您现在的位置是:主页 > 科技新闻 >
芯片圈变天了!英伟达推出首个CPU,狂捧Arm生态
2021-04-13 09:54:05科技新闻 911人已围观
此外,NVIDIA还公布了与亚马逊AWS、Ampere Computing、联发科和Marvell等基于Arm的CPU平台的合作伙伴关系。在软件方面,超大规模语言模型训练与推理问答引擎Megatron、实时对话式AI平台Jarvis、AI网络安全框架Morpheus、Omniverse企业版、由GPU加速的量子电路模拟框架CuQuantum等一系列最新进展首次揭晓。显然,面向数据中心异构计算的新天地,NVIDIA正集合软硬件技术优势,打出高调的组合拳。
此次发布会令人最印象深刻的,就是NVIDIA在助推Arm生态方面不遗余力,从自研CPU、DPU、自动驾驶处理器到GPU的合作伙伴,从云、高性能计算、边缘计算到PC,无处不Arm。先来看下这次发布的三款硬件新品:
1、首颗数据中心CPU:落地全球最快AI超算
黄仁勋宣布的第一个重磅新品,是一款专为大规模人工智能和高性能计算应用而设计的CPU——NVIDIA Grace。绝大多数的数据中心仍将继续使用现有的CPU,而Grace主要将用于计算领域的细分市场,预计将于2023年可供货。由于超大规模的模型很难完全放进GPU内存,如果存储在系统内存,访问速度则会大大受限,这款CPU的问世主要即是为了解决这一瓶颈。
NVIDIA Grace以发明了世界上第一个编译器、被称为“计算机软件工程第一夫人”的先驱计算机科学家Grace Hopper命名,具体有3点创新进步:(1)内置下一代Arm Neoverse内核,每个CPU能在SPECrate2017_int_base基准测试中单位时间运行超过300个实例;(2)采用第四代NVIDIA NVLink,从CPU到GPU连接速度超过900GB/s,达到相当于目前服务器14倍的带宽;从CPU到CPU的速度超过600GB/s。(3)拥有最高的内存带宽,采用的新内存LPDDR5x技术,带宽是LPDDR4的两倍,能源效率提高了10倍,能提供更多计算能力。明年将有两台性能强大的AI超级计算机面世,都将采用NVIDIA Grace,据称其与NVIDIA GPU紧密结合,性能将比目前最先进的NVIDIA DGX系统(在x86 CPU上运行)高出10倍。这两台AI超算中,瑞士国家计算中心(CSCS)正在打造一个算力可达20Exaflops的系统,美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)也将为其研究人员配备新AI超算。 2、Bluefield-3 DPU:220亿晶体管
在黄仁勋看来,负责在数据中心传输和处理数据的数据处理单元(DPU),正与CPU、GPU共同组成“未来计算的三大支柱”。NVIDIA全新BlueField-3 DPU包含220亿个晶体管,采用16个Arm A78 CPU核心、18M IOPs弹性块存储,加密速度是上一代的4倍,并完全向下兼容BlueField-2。BlueField-2能够卸载相当于30个CPU核的工作负载,而BlueField-3实现了10倍的加速计算性能提升,能够替代300个CPU核,以400Gbps的速率,对网络流量进行保护、卸载和加速。该处理器也是首款支持第五代PCIe总线并提供数据中心时间同步加速的DPU。
3、车轮上的数据中心:算力达1000TOPS
NVIDIA DRIVE Atlan是新一代AI自动驾驶汽车处理器,算力将达到1000TOPS,约是上一代Orin处理器的4倍,超过了绝大多数现有无人驾驶出租车的子女计算能力。
黄仁勋夸赞说:“Atlan集NVIDIA在AI、汽车、机器人、安全和BlueField安全数据中心领域的所有技术之大成,堪称一项技术奇迹。”
4、便捷式AI数据中心和DGX SuperPod双升级
黄仁勋还宣布升级NVIDIA专为工作组打造的“便携式AI数据中心”NVIDIA DGX Station,以及NVIDIA专为密集型AI研发打造的AI数据中心产品NVIDIA DGX SuperPod。全新DGX Station 320G借助320GB超快速HBM2e连接至4个NVIDIA A100 GPU,内存带宽达到每秒8TB。然而,仅需将其插入普通的壁装电源插座即可使用,耗电量只有1500W。黄仁勋说,达到这种性能的CPU集群成本约为100万美元,而DGX Station仅需14.9万美元。
DGX SuperPOD使用全新80GB NVIDIA A100,将其HBM2e内存提升至90TB,实现2.2EB/s的总带宽。要实现如此的带宽,需要11000台CPU服务器,大约相当于有250个机柜的数据中心,比SuperPOD多15倍。目前它已经升级至采用NVIDIA BlueField-2,且NVIDIA如今还为该产品提供配套的NVIDIA Base Command DGX管理和编排工具。
5、Aerial A100:5G+AI的新型边缘计算平台
黄仁勋还提到了NVIDIA的AI-on-5G计算平台,这是一款专为边缘设计、将5G和AI相结合的新型计算平台。该平台将采用NVIDIA Aerial软件开发套件与NVIDIA BlueField-2 A100,将GPU和CPU组合成“有史以来最先进的PCIE卡。”富士通、谷歌云、Mavenir、Radisys和Wind River等合作伙伴都在开发适用于NVIDIA AI-on-5G平台的解决方案。
除了推出基于Arm的CPU外,NVIDIA还宣布一系列与Arm处理器设计商的合作进展,包括将为亚马逊AWS Graviton2 CPU提供GPU加速、为科学和AI应用开发提供支持的全新HPC开发者套件、提升边缘视频分析和安全功能、打造新一类基于Arm并搭载NVIDIA RTX GPU的新款PC等。这些举动反映出无论是市场还是NVIDIA自身,对基于Arm的解决方案的兴趣已经超出移动领域。
1、NVIDIA GPU搭配亚马逊自研CPU赋能云服务
2021年下半年,基于亚马逊云科学(AWS)自研服务器处理器AWS Graviton2的Amazon EC2实例将与NVIDIA GPU相结合,在云端部署。这一新组合将实现降低成本、支持更丰富的游戏串流体验、优化云上安卓游戏和人工智能推理、以更低成本提供更高的AI推理性能等优势。黄仁勋说:“我们致力于将Arm生态系统扩展到移动和嵌入式系统以外的市场,而今日宣布的新合作伙伴,正是我们迈出的第一步。”
NVIDIA在去年推出了一个机架比肩AI数据中心的AI系统DGX A100、AI算力高达700 PFLOPS的集群DGX SuperPOD、千万亿级工作组服务器DGX Station A100。面向AI应用需求,NVIDIA已经提供Megatron、Jarvis、Merlin、Maxine、Isaac、Metropolis、Clara和DRIVE、以及各种可使用TAO进行定制化的预训练模型。今天,NVIDIA进一步强化企业计算服务,不仅推出大型语言模型训练与推理问答引擎、宣布对话式AI平台最新落地进展,还展示了其量子电路模拟框架。
1、NVIDIA EGX:扩大认证服务器生态系统
为进一步实现AI民主化,黄仁勋发布了来自顶尖制造商的新系列NVIDIA认证系统,即大容量企业级服务器,现已通过认证。这一系统可运行NVIDIA AI Enterprise软件套件,该套件得到了全球应用最广泛的计算虚拟化平台——VMware vSphere 7的独家认证。
NVIDIA今日推出多款新系统,以扩大NVIDIA认证服务器生态系统。这些新系统配备用于主流AI和数据分析的NVIDIA A30 GPU,以及用于AI图形、虚拟工作站以及混合计算和图形工作负载的NVIDIA A10 GPU。
2、Megatron:超大型语言模型训练与推理
黄仁勋发布了用于训练Transformers的超大语言模型的NVIDIA Megatron Triton推理服务器。Transformers已帮助开发者在自然语言处理领域取得了突破性进展,能够生成文档摘要、将电子邮件中的短语补充完整、对测验进行评分、生成体育赛事现场评论、甚至生成代码。
使用Megatron Triton的DGX A100能在1秒内做出响应,可同时支持16项查询,而双插座CPU服务器支持1条问询就超过了1分钟。 3、Jarvis:实时对话式AI平台现可使用
Jarvis是一个基于NVIDIA GPU提供实时性能的灵活、多模态对话式AI服务应用框架,可帮助开发者轻松实现实时语音识别、转录、摘要、翻译、封闭式字幕、虚拟助手、聊天机器人等功能。现在,NVIDIA已经是一个生产就绪、现已可用的端到端对话式AI模型,企业可基于自身数据和特定需求对模型做进一步的微调,并使用NGC实现在云或边缘快速部署定制化语言型AI服务。
为帮助客户将自身专业知识应用于AI领域,黄仁勋还宣布推出NVIDIA TAO,其可以运用客户和合作伙伴的数据,对NVIDIA预训练模型进行微调和适配,同时保护数据隐私。
4、Morpheus:AI网络安全应用框架
为了保障现代化数据中心的安全,黄仁勋宣布推出基于NVIDIA GPU、BlueField DPU、Net-Q网络遥测软件和EGX的新型AI框架而构建的NVIDIA Morpheus数据中心安全平台,能够对完整的数据包进行实时检测、预防安全威胁,现可抢先试用。作为一个基于AI的云原生网络安全框架,NVIDIA Morpheus通过在边缘和AI技术的结合,利用实时的遥测、策略执行及操作,可以在不牺牲成本和性能的情况下分析更多的安全数据,识别、捕捉和应对以往无法识别的威胁和异常情况,如未加密敏感数据的泄露、网络钓鱼攻击和恶意软件。
Morpheus与BlueField DPU相结合,使网络中的每个计算节点都成为边缘网络防御传感器,企业无需复制数据,也能够以线速分析每个数据包。相比之下,传统的AI安全工具通常只能采样5%左右的网络流量数据,因此威胁检测算法并非基于完整的模型。同步推出的BlueField-3可为NVIDIA Morpheus提供实时的网络可视化、网络威胁的检测与响应、以及监控、遥测和代理服务。开发者还能够在现有IP投资的基础上,使用深度学习模型来创建自己的Morpheus AI功能。
5、CuQuantum:量子电路模拟框架为加快有赖于量子位(或量子比特,能作为单个的0或1存在,也可以同时作为二者存在)的量子计算研究,黄仁勋推出了cuQuantum,为量子电路模拟器提供加速。这是专为模拟量子电路而设计的加速库,适用于张量网络求解器和状态向量求解器,经过优化后,可以扩展到大GPU显存、多个GPU和多个DGX节点。
转载自微信公众号智东西
相关文章
随机图文
-
少喝点就没事?酒精对心脏危害有多大,这项研究告诉你
俗话说,“小酌怡情,大饮伤身”。很多人虽然知道酒精损害健康,但往往以为“适量”喝一点没什么问题。 然而越来越多的科学研究告诉我们,喝酒并没有一个“安全”的界限,即使是喝得不多也会造成健康损害。近期,根据欧洲心脏病学会(European Society of Cardiology)“心力衰竭”主题年会上新发表的一项研究,酒精对心脏的风险可能比过去以为的更大。尽管世界各地对饮酒量的 -
2021-4-16日周五刷卡指南
汇丰银行x云闪付红包:汇丰中国权益平台-我的权益用卡活动,报名后,使用云闪付选择汇丰信用卡支付单笔满50元可抽最高50元刷-卡金红包(共30次, 4月30日截止) 广发银行x周周刷: 4月1日10点-8日、4月9日9点-15日、4月16日9点-22日、4月23日9点-30日,每周期消费3笔且累计每满1k元,可抽奖最高1000元刷卡金1次(每周期共2次,共32w份) ;活动期间消费 -
哈啰出行赴美上市:2020年亏损11亿,蚂蚁持股36.3%
共享单车“小蓝”的主体公司哈啰出行(以下简称哈啰)于4月24日正式在纳斯达克递交赴美上市招股书。瑞信、摩根士丹利及中金公司是哈罗联席保荐人。 哈啰于2016年9月在上海成立,在ofo和摩拜大战的那几年,哈啰“小蓝”在共享单车的市场里并未占据太多市场份额。如今,哈啰已经在行业大洗牌中留存下来,还慢慢站稳脚跟,并不断通过拓展服务边界扩大 -
美股为什么跌不起?
拿全球市场来对比A股,单纯去看指数尿性,记得在2017年有几个朋友跟我一起喝茶交流美股的问题,大部分朋友都认为美股要下跌了,但客观的情况是美股在一片看衰声中不断新高。到今天还有很多人希望美股下跌? 美股下跌对A股不是好事,A股历来的特点就是跟跌不跟涨。周五因为中美博弈,中国长城几乎跌停板。可以想象中未来的一段时间乃至未来的三年到五年,科技这块还有很远的路要走。那么对应的科技
猜你喜欢
站点信息
- 文章统计: 192 篇文章
- 微信公众号:扫描二维码,关注我们