2

这次”料“更多 NVIDIA黄仁勋的GTC 2021”厨房“发布会再度上演

 3 years ago
source link: http://server.zhiding.cn/server/2021/0413/3133282.shtml
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

这次”料“更多 NVIDIA黄仁勋的GTC 2021”厨房“发布会再度上演

作者:李祥敬   【原创】   2021-04-13 14:45:14

关键字: NVIDIA

转眼今年的GTC大会再次来临,黄仁勋的”厨房“发布会再度上演。虽然场景没有变,但是发布的内容确实”料“更多,涉及了AI、汽车、机器人、5G、实时图形、协作和数据中心等。

如果大家有印象的话,去年NVIDIA GTC大会,NVIDIA首席执行官黄仁勋在自家厨房进行大会演讲应该是无出其右了。转眼今年的GTC大会再次来临,黄仁勋的”厨房“发布会再度上演。虽然场景没有变,但是发布的内容确实”料“更多,涉及了AI、汽车、机器人、5G、实时图形、协作和数据中心等。

liH9m9maDk8I_600.png

黄仁勋说,NVIDIA会一如既往在CPU、DPU和GPU方面大力投入,并使其能够用于研究人员和企业的全新数据中心级计算解决方案。硬件只是NVIDIA的一方面,作为一家软件公司,NVIDIA提供一系列基于NVIDIA AI,以及用于仿真、协作和自主机器训练的软件。

组合拳——CPU、DPU和GPU

我们知道GPU是NVIDIA的”主业“,但是凭借一系列的收购,NVIDIA也在向其他XPU拓展,在本次大会上,NVIDIA推出了CPU、DPU和GPU的”组合拳“,帮助用户打造完全可编程的单一AI计算单元。

CPU与GPU一直是好朋友,NVIDIA GPU作为加速计算组件,其实扮演了与CPU一起工作的角色。如今NVIDIA也推出了自己的首款数据中心CPU——Grace,Grace是一款高度专用型处理器,主要面向大型数据密集型HPC和AI应用。

Grace是高度专业化的处理器,工作负载面向例如训练具有超过1万亿个参数的新一代NLP模型等。当与NVIDIA GPU紧密耦合时,搭载Grace CPU的系统速度比如今基于NVIDIA DGX 打造的最先进的系统(在x86 CPU上运行)快10倍。从这样的成绩可以看出,NVIDIA推出自有CPU芯片意在更好地实现与GPU的协同处理,让性能表现更优秀。

Grace基于第四代 NVIDIA NVLink互联技术,支持LPDDR5x内存子系统,并可以得到NVIDIA HPC软件开发套件以及全套CUDA和CUDA-X库的支持。据悉,瑞士国家超级计算中心将构建一台名为Alps的超级计算机。这台计算机将使用Grace和NVIDIA下一代GPU。美国能源部下属的洛斯阿拉莫斯国家实验室也将在2023年推出一台基于Grace的超级计算机。

除了自研的CPU,凭借收购而来的Arm,也让NVIDIA在CPU方面有了更多的话语权。在云计算、企业和边缘数据中心、超级计算、PC等其他市场中,Arm也开始崭露头角。黄仁勋也宣布与多家重要的Arm合作伙伴展开合作,包括云计算领域的AWS、科学和云计算领域的Ampere Computing、超融合边缘服务器领域的Marvel、以及将打造Chrome OS和Linux PC SDK与参考系统的联发科。

DPU(Data Processing Unit,数据处理单元)是NVIDIA在收购Mellanox推出的创新产品,其可实现具有突破性的网络、存储和安全性能。作为业内首款400G以太网和NDR InfiniBand DPU,BlueField-3具有出色的网络性能。相比上一代产品,它具有10倍加速计算能力、16个Arm A78 CPU核,和4倍的加密速度。BlueField-3也是首款支持第五代PCIe总线并提供数据中心时间同步加速的DPU。

此外,BlueField-3利用NVIDIA DOCA(集数据中心于芯片的架构)软件开发包的优势,为开发者提供一个完整、开放的软件平台,开发在BlueField DPU上开发软件定义和硬件加速的网络、存储、安全和管理等应用。目前服务器制造商戴尔、浪潮、联想和超微正在将BlueField DPU集成到他们的系统中,云服务供应商也在使用BlueField DPU来加速他们的业务,如百度、京东和UCloud。

黄仁勋还提到了NVIDIA的AI-on-5G计算平台,该平台充分利用 NVIDIA Aerial软件开发套件与NVIDIA BlueField-2 A100——一种包含NVIDIA “5T for 5G”解决方案的、集成GPU和DPU的融合型卡,创建高性能5G RAN和AI应用。富士通、Google Cloud、Mavenir、Radisys和Wind River等合作伙伴都在开发适用于NVIDIA AI-on-5G平台的解决方案。

不管是CPU还是DPU、GPU,很明显,NVIDIA正在将自己业务边界不断延展,也就是不再局限于以GPU为中心,而是以计算为核心,覆盖多样化的计算工作负载。随之而来的就是客户选择的灵活性,同时整个计算芯片市场也将迎来新的格局。

NVIDIA是软件平台公司

除了更富的硬件产品,NVIDIA在软件方面的布局也业界有目共睹的,比如CUDA。所以,我们通常会在GTC大会上看到一系列的软件更新。

在本届大会上,NVIDIA发布了用于训练Transformers的框架—— NVIDIA Megatron。Transformers在自然语言处理领域具有至关重要的位置,其在生成文档摘要、将电子邮件中的短语补充完整、对测验进行评分、生成体育赛事现场评论、甚至生成代码等领域有着广泛的应用。

此外,NVIDIA还发布了用于计算药物研发加速库Clara Discovery的一些新模型,以及与Schrodinger的合作;用于对话式AI的NVIDIA Jarvis已经可用,其能够实现语音识别、语言理解、翻译和表达性语音;加快推荐系统的NVIDIA Merlin现可通过NGC(NVIDIA的深度学习框架容器目录)获取。

为帮助客户将自身专业知识应用于AI领域,黄仁勋发布了NVIDIA TAO,其可以运用客户和合作伙伴的数据,对NVIDIA预训练模型进行微调和适配,同时保护数据隐私。

量子计算也是当下的热点,NVIDIA cuQuantum能够为量子电路模拟器提供加速,以助力研究人员设计出更完善的量子计算机。

为了保障现代化数据中心的安全,黄仁勋发布了NVIDIA Morpheus数据中心安全平台,其基于NVIDIA AI、NVIDIA BlueField、Net-Q网络遥测软件和EGX而构建,能够对完整的数据包进行实时检测。

开箱即用的产品

有了硬件又有了软件,NVIDIA为用户打造更加开箱即用的解决方案,其中包括专为工作组打造的“便携式AI数据中心”——NVIDIA DGX Station,以及NVIDIA专为密集型AI研发打造的AI数据中心产品——NVIDIA DGX SuperPod。

全新DGX Station 320G借助320GB超快速HBM2e连接至4个NVIDIA A100 GPU,内存带宽达到每秒8TB。然而,仅需将其插入普通的壁装电源插座即可使用,耗电量只有1500瓦。此外,NVIDIA还发布了一种适用于NVIDIA DGX Station A100的订阅服务。DGX Station A100是世界上唯一支持 NVIDIA多实例GPU技术的适用于办公室场景的工作组服务器设备。

DGX SuperPOD是配备20套或以上NVIDIA DGX A100系统和NVIDIA InfiniBand HDR网络的AI超级计算机。DGX SuperPOD使用全新80GB NVIDIA A100,将其HBM2e内存提升至90TB。目前它已经升级至采用NVIDIA BlueField-2,且NVIDIA如今还为该产品提供配套的NVIDIA Base Command DGX管理和编排工具。

为进一步实现AI民主化,黄仁勋发布了来自顶尖制造商的新系列NVIDIA认证系统,即大容量企业级服务器。它们现在已通过认证,可运行NVIDIA AI Enterprise软件套件,该套件得到了全球应用最广泛的计算虚拟化平台——VMware vSphere 7的独家认证。

NVIDIA于今日发布多款新系统,以扩大NVIDIA认证服务器生态系统。这些新系统配备用于主流AI和数据分析的NVIDIA A30 GPU,以及用于AI图形、虚拟工作站以及混合计算和图形工作负载的NVIDIA A10 GPU。

最后,NVIDIA推出推理服务器NVIDIA Triton,它可以从进入客户EGX服务器或云实例的连续数据流中获取洞察。这包括任何在cuDNN上运行的AI模型,也就是几乎所有的AI ,包括来自TensorFlow、Pytorch、ONNX、OpenVINO、TensorRT等的任何框架。

其他——仿真协作与自动驾驶

在大会上,NVIDIA还公布了其他产品更新,比如NVIDIA Omniverse,其旨在创建共享虚拟3D世界,特点包括:可以扩展至多个GPU、具有高物理精度、能够充分运用RTX实时路径追踪和DLSS、可以使用NVIDIA MDL模拟材料、可以使用NVIDIA PhysX模拟物理学并且与NVIDIA AI完全集成。

3D制作团队通常规模庞大、应用技术繁多且所在地点分散,NVIDIA Omniverse Enterprise使其能够在复杂的项目中开展无缝协作。设计师、艺术家和审核人员可以在任何地点、任何设备上进行线上实时协作,而不需要召开面对面会议或就大量文件进行交流和迭代。

Omniverse Enterprise是一个全新的平台,它包含NVIDIA Omniverse Nucleus服务器(管理客户端之间的共享数据库)和NVIDIA Omniverse Connectors(业内领先的设计应用程序插件)。

它还包含两个终端用户应用:NVIDIA Omniverse Create,可加速场景构成,用户可通过实时互动来装配、点亮、模拟和渲染场景;NVIDIA Omniverse View,支持无缝设计协作,并能通过逼真的渲染技术实现建筑和工程项目的可视化。该平台还包含NVIDIA RTX Virtual Workstation(vWS)软件,它能让协作者在任何地方自由地运行各类图形密集型3D应用。

Omniverse Enterprise经测试和优化后,适合专业人员在NVIDIA RTX笔记本电脑及台式电脑上运行,或在NVIDIA EGX平台上的NVIDIA认证系统上运行。因此,从使用本地台式电脑、笔记本电脑的小型工作组,到使用各种设备访问数据中心的全球分布式团队,任何规模的组织都可以部署该工具。

自动驾驶汽车领域是“机器学习和机器人技术所面对的最严峻的挑战之一,NVIDIA构建模块化的端到端解决方案,其自动驾驶汽车计算系统级芯片——NVIDIA DRIVE Orin将于2022年投产。与此同时,NVIDIA新一代车载系统级芯片NVIDIA DRIVE Atlan正式发布,其集NVIDIA在AI、汽车、机器人、安全和BlueField安全数据中心领域的所有技术之大成,为汽车带来真正的数据中心。Atlan可以达到每秒超过1000万亿次(TOPS)运算次数,致力于应用到2025年的车型。

NVIDIA第八代Hyperion汽车平台也同期发布,包括参考传感器、自动驾驶汽车和中央计算机、3D地面真实数据记录仪、网络以及所有必要的软件。在软件方面,正如Omniverse能够构建汽车生产工厂的数字孪生一样,DRIVE Sim也可用于创建自动驾驶汽车的数字孪生,并将其用于自动驾驶汽车的开发。

总结划重点

”厨房“发布会全程看下来,应该说看点颇多。但是总结一下,无外乎以下几点:

如今是一家能够提供GPU、CPU和DPU三种芯片的公司。

NVIDIA是一家软件平台公司。

NVIDIA是一家AI公司,提供Megatron、Jarvis、Merlin、Maxine、Isaac、Metropolis、Clara和DRIVE、以及各种可使用TAO进行定制化的预训练模型。

NVIDIA正在通过用于研究的DGX、用于云的HGX、用于企业级和5G边缘的EGX以及用于机器人技术的AGX来扩展AI。

总之,NVIDIA正在变得越来越”重“,基于已有产品,其业务领域不断扩展。我们对于NVIDIA的定位和认知也正在刷新。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK