仿佛是和疫情叫板,当我们前脚还沉溺于NVIDIA发布的RTX 30系列强大显卡,忙着为自己的电脑更新换代时,后脚黄仁勋就携着一系列涵盖数据中心、边缘智能、专业视觉、协同设计、医疗健康等领域的新产品、新技术和新解决方案奔涌而来。在10月5日举办的GTC 2020秋季站线上会议中,NVIDIA宣布推出了以DOCA为特色的数据处理单元DPU、基于全新安培(Ampere)架构的RTX A6000和RTX A40专业图形卡以及围绕远程协作和AI视频会议的Omniverse、Maxine平台,再次掀起了企业级GPU应用创新狂潮。
NVIDIA创始人兼CEO黄仁勋再次进行“厨房发布”
全新DPU处理器,为数据中心而生
在云计算和人工智能技术的强大推动下,数据中心设计正面临着结构性转变。当基于数据的深度挖掘和应用成为趋势,要求传统CPU有效地处理这些苛刻的工作负载实在是勉为其难。因此,基于GPU的应用开始转移至该领域填补相关的资源空白。在专门为数据中心的服务器设计了安培架构和A100系列产品后,NVIDIA再次推出一种新型处理器-DPU(Data Processing Unit,数据处理单元)。
不同于CPU、GPU在客户端与数据中心的“两开花”,本次NVIDIA发布的DPU处理器是专为数据中心设计的,由新型的DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)架构——一种全新的数据中心IOC(Infrastructure On A Chip - 基础架构级芯片)架构提供支持。在GTC大会主题演讲中,NVIDIA创始人兼首席执行官黄仁勋透露了未来三年NVIDIA DPU发展路线图。其中,包括全新的NVIDIA BlueField-2 系列DPU和NVIDIA DOCA 软件开发套件,可用于在DPU加速的数据中心基础设施服务上构建应用程序。
从功能性上看DPU 主要扮演的是“减负”的角色,从 CPU 上卸下部分“关键”的网络、存储和安全工作负载,并启用新的安全和管理程序功能,从目前DPU系列中包括两款PCIe产品,可以将其产品特性总结为:
·NVIDIA BlueField-2 DPU将NVIDIA Mellanox ConnectX-6 Dx与Arm核心相结合,从而实现完全可编程,提供200Gb/s的数据传输速率,并加速关键的数据中心安全性、网络和存储任务,其中包括隔离、信任根、密钥管理、RDMA/RoCE、GPU Direct、弹性块存储、数据压缩等。
·NVIDIA BlueField-2X DPU具备BlueField-2 DPU的全部关键特性。此外,可应用于数据中心安全、网络和存储任务的NVIDIA Ampere GPU的AI功能也在不断强化这些关键特性。NVIDIA BlueField-2X DPU基于NVIDIA第三代Tensor Core核心,可采用AI进行实时安全分析,包括识别提示窃取机密的异常流量、线速加密流量分析、恶意活动的主机自检、以及动态的安全编排自动化响应(SOAR)。
与之配套的是,NVIDIA还推出了基于DPU的软件生态架构DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)。DOCA 架构基于开放的 API,为开发者提供全面的开放式平台,助力构建运行于BlueField 系列DPU上的软件定义硬件加速的网络、存储、安全及管理应用程序。
在黄仁勋看来,数据中心已成为新型计算单元。在现代化、安全的加速数据中心中,DPU已成为其重要的组成部分。CPU、GPU和DPU的结合,可构成完全可编程的单一AI计算单元,提供前所未有的安全性和算力。他透露目前全球领先的服务器制造商均计划在其企业级服务器产品中集成NVIDIA DPU,包括华硕、源讯、戴尔技术、富士通、技嘉科技、新华三、浪潮、联想、云达科技和超微。
专业图形卡RTX A6000和A40揭开神秘面纱
在专业图形卡方面,NVIDIA发布了面向工作站的RTX A6000和面向服务器的RTX A40。两者均采用了最新的Ampere架构,并在GPU 配置上保持一致性,即84个带有 GA102 GPU 的流式多处理器。唯一的区别在于前者是主动散热,而后者是被动。
谈到GA102 GPU,也许大家并不陌生,在之前发布的RTX 3090中我们已经被其强大的性能所折服,而本次发布的RTX A6000显存更大,达到了48GB。其主要特点包括:
• 第二代RT Core:最高可提供2倍于上一代的吞吐量,以及并行光线追踪、着色和计算功能。
• 第三代Tensor Core:最高可提供5倍于上一代的吞吐量,并支持全新TF32和BF16数据格式,结合稀疏运算特性提供10倍加速性能。
• 全新CUDA Core:最高可提供2倍于上一代的FP32吞吐量,能够显著提高图形和计算能力。
• 48GB GPU内存:单个GPU可提供的最大内存,通过NVLink连接两个GPU可以扩展到96GB。
• 虚拟化:通过添加NVIDIA虚拟工作站等NVIDIA虚拟GPU软件,为远程用户提供针对图形工作负载和强大虚拟工作站实例的大规模支持,赋力高端设计、AI和计算工作负载的更大规模工作流程。
• PCIe Gen 4:提供2倍于上一代的带宽,加速Lenovo ThinkStation P620等PCIe Gen 4服务器和工作站中数据密集型工作负载(如数据科学、混合渲染和视频流)的GPU数据传输。
可以看出,RTX A6000将进一步帮助设计师和工程师加速渲染、AI、VR/AR和计算工作负载。对此,雷诺集团计算机图形和可视化解决方案Guillaume Shan表示:“打造新一代乘用车需要完美的设计和对美的不懈追求。雷诺设计团队不断突破界限,运用我们能够使用的所有工具。我们一直使用NVIDIA技术在光线追踪打造的照片级真实感中审查设计概念。全新NVIDIA RTX A6000超出了我们的预期,在光线追踪室外场景中实现了2倍以上的性能提升。这令人十分惊叹。”
目前,戴尔、惠普和联想等全球领先的系统制造商将提供多款基于NVIDIA RTX A6000的工作站。思科、戴尔、富士通、惠普和联想等全球领先的系统制造商将提供多款基于NVIDIA A40的服务器。
打破地理束缚,为远程协作提供全方位支持
疫情改变了内容创作和消费的方式。如今,全球各地的团队通常要共同协作,远程处理高清内容,使用多个工作负载并且需要大量计算资源。对此,NVIDIA发布公测版Omniverse平台,并推出了NVIDIA云AI视频流平台Maxine,全方位支持本地或远程实时协作。
Omniverse公测版发布
为了创建视觉效果、建筑可视化和制造设计,一般需要不同团队、不同远程办公地点和多个客户现场的多名人员协作审查,并且需要使用多种软件工具才能将资源3D化,而跨应用的无缝数据传输一直是开发人员所面临的棘手问题之一。对此,NVIDIA在为期一年的抢先体验计划之后发布了公测版Omniverse。Omniverse整合了NVIDIA在图形、仿真和AI领域的突破,是NVIDIA首个基于RTX的3D仿真模拟和协作平台。
对于创意工作者和开发人员而言,Omniverse的关键创新是仅需一键点击即可在Autodesk Revit、McNeel Rhino或Trimble SketchUp之间切换。用户无需进行数据准备或抽样,就能使用兼容的照片级逼真的渲染软件浏览大型模型。这就避免了转化延迟和切换软件工具造成的错误,大量节省了时间和成本。
NVIDIA创始人兼首席执行官黄仁勋在GTC线上主题演讲中揭露了公测版的相关信息,他表示:“物理和虚拟世界将会日益融合。Omniverse让位于全球各地或居家办公的创作者团队,能够像编辑文档一样在同一个设计上轻松开展协作。这是《星际迷航》全息甲板的初始,它终成现实。”
目前,Omniverse获得了许多主要的软件领导者支持,例如Adobe、Autodesk、Bentley Systems、Robert McNeel & Associates和SideFX等。Blender正在与NVIDIA合作,通过加入USD功能实现Omniverse与其软件的集成。NVIDIA还与其他领先的软件供应商合作,让所有艺术家和设计师都可以在自己选择的应用上通过Omniverse开展协作。
AI视频会议平台Maxine
除了Omniverse公测版外,NVIDIA还宣布推出了NVIDIA Maxine平台,该平台为开发者提供了一套基于云的、GPU加速AI视频会议软件,以提升流视频质量。NVIDIA Maxine是云原生的流视频AI平台,能让服务提供商每天对大约3000多万次的网络会议提供全新AI功能。视频会议服务提供商在云端运行基于NVIDIA GPU的平台,可以为用户提供包括凝视校正、超分辨率、噪声消除、人脸补光等全新AI效果。
为了降低带宽需求,改进通话质量,Maxine平台的AI软件无需流处理全部屏幕像素,而是分析通话中每个人的关键面部特征,然后在通话另一边的视频中智能地重新激活人脸。这使得流视频可通过更少的数据在互联网上进行传输。
使用这种在NVIDIA GPU上运行的基于AI的新视频压缩技术,开发者可将视频带宽消耗减少到H.264流视频压缩标准要求的十分之一。在降低供应商成本的同时,为终端用户提供了更流畅的视频会议体验,使用户能够享受更多AI服务,并减少电脑、平板和手机上的数据流。
值得一提的是,NVIDIA研究人员在Maxine中实现新的突破,包括了让视频会议的感觉更像面对面的交谈。视频会议服务提供商将能够利用NVIDIA在GAN(对抗式生成网络)上的研究成果,提供各种各样的新功能。例如,人脸校正功能可以自动调整人脸,使人们在通话中看起来是面对面的。而凝视校正功能可模拟屏幕上的眼神交流,即使摄像头未与用户的屏幕对齐也能轻松实现。自今年年初以来,视频会议的数量增长了十倍,这些功能可以帮助人们将视线落在屏幕中的视频上,而不必盯着摄像头。
注重医疗健康,加速新冠疫苗研发
受疫情影响,人们对自身健康的关注度正在与日俱增,而近日特朗普总统感染新冠病毒,更是将医疗健康领域推上了风口浪尖。在GTC 2020秋季站上,NVIDIA宣布与全球医疗健康公司葛兰素史克(GSK)及其AI团队达成合作,后者正在将计算技术应用于药物和疫苗研发。
GSK中心坐落于伦敦快速发展的Knowledge Quarter,该中心将利用生物医学数据、AI方法和先进的计算平台,以更高的精确度和更大的规模解读基因和临床数据。GSK AI中心一旦全面运作,将汇聚该公司在英国的AI团队,包括GSK的AI研究员、一项新的专业培训项目,以及来自NVIDIA的科学家。据悉,GSK最近在伦敦建立了一个新的AI中心。该中心是同类中心中的先驱,它将利用GSK重要的基因和基因组数据,改进转化药物和疫苗的设计和开发过程。
在整个药物和疫苗研发过程中,NVIDIA将贡献其在GPU优化和高性能计算开发方面的专业知识,包括NVIDIA Clara Discovery™ 、一组新的优化计算药物发现应用和框架。除了NVIDIA DGX A100系统外,GSK还将被允许访问NVIDIA的Cambridge-1。
Cambridge-1是英国最强大的AI超级计算机,由NVIDIA助力其打造,帮助英国医疗健康领域的研究人员借助AI解决包括COVID-19在内的紧迫的医学难题。
预计年底前上线的Cambridge-1超级计算机,将采用NVIDIA DGX SuperPOD™系统,具备超过400 petaflops AI性能和8 petaflops Linpack性能。在最新的全球最强超级计算机排名TOP500榜单中,Cambridge-1排名第29位。同时,该超级计算机也跻身当前Green500榜单中全球最节能的超级计算机前三名。
对此,黄仁勋在GTC大会主题演讲中表示:“为了解决全球医疗健康领域最紧迫的挑战,我们需要强大的计算资源来将AI加以利用。Cambridge-1超级计算机将成为英国的创新中心,进一步推动英国研究人员在关键医疗和新药研发方面的开创性工作。
后记
如今NVIDIA正朝着“数据中心规模公司”不断迈进,这一点在其最新的财报中也得以体现---NVIDIA数据中心的收入首次超过了游戏销售。在黄仁勋看来,通过将自身的AI能力和RTX引擎开放给Arm平台,NVIDIA的步伐正在加速。