e-works数字化企业网  »  新闻  »  记者观察  »  正文

乘AI之势,NVIDIA持续引领GPU变革

2018年12月2日     来源:e-works        作者:e-works王聪       
关键字:NVIDIA  GPU加速  AI  
2018年11月21日,NVIDIA在苏州举办了GTC China大会,这也是英伟达2018年全球GPU技术峰会中的最后一站。

    2018年11月21日,NVIDIA在苏州举办了GTC China大会,这也是英伟达2018年全球GTC(GPU Technology Conference,GPU技术峰会)中的最后一站。一如 NVIDIA 从 2017 年之后持续弹奏的主旋律,这场在苏州举办的 GTC 大会也是以“I Am AI”开场。

    虽然本次会议上并没有推出新产品,但作为全球图形技术和数字媒体处理器行业领军企业,NVIDIA专注于个人和专业计算平台的人机交互体验产品,其GPU代表性产品是目前世界上运算能力最强大的处理器之一,广泛应用于大数据、云计算、虚拟现实、深度学习等领域。

    特别是浪潮、联想等大厂加入的 HGX-2中国落地,以及 NGC 容器中阿里云、联想、浪潮、华为以及曙光的身影,都充分显示NVIDIA与中国大厂客户一起抱团过冬的决心。

无

图 GTC China大会

HGX-2,全球最强大的加速服务器平台

    如今,AI为计算力带来变革。黄仁勋在GTC大会上明确表示,未来已来。作为科技行业的热点,人工智能(AI)与机器学习正持续受到业界的关注。调研机构Gartner表示人工智能和先进的机器学习技术是被广泛关注的新兴技术,将在企业甚至整个行业中掀起革命浪潮。它们能够大幅度降低劳动力成本,产生意想不到的新见解,从原始数据中发现新模式,并建立预测模型。据分析师估计,面向数据科学和机器学习的服务器市场每年价值约为 200 亿美元,加上科学分析和深度学习市场,高性能计算市场总价值大约为 360 亿美元。

    也正是看到这种趋势,在本次大会的现场,黄仁勋宣布其HGX-2服务器平台已被广泛采用,这是全球最强大的加速服务器平台,适用于 AI 深度学习、机器学习和高性能计算。

 无

图 黄仁勋介绍HGX-2

    据了解,NVIDIA 的 HGX-2 在单节点中能够提供 2 千万亿次的计算性能,与仅使用 CPU 的服务器相比,它将 AI 机器学习工作负载的运行速度提升近 550 倍,将 AI 深度学习工作负载的运行速度提升近 300 倍,将高性能计算工作负载的运行速度提升近 160 倍。

    黄仁勋表示,计算机产业的领导者都在使用HGX-2,包括华为、浪潮、曙光、联想、QCT、超微等国内外知名服务器厂商都宣布与英伟达合作生产HGX-2。其中浪潮是国内首家构建HGX-2服务器的厂商,基于NVIDIA HGX-2平台的浪潮AI超级服务器AGX-5,专为解决当前AI深度学习和高性能计算的性能扩展难题而设计。通过NVIDIA与浪潮的强强联手,基于NVIDIA HGX-2平台的浪潮AI超级服务器AGX-5 AI计算性能高达2PFlops,将为全球AI用户带来前所未见的AI创新加速体验。此外,双方也将持续推动产品创新与GPU生态建设,共同推动AI赋能传统行业转型。

 无

图 HGX-2在国内的全面合作应用

RAPIDS,引领后摩尔时代下加速变革

    “数据分析和机器学习是高性能计算市场中最大的细分市场,不过目前尚未实现加速。”在 GTC 技术大会主旨演讲中黄仁勋表示,“全球最大的行业均在海量服务器上运行机器学习算法,目的在于了解所在市场和环境中的复杂模式,同时迅速、精准地做出将直接影响其基础的预测。”

    随着大数据技术的快速发展,不管是在数据处理还是训练的过程,都需要大量的计算力,而在后摩尔时代,数据的增长量远远超过了计算力,基于Hadoop、SPARK的分布式节点加速会越来越困难。对于GPU加速深度学习而言,它本质是加速了计算的应用,而数据分析和机器学习目前是最大的HPC应用分支,伴随着未来高速增长,它对计算力有着巨大的需求。对此,NVIDIA推出GPU 加速平台RAPIDS,该平台已与全球最流行的数据科学库及工作流无缝整合,可加速机器学习,如包括Anaconda、BlazingDB、Graphistry、NERSC、PyData、INRIA和Ursa Labs在内的主要开源贡献者,都在RAPIDS推出后立即给予了其广泛的生态系统支持。

    最初的 RAPIDS 基准分析利用了 XGBoost 机器学习算法在 NVIDIA DGX-2™ 系统上进行训练,结果表明,与仅有 CPU 的系统相比,其速度能加快 50 倍。这可以帮助数据科学家将典型训练时间从数天减少到数小时,或者从数小时减少到数分钟,具体取决于其数据集的规模。

 无

图 RAPIDS平台

    值得一提的是,RAPIDS 构建于 Apache Arrow、pandas 和 scikit-learn 等流行的开源项目之上,为最流行的Python 数据科学工具链带来了 GPU 提速。为了将更多的机器学习库和功能引入 RAPIDS,NVIDIA 广泛地与开源生态系统贡献者展开合作 ,其中包括 Anaconda、BlazingDB、Databricks、Quansight、scikit-learn、Ursa Labs 负责人兼 Apache Arrow 缔造者 WesMcKinney 以及迅速增长的 Python 数据科学库 pandas 等等。

T4,基于TURING架构的持续创新

    近几年,NVIDIA不断加强GPU与人工智能技术的融合发展,越来越多的产品线支持AI应用。本次会议上,黄仁勋还介绍了新的NVIDIA Tesla T4基于TURING(图灵)架构,主要面向于深度学习和AI视频应用,视频处理速度提高了一倍。他表示TURING架构相比于Quadro 过去的Pascal架构,新增了具备AI 训练和推理能力的张量核心(Tensor Core),以及支持光线跟踪的RT核心(RT Core),这一架构凝结了超过一万名工程师的努力。

    对此,黄仁勋甚至将其称为2006年CUDA GPU发布以来NVIDIA最重大的一次跨越,TURING GPU具备新一代混合渲染模式,融合了互操作光栅化、光线追踪、图形计算、人工智能等最新技术。

    此外,新一代TURING GPU架构得到了来自二十多个关键ISV的支持。为了帮助开发人员快速充分利用图灵的功能,NVIDIA通过新的人工智能,光线追踪和仿真SDK增强了其RTX开发平台,以加快TURING GPU对关键图形应用程序的能力,以满足数百万设计师、艺术家和科学家的需求。

    目前,黄仁勋表示国内的多家科技巨头正在推出基于全新 NVIDIA T4 GPU的新产品和服务,它已成为普及最为迅速的一款服务器 GPU。例如以浪潮为代表正在加快T4系列GPU的应用,其NF5280M4、NF5280M5、NF5288M5、NF5468M5型号预计将在年底前便开始供货。

DRIVE AGX Xavier,为自动驾驶注入新活力

    中国约占全球汽车销量的三分之一,年产汽车约2,450万辆,在全球向自动驾驶的过渡中提供了巨大的推动力,且领先公司已选用NVIDIA为其新一代汽车提供技术支持。自动驾驶技术正在带动一场交通运输业的革命——从个人旅行到物流和配送——这一变化在中国这一全球最大的汽车市场中更加明显。

    过去5年中,中国在电动汽车技术方面的投资超过150亿美元,旨在到2020年生产200万辆电动汽车,到2025年增至700万辆,已经成为新一代电动汽车初创企业的大本营。这些初创公司致力于全新动力总成技术以及自动驾驶,且正在使用NVIDIA DRIVE AGX Xavier来实现这一目标。

无

图 NVIDIA DRIVE AGX Xavier

    借助DRIVE AGX Xavier,总部位于中国广州的初创公司小鹏汽车及其主要的一级供应商德赛西威将使用每秒可处理30万亿次操作、功率仅为30瓦,致力于至2020年打造面向量产车型的L3级自动驾驶系统。L3级自动驾驶使汽车能够自行转向和制动,但在某些条件下仍需要手动控制。

    DRIVE AGX Xavier还将为来自北京的奇点汽车即将推出的车辆提供技术支持,奇点汽车是一家为L3级自动驾驶开发软件定义、可定制电动车的初创公司,旨在于2020年实现量产。此外,SF Motors计划于明年推出其首款电动分频器SF5,并表示将采用DRIVE AGX Xavier开发下一代自主计算平台。

责任编辑:王聪
e-works
官方微信
掌上
信息化
编辑推荐
文章推荐
博客推荐
视频推荐