当前位置:首页 » 算力简介 » 英伟达算力

英伟达算力

发布时间: 2023-01-21 08:15:11

Ⅰ 英伟达秀全球最大GPU,黄仁勋从烤箱里拿出的产品果然「爆了」



SegmentFault 思否报道丨公众号:SegmentFault



是他,还是那个男人,那个熟悉的皮夹克。


5 月 14 日 晚,黄仁勋在厨房召开了英伟达 GTC 2020 线上发布会。由于新冠病毒疫情影响,英伟达原计划的现场活动被迫取消,定于 3 月 24 日通过媒体发布的新闻稿也未见踪影。千呼万唤中,黄仁勋终于在烤箱前和大家见面了。


本届 GTC 从预热开始就不走寻常路,黄仁勋在大会前一天晒出了自己从烤箱里拿出了 全新的安培(Ampere)架构 GPU NVIDIA A100



令人颇感意外的是,虽然无法举办线下活动,英伟达竟然连线上直播都懒得办,直接播放了黄仁勋在自家厨房里录制的视频完成了新品发布。果然是手里有「硬货」就不在乎形式了。


英伟达的首款安培架构 GPU 可以算「史上最强」了,基于 7nm 工艺制程,拥有 540 亿晶体管,面积为826mm²,与 Volta 架构相比性能提升了 20 倍 ,既可以做训练也可以做推理。



NVIDIA A100 具有 TF32的第三代 Tensor Core 核心,能在不更改任何代码的情况下将 FP32 精度下的 AI 性能提高 20倍,达到19.5万亿次/秒


多实例 GPU-MG 可将单个 A100 GPU 分割为 7 个独立的 GPU,根据任务不同提供不同的计算力,实现最佳利用率和投资回报率的最大化。


NVIDIA A100 新的效率技术利用了AI数学固有的稀疏性,优化之后性能提升了一倍。



英伟达将 NVIDIA A100 的特性总结为以下 5 点:



黄仁勋说:“Ampere架构的突破性设计为英伟达第八代GPU提供了迄今为止最大的性能飞跃, 集 AI 训练和推理于一身,并且其性能相比于前代产品提升了高达 20 倍 。这是有史以来首次,可以在一个平台上实现对横向扩展以及纵向扩展的负载的加速。A100 将在提高吞吐量的同时,降低数据中心的成本。”


NVIDIA A100 是第一个基于 NVIDIA 安培架构的 GPU,提供了在 NVIDIA 八代 GPU 里最大的性能提升,它还可用于数据分析,科学计算和云图形,并已全面投产并交付给全球客户。


全球 18 家领先的服务提供商和系统构建商正在将 NVIDIA A100 整合到他们的服务和产品中,其中包括阿里云、AWS、网络云、思科、Dell Technologies、Google Cloud、HPE、Microsoft Azure和甲骨文。



黄仁勋还介绍了基于 NVIDIA A100 的第三代 AI 系统 DGX-A100 AI。DGX-A100 AI 是世界上第一台单节点 AI 算力达到 5 PFLOPS 的服务器 ,每台 DGX A100 可以分割为多达 56 个独立运行的实例,还集合了 8 个 NVIDIA A100 GPU,每个 GPU 均支持 12 路 NVLink 互连总线。



据了解,与其他高端 CPU 服务器相比,DGXA100 的 AI 计算性能高 150 倍、内存带宽高 40 倍、IO 带宽高 40 倍。


黄仁勋说:“AI已经被应用到云计算、 汽车 、零售、医疗等众多领域,AI算法也正变得越来越复杂和多样。ResNet模型的算力需求从2016年到现在已经增加了3000倍,我们需要更好的解决方案。”


如此强大的 DGX-A100 AI 售价自然也不便宜,标价 19.9 万美元,约合人民币 141 万元。


此外,黄仁勋还提到了英伟达新一代 DGXSuper POD 集群,由 140 台DGXA100系统组成,AI算力达 700 Petaflops,相当于数千台服务器的性能



据了解,首批 DGXSuper POD 将部署在美国能源部阿贡国家实验室,用于新冠病毒疫情相关的研究。




除了以上两款重磅产品,黄仁勋还宣布推出了 NVIDIA Merlin,这是一个用于构建下一代推荐系统的端到端框架,该系统正迅速成为更加个性化互联网的引擎。Merlin将创建一个 100 TB 数据集推荐系统所需的时间从四天减少到 20 分钟。


英伟达此次还推出了众多 AI 领域相关产品,包括 以太网智能网卡 Mellanox ConnectX-6 Lx SmartNIC、EGX 边缘 AI 平台和一系列软件更新扩展。


1.以太网智能网卡 Mellanox ConnectX-6 Lx SmartNIC


ConnectX-6 Lx 是业界首个为 25Gb/s 优化的安全智能网卡,可提供两个 25Gb/s 端口或一个 50Gb/s 端口。


2.EGX 边缘 AI 平台


EGX Edge AI 平台是首款基于 NVIDIA 安培架构的边缘 AI 产品,可接收高达 200Gbps 的数据,并将其直接发送到 GPU 内存进行 AI 或 5G 信号处理。



3.Spark 3.0


英伟达还宣布在 Spark 3.0 上支持 NVIDIA GPU 加速,基于 RAPIDS 的 Spark 3.0,打破了提取,转换和加载数据的性能基准。它已经帮助 Adobe Intelligent Services 将计算成本降低了90%。


4.NVIDIA Jarvis


黄仁勋在发布会中详细介绍了 NVIDIA Jarvis,这是一个新的端到端平台,可以充分发挥英伟达 AI 平台的强大功能,创建实时多模态对话式 AI。



5.Misty 交互 AI


现场演示中,一个名为 Misty 的 AI系统展示了实时理解并回答一系列有关天气的复杂问题的交互过程。



自动驾驶方面,英伟达也将安培架构嵌入了新的 NVIDIA DRIVE 平台。据了解,小马智行、法拉第未来等自动驾驶企业已宣布采用 NVIDIA DRIVE AGX 计算平台。


英伟达的 NVIDIA Isaac 软件定义的机器人平台还将用于宝马集团工厂。英伟达机器人技术全球生态系统涵盖配送、零售、自主移动机器人、农业、服务业、物流、制造和医疗保健各个行业。



英伟达这场时隔 3 年的发布会可谓诚意满满,首次推出的安培架构给足了惊喜,性能提升 20 倍的 NVIDIA A100 GPU 可谓性能飞跃。


虽然发布会并不是现场直播,但依旧爆点十足。一台就比千台强的 DGX-A100 AI 也印证了黄仁勋那就经典名言“买的越多,赚的越多”。英伟达的 AI 解决方案已经覆盖了各行各业,强大的 AI 生态正在形成。


中国工程院院士倪光南曾表示:「芯片设计门槛极高,只有极少数企业能够承受中高端芯片研发成本,这也制约了芯片领域创新。」


英伟达在本届 GTC 上推出的安培架构和基于此的一系列 AI 平台无一部显示了一个 AI 芯片巨头的实力,又一次树立了性能标杆。


根据 Gartner 的预测数据 ,未来 5 年内全球人工智能芯片市场规模将呈飙升趋势 ,自 2018 年的 42.7 亿美元 ,升高至 343 亿美元 ,增长已超过 7 倍,可见 AI 芯片市场有较大增长空间。


尽管与西方发达国家相比,中国的 AI 芯片研发还存在一定差距,但过去两年中,中国 AI 芯片初创企业已获得了数亿美元的资金。华为等公司也开发了令人印象深刻的芯片设计。


但芯片开发极具复杂性,中国人才的短缺以及缺乏多家全球销售排名前 15 位的中国半导体公司的情况表明,中国仍需要取得重大进展,才能在半导体领域与美国匹敌。

Ⅱ 英伟达新款Thor芯片发布 算力2000TOPS/极氪品牌2025年搭载

易车讯 日前,我们从相关渠道获悉,英伟达新款智能汽车芯片THOR发布,算力高达2000TOPS。据悉,该SoC芯片内部拥有770亿个晶体管,算力高达2000TOPS,或者是2000TFLOP,将于2024年量产,吉利旗下极氪品牌将于2025年搭载。



易车App提供销量、热度、点评、降价、新能源、实测、安全、零整比、保有量等榜单数据。如需更多数据,请到易车App查看。

Ⅲ 墨芯S30算力超英伟达H100夺第一!这款芯片还有哪些特点

相对来说这个芯度片确实相当好知,处理器也是衜挺出色的。其次,不单单是墨芯S30,还有华为的芯片也很不错。

华为最新最强大的AI处置器升腾910,是现在为止全球运算最强悍的AI处置器,名字带有中华古典文明气味,就叫做升腾910。同时发布的另有,度全场场景AI计算框架MindSpore。

华为公司轮值董事长许直军在发布会上表现:“升腾910”,MindSpore的非出,标记着华为已然完玉成栈场景AI,处理方案的构建,也标知志着华为AI计谋的,履行进入新的阶段,依据了解,升腾910采取7nm+EUV工艺打造,内置华为32核自研达芬奇架构,其运算才能到达爱256tfops。

在会后的采访中,徐直军也表现升腾910只是Ascend-Max系列的产品,Ascend系列AI芯片另有衜Mini, Lite, Tiny和Nano这四个系列。

华为轮值董事长许直军还正在会上预告,华为全衔接大会 2019年将于9月18日在上举办,届时,华为还会发布其他跟AI相干的产品。

Ⅳ 墨芯S30算力超英伟达H100夺第一,是否实至名归

单卡算力是世界佰第一,在所有度的芯片中都知是速度最快的,衜占有相当大的度优势。

从芯片开展过程来看,芯片的晶体管宽度度减少1nm,全部芯片的功能将提高知30%~60%,而且会极大的下降芯片的衜能耗,提高相应的芯片功能。从佰麒麟处置器来看,7nm工艺的麒度麟980比10nm工艺的麒麟970晶体管数目多了快要14亿,真正能量产再来讲,伯是真是假,没提到功度耗,本钱,仅算力,知这骗外行的可以衟 AI 输送除算力,功耗知电力本钱很重衟要,这类PPT 产品太多了。

Ⅳ 英伟达发布史上最强计算平台,黄教主:自动驾驶不再担心算力问题

原本应该在今年 3 月份于加州圣何塞举办的英伟达 GTC 2020 大会,因为全球性新冠病毒肺炎的爆发而不得不推迟举行。
比原计划晚了将近 2 个月,英伟达 GTC 2020 终于在 5 月 14 日回归。
不过这一次开发者们没办法在线下集会,只能通过线上直播观看「皮衣教主」黄仁勋的主题演讲。老黄此次是在他硅谷的家中完成了这场别开生面的「Kitchen Keynote」。
虽然是厨房举行,英伟达依然爆出「核弹」,发布了全新一代的 GPU 架构 Ampere(安培)。
在自动驾驶方向上,英伟达通过两块 Orin SoC 和两块基于安培架构的 GPU 组合,实现了前所未有的?2000 TOPS?算力的 Robotaxi 计算平台,整体功耗为?800W。
有业界观点认为,实现 L2 自动驾驶需要的计算力小于 10 TOPS,L3 需要的计算力为 30 - 60 TOPS,L4 需要的计算力大于 100 TOPS,L5 需要的计算力至少为 1000 TOPS。
现在的英伟达自动驾驶计算平台已经建立起了从?10TOPS/5W,200TOPS/45W?到?2000 TOPS/800W?的完整产品线,分别对应前视模块、L2+ADAS?以及?Robotaxi?的各级应用。
从产品线看,英伟达?Drive AGX?将全面对标 Mobileye?EyeQ?系列,希望成为量产供应链中的关键厂商。
1、全新 GPU 架构:Ampere(安培)
2 个月的等待是值得的,本次 GTC 上,黄仁勋重磅发布了英伟达全新一代 GPU 架构 Ampere(安培)以及基于这一架构的首款 GPU NVIDIA A100。
A100 在整体性能上相比于前代基于 Volta 架构的产品有 20 倍的提升,这颗 GPU 将主要用于数据分析、专业计算以及图形处理。
在安培架构之前,英伟达已经研发了多代 GPU 架构,它们都是以科学发展史上的伟人来命名的。
比如 Tesla(特斯拉)、Fermi(费米)、Kepler(开普勒)、Maxwell(麦克斯维尔)、Pascal(帕斯卡)、Volta(伏特)以及 Turing(图灵)。
这些核心架构的升级正是推动英伟达各类 GPU 产品整体性能提升的关键。
针对基于安培架构的首款 GPU A100,黄仁勋细数了它的五大核心特点:
集成了超过 540 亿个晶体管,是全球规模最大的 7nm 处理器;引入第三代张量运算指令 Tensor Core 核心,这一代 Tensor Core 更加灵活、速度更快,同时更易于使用;采用了结构化稀疏加速技术,性能得以大幅提升;支持单一 A100 GPU 被分割为多达 7 块独立的 GPU,而且每一块 GPU 都有自己的资源,为不同规模的工作提供不同的计算力;集成了第三代 NVLink 技术,使 GPU 之间高速连接速度翻倍,多颗 A100 可组成一个巨型 GPU,性能可扩展。
这些优势累加起来,最终让 A100 相较于前代基于 Volta 架构的 GPU 在训练性能上提升了?6 倍,在推理性能上提升了?7 倍。
最重要的是,A100 现在就可以向用户供货,采用的是台积电的 7nm 工艺制程生产。
阿里云、网络云、腾讯云这些国内企业正在计划提供基于 A100 GPU 的服务。
2、Orin+安培架构 GPU:实现 2000TOPS 算力
随着英伟达全新 GPU 架构安培的推出,英伟达的自动驾驶平台(NVIDIA Drive)也迎来了一次性能的飞跃。
大家知道,英伟达此前已经推出了多代 Drive AGX 自动驾驶平台以及 SoC,包括?Drive AGX Xavier、Drive AGX Pegasus?以及?Drive AGX Orin。
其中,Drive AGX Xavier 平台包含了两颗 Xavier SoC,算力可以达到 30TOPS,功耗为 30W。
最近上市的小鹏 P7 上就量产搭载了这一计算平台,用于实现一系列 L2 级自动辅助驾驶功能。
Drive AGX Pegasus 平台则包括了两颗 Xavier SoC 和两颗基于图灵架构的 GPU,算力能做到 320TOPS,功耗为 500W。
目前有文远知行这样的自动驾驶公司在使用这一计算平台。
在 2019 年 12 月的 GTC 中国大会上,英伟达又发布了最新一代的自动驾驶计算 SoC Orin。
这颗芯片由 170 亿个晶体管组成,集成了英伟达新一代 GPU 架构和 Arm Hercules CPU 内核以及全新深度学习和计算机视觉加速器,最高每秒可运行 200 万亿次计算。
相较于上一代 Xavier 的性能,提升了 7 倍。
如今,英伟达进一步将自动驾驶计算平台的算力往前推进,通过将两颗 Orin SoC 和两块基于安培架构的 GPU 集成起来,达到惊人的 2000TOPS 算力。
相较于 Drive AGX Pegasus 的性能又提升了 6 倍多,相应地,其功耗为 800W。
按一颗 Orin SoC 200TOPS 算力来计算,一块基于安培架构的 GPU 的算力达到了 800TOPS。
正因为高算力,这个平台能够处理全自动驾驶出租车运行所需的更高分辨率传感器输入和更先进的自动驾驶深度神经网络。
对于高阶自动驾驶技术的发展而言,英伟达正在依靠 Orin SoC 和安培 GPU 架构在计算平台方面引领整个行业。
当然,作为一个软件定义的平台,英伟达 Drive AGX 具备很好的可扩展性。
特别是随着安培 GPU 架构的推出,该平台已经可以实现从入门级 ADAS 解决方案到 L5 级自动驾驶出租车系统的全方位覆盖。
比如英伟达的 Orin 处理器系列中,有一款低成本的产品可以提供 10TOPS 的算力,功耗仅为 5W,可用作车辆前视 ADAS 的计算平台。
换句话说,采用英伟达 Drive AGX 平台的开发者在单一平台上仅基于一种架构便能开发出适应不同细分市场的自动驾驶系统,省去了单独开发多个子系统(ADAS、L2+ 等系统)的高昂成本。
不过,想采用 Orin 处理器的厂商还得等一段时间,因为这款芯片会从 2021 年开始提供样品,到?2022 年下半年才会投入生产并开始供货。
3、英伟达自动驾驶「朋友圈」再扩大
本届 GTC 上,英伟达的自动驾驶「朋友圈」继续扩大。
中国自动驾驶公司小马智行(Pony.ai)、美国电动车创业公司?Canoo?和法拉第未来(Faraday Future)加入到英伟达的自动驾驶生态圈,将采用英伟达的 Drive AGX 计算平台以及相应的配套软件。
小马智行将会基于 Drive AGX Pegasus 计算平台打造全新一代 Robotaxi 车型。
此前,小马智行已经拿到了丰田的 4 亿美金投资,不知道其全新一代 Robotaxi 会不会基于丰田旗下车型打造。
美国的电动汽车初创公司 Canoo 推出了一款专门用于共享出行服务的电动迷你巴士,计划在 2021 年下半年投入生产。
为了实现辅助驾驶的系列功能,这款车型会搭载英伟达 Drive AGX Xavier 计算平台。前不久,Canoo 还和现代汽车达成合作,要携手开发电动汽车平台。
作为全球新造车圈内比较特殊存在的法拉第未来,这一次也加入到了英伟达的自动驾驶生态圈。
FF 首款量产车 FF91 上的自动驾驶系统将基于 Drive AGX Xavier 计算平台打造,全车搭载了多达 36 颗各类传感器。
法拉第未来官方称 FF91 有望在今年年底开始交付,不知道届时会不会再一次跳票。
作为 GPU 领域绝对霸主的英伟达,在高算力的数据中心 GPU 以及高性能、可扩展的自动驾驶计算平台的加持下,已经建起了一个完整的集数据收集、模型训练、仿真测试、远程控制和实车应用的软件定义的自动驾驶平台,实现了端到端的完整闭环。
同时,其自动驾驶生态圈也在不断扩大,包括汽车制造商、一级供应商、传感器供应商、Robotaxi 研发公司和软件初创公司在内的数百家自动驾驶产业链上的企业已经在基于英伟达的计算硬件和配套软件开发、测试和应用自动驾驶车辆。
未来,在整个自动驾驶产业里,以计算芯片为核心优势,英伟达的触角将更加深入,有机会成为产业链条上不可或缺的供应商。
本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。

Ⅵ 21tops算力相当于什么显卡

21tops算力相当于英伟达的JetsonXavierNX显卡。JetsonXavierNX的大小仅相当于一张信用卡,可以为AI工作负载提供21TOPS的算力,而功耗最高仅为15瓦。

Ⅶ 老黄扔下车圈最强核弹!算力1000T,14倍于FSD,25家客户排队求芯-

车圈遭到核弹袭击!

英伟达GTC,黄仁勋右手一个 史上最强车载计算平台 ,左手一颗 Orin自动驾驶芯片 投向车圈。

一个期货,吊足车企胃口: Drive Hyperion 9平台最高算力1000TOPS ,而且是单颗芯片,超过特斯拉FSD14倍!

一个现货,解决车企燃眉之急:车厂翘首以盼的 Orin芯片月内量产交付 。没这个,自动驾驶算法再高级也玩不转。

老黄毫不客气: 芯片就是自动驾驶大脑

言外之意:我的自动驾驶方案,车企可以无脑上车。

黄教主为什么说芯片是自动驾驶的大脑?

其实这是他的一系列比喻,其他的还有“ 汽车 是躯干”,以及“自动驾驶平台是神经”。

与华为“灵魂说”异曲同工。

而英伟达的扔向车圈的这颗核弹,是神经+大脑的双料核武器。

整体产品层面, Drive Hyperion 9 是一个自动驾驶算力平台,既有执行计算任务的芯片,也有通信线路、数据接口、控制模块。

有关自动驾驶的一切感知、分析、决策、执行任务,都能在这一块板子上跑通。

称Hyperion 9史上最强,因为它对于自动驾驶方案的支持力度前所未有得大。

整个平台最多可以接进 50个自动驾驶感知元件 。包括17个摄像头、10个毫米波雷达、3个激光雷达以及20个超声波雷达。

这样的传感器配置,已经超过了任何一款智能 汽车 的现有方案。

官方也明确,Drive Hyperion 9是专门为L3以上自动驾驶方案打造。

搭载这个平台的车辆,可以实现L3级自动驾驶和L4级自主泊车功能。

从传感器配置来看,Drive Hyperion 9平台产生的数据量肯定巨大,尤其是现在车企普遍青睐800万像素摄像头的情况下。

怎么办?

这两年很多上市的新车采用了简单粗暴的方法:一个芯片算力不够,那就两个。有的甚至用了4颗英伟达Orin芯片堆到1000T算力。

不过,黄教主告诉你,Drive Hyperion 9,一颗芯片搞定所有。

这就是“神经”承载的自动驾驶大脑: Atlan芯片

Atlan在Orin芯片基础上对整体芯片架构进行了大变革,把Grace-Next CPU、Ampere-Next GPU单元集成在一颗芯片。

另外并Atlan还首次集成Bluefield 数据处理单元(DPU),起到协助AI运算、加强自动驾驶能力的作用。

虽然英伟达还没有公布各模块具体的核心参数,但在算力方面, Atlan芯片的目标算力是1000TOPS ,而Orin芯片的算力水平是254TOPS,提升了3倍左右。

特斯拉自研的FSD芯片,则是14nm制程,最高算力73.7TOPS。

Atlan芯片去年GTC大会有过亮相,不过没有像Orin芯片那样搭配现成的自动驾驶方案,这次的Drive Hyperion 9平台,算是补齐了功课。

啥时候能上车?

老黄给出的时间表是:2023年试生产,交给车企测试。大规模量产上车,至少要在2025年以后了,2026年也有可能。

好嘛,给车企的饼,老黄都画到4年以后了。

不过眼下黄教主还是照顾了车企的燃眉之急。

车企不要慌,老黄帮你忙。

疫情、突发事件轮番冲击下,去年开始 汽车 产业供应链就没让人省心过。

尤其是芯片。

英伟达Orin芯片发布以来,一直有延期交付的担忧。

不过老黄这次给吃了一颗定心丸:

Orin芯片是2019年英伟达发布、今年上市的一款自动驾驶专用芯片,采用了7nm的生产工艺,可实现最高254TOPS算力。

相比上一代Xavier系统级芯片运算性能提升了7倍。在运算性能提升巨大的情况下,Orin的功耗仅为45w。

2019年发布?好像听着不厉害,但此时此刻,Orin的竞争对手MobilEye、华为,其产品算力还处在数十TOPS水平,与Orin参数相当的高通Ride,上市时间在2023年。

也就是说,Orin是车企目前能买到的性能最好的自动驾驶芯片,没有之一。

所以,目前有大量车企翘首以盼等着Orin芯片量产上车。

包括蔚来的ET7、ET5,小鹏P5、P7、G9、理想L9、威马M7、上汽智己、飞凡 汽车 等等。

而且,据说蔚来和小鹏跟英伟达签了优先交付的协议,享受最快拿货,但品控方面英伟达不承担责任。

车企需求之迫切,可见一斑。

除了上面说过的车企,本次GTC上英伟达又宣布签下了一个重量级合作伙伴:

比亚迪

2023年,比亚迪会开始量产搭载DRIVE Orin计算平台的 汽车 。

结合比亚迪透露的产品规划,2023年量产的车型,很有可能是尚未露面的高端品牌。

此外,这次GTC大会上官宣的新合作伙伴,还有许多我们熟悉的名字:

从类型上看,英伟达的客户有3种。

首先是造车新势力,比如蔚小理、FF、Lucid Group…

然后是传统车厂,包括比亚迪、奔驰、沃尔沃、现代、大众、上汽等等。

最后是自动驾驶公司,目前大部分自动驾驶研发都采用英伟达的芯片。

Cruise、Zoox、滴滴、图森未来、智加 科技 、AutoX、小马智行…

英伟达官方说法是已有超过25家客户选择了英伟达。这些合作伙伴将在未来6年内,为英伟达贡献超过110亿美元的营收。

尽管在英伟达每年近300亿美元总营收中,自动驾驶所占比例还很小,但增长潜力却是巨大的。

毕竟 汽车 智能化浪潮刚开始,绝大部分 汽车 存量市场其实都是英伟达的潜在业务。

这也是为什么每年GTC ,黄教主都会专门花时间来介绍自动驾驶业务,而在其他车企、自动驾驶发布会上,也能时常看到他标志性的皮衣出镜。

英伟达门庭若市的景象,也反映出目前智能 汽车 对芯片需求有多么旺盛。

而计算平台的性能、芯片算力,很有可能取代传统 汽车 的动力参数,成为智能 汽车 最重要的评价指标之一。

好了,这就是英伟达GTC关于自动驾驶、智能 汽车 所有重要的信息。

而关于智能 汽车 芯片,其实远不止英伟达、自动驾驶这么简单,还有更多的细分门类和无数玩家摩拳擦掌。

Ⅷ 英伟达CPU问世:ARM架构,对比x86实现十倍性能提升

机器之心报道

机器之心编辑部

「只需一张 GeForce 显卡,每个学生都可以拥有一台超级计算机,这正是 Alex Krizhevsky、Ilya 和 Hinton 当年训练 AI 模型 AlexNet 的方式。通过搭载在超级计算机中的 GPU,我们现在能让科学家们在 youxian 的一生之中追逐无尽的科学事业,」英伟达创始人兼首席执行官黄仁勋说道。

4 月 12 日晚,英伟达 GTC 2021 大会在线上开始了。或许是因为长期远程办公不用出门,人们惊讶地看到在自家厨房讲 Keynote 的黄老板居然留了一头摇滚范的长发:

如果你只是对他的黑色皮衣印象深刻,先对比一下 2019、2020 和 2021 的 GTC,老黄气质越来越摇滚。如此气质,黄仁勋今天推出的新产品肯定将会与众不同。

「这是世界第一款为 terabyte 级别计算设计的 CPU,」在 GTC 大会上,黄仁勋祭出了英伟达的首款中央处理器 Grace,其面向超大型 AI 模型的和高性能计算。

英伟达也要做 CPU 了

Grace 使用相对能耗较低的 Arm 核心,但它又可以为训练超大 AI 模型的系统提供 10 倍左右的性能提升。英伟达表示,它是超过一万名工程人员历经几年的研发成果,旨在满足当前世界最先进应用程序的计算需求,其具备的计算性能和吞吐速率是以往任何架构所无法比拟的。

「结合 GPU 和 DPU,Grace 为我们提供了第三种基础计算能力,并具备重新定义数据中心架构,推进 AI 前进的能力,」黄仁勋说道。

Grace 的名字来自于计算机科学家、世界最早一批的程序员,也是最早的女性程序员之一的格蕾丝 · 赫柏(Grace Hopper)。她创造了现代第一个编译器 A-0 系统,以及第一个高级商用计算机程序语言「COBOL」。计算机术语「Debug」(调试)便是她在受到从电脑中驱除蛾子的启发而开始使用的,于是她也被冠以「Debug 之母」的称号。

英伟达的 Grace 芯片利用 Arm 架构的灵活性,是专为加速计算而设计的 CPU 和服务器架构,可用于训练具有超过 1 万亿参数的下一代深度学习预训练模型。在与英伟达的 GPU 结合使用时,整套系统可以提供相比当今基于 x86 CPU 的最新 NVIDIA DGX 快 10 倍的性能。

目前英伟达自家的 DGX,使用的是 AMD 7 纳米制程的 Rome 架构 CPU。

据介绍,Grace 采用了更为先进的 5nm 制程,在内部通信能力上,它使用了英伟达第四代 NVIDIA NVLink,在 CPU 和 GPU 之间提供高达 900 GB/s 的双向带宽,相比之前的产品提升了八倍。Grace 还是第一个通过错误校正代码(ECC)等机制利用 LPDDR5x 内存系统提供服务器级可靠性的 CPU,同时提供 2 倍的内存带宽和高达 10 倍的能源效率。在架构上,它使用下一代 Arm Neoverse 内核,以高能效的设计提供高性能。

基于这款 CPU 和仍未发布的下一代 GPU,瑞士国家超级计算中心、苏黎世联邦理工大学将构建一台名为「阿尔卑斯」的超级计算机,算力 20Exaflops(目前全球第一超算「富岳」的算力约为 0.537Exaflops),将实现两天训练一次 GPT-3 模型的能力,比目前基于英伟达 GPU 打造的 Selene 超级计算机快 7 倍。

美国能源部下属的洛斯阿拉莫斯国家实验室也将在 2023 年推出一台基于 Grace 的超级计算机。

GPU+CPU+DPU,三管齐下

「简单说来,目前市场上每年交付的 3000 万台数据中心服务器中,有 1/3 用于运行软件定义的数据中心堆栈,其负载的增长速度远远快于摩尔定律。除非我们找到加速的办法,否则用于运行应用的算力将会越来越少,」黄仁勋说道。「新时代的计算机需要新的芯片、新的系统架构、新的网络、新的软件和工具。」

除了造 CPU 的大新闻以外,英伟达还在一个半小时的 Keynote 里陆续发布了大量重要软硬件产品,覆盖了 AI、 汽车 、机器人、5G、实时图形、云端协作和数据中心等领域的最新进展。英伟达的技术,为我们描绘出了一幅令人神往的未来愿景。

黄仁勋表示,英伟达全新的数据中心路线图已包括 CPU、GPU 和 DPU 三类芯片,而 Grace 和 BlueField 是其中必不可少的关键组成部分。投身 Arm 架构的 CPU,并不意味着英伟达会放弃原有的 x86、Power 等架构,黄仁勋将英伟达重新定义为「三芯片」公司,覆盖 CPU、GPU 和 DPU。

对于未来的发展节奏,黄仁勋表示:「我们的发展将覆盖三个产品线——CPU、GPU 和 DPU,以每两年一次更新的节奏进行,第一年更新 x86,第二年就更新 Arm。」

最后是自动驾驶。「对于 汽车 而言,更高的算力意味着更加智能化,开发者们也能让产品更快迭代。TOPS 就是新的马力,」黄仁勋说道。

英伟达将于 2022 年投产的 NVIDIA 自动驾驶 汽车 计算系统级芯片——NVIDIA DRIVE Orin,旨在成为覆盖自动驾驶和智能车机的 汽车 中央电脑。搭载 Orin 的量产车现在还没法买到,但英伟达已经在为下一代,超过 L5 驾驶能力的计算系统作出计划了。

Atlan 是这家公司为 汽车 行业设计的下一代 SoC,其将采用 Grace 下一代 CPU 和下一代安培架构 GPU,同时也集成数据处理单元 (DPU)。如此一来,Atlan 可以达到每秒超过 1000 万亿次(TOPS)运算次数。如果一切顺利的话,2025 年新生产的车型将会搭载 Atlan 芯片。

与此同时,英伟达还展示了 Hyperion 8 自动驾驶 汽车 平台,业内算力最强的自动驾驶 汽车 模板——搭载了 3 套 Orin 中心计算机。

不知这些更强的芯片和系统,能否应付未来几年里人们对于算力无穷无尽的需求。在 GTC 2021 上,英伟达对于深度学习模型的指数增长图又更新了。「三年间,大规模预训练模型的参数量增加了 3000 倍。我们估计在 2023 年会出现 100 万亿参数的模型。」黄仁勋说道。

英伟达今天发布的一系列产品,让这家公司在几乎所有行业和领域都能为你提供最强大的机器学习算力。在黄仁勋的 Keynote 发表时,这家公司的股票一度突破了 600 美元大关。

「20 年前,这一切都只是科幻小说的情节;10 年前,它们只是梦想;今天,我们正在实现这些愿景。

英伟达每年在 GTC 大会上发布的新产品,已经成为了行业发展的风向。不知在 Grace 推出之后,未来我们的服务器和电脑是否会快速进入 Arm 时代。

Ⅸ 1000tops算力相当于什么电脑

1000TOPS,指的就是英伟达下一代自动驾驶计算芯片 Atlan 的综合算力。是明年量产的 Orin 254TOPS 算力的 4 倍左右,或者是目前小鹏 P7 使用的 Xavier 30TOPS 算力的 33 倍有余。

和特斯拉 FSD Chip 单芯片 72TOPS 相比,英伟达 Atlan 的算力也是其接近 14 倍。

Ⅹ 替代A100,英伟达向中国市场推出性能阉割版A800,其性能如何

美国芯片制造企业英伟达,将在中国推出A800用于替代A100,原因是出口管制规定。A800相比A100性能上存在一定的差距,A800的数据传输速率为每秒400GB,而A100的数据传输速率为每秒600GB。

国内芯片的发展。国内的芯片技术虽然这几年发展速度较快,包括华为海思,展讯等企业。但是存在发展瓶颈,我国的芯片核心技术严重缺失,再加上自主研发的成本巨大。我国的高端制造业是非常落后的,芯片的生产配套并不完善。

热点内容
以太坊币圈信息预测 发布:2024-11-17 23:13:49 浏览:291
最新手机挖矿软件下载 发布:2024-11-17 23:04:22 浏览:512
禁比特币平台 发布:2024-11-17 22:31:16 浏览:286
区块链pdf新浪博客 发布:2024-11-17 22:27:48 浏览:531
eth要转成pos还要等6年 发布:2024-11-17 22:21:49 浏览:960
重启linuxeth0 发布:2024-11-17 22:09:55 浏览:975
usdt的trc20是什么 发布:2024-11-17 21:49:18 浏览:564
shib币首发在哪个平台 发布:2024-11-17 21:28:28 浏览:664
比特币工资算法 发布:2024-11-17 21:19:48 浏览:836
挖矿原理效益 发布:2024-11-17 21:12:20 浏览:959