當前位置:首頁 » 算力簡介 » 英偉達算力

英偉達算力

發布時間: 2023-01-21 08:15:11

Ⅰ 英偉達秀全球最大GPU,黃仁勛從烤箱里拿出的產品果然「爆了」



SegmentFault 思否報道丨公眾號:SegmentFault



是他,還是那個男人,那個熟悉的皮夾克。


5 月 14 日 晚,黃仁勛在廚房召開了英偉達 GTC 2020 線上發布會。由於新冠病毒疫情影響,英偉達原計劃的現場活動被迫取消,定於 3 月 24 日通過媒體發布的新聞稿也未見蹤影。千呼萬喚中,黃仁勛終於在烤箱前和大家見面了。


本屆 GTC 從預熱開始就不走尋常路,黃仁勛在大會前一天曬出了自己從烤箱里拿出了 全新的安培(Ampere)架構 GPU NVIDIA A100



令人頗感意外的是,雖然無法舉辦線下活動,英偉達竟然連線上直播都懶得辦,直接播放了黃仁勛在自家廚房裡錄制的視頻完成了新品發布。果然是手裡有「硬貨」就不在乎形式了。


英偉達的首款安培架構 GPU 可以算「史上最強」了,基於 7nm 工藝製程,擁有 540 億晶體管,面積為826mm²,與 Volta 架構相比性能提升了 20 倍 ,既可以做訓練也可以做推理。



NVIDIA A100 具有 TF32的第三代 Tensor Core 核心,能在不更改任何代碼的情況下將 FP32 精度下的 AI 性能提高 20倍,達到19.5萬億次/秒


多實例 GPU-MG 可將單個 A100 GPU 分割為 7 個獨立的 GPU,根據任務不同提供不同的計算力,實現最佳利用率和投資回報率的最大化。


NVIDIA A100 新的效率技術利用了AI數學固有的稀疏性,優化之後性能提升了一倍。



英偉達將 NVIDIA A100 的特性總結為以下 5 點:



黃仁勛說:「Ampere架構的突破性設計為英偉達第八代GPU提供了迄今為止最大的性能飛躍, 集 AI 訓練和推理於一身,並且其性能相比於前代產品提升了高達 20 倍 。這是有史以來首次,可以在一個平台上實現對橫向擴展以及縱向擴展的負載的加速。A100 將在提高吞吐量的同時,降低數據中心的成本。」


NVIDIA A100 是第一個基於 NVIDIA 安培架構的 GPU,提供了在 NVIDIA 八代 GPU 里最大的性能提升,它還可用於數據分析,科學計算和雲圖形,並已全面投產並交付給全球客戶。


全球 18 家領先的服務提供商和系統構建商正在將 NVIDIA A100 整合到他們的服務和產品中,其中包括阿里雲、AWS、網路雲、思科、Dell Technologies、Google Cloud、HPE、Microsoft Azure和甲骨文。



黃仁勛還介紹了基於 NVIDIA A100 的第三代 AI 系統 DGX-A100 AI。DGX-A100 AI 是世界上第一台單節點 AI 算力達到 5 PFLOPS 的伺服器 ,每台 DGX A100 可以分割為多達 56 個獨立運行的實例,還集合了 8 個 NVIDIA A100 GPU,每個 GPU 均支持 12 路 NVLink 互連匯流排。



據了解,與其他高端 CPU 伺服器相比,DGXA100 的 AI 計算性能高 150 倍、內存帶寬高 40 倍、IO 帶寬高 40 倍。


黃仁勛說:「AI已經被應用到雲計算、 汽車 、零售、醫療等眾多領域,AI演算法也正變得越來越復雜和多樣。ResNet模型的算力需求從2016年到現在已經增加了3000倍,我們需要更好的解決方案。」


如此強大的 DGX-A100 AI 售價自然也不便宜,標價 19.9 萬美元,約合人民幣 141 萬元。


此外,黃仁勛還提到了英偉達新一代 DGXSuper POD 集群,由 140 台DGXA100系統組成,AI算力達 700 Petaflops,相當於數千台伺服器的性能



據了解,首批 DGXSuper POD 將部署在美國能源部阿貢國家實驗室,用於新冠病毒疫情相關的研究。




除了以上兩款重磅產品,黃仁勛還宣布推出了 NVIDIA Merlin,這是一個用於構建下一代推薦系統的端到端框架,該系統正迅速成為更加個性化互聯網的引擎。Merlin將創建一個 100 TB 數據集推薦系統所需的時間從四天減少到 20 分鍾。


英偉達此次還推出了眾多 AI 領域相關產品,包括 乙太網智能網卡 Mellanox ConnectX-6 Lx SmartNIC、EGX 邊緣 AI 平台和一系列軟體更新擴展。


1.乙太網智能網卡 Mellanox ConnectX-6 Lx SmartNIC


ConnectX-6 Lx 是業界首個為 25Gb/s 優化的安全智能網卡,可提供兩個 25Gb/s 埠或一個 50Gb/s 埠。


2.EGX 邊緣 AI 平台


EGX Edge AI 平台是首款基於 NVIDIA 安培架構的邊緣 AI 產品,可接收高達 200Gbps 的數據,並將其直接發送到 GPU 內存進行 AI 或 5G 信號處理。



3.Spark 3.0


英偉達還宣布在 Spark 3.0 上支持 NVIDIA GPU 加速,基於 RAPIDS 的 Spark 3.0,打破了提取,轉換和載入數據的性能基準。它已經幫助 Adobe Intelligent Services 將計算成本降低了90%。


4.NVIDIA Jarvis


黃仁勛在發布會中詳細介紹了 NVIDIA Jarvis,這是一個新的端到端平台,可以充分發揮英偉達 AI 平台的強大功能,創建實時多模態對話式 AI。



5.Misty 交互 AI


現場演示中,一個名為 Misty 的 AI系統展示了實時理解並回答一系列有關天氣的復雜問題的交互過程。



自動駕駛方面,英偉達也將安培架構嵌入了新的 NVIDIA DRIVE 平台。據了解,小馬智行、法拉第未來等自動駕駛企業已宣布採用 NVIDIA DRIVE AGX 計算平台。


英偉達的 NVIDIA Isaac 軟體定義的機器人平台還將用於寶馬集團工廠。英偉達機器人技術全球生態系統涵蓋配送、零售、自主移動機器人、農業、服務業、物流、製造和醫療保健各個行業。



英偉達這場時隔 3 年的發布會可謂誠意滿滿,首次推出的安培架構給足了驚喜,性能提升 20 倍的 NVIDIA A100 GPU 可謂性能飛躍。


雖然發布會並不是現場直播,但依舊爆點十足。一台就比千台強的 DGX-A100 AI 也印證了黃仁勛那就經典名言「買的越多,賺的越多」。英偉達的 AI 解決方案已經覆蓋了各行各業,強大的 AI 生態正在形成。


中國工程院院士倪光南曾表示:「晶元設計門檻極高,只有極少數企業能夠承受中高端晶元研發成本,這也制約了晶元領域創新。」


英偉達在本屆 GTC 上推出的安培架構和基於此的一系列 AI 平台無一部顯示了一個 AI 晶元巨頭的實力,又一次樹立了性能標桿。


根據 Gartner 的預測數據 ,未來 5 年內全球人工智慧晶元市場規模將呈飆升趨勢 ,自 2018 年的 42.7 億美元 ,升高至 343 億美元 ,增長已超過 7 倍,可見 AI 晶元市場有較大增長空間。


盡管與西方發達國家相比,中國的 AI 晶元研發還存在一定差距,但過去兩年中,中國 AI 晶元初創企業已獲得了數億美元的資金。華為等公司也開發了令人印象深刻的晶元設計。


但晶元開發極具復雜性,中國人才的短缺以及缺乏多家全球銷售排名前 15 位的中國半導體公司的情況表明,中國仍需要取得重大進展,才能在半導體領域與美國匹敵。

Ⅱ 英偉達新款Thor晶元發布 算力2000TOPS/極氪品牌2025年搭載

易車訊 日前,我們從相關渠道獲悉,英偉達新款智能汽車晶元THOR發布,算力高達2000TOPS。據悉,該SoC晶元內部擁有770億個晶體管,算力高達2000TOPS,或者是2000TFLOP,將於2024年量產,吉利旗下極氪品牌將於2025年搭載。



易車App提供銷量、熱度、點評、降價、新能源、實測、安全、零整比、保有量等榜單數據。如需更多數據,請到易車App查看。

Ⅲ 墨芯S30算力超英偉達H100奪第一!這款晶元還有哪些特點

相對來說這個芯度片確實相當好知,處理器也是衜挺出色的。其次,不單單是墨芯S30,還有華為的晶元也很不錯。

華為最新最強大的AI處置器升騰910,是現在為止全球運算最強悍的AI處置器,名字帶有中華古典文明氣味,就叫做升騰910。同時發布的另有,度全場場景AI計算框架MindSpore。

華為公司輪值董事長許直軍在發布會上表現:“升騰910”,MindSpore的非出,標記著華為已然完玉成棧場景AI,處理方案的構建,也標知志著華為AI計謀的,履行進入新的階段,依據了解,升騰910採取7nm+EUV工藝打造,內置華為32核自研達芬奇架構,其運算才能到達愛256tfops。

在會後的采訪中,徐直軍也表現升騰910隻是Ascend-Max系列的產品,Ascend系列AI晶元另有衜Mini, Lite, Tiny和Nano這四個系列。

華為輪值董事長許直軍還正在會上預告,華為全銜接大會 2019年將於9月18日在上舉辦,屆時,華為還會發布其他跟AI相乾的產品。

Ⅳ 墨芯S30算力超英偉達H100奪第一,是否實至名歸

單卡算力是世界佰第一,在所有度的晶元中都知是速度最快的,衜佔有相當大的度優勢。

從晶元開展過程來看,晶元的晶體管寬度度減少1nm,全部晶元的功能將提高知30%~60%,而且會極大的下降晶元的衜能耗,提高相應的晶元功能。從佰麒麟處置器來看,7nm工藝的麒度麟980比10nm工藝的麒麟970晶體管數目多了快要14億,真正能量產再來講,伯是真是假,沒提到功度耗,本錢,僅算力,知這騙外行的可以衟 AI 輸送除算力,功耗知電力本錢很重衟要,這類PPT 產品太多了。

Ⅳ 英偉達發布史上最強計算平台,黃教主:自動駕駛不再擔心算力問題

原本應該在今年 3 月份於加州聖何塞舉辦的英偉達 GTC 2020 大會,因為全球性新冠病毒肺炎的爆發而不得不推遲舉行。
比原計劃晚了將近 2 個月,英偉達 GTC 2020 終於在 5 月 14 日回歸。
不過這一次開發者們沒辦法在線下集會,只能通過線上直播觀看「皮衣教主」黃仁勛的主題演講。老黃此次是在他矽谷的家中完成了這場別開生面的「Kitchen Keynote」。
雖然是廚房舉行,英偉達依然爆出「核彈」,發布了全新一代的 GPU 架構 Ampere(安培)。
在自動駕駛方向上,英偉達通過兩塊 Orin SoC 和兩塊基於安培架構的 GPU 組合,實現了前所未有的?2000 TOPS?算力的 Robotaxi 計算平台,整體功耗為?800W。
有業界觀點認為,實現 L2 自動駕駛需要的計算力小於 10 TOPS,L3 需要的計算力為 30 - 60 TOPS,L4 需要的計算力大於 100 TOPS,L5 需要的計算力至少為 1000 TOPS。
現在的英偉達自動駕駛計算平台已經建立起了從?10TOPS/5W,200TOPS/45W?到?2000 TOPS/800W?的完整產品線,分別對應前視模塊、L2+ADAS?以及?Robotaxi?的各級應用。
從產品線看,英偉達?Drive AGX?將全面對標 Mobileye?EyeQ?系列,希望成為量產供應鏈中的關鍵廠商。
1、全新 GPU 架構:Ampere(安培)
2 個月的等待是值得的,本次 GTC 上,黃仁勛重磅發布了英偉達全新一代 GPU 架構 Ampere(安培)以及基於這一架構的首款 GPU NVIDIA A100。
A100 在整體性能上相比於前代基於 Volta 架構的產品有 20 倍的提升,這顆 GPU 將主要用於數據分析、專業計算以及圖形處理。
在安培架構之前,英偉達已經研發了多代 GPU 架構,它們都是以科學發展史上的偉人來命名的。
比如 Tesla(特斯拉)、Fermi(費米)、Kepler(開普勒)、Maxwell(麥克斯維爾)、Pascal(帕斯卡)、Volta(伏特)以及 Turing(圖靈)。
這些核心架構的升級正是推動英偉達各類 GPU 產品整體性能提升的關鍵。
針對基於安培架構的首款 GPU A100,黃仁勛細數了它的五大核心特點:
集成了超過 540 億個晶體管,是全球規模最大的 7nm 處理器;引入第三代張量運算指令 Tensor Core 核心,這一代 Tensor Core 更加靈活、速度更快,同時更易於使用;採用了結構化稀疏加速技術,性能得以大幅提升;支持單一 A100 GPU 被分割為多達 7 塊獨立的 GPU,而且每一塊 GPU 都有自己的資源,為不同規模的工作提供不同的計算力;集成了第三代 NVLink 技術,使 GPU 之間高速連接速度翻倍,多顆 A100 可組成一個巨型 GPU,性能可擴展。
這些優勢累加起來,最終讓 A100 相較於前代基於 Volta 架構的 GPU 在訓練性能上提升了?6 倍,在推理性能上提升了?7 倍。
最重要的是,A100 現在就可以向用戶供貨,採用的是台積電的 7nm 工藝製程生產。
阿里雲、網路雲、騰訊雲這些國內企業正在計劃提供基於 A100 GPU 的服務。
2、Orin+安培架構 GPU:實現 2000TOPS 算力
隨著英偉達全新 GPU 架構安培的推出,英偉達的自動駕駛平台(NVIDIA Drive)也迎來了一次性能的飛躍。
大家知道,英偉達此前已經推出了多代 Drive AGX 自動駕駛平台以及 SoC,包括?Drive AGX Xavier、Drive AGX Pegasus?以及?Drive AGX Orin。
其中,Drive AGX Xavier 平台包含了兩顆 Xavier SoC,算力可以達到 30TOPS,功耗為 30W。
最近上市的小鵬 P7 上就量產搭載了這一計算平台,用於實現一系列 L2 級自動輔助駕駛功能。
Drive AGX Pegasus 平台則包括了兩顆 Xavier SoC 和兩顆基於圖靈架構的 GPU,算力能做到 320TOPS,功耗為 500W。
目前有文遠知行這樣的自動駕駛公司在使用這一計算平台。
在 2019 年 12 月的 GTC 中國大會上,英偉達又發布了最新一代的自動駕駛計算 SoC Orin。
這顆晶元由 170 億個晶體管組成,集成了英偉達新一代 GPU 架構和 Arm Hercules CPU 內核以及全新深度學習和計算機視覺加速器,最高每秒可運行 200 萬億次計算。
相較於上一代 Xavier 的性能,提升了 7 倍。
如今,英偉達進一步將自動駕駛計算平台的算力往前推進,通過將兩顆 Orin SoC 和兩塊基於安培架構的 GPU 集成起來,達到驚人的 2000TOPS 算力。
相較於 Drive AGX Pegasus 的性能又提升了 6 倍多,相應地,其功耗為 800W。
按一顆 Orin SoC 200TOPS 算力來計算,一塊基於安培架構的 GPU 的算力達到了 800TOPS。
正因為高算力,這個平台能夠處理全自動駕駛計程車運行所需的更高解析度感測器輸入和更先進的自動駕駛深度神經網路。
對於高階自動駕駛技術的發展而言,英偉達正在依靠 Orin SoC 和安培 GPU 架構在計算平台方面引領整個行業。
當然,作為一個軟體定義的平台,英偉達 Drive AGX 具備很好的可擴展性。
特別是隨著安培 GPU 架構的推出,該平台已經可以實現從入門級 ADAS 解決方案到 L5 級自動駕駛計程車系統的全方位覆蓋。
比如英偉達的 Orin 處理器系列中,有一款低成本的產品可以提供 10TOPS 的算力,功耗僅為 5W,可用作車輛前視 ADAS 的計算平台。
換句話說,採用英偉達 Drive AGX 平台的開發者在單一平台上僅基於一種架構便能開發出適應不同細分市場的自動駕駛系統,省去了單獨開發多個子系統(ADAS、L2+ 等系統)的高昂成本。
不過,想採用 Orin 處理器的廠商還得等一段時間,因為這款晶元會從 2021 年開始提供樣品,到?2022 年下半年才會投入生產並開始供貨。
3、英偉達自動駕駛「朋友圈」再擴大
本屆 GTC 上,英偉達的自動駕駛「朋友圈」繼續擴大。
中國自動駕駛公司小馬智行(Pony.ai)、美國電動車創業公司?Canoo?和法拉第未來(Faraday Future)加入到英偉達的自動駕駛生態圈,將採用英偉達的 Drive AGX 計算平台以及相應的配套軟體。
小馬智行將會基於 Drive AGX Pegasus 計算平台打造全新一代 Robotaxi 車型。
此前,小馬智行已經拿到了豐田的 4 億美金投資,不知道其全新一代 Robotaxi 會不會基於豐田旗下車型打造。
美國的電動汽車初創公司 Canoo 推出了一款專門用於共享出行服務的電動迷你巴士,計劃在 2021 年下半年投入生產。
為了實現輔助駕駛的系列功能,這款車型會搭載英偉達 Drive AGX Xavier 計算平台。前不久,Canoo 還和現代汽車達成合作,要攜手開發電動汽車平台。
作為全球新造車圈內比較特殊存在的法拉第未來,這一次也加入到了英偉達的自動駕駛生態圈。
FF 首款量產車 FF91 上的自動駕駛系統將基於 Drive AGX Xavier 計算平台打造,全車搭載了多達 36 顆各類感測器。
法拉第未來官方稱 FF91 有望在今年年底開始交付,不知道屆時會不會再一次跳票。
作為 GPU 領域絕對霸主的英偉達,在高算力的數據中心 GPU 以及高性能、可擴展的自動駕駛計算平台的加持下,已經建起了一個完整的集數據收集、模型訓練、模擬測試、遠程式控制制和實車應用的軟體定義的自動駕駛平台,實現了端到端的完整閉環。
同時,其自動駕駛生態圈也在不斷擴大,包括汽車製造商、一級供應商、感測器供應商、Robotaxi 研發公司和軟體初創公司在內的數百家自動駕駛產業鏈上的企業已經在基於英偉達的計算硬體和配套軟體開發、測試和應用自動駕駛車輛。
未來,在整個自動駕駛產業里,以計算晶元為核心優勢,英偉達的觸角將更加深入,有機會成為產業鏈條上不可或缺的供應商。
本文來源於汽車之家車家號作者,不代表汽車之家的觀點立場。

Ⅵ 21tops算力相當於什麼顯卡

21tops算力相當於英偉達的JetsonXavierNX顯卡。JetsonXavierNX的大小僅相當於一張信用卡,可以為AI工作負載提供21TOPS的算力,而功耗最高僅為15瓦。

Ⅶ 老黃扔下車圈最強核彈!算力1000T,14倍於FSD,25家客戶排隊求芯-

車圈遭到核彈襲擊!

英偉達GTC,黃仁勛右手一個 史上最強車載計算平台 ,左手一顆 Orin自動駕駛晶元 投向車圈。

一個期貨,吊足車企胃口: Drive Hyperion 9平台最高算力1000TOPS ,而且是單顆晶元,超過特斯拉FSD14倍!

一個現貨,解決車企燃眉之急:車廠翹首以盼的 Orin晶元月內量產交付 。沒這個,自動駕駛演算法再高級也玩不轉。

老黃毫不客氣: 晶元就是自動駕駛大腦

言外之意:我的自動駕駛方案,車企可以無腦上車。

黃教主為什麼說晶元是自動駕駛的大腦?

其實這是他的一系列比喻,其他的還有「 汽車 是軀干」,以及「自動駕駛平台是神經」。

與華為「靈魂說」異曲同工。

而英偉達的扔向車圈的這顆核彈,是神經+大腦的雙料核武器。

整體產品層面, Drive Hyperion 9 是一個自動駕駛算力平台,既有執行計算任務的晶元,也有通信線路、數據介面、控制模塊。

有關自動駕駛的一切感知、分析、決策、執行任務,都能在這一塊板子上跑通。

稱Hyperion 9史上最強,因為它對於自動駕駛方案的支持力度前所未有得大。

整個平台最多可以接進 50個自動駕駛感知元件 。包括17個攝像頭、10個毫米波雷達、3個激光雷達以及20個超聲波雷達。

這樣的感測器配置,已經超過了任何一款智能 汽車 的現有方案。

官方也明確,Drive Hyperion 9是專門為L3以上自動駕駛方案打造。

搭載這個平台的車輛,可以實現L3級自動駕駛和L4級自主泊車功能。

從感測器配置來看,Drive Hyperion 9平台產生的數據量肯定巨大,尤其是現在車企普遍青睞800萬像素攝像頭的情況下。

怎麼辦?

這兩年很多上市的新車採用了簡單粗暴的方法:一個晶元算力不夠,那就兩個。有的甚至用了4顆英偉達Orin晶元堆到1000T算力。

不過,黃教主告訴你,Drive Hyperion 9,一顆晶元搞定所有。

這就是「神經」承載的自動駕駛大腦: Atlan晶元

Atlan在Orin晶元基礎上對整體晶元架構進行了大變革,把Grace-Next CPU、Ampere-Next GPU單元集成在一顆晶元。

另外並Atlan還首次集成Bluefield 數據處理單元(DPU),起到協助AI運算、加強自動駕駛能力的作用。

雖然英偉達還沒有公布各模塊具體的核心參數,但在算力方面, Atlan晶元的目標算力是1000TOPS ,而Orin晶元的算力水平是254TOPS,提升了3倍左右。

特斯拉自研的FSD晶元,則是14nm製程,最高算力73.7TOPS。

Atlan晶元去年GTC大會有過亮相,不過沒有像Orin晶元那樣搭配現成的自動駕駛方案,這次的Drive Hyperion 9平台,算是補齊了功課。

啥時候能上車?

老黃給出的時間表是:2023年試生產,交給車企測試。大規模量產上車,至少要在2025年以後了,2026年也有可能。

好嘛,給車企的餅,老黃都畫到4年以後了。

不過眼下黃教主還是照顧了車企的燃眉之急。

車企不要慌,老黃幫你忙。

疫情、突發事件輪番沖擊下,去年開始 汽車 產業供應鏈就沒讓人省心過。

尤其是晶元。

英偉達Orin晶元發布以來,一直有延期交付的擔憂。

不過老黃這次給吃了一顆定心丸:

Orin晶元是2019年英偉達發布、今年上市的一款自動駕駛專用晶元,採用了7nm的生產工藝,可實現最高254TOPS算力。

相比上一代Xavier系統級晶元運算性能提升了7倍。在運算性能提升巨大的情況下,Orin的功耗僅為45w。

2019年發布?好像聽著不厲害,但此時此刻,Orin的競爭對手MobilEye、華為,其產品算力還處在數十TOPS水平,與Orin參數相當的高通Ride,上市時間在2023年。

也就是說,Orin是車企目前能買到的性能最好的自動駕駛晶元,沒有之一。

所以,目前有大量車企翹首以盼等著Orin晶元量產上車。

包括蔚來的ET7、ET5,小鵬P5、P7、G9、理想L9、威馬M7、上汽智己、飛凡 汽車 等等。

而且,據說蔚來和小鵬跟英偉達簽了優先交付的協議,享受最快拿貨,但品控方面英偉達不承擔責任。

車企需求之迫切,可見一斑。

除了上面說過的車企,本次GTC上英偉達又宣布簽下了一個重量級合作夥伴:

比亞迪

2023年,比亞迪會開始量產搭載DRIVE Orin計算平台的 汽車 。

結合比亞迪透露的產品規劃,2023年量產的車型,很有可能是尚未露面的高端品牌。

此外,這次GTC大會上官宣的新合作夥伴,還有許多我們熟悉的名字:

從類型上看,英偉達的客戶有3種。

首先是造車新勢力,比如蔚小理、FF、Lucid Group…

然後是傳統車廠,包括比亞迪、賓士、沃爾沃、現代、大眾、上汽等等。

最後是自動駕駛公司,目前大部分自動駕駛研發都採用英偉達的晶元。

Cruise、Zoox、滴滴、圖森未來、智加 科技 、AutoX、小馬智行…

英偉達官方說法是已有超過25家客戶選擇了英偉達。這些合作夥伴將在未來6年內,為英偉達貢獻超過110億美元的營收。

盡管在英偉達每年近300億美元總營收中,自動駕駛所佔比例還很小,但增長潛力卻是巨大的。

畢竟 汽車 智能化浪潮剛開始,絕大部分 汽車 存量市場其實都是英偉達的潛在業務。

這也是為什麼每年GTC ,黃教主都會專門花時間來介紹自動駕駛業務,而在其他車企、自動駕駛發布會上,也能時常看到他標志性的皮衣出鏡。

英偉達門庭若市的景象,也反映出目前智能 汽車 對晶元需求有多麼旺盛。

而計算平台的性能、晶元算力,很有可能取代傳統 汽車 的動力參數,成為智能 汽車 最重要的評價指標之一。

好了,這就是英偉達GTC關於自動駕駛、智能 汽車 所有重要的信息。

而關於智能 汽車 晶元,其實遠不止英偉達、自動駕駛這么簡單,還有更多的細分門類和無數玩家摩拳擦掌。

Ⅷ 英偉達CPU問世:ARM架構,對比x86實現十倍性能提升

機器之心報道

機器之心編輯部

「只需一張 GeForce 顯卡,每個學生都可以擁有一台超級計算機,這正是 Alex Krizhevsky、Ilya 和 Hinton 當年訓練 AI 模型 AlexNet 的方式。通過搭載在超級計算機中的 GPU,我們現在能讓科學家們在 youxian 的一生之中追逐無盡的科學事業,」英偉達創始人兼首席執行官黃仁勛說道。

4 月 12 日晚,英偉達 GTC 2021 大會在線上開始了。或許是因為長期遠程辦公不用出門,人們驚訝地看到在自家廚房講 Keynote 的黃老闆居然留了一頭搖滾范的長發:

如果你只是對他的黑色皮衣印象深刻,先對比一下 2019、2020 和 2021 的 GTC,老黃氣質越來越搖滾。如此氣質,黃仁勛今天推出的新產品肯定將會與眾不同。

「這是世界第一款為 terabyte 級別計算設計的 CPU,」在 GTC 大會上,黃仁勛祭出了英偉達的首款中央處理器 Grace,其面向超大型 AI 模型的和高性能計算。

英偉達也要做 CPU 了

Grace 使用相對能耗較低的 Arm 核心,但它又可以為訓練超大 AI 模型的系統提供 10 倍左右的性能提升。英偉達表示,它是超過一萬名工程人員歷經幾年的研發成果,旨在滿足當前世界最先進應用程序的計算需求,其具備的計算性能和吞吐速率是以往任何架構所無法比擬的。

「結合 GPU 和 DPU,Grace 為我們提供了第三種基礎計算能力,並具備重新定義數據中心架構,推進 AI 前進的能力,」黃仁勛說道。

Grace 的名字來自於計算機科學家、世界最早一批的程序員,也是最早的女性程序員之一的格蕾絲 · 赫柏(Grace Hopper)。她創造了現代第一個編譯器 A-0 系統,以及第一個高級商用計算機程序語言「COBOL」。計算機術語「Debug」(調試)便是她在受到從電腦中驅除蛾子的啟發而開始使用的,於是她也被冠以「Debug 之母」的稱號。

英偉達的 Grace 晶元利用 Arm 架構的靈活性,是專為加速計算而設計的 CPU 和伺服器架構,可用於訓練具有超過 1 萬億參數的下一代深度學習預訓練模型。在與英偉達的 GPU 結合使用時,整套系統可以提供相比當今基於 x86 CPU 的最新 NVIDIA DGX 快 10 倍的性能。

目前英偉達自家的 DGX,使用的是 AMD 7 納米製程的 Rome 架構 CPU。

據介紹,Grace 採用了更為先進的 5nm 製程,在內部通信能力上,它使用了英偉達第四代 NVIDIA NVLink,在 CPU 和 GPU 之間提供高達 900 GB/s 的雙向帶寬,相比之前的產品提升了八倍。Grace 還是第一個通過錯誤校正代碼(ECC)等機制利用 LPDDR5x 內存系統提供伺服器級可靠性的 CPU,同時提供 2 倍的內存帶寬和高達 10 倍的能源效率。在架構上,它使用下一代 Arm Neoverse 內核,以高能效的設計提供高性能。

基於這款 CPU 和仍未發布的下一代 GPU,瑞士國家超級計算中心、蘇黎世聯邦理工大學將構建一台名為「阿爾卑斯」的超級計算機,算力 20Exaflops(目前全球第一超算「富岳」的算力約為 0.537Exaflops),將實現兩天訓練一次 GPT-3 模型的能力,比目前基於英偉達 GPU 打造的 Selene 超級計算機快 7 倍。

美國能源部下屬的洛斯阿拉莫斯國家實驗室也將在 2023 年推出一台基於 Grace 的超級計算機。

GPU+CPU+DPU,三管齊下

「簡單說來,目前市場上每年交付的 3000 萬台數據中心伺服器中,有 1/3 用於運行軟體定義的數據中心堆棧,其負載的增長速度遠遠快於摩爾定律。除非我們找到加速的辦法,否則用於運行應用的算力將會越來越少,」黃仁勛說道。「新時代的計算機需要新的晶元、新的系統架構、新的網路、新的軟體和工具。」

除了造 CPU 的大新聞以外,英偉達還在一個半小時的 Keynote 里陸續發布了大量重要軟硬體產品,覆蓋了 AI、 汽車 、機器人、5G、實時圖形、雲端協作和數據中心等領域的最新進展。英偉達的技術,為我們描繪出了一幅令人神往的未來願景。

黃仁勛表示,英偉達全新的數據中心路線圖已包括 CPU、GPU 和 DPU 三類晶元,而 Grace 和 BlueField 是其中必不可少的關鍵組成部分。投身 Arm 架構的 CPU,並不意味著英偉達會放棄原有的 x86、Power 等架構,黃仁勛將英偉達重新定義為「三晶元」公司,覆蓋 CPU、GPU 和 DPU。

對於未來的發展節奏,黃仁勛表示:「我們的發展將覆蓋三個產品線——CPU、GPU 和 DPU,以每兩年一次更新的節奏進行,第一年更新 x86,第二年就更新 Arm。」

最後是自動駕駛。「對於 汽車 而言,更高的算力意味著更加智能化,開發者們也能讓產品更快迭代。TOPS 就是新的馬力,」黃仁勛說道。

英偉達將於 2022 年投產的 NVIDIA 自動駕駛 汽車 計算系統級晶元——NVIDIA DRIVE Orin,旨在成為覆蓋自動駕駛和智能車機的 汽車 中央電腦。搭載 Orin 的量產車現在還沒法買到,但英偉達已經在為下一代,超過 L5 駕駛能力的計算系統作出計劃了。

Atlan 是這家公司為 汽車 行業設計的下一代 SoC,其將採用 Grace 下一代 CPU 和下一代安培架構 GPU,同時也集成數據處理單元 (DPU)。如此一來,Atlan 可以達到每秒超過 1000 萬億次(TOPS)運算次數。如果一切順利的話,2025 年新生產的車型將會搭載 Atlan 晶元。

與此同時,英偉達還展示了 Hyperion 8 自動駕駛 汽車 平台,業內算力最強的自動駕駛 汽車 模板——搭載了 3 套 Orin 中心計算機。

不知這些更強的晶元和系統,能否應付未來幾年裡人們對於算力無窮無盡的需求。在 GTC 2021 上,英偉達對於深度學習模型的指數增長圖又更新了。「三年間,大規模預訓練模型的參數量增加了 3000 倍。我們估計在 2023 年會出現 100 萬億參數的模型。」黃仁勛說道。

英偉達今天發布的一系列產品,讓這家公司在幾乎所有行業和領域都能為你提供最強大的機器學習算力。在黃仁勛的 Keynote 發表時,這家公司的股票一度突破了 600 美元大關。

「20 年前,這一切都只是科幻小說的情節;10 年前,它們只是夢想;今天,我們正在實現這些願景。

英偉達每年在 GTC 大會上發布的新產品,已經成為了行業發展的風向。不知在 Grace 推出之後,未來我們的伺服器和電腦是否會快速進入 Arm 時代。

Ⅸ 1000tops算力相當於什麼電腦

1000TOPS,指的就是英偉達下一代自動駕駛計算晶元 Atlan 的綜合算力。是明年量產的 Orin 254TOPS 算力的 4 倍左右,或者是目前小鵬 P7 使用的 Xavier 30TOPS 算力的 33 倍有餘。

和特斯拉 FSD Chip 單晶元 72TOPS 相比,英偉達 Atlan 的算力也是其接近 14 倍。

Ⅹ 替代A100,英偉達向中國市場推出性能閹割版A800,其性能如何

美國晶元製造企業英偉達,將在中國推出A800用於替代A100,原因是出口管制規定。A800相比A100性能上存在一定的差距,A800的數據傳輸速率為每秒400GB,而A100的數據傳輸速率為每秒600GB。

國內晶元的發展。國內的晶元技術雖然這幾年發展速度較快,包括華為海思,展訊等企業。但是存在發展瓶頸,我國的晶元核心技術嚴重缺失,再加上自主研發的成本巨大。我國的高端製造業是非常落後的,晶元的生產配套並不完善。

熱點內容
新華社最新的元宇宙新聞 發布:2024-11-18 09:19:29 瀏覽:564
以太坊幣圈信息預測 發布:2024-11-17 23:13:49 瀏覽:291
最新手機挖礦軟體下載 發布:2024-11-17 23:04:22 瀏覽:512
禁比特幣平台 發布:2024-11-17 22:31:16 瀏覽:286
區塊鏈pdf新浪博客 發布:2024-11-17 22:27:48 瀏覽:531
eth要轉成pos還要等6年 發布:2024-11-17 22:21:49 瀏覽:960
重啟linuxeth0 發布:2024-11-17 22:09:55 瀏覽:975
usdt的trc20是什麼 發布:2024-11-17 21:49:18 瀏覽:564
shib幣首發在哪個平台 發布:2024-11-17 21:28:28 瀏覽:664
比特幣工資演算法 發布:2024-11-17 21:19:48 瀏覽:836