阿里雲gpu的算力
❶ 阿里AI晶元「含光800」問世,性能相當10顆GPU
序言
雖然世界上AI晶元品種不少,但性能特別出眾的卻是寥寥無幾,中國阿里20來年發展史上自主研發的首款國產晶元「含光800」在實測現場以出色的表現脫穎而出。它與傳統的GPU比,具有 「以1當10」 的卓越優勢。這就是1顆「含光800」的性能堪比傳統的10顆GPU,具有突出的性價比。
1 何謂「含光」?
「含光」是上古三大神劍之一,即該劍含而不露,光而不閃。此喻「含光800」所具有的隱其形強其里的算力。含光800是一款雲端AI推理晶元,重點應用於視覺場景。就其性能,含光800刷新了現有AI晶元記錄,性能及能效堪比全球第一。
該AI架構由兩部分組成:硬建系統的核心是「晶元」,好比人的驅體,軟體的核心就是「操作系統」,好比軀體的靈魂;靈魂即所謂的智能(AI)。所以,大凡世界上所有的高 科技 產品概莫能外,均由硬體與軟體構成。
2 「含光800」的卓越表現
晶元被稱為工業之母,要想掌控世界的高 科技 ,首先必須擁有自己的晶元!含光800是阿里20來年發展史上自主研發的首款國產晶元。
含光800將通過阿里雲對外輸出AI算力。基於含光800的AI雲服務當前已正式上線,相比傳統GPU算力,性價比提升100%。
在業界標准ResNet-50測試中,含光800推理性能達到78563 IPS,比目前業界最好的AI晶元性能高出4倍;能效比是500 IPS/W參與測評第二名的3.3倍。
3 「含光800」的作用
在杭州城市大腦業務測試結果表明,1顆「含光800」的算力功能朝過目前10顆常規功能GPU。
在雲棲會現場演示其性能同樣出彩,比如城市大腦中的實時處理,對杭州主城區交通視頻,採用40顆傳統GPU,時延為300ms,而採用含「含光800」只需要4顆,其時延降至150ms。
在用於處理淘寶商品庫每天新增10億張商品圖片,使用傳統GPU算力識別需要至少1小時,而使用「含光800」後處理時間縮短至僅5分鍾。
❷ 阿里第一顆晶元問世,為何第一個AI晶元就登頂全球
含光一出,不服來干!
阿里將晶元命名為平頭哥,一種生活在非洲的蜜罐,號稱全球膽子最肥的動物。其性格“不服就干”也成了阿里晶元的代名詞。
含光是我國傳說中上古三大神劍之一,該劍含而不露,光而不耀,光聽名字就能想像到此劍強勁的威力。而含光就是平頭哥旗下的小弟,將來還會有更多晶元產品。含光800的出現,真正體現了平頭哥的特色:短、平、快。再加上上古神劍,天下無敵,聽這名字就相當的霸氣。
三、為企業輸出普惠算力,好東西讓更多企業使用。
阿里產品鐵三角:AI+晶元+雲計算,從技術和硬體都沒有問題,阿里是服務企業起家的,未來這些應用的目標還是廣大企業用戶。依靠阿里巴巴“讓天下沒有難做生意”的願景,將會打造全新的商業模式——平頭哥模式,為企業提供性價比更高的普惠算力,讓更多企業都能享受科技帶來的價值。
❸ 阿里雲架構師解讀四大主流游戲架構
游戲 行業是阿里雲最早聚焦的行業之一,近年來 游戲 行業的變化、雲計算產品技術的變化都與日俱進。隨著行業業務的變化、技術架構的演進以及阿里雲產品的迭代演進,整體的產品技術選型在不同的 游戲 場景、業務場景也不盡相同。本文將聚焦阿里雲彈性計算產品在 游戲 行業的方案實踐經驗。
當前, 游戲 行業的各種場景和行業發展密不可分。簡單回顧電子 游戲 的發展,80年代的黑白機,90年代的PC單機 游戲 ,00年代前夕隨著互聯網的發展網路 游戲 開始盛行,2010年後隨著移動設備的逐漸普及,手游在國內開始興起。
從 游戲 終端來區別,主要有:主機 游戲 (往往是3A 游戲 )、PC 游戲 、移動 游戲 和網頁 游戲 等。目前出現跨平台多端 游戲 ,以及雲 游戲 化的趨勢。
關於 游戲 的品類區別會有非常多的維度:RPG(角色扮演)、MOBA類、競技類、FPS(射擊類)、休閑類、卡牌類、棋牌類、SLG(策略類)等等。目前有多品類融合玩法裂變的趨勢。
隨著國內防沉迷、版號因素,近年來 游戲 行業誕生了越來越多的精品 游戲 ,出海全球化乃至區域化,以及整體存量用戶增速放緩,長線運營、精細運營以及私域社區等運營方式也在悄然變化。
不同的業務場景技術架構不盡相同,如競技類 游戲 和卡牌類 游戲 對計算的需求就有所區別,雲 游戲 與常規的網路 游戲 架構也有所區別。這里主要從 游戲 服和 游戲 平台、大數據、雲 游戲 這四個目前常見的場景簡單介紹其架構。
游戲 服,從 游戲 類型來看有RPG、FPS、MOBA、SLG、棋牌、休閑等等;從 游戲 平台來看通常有主機、手機、PC等;從業務發行來看有全球、國內、海外,從部署架構來看有集中部署和分區部署;從技術架構來看, 游戲 行業也有逐漸分層解耦的趨勢,但與互聯網應用相比,有一定其獨特性。
因為 游戲 的強交互性特點, 游戲 技術架構與其他互聯網應用相比有一定獨特性。 游戲 需要保持會話連接,也就是從一個客戶端到服務端的長連接,便於對客戶端中玩家的操作、行為等進行及時的反饋以及推送給共同 游戲 或對戰的其他玩家,所以 游戲 普遍對網路質量更加敏感,網路質量較差的情況會使長連接斷開或重連,引起玩家掉線。 游戲 也需要保持會話的狀態,既服務端會保持一份玩家的實體,當玩家進行操作時,下次通信的數據會依賴之前的通信的數據,這也是一些MMO(多人在線)大型 游戲 對網路吞吐性能要求較高的原因之一。再比如FPS、MOBA類等多人對戰類 游戲 ,交互性更強,對網路延遲容忍度更低,要求低延遲。因為 游戲 需要比較高密度的記錄玩家的操作以及結果,所以有頻繁寫入數據的特點,這類場景需要較強的IO性能。因為 游戲 強交互性、低延遲的特點,其技術架構也和互聯網應用不同,在逐漸分層解耦的同時,需要保證 游戲 玩家的交互效果,同時也會依賴到底層伺服器的計算能力。
這些都是 游戲 場景普遍存在的特點:長連接保持會話、保持狀態、低延遲網路、高IO吞吐、高計算性能。
游戲 的部署架構會結合 游戲 業務特點、 游戲 運營需求來制定 游戲 服務,有分區分服、全區全服業務邏輯,分區分服還是全區全服,最大的架構差異在於數據是不是一套。而從部署方式看,主要是集中式部署和分區域部署。
集中部署就是不論 游戲 玩家在哪裡, 游戲 服務集中在一個區域,適合對網路延遲要求通常不高的 游戲 類型,如休閑類;分區部署是指 游戲 伺服器根據 游戲 玩家地域分布,分區域部署,方便就近接入,適合對網路延遲要求較高的 游戲 類型,如MOBA、FPS類。
典型架構
MMO類有高並發特點,大量玩家並發的高計算量負載對伺服器的計算能力和穩定性有著極高的要求。同時MMO類 游戲 有著比較強的PVE或PVP特性,對網路延遲的容忍度較低。
其中網關伺服器負責所有網路數據包的轉發,通常是網路負載較集中的點,對於網路吞吐能力要求較高。單個 游戲 區承載玩家數量高,邏輯伺服器通常按照場景地圖來劃分,規模再大會通過分區的方式實現。
數據中心伺服器負責緩存玩家數據並非同步入庫,保障玩家客戶快速獲取和寫入數據,對於可用性要求較高,需要配合應用層實現數據容錯機制。
日誌伺服器承載了大區所有業務行為的日誌收集及處理的壓力,對磁碟寫入性能要求較高,通常採用多台分組方式實現。
(1)MMO 游戲 服性能與穩定需求,建議使用最第7代ECS實例,根據實際需求選型c計算型(CPU與內存配比1:2)/g通用型(1:4)/r內存型(1:8),Intel Ice Lake 2.9GHz基頻3.5GHz睿頻提供超高性能,能更好地優化 游戲 體驗。
(2)非同步落庫以及日誌伺服器,對於磁碟讀寫性能要求高的場景,建議雲上使用ESSD PL 0/1/2/3根據業務性能需要選擇,避免磁碟讀寫瓶頸。
(3)在 游戲 日常版本更新中,需要各個地域Region鏡像的快速復制,基於ESSD快照異地復制的能力,能夠提升鏡像復制效率。
(4)分區分服等場景往往需要快速地開服滾服合服,通過CADT雲速搭、ESS彈性伸縮、OOS運維編排、ROS資源編排等雲上運維工具搭配產品使用,能夠提升雲上運維效率。
ii. FPS、MOBA類 游戲 架構介紹
MOBA類 游戲 主要包括PVP系統、PVE系統、 游戲 平台等幾個主要部分,其中PVP戰斗是MOBA/FPS 游戲 的核心。
PVP、PVE、 游戲 平台功能部署於同一VPC中,構成 游戲 大區;戰斗伺服器(往往)單獨跨地域部署。
游戲 客戶端首先接入到登錄伺服器中,完成登錄認證、計費等 游戲 平台邏輯。為避免單點問題,所以 游戲 平台服務往往需要高可用方案。可利用雲上高可用方案,包括便捷的運維工具滿足業務高可用需求。
FPS/MOBA競技 游戲 ,往往對延遲特別敏感,可以想像,競技類 游戲 中對戰的 游戲 場景:玩家操控人物,在地圖里步伐飄逸,槍聲密集,每一顆子彈都是一次時間加上空間的矢量計算,而且需要在主進程中完成計算,那麼算力需求就隨著房間玩家數量上升而指數爆炸,5V5的房間和大房間100人(吃雞)對算力的需求完全不同。
游戲 這部分重算力場景,推薦阿里雲7代高主頻或七代實例,更高的單核性能提供更好的戰斗效果。
戰斗房間類 游戲 ,因為業務本身峰谷特性,靈活地使用雲上資源的彈性能力,往往會較好地優化整體的資源使用成本。阿里雲彈性計算本身提供了非常靈活的付費方式,包括常規的按量實例、包月包年實例、以及通過節省計劃/預留實例券去抵扣按量實例資源,兼顧資源靈活使用的同時達到更優的成本。
此外,為更進一步釋放開發運維的效率,當前一些 游戲 也採用了容器化技術架構,阿里雲的ACK+ECS/ECI彈性容器實例組合搭配使用,更進一步釋放了基礎資源的靈活性和彈性能力。
業務場景
游戲 平台(不限於FPS、MOBA類)主要提供的服務:官網、客服、注冊、登錄、充值、兌換、商城、推送、公告、社區、SDK及郵件、簡訊等公共服務;包括內容審核、視頻錄制、彈幕、轉碼、剪輯、RTC這些業務需要的基礎服務,以及運維監控、發布平台、測試平台這些運維等平台服務。
這部分更接近於通用的互聯網技術架構,以服務為顆粒度解耦,接入->網關->應用->資料庫。
技術特點
這往往通常需要構建高可用基礎架構來提升穩定性,業務突發期往往需要一定的彈性能力。相比於 游戲 服務這部分容器化就更加普及,也更容易通過雲上的比如彈性容器實例去應對流量峰值場景。在視頻錄制場景,對實時性要求較高時,往往會基於GPU能力構建,這部分阿里雲也提供了vGPU/cGPU能力,釋放GPU的靈活性。
大數據是當前 游戲 業務經營、 游戲 運營主要的技術手段,主要面向平台數據運營、 游戲 數據分析、廣告轉化分析、安全運營分析等 游戲 核心運營場景。不同的場景對實時性要求不同,實時查詢檢索通常是經營分析、客戶受理、玩家監測、在線等場景;離線報表通常是玩家行為分析、用戶畫像、特徵挖掘等場景。
總體而言,實時性業務更多是業務查詢類、簡單計算類任務,比如買量轉化的分析;離線類基本是分析類、預測類任務,比如 游戲 玩法分析。
從技術架構來看,得益於開源社區技術棧的高豐富度,大數據具體的技術選擇非常之多,整體從存算一體到存算分離,也誕生像數據倉庫、數據湖乃至湖倉一體等概念。
從數據架構流程來看,從數據源->數據採集、傳輸->數據計算、存儲->數據應用,其中可選看技術方案也需要因地制宜。
從部署架構來看,不同的 游戲 公司處在不同的數據建設階段,會有不同的選擇傾向,包括完全自建、基於雲自建大數據、基於雲上託管、以及利用更多雲上成熟的產品技術去豐富整體的大數據能力集,而後者也成為越來越多客戶的選擇。
拿雲上大數據方案舉例來講,比如實時計算部分,選擇SLS採集、Kafka數據網關通道,通過Flink做數據計算,通過ES或CK做數據分析,通過ADB以及QuickBI做數據應用展示。離線方案通過OSS做冷數據存儲,Spark、Hive、HDFS等組件做數據計算存儲,通過CK匯聚分析,通過Dataworks做數據應用。
具體計算存儲的產品選型,主要根據不同的業務特性以及大數據應用特性來區分,根據數據容量、IOPS、吞吐、讀寫特點以及性價比來選擇。
如剛剛舉例的實時計算/近實時計算場景,Flink具備高性能、低延遲特點,所以是計算密集、網路性能高場景,推薦選型七代ECS實例或6代增強實例;如HDFS需要超大存儲容量,高吞吐,推薦D系列本地盤實例,如D2S存儲型本地盤實例。Remote Shuffle Service等處理結果多的場景,讀寫處理頻繁如大量的join計算,需要綜合來看計算、網路、存儲性能以及綜合成本來選擇通用實例(如第7代ECS實例)或i系列本地盤實例。所以,最終在雲上的資源選型,在性能滿足的前期下,需要評估通過網路傳輸數據成本高(雲盤),還是就地取材計算成本高(本地盤),不同模型、不同量級選擇不同。
從內存處理(成本最高、性能最好、存儲容量最小)、SSD本地盤、HDD本地盤、ESSD雲盤、OSS對象存儲(成本最優、性能一般、存儲容量最大),逐漸分層解耦,還帶來一個好處:充分釋放了雲上彈性的能力,可以利用更輕巧的彈性計算產品(如SPOT搶占式實例方式,或ECI容器實例)進行大數據計算,達到更好的彈性能力去滿足業務需求的同時也能節約更多的成本。
雲 游戲 主要分終端和雲端。終端部分基於Windows、iOS、Linux等操作系統的終端設備包括手機、平板、電腦、電視機、VR一體機等。雲端架構主要是 游戲 應用層、雲 游戲 平台層、IaaS基礎資源層,應用層包括PC 游戲 、手游、VR 游戲 、H5 游戲 等多種類型的 游戲 應用;平台層雲 游戲 必須的運營平台、支撐平台、流化技術平台等;IaaS基礎資源層包括基礎網路、基於X86架構以及ARM架構的GPU伺服器。
雲 游戲 落地,在技術上也經歷了諸多挑戰,為滿足端到端高性能低時延,網路調度、指令串流、編解碼、多終端的SDK適配等等都是雲 游戲 場景中不可避免的技術問題。
對於雲端算力來講,阿里雲解決了雲端渲染、串流以及編解碼問題,並通過全系列GPU產品來滿足雲手游、端游、VR乃至企業級視覺渲染場景的需求。
總結來講,阿里雲彈性計算通過雲上的串流、編碼加速、渲染加速等全套的技術幫助 游戲 客戶給雲 游戲 玩家提供更好的性能體驗,通過基於阿里雲全球數據中心可以幫助雲 游戲 客戶覆蓋更多的用戶,通過GPU多種產品形態和整體的彈性能力,也幫助到 游戲 客戶去更快捷更靈活的構建其雲 游戲 業務。
阿里雲通過多年的技術積累和持續的運營,提供了大規模的基礎設施雲服務,目前在全球部署了26個地域、82個可用區,通過優異穩定的性能表現幫助 游戲 客戶高效穩定地運行 游戲 業務,為玩家提供極致順滑的 游戲 體驗,並通過技術手段不斷地幫助 游戲 客戶優化用雲成本。
國內的業務出海、 游戲 出海也是現階段大的趨勢之一,很多 游戲 公司已經把出海從業務可選項變成了必選項之一。在2022年3月,阿里雲上線了韓國和泰國兩大Region,能夠為本地化的 游戲 業務提供更流暢、更穩定的 游戲 體驗,以此希望能在 游戲 客戶出海的業務領域,提供更多的幫助。
當然,作為內容與 科技 兩大熱門領域的交叉領域, 游戲 產業日新月異,架構也隨著前端業務的需要不斷改變。阿里雲彈性計算也針對 游戲 廠商的不同架構,陸續推出了不同的雲伺服器類型和付費方式,以及雲上運維套件,以幫助客戶降本增效。
原文鏈接:http://click.aliyun.com/m/1000336551/
❹ 全球推理性能之王!阿里終於出手了 發布第一顆晶元!
在阿里內部的體系中,「平頭哥」並不是只是戰斗能力超群的動物代表,而是一家技術實力超強的半導體公司。
今日召開的雲棲大會上,「平頭哥」並沒有辜負大家的期待,帶來了阿里巴巴首款AI晶元——含光800。
據稱,這款AI晶元刷新了全球推理性能最高紀錄。有業內評論認為,平頭哥憑借晶元領域一系列產品,阿里有望在AIoT賽道上占盡優勢,搶先站上了萬億市場的風口。
那麼,這款全球最強AI晶元到底牛在哪裡?平頭哥的晶元版圖又會是怎樣的布局?
不妨和基金君一起來看一下。
平頭哥「亮劍」: 含光800來了!
從去年成立平頭哥半導體公司開始,外界對阿里巴巴在晶元方面的布局動作始終關注頗高。在今日的雲棲大會上,平頭哥果然交出了漂亮的答復。
9月25日,阿里巴巴旗下平頭哥半導體公司正式發布首款晶元——含光800。
為什麼要用「含光」命名?
含光為上古三大神劍之一,該劍含而不露,光而不耀。阿里巴巴用它來作為公司首款晶元的命名,體現了他們在這個領域的雄心與謙遜。
那麼,這款性能超強的AI晶元的能力值到底如何呢?
據阿里巴巴方面介紹,含光800雖然是阿里巴巴第一款晶元,但卻是全球性能最強的AI晶元。作為一款主要用於雲端視覺處理場景的晶元,含光800的性能打破了現有AI晶元記錄,在性能及能效比方面統領全球第一。
在業界標準的ResNet-50測試中,含光800推理性能達到78563 IPS,比目前業界最好的AI晶元性能高4倍;能效比500 IPS/W,是第二名的3.3倍。
據阿里巴巴方面的專家介紹,這款晶元能夠達成這樣的表現,得益於軟硬體的協同創新。
據悉,含光800採用自研架構,針對深度學習中使用的大量權重參數和張量數據,在支持稀疏壓縮與量化處理的基礎上,通過獨特設計的數據訪存與流水線處理技術,大大減低了I/O需求和數據的搬移;同時深度優化了卷積,矩陣乘,向量計算和各種激活函數,通過高有效的硬體資源調度和全並行的數據流處理,把AI運算的性能和能效雙雙推向極致。
「平頭哥突破了演算法和硬體之間的鴻溝,基於阿里巴巴豐富的場景和達摩院演算法能力,自研晶元架構,並且設計了完整軟體棧」,阿里巴巴專家強調。這樣的設計理念也讓整個晶元的效果立竿見影。
對於「平頭哥」的首款晶元,外界更驚艷在它超短的研發周期。據悉,平頭哥用最短的時間完成了晶元的設計、流片整個過程。其中7個月完成了前端設計,之後僅用了3個月就成功流片。
一般而言,晶元行業屬於投入大、周期長、突破慢的領域,但成立才剛剛滿一年的平頭哥半導體公司,卻在短時間內能夠這么快推出首款晶元,而且晶元一推出,就能夠在性能上達到世界尖端水平,只能說,阿里旗下平頭哥的實力,著實不能小覷。
晶元落地: 含光800實現大規模應用
很多AI晶元公司,推出研發晶元後往往沒有下文,這是因為他們尚屬於晶元打造和場景設計階段,而平頭哥帶出的「含光800」從誕生開始就能夠實現大規模的場景應用。
據了解,阿里經濟體擁有包括圖像視頻分析、搜索和推薦在內的豐富人工智慧應用場景,這都需要AI專用晶元提供算力。這也讓AI晶元誕生後就存在應用的場景。
在阿里巴巴內部體系中,含光800能夠實現多個場景:包括視頻圖像識別/分類/搜索、城市大腦等。在未來,這個晶元甚至還可被應用於醫療影像、自動駕駛等領域。
那麼,除了阿里內部之外,在實際的生活應用中,這顆晶元又能夠做什麼呢?
雲棲大會現場演示了該晶元在交通狀況識別及拍立得商品識別上的兩個具體應用。
1、交通狀況識別
以杭州城市大腦實時處理1000路視頻為例,過去使用GPU需要40塊,延時為300ms,單路視頻功耗2.8W;使用含光800僅需4塊,延時150ms,單路視頻功耗1W。
在杭州交通狀況識別的視頻中,含光可以在極短時間內對車的路況做出及時准確的識別,只需要用到以前1/10的硬體就可完成通用GPU能夠完成的任務。
2、拍立得商品識別
據了解,拍立淘商品庫每天新增10億商品圖片,為了讓用戶快速從海量圖片中精準搜索到商品,需要強大的計算力支撐,使用含光800搜索效率可提升12倍,時間從傳統通用GPU的1小時縮減至5分鍾。
此外,目前基於含光800的AI雲服務已正式上線。未來,含光800不僅服務阿里內部場景,還將全面通過雲服務開放。
阿里巴巴方面的專家表示,在人工智慧場景中,含光800是傳統異構計算很好地補充,通過阿里雲可以為企業提供更多的選擇,未來他們還會推出更多形態的人工智慧晶元,在終端、雲數據中心都會有更大規模的部署和應用。
阿里巴巴晶元版圖浮出水面
如果以為平頭哥推出一款性能超高的晶元就結束使命,那你就錯了!
過去,阿里巴巴集團一直強調「讓天下沒有難做的生意」,而在平頭哥這里,這一願景改為「讓天下沒有難造的晶元」。
得益於含光800的發布,阿里巴巴的端雲晶元布局基本成型。據悉,在端側,平頭哥已擁有成熟的生態體系,7款自研嵌入式CPU IP核均已得到大規模量產的驗證,授權客戶超100家,累計銷售超十億顆,廣泛應用於機器視覺、工業控制、車載終端、移動通信和信息安全等領域。
在雲端,阿里雲為平頭哥服務企業提供了絕佳平台,未來企業可以通過阿里雲輕松獲取含光800的極致算力。
此前,平頭哥就發布了面向AIoT時代的一站式晶元設計平台無劍,提供集晶元架構、基礎軟體、演算法與開發工具於一體的整體解決方案,能幫晶元設計企業將設計成本降低50%,周期壓縮50%。
平頭哥介紹稱,「在這個平台研發晶元的企業,只需專注於20%的專用設計工作量,並讓這20%的工作產生80%的價值」。
根據阿里巴巴在晶元上的定位,那就是端上做晶元基礎設施,雲端為企業提供普惠算力。例如,處理器是所有高端系統晶元都需要的產品,它是最核心的基礎設施產品,AI晶元是人工智慧場景最高效的算力單元,阿里將投入重金打造好這些技術,同時構建應用生態。
「晶元、AI和雲計算三位一體、協同發展——人工智慧演算法逐漸集成到晶元,集成演算法的專用晶元為雲服務提供了更強的性能,而雲計算本身則加速了人工智慧應用的大規模落地。」阿里巴巴相關專家表示。
阿里巴巴集團副總裁戚肖寧表示:「傳統通用晶元的模式越來越難適應碎片化AIoT場景的需求,開源、開放是大勢所趨,平頭哥致力於做AIoT時代的晶元基礎設施提供者,讓晶元更普惠。」
平頭哥到底是誰?
如此硬核的技術能力,果然已經讓眾人見識到了平頭哥的不凡。
不過話說回來,平頭哥和阿里到底是有怎樣的淵源?為什麼一家高科技公司有這么「社會」的代稱?
2018年雲棲大會上,阿里巴巴宣布整合中天微與達摩院晶元團隊,成立「平頭哥」半導體公司。
據了解,「平頭哥」由阿里此前收購的晶元公司——中天微系統有限公司,以及達摩院的自研晶元業務整合而來,阿里巴巴董事局主席馬雲親自將其命名為「平頭哥半導體有限公司」,旨在推進雲端一體化的晶元布局。
而這位「平頭哥」,實際上是來自非洲大草原一種動物,叫做非洲蜜獾,頭頂一片白毛,宛如被剃了平頭,外表看起來殺傷力像個青銅,實際上是個王者。
在動物世界中,平頭哥幾乎是擁有最強大的好戰基因,雖然體態小巧,卻不畏比之龐大十數倍的猛獸毒蟲,驍勇善戰,常常能夠以小博大,成功反制。平頭哥強大的殺傷力,已經被網友票選為「實力票選為」除了人類以外,基本沒有天敵的動物。
阿里將平頭哥命名為旗下半導體公司,頗有深意,諸如江湖的說法,「生死看淡,不服就干」,這種大膽的動物也和阿里巴巴始終秉持的「不服輸、不怕折騰」的精神一脈相承。而在晶元開發領域,人們正需要像平頭哥這樣不畏艱難、不畏辛苦、敢於挑戰的人才投入進去。
2019年7月25日,平頭哥成立後發布了第一個成果,基於RISC-V的處理器IP核玄鐵910。據介紹,玄鐵的性能比公開的RISC-V最好處理器還要提升40%,主頻功耗僅為0.2瓦。
阿里巴巴集團副總裁戚肖寧表示,其可用於設計製造高性能端上晶元,應用於5G、人工智慧以及自動駕駛等領域。使用該處理器可使晶元性能提高一倍以上,同時晶元成本降低一半以上。
也有通俗的解釋稱,玄鐵910不是英特爾一樣完全整合的CPU,而是ARM類似的CPU IP形態,華為麒麟需要用,高通驍龍需要用,三星蘋果的手機晶元也離不開。
從處理器到AI晶元,阿里的平頭哥公司憑借一系列產品切入晶元領域,而且一做就做到了極致,這也讓很多人看到了中國在晶元產業未來的希望。
對於平頭哥想打造的晶元生態,我們可以用平台思維去理解:平頭哥先解決晶元技術比較難的部分,然後用演算法和集成的方法,讓更多的企業參與到其中,根據自己所需要的應用和場景進行開發,打造起平台生態。
據悉,平頭哥還將將成立晶元開放社區,進一步為晶元產業提供開放協作的平台;公司還將繼續開發操作系統,軟硬體融合的演算法,核心的IP等。把這些共性的技術能夠做好做精做出競爭力,並形成生態,然後開放給其合作夥伴,讓他們基於高質量的基礎設施打造晶元產品,有助於提升整體的產業競爭力。
阿里巴巴集團CTO、達摩院院長張建鋒說:「在全球晶元領域,阿里巴巴是一個新人,玄鐵和含光800是平頭哥的萬里長征第一步,我們還有很長的路要走。」
(文章來源:中國基金報)
❺ 小鵬汽車與阿里雲聯合建成自動駕駛智算中心
小鵬汽車與阿里雲聯合建成自動駕駛智算中心
小鵬汽車與阿里雲聯合建成自動駕駛智算中心,該智算中心由小鵬汽車與阿里雲在烏蘭察布合建,算力可達600PFLOPS(每秒浮點運算60億億次),小鵬汽車與阿里雲聯合建成自動駕駛智算中心。
小鵬汽車與阿里雲聯合建成自動駕駛智算中心1
8 月 2 日,小鵬汽車與阿里雲共同宣布在內蒙古烏蘭察布建成中國最大的自動駕駛智算中心 " 扶搖 ",用於自動駕駛模型訓練。
" 扶搖 " 基於阿里雲智能計算平台,算力可達 600PFLOPS(每秒浮點運算 60 億億次),將小鵬汽車自動駕駛核心模型的訓練速度提升了近 170 倍,並且未來還具備 10~100 倍的算力提升空間。雙方表示,模型訓練速度的大幅提升,將有力推動自動駕駛技術的發展,讓汽車的智能化程度和安全性都邁入新的階段。
同時," 扶搖 " 結合烏蘭察布當地天然的氣候優勢,採用風冷、AI 調溫、模塊化設計等綠色技術,可實現全年超過 80% 時間全新風運行,年平均 PUE(PUE 指數據中心能耗電力電源使用效率,越接近 1,表明數據中心對電能的利用效率越高,越綠色)小於 1.2。目前," 扶搖 " 正用於小鵬城市 NGP 智能導航輔助駕駛的演算法模型訓練。
憑借地理位置帶來的能源、氣候等區位優勢,烏蘭察布是中國數據中心產業聯盟評選為最適合發展數據中心的地區,也是全國一體化算力網路樞紐節點之一。目前有華為、阿里、蘋果等 26 個數據中心項目落地在此,總計有 419 萬台伺服器。
整體來看,今年 1-7 月,小鵬汽車累計交付超過 8 萬台,為去年同期的 2.1 倍。自交付以來,小鵬汽車歷史累計交付量已接近 22 萬台。
此外,小鵬汽車首款面向全球的智能旗艦 SUV小鵬 G9 將於 8 月開放預訂,並於 9 月正式上市。
小鵬汽車與阿里雲聯合建成自動駕駛智算中心2
8月2日,「東數西算」內蒙古樞紐節點中國最大的自動駕駛智算中心建成。該智算中心由小鵬汽車與阿里雲在烏蘭察布合建,算力可達600PFLOPS(每秒浮點運算60億億次),用於小鵬汽車的自動駕駛模型訓練。「草原雲谷」烏蘭察布也迎來首座智算中心。
「東數西算」工程是實現算力規模化、集約化和綠色化的全國一體化布局。西部地區通過承接東部算力需求,像「南水北調」「西電東送」一樣優化算力資源配置,提升算力資源使用效率。
位於內蒙古的.烏蘭察布就在八大國家算力樞紐節點上。依託獨特的區位優勢和氣候優勢,包括阿里巴巴、蘋果在內的12大數據中心已落戶烏蘭察布。這里也因此被稱為「草原雲谷」。
隨著人工智慧應用的井噴式發展,專用於智能計算的智算成為發展最快的一種算力形式。智算因其「專用性」,在面向AI場景時性能和能耗更優。據工信部統計,目前我國已建和在建的智算中心有20餘座,遍布甘肅、京津冀、長三角、粵港澳大灣區、成渝等國家算力樞紐。
為響應國家「東數西算」戰略,小鵬汽車與阿里雲選擇在烏蘭察布建設智算中心「扶搖」,算力規模達600PFLOPS,可將自動駕駛模型訓練提速近170倍。模型訓練速度的大幅提升,將有力推動自動駕駛技術的發展,讓汽車的智能化程度和安全性都邁入新的階段。
同時,「扶搖」也是更綠色低碳的智算中心,結合烏蘭察布當地天然的氣候優勢,採用風冷、AI調溫、模塊化設計等綠色技術,可實現全年超過80%時間全新風運行,年平均PUE小於1.2。
小鵬汽車與阿里雲聯合建成自動駕駛智算中心3
8月2日,小鵬汽車宣布在烏蘭察布建成中國最大的自動駕駛智算中心「扶搖」,用於自動駕駛模型訓練。「扶搖」基於阿里雲智能計算平台,算力可達600PFLOPS(每秒浮點運算60億億次),將小鵬自動駕駛核心模型的訓練速度提升了近170倍。
小鵬汽車董事長、CEO何小鵬表示,「隨著自動駕駛模擬訓練的需求變化,我們需要一個強大的本地+雲端的算力來支持。我非常有信心和阿里雲在一起合作,我們能夠更快更強去實現自動駕駛的研發。小鵬汽車期待,與阿里雲一起攜手共進,共創未來出行時代的美好明天。」
數據驅動是自動駕駛發展的公認方向,也讓自動駕駛模型訓練成為一頭「吃算力」的巨獸。自動駕駛的視覺檢測、軌跡預測與行車規劃等演算法模型,有賴於機器學習海量數據集,但算力的不足讓研發速度仍遠遠趕不上數據量增長的速度。隨著感測器的進一步增加,算力的挑戰越來越大。
近年來,專用於機器學習的AI智算成為發展最快的一種算力形式。包括谷歌、微軟、Meta、阿里巴巴在內的頂尖科技公司都紛紛建造了智算中心。
自動駕駛演算法模型訓練是機器學習的典型場景之一。在烏蘭察布,小鵬汽車建造了一個算力規模達600PFLOPS的自動駕駛專用智算中心「扶搖」,來進一步提高模型訓練的效率。
通過與阿里雲合作,「扶搖」以更低成本實現了更強算力。首先,對GPU資源進行細粒度切分、調度,將GPU資源虛擬化利用率提高3倍,支持更多人同時在線開發,效率提升十倍以上。在通訊層面,端對端通信延遲降低80%至2微秒。整體計算效率上,實現了算力的線性擴展。
存儲吞吐比業界20GB/s的普遍水準提升了40倍,數據傳輸能力相當於從送快遞的微型麵包車,換成了20多米長的40噸集裝箱重卡。此外,阿里雲機器學平台PAI提供了模型訓練部署、推理優化等AI工程化工具,比開源框架訓練性能提升30%以上。
「扶搖」支持小鵬自動駕駛核心模型的訓練時長從7天,縮短至1小時內,大幅提速近170倍。目前,「扶搖」正用於小鵬城市NGP輔助駕駛系統的演算法模型訓練。和高速道路相比,城市路段的交通狀況更為復雜,自動駕駛特殊場景(corner case)的數據集規模增加了上百倍。
❻ 阿里第一顆自研晶元正式問世,為何被譽為全球最強AI
9月25日,在2019雲棲大會上,阿里巴巴集團首席技術官、阿里雲智能總裁張建鋒宣布,平頭哥發布全球最高性能AI推理晶元含光800。含光800是阿里巴巴第一顆自研晶元,其稱是全球性能最強的AI晶元,主要用於雲端視覺處理場景。