晶元演算法算力
『壹』 最高280 TOPS算力,黑芝麻科技發布華山二號,PK特斯拉FSD
晶元作為智能汽車的核心「大腦」,成為諸多車企、Tier 1、自動駕駛企業重點布局的領域。
圍繞著自動駕駛最為關鍵的計算單元,國內誕生了諸多自動駕駛晶元創新公司,在該領域的絕大部分市場份額依然被國外廠商控制的當下,他們正在爭取成為「國產自動駕駛晶元之光」。
成立於 2016 年的黑芝麻智能科技便是這一名號的有力爭奪者。
繼 2019 年 8 月底發布旗下首款車規級自動駕駛晶元華山一號(HS-1)A500 後,黑芝麻又在這個 6 月推出了相較於前代在性能上實現躍遷的全新系列產品——華山二號(HS-2),兩個系列產品的推出相隔僅 300 余天,整體研發效率可見一斑。
1、國產算力最高自動駕駛晶元的自我修養
華山二號系列自動駕駛晶元目前有兩個型號的產品,包括:
應用於?L3/L4?級自動駕駛的華山二號 A1000?;針對?ADAS/L2.5?自動駕駛的華山二號 A1000L。
簡單理解就是,A1000 是高性能版本,而 A1000L 則在性能上進行了裁剪。
這樣的產品型號設置也讓華山二號系列晶元能在不同的自動駕駛應用場景中進行集成。
相較於 A500 晶元,A1000?在算力上提升了近?8 倍,達到了?40 - 70TOPS,相應的功耗為?8W,能效比超過?6TOPS/W,這個數據指標目前在全球處於領先地位。
華山二號 A1000 之所以能有如此出色的能效表現,很大程度是因為這塊晶元是基於黑芝麻自研的多層異構性的?TOA 架構打造的。
這個架構將黑芝麻核心的圖像感測技術、圖像視頻壓縮編碼技術、計算機視覺處理技術以及深度學習技術有機地結合在了一起。
此外,這款晶元中內置的黑芝麻自研的高性能圖像處理核心?NeuralIQ ISP?以及神經網路加速引擎?DynamAI DL?也為其能效躍升提供了諸多助力。
需要注意的是,這里的算力數值之所以是浮動的,是因為計算方式的不同。
如果只計算 A1000 的卷積陣列算力,A1000 大致是 40TOPS,如果加上晶元上的 CPU 和 GPU 的算力,其總算力將達到?70TOPS。
在其他參數和特性方面,A1000 內置了 8 顆 CPU 核心,包含 DSP 數字信號處理和硬體加速器,支持市面上主流的自動駕駛感測器接入,包括激光雷達、毫米波雷達、4K 攝像頭、GPS 等等。
另外,為了滿足車路協同、車雲協同的要求,這款晶元不僅集成了 PCIE 高速介面,還有車規級千兆乙太網介面。
A1000 從設計開始就朝著車規級的目標邁進,它符合晶元 AEC-Q100 可靠性和耐久性 Grade 2 標准,晶元整體達到了 ISO 26262 功能安全 ASIL-B 級別,晶元內部還有滿足 ASIL-D 級別的安全島,整個晶元系統的功能安全等級為?ASIL-D。
從這些特性來看,A1000 是一款非常標準的車規級晶元,完全可以滿足在車載終端各種環境的使用要求。
A1000 晶元已於今年 4 月完成流片,採用的是台積電的 16nm FinFET 製程工藝。
今年 6 月,黑芝麻的研發團隊已經對這款晶元的所有模塊進行了性能測試,完全調試通過,接下來就是與客戶進行聯合測試,為最後的大規模量產做准備。
據悉,搭載這款晶元的首款車型將在?2021 年底量產。
隨著 A1000 和 A1000L 的推出,黑芝麻的自動駕駛晶元產品路線圖也更加清晰。
在華山二號之後,這家公司計劃在 2021 年的某個時點推出華山三號,主要面向的是 L4/L5 級自動駕駛平台,晶元算力將超越 200TOPS,同時會採用更先進的 7nm 製程工藝。
華山三號的?200TOPS?算力,將追平英偉達 Orin 晶元的算力。
去年 8 月和華山一號 A500 晶元一同發布的,還有黑芝麻自研的 FAD(Full Autonomous Driving)自動駕駛計算平台。
這個平台演化至今,在 A1000 和 A1000L 晶元的基礎上,有了更強的可擴展性,也有了更廣泛的應用場景。
針對低級別的 ADAS 場景,客戶可以基於 HS-2 A1000L 晶元搭建一個算力為 16TOPS、功耗為 5W 的計算平台。
而針對高級別的 L4 自動駕駛,客戶可以將 4 塊 HS-2 A1000 晶元並聯起來,實現高達 280TOPS 算力的計算平台。
當然,根據不同客戶需求,這些晶元的組合方式是可變換的。
與其他大多數自動駕駛晶元廠商一樣,黑芝麻也在可擴展、靈活變換的計算平台層面投入了更多研發精力,為的是更大程度上去滿足客戶對計算平台的需求。
反過來,這樣的做法也讓黑芝麻這樣的晶元廠商有了接觸更多潛在客戶的機會。
根據黑芝麻智能科技的規劃,今年 7 月將向客戶提供基於 A1000 的核心開發板。
到今年 9 月,他們還將推出應用於 L3 自動駕駛的域控制器(DCU),其中集成了兩顆 A1000 晶元,算力可達 140TOPS。
2、黑芝麻自動駕駛晶元產品「聖經」
借著華山二號系列晶元的發布,黑芝麻智能科技創始人兼 CEO 單記章也闡述了公司 2020 年的「AI 三次方」產品發展戰略,具體包括「看得懂、看得清和看得遠」。
這一戰略是基於目前市面上對自動駕駛域控制器和計算平台的諸多要求提出的,這些要求包括安全性、可靠性、易用性、開放性、可升級以及延續性等。
其中,看得懂直接指向的是?AI 技術能力,要求黑芝麻的晶元產品能夠理解外界所有的信息,可以進行判斷和決策。
而看得懂的基礎是看得清,這指的是黑芝麻晶元產品的圖像處理能力,需要具備准確接收外界信息的能力。
這里尤其以攝像頭感測器為代表,其信息量最大、數據量也最多,當然感測器融合也不可或缺。
看得遠則指的是車輛不僅要感知周邊環境,還要了解更大范圍的環境信息,這就涉及到了車路協同、車雲協同這樣的互聯技術,所以我們看到黑芝麻的晶元產品非常注重對互聯技術的支持。
作為一家自動駕駛晶元研發商,這一戰略將成為黑芝麻後續晶元產品研發的「聖經」。
3、定位 Tier 2,綁定 Tier 1,服務 OEM
現階段,發展智能汽車已經成為了國家意志,在政策如此支持的情況下,智能汽車的市場爆發期指日可待。
根據艾瑞咨詢的報告數據顯示,到 2025 年全球將會有 6662 萬輛智能汽車的存量,中國市場的智能汽車保守預計在 1600 萬輛左右。
如此規模龐大的智能汽車增量市場,將為那些打造智能汽車「大腦」的晶元供應商培育出無限的產品落地機會。
作為其中一員,黑芝麻智能科技也將融入到這股潮流之中,很有機會成長為潮流的引領者。
作為一家自動駕駛晶元研發商,黑芝麻智能科技將自己定位為?Tier 2,未來將綁定 Tier 1 合作夥伴,進而為車企提供產品和服務。
當然,黑芝麻不僅能提供車載晶元,未來還將為客戶提供自動駕駛感測器和演算法的解決方案,還有工具鏈、操作平台等產品。
憑借著此前發布的華山一號 A500 晶元,黑芝麻智能科技已經與中國一汽和中科創達兩家達成了深入的合作夥伴關系,將在自動駕駛晶元、視覺感知演算法等領域展開了諸多項目合作。
另外,全球頂級供應商博世也與黑芝麻建立起了戰略合作關系。
目前,黑芝麻的華山一號 A500 晶元已經開啟了量產,其與國內頭部車企關於 L2+ 和 L3 級別自動駕駛的項目也正在展開。
如此快速的落地進程,未來可期。
有意思的是,黑芝麻此番發布華山二號系列晶元,包括中國一汽集團的副總經理王國強、上汽集團總工程師祖似傑、蔚來汽車 CEO 李斌以及博世中國區總裁陳玉東在內的多位行業大佬都為其雲站台。
這背後意味著什麼?給我們留下了很大的想像空間。
本文來源於汽車之家車家號作者,不代表汽車之家的觀點立場。
『貳』 簡述cpu、gpu、fpga和asic四種人工智慧晶元的性能
FPGA(Field Programmable Gate Array,現場可編程門陣列)具有足夠的計算能力和足夠的靈活性。FPGA的計算速度快是源於它本質上是無指令、無需共享內存的體系結構。對於保存狀態的需求,FPGA中的寄存器和片上內存(BRAM)是屬於各自的控制邏輯的,無需不必要的仲裁和緩存,因此FPGA在運算速度足夠快,優於GPU。同時FPGA也是一種半定製的硬體,通過編程可定義其中的單元配置和鏈接架構進行計算,因此具有較強的靈活性。相對於GPU,FPGA能管理能運算,但是相對開發周期長,復雜演算法開發難度大。
ASIC(Application Specific Integrated Circuit特定用途集成電路)根據產品的需求進行特定設計和製造的集成電路,能夠在特定功能上進行強化,具有更高的處理速度和更低的能耗。缺點是研發成本高,前期研發投入周期長,且由於是定製化,可復制性一般,因此只有用量足夠大時才能夠分攤前期投入,降低成本。
CPU:
中央處理器作為計算機系統的運算和控制核心,是信息處理、程序運行的最終執行單元,CPU 是對計算機的所有硬體資源(如存儲器、輸入輸出單元) 進行控制調配、執行通用運算的核心硬體單元。
優點:CPU有大量的緩存和復雜的邏輯控制單元,非常擅長邏輯控制、串列的運算
缺點:不擅長復雜演算法運算和處理並行重復的操作。
對於AI晶元來說,算力最弱的是cpu。雖然cpu主頻最高,但是單顆也就8核,16核的樣子,一個核3.5g,16核也就56g,再考慮指令周期,每秒最多也就30g次乘法。還是定點的。
生產廠商:intel、AMD
現在設計師最需要的就是GPUCPU,呆貓桌面雲可以享受高GPUCPU的待遇。
GPU:
圖形處理器,又稱顯示核心、視覺處理器、顯示晶元,是一種專門在個人電腦、工作站、游戲機和一些移動設備(如平板電腦、智能手機等)上做圖像和圖形相關運算工作的微處理器。
優點:提供了多核並行計算的基礎結構,且核心數非常多,可以支撐大量數據的並行計算,擁有更高的浮點運算能力。
缺點:管理控制能力(最弱),功耗(最高)。
生產廠商:AMD、NVIDIA
『叄』 給人工智慧提供算力的晶元有哪些類型
給人工智慧提供算力的晶元類型有gpu、fpga和ASIC等。
GPU,是一種專門在個人電腦、工作站、游戲機和一些移動設備(如平板電腦、智能手機等)上圖像運算工作的微處理器,與CU類似,只不過GPU是專為執行復雜的數學和幾何計算而設計的,這些計算是圖形渲染所必需的。
FPGA能完成任何數字器件的功能的晶元,甚至是高性能CPU都可以用FPGA來實現。 Intel在2015年以161億美元收購了FPGA龍 Alter頭,其目的之一也是看中FPGA的專用計算能力在未來人工智慧領域的發展。
ASIC是指應特定用戶要求或特定電子系統的需要而設計、製造的集成電路。嚴格意義上來講,ASIC是一種專用晶元,與傳統的通用晶元有一定的差異。是為了某種特定的需求而專門定製的晶元。谷歌最近曝光的專用於人工智慧深度學習計算的TPU其實也是一款ASIC。
(3)晶元演算法算力擴展閱讀:
晶元又叫集成電路,按照功能不同可分為很多種,有負責電源電壓輸出控制的,有負責音頻視頻處理的,還有負責復雜運算處理的。演算法必須藉助晶元才能夠運行,而由於各個晶元在不同場景的計算能力不同,演算法的處理速度、能耗也就不同在人工智慧市場高速發展的今天,人們都在尋找更能讓深度學習演算法更快速、更低能耗執行的晶元。
『肆』 零跑汽車發布自動駕駛晶元:算力4.2TOPS 支持L3級自動駕駛
國家發改委產業發展司機械裝備處處長吳衛
未來,中國製造的汽車將是全球新技術融合最多、創新融合最多的,也必將領跑全球汽車工業。
同時,汽車晶元領域的競爭也異常激烈。相比於消費電子產品的晶元,汽車晶元對安全性、穩定性的要求更高,是晶元行業共同面對的難題,這也是中國晶元公司的機會。
結語:自研技術讓零跑更具競爭力
零跑汽車是中國造車新勢力企業中第一個自主研發汽車自動駕駛晶元的,搭載這款晶元的量產車零跑C11下月就將發布。零跑汽車在自動駕駛領域的飛速進步,也得到了用戶的認可。
統計數據顯示,零跑汽車兩款量產車型從今年7月以來銷量逐步攀升,9月銷量破千,10月銷量有望突破1600輛,大量的自研技術讓零跑這一造車新勢力具備了更強的競爭力。
本文來源於汽車之家車家號作者,不代表汽車之家的觀點立場。
『伍』 晶元算力tops是什麼意思
TOPS,處理器運算能力單位。TOPS是Tera Operations Per Second的縮寫,1TOPS代表處理器每秒鍾可進行一萬億次(10^12)操作。
『陸』 PoC挖礦中的算力是什麼意思
PoC的本質,用一個普通人也可以理解的話說,就是用硬碟挖礦。沒錯,PoW是用CPU(或者顯卡、ASIC礦機,他們的本質都是更強的計算晶元,與CPU本質上是一樣的)挖礦、PoS是憑借持幣比例挖礦,DPoS是根據投票決定超級節點,而PoC就是憑借硬碟挖礦。
我們可以這么理解:
-在PoW里是誰的晶元計算快、誰就容易挖到礦;
-在PoS里是誰持幣多,誰就容易挖到礦;
-在DPoS里是誰獲得的投票多,誰就能成為超級節點進行挖礦;
-在PoC里就是誰的硬碟容量大,誰就容易挖到礦。
是不是足夠簡單易懂了吧!
要理解PoC的具體原理,我們還是得從比特幣PoW入手(研究區塊鏈,PoW就是你永遠也繞不過去的技術概念)。
PoW的全稱是Proof of Work,即工作量證明。這兒所謂的工作量,就是礦工的CPU(或者顯卡、ASIC晶元,我們前面已經說過,這些硬體只是計算速度更快,本質和CPU並無區別)執行一種叫做哈希演算法的計算工作。簡而言之,誰能夠在單位時間內執行更多次的哈希計算,誰就有更大幾率產生一個符合要求的哈希結果、進而拿到寫入區塊鏈的權利。
可以這么說,比特幣PoW的本質就是算力競爭挖礦。每一個新區塊的產生,就是給礦工出一道「難題」,礦工通過算力競爭,比拼誰能夠先找到符合要求的「答案」。礦工通過購買牛逼的計算晶元,以及持續地消耗電能進行高頻率高強度的哈希計算,去獲得更強的算力佔比,進而獲得更大的找到 「答案」的概率。如果一個比特幣礦工擁有全網20%的算力,理論上他就可以挖出20%的新區塊、進而獲得20%的區塊獎勵(最早每個塊有50個比特幣獎勵,現在已經減少到12.5個,明年還會繼續減半)。
PoW挖礦規則簡單粗暴、算力可以自由進出,因此能建立足夠的安全性,來保證區塊鏈不被篡改的特性。這就是為什麼比特幣雖然技術看似簡單,但是能夠成為幣王之王,占據一半左右的市值。
此外,比特幣的分叉幣(例如BCH和BSV)、萊特幣LTC、以太坊ETH、門羅幣Monero、達世幣Dash也都是全部或部分採用了PoW機制挖礦的幣種,只不過這些幣種可能在一些技術參數上與比特幣有區別,但總體思想是類似的。
我們今天的主角PoC,和比特幣PoW有異曲同工之妙,但是又有一些實質性的區別。我們知道,比特幣PoW要求礦工持續地、反復地執行哈希計算,礦工需要高強度地運行他們的計算晶元,並消耗極為可觀的電力資源。
我們的PoC則是另行開辟了一條極為巧妙的道路:它要求礦工預先計算好數量巨大的哈希結果,並將這些數據存儲在硬碟里;挖礦的時候,礦工也是爭相破解「難題」,不同的是「難題」的答案要在硬碟數據中找,而不是實時地計算。自然而然,誰的硬碟容量更大,誰就有能預先存儲更多的「備選答案」,誰就有更高的概率找到能夠匹配「難題」的那個「正確答案」。
有人可能要問了,在PoC這個機制中,礦工有沒有可能通過晶元去計算答案作弊呢?不可能。PoC的演算法設計決定了它在找「答案」的時候,對存儲空間這一要素非常敏感,而對晶元的計算能力不那麼敏感。強大的算力對礦工挖礦成功率加成並不是很大,而擁有更多的存儲空間倒是能成倍地提高挖礦成功率。PoC的這種特性也被形象地稱為「空間換時間」。
『柒』 地平線CEO余凱 講述汽車智能晶元,驅動自動駕駛新發展
演講的最後余凱向我們展示了2021款理想ONE的發布會現場的視頻,在發布會上,理想汽車創始人李想高度評價稱「地平線是其見過配合程度最高、最專業的晶元供應商團隊。」開放性的生態理念和中國企業獨有的性價比優勢,使地平線廣受主機廠歡迎。最後余凱也向我們表達了期望中國主機廠能夠相信我們國產晶元企業的實力,謀求合作共贏,做到互相扶持。那麼就讓我們共同期待中國主機廠和初創科技公司能在日後摩擦出更多的火花吧。
『捌』 演算法公司角逐AI晶元,商業化之難如何破
二月初,AI晶元投資回暖。2月25日,成立100天的GPU晶元公司摩爾線程宣布融資數十億元,摩爾線程由前英偉達全球副總裁、中國區總經理張建中創立,其融資信息剛發布立刻在業界發酵。2月11日,另一家GPU晶元的創業公司登臨科技宣布完成了A+輪融資,首款GPU+人工智慧處理器已成功回片通過測試,開始客戶送樣。
與此同時,另一陣營的AI演算法公司紛紛提速AI晶元商業化進程。2月18日,網路在年度財報會上首次披露AI晶元的進展情況,加上此前其AI晶元將單獨運作進行正與IDG等進行融資談判的消息被媒體傳出,網路AI晶元的商業化被猜提速。2月9日,由做了二十餘年演算法余凱其創立的AI晶元公司地平線,宣布完成3.5億美元的C3輪融資、其自動駕駛晶元今年出貨量將突破100萬片。也是在最近,另外一家AI演算法公司依圖科技將推出第二顆AI晶元消息,也被傳出,而其上市招股書顯示,募集資金中有23億將用於新一代晶元的研發以及生態布局。