tops算力FPGA設計
㈠ 簡要介紹當前為人工智慧提供算力的晶元類型及特點
給人工智慧提供算力的晶元類型有gpu、fpga和ASIC等。
GPU,是一種專門在個人電腦、工作站、游戲機和一些移動設備(如平板電腦、智能手機等)上圖像運算工作的微處理器,與CU類似,只不過GPU是專為執行復雜的數學和幾何計算而設計的,這些計算是圖形渲染所必需的。
FPGA能完成任何數字器件的功能的晶元,甚至是高性能CPU都可以用FPGA來實現。 Intel在2015年以161億美元收購了FPGA龍 Alter頭,其目的之一也是看中FPGA的專用計算能力在未來人工智慧領域的發展。
ASIC是指應特定用戶要求或特定電子系統的需要而設計、製造的集成電路。嚴格意義上來講,ASIC是一種專用晶元,與傳統的通用晶元有一定的差異。是為了某種特定的需求而專門定製的晶元。谷歌最近曝光的專用於人工智慧深度學習計算的TPU其實也是一款ASIC。
㈡ 從計算機硬體設計的角度分析如何提供更為豐富的算力
自上世紀90年代互聯網技術誕生以來,移動互聯網、雲計算、大數據、人工智慧等新一代信息技術的不斷發展和逐步成熟,並日益深入的滲透到經濟社會的各個領域,2020年全球范圍內爆發的新冠疫情又進一步加速了這一趨勢,數字經濟已經成為世界經濟發展的新階段,即世界經濟發展已經進入數字經濟時代。
黨中央、國務院和各級政府高度重視數字經濟的發展。從2015年《中國製造2025》、《促進大數據發展行動綱要》等政策出台以來,中央和各級地方陸續以推出系列數字經濟發展的措施,並支持雄安新區、浙江、福建等六個地區建設國家數字經濟創新發展試驗區,支持北京、上海、深圳、西安等地建設國家新一代人工智慧創新發展試驗區。2020年國家進一步提出加強新型基礎設施建設,並明確將數據作為一種新型生產要素寫入政策文件,這些將為數字經濟的發展奠定更加堅實的基礎。
農業經濟時代,土地、水源和工具是關鍵資源。工業經濟時代,能源、原材料、機器設備和生產工藝等是關鍵資源。那數字經濟時代的關鍵資源是什麼呢?數字經濟時代的關鍵資源是數據、算力和演算法。數據是數字經濟時代的原材料,各種經濟活動中都在源源不斷的產生的數據,越來越多的組織也將數據當作一種資產,在政策層面數據已經成為一種新型生產要素。算力相當於數字經濟時代的機器設備和生產力,面向各種場景的數據產品或應用都離不開算力的加工和計算,而且對算力的需求和要求也越來越高。演算法是數字經濟時代的生產工藝,面向圖像、語音、自然語言處理等不同的應用場景和領域的演算法也層出不窮,演算法的提升和改進可以提高算力的效率和更多的挖掘數據價值。
本文重點分析算力方面內容,介紹算力市場總體情況,當前算力發展的特點和趨勢,以及重點算力供應方式等。
一、算力需求快速增長,算力投資具有多重經濟價值
算力即計算能力,核心是CPU、GPU、NPU、MCU等各類晶元,具體由計算機、伺服器、高性能計算集群和各類智能終端等承載。數字經濟時代,數據的爆炸式增長,演算法的復雜程度不斷提高,對算力需求越來越高。算力是數字經濟發展的基礎設施和核心生產力,對經濟發展具有重要作用,根據IDC與浪潮聯合發布的《2020全球計算力指數評估報告》,計算力指數平均每提高1點,數字經濟和GDP將分別增長3.3‰和1.8‰。
隨著數字經濟的不斷發展,人工智慧、物聯網、區塊鏈、AR/VR 等數字經濟的關鍵領域對算力的需求也將呈爆炸式增長。根據華為發布的《泛在算力:智能社會的基石》報告,預計到2030年人工智慧、物聯網、區塊鏈、AR/VR 等總共對算力的需求將達到3.39萬EFLOPS,並且將共同對算力形成隨時、隨地、隨需、隨形 (Anytime、Anywhere、AnyCapacity、Any Object) 的能力要求,其中人工智慧算力將超過1.6萬EFLOPS,接近整體算力需求的一半。OpenAI開發的GPT-3模型涉及1750億個參數,對算力的需求達到3640PFLOPS,目前國內也有研究團隊在跟進中文GPT-3模型的研究。
算力投資具有多重經濟價值,不僅直接帶動伺服器行業及上游晶元、電子等行業的發展,而且算力價值的發揮將帶動各行業轉型升級和效率提升等,帶來更大的間接經濟價值。根據《泛在算力:智能社會的基石》報告,每投入1美元算力即可以帶動晶元、伺服器、數據中心、智能終端、高速網路等領域約4.7美元的直接產業產值增長;在傳統工廠改造為智能化工廠的場景下,每1美元的算力投入,可以帶動10美元的相關產值提升。
二、算力發展的特點及趨勢
隨著數據規模的增加和演算法復雜度的提升,以及應用多樣性的不斷豐富,對算力提出的要求也越來越高,當前算力發展呈現出三方面的特點,一是多種架構百花齊放的狀態,二是中心化的算力與邊緣終端算力快速發展,三是專用算力日漸成勢。
近年來多種算力架構並存並快速發展。曾經x86架構的算力占絕對優勢,英特爾和AMD基本壟斷了X86算力架構市場,海光信息通過跟AMD合作獲得x86架構的授權;如今基於ARM架構的算力份額不斷擴大,特別是在移動端ARM架構算力成為主流,華為海思等主要產品是基於ARM架構,另外天津飛騰的產品也是基於ARM架構。隨著人工智慧等算力需求的不斷增加,GPU算力的需求不斷增加,英偉達在GPU算力市場佔有絕對優勢,AMD也分了一杯羹,疊加比特幣挖礦算力需求,導致市場上GPU卡供不應求。近幾年國內也出現幾個GPU方面的創業團隊,如寒武紀、登臨科技、燧原科技等。此外,Risc-V、存算一體化架構、類腦架構等算力也不斷涌現,不過這些算力剛剛起步,在應用生態等方面還需要一定較長的培育過程。
中心化算力和邊緣終端算力快速發展。隨著7nm製程日漸成熟,基於7nm製程的CPU、GPU等算力性能得到極大提升,目前7nm製程算力主要是中心化算力,移動端智能手機的處理器算力部分也已經採用7nm製程。台積電的7nm製程已經實現規模化,並開始攻關3nm工藝製程;中芯國際7nm工藝製程仍在技術攻關當中。隨著5G及物聯網應用的不斷增加,邊緣終端算力的需求日益增加,特別是自動駕駛、智慧安防、智慧城市等領域算力需求。地平線自動駕駛晶元已經量產,英偉達jetson產品在嵌入式終端產品應用廣泛,其他針對特定領域專用邊緣終端晶元創業公司層出不窮。
針對圖像、語音等特定領域的專用算力日漸成勢。一方面是晶元工藝製程越來越逼近摩爾定律的極限,另一方面是物聯網智能終端對功耗的要求等,針對特定領域的專用晶元層出不窮,並且越來越多的巨頭參與其中。谷歌的TPU專為機器學習定製的算力,阿里平頭哥的含光NPU專為神經網路定製的算力,賽靈思的FPGA算力,網路研發針對語音領域的鴻鵠晶元以及雲知聲、思必馳、探境科技等也推出智能語音相關的晶元,北京君正、雲天勵飛、依圖科技和芯原微電子等推出針對視覺和視頻處理相關的專用晶元。
三、算力供應以公有雲和自建算力為主,多種方式相補充
當前的算力供給主要包括公有雲、超算中心、自建算力、地方算力中心等方式。其中,公有雲和自建算力中心是算力的主要來源方式,超算中心及地方算力中心等多種方式相互補充。
規模化的算力供應通常通過數據中來承載,新建數據中心的不斷增加,將帶動未來算力資源的供應不斷擴大。據中國電子信息產業發展研究院統計數據,2019年中國數據中心數量大約為7.4萬個,大約能佔全球數據中心總量的23%,其中大型數據中心佔比12.7%;在用數據中心機架規模達到265.8萬架,同比增長28.7%;在建數據中心機架規模約185萬架,同比增加約43萬架。2020年國家大力支持「新基建」建設以來,數據中心作為「新基建」的重要內容,京津冀、長三角和珠三角等算力需求地區,以及中西部能源資源集中的區域,如內蒙、山西等,均在推進新的大中型數據中心的建設。
公有雲以其穩定和易用等特點,成為許多企業特別是中小企業的算力首選方式。據不完全統計,阿里雲伺服器總數接近200萬台,騰訊雲伺服器總數超過110萬台,華為雲、網路雲、京東雲、AWS等雲廠商伺服器總數未找到確切數據,保守估計各類雲廠商伺服器總數之和也超過500萬台。而且在國家宣布大力支持「新基建」建設之後,騰訊宣布未來五年將投資5000億元用於雲計算、數據中心等新基建項目的進一步布局,阿里雲宣布未來三年阿里將投2000億元用於面向未來的數據中心建設及重大核心技術研發攻堅,網路宣布預計到2030年網路智能雲伺服器台數將超過500萬台。各大雲廠商仍在繼續加大算力投入,公有雲算力供應將會更加充裕。
自建算力以其安全性和自主性等特點,成為政府、大企業及其他關注安全的組織的算力首選方式。政府、銀行及高校和央企等,通常通過自建或租賃數據中心的方式自建算力,滿足自身各項業務的算力需求。許多互聯網公司在剛開始時選擇使用公有雲服務,但規模發展到一定程度時通常都會開始自建或租賃數據中心的方式自建算力。其他有部分各種類型的企業,出於安全、商業機密和隱私等方面的考慮,不意願把數據和業務等放到阿里雲等公有雲上,往往選擇託管伺服器的方式自建算力,規模更小企業直接就在本地使用。2020年6月快手宣布投資100億元自建數據中心,計劃部署30萬台伺服器,位元組跳動等大型互聯網公司都在不斷加大數據中心的建設。
超算中心和地方算力中心作為算力供應有效的補充方式,適合於大規模計算需求的應用領域。截至2020年,科技部批准建立的國家超級計算中心共有八所,分別是國家超級計算天津中心、廣州中心、深圳中心、長沙中心、濟南中心、無錫中心、鄭州中心和崑山中心。超算中心主要的算力資源以CPU為主,新建的超算中心及更新升級過程中超算中心逐步增加了異構GPU算力資源。超算中心較好的滿足和彌補了高校科研中算力資源的需求,特別是在工業模擬、生物信息、新材料、氣象、海洋等科學計算領域。國內主要省市地區基本都投資建設了當地算力中心,重點服務本地科研和產業發展的需求,如太原、蘇州、福建等地,目前通常地方算力中心的規模並不大,計算節點數在200-500之間居多,主要服務於當地氣象、工業模擬和生物信息等領域計算需求。此外,2020年以來,武漢、南京、珠海、許昌等地區正在建設人工智慧計算中心,將在一定程度上彌補當前規模化AI算力不足的情況。
結語
算力作為數字經濟的基礎設施,也是數字經濟時代的生產力和引擎,越來越成為數字經濟時代國家競爭力的體現。根據IDC與浪潮聯合發布的《2020全球計算力指數評估報告》,中國和美國的算力建設在全球處於領先地位,美國的算力無論在規模、效率、應用水平等方面都領先於中國。此外,從算力晶元供應角度看,美國的英特爾、AMD、英偉達等企業幾乎佔了全球的絕大部分的市場份額。可見,中國在算力建設和發展仍然需要加大投入和加強研發等,發揮優勢的同時彌補不足,從而為數字經濟長期發展奠定更加堅實的基礎。
㈢ 為什麼電子元器件產品更容易受到美國出口管制部門的關注
我們帶大家粗略解讀了一下這次美國晶元及技術出口管制新規的一些特別之處,並且很明確的指出了這次技術和產品的出口管制已經明顯具有「晶元戰爭」的硝煙,從某種層面上已經將中國列為對其有明顯安全威脅的國家,今天我們就來深入分析一下美國出台這部分晶元管制的背後原因以及對中國半導體及ICT產業發展的影響。
首先我們詳細說一下為什麼這次的新規具有明顯的宣戰意味。我們先不提這次一次性列舉的幾十家企業將面臨比華為更為嚴格的限制,先看看美國正常的出口禁令標準是什麼。美國的高科技特別是電子信息技術一般有幾種不同的安全級別,最高的限制肯定就是禁止出口,這裡面核心都是一些軍用技術,特別是一些高度機密的核心技術,比如其早期的隱形戰機塗料,相控陣列雷達掃描,超高速超高性能模擬系統等,當然一些高精尖的儀器設備也屬於這部分管制范圍。第二類就是高級別的軍用的產品和技術,這部分禁運的范疇主要是非軍事友好國家,比如北約陣營之外國家以及除了日本韓國這些美國有駐軍的國家之外,典型的就是澳大利亞這類算是友好的國家也在第二類禁運范疇內。第三類禁運就有意思了,基本都是美國認為的對其有明顯威脅國家,基本都是跟美國無外交關系或者正在處於戰事中的國家,這部分的禁運清單很長,甚至最嚴格的是所有包含一點點美國產品和技術的產品和系統都不能銷往這些國家。我們熟知的俄羅斯,也是因為克里米亞之後才被美國開始部分限制禁運,而全面禁運則是烏克蘭戰爭開始之後。舉兩個例子,華為就是被「誣陷」把含有美國產品的整機賣給伊朗而被美國制裁,而某家被收購的免稅州企業因為把給海軍訂單的產品型號面板未加改動就換殼成民用產品以及曾將某個產品賣給巴鐵,而先後兩次受到美國政府勒令SVP背鍋辭職加高額罰款。
那麼這次新規中突出強調的高性能計算晶元和高性能計算設備,讓這兩個很明顯絕大部分不是針對軍事用途的產品出口中國受到嚴格管控,把中國當作威脅其國家安全的國家的意圖已經是司馬昭之心了,這意味著中國正常民用科技發展在美國人眼中是高度威脅其安全的存在,那麼這不是宣戰又是什麼?畢竟在37年前合資企業這個模式的出現,就是為了繞過美國所謂的軍用設備出口管制而發明的,同樣是很多軍用相關的高性能模擬晶元,曾經經常以科研用途的方式,藏身於某些整機產品中,遠渡重洋走進某些科研院所。而這些產品和設備,都是因冠以MIL認證標准而奇貨可居的。
當然,從另一個角度來說,中國的某幾個領域確實已經讓美國人感到了威脅,而這幾個領域也許就是未來科技競爭的主要戰場,因此在中國還沒有完全建立強大的晶元產業之前,從前端控制中國部分產業的發展,這很明顯是美國人對之前「綏靖政策」不能再拖延的「撥亂反正」。
如果非要把半導體產品跟軍事聯系起來,按說高性能模擬晶元首當其沖,而有趣的是,針對中國的出口限制中,在所有非MIL標准體系下的高性能模擬產品都沒有享受到過如今這些高性能計算晶元的待遇。這已經很能說明美國新規的目的從來不是限制中國的軍事用途或者所謂的用AI來訓練軍事的目的,其核心就是要嚴格限制中國高性能計算領域的飛速擴張。這其中,AI、雲計算和超級計算機,是最受影響的幾個領域。反倒是很多人提出的自動駕駛領域,筆者認為影響還不算大。
先說自動駕駛這部分,很多人可能認為因為NVIDIA在自動駕駛方面的算力優勢非常明顯,因此未來的A100和H100這些產品禁運將嚴重影響中國的自動駕駛技術的發展。筆者認為,從邏輯上這么看是沒錯的,但從實際技術指標上和目前國內自動駕駛的發展情況看,情況並沒有想像的那麼差。首先,自動駕駛目前能做到L4級已經是現有技術看到的極致了,即使按照某些最苛刻場景的自動駕駛(車載獨立計算),算力也並不需要做到4800+。其次,國內雖然很多自動駕駛早期用NVIDIA的晶元做研究,但得益於互聯網造車新勢力的融資需求,真正應用到整車時都宣傳自己設計主處理晶元。國內部分廠商面向L3級自動駕駛的自研晶元按美國這次的標准算,TOPS算力大概在1500-3000左右已經是很高的標准了,遠達不到被禁止設計和生產的要求。再者,對自主設計晶元要求不高的傳統車廠選擇Tier1合作的自動駕駛方案,也很少會用到高算力的主處理晶元,更多會選擇V2X這種對實時算力要求不高的系統性方案。至於很多人擔心的未來超過4800算力的晶元設計都將缺少美國EDA的支持,這點在自動駕駛方面短期內也不太會受限制,一方面,專用晶元執行效率更高,因此基礎算力不需要太高也能滿足自動駕駛基本需求,至於L5的需求和所謂超高性能汽車主處理器,這部分都是用來提升融資額度的籌碼,現在美國的新規反倒像是幫投資者更客觀評估智能駕駛企業估值的標尺。另一方面,現在的NVIDIA A100裸晶元售價依然在5000+美元左右的高位,一張A100卡則是高達上萬美元。就算自動駕駛汽車可以賣得很貴,號稱一台補貼十幾萬的蔚來整車成本也不過5萬美元,考慮到電池需要佔40%成本,還用得起裸片成本5000+美元的A100么?
所以,真正美國瞄準的是中國的超級計算機和高性能伺服器以及AI應用。畢竟在全球雲計算領域,基本上已經是中美爭霸的格局了,而面向未來的AI應用(非工業)方面,其他國家加起來積累成果可能都不及中美一個國家。在本次禁令正式發布之前就傳出的GPU出口管制,就是針對高性能伺服器和AI應用的,只不過,現在加上了高性能處理器和高性能計算整機。深究一些細節,就能看出這份禁令真的是有的放矢,處處卡住了關鍵技術指標。比如「滿足輸入輸出(I/O)雙向傳輸速度高於600GB/s」,直接卡住了高性能加速應用;「每次操作的比特長度乘以TOPS 計算出的處理性能合計為4800 或更多算力的產品」,這幾乎是超大規模AI模型訓練的入門級標准。兩個結合起來,基本上是2018-2019年左右最先進伺服器的技術指標,而現在已經是2022年了,NVIDIA的A100是2020年的產物,而H100才是2022年新一代。與此對應,曾經認為可能不會受禁令現在的AMD的MI100現在看也很難過關(標稱值1.2TB/s帶寬,算力也是對標A100的存在),新推出的MI250早就被證實肯定會禁止出口到中國。在高性能伺服器的加速卡方面,離開最主流的GPU加速卡,未來中國的高性能伺服器未來只能依靠FPGA和其他ASIC了,很可惜的是,能媲美GPU的FPGA加速技術恰恰只掌握在已被密切關注的AMD和目前尚未被牽扯進來的Intel手上。而ASIC加速卡要達到同樣的水平,恐怕只能寄希望於先進製程的發展了,哦,我們忘記了,美國人把3nm GAA的EDA在8月份就開始全球設計審核管制了。而對中國市場的半導體工藝設備和技術管控,早在幾個月前就已經實施了,即使以應用材料和LAM這些設備巨頭去抗議,估計也很難有明顯的政策松動。
在超算方面,「FP64(雙精度)理論計算能力是在100 petaFLOPS(每秒千萬億次浮點運算)或者以上,FP32(單精度)在200 petaFLOPS 或者以上浮點算力的超級計算機」,這部分基本上是超算前500的實力,進口倒是不多,但如果零件上要管控,我們的超算未來可能就會很尷尬了。
而在AI訓練模型這方面,算力幾乎是最迫切的需求,這也是為何NVIDIA能夠短短幾年內在銷售額未盡前十的前提下,依然能成為半導體市值第二的公司。這也是為何一向沉穩的AMD願意對標A100推出MI100這種型號倒退但部分性能大幅跨越的產品的初衷。按照美國這次的標准,恐怕筆者曾經認為的AI應用滄海遺珠Gaudi2也難於倖免了。換句話說,目前最主流的2021年之後推出的AI訓練模型用計算晶元,基本上都很難擺脫這次新規的要求。當然我們也看到一些特別的初創公司的AI計算晶元,如果達不到A100的入門標准,那麼也只能算是無奈之選,算力本來就是目前AI發展的技術瓶頸,這次管制必將大幅拖累中國AI訓練及相關應用的發展速度,即使我們已經看到一些有落地盈利可能的AI應用,也可能因為技術上的滯後而錯失搶占應用制高點的先機。
當然我們也看到一些國內GPU和AI晶元企業開始了國產替代之路,並且多款產品也是對標A100性能甚至還有所超越,但從實際反饋來看,也許硬體標稱性能已經達到了,但結合軟體演算法之後的實際效果似乎差了不少。畢竟在這個幾乎所有開發都是基於NVIDIA布局十多年的Tensor體系下,國產AI晶元要做到跟主流AI軟體兼容,筆者感覺與其行百里者半九十,還不如推倒了體系重新來過。反正從這次美國的政策看,未來指望靠N,A,I三家產品來與美國AI水平並駕齊驅簡直是No Any Impossible,還不如趁此機會好好從頭開始搭建一下中國的AI技術體系,別忘了我們現在還有一個關鍵的競爭優勢——人工標注。
當然,我們也可以基本跟未來的挖礦產業揮手告別了,這個本來就灰色的產業將因此次管制新規逐漸淡出部分國內礦機公司的未來戰略規劃,畢竟挖礦要先進工藝作保障,3nm GAA的EDA已經被管制了,美國政府這次這么苛刻的限制高性能計算晶元,誰都知道礦機晶元的算力池還是很可觀的,那麼你猜美國人會不會放你去用EDA設計GAA晶元來擴充國內AI算力?
我們分析了這么多這次新政的影響,並不等於我們要悲觀的投降,反而我們可以藉助一些機會重塑我們的ICT產業結構,而這是這場晶元戰爭中,中國與三十多年前日本最大的不同之處。下一期我們將深入探索晶元戰爭中的應對策略和我們獨特的優勢。
㈣ 如何看待百度自主研發的昆侖晶元
昆侖是中國在大規模AI運算實踐中催生出的晶元,基於網路8年的CPU、GPU和FPGA的AI加速器的研發,通過20多次迭代而生。
因此,「昆侖」也是迄今為止業內設計算力最高的AI晶元(100+瓦特功耗下提供260Tops性能)。
與市面上已發布的適用於垂直場景的晶元不同,網路之所以將「昆侖」定義為國內首款雲端全功能晶元,是因為其可高效地同時滿足訓練和推斷的需求,除了常用深度學習演算法等雲端需求,還能適配諸如自然語言處理,大規模語音識別,自動駕駛,大規模推薦等具體終端場景的計算需求。
綜合來看,「昆侖」擁有高性能、高性價比、易用3大特點。
(1)高效:針對語音、NLP、圖像等專門優化。
(2)低成本:同等性能下成本降低10倍。
(3)易用:支持paddle等多個深度學習框架;編程靈活度高;靈活支持訓練和預測。
從2011年起,為了深度學習運算的需要,網路開始基於FPGA研發AI加速器,並同期開始使用GPU。在過去幾年中,網路對FPGA和GPU都進行了大規模部署。
AI應用的爆發,對運算能力提出越來越高的要求,基於傳統晶元的AI運算加速,已經不能滿足需求。在大規模AI運算的實踐探索中,網路研發出了一款專門用於AI大規模運算的晶元「昆侖」,它的運算能力比最新基於FPGA的AI加速器,性能提升了近30倍。
㈤ 中國車規級邊緣計算晶元或落地日內瓦 地平線吹響車上算力集結號
雖然歐洲當下也受到疫情的影響,但截至目前,將於3月5日開幕的日內瓦國際車展,官方並沒有正式發布推遲或取消的計劃。包括中國車企在內的多家汽車產業巨頭仍將如約參展。相比往年,今年中國車企的參展作品具有特別的意義,因為搭載中國車規級邊緣計算晶元的全新車型即將在車展上亮相。這意味著,中國車企的競爭力,已不再局限於以往的發動機、變速箱、車身、底盤、外觀,而是面向著汽車更高層次的發展,面向著汽車發展的未來——人工智慧,吹響集結號。而號手——這枚車規級邊緣計算晶元的生產商,便是來自中國的地平線。
地平線在自動駕駛領域的車規級晶元量產落地,對於中國汽車業整體無疑是一個好消息。可以預見的是,未來汽車以及人工智慧產業對算力的需求是驚人的。在過去的數年裡,我們看到智能駕駛的等級每提高一級,算力差不多要提升一個數量級。如果要實現全自動駕駛,車輛需要數千個TOPs量級的算力。但當下汽車市場上的產品,其平均算力也沒能達到個位數的TOPs。所以在龐大的市場需求面前,中國企業的力量就顯得至關重要。如果我們並不注重這塊戰略高地,或許依舊會像飛機發動機、汽車的動力總成一樣受制於海外。而中國國力量的出現,不僅意味著我們的戰略高地有望得到堅守,並可能在世界市場上攻城略地。有行業內專家預計,征程晶元兩年內將有望達到百萬量級的前裝裝車量,五年內則有望完成千萬量級的目標。
本文來源於汽車之家車家號作者,不代表汽車之家的觀點立場。
㈥ 三強爭霸高端FPGA(一)
英特爾在早前宣布,他們已開始將其第一批新的Agilex FPGA交付給搶先體驗的客戶。這使得最大的兩家FPGA供應商之間競爭進入到了「正面交鋒」階段。Xilinx於6月份交付了他們的第一款「 Versal ACAP」FPGA,因此,在經歷了一場漫長而有爭議的「誰能首先交付?」之戰之後。事實證明,這兩家競爭公司都可以在大約兩個月內,開始交付其可用來與對手對標的FPGA產品線。這意味著,與其他憑借第一時間引入先進節點來提升性能的競爭不同,這兩家公司都沒有足夠的時間好搭去利用一種新的、更先進的技術來贏得設計上的勝利。
不過,這次競爭的領域擴大了,新玩家Achronix聲稱他們將在今年年底之前交付其新型Speedster 7t FPGA的首批樣品。對於開發團隊而言,這意味著到今年年底,將有三款完全不同的高端FPGA產品可供選擇——所有這些產品都採用類似的工藝技術,並且均具有獨特的功能。
本篇文章是比較這三家供應商的新高端FPGA系列的多部分系列中的第一部分。我們將研究底層的工藝,FPGA邏輯組織(LUT)本身,用於加速處理和聯網的強化資源,存儲器架構,晶元/封裝/定製架構,I/O資源,設計工具策略,每個產品的獨特和新穎的特性和功能,以及營銷策略。如果您是可以從大量FLOPS,瘋狂的帶寬或是從設計過的一些有趣,功能強大的半導體器件中獲得樂趣的人,那麼,這對你來說將是一次令人興奮的旅行。
注意事項–英特爾和Achronix都參與其中,並提供了本文的信息。Xilinx沒有回應我們對信息的請求。
這一次,高端FPGA的霸主地位有所改變。過去,高端FPGA最大的市場是在網路方面,市場份額的變化也是如此,這主要取決於誰可以為部署最新一輪的有線和無線網路客戶的產品提供最豐富的設計,,誰就可以取得較大的市場份額。然而,5G推出的時機已經改變了這一動態。在當前的FPGA技術浪潮到來之前,5G就已經開始加速擴展。因此,第一輪5G的主幹網是建立在上一代可編程邏輯上的。這些器件將融入一個已經很強大的5G生態系統,因此,我們無法確定5G的徹底革命和新一代FPGA的誕生之間是否保持了一致。這些FPGA的設計已經充分理解了5G的機制。但是,不要低估FPGA對5G的重要性,或者5G對FPGA市場的重要性。今天,當你使用手機時,你的通話有99%的可能是通過FPGA進行的。有了5G,FPGA的影響會更大。
隨著數據中心加速(主要是針對AI工作負載)這一新興市場的快速擴展,這一現象引起了人們的興趣。據估計,人工智慧加速市場將在未來幾年中飛速發展,因而這三家供應商都將以其令人印象深刻的性價比和更高的能效來爭奪這些設備的大部分市場份額,並聲稱他們提供的解決方案可以一直延伸到邊緣/端側。這些供應商中的每一個都非常清楚地意識到佔領這些AI加速卡插槽是當務之急,並且他們都圍繞這個想法設計了新晶元。
讓我們看看所有這些因素吧?
從底層工藝技術來看,Xilinx和Achronix FPGA系列在基於TSMC 7nm而設計,而Intel Agilex則採用了性能相近的Intel 10nm工藝。不要被7/10命名差異所迷惑。不要被7/10的命名法差異所混淆。我們很早以前就曾指出,半導體行業的營銷團體根據市場上聽起來不錯的東西來命名節點,而不是從晶體管本身的任何可識別的特徵中推導出它們。據我們估計,TSMC的7nm和Intel10nm是大致相當的工藝,使用這兩種工藝的廠商基本一致。這意味著英特爾在工藝技術方面長期保持的領先地位似乎蠢棚已經消失,不過,當我們接近摩爾定律的瓶頸時,硅加工領域的競爭升級是不可避免的。
當推進到最新的半導體工藝節點,這三個供應商都獲得了適度的推動。然而這種推進已不可能達到摩爾定律的 歷史 標准,因為在過去幾個工藝節點的新流程更新所帶來的收益增量一直在穩步下降。每個人從FinFET技術問世中都獲得了一次友檔拿臨時性的推動,現在,隨著摩爾定律即將在經濟層面上終結,我們可能會發現邊際收益遞減趨勢將一直延續。
在過去,隨著晶體管尺寸的減小,每個新工藝節點都讓晶體管的密度大量提升,並獲得更好的性能和更低的功耗。現在,供應商必須在這三者之間進行權衡,並且即使在他們偏愛的指標上,通常也只能得到較小的回報。同時,轉移到新工藝節點的non-recurring費用繼續呈指數級增長。這意味著FPGA公司所承擔的風險急劇上升,這是因為為了保持競爭力,他們需要不斷投資才能獲取不斷減少的收益。這也意味著我們正在進入一個新時代,FPGA本身的架構和功能、FPGA工具以及這三家公司的營銷策略將成為影響收益的關鍵因素,而不是誰將率先使用新的製程工藝。
考慮到工藝技術實際上是一種洗禮,讓我們看一下每個供應商產品的功能和特性。從最基本的FPGA功能– LUT結構開始。我們經常感嘆每個公司對LUT的計算都不一樣,而且這個 游戲 每一代都變得更加復雜。Xilinx和Achronix當前使用的是6輸入LUT,而Intel的ALM本質上是8輸入LUT。廠商或多或少地同意我們可以使用2.2 LUT4s per LUT6,,和2.99 LUT4s per LUT8將不同的LUT轉換為等價的4輸入LUT。
根據這方法一計算,Achronix Speedster 7T系列包括從363K到2.6M LUT6(相當於800K到5.76M的等效LUT4)領先業界,Intel Agilex系列包括 132 K到912K 的ALM(相當於395K到2.7M的等效LUT4),Xilinx的Versal系列產品包含了約246K到984K CLB(可換算成541K到2.2M的等效LUT4)。每個供應商都聲稱自己的體系結構優越,著重強調了可以提高某些特定應用或配置中的邏輯密度,性能或可布線性的設計功能。目前,我們尚不清楚任何供應商的LUT是否明顯優於其他任何供應商的LUT。
但是,FPGA可用資源不僅取決於LUT的數量。還必須考慮以下挑戰:被有效使用LUT的百分比(我們將在稍後討論設計工具時進行討論),以及集成到邏輯模塊中的強化功能的數量,這些功能允許以最小的方式實現設計功能LUT結構的參與。根據您的設計,您可能會發現更多內容被塞入一個或多個FPGA中,而這些內容和LUT數量無關。
FPGA「擅長」人工智慧推理的主要原因是其可以並行完成大量的算術運算(主要是各種精度的乘法累加),這要歸功於編織在可編程邏輯結構中的存在大量"DSP塊陣列"。這使得FPGA能夠比傳統的馮·諾依曼結構的處理器更有效地執行例如卷積等矩陣運算。
分析對AI推理至關重要的硬體乘法器,Achronix的可變精度乘法器可實現41K int-8乘法或82K int-4乘法。英特爾Agilex具有2K-17K 18×19乘法器,Xilinx Versal有500-3K「DSP引擎」,大概是「 DSP58 slice」,包括27×24乘法器和新的硬體浮點功能。這種比較肯定是「從蘋果到橙子到芒果」,至於哪種水果更適合您的應用,它必須是「由設計者決定的」。
現在,這三個供應商都增強了對浮點乘法的支持。Achronix為他們的DSP塊提供了一個全新的架構,他們稱之為"機器學習處理器"(MLP)。每個MLP包含多達32個乘法器/累加器(MAC)、4-24位整數模式和各種浮點模式,可支持包括TensorFlow 的Bfloat16格式和塊浮點格式。最重要的是,Achronix MLP將嵌入式存儲器模塊與計算單元緊密耦合,從而使MAC操作能夠以750 MHz的頻率運行,而等待通過FPGA組織訪問存儲器獲取數據。
英特爾還使用具有硬體浮點的可變精度DSP模塊(基本上就像它們已經提供了多年的功能一樣)。英特爾的浮點支持也許是三者中最廣泛和最成熟的。藉助Agilex,他們推出了兩種新的浮點模式,即半精度浮點(FP16)和塊浮點(Bfloat16),並且進行了架構調整,以使其DSP運算更加高效。
Xilinx已將其以前的DSP48 Slice升級到DSP58 ——大概是因為它們現在包括了硬體浮點,並且其乘法器也升級到了27×24。因此,在這一代產品中,另外兩家供應商也加入了英特爾的行列,提供支持浮點運算的硬體乘法器。對於Xilinx而言,這是一個逆轉。賽靈思此前聲稱,FPGA中實現浮點硬體乘法器不是一個好主意,因為浮點運算主要用於訓練,而FPGA則主要針對推理應用。
就可用的浮點格式而言,Versal(最多2.1K乘法器)和Agilex(最多8.7K乘法器)都支持FP32格式。這三個系列均支持半精度(FP16)——Versal最多可支持2.1K乘法器,Agilex最多可支持17.1K乘法器,Speedster最多可支持5.1K乘法器。Agilex(最多17.1K乘法器)和Speedster(最多5.1K個)支持Bfloat16。對於FP24格式浮點乘法,Versal和Agilex可能會使用FP32單元,而Speedster則具有高達2.6K的乘法器。Achronix Speedster還支持多達81.9K的塊浮點乘法器。
Xilinx還帶來了一種新的軟體可編程矢量處理器——高達400個1GHz +V LIW-SIMD矢量處理核心陣列,具有增強計算和緊密耦合的內存。這為並行化復雜的向量運算並利用FPGA豐富的計算資源提供了更為簡單的編程模型。總體而言,是在Xilinx的「kitchen sink」競爭策略上選中了「GPU /推理引擎」。稍後我們將詳細討論這一點。
英特爾對Achronix MLP和Xilinx矢量處理器的回應是老派的演變。他們指出,Agilex DSP模塊實現了與其他供應商的新DSP功能相同的功能。可以利用已建立並充分理解的FPGA設計開發流程,並且不需要客戶在器件的各個體系結構中去劃分他們的設計。如果您的團隊具有FPGA/RTL設計專業知識,這是一件好事。但如果你的應用需要由軟體工程師來開發DSP,Xilinx的軟體可編程方法可能有優勢。
除了簡單地計算乘數外,我們還可以通過查看供應商關於理論性能的聲明來比較這些能力。但有一點需要注意,這些說法被嚴重誇大了,而且很難精確定義。供應商通常通過將晶元上的乘法器數目乘以這些乘法器的最大工作頻率來得出一個數,得出一個"最多XX TOPS或TFLOPS"的數字。顯然,現實世界中的設計不會使用到100%的乘法器,沒有任何一個設計能夠達到這些乘法器的最大理論時鍾速率,也沒有一個設計能夠以適當的速率持續為這些乘法器提供輸入數據,並且這些乘法運算的精度因供應商而異。
如果必須估算的話,我們可以說FPGA在實際設計中可以實際達到其理論最大值的50-90%。這要比GPU更好,後者被認為在現實世界中只能達到其理論最大值的10-20%。
在推測INT8操作的TOPS數量時,如果我們將其矢量處理器中的 133 個TOPS包含在內,則Xilinx Versal以大約 171 個TOPS位居榜首。12個來自其DSP塊,26個來自其邏輯結構。Speedster緊隨其後,有大約86個TOPS,其中61個來自他們的MLP模塊,25個來自他們的邏輯結構。Agile xi nt8操作最大值為92個TOPS,其中51個來自DSP塊,41個來自邏輯結構。從Bfloat16格式的TFLOPS來看,Agilex以40個領先,Versal以9個緊隨其後,Speedster以8個墊底。Speedster在塊浮點操作上上獲得了很大的優勢,但是,它有123個TFLOPS,其次是Agilex的41個和Versal的15個。
這些數字均來自公司自己的數據表。正如我們所提到的,它們是理論上的最大值,在實際的實際應用中是不可能達到的。Achronix宣稱的「可用性」具有一定的價值,因為它們的MLP是獨特的設計,旨在將可變精度乘法運算維持在模塊本身內進行,並以最大時鍾速率運行,而無需數據往返於邏輯結構即可完成AI推理中最常見的操作。同樣,Xilinx的矢量處理器體系結構應能很好地保持數據平穩地流經算術單元。也就是說,我們還沒有看到基準或參考設計以任何有意義的方式來證明這些公司的聲稱。
當然,要使用所有這些LUT和乘法器,就需要讓您的設計實際布局和布線並滿足所選晶元的時序要求。隨著FPGA的發展,這已成為越來越困難的挑戰。單比他網路和邏輯路徑通過有限的路由資源分布在巨大晶元上,這使傳統的時序收斂逐漸變成一場噩夢。用於在同步設計上實現時序收斂的常規技術均遇到了障礙,無法擴展。Xilinx和Achronix都通過添加覆蓋傳統邏輯和路由結構的片上網路(NoC)在新一代FPGA中解決了這一問題。NoC從本質上改變了 游戲 規則,因為整個晶元不再需要在一個巨大的魔術般的融合中實現時序收斂。現在,較小的同步塊可以通過NoC傳遞數據,減輕了傳統路由結構的負擔,並將巨大的設計自動化工具需要解決的問題分解為更小、更易於管理的問題。
幾代以前,英特爾已經採取了另一種方法來解決這一問題——用稱為「 HyperFlex寄存器」的大量微寄存器鋪平到整個邏輯結構。這些寄存器允許對更長、更復雜的邏輯路徑進行重新定時和流水線處理,從而使整個設計實質上變得非同步。有趣的是,這也是Xilinx和Achronix使用的NoC的效果。每種方法都面臨挑戰,因為這兩種方法都會給晶元設計和我們使用的設計工具增加大量復雜性。據報道,在英特爾的案例中HyperFlex寄存器對邏輯架構可以實現的整體速度也有一些負面影響。英特爾表示,Agilex FPGA中的HyperFlex體系結構是第二代,並且與上一代HyperFlex體系結構相比具有改進和增強,可以提高性能並簡化時序收斂。在Agilex取得進展之後,我們將不得不拭目以待觀察用戶使用後的反應。
在採用NoC進行路由的兩家供應商,Xilinx和Achronix中,Achronix聲稱通過其二維跨晶元AXI實現實現了最快的NoC。在這一NoC中的每一行或每一列都實現為兩個工作在2 GHz的256位單向AXI通道,也就是在每個方向上可以支持512 Gbps的數據流量。Speedster的NoC共有197個節點,最終形成27 Tbps的總帶寬,減輕了FPGA傳統按位進行路由的資源負擔。據我們所知,Xilinx的Versal NoC性能尚未發布,但是大約有28個節點,我們猜測大約是總帶寬是1.5 Tbps。
好吧,本周我們的墨水用完了,但下周我們將繼續進行下去——看看這些FPGA系列帶來的迷人而靈活的存儲器架構,每個系列的獨特封裝和定製功能,瘋狂的SerDes IO功能,嵌入式處理子系統,設計工具流程等。
*點擊文末 閱讀原文 ,可閱讀 英文 原文。
今天是《半導體行業觀察》為您分享的第2125期內容,歡迎 關注 。
半導體行業觀察
『 半導體第一垂直媒體 』
識別二維碼 ,回復下方關鍵詞,閱讀更多
AI|晶圓|台積電|射頻|華為|集成電路|TWS耳機|小米
回復 投稿 ,看《如何成為「半導體行業觀察」的一員 》
回復 搜索 ,還能輕松找到其他你感興趣的文章!
英文原文
!
㈦ 算力涵蓋gpu+cpu+fpga和各種各樣的asic專用晶元嗎
是的,算力可以涵蓋 GPU、CPU、FPGA 以及各種各樣的 ASIC 專用晶元。
GPU(圖形處理單元)是一種專門用於處理圖形和視頻的晶元,常用於游戲、視頻編輯、人工智慧等領域。
CPU(中央處理器)是計算機的核心處理器,負責執行計算機程序中的指令。
FPGA(可編程邏輯門陣列)是一種可以在硬體層面上實現各種邏輯功能的晶元,在機器學習、通信、計算機視覺等領域有廣泛應用。
ASIC(專用集成電路)是為特定應用而設計的集成電路,具有高度專業化、高效率、低成本的優勢。在區塊鏈、密碼學等領域有廣泛應用。
總的來說,算力可以涵蓋各種計算資源,包括 CPU、GPU、FPGA 和 ASIC 等,用於處理各種不同的計算任務。
㈧ 百度AI開發者大會玩轉了哪些黑科技
作為中美人工智慧(AI)技術的先鋒企業,在網路與谷歌各自的2018年開發者大會上,AI不約而同成為貫穿全場的主角。不過與谷歌更多講述公司AI技術的創新與發展相比,7月4日的2018網路AI開發者大會上,網路更多展示了公司AI產業化的實際成果。
網路高級副總裁、AI技術平台體系總負責人王海峰介紹,「目前網路大腦每天的調用次數超過了4000億次,網路大腦3.0最大的優勢是多模態深度語義理解包含視覺、語音、自然語言、數據語義以及多元語義等。多模態深度語義理解不僅能夠讓機器聽清、看清,還能夠深入理解語音背後的含義,從而更好地支撐各種應用」。
作為一個以開放為理念的平台,開發者能夠通過網路大腦便捷地獲取AI能力,王海峰解釋,「網路大腦3.0已經對外開放了110多項領先的AI能力,並通過開放EasyDL等定製化平台、軟硬一體的AI能力,持續降低AI應用門檻,幫助開發者和企業應用AI實現業務創新與升級。」
打通AI與移動端的「智能小程序」
小程序的普及與流行,儼然成為現今移動端開發者必須緊跟的潮流。顯然,網路也不願意在此掉隊。
2018網路AI開發者大會上,網路副總裁沈抖正式對外發布網路智能小程序。據介紹,與其他小程序相比,網路智能小程序不僅可以全面接入網路大腦的AI能力,更將在今年12月全面開源。
網路方面人士解釋了網路智能小程序開放性體現的兩個層面,「首先,開發者只要簡單修改幾行代碼,就可以將自己在其他平台開發的小程序接入網路智能小程序,進而讓這個智能小程序無縫運行在網路系App(網路App、網路貼吧、網路網盤等)以及外部App(嗶哩嗶哩、58同城等)上,實現一端開發,多端可運行。其次,網路還將開放全域千億流量扶持開發者,幫助他們快速沉澱精準用戶,而網路流量中天然存在大量與資訊、服務、工具等相關的需求,尤其是在網路信息流中,用戶看到的內容都是根據興趣匹配推薦的,這些內容可以激發用戶各類需求,適合開發者去挖掘」。
而AI技術對於網路智能小程序的價值,則更多體現在精準獲客上。前述網路方面人士分析,網路智能小程序可以基於大數據、意圖識別、興趣識別等技術精準找到各類智能小程序用戶,有效縮短用戶轉化途徑,為開發者和合作夥伴帶來實實在在的商業效益。
網路方面提供的資料顯示,接入網路智能小程序後,查違章智能小程序全網的日活躍用戶在50天內增長了370%,火車票智能小程序訂單轉化率在20天內提升了44%。同時網路貼吧小程序上線以來,用戶人均使用時長也增加了30%以上。
㈨ Fpga哪顆晶元做礦機算力
Fpga礦機晶元做礦機算力
主要功能
1、可遠程升級算力:具有更強的動態編程能力,以容納不斷完善的協議制度
2、超大算力:1700M/台,最高可升級5100M
3、可再編輯、靈活行強
4、標准伺服器外觀
5、低功耗
㈩ 一群清華的博士,在天上玩起了「衛星智能」
隨著遙感衛星為代表的衛星數量的增加和信息收集能力的提升,我們能夠通過衛星拍攝的高清影像鳥瞰地球萬象,感知地球變化。例如「高分二號」在2017年拍下的故宮,地面解析度就已經小於一米,讓我們從天空俯瞰故宮全貌,欣賞北京城中心的壯闊之美。
「高分二號」在2017年拍下的故宮,地面解析度小於一米
而越來越清晰的衛星圖像背後,則是遙感衛星正在產生海量的數據——根據自然資源部《衛星遙感應用報告》(2020年)[1],中國在軌的自然資源遙感衛星已經達到19顆,全年數據量達到了1.6PB(1PB = 1024TB)。
但以往中國自己的衛星星地間傳輸,可不像我們日常生活中使用手機這樣的5G網路便捷,想將這么多數據傳回國內並不容易。考慮到中國目前衛星地面站建設少,因此只能在路過中國上空時才能獲得回傳數據的短短幾分鍾窗口,且一次只能傳輸幾十Gb的有限數據,所以,衛星在數據傳輸上消耗的時間,遠遠大於拍攝的時間。
以拍下上面這張圖的「高分二號」為例,衛星星上能儲存大約4Tb的數據、記錄不少於20分鍾的拍攝信息;「高分二號」的傳輸帶寬是2x450Mbps,也就意味著回傳4Tb數據需要超過75分鍾。而每次經過中國上空僅能獲得數分鍾窗口時間,則需要多次下傳和以天計算的時間延遲才能最終完成這一工作。
隨著商業衛星的蓬勃發展,不僅僅是遙感衛星的數據的採集和處理越來越成為了一個問題,包括通信、導航、科研、技術試驗衛星在內的全產業鏈乃至最終的衛星互聯網和空天地一體化網路,都面臨著這樣的瓶頸。
劉冬宇 | 作者
李拓 | 編輯
更多衛星數據,更廣闊的市場
地球空間正在變得忙碌。在果殼硬 科技 之前的文章中曾提到[2],根據UCS Satellite Database的統計,截至去年9月1日,地球軌道上已經有了4550顆衛星,其中在過去的一年間,人類就新發射了超過一千顆衛星,這要歸功於商業衛星產業的高速發展——特別是衛星最多的美國,並且其中絕大多數都是商業衛星。
UCS Satellite Database 及公開火箭發射數據
中國的商業衛星公司雖然發展勢頭不錯,但還沒有像美國那樣,把更多商業衛星送上天;而政策的支持,是中國的商業衛星公司們最期待的發展要素。而在春節假期之前,國家就給衛星行業送了一個「大紅包」:《2021中國的航天》白皮書,給商業航天定調支持。具體的措施,既包括對商業航天發射的支持——
未來五年,中國將在強化航天產品統一技術體制的基礎上,進一步完善現有航天發射場系統……建設商業發射工位和商業航天發射場,滿足各類商業發射需求。
也不乏更多商業化機會——
未來五年,中國航天將緊緊抓住數字產業化、產業數字化發展機遇,面向經濟 社會 發展和大眾多樣化需求,加大航天成果轉化和技術轉移,豐富應用場景,創新商業模式,推動空間應用與數字經濟發展深度融合。拓展衛星遙感、衛星通信應用廣度深度,實施北斗產業化工程,為國民經濟各行業領域和大眾消費提供更先進更經濟的優質產品和便利服務。培育發展太空 旅遊 、太空生物制葯、空間碎片清除、空間試驗服務等太空經濟新業態,提升航天產業規模效益。
暫時拋開太空 旅遊 、空間碎片清除等距離商業化還尚需時日的方向,今天目所能及的商業衛星業務,還集中在通信、導航、遙感和科學實驗四大領域;對於中國商業衛星公司,由於導航與通信領域主要由「國家隊」牽頭,遙感便成了商業化突破最為迅猛的領域。
遙感衛星在全球范圍內已實現高度商業化。根據SIA數據及頭豹研究院的整理,在2020年,全球衛星遙感服務市場已經達到24.2億美元,在2025年預計將達到43.6億美元[3]。另一份數據則表明,2020年,中國遙感衛星市場估計為81.8億人民幣,從2018年至2020年,每年增長率在8.23%~8.34%。[4]
全球衛星遙感服務行業市場規模。圖丨SIA、頭豹研究院[3]
中國遙感衛星行業市場規模。圖丨前瞻產業研究院[4]
蓬勃的市場,也時刻面臨著文章開頭的難題: 數據量大,但有效數據少;傳輸時間過長,導致數據的時效性差,限制了遙感衛星的應用場景 。
比如一顆典型的光學衛星,如果在某一圈飛行中開機拍攝10分鍾,那麼數據的回傳還需要再繞地飛行十圈甚至更多,且只能在每次路過中國上空時傳回一部分原始數據。星測未來聯合創始人、COO曹德志向果殼硬 科技 介紹,在耗費大量時間、衛星能源下傳的原始數據中,又會因為雲層遮擋等原因,無效數據的佔比可能超過一半。
還有另一類蓬勃發展的遙感衛星,SAR衛星,SAR即「合成孔徑雷達」(Synthetic Aperture Radar)。這是一類使用微波雷達進行探測的衛星,且不受天氣與雲層影響,具有全天時、全天候的優點,並且對地表物體的高度非常敏感(最高可達毫米級精度),還能分析地表植被、含水量等信息,因此格外適用於氣象災害、應急、農業、海事等需求,服務於金融、國防與公共事業[5]。
在去年七月的河南暴雨中,河南省自然資源衛星應用技術中心就調用了國內外SAR衛星數據,以分析洪澇淹沒區、城市道路淹沒情況等。[6]
SAR衛星的商業應用,同樣受到數據處理的限制。SAR衛星的典型工作模式為「條帶成像」,即隨著衛星在軌道上的移動,雷達以相對勻速掃描地面,連續採集雷達反射圖像,然後經歷漫長的原始數據回傳,才能拼接出最終的遙感信息。
對於如何更好地挖掘衛星數據價值,並應用於各類商業場景中,一個容易理解的解決方法,是在衛星上壓縮數據甚至篩選數據,只回傳最重要的信息。
而這個方法必然要基於運算,就像在手機上,我們為了處理照片,給手機塞進了幾顆ISP、NPU等晶元、一系列場景識別與圖像處理演算法。但在衛星上,起碼的算力和演算法問題,該如何解決?
衛星智能化如何實現?
「星測未來」目前的主要工作之一,就是為這些遙感衛星提供高能效的邊緣算力平台與結合場景的應用解決方案,通過在軌壓縮、在軌處理等方式升級衛星的數據計算和傳輸處理能力,從而為金融、應急、地區安全等下游應用市場提供服務。實際上,對遙感信息的智能處理,也分為不同的層次,不僅可以解決數據傳輸問題,更重要的是提升衛星數據價值與運行效率。
最基礎的工作,是在星上壓縮數據,以減少回傳數據包的尺寸,降低通信帶寬壓力。
光學衛星圖像壓縮(長光衛星、星測未來)
初級的智能化,是篩選無效數據,比如去除被雲層遮擋的圖像,或者在有明確工作任務,比如掃描地面時,舍棄掉拍攝的海洋的部分。這部分工作也可以節省數據流量。
更高級的智能,則是在星上直接完成例如目標識別、跟蹤等工作。這也是讓衛星數據產生較高商業價值的關鍵,原本它需要將數據完全回傳後在地面完成,而如果在衛星上識別,則可以直接獲得有效的切片數據或目標信息,甚至可以針對性地調整衛星 星座 的工作模式,進一步精確採集局域的重要信息。
SAR衛星識別船隻(天儀研究院,星測未來)
SAR衛星艦船監測與水體識別
(天儀研究院、廈門大學、星測未來)
更進一步的是,如果衛星的工作任務中包括識別走私貨船等特定目標,智能的衛星甚至可以只向地面實時匯報一個簡訊息,「某位置出現某物」,與回傳圖像相比,具備更強的實時性。
可以看出,伴隨著智能化水平的提高,衛星數據更貼近商業需求,並且可以補充拓展很多傳統遙感流程無法實現的應用場景。
想實現衛星智能化,則需要為衛星引入低成本、高效能比的算力。什麼樣的晶元以及星上算力平台適合在太空中開展計算工作呢?通常衛星的晶元都是航天專用的產品,往往採用成熟製程,穩定性更高,但在性能、功耗與價格上沒有優勢。而採用大公司標准化的晶元,成了低成本、大算力的選擇,但它卻不一定適合在太空環境下工作。
而星測未來正是從這里打開突破口,曹德志向果殼硬 科技 介紹,CEO倉基榮與COO曹德志是清華工程物理系核電子學實驗室畢業的師兄弟,核電子學實驗室以往參與過與CERN(歐洲核子中心)的合作,提供了不少輻照環境下的高性能軟硬體平台,以完成每秒數百Gb的大通量數據篩選和處理工作,因此團隊的專業背景,是對輻射環境下的軟硬體計算平台及其應用有著充分的了解。
從2016年起,實驗室的本科和研究生們同時發起了一個空間探測項目——「天格計劃」,通過採用商業立方衛星平台搭載的空間探測載荷,開展伽馬射線暴勘測的 星座 組網計劃。這也啟發了創業團隊利用立方星開展太空實驗的業務,不斷加深對空間粒子探測、太空輻照的認知,並將晶元和星上算力平台在充分的地面測試後送至太空在軌驗證,幫助星測未來不斷迭代可靠性加固的方案設計:包括異構體系的硬體篩選,軟體系統的冗餘備份,以及通過神經網路架構搜索建立演算法的容錯設計和校驗優化等等。
因此,團隊自研多款「星溪」系列星上算力平台,均採用商用級器件(比如FPGA、GPU或ASIC晶元等)替代宇航級器件,降低行業成本,但卻具備較高的冗餘可靠性特色。
「星溪」自2020年至今已經迭代數次,目前成熟產品星溪02採用了FPGA+GPU的運算方案,能實現20W功耗、20TOPs算力。根據發射計劃,本月(2022年2月)星溪02將搭載衛星平台升空並完成在軌部署,實現全流程的工業級器件在軌驗證與後續的長時間運行考驗。
星溪02產品概念圖
據介紹,星測未來的星上智能方案,已經與多家中國頭部商業衛星企業達成合作,比如在可見光遙感領域與長光衛星合作,SAR衛星領域則是與天儀研究院合作。通過廣泛的產業鏈的合作,星測未來獲得了更多在軌驗證、商業場景拓展等關鍵機會,實現從科研、工程樣機走向市場化的過程。
技術服務科研
星測未來的另一項業務——「星測」系列太空實驗平台,則是通過搭載科研衛星的載荷形式,開展包括太空輻照測試、空間粒子探測、通用數據採集及處理等產品及服務。
曹德志向果殼硬 科技 介紹,「星測」平台同樣源於他們在空間探測領域的技術積累,其產品優勢在於:
第一,較低成本地實現科學載荷研製,較快時間驗證新技術 。一顆大型科研衛星通常搭載多個實驗載荷組成復雜系統,而許多新技術所帶來的系統性風險則需要前期開展關鍵技術在軌測試。星測太空實驗平台則是結合載荷研製能力以及空間輻照測試服務共同完成該項任務,幫助大型科研衛星降低風險。
第二,獨立採用小衛星搜集數據,快速推動空間科學研究成果誕生 。一顆大型科研衛星通常需要5~10年的研發周期,而基於低成本、高可靠商用現貨的載荷產品與立方星搭載模式,則短至一年即可完成科學目標的觀測與數據收集,發表科研的新成果。
第三點,開辟空間科學的新觀測模式 ,多星組網實現陣列、接力等科學觀測模式,比如面向宇宙瞬變源天體事件的爆發位置觀測,比如面向太陽和星雲的長時間接力觀測等,都將從新的角度打開天文學和宇宙學觀測的一扇新的窗。
「星測」平台一方面服務於科學家的科學 探索 ,起到降本、提速與推動科研行業發展的效果,另一方面,也加強星測未來的自身技術驗證,使得星測未來始終處於空間探測、衛星數據採集、星載邊緣處理等領域的新技術前沿。
曹德志表示,盡管科研衛星服務的市場空間受限於研究經費,大致在數十億元/年,但對星測未來而言,已經通過「星測」平台業務在行業內打開了局面,樹立了品牌,成為公司第一階段業務的主要現金流來源。
博士怎麼經營公司?
我們還很好奇一個問題:星測未來的團隊成員主要來自清華大學、斯坦福、中科院等知名高校和研究所,大多在從事產品研發;對於兩位創始人和幾位核心管理團隊成員,這也是他們的第一份工作,他們是如何實現從研究者到企業管理者的切換的?
據介紹,星測未來團隊目前人員並不多,大約全職十餘人,兼職實習三十人左右,但在公司成立之初,就面臨疫情居家、研發生產調試多地分工等情況,由此也開啟了遠程協作的工作方式。而由於團隊的高校背景,星測未來團隊從一開始就非常注重文檔的留存和信息的流轉。「這可能是我們公司一種習慣或者說文化,很多東西如果你想不清楚就寫下來,用文檔來傳達更加完整、體系化。」曹德志這樣說。
這與飛書的理念不謀而合。因此,他們在調研了多個辦公協作平台後,最終選擇用飛書來承載公司進行文檔記錄和遠程會議的平台。因為作為國內辦公協作的代表之一,飛書也著重推出過一種開會的方式——「飛閱會」,一種基於飛書文檔的閱讀+評論的開會方法。
曹德志說,「初創企業最重要的是不失真,人和人之間可以坦誠地交流,把信息升華,把客戶需求跟產品快速對接起來,最後達成整個業務的推進」。而在使用飛書文檔的過程中,團隊也根據公司發展和業務需求開發出了一些適合自己的工作模式,一個是用文檔搭建的知識庫,另一個則是用多維表格建立的客戶管理系統。
對於一家初創公司來說,成熟的CRM或者低代碼工具雖好,但不代表能解決業務流程中的核心問題,「首先是想清楚怎麼做,然後工具才能發揮應有的作用」,而用簡單的表格和文檔背後,是把想做的事情、想傳達的理念表達清楚,然後才能加速推動初創企業的業務發展。
「通過文檔和多維表格的形式,能夠把信息從一個地方搬運到另一個地方,飛書提供的這種信息流轉的機制,成了我們業務當中很重要的一環。飛書承載的代碼和文檔,最終都會帶到天上去。」曹德志這樣總結飛書在具體工作中的作用。