基於區塊鏈的隱私計算
⑴ 首個區塊鏈與隱私計算科技創新平台在京成立
未來區塊鏈與隱私計算高精尖創新中心28日在京成立,該中心依託北京航空航天大學和北京微芯區塊鏈與邊緣計算研究院共同建設,是國際首個區塊鏈與隱私計算 科技 創新平台。
解決長安鏈發展的技術問題是高精尖創新中心的核心任務。中心將堅持「走在理論最前沿、占據創新制高點、取得產業新優勢」的建設目標,緊緊圍繞長安鏈的迭代升級和未來發展開展 科技 攻關,並做好相關前沿技術研究的超前部署,結合沙河高教園區發展需求和區位優勢,聯合清華大學、北京郵電大學、中央 財經 大學、北京信息 科技 大學、中國人民銀行數字貨幣研究所等高校、院所和企業研究力量,大力引進全球頂級人才,在區塊鏈與隱私計算基礎理論、動態自適應區塊鏈系統、多尺度隱私計算演算法與開源平台、區塊鏈與隱私計算領域專用架構晶元與硬體、區塊鏈與隱私計算監管等方面取得國際領先成果。
高精尖創新中心採用「一體兩地、前店後廠」的運行模式,形成未來科學城與中關村科學城的良性互動。「前店」位於北京微芯區塊鏈與邊緣計算研究院,主要開展產品開發、實驗驗證等工作,「後廠」位於沙河高教園區,利用園區高校多學科交叉、人才聚集的資源優勢以及昌平區醫療、能源、先進製造等區塊鏈重點應用領域的場景優勢,吸引和聚集全球領軍人才,培育高水平研究團隊,開展基礎理論研究、關鍵技術攻關以及平台建設等工作。
此外,創新中心還將推進數字人民幣、跨境貿易、碳交易等領域與國家電網、國能集團、中糧集團等在北京的中央企業合作,努力建設數字經濟重要原始創新基地,為北京市建設成為全球數字經濟標桿城市提供支撐。
北京市把區塊鏈作為核心技術自主創新的重要突破口和國際 科技 創新中心建設的重要抓手,國內首個自主可控的區塊鏈軟硬體技術體系——長安鏈發布1年來,不斷夯實底層技術根基,持續迭代升級,作為區塊鏈底層基礎設施,積極服務國家部委、中央企業和北京市,在政務數據共享、信用稅務、司法存證、碳交易、供應鏈、食品安全、疫情防控等重大領域和關鍵行業,實現了140餘個場景應用,支撐了國家數字基礎設施主鏈建設。
未來區塊鏈與隱私計算高精尖中心作為該領域全球首個高水平國際化創新平台,圍繞長安鏈場景應用重大需求和前沿 科技 發展趨勢,有望在基礎理論和關鍵技術上取得先發優勢,保證長安鏈核心技術的自主可控與持續領先,實現「數據可用不可見,用途可控可計量」,為建設高效、高安全和高流動性的數據要素市場打下堅實基礎,對釋放數字經濟新活力、支撐區塊鏈產業集群發展具有重大意義。
ID:jrtt
⑵ 為什麼說區塊鏈融合隱私計算是必然趨勢
從更大的版圖視角來看,要構建全面的隱私保護和治理體系,不僅需要融合區塊鏈、人工智慧、大數據、隱私計算等多種技術,還需要結合法律法規、監管治理等諸多策略。
在數字化 社會 中,大家對於數據生產要素有著更為強烈的需求,無論是用戶服務、業務營銷都需要使用大量的數據,尤其是在分布式協作的業務模式中,各方都希望數據能順暢地流通,並合理地體現數據價值。但與之相悖的是,數據孤島仍然存在,數據的粗放式使用仍待解決。
與此同時,合法合規成為大勢所趨。不論是在國內還是國際上,與個人信息保護、數據安全相關的法律法規一一出台,都對個人信息保護和數據安全等方面提出了更為嚴格的要求。這意味著,要確保數據的安全,也要尊重個人的隱私權益;在數據全生命周期上,要求實現全面規范,達成合規地流通。
以用戶為中心,在安全隱私前提下交換數據,並提供優質合規的服務, 是數字化 社會 建設的趨勢,需要在技術、業務模式、治理體繫上做出更多的創新。在分布式系統里引入隱私計算、發展合規的數據交易所等舉措,都體現出這種創新精神。
在隱私計算領域,區塊鏈、聯邦學習和安全多方計算已然成為三大關鍵核心技術,而且這三大技術之間互有側重,也有許多重合和聯系。
其中,從區塊鏈的角度出發,我們可以看到,一方面,區塊鏈上的數據需要採用隱私演算法來保護;另一方面,區塊鏈也可以成為隱私計算協作里的底座和樞紐:採用區塊鏈技術去記錄、追溯多方協作中的數據集、演算法模型、計算過程,並對最終結果進行評估和共識,持續優化協作效率。
此前幾年,我們在區塊鏈領域里 探索 應用落地時,常常是用區塊鏈為業務場景構建 「分布式賬本」。合規的應用都會對用戶和商戶進行KYC (Know Your Client) ,其中也存在不少待通過隱私計算等創新解法來解答的問題。
例如,身份信息是否可以向全聯盟鏈公布?在交易時,交易里的金額、相關方是否明文公開?每個人擁有的資產,是否可以被隨意查詢?人們的業務行為,是否會在未授權的情況下被濫用?
例如,在消費場景的積分卡券業務中,商家和商家之間通常不希望過多地暴露自己的經營狀況,比如有多少用戶開卡、充值,以及每天的流水等;個人用戶也不希望自己的消費行為被公開審視。
於是,在隱私問題尚未能徹底解決之前,我們通常採用的辦法是,引入核心權威機構參與共識和維護全賬本,而其他參與者則分層分片,以不同許可權的角色參與。但這樣,在一定程度上增加了系統的復雜性,影響了用戶體驗,同時,給區塊鏈應用的規模化和普及化帶來了挑戰。
目前,區塊鏈也普遍用於政務領域,比如在智慧城市管理以及各種民生應用中,為大家提供「一網通辦」的良好體驗,這就需要多領域、多地域、多部門的通力協作。我們可以看到,政務應用覆蓋面廣,角色眾多,數據存在多級別的敏感性和重要性。
區塊鏈可以作為分布式協作的底座,通過數據目錄、數據湖等方式,構建數據流轉的樞紐,同時引入隱私計算和全面的治理規則,界定數據的邊界,使數據在「不出庫」的同時,依舊可以實現身份認證、隱匿查詢、模型構建等能力。
從更大的版圖視角來看,要構建全面的隱私保護和治理體系,不僅需要融合區塊鏈、人工智慧、大數據、隱私計算等多種技術,還需要結合法律法規、監管治理等諸多策略。
區塊鏈隱私保護的場景豐富、角色眾多,流程多樣、數據立體,我們可以用 「雙循環」機製做進一步分析。
首先,我們從用戶端出發,尊重用戶對數據的知情權和控制權,把重要的數據交給用戶管理。
比如,驗證身份的「四要素」中,用戶的身份憑據和聯系方式通常來自政府和運營商這些權威機構,當用戶和某一個業務場景產生聯系時,他們並不需要提供全部的明文信息,只需要選擇性披露一些可驗證的憑據,用以代替明文。
基於分布式驗證機制即可實現多場景的驗身,證明自己的合法身份,此時業務提供方即使未獲得更多明文數據,但也不能拒絕服務。這就從根源上降低乃至杜絕了用戶關鍵隱私的泄露風險。
其次,在業務方,依舊可以採用諸如聯邦學習、安全多方計算等技術,對用戶已經授權的、合規採集的業務數據進行處理。
在用戶知情同意的前提下,在B端實現與合作夥伴之間的協同計算,數據不出庫,隱私不泄露,但實現諸如風控、營銷、廣告等對業務運營有重要價值的事務。最終實現業務效果的提升,在給業務方帶來效益的同時,也為用戶提供更優質的服務,或者權益上的回報。其整個價值體系是閉環的,合規的,可持續的。
例如物聯網和區塊鏈,在採集端,就需要給設備分配身份和標識,同時演算法上要做到去標識,防泄露;在用戶端,不但要提供個性化的服務,還要做到防止不必要的畫像,在做到可驗證用戶身份和資質的同時,又不能無端地追蹤用戶行為軌跡;最終,在提供優質服務、安全存儲用戶數據的時候,又要尊重用戶的意願,包括注銷退出的要求。
如此的「雙循環體系」,可能不止是在技術上要求設備、APP、後台服務進行迭代的重構,同時其商業模式、運營治理觀念等層面可能也會產生許多革新。整個鏈條會非常的長,需要做的工作也非常多,覆蓋晶元、硬體、網路、軟體、雲平台等廣袤的產業鏈。
目前來看,並沒有哪一個「包打天下」的單一技術,可以滿足「全鏈路」、「雙循環」的要求。那麼我們不妨把場景拆細一點,列舉得全面一些,組合一些技術和方案,先解決某個場景里的痛點問題。
事實上,我們在和眾多產業應用開發者交流時,他們更期望聚焦於具體的、迫在眉睫的問題,得到有針對性、可著手實施的解決方案,比如轉賬時隱匿金額、排名時不透露分數、投票時不泄露身份、KYC流程時不泄露視頻等等。
特定場景下的問題常常可以基於隱私計算的某一個演算法或一些演算法的組合,針對性的去應對。我們可以日拱一卒,解決一個又一個的場景化問題,對之前可能有紕漏的事情亡羊補牢,對可預見的剛性需求引入新技術新思路,創新性地去實現。這樣就逐步把數據安全的籬笆一點點紮起來,最終築就數據安全的長城。
分布式協作中,許多場景是跨機構的、跨網路的,無論是區塊鏈還是隱私計算,都會遇到要和其他合作方、其他平台互通的要求。我們看到信通院的相關工作組正在討論多項互聯互通規范,核心框架是要做到「節點互通」、「資源互通」、「演算法互通」。
節點互通要求網路和協議等基礎要素能互通。資源互通強調的是對資源的發布存儲、定址使用、治理審計 (含刪除數據、下線服務等) ,在這個層面上,大家都實現相對一致的視圖,提供通用的介面。演算法的互通則是非常細致和場景化的,每一種演算法都有自己的特點,其密碼學基礎、運算規則、協作流程都會不一樣,反過來對資源的管理資質和節點網路的拓撲,都會提出更多的要求。
在互通基礎上還有「自洽性」、「安全性」、「正確性」等要求,而且隨著領域的發展,不斷增加更多功能的「擴展性」也非常重要。之前,可能大家是在埋頭苦幹,積累技術和經驗,以後在落地時,則需要更注重介面和規范,開放心態,大家一起溝通共建,通過開源開放的方式尋求共識和共贏。
總結一下,關於隱私計算發展的幾個思考:
第三,實現標准化和普及化,以推動新技術和新理念的規模化落地。比如相關的行業標准、評測體系,這對幫助從業者理清發展道路、達成行業要求大有裨益。
區塊鏈發展這么多年,除了技術本身,其實最難的是 「怎麼解釋清楚啥是區塊鏈」 。希望在科普推廣方面,方興未艾的隱私計算能有更多的新思路,實現更好的效果。
回顧區塊鏈和隱私計算的熱潮,我們看到產業和 社會 在呼喚數據安全和隱私保護,行業也已經有了不少可用的研究成果,得到了一定的認可。展望可見的未來,我們將更加開放、務實,聚焦用戶和場景, 探索 規范的、規模化的、可持續的應用之路。
⑶ 機密計算:區塊鏈第二重安全門
機密計算由機密計算聯盟(Confidential Computing Consortium,CCC)定義,該聯盟是Linux基金會的一部分,旨在定義和加速機密計算的採用。聯盟成員包括阿里巴巴、AMD、ARM、Meta、Fortanix、谷歌、華為、IBM、英特爾、微軟、甲骨文、瑞士電信、騰訊和VMware。
數據在其生命周期中通常存在三種狀態。使用加密技術可以確保數據在前兩種狀態下的安全性,例如數據鏈路層加密、資料庫/文件系統的加密,但數據在最終使用時,在CPU和內存中的數據都是明文的。
機密計算通過在基於硬體的可信執行環境中執行計算來保護使用中的數據,以確保數據的安全性。為了實現機密計算,基於硬體輔助的TEE(Trusted Execution Environment,可信執行環境)是必要的。
TEE由致力於開發、制定和發布安全晶元技術標準的全球平台組織(Global Platform)提出。它是一種具有運算和儲存功能,能提供安全性和完整性保護的獨立處理環境。其基本思想是在硬體中為敏感數據單獨分配一塊隔離的內存,確保敏感數據的計算在這塊內存中進行,並且除了經過授權的介面訪問之外,硬體中的其他部分並不能夠訪問這塊內存中的數據,以此來實現敏感數據的隱私計算。
與TEE相對的是REE(Rich Execution Environment,富執行環境),即我們常用的操作系統運行時的環境,可以運行如Windows、Android、iOS等通用的操作系統。REE是一個容易受到攻擊的開放環境,如敏感數據的竊取、移動支付盜用等等。而TEE是中央處理器上的一個安全區域,能夠保證敏感數據在隔離和可信的環境內被處理,從而免受來自REE中的軟體攻擊。
TEE通常採用軟硬結合的方式進行安全性的保障與支持。在下圖這一典型的可信執行環境架構中,TEE內部為REE中的軟體提供了介面,使得REE中的軟體可以調用TEE對數據進行處理,但不會泄露敏感數據。
比如指紋解鎖,一般來說,指紋是存儲在TEE環境中的,保障隱私安全。另外,一些受版權保護的視頻,也會在TEE環境中運行,我們嘗試截屏某些視頻時,會截取失敗,原因即如此。
當前,TEE技術較為依賴傳統互聯網廠商,主流的晶元架構平台的TEE如下:
Intel平台:Intel平台有Software Guard Extensions(SGX),是Intel提供的一組指令,用於提高應用的代碼和數據的安全性,用戶可以把敏感數據放入到Encalve中,Enclave是一種受保護的可信執行環境。歸功於Intel提供的便利的SDK和開發環境,成為了目前學術界使用最廣泛的一個TEE平台,也是目前已有的較多在區塊鏈項目中使用的TEE平台。
ARM平台:ARM平台有TrustZone,把硬體資源分為安全世界和非安全世界兩部分,所有需要保密的操作在安全世界執行,其餘操作在非安全世界執行,安全世界和非安全世界通過一個名為Monitor Mode的模式進行轉換。目前我們用的安卓或蘋果系統,都是通過TrustZone保護我們錄入的指紋信息、臉部信息等個人隱私數據。
AMD平台:AMD平台利用SEV(AMD Secure Encrypted Virtualization)、SME(AMD Secure Memory Encryption)和SEV-ES(Secure Encrypted Virtualization-Encrypted State)等技術實現虛擬機的Guest內存加密和安全隔離;原理是在AMD的處理器里內置一塊小的ARM晶元,專門用來加密虛擬機的內存和在狀態切換時加密寄存器。
區塊鏈是機密計算的一個應用場景。區塊鏈的一個關鍵特徵是,它確保應該有一段共同數據的參與者確信他們看到的是相同的東西,並且一旦進入區塊鏈,數據是不變的。應由應用程序開發人員確保敏感數據不存儲在不可變的區塊鏈上。
機密計算可用於增強基於區塊鏈的系統的實施。通過結合機密計算和區塊鏈技術的能力,用戶可以利用基於硬體的TEE提供認證和驗證服務,優化可擴展性、隱私和安全性。區塊鏈用戶之間數據一致性的保證通常取決於各方獨立驗證所有當前數據有效性所依賴的歷史數據。這需要了解這些歷史數據集,這是一個潛在的可擴展性或隱私問題。用戶可以在基於硬體的TEE中執行智能合約,而不是自己獨立訪問和驗證歷史數據和相關智能合約。一旦交易完成,TEE將提供認證服務,以證明交易的可靠性,這意味著後續參與者無需再次為自己進行驗證。基於TEE的認證服務還可以幫助解決協商一致協議帶來的一些計算和通信效率低下的問題。
簡單地說就是機密計算可以增強區塊鏈的安全性和隱私性。以下是幾個典型場景:
公鏈:例如Secret Network,用戶交易時,會將信息提交鏈上加密智能合約中,加密的輸入會在TEE環境中,由運行全節點的驗證者解密,然後執行,將計算結果移出TEE環境時,再加密。
Layer2:例如Eigen Network,將節點分為計算節點和合約節點。合約節點用於區塊鏈本身的管理維護,計算節點用於執行用戶的交易。用戶的交易直接發給合約的執行節點,然後在TEE里運行,執行的結果將會以密文的形式保存在區塊鏈上。
預言機:預言機龍頭ChainLink基於合約可信數據源系統Town Crier,在Town Crier系統中有專門用於運行Intel SGX的節點,它是用於和現實世界中的可信數據源建立Https連接,並且在節點的SGX內運行合約來指定數據獲取的具體邏輯,確保通過此模型而獲取的數據只有兩種結果,要麼獲取不到,要麼就是真實可信的數據。
跨鏈橋:Avalanche跨鏈橋TEE節點,稱為Warden。用戶在Avalanche前端提交跨鏈請求,Warden會將交易傳入TEE隱私環境進行驗證,驗證者通過MPC方式,利用自己私鑰碎片簽數交易。利用TEE環境,保護了跨鏈交易驗證的安全性。
支付管道:TeeChan是改善比特幣支付可擴展性的解決方案之一,沒有支付通道的用戶可以直接在線下創建支付通道,由於TEE環境本身的隔離性,即使用戶本身也無法隨意動用TEE內賬戶里的資產,因此只要有支付通道在對方TEE里創建,那麼你就不需要擔心對方在沒有你允許的情況下把那筆錢用在別的地方,增加了安全性。
這一篇是我公眾號(公眾號名:小豬Web3)的一篇發表,探討了機密計算和TEE。基於TEE的機密計算雖然可以用於增強區塊鏈的安全性和隱私性,但它本身其實存在一些問題。首先是側信道攻擊,側信道攻擊一直是TEE固有的風險,過去幾年裡,針對Intel SGX側信道攻擊發生過多次,Intel也不得不持續修復漏洞。其次,TEE方案實際上依賴Intel、ARM、AMD等傳統企業可信的安全假設,這就存在一個中心化信任的問題,相信主流的晶元架構平台不會留後門。不過沒有一種技術是完美的,目前機密計算與TEE已經成了Web2中安全防護和隱私計算的工程利器,相信未來在Web3中也會大放異彩。
筆者來自螞蟻鏈,也是一名以太坊/Solana/Sui上的開發者,熟悉主流公鏈技術和Web3項目,拉了一個學習交流群,歡迎對Web3有興趣的同學加入(戳我微信號go15810306120)。
⑷ 區塊鏈與隱私計算的結合是必然趨勢嗎
區塊鏈與隱私計算的結合是必然趨勢嗎?
我們目前對這個問題的思考框架是:如果不與隱私計算技術結合,區塊鏈技術的應用是 否受到限制、無法向前發展;如果不與區塊鏈技術結合,隱私計算技術是否受到限制、無法 向前發展。如果二者對彼此都是剛需,那麼它們相結合的趨勢就是必然。
以下為我們對這個問題的思考:
1、隱私計算技術的應用是否區塊鏈技術的剛需
區塊鏈技術有巨大的優勢,但是如果沒有隱私計算技術,區塊鏈技術的應用會大大受到 限制,因為無法解決鏈上數據的隱私保護問題,這使得大量涉及敏感數據的場景不願應用區 塊鏈技術,比如金融和醫療領域。
(1)區塊鏈技術的局限性
第一,鏈上數據公開透明,數據的合規處理和隱私保護能力不足 區塊鏈作為分布式賬本系統,數據的公開透明盡管有利於存證、防篡改,但也存在數據 可輕易被復制、泄漏個人隱私的風險。區塊鏈在公有鏈上要求不同節點對交易和交易狀態進 行驗證、維護,形成共識,因此每個參與者都能擁有完整的數據備份,所有的交易數據公開 透明。如果知道某個參與者的賬戶,就很容易獲取其每一筆交易記錄,從而據此推斷其 社會 身份、財產狀況等。以消費場景為例,平台之間存在競爭壁壘,用戶也希望保留消費隱私, 因此區塊鏈缺乏對用戶流水、物流信息、營銷情況等與企業、個人隱私相關的數據缺乏保護 能力,往往導致數據擁有方不願意讓數據進入流通環節。在鏈上系統的交易不再受中心賬本的控制,用戶通過使用唯一的私鑰進行交易,交易過 程被加密且加密前數據很難還原,僅以私鑰作為交易憑證使得區塊鏈內的交易變得更加匿名 和不可控。在分布式賬本系統上,所有的轉賬以地址形式進行,一但發生了詐騙或者洗錢等 金融犯罪,即便可以公開查詢地址,但對資金追蹤的難度極大,且私鑰作為交易憑證很難證 明使用者的身份,因此許多企業、個人通過區塊鏈進行洗錢等違法交易,不利於數據的合規 處理和合法共享。
第二,數據處理能力不足,制約技術的進一步落地和商業化拓展 鏈上計算受限於網路共識的性能,使得鏈上交易難以具備實時性和高效率,區塊鏈智能 合約的計算能力需要擴展。以最大的加密支付系統比特幣為例,每秒鍾只能夠處理大約 3 到 7 筆交易5 ,且當前產生的交易的有效性受網路傳輸影響,往往需要等待 10 分鍾左右的記賬周 期才能讓網路上的節點共同知道交易內容。此外,如果鏈上有兩個及以上節點同時競爭到記賬權力,則還需要等待下一個記賬周期才能確認交易的准確性,最終由區塊最長、記賬內容 最多的鏈來完成確認。
完全去中心化的系統與現實中大部分現有體系的兼容性不足,缺乏鏈上鏈下協同、多業 務發展的系統和功能,制約區塊鏈技術的進一步落地。在區塊鏈的技術落地過程中,首先, 各行業本身具有成熟的體系,區塊鏈完全去中心化的形式不一定適合所有的領域和行業;其 次,區塊鏈的平台設計和實際運行成本巨大,其所具備的低效率和延遲性的交易缺陷非常明 顯,是否能夠彌補原系統更換的損失需要經過一定的精算和比較;此外,使用區塊鏈存儲數 據需要對原有數據格式進行整理,涉及到政務、司法領域的敏感數據,更需要建立鏈接線上 和線下數據的可信通道防止數據錄入有誤,這帶來了較高的人力、物力成本。
(2)隱私計算技術對區塊鏈技術的幫助
隱私計算技術保障數據從產生、感知、發布、傳播到存儲、處理、使用、銷毀等全生命 周期過程中的隱私性,彌補區塊鏈技術的隱私保護能力,實現數據的「可用不可見」。通過 引入隱私計算技術,用戶的收支信息、住址信息等個人數均以密文的形式呈現,在平台進行 數據共享的過程中,既能防止數據泄露,又能夠保障用戶個人隱私的安全,有利於進一步打 破數據孤島效應,推動更大范圍內的多方數據協作。隱私計算技術可與區塊鏈技術形成技術組合,提升數據處理能力、擴大可應用范圍。隱 私計算技術通過對數據進行規范化處理,能夠提升數據處理、數據共享的效率,提升區塊鏈 的數據處理能力。此外,隱私計算技術+區塊鏈技術的技術組合能夠應用於缺乏中心化系統、 但又對敏感數據分享有強烈需求的合作領域,擴展區塊鏈技術的應用場景。
區塊鏈技術的應用是否隱私計算技術的剛需
(1)隱私計算技術的局限性
第一,數據共享缺乏安全檢驗,制約數據流通的可信性
數據共享的整個流程涉及到採集、傳輸、存儲、分析、發布、分賬等多個流程,隱私計 算主要是解決全流程的數據「可用不可見」的問題,但是難以保證數據來源可信和計算過程 可信。
從數據來源可信的角度來說,在數據採集的環節,數據內容本身可能不完整,數據的錄 入可能會存在失誤;在數據傳輸的環節,數據的傳輸可能會被其他的客戶端攻擊,導致數據 在傳輸的過程中泄漏;在數據的儲存環節,儲存數據的角色方有可能會篡改數據或者將數據 復制轉賣到黑市,這些都不會被隱私計算技術記錄。如果無法保證數據共享各方的身份得到 「可信驗證」,就有可能導致數據的隱私「名不副實」。從計算過程可信的角度來說,在數 據分析和發布的環節,數據的共享方有可能私自篡改數據的運行結果和發布內容,對最終數 據處理的結果進行造假。因此,一旦信息經過驗證並添加到隱私計算的環境中,很難發現數 據是否被篡改、被泄漏,很難防止不同時間點不同節點的數據造假的情況,在涉及到金融、政務、醫療、慈善等關鍵領域里,如果數據有誤則產生的一系列法律問題則難以追究。
第二,業務水平整體層次不齊,制約技術平台的擴展
當前,隱私計算的技術實現路徑主要分為三種:多方安全計算、聯邦學習、TEE 可信執行 環境。三種技術路徑存在各自的應用缺陷和問題,由於行業內不同公司對於技術的掌握能力 和研發能力有限,導致技術平台的實際應用范圍有限,可擴展能力不足。
多方安全計算盡管具有復雜高標準的密碼學知識,但其計算性能在實際應用的過程中存 在效率低的缺陷。隨著應用規模的擴大,採用合適的計算方案保證運算時延與參與方數量呈 現線性變化是目前各技術廠商面臨的一大挑戰。多方安全計算雖然能保證多方在數據融合計 算時候的隱私安全,但是在數據的訪問、控制、傳輸等環節,仍然需要匹配其他的技術手段 防止數據泄露、篡改。
聯邦學習技術目前在業內的應用通常以第三方平台為基礎模型,在基礎模型之上進行隱 私計算,這樣的基礎模型本身存在被開發者植入病毒的隱患。此外,聯邦學習的機制默認所 有的參與方都是可信方,無法規避某個參與方惡意提供虛假數據甚至病害數據,從而對最終 的訓練模型造成不可逆轉的危害。由於聯邦學習需要各個參與式節點進行計算,因此節點的 計算能力、網路連接狀態都將限制聯邦學習的通信效率。
TEE 可信執行環境在國內目前核心硬體技術掌握在英特爾、高通、ARM 等少數外國核心供 應商中,如果在關鍵領域從國外購買,則存在非常高的安全風險和應用風險。第三,數據共享缺乏確權機制,制約數據流通的應用性 隱私計算通過使用多方數據共同計算、產生成果,然而在實際合作的過程中,由於各個 數據共享方業務水平不同、數據質量不一導致在數據處理的每一個環節難以實現合理的確權。
按照常規的利益分配機制,擁有高質量數據、高成果貢獻率的數據擁有方理應從中獲取更多 的利潤,但是隱私計算僅考慮到數據的「可用不可見」,數據共享方難以從最終結果來判斷 誰的數據對於成果的貢獻最大,造成利益分配的不公平。如果缺乏合理的成果貢獻評估機制和利益分配機制,就會難以激勵數據所有者和其他數 據持有者進行合作。尤其是在不信任的多方合作的場景下,會更加增加合作的信任成本,使 得多方協作難以達成,制約數據流通的實際應用性。
(2)區塊鏈技術對隱私計算技術的幫助
區塊鏈技術通過數據流通的所有環節、所有參與者進行記錄,實現數據共享流程中的權 責分明,提升了數據流通的可信性。在數據傳輸的環節,區塊鏈記錄數據的提供者,確認數 據提供方身份的真實性和有效性,有利於數據確權,為公平可行的利益分配機制提供參考;在數據儲存的環節,區塊鏈保證數據的每一次修改都有跡可循,防止數據的惡意篡改。區塊 鏈技術可作為隱私計算技術的底層平台,保證了加密數據本身的真實有效性,提升了隱私計 算平台里數據流通的可信性,拓展隱私計算技術的應用范圍。
3. 結論
隱私計算技術和區塊鏈技術的融合是必然的趨勢。對於數據資產的流轉來講,沒有隱私 計算,不能解決數據本身的安全和隱私保護問題;沒有區塊鏈,不能解決數據的確權問題以 及在更大范圍內的數據網路協作問題。將區塊鏈和隱私計算二者結合起來,建設大規模數據 流通網路,在目前的實踐中成為有所共識的 探索 方向。
區塊鏈與隱私計算的結合會改變什麼?
1、形成大規模數據流通網路和數據要素市場
當前,數據流通存在三方面問題:數據擁有方的數據保護和數據確權難以實現;不同來 源數據的整合處理成本過高、缺乏統一標准;數據利益的分配機制不完善。
如前文所述,區塊鏈和隱私計算技術相結合,可以一方面解決隱私保護問題,一方面解 決數據確權和多方協作問題,從而建立大規模的數據流通網路。
在大規模數據流通網路建立的基礎上,真正意義上的數據要素市場才能夠形成,數據作 為生產要素的價值才能夠被充分發掘出來。
2、推動數據資產化的發展
所謂資產,是指由企業過去的交易或事項形成的,由企業擁有或者控制的,預期會給企 業帶來經濟利益的資源。
數據的資產化就是讓數據在市場上發現價值,能夠為企業創造新的經濟益。
大規模數據流通網路和數據要素市場的形成,將大大推動數據價值的發現、數據資產化 的發展。
從企業一側來看,企業的生產經營活動當中沉澱下來的數據會成為寶貴的資產。一方面, 對這些數據的分析和運用,將推動企業改善自身的業務;另一方面,與外部機構進行數據的 共享,能夠推動數據發揮出更大的價值,企業自身也將從中獲取更多收益。這會反過來進一 步推動企業的數字化轉型和對數據資產的管理。未來,對數據資產的盤點可能成為企業在資 產負債表、現金流量表、利潤表之外的「第四張表」。
數據資產化的發展,也會推動圍繞數據價值挖掘形成全新的服務體系。其中包括數據確 權、定價、交易等各個環節。上海 社會 科學院信息研究所副所長丁波濤將未來數據資產服務體系中的機構分成四類:
第一類提供中介服務,包括數據經紀人,還有數據代理。
第二類提供數據評估,由於數據市場信息不對稱或信息混亂,需要提供合規評估、數據 質量和數據價格的評估。
第三類提供價格咨詢,如提供法律、經濟咨詢或者是上市輔導等的咨詢服務企業。
第四類提供專業技術服務,包括數據開發、數據處理服務、數據交付服等。數據資產化的發展,帶來的將是人們認知的提升、生產效率的提高、生產要素的重組、 創新的產生、經濟的發展以及全 社會 整體福利的提升。
3、對現有業態的改變
區塊鏈與隱私計算的結合,將提升企業和個人分享數據、利用數據的積極性,進一步推 動打破「數據孤島」。其對現有業態的改變主要體現在以下幾個層面:
第一,這將帶來新的數據和 科技 變革。
首先,這將推動數據密態時代的到來。數據密態時代的核心,是數據流通使用方式的巨 大改變,數據將以密態形式在主體間流動和計算,顯著降低數據泄露的風險,並在合規前提 下支撐各種形態業務的發展。此前,數據被加密之後只能用來傳輸或者存儲,但是未來數據 在加密狀態下可以被計算。這將帶來一系列新的問題和挑戰,引發許多相關技術領域的連鎖 反應。
其二,這將重塑大數據產業。隨著數據流通的安全化,以往較為敏感的數據領域逐漸開 放。以政務數據為例,隱私計算使聯合政務、企業、銀行等多方數據建模和分析成為可能, 進一步釋放數據應用價值,創造了多樣化的應用機遇。
其三,人工智慧產業將獲得新一輪的發展。數據、演算法和算力是人工智慧發展的三要素。近幾年來,由於缺乏可用的數據,人工智慧的發展遭遇瓶頸。未來,5G 和物聯網的發展將使 得萬物互聯,數據量大幅增長。區塊鏈+隱私計算技術的應用,可以使得人工智慧利用海量數 據優化模型,真正邁向「智能化」。其四,這將為區塊鏈產業的發展帶來新的機遇。區塊鏈與隱私計算相結合,將拓展聯盟 鏈的節點數量,從而進一步擴大可協同利用的數據資源的范圍。
第二,在 科技 變革的基礎之上,區塊鏈與隱私計算相結合,將給許多傳統產業帶來變革。
在政務領域,一方面,可以實現政府不同部門之間的互聯互通及數據共享,從而促進政 府不同部門的協同,提高政府的效率以及決策質量,推動智慧城市的建設;另一方面,可以 促進政務數據與民間數據的雙向開放。政務數據向 社會 開放,可以為企業或學界所用,釋放 更多價值。民間的數據源向政府開放,可以提高政府在決策以及政務流程等方面的效率。
在金融領域,支付、徵信、信貸、證券資管等各個領域都會因之發生變化。總體來看, 主要是影響到金融的風控和營銷兩個方面。區塊鏈與隱私計算技術的結合,可以在符合法律 規定、不泄露各方原始數據的前提下,擴大數據來源,包括利用金融體系外部的互聯網數據, 實現多方數據共享,聯合建模,從而有效識別信用等級、降低多頭信貸、欺詐等風險,也有 助於信貸及保險等金融產品的精準定價;同樣,內外部多方數據的共享融合也有助於提高金融機構的反洗錢甄別能力。
在醫療領域,未來在疾病治療、葯物研究、醫療保險等多個領域,區塊鏈與隱私計算都 能助推醫療信息化建設,帶來巨大變革。在疾病治療和葯物研究方面,區塊鏈與隱私計算結 合,能夠促進更多的醫療數據被聯合起來進行分析和研究,從而為許多疾病的治療帶來新的 突破。在醫療保險方面,區塊鏈與隱私計算技術結合,主要是可以使得保險公司可以應用到 更多的數據,改善保險產品的設計、定價、營銷,甚至可以促進保險公司對客戶的 健康 管理 等。
區塊鏈與隱私計算技術相結合,目前應用的重點領域是政務、金融、醫療領域,但是未來其應用將不僅僅局限於這三個領域,還將在更多領域發揮作用。
第三,數據權利、利益將重新分配。
這可能是區塊鏈與隱私計算技術相結合所帶來的最為核心,也是最為深刻的,與每一個人 的切身利益都息息相關的變革。
首先,這涉及到每個產業鏈不同環節利益的重新分配。
前述在廣告營銷領域的應用落地為例,此前廣告營銷的利益分配主要是在廣告主與渠 道商之間。但是,未來應用區塊鏈和隱私計算技術,可以在更大范圍內進行數據協作,則要 解決廣告主、多個渠道方、消費者之間多方數據協作的問題,這其中就涉及到多方之間權責 的劃分、利益的重新分配。
其次,這還涉及到企業與個人之間利益的重新分配。
歐盟的 GDPR,美國的 CCPA 等法案中涉及用戶的一項重要權益即「portability,(可攜 帶權)」。即第三方應用不能封鎖個人數據,一旦個人有下載的訴求,APP 需要提供便利的 API 利於個人拷貝數據。美國公司已陸續為用戶提供 API,如果在這方面功能缺失,個人客戶 可以提出訴訟,而公司也將面臨巨額的罰款。在中國的《個人信息保護法》當中,也有相關的條款。《個人信息保護法》第四十五條規 定,「個人有權向個人信息處理者查閱、復制其個人信息」、「個人請求查閱、復制其個人信息 的,個人信息處理者應當及時提供。個人請求將個人信息轉移至其指定的個人信息處理者, 符合國家網信部門規定條件的,個人信息處理者應當提供轉移的途徑。」
目前,中國公司的區塊鏈+隱私計算 探索 主要集中在 To B 服務領域,但是區塊鏈是全球 化的商業,如果美國已經出現這樣的模式,中國大概率不會完全不受影響。伴隨著消費級軟硬體技術能力的提升,區塊鏈與隱私計算技術結合,會逐步對個人與機構 之間的數據服務進行變革。對於個人用戶而言,將有機會獲得自身隱私數據的完全掌控權, 並為數據業務過程中所涉及的數據隱私需求獲得更強的技術性保障。目前關於 To C 服務的相關問題,國內業界還在探討當中。
為什麼區塊鏈+隱私計算的應用尚未大規模普及?
第一,區塊鏈+隱私計算的落地應用,主要是在涉及需要多方數據協作的情況,目前實際需求尚未爆發。
從隱私計算技術發展的角度來看,目前隱私計算尚在落地初期,解決的主要是兩方之間 的數據協作問題,涉及到多方的場景還不多,因此很多時候還沒有體會到對區塊鏈+隱私計算 應用的需要。
從區塊鏈技術發展的角度來看,區塊鏈技術在許多領域的應用目前並非剛需。不少問題 可以應用區塊鏈解決,但是不用區塊鏈技術也能解決,而應用區塊鏈技術解決的成本更高。因此,目前區塊鏈項目的建設主要是政務部門和大型企業較為積極,因為政府和大型企業從 長遠發展的角度來考慮,可以做前瞻性的投資建設和技術布局,但是大多數商業機構需要衡 量投入與產出。
區塊鏈技術與隱私計算技術結合,主要是用於處理數據協作問題。從數據治理的角度來 看,目前大多數機構都在處理自身內部的數據治理問題,內部的數據體系梳理好之後,才涉 及到與外部進行數據協作,因此還需要時間。
第二,區塊鏈+隱私計算的落地應用較為復雜,涉及到新商業模式的創造、權責以及利益 的重新分配,因此需要的時間更長。
以在廣告營銷領域的應用落地為例,目前的大多數應用 都只是落地了隱私計算平台,主要涉及兩方數據協作,直接應用隱私計算技術,延續此前商 業應用即可。但是,如果引入區塊鏈技術,則要解決廣告主、渠道方、消費者之間多方數據 協作的問題,這其中可能涉及到多方之間權責的劃分、利益的重新分配,新商業模式的形成 需要時間進行 探索 。
應用的大規模普及,還需要解決哪些問題?
區塊鏈+隱私計算的應用在大規模鋪開之前,還需要具備三方面的條件:
第一,從外部環境來看,需要全 社會 整體的數字化水平的提高。 打個比方,區塊鏈+隱私 計算將來會形成數據流通的高速公路,但是路上要有足夠的車。目前全 社會 的數字化正在快 速推進當中,大多數機構都是正在進行自身內部的數據治理,他們需要先處理好自己的數據, 之後才能產生更多的與外部數據進行協作的需求,這還需要時間。
第二,從技術發展來看,技術成熟尚需投入。 區塊鏈+隱私計算技術的應用,實際上是犧 牲了數據流通的效率、提升了安全性,但是數據流通的效率也非常重要,未來需要在效率和 安全這兩個方面形成一定的平衡,安全要保障,足夠的效率也要滿足,這其中涉及到許多技 術的研發、行業標準的制定,技術產品化的發展和完善、技術成本的進一步降低,還需要時 間。
第三,還需要相關法律法規的完善,以及數據交易商業模式的形成。 不過,這一條件與 前兩個條件相比,其在目前的重要性相對次之。因為隨著需求的爆發、技術的完善,相關的法律法規以及商業模式就會隨之形成,這一條件在現階段並非限制區塊鏈與隱私計算技術落 地應用的最關鍵因素。
區塊鏈+隱私計算的應用中還蘊藏著哪些趨勢?
1、國產化的趨勢
區塊鏈+隱私計算的應用,涉及網路安全、數據安全,未來將成為新基建的重要組成部分。這是關乎網路空間主權、國家安全和未來發展利益的重要方面,因此這個領域的國產化是未來趨勢。
在區塊鏈+隱私計算技術應用的國產化當中,軟體的國產化是相對容易實現的。難點在於 硬體的國產化,其中最難的部分是晶元的國產化。
這一部分的發展,與信創領域的發展相關。信創,即信息技術應用創新產業,其是數據 安全、網路安全的基礎,也是新基建的重要組成部分。信創涉及到的行業包括 IT 基礎設施:CPU 晶元、伺服器、存儲、交換機、路由器、各種雲和相關服務內容;基礎軟體:資料庫、操 作系統、中間件;應用軟體:OA、 ERP、辦公軟體、政務應用、流版簽軟體;信息安全:邊 界安全產品、終端安全產品等。
在區塊鏈+隱私計算領域,目前已經有企業在嘗試產品的國產化。例如,前文提到的,螞 蟻鏈自研了密碼卡、隱私計算硬體以及自研可信上鏈晶元,同時還推出了摩斯隱私計算一體 機。創業公司如星雲 Clustar、融數聯智也在進行相關國產化硬體產品的研發。
2、軟硬體技術相結合、更多技術融合發展的趨勢
目前,在區塊鏈與隱私計算技術相結合的實踐中,也呈現出了軟硬體技術相結合、更多 技術融合發展的趨勢。這主要是緣於幾方面的需求:
第一,是加強數據安全性的需求。
隱私計算主要是解決數據在計算過程中不泄露的問題,區塊鏈主要是解決存證問題,二者結合僅能解決數據安全的一部分問題。數據從產生到計算再到消亡,會涉及採集、傳輸、 存儲、計算、銷毀等多個環節,其生命周期可能會有數十年之久,要真正保障數據安全需要 一個更加全方位的、體系化的解決方案,以使得每個環節上都有對應的技術體系保障數據安 全 在數據採集階段需要精心設計設備可信架構,在網路傳輸階段需要合理運用安全協議, 在存儲階段需要兼顧加密與性能,在數據計算階段需要靈活選擇可信執行環境與密態運算。除此以外,計算環境的可信與安全在防禦縱深建設上也至關重要。這些安全保障能力的技術 圖譜會涉及到可信計算、軟硬體供應鏈安全、隔離技術、網路與存儲的透明加密、密鑰管理、 可信執行環境等等。這其中每一個技術點都有軟硬體結合、多種技術融合發揮的空間。
第二,是提升計算性能的需求。
隱私計算的性能目前還比較低,在計算機單機、單機和單機之間、計算機集群之間這三 個層面上都存在。
在計算機單機上,隱私計算由於運用了密碼學技術,計算過程中涉及到很多加密解密的 步驟,這使得計算量以幾何級數增加。以全同態演算法為例,在通用晶元上密文運算的速度比 明文運算慢了 10 萬倍。這意味著,做同樣的運算,如果用全同態演算法,在 Intel 最新的 Icelake 處理器上,跑出來的效果等同於 Intel 的第一代 8086 處理器,直接回退了數十年。這使得全 同態加密在現實情況下就不具備可用性了。算力問題也是導致全同態演算法一直未得到廣泛應 用的根本原因。
在單機之間和計算機集群之間,會涉及到單機之間和集群之間的通信效率問題。一方面, 主流的隱私計算技術無論是聯邦學習還是多方安全計算,都有通信問題。密文膨脹、傳輸次 數膨脹,會導致單機之間網路傳輸效率成為隱私計算的瓶頸之一。另一方面,由於大多數隱 私計算的場景都是跨多方的,多方要通過公網進行通信,公網的帶寬與時延目前也是巨大的 鴻溝。
性能的問題,會隨著時間的推移越來越嚴重。2021 年,隱私計算的落地尚處於頗為早期 的階段,主要是在一些機構內部或者是兩方、三方之間應用,處理的數據量較小,這個問題 還不明顯。可是未來,多方數據交換需求的到來、5G 和物聯網的發展所帶來的數據量急劇增 大,最終導致的將是數據量爆發式的增長,這需要消耗大量的算力。
到那時,隱私計算的性 能將面臨巨大的挑戰。現在在硬體的創新方面正處於體系結構的黃金時代。這是因為,移動互聯網的飛速發展 使得應用場景發展很快,上層的軟體也發展很快,這使得在計算機底層進行支持的硬體甚至 晶元都需要隨之進行改變,進入了新一輪的創新周期。
而從區塊鏈與隱私計算結合的長遠發展來看,軟硬體結合、多技術融合,對隱私計算來 說,可以提升性能、安全性和計算效果;對區塊鏈來說,可以促使更多機構低成本加入聯盟 鏈,擴大聯盟鏈應用范圍。
END
編輯 | 領路元
來源 | 零一 財經 《區塊鏈+隱私計算一線實踐報告(2022)》