大數據隱私區塊鏈
① 區塊鏈與隱私計算的結合是必然趨勢嗎
區塊鏈與隱私計算的結合是必然趨勢嗎?
我們目前對這個問題的思考框架是:如果不與隱私計算技術結合,區塊鏈技術的應用是 否受到限制、無法向前發展;如果不與區塊鏈技術結合,隱私計算技術是否受到限制、無法 向前發展。如果二者對彼此都是剛需,那麼它們相結合的趨勢就是必然。
以下為我們對這個問題的思考:
1、隱私計算技術的應用是否區塊鏈技術的剛需
區塊鏈技術有巨大的優勢,但是如果沒有隱私計算技術,區塊鏈技術的應用會大大受到 限制,因為無法解決鏈上數據的隱私保護問題,這使得大量涉及敏感數據的場景不願應用區 塊鏈技術,比如金融和醫療領域。
(1)區塊鏈技術的局限性
第一,鏈上數據公開透明,數據的合規處理和隱私保護能力不足 區塊鏈作為分布式賬本系統,數據的公開透明盡管有利於存證、防篡改,但也存在數據 可輕易被復制、泄漏個人隱私的風險。區塊鏈在公有鏈上要求不同節點對交易和交易狀態進 行驗證、維護,形成共識,因此每個參與者都能擁有完整的數據備份,所有的交易數據公開 透明。如果知道某個參與者的賬戶,就很容易獲取其每一筆交易記錄,從而據此推斷其 社會 身份、財產狀況等。以消費場景為例,平台之間存在競爭壁壘,用戶也希望保留消費隱私, 因此區塊鏈缺乏對用戶流水、物流信息、營銷情況等與企業、個人隱私相關的數據缺乏保護 能力,往往導致數據擁有方不願意讓數據進入流通環節。在鏈上系統的交易不再受中心賬本的控制,用戶通過使用唯一的私鑰進行交易,交易過 程被加密且加密前數據很難還原,僅以私鑰作為交易憑證使得區塊鏈內的交易變得更加匿名 和不可控。在分布式賬本系統上,所有的轉賬以地址形式進行,一但發生了詐騙或者洗錢等 金融犯罪,即便可以公開查詢地址,但對資金追蹤的難度極大,且私鑰作為交易憑證很難證 明使用者的身份,因此許多企業、個人通過區塊鏈進行洗錢等違法交易,不利於數據的合規 處理和合法共享。
第二,數據處理能力不足,制約技術的進一步落地和商業化拓展 鏈上計算受限於網路共識的性能,使得鏈上交易難以具備實時性和高效率,區塊鏈智能 合約的計算能力需要擴展。以最大的加密支付系統比特幣為例,每秒鍾只能夠處理大約 3 到 7 筆交易5 ,且當前產生的交易的有效性受網路傳輸影響,往往需要等待 10 分鍾左右的記賬周 期才能讓網路上的節點共同知道交易內容。此外,如果鏈上有兩個及以上節點同時競爭到記賬權力,則還需要等待下一個記賬周期才能確認交易的准確性,最終由區塊最長、記賬內容 最多的鏈來完成確認。
完全去中心化的系統與現實中大部分現有體系的兼容性不足,缺乏鏈上鏈下協同、多業 務發展的系統和功能,制約區塊鏈技術的進一步落地。在區塊鏈的技術落地過程中,首先, 各行業本身具有成熟的體系,區塊鏈完全去中心化的形式不一定適合所有的領域和行業;其 次,區塊鏈的平台設計和實際運行成本巨大,其所具備的低效率和延遲性的交易缺陷非常明 顯,是否能夠彌補原系統更換的損失需要經過一定的精算和比較;此外,使用區塊鏈存儲數 據需要對原有數據格式進行整理,涉及到政務、司法領域的敏感數據,更需要建立鏈接線上 和線下數據的可信通道防止數據錄入有誤,這帶來了較高的人力、物力成本。
(2)隱私計算技術對區塊鏈技術的幫助
隱私計算技術保障數據從產生、感知、發布、傳播到存儲、處理、使用、銷毀等全生命 周期過程中的隱私性,彌補區塊鏈技術的隱私保護能力,實現數據的「可用不可見」。通過 引入隱私計算技術,用戶的收支信息、住址信息等個人數均以密文的形式呈現,在平台進行 數據共享的過程中,既能防止數據泄露,又能夠保障用戶個人隱私的安全,有利於進一步打 破數據孤島效應,推動更大范圍內的多方數據協作。隱私計算技術可與區塊鏈技術形成技術組合,提升數據處理能力、擴大可應用范圍。隱 私計算技術通過對數據進行規范化處理,能夠提升數據處理、數據共享的效率,提升區塊鏈 的數據處理能力。此外,隱私計算技術+區塊鏈技術的技術組合能夠應用於缺乏中心化系統、 但又對敏感數據分享有強烈需求的合作領域,擴展區塊鏈技術的應用場景。
區塊鏈技術的應用是否隱私計算技術的剛需
(1)隱私計算技術的局限性
第一,數據共享缺乏安全檢驗,制約數據流通的可信性
數據共享的整個流程涉及到採集、傳輸、存儲、分析、發布、分賬等多個流程,隱私計 算主要是解決全流程的數據「可用不可見」的問題,但是難以保證數據來源可信和計算過程 可信。
從數據來源可信的角度來說,在數據採集的環節,數據內容本身可能不完整,數據的錄 入可能會存在失誤;在數據傳輸的環節,數據的傳輸可能會被其他的客戶端攻擊,導致數據 在傳輸的過程中泄漏;在數據的儲存環節,儲存數據的角色方有可能會篡改數據或者將數據 復制轉賣到黑市,這些都不會被隱私計算技術記錄。如果無法保證數據共享各方的身份得到 「可信驗證」,就有可能導致數據的隱私「名不副實」。從計算過程可信的角度來說,在數 據分析和發布的環節,數據的共享方有可能私自篡改數據的運行結果和發布內容,對最終數 據處理的結果進行造假。因此,一旦信息經過驗證並添加到隱私計算的環境中,很難發現數 據是否被篡改、被泄漏,很難防止不同時間點不同節點的數據造假的情況,在涉及到金融、政務、醫療、慈善等關鍵領域里,如果數據有誤則產生的一系列法律問題則難以追究。
第二,業務水平整體層次不齊,制約技術平台的擴展
當前,隱私計算的技術實現路徑主要分為三種:多方安全計算、聯邦學習、TEE 可信執行 環境。三種技術路徑存在各自的應用缺陷和問題,由於行業內不同公司對於技術的掌握能力 和研發能力有限,導致技術平台的實際應用范圍有限,可擴展能力不足。
多方安全計算盡管具有復雜高標準的密碼學知識,但其計算性能在實際應用的過程中存 在效率低的缺陷。隨著應用規模的擴大,採用合適的計算方案保證運算時延與參與方數量呈 現線性變化是目前各技術廠商面臨的一大挑戰。多方安全計算雖然能保證多方在數據融合計 算時候的隱私安全,但是在數據的訪問、控制、傳輸等環節,仍然需要匹配其他的技術手段 防止數據泄露、篡改。
聯邦學習技術目前在業內的應用通常以第三方平台為基礎模型,在基礎模型之上進行隱 私計算,這樣的基礎模型本身存在被開發者植入病毒的隱患。此外,聯邦學習的機制默認所 有的參與方都是可信方,無法規避某個參與方惡意提供虛假數據甚至病害數據,從而對最終 的訓練模型造成不可逆轉的危害。由於聯邦學習需要各個參與式節點進行計算,因此節點的 計算能力、網路連接狀態都將限制聯邦學習的通信效率。
TEE 可信執行環境在國內目前核心硬體技術掌握在英特爾、高通、ARM 等少數外國核心供 應商中,如果在關鍵領域從國外購買,則存在非常高的安全風險和應用風險。第三,數據共享缺乏確權機制,制約數據流通的應用性 隱私計算通過使用多方數據共同計算、產生成果,然而在實際合作的過程中,由於各個 數據共享方業務水平不同、數據質量不一導致在數據處理的每一個環節難以實現合理的確權。
按照常規的利益分配機制,擁有高質量數據、高成果貢獻率的數據擁有方理應從中獲取更多 的利潤,但是隱私計算僅考慮到數據的「可用不可見」,數據共享方難以從最終結果來判斷 誰的數據對於成果的貢獻最大,造成利益分配的不公平。如果缺乏合理的成果貢獻評估機制和利益分配機制,就會難以激勵數據所有者和其他數 據持有者進行合作。尤其是在不信任的多方合作的場景下,會更加增加合作的信任成本,使 得多方協作難以達成,制約數據流通的實際應用性。
(2)區塊鏈技術對隱私計算技術的幫助
區塊鏈技術通過數據流通的所有環節、所有參與者進行記錄,實現數據共享流程中的權 責分明,提升了數據流通的可信性。在數據傳輸的環節,區塊鏈記錄數據的提供者,確認數 據提供方身份的真實性和有效性,有利於數據確權,為公平可行的利益分配機制提供參考;在數據儲存的環節,區塊鏈保證數據的每一次修改都有跡可循,防止數據的惡意篡改。區塊 鏈技術可作為隱私計算技術的底層平台,保證了加密數據本身的真實有效性,提升了隱私計 算平台里數據流通的可信性,拓展隱私計算技術的應用范圍。
3. 結論
隱私計算技術和區塊鏈技術的融合是必然的趨勢。對於數據資產的流轉來講,沒有隱私 計算,不能解決數據本身的安全和隱私保護問題;沒有區塊鏈,不能解決數據的確權問題以 及在更大范圍內的數據網路協作問題。將區塊鏈和隱私計算二者結合起來,建設大規模數據 流通網路,在目前的實踐中成為有所共識的 探索 方向。
區塊鏈與隱私計算的結合會改變什麼?
1、形成大規模數據流通網路和數據要素市場
當前,數據流通存在三方面問題:數據擁有方的數據保護和數據確權難以實現;不同來 源數據的整合處理成本過高、缺乏統一標准;數據利益的分配機制不完善。
如前文所述,區塊鏈和隱私計算技術相結合,可以一方面解決隱私保護問題,一方面解 決數據確權和多方協作問題,從而建立大規模的數據流通網路。
在大規模數據流通網路建立的基礎上,真正意義上的數據要素市場才能夠形成,數據作 為生產要素的價值才能夠被充分發掘出來。
2、推動數據資產化的發展
所謂資產,是指由企業過去的交易或事項形成的,由企業擁有或者控制的,預期會給企 業帶來經濟利益的資源。
數據的資產化就是讓數據在市場上發現價值,能夠為企業創造新的經濟益。
大規模數據流通網路和數據要素市場的形成,將大大推動數據價值的發現、數據資產化 的發展。
從企業一側來看,企業的生產經營活動當中沉澱下來的數據會成為寶貴的資產。一方面, 對這些數據的分析和運用,將推動企業改善自身的業務;另一方面,與外部機構進行數據的 共享,能夠推動數據發揮出更大的價值,企業自身也將從中獲取更多收益。這會反過來進一 步推動企業的數字化轉型和對數據資產的管理。未來,對數據資產的盤點可能成為企業在資 產負債表、現金流量表、利潤表之外的「第四張表」。
數據資產化的發展,也會推動圍繞數據價值挖掘形成全新的服務體系。其中包括數據確 權、定價、交易等各個環節。上海 社會 科學院信息研究所副所長丁波濤將未來數據資產服務體系中的機構分成四類:
第一類提供中介服務,包括數據經紀人,還有數據代理。
第二類提供數據評估,由於數據市場信息不對稱或信息混亂,需要提供合規評估、數據 質量和數據價格的評估。
第三類提供價格咨詢,如提供法律、經濟咨詢或者是上市輔導等的咨詢服務企業。
第四類提供專業技術服務,包括數據開發、數據處理服務、數據交付服等。數據資產化的發展,帶來的將是人們認知的提升、生產效率的提高、生產要素的重組、 創新的產生、經濟的發展以及全 社會 整體福利的提升。
3、對現有業態的改變
區塊鏈與隱私計算的結合,將提升企業和個人分享數據、利用數據的積極性,進一步推 動打破「數據孤島」。其對現有業態的改變主要體現在以下幾個層面:
第一,這將帶來新的數據和 科技 變革。
首先,這將推動數據密態時代的到來。數據密態時代的核心,是數據流通使用方式的巨 大改變,數據將以密態形式在主體間流動和計算,顯著降低數據泄露的風險,並在合規前提 下支撐各種形態業務的發展。此前,數據被加密之後只能用來傳輸或者存儲,但是未來數據 在加密狀態下可以被計算。這將帶來一系列新的問題和挑戰,引發許多相關技術領域的連鎖 反應。
其二,這將重塑大數據產業。隨著數據流通的安全化,以往較為敏感的數據領域逐漸開 放。以政務數據為例,隱私計算使聯合政務、企業、銀行等多方數據建模和分析成為可能, 進一步釋放數據應用價值,創造了多樣化的應用機遇。
其三,人工智慧產業將獲得新一輪的發展。數據、演算法和算力是人工智慧發展的三要素。近幾年來,由於缺乏可用的數據,人工智慧的發展遭遇瓶頸。未來,5G 和物聯網的發展將使 得萬物互聯,數據量大幅增長。區塊鏈+隱私計算技術的應用,可以使得人工智慧利用海量數 據優化模型,真正邁向「智能化」。其四,這將為區塊鏈產業的發展帶來新的機遇。區塊鏈與隱私計算相結合,將拓展聯盟 鏈的節點數量,從而進一步擴大可協同利用的數據資源的范圍。
第二,在 科技 變革的基礎之上,區塊鏈與隱私計算相結合,將給許多傳統產業帶來變革。
在政務領域,一方面,可以實現政府不同部門之間的互聯互通及數據共享,從而促進政 府不同部門的協同,提高政府的效率以及決策質量,推動智慧城市的建設;另一方面,可以 促進政務數據與民間數據的雙向開放。政務數據向 社會 開放,可以為企業或學界所用,釋放 更多價值。民間的數據源向政府開放,可以提高政府在決策以及政務流程等方面的效率。
在金融領域,支付、徵信、信貸、證券資管等各個領域都會因之發生變化。總體來看, 主要是影響到金融的風控和營銷兩個方面。區塊鏈與隱私計算技術的結合,可以在符合法律 規定、不泄露各方原始數據的前提下,擴大數據來源,包括利用金融體系外部的互聯網數據, 實現多方數據共享,聯合建模,從而有效識別信用等級、降低多頭信貸、欺詐等風險,也有 助於信貸及保險等金融產品的精準定價;同樣,內外部多方數據的共享融合也有助於提高金融機構的反洗錢甄別能力。
在醫療領域,未來在疾病治療、葯物研究、醫療保險等多個領域,區塊鏈與隱私計算都 能助推醫療信息化建設,帶來巨大變革。在疾病治療和葯物研究方面,區塊鏈與隱私計算結 合,能夠促進更多的醫療數據被聯合起來進行分析和研究,從而為許多疾病的治療帶來新的 突破。在醫療保險方面,區塊鏈與隱私計算技術結合,主要是可以使得保險公司可以應用到 更多的數據,改善保險產品的設計、定價、營銷,甚至可以促進保險公司對客戶的 健康 管理 等。
區塊鏈與隱私計算技術相結合,目前應用的重點領域是政務、金融、醫療領域,但是未來其應用將不僅僅局限於這三個領域,還將在更多領域發揮作用。
第三,數據權利、利益將重新分配。
這可能是區塊鏈與隱私計算技術相結合所帶來的最為核心,也是最為深刻的,與每一個人 的切身利益都息息相關的變革。
首先,這涉及到每個產業鏈不同環節利益的重新分配。
前述在廣告營銷領域的應用落地為例,此前廣告營銷的利益分配主要是在廣告主與渠 道商之間。但是,未來應用區塊鏈和隱私計算技術,可以在更大范圍內進行數據協作,則要 解決廣告主、多個渠道方、消費者之間多方數據協作的問題,這其中就涉及到多方之間權責 的劃分、利益的重新分配。
其次,這還涉及到企業與個人之間利益的重新分配。
歐盟的 GDPR,美國的 CCPA 等法案中涉及用戶的一項重要權益即「portability,(可攜 帶權)」。即第三方應用不能封鎖個人數據,一旦個人有下載的訴求,APP 需要提供便利的 API 利於個人拷貝數據。美國公司已陸續為用戶提供 API,如果在這方面功能缺失,個人客戶 可以提出訴訟,而公司也將面臨巨額的罰款。在中國的《個人信息保護法》當中,也有相關的條款。《個人信息保護法》第四十五條規 定,「個人有權向個人信息處理者查閱、復制其個人信息」、「個人請求查閱、復制其個人信息 的,個人信息處理者應當及時提供。個人請求將個人信息轉移至其指定的個人信息處理者, 符合國家網信部門規定條件的,個人信息處理者應當提供轉移的途徑。」
目前,中國公司的區塊鏈+隱私計算 探索 主要集中在 To B 服務領域,但是區塊鏈是全球 化的商業,如果美國已經出現這樣的模式,中國大概率不會完全不受影響。伴隨著消費級軟硬體技術能力的提升,區塊鏈與隱私計算技術結合,會逐步對個人與機構 之間的數據服務進行變革。對於個人用戶而言,將有機會獲得自身隱私數據的完全掌控權, 並為數據業務過程中所涉及的數據隱私需求獲得更強的技術性保障。目前關於 To C 服務的相關問題,國內業界還在探討當中。
為什麼區塊鏈+隱私計算的應用尚未大規模普及?
第一,區塊鏈+隱私計算的落地應用,主要是在涉及需要多方數據協作的情況,目前實際需求尚未爆發。
從隱私計算技術發展的角度來看,目前隱私計算尚在落地初期,解決的主要是兩方之間 的數據協作問題,涉及到多方的場景還不多,因此很多時候還沒有體會到對區塊鏈+隱私計算 應用的需要。
從區塊鏈技術發展的角度來看,區塊鏈技術在許多領域的應用目前並非剛需。不少問題 可以應用區塊鏈解決,但是不用區塊鏈技術也能解決,而應用區塊鏈技術解決的成本更高。因此,目前區塊鏈項目的建設主要是政務部門和大型企業較為積極,因為政府和大型企業從 長遠發展的角度來考慮,可以做前瞻性的投資建設和技術布局,但是大多數商業機構需要衡 量投入與產出。
區塊鏈技術與隱私計算技術結合,主要是用於處理數據協作問題。從數據治理的角度來 看,目前大多數機構都在處理自身內部的數據治理問題,內部的數據體系梳理好之後,才涉 及到與外部進行數據協作,因此還需要時間。
第二,區塊鏈+隱私計算的落地應用較為復雜,涉及到新商業模式的創造、權責以及利益 的重新分配,因此需要的時間更長。
以在廣告營銷領域的應用落地為例,目前的大多數應用 都只是落地了隱私計算平台,主要涉及兩方數據協作,直接應用隱私計算技術,延續此前商 業應用即可。但是,如果引入區塊鏈技術,則要解決廣告主、渠道方、消費者之間多方數據 協作的問題,這其中可能涉及到多方之間權責的劃分、利益的重新分配,新商業模式的形成 需要時間進行 探索 。
應用的大規模普及,還需要解決哪些問題?
區塊鏈+隱私計算的應用在大規模鋪開之前,還需要具備三方面的條件:
第一,從外部環境來看,需要全 社會 整體的數字化水平的提高。 打個比方,區塊鏈+隱私 計算將來會形成數據流通的高速公路,但是路上要有足夠的車。目前全 社會 的數字化正在快 速推進當中,大多數機構都是正在進行自身內部的數據治理,他們需要先處理好自己的數據, 之後才能產生更多的與外部數據進行協作的需求,這還需要時間。
第二,從技術發展來看,技術成熟尚需投入。 區塊鏈+隱私計算技術的應用,實際上是犧 牲了數據流通的效率、提升了安全性,但是數據流通的效率也非常重要,未來需要在效率和 安全這兩個方面形成一定的平衡,安全要保障,足夠的效率也要滿足,這其中涉及到許多技 術的研發、行業標準的制定,技術產品化的發展和完善、技術成本的進一步降低,還需要時 間。
第三,還需要相關法律法規的完善,以及數據交易商業模式的形成。 不過,這一條件與 前兩個條件相比,其在目前的重要性相對次之。因為隨著需求的爆發、技術的完善,相關的法律法規以及商業模式就會隨之形成,這一條件在現階段並非限制區塊鏈與隱私計算技術落 地應用的最關鍵因素。
區塊鏈+隱私計算的應用中還蘊藏著哪些趨勢?
1、國產化的趨勢
區塊鏈+隱私計算的應用,涉及網路安全、數據安全,未來將成為新基建的重要組成部分。這是關乎網路空間主權、國家安全和未來發展利益的重要方面,因此這個領域的國產化是未來趨勢。
在區塊鏈+隱私計算技術應用的國產化當中,軟體的國產化是相對容易實現的。難點在於 硬體的國產化,其中最難的部分是晶元的國產化。
這一部分的發展,與信創領域的發展相關。信創,即信息技術應用創新產業,其是數據 安全、網路安全的基礎,也是新基建的重要組成部分。信創涉及到的行業包括 IT 基礎設施:CPU 晶元、伺服器、存儲、交換機、路由器、各種雲和相關服務內容;基礎軟體:資料庫、操 作系統、中間件;應用軟體:OA、 ERP、辦公軟體、政務應用、流版簽軟體;信息安全:邊 界安全產品、終端安全產品等。
在區塊鏈+隱私計算領域,目前已經有企業在嘗試產品的國產化。例如,前文提到的,螞 蟻鏈自研了密碼卡、隱私計算硬體以及自研可信上鏈晶元,同時還推出了摩斯隱私計算一體 機。創業公司如星雲 Clustar、融數聯智也在進行相關國產化硬體產品的研發。
2、軟硬體技術相結合、更多技術融合發展的趨勢
目前,在區塊鏈與隱私計算技術相結合的實踐中,也呈現出了軟硬體技術相結合、更多 技術融合發展的趨勢。這主要是緣於幾方面的需求:
第一,是加強數據安全性的需求。
隱私計算主要是解決數據在計算過程中不泄露的問題,區塊鏈主要是解決存證問題,二者結合僅能解決數據安全的一部分問題。數據從產生到計算再到消亡,會涉及採集、傳輸、 存儲、計算、銷毀等多個環節,其生命周期可能會有數十年之久,要真正保障數據安全需要 一個更加全方位的、體系化的解決方案,以使得每個環節上都有對應的技術體系保障數據安 全 在數據採集階段需要精心設計設備可信架構,在網路傳輸階段需要合理運用安全協議, 在存儲階段需要兼顧加密與性能,在數據計算階段需要靈活選擇可信執行環境與密態運算。除此以外,計算環境的可信與安全在防禦縱深建設上也至關重要。這些安全保障能力的技術 圖譜會涉及到可信計算、軟硬體供應鏈安全、隔離技術、網路與存儲的透明加密、密鑰管理、 可信執行環境等等。這其中每一個技術點都有軟硬體結合、多種技術融合發揮的空間。
第二,是提升計算性能的需求。
隱私計算的性能目前還比較低,在計算機單機、單機和單機之間、計算機集群之間這三 個層面上都存在。
在計算機單機上,隱私計算由於運用了密碼學技術,計算過程中涉及到很多加密解密的 步驟,這使得計算量以幾何級數增加。以全同態演算法為例,在通用晶元上密文運算的速度比 明文運算慢了 10 萬倍。這意味著,做同樣的運算,如果用全同態演算法,在 Intel 最新的 Icelake 處理器上,跑出來的效果等同於 Intel 的第一代 8086 處理器,直接回退了數十年。這使得全 同態加密在現實情況下就不具備可用性了。算力問題也是導致全同態演算法一直未得到廣泛應 用的根本原因。
在單機之間和計算機集群之間,會涉及到單機之間和集群之間的通信效率問題。一方面, 主流的隱私計算技術無論是聯邦學習還是多方安全計算,都有通信問題。密文膨脹、傳輸次 數膨脹,會導致單機之間網路傳輸效率成為隱私計算的瓶頸之一。另一方面,由於大多數隱 私計算的場景都是跨多方的,多方要通過公網進行通信,公網的帶寬與時延目前也是巨大的 鴻溝。
性能的問題,會隨著時間的推移越來越嚴重。2021 年,隱私計算的落地尚處於頗為早期 的階段,主要是在一些機構內部或者是兩方、三方之間應用,處理的數據量較小,這個問題 還不明顯。可是未來,多方數據交換需求的到來、5G 和物聯網的發展所帶來的數據量急劇增 大,最終導致的將是數據量爆發式的增長,這需要消耗大量的算力。
到那時,隱私計算的性 能將面臨巨大的挑戰。現在在硬體的創新方面正處於體系結構的黃金時代。這是因為,移動互聯網的飛速發展 使得應用場景發展很快,上層的軟體也發展很快,這使得在計算機底層進行支持的硬體甚至 晶元都需要隨之進行改變,進入了新一輪的創新周期。
而從區塊鏈與隱私計算結合的長遠發展來看,軟硬體結合、多技術融合,對隱私計算來 說,可以提升性能、安全性和計算效果;對區塊鏈來說,可以促使更多機構低成本加入聯盟 鏈,擴大聯盟鏈應用范圍。
END
編輯 | 領路元
來源 | 零一 財經 《區塊鏈+隱私計算一線實踐報告(2022)》
② 區塊鏈會不會暴露我們的隱私
答案是當然不會。區塊鏈系統所要保存的東西也是有針對性的
③ 從區塊鏈和大數據的關系來看區塊鏈是什麼技術
從區塊鏈和大數據的關系來看,區塊鏈是一種分布式賬本技術。
區塊鏈技術是一種去中心化的分布式資料庫技術,可以記錄和存儲交易數據和信息,並在網路中進行共享和驗證。區塊鏈的核心是去中心化和去信任化,通過區塊鏈技術,不同的參與者可以進行可信的交互,可以保護交易數據和信息的安全性和隱私性。從大數據的角度來看,區塊鏈技術可以為大數據提供更加安全和可靠的存儲和共享方式。區塊鏈技術可以保證數據的完整性和不可篡改性,也可以保護數據的隱私性和安全性。這些特點使得區塊鏈技術在大數據領域有廣泛的應用前景,例如在金融、醫療、物流等領域,區塊鏈技術可以為大數據提供更加安全和可信的存儲、傳輸和分析方式,進而促進相關行業的發展和創新。
④ 為什麼說區塊鏈融合隱私計算是必然趨勢
從更大的版圖視角來看,要構建全面的隱私保護和治理體系,不僅需要融合區塊鏈、人工智慧、大數據、隱私計算等多種技術,還需要結合法律法規、監管治理等諸多策略。
在數字化 社會 中,大家對於數據生產要素有著更為強烈的需求,無論是用戶服務、業務營銷都需要使用大量的數據,尤其是在分布式協作的業務模式中,各方都希望數據能順暢地流通,並合理地體現數據價值。但與之相悖的是,數據孤島仍然存在,數據的粗放式使用仍待解決。
與此同時,合法合規成為大勢所趨。不論是在國內還是國際上,與個人信息保護、數據安全相關的法律法規一一出台,都對個人信息保護和數據安全等方面提出了更為嚴格的要求。這意味著,要確保數據的安全,也要尊重個人的隱私權益;在數據全生命周期上,要求實現全面規范,達成合規地流通。
以用戶為中心,在安全隱私前提下交換數據,並提供優質合規的服務, 是數字化 社會 建設的趨勢,需要在技術、業務模式、治理體繫上做出更多的創新。在分布式系統里引入隱私計算、發展合規的數據交易所等舉措,都體現出這種創新精神。
在隱私計算領域,區塊鏈、聯邦學習和安全多方計算已然成為三大關鍵核心技術,而且這三大技術之間互有側重,也有許多重合和聯系。
其中,從區塊鏈的角度出發,我們可以看到,一方面,區塊鏈上的數據需要採用隱私演算法來保護;另一方面,區塊鏈也可以成為隱私計算協作里的底座和樞紐:採用區塊鏈技術去記錄、追溯多方協作中的數據集、演算法模型、計算過程,並對最終結果進行評估和共識,持續優化協作效率。
此前幾年,我們在區塊鏈領域里 探索 應用落地時,常常是用區塊鏈為業務場景構建 「分布式賬本」。合規的應用都會對用戶和商戶進行KYC (Know Your Client) ,其中也存在不少待通過隱私計算等創新解法來解答的問題。
例如,身份信息是否可以向全聯盟鏈公布?在交易時,交易里的金額、相關方是否明文公開?每個人擁有的資產,是否可以被隨意查詢?人們的業務行為,是否會在未授權的情況下被濫用?
例如,在消費場景的積分卡券業務中,商家和商家之間通常不希望過多地暴露自己的經營狀況,比如有多少用戶開卡、充值,以及每天的流水等;個人用戶也不希望自己的消費行為被公開審視。
於是,在隱私問題尚未能徹底解決之前,我們通常採用的辦法是,引入核心權威機構參與共識和維護全賬本,而其他參與者則分層分片,以不同許可權的角色參與。但這樣,在一定程度上增加了系統的復雜性,影響了用戶體驗,同時,給區塊鏈應用的規模化和普及化帶來了挑戰。
目前,區塊鏈也普遍用於政務領域,比如在智慧城市管理以及各種民生應用中,為大家提供「一網通辦」的良好體驗,這就需要多領域、多地域、多部門的通力協作。我們可以看到,政務應用覆蓋面廣,角色眾多,數據存在多級別的敏感性和重要性。
區塊鏈可以作為分布式協作的底座,通過數據目錄、數據湖等方式,構建數據流轉的樞紐,同時引入隱私計算和全面的治理規則,界定數據的邊界,使數據在「不出庫」的同時,依舊可以實現身份認證、隱匿查詢、模型構建等能力。
從更大的版圖視角來看,要構建全面的隱私保護和治理體系,不僅需要融合區塊鏈、人工智慧、大數據、隱私計算等多種技術,還需要結合法律法規、監管治理等諸多策略。
區塊鏈隱私保護的場景豐富、角色眾多,流程多樣、數據立體,我們可以用 「雙循環」機製做進一步分析。
首先,我們從用戶端出發,尊重用戶對數據的知情權和控制權,把重要的數據交給用戶管理。
比如,驗證身份的「四要素」中,用戶的身份憑據和聯系方式通常來自政府和運營商這些權威機構,當用戶和某一個業務場景產生聯系時,他們並不需要提供全部的明文信息,只需要選擇性披露一些可驗證的憑據,用以代替明文。
基於分布式驗證機制即可實現多場景的驗身,證明自己的合法身份,此時業務提供方即使未獲得更多明文數據,但也不能拒絕服務。這就從根源上降低乃至杜絕了用戶關鍵隱私的泄露風險。
其次,在業務方,依舊可以採用諸如聯邦學習、安全多方計算等技術,對用戶已經授權的、合規採集的業務數據進行處理。
在用戶知情同意的前提下,在B端實現與合作夥伴之間的協同計算,數據不出庫,隱私不泄露,但實現諸如風控、營銷、廣告等對業務運營有重要價值的事務。最終實現業務效果的提升,在給業務方帶來效益的同時,也為用戶提供更優質的服務,或者權益上的回報。其整個價值體系是閉環的,合規的,可持續的。
例如物聯網和區塊鏈,在採集端,就需要給設備分配身份和標識,同時演算法上要做到去標識,防泄露;在用戶端,不但要提供個性化的服務,還要做到防止不必要的畫像,在做到可驗證用戶身份和資質的同時,又不能無端地追蹤用戶行為軌跡;最終,在提供優質服務、安全存儲用戶數據的時候,又要尊重用戶的意願,包括注銷退出的要求。
如此的「雙循環體系」,可能不止是在技術上要求設備、APP、後台服務進行迭代的重構,同時其商業模式、運營治理觀念等層面可能也會產生許多革新。整個鏈條會非常的長,需要做的工作也非常多,覆蓋晶元、硬體、網路、軟體、雲平台等廣袤的產業鏈。
目前來看,並沒有哪一個「包打天下」的單一技術,可以滿足「全鏈路」、「雙循環」的要求。那麼我們不妨把場景拆細一點,列舉得全面一些,組合一些技術和方案,先解決某個場景里的痛點問題。
事實上,我們在和眾多產業應用開發者交流時,他們更期望聚焦於具體的、迫在眉睫的問題,得到有針對性、可著手實施的解決方案,比如轉賬時隱匿金額、排名時不透露分數、投票時不泄露身份、KYC流程時不泄露視頻等等。
特定場景下的問題常常可以基於隱私計算的某一個演算法或一些演算法的組合,針對性的去應對。我們可以日拱一卒,解決一個又一個的場景化問題,對之前可能有紕漏的事情亡羊補牢,對可預見的剛性需求引入新技術新思路,創新性地去實現。這樣就逐步把數據安全的籬笆一點點紮起來,最終築就數據安全的長城。
分布式協作中,許多場景是跨機構的、跨網路的,無論是區塊鏈還是隱私計算,都會遇到要和其他合作方、其他平台互通的要求。我們看到信通院的相關工作組正在討論多項互聯互通規范,核心框架是要做到「節點互通」、「資源互通」、「演算法互通」。
節點互通要求網路和協議等基礎要素能互通。資源互通強調的是對資源的發布存儲、定址使用、治理審計 (含刪除數據、下線服務等) ,在這個層面上,大家都實現相對一致的視圖,提供通用的介面。演算法的互通則是非常細致和場景化的,每一種演算法都有自己的特點,其密碼學基礎、運算規則、協作流程都會不一樣,反過來對資源的管理資質和節點網路的拓撲,都會提出更多的要求。
在互通基礎上還有「自洽性」、「安全性」、「正確性」等要求,而且隨著領域的發展,不斷增加更多功能的「擴展性」也非常重要。之前,可能大家是在埋頭苦幹,積累技術和經驗,以後在落地時,則需要更注重介面和規范,開放心態,大家一起溝通共建,通過開源開放的方式尋求共識和共贏。
總結一下,關於隱私計算發展的幾個思考:
第三,實現標准化和普及化,以推動新技術和新理念的規模化落地。比如相關的行業標准、評測體系,這對幫助從業者理清發展道路、達成行業要求大有裨益。
區塊鏈發展這么多年,除了技術本身,其實最難的是 「怎麼解釋清楚啥是區塊鏈」 。希望在科普推廣方面,方興未艾的隱私計算能有更多的新思路,實現更好的效果。
回顧區塊鏈和隱私計算的熱潮,我們看到產業和 社會 在呼喚數據安全和隱私保護,行業也已經有了不少可用的研究成果,得到了一定的認可。展望可見的未來,我們將更加開放、務實,聚焦用戶和場景, 探索 規范的、規模化的、可持續的應用之路。
⑤ 濡備綍鍙戝睍鈥滃尯鍧楅摼+澶ф暟鎹鈥濈浉緇撳悎鐨勫緛淇℃妧鏈
榪欎釜琛屼笟鍙戝睍鍖呮嫭鏁版嵁鏀墮泦涓庢暣鍚堛佸尯鍧楅摼鎶鏈搴旂敤銆佸ぇ鏁版嵁鍒嗘瀽銆佷互鍙婂畨鍏ㄤ笌闅愮佷繚鎶ゃ
1銆佹暟鎹鏀墮泦涓庢暣鍚堬細鍒╃敤澶氱嶆暟鎹婧愶紝鍖呮嫭鍏寮鏁版嵁銆佷紒涓氭暟鎹鍜屼釜浜烘暟鎹錛岃繘琛屾湁鏁堟暣鍚堬紝涓哄緛淇℃彁渚涘叏闈銆佸噯紜鐨勪俊鎮鍩虹銆
2銆佸尯鍧楅摼鎶鏈搴旂敤錛氶氳繃鍖哄潡閾炬妧鏈紜淇濇暟鎹鐨勪笉鍙綃℃敼鎬у拰閫忔槑鎬э紝鎻愰珮寰佷俊淇℃伅鐨勪俊浠誨害鍜屽彲闈犳с
3銆佸ぇ鏁版嵁鍒嗘瀽錛氳繍鐢ㄥ厛榪涚殑澶ф暟鎹鍒嗘瀽鏂規硶錛屾寲鎺樻暟鎹闂寸殑鍏寵仈鍜屾ā寮忥紝涓哄緛淇¤瘎浼版彁渚涙洿娣卞叆鐨勬礊瀵熷拰棰勬祴銆
4銆佸畨鍏ㄤ笌闅愮佷繚鎶わ細鍦ㄦ暟鎹鏀墮泦銆佸瓨鍌ㄥ拰浣跨敤榪囩▼涓錛屼弗鏍奸伒瀹堢浉鍏蟲硶寰嬫硶瑙勶紝紜淇濈敤鎴烽殣縐佸拰鏁版嵁瀹夊叏銆
⑥ 區塊鏈如何帶來個人數據保護「革命」
區塊鏈如何帶來個人數據保護「革命」
美國媒體當地時間17日晚間披露說,深陷濫用個人隱私數據丑聞的英國「劍橋分析」公司原本計劃推出個人隱私數據存儲服務,並通過區塊鏈技術以加密貨幣的形式出售。個人信息加密貨幣化的概念其實並不新鮮,這個設想的關鍵在於每個人對個人信息的自主權。一些業內人士認為,區塊鏈技術可能帶來個人數據保護「革命」。
大數據時代,個人的數據被認為是黃金般珍貴。個人數據泄漏令人擔憂,但絕大部分人不可能因為害怕數據被收集而切斷與互聯網的聯系,而現階段有責任保管個人信息的企業、學校、酒店、社交網站等往往擔責不力。專家們認為,區塊鏈技術作為一種帶有加密、信任、點對點、難篡改等特徵的「中間件」,有望解決這個難題。
區塊鏈技術的出現令個人數據掌控權從互聯網公司轉移到用戶自己手中,使人人掌控自己的個人數據成為可能。通過它,用戶個人數據可以與個人數字身份證相關聯,用戶可以選擇數字身份證是匿名、化名或公開,還可以隨時隨地從任何設備訪問區塊鏈應用平台,控制他們的互聯網個人數據。
舉例來說,某人的身份證號碼在區塊鏈上的信息可能被轉換為一串密文,人臉圖像信息也被加密。他在酒店辦理入住時,僅需通過應用將身份證號碼密文發送給酒店,酒店將信息同區塊鏈應用上的加密數據比對,不需要知道他的任何真實信息,但只要加密數據比對結果相符就可以保證入住。
與此同時,大數據及人工智慧開發需要大量用戶數據資源,用戶可以將個人數據作為加密貨幣選擇性出售,同時收到一定回報。例如,如果電商需要用戶數據開發一個新應用,用戶可以選擇出售自己的購物歷史數據,但自己的地址賬號等信息仍可以保密。
在基因測序領域,區塊鏈應用已經開始讓傳統基因測序公司出售個人數據的「生財之道」受到挑戰。
近年來,面向普通人的基因測序服務備受追捧。以美國「23與我」染色體生物技術公司為例,消費者僅需不到100美元和幾口唾液就能得到家族遺傳信息,如果再付80美元,就能在原始數據基礎上獲得遺傳健康風險等方面的深度解析。然而這家企業並不滿足於測序服務收入,還將自己掌握的數百萬份客戶遺傳數據分類打包賣給制葯公司,僅2015年初出售的帕金森病數據就高達6000萬美元。不少類似的生物技術公司一邊從消費者獲得服務收入,一邊轉賣消費者的數據「掙雙份錢」。
今年2月,美國哈佛大學遺傳學家喬治·徹奇創建了「星雲基因」公司,希望通過區塊鏈技術打破這個格局。該公司計劃以低於1000美元的價格完成全基因組測序,這一費用由客戶承擔,作為回報,客戶在直觀了解自身遺傳信息對應疾病風險的同時,也擁有對測序數據的自主權。遺傳信息將通過區塊鏈技術保障安全,同時加密貨幣化,按照顧客的意願進行存儲出售等交易。
這家公司計劃推出一種「星雲幣」作為交易媒介,顧客可以將自己的遺傳信息兌換為「星雲幣」,也可以用「星雲幣」支付自己的測序費用,制葯公司可以用傳統貨幣購買「星雲幣」來獲得普通人的遺傳信息數據,整個交易買賣過程都通過區塊鏈平台完成,加密透明且安全。
徹奇表示,在綜合測序花費、遺傳信息保護、數據管理及基因組大數據處理等多方面因素後,區塊鏈技術讓更多人真正地「擁有」自己的遺傳信息。
⑦ 區塊鏈和大數據分析有什麼關系
區塊鏈和大數據存儲的關系如下:
一、數據安全:區塊鏈讓數據真正「放心」流動起來
區塊鏈以其可信任性、安全性和不可篡改性,讓更多數據被解放出來。用一個典型案例來說明,即區塊鏈是如何推進基因測序大數據產生的。區塊鏈測序可以利用私鑰限制訪問許可權,從而規避法律對個人獲取基因數據的限制問題,並且利用分布式計算資源,低成本完成測序服務。區塊鏈的安全性讓測序成為工業化的解決方案,實現了全球規模的測序,從而推進數據的海量增長。
二、數據開放共享:區塊鏈保障數據私密性
政府掌握著大量高密度、高價值數據,如醫療數據、人口數據等。政府數據開放是大勢所趨,將對整個經濟社會的發展產生不可估量的推動力。然而,數據開放的主要難點和挑戰是如何在保護個人隱私的情況下開放數據。基於區塊鏈的數據脫敏技術能保證數據私密性,為隱私保護下的數據開放提供了解決方案。數據脫敏技術主要是採用了哈希處理等加密演算法。例如,基於區塊鏈技術的英格碼系統(Enigma),在不訪問原始數據情況下運算數據,可以對數據的私密性進行保護,杜絕數據共享中的信息安全問題。例如,公司員工可放心地開放可訪問其工資信息的路徑,並共同計算出群內平均工資。每個參與者可得知其在該組中的相對地位,但對其他成員的薪酬一無所知。
數據HASH脫敏處理示意圖
三、數據存儲:區塊鏈是一種不可篡改的、全歷史的、強背書的資料庫存儲技術區塊鏈技術,通過網路中所有節點共同參與計算,互相驗證其信息的真偽以達成全網共識,可以說區塊鏈技術是一種特定資料庫技術。迄今為止我們的大數據還處於非常基礎的階段,基於全網共識為基礎的數據可信的區塊鏈數據,是不可篡改的、全歷史的、也使數據的質量獲得前所未有的強信任背書,也使資料庫的發展進入一個新時代。
四、數據分析:區塊鏈確保數據安全性
數據分析是實現數據價值的核心。在進行數據分析時,如何有效保護個人隱私和防止核心數據泄露,成為首要考慮的問題。例如,隨著指紋數據分析應用和基因數據檢測與分析手段的普及,越來越多的人擔心,一旦個人健康數據發生泄露,將可能導致嚴重後果。區塊鏈技術可以通過多簽名私鑰、加密技術、安全多方計算技術來防止這類情況的出現。當數據被哈希後放置在區塊鏈上,使用數字簽名技術,就能夠讓那些獲得授權的人們才可以對數據進行訪問。通過私鑰既保證數據私密性,又可以共享給授權研究機構。數據統一存儲在去中心化的區塊鏈上,在不訪問原始數據情況下進行數據分析,既可以對數據的私密性進行保護,又可以安全地提供給全球科研機構、醫生共享,作為全人類的基礎健康資料庫,對未來解決突發疾病、疑難疾病帶來極大的便利。
五、數據流通:區塊鏈保障數據相關權益
對於個人或機構有價值的數據資產,可以利用區塊鏈對其進行注冊,交易記錄是全網認可的、透明的、可追溯的,明確了大數據資產來源、所有權、使用權和流通路徑,對數據資產交易具有很大價值。
一方面,區塊鏈能夠破除中介拷貝數據威脅,有利於建立可信任的數據資產交易環境。數據春信是一種非常特殊的商品,與普通商品有著本質區別,主要是具有所有權不清晰、 「看過、復制即被擁有」等特徵,這也決定了使用傳統商品中介的交易方式無法滿足數據的共享、交換和交易。因為中介中心有條件、有能力復制和保存所有流經的扒州輪數據,這對數據生產者極不公平。這種威脅僅僅依靠承諾是無法消除的,而這種威脅的存在也成為阻礙數據流通巨大障礙。基於去中心化的區塊鏈,能夠破除中介中心拷貝數據的威脅,保障數據擁有者的合法權益。
另一方面,區塊鏈提供了可追溯路徑,能有效破解數據確權難題。區塊鏈通過網路中多個參與計算的節點來共同參與數據的計算和記錄,並且互相驗證其信息的有效,既可以進行信息防偽,又提供了可追溯路徑。把各個區塊的交易信息串起來,就形成了完整的交易明細清單,每筆交易來龍去脈非常清晰、透明。另外,當人們對某個區塊的「值」有疑問時,可方便地回溯歷史交易記錄進而判別該值是否正確,識別出該值是否已被篡改或記錄有誤。
一切在區塊鏈上有了保障,大數據自然會更加活躍起來。
幣盈中國平台上眾籌項目的代幣都是基於區塊鏈技跡橡術開發出來的,相關的信息都會記錄到區塊鏈上。