國內(nèi)外“健康碼”區(qū)別在哪里?具有隱私保護的疫情追蹤技術(shù)框架
- 來源: 中國網(wǎng) 2020-04-21 16:14:13
當?shù)貢r間2020年4月10日,蘋果與谷歌宣布將聯(lián)手推出一項方案,利用藍牙技術(shù)幫助政府和衛(wèi)生機構(gòu)減緩病毒蔓延,這項方案也被國內(nèi)媒體解讀為歐美版“健康碼”。對于“健康碼”這個概念,相信在國內(nèi)的大家已經(jīng)很熟悉了,疫情期間成為了防控工作的一個有效工具。當歐美版這個“健康碼”新聞出來的時候,我們第一時間也關(guān)注到了這個新聞,第一反應是美國的互聯(lián)網(wǎng)公司終于“抄作業(yè)”了。不過從我們對蘋果和谷歌的技術(shù)細節(jié)進行深入了解之后,我們發(fā)現(xiàn)這個歐美版的“健康碼”并不是直接抄作業(yè),而是根據(jù)歐美國家的國情做了很不一樣的設(shè)計,本文也將通過分析這項技術(shù)方案的設(shè)計原則來講解歐美版的“健康碼”到底哪里不一樣。
筆者注:本文的技術(shù)分析基于蘋果和谷歌官方技術(shù)文檔,以及開源項目。DP-3T (Decentralized Privacy-Preserving Proximity Tracing)開源項目跟蘋果和谷歌沒有直接聯(lián)系,DP-3T是由一群歐洲的科學家所發(fā)起的疫情追蹤開放式協(xié)議,不過DP-3T所倡導的大部分設(shè)計思想已被蘋果和谷歌采納,因此本文的大部分內(nèi)容都來源于DP-3T開源項目的白皮書。
國內(nèi)版“健康碼”
首先讓我們來看看國內(nèi)目前健康碼大體的一個技術(shù)架構(gòu)。根據(jù)我們對所見到的健康碼分析研究,我們認為國內(nèi)健康碼大多采取的是中心化的大數(shù)據(jù)收集和分析模式,其具備以下幾個特點:
中心化存儲所有用戶的行程和身份信息,方便統(tǒng)一進行大數(shù)據(jù)分析和調(diào)控。
沒有確診的用戶數(shù)據(jù)也會上傳,確保出現(xiàn)疫情的時候能夠快速通知到密切接觸人群。
收集的用戶信息包含了身份信息,行程信息等敏感數(shù)據(jù),方便進行數(shù)據(jù)關(guān)聯(lián)分析。
數(shù)據(jù)生命周期不太明確,超過一定天數(shù)的數(shù)據(jù)是否刪除掉沒有統(tǒng)一標準。
基于以上幾個特點,國內(nèi)的健康碼實行起來可以達到高效快速甄別密切接觸人群的目的,不過一定程度上用戶數(shù)據(jù)的隱私?jīng)]有徹底的保護,數(shù)據(jù)被濫用的可能性也存在。那么,讓我們看看國外是怎么設(shè)計的吧。
歐美版“健康碼”
設(shè)計目標
由于歐美國家的對于數(shù)據(jù)隱私保護上有很強的監(jiān)管,因此在設(shè)計疫情監(jiān)控方案的時候,需要充分考慮到數(shù)據(jù)隱私保護的影響。同時,歐美民眾天然對政府和大型企業(yè)缺乏信任,過度中心化的架構(gòu)在做疫情監(jiān)控上也會有不少主力,因此谷歌和蘋果在提出他們的疫情監(jiān)控方案時候,在同時滿足能夠快速確定密切接觸人群的同時,需要滿足一下幾點數(shù)據(jù)隱私保護要求:
最小化收集的數(shù)據(jù)量。疾控部門應該盡可能的減少對數(shù)據(jù)收集的要求,同時確保數(shù)據(jù)匿名化,也就是脫敏。數(shù)據(jù)只保留能夠快速追蹤密切接觸人群的最必要部分,任何機構(gòu)都沒法從這個數(shù)據(jù)里面獲取敏感個人信息。
不上傳沒有確診用戶數(shù)據(jù)。用戶在沒有確診的時候,在沒有征得用戶授權(quán)之前,數(shù)據(jù)不能上傳到疾控部門那里,數(shù)據(jù)會一直留在用戶自己的手機里面。
過期數(shù)據(jù)定期刪除。所有數(shù)據(jù)應該有一個固定的過期時間,超過這個時間數(shù)據(jù)應該刪除,進一步降低數(shù)據(jù)泄露的風險。
盡可能杜絕數(shù)據(jù)濫用。因為收集的數(shù)據(jù)量是極少的,而且在發(fā)送給后端之前已經(jīng)進行了匿名化處理,數(shù)據(jù)被大規(guī)模濫用的可能性也會降到最低。
基于上述數(shù)據(jù)隱私保護要求,我們來看看歐美版的“健康碼”,是如何具體設(shè)計的。
技術(shù)細節(jié)
簡單來講,歐美版的“健康碼”采用藍牙的BLE(Bluetooth Low Energy)廣播技術(shù),這項技術(shù)可以讓設(shè)備通過低功耗藍牙協(xié)議,向周圍的近距離其他藍牙設(shè)備進行廣播信息。由于目前智能手機基本具備藍牙功能,因此這個技術(shù)方案設(shè)計了一個在近距離接觸其他設(shè)備時候的信息收集方式,讓我們來看看是他們怎么做的。
首先,每個設(shè)備都需要生成Ephemeral IDs(臨時身份標示符)。EphID生成是依賴某種密碼學算法,因此需要一個私鑰SK。這個私鑰為了確保安全,是需要每天進行更換,當天的私鑰是根據(jù)前一天的私鑰的某種哈希值而生成:
另外為了進一步確保EphID的匿名性,該設(shè)計要求每天需要生成若干個新的EphIDs,根據(jù)相應的時間間隔進行輪換。這個輪換的時間間隔是可以按照分鐘進行配置,假如是30分鐘,那么每天需要生成48個EphIDs以供輪換。生成EphIDs的算法如下:
PRF是個偽隨機函數(shù)(例如:HMAC-SHA256),“broadcast key”是個固定公開的字符串,PRG是一個流加密函數(shù)(例如:AES CTR模式)產(chǎn)生n個16 bytes的EphIDs。然后設(shè)備可以將這個生成的n個EphIDs隨機打亂順序,然后依次進行使用。這些生成的EphIDs都會存在設(shè)備本地,以供后續(xù)使用。
當設(shè)備有了這些EphID來表示自己的身份之后,會在設(shè)備開啟過程中持續(xù)向周圍安裝了同樣服務的設(shè)備廣播自己的EphID,因此這些設(shè)備在運行過程中都會存儲除了自己的 EphID之外的,收到的其他人的EphID,以及一些包含了收到時間的輔助信息。這些設(shè)備本地會有一個數(shù)據(jù)過期時間的配置,例如14天,超過這個時間窗口的數(shù)據(jù)會被自動清除。我們可以算出來,如果一個人每天接觸100個人,每個人每天有100個EphIDs,14天窗口內(nèi),可能需要存儲140k個EphID,EphID的存儲代價是32bytes,因此總體數(shù)據(jù)量是 4.2 MB,這是一個非常小的數(shù)據(jù)量了。
那么,當一個患者確診之后的流程又是怎樣的呢,我們可以參考上圖:
1.患者主動或者被動(根據(jù)所在國政策)上傳具有傳染性第一天的私鑰信息到后端服務器。這個后端服務器可以是互聯(lián)網(wǎng)公司的云,也可以是政府機構(gòu)的機房。
2.后端服務器在收到信息之后會廣播確診患者的私鑰信息,給所有使用該服務器的設(shè)備。這種廣播可以是通過推送的方式進行,也可以是手機設(shè)備通過定期輪詢抓取的方式進行。
3.手機收到相關(guān)患者私鑰信息之后,會在本地進行一些計算,以確認感染風險,如果感染風險高于閾值,會觸發(fā)手機報警。
4.對于高于風險閾值的密切接觸者,可以選擇將自己與患者的接觸信息,包括次數(shù),相對時間等脫敏后的匿名數(shù)據(jù),上傳給疾控部門或者流行病學家。這種上傳可以是定期批量上傳,以節(jié)省手機的資源消耗。當然很重要的一點是,用戶也可以選擇不上傳。
5.確診患者在確保已完成私鑰上傳之后,需要重新隨機生成一個全新的私鑰,這樣的話確保之后的隱私不會被侵犯。
根據(jù)以上的確診患者的數(shù)據(jù)上報流程,我們可以總結(jié)這套設(shè)計方案有以下幾個特點:
后端服務器扮演的是一個通信媒介的作用,本身不做大規(guī)模的數(shù)據(jù)存儲和分析。這樣就算是后端服務器被黑或者被濫用,也可以將隱私泄露的風險降到最低。
對于是否要分享自己的信息給疾控中心相關(guān)人員,用戶有自己的選擇權(quán)。對于不想共享這部分數(shù)據(jù)的用戶,可以在自己的手機上關(guān)閉。
疾控中心收到的所有用戶分享的數(shù)據(jù)全部匿名化脫敏處理,而且數(shù)據(jù)量非常有限。因此無法從收到的數(shù)據(jù)里面探知具體的位置信息,真實身份信息等等。
兩種“健康碼”比較
從上面我們對于兩種“健康碼”技術(shù)架構(gòu)的分析來看,歐美版的“健康碼”在隱私保護上的確有下足功夫,具體可以表現(xiàn)為以下幾個優(yōu)勢:
數(shù)據(jù)收集量很小,每個人每天的數(shù)據(jù)量<1MB。
無敏感數(shù)據(jù)收集,數(shù)據(jù)匿名化處理,用密碼學方法保證隱私性。
超過一定時間的數(shù)據(jù)會被清除。
未確診患者數(shù)據(jù)無需上傳,用戶在數(shù)據(jù)上傳上有選擇權(quán)。
去中心化架構(gòu)為主,中心化服務器只作為通信媒介。
不過,從我們對實際運行情況了解來看,這套方案在現(xiàn)實推廣中也會遇到不少問題,總結(jié)來說我們認為會有以下幾個劣勢:
設(shè)備如果未開啟藍牙、藍牙功能缺失或者遇到手機沒有電,這部分工作就完全無法進行。
藍牙傳輸協(xié)議的安全性有待商榷,已知已有多種針對藍牙傳輸協(xié)議的安全攻擊。
在人口密集區(qū)域,這套廣播協(xié)議對設(shè)備電量損耗和實際傳輸成功效率都會有不少影響。
如果很大一部分用戶不積極主動上傳數(shù)據(jù)給疾控部門,疫情防控工作效率會大打折扣。
如果被不懷好意的人利用這套協(xié)議惡意提交錯誤數(shù)據(jù),比如提交錯誤的接觸數(shù)據(jù)等,會造成一定程度的錯誤判斷。
所以,具體運行過程中這套協(xié)議是否能夠有效,非常取決于所在地的國情,我們將繼續(xù)觀察這套技術(shù)協(xié)議在落地過程中的情況。
【免責聲明】
1、凡本網(wǎng)注明出處非(巨潮財經(jīng)網(wǎng))的作品,均轉(zhuǎn)載于自其它媒體,并不代表本網(wǎng)贊同其觀點和對其真實性負責,目的在于信息的傳遞,本網(wǎng)不承擔稿件侵權(quán)行為的連帶責任,如對稿件有質(zhì)疑請與本網(wǎng)客服聯(lián)系。
2、刊發(fā)此文目的在于傳遞更多信息,文章內(nèi)容僅供參考,不構(gòu)成投資建議,投資者據(jù)此操作,風險自擔。
3、如涉及作品內(nèi)容、版權(quán)等其它問題,請在15日內(nèi)聯(lián)系本網(wǎng)客服。
-
國內(nèi)外“健康碼”區(qū)別在哪里?具有隱私保護的疫情追蹤技術(shù)框架
當?shù)貢r間2020年4月10日,蘋果與谷歌宣布將聯(lián)手推出一項方案,利用藍牙技術(shù)幫助政府和衛(wèi)生機構(gòu)減緩病毒蔓延,這項方案也被國內(nèi)...
2020-04-21 16:14:13
-
迄今最像地球的系外行星或出現(xiàn) 有望供生命繁衍生息
美國國家航空航天局(NASA)的系外行星獵手開普勒太空望遠鏡已于2018年光榮退役,但其留下的科學遺產(chǎn)并未煙消云散。據(jù)美國太空網(wǎng)...
2020-04-17 15:55:12
-
不一樣的高校云課堂 確保在線學習質(zhì)量
3 7萬場次課程、逾102萬人次上課師生、170萬小時授課時長、超過95%的課堂出勤率,這是清華大學開展線上教學的首月報告單。在...
2020-04-15 16:55:29
-
數(shù)字經(jīng)濟打開就業(yè)“新天地” 共享員工企業(yè)共享
春天來了,就業(yè)市場也開始加速解凍。近日,26歲的龔飛和弟弟在貴州銅仁老家滯留數(shù)十天后,在家門口成了同事。兄弟倆現(xiàn)在都是...
2020-04-15 16:52:37
-
永久性視力損傷或有望恢復 科學家首次在小鼠模型中成功實現(xiàn)
利用先進的基因編輯技術(shù),我國科學家在治療神經(jīng)性疾病的基礎(chǔ)研究方面,取得重要進展。首次在小鼠模型上,成功恢復永久性視力...
2020-04-14 16:43:33
- 優(yōu)質(zhì)內(nèi)容成短視頻行業(yè)競爭關(guān)鍵 好看視頻10億獎金扶持原創(chuàng)作者 頒發(fā)年度大獎
- 運用計算型潛望原理 數(shù)碼相機就能“看見”隱藏物體 探測隱藏的物體和敵人
- 新型交通制式:動車與地鐵“混血” 國產(chǎn)首個市域動車組上線運營
- “回家地圖”:2019年春運護航服務啟動 騎行返鄉(xiāng)可定位免費維修點
- 打游戲也輸了!新款“阿爾法”擊敗人類玩家 取得壓倒性勝利
- 我國學者研究“多節(jié)點量子網(wǎng)絡”取得基礎(chǔ)性突破 拓展節(jié)點數(shù)目
- 160公里時速磁浮列車將在商業(yè)線進行提速測試
- 科技創(chuàng)新讓生活更精彩 營養(yǎng)美食可打印
- 人工智能將給“尋醫(yī)問診”帶來哪些改變 機器人為居家養(yǎng)老、個人護理服務
- 競爭者來了?英國電信“官宣”入華,移動、聯(lián)通、電信該緊張嗎 用戶選擇多樣化