當(dāng)隱私計(jì)算的齒輪轉(zhuǎn)到“可算不可識(shí)”
近年來,相關(guān)法律法規(guī)的不斷完善讓一眾互聯(lián)網(wǎng)公司從對算法和數(shù)據(jù)使用的狂熱中清醒過來,開始逐漸重視個(gè)人隱私保護(hù)和消費(fèi)者數(shù)據(jù)安全的問題。剛剛發(fā)布的三季報(bào),很多互聯(lián)網(wǎng)公司都調(diào)整了自己發(fā)展的規(guī)劃,并對一些之前高談闊論的未來技術(shù)研發(fā)目標(biāo)做了不同程度的“遮掩”。
從2015年之后,不管是字節(jié)系的崛起,還是美團(tuán)在外賣業(yè)務(wù)上深耕,亦或是滴滴在出行領(lǐng)域的布局,包括國外的互聯(lián)網(wǎng)企業(yè)在內(nèi),絕大多數(shù)解決用戶數(shù)據(jù)安全的技術(shù),都是從數(shù)據(jù)的發(fā)生端入手,試圖通過隱藏用戶最關(guān)鍵的信息來達(dá)到保證用戶信息安全,同時(shí)還能繼續(xù)實(shí)現(xiàn)互聯(lián)網(wǎng)企業(yè)算法加大數(shù)據(jù)的運(yùn)營優(yōu)勢。
發(fā)展過程中,企業(yè)對用戶個(gè)人的隱私保護(hù)絕不是當(dāng)下才被喚醒的意識(shí)。曾經(jīng)有幾家國際互聯(lián)網(wǎng)巨頭公布過脫敏后的用戶數(shù)據(jù),希望行業(yè)能對這樣的用戶數(shù)據(jù)安全技術(shù)進(jìn)行標(biāo)準(zhǔn)化認(rèn)定,以此來確認(rèn)個(gè)人隱私保護(hù)可以用技術(shù)的手段予以解決。遺憾的是,這些信息無一例外都讓媒體或者行業(yè)專家找到了可以逐一對應(yīng)到用戶本身的特征,開放的高維關(guān)聯(lián)之下,絕對的匿名化宣告失敗,相關(guān)平臺(tái)“收獲”了一波市場質(zhì)疑:企業(yè)的算法機(jī)制或者技術(shù)手段到底會(huì)加劇隱私保護(hù)的風(fēng)險(xiǎn),還是會(huì)反哺數(shù)據(jù)安全,按照法律要求保護(hù)個(gè)人隱私?
某種意義上說,這已經(jīng)變成當(dāng)下困擾中國乃至世界互聯(lián)網(wǎng)平臺(tái)型公司的問題。在滿足匿名化要求的同時(shí),來提升數(shù)據(jù)要素應(yīng)用的能力,最終實(shí)現(xiàn)隱私保護(hù)和數(shù)據(jù)要素行業(yè)發(fā)展的平衡點(diǎn),難題的“正解”在哪里?
#01
數(shù)據(jù)和算法是命門
先了解一下“題面”。
隨著移動(dòng)互聯(lián)網(wǎng)的普及以及頭條系的崛起,以人工編輯為核心的傳統(tǒng)信息分發(fā)模式逐漸衰落,以算法為核心的智能分發(fā)模式興盛崛起。
當(dāng)前的各大平臺(tái),基于算法的傳播呈現(xiàn)出可計(jì)算的特質(zhì),后臺(tái)將每個(gè)用戶內(nèi)容消費(fèi)的行為數(shù)據(jù),比如用戶瀏覽時(shí)長、轉(zhuǎn)發(fā)、評(píng)論等,個(gè)體屬性數(shù)據(jù)以及社交關(guān)系數(shù)據(jù)進(jìn)行大數(shù)據(jù)的統(tǒng)計(jì)和分析,進(jìn)而挖掘用戶的愛好習(xí)慣和社交興趣網(wǎng)絡(luò),最終生成精準(zhǔn)的用戶畫像,向用戶推送最具個(gè)性化需求的信息、商品或者服務(wù)。
而平臺(tái)可以依據(jù)這樣的能力,獲取在精準(zhǔn)廣告、產(chǎn)品銷售以及服務(wù)推薦中的利益,從而建立自己的業(yè)務(wù)圈層。
一定程度上來說,算法推薦讓編輯篩選模式下的“人找信息”變?yōu)椤靶畔⒄胰恕保脩舫蔀榱怂惴軜?gòu)或程序編碼的價(jià)值落點(diǎn)。
通過算法和大數(shù)據(jù)的挖掘,很多互聯(lián)網(wǎng)平臺(tái)在最近兩年誕生了一系列新的商業(yè)模式,他們不光在滿足用戶信息需求上向前跨出了一大步,同時(shí)還能利用各種碎片化的服務(wù)和工具,幫助用戶實(shí)現(xiàn)以前所不能想象的互聯(lián)網(wǎng)服務(wù)。
尤其在互聯(lián)網(wǎng)信息超載時(shí)代,以大數(shù)據(jù)驅(qū)動(dòng)的智能算法推薦系統(tǒng)逐漸應(yīng)用到社會(huì)生活的各個(gè)領(lǐng)域。面對海量信息,智能算法會(huì)根據(jù)用戶的在線行為計(jì)算分析出個(gè)人的興趣愛好和行為趨向,從而幫助用戶做出自動(dòng)化決策。大量無序的、雜亂的數(shù)據(jù)存儲(chǔ)進(jìn)數(shù)據(jù)庫,積累、沉淀之后成為企業(yè)的信息資產(chǎn)和核心驅(qū)動(dòng)力。
然而,風(fēng)險(xiǎn)也如影隨形。從抖音侵犯用戶信息權(quán),到曠視科技等人臉識(shí)別公司被推至輿論焦點(diǎn),到智聯(lián)招聘用戶簡歷流向黑市,到知乎4天獲取3w+用戶信息,再到美團(tuán)被質(zhì)疑差異化定價(jià)“殺熟”客戶......經(jīng)濟(jì)利益的驅(qū)動(dòng)下,用戶個(gè)人信息在被各類主體競相挖掘和利用的同時(shí),因信息泄露引發(fā)的欺詐事件司空見慣、侵犯個(gè)人隱私的現(xiàn)象在多領(lǐng)域多平臺(tái)泛濫。
“善治病者必醫(yī)其受病之處,善救弊者,必塞其起弊之原”。在大數(shù)據(jù)應(yīng)用逐漸深入社會(huì)生產(chǎn)生活每一個(gè)“毛細(xì)血管”的今天,相關(guān)法律法規(guī)和監(jiān)管政策對個(gè)人隱私保護(hù)筑起安全墻,企業(yè)也應(yīng)積極采取相關(guān)措施,設(shè)置合規(guī)機(jī)制,注重技術(shù)安全升級(jí),從根本上避開那些不該觸碰的“雷”。
#02
“可用不可見”的失效
很長一段時(shí)間,各大互聯(lián)網(wǎng)公司都在積極探討合理合法,保護(hù)用戶隱私的數(shù)據(jù)使用方式。
隱私計(jì)算或者說是隱私保護(hù)計(jì)算,此前被視為從技術(shù)角度實(shí)現(xiàn)了數(shù)據(jù)流通與隱私保護(hù)之間的平衡的最優(yōu)解,即做到了數(shù)據(jù)的“可用不可見”,既實(shí)現(xiàn)了數(shù)據(jù)價(jià)值的流通與共享,又實(shí)現(xiàn)了數(shù)據(jù)的隱私保護(hù)。
很長一段時(shí)間,“可用不可見”被視為隱私計(jì)算的精髓。“不可見”指的從技術(shù)角度屏蔽了敏感信息和隱私數(shù)據(jù),為不可分享或者不能的數(shù)據(jù)加上一層安全的“防護(hù)罩”,以實(shí)現(xiàn)事實(shí)上對隱私數(shù)據(jù)的保護(hù),也就是不明文泄露、不直接明示。
從這一角度來說,“隱私計(jì)算”讓數(shù)據(jù)開放、共享、流通成為一種可能。但需要注意的是,“隱私計(jì)算”只解決了流通過程中的安全問題,在數(shù)據(jù)流通之前和之后的權(quán)屬和收益問題仍不明確,另外“隱私計(jì)算”技術(shù)產(chǎn)品的安全分級(jí)標(biāo)準(zhǔn)與行業(yè)信任共識(shí)也有待建立。
尤其是,通過密碼學(xué)或者是分布式機(jī)器學(xué)習(xí)加密碼的方式,來對于信息加密傳輸?shù)街行脑龠M(jìn)行解密,解密過程和加密過程全部在計(jì)算機(jī)系統(tǒng)內(nèi)完成,確實(shí)可以實(shí)現(xiàn)可用不可見,但實(shí)際處理過程中仍存在大量安全隱患,比如有的密文可以被反推出明文。
西方世界知名的網(wǎng)絡(luò)視頻平臺(tái)奈飛曾經(jīng)就保護(hù)用戶隱私做過一次算法的印證和比賽。當(dāng)時(shí)奈飛公布了一部分做了去標(biāo)識(shí)脫敏處理的用戶評(píng)分,結(jié)果被UTAustin的兩位研究者關(guān)聯(lián)到了相應(yīng)用戶的ID,并識(shí)別出了其中一些用戶身份。2010年 Netflix為此被罰款900萬美金。此前的2006年,為了學(xué)術(shù)研究,“是美國在線”(AOL)公開了一些做了去標(biāo)識(shí)和脫敏處理的匿名化的搜索記錄。但是《紐約時(shí)報(bào)》通過這些記錄,找到了真實(shí)世界中對應(yīng)的一個(gè)人。后來AOL遭到起訴,為此賠償了大概總額高達(dá)500萬美金的罰款。
這一過程中“可用不可見”帶來的匿名化實(shí)現(xiàn)主要表現(xiàn)在個(gè)人身份識(shí)別信息(PII)的泄露,和個(gè)人的屬性行為數(shù)據(jù)導(dǎo)致的個(gè)人身份泄露。由于某些個(gè)人屬性行為數(shù)據(jù)的獨(dú)特性,可以間接識(shí)別出特定自然人的身份。
也就是說,在此案例中,數(shù)據(jù)還是要從用戶自己持有的終端,例如手機(jī)上傳到網(wǎng)站或者機(jī)構(gòu)的服務(wù)器再進(jìn)行后續(xù)計(jì)算的操作,這一過程數(shù)據(jù)會(huì)在一個(gè)開放空間中存在,那么只要掌握足夠多的數(shù)據(jù),就可以跟脫敏后的數(shù)據(jù)進(jìn)行關(guān)聯(lián)來查找相關(guān)性,最終可能會(huì)通過各種算法找到真正能對應(yīng)的人。
如此看來,只要數(shù)據(jù)脫離了消費(fèi)者本身持有終端的掌控,就存在被泄露的風(fēng)險(xiǎn),而這點(diǎn)是可用不可見的理論無法彌補(bǔ)的。
#03
“可算不可識(shí)”更進(jìn)一步
那么有沒有真的能解決個(gè)人隱私安全,同時(shí)還能保證互聯(lián)網(wǎng)企業(yè)算法為基礎(chǔ)的業(yè)務(wù)模式繼續(xù)推行的方法?
11月26日,螞蟻集團(tuán)副總裁、螞蟻集團(tuán)安全隱私科技委員會(huì)主席韋韜在第七屆中國互聯(lián)網(wǎng)法治大會(huì)上提出,可以通過隱私計(jì)算技術(shù)達(dá)到“可算不可識(shí)”,這是實(shí)現(xiàn)個(gè)人隱私保護(hù)和數(shù)據(jù)要素行業(yè)發(fā)展平衡的關(guān)鍵。
根據(jù)他的想法,與“可用不可見”相比,“可算不可識(shí)”更進(jìn)一步。“首先要滿足匿名化的要求,不能夠識(shí)別到特定的自然人。另外,要可算,假如說數(shù)據(jù)完全沒有辦法計(jì)算,沒有辦法產(chǎn)生數(shù)據(jù)價(jià)值,那么這個(gè)數(shù)據(jù)要素行業(yè)也無法發(fā)展。”
因?yàn)椤翱捎貌豢梢姟边€是要把數(shù)據(jù)利用加密方式通過個(gè)人的終端傳遞到互聯(lián)網(wǎng)平臺(tái),再進(jìn)行后續(xù)的數(shù)據(jù)挖掘和算法處理,整個(gè)過程確實(shí)存在信息泄露的問題和風(fēng)險(xiǎn)。而“可算不可識(shí)”,整個(gè)過程并不傳輸數(shù)據(jù),只是通過加密性的算法調(diào)整,同時(shí)對符合標(biāo)準(zhǔn)的個(gè)人數(shù)據(jù)進(jìn)行分散式的計(jì)算,最終將計(jì)算結(jié)果傳遞到平臺(tái),而不是傳導(dǎo)隱私數(shù)據(jù)本身。
總體而言,“可用不可見”是關(guān)于數(shù)據(jù)如何處理的維度,而“可算不可識(shí)”則集中在數(shù)據(jù)無授權(quán)的情況下如何來保障個(gè)人信息隱私權(quán)益。
韋滔表示,在未來的實(shí)踐中,數(shù)據(jù)要素價(jià)值要實(shí)現(xiàn)“可算不可識(shí)”強(qiáng)依賴于安全的受控環(huán)境。這一環(huán)境中下,“可算不可識(shí)”要對數(shù)據(jù)的過程,結(jié)果和生命周期進(jìn)行掌控。這就要對所有可能產(chǎn)生數(shù)據(jù)關(guān)聯(lián)的通道進(jìn)行強(qiáng)管控:包括研發(fā)過程的中間數(shù)據(jù),可以通過如動(dòng)態(tài)匿名等方法防止重識(shí)別;另外在結(jié)果輸出的時(shí)候,要防止輸出結(jié)果由于精度過高,有機(jī)會(huì)導(dǎo)致原始屬性行為數(shù)據(jù)通過數(shù)據(jù)信息傳導(dǎo)導(dǎo)致個(gè)人身份的間接泄露。
安全的受控環(huán)境對“可算不可識(shí)”過程中數(shù)據(jù)的處理和輸出是否能夠嚴(yán)格按照規(guī)范或者共識(shí)來做管控提出了更高的要求。
而可信計(jì)算技術(shù)的成熟,給了實(shí)現(xiàn)“可算不可識(shí)”的底氣。這是隱私計(jì)算技術(shù)中的底層技術(shù),最初是由可信計(jì)算組(TCG)推動(dòng)和開發(fā)的技術(shù),可以在計(jì)算機(jī)啟動(dòng)時(shí)刻就開始進(jìn)行安全度量,而且有硬件可信模塊TPM/TCM以及軟硬件協(xié)同保障的完整的驗(yàn)證鏈。在國內(nèi)已得到了廣泛推廣,并成為等保四級(jí)的關(guān)鍵支撐技術(shù)。
在韋滔看來,將可信計(jì)算技術(shù)應(yīng)用在相對匿名化領(lǐng)域,是一個(gè)非常好的契合:它能夠提供運(yùn)行環(huán)境隔離,能夠把數(shù)據(jù)的存儲(chǔ)、傳輸和處理有效的和外部隔離,能夠支撐技術(shù)保障的遠(yuǎn)程驗(yàn)證能力,能夠使得數(shù)據(jù)的處理輸出管控機(jī)制可以遠(yuǎn)程驗(yàn)證和審計(jì),而且支持后期上鏈等操作。
可以說,可信技術(shù)加持下,“可算不可識(shí)”確實(shí)在個(gè)人隱私保護(hù)與平臺(tái)數(shù)據(jù)和算法發(fā)展之間找到了一個(gè)動(dòng)態(tài)的平衡。
而這很可能成為打動(dòng)國內(nèi)各家互聯(lián)網(wǎng)平臺(tái)未來積極轉(zhuǎn)型的關(guān)鍵。
畢竟只有保證安全與合規(guī),平臺(tái)發(fā)展才能健康可持續(xù)。
免責(zé)聲明:本網(wǎng)站所有文章僅作為資訊傳播使用,既不代表任何觀點(diǎn)導(dǎo)向,也不構(gòu)成任何投資建議。】
猜你喜歡
APEC中小企業(yè)信息化促進(jìn)中心報(bào)告:“平臺(tái)+SaaS模式”助力服務(wù)業(yè)撬動(dòng)百億級(jí)消費(fèi)新市場
互聯(lián)網(wǎng)平臺(tái)為中小服務(wù)業(yè)提供的數(shù)字技術(shù)能力,正在從工具數(shù)字化升級(jí)為信用數(shù)字化。大數(shù)據(jù)時(shí)代的新命題:誰在滿足中國企業(yè)的實(shí)時(shí)性需求?
從540億元到1286億元——這是中國通信標(biāo)準(zhǔn)化協(xié)會(huì)大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進(jìn)委員會(huì)在2023年做出的一份預(yù)測報(bào)告。報(bào)告指出,未來五年,中國數(shù)據(jù)庫行業(yè)在未來五年會(huì)從一個(gè)百億級(jí)市場跨越成為千億級(jí)市場。研發(fā)費(fèi)用超調(diào)整后凈利潤,BOSS直聘為何如此注重研發(fā)?
?在線招聘平臺(tái)有多重視研發(fā)?看看BOSS直聘2022年財(cái)報(bào)就知道了。BOSS直聘再次被曝“情色招聘”,女大學(xué)生表示不敢反抗
此次事件再次引起風(fēng)波,多數(shù)網(wǎng)友質(zhì)疑Boss直聘在安全審核上存在漏洞。新橙優(yōu)品收取高額服務(wù)費(fèi)利率達(dá)36%,主體公司1.2億股權(quán)多次被凍結(jié)
互聯(lián)網(wǎng)平臺(tái)新橙優(yōu)品實(shí)際借款利率和合同利率相差甚遠(yuǎn)。橙心優(yōu)選、美團(tuán)優(yōu)選、京喜相繼裁員,社區(qū)團(tuán)購開始大撤退了?
對于互聯(lián)網(wǎng)巨頭們來說,社區(qū)團(tuán)購不應(yīng)該成為它們尋求新增長的目標(biāo)。
數(shù)科社
共138篇文章
關(guān)注數(shù)字科技行業(yè)大小事,多角度洞察數(shù)字科技行業(yè)熱點(diǎn),同時(shí)還建立媒體、公關(guān)、市場交流社群,打造圈內(nèi)人士聚集陣地。
最近更新文章
-
在愛奇藝上追《仙劍四》,總共分幾步?
2024-02-07愛奇藝 -
2024年了,巨頭還是放不下社區(qū)團(tuán)購
2024-01-04社區(qū)團(tuán)購