當心「讚」字揭你底?! 數位痕跡讓你成為透明人

英國劍橋大學研究人員在《美國國家科學院院刊》雜誌發表的一項最新研究表明,對臉書(Facebook)網站用戶的「讚」(Like)資訊進行自動分析,即可非常準確地推斷出該用戶的種族、年齡、智商、性別、個性、物質濫用和政治觀點等。

大陸新聞中心/綜合報導

英國劍橋大學研究人員在《美國國家科學院院刊》雜誌發表的一項最新研究表明,對臉書(Facebook)網站用戶的『讚』(Like)資訊進行自動分析,即可非常準確地推斷出該用戶的種族、年齡、智商、性別、個性、物質濫用和政治觀點等。而『讚』資訊作為缺省值目前是公開的。

根據科技日報報導,在這項研究中,研究人員將臉書的『讚』按鈕作為數字記錄的『通用類別』,這有點類似於網頁搜索查詢和瀏覽歷史。研究表明,這種技術可用於提取幾乎每個定期在線網民的敏感資訊。

在微軟劍橋研究院的合作下,英國劍橋大學心理測試中心的研究人員對58000多名美國臉書用戶的資料集進行了分析,這些用戶透過『我的個性』應用程式自願提供其個人喜好、人口概況和心理測試結果。這些用戶選擇性提供資料,並同意將記錄的個人資訊用於分析。

研究人員創建的統計模型只需單獨使用臉書的『讚』資訊就能預測出個人的詳細情況。模型預測男性性別的準確性為88%,區分非裔美國人和白種美國人的準確率為95%,共和黨人和民主黨人的區分度達到85%,基督徒和穆斯林的準確分類率為82%,在關係狀態和物質濫用方面的預測精度也相當高,介於65%至73%之間。

但是,很少有用戶會點擊『讚』按鈕來明確揭示某些屬性。例如,低於5%的同性戀用戶會對『同性婚姻』這樣明顯的個人屬性稱『讚』。準確的預測結果取決於『推斷』,即聚合大量資訊量較少但更受歡迎的『讚』,如音樂和電視節目,從而捕捉到深度的個人資料。研究人員稱,即使是用戶父母是否在其21歲前離婚等看似不透明的個人資料,預測的準確度也能達到60%,這對形成該用戶是否具有『廣告價值』等資訊已足夠了。雖然研究人員的研究重點在於個性化營銷的潛力,即利用預測模型來改善在線服務質量,但他們同時警告說,預測結果會對用戶的隱私帶來一定威脅。

許多網上消費者可能會覺得這樣的數字暴露水平已超過其可接受的範圍。如企業、政府甚至個體都可使用預測軟件,從臉書的『讚』和其他數字痕跡準確地推斷出高度敏感的資訊。研究人員還對包括智力、情緒穩定性、開放性和外向性在內的人格特質進行了測試。盡管這些潛在特質更難衡量,但分析精度仍是驚人的。開放性研究表明,透過單獨觀察『讚』得到的資訊量與實際性格測試得分大致相當。某些『讚』與個性之間有著強烈的、但貌似不一致或隨機的關係,如炸薯條和高智商。

當把它們作為一個研究整體時,通過單獨分析臉書『讚』得出的個人屬性和人格特質的不同估值,甚至可以形成世界範圍內數百萬用戶的驚人準確的個人肖像。研究結果表明,在此項研究基礎上,心理評估業將以前所未有的規模發生革命,未來或將不再需要昂貴的評估中心和問卷調查。

研究人員表示,基於臉書『讚』得出的成果,同樣也適用於範圍更廣的其他網上行為。類似的預測可從各種各樣的數字資料得出,這種二次『推斷』在預測用戶想要隱藏的敏感資訊方面將具有統計學意義的非凡準確性。鑒於用戶留下的數字痕跡的多樣性,個體的控制將變得越來越難。

如果你是包括臉書在內的新興技術的忠實擁躉或活躍用戶,你也許會非常欣賞其自動化的新書推薦,或是為你挑選你最感興趣的新聞故事。不過,你也要想到,相同的資料和技術也可被用來預測你的政治觀點或性取向,從而將你的自由甚至生命置於危險之中。這種情況一旦發生,將降低人們使用數字技術的熱情,削弱個人和機構之間的信任,進而阻礙技術和經濟的進步。用戶需要提供對其資訊使用的透明度和控制權。

研究人員指出,希望該項研究有助於關於用戶隱私的持續討論:消費者有理由期待,在他們使用的產品或服務中內置更加強有力的隱私保護措施。而該項研究要提醒消費者的是:在網上共用資訊時要慎之又慎,一方面要設置隱私控制,另一方面堅決不與陌生人共用資訊。