科技報報/「刷臉支付」難在哪裡? 光照、姿態等問題

2015年3月15日,在德國漢諾威國際資訊及通信技術博覽會開幕式上,阿里巴巴集團董事局主席馬雲展示「刷臉支付」技術。

不久前,阿里巴巴集團董事局主席馬雲在德國玩的一場『刷臉秀』吸引了很多人的目光,在這次活動中,馬雲向德國總理梅克爾與大陸國務院副總理馬凱,演示了螞蟻金服的Smile to Pay掃臉技術,利用『刷臉支付』從淘寶網上購買了1948年漢諾威紀念郵票。

人臉識別最古老也最自然

根據北京日報報導,『刷臉支付』其實也不是什麼新鮮事兒,它是眼下研究很熱門、發展很迅猛的人身識別技術的一種。除了極端嚴重的『臉盲症』患者,我們識別一個人最原始、最自然、最方便的方法就是看他的臉。走在路上,迎面一個人過來,等我們看清了他的臉,就認出來了,『哦,老張!』

識別一個人的身分,是社會生活中十分重要的一件事情。以往人們想出了很多辦法來做這件事,比如用鑰匙,用證件,用密碼等等,但這些都是身外之物,一旦遺失了、忘記了或被盜了,就很麻煩。

近幾十年來,人們想到了利用人體固有的生物特徵進行身份識別的辦法,這就叫生物特徵識別技術。由於這些生物特徵是長在人的身體上的,所以也就不存在遺失、忘記或被盜的問題了。

這些辦法有很多,比如指紋識別,這是應用最早、最廣泛,也是目前最成熟的生物特徵身份鑑別方法;再比如虹膜識別,虹膜是眼球前部含色素的環形薄膜,含有極其豐富的結構和紋理特徵,到目前為止,虹膜識別的錯誤率是各種生物特徵識別中最低的。此外,還有利用人的行為特徵進行的筆跡識別、步態識別、聲紋識別等等。

但是有一條,這些生物特徵識別方法一般都需要人們的行為配合,比如按個指印兒,把眼睛貼到什麼儀器上之類,顯得很不自然,也不太友好。因此,最自然的方法還是要返璞歸真——看見你的臉,就把你認出來了!

五十年來獲得長足發展

早在19世紀末,有個叫高爾頓的測量狂人(這個人也是智商測量的始作俑者)就想到了人臉識別的問題,他在1888年和1910年分別在《自然》雜誌上發表了兩篇關於利用人臉進行身份識別的文章。他用一組數字代表不同的人臉側面特徵,並對人類自身的人臉識別能力進行了分析。但是當然,當時還不可能涉及人臉的自動識別問題。

據西安理工大學王映輝教授介紹,自動人臉識別的研究論文最早見於1965年,到現在已有五十年的歷史。近年來,人臉識別研究得到了諸多研究人員的青睞,湧現出了很多新的技術和方法。尤其是自1990年以來,人臉識別更得到了長足的發展,每年都有大量的學術論文發表。現在,幾乎所有知名的理工科大學和主要的IT產業公司都有研究組在從事人臉識別的研究。

人臉識別的具體過程可分為以下四步:第一步,搜集並初步處理人的臉部圖像資訊;第二步,從採集到的圖像中提取關鍵的資訊;第三步,進一步處理已有資訊並將它們保存;第四步,比對,把需要識別的人臉與已經保存在資料庫中的人臉資訊進行匹配和甄別。

存在困難超乎一般人想像

這些看上去好像並不難,但對實際的人臉識別來說,面臨的困難其實是超乎想像的,王映輝教授就介紹了以下幾點:

光照問題。這是機器視覺中存在已久的問題,在人臉識別中的表現尤為明顯,即使目前最好的人臉識別系統,在室外光照環境下,其識別率也會急劇下降。

姿態問題。這也是目前人臉識別研究中需要解決的一個技術難點。目前多數的人臉識別演算法主要針對正面、準正面人臉圖像,當發生俯仰或者左右側面比較厲害的情況下,人臉識別演算法的識別率也將會急劇下降。

表情問題。很遺憾,人的面部不像手指、虹膜,它是有豐富表情的地方。表情是一種很複雜的肌肉運動,每種表情是幾十塊面部肌肉共同運動的組合,很難用一個準確的數學模型來描述這些肌肉的運動。此外,表情的表現形式也因人而異,同一種表情在不同的人面部上有不同的表現形式。因此,如何有效地識別帶有表情的圖像,從而提高人臉識別的準確率,也是一個重要的挑戰。

遮擋問題。對於非配合情況下的人臉圖像採集,遮擋問題是一個非常嚴重的問題。特別是在監控環境下,往往被監控對象都會戴著眼鏡、帽子等飾物,使得被採集出來的人臉圖像有可能不完整,從而影響了後面的特徵提取與識別。

生長問題。和指紋、虹膜不同,隨著年齡的變化,面部外觀也會變化,特別是對於青少年,這種變化會更加明顯。

低質量照片問題。目前的多數人臉識別系統在演算法設計和模型訓練方面往往都只針對圖像質量很好的情況,但對智慧監控、公安系統犯罪嫌疑人照片比對等應用而言,照片的質量可能非常差。如何提高系統對這些低質量照片的識別能力也是人臉識別亟待解決的關鍵問題之一……。

利用三維資訊擁有更好未來

正是由於以上存在的種種困難,人臉識別的準確性目前仍低於虹膜、指紋識別,但由於它的無侵害性和方便、友好的方式,還是得到人們更多的重視。

王映輝教授介紹,人臉識別技術發展到今天,許多成果仍然是在二維資訊基礎上取得的,而真實世界中的人臉是三維的,三維資訊特別是三維圖像較之二維圖像更能提供完整而真實的內容。如何有效地利用人臉的三維資訊進行識別,將是一個極具挑戰性的研究課題。

每種生物特徵識別技術都有其一定的適用範圍和要求,單一的生物特徵識別在實際應用中顯現出各自的局限性,如有些人的指紋無法提取特徵,患眼疾的人虹膜會發生變化等。統計顯示,目前還沒有一個單生物特徵能達到完美無誤的要求。因此,生物特徵識別領域出現了一種新方向,即多模態生物特徵識別技術結合使用。

小貼士 生物特徵識別
人體所固有的生物特徵有許多,能夠用來認證身份的生物特徵應該具有以下的特性:

普遍性:每個正常人都應該具有這種特徵;
惟一性:不同的人應該具有各不相同的特徵;
可採集性:所選擇的特徵可以定量測量;
穩定性:所選擇的特徵至少在一段較長的時間內是不變的,並且特徵的採集不隨條件、環境的變化而變化。

在實際的生物特徵識別系統中,還應考慮如下一些因素:
性能:識別的準確性、速度、可靠性以及為達到所要求的準確性和速度所需要的資源;
可接受性:使用者在多大程度上願意接受這種生物特徵識別系統;
安全性:用欺詐的方法騙過系統的難易程度。


工作人員在演示人臉識別系統。


某集團在博覽會上推廣人臉識別系統。