來(lái)源:澎湃新聞 斯坦福大學(xué)的邁克爾·科辛斯基(Michal Kosinski)和王軼倫發(fā)現,通過(guò)從3萬(wàn)多張人臉圖像中提取出來(lái)的特征,計算機識別出同性戀男性的準確率最高可達到91%,同性戀女性則為83%。論文認為,與產(chǎn)前激素理論一致,同性戀男性的長(cháng)相更“女性化”,下巴更窄,鼻子更長(cháng),額頭更大,同性戀女性則相反。 這篇題為《深度神經(jīng)網(wǎng)絡(luò )基于人臉圖像判斷性取向比人類(lèi)更準確》的論文于9月7日發(fā)表在《人格與社會(huì )心理學(xué)雜志》(Journal of Personality and Social Psychology)上后,引發(fā)了媒體和社交網(wǎng)絡(luò )的熱議。 英國《衛報》擔心,這項技術(shù)會(huì )導致青少年“自測”,夫妻“互測”,而在對同性戀處以死刑的國家,這項技術(shù)更可能淪為殺人工具。 不過(guò),在作者看來(lái),他們的研究是針對人臉識別技術(shù)和互聯(lián)網(wǎng)隱私問(wèn)題的警告,是對未來(lái)可能成真的技術(shù)濫用的演示。作者在文章中呼吁,政府和企業(yè)應制定相關(guān)法規,發(fā)展相關(guān)技術(shù),降低同性戀群體的隱私風(fēng)險。 ![]() 異性戀(左)、同性戀(中)男女的復合面部圖像,最右為異性戀(綠色)、同性戀(紅色)男女的平均面部標記 論文的摘要寫(xiě)道:“我們發(fā)現人臉中包含的有關(guān)性取向的信息遠比人腦能夠感知到的多。我們用深度神經(jīng)網(wǎng)絡(luò )從35326張面部圖像中提取特征。我們將這些特征輸入邏輯回歸算法,對性取向進(jìn)行分類(lèi)。給定單張面部圖像,分類(lèi)器能以81%的概率區別同性戀和異性戀男性,女性則為71%。人類(lèi)的判斷準確率則要低得多:男性61%,女性54%。給定同一個(gè)人的5張面部圖像,算法的準確率可以相應提高到91%和83%。分類(lèi)器利用的面部特征,有鼻子形狀等固定特征,也有打扮風(fēng)格等臨時(shí)特征。同性戀男性和女性?xún)A向于具備性別非典型的面部形態(tài)、表情和打扮風(fēng)格,這與產(chǎn)前激素暴露影響性取向的理論相符合。而性別分類(lèi)模型檢測同性戀男性的準確率為 57%,同性戀女性的準確率為 58%。這些發(fā)現提高了我們對性取向起源以及人類(lèi)認知缺陷的理解。此外,公司與政府越來(lái)越多地使用計算機視覺(jué)算法探測人的內在特征,我們的研究揭示出同性戀的隱私與安全正在面臨威脅! 算法準確率:男性91%,女性83% 研究者從美國交友網(wǎng)站上獲取了公開(kāi)資料,包括36630名男性的130741張照片和38593名女性的170360張照片,年齡在18歲到40歲之間。他們的性取向則是通過(guò)意向伴侶性別獲悉的。 隨后,研究者將這些照片中的人臉用Face++軟件進(jìn)行了處理,剔除了一些照片。接著(zhù),他們人工篩選這些照片是否是成年白人,性別與網(wǎng)絡(luò )資料是否相符。最后,他們隨即剔除了一些照片,以平衡異性戀和同性戀的人數,留下的樣本包含同性戀和異性戀男性各3947名,同性戀和異性戀女性各3441名。 ![]() 對美國交友網(wǎng)站上獲取的公開(kāi)照片進(jìn)行處理 研究者使用一個(gè)名為VGG-Face的深度神經(jīng)網(wǎng)絡(luò )提取圖像的特征,并以此訓練邏輯回歸模型。實(shí)驗結果顯示,給定單張面部圖像,分類(lèi)器能以81%的概率區別同性戀和異性戀男性,女性則為71%。給定同一個(gè)人的5張面部圖像,算法的準確率可以相應提高到91%和83%。 ![]() 給定個(gè)體男性(藍色)、女性(紅色)1至5張照片,算法的準確率提高 符合產(chǎn)前激素理論:同性戀男性更“女性化”? 在引言部分,作者說(shuō)明,他們選擇研究性取向的一個(gè)重要原因是“廣為接受的性取向的產(chǎn)前激素理論(PHT),預測了外表與性取向的關(guān)系”。 論文寫(xiě)道,根據產(chǎn)前激素理論,男性胚胎過(guò)少地暴露在雄性激素中,或女性胚胎過(guò)多地暴露在雄性激素中,都可能造成性取向異化。然而,雄性激素同樣與兩性面部分化有關(guān),產(chǎn)前激素理論預測同性戀人群傾向于具備性別上不典型的面部形態(tài)。即,同性戀男性面部應該更女性化,同性戀女性面部應該更男性化。 研究者通過(guò)分類(lèi)器識別的位點(diǎn)集合成了計算機認為“最像同性戀”和“最不像同性戀”的人臉。論文認為,計算機識別結果與產(chǎn)前激素理論相符合,同性戀長(cháng)相在性別上更不典型。平均來(lái)講,同性戀男性的下巴更窄,鼻子更長(cháng),額頭更大;同性戀女性則相反。 ![]() 顏色越紅的區域,在算法中越重要 為了進(jìn)一步檢驗“同性戀長(cháng)相更不具備性別典型性”這一假設,研究者還通過(guò)一個(gè)準確率98%的性別分類(lèi)器試圖區別同性戀和異性戀,發(fā)現在男性身上的準確率為 57%,在女性身上的準確率為 58%。論文寫(xiě)到:“數據顯示,男性面部的女性化程度與同性戀概率呈正相關(guān),女性則相反! 研究的幾點(diǎn)局限性 不過(guò),在論文的討論部分,作者強調研究結論不應被讀者誤讀。首先,同性戀長(cháng)相更不具備性別典型性,不代表所有的同性戀男性長(cháng)相都女性化,也不代表所有同性戀女性長(cháng)相都不女性化。 其次,不應誤讀91%這個(gè)實(shí)驗中的數值。在美國的同性戀比例大約為6%到7%的情況下,分類(lèi)器需要大幅犧牲準確率,才能覆蓋大量的樣本。 論文也自我指出了研究的幾點(diǎn)限制:樣本限于白人、沒(méi)有排除雙性戀,以及無(wú)法排除長(cháng)相“更同性戀”的人更容易“出柜”這一點(diǎn)。 作者也拋出了其他幾個(gè)有趣的問(wèn)題,比如同性戀男性更少留胡子,主要是生理原因(毛發(fā)稀少)還是品味原因?分類(lèi)器識別男性比女性更準確,是否意味著(zhù)女性的性取向更具流動(dòng)性? 看臉識罪犯、識貧富、識同性戀:科學(xué)相面術(shù)? 近年來(lái),計算機視覺(jué)識別技術(shù)發(fā)展迅速。從辦理身份證件、電子支付到機場(chǎng)安檢、辦公門(mén)禁,人臉識別技術(shù)正在大規模進(jìn)入人們的日常生活。不過(guò),一些研究者試圖通過(guò)計算機視覺(jué)識別,尋找外表特征和內在性格的聯(lián)系,引發(fā)了廣泛的爭議。 去年11月,上海交通大學(xué)武筱林教授的《基于面部圖像的自動(dòng)犯罪概率推斷》一文指出,機器可以通過(guò)照片分辨出誰(shuí)是罪犯,誰(shuí)是守法公民,識別準確率在86%以上。隨后,加拿大多倫多大學(xué)一項機器看臉識貧富的研究,同樣引發(fā)了一些爭議。 此前,一家以色列初創(chuàng )公司聲稱(chēng)其開(kāi)發(fā)的人臉識別程序成功識別了參與2015年11月巴黎恐怖襲擊的9名恐怖分子,還能識別戀童癖與白領(lǐng)罪犯。 盡管這些研究倍受倫理爭議,但從論文來(lái)看,科辛斯基和王軼倫顯然并不認同將這方面的研究完全劃歸禁區。 在引言部分,論文提到,相面術(shù)可回溯至古中國和古希臘,畢達哥拉斯就曾“看臉”收門(mén)生。而意大利外科醫生龍勃羅梭在19世紀初開(kāi)創(chuàng )了“天生犯罪人理論”,指出罪犯可以通過(guò)臉部特征識別。 “如今,相面術(shù)被廣泛認定為一種糅合迷信與種族主義的偽科學(xué)。由于合法性問(wèn)題,研究、甚至是討論面部特征和性格之間的聯(lián)系都成為了禁忌。聯(lián)系不存在,這成了一個(gè)普遍的前提。然而,很多機制暗示,情況是相反的! “重要的是,人類(lèi)看臉判斷性格的準確率低,并不一定說(shuō)明線(xiàn)索不是明明白白地擺在那里。只是,人類(lèi)可能缺乏探測或解讀的能力……因此,我們用現代計算機視覺(jué)算法檢驗這個(gè)假設! 同性戀群體危險了! 論文的作者試圖通過(guò)這一研究警告我們,社交平臺上的公開(kāi)數據,可以被人利用,制作針對性取向的分類(lèi)器。文章寫(xiě)道:“預測性取向可能對同性戀男女和整個(gè)社會(huì )都造成嚴重威脅,甚至生命威脅!S多國家的法律認定同性戀是犯罪,8個(gè)國家會(huì )將同性戀處以死刑。因此,我們讓決策者、科技企業(yè)和同性戀群體知道看臉識同性戀的準確率可以有多高,這很關(guān)鍵! 雖然論文所演示的恰恰是論文所反對的,作者強調,他們并非要制造一種入侵的工具,而是為了演示一些常用的入侵路徑。就在眼下,一些政府和企業(yè)就在研究人臉識別和內在人格之間的聯(lián)系,風(fēng)險預警迫在眉睫。作者希望,他們的研究能提醒政府和企業(yè),制定相關(guān)法規,發(fā)展相關(guān)技術(shù),降低同性戀群體的隱私風(fēng)險。 社交網(wǎng)站信息顯示,科辛斯基是斯坦福商學(xué)院的助理教授,2014年在劍橋大學(xué)獲得心理學(xué)博士學(xué)位。他曾供職于微軟研究院和劍橋大學(xué),在公開(kāi)言論中曾多次談及隱私問(wèn)題。王軼倫本科畢業(yè)于浙江大學(xué),2016年在斯坦福獲碩士學(xué)位,目前是IDG資本駐舊金山灣區的投資顧問(wèn),投資領(lǐng)域專(zhuān)注于A(yíng)I、機器人、機器學(xué)習、計算機視覺(jué)等。 ![]() 王軼倫(左)、科辛斯基(右) |