作為生物識別技術(shù)的一種,搭載人臉識別功能的各類(lèi)智能化產(chǎn)品已應用得非常普遍。但從產(chǎn)品體驗而言,用戶(hù)的感受卻不盡相同。比如有能夠在自行車(chē)騎行狀態(tài)下,無(wú)需下車(chē)實(shí)現快速無(wú)感通行的小區人臉識別閘機。同時(shí)也會(huì )在使用部分產(chǎn)品時(shí),遇到多次識別不通過(guò)、站在原處不停變換人臉角度等待識別通過(guò)的尷尬。 造成這一差距,除了算法自身魯棒性和性能之外,由于模糊、遮擋、大角度、逆光暗光等復雜環(huán)境引起的人臉圖像質(zhì)量問(wèn)題也會(huì )導致人臉識別準確率過(guò)低,需要多次重復識別才能成功,從而整體耗時(shí)被大大拉長(cháng)。 我們知道當圖像質(zhì)量越差,那么人臉識別的準確率就越低。如果可以將人臉圖像進(jìn)行標準化評估,去除低質(zhì)量圖片,將篩選后質(zhì)量符合標準的圖像才送往下一個(gè)流程中,那么識別效率將大大提升。這就是實(shí)現人臉識別無(wú)感通行的一項重要技術(shù)——圖像質(zhì)量檢測算法(FQ),《從零學(xué)習人臉識別》系列公開(kāi)課第六期就對該算法進(jìn)行了詳細介紹。 人臉圖像質(zhì)量檢測算法的原理 與人臉識別一樣,圖像質(zhì)量檢測算法(FQ)也是基于特征提取原理,通過(guò)神經(jīng)網(wǎng)絡(luò )從海量數據中學(xué)習獲取人臉質(zhì)量檢測關(guān)注的特征(主要包括光線(xiàn)、模糊、角度、遮擋、表情、噪聲等)并進(jìn)行質(zhì)量判斷。每個(gè)特征以特定的數值來(lái)表示,比如下圖的人臉特征向量為(0,1,0,1,1),即強光、中度模糊、中等遮擋、大角度、大表情。 當然,這個(gè)特征向量可以無(wú)限擴充,將特征的描述越細致,特征向量就越精確,光線(xiàn)可以增加暗光、低光,模糊可以增加輕微模糊、中等模糊。以虹軟視覺(jué)開(kāi)放平臺的圖像質(zhì)量檢測算法為例,在噪聲特征中甚至可以擴充到六十四位以上的特征。 在提取特征向量后,各張人臉圖片的特征雜亂無(wú)序地分布在向量空間里。此時(shí),通過(guò)對數據進(jìn)行學(xué)習,質(zhì)量好的樣本盡可能聚集在中間,而不好的被推離。最后根據計算樣本到圈中心的距離,得到一個(gè)質(zhì)量分數。 每個(gè)特征對質(zhì)量分數的影響各不相同,我們需要根據各自業(yè)務(wù)需求設定相應的閾值,FQ會(huì )將低于設定閾值的低質(zhì)量圖像過(guò)濾,從而確保輸送到后面人臉識別環(huán)節的圖像質(zhì)量都是比較好的。 人臉圖像質(zhì)量檢測算法的經(jīng)典應用 將人臉質(zhì)量檢測放到真實(shí)的使用場(chǎng)景中,情況會(huì )怎么樣?以下是基于,包含人臉檢測、活體檢測、人臉比對、人證比對等一系列功能在內的虹軟視覺(jué)開(kāi)放平臺免費、離線(xiàn)SDK ArcFace,所開(kāi)發(fā)的智能辦公刷臉門(mén)禁。 一名用戶(hù)從遠處走來(lái),由于距離原因,系統首先捕捉到的是比較模糊的人臉圖像。而后,FQ算法會(huì )自動(dòng)進(jìn)行判斷,由于質(zhì)量過(guò)低該圖像會(huì )被拒絕送往下一個(gè)識別環(huán)節中。隨后系統會(huì )繼續捕捉,直到一張質(zhì)量較好的人臉圖像被送往識別并成功。整個(gè)過(guò)程用戶(hù)無(wú)需刻意停留等待,即可一次完成人臉識別。 而如果在沒(méi)有加入FQ算法的情況下,首次捕捉到的模糊照片被送入下一個(gè)人臉識別環(huán)節中。當這張人臉圖片在識別失敗后,系統就需要再捕捉一張圖片,進(jìn)行第二次識別、甚至第三次識別。如此,用戶(hù)基本將難以實(shí)現無(wú)感快速通行。 從對比實(shí)驗中,所感受到的差異就已經(jīng)非常明顯,如下圖所示:相比沒(méi)有FQ的情況,增加了FQ的人臉識別系統每個(gè)環(huán)節耗時(shí)平均減少約30%。 同樣,在批量進(jìn)行人臉識別底庫注冊時(shí),往往會(huì )有上萬(wàn)張圖片。普通的人工篩選,很難完成圖像質(zhì)量檢測。而FQ算法可以快速完成篩選,讓人臉識別從底庫的特征值開(kāi)始就更加準確。 作為一款輔助算法,我們在選型時(shí)要更多地考慮整體,FQ不能占用太大空間和耗時(shí)。比如上面“智能辦公刷臉門(mén)禁”實(shí)驗中選擇的虹軟視覺(jué)開(kāi)放平臺所開(kāi)發(fā)的FQ算法,其模型小,能在確保精度的前提下盡可能提升檢測速度。 此外需要注意的是,不同項目、不同環(huán)境對質(zhì)量好的定義各有不同。比如公司刷臉門(mén)禁和絕密實(shí)驗室的刷臉門(mén)禁,兩者對攝像頭成像效果的定義當然就有所區別。這時(shí)候,開(kāi)發(fā)者就得根據不同項目需求進(jìn)行攝像頭的單獨調參,從而分支出不同場(chǎng)景的版本。 其他關(guān)于人臉質(zhì)量檢測的相關(guān)問(wèn)題, 第六期“虹軟視覺(jué)開(kāi)放平臺人臉公開(kāi)課”都有具體解答,感興趣的開(kāi)發(fā)者朋友可以點(diǎn)擊下方鏈接觀(guān)看完整視頻;蛘咦孕兴阉鳌昂畿浺曈X(jué)開(kāi)放平臺人臉公開(kāi)課”,隨時(shí)可以學(xué)習。 |