基于三維的人臉定位系統的研究

發(fā)布時(shí)間:2010-9-17 17:32    發(fā)布者:techshare
關(guān)鍵詞: 定位系統 , 人臉 , 三維
三維人臉識別過(guò)程及系統功能

國外三維人臉識別的典型方法主要是利用深度圖像自身的幾何特征,利用深度圖像處理技術(shù),分析面貌曲面的曲率等幾何特征,對面貌曲面進(jìn)行凹凸區域的分割、正側面輪廓邊緣的提取。最早對三維圖像面貌識別的研究有Lapreste 提出的基于輪廓線(xiàn)的方法,通過(guò)對人臉面貌曲率的分析,提取輪廓線(xiàn)上的特征點(diǎn),利用輪廓線(xiàn)作為特征進(jìn)行面貌的識別。Lee&Milios 從人臉面貌深度圖像中抽取凸區域,這些凸區域形成了特征集,計算出所有凸區域相關(guān)的擴展高斯圖,兩幅面貌特征的匹配就是利用這些擴展高斯圖像進(jìn)行的。當然還有很多基于輪廓線(xiàn)和凸區域的改進(jìn)方法,例如凸凹點(diǎn)多階段融合過(guò)程方法、輪廓線(xiàn)的歐氏距離識別方法、輪廓線(xiàn)曲率比較方法等等。但這些方法還停留在理論研究的層次,沒(méi)有實(shí)質(zhì)的自動(dòng)化系統的出現。國內三維人臉識別的研究也相應地展開(kāi),但與國外的研究相比還處于剛起步的狀態(tài)。目前,三維數據獲取已經(jīng)成為可能,并已經(jīng)成熟的在實(shí)際工作中使用(如三維激光掃描技術(shù)、CT成像技術(shù)、結構光方法等),使得三維圖形識別技術(shù)得到了應用的可能,可以迅速地完成人頭三維面貌數據獲取。這也為我們的研究提供了實(shí)現的基礎。  

總的來(lái)說(shuō),要實(shí)現一個(gè)自動(dòng)的人臉識別系統主要要完成以下的4個(gè)功能。

① 人臉檢測(Detection)與分割(Segmentation)。從任意的場(chǎng)景中檢測人臉的存在并進(jìn)行定位,提取出一個(gè)人臉。
② 人臉的規范化(Normalization)。校正人臉在尺度、光照和旋轉等方面的變化。
③ 人臉表征(Face Representation)。采用某種方法表示出數據庫中的已知人臉和檢測出的人臉,通常的方法有幾何特征、代數特征、特征臉、固定特征模板等。
④ 人臉識別(Recognition)。根據人臉的表征方法,選擇適當的匹配策略將得到的人臉與數據庫中的已知人臉相比較。  

我們研究的基于三維模型的人臉識別方法,與以往的系統的最主要區別就在于:人臉庫中記錄的不是像以前一樣,記錄著(zhù)每個(gè)人的各種姿勢、位置、表情的頭部照片,而是存儲的一個(gè)人臉的三維空間模型。由這個(gè)區別引申出人臉的表征和識別的方法也與二維識別方法不同。  

由于人臉表征的區別,三維人臉識別系統也分兩類(lèi),一是純三維之間的對比,例如通過(guò)多角度拍照,系統自動(dòng)構建人臉的三維模型,與庫中的三維模型進(jìn)行比較。這種方法中人臉的表征是一個(gè)基于三維的特征向量。由于人臉的三維重構目前還是一個(gè)正在研究的領(lǐng)域,其過(guò)程依然是一個(gè)病態(tài)的過(guò)程。因此我們沒(méi)有選擇這種方法進(jìn)行我們的系統開(kāi)發(fā)。第二種系統是通過(guò)三維模型增強了的二維之間的對比。即通過(guò)對三維模型的變化,我們可以找到和成像環(huán)境一致的三維模型的位置,通過(guò)其平面投影得到一個(gè)二維的圖片,和原有的照片進(jìn)行二維上的比較,實(shí)現識別的過(guò)程。在選擇人臉表征時(shí),使用了實(shí)時(shí)性最好的特征點(diǎn)表示法。使用人臉關(guān)鍵特征點(diǎn)所形成的幾何特征來(lái)對人進(jìn)行區別。  

由這個(gè)主導思想,產(chǎn)生的新的人臉識別系統的主要功能如下。  

① 人臉檢測與分割。從任意的場(chǎng)景中、視頻數據中檢測人臉的存在,提取出一個(gè)人臉及各個(gè)區域部分。在人臉上自動(dòng)標記出我們需要的特征點(diǎn), 例如外眼點(diǎn)、內眼點(diǎn)、眉間點(diǎn)、鼻下點(diǎn)、頜下點(diǎn)、嘴角點(diǎn)等等,如圖1。



圖1 人臉特征分布示意圖

② 人臉的規范化。計算出人臉在尺度和旋轉等方面的變化,得到攝像過(guò)程中人臉的實(shí)際位置,將庫中的人臉三維模型也變化到同樣的位置。這是幾何特征識別的一個(gè)關(guān)鍵的問(wèn)題。由于人臉的幾何特征的相似性比較,受人臉拍攝角度的影響很大,當人臉偏轉超過(guò)一定的角度的時(shí)候,許多重要的特征點(diǎn)在二維上不可見(jiàn)了,因此也無(wú)法計算出對應的特征向量。如果不能將人臉模型和照片保持在同樣的偏轉環(huán)境下,識別的可信性就不具備。對這個(gè)問(wèn)題的解決可以結合人類(lèi)學(xué)、面貌測量學(xué)多年來(lái)由統計而來(lái)的經(jīng)驗公式來(lái)完成,如圖2。



圖2 三維人臉模型

③ 人臉表征。采用標記出的特征點(diǎn)的幾何特性(例如特征點(diǎn)分布歐氏距離、B樣條曲面等方法)表示出數據庫中的已知人臉和檢測出的人臉。對同一個(gè)照片的特征點(diǎn)采取多層次描述的方法,形成多個(gè)幾何特征向量,這種多層次描述的方法可以有效地降低人臉識別過(guò)程中的誤識現象的出現。同樣,識別的過(guò)程也是采取多分類(lèi)器合作的模式識別方法。  

④人臉識別。根據獲得的人臉照片特征點(diǎn),計算出人臉的偏轉角度,同時(shí)計算出多個(gè)特征向量,從數據庫中取出已知的人臉特征點(diǎn)信息,構建出三維人臉特征點(diǎn)拓撲模型,對此模型進(jìn)行偏轉,使之與二維人臉照片的拍攝環(huán)境一致。計算出三維模型的多個(gè)特征向量,通過(guò)面貌特征的多層次描述、多分類(lèi)器合作的模式識別方法,對投影結果與二維相應照片進(jìn)行相似性度量。在進(jìn)行識別時(shí),對每個(gè)分類(lèi)器設定一個(gè)閥值,對所有的特征向量的結果也設置一個(gè)閥值,一旦所有的度量結果都達到閥值的要求,即認定此次識別是成功的,否則繼續從數據庫中讀數據,進(jìn)行識別。

技術(shù)路線(xiàn)與設計方案  

為了實(shí)現上面的研究?jì)热,我們選擇了一個(gè)可行的解決方案。使用Microsoft Visual Studio作為系統的開(kāi)發(fā)平臺,利用其提供的強大的圖形圖像處理功能,使用OPENGL專(zhuān)業(yè)三維引擎,最后配合Oracle數據庫對異構數據的管理功能實(shí)現系統。其中,人臉三維數據的獲取采用加拿大polhemus公司生產(chǎn)的手持式三維激光掃描儀FastSCAN以及Inspeck公司基于結構光柵拍攝的三維數據建模設備(Inspeck)。整個(gè)系統的用例如圖3所示,其中的關(guān)鍵技術(shù)如下所述。





圖3 系統用例圖

(1) 供系統管理人員使用的管理平臺。主要檢測進(jìn)行人臉三維數據的獲取和預處理以及三維特征點(diǎn)的選擇和存儲等功能。利用Visual C++和OPENGL開(kāi)發(fā)的三維模型的管理系統,通過(guò)激光掃描儀或結構光拍攝相機獲得原始的人臉三維模型,由于得到的三維數據坐標不統一,為了便于計算使用,要進(jìn)行坐標的統一,通過(guò)平臺實(shí)現對原始模型的光滑平順,坐標變換,根據分辨率要求,生成三維面貌表面數據。由于人臉
的三維特征點(diǎn)的選取工作不要求太強的實(shí)時(shí)性,故可以采取手工選取的方式,由系統管理員通過(guò)平臺對特征點(diǎn)進(jìn)行標定。全部標定結束后,記錄入后臺數據庫中。當然管理平臺還具備其他的功能,例如新用戶(hù)的添加、用戶(hù)的刪除、信息修改等常用數據庫管理功能。  

(2)基于Visual C++、OpenGL和DirectShow開(kāi)發(fā)出人臉的自動(dòng)化識別系統。首先通過(guò)DirectShow對視頻流進(jìn)行分析,自動(dòng)檢測出人臉的存在并從圖像中將其分割出來(lái)。找到人臉后,使用VC實(shí)現的ASM主動(dòng)形狀模型對人臉特征點(diǎn)進(jìn)行自動(dòng)的標定。得到特征點(diǎn)后,根據主要的特征點(diǎn)位置,計算出拍攝角度。對三維數據的進(jìn)行讀取,讀取后使用OPENGL構建出人臉的抽象三維模型,同時(shí)按照拍攝角度的變化模型。當三維模型的平面投影和二維照片中人臉的旋轉角度相同時(shí),通過(guò)多特征向量生成、多分類(lèi)器判別及閥值設定的方法實(shí)現識別。  

(3)底層數據庫使用Oracle數據庫,利用它良好的異構數據存儲性和大量數據的處理能力,實(shí)現系統需要使用到的三維空間信息和屬性信息的統一存儲,以及對海量數據的查詢(xún)檢索。  

(4)不論是管理平臺還是自動(dòng)識別系統,對人臉數據庫的讀取都通過(guò)數據庫中間件完成,統一的進(jìn)行信息讀取、維護、操作。

最終形成一個(gè)基于三維數據庫中間件的三層C/S體系的應用程序。這個(gè)設計方案可以用圖4表示。



圖4 系統設計方案示例圖

結語(yǔ)

這個(gè)系統與已有各種人臉識別系統的最大的區別就在于,數據庫中記錄的是三維人臉模型,而不是目前各種庫中存儲的人臉多姿態(tài)照片。通過(guò)三維深度信息的投影變化解決人臉識別中多姿態(tài)的問(wèn)題。利用物體幾何拓撲的不變性原理,排除大部分人臉表情對識別的影響,而且由于采用的方法與照片的明暗程度無(wú)關(guān),可以解決人臉識別過(guò)程中受拍攝環(huán)境光照強度的影響,達到較理想的人臉識別效果。
本文地址:http://selenalain.com/thread-27663-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页