仿人機器人的頭部視覺(jué)跟蹤系統利用視覺(jué)信息作為反饋,來(lái)規劃機器人的頭部運動(dòng)使其能實(shí)時(shí)的跟蹤運動(dòng)目標。視覺(jué)跟蹤是仿人機器人的重要功能之一,它的研究對于仿人機器人的自主導航、人機交互以及視覺(jué)伺服都具有極其重要的意義。 視覺(jué)跟蹤的實(shí)時(shí)性是仿人機器人的重要性能要求之一。針對這一系統要求,近年來(lái)有很多學(xué)者設計出了多種系統結構。文中作者設計了一種基于CAN總線(xiàn)的分布式的仿人機器人的控制系統,其中的視覺(jué)系統通過(guò)無(wú)線(xiàn)局域網(wǎng)與控制系統進(jìn)行通訊。日本仿人機器人ASIMO的運動(dòng)控制系統采用集中式控制方式,視覺(jué)系統通過(guò)網(wǎng)絡(luò )與運動(dòng)控制系統通訊。一臺計算機難以滿(mǎn)足視覺(jué)跟蹤的實(shí)時(shí)性要求,為了實(shí)現實(shí)時(shí)跟蹤,本文提出并實(shí)現了一種基于MemoLink通訊的雙計算機的視覺(jué)跟蹤系統。該系統通訊可靠、體積小,便于將兩臺計算機安置于仿人機器人的胸腔內。 目標分割的穩定性是機器人視覺(jué)跟蹤系統的重要要求之一,近幾年來(lái)很多學(xué)者對這個(gè)領(lǐng)域進(jìn)行了研究,大多數的機器人目標跟蹤系統選用了單一的圖像信息,有的采用了物體的顏色信息,有的采用了物體的輪廓信息。然而在復雜的非結構化的室內背景下,單一的圖像信息不能保證系統穩定的分割出目標。多種圖像信息的融合是解決目標物體識別穩定性的方法之一。本文中作者提出了一種集成深度、顏色和形狀信息的逐步逼近目標區域的快速目標分割方法 1 系統結構 仿人機器人BHR1的系統結構如圖1所示,其全身有32個(gè)自由度,其中頭部有2個(gè)自由度,可以在兩個(gè)方向上自由轉動(dòng),即左右轉動(dòng)和上下轉動(dòng)。面部放置兩只CCD攝像頭作為視覺(jué)傳感器來(lái)模擬人的眼睛。采用SVS立體視覺(jué)處理系統處理視覺(jué)信息,SVS系統提供了每幀圖像的深度圖像。 圖1 仿人型機器人(BHR1)跟蹤系統的系統結構 兩臺計算機置于機器人的胸腔內,其中一臺計算機負責視覺(jué)信息的處理,另外一臺負責機器人的運動(dòng)控制。前者被稱(chēng)之為信息處理子系統,后者被稱(chēng)為運動(dòng)控制子系統, 兩臺計算機通過(guò)Memolink進(jìn)行通訊。信息處理子系統利用Windows強大的多媒體功能來(lái)處理立體視覺(jué)信息,實(shí)現目標的快速分割以及物體的運動(dòng)估計和預測。運動(dòng)控制子系統以Linux/RT-Linux實(shí)時(shí)操作系統作為平臺,保證了機器人控制系統的實(shí)時(shí)性。除了頭部運動(dòng)關(guān)節,運動(dòng)控制系統負責仿人機器人全部關(guān)節的控制。Memolink 是系統間進(jìn)行快速通信的一種有效解決方案,是連接信息處理子系統和運動(dòng)控制子系統的橋梁。具有通信速度快和通信前無(wú)需握手的優(yōu)點(diǎn)。 整個(gè)跟蹤過(guò)程執行如下的循環(huán):搜索目標——發(fā)現目標——匹配——狀態(tài)估計和預測——運動(dòng)控制。不同的匹配方法應用產(chǎn)生了不同的跟蹤方法。本文中作者提出了一種融合深度、顏色和形狀信息的逐步逼近目標區域的快速分割方法。在實(shí)時(shí)的跟蹤系統中,運動(dòng)估計和預測有效的減少了檢測區域,提高了系統的跟蹤速度。研究中采用經(jīng)典的卡爾曼濾波器進(jìn)行運動(dòng)目標的狀態(tài)估計和預測。 2 基于多圖像信息的目標分割方法 視覺(jué)信息處理子系統完成目標物體的快速分割,同時(shí)估計和預測目標物體的運動(dòng)信息,把目標物體的位置信息實(shí)時(shí)地傳遞給運動(dòng)控制子系統。目標識別的穩定性對整個(gè)跟蹤系統的穩定性起著(zhù)至關(guān)重要的作用。 在復雜背景的非結構化的室內環(huán)境下,用于機器人視覺(jué)跟蹤的圖像信息有:深度、顏色、形狀、邊緣、運動(dòng)等;诙嘈畔⒌倪\動(dòng)目標的分割方法中,所選取的信息應該具有互補性。物體的顏色是物體最顯著(zhù)的特征,適合用于目標的跟蹤。但是當背景中包含同樣顏色的物體時(shí),基于顏色的跟蹤將會(huì )失敗。深度信息有助于系統得到粗略的前景區域,也就是包含運動(dòng)物體的目標候選窗口,另外基于深度分割的粗略前景輪廓的獲得計算量小,速度快;赗HT(Random Hough transform)算法的形狀檢測器可以檢測各種不同的幾何形狀,比如:橢圓形、三角形和多邊形,進(jìn)而把目標候選區域中相同顏色的物體區別開(kāi)來(lái)。 圖2 視頻序列中運動(dòng)目標分割過(guò)程 本文利用仿人機器人的立體視覺(jué)系統,設計了融合深度,顏色,形狀信息的逐步逼近目標區域的快速跟蹤方法。圖2為視頻序列中運動(dòng)目標的分割過(guò)程。首先利用深度信息把機器人關(guān)心的前景區域分割出來(lái),得到ROF(Region of Foregroud)區域,即粗略的目標候選區域。在ROF中使用顏色濾波器分割,得到ROIC(Region of Interest Color)區域。最后形狀檢測器可以把相同顏色的物體區別開(kāi)來(lái)。在分割過(guò)程中,候選目標區域逐步縮小并逼近目標區域。逐步縮小的候選目標區域減少了計算量,提高了系統的運算速度。同時(shí),該方法有效的避免了場(chǎng)景中相同顏色物體的干擾,提高了目標分割的穩定性。圖3顯示了目標物體的分割結果。 圖3 復雜場(chǎng)景中目標物體的分割結 3 運動(dòng)控制子系統 3.1運動(dòng)控制系統的結構 機器人的運動(dòng)控制子系統是一個(gè)典型的計算機控制系統。機器人頭部的控制目的是為了機器人的頭部能夠實(shí)時(shí)跟蹤運動(dòng)目標,因此實(shí)際控制信號輸入量是根據目標物體的位置信息求得的規劃數據。在反饋信號的輸入方面,因為被控對象是電機轉動(dòng)的角度,用電機上面的軸角編碼器的輸出作為反饋信號。 系統使用了一套多功能接口板,將所有的A/D轉換、D/A轉換、ENC(encoder)、PWM、IO等多種功能都集成在該接口板上,提高了系統的集成性并減小了系統體積和重量。多功能接口板上上的ENC接口來(lái)作為反饋信號的輸入通道,它可以測量軸角編碼器的脈沖輸出個(gè)數。每個(gè)運動(dòng)關(guān)節采用經(jīng)典的PD伺服控制。 3.2運動(dòng)控制系統的軟件結構 運動(dòng)控制子系統采用了RT-Linux(Real Time Linux)實(shí)時(shí)操作系統,其軟件結構如圖4所示,主要包括兩個(gè)模塊:主程序模塊、實(shí)時(shí)任務(wù)模塊,主程序模塊是linux應用程序,實(shí)時(shí)任務(wù)模塊是RTlinux下的實(shí)時(shí)進(jìn)程。兩個(gè)模塊也是兩個(gè)進(jìn)程,通過(guò)管道(FIFO)進(jìn)行通訊等。 圖4 BHR1運動(dòng)控制系統的軟件結構 實(shí)時(shí)任務(wù)主模塊包括兩部分:周期性執行的實(shí)時(shí)控制循環(huán)(即實(shí)時(shí)線(xiàn)程)和實(shí)時(shí)任務(wù)觸發(fā)器。實(shí)時(shí)線(xiàn)程的周期性執行是由一個(gè)循環(huán)實(shí)現的。該循環(huán)主要完成兩大功能:機器人運動(dòng)控制、與各電機相連的軸角編碼器的信息采集。實(shí)時(shí)任務(wù)周期為3毫秒。實(shí)時(shí)任務(wù)周期是根據D/A通道處理時(shí)間和碼盤(pán)計數器讀取時(shí)間,以及傳感器信息獲取時(shí)間確定。 主程序模塊與一般的Linux應用程序沒(méi)有區別,它主要有以下幾個(gè)功能:與信息處理系統通訊;向實(shí)時(shí)任務(wù)傳送控制參數;實(shí)現人機交互,即將從實(shí)時(shí)任務(wù)傳過(guò)來(lái)的電機轉動(dòng)數據和傳感器數據輸出到監視器上,同時(shí)將通過(guò)鍵盤(pán)輸入的控制信號,實(shí)際上主程序模塊主要實(shí)現控制臺的作用,可以稱(chēng)之為控制臺程序。 3.3運動(dòng)控制過(guò)程 跟蹤系統的控制目標是:根據圖像處理獲取的目標質(zhì)心在圖像平面中的位置,實(shí)時(shí)調整機器人頭部的2個(gè)電機轉動(dòng)角度,將目標置于圖像平面的中央位置。運動(dòng)控制系統中一個(gè)控制循環(huán)大約需要3毫秒的時(shí)間。在信息處理系統中,處理一幀圖像平均需要100毫秒左右的時(shí)間。由此可見(jiàn),視覺(jué)處理的周期要遠遠大于運動(dòng)控制的周期。因此在一個(gè)視覺(jué)處理周期之后,系統應該做好下一個(gè)視覺(jué)處理周期之內的運動(dòng)規劃,也就是做好后面多個(gè)控制周期之內的運動(dòng)規劃,這樣才能保證機器人的頭部以均勻、平緩,同時(shí)又是準確的速度來(lái)跟蹤目標。 4 實(shí)驗 在仿人機器人BHR1中,信息處理計算機的CPU為PⅣ2.4GHz,內存為512MB,運動(dòng)控制計算機的CPU為PIII700MHz,內存為256MB。SVS系統的采集速度為15幀每秒,采集圖像的大小為320×240像素。Memolink采用PCI接口,最大傳輸速率為1M bytes/s或1M words/s。 4.1 復雜背景下運動(dòng)目標的跟蹤 在運動(dòng)物體跟蹤實(shí)驗中,紅色小球作為目標在機器人的視野中做單擺運動(dòng)。為了驗證基于多圖像信息的目標識別算法,背景中放置了紅色的方塊和一個(gè)綠色的小球。實(shí)驗結果如圖5所示,第一行圖像是實(shí)驗場(chǎng)景,第二行圖像是左攝像頭的視頻序列,結果表明彩色目標運動(dòng)速度小于0.3m/s時(shí),機器人頭部仍可以很好地跟蹤目標的運動(dòng),并使其始終位于左側攝像機所采集到圖像的中央位置。在復雜的非結構環(huán)境的室內背景下,利用單一的圖像信息,系統很可能會(huì )跟蹤失敗。相同背景下,單一的顏色信息不能將紅色的小球和背景中的紅色方塊區分開(kāi)來(lái)。 圖 5 復雜背景下彩色目標跟蹤實(shí)驗 圖6顯示了紅色小球運動(dòng)狀態(tài)時(shí)的跟蹤過(guò)程,圖中的數據為實(shí)際數據的1/10抽樣?梢钥闯,在X軸方向上,目標質(zhì)心坐標到圖像中心的偏差在±30個(gè)像素以?xún),在y軸方向上,目標質(zhì)心坐標到圖像中心的偏差在±20個(gè)像素內。實(shí)驗說(shuō)明在物體的運動(dòng)過(guò)程中,跟蹤系統能夠實(shí)時(shí)跟蹤物體并將物體的質(zhì)心保持在左眼攝像機的中心。 圖6 目標在X、Y方向上的跟蹤誤差(像素) 5 結論 本文提出了基于Memolink通訊的雙計算機的仿人機器人的視覺(jué)跟蹤系統,系統能夠滿(mǎn)足仿人機器人實(shí)時(shí)視覺(jué)跟蹤的性能要求。 在未知的復雜環(huán)境中,基于深度、顏色和模版匹配的多圖像信息融合方案確保機器人穩定的從視頻序列中分割出運動(dòng)目標。 本文作者的創(chuàng )新點(diǎn): 本文提出并實(shí)現了一種基于MemoLink通訊的雙計算機的視覺(jué)跟蹤系統, 一臺計算機負責視頻信息的處理,另一臺計算機負責機器人頭部的運動(dòng)控制,實(shí)現了仿人機器人頭部對運動(dòng)目標的實(shí)時(shí)跟蹤。本文提出了一種集成深度、顏色和形狀信息的逐步逼近目標區域的快速目標分割方法,實(shí)現了復雜背景下目標物體的穩定分割。 |