基于顏色特征的物體識別系統對于不同顏色的分別提取和識別 隨著(zhù)計算機科學(xué)和自動(dòng)控制技術(shù)的發(fā)展,越來(lái)越多的不同種類(lèi)的智能機器人出現在生產(chǎn)生活中,視覺(jué)系統作為智能機器人系統中一個(gè)重要的子系統,也越來(lái)越受到人們的重視。 視覺(jué)系統是一個(gè)非常復雜的系統,它既要做到圖像的準確采集還要做到對外界變化反應的實(shí)時(shí)性,同時(shí)還需要對外界運動(dòng)的目標進(jìn)行實(shí)時(shí)跟蹤。因此,視覺(jué)系統對硬件和軟件系統都提出了較高的要求。目前比較流行的足球機器人技術(shù),它的視覺(jué)系統屬于比較典型的快速識別和反應類(lèi)型。 機器視覺(jué)系統是指用計算機來(lái)實(shí)現人的視覺(jué)功能,也就是用計算機來(lái)實(shí)現對客觀(guān)的三維世界的識別。人類(lèi)視覺(jué)系統的感受部分是視網(wǎng)膜,它是一個(gè)三維采樣系統。三維物體的可見(jiàn)部分投影到網(wǎng)膜上,人們按照投影到視網(wǎng)膜上的二維的像來(lái)對該物體進(jìn)行三維理解(對被觀(guān)察對象的形狀、尺寸、離開(kāi)觀(guān)察點(diǎn)的距離、質(zhì)地和運動(dòng)特征等的理解)。 機器視覺(jué)系統的輸入裝置可以是攝像機、轉鼓等,它們都把三維的影像作為輸入源,即輸入計算機的就是三維管觀(guān)世界的二維投影。如果把三維客觀(guān)世界到二維投影像看作是一種正變換的話(huà),則機器視覺(jué)系統所要做的是從這種二維投影圖像到三維客觀(guān)世界的逆變換,也就是根據這種二維投影圖像去重建三維的客觀(guān)世界。 機器視覺(jué)系統主要由三部分組成:圖像的獲取、圖像的處理和分析、輸出或顯示。圖像的獲取實(shí)際上是將被測物體的可視化圖像和內在特征轉換成能被計算機處理的一系列數據,它主要由三部分組成:照明,圖像聚焦形成,圖像確定和形成攝像機輸出信號。視覺(jué)信息的處理技術(shù)主要依賴(lài)于圖像處理方法,它包括圖像增強、數據編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內容。經(jīng)過(guò)這些處理后,輸出圖像的質(zhì)量得到相當程度的改善,既改善了圖像的視覺(jué)效果,又便于計算機對圖像進(jìn)行分析、處理和識別。 機器人視覺(jué)系統主要是利用顏色、形狀等信息來(lái)識別環(huán)境目標。以機器人對顏色的識別為例:當攝像頭獲得彩色圖像以后,機器人上的嵌入計算機系統將模擬視頻信號數字化,將像素根據顏色分成兩部分:感興趣的像素(搜索的目標顏色)和不感興趣的像素(背景顏色)。然后,對這些感興趣的像素進(jìn)行RGB 顏色分量的匹配。為了減少環(huán)境光強度的影響,可把RGB顏色域空間轉化到HIS顏色空間。 在足球機器人的彩色視覺(jué)系統中,程序是根據貼在機器人小車(chē)頂上的色標來(lái)識別機器人是屬于哪一隊,以及是幾號隊員的。由于在每個(gè)機器人小車(chē)頂上有兩種顏色的色標,分別是隊標和隊員標。因此,識別工作的第一步是把圖像中的每一個(gè)像素,根據顏色分類(lèi)到一組離散的色彩類(lèi)中。 顏色分類(lèi)常用的方法有線(xiàn)性色彩閾值法、最近鄰域法和閾值向量法等。 其中,線(xiàn)性色彩閾值法是用線(xiàn)性平面把色彩空間分割開(kāi)來(lái),其閾值的確定可采用直接取閾值和通過(guò)自動(dòng)訓練來(lái)獲取目標顏色范圍等方法,也可以采用神經(jīng)網(wǎng)絡(luò )和多參數決策樹(shù)方法來(lái)進(jìn)行自學(xué)習,以獲得合適的閾值;而用最近鄰域分類(lèi)法分割圖像時(shí),則利用隸屬度函數,即根據最大的隸屬度來(lái)判斷這個(gè)顏色屬于哪個(gè)類(lèi);閾值向量法是先使用一組事先確定的閾值向量來(lái)把色彩值在色彩空間中的位置來(lái)判斷其屬于哪種顏色。 在色彩分類(lèi)之后,必須對各個(gè)顏色類(lèi)的點(diǎn)進(jìn)行處理,最終辨識出場(chǎng)上的各個(gè)敵我隊員和球在場(chǎng)上的位置和方向角。識別時(shí),通常的做法是對分類(lèi)后的像素進(jìn)行一次掃描,即將相鄰的同種顏色的像素連成色塊。 基于閾值向量的顏色識別 一、色彩空間選擇 對于采用基于彩色圖像分割的方法識別目標時(shí),首先要選擇合適的顏色空間,常用的顏色空間有RGB、YUV、HSV、CMY等。顏色空間的選擇直接影響到圖像分割和目標識別的效果。 RGB——最常用的顏色空間,其中亮度等于R、G、B3個(gè)分量之和。RGB顏色空間是不均勻的顏色空間,兩個(gè)顏色之間的知覺(jué)差異與空間中兩點(diǎn)間的歐氏距離不成線(xiàn)性比例,而且R、G、B值之間的相關(guān)性很高,對同一顏色屬性,在不同條件(光源種類(lèi)、強度和物體反射特性)下,RGB值很分散,對于識別某種特定顏色,很難確定其閾值和其在顏色空間中的分布范圍。因此通常會(huì )選擇能從中分離出亮度分量的顏色空間,其中最常見(jiàn)的是YUV和HSV顏色空間。 HSV——接近人眼感知色彩的方式,H為色調(Hue),S為色飽和度(Saturation),V為亮度(Value)。色調H能準確地反映顏色種類(lèi),對外界光照條件變化敏感度低,但是H和S均為R、G、B的非線(xiàn)性變換,存在奇異點(diǎn),在奇異點(diǎn)附近即使R、G、B的值有很小變化也引起變換值有很大的跳動(dòng)。 YUV——RGB顏色空間線(xiàn)性變化為亮度色彩空間。是為了解決彩色電視機與黑白電視機的兼容問(wèn)題而提出的。Y表示亮度(Luminance),UV用來(lái)表示色差(Chrominance)。YUV表示法的重要性是它的亮度信號(Y)和色度信號(U、V)是相互獨立的。所謂色差是指基色信號中的3個(gè)分量信號(即R、G、B)與亮度信號之差。 YUV格式與RGB存在如下關(guān)系: 二、閾值確定和色彩判斷 在確定閾值時(shí),首先通過(guò)采集樣本進(jìn)行訓練,從而得到預定的幾種顏色在YUV空間的分量的上下閾值,如圖2所示。 當一個(gè)待判定的像素在色彩空間中的位置落在這個(gè)長(cháng)方體中時(shí),就認為該像素屬于要找的顏色,從而完成對圖像顏色的識別。在Y空間中,Y值表示亮度,因它的變化很大,所以只考慮了U和V的值,在進(jìn)行顏色判斷時(shí),首先分別建立U、V的閾值向量。 在顏色識別后進(jìn)行圖像分割,在圖像分割中采用了種子填充算法,其整個(gè)種子的填充是和像素點(diǎn)的顏色同時(shí)進(jìn)行的,一開(kāi)始不是對所有的像素進(jìn)行處理,而是分塊進(jìn)行的。當中心點(diǎn)是所要識別的顏色時(shí),就以這個(gè)點(diǎn)為種子向四周擴散,并判定周?chē)袼攸c(diǎn)的顏色,直到填滿(mǎn)整個(gè)塊。 |