來(lái)源:Digi-Key 作者:Jody Muelaner 機器視覺(jué)是一系列技術(shù)的融合,可使工業(yè)或其他的自動(dòng)化設備從圖像中獲得對當時(shí)環(huán)境的高級理解。如果沒(méi)有機器視覺(jué)軟件,具有不同色彩值和色調強度的數字圖像對于此類(lèi)設備來(lái)說(shuō)只不過(guò)是簡(jiǎn)單的、無(wú)任何聯(lián)系的像素集合。機器視覺(jué)讓計算機(通常與機器控制器相連)檢測這類(lèi)圖像中的邊緣和形狀,以使更高級別的處理程序識別出預先定義的目標物體。這種意義上的圖像并不局限于可見(jiàn)光譜中的攝影圖像;這類(lèi)圖像也可以包括使用紅外、激光、X 射線(xiàn)和超聲波信號獲得的圖像。 ![]() 圖 1:機器視覺(jué)正越來(lái)越多地用于更復雜的機器人應用。(圖片來(lái)源:John6863373 | Dreamstime.com) 在工業(yè)環(huán)境中,相當常見(jiàn)的機器視覺(jué)應用從物料箱中雜亂放置的許多零件中識別出特定的零件。在這里,機器視覺(jué)有助于拾放機器人自動(dòng)拾取正確的零件。當然,如果這些零件都以相同的方向整齊地排列在托盤(pán)上,那么用成像反饋來(lái)識別這些零件就相對簡(jiǎn)單了。然而,功能強大的機器視覺(jué)算法可識別與攝像機有不同距離的物體(因此在成像傳感器上顯示為不同大小的圖像)以及與相機不同向的物體。 最復雜的機器視覺(jué)系統已經(jīng)實(shí)現了遠比從物料箱揀選零件更復雜的新興設計,例如,可能沒(méi)有比自動(dòng)駕駛汽車(chē)更復雜的識別了。 ![]() 圖 2:機器視覺(jué)使工業(yè)或其他系統能通過(guò)圖像對環(huán)境獲得高級了解。(圖片來(lái)源:Wikimedia) 與機器視覺(jué)有關(guān)的技術(shù) 機器視覺(jué)這一術(shù)語(yǔ)有時(shí)被保留下來(lái),以便參考那些能從圖像中提取信息的更成熟、更有效的數學(xué)方法。相比之下,計算機視覺(jué)一詞通常描述的是更現代、計算要求更高的系統——包括使用機器學(xué)習或人工智能 (AI) 的黑箱方法。然而,機器視覺(jué)也可作為一個(gè)包羅萬(wàn)象的術(shù)語(yǔ),包括從圖像中提取高級信息的所有方法;在這種情況下,計算機視覺(jué)描述了其基本的運行理論。 能從圖像中提取高級含義的技術(shù)比比皆是。在研究界,此類(lèi)技術(shù)通常被認為不同于機器視覺(jué)。然而實(shí)際上,所有這些都是實(shí)現機器視覺(jué)的不同方式...而且他們在許多情況下是重疊的。 數字圖像處理是數字信號處理的一種形式,涉及圖像增強、修復、編碼和壓縮。相比模擬圖像處理,其優(yōu)點(diǎn)是最大限度地減小噪音和失真以及有眾多算法可用。最初的一種圖像增強是用來(lái)校正第一批月球表面的近距離圖像的。在此過(guò)程中,使用了攝影測量制圖以及噪聲濾波器,并針對成像攝像機對準月球表面所產(chǎn)生的幾何失真進(jìn)行了修正。 ![]() 圖 3:DLPC350 集成電路 (IC) 控制器提供輸入和輸出觸發(fā)信號,使所顯示的模式與攝像機同步。該控制器與數字微鏡設備 (DMD) 配套使用,旨在為工業(yè)、醫療和安全設備提供 3D 機器視覺(jué)。事實(shí)上,其應用包括 3D 掃描以及計量系統。(圖片來(lái)源:Texas Instruments) 數字圖像增強通常涉及增大對比度,還可能針對視角和鏡頭失真進(jìn)行幾何校正。壓縮通常是通過(guò)將復雜信號近似為余弦函數組合來(lái)實(shí)現的——一種被稱(chēng)為離散余弦變換 (DCT) 的傅里葉變換。JPEG 文件格式是 DCT 最常見(jiàn)的應用。圖像修復也可以使用傅里葉變換來(lái)消除噪音和模糊。 攝影測量學(xué)采用某種特征識別來(lái)從圖像中提取測量結果。當從不同位置獲得同一場(chǎng)景的多幅圖像時(shí),這些測量結果可以包括 3D 信息。最簡(jiǎn)單的攝影測量系統采用比例尺測量圖像中兩點(diǎn)之間的距離。為此,通常需要在圖像中包含一個(gè)已知的參考比例。 特征檢測讓計算機識別圖像中的邊緣、拐角或點(diǎn)。這是攝影測量以及識別物體和運動(dòng)所需的第一步。Blob 檢測可以識別出邊緣過(guò)于光滑而無(wú)法進(jìn)行邊緣或拐角檢測的區域。 模式識別用于識別特定對象。在最簡(jiǎn)單的情況下,這可能意味著(zhù)需要在傳送帶上找到一個(gè)定義明確的特定機械部件。 3D 重構確定來(lái)自 2D 圖像物體的 3D 形態(tài)。這種功能可通過(guò)攝影測量方法來(lái)實(shí)現。其中,共同特征的高度(在不同觀(guān)測點(diǎn)的圖像中確定)采用三角測量來(lái)確定。單純使用 2D 圖像進(jìn)行 3D 重構也是可能的;在此,軟件也解釋了邊緣或陰影區域之間的幾何關(guān)系。 ![]() 圖 4:3D 掃描儀捕捉物體的 2D 圖像以構建其 3D 模型。在某些情況下,數字模型隨后會(huì )用于 3D 打印副本。(圖片來(lái)源:深圳創(chuàng )想三維科技股份有限公司) 人類(lèi)可以在大腦中利用線(xiàn)描畫(huà)法加工簡(jiǎn)單地重構出立方體——利用陰影圓重構出球體。陰影顯示了表面的坡度。然而,這種推導過(guò)程遠比想象中復雜的多,因為陰影是一維參數,而坡度則發(fā)生在二維情況下。這可能導致模棱兩可的情況——這是由描繪物理上不可能的物體的藝術(shù)驗證了的事實(shí)。 ![]() 圖 5:用計算機根據 2D 圖像確定工件的 3D 形狀充滿(mǎn)了挑戰。 機器視覺(jué)任務(wù)是如何排序的 通過(guò)從低級操作開(kāi)始,然后逐步推進(jìn)到高級操作,許多機器視覺(jué)系統都逐步地結合了上述技術(shù)。在最低級別下,圖像的所有像素都作為高帶寬數據保存。然后,序列中的每個(gè)操作都能識別圖像特征,并以相對較少的數據量來(lái)表示所關(guān)注的信息。 首先是圖像增強和修復的低級操作,其次是特征檢測。因此在使用多傳感器的情況下,可由專(zhuān)門(mén)針對單獨傳感器的分布式進(jìn)程來(lái)執行低級操作。一旦在單獨圖像中檢測到特征,就可進(jìn)行更高級的攝影測量——正如任何物體識別或其他依靠來(lái)自多個(gè)圖像和傳感器的組合數據的任務(wù)一樣。 直接計算和學(xué)習算法 在機器視覺(jué)情況下,直接計算是一組由程序員定義的數學(xué)函數。這些函數接受諸如圖像像素值之類(lèi)的輸入,產(chǎn)生諸如物體邊緣坐標之類(lèi)的輸出。相比之下,學(xué)習算法不是由人類(lèi)直接編寫(xiě)的,而是通過(guò)將輸入與期望的輸出相關(guān)聯(lián)的實(shí)例數據集進(jìn)行訓練的。因此,學(xué)習算法作為黑盒子使用,F在大多數此類(lèi)機器學(xué)習都采用了基于人工神經(jīng)網(wǎng)絡(luò )的深度學(xué)習來(lái)進(jìn)行計算。 ![]() 圖 6:iVu 系列的圖像傳感器可以通過(guò)類(lèi)型、尺寸、位置、方向和顏色來(lái)識別工件。機器視覺(jué)組件可以接受配置,并通過(guò)集成屏幕、遠程 HMI 或 PC 進(jìn)行監控。攝像機、控制器、鏡頭和燈都是預先集成的。(圖片來(lái)源:Banner Engineering Corp.) 如果基于直接計算,工業(yè)應用的簡(jiǎn)單機器學(xué)習往往更可靠,計算要求也更低。當然,通過(guò)直接計算所能達到的效果是有限的。例如,永遠不要希望執行人臉來(lái)識別所需的高級識別模式,特別是不要希望從擁擠公共空間的視頻資料中進(jìn)行識別。相比之下,機器學(xué)習能巧妙地處理此類(lèi)應用。因此,機器學(xué)習越來(lái)越多地被部署到低級機器視覺(jué)操作中就不足為奇了,具體包括圖像增強、修復和特征檢測。 改進(jìn)教學(xué)方法(不是算法) 深度學(xué)習技術(shù)的日趨成熟讓人發(fā)現,需要改進(jìn)的不是學(xué)習算法本身,而是算法的訓練方式。一種經(jīng)過(guò)改進(jìn)的訓練程序被稱(chēng)為以數據為中心的計算機視覺(jué)。在這里,深度學(xué)習系統接受由數千、數百萬(wàn)、甚至數十億張圖像組成的非常強大的訓練集——然后保存通過(guò)其算法從每張圖像中提取的合成信息。這些算法通過(guò)工作實(shí)例聯(lián)系來(lái)實(shí)現有效學(xué)習,然后參考“答案書(shū)”來(lái)驗證是否得出了正確數值。 有一個(gè)關(guān)于數字模式識別的老故事具有警醒作用。美國軍方曾經(jīng)打算利用機器視覺(jué)進(jìn)行目標識別,國防承包商的演示可靠地識別出了美制和俄制坦克。各種不同的坦克都能從供應商的航拍照片中一輛接一輛地正確區分出來(lái)。但是,當用五角大樓自己的圖片庫再次測試時(shí),該系統卻不斷地給出錯誤的答案。問(wèn)題是,國防承包商的圖片都描繪了沙漠中的美國坦克和綠地上的俄羅斯坦克。該系統沒(méi)有識別出不同的坦克,反而識別出了不同顏色的背景。識別標準是什么呢?學(xué)習算法需要有精心策劃的訓練數據才能發(fā)揮作用。 結論:機器人工作單元的安全愿景 機器視覺(jué)不再是一項利基技術(shù)。在目前開(kāi)來(lái),工業(yè)領(lǐng)域是機器視覺(jué)部署增長(cháng)最大的領(lǐng)域。在該領(lǐng)域,最引人注目的發(fā)展是目前機器視覺(jué)如何完善工業(yè)工廠(chǎng)的安全系統,即當工人在沒(méi)有佩戴安全帽、防護面具或其他合適的防護用品的情況下進(jìn)入工作區時(shí),該系統會(huì )發(fā)出警報或發(fā)出語(yǔ)音通知。機器視覺(jué)還可用于當叉車(chē)等移動(dòng)機械離人員太近時(shí)發(fā)出警示的系統。 這些和類(lèi)似的機器視覺(jué)系統有時(shí)可以取代工業(yè)機器人周?chē)挠卜雷o措施,以使操作更有效。機器視覺(jué)系統還可以取代或加強基于燈光防護的安全系統,這些安全系統只要發(fā)現工人進(jìn)入工作單元就會(huì )停止機械運行。當機器視覺(jué)監測到工作單元周?chē)墓S(chǎng)地面時(shí),該單元中的機器人有可能在人員靠近時(shí)逐漸減速。 隨著(zhù)工業(yè)環(huán)境設計的發(fā)展,以適應協(xié)作機器人和其他工作單元設備,使工廠(chǎng)人員可以安全地走動(dòng)(甚至在設備運行時(shí)),這些和其他基于機器視覺(jué)的系統會(huì )成為工廠(chǎng)流程中更常見(jiàn)的一部分。 |