人機接口或人機界面(HMI)是系統和人之間進(jìn)行交互和信息交換的媒介。傳統的HMI主要借助RS232、RS422/RS485等串行通信接口,以及網(wǎng)口、USB等數據接口來(lái)實(shí)現設備的人機交互,而展現在我們面前的“觸摸屏”、導航按鈕等是HMI產(chǎn)品中非常重要的硬件部分,它替代了原有的鼠標和鍵盤(pán)的部分功能。 隨著(zhù)技術(shù)的不斷演進(jìn),HMI的交互方式和體現形式都發(fā)生了很大的改變,F在的人機交互可能是有形的,也可能是無(wú)形的。比如,我們可以發(fā)出一個(gè)口頭命令或者通過(guò)手勢來(lái)控制智能手機,也可以用語(yǔ)音控制車(chē)輛的導航系統,選擇我們要去的目的地。 有關(guān)HMI的三大猜想 無(wú)論是在功能上還是概念上,如今的HMI都發(fā)生了翻天覆地的變化。從技術(shù)和應用角度,我們認為HMI將在如下三個(gè)方面進(jìn)一步影響未來(lái)的人機交互方式。 屏幕的變化 在消費電子中,曲面屏、折疊屏開(kāi)始大量使用,傳感器技術(shù)的進(jìn)步帶動(dòng)屏下指紋的應用。在汽車(chē)中,HMI的體現形式主要是屏幕和顯示器,乘客可以通過(guò)按下屏幕上的按鈕來(lái)操作音頻系統的輸出,比如選擇輸入設備、收音機調臺、瀏覽導航指令等。 未來(lái),乘用車(chē)中的屏幕將被賦予更多功能,尺寸也會(huì )越來(lái)越大,一個(gè)完全可定制的全數字儀表盤(pán)顯示屏將獲得廣泛應用,F在,特斯拉的15英寸縱向觸摸屏已經(jīng)將加熱、通風(fēng)和空調(HVAC)控制等功能納入其中,接下來(lái)應該還會(huì )賦予大屏更多的功能。 語(yǔ)音有望優(yōu)先成為HMI的下一個(gè)發(fā)展目標 專(zhuān)家預測,到2022年,80%的車(chē)載HMI將集成語(yǔ)音控制功能,這還不包括智能手機中使用的語(yǔ)音識別系統。隨著(zhù)語(yǔ)音識別技術(shù)的進(jìn)步,其應用也在不斷擴展,F在,大多數HMI使用語(yǔ)音命令來(lái)控制音頻系統和接聽(tīng)電話(huà)等。 未來(lái),自然語(yǔ)言命令還將用來(lái)執行更加復雜的功能,從車(chē)輛的自適應巡航控制,到智能手機和可穿戴設備的非接觸控制和操作。也可以說(shuō),將語(yǔ)音用戶(hù)界面(VUI)應用于電子設備中將成為人機交互發(fā)展的大趨勢,F在,基于人工智能(AI)的語(yǔ)音智能助理基本解決了VUI存在的“聽(tīng)不清楚”這一弊端,語(yǔ)音控制 + AI + 機器學(xué)習,三者相結合的語(yǔ)音用戶(hù)界面,它們的應用前景,想想都會(huì )讓人無(wú)比激動(dòng)。 手勢識別在非接觸HMI中開(kāi)始走紅 與觸摸屏相比,手勢控制具有很多優(yōu)點(diǎn):例如,用戶(hù)不必觸摸設備就可以從遠處發(fā)出命令。另外,手勢控制還將HMI從二維用戶(hù)界面擴展至三維空間。全球著(zhù)名的車(chē)企寶馬公司已將手勢技術(shù)應用在部分車(chē)型中,乘客做出的手勢動(dòng)作被攝像頭“看到”后即可執行車(chē)內的功能。當然,我們也可以把手勢控制看作是語(yǔ)音控制的替代方案,尤其是在那些不適合大聲講話(huà)的公共區域。 VUI:HMI的未來(lái)之星 新冠肺炎的爆發(fā),為了避免因接觸可能帶來(lái)的病毒傳播,在工作場(chǎng)所、零售店、醫院等環(huán)境中,非接觸HMI的需求量急劇上升。隨著(zhù)全球經(jīng)濟的重新開(kāi)放,這一趨勢有進(jìn)一步加速的可能。為此,我們大膽預測,未來(lái)10年,非接觸HMI尤其是VUI的發(fā)展將駛入發(fā)展的快車(chē)道。該市場(chǎng)的發(fā)展也為半導體公司、OEM/ODM、近距離傳感供應商和軟件公司提供了商機。 在一眾非接觸HMI技術(shù)中,為什么VUI這么被業(yè)界看好呢?其實(shí),早在2014 年,微軟首席執行官 Satya Nadella就曾預言:“人聲就是新的接口”。根據普華永道(PwC)在2018年所作的一項消費者調查顯示,90%的受訪(fǎng)者熟悉語(yǔ)音助手,72%的受訪(fǎng)者對這項技術(shù)有第一手使用經(jīng)驗。 ![]() 圖1:語(yǔ)音助手在各種電子設備中的應用情況(圖源:PwC 2018年消費者調查問(wèn)卷) VUI之所以獲得消費者的廣泛認可,一方面它能解放我們的雙手,提高通信的便利性;另一方面它有效增強了客戶(hù)體驗,畢竟我們說(shuō)話(huà)的速度比打字快得多,通過(guò)對非接觸控制系統的口頭命令,人與機器的交流將變得更加自然和有效。隨著(zhù)語(yǔ)音識別技術(shù)的不斷成熟,VUI在未來(lái)幾年內將惠及數十億用戶(hù)。專(zhuān)家預測,在未來(lái)5年內,幾乎每個(gè)應用程序都將以某種方式集成VUI技術(shù)。 AI使機器變得越來(lái)越智能化,因此,加入了AI和機器學(xué)習的VUI將極大地改善語(yǔ)音接口的個(gè)性化體驗。據研究公司Tractica的預測,基于A(yíng)I的語(yǔ)音智能助理在HMI中的作用越來(lái)越重要,到2025年,全球市場(chǎng)價(jià)值有望達到46億美元。未來(lái)幾年內,80%的車(chē)載HMI將集成語(yǔ)音識別系統,這還不包括谷歌語(yǔ)音(Google voice)和蘋(píng)果Siri等智能手機助理應用。在汽車(chē)中,語(yǔ)音命令最常用于控制汽車(chē)中的媒體播放器,為導航系統設置目的地。隨著(zhù)機器學(xué)習算法的發(fā)展,ADAS的功能中也將引入VUI。在智能手機中,高端機型幾乎都擁有語(yǔ)音控制手機操作的功能。 在智能家居中,語(yǔ)音控制系統將家居自動(dòng)化提升到了一個(gè)新的水平,像Amazon Echo、Google Nest和Samsung SmartThings這樣的智能家居集線(xiàn)器允許用戶(hù)使用簡(jiǎn)單的語(yǔ)音命令來(lái)管理連接的設備。與此同時(shí),VUI也在逐步滲透到我們的工作場(chǎng)所,并使之朝著(zhù)數字化方向發(fā)展。Gartner預測,到2023年25%的員工與應用程序的交互將通過(guò)語(yǔ)音進(jìn)行。 深耕關(guān)鍵技術(shù) 總體來(lái)看,非接觸HMI主要涉及9大關(guān)鍵技術(shù),即:基于攝像頭的手勢識別及認證、手勢超聲或雷達、眼球跟蹤、語(yǔ)音命令、基于手勢和位置的光電二極管傳感器、接近式觸摸屏、運動(dòng)傳感器融合、短距無(wú)線(xiàn)電以及其他非接觸技術(shù)。根據研究機構Touch Display Research最新發(fā)布的《非接觸HMI 2020》報告,目前,非接觸HMI技術(shù)已經(jīng)吸引了多達390余家公司的參與,他們重點(diǎn)深耕非接觸傳感器,以及軟件和系統集成等領(lǐng)域,其中,提供語(yǔ)音命令和基于攝像頭的手勢識別的公司最多。 針對HMI應用,多家技術(shù)供應商都采取了積極的行動(dòng),比如,TI公司以營(yíng)造一個(gè)完整的生態(tài)系統為主,其HMI產(chǎn)品組合包括廣泛的I/O、圖形處理、語(yǔ)音識別等,提供開(kāi)發(fā)各種接口所需的幾乎所有組件、軟件和支持。TI的方案還實(shí)現了以太網(wǎng)供電,以進(jìn)一步降低布線(xiàn)的復雜性,甚至支持無(wú)線(xiàn)連接。 例如,TIDEP-01013是具有毫米波傳感器和Sitara處理器的手勢控制HMI參考設計;TIDEP0066語(yǔ)音識別參考設計則采用TI嵌入式語(yǔ)音識別 (TIesr) 庫,突出了C5535和C5545 DSP器件的語(yǔ)音識別能力。 ![]() 圖2:語(yǔ)音識別參考設計原理框圖(圖源:TI) 由于背景噪音的干擾,語(yǔ)音識別的效果通常不是那么完美。優(yōu)質(zhì)MEMS麥克風(fēng)和先進(jìn)的音頻處理功能是促使語(yǔ)音控制設備真正適用于日常環(huán)境的關(guān)鍵因素。英飛凌的VUI市場(chǎng)策略則是通過(guò)逐步建立起來(lái)的合作伙伴生態(tài)系統,向行業(yè)提供一系列創(chuàng )新的參考平臺和即用型新一代VUI解決方案。目前可用的解決方案主要來(lái)自于A(yíng)aware、CEVA、Creoir、SoundAI、Sugr和XMOS等公司。2017年初,英飛凌與XMOS共同提出的全新語(yǔ)音控制方案采用的是智能麥克風(fēng),它使語(yǔ)音助手能在其他噪音當中準確識別定位人聲。其中,英飛凌的XENSIV雷達和硅麥克風(fēng)傳感器組合能識別揚聲器與麥克風(fēng)的位置和距離,同時(shí)利用XMOS的遠場(chǎng)語(yǔ)音處理技術(shù)來(lái)捕捉語(yǔ)音。 ![]() 圖3:英飛凌聯(lián)合合作伙伴推出是部分VUI參考設計(圖源:根據英飛凌網(wǎng)站信息整理) 結語(yǔ) 時(shí)間回到20世紀50年代初,語(yǔ)音識別技術(shù)初現萌芽,只是彼時(shí)的系統只能理解數字。到了2017年,這項技術(shù)已經(jīng)取得長(cháng)足的進(jìn)步,幾乎達到可以精確地理解人類(lèi)語(yǔ)言的水平,因此奠定了VUI商用的基礎。 人機交互是實(shí)現自動(dòng)化和智能化的前提。經(jīng)過(guò)幾十年的發(fā)展,按鈕/按鍵這種HMI方式正在從我們的生活中退出,取而代之的觸摸屏在很多應用場(chǎng)合也會(huì )逐漸被全新一代的VUI替代。技術(shù)和創(chuàng )新永無(wú)止境,雖然今天的VUI尚不完美,但它的優(yōu)點(diǎn)已被消費者廣泛認可。畢竟,人類(lèi)最有效的溝通方法就是語(yǔ)言,未來(lái)的機器應該也不會(huì )例外。 來(lái)源:貿澤電子 作者:M博士 |