“車(chē)聯(lián)網(wǎng)構筑語(yǔ)音技術(shù)應用新世界” 在蘋(píng)果Siri所引發(fā)的全球語(yǔ)音熱潮的推動(dòng)下,科大訊飛成為了中文語(yǔ)音識別領(lǐng)域的弄潮兒。然而一些有識之士深刻認識到,語(yǔ)音識別技術(shù)真正有價(jià)值的應用領(lǐng)域是在汽車(chē)駕駛,車(chē)聯(lián)網(wǎng)將成為語(yǔ)音技術(shù)應用領(lǐng)域的又一藍海。與科大訊飛走手機語(yǔ)音識別應用之路不同,車(chē)音網(wǎng)將語(yǔ)音識別應用的重點(diǎn)放在了汽車(chē)駕駛室內,并成功搭建了一個(gè)車(chē)載語(yǔ)音云平臺。 語(yǔ)音汽車(chē) 依托車(chē)載語(yǔ)音云平臺,駕駛者只要開(kāi)口說(shuō)話(huà),相關(guān)需求就能得到滿(mǎn)足。 1920年代生產(chǎn)的“Radio Rex”玩具狗是眼下有據可查的最早的語(yǔ)音識別器,當這只狗聽(tīng)到自己的名字時(shí),它就會(huì )從底座上彈出來(lái),嚇人一跳。那時(shí)候的語(yǔ)音識別技術(shù)是基于英文語(yǔ)音為基礎開(kāi)發(fā),而作為象形文字的中文語(yǔ)音識別與作為音節文字的英文語(yǔ)音識別有著(zhù)很大差別,而且也相對困難得多。 蘋(píng)果Siri(語(yǔ)音個(gè)人助理服務(wù))的問(wèn)世,展示出了語(yǔ)音識別技術(shù)在應用領(lǐng)域的非凡前景?拼笥嶏w則是借助蘋(píng)果Siri所引發(fā)的全球語(yǔ)音熱潮,成為在中文語(yǔ)音識別領(lǐng)域中異軍突起的企業(yè)。為此,中國移動(dòng)宣布斥資14億元現金戰略入股科大訊飛,成為第二大股東。 對于這一舉措,中國移動(dòng)方面稱(chēng),主要是由于看好語(yǔ)音技術(shù)的發(fā)展潛力,智能手機下一步的發(fā)展將會(huì )是以語(yǔ)音技術(shù)為主的人機互動(dòng)科技,而科大訊飛已于內地上市,在語(yǔ)音技術(shù)業(yè)務(wù)方面取得行業(yè)領(lǐng)先地位,基于此雙方形成了目前的資本合作格局。 其實(shí),語(yǔ)音識別技術(shù)并非蘋(píng)果的創(chuàng )舉,早期的聲碼器,可以看做是語(yǔ)音識別技術(shù)的雛形。在追溯中文語(yǔ)音識別技術(shù)起源時(shí),另一家公司的名字映入眼簾——車(chē)音網(wǎng);谑嗄暾Z(yǔ)音識別技術(shù)的研發(fā)耕耘,車(chē)音網(wǎng)成為為車(chē)主提供基于語(yǔ)音識別技術(shù)的智能輔助駕駛服務(wù)的領(lǐng)頭羊。 早在1999年,車(chē)音網(wǎng)創(chuàng )始人沈康麒所帶領(lǐng)的技術(shù)團隊就開(kāi)始投身語(yǔ)音識別技術(shù)的研發(fā),這群工程師也可以說(shuō)是國內研究中文語(yǔ)音識別技術(shù)最早的那撥人。因此,在語(yǔ)音識別技術(shù)研發(fā)道路上,科大訊飛并不孤單。 記者通過(guò)采訪(fǎng)發(fā)現,科大訊飛與車(chē)音網(wǎng)的底層技術(shù)原理和算法幾乎完全一致,但在對語(yǔ)音引擎理解、應用領(lǐng)域研究和業(yè)務(wù)發(fā)展方向等方面,兩家公司卻走著(zhù)幾乎完全不同的道路。車(chē)音網(wǎng)的核心團隊基于十余年語(yǔ)音識別技術(shù)的研發(fā)耕耘,深刻認識到,語(yǔ)音識別技術(shù)真正有價(jià)值的應用領(lǐng)域在車(chē)里,在手眼感官被占、行為受限的特定行為空間當中。 車(chē)音網(wǎng)致力于為車(chē)主提供基于語(yǔ)音識別技術(shù)的智能輔助駕駛服務(wù),并成功搭建了一個(gè)車(chē)載語(yǔ)音云平臺。依托該平臺,駕駛者只要開(kāi)口說(shuō)話(huà),相關(guān)需求就能得到滿(mǎn)足。憑借優(yōu)秀的語(yǔ)音技術(shù)基礎和卓越的用戶(hù)體驗,車(chē)音網(wǎng)在短短三年時(shí)間內就發(fā)展近20萬(wàn)用戶(hù)。 語(yǔ)音引爆車(chē)聯(lián)網(wǎng) 在車(chē)聯(lián)網(wǎng)服務(wù)大規模增長(cháng)的路上,人機交互的語(yǔ)音識別技術(shù)被認為是必備的入場(chǎng)券。 車(chē)音網(wǎng)所在的行業(yè)叫車(chē)聯(lián)網(wǎng)(Telematics),也就是車(chē)載信息服務(wù),即借助無(wú)線(xiàn)通信網(wǎng),為駕車(chē)人士提供諸如免提電話(huà)、道路救援、指路導航、車(chē)輛遠程診斷、預訂酒店等多樣化的汽車(chē)安全及信息服務(wù)。 在美國,車(chē)聯(lián)網(wǎng)市場(chǎng)規模已超過(guò)100億美元,但在中國,2009年車(chē)聯(lián)網(wǎng)才開(kāi)始起步。車(chē)聯(lián)網(wǎng)服務(wù)源自歐美,是一種結合了全球衛星定位系統和無(wú)線(xiàn)通信技術(shù)的汽車(chē)遠程信息服務(wù)。通俗地說(shuō),裝了Telematics的汽車(chē),就像是航線(xiàn)上的飛機,包括運行軌跡、車(chē)況等一切數據信息都能被服務(wù)中心及時(shí)掌握,而駕駛者也能通過(guò)無(wú)線(xiàn)網(wǎng)絡(luò )隨時(shí)與服務(wù)中心進(jìn)行聯(lián)系,及時(shí)獲取所需的信息和服務(wù)!奥飞峡煨、車(chē)下秘書(shū)、車(chē)上生活、車(chē)上辦公”是車(chē)聯(lián)網(wǎng)的本質(zhì)特征。 從產(chǎn)業(yè)鏈上來(lái)看,車(chē)聯(lián)網(wǎng)服務(wù)可以分為以移動(dòng)通信運營(yíng)商為主的后裝市場(chǎng)和以汽車(chē)廠(chǎng)商為主的前裝市場(chǎng)兩個(gè)部分。前者主要側重位置導航、實(shí)時(shí)路況、資訊娛樂(lè )等車(chē)載位置與信息服務(wù);而后者則集中于車(chē)輛診斷、碰撞緊急求助、被盜車(chē)輛追蹤、呼叫中心等汽車(chē)安防服務(wù)。 在歐美,車(chē)聯(lián)網(wǎng)服務(wù)已經(jīng)是駕駛者不可缺少的一項服務(wù)。譬如,通用ON-STAR(安吉星)在全美有5000萬(wàn)用戶(hù),且在通用車(chē)里使用比例高達到50%,但對中國車(chē)主而言,這還是一個(gè)全新的概念。 毫無(wú)疑問(wèn),這將是一個(gè)很龐大的市場(chǎng)。一個(gè)簡(jiǎn)單的數據對比或可以說(shuō)明,相對于中國過(guò)億的乘用車(chē)保有量相比,目前使用車(chē)聯(lián)網(wǎng)服務(wù)的還不足1%。無(wú)論是海外經(jīng)驗證明還是簡(jiǎn)單的邏輯分析,都可以得出這樣的結論:鑒于這樣的服務(wù)與個(gè)體生命密切相關(guān),“用戶(hù)黏性”非常好,其市場(chǎng)一旦爆發(fā),規模勢必驚人。 但三年時(shí)光匆匆過(guò),車(chē)聯(lián)網(wǎng)行業(yè)的發(fā)展依然是“雷聲大,雨點(diǎn)小”。談及現狀,業(yè)內普遍認為,一方面是這一行業(yè)還缺乏“殺手級”的應用,另一方面則是因為中國車(chē)主的消費觀(guān)念短期內難以改變,市場(chǎng)還需要逐步培育。 車(chē)音網(wǎng)副總裁陸凌濤分析稱(chēng),在前裝市場(chǎng),汽車(chē)廠(chǎng)商還沒(méi)有相關(guān)意識,即使有了意識后,也涉及一些汽車(chē)生產(chǎn)標準的調整,這需要時(shí)間;而在后裝市場(chǎng),目前多數人還是把車(chē)當奢侈品,而不是一個(gè)工具,這決定了消費習慣。 不過(guò),多數人相信,這一市場(chǎng)即將爆發(fā),而在車(chē)聯(lián)網(wǎng)服務(wù)大規模增長(cháng)的路上,基于人機交互的語(yǔ)音識別技術(shù)被認為是必備的入場(chǎng)券。陸凌濤說(shuō),在車(chē)載環(huán)境下用戶(hù)能做什么,受制于與汽車(chē)的交互方式。他認為,在車(chē)載環(huán)境下,用戶(hù)的主要集中力在于駕駛,人與車(chē)的交互必須在不影響駕駛的前提條件下進(jìn)行。語(yǔ)音識別技術(shù)則提供了這樣一種安全便攜的交互方式,用戶(hù)只需動(dòng)口,即可滿(mǎn)足在行車(chē)過(guò)程中撥打電話(huà)、位置導航、資訊播報、語(yǔ)音點(diǎn)歌、車(chē)輛診斷等伴隨式服務(wù)。 語(yǔ)音夢(mèng)回車(chē)里 通過(guò)語(yǔ)音識別技術(shù),車(chē)音網(wǎng)已經(jīng)幫車(chē)主實(shí)現了“動(dòng)口不動(dòng)手”的車(chē)上信息服務(wù)。車(chē)音網(wǎng)可以說(shuō)是國內首家通過(guò)智能手機實(shí)現車(chē)聯(lián)網(wǎng)服務(wù)的企業(yè),十幾年的語(yǔ)音識別領(lǐng)域耕耘最終在車(chē)聯(lián)網(wǎng)的應用領(lǐng)域迸發(fā)出火花。 蘋(píng)果公司在今年6月份舉行的全球研發(fā)者大會(huì )(WWDC)中提到,iPhone未來(lái)將會(huì )用一根數據線(xiàn)與汽車(chē)連接,駕駛者(用戶(hù))可以通過(guò)方向盤(pán)上的按鈕觸發(fā)Siri,包括豐田、捷豹在內等九大廠(chǎng)商已經(jīng)承諾將在未來(lái)一年內開(kāi)發(fā)支持iPhone Siri的接口。屆時(shí),駕駛者將能一邊駕駛,一邊和身旁這位上知天文下知地理的助手聊天。 令人興奮的是,這些設想早在三年前就已經(jīng)在車(chē)音網(wǎng)的業(yè)務(wù)規劃當中,通過(guò)藍牙技術(shù),車(chē)音網(wǎng)已經(jīng)實(shí)現手機與汽車(chē)的連接的產(chǎn)品化,通過(guò)語(yǔ)音識別技術(shù),車(chē)音網(wǎng)也已經(jīng)幫車(chē)主實(shí)現了“動(dòng)口不動(dòng)手”的車(chē)上信息服務(wù)。真正實(shí)現了將語(yǔ)音識別切入到人的實(shí)際生活場(chǎng)景中去。車(chē)音網(wǎng)整合了語(yǔ)音通訊、地圖、地理信息、音樂(lè )媒體等幾乎所有生活信息,然后進(jìn)行人性化的整合,并且用語(yǔ)音交互的方式表達出來(lái)。 通過(guò)切身的體驗,更加令人興奮的是,蘋(píng)果在WWDC上提出,未來(lái)的iPhone僅僅用一個(gè)觸發(fā)按鈕就能實(shí)現Siri與汽車(chē)的結合,而車(chē)音網(wǎng)卻已經(jīng)將這個(gè)按鈕裝到了車(chē)上,而且通過(guò)國際通用的藍牙技術(shù),這個(gè)按鈕能連接的手機當然不僅僅是iPhone,還有其他各類(lèi)的具備藍牙功能智能手機,還因為車(chē)音網(wǎng)的服務(wù)實(shí)現方式是建立在2G基礎上的IVR話(huà)音通道和基于3G通訊網(wǎng)絡(luò )的數據通道,所以甚至就連非智能手機都能聽(tīng)得懂車(chē)主的“發(fā)號施令”,就如同在你駕車(chē)的時(shí)候,身邊多了一個(gè)聽(tīng)得懂人話(huà)、幾乎無(wú)所不能的助手副駕。 在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域中看似簡(jiǎn)單的語(yǔ)音應用,在高速行駛、行為受限的車(chē)載應用場(chǎng)景中,卻并非那么簡(jiǎn)單。首要問(wèn)題就是語(yǔ)音識別技術(shù)的商用能力成為關(guān)鍵,噪音、麥克風(fēng)回聲、口音問(wèn)題等等都會(huì )深深的影響語(yǔ)音技術(shù)的識別率,而語(yǔ)音識別率的高低又直接影響用戶(hù)的體驗,同時(shí)也關(guān)系到語(yǔ)音技術(shù)開(kāi)發(fā)企業(yè)的核心競爭力。 “事實(shí)上,噪音和麥克風(fēng)回聲都有辦法建立模型來(lái)解決,但實(shí)現更高的語(yǔ)音識別率首先需要解決口音問(wèn)題,尤其在中國這個(gè)口音繁雜的環(huán)境下,不同地域不同口音的語(yǔ)料數據庫以及針對語(yǔ)料庫的語(yǔ)音模型分析至關(guān)重要!标懥铦f(shuō),要提高語(yǔ)音識別率,并不僅僅需要龐大資金的支持,還需要時(shí)間的積累。 據了解,在語(yǔ)料采集方面,沈康麒曾親自帶領(lǐng)一支數據團隊,專(zhuān)門(mén)在全國各地收集采錄不同口音、不同階段年齡、不同性別在不同環(huán)境下的真實(shí)語(yǔ)料。這樣的工作十余年來(lái)始終堅持不懈,并不惜耗資過(guò)億進(jìn)行特征提取、模型訓練,形成了世界上獨一無(wú)二的廣譜語(yǔ)音特征數據庫資源,這為車(chē)音網(wǎng)特有的商用級非特定人語(yǔ)音識別技術(shù)打下了堅實(shí)的基礎。 機會(huì )總是留給有準備的企業(yè)。 從2010年下半年開(kāi)始,汽車(chē)銷(xiāo)量在經(jīng)過(guò)大規?焖僭鲩L(cháng)后,增速放緩甚至出現了停滯,許多汽車(chē)廠(chǎng)商意識到需要通過(guò)差異化服務(wù)來(lái)增加銷(xiāo)量,而車(chē)聯(lián)網(wǎng)這一在歐美汽車(chē)行業(yè)發(fā)展了近十年的新興汽車(chē)信息服務(wù)被引進(jìn)后,幾乎成為了所有汽車(chē)廠(chǎng)商特別是國產(chǎn)汽車(chē)品牌尋求市場(chǎng)差異化的興奮劑。但當時(shí)由于國內很多汽車(chē)廠(chǎng)商缺乏相關(guān)的技術(shù)積累,只能找到技術(shù)相對成熟的第三方公司合作。 于是,國內一些車(chē)廠(chǎng)紛紛找到了車(chē)音網(wǎng)洽談合作。截至目前,奔騰、蓮花、斯巴魯、一汽豐田、一汽馬自達、安吉星等車(chē)廠(chǎng)及TSP(Telematics運營(yíng)服務(wù)商)紛紛開(kāi)始與車(chē)音網(wǎng)尋求合作打造語(yǔ)音服務(wù)平臺。車(chē)音網(wǎng)正逐漸成為中國車(chē)聯(lián)網(wǎng)行業(yè)中基于語(yǔ)音識別技術(shù)的人機交互平臺的主要提供商。 語(yǔ)音車(chē)的未來(lái) 陸凌濤表示,要達到更自然的人機交互,需要三個(gè)層面的努力:自然語(yǔ)言識別、人工智能和知識庫,缺一不可。 完美的語(yǔ)音技術(shù),或者人類(lèi)對這一技術(shù)的最終想象,早在上個(gè)實(shí)際80年代,就在美國的科幻電影《霹靂游俠》中的那輛聽(tīng)得懂人話(huà)的汽車(chē)上就已有所展現,直到近期,電影《鋼鐵俠》中的那位無(wú)所不能的智能管家、《機器管家》中的那位機器人,都在不斷體現著(zhù)人們對語(yǔ)音識別技術(shù)的應用渴望,這些機器(人)不僅能夠完美執行指令,而且還能夠讀懂人的感情。從這一意義上來(lái)說(shuō),從事語(yǔ)音識別研發(fā)的公司均存在著(zhù)巨大的潛在前景。但讓機器讀懂你在說(shuō)什么,這實(shí)在是一件浩大的工程。 陸凌濤表示,要達到更自然的人機交互,需要三個(gè)層面的努力:自然語(yǔ)言識別、人工智能和知識庫,缺一不可。而云計算和大數據時(shí)代的到來(lái),這些科幻小說(shuō)里的場(chǎng)景幾乎距離大眾只剩下“最后一公里”。云計算帶來(lái)的一個(gè)好處是,每個(gè)人的數據都是存儲在云端的,不管這個(gè)人到了哪里,他的數據都可以隨時(shí)調用,他的偏好都可以隨時(shí)下載下來(lái)。 設想這樣的場(chǎng)景,你在云端設置了一個(gè)叫“我的家”的地點(diǎn),然后當你對著(zhù)手機喊“我的家”時(shí),它會(huì )告訴你怎么走。但當你和你的汽車(chē)系統說(shuō)去“我的家”時(shí),它顯然并不能理解“我的家”是什么,因為它的數據和云端的數據是不相通的。 每個(gè)人每天用得最多的設備毫無(wú)疑問(wèn)是手機,你的大多數個(gè)人數據和個(gè)人偏好都被手機記錄了下來(lái)。如果每臺手機都是一個(gè)助手,顯然這個(gè)助手是眾多數碼助手中最了解你的。而汽車(chē)系統因為是相對獨立的,它并沒(méi)有像手機那樣,了解那么多你的偏好,甚至,它能知道你經(jīng)常在什么地點(diǎn)之間往返就已經(jīng)算是“聰明的汽車(chē)”了。 另一方面,目前每個(gè)汽車(chē)廠(chǎng)商研發(fā)的汽車(chē)系統都是相對獨立的,這給數據共享帶來(lái)了難度。設想某一智能汽車(chē)已經(jīng)了解了你的偏好,某一天你換車(chē)了,你得重新調教這輛車(chē),讓它更“懂”你。 于是,如果每個(gè)人開(kāi)車(chē)時(shí)都連上自己的手機,這時(shí)在你手機里記錄的個(gè)人偏好就被完整的移植到了汽車(chē)系統當中,哪怕這并不是你自己的車(chē),那一瞬間,這輛車(chē)也是完全懂你的。所以更智能的、更個(gè)性化的汽車(chē)系統,必將與手機密不可分,或者說(shuō),必將與手機記錄下來(lái)的用戶(hù)數據密不可分。 而這也恰是車(chē)音網(wǎng)眼中車(chē)聯(lián)網(wǎng)產(chǎn)業(yè)的最后一公里,讓你的車(chē)“聽(tīng)懂”你,讓你的車(chē)“更懂”你! 來(lái)源:證券時(shí)報 |