作者:保羅•戈拉塔 貿澤電子 這個(gè)圣誕節我其中一個(gè)女兒發(fā)起了一個(gè)家庭游戲叫作“聽(tīng)音”,我們玩的非常的開(kāi)心。它是“聽(tīng)力挑戰”的一種新形式,目前也變得很流行了。一個(gè)人戴著(zhù)耳機,不僅能夠隔絕外界的聲音,同時(shí)耳機里也隨機發(fā)出一些聲音,另一個(gè)人面對戴耳機的人隨機朗讀卡片上的短語(yǔ),比如“鴿子喜歡擁抱”,然后在沒(méi)有任何其他線(xiàn)索的情況下,戴耳機的玩家只能通過(guò)讀者嘴唇的變化來(lái)解讀“聽(tīng)到”的短語(yǔ)。 ![]() 這就像是一臺計算機,玩家嘗試從各方面檢測這個(gè)短語(yǔ)的線(xiàn)索——盡管都不是很明顯。玩家用他們的視覺(jué)來(lái)“聽(tīng)”并且破譯嘴唇的意思。這其實(shí)就是有趣的地方(當然。,因為通過(guò)視覺(jué)線(xiàn)索聽(tīng)到的信息與真正表達的意思相比是非常不同且隨機的。這個(gè)游戲利用了人類(lèi)在聽(tīng)覺(jué)和視覺(jué)方面調整的局限性。 計算機能夠做的更好嗎?現在的聊天機器人正在取得巨大的進(jìn)展,這些應用采用音頻技術(shù)、人工智能(AI)機器學(xué)習的結合,它們在對話(huà)中會(huì )產(chǎn)生類(lèi)似人類(lèi)的推理和反應。特別的是自然語(yǔ)言編程和神經(jīng)網(wǎng)絡(luò )的發(fā)展已經(jīng)融合在一起創(chuàng )建動(dòng)態(tài)的人機交互方式,這為公司和終端用戶(hù)帶來(lái)了非常重大的潛在好處。 技術(shù)正在趨于一致 盡管人工智能、機器學(xué)習和音頻技術(shù)方面的發(fā)展已經(jīng)有一段時(shí)間了,但是直到最近它們才融合在一起使得人機交互成為可能。 人工智能和自然語(yǔ)言編程 人工智能(AI)正在通過(guò)可操作的洞察力改變計算的價(jià)值,從自動(dòng)化和可擴展的處理過(guò)程到具體的知識,通過(guò)解釋一個(gè)程序和一系列過(guò)程,人工智能讓不同的公司對于它們面對的市場(chǎng)有新的理解,產(chǎn)生新的價(jià)值并且快速部署決策。 在音頻方面,AI能夠以各種方式幫助人類(lèi),這是因為我們在人類(lèi)語(yǔ)言和溝通中所使用的很多東西都可以被編程到機器中,通過(guò)自然語(yǔ)言處理(NLP)算法來(lái)計算出復雜的模式識別方案。目前設計師們正致力于讓機器能夠以雙向的方式使用自然人類(lèi)語(yǔ)言,例如: • 機器聽(tīng)取人類(lèi)語(yǔ)言,機器能夠理解人類(lèi)語(yǔ)言 • 機器理解人類(lèi)語(yǔ)言,機器以人類(lèi)語(yǔ)言作出回應 實(shí)現雙向通信編程的一個(gè)挑戰是確保算法的格式化,能夠理解周?chē)沫h(huán)境并且作出適當的響應,這被稱(chēng)為“框架問(wèn)題”——人類(lèi)的處理過(guò)程是確保計算機具有實(shí)現某種功能所需要的指令。為了能夠作出適當響應,機器必須被編程能夠理解明確的語(yǔ)言和正確的線(xiàn)索來(lái)理解表達背后的意圖和態(tài)度。 AI領(lǐng)域常用的編程語(yǔ)言包括Python、Java、Lisp、Prolog和C++。Python是一種非常流行的人工智能應用程序編程的計算機語(yǔ)言,它采用模塊化的體系結構,專(zhuān)注于不同領(lǐng)域的特定功能,它為語(yǔ)義結構定義了相對簡(jiǎn)單的規則,它的一些框架比如NLTK、genism和Quepy,都是NLP和文本處理的理想選擇。這些定義如下: • NLTK是一系列Pyhton開(kāi)源模塊的集合,支持自然語(yǔ)言工具箱。它提供了語(yǔ)言數據和詞匯資源,以便開(kāi)發(fā)者能夠在常用的操作系統中開(kāi)發(fā)NLP應用和進(jìn)行文本分析 • Genism是一個(gè)能夠從文檔中提取語(yǔ)義含義的模塊,剔除了不必要的復雜度 • Quepy則致力于將自然語(yǔ)言問(wèn)題轉換為從數據庫中查詢(xún)的問(wèn)題 機器學(xué)習和神經(jīng)網(wǎng)絡(luò ) 對于人類(lèi)而言,學(xué)習是我們與生俱來(lái)的智力、生物成熟和經(jīng)驗的自然組成部分。學(xué)習可以理解為不斷的自我提升,反饋可以用來(lái)不斷的調整以獲得更好的結果。通過(guò)人類(lèi)大腦的研究——尤其是神經(jīng)網(wǎng)絡(luò )——研究人員已經(jīng)將強大的機器學(xué)習概念化,并將其轉化為人工智能。神經(jīng)網(wǎng)絡(luò )包括很多電子互連,它們能夠影響許多神經(jīng)元的集體反應,這意味著(zhù)神經(jīng)網(wǎng)絡(luò )會(huì )影響更廣泛的行為,而不僅僅是單個(gè)神經(jīng)元。 與深度強化學(xué)習(或深度學(xué)習)相結合,通過(guò)反饋目標導向的表現可能是積極的或消極的,這些最近突破的創(chuàng )新性策略幫助解決了許多復雜的問(wèn)題,包括理解和回應自然人類(lèi)語(yǔ)言和對話(huà)。一些產(chǎn)品比如Seeed Studio的谷歌AIY語(yǔ)音工具包、ReSpeaker 2-Mics Pi Hat等,它們是開(kāi)始自然語(yǔ)言識別研究最有趣且快速的方法。 聊天機器人的興起 聊天機器人結合了音頻技術(shù)、AI和機器學(xué)習,它們接收傳感器的輸入使用算法來(lái)確定輸入的信息,然后根據這些信息作出相應的響應,同時(shí)它們也在根據不同的輸入信息進(jìn)行學(xué)習。聊天機器人是一種前瞻性的交流工具,目前被很多公司使用,包括亞馬遜、蘋(píng)果、Facebook和谷歌等,用來(lái)招待不同的客戶(hù)。通過(guò)機器學(xué)習和預測分析,聊天機器人正在不斷的提高。它們會(huì )感知、思考、決定以及行動(dòng)。聊天機器人應用疊加了人工智能、機器學(xué)習和深度學(xué)習(見(jiàn)圖1)。 ![]() 圖1:聊天機器人疊加了AI、機器學(xué)習和深度學(xué)習 公司采用聊天機器人來(lái)增加收入并且為客戶(hù)提供高水平的服務(wù)和安排無(wú)疑是明智的,F在的客戶(hù)對于技術(shù)都非常的熟悉,期望公司對他們的需求能夠快速有效的作出響應。像Siri、Alexa和Cortana這樣的聊天機器人現在對于我們大多數人來(lái)說(shuō)都已經(jīng)是家喻戶(hù)曉的名字了。工程師們仍然在努力讓它們模仿和超越人類(lèi)的行為表現,通過(guò)動(dòng)態(tài)的交互不斷的提升聊天機器人的智力,讓它們更加的人性化和吸引人。我們的目標是讓計算機在如下領(lǐng)域具有類(lèi)似人類(lèi)的能力: • 文本轉換成語(yǔ)音,語(yǔ)音轉換成文本 • 語(yǔ)調分析和個(gè)性化識別 • 自然語(yǔ)言分類(lèi)和語(yǔ)言翻譯 • 虛擬代理和會(huì )話(huà)編程 深度學(xué)習AI,比如谷歌開(kāi)發(fā)的DeepMind,使得計算機聽(tīng)起來(lái)不再像是計算機了。相反計算機可以合成聲音進(jìn)行現實(shí)的交談,從而通過(guò)了圖形測試——這意味著(zhù)它們的反應對于我們而言是如此的真實(shí),以至于我們無(wú)法分辨出它們是計算機。深度學(xué)習取得的這些結果是因為處理了大量的文本對話(huà)并且從這些對話(huà)中學(xué)習人類(lèi)語(yǔ)言和溝通。因為AI可以通過(guò)計算處理如此多的文本對話(huà)信息,因此它會(huì )建立一個(gè)足夠大且高效的經(jīng)驗框架,從這個(gè)框架中得出結論然后對人類(lèi)的對話(huà)作出適當的回應。 與人工智能學(xué)習溝通會(huì )話(huà)相似,它也可以學(xué)習使用獨特的人類(lèi)聲音和感情來(lái)回應。除了把聲音信息存儲到記憶中,人工神經(jīng)網(wǎng)絡(luò )還會(huì )處理成千上萬(wàn)個(gè)小時(shí)的人類(lèi)聲音,這個(gè)網(wǎng)絡(luò )還會(huì )推斷出一些具體的細節來(lái)模仿自然的人類(lèi)語(yǔ)言。這使得聊天機器人可以借助人工智能來(lái)選擇適合這個(gè)場(chǎng)合聲音和交流方式。人工智能只需要幾分鐘的時(shí)間就能將語(yǔ)音數據復制到語(yǔ)音中而不用管語(yǔ)音模式是怎樣的。 聊天機器人可以使用會(huì )話(huà)AI提供更個(gè)性化的服務(wù),聊天機器人采用更加人性化的自然語(yǔ)言會(huì )話(huà)方式,接收和反饋高質(zhì)量的信息,這預計會(huì )帶來(lái)更多的銷(xiāo)售機會(huì )和客戶(hù)滿(mǎn)意度。聊天機器人被設定為始終提供最高水平的客戶(hù)服務(wù)。 聊天機器人是不在意交流媒介的:它們不會(huì )介意你是通過(guò)電話(huà)、電子郵件還是社交媒體應用程序與它們溝通。在每個(gè)實(shí)例中,它都被設定為會(huì )作出合適的回應。聊天機器人是一款基于數字的、面向客戶(hù)的產(chǎn)品,它利用技術(shù)和數字世界的優(yōu)勢正在改變我們的業(yè)務(wù)環(huán)境,聊天機器人技術(shù)在某些業(yè)務(wù)方面也是合適的,包括銷(xiāo)售、市場(chǎng)營(yíng)銷(xiāo)、客戶(hù)服務(wù)和其他類(lèi)似的場(chǎng)景。在某些場(chǎng)景聊天機器人已經(jīng)開(kāi)始使用數字技術(shù)與公司進(jìn)行溝通,它們也是公司與客戶(hù)之間進(jìn)行溝通的一種非常好的選擇。 聊天機器人面臨的最重要的問(wèn)題之一是幫助它們解決特定的用戶(hù)需求。因為人類(lèi)是非常復雜的,所以要求聊天機器人能夠隨時(shí)理解用戶(hù)的請求,即使這個(gè)請求是不斷變化的。這需要聊天機器人能夠理解人類(lèi)語(yǔ)言的細微差別,從而有效的避免差錯。 通過(guò)與預測分析技術(shù)相結合,優(yōu)秀的人工智能聊天機器人似乎可以通過(guò)預測對話(huà)的方向來(lái)解讀與它們互動(dòng)的人的思想。這意味著(zhù)聊天機器人將會(huì )進(jìn)化,它們將會(huì )更專(zhuān)注于制定建議和作出預測——使它們能夠提升能力,會(huì )采取某些具體行動(dòng)。實(shí)現更加智能的聊天機器人是一項持續不斷的挑戰,設計師們正在努力使它們在與人類(lèi)互動(dòng)和需求的意識上達成一致性的反應。 總結:對話(huà)的形成 人工智能、機器學(xué)習和音頻技術(shù)的發(fā)展已經(jīng)不斷的融合在一起,通過(guò)聊天機器人實(shí)現了人類(lèi)一樣的人機交互應用。具備識別和解釋語(yǔ)音和音調的能力,聊天機器人正在成為提供基本客戶(hù)服務(wù)和類(lèi)似交互的一種虛擬代理——對語(yǔ)音輸入以及所暗示的信息具備一定的理解、響應以及學(xué)習的能力。 然而要做出適當的回應,機器必須被編程能夠理解明確的語(yǔ)言信息和正確的暗示信息,從而了解表達背后的意圖和態(tài)度。這是人機交互方面自然語(yǔ)言編程的進(jìn)步,使兩者間的雙向通信取得了進(jìn)展。神經(jīng)網(wǎng)絡(luò )也是一個(gè)關(guān)鍵的進(jìn)步,它使得機器能夠從以前的交互中不斷學(xué)習。 我期待著(zhù)未來(lái)某一天我的電腦能夠幫助我寫(xiě)技術(shù)文章。希望從它嘴里說(shuō)出的第一句話(huà)不是:“我認為那樣是不成熟的、業(yè)余的、愚蠢的,我建議你該這樣寫(xiě)……”,將來(lái)某一天只要它具備立刻能夠讀懂我嘴唇動(dòng)作的能力,人們就不會(huì )像玩“聽(tīng)音”游戲那樣嘲笑我了。 原文鏈接:https://www.mouser.com/applicati ... d-machine-learning/ ![]() |