(蘋(píng)果推出了iPhone 4S語(yǔ)音技術(shù),人們第一次可以用語(yǔ)言和手機進(jìn)行人工智能對話(huà),不過(guò)這并不是一個(gè)新的想法,早在1987年蘋(píng)果就發(fā)布過(guò)一個(gè)視頻“知識導航”闡明了這一概念,一個(gè)折疊式的平板運行Mac系統,半透明的可折疊式屏幕,看上去就像是《星際迷航》里的設備,機器里的人工智能助手可以和用戶(hù)侃侃而談,并提供圖表和數據,這一切和Siri都是那么的相似。) iPhone 4s發(fā)布會(huì )現場(chǎng)蘋(píng)果演示的Siri技術(shù)相當神奇,機器可以根據人的語(yǔ)音自動(dòng)發(fā)起各種動(dòng)作并將應用和數據信息提供到屏幕上,那么Siri目前能實(shí)現多少功能,有多少命令可以被識別呢,TUAW整理了一份命令列表大家可以關(guān)注下: Address Book Querying Contacts
Calendars Adding Events
Setting Alarms
Sending Messages
Checking Up on Friends
Directions
Sending Texts
Playback
Creating and finding notes
Phone calls
Requesting reminders
Checking Stocks
Weather Checking the Forecast
Looking up information
Using Wolfram Alpha
![]() 業(yè)內人士認為,蘋(píng)果限制Siri的使用是合理的,因為Siri集成了大量功能,例如學(xué)習用戶(hù)的自然語(yǔ)音,理解用戶(hù)所說(shuō)的英語(yǔ)、法語(yǔ)和德語(yǔ)詞匯。不過(guò),老款iPhone的用戶(hù)可能會(huì )對無(wú)法使用這一功能感到失望。 蘋(píng)果的“Let’s Talk iPhone”大會(huì )已經(jīng)結束,留下了很多值得期待的東西。其中很重要的一項是其即將發(fā)布的最新款iPhone 4S中的Siri軟件。 收購 去年 4 月,蘋(píng)果收購一家名為 Siri 的公司,Siri公司為iPhone開(kāi)發(fā)了一款名為Siri的“虛擬個(gè)人助理”應用,該應用能夠為手機提供自然語(yǔ)言搜索功能。這就是現在iPhone 4S中的Siri。 Siri用到的核心技術(shù)為自然語(yǔ)言認知、解析、搜索和匹配,就像一個(gè)手機上的語(yǔ)音搜索引擎一樣;蛟S你會(huì )說(shuō),一個(gè)功能如此受限的手機居然能夠做比強 大的電腦還多的事情。沒(méi)錯,從處理能力上講,這些功能對于一款哪怕是雙核處理器的智能手機來(lái)講也太難。不過(guò),Siri可以利用網(wǎng)絡(luò )的力量。事實(shí)上,這正是 Siri的精妙所在。Siri的數據源都是開(kāi)放API的權威數據源,如維基百科和Wolfram Alpha,前者以其儲存的知識量和知識的權威性著(zhù)稱(chēng),而后者則主要擅長(cháng)智能分析。如果蘋(píng)果能夠將美國航空的數據源拿過(guò)來(lái),那你就可以通過(guò)Siri定票 了。 此外,因為Siri能夠幫助你把語(yǔ)言轉化成文本,因此可以幫你快速處理日常生活中的很多“瑣事”。比如發(fā)郵件或者發(fā)Tweets,只需用口頭告訴 Siri就行,不需要用手慢慢的打字。而Todo List也可能不需要你精心打理了,想想你每天浪費在安排事情上的時(shí)間有多少! 我們知道,亞馬遜的Slik瀏覽器借助其強大的云后端幫你獲取和處理數據,其實(shí)Siri的原理與此類(lèi)似。如果沒(méi)有Wolfram Alpha強大的計算和分析能力,如果沒(méi)有維基百科提供的海量數據,Siri恐怕也沒(méi)法達到預想的功能。所有這些,再次證明了開(kāi)放數據的無(wú)限可能性。(美帝的)世界因此更美好。 噪音 當然,當你在大街上對著(zhù)Siri說(shuō)話(huà)的時(shí)候,也可能產(chǎn)生噪音。試想,如果你和朋友各自問(wèn)自己的Siri的話(huà)都被對方的Siri聽(tīng)到了,Siri是否困惑?當你的妻子問(wèn)她的Siri一些關(guān)于你的未知秘密時(shí),你又做何想? 國內類(lèi)似產(chǎn)品 國內有類(lèi)似產(chǎn)品如何?據說(shuō),你跟手機聊天時(shí),手機可以把你的話(huà)錄下來(lái),然后通過(guò)網(wǎng)絡(luò )傳輸到接受端,接受端有專(zhuān) 門(mén)的接受員“解析”你的話(huà),然后為你提供精準服務(wù)。這是國內某運營(yíng)商的一款產(chǎn)品。哪怕你說(shuō)四川話(huà)也能幫你“解析”。當然,這種產(chǎn)品肯定要比Siri這樣所 謂的智能機器強很多。只是其成本和速度不如Siri,更重要的時(shí)它的scalability不強。 iPhone 4S全新的語(yǔ)音控制功能名為Siri,令iPhone4S變身為一臺智能化機器人,利用Siri用戶(hù)可以通過(guò)手機讀短信、介紹餐廳、詢(xún)問(wèn)天氣、語(yǔ)音設置鬧鐘等。Siri可以支持自然語(yǔ)言輸入,并且可以調用系統自帶的天氣預報、日程安排、搜索資料等應用。還能夠不斷學(xué)習新的聲音和語(yǔ)調,提供對話(huà)式的應答。 事實(shí)上,語(yǔ)音控制一直都是人們夢(mèng)寐以求的功能之一,蘋(píng)果在iPhone 3GS中就加入了這一功能。但不得不說(shuō)的說(shuō),直到Siri的出現,蘋(píng)果才真正將手機革命帶入了語(yǔ)音控制這塊戰場(chǎng)中,用戶(hù)也真正實(shí)現了同電子設備的人機交互。 應該說(shuō)任天堂的Wii游戲機第一次實(shí)現了人機在動(dòng)作感應上的互動(dòng),顛覆了人們傳統的游戲方式與游戲體驗。蘋(píng)果的第一代iPhone則第一次實(shí)現了用戶(hù)與移動(dòng)設備在觸摸面板上的互動(dòng),并將大尺寸觸摸面板提升到了業(yè)內標準的高度,F在,幾乎所有的智能手機和平板電腦都沿用了蘋(píng)果公司的這一策略。 如今,蘋(píng)果希望Siri能夠成為語(yǔ)音控制領(lǐng)域的業(yè)內標準,說(shuō)不定在不久的未來(lái),我們將有能力不用觸摸、點(diǎn)擊或者打字,而僅僅通過(guò)說(shuō)話(huà)的方式便完成對設備的控制。 就語(yǔ)音控制本身來(lái)說(shuō),這一技術(shù)也有著(zhù)相當充分的發(fā)展空間。通過(guò)語(yǔ)音控制用戶(hù)將可以大大減少關(guān)注手機屏幕的時(shí)間與頻率,更好的關(guān)注自己手頭的事情。而且,語(yǔ)音控制可以非常有效的提高那些正在運動(dòng)、開(kāi)車(chē)甚至是視力受損用戶(hù)的使用體驗。 除此之外,對大部分用戶(hù)來(lái)說(shuō),通過(guò)語(yǔ)音方式來(lái)組織句子比在鍵盤(pán)上一個(gè)個(gè)字母的敲擊要容易許多。 當然,在實(shí)際使用過(guò)程中,Siri同樣面臨著(zhù)不小的挑戰。我們都知道,語(yǔ)音控制在嘈雜環(huán)境中使用效果不佳,且往往在面對繁多地方口音或者語(yǔ)調較快的句子時(shí)的識別效果較差。 最近,我曾經(jīng)在A(yíng)pp Store中下載過(guò)幾個(gè)語(yǔ)音識別應用進(jìn)行試用,但在實(shí)際使用過(guò)程中,這些軟件無(wú)一例外的都令我感到十分沮喪。 但即便如此,我仍愿意打賭Siri將是一款與眾不同的產(chǎn)品。畢竟,蘋(píng)果此前就為業(yè)內掀起了兩次革命,也許Siri會(huì )成為這第三次革命的導火索。 語(yǔ)音識別 但在周二的iPhone 4S發(fā)布會(huì )上,最受關(guān)注的功能卻是一款名為“Siri”的語(yǔ)音識別技術(shù)。蘋(píng)果展示了多種人機對話(huà)場(chǎng)景,包括管理日程安排、尋找餐館以及查詢(xún)天氣。 美國市場(chǎng)研究公司Forrester分析師弗蘭克·吉利特(Frank Gillett)說(shuō):“這邁出了很大的一步。能夠與設備對話(huà)將為用戶(hù)提供更多選擇,而不僅僅是用手指在設備上點(diǎn)點(diǎn)劃劃! 但這項技術(shù)是否足以讓iPhone 4S成為消費者的必備品,并在一眾競爭對手中脫穎而出,仍然有待觀(guān)察。美國市場(chǎng)研究公司CCS Insight分析師約翰·杰克遜(John Jackson)說(shuō):“目前還不清楚Siri是否足以吸引用戶(hù)購買(mǎi)。歷史經(jīng)驗表明,用戶(hù)不會(huì )太看重這類(lèi)技術(shù)! 具體應用 語(yǔ)音識別技術(shù)并不新穎,早在十幾年前就已經(jīng)被應用于PC。就連車(chē)載GPS等科技含量較低的設備也已經(jīng)配備了語(yǔ)音功能。谷歌也在一年多以前面向Android智能手機操作系統推出了語(yǔ)音識別技術(shù)。該公司最近還在搜索引擎中整合了語(yǔ)音識別功能。 但吉利特表示,蘋(píng)果的技術(shù)不僅可以識別語(yǔ)音,還可以根據用戶(hù)所說(shuō)的話(huà)執行任務(wù),使之更加接近真正的“個(gè)人助理”。 在展示過(guò)程中,蘋(píng)果高管問(wèn)iPhone 4S,今天是否需要帶雨衣?這款手機回答到:“今天看起來(lái)的確要下雨!痹诹硗庖欢蜸iri技術(shù)的演示視頻中,一位正在慢跑的用戶(hù)要求手機預訂一個(gè)餐館。手機回答道:已經(jīng)預訂過(guò)了。 蘋(píng)果稱(chēng),Siri最初僅支持英語(yǔ)、法語(yǔ)和德語(yǔ),很快還將支持更多語(yǔ)種。該公司去年早些時(shí)候收購了語(yǔ)音識別創(chuàng )業(yè)企業(yè)Siri。 其他升級 2007年發(fā)布的iPhone如今已經(jīng)成為全球最暢銷(xiāo)的智能手機。但由于可供摩托羅拉、HTC和三星等手機廠(chǎng)商免費使用,因此谷歌Android操作系統的合并份額仍然高于iPhone。 iPhone 4S采用蘋(píng)果自主設計的雙核A5處理器,視頻和圖形性能都得以提升。攝像頭則從500萬(wàn)像素提升到800萬(wàn)像素。 蘋(píng)果還公布了即將推出的云計算服務(wù)的更多細節。iPhone和iPad用戶(hù)將可以把音樂(lè )、照片和其他數據存儲在蘋(píng)果的遠程服務(wù)器中,流程與谷歌和亞馬遜的云計算服務(wù)類(lèi)似。 美國市場(chǎng)研究公司Gartner分析師范·貝克(Van Baker)表示,真正能夠令iPhone 4S脫穎而出的是Siri技術(shù)!斑@項技術(shù)很先進(jìn),他們把門(mén)檻抬高了!彼f(shuō)。 |