“谷歌大腦背后的大腦”說(shuō),最快15年實(shí)現通用人工智能

發(fā)布時(shí)間:2016-8-3 13:08    發(fā)布者:eechina
關(guān)鍵詞: 人工智能 , 谷歌
來(lái)源:Forbes

《福布斯》網(wǎng)站今日刊文,專(zhuān)訪(fǎng)“谷歌大腦背后的大腦”Jeff Dean。Dean回顧了他自1999年加入至今在公司的不同角色,重點(diǎn)介紹了谷歌大腦的項目?jì)热。Dean 認為,谷歌保持創(chuàng )新的源泉在于保持部門(mén)的靈活性。軟件開(kāi)源與開(kāi)放的文化有助于這家公司吸引頂級人才,從事研發(fā)。他個(gè)人猜測,實(shí)現通用AI最快僅需15年。

Jeff Dean 是谷歌最早的雇員之一,他1996年從華盛頓大學(xué)計算機系獲得博士學(xué)位,1999年加入谷歌。他是谷歌成長(cháng)過(guò)程的關(guān)鍵人物,谷歌分布式計算基礎構架主要由他設計和完成,該構架支持了谷歌的大部分產(chǎn)品。

谷歌 CEO Sundar Pichai 曾說(shuō)谷歌將從根本上成為一家人工智能公司。作為系統和基礎構架部門(mén)的資深研究員,Dean和他的團隊對于實(shí)現這一目標至關(guān)重要。在這篇內容廣泛的訪(fǎng)談中,Dean 描述了他在谷歌的多種角色、公司的 AI 愿景,他對于谷歌如何在成為巨頭后保持企業(yè)奮斗精神的看法,以及許多其他話(huà)題。

谷歌如何與官僚主義戰斗

Peter High:Jeff Dean,你從1999年起就加入了谷歌,見(jiàn)證了谷歌的大部分歲月。請簡(jiǎn)要介紹一下在谷歌的 17 年間你的角色演變。

Jeff Dean:當我加入時(shí),公司還很小。我們都擠在帕洛阿爾托的大學(xué)街上的一座小辦公室里。我做的第一件主要任務(wù)是建造我們的第一個(gè)廣告系統。而后我用了四五年時(shí)間做抓取、索引和搜索系統,這些是每一次谷歌檢索都會(huì )用到的服務(wù)。之后,我大多與我的同事 Sanjay Ghemawat 等人一起工作,建造軟件基礎構架,谷歌用該構架來(lái)存儲和處理大數據集、做建立搜索索引或處理衛星圖像之類(lèi)的事。最近,我一直在做機器學(xué)習系統方面的工作。

High:你的涉獵范圍如此廣闊,你的職責也如此多樣,我猜想你不會(huì )有模式化的工作日常。你怎樣決定與公司內外的哪些人互動(dòng)?我很感興趣的是,你如何在你現在從事的不同事務(wù)上分配時(shí)間。

Dean:我沒(méi)有典型的工作日常。在前十四到十五年里,我沒(méi)有擔任任何管理職位,因此我有更多的自由時(shí)間來(lái)專(zhuān)注寫(xiě)代碼。在過(guò)去的幾年里,我在一些機器學(xué)習項目上擔任了管理職位,這對我來(lái)說(shuō)很有趣,也是一種新的學(xué)習體驗。在公司歷史上我做過(guò)許多項目,我想要與這些不同項目的進(jìn)展保持聯(lián)系,所以我常常會(huì )收到很多電子郵件。

我花許多時(shí)間來(lái)處理電子郵件,大部分時(shí)間用來(lái)刪除郵件,或是瀏覽郵件以了解正在發(fā)生什么。我有幾個(gè)只要有時(shí)間就會(huì )去做的技術(shù)項目,我在各種會(huì )議和設計評審之類(lèi)的事之余抽時(shí)間去做這些項目。

High: 谷歌在經(jīng)過(guò)戲劇性的增長(cháng)之后仍然是創(chuàng )新的典范。它仍然像當年小企業(yè)時(shí)期那樣雄心勃勃、富于創(chuàng )新,另一方面它已擁有了科技巨頭的人力和財力資源。公司如何與停滯和官僚主義戰斗,以便能讓自己保持敏捷,不被規模拖累?

Dean:從我加入時(shí)起,我們一直經(jīng)歷著(zhù)公司的持續增長(cháng)。在早年,我們每年都會(huì )將雇傭人數翻倍。如果用百分比來(lái)衡量,我們現在大大放慢了招聘新員工的速度,然而如果用絕對數量來(lái)衡量,我們仍然在經(jīng)歷著(zhù)實(shí)質(zhì)性增長(cháng),大約每年新增10%、20%的雇員。每當公司規模翻倍,這都會(huì )驅使我們重新思考公司做事的方式。那些在X規模水平上有效的方法,在2X規模水平上就不再有效了。我們已經(jīng)解決了如何讓我們的企業(yè)風(fēng)格、工程方法、組織結構、團隊動(dòng)力適應新的規模。

我認為,對我們的成長(cháng)幫助很大的一件事是,我們傾向于把工作分岔成許多不同領(lǐng)域,這些領(lǐng)域與谷歌正在做的其他東西保持一定的獨立。建造能帶來(lái)互聯(lián)網(wǎng)接入的高空熱氣球,這種項目就和搜索服務(wù)之間沒(méi)多大關(guān)系。我們實(shí)質(zhì)上擁有多個(gè)不同的活躍項目,這些項目不像核心業(yè)務(wù)內部的項目那樣需要大量的溝通,由此我們可以獲得規模和效率。

High:據我理解,谷歌/Alphabet之間的分離也體現了這種邏輯——試圖保持敏捷性,同時(shí)將各種不同的活動(dòng)分離開(kāi)?梢赃@么說(shuō)嗎?

Dean:可以。我認為這使得 Alphabet下的其他一些部門(mén)能更獨立的運行。關(guān)于這種規模上的翻倍,我想說(shuō)的第一點(diǎn)是,這確實(shí)帶來(lái)了一些變化,過(guò)去我們每個(gè)人都在同一座辦公樓里工作,現在每個(gè)人都需要在不同的辦公樓間往返。

另一件事是,過(guò)去我們的工程人員都位于山景城,后來(lái)我們在蘇黎世、紐約、東京和西雅圖都建立了工程機構。有一段時(shí)間,我們同時(shí)擁有這五個(gè)機構,而它們也都發(fā)展得更龐大。之后的短短幾年里,我們從五個(gè)工程機構發(fā)展到三十五個(gè)工程機構,因為我們感到,我們可以在世界各地找到那些有天分的人,并在他們附近建立機構吸引他們。這使得我們必須重新思考我們如何將工程方面的努力組織起來(lái)。

如果你只有一家小機構,那么你大概不應該讓員工去做一百件事;他們應該只去做少數幾件事,并專(zhuān)注于將它們做好。一些小機構曾經(jīng)以山景城總部的做法為榜樣,他們會(huì )去看山景城的人在做什么;他們發(fā)現山景城的人在做一百件不同的工作,于是他們以為自己也應該去做一百件不同的工作。我們經(jīng)歷周折才找到一種更好的方式,把分布在各地的工程機構的員工都調動(dòng)起來(lái)。

個(gè)人猜測:最快 15 年實(shí)現通用人工智能

High:谷歌 CEO Sundar Pichai 曾說(shuō),從長(cháng)期看,硬件設備將退隱,而計算將從移動(dòng)優(yōu)先演化到人工智能優(yōu)先。關(guān)于這個(gè)人工智能優(yōu)先的世界,你將如何表述谷歌的愿景?

Dean:我認為我們已經(jīng)從桌面計算轉移到了移動(dòng)計算,現在每個(gè)人都隨身攜帶者計算設備。隨著(zhù)設備持續降價(jià),語(yǔ)音識別和其他替代性的用戶(hù)界面變得更加實(shí)用,這些將改變我們與計算設備互動(dòng)的方式。設備將隱退到背景中,環(huán)繞在附近,讓我們能夠隨時(shí)與他們說(shuō)話(huà),就想我們能與信賴(lài)的同伴說(shuō)話(huà)一樣。

它們將幫助我們獲得更多信息,或幫我們完成各種任務(wù)。我認為這是機器學(xué)習前進(jìn)的主要目標之一:讓計算機能像人類(lèi)同伴一樣提供建議,在需要時(shí)搜尋更多的信息,以及這一類(lèi)的事情。我認為未來(lái)五到十年將會(huì )令人振奮。

High:隨著(zhù)技術(shù)進(jìn)步以及人工智能各種目標的實(shí)現,似乎人們不再將這些已實(shí)現的東西稱(chēng)為人工智能。也就是說(shuō),人工智能似乎總是以“將來(lái)時(shí)”的形態(tài)被談?wù)。你如何定義人工智能的界限?

Dean:我認為真正的人工智能將是這樣一個(gè)系統,它能執行人類(lèi)水平的推理、理解,完成復雜任務(wù)。我們很明顯尚未達到這一點(diǎn),但你說(shuō)的很對,我們已取得了很多進(jìn)展。五年前,還根本不可能讓電腦從圖像中生成對圖片進(jìn)行人類(lèi)水平的語(yǔ)句描述。如今,電腦生成的句子可能會(huì )說(shuō),“這是一張男子在網(wǎng)球場(chǎng)上手持網(wǎng)球拍的圖片”。與此同時(shí),人類(lèi)可能會(huì )說(shuō),“這是一張網(wǎng)球手準備發(fā)球的圖片”。

人類(lèi)所做的描述更精妙,不過(guò)計算機已經(jīng)可以生成接近人類(lèi)水平的圖片說(shuō)明,這一事實(shí)本身就是一個(gè)巨大的進(jìn)步。這只是過(guò)去五到六年里人們將更復雜的機器學(xué)習模型投入應用所取得的進(jìn)展之一。當人們將模型應用于更大的數據集和更多的計算時(shí),結果將變得更好。

High:你認為我們離通用人工智能還有多遠?

Dean:如果你問(wèn)不同的人,就會(huì )得到不同的答案。出于純粹的猜測,我認為我們離通用人工智能的距離是 15 年到 50 年——或許 15 年左右的可能性更大。

High: 正如你提到的,語(yǔ)言是關(guān)鍵要素,而谷歌的許多人工智能創(chuàng )新都圍繞著(zhù)語(yǔ)言,無(wú)論是從網(wǎng)絡(luò )中讀取和理解事物,還是從事智能對話(huà)或理解文本。你能否談?wù),通過(guò)什么路徑能讓機器更好地闡釋信息?在你看來(lái),什么是能夠讓我們哪怕不能實(shí)現也至少能接近通用人工智能的階梯?你在這方面做哪些工作?

Dean:我認為,一個(gè)重要的領(lǐng)域是信息檢索領(lǐng)域,而這一領(lǐng)域正是谷歌早期工作的基礎。按照傳統,信息檢索并不試圖真的理解當用戶(hù)輸入查詢(xún)時(shí)想要什么。它更多地是關(guān)于查找那些包含某個(gè)單詞或相近單詞的文檔。有趣的是,最近四五年來(lái),我們已能夠開(kāi)始研發(fā)一些技術(shù),這些技術(shù)能更好地理解“汽車(chē)”這個(gè)單詞的本質(zhì)。當我們知道“汽車(chē)”、“汽車(chē)們”、“車(chē)”、“客車(chē)”、“皮卡”等單詞都以某種方式聯(lián)系在一起時(shí),我們就能夠以平滑的方式匹配文檔,使許多語(yǔ)言理解任務(wù)導向更好的結果。

我們不僅能理解詞語(yǔ),我們也已經(jīng)快要能夠理解兩個(gè)句子互為同義句。這一點(diǎn)是新的語(yǔ)言理解水平的起點(diǎn),在新的水平上,我們將能夠以機器學(xué)習的方式理解長(cháng)得多的文本。

我們對未來(lái)幾年的一個(gè)良好目標是,我們希望實(shí)現:輸入數百或數千份文件,然后可以就這些文件的內容進(jìn)行對話(huà);蛟S系統將會(huì )總結文件的內容,或許系統將對文件內容進(jìn)行提問(wèn)或回答。我認為,這才是真正能展現高水平語(yǔ)言理解的東西。

谷歌大腦:谷歌的產(chǎn)業(yè)研究院

High: 似乎你和你的團隊的一些進(jìn)展已經(jīng)開(kāi)始進(jìn)入谷歌產(chǎn)品了,例如谷歌新的對話(huà)虛擬助理“Google Assistant”、谷歌用來(lái)與亞馬遜 Echo 競爭的”Google Home”、用來(lái)提供面向谷歌服務(wù)的對話(huà)界面的消息應用”Allo”。你對近期谷歌推出的這些新產(chǎn)品和服務(wù)有何看法?

Dean:我現在領(lǐng)導的研究團隊名叫谷歌大腦。我們專(zhuān)注于建造可用于機器學(xué)習的大規模計算系統,以及進(jìn)行高級機器學(xué)習研究。我們同時(shí)擁有這兩方面的人才,而他們聯(lián)合起來(lái)解決問(wèn)題,這常常會(huì )帶來(lái)顯著(zhù)的進(jìn)步,這種進(jìn)步是只具有機器學(xué)習技能或只具有大規模計算技能的人無(wú)法單獨取得的。我認為這是我們團隊取得眾多成功的原因之一。它使我們既在這兩個(gè)領(lǐng)域取得成功,也讓我們能夠將“為問(wèn)題投入多少計算”和“如何為我們關(guān)心的問(wèn)題訓練大型、強大的模型”方面的最高水平進(jìn)一步提升。

我們認識到,我們的一些研究成果能被用來(lái)改善谷歌目前的產(chǎn)品,這使得我們對于從事長(cháng)程研究感到相當樂(lè )觀(guān)。我們將和產(chǎn)品團隊一起工作并對他們說(shuō),“嘿,我們認為這個(gè)機器學(xué)習研究將會(huì )在你的產(chǎn)品的這個(gè)情境中有用處”。有些時(shí)候我們只是簡(jiǎn)單地把東西移交對方。有些時(shí)候,需要我們團隊和產(chǎn)品團隊之間的深度協(xié)作才能讓研究成果在產(chǎn)品中實(shí)現。

谷歌大腦研究團隊的一項工作,是研發(fā)一個(gè)名叫“序列到序列學(xué)習”的模型。這里的想法是,你使用一個(gè)輸入序列來(lái)預測某個(gè)輸出序列。這聽(tīng)起來(lái)很小,但它可以和許多你很想解決的現實(shí)問(wèn)題匹配起來(lái)。他們發(fā)表的論文最初是在語(yǔ)言翻譯語(yǔ)境下的。輸入序列可能是一個(gè)句子中的英文單詞,每次輸入一個(gè)句子的序列。

這個(gè)模型被訓練為輸出等效的法語(yǔ)單詞以創(chuàng )造一個(gè)與英文句子同義的法語(yǔ)句子。這與其他機器翻譯系統很不一樣,別的系統通常是運用機器學(xué)習或統計模型對問(wèn)題編碼和分割,再把它縫合起來(lái)。與這些方法相反,新的模型是徹底的端到端的機器學(xué)習系統,你只要向系統喂入不同語(yǔ)言的同義句對子,系統就會(huì )學(xué)習從一個(gè)語(yǔ)言翻譯到另一個(gè)語(yǔ)言。

在其他情境中,這個(gè)一般模型也很有用。Gmail 團隊采用了該模型,把它用作“智能回復”功能的基礎。在該功能中,輸入序列是一段收到的電子郵件,而輸出序列是對來(lái)信情境下可能回復的預測。例如,你可能收到一封郵件說(shuō),“嗨,我們想邀請你參加感恩節晚餐,請告訴我們你能否參加! 系統所產(chǎn)生的回復可能是“是的,我們很想參加。需要我們帶點(diǎn)什么來(lái)?”或者“抱歉,我們不能來(lái)”,或者其他與情境相關(guān)的內容。這里使用的是同一個(gè)模型,只是在不同的數據集上得到了訓練。

High:谷歌大腦的研究和突破應用,怎么樣在谷歌更加傳統的產(chǎn)品中進(jìn)行部署?

Dean:我們已經(jīng)開(kāi)始正式推進(jìn)這一進(jìn)程。5年前,當我們第一次開(kāi)始組建機器學(xué)習研究組,調查使用大量的計算和深度卷積網(wǎng)絡(luò )處理問(wèn)題的情況,當時(shí)公司里還沒(méi)有多少人在使用這種方法。后來(lái),我們發(fā)現少數看起來(lái)可以有效應用的幾個(gè)地方,其中包括語(yǔ)音識別系統,所以我們跟語(yǔ)音識別團隊的同事緊密合作,把深度神經(jīng)網(wǎng)絡(luò )加入到語(yǔ)音識別系統中去,從而在識別精準度上獲得了顯著(zhù)的提升。然后,我們又與幾個(gè)計算機視覺(jué)相關(guān)的團隊合作,比如圖像識別和一些街景團隊,其中包括,用圖像中的原始像素去訓練模型做一些有意思的事情,從圖像中提取文本或者理解圖像(是美洲豹,垃圾車(chē)或是別的什么東西)。

有趣的是,隨著(zhù)時(shí)間的過(guò)去,更多的團隊開(kāi)始采用這些方法,因為他們會(huì )聽(tīng)到別的團隊說(shuō)在嘗試一些別的東西,并且獲得了好的結果。不然就是,我們可以把他們與這些團隊聯(lián)系起來(lái),或者我們可以提供一些在他們特定的問(wèn)題語(yǔ)境下如何使用這些方法的建議。后來(lái),我們把這些都正規化,所以現在我們就有了一個(gè)團隊來(lái)做這些擴展工作。首先是聯(lián)系想要在產(chǎn)品中用到這些機器學(xué)習模型的團隊,他們會(huì )描述自己遇到的難題,一般情況下,我們團隊會(huì )說(shuō):“這似乎跟其他團隊所遇到的難題很像,我們的解決方案很有用,試試看我們的方案,然后給我們反饋”。

2011年到2012年間,公司使用深度神經(jīng)網(wǎng)絡(luò )技術(shù)的團隊只有十幾組,現在已經(jīng)超過(guò)200多組,有上千人在訓練這類(lèi)的模型,使用的就是我們團隊搭建的軟件。

谷歌的開(kāi)源和開(kāi)放

High:你也是TensorFlow的主要創(chuàng )建者之一。和其他公司一樣,谷歌也聚焦于開(kāi)發(fā)開(kāi)放資源的AI技術(shù)。你對使用開(kāi)放資源AI技術(shù)的原因和優(yōu)勢有什么看法?

Dean:現在有許多不同的框架,用于展示不同的機器學(xué)習算法,它們都是開(kāi)源的項目。我認為,能有很多的選擇是一件不錯的事,但是,如果我們能開(kāi)發(fā)出一些東西,讓機器學(xué)習社區中更多的人可以在后臺使用并且努力去改進(jìn),并且,這些努力中,很多都是在做相同的工作,所以,把他們都集中在一個(gè)資料庫,讓多數人都能采用,這就再好不過(guò)了。

其背后的原因是,這會(huì )讓機器學(xué)習的新想法得以更好地表達。傳統的方法是,人們如果有了新的想法,會(huì )寫(xiě)一篇論文,做實(shí)驗,并且不會(huì )把代碼也發(fā)表出來(lái),讓人們去重復這些實(shí)驗。作為一個(gè)研究者,你會(huì )看別人的論文,并且嘗試對比自己和他人的技術(shù)。通常,由于這是用論文而不是代碼進(jìn)行表示,你需要猜測他們究竟做了什么。論文,從本質(zhì)上看,會(huì )忽略掉許多細節,而這并不是有意的。他們可能會(huì )說(shuō):“我們使用了一個(gè)較低的學(xué)習率”,但是,你關(guān)心的是,他們使用的學(xué)習率是0.0001,并且經(jīng)過(guò)幾萬(wàn)步的調整后,怎么降到了0.005。如果有一個(gè)軟件框架,讓人們能夠用代碼展示想法,并用表格的方式發(fā)表這些研究模型和想法,會(huì )讓社區內的思想流動(dòng)更加迅速。

對于我們來(lái)說(shuō),這也便利了我們與谷歌之外的人的合作。通常,我們會(huì )有暑期實(shí)習生。過(guò)去,這些實(shí)習生在實(shí)習結束后還要寫(xiě)實(shí)習期間工作的論文,但是,那時(shí)候他們已經(jīng)離開(kāi)谷歌了,所以無(wú)法再使用谷歌的計算機,所以這會(huì )讓他們很難繼續完成論文,或者再進(jìn)行一兩次實(shí)驗,F在, 他們可以隨時(shí)使用這些開(kāi)放資源或TensorFlow來(lái)做這件事,甚至也可以在平臺上找到其他能幫忙的人。我們正在教許多谷歌的工程師使用機器學(xué)習,其中最通用的工具就是TensorFlow。

High:谷歌的一個(gè)優(yōu)勢在于擁有很多人工智能和機器學(xué)習人才。谷歌研究部門(mén)負責人 Peter Norvig 估計全球超過(guò)5%的機器學(xué)習菁英都在谷歌工作。谷歌是如何讓自己對機器學(xué)習頂尖人才變得有如此吸引力的?考慮到機器學(xué)習或者說(shuō)人工智能涉及到計算機科學(xué)、工程學(xué)、神經(jīng)科學(xué)、生物學(xué)、數學(xué)等不同學(xué)科,你認為如何才能確保招聘來(lái)的這些人才任人適用呢?

Dean:我們工作的范圍很廣,人才也各種各樣。我發(fā)現,當你把一批不同專(zhuān)業(yè)背景的人聚在一起解決問(wèn)題時(shí),往往比召集一批專(zhuān)業(yè)背景類(lèi)似的人效果更好。從整體上說(shuō),你做完了一件沒(méi)有人能夠單獨做出來(lái)的事情。我們的機器學(xué)習團隊就是一個(gè)很好的例子。里面有像我這樣的人,擁有很多開(kāi)發(fā)大規模計算系統的經(jīng)驗,也有世界頂級的機器學(xué)習研究者。把這些不同類(lèi)型的人聚在一起就組成了一個(gè)非常強大的團隊。機器學(xué)習正在影響醫療、機器人等等很多不同的領(lǐng)域,這是非常好的現象。我們團隊中還有幾位神經(jīng)科學(xué)家。

很快我們將開(kāi)始一個(gè)叫做“谷歌大腦實(shí)習培訓”(Google Brain Residency Program)的計劃。我們招人到谷歌和Google Brain一起工作一年,基本上是學(xué)習如何進(jìn)行機器學(xué)習相關(guān)的研究。我們現在已經(jīng)得到了大量的申請簡(jiǎn)歷,最終項目會(huì )留下 28 個(gè)人。他們來(lái)自不同的背景——計算機科學(xué)、統計學(xué)、數學(xué)、生物學(xué)、物理學(xué),處在職業(yè)生涯的不同階段——有人剛剛讀完本科,有些人則博士后畢業(yè),還有的已經(jīng)在產(chǎn)業(yè)界工作了一兩年。我認為這將是一個(gè)很好的組合,解決問(wèn)題時(shí)都帶來(lái)很多不同的觀(guān)點(diǎn)。

High:我很好奇,有很多不以技術(shù)為中心的傳統公司也會(huì )使用人工智能和機器學(xué)習,你會(huì )在多大程度上與這些傳統公司交流和工作?你怎樣看AI技術(shù)的發(fā)展曲線(xiàn)?顯然,這在公司之間甚至是行業(yè)之間都是不同的。但也有一些領(lǐng)先的傳統行業(yè)開(kāi)始利用人工智能,包括醫療和金融領(lǐng)域,這些機構有著(zhù)大量的非結構化數據需要處理。你曾經(jīng)是否與這些傳統行業(yè)的公司打過(guò)交道,或者和它們討論人工智能在更為傳統的環(huán)境中的發(fā)展過(guò)程?

Dean:其他行業(yè)的大多數公司可能沒(méi)有谷歌或者其他科技公司在應用機器學(xué)習方面表現的好。我認為,隨著(zhù)時(shí)間的推移,最終大多數公司都將越來(lái)越多地使用機器學(xué)習,因為機器學(xué)習將會(huì )變得非常強大,為他們的業(yè)務(wù)帶來(lái)變革。我們已經(jīng)與一些大型的醫療機構討論了要建立合作關(guān)系,看看機器學(xué)習可以為該領(lǐng)域的某些問(wèn)題做些什么。我們最近推出了一個(gè)云機器學(xué)習產(chǎn)品,可以讓人們在谷歌的云平臺上運行機器學(xué)習算法。顯然,有許多公司有興趣了解在他們的業(yè)務(wù)的環(huán)境中該如何使用該產(chǎn)品。

我認為這種轉變可能要經(jīng)過(guò)幾個(gè)階段才會(huì )發(fā)生,在這些階段中,你可以使用AI技術(shù)和機器學(xué)習的方法來(lái)解決問(wèn)題。在一些領(lǐng)域里,理解圖像的內容東西對很多行業(yè)來(lái)說(shuō)都是有用的。谷歌和其他公司正在提供簡(jiǎn)單易用的界面,而你無(wú)需知道任何機器學(xué)習的東西。你可以只給出一張圖片,然后說(shuō)“告訴我這張圖里有什么”,任何沒(méi)有機器學(xué)習專(zhuān)業(yè)知識的軟件工程師都可以這么使用。他們得到的信息可能是“照片里有個(gè)體育場(chǎng),人們在那里打棒球,而且圖像中還有一堆文字,文字是……”即使沒(méi)有應用機器學(xué)習,這也會(huì )是非常有用的。

然后將會(huì )有已經(jīng)開(kāi)發(fā)好的模型,可以用公司的數據重復訓練這個(gè)模型來(lái)得到一個(gè)定制化的解決方案,而且無(wú)需研究核心的機器學(xué)習技術(shù)來(lái)開(kāi)發(fā)一個(gè)全新的模型。一個(gè)很好的例子是序列到序列的工作,我們現在已經(jīng)應用到谷歌的六七個(gè)不同的問(wèn)題中。另一個(gè)很好的例子是一個(gè)采集圖像的模型,它能發(fā)現圖像中有趣的部分。這個(gè)通用模型的一個(gè)應用是,檢測街景圖像中的文本位置。你想閱讀所有的文本,但是首先,你必須能在店門(mén)、路牌上等這類(lèi)地方找到它們。這種通用模型在醫療環(huán)境中也有用,比如在診斷糖尿病性視網(wǎng)膜病變時(shí),你有一個(gè)視網(wǎng)膜的掃描圖像,你想找到該掃描圖像上的疾病指標,這時(shí)你就能用上這個(gè)模型了。用的是相同的模型結構,你只是在不同的數據中指出病變。你不是在用文本高亮顯示的街景圖像,而是在醫生已經(jīng)圈好病變部位的視網(wǎng)膜圖像上指出它。我認為該通用模型的方法將很好地解決很多不同類(lèi)型的問(wèn)題。

本文地址:http://selenalain.com/thread-171449-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页