在經(jīng)歷了一個(gè)多世紀的研究后,人工智能 (AI) 最近變成了一個(gè)熱門(mén)并且異常重要的領(lǐng)域。尤其值得一提的是,模式識別和機器學(xué)習已經(jīng)發(fā)展到深度學(xué)習 (DL),這是一個(gè)比較新的名稱(chēng),指的是從經(jīng)驗中學(xué)習的人工神經(jīng)網(wǎng)絡(luò ) (NN)。DL目前已廣泛應用到了工業(yè)和日常生活中。您智能手機上的圖像和語(yǔ)音識別,以及從一種語(yǔ)言到另一種語(yǔ)言的自動(dòng)翻譯,就是DL發(fā)揮作用的兩個(gè)例子。 在講英語(yǔ)的盎格魯文化圈中,許多人以為DL是盎格魯文化圈國家的一項發(fā)明創(chuàng )造。但實(shí)際上,DL卻是在英語(yǔ)并非官方語(yǔ)言的國家發(fā)明的。首先,讓我們把目光投向過(guò)去,以整個(gè)計算史為背景了解AI的發(fā)展進(jìn)程。 早期的計算先行者 安提基特拉機械 (Antikythera Mechanism) 于公元前一世紀在希臘建造,是最早的機械計算機器之一。該裝置通過(guò)37個(gè)大小各異的齒輪運轉,用于預測天文現象 (圖1)。 ![]() 圖1:公元前1世紀希臘建造的安提基特拉機械 該裝置包含37個(gè)大小各異的齒輪,它被用來(lái)對天文現象進(jìn)行預測。(來(lái)源:DU ZHI XING/Shutterstock.com) 安提基特拉機械的先進(jìn)性在其后1600年內一直未被超越,直到紐倫堡的彼得·亨利因 (Peter Henlein) 于1505年開(kāi)始制造小型懷表。但是,與安提基特拉機械一樣,亨利因的機械也不是針對用戶(hù)給出的輸入來(lái)計算結果的通用機器。它們只是使用齒輪比來(lái)對時(shí)間做除法而已。手表將秒數除以60得到分鐘數,將分鐘數除以60得到小時(shí)數。 但在1623年,圖賓根的威廉·?ǖ (Wilhelm Schickard) 建造了首臺進(jìn)行基本算數的自動(dòng)計算機。緊隨其后的是1640年布萊斯·帕斯卡 (Blaise Pascal) 的Pascaline加法器。隨后在1670年,戈特弗里德·威廉·萊布尼茨 (Gottfried Wilhelm Leibniz) 發(fā)明了步進(jìn)計算器,這是首臺能夠進(jìn)行加、減、乘、除所有四種基本運算的機器。1703年,萊布尼茨發(fā)表了《二進(jìn)制算術(shù)闡釋》(Explanation of Binary Mathematics),這就是現在幾乎所有現代計算機上都在使用的二進(jìn)制計算方法。 數學(xué)分析和數據科學(xué)也在不斷發(fā)展。大約在1800年,卡爾·弗里德里!じ咚 (Carl Friedrich Gauss) 和阿德里安-馬里·勒讓德 (Adrien-Marie Legendre) 通過(guò)線(xiàn)性回歸(現在有時(shí)稱(chēng)為“淺層學(xué)習”)發(fā)展出了模式識別的最小二乘法。高斯就是使用了這種算法讓人們再次觀(guān)測到小行星谷神星。他分析了先前觀(guān)測的數據點(diǎn),然后使用多種技巧來(lái)調整預測算式的參數,從而準確預測了谷神星再次出現的位置,這讓高斯名聲大噪。 差不多在同一個(gè)時(shí)期,法國出現了第一臺實(shí)用的程控機器:由穿孔卡片編程的自動(dòng)織布機。1800年左右,約瑟夫·瑪麗·雅卡爾 (Joseph Marie Jacquard) 和同事就此成為了第一批事實(shí)上的程序員。 1837年,英格蘭的查爾斯·巴貝奇 (Charles Babbage) 設計了被稱(chēng)為“分析機”的更通用的程控機器。當時(shí)沒(méi)有人能夠把它造出來(lái),也許是因為它的設計仍然基于繁瑣的十進(jìn)制而不是萊布尼茲的二進(jìn)制運算。不過(guò),至少他設計的通用性次之的“差分機2號”在1991年造出的樣機表明能夠運行。 20世紀伊始,智能機器方向上的進(jìn)步大大加快。以下列出了1900年以來(lái)與AI發(fā)展相關(guān)的主要里程碑: ● 1914年,西班牙人萊昂納多·托雷斯·伊·克維多 (Leonardo Torres y Quevedo) 使用電磁元件建造了第一臺國際象棋自動(dòng)機。它能從任何位置開(kāi)始完成王車(chē)殘局而無(wú)需人工干預。當時(shí),國際象棋被認為是一種高智力水平的活動(dòng)。 ● 1931年,奧地利人庫爾特·哥德?tīng)?(Kurt Gödel) 提出了第一種基于整數的通用編碼語(yǔ)言,從而成為AI理論以及整個(gè)理論計算機科學(xué)的奠基者。他用這種編碼語(yǔ)言來(lái)描述通用的計算定理證明器,確定數學(xué)、運算和AI的基本限制。1960年代和1970年代,AI和專(zhuān)家系統中許多后來(lái)的工作都將哥德?tīng)柕姆椒☉糜诙ɡ碜C明和推論。 ● 1935年,美國數學(xué)家阿隆佐·邱齊 (Alonzo Church) 發(fā)表了哥德?tīng)?931年成果的擴展,解決了“可判定性難題”,也就是決策難題,引入了被稱(chēng)為“λ演算”的替代通用語(yǔ)言。這便是流行編程語(yǔ)言L(fǎng)ISP的基礎。英國的艾倫·圖靈 (Alan Turing) 在1936年使用了另一種同樣強大的理論結構重新構造了這項成果,現在這種結構被稱(chēng)為“圖靈機” (圖2)。他還提出了一種主觀(guān)AI測試。 ![]() 圖2:英國人艾倫·圖靈在1936年使用被稱(chēng)為圖靈機的理論結構重構了流行編程語(yǔ)言L(fǎng)ISP。(來(lái)源:EQRoy/Shutterstock.com) ● 1935年至1941年間,康拉德·楚澤 (Konrad Zuse) 建造了第一臺具有實(shí)用意義并且可以工作的程序控制計算機Z3。在1940年代,他還設計了第一種高級編程語(yǔ)言,并用它編寫(xiě)了第一個(gè)通用國際象棋程序。1950年,楚澤制造出世界第一臺商用計算機Z4,比第一臺UNIVAC早了幾個(gè)月。 ● 盡管“AI”這一名稱(chēng)是約翰·麥卡錫 (John McCarthy) 在1956年的達特茅斯會(huì )議上創(chuàng )造的,但早在五年之前,在巴黎舉辦的著(zhù)名的計算機與人類(lèi)思想大會(huì ) (“Les Machines à Calculer et la Pensee Humaine”) 上就已討論這個(gè)主題。赫伯特·布魯德勒 (Herbert Bruderer) 非常恰當地將其稱(chēng)為首次關(guān)于A(yíng)I的大會(huì )。在那次有數百名世界專(zhuān)家參加的會(huì )議上,諾伯特·維納 (Norbert Wiener) 和前面提到的托雷斯·伊·克維多著(zhù)名的國際象棋機進(jìn)行了一場(chǎng)對局。 ● 20世紀50年代后期,弗蘭克·羅森布拉特 (Frank Rosenblatt) 開(kāi)發(fā)了用于“淺層神經(jīng)網(wǎng)絡(luò )”的感知機和簡(jiǎn)單學(xué)習的算法。這些實(shí)際上是高斯和勒讓德在1800年左右推出的古老線(xiàn)性回歸器的變形。羅森布拉特后來(lái)還考慮過(guò)更深度的網(wǎng)絡(luò ),但并未取得太多進(jìn)展。 ● 1965年,兩位烏克蘭人阿列克謝·伊瓦赫年科 (Alexey Ivakhnenko) 和瓦倫丁·拉帕 (Valentin Lapa) 發(fā)表了第一篇有關(guān)具有任意層數的深層多層感知機學(xué)習算法的文章。如果說(shuō)前饋網(wǎng)絡(luò )領(lǐng)域中有一位“深度學(xué)習之父”,一定非伊瓦赫年科莫屬。即使按照2000年以后的標準,他的網(wǎng)絡(luò )也屬于深層 (達到8層)。和如今的深度神經(jīng)網(wǎng)絡(luò )類(lèi)似,他的網(wǎng)絡(luò )能夠通過(guò)學(xué)習來(lái)創(chuàng )建分層和分布式的傳入數據內部表述。最近幾十年來(lái),深度學(xué)習變得非常重要。它是AI的一個(gè)專(zhuān)門(mén)化分支,在某種程度上與人腦有關(guān);人腦包含大約1000億個(gè)神經(jīng)元,每個(gè)神經(jīng)元都與1萬(wàn)個(gè)其他神經(jīng)元相連接。其中有些是輸入神經(jīng)元,可為其他神經(jīng)元提供數據(聽(tīng)覺(jué)、視覺(jué)、觸覺(jué)、痛覺(jué)、饑餓感)。還有一些神經(jīng)元是輸出神經(jīng)元,可以控制肌肉。大多數神經(jīng)元隱藏于二者之間,思維就在這些神經(jīng)元中進(jìn)行。大腦通過(guò)改變連接的強度或權重來(lái)學(xué)習,這些連接決定了神經(jīng)元相互影響的強度,并對一生中的所有經(jīng)歷進(jìn)行編碼。如今的深度學(xué)習人工神經(jīng)網(wǎng)絡(luò )正是由此獲得啟發(fā),能夠比之前的方法更好地學(xué)習。 ● 1969年,馬文·明斯基 (Marvin Minsky) 和西摩·佩珀特 (Seymour Papert) 的出名著(zhù)作《Perceptrons: an introduction to computational geometry》(感知機:計算幾何學(xué)導論) 介紹了淺層學(xué)習的局限性,探討了這個(gè)實(shí)際上已在4年前由阿列克謝·伊瓦赫年科和瓦倫丁·拉帕解決的問(wèn)題。有人說(shuō)明斯基的書(shū)延緩了與神經(jīng)網(wǎng)絡(luò )有關(guān)的研究,但事實(shí)并非如此,或者說(shuō)在美國之外進(jìn)行的研究肯定不是這種情況。在隨后的幾十年里,許多研究者 (尤其是在東歐) 以伊瓦赫年科等人的成果為基礎繼續研究。即使是在2000年代,人們仍在使用他被廣泛引用的方法來(lái)訓練深層網(wǎng)絡(luò )。 1970年之前的歷史就介紹到這里。在A(yíng)I歷史第二部分,我們將會(huì )詳細講述后續發(fā)展。 文章來(lái)源:貿澤電子 作者簡(jiǎn)介:Jürgen Schmidhuber經(jīng)常被媒體譽(yù)為「現代人工智能之父」。他在大約15歲時(shí)就希望能開(kāi)發(fā)一種比他自己更聰明、能夠自我完善的人工智能 (AI),并以此作為退休之前的主攻目標。他的實(shí)驗室自1991年起引領(lǐng)了深度學(xué)習神經(jīng)網(wǎng)絡(luò )的研究,提出了包括長(cháng)短期記憶 (LSTM) 在內的多項技術(shù),為機器學(xué)習領(lǐng)域帶來(lái)了革命性的創(chuàng )新。到2017年,LSTM已經(jīng)在30億設備上得到運用,每天由全球數家市值最高上市公司的用戶(hù)發(fā)起的使用請求多達數十億次。LSTM顯著(zhù)改善了超過(guò)20億臺Android手機的語(yǔ)音識別功能(2015年起);谷歌翻譯使用LSTM大幅改善了機器翻譯的質(zhì)量(2016年起);Facebook每天使用LSTM技術(shù)執行逾45億次自動(dòng)翻譯(2017年);蘋(píng)果公司在約10億臺iPhone的Siri和Quicktype功能中采用了LSTM技術(shù)(2016年起);亞馬遜公司的Alexa語(yǔ)音助手也采用LSTM技術(shù)來(lái)回答問(wèn)題(2016年起);還有各種數不勝數的其他應用也采用了LSTM技術(shù)。2011年,他的團隊率先借助深度神經(jīng)網(wǎng)絡(luò )技術(shù)贏(yíng)得了一項官方舉辦的計算機視覺(jué)識別大賽,并且識別能力超過(guò)了人類(lèi);2012年,他們又率先借助深度神經(jīng)網(wǎng)絡(luò )技術(shù)贏(yíng)得了一項以檢測癌癥為主題的醫療影像識別大賽。這些成就無(wú)不引起了業(yè)界的極大興趣。此外,它的研究小組還涉足元學(xué)習、數學(xué)嚴謹的通用AI,以及在通用問(wèn)題求解中通過(guò)自我學(xué)習實(shí)現遞歸自我改善(1987年起)。在1990年代,他在研究中引入了無(wú)監督對抗神經(jīng)網(wǎng)絡(luò ),這些神經(jīng)網(wǎng)絡(luò )通過(guò)極大極小博弈 (minimax) 的方式相互競爭,以實(shí)現人工好奇心等特性。他的創(chuàng )造力,好奇心和樂(lè )趣的正式理論解釋了藝術(shù),科學(xué),音樂(lè )和幽默。他提出的有關(guān)創(chuàng )造力、好奇心和樂(lè )趣的形式理論可以為藝術(shù)、科學(xué)、音樂(lè )和幽默提出解釋。他還概括了算法信息論和物理學(xué)中的多世界理論,并且引入了「低復雜度美學(xué)」的概念,也就是信息時(shí)代的極簡(jiǎn)藝術(shù)形式。他在研究生涯中獲獎無(wú)數,寫(xiě)作了超過(guò)350篇經(jīng)過(guò)同行評審的論文,并且頻繁現身大型活動(dòng)的主題演講。他是NNAISENSE公司的首席科學(xué)家,該公司肩負著(zhù)率先實(shí)現實(shí)用的通用AI的使命。他還向許多政府機構提供有關(guān)AI戰略的建議。 |