澎湃新聞?dòng)浾?虞涵棋 一手創(chuàng )造史上最強圍棋人工智能AlphaGo的DeepMind團隊,又教會(huì )了人工智能在迷宮中“抄近路”。 北京時(shí)間5月10日凌晨1時(shí),該英國團隊在世界頂級學(xué)術(shù)雜志《自然》上發(fā)表論文稱(chēng),其最新研發(fā)出的一個(gè)人工智能程序具有類(lèi)似哺乳動(dòng)物一樣的尋路能力,非常類(lèi)似大腦中網(wǎng)格細胞的工作原理。 神秘的網(wǎng)格細胞:大腦內置GPS 從家出發(fā)到新的地點(diǎn),再原路返回,從中選擇盡可能的捷徑,這是絕大多數動(dòng)物都能勝任的簡(jiǎn)單任務(wù)。然而,大腦這種本能的導航機制尚未被完全理解。 科學(xué)家們在動(dòng)物和人類(lèi)大腦中找到了三種跟認路相關(guān)的細胞,分別是位置細胞、方向細胞和網(wǎng)格細胞。 位置細胞能在主體到達特定地點(diǎn)時(shí)放電,從而賦予對過(guò)往地點(diǎn)的記憶;方向細胞能感應前進(jìn)的方向;網(wǎng)格細胞則是最神秘的一種:它們能將整個(gè)空間環(huán)境劃分成蜂窩狀的六邊形網(wǎng)格,仿佛地圖上的坐標系。 發(fā)現網(wǎng)格細胞的的莫索爾夫婦因此獲得了2014年的諾貝爾生理學(xué)或醫學(xué)獎。不過(guò),網(wǎng)格細胞僅僅是在空間環(huán)境中提供GPS定位服務(wù)嗎?一些科學(xué)家猜測,它們也會(huì )參與矢量計算,輔助動(dòng)物規劃路徑。 人工神經(jīng)網(wǎng)絡(luò )中自動(dòng)出現類(lèi)似結構 DeepMind團隊決定用人工神經(jīng)網(wǎng)絡(luò )檢驗上述猜想。人工神經(jīng)網(wǎng)絡(luò )是一種利用多層處理模擬大腦神經(jīng)網(wǎng)絡(luò )的運算結構。團隊首先用深度學(xué)習算法訓練神經(jīng)網(wǎng)絡(luò )學(xué)習哺乳動(dòng)物的覓食運動(dòng)路徑,利用線(xiàn)速度、角速度等信號在視覺(jué)環(huán)境中進(jìn)行定位。 研究人員隨后發(fā)現,一種類(lèi)似于網(wǎng)格細胞活動(dòng)特征的結構自動(dòng)誕生了!在此前的訓練中,研究人員并未刻意引導神經(jīng)網(wǎng)絡(luò )產(chǎn)生此種結構。 ![]() 人工神經(jīng)網(wǎng)絡(luò )中自動(dòng)出現了與大鼠網(wǎng)格細胞(下)類(lèi)似的網(wǎng)格結構(上) 圖片來(lái)源:DeepMind官方博客 這再次顯示了深度學(xué)習的可喜又可畏之處:這是一種通過(guò)大量匹配的輸入和輸出值訓練機器自我摸索的算法,最后得到的機器邏輯是不為人知的黑匣子。正如AlphaGo自動(dòng)領(lǐng)悟了人類(lèi)千年棋史上從所未見(jiàn)的“天外飛仙”棋招,這次的神經(jīng)網(wǎng)絡(luò )也自動(dòng)出現了令人驚喜的結構。 迷宮尋路 DeepMind團隊隨后利用強化學(xué)習檢驗這種網(wǎng)格結構是否能夠進(jìn)行矢量導航。強化學(xué)習被普遍用于訓練游戲AI,人類(lèi)告訴AI一種游戲的得分獎懲機制,但卻不教授游戲方法,由AI在反復進(jìn)行游戲、努力爭取更高分的過(guò)程中自我進(jìn)化。后期的AlphaGo就完全擯棄了人類(lèi)棋譜經(jīng)驗,在純粹的自我對弈中從零進(jìn)化到更強版本。 研究人員將之前自動(dòng)出現的網(wǎng)格結構與一個(gè)更大型的神經(jīng)網(wǎng)絡(luò )架構結合成了人工智能體,置于虛擬現實(shí)的游戲環(huán)境中。經(jīng)歷強化學(xué)習后,該人工智能在游戲迷宮中向目的地前進(jìn)的導航能力超越了一般人,達到了職業(yè)游戲玩家水平。它能像哺乳動(dòng)物一樣尋找新路線(xiàn)和抄近路。 ![]() 人工智能學(xué)習在迷宮中抄近路 最關(guān)鍵的是,當研究人員“靜默”原來(lái)的網(wǎng)格結構后,人工智能體的導航能力就會(huì )變弱,判斷目標的距離和方向都更不準確了。 論文作者之一Dharshan Kumaran說(shuō)道:“我們證明了網(wǎng)格細胞遠不只是給我們提供GPS定位信號,也是一種大腦賴(lài)以計算兩個(gè)地點(diǎn)間的最短距離的核心導航機制! 用人工智能代替小白鼠做實(shí)驗 與一直強調“人工智能不是仿生學(xué)”的Facebook人工智能首席科學(xué)家楊立昆(Yann Lecun)不同,天才創(chuàng )始人戴密斯·哈薩比斯(Demis Hassabis)執掌的DeepMind熱衷探索人工智能與腦科學(xué)的相輔相成。這項研究再一次體現了他們的科學(xué)理念:腦科學(xué)啟發(fā)下的人工智能算法能反過(guò)來(lái)幫助人類(lèi)探索大腦運行機制,從而也更好地理解人工智能的內在邏輯。 哈薩比斯評價(jià)道:“我們相信人工智能和神經(jīng)科學(xué)是相互啟發(fā)的。這項工作就是很好的證明:通過(guò)研發(fā)出一個(gè)能在復雜環(huán)境中導航的人工智能體,我們對網(wǎng)格細胞在哺乳動(dòng)物導航中的重要性有了更深的理解! DeepMind團隊相信,類(lèi)似的研究方法還可以用來(lái)探索大腦聽(tīng)覺(jué)和控制四肢的機制。在更遠的將來(lái),神經(jīng)科學(xué)家們甚至可以用人工智能代替小白鼠來(lái)做實(shí)驗。 |