谷歌發(fā)布史上最大“通才”AI模型,可讓機器人更自主

發(fā)布時(shí)間:2023-3-9 09:10    發(fā)布者:eechina
關(guān)鍵詞: 谷歌 , AI模型 , 機器人
來(lái)源:大半導體產(chǎn)業(yè)網(wǎng)

據報道,近日,谷歌和柏林工業(yè)大學(xué)的團隊重磅推出了史上最大的視覺(jué)語(yǔ)言模型——PaLM-E。通過(guò)PaLM-540B語(yǔ)言模型與ViT-22B視覺(jué)Transformer模型相結合,PaLM-E參數量高達5620億(GPT-3的參數量為1750億)。

作為一種多模態(tài)具身視覺(jué)語(yǔ)言模型(VLM),PaLM-E不僅可以理解圖像,還能理解、生成語(yǔ)言,可以執行各種復雜的機器人指令而無(wú)需重新訓練。谷歌研究人員還觀(guān)察到一些有趣的效果,這些效果顯然來(lái)自PaLM-E的核心——大型語(yǔ)言模型。PaLM-E表現出了“正遷移”能力,即它可以將從一項任務(wù)中學(xué)到的知識和技能遷移到另一項任務(wù)中,從而與單任務(wù)機器人模型相比具有“顯著(zhù)更高的性能”。

谷歌研究人員計劃探索PaLM-E在現實(shí)世界場(chǎng)景中的更多應用,例如家庭自動(dòng)化或工業(yè)機器人。他們希望PaLM-E能夠激發(fā)更多關(guān)于多模態(tài)推理和具身AI的研究。
本文地址:http://selenalain.com/thread-813196-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页