谷歌DeepMind發(fā)布新型機器人人工智能模型

發(fā)布時(shí)間:2025-3-14 09:41    發(fā)布者:eechina
關(guān)鍵詞: 谷歌 , DeepMind , 機器人 , 人工智能模型
谷歌旗下的DeepMind公司在人工智能領(lǐng)域再次取得重大突破,于昨日正式發(fā)布了兩款專(zhuān)為機器人設計的人工智能模型:Gemini Robotics和Gemini Robotic-ER。這兩款模型的問(wèn)世,標志著(zhù)谷歌DeepMind在推動(dòng)機器人技術(shù)智能化、提升機器人在現實(shí)世界任務(wù)中的執行能力方面邁出了關(guān)鍵一步。

據DeepMind官方介紹,Gemini Robotics和Gemini Robotic-ER是基于大型語(yǔ)言模型的推理能力而開(kāi)發(fā)的,旨在幫助機器人更好地適應復雜多變的環(huán)境,完成各種現實(shí)世界中的任務(wù)。其中,Gemini Robotics是一款視覺(jué)-語(yǔ)言-動(dòng)作模型,它不僅能夠概括新場(chǎng)景,還能更善于與人和環(huán)境互動(dòng),執行更精確的物理任務(wù),如折疊紙張、擰下瓶蓋等。該模型在通用性、交互性和靈活性三大關(guān)鍵領(lǐng)域表現出色,能夠理解廣泛的自然語(yǔ)言指令,并根據輸入調整行為,持續監控周邊環(huán)境以檢測變化,從而調整動(dòng)作。

而Gemini Robotic-ER(即具身推理)則是一款具備增強空間理解能力的先進(jìn)視覺(jué)-語(yǔ)言模型。它能夠使機器人專(zhuān)家利用Gemini的具身推理能力運行自有程序,完成更為復雜的推理過(guò)程。例如,在打包午餐盒時(shí),Gemini Robotic-ER能夠知道所有東西的位置,以及如何打開(kāi)午餐盒、抓取食物并將它們放在合適的位置。這一特性使得機器人在處理復雜任務(wù)時(shí)更加得心應手。

DeepMind表示,要成為對人類(lèi)有用的機器人AI模型,必須具備三大核心特質(zhì):通用性、交互性和靈巧性。新發(fā)布的這兩款模型正是基于這些特質(zhì)而設計的,它們能夠讓多種機器人執行比以往更廣泛的現實(shí)任務(wù),從而幫助人類(lèi)在家庭、職場(chǎng)等場(chǎng)景中更好地與機器人協(xié)作。

在技術(shù)層面,Gemini Robotics的綜合泛化性能是現有最先進(jìn)視覺(jué)-語(yǔ)言-動(dòng)作模型的兩倍以上,這得益于DeepMind在算法優(yōu)化和模型訓練方面的深厚積累。而Gemini Robotic-ER則在安全性方面進(jìn)行了重點(diǎn)考慮,DeepMind正在開(kāi)發(fā)一種“分層方法”,以評估在特定情境下潛在行為的安全性,并訓練Gemini Robotic-ER模型進(jìn)行相應判斷。

此外,DeepMind還發(fā)布了新的基準和框架,以助力人工智能行業(yè)的安全研究。去年,谷歌DeepMind推出了“機器人憲法”,這是一套受艾薩克·阿西莫夫啟發(fā)的規則,供機器人遵循。此次發(fā)布的兩款模型也將在這一框架下進(jìn)行運作,以確保其在執行任務(wù)時(shí)始終遵循安全、可靠的原則。
本文地址:http://selenalain.com/thread-883758-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页