中國最受矚目的具身智能公司發(fā)布首個(gè)基礎大模型 說(shuō)要打破行業(yè)瓶頸

發(fā)布時(shí)間:2025-1-10 17:23    發(fā)布者:eechina
關(guān)鍵詞: GraspVLA , 具身 , 抓取 , 通用機器人
近日,銀河通用聯(lián)合北京智源人工智能研究院(BAAI)及北京大學(xué)和香港大學(xué)研究人員,鄭重發(fā)布首個(gè)全面泛化的端到端具身抓取基礎大模型 GraspVLA。

據介紹,GraspVLA 的訓練包含預訓練和后訓練兩部分。其中預訓練完全基于合成大數據,訓練數據達到了有史以來(lái)最大的數據體量——十億幀「視覺(jué)-語(yǔ)言-動(dòng)作」對,掌握泛化閉環(huán)抓取能力、達成基礎模型;預訓練后,模型可直接 Sim2Real 在未見(jiàn)過(guò)的、千變萬(wàn)化的真實(shí)場(chǎng)景和物體上零樣本測試,全球首次全面展現了七大卓越的泛化能力,滿(mǎn)足大多數產(chǎn)品的需求;而針對特別需求,后訓練僅需小樣本學(xué)習即可遷移基礎能力到特定場(chǎng)景,維持高泛化性的同時(shí)形成符合產(chǎn)品需求的專(zhuān)業(yè)技能。

GraspVLA 展示了無(wú)需大規模真實(shí)數據、僅通過(guò)合成數據達到基礎模型的預訓練過(guò)程,和進(jìn)一步通過(guò)小樣本微調使基礎“通才”快速成長(cháng)為指定場(chǎng)景“專(zhuān)家”的能力,定義了 VLA 發(fā)展的新范式。這一方式打破了世界范圍內具身通用機器人當前發(fā)展的兩大瓶頸 。

真實(shí)數據采集不僅非常昂貴,且很難覆蓋所有可能的實(shí)際應用場(chǎng)景,導致數據量不夠無(wú)法訓練出基礎模型、采集成本過(guò)大以致無(wú)法盈利。即便不計成本地采集,由于人形機器人硬件遠未收斂,隨著(zhù)硬件更新,原有的數據效力將大打折扣,造成大規模的浪費。

數據的缺乏直接限制了機器人的泛化性和通用性。大部分機器人只能在特定的環(huán)境、特定的物體和特定的條件下完成專(zhuān)用任務(wù),人形機器人無(wú)法實(shí)現規模商業(yè)化。

以 GraspVLA 為代表的銀河通用技術(shù)路線(xiàn)具有低成本、大數據、高泛化的特點(diǎn),突破了具身智能的發(fā)展瓶頸,將在2025年引領(lǐng)端到端具身大模型走向規模商業(yè)化。

來(lái)源: 網(wǎng)易科技報道

本文地址:http://selenalain.com/thread-880368-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页