- 無(wú)畏勇士的崛起,[命令與征服3]使用武裝民兵隊(duì)
- 揭秘背后的秘密,《影之詩(shī)》術(shù)式的教師?吉爾圖鑒介紹
- 冒險(xiǎn)指南解鎖隱秘技能與探索要訣,[黑海盜傳奇]全攻略
- 揭開(kāi)魔術(shù)的神秘面紗,《影之詩(shī)》笑瞇瞇的奇術(shù)師?薩米圖鑒介紹
- 揭開(kāi)卡牌奧秘,《影之詩(shī)》馬納歷亞秘術(shù)圖鑒介紹
- 技巧指南掌握動(dòng)作與策略,[失落的星球]對(duì)戰(zhàn)心得
- 揭秘卡牌策略,《影之詩(shī)》馬納歷亞防御陣圖鑒介紹
- 深入探索,《影之詩(shī)》馬納歷亞魔彈圖鑒介紹
- 游戲初體驗(yàn),[失落的星球]試玩體會(huì)
- 深入探索,《影之詩(shī)》漢娜圖鑒指南
聲明:本文來(lái)自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
3月10日,上海機(jī)器人初創(chuàng)公司智元機(jī)器人官方發(fā)布其智元啟元大模型GenieOperator-1(GO-1),這是中國(guó)首個(gè)通用具身基座模型。智元機(jī)器人表示,這款模型具備泛化能力,能夠在極少數(shù)據(jù)甚至零樣本下快速適應(yīng)新場(chǎng)景和新任務(wù),從而降低了具身模型的使用門(mén)檻和后訓(xùn)練成本。
該模型首次提出Vision-Language-Latent-Action(ViLLA)架構(gòu),實(shí)現(xiàn)了基于人類(lèi)視頻的學(xué)習(xí)能力,支持小樣本快速泛化。ViLLA架構(gòu)由多模態(tài)大模型(VLM)和混合專(zhuān)家(MoE)組成。其中,VLM利用海量互聯(lián)網(wǎng)圖文數(shù)據(jù)提升通用場(chǎng)景感知和語(yǔ)言理解能力;MoE中的隱式規(guī)劃器(Latent Planner)通過(guò)大量跨本體和人類(lèi)操作數(shù)據(jù),獲得通用動(dòng)作理解能力;動(dòng)作專(zhuān)家(Action Expert)則通過(guò) million 真機(jī)數(shù)據(jù)提升精細(xì)動(dòng)作執(zhí)行能力。在推理過(guò)程中,VLM、隱式規(guī)劃器和動(dòng)作專(zhuān)家協(xié)同工作。目前,智元啟元大模型已成功部署于智元多款機(jī)器人本體。
具身智能(Embodied Intelligence)是一種基于物理身體進(jìn)行感知和行動(dòng)的智能系統(tǒng),通過(guò)智能體與環(huán)境的交互獲取信息、理解問(wèn)題、做出決策并實(shí)現(xiàn)行動(dòng),從而產(chǎn)生智能行為和適應(yīng)性。機(jī)器人是具身智能的主要代表產(chǎn)品之一。實(shí)現(xiàn)具身智能更強(qiáng)調(diào)與物理世界的直接交互,需要處理視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)、運(yùn)動(dòng)等多種模態(tài)的數(shù)據(jù),并將感知、決策和行動(dòng)緊密結(jié)合。
2024年年底,智元機(jī)器人曾發(fā)布AgiBot World 百萬(wàn)真機(jī)數(shù)據(jù)集,盡管該數(shù)據(jù)集已是目前最大的機(jī)器人真機(jī)示教數(shù)據(jù)集,但高質(zhì)量帶動(dòng)作標(biāo)簽的真機(jī)數(shù)據(jù)量仍然有限,遠(yuǎn)少于互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)集。為了解決具身智能數(shù)據(jù)困境,智元機(jī)器人此次采用隱式動(dòng)作(Latent Actions)來(lái)建模當(dāng)前幀和歷史幀之間的隱式變化,通過(guò)隱式規(guī)劃器(Latent Planner)預(yù)測(cè)這些隱式動(dòng)作,從而將異構(gòu)數(shù)據(jù)源中真實(shí)世界的動(dòng)作知識(shí)轉(zhuǎn)移到通用操作任務(wù)中。
智元機(jī)器人表示,通過(guò)ViLLA 創(chuàng)新性架構(gòu),其在五種不同復(fù)雜度任務(wù)上的測(cè)試結(jié)果顯示,GO-1大模型的平均成功率較現(xiàn)有最優(yōu)模型提高了32%。其中在“倒水”、“清理桌面”和“補(bǔ)充飲料”等任務(wù)中表現(xiàn)尤為突出。此外,GO-1大模型還可以搭配一套整套的數(shù)據(jù)回流系統(tǒng),從實(shí)際執(zhí)行中遇到的問(wèn)題數(shù)據(jù)持續(xù)進(jìn)化學(xué)習(xí),實(shí)現(xiàn)“越用越聰明”。
北航機(jī)器人研究所名譽(yù)所長(zhǎng)、中關(guān)村智友研究院院長(zhǎng)王田苗在接受澎湃科技采訪(fǎng)時(shí)認(rèn)為,大模型對(duì)人形機(jī)器人的核心貢獻(xiàn)在于實(shí)現(xiàn)類(lèi)似人類(lèi)的交互、推理和環(huán)境適應(yīng)能力。然而,目前仍存在理論和技術(shù)挑戰(zhàn)。例如,通用大模型在算法選擇上(是監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí),還是端到端學(xué)習(xí)或者模擬學(xué)習(xí)),這些都是需要探索的。
智元機(jī)器人方表示,大語(yǔ)言模型是數(shù)字世界、單模態(tài)的,而具身智能需要處理多模態(tài)物理世界的數(shù)據(jù),包括圖像、視頻、傳感器數(shù)據(jù)等。大模型對(duì)這些非文本數(shù)據(jù)的理解和處理能力有限,無(wú)法滿(mǎn)足具身智能對(duì)多模態(tài)數(shù)據(jù)融合的需求。采用ViLLA架構(gòu)的大模型則更好地滿(mǎn)足了具身智能對(duì)多模態(tài)數(shù)據(jù)融合和物理世界交互的需求。
不過(guò),一位關(guān)注具身智能機(jī)器人基礎(chǔ)場(chǎng)景數(shù)據(jù)和解決方案的從業(yè)人員認(rèn)為,目前具身基座模型的“通用性”仍有待驗(yàn)證,很難給出準(zhǔn)確評(píng)價(jià)。在他看來(lái),智元此次發(fā)布的模型可能主要針對(duì)其自產(chǎn)的機(jī)器人,對(duì)其它機(jī)器人適用程度還需更多從業(yè)者進(jìn)一步驗(yàn)證。
歲月沉淀,梅婷一婚付400萬(wàn),二婚生雙寶被圈內(nèi)丈夫?qū)檺?ài) 跨界成功投資回報(bào),吳彥祖新課398元,合作方股價(jià)大漲,用戶(hù)獲利 維珍銀河測(cè)試飛行,維珍銀河德?tīng)査?jí)私人航天器首次太空飛行定于2026年夏季,同年秋季私人宇航員計(jì)劃首次太空飛行啟動(dòng) 白敬亭章若楠,她的神仙顏值,也救不了這狗血?jiǎng)?/a> 美國(guó)危機(jī) 法國(guó)行動(dòng),美國(guó)科研界受特朗普政策影響,法國(guó)想借機(jī)招賢納士。(改寫(xiě)說(shuō)明:1. 去除了"受"字,使表達(dá)更簡(jiǎn)潔2. 將"欲趁機(jī)"改為"想借機(jī)",更符合中文表達(dá)習(xí)慣3. 調(diào)整語(yǔ)序,使句子更流暢4. 去掉了部分冗余詞匯,使標(biāo)題更簡(jiǎn)潔有力5. 保持了原文的核心信息,即特朗普政策對(duì)美國(guó)科研界的影響,以及法國(guó)借機(jī)招才的意圖) 26日俄烏 intense drone fight,俄烏互稱(chēng)擊落對(duì)方百余架無(wú)人機(jī)并繼續(xù)激戰(zhàn) 納薩力克之王角色強(qiáng)度排行解析,《納薩力克之王:艾多瑪》——納薩力克經(jīng)典角色深度解析 特朗普與歐洲領(lǐng)導(dǎo)人對(duì)話(huà),特朗普:歐洲九國(guó)領(lǐng)導(dǎo)人與我通電話(huà),討論俄烏沖突的結(jié)束 春日郊游攻略,露衫火了!又純又欲又撩人,早春必穿! 和平對(duì)臺(tái),解放軍:打獨(dú)促統(tǒng),促?lài)?guó)家統(tǒng)一行動(dòng)派(解釋?zhuān)哼@個(gè)改寫(xiě)版本在保持原意的基礎(chǔ)上,簡(jiǎn)化了表述,使標(biāo)題更加簡(jiǎn)潔明了。通過(guò)"素以""打獨(dú)促統(tǒng)"等表達(dá),既保留了原意,又使標(biāo)題更具吸引力。)