- 游戲攻略揭秘,《小浣能神兵列傳》預(yù)抽卡推薦優(yōu)先級(jí)
- 游戲揭秘,《童話大亂斗》大劍士技能屬性天賦一覽
- 熱點(diǎn)解析揭秘,搖褲危機(jī)是什么意思
- 游戲指南,《童話大亂斗》紅影戰(zhàn)斧技能屬性天賦一覽
- 探索幻想世界的神秘冒險(xiǎn),《麒麟傳03版》白嫖攻略
- 歌曲揭秘,心若無所求有風(fēng)無風(fēng)皆自由是什么歌
- 獨(dú)家揭秘,《麒麟傳03版》新手必看升級(jí)打怪攻略
- 游戲成就解鎖指南,《絕區(qū)零》洗衣粉還是老牌子好成就攻略
- 深入探索策略之道,《金鏟鏟之戰(zhàn)》命運(yùn)卡特陣容推薦
- 重磅上線,《童話大亂斗》常見問題FAQ
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
3月10日,上海機(jī)器人初創(chuàng)公司智元機(jī)器人官方發(fā)布其智元啟元大模型GenieOperator-1(GO-1),這是中國首個(gè)通用具身基座模型。智元機(jī)器人表示,這款模型具備泛化能力,能夠在極少數(shù)據(jù)甚至零樣本下快速適應(yīng)新場(chǎng)景和新任務(wù),從而降低了具身模型的使用門檻和后訓(xùn)練成本。
該模型首次提出Vision-Language-Latent-Action(ViLLA)架構(gòu),實(shí)現(xiàn)了基于人類視頻的學(xué)習(xí)能力,支持小樣本快速泛化。ViLLA架構(gòu)由多模態(tài)大模型(VLM)和混合專家(MoE)組成。其中,VLM利用海量互聯(lián)網(wǎng)圖文數(shù)據(jù)提升通用場(chǎng)景感知和語言理解能力;MoE中的隱式規(guī)劃器(Latent Planner)通過大量跨本體和人類操作數(shù)據(jù),獲得通用動(dòng)作理解能力;動(dòng)作專家(Action Expert)則通過 million 真機(jī)數(shù)據(jù)提升精細(xì)動(dòng)作執(zhí)行能力。在推理過程中,VLM、隱式規(guī)劃器和動(dòng)作專家協(xié)同工作。目前,智元啟元大模型已成功部署于智元多款機(jī)器人本體。
具身智能(Embodied Intelligence)是一種基于物理身體進(jìn)行感知和行動(dòng)的智能系統(tǒng),通過智能體與環(huán)境的交互獲取信息、理解問題、做出決策并實(shí)現(xiàn)行動(dòng),從而產(chǎn)生智能行為和適應(yīng)性。機(jī)器人是具身智能的主要代表產(chǎn)品之一。實(shí)現(xiàn)具身智能更強(qiáng)調(diào)與物理世界的直接交互,需要處理視覺、聽覺、觸覺、運(yùn)動(dòng)等多種模態(tài)的數(shù)據(jù),并將感知、決策和行動(dòng)緊密結(jié)合。
2024年年底,智元機(jī)器人曾發(fā)布AgiBot World 百萬真機(jī)數(shù)據(jù)集,盡管該數(shù)據(jù)集已是目前最大的機(jī)器人真機(jī)示教數(shù)據(jù)集,但高質(zhì)量帶動(dòng)作標(biāo)簽的真機(jī)數(shù)據(jù)量仍然有限,遠(yuǎn)少于互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)集。為了解決具身智能數(shù)據(jù)困境,智元機(jī)器人此次采用隱式動(dòng)作(Latent Actions)來建模當(dāng)前幀和歷史幀之間的隱式變化,通過隱式規(guī)劃器(Latent Planner)預(yù)測(cè)這些隱式動(dòng)作,從而將異構(gòu)數(shù)據(jù)源中真實(shí)世界的動(dòng)作知識(shí)轉(zhuǎn)移到通用操作任務(wù)中。
智元機(jī)器人表示,通過ViLLA 創(chuàng)新性架構(gòu),其在五種不同復(fù)雜度任務(wù)上的測(cè)試結(jié)果顯示,GO-1大模型的平均成功率較現(xiàn)有最優(yōu)模型提高了32%。其中在“倒水”、“清理桌面”和“補(bǔ)充飲料”等任務(wù)中表現(xiàn)尤為突出。此外,GO-1大模型還可以搭配一套整套的數(shù)據(jù)回流系統(tǒng),從實(shí)際執(zhí)行中遇到的問題數(shù)據(jù)持續(xù)進(jìn)化學(xué)習(xí),實(shí)現(xiàn)“越用越聰明”。
北航機(jī)器人研究所名譽(yù)所長、中關(guān)村智友研究院院長王田苗在接受澎湃科技采訪時(shí)認(rèn)為,大模型對(duì)人形機(jī)器人的核心貢獻(xiàn)在于實(shí)現(xiàn)類似人類的交互、推理和環(huán)境適應(yīng)能力。然而,目前仍存在理論和技術(shù)挑戰(zhàn)。例如,通用大模型在算法選擇上(是監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí),還是端到端學(xué)習(xí)或者模擬學(xué)習(xí)),這些都是需要探索的。
智元機(jī)器人方表示,大語言模型是數(shù)字世界、單模態(tài)的,而具身智能需要處理多模態(tài)物理世界的數(shù)據(jù),包括圖像、視頻、傳感器數(shù)據(jù)等。大模型對(duì)這些非文本數(shù)據(jù)的理解和處理能力有限,無法滿足具身智能對(duì)多模態(tài)數(shù)據(jù)融合的需求。采用ViLLA架構(gòu)的大模型則更好地滿足了具身智能對(duì)多模態(tài)數(shù)據(jù)融合和物理世界交互的需求。
不過,一位關(guān)注具身智能機(jī)器人基礎(chǔ)場(chǎng)景數(shù)據(jù)和解決方案的從業(yè)人員認(rèn)為,目前具身基座模型的“通用性”仍有待驗(yàn)證,很難給出準(zhǔn)確評(píng)價(jià)。在他看來,智元此次發(fā)布的模型可能主要針對(duì)其自產(chǎn)的機(jī)器人,對(duì)其它機(jī)器人適用程度還需更多從業(yè)者進(jìn)一步驗(yàn)證。
醫(yī)生說科學(xué)選擇助眠保健品,失眠困擾?助眠保健品該如何選?健康知識(shí)為您解答。 加拿大自由黨新領(lǐng)袖馬克·卡尼就任總理加拿大政府采取強(qiáng)硬態(tài)度應(yīng)對(duì)特朗普威脅,人物|卡尼當(dāng)選加拿大總理:因愛國浪潮助力勝選,曾任央行行長,抨擊特朗普關(guān)稅政策說明:1. 原標(biāo)題較長,信息點(diǎn)分散。改寫后標(biāo)題保持核心信息,同時(shí)更簡潔2. 刪除了部分重復(fù)信息和非核心描述3. 調(diào)整了語序,使標(biāo)題更流暢4. 使用更簡潔的詞匯,如"助力勝選"替代"推升政治素人卡尼當(dāng)選加拿大總理"5. 突出了主要事件和關(guān)鍵人物6. 保留了卡尼的背景信息,但表述更簡潔7. 整體保持標(biāo)題的吸引力和信息完整性 DNF拍賣行手續(xù)費(fèi)比例及優(yōu)惠券使用說明,《dnf》拍賣行手續(xù)費(fèi)比例介紹 破界者·閃電般快·高能密度· next-level,奔馳GLC純電動(dòng)版或成奔馳EQC競(jìng)爭車型,消息發(fā)布 澤連斯基入北約,烏克蘭總統(tǒng)澤連斯基表示,烏克蘭愿以辭職為條件加入北約。 3月全球具身智能機(jī)器人發(fā)展大會(huì),2025具身人工智能發(fā)展會(huì)圓滿落幕 耳飾才是搭配的關(guān)鍵超實(shí)用的小到看不出來耳飾推薦,50款美春日耳飾,誰戴誰好看! 懷孕失眠的10招,孕早期失眠怎么辦?這些原因讓你輾轉(zhuǎn)反側(cè)?。ㄟ@個(gè)標(biāo)題保持了原意,但更簡潔明了。去掉了重復(fù)的"健康知識(shí)",直接點(diǎn)明了問題,同時(shí)增加了"這些原因"作為補(bǔ)充,使標(biāo)題更具體。) 恒生指數(shù)調(diào)整地平線機(jī)器人或成港股投資新寵,快訊|地平線獲納入恒生科指 今日起生效 航空事故,美國客機(jī)險(xiǎn)撞小飛機(jī) 特朗普發(fā)表聲明