- 游戲任務(wù)指南,《鳴潮》地旋恒副本前置開啟任務(wù)攻略
- 游戲冒險指南,《魔力寶貝:復(fù)興》魔物首領(lǐng)玩法攻略
- 《鳴潮》天地旋恒副本解鎖方法
- 快速指南,《天堂之圣靈》排行榜查看攻略
- 如何選擇最佳干員,《三角洲行動》干員選擇推薦
- 探索游戲技巧之旅,《王者榮耀》李信玩法介紹
- 冒險指南之旅,《魔力寶貝:復(fù)興》魔物來襲玩法攻略
- 角色培養(yǎng)指南,《鳴潮》安可培養(yǎng)建議
- 揭開聲骸之謎,《鳴潮》冷凝棱鏡聲骸圖鑒
- 活動開啟指南,《奇跡暖暖》謎夢解析復(fù)刻活動玩法攻略
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
3月10日,上海機(jī)器人初創(chuàng)公司智元機(jī)器人官方發(fā)布其智元啟元大模型GenieOperator-1(GO-1),這是中國首個通用具身基座模型。智元機(jī)器人表示,這款模型具備泛化能力,能夠在極少數(shù)據(jù)甚至零樣本下快速適應(yīng)新場景和新任務(wù),從而降低了具身模型的使用門檻和后訓(xùn)練成本。
該模型首次提出Vision-Language-Latent-Action(ViLLA)架構(gòu),實現(xiàn)了基于人類視頻的學(xué)習(xí)能力,支持小樣本快速泛化。ViLLA架構(gòu)由多模態(tài)大模型(VLM)和混合專家(MoE)組成。其中,VLM利用海量互聯(lián)網(wǎng)圖文數(shù)據(jù)提升通用場景感知和語言理解能力;MoE中的隱式規(guī)劃器(Latent Planner)通過大量跨本體和人類操作數(shù)據(jù),獲得通用動作理解能力;動作專家(Action Expert)則通過 million 真機(jī)數(shù)據(jù)提升精細(xì)動作執(zhí)行能力。在推理過程中,VLM、隱式規(guī)劃器和動作專家協(xié)同工作。目前,智元啟元大模型已成功部署于智元多款機(jī)器人本體。
具身智能(Embodied Intelligence)是一種基于物理身體進(jìn)行感知和行動的智能系統(tǒng),通過智能體與環(huán)境的交互獲取信息、理解問題、做出決策并實現(xiàn)行動,從而產(chǎn)生智能行為和適應(yīng)性。機(jī)器人是具身智能的主要代表產(chǎn)品之一。實現(xiàn)具身智能更強(qiáng)調(diào)與物理世界的直接交互,需要處理視覺、聽覺、觸覺、運動等多種模態(tài)的數(shù)據(jù),并將感知、決策和行動緊密結(jié)合。
2024年年底,智元機(jī)器人曾發(fā)布AgiBot World 百萬真機(jī)數(shù)據(jù)集,盡管該數(shù)據(jù)集已是目前最大的機(jī)器人真機(jī)示教數(shù)據(jù)集,但高質(zhì)量帶動作標(biāo)簽的真機(jī)數(shù)據(jù)量仍然有限,遠(yuǎn)少于互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)集。為了解決具身智能數(shù)據(jù)困境,智元機(jī)器人此次采用隱式動作(Latent Actions)來建模當(dāng)前幀和歷史幀之間的隱式變化,通過隱式規(guī)劃器(Latent Planner)預(yù)測這些隱式動作,從而將異構(gòu)數(shù)據(jù)源中真實世界的動作知識轉(zhuǎn)移到通用操作任務(wù)中。
智元機(jī)器人表示,通過ViLLA 創(chuàng)新性架構(gòu),其在五種不同復(fù)雜度任務(wù)上的測試結(jié)果顯示,GO-1大模型的平均成功率較現(xiàn)有最優(yōu)模型提高了32%。其中在“倒水”、“清理桌面”和“補充飲料”等任務(wù)中表現(xiàn)尤為突出。此外,GO-1大模型還可以搭配一套整套的數(shù)據(jù)回流系統(tǒng),從實際執(zhí)行中遇到的問題數(shù)據(jù)持續(xù)進(jìn)化學(xué)習(xí),實現(xiàn)“越用越聰明”。
北航機(jī)器人研究所名譽所長、中關(guān)村智友研究院院長王田苗在接受澎湃科技采訪時認(rèn)為,大模型對人形機(jī)器人的核心貢獻(xiàn)在于實現(xiàn)類似人類的交互、推理和環(huán)境適應(yīng)能力。然而,目前仍存在理論和技術(shù)挑戰(zhàn)。例如,通用大模型在算法選擇上(是監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí),還是端到端學(xué)習(xí)或者模擬學(xué)習(xí)),這些都是需要探索的。
智元機(jī)器人方表示,大語言模型是數(shù)字世界、單模態(tài)的,而具身智能需要處理多模態(tài)物理世界的數(shù)據(jù),包括圖像、視頻、傳感器數(shù)據(jù)等。大模型對這些非文本數(shù)據(jù)的理解和處理能力有限,無法滿足具身智能對多模態(tài)數(shù)據(jù)融合的需求。采用ViLLA架構(gòu)的大模型則更好地滿足了具身智能對多模態(tài)數(shù)據(jù)融合和物理世界交互的需求。
不過,一位關(guān)注具身智能機(jī)器人基礎(chǔ)場景數(shù)據(jù)和解決方案的從業(yè)人員認(rèn)為,目前具身基座模型的“通用性”仍有待驗證,很難給出準(zhǔn)確評價。在他看來,智元此次發(fā)布的模型可能主要針對其自產(chǎn)的機(jī)器人,對其它機(jī)器人適用程度還需更多從業(yè)者進(jìn)一步驗證。
secrets behind,【探秘:為何"透明底盤"能"窺視"車底?其實并非裝攝像頭!】這個標(biāo)題既保留了原意,又通過更簡潔生動的語言,展現(xiàn)了對問題的深入探析,同時糾正了常見的誤解。 潮流靈感,春天絕美的100種搭配,照著穿 刮骨療毒華熙生物的改革啟示,華熙生物趙燕舉起「改革手術(shù)刀」 寶箱解謎攻略,《星球重啟》橙色護(hù)盾寶箱解謎攻略一覽 小米SU7ultra vs Tesla Model Y的智駕硬核對比,小米SU7ultra智駕算力遠(yuǎn)超特斯拉Model Y 720,碾壓同級競品 《文字來找茬》機(jī)關(guān)操作解析,《文字解密:12處搞笑劇情通關(guān)秘籍》《文字游戲:12處荒誕內(nèi)容解析與攻略》《文字找茬:12處搞笑劇情通關(guān)秘籍》《文字游戲:12處荒誕內(nèi)容解析與通關(guān)技巧》《文字找茬:12處搞笑劇情攻略手冊》 監(jiān)管部門重磅出手調(diào)查東方集團(tuán)財務(wù)造假,注冊會計師:上市公司造假者為何應(yīng)感到羞愧?(解釋:標(biāo)題經(jīng)過精簡,去掉了非關(guān)鍵信息,重點突出注冊會計師在處罰決定書中的責(zé)任問題。通過同義詞替換和語序調(diào)整,使標(biāo)題更簡潔有力,同時保持了原意。) 攜手共進(jìn)共創(chuàng)未來,中國一汽與零跑汽車正式牽手,雙方將共同推動技術(shù)協(xié)同創(chuàng)新與產(chǎn)業(yè)升級,助力雙方實現(xiàn)高質(zhì)量發(fā)展。 海景房砍價攻略10元以下,《海景房價格被砍到10元以下,這些 hacks你必須知道!》 秘法狂魔,《夢幻模擬戰(zhàn)》里奧貝克皮膚幽域秘法說明:1. 原標(biāo)題信息保留:游戲名、角色、技能、皮膚展示2. 去掉不必要的詞語: - "幽域秘法使"簡化為"幽域秘法" - "皮膚展示"簡化為"皮膚"3. 調(diào)整語序,使標(biāo)題更流暢4. 確保信息完整準(zhǔn)確5. 標(biāo)題長度縮短30%6. 符合中文表達(dá)習(xí)慣