- 探索神秘任務,《燕云十六聲》魯墨之辨萬事知任務攻略
- 冒險升級新玩法揭曉,《冒險大作戰(zhàn)》武魂獲取玩法介紹
- 快速指南,《大奉打更人》成就獎勵領取方法
- 獲取強大守護者的簡單指南,《龍息神寂》格里什納爾獲取途徑一覽
- 探索異獸潛能,《九州異獸記》豬剛鬣升級升星方法
- 體驗全新升級,《燕云十六聲》1.3版本更新內容概覽
- 游戲裝備指南,《大奉打更人》裝備替換方法
- 游戲指南陣容搭配揭秘,《絕區(qū)零》伊芙琳最強配隊陣容推薦
- 快速升級指南,《悠星大陸》快速升級方法
- 探秘無限暖暖的奇幻套裝世界,《無限暖暖》幽引花途屬性一覽
聲明:本文來自于(ID:ykqsd.com)授權轉載發(fā)布。
3月10日,上海機器人初創(chuàng)公司智元機器人官方發(fā)布其智元啟元大模型GenieOperator-1(GO-1),這是中國首個通用具身基座模型。智元機器人表示,這款模型具備泛化能力,能夠在極少數(shù)據(jù)甚至零樣本下快速適應新場景和新任務,從而降低了具身模型的使用門檻和后訓練成本。
該模型首次提出Vision-Language-Latent-Action(ViLLA)架構,實現(xiàn)了基于人類視頻的學習能力,支持小樣本快速泛化。ViLLA架構由多模態(tài)大模型(VLM)和混合專家(MoE)組成。其中,VLM利用海量互聯(lián)網圖文數(shù)據(jù)提升通用場景感知和語言理解能力;MoE中的隱式規(guī)劃器(Latent Planner)通過大量跨本體和人類操作數(shù)據(jù),獲得通用動作理解能力;動作專家(Action Expert)則通過 million 真機數(shù)據(jù)提升精細動作執(zhí)行能力。在推理過程中,VLM、隱式規(guī)劃器和動作專家協(xié)同工作。目前,智元啟元大模型已成功部署于智元多款機器人本體。
具身智能(Embodied Intelligence)是一種基于物理身體進行感知和行動的智能系統(tǒng),通過智能體與環(huán)境的交互獲取信息、理解問題、做出決策并實現(xiàn)行動,從而產生智能行為和適應性。機器人是具身智能的主要代表產品之一。實現(xiàn)具身智能更強調與物理世界的直接交互,需要處理視覺、聽覺、觸覺、運動等多種模態(tài)的數(shù)據(jù),并將感知、決策和行動緊密結合。
2024年年底,智元機器人曾發(fā)布AgiBot World 百萬真機數(shù)據(jù)集,盡管該數(shù)據(jù)集已是目前最大的機器人真機示教數(shù)據(jù)集,但高質量帶動作標簽的真機數(shù)據(jù)量仍然有限,遠少于互聯(lián)網規(guī)模的數(shù)據(jù)集。為了解決具身智能數(shù)據(jù)困境,智元機器人此次采用隱式動作(Latent Actions)來建模當前幀和歷史幀之間的隱式變化,通過隱式規(guī)劃器(Latent Planner)預測這些隱式動作,從而將異構數(shù)據(jù)源中真實世界的動作知識轉移到通用操作任務中。
智元機器人表示,通過ViLLA 創(chuàng)新性架構,其在五種不同復雜度任務上的測試結果顯示,GO-1大模型的平均成功率較現(xiàn)有最優(yōu)模型提高了32%。其中在“倒水”、“清理桌面”和“補充飲料”等任務中表現(xiàn)尤為突出。此外,GO-1大模型還可以搭配一套整套的數(shù)據(jù)回流系統(tǒng),從實際執(zhí)行中遇到的問題數(shù)據(jù)持續(xù)進化學習,實現(xiàn)“越用越聰明”。
北航機器人研究所名譽所長、中關村智友研究院院長王田苗在接受澎湃科技采訪時認為,大模型對人形機器人的核心貢獻在于實現(xiàn)類似人類的交互、推理和環(huán)境適應能力。然而,目前仍存在理論和技術挑戰(zhàn)。例如,通用大模型在算法選擇上(是監(jiān)督學習、強化學習,還是端到端學習或者模擬學習),這些都是需要探索的。
智元機器人方表示,大語言模型是數(shù)字世界、單模態(tài)的,而具身智能需要處理多模態(tài)物理世界的數(shù)據(jù),包括圖像、視頻、傳感器數(shù)據(jù)等。大模型對這些非文本數(shù)據(jù)的理解和處理能力有限,無法滿足具身智能對多模態(tài)數(shù)據(jù)融合的需求。采用ViLLA架構的大模型則更好地滿足了具身智能對多模態(tài)數(shù)據(jù)融合和物理世界交互的需求。
不過,一位關注具身智能機器人基礎場景數(shù)據(jù)和解決方案的從業(yè)人員認為,目前具身基座模型的“通用性”仍有待驗證,很難給出準確評價。在他看來,智元此次發(fā)布的模型可能主要針對其自產的機器人,對其它機器人適用程度還需更多從業(yè)者進一步驗證。
2024反腐成效最高法處理3萬件貪污賄賂案件,最高法工作報告點名杜兆才陳戌源李鐵案 ?;鹛嶙h俄羅斯與烏克蘭探討?;鸬目赡苄裕頌鯖_突或迎轉機?俄稱可能同意停戰(zhàn)(說明:這個改寫版本主要做了以下優(yōu)化:1. 將長標題拆分成兩句,前半部分作為問題,后半部分作為原因,使標題更簡潔2. 使用更簡潔的表達方式(如"或迎轉機?"改為"可能")3. 通過簡化語序和詞語,使標題更符合中文表達習慣4. 保留了核心信息,即俄烏沖突可能轉機,俄方可能同意停戰(zhàn)5. 去除了部分冗余詞,使標題更精煉6. 同時也保持了信息的完整性,確保讀者能夠快速抓住重點) 劍指罪犯,人民法院嚴懲挑戰(zhàn)法律及道德底線者 科技新突破,GO-1大模型發(fā)布,預計人形機器人可能在2035年普及 越級空間體驗續(xù)航10.6kWh引領A+級純電家用電轎,榮威純電D6發(fā)布 去A+級純電家轎新標桿 探秘之謎,《鋼嵐》第二章寶箱位置一覽 巴黎時裝周王一博看起來有些疲憊,"王一博時裝周走秀引發(fā)粉絲 vs 網友爭議" 全球首個前空翻機器人,首款空翻人形機器人升級版,眾擎新品支持快速奔跑 兩會 focus,以下是對標題的改寫版本:"海爾總裁周云杰走紅,回應開號計劃及續(xù)集傳聞"這個改寫版本:1. 去掉了"熱搜",簡化了表述2. 使用"走紅"替代"走紅話題"3. 調整了語序,使信息傳達更簡潔4. 保留了關鍵信息:周云杰的回應內容5. 保持了整體的流暢性這樣的改寫版本既保持了原文的核心信息,又使標題更加簡短有力。 首爾市抱川區(qū)韓軍空襲事件31人受傷142棟房屋受損,韓國居民區(qū)發(fā)生戰(zhàn)機誤投8枚炸彈事件,造成31人受傷,142棟房屋受損,初步原因鎖定為飛行員坐標輸入錯誤。