人妻精品无码专区,在线不卡高清是日本视频

聲明:本文來(lái)自于（ID:ykqsd.com）授權(quán)轉(zhuǎn)載發(fā)布。

3月10日，上海機(jī)器人初創(chuàng)公司智元機(jī)器人官方發(fā)布其智元啟元大模型GenieOperator-1（GO-1），這是中國(guó)首個(gè)通用具身基座模型。智元機(jī)器人表示，這款模型具備泛化能力，能夠在極少數(shù)據(jù)甚至零樣本下快速適應(yīng)新場(chǎng)景和新任務(wù)，從而降低了具身模型的使用門(mén)檻和后訓(xùn)練成本。

該模型首次提出Vision-Language-Latent-Action（ViLLA）架構(gòu)，實(shí)現(xiàn)了基于人類(lèi)視頻的學(xué)習(xí)能力，支持小樣本快速泛化。ViLLA架構(gòu)由多模態(tài)大模型（VLM）和混合專(zhuān)家（MoE）組成。其中，VLM利用海量互聯(lián)網(wǎng)圖文數(shù)據(jù)提升通用場(chǎng)景感知和語(yǔ)言理解能力；MoE中的隱式規(guī)劃器（Latent Planner）通過(guò)大量跨本體和人類(lèi)操作數(shù)據(jù)，獲得通用動(dòng)作理解能力；動(dòng)作專(zhuān)家（Action Expert）則通過(guò) million 真機(jī)數(shù)據(jù)提升精細(xì)動(dòng)作執(zhí)行能力。在推理過(guò)程中，VLM、隱式規(guī)劃器和動(dòng)作專(zhuān)家協(xié)同工作。目前，智元啟元大模型已成功部署于智元多款機(jī)器人本體。

具身智能（Embodied Intelligence）是一種基于物理身體進(jìn)行感知和行動(dòng)的智能系統(tǒng)，通過(guò)智能體與環(huán)境的交互獲取信息、理解問(wèn)題、做出決策并實(shí)現(xiàn)行動(dòng)，從而產(chǎn)生智能行為和適應(yīng)性。機(jī)器人是具身智能的主要代表產(chǎn)品之一。實(shí)現(xiàn)具身智能更強(qiáng)調(diào)與物理世界的直接交互，需要處理視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)、運(yùn)動(dòng)等多種模態(tài)的數(shù)據(jù)，并將感知、決策和行動(dòng)緊密結(jié)合。

2024年年底，智元機(jī)器人曾發(fā)布AgiBot World 百萬(wàn)真機(jī)數(shù)據(jù)集，盡管該數(shù)據(jù)集已是目前最大的機(jī)器人真機(jī)示教數(shù)據(jù)集，但高質(zhì)量帶動(dòng)作標(biāo)簽的真機(jī)數(shù)據(jù)量仍然有限，遠(yuǎn)少于互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)集。為了解決具身智能數(shù)據(jù)困境，智元機(jī)器人此次采用隱式動(dòng)作（Latent Actions）來(lái)建模當(dāng)前幀和歷史幀之間的隱式變化，通過(guò)隱式規(guī)劃器（Latent Planner）預(yù)測(cè)這些隱式動(dòng)作，從而將異構(gòu)數(shù)據(jù)源中真實(shí)世界的動(dòng)作知識(shí)轉(zhuǎn)移到通用操作任務(wù)中。

智元機(jī)器人表示，通過(guò)ViLLA 創(chuàng)新性架構(gòu)，其在五種不同復(fù)雜度任務(wù)上的測(cè)試結(jié)果顯示，GO-1大模型的平均成功率較現(xiàn)有最優(yōu)模型提高了32%。其中在“倒水”、“清理桌面”和“補(bǔ)充飲料”等任務(wù)中表現(xiàn)尤為突出。此外，GO-1大模型還可以搭配一套整套的數(shù)據(jù)回流系統(tǒng)，從實(shí)際執(zhí)行中遇到的問(wèn)題數(shù)據(jù)持續(xù)進(jìn)化學(xué)習(xí)，實(shí)現(xiàn)“越用越聰明”。

北航機(jī)器人研究所名譽(yù)所長(zhǎng)、中關(guān)村智友研究院院長(zhǎng)王田苗在接受澎湃科技采訪(fǎng)時(shí)認(rèn)為，大模型對(duì)人形機(jī)器人的核心貢獻(xiàn)在于實(shí)現(xiàn)類(lèi)似人類(lèi)的交互、推理和環(huán)境適應(yīng)能力。然而，目前仍存在理論和技術(shù)挑戰(zhàn)。例如，通用大模型在算法選擇上（是監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)，還是端到端學(xué)習(xí)或者模擬學(xué)習(xí)），這些都是需要探索的。

智元機(jī)器人方表示，大語(yǔ)言模型是數(shù)字世界、單模態(tài)的，而具身智能需要處理多模態(tài)物理世界的數(shù)據(jù)，包括圖像、視頻、傳感器數(shù)據(jù)等。大模型對(duì)這些非文本數(shù)據(jù)的理解和處理能力有限，無(wú)法滿(mǎn)足具身智能對(duì)多模態(tài)數(shù)據(jù)融合的需求。采用ViLLA架構(gòu)的大模型則更好地滿(mǎn)足了具身智能對(duì)多模態(tài)數(shù)據(jù)融合和物理世界交互的需求。

不過(guò)，一位關(guān)注具身智能機(jī)器人基礎(chǔ)場(chǎng)景數(shù)據(jù)和解決方案的從業(yè)人員認(rèn)為，目前具身基座模型的“通用性”仍有待驗(yàn)證，很難給出準(zhǔn)確評(píng)價(jià)。在他看來(lái)，智元此次發(fā)布的模型可能主要針對(duì)其自產(chǎn)的機(jī)器人，對(duì)其它機(jī)器人適用程度還需更多從業(yè)者進(jìn)一步驗(yàn)證。

熱度與口碑的反差，《北上》實(shí)力派小演員受關(guān)注！ AlphaEdit精準(zhǔn)算法零空間投影技術(shù)突破語(yǔ)言模型知識(shí)更新效率，Llama 3通過(guò)模型編輯算法，在知識(shí)編輯任務(wù)中表現(xiàn)提升35%。拖圖通關(guān)，《文字分析農(nóng)民工生活問(wèn)題，助您提高生活質(zhì)量秘籍》萬(wàn)斯停火談判有希望，烏克蘭安全問(wèn)題專(zhuān)家萬(wàn)斯稱(chēng)，讓美國(guó)人受益是烏克蘭最好的安全保障巡演大膽暴露與冷遇，Jennie魅力展現(xiàn)：歐美演唱會(huì)舞步尷尬或Jennie歐美巡演：舞步尷尬魅力依舊這兩個(gè)版本都保持了原意，同時(shí)簡(jiǎn)化了內(nèi)容，使標(biāo)題更簡(jiǎn)潔明了。大模型創(chuàng)新與AI通用Agent，國(guó)金證券解讀：Manus推動(dòng)通用Agent發(fā)展，關(guān)注AI應(yīng)用創(chuàng)新突破崩壞星穹鐵道直播預(yù)告12月15日1930新增角色&兌換碼，《崩壞：星穹鐵道》1.6直播時(shí)間表一覽極限運(yùn)動(dòng)限定，《無(wú)期迷途》極限運(yùn)動(dòng)計(jì)劃介紹一覽文字挑戰(zhàn)飲品拖動(dòng)還原攻略，《來(lái)找茬》熱門(mén)飲品拖拽還原飲品名通關(guān)技巧丹麥軍長(zhǎng)宣布北歐八國(guó)向?yàn)蹩颂m提供彈藥支持，歐洲國(guó)家批準(zhǔn)向?yàn)蹩颂m提供大額資金援助