- 新年探秘,《尋道大千》元旦返廠活動異獸介紹
- 即將上線的新活動指南,《未定事件簿》左然破浪遠(yuǎn)行邀請函介紹
- 解密技巧揭秘,《燕云十六聲》太極之謎解謎攻略
- 揭開戰(zhàn)斗奧秘,《問劍長生》天爐流派特點(diǎn)介紹
- 游戲內(nèi)攻略揭秘,《鬼谷八荒》雷靈氣出售方法
- 游戲策略指南,《問劍長生》宗門寶庫玩法介紹
- 探索必備指南,《燕云十六聲》忠孝傳家花錢位置一覽
- 伙伴系統(tǒng)指南,《我本千金》伙伴培養(yǎng)優(yōu)先攻略
- 游戲新體驗(yàn)搶先看,《陰陽師》福悅座敷童子花合戰(zhàn)皮膚介紹
- 游戲生活指南,《大奉打更人》釣魚方法一覽
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
出品 | 網(wǎng)易科技《態(tài)度AGI》欄目
作者 | 崔玉賢
編輯 | 丁廣勝
"下周智元機(jī)器人有重要進(jìn)展。"華為離職天才少年、智元聯(lián)合創(chuàng)始人稚暉君(彭志輝)在社交媒體上率先作了預(yù)告。
3月10日上午,"重要進(jìn)展"如期而至。智元機(jī)器人官方賬號正式發(fā)布首個通用具身基座模型——智元啟元大模型GO-1(Genie Operator-1),這也是國內(nèi)首個通用具身基座大模型。
消息一經(jīng)傳出,便登上兩個熱門話題。
智元官方介紹,其GO-1大模型開創(chuàng)了Vision-Language-Latent-Action (ViLLA)架構(gòu)。該架構(gòu)由多模態(tài)大模型(VLM)與混合專家(MoE)組成,具備人類視頻學(xué)習(xí)、小樣本快速泛化、一腦多形、持續(xù)進(jìn)化等優(yōu)勢。這不僅使機(jī)器具備了拓展運(yùn)動能力,更賦予了其AI能力,使機(jī)器真正獲得了價值。
智元官方在五個不同復(fù)雜度的任務(wù)上測試了GO-1,與現(xiàn)有最優(yōu)模型相比,GO-1的成功率大幅提升,平均成功率提高了32%(從46%增至78%)。
其中"倒水"、"清理桌面"和"補(bǔ)充飲料"等任務(wù)表現(xiàn)尤為突出。
在MoE架構(gòu)中,Latent Planner作為一組專家,基于VLM的中間層輸出預(yù)測Latent Action Tokens作為CoP(規(guī)劃鏈),進(jìn)行通用的動作理解和規(guī)劃。智元單獨(dú)驗(yàn)證了Latent Planner在ViLLA架構(gòu)中的作用,結(jié)果顯示增加Latent Planner可提升12%的成功率(從66%增至78%)。
智元表示,GO-1的推出不僅使具身智能的范圍從單一任務(wù)擴(kuò)展到多種任務(wù),還使它從封閉環(huán)境擴(kuò)展到開放世界,并從預(yù)設(shè)程序走向指令泛化,從而將這一技術(shù)提升到了新的高度。
智元將于2025年第三季度推出首個基于強(qiáng)化學(xué)習(xí)的Foundation Model。
在GO-1大模型發(fā)布之后,智元合伙人、具身業(yè)務(wù)部總裁、研究院執(zhí)行院長姚卯青以及智元具身研究中心常務(wù)主任任廣輝接受了網(wǎng)易科技的采訪。
關(guān)于發(fā)布具身基座大模型的初衷,姚卯青非??隙ǖ乇硎?,AI能力將成為區(qū)分機(jī)器人產(chǎn)品競爭力的核心要素,而機(jī)器人公司若不投入大模型,將難以在競爭中立于不敗之地。
對于智元來說,AI的投入可以視為一項具有戰(zhàn)略意義的堅定舉措。
此外,智元在發(fā)布基座大模型的同時,還將相關(guān)論文公開發(fā)布,這在一定程度上可以視為開源行為。據(jù)姚卯青透露,智元計劃于今年第一季度向核心用戶開源整個大模型。
在采訪中,姚卯青還提到了行業(yè)內(nèi)的熱門話題“9.9萬人形機(jī)器人”。他認(rèn)為,硬件的基礎(chǔ)同樣決定了機(jī)器能力的上限。在當(dāng)前階段,智元仍然堅信,以價值為導(dǎo)向,使機(jī)器人的硬件與軟件協(xié)同合作,才能產(chǎn)生理想的效果,而不是簡單地購買一個大型電動玩具。
姚卯青認(rèn)為,人形機(jī)器人的應(yīng)用將是一個漸進(jìn)的過程,未來1至2年,這一技術(shù)將在特定場景中實(shí)現(xiàn)落地。而人們期待的機(jī)器人進(jìn)入家庭場景,還需要大約5年時間。
智元機(jī)器人成立于2023年,創(chuàng)始人之一彭志輝曾是華為的"天才少年",人稱"稚暉君"或"野生鋼鐵俠"。公司成立不久就發(fā)布了首款人形機(jī)器人,截至目前已下線1000臺機(jī)器人產(chǎn)品,智元機(jī)器人已完成多項融資,累計融資金額超過16億元。
值得一提的是,稚暉君還是B站的熱門UP主,他于2017年11月26日開始在B站上傳視頻。2020年,憑借在B站發(fā)布自制硬核小電視內(nèi)容,他迅速走紅。2024年,陳睿在其公開演講中盛贊其"從野生鋼鐵俠到70億估值企業(yè)CTO"的成長路徑。
以下為對話智元合伙人、具身業(yè)務(wù)部總裁、研究院執(zhí)行院長姚卯青以及智元具身研究中心常務(wù)主任任廣輝的部分內(nèi)容:
提問:智元具身基座大模型的研發(fā)初衷是什么?
姚卯青:這與公司的使命緊密相連。我們公司的使命是希望通過通用機(jī)器人創(chuàng)造無限生產(chǎn)力。我們認(rèn)為,機(jī)器人僅憑硬件本體是遠(yuǎn)遠(yuǎn)不夠的。這一點(diǎn),國內(nèi)外一些機(jī)構(gòu)的評論也證實(shí),雖然中國形機(jī)器人公司在硬件方面表現(xiàn)突出,但在AI能力方面尚未見到顯著進(jìn)展。
我們認(rèn)為,AI能力將成為機(jī)器人產(chǎn)品競爭力的核心要素,就像當(dāng)今的新能源車和智能手機(jī)一樣。硬件領(lǐng)域已逐漸趨于收斂,供應(yīng)鏈也將高度整合,最終的競爭焦點(diǎn)將落在AI能力上。
對于機(jī)器人而言,自主作業(yè)能力至關(guān)重要?;谶@一初衷,我們將具身智能的AI研發(fā)提升為公司的戰(zhàn)略級投入。我們是 industry first 在行業(yè)內(nèi)實(shí)現(xiàn)了大規(guī)模量產(chǎn),并用 produced 的機(jī)器人編隊采集了百萬級高質(zhì)量數(shù)據(jù)。同時,我們將這些數(shù)據(jù)用于自研大模型,并將大模型部署回硬件本體。
我們實(shí)現(xiàn)了從硬件到大模型的完整閉環(huán)研發(fā)迭代。
提問:大模型將應(yīng)用于哪些場景?如何應(yīng)用?
姚卯青:我們預(yù)計大模型在機(jī)器人行業(yè)的應(yīng)用將經(jīng)歷逐步推進(jìn)的變化。它將首先在結(jié)構(gòu)化、明確場景的領(lǐng)域內(nèi)落地,然后逐步擴(kuò)展到半結(jié)構(gòu)化和半開放的任務(wù)和場景。通過在各行業(yè)、各場景中持續(xù)積累海量數(shù)據(jù)和交互數(shù)據(jù),我們最終將實(shí)現(xiàn)通用人工智能(AGI)在物理世界中的應(yīng)用。到那時,大模型可能會真正走入千家萬戶,在家庭中執(zhí)行各種開放式的指令任務(wù)。
從這一角度來看,我們將在未來兩年內(nèi)重點(diǎn)布局工業(yè)、服務(wù)業(yè)和商業(yè)領(lǐng)域的應(yīng)用,同時也將堅定不移地為最終實(shí)現(xiàn)AGI、走進(jìn)家庭這樣的開放式場景而持續(xù)技術(shù)突破。
提問:智元的具身基座大模型GO1能否降低成本?大概能降低多少?
任廣輝:我們可以回顧一下之前的研究,通常情況下,完成一個任務(wù)需要數(shù)萬條數(shù)據(jù)才能達(dá)到較好的成功率,而現(xiàn)在只需要數(shù)千條或幾百條,效率提升了幾個數(shù)量級。
提問:智元的具身基座大模型開源的發(fā)展前景如何?
姚卯青:在同步發(fā)布視頻的同時,我們還公開了技術(shù)博客和對應(yīng)的論文,這在某種程度上可以視為開源。同時,我們計劃在Q1對智元的核心用戶進(jìn)行模型的開源,以便他們可以將模型部署到智元的機(jī)器人上。
提問:機(jī)器人在基座模型上的技術(shù)是否已進(jìn)入技術(shù)收斂階段?
姚卯青:我們認(rèn)為,機(jī)器人的技術(shù)目前還處于早期階段,尚未達(dá)到技術(shù)收斂的程度。這主要是由于行業(yè)受限于數(shù)據(jù)的問題,還未完成對Scaling Low的完整驗(yàn)證工作。
提問:根據(jù)機(jī)器人智能等級標(biāo)準(zhǔn),智元的GO1技術(shù)相當(dāng)于哪個等級?
姚卯青:我們的發(fā)布技術(shù)目前處于G3至G4等級的過渡階段。
提問:未來,數(shù)據(jù)采集、標(biāo)注、審核以及數(shù)據(jù)交易等環(huán)節(jié)可能會單獨(dú)剝離出來形成一個產(chǎn)業(yè)嗎?
姚卯青:我們認(rèn)為,數(shù)據(jù)的采集、標(biāo)注、審核以及數(shù)據(jù)交易等環(huán)節(jié)可能會獨(dú)立出來形成一個產(chǎn)業(yè)。
提問:未來,機(jī)器人的核心競爭力將主要集中在人工智能技術(shù)上,其發(fā)展路線和趨勢是怎樣的?
姚卯青:我認(rèn)為算法目前尚未完全達(dá)到收斂狀態(tài),仍處于多元發(fā)展的階段。但在這一過程中,我們也發(fā)現(xiàn)了不少挑戰(zhàn),例如偏科現(xiàn)象普遍存在,一些公司在算法方面表現(xiàn)突出,但往往缺乏完善的機(jī)器人硬件支持。以國外公司為例,雖然他們在算法領(lǐng)域有一定造詣,但硬件本體的規(guī)模和質(zhì)量仍有待提升,這對算法研發(fā)和驗(yàn)證工作構(gòu)成了制約。另一方面,許多專注于硬件制造的公司,在AI領(lǐng)域投入的資源較為有限。
所以,我們希望看到更多像智元這樣,能夠從硬件、數(shù)據(jù)、算法等端到端進(jìn)行全面研發(fā)的企業(yè)涌現(xiàn)出來。
問題:您認(rèn)為機(jī)器人何時能真正走進(jìn)家庭生活?
姚卯青:我們判斷,這可能需要五到六年的時間,才能真正走進(jìn)家庭并創(chuàng)造價值。
問題:之前有人討論過價格9.9萬元的機(jī)器人,您認(rèn)為這在行業(yè)內(nèi)引發(fā)了很多爭議。您曾指出,9.9萬元的價格沒有實(shí)際意義?,F(xiàn)在大模型發(fā)布后,這對機(jī)器人終端售價會產(chǎn)生什么影響?
姚卯青:定價9.9萬元的機(jī)器人確實(shí)受到了行業(yè)內(nèi)外的高度關(guān)注。但業(yè)內(nèi)人士知道,現(xiàn)在高性能的零部件成本已經(jīng)很高了。如果價格特別低,那可能使用的材料就很普通。同時,硬件的基礎(chǔ)決定了機(jī)器人的能力上限。在這個階段,我們?nèi)匀粓孕牛嬲膬r值在于硬件和軟件協(xié)同工作的效果,而不是單純地購買一個大號的電動玩具,長期來看,這種產(chǎn)品不具備良好的商業(yè)價值。
問題:智元今年的商業(yè)計劃是什么?
姚卯青:今年我們的商業(yè)化目標(biāo)是實(shí)現(xiàn)營收比去年增長幾倍,出貨量預(yù)計將達(dá)到數(shù)千臺。
問題:智元公司成立時間較短,如何在與成立時間較長的公司競爭?有什么優(yōu)勢?
姚卯青:我覺得成立時間較短的公司有較大的競爭優(yōu)勢。因?yàn)閺募夹g(shù)角度來看,人形機(jī)器人產(chǎn)業(yè)是一個新興領(lǐng)域。我們看到,那些在大模型領(lǐng)域取得成功的企業(yè),他們的組織結(jié)構(gòu)和人才方向都非常年輕化。
在經(jīng)營戰(zhàn)略和技術(shù)創(chuàng)新規(guī)劃方面,我們希望能夠在"unlearned"的基礎(chǔ)上進(jìn)行學(xué)習(xí)和吸收。如果公司積累了一定的歷史包袱,就很難以"abrupt"的方式進(jìn)行戰(zhàn)略調(diào)整。同時,發(fā)展到一定規(guī)模的公司,從資本運(yùn)作層面和經(jīng)營層面往往都會變得更加保守和務(wù)實(shí)。
智元公司作為一家只有兩年歷史的初創(chuàng)企業(yè),其平均研發(fā)團(tuán)隊的年齡不到30歲。無論是出貨量還是營收表現(xiàn),都在以一個非常快速的速度增長。
相信今年我們有很大的機(jī)會能夠在經(jīng)營層面上實(shí)現(xiàn)國內(nèi)行業(yè)頭部地位,成為真正的龍頭企業(yè)。我們用兩年時間走完了行業(yè)同行可能需要八年、九年才能完成的路程,而且是在一個快速上升的行業(yè)中。
養(yǎng)成與策略,《天天闖關(guān)》皮膚系統(tǒng)攻略 《怪物獵人荒野》玩家分享如何高效刷取一夜花,怪物獵人荒野一夜資源快速獲取攻略 CF手游抽取雷神音效卡的方法,《CF手游》雷神音效卡獲得方法介紹 大劍破防必看,怪物獵人荒野:反擊觸發(fā)條件解析【攻擊逆襲觸發(fā)條件解析】在怪物獵人荒野中,玩家在戰(zhàn)斗中觸發(fā)特定的攻擊組合可以大幅提升戰(zhàn)斗力。本文將為您詳細(xì)解析反擊觸發(fā)條件,幫助您更好地掌握戰(zhàn)斗技巧?!居|發(fā)條件】1. 攻擊方向:確保攻擊方向與敵人位置對齊,避免不必要的走位操作。2. 時間控制:連續(xù)攻擊時,注意攻擊節(jié)奏,避免間歇性攻擊。3. 技能使用:合理使用特殊技能和必殺技,確保技能釋放時機(jī)與攻擊組合同步?!咀⒁馐马棥? 選擇適合的戰(zhàn)斗模式,如單人挑戰(zhàn)或組隊?wèi)?zhàn)斗,以更好地發(fā)揮技能效果。- 在實(shí)戰(zhàn)中根據(jù)敵人特點(diǎn)調(diào)整攻擊策略,提升戰(zhàn)斗效率?!究偨Y(jié)】通過以上分析,您可以更高效地掌握怪物獵人荒野中的反擊技巧,提升戰(zhàn)斗體驗(yàn)。 煉金裝備合成,《金色傳說》煉金盒玩法介紹 快速下載,怪物之家2勛章下載安裝教程 值臺小木盒點(diǎn)擊解鎖,陰陽鍋(上)謎境版第三章郭浩飛視角攻略 4月30日預(yù)下載開啟,Skin Deep發(fā)售日期泄露 電光飛弧,《星球重啟》飛天小柯基寵物介紹一覽 比亞迪海洋網(wǎng)發(fā)布全新車型,比亞迪海洋網(wǎng)銷量新高,即將推出全新休旅及獨(dú)立MPV