- 全新版本揭曉,文明7奠基者版發(fā)售時間揭秘
- 版本煥新,魔蛇之擁 卡西奧佩婭
- 獨家深度揭秘,最終幻想13-2PC版無限跳出怎么解決
- 新手必看攻略,絕區(qū)零1月21日兌換碼2025
- 奇趣互動探索,米塔迷你游戲玩法詳解
- 快速指南,NBA2K18連不上服務(wù)器怎么辦
- 全新選擇,文明7奠基者版發(fā)售時間公布
- 即將上線,《迷失之徑》發(fā)售時間介紹
- 實用技巧分享,ECHO解壓縮包損壞怎么辦
- 最新指南搶先看,崩壞星穹鐵道1月21日兌換碼2025
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
出品:網(wǎng)易科技《態(tài)度AGI》欄目
作者:崔玉賢
編輯:丁廣勝
“下周,智元機器人將發(fā)布全新產(chǎn)品。”華為離職天才少年、智元聯(lián)合創(chuàng)始人“稚暉君”(彭志輝)在社交媒體上發(fā)出預(yù)告。
3月10日上午,“好東西”如期而至,智元機器人官方宣布正式發(fā)布首個通用具身基座模型——智元啟元大模型GO-1(Genie Operator-1),這也是國內(nèi)首個通用具身基座大模型。
此消息迅速登上熱搜,引發(fā)廣泛關(guān)注。
根據(jù)官方介紹,智元的GO-1大模型采用了創(chuàng)新的Vision-Language-Latent-Action (ViLLA)架構(gòu),該架構(gòu)由VLM(多模態(tài)大模型)與MoE(混合專家)組成,具備人類視頻學(xué)習(xí)能力、小樣本快速泛化、一腦多形、持續(xù)進化等顯著優(yōu)勢。這一架構(gòu)使機器不僅具備了運動能力,更實現(xiàn)了AI功能,真正賦予了機器價值。
在對GO-1進行多維度測試后發(fā)現(xiàn),其在五個不同復(fù)雜度任務(wù)中的成功率較現(xiàn)有最優(yōu)模型大幅提升,平均成功率提高32%(從46%提升至78%)。
其中,“倒水”、“清理桌面”和“補充飲料”等任務(wù)表現(xiàn)尤為突出。
在ViLLA架構(gòu)中,Latent Planner作為MoE的一組專家,基于VLM的中間層輸出預(yù)測Latent Action Tokens作為CoP(Chain of Planning,規(guī)劃鏈),實現(xiàn)了通用的動作理解和規(guī)劃。單獨驗證Latent Planner在ViLLA架構(gòu)中的作用后,其成功率提升了12%(從66%提升至78%)。
推出GO-1后,智元機器人將具身智能技術(shù)的應(yīng)用場景從單一任務(wù)擴展到了多任務(wù)并行,從封閉環(huán)境轉(zhuǎn)向開放世界,從預(yù)設(shè)程序走向指令泛化,標志著具身智能技術(shù)進入了一個全新的發(fā)展階段。
智元機器人將于2025年第二季度推出首個基于強化學(xué)習(xí)的Foundation Model。
在GO-1大模型正式發(fā)布之后,智元合伙人、具身業(yè)務(wù)部總裁、研究院執(zhí)行院長姚卯青以及智元具身研究中心常務(wù)主任任廣輝接受了網(wǎng)易科技的采訪。
對于發(fā)布基座大模型的目的,姚卯青表示,AI技術(shù)將成為機器人產(chǎn)品核心競爭力的關(guān)鍵要素,而機器人行業(yè)的發(fā)展最終將取決于其AI能力。因此,任何機器人公司若不投入大模型技術(shù)的研發(fā),則難以在未來的競爭中立于不敗之地。
對于智元來說,AI技術(shù)的投入被視為一項具有戰(zhàn)略意義的長期規(guī)劃,且是堅定的。
此外,智元在發(fā)布基座大模型的同時,還同步發(fā)布了相關(guān)論文,這在一定程度上可被視為一種開放式的做法。據(jù)姚卯青透露,智元將在2025年第一季度向核心用戶開源整個大模型。
在采訪中,姚卯青還深入探討了行業(yè)熱議的"9.9萬人形機器人"話題。他認為,機器人硬件的基礎(chǔ)性能同樣決定了其能力的上限。在這一階段,智元仍然堅持認為,以價值為導(dǎo)向,讓機器人硬件與軟件協(xié)同合作,產(chǎn)生良好的效果,才是正確的研發(fā)方向,而不是簡單地追求體積大的"玩具"。
姚卯青表示,人形機器人的應(yīng)用將是一個漸進的過程。目前,人形機器人已在局部場景中實現(xiàn)應(yīng)用落地,但大家期待的機器人進入家庭場景,還需要再等5年左右。
智元機器人公司成立于2023年,創(chuàng)始人彭志輝早年曾在華為擔(dān)任要職,后轉(zhuǎn)投智元。自成立以來,公司就已推出首款真正意義上的人形機器人,并已批量下線1000臺機器人產(chǎn)品,完成了多輪融資,累計融資金額超過16億元。
值得一提的是,智元的創(chuàng)始人彭志輝還是B站知名UP主。2017年,他開始在B站發(fā)布視頻內(nèi)容。2020年,憑借在B站制作的硬核小電視視頻走紅。2024年,他在公開演講中盛贊其從"野生鋼鐵俠"成長為70億估值企業(yè)CTO的成長軌跡。
以下是對原文的改寫版本:
1. 以下為對話智元合伙人、具身業(yè)務(wù)部總裁、研究院執(zhí)行院長姚卯青以及智元具身研究中心常務(wù)主任任廣輝的部分內(nèi)容:
2. 提問:智元具身基座大模型的研發(fā)初衷是什么?
3. 姚卯青:這與我們公司的使命緊密相連。我們公司的使命是通過通用機器人創(chuàng)造無限生產(chǎn)力。我們認為,機器人僅憑硬件本體(HBP)是不夠的,這也是當前一些機構(gòu)或國外公司對機器人行業(yè)的評論,認為中國人形機器人公司在硬件領(lǐng)域表現(xiàn)突出,但在AI能力方面尚未見到顯著進展。
4. 我們認為,AI能力將是未來機器人產(chǎn)品競爭力的核心驅(qū)動力,就像今天的新能源車和智能手機一樣,硬件領(lǐng)域趨于收斂,供應(yīng)鏈高度整合,最終的對決將集中在AI能力上。
5. 對于機器人而言,沒有自主作業(yè)能力的價值是有限的?;谶@一初衷,我們將具身智能的AI研發(fā)提升為公司戰(zhàn)略級的投入。我們也是首個實現(xiàn)大規(guī)模機器人量產(chǎn),并用這批產(chǎn)線采集的數(shù)百萬高質(zhì)量數(shù)據(jù)進行自研大模型訓(xùn)練,同時將大模型部署回硬件本體。這一閉環(huán)的研發(fā)迭代是 industry-defining的。
6. 提問:大模型的應(yīng)用場景將經(jīng)歷怎樣的演變?
7. 姚卯青:我們預(yù)計,大模型在機器人行業(yè)的應(yīng)用將經(jīng)歷漸進式演變,從結(jié)構(gòu)化場景較為明確的領(lǐng)域開始逐步落地探索,隨后向半結(jié)構(gòu)化和半開放的任務(wù)和場景擴展。通過在各行業(yè)、各場景中持續(xù)積累海量數(shù)據(jù)和交互數(shù)據(jù),我們最終將實現(xiàn)通用人工智能(AGI)在物理世界的應(yīng)用,真正走進千家萬戶,尤其在家庭中執(zhí)行各類開放式的指令任務(wù)。
8. 從這一角度看,我們在過去兩年內(nèi)將重點布局工業(yè)、服務(wù)業(yè)和商業(yè)領(lǐng)域的應(yīng)用,同時堅定地為最終實現(xiàn)AGI、走進家庭這樣的開放式場景持續(xù)技術(shù)積累。
9. 提問:智元的具身基座大模型GO1可以降低成本,具體能夠降低多少幅度?
讓我們回顧一下之前的研究成果。在特定場景中,完成一個任務(wù)所需的訓(xùn)練數(shù)據(jù)量可能達到數(shù)千條甚至數(shù)百條就能達到最佳效果,相比之前需要的萬條規(guī)模,這相當于降低了數(shù)量級的數(shù)據(jù)采集要求。
智元開發(fā)的具身基座大模型開源后,其應(yīng)用前景如何?
我們可以看到,智元推出的核心技術(shù)已正式發(fā)布,并同步公開了技術(shù)博客和相關(guān)論文。某種程度上,這也算是對智元平臺的開源。我們計劃在本季度對核心用戶進行模型開源,允許他們將模型部署到智元的機器人上進行應(yīng)用。
機器人技術(shù)方面,我們認為目前仍處于早期階段,尚未達到技術(shù)收斂狀態(tài)。由于行業(yè)受限于數(shù)據(jù)供應(yīng)的問題,尚未完成從局部驗證到全面驗證的完整過程。這也是我們此前選擇主動開源AgiBot World的原因。
在機器人智能等級標準(G1-G5)的體系中,智元的GO1技術(shù)應(yīng)該處于哪個等級?
目前發(fā)布的相關(guān)技術(shù)處于G3至G4之間的過渡階段。
數(shù)據(jù)集采集的未來走向是否會單獨剝離出來形成一個獨立的產(chǎn)業(yè)?
這一趨勢是有可能的。從AI產(chǎn)業(yè)發(fā)展的明確分工來看,數(shù)據(jù)采集、標注、審核甚至數(shù)據(jù)交易等環(huán)節(jié)都已經(jīng)出現(xiàn)了以平臺為主導(dǎo)的機構(gòu)。在機器人領(lǐng)域,這一情況同樣具備可復(fù)制性。
未來,機器人技術(shù)的發(fā)展將主要聚焦于哪些方面?技術(shù)路徑和市場趨勢是怎樣的?
在技術(shù)路徑和市場趨勢方面,機器人的核心競爭力將源自于AI技術(shù)的持續(xù)進步。我們預(yù)計,隨著AI技術(shù)的不斷演進,機器人領(lǐng)域的競爭將更加激烈,市場也將呈現(xiàn)出多元化的發(fā)展格局。
姚卯青:我認為算法目前還處于發(fā)展的初期階段,還不能說已經(jīng)形成了完整的生態(tài)鏈。但在這一過程中,我們確實遇到了一些挑戰(zhàn)。例如,偏科現(xiàn)象較為普遍,一些公司在算法方面有顯著優(yōu)勢,包括一些國外公司,雖然在AI算法方面表現(xiàn)突出,但在機器人硬件和機器人本體的生產(chǎn)規(guī)模上卻相對薄弱,這在一定程度上限制了其在算法研發(fā)和驗證方面的整體能力。另一方面,一些專注于硬件制造的公司由于行業(yè)限制,其在AI領(lǐng)域的投入也受到較大制約。
我們希望看到更多的公司能夠像智元這樣,從硬件、數(shù)據(jù)、算法等端到端,具備完整的研發(fā)能力,從而在這一領(lǐng)域形成更多具有競爭力的創(chuàng)新者。
提問:您認為智能機器人何時能夠走進家庭場景應(yīng)用?
姚卯青:我們預(yù)測,這一目標的實現(xiàn)可能需要大約五年的努力,才能真正推動智能機器人走入家庭,創(chuàng)造實際價值。
提問:之前有人對9.9萬元價位下的機器人表示擔(dān)憂,您認為這一價位是否具有真正的市場價值?
姚卯青:9.9萬元價位確實引起了廣泛關(guān)注。但是,行業(yè)內(nèi)的從業(yè)者都知道,目前生產(chǎn)高質(zhì)量零部件的成本較高。如果價格虛高,顯然是在使用劣質(zhì)材料。此外,硬件的基礎(chǔ)配置也決定了機器人的能力上限。在此階段,我們始終堅持價值導(dǎo)向,只有當機器人的硬件與軟件協(xié)同作用,才能產(chǎn)生真正的好效果,為用戶提供實際價值。單純購買一個大號的電動玩具,長期來看不具備良好的商業(yè)價值。
提問:智元今年的商業(yè)計劃是什么?
姚卯青:今年我們的增長目標是營收的倍增,出貨量將突破數(shù)千臺。
提問:智元成立僅兩三 years,如何與成立八九年甚至更長時間的公司競爭?競爭優(yōu)勢是什么?
姚卯青:我覺得成立時間較短的公司具有較大的競爭優(yōu)勢。因為智能機器人產(chǎn)業(yè)從技術(shù)上說是一個新興行業(yè),而能夠成功的大模型公司往往在組織結(jié)構(gòu)上有著非常年輕化的方向。
在制定經(jīng)營戰(zhàn)略或技術(shù)規(guī)劃時,我們需要克服"unlearnable"的障礙,如果存在過多的歷史包袱,就難以采取-bold的策略性調(diào)整。發(fā)展到一定規(guī)模的公司,從資本運作層面和經(jīng)營層面都會變得更加保守、務(wù)實。
智元公司成立兩年來,平均研發(fā)年齡為30歲以下,無論是產(chǎn)品銷量還是收入,都實現(xiàn)了快速提升。
相信今年我們有機會在經(jīng)營層面上實現(xiàn)國內(nèi)行業(yè)領(lǐng)軍,成為真正的行業(yè)龍頭。我們用兩年時間走完了別人可能需要八年、九年才能完成的路程,這得益于快速上升的趨勢。
特朗普關(guān)稅政策,21深度|美股“大跳水” 全新生存游戲《Star Crafter》生存版本現(xiàn)已上線免費下載地址https//store.steampowered.com/app/3476660/Star_Crafter/,Star Crafter下載地址:官網(wǎng)下載鏈接匯總 1984年父女逃學(xué)北上父女情深父以大貨車為家的選擇,《北上》學(xué)而思貨車事件引發(fā)熱議,齊歡回應(yīng)引發(fā)社會關(guān)注! Team Ninja《浪人崛起》,Rise of the Ronin官網(wǎng)地址在哪?Rise of the Ronin游戲官網(wǎng)鏈接 經(jīng)濟利益與停火,萬斯稱烏克蘭最有效的安全保障是讓美國人受益 緋紅森林早晨釣魚指南捕捉神秘寶藏,怪物獵人荒野釣盾章菊螺技巧分享 "科技競爭中被中國超越,需效仿特朗普" 地圖導(dǎo)航捷徑,怪物獵人荒野掌握游戲?qū)Ш郊记?,快速找到東西實用方法! 異界凱薩強技能,《天下布魔ma》夜之影凱薩技能介紹 低門檻新政策,蘇州推出特色房貸業(yè)務(wù),前五年每月僅需支付100元本金