- 全新視角,《世界之外》茶館軼聞活動介紹
- 奇幻冒險指南,《霓虹深淵:無限》寵物火焰精靈圖鑒
- 探索奇幻冒險,《霓虹深淵:無限》寵物歡快的劍玉圖鑒
- 游戲小技巧揭秘,《原神》圣遺物套裝鎖定關閉介紹
- 深入解讀玩家新套路,《原神》5.2萬希牌組搭配推薦
- 游戲技巧解鎖,《螺旋勇士》雙B0SS原理攻略通用
- 游戲世界中的小妙招,《星露谷物語》潘姆需要電池任務攻略
- 游戲新手指南,《魔獸世界》驚天兇案任務攻略
- 探索奇幻冒險,《霓虹深淵:無限》寵物棒球鸚鵡圖鑒
- 攻略達人帶你探索,《螺旋勇士》時空秘境第十層攻略
聲明:本文來自于(ID:ykqsd.com)授權轉載發(fā)布。
中國的人形機器人公司,近年來在技術發(fā)展層面,持續(xù)探索硬件與AI的協(xié)同發(fā)展路徑。在近期一次對話中,美國知名人形機器人公司Figure AI的創(chuàng)始人布雷特·阿德考克(Brett Adcock)表示,硬件與AI的協(xié)同發(fā)展,是實現(xiàn)技術突破的關鍵所在。他強調,一家優(yōu)秀的機器人公司,不能只專注于其中一部分技術,而必須在硬件與AI兩個維度上均衡發(fā)展。
阿德考克還提到,目前中國市場上的部分機器人公司,過分強調硬件建設,卻忽視了AI技術的投入。這種"偏科"的現(xiàn)象,實際上正在改變中國頭部人形機器人企業(yè)的戰(zhàn)略方向。具體來說,這類企業(yè)正在將硬件與AI協(xié)同發(fā)展作為核心戰(zhàn)略,以實現(xiàn)技術突破。
3月10日,在一次采訪中,智元公司合伙人、具身業(yè)務部總裁姚卯青進一步分析了這一現(xiàn)象。他指出,在人形機器人賽道上,"偏科"現(xiàn)象普遍存在。一些公司雖然在算法研發(fā)方面投入較大,但卻在硬件制造能力上有所欠缺,這會嚴重制約算法研發(fā)的效果。而另一些公司雖然注重硬件建設,但在AI技術投入方面則受到限制。只有像智元這樣的公司,能夠在硬件與AI兩個維度上實現(xiàn)全面布局,才能在競爭中脫穎而出。
值得注意的是,智元的這種"雙輪驅動"戰(zhàn)略,正是其在2023年2月成功獲得"獨角獸"稱號的重要原因。確實有部分中國機器人公司,將重心放在硬件建設上。去年8月,宇樹科技創(chuàng)始人王興興在接受采訪時曾提到,由于具身智能大模型的研發(fā)投入較大,宇樹科技在這一領域采取了較為謹慎的態(tài)度。他指出,考慮到當前具身智能模型技術路線尚不清晰,投入可能會帶來不確定性,因此選擇暫時觀望。然而,王興興也強調,宇樹科技不會放棄對這一領域的研發(fā),因為硬件是連接AI的橋梁,缺乏對具身智能模型的深入了解,很難設計出優(yōu)秀的機器人本體。
相比之下,姚卯青認為,智元在這一領域的投入更為積極。他指出,機器人公司如果不具備強大的AI能力,就無法實現(xiàn)智能化轉型,也就無法實現(xiàn)真正的作業(yè)能力。在姚卯青看來,AI技術能力將成為未來機器人產品競爭力的關鍵所在,就像新能源汽車和智能手機等終端產品一樣,隨著硬件方案逐漸趨于統(tǒng)一,供應鏈高度整合,最終的競爭將集中在AI能力上。
智元的人形機器人
3月10日,智元發(fā)布了首個通用具身基座大模型GO-1。據公司介紹,這款具身智能模型最大的創(chuàng)新在于其架構設計。智元GO-1采用了Vision-Language-Latent-Action (ViLLA)架構,這一架構由多模態(tài)大模型(VLM)與混合專家模型(MoE)組成。
其中,VLM通過學習海量的互聯(lián)網純文本與圖文數據,幫助機器人理解通用知識和場景信息。而MoE則由兩個"專家"組成:隱式規(guī)劃器(Latent Planner)利用大量的人類與機器人本體的操作數據,獲得通用的動作理解能力;動作專家(Action Expert)則通過仿真數據和真實數據的結合,獲得精細的動作執(zhí)行能力。
從技術原理上來看,這種架構構建了從通用場景感知、指令理解、動作理解到動作最終執(zhí)行的全鏈條。姚卯青用乒乓球教學的比喻進一步解釋了這一架構的創(chuàng)新之處。他指出,VLM之于機器人的作用,好比是基礎理論課,幫助機器人理解乒乓球的基礎知識。隱式規(guī)劃器(Latent Planner)的作用,好比是讓初學者觀看世界冠軍的比賽視頻,幫助他們理解乒乓球的高級技巧。而動作專家(Action Expert)則通過仿真數據進行模擬訓練,如同使用發(fā)球機進行訓練,而利用真實數據進行訓練,則如同請乒乓球教練手把手指導。
這一創(chuàng)新性的技術架構,不僅為智元的人形機器人開發(fā)開辟了新的技術路徑,也為整個機器人行業(yè)的發(fā)展提供了重要的參考價值。
具身智能模型的四類訓練數據。智元公司為其提供技術支持。
智元具身研究中心常務主任任廣輝指出,當前市場上具身智能模型面臨著諸多實際應用難題。例如,斯坦福大學的ACT小模型雖然在訓練方法上有所創(chuàng)新,但未能充分運用大規(guī)模圖文和操作視頻數據,導致其技能單一且難以學習新技能?;赩ision-Language-Action(VLA)構建的模型雖然在場景感知和指令理解方面表現(xiàn)突出,但在缺乏大規(guī)模機器人操作視頻數據的情況下,其迭代成本過高。
智元發(fā)布的實驗數據顯示,其推出的GO-1模型較現(xiàn)有最優(yōu)模型顯著提升了成功率,從46%提升至78%,改進幅度達32%。
智元方面表示,GO-1模型在泛化能力方面進行了顯著優(yōu)化,降低了具身模型的使用門檻。同時,該模型搭配了一套完整的數據回流系統(tǒng),能夠實時反饋場景測試中的錯誤數據,并將這些數據融入后續(xù)模型訓練,實現(xiàn)模型的持續(xù)迭代。
為拓展應用場景,智元正在尋求與頭部大模型公司合作開發(fā)具身智能模型。2月下旬,跳星星辰宣布與智元達成戰(zhàn)略合作,共同探索AI+具身機器人在各領域的應用。智元介紹稱,雙方將基于跳星的多模態(tài)、推理和訓練等底層技術能力,開發(fā)出符合機器人應用場景的產品。
在數據采集路線的探索方面,目前仍存在不同的策略選擇。部分企業(yè)傾向于利用合成數據,但也有不少公司認為真實機器人的數據是解決數據瓶頸的重要途徑。為此,智元在上海建立了 dedicated的數據采集工廠,部署了近100臺機器人,日采集量達到3萬至5萬條真實數據。
業(yè)內普遍認為,2025年是具身智能模型"量產元年"。1月初,智元宣布已累計下線1000臺通用具身機器人,其中包括731套雙足人形機器人和269套輪式通用機器人。姚卯青透露,這1000臺機器人中有數百臺已經交付給客戶,其余作為樣機投入研發(fā)。
姚卯青預估,公司今年的出貨量將突破數千臺,并預計營收較去年將實現(xiàn)數倍增長。此外,智元計劃在科研教育、服務業(yè)等領域進一步拓展應用場景。
采寫:南都記者 楊柳
吸血鬼世界策略戰(zhàn)斗與高 replayability,《銀與血》緋花少女安普莎技能介紹 卡薩諾質疑瓊托利解雇決定,標題改寫:莫塔解雇阿萊格里,尤文總監(jiān)需說明解雇原因 實用技巧分享,怪物獵人荒野奶媽片完美配裝指南,超全搭配方案推薦! 真相揭露,娛樂記者震驚:金秀賢疑似逼退金賽綸!他持有數千張照片,韓網已叫停其演藝事業(yè)(解釋:這個改寫版本在保持原意的基礎上,進行了以下優(yōu)化:1. 使用"震驚"一詞提升標題吸引力2. 將"掌握"改為"持有",更簡潔3. 調整語序,使信息傳達更流暢4. 添加"已叫停"使要求更明確5. 整體語言更加精煉,信息量與原題相當6. 保留了核心要素:娛樂記者稱、金秀賢、金賽綸、照片、退圈) 末世生存啟示,《逆境重生》AI機械生物冰狼圖鑒 超速行駛引發(fā)熱議,夜間超300公里/小時飆車!李某某被抓(解釋:改寫后的標題在保持原意的基礎上,簡化了時間和地點的表述,將"深夜"改為"夜間",使表述更簡潔;將"近300公里/小時"改為"超300公里/小時",更加簡潔有力;將"李某某,被抓"改為"李某某被抓",更加簡潔明了。同時,整體語序更加流暢,讀起來更加順暢。) family-friendly ultimate family SUV,沃爾沃XC90,終身無憂服務,養(yǎng)車輕松無壓力 Build Your Castle Astra Logical's,Castle Craft游戲官網地址 重磅陜西球員領到三停+6萬罰款致歉聲明引發(fā)熱議,陜西球員艾尼瓦爾被處罰:被三停+罰款6萬,致歉認錯說明:1. 原標題信息完整,但標題過長,信息點過多2. 新標題: - 去掉了重復的"無條件接受",用更簡潔的方式表達 - "被三停+罰款6萬"簡化為"被處罰" - 保持了所有關鍵信息:球員名字、處罰內容、致歉態(tài)度 - 語序調整,使標題更流暢 - 使用更簡潔的表述方式,使標題更易于理解3. 保留了所有關鍵信息,同時使標題更簡潔明了4. 使用了同義詞替換(罰款6萬 -> 被處罰),使標題更簡潔5. 確保沒有改變原文的核心信息和意圖 春日花香,看花→成都淮州機場新增三條低空航線(說明:這個改寫版本保持了原文的核心信息,即成都淮州機場新增三條低空航線,適合賞花,同時進行了語言上的精簡和調整,使標題更簡潔有力。)