- 獲取游戲福利訣竅,《DNF》換衣間使用券獲得方法介紹
- 馴服指南,我的世界怎么馴服馬當坐騎2025年
- 游戲攻略揭秘,《碧藍航線》不知火屬性技能圖鑒
- 命運交織的時刻,《命運冠位指定》慶功Order禮裝圖鑒
- 精彩活動搶先看,《DNF》阿拉德四月新活動一覽
- 游戲攻略技巧揭秘,2025版我的世界敵對生物清除指令使用方法
- 揭秘艦娘技能與獲取指南,《碧藍航線》狐提屬性技能圖鑒
- 玩家必看指南,《DNF》悲嘆之塔推薦書用法介紹
- 游戲設置技巧揭秘,2025手機版屏蔽我的世界指令消息的指令是什么
- 探索艦船魅力,《碧藍航線》柯尼斯堡屬性技能圖鑒
聲明:本文來自于(ID:ykqsd.com)授權轉載發(fā)布。
本文來源:時代財經 作者:龐宇
"開源永存",這是MetaGPT研究員、OpenManus合作者向勁宇在面向時代財經等媒體的分享中所作的總結。
最近一周,全球首款通用AI智能體——Manus引發(fā)廣泛關注,成為科技圈持續(xù)熱議的話題。
在Manus的開源替代方案方面, emergence of such alternatives is rapid. 僅在三天內,國內初創(chuàng)公司DeepWisdom的MetaGPT團隊便利用開源框架成功復制出了OpenManus;開源社區(qū)CAMEL-AI團隊也以零天時間復制出了Manus通用智能體OWL。這種持續(xù)涌現(xiàn)的復刻現(xiàn)象似乎也傳遞了一個明確的信息:智能體Agent的準入門檻并非不可逾越。
但Manus的"護城河"究竟有多深?Agent賽道的終極競爭力又是什么?業(yè)內普遍認為2025年有望成為AI Agent爆發(fā)元年,這個賽道還有哪些未解難題?
近日,OpenManus核心作者向時代財經等媒體分享了其中的故事,并闡述了他們對Agent的理解。
僅用三天時間復制Manus,00后擔當主角
Manus發(fā)布當晚,向勁宇感受到身邊的人都很興奮,"大多數(shù)人的興奮似乎來自于AI能夠使用電腦。"
但在他的看法中,這樣的功能在業(yè)內并不算稀奇。
"例如,在我們2024年的開源項目Data Interpreter中已經有了規(guī)劃能力的實現(xiàn);而Computer Use和Browser Use等功能則在OpenHands(此前名為OpenDevin,一個由AI提供支持的軟件開發(fā)代理平臺)以及智譜AutoGLM等多個項目中已經實現(xiàn)。"向勁宇表示。
在僅一個試用版本的實現(xiàn)階段,他判斷“嘗試”將其開源版本提供給他人,“應該不難”。
MetaGPT研究員梁新兵和OpenManus核心作者張佳釔等“及時響應”,并“立即”對Manus進行全面技術調研。當天晚上下班后,與團隊討論產品形態(tài)和技術路線,決定“加班加點”盡快發(fā)布開源版本。
在“僅用約3小時”后,“大概(晚上)11點左右”,團隊將第一個版本合并并發(fā)布到GitHub。
項目發(fā)布不到1天,已收獲“超過7000顆”GitHub星星?!爱敃r沒有想到OpenManus會引發(fā)如此大的關注?!?/p>
梁新兵曾就讀于華東師范大學,擁有豐富的AI開發(fā)經驗,尤其在Data Interpreter等AI Agent項目上有手頭的工作。向勁宇則來自西南交通大學應用物理系,大四期間與隊友共同開發(fā)了基于GPT-4和Claude 3的多智能體方案,獲得了阿里巴巴數(shù)學競賽AI賽道的亞軍。兩人均為00后,已在2024年7月加入MetaGPT團隊。
項目引發(fā)的討論至今仍讓團隊感到“難以置信”。
在發(fā)酵一天后,“早上十點半突然收到大量添加好友”,向勁宇意識到項目可能“爆火”。他試圖休息,但無法入睡,拿起手機卻發(fā)現(xiàn)消息“來不及回”。
Manus是一款基于大語言模型的AI Agent,其核心技術包含規(guī)劃(Planning)、記憶(Memory)、工具調用(Tools)等模塊,用于解決任務邏輯連貫性問題,完成跨系統(tǒng)任務。
MetaGPT團隊對Manus的技術架構進行了深入解構,認為其是一個多智能體系統(tǒng),采用基于規(guī)劃工具的線性計劃方法,動態(tài)分配任務給不同Agent,每個任務均采用ReAct循環(huán)模式調用工具。
團隊是如何在3小時內復刻Manus的技術架構的?
向勁宇認為,一個簡潔的Agent框架應該由可更換的工具和提示詞整合而成?;谶@個思路,他們開發(fā)了一個完整的Agent小型框架。
據(jù)了解,決定ReAct Agent效果的關鍵因素是提示詞的引導作用和工具的使用。在OpenManus中,提示詞主導了Agent的整體行為邏輯,而工具則定義了其行動范圍,兩者一旦設定,就能完整地詮釋一個ReAct Agent。
"可更換的優(yōu)點是可以整合不同場景下的工具,這樣我就能創(chuàng)造出一個全新的Agent。定義起來也很方便,不需要單獨編寫內部邏輯,只需要調整工具空間(Tools)即可。"
在他的觀點中,"我們的工作是讓抽象變得更簡潔。通過提供豐富的工具集合,讓各種Agent能夠靈活地通過裝備工具集來擴展在不同場景下的能力。"
其中,規(guī)劃能力尤為重要。因此,OpenManus繼承了Manus在規(guī)劃方面的優(yōu)勢,通過 Planning Tool 實現(xiàn)任務分解,從而能夠有效處理現(xiàn)實世界中的復雜情況。
討論OpenManus的未來工作時,梁新兵表示,接下來將從增強 Planning 能力、引入標準化評測、拓展模型適配(從Claude-3-5擴展到DeepSeek V2.5)、實現(xiàn)容器化部署等多個方面來提升OpenManus的效果。
OpenManus是否有可能超越Manus?
"Manus的產品交互體驗很好,有很多技術值得借鑒。目前OpenManus的效果還比較有限,我們還沒有單獨優(yōu)化效果。OpenManus的前期目標是達到原始Manus的相同效果,后續(xù)將依靠龐大的開源社區(qū)不斷優(yōu)化,希望能為OpenManus帶來更高的智能涌現(xiàn)。"
Manus的"護城河"有多深?
根據(jù)Manus官方網(wǎng)站的介紹,Manus能夠快速操作,一鍵幫助用戶完成旅行規(guī)劃、股票分析、制作PPT、財報分析等任務,涵蓋研究、生活、數(shù)據(jù)分析、教育、生產效率等多個領域。
在官方發(fā)布的視頻中,Manus的表現(xiàn)令人驚嘆,他能夠從規(guī)劃到執(zhí)行完成整個流程。舉例來說,在分析特斯拉股票的任務中,Manus只需45秒即可實現(xiàn)"數(shù)據(jù)抓取→建?!鷪蟾嫔?的全流程操作。
簡而言之,用戶只需提供簡單的提示指令,經過一定時間后,就能獲得一個完美的成品交付。
然而,MetaGPT團隊僅需5人3小時,便通過開源框架復刻了OpenManus;開源社區(qū)CAMEL-AI團隊也實現(xiàn)了"0天復刻",推出了OWL并開源了部分模塊。這些努力讓"Manus缺乏技術壁壘"的質疑聲不斷。
據(jù)此前媒體報道,Manus的核心模型能力源自Anthropic的Claude。3月10日,Manus創(chuàng)始人季逸超在社交平臺透露,Manus產品采用了基于阿里千問大模型(Qwen)的微調模型。
有市場人士認為,隨著大模型能力的持續(xù)增強,這些工具鏈的功能最終會內化到模型中。未來,大模型可能無需再調用外部工具鏈,而Manus所創(chuàng)造的價值可能因此逐漸被內生能力所涵蓋。
一位參與該討論的AI領域投資人士林亞秋(化名)指出,當大模型能力進一步提升,一些高頻場景可能會由模型本身覆蓋,大模型公司也可能因此內置這些Agent。
Agent的誕生需要基座模型性能的提升,這是行業(yè)內的共識。但為何Manus最先獲得這一關注?
林亞秋向時代財經表示,"Manus能夠率先跑出來,一方面是因為從今年春節(jié)前后開始,推理模型的技術取得了比較大的進展。這件事對Manus的幫助很大,因為只有在推理模型成熟的情況下才有機會去做。Agent有規(guī)劃、工具調用和記憶這三個特點,每一點的成功率都會影響最終的成功率。而推理模型的提升會令第一步——規(guī)劃能力的提升變得至關重要。"
另一方面,Manus創(chuàng)作團隊本身也具備一定的實力。"他們的產品能力非常強,非常懂用戶的需求,且在功能實現(xiàn)上做得很好。"林亞秋補充道。據(jù)她了解,Manus創(chuàng)作團隊過去兩年在產品能力方面表現(xiàn)得很出色,這也是團隊擅長的地方。
其實,就算基于MetaGPT在AI場景的自動化和智能體框架上多年的技術積累,3人3小時實現(xiàn)對Manus的復刻也并非易事。
在技術方案方面,Manus采用了業(yè)內共識的核心基礎技術。盡管如此,Manus本身仍是一份出色的作品。它通過用戶示例,展現(xiàn)了卓越的用戶體驗體驗,并在整體交互效果方面表現(xiàn)良好。該團隊實現(xiàn)了復雜的規(guī)劃,包括自行開發(fā)的Post Train模型,這一創(chuàng)新模型在效果和交互體驗上均有顯著提升,并為團隊提供了許多發(fā)展思路。
從核心理念來看,Manus團隊倡導“更少的結構,更多的智能”(Less structure, more intelligence)。這一理念體現(xiàn)在產品的特性中,賦予AI更大的自主權,以決定如何使用工具和完成任務,從而進一步提升了用戶體驗。
實際上,Manus團隊已明確表示,當前的Manus距離正式版仍有較大差距。在模型幻覺、交付物友好度、運行速度等方面,還有很大的提升空間。
曼us AI團隊產品負責人張濤(HideCloud),同時也是Monica.im產品合伙人,近期在朋友圈發(fā)文表示,過去幾個小時對于團隊來說充滿了意外和挑戰(zhàn)。團隊低估了大家的熱情,這原本是產品探索過程中的階段性收獲,因此服務器資源的準備水平與demo相當,卻沒想到會引起如此大的波瀾。
在Agent元年,成本與技術難題仍待解決
"2025年有望成為AI Agent元年"似乎已成為行業(yè)的共識。
開源證券指出,隨著大模型性能提升與成本降低,以及在消費級顯卡部署門檻降低,為AI大規(guī)模應用落地奠定了堅實基礎。Manus的發(fā)布有望加速AI Agent的應用落地,重塑各行業(yè)的工作流程。
華泰證券指出,Manus AI的底層架構由多模型驅動,通過高效的工程化編排,成功滿足了Agent交互過程中的規(guī)劃、自主、準確三大核心需求。這標志著Agent應用在Action環(huán)節(jié)的關鍵突破。目前,該階段正進入工程化落地的關鍵階段,有望在2025年進入放量元年。
Manus等AI Agent的誕生,依賴于團隊在基座模型上的持續(xù)投入和進化。但另一個事實是,隨著大模型能力的提升,許多問題的解決成功率會提高,但問題本身并不會消失。MetaGPT研究員、OpenManus合作者之一洪思睿指出。
洪思睿補充道:"人類社會仍有許多復雜且長尾的問題,包括機器學習、代碼修復以及通過搜索組合結果為用戶提供解決方案的問題。這些都需要通過技術手段來提升大模型的效果,包括解決幻覺問題。"
一方面,大模型幻覺仍然阻礙著AI的落地。另一方面,行業(yè)內目前在規(guī)劃、記憶、工具調用等方面仍存在一些難點亟待解決。
目前Agent在規(guī)劃方面的進展,主要依賴于模型自身能力的提升,同時也會借助外部輔助結構,即在Agent層面上增加更為復雜的輔助結構進行規(guī)劃支持。
在工具方面,如OpenManus目前主要依賴一些現(xiàn)有的開源工具,“例如Claude和Browser等”。值得注意的是,其他團隊在Browser工具方面的研究顯示,僅僅依靠Claude和Browser等工具,基本就能完成許多任務,已經初步形成了Manus的雛形。而據(jù)MetaGPT團隊設想,未來可能會賦予Agent自行創(chuàng)建工具的能力。
不過,在洪思睿看來,大模型或Agent使用工具本身并不算新奇。“但隨著工具數(shù)量的不斷增加,隨之而來的技術難點也隨之而來:如果存在大量相似工具,Agent在解決同一任務時如何做出準確決策,選擇最合適的工具;以及工具參數(shù)定義不夠明確或不合理時,可能導致大模型在生成工具調用決策時出錯等問題。這些都是工具使用環(huán)節(jié)中需要解決的關鍵問題。”
此外,在記憶(Memory)環(huán)節(jié)上,MetaGPT團隊認為,目前Agent在處理復雜、長程任務(例如在瀏覽網(wǎng)頁時,網(wǎng)頁信息可能非常長)時,如何壓縮并存儲相關信息,是一個極具挑戰(zhàn)性的問題,并且要確保壓縮后的關鍵信息不會被修改或遺漏。
Memory、推理效率與成本之間直接相關?!叭绻覀兒雎訫emory,不做壓縮和任何處理,目前的大模型仍然可以處理,但這樣帶來的問題并非質量下降,而是會顯著增加處理時間和成本,嚴重影響用戶體驗。”梁新兵表示。
降本增效、優(yōu)化成本,是大量應用廠商首要任務,也是持續(xù)優(yōu)化的方向。
據(jù)Manus團隊此前透露,目前Manus單任務成本2美元,已經經過大量優(yōu)化,但可能仍難以滿足部分用戶的接受度?!皩τ谏逃脕碚f,(這個價格)還是挺貴的。如果沒有足夠的群眾基礎以及轉化率,可能商業(yè)化上就不一定會特別成功?!绷謥喦锵驎r代財經表示。
當一個Agent產品推出后,開源社區(qū)很快出現(xiàn)了功能相近的復刻項目,這引發(fā)了行業(yè)內對Agent領域核心競爭力的深度思考:這個賽道的終極競爭壁壘究竟在哪里?
在洪思睿看來,Agent的商業(yè)化競爭,關鍵在于能否將真實場景中的任務和效果,包括個性化的功能,做到極致。
目前學術界在SWEBench、GAIA等平臺開展的大量Agent測試工作,無論是針對簡單的任務,還是更具挑戰(zhàn)性的任務,任務完成率都相對較低。這些任務的成功率如果直接映射到實際商業(yè)場景中,意味著用戶在面對不同難度的問題時,Agent的性能仍然存在較大局限性。
因此,她認為,無論是編程任務,還是數(shù)據(jù)采集與報告生成任務,只有在各種用戶問題和場景下都能達到極致,任務完成率才能提升到令人滿意的水平,真正實現(xiàn)Agent具備人們所期望的行動能力,用戶才會持續(xù)使用Agent。
同時,展望Agent的未來,洪思睿認為,從當前技術發(fā)展的趨勢來看,多智能體在商業(yè)應用方面具有明確且強烈的前景,例如在代碼生成這一技術相對成熟且能較好解決用戶實際需求的場景下,“目前用戶對于此類服務的付費意愿也是較高的?!?/p>
討論Manus的火爆程度對行業(yè)帶來的信心時,林亞秋表示,“Manus的火爆程度不僅在于它獲得了巨大的關注,更在于它成功普及了公眾對AI Agent的誤解:即AI Agent可以處理大量的繁瑣事務;同時,也吸引了大量的潛在用戶群。但從投資人和創(chuàng)業(yè)者的角度來看,早在2023年左右大家就認為,AI Agent作為大語言模型之下的重要應用場景具有巨大的發(fā)展?jié)摿?。如今,大家信心提升的一個重要原因在于模型技術的進步速度,接下來,大家將在Agent技術、產品化方面進行進一步探索?!?/p>
據(jù)她了解,市場上有很多團隊正在快速開發(fā)基于推理模型進展的產品?!肮烙嫿衲赀€會有更多的類似產品出現(xiàn)?!?/p> 爆炸暫停交通特斯拉股價暴跌馬斯克重心轉移,SpaceX星艦爆炸導致特斯拉股價腰斬 馬斯克可能成為公司"負資產" 保持脊柱標準弧度,如何擁有好體態(tài)?掌握三步快速測量法 社交賬號正式關閉,33歲孟耿如正式退出娛樂圈:隱退社交圈 破局,大飛機概念股漲停,C919進入交付期 星辰大海,神舟二十號、二十一號任務航天員乘組已確定,正在進行相關訓練 關稅政策挑戰(zhàn),特朗普:不排除美國經濟衰退可能 直擊健康真相,完美身材?明星的天鵝頸、直角肩其實是病態(tài)! 2025年空間站,標題改寫:太空出差乘組確定,2025年載人飛行任務即將啟程 跌宕起伏,高盛最新報告解析美股崩盤原因,衰退擔憂排在首位 尤文慘敗球員表現(xiàn)如何,0-4!米體尤文:混亂稚嫩的尤文,莫塔被加斯佩里尼上了節(jié)大師課