- 幕后故事揭曉,奧德彪又是什么梗
- 解鎖新角色,《崩壞:星穹鐵道》云璃強度介紹
- 未來戰(zhàn)場前瞻,《硬核機甲啟示》動蕩的火星情報介紹
- 揭開機甲新篇章,《硬核機甲MFX-02雷暴系列簡介》
- 新手必看,《迷霧大陸》新手風(fēng)暴流技能及套裝攻略
- 深入探索解密崩壞星穹鐵道的追擊策略,《崩壞:星穹鐵道》托帕追擊隊玩法介紹
- 探索酷炫時尚,《DNF:起源機車服套裝外觀》
- 探索機甲世界,《硬核機甲啟示》MPF-04S 荊棘簡述
- 未來激戰(zhàn)前瞻,《硬核機甲》百夫長MPF-04C簡介
- 《原神》安固諸方之述演防御想定1-3過關(guān)方法
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
小編分析發(fā)現(xiàn),Manus迅速成為AI領(lǐng)域的引領(lǐng)者。僅用一個晚上,加之一場不夠正式的發(fā)布會,便迅速走紅。在某魚上,一個邀請碼的售價已高達5萬元。不用多想,現(xiàn)在最著急的無疑是投資者和各大企業(yè)。
Manus的神奇之處究竟在哪里?是過度炒作,還是貨真價實?
01
它能做些什么?
它能完成一個針對特斯拉的財報分析報告,也能生成一個完全可以正常交互的網(wǎng)站,甚至還能玩一款可以直接上手的RPG游戲。它能自行搭建開發(fā)環(huán)境,編寫代碼,調(diào)試,甚至自編譯。
如果你需要做一個地區(qū)人口調(diào)研報告,Manus還可以直接訪問數(shù)據(jù)庫和搜索數(shù)據(jù),選擇最適合的來源完成分析。
更令人稱奇的是,只需一個prompt,就能完成復(fù)雜的分析項目。在GAIA benchmark的評測中,Manus的表現(xiàn)已超越OpenAI的DeepSearch。
通過推特和國內(nèi)社交媒體上的用戶案例分析,可以看出,Manus在執(zhí)行流程和產(chǎn)出結(jié)果上,均與DeepSearch不相上下。每個環(huán)節(jié)的代碼和文件都公開透明,分類整理,方便用戶查閱。
在處理特斯拉和英偉達的財報分析時,Manus的表現(xiàn)不遜于雪球大V。這得益于它能自行搭建虛擬電腦,完成數(shù)據(jù)獲取、計算、環(huán)境搭建和測試等硬核工作,極大解放了用戶。
02
背后的團隊
Manus因為其超高品質(zhì)的產(chǎn)出而點燃了社交媒體的聲量,作為國內(nèi)團隊的代表作品,它為國內(nèi)團隊在國際舞臺上爭取了更多關(guān)注。在AI領(lǐng)域,盡管國內(nèi)團隊在技術(shù)實力上與美國頂尖團隊相比略顯遜色,但也不失為追趕的榜樣。
我們了解到,Manus是國內(nèi)AI創(chuàng)業(yè)團隊Monica AI的另一款產(chǎn)品。Monica AI是一款專為垂直領(lǐng)域設(shè)計的AI聊天機器人,與國外基于原生狀態(tài)的聊天機器人不同,Monica AI通過提供大量現(xiàn)成的API接口,讓用戶無需進行prompt調(diào)優(yōu),即可輕松上手使用。
創(chuàng)始人肖宏在這款操作簡單的聊天機器人上深刻認(rèn)識到大模型與用戶交互的局限性。即,大模型雖然表現(xiàn)出色,但在完成一個復(fù)雜項目時,需要分階段與用戶進行多次對話。
但由于Manus直接將用戶與大模型連接起來,用戶需要將任務(wù)分解為多個1v1對話,逐步完成。甚至,用戶也無法完全確認(rèn)輸入給模型的token是否是該任務(wù)的最佳解決方案。
然而,Manus通過一次完整的對話框操作,讓用戶一步到位解決更復(fù)雜、需要更高智能化的任務(wù)。從這個角度看,Manus更像是一個精心設(shè)計的AI任務(wù)集合。
團隊刻意避免展示大模型神奇的一面,而是從用戶角度出發(fā),思考如何通過發(fā)揮模型的優(yōu)勢來解決日常問題。這種務(wù)實且珍貴的探索值得肯定。
Manus的故事展示了國內(nèi)連續(xù)創(chuàng)業(yè)者對用戶需求的精準(zhǔn)把握能力和團隊的執(zhí)行力。至于他們所需的AI技術(shù)實力,我們將在后續(xù)內(nèi)容中詳細探討。
03
產(chǎn)品的亮點
《賽博禪心》通過報道Manus團隊的自媒體內(nèi)容,透露出在Deep Search平臺執(zhí)行一次任務(wù)的費用大約為2美元,而Claude 3.7 Sonet與基于國內(nèi)Qwen模型的優(yōu)化版本的單條任務(wù)成本僅為Deep Search的1/10。這一創(chuàng)新舉措無需質(zhì)疑,創(chuàng)始人在一次播客訪談中明確表示,即使在開發(fā)Monica時,他們也并非僅僅將用戶需求作為prompt的中轉(zhuǎn)站,而是直接將需求投入模型,并進行了產(chǎn)品調(diào)優(yōu)過程。
學(xué)習(xí)是一個天賦異稟且骨骼清奇的練武奇才,需要后天的付出才能成就一段江湖之路。
通過混合架構(gòu),Manus任務(wù)系統(tǒng)能夠自主規(guī)劃、思考與完成任務(wù)。這一系統(tǒng)并非將Claude與Qwen模型分割開來,而是打破了模型之間的"界限",讓每個模型專注于自己擅長的任務(wù)環(huán)節(jié)。
采用多個大模型的混合配置,并基于虛擬云端執(zhí)行環(huán)境,Manus系統(tǒng)實現(xiàn)了用戶只需一次性的鍵盤輸入即可完成復(fù)雜對話請求,突破了傳統(tǒng)聊天機器人多輪對話的局限性。
對Manus執(zhí)行過程的初步猜測:
《賽博禪心》一文中提到的"工程驅(qū)動創(chuàng)新",暗示Manus的任務(wù)執(zhí)行過程中,運用了多種工程手段與模型能力的結(jié)合。通過對多個社交媒體案例的分析,我們對Manus的運行機制做了一個簡單的推測。
假設(shè)大模型(可能是Qwen)在分析輸入后,首先確定任務(wù)的類型,然后Manus內(nèi)部會根據(jù)輸入類型進行分類,例如編程任務(wù)、多模態(tài)內(nèi)容生成、任務(wù)規(guī)劃類、建議咨詢類等等。如果輸入為英文,猜測可能主要由Claude模型負責(zé)執(zhí)行。
具體到任務(wù)執(zhí)行層面,猜測過程如下:
1.接收到一個輸入后,大模型首先進行任務(wù)分類,決定后續(xù)任務(wù)執(zhí)行的模型選擇;
2.接著,大模型將輸入拆解為若干層級分明、優(yōu)先級明確且執(zhí)行順序清晰的子任務(wù);
3.上級任務(wù)的輸出結(jié)果會被下一個任務(wù)所使用;
4.多個任務(wù)的輸出結(jié)果會被整合成一個最終的分析報告。
對于每個子節(jié)點選擇執(zhí)行的模型,我們推測如果是編程類任務(wù),通常會由Claude主導(dǎo)執(zhí)行;如果是中文決策建議類,則以Qwen為主。在子節(jié)點的任務(wù)復(fù)雜度不一的情況下,執(zhí)行過程中可能需要混合使用這兩者,然后通過效果對比,最終保留表現(xiàn)最佳的模型。
從上述的分析可以看出,初始需求的輸入質(zhì)量會對后續(xù)任務(wù)的類型判斷、子節(jié)點規(guī)劃和執(zhí)行效率產(chǎn)生重要影響,因此對于Manus的要求是相當(dāng)高的,通常需要用戶提供詳細且完整的描述(越詳細越好)。
這一點可能會成為Manus的批評焦點,畢竟一次任務(wù)的執(zhí)行需要消耗一定的時間和算力,如果因為描述不夠清晰而導(dǎo)致資源的浪費,將嚴(yán)重損害用戶體驗,反映出產(chǎn)品尚未成熟。相信未來團隊會進一步優(yōu)化,畢竟一次任務(wù)的費用大概一杯奶茶錢。
04
當(dāng)前的問題
從2022年到2025年,經(jīng)歷了三年多的大模型風(fēng)口一輪輪的認(rèn)知沖擊。人們對于大模型產(chǎn)品的使用體驗,已經(jīng)基本走過了"Aha Moment"決定產(chǎn)品去留的階段。一個大模型產(chǎn)品,在效果驚人的基礎(chǔ)上,還必須要具備穩(wěn)定性和快速響應(yīng)能力,才能長久留住用戶。
效果穩(wěn)定性
回頭來看Manus,由于我們的Manus賬號還在wishlist中,從推特和國內(nèi)社媒的用戶反饋來看,與DeepSeek相比,用戶對Manus的輸出穩(wěn)定性存在較大疑慮。有用戶反映輸出中出現(xiàn)事實錯誤,甚至有讓人啼笑皆非的環(huán)節(jié)。
如果在執(zhí)行過程中,若出現(xiàn)數(shù)據(jù)或事實的誤用,將會導(dǎo)致最終結(jié)果失去可信度,從而浪費掉2美元的成本。
算力
除了任務(wù)效果不穩(wěn)定外,單任務(wù)的執(zhí)行時間過長也是Manus的一大批評點,盡管團隊展示了其任務(wù)執(zhí)行邏輯和流程,但留給用戶的卻是漫長的等待時間。例如,一位用戶在社交媒體上抱怨,自己的任務(wù)執(zhí)行了4-5小時左右。
這背后的原因是團隊對用戶使用量的把控存在不足,而Manus的架構(gòu)也無法支撐高算力的需求。事實上,用戶對Manus的使用已經(jīng)習(xí)慣了快速出結(jié)果的體驗,對于長達幾小時的等待時間自然難以忍受。
其實,如果Manus能提供一個明確的完成時間預(yù)期,用戶對長時間等待的不耐煩情緒可能會有所減少。畢竟,對于一個復(fù)雜的分析任務(wù),即使執(zhí)行時間長達2-3小時甚至半天,也比現(xiàn)實中的初級員工處理得更快。
技術(shù)能力
如果說算力可以通過添加顯卡來提升,那么團隊在技術(shù)能力方面短期內(nèi)難以跟上其他頂尖產(chǎn)品如DeepSeek的水平。與之相比,Manus的技術(shù)儲備可能更適合開發(fā)一款日活百萬級的用戶端產(chǎn)品。
與經(jīng)驗豐富的團隊相比,新團隊的優(yōu)勢在于快速捕捉需求并開發(fā)出可用的產(chǎn)品,但當(dāng)用戶量增加時,技術(shù)升級的問題就凸顯了出來。當(dāng)前,Manus的用戶反饋中提到運行速度慢、任務(wù)卡頓等問題,都是技術(shù)升級的外在表現(xiàn)。
盡管Manus已經(jīng)具備了良好的起步基礎(chǔ),并且創(chuàng)始人團隊善于發(fā)現(xiàn)并滿足用戶需求,但要實現(xiàn)Manus的長遠發(fā)展和穩(wěn)定性,還需要更多的人才加入。畢竟,目前的產(chǎn)品架構(gòu)已經(jīng)讓內(nèi)行人能夠大致理解其工作原理,被大廠快速復(fù)制出來并不困難。
(此處應(yīng)為“05”或編號結(jié)尾,具體根據(jù)上下文調(diào)整)
Manus初步顯示,AI Agent領(lǐng)域還存在另一條可行的發(fā)展路徑。
市場上,Agent產(chǎn)品可分為兩大類:通用型和垂直應(yīng)用型。在通用型領(lǐng)域,知名度最高的兩大產(chǎn)品來自兩個主要的大模型廠商——OpenAI推出了"Operator",Anthropic推出了"Computer Use"。通用型領(lǐng)域可以說是由這兩大產(chǎn)品所主導(dǎo)的。
Anthropic的Agent軟件通過一個獨特的API,開發(fā)者可以利用Claude模型執(zhí)行基本的計算機操作,如打開文件等。而OpenAI則在此基礎(chǔ)上擴展了硬件調(diào)用范圍,允許開發(fā)者通過API接口在個人電腦上完成編程、旅行預(yù)訂和購物等活動。國內(nèi)智譜的AutoGLM在運行機制上與OpenAI的"Operator"具有相似性。
垂直型Agent產(chǎn)品,代表作包括cursor和devin。這些產(chǎn)品在程序員群體中享有良好的口碑,但應(yīng)用領(lǐng)域較為狹窄,難以推廣。
翻 transcript顯示,Manus創(chuàng)始人肖宏曾表示,通用型和垂直型產(chǎn)品在普世價值上存在差異。他認(rèn)為,通用型產(chǎn)品雖然在速度上不及垂直型,但更具普世價值。實際上,許多程序員已經(jīng)在使用cursor編寫基礎(chǔ)代碼。
研究表明,Manus定位為通用型AI Agent。通過工程手段對Agent架構(gòu)進行創(chuàng)新,將復(fù)雜工作流程封裝到云環(huán)境中,并融合多個大模型,通過任務(wù)規(guī)劃實現(xiàn)子任務(wù)的自動處理,最終產(chǎn)出的任務(wù)通常需要經(jīng)過多輪人機對話才能完成。
該研究顯示,Manus在部分任務(wù)上超過了OpenAI的DeepSearch產(chǎn)品,開辟了AI Agent發(fā)展的新路徑。
通用型Agent產(chǎn)品的實現(xiàn)不可能依賴單一模型,且天然屬于第三方開發(fā)者的服務(wù)范疇。
由于OpenAI和Anthropic的Agent產(chǎn)品難以通過競品模型實現(xiàn),這決定了它們的研發(fā)進度和工程手段與第三方開發(fā)者相比難以企及。
同時,Manus的應(yīng)用范圍更具落地性,相比通用型產(chǎn)品,垂直型產(chǎn)品的應(yīng)用領(lǐng)域更為廣闊。通用型Agent通常幫助用戶完成購票、行程規(guī)劃等操作,操作門檻較低。但對于撰寫特斯拉財報分析報告等高門檻的任務(wù),其商業(yè)價值則更為顯著。
互聯(lián)網(wǎng)界普遍認(rèn)為AI Agent和通用型AGI是同一回事,但Manus的出現(xiàn)表明,即便尚未達到AGI的高度,但對普通用戶而言,能夠完成具體任務(wù)的同志仍然是可貴的。
三重啟示:
一、有了AI的助力,獨立思考和創(chuàng)新能力將成為未來社會的核心競爭力。
即使Manus作為廣泛使用的AI產(chǎn)品仍處于早期階段,我們也能從類似產(chǎn)品的涌現(xiàn)中認(rèn)識到,持續(xù)創(chuàng)新和突破思考能力是未來社會的核心問題。
AI能夠協(xié)助人們完成案例分析報告、文獻綜述等日常任務(wù),但AI無法替代人類進行實驗設(shè)計或確定研究切入點。
在AI技術(shù)的廣泛應(yīng)用下,人與人之間的差距可能會越來越大。
二、第一手消息的來源可能會受到自媒體和垂直領(lǐng)域媒體的影響。
在傳統(tǒng)互聯(lián)網(wǎng)風(fēng)口(如2010年前后) era,科技媒體發(fā)揮著關(guān)鍵作用,它們不僅包括四大傳統(tǒng)門戶網(wǎng)站,還包括垂直領(lǐng)域的專業(yè)媒體。而在AI風(fēng)口時代,創(chuàng)業(yè)企業(yè)的動態(tài)往往首先源于自媒體,隨后在社交媒體上發(fā)酵,最終被大眾所知。
在"古典"時代,只要保持與記者的溝通,就能及時捕捉到重要行業(yè)動態(tài)。但在AI時代,投資人往往處于被動地位,對新興的科技初創(chuàng)公司知之甚少。
很多風(fēng)投機構(gòu)通過設(shè)立孵化器來培養(yǎng)創(chuàng)業(yè)企業(yè),但這種模式的成功率不高,也很少能產(chǎn)出真正有市場價值的創(chuàng)新產(chǎn)品。如何在社交媒體發(fā)酵的背景下,抓住潛在的機會甚至發(fā)現(xiàn)新的機會,是風(fēng)投機構(gòu)需要面對的新課題。
面對"大廠",該怎么選?
DeepSeek憑借其優(yōu)秀的模型效果和開源殺手锏,已將字節(jié)、騰訊、百度等大廠的技術(shù)領(lǐng)先優(yōu)勢甩在身后。而Manus不僅走出了通用型agent的一步,更領(lǐng)先了大廠。關(guān)于研發(fā)成本的對比,我們目前還無法提供具體數(shù)據(jù),但若等到那時候,這無疑是對大廠的一次羞辱。
Agent,該怎么選?
參考資料:
1. 張小珺 | 商業(yè)訪談錄:https://www.xiaoyuzhoufm.com/episode/67c3d80fb0167b8db9e3ec0f
2. 賽博禪心:實測Manus:首個真干活A(yù)I,中國造(附50個用例+拆解)https://mp.weixin.qq.com/s?__biz=MzkzNDQxOTU2MQ==&mid=2247498251&idx=1&sn=f3a81f0f2a0f54c89ed51b2951b07da2
3. 賽博禪心:關(guān)于Manus的一些獨家信息
4. manuS使用分享:https://manus.im/share/hRGARE7EBqtDhLHBGISLP7?replay=1
直接談判,"美國為何直接與哈馬斯談判?專家分析:三個主要考量因素"這個改寫版本:1. 去掉了原標(biāo)題中的"專家解讀",簡化為"專家分析"2. 將"至少有三重考慮"改為"三個主要考量因素",更簡潔明了3. 調(diào)整了語序,將"為何"改為"為何直接",更符合口語化表達4. 保持了核心信息:美國為何直接與哈馬斯進行談判,以及專家認(rèn)為有三個主要考量因素5. 整體更加簡潔,適合作為標(biāo)題使用 庫庫超級表現(xiàn)成為切爾西的超級核心球員,庫庫逆襲成大腿,0被破6解圍攻防一體 健康守護,更年期女性保健品有哪些?失眠、腰酸背痛怎么辦? 合作交付智能航空物流,順豐訂購百架無人機助力支線物流高效運行 AI+自習(xí)室,AI自習(xí)室加盟店年入百萬?北京一家門店半年僅收5名學(xué)生 限定版 | 深淵恐懼高端FPS恐怖游戲(僅限steam),深淵恐懼游玩平臺 | Chasmal Fear游戲平臺介紹 3月6日上市的豐田鉑智3X憑借超值價格和寬敞空間成為純電緊湊SUV領(lǐng)域的標(biāo)桿之作,豐田全球首款純電緊湊SUV售價10.98萬元起,直面自主新能源品牌 2月最新韓國國家隊名單發(fā)布,韓國隊名單:孫興慜、金玟哉、李剛?cè)事赎?,黃喜燦、李在城出戰(zhàn)(這個標(biāo)題保持了原意,同時進行了以下優(yōu)化:1. 將"大名單"簡化為"名單"2. 去掉了多余的逗號和頓號3. 將"率隊"替換為更簡潔的表達4. 調(diào)整了語序,使信息傳達更直接5. 使用了更簡潔的表述方式) 融一平臺突破應(yīng)用兼容難題,科信融一發(fā)布“融一平臺” 歲月痕跡優(yōu)雅老去,劉曉慶真實老去:74歲聚餐照比劇本人生更傳奇