- 揭秘新技能實(shí)驗(yàn)背后的驚人發(fā)現(xiàn),《紅色警戒3》蘇聯(lián)技巧研究:蜘蛛的利弊
- 探秘三國(guó)謀士,《英雄愛(ài)三國(guó)》卡牌郭嘉圖鑒
- 戰(zhàn)略新思維,《紅色警戒3》戰(zhàn)報(bào):日升帝國(guó)對(duì)決同盟空軍
- 策略博弈的深淵探索,《紅色警戒3》PVP對(duì)戰(zhàn)技巧
- 傳奇勇將的崛起與智慧,《英雄愛(ài)三國(guó)》七進(jìn)七出趙云圖鑒
- 揭秘優(yōu)化背后的故事,《紅色警戒3》盟軍支援能力與建筑兵種數(shù)值表
- 揭秘游戲中的隱藏?cái)?shù)據(jù),《紅色警戒3》1.0 遭遇戰(zhàn)單位HP
- 深入探究黃蜂女,《漫威:超級(jí)爭(zhēng)霸戰(zhàn)》黃蜂女圖鑒
- 策略啟示,《命令與征服:紅色警戒3》暴兵技巧
- 游戲策略指南,《命令與征服:紅色警戒3》資源采集者
聲明:本文來(lái)自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
小編分析發(fā)現(xiàn),Manus迅速成為AI領(lǐng)域的引領(lǐng)者。僅用一個(gè)晚上,加之一場(chǎng)不夠正式的發(fā)布會(huì),便迅速走紅。在某魚(yú)上,一個(gè)邀請(qǐng)碼的售價(jià)已高達(dá)5萬(wàn)元。不用多想,現(xiàn)在最著急的無(wú)疑是投資者和各大企業(yè)。
Manus的神奇之處究竟在哪里?是過(guò)度炒作,還是貨真價(jià)實(shí)?
01
它能做些什么?
它能完成一個(gè)針對(duì)特斯拉的財(cái)報(bào)分析報(bào)告,也能生成一個(gè)完全可以正常交互的網(wǎng)站,甚至還能玩一款可以直接上手的RPG游戲。它能自行搭建開(kāi)發(fā)環(huán)境,編寫(xiě)代碼,調(diào)試,甚至自編譯。
如果你需要做一個(gè)地區(qū)人口調(diào)研報(bào)告,Manus還可以直接訪問(wèn)數(shù)據(jù)庫(kù)和搜索數(shù)據(jù),選擇最適合的來(lái)源完成分析。
更令人稱(chēng)奇的是,只需一個(gè)prompt,就能完成復(fù)雜的分析項(xiàng)目。在GAIA benchmark的評(píng)測(cè)中,Manus的表現(xiàn)已超越OpenAI的DeepSearch。
通過(guò)推特和國(guó)內(nèi)社交媒體上的用戶案例分析,可以看出,Manus在執(zhí)行流程和產(chǎn)出結(jié)果上,均與DeepSearch不相上下。每個(gè)環(huán)節(jié)的代碼和文件都公開(kāi)透明,分類(lèi)整理,方便用戶查閱。
在處理特斯拉和英偉達(dá)的財(cái)報(bào)分析時(shí),Manus的表現(xiàn)不遜于雪球大V。這得益于它能自行搭建虛擬電腦,完成數(shù)據(jù)獲取、計(jì)算、環(huán)境搭建和測(cè)試等硬核工作,極大解放了用戶。
02
背后的團(tuán)隊(duì)
Manus因?yàn)槠涑咂焚|(zhì)的產(chǎn)出而點(diǎn)燃了社交媒體的聲量,作為國(guó)內(nèi)團(tuán)隊(duì)的代表作品,它為國(guó)內(nèi)團(tuán)隊(duì)在國(guó)際舞臺(tái)上爭(zhēng)取了更多關(guān)注。在AI領(lǐng)域,盡管?chē)?guó)內(nèi)團(tuán)隊(duì)在技術(shù)實(shí)力上與美國(guó)頂尖團(tuán)隊(duì)相比略顯遜色,但也不失為追趕的榜樣。
我們了解到,Manus是國(guó)內(nèi)AI創(chuàng)業(yè)團(tuán)隊(duì)Monica AI的另一款產(chǎn)品。Monica AI是一款專(zhuān)為垂直領(lǐng)域設(shè)計(jì)的AI聊天機(jī)器人,與國(guó)外基于原生狀態(tài)的聊天機(jī)器人不同,Monica AI通過(guò)提供大量現(xiàn)成的API接口,讓用戶無(wú)需進(jìn)行prompt調(diào)優(yōu),即可輕松上手使用。
創(chuàng)始人肖宏在這款操作簡(jiǎn)單的聊天機(jī)器人上深刻認(rèn)識(shí)到大模型與用戶交互的局限性。即,大模型雖然表現(xiàn)出色,但在完成一個(gè)復(fù)雜項(xiàng)目時(shí),需要分階段與用戶進(jìn)行多次對(duì)話。
但由于Manus直接將用戶與大模型連接起來(lái),用戶需要將任務(wù)分解為多個(gè)1v1對(duì)話,逐步完成。甚至,用戶也無(wú)法完全確認(rèn)輸入給模型的token是否是該任務(wù)的最佳解決方案。
然而,Manus通過(guò)一次完整的對(duì)話框操作,讓用戶一步到位解決更復(fù)雜、需要更高智能化的任務(wù)。從這個(gè)角度看,Manus更像是一個(gè)精心設(shè)計(jì)的AI任務(wù)集合。
團(tuán)隊(duì)刻意避免展示大模型神奇的一面,而是從用戶角度出發(fā),思考如何通過(guò)發(fā)揮模型的優(yōu)勢(shì)來(lái)解決日常問(wèn)題。這種務(wù)實(shí)且珍貴的探索值得肯定。
Manus的故事展示了國(guó)內(nèi)連續(xù)創(chuàng)業(yè)者對(duì)用戶需求的精準(zhǔn)把握能力和團(tuán)隊(duì)的執(zhí)行力。至于他們所需的AI技術(shù)實(shí)力,我們將在后續(xù)內(nèi)容中詳細(xì)探討。
03
產(chǎn)品的亮點(diǎn)
《賽博禪心》通過(guò)報(bào)道Manus團(tuán)隊(duì)的自媒體內(nèi)容,透露出在Deep Search平臺(tái)執(zhí)行一次任務(wù)的費(fèi)用大約為2美元,而Claude 3.7 Sonet與基于國(guó)內(nèi)Qwen模型的優(yōu)化版本的單條任務(wù)成本僅為Deep Search的1/10。這一創(chuàng)新舉措無(wú)需質(zhì)疑,創(chuàng)始人在一次播客訪談中明確表示,即使在開(kāi)發(fā)Monica時(shí),他們也并非僅僅將用戶需求作為prompt的中轉(zhuǎn)站,而是直接將需求投入模型,并進(jìn)行了產(chǎn)品調(diào)優(yōu)過(guò)程。
學(xué)習(xí)是一個(gè)天賦異稟且骨骼清奇的練武奇才,需要后天的付出才能成就一段江湖之路。
通過(guò)混合架構(gòu),Manus任務(wù)系統(tǒng)能夠自主規(guī)劃、思考與完成任務(wù)。這一系統(tǒng)并非將Claude與Qwen模型分割開(kāi)來(lái),而是打破了模型之間的"界限",讓每個(gè)模型專(zhuān)注于自己擅長(zhǎng)的任務(wù)環(huán)節(jié)。
采用多個(gè)大模型的混合配置,并基于虛擬云端執(zhí)行環(huán)境,Manus系統(tǒng)實(shí)現(xiàn)了用戶只需一次性的鍵盤(pán)輸入即可完成復(fù)雜對(duì)話請(qǐng)求,突破了傳統(tǒng)聊天機(jī)器人多輪對(duì)話的局限性。
對(duì)Manus執(zhí)行過(guò)程的初步猜測(cè):
《賽博禪心》一文中提到的"工程驅(qū)動(dòng)創(chuàng)新",暗示Manus的任務(wù)執(zhí)行過(guò)程中,運(yùn)用了多種工程手段與模型能力的結(jié)合。通過(guò)對(duì)多個(gè)社交媒體案例的分析,我們對(duì)Manus的運(yùn)行機(jī)制做了一個(gè)簡(jiǎn)單的推測(cè)。
假設(shè)大模型(可能是Qwen)在分析輸入后,首先確定任務(wù)的類(lèi)型,然后Manus內(nèi)部會(huì)根據(jù)輸入類(lèi)型進(jìn)行分類(lèi),例如編程任務(wù)、多模態(tài)內(nèi)容生成、任務(wù)規(guī)劃類(lèi)、建議咨詢類(lèi)等等。如果輸入為英文,猜測(cè)可能主要由Claude模型負(fù)責(zé)執(zhí)行。
具體到任務(wù)執(zhí)行層面,猜測(cè)過(guò)程如下:
1.接收到一個(gè)輸入后,大模型首先進(jìn)行任務(wù)分類(lèi),決定后續(xù)任務(wù)執(zhí)行的模型選擇;
2.接著,大模型將輸入拆解為若干層級(jí)分明、優(yōu)先級(jí)明確且執(zhí)行順序清晰的子任務(wù);
3.上級(jí)任務(wù)的輸出結(jié)果會(huì)被下一個(gè)任務(wù)所使用;
4.多個(gè)任務(wù)的輸出結(jié)果會(huì)被整合成一個(gè)最終的分析報(bào)告。
對(duì)于每個(gè)子節(jié)點(diǎn)選擇執(zhí)行的模型,我們推測(cè)如果是編程類(lèi)任務(wù),通常會(huì)由Claude主導(dǎo)執(zhí)行;如果是中文決策建議類(lèi),則以Qwen為主。在子節(jié)點(diǎn)的任務(wù)復(fù)雜度不一的情況下,執(zhí)行過(guò)程中可能需要混合使用這兩者,然后通過(guò)效果對(duì)比,最終保留表現(xiàn)最佳的模型。
從上述的分析可以看出,初始需求的輸入質(zhì)量會(huì)對(duì)后續(xù)任務(wù)的類(lèi)型判斷、子節(jié)點(diǎn)規(guī)劃和執(zhí)行效率產(chǎn)生重要影響,因此對(duì)于Manus的要求是相當(dāng)高的,通常需要用戶提供詳細(xì)且完整的描述(越詳細(xì)越好)。
這一點(diǎn)可能會(huì)成為Manus的批評(píng)焦點(diǎn),畢竟一次任務(wù)的執(zhí)行需要消耗一定的時(shí)間和算力,如果因?yàn)槊枋霾粔蚯逦鴮?dǎo)致資源的浪費(fèi),將嚴(yán)重?fù)p害用戶體驗(yàn),反映出產(chǎn)品尚未成熟。相信未來(lái)團(tuán)隊(duì)會(huì)進(jìn)一步優(yōu)化,畢竟一次任務(wù)的費(fèi)用大概一杯奶茶錢(qián)。
04
當(dāng)前的問(wèn)題
從2022年到2025年,經(jīng)歷了三年多的大模型風(fēng)口一輪輪的認(rèn)知沖擊。人們對(duì)于大模型產(chǎn)品的使用體驗(yàn),已經(jīng)基本走過(guò)了"Aha Moment"決定產(chǎn)品去留的階段。一個(gè)大模型產(chǎn)品,在效果驚人的基礎(chǔ)上,還必須要具備穩(wěn)定性和快速響應(yīng)能力,才能長(zhǎng)久留住用戶。
效果穩(wěn)定性
回頭來(lái)看Manus,由于我們的Manus賬號(hào)還在wishlist中,從推特和國(guó)內(nèi)社媒的用戶反饋來(lái)看,與DeepSeek相比,用戶對(duì)Manus的輸出穩(wěn)定性存在較大疑慮。有用戶反映輸出中出現(xiàn)事實(shí)錯(cuò)誤,甚至有讓人啼笑皆非的環(huán)節(jié)。
如果在執(zhí)行過(guò)程中,若出現(xiàn)數(shù)據(jù)或事實(shí)的誤用,將會(huì)導(dǎo)致最終結(jié)果失去可信度,從而浪費(fèi)掉2美元的成本。
算力
除了任務(wù)效果不穩(wěn)定外,單任務(wù)的執(zhí)行時(shí)間過(guò)長(zhǎng)也是Manus的一大批評(píng)點(diǎn),盡管團(tuán)隊(duì)展示了其任務(wù)執(zhí)行邏輯和流程,但留給用戶的卻是漫長(zhǎng)的等待時(shí)間。例如,一位用戶在社交媒體上抱怨,自己的任務(wù)執(zhí)行了4-5小時(shí)左右。
這背后的原因是團(tuán)隊(duì)對(duì)用戶使用量的把控存在不足,而Manus的架構(gòu)也無(wú)法支撐高算力的需求。事實(shí)上,用戶對(duì)Manus的使用已經(jīng)習(xí)慣了快速出結(jié)果的體驗(yàn),對(duì)于長(zhǎng)達(dá)幾小時(shí)的等待時(shí)間自然難以忍受。
其實(shí),如果Manus能提供一個(gè)明確的完成時(shí)間預(yù)期,用戶對(duì)長(zhǎng)時(shí)間等待的不耐煩情緒可能會(huì)有所減少。畢竟,對(duì)于一個(gè)復(fù)雜的分析任務(wù),即使執(zhí)行時(shí)間長(zhǎng)達(dá)2-3小時(shí)甚至半天,也比現(xiàn)實(shí)中的初級(jí)員工處理得更快。
技術(shù)能力
如果說(shuō)算力可以通過(guò)添加顯卡來(lái)提升,那么團(tuán)隊(duì)在技術(shù)能力方面短期內(nèi)難以跟上其他頂尖產(chǎn)品如DeepSeek的水平。與之相比,Manus的技術(shù)儲(chǔ)備可能更適合開(kāi)發(fā)一款日活百萬(wàn)級(jí)的用戶端產(chǎn)品。
與經(jīng)驗(yàn)豐富的團(tuán)隊(duì)相比,新團(tuán)隊(duì)的優(yōu)勢(shì)在于快速捕捉需求并開(kāi)發(fā)出可用的產(chǎn)品,但當(dāng)用戶量增加時(shí),技術(shù)升級(jí)的問(wèn)題就凸顯了出來(lái)。當(dāng)前,Manus的用戶反饋中提到運(yùn)行速度慢、任務(wù)卡頓等問(wèn)題,都是技術(shù)升級(jí)的外在表現(xiàn)。
盡管Manus已經(jīng)具備了良好的起步基礎(chǔ),并且創(chuàng)始人團(tuán)隊(duì)善于發(fā)現(xiàn)并滿足用戶需求,但要實(shí)現(xiàn)Manus的長(zhǎng)遠(yuǎn)發(fā)展和穩(wěn)定性,還需要更多的人才加入。畢竟,目前的產(chǎn)品架構(gòu)已經(jīng)讓內(nèi)行人能夠大致理解其工作原理,被大廠快速?gòu)?fù)制出來(lái)并不困難。
(此處應(yīng)為“05”或編號(hào)結(jié)尾,具體根據(jù)上下文調(diào)整)
Manus初步顯示,AI Agent領(lǐng)域還存在另一條可行的發(fā)展路徑。
市場(chǎng)上,Agent產(chǎn)品可分為兩大類(lèi):通用型和垂直應(yīng)用型。在通用型領(lǐng)域,知名度最高的兩大產(chǎn)品來(lái)自兩個(gè)主要的大模型廠商——OpenAI推出了"Operator",Anthropic推出了"Computer Use"。通用型領(lǐng)域可以說(shuō)是由這兩大產(chǎn)品所主導(dǎo)的。
Anthropic的Agent軟件通過(guò)一個(gè)獨(dú)特的API,開(kāi)發(fā)者可以利用Claude模型執(zhí)行基本的計(jì)算機(jī)操作,如打開(kāi)文件等。而OpenAI則在此基礎(chǔ)上擴(kuò)展了硬件調(diào)用范圍,允許開(kāi)發(fā)者通過(guò)API接口在個(gè)人電腦上完成編程、旅行預(yù)訂和購(gòu)物等活動(dòng)。國(guó)內(nèi)智譜的AutoGLM在運(yùn)行機(jī)制上與OpenAI的"Operator"具有相似性。
垂直型Agent產(chǎn)品,代表作包括cursor和devin。這些產(chǎn)品在程序員群體中享有良好的口碑,但應(yīng)用領(lǐng)域較為狹窄,難以推廣。
翻 transcript顯示,Manus創(chuàng)始人肖宏曾表示,通用型和垂直型產(chǎn)品在普世價(jià)值上存在差異。他認(rèn)為,通用型產(chǎn)品雖然在速度上不及垂直型,但更具普世價(jià)值。實(shí)際上,許多程序員已經(jīng)在使用cursor編寫(xiě)基礎(chǔ)代碼。
研究表明,Manus定位為通用型AI Agent。通過(guò)工程手段對(duì)Agent架構(gòu)進(jìn)行創(chuàng)新,將復(fù)雜工作流程封裝到云環(huán)境中,并融合多個(gè)大模型,通過(guò)任務(wù)規(guī)劃實(shí)現(xiàn)子任務(wù)的自動(dòng)處理,最終產(chǎn)出的任務(wù)通常需要經(jīng)過(guò)多輪人機(jī)對(duì)話才能完成。
該研究顯示,Manus在部分任務(wù)上超過(guò)了OpenAI的DeepSearch產(chǎn)品,開(kāi)辟了AI Agent發(fā)展的新路徑。
通用型Agent產(chǎn)品的實(shí)現(xiàn)不可能依賴(lài)單一模型,且天然屬于第三方開(kāi)發(fā)者的服務(wù)范疇。
由于OpenAI和Anthropic的Agent產(chǎn)品難以通過(guò)競(jìng)品模型實(shí)現(xiàn),這決定了它們的研發(fā)進(jìn)度和工程手段與第三方開(kāi)發(fā)者相比難以企及。
同時(shí),Manus的應(yīng)用范圍更具落地性,相比通用型產(chǎn)品,垂直型產(chǎn)品的應(yīng)用領(lǐng)域更為廣闊。通用型Agent通常幫助用戶完成購(gòu)票、行程規(guī)劃等操作,操作門(mén)檻較低。但對(duì)于撰寫(xiě)特斯拉財(cái)報(bào)分析報(bào)告等高門(mén)檻的任務(wù),其商業(yè)價(jià)值則更為顯著。
互聯(lián)網(wǎng)界普遍認(rèn)為AI Agent和通用型AGI是同一回事,但Manus的出現(xiàn)表明,即便尚未達(dá)到AGI的高度,但對(duì)普通用戶而言,能夠完成具體任務(wù)的同志仍然是可貴的。
三重啟示:
一、有了AI的助力,獨(dú)立思考和創(chuàng)新能力將成為未來(lái)社會(huì)的核心競(jìng)爭(zhēng)力。
即使Manus作為廣泛使用的AI產(chǎn)品仍處于早期階段,我們也能從類(lèi)似產(chǎn)品的涌現(xiàn)中認(rèn)識(shí)到,持續(xù)創(chuàng)新和突破思考能力是未來(lái)社會(huì)的核心問(wèn)題。
AI能夠協(xié)助人們完成案例分析報(bào)告、文獻(xiàn)綜述等日常任務(wù),但AI無(wú)法替代人類(lèi)進(jìn)行實(shí)驗(yàn)設(shè)計(jì)或確定研究切入點(diǎn)。
在AI技術(shù)的廣泛應(yīng)用下,人與人之間的差距可能會(huì)越來(lái)越大。
二、第一手消息的來(lái)源可能會(huì)受到自媒體和垂直領(lǐng)域媒體的影響。
在傳統(tǒng)互聯(lián)網(wǎng)風(fēng)口(如2010年前后) era,科技媒體發(fā)揮著關(guān)鍵作用,它們不僅包括四大傳統(tǒng)門(mén)戶網(wǎng)站,還包括垂直領(lǐng)域的專(zhuān)業(yè)媒體。而在AI風(fēng)口時(shí)代,創(chuàng)業(yè)企業(yè)的動(dòng)態(tài)往往首先源于自媒體,隨后在社交媒體上發(fā)酵,最終被大眾所知。
在"古典"時(shí)代,只要保持與記者的溝通,就能及時(shí)捕捉到重要行業(yè)動(dòng)態(tài)。但在AI時(shí)代,投資人往往處于被動(dòng)地位,對(duì)新興的科技初創(chuàng)公司知之甚少。
很多風(fēng)投機(jī)構(gòu)通過(guò)設(shè)立孵化器來(lái)培養(yǎng)創(chuàng)業(yè)企業(yè),但這種模式的成功率不高,也很少能產(chǎn)出真正有市場(chǎng)價(jià)值的創(chuàng)新產(chǎn)品。如何在社交媒體發(fā)酵的背景下,抓住潛在的機(jī)會(huì)甚至發(fā)現(xiàn)新的機(jī)會(huì),是風(fēng)投機(jī)構(gòu)需要面對(duì)的新課題。
面對(duì)"大廠",該怎么選?
DeepSeek憑借其優(yōu)秀的模型效果和開(kāi)源殺手锏,已將字節(jié)、騰訊、百度等大廠的技術(shù)領(lǐng)先優(yōu)勢(shì)甩在身后。而Manus不僅走出了通用型agent的一步,更領(lǐng)先了大廠。關(guān)于研發(fā)成本的對(duì)比,我們目前還無(wú)法提供具體數(shù)據(jù),但若等到那時(shí)候,這無(wú)疑是對(duì)大廠的一次羞辱。
Agent,該怎么選?
參考資料:
1. 張小珺 | 商業(yè)訪談錄:https://www.xiaoyuzhoufm.com/episode/67c3d80fb0167b8db9e3ec0f
2. 賽博禪心:實(shí)測(cè)Manus:首個(gè)真干活A(yù)I,中國(guó)造(附50個(gè)用例+拆解)https://mp.weixin.qq.com/s?__biz=MzkzNDQxOTU2MQ==&mid=2247498251&idx=1&sn=f3a81f0f2a0f54c89ed51b2951b07da2
3. 賽博禪心:關(guān)于Manus的一些獨(dú)家信息
4. manuS使用分享:https://manus.im/share/hRGARE7EBqtDhLHBGISLP7?replay=1
AI時(shí)代的分化與挑戰(zhàn),九坤投資三大實(shí)驗(yàn)室:AI在量化圈的困境 如何快速識(shí)別他人心肌梗死,"心梗發(fā)作要命!掌握這些識(shí)別和急救技巧" 突破創(chuàng)新的力量,三款航空發(fā)動(dòng)機(jī)首飛再創(chuàng)新高 保險(xiǎn)人才爭(zhēng)奪戰(zhàn),險(xiǎn)企校招搶手,AI助力招聘!熱門(mén)公司爭(zhēng)搶熱門(mén)專(zhuān)業(yè),這些專(zhuān)業(yè)最受關(guān)注 俄羅斯突破烏克蘭防線,美媒:烏軍可能在兩周內(nèi)撤出庫(kù)爾斯克地區(qū) 轉(zhuǎn)會(huì),海門(mén)珂締緣官方宣布,任世哲、羅東平加入球隊(duì),同時(shí)上調(diào)十名新隊(duì)員加入陣容。 轉(zhuǎn)折點(diǎn)耐克與利物浦的贊助結(jié)束阿迪達(dá)斯成為官方球衣贊助商,阿迪達(dá)斯為利物浦每年帶來(lái)6.5-7億英鎊收入 夜景佤族舞蹈,佤族歌舞驚艷昆明長(zhǎng)水機(jī)場(chǎng),展現(xiàn)異彩民族文化 華強(qiáng)北人潮涌動(dòng)人形機(jī)器人引發(fā)關(guān)注,杭州的機(jī)器人和深圳的機(jī)器人“打”起來(lái)了 中非對(duì)話故事與未來(lái),中國(guó)農(nóng)民托人帶大米到湖南,被王毅外長(zhǎng)點(diǎn)名,其農(nóng)場(chǎng)產(chǎn)量創(chuàng)新高