- 《戰(zhàn)艦少女R》角色深入解析,《戰(zhàn)艦少女r》圣地亞哥評測
- 精美立繪解析,《戰(zhàn)艦少女r》光榮評測
- 熱門卡組揭秘,《爐石傳說》Savjz招募獵玩法一覽
- 歷史風云背后的人物,《率土之濱》陸抗圖鑒
- 爐石玩家必看,《爐石傳說》招募戰(zhàn)攻略:Tom60229構(gòu)筑指南
- 策略與挑戰(zhàn),[戰(zhàn)錘40K:冬季攻勢]明流程攻略
- 深入探討角色魅力,《戰(zhàn)艦少女r》貝爾法斯特評測
- 即將登場的新英雄,《幻想全明星》遠坂凜技能介紹
- 命運轉(zhuǎn)折的背后,《率土之濱》穆皇后圖鑒
- 奇幻再現(xiàn),[新鬼武者 夢之黎明]流程攻略
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
近日,關(guān)于部署DeepSeek到底是賺錢還是虧錢的事在網(wǎng)絡(luò)上引發(fā)了激烈的爭論。3月1日,DeepSeek在開源周的最后一天,公布其模型理論上的成本利潤率可以高達545%,這一數(shù)字讓人們驚嘆不已。然而,在此表態(tài)的同時,AI基礎(chǔ)設(shè)施企業(yè)潞晨科技創(chuàng)始人尤洋提出了一個截然不同的觀點,他的一則"部署DeepSeek月虧4億"的發(fā)言瞬間成為了輿論風暴的中心。隨后,潞晨科技宣布停用DeepSeek的行為,也讓人們不得不重新審視MaaS(模型即服務(wù))這一商業(yè)模式。
何為MaaS服務(wù)?為何提供MaaS服務(wù)的企業(yè)會出現(xiàn)"用戶越多虧損越多"的現(xiàn)象?MaaS服務(wù)究竟是一門什么樣的生意?
如果大模型是煤炭,那么MaaS就是電廠,它將煤炭轉(zhuǎn)化為人人可以方便使用的電。這一比喻生動地詮釋了MaaS服務(wù)的價值所在。
MaaS的出現(xiàn),標志著一種全新的商業(yè)模式正在興起。
對于個人用戶來說,使用大模型主要有兩種途徑:一是通過現(xiàn)有的模型APP、網(wǎng)頁版進行使用,二是自行下載如DeepSeek等開源模型部署到本地,享受更加私域化的定制化服務(wù)。然而,這種本地部署可能面臨運行不穩(wěn)定等挑戰(zhàn)。而對企業(yè)的用戶來說,這種不穩(wěn)定是無法容忍的,因此MaaS的需求應(yīng)運而生。
所謂MaaS,就是將模型部署到企業(yè)端供用戶使用的服務(wù)。MaaS服務(wù)商通過部署模型后,提供API接口,企業(yè)用戶可以通過API接口直接調(diào)用,按token計價。這種方式不僅讓模型運行更快,還為企業(yè)提供了更高的穩(wěn)定性和并發(fā)能力,同時降低了使用成本。
"如果大模型是煤炭,那么MaaS就是電廠,它將煤炭變成了人人可以方便使用的電。"王鐵震這樣解釋。他表示,如果不用MaaS服務(wù),企業(yè)就需要自行搭建發(fā)電機組,成本高而且不劃算。對于一些大型項目,完全依賴"發(fā)電機組"的做法行不通。王鐵震表示,未來每一個企業(yè)用戶每天可能會"燒掉"幾億token,作為標品的MaaS將成為越來越重要的基礎(chǔ)服務(wù)。
云廠商是提供MaaS服務(wù)的一大主力,因為對于它們來說,提供MaaS服務(wù)可以為其原有業(yè)務(wù)增加一個新的收入來源,更好地利用閑置算力。以往企業(yè)按時間向云廠商租借算力,一個2小時的計算任務(wù)需要租賃2小時時長的8張A100本地計算卡。然而,由于算力需求的波動,GPU利用率可能只有50%。Hugging Face工程師王鐵震指出,這種模式導(dǎo)致算力被大量閑置在"等用戶"的過程中。
作為連接大模型底層算力和下游應(yīng)用的中間層,類似潞晨科技這樣的AI Infra(AI基礎(chǔ)設(shè)施)企業(yè)也是MaaS服務(wù)商的另一類主力。AI Infra廠商的工作涵蓋了數(shù)據(jù)準備、模型訓(xùn)練、部署和應(yīng)用整合等環(huán)節(jié),將原始算力資源加工成符合用戶需求的"成品菜"。
自身沒有模型的廠商要想經(jīng)營MaaS商業(yè)模式,離不開開源模型的支持。MaaS的產(chǎn)業(yè)鏈格局主要分為三大板塊:一是創(chuàng)造模型的企業(yè)將模型發(fā)布在如Hugging Face這樣的開源社區(qū);二是MaaS服務(wù)商從開源社區(qū)下載、部署、優(yōu)化模型,并進行必要的管理;三是應(yīng)用開發(fā)企業(yè)通過調(diào)用token進行應(yīng)用開發(fā)。正是因為有了開源模型的支持,MaaS的商業(yè)模式才得以成立。因此,當像DeepSeek這樣的開源模型突然爆火時,它為MaaS行業(yè)帶來了可觀的流量,推動了整個MaaS服務(wù)生態(tài)的發(fā)展。
據(jù)最新報道,國內(nèi)最早引入DeepSeekAI基礎(chǔ)設(shè)施的公司自DeepSeek R1/V3推理服務(wù)正式上線后,流量增長了數(shù)倍。
盡管帶來了流量,但這一商業(yè)模式是否能實現(xiàn)盈利,各方看法不一。
月虧4億的核心成本在于算力
盡管DeepSeek聲稱其理論利潤率高達545%,但尤洋指出,月虧4億?!皾M血版的DeepSeek R1每日輸出1000億token,每月機器成本4.5億,虧損4億,用戶越多,虧損越多?!庇妊蟀l(fā)表上述言論后不久,3月1日,潞晨科技宣布一周后暫停DeepSeek API服務(wù)。
對于"月虧4億"的言論,尤洋在媒體回應(yīng)中表示,與火山云、阿里云等頭部企業(yè)相比,中小企業(yè)的成本效益問題凸顯?!俺鮿?chuàng)企業(yè)即使融了數(shù)億,也可能還沒大廠一個月的營銷推廣費高。我覺得只使用第三方開源模型以當下的MaaS模式賣API的話,肯定是虧的?!?/p>
一位AI Infra從業(yè)者對澎湃科技表示,MaaS公司目前有兩種收費模式:一是企業(yè)調(diào)用API,按token結(jié)算;二是月費會員,例如OpenAI有Pro用戶、Plus用戶等。國內(nèi)MaaS公司普遍采用前者,按token結(jié)算實際上是按算力結(jié)算,“每秒鐘推理多少數(shù)據(jù)、輸出多少token,這其實和算力的價格完全綁定,核心成本在于算力。”在此模式下,“客戶越多虧得越多其實也比較合理,因為目前國內(nèi)模型的API都在降價,本身價格比較低,譬如DeepSeek-R1官方售價為百萬token 16元。”
該從業(yè)者進一步解釋,如果MaaS企業(yè)只提供API服務(wù),沒有自己的模型、沒有足夠的算力,“頂多用幾十臺小集群來做,一定是虧的,做多少虧多少。”他認為這主要由MaaS商業(yè)模式引發(fā),從OpenAI的營收比例可見一斑?!癆PI只占OpenAI營收的30%,70%的利潤來自包月用戶。因為包月用戶實際上跑不了那么多算力,所以是賺錢的,利潤率很高。”
“這就是為什么市面上為大模型公司供給服務(wù)器的‘裸金屬企業(yè)’的銷售模式一定不是一個很好的商業(yè)模式?!痹搹臉I(yè)者補充道,token是銷售成本,對于MaaS企業(yè)來說,賣得越多虧得越多,因此對成本‘特別敏感’。
盡管虧損嚴重,但寧可先圈用戶
王鐵震同樣指出,算力成本是決定MaaS定價的重要因素。MaaS服務(wù)商的算力來源多樣,有的來自企業(yè)自身機房,有的按小時向云廠商租賃,有的來自閑置算力中心。每家MaaS企業(yè)每小時的GPU成本差異較大,若使用國內(nèi)算力中心的閑置算力,其唯一的成本就是電費。算力成本的不同在很大程度上決定了提供MaaS服務(wù)是否能實現(xiàn)盈利。
此外,技術(shù)和市場競爭等因素也會對MaaS企業(yè)的定價產(chǎn)生影響。他指出,前沿的技術(shù)有助于提高MaaS企業(yè)的“煤轉(zhuǎn)電”效率水平。行業(yè)內(nèi)基于開源技術(shù)提供的服務(wù)和計算成本,如果開源Infra的效果無法達到預(yù)期水平,那么基本上就難以在競爭中立足。值得注意的是,一個MaaS公司的部署如果存在各種漏洞或bug,這也會直接反映在成本結(jié)構(gòu)中。
不過,由于認知的局限性,不同人的理解可能存在偏差。由于行業(yè)尚未充分開源,技術(shù)開發(fā)者基于自身背景和經(jīng)驗選擇不同的技術(shù)路線,導(dǎo)致不同技術(shù)維度的競爭者之間認知不一致,這就使得估算他人的成本變得困難。然而,DeepSeek開源Infra項目的開源化,通過提供源代碼幫助統(tǒng)一認知。以前,模型開發(fā)者可能從未想到還能通過CUDA的隱藏API以較低的成本實現(xiàn)效率提升,如今通過統(tǒng)一認知,這一問題得到了解決。DeepSeek通過實現(xiàn)PTX編程,能夠直接與底層硬件進行交互,PTX通常隱藏在CUDA的驅(qū)動中。王鐵震表示,在選定的發(fā)展方向上,“卷”將有助于進一步降低token價格,技術(shù)的快速迭代將推動需求的增長。對于工程師來說,這是一個既充滿興奮又面臨更大壓力的階段,因為需要掌握更多新技術(shù)。
王鐵震指出,DeepSeek開源項目提高了行業(yè)的基準水平,從而促進了其他企業(yè)進一步降低API調(diào)用成本。他解釋道,以前大家使用開源的大模型時發(fā)現(xiàn)成本非常高昂,只能通過加大研發(fā)投入或提供補貼來支撐業(yè)務(wù)。而DeepSeek開源后,大家開始能夠合理使用這些模型,實現(xiàn)盈利。因此,有人開始思考進一步降低價格以維持盈利能力,從而引發(fā)了對下一代技術(shù)核心的探索。這也就意味著,MaaS服務(wù)商要想贏得市場,價格策略至關(guān)重要。如果產(chǎn)品定價明顯高于競爭對手,即使在其他方面表現(xiàn)優(yōu)異,也可能難以獲得市場份額。
盡管單純銷售API接口的商業(yè)模式在盈利方面存在一定困難,但大家爭相接入DeepSeek開源項目并非僅僅為了蹭熱點。尤陽也表示,如果將MaaS功能集成到其他產(chǎn)品中,通過產(chǎn)品實現(xiàn)盈利是有可能的。他坦承,大廠在優(yōu)化技術(shù)和可選方案方面可能比中小廠商更為出色,能夠更好地分攤成本,從而實現(xiàn)更高的利潤率。此外,大廠的長期戰(zhàn)略規(guī)劃也為其提供了緩沖虧損的空間。即使短期內(nèi)存在虧損,通過開發(fā)超級APP和其他業(yè)務(wù),可以消耗大量token資源,最終通過額外付費或整體業(yè)務(wù)模式實現(xiàn)盈利。
對于MaaS服務(wù)商來說,提供全面的解決方案是提升競爭力的關(guān)鍵。如果將MaaS服務(wù)作為一個整體解決方案進行銷售,而非僅僅銷售API,就能夠獲得更高的溢價收入。業(yè)內(nèi)人士認為,如果未來AI Infra行業(yè)的盈利模式發(fā)生變化,可能會從為垂直行業(yè)的大型模型廠商提供MaaS服務(wù)轉(zhuǎn)向為各行各業(yè)的用戶提供服務(wù)。這種轉(zhuǎn)變將使MaaS服務(wù)更加專業(yè)化,服務(wù)范圍也將進一步擴大,服務(wù)方式也將更加個性化。
王鐵震表示,目前MaaS行業(yè)正處于一個無序競爭的早期階段,企業(yè)寧愿承受虧損也要優(yōu)先銷售服務(wù)以積累用戶基礎(chǔ)。因此,當前的MaaS定價機制并不能充分反映實際成本。他認為,國內(nèi)所有行業(yè)都在競爭,如果一個行業(yè)不參與競爭,可能是因為相關(guān)從業(yè)者尚未意識到該行業(yè)的巨大潛力。一旦行業(yè)真正進入競爭狀態(tài),誰能在技術(shù)和成本控制方面占據(jù)領(lǐng)先地位,誰就能在競爭中脫穎而出。他指出,國內(nèi)AI Infra行業(yè)還有很大的提升空間,比如通過提高token輸出速度和降低token價格,能夠進一步推動技術(shù)進步。
3月11日,硅基流動宣布,DeepSeek API進行了升級,DeepSeek-V3的批量推理價格降低了50%。3月11日至18日期間,DeepSeek-R1的批量推理價格下降至75%,輸入價格為1元/百萬Token,輸出價格為4元/百萬Token。
黃帽戰(zhàn)斗狂 黃帽敏捷技能 黃帽戰(zhàn)斗狂速,《街機恐龍》職業(yè)檔案之開羅 無畏威嚴,《驅(qū)入虛空》困獸沙娜技能介紹 32GB Games公路駕駛, Off Road Together 游戲平臺指南 VoxRay開發(fā),Voxile游戲官網(wǎng)地址在哪里 東航每周四班,中國東方航空開通上海阿布扎比直達航線,4月28日開通 高價轉(zhuǎn)會利物浦對多特中后衛(wèi)施洛特貝克感興趣,圖片報:斯洛特貝克轉(zhuǎn)會5000萬歐元,利物浦出價超5000萬 波可娜破壞之鋒,《絕區(qū)零》波可娜技能介紹 夏季防曬飲食小貼士,"防曬食譜指南:竟然隱藏著這些你完全 unaware 的光敏食物" 1. 探秘得分后衛(wèi)的多面魅力 2. 賈森特里的技術(shù)亮點 3. 突破 specialists 4. 賈森特里的得分新高度 5. 小個子得分手的秘密 6. 賈森特里的外射奇技 7. 探求得分后衛(wèi)的極限 8. 賈森特里的技術(shù)封神 9. 突破與穩(wěn)定的得分者 10. 賈森特里的得分密碼,《美職籃全明星》賈森特里介紹 全能型球員·靈活多面,《美職籃全明星》保羅班凱羅介紹