- 加拿大調(diào)查特斯拉電動(dòng)汽車(chē)補(bǔ)貼申請(qǐng),加拿大調(diào)查特斯拉是否存在騙補(bǔ)行為:一經(jīng)銷(xiāo)商在周末交了4000輛特斯拉
- 定制版顯卡,支持 DIY 工廠(chǎng):訊景 Quicksilver 顯卡 3D 打印文件
- 聚焦廣州增城航天產(chǎn)業(yè)基地啟動(dòng),航天電器廣州增城產(chǎn)業(yè)基地項(xiàng)目開(kāi)工,聚焦低空經(jīng)濟(jì)
- ?;鹫勁信c經(jīng)濟(jì)利益,烏克蘭官員萬(wàn)斯稱(chēng),最佳保障是美國(guó)利益最大化
- 歲月的長(zhǎng)河里優(yōu)雅知性,春季穿搭必pick!4款單品讓你輕松打造日系甜美風(fēng),超好看!
- 英偉達(dá)GTC聚焦機(jī)器人產(chǎn)業(yè)鏈,NVIDIA GTC大會(huì)即將召開(kāi);AI醫(yī)療應(yīng)用持續(xù)發(fā)展
- 銷(xiāo)量交替冠軍被打破,出乎意料!2月新勢(shì)力品牌銷(xiāo)量劇變
- 俄烏沖突升級(jí)俄羅斯空襲烏克蘭東部,美軍1萬(wàn)或撤離德國(guó),衛(wèi)星服務(wù)消失,烏軍士兵面臨被包圍危險(xiǎn);波蘭推動(dòng)憲法修正案強(qiáng)化國(guó)防
- 飛機(jī)恐怖事件,澳大利亞夫婦在飛行途中目擊女子突發(fā)離世,與遺體共坐4小時(shí)。
- 8年漢漂漢軍再聚武漢,標(biāo)題改寫(xiě)建議:告別“漢漂”,武漢成金山辦公最大研發(fā)基地說(shuō)明:1. 將"漢漂"簡(jiǎn)化為"漢漂",同時(shí)保持了核心意思2. 調(diào)整語(yǔ)序,先點(diǎn)明主題"告別漢漂",再說(shuō)明結(jié)果"武漢成最大研發(fā)基地"3. 去掉重復(fù)的"已成",使標(biāo)題更加簡(jiǎn)潔4. 使用更簡(jiǎn)潔的表達(dá)方式,同時(shí)保持了原意這個(gè)標(biāo)題既保持了原文的核心信息,又更加簡(jiǎn)潔明了,易于理解。
聲明:本文來(lái)自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
近期圍繞著DeepSeek模型是否能帶來(lái)經(jīng)濟(jì)收益,近期網(wǎng)絡(luò)上掀起了熱烈討論。3月1日,DeepSeek在開(kāi)源周的最后,公布其模型理論上的成本利潤(rùn)率可以高達(dá)545%,在人們?yōu)榇梭@嘆的同時(shí),AI基礎(chǔ)設(shè)施企業(yè)潞晨科技創(chuàng)始人尤洋提出了不同觀(guān)點(diǎn),他的一則"部署DeepSeek月虧4億"的發(fā)言,迅速成為輿論風(fēng)暴的中心。潞晨科技隨后宣布停用DeepSeek的行為,也讓人們不得不重新審視MaaS(模型即服務(wù))這一商業(yè)模式。
何為MaaS服務(wù)?為何提供MaaS服務(wù)的企業(yè)存在"用戶(hù)越多虧損越多"的現(xiàn)象?MaaS服務(wù)是否真的值得投資?
如果大模型是煤炭,那么MaaS就是電廠(chǎng)。它將煤炭轉(zhuǎn)化為可供所有人方便使用的電力。
MaaS的興起,標(biāo)志著商業(yè)范式的一次革新。
如果大模型是煤炭,那么MaaS就是電廠(chǎng),它將煤炭變成了人人可以方便使用的電?!蓖蹊F震這樣解釋。
作為提供MaaS服務(wù)的主要力量之一,云廠(chǎng)商通過(guò)提供MaaS服務(wù),能夠更好地利用現(xiàn)有的算力資源,優(yōu)化算力利用率,提升服務(wù)效率。
傳統(tǒng)的云服務(wù)模式是企業(yè)按時(shí)間付費(fèi),而MaaS模式則是企業(yè)按token計(jì)價(jià)。這種模式不僅降低了企業(yè)使用大模型的成本,還提升了服務(wù)的穩(wěn)定性和吞吐量。
作為提供MaaS服務(wù)的另一大主力,AI Infra(AI基礎(chǔ)設(shè)施)企業(yè)通過(guò)構(gòu)建從數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練到部署應(yīng)用的完整生態(tài)鏈,將原始算力資源轉(zhuǎn)化為用戶(hù)友好的服務(wù)產(chǎn)品。
在沒(méi)有自己模型的廠(chǎng)商中,要想經(jīng)營(yíng)好MaaS商業(yè)模式,離不開(kāi)開(kāi)源模型的支持。MaaS的商業(yè)模式可以分為三個(gè)主要環(huán)節(jié):第一,模型創(chuàng)造者將模型發(fā)布到開(kāi)源社區(qū);第二,MaaS服務(wù)商從開(kāi)源社區(qū)下載、部署、優(yōu)化模型;第三,應(yīng)用開(kāi)發(fā)企業(yè)通過(guò)API接口調(diào)用模型,按token計(jì)價(jià)。
開(kāi)源模型的爆火,正是推動(dòng)MaaS商業(yè)模式發(fā)展的重要力量。它為MaaS服務(wù)的用戶(hù)提供了一個(gè)便捷、高效、低成本的解決方案。
據(jù)報(bào)道,國(guó)內(nèi)最早部署DeepSeek的AI基礎(chǔ)設(shè)施平臺(tái)在上線(xiàn)DeepSeek R1/V3推理服務(wù)后,流量增長(zhǎng)了數(shù)倍之多。
盡管帶來(lái)了流量增長(zhǎng),但這一商業(yè)模式是否能實(shí)現(xiàn)盈利,各方看法存在明顯的分歧。
每月虧損4億元的核心成本即算力。
盡管DeepSeek聲稱(chēng)其理論利潤(rùn)率高達(dá)545%,但尤洋卻提出了"月虧4億"的質(zhì)疑。他指出,DeepSeek R1每日輸出1000億token,但月度機(jī)器成本高達(dá)4.5億元,導(dǎo)致虧損4億元,這一數(shù)字會(huì)隨著用戶(hù)量的增加而成倍增加。尤洋的言論發(fā)表后不久,3月1日,潞晨科技宣布暫停DeepSeek API服務(wù)。
對(duì)于"月虧4億"的質(zhì)疑,尤洋在媒體采訪(fǎng)中表示,與火山云、阿里云等頭部企業(yè)相比,中小型企業(yè)強(qiáng)行投入大量資源使用第三方開(kāi)源模型進(jìn)行MaaS,往往會(huì)面臨巨額虧損。尤洋進(jìn)一步解釋道,初創(chuàng)企業(yè)即使融資幾億元,也可能不如大廠(chǎng)一個(gè)月的營(yíng)銷(xiāo)推廣費(fèi)用高。他認(rèn)為,單純依賴(lài)調(diào)用第三方開(kāi)源模型進(jìn)行MaaS的模式,必定會(huì)導(dǎo)致虧損。
一位AI基礎(chǔ)設(shè)施從業(yè)者在接受澎湃科技采訪(fǎng)時(shí)表示,MaaS公司目前主要有兩種收費(fèi)模式:一是企業(yè)通過(guò)調(diào)用API按token計(jì)費(fèi);二是采用月費(fèi)會(huì)員制,例如OpenAI的Pro和Plus會(huì)員。國(guó)內(nèi)MaaS公司普遍采用前者,按token計(jì)費(fèi)實(shí)際上等同于按算力計(jì)費(fèi),因?yàn)槊棵腌姷耐评砹亢洼敵鰐oken的數(shù)量直接反映算力的大小,而算力的費(fèi)用就是其核心成本。在這種模式下,"客戶(hù)越多虧得越多"的現(xiàn)象在所難免,因?yàn)槟壳皣?guó)內(nèi)模型API的價(jià)格較為親民,例如DeepSeek-R1官方售價(jià)為百萬(wàn)token 16元。
該從業(yè)者進(jìn)一步解釋道,如果一家MaaS企業(yè)僅提供API服務(wù),而沒(méi)有自建模型和算力資源,"最多只能搭建幾十臺(tái)小集群來(lái)支撐,這樣也會(huì)虧,而且虧損程度與企業(yè)規(guī)模直接相關(guān)"。他認(rèn)為,這一商業(yè)模式的問(wèn)題主要體現(xiàn)在MaaS模式上。以O(shè)penAI的營(yíng)收結(jié)構(gòu)為例可見(jiàn)一斑,API收入僅占整體營(yíng)收的30%,而包月用戶(hù)帶來(lái)的70%利潤(rùn)主要來(lái)自于對(duì)算力需求的覆蓋,因此利潤(rùn)率極高。
該從業(yè)者指出,這就是為什么市面上專(zhuān)門(mén)向大模型公司提供算力支撐的"裸金屬企業(yè)"的商業(yè)模式難以持續(xù)盈利的原因所在。token的銷(xiāo)售成本決定了MaaS企業(yè)對(duì)于規(guī)模的敏感度,因此對(duì)成本控制要求極其嚴(yán)格。
盡管面臨虧損,但這些企業(yè)寧愿先賠錢(qián),也要先圈住用戶(hù)。
王鐵震也提到,算力成本是決定MaaS定價(jià)的重要因素。不同類(lèi)型的MaaS服務(wù)商其算力來(lái)源也存在差異,有的企業(yè)可能利用自身機(jī)房提供的算力,有的則通過(guò)向云廠(chǎng)商按小時(shí)租賃算力,還有的可能利用閑置的算力中心資源。每一家MaaS企業(yè)的算力成本差異較大,尤其是若采用國(guó)內(nèi)算力中心的閑置算力資源時(shí),唯一的成本就是電費(fèi)。算力成本的高低在很大程度上決定了提供MaaS服務(wù)是否能夠?qū)崿F(xiàn)盈利。
此外,技術(shù)和市場(chǎng)競(jìng)爭(zhēng)等因素也會(huì)對(duì)MaaS企業(yè)定價(jià)產(chǎn)生影響。他提到,前沿的技術(shù)有助于提升MaaS企業(yè)"煤轉(zhuǎn)電"的效率。行業(yè)內(nèi)基于開(kāi)源技術(shù)提供服務(wù)和計(jì)算成本方面,"如果連開(kāi)源的Infra效果都達(dá)不到,基本上就出局了。"同時(shí),一個(gè)MaaS公司的部署如果有各種bug(漏洞),也會(huì)反映在成本上。
不過(guò),每個(gè)人的認(rèn)知都有局限。由于行業(yè)尚未充分開(kāi)源,不同背景的技術(shù)開(kāi)發(fā)者選擇不同的技術(shù)路線(xiàn),不在同一技術(shù)維度展開(kāi)競(jìng)爭(zhēng),認(rèn)知不對(duì)齊,因此也就無(wú)法預(yù)估他人的成本。然而,DeepSeek開(kāi)源Infra項(xiàng)目的源代碼幫助對(duì)齊了認(rèn)知,"以前模型開(kāi)發(fā)者可能從未想到還能通過(guò)使用CUDA中的一個(gè)未公開(kāi)的API來(lái)降低成本,現(xiàn)在通過(guò)統(tǒng)一認(rèn)知,情況就清晰多了。"DeepSeek實(shí)現(xiàn)了PTX編程,可以直接與底層硬件進(jìn)行交互,PTX通常隱藏在CUDA的驅(qū)動(dòng)中。王鐵震表示,在確定的方向上"卷"就可以繼續(xù)降低token價(jià)格,技術(shù)迭代加快,需求也會(huì)隨之上漲。"對(duì)于工程師個(gè)人而言,既興奮又覺(jué)得壓力變大了,因?yàn)檫€要學(xué)更多東西。"
王鐵震說(shuō),DeepSeek開(kāi)源后不僅提高了行業(yè)基準(zhǔn),還促進(jìn)了業(yè)內(nèi)進(jìn)一步降低API調(diào)用價(jià)格。"以前大家使用開(kāi)源的大模型時(shí)發(fā)現(xiàn)成本非常高,只能通過(guò)砸錢(qián)、砸補(bǔ)貼或買(mǎi)用戶(hù)。但有了DeepSeek開(kāi)源后,大家開(kāi)始使用,都開(kāi)始賺錢(qián)了。這時(shí)有人就開(kāi)始想,是否可以把價(jià)格再降一降,結(jié)果大家又不賺錢(qián)了,于是就開(kāi)始思考下一代的技術(shù)核心。"因此,MaaS服務(wù)商要把服務(wù)賣(mài)出去,還得看競(jìng)爭(zhēng)對(duì)手的價(jià)格,"如果賣(mài)得明顯比別人貴很多,就算其他地方都很好也不行。"
盡管單純賣(mài)API接口的盈利能力可能不足,但大家爭(zhēng)相接入DeepSeek也不是為了蹭熱點(diǎn)。尤陽(yáng)也表示,"如果它(MaaS)作為一個(gè)功能點(diǎn)提供到其他產(chǎn)品中,最終通過(guò)產(chǎn)品來(lái)賺錢(qián),是有可能的。"他坦承,大廠(chǎng)的優(yōu)化手段和可選方案可能比中小型廠(chǎng)商更好,可能會(huì)收回更多的成本。此外,大廠(chǎng)的長(zhǎng)遠(yuǎn)戰(zhàn)略規(guī)劃或許會(huì)讓它們即使短期內(nèi)有虧損,也能通過(guò)開(kāi)發(fā)超級(jí)APP和其他業(yè)務(wù)消耗大量token,再通過(guò)一些額外付費(fèi)或整體業(yè)務(wù)來(lái)補(bǔ)回虧損。
對(duì)于MaaS服務(wù)商來(lái)說(shuō),還可以為各行各業(yè)的企業(yè)提供整體解決方案,如果將MaaS服務(wù)作為整體解決方案打包出售而非單純銷(xiāo)售API,就能獲得溢價(jià)。業(yè)內(nèi)人士認(rèn)為,如果未來(lái)AI Infra企業(yè)的盈利模式發(fā)生變化,可能會(huì)從為垂直大模型廠(chǎng)商提供MaaS轉(zhuǎn)向?yàn)楦餍懈鳂I(yè)的用戶(hù)提供服務(wù),MaaS服務(wù)將更加垂直化,服務(wù)范圍也會(huì)更加廣泛,服務(wù)方式也會(huì)發(fā)生改變。
王鐵震表示,MaaS行業(yè)目前正處于早期無(wú)序競(jìng)爭(zhēng)的格局中,企業(yè)寧愿虧錢(qián)也愿意先銷(xiāo)售服務(wù)、積累用戶(hù),因此當(dāng)前的MaaS定價(jià)并不能完全反映實(shí)際成本。"國(guó)內(nèi)所有行業(yè)都在'卷'。如果一個(gè)行業(yè)不卷,可能是因?yàn)榇蠹叶紱](méi)有意識(shí)到這個(gè)行業(yè)有巨大的潛力,一旦卷起來(lái),就會(huì)凸顯出誰(shuí)才是行業(yè)的技術(shù)領(lǐng)先者。"在他看來(lái),國(guó)內(nèi)AI Infra行業(yè)還有很大的提升空間,"能看到未來(lái)這里面有巨大的潛力,比如提高token輸出速度,降低token價(jià)格,加速技術(shù)進(jìn)步。"
3月11日,硅基流動(dòng)宣布,DeepSeek API進(jìn)行了升級(jí),DeepSeek-V3的批量推理價(jià)格降低了50%,3月11日-18日期間,DeepSeek-R1的批量推理價(jià)格降低了75%,輸入價(jià)格為1元/百萬(wàn)Token,輸出價(jià)格為4元/百萬(wàn)Token。
物理防曬101,物理防曬VS化學(xué)防曬,防曬霜你會(huì)選嗎? 礦藏挖礦技巧,《大江湖之蒼龍與白鳥(niǎo)》挖礦技巧 Star Survival,StarCrafter怎么下載:游戲下載地址解析 商會(huì)系統(tǒng)解鎖26個(gè)城市任務(wù)種類(lèi)多樣,《三國(guó)問(wèn)鼎山河》商會(huì)系統(tǒng)介紹 精準(zhǔn)擊球比賽精彩,鄭欽文表示,她希望有一天能擁有自己的抖音賬號(hào),但經(jīng)紀(jì)人對(duì)她要求非常嚴(yán)格。(這個(gè)改寫(xiě)版本:1. 使用"表示"替代"希望有一天",使表述更簡(jiǎn)潔直接2. "擁有"替代"想有自己的",更符合口語(yǔ)表達(dá)3. "要求嚴(yán)格"替代"很?chē)?yán)格",更符合書(shū)面表達(dá)習(xí)慣4. 調(diào)整了語(yǔ)序,使句子更流暢5. 保留了所有關(guān)鍵信息,同時(shí)更精煉了表達(dá)) 平民海賊王高效陣容推薦低成本高收益,《海賊王寶藏巡航》平民友好陣容推薦 航空創(chuàng)新引領(lǐng)未來(lái),三款新進(jìn)展:首飛加速再創(chuàng)進(jìn)度條新高度 突破進(jìn)化EA888發(fā)動(dòng)機(jī),SUV一口價(jià)26.99萬(wàn)元起,途昂Pro上市 『探秘先祖·糖果幣』,《光遇》10月25日糖果幣位置2023 《閃光翅蟲(chóng)捕捉指南輕松捕捉神秘生物》,《怪物獵人:荒野之息》中閃光翅蟲(chóng)收集技巧全解析