- 游戲攻略揭秘,《部落大作戰(zhàn)》閃避流進階攻略
- 游戲高手必備,《絕區(qū)零》萊卡恩技能操作技巧
- 攻略指南輕松掌握游戲挑戰(zhàn),《絕區(qū)零》深淵第十層平民陣容攻略
- 深入探索,《絕區(qū)零》可琳邀約好感度增加選擇建議
- 全新冒險指南,《仙境傳說RO:新啟航》新手開荒攻略
- 游戲攻略詳解,《燕云十六聲》稚子江湖二任務攻略
- 裝備背后的力量,《DNF:起源》重力契約長靴裝備指南
- 《絕區(qū)零》艾蓮每日邀約選擇答案一覽
- 游戲技巧揭秘,《秦時明月手游》進行傳功步驟介紹
- 探秘裝備之路,《DNF:起源》重力綁腿裝備圖鑒
聲明:本文來自于(ID:ykqsd.com)授權轉載發(fā)布。
PPIO派歐云聯(lián)合創(chuàng)始人兼首席執(zhí)行官姚欣
中國開源大模型DeepSeek最新宣布其“癱瘓”
鈦媒體獲悉,3月11日凌晨,DeepSeek正式宣布,其R1網絡和API服務出現(xiàn)故障,隨后開始調查, shortly after DeepSeek官方表示,關于R1網頁和API服務的問題已得到解決。
事實上,這并非首次。自春節(jié)以來,DeepSeek頻繁回復“服務器繁忙,請稍后再試”的消息,讓各地用戶忍無可忍。
然而,DeepSeek日前卻發(fā)布文章稱,包括了網頁、APP和API在內的所有負載,如果所有tokens全部按照 DeepSeek R1 的定價計算,理論上一天的成本利潤率高達545%,這一數據震撼了市場。但很多人并不認同這一說法,認為545%的數據存在誤導性。
“545%只是一個理論數字,DeepSeek發(fā)布文章中也提到,如果全行業(yè)都按照這個數字來,那么大家就都別干了。”PPIO派歐云聯(lián)合創(chuàng)始人兼首席執(zhí)行官姚欣近日對鈦媒體表示。
姚欣指出,盡管DeepSeek擁有許多創(chuàng)新技術,但這份沒有收入起伏的數據,證明了DeepSeek全天近16個小時都處于峰值期,無法完整地滿足用戶的請求和服務,這樣的服務質量“不合格”。
作為首批適配DeepSeek模型的AI算力廠商,PPIO派歐云成立于2018年,由PPTV創(chuàng)始人、前藍馳創(chuàng)投投資人姚欣和首席架構師王聞宇共同創(chuàng)立,主要在網絡邊緣側構建分布式云計算服務,科技“按需付費”形成了商業(yè)落地。
姚欣曾形容,PPIO派歐云是“算力版的滴滴”,主要整合企業(yè)側的閑時碎片化算力,承載多種服務,包括音視頻和AI推理等。
DeepSeek-V3/R1模型發(fā)布之后,PPIO派歐云率先完成適配工作,據SuperCLUE發(fā)布的DeepSeek-R1網頁端穩(wěn)定性測評報告顯示,PPIO派歐云的滿血版 DeepSeek-R1準確率達100%,從而為客戶和開發(fā)者提供穩(wěn)定、準確的支持。
在姚欣看來,PPIO派歐云最獨特的優(yōu)勢在于其"靈活的資源調配能力",即擁有一個分布式系統(tǒng),可以根據用戶需求動態(tài)調整資源,從而在DeepSeek官網中釋放峰值壓力,有效應對服務中的壓力問題。
3月6日,PPIO上線了高性能版Deepseek R1/V3 Turbo(全參數滿血版)版本,其吞吐量達到30 TPS,較之前版本提升了3倍,充分滿足了高并發(fā)場景的需求。當前活動價8折優(yōu)惠,Deepseek V3 Turbo的定價降至每百萬tokens 1.6元。
姚欣對鈦媒體AGI表示,從長期來看,AI基礎架構中的MaaS中間層是否賺錢并不重要,關鍵在于實現(xiàn)開源和標準化,使MaaS逐步普及并走向開放化。整個行業(yè)目前正處于 lengthy 發(fā)展過程,各參與者都在 You 追我趕的競爭中前進,而DeepSeek則鼓勵更多模型開源,加速技術創(chuàng)新。
姚欣表示,未來三年,AI 大模型的推理成本有可能下降1000倍以上,在計算資源成本高昂且需求激增的市場環(huán)境下,分布式算力將成為引領下一階段發(fā)展的重要推動力。
"從去年5月至今,PPIO派歐云平臺80億參數規(guī)模的模型價格下降了一半以上,同一代模型情況下,一年時間后API調用價格下降10倍,這是我們能看到的一個基本趨勢,今年如果新的模型出現(xiàn),肯定會有新的降本空間。"姚欣指出,整個市場已經形成了AI 推理、AI商業(yè)落地等"共識",因此公司今年會加大對應用落地、接納客戶服務、兼容更多國產GPU卡等服務的開發(fā)。
姚欣強調,推理成本的持續(xù)下降必然會帶來AI應用的爆發(fā)式增長。未來兩年,中國AI將進入"免費應用"時代,即AI推理成本將低于AI應用通過廣告或增值服務變現(xiàn)的收入,用戶無需付費即可實現(xiàn)AI應用的免費使用。
在鈦媒體AGI的獨家對話中(刪減部分):
姚欣表示,我相信大家對這個數字都非常清楚,545%只是一個理論數值,DeepSeek的文章中也提到過,如果全行業(yè)都達到這個水平,大家都別干了。
我們也做了很多詳細的分析和解讀,主要包括以下幾點:
首先是DeepSeek在很多方面都進行了獨特的創(chuàng)新,其中對于我們的啟發(fā)在于,許多AI模型和推理采用單機單卡、單機多卡的部署方式,即一個單機上運行多個模型。在之前進行模型訓練時,我們沒有很好地思考未來如何部署。而如今,DeepSeek清楚地認識到未來需要在多個集群上部署模型,其核心策略是采用專家并行策略,即將專家并行分布在多個機器上。這種部署思路與我們PPIO派歐云對于分布式推理的理解不謀而合。
第二,成本控制率是一個理論值,例如,它的利用率幾乎全天滿負荷運行,只有在凌晨出現(xiàn)低谷,但成本卻幾乎沒有下降。因此,它采取降價策略,將利用率提升。
作為一個服務過4.5億用戶的PPTV創(chuàng)始人,我遺憾地指出,這是一個理論上的理想狀態(tài)?;ヂ?lián)網應用服務通常會經歷流量高峰和低谷,就像正弦曲線一樣。然而,如果在最高峰時段流量變?yōu)橹本€,意味著該時段內用戶請求無法接入。
總結而言,春節(jié)期間DeepSeek的服務中斷未能滿足用戶和企業(yè)服務需求,同時這也表明DeepSeek全天近16小時運行在峰值期,無法完整滿足用戶請求和服務。因此,我認為其服務質量相當于"不及格"。
因此,DeepSeek的服務和技術架構需要更加"彈性",才能解決這些問題。PPIO派歐云在春節(jié)期間第一時間接入DeepSeek,利用分布式推理實現(xiàn)負載均衡優(yōu)化,以確??蛻舴召|量的穩(wěn)定。
姚欣:我們對企業(yè)和用戶版本進行了區(qū)分。
其中,企業(yè)客戶享有優(yōu)先級服務,春節(jié)期間流量增長了10倍,但PPIO派歐云支持的DeepSeek-V3/R1服務可用性達到99.9%,因此我們成為春節(jié)期間唯一全程扛下如此大流量的供應商。
在我的看法中,PPIO派歐云的獨特價值在于能夠根據用戶需求動態(tài)調整資源。我們擁有大量分散的數據中心和計算資源,并基于分布式系統(tǒng)進行管理,因此在春節(jié)期間的表現(xiàn)還算不錯。
姚欣:我覺得投資人miss(錯過)項目是正常的,沒有任何投資人能把全球最好的項目都拿過來,何況DeepSeek并不差錢。
其實,我覺得好公司就應該這樣:一方面有足夠強的現(xiàn)金流支撐創(chuàng)始人實現(xiàn)夢想,融資只是補充現(xiàn)金的一種手段,不能因為有融資方式就一味燒錢補充流量或收入,而應該更多地發(fā)展盈利業(yè)務,就像DeepSeek和梁文鋒一樣,幻方有發(fā)展的業(yè)務。PPIO派歐云也是如此,才敢在該行業(yè)中大膽、放心地競爭。
姚欣:MaaS定義的是推理加速和服務中間層。我自己從PPTV時期就做視頻云服務,所以在我看來,上一輪SaaS(軟件即服務)和IaaS(基礎設施即服務)市場份額能達到80%以上,而PaaS(平臺即服務)的規(guī)模較小,MaaS則相當于AI領域的中間層服務。
因此,在任何一個行業(yè)的中間層,無論是開源數據庫還是操作系統(tǒng)本身,核心價值點都在于構建生態(tài)和上下游產業(yè)鏈實現(xiàn)價值?;谶@一認知,我提出中間層應作為標準統(tǒng)一平臺,通過抽象和虛擬化下層IaaS的異構基礎,為上層SaaS暴露標準化技術能力,從而簡化開發(fā)流程,讓開發(fā)者基于中間平臺直接進行編程。這是中間層最根本的價值所在。
在長期發(fā)展中,我們對MaaS中間層的價值判斷不再那么重要。相反,我們更應關注的是通過開源和標準化,讓MaaS技術逐步普及、普惠,最終走向完全的開源化。在這一過程中,PPIO派歐云發(fā)揮著積極的推動作用,不僅會推出更多開源技術,還將支持開源生態(tài)的建設。值得注意的是,MaaS層本身并不會直接產生經濟價值,我們的核心收入來源將來自算力資源的銷售和模型的提供,通過彈性IaaS服務與模型銷售相結合,實現(xiàn)極致性價比和彈性的開源模型服務。
面對行業(yè)發(fā)展的長遠目標,我們深知這是一個需要持續(xù)努力和不斷探索的過程。開源合作是推動整個行業(yè)進步的最佳方式,通過"你中有我、我中有你"的開源理念,我們鼓勵更多模型開放源代碼,促進技術交流與進步。這種開放合作不僅能夠加速技術創(chuàng)新,也為行業(yè)內的企業(yè)提供了更多應用場景的可能性,同時顯著降低了模型使用成本。對于像我們這樣追求創(chuàng)新和高效的企業(yè)來說,開源合作無疑是一次難得的機遇,因此我們將全力支持這一進程。
節(jié)日期間,我們及時推出了DeepSeek開源模型的"滿血版",并迅速完成了評測與上線工作。工程師們加班加點優(yōu)化改進,只為提供給客戶最好的服務體驗。這一舉動體現(xiàn)了我們對企業(yè)成長和客戶價值的深刻理解,也展現(xiàn)了我們對技術創(chuàng)新的堅定信心。我相信,隨著DeepSeek模型性能的持續(xù)提升,將會有更多 previously latent的應用場景得到解放,同時開源模型的普及也將極大降低企業(yè)的使用門檻。因此,我們決心全力支持開源合作,助力更多企業(yè)快速上手并享受到技術紅利。
在接下來的幾個月里,我們預計會有越來越多的企業(yè)接入PPIO派歐云平臺,進一步推動我們的收入增長。我們對即將到來的業(yè)務發(fā)展充滿信心。
姚欣:我們的模型庫不僅包含開源基座模型,還有眾多經過微調和多模態(tài)優(yōu)化的模型。這種多樣化布局不僅滿足了不同行業(yè)和場景的需求,也為開源社區(qū)提供了豐富的資源。
同時,我認為底座模型的構建不需要過于復雜,就像操作系統(tǒng)和搜索引擎那樣,核心功能往往不需要過于冗雜。大量基于底座模型的垂直行業(yè)解決方案、微調模型以及模型應用,反而能夠推動整個生態(tài)系統(tǒng)的繁榮發(fā)展。目前開源模型的性能已經取得了顯著提升,接近閉源水平,這一趨勢顯示出開源技術正在成為推動行業(yè)發(fā)展的主要力量。
在多模態(tài)領域,我們目前正積極推進音頻和聲音克隆技術的研發(fā),并計劃推出一批優(yōu)質的人工智能生成視頻模型,為用戶提供更豐富、更便捷的服務。
姚欣:在進入這一領域時,我們不會僅僅滿足于中間層的技術實現(xiàn),而是采取了自下而上的戰(zhàn)略。我們不僅具備強大的彈性資源池和全球算力調度能力,還擁有豐富的分布式系統(tǒng)開發(fā)經驗。一旦市場需求爆發(fā),我們不僅要追求極致的性價比,還要確保系統(tǒng)的彈性足夠應對高峰負載,確保用戶能夠正常訪問。只有這樣,我們的商業(yè)模式才能真正站穩(wěn)腳跟,未來的競爭和盈利才有保障。
在長期發(fā)展中,我們認為技術的彈性將變得越來越重要。相比固定資源的閑置,我們更傾向于利用彈性資源池來滿足高峰期的需求。同時,全球范圍內的算力調度能力也將讓我們的服務更具競爭力。盡管目前業(yè)務還處于起步階段,但未來一旦用戶數量激增,我們不僅需要確保服務質量,還要在彈性方面下大功夫,這樣才能真正滿足用戶需求,實現(xiàn)商業(yè)可持續(xù)發(fā)展。
這個領域有點類似于移動互聯(lián)網的早期階段,首要任務是做好用戶服務工作,通過伴隨著一系列峰值事件實現(xiàn)增長,隨后借助智能算力和云服務進行差異化競爭,開展分布式推理業(yè)務,提供商業(yè)To B(企業(yè)級)解決方案,包括開源、優(yōu)化和降本的方案,與生態(tài)系統(tǒng)共同促進其發(fā)展。
姚欣:我認為,國產算力在訓練階段確實面臨較大挑戰(zhàn),但R1這種推理模型的引入,使得國產算力的發(fā)展不再局限于芯片性能(計算能力)的考量,而是更加注重顯存(存儲能力)和并聯(lián)機制(通信能力)的重要性,這將有利于國產算力卡的進一步發(fā)展,并提升其性能水平。
對于算力需求,我的觀點是:
首先,未來算力將持續(xù)增長,但其構成將發(fā)生重大變化。到2024年,英偉達60%的算力卡將被用于訓練場景,40%用于推理場景。未來推理場景的占比將顯著提升,這一變化與用戶使用量、模型規(guī)模和用戶活躍度密切相關。
其次,從全球視角來看,當前AI應用的滲透率相當于2011年移動互聯(lián)網階段,仍存在巨大的增長機遇。即使訓練算力市場增長放緩,推理算力市場將實現(xiàn)爆發(fā)式增長,總體算力規(guī)模將保持持續(xù)增長態(tài)勢。
姚欣:一體機與國產卡適配性問題本身并無直接關聯(lián),大家選擇做"一體機"的根本原因是滿足客戶的不同需求。
在公有云、私有云、專有云等不同形態(tài)下,各自具備特定特點和應用場景。我認為,"一體機"屬于私有云或專有云范疇,它通過內部系統(tǒng)部署,解決了企業(yè)數據不出境、不出體外的問題,確保了數據的安全性和隱私性。
此外,成本結構也存在差異。公有云對于客戶而言使用成本最低,使用門檻也最為便捷。而私有云則需要投入硬件成本,通常需要分攤到3年、5年甚至更長時間才能攤銷,且硬件貶值速度較快。對于要求數據不出界的行業(yè)客戶,一體機這種特殊部署需求尤為合理。這與移動互聯(lián)網早期客戶傾向于自己搭建數據中心存儲數據,后來逐漸認識到公有云更具成本效益的結論相一致,需要一個教育和認知的過程。
當然,我們還需要考慮客戶的特定需求和服務類型,但目前PPIO派歐云主要以公有云為主,服務于大量互聯(lián)網和C端場景。對于需要在企業(yè)內網訪問、數據敏感的行業(yè)客戶,我們也會提供基于一體機的私有化部署方案。
姚欣:首先,底層創(chuàng)新的周期較長、變化較慢,這是客觀存在的事實。
舉個例子,英偉達從創(chuàng)立到現(xiàn)在已經31年了,誰能想到今天它已經成為AI時代的核心合作伙伴。其實,任何底層技術的發(fā)展都具有長期性,需要投入時間和耐心。在PPIO平臺成立的那一天,我就堅信我們要把分布式架構全球化、系統(tǒng)化,這個目標不是三年五年就能完成的,而是需要10年、20年的時間,只有當這套技術真正實現(xiàn)標準化和普及,才能讓所有應用受益。這個過程需要我們耐心等待行業(yè)發(fā)展的機遇和變遷,這需要長期的堅持。
投資人的角色各有不同,有些是長期投資者,有些則是短期投機者。當年的美元基金等早期投資,回報周期可以達到12年,而有些基金的募資周期只有3到5年,投資者必須在5年內退出。而后期投資和成長期投資則需要在更廣泛的生態(tài)中找到機會。因此,我們更需要一個繁榮的生態(tài)系統(tǒng),因為投資的本質就是"反共識"。一個地方人多未必賺錢,但我們希望每個地方都能有投資機會。我們也希望,國內的投資環(huán)境、上市機制和并購生態(tài)能夠持續(xù)改善,因為金融市場的流動性和創(chuàng)新都需要時間。國家也在逐步重視這些領域,希望更多有耐心的投資者能夠陪伴這一進程。
之前,人民幣基金主要投資早期初創(chuàng)企業(yè),如今他們也在更早、更小、更專注的高科技領域投資,甚至看到某些地方允許國有資本參與早期投資。這表明,中國的一級資本市場正在逐步向長期投資模式轉型。當年PPTV從2004年到2014年用了10年時間發(fā)展,還不能算是大成者,而今天我已經是PPIO的創(chuàng)始人,視頻行業(yè)已經發(fā)展了20多年。這些經歷告訴我們,長期陪伴是一個必要的過程,這些投資人也值得我們由衷的尊重。
十多年前,我有機會在PPTV工作,從2004年到2014年用了10年時間,但仍然不算大成。今天,PPIO已經走過了比我預期的更長時間,我越來越接近我的夢想。今天的PPIO不僅承載著當年的愿景,還致力于科技創(chuàng)新成為未來的新基礎設施和底座,我們沿著最初的夢想持續(xù)前行。
姚欣:這已經是十多年前的事了。誰不想讓自己的孩子考入清華北大,我也希望我的孩子能去納斯達克敲響第一聲 bell,并像字節(jié)跳動那樣閃耀。但隨著市場競爭的加劇,我覺得企業(yè)并購退出已經成為常態(tài),2016年在Blue馳投資后發(fā)現(xiàn),90%以上的企業(yè)都是通過并購退出的,而IPO退出不到10%。這是一個普及性的現(xiàn)象。
痛苦是短暫的,但對創(chuàng)業(yè)者來說,技術是長期的事情。從PPTV到PPIO,我越來越接近自己的夢想。今天的PPIO不僅承載著我的愿景,還致力于將分布式架構作為未來的新基礎設施和底層技術,我們始終沿著最初的夢想持續(xù)前進。
姚欣:客戶競爭無處不在,所有的機會都在于不斷優(yōu)中選優(yōu)和打磨,每一家企業(yè)都應該有自己獨特的核心競爭力。我們希望在技術上做好獨特性,提高護城河,做到自上而下、從軟到硬的持續(xù)優(yōu)化。每家企業(yè)都應該在擅長的領域專注發(fā)展,每家企業(yè)都應該有自己的差異化和核心壁壘。
姚欣:首先,包括OpenAI在內的全行業(yè)模型價格都在持續(xù)下降。
其次,去年5月至今,PPIO派歐云平臺80億參數規(guī)模的模型價格已經下降了一半以上,今年中有望實現(xiàn)一年降10倍的目標。對于新興的模型,比如DeepSeek這類新模型,我相信半年后肯定會有新的降本空間。
我對實現(xiàn)"推理成本在3年內降低1000倍"這一長期目標充滿信心。我們還相信,未來兩年內,中國的AI技術將進入"免費應用"時代,即AI推理成本將低于其通過廣告或增值服務變現(xiàn)的收入,無需向用戶收費就能實現(xiàn)AI應用的免費化,就像當年游戲從收費轉為免費,視頻從收費轉為免費,都帶來了巨大的市場爆發(fā)。
姚欣:我認為大家都是理性選擇的,不會只是出于燒錢考慮。一些廠商認為燒錢不合理,所以我相信這些大廠也會有自己的全面考量方式。
對于PPIO派歐云來說,我們看到整個市場已經達成共識,即AI推理和AI商業(yè)落地,這與我們的公司定位高度契合。因此,今年我們的團隊計劃在應用落地、接納客戶服務以及兼容更多國產GPU卡方面下大功夫,實現(xiàn)同等模型參數下成本每年下降十倍。這種持續(xù)的降低成本,必將推動AI應用的爆發(fā)式增長,讓我們有望分得更大的市場份額。
(本文首發(fā)于鈦媒體App,作者|林志佳)
攻略,《口袋斗蛐蛐》火焰圣女攻略 武器的高效搭配,怪物獵人:荒野攻勢毒斬斧最佳配裝推薦 預購獎勵開啟,浪人崛起預購獎勵如何領?。侯I取位置解析 嫦娥提到了誰,《王者榮耀》每日一題答案分享 21A3連招輸出傷害翻倍,《決勝巔峰》梅麗莎打法攻略 龍騰四?!?20威風凜凜,“龍字頭”國產飛機大盤點,超燃! 四葉蜉蝣捕捉指南,怪物獵人荒野:四葉蜉蝣收集方法解析 武器搭配的秘密,荒野強擊瓶斬斧最強裝推薦 探索新冒險,Voxile游戲官網位置在哪里?官網地址是什么? 硬核價格爆表廣汽豐田鉑智3X上市銷量破紀錄,廣豐鉑智3X上市一小時訂單破萬,合資純電車背后原因是什么?