- 探索數(shù)碼世界的奧秘之旅,《數(shù)碼寶貝:新世紀(jì)》智天使獸(善)強(qiáng)度解析
- 探索神秘太空,交易者 圖文全攻略 全流程攻略
- 揭開數(shù)碼獸奧秘,《數(shù)碼寶貝:新世紀(jì)》兔兒爺獸強(qiáng)度一覽
- 終極攻略揭秘,戰(zhàn)爭游戲:空地一體戰(zhàn) 全流程視頻攻略
- 游戲探秘,《數(shù)碼寶貝:新世紀(jì)》玉兔獸強(qiáng)度一覽
- 探索數(shù)碼世界的奧秘,《數(shù)碼寶貝:新世紀(jì)》垂耳兔獸強(qiáng)度一覽
- 解鎖成就寶典,兔子之夜 全成就一覽表
- 游戲角色解析,《數(shù)碼寶貝:新世紀(jì)》薔薇獸強(qiáng)度一覽
- 游戲高手指南,《生化危機(jī)6》克里斯最后一關(guān)攻略技巧
- 游戲探索指南,《數(shù)碼寶貝:新世紀(jì)》花仙獸強(qiáng)度一覽
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
編者按:在深入分析算力與成本相關(guān)議題的"算力經(jīng)濟(jì)學(xué)"系列研究中,本期重點(diǎn)探討ASIC芯片的自研路徑及其產(chǎn)業(yè)鏈影響。本文基于公開信息整理,僅作為知識交流使用,不做投資建議。
作者:我、蘇揚(yáng)擔(dān)任編輯,鄭可君為編輯助理
DeepSeek在推理需求領(lǐng)域已露鋒芒,英偉達(dá)的算力優(yōu)勢被暫時打破,一個全新的世界大門正緩緩打開——以ASIC芯片為核心的算力革命,正以前所未有的方式悄然興起。
知情人士透露,DeepSeek正在積極籌備自研AI芯片,這一消息與國內(nèi)各大科技巨頭已提前布局自研芯片的時間形成鮮明對比。
在大洋彼岸,OpenAI的自研芯片進(jìn)展也在年初公布。據(jù)外媒報道,博通為其量身定制的首塊ASIC芯片已在臺積電批量生產(chǎn),即將投入市場。
此前,Sam Altman曾計劃斥資700億美元打造"芯片帝國",涵蓋設(shè)計與制造全過程。而谷歌、亞馬遜、微軟、Meta等科技巨頭也紛紛加入自研潮,紛紛表態(tài)支持自研芯片研發(fā)。
這一信號表明——無論深Seek、OpenAI,還是中國科技巨頭與美國科技巨頭,誰也不愿在算力時代落后。而ASIC芯片,很可能成為他們跨越新世界大門的關(guān)鍵鑰匙。
這場自研熱潮會不會讓英偉達(dá)失去優(yōu)勢?會不會再造第二個英偉達(dá)?目前尚無定論。
但可以確定的是,自研浪潮已經(jīng)掀起,相關(guān)產(chǎn)業(yè)鏈企業(yè)早已"水漲船高"。例如,博通作為為各大賽廠提供ASIC設(shè)計定制服務(wù)的領(lǐng)軍企業(yè),其業(yè)績已顯現(xiàn)出明顯增長。2024年,博通的AI業(yè)務(wù)收入同比增長240%,達(dá)到37億美元;2025年第一季度,收入更是突破41億美元,同比增長77%。其中80%的收入來自ASIC芯片設(shè)計業(yè)務(wù)。
從博通的業(yè)績來看,他們對ASIC芯片這塊"蛋糕"的估值已超過900億美元。這一數(shù)字背后,是整個自研芯片產(chǎn)業(yè)鏈的潛在價值。
01
算力經(jīng)濟(jì)學(xué)的未來正面臨新的轉(zhuǎn)折點(diǎn)
在AI推理領(lǐng)域,成本的降低是推動其爆發(fā)的關(guān)鍵條件,而通用GPU芯片則成為了限制其發(fā)展的重要瓶頸。
英偉達(dá)推出了兩款重量級產(chǎn)品:H100和A100,這兩款芯片在大模型訓(xùn)練中表現(xiàn)卓越。H100和A100的性能表現(xiàn)堪稱行業(yè)標(biāo)桿,就連B200和H200芯片也吸引了科技巨頭的目光。例如,金融時報援引Omdia的數(shù)據(jù),指出2024年英偉達(dá)Hopper架構(gòu)芯片的主要客戶包括微軟、Meta、Tesla/xAI等企業(yè),其中微軟的訂單量已經(jīng)達(dá)到50萬臺。
然而,作為通用GPU領(lǐng)域的主導(dǎo)者,英偉達(dá)的產(chǎn)品線正在展現(xiàn)出其“雙刃劍”的一面:高昂的成本與能耗的冗余。
從成本角度來看,單個H100芯片的單價超過3萬美元,僅用于訓(xùn)練一個擁有千億參數(shù)的模型,就需要 thousands of GPUs,再加上網(wǎng)絡(luò)設(shè)備、存儲系統(tǒng)和安全措施等后續(xù)投入,總計超過5億美元。根據(jù)匯豐的數(shù)據(jù),最新一代的GB200 NVL72方案,單機(jī)房的總成本超過300萬美元,而NVL36也在180萬美元左右。
從這個角度來看,基于通用GPU的模型訓(xùn)練在成本方面確實(shí)存在巨大壓力。盡管AI技術(shù)在硅谷依然強(qiáng)調(diào)“算力至上”的理念,但資本支出并未因此減緩。例如,馬斯克旗下的xAI平臺最近公布的數(shù)據(jù)表明,其訓(xùn)練服務(wù)器規(guī)模已經(jīng)達(dá)到20萬臺GPU的水平。
在騰訊科技與硅兔聯(lián)合發(fā)布的《2025 AI關(guān)鍵洞察》報告中指出,預(yù)計2024年全球超大規(guī)模數(shù)據(jù)中心的資本支出(CapEx)將突破2000億美元,到2025年這一數(shù)字預(yù)計將接近2500億美元,而主要資源的投入方向?qū)⑥D(zhuǎn)向人工智能領(lǐng)域。
從能耗角度來看,根據(jù)SemiAnalysis的測算,10萬臺H100集群的總功耗為150MW,每年將消耗1.59TWh的電量,按當(dāng)前的電價計算,每年的電費(fèi)高達(dá)1.239億美元。
相比之下,OpenAI公布的數(shù)據(jù)顯示,在推理階段,GPU的算力利用率通常在30%-50%之間,這種“邊算邊等”的低效利用模式在推理時代確實(shí)顯得力不從心,浪費(fèi)十分嚴(yán)重。
谷歌此前公布的TPU V4與A100針對不同架構(gòu)模型的訓(xùn)練速度
性能領(lǐng)先于價格,但效率卻不盡如人意,加之生態(tài)壁壘,業(yè)內(nèi)過去一年 repeatedly express the sentiment: "The sky is falling for NVIDIA." Cloud providers gradually lose control over hardware自主權(quán), compounded by supply chain risks, while AMD currently remains in a fragile position. These factors collectively drive firms to pursue in-house AI芯片 development.
As a result, the AI chip landscape has transitioned from technology competition to economic game.
As per西南證券's research conclusion: "When model architectures reach a plateau, every dollar invested in computation must yield quantifiable economic returns."
Recent feedback from North American cloud vendors indicates that ASIC technology is beginning to demonstrate its superiority:
● 谷歌:博通為谷歌定制的TPU v5芯片在Llama-3推理場景中,相比H100,單位算力成本降低了70%。
● 亞馬遜:采用3nm制程的AWS Trainium 3芯片,在相同算力下能耗僅為通用GPU的1/3,且年電費(fèi)節(jié)省超過千萬美元;據(jù)了解,亞馬遜 Trainium芯片2024年出貨量已突破50萬片。
● 微軟:根據(jù)IDC數(shù)據(jù),微軟Azure自研ASIC后,硬件采購成本占比從75%降至58%,成功擺脫了長期的議價困境。
As the largest beneficiary of the North American ASIC ecosystem, the trend is increasingly evident in the data.
博通2024年AI業(yè)務(wù)收入達(dá)37億美元,同比增長240%,其中80%來自于ASIC設(shè)計服務(wù)。2025Q1,其AI業(yè)務(wù)營收達(dá)到41億美元,同比增長77%,預(yù)計第二季度AI營收將增長至44億美元,同比增幅達(dá)44%。
博通早在年報期間就指出,2027年其ASIC收入將迎來爆發(fā)式增長,給市場一個大餅——三年之后,該市場規(guī)模有望達(dá)到900億美元。在Q1電話會上,公司再次重申了這一觀點(diǎn)。
據(jù)悉,憑借這一產(chǎn)業(yè)趨勢,博通已經(jīng)成為全球繼英偉達(dá)、臺積電之后的第三家市值破1萬億美元的半導(dǎo)體公司,這一消息也引發(fā)了對Marvell、AIchip等公司的廣泛關(guān)注。
不過,有一點(diǎn)值得強(qiáng)調(diào)——盡管ASIC性能優(yōu)越,但不會取代GPU的地位。
微軟、谷歌、Meta等公司紛紛下場自研,但同時又在搶購英偉達(dá)的B200首發(fā)芯片,這說明雙方之間并非直接競爭關(guān)系。
更為客觀的結(jié)論是,GPU將在高性能訓(xùn)練市場中主導(dǎo)地位,而在推理場景中,由于GPU的通用性,其依然是主要的芯片。但在未來4000億美元的AI芯片藍(lán)海市場中,ASIC的滲透路徑已經(jīng)清晰可見。
根據(jù)IDC的數(shù)據(jù),2024-2026年推理場景中,ASIC占比將從15%提升至40%,即最高1600億美元。
這場變革的最終結(jié)果可能是:在推理市場中,ASIP占比將達(dá)到80%,而GPU將重新主導(dǎo)訓(xùn)練和圖形領(lǐng)域。在這場變革中,真正能勝出的將是那些同時具備硅片技術(shù)和場景理解能力的"雙棲玩家",英偉達(dá)顯然屬于這一行列,看好ASIP的前景并非唱空英偉達(dá)。
而在新的時代背景下,投資的指引應(yīng)當(dāng)轉(zhuǎn)向?qū)ふ页ミ_(dá)之外的雙棲玩家,如何在這片ASIP的新紀(jì)元掘金。
02
ASIC的"手術(shù)刀":非核心模塊,通通砍掉
錦緞在某文中對SoC進(jìn)行了深入解析,而CPU和GPU用戶已習(xí)以為常,F(xiàn)PGA市場小眾,ASIC則是最不熟悉的應(yīng)用領(lǐng)域。以下是需要重點(diǎn)介紹的幾個領(lǐng)域及其特性描述:
特性描述:
1. CPU
2. GPU
3. FPGA領(lǐng)域
4. ASIC領(lǐng)域
5. 定制化程度描述
6. 通用特性描述
7. 半通用特性描述
8. 半定制化特性描述
全定制化方案
靈活性高
成本可控
較低成本
較高預(yù)算
低功耗
核心優(yōu)勢
應(yīng)用范圍廣
計算能力強(qiáng),生態(tài)成熟
靈活且應(yīng)用范圍廣
效能表現(xiàn)最優(yōu)
局限性之一是處理速度較慢
多任務(wù)處理性能略顯不足
消耗電量較高,軟件開發(fā)難度較大
在峰值計算方面仍有提升空間
產(chǎn)品開發(fā)周期較長,存在較高的技術(shù)風(fēng)險
適用領(lǐng)域方面需要進(jìn)一步拓展
主要應(yīng)用于特定場景
在云端進(jìn)行訓(xùn)練和推理過程
適合云端推理,同時支持終端級推理應(yīng)用
云端進(jìn)行訓(xùn)練和推理,終端設(shè)備進(jìn)行推理任務(wù)
圖示對比:算力芯片性能 資料來源:中泰證券
那么,有人說ASIC對AI推理性能有積極影響,那么它到底是什么樣的芯片呢?
從架構(gòu)設(shè)計上來說,通用型GPU芯片需要兼顧圖形渲染、科學(xué)計算、不同模型架構(gòu)等多種需求,這種"通用設(shè)計"導(dǎo)致大量晶體管資源被浪費(fèi)在非核心功能模塊上。
英偉達(dá)GPU的最大特點(diǎn),就是擁有眾多"小核",這些"小核"可以比作多級發(fā)動機(jī),開發(fā)者可以利用多年積累的算子庫,實(shí)現(xiàn)高效的并行計算。
但當(dāng)下游模型確定后,計算任務(wù)也隨之確定,不需那么多"小核"來保持計算的靈活性,這正是ASIC芯片的全定制化架構(gòu)特點(diǎn)。
通過"精準(zhǔn)裁剪"策略,僅保留與目標(biāo)場景強(qiáng)相關(guān)的硬件單元,從而釋放出驚人的計算效率,這一技術(shù)已在谷歌和亞馬遜的產(chǎn)品中得到驗(yàn)證。
谷歌TPU v5e AI加速器實(shí)拍效果
對于GPU芯片,調(diào)用方式是英偉達(dá)的CUDA,但對于ASIC芯片,調(diào)用方式則是云廠商自研的算法,對于以軟件為主的大型企業(yè)來說,確實(shí)不算難事。
● 在TPU v4架構(gòu)中,95%的晶體管資源被優(yōu)化用于矩陣乘法和向量處理,這些單元專為神經(jīng)網(wǎng)絡(luò)計算進(jìn)行了深度優(yōu)化,而與之相比,GPU的類似單元僅占約60%。
與傳統(tǒng)馮·諾依曼架構(gòu)的"計算-存儲"分離模式不同,ASIC通過算法特征定制數(shù)據(jù)流,實(shí)現(xiàn)了更高效的資源利用。以博通為Meta定制的推薦系統(tǒng)芯片為例,計算單元直接嵌入存儲控制器周圍,這種架構(gòu)減少了數(shù)據(jù)傳輸距離70%,從而將延遲降低至GPU的1/8水平。
針對AI模型中占50%-90%的權(quán)重稀疏特性,亞馬遜 Trainium2芯片集成了一款高效的稀疏計算引擎,通過跳過零值計算環(huán)節(jié),理論性能提升可達(dá)300%。
當(dāng)算法趨于固定,對于確定性的垂直場景,ASIC展現(xiàn)出天然的優(yōu)勢。這種架構(gòu)設(shè)計的根本目標(biāo),就是讓芯片本身成為算法的"物理延伸"。
在整個發(fā)展歷程中,我們可以觀察到大量成功的ASIC案例,其中礦機(jī)芯片是其中最具代表性的例子。
在早期,行業(yè)主要依賴英偉達(dá)的GPU進(jìn)行ASIC設(shè)計,但隨著挖礦難度的上升,電力消耗超過挖礦收益(類似于當(dāng)前的推理需求場景),定制化ASIC芯片應(yīng)運(yùn)而生。雖然在通用性上不及GPU,但礦機(jī)ASIC通過極致化并行能力,展現(xiàn)了更高的專用性能。
例如,比特大陸的比特幣礦機(jī)ASIC采用了數(shù)萬個SHA-256哈希計算單元,在單一算法的加速上實(shí)現(xiàn)了超線性效果,算力密度較GPU高出10倍以上。這種設(shè)計不僅提升了專用能力,還實(shí)現(xiàn)了能耗的系統(tǒng)級優(yōu)化。
此外,采用ASIC可精簡外圍電路(如不再需要PCIe接口的復(fù)雜協(xié)議棧),從而減少了主板面積40%,整機(jī)成本降低25%。
低成本、高效率的特性,使得ASIC技術(shù)天然適應(yīng)了AI產(chǎn)業(yè)從"暴力堆算力"向"精細(xì)化效率革命"轉(zhuǎn)型的需求。
隨著推理時代的到來,ASIC的成本優(yōu)勢將再次顯現(xiàn),就像礦機(jī) historically did。這種模式將導(dǎo)致規(guī)模效應(yīng)下的"死亡交叉"——盡管單芯片設(shè)計費(fèi)用高達(dá)5000萬美元,但邊際成本下降曲線遠(yuǎn)超過通用GPU。
以谷歌TPU v4為例,其單顆成本從10萬片出貨時的3800美元降至100萬片出貨時的1200美元,降幅達(dá)70%。預(yù)計到2025年,TPU v6的單片算力將較前代提升3倍,同時其性價比將繼續(xù)提升。
這引出了一個新話題,是否所有人都可以加入這場自研ASIC的浪潮?這取決于自研成本與市場需求的平衡。
按照7nm工藝的ASIC推理加速卡來計算,涉及IP授權(quán)費(fèi)用、人力成本、設(shè)計工具、掩模費(fèi)用等,總體規(guī)??赡茉跀?shù)億元,不包括后續(xù)的量產(chǎn)成本。
目前,像谷歌、亞馬遜這樣的云廠商,憑借成熟的客戶基礎(chǔ)和研發(fā)銷售的閉環(huán),已經(jīng)在自研領(lǐng)域占據(jù)先機(jī),具有先天的優(yōu)勢。
與Meta類似,其自研策略背后是內(nèi)部對算力需求的巨大規(guī)模。今年初,扎克伯格已明確計劃,到2025年將實(shí)現(xiàn)約1GW的計算能力,并于年底前擁有超過130萬張GPU。
(內(nèi)容暫時缺失)
"新地圖"的商業(yè)價值遠(yuǎn)遠(yuǎn)超出了100億美元預(yù)期
即使僅考慮挖礦需求,市場 already 生成了近100億美元的價值,因此當(dāng)博通在2024年底預(yù)測AI ASIC市場空間在700-900億美元時,我們不感到意外,甚至認(rèn)為這個數(shù)字可能偏低。
現(xiàn)在,ASIC芯片產(chǎn)業(yè)的發(fā)展趨勢應(yīng)當(dāng)被視為不可動搖的事實(shí),重點(diǎn)應(yīng)放在如何掌握"新地圖"的競爭規(guī)則。
在近數(shù)千億美元的AI ASIC市場中,已基本形成了清晰的三大梯隊——"制定規(guī)則的ASIC芯片設(shè)計者和制造者"、"產(chǎn)業(yè)鏈配套"、"垂直場景下的Fabless"。
第一梯隊,由"制定規(guī)則的ASIC芯片設(shè)計者和制造者"組成,他們不僅能夠生產(chǎn)單價超過1萬美元的ASIC芯片,還能與云廠商展開合作,代表這一群體的有博通、Marvell、AIchip,以及在先進(jìn)芯片制造方面受益匪淺的代工巨頭——臺積電。
在產(chǎn)業(yè)鏈布局方面,市場需求關(guān)注的配套邏輯主要包括更上游的先進(jìn)封裝與更下游的產(chǎn)業(yè)鏈延伸。
先進(jìn)封裝領(lǐng)域:臺積電CoWoS產(chǎn)能的35%已轉(zhuǎn)移至ASIC客戶,對應(yīng)的國產(chǎn)企業(yè)包括中芯國際、長電科技和通富微電等。
由于英偉達(dá)硬件方案解耦帶來的新硬件機(jī)會,云廠商正在拓展AEC(異構(gòu)Express Conduit)等新型硬件應(yīng)用。例如,亞馬遜自研的單顆ASIC需配3根AEC,若2027年出貨量達(dá)到700萬顆,預(yù)計將帶動超過50億美元的市場價值,同時服務(wù)器、PCB等硬件領(lǐng)域也將受益于類似技術(shù)發(fā)展。
在更底層的Fabless(無晶圓廠設(shè)計服務(wù)提供商)領(lǐng)域,asic芯片的本質(zhì)是需求驅(qū)動型市場,誰能最先洞察垂直場景中的痛點(diǎn),誰便掌握了定價權(quán)。asic芯片具有高度定制化能力,這與垂直場景的天然契合度極高。以智能駕駛芯片為例,作為asic芯片的典型代表,隨著比亞迪等品牌全面布局智能駕駛,這類產(chǎn)品已進(jìn)入爆發(fā)期。
從全球asic產(chǎn)業(yè)鏈的三個梯隊來看,國產(chǎn)芯片 essentially擁有“三把鑰匙”,即在先進(jìn)封裝、云計算硬件以及垂直場景應(yīng)用三大領(lǐng)域具有競爭優(yōu)勢。
由于受到禁令限制,國產(chǎn)GPU與英偉達(dá)的差距依然顯著,生態(tài)建設(shè)的路程漫長而艱巨。然而,在asic芯片領(lǐng)域,中國與海外企業(yè)處于同一起跑線上。結(jié)合垂直場景,中國不少Fabless企業(yè)能夠推出更具能效比的產(chǎn)品,例如礦用ASIC、智能駕駛 ASIC 以及阿里平頭哥的含光芯片、百度的昆侖芯等。
與asic芯片配套的芯片制造環(huán)節(jié)主要依賴中芯國際,而中興微等中興旗下企業(yè)正逐步加入這一領(lǐng)域,未來不排除與國內(nèi)廠商展開合作,上演“誰是博通”的新戲碼。
圖為英偉達(dá)的主要上游供應(yīng)商,來源為富邦研究;右圖為GB200 NV72L機(jī)柜的總長接近2英里,展示了NVLink Spine銅纜的震撼規(guī)模。
產(chǎn)業(yè)鏈配套環(huán)節(jié)的技術(shù)難度相對較低,對應(yīng)的硬件產(chǎn)品包括服務(wù)器、光模塊、交換機(jī)、PCB和銅纜等。由于這些環(huán)節(jié)的技術(shù)門檻不高,國內(nèi)企業(yè)的競爭力本來就較為突出。此外,這些硬件企業(yè)與國產(chǎn)算力之間存在“共生”關(guān)系,asic芯片產(chǎn)業(yè)鏈同樣不容忽視。
在應(yīng)用場景方面,除了反復(fù)提及的智能駕駛芯片和AI推理加速卡,其他國產(chǎn)設(shè)計公司的機(jī)會則取決于特定場景能否迎來爆發(fā),以及相關(guān)企業(yè)能否準(zhǔn)確把握機(jī)遇。
04
總結(jié)
當(dāng)人工智能從依靠大量人力進(jìn)行的"大力出奇跡"式訓(xùn)練,轉(zhuǎn)向依靠算法進(jìn)行的高效率、低成本的深水區(qū)探索時,算力戰(zhàn)爭的第二階段必將成為那些能夠?qū)⒓夹g(shù)轉(zhuǎn)化為實(shí)際經(jīng)濟(jì)效益的企業(yè)的天下。
ASIC芯片的崛起不僅是一次技術(shù)革新,更是一本關(guān)于效率、成本和話語權(quán)的商業(yè)智慧錄。
在這張新的牌局中,中國玩家正在逐步掌握越來越多的籌碼——機(jī)會總是留給那些準(zhǔn)備充分的人。
轉(zhuǎn)載開白 | 商務(wù)合作 | 內(nèi)容交流請?zhí)砑游⑿牛簀induan008 添加微信請注明:姓名+公司+來意
怪物獵人荒野高效資源采集技巧,怪物獵人荒野快速采集方法掌握怪物獵人荒野快速采集技巧解析 暗影帷幕五輪傳奇策略與RPG的完美結(jié)合(僅在Steam上線主機(jī)玩家等不及),暗影帷幕:五輪傳奇游戲平臺推薦 獨(dú)特關(guān)鍵誘餌彈快速打斷怪物切換區(qū)域拖住怪物戰(zhàn)斗節(jié)奏,荒野誘餌彈有什么作用-解析特殊用途機(jī)制 審判傷加成,《小雞艦隊出擊》智慧女神強(qiáng)度介紹 天塹沙原便便區(qū)捕獲指南,怪物獵人荒野捕捉糞金龜方法 月球探測即將啟程,雅典娜著陸器發(fā)射,開啟月球探測之旅 凍結(jié)之王龍開卡技巧,怪物獵人荒野凍峰龍怎么打-打凍峰龍技巧全解析 光屬性寵物戰(zhàn)斗與策略,《洛克王國:世界》光系寵物一覽 硬核2D格斗,范馬刃牙血之競技場和Baki Hanma Blood Arena游戲官方地址介紹 清新可愛有趣又多玩,撲貓時刻官網(wǎng)地址在哪里?免費(fèi)下載!