- 成長之路,《實況足球2009》快速掌握一球成名技巧
- 深入探索裝備魅力,《拉結(jié)爾》手游聚魂皮褲屬性圖鑒介紹
- 神秘偶像背后的面具,《約戰(zhàn):精靈再臨》誘宵美九圖鑒
- 更新版操作指南揭秘,《實況足球2009》
- 深入揭秘,《拉結(jié)爾》手游族群守護(hù)者屬性圖鑒介紹
- 探索游戲裝備秘密,《拉結(jié)爾》手游禁錮之力屬性圖鑒介紹
- 深入探秘,《拉結(jié)爾》手游魅影戒指屬性圖鑒介紹
- 深入探秘,《拉結(jié)爾》手游巨像勛章屬性圖鑒介紹
- 游戲心得分享,《粘粘世界》心得總結(jié)
- 揭秘傳奇英雄,《夢三國手游》馬超圖鑒
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
AI生成圖片
大模型的"王后"可能被取代,只有更合適的"接班人"。繼DeepSeek-R1推理模型之后,算力供應(yīng)端押寶阿里巴巴千問QwQ-32B,被視為即將大規(guī)模落地的推理模型。
3月10日,國家超算互聯(lián)網(wǎng)平臺宣布接入阿里巴巴千問大模型,對外提供QwQ-32B API服務(wù),用戶可免費獲取100萬 tokens。
不少國產(chǎn)算力廠商已推出或計劃推出更適合QwQ-32B的算力部署模式。
前期,國產(chǎn)AI芯片廠商壁仞科技推出基于壁礪TM106全系列的一體機(jī),全面支持QWQ-32B大模型推理;摩爾線程基于高速推理框架vLLM和MT Transformer推理引擎部署了QwQ-32B;算能的SophNet云平臺接入QwQ-32B模型,依托算能自主研發(fā)的TPU,推理速度達(dá)75 Tokens/s;東南大學(xué)基于其國產(chǎn)算力平臺,接入QwQ-32B模型,成為全國首個提供該服務(wù)的高校;青云科技旗下AI算力云也上線了QwQ-32B。
行業(yè)專家指出,作為推理模型,更關(guān)注的是性價比指標(biāo)。DeepSeek-R1普及了大模型推理場景,之后的大模型需提供更優(yōu)效果和更低成本,才能彌補(bǔ)DeepSeek-R1的替換成本。
阿里巴巴官方透露,在冷啟動基礎(chǔ)上,通義團(tuán)隊針對數(shù)學(xué)、編程和通用能力進(jìn)行了兩輪大規(guī)模強(qiáng)化學(xué)習(xí)。在32B模型尺寸下,既能提供極強(qiáng)推理能力,又滿足低資源消耗需求,適合快速響應(yīng)或?qū)?shù)據(jù)安全要求高的場景。開發(fā)者和企業(yè)可在消費級硬件上部署本地設(shè)備,進(jìn)一步打造高度定制化AI方案。
在一系列權(quán)威基準(zhǔn)測試中,千問QwQ-32B模型幾乎超越OpenAI-o1-mini,與最強(qiáng)開源推理模型DeepSeek-R1齊駕。在AIME24評測集的數(shù)學(xué)能力測試中,以及LiveCodeBench的代碼能力評估中,千問QwQ-32B表現(xiàn)與DeepSeek-R1不相上下,遠(yuǎn)超同尺寸R1蒸餾模型。
此外,千問QwQ-32B模型集成了智能體Agent的能力,使其在使用工具的同時進(jìn)行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過程。
此外,千問QwQ-32B模型中還集成了與智能體Agent相關(guān)的能力,使其能夠在使用工具的同時進(jìn)行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過程。
上述業(yè)內(nèi)人士指出,DeepSeek的成功后,行業(yè)內(nèi)為了加快部署步伐,導(dǎo)致大模型一體機(jī)市場迅速發(fā)展,但事實上,一體機(jī)可能并非最適合DeepSeek-R1的部署模式。
相較于QwQ-32B的稠密架構(gòu)模型,DeepSeek采用了稀疏模型架構(gòu),以滿血版R1為例,其6710億參數(shù)需要占用671GB顯存。為了支持輸入/輸出、過程數(shù)據(jù)等操作,還需額外預(yù)留大量顯存空間。然而,在每次推理過程中,僅有370參數(shù)被激活,這表明一體機(jī)中大量算力并未得到高效利用。
此外,國產(chǎn)芯片方面,DeepSeek-R1的開源行為增強(qiáng)了行業(yè)對國產(chǎn)大模型的信心,而QwQ-32B憑借更大的算力和采用Apache 2.0協(xié)議開源,使得消費級顯卡能夠輕松部署。即使國產(chǎn)芯片在性能上不及英偉達(dá)GPU,但在做好兼容性和適應(yīng)性前提下,已能夠滿足更多個人開發(fā)者及中小企業(yè)以低成本接入頂級模型的需求。
一位云計算行業(yè)的分析師表示,自ChatGPT推出以來,生成式AI對云計算收入增長的貢獻(xiàn)至少占有一半。這些收入主要來自推出新大模型/GPU服務(wù)或通過改進(jìn)現(xiàn)有云服務(wù)來驅(qū)動AI應(yīng)用。值得注意的是,AI不再僅僅是云計算的應(yīng)用擴(kuò)展,而是成為驅(qū)動云計算戰(zhàn)略演進(jìn)的核心驅(qū)動力。
從大模型與算力相互促進(jìn)的角度來看,大模型的部署正從單純的"技術(shù)摸高"走向"技術(shù)摸高+工程創(chuàng)新"的并行發(fā)展,而算力結(jié)構(gòu)則從"預(yù)訓(xùn)練"時代轉(zhuǎn)向"預(yù)訓(xùn)練+后訓(xùn)練+推理"的新模式。算力需求將持續(xù)增長。
以阿里云為例,其遵循"AI驅(qū)動,公共云優(yōu)先"的發(fā)展戰(zhàn)略,開源的千問大模型已成為連接AI與云計算的重要抓手。在最新一期的阿里云財報中,AI收入已連續(xù)六個季度實現(xiàn)三位數(shù)增長,并推動云服務(wù)收入重返13%的高增長區(qū)間,達(dá)到317億元人民幣,增速較上一季度的7%接近翻番。這一增長趨勢推動了云+AI的估值邏輯,最終帶動阿里巴巴股價上漲近60%,市值狂飆至超過1100億美元。
通過開源合作,阿里通義千問已成為支持最多大模型的國產(chǎn)算力平臺之一,并在海外被包括Camel.AI、SambaNova Cloud、OpenRouter、ChatLLM、Together.AI、LM Studio在內(nèi)的多家平臺部署并提供API服務(wù)。
目前,通義千問在HuggingFace熱門大模型排行榜上穩(wěn)居榜首,其衍生模型數(shù)量已超過10萬個,超越美國的Llama模型,成為全球應(yīng)用最廣泛的AI大模型。(本文首發(fā)于鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達(dá))
物理防曬小貼士,物理防曬VS化學(xué)防曬,防曬霜你會選嗎? 3.10焦點對決冠軍爭奪戰(zhàn),對陣橫濱,穆斯卡特:必須拿出出色表現(xiàn)才能奪冠 貓的聰明表現(xiàn),二樓貴賓席,廣東一家咖啡店迎賓貓按鈴招顧客 新總理上任 局外人挑戰(zhàn) 未來如何,加拿大非官方角色當(dāng)總理:加拿大如何對特朗普"強(qiáng)硬對著"?加拿大如何處理對華關(guān)系? 如何移動錢改善姥姥過冬條件,《文字來找茬》姥姥過冬通關(guān)攻略 上海 vs 山東 激烈對決 亮點紛呈 全面解析,首節(jié)開局戰(zhàn)平,劉毅雙外齊現(xiàn)神態(tài),洛夫頓多威穩(wěn)健發(fā)揮,李添榮失誤 如何快速識別他人心肌梗死,心梗發(fā)作要命,記住識別和急救方法 智領(lǐng)新知 廣汽豐田再創(chuàng)智能汽車新標(biāo)桿,廣豐鉑智3X上市后訂單百萬,合資純電車為何能迅速崛起? 俄羅斯突襲烏克蘭防線談判是否可能,美媒:烏軍可能在兩周內(nèi)撤出庫爾斯克地區(qū) 多樣化的優(yōu)雅穿搭搭配法則,這些才是氣質(zhì)女性的高級感穿搭!簡約又不老套