- 節(jié)日更新?lián)屜瓤?,《迷你世界》慕斯皮膚免費獲取指南
- 攻略指南,《金鏟鏟之戰(zhàn)》S13執(zhí)法九五陣容攻略
- 最新游戲更新揭秘,《碧藍航線》11月21日更新內(nèi)容
- 游戲攻略指南,《黎明飛馳》摩托遠(yuǎn)征任務(wù)攻略
- 揭開餐廳的秘密,《異世界慢生活》接待客人方法一覽
- 游戲任務(wù)揭秘,《魔獸世界》巨型淡水蝦任務(wù)攻略
- 游戲活動攻略指南,《絕區(qū)零》1.3嗯呢助教計劃第5天攻略
- 通關(guān)秘籍,《絕區(qū)零》電子戰(zhàn)場亂斗紊亂通關(guān)攻略
- 攻略必備,《金鏟鏟之戰(zhàn)》S13德萊文陣容攻略
- 深入了解,《湮滅邊界線》黑豹介紹
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
AI生成圖片
大模型的"王后"可能被取代,只有更合適的"接班人"。繼DeepSeek-R1推理模型之后,算力供應(yīng)端押寶阿里巴巴千問QwQ-32B,被視為即將大規(guī)模落地的推理模型。
3月10日,國家超算互聯(lián)網(wǎng)平臺宣布接入阿里巴巴千問大模型,對外提供QwQ-32B API服務(wù),用戶可免費獲取100萬 tokens。
不少國產(chǎn)算力廠商已推出或計劃推出更適合QwQ-32B的算力部署模式。
前期,國產(chǎn)AI芯片廠商壁仞科技推出基于壁礪TM106全系列的一體機,全面支持QWQ-32B大模型推理;摩爾線程基于高速推理框架vLLM和MT Transformer推理引擎部署了QwQ-32B;算能的SophNet云平臺接入QwQ-32B模型,依托算能自主研發(fā)的TPU,推理速度達75 Tokens/s;東南大學(xué)基于其國產(chǎn)算力平臺,接入QwQ-32B模型,成為全國首個提供該服務(wù)的高校;青云科技旗下AI算力云也上線了QwQ-32B。
行業(yè)專家指出,作為推理模型,更關(guān)注的是性價比指標(biāo)。DeepSeek-R1普及了大模型推理場景,之后的大模型需提供更優(yōu)效果和更低成本,才能彌補DeepSeek-R1的替換成本。
阿里巴巴官方透露,在冷啟動基礎(chǔ)上,通義團隊針對數(shù)學(xué)、編程和通用能力進行了兩輪大規(guī)模強化學(xué)習(xí)。在32B模型尺寸下,既能提供極強推理能力,又滿足低資源消耗需求,適合快速響應(yīng)或?qū)?shù)據(jù)安全要求高的場景。開發(fā)者和企業(yè)可在消費級硬件上部署本地設(shè)備,進一步打造高度定制化AI方案。
在一系列權(quán)威基準(zhǔn)測試中,千問QwQ-32B模型幾乎超越OpenAI-o1-mini,與最強開源推理模型DeepSeek-R1齊駕。在AIME24評測集的數(shù)學(xué)能力測試中,以及LiveCodeBench的代碼能力評估中,千問QwQ-32B表現(xiàn)與DeepSeek-R1不相上下,遠(yuǎn)超同尺寸R1蒸餾模型。
此外,千問QwQ-32B模型集成了智能體Agent的能力,使其在使用工具的同時進行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過程。
此外,千問QwQ-32B模型中還集成了與智能體Agent相關(guān)的能力,使其能夠在使用工具的同時進行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過程。
上述業(yè)內(nèi)人士指出,DeepSeek的成功后,行業(yè)內(nèi)為了加快部署步伐,導(dǎo)致大模型一體機市場迅速發(fā)展,但事實上,一體機可能并非最適合DeepSeek-R1的部署模式。
相較于QwQ-32B的稠密架構(gòu)模型,DeepSeek采用了稀疏模型架構(gòu),以滿血版R1為例,其6710億參數(shù)需要占用671GB顯存。為了支持輸入/輸出、過程數(shù)據(jù)等操作,還需額外預(yù)留大量顯存空間。然而,在每次推理過程中,僅有370參數(shù)被激活,這表明一體機中大量算力并未得到高效利用。
此外,國產(chǎn)芯片方面,DeepSeek-R1的開源行為增強了行業(yè)對國產(chǎn)大模型的信心,而QwQ-32B憑借更大的算力和采用Apache 2.0協(xié)議開源,使得消費級顯卡能夠輕松部署。即使國產(chǎn)芯片在性能上不及英偉達GPU,但在做好兼容性和適應(yīng)性前提下,已能夠滿足更多個人開發(fā)者及中小企業(yè)以低成本接入頂級模型的需求。
一位云計算行業(yè)的分析師表示,自ChatGPT推出以來,生成式AI對云計算收入增長的貢獻至少占有一半。這些收入主要來自推出新大模型/GPU服務(wù)或通過改進現(xiàn)有云服務(wù)來驅(qū)動AI應(yīng)用。值得注意的是,AI不再僅僅是云計算的應(yīng)用擴展,而是成為驅(qū)動云計算戰(zhàn)略演進的核心驅(qū)動力。
從大模型與算力相互促進的角度來看,大模型的部署正從單純的"技術(shù)摸高"走向"技術(shù)摸高+工程創(chuàng)新"的并行發(fā)展,而算力結(jié)構(gòu)則從"預(yù)訓(xùn)練"時代轉(zhuǎn)向"預(yù)訓(xùn)練+后訓(xùn)練+推理"的新模式。算力需求將持續(xù)增長。
以阿里云為例,其遵循"AI驅(qū)動,公共云優(yōu)先"的發(fā)展戰(zhàn)略,開源的千問大模型已成為連接AI與云計算的重要抓手。在最新一期的阿里云財報中,AI收入已連續(xù)六個季度實現(xiàn)三位數(shù)增長,并推動云服務(wù)收入重返13%的高增長區(qū)間,達到317億元人民幣,增速較上一季度的7%接近翻番。這一增長趨勢推動了云+AI的估值邏輯,最終帶動阿里巴巴股價上漲近60%,市值狂飆至超過1100億美元。
通過開源合作,阿里通義千問已成為支持最多大模型的國產(chǎn)算力平臺之一,并在海外被包括Camel.AI、SambaNova Cloud、OpenRouter、ChatLLM、Together.AI、LM Studio在內(nèi)的多家平臺部署并提供API服務(wù)。
目前,通義千問在HuggingFace熱門大模型排行榜上穩(wěn)居榜首,其衍生模型數(shù)量已超過10萬個,超越美國的Llama模型,成為全球應(yīng)用最廣泛的AI大模型。(本文首發(fā)于鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達)
本地商業(yè)國際化布局科技賦能,王興思考,美團走向京東、餓了么、美團網(wǎng)、美團外賣、大眾點評等品質(zhì)餐飲品牌——1979年出生的王興 重組利好,突然漲停!這個題材,大面積異動! 廣發(fā)銀行2024年困境與挑戰(zhàn),中國廣發(fā)銀行經(jīng)營業(yè)績出現(xiàn)下降,股票遭遇大股東減持行為 靜的力量,李靜:更年期是人生的盛夏 33位政協(xié)委員榮獲,英雄祁發(fā)寶,再獲榮譽 股權(quán)困境解析,股份出售,亞太財險重?fù)?dān)成 focus 愛達郵輪100航次,國產(chǎn)大郵輪"愛達?魔都號"第100航次或國產(chǎn)大郵輪愛達?魔都號完成100個航次 摩托羅拉 razr 50發(fā)布,"摩托羅拉 Razr 50、Edge 50 Ultra 海外版全新功能:圈選即搜快速搜索" 市場趨勢,CounterPoint:中國成為全球智能手表銷量冠軍 烏克蘭總統(tǒng)訪美無果而返回,注意!英國向烏克蘭輸貸款!