- 玩家必看攻略揭秘,《碧藍航線》武藏復刻卡池出貨率一覽
- 深入解讀,《桃花師》金烏屬性技能分析
- 游戲攻略揭秘,《鬼谷八荒》刀修前期開荒攻略
- 即將更新帶來驚喜,《DNF:起源》65版本新地圖一覽
- 揭開符文奧秘,《云頂之弈》S13棱彩符文介紹
- 策略解讀,《爐石傳說》親王賊卡組代碼分享
- 《絕區(qū)零》1.3嗯呢助教計劃第2天通關攻略
- 全新版本揭幕,《DNF:65版本新技能詳解》
- 探討游戲角色設計,《碧藍航線》現(xiàn)版本酒匂強度一覽
- 游戲攻略起步指南,《爆裂小隊》合體開局玩法介紹
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
科大訊飛研究院正式宣布,公司與華為共同完成了國產(chǎn)算力領域的重大突破。雙方聯(lián)合團隊成功突破國產(chǎn)算力集群上 MoE 模型的大規(guī)??绻?jié)點專家并行集群推理,這一成果是繼 DeepSeek 揭示其 MoE 模型訓練推理方案之后,中國首個基于國產(chǎn)算力的全新解決方案。
在技術(shù)實現(xiàn)層面,聯(lián)合團隊通過軟硬件協(xié)同創(chuàng)新,在多個關鍵技術(shù)層面充分挖掘硬件潛力。特別是在算子融合方面,團隊實現(xiàn)了 MLA 預處理階段的并行流水處理,并將多個小算子進行融合重構(gòu),消除了小算子下發(fā)開銷。這一創(chuàng)新使得 MLA 前處理時延較之前提升了 50% 以上,顯著提升了系統(tǒng)性能。
為優(yōu)化混合并行策略和通信計算并行,團隊構(gòu)建了 TP(張量并行)+EP(專家并行)的混合范式。在 MLA 計算層,采用機內(nèi) TP 并行策略,充分發(fā)揮了機內(nèi)高速互聯(lián)的優(yōu)勢,降低了跨機通信的損耗。在專家調(diào)度方面,團隊實現(xiàn)了 64 張卡的均衡專家計算節(jié)點分配,并創(chuàng)新性地定制了 AllToAll 通信協(xié)議,使專家數(shù)據(jù)交換效率提升了 40%。同時,通過分層優(yōu)化降低了跨機流量傳輸?shù)?60%。此外,研發(fā)的路由專家負載均衡算法確保了卡間負載差異控制在 10%以內(nèi),集群吞吐量提升了 30%。
在分布式架構(gòu)創(chuàng)新與算法協(xié)同優(yōu)化的推動下,國產(chǎn)算力上的性能實現(xiàn)了顯著提升。單卡靜態(tài)內(nèi)存占用較雙機部署減少至 1/4,效率提升了 75%。專家計算密度較之前增加了 4 倍,同時推理吞吐量提升了 3.2 倍,端到端時延較之前降低 50%。
科大訊飛研究院表示,這一創(chuàng)新性解決方案將被應用于訊飛星火深度推理模型的訓練加速,預期可使訓練時推理效率提升 200%。基于該方案的推理引擎還實現(xiàn)了在國產(chǎn)算力上高效運行 DeepSeek V3 和 R1 模型。
IT之家從科大訊飛的公告獲悉,深度推理大模型星火 X1 已經(jīng)完成升級。在模型參數(shù)量比業(yè)界同行少一個數(shù)量級的前提下,星火 X1 的數(shù)學能力全面對標 DeepSeek R1 和 OpenAI O1,在中文數(shù)學各項任務中均實現(xiàn)了領先的性能表現(xiàn)。
雙影奇境下載指南輕松聯(lián)機對戰(zhàn)教程,雙影奇境游俠聯(lián)機教學:操作指南與技巧 捕捉到它會怎樣,怪物獵人荒野:楔蟲收集方法 低難度捕獲暴君蚱蜢小貼士,怪物獵人荒野暴君蚱蜢收集方法 朵莉亞生存與爆發(fā)的完美出裝搭配,《王者榮耀》朵莉亞出裝思路介紹 全新《血腥角斗2》極致沉浸式體驗VR動作游戲的next level,GORN 2游戲怎么下載 游戲下載地址 香草戒指椰子刷取攻略,如龍8外傳椰子戒指獲取攻略 增幅藥劑輕松加倍,怪物獵人荒野鬼人藥延長方法分享 西爾維婭技能大解析25%傷害加成自動忽略耐力,《黑星勇者成名錄》西爾維婭特性技能介紹 天塹深處的神秘冒險,荒野皇帝蚱蜢捕捉指南:怪物獵人荒野中皇帝蚱蜢的捕捉方法 逆境重生治療藥劑使用技巧,《逆境重生》藥品使用技巧