- 游戲更新發(fā)布會提前揭秘,《鳴潮》1.2更新時(shí)間介紹
- 裝備探秘,《DNF:起源》承天迫擊戰(zhàn)甲裝備指南
- 最新活動指南,《奇跡暖暖》6.14大喵限時(shí)制衣活動簡介
- 最新游戲福利攻略,《忍者必須死3》2024年7月兌換碼
- 上班族玩家的劍網(wǎng)3無界指南,《劍網(wǎng)3無界》上班族玩法建議
- 探索轉(zhuǎn)生奧秘,《創(chuàng)造吧我們的星球》藍(lán)翎翼龍啾轉(zhuǎn)生公式分享
- 陣容搭配指南,《無盡夢回》陣容搭配方案大全
- 《地下城與勇士:起源》泰坦蛇眼胸甲圖鑒
- 最新福利搶先看,《放置奇兵》2024年7月兌換碼分享
- 標(biāo)題前綴探索神秘捕捉之旅,《創(chuàng)造吧我們的星球》碟象坐標(biāo)及飼料詳解
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
小編整理發(fā)現(xiàn),深度求索公司旗下的應(yīng)用程序和R1推理模型在農(nóng)歷春節(jié)前夕表現(xiàn)突出,先后登上多地App Store免費(fèi)下載榜質(zhì)優(yōu)價(jià)廉,引發(fā)了全民的關(guān)注和討論。
在農(nóng)歷春節(jié)過后,阿里旗下的通義系列大模型不僅連續(xù)多次在開源領(lǐng)域“屠榜”,還成為了全球最大的開源模型,被開發(fā)者親切地稱為"源神"。
最新消息顯示,3月6日,阿里云發(fā)布了全新推理模型通義千問QwQ-32B,并在當(dāng)天開源。這一模型以更小的參數(shù)在數(shù)學(xué)、代碼和通用能力上與DeepSeek的R1模型相媲美。開源當(dāng)天,通義千問QwQ-32B就登上了全球主流AI開源社區(qū)Hugging Face的趨勢榜。與此同時(shí),阿里云旗下視覺基座大模型萬相2.1(Wan2.1)在發(fā)布和開源后僅僅六天,就登上了Hugging Face趨勢榜和模型空間榜兩個(gè)榜單,成為全球開源社區(qū)最受歡迎的模型之一。
(千問QwQ-32B開源當(dāng)日即登頂Hugging Face趨勢榜,第四位為阿里旗下萬相2.1視覺模型。圖源:Hugging Face社區(qū)截圖)
這一成就意味著,在全球前三的AI開源公司中,中國(杭州)已占據(jù)兩席。
從政策層面來看,人工智能正逐漸進(jìn)入國家發(fā)展的重要視野。從2017年首次寫入政府工作報(bào)告,到2025年全國兩會,人工智能已連續(xù)7次被提及,且每次表述都更加具體化。這一系列變化凸顯了國家對新一代人工智能發(fā)展高度重視的同時(shí),也反映出中國企業(yè)在人工智能領(lǐng)域快速崛起所帶來的強(qiáng)大創(chuàng)新支撐力。
深度求索公司憑借其開源性、性價(jià)比和降低算力依賴等優(yōu)勢,成為近期最耀眼的明星。但單靠一己之力難以成林,要堅(jiān)定中國人工智能發(fā)展的長期信心,就必須有更多持續(xù)性的、全場景的突破。而自2023年8月起,阿里持續(xù)堅(jiān)持開源路線,累計(jì)開源超200款全尺寸、全模態(tài)模型的通義系列模型,似乎在近期給出了最好的答案。
今年2月,《南華早報(bào)》報(bào)道稱,通過開源,阿里巴巴的通義千問系列模型使斯坦福、伯克利等高校能夠以低成本復(fù)刻DeepSeek的技術(shù)。文章指出,阿里巴巴模型的能力再次證明,中國正在縮小與美國領(lǐng)先企業(yè)的人工智能差距,而基于阿里千問開源開放的路線,研究人員越來越多地利用阿里巴巴的技術(shù)來降低AI訓(xùn)練成本。
那么,為什么DeepSeek和通義系列模型會成為交相輝映的開源"雙子星"?開源又為什么成為中國AI破局的必然選擇?
中國開源"雙雄"
硅谷的AI競賽劇本已寫就,勝利結(jié)局早已確定:
封閉式研發(fā)模式限制了技術(shù)的擴(kuò)散;
算力技術(shù)(Scaling Law)的提升抬高了追趕的壁壘;
壟斷帶來的高利潤;
這是一場以科技和地緣政治為武器的權(quán)力游戲。
在芯片被美公司卡脖子的情況下,中國的AI企業(yè)所使用的圖形處理器與美國存在兩代技術(shù)差距。如果繼續(xù)沿用“大模型等于大算力”的發(fā)展道路,那么中國始終在被動追趕。
相反,中國的企業(yè)們選擇了開放、分布式、信息平等的生態(tài)發(fā)展路徑。前谷歌首席執(zhí)行官埃里克·施密特曾評論稱,DeepSeek的發(fā)布標(biāo)志著全球AI競賽邁入新的歷史階段。
在公眾最認(rèn)可的"破圈"原因中,訓(xùn)練成本低、性能相對優(yōu)秀且開源使用是DeepSeek脫穎而出的主要因素。具體而言,DeepSeek-R1在訓(xùn)練后期采用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有少量標(biāo)注數(shù)據(jù)的情況下,其性能已與OpenAI的GPT-4正式版相當(dāng),但其訓(xùn)練成本僅為GPT-4的1/180。
此外,DeepSeek在應(yīng)用層面采取了全部免費(fèi)的策略,這一做法使其迅速登上多個(gè)App Store免費(fèi)下載榜。在不進(jìn)行任何廣告投放的情況下,僅用時(shí)7天就完成了1億用戶量的積累。盡管ChatGPT官方未公布這一用戶增長的具體時(shí)間,但瑞銀分析師勞埃德·沃姆斯利在研報(bào)中指出,這一時(shí)間大約為兩個(gè)月。
盡管過去一年ChatGPT的用戶數(shù)量仍在增長,但其高昂的定價(jià)策略已將大量潛在用戶排斥在外。據(jù)了解,ChatGPT Pro的月費(fèi)達(dá)到200美元。
值得稱贊的是,DeepSeek-R1模型在開源過程中展現(xiàn)了獨(dú)特優(yōu)勢。該模型采用統(tǒng)一的開源策略,遵循MIT License這一寬松且標(biāo)準(zhǔn)化的開源許可方式,實(shí)現(xiàn)了完全開源,用戶無需申請即可使用,且完全不受商用限制。
在DeepSeek系列模型迅速崛起的同時(shí),通義系列模型以其獨(dú)特的定位迅速崛起,成為杭州AI雙雄中的"寶藏男孩"和"AI界汪峰"。這一創(chuàng)新策略不僅構(gòu)建了開源界的中國生態(tài)系統(tǒng),還直接推翻了開源模型性能受限于閉源模型的先前認(rèn)知。
從時(shí)間線來看,早在2023年7月,阿里云首席技術(shù)官周靖人就在上海世界人工智能大會上堅(jiān)定支持開源路線。次月(2023年8月),通義系列模型中的通義千問模型Qwen-7B正式開源,這標(biāo)志著國內(nèi)企業(yè)首個(gè)大規(guī)模開源大模型產(chǎn)品的出現(xiàn)。此后,騰訊控股、智譜華章、百川智能等企業(yè)紛紛跟進(jìn),相繼開源了多款重量級大模型產(chǎn)品。
在開源數(shù)量方面,阿里已形成從Qwen系列到Qwen系列的完整序列,涵蓋了從0.5B到110B的全尺寸模型,累計(jì)開源超200款。相比之下,DeepSeek的開源模型類型更為豐富,不僅涵蓋Qwen、Qwen1.5、Qwen2、Qwen2.5等系列,還包括語音、視覺、文本等多模態(tài)領(lǐng)域。
從便捷性角度來看,盡管DeepSeek-V3和R3系列模型支持本地部署,但其最大規(guī)模版本DeepSeek-R1需要配備8卡的服務(wù)器,單卡成本高達(dá)數(shù)百萬級別。而阿里最新的QwQ-32B在個(gè)人消費(fèi)級顯卡(如NVIDIA 4090)或蘋果M4 Mac電腦上即可運(yùn)行,同時(shí)在性能上與DeepSeek-R1不相上下,開源當(dāng)天便迅速登頂Hugging Face趨勢榜榜首。
寬松的開源許可和部署條件賦予了開發(fā)者極大的自由度。用戶只需支付少量費(fèi)用即可在高性能AI平臺上本地部署QwQ-32B模型,還可以根據(jù)需求運(yùn)用蒸餾技術(shù)精煉出專門模型,用于司法、教育、醫(yī)療等多樣化場景,甚至可用于商業(yè)用途。
通義系列模型的全尺寸、全模態(tài)、全場景開源戰(zhàn)略得到了多位產(chǎn)學(xué)研界專家的高度認(rèn)可,并被用作基礎(chǔ)模型進(jìn)行深度優(yōu)化和蒸餾工作。
例如,李飛飛團(tuán)隊(duì)基于千問Qwen2.5-32B-Instruct開源模型訓(xùn)練出新模型s1,其推理能力與Open AI的o1模型以及DeepSeek的R1模型在數(shù)學(xué)和編碼能力上表現(xiàn)相當(dāng)。此外,DeepSeek官方曾透露,其已將DeepSeek-R1的推理能力通過蒸餾技術(shù)分解為6個(gè)開源模型,其中4個(gè)基于Qwen-32B模型。伯克利Tiny Zero和上海交大LIMO團(tuán)隊(duì)也在通義系列模型的基礎(chǔ)上進(jìn)一步提升了推理性能。
通義系列模型不僅積極回饋開源社區(qū),還在反哺自身模型進(jìn)化方面發(fā)揮了重要作用。目前,在Hugging Face平臺上,通義系列衍生模型數(shù)量突破10萬,成為全球最大的開源模型之一,持續(xù)領(lǐng)先于美國的Llama等其他開源模型。今年2月,Hugging Face大模型榜單前十名全部來自基于通義系列模型二次開發(fā)的衍生模型。
(Hugging Face大模型榜單前十名為通義系列模型衍生作品。圖:Hugging Face官方截圖)
在傳播路徑上具有特殊優(yōu)勢的通義系列模型,在AI領(lǐng)域掀起了一股特殊旋風(fēng)。這一現(xiàn)象不僅與開源與閉源的爭論密不可分,更折射出整個(gè)AI產(chǎn)業(yè)生態(tài)的深刻變革。
開源的全稱是開放源代碼,是指用戶不僅可以自由使用,更能深入研究和學(xué)習(xí)源代碼。值得注意的是,從Open AI發(fā)布GPT-3開始,后續(xù)的GPT-3.5和o1等模型都采取了閉源策略。這種轉(zhuǎn)變背后,隱藏著多重考量:包括安全性、可控性、以及商業(yè)利益和地緣政治因素等。
值得注意的是,Meta的"開源"策略采用了更為嚴(yán)格的開放許可機(jī)制。與DeepSeek和通義系列模型相比,這一策略在很多方面都更為嚴(yán)格(具體對比見下圖)。
(對比圖:Meta、DeepSeek和通義系列的開源許可對比)
事實(shí)上,開源的力量在于凝聚全球智慧,共同推動技術(shù)創(chuàng)新,并將成果普惠于所有人。中國在制定AI相關(guān)標(biāo)準(zhǔn)時(shí),也充分考慮了技術(shù)擴(kuò)散的可能性。這不得不提到,通義系列模型是支持語言數(shù)量最多的開源模型,在海外收獲了大量第三世界國家的贊賞。
在正在進(jìn)行的全國兩會上,也有不少海外記者在接受"玉淵潭天"采訪時(shí)表示,中國開源的大模型"蒸餾"技術(shù)正在被本國技術(shù)團(tuán)隊(duì)利用。
值得注意的是,中國開源模型的快速迭代速度,迫使全球主要AI企業(yè)加快創(chuàng)新步伐。在農(nóng)歷節(jié)后,這些企業(yè)紛紛推出新模型:Open AI推出了o3-mini,提供免費(fèi)使用;馬斯克推出了"最聰明的AI" Grok3;Anthropic更新了混合推理模型 Claude 3.7 Sonnet。
一位高層曾表示:這表明,開源理念的勝利遠(yuǎn)超想象。
另一名高層則指出:與其說是中國打敗了美國AI,不如說是開源戰(zhàn)勝了閉源。這揭示了一個(gè)深刻的真相。
(關(guān)于阿里新增長曲線的內(nèi)容保持不變)
DeepSeek的出現(xiàn)打破了美國企業(yè)對AI技術(shù)的壟斷,而阿里通義系列模型在開源模型排名中長期位居榜首,這些事實(shí)粉碎了美國科技企業(yè)在技術(shù)封鎖上的 initial想象。
外資對中國科技股的看好可見一斑,阿里巴巴的股價(jià)自1月13日的每股77.35港元起漲,至3月7日的每股145.90港元最高點(diǎn),累計(jì)漲幅超過88.6%。
(自1月13日以來,阿里港股股價(jià)累計(jì)漲幅超過80%。圖|Wind截圖)
此次股價(jià)上漲反映了阿里對"AI+云計(jì)算"戰(zhàn)略布局的價(jià)值重估。
15年前,阿里決定投入云計(jì)算研發(fā),自2018年起開始探索AI大模型。如今,阿里不僅在全球云計(jì)算領(lǐng)域占據(jù)領(lǐng)先地位,且在亞太地區(qū)排名第一。自2月以來,阿里持續(xù)加大對云計(jì)算和AI的投資力度,吳泳銘宣布未來三年將投入超過3800億元,用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施,總規(guī)模超過過去十年的總和。
AI技術(shù)的廣泛應(yīng)用推動了各行各業(yè)的數(shù)字化轉(zhuǎn)型,這也導(dǎo)致了客戶對阿里云產(chǎn)品需求的快速增長。根據(jù)阿里巴巴集團(tuán)2025財(cái)年三季度財(cái)報(bào),季度內(nèi)阿里云收入同比增長超過13%,達(dá)到317.42億元。此外,AI相關(guān)產(chǎn)品收入已連續(xù)六季度保持三位數(shù)增長。阿里云更是國內(nèi)唯一實(shí)現(xiàn)盈利穩(wěn)定的云計(jì)算服務(wù)商。
數(shù)據(jù)顯示,80%的中國科技公司、65%的專精特新"小巨人"企業(yè)和60%的A股上市公司使用阿里云的算力服務(wù),中國一半以上的大型模型公司運(yùn)行在阿里云上。中國石油、國家電網(wǎng)、招商銀行、中華財(cái)險(xiǎn)、杭州地鐵集團(tuán)、魅族、雷鳥等企業(yè)均與阿里展開深度合作,圍繞云計(jì)算和AI應(yīng)用落地展開廣泛合作。蘋果的Apple Intelligence也在中國選擇了與阿里合作,此舉將迅速為阿里補(bǔ)全在C端的AI應(yīng)用布局。
阿里云在全球運(yùn)營86個(gè)可用區(qū),覆蓋28個(gè)地域,是全球領(lǐng)先、亞太地區(qū)排名第一的云計(jì)算服務(wù)提供商,不僅服務(wù)于自身,還服務(wù)于全球500多萬客戶。早在2022年,阿里云就首次提出"Model as a Service(MaaS)"理念,面向AI時(shí)代,全面重構(gòu)了從底層硬件到計(jì)算、存儲、網(wǎng)絡(luò)、數(shù)據(jù)處理、模型訓(xùn)練和推理的全棧技術(shù)架構(gòu)體系。
彭博社曾在2月10日的報(bào)道中指出,
在電商業(yè)務(wù)取得成功后,阿里正在融入中國AI發(fā)展的大潮中,成為產(chǎn)業(yè)升級的重要力量。
隨著實(shí)證AI和普及的快速發(fā)展,千行百業(yè)都在爭相使用AI技術(shù),由此帶來的推理算力需求也將急劇上升,這為阿里云帶來了前所未有的發(fā)展機(jī)遇。
DeepSeek的開源計(jì)劃與阿里云的技術(shù)突破,不僅推動了中國AI產(chǎn)業(yè)的快速發(fā)展,還為行業(yè)帶來了全新的技術(shù)視野。這些創(chuàng)新正在重塑中國經(jīng)濟(jì)的版圖,引領(lǐng)著一場深刻的科技革命。
原創(chuàng)不易,感謝有你!
一起邀請更多人關(guān)注,讓好內(nèi)容被更多人看見。
?智谷趨勢深入洞察中產(chǎn)階級的資本覺醒,為更多人提供財(cái)富增長的機(jī)會。從宏觀經(jīng)濟(jì)到商業(yè)邏輯,從企業(yè)興衰到產(chǎn)業(yè)變遷,智谷趨勢帶您發(fā)現(xiàn)中國最真實(shí)的脈動與趨勢洞見。
夏威夷5區(qū)的隱秘寵物店,如龍8外傳動物獲取方法全解析 沖突升級特朗普憤怒美軍撤離德國,特朗普不滿,美軍1萬或撤離德國!美方切斷后,烏軍立即失去通信,1萬名士兵面臨包圍!波蘭推進(jìn)憲法修正案。 權(quán)藏BOSS機(jī)關(guān)鑰匙,浪人崛起滑翔機(jī)技巧分享:如何獲取滑翔翼 海上物資購買點(diǎn)在游戲中以低價(jià)獲取優(yōu)質(zhì)資源,1. 如龍8外傳戒指材料獲取方法指南2. 如龍8外傳戒指材料獲取途徑解析3. 如龍8外傳戒指制造材料獲取技巧4. 如龍8外傳戒指鍛造材料獲取方法5. 如龍8外傳戒指材料獲取方法合集6. 如龍8外傳戒指材料獲取途徑全解析7. 如龍8外傳戒指材料獲取方法全解析8. 如龍8外傳戒指材料獲取技巧指南9. 如龍8外傳戒指材料獲取方法全解析10. 如龍8外傳戒指材料獲取途徑全解析 清腐蟲捕獲指南生物尸體旁捕獲難度低,怪物獵人荒野清腐蟲收集方法全攻略清腐蟲在荒野大 notes中的收集技巧 鬼谷八荒幕客技能重戀與疊峰神秘技能背后的強(qiáng)力加成,《鬼谷八荒》幕客技能介紹 活力//(三亞鳳凰國際機(jī)場),239.15萬!三亞鳳凰機(jī)場2月旅客吞吐量再創(chuàng)新高 在如龍8外傳中尋找夏威夷的寶箱,如龍8外傳套裝獲取方法大合集 痔瘡與直腸癌輕松辨別,“健康公開課:痔瘡做腸鏡會很疼嗎?” 俄羅斯軍隊(duì)推進(jìn)庫爾斯克州邊界俄烏沖突即將升級,俄軍隊(duì)美烏會晤前突襲庫爾克斯,管道突襲奪回3個(gè)關(guān)鍵 Settlements(解釋:改寫后的標(biāo)題:1. 保留了核心信息:俄羅斯軍隊(duì)在美烏會晤前突襲庫爾克斯2. 使用"管道突襲"這一專業(yè)術(shù)語,保持專業(yè)性3. "奪回3個(gè)關(guān)鍵 Settlements"比"奪回3個(gè)村莊"更簡潔專業(yè)4. 通過調(diào)整語序,使標(biāo)題更加流暢和易讀5. 刪除了不必要的細(xì)節(jié),使標(biāo)題更加緊湊)