国产亚洲欧美在线观看精品,а√天堂中文在线资源bt种子,国产亚洲精品自在线亚洲页码,日本一区二区不卡高清久久久

站長之家 - 業(yè)界 2025-03-10 22:46:29

蒸餾雙刃劍,AI公司集體借鑒開源模型,"小模型"時代或迎低價競爭?

聲明:本文來自于(ID:ykqsd.com)授權轉(zhuǎn)載發(fā)布。

3月10日,據(jù)最新消息,如今開發(fā)人工智能技術的成本已降至歷史新低。這一更低廉的開發(fā)技術讓開發(fā)者倍感振奮,然而,隨著開發(fā)成本降至最低點,大科技公司對基礎模型的巨額投資,必須找到合理的解釋。

3月10日,據(jù)最新消息,如今開發(fā)人工智能技術的成本已降至歷史新低。這一更低廉的開發(fā)技術讓開發(fā)者倍感振奮,然而,隨著開發(fā)成本降至最低點,大科技公司對基礎模型的巨額投資,必須找到合理的解釋。

隨著大語言模型研發(fā)成本的持續(xù)下降,打造一家人工智能公司所需的費用正以每日遞減的速度下降。

人工智能算力成本持續(xù)下降,此外,"模型蒸餾技術"這種以極低成本訓練出優(yōu)質(zhì)大模型的技術正在不斷普及。這項廉價開發(fā)技術令AI開發(fā)者歡欣鼓舞,但這并非全然利好,也讓一些企業(yè)感到寒意。這項歷史悠久的技術正被賦予新價值:對多數(shù)人來說,這項技術是福音;對特定群體而言,這項技術意味著復雜挑戰(zhàn);而對于人工智能的未來發(fā)展而言,這項技術意義深遠。

蒸餾技術解構

開發(fā)人員和專家普遍認為,蒸餾技術的本質(zhì)在于運用一個模型提升另一個模型的能力。具體而言,就是讓一個較大的"教師"模型生成應答與推理路徑,再讓一個較小的"學生"模型模仿其行為模式。

據(jù)傳,中國公司DeepSeek(深度求索)以約500萬美元的成本訓練出的模型,已達到與OpenAI抗衡的程度。這一消息在業(yè)內(nèi)引起了軒然大波。然而,該消息引發(fā)市場對芯片需求下降的擔憂,導致英偉達市值下跌了6000億美元。盡管這一預測尚未成真,但該消息仍對市場產(chǎn)生了顯著影響。

今年1月,加州大學伯克利分校的研究團隊發(fā)布了一項研究,表明他們僅以不到1000美元的算力成本就訓練出兩個新模型。今年2月,斯坦福大學、華盛頓大學以及艾倫人工智能研究所的研究團隊更進一步,只用更低成本就訓練出一個可用的推理模型。

這些突破都得益于蒸餾技術。

這項技術通常會搭配微調(diào)技術(fine-tuning),能以遠低于其他方法的成本在訓練階段提升模型性能。開發(fā)人員常用這兩種技術賦予模型特定的專業(yè)知識或技能。例如,可以將Meta開發(fā)的通用基礎模型蒸餾成精通美國稅法的專家系統(tǒng);或者利用DeepSeek的R1推理模型對Llama進行蒸餾,從而增強后者的推理能力,讓Llama在生成答案需要更長時間時,能逐步展示推理過程。

美國知名半導體分析機構SemiAnalysis的分析師在今年1月份發(fā)布的報告中指出:“R1模型中最引人注目的部分,可能就在于通過推理模型的輸出對一些非推理小模型進行微調(diào),從而使這些模型具備推理能力?!?/p>

雖然價格低廉,但DeepSeek還將其R1推理模型作為教師,發(fā)布了其他開源模型的蒸餾版本。值得注意的是,DeepSeek的全尺寸模型以及Llama的最大規(guī)模模型過于龐大,只有特定硬件才能支持其運行。而蒸餾技術也有助于解決這一問題。圖靈資本合伙人薩米爾·庫馬爾表示:“經(jīng)過蒸餾的模型體積更小、參數(shù)更少、內(nèi)存占用更低,甚至可以在手機或邊緣設備上運行?!?/p>

DeepSeek的突破性在于,經(jīng)過蒸餾的模型性能并未因規(guī)??s減而下降,反而有所提升。

蒸餾技術雖非新生事物,卻已悄然蛻變。

蒸餾技術最早出現(xiàn)在2015年,源于谷歌人工智能元老杰夫·迪恩、杰弗里·辛頓以及谷歌DeepMind研究副總裁奧里奧爾·維尼亞爾斯共同撰寫的一篇論文。維尼亞爾斯近期透露,該論文曾被NeurIPS頂會拒稿,理由是該技術“對領域影響有限”。十年后,蒸餾技術卻突然成為AI討論的核心議題。與過去相比,如今蒸餾技術的威力提升源于可用作教師模型的開源模型在數(shù)量與質(zhì)量上的飛躍。IBM LLM Granite技術管理總監(jiān)凱特·索爾在播客中表示:“DeepSeek通過MIT許可開源迄今最強大的模型,實質(zhì)上正在侵蝕各大廠商守護核心模型的緊閉大門?!?/p>

蒸餾技術的應用邊界索爾提到,互聯(lián)網(wǎng)開源模型庫Hugging Face平臺上充斥著諸如Meta Llama和阿里巴巴Qwen等傳統(tǒng)模型的蒸餾版本。實際上,Hugging Face存儲的約150萬個模型中,有3萬個名稱中帶有“distill”字樣,這通常表明它們經(jīng)過了蒸餾。但目前尚無蒸餾模型進入Hugging Face的榜單前列。正如實體店里的一元店,蒸餾技術雖具頂尖性價比,但可選范圍有限且存在缺陷:專精某項任務的蒸餾模型在其他領域的表現(xiàn)可能會弱化。

蘋果公司研究人員曾嘗試構建“蒸餾擴展定律”,通過教師模型的規(guī)模、目標模型規(guī)模和算力投入等參數(shù)預測蒸餾效果。他們發(fā)現(xiàn),在特定條件下,當使用高質(zhì)量的教師模型時,蒸餾效果優(yōu)于傳統(tǒng)的監(jiān)督學習,但當教師模型過大時,性能提升將停滯。

盡管如此,這一技術仍有助于縮短從概念到原型的距離,普遍降低人工智能創(chuàng)業(yè)門檻。但多位人工智能專家強調(diào),這種捷徑并不否定昂貴基礎模型的必要性,但卻是動搖了大模型廠商的盈利前景。

基礎模型還有出路嗎?英偉達首席執(zhí)行官黃仁勛在公司最新財報發(fā)布后接受采訪時表示:“如今全球幾乎所有AI開發(fā)者都在使用DeepSeek的R1來蒸餾新模型?!闭麴s技術帶來了機遇,但對OpenAI和Anthropic等公司耗巨資開發(fā)的專有大模型構成了威脅,有可能遭到對抗。云平臺Hyperbolic聯(lián)合創(chuàng)始人張杰表示:“我認為基礎模型將會越來越趨于同質(zhì)化。預訓練模型的能力存在天花板,我們正逼近這個極限?!睆埥苷J為,大語言模型巨頭的出路在于打造受歡迎的產(chǎn)品而非模型本身,這或許解釋了Meta選擇部分開源Llama模型的戰(zhàn)略考量。

此外,基礎模型公司還可以采用更激進的策略。匿名谷歌DeepMind研究員表示,具備推理能力的模型可以通過隱藏推理步驟或“痕跡”來防止被蒸餾。雖然OpenAI在大型o1推理模型中隱藏了完整的推理路徑,但新發(fā)布的o3-mini版本則展示了這些信息。特朗普政府人工智能政策顧問戴維·薩克斯今年1月份接受采訪時說:“未來幾個月,頭部人工智能公司將圍剿蒸餾技術。”

不過,在開源AI的"狂野西部",要遏制技術擴散談何容易?IBM的LLM Granite的索爾直言:Hugging Face平臺充斥著大量未經(jīng)許可的格式化訓練數(shù)據(jù)集,這早已成為公開的秘密。

Anthropic和OpenAI均未對此作出回應或置評。(辰辰)

Perfect for Smooth Gameplay on Windows 10,Bugaboo Pocket配置要求解析 逆轉(zhuǎn) Swift,遼寧隊6人得分上雙,趙繼偉23+9,瓊斯獨得42分,遼寧隊以大勝吉林隊。 突破與創(chuàng)新歐洲阿麗亞娜6型火箭的首次商業(yè)發(fā)射,阿麗亞娜6型火箭完成商業(yè)發(fā)射任務或者:商業(yè)發(fā)射任務首次完成 阿麗亞娜6型火箭騰空 對話與探索,湖大校長施一公:AI時代的核心關注點是什么? 喜訊Melody愛情事業(yè)雙豐收參加上海活動播客精神療愈寶庫,Melody事業(yè)愛情雙喜臨門,隨 she 出席上?;顒?,薔薔亦隨之而來 3月2日倫敦會議,澤連斯基已經(jīng)抵達英國 弓箭與龍矢深淵獸黑絲的生存與爆發(fā)之道,怪物獵人荒野弓打黑絲技巧指南打黑絲:荒野弓打法技巧解析 加征關稅引發(fā)的談判,加拿大加稅一天后,特朗普重申加稅條件。外長表示不希望每30天都成為"鬧劇"。 外星生物奪走魔法石騎士與刺客的戰(zhàn)斗,《元氣騎士服務器崩潰后快速恢復鏈接全攻略》 火星探測重大發(fā)現(xiàn),張松山:中國太空探索展現(xiàn)開放與合作精神
     
澳門發(fā)展銀行

澳門發(fā)展銀行

大?。?em>71mb更新:2025-03-10 22:46:29

類別:系統(tǒng):Android

立即下載(42.54MB)
  • 澳門發(fā)展銀行
  • 澳門發(fā)展銀行
  • 澳門發(fā)展銀行

游戲特色

“你在威脅我?”裴劍仙鳳眸睜開,眸光爆發(fā)出森然殺氣。嗆。一道銀白色的劍芒劃破夜空。那仙劍雪霽便是轟然出竅,握于掌中。

“我裴婉妤生平最厭惡別人盛氣凌人的威脅我?!薄皠e說是你,顧二公子?!薄氨闶悄慵曳蛉耍夷切熓?,都不成!”

“是嗎?!鳖櫤宪幪袅颂裘迹骸翱催@架勢,姑娘要跟我斗劍?”“你也敢?”裴婉妤冷蔑道?!皹芬夥钆??!鳖櫤宪幾旖潜3种σ?,緩緩抽出腰間長劍,“若是我贏了姑娘,我只要姑娘一個承諾?!?/p>

“什么承諾?無妨,你若真能勝我手中仙劍,我自當答應?!迸嵬矜ツ抗獾?。“待我四弟好些,永遠不要欺負他。”顧合軒道:“他自小被咱們?nèi)齻€哥哥壓著,一直想要證明自己,這才魯莽行事,險些丟了性命,往后余生,我只望他能好好活著。”

“你這人”裴仙子臉色微變,那冰冷霸絕的劍意,頓時消弭了幾分。“收劍吧,顧二公子,你,真會死的?!薄澳强晌幢亍!鳖櫤宪帗u頭。

裴婉妤搖頭道:“你知道嗎,任何敢在我面前拔劍的人,我都會許給他們一次公平的對決,但無奈的是——他們最后都很快的死在我的劍下?!?/p>

“而你一旦拔劍,我不會再留情?!眴?。話音將落。顧二爺手中那柄仿若千年寒玉打造而成,流光灼灼的白玉道劍,已然出鞘!隨后,一股仿若能碾碎蒼穹,傾覆山海的滅世氣息,轟然而出,震蕩百丈虛空!裴劍仙那冷蔑傲然的鳳眸,陡然一縮,愕然的看向青年身后顯化的劍韻。

這一刻,她終于確定了對方練的是什么劍道?!澳氵@一劍使出,便離死不遠了,你可知道?”裴婉妤咬牙道?!八阅?,裴姑娘要打么?”

“你真是個瘋子。”裴劍仙雙手抱胸,將臉冷冷側(cè)到一邊。顧合軒微笑道:“這算不算姑娘認輸了?”“我”裴劍仙神色郁悶,閉上鳳眸:“你就當是吧,打下去的話,我的確會輸,但你會死?!?/p>

“謝謝姑娘?!鳖櫤宪幨掌痖L劍,雙手抱拳,竟是深深的鞠了一躬:“如此。舍弟便拜托姑娘照拂了?!薄澳銥楹螌λ@么好?”

游戲亮點

座位上,副領隊不禁抱怨道:“他們肯定不想被我們發(fā)現(xiàn)自己的脆弱,所以才這么反應過激!”坎幽離對這種失敗的共鳴并不感興趣,他只是閉上眼睛,微微養(yǎng)神。

而就在此時,他的腦海中,響起了一個聲音。這個聲音的主人,正是之前在迎客峰,喝退了坎幽離的明鏡宗真君,玉輪真君。

“參見真君。”神海中,坎幽離對對方深深鞠了一躬:“請問真君有何囑咐?!薄灸銈儾挥弥彪x開,全都留下來,我都有用】

而玉輪真君也毫不多話,他直截了當?shù)溃骸窘酉聛磉€有其他任務需要你們做,去明鏡宗西側(cè),我在那里設下了一個暗道】

游戲玩法

范佩西裝作嫉妒地道,隨后想起什么,笑著拍胸膛,“有了,我是人民的球王!”“哈哈,切.!”他又引來群嘲,不過本人倒是沒怎么在意,這本來就是整個尬的活躍活躍氣氛。

在一眾歡聲笑語中,眾人之間的距離在飛快地拉近。之后就是固定項目了,他們一行人開著車,前往了馬埃爾所居住的別墅莊園。

這次,當他們緩緩駛?cè)腭R埃爾家門口小公園的小路時,與去年截然不同的場景發(fā)生了?!爸x特?!薄澳氵@么年輕住這?”

評測

俄羅斯軍隊突破庫爾斯克斷供烏軍彈藥燃料,烏克蘭軍方處境急轉(zhuǎn),可能放棄軍事行動

2023年就業(yè)作為民生基石成為經(jīng)濟基礎受到廣泛關注,就業(yè)如何實現(xiàn)?AI是否會引發(fā)大規(guī)模失業(yè)?代表委員的觀點是

震驚細節(jié)真相,金賽綸生前內(nèi)容曝光,控訴金秀賢假辟謠事件發(fā)生,戀愛6年被逼死

2025年國防支出1.81萬億元,解放軍和武警部隊新聞發(fā)言人:2025年國防支出預算達1.81萬億元

西西弗斯式的挑戰(zhàn),北大保安:十年法考終成律師,十年寒窗終有成

顯示全部

熱門推薦
玩家評論
我要跟貼
取消
最新手游