国产亚洲欧美在线观看精品,а√天堂中文在线资源bt种子,国产亚洲精品自在线亚洲页码,日本一区二区不卡高清久久久

站長之家 - 業(yè)界 2025-03-12 03:39:07

蒸餾雙刃劍,AI公司集體借鑒開源模型,"小模型"時(shí)代或迎低價(jià)競爭?

聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。

3月10日,據(jù)最新消息,如今開發(fā)人工智能技術(shù)的成本已降至歷史新低。這一更低廉的開發(fā)技術(shù)讓開發(fā)者倍感振奮,然而,隨著開發(fā)成本降至最低點(diǎn),大科技公司對基礎(chǔ)模型的巨額投資,必須找到合理的解釋。

3月10日,據(jù)最新消息,如今開發(fā)人工智能技術(shù)的成本已降至歷史新低。這一更低廉的開發(fā)技術(shù)讓開發(fā)者倍感振奮,然而,隨著開發(fā)成本降至最低點(diǎn),大科技公司對基礎(chǔ)模型的巨額投資,必須找到合理的解釋。

隨著大語言模型研發(fā)成本的持續(xù)下降,打造一家人工智能公司所需的費(fèi)用正以每日遞減的速度下降。

人工智能算力成本持續(xù)下降,此外,"模型蒸餾技術(shù)"這種以極低成本訓(xùn)練出優(yōu)質(zhì)大模型的技術(shù)正在不斷普及。這項(xiàng)廉價(jià)開發(fā)技術(shù)令A(yù)I開發(fā)者歡欣鼓舞,但這并非全然利好,也讓一些企業(yè)感到寒意。這項(xiàng)歷史悠久的技術(shù)正被賦予新價(jià)值:對多數(shù)人來說,這項(xiàng)技術(shù)是福音;對特定群體而言,這項(xiàng)技術(shù)意味著復(fù)雜挑戰(zhàn);而對于人工智能的未來發(fā)展而言,這項(xiàng)技術(shù)意義深遠(yuǎn)。

蒸餾技術(shù)解構(gòu)

開發(fā)人員和專家普遍認(rèn)為,蒸餾技術(shù)的本質(zhì)在于運(yùn)用一個(gè)模型提升另一個(gè)模型的能力。具體而言,就是讓一個(gè)較大的"教師"模型生成應(yīng)答與推理路徑,再讓一個(gè)較小的"學(xué)生"模型模仿其行為模式。

據(jù)傳,中國公司DeepSeek(深度求索)以約500萬美元的成本訓(xùn)練出的模型,已達(dá)到與OpenAI抗衡的程度。這一消息在業(yè)內(nèi)引起了軒然大波。然而,該消息引發(fā)市場對芯片需求下降的擔(dān)憂,導(dǎo)致英偉達(dá)市值下跌了6000億美元。盡管這一預(yù)測尚未成真,但該消息仍對市場產(chǎn)生了顯著影響。

今年1月,加州大學(xué)伯克利分校的研究團(tuán)隊(duì)發(fā)布了一項(xiàng)研究,表明他們僅以不到1000美元的算力成本就訓(xùn)練出兩個(gè)新模型。今年2月,斯坦福大學(xué)、華盛頓大學(xué)以及艾倫人工智能研究所的研究團(tuán)隊(duì)更進(jìn)一步,只用更低成本就訓(xùn)練出一個(gè)可用的推理模型。

這些突破都得益于蒸餾技術(shù)。

這項(xiàng)技術(shù)通常會(huì)搭配微調(diào)技術(shù)(fine-tuning),能以遠(yuǎn)低于其他方法的成本在訓(xùn)練階段提升模型性能。開發(fā)人員常用這兩種技術(shù)賦予模型特定的專業(yè)知識或技能。例如,可以將Meta開發(fā)的通用基礎(chǔ)模型蒸餾成精通美國稅法的專家系統(tǒng);或者利用DeepSeek的R1推理模型對Llama進(jìn)行蒸餾,從而增強(qiáng)后者的推理能力,讓Llama在生成答案需要更長時(shí)間時(shí),能逐步展示推理過程。

美國知名半導(dǎo)體分析機(jī)構(gòu)SemiAnalysis的分析師在今年1月份發(fā)布的報(bào)告中指出:“R1模型中最引人注目的部分,可能就在于通過推理模型的輸出對一些非推理小模型進(jìn)行微調(diào),從而使這些模型具備推理能力?!?/p>

雖然價(jià)格低廉,但DeepSeek還將其R1推理模型作為教師,發(fā)布了其他開源模型的蒸餾版本。值得注意的是,DeepSeek的全尺寸模型以及Llama的最大規(guī)模模型過于龐大,只有特定硬件才能支持其運(yùn)行。而蒸餾技術(shù)也有助于解決這一問題。圖靈資本合伙人薩米爾·庫馬爾表示:“經(jīng)過蒸餾的模型體積更小、參數(shù)更少、內(nèi)存占用更低,甚至可以在手機(jī)或邊緣設(shè)備上運(yùn)行。”

DeepSeek的突破性在于,經(jīng)過蒸餾的模型性能并未因規(guī)??s減而下降,反而有所提升。

蒸餾技術(shù)雖非新生事物,卻已悄然蛻變。

蒸餾技術(shù)最早出現(xiàn)在2015年,源于谷歌人工智能元老杰夫·迪恩、杰弗里·辛頓以及谷歌DeepMind研究副總裁奧里奧爾·維尼亞爾斯共同撰寫的一篇論文。維尼亞爾斯近期透露,該論文曾被NeurIPS頂會(huì)拒稿,理由是該技術(shù)“對領(lǐng)域影響有限”。十年后,蒸餾技術(shù)卻突然成為AI討論的核心議題。與過去相比,如今蒸餾技術(shù)的威力提升源于可用作教師模型的開源模型在數(shù)量與質(zhì)量上的飛躍。IBM LLM Granite技術(shù)管理總監(jiān)凱特·索爾在播客中表示:“DeepSeek通過MIT許可開源迄今最強(qiáng)大的模型,實(shí)質(zhì)上正在侵蝕各大廠商守護(hù)核心模型的緊閉大門。”

蒸餾技術(shù)的應(yīng)用邊界索爾提到,互聯(lián)網(wǎng)開源模型庫Hugging Face平臺上充斥著諸如Meta Llama和阿里巴巴Qwen等傳統(tǒng)模型的蒸餾版本。實(shí)際上,Hugging Face存儲(chǔ)的約150萬個(gè)模型中,有3萬個(gè)名稱中帶有“distill”字樣,這通常表明它們經(jīng)過了蒸餾。但目前尚無蒸餾模型進(jìn)入Hugging Face的榜單前列。正如實(shí)體店里的一元店,蒸餾技術(shù)雖具頂尖性價(jià)比,但可選范圍有限且存在缺陷:專精某項(xiàng)任務(wù)的蒸餾模型在其他領(lǐng)域的表現(xiàn)可能會(huì)弱化。

蘋果公司研究人員曾嘗試構(gòu)建“蒸餾擴(kuò)展定律”,通過教師模型的規(guī)模、目標(biāo)模型規(guī)模和算力投入等參數(shù)預(yù)測蒸餾效果。他們發(fā)現(xiàn),在特定條件下,當(dāng)使用高質(zhì)量的教師模型時(shí),蒸餾效果優(yōu)于傳統(tǒng)的監(jiān)督學(xué)習(xí),但當(dāng)教師模型過大時(shí),性能提升將停滯。

盡管如此,這一技術(shù)仍有助于縮短從概念到原型的距離,普遍降低人工智能創(chuàng)業(yè)門檻。但多位人工智能專家強(qiáng)調(diào),這種捷徑并不否定昂貴基礎(chǔ)模型的必要性,但卻是動(dòng)搖了大模型廠商的盈利前景。

基礎(chǔ)模型還有出路嗎?英偉達(dá)首席執(zhí)行官黃仁勛在公司最新財(cái)報(bào)發(fā)布后接受采訪時(shí)表示:“如今全球幾乎所有AI開發(fā)者都在使用DeepSeek的R1來蒸餾新模型?!闭麴s技術(shù)帶來了機(jī)遇,但對OpenAI和Anthropic等公司耗巨資開發(fā)的專有大模型構(gòu)成了威脅,有可能遭到對抗。云平臺Hyperbolic聯(lián)合創(chuàng)始人張杰表示:“我認(rèn)為基礎(chǔ)模型將會(huì)越來越趨于同質(zhì)化。預(yù)訓(xùn)練模型的能力存在天花板,我們正逼近這個(gè)極限?!睆埥苷J(rèn)為,大語言模型巨頭的出路在于打造受歡迎的產(chǎn)品而非模型本身,這或許解釋了Meta選擇部分開源Llama模型的戰(zhàn)略考量。

此外,基礎(chǔ)模型公司還可以采用更激進(jìn)的策略。匿名谷歌DeepMind研究員表示,具備推理能力的模型可以通過隱藏推理步驟或“痕跡”來防止被蒸餾。雖然OpenAI在大型o1推理模型中隱藏了完整的推理路徑,但新發(fā)布的o3-mini版本則展示了這些信息。特朗普政府人工智能政策顧問戴維·薩克斯今年1月份接受采訪時(shí)說:“未來幾個(gè)月,頭部人工智能公司將圍剿蒸餾技術(shù)。”

不過,在開源AI的"狂野西部",要遏制技術(shù)擴(kuò)散談何容易?IBM的LLM Granite的索爾直言:Hugging Face平臺充斥著大量未經(jīng)許可的格式化訓(xùn)練數(shù)據(jù)集,這早已成為公開的秘密。

Anthropic和OpenAI均未對此作出回應(yīng)或置評。(辰辰)

俄羅斯庫爾斯克州別拉亞鎮(zhèn)購物中心遭烏克蘭炮擊,俄羅斯一購物中心遭炮擊致4人死亡 真相再反轉(zhuǎn)金秀賢竟然這樣做狗血戀愛真相,金秀賢與金賽綸事件引韓國網(wǎng)叫停 平民陣容搭配,《蒼霧世界》平民討伐專家陣容推薦 雙持武器的秘密 高射速與靈活操作 戰(zhàn)斗中的制勝法寶 多樣性能完美融合,《星際戰(zhàn)甲》雙持武器介紹 雷電套組飛行搭配技巧,怪物獵人荒野走地流操蟲棍配裝攻略 拉面搭配,《開羅拉面店》面條和湯水搭配大全 畫質(zhì)尚可低配置流暢,Maliki Poison Of The Past游戲配置要求全解析 得分手與防守家,《美職籃全明星》肯揚(yáng)馬丁玩法介紹 王寶樂技能全解析,《三千幻世》王寶樂技能玩法攻略 《撲貓時(shí)刻》有趣聯(lián)機(jī)Windows 10最低配置,Time to Morp游戲配置要求
     
顧文杰

顧文杰

大?。?em>99mb更新:2025-03-12 03:39:07

類別:系統(tǒng):Android

立即下載(42.54MB)
  • 顧文杰
  • 顧文杰
  • 顧文杰

游戲特色

術(shù)士們開始激蕩道息,給所有武器附著術(shù)法。于宏無償給出的三種特攻符箓被修改成陣法,在大量術(shù)士的聯(lián)手激活下,將整個(gè)災(zāi)害長城黑色墻體,鍍上一片瑩白陣紋。

此時(shí)后方的術(shù)士們才陸陸續(xù)續(xù)趕到,紛紛越過災(zāi)害長城,停下休息。有的直接不打算停,往更遠(yuǎn)處想跑,被于宏以靈光秘術(shù)按住。

他親自站在后方一座導(dǎo)彈發(fā)射井邊上。此時(shí)駐扎這里的軍方司令快步趕至,走到他身邊?!罢崦酥?,怎么回事!?不是說最后一扇萬靈之門馬上就要關(guān)閉了么!?為什么還會(huì)搞出這么大陣仗!?”

“你在質(zhì)問我么???”于宏反問,目光看向?qū)Ψ?。司令是個(gè)留著小胡子的中年光頭男子,被眼神一逼渾身一僵,但還是硬頂著壓力和于宏對視。

“超自然方面是你們和災(zāi)害對策部在負(fù)責(zé)!我不問你問誰?。恐澳銈兣闹乜诤臀艺f,馬上就能完結(jié)一切!現(xiàn)在到底是怎么回事?。繛槭裁匆醋罡呔浒粹o???全鶴真君人呢!?”

“真君.”于宏咬牙,回想起那漫天的萬靈之門,幾乎說不出話。司令見狀,瞬間心頭一涼,明白情況不妙。雖然他并非術(shù)士,但對全鶴在術(shù)士圈中的實(shí)力高度,還是有所了解。

可現(xiàn)在,這位當(dāng)世最強(qiáng)術(shù)士.居然也.“來了!”于宏忽地扭頭,看向紫和宮方向。那里再度涌出的灰霧中,無窮的金色浪潮,一下沖出,朝著災(zāi)害長城轟然沖來。

這一幕夸張的數(shù)量,讓早已戒備等候的軍隊(duì)和術(shù)士們都驚呆了。但下一刻,所有人立馬開始了轟炸。密密麻麻的炮擊聲同時(shí)化為一聲響,震的地面一抖。

數(shù)以千計(jì)的炮彈以數(shù)倍音速速度,轟然落入金色浪潮中。轟轟轟!!爆炸,火焰,源源不斷阻擋著浪潮的靠近。于宏一躍跳進(jìn)導(dǎo)彈井,落在導(dǎo)彈頂部,渾身靈光往上不要錢般的附著。

對于無生命物體,靈光只能短暫附著一陣。所以他只能第一時(shí)間跑到這里來。一旁司令見狀,二話不說,拿出對講機(jī)下令點(diǎn)火。

游戲亮點(diǎn)

再配上史萊克學(xué)院留在避難所中的資源,他們每個(gè)人都進(jìn)步神速想,現(xiàn)在已經(jīng)是魂圣了。他們這第一批前來魔鬼島的人中,就沒有一個(gè)是七環(huán)以下的。

十名七環(huán)魂圣加上二字斗鎧,配上舞長空這個(gè)封號斗羅加三字斗鎧師,他們這個(gè)小隊(duì)不管放到哪里,絕對都是一股不容忽視的力量。

“果然有問題?!彪S著潛艇的不斷深入,舞長空的眉頭緊鎖,太安靜了!沒錯(cuò),太過安靜了。按照他以往的經(jīng)歷來說,這魔鬼島的外圍海域應(yīng)該聚集著大量?;戢F才對。

那些?;戢F雖然因?yàn)闅缒芰康挠绊懀桓铱拷Ч韻u,但也應(yīng)該盤旋在島嶼之外,靜等生命能量的爆發(fā)才對。可是,此刻隨著他們潛艇的前進(jìn),海面上,居然連一只高階海魂獸的影子都沒有看到,這顯然很有問題。

游戲玩法

一手拿著玉盒,一手輕輕撫了撫,左東閣眼眸深處閃過一抹復(fù)雜目光:“行了,你的心意我已經(jīng)收了,你回赤焰峰吧,巧蓮和文月她們肯定念叨著你呢?!?/p>

“弟子劍陣都幫您啟動(dòng)了,您不先打開看一下嗎?”左東閣很無奈地看了夏道明一眼。最得意的弟子,特意從涅焱古荒墟帶回來的禮物,他當(dāng)然想打開看一看是什么禮物。

而且這小子還特意啟動(dòng)了劍陣,顯然禮物絕對不簡單。左東閣表面上一副不在乎的樣子,其實(shí)內(nèi)心要緊好奇得很,也很感動(dòng)。

評測

聚賢林探索,《大江湖之蒼龍與白鳥》聚賢林任務(wù)攻略

突破創(chuàng)新引領(lǐng)全球可穿戴設(shè)備市場增長,華為智能穿戴五載輝煌稱霸中國智能穿戴市場

稀有植物大觀龍都黃昏緋紅森林早晨銻巖黃昏荒野豐收季,怪物獵人荒野稀有特產(chǎn)獲取位置及出現(xiàn)時(shí)間推薦

煉金書房,《元尊》庭院玩法匯總

天塹沙原營地探索路線,《怪物獵人:世界》冬龍夏草刷取位置在哪?

顯示全部

熱門推薦
玩家評論
我要跟貼
取消
最新手游