国产亚洲欧美在线观看精品,а√天堂中文在线资源bt种子,国产亚洲精品自在线亚洲页码,日本一区二区不卡高清久久久

站長之家 - 業(yè)界 2025-03-11 06:42:37

AI成本下降,AI行業(yè)數(shù)據(jù)共享引發(fā)關(guān)注:小模型訓練成本大幅下降?

聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。

3月10日,最近消息顯示,如今開發(fā)人工智能的成本正降至歷史新低。盡管更經(jīng)濟的人工智能開發(fā)技術(shù)讓開發(fā)者感到欣喜,但這一趨勢并非全是利好消息。隨著開發(fā)成本降至最低點,大科技公司對基礎(chǔ)模型的高昂投資需要有合理的解釋。

以下為翻譯內(nèi)容:

打造一家人工智能公司究竟要花多少錢?隨著大語言模型的研發(fā)成本越來越低,這個數(shù)字每天都在下降。

人工智能算力成本持續(xù)下降,此外,一種極低成本訓練出優(yōu)質(zhì)大模型的“模型蒸餾技術(shù)”在不斷普及。新型廉價開發(fā)技術(shù)令AI開發(fā)者歡欣鼓舞,但這并非全然利好,也讓一些企業(yè)感到寒意。這項歷史悠久的技術(shù)正被賦予新價值:對多數(shù)人是福音,對特定群體意味著復雜挑戰(zhàn),而對AI未來則意義深遠。

蒸餾技術(shù)解構(gòu)

人工智能開發(fā)者和專家表示,蒸餾技術(shù)的本質(zhì)在于運用一個模型提升另一個模型。讓一個較大的“教師”模型生成應答與推理路徑,再讓一個較小的“學生”模型模仿其行為模式。

據(jù)傳中國公司DeepSeek(深度求索)以約500萬美元成本訓練出與OpenAI compete的模型,在業(yè)界引起軒然大波。該消息引發(fā)股市恐慌,因擔憂芯片需求下降,英偉達市值慘跌6000億美元(但此預測尚未成真)。

加州大學伯克利分校的研究團隊則在今年1月份發(fā)布研究,表明他們用不到1000美元的算力成本就訓練出兩個新模型。今年2月份,斯坦福大學、華盛頓大學以及艾倫人工智能研究所的研究人員更進一步,只用更低成本就訓練出一個可用的推理模型。

這些突破都得益于蒸餾技術(shù)。

這項技術(shù)通常會搭配微調(diào)技術(shù)(fine-tuning),能以遠低于其他方法的成本在訓練階段提升模型性能。開發(fā)者常用這兩種技術(shù)賦予模型特定的專業(yè)知識或技能。例如,可以將Meta開發(fā)的通用基礎(chǔ)模型蒸餾成精通美國稅法的專家系統(tǒng);或者利用DeepSeek的R1推理模型對Llama進行蒸餾,從而增強后者的推理能力,讓Llama在生成答案需要更長時間時,能逐步展示推理過程。

SemiAnalysis的分析師在今年1月份的報告中指出,R1模型中最引人注目的部分,可能在于通過推理引擎的輸出對小型模型進行微調(diào)訓練,使其具備推理能力。

除了價格低廉外,DeepSeek還以R1推理引擎為核心,推出其他開源模型的壓縮版本。盡管DeepSeek的全尺寸模型和Llama的最大規(guī)模模型過于龐大,僅能通過高性能硬件進行運行,但蒸餾技術(shù)為解決這一問題提供了新的思路。圖靈資本合伙人薩米爾·庫馬爾表示,經(jīng)過蒸餾處理的模型不僅體積更小、參數(shù)更少,而且內(nèi)存占用也大幅降低,甚至可以在移動設(shè)備或邊緣設(shè)備上運行。

DeepSeek的突破性創(chuàng)新在于,經(jīng)過蒸餾處理后的模型性能并未因規(guī)??s減而下降,反而有所提升。

蒸餾技術(shù)雖非新興概念,卻已悄然發(fā)展為一項重要技術(shù)。

蒸餾技術(shù)最早源于2015年,由谷歌人工智能先驅(qū)杰夫·迪恩、杰弗里·辛頓以及谷歌DeepMind研究副總裁奧里奧爾·維尼亞爾斯共同撰寫的一篇論文中提出。維尼亞爾斯最近透露,該論文曾因技術(shù)影響力有限而被NeurIPS頂級會議拒稿。然而,隨著時間的推移,蒸餾技術(shù)已成為AI領(lǐng)域的核心議題。與過去相比,如今蒸餾技術(shù)的威力顯著提升,主要得益于可用作教師模型的開源模型數(shù)量和質(zhì)量的大幅增加。IBM LLM Granite技術(shù)總監(jiān)凱特·索爾表示,DeepSeek通過MIT許可開源的最強大模型,實質(zhì)上正在侵蝕各大公司守護核心模型的緊閉大門。

蒸餾技術(shù)的應用邊界在索爾的討論中得到了進一步闡述。在Hugging Face平臺上,充斥著諸如Meta Llama和阿里巴巴Qwen等傳統(tǒng)模型的蒸餾版本。實際上,Hugging Face平臺上存儲的約150萬個模型中,有3萬個名稱中帶有“distill”字樣,這通常表明它們經(jīng)過了蒸餾處理。然而,目前并未有蒸餾模型進入Hugging Face的熱門榜單。正如實體商店中的一元店,蒸餾技術(shù)具有頂尖的性價比,但其可選范圍有限且存在缺陷:專精某項任務的蒸餾模型在其他領(lǐng)域的表現(xiàn)可能會弱化。

蘋果公司的研究人員曾嘗試建立“蒸餾擴展模型”,通過教師模型的規(guī)模、目標模型規(guī)模和算力投入等參數(shù)預測蒸餾效果。他們發(fā)現(xiàn),在特定條件下,當使用高質(zhì)量的教師模型時,蒸餾效果優(yōu)于傳統(tǒng)的監(jiān)督式學習,但當教師模型過大時,性能提升將停滯。

盡管如此,這一技術(shù)仍有助于縮短從概念到原型開發(fā)的距離,普遍降低人工智能創(chuàng)業(yè)門檻。然而,多位人工智能專家強調(diào),這種捷徑并不否定開發(fā)昂貴基礎(chǔ)模型的必要性,但卻是大模型廠商盈利前景的動搖因素。

基礎(chǔ)模型的未來出路何在?英偉達首席執(zhí)行官黃仁勛在最新財報發(fā)布后的采訪中表示,如今全球幾乎所有AI開發(fā)者都在使用DeepSeek的R1模型來進行蒸餾。蒸餾技術(shù)帶來的機遇不容忽視,但對OpenAI和Anthropic等公司耗巨資開發(fā)的專有大模型構(gòu)成了威脅,甚至可能引發(fā)對抗。云平臺Hyperbolic聯(lián)合創(chuàng)始人張杰表示,他認為基礎(chǔ)模型將越來越趨同化。預訓練模型的能力存在上限,我們正逼近這一極限。張杰還認為,大語言模型巨頭的未來發(fā)展應聚焦于打造受歡迎的產(chǎn)品而非模型本身,這或許解釋了Meta選擇部分開源Llama模型的戰(zhàn)略考量。

此外,基礎(chǔ)模型公司還可以采取更為激進的策略。匿名的谷歌DeepMind研究員表示,具備推理能力的模型可以通過隱藏推理步驟或“痕跡”來防止被蒸餾。雖然OpenAI在大型o1推理引擎中隱藏了完整的推理路徑,但新發(fā)布的o3-mini版本則展示了這些信息。特朗普政府人工智能政策顧問戴維·薩克斯在今年1月份的一次采訪中表示,“未來幾個月,頭部人工智能公司將加大對蒸餾技術(shù)的圍剿力度?!?/p>

不管怎樣,在開源人工智能領(lǐng)域這個充滿活力的"西部 Wild West",想要通過限制蒸餾技術(shù)來遏制技術(shù)擴散,這可并非易事。IBM的 Granite 指出,Hugging Face 平臺實際上已經(jīng)積累了大量未經(jīng)許可的、經(jīng)過格式化處理的 GPT 模型訓練數(shù)據(jù)集,這早已成為公開的秘密。

而 Anthropic 和 OpenAI 對此均未置評。(辰辰)

甜蜜狗 companion,宋慧喬好友相聚,與愛犬Ruby合照,笑容甜蜜很愜意! 韓國抱川市韓軍戰(zhàn)斗機誤炸事件,韓國居民區(qū)被誤投彈藥,兩機導致31死142棟損,操作失誤…… 1033,1139,1072,1176,《逆水寒手游》鏡天閣風景點位置一覽 札幌機場客機撞上狐貍部分乘客改簽航班影響工作安排,日本航空公司客機在札幌緊急迫降,47人受傷未。 快速提升,《全境封鎖2》直升30級方法 大興機場口岸出入境增長,北京大興機場出入境口岸人數(shù)昨日突破百萬。 優(yōu)雅的力量,步履向前是Hermès女郎的自由宣言 4步修腳指南,《非凡的大多數(shù)》修腳步驟攻略 國防預算增長,解放軍武警代表團新聞發(fā)言人指出,2025年國防預算安排1.81萬億元。 高暴擊率行秋畢業(yè)面板搭配分析,《原神》行秋畢業(yè)面板分享
     
楊曉穎

楊曉穎

大?。?em>23mb更新:2025-03-11 06:42:37

類別:系統(tǒng):Android

立即下載(42.54MB)
  • 楊曉穎
  • 楊曉穎
  • 楊曉穎

游戲特色

面前的大海,變了!他呆立在空中,怔怔看著海域。咚咚咚,咚咚咚。悶悶的聲音像是有人在敲鼓。這聲音先是很小,幾乎微不可聞。

后來慢慢變大,變得壓過了海潮聲,壓過了天地間的一切聲響。世間似乎只剩下這咚咚咚的悶響。青云大圣只覺得自己體內(nèi)莫名發(fā)熱,甚至有種想要撕碎胸膛,將五臟六腑拿出來吹吹海風的燥。

但他的心,卻慢慢涼了。海面也涼了。不知什么時候,拍案的海水,慢慢變成了紅色,濃郁,粘稠,有種莫名卻令人毛骨悚然的芳香。

青云大圣玩了命地往后飛。紅色的海面上,日頭忽然落下,一輪月亮,一輪黑色彎月,劃開天際線,躍入天際。黑色的月光,照著紅色大海中,兩個恭敬俯首的背影。

咚咚咚,咚咚咚。悶悶地鼓聲越來越大,那黑色的月光似在收縮。海水如血液一樣,慢慢涌上黑月。心臟!青云大圣這才看明白,這月亮,竟是一顆心臟!隨著海水一點點的涌入,黑色的彎月慢慢圓潤了起來,變成滿月后,猛地收縮又炸開。

一個令他不敢直視的身影,出現(xiàn)在虛空中。天又亮了,海又藍了,一切詭異的景色消失,但青云大圣心中卻更加懼怕,他一轉(zhuǎn)遁光,朝著通明山飛去。

明德首座,救命!……大自在魔祖看了眼千里之外的遁光,并不在意,他自虛空一步步走下,看著跪在地上的兩個人。

兩個人……“其他人呢?”“圣祖,他們回歸血海了?!庇内は尚⌒囊硪淼卮鸬馈4笞栽谀ё鎰幼饕唤?,輕輕閉上眼睛,似在體悟什么,半天才開口道:“都死了?”

“是!”幽冥仙依舊不敢抬頭,連帶著陳亭也將腦袋埋在土里?!拔掖笞栽冢瑑|萬血脈后裔,只剩你們兩人了?”大自在魔祖定睛朝著面前兩人看去,待看到幽冥仙的時候又皺起了眉頭,“你原不是我的血脈?”

“不是!”幽冥仙渾身一抖,像是有些惶恐,解釋道:“我是心慕圣祖大法,轉(zhuǎn)投圣教的?!贝笞栽谀ё娲蛄苛擞内は梢粫?,似乎終于從沉睡中完全清醒,他緩緩點頭道:“我記得你,太上道的……”

游戲亮點

而那些無名無姓的死士宵小就算出手,趙知拙也絕對擋得住。趙知拙的戰(zhàn)力,不會輸給百強武者排名前十的那些頂尖人物,甚至可能更強。

石川雨又道:“你覺得,我是在虛張聲勢?這么大的動靜,你沒發(fā)現(xiàn),到現(xiàn)在城防營都還沒有趕過來。這是長林幫能有的能量?”

李唯一轉(zhuǎn)過頭瞥了他一眼,露出一口緊咬著的雪白牙齒?!瓧钋嘞谝凰彝T阱『又行牡聂眶揪夼炁灅侵鲝d內(nèi),身前的桌案上,撲淺青色的刺繡桌布,繡以百鳥和云紋。

擺放銀質(zhì)精美酒具,珍奇異果,及一盞法器骨燈。一縷縷法氣,從她右手纖細雪白的指尖逸散而出,催動骨燈法器。

游戲玩法

這條路的盡頭,十有八九就是他需要支付的報酬。宋延也不是吃白飯的人,吃了人家飯,肯定會有感情,滴水之恩涌泉相報也沒問題,只是.若是要以命相報,那就不行了。

報酬需要怎么支付,他不清楚。所以,這條路,他不走!雖然不走,可他等的時機卻已成熟。盡管只是成熟,而非完美,可已經(jīng)是時候了。

他已經(jīng)坐到老祖身邊,被老祖寄予重望。那.是時候?qū)δ鍪至?。魔僧和他不同。這些年,他是在修行,魔僧則一直在搞事。

評測

《爆梗找茬王》生僻字正確買到想要的菜攻略,《爆梗找茬王:生僻字通向美味的通關(guān)指南》

意甲 3月11日,拉齊奧對陣烏迪內(nèi)斯:羅馬尼奧利、貢多齊頂替,托萬、洛倫佐-盧卡上場

特斯拉股價連續(xù)下跌日本市場供應中斷,特斯拉Model S/X日本暫停交付,全球市場表現(xiàn)不佳

3月11日焦點對決,西班牙人vs赫羅納:普阿多、庫穆布拉及阿圖爾、布林德出戰(zhàn)

深度解析,蘆哲:貸款新增額環(huán)比下降,1-2月同比持平

顯示全部

熱門推薦
玩家評論
我要跟貼
取消
最新手游