日本黄色视频一区二区三区,国产精品2020观看久久,亚洲第一天堂国产丝袜熟女

聲明:本文來(lái)自于（ID:ykqsd.com）授權(quán)轉(zhuǎn)載發(fā)布。

3月10日，最近消息顯示，如今開(kāi)發(fā)人工智能的成本正降至歷史新低。盡管更經(jīng)濟(jì)的人工智能開(kāi)發(fā)技術(shù)讓開(kāi)發(fā)者感到欣喜，但這一趨勢(shì)并非全是利好消息。隨著開(kāi)發(fā)成本降至最低點(diǎn)，大科技公司對(duì)基礎(chǔ)模型的高昂投資需要有合理的解釋。

以下為翻譯內(nèi)容：

打造一家人工智能公司究竟要花多少錢(qián)？隨著大語(yǔ)言模型的研發(fā)成本越來(lái)越低，這個(gè)數(shù)字每天都在下降。

人工智能算力成本持續(xù)下降，此外，一種極低成本訓(xùn)練出優(yōu)質(zhì)大模型的“模型蒸餾技術(shù)”在不斷普及。新型廉價(jià)開(kāi)發(fā)技術(shù)令A(yù)I開(kāi)發(fā)者歡欣鼓舞，但這并非全然利好，也讓一些企業(yè)感到寒意。這項(xiàng)歷史悠久的技術(shù)正被賦予新價(jià)值：對(duì)多數(shù)人是福音，對(duì)特定群體意味著復(fù)雜挑戰(zhàn)，而對(duì)AI未來(lái)則意義深遠(yuǎn)。

蒸餾技術(shù)解構(gòu)

人工智能開(kāi)發(fā)者和專(zhuān)家表示，蒸餾技術(shù)的本質(zhì)在于運(yùn)用一個(gè)模型提升另一個(gè)模型。讓一個(gè)較大的“教師”模型生成應(yīng)答與推理路徑，再讓一個(gè)較小的“學(xué)生”模型模仿其行為模式。

據(jù)傳中國(guó)公司DeepSeek（深度求索）以約500萬(wàn)美元成本訓(xùn)練出與OpenAI compete的模型，在業(yè)界引起軒然大波。該消息引發(fā)股市恐慌，因擔(dān)憂芯片需求下降，英偉達(dá)市值慘跌6000億美元（但此預(yù)測(cè)尚未成真）。

加州大學(xué)伯克利分校的研究團(tuán)隊(duì)則在今年1月份發(fā)布研究，表明他們用不到1000美元的算力成本就訓(xùn)練出兩個(gè)新模型。今年2月份，斯坦福大學(xué)、華盛頓大學(xué)以及艾倫人工智能研究所的研究人員更進(jìn)一步，只用更低成本就訓(xùn)練出一個(gè)可用的推理模型。

這些突破都得益于蒸餾技術(shù)。

這項(xiàng)技術(shù)通常會(huì)搭配微調(diào)技術(shù)（fine-tuning），能以遠(yuǎn)低于其他方法的成本在訓(xùn)練階段提升模型性能。開(kāi)發(fā)者常用這兩種技術(shù)賦予模型特定的專(zhuān)業(yè)知識(shí)或技能。例如，可以將Meta開(kāi)發(fā)的通用基礎(chǔ)模型蒸餾成精通美國(guó)稅法的專(zhuān)家系統(tǒng)；或者利用DeepSeek的R1推理模型對(duì)Llama進(jìn)行蒸餾，從而增強(qiáng)后者的推理能力，讓Llama在生成答案需要更長(zhǎng)時(shí)間時(shí)，能逐步展示推理過(guò)程。

SemiAnalysis的分析師在今年1月份的報(bào)告中指出，R1模型中最引人注目的部分，可能在于通過(guò)推理引擎的輸出對(duì)小型模型進(jìn)行微調(diào)訓(xùn)練，使其具備推理能力。

除了價(jià)格低廉外，DeepSeek還以R1推理引擎為核心，推出其他開(kāi)源模型的壓縮版本。盡管DeepSeek的全尺寸模型和Llama的最大規(guī)模模型過(guò)于龐大，僅能通過(guò)高性能硬件進(jìn)行運(yùn)行，但蒸餾技術(shù)為解決這一問(wèn)題提供了新的思路。圖靈資本合伙人薩米爾·庫(kù)馬爾表示，經(jīng)過(guò)蒸餾處理的模型不僅體積更小、參數(shù)更少，而且內(nèi)存占用也大幅降低，甚至可以在移動(dòng)設(shè)備或邊緣設(shè)備上運(yùn)行。

DeepSeek的突破性創(chuàng)新在于，經(jīng)過(guò)蒸餾處理后的模型性能并未因規(guī)?？s減而下降，反而有所提升。

蒸餾技術(shù)雖非新興概念，卻已悄然發(fā)展為一項(xiàng)重要技術(shù)。

蒸餾技術(shù)最早源于2015年，由谷歌人工智能先驅(qū)杰夫·迪恩、杰弗里·辛頓以及谷歌DeepMind研究副總裁奧里奧爾·維尼亞爾斯共同撰寫(xiě)的一篇論文中提出。維尼亞爾斯最近透露，該論文曾因技術(shù)影響力有限而被NeurIPS頂級(jí)會(huì)議拒稿。然而，隨著時(shí)間的推移，蒸餾技術(shù)已成為AI領(lǐng)域的核心議題。與過(guò)去相比，如今蒸餾技術(shù)的威力顯著提升，主要得益于可用作教師模型的開(kāi)源模型數(shù)量和質(zhì)量的大幅增加。IBM LLM Granite技術(shù)總監(jiān)凱特·索爾表示，DeepSeek通過(guò)MIT許可開(kāi)源的最強(qiáng)大模型，實(shí)質(zhì)上正在侵蝕各大公司守護(hù)核心模型的緊閉大門(mén)。

蒸餾技術(shù)的應(yīng)用邊界在索爾的討論中得到了進(jìn)一步闡述。在Hugging Face平臺(tái)上，充斥著諸如Meta Llama和阿里巴巴Qwen等傳統(tǒng)模型的蒸餾版本。實(shí)際上，Hugging Face平臺(tái)上存儲(chǔ)的約150萬(wàn)個(gè)模型中，有3萬(wàn)個(gè)名稱(chēng)中帶有“distill”字樣，這通常表明它們經(jīng)過(guò)了蒸餾處理。然而，目前并未有蒸餾模型進(jìn)入Hugging Face的熱門(mén)榜單。正如實(shí)體商店中的一元店，蒸餾技術(shù)具有頂尖的性?xún)r(jià)比，但其可選范圍有限且存在缺陷：專(zhuān)精某項(xiàng)任務(wù)的蒸餾模型在其他領(lǐng)域的表現(xiàn)可能會(huì)弱化。

蘋(píng)果公司的研究人員曾嘗試建立“蒸餾擴(kuò)展模型”，通過(guò)教師模型的規(guī)模、目標(biāo)模型規(guī)模和算力投入等參數(shù)預(yù)測(cè)蒸餾效果。他們發(fā)現(xiàn)，在特定條件下，當(dāng)使用高質(zhì)量的教師模型時(shí)，蒸餾效果優(yōu)于傳統(tǒng)的監(jiān)督式學(xué)習(xí)，但當(dāng)教師模型過(guò)大時(shí)，性能提升將停滯。

盡管如此，這一技術(shù)仍有助于縮短從概念到原型開(kāi)發(fā)的距離，普遍降低人工智能創(chuàng)業(yè)門(mén)檻。然而，多位人工智能專(zhuān)家強(qiáng)調(diào)，這種捷徑并不否定開(kāi)發(fā)昂貴基礎(chǔ)模型的必要性，但卻是大模型廠商盈利前景的動(dòng)搖因素。

基礎(chǔ)模型的未來(lái)出路何在？英偉達(dá)首席執(zhí)行官黃仁勛在最新財(cái)報(bào)發(fā)布后的采訪中表示，如今全球幾乎所有AI開(kāi)發(fā)者都在使用DeepSeek的R1模型來(lái)進(jìn)行蒸餾。蒸餾技術(shù)帶來(lái)的機(jī)遇不容忽視，但對(duì)OpenAI和Anthropic等公司耗巨資開(kāi)發(fā)的專(zhuān)有大模型構(gòu)成了威脅，甚至可能引發(fā)對(duì)抗。云平臺(tái)Hyperbolic聯(lián)合創(chuàng)始人張杰表示，他認(rèn)為基礎(chǔ)模型將越來(lái)越趨同化。預(yù)訓(xùn)練模型的能力存在上限，我們正逼近這一極限。張杰還認(rèn)為，大語(yǔ)言模型巨頭的未來(lái)發(fā)展應(yīng)聚焦于打造受歡迎的產(chǎn)品而非模型本身，這或許解釋了Meta選擇部分開(kāi)源Llama模型的戰(zhàn)略考量。

此外，基礎(chǔ)模型公司還可以采取更為激進(jìn)的策略。匿名的谷歌DeepMind研究員表示，具備推理能力的模型可以通過(guò)隱藏推理步驟或“痕跡”來(lái)防止被蒸餾。雖然OpenAI在大型o1推理引擎中隱藏了完整的推理路徑，但新發(fā)布的o3-mini版本則展示了這些信息。特朗普政府人工智能政策顧問(wèn)戴維·薩克斯在今年1月份的一次采訪中表示，“未來(lái)幾個(gè)月，頭部人工智能公司將加大對(duì)蒸餾技術(shù)的圍剿力度。”

不管怎樣，在開(kāi)源人工智能領(lǐng)域這個(gè)充滿(mǎn)活力的"西部 Wild West"，想要通過(guò)限制蒸餾技術(shù)來(lái)遏制技術(shù)擴(kuò)散，這可并非易事。IBM的 Granite 指出，Hugging Face 平臺(tái)實(shí)際上已經(jīng)積累了大量未經(jīng)許可的、經(jīng)過(guò)格式化處理的 GPT 模型訓(xùn)練數(shù)據(jù)集，這早已成為公開(kāi)的秘密。

而 Anthropic 和 OpenAI 對(duì)此均未置評(píng)。（辰辰）

雷之鳴看戲150副本積分全服最全攻略，《夢(mèng)幻西游》雷之鳴看戲副本攻略眼睛放松小技巧，在家教課：記住12個(gè)護(hù)眼小貼士廣東隊(duì)大勝四川關(guān)鍵時(shí)刻，廣東勝四川！外援笑哈哈，小胡關(guān)鍵，徐杰沉著，杜鋒提醒對(duì)手浙江之旅雙影奇境彩蛋藏在哪兒，雙影奇境逃出生天彩蛋位置大公開(kāi)！看這里！深入沙盒模式，雙點(diǎn)博物館沙盒選項(xiàng)有什么作用歸國(guó)青年才俊，北大回應(yīng)"物理學(xué)家劉暢歸國(guó)"：2月已入職，任助理教授玉佩1的位置，如龍8外傳全金珠獲取方法賈勒特阿倫全能中鋒的戰(zhàn)術(shù)分析與選擇建議，《美職籃全明星》賈勒特阿倫玩法介紹 ManuS價(jià)格暴漲，" project failure, when will the next generation project come?" 優(yōu)雅時(shí)光，標(biāo)題改寫(xiě)：日系穿搭成春季必選！4件單品讓你輕松打造精致春季造型，超好看！