国产亚洲欧美在线观看精品,а√天堂中文在线资源bt种子,国产亚洲精品自在线亚洲页码,日本一区二区不卡高清久久久

站長之家 - 業(yè)界 2025-03-11 08:46:44

AI成本下降,AI行業(yè)數(shù)據(jù)共享引發(fā)關(guān)注:小模型訓(xùn)練成本大幅下降?

聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。

3月10日,最近消息顯示,如今開發(fā)人工智能的成本正降至歷史新低。盡管更經(jīng)濟(jì)的人工智能開發(fā)技術(shù)讓開發(fā)者感到欣喜,但這一趨勢并非全是利好消息。隨著開發(fā)成本降至最低點(diǎn),大科技公司對基礎(chǔ)模型的高昂投資需要有合理的解釋。

以下為翻譯內(nèi)容:

打造一家人工智能公司究竟要花多少錢?隨著大語言模型的研發(fā)成本越來越低,這個數(shù)字每天都在下降。

人工智能算力成本持續(xù)下降,此外,一種極低成本訓(xùn)練出優(yōu)質(zhì)大模型的“模型蒸餾技術(shù)”在不斷普及。新型廉價開發(fā)技術(shù)令A(yù)I開發(fā)者歡欣鼓舞,但這并非全然利好,也讓一些企業(yè)感到寒意。這項歷史悠久的技術(shù)正被賦予新價值:對多數(shù)人是福音,對特定群體意味著復(fù)雜挑戰(zhàn),而對AI未來則意義深遠(yuǎn)。

蒸餾技術(shù)解構(gòu)

人工智能開發(fā)者和專家表示,蒸餾技術(shù)的本質(zhì)在于運(yùn)用一個模型提升另一個模型。讓一個較大的“教師”模型生成應(yīng)答與推理路徑,再讓一個較小的“學(xué)生”模型模仿其行為模式。

據(jù)傳中國公司DeepSeek(深度求索)以約500萬美元成本訓(xùn)練出與OpenAI compete的模型,在業(yè)界引起軒然大波。該消息引發(fā)股市恐慌,因擔(dān)憂芯片需求下降,英偉達(dá)市值慘跌6000億美元(但此預(yù)測尚未成真)。

加州大學(xué)伯克利分校的研究團(tuán)隊則在今年1月份發(fā)布研究,表明他們用不到1000美元的算力成本就訓(xùn)練出兩個新模型。今年2月份,斯坦福大學(xué)、華盛頓大學(xué)以及艾倫人工智能研究所的研究人員更進(jìn)一步,只用更低成本就訓(xùn)練出一個可用的推理模型。

這些突破都得益于蒸餾技術(shù)。

這項技術(shù)通常會搭配微調(diào)技術(shù)(fine-tuning),能以遠(yuǎn)低于其他方法的成本在訓(xùn)練階段提升模型性能。開發(fā)者常用這兩種技術(shù)賦予模型特定的專業(yè)知識或技能。例如,可以將Meta開發(fā)的通用基礎(chǔ)模型蒸餾成精通美國稅法的專家系統(tǒng);或者利用DeepSeek的R1推理模型對Llama進(jìn)行蒸餾,從而增強(qiáng)后者的推理能力,讓Llama在生成答案需要更長時間時,能逐步展示推理過程。

SemiAnalysis的分析師在今年1月份的報告中指出,R1模型中最引人注目的部分,可能在于通過推理引擎的輸出對小型模型進(jìn)行微調(diào)訓(xùn)練,使其具備推理能力。

除了價格低廉外,DeepSeek還以R1推理引擎為核心,推出其他開源模型的壓縮版本。盡管DeepSeek的全尺寸模型和Llama的最大規(guī)模模型過于龐大,僅能通過高性能硬件進(jìn)行運(yùn)行,但蒸餾技術(shù)為解決這一問題提供了新的思路。圖靈資本合伙人薩米爾·庫馬爾表示,經(jīng)過蒸餾處理的模型不僅體積更小、參數(shù)更少,而且內(nèi)存占用也大幅降低,甚至可以在移動設(shè)備或邊緣設(shè)備上運(yùn)行。

DeepSeek的突破性創(chuàng)新在于,經(jīng)過蒸餾處理后的模型性能并未因規(guī)??s減而下降,反而有所提升。

蒸餾技術(shù)雖非新興概念,卻已悄然發(fā)展為一項重要技術(shù)。

蒸餾技術(shù)最早源于2015年,由谷歌人工智能先驅(qū)杰夫·迪恩、杰弗里·辛頓以及谷歌DeepMind研究副總裁奧里奧爾·維尼亞爾斯共同撰寫的一篇論文中提出。維尼亞爾斯最近透露,該論文曾因技術(shù)影響力有限而被NeurIPS頂級會議拒稿。然而,隨著時間的推移,蒸餾技術(shù)已成為AI領(lǐng)域的核心議題。與過去相比,如今蒸餾技術(shù)的威力顯著提升,主要得益于可用作教師模型的開源模型數(shù)量和質(zhì)量的大幅增加。IBM LLM Granite技術(shù)總監(jiān)凱特·索爾表示,DeepSeek通過MIT許可開源的最強(qiáng)大模型,實質(zhì)上正在侵蝕各大公司守護(hù)核心模型的緊閉大門。

蒸餾技術(shù)的應(yīng)用邊界在索爾的討論中得到了進(jìn)一步闡述。在Hugging Face平臺上,充斥著諸如Meta Llama和阿里巴巴Qwen等傳統(tǒng)模型的蒸餾版本。實際上,Hugging Face平臺上存儲的約150萬個模型中,有3萬個名稱中帶有“distill”字樣,這通常表明它們經(jīng)過了蒸餾處理。然而,目前并未有蒸餾模型進(jìn)入Hugging Face的熱門榜單。正如實體商店中的一元店,蒸餾技術(shù)具有頂尖的性價比,但其可選范圍有限且存在缺陷:專精某項任務(wù)的蒸餾模型在其他領(lǐng)域的表現(xiàn)可能會弱化。

蘋果公司的研究人員曾嘗試建立“蒸餾擴(kuò)展模型”,通過教師模型的規(guī)模、目標(biāo)模型規(guī)模和算力投入等參數(shù)預(yù)測蒸餾效果。他們發(fā)現(xiàn),在特定條件下,當(dāng)使用高質(zhì)量的教師模型時,蒸餾效果優(yōu)于傳統(tǒng)的監(jiān)督式學(xué)習(xí),但當(dāng)教師模型過大時,性能提升將停滯。

盡管如此,這一技術(shù)仍有助于縮短從概念到原型開發(fā)的距離,普遍降低人工智能創(chuàng)業(yè)門檻。然而,多位人工智能專家強(qiáng)調(diào),這種捷徑并不否定開發(fā)昂貴基礎(chǔ)模型的必要性,但卻是大模型廠商盈利前景的動搖因素。

基礎(chǔ)模型的未來出路何在?英偉達(dá)首席執(zhí)行官黃仁勛在最新財報發(fā)布后的采訪中表示,如今全球幾乎所有AI開發(fā)者都在使用DeepSeek的R1模型來進(jìn)行蒸餾。蒸餾技術(shù)帶來的機(jī)遇不容忽視,但對OpenAI和Anthropic等公司耗巨資開發(fā)的專有大模型構(gòu)成了威脅,甚至可能引發(fā)對抗。云平臺Hyperbolic聯(lián)合創(chuàng)始人張杰表示,他認(rèn)為基礎(chǔ)模型將越來越趨同化。預(yù)訓(xùn)練模型的能力存在上限,我們正逼近這一極限。張杰還認(rèn)為,大語言模型巨頭的未來發(fā)展應(yīng)聚焦于打造受歡迎的產(chǎn)品而非模型本身,這或許解釋了Meta選擇部分開源Llama模型的戰(zhàn)略考量。

此外,基礎(chǔ)模型公司還可以采取更為激進(jìn)的策略。匿名的谷歌DeepMind研究員表示,具備推理能力的模型可以通過隱藏推理步驟或“痕跡”來防止被蒸餾。雖然OpenAI在大型o1推理引擎中隱藏了完整的推理路徑,但新發(fā)布的o3-mini版本則展示了這些信息。特朗普政府人工智能政策顧問戴維·薩克斯在今年1月份的一次采訪中表示,“未來幾個月,頭部人工智能公司將加大對蒸餾技術(shù)的圍剿力度?!?/p>

不管怎樣,在開源人工智能領(lǐng)域這個充滿活力的"西部 Wild West",想要通過限制蒸餾技術(shù)來遏制技術(shù)擴(kuò)散,這可并非易事。IBM的 Granite 指出,Hugging Face 平臺實際上已經(jīng)積累了大量未經(jīng)許可的、經(jīng)過格式化處理的 GPT 模型訓(xùn)練數(shù)據(jù)集,這早已成為公開的秘密。

而 Anthropic 和 OpenAI 對此均未置評。(辰辰)

孩子發(fā)脾氣怎么辦,《支付寶螞蟻莊園11月20日最新答案解析》 soon,美媒:烏軍可能在兩周內(nèi)撤出庫爾斯克地區(qū) 傾聽孩子的小課堂,家長哪種方式有助于管理兒童情緒 美股科技股全線下跌,美股三大指數(shù)跌勢初現(xiàn),英偉達(dá)跌,諾和諾德跌 收購談判失利,字節(jié)計劃收購Manus團(tuán)隊,報價太低遭拒 看房售房與違法搭建,杭州女子家中200家中介涌入,房產(chǎn)售價696萬,急需出售 零跑汽車杭州市場增長亮點(diǎn),杭州為何不加入零跑 也蹭流量 340人在敘利亞沿海地區(qū),敘利亞政府軍與阿薩德 old forces 交火致Thousands人死亡,敘利亞過渡總統(tǒng)呼吁"勢力"放下武器,俄羅斯、土耳其表態(tài)。 強(qiáng)化突破,《金鏟鏟之戰(zhàn)》S10賽季白銀符文分類解析 探索新地圖解鎖稀有裝備,《星球重啟》信號寶箱收集攻略
     
黃色電影韓國

黃色電影韓國

大?。?em>55mb更新:2025-03-11 08:46:44

類別:系統(tǒng):Android

立即下載(42.54MB)
  • 黃色電影韓國
  • 黃色電影韓國
  • 黃色電影韓國

游戲特色

應(yīng)宿羽答:‘因為我就是想看雪啊。’無人聲,靜有十二息,雨勢稍大,拍瓦可聞,殿外夜鶯鳴叫三聲,未飛未驚。鼻端漸有雨味。

應(yīng)宿羽言:‘那時節(jié)也沒有你們‘北方的蟲子’?!椅创稹?yīng)宿羽言:‘聽今日朝上說,北方局勢偏于安定了,真好,這么多年兵禍連綿,百姓們終于可以得些休養(yǎng)了。’

我答:‘你覺得往后是安定的時日么?’應(yīng)宿羽伸手接雨:‘北面外敵已退,內(nèi)里朝堂漸穩(wěn),賢君明后登位四年,都尚年輕……大唐已連著過了幾個凜冬,你瞧,這不已下起了溫潤的春雨嗎?’

我未答,約兩息,殿內(nèi)外五感皆如常。應(yīng)宿羽言,聲低平時一半:‘沐舟,我總覺得……你好像不停地在擔(dān)憂著什么。’

我未答,微一走神。應(yīng)宿羽言:‘三年來,一直都是。姑姑說那夜她和你聊了三個時辰,她說你總是想著‘離開’,不管是落在哪里,‘扎根’這件事本身就令你不安……我看你也是這樣。’

我答:‘人家說了你便‘我看也是’,平日卻不見說?!瘧?yīng)宿羽答:‘啊,那我笨咯,我早承認(rèn)自己在越大俠面前是個笨蛋,有什么新奇的?!?/p>

我答:‘我怕你忘了。’應(yīng)宿羽笑,三聲,一高兩低。雨勢始大,落如松針,約小半刻后土地松軟,人馬留印,殿內(nèi)外萬籟漸起,穿林打葉聲、落檐滴瓦聲、景池?fù)羲暦N種混雜。雨中土腥泛在鼻端。

五感無異。應(yīng)宿羽雙腿平伸,眼望階下梅樹:‘所以姑姑說……你說你愿意試著留下來……真的嗎?’我未答,約兩息,后答:‘是?!?/p>

無人聲,靜有七息,應(yīng)宿羽笑成珠串,聲與殿外夜鶯同起。繼而應(yīng)宿羽言:‘我覺得,是你一直那樣長大的緣故?!?/p>

‘你長在險惡江湖,太習(xí)慣睡覺都枕著把劍了,看什么都是冷眼。什么都不信任,所以什么都不靠近。但越少俠是我見過最有俠義之心的人了,何必總是留給世人冷淡桀驁的樣子。不妨試著相信一下,只要戰(zhàn)勝了惡人、跨過了難關(guān),我們也可以一起把世界變成想要的樣子——姑姑和姑父不就立在上面嗎?’

游戲亮點(diǎn)

“你想想,你愿意找一位無上天尊做師傅,還是想找一個只會挖墳的死胖子當(dāng)師傅。”秦天義正言辭道。“天尊好!”葉凡仔細(xì)一想,然后果斷道。

“這就對了!”秦天欣慰道。一時間,眾人氣氛很是融洽。一旁,李小曼目光在秦天與葉凡的臉上來回的打轉(zhuǎn),遲疑道:“葉凡你確定你跟這一位小天尊……沒有什么關(guān)系嗎?”

秦天與葉凡長得太像了,連她這個前女友都有些分不清了。如今葉凡與秦天已經(jīng)有八分相似了,都快趕上雙胞胎了!

秦天冥冥之中有種預(yù)感,他們這一張臉長到八分相似就不會再繼續(xù)下去了。且隨著二人修為的增長,差異性會越來越多,逐漸擁有屬于自己的特性。

游戲玩法

剎那間,天地為之一顫。九天之上,一道又一道月光之劍緩緩匯聚。滄海之中,無窮無盡的海水凝聚成劍飛出,如同飛蛾撲火一般的向著天月而去。

沒有人能數(shù)得清究竟有多少劍氣,那恒河沙數(shù)一般的劍氣不斷匯聚,宛如滿天繁星一般盤旋在一起,最終化作一道籠罩?jǐn)?shù)千里天地的劍之領(lǐng)域。

這些劍域與月光匯聚在一起,化作一萬道月白色劍意交錯,最終在極致的盤旋之后猛地一停?!安缓谩!碧婢┼庖宦?,當(dāng)即催動全身手段抵御。

評測

解決方法合集,《星神少女》閃退解決方法介紹

2023歐冠決賽次回合巴塞羅那與本菲卡對決,本菲卡教練:3C發(fā)揮出色;弗里克在歐冠奪冠經(jīng)驗充足

35歲是否真的是就業(yè)門檻政協(xié)委員張凱麗發(fā)聲,張凱麗兩會出圈,質(zhì)疑國家力量的干涉

痔瘡與直腸癌便血的顏色差異,標(biāo)題改寫:便血:痔瘡還是直腸癌?專家教你辨別方法

特朗普2025年3月4日講話全球政策動向,特朗普在國會發(fā)表涉及多項重要議題的演講,會議中引發(fā)爭議,多名民主黨議員被驅(qū)逐

顯示全部

熱門推薦
玩家評論
我要跟貼
取消
最新手游