国产亚洲欧美在线观看精品,а√天堂中文在线资源bt种子,国产亚洲精品自在线亚洲页码,日本一区二区不卡高清久久久

站長之家 - 業(yè)界 2025-03-12 03:12:57

AI成本下降,AI行業(yè)數(shù)據(jù)共享引發(fā)關(guān)注:小模型訓(xùn)練成本大幅下降?

聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。

3月10日,最近消息顯示,如今開發(fā)人工智能的成本正降至歷史新低。盡管更經(jīng)濟的人工智能開發(fā)技術(shù)讓開發(fā)者感到欣喜,但這一趨勢并非全是利好消息。隨著開發(fā)成本降至最低點,大科技公司對基礎(chǔ)模型的高昂投資需要有合理的解釋。

以下為翻譯內(nèi)容:

打造一家人工智能公司究竟要花多少錢?隨著大語言模型的研發(fā)成本越來越低,這個數(shù)字每天都在下降。

人工智能算力成本持續(xù)下降,此外,一種極低成本訓(xùn)練出優(yōu)質(zhì)大模型的“模型蒸餾技術(shù)”在不斷普及。新型廉價開發(fā)技術(shù)令A(yù)I開發(fā)者歡欣鼓舞,但這并非全然利好,也讓一些企業(yè)感到寒意。這項歷史悠久的技術(shù)正被賦予新價值:對多數(shù)人是福音,對特定群體意味著復(fù)雜挑戰(zhàn),而對AI未來則意義深遠。

蒸餾技術(shù)解構(gòu)

人工智能開發(fā)者和專家表示,蒸餾技術(shù)的本質(zhì)在于運用一個模型提升另一個模型。讓一個較大的“教師”模型生成應(yīng)答與推理路徑,再讓一個較小的“學(xué)生”模型模仿其行為模式。

據(jù)傳中國公司DeepSeek(深度求索)以約500萬美元成本訓(xùn)練出與OpenAI compete的模型,在業(yè)界引起軒然大波。該消息引發(fā)股市恐慌,因擔憂芯片需求下降,英偉達市值慘跌6000億美元(但此預(yù)測尚未成真)。

加州大學(xué)伯克利分校的研究團隊則在今年1月份發(fā)布研究,表明他們用不到1000美元的算力成本就訓(xùn)練出兩個新模型。今年2月份,斯坦福大學(xué)、華盛頓大學(xué)以及艾倫人工智能研究所的研究人員更進一步,只用更低成本就訓(xùn)練出一個可用的推理模型。

這些突破都得益于蒸餾技術(shù)。

這項技術(shù)通常會搭配微調(diào)技術(shù)(fine-tuning),能以遠低于其他方法的成本在訓(xùn)練階段提升模型性能。開發(fā)者常用這兩種技術(shù)賦予模型特定的專業(yè)知識或技能。例如,可以將Meta開發(fā)的通用基礎(chǔ)模型蒸餾成精通美國稅法的專家系統(tǒng);或者利用DeepSeek的R1推理模型對Llama進行蒸餾,從而增強后者的推理能力,讓Llama在生成答案需要更長時間時,能逐步展示推理過程。

SemiAnalysis的分析師在今年1月份的報告中指出,R1模型中最引人注目的部分,可能在于通過推理引擎的輸出對小型模型進行微調(diào)訓(xùn)練,使其具備推理能力。

除了價格低廉外,DeepSeek還以R1推理引擎為核心,推出其他開源模型的壓縮版本。盡管DeepSeek的全尺寸模型和Llama的最大規(guī)模模型過于龐大,僅能通過高性能硬件進行運行,但蒸餾技術(shù)為解決這一問題提供了新的思路。圖靈資本合伙人薩米爾·庫馬爾表示,經(jīng)過蒸餾處理的模型不僅體積更小、參數(shù)更少,而且內(nèi)存占用也大幅降低,甚至可以在移動設(shè)備或邊緣設(shè)備上運行。

DeepSeek的突破性創(chuàng)新在于,經(jīng)過蒸餾處理后的模型性能并未因規(guī)??s減而下降,反而有所提升。

蒸餾技術(shù)雖非新興概念,卻已悄然發(fā)展為一項重要技術(shù)。

蒸餾技術(shù)最早源于2015年,由谷歌人工智能先驅(qū)杰夫·迪恩、杰弗里·辛頓以及谷歌DeepMind研究副總裁奧里奧爾·維尼亞爾斯共同撰寫的一篇論文中提出。維尼亞爾斯最近透露,該論文曾因技術(shù)影響力有限而被NeurIPS頂級會議拒稿。然而,隨著時間的推移,蒸餾技術(shù)已成為AI領(lǐng)域的核心議題。與過去相比,如今蒸餾技術(shù)的威力顯著提升,主要得益于可用作教師模型的開源模型數(shù)量和質(zhì)量的大幅增加。IBM LLM Granite技術(shù)總監(jiān)凱特·索爾表示,DeepSeek通過MIT許可開源的最強大模型,實質(zhì)上正在侵蝕各大公司守護核心模型的緊閉大門。

蒸餾技術(shù)的應(yīng)用邊界在索爾的討論中得到了進一步闡述。在Hugging Face平臺上,充斥著諸如Meta Llama和阿里巴巴Qwen等傳統(tǒng)模型的蒸餾版本。實際上,Hugging Face平臺上存儲的約150萬個模型中,有3萬個名稱中帶有“distill”字樣,這通常表明它們經(jīng)過了蒸餾處理。然而,目前并未有蒸餾模型進入Hugging Face的熱門榜單。正如實體商店中的一元店,蒸餾技術(shù)具有頂尖的性價比,但其可選范圍有限且存在缺陷:專精某項任務(wù)的蒸餾模型在其他領(lǐng)域的表現(xiàn)可能會弱化。

蘋果公司的研究人員曾嘗試建立“蒸餾擴展模型”,通過教師模型的規(guī)模、目標模型規(guī)模和算力投入等參數(shù)預(yù)測蒸餾效果。他們發(fā)現(xiàn),在特定條件下,當使用高質(zhì)量的教師模型時,蒸餾效果優(yōu)于傳統(tǒng)的監(jiān)督式學(xué)習(xí),但當教師模型過大時,性能提升將停滯。

盡管如此,這一技術(shù)仍有助于縮短從概念到原型開發(fā)的距離,普遍降低人工智能創(chuàng)業(yè)門檻。然而,多位人工智能專家強調(diào),這種捷徑并不否定開發(fā)昂貴基礎(chǔ)模型的必要性,但卻是大模型廠商盈利前景的動搖因素。

基礎(chǔ)模型的未來出路何在?英偉達首席執(zhí)行官黃仁勛在最新財報發(fā)布后的采訪中表示,如今全球幾乎所有AI開發(fā)者都在使用DeepSeek的R1模型來進行蒸餾。蒸餾技術(shù)帶來的機遇不容忽視,但對OpenAI和Anthropic等公司耗巨資開發(fā)的專有大模型構(gòu)成了威脅,甚至可能引發(fā)對抗。云平臺Hyperbolic聯(lián)合創(chuàng)始人張杰表示,他認為基礎(chǔ)模型將越來越趨同化。預(yù)訓(xùn)練模型的能力存在上限,我們正逼近這一極限。張杰還認為,大語言模型巨頭的未來發(fā)展應(yīng)聚焦于打造受歡迎的產(chǎn)品而非模型本身,這或許解釋了Meta選擇部分開源Llama模型的戰(zhàn)略考量。

此外,基礎(chǔ)模型公司還可以采取更為激進的策略。匿名的谷歌DeepMind研究員表示,具備推理能力的模型可以通過隱藏推理步驟或“痕跡”來防止被蒸餾。雖然OpenAI在大型o1推理引擎中隱藏了完整的推理路徑,但新發(fā)布的o3-mini版本則展示了這些信息。特朗普政府人工智能政策顧問戴維·薩克斯在今年1月份的一次采訪中表示,“未來幾個月,頭部人工智能公司將加大對蒸餾技術(shù)的圍剿力度?!?/p>

不管怎樣,在開源人工智能領(lǐng)域這個充滿活力的"西部 Wild West",想要通過限制蒸餾技術(shù)來遏制技術(shù)擴散,這可并非易事。IBM的 Granite 指出,Hugging Face 平臺實際上已經(jīng)積累了大量未經(jīng)許可的、經(jīng)過格式化處理的 GPT 模型訓(xùn)練數(shù)據(jù)集,這早已成為公開的秘密。

而 Anthropic 和 OpenAI 對此均未置評。(辰辰)

Explore | Steam | Conquer Darkness,征服黑暗游戲官網(wǎng)地址-Conquest Dark游戲官網(wǎng) 捕捉輕松神秘沙漠中的不死蟲,怪物獵人荒野不死蟲收集指南 GORN VR Blood Combat,GORN 2游戲官網(wǎng)地址在哪里 冒險探索,《開放世界:貝海姆世界齒輪系統(tǒng)與星圖布局》 零跑B10預(yù)售開啟10.98萬起,零跑B10售價10.98萬起,12萬可配置激光雷達 腦洞大開識別虛假求職者全解析,《腦洞非常大》虛假求職者通關(guān)攻略 輕松獲取說英雄卡,《逆水寒手游》說英雄卡一舟煙雨獲得方法 夜捕撈大魚緋紅森林17區(qū),《怪物獵人:荒野大 journals》中入道烏賊釣點位置介紹 regenerated football stadium,曼聯(lián)官方宣布將新建一座可容納10萬名球迷的現(xiàn)代化體育場,預(yù)計2025年完工。 休息后進入白晝模式跳轉(zhuǎn)時間退出,刷滿月攻略:怪物獵人荒野快速獲取滿月方法解析
     
徐福山

徐福山

大小:47mb更新:2025-03-12 03:12:57

類別:系統(tǒng):Android

立即下載(42.54MB)
  • 徐福山
  • 徐福山
  • 徐福山

游戲特色

這時候,雪乃太太正好從外面進來?!鞍。疃?,我回來了?!笨椞镄盼崞鹕硎疽?。雪乃太太隨意地擺擺手,然后朝著兩位客人微微致意,就宛如回家似的將外套脫下來掛在衣架上,徑自去沙發(fā)上坐下來。

好像她們的商務(wù)洽談完全和她無關(guān)的態(tài)度。三上三郎見過她,盡管覺得漂亮得驚艷也不太留意。高野蘭卻悄然琢磨,這位大美人是誰?怎么看著這么眼熟?

按理來說,這樣的美女我該過目不忘才對。啊,和服美女!高野蘭猛地想了起來。在一次春天書店的一次高層會議上,看到過這位美女。

好像是春天書店的高層董事?而且是古早的神秘投資人之一!怎么她在織田信吾這里?而且稱呼這么親昵,居然是名字的直接相稱……

高野蘭看向織田信吾的目光,又是大有不同了??椞镄盼釀t是只顧自繼續(xù)說著自己的想法?!笆堑?,我在考慮新漫畫。實不相瞞,這是我的準岳母對我提出的要求?!笨椞镄盼峤忉尩?,“雖然不是她直接表達的,但我希望創(chuàng)作出她欣賞的一部作品?!?/p>

三上三郎一愣:“不是直接表達的?”“哈哈,我剛從準岳母家回來,自然是因為這個?!笨椞镄盼嵋膊患氄f。波風(fēng)幽鶴卻是回頭望過來,嘴角含笑,目光中帶著額外的意味。幸福,那叫一個幸福得冒泡,秋水都要蕩漾出來的感覺。

藤堂香橙卻是撇嘴。三上悠子狀如常態(tài),根本不在她的考慮范圍內(nèi)了。三上三郎卻是望了一眼自己的妹妹。該不會我家妹子,已經(jīng)是敗犬了吧……他擔憂地想問個清楚。

但是看看遠處的和服美女,再看看正回頭的長腿美女,再看看旁邊的大雷美女……好吧,悠子輸?shù)牟辉?。三上三郎雖然心中為妹妹鳴不平,但還是理性地承認,別人贏的有道理。

不過我家妹子還是有優(yōu)點的!至少嬌小可愛也是很討人喜歡的對不對?三上三郎考慮找時間,要好好幫織田信吾開發(fā)一下XP愛好。

三人又商量了一段時間,織田信吾明確表示只是有個新漫畫的企劃?!安贿^,我對新漫畫已經(jīng)有個大致的眉目了?!笨椞镄盼嵛⑿Α?/p>

游戲亮點

“不是,你之前也注意到了吧,云風(fēng)對,那姑娘也有點意思。”陸云闕壓低了聲音,湊在云子衿的耳邊說只有兩個人聽得見的悄悄話。

“你不說我都給忘了,那這……”兩兄弟不會因為一個涂圖圖就反目成仇吧?云子衿看了涂圖圖一眼,她怎么就沒有發(fā)現(xiàn),這丫頭還有成為“禍水”的潛質(zhì)?

“不管了,船到橋頭自然直。看他們倆誰最后能夠抱得美人歸吧?!笔中氖直扯际侨猓懺脐I也沒辦法說服自己到底支持誰。

而其他人也是面露怪異之色,唐三這玄天功還有唐門絕學(xué)以及暗器手法自己都是寶貴的很,連兄弟都不愿意教,竟然會交給這么一個相處沒多久的人身上,憑什么?

游戲玩法

【異界伐樓那】喃喃道。【異界因陀羅】也緩緩抬頭,毛毛細雨正籠罩在這天界之中,溫柔的水之力量飄蕩,隨著聲音擴散到整個天界。

此時,這道‘婆之音’波蕩不斷,不斷在天界中回蕩。水之力量也越發(fā)濃郁,充斥在這天界之中?!捌??”【異界伐樓那】眉頭微皺,喃喃自語。

他感覺到自己的力量,在這道聲音的加持下,在變得更強。嘩啦啦!針尖般的毛毛細雨越來越大,宛如牛尾掃過,嘩啦啦匯聚在這天界之中。

評測

精美的畫面與流暢的運行體驗需64位處理器與Windows 7以上系統(tǒng)至少1GB RAM,Portal Fantasy游戲配置需求說明

創(chuàng)新玩法即將上線主機玩家持續(xù)關(guān)注,Shadowveil Legend of The Five Rings 游戲平臺推薦

爭執(zhí)于白宮內(nèi)閣會議,內(nèi)閣會議發(fā)生爭執(zhí)?特朗普:兩人關(guān)系良好,無分歧

震驚韓國明星 couple's shocking truth about 7 billion debt and love gone wrong,金秀賢與金賽綸親密照曝光,女方曾發(fā)短信求救,希望對方安靜

小石頭,林詩棟在重慶賽事中以3-1擊敗寶島選手,世界冠軍不丟臉并闖入男單16強。

顯示全部

熱門推薦
玩家評論
我要跟貼
取消
最新手游