国产亚洲欧美在线观看精品,а√天堂中文在线资源bt种子,国产亚洲精品自在线亚洲页码,日本一区二区不卡高清久久久

站長之家 - 業(yè)界 2025-03-11 01:39:41

蒸餾雙刃劍,AI公司集體借鑒開源模型,"小模型"時代或迎低價(jià)競爭?

聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。

3月10日,據(jù)最新消息,如今開發(fā)人工智能技術(shù)的成本已降至歷史新低。這一更低廉的開發(fā)技術(shù)讓開發(fā)者倍感振奮,然而,隨著開發(fā)成本降至最低點(diǎn),大科技公司對基礎(chǔ)模型的巨額投資,必須找到合理的解釋。

3月10日,據(jù)最新消息,如今開發(fā)人工智能技術(shù)的成本已降至歷史新低。這一更低廉的開發(fā)技術(shù)讓開發(fā)者倍感振奮,然而,隨著開發(fā)成本降至最低點(diǎn),大科技公司對基礎(chǔ)模型的巨額投資,必須找到合理的解釋。

隨著大語言模型研發(fā)成本的持續(xù)下降,打造一家人工智能公司所需的費(fèi)用正以每日遞減的速度下降。

人工智能算力成本持續(xù)下降,此外,"模型蒸餾技術(shù)"這種以極低成本訓(xùn)練出優(yōu)質(zhì)大模型的技術(shù)正在不斷普及。這項(xiàng)廉價(jià)開發(fā)技術(shù)令A(yù)I開發(fā)者歡欣鼓舞,但這并非全然利好,也讓一些企業(yè)感到寒意。這項(xiàng)歷史悠久的技術(shù)正被賦予新價(jià)值:對多數(shù)人來說,這項(xiàng)技術(shù)是福音;對特定群體而言,這項(xiàng)技術(shù)意味著復(fù)雜挑戰(zhàn);而對于人工智能的未來發(fā)展而言,這項(xiàng)技術(shù)意義深遠(yuǎn)。

蒸餾技術(shù)解構(gòu)

開發(fā)人員和專家普遍認(rèn)為,蒸餾技術(shù)的本質(zhì)在于運(yùn)用一個模型提升另一個模型的能力。具體而言,就是讓一個較大的"教師"模型生成應(yīng)答與推理路徑,再讓一個較小的"學(xué)生"模型模仿其行為模式。

據(jù)傳,中國公司DeepSeek(深度求索)以約500萬美元的成本訓(xùn)練出的模型,已達(dá)到與OpenAI抗衡的程度。這一消息在業(yè)內(nèi)引起了軒然大波。然而,該消息引發(fā)市場對芯片需求下降的擔(dān)憂,導(dǎo)致英偉達(dá)市值下跌了6000億美元。盡管這一預(yù)測尚未成真,但該消息仍對市場產(chǎn)生了顯著影響。

今年1月,加州大學(xué)伯克利分校的研究團(tuán)隊(duì)發(fā)布了一項(xiàng)研究,表明他們僅以不到1000美元的算力成本就訓(xùn)練出兩個新模型。今年2月,斯坦福大學(xué)、華盛頓大學(xué)以及艾倫人工智能研究所的研究團(tuán)隊(duì)更進(jìn)一步,只用更低成本就訓(xùn)練出一個可用的推理模型。

這些突破都得益于蒸餾技術(shù)。

這項(xiàng)技術(shù)通常會搭配微調(diào)技術(shù)(fine-tuning),能以遠(yuǎn)低于其他方法的成本在訓(xùn)練階段提升模型性能。開發(fā)人員常用這兩種技術(shù)賦予模型特定的專業(yè)知識或技能。例如,可以將Meta開發(fā)的通用基礎(chǔ)模型蒸餾成精通美國稅法的專家系統(tǒng);或者利用DeepSeek的R1推理模型對Llama進(jìn)行蒸餾,從而增強(qiáng)后者的推理能力,讓Llama在生成答案需要更長時間時,能逐步展示推理過程。

美國知名半導(dǎo)體分析機(jī)構(gòu)SemiAnalysis的分析師在今年1月份發(fā)布的報(bào)告中指出:“R1模型中最引人注目的部分,可能就在于通過推理模型的輸出對一些非推理小模型進(jìn)行微調(diào),從而使這些模型具備推理能力?!?/p>

雖然價(jià)格低廉,但DeepSeek還將其R1推理模型作為教師,發(fā)布了其他開源模型的蒸餾版本。值得注意的是,DeepSeek的全尺寸模型以及Llama的最大規(guī)模模型過于龐大,只有特定硬件才能支持其運(yùn)行。而蒸餾技術(shù)也有助于解決這一問題。圖靈資本合伙人薩米爾·庫馬爾表示:“經(jīng)過蒸餾的模型體積更小、參數(shù)更少、內(nèi)存占用更低,甚至可以在手機(jī)或邊緣設(shè)備上運(yùn)行?!?/p>

DeepSeek的突破性在于,經(jīng)過蒸餾的模型性能并未因規(guī)??s減而下降,反而有所提升。

蒸餾技術(shù)雖非新生事物,卻已悄然蛻變。

蒸餾技術(shù)最早出現(xiàn)在2015年,源于谷歌人工智能元老杰夫·迪恩、杰弗里·辛頓以及谷歌DeepMind研究副總裁奧里奧爾·維尼亞爾斯共同撰寫的一篇論文。維尼亞爾斯近期透露,該論文曾被NeurIPS頂會拒稿,理由是該技術(shù)“對領(lǐng)域影響有限”。十年后,蒸餾技術(shù)卻突然成為AI討論的核心議題。與過去相比,如今蒸餾技術(shù)的威力提升源于可用作教師模型的開源模型在數(shù)量與質(zhì)量上的飛躍。IBM LLM Granite技術(shù)管理總監(jiān)凱特·索爾在播客中表示:“DeepSeek通過MIT許可開源迄今最強(qiáng)大的模型,實(shí)質(zhì)上正在侵蝕各大廠商守護(hù)核心模型的緊閉大門?!?/p>

蒸餾技術(shù)的應(yīng)用邊界索爾提到,互聯(lián)網(wǎng)開源模型庫Hugging Face平臺上充斥著諸如Meta Llama和阿里巴巴Qwen等傳統(tǒng)模型的蒸餾版本。實(shí)際上,Hugging Face存儲的約150萬個模型中,有3萬個名稱中帶有“distill”字樣,這通常表明它們經(jīng)過了蒸餾。但目前尚無蒸餾模型進(jìn)入Hugging Face的榜單前列。正如實(shí)體店里的一元店,蒸餾技術(shù)雖具頂尖性價(jià)比,但可選范圍有限且存在缺陷:專精某項(xiàng)任務(wù)的蒸餾模型在其他領(lǐng)域的表現(xiàn)可能會弱化。

蘋果公司研究人員曾嘗試構(gòu)建“蒸餾擴(kuò)展定律”,通過教師模型的規(guī)模、目標(biāo)模型規(guī)模和算力投入等參數(shù)預(yù)測蒸餾效果。他們發(fā)現(xiàn),在特定條件下,當(dāng)使用高質(zhì)量的教師模型時,蒸餾效果優(yōu)于傳統(tǒng)的監(jiān)督學(xué)習(xí),但當(dāng)教師模型過大時,性能提升將停滯。

盡管如此,這一技術(shù)仍有助于縮短從概念到原型的距離,普遍降低人工智能創(chuàng)業(yè)門檻。但多位人工智能專家強(qiáng)調(diào),這種捷徑并不否定昂貴基礎(chǔ)模型的必要性,但卻是動搖了大模型廠商的盈利前景。

基礎(chǔ)模型還有出路嗎?英偉達(dá)首席執(zhí)行官黃仁勛在公司最新財(cái)報(bào)發(fā)布后接受采訪時表示:“如今全球幾乎所有AI開發(fā)者都在使用DeepSeek的R1來蒸餾新模型。”蒸餾技術(shù)帶來了機(jī)遇,但對OpenAI和Anthropic等公司耗巨資開發(fā)的專有大模型構(gòu)成了威脅,有可能遭到對抗。云平臺Hyperbolic聯(lián)合創(chuàng)始人張杰表示:“我認(rèn)為基礎(chǔ)模型將會越來越趨于同質(zhì)化。預(yù)訓(xùn)練模型的能力存在天花板,我們正逼近這個極限?!睆埥苷J(rèn)為,大語言模型巨頭的出路在于打造受歡迎的產(chǎn)品而非模型本身,這或許解釋了Meta選擇部分開源Llama模型的戰(zhàn)略考量。

此外,基礎(chǔ)模型公司還可以采用更激進(jìn)的策略。匿名谷歌DeepMind研究員表示,具備推理能力的模型可以通過隱藏推理步驟或“痕跡”來防止被蒸餾。雖然OpenAI在大型o1推理模型中隱藏了完整的推理路徑,但新發(fā)布的o3-mini版本則展示了這些信息。特朗普政府人工智能政策顧問戴維·薩克斯今年1月份接受采訪時說:“未來幾個月,頭部人工智能公司將圍剿蒸餾技術(shù)?!?/p>

不過,在開源AI的"狂野西部",要遏制技術(shù)擴(kuò)散談何容易?IBM的LLM Granite的索爾直言:Hugging Face平臺充斥著大量未經(jīng)許可的格式化訓(xùn)練數(shù)據(jù)集,這早已成為公開的秘密。

Anthropic和OpenAI均未對此作出回應(yīng)或置評。(辰辰)

2025年國防支出,解放軍和武警部隊(duì)代表團(tuán)發(fā)言人:2025年國防預(yù)算安排1.81萬億元 數(shù)千億美元欺詐揭露特朗普政府...,驚人的發(fā)現(xiàn)!馬斯克揭露數(shù)十億美元假合同,特朗普:大量協(xié)議成騙局,政府將面臨大規(guī)模裁員 NBA太陽隊(duì) conquest太陽隊(duì) vs 獨(dú)行俠KD 32+10+7241,太陽隊(duì)以64分擊敗獨(dú)行俠,杜蘭特21+9+8打破德克紀(jì)錄,成為歷史第8人 月球著陸器雅典娜著陸失敗太陽能中斷關(guān)鍵任務(wù)完成南極近點(diǎn)記錄,月球著陸器"雅典娜"著陸時側(cè)翻任務(wù)提前結(jié)束 破局·星火,星門計(jì)劃背后的暗網(wǎng)項(xiàng)目:這家創(chuàng)業(yè)公司如何操作? 航空,2025年首兩個月,空客交付量降幅顯著 哈登準(zhǔn)三雙加時賽制勝,哈登29分9籃板11助攻,近10年首次創(chuàng)下單場灌籃神跡,聯(lián)盟無人能及 “空中交通管制員的關(guān)鍵職責(zé)”,塔臺上的“她”力量 最颯女管制員 未定事件簿拼圖活動,《未定事件簿》雪照夏時玩法介紹一覽 證監(jiān)會財(cái)務(wù)造假調(diào)查進(jìn)展,東方集團(tuán)財(cái)務(wù)造假,大華會計(jì)師事務(wù)所財(cái)務(wù)造假頻繁發(fā)生?
     
拼婚

拼婚

大?。?em>25mb更新:2025-03-11 01:39:41

類別:系統(tǒng):Android

立即下載(42.54MB)
  • 拼婚
  • 拼婚
  • 拼婚

游戲特色

“星逸移動電源3 pro,20000毫安電量,同樣星逸快充2.0,20瓦極速快充,能用一周,確保無憂。售價(jià)399!”

“此外,星逸移動電源2代,10000毫安電量,10瓦快充,價(jià)格直降100,199!”“星逸移動電源1S,6600毫安電量,10瓦快充,價(jià)格直降100,118!”

這個價(jià)格算是很有競爭力,畢竟星逸移動電源1S和2代雖然只支持10瓦快充,但也遠(yuǎn)超其他友商的5瓦。這年頭,5瓦慢充的移動電源都要100左右。

星逸科技10瓦的賣118-200,20瓦的賣300,并且支持多品牌,多接口,全能快充,算是良心價(jià),競爭力十足。

不過后續(xù),價(jià)格就會卷起來,卷的更低。但星逸移動電源不會大降價(jià),除了更新?lián)Q代之外。后續(xù)推出無界移動電源,打價(jià)格戰(zhàn)。

價(jià)格一出,果然,消費(fèi)者都很是滿意:“星逸移動電源3代升級20瓦快充,還和之前的2代首發(fā)價(jià)一樣,純屬加量不加價(jià),真劃算。”

“王董良心啊,星逸移動電源壟斷20瓦快充,完全可以賣高價(jià),但依舊選擇299,只能說良心?!薄耙簧郏苯映湫且菀苿与娫?Pro,兩萬毫安,再也不擔(dān)心續(xù)航了?!?/p>

“沒錯,兩萬毫安大容量,再也沒了續(xù)航焦慮?!辈贿^也正是比較良心的定價(jià)策略,加上獨(dú)有的全能充和快充,使得星逸移動電源全球熱銷。

像是星逸移動電源2代,月銷量大幾百萬臺,全球年銷量超過7000萬臺!還有星逸移動電源1s,年銷量也超過五千萬臺。

不過眼下星逸移動電源1S再賣幾個月,銷量低了,就要逐步停產(chǎn),清完庫存后全面下架。6600毫安的電池,確實(shí)不太夠了。

游戲亮點(diǎn)

正是因?yàn)檫@一點(diǎn),他才答應(yīng)了潘托斯的富豪總督伊利里歐的牽線,以自己出兵相助為代價(jià),迎娶這位龍之家族的公主。

至于是否履行這個承諾,他并未作出決定。他需要觀察。倘若那位坦格利安家族的王子有成為一名合格君主的品質(zhì),他不介意出兵相助。

這樣還能為自己贏得一個強(qiáng)大的盟友。但現(xiàn)在看來,他的想法太樂觀了。聽著那幾位仆人狡辯丹妮莉絲憑空消失,卓戈尚未說話,韋賽里斯·坦格利安就暴跳如雷。

“不可能!”“你們在說謊!”“快點(diǎn)告訴我,你們將丹妮藏到了哪里?”“我告訴你,我已經(jīng)將妹妹交給你了,現(xiàn)在我完成了我的承諾,該你履行你的諾言了!”

游戲玩法

“沒大賽超越那個怪物有點(diǎn)難,不過以馬埃爾的水準(zhǔn)保持住應(yīng)該不算困難!”“是的,梅西經(jīng)歷了數(shù)個賽季的沉淀與穩(wěn)定發(fā)揮,這賽季又爆發(fā)數(shù)據(jù),要想跟上他太難了,不過隊(duì)長從今天過后,也是登過世界第一寶座的人了!”

“哈哈哈!”一群人中,吉伯特的情緒顯得格外激動,他不斷拍著手,目光也在門口的一處搜尋起來。很快,他看到了喬爾森最早為馬埃爾做的身價(jià)牌,以及他為第一次打歐冠的馬埃爾送的2張身價(jià)牌禮物。

現(xiàn)在想想,那都已經(jīng)過去很久了最高身價(jià)牌上的身價(jià),也還不及馬埃爾現(xiàn)在身價(jià)的零頭。感嘆的同時,他也生出給馬埃爾重做幾個身價(jià)牌的想法。

評測

航天探索新進(jìn)展,張松山:中國太空探索展現(xiàn)開放與合作精神

120周年輝煌回顧,切爾西:成立120周年紀(jì)念,34冠奪冠,全球最佳俱樂部!

過敏原的歷史長卷,中國千萬級群體受挑戰(zhàn),誰才是元兇?

價(jià)格屠夫硬核科技,零跑B10曝光:13萬起可配置激光雷達(dá),價(jià)格新屠夫出現(xiàn)?改寫說明:1. 去掉了重復(fù)的"價(jià)格",使標(biāo)題更簡潔2. 調(diào)整了語序,使標(biāo)題更符合中文表達(dá)習(xí)慣3. 保留了關(guān)鍵信息:車型名稱、價(jià)格區(qū)間、主要功能4. "新屠夫"這一網(wǎng)絡(luò)熱詞保留,增加了標(biāo)題吸引力5. 整體標(biāo)題更緊湊,信息傳遞更明確

巴黎時裝秀見朋友,久違的巴黎,久違的秀場

顯示全部

熱門推薦
玩家評論
我要跟貼
取消
最新手游