国产亚洲欧美在线观看精品,а√天堂中文在线资源bt种子,国产亚洲精品自在线亚洲页码,日本一区二区不卡高清久久久

站長之家 - 業(yè)界 2025-03-11 04:43:42

AlphaEdit精準(zhǔn)算法零空間投影技術(shù)突破語言模型知識更新效率,Llama 3通過模型編輯算法,在知識編輯任務(wù)中表現(xiàn)提升35%。

聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。

最近,中國科學(xué)技術(shù)大學(xué)的研究團(tuán)隊(duì)研發(fā)了一種名為AlphaEdit的精準(zhǔn)編輯算法,該算法為大型語言模型的知識更新和管理提供了一種高效解決方案。

該算法的核心在于,在對模型進(jìn)行知識更新時(shí),將參數(shù)變化投影到原始知識的零空間中。這種方法理論上能夠確保在定向更新模型中的錯誤、過時(shí)或不安全知識時(shí),不會對模型的通用能力造成干擾。

研究人員在主流編輯方法中僅增加一行代碼,就實(shí)現(xiàn)了Llama 3在知識編輯任務(wù)上的性能提升達(dá)35%。

該方法具有廣泛的適用性,可以應(yīng)用于大多數(shù)常用的模型編輯算法,并在論文中接受了驗(yàn)證。

論文的審稿人評價(jià)稱:"該研究成功解決了當(dāng)前模型編輯中知識更新與知識保留之間難以平衡的問題。"

相關(guān)論文《AlphaEdit:基于零空間約束的語言模型知識編輯》(AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models)已發(fā)表在國際學(xué)習(xí)表征會議(ICLR 2025,International Conference on Learning Representations)上,并被選為 orally presentation(僅占投稿總數(shù)的1.8%)。

中國科學(xué)技術(shù)大學(xué)的博士生方俊峰和碩士生姜厚丞是共同第一作者,王翔教授和何向南教授擔(dān)任共同通訊作者。

該研究團(tuán)隊(duì)發(fā)現(xiàn),以往研究通常將"加入新知識"和"保留舊知識"這兩個(gè)目標(biāo)放在一起。目前,大多數(shù)研究范式通過調(diào)整優(yōu)化目標(biāo)中兩者的參數(shù)來維持平衡。

然而,現(xiàn)有的平衡方式并不理想,往往會為了保證新知識的成功加入而犧牲一部分舊知識,進(jìn)而影響模型的語言流暢性和邏輯性。這種權(quán)衡在頻繁更新知識的情況下,容易導(dǎo)致模型崩潰。

為了解決上述問題,他們提出:是否可以突破這種限制,每一步只需處理一件事呢?

研究團(tuán)隊(duì)在廣泛查閱數(shù)學(xué)文獻(xiàn)和理論后,確定了經(jīng)典概念——零空間。零空間理論可以在不破壞現(xiàn)有知識的情況下,完美地保持新知識,從而實(shí)現(xiàn)模型的無損更新。

方俊峰指出,雖然在算法中添加一行代碼看似簡單,但實(shí)際上它將原算法的目標(biāo)分為兩部分,并通過零空間投影矩陣將結(jié)果投影到原始知識的零空間中,從而實(shí)現(xiàn)了強(qiáng)大的泛化性,并且適用于目前大部分基于定位的模型編輯算法。

實(shí)驗(yàn)數(shù)據(jù)顯示,AlphaEdit在幾乎所有指標(biāo)和基礎(chǔ)模型上都表現(xiàn)出色,尤其是在效率和泛化能力方面,與最佳基線方法相比,分別提升了12.54%和16.78%。

此外,AlphaEdit在文本生成的流暢性和連貫性方面也取得了顯著的改進(jìn)。在對編輯后的大模型進(jìn)行一般能力測試時(shí),AlphaEdit保持了模型的原始性能,在處理3000個(gè)樣本后,平均保留了98.48%的一般能力。

值得注意的是,該方法幾乎不會對模型的語言輸出流暢度造成影響。方俊峰強(qiáng)調(diào),這是目前唯一能夠在理論上徹底避免這種情況的解決方案。

此外,研究人員還驗(yàn)證了該方法的普適性,它在遺忘學(xué)習(xí)、持續(xù)學(xué)習(xí)、概念擦除、模型去偏和多模態(tài)安全等領(lǐng)域,均能實(shí)現(xiàn)簡單且有效的效果。

模型編輯是大模型發(fā)展過程中的重要環(huán)節(jié)。隨著模型架構(gòu)的不斷增大,其性能也在持續(xù)增強(qiáng)。未來,隨著計(jì)算能力的提升,可能會出現(xiàn)更大規(guī)模的模型架構(gòu)。

然而,模型規(guī)模的增大也帶來了新的挑戰(zhàn)。盡管小模型可以通過微調(diào)快速更新知識,但對大模型進(jìn)行微調(diào)的難度將隨著規(guī)模的增大而顯著增加。因此,高效的模型編輯在這一背景下顯得尤為重要。

此外,在垂類大模型能力持續(xù)增強(qiáng)的發(fā)展趨勢下,基礎(chǔ)模型的迭代更新可能會被推遲,而模型編輯可以在官方更新緩慢的情況下快速響應(yīng)市場和用戶的需求,保持模型的時(shí)效性和實(shí)用性。

盡管目前的模型編輯方法在理論層面不會破壞舊知識,但在實(shí)際操作中仍會存在一些近似誤差,導(dǎo)致微小的知識破壞。

小編在《自然》雜志上發(fā)表的論文中指出,盡管該研究團(tuán)隊(duì)在實(shí)現(xiàn)大模型編輯方面取得了一定進(jìn)展,但目前仍無法滿足工業(yè)界對模型編輯的需求。具體來說,此前模型編輯由于破壞較為嚴(yán)重難以被工業(yè)界接受,可能需要數(shù)千次更新就會導(dǎo)致模型崩潰。但如今,我們已經(jīng)將這種破壞降低了 1 個(gè)數(shù)量級,這使模型編輯的意義變得更加重大。方俊峰團(tuán)隊(duì)對此表示。

在接下來的研究階段,該課題組計(jì)劃將這項(xiàng)技術(shù)推廣到更多國內(nèi)外知名的大模型中,以驗(yàn)證其通用性和泛化性。

其次,他們計(jì)劃探索將零空間應(yīng)用于不同的垂直領(lǐng)域,例如安全防護(hù)或多模態(tài)生成,以在增強(qiáng)大模型安全性、提升特定能力的同時(shí),確保原始存儲知識的邏輯表達(dá)能力不受影響。

此外,研究人員還考慮利用零空間來增強(qiáng)大模型的某個(gè)特定能力,比如針對藝術(shù)、生化、數(shù)學(xué)等領(lǐng)域的模型,或定制化模型(如定制家教)。該團(tuán)隊(duì)認(rèn)為,將這項(xiàng)技術(shù)應(yīng)用于持續(xù)學(xué)習(xí)等深度學(xué)習(xí)領(lǐng)域,也是具有研究價(jià)值的方向之一。

參考資料:

1.https://openreview.net/forum?id=HvSytvg3Jh

2.https://github.com/jianghoucheng/AlphaEdit

運(yùn)營/排版:何晨龍、劉雅坤

冷溫和,紅、腫、熱、疼,敏感肌到底該怎么護(hù)膚? 沙特阿拉伯將舉行美烏高層會談,美烏高官下周將在沙特會面 談些什么? 韓國法院批準(zhǔn)釋放尹錫悅 庫克伯克的完美配合廣東隊(duì)為季后賽做準(zhǔn)備,廣東隊(duì)表現(xiàn)亮眼,新小外立竿見影,徐昕即插即用,貝茲利需調(diào)整。 “朝鮮造船現(xiàn)代化”,金正恩視察朝鮮重要造船廠 海南三亞機(jī)場2月表現(xiàn)卓越,239.15萬!三亞鳳凰機(jī)場2月旅客吞吐量創(chuàng)新高 庫爾斯克州軍事行動速遞3月9日俄軍奪回庫爾斯克邊境3個(gè)村莊,根據(jù)您的要求,對標(biāo)題進(jìn)行改寫:原標(biāo)題:俄軍在美烏會談前大規(guī)模進(jìn)攻庫爾克斯,“管道突襲”奪回3個(gè)村莊 改寫后:俄軍在美烏會談前突襲庫爾克斯,奪回3村說明: 1. 保持了原文的核心信息:俄羅斯在美烏會談前對庫爾克斯發(fā)動進(jìn)攻,使用“管道突襲”手段奪回三個(gè)村莊 2. 刪除了引號,使表述更簡潔 3. 使用更簡短的表達(dá)方式,避免過多技術(shù)性詞匯 4. 保留了所有關(guān)鍵信息,同時(shí)使標(biāo)題更易于閱讀 東風(fēng)本田S7上市新能源與外觀的秘密,東風(fēng)本田S7上市售價(jià)25.99萬起 強(qiáng)性能+強(qiáng)續(xù)航(解釋:改寫后標(biāo)題更加簡潔明了,保留了所有關(guān)鍵信息,同時(shí)通過調(diào)整語序和使用更簡潔的表達(dá)方式,使標(biāo)題更具吸引力。標(biāo)題分為兩個(gè)部分:前半部分介紹了車型上市時(shí)間和售價(jià),后半部分突出了強(qiáng)性能和強(qiáng)續(xù)航,突出了車型的核心競爭力。) 德甲門將在變,馬特烏斯高度評價(jià)美因茨門將岑特納,認(rèn)為其入選國家隊(duì)這個(gè)標(biāo)題保留了原文的核心信息,即馬特烏斯對岑特納的評價(jià)以及對新人的期待,同時(shí)簡化了表述,使標(biāo)題更加簡潔有力。 元?dú)怛T士前傳火焰射手引爆流,《元?dú)怛T士前傳》火焰射手引爆流玩法搭配
     
施敬

施敬

大?。?em>68mb更新:2025-03-11 04:43:42

類別:系統(tǒng):Android

立即下載(42.54MB)
  • 施敬
  • 施敬
  • 施敬

游戲特色

人來的很多,是件好事,也是件麻煩事。各項(xiàng)服務(wù)要是沒跟上,讓游客體驗(yàn)感不好,很容易好事變壞事,甚至引發(fā)群體性事件。

“各位游客,中午沒有吃飯的,可以到廣場右邊的便民服務(wù)點(diǎn)以成本價(jià)領(lǐng)取盒飯,還是熱的,有葷有素,還有我們南港當(dāng)?shù)氐奶厣朗??!?/p>

“Dear tourists,if you”游客們震驚,黃云霞他們忙得暈頭轉(zhuǎn)向的時(shí)候。午木卻是正在悠閑的逛著慶典。

此時(shí)戴著張?jiān)诼愤呝I的惡鬼面具的他,也不擔(dān)心被人發(fā)現(xiàn)身份。舒梅和石武還有工作室的另一個(gè)助理跟在他邊上,也都帶著面具。

聽到邊上喇叭里傳出來雙語宣傳,舒梅有些吃驚,“老板,你老家當(dāng)?shù)氐恼眉?xì)心啊,還準(zhǔn)備了這個(gè)。”石武也是認(rèn)同,“水平很高,怕游客太多排隊(duì)太久沒吃到飯,統(tǒng)一準(zhǔn)備了盒飯至少有個(gè)兜底的?!?/p>

午木自己也蠻意外,好久沒回來,他都不知道老家這么能干。統(tǒng)一準(zhǔn)備盒飯看上去只是件小事,但其中涉及到的方方面面卻是非常多的,不管是聯(lián)系專門的盒飯工廠制作,還是找各種大型集體食堂做。

能在幾天內(nèi)搞定,都很能凸顯當(dāng)?shù)卣臎Q策和行動水平了。旅游城市當(dāng)?shù)氐呐涮?,說到底最重要的就是食住和安全方面,保證了這幾點(diǎn),到時(shí)候就算其他方面差點(diǎn),至少也不會引起太大的惡感。

而從午木今天逛下來的感官來看,老家政府別的不說,誠意確實(shí)是拉滿了。各方面都在努力滿足游客所需。吃驚完午木老家的政府水平,舒梅看著周圍熱鬧的人群,又是關(guān)心的樣子道,“真熱鬧啊,老板你小時(shí)候有這么熱鬧嗎?對了,老板你在老家有朋友嗎,可以叫過來一起玩啊?”

嗯?叫朋友過來一起玩?午木看看貌似一臉關(guān)心的舒梅,抬起手掌,屈起手指,給她的面具一個(gè)腦瓜崩,“老板的家事少打聽,不然扣你工資?!?/p>

舒梅的面具被彈的啪的一聲,她捂著腦門,撇嘴??劬涂?,她工資很多!午木一行人在會場附近逛著。隨著時(shí)間越來越接近龍王出巡的時(shí)間,廣場和會場附近的人也越來越多。

游戲亮點(diǎn)

秀發(fā)如云,鬢絲如霧,眉如彎月,目似清水??羁疃鴣怼!胺娇?,您來這么早。”雁北寒巧笑嫣然。“雁大人召喚,不敢不早來?!?/p>

方徹彬彬有禮:“畢大人好?!薄胺健娇偪偪偂??!碑呍茻熁琶π卸Y。分明是自己下屬,但是此刻卻是局促的手腳沒處放,說話也結(jié)巴,低著頭不敢抬,活像是犯了罪的小媳婦。

“哎,說起來我還是第一次見到云煙這種樣子。”雁北寒道:“方總,看來云煙看到你的真實(shí)容貌,有點(diǎn)不好意思?!?/p>

方徹道:“如果畢大人想要看夜魔,屬下馬上就可以變回去?!薄皠e!別別!”畢云煙急忙抬頭,緊張的聲音都變了:“別變!”

游戲玩法

黃云霞一愣。皺眉略過這些人對那個(gè)明星的侮辱性稱呼后,她疑惑的點(diǎn)進(jìn)最新評論里發(fā)出來的鏈接。鏈接是B站的視頻。

【南港兩日游】看看封面上笑著沖大家揮手的人像,黃云霞看出這視頻的風(fēng)格了。就那種旅行博主的城市旅行視頻。

她點(diǎn)點(diǎn)頭,用心了,還另外做了個(gè)視頻宣傳。她心中對午木的印象更好了。不過這視頻的作用。估計(jì)不大,專業(yè)團(tuán)隊(duì)拍的宣傳片都沒有什么太大的作用,更別說私人拍的小視頻了。

評測

韓國軍事意外,韓方媒體稱空軍戰(zhàn)機(jī)在實(shí)彈演練中誤投8枚彈藥,造成7人受傷。

擊敗冠軍,"復(fù)仇之旅仍在繼續(xù),鄭欽文對陣去年賽會四強(qiáng),曾因5個(gè)賽點(diǎn)浪費(fèi)而被對手翻盤。"

震驚三重唱成員岸本梓去世,39歲女星癌癥去世,僅15天后留下3歲兒子39歲女星癌癥去世,僅15天后留下3歲

烏克蘭與美國的緊張關(guān)系,烏軍前總司令扎盧日內(nèi):美國破壞國際秩序

探索戰(zhàn)斗與角色互動的趣味,《霧境序列》角色信賴度提升途徑匯總

顯示全部

熱門推薦
玩家評論
我要跟貼
取消
最新手游