- 揭秘卡牌玄機(jī),《影之詩(shī)》凈化之圣彈圖鑒介紹
- 揭開(kāi)神秘面紗之路,《影之詩(shī)》必殺之魔彈圖鑒介紹
- 深入探索,《影之詩(shī)》魔導(dǎo)狙擊手?瓦路茲圖鑒介紹
- 揭秘角色背后的故事,《三國(guó)如龍傳》馬云祿圖鑒
- 深入探索卡牌魅力,《影之詩(shī)》沉默的女仆諾嘉圖鑒介紹
- 探索英雄魅力,《三國(guó)如龍傳》周泰圖鑒
- 揭示英雄風(fēng)采,《三國(guó)如龍傳》凌統(tǒng)圖鑒
- 深入卡牌解析,《影之詩(shī)》漆黑女王?瑪格娜絲圖鑒簡(jiǎn)介
- 深入探索,《影之詩(shī)》伊梅拉(命運(yùn)抉擇)圖鑒簡(jiǎn)介
- 揭秘角色魅力,《三國(guó)如龍傳》丁原圖鑒
聲明:本文來(lái)自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
最近,中國(guó)科學(xué)技術(shù)大學(xué)的研究團(tuán)隊(duì)研發(fā)了一種名為AlphaEdit的精準(zhǔn)編輯算法,該算法為大型語(yǔ)言模型的知識(shí)更新和管理提供了一種高效解決方案。
該算法的核心在于,在對(duì)模型進(jìn)行知識(shí)更新時(shí),將參數(shù)變化投影到原始知識(shí)的零空間中。這種方法理論上能夠確保在定向更新模型中的錯(cuò)誤、過(guò)時(shí)或不安全知識(shí)時(shí),不會(huì)對(duì)模型的通用能力造成干擾。
研究人員在主流編輯方法中僅增加一行代碼,就實(shí)現(xiàn)了Llama 3在知識(shí)編輯任務(wù)上的性能提升達(dá)35%。
該方法具有廣泛的適用性,可以應(yīng)用于大多數(shù)常用的模型編輯算法,并在論文中接受了驗(yàn)證。
論文的審稿人評(píng)價(jià)稱:"該研究成功解決了當(dāng)前模型編輯中知識(shí)更新與知識(shí)保留之間難以平衡的問(wèn)題。"
相關(guān)論文《AlphaEdit:基于零空間約束的語(yǔ)言模型知識(shí)編輯》(AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models)已發(fā)表在國(guó)際學(xué)習(xí)表征會(huì)議(ICLR 2025,International Conference on Learning Representations)上,并被選為 orally presentation(僅占投稿總數(shù)的1.8%)。
中國(guó)科學(xué)技術(shù)大學(xué)的博士生方俊峰和碩士生姜厚丞是共同第一作者,王翔教授和何向南教授擔(dān)任共同通訊作者。
該研究團(tuán)隊(duì)發(fā)現(xiàn),以往研究通常將"加入新知識(shí)"和"保留舊知識(shí)"這兩個(gè)目標(biāo)放在一起。目前,大多數(shù)研究范式通過(guò)調(diào)整優(yōu)化目標(biāo)中兩者的參數(shù)來(lái)維持平衡。
然而,現(xiàn)有的平衡方式并不理想,往往會(huì)為了保證新知識(shí)的成功加入而犧牲一部分舊知識(shí),進(jìn)而影響模型的語(yǔ)言流暢性和邏輯性。這種權(quán)衡在頻繁更新知識(shí)的情況下,容易導(dǎo)致模型崩潰。
為了解決上述問(wèn)題,他們提出:是否可以突破這種限制,每一步只需處理一件事呢?
研究團(tuán)隊(duì)在廣泛查閱數(shù)學(xué)文獻(xiàn)和理論后,確定了經(jīng)典概念——零空間。零空間理論可以在不破壞現(xiàn)有知識(shí)的情況下,完美地保持新知識(shí),從而實(shí)現(xiàn)模型的無(wú)損更新。
方俊峰指出,雖然在算法中添加一行代碼看似簡(jiǎn)單,但實(shí)際上它將原算法的目標(biāo)分為兩部分,并通過(guò)零空間投影矩陣將結(jié)果投影到原始知識(shí)的零空間中,從而實(shí)現(xiàn)了強(qiáng)大的泛化性,并且適用于目前大部分基于定位的模型編輯算法。
實(shí)驗(yàn)數(shù)據(jù)顯示,AlphaEdit在幾乎所有指標(biāo)和基礎(chǔ)模型上都表現(xiàn)出色,尤其是在效率和泛化能力方面,與最佳基線方法相比,分別提升了12.54%和16.78%。
此外,AlphaEdit在文本生成的流暢性和連貫性方面也取得了顯著的改進(jìn)。在對(duì)編輯后的大模型進(jìn)行一般能力測(cè)試時(shí),AlphaEdit保持了模型的原始性能,在處理3000個(gè)樣本后,平均保留了98.48%的一般能力。
值得注意的是,該方法幾乎不會(huì)對(duì)模型的語(yǔ)言輸出流暢度造成影響。方俊峰強(qiáng)調(diào),這是目前唯一能夠在理論上徹底避免這種情況的解決方案。
此外,研究人員還驗(yàn)證了該方法的普適性,它在遺忘學(xué)習(xí)、持續(xù)學(xué)習(xí)、概念擦除、模型去偏和多模態(tài)安全等領(lǐng)域,均能實(shí)現(xiàn)簡(jiǎn)單且有效的效果。
模型編輯是大模型發(fā)展過(guò)程中的重要環(huán)節(jié)。隨著模型架構(gòu)的不斷增大,其性能也在持續(xù)增強(qiáng)。未來(lái),隨著計(jì)算能力的提升,可能會(huì)出現(xiàn)更大規(guī)模的模型架構(gòu)。
然而,模型規(guī)模的增大也帶來(lái)了新的挑戰(zhàn)。盡管小模型可以通過(guò)微調(diào)快速更新知識(shí),但對(duì)大模型進(jìn)行微調(diào)的難度將隨著規(guī)模的增大而顯著增加。因此,高效的模型編輯在這一背景下顯得尤為重要。
此外,在垂類大模型能力持續(xù)增強(qiáng)的發(fā)展趨勢(shì)下,基礎(chǔ)模型的迭代更新可能會(huì)被推遲,而模型編輯可以在官方更新緩慢的情況下快速響應(yīng)市場(chǎng)和用戶的需求,保持模型的時(shí)效性和實(shí)用性。
盡管目前的模型編輯方法在理論層面不會(huì)破壞舊知識(shí),但在實(shí)際操作中仍會(huì)存在一些近似誤差,導(dǎo)致微小的知識(shí)破壞。
小編在《自然》雜志上發(fā)表的論文中指出,盡管該研究團(tuán)隊(duì)在實(shí)現(xiàn)大模型編輯方面取得了一定進(jìn)展,但目前仍無(wú)法滿足工業(yè)界對(duì)模型編輯的需求。具體來(lái)說(shuō),此前模型編輯由于破壞較為嚴(yán)重難以被工業(yè)界接受,可能需要數(shù)千次更新就會(huì)導(dǎo)致模型崩潰。但如今,我們已經(jīng)將這種破壞降低了 1 個(gè)數(shù)量級(jí),這使模型編輯的意義變得更加重大。方俊峰團(tuán)隊(duì)對(duì)此表示。
在接下來(lái)的研究階段,該課題組計(jì)劃將這項(xiàng)技術(shù)推廣到更多國(guó)內(nèi)外知名的大模型中,以驗(yàn)證其通用性和泛化性。
其次,他們計(jì)劃探索將零空間應(yīng)用于不同的垂直領(lǐng)域,例如安全防護(hù)或多模態(tài)生成,以在增強(qiáng)大模型安全性、提升特定能力的同時(shí),確保原始存儲(chǔ)知識(shí)的邏輯表達(dá)能力不受影響。
此外,研究人員還考慮利用零空間來(lái)增強(qiáng)大模型的某個(gè)特定能力,比如針對(duì)藝術(shù)、生化、數(shù)學(xué)等領(lǐng)域的模型,或定制化模型(如定制家教)。該團(tuán)隊(duì)認(rèn)為,將這項(xiàng)技術(shù)應(yīng)用于持續(xù)學(xué)習(xí)等深度學(xué)習(xí)領(lǐng)域,也是具有研究?jī)r(jià)值的方向之一。
參考資料:
1.https://openreview.net/forum?id=HvSytvg3Jh
2.https://github.com/jianghoucheng/AlphaEdit
運(yùn)營(yíng)/排版:何晨龍、劉雅坤
俄空防系統(tǒng)摧毀烏克蘭無(wú)人機(jī),庫(kù)爾斯克戰(zhàn)場(chǎng) intense combat! RUSSIA taps天然氣管道突襲敵后, Ukrainian forces suffer significant setbacks! 冠軍晉級(jí),鄭欽文重返WTA世界八強(qiáng)!一場(chǎng)比賽,排名躍升60分(以上改寫(xiě)保持了原文核心信息,同時(shí)簡(jiǎn)化了表達(dá),使標(biāo)題更簡(jiǎn)潔明了,信息傳達(dá)更直接。) 哪吒票房神話,哪吒逆市再創(chuàng)票房新高 探索清除毒霧的方法,《星球重啟》去除毒霧方法分享 經(jīng)濟(jì)衰退預(yù)測(cè),特朗普指出美國(guó)經(jīng)濟(jì)正經(jīng)歷"過(guò)渡期",今年衰退可能到來(lái)(解釋:這個(gè)改寫(xiě)版本保留了原文的核心信息,即特朗普的觀點(diǎn),但通過(guò)簡(jiǎn)化表述和調(diào)整語(yǔ)序,使標(biāo)題更加簡(jiǎn)潔明了。同時(shí),使用了更正式的表達(dá)方式,適合作為標(biāo)題使用。) 小票上的秘密雙酚A或致癌,患癌博主提醒熱敏紙或致癌!真相是…… 打擊犯罪嚴(yán)懲罪犯,法院對(duì)挑戰(zhàn)底線的罪惡分子依法嚴(yán)懲,決不姑息。 澤連斯基愿意辭職,烏總統(tǒng)澤連斯基愿意辭職以換取烏克蘭加入北約烏總統(tǒng)澤連斯基稱烏克蘭加入北約可換取其卸任烏總統(tǒng)澤連斯基愿意以卸任換取烏克蘭入北約烏總統(tǒng)澤連斯基稱烏克蘭可入北約換卸任烏總統(tǒng)澤連斯基愿意以卸任換取烏克蘭入北約 揭秘汪小菲給大S的錢(qián)時(shí)間點(diǎn)吻合真相,汪小菲律師驚人線索曝光,具俊曄大S被卷入,露馬腳了! 冠軍橫掃晉級(jí)16強(qiáng),鄭欽文救球摔倒+膝蓋流血贏得10萬(wàn)美元獎(jiǎng)金