国产亚洲欧美在线观看精品,а√天堂中文在线资源bt种子,国产亚洲精品自在线亚洲页码,日本一区二区不卡高清久久久

站長之家 - 業(yè)界 2025-03-12 15:23:29

DeepSeek開源R1-Omni,阿里新開源項(xiàng)目R1-Omni首次結(jié)合全模態(tài)情感識(shí)別技術(shù)

聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。

首次將DeepSeek同款的RLVR技術(shù)成功應(yīng)用于全模態(tài)大語言模型,并特別關(guān)注含視頻內(nèi)容的場景。

通義實(shí)驗(yàn)室的薄列峰團(tuán)隊(duì)再次推出了開源的R1-Omni模型。

同樣在杭州,通義實(shí)驗(yàn)室的開源活動(dòng)引發(fā)了關(guān)注,有人戲稱"開源雙feng",寓意著開源的力量。

他們又做了哪些創(chuàng)新工作?

DeepSeek-R1模型成功推動(dòng)了RLVR技術(shù)的普及,此前的研究團(tuán)隊(duì)已將RLVR應(yīng)用于圖像-文本多模態(tài)LLM,其在幾何推理和視覺計(jì)數(shù)等任務(wù)中展現(xiàn)出卓越的性能。

盡管如此,目前尚未有研究將RLVR技術(shù)與包含音頻和動(dòng)態(tài)視覺內(nèi)容的全模態(tài)LLM進(jìn)行結(jié)合。

通義實(shí)驗(yàn)室的薄列峰團(tuán)隊(duì)首次將RLVR技術(shù)應(yīng)用于全模態(tài)LLM,重點(diǎn)研究了視覺和音頻模態(tài)協(xié)同作用的情感識(shí)別任務(wù)。

實(shí)驗(yàn)結(jié)果表明,該模型在多個(gè)關(guān)鍵指標(biāo)上取得了顯著提升:

引入RLVR技術(shù)不僅提升了模型在訓(xùn)練數(shù)據(jù)集上的性能表現(xiàn),還在分布外數(shù)據(jù)集上表現(xiàn)出更強(qiáng)的魯棒性。

改進(jìn)后的模型在推理速度和資源利用率上都有顯著提升,更重要的是,其在情感識(shí)別過程中各模態(tài)之間的相互作用分析能力得到了明顯增強(qiáng)。

R1-Omni在這一領(lǐng)域也受到了不少網(wǎng)友的關(guān)注:

可解釋性與多模態(tài)學(xué)習(xí)被認(rèn)為是下一代AI研究的重要方向之一。

讓我們具體了解一下R1-Omni。

R1-Omni長啥樣?

在研究方法上,論文首先介紹了與DeepSeek同款的RLVR和GRPO算法。

RLVR是一種創(chuàng)新的訓(xùn)練方法,其核心思想是通過驗(yàn)證函數(shù)直接評(píng)估輸出結(jié)果,無需依賴傳統(tǒng)的人類偏好導(dǎo)向的獎(jiǎng)勵(lì)模型。

當(dāng)給定輸入問題q時(shí),策略模型πθ生成響應(yīng)o,隨后應(yīng)用可驗(yàn)證獎(jiǎng)勵(lì)函數(shù)R(q,o)對(duì)其進(jìn)行評(píng)估,其核心目標(biāo)是通過最大化驗(yàn)證獎(jiǎng)勵(lì)減去KL散度正則化項(xiàng)來優(yōu)化模型。

該方法在簡化獎(jiǎng)勵(lì)機(jī)制的同時(shí),確保了其與任務(wù)內(nèi)在評(píng)價(jià)標(biāo)準(zhǔn)的一致性。

GRPO是一種全新的強(qiáng)化學(xué)習(xí)方法,與現(xiàn)有的PPO等傳統(tǒng)方法不同,PPO依賴于一個(gè)評(píng)論家模型來評(píng)估候選策略的性能,而GRPO直接比較生成的響應(yīng)組,無需依賴額外的評(píng)論家模型,從而簡化了整個(gè)訓(xùn)練流程。

通過引入歸一化評(píng)分機(jī)制,GRPO算法鼓勵(lì)模型在組內(nèi)優(yōu)先選擇獎(jiǎng)勵(lì)值更高的響應(yīng),從而增強(qiáng)了模型區(qū)分高質(zhì)量和低質(zhì)量輸出的能力。

參考DeepSeek-R1中的方法論,研究團(tuán)隊(duì)將GRPO與RLVR進(jìn)行了整合,形成了新的研究框架。

在R1-Omni模型的開發(fā)過程中,團(tuán)隊(duì)基于DeepSeek-R1訓(xùn)練方法的啟發(fā),設(shè)計(jì)了一種冷啟動(dòng)方案。

該研究在整合了232個(gè)可解釋多模態(tài)數(shù)據(jù)集(包含視覺和音頻樣本)以及348個(gè)人工標(biāo)注的HumanOmni數(shù)據(jù)集樣本的綜合數(shù)據(jù)集上,對(duì)開源全模態(tài)模型HumanOmni-0.5B進(jìn)行了微調(diào)訓(xùn)練,以提升其情感識(shí)別能力。通過這一過程,模型能夠初步理解視覺和音頻線索對(duì)情感識(shí)別的影響。

在微調(diào)優(yōu)化階段,研究團(tuán)隊(duì)采用了基于RLVR的訓(xùn)練方法,其獎(jiǎng)勵(lì)函數(shù)由準(zhǔn)確率獎(jiǎng)勵(lì)和格式獎(jiǎng)勵(lì)組成。準(zhǔn)確率獎(jiǎng)勵(lì)用于評(píng)估模型預(yù)測情感與真實(shí)情感的匹配度,而格式獎(jiǎng)勵(lì)則確保了模型輸出符合指定的HTML標(biāo)簽格式。

模型輸出設(shè)計(jì)包括兩個(gè)主要部分:第一部分是一個(gè)推理過程,內(nèi)容被封裝在特定的標(biāo)簽內(nèi),詳細(xì)解釋了模型如何整合視覺和音頻信息得出預(yù)測結(jié)論;第二部分則是一個(gè)情感標(biāo)簽,同樣被封裝在標(biāo)簽內(nèi),表示最終預(yù)測的情感。

推理/理解/泛化三方面提升

在實(shí)驗(yàn)評(píng)估中,研究者將R1-Omni與三個(gè)基線模型進(jìn)行了對(duì)比:原始的HumanOmni-0.5B、在EMER數(shù)據(jù)集上進(jìn)行監(jiān)督微調(diào)的模型EMER-SFT,以及直接在MAFW和DFEW訓(xùn)練集上基于HumanOmni-0.5B進(jìn)行監(jiān)督微調(diào)的模型MAFW-DFEW-SFT。

評(píng)估指標(biāo)主要采用無加權(quán)平均召回率(UAR)和加權(quán)平均召回率(WAR),這些指標(biāo)能夠有效衡量模型在不同情感類別中準(zhǔn)確分類情感的能力。

值得注意的是,所有評(píng)估實(shí)驗(yàn)均在開放詞匯情感測試(OV-emotion)協(xié)議下進(jìn)行。在這種設(shè)置下,模型無需依賴預(yù)定義的情感類別,而是能夠直接從輸入數(shù)據(jù)中生成情感標(biāo)簽,這不僅增加了評(píng)估的挑戰(zhàn)性,也為實(shí)際應(yīng)用提供了更高的價(jià)值。

實(shí)驗(yàn)結(jié)果顯示,R1-Omni在三個(gè)關(guān)鍵指標(biāo)上均優(yōu)于其他三個(gè)對(duì)比模型:推理能力的提升、理解能力的增強(qiáng)、以及泛化能力的顯著提高。

研究者通過一系列可視化示例展示了R1-Omni與其它三個(gè)模型的輸出對(duì)比,結(jié)果顯示R1-Omni能夠提供更加連貫、準(zhǔn)確且易于理解的推理過程。

相比之下,原始HumanOmni-0.5B模型在推理能力方面表現(xiàn)較為有限,而EMER-SFT模型雖然具備一定的推理能力,但其推理過程的連貫性較差且容易產(chǎn)生主觀臆斷。MAFW-DFEW-SFT模型雖然在某些方面有所提升,但整體表現(xiàn)仍無法與R1-Omni相媲美。

在MAFW和DFEW數(shù)據(jù)集上,R1-Omni在UAR和WAR指標(biāo)上均表現(xiàn)優(yōu)于其他模型。

例如,在DFEW數(shù)據(jù)集上,R1-Omni實(shí)現(xiàn)了65.83%的UAR和56.27%的WAR,顯著優(yōu)于MAFW-DFEW-SFT的60.23%UAR和44.39%WAR。

為了評(píng)估模型的泛化能力,研究者在RAVDESS數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),該數(shù)據(jù)集被用作分布外(OOD)測試集。

與主要由電影片段組成的MAFW和DFEW數(shù)據(jù)集不同,RAVDESS數(shù)據(jù)集的特點(diǎn)是以中性北美口音發(fā)表詞匯匹配的陳述,這種顯著的數(shù)據(jù)分布差異使得RAVDESS成為評(píng)估模型在未見場景下泛化能力的理想基準(zhǔn)。

R1-Omni在RAVDESS數(shù)據(jù)集上相較于MAFW-DFEW-SFT模型實(shí)現(xiàn)了顯著提升,UAR和WAR分別為43.00%和44.69%。

目前,基礎(chǔ)模型HumanOmni-0.5B、冷啟動(dòng)模型EMER-SFT,以及MAFW-DFEW-SFT和最終模型R1-Omni均已開源。

[1]https://arxiv.org/abs/2503.05379[2]https://github.com/HumanMLLM/R1-Omni

南桃北柳,楊柳青年畫的南北二派 疾風(fēng)勁弓,怪物獵人荒野:輪椅弓配裝方法介紹 招募系統(tǒng)技巧干員獲取全解析,《明日方舟:終末地》招募攻略 合作速遞,曝某新勢力與法拉利合作 腦洞大開的攻略,《腦洞非常大》擺爛通關(guān)攻略 25分鐘啟航開啟低空交通新時(shí)代,上海浦東低空交通運(yùn)輸體系建設(shè)今日試飛部分航線 硬核實(shí)力派,全球首款純電SUV 10.98萬起售,直擊自主新能源領(lǐng)域——豐田推出全新緊湊型SUV(解釋:1. "全球第一拼了!"改為"全球首款",更簡潔明了2. "豐田純電緊湊型SUV"改為"全新緊湊型SUV",更符合中文表達(dá)習(xí)慣3. "10.98萬起售"保留,價(jià)格信息不變4. "硬剛自主新能源"改為"直擊自主新能源領(lǐng)域",更簡潔有力5. 語序調(diào)整為先講車型,再講價(jià)格,最后點(diǎn)出挑戰(zhàn)領(lǐng)域,邏輯更清晰6. 整體標(biāo)題更簡潔有力,同時(shí)準(zhǔn)確傳達(dá)了豐田推出新車型的核心信息) 合作開源違規(guī)整頓辟謠 truth,早資道 | 阿里通義回應(yīng)與Manus的合作;華為內(nèi)部通報(bào)整頓"違規(guī)招聘" 夏季防曬飲食小貼士,防曬食譜:意想不到的"光敏感食物"大集合說明:1. 保持了原文的核心內(nèi)容,將"防曬飲食攻略"改為更簡潔的"防曬食譜"2. 將"揭秘你意想不到的"改為更口語化的"意想不到的"3. 使用"大集合"使標(biāo)題更完整4. 調(diào)整了語序,使標(biāo)題更流暢5. 保留了關(guān)鍵信息:防曬、光敏食物6. 整體標(biāo)題更加簡潔明了,易于理解 荒野裝備蟲棍畢業(yè)裝搭配與飛行騎乘技巧,怪物獵人荒野之息蟲棍畢業(yè)裝搭配推薦-蟲棍畢業(yè)配裝指南
     
蔣雯麗是猶太人嗎

蔣雯麗是猶太人嗎

大小:88mb更新:2025-03-12 15:23:29

類別:系統(tǒng):Android

立即下載(42.54MB)
  • 蔣雯麗是猶太人嗎
  • 蔣雯麗是猶太人嗎
  • 蔣雯麗是猶太人嗎

游戲特色

“四翅千足玉,隨身攜帶可溫養(yǎng)神魂,周公子若是有需要,將其捏碎,跟著內(nèi)里蠱蟲便能尋到我?!痹谎凵耖W爍片刻,道:

“有些貴重了?!泵缃訐u了搖頭,道:“不瞞公子,我此行來中原除了參與大比以外,還是為了結(jié)交你們這些青年才俊。你應(yīng)當(dāng)知曉,我們這些山野蠱民想要融入進(jìn)你們中原,光靠實(shí)力是遠(yuǎn)遠(yuǎn)不夠的,所以此禮也算先結(jié)個(gè)善緣。”

元昊聞言立刻笑了:“善緣?金姑娘的想法倒是與我不謀而合了?!弊灾鬈娨环胶螅槐阆騺碛袀€(gè)好習(xí)慣,就如同那下九流中的賊道在犯事之前總會(huì)先行踩點(diǎn),他在率軍覆滅一地之前也會(huì)視情況先去當(dāng)?shù)毓涔洹?/p>

一是親自踩點(diǎn)能更了解當(dāng)?shù)厍闆r,畢竟紙上得來終覺淺。二便是為提前結(jié)下一些緣分。有了緣分,便有交情,等戰(zhàn)爭來臨,屠殺這些有交情之人能讓他更興奮.苗疆女子眸子彎成兩條月牙:

“看來周公子所在世家也需要盟友,那我們興許會(huì)有很多話說了?!薄澳鞘亲匀唬贿^周某來劍宗山門還有宗門之事需要處理?!?/p>

元昊沒有否認(rèn),笑呵呵將蠱蟲琥珀收入懷中,道:“此物周某便在此謝過了,至于還禮便等我二人下次見面,如何?”

苗疆女子頓感眼前之人有趣,彎眸笑道:“那小女子可得好好期待一下了?!薄?”元昊半瞇眼睛,盯著女子看了兩息,森白的牙齒微露,笑道:“放心,屆時(shí)還禮一定讓金姑娘滿意?!?/p>

“.”二人說話間,座下航獸已然來到了主峰南側(cè)山腰一座巨大的落禽臺(tái)上方,這是劍宗專門用來接待來客的地界。

從窗欞向外望去,鳳啼漫天,可見各類航獸在其中起落,且不時(shí)便從落地的航獸中走出一兩個(gè)氣息不俗的修者。一同下了航獸,疤臉男直接逃也似的離開了,空余元昊與金姓女子二人同行。

出了落獸臺(tái),深秋時(shí)節(jié)的滿山紅葉極為瑰麗,而在這林海中可見一條階梯,一邊向上通往劍宗,一邊向下通往山城。

游戲亮點(diǎn)

“我們在夏師弟的帶領(lǐng)下,滅殺了柴家柴逸等七位子弟,收獲了大量修行資源,弟子還獲得了一件法寶烏山印?!崩钔u湊過去,壓低聲音說道,仿若生怕隔壁有耳一樣。

“什么!”饒是蕭鴻儀有了點(diǎn)心理準(zhǔn)備,聽到這話還是控制不住渾身一震,驚呼出聲。實(shí)在是這消息太過震撼了。

歷次涅焱古荒墟探險(xiǎn),都是五大修仙家族在最后時(shí)刻狩獵他們這些大玄國外的宗門弟子,又哪有他們獵殺五大修仙家族子弟的份?

結(jié)果,現(xiàn)在倒好這四個(gè)家伙,竟然反倒獵殺了柴家子弟,而且還是七位,這簡直駭人聽聞,喪心病狂啊!許久,蕭鴻儀方才從這驚天消息中慢慢緩過神來,深吸好幾口氣,道:“后生可畏,后生可畏,你們比我們這一代還要膽大許多??!不過,你們怎么只逮住柴家一家劫殺?”

游戲玩法

“咳咳咳你爺爺說這話的時(shí)候都已經(jīng)老年癡呆,胡話你也信?”宇智波銀聞言表情一僵,微瞇的雙眼透出森森寒芒,

好你個(gè)宇智波淼,居然敢背地里損害我的光輝形象,看我回波之國怎么收拾你!“但是副族長也是這么說的啊。”

“童言無忌?!薄澳亲彘L也.”“停!我們還是回歸到你的問題吧。”表情陰沉的宇智波銀,將誹謗自己的幾人記上小本本后,轉(zhuǎn)而將目光落在神情萎靡的宇智波鏡身上,“身為宇智波一族,想要變強(qiáng)其實(shí)很簡單?!?/p>

評(píng)測

OPPO新機(jī)超驍龍6 Gen1天璣6300性能強(qiáng)勁設(shè)計(jì)創(chuàng)新,OPPO新機(jī)搭載驍龍6 Gen1和天璣6300芯片,跑分?jǐn)?shù)據(jù)曝光

測試服全新功能體驗(yàn),《劍網(wǎng)3》環(huán)身特效稱號(hào)位置自定義介紹

深淵副本靈魂碎片獲取攻略,《再刷一把2:金色傳說》靈魂碎片獲取攻略

龍屬性武器秘籍屬性傷害公式解析 龍屬性武器升級(jí)屬性傷害的秘密 龍屬性武器挑戰(zhàn)屬性傷害與異常值,怪物獵人荒野龍屬性傷害構(gòu)成分析

逆襲技能,荒野太刀逆襲技能的優(yōu)點(diǎn)有哪些?太刀逆襲技能優(yōu)點(diǎn)解析

顯示全部

熱門推薦
玩家評(píng)論
我要跟貼
取消
最新手游