- 游戲技巧指南,我的世界連鎖采集怎么設(shè)置
- 探索隱藏路徑,王國拯救者成就無法解鎖原因解析
- 奇妙角色背后的秘密,米塔小米塔是誰-小米塔信息介紹
- 探索江湖秘境,燕云十六聲曹生書畫店在哪
- 生存之道揭示,SCP實(shí)驗(yàn)室武裝遇SCP應(yīng)對(duì)指南
- 游戲冒險(xiǎn)指南,燕云十六聲孤舟獨(dú)影任務(wù)攻略
- 揭開全新篇章,完美約會(huì)什么時(shí)候發(fā)售
- 活潑與趣味,米塔帽子米塔是誰-帽子米塔信息介紹
- 逃跑策略全解析,SCP秘密實(shí)驗(yàn)室逃跑遇SCP應(yīng)對(duì)指南
- 探索鮮明個(gè)性,米塔善良米塔是誰-善良米塔信息介紹
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
近期DeepSeek迅速崛起,不僅在科技領(lǐng)域引起了廣泛關(guān)注,而且已經(jīng)深入到普通人的日常生活,甚至在一些政府部門的應(yīng)用中也開始見到其身影。那么,大家自然也會(huì)好奇,為何中國在人工智能時(shí)代能夠不斷涌現(xiàn)出火爆的產(chǎn)品?復(fù)旦大學(xué)中國研究院的特邀研究員汪濤老師對(duì)此進(jìn)行了深入淺出的解析。
汪濤老師主題演講是關(guān)于中文在人工智能時(shí)代的優(yōu)勢(shì)。DeepSeek之所以能夠迅速崛起,關(guān)鍵并不是其在技術(shù)上獲得了突破性的進(jìn)展,而是其效率獲得了數(shù)量級(jí)的提升,使得在相同性能下,成本可以降低近20倍。這種現(xiàn)象的出現(xiàn),源于研發(fā)團(tuán)隊(duì)幾乎挖掘了所有可能提升效率的技術(shù)。具體而言,他們采用了更底層的編程語言如PTX,這種底層語言的效率通常更高,但編程難度也隨之增加。此外,他們還適當(dāng)降低了精度,例如采用1個(gè)字節(jié)的8位浮點(diǎn)運(yùn)算,而非32位,從而顯著減少了存儲(chǔ)量和運(yùn)算量。
在人工智能領(lǐng)域,有一個(gè)專業(yè)的術(shù)語叫量化,還有采用蒸餾方法大大減少參數(shù)數(shù)量。另外還有混合專家架構(gòu)(MoE),以及多頭潛在注意力技術(shù)(MLA)。這些技術(shù)本身并不是完全由DeepSeek首創(chuàng),它們?cè)诿绹斯ぶ悄墚a(chǎn)業(yè)界的相關(guān)專業(yè)人員早已有所了解,但為何DeepSeek能夠?qū)⑦@些技術(shù)發(fā)揮到極致呢?我們可以從一個(gè)更易于理解的角度來探討:中文在人工智能時(shí)代所具有的技術(shù)優(yōu)勢(shì)。
DeepSeek正是充分利用了中文的技術(shù)優(yōu)勢(shì),所以其迅速崛起之后,立刻引起了人們的廣泛關(guān)注。
如果我們回顧一下兩百年來的發(fā)展歷程,我們對(duì)于中文在現(xiàn)代科技中的作用,經(jīng)歷了一個(gè)逐漸演變的過程。
在中國古代,中文對(duì)周邊地區(qū)文化的影響具有壓倒性的優(yōu)勢(shì)。其他地區(qū)對(duì)中國普遍懷有仰慕之情。然而,隨著中國近代落后,尤其是甲午戰(zhàn)爭(zhēng)后的失敗,導(dǎo)致許多中國知識(shí)分子開始反思自身文化,包括語言文字。這種反思迅速演變?yōu)闃O端觀點(diǎn),甚至有人認(rèn)為漢字阻礙了中國進(jìn)入現(xiàn)代科技文明。
隨著電子計(jì)算機(jī)等信息技術(shù)的出現(xiàn),中文在計(jì)算機(jī)輸入方面確實(shí)存在一些困難。因?yàn)檫@些鍵盤來自英文打字機(jī),所以輸入英文最為方便。過去有人認(rèn)為漢字阻礙了中國進(jìn)入現(xiàn)代科技文明的觀點(diǎn),隨著信息技術(shù)時(shí)代的到來再次浮出水面。但在20世紀(jì)80年代,中國科技界在漢字輸入方面做了大量工作,被稱為“萬碼奔騰”。這些工作極大地降低了中文輸入到計(jì)算機(jī)的難度。其中比較著名和主流的是五筆字型輸入法(王碼),由王永民先生發(fā)明,以及拼音輸入法。
到了人工智能時(shí)代,中文在技術(shù)優(yōu)勢(shì)方面發(fā)生了根本性逆轉(zhuǎn),其原因主要包括以下幾點(diǎn):
首先是漢字具有高度的規(guī)整性。無論是書寫還是發(fā)音,其尺寸和發(fā)音時(shí)間都非常一致。這種特性使得計(jì)算機(jī)處理變得異常便捷。例如,中文每個(gè)字的發(fā)音都是聲母加韻母,發(fā)音時(shí)間一致,便于識(shí)別。相比之下,英文單詞長(zhǎng)度不一,發(fā)音有連讀現(xiàn)象,增加了識(shí)別難度。
其次是漢字的信息密度高于字母文字。漢字作為表意文字,內(nèi)涵豐富,用極少的漢字即可表達(dá)復(fù)雜意思。尤其在文言文中,信息密度更高。對(duì)于人工智能來說,這意味著在存儲(chǔ)相同含義的文本時(shí),中文所需存儲(chǔ)量和計(jì)算量最少。與英文或其他字母文字相比,中文通常占用的頁面更少。需要注意的是,雖然中文信息密度總體較高,但在嚴(yán)謹(jǐn)性要求高的場(chǎng)合,如論文或法律文件中,信息密度差異可能不那么明顯。但就大多數(shù)情況下而言,中文在信息表達(dá)上的優(yōu)勢(shì)依然明顯。
第三個(gè)特點(diǎn)在于其穩(wěn)定性。漢字作為一項(xiàng)具有穩(wěn)定性的文化符號(hào),其基本特征在長(zhǎng)時(shí)間內(nèi)保持不變。與上古時(shí)期的甲骨文相比,今天常用的漢字與其非常接近。對(duì)于新興事物的適應(yīng),漢字通過常用基礎(chǔ)字構(gòu)建新詞組的方式進(jìn)行,這種詞組往往具備規(guī)律性分類的特性。例如,"機(jī)"字可以組合出拖拉機(jī)、播種機(jī)、飛機(jī)、紡織機(jī)、發(fā)動(dòng)機(jī)、蒸汽機(jī)、計(jì)算機(jī)等多個(gè)機(jī)器名稱。漢字的穩(wěn)定性為人工智能技術(shù)提供了顯著優(yōu)勢(shì),即參數(shù)量減少、重復(fù)訓(xùn)練次數(shù)增加,從而提高準(zhǔn)確性。
相較之下,英語會(huì)不斷吸收新詞,常用詞匯也在不斷更新。在評(píng)價(jià)中文技術(shù)優(yōu)勢(shì)時(shí),我們不必過分夸大,而應(yīng)基于不同時(shí)代技術(shù)變革中文化優(yōu)劣勢(shì)變化的客觀分析,更加理性地看待中國文化的獨(dú)特價(jià)值。在人工智能時(shí)代,我們更應(yīng)發(fā)揮中文的優(yōu)勢(shì),推動(dòng)中國在這一時(shí)代的快速發(fā)展,并實(shí)現(xiàn)更好的經(jīng)濟(jì)效益。從對(duì)自身語言態(tài)度的轉(zhuǎn)變中,我們應(yīng)獲得這樣的啟示:應(yīng)當(dāng)以科學(xué)的態(tài)度看待文化,認(rèn)識(shí)到其利弊或優(yōu)勢(shì)、劣勢(shì)都是相對(duì)于特定背景而言的。我們既不能因劣勢(shì)輕視文化,也不能因優(yōu)勢(shì)自我膨脹,而應(yīng)科學(xué)地分析和改進(jìn)劣勢(shì),充分利用潛在的優(yōu)勢(shì)。
[編輯: 劉清揚(yáng)]
[負(fù)責(zé)任: 范燕菲]
冒險(xiǎn)大作戰(zhàn) 快速升級(jí)技巧全解析,《冒險(xiǎn)大作戰(zhàn)》快速升級(jí)方法一覽 雷電套單刷防御流,怪物獵人荒野:額外耐力貫通重弩配裝指南分享 太刀氣刃兜割紅色解放無雙斬與中斷技巧,怪物獵人太刀氣刃突刺使用方法及技巧解析 探秘丹藥制作踏風(fēng)行丹方與藥材收集秘籍,《踏風(fēng)行》丹藥系統(tǒng)介紹 硬核挑戰(zhàn)自由創(chuàng)造的獨(dú)特主題,雙點(diǎn)博物館沙盒模式創(chuàng)意玩法與優(yōu)秀玩法介紹 終極人工智能防御機(jī)器人尖端科技完美結(jié)晶,《逆境重生 AI機(jī)械體 I型守衛(wèi)》 《浪人崛起》即將登陸Windows平臺(tái),Rise of the Ronin PC版發(fā)售時(shí)間發(fā)布 限定道具大集合,《星際戰(zhàn)甲》組合包介紹 太刀武器的獨(dú)特之處在于看破斬的使用方式通過RT+B鍵觸發(fā)連段攻擊不僅在連段時(shí)有效還能在其他情況下使用且無敵時(shí)間長(zhǎng)使用時(shí)會(huì)消耗全部練氣槽但成功追擊后會(huì)回復(fù)按RT還能衍生出其他招式如機(jī)鋒大回旋斬,怪物獵人荒野太刀看破斬使用技巧分享 獲取途徑有哪些全在這里一網(wǎng)打盡,《星球重啟》機(jī)甲獲取攻略