- 深入探索,《七人傳奇:光暗交戰(zhàn)》伊麗莎白公主介紹
- 即將到來的游戲更新揭秘,《時(shí)空中的繪旅人》司嵐誰與歸畫靈介紹
- 任務(wù)揭秘,《絕區(qū)零》色彩斑斕的決斗任務(wù)完成步驟
- 戰(zhàn)略指南,《三國(guó):謀定天下》前期建筑升級(jí)順序
- 即將上線的冒險(xiǎn)之旅,《劍與遠(yuǎn)征:英雄培養(yǎng)優(yōu)先級(jí)指南》
- 策略與挑戰(zhàn),《怪物聯(lián)萌》荒野巨人boss攻略
- 游戲攻略指南,《螢火突擊》紫羅蘭病院鑰匙推薦
- 游戲任務(wù)指南,《鳴潮》幫小棠找貓任務(wù)完成方法
- 策略揭秘,《怪物聯(lián)萌》沙蟲王boss攻略
- 游戲任務(wù)攻略指南,《鳴潮》溫泉大冒險(xiǎn)任務(wù)完成方法
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
近期DeepSeek迅速崛起,不僅在科技領(lǐng)域引起了廣泛關(guān)注,而且已經(jīng)深入到普通人的日常生活,甚至在一些政府部門的應(yīng)用中也開始見到其身影。那么,大家自然也會(huì)好奇,為何中國(guó)在人工智能時(shí)代能夠不斷涌現(xiàn)出火爆的產(chǎn)品?復(fù)旦大學(xué)中國(guó)研究院的特邀研究員汪濤老師對(duì)此進(jìn)行了深入淺出的解析。
汪濤老師主題演講是關(guān)于中文在人工智能時(shí)代的優(yōu)勢(shì)。DeepSeek之所以能夠迅速崛起,關(guān)鍵并不是其在技術(shù)上獲得了突破性的進(jìn)展,而是其效率獲得了數(shù)量級(jí)的提升,使得在相同性能下,成本可以降低近20倍。這種現(xiàn)象的出現(xiàn),源于研發(fā)團(tuán)隊(duì)幾乎挖掘了所有可能提升效率的技術(shù)。具體而言,他們采用了更底層的編程語言如PTX,這種底層語言的效率通常更高,但編程難度也隨之增加。此外,他們還適當(dāng)降低了精度,例如采用1個(gè)字節(jié)的8位浮點(diǎn)運(yùn)算,而非32位,從而顯著減少了存儲(chǔ)量和運(yùn)算量。
在人工智能領(lǐng)域,有一個(gè)專業(yè)的術(shù)語叫量化,還有采用蒸餾方法大大減少參數(shù)數(shù)量。另外還有混合專家架構(gòu)(MoE),以及多頭潛在注意力技術(shù)(MLA)。這些技術(shù)本身并不是完全由DeepSeek首創(chuàng),它們?cè)诿绹?guó)人工智能產(chǎn)業(yè)界的相關(guān)專業(yè)人員早已有所了解,但為何DeepSeek能夠?qū)⑦@些技術(shù)發(fā)揮到極致呢?我們可以從一個(gè)更易于理解的角度來探討:中文在人工智能時(shí)代所具有的技術(shù)優(yōu)勢(shì)。
DeepSeek正是充分利用了中文的技術(shù)優(yōu)勢(shì),所以其迅速崛起之后,立刻引起了人們的廣泛關(guān)注。
如果我們回顧一下兩百年來的發(fā)展歷程,我們對(duì)于中文在現(xiàn)代科技中的作用,經(jīng)歷了一個(gè)逐漸演變的過程。
在中國(guó)古代,中文對(duì)周邊地區(qū)文化的影響具有壓倒性的優(yōu)勢(shì)。其他地區(qū)對(duì)中國(guó)普遍懷有仰慕之情。然而,隨著中國(guó)近代落后,尤其是甲午戰(zhàn)爭(zhēng)后的失敗,導(dǎo)致許多中國(guó)知識(shí)分子開始反思自身文化,包括語言文字。這種反思迅速演變?yōu)闃O端觀點(diǎn),甚至有人認(rèn)為漢字阻礙了中國(guó)進(jìn)入現(xiàn)代科技文明。
隨著電子計(jì)算機(jī)等信息技術(shù)的出現(xiàn),中文在計(jì)算機(jī)輸入方面確實(shí)存在一些困難。因?yàn)檫@些鍵盤來自英文打字機(jī),所以輸入英文最為方便。過去有人認(rèn)為漢字阻礙了中國(guó)進(jìn)入現(xiàn)代科技文明的觀點(diǎn),隨著信息技術(shù)時(shí)代的到來再次浮出水面。但在20世紀(jì)80年代,中國(guó)科技界在漢字輸入方面做了大量工作,被稱為“萬碼奔騰”。這些工作極大地降低了中文輸入到計(jì)算機(jī)的難度。其中比較著名和主流的是五筆字型輸入法(王碼),由王永民先生發(fā)明,以及拼音輸入法。
到了人工智能時(shí)代,中文在技術(shù)優(yōu)勢(shì)方面發(fā)生了根本性逆轉(zhuǎn),其原因主要包括以下幾點(diǎn):
首先是漢字具有高度的規(guī)整性。無論是書寫還是發(fā)音,其尺寸和發(fā)音時(shí)間都非常一致。這種特性使得計(jì)算機(jī)處理變得異常便捷。例如,中文每個(gè)字的發(fā)音都是聲母加韻母,發(fā)音時(shí)間一致,便于識(shí)別。相比之下,英文單詞長(zhǎng)度不一,發(fā)音有連讀現(xiàn)象,增加了識(shí)別難度。
其次是漢字的信息密度高于字母文字。漢字作為表意文字,內(nèi)涵豐富,用極少的漢字即可表達(dá)復(fù)雜意思。尤其在文言文中,信息密度更高。對(duì)于人工智能來說,這意味著在存儲(chǔ)相同含義的文本時(shí),中文所需存儲(chǔ)量和計(jì)算量最少。與英文或其他字母文字相比,中文通常占用的頁面更少。需要注意的是,雖然中文信息密度總體較高,但在嚴(yán)謹(jǐn)性要求高的場(chǎng)合,如論文或法律文件中,信息密度差異可能不那么明顯。但就大多數(shù)情況下而言,中文在信息表達(dá)上的優(yōu)勢(shì)依然明顯。
第三個(gè)特點(diǎn)在于其穩(wěn)定性。漢字作為一項(xiàng)具有穩(wěn)定性的文化符號(hào),其基本特征在長(zhǎng)時(shí)間內(nèi)保持不變。與上古時(shí)期的甲骨文相比,今天常用的漢字與其非常接近。對(duì)于新興事物的適應(yīng),漢字通過常用基礎(chǔ)字構(gòu)建新詞組的方式進(jìn)行,這種詞組往往具備規(guī)律性分類的特性。例如,"機(jī)"字可以組合出拖拉機(jī)、播種機(jī)、飛機(jī)、紡織機(jī)、發(fā)動(dòng)機(jī)、蒸汽機(jī)、計(jì)算機(jī)等多個(gè)機(jī)器名稱。漢字的穩(wěn)定性為人工智能技術(shù)提供了顯著優(yōu)勢(shì),即參數(shù)量減少、重復(fù)訓(xùn)練次數(shù)增加,從而提高準(zhǔn)確性。
相較之下,英語會(huì)不斷吸收新詞,常用詞匯也在不斷更新。在評(píng)價(jià)中文技術(shù)優(yōu)勢(shì)時(shí),我們不必過分夸大,而應(yīng)基于不同時(shí)代技術(shù)變革中文化優(yōu)劣勢(shì)變化的客觀分析,更加理性地看待中國(guó)文化的獨(dú)特價(jià)值。在人工智能時(shí)代,我們更應(yīng)發(fā)揮中文的優(yōu)勢(shì),推動(dòng)中國(guó)在這一時(shí)代的快速發(fā)展,并實(shí)現(xiàn)更好的經(jīng)濟(jì)效益。從對(duì)自身語言態(tài)度的轉(zhuǎn)變中,我們應(yīng)獲得這樣的啟示:應(yīng)當(dāng)以科學(xué)的態(tài)度看待文化,認(rèn)識(shí)到其利弊或優(yōu)勢(shì)、劣勢(shì)都是相對(duì)于特定背景而言的。我們既不能因劣勢(shì)輕視文化,也不能因優(yōu)勢(shì)自我膨脹,而應(yīng)科學(xué)地分析和改進(jìn)劣勢(shì),充分利用潛在的優(yōu)勢(shì)。
[編輯: 劉清揚(yáng)]
[負(fù)責(zé)任: 范燕菲]
快速操作指南,怪物獵人荒野實(shí)用采集技巧解析 庫爾斯克購物中心遭炮擊4死9傷,俄羅斯一購物中心遭炮擊致4人死亡 突破 | 關(guān)鍵2期臨床顯示TY-9591勝出,奧希替尼被“氘”了一刀? 洛克王國(guó)世界龍系寵物獲取攻略全解析,《洛克王國(guó):世界》龍系寵物獲取攻略 納薩力克之王新手抽取系統(tǒng)詳解,《納薩力克之王》莫莫獲得方法一覽 寶箱位置解析,《櫻庭世界》晝紅箱子位置圖解分享 探索真島吾郎的上衣飾,如龍8上身衣服怎么獲取-上身衣服獲取方法全解析 重磅新藥,奧希替尼被“氘”了一刀? 龍都戰(zhàn)斗中心快速刷新大小金方法,怪物獵人:荒野大 Evolution 大小金刷法指南 水屬性爆炸輕松擊敗護(hù)兇爪龍,護(hù)兇爪龍弱點(diǎn)全解析護(hù)兇爪龍具體弱點(diǎn)分析護(hù)兇爪龍弱點(diǎn)大解密護(hù)兇爪龍具體弱點(diǎn)全圖解護(hù)兇爪龍弱點(diǎn)全解析及對(duì)策護(hù)兇爪龍具體弱點(diǎn)分析與應(yīng)對(duì)策略護(hù)兇爪龍弱點(diǎn)全解析及戰(zhàn)斗技巧護(hù)兇爪龍具體弱點(diǎn)全解析及戰(zhàn)斗技巧