近幾年來,數(shù)字技術(shù)和人工智能應(yīng)用的飛速發(fā)展,給漢字文明傳承帶來了全新的機遇與挑戰(zhàn)。近日,教育部、國家語委、中央網(wǎng)信辦發(fā)布了《關(guān)于加強數(shù)字中文建設(shè) 推進語言文字信息化發(fā)展的意見》,明確要深入推進信息技術(shù)與語言文字深度融合,以加強數(shù)字中文建設(shè)為重點全面推進語言文字信息化發(fā)展,全方位釋放語言文字的數(shù)據(jù)要素價值、全環(huán)節(jié)發(fā)揮語言文字資源優(yōu)勢、全領(lǐng)域賦能經(jīng)濟社會發(fā)展。
黨的十八大以來,國家高度重視數(shù)字中文建設(shè)和語言文字信息化發(fā)展,出臺了不少政策為漢字?jǐn)?shù)字化保駕護航,不斷完善語言文字信息化的發(fā)展環(huán)境,推動漢字文明在數(shù)字時代煥發(fā)出新的生機。2021年11月發(fā)布的《關(guān)于全面加強新時代語言文字工作的意見》對新時代語言文字工作進行了全面部署,為數(shù)字中文建設(shè)和語言文字信息化發(fā)展奠定了政策基礎(chǔ),指明了發(fā)展方向。2022年7月發(fā)布的《信息技術(shù) 中文編碼字符集》(GB18030-2022)強制性國家標(biāo)準(zhǔn)為漢字頒發(fā)了“數(shù)字簽證”,滿足了社會生活各領(lǐng)域的使用需求,為傳承漢字文明、增強中文信息處理能力提供了強有力的標(biāo)準(zhǔn)保障。2025年1月印發(fā)的《關(guān)于加強數(shù)字中文建設(shè) 推進語言文字信息化發(fā)展的意見》全面謀劃數(shù)字中文建設(shè),強調(diào)系統(tǒng)構(gòu)建語言文字信息化體系,全面推進語言文字信息化發(fā)展。
在這些政策、標(biāo)準(zhǔn)與技術(shù)的支持與推動下,數(shù)字中文建設(shè)成果斐然。如北京師范大學(xué)“漢字全息資源應(yīng)用系統(tǒng)”充分運用數(shù)據(jù)庫、信息挖掘、可視化等現(xiàn)代化手段,從形、音、義、用、碼五大維度,較為全面地呈現(xiàn)古今8萬多漢字的屬性體系,有效滿足不同領(lǐng)域漢字應(yīng)用的多元化需求。遼寧大學(xué)“漢字字料庫”標(biāo)注了從古至今的近300萬筆字書漢字字料,為漢字研究提供了海量數(shù)據(jù)支持,也為基于“大漢字模型”的AI應(yīng)用筑牢漢字?jǐn)?shù)據(jù)根基。
以人工智能技術(shù)賦能古文字識別為例,此前,研究人員面對甲骨文、金文、戰(zhàn)國文字等古文字以及行書、草書等變異字體,常常需要耗費大量時間和精力去辨認(rèn)。人工智能技術(shù)的介入,讓沉睡千年的古文字“開口說話”,為這一困境帶來了破局的希望。華東師范大學(xué)借助基于人工智能技術(shù)開發(fā)的“商周金文智能鏡”,使金文識別率提升到92%以上。吉林大學(xué)與中國書法網(wǎng)合作開發(fā)的“字鑒·書法識別”程序可以精準(zhǔn)識別古文字、歷代法帖漢字等非標(biāo)準(zhǔn)字體,為漢字書法藝術(shù)的研究和傳承提供了便利。
文字博物館的數(shù)字化建設(shè)也是一大亮點。例如,河南安陽的中國語言文字?jǐn)?shù)字博物館通過數(shù)字化手段將豐富的漢字文明資源呈現(xiàn)在大眾面前,讓漢字從博物館走進了千家萬戶。此外,以古文字為主題的游戲動畫,如《甲骨書信》《甲骨文風(fēng)云》等也紛紛涌現(xiàn),將古文字知識融入游戲與動畫中,讓參與者充分感受漢字文明的魅力。
數(shù)字浪潮為漢字文明傳承賦予了新的生機,但要想讓漢字文明薪火相傳,仍然任重而道遠(yuǎn)。加強漢字?jǐn)?shù)據(jù)資源建設(shè)是最要緊的工作。這一工作要求廣泛收集各類漢字真實數(shù)據(jù),涵蓋甲骨文、金文、戰(zhàn)國文字、隸書、楷書、行書、草書等多種字體,構(gòu)建大規(guī)模且高質(zhì)量的漢字?jǐn)?shù)據(jù)庫。通過對采集的字料數(shù)據(jù)進行科學(xué)精準(zhǔn)的標(biāo)注,將其轉(zhuǎn)化為高質(zhì)量的漢字智能數(shù)據(jù)集,讓基于人工智能技術(shù)的“大漢字模型”學(xué)習(xí)到海量且精準(zhǔn)的漢字知識,提升人機交互在理解與輸出時的準(zhǔn)確度和可靠性。
技術(shù)創(chuàng)新與應(yīng)用一刻也不能松懈。持續(xù)探索AI前沿技術(shù)在漢字文明傳承中的應(yīng)用,進一步推動生成式人工智能、多模態(tài)信息處理等技術(shù)創(chuàng)新,讓更多更智能的漢字產(chǎn)品賦能漢字文明的創(chuàng)造性轉(zhuǎn)化和創(chuàng)新性發(fā)展,利用虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)等技術(shù),建設(shè)線上“漢字文明體驗館”,開發(fā)能同時展示漢字形、音、義、用以及不同字體書寫模態(tài)、相關(guān)歷史故事的數(shù)字化產(chǎn)品,讓漢字文明以更有趣的方式傳播。
“借風(fēng)出海”是漢字在數(shù)字時代的重要使命。隨著經(jīng)濟全球化的發(fā)展,漢字的國際影響力越來越大。通過與一些國際伙伴深度合作,共同開展數(shù)字中文研究項目,實現(xiàn)漢字?jǐn)?shù)字化資源共享,讓漢字文明融入全球數(shù)字生態(tài),進一步提升在全球數(shù)字空間的話語權(quán)。
從第一個甲骨文刻在龜甲上,到今天人工智能“讀懂”漢字,漢字一直都在尋找新的契機與世界對話,漢字文明傳承因此生生不息、歷久彌新。在數(shù)字中文建設(shè)和語言文字信息化發(fā)展的浪潮中,我們要抓住機遇,迎接挑戰(zhàn),通過全社會的不懈努力,讓漢字文明在信息時代和數(shù)字時代“乘風(fēng)破浪”,讓古老的漢字煥發(fā)新生,在世界文明舞臺上綻放光彩。
(作者:柳建鈺,系遼寧大學(xué)文學(xué)院教授)
來源:《光明日報》(2025年05月16日02版)