輸入網(wǎng)址、輕點(diǎn)鼠標(biāo),儒家經(jīng)典《論語》可逐頁在線閱覽,飄逸俊秀的漢隸代表作《曹全碑》書法躍然眼前,古籍還能實(shí)現(xiàn)繁體字和簡體字轉(zhuǎn)換等功能,讓讀者能查詢、會(huì)閱讀。專家認(rèn)為,中華古籍浩如煙海,對(duì)珍貴古籍進(jìn)行保護(hù)、修復(fù)和活用,關(guān)乎中華文脈的延續(xù)和傳承。隨著數(shù)字技術(shù)不斷成熟,古籍正走出“深閨高閣”,資源會(huì)得到更有效利用。
從圖書館“搬”到網(wǎng)絡(luò)平臺(tái)
點(diǎn)擊瀏覽器,進(jìn)入一個(gè)名為“識(shí)典古籍”的網(wǎng)站,記者看到《周易》《左傳》《禮記》等典籍陳列在首頁上。隨機(jī)點(diǎn)開一本,左側(cè)為章節(jié)目錄,右側(cè)為正文,排版形式既符合現(xiàn)代人的閱讀習(xí)慣,又還原了古籍紙張的閱讀美感。
這是北京大學(xué)數(shù)字人文研究中心與字節(jié)跳動(dòng)合作研發(fā)的一個(gè)數(shù)字古籍平臺(tái),自去年10月發(fā)布以來,已上線古籍1200余部,免費(fèi)供公眾瀏覽。
與一些數(shù)字化平臺(tái)僅提供古籍影像不同,點(diǎn)擊該平臺(tái)的功能按鈕,還能實(shí)現(xiàn)簡繁體轉(zhuǎn)換、圖文對(duì)照、全文檢索、支持移動(dòng)端等服務(wù)。北京大學(xué)人工智能研究院副研究員楊浩介紹,該平臺(tái)應(yīng)用了文字識(shí)別、自動(dòng)標(biāo)點(diǎn)等技術(shù),不僅將影印本上的文字提取整理,還可以標(biāo)記文本中的人名、地名等信息。“我們利用人工智能技術(shù),將古籍由以前的圖像加工成可檢索的文本與數(shù)據(jù),方便研究者、用戶直接閱讀。”
隨著數(shù)字技術(shù)不斷成熟,科技賦能古籍工作取得可喜進(jìn)展。國家圖書館公布的數(shù)據(jù)顯示,全國已累計(jì)在線發(fā)布古籍?dāng)?shù)字資源13萬部(件)。打開《永樂大典》高清影像數(shù)據(jù)庫(第一輯),讀者能瀏覽到國家圖書館館藏的《永樂大典》40冊(cè)、75卷的高清圖像及相關(guān)知識(shí);浙江大學(xué)打造的“智慧古籍平臺(tái)”可在線查閱數(shù)萬篇古籍,還有著者小傳、人物行跡及社會(huì)網(wǎng)絡(luò)關(guān)系圖等延伸信息。
這些古籍是怎樣從圖書館庫房“搬”到網(wǎng)絡(luò)平臺(tái)的?楊浩介紹,古籍?dāng)?shù)字化過程分為兩步。首先將古籍進(jìn)行掃描。古籍掃描使用專用非接觸式掃描儀,通過高像素照相機(jī),盡量不按壓古籍頁面進(jìn)行拍照;采用的光源是防紫外線的LED燈冷光源,減少對(duì)古籍的損害。其次是對(duì)圖像做數(shù)據(jù)化處理,利用人工智能技術(shù)對(duì)文字進(jìn)行識(shí)別,對(duì)標(biāo)點(diǎn)、實(shí)體等進(jìn)行標(biāo)引,方便讀者閱讀與檢索。
減少人工智能識(shí)別錯(cuò)誤率也很重要。字節(jié)跳動(dòng)公益古籍項(xiàng)目相關(guān)負(fù)責(zé)人說,具有中文、歷史等專業(yè)知識(shí)并對(duì)古籍感興趣的員工,自發(fā)成立2600人的志愿者團(tuán)隊(duì),參與古籍校對(duì)工作。
方便讀者獲取資源
“作為再生性保護(hù)的重要手段,古籍?dāng)?shù)字化及其平臺(tái)建設(shè)意義重大。”北京大學(xué)數(shù)字人文中心主任王軍認(rèn)為,古籍?dāng)?shù)字化可以很好地解決古籍保護(hù)與利用之間的矛盾。傳統(tǒng)上,人們要利用古籍,必須直接接觸書籍,這可能導(dǎo)致書籍受到進(jìn)一步磨損,且只能在特定的圖書館或機(jī)構(gòu)中閱讀。通過數(shù)字化,不僅能減少對(duì)古籍的物理損害,還方便讀者隨時(shí)隨地獲取這些資源。
近年來,古籍?dāng)?shù)字化和平臺(tái)建設(shè)進(jìn)展很快。國家圖書館搭建的“中華古籍資源庫”已成為全國古籍資源類型和品種最多、體量最大的綜合性資源共享發(fā)布平臺(tái)。中華書局的“中華經(jīng)典古籍庫”已發(fā)布6000多種、15億字的點(diǎn)校本古籍。一些地方還打造了整理少數(shù)民族古籍的數(shù)字平臺(tái),如“廣西古籍文庫”目前共收錄100多部古壯族文字古籍底本和近千份民族地區(qū)文書等資源。
不過,古籍?dāng)?shù)字化工作依然任重道遠(yuǎn)。業(yè)內(nèi)人士指出,中國現(xiàn)存古籍中,只有少部分被拍攝成圖像資料,而大部分未實(shí)現(xiàn)文本數(shù)字化。此外,大量古籍分散收藏在各個(gè)圖書館或收錄于不同的數(shù)據(jù)庫,難以進(jìn)行高效檢索、關(guān)聯(lián)閱讀和深度挖掘與利用。
如何將這些散落的古籍整合起來?6月初,一個(gè)旨在對(duì)2.5萬種古籍進(jìn)行數(shù)字化整理的古籍智慧圖書館項(xiàng)目啟動(dòng)。該項(xiàng)目到2025年底,將實(shí)現(xiàn)國家圖書館等館藏古籍?dāng)?shù)字化,并為人們提供公益性閱讀服務(wù)。
短視頻再現(xiàn)古籍里的美食
“沒想到古籍這么‘香’。”在看完系列短視頻《食光機(jī)·隨園私房菜》后,有網(wǎng)友留言說。該短視頻由南京圖書館歷史文獻(xiàn)研究館研究員史星宇和韓超制作,他們按照清代文學(xué)家袁枚寫的《隨園食單》,再現(xiàn)古籍里的美食,吸引不少人觀看。
“為了更好地呈現(xiàn)《隨園食單》中的菜品,我們結(jié)合歷史和古代文學(xué)等相關(guān)學(xué)科背景,對(duì)原文文本一起推敲斟酌,在烹飪上反復(fù)試驗(yàn),同時(shí)盡量還原書中的烹飪手法,保證菜品的原汁原味。”韓超說。
如何讓數(shù)字化的古籍和人們更親近呢?這考驗(yàn)著文保機(jī)構(gòu)、科研院校與互聯(lián)網(wǎng)公司等相關(guān)從業(yè)者的創(chuàng)新能力。如紀(jì)錄片《古籍尋游記》運(yùn)用交互技術(shù)、掃描技術(shù)等,讓用戶以更沉浸的方式體驗(yàn)甲骨文刻字、建造敦煌莫高窟的過程。
王軍認(rèn)為,在古籍?dāng)?shù)字化、活化過程中,人文社科學(xué)者要積極介入,并加強(qiáng)與技術(shù)人員合作;高校古典文獻(xiàn)學(xué)等相關(guān)專業(yè)應(yīng)培養(yǎng)兼具技術(shù)與學(xué)術(shù)能力的復(fù)合型人才,部分古籍內(nèi)容應(yīng)向著“數(shù)字文創(chuàng)”轉(zhuǎn)化,讓古籍更好地走進(jìn)千家萬戶。
原標(biāo)題:
全國累計(jì)在線發(fā)布古籍?dāng)?shù)字資源13萬部
數(shù)字技術(shù)讓古籍“觸手可及”(網(wǎng)上中國)