清華大學(xué)人文學(xué)院院長萬俊人30多年前在北京大學(xué)讀書時,曾問過北大歷史系教授田余慶一個問題:“田先生,‘二十四史’您看了幾遍?”
“傻小子,沒有一個史學(xué)家能夠讀完‘二十四史’的。”田余慶的回答,給萬俊人留下了深刻印象。
如今,有了古籍?dāng)?shù)據(jù)庫,輸入關(guān)鍵詞,瞬間,“二十四史”中的相關(guān)內(nèi)容就涌現(xiàn)在眼前了,檢索和閱讀的便捷性有了極大提升。讀完“二十四史”雖然仍然需要下苦功夫,但利用“二十四史”已經(jīng)越來越方便。
從紙本閱讀到檢索系統(tǒng),從檢索系統(tǒng)到分析系統(tǒng),人文學(xué)術(shù)的研究工具正在向“數(shù)字化”的方向轉(zhuǎn)變,和萬俊人一樣,很多人文學(xué)者的研究中越來越離不開“數(shù)字”了。
“不數(shù)字無人文的時代”到來
在信息的汪洋里,既要放寬眼界,又要盯準(zhǔn)目標(biāo),不被淹沒,是學(xué)者們共同的需求和愿望。
“現(xiàn)在我們處在海量的信息中,這信息量不是宏觀,而是巨觀的。”臺灣大學(xué)資訊工程系教授、數(shù)位人文中心主任項潔如是說。
從微觀到中觀,從中觀到宏觀,再到巨觀,信息視域越來越廣闊無邊。人文學(xué)者如何駕馭浩如煙海的文獻材料?數(shù)字技術(shù)能幫他們做什么?
“對于人文學(xué)者來講,從來不是看幾篇文章就可以開始寫作,而是要看大量的文獻才敢下筆。”項潔分析道,“因為作者檢索到的文獻是一個系統(tǒng),要找出這些文獻之間的脈絡(luò)關(guān)系,是至關(guān)重要的事情。”
“如果一位學(xué)者僅僅具備本學(xué)科的學(xué)術(shù)訓(xùn)練,而不具備數(shù)字思維,欠缺運用數(shù)字技術(shù)進行研究的能力,即使他的學(xué)術(shù)功底再扎實,今后也寸步難行。”商務(wù)印書館執(zhí)行董事顧青說,“目前,我們利用數(shù)字技術(shù)進行人文學(xué)術(shù)研究的人群還不夠多。我堅信,在不遠的將來,我們不必再用‘數(shù)字人文’這樣的名號來宣示我們區(qū)別于傳統(tǒng)研究的立場。因為,‘不數(shù)字無人文的時代’已經(jīng)到來,數(shù)字人文將深刻地改變學(xué)者,尤其是人文社科學(xué)者們的知識結(jié)構(gòu)和研究路徑。”
事實上,在一些學(xué)者看來,人文與數(shù)字,從來就沒有分過家。
萬俊人從古埃及、古希臘的建筑和哲學(xué)中,指出數(shù)字人文的神妙:“埃及金字塔,至今還是一個謎。它之所以能夠歷經(jīng)4700多年的風(fēng)雨,不只有古埃及人的信仰、圖騰和崇拜因素,還有數(shù)字的因素。在一片茫茫大漠的頂端,鑄造了繁多規(guī)整和雄偉的建筑,而且是用巨大的石頭壘起來,沒有精確的數(shù)字計算,是不能夠做到這一點的。”
萬俊人認為,人文學(xué)術(shù)的源頭就與數(shù)字有關(guān)。他說:“古希臘哲學(xué)家畢達哥拉斯,他的哲學(xué)源自數(shù)字。從他開始,希臘哲學(xué)開始產(chǎn)生了數(shù)學(xué)的傳統(tǒng)。中國古代哲學(xué)也是如此,例如《易經(jīng)》。所以,人文和數(shù)字從一開始就是孿生兄妹,只不過在后來的歲月里,兩者走得比較遠了些,看似它們已經(jīng)告別了,其實它們一直在同一條路上,與人類文明和文化同行。”
用數(shù)字方法,解決人文研究難題
數(shù)字人文的發(fā)展動力,在于采用新的方法,解決過去難以解決的問題。
多年來,項潔研究團隊一直致力于滿足人文學(xué)者對內(nèi)容數(shù)字化的需求,建立一個屬于他們自己的資料庫,來處理、標(biāo)注和分析資料,使內(nèi)容和工具能夠互動起來。
顧青回憶起30多年前,他在北京大學(xué)讀書的時候,上過一門“工具書使用”的課程,講的都是怎么使用紙質(zhì)工具書。今天,這門課程涉及的很多工具書已經(jīng)可以被數(shù)字化工具所取代,其中的一些工具書已進入古籍收藏家的視野,實用價值遠不如從前。
清華大學(xué)人文學(xué)院副教授李飛躍和中國社會科學(xué)院文學(xué)研究所助理研究員趙薇介紹,幾十年來中國人文學(xué)科的定量分析成果紛紛涌現(xiàn),用數(shù)字手段檢驗和打破了一些人們習(xí)焉不察的定見:
20世紀80年代,陳炳藻、李賢平、施健軍和陳大康等海內(nèi)外中國學(xué)者分別采用文體測量學(xué)的辦法,利用人工統(tǒng)計或計算機輔助手段,對《石頭記》前八十回、后四十回作者統(tǒng)一性問題作出判定;2005年,哈佛大學(xué)包弼德與北京大學(xué)等合建“中國歷代人物傳記資料庫”(CBDB);2001年,復(fù)旦大學(xué)和哈佛大學(xué)共建“中國歷史地理信息系統(tǒng)”(CHGIS)等,這些人文學(xué)者是數(shù)字人文的先行者。
“長安城圖的精準(zhǔn)化和數(shù)位化應(yīng)用”,這是臺灣中山大學(xué)中文系教授簡錦松利用數(shù)字化技術(shù)進行的一項研究。據(jù)他介紹,過去學(xué)界對唐代長安城的了解,都是從留存下來的紙質(zhì)圖上看到的?,F(xiàn)在可以對原始的古圖做數(shù)字化處理,然后放進電子地圖里,就能看到精準(zhǔn)的長安古城面貌了。
這項研究既有學(xué)術(shù)價值,也很有趣。比如,有了這張數(shù)字化圖,就可以知道白居易的家住在哪里,上朝要走多久;也可以知道韓愈從家里出來拜訪張繼,要經(jīng)過什么路徑;李商隱為悼念亡妻寫下了著名的《西亭》:“此夜西亭月正圓,疏簾相伴宿風(fēng)煙。梧桐莫更翻清露,孤鶴從來不得眠。”從李商隱家到他妻子娘家的居所西亭,路程并不遙遠,只有1.7公里。
借助中南民族大學(xué)文學(xué)與新聞傳播學(xué)院王兆鵬教授構(gòu)建的“唐宋文學(xué)編年地圖平臺”和“漢魏六朝文學(xué)編年地圖平臺”數(shù)據(jù)庫,也可以了解唐宋時期和漢魏六朝時期作家的活動情況。
“數(shù)字人文,能夠在相當(dāng)程度上幫助傳統(tǒng)的研究工作,讓學(xué)者們有更多時間去做計算機目前還不能做的研究。”清華大學(xué)人文學(xué)院教授、《數(shù)字人文》期刊主編劉石說。比如,古籍標(biāo)點、字句??薄⑺饕幾?、資料匯編,過去的學(xué)者在這些方面花費了大量心血,如今都可以借助計算機去完成。
建立起知識的關(guān)聯(lián),是數(shù)字人文的本事
數(shù)字人文興起的前提,是人文資料和文獻檔案的電子化與數(shù)據(jù)化。
劉石認為,當(dāng)今社會,數(shù)字化的浪潮無所不在,也深刻地影響著包括人文和社會科學(xué)在內(nèi)的一切領(lǐng)域。數(shù)字人文,推動了當(dāng)代文獻學(xué)的發(fā)展,使之形成數(shù)據(jù)驅(qū)動、實證為先的新特征。“前幾年,人文學(xué)界有一種輕文獻考辨、重義理闡發(fā)的現(xiàn)象,導(dǎo)致學(xué)風(fēng)空疏的傾向?,F(xiàn)在有了數(shù)字人文,你想空疏都空疏不了。因為,數(shù)字人文中的大數(shù)據(jù),不就是拿數(shù)據(jù)說話的實證研究嗎?所以,從這個角度講,文獻學(xué)、古籍整理,或者考據(jù)學(xué),今后不見得會消亡,反而會隨著數(shù)字人文的發(fā)展獲得新的活力。”
眾所周知,錢鐘書先生博聞強記,而他的記憶力與他的學(xué)術(shù)成就息息相關(guān)。有人提出疑問:進入數(shù)字人文時代,學(xué)者的記憶能力還重要嗎?清華大學(xué)計算機科學(xué)與技術(shù)系主任、《數(shù)字人文》期刊主編孫茂松教授認為:“實際上,電腦時代并不意味著什么都能搜索到。數(shù)字人文要做的,不是把死的知識存在那里,而是要建立起不同知識間的關(guān)聯(lián),有豐富的知識聯(lián)想,讓知識活起來,進行深入的學(xué)術(shù)融合。”
“我們現(xiàn)在遇到的一個最大的問題,就是有了大量的電子文本之后,怎樣利用這些數(shù)據(jù)庫進行研究?”美國巴克內(nèi)爾大學(xué)東亞研究系教授陳松說。
因為,人工智能必須由人去做,才會智能,才有可能做出有價值的研究。
李飛躍從教學(xué)角度來分析數(shù)字人文:“過去我們說,知識就是力量。工業(yè)化時代標(biāo)準(zhǔn)化的教育,更重視知識技能的傳授教育。如今,信息時代的教育有一個非常重要的特點,就是更重視建立知識之間的關(guān)聯(lián),這才是力量。”
正如項潔所說的那樣,這些細微而生動的數(shù)字化,“從巨觀上,穿越了不同知識和學(xué)科之間的隔斷,才能從微觀上直達知識的細節(jié)”。
“從科學(xué)革命開始,學(xué)界有一個很大的分流,就是理工以發(fā)現(xiàn)為主,人文則以解釋為主。如今,有了數(shù)字人文這座新的橋梁,把以發(fā)現(xiàn)為主的理工學(xué)術(shù)帶到人文學(xué)界,人文學(xué)術(shù)將會有新的發(fā)展。”香港科技大學(xué)人文與社會科學(xué)學(xué)院教授李中清說。
“數(shù)字人文是人文社科學(xué)術(shù)研究的未來,希望在信息科技領(lǐng)域中,有最懂傳統(tǒng)文化的人;在人文學(xué)術(shù)界中,有最懂?dāng)?shù)字技術(shù)的人。”這是顧青的期待,也是學(xué)者們共同的期盼。
(記者 計亞男 杜羽)