作者:復旦大學哲學學院教授 徐英瑾
復旦大學外文學院教授陸谷孫先生,最近不幸因病醫(yī)治無效而辭世。我不是學習英語專業(yè)的,但因為關(guān)心與機器翻譯相關(guān)的人工智能哲學問題,故而平素也較為留意陸先生發(fā)表的一些真知灼見。
陸先生于2015年發(fā)表過一篇討論翻譯技巧的短文。文中指出,翻譯要講求做到“飛躍”與“抵達”,即飛躍源語言與目標語言之間的文化隔閡,準確抵達目標語言中相應(yīng)文化氣場中的那個“著陸點”。因為不同的待譯文本具有各自的文化氣場,所以譯者就需要根據(jù)語境的變化機敏地選擇最恰當?shù)?ldquo;飛躍路線”,在譯文生成過程的終端實現(xiàn)最順當?shù)?ldquo;文化軟著陸”。
陸先生舉過一個案例,來說明這種“飛躍”與“抵達”。某出版社曾咨詢陸先生,如何為一篇題目為《租界》的中文小說,安上一個妥貼的英文標題。直譯當然是“The Concession”,但陸先生讀完小說發(fā)現(xiàn),作者說的是發(fā)生在舊上海法租界的故事,所以就譯為了“In the French Concession”,并用“in”強調(diào)了租界本身只是故事發(fā)生的場所,而非小說的真正描述對象。爾后,出版社又改了主意,覺得題目應(yīng)當換成小說主人公的名字,即“中國排骨”。這又怎么譯成英文呢?陸先生覺得,若直接譯為“Chinese ribs”,洋人肯定會誤認為這是菜譜,而“排骨”在漢語語境中所具有的“纖弱秀氣”意思就全丟凈了?;蛟S其意思更接近于“Bony Green Knight”吧,但此詞帶有中世紀色彩,放置到小資味濃郁的上海租界語境中,有點關(guān)公戰(zhàn)秦瓊的違和感了;翻譯為“Bony She-Man”則脂粉氣過濃。根據(jù)陸先生的描述,他就像直升機一樣在作為對象語言的英語領(lǐng)地上空盤旋,為尋找一處最佳的著陸點而費心煩神。
可見,面對此類高度復雜的翻譯任務(wù),譯者需要付出極大的心智努力才有可能呈現(xiàn)信、達、雅的譯作。其間的腦力付出,有時甚會至遠遠超出用母語進行思想原創(chuàng)。面對如此艱巨的腦力任務(wù),做人工智能研究的工程師或許會“想入非非”:倘若能夠根據(jù)陸先生的翻譯精神編制一種程序,讓機器自動進行文本翻譯,該有多好???
凡事都是“說易行難”。現(xiàn)有機器翻譯的主流思路,分為“符號進路”與“統(tǒng)計進路”兩種。很可惜,這兩種進路都無法忠實地落實關(guān)于“飛躍與抵達”的翻譯經(jīng)驗談。
先來看“符號進路”。按此進路,在機器翻譯中可以先做一個巨型雙語語料庫,并憑借現(xiàn)有的雙語翻譯詞典,搭架起一座橋梁。更精細的建模工作,甚至還要求對個別詞匯進行語義框架構(gòu)建。譬如,“排骨”這詞的框架,就自帶有與諸如“豬皮”“高湯”“蹄髈”之類詞匯相關(guān)的推理關(guān)系表征。這樣,系統(tǒng)一旦觸發(fā)一個特定詞匯,就會形成與之相關(guān)的語義框架,并由此使得一些簡單的語義推理成為可能。
然而,對于“符號進路”的機器翻譯路徑而言,需要編程員預先對大量雙語語料對應(yīng)關(guān)系及各個詞匯自身的語義框架進行建模。工作的繁瑣度就不提了,其不靈活性更是一個致命傷。具體而言,信息再完備的此類系統(tǒng),也很難對前面提到的“中國排骨”這樣古怪的詞語進行準確的信息解碼。通常狀態(tài)下,若不對整部小說有一定了解,恐怕就只能被譯為“Chinese ribs”這樣的菜名了。但是,對于現(xiàn)有的翻譯系統(tǒng)來說,對整部待譯小說進行“宏觀把握”,卻是一個幾乎不可能完成的任務(wù)。
再來看統(tǒng)計學機器翻譯路徑。它是由所謂“深度學習”系統(tǒng)來實現(xiàn)的。概而言之,“深度學習”是一個升級版的人工神經(jīng)元網(wǎng)絡(luò)系統(tǒng)。其基本工作原理是,在亞符號層面上將語義對象解析為一個復雜的特征簇,然后通過神經(jīng)元網(wǎng)絡(luò)的多層次加工,從中逐層將高階語義重新構(gòu)造出來。照此進路,一個諸如“排骨”這樣的詞匯,其原始形態(tài)只有數(shù)學特征、沒有語義特征。由于允許系統(tǒng)對語義相似關(guān)系作出模糊處理,因而其靈活性顯然超過“符號進路”系統(tǒng)。
不過,與陸先生的翻譯智慧相比,“深度學習”網(wǎng)絡(luò)的火候還差得遠。且不提此類系統(tǒng)的運行所需要消耗的大量計算資源,光在一個問題上就完敗了:它必須有大量的訓練樣本,以幫助其在一類源語言詞匯與另一類目標語言詞匯之間預先搭建起大致的相關(guān)性關(guān)系簇;然后,它才能夠依循成例,摸索出與之比較接近的“跨越方式”。但是,像陸先生那樣進行創(chuàng)造性“跨越”的大本領(lǐng),此類系統(tǒng)還是學不來的。
這是不是意味著陸先生的翻譯智慧,任何機器都無法模仿呢?我當然也不這么悲觀。現(xiàn)有的機器翻譯進路之所以有問題,與其說是因為超級人工智能不靠譜,還不如說是業(yè)內(nèi)人士太滿足于玩弄工程學層面上的“奇技淫巧”了,不愛琢磨學理層面上的抽象問題。
考慮到這一點,機器翻譯就不宜作為一個單獨的研究項目“孤軍深入”,而應(yīng)當成為人工感知、類比推理機制等相關(guān)領(lǐng)域內(nèi)的研究成果的衍生產(chǎn)品。這一條新進路,在國際上一般被稱為“通用人工智能”。或者說得更通俗一點,按此新進路,人工智能專家與其模仿陸先生的資深翻譯能力,還不如先去模仿陸先生咿呀學語時的“通用智力”,然后再求日益精進。此路看似曲折,實際上才是人工智能研究之“正道”。