【摘要】生成式人工智能的發(fā)布標志著人工智能邁入社會應用階段,引發(fā)各領(lǐng)域?qū)θ斯ぶ悄苡绊懙挠懻?。在學術(shù)領(lǐng)域,人工智能帶來的影響遠大于科學革命中計量技術(shù)帶來的震動,其中,對文科的影響尤其具有顛覆性。在學術(shù)發(fā)展的歷史里,文科是整體性學術(shù)在科學革命里的剩余,其中人文學科還帶著整體性學術(shù)的特征。在技術(shù)發(fā)展的脈絡里,人工智能不是一個具有充分共識的概念,可對人工智能的應用均指向?qū)θ祟愃季S與行動能力的延展和替代。人工智能對學術(shù)領(lǐng)域的影響產(chǎn)生了學術(shù)智能,其中理科智能形成了一些可資借鑒的路徑,文科智能將會與理科智能殊途同歸,文科的未來終將通過人機互生的知識創(chuàng)新與積累而成為人類日常需求的知識源。
【關(guān)鍵詞】人工智能 學術(shù)智能 理科智能 文科智能
【中圖分類號】G434/G642.3 【文獻標識碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2024.02.002
【作者簡介】邱澤奇,北京大學中國社會與發(fā)展研究中心主任,社會學系教授、博導,數(shù)字治理研究中心主任,教育部“長江學者獎勵計劃”特聘教授,北京大學博雅特聘教授。研究方向為數(shù)字社會發(fā)展與治理、技術(shù)應用與社會變遷。主要著作有《重構(gòu)關(guān)系:數(shù)字社交的本質(zhì)》、《數(shù)據(jù)要素五論:信息、權(quán)屬、價值、安全、交易》(合著)、《技術(shù)與組織:學科脈絡與文獻》(主編)等。
2022年11月30日,ChatGPT的發(fā)布標志著人工智能從實驗室邁入社會應用。一年多以來,人工智能話題的熱度持續(xù)不減。近期,GPTs的發(fā)布,進一步延續(xù)了人工智能話題的熱度。圍繞人工智能與人類未來,從日常支持、工作替代,到人類替代;從社會大眾、專家精英到國際社會,人們熱議人工智能給人類社會帶來的無限可能。其中,既有對人工智能影響的積極期待,如改善人類健康、提高殘障人士的生活質(zhì)量、增進人類福祉等;也有對人工智能負面影響的想象,如替代人類工作,讓大量勞動力失去工作崗位,包括對人類的奴役、替代,甚至消滅等。
在豐富的想象中,處理人工智能與人類關(guān)系的人工智能倫理成為各國政府和社會關(guān)注的重點議題。2023年11月1日,首屆人工智能安全峰會在英國倫敦布萊奇利莊園舉行,標志著對人工智能負面影響的警惕已經(jīng)進入各國政府的視野。
在保證人類安全的前提下,應用人工智能造福人類社會也成為各國努力和競爭的主要場域。其中,知識創(chuàng)新與積累是一個小眾卻又對人類影響深遠的領(lǐng)域。事實上,人工智能對學術(shù)的影響快速且深入,業(yè)已形成了一個通用術(shù)語“理科智能”(AI for science)。按照人們當下對學術(shù)的理解,學術(shù)包含自然科學、社會科學和人文學科。如果不那么精準和復雜地進行分類,則可以簡化為文科和理科。與16世紀中葉科學革命初期的格局類似,人工智能在學術(shù)領(lǐng)域應用(學術(shù)智能,AI for academia)的切入點主要集中在理科(science)。對于文科智能,專家們雖然進行了許多努力(Lazer et al., 2009; Lazer et al., 2020),當下卻還沒有找準突破口,還沒有像理科智能那樣形成可以閉環(huán)的工作流程或場景邏輯,更沒有形成可以上線GPTs的應用。
本文從學術(shù)發(fā)展的歷史和人工智能技術(shù)的脈絡出發(fā),試圖探討人工智能與文科未來。自從人類把對自然與社會的解釋權(quán)從諸神手中奪過來、用知識替代神諭以來,學術(shù)發(fā)展始終呈現(xiàn)為“素材-方法-理論”之間的互動與促進。其中,觸發(fā)三要素形成新互動模式的始終是技術(shù)演進(邱澤奇,2023)。如果把人工智能理解為新一輪的技術(shù)變革,便意味著文科三要素面臨互動模式的新發(fā)展。新的互動模式會怎樣呈現(xiàn)呢?對該問題的回答可以有兩條研究路徑。一是運用事實進行歸納和提煉,獲得人工智能與文科未來的事實邏輯。只是,開啟這一路徑的前提是有事實,即需要在實踐層次獲得人工智能與文科發(fā)展的諸多場景。遺憾的是,理科智能在當下已有若干場景,而文科智能還沒有。如此,我們只能選擇另一條路徑——借鑒已有的事實,在概念層次進行探討。本文采用的是第二條研究路徑。為了在概念層次闡述人工智能與文科未來,我們還需要回答幾個基本問題,如什么是文科?什么是人工智能?人工智能與文科未來有什么關(guān)系?后面的討論將分為三個部分:從學術(shù)發(fā)展的歷史中論證文科是人類知識創(chuàng)新與積累的剩余領(lǐng)域;從技術(shù)脈絡的演進里闡述人工智能是人類智力的延展和替代;運用理科智能實踐闡述文科未來是文科智能,而文科智能的本質(zhì)也是人機互生。
學術(shù)發(fā)展史中的文科
文科通常是人文學科和社會科學的總稱。人文學科與社會科學的分野不是從來如此。夫子講“六藝”,講的是人類的知識和能力,并沒有區(qū)分人文和社科,也沒有區(qū)分文科和理科。區(qū)分人文和社科是科學革命之后的現(xiàn)象。當下,大多數(shù)人的第一個共識是,把以探索人類精神為基本目標的學科稱為人文學科。人們不以“科學”指稱人文類的學術(shù)研究,是因為在對人文的探索中還有許多不滿足科學邏輯的部分,譬如文學與藝術(shù)對人類精神的探索很難用科學邏輯進行歸納和解釋。當然,人文探索是否需要滿足科學邏輯要另當別論,因為這也是一個極有爭議的議題。大多數(shù)人的第二個共識是把以探索社會規(guī)律為目標的學科稱為社會科學。人們以科學指稱對社會現(xiàn)象的學術(shù)探索,是因為在對社會的探索中均試圖用科學邏輯對社會現(xiàn)象進行歸納和解釋。毋庸諱言,社會科學對社會現(xiàn)象的歸納和解釋與自然科學對自然現(xiàn)象的歸納和解釋還有很大區(qū)別。可是,社會科學家們總是試圖理解社會現(xiàn)象發(fā)生發(fā)展的規(guī)律,也盡量讓對社會現(xiàn)象的歸納和解釋符合嚴謹?shù)目茖W邏輯,在這一點上,他們與自然科學家們對自然現(xiàn)象歸納和解釋的努力是一致的。
在人工智能運用于科學研究之前,依據(jù)科學探索三要素(素材、方法、理論)組合的發(fā)展,文科大致經(jīng)歷過兩個相互承接卻又有本質(zhì)差異的階段,即學術(shù)階段和學科階段(邱澤奇,2023)。進入數(shù)字時代以來,文科發(fā)展進入第三個階段,即智能階段。人工智能是這個階段出現(xiàn)的現(xiàn)象,也是在這個階段構(gòu)成了與文科的關(guān)系?;厮輰W術(shù)的歷史,在文科發(fā)展的每個階段,技術(shù)進步始終是撬動文科(準確地說是撬動整個學術(shù))變革的力量。要么帶來素材的豐富,要么帶來方法的革新,要么對既有理論提出挑戰(zhàn)。無論是素材豐富還是方法創(chuàng)新,都會推動人類觀念的變革,進而帶來觀察事物視角或理論的革故鼎新。換句話說,三要素互動與促進帶來的是人類對人文精神與社會規(guī)律認知的創(chuàng)新與積累。
在人類發(fā)展的早期,用于知識創(chuàng)新與積累的素材數(shù)量和類型都相對有限,只有文本、圖像、實物、言語、音樂、舞蹈、儀式等。不過,人們把想象拓展和比較分析等方法運用于有限素材,還是發(fā)展出了對自然與社會的認知方法,形成了認識自然與社會的知識創(chuàng)新與積累模式,也就是人們常說的學術(shù)(academia)。
學術(shù)是人類知識創(chuàng)新與積累的第一個階段,也是文科發(fā)展的第一個階段,在本質(zhì)上是人類理性與神諭分離的過程,形成的是人類對自然與社會現(xiàn)象的整體性認知。必須指出的是,整體性知識是一部分人個性化地對自然和社會現(xiàn)象進行非計量刻畫與闡釋的產(chǎn)物。我們說的文科,在那時還是整體性知識的一部分。從神諭到學術(shù)的發(fā)展,其價值和意義不只在于當下理解的知識創(chuàng)新與積累,更重要的是讓人類在認知上擺脫了對諸神的依附,用人類理性建構(gòu)起面向自然現(xiàn)象與社會現(xiàn)象的知識體系。與此同時,人類也因一部分人對創(chuàng)造與積累知識的貢獻而將他們塑造成知識精英(傳統(tǒng)中國人常說的“讀書人”),將他們奉為圣賢,并將對自然現(xiàn)象與社會現(xiàn)象的解釋權(quán)讓渡給他們。古希臘的“三圣”、中國春秋戰(zhàn)國時期的諸子百家莫不是如此。
在以整體性闡釋為特征的學術(shù)發(fā)展中,人們逐漸發(fā)現(xiàn),采用新的方法或技術(shù)工具可以獲得同一個對象或現(xiàn)象的不同素材,改變對對象或現(xiàn)象的認知。例如,1543年,維薩里出版了《人體構(gòu)造》(De Humani Corporis Fabrica),他用解剖方法觀察人體結(jié)構(gòu),獲得了之前不曾了解的人體構(gòu)成內(nèi)容,讓諸神子民身體的構(gòu)造不再神秘。又如,哥白尼的“日心說”提出之后,第谷、伽利略、開普勒、牛頓等在其理論基礎(chǔ)之上不斷取得新的突破,特別是伽利略的望遠鏡解決了哥白尼理論的不少困難。
事實上,將計量技術(shù)運用于對自然現(xiàn)象的觀察,不僅獲得了新的素材,如觀察數(shù)據(jù)、調(diào)查數(shù)據(jù)、統(tǒng)計數(shù)據(jù)等,也對以整體性知識呈現(xiàn)的學術(shù)提出了嚴峻挑戰(zhàn),帶來了自人類樹立理性以來的另一場學術(shù)變革。直接的后果是自然科學同整體性學術(shù)的分離,這也是人類知識創(chuàng)新與積累的第二個階段,不過,這還不是文科發(fā)展的第二個階段。自然科學的獨立不只是人類理性同諸神的決裂,還是人類理性內(nèi)在的分化。伴隨自然科學分立的是分科知識的創(chuàng)新與積累。計量不僅推動了分析方法的發(fā)展,形成了科學界共識的科學實驗方法,還推動了以演繹邏輯為特征的理論發(fā)展,讓知識的創(chuàng)新與積累從對自然現(xiàn)象總體性的把握轉(zhuǎn)向?qū)唧w規(guī)律的追尋。
受自然科學影響,在面向社會現(xiàn)象時,人們也同樣試圖運用計量技術(shù)開展研究,這便是文科發(fā)展的第二個階段。隨著統(tǒng)計思維發(fā)展為統(tǒng)計科學,對社會現(xiàn)象規(guī)律的追尋也成為分科學術(shù)的重要組成部分。社會科學各學科的建立與發(fā)展正是這一歷史潮流的直接后果。政治學、經(jīng)濟學、社會學、教育學、法學等莫不如是。新素材的出現(xiàn)推動了新方法的發(fā)展。比照自然科學的實驗方法,社會科學發(fā)展出了思想實驗。為了證明思想實驗的現(xiàn)實性,社會科學又發(fā)展了實證分析,用客觀事實證明邏輯推理的現(xiàn)實性。對現(xiàn)實邏輯的歸納和檢驗則推動了對社會現(xiàn)象規(guī)律的檢驗。文科由此不再滿足于對人類價值和意義的闡釋,而希望通過對社會規(guī)律的發(fā)現(xiàn)和檢驗,減少人類面對的不確定性,進而增進人類的福祉。
緊隨自然科學潮流,試圖對社會規(guī)律進行探討和對社會現(xiàn)象進行解釋的分科學術(shù)也制造了一個理想與現(xiàn)實的悖論:學科化的規(guī)律探索與整體性人類生態(tài)的背離。與自然現(xiàn)象不同,社會現(xiàn)象原本具有整體性和生態(tài)性,學科化的確可以在給定條件下獲得社會具體現(xiàn)象的規(guī)律,卻忽略了社會現(xiàn)象之間的整體關(guān)聯(lián)和生態(tài)關(guān)聯(lián)。一系列來自嚴格給定條件的具體規(guī)律,在面向一般社會現(xiàn)象時,頃刻間變得離散化和碎片化,難以讓人們建立面向日常社會現(xiàn)象的總體圖景,也難以讓人們在總體上把握社會規(guī)律,自然也無法復盤社會現(xiàn)象。這便是科爾曼著名的宏微觀悖論(Coleman, 1994)。以此為依據(jù),人們總認為社會科學是“軟”的,與人們試圖從現(xiàn)象獲得的對社會的認識還差著一步。其實,這正是社會科學的軟肋:難以形成對社會現(xiàn)象的擬合或重建。
文科發(fā)展的第二個階段并不徹底。隨著社會科學同整體性學術(shù)的分立,整體性學術(shù)的剩余便是如今的人文學科。只是,這些剩余中的少部分也還在試圖進入科學陣營,如計量史學、科技考古、分析哲學等。這些剩余中的大部分則還保留了傳統(tǒng)整體性學術(shù)的特征,用第一階段的方法分析第一階段既有素材,闡述人類的價值和意義。
基于計量的對自然規(guī)律的探索給人類帶來了具體且豐厚的回報。工業(yè)革命是以自然科學為基底的,人類物質(zhì)生活的豐富又是以工業(yè)革命為前提的。自然科學與工業(yè)技術(shù)的互動,在帶來人類物質(zhì)生活極大豐富的同時,還大大地延展甚至替代了人類的體力,把人類從繁重的或無力承擔的體力勞動中解放出來。與此同時,人類還希望分科學術(shù)對社會現(xiàn)象的探索可以與自然科學對自然現(xiàn)象的探索一樣為人類的社會生活帶來更大的確定性。遺憾的是,從經(jīng)濟到政治、從心理到社會,社會科學并沒有讓人類得償所愿,如今的人類依然面對著眾多難以解決的社會難題,文科也依然是一個有待積極發(fā)展的學術(shù)領(lǐng)域。
歸納起來說,在學術(shù)發(fā)展的歷史里,與其說文科經(jīng)歷了三個階段,不如說文科是科學革命的剩余。整體性知識創(chuàng)新與積累是學術(shù)的發(fā)端,在隨后的發(fā)展中,對自然現(xiàn)象的學術(shù)探索隨著科學探索三要素的計量化而分立出來,形成了被認為是“硬科學”的自然科學,即理科;剩下來的部分被認為是“軟”的,稱之為文科。隨著對社會現(xiàn)象的學術(shù)探索也開始遵循科學邏輯,再次剩下的部分便被稱為人文學科。換句話說,不嚴格滿足科學邏輯的學術(shù)(在許多自然科學家看來,社會科學也不滿足科學邏輯),便是人們所說的文科。
技術(shù)脈絡里的人工智能
人們熱議的人工智能或許各有不同的所指。概略地說,至少有三類不同的指稱(蔡自興等,2020)。例如,作為能力的人工智能;作為機器的人工智能;以及作為學科的人工智能。筆者認為,機器是能力的載體,是學科的產(chǎn)出。因此,這三類指稱的人工智能,在本質(zhì)上其實是一類,即機器智能。因此,筆者也更愿意用機器智能表述人工智能。
1956年召開的達特茅斯暑期研討會議標志著人工智能作為一個學科的誕生?!蛾P(guān)于舉辦達特茅斯人工智能暑期研討會的提議》(A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence)首次提出了“人工智能”(Artificial Intelligence)概念(McCarthy et al., 1955),認為人類學習能力的一切方面,以及智能的其他一切特性在原則上都可以被精確刻畫,從而可以用機器作為載體進行模擬。機器可模擬諸如語言運用、概念抽象、問題求解、自我改進等人類能力。以此為基礎(chǔ),人工智能至少包括以下7個方面:(1)自動計算機,以程序模擬人腦的功能;(2)計算機對語言的使用(學習新詞匯,并按照規(guī)則進行語句推斷);(3)神經(jīng)網(wǎng)絡(假想神經(jīng)元如何排列組合形成概念);(4)計算復雜度理論(建立衡量計算復雜度、改進計算效率的標準);(5)自我改進;(6)抽象能力(從各種感知數(shù)據(jù)中進行抽象);(7)隨機性與創(chuàng)造力(通過有控制的隨機性來模擬人類思維的創(chuàng)造性)??梢哉J為,人工智能當下探討的主要技術(shù)性議題在那次研討會上均已涉及,不過尚沒有涉及后來極具爭議的對“智能”的界定。
人們對智能的理解大致有兩類。第一類認為,人類智能是理解和學習事物的思考能力,強調(diào)將智能與本能區(qū)別開來(蔡自興等,2020)。例如,計算機科學家明斯基就將智能理解為“解決困難問題的能力”(Minsky, 1985)。第二類則將智能視為應用知識處理問題的能力或由目標準則衡量的抽象思考能力(蔡自興等,2020),強調(diào)人類如何適應環(huán)境并達成系統(tǒng)目標。例如,有人將智能定義為給定一個輸入集或給定條件下進行正確決策的能力(瓊斯,2010)。計算機科學家紐厄爾和西蒙則將涵蓋了人類智能的“一般智能行動”定義為,發(fā)生在實際情境中在一定的速度和復雜程度約束下,適合系統(tǒng)目標、適應環(huán)境需要的行為(Newell and Simon, 1976)。如果跳出人工智能的技術(shù)邏輯觀察人工智能,在筆者看來,兩類能力都是智能,是智能的一體兩面。學習能力是獲取知識和積累技能的能力,處理問題包括進行決策則是運用知識和技能的能力。兩類能力都是人類智能的重要組成部分。既然如此,人工智能和人類智能又有什么關(guān)系呢?人工智能是否為人類智能的孿生?
羅素和諾維格指出,有些人根據(jù)對人類行為的復刻來定義智能,而另一些人則更喜歡用理性(rationality)來抽象地定義智能(Russell and Norvig, 2021)。智能原本各不相同:一些人將智能視為內(nèi)部思維過程和推理;而另一些人則關(guān)注智能的外部特征,即智能行為。事實上,既有的探討實際覆蓋了4種可能的組合(如表1)(Russell and Norvig, 2021)。
表1
崇尚類人智能的人有他們對智能的定義。一年多來,人工智能熱議中經(jīng)常出現(xiàn)的圖靈測試是用類人行為理解人工智能的典型例子。圖靈提出,如果人類提問者在提出書面問題后無法分辨書面回答是來自人還是來自計算機,那么,這樣的計算機便是“會思考的機器”(Turing, 1950)。值得注意的是,類人行為有特定的指稱,如需要智能才能完成的任務(Raphael, 1976),能夠發(fā)揮需要人類智能才能實現(xiàn)的功能(Kurzwell, 1990),又或者是執(zhí)行人或動物具有的智能任務(Dean et al., 1995)等。這些理解,如今被標準化為自然語言處理、知識表達、推理、學習、視覺等(Russell and Norvig, 2021)。
除了行為,強調(diào)思維的人認為,會思考才是智能,主張使計算機像人類一樣思考(Newell and Simon, 1961),甚至主張反推人類思維機制。持這類觀點的學者認為,人工智能是使計算機能思維、具有智力的新嘗試(Haugeland, 1985),是與人類思維、決策、問題求解和學習等有關(guān)的自動化(Bellman, 1978),是模擬人腦從事推理、規(guī)劃、設計、思考、學習等思維活動(Rich, 1983)。
同樣,推崇理性主義的人也從行為與思維兩個維度提出了自己的主張。關(guān)注思維的人認為,智能并不在于逼真地模擬人類,而在于正確思維的法則與無可辯駁的推理過程。邏輯主義傳統(tǒng)追求用精確的邏輯符號系統(tǒng)刻畫物體及其關(guān)系,并用程序求解一切可用邏輯符號刻畫的問題。例如,用計算模型研究智力行為(Charniak and McDermott, 1985),用計算擬合理解、推理和行為(Winston, 1992),甚至有人極端地認為,智能即知識,即怎樣表達知識,怎樣獲取知識和怎樣使用知識(Nilsson, 1998)。
關(guān)注行為的人則認為,智能在行動上是一種智能體(agent,社會學稱之為能動的行動者),是在環(huán)境中、在與其他智能體共存時,能夠持續(xù)自動運轉(zhuǎn)的實體(Shoham, 1993),它既是人工智能的初衷,也是人工智能的目標(Hayes-Roth, 1995)。還有一些觀點,雖然沒有使用智能體概念,卻明確地以理性行動為標準,如通過計算力圖理解和模仿智能(Schalkoff, 1990),探索智能(Nilsson, 1998),或建立自然智能實體(Genesereth and Nilsson, 1987)。
無論在技術(shù)層次對人工智能的理解有多復雜,在與人類智能關(guān)聯(lián)的意義上,筆者認為,第一,盡管觀點各異,但機器智能是一類思維智能。思維的內(nèi)在是否滿足人類思維邏輯,是技術(shù)層次甚或理想層次的議題,關(guān)鍵是可以輸出為智能行動。第二,智能行動具有階段性。類人智能是智能行動的初級階段,理性主義則是智能行動的理想目標。如何達成是科學與技術(shù)的目標,對應用而言,關(guān)鍵是面對一個需要解決的議題,具有不同智能類型和層級的人工智能與人類智能之間究竟是什么關(guān)系?給定我們討論的場景,即,對文科而言,人工智能現(xiàn)在與將來究竟意味著什么?
學術(shù)智能里的文科未來
在人工智能向一切滲透的歷史潮流中,學術(shù)智能是一個無法阻擋的部分。面向人工智能,就像歷史中的文科和理科一樣,理科已經(jīng)先行一步,形成了理科智能?;蛟S,我們可以從理科智能的努力中窺見文科未來。
理科智能的英文表述——AI for science,字面含義非常清晰,即運用人工智能進行科學探索。言下之意是,人工智能是科學研究的新工具,科學研究則是人工智能的應用場景。不過,還是有人持有不同的觀點。湯超(2022)認為,理科智能有三個層次:第一是把人工智能技術(shù)、特別是深度學習技術(shù)應用于各個學科中的科研、技術(shù)創(chuàng)新、成果轉(zhuǎn)化等之中,只是在實踐中是屬于從1到10、10到100,甚至10到1000的發(fā)展,而從0到1的突破性原始創(chuàng)新不多;第二是運用人工智能發(fā)現(xiàn)新的科學定律、創(chuàng)立新的科學范式、引發(fā)新的科學革命,而不僅僅是充實、完善已有的科學范式;第三是人工智能科學(Science of AI),研究人工智能的科學原理,如2021年諾貝爾物理學獎研究的自旋玻璃模型發(fā)展的統(tǒng)計物理理論對神經(jīng)科學和機器學習的影響。筆者認為,湯超的觀點有點混雜,他的第一、二層次實際是同一個議題的遞進表述,第三個層次則是人工智能這一專門領(lǐng)域的前兩個層次。說到底,理科智能是運用人工智能進行面向自然現(xiàn)象的知識創(chuàng)新和積累,創(chuàng)新即湯超所說的第二個層次,積累即湯超所說的第一個層次。那么,如何運用人工智能進行創(chuàng)新和積累呢?
有人對理科智能的既有發(fā)展進行了歸納(Wang et al., 2023)。當下,人工智能在理科知識創(chuàng)新和積累里扮演的角色依然是工具性的。
第一,助力數(shù)據(jù)清理和提煉。在數(shù)據(jù)篩選中,實時識別并舍棄原始數(shù)據(jù)的背景噪音,保留富含信息的數(shù)據(jù)。例如,使用異常檢測(anomaly detection)算法能夠?qū)⑾∮惺录鳛楫惓?shù)據(jù)進行識別并保存。在物理學、神經(jīng)科學、地球科學、海洋學以及天文學等領(lǐng)域,數(shù)據(jù)選擇智能得到了廣泛的應用。
在數(shù)據(jù)注釋中,訓練有監(jiān)督的模型需要依賴帶有標簽的數(shù)據(jù)集,然而,對生物學、醫(yī)學等實驗性學科來說,生成大量準確標簽的數(shù)據(jù)集既耗時又耗力。偽標簽法(pseudo labelling)和標簽傳播法(label propagation)便是更優(yōu)的替代方案,它們允許在只有少量準確注釋的大型無標簽數(shù)據(jù)集中進行自動注釋。此外,主動學習還可以幫助科學家確定最有必要進行實驗標注的數(shù)據(jù)點,從而進一步降低成本。另一種數(shù)據(jù)注釋策略是借助專業(yè)知識制定標簽規(guī)則。
在數(shù)據(jù)生成中,通過自動數(shù)據(jù)增強(auto augment)和深度生成模型(deep generative AI)生成額外的合成數(shù)據(jù)點、擴充訓練數(shù)據(jù)集,是創(chuàng)建更好模型的有效方法。例如,生成式對抗網(wǎng)絡(generative adversarial network)可以在多個領(lǐng)域中生成逼真且有用的數(shù)據(jù),從粒子碰撞事件、病理切片、胸部X光、磁共振對比、三維材料微結(jié)構(gòu)、蛋白質(zhì)功能到基因序列。
在數(shù)據(jù)提煉中,人工智能則能進一步提高測量分辨率、減少噪聲,并減小測量精度的誤差,使之具有一致性。例如,黑洞成像、捕捉物理粒子碰撞、提高活細胞圖像的分辨率,以及細胞類型檢測。
第二,學習有意義的數(shù)據(jù)表達。在數(shù)據(jù)表達中,幾何先驗、幾何深度學習、自監(jiān)督學習、語言模式化、轉(zhuǎn)接構(gòu)架(transformer architectures)、神經(jīng)算子等均能夠在多層次數(shù)據(jù)中提取有意義的表達方式、優(yōu)化表達,以指導研究。
第三,支撐科學假設建構(gòu)。科學家們在實踐中體會到,人工智能在假設構(gòu)建的多個階段都可以發(fā)揮重要的支撐作用。例如,可以在噪聲觀測中識別候選符號表達式,進而生成假設、幫助設計(如一個能與治療目標結(jié)合的分子),或設想可以推翻數(shù)學猜想的反例。此外,人工智能可以學習假設的貝葉斯后驗分布,利用分布生成與科學數(shù)據(jù)和知識相吻合的假設。實踐策略如黑箱預測、引導組合假設空間、優(yōu)化可微假設空間等。
第四,驅(qū)動實驗與仿真。實驗成本高昂、操作復雜是理科始終面對的實踐難題,計算機仿真一直是替代方案,人工智能為計算機仿真提供了更為有效和靈活的實驗手段??茖W家可以通過人工智能識別和優(yōu)化假設進行測試,還可運用計算機仿真進行假設檢驗。例如,對科學假設進行有效性評估,運用仿真對假設進行推演觀察等。
也有人認為,理科智能是自然科學的新范式(Zhang et al., 2023)。學者們系統(tǒng)地考察了用于量子、原子和連續(xù)體系統(tǒng)的人工智能應用,認為從亞原子(波函數(shù)和電子密度)、原子(分子、蛋白質(zhì)、材料和相互作用)到宏觀(流體、氣候和地下)尺度,通過深度學習捕獲自然系統(tǒng)的物理第一性原理尤其是對稱性,是具有挑戰(zhàn)性的人工智能運用領(lǐng)域,其中可解釋性、分布外泛化、使用基礎(chǔ)和大型語言模型進行知識轉(zhuǎn)移以及不確定性量化,都是人工智能運用的重要場景。還有人考察了人工智能在基礎(chǔ)科學的應用(Xu et al., 2021),如信息科學、數(shù)學、醫(yī)學、材料科學、地球科學、生命科學、物理和化學等。
對20余位數(shù)據(jù)科學家進行的半結(jié)構(gòu)式訪談研究(Wang et al., 2019)還表明,人工智能還運用于自動化數(shù)據(jù)科學家的工作實踐,如Auto AI或Auto ML系統(tǒng)能自主獲取和預處理數(shù)據(jù)、設置新特征,并根據(jù)目標(如準確性或運行效率)創(chuàng)建模型、給模型打分等??茖W家們認為,人工智能一方面加快了構(gòu)建數(shù)據(jù)科學的進程;另一方面還可能過度降低數(shù)據(jù)科學從業(yè)人員的技術(shù)門檻。
還有科學家在設想一個能夠在生物醫(yī)學科學領(lǐng)域進行重大科學發(fā)現(xiàn)的人工智能(Kitano, 2016),如生成并驗證大量假設,開展實時的隨機推斷、開展多策略的適應性學習、保持無限的數(shù)據(jù)記憶容量、執(zhí)行大量并行異質(zhì)處理等。在這些進程中,人工智能可以克服人類在信息處理能力、知識表達能力、表型能力(phenotyping)等方面的認知局限、推動生物醫(yī)學實現(xiàn)研究方法的迭代升級,使科學發(fā)現(xiàn)變?yōu)楦咝У膶嵺`成為可能。
科學家們認為,理論上,人工智能系統(tǒng)可以檢驗所有可能的假設,重新定義科學直覺的本質(zhì)與科學發(fā)現(xiàn)的過程。應用于科學發(fā)現(xiàn)的人工智能將超越現(xiàn)有的人工智能與專家組合,成為頂級研究機構(gòu)的基礎(chǔ)設施,甚至有望居于其他人工智能系統(tǒng)和人類智能體網(wǎng)絡的中心,協(xié)調(diào)大規(guī)模的人機智力活動。例如,實現(xiàn)對數(shù)據(jù)的自動化分析和發(fā)現(xiàn),系統(tǒng)、準確地搜索假設空間以確保最優(yōu)結(jié)果,自主地發(fā)現(xiàn)數(shù)據(jù)中的復雜模式,實現(xiàn)小規(guī)??茖W過程應用的可靠、一致、透明和可復制(Gil et al., 2014),包括在處理大數(shù)據(jù)、發(fā)現(xiàn)長尾的暗數(shù)據(jù)等方面作出貢獻,并通過工作流程系統(tǒng)實現(xiàn)科學發(fā)現(xiàn)過程的自動化(Gil and Hirsh, 2012)。
縱觀理科智能的實踐和科學家們對理科智能的洞見,我們可以作如下歸納:
第一,數(shù)據(jù)是理科智能的前提,沒有數(shù)據(jù)便沒有理科智能。理科數(shù)據(jù)有兩類來源,一是科學活動產(chǎn)生的數(shù)據(jù),如實驗數(shù)據(jù)、觀測數(shù)據(jù)、傳感數(shù)據(jù)、調(diào)查數(shù)據(jù)等,在人工智能可以運用于理科之前,理科已經(jīng)在依據(jù)數(shù)據(jù)做研究;二是人工智能生成的數(shù)據(jù),在給定事物之間關(guān)系的前提下,人工智能有能力產(chǎn)生可用于研究活動的數(shù)據(jù),即生成式數(shù)據(jù)。
第二,人工智能有助于標記數(shù)據(jù)、清理數(shù)據(jù)、篩選數(shù)據(jù)、分析數(shù)據(jù)、表達數(shù)據(jù)。理科數(shù)據(jù)的規(guī)模和類型多元且復雜。清理數(shù)據(jù)曾經(jīng)是工作量巨大且勞動力密集型的科學活動,無論是實驗或觀測產(chǎn)生的數(shù)據(jù)還是人工智能生成的數(shù)據(jù),人工智能都可以用于標記數(shù)據(jù)、清理數(shù)據(jù)、篩選數(shù)據(jù)、分析數(shù)據(jù)、表達數(shù)據(jù),讓數(shù)據(jù)以科學家希望的形式精準地呈現(xiàn)。
第三,人工智能有助于檢驗或發(fā)現(xiàn)事物之間的關(guān)系模式。運用數(shù)據(jù)檢驗科學假設是科學研究最重要的活動之一,人類計算能力的局限一度導致可以運用于假設檢驗的數(shù)據(jù)量非常有限,人工智能之于科學計算,有能力在假設檢驗中納入更多數(shù)據(jù)和參數(shù),如生成式大模型的參數(shù)量級已經(jīng)逼近萬億,完全達到了人力不可及的量級。不僅如此,計算能力和模式發(fā)現(xiàn)(如機器學習,無論是哪種學習)能力的增長,讓人工智能所具備的從數(shù)據(jù)中發(fā)現(xiàn)事物之間關(guān)系模式的能力早已超越了人類,人工智能可以實現(xiàn)從數(shù)據(jù)中發(fā)現(xiàn)模式,使得創(chuàng)新和積累知識不只是理科智能的應用場景,甚至開始運用于生產(chǎn)實踐,如藥物篩選、材料發(fā)現(xiàn),等等。
第四,人機互生,科學家與機器智能相互促進。對理科智能的眾多討論只是刻畫了科研實踐,即使提及理科的新范式,也語焉不詳。其實,科研實踐已經(jīng)揭示了理科智能的應用場景,這也是在之前的理科中不曾出現(xiàn)的部分。例如,人機之間相互啟發(fā)與互動,一方面機器給人類帶來靈感,啟發(fā)人類進行創(chuàng)新;另一方面人類也給機器提出難題,挑戰(zhàn)機器綜合人類知識和從知識中發(fā)現(xiàn)新知識的能力,促進機器智能能力的迭代創(chuàng)新。既有的人工智能運用幾乎都能證明這一點,如Alpha Fold 2與蛋白質(zhì)結(jié)構(gòu)預測、Graphormer與分子建模等。
除此以外,筆者認為,關(guān)于理科智能的討論有一個重要缺失,即對知識創(chuàng)新與積累的路徑缺乏討論。截至當下,幾乎所有討論都還是以既有分科學術(shù)為默認前提的討論,沒有觸及類似科學革命帶來的分科學術(shù)的路徑討論,或者尚未提及知識創(chuàng)新與積累的新形態(tài)或新范式。
即使如此,文科智能可以從理科智能中看到怎樣的未來呢?對此,筆者在之前的討論已有部分述及(邱澤奇,2023),這里不妨摘其要而論。
第一,與理科智能一樣,文科智能的前提也是數(shù)據(jù)。在一定程度上可以說,理科在科學革命之后就完成了以數(shù)據(jù)為支撐的科學邏輯建構(gòu),而文科還沒有完成以數(shù)據(jù)為基底的知識創(chuàng)新與邏輯建構(gòu)??芍灰狈?shù)據(jù),就難以讓人工智能進入文科智能。因此,文科未來的第一階段工作是素材的數(shù)據(jù)化,將對社會現(xiàn)象的刻畫從文字的、形象的轉(zhuǎn)變?yōu)閿?shù)據(jù)的,從碎片化的、離散化的數(shù)據(jù)轉(zhuǎn)變?yōu)閰R聚化的、可以彼此關(guān)聯(lián)的數(shù)據(jù),進而為運用算法、回到整體視角提供條件,且可以讓人工智能支持甚至支撐數(shù)據(jù)化,如一切非數(shù)據(jù)素材的數(shù)據(jù)化。不僅如此,人工智能同樣可以針對社會現(xiàn)象生成數(shù)據(jù)。簡言之,“一切皆可數(shù)據(jù)化”的邏輯同樣適用于文科素材。
第二,接下來的場景,文科與理科是一致的。如標記數(shù)據(jù)、清理數(shù)據(jù)、篩選數(shù)據(jù)、分析數(shù)據(jù)、表達數(shù)據(jù),讓數(shù)據(jù)以文科學者希望的形式精準呈現(xiàn)。再如,檢驗假設、發(fā)現(xiàn)規(guī)律等。需要特別說明的是,素材的數(shù)據(jù)化將改變?nèi)宋呐c社科分立的現(xiàn)象,使得對人類精神的探索與對社會規(guī)律的探索殊途同歸。直到當下,人類精神現(xiàn)象是否存在規(guī)律還是一個懸而未決的議題,對精神分析的爭議便是明證。文科智能至少可以讓文科學者們證明人類的精神世界是否有規(guī)律可循。同樣,文科智能也遵循人機互生的模式。其實,彭特蘭的實驗已經(jīng)證明,人類智能是在小群體中被激發(fā)的,在小群體中有一個記憶力、算力、歸納和綜合能力超群的同伴,意味著人機互生將獲得更大創(chuàng)造力(阿萊克斯·彭特蘭,2015)。
第三,文科智能的知識創(chuàng)新與積累更有機會突破科學革命之后文科的悖論,邁向新的綜合,以可靠的、可檢驗的整體性知識造福人類。與理科智能不同,除了運用數(shù)據(jù)檢驗假設、發(fā)現(xiàn)規(guī)律,形成給定條件下的具體規(guī)律,文科智能還需要將具體場景的規(guī)律整合起來,形成彼此關(guān)聯(lián)的、有助于人們理解和解釋日?,F(xiàn)象的知識動態(tài)。換句話說,由文科智能帶來的知識不再是嚴格約束條件下的、面向社會現(xiàn)象的規(guī)律,而是以日常為條件的、面向日常社會現(xiàn)象的理解與解釋。文科智能帶來的文科知識創(chuàng)新與積累,在外顯形態(tài)上理應成為每個人觸手可及的知識源。
而要實踐文科智能,除了面對理科智能的挑戰(zhàn)以外,還有文科特定的挑戰(zhàn)。在學術(shù)智能中,無論是理科還是文科,當下的實踐路徑都是建立在科學革命之后分科學術(shù)路徑基礎(chǔ)上的,人們已經(jīng)養(yǎng)成了對專門問題進行深入挖掘的習慣,如何重新回到“深入淺出”的路徑上,在專門知識之間建立聯(lián)系,讓專門知識成為日常知識池,還沒有一條明確的可以實踐的路徑。算法創(chuàng)新或許是路徑探索的關(guān)鍵(Wang et al., 2023)。在海量數(shù)據(jù)環(huán)境下,不要說深入淺出,即使只是深入,沒有算法也寸步難行。
更大的難題還在于,當下,學術(shù)界似乎還沒有充分認識到人工智能對學術(shù)的影響力,更缺乏相關(guān)能力的積累。從數(shù)據(jù)化、模型化、算法化到知識化,每一個環(huán)節(jié)與環(huán)節(jié)關(guān)聯(lián),文科未來的起點似乎要從培養(yǎng)跨學科的人才開始。
結(jié)論
之所以在概念層次探討文科未來,誠如讀者所見,文科智能的發(fā)展還沒有進入理科智能的階段,還沒有可以討論的實踐和細節(jié)。盡管如此,文科未來的方向是明確的,那就是與理科智能一樣,推動人工智能與人類智能彼此互生,通過知識積累和創(chuàng)新,形成人類知識的新形態(tài),也形成知識服務于人類的新格局,促進人類對自身的理解與解釋,進而增進人類福祉。
參考文獻
阿萊克斯·彭特蘭,2015,《智慧社會:大數(shù)據(jù)與社會物理學》,汪小帆、汪容譯,杭州:浙江人民出版社。
蔡自興等編,2020,《人工智能及其應用(第6版)》,北京:清華大學出版社。
瓊斯,2010,《人工智能》,黃厚寬、尹傳環(huán)、董興業(yè)譯,北京:電子工業(yè)出版社。
邱澤奇,2023,《數(shù)字化與文科范式革命》,《大學與學科》,第2期。
湯超,2022,《關(guān)于AI for Science的幾層意思》, https://hub.baai.ac.cn/view/19780。
A. Newell and H. A. Simon, 1961, “Computer Simulation of Human Thinking,“ Science, 134.
A. Newell and H. A. Simon, 1976, “Computer Science as Empirical Inquiry: Symbols and Search,“ Communications of the ACM, 19(3).
A. Turing, 1950, “Computing Machinery and Intelligence," Mind, 59(236).
B. Hayes-Roth, 1995, “Agents on Stage: Advancing the State of the Art of AI,“ Proceeding of IJCAI, (1).
B. Raphael, 1976, The Thinking Computer: Mind Inside Matter, San Francisco: W. H. Freeman.
D. K. Wang et al., 2019, “Human-AI Collaboration in Data Science: Exploring Data Scientists' Perceptions of Automated AI,“ Proceedings of the ACM on Human-Computer Interaction, 3(CSCW).
D. Lazer et al., 2009, “Computational Social Science,“ Science, 323(5915).
D. Lazer et al., 2020, “Computational Social Science: Obstacles and Opportunities,“ Science, 369(6507).
E. Charniak and D. McDermott, 1985, Introduction to Artificial Intelligence, Massachusetts: Addison-Wesley.
E. Rich, 1983, Artificial Intelligence, New York: McGraw-Hill.
H. Kitano, 2016, “Artificial Intelligence to Win the Nobel Prize and Beyond: Creating the Engine for Scientific Discovery,“ AI Magazine, 37(1).
H. C. Wang et al., 2023, “Scientific Discovery in the Age of Artificial Intelligence,“ Nature, 620, 47-60.
J. S. Coleman, 1994, Foundations of Social Theory, Cambridge: Harvard University Press.
J. Haugeland, 1985, Artificial Intelligence: The Very Idea, Cambridge: MIT Press.
J. McCarthy et al., 2006/1955, “A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence,“ AI Magazine, 27(4).
M. Genesereth and N. Nilsson, 1987, Logical Foundations of Artificial Intelligence, Los Altos: Morgan Kaufmann.
M. Minsky, 1985, The Society of Mind, New York: Simon and Schuster.
N. J. Nilsson, 1998, Artificial Intelligence: A New Synthesis, San Francisco: Morgan Kaufmann.
P. Winston, 1992, Artificial Intelligence (3rd edition), New York: Addison-Wesley.
R. Bellman, 1978, An Introduction to Artificial Intelligence: Can Computers Think? San Francisco: Boyd & Fraser Publishing Company.
R. Kurzwell, 1990, Age of Intelligent Machines, Cambridge: MIT Press.
R. Schalkoff, 1990, Artificial Intelligence: An Engineering Approach, New York: McGraw-Hill.
S. Russell and P. Norvig, 2021, Artificial Intelligence: A Modern Approach (4th edition), New York: Pearson.
T. Dean; J. F. Allen and Y. Aloimonos, 1995, Artificial Intelligence: Theory and Practice, New York: Addison-Wesley.
X. Zhang et al., 2023, “Artificial Intelligence for Science in Quantum, Atomistic, and Continuum Systems,“ arXiv:2307.08423v2 [cs.LG].
Y. Gil et al., 2014, “Amplify Scientific Discovery with Artificial Intelligence,“ Science, 346(6206).
Y. Gil and H. Hirsh, 2012, “Discovery Informatics: AI Opportunities in Scientific Discovery,“ In Discovery Informatics: The Role of AI Research in Innovating Scientific Processes, Palo Alto: AAAI Press.
Y. Shoham, 1993, “Agent-Oriented Programming,“ Artificial Intelligence, 60(1).
Y. J. Xu et al., 2021, “Artificial Intelligence: A Powerful Paradigm for Scientific Research," The Innovation, 2(4).
Future Prospects of AI for Humanities and Social Science
Qiu Zeqi
Abstract: The release of generative AI marks the beginning of AI applications in society, and has sparked discussions on the impact of AI in various fields. In the academic field, the impact of artificial intelligence is far greater than the shock of metrologic technology in the revolution of science, and the impact on the humanities and social science (HSS) is particularly subversive. In the history of academic development, the HSS are the remnants of holistic scholarship in the revolution of science, and the humanities still have the characteristics of holistic scholarship. In the context of technological development, artificial intelligence is not a concept with full consensus, but the application of AI points to the extension and replacement of human thinking and action capabilities. The influence of AI on the academic field has produced AI for academia, among which AI for science has formed some paths that can be used for reference in AI for HSS, and AI for HSS will end up with AI for science, and the future of HSS will eventually become the source of knowledge for human daily needs through the innovation and accumulation of human-machine knowledge of human-machine interaction.
Keywords: AI, AI for academia, AI for science, AI for humanities and social science
責 編∕李思琪