具身智能是指一種思想或者理論。它強調(diào)認知受智能體的感知與動作的影響,主張智能或智能行為來自智能體身體與周圍環(huán)境的交互,而不僅僅是大腦的功能。這種思想與建立在笛卡爾身心二元論基礎(chǔ)上的離身智能不同,后者沒有考慮大腦與身體之間的聯(lián)系。具身智能理論對認知科學、心理學、人類學、藝術(shù)等都產(chǎn)生了深刻的影響,由此誕生了具身認知、具身心理學等分支學科。當前,具身智能理論深入到大眾關(guān)注的人工智能、機器人技術(shù)等領(lǐng)域,并產(chǎn)生重大影響。
推動人工智能邁向更高水平的通用人工智能
早期人工智能研究者認為,機器可以通過對符號的操作實現(xiàn)對人類思考(理性行為)的模擬,即讓機器像人類那樣思考,無需考慮身體和環(huán)境。他們把人工智能定義為模擬人類的智能行為,除了模擬思考之外,還包括感知、動作,以及情感與靈感等。由于他們認為思考和身體、環(huán)境是分離的,因此在模擬這些行為時,是各自獨立進行,沒有考慮行為之間的相互聯(lián)系。人工智能的另一學派內(nèi)在主義,主張人工智能應(yīng)該模擬人類大腦的工作原理,我們通常稱之為類腦計算。這個學派也沒有考慮思考、感知與身體的關(guān)系。因此傳統(tǒng)人工智能中的兩大學派都屬于離身智能。
具身智能則認為人類的智能行為不僅依賴大腦的思考,還需要通過與物理環(huán)境的交互來進行學習和決策,最后通過感知將執(zhí)行的結(jié)果反饋到大腦,形成閉環(huán),構(gòu)成一個智能體,這樣才能真正實現(xiàn)模擬人類智能行為的目標。具身智能這種思想的提出,與傳統(tǒng)人工智能不同,將推動人工智能向更高的水平——通用人工智能發(fā)展。
人工智能的發(fā)展歷史,經(jīng)歷過三個階段。第一代人工智能提出以知識與經(jīng)驗為基礎(chǔ)的推理模型,通過這一模型來模擬人類的思考。這一模型具有可解釋性與可理解性的優(yōu)點,但由于知識表示與獲取的困難,該模型在應(yīng)用和產(chǎn)業(yè)化上受到很大限制。第二代人工智能提出數(shù)據(jù)驅(qū)動的模型,通過基于大數(shù)據(jù)的機器學習,實現(xiàn)對人類感性和情感行為的模擬。由于模型的圖像、語音等輸入數(shù)據(jù)來自客觀世界,因此具有很大的應(yīng)用潛力,但由于模型本身存在不安全、不可靠、不可信(不可解釋)、不可控和不易推廣等缺陷,因此應(yīng)用范圍有限。雖然科學家在這期間也進行過模擬人類動作,比如手的操作與腳的步行等研究,但沒有將這些研究與思考、感知等其他方面聯(lián)系起來??傊?,這兩代人工智能都有很大的局限性,而且只針對特定領(lǐng)域、利用特定模型去解決特定任務(wù)。
2020年大語言模型的出現(xiàn),把人工智能推向新的發(fā)展階段——第三代人工智能。大語言模型具有強大的語言生成能力,使機器能夠在開放領(lǐng)域下實現(xiàn)與人類的自由交互,這表明機器已經(jīng)完全掌握了人類的語言。此事意義重大。正如哲學家維特根斯坦所言:“我的語言界限,就是我的世界界限。”機器一旦掌握了人類的語言,也就在某種程度上理解了人類的世界。大語言模型向通用人工智能邁出了關(guān)鍵一步。
盡管人工智能在語言生成上取得成功,在許多其他任務(wù)上還不能實現(xiàn)領(lǐng)域的通用性。比如醫(yī)療診斷,目前我們還沒有開發(fā)出適用于各種疾病的計算機醫(yī)療診斷系統(tǒng)。另外,大語言模型只會說(生成語言),不會干(行動)。還有大量的任務(wù),特別是復(fù)雜的任務(wù),人工智能目前還無法完成。我們離真正的通用人工智能仍有一定距離,其原因就在于,傳統(tǒng)人工智能對人類(大腦)的思考、感知與動作等方面的模擬是相互分開的,而且與環(huán)境隔離。具身智能則強調(diào)物理身體、環(huán)境感知與反饋的重要性,并通過它們實現(xiàn)與外部世界的交互。這正好彌補了傳統(tǒng)人工智能的不足,使機器通過與環(huán)境的反復(fù)交互,逐漸學習適應(yīng)環(huán)境并優(yōu)化其決策和行動,不斷迭代,完成更多、更復(fù)雜的任務(wù),這就是新的學習范式——強化學習。由此可見,具身智能將使人工智能在更廣泛的環(huán)境下,完成更多的任務(wù),向通用人工智能邁進。
推動機器人領(lǐng)域三方面的技術(shù)進步
機器人的研究遠在人工智能誕生之前。1954年,科學家發(fā)明數(shù)字控制可編程的機械臂,為現(xiàn)代工業(yè)機器人打下基礎(chǔ),也預(yù)示著現(xiàn)代機器人的真正誕生。在人工智能的發(fā)展過程中,雖然也將模仿人類動作納入研究范圍,但由于當時研究的重點是思考與感知,動作(身體)并沒有受到很大關(guān)注。后來,機器人研究慢慢形成一個新領(lǐng)域——機器人學,與人工智能中的動作研究同時存在。機器人學研究的范圍更寬,也更多關(guān)注技術(shù)、實際應(yīng)用和產(chǎn)業(yè)化。1986年,移動機器人的先驅(qū)羅德尼·布魯克斯提出了行為主義機器人學的主張,他認為傳統(tǒng)的符號主義人工智能過于依賴復(fù)雜的推理系統(tǒng),忽視了身體與環(huán)境的互動對智能行為的關(guān)鍵性貢獻??梢哉f,這是在機器人領(lǐng)域首次提出具身智能思想。
總的來看,具身智能推動了機器人領(lǐng)域三方面的技術(shù)進步。
其一是推動機器人技術(shù)從單一感知(如視覺或觸覺)向多模態(tài)感知發(fā)展。自動駕駛汽車需要在各種氣候條件和復(fù)雜環(huán)境下行駛,全天候的環(huán)境感知極為重要。目前除了利用單一的攝像機之外,人們更多地考慮多傳感器融合,即除攝像機之外,還要綜合利用激光掃描儀、雷達、聲吶、衛(wèi)星定位等不同傳感器,以保證感知的可靠性。同樣,對機械手來講,也需要利用觸覺、力覺、力矩覺等多傳感器的融合,以便在復(fù)雜環(huán)境下實現(xiàn)復(fù)雜操作,比如,裝配、搶險救災(zāi)、排雷等。
其二是推動機器人技術(shù)更加關(guān)注軟件與硬件的高度整合。為了適應(yīng)不同工作任務(wù)的需求,我們需要設(shè)計不同類型的機器人,如為家庭服務(wù)的人形機器人,擁有靈巧雙手的裝配機器人,擁有特殊功效的仿生機器人等。不同類型的機器人需要不同的控制技術(shù),也會導致不同的學習和感知方式,這反過來又影響機器人形態(tài)的設(shè)計。這些都屬于機器人軟硬件協(xié)同的問題。
其三,具身智能中的智能體概念對機器人技術(shù)也將產(chǎn)生重要影響。根據(jù)智能體這一概念,機器人將思考、感知和動作連為一體,既可以在數(shù)字世界中也可以在物理世界中完成任務(wù),利用數(shù)字世界又可以對物理世界進行仿真,這些對推動機器人的發(fā)展意義重大。比如,無人車的實驗如果在物理世界中進行,就要受到氣候條件、突發(fā)事件等諸多因素限制,利用仿真模擬則會大大提高效率,節(jié)省時間與費用。利用智能體理論,我們可以讓機器人相互之間進行博弈,實現(xiàn)機器的自我進化(迭代),使機器人的性能不斷提高。
(作者為中國科學院院士、清華大學教授)
推薦讀物
《人工智能導論》:林堯瑞、馬少平編著;清華大學出版社出版。
《可解釋人工智能導論》:楊強、范力欣等著;電子工業(yè)出版社出版。
《具身智能導論》:劉華平、郭迪等編著;高等教育出版社出版。
版式設(shè)計:蔡華偉