參會者在2024互聯(lián)網岳麓峰會現(xiàn)場與AI數(shù)字人“小麓”互動。
新華社記者 陳澤國攝
在江蘇省無錫市百度智能云千帆大模型(無錫)創(chuàng)新中心,工作人員在展示視覺追蹤機械臂控制技術。
陸啟輝攝(人民視覺)
“可以給我設計一個北京一日游計劃嗎?”近日,2024世界智能網聯(lián)汽車大會現(xiàn)場,在極狐阿爾法S5上體驗北汽AI智能體的李先生,感覺自己有了一名隨叫隨到的“出行顧問”,“只需一句語音指令,AI智能體就能自動規(guī)劃好路線,方便極了”。
近年來,AI(人工智能)大模型技術的涌現(xiàn),掀起新一代AI研究熱潮,而今,AI智能體(AI Agent)正成為行業(yè)新熱點。從智能汽車中的語音助手到網絡直播間的數(shù)字人主播,AI智能體正以其獨特的自主性和交互性,深度改造應用生態(tài),持續(xù)構建智慧生活新圖景。
重塑人與機器的互動方式
顧名思義,AI智能體就是具備AI能力的一個智能實體,其可能是硬件裝置,也可能是軟件系統(tǒng)。它能夠感知環(huán)境、進行決策,并依托AI能力執(zhí)行動作,最終實現(xiàn)特定的目標任務。
“通俗來講,AI智能體就像一個有智商、有情商、能理解、會幫忙的‘小助手’。”北京通用人工智能研究院先進技術中心副主任陳浩表示,這個“小助手”不僅能理解人類的語言,還能通過學習和分析數(shù)據(jù)來不斷提高自己在特定領域的技能水平。
為何AI智能體能成為行業(yè)關注的熱點?其與大模型技術的關系是怎樣的?
字節(jié)跳動豆包大模型相關負責人接受本報采訪時表示,AI智能體是基于大模型技術出現(xiàn)的,AI智能體“有手有腳”,可以自己干活、自己執(zhí)行,而大模型就是它的“大腦”。
但AI智能體是更“立體化”的智能系統(tǒng),除了提供大模型廣泛使用的語言交流服務,AI智能體還能根據(jù)上下文進行智能推理和情感分析,并模仿人類行為進行相應的操作。
比如,下達“幫我做一道菜”這項任務指令,“大模型廚師”只能輸出一份食譜并指出需要哪些食材;“AI智能體廚師”則不僅能提供食譜,還會根據(jù)指令人的口味偏好和營養(yǎng)需求,選擇最合適的食材自動下單購買,甚至能夠監(jiān)控烹飪過程,確保食物的質量和口感。
“傳統(tǒng)的人機對話往往受限于固定的模式和預設的規(guī)則,難以實現(xiàn)真正自然的交流。”百度集團資深副總裁梁志祥指出,依托大模型在理解、生成、邏輯、記憶方面的四大能力,AI智能體已經能夠模擬出更加貼近人類真實對話的方式,這使得“人機交互”變得如同“人人對話”一樣流暢自然。
事實上,獲益于大模型的通用性和可擴展性,AI智能體的使用門檻得以大幅降低。無論是大型企業(yè)還是中小企業(yè),甚至是個人開發(fā)者,無需新硬件或大量額外的訓練數(shù)據(jù),都能快速搭建起自己的AI智能體應用。
前不久,百度“文小言”大模型App推出“一句話創(chuàng)建智能體”的新功能。每個人可以根據(jù)需求創(chuàng)建專屬于自己的AI智能體,其性格、音色、身份設定都取決于用戶的個性化選擇。創(chuàng)建者可與“專屬智能體”進行視頻對話、英語口語練習,還可以模擬求職面試等。據(jù)相關統(tǒng)計,百度文心智能體平臺已吸引了10萬家企業(yè)、60萬名開發(fā)者,覆蓋了上百個應用場景。
“未來,如果用戶使用及生成自己的AI智能體都更加便捷,這將真正釋放AI智能體的價值。”梁志祥說,“下一步,我們將把AI智能體精準、高效地分發(fā)給更多的用戶,讓每個人都能成為AI智能體的‘開發(fā)者’。”
應用場景持續(xù)拓寬
當前,一系列AI智能體技術正在蓬勃發(fā)展,應用場景持續(xù)拓展。
“一年半以前,北汽極狐就開始著手研究AI智能體,主要應用于研發(fā)效率提升、標準化語言編譯以及用戶服務等多個方面。”北汽研究總院智能網聯(lián)中心主任馮碩介紹,AI賦能的駕駛艙告別了機械式、固定指令式“人機問答”的舊模式,可實現(xiàn)靈活性、定制化的“智能交互”,例如,AI智能體會根據(jù)駕乘人的工作習慣安排日程表,捕捉駕乘人的喜好、情緒推薦音樂、電影等。
當識別出駕乘人過度疲勞時,AI智能體會迅速生成包括預訂車位、調節(jié)車內環(huán)境、設定休息時長等在內的服務方案,為用戶提供更加安全的智能駕駛體驗。“未來,AI智能體還有望搭載‘一句話訂外賣’等功能,更方便駕乘人使用。”馮碩說。
與此同時,AI智能體技術也在快速發(fā)展并逐步落地到各種小型終端設備中。
“豆包豆包,寺中這個羅漢是誰?”“這是摩訶迦葉,釋迦牟尼的十大弟子之一……”自媒體運營者小范回憶道,在國慶假期參觀浙江臺州國清寺時,他與耳機Ola Friend之間常有這樣的問答。
據(jù)了解,Ola Friend是字節(jié)跳動旗下豆包大模型發(fā)布的首款AI智能體耳機,除了常規(guī)的聲樂播放功能,還能在信息查詢、旅游出行等場景為用戶提供即時幫助。
豆包大模型相關負責人介紹稱,Ola Friend可隨時化身為用戶的“私人導游”,并且用戶還能根據(jù)興趣點進行“追問”,如逛畫展時,用戶可以就某件具體的展品讓Ola Friend幫自己介紹,再延伸追問該展品創(chuàng)作者的藝術風格、其他代表作品等,在一問一答中獲取更多知識。
今年以來,越來越多的手機廠商也紛紛加入AI智能體布局。vivo近期發(fā)布了名為PhoneGPT的手機智能體,能夠基于用戶意圖準確操作手機應用以完成任務,如打電話、發(fā)短信、訂餐廳等,極大提升用戶體驗;華為將智慧助手小藝升級為系統(tǒng)級智能體,不僅問答能力再進階,而且具備更強的感知推理能力;OPPO則推出了“1+N”智能體生態(tài)戰(zhàn)略,由AI超級智能體和AI Pro開發(fā)平臺組成,旨在提供更符合用戶偏好的個性化服務模式。
在商業(yè)服務場景中,AI智能體正與消費者進行深度互動。
百度電商數(shù)字人直播平臺“慧播星”5分鐘就能生成一個帶貨智能體,不僅可以24小時在線,且整個直播間實現(xiàn)了完全智能化、無人化。數(shù)字人主播和數(shù)字人副播各司其職,及時回答消費者提問,展示和講解商品時配合流暢自然,對來不及口頭回復的問題,還有AI助理進行文字回復。
“因為有了數(shù)字人直播智能體技術,電商直播行業(yè)的成本高、時間受限、質量不穩(wěn)定等難題得到有效緩解。”梁志祥稱,截至目前,“慧播星”已累計幫助數(shù)萬家商家實現(xiàn)收益增長,平均帶來62%的商品交易總額的提升。
當前,AI智能體還在其他諸多場景中得到應用,如編程、內容創(chuàng)作、工業(yè)制造等,展現(xiàn)出強大的應用潛力和市場價值。
帶給未來生活更多可能
不少業(yè)內人士認為,AI智能體將是未來趨勢所在。
騰訊發(fā)布《2024數(shù)字科技前沿應用趨勢報告》認為,大模型將走向多模態(tài),AI智能體有望成為下一代平臺。國際管理咨詢公司埃森哲在《技術展望2024》報告中稱,96%的企業(yè)高管認為AI智能體將在未來3年內為其所在企業(yè)帶來重大發(fā)展機遇。
業(yè)內人士表示,在可預見的未來,AI智能體將幫助多個行業(yè)構建起以“人+AI數(shù)字員工”為核心的智能化運營新常態(tài)。例如,在醫(yī)療領域,AI智能體可以協(xié)助醫(yī)生進行診斷、治療和健康管理;在交通領域,AI智能體可以通過分析數(shù)據(jù)和實時路況,為交通管理和規(guī)劃提供科學依據(jù);在教育領域,AI智能體可以提供智能輔導和自適應學習系統(tǒng),幫助學生更好掌握知識。
專家指出,隨著機器學習和深度學習技術的不斷進步,AI智能體的特性和學習能力還將變得愈發(fā)強大,未來將更好地適應復雜多變的現(xiàn)實世界,為社會發(fā)展帶來更多可能。
盡管AI智能體技術為未來生活帶來了更多可能,但目前其仍然處于起步階段——已出現(xiàn)的AI智能體僅能完成較為簡單、固定的工作,且應用功能同質化嚴重。
有觀點指出,AI智能體的發(fā)展瓶頸之一在于目前的大模型缺乏足夠的推理能力,無法在沒有人工介入的情況下真正解決復雜的問題。大模型技術本身就因算法等因素存在不可預測的先天缺陷,容易為AI智能體帶來一系列安全隱患。
除了技術風險,AI智能體也面臨倫理和隱私等問題。業(yè)內人士表示,AI智能體在提供服務的過程中會收集大量數(shù)據(jù),有可能導致個人隱私信息的泄露,比如AI智能體可能會根據(jù)用戶的購物習慣推斷出他們的某些私人愛好。這種“窺探”行為,無疑是對用戶隱私的侵犯。
專家認為,目前需盡快根據(jù)智能體的功能用途、使用時限進行分類管理,尤其對高風險智能體的開發(fā)生產及應用部署進行持續(xù)監(jiān)管,并及時制定相關法律法規(guī),改進現(xiàn)有互聯(lián)網標準,從而更好地預防智能體引發(fā)的各種風險。