隨著人工智能的快速發(fā)展,大模型技術已成為當今人工智能領域的熱門話題。2022年底以來,認知大模型掀起通用人工智能的全新熱潮,其歷史意義被認為“不亞于PC和互聯(lián)網的誕生”。2024年12月底,深度求索公司先后發(fā)布DeepSeek V3和DeepSeekR1大模型,并快速“出圈”,提升了我國在全球人工智能領域的影響力,引發(fā)國內外廣泛關注,在全球范圍掀起又一輪大模型發(fā)展浪潮。鑒于此,梳理大模型技術的進展和產業(yè)發(fā)展現(xiàn)狀,剖析其面臨的困難挑戰(zhàn)以及未來發(fā)展趨勢,并找到針對性的對策,有助于我們全面深入地掌握大模型這一前沿領域,加快推動我國大模型技術與產業(yè)的發(fā)展邁上新臺階。
大模型技術及產業(yè)發(fā)展現(xiàn)狀
2017年,Google提出Transformer架構,成為大模型領域主流算法基礎。次年,OpenAI發(fā)布GPT-1、Google推出BERT,預訓練大模型由此成為自然語言處理主流。此后,AI大模型技術不斷突破。2020年起,OpenAI陸續(xù)推出GPT-3、GPT-3.5、GPT-4,AI能力多輪提升。至2024年,全球大模型井噴式發(fā)展。OpenAI發(fā)布的文生視頻Sora模型,推動大模型技術向語音、視覺等多模態(tài)及學科交叉方向拓展;隨后推出的GPT-4o能夠實時處理多類型信息,顯著提升了人機對話響應速度;發(fā)布的o1-Preview大模型則大幅提高了復雜推理能力。同年末,又推出了o1pro、o3等新一代推理大模型,向通用人工智能進一步邁進。在國內,眾多公司以及高校和科研機構均加大投入,發(fā)布眾多通用大模型,形成了“百花齊放”的景象。例如,百度的“文心一言”、阿里的“通義千問”、字節(jié)跳動的“豆包”以及科大訊飛的“訊飛星火”,特別是深度求索公司發(fā)布的DeepSeekV3和DeepSeekR1大模型,通過打破傳統(tǒng)的“算力競賽”規(guī)則并完全開源,成為國內的一個里程碑事件。
在產業(yè)應用方面,國外微軟、谷歌等大廠積極探索企業(yè)級服務商業(yè)化路徑,加快產業(yè)落地。微軟先后把ChatGPT/GPT-4能力融入Bing搜索引擎、Office全家桶、Azure云服務和Teams程序等,推出Microsoft 365Co-pilot,顯著提升Office生產力與交互體驗。OpenAI借助插件接入互聯(lián)網,能調用各類APP、解決復雜任務,甚至被美國國防部、NASA等政府機構用于情報分析、軍事戰(zhàn)略規(guī)劃等領域。隨著我國新基建、新經濟推進,眾多團隊加速大模型場景創(chuàng)新應用。如在教育領域,大模型賦能智慧課堂、個性化學習等,助力教育公平與教學質量提升;在醫(yī)療領域,大模型全方位提升“醫(yī)、教、研、管”各環(huán)節(jié)診療水平。此外,在金融、工業(yè)、政府、科研、電商、文旅、司法等其他領域,大模型也得到廣泛應用,為各行業(yè)發(fā)展注入新的動力。通過融合Deep-Seek等深度搜索技術的優(yōu)勢,國內團隊也在不斷探索如何進一步提升大模型在特定應用場景下的信息檢索與處理能力,以滿足更加復雜多樣的用戶需求。
面臨的困難和挑戰(zhàn)
盡管大模型技術及其產業(yè)生態(tài)已取得階段性顯著成果,但其發(fā)展之路仍布滿復雜且亟待解決的難題與挑戰(zhàn)。
國產大模型的創(chuàng)新升級在較大程度上依賴于國外的先進算力。當前國產算力軟件系統(tǒng)的生態(tài)還不成熟,每一次大模型算法創(chuàng)新,都需要額外投入數(shù)月的時間來進行大量的國產適配移植和效率優(yōu)化工作。此外,國產大模型訓練高度依賴進口算力,除個別模型外,多數(shù)可下載的大模型均基于英偉達卡訓練。考慮到未來我國獲取英偉達先進制程算力資源的渠道可能會進一步受限,若不能盡快解決國產自主可控人工智能產業(yè)生態(tài)薄弱、適配困難等問題,我們或將面臨“在他國基石上構筑高樓”的困境。
國產大模型在落地應用生態(tài)方面缺乏成熟有效的工具鏈體系支持。盡管國家已出臺多項政策措施,鼓勵和支持基于國產硬件開展大模型的落地應用,但大模型在實際行業(yè)應用中需要語言、語音及多模態(tài)等多個大模型的組合創(chuàng)新,同時還需要針對行業(yè)/私域知識和特定場景任務進行定制優(yōu)化,這迫切需要成熟、高效且易用的工具鏈體系來支撐。然而,當前國產落地工具鏈體系的缺失和不足,正嚴重制約大模型在行業(yè)中的廣泛、快速應用,以及創(chuàng)新創(chuàng)業(yè)生態(tài)的構建和發(fā)展。
人工智能生成的虛假信息泛濫正在威脅網絡信息安全。在技術機理上,現(xiàn)行人工智能系統(tǒng)主要依托深度神經網絡架構進行統(tǒng)計建模,這種數(shù)據驅動范式導致模型存在知識記憶模糊、幻覺等問題。以OpenAI發(fā)布的GPT-4.5為例,雖將幻覺發(fā)生率較GPT-4o降低40%,但在SimpleQA基準測試中仍高達37.1%。隨著具備長思維鏈的推理模型用戶增多,由于推理模型在生成內容邏輯自洽性、結構嚴謹性方面的優(yōu)勢,幻覺數(shù)據會變得更具迷惑性和欺騙性。普通民眾對AI技術了解不足,極易將算法輸出的幻覺數(shù)據誤判為真實可信信息。更嚴峻的是,這些帶算法偏差的虛假信息會被迭代訓練的新一代AI系統(tǒng)重新學習,并通過搜索引擎等渠道指數(shù)級擴散,最終形成“數(shù)據污染—算法吸收—再污染”的惡性循環(huán)。
通用大模型技術的發(fā)展趨勢及應對策略
當前大模型性能的上限天花板在不斷地被抬高,大模型訓練和推理的成本也實現(xiàn)了成倍的降低,預示著大模型的賦能價值和產業(yè)規(guī)模都有了更大的發(fā)展空間。面對上述困難和挑戰(zhàn),我們需時刻保持敬畏之心,緊跟大模型發(fā)展趨勢,盡快實現(xiàn)我國大模型核心技術突破,全方位推動大模型落地。
一是加大并保持對通用大模型底座“主戰(zhàn)場”的持續(xù)投入。我國通用人工智能戰(zhàn)略的實施,可以圍繞以下幾個核心目標展開。其一,確保以中英文為代表的通用底座大模型能力持續(xù)追趕并努力對標國際最高水平;其二,在示范行業(yè)應用的效果和落地價值形成趕超優(yōu)勢;其三,加大多語種大模型的研發(fā)力度,積極在海外布局大模型推廣,為世界提供多樣化的選擇。對此,可以采取以下措施:建立全國性的計算資源共享及調度平臺,統(tǒng)籌調配算力資源,并加快制定算力資源的合理分配、獲取、使用和監(jiān)管政策。支持開展創(chuàng)新算法及核心技術研究,探索大模型高效并行訓練技術,以及邏輯和知識推理、指令學習、人類意圖對齊等調優(yōu)方法。深入研究基于增量預訓練的行業(yè)大模型訓練技術、多源異構行業(yè)知識檢索等關鍵技術,并結合教育、醫(yī)療、金融、司法等應用場景,設計適合特定垂直領域的算法架構。
二是加快構建國產算力平臺上的自主可控大模型及產業(yè)生態(tài)。近期,DeepSeek的推出引發(fā)了國際社會對我國人工智能發(fā)展的高度關注,未來可能會面臨對人工智能芯片、存儲、計算架構等技術要素的更嚴格限制,國產自主可控比以往任何時候都更加迫切。為此,我們要鼓勵基于自主可控國產算力平臺的大模型研發(fā)和應用,加速基于國產算力的大模型算法創(chuàng)新。鼓勵國有企業(yè)尤其是央企優(yōu)先采購基于國產算力平臺研發(fā)的全棧自主可控大模型。加快推進面向教育、醫(yī)療、工業(yè)、科研等領域的國家人工智能行業(yè)應用基地建設,推動國產大模型在各基地落地應用,持續(xù)形成迭代“數(shù)據飛輪”。鼓勵依托自主可控算力底座建立的大模型開發(fā)者生態(tài)發(fā)展和開源社區(qū)建設,通過專項支持加快形成國產大模型生態(tài)體系和工具鏈,加速我國自主可控人工智能產業(yè)生態(tài)發(fā)展。支持全國產化大模型“線上”開放平臺建設,推動國產化大模型能力和工具開放共享,降低中小企業(yè)國產化開發(fā)門檻。
三是構建預防大模型幻覺數(shù)據泛濫的專項治理體系?;糜X數(shù)據不僅影響AI行業(yè)的深度應用,更危及互聯(lián)網和數(shù)字經濟時代的社會安全。為此,應建立針對不同可信度和危害程度的數(shù)據標簽體系,搭建分層分類的數(shù)據信息可信等級認證與溯源體系,為公眾提供安全可靠的信息和知識來源。定期清理幻覺數(shù)據,及時澄清重大事件真相,降低輿情風險和社會危害。推動國家級高質量訓練數(shù)據的開放和共享,為AI模型訓練提供優(yōu)質的數(shù)據集和知識檢索增強信源。重點攻克深度推理模型的長思維鏈幻覺治理難題,確保思考推理過程及結果的可信可溯源,特別是在教育、醫(yī)療、安全等高敏感行業(yè),研發(fā)專業(yè)思維鏈融合和行業(yè)知識數(shù)據增強等技術。同時,組織研發(fā)AIGC幻覺治理與數(shù)據安全防護技術及平臺,突破幻覺自動分析、AIGC深度鑒偽、虛假信息檢測、有害內容識別以及互聯(lián)網傳播溯源等關鍵技術。此外,構建公眾可用的AIGC幻覺信息檢測工具與服務平臺。
四是加快出臺更加客觀、公正、可信的評測方法。目前業(yè)界大模型缺乏有公信力、標準化的科學方法評測體系,構建和制定全面、科學、權威的大模型質量評測體系,規(guī)范評測亂象,對牽引和推動行業(yè)應用更良性發(fā)展具有重要意義。因此,要加快構建涵蓋文本生成、語言理解、知識問答、邏輯推理等多維能力的認知大模型測評體系。聯(lián)合國家級權威機構和行業(yè)龍頭企業(yè)等組織,共同發(fā)布具有公信力的行業(yè)大模型評測標準和應用指南,指導各行業(yè)甄別和選型大模型??茖W認識大模型能力的邊界,以更少的算力、更高的效率打造專屬模型和專屬應用。支持大模型朝通專結合的方向發(fā)展,強化云邊端一體化+軟硬件一體化,用更小的算力作出相對更優(yōu)的效果。
五是堅持源頭核心技術系統(tǒng)性創(chuàng)新,在戰(zhàn)略性、前瞻性的基礎研究領域做好布局。重點布局大模型的寬基礎研究,力求在大模型能力涌現(xiàn)機理、可信訓練推理、強化學習技術、自主學習技術等方面形成突破。加強腦科學與類腦智能、量子計算等領域與人工智能關鍵研究的協(xié)同攻關,形成交叉學科的突破性研究。促進通用人工智能和各科學領域的交叉融合,打造AI for Science的科研新范式,研究基于科學數(shù)據的AI建模和科學知識提取技術,助力科研人員更高效地進行科學研究和探索。在生命科學、化學、制藥、物理、材料等多個科研領域,引入人工智能通識課,培養(yǎng)一批具備專業(yè)科研能力和高水平通用人工智能理解能力的人才,為可能涌現(xiàn)的交叉學科重大突破作儲備。
六是加速通用人工智能技術相關的法律法規(guī)制定與審議。全世界都在呼吁人工智能技術的設計、開發(fā)、應用要以維護人類安全、隱私、利益為初衷,但現(xiàn)行法律法規(guī)在面對人工智能技術引發(fā)的倫理等問題時,往往難以對法律責任進行合理評判。大模型的可信度、可解釋性是未來發(fā)展的重要方向,為此可以從當前人工智能技術應用過程中的人工智能事故責任中劃分出倫理問題、人工智能后臺數(shù)據泄露問題、人工智能技術濫用問題、大數(shù)據平臺的漏洞問題和著作權保護等細分問題,并著手制定相應的法律法規(guī)。鼓勵企業(yè)和研究機構開展數(shù)據隱私保護技術的研發(fā)和應用,提高數(shù)據的安全性和隱私性。鼓勵企業(yè)創(chuàng)新內容安全審核算法,以更優(yōu)的人工智能初步篩查構建高效、準確的審核流程體系。
(作者系語音及語言信息處理國家工程研究中心主任、科大訊飛股份有限公司董事長)
