近年來,大模型技術飛速發(fā)展,極大提升了全球人工智能技術發(fā)展和應用迭代速度,被認為是“邁向通用人工智能的里程碑技術”。面對新一輪大模型引領的人工智能變革,加快推進大模型賦能數(shù)智化應用健康發(fā)展具有重要意義。
作為最成功的一類大模型,大語言模型是一種包含大規(guī)模參數(shù)、使用大量文本數(shù)據(jù)訓練出來的深度學習模型,展現(xiàn)了大模型的能力和基本技術框架。目前,這一技術思路和框架已被用來處理圖像、視頻等多模態(tài)數(shù)據(jù),并被推廣應用于機器人控制與智能決策等場景。各類大模型正處于迅猛發(fā)展之中,眾多高科技企業(yè)紛紛投身大模型建設,圍繞大模型已經(jīng)形成相對成熟的技術框架,但產(chǎn)品和生態(tài)尚在發(fā)展形成之中。總體而言,大模型的技術發(fā)展歷程相比以往任何人工智能技術都更迅猛,其影響力也是史無前例的。
大模型的“大”主要體現(xiàn)在3個方面,即模型參數(shù)規(guī)模大、訓練數(shù)據(jù)規(guī)模大和算力消耗需求大。模型參數(shù)方面,當前主流大模型的參數(shù)規(guī)模通常在千億甚至萬億級別,遠遠大于以往的各類深度學習模型。訓練數(shù)據(jù)方面,大模型在前期訓練階段和后期調(diào)優(yōu)階段都需要海量的數(shù)據(jù)支撐,例如引爆大模型范式的聊天機器人ChatGPT,預訓練數(shù)據(jù)量達到了45TB,其研發(fā)公司還在拉丁美洲等地區(qū)招募了約1000名員工,專門從事與大模型相關的訓練數(shù)據(jù)標注工作。算力需求方面,根據(jù)有關市場調(diào)查機構(gòu)估計,ChatGPT的運行需要上萬片最先進的圖形處理芯片同時工作,耗電量巨大。
大模型已經(jīng)展現(xiàn)出驚人的能力,基于大語言模型的聊天機器人是以人機對話為接口的高效信息獲取、智能處理和內(nèi)容生成工具,能夠?qū)崿F(xiàn)高質(zhì)量的信息整合、翻譯和簡單的問題求解與規(guī)劃。其受到全社會廣泛關注,主要是它已經(jīng)初步具備通用人工智能的部分特性,包括通順的自然語言生成、全領域的知識體系覆蓋、跨任務場景的通用處理模型、通暢的人機交互接口。當然,聊天機器人只是大模型的起點,大模型未來的發(fā)展趨勢也已初見端倪。
第一,大模型有望引領諸多行業(yè)的數(shù)智化創(chuàng)新發(fā)展。大模型的學習模式類似人類大腦,通過學習不同的數(shù)據(jù),能夠形成多樣化的能力,不需要按照任務開發(fā)定制化的算法。通過自然的人機交互,智能化地解決復雜問題和實現(xiàn)輔助決策,推動各行業(yè)體系變革和生態(tài)發(fā)展。例如,未來的信息系統(tǒng)可以由領域用戶通過與大模型的交互直接搭建和維護,“用戶即程序員”,顛覆信息系統(tǒng)研發(fā)和應用范式。
第二,領域?qū)S煤洼p量化大模型是當前技術研究的重點。大模型雖然已經(jīng)展現(xiàn)出諸多優(yōu)勢,但依然存在可靠性差、訓練數(shù)據(jù)依賴、因果推理能力弱、搭建成本高等短板,在部分領域深度應用上的表現(xiàn)弱于專用小模型。為了更充分地發(fā)揮大模型優(yōu)勢,金融、教育、醫(yī)療等領域?qū)S么竽P鸵讶〉昧穗A段性成果,有望促進各項專業(yè)能力的涌現(xiàn)。
第三,大模型有望發(fā)展成為更加通用的人工智能。大模型起步于文本信息處理,現(xiàn)已涵蓋圖片、音視頻等多模態(tài)數(shù)據(jù)。在不久的將來,大模型將超越信息域,結(jié)合硬件設施,發(fā)展成為與物理和人類世界互動的具象智能,逐步縮小與真正的“通用人工智能”的差距。
雖然大模型展現(xiàn)的能力已經(jīng)讓全社會看到了通用人工智能的曙光,但當前大模型也有一定的局限性。一方面,由于大模型自身結(jié)構(gòu)和機制漏洞,有被惡意攻擊的風險;另一方面,大模型自身的知識表達和學習模式還存在缺陷,導致其回答中經(jīng)常出現(xiàn)“幻覺”,如常識性錯誤、杜撰內(nèi)容等。
推進大模型賦能數(shù)智化應用健康發(fā)展,應堅持規(guī)劃引領、需求帶動、應用導向、安全為基,引導、扶持和監(jiān)督大模型在更廣泛的領域應用中長計遠慮、扎實落地、穩(wěn)步推進。
首先,掌握技術主動權,加快自主可控的國產(chǎn)大模型全鏈條建設。依托我國現(xiàn)有的人工智能人才基礎,構(gòu)建面向大模型與通用人工智能技術的平臺和隊伍。加大芯片、大數(shù)據(jù)、人工智能等產(chǎn)業(yè)的投入與整合力度,保障“海量數(shù)據(jù)”“頂尖人才”“算力支撐”的落地,推進我國全階段自主可控大模型建設,掌握大模型技術發(fā)展的主動權和話語權。大力支持國產(chǎn)大模型的下游技術攻關和產(chǎn)品推廣,促進國產(chǎn)大模型產(chǎn)品的應用落地和迭代升級。
其次,深化大模型應用生態(tài)建設,構(gòu)建“通用大模型+專用小模型”的成熟應用生態(tài)。早在大模型產(chǎn)生之前,基于領域經(jīng)驗歸納和業(yè)務知識構(gòu)建的“小模型”已經(jīng)廣泛應用于各行業(yè)。應充分認識并應用好大模型和傳統(tǒng)小模型各自的特性,在推廣大模型產(chǎn)品的同時進一步推進小模型技術的升級和應用,發(fā)揮好小模型輕量級、高效率、善于解決特定問題的優(yōu)勢,逐步推進大小模型融合的應用生態(tài)。
最后,建立健全大模型安全審查制度與法律體系,從源頭規(guī)避大模型發(fā)展風險。推動建立行之有效的數(shù)據(jù)審查機制和接入許可規(guī)范,從源頭把控大模型內(nèi)容安全性,并主動參與全球人工智能模型使用規(guī)范的標準制定。同時,對于大模型可能產(chǎn)生的風險進行合理評估與審核,如歧視、仇恨言論、私人信息泄露、虛假信息、協(xié)助犯罪等。