【摘要】歷經(jīng)數(shù)據(jù)互聯(lián)網(wǎng)、信息互聯(lián)網(wǎng),互聯(lián)網(wǎng)發(fā)展當(dāng)前進(jìn)入了價(jià)值互聯(lián)網(wǎng)階段。在數(shù)據(jù)與應(yīng)用解耦的趨勢(shì)背景下,互聯(lián)網(wǎng)基礎(chǔ)技術(shù)亟需從支撐網(wǎng)間互聯(lián)、網(wǎng)站互聯(lián)到支撐數(shù)島互聯(lián),數(shù)據(jù)互操作技術(shù)是支撐數(shù)島互聯(lián)的基礎(chǔ)性技術(shù)。數(shù)據(jù)互操作解決數(shù)據(jù)的標(biāo)識(shí)確權(quán)、認(rèn)證授權(quán)、安全交換三大核心問(wèn)題,在技術(shù)實(shí)現(xiàn)上基于現(xiàn)有的DNS(域名系統(tǒng))向DIS(數(shù)據(jù)互操作系統(tǒng))演進(jìn),并形成DIP/RDF(數(shù)據(jù)互操作協(xié)議/資源描述框架)協(xié)議規(guī)范,支持?jǐn)?shù)據(jù)應(yīng)用模式從“數(shù)據(jù)中臺(tái)”向“數(shù)據(jù)中樞”轉(zhuǎn)變。隨著經(jīng)濟(jì)社會(huì)發(fā)展對(duì)高質(zhì)量數(shù)據(jù)的需求進(jìn)一步提升,數(shù)據(jù)基礎(chǔ)設(shè)施將從網(wǎng)絡(luò)基礎(chǔ)設(shè)施中分離,數(shù)據(jù)互操作技術(shù)將成為數(shù)據(jù)基礎(chǔ)設(shè)施的重要組成部分。數(shù)據(jù)基礎(chǔ)設(shè)施的市場(chǎng)化運(yùn)作將帶動(dòng)數(shù)據(jù)基礎(chǔ)設(shè)施產(chǎn)業(yè)的發(fā)展,并支撐數(shù)字技術(shù)、數(shù)字產(chǎn)業(yè)等上層應(yīng)用蓬勃發(fā)展。
【關(guān)鍵詞】互聯(lián)網(wǎng)基礎(chǔ)技術(shù) 數(shù)據(jù)互操作 數(shù)據(jù)基礎(chǔ)設(shè)施 數(shù)字經(jīng)濟(jì)
【中圖分類(lèi)號(hào)】TP39 【文獻(xiàn)標(biāo)識(shí)碼】A
當(dāng)前,全球互聯(lián)網(wǎng)發(fā)展迎來(lái)戰(zhàn)略機(jī)遇疊加的特殊窗口期,以價(jià)值互聯(lián)網(wǎng)支撐知識(shí)交換為特征的第四次工業(yè)革命驅(qū)動(dòng)全球數(shù)字經(jīng)濟(jì)發(fā)展進(jìn)入新階段。黨的二十大報(bào)告提出加快建設(shè)“網(wǎng)絡(luò)強(qiáng)國(guó)、數(shù)字中國(guó)”,《中共中央 國(guó)務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見(jiàn)》(簡(jiǎn)稱(chēng)“數(shù)據(jù)二十條”)、《數(shù)字中國(guó)建設(shè)整體布局規(guī)劃》等頂層戰(zhàn)略文件出臺(tái),配合組建國(guó)家數(shù)據(jù)局等行政機(jī)構(gòu)體制改革,旨在破除數(shù)字經(jīng)濟(jì)發(fā)展的制度障礙。數(shù)字經(jīng)濟(jì)發(fā)展對(duì)其互聯(lián)網(wǎng)底座提出了更高要求,互聯(lián)網(wǎng)發(fā)展新階段基礎(chǔ)技術(shù)攻關(guān)的核心,應(yīng)圍繞支撐數(shù)字經(jīng)濟(jì)發(fā)展所需的更高知識(shí)密度和更小治理粒度的可信數(shù)據(jù)展開(kāi)。
互聯(lián)網(wǎng)發(fā)展進(jìn)入價(jià)值互聯(lián)網(wǎng)階段
互聯(lián)網(wǎng)誕生于信息化進(jìn)程的數(shù)字化階段,發(fā)展于網(wǎng)絡(luò)化階段,爆發(fā)于智能化階段。隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大和數(shù)據(jù)的累積,其核心需求從早期的數(shù)據(jù)交換、信息共享逐步演變?yōu)橹谓?jīng)濟(jì)社會(huì)發(fā)展的知識(shí)構(gòu)建,推動(dòng)互聯(lián)網(wǎng)從數(shù)據(jù)互聯(lián)網(wǎng)、信息互聯(lián)網(wǎng)發(fā)展至價(jià)值互聯(lián)網(wǎng)階段。
數(shù)據(jù)互聯(lián)網(wǎng)階段(1974—1994年),核心需求是數(shù)據(jù)交換,關(guān)鍵問(wèn)題是如何在不可靠的異構(gòu)網(wǎng)絡(luò)上實(shí)現(xiàn)可靠的數(shù)據(jù)傳輸。早期的阿帕網(wǎng)中,主機(jī)之間的連接和通信前提是同構(gòu)網(wǎng)絡(luò),但隨著網(wǎng)絡(luò)數(shù)據(jù)傳輸需求的逐漸擴(kuò)大和復(fù)雜化,出現(xiàn)了難以定位目標(biāo)主機(jī)、傳輸錯(cuò)誤率高、網(wǎng)絡(luò)運(yùn)行效率低等問(wèn)題。因此,該階段需要解決的關(guān)鍵問(wèn)題是,如何規(guī)范數(shù)據(jù)包格式、統(tǒng)一通信協(xié)議的規(guī)范,實(shí)現(xiàn)主機(jī)互聯(lián),滿足全球范圍內(nèi)、異構(gòu)網(wǎng)絡(luò)間的可靠數(shù)據(jù)傳輸?shù)钠惹行枨蟆?974年,羅伯特·卡恩和溫頓·瑟夫提出的傳輸控制技術(shù)(TCP/IP協(xié)議前身)實(shí)現(xiàn)了數(shù)據(jù)包的封裝,以及在不可靠的網(wǎng)絡(luò)中將數(shù)據(jù)包從一臺(tái)設(shè)備可靠地傳輸?shù)搅硪慌_(tái)設(shè)備,有效地減少了網(wǎng)絡(luò)連接和傳輸過(guò)程中的錯(cuò)誤,提升了網(wǎng)絡(luò)運(yùn)行效率。此階段,電子郵件、文件傳輸服務(wù)是典型應(yīng)用,主機(jī)、路由器、電纜等通信物理設(shè)施是關(guān)鍵數(shù)字基礎(chǔ)設(shè)施。
信息互聯(lián)網(wǎng)階段(1994—2014年),核心需求是信息共享,關(guān)鍵問(wèn)題是如何在非結(jié)構(gòu)化的網(wǎng)絡(luò)上結(jié)構(gòu)化描述數(shù)據(jù)以形成信息。隨著互聯(lián)網(wǎng)接入規(guī)模的擴(kuò)大,人們利用互聯(lián)網(wǎng)完成信息交互的需求逐漸凸顯。然而,由于缺乏信息獲取入口和信息共享途徑,多方之間高效的信息交互難以實(shí)現(xiàn)。因此,探索新的協(xié)議和規(guī)范,促進(jìn)互聯(lián)網(wǎng)中廣泛的信息共享,成為互聯(lián)網(wǎng)的新發(fā)展方向。HTTP/HTML(超文本傳輸協(xié)議/超文本標(biāo)記語(yǔ)言)是解決信息交互問(wèn)題的關(guān)鍵技術(shù)和標(biāo)準(zhǔn),由蒂姆·伯納斯·李提出,并于1994年成立萬(wàn)維網(wǎng)聯(lián)盟來(lái)進(jìn)行標(biāo)準(zhǔn)化和推廣應(yīng)用。信息用HTML進(jìn)行結(jié)構(gòu)化表述,遵循HTTP協(xié)議規(guī)范傳輸,實(shí)現(xiàn)了以結(jié)構(gòu)化的信息描述方式來(lái)表述非結(jié)構(gòu)化的網(wǎng)絡(luò)數(shù)據(jù),使得可獨(dú)立于互聯(lián)網(wǎng)主機(jī)之間的差異,在不同的硬件和操作系統(tǒng)上以相似的形式顯示信息,促進(jìn)了互聯(lián)網(wǎng)中的跨域信息共享。隨著網(wǎng)站數(shù)量的大規(guī)模增加,主要實(shí)現(xiàn)網(wǎng)站名稱(chēng)和主機(jī)地址映射的域名系統(tǒng)(Domain Name System,DNS)的重要性逐漸增強(qiáng)。域名系統(tǒng)通過(guò)對(duì)網(wǎng)站地址采用有語(yǔ)義的名字標(biāo)識(shí)命名,實(shí)現(xiàn)了對(duì)網(wǎng)站的快速尋址,進(jìn)一步推動(dòng)了互聯(lián)網(wǎng)中的信息共享。此階段,門(mén)戶網(wǎng)站、電子商務(wù)、社交媒體等是典型應(yīng)用,域名系統(tǒng)是關(guān)鍵數(shù)字基礎(chǔ)設(shè)施。
價(jià)值互聯(lián)網(wǎng)階段(2014年至今),核心需求是知識(shí)構(gòu)建,關(guān)鍵問(wèn)題是如何在不可信的網(wǎng)絡(luò)上交換可信數(shù)據(jù)以形成知識(shí)。數(shù)字經(jīng)濟(jì)以數(shù)字化的數(shù)據(jù)作為關(guān)鍵生產(chǎn)要素,用以產(chǎn)生信息、知識(shí)和創(chuàng)造價(jià)值。然而,不可信網(wǎng)絡(luò)中的數(shù)據(jù)交換存在以下問(wèn)題:一是數(shù)據(jù)安全無(wú)法保障,數(shù)據(jù)侵權(quán)、數(shù)據(jù)泄露等現(xiàn)象頻發(fā),引發(fā)相關(guān)個(gè)體、企業(yè)對(duì)數(shù)據(jù)安全的擔(dān)憂,導(dǎo)致數(shù)據(jù)的過(guò)度保護(hù),阻礙數(shù)據(jù)的流通;二是數(shù)據(jù)真實(shí)性難以保證,偽造數(shù)據(jù)、劣質(zhì)數(shù)據(jù)層出不窮,數(shù)據(jù)使用者難以依托互聯(lián)網(wǎng)數(shù)據(jù)構(gòu)建有價(jià)值的知識(shí)成果,導(dǎo)致無(wú)效的數(shù)據(jù)挖掘,阻礙數(shù)據(jù)應(yīng)用的發(fā)展;三是數(shù)據(jù)價(jià)值分配缺乏合理性,互聯(lián)網(wǎng)平臺(tái)利用優(yōu)質(zhì)創(chuàng)作內(nèi)容吸引非創(chuàng)作用戶流量、實(shí)現(xiàn)快速變現(xiàn),但用戶無(wú)法通過(guò)自身產(chǎn)生的內(nèi)容數(shù)據(jù)獲得合法收益,導(dǎo)致用戶的消極情緒,阻礙數(shù)據(jù)的持續(xù)產(chǎn)出。因此,探索新的規(guī)范和協(xié)議,保障數(shù)據(jù)安全、真實(shí)并實(shí)現(xiàn)數(shù)據(jù)價(jià)值的合理分配,達(dá)成數(shù)據(jù)的可信交換,是價(jià)值互聯(lián)網(wǎng)階段的主要任務(wù)。區(qū)塊鏈技術(shù)是滿足可信數(shù)據(jù)交換的關(guān)鍵技術(shù)之一,也是融合加密技術(shù)、共識(shí)機(jī)制及圖靈完備的智能合約語(yǔ)言的可信計(jì)算平臺(tái),將通過(guò)維護(hù)不可篡改的分布式賬本,支撐價(jià)值互聯(lián)網(wǎng)中可信化要求的新的基礎(chǔ)設(shè)施構(gòu)建。同時(shí),為解決上述數(shù)據(jù)安全、可信及價(jià)值分配等問(wèn)題,區(qū)塊鏈技術(shù)還需完善并融合承載數(shù)據(jù)治理規(guī)則和數(shù)據(jù)要素利用的數(shù)據(jù)互操作技術(shù),在彌合網(wǎng)絡(luò)碎片和連通數(shù)據(jù)孤島的基礎(chǔ)上,保障數(shù)據(jù)全生命周期的可信、可用、可管、可控。
價(jià)值互聯(lián)網(wǎng)需要數(shù)據(jù)互操作技術(shù)
數(shù)據(jù)價(jià)值的凸顯和數(shù)據(jù)安全的加強(qiáng)迫使數(shù)據(jù)與應(yīng)用解耦,逐漸成為可控可信的數(shù)據(jù)自治空間,形成眾多的數(shù)據(jù)孤島(簡(jiǎn)稱(chēng)數(shù)島)。因此,實(shí)現(xiàn)數(shù)島互聯(lián)以完成數(shù)據(jù)互操作,成為價(jià)值互聯(lián)網(wǎng)階段的重要課題。互聯(lián)網(wǎng)發(fā)展至今,顛覆性的技術(shù)創(chuàng)新難以打敗兼容性的技術(shù)演進(jìn),數(shù)據(jù)互操作的技術(shù)實(shí)現(xiàn)必須以現(xiàn)有互聯(lián)網(wǎng)基礎(chǔ)技術(shù)為依托,逐步形成新的互聯(lián)網(wǎng)協(xié)議標(biāo)準(zhǔn)。
第一,互聯(lián)網(wǎng)發(fā)展新階段數(shù)據(jù)互操作至關(guān)重要?;ヂ?lián)網(wǎng)發(fā)展新階段,數(shù)據(jù)與應(yīng)用解耦成為關(guān)鍵特征。信息化進(jìn)程從數(shù)字化、網(wǎng)絡(luò)化發(fā)展到智能化階段,數(shù)據(jù)與應(yīng)用的關(guān)系隨之發(fā)生變化。在數(shù)字化階段,由于互聯(lián)網(wǎng)技術(shù)還沒(méi)有普及,數(shù)據(jù)和應(yīng)用在用戶本地,用戶對(duì)數(shù)據(jù)具有完全的控制權(quán)。隨著數(shù)據(jù)產(chǎn)生速率的持續(xù)提升和應(yīng)用模式的不斷創(chuàng)新,數(shù)據(jù)交換成為基本需求,直接推動(dòng)了互聯(lián)網(wǎng)的誕生。同時(shí),數(shù)字化數(shù)據(jù)的傳輸容量和傳輸速度需求進(jìn)一步推動(dòng)了網(wǎng)絡(luò)技術(shù)的發(fā)展。在網(wǎng)絡(luò)化階段,互聯(lián)網(wǎng)服務(wù)的發(fā)展催生了數(shù)據(jù)和應(yīng)用均在網(wǎng)絡(luò)云端的新模式?;ヂ?lián)網(wǎng)服務(wù)為人們生活帶來(lái)極大便利,但也導(dǎo)致了用戶數(shù)據(jù)完全由云服務(wù)提供者掌握,用戶逐漸失去了數(shù)據(jù)的控制權(quán)。互聯(lián)網(wǎng)平臺(tái)作為數(shù)據(jù)的實(shí)際控制者和數(shù)據(jù)價(jià)值的直接受益者,承擔(dān)起數(shù)據(jù)安全、可信、可控的全部責(zé)任。然而,互聯(lián)網(wǎng)平臺(tái)僅是數(shù)據(jù)全生命周期的一個(gè)參與者,目前數(shù)據(jù)收益分配機(jī)制不利于數(shù)據(jù)產(chǎn)業(yè)生態(tài)的健康可持續(xù)發(fā)展。在智能化階段,數(shù)據(jù)和應(yīng)用解耦成為必然趨勢(shì)。在《數(shù)據(jù)安全法》和《個(gè)人信息保護(hù)法》等相關(guān)法律法規(guī)相繼出臺(tái)促使數(shù)據(jù)合規(guī)及治理要求越來(lái)越高的同時(shí),終端計(jì)算能力也隨著數(shù)字技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展逐步提升,隱私數(shù)據(jù)和重要數(shù)據(jù)以相關(guān)方可選擇的方式存儲(chǔ)于安全、可信、可控的數(shù)據(jù)自治空間中,應(yīng)用服務(wù)提供方在經(jīng)過(guò)相關(guān)方許可的前提下,“按需使用”獲取數(shù)據(jù),以進(jìn)一步提供服務(wù)。同時(shí),建立數(shù)據(jù)價(jià)值分配機(jī)制,也可以使用戶依靠生產(chǎn)數(shù)據(jù)獲取持續(xù)收益。
數(shù)據(jù)與應(yīng)用解耦促使互聯(lián)網(wǎng)應(yīng)用和數(shù)據(jù)之間交叉訪問(wèn)需求增加,使得數(shù)據(jù)互操作成為互聯(lián)網(wǎng)發(fā)展新階段的重要關(guān)切?;ゲ僮魇侵覆煌?jì)算機(jī)系統(tǒng)、網(wǎng)絡(luò)、操作系統(tǒng)和應(yīng)用程序一起工作并共享信息的過(guò)程,存在于互聯(lián)網(wǎng)誕生之初,并伴隨著互聯(lián)網(wǎng)發(fā)展而演進(jìn)。數(shù)據(jù)互聯(lián)網(wǎng)階段,互操作技術(shù)專(zhuān)注于實(shí)現(xiàn)主機(jī)間的通信,完成異構(gòu)網(wǎng)絡(luò)間的數(shù)據(jù)交換;信息互聯(lián)網(wǎng)階段,互操作技術(shù)專(zhuān)注于實(shí)現(xiàn)網(wǎng)站間的統(tǒng)一規(guī)范,完成不同網(wǎng)站間的信息共享;價(jià)值互聯(lián)網(wǎng)階段,數(shù)據(jù)與應(yīng)用解耦將推動(dòng)互聯(lián)網(wǎng)應(yīng)用和數(shù)據(jù)之間交叉訪問(wèn),應(yīng)用與數(shù)據(jù)的一對(duì)一關(guān)系將演變?yōu)槎鄬?duì)多關(guān)系,從而大幅提升互操作的復(fù)雜度,解決數(shù)島間的數(shù)據(jù)互操作成為關(guān)鍵。
互聯(lián)網(wǎng)數(shù)據(jù)互操作是用于解決數(shù)據(jù)跨域互聯(lián)互通和交換共享的互聯(lián)網(wǎng)基礎(chǔ)技術(shù),秉持“數(shù)據(jù)不離域,可用不可見(jiàn)”的基本原則,驅(qū)動(dòng)數(shù)據(jù)應(yīng)用從“數(shù)據(jù)中臺(tái)”到“數(shù)據(jù)中樞”模式的轉(zhuǎn)變。一方面,由TCP/IP、HTTP/HTML、DNS等協(xié)議構(gòu)成的傳統(tǒng)互聯(lián)網(wǎng)基礎(chǔ)技術(shù),作為連接互聯(lián)網(wǎng)物理基礎(chǔ)設(shè)施、支撐互聯(lián)網(wǎng)多樣化應(yīng)用的關(guān)鍵技術(shù),因未考慮數(shù)據(jù)權(quán)屬和保護(hù)問(wèn)題,造成數(shù)據(jù)訪問(wèn)受控于網(wǎng)站,難以滿足數(shù)據(jù)與應(yīng)用解耦模式下可信數(shù)據(jù)交換的要求,制約了數(shù)據(jù)要素的流動(dòng)和價(jià)值釋放;另一方面,傳統(tǒng)以“數(shù)據(jù)中臺(tái)”為基本模式的跨域數(shù)據(jù)交換,因存在一個(gè)收集原始數(shù)據(jù)的集中平臺(tái),導(dǎo)致數(shù)據(jù)需從本地可控存儲(chǔ)流向集中的不可控第三方平臺(tái),同樣造成數(shù)據(jù)安全可信保障的困難。因此,數(shù)據(jù)互操作技術(shù)需從保護(hù)數(shù)據(jù)安全及權(quán)屬的角度出發(fā),基于已有的互聯(lián)網(wǎng)基礎(chǔ)技術(shù),構(gòu)建應(yīng)用與數(shù)據(jù)之間的“橋梁”;避免數(shù)據(jù)的離域,用“數(shù)據(jù)中樞”的新型模式替換“數(shù)據(jù)中臺(tái)”的傳統(tǒng)模式,用跨域數(shù)據(jù)索引與確權(quán)替代傳統(tǒng)數(shù)據(jù)中心存儲(chǔ)數(shù)據(jù)的方式,在歸還數(shù)據(jù)管理與授權(quán)的基礎(chǔ)上,實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)數(shù)據(jù)資源的定位,在保障數(shù)據(jù)權(quán)屬的前提下安全交換數(shù)據(jù),為數(shù)據(jù)與應(yīng)用解耦后的數(shù)據(jù)高效利用夯實(shí)基礎(chǔ)。
第二,數(shù)據(jù)互操作技術(shù)支持?jǐn)?shù)據(jù)跨域互聯(lián)互通。數(shù)據(jù)互操作技術(shù)需貫穿數(shù)據(jù)采集、傳輸、存儲(chǔ)、計(jì)算、應(yīng)用、消亡的數(shù)據(jù)全生命周期,支持發(fā)現(xiàn)和定位數(shù)據(jù)資源,并在保障數(shù)據(jù)權(quán)屬和促進(jìn)數(shù)據(jù)可信的前提下實(shí)現(xiàn)數(shù)據(jù)資源安全交換。數(shù)據(jù)互操作需解決標(biāo)識(shí)確權(quán)、認(rèn)證授權(quán)和安全交換三大關(guān)鍵問(wèn)題,并支撐數(shù)據(jù)標(biāo)識(shí)體系、數(shù)據(jù)確權(quán)體系、身份認(rèn)證體系、訪問(wèn)授權(quán)體系、分級(jí)分類(lèi)體系、算法管理體系構(gòu)建。其中,統(tǒng)一標(biāo)準(zhǔn)的標(biāo)識(shí)體系為數(shù)據(jù)建立全球唯一標(biāo)識(shí)索引,形成共享和交換數(shù)據(jù)信息的紐帶,使得產(chǎn)生的數(shù)據(jù)能被發(fā)現(xiàn)、需要的數(shù)據(jù)能被找到;統(tǒng)一標(biāo)準(zhǔn)的確權(quán)體系,明確數(shù)據(jù)權(quán)屬,保障數(shù)據(jù)持有者、加工者、經(jīng)營(yíng)者等各方的合法權(quán)益;統(tǒng)一標(biāo)準(zhǔn)的認(rèn)證體系,確保身份的唯一性和不可偽造性,為數(shù)據(jù)的跨域使用提供分布式身份認(rèn)證能力,打破因無(wú)法認(rèn)證操作者而拒絕數(shù)據(jù)跨域使用的現(xiàn)狀;統(tǒng)一標(biāo)識(shí)的授權(quán)體系,僅允許經(jīng)授權(quán)后的數(shù)據(jù)訪問(wèn),以保障數(shù)據(jù)可控,保證數(shù)據(jù)互操作流程的安全性和合法性,減輕個(gè)人、企業(yè)等對(duì)數(shù)據(jù)侵權(quán)進(jìn)一步引發(fā)的數(shù)據(jù)泄露等問(wèn)題的擔(dān)憂;統(tǒng)一標(biāo)準(zhǔn)的分類(lèi)分級(jí)體系,以依據(jù)核心數(shù)據(jù)、重要數(shù)據(jù)、一般數(shù)據(jù)構(gòu)成的分級(jí)框架和公共個(gè)人維度、公共管理維度、信息傳播維度、行業(yè)領(lǐng)域維度的分類(lèi)規(guī)則,形成具體可操作、可執(zhí)行的數(shù)據(jù)分類(lèi)分級(jí)標(biāo)準(zhǔn),保障數(shù)據(jù)跨域互操作過(guò)程的合規(guī)性;統(tǒng)一標(biāo)準(zhǔn)的算法管理體系,對(duì)可信算法統(tǒng)一管理和認(rèn)證,以結(jié)合現(xiàn)有的隱私保護(hù)技術(shù),在不離域的前提下實(shí)現(xiàn)科學(xué)數(shù)據(jù)的價(jià)值釋放。
數(shù)據(jù)互操作技術(shù)的“互操作”需要做到與現(xiàn)有技術(shù)向后兼容的數(shù)據(jù)互聯(lián)互通。因此,以標(biāo)識(shí)為基礎(chǔ),發(fā)揮已有互聯(lián)網(wǎng)基礎(chǔ)技術(shù)的能力和優(yōu)勢(shì)進(jìn)一步推動(dòng)技術(shù)演進(jìn),是數(shù)據(jù)互操作技術(shù)的主要實(shí)現(xiàn)思路。從最初以地址標(biāo)識(shí)為基礎(chǔ)的路由系統(tǒng),到以名字標(biāo)識(shí)為基礎(chǔ)的域名系統(tǒng),支撐數(shù)據(jù)交換、信息共享的歷史要求雖已完成,但已難以適應(yīng)當(dāng)前知識(shí)構(gòu)建和價(jià)值交換的要求,因而一種以泛在標(biāo)識(shí)為基礎(chǔ)的數(shù)據(jù)標(biāo)識(shí)系統(tǒng)的產(chǎn)生成為必然。當(dāng)前,域名及域名系統(tǒng)是互聯(lián)網(wǎng)關(guān)鍵資源的核心連接點(diǎn),它基于對(duì)IP地址等資源的關(guān)聯(lián)和映射,不僅將全球的網(wǎng)站連接在一起,更是成為全球互聯(lián)網(wǎng)的中樞神經(jīng)系統(tǒng)。實(shí)現(xiàn)全球的數(shù)據(jù)連接,構(gòu)建數(shù)字經(jīng)濟(jì)的中樞神經(jīng)系統(tǒng),要實(shí)現(xiàn)從DNS(域名系統(tǒng))到DIS(數(shù)據(jù)互操作系統(tǒng))的演進(jìn)。需要強(qiáng)調(diào)的是,數(shù)據(jù)互操作技術(shù)要實(shí)現(xiàn)向后兼容,以符合互聯(lián)網(wǎng)統(tǒng)一標(biāo)準(zhǔn)的方式發(fā)現(xiàn)和定位數(shù)據(jù)資源,并在保障數(shù)據(jù)權(quán)屬和促進(jìn)數(shù)據(jù)可信的前提下實(shí)現(xiàn)數(shù)據(jù)資源的安全交換,而不是自建體系。這既是互聯(lián)網(wǎng)基礎(chǔ)技術(shù)創(chuàng)新的趨勢(shì),也是數(shù)據(jù)治理落地實(shí)施的保障,更是數(shù)字經(jīng)濟(jì)發(fā)展對(duì)數(shù)據(jù)基礎(chǔ)設(shè)施的要求。
數(shù)據(jù)互操作技術(shù)的“互操作”還需達(dá)成國(guó)際數(shù)據(jù)孤島間的互操作,推動(dòng)DIP/RDF(數(shù)據(jù)互操作協(xié)議/資源描述框架)國(guó)際統(tǒng)一標(biāo)準(zhǔn)的形成,實(shí)現(xiàn)全球范圍的數(shù)據(jù)互聯(lián)互通。在不同互聯(lián)網(wǎng)發(fā)展階段,互聯(lián)網(wǎng)基礎(chǔ)技術(shù)始終由資源描述規(guī)范及配套的傳輸協(xié)議構(gòu)成。在價(jià)值互聯(lián)網(wǎng)階段,一種用于描述數(shù)據(jù)資源及可信數(shù)據(jù)資源傳輸?shù)膮f(xié)議,對(duì)于實(shí)現(xiàn)數(shù)島互聯(lián)至關(guān)重要。RDF是一種描述數(shù)據(jù)資源元數(shù)據(jù)的規(guī)范模型,以<資源,屬性,陳述>三元組為基本元素,用于描述數(shù)據(jù)資源的基本特性及關(guān)系,該技術(shù)是實(shí)現(xiàn)數(shù)據(jù)資源重用和數(shù)據(jù)交換的關(guān)鍵,更是互聯(lián)網(wǎng)數(shù)據(jù)機(jī)器可讀、進(jìn)一步實(shí)現(xiàn)大規(guī)模數(shù)據(jù)應(yīng)用的基礎(chǔ)。數(shù)據(jù)互操作技術(shù)將以RDF作為數(shù)據(jù)資源描述的基本規(guī)范,推動(dòng)跨域數(shù)據(jù)互聯(lián)互通的數(shù)據(jù)資源傳輸協(xié)議——數(shù)據(jù)互操作協(xié)議DIP的標(biāo)準(zhǔn)化工作,在國(guó)際社區(qū)形成數(shù)據(jù)互操作共識(shí),進(jìn)一步促進(jìn)數(shù)據(jù)價(jià)值流通,擴(kuò)大數(shù)據(jù)應(yīng)用范圍。
數(shù)據(jù)互操作技術(shù)釋放數(shù)據(jù)要素價(jià)值
數(shù)據(jù)互操作技術(shù)有助于保障數(shù)據(jù)內(nèi)容可信、數(shù)據(jù)交易安全、收益分配公平,在未來(lái),數(shù)據(jù)互操作技術(shù)將成為數(shù)據(jù)基礎(chǔ)設(shè)施的核心技術(shù),而數(shù)據(jù)基礎(chǔ)設(shè)施的形成和發(fā)展,有助于推動(dòng)在高質(zhì)量數(shù)據(jù)互聯(lián)互通基礎(chǔ)上的應(yīng)用生態(tài)蓬勃發(fā)展。
第一,數(shù)據(jù)互操作技術(shù)支撐數(shù)據(jù)基礎(chǔ)設(shè)施構(gòu)建。2023年2月,中共中央、國(guó)務(wù)院印發(fā)《數(shù)字中國(guó)建設(shè)整體布局規(guī)劃》(以下簡(jiǎn)稱(chēng)《規(guī)劃》)明確,數(shù)字中國(guó)建設(shè)要“夯實(shí)數(shù)字基礎(chǔ)設(shè)施和數(shù)據(jù)資源體系‘兩大基礎(chǔ)’”,并將數(shù)字基礎(chǔ)設(shè)施劃分為網(wǎng)絡(luò)基礎(chǔ)設(shè)施、算力基礎(chǔ)設(shè)施和應(yīng)用基礎(chǔ)設(shè)施三類(lèi)。支撐數(shù)據(jù)資源體系的數(shù)據(jù)基礎(chǔ)設(shè)施某種意義上屬于網(wǎng)絡(luò)基礎(chǔ)設(shè)施的范疇,并連接算力基礎(chǔ)設(shè)施和支撐應(yīng)用基礎(chǔ)設(shè)施。推動(dòng)數(shù)字經(jīng)濟(jì)高質(zhì)量可持續(xù)發(fā)展是數(shù)字基礎(chǔ)設(shè)施建設(shè)的最終目的,數(shù)據(jù)要素是數(shù)字經(jīng)濟(jì)發(fā)展的最活躍增長(zhǎng)要素,數(shù)字基礎(chǔ)設(shè)施應(yīng)支撐數(shù)據(jù)全生命周期的高效流通。以暢通數(shù)據(jù)資源大循環(huán)為價(jià)值導(dǎo)向,必然促使數(shù)據(jù)基礎(chǔ)設(shè)施從網(wǎng)絡(luò)基礎(chǔ)設(shè)施中分離出來(lái)。網(wǎng)絡(luò)基礎(chǔ)設(shè)施主要完成數(shù)據(jù)的采集和傳輸,算力基礎(chǔ)設(shè)施主要完成數(shù)據(jù)的存儲(chǔ)和計(jì)算,應(yīng)用基礎(chǔ)設(shè)施主要完成數(shù)據(jù)的分析和應(yīng)用,數(shù)據(jù)基礎(chǔ)設(shè)施則貫穿和連接網(wǎng)絡(luò)基礎(chǔ)設(shè)施、算力基礎(chǔ)設(shè)施和應(yīng)用基礎(chǔ)設(shè)施,打通數(shù)據(jù)資源體系,促進(jìn)數(shù)據(jù)循環(huán)暢通,從而釋放數(shù)據(jù)要素價(jià)值。
類(lèi)比于工業(yè)經(jīng)濟(jì)時(shí)代圍繞資本流通建立的監(jiān)管體系,數(shù)據(jù)基礎(chǔ)設(shè)施幫助實(shí)現(xiàn)對(duì)數(shù)據(jù)要素的統(tǒng)籌管理與宏觀調(diào)配。一方面,數(shù)據(jù)基礎(chǔ)設(shè)施對(duì)內(nèi)保障數(shù)據(jù)本身的安全可靠,對(duì)外促進(jìn)數(shù)據(jù)全生命周期各環(huán)節(jié)之間的聯(lián)動(dòng)配合;另一方面,數(shù)據(jù)治理與安全保障能促使更多的高價(jià)值數(shù)據(jù)從封閉的系統(tǒng)平臺(tái)中釋放出來(lái),并保障數(shù)據(jù)全生命周期的安全有序流通。
數(shù)據(jù)互操作技術(shù)是數(shù)據(jù)基礎(chǔ)設(shè)施構(gòu)建的核心技術(shù)。在本質(zhì)上,數(shù)據(jù)互操作技術(shù)是一套實(shí)現(xiàn)數(shù)據(jù)交換的機(jī)制設(shè)計(jì),包含標(biāo)識(shí)確權(quán)、認(rèn)證授權(quán)、安全交換三個(gè)核心步驟,其中標(biāo)識(shí)確權(quán)和認(rèn)證授權(quán)對(duì)應(yīng)了數(shù)據(jù)交換確權(quán)和行權(quán)的過(guò)程,明確了數(shù)據(jù)提供方的權(quán)利和義務(wù),即負(fù)有保證數(shù)據(jù)內(nèi)容真實(shí)可靠、安全合規(guī)的義務(wù),同時(shí)也享有根據(jù)數(shù)據(jù)的實(shí)際價(jià)值、需求程度、數(shù)據(jù)質(zhì)量獲得收益分配的權(quán)利;而安全交換則對(duì)應(yīng)于數(shù)據(jù)交換過(guò)程的安全性。此外,數(shù)據(jù)互操作系統(tǒng)承載了基于此系統(tǒng)實(shí)現(xiàn)的每一筆數(shù)據(jù)交換的真實(shí)記錄。就技術(shù)定位而言,數(shù)據(jù)互操作實(shí)現(xiàn)了對(duì)從采集傳輸?shù)綉?yīng)用消亡的數(shù)據(jù)全生命周期的監(jiān)管。數(shù)據(jù)互操作是數(shù)據(jù)基礎(chǔ)設(shè)施的底層技術(shù)架構(gòu),數(shù)據(jù)基礎(chǔ)設(shè)施應(yīng)包含的其他功能,如數(shù)據(jù)內(nèi)容審核、任務(wù)資源分配等,都能夠基于這一底層機(jī)制和技術(shù)架構(gòu)向上構(gòu)建。在未來(lái),數(shù)據(jù)基礎(chǔ)設(shè)施的內(nèi)涵與功能將隨著現(xiàn)實(shí)數(shù)據(jù)需求與數(shù)據(jù)治理實(shí)踐的變化而不斷豐富,但圍繞每一次數(shù)據(jù)交換的實(shí)現(xiàn)思路與方向是基本不變的。就具體功能而言,明確數(shù)據(jù)權(quán)屬以及保障交換安全本身屬于“控制”的具體內(nèi)涵,其中,明確的數(shù)據(jù)權(quán)屬配合真實(shí)的交換記錄為數(shù)據(jù)治理提供依據(jù)。數(shù)據(jù)互操作系統(tǒng)能夠與數(shù)據(jù)治理規(guī)則相容,從數(shù)據(jù)流通的底層架構(gòu)中為數(shù)據(jù)治理留出操作窗口,對(duì)數(shù)據(jù)治理手段進(jìn)行數(shù)字化賦能,使其不再獨(dú)立于技術(shù)系統(tǒng)與平臺(tái)之外。
第二,數(shù)據(jù)基礎(chǔ)設(shè)施支撐數(shù)字化發(fā)展應(yīng)用生態(tài)。一方面,互聯(lián)網(wǎng)發(fā)展面臨的新問(wèn)題、新需求會(huì)助推數(shù)據(jù)基礎(chǔ)設(shè)施的發(fā)展并形成相關(guān)產(chǎn)業(yè);另一方面,數(shù)據(jù)基礎(chǔ)設(shè)施的發(fā)展成熟,也將支撐上層應(yīng)用不斷取得新突破。
任何技術(shù)的推廣與普及都必然以市場(chǎng)化的方式運(yùn)作并形成相關(guān)產(chǎn)業(yè),數(shù)據(jù)基礎(chǔ)設(shè)施的發(fā)展將助推形成數(shù)據(jù)基礎(chǔ)設(shè)施產(chǎn)業(yè),并在納入數(shù)字經(jīng)濟(jì)核心產(chǎn)業(yè)的統(tǒng)計(jì)范疇以及數(shù)字經(jīng)濟(jì)運(yùn)行中發(fā)揮特定的作用、扮演固定的角色。當(dāng)前,中國(guó)已建成世界規(guī)模領(lǐng)先的數(shù)字基礎(chǔ)設(shè)施,其中,網(wǎng)絡(luò)基礎(chǔ)設(shè)施規(guī)模全球最大,算力規(guī)模位居全球第二?!稊?shù)字中國(guó)發(fā)展報(bào)告(2021年)》指出,2017年到2021年,我國(guó)數(shù)據(jù)產(chǎn)量從2.3ZB增長(zhǎng)至6.6ZB,全球占比9.9%,位居世界第二。隨著中國(guó)產(chǎn)生的數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng),數(shù)據(jù)基礎(chǔ)設(shè)施產(chǎn)業(yè)也將發(fā)展至與其他數(shù)字基礎(chǔ)設(shè)施相當(dāng)?shù)捏w量與規(guī)模,數(shù)據(jù)基礎(chǔ)設(shè)施產(chǎn)業(yè)的發(fā)展蘊(yùn)含著巨大的市場(chǎng)機(jī)會(huì)和廣闊的想象空間。
數(shù)據(jù)基礎(chǔ)設(shè)施助力數(shù)字技術(shù)迭代升級(jí)。大數(shù)據(jù)、云計(jì)算、區(qū)塊鏈、物聯(lián)網(wǎng)、人工智能等數(shù)字技術(shù)作用于數(shù)據(jù)生命周期的部分環(huán)節(jié)甚至全流程,數(shù)字技術(shù)的迭代升級(jí)與數(shù)據(jù)互聯(lián)互通息息相關(guān)。以人工智能技術(shù)為例,機(jī)器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)是大型語(yǔ)言類(lèi)模型出現(xiàn)之前,人工智能技術(shù)中應(yīng)用最為廣泛的門(mén)類(lèi),能夠較好地解決圖像識(shí)別、聲音識(shí)別等問(wèn)題,并應(yīng)用于人臉識(shí)別門(mén)禁卡、無(wú)人駕駛汽車(chē)等領(lǐng)域。神經(jīng)網(wǎng)絡(luò)技術(shù)理念的提出最早可以追溯到McCulloch and Pitts(1943),上世紀(jì)六十年代曾經(jīng)歷了技術(shù)理論的繁榮發(fā)展期,但是神經(jīng)網(wǎng)絡(luò)技術(shù)直到2010年才開(kāi)始大規(guī)模普及應(yīng)用,算力基礎(chǔ)設(shè)施不健全與數(shù)據(jù)資源匱乏是其中的主要限制因素。同樣,算力基礎(chǔ)設(shè)施與豐富的數(shù)據(jù)資源支撐了ChatGPT等大型語(yǔ)言類(lèi)人工智能模型的構(gòu)建。一方面,ChatGPT等大型語(yǔ)言類(lèi)模型的發(fā)展高度依賴于高知識(shí)密度數(shù)據(jù)的積累,而“數(shù)據(jù)孤島”問(wèn)題的凸顯,難以有效支撐人工智能技術(shù)及其應(yīng)用的發(fā)展,這就需要數(shù)據(jù)基礎(chǔ)設(shè)施為人工智能技術(shù)的發(fā)展提供豐富的高知識(shí)密度數(shù)據(jù);另一方面,ChatGPT等大型語(yǔ)言類(lèi)人工智能模型的發(fā)展隱含一定治理風(fēng)險(xiǎn),呼喚數(shù)據(jù)基礎(chǔ)設(shè)施在數(shù)據(jù)資源體系大循環(huán)中扮演總體控制的角色。
數(shù)據(jù)基礎(chǔ)設(shè)施賦能相關(guān)產(chǎn)業(yè)發(fā)展壯大。從數(shù)據(jù)要素產(chǎn)生的邏輯來(lái)看,可將各類(lèi)產(chǎn)業(yè)分為數(shù)據(jù)原生產(chǎn)業(yè)和數(shù)據(jù)次生產(chǎn)業(yè),數(shù)據(jù)原生產(chǎn)業(yè)從產(chǎn)生之日起就依托于數(shù)據(jù)存在并發(fā)展,數(shù)據(jù)次生產(chǎn)業(yè)則指?jìng)鹘y(tǒng)產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型、數(shù)據(jù)基因的植入與產(chǎn)業(yè)數(shù)字作用機(jī)制的形成(江小涓和靳景,2022)。對(duì)于數(shù)據(jù)原生產(chǎn)業(yè)而言,數(shù)據(jù)基礎(chǔ)設(shè)施促進(jìn)高價(jià)值數(shù)據(jù)釋放,直接推動(dòng)了數(shù)據(jù)原生產(chǎn)業(yè)的發(fā)展。對(duì)于數(shù)據(jù)次生產(chǎn)業(yè)而言,數(shù)據(jù)基礎(chǔ)設(shè)施賦能傳統(tǒng)產(chǎn)業(yè),使之向數(shù)據(jù)次生產(chǎn)業(yè)演進(jìn)。制造業(yè)是發(fā)展實(shí)體經(jīng)濟(jì)的重點(diǎn),數(shù)據(jù)基礎(chǔ)設(shè)施支撐數(shù)據(jù)要素高效流通,幫助制造業(yè)生產(chǎn)直面消費(fèi)市場(chǎng),使生產(chǎn)制造方式從大規(guī)模、標(biāo)準(zhǔn)化、低成本的流水線生產(chǎn)向小規(guī)模、個(gè)性化、易調(diào)整的數(shù)字化生產(chǎn)方式轉(zhuǎn)變,使按需生產(chǎn)、快速響應(yīng)、各生產(chǎn)環(huán)節(jié)之間的緊密配合成為可能,衍生出增量制造、柔性制造等新模式。
面對(duì)價(jià)值互聯(lián)網(wǎng)的發(fā)展浪潮,在網(wǎng)絡(luò)強(qiáng)國(guó)戰(zhàn)略實(shí)施過(guò)程中,引領(lǐng)互聯(lián)網(wǎng)體系結(jié)構(gòu)和基礎(chǔ)技術(shù)方面的創(chuàng)新才是根本。為此,應(yīng)加快搭建數(shù)據(jù)基礎(chǔ)制度體系、制定有關(guān)技術(shù)標(biāo)準(zhǔn),前瞻布局“數(shù)據(jù)中樞”模式沙盒試點(diǎn),以積極作為的姿態(tài)把握第四次工業(yè)革命發(fā)展機(jī)遇,以網(wǎng)絡(luò)強(qiáng)國(guó)和數(shù)字中國(guó)建設(shè)推動(dòng)實(shí)現(xiàn)經(jīng)濟(jì)和社會(huì)發(fā)展數(shù)字化轉(zhuǎn)型,以數(shù)字經(jīng)濟(jì)高質(zhì)量快速發(fā)展推動(dòng)實(shí)現(xiàn)中華民族偉大復(fù)興的宏偉目標(biāo)。
(作者為中國(guó)科學(xué)院計(jì)算技術(shù)研究所互聯(lián)網(wǎng)基礎(chǔ)技術(shù)實(shí)驗(yàn)室主任,清華大學(xué)互聯(lián)網(wǎng)治理研究中心主任,伏羲智庫(kù)創(chuàng)始人)
【參考文獻(xiàn)】
①江小涓、靳景:《數(shù)字技術(shù)提升經(jīng)濟(jì)效率:服務(wù)分工、產(chǎn)業(yè)協(xié)同和數(shù)實(shí)孿生》,《管理世界》,2022年第12期。
②McCulloch W S, Pitts W. A logical calculus of the ideas immanent in nervous activity[J]. The bulletin of mathematical biophysics, 1943, 5: 115-133.
③李曉東、劉金河、付偉:《互聯(lián)網(wǎng)發(fā)展新階段與基礎(chǔ)資源全球治理體系變革》,《汕頭大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版)》,2021年第8期。
責(zé)編/王妍卓 美編/宋揚(yáng)
聲明:本文為人民論壇雜志社原創(chuàng)內(nèi)容,任何單位或個(gè)人轉(zhuǎn)載請(qǐng)回復(fù)本微信號(hào)獲得授權(quán),轉(zhuǎn)載時(shí)務(wù)必標(biāo)明來(lái)源及作者,否則追究法律責(zé)任。