北京大學(xué)中國社會(huì)與發(fā)展研究中心主任 邱澤奇
【摘要】算法對(duì)人類社會(huì)生活影響的普遍性和深刻性讓算法成為堪比自然環(huán)境的人工環(huán)境,算法影響的利弊兩面性以及算法侵害的不斷出現(xiàn)將人類推入算法治理時(shí)代。伴隨算法影響不斷擴(kuò)大的是算法自身復(fù)雜性的增強(qiáng),算法已經(jīng)從古老的計(jì)算演化為實(shí)時(shí)關(guān)系模型的自我迭代與演進(jìn),進(jìn)而讓算法的過程治理既在技術(shù)上不可行,也在管理上代價(jià)高昂。中美歐在算法治理領(lǐng)域的探索實(shí)踐呈現(xiàn)不同格局,美國從防范算法侵害入手,形成了政府和第三方的問責(zé)模式;歐盟從數(shù)據(jù)保護(hù)入手,逐漸與美國的問責(zé)模式匯流;中國從網(wǎng)絡(luò)安全入手實(shí)施治理,但尚未形成有法理邏輯和明確操作路徑的算法治理模式,邁向問責(zé)模式似乎是中國算法治理可能的且有效的行動(dòng)選擇。
【關(guān)鍵詞】算法治理 算法技術(shù) 問責(zé)模式
【中圖分類號(hào)】D922.16 【文獻(xiàn)標(biāo)識(shí)碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2022.10.003
對(duì)算法治理的討論盡管早在20世紀(jì)80年代已初現(xiàn)端倪,可真正廣泛進(jìn)入人們的視線還是始于近些年中美歐相關(guān)法律的落地和文獻(xiàn)數(shù)量的爆發(fā)式增長(zhǎng)。
1984年是桌面計(jì)算機(jī)進(jìn)入流行的初始階段,也是人們對(duì)算法開始警覺的起點(diǎn)。次年,美國國會(huì)技術(shù)評(píng)估辦公室的一份報(bào)告指出,在過去20年間,聯(lián)邦政府四分之一的部門已經(jīng)將計(jì)算機(jī)系統(tǒng)用于執(zhí)法調(diào)查或情報(bào)搜集與分析。[1]其中的“計(jì)算機(jī)系統(tǒng)”便內(nèi)含了算法。隨后,同一間辦公室的報(bào)告《電子記錄系統(tǒng)與個(gè)人隱私》則明確意識(shí)到了算法治理的挑戰(zhàn)。報(bào)告指出,運(yùn)用電子記錄進(jìn)行個(gè)人畫像意味著求解個(gè)體特征和行為模式以及其與特定行為的關(guān)聯(lián),進(jìn)而直接涉及使用個(gè)人記錄畫像、產(chǎn)生算法歧視等隱私和自由問題。[2]
其實(shí),早在20世紀(jì)60年代后期,人們已有對(duì)自動(dòng)化的擔(dān)憂,類似于當(dāng)下人們對(duì)算法的顧慮。值得記錄的一項(xiàng)反思是對(duì)人的特殊性和目的性的強(qiáng)調(diào),認(rèn)為自動(dòng)化的設(shè)計(jì)、制造、存在都是應(yīng)該圍繞人展開的,人的尊嚴(yán)是自動(dòng)化的第一理念。[3]此后,人們對(duì)信息技術(shù)的迭代演進(jìn)、信息技術(shù)的數(shù)字化,以及數(shù)字技術(shù)向生產(chǎn)和生活各領(lǐng)域不斷滲透帶來的影響一直保持著關(guān)注。只是這些關(guān)注始終呈現(xiàn)為有限的探討,沒有形成持續(xù)的努力。
人工智能的新一輪爆發(fā)[4]引發(fā)了近些年對(duì)算法治理的關(guān)注。大多數(shù)涉及算法治理的文獻(xiàn)甚至不謀而合地形成了一種套路式表述,如:隨著大數(shù)據(jù)、云計(jì)算、人工智能技術(shù)應(yīng)用的普及,算法已廣泛且深度地進(jìn)入平臺(tái)經(jīng)濟(jì)、智慧城鄉(xiāng)、政府治理等政治、市場(chǎng)、社會(huì)領(lǐng)域,成為影響人類生產(chǎn)與生活的關(guān)鍵力量,算法在帶來數(shù)字經(jīng)濟(jì)繁榮、政府治理有效、社會(huì)發(fā)展活躍的同時(shí),也潛藏著政治、經(jīng)濟(jì)、社會(huì)、法律等一系列風(fēng)險(xiǎn),且相關(guān)風(fēng)險(xiǎn)在逐漸顯現(xiàn)。為此,政府或社會(huì)亟需關(guān)注……。中國知網(wǎng)的數(shù)據(jù)顯示,以算法治理為主題的社會(huì)科學(xué)文獻(xiàn)在2013年左右只有零星幾篇,2018年開始呈現(xiàn)急劇上升趨勢(shì),2022年前4個(gè)月發(fā)表的文獻(xiàn)數(shù)量幾乎與2020年整年的數(shù)量相若。
在既有的探討中,盡管不少文獻(xiàn)直奔算法治理主題,盡抒胸臆地表達(dá)對(duì)算法治理的關(guān)注,卻無意或有意地忽視了一些基本問題,如,算法是一個(gè)舊已有之的存在,如今為什么要特別關(guān)注?到底什么是算法?如果關(guān)注,又能關(guān)注什么?本文試圖從算法對(duì)人類社會(huì)生產(chǎn)和生活的廣泛和深刻影響的程度入手,闡述算法已經(jīng)成為人類生產(chǎn)和生活的普遍環(huán)境,不得不予以關(guān)注;本文還將進(jìn)一步分析算法的技術(shù)邏輯,說明關(guān)注過程治理、試圖對(duì)算法進(jìn)行實(shí)時(shí)監(jiān)測(cè)難以實(shí)現(xiàn)算法治理目標(biāo);最后本文將探討算法治理的可能路徑及中美歐的行動(dòng)選擇。
進(jìn)入算法治理時(shí)代
在套路化闡述算法治理的文獻(xiàn)中,人們認(rèn)為,關(guān)注算法的必要性來自于大數(shù)據(jù)、云計(jì)算、人工智能等數(shù)字技術(shù)的廣泛應(yīng)用。問題是,為何相關(guān)技術(shù)廣泛應(yīng)用之后必需治理算法呢?換個(gè)問法,數(shù)字技術(shù)的廣泛應(yīng)用與算法有什么關(guān)系?不用算法,可行嗎?即使運(yùn)用算法,不治理,行嗎?我們認(rèn)為,回答這些問題是理解算法治理必要性的前提。
算法古已有之。在中國之外,算法的最早證據(jù)可以追溯到古代美索不達(dá)米亞的巴比倫數(shù)學(xué),在伊拉克巴格達(dá)附近發(fā)現(xiàn)的一塊公元前2500年左右蘇美爾時(shí)期的粘土碑上的除法算法便是證據(jù),[5]古巴比倫的天文學(xué)采用算法程序計(jì)算重大天文事件的時(shí)間和地點(diǎn)。[6]在中國,算法的最早證據(jù)則可追溯到《黃帝歷》,時(shí)間大約在公元前2700年,人們用算法理解天體之間的運(yùn)動(dòng)規(guī)律,安排人類的生產(chǎn)和生活。[7]如此可知,算法在人類歷史中始終存在,在近代社會(huì)也沒有停止演化,且早已運(yùn)用于生產(chǎn)和生活之中。[8]可是,為什么直到現(xiàn)在,人們才那么關(guān)注算法治理?
歸納既有文獻(xiàn),我們觀察到三種主要理由。一種理由認(rèn)為,算法侵害[9]是觸發(fā)人們關(guān)注算法治理的根由。人們認(rèn)為,現(xiàn)實(shí)生產(chǎn)和生活中已經(jīng)出現(xiàn)了算法歧視、算法偏見、算法共謀、算法壟斷、算法黑箱、算法遮蔽、算法短視、算法霸權(quán)、算法操縱、算法劫持、算法剝削等與算法關(guān)聯(lián)的社會(huì)、經(jīng)濟(jì)、甚至政治侵害,給人類社會(huì)的政治、經(jīng)濟(jì)、社會(huì)生活帶來了負(fù)面影響。
另一種理由認(rèn)為,算法風(fēng)險(xiǎn)[10]是觸發(fā)算法治理的根由。人們認(rèn)為,在個(gè)體層次,算法強(qiáng)化著信息繭房,帶來人的認(rèn)知窄化風(fēng)險(xiǎn)。在市場(chǎng)層次,算法遵循商業(yè)邏輯,醞釀著監(jiān)控資本主義的風(fēng)險(xiǎn)。在國家層次,算法隱藏著被特定利益集團(tuán)用于社會(huì)控制和政治權(quán)力再生產(chǎn)的政治風(fēng)險(xiǎn)。從個(gè)體層次到國家層次的風(fēng)險(xiǎn)給人類社會(huì)的政治、經(jīng)濟(jì)、社會(huì)生活帶來巨大的不確定性。
除了算法帶來的侵害和風(fēng)險(xiǎn),還有人將算法影響上升到制度層次,認(rèn)為算法權(quán)力、算法規(guī)則是觸發(fā)規(guī)則競(jìng)爭(zhēng)、權(quán)力競(jìng)爭(zhēng)甚至規(guī)則壟斷、權(quán)力壟斷的根由。值得特別注意的是,這也是西文文獻(xiàn)探討算法治理的主流。早在中文文獻(xiàn)關(guān)注算法之前,西文文獻(xiàn)就以著作形態(tài)探討算法權(quán)力(power of algorithms)了。奧賽羅和佩特里希編輯的論文集[11]運(yùn)用歷史與現(xiàn)實(shí)視角刻畫算法對(duì)日常生活的影響,如導(dǎo)航、搜索、保密通信、油鹽醬醋、觀看電視、導(dǎo)購、游戲等,算法已經(jīng)介入人們的日常生活,成為影響甚至支配人們?nèi)粘I畹臋?quán)力。在一般權(quán)力之外,社會(huì)學(xué)家似乎偏愛算法的社會(huì)權(quán)力(social power of algorithms)。人們認(rèn)為,算法正在從人類手里獲得決策權(quán),在越來越多的領(lǐng)域或行動(dòng)中成為人類的代理人,不僅在日常生活中代理個(gè)體,還在組織行動(dòng)中代理組織或機(jī)構(gòu)。如果個(gè)體和組織層次的代理行動(dòng)涉及社會(huì)秩序的建構(gòu)和預(yù)測(cè),在邏輯上,算法已經(jīng)進(jìn)入政治生活領(lǐng)域,[12]直接觸碰到了政治權(quán)力。在中文文獻(xiàn)中,算法權(quán)力也在成為一個(gè)重要論題。[13]
同樣,西文文獻(xiàn)也早在以著作形態(tài)探討算法規(guī)則,這些甚至早于對(duì)算法權(quán)力的探討。[14]萊辛格直言,代碼即法律。在短短五年內(nèi)對(duì)著作的兩次修訂中,萊辛格明確指出,代碼建構(gòu)了數(shù)字空間的規(guī)則,同樣約束著人類行動(dòng)。計(jì)算機(jī)代碼與制度具有同樣的規(guī)制效應(yīng)。萊辛格擔(dān)心的是,商業(yè)公司的逐利性會(huì)讓規(guī)則朝著有利于盈利的方向偏移,進(jìn)而影響代碼規(guī)則在數(shù)字空間的公共性。通俗地說,如果我們把法律作為人類公共性的產(chǎn)物,那么,萊辛格擔(dān)心的是,在數(shù)字空間,代碼會(huì)將法律的公共性引向?yàn)橘Y本牟利。進(jìn)一步的討論甚至將算法規(guī)則提升到更高規(guī)則層級(jí),[15]認(rèn)為算法給憲法帶來了挑戰(zhàn),對(duì)人的自由及其他基本權(quán)利造成不利影響,更不用說對(duì)制度、規(guī)制、公共政策等的影響了。
的確,算法向生產(chǎn)和生活的不斷滲透對(duì)人類社會(huì)產(chǎn)生著深刻的影響,小到個(gè)體的日常生活決策如食物、衣裝、出行等,中到人與社會(huì)每個(gè)層次的關(guān)系如群體、組織、市場(chǎng)、社會(huì)、國家等,大到人類的基本權(quán)利如自由等。問題是,自算法進(jìn)入人類生產(chǎn)與生活開始,算法的影響始終存在,人們?yōu)槭裁匆诋?dāng)下關(guān)注算法侵害、算法風(fēng)險(xiǎn)、算法權(quán)力、算法規(guī)則呢?換一種方式提問,假設(shè)這些影響只涉及極少數(shù)人,而不涉及整個(gè)人類社會(huì),我們還需要如此關(guān)注算法么?答案是否定的。即使有人關(guān)注也無需將其推送到整個(gè)社會(huì)面前,正如20世紀(jì)初人們對(duì)生產(chǎn)流水線的關(guān)注、20世紀(jì)60年代人們對(duì)自動(dòng)化的關(guān)注一樣,算法可以成為少數(shù)人的興趣或?qū)W術(shù)探討的前沿,而無須成為整個(gè)社會(huì)關(guān)注的焦點(diǎn)。
我們認(rèn)為,社會(huì)關(guān)注聚焦于算法治理其實(shí)是由兩個(gè)因素推動(dòng)的,除了算法影響的廣度和深度,還有算法影響的覆蓋面。遺憾的是,既有文獻(xiàn)極少涉及后者。事實(shí)上,不僅因?yàn)樗惴ㄓ绊懥藦膫€(gè)體決策、行動(dòng)到國家憲法等人類社會(huì)生活的各個(gè)領(lǐng)域,還因?yàn)樗惴ㄓ绊懥耸澜绲拇蠖鄶?shù)社會(huì)、大多數(shù)人,可以說,整個(gè)人類社會(huì)的方方面面都處在算法的影響之下,人類參與的政治、經(jīng)濟(jì)、社會(huì)生活,處處都有算法的影響,一些領(lǐng)域甚至根本是由算法在推動(dòng)。
那么,算法影響的覆蓋面到底有多大呢?其實(shí),接受算法影響是有條件的,不滿足相應(yīng)的條件,算法影響便覆蓋不到。要觀察算法影響的覆蓋面,還需從算法影響發(fā)生的條件入手。對(duì)算法影響條件的分析也從另一個(gè)角度幫助我們理解,算法始終與人類的生產(chǎn)與生活相伴隨,長(zhǎng)期以來算法影響覆蓋的人群卻一直非常有限,如同流水線、自動(dòng)化等在不同層次影響的人群始終是有邊界的。
在數(shù)字時(shí)代,算法影響的第一個(gè)條件是接入互聯(lián)網(wǎng)絡(luò)。沒有互聯(lián)網(wǎng)絡(luò)的接入,就沒有個(gè)體或組織行動(dòng)與數(shù)字網(wǎng)絡(luò)的數(shù)據(jù)交換,也不會(huì)有任何數(shù)字化算法介入,無論是個(gè)體還是機(jī)構(gòu)或組織都被排除在算法的影響之外。根據(jù)國際電信聯(lián)盟(ITU)的數(shù)據(jù),截至2021年,世界上依然有37%左右[16]的人口沒有接入互聯(lián)網(wǎng)。根據(jù)中國互聯(lián)網(wǎng)信息中心的數(shù)據(jù),截至2021年12月,在中國以人口總體為分母的互聯(lián)網(wǎng)接入率為73.0%,10.32億接入用戶,其中鄉(xiāng)村用戶占27.6%,城鎮(zhèn)用戶占72.4%。如果以接入設(shè)施覆蓋面觀察,以最小行政單元為計(jì)量單位,中國的寬帶覆蓋率為100%,光纖覆蓋率為98%。[17]綜合相關(guān)數(shù)據(jù)可以獲得的判斷是,盡管世界上依然有超過三分之一的人口沒有接入互聯(lián)網(wǎng),尚處在算法影響的范圍之外,中國卻實(shí)現(xiàn)了互聯(lián)網(wǎng)接入的充分供給,如果以家庭為單位計(jì)算,則人口整體處于算法影響的覆蓋之內(nèi)。在數(shù)字接入的意義上,算法有機(jī)會(huì)影響到幾乎每一位中國人,如果愿意,每一位中國人也有機(jī)會(huì)接受算法的影響。算法覆蓋的無邊界性,在歷史上是不曾出現(xiàn)的現(xiàn)象。一個(gè)直接的例子是,新冠肺炎疫情流行的近三年來,一塊方寸大小的健康狀況二維碼,讓每一位生活在中國的人都感受到了算法影響的強(qiáng)烈沖擊。
算法影響的第二個(gè)條件是數(shù)據(jù)成為人類生產(chǎn)與生活的環(huán)境。如果只是接入網(wǎng)絡(luò),也不足以讓算法影響觸達(dá)每一個(gè)接入的節(jié)點(diǎn)(人、組織、事物等)。與算法一致,網(wǎng)絡(luò)也始終伴隨著人類社會(huì)存在。人際網(wǎng)絡(luò)是基礎(chǔ)網(wǎng)絡(luò),由此衍生的網(wǎng)絡(luò)林林總總??墒?,網(wǎng)絡(luò)并沒有因?yàn)楦采w面的擴(kuò)大而改變網(wǎng)絡(luò)的本質(zhì)屬性,網(wǎng)絡(luò)還是人與人、人與事、人與物、物與事等事物之間的一種連接關(guān)系。當(dāng)然,連接的性質(zhì)會(huì)因?yàn)殛P(guān)系屬性的差異而發(fā)生變化,從血緣網(wǎng)絡(luò)、地緣網(wǎng)絡(luò),衍生出供應(yīng)網(wǎng)絡(luò)、生產(chǎn)網(wǎng)絡(luò)、創(chuàng)新網(wǎng)絡(luò)、貿(mào)易網(wǎng)絡(luò)、社會(huì)網(wǎng)絡(luò)、政治網(wǎng)絡(luò)等。在網(wǎng)絡(luò)上,兩個(gè)節(jié)點(diǎn)之間流動(dòng)的只要不是不斷產(chǎn)生的數(shù)據(jù),不管流動(dòng)的是什么,即使伴隨著算法,算法的影響也僅限于有限的節(jié)點(diǎn)之間,不足以引發(fā)廣泛的社會(huì)關(guān)注??墒?,當(dāng)網(wǎng)絡(luò)上流動(dòng)的是關(guān)系性數(shù)據(jù)時(shí),算法影響的溢出點(diǎn)便出現(xiàn)了。
數(shù)據(jù)對(duì)算法影響溢出的推動(dòng)不在于數(shù)據(jù)本身,而在于數(shù)據(jù)的量。在互聯(lián)網(wǎng)上,有人專門關(guān)注數(shù)字網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù)量,如“數(shù)據(jù)從不睡覺(Data Never Sleeps)”9.0版[18]顯示,在數(shù)字網(wǎng)絡(luò)上每分鐘產(chǎn)生的20類數(shù)據(jù)中,任何一類的數(shù)據(jù)量都是人腦的計(jì)算能力無法勝任的,甚至也是個(gè)人電腦的處理能力難以勝任的。數(shù)據(jù)量巨大到遠(yuǎn)遠(yuǎn)超出人類加上簡(jiǎn)單工具的處理能力,在歷史上也是不曾出現(xiàn)的現(xiàn)象。數(shù)字網(wǎng)絡(luò)進(jìn)入社會(huì)化應(yīng)用以來,人類活動(dòng)產(chǎn)生和積累的數(shù)據(jù)量早已超出傳統(tǒng)的處理能力,不借助算法,人類根本無力運(yùn)用數(shù)據(jù)資源進(jìn)行生產(chǎn),難以提高生活質(zhì)量。數(shù)據(jù)已經(jīng)成為接入數(shù)字網(wǎng)絡(luò)的人口之生產(chǎn)和生活環(huán)境,巨量的數(shù)據(jù)和應(yīng)用是人類依靠其生物屬性無力應(yīng)付和處理的,由此帶來的直接后果是:算法成為了人類生產(chǎn)與生活必備的外生性能力。這樣我們就可以理解,為什么智能手機(jī)在日常生活中會(huì)成為人們的第一陪伴。
算法影響的第三個(gè)條件是算法成為人類生產(chǎn)和生活的必備工具。數(shù)據(jù)和算法的組合正在從根本上改變?nèi)祟惖纳a(chǎn),推動(dòng)著人類從工業(yè)經(jīng)濟(jì)邁向數(shù)字經(jīng)濟(jì);也在從根本上改變?nèi)祟惖纳睿苿?dòng)著人類從工業(yè)社會(huì)邁向數(shù)字社會(huì),數(shù)據(jù)和算法因此成為人類邁向數(shù)字時(shí)代的標(biāo)志性指標(biāo)。
在經(jīng)濟(jì)領(lǐng)域,上市公司的市值排名不只標(biāo)示企業(yè)價(jià)值規(guī)模,也指示關(guān)鍵技術(shù)的影響力和社會(huì)的取舍。根據(jù)公開數(shù)據(jù),在市值排名前十的公司中,1990年有6家銀行、1家通信硬件公司;2020年則有7家互聯(lián)網(wǎng)公司、2家金融公司。在過去四十年,以設(shè)施設(shè)備等硬件為基礎(chǔ),以組織和社會(huì)應(yīng)用為目標(biāo),數(shù)字技術(shù)快速邁過其擴(kuò)散臨界點(diǎn),進(jìn)入變革的起飛階段。中國信通院的數(shù)據(jù)顯示,2020年中國數(shù)字經(jīng)濟(jì)增加值為39.2萬億元人民幣,占GDP的比重躍升至38.6%,[19]這意味著,中國數(shù)字經(jīng)濟(jì)已越過技術(shù)擴(kuò)散起飛的臨界點(diǎn)而進(jìn)入起飛初始階段。預(yù)計(jì),2025年中國數(shù)字經(jīng)濟(jì)占GDP的比重將超過50%,[20]中國將真正進(jìn)入數(shù)字經(jīng)濟(jì)時(shí)代。
在社會(huì)領(lǐng)域,數(shù)字終端已經(jīng)成為人們的必備工具,且不細(xì)說數(shù)字企業(yè)、數(shù)字政府如何運(yùn)用算法改善生產(chǎn)、改善治理,只從人們?nèi)粘I顚?duì)數(shù)字工具的應(yīng)用中便能看到由數(shù)據(jù)量推動(dòng)的算法帶來的影響。在中國互聯(lián)網(wǎng)用戶群體中,90%的人使用即時(shí)通訊、80%的人使用政務(wù)服務(wù)、70%的人使用數(shù)字支付,哪一項(xiàng)應(yīng)用的實(shí)現(xiàn)都依賴算法。例如,運(yùn)籌起點(diǎn)到終點(diǎn)的行車路線是出租車司機(jī)的基本職業(yè)能力,現(xiàn)如今,司機(jī)們卻說,離開了即時(shí)導(dǎo)航都無法行車了。
在政務(wù)領(lǐng)域,省部級(jí)政務(wù)接入國家政務(wù)平臺(tái)的比例快速上升,居民跨行政區(qū)辦理業(yè)務(wù)的便利性極大增強(qiáng)。在政務(wù)平臺(tái)上,實(shí)名注冊(cè)個(gè)人數(shù)達(dá)7.74億,法人數(shù)量達(dá)7.27億。審批等行政許可事項(xiàng)實(shí)現(xiàn)網(wǎng)上受理和最多跑一次的比例達(dá)82.13%;一半以上行政許可事項(xiàng)平均時(shí)限壓縮超過40%;政府事項(xiàng)網(wǎng)上可辦率超過了90%。[21]數(shù)字連接正在推動(dòng)中國治理體系和治理能力的現(xiàn)代化。
任何一項(xiàng)終端工具應(yīng)用的背后都有算法,算法的工具化無處不在。我們甚至可以認(rèn)為:無算法,不生產(chǎn);無算法,不生活。在生產(chǎn)領(lǐng)域,數(shù)據(jù)已成為人類的新生產(chǎn)資料,算法則成為人類新的生產(chǎn)工具。在生活領(lǐng)域,數(shù)據(jù)已成為人類提升生活質(zhì)量的素材,算法則成為人類新的生活工具。
人類正在加速進(jìn)入算法時(shí)代,人們之所以關(guān)注算法侵害、算法風(fēng)險(xiǎn)、算法權(quán)力、算法規(guī)則,不是因?yàn)榍趾ΑL(fēng)險(xiǎn)、權(quán)力、規(guī)則本身,而是因?yàn)榍趾?、風(fēng)險(xiǎn)、權(quán)力、規(guī)則直接影響到大多數(shù)人的利益和福祉,直接影響到經(jīng)濟(jì)發(fā)展的可持續(xù)性,直接影響到社會(huì)發(fā)展的平等性,直接影響到政治發(fā)展的公平性。換句話說,在人類邁向數(shù)字時(shí)代的同時(shí),我們無法回避算法給人類帶來的如此深重且本質(zhì)性的影響。問題是,算法又是何方神圣,何以有如此魔力?在既有的討論中,一些重要的觀點(diǎn)可能源自對(duì)算法的誤解,為此,下文有必要交代我們對(duì)算法的理解。
算法治理的技術(shù)迷思
盡管算法早已存在于人類社會(huì),可作為概念,算法的詞源卻來自波斯數(shù)學(xué)家花剌子模(Mu?ammad ibn Mūsā al-Khwārizmī)的名字?;ㄘ葑幽C值睦≌Z寫法(Algoritmi)便是今天人們見到的算法作為術(shù)語的拼寫原型。算法的現(xiàn)代意義源自公元9世紀(jì)花剌子模向西方譯介印度計(jì)算方法。[22]可是,直到計(jì)算機(jī)和計(jì)算機(jī)科學(xué)進(jìn)入人們的生產(chǎn)和生活之前,人們都沒有算法的概念,正如計(jì)算機(jī)科學(xué)創(chuàng)始人諾斯(Donald Knuth)所說,直到20世紀(jì)70年代,“絕大多數(shù)受過教育的人都不知道算法,并且說實(shí)話,無論如何,也幾乎沒有必要知道”。[23]
那么,算法到底是什么?在不同的歷史階段、不同的應(yīng)用場(chǎng)景中,算法有著不同所指,從最簡(jiǎn)單的算法到最復(fù)雜的算法??稍诒举|(zhì)上,算法只是一種求解邏輯。舉例盡管常常不是準(zhǔn)確的定義方法,卻是幫助人們理解概念準(zhǔn)確定義最有效的方法,還是舉一個(gè)例子吧。
在一座超大城市,假設(shè)您是乘客,在地點(diǎn)A上了一輛出租車,告訴司機(jī)您要去地點(diǎn)B,您希望盡快到達(dá)目的地。一位出色的出租車司機(jī)通常對(duì)服務(wù)范圍的道路非常熟悉。在您告訴司機(jī)目的地的瞬間,司機(jī)的頭腦中會(huì)快速盤算行車路線,譬如,路線一可能會(huì)遇到堵車,路線二不是最短路徑,路線三可能正好適中,或者還有更優(yōu)的滿足盡快到達(dá)目的地需求的路線,只是司機(jī)不了解。
其中,從A點(diǎn)到B點(diǎn),是需要解決的問題。有多個(gè)與問題相關(guān)的因素,至少涉及交通工具、道路狀況、交通動(dòng)態(tài)、選擇偏好。給定乘客的選擇偏好:盡快;再給定交通工具:出租車;司機(jī)的路線選擇至少還涉及道路狀況和交通動(dòng)態(tài)。再假設(shè)道路狀況已知,便有了司機(jī)的三條路線選擇。
如果說司機(jī)的三條路線選擇是從A點(diǎn)到B點(diǎn)問題的數(shù)學(xué)解,算法則是司機(jī)路線選擇的求解過程。在過程中,從A點(diǎn)到B點(diǎn)的路線用時(shí)是因變量,交通工具、道路狀況、交通動(dòng)態(tài)、選擇偏好等是自變量,其中,每一個(gè)自變量對(duì)因變量的影響并非等價(jià),如交通工具是條件變量,道路狀況也可以是條件變量,交通工具與道路狀況一起又會(huì)衍生出其他變量如路線備選集,交通動(dòng)態(tài)可能是直接的自變量,卻是只能憑借司機(jī)經(jīng)驗(yàn)的自變量。運(yùn)用與事實(shí)相吻合的關(guān)聯(lián)邏輯,建立自變量與自變量的關(guān)系結(jié)構(gòu),進(jìn)一步建構(gòu)自變量與因變量的關(guān)系結(jié)構(gòu),形成求解的計(jì)算邏輯,就是算法。
這個(gè)例子表明,第一,算法是面對(duì)問題的,無論是現(xiàn)實(shí)問題還是理論問題,總之是需要解決的問題。盡快到達(dá)目的地是需要解決的現(xiàn)實(shí)問題,如何把某個(gè)商品賣給愿意出高價(jià)的人是需要解決的理論和現(xiàn)實(shí)問題,人們?yōu)槭裁丛谒阉饕嫔纤阉鞲忻八幰彩切枰鉀Q的理論和現(xiàn)實(shí)問題。人類需要解決的問題無處不在,故算法從不缺乏需要解決的問題。
第二,算法是通過計(jì)算解決問題的。因此,任何用到算法的問題,都需要將問題數(shù)學(xué)化為可計(jì)算模型。其中又內(nèi)含著一個(gè)問題的兩面。一方面,要解決的問題可以被數(shù)學(xué)化即用數(shù)學(xué)模型刻畫,不能建?;驎簳r(shí)不能建模的問題是無法運(yùn)用算法的,如人類或許暫時(shí)還無力將A愛戀B的程度數(shù)學(xué)化。另一方面,建構(gòu)的數(shù)學(xué)模型是可計(jì)算的。滿足可計(jì)算的條件是,至少有用于計(jì)算的數(shù)據(jù),至少計(jì)算可以獲得解,即存在著運(yùn)用數(shù)據(jù)進(jìn)行計(jì)算而獲得的解。沒有數(shù)據(jù),無法計(jì)算;有數(shù)據(jù)卻沒有計(jì)算解也無法計(jì)算。通俗地說,運(yùn)用計(jì)算機(jī)不是為了計(jì)算,而是為了運(yùn)用計(jì)算機(jī)的算力更有效率地獲得計(jì)算的解。哈雷爾(David Harel)之所以將算法定義為計(jì)算機(jī)科學(xué)的靈魂,[24]或許理由正是在此。
算法正是每一位出租車司機(jī)頭腦中交通路線的運(yùn)籌過程。在這個(gè)意義上,算法與人類的存在相伴隨??墒?,人們關(guān)注算法,并不是因?yàn)槟澄怀鲎廛囁緳C(jī)頭腦里的交通路線,一個(gè)人的算法并不會(huì)對(duì)其他人構(gòu)成影響,除非存在某種組織結(jié)構(gòu),更不會(huì)對(duì)大多數(shù)人構(gòu)成影響,進(jìn)而也不會(huì)成為社會(huì)關(guān)注的焦點(diǎn)。
如果不是一位出租車司機(jī),而是成千上萬的出租車和非出租車司機(jī),是幾百萬輛機(jī)動(dòng)車行駛在道路上,即同時(shí)有幾百萬個(gè)算法在發(fā)生,不僅如此,幾百萬個(gè)算法還因?yàn)槎寂c道路資源有關(guān)而構(gòu)成相互影響,即每一位司機(jī)算法的效率都以其他司機(jī)的算法為條件,而且,每一位司機(jī)的行車路線、行駛狀態(tài)、駕駛行為都可以成為影響交通路線選擇的因素。在這樣的環(huán)境下,如果還希望獲得最優(yōu)行駛路線,運(yùn)用人的生物屬性已經(jīng)無力達(dá)成目標(biāo),即人類的生物屬性沒有能力處理哪怕是交通路線選擇之類的算法之間的關(guān)系。
如果道路條件、每一個(gè)路口的交通燈變化、道路上每一輛機(jī)動(dòng)車的行駛路線、行駛狀態(tài)、每一個(gè)駕駛者的駕駛行為都被數(shù)據(jù)化,都匯集到一個(gè)數(shù)據(jù)池,且希望依據(jù)數(shù)據(jù)來獲得最優(yōu)行車路線,即盡快從A點(diǎn)到達(dá)B點(diǎn);那么,此時(shí)出租車司機(jī)面對(duì)的不再只是交通路線選擇,而是多出了許許多多工作,且不說相關(guān)數(shù)據(jù)如何測(cè)量、匯集,只說匯集后如何識(shí)別、整理與運(yùn)用,每一項(xiàng)活動(dòng)都是人類的生物屬性能力難以處理的,唯一可以借用的,只有算法。
第三,算法是一系列問題和求解數(shù)學(xué)模型的集合。從一個(gè)人的算法到一座城市的算法,在數(shù)量規(guī)模擴(kuò)大的同時(shí),算法也完成了它的華麗轉(zhuǎn)身,從一個(gè)數(shù)學(xué)模型變成了無數(shù)個(gè)數(shù)學(xué)模型,且無數(shù)個(gè)數(shù)學(xué)模型之間不是獨(dú)立的,相互之間不僅有關(guān)系,而且關(guān)系還異常復(fù)雜,可能形成有條件的、多層次卷積的、多卷積關(guān)聯(lián)網(wǎng)絡(luò)的或更加復(fù)雜的關(guān)系,且模型之間的關(guān)系不僅有結(jié)構(gòu),還有時(shí)序,結(jié)構(gòu)與時(shí)序之間還不是確定的。以前置算法為條件的算法以及人類對(duì)計(jì)算效率的追求,還促進(jìn)了算法的自我迭代,即以算法為數(shù)據(jù)而改進(jìn)算法。
算法不僅與算法交互,也與人類行為或事物的發(fā)展變化交互。還是以城市道路交通為例,道路上的每一位機(jī)動(dòng)車駕駛員都有隨機(jī)應(yīng)變的能力和行動(dòng),而每一個(gè)隨機(jī)應(yīng)變都有機(jī)會(huì)改變前一個(gè)時(shí)點(diǎn)算法的結(jié)果,也意味著被運(yùn)用于計(jì)算的算法需要面對(duì)人類行為的改變、道路狀態(tài)的改變、交通環(huán)境的改變而迭代和優(yōu)化。如此,算法的實(shí)際運(yùn)行遠(yuǎn)比人們想象的復(fù)雜,一個(gè)看起來只呈現(xiàn)了紅橙黃綠交通狀態(tài)的即時(shí)導(dǎo)航系統(tǒng),卻是異常復(fù)雜算法融合的結(jié)果。以谷歌流感模型為例,算法科學(xué)家運(yùn)用用戶搜索數(shù)據(jù)呈現(xiàn)的2007年流感模型是在4.5億個(gè)模型中篩選綜合的結(jié)果。[25]
可是,如何把不同的算法整合到一起形成求解模型的集合呢?且不說4.5億個(gè)模型,即使是45個(gè)模型,也是人類的生物屬性無法處理的,數(shù)45個(gè)數(shù)還常常出錯(cuò)呢,算45個(gè)模型且將45個(gè)模型建立關(guān)聯(lián),更不是人類的生物屬性可以無錯(cuò)應(yīng)對(duì)的了。那么,如何讓用于解決問題的模型不變成進(jìn)一步需要解決的問題,而真正解決人類問題呢?算法對(duì)代碼的需要出現(xiàn)了。
第四,算法是由代碼連接且結(jié)構(gòu)化的一系列問題和求解數(shù)學(xué)模型的集合。通俗地說,任何由計(jì)算機(jī)執(zhí)行的指令都是代碼。復(fù)雜算法的代碼量可以多達(dá)數(shù)億行,可代碼向計(jì)算機(jī)傳遞的每一條指令卻只有一個(gè)動(dòng)作,做(do)或不做(else),再復(fù)雜的數(shù)學(xué)模型都需要將其轉(zhuǎn)化為向計(jì)算機(jī)傳達(dá)的簡(jiǎn)單指令。復(fù)雜的簡(jiǎn)單也因此變成了復(fù)雜的復(fù)雜的一部分,計(jì)算機(jī)代碼也因此成為了算法的有機(jī)組成部分。實(shí)現(xiàn)算法代碼化的不是別人,正是人們將數(shù)學(xué)模型轉(zhuǎn)化為結(jié)構(gòu)化的計(jì)算邏輯(如Alonzo Church)和被稱為電子計(jì)算機(jī)鼻祖的圖靈(Alan Turing)將計(jì)算邏輯轉(zhuǎn)化為可由計(jì)算機(jī)執(zhí)行的指令邏輯,其中,每一條指令都以代碼形式呈現(xiàn)。在算法代碼化的進(jìn)程中,代碼(code)的確是規(guī)則,代碼的確在指示計(jì)算機(jī)做或不做。由此推演下去,表面上,正是由代碼攜帶的簡(jiǎn)單指令構(gòu)成的復(fù)雜算法影響著計(jì)算結(jié)果的輸出,帶來了文獻(xiàn)關(guān)注的算法侵害、算法風(fēng)險(xiǎn)、算法權(quán)力、算法規(guī)則??墒牵坏┪覀冞M(jìn)一步了解了代碼與算法的關(guān)系,或許會(huì)有不一樣的觀點(diǎn)。
綜上所述,如果僅從技術(shù)上觀察,算法不過是面對(duì)理論和現(xiàn)實(shí)問題的數(shù)學(xué)求解過程,只是因?yàn)榍蠼饷鎸?duì)的復(fù)雜性超出了人類生物屬性的能力范圍,人們創(chuàng)造出一種機(jī)器,且機(jī)器能夠理解人類將復(fù)雜求解過程簡(jiǎn)化為做或不做的機(jī)器指令,交給機(jī)器去求解而已。通俗地說,理解當(dāng)下熱議的算法治理,我們必須認(rèn)識(shí)到,算法對(duì)人類社會(huì)的影響是隨著第一臺(tái)可編程電子計(jì)算機(jī)和第一種計(jì)算機(jī)編程語言的出現(xiàn)而出現(xiàn)的,隨著計(jì)算機(jī)和計(jì)算機(jī)科學(xué)的發(fā)展,算法才真正開始在解決人類問題的需求中發(fā)揮核心作用,從初期的軍事和科學(xué)領(lǐng)域,到商業(yè)和管理領(lǐng)域,再到當(dāng)下的日常生產(chǎn)和生活領(lǐng)域,算法的影響隨著算法應(yīng)用的拓展和對(duì)人群覆蓋性的擴(kuò)大而呈現(xiàn)。“是計(jì)算機(jī)科學(xué)的快速發(fā)展,特別是對(duì)算法的研究,改變了這一切。如今,算法已變得必不可少。”[26]只是,從解決問題的需求到問題解決的數(shù)學(xué)求解,從極為簡(jiǎn)單的數(shù)學(xué)求解到數(shù)學(xué)求解之間的關(guān)系結(jié)構(gòu)化、復(fù)雜化、動(dòng)態(tài)化,算法已經(jīng)不再簡(jiǎn)單如出租車司機(jī)的行車路線運(yùn)籌,在數(shù)字時(shí)代,算法已經(jīng)轉(zhuǎn)型為一系列關(guān)系和關(guān)系動(dòng)態(tài)的代碼化,問題、模型、代碼已經(jīng)成為算法的內(nèi)核。
算法治理的行動(dòng)選擇
上文討論已經(jīng)證明,算法之所以會(huì)成為社會(huì)關(guān)注的焦點(diǎn),不在于算法有多復(fù)雜,而在于算法會(huì)對(duì)許多人甚或?qū)φ麄€(gè)社會(huì)帶來影響。如果說數(shù)字連接、數(shù)據(jù)豐盈、人類必備是算法影響的三項(xiàng)必要條件,問題求解對(duì)能力的要求超出人類生物屬性的極限是算法影響的充分條件;那么,在人類跨入數(shù)字時(shí)代、中國進(jìn)入數(shù)字發(fā)展加速期的當(dāng)下,算法又如何產(chǎn)生影響呢?我們認(rèn)為,只有理解算法影響人類的機(jī)理,才能從出發(fā)點(diǎn)找對(duì)算法治理的方向。
既有文獻(xiàn)對(duì)算法影響社會(huì)的機(jī)制認(rèn)識(shí)大致可以歸結(jié)為兩個(gè)本質(zhì)性的爭(zhēng)議。第一,算法是中立的還是有偏見的?斯廷森(Catherine Stinson)指出,人們以為算法是中立的,干凈的數(shù)據(jù)和良好的意圖可以消除偏見,其實(shí),算法并不是中立的,除了有偏見的數(shù)據(jù)和算法生產(chǎn)者以外,算法自身也會(huì)產(chǎn)生偏見。這種偏見不一定來自于數(shù)據(jù),也不一定來自算法生產(chǎn)者,而是來自于機(jī)器學(xué)習(xí)的進(jìn)程,算法在不斷的迭代中從用戶對(duì)算法推薦的響應(yīng)中進(jìn)行學(xué)習(xí),創(chuàng)建著針對(duì)用戶的選擇性偏差,即偏見。[27]這些偏見不僅具有統(tǒng)計(jì)學(xué)意義,也會(huì)帶來不同類型不同程度的算法侵害后果,如學(xué)者們筆下的算法共謀、算法壟斷、算法黑箱、算法遮蔽、算法短視、算法霸權(quán)、算法操縱、算法劫持、算法剝削等,即我們統(tǒng)稱的算法侵害,而算法決策的普遍性會(huì)讓算法侵害對(duì)人類社會(huì)構(gòu)成侵害。未來的侵害對(duì)當(dāng)下而言即是風(fēng)險(xiǎn),即學(xué)者們說的算法風(fēng)險(xiǎn)。[28]
第二,算法是人類意志的產(chǎn)物還是自主自為的?認(rèn)同“算法即規(guī)則”[29]觀點(diǎn)的研究者認(rèn)為,算法已經(jīng)作為獨(dú)立行為主體參與人類生產(chǎn)、生活,算法規(guī)則也外化為社會(huì)行為規(guī)則,對(duì)人類產(chǎn)生深度影響。例如,算法的自動(dòng)化和智能化特征可能誘使技術(shù)研發(fā)者和應(yīng)用者在提高效率、降低成本的引導(dǎo)下,更多追求控制乃至替代人類行為的自主性。[30]有人甚至認(rèn)為,算法的自主自為性形成了算法利維坦,成為建構(gòu)人類環(huán)境的重要乃至決定性的力量,不僅每一位社會(huì)成員正逐漸在成為算法的附庸,國家權(quán)力運(yùn)行也在日益依賴算法,社會(huì)的技術(shù)理性至上實(shí)踐建構(gòu)了算法的絕對(duì)權(quán)威。[31]
在探討算法治理行動(dòng)之前,我們認(rèn)為有必要針對(duì)算法影響機(jī)制的爭(zhēng)議進(jìn)行澄清和回應(yīng)。實(shí)踐總是最客觀的出發(fā)點(diǎn),讓我們通過一項(xiàng)實(shí)證研究來厘清。一項(xiàng)對(duì)谷歌圖片算法的研究,對(duì)4個(gè)以上種族所有年齡段的4萬多張面孔的算法展開的審查顯示,谷歌圖片算法再現(xiàn)了白人男性父權(quán)制結(jié)構(gòu)。算法對(duì)白人男性有更多樣化的和更積極的刻畫,對(duì)其他人群的描述則更簡(jiǎn)單,更加呈現(xiàn)如刻板印象、歧視女性等社會(huì)歧視。[32]不過,研究團(tuán)隊(duì)的工作沒有就此停止,而是借鑒布迪厄的文化再生產(chǎn)理論對(duì)算法進(jìn)行再培訓(xùn)。結(jié)果顯示,經(jīng)過再培訓(xùn)的算法呈現(xiàn)了算法對(duì)社會(huì)文化實(shí)踐的刻畫,改善了之前呈現(xiàn)的社會(huì)歧視。[33]
這項(xiàng)研究告訴我們,如果代碼生產(chǎn)者以客觀為由,真實(shí)地?cái)M合社會(huì)現(xiàn)實(shí),那么,算法的確會(huì)攜帶偏見,進(jìn)而制造算法侵害。復(fù)刻部分人群(如代碼編寫者、數(shù)據(jù)匯集者等)的社會(huì)歧視和刻板印象,不只是將現(xiàn)實(shí)社會(huì)的社會(huì)歧視和刻板印象算法化,還意味著將部分人群的社會(huì)歧視和刻板印象通過高度互聯(lián)的社會(huì)網(wǎng)絡(luò)傳遞給不明真相的用戶,因此也不再只是布迪厄意義上的文化再生產(chǎn),而是對(duì)社會(huì)歧視的擴(kuò)散與傳播,甚至是社會(huì)歧視的教唆。
對(duì)算法再培訓(xùn)帶來的算法改善則清晰地說明,第一,算法侵害看起來是算法偏見制造的,實(shí)際卻是編寫算法的人群制造的,算法只是做了算法可做的事:有效率地運(yùn)行代碼,為人類提供計(jì)算結(jié)果。無論是通過算法迭代還是自編碼,算法都只是放大人類在初始階段植入的偏見和規(guī)則,而不是算法自主自為地形成偏見和規(guī)則。以為算法存在獨(dú)立于算法生產(chǎn)者之外的偏見或規(guī)則,以為算法不再是人類生產(chǎn)的產(chǎn)品,其實(shí)是一種方向性的誤解。第二,算法并不具有自主自為性。算法的確可以自我改善,自己編寫代碼,可是算法卻沒有自帶偏見、也沒有自造規(guī)則,即使有偏見、有規(guī)則,也是人類將自己的偏見和規(guī)則變成算法代碼形成的偏見和規(guī)則。沒有人類輸入的第一行代碼,便不會(huì)有算法的其他代碼,算法的自主性自為性便失去了載體,也根本沒有機(jī)會(huì)。第三,支持算法偏見和規(guī)則影響力的不是算法本身,而是對(duì)算法的運(yùn)用。如前所述,算法的個(gè)體應(yīng)用不會(huì)對(duì)其他人群產(chǎn)生影響,算法的平臺(tái)化運(yùn)用則是促成算法影響力的機(jī)會(huì)和力量,無論是算法偏見、算法規(guī)則,還是其他。[34]當(dāng)然,算法的平臺(tái)運(yùn)用并非只是出租車司機(jī)頭腦里的交通路線運(yùn)籌,而是更廣泛的行動(dòng)關(guān)系(復(fù)雜算法、網(wǎng)絡(luò)算法),一方面是面對(duì)問題的技術(shù)解決方案,另一方面是平臺(tái)組織與技術(shù)解決方案的關(guān)系體系。同時(shí),由于技術(shù)解決方案和平臺(tái)都是面向用戶的,龐大的用戶規(guī)模又具有社會(huì)性,最終形成的是技術(shù)解決方案、平臺(tái)組織、社會(huì)之間的不僅關(guān)涉生產(chǎn)效率,還牽扯社會(huì)平等的綜合關(guān)系體系。
如此,算法治理的方向選擇直接擺在了我們的面前。第一,算法不具有自由意志,算法是人類行動(dòng)的產(chǎn)出,沒有脫離人類行動(dòng)的算法,從最簡(jiǎn)單的算法到最復(fù)雜的算法,都是如此。因此,算法治理是針對(duì)人類生產(chǎn)算法的行動(dòng)治理。把算法偏見歸咎于算法本身,無異于同風(fēng)車作戰(zhàn)。有人依據(jù)算法承擔(dān)的任務(wù)將算法在人類行動(dòng)里承擔(dān)的角色劃分為純粹執(zhí)行者、輔助決策者、獨(dú)立決策者。[35]這一劃分看似來自實(shí)踐,實(shí)際上卻對(duì)算法自由意志的設(shè)定含混不清,一方面假設(shè)算法是人類產(chǎn)品,另一方面又假設(shè)算法具有自主自為性。
第二,算法治理一方面是針對(duì)算法偏見的治理,另一方面也是針對(duì)算法平臺(tái)運(yùn)用的治理。算法治理的目標(biāo),前者是為算法糾偏,后者則是約束算法運(yùn)用的方向和范圍,以期最大限度地減少算法偏見帶來的算法侵害,維系和促進(jìn)社會(huì)平等。在現(xiàn)實(shí)生活中,算法的主要生產(chǎn)者是平臺(tái),制造算法影響力的也是平臺(tái),是故,算法治理便可以匯聚為針對(duì)平臺(tái)的算法治理。
在中文語境中,算法治理有雙重含義。第一,用算法進(jìn)行治理(governance by algorithm)。第二,對(duì)算法進(jìn)行治理(governance to algorithm)。英文語境卻沒有算法治理(algorithm governance)概念,也很難找到一個(gè)對(duì)應(yīng)的概念,維基百科中甚至沒有相應(yīng)詞條??v觀中文文獻(xiàn)對(duì)算法治理的探討,大多探討的是第二重含義。在接下來的討論中,我們也在第二種意義上使用算法治理,在給定算法不具有自由意志、且不具有自主自為性的前提下,探討針對(duì)算法偏見帶來的算法侵害之治理行動(dòng)。
算法治理發(fā)端于美國,[36]美國如何應(yīng)對(duì)算法侵害呢?直接的答案是,問責(zé)模式,[37]問責(zé)對(duì)象是有潛力讓算法產(chǎn)生廣泛且深刻影響的算法生產(chǎn)者和使用者,問責(zé)內(nèi)容包括算法內(nèi)容和非算法流程,問責(zé)的主體是政府或第三方。
2017年1月12日,美國計(jì)算機(jī)協(xié)會(huì)下屬的美國公共政策委員會(huì)(USACM)發(fā)布的《算法透明度和責(zé)任聲明》指出:“生活中無處不在的算法促使我們應(yīng)該專注于解決與算法設(shè)計(jì)和技術(shù)相關(guān)的挑戰(zhàn),并從一開始就防止偏見。”圍繞算法公平,從建立算法公平意識(shí)到實(shí)現(xiàn)算法公平的算法檢驗(yàn),這項(xiàng)《聲明》提出了7項(xiàng)促進(jìn)算法透明度和可靠性的原則,建立了算法治理的外部問責(zé)和控制模式。
在州、市一級(jí)的算法治理中,2017年12月,紐約市議會(huì)通過了第一部針對(duì)人工智能監(jiān)管的《政府部門自動(dòng)決策系統(tǒng)法案》(Auto Decision System Task Force Law),要求成立包括自動(dòng)化決策系統(tǒng)專家和受自動(dòng)化決策系統(tǒng)影響的公民組織代表在內(nèi)的工作組,對(duì)市政機(jī)構(gòu)運(yùn)用自動(dòng)決策算法的公平性、問責(zé)性和透明度等進(jìn)行監(jiān)督,由此開啟了算法治理外部問責(zé)與控制的實(shí)踐模式。
2019年4月,美國國會(huì)參眾兩院通過了《算法問責(zé)法案》,授權(quán)美國聯(lián)邦貿(mào)易委員會(huì)(FTC)要求并監(jiān)督企業(yè)對(duì)其人工智能系統(tǒng)的“準(zhǔn)確性、公平性、偏見、歧視、隱私和安全性”等問題進(jìn)行自我審查,且約定這一法案適用于年收入超過5000萬美元或擁有超過100萬用戶數(shù)據(jù)的數(shù)據(jù)代理商和企業(yè)。由此建立了治理對(duì)象的范圍。
2021年5月,美國參議院引入《算法正義與在線平臺(tái)透明度法案》,要求規(guī)范算法過程,進(jìn)而保護(hù)個(gè)人信息,保障個(gè)人特征不因算法而受到歧視?!斗ò浮方⒘怂惴ò踩院陀行詷?biāo)準(zhǔn),對(duì)歧視的判斷標(biāo)準(zhǔn)進(jìn)行了詳細(xì)解釋,還要求在線平臺(tái)為非算法流程承擔(dān)責(zé)任,包括算法運(yùn)行的可靠性、個(gè)人數(shù)據(jù)的可攜帶性和將個(gè)人數(shù)據(jù)作為司法證據(jù)的可實(shí)現(xiàn)性,由此建立了將個(gè)人數(shù)據(jù)證據(jù)化、將算法偏見歸責(zé)化的邏輯閉環(huán)。
簡(jiǎn)單地說,美國把因算法偏見帶來的不良社會(huì)后果直接歸責(zé)到算法生產(chǎn)者和使用者,而沒有歸咎于算法自身。
在數(shù)字時(shí)代的三方國際力量中,歐盟是重要一方。盡管歐盟沒有針對(duì)算法的專門法律,可針對(duì)數(shù)據(jù)保護(hù)的一系列法律在實(shí)踐中也直接約束了算法的生產(chǎn)和運(yùn)用。1995年頒布的《數(shù)據(jù)保護(hù)指令》確認(rèn)了數(shù)據(jù)主體的權(quán)利、數(shù)據(jù)保護(hù)的監(jiān)管機(jī)構(gòu),對(duì)數(shù)據(jù)的跨國流通等也作出詳細(xì)規(guī)定,建立了以數(shù)據(jù)保護(hù)為出發(fā)點(diǎn)的算法治理的邏輯起點(diǎn)。2000年頒布的《電子商務(wù)指令》則規(guī)范了數(shù)字服務(wù)提供者的責(zé)任。2015年歐盟進(jìn)一步出臺(tái)的《數(shù)字單一市場(chǎng)戰(zhàn)略》雖不具有法律效應(yīng),卻在理論上奠定了針對(duì)數(shù)字市場(chǎng)的監(jiān)管框架,把算法產(chǎn)出(如搜索結(jié)果、廣告鏈接等)透明度,數(shù)據(jù)流動(dòng)的組織間關(guān)系、數(shù)據(jù)流動(dòng)的意愿與約束等都納入市場(chǎng)監(jiān)管范圍,為算法治理指出了方向。2017年頒行的《機(jī)器人民事責(zé)任法案》則把算法偏見帶來的算法侵害,如對(duì)個(gè)人決策帶來的負(fù)面影響,對(duì)政府行政、司法、公共政策帶來的不利影響等,明確歸責(zé)于算法的生產(chǎn)者和使用者,并且在道德層面對(duì)算法生產(chǎn)和使用提出了要求。由此,我們觀察到,歐盟的算法治理從守勢(shì)的數(shù)據(jù)保護(hù)即通過保護(hù)數(shù)據(jù)來保障權(quán)益也轉(zhuǎn)向了不得不面對(duì)的算法侵害,并與美國一致,將算法侵害歸責(zé)到算法的生產(chǎn)者和使用者,而不是算法自身。
歐盟2018年頒布的《通用數(shù)據(jù)保護(hù)條例》(GDPR)將自1995年以來零碎的算法治理理念具體化為數(shù)據(jù)保護(hù)規(guī)制的重要組成部分,更具體地定義了數(shù)據(jù),對(duì)數(shù)據(jù)的提供、匯集等作了更明確的規(guī)定,還詳細(xì)約定了數(shù)據(jù)主體的數(shù)據(jù)訪問權(quán)、糾正權(quán)、被遺忘權(quán)、限制處理權(quán)、反對(duì)權(quán)、拒絕權(quán)和自主決定權(quán)等權(quán)利,更對(duì)數(shù)據(jù)的處理和運(yùn)用進(jìn)行了嚴(yán)格的限制,明確禁止可能造成算法侵害的數(shù)據(jù)運(yùn)用,如揭示種族或民族出身,揭示政治觀點(diǎn)、宗教或哲學(xué)信仰,刻畫自然人健康、性取向等。歐洲議會(huì)秘書處2019年發(fā)布的《算法問責(zé)和透明治理框架》(A governance framework for algorithmic accountability and transparency)提出了負(fù)責(zé)任的研究與創(chuàng)新(RRI)概念,從道德、法律到實(shí)踐,明確了算法治理的問責(zé)框架。歐盟委員會(huì)2020年提案的《數(shù)字服務(wù)法案》和《數(shù)字市場(chǎng)法案》在數(shù)字治理上則進(jìn)一步向美國靠攏,強(qiáng)化了算法生產(chǎn)者和使用者的責(zé)任;2021年提案的《人工智能法案》則區(qū)分了規(guī)則算法(rule-based algorithms)和學(xué)習(xí)算法(learning algorithms),建立了基于算法風(fēng)險(xiǎn)的算法治理改進(jìn)路徑,再次強(qiáng)調(diào)算法生產(chǎn)者和使用者的責(zé)任,強(qiáng)調(diào)問責(zé)機(jī)制。
總體上看,雖然歐盟與美國一樣在形成算法治理的邏輯閉環(huán),卻在實(shí)踐中從數(shù)據(jù)保護(hù)入手,建立了保護(hù)個(gè)體、組織不受算法侵害的防御性治理框架和法律制度,在算法治理理念上則已向美國靠攏,即采用政府和第三方問責(zé)模式治理算法可能帶來的侵害,且將算法侵害責(zé)任歸咎于算法生產(chǎn)者和使用者。
到這里為止,其實(shí)我們需要問一個(gè)問題,為什么美國的算法治理要采用問責(zé)模式?為什么歐盟會(huì)向美國靠攏也采用問責(zé)模式?前一節(jié)其實(shí)已經(jīng)回答了這個(gè)問題的技術(shù)部分,即,算法的復(fù)雜性使得算法自身始終處于迭代之中。換句話說,在生產(chǎn)和生活中運(yùn)行的算法不是一個(gè)確定現(xiàn)象,而是一個(gè)動(dòng)態(tài)。譬如,人們熟悉且經(jīng)常使用的乘用車即時(shí)導(dǎo)航系統(tǒng)。無論采用哪一家數(shù)字平臺(tái)提供的導(dǎo)航系統(tǒng),都會(huì)有一項(xiàng)服務(wù):道路交通動(dòng)態(tài)實(shí)時(shí)更新。在從A點(diǎn)駛向B點(diǎn)的進(jìn)程中,只要出現(xiàn)道路動(dòng)態(tài)變化,系統(tǒng)都會(huì)提醒您前方可能的優(yōu)化備選路線和道路上的事故或擁堵動(dòng)態(tài),呈現(xiàn)在用戶屏幕上的、變化著的、從綠色到深紅色的道路標(biāo)記變化正是實(shí)時(shí)計(jì)算的產(chǎn)出,也意味著算法在被使用進(jìn)程中的自我迭代。
算法的實(shí)時(shí)迭代意味著對(duì)算法代碼進(jìn)行實(shí)時(shí)督導(dǎo)(monitoring)和審查(auditing)需要具備與算法生產(chǎn)和使用相當(dāng)或超越的技術(shù)能力。僅此,便意味著在技術(shù)上不可行;或者即使可行,至少也是艱難的和代價(jià)高昂的。對(duì)超出能力范圍的技術(shù)過程進(jìn)行監(jiān)管,需要跳出技術(shù)和技術(shù)過程本身,尋求算法治理的關(guān)鍵節(jié)點(diǎn)和效率節(jié)點(diǎn),正如俗語說的,打蛇要打在七寸上。
那么,算法治理的關(guān)鍵節(jié)點(diǎn)在哪里呢?算法的生產(chǎn)是一個(gè)過程,從算法設(shè)計(jì)、代碼編寫到算法產(chǎn)品;算法的應(yīng)用也是一個(gè)過程,從算法部署、算法迭代到算法產(chǎn)出。如果沿著算法的生產(chǎn)與應(yīng)用邏輯和流程進(jìn)行治理,可以稱之為過程治理。一旦算法投入應(yīng)用并達(dá)到足夠的規(guī)模,算法便會(huì)產(chǎn)生相應(yīng)的社會(huì)后果,包括算法偏見。如果針對(duì)算法的產(chǎn)出展開治理,可以稱之為結(jié)果治理。算法治理的社會(huì)特征在于過程治理的不可行性或代價(jià)高昂以及結(jié)果治理的簡(jiǎn)單易行,是故,算法治理的關(guān)鍵節(jié)點(diǎn)便已不言而喻,那就是,針對(duì)算法結(jié)果進(jìn)行治理。
算法問責(zé)便是對(duì)結(jié)果的治理,也顯然采用了刪繁就簡(jiǎn)原則。第一,在法律上約定算法可追責(zé)性。要求算法透明、算法解釋、數(shù)據(jù)證據(jù)化等,正是為結(jié)果可追責(zé)提供事實(shí)前提和法理邏輯前提。第二,在規(guī)則上約定算法責(zé)任實(shí)體性。盡管算法即規(guī)則,可算法規(guī)則只適用于計(jì)算過程,不適用于外化的社會(huì)過程,算法生產(chǎn)者和使用者才是算法的責(zé)任主體,即算法的責(zé)任主體是人或人的集合體,不是算法自身。一些人以為算法的行動(dòng)責(zé)任已經(jīng)向機(jī)器轉(zhuǎn)移,事實(shí)上并沒有,機(jī)器行動(dòng)依然是人類行動(dòng)的一部分或人類行動(dòng)的目的性延伸。如果我們把算法向人工智能甚至通用人工智能領(lǐng)域的拓展理解為人類對(duì)效率追求的時(shí)代發(fā)展,在提高效率、降低成本的引導(dǎo)下,即使人類會(huì)忽視算法偏見的存在甚至助長(zhǎng)算法偏見,算法也依然只是算法,算法的自主性是人類賦予甚至縱容的自主性,在本質(zhì)上還是人類的行動(dòng)選擇,而不是機(jī)器的主動(dòng)侵入。讓機(jī)器為人類的選擇偏見背鍋是人類卸責(zé)的行動(dòng),不是機(jī)器的行動(dòng)。
有鑒于此,作為數(shù)字時(shí)代三方國際力量之一的中國,又在如何進(jìn)行算法治理呢?從1994年制定第一部相關(guān)行政指令《計(jì)算機(jī)信息系統(tǒng)安全保護(hù)條例》到目前,中國共出臺(tái)了60多部相關(guān)法律法規(guī)和行政指令。從時(shí)間順序來看,可以認(rèn)為中國的算法治理是從總體安全出發(fā)的。
雖然早在2000年9月國務(wù)院就頒布了《互聯(lián)網(wǎng)信息服務(wù)管理辦法》,可該《辦法》更多是行政許可對(duì)服務(wù)內(nèi)容相關(guān)的約定,屬于數(shù)據(jù)經(jīng)營監(jiān)管類的行政指令。進(jìn)入算法治理時(shí)代以來,第一部相關(guān)法律《中華人民共和國網(wǎng)絡(luò)安全法》(以下簡(jiǎn)稱《網(wǎng)絡(luò)安全法》)雖不直接涉及算法,卻奠定了算法治理的基本方向,即以安全為依歸。2017年6月實(shí)施的《網(wǎng)絡(luò)安全法》的焦點(diǎn)是網(wǎng)絡(luò)空間安全,也可以被理解為網(wǎng)絡(luò)環(huán)境安全。網(wǎng)絡(luò)安全也被廣泛傳播為國土安全的拓展,即將網(wǎng)絡(luò)空間作為國土空間的一部分,從守護(hù)安全出發(fā)強(qiáng)調(diào)數(shù)字基礎(chǔ)設(shè)施、網(wǎng)絡(luò)運(yùn)行、網(wǎng)絡(luò)信息的安全與保障。第二部相關(guān)法律是2019年1月實(shí)施的《中華人民共和國電子商務(wù)法》,焦點(diǎn)在于交易安全,部分內(nèi)容涉及對(duì)算法結(jié)果的治理,如支付指令發(fā)生錯(cuò)誤時(shí)的處理等,卻沒有專門涉及算法侵害的內(nèi)容。2019年10月實(shí)施的《兒童個(gè)人信息網(wǎng)絡(luò)保護(hù)規(guī)定》雖聚焦于個(gè)人信息,卻依然強(qiáng)調(diào)了信息安全,這里也出現(xiàn)了一個(gè)新的動(dòng)向,即對(duì)兒童信息相關(guān)運(yùn)營商的責(zé)任約定。2020年3月實(shí)施的《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》依然是安全導(dǎo)向的,強(qiáng)調(diào)網(wǎng)絡(luò)信息生產(chǎn)與發(fā)布、網(wǎng)絡(luò)內(nèi)容服務(wù)的無害性,即內(nèi)容安全,只有在關(guān)于內(nèi)容服務(wù)的第十二條涉及了算法治理,不過,依然是從內(nèi)容安全出發(fā)的。第十二條規(guī)定:“網(wǎng)絡(luò)信息內(nèi)容服務(wù)平臺(tái)采用個(gè)性化算法推薦技術(shù)推送信息的,應(yīng)當(dāng)設(shè)置符合本規(guī)定第十條、第十一條要求的推薦模型,建立健全人工干預(yù)和用戶自主選擇機(jī)制。”第十條、第十一條規(guī)定的都是內(nèi)容屬性,而不涉及算法侵害。2021年9月實(shí)施的《中華人民共和國數(shù)據(jù)安全法》則將網(wǎng)絡(luò)安全進(jìn)一步延伸到數(shù)據(jù)領(lǐng)域,焦點(diǎn)依然是安全,即在總體國家安全觀的指導(dǎo)下建立健全數(shù)據(jù)安全治理體系。
2021年11月實(shí)施的《中華人民共和國個(gè)人信息保護(hù)法》(以下簡(jiǎn)稱《個(gè)人信息保護(hù)法》)才真正涉及算法治理,出現(xiàn)了與歐盟GDPR相似的內(nèi)容,不過,安全指向依然清晰明確。個(gè)人信息權(quán)益、個(gè)人信息處理及個(gè)人信息跨境流動(dòng),都清晰地指向了個(gè)人信息安全。值得指出的是,其中也有一個(gè)清晰的轉(zhuǎn)向,即在知情同意的意義上,明確了個(gè)人信息的個(gè)人權(quán)屬性,區(qū)分了一般個(gè)人信息和敏感個(gè)人信息,說明了個(gè)人在個(gè)人信息處理中的權(quán)利,也規(guī)定了違反個(gè)人信息處理規(guī)則的法律責(zé)任,如明確涉及算法的第七十條規(guī)定“個(gè)人信息處理者違反本法規(guī)定處理個(gè)人信息,侵害眾多個(gè)人的權(quán)益的,人民檢察院、法律規(guī)定的消費(fèi)者組織和由國家網(wǎng)信部門確定的組織可以依法向人民法院提起訴訟”。問題是,《個(gè)人信息保護(hù)法》依然只是原則性規(guī)定,還沒有完成個(gè)人信息保護(hù)的司法證據(jù)化約定。
2022年3月實(shí)施的《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》(以下簡(jiǎn)稱《規(guī)定》)才是第一部針對(duì)算法的管理規(guī)定?!兑?guī)定》雖然只是四部委的行政指令,卻有了針對(duì)算法黑箱、算法歧視、信息繭房、輿論操控、不正當(dāng)競(jìng)爭(zhēng)等算法侵害的規(guī)范。與既往的相關(guān)法律和行政指令不同,《規(guī)定》明確了信息服務(wù)規(guī)范、用戶權(quán)益保護(hù)、監(jiān)督管理責(zé)任和法律責(zé)任,將監(jiān)管責(zé)任主體明確為四部委(網(wǎng)信辦、工信部、公安部、市場(chǎng)監(jiān)管總局),并將相關(guān)違規(guī)的法律責(zé)任監(jiān)管納入國家相關(guān)部門管理之中。不過,聯(lián)系2021年9月國家互聯(lián)網(wǎng)信息辦公室、中央宣傳部等九部門聯(lián)合發(fā)布的《關(guān)于加強(qiáng)互聯(lián)網(wǎng)信息服務(wù)算法綜合治理的指導(dǎo)意見》(以下簡(jiǎn)稱《指導(dǎo)意見》)可以看出,《規(guī)定》依然是一部以安全為導(dǎo)向的行政指令,因?yàn)椤吨笇?dǎo)意見》中明確指出要堅(jiān)持正確導(dǎo)向、依法治理、風(fēng)險(xiǎn)防控、權(quán)益保障、技術(shù)創(chuàng)新等五項(xiàng)基本原則,要“利用三年左右時(shí)間,逐步建立治理機(jī)制健全、監(jiān)管體系完善、算法生態(tài)規(guī)范的算法安全綜合治理格局”的主要目標(biāo)。即使如此,遺憾的是,到此為止,中國的算法治理只有目標(biāo),相關(guān)法律法規(guī)尚沒有像歐美那樣形成從治理理念到判例實(shí)踐的閉環(huán),其中,尤其是還看不出算法治理的法治理念,更沒完成算法治理的司法證據(jù)化約定。
如果說算法偏見帶來的算法侵害是算法治理面對(duì)的核心問題;那么,在給定算法偏見人因化或組織化,給定算法技術(shù)處于不斷迭代且動(dòng)態(tài)演化的場(chǎng)景下,實(shí)施算法治理的行動(dòng)選擇其實(shí)不多。
第一,鑒于算法的技術(shù)復(fù)雜性和動(dòng)態(tài)性,約定算法透明是讓算法可以作為算法審查[38]和追責(zé)的前提,卻不是實(shí)施算法監(jiān)測(cè)的理由。如前所述,算法的技術(shù)迷思已經(jīng)宣告了算法監(jiān)測(cè)的低效率和高成本,因此,過程治理不是算法治理的可選項(xiàng)??墒?,針對(duì)過程的治理要求卻是其他治理選項(xiàng)的必備條件。
第二,如果我們把算法安全風(fēng)險(xiǎn)理解為算法侵害的一個(gè)類型,則結(jié)果治理即使不是算法治理的唯一選擇,也是有效選擇。防范風(fēng)險(xiǎn)是保障安全的一種策略,治理侵害則是防范風(fēng)險(xiǎn)的明智之舉。在算法無處不在且覆蓋廣泛而深刻的數(shù)字時(shí)代,算法已經(jīng)成為人類生產(chǎn)和生活的環(huán)境,這也意味著算法風(fēng)險(xiǎn)時(shí)時(shí)刻刻無處不在,而不只是學(xué)者們列出的個(gè)體、組織、國家,政治、經(jīng)濟(jì)、社會(huì)的風(fēng)險(xiǎn)。對(duì)時(shí)時(shí)刻刻無處不在的風(fēng)險(xiǎn),優(yōu)化的行動(dòng)選擇是治理出現(xiàn)的侵害并將其作為未來可能的風(fēng)險(xiǎn)源,而不是治理出現(xiàn)概率極小的、可能出現(xiàn)侵害的預(yù)設(shè)風(fēng)險(xiǎn)。
第三,算法侵害的人因化意味著治理行動(dòng)的對(duì)象是算法的生產(chǎn)者和使用者,而不是算法。在相當(dāng)長(zhǎng)一段時(shí)間內(nèi),支持通用人工智能的算法還不會(huì)出現(xiàn),算法依然是人類的產(chǎn)品,即使算法具備學(xué)習(xí)能力,第一行代碼依然是人類編寫的。因此,算法治理的關(guān)鍵是約束算法生產(chǎn)者寫對(duì)第一行代碼,約束算法使用者用對(duì)第一行代碼,問責(zé)模式至少是當(dāng)下可行且有效的治理模式。
第四,鑒于算法的生產(chǎn)者和使用者以及對(duì)人類構(gòu)成廣泛且深刻影響的主要是平臺(tái)組織,把算法治理納入平臺(tái)治理、作為平臺(tái)治理的一項(xiàng)內(nèi)容,在形成成熟的算法治理進(jìn)程中至少可以作為一項(xiàng)過渡性的行動(dòng)選擇。的確,平臺(tái)組織匯集了人類的代碼精英,[39]用問責(zé)模式敦促平臺(tái)組織約束代碼精英在代碼生產(chǎn)中融入人類的積極價(jià)值觀,融入人類共同的倫理,[40]融入保障人類平等的相關(guān)法律和法規(guī),可以從源頭治理算法偏見,預(yù)防算法侵害,進(jìn)而最大限度地降低算法風(fēng)險(xiǎn)。
結(jié)論
伴隨數(shù)字連接邁向人類整體連接的是各類數(shù)字終端包括移動(dòng)終端和傳感器的時(shí)時(shí)刻刻無處不在,如此廣泛且深刻的數(shù)字連接因連接的“節(jié)點(diǎn)—中心”結(jié)構(gòu)而形成的是數(shù)據(jù)的匯流與應(yīng)用的分發(fā)模式。在匯流與分發(fā)之間,算法成為運(yùn)用數(shù)據(jù)資源促進(jìn)人類發(fā)展和平等的關(guān)鍵所在。
事實(shí)是,算法在帶來數(shù)字紅利的同時(shí),也在帶來算法侵害。人們關(guān)注算法侵害不是因?yàn)樗惴ㄇ趾Ρ旧?,而是因?yàn)樗惴ɡ字绊憣?duì)人群的覆蓋。算法古已有之,算法侵害古已有之,之所以沒有形成廣泛的甚至令人焦慮的關(guān)注是因?yàn)樗簧婕按蠖鄶?shù)乃至人類社會(huì)整體。如今,數(shù)字連接已經(jīng)覆蓋了世界人口的67%,覆蓋了中國的幾乎所有家庭,算法侵害無孔不入,有機(jī)會(huì)讓每一位處在數(shù)字網(wǎng)絡(luò)中的人感同身受,人們關(guān)注算法侵害正是源于算法影響的廣泛性和深刻性,人們關(guān)注算法治理也源于人們?cè)噲D阻止算法侵害的普遍發(fā)生。
如果說算法侵害是算法帶來的不利后果,學(xué)者們則用更多源于事實(shí)的歸納來具體化這樣的侵害,如算法歧視、算法偏見、算法共謀、算法壟斷、算法黑箱、算法遮蔽、算法短視、算法霸權(quán)、算法操縱、算法劫持、算法剝削等。算法給人們帶來的負(fù)面影響還可以列出更多,甚至是一個(gè)無窮列表。試圖阻止算法具體的負(fù)面影響并不足以防止算法侵害。
算法侵害源于算法偏見??墒撬惴ㄆ姴皇撬惴ㄗ约旱钠姡侨祟惼娫谒惴ㄖ械脑佻F(xiàn)甚至放大。在通用人工智能出現(xiàn)之前(甚至出現(xiàn)之后),盡管算法已經(jīng)從人類的簡(jiǎn)單計(jì)算活動(dòng)邁向機(jī)器的自編碼,算法始終還是人類的產(chǎn)品,而不是獨(dú)立于人類的、具有自由意志的、與人類并行的客觀存在。沒有人類輸入的第一行代碼,便不會(huì)有動(dòng)態(tài)演化的機(jī)器算法。如此,阻止乃至防止算法偏見還需首先糾正人類的偏見。
針對(duì)算法偏見來糾正人類的偏見有兩個(gè)基本路徑,一是針對(duì)偏見發(fā)生的過程,二是針對(duì)偏見帶來的后果。落實(shí)到算法治理中,前者是過程治理,后者是結(jié)果治理。算法的技術(shù)迷思決定了過程治理是低效率的和高成本的,算法的動(dòng)態(tài)性也決定了試圖通過過程治理來預(yù)防算法侵害無異于與風(fēng)車作戰(zhàn)。針對(duì)算法偏見帶來的結(jié)果進(jìn)行治理在理論上是更加有效的行動(dòng)選擇。
在數(shù)字時(shí)代的國際三方中,美國的算法治理采用了算法侵害的事后問責(zé)模式,同時(shí),也為問責(zé)實(shí)現(xiàn)如便于算法審查作了算法透明、數(shù)據(jù)證據(jù)化等約定,形成了從算法治理法理到實(shí)踐的邏輯閉環(huán)。歐盟的算法治理從保護(hù)數(shù)據(jù)的守勢(shì)入手,也在邁向美國的算法問責(zé)模式。中國的算法治理以網(wǎng)絡(luò)安全為起點(diǎn),以總體安全為目標(biāo),尚未呈現(xiàn)清晰的法理,在實(shí)踐上頒布了一些點(diǎn)位性規(guī)則,卻還沒有形成以法理為依據(jù)、以社會(huì)平等為依歸的算法治理邏輯。我們認(rèn)為,針對(duì)算法偏見的事后問責(zé)或許是殊途同歸的有效選擇。
(本文系國家社科基金重大項(xiàng)目“新技術(shù)應(yīng)用背景下數(shù)字社會(huì)特征研究”子課題“數(shù)字社會(huì)的國家治理研究”成果的一部分,項(xiàng)目編號(hào):19ZDA143)
注釋
[1]U.S. Congress; Office of Technology Assessment, Federal Government Information Technology: Electronic Surveillance and Civil Liberties, U.S. Government Printing Office, 1985, pp. 3-4, 14-15.
[2]U.S. Congress; Office of Technology Assessment, Federal Government Information Technology: Electronic Record Systems and Individual Privacy, U.S. Government Printing Office, 1986, pp. 89-95.
[3]Sterling, T. D., "Guidelines for Humanizing Computerized Information Systems: A Report from Stanley House", Communications of the ACM, 1974, 17(11) , pp. 609-613.
[4]姜李丹、薛瀾:《我國新一代人工智能治理的時(shí)代挑戰(zhàn)與范式變革》,《公共管理學(xué)報(bào)》,2022年第2期。
[5]Chabert, J. L., A History of Algorithms: From the Pebble to the Microchip, Springer Science & Business Media, 2012, pp. 7–8.
[6]Aaboe, A., Episodes from the Early History of Astronomy, New York: Springer, 2001, pp. 40–62.
[7]陳久金、楊怡:《中國古代的天文與歷法》,北京:商務(wù)印書館,1998年。
[8]邱澤奇:《算法向善選擇背后的權(quán)衡與博弈》,《人民論壇》,2021年2月中下期。
[9]肖紅軍:《算法責(zé)任:理論證成、全景畫像與治理范式》,《管理世界》,2022年第4期;陽鎮(zhèn)、陳勁:《算法治理:成為責(zé)任型數(shù)智企業(yè)》,《清華管理評(píng)論》,2021年第4期;丁曉東:《算法與歧視:從美國教育平權(quán)案看算法倫理與法律解釋》,《中外法學(xué)》,2017年第6期。
[10]孟天廣、李珍珍:《治理算法:算法風(fēng)險(xiǎn)的倫理原則及其治理邏輯》,《學(xué)術(shù)論壇》,2022年第1期;張愛軍:《“算法利維坦”的風(fēng)險(xiǎn)及其規(guī)制》,《探索與爭(zhēng)鳴》,2021年第1期;賈開:《人工智能與算法治理研究》,《中國行政管理》,2019年第1期。
[11]Ausiello, G. and Petreschi, R., The Power of Algorithms: Inspiration and Examples in Everyday Life, Springer Science & Business Media, 2013.
[12]Beer, D., "The Social Power of Algorithms", Information, Communication & Society, 2017, 20(1), pp. 1–13.
[13]張愛軍、王首航:《算法:一種新的權(quán)力形態(tài)》,《治理現(xiàn)代化研究》,2020年第1期。
[14][29]Lessig L., Code: And Other Laws of Cyberspace (New edition), New York: Basic Books, 1999. 第二版于2006年出版,基于第二版的中文版于2018年出版。參見[美]勞倫斯·萊斯格:《代碼2.0:網(wǎng)絡(luò)空間中的法律(修訂版)》,北京:清華大學(xué)出版社,2018年。
[15]Micklitz, H. W.; Pollicino O.; Reichman A., et al., Constitutional Challenges in The Algorithmic Society, New York: Cambridge University Press, 2022.
[16]參見國際電聯(lián)(ITU)網(wǎng)站:https://www.itu.int/en/ITU-D/Statistics/Pages/stat/default.aspx.
[17]中國互聯(lián)網(wǎng)絡(luò)信息中心:《第49次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,2022年。
[18]參見https://www.domo.com/learn/infographic/data-never-sleeps-9.
[19][21]主要依據(jù)綜合自中國信通院:《中國數(shù)字經(jīng)濟(jì)發(fā)展白皮書》,2022年;中國互聯(lián)網(wǎng)絡(luò)信息中心:《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,2022年。對(duì)兩類報(bào)告均參考了其初期和近兩年的數(shù)據(jù)。
[20]李稻葵在2021年亞洲博鰲論壇上的發(fā)言,參見媒體報(bào)道。
[22]Referred to "Al-Khwarizmi biography," www-history.mcs.st-andrews.ac.uk, Archived from the original on August 2, 2019. Retrieved May 3, 2017.
[23][26]Knuth, D., The Art of Computer Programming. Volume 1: Fundamental Algorithms, New York: Addison-Wesley Professional, 1997.
[24]Harel D. and Feldman. Y., Algorithmics: The Spirit of Computing (3rd ed), Harlow: Addison-Wesley, 2004.
[25]Butler, D., "Web Data Predict Flu", Nature, 2008, 456 (7220), pp. 287–288.
[27]Stinson C., "Algorithms Are Not Neutral: Bias in Collaborative Filtering", ArXiv, 2021. 2105.01031.
[28]孟天廣、李珍珍:《治理算法:算法風(fēng)險(xiǎn)的倫理原則及其治理邏輯》,《學(xué)術(shù)論壇》,2022年第1期。
[30]賈開、薛瀾:《第四次工業(yè)革命與算法治理的新挑戰(zhàn)》,《清華管理評(píng)論》,2021年第4期。
[31]張愛軍:《“算法利維坦”的風(fēng)險(xiǎn)及其規(guī)制》,《探索與爭(zhēng)鳴》,2021年第1期。
[32][33]Papakyriakopoulos O., and Mboya A. M., "Beyond Algorithmic Bias: A Socio-Computational Interrogation of the Google Search by Image Algorithm", ArXiv, 2021, 2105.12856.
[34]算法不只是因偏見帶來侵害,更主要還是因效率帶來算法紅利,算法紅利是數(shù)字紅利的核心。人類對(duì)數(shù)字技術(shù)的追逐正是由于數(shù)字紅利的吸引。參見邱澤奇、張樹沁、劉世定等:《從數(shù)字鴻溝到紅利差異——互聯(lián)網(wǎng)資本的視角》,《中國社會(huì)科學(xué)》,2016年第10期。算法紅利不在本文討論范圍,故略去。
[35]肖紅軍:《算法責(zé)任:理論證成、全景畫像與治理范式》,《管理世界》,2022年第4期。
[36]許可:《馴服算法:算法治理的歷史展開與當(dāng)代體系》,《華東政法大學(xué)學(xué)報(bào)》,2022年第1期。
[37]孫逸嘯、鄭浩然:《算法治理的域外經(jīng)驗(yàn)與中國進(jìn)路》,《信息安全研究》,2021年第1期。
[38]Shen, H.; DeVos, A.; Eslami, M. et al., "Everyday Algorithm Auditing: Understanding the Power of Everyday Users in Surfacing Harmful Algorithmic Behaviors", ArXiv, 2021, 2105.02980.
[39]Burrell, J. and Fourcade, M., "The Society of Algorithms", Annual Review of Sociology, 2021, 47(1), pp. 213–237.
[40]Timcke, S., Algorithms and the End of Politics: How Technology Shapes 21st Century American Life, Bristol University Press, 2021.
責(zé) 編/陳璐穎
邱澤奇,北京大學(xué)博雅特聘教授、中國社會(huì)與發(fā)展研究中心主任、數(shù)字治理研究中心主任、社會(huì)學(xué)系教授,教育部“長(zhǎng)江學(xué)者”特聘教授。研究方向?yàn)閿?shù)字社會(huì)、數(shù)字治理。主要著作有《邊區(qū)企業(yè)的發(fā)展歷程:國有大企業(yè)和企業(yè)型城市的集體企業(yè)》《中國大陸社會(huì)分層狀況的變遷》《社會(huì)學(xué)是什么?》《費(fèi)孝通與江村》《朋友在先——中國對(duì)烏干達(dá)衛(wèi)生發(fā)展援助案例研究》《技術(shù)與組織:學(xué)科脈絡(luò)與文獻(xiàn)》等。
The Technical Myth and Action Choice of Algorithmic Governance
Qiu Zeqi
Abstract: Due to their pervasive and profound influence on the human society and life, algorithms have become an artificial environment comparable to the natural environment. Their advantages and disadvantages as well as the continuous emergence of algorithmic infringement have pushed mankind into the era of algorithmic governance. The influence of algorithms has been increasing, so has their complexity. Algorithms have evolved from the ancient calculation to the self-iteration and evolution of the real-time relationship model, which makes the process governance of algorithms not only technically infeasible, but also costly in management. The exploration and practice in the field of algorithmic governance in China, the United States and Europe show different patterns. The United States has formed an accountability model dominated by the government and the third party with an aim to prevent algorithmic infringement; focusing on data protection, Europe gradually follow the example of the accountability model of the United States; China implements governance from the perspective of Internet security, but has not yet established an algorithmic governance model with a legal logic and clear operation path. Moving towards the accountability model seems to be a possible and effective action choice for China's algorithmic governance.
Keywords: algorithmic governance, algorithmic technology, accountability model