隨著大數(shù)據(jù)和機(jī)器學(xué)習(xí)算法的普及,社會(huì)科學(xué)的量化研究也逐漸試圖采用以人工智能和數(shù)據(jù)挖掘?yàn)榛A(chǔ)的新興研究手段,來(lái)處理過(guò)去無(wú)法處理或者忽視了的研究議題。在此背景下,如何處理好人工智能技術(shù)與社會(huì)科學(xué)研究的關(guān)系就顯得尤為重要。人心可以計(jì)算和測(cè)量嗎?怎么用人工智能測(cè)算人的情感和態(tài)度?這一類問(wèn)題越來(lái)越受到智庫(kù)工作者的關(guān)注。
人工智能如何測(cè)量人心,是個(gè)問(wèn)題(圖片來(lái)自網(wǎng)絡(luò))
今天,小智邀請(qǐng)到復(fù)旦大學(xué)社會(huì)發(fā)展與公共政策學(xué)院胡安寧教授,就人工智能在社會(huì)科學(xué)領(lǐng)域的應(yīng)用和未來(lái)趨勢(shì)分享他的研究和體會(huì)。
目前人工智能在社會(huì)科學(xué)領(lǐng)域的應(yīng)用
目前,在社會(huì)科學(xué)領(lǐng)域,人工智能主要運(yùn)用于輔助數(shù)學(xué)模型,進(jìn)行量化研究,分析某些變量對(duì)某個(gè)結(jié)果如何產(chǎn)生影響和產(chǎn)生多大的影響,進(jìn)而進(jìn)行行為的預(yù)測(cè)。一般來(lái)說(shuō),采用數(shù)據(jù)挖掘的研究者通常盡可能地納入各種與“結(jié)果”相關(guān)的因素,然后考察這些因素合并在一起,如何能夠在新的環(huán)境下盡可能準(zhǔn)確地預(yù)測(cè)結(jié)果。
這方面比較典型的人工智能應(yīng)用是客戶分析模型。商家可以將大量已有的用戶數(shù)據(jù)導(dǎo)入人工智能系統(tǒng),以此訓(xùn)練出一個(gè)具有比較強(qiáng)預(yù)測(cè)力的模型工具。之后,當(dāng)新的用戶出現(xiàn)時(shí),他們的某些信息(如年齡、教育水平、收入水平)便能夠輸入模型,以此預(yù)測(cè)出用戶的某些屬性。例如,當(dāng)人們?cè)趤嗰R遜網(wǎng)站上買書時(shí),一旦輸入社會(huì)學(xué)類書籍,網(wǎng)站會(huì)自動(dòng)基于過(guò)往用戶的購(gòu)買習(xí)慣,向這一新的用戶推薦一些其他書籍。誠(chéng)然,如果這一新的用戶是社會(huì)學(xué)專業(yè)的大學(xué)生,而亞馬遜過(guò)往的演算是基于大量社會(huì)學(xué)專業(yè)大學(xué)生的購(gòu)買習(xí)慣,這些新推薦的書籍很有可能正是新使用者所需要的,由此既給用戶以便利,又提升了網(wǎng)站的營(yíng)業(yè)額。
可以看到,人工智能目前只是參與“以詮釋為導(dǎo)向的模型擬合”,比以前的進(jìn)步主要是可以處理的數(shù)據(jù)量更大了,速度更快了,但人們很少見(jiàn)到社會(huì)科學(xué)家會(huì)基于自己的研究模型做出具體的預(yù)測(cè)(比如很少有政治社會(huì)學(xué)家運(yùn)用人工智能預(yù)測(cè)何時(shí)會(huì)發(fā)生社會(huì)運(yùn)動(dòng))。鑒于此,當(dāng)越來(lái)越多的研究者將基于演算的、以預(yù)測(cè)為目的的人工智能技術(shù)引入社會(huì)科學(xué)研究的時(shí)候,人們似乎見(jiàn)到了社會(huì)科學(xué)新的發(fā)展方向,甚至是社會(huì)科學(xué)研究的范式革命。
人工智能發(fā)展的三個(gè)階段(圖片來(lái)自網(wǎng)絡(luò))
“人心難測(cè)”:計(jì)算科學(xué)的視角
在計(jì)算科學(xué)中,人工智能是一個(gè)非常寬泛的領(lǐng)域,其中基于不同的應(yīng)用方向有不同的分支學(xué)科。但究其根本,與社會(huì)科學(xué)密切相關(guān)的人工智能應(yīng)用主要是機(jī)器學(xué)習(xí)。所謂機(jī)器學(xué)習(xí),是通過(guò)提供給機(jī)器特定的數(shù)據(jù),讓計(jì)算機(jī)利用算法,尋找出這些數(shù)據(jù)背后的模式。之后,當(dāng)新的數(shù)據(jù)出現(xiàn)以后,人們便能夠用這些模式來(lái)套用數(shù)據(jù),做出預(yù)測(cè)。
那么,如果用這套工具來(lái)試圖理解人類社會(huì),做社會(huì)科學(xué)的研究,是否可能呢?答案是:介于肯定與否定之間。之所以有肯定的一面,是因?yàn)槿祟惖哪承┥鐣?huì)性行為具有高度模式化的特點(diǎn)。例如,在給定特定資源的情況下,一個(gè)理性選擇的個(gè)人通常會(huì)做出利益最大化的決策(比如在給定資金的情況下進(jìn)行投資決策)。此時(shí),機(jī)器可以對(duì)這種模式化的行為進(jìn)行分析,甚至在立足于大量已有投資“經(jīng)驗(yàn)”的基礎(chǔ)上,“創(chuàng)造性”地通過(guò)演算給投資者指出一種常人可能忽略了的最優(yōu)投資策略。
如果簡(jiǎn)單地認(rèn)為人們可以利用人工智能技術(shù)完全預(yù)測(cè)個(gè)體行為,并建立預(yù)測(cè)性的社會(huì)科學(xué),那就不免有些過(guò)于樂(lè)觀了。正是因?yàn)檫@一點(diǎn),上述問(wèn)題的答案中又包含否定的一面。具體而言,利用人工智能技術(shù)進(jìn)行社會(huì)性行為的分析會(huì)面臨三個(gè)困境。
困境一:機(jī)器學(xué)習(xí)的模式化
正所謂成也蕭何、敗也蕭何,人工智能雖然能夠?qū)τ谀J交男袨檫M(jìn)行基于算法的預(yù)測(cè)和分析(例如,“阿爾法狗”可以擊敗中國(guó)、韓國(guó)很多圍棋高手),但是,一旦人們面對(duì)的問(wèn)題不是模式化問(wèn)題時(shí),人工智能就難以處理了。一個(gè)簡(jiǎn)單的例子是:如果問(wèn)機(jī)器“1+1等于幾”?機(jī)器會(huì)立刻回答“等于2”。但如果告訴機(jī)器,這里的“1”代表一堆沙子,那么,兩堆沙子放在一起是什么呢?人們會(huì)說(shuō),還是一堆沙子。而機(jī)器卻無(wú)法做出類似的回答。因?yàn)?,兩堆沙子混成一堆不再是一個(gè)數(shù)學(xué)化的模式問(wèn)題,而是一個(gè)生活經(jīng)驗(yàn)問(wèn)題。
困境二:缺乏抽象思維的能力
目前文本學(xué)習(xí)非常流行,其中有一些算法能夠說(shuō)明一段文字所表達(dá)的作者情感。但是,這種分析到目前為止還比較機(jī)械,其背后的機(jī)制在于特定詞匯的計(jì)算特征。因此,使用這種技術(shù),人們所得到的信息也是非常初步的。換句話說(shuō),人們目前很難寄希望于人工智能能夠讀出字里行間的潛在意思。而對(duì)于社會(huì)科學(xué)而言,恰恰是一段文字的字里行間才能夠反映出作者的真實(shí)想法。如果僅僅根據(jù)詞頻或者其他表面上的文字使用模式,人們很難區(qū)分作者的真實(shí)意思和反諷之間的區(qū)別。
困境三:人工智能在處理問(wèn)題時(shí)缺乏整體性、系統(tǒng)性的思考。
比如,將人工智能應(yīng)用于體育領(lǐng)域時(shí),通過(guò)算法和數(shù)據(jù)所提供的信息可以幫助某個(gè)足球隊(duì)選擇最出色的特定位置的球員(前鋒、后衛(wèi)或者門將),但是,這個(gè)最好的后衛(wèi)或前鋒能否與全隊(duì)有效配合,產(chǎn)生化學(xué)效應(yīng),人工智能卻難以判斷。如果出現(xiàn)“一山不容二虎”的局面,兩個(gè)最好的球員在一起所產(chǎn)生的效果可能反而不如兩個(gè)普通球員在一起合作的效果好。這些超越個(gè)體的整體性判斷,則需要教練員與不同位置的球員進(jìn)行“人與人”之間的溝通才能做出。顯然,這些已經(jīng)不是機(jī)器所能做到的了。對(duì)于社會(huì)科學(xué)而言,學(xué)者們感興趣的恰恰是人與人之間的聯(lián)系,以及這種聯(lián)系所產(chǎn)生出來(lái)的超越個(gè)體的“社會(huì)行為”。
《點(diǎn)球成金》里的老板通過(guò)人工智能選擇棒球隊(duì)員(圖片為《點(diǎn)球成金》劇照)
“人心難測(cè)”:社會(huì)科學(xué)的視角
人類的各種稟賦,尤其是那些構(gòu)成人類社會(huì)本質(zhì)特征的元素并不完全是理性化的行為。甚至可以說(shuō),人類社會(huì)之所以成為社會(huì),恰恰是因?yàn)槊總€(gè)人不是像機(jī)器般“算計(jì)”,而是有著非理性的情感、思想和價(jià)值。人類社會(huì)之所以能夠存在,生活于其中的個(gè)體之所以能夠彼此團(tuán)結(jié)起來(lái)而不至于一盤散沙,所依賴的并不是這種“精致的利己主義”。相反,人們需要的是一種超驗(yàn)的,在人們看來(lái)不那么善變的、完美的存在。這種存在無(wú)法用理性來(lái)衡量,甚至只可意會(huì)不可言傳,而這恰恰正是社會(huì)科學(xué)最為關(guān)注的,最想解釋清楚的。
比如,婚姻的形成過(guò)程往往涉及很多理性化的考慮。尤其是在今天,夫妻雙方在最后走入婚姻殿堂之前可能在家庭義務(wù)、雙方家庭的物質(zhì)支持等方面已經(jīng)有一系列的討價(jià)還價(jià)。在這里,雙方都在努力地做到利益最大化,理性化的原則通常會(huì)占上風(fēng),甚至有人工智能軟件專門計(jì)算匹配度。但是,婚姻涉及的不僅僅是這些功利性的考慮,更重要的是雙方的愛(ài)情基礎(chǔ)。而愛(ài)情卻是一種神圣性的存在,人們通常認(rèn)為它是永恒的、完美的,不容討價(jià)還價(jià)和妥協(xié)的。總之,一個(gè)基本的共識(shí)是,僅僅用理性計(jì)算來(lái)衡量婚姻是無(wú)法把握婚姻的本質(zhì)的。
測(cè)試婚姻匹配度的軟件(圖片來(lái)自網(wǎng)絡(luò))
我們的結(jié)論是,人們完全可以采用人工智能的算法來(lái)推理和預(yù)測(cè)個(gè)人的選擇和傾向,但這種預(yù)測(cè)僅僅局限于世俗領(lǐng)域而非神圣領(lǐng)域?!叭诵牡念A(yù)測(cè)”很多時(shí)候是神圣且?guī)в信既恍缘?,也許這個(gè)時(shí)候進(jìn)行研究的最好方法是直接的訪談和體驗(yàn),人工智能時(shí)代依然“人心難測(cè)”。(人民日?qǐng)?bào)中央廚房 智觀天下工作室出品,田衛(wèi)平整理)