人機(jī)圍棋大戰(zhàn):人工智能能否戰(zhàn)勝人類?
2016-03-15 08:41:00 來源: 第一財(cái)經(jīng)日?qǐng)?bào)

摘要:“這是一場(chǎng)新鮮而陌生的比賽,是全新的挑戰(zhàn)。很難保證5比0全勝,畢竟我的對(duì)手從來不會(huì)失誤?!?/p>

李世石對(duì)戰(zhàn)AlphaGo,首番棋誰會(huì)贏?

一方是擁有十多個(gè)圍棋世界冠軍頭銜的最高級(jí)別人類選手;一方是現(xiàn)階段人工智能領(lǐng)域最厲害的圍棋程序,北京時(shí)間今日(3月9日)12時(shí),全球都會(huì)將目光聚焦首爾。

“這是一場(chǎng)新鮮而陌生的比賽,是全新的挑戰(zhàn)。我很難保證5比0全勝,畢竟我的對(duì)手從來不會(huì)失誤?!弊蛉盏馁惽鞍l(fā)布會(huì)上,李世石雖然一改此前的自信滿滿,但依舊認(rèn)為“目前還是人類比人工智能強(qiáng)”。

去年10月,歐洲圍棋冠軍樊麾曾輸給AlphaGo,但不少圍棋高手研究對(duì)戰(zhàn)棋譜后,都指其有“放水”嫌疑。對(duì)此,作為AlphaGo的設(shè)計(jì)者,谷歌人工智能公司DeepMind的CEO杰米斯·哈薩比斯在發(fā)布會(huì)上表示:“大家看到的AlphaGo并不是它能力的全部,它這一刻仍在憑借著其人工智能技術(shù),對(duì)棋譜進(jìn)行學(xué)習(xí)。相信AlphaGo能在比賽時(shí)展示不同的一面。”

曾歷任韓國(guó)科學(xué)技術(shù)院人工智能院士、現(xiàn)就職于韓國(guó)頂尖民營(yíng)研究所HandySoftware的李承鎬(音譯)博士在接受《第一財(cái)經(jīng)日?qǐng)?bào)》記者專訪時(shí)表示,無論這場(chǎng)對(duì)決孰勝孰負(fù),最終的贏家都將是人類自己。

圍棋界:人肯定贏

對(duì)于人機(jī)大戰(zhàn)結(jié)果的預(yù)測(cè),中韓圍棋界都站在人類一邊。

3月7日晚,棋圣聶衛(wèi)平向包括《第一財(cái)經(jīng)日?qǐng)?bào)》在內(nèi)的媒體表示,人工智能缺乏判斷力,與人類棋手對(duì)弈很難取勝。

“很多職業(yè)棋手,包括最頂尖的職業(yè)選手,(對(duì)于局勢(shì)的)看法會(huì)有很多分歧,比如李世石認(rèn)為形勢(shì)可以,而柯潔可能認(rèn)為不行。對(duì)于圍棋的判斷,是計(jì)算機(jī)的大難題,我不相信現(xiàn)在有電腦能突破這個(gè),所以人和電腦下,百分之一百是人贏?!甭櫺l(wèi)平表示。

聶衛(wèi)平的依據(jù)在于,圍棋變化可以歸結(jié)為361的階乘,本身就是一個(gè)無限大的數(shù),其中還包含打二還一、打三還一、打結(jié)、倒撲等各種技法,可以說是變化無窮。

“李世石最近的狀態(tài)非常好?!蓖惶欤袊?guó)圍棋選手柯潔表示。言下之意,目前的人工智能還不足以挑戰(zhàn)現(xiàn)役一流圍棋棋手。

此前,柯潔曾多次擊敗李世石,并在不久前收到了來自國(guó)內(nèi)異構(gòu)智能公司圍棋AI“異構(gòu)神機(jī)”的挑戰(zhàn)。但他并未應(yīng)戰(zhàn)。

韓國(guó)女棋手尹英敏(音譯)也站在李世石這邊。被譽(yù)為“韓國(guó)圍棋推廣第一人”的她昨日向本報(bào)記者表示:“按照雙方水平來看,李世石九段不僅會(huì)勝出,而且會(huì)以壓倒性的優(yōu)勢(shì)勝出,如果李世石輸?shù)粢粓?chǎng)都會(huì)被認(rèn)為是重大失誤?!?/p>

“但我們需要注意到,本次比賽的賽制設(shè)計(jì)對(duì)于AlphaGo比較有利?!币⒚粞a(bǔ)充道。

據(jù)了解,此次人機(jī)交手將大戰(zhàn)5盤,日程分別是9日、10日、12日、13日和15日,比賽在韓國(guó)時(shí)間下午1時(shí)(北京時(shí)間12時(shí))開始。尹英敏認(rèn)為:“在這種匆忙日程下,人類的疲勞度將會(huì)上升,但計(jì)算機(jī)卻不會(huì)疲勞?!?/p>

其次,雙方各有2小時(shí)的布局時(shí)間及3次60秒的讀秒(棋手將限時(shí)用完后的倒計(jì)時(shí)時(shí)間)。每場(chǎng)比賽預(yù)計(jì)需要4~5個(gè)小時(shí)。“充裕的時(shí)間為計(jì)算器的運(yùn)算提供了有利條件?!币⒚舯硎荆珹lphaGo的另一個(gè)優(yōu)勢(shì)是,而本次對(duì)局使用的是中國(guó)圍棋競(jìng)賽規(guī)則(比賽結(jié)束時(shí),后走棋的棋手貼目),是AlphaGo平時(shí)“訓(xùn)練”使用的規(guī)則,而李世石則更熟悉韓式規(guī)則。除此之外,中國(guó)有句俗話叫“知己知彼,百戰(zhàn)不殆”,如今AlphaGo對(duì)于李世石肯定已經(jīng)非?!傲私狻保钍朗瘏s對(duì)AlphaGo一無所知,這對(duì)于李世石來說也是劣勢(shì)之一。

但尹英敏同時(shí)表示,AlphaGo的優(yōu)勢(shì)能否左右戰(zhàn)局,依舊取決于李世石當(dāng)天的身體及精神狀態(tài)。

IT界觀點(diǎn)不一

作為人工智能界的專家,李承鎬的觀點(diǎn)與韓國(guó)近六成民眾一致:李世石會(huì)獲得壓倒性的優(yōu)勢(shì)。他認(rèn)為,即便是機(jī)器人有其獨(dú)有的優(yōu)勢(shì),依然無法對(duì)于狀態(tài)良好的李世石產(chǎn)生巨大威脅。他笑稱:“畢竟很少會(huì)有頂級(jí)的專業(yè)選手,連續(xù)好幾場(chǎng)出現(xiàn)致命失誤,除非他不愿意繼續(xù)對(duì)決下去。”

創(chuàng)新工場(chǎng)CEO、谷歌前全球副總裁兼大中華區(qū)總裁李開復(fù)也在知乎上表示,AlphaGo這次要打敗李世石比較懸,但是1~2年之內(nèi)必然完勝人類。

李開復(fù)指出,樊麾只是職業(yè)二段,而李世石是職業(yè)九段,差別是巨大的,“就比如說一個(gè)人乒乓球打敗了非洲冠軍,并不代表他就可以成功挑戰(zhàn)中國(guó)冠軍?!?/p>

與上述觀點(diǎn)不同,搜狗CEO王小川認(rèn)為,人工智能將會(huì)完勝。他提出了自己的兩個(gè)斷言:AlphaGo將會(huì)完勝李世石;除了圍棋,人工智能在其他博弈類的封閉游戲里也會(huì)橫掃人類?!拔艺J(rèn)為谷歌的那套深度學(xué)習(xí)的方法加上搜索空間的方法,大體上可以覆蓋人的思考,而且它可能做得更好?!蓖跣〈ū硎尽?/p>

AlphaGo的研究者戴維·席爾瓦表示,AlphaGo系統(tǒng)的關(guān)鍵是,將圍棋巨大無比的搜索空間壓縮到可控的范圍之內(nèi)。為了達(dá)到這一目的,AlphaGo系統(tǒng)將最先進(jìn)的蒙特卡洛樹狀搜索技術(shù)與兩個(gè)深層神經(jīng)網(wǎng)絡(luò)相結(jié)合,每個(gè)深層神經(jīng)網(wǎng)絡(luò)均包含許多層,每層又包含數(shù)以百萬計(jì)的神經(jīng)元一樣的連接。

在AlphaGo兩種不同的神經(jīng)網(wǎng)絡(luò)中,“策略網(wǎng)絡(luò)”的作用是預(yù)測(cè)下一步,并用來將搜索范圍縮小至最有可能觸發(fā)的那些步驟;另一個(gè)神經(jīng)網(wǎng)絡(luò)“價(jià)值網(wǎng)絡(luò)”則是用來減少搜索樹的深度,每走一步估算一次獲勝方,而不是搜索所有結(jié)束棋局的途徑。

上述方法使得AlphaGo的搜索方式相比之前的方法更人性化。例如,深藍(lán)采用強(qiáng)力方法搜索的棋子位置要比AlphaGo多數(shù)千倍。而AlphaGo則相反,它通過想象下完剩余棋局來對(duì)下一步進(jìn)行預(yù)判,如此多次反復(fù)。在上述模擬游戲中,策略網(wǎng)絡(luò)提出下一步的智能建議,而價(jià)值網(wǎng)絡(luò)則對(duì)走過的每個(gè)位置進(jìn)行評(píng)估。

具體而言,谷歌首先采用圍棋專業(yè)棋手的3000萬步下法對(duì)“價(jià)值網(wǎng)絡(luò)”進(jìn)行訓(xùn)練,直到該網(wǎng)絡(luò)對(duì)人類下法預(yù)測(cè)準(zhǔn)確率達(dá)到57%(AlphaGo之前的紀(jì)錄是44%)。

但AlphaGo的目標(biāo)是擊敗水平最高的人類棋手,而不僅僅是模仿他們。為了做到這一點(diǎn),AlphaGo學(xué)會(huì)自己發(fā)現(xiàn)新策略,通過自身兩個(gè)神經(jīng)網(wǎng)絡(luò)之間成千上萬的對(duì)弈,采用被稱為強(qiáng)化學(xué)習(xí)的試錯(cuò)法逐步進(jìn)行改善。這種方法提高了“策略網(wǎng)絡(luò)”的效率,以至于最原始的“神經(jīng)網(wǎng)絡(luò)”可以擊敗最尖端、構(gòu)建有巨大無比的搜索樹的圍棋軟件。

“在與樊麾二段比賽后,我們對(duì)AlphaGo進(jìn)行了多次更新。請(qǐng)大家關(guān)注AlphaGo以什么樣的方式與最優(yōu)秀的棋手李世石對(duì)弈。”哈薩比斯昨日預(yù)計(jì),“再過大約5年時(shí)間,AI將全面超越最頂尖人類棋手?!?/p>

最終贏家仍是人類

無論是AlphaGo還是李世石贏得比賽,這都不是人工智能的最終目的。

李承鎬一再向本報(bào)記者強(qiáng)調(diào):“人工智能開發(fā)的最終方向,還是要取決于人類,并且服務(wù)于人類的。畢竟人工智能也是由人類制作而成的,這是人工智能技術(shù)發(fā)展的基礎(chǔ)和終極目的,我們不能忘記這個(gè)目的?!?/p>

“另外,通過人工智能技術(shù),能夠促進(jìn)IoT(物聯(lián)網(wǎng))等新技術(shù)的開發(fā),從而更有利于人類的發(fā)展與福祉?!崩畛墟€認(rèn)為,近年來暫時(shí)停滯的科技發(fā)展,將因人工智能技術(shù),煥發(fā)“全新的春天”。

谷歌董事長(zhǎng)埃里克·施密特也在賽前發(fā)布會(huì)上表示:“我們開發(fā)人工智能機(jī)器人的最終目的在于為人類提供福祉,為未解難題提供新的解決方法;而其中,圍棋只是我們選擇增強(qiáng)人工智能機(jī)器人的實(shí)力的方法之一。無論這場(chǎng)對(duì)決孰勝孰負(fù),最終的贏家都將是人類自己,因?yàn)槿斯ぶ悄艿陌l(fā)展,最終的受益者將是人類自己?!?/p>

事實(shí)上,目前谷歌、百度都已經(jīng)通過人工智能技術(shù)在語音識(shí)別、圖片識(shí)別、無人駕駛等方面展開應(yīng)用。

“當(dāng)湖十局,不止求勝,在棋局之外,我們探求的新境界是人類智慧與機(jī)器智能的配合,因而圍棋智能僅僅是人工智能的副產(chǎn)品,而人工智能的終極目標(biāo)是讓我們擁有更加便捷的生活。”異構(gòu)智能CEO吳韌說。

  • 為你推薦
  • 公益播報(bào)
  • 公益匯
  • 進(jìn)社區(qū)

熱點(diǎn)推薦

即時(shí)新聞

武漢