新華社洛杉磯12月18日電(記者郭爽)美國(guó)科學(xué)家日前報(bào)告說(shuō),他們從人類(lèi)大腦的學(xué)習(xí)方式中獲得靈感,研發(fā)出一種新的“深度學(xué)習(xí)”算法,可以讓機(jī)器像人類(lèi)嬰兒一樣自主學(xué)習(xí)視覺(jué)世界。
在深度學(xué)習(xí)領(lǐng)域,科學(xué)家喜歡用“這是1,這是2”的方法來(lái)訓(xùn)練機(jī)器。這種被稱(chēng)為“監(jiān)督學(xué)習(xí)”的技術(shù),在訓(xùn)練時(shí)需要為機(jī)器提供成千上萬(wàn)標(biāo)記好的樣本,此前被認(rèn)為是最有效的方法。
不過(guò),人類(lèi)并不是這樣學(xué)習(xí)。在大多數(shù)情況下,人類(lèi)大腦的學(xué)習(xí)方式都是“無(wú)監(jiān)督學(xué)習(xí)”。在日前于西班牙巴塞羅那舉行的神經(jīng)信息處理系統(tǒng)(NIPS)大會(huì)上,研究人員發(fā)表報(bào)告說(shuō),美國(guó)賴(lài)斯大學(xué)和貝勒醫(yī)學(xué)院的神經(jīng)科學(xué)和人工智能專(zhuān)家研發(fā)出一種“半監(jiān)督學(xué)習(xí)”算法,這種機(jī)器學(xué)習(xí)方式與人類(lèi)更為接近。
研究負(fù)責(zé)人安基特·帕特爾解釋說(shuō),嬰兒出生第一年,父母會(huì)告訴孩子這是水瓶、椅子、媽媽……,但事實(shí)上,嬰兒并不能理解這些詞語(yǔ)的意思。多數(shù)情況下,他們是通過(guò)與世界互動(dòng)進(jìn)行“無(wú)監(jiān)督學(xué)習(xí)”的。
據(jù)介紹,研究人員首先僅向新研發(fā)出的“深度渲染混合模型”提供從0到9這10個(gè)數(shù)字的10個(gè)手寫(xiě)標(biāo)準(zhǔn)樣本,然后再讓模型去“自學(xué)”數(shù)千個(gè)樣本數(shù)據(jù),通過(guò)這種“半監(jiān)督學(xué)習(xí)”算法讓模型學(xué)習(xí)識(shí)別手寫(xiě)體數(shù)字。最終測(cè)試結(jié)果顯示,在辨別手寫(xiě)數(shù)字方面,這種模型比此前幾乎所有算法,即一開(kāi)始就通過(guò)數(shù)千個(gè)正確樣本訓(xùn)練機(jī)器“學(xué)習(xí)”每個(gè)數(shù)字的方法更為準(zhǔn)確。
研究人員表示,這種“半監(jiān)督學(xué)習(xí)”算法屬于一種“卷積神經(jīng)網(wǎng)絡(luò)”。在這種從生物神經(jīng)元中得到啟發(fā)而設(shè)計(jì)出的多層人工神經(jīng)元網(wǎng)絡(luò)中,人工神經(jīng)元(或稱(chēng)數(shù)據(jù)處理單元)分層排列。第一層掃描圖像,并執(zhí)行相對(duì)簡(jiǎn)單的任務(wù),如搜索邊緣和顏色的變化等。第二層負(fù)責(zé)檢查從第一層輸出的內(nèi)容,并搜索更復(fù)雜的模式。從數(shù)學(xué)角度上說(shuō),這種在模式內(nèi)尋找模式的嵌套方法被稱(chēng)為一種非線性過(guò)程。
研究人員指出,從本質(zhì)上說(shuō),卷積神經(jīng)網(wǎng)絡(luò)是一個(gè)“非常簡(jiǎn)單的視覺(jué)皮層”。舉例來(lái)說(shuō),如果給這個(gè)網(wǎng)絡(luò)輸入一個(gè)圖像,那么它的每一層就會(huì)處理這個(gè)圖像的一部分特征,而隨著層級(jí)深入,對(duì)于圖像的理解也就不斷加深。到最后一層,這個(gè)網(wǎng)絡(luò)就會(huì)獲得關(guān)于這個(gè)圖像相當(dāng)深入且抽象的理解。事實(shí)上,現(xiàn)今幾乎所有自動(dòng)駕駛系統(tǒng)都配備了這種網(wǎng)絡(luò),因?yàn)榫矸e神經(jīng)網(wǎng)絡(luò)是迄今最好的視覺(jué)處理方法。
研究人員認(rèn)為,他們研發(fā)出的這種人工神經(jīng)網(wǎng)絡(luò)還可以幫助神經(jīng)科學(xué)家更好地了解人類(lèi)大腦處理信息的方式,因?yàn)槿祟?lèi)大腦的“算法”遠(yuǎn)遠(yuǎn)優(yōu)于任何人類(lèi)設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)。