吳華:神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)大幅提升翻譯質(zhì)量
2016-12-23 09:06:00 來(lái)源:新華網(wǎng)

????新華網(wǎng)北京12月23日電(凌紀(jì)偉)從提出到大規(guī)模應(yīng)用,基于統(tǒng)計(jì)機(jī)器翻譯(SMT)技術(shù)的互聯(lián)網(wǎng)翻譯系統(tǒng)花費(fèi)了15年時(shí)間。而神經(jīng)網(wǎng)絡(luò)翻譯(NMT)技術(shù)從2014年9月提出,到百度2015年5月上線首個(gè)神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng),只用了短短8個(gè)月時(shí)間。

????12月21日,百度技術(shù)委員會(huì)聯(lián)席主席、自然語(yǔ)言處理部技術(shù)負(fù)責(zé)人吳華博士表示,NMT這一技術(shù)帶來(lái)了翻譯質(zhì)量的大幅躍升,極大地提升了用戶體驗(yàn)?!鞍俣确g在中英的測(cè)試集上,翻譯質(zhì)量比之前傳統(tǒng)的方法提升了7個(gè)百分點(diǎn)以上?!?/p>

????眾所周知,機(jī)器翻譯距今已有70年的發(fā)展歷史。自上世紀(jì)40年代起,基于規(guī)則、實(shí)例以及統(tǒng)計(jì)的機(jī)器翻譯方法漸次登場(chǎng),各領(lǐng)風(fēng)騷。近兩年,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)異軍突起,取得了翻譯質(zhì)量的大幅躍升。在2016年學(xué)術(shù)界頂級(jí)會(huì)議上,幾乎全是圍繞NMT相關(guān)的創(chuàng)新工作。今年9月,谷歌、微軟等公司也相繼發(fā)布NMT系統(tǒng)。

????NMT技術(shù)緣何受到追捧?據(jù)吳華介紹,它克服了傳統(tǒng)方法將句子分割為不同片段進(jìn)行翻譯的缺點(diǎn),而是充分利用上下文信息,對(duì)句子進(jìn)行整體的編碼和解碼,從而產(chǎn)生更為流暢的譯文。

????“翻譯如果想做得非常準(zhǔn)確的話,是要有一些背景知識(shí),還有偏向知識(shí)的。”吳華舉例說(shuō),比如在讀文章的時(shí)候,是在通讀了這篇文章后我們才能知道一句話的意思。再比如讀英文文學(xué)作品時(shí),我們可能認(rèn)識(shí)每個(gè)英文單詞,但如果缺乏英文文學(xué)積累或者當(dāng)?shù)匚幕尘?,就不能深入理解作品?nèi)涵。

????吳華說(shuō),這正是機(jī)器翻譯下一步要去解決的問題,就是要從篇章上通讀,抓住這個(gè)段落或者篇章逐字翻譯,而不是像現(xiàn)在這樣按句翻譯?;谏窠?jīng)網(wǎng)絡(luò)技術(shù)本身,它在長(zhǎng)句的處理能力上比某些翻譯要好一些,翻譯質(zhì)量有很大提升。她說(shuō),作為一款翻譯工具,最核心的是翻譯質(zhì)量,未來(lái)幾年百度會(huì)基于神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)一步擴(kuò)大領(lǐng)先優(yōu)勢(shì),提高翻譯內(nèi)容的準(zhǔn)確度。

????雖然神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)促使翻譯質(zhì)量大幅提升,但如果用“信達(dá)雅”的翻譯原則衡量當(dāng)前機(jī)器翻譯的水平,吳華認(rèn)為它還處在“信”的層面,或者說(shuō)處在相對(duì)直譯階段。

????隨著百度、谷歌等科技公司陸續(xù)推出神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng),有關(guān)“翻譯這個(gè)職業(yè)會(huì)被淘汰么?”的爭(zhēng)論頗受關(guān)注。對(duì)此,吳華的觀點(diǎn)是機(jī)器翻譯在很長(zhǎng)一段時(shí)間都達(dá)不到人工翻譯的精準(zhǔn)層次,特別是在對(duì)精度要求較高的專業(yè)翻譯領(lǐng)域。她認(rèn)為,機(jī)器翻譯如果要取代人工翻譯,其準(zhǔn)確度至少要達(dá)到90%以上,而目前也就只有70%的水平。

????不過(guò),吳華指出,機(jī)器翻譯也有一定的自身優(yōu)勢(shì),它好像是你的一個(gè)隨身翻譯官一樣,在對(duì)翻譯質(zhì)量要求不太苛刻的情況下,它能隨身幫你解決生活中的一些實(shí)際問題。她以百度翻譯為例說(shuō),公交車售票員用百度翻譯幫助巴基斯坦小伙子找回失物、游客利用『對(duì)話翻譯』、『拍照翻譯』功能在國(guó)外自由溝通等等,都表明了百度翻譯越來(lái)越多的融入生活。

????據(jù)悉,目前百度翻譯支持全球28種語(yǔ)言互譯、756個(gè)翻譯方向,每日響應(yīng)過(guò)億次的翻譯請(qǐng)求。此外,百度翻譯還開放了API接口,已有超過(guò)2萬(wàn)個(gè)第三方應(yīng)用接入,華為、OPPO、中興、三星等手機(jī)也接入了百度翻譯API。世界知識(shí)產(chǎn)權(quán)組織(WIPO)也將百度翻譯API集成到官網(wǎng),供用戶將專利信息翻譯成不同語(yǔ)種查詢。

  • 為你推薦
  • 公益播報(bào)
  • 公益匯
  • 進(jìn)社區(qū)

熱點(diǎn)推薦

即時(shí)新聞

武漢