吳華:神經(jīng)網(wǎng)絡(luò)機器翻譯技術(shù)大幅提升翻譯質(zhì)量
2016-12-23 09:06:00 來源:新華網(wǎng)

????新華網(wǎng)北京12月23日電(凌紀偉)從提出到大規(guī)模應(yīng)用,基于統(tǒng)計機器翻譯(SMT)技術(shù)的互聯(lián)網(wǎng)翻譯系統(tǒng)花費了15年時間。而神經(jīng)網(wǎng)絡(luò)翻譯(NMT)技術(shù)從2014年9月提出,到百度2015年5月上線首個神經(jīng)網(wǎng)絡(luò)機器翻譯系統(tǒng),只用了短短8個月時間。

????12月21日,百度技術(shù)委員會聯(lián)席主席、自然語言處理部技術(shù)負責人吳華博士表示,NMT這一技術(shù)帶來了翻譯質(zhì)量的大幅躍升,極大地提升了用戶體驗?!鞍俣确g在中英的測試集上,翻譯質(zhì)量比之前傳統(tǒng)的方法提升了7個百分點以上。”

????眾所周知,機器翻譯距今已有70年的發(fā)展歷史。自上世紀40年代起,基于規(guī)則、實例以及統(tǒng)計的機器翻譯方法漸次登場,各領(lǐng)風騷。近兩年,神經(jīng)網(wǎng)絡(luò)機器翻譯技術(shù)異軍突起,取得了翻譯質(zhì)量的大幅躍升。在2016年學(xué)術(shù)界頂級會議上,幾乎全是圍繞NMT相關(guān)的創(chuàng)新工作。今年9月,谷歌、微軟等公司也相繼發(fā)布NMT系統(tǒng)。

????NMT技術(shù)緣何受到追捧?據(jù)吳華介紹,它克服了傳統(tǒng)方法將句子分割為不同片段進行翻譯的缺點,而是充分利用上下文信息,對句子進行整體的編碼和解碼,從而產(chǎn)生更為流暢的譯文。

????“翻譯如果想做得非常準確的話,是要有一些背景知識,還有偏向知識的?!眳侨A舉例說,比如在讀文章的時候,是在通讀了這篇文章后我們才能知道一句話的意思。再比如讀英文文學(xué)作品時,我們可能認識每個英文單詞,但如果缺乏英文文學(xué)積累或者當?shù)匚幕尘?,就不能深入理解作品?nèi)涵。

????吳華說,這正是機器翻譯下一步要去解決的問題,就是要從篇章上通讀,抓住這個段落或者篇章逐字翻譯,而不是像現(xiàn)在這樣按句翻譯?;谏窠?jīng)網(wǎng)絡(luò)技術(shù)本身,它在長句的處理能力上比某些翻譯要好一些,翻譯質(zhì)量有很大提升。她說,作為一款翻譯工具,最核心的是翻譯質(zhì)量,未來幾年百度會基于神經(jīng)網(wǎng)絡(luò)技術(shù)進一步擴大領(lǐng)先優(yōu)勢,提高翻譯內(nèi)容的準確度。

????雖然神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)促使翻譯質(zhì)量大幅提升,但如果用“信達雅”的翻譯原則衡量當前機器翻譯的水平,吳華認為它還處在“信”的層面,或者說處在相對直譯階段。

????隨著百度、谷歌等科技公司陸續(xù)推出神經(jīng)網(wǎng)絡(luò)機器翻譯系統(tǒng),有關(guān)“翻譯這個職業(yè)會被淘汰么?”的爭論頗受關(guān)注。對此,吳華的觀點是機器翻譯在很長一段時間都達不到人工翻譯的精準層次,特別是在對精度要求較高的專業(yè)翻譯領(lǐng)域。她認為,機器翻譯如果要取代人工翻譯,其準確度至少要達到90%以上,而目前也就只有70%的水平。

????不過,吳華指出,機器翻譯也有一定的自身優(yōu)勢,它好像是你的一個隨身翻譯官一樣,在對翻譯質(zhì)量要求不太苛刻的情況下,它能隨身幫你解決生活中的一些實際問題。她以百度翻譯為例說,公交車售票員用百度翻譯幫助巴基斯坦小伙子找回失物、游客利用『對話翻譯』、『拍照翻譯』功能在國外自由溝通等等,都表明了百度翻譯越來越多的融入生活。

????據(jù)悉,目前百度翻譯支持全球28種語言互譯、756個翻譯方向,每日響應(yīng)過億次的翻譯請求。此外,百度翻譯還開放了API接口,已有超過2萬個第三方應(yīng)用接入,華為、OPPO、中興、三星等手機也接入了百度翻譯API。世界知識產(chǎn)權(quán)組織(WIPO)也將百度翻譯API集成到官網(wǎng),供用戶將專利信息翻譯成不同語種查詢。

  • 為你推薦
  • 公益播報
  • 公益匯
  • 進社區(qū)

熱點推薦

即時新聞

武漢