設為首頁 | 加入收藏歡迎進入北京青年網 !

最新文章:
美容冠的使用優勢有哪些?
美麗有方,安全先行——女人如何選擇
種植牙需要哪些條件

人工智能再下一城:機器翻譯提前7年達到人類專業翻譯水平

發布時間:2018-04-03 11:58:27 來源:來自網絡

由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今天宣布,其研發的機器翻譯系統在通用新聞報道的中譯英測試集上,達到了人類專業譯者水平。這是首個在新聞報道的翻譯質量和準確率上媲美人類專業譯者的翻譯系統。

微軟技術院士黃學東

微軟技術院士,負責微軟語音、自然語言和機器翻譯工作的黃學東博士表示,這是自然語言處理領域的一項里程碑式的成就。“這是我們的情懷,是非常有意義的工作,”黃學東告訴新智元:“消除語言障礙,讓人們能更好地溝通,非常有價值,值得我們多年來不斷為此付出努力。”

黃學東驕傲地說,2015年微軟率先在圖像識別ImageNet數據集達到人類水平,2016年在Switchboard對話語義識別達到人類水平,2017在斯坦福問答數據集SQuAD上達到人類水平,今天又在機器翻譯上達到人類水平,一路走來,微軟的進步激動人心,“這是我們共同的成就,我們是站在同行的肩膀上往上走”。

黃學東表示,微軟語音和NLP組在成立時,便立下了要在兩年后將機器翻譯做到人類專業水平的目標。如今,這一目標提前實現,“除了計算力的大幅提高,深度學習方法的提高,我們還結合了以前在Switchboard上取得的經驗,數據也做了很多整理,比如去除低質量的訓練數據,等等。”黃學東說。

“這既是技術上的突破,也是工程上的突破,是技術和工程的完美結合,只有把過程中的每一件事情都做好,才能得到這樣的結果。”

NLP里程碑式突破:首個媲美人類專業譯者的機器翻譯系統

這次微軟的翻譯系統是在數據集WMT-17的新聞數據集newstest2017上取得了上述成果。WMT是機器翻譯領域的國際頂級評測比賽之一。WMT數據集也是機器翻譯領域一個公認的主流數據集。其中,newstest2017新聞報道測試集由產業界和學術界的合作伙伴共同開發,包括來自新聞評論語料庫的約332K個句子對,來自聯合國平行語料庫的15.8M個句子對,以及來自CWMT語料庫的9M個句子對。

雖然研究人員只進行了漢譯英的測試,但黃學東表示,英譯漢結果也應該并無不同。“從技術上說,漢譯英和英譯漢是相同的,只要有足夠的數據。”

為了確保翻譯結果準確且達到人類的翻譯水平,微軟研究團隊還邀請了雙語語言顧問,將微軟的翻譯結果與兩個獨立的人工翻譯結果進行了比較評估(全部盲測)。黃學東告訴新智元:“當機器翻譯質量很差的時候,使用BLEU評分還行,但是當機器翻譯質量提高以后,就需要靠人類來評價。”

具體說,當100分是標準滿分時,微軟的系統得分69.9,專業譯者68.6,而眾包翻譯得分為67.6。

人類專家的評估結果(部分):其中,Reference-HT為純人工翻譯;Reference-PE為使用Google Translate加人工后期編輯的翻譯;Reference-WMT是WMT原始翻譯,包含錯誤;Online-A-1710是2017年10月16日收集的Microsoft翻譯商用系統(production system);Online-B-1710是2017年10月16日收集的谷歌翻譯商用系統;Sogou是搜狗NMT翻譯系統,這是在2017年WMT中英機器翻譯競賽的冠軍。

機器翻譯提前7年超越人類譯者,人工智能再下一城

機器翻譯是科研人員攻堅了數十年的研究領域,曾經很多人都認為機器翻譯根本不可能達到人類翻譯的水平。

2017年中旬,牛津大學面向機器學習研究人員做了一次大規模調查,調查的內容是他們對 AI 進展的看法。這些研究人員預測,未來10年,AI 將在許多活動中超過人類,具體預測見下表:

[db:編輯]

相關文章

圖片推薦

網站首頁 | 關于我們 | 聯系方式 | 招聘信息 | 版權聲明 | 網站地圖 | 北京青年網
加拿大28和加拿大快乐8开奖网