據(jù)外媒報(bào)道,機(jī)器翻譯技術(shù)自誕生以來走過了漫長的道路。雖然像谷歌這樣的翻譯曾經(jīng)粗糙、不可靠,而且只對(duì)最基本的翻譯有用,但如今,由于AI的力量,它們可以實(shí)現(xiàn)驚人的準(zhǔn)確。然而一些古老的翻譯方法仍然存在。 比如在Facebook上,句子首先從一種基礎(chǔ)語言翻譯成英語,然后再從英語翻譯成目標(biāo)語言。
這由幾個(gè)原因造成,其中一個(gè)是缺乏有用的AI訓(xùn)練數(shù)據(jù)用于非英語語言到語言的翻譯。
許多人將單詞和短語從英語翻譯成法語或從法語翻譯成英語,但將內(nèi)容從法語翻譯成西班牙語或西班牙語翻譯成德語的人卻要少得多。
這使得訓(xùn)練AI理解復(fù)雜的語言到語言的翻譯是一個(gè)相當(dāng)困難的過程。然而根據(jù)Facebook最近發(fā)布的一篇博文,這家社交媒體巨頭終于解決了這個(gè)問題并想出了一個(gè)解決方案。
該解決方案以M2M-100的形式出現(xiàn),這是第一個(gè)“多語言機(jī)器翻譯模型”。該模型可以在100種語言的任意一對(duì)之間進(jìn)行翻譯,而無需依賴任何英語數(shù)據(jù)集。如果懷疑它的有效性則可以自己檢查,因?yàn)樵撃P褪峭耆_源。
Facebook表示,跟它所謂的“以英語為中心”的翻譯系統(tǒng)相比,它的多語種翻譯模式更有意義。該公司聲稱,M2M -100在機(jī)器翻譯評(píng)估的BLEU scale上比這類方法高出“10分”。
據(jù)Facebook介紹稱,這個(gè)項(xiàng)目已經(jīng)醞釀多年,盡管還有很大的改進(jìn)空間,但該公司對(duì)目前所取得的進(jìn)展感到滿意。
目前還不清楚M2M -100何時(shí)或是否會(huì)直接在Facebook上推出。
關(guān)鍵詞:
責(zé)任編輯:Rex_01