文獻文獻文獻文獻文獻新科技科技科技科技知識產(chǎn)權(quán)
#文章僅代表作者觀點,不代表IPRdaily立場#
來源:IPRdaily NnTech 新科技評測團隊
原標題:挑戰(zhàn)日本最強AI翻譯引擎!出版社這次拿出了硬科技
機器翻譯一直是阻礙專利領(lǐng)域技術(shù)全球跨語言信息化應(yīng)用的一個核心技術(shù)難題。
而由于近年來人工智能技術(shù)的飛速發(fā)展,機器翻譯公司如雨后春筍般迅速發(fā)展,國外的Google、微軟已經(jīng)在各領(lǐng)域應(yīng)用機器翻譯技術(shù)。
筆者了解到,近日,日本一款DeepL在線機器翻譯軟件,號稱在實例評測中碾壓了谷歌翻譯,更是引起了機器翻譯領(lǐng)域的轟動!
盡管如此,專利領(lǐng)域的機器翻譯由于科技詞語的晦澀,同時要求具有很嚴謹?shù)姆梢?guī)范性,增加了人工智能技術(shù)在專利機器翻譯中應(yīng)用的難度。
而隨著技術(shù)的不斷更新迭代,這種情況正在逐步發(fā)生變化!
筆者發(fā)現(xiàn),作為專利翻譯國家隊的知識產(chǎn)權(quán)出版社也推出了應(yīng)用于科技與專利文獻翻譯的機器翻譯引擎——科專笑飛,或許這將極大推進機器翻譯技術(shù)在專利領(lǐng)域的應(yīng)用!
今天NnTech 新科技評測團隊,將對最近很火爆的DeepL與科專笑飛做一個專業(yè)評測,看看在科技文本機器翻譯領(lǐng)域,究竟誰能更勝一籌!
一、漢日雙向評測
評測樣本:
樣本隨機取自2020年最新的專利申請文獻,共計50句
評測時間:
評測時間為2020年4月2日
評測對象:
評測對象為科專笑飛機器翻譯系統(tǒng)和DeepL機器翻譯系統(tǒng)的當前最新翻譯結(jié)果結(jié)果取自兩系統(tǒng)官方網(wǎng)站翻譯界面:
科專笑飛:www.iptranslation.net
DeepL:https://www.deepl.com/translator
評測方式:
評測采取人工評測的方式
說明:人工評測,以國家語言文字工作委員會發(fā)布的機器翻譯譯文的人工評測標準為標準,若干名評測人員按照標準分別為兩種翻譯結(jié)果進行打分,分制為100分制。人工評測采用隨機評測,事先未告知評測人員所評系統(tǒng)相關(guān)具體細節(jié)及所閱讀的譯文是哪個系統(tǒng)的譯文,打分過程中評測人員無溝通,以此來盡可能地避免人工評測的主觀性。
漢-日方向評測結(jié)果:
漢-日方向評測結(jié)果如下表及柱狀圖:
日-漢方向評測結(jié)果:
日-漢方向評測結(jié)果如下表及柱狀圖:
評測結(jié)論:
從得分上來看,科專笑飛機器翻譯系統(tǒng)漢-日、日-漢雙向翻譯效果明顯優(yōu)于DeepL翻譯效果。
漢-日方向,科專笑飛機器翻譯系統(tǒng)的平均分比DeepL機器翻譯系統(tǒng)的得分高出了13.5分;日-漢方向,科專笑飛機器翻譯系統(tǒng)的平均分比DeepL機器翻譯系統(tǒng)的得分高出了9.5分;從雙向來說,兩者分差都比較大,這證明了科專笑飛機器翻譯系統(tǒng)漢-日、日-漢雙向翻譯要明顯優(yōu)于DeepL機器翻譯系統(tǒng)。
二、漢英雙向評測
評測樣本:
樣本隨機取自2020年最新的專利申請文獻,共計40段(約120句)
評測時間:
評測時間為2020年4月2日
評測對象:
評測對象為科專笑飛機器翻譯系統(tǒng)和DeepL機器翻譯系統(tǒng)的當前最新翻譯結(jié)果。結(jié)果取自兩系統(tǒng)官方網(wǎng)站翻譯界面:
科專笑飛:www.iptranslation.net
DeepL:https://www.deepl.com/translator
評測方式:
評測采取人工評測的方式
漢-英方向評測結(jié)果:
漢-英方向評測結(jié)果如下表及柱狀圖:
英-漢方向評測結(jié)果:
英-漢方向評測結(jié)果如下表及柱狀圖:
評測結(jié)論:
科專笑飛機器翻譯系統(tǒng)漢-英、英-漢雙向翻譯效果明顯優(yōu)于DeepL翻譯效果。
漢-英方向,科專笑飛機器翻譯系統(tǒng)的平均分比DeepL機器翻譯系統(tǒng)的得分高出了9.115分;英-漢方向,科專笑飛機器翻譯系統(tǒng)的平均分比DeepL機器翻譯系統(tǒng)的得分高出了5.34分;從雙向來說,兩者分差都比較大,這證明了科專笑飛機器翻譯系統(tǒng)漢-英、英-漢雙向翻譯要明顯優(yōu)于DeepL機器翻譯系統(tǒng)。
三、評測實例
評測團隊隨機抽取了評測實例,示例如下:
實例一:
結(jié)論:
科專笑飛的譯文在專利術(shù)語的選擇上更加地道,DEEPL的譯文在選詞翻譯方面按照原文進行直譯,雖然翻譯正確,但相對來說,表達不夠?qū)I(yè)地道。
實例二:
結(jié)論:
科專笑飛引擎對長句、長段落進行了綜合性的學(xué)習(xí)和處理,能夠保證整體的結(jié)構(gòu)完整。而DeepL的引擎在長段落整體翻譯時,會出現(xiàn)漏譯、句子信息缺失、翻譯不完整的情況。比如此例中,該引擎并沒有將句子完全翻譯完,丟失了句子后半部分的信息。
四、評測總結(jié)
從測試結(jié)果可以看出來,對于專利翻譯或科技文獻的翻譯,科專笑飛已經(jīng)做了專門的訓(xùn)練。以此同時對專利文本翻譯中的一些表達方式及格式處理也進行了優(yōu)化處理,更適合科技領(lǐng)域的文本翻譯。
知識產(chǎn)權(quán)出版社“秘密”進行的機器翻譯引擎研制項目究竟是什么來頭?
測試團隊從科專笑飛的官網(wǎng)了解到:
科專笑飛是由知識產(chǎn)權(quán)出版社自主研發(fā)的新一代人工智能多語種專利文獻機器翻譯系統(tǒng),實現(xiàn)了英、日、德等多語種與中文之間雙向的全自動機器翻譯和人機交互計算機輔助翻譯。
系統(tǒng)基于全球多語種專利文獻數(shù)據(jù),采用國際前沿的多策略神經(jīng)網(wǎng)絡(luò)機器翻譯核心技術(shù),融合模板、統(tǒng)計、規(guī)則、實例等多種機器翻譯方法,針對專利文獻特定域信息的用詞習(xí)慣、句法結(jié)構(gòu)以及語義選擇等特點,對翻譯知識庫進行優(yōu)化配置和構(gòu)建,使譯文達到了90%的準確率和商用推廣性,是幫助用戶實現(xiàn)知識產(chǎn)權(quán)領(lǐng)域多語言信息獲取和翻譯的有力工具。
其技術(shù)優(yōu)勢在于:
采用國際前沿的多策略神經(jīng)網(wǎng)絡(luò)機器翻譯核心技術(shù),融合模板、統(tǒng)計、規(guī)則、實例等多種機器翻譯方法,針對專利文獻特定域信息的用詞習(xí)慣、句法結(jié)構(gòu)以及語義選擇等特點,對翻譯知識庫進行優(yōu)化配置和構(gòu)建,使專利譯文達到了90%以上的準確率。
科技創(chuàng)新目前已經(jīng)成為全球未來競爭的核心,而科技文獻利用將成為未來科技創(chuàng)新技術(shù)情報的重要信息途徑,而機器翻譯正是解決全球跨語言技術(shù)應(yīng)用的加速器。
評測團隊驚嘆國內(nèi)AI技術(shù)在專利領(lǐng)域落地技術(shù)研發(fā)實力和技術(shù)先進性,類似科專笑飛這樣的最新產(chǎn)品也代表了目前全球技術(shù)機器翻譯引擎的最高水準。
相信未來,科專笑飛會給我們帶來更多的改變與驚喜!
來源:IPRdaily NnTech 新科技評測團隊
編輯:IPRdaily王穎 校對:IPRdaily縱橫君
點擊圖片,查看專題詳情!
「關(guān)于IPRdaily」
IPRdaily是具有全球影響力的知識產(chǎn)權(quán)媒體,致力于連接全球知識產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來自于中國、美國、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司及成長型科技企業(yè)的管理者及科技研發(fā)或知識產(chǎn)權(quán)負責(zé)人,還有來自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機構(gòu)的全球近100萬用戶(國內(nèi)70余萬+海外近30萬),2019年全年全網(wǎng)頁面瀏覽量已經(jīng)突破過億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來源IPRdaily NnTech 新科技評測團隊并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉(zhuǎn)載,請注明出處:“http://globalwellnesspartner.com/
文章不錯,犒勞下辛苦的作者吧