CN111680526B - 基于逆向翻译结果比对的人机交互翻译系统与方法 - Google Patents
基于逆向翻译结果比对的人机交互翻译系统与方法 Download PDFInfo
- Publication number
- CN111680526B CN111680526B CN202010508292.5A CN202010508292A CN111680526B CN 111680526 B CN111680526 B CN 111680526B CN 202010508292 A CN202010508292 A CN 202010508292A CN 111680526 B CN111680526 B CN 111680526B
- Authority
- CN
- China
- Prior art keywords
- translation
- engine
- reverse
- machine
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013519 translation Methods 0.000 title claims abstract description 352
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000002452 interceptive effect Effects 0.000 title claims description 6
- 238000011156 evaluation Methods 0.000 claims abstract description 78
- 230000003993 interaction Effects 0.000 claims abstract description 29
- 238000004891 communication Methods 0.000 claims abstract description 17
- 230000014616 translation Effects 0.000 claims description 330
- 102100031680 Beta-catenin-interacting protein 1 Human genes 0.000 claims description 17
- 101000993469 Homo sapiens Beta-catenin-interacting protein 1 Proteins 0.000 claims description 17
- 101100322245 Caenorhabditis elegans des-2 gene Proteins 0.000 claims description 9
- 101100222880 Diacronema lutheri Plesd1 gene Proteins 0.000 claims description 9
- 102100037416 Sphingolipid delta(4)-desaturase DES1 Human genes 0.000 claims description 9
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001915 proofreading effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 101100422762 Homo sapiens SI gene Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Machine Translation (AREA)
Abstract
本发明提出一种基于逆向翻译结果比对的人机交互翻译系统、利用该系统实现的基于集成化评测引擎进行翻译比对的人机共译方法以及实现该方法的计算机可读存储介质。所述人机交互翻译系统包括源译文输入接口、与所述源译文输入接口分别进行数据通信的三个机器翻译引擎、接收翻译结果并对其评测的评测引擎、逆向翻译引擎以及逆向比对模块;所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出;通过在在人机交互界面上高亮显示所述源译文与所述逆向翻译结果的差异部分;并排显示所述三个机器翻译引擎对于所述差异部分的翻译结果,从而利用实现人机共译。
Description
技术领域
本发明属于翻译技术领域,尤其涉及一种基于逆向翻译结果比对的人机交互翻译系统、利用该系统实现的基于集成化评测引擎进行翻译比对的人机共译方法以及实现该方法的计算机可读存储介质。
背景技术
机器翻译其实是利用计算机把一种自然语言翻译成另一种自然语言的过程,基本流程大概分为三块:预处理、核心翻译、后处理。预处理是对语言文字进行规整,把过长的句子通过标点符号分成几个短句子,过滤一些语气词和与意思无关的文字,将一些数字和表达不规范的地方,归整成符合规范的句子。核心翻译模块是将输入的字符单元、序列翻译成目标语言序列的过程,这是机器翻译中最关键最核心的地方。后处理模块是将翻译结果进行大小写的转化、建模单元进行拼接,特殊符号进行处理,使得翻译结果更加符合人们的阅读习惯。
在大规模的翻译工程时代,机器翻译工具的使用不可避免。然而,机器翻译的局限性导致其不可能完全替代人工翻译。尽管如此,如果选择了正确的翻译工具,翻译效率将大大提高,这是不可否认的。
现有技术已经存在各种不同语言之间的翻译工具与机器翻译引擎,包括各种伴随人工智能、大数据、深度学习技术发展起来的优化的机器翻译方案。
申请号为CN201810063565.2的中国发明专利申请提出一种基于深度学习的专业领域机器同步翻译装置及方法,推动同声传译从译员同传(Human SI)向机辅同传(Computer-aidedSI),再向最终的机器口译(Machine SI)发展。基于深度学习来一方面解决译员在同声传译现场出现的听不懂、记不住、译不出的困难,提高术语和固有表达的双语转换正确率,另一方面译员可以根据机器翻译在线即时进行译后编辑,提高译语的信息量,而且在一些场景能够替代译员实现延时一秒以内的准实时的同声传译功能。
申请号为CN201710203439.8的中国发明专利申请提出一种多语言智能预处理实时统计机器翻译系统,能够把一种语言的句子,篇章实时翻译成另一种语言,该系统能够翻译句子完整,表达正确,带有标点符号的文本语言,也能翻译没有段落分割,句子可能不完整,没有标点符号,句子里有噪音的语音;提高了对小概率词语、短语的翻译准确度,即将数字、日期、时间、URL等小概率词语分别标注并优先翻译;本发明的预处理模块能够对输入的句子进行规范化处理;本发明的后处理模块能够提高翻译结果的流畅度。
虽然机器翻译对翻译行业带来的冲击是致命的,承担不要求准确度的简单翻译任务的普通翻译人员将被机器彻底取代。但是,对于专业领域的翻译工作,目前看来,机器还不能胜任。但不能翻译的原因并不是其内容上有多么艰涩。事实上,专业领域翻译的难度其实不高,每个领域除了业内惯用的专有词汇以外,句法上往往还是严谨规范的写法居多,但专业翻译要求极高的准确性,机器无法承担出现错误所导致的严重后果。很多时候,一些过于专门的文件的翻译工作往往是由其领域的专业人士亲自上阵翻译的,这也解释了为什么一些概念的翻译极端拗口,符合逻辑而缺乏美感。
然而,在大规模翻译工程时代,仅仅依靠人工翻译显然不能满足效率需要,而一味的依靠机器翻译则无法满足准确度需要。不管机器翻译或者计算机辅助翻译的方案如何改进,人工编辑校对甚至翻译都不可缺少。此外,翻译人员通常根据经验、使用习惯结合翻译工具的特点来选择一种翻译工具,一旦选定,则基本不变。
然而,实践发现,不同的翻译工具的内核不同,对于同一种待译文本通常给出不同的结果;此外,对于相同的一份待译资料,其中不同的子部分,同一翻译工具的结果准确度也不一样。现有翻译人员对此通常十分困惑,并在多种翻译工具中来回徘徊,疲于选择翻译工具以及校对翻译结果。此类种种,原本用于提高翻译效率的翻译工具反而成了拖慢翻译节奏的累赘。
可见,如何平衡人工编辑翻译和机器翻译的工作时间、人工翻译何时接介入、以何种方式介入并且在保证准确度的同时能够满足大规模语义翻译的需要,现有技术并未给出有效的解决方案。
发明内容
为解决上述技术问题,本发明提出一种基于逆向翻译结果比对的人机交互翻译系统、利用该系统实现的基于集成化评测引擎进行翻译比对的人机共译方法以及实现该方法的计算机可读存储介质。所述人机交互翻译系统包括源译文输入接口、与所述源译文输入接口分别进行数据通信的三个机器翻译引擎、接收翻译结果并对其评测的评测引擎、逆向翻译引擎以及逆向比对模块;所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出;通过在在人机交互界面上高亮显示所述源译文与所述逆向翻译结果的差异部分;并且并排显示所述三个机器翻译引擎对于所述差异部分的翻译结果,从而利用在所述人机交互界面上提供编辑工具对所述差异部分的翻译结果进行编辑。本发明的技术方案能够最大程度的利用机器翻译的结果,同时最大可能的针对可能错误的翻译结果进行人工校对,在保证效率的同时,提高了准确度。
具体来说,在本发明的第一个方面,提供一种基于逆向翻译结果比对的人机交互翻译系统,所述人机交互翻译系统包括源译文输入接口。
作为关键的改进,在本发明的技术方案中,存在至少三个机器翻译引擎与具备可拆卸的通信接口的集成化评测引擎;
所述至少三个机器翻译引擎与所述源译文输入接口分别进行数据通信;所述三个机器翻译引擎分别输出第一目译文、第二目译文以及第三目译文;
作为本发明的重要创造性之一,所述三个机器翻译引擎为ICAT、TRADOS、LINGOES;
评测引擎接收所述第一目译文、第二目译文以及第三目译文并对其进行结果评测,输出所述第一目译文、第二目译文以及第三目译文的评测得分;
作为体现本发明创造性的关键技术手段之一,在本发明中,基于所述评测得分,选择所述第一目译文、第二目译文、第三目译文其中之一,作为逆向翻译引擎的输入;
具体而言,本发明是将最高评测得分对应的目译文,作为逆向翻译引擎的输入,这样能够最大程度的利用翻译结果最准确的机器引擎;
所述逆向翻译引擎对输入的目译文进行逆向翻译,将逆向翻译结果作为逆向比对模块的输入;
所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出;
其中,所述逆向翻译引擎为基于所述评测得分选择的所述三个机器翻译引擎之一,所述逆向翻译结果是将所述选择的目译文翻译成所述源译文对应的语种;
作为体现本发明创造性的关键技术手段之一,在本发明中,所述逆向翻译引擎为基于所述评测得分选择的所述三个机器翻译引擎之一,具体包括:
将评测得分最低的目译文对应的机器翻译引擎,作为所述逆向翻译引擎。
这样,可以最大可能的识别并且避免机器翻译的错误部分,便于后期人工编辑介入。
作为实现本发明技术效果的另一个关键技术手段,所述评测引擎包括基于句子级别的评测引擎和基于词语级别的评测引擎;所述评测引擎对外提供集成化的通信接口,通过所述通信接口与翻译引擎通信,并对所述翻译引擎的翻译结果进行评测。
在所述基于句子级别的评测引擎上,包括至少一个预测器,所述预测器采用双向LSTM进行建模,并且输出所述基于句子级别的评测引擎和所述基于词语级别的评估引擎各自输出结果的相似度;
在所述基于词语级别的评测引擎上,包括至少一个评估器,所述评估器用于评估所述基于句子级别的评测引擎和所述基于词语级别的评估引擎各自输出结果的差异度。
进一步的,作为体现人机交互效果的重要组成部分,所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出,具体包括:
在人机交互界面上高亮显示所述源译文与所述逆向翻译结果的差异部分;
并且并排显示所述三个机器翻译引擎对于所述差异部分的翻译结果。
进一步的,本发明的技术方案中,还在所述人机交互界面上提供编辑工具,所述编辑工具用于对所述差异部分的翻译结果进行编辑。
利用上述第一个方面的人机交互翻译系统,可以实现集成机器翻译和人工校对的人机交互翻译方法,因此,在本发明的第二个方面,提供一种利用集成化评测引擎进行翻译比对的人机共译方法,具体而言,所述方法包括如下步骤:
S100:接收源译文source;
S200:分别利用机器翻译引擎ICAT、TRADOS、LINGOES对所述源译文进行翻译,各自输出第一目译文des1、第二目译文des2以及第三目译文des3;
S300:将具备可拆卸的集成化通信接口的评测引擎并行连接至所述ICAT、TRADOS、LINGOES的输出端,获得所述第一目译文des1、第二目译文des2以及第三目译文des3后,对其进行评测,获取第一评测得分score1、第二评测得分score2以及第三评测得分score3;
S400:计算max{score1,score2,score3}以及min{score1,score2,score3};
S500:将min{score1,score2,score3}对应的机器翻译引擎作为逆向翻译引擎,并将max{score1,score2,score3}对应的目译文输入至所述逆向翻译引擎,输出逆向翻译结果-Des;
S600:将逆向翻译结果-Des与源译文source进行相似度以及差异度比对;
S700:在所述人机交互界面上对差异部分的翻译结果进行编辑。
在所述步骤S600之后,在步骤S700之前,还包括:
在人机交互界面上高亮显示所述源译文与所述逆向翻译结果的差异部分;
并且并排显示机器翻译引擎ICAT、TRADOS、LINGOES对于所述差异部分的翻译结果。
本发明的上述方法可以通过计算机指令形式的程序代码实现,因此,本发明还提供计算机可读存储介质,其上存储有计算机可执行指令,通过包含存储器和处理器的通信终端,执行所述可执行指令,用于实现前述利用集成化评测引擎进行翻译比对的人机共译方法。
本发明的进一步优点将结合说明书附图在具体实施例部分进一步详细体现。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的人机交互翻译系统的整体架构图。
图2是图1所述系统中评测引擎的工作架构图。
图3是图1所述系统中人机交互界面的显示示意图。
图4是利用图1所述系统实现的人机共译方法流程图。
具体实施方式
下面,结合附图以及具体实施方式,对发明做出进一步的描述。
参照图1,本发明一个实施例的基于逆向翻译结果比对的人机交互翻译系统的整体架构图。
图1中,所述人机交互系统包括源译文输入接口、三个机器翻译引擎ICAT、TRADOS、LINGOES、评测引擎、逆向翻译引擎以及逆向比对模块。
在本实施例中,三个机器翻译引擎与具备可拆卸的通信接口的集成化评测引擎通信;
所述至少三个机器翻译引擎与所述源译文输入接口分别进行数据通信;所述三个机器翻译引擎分别输出第一目译文、第二目译文以及第三目译文;
评测引擎接收所述第一目译文、第二目译文以及第三目译文并对其进行结果评测,输出所述第一目译文、第二目译文以及第三目译文的评测得分;
基于所述评测得分,选择所述第一目译文、第二目译文、第三目译文其中之一,作为逆向翻译引擎的输入;
具体而言,在本实施中,是将最高评测得分对应的目译文,作为逆向翻译引擎的输入,这样能够最大程度的利用翻译结果最准确的机器引擎;这是本发明的关键实现之一;
所述逆向翻译引擎为基于所述评测得分选择的所述三个机器翻译引擎之一,所述逆向翻译结果是将所述选择的目译文翻译成所述源译文对应的语种;
具体而言,在本实施例中,所述逆向翻译引擎对输入的目译文进行逆向翻译,将逆向翻译结果作为逆向比对模块的输入;
所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出;
所述逆向翻译引擎为基于所述评测得分选择的所述三个机器翻译引擎之一,具体包括:
将评测得分最低的目译文对应的机器翻译引擎,作为所述逆向翻译引擎。
这样,可以最大可能的识别并且避免机器翻译的错误部分,便于后期人工编辑介入。
在图1基础上,进一步参见图2,图1所述系统中评测引擎的工作架构图。
在图2中,所述评测引擎包括基于句子级别的评测引擎和基于词语级别的评测引擎;所述评测引擎对外提供集成化的通信接口,通过所述通信接口与翻译引擎通信,并对所述翻译引擎的翻译结果进行评测。
在所述基于句子级别的评测引擎上,包括至少一个预测器,所述预测器采用双向LSTM进行建模,并且输出所述基于句子级别的评测引擎和所述基于词语级别的评估引擎各自输出结果的相似度;
在所述基于词语级别的评测引擎上,包括至少一个评估器,所述评估器用于评估所述基于句子级别的评测引擎和所述基于词语级别的评估引擎各自输出结果的差异度。
接下来参见图3,作为体现人机交互效果的重要组成部分,所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出,具体包括:
在人机交互界面上高亮显示所述源译文与所述逆向翻译结果的差异部分;
并且并排显示所述三个机器翻译引擎对于所述差异部分的翻译结果。
进一步的,图3所述的实例中,虽然未示出,但是在所述人机交互界面上还提供编辑工具,所述编辑工具用于对所述差异部分的翻译结果进行编辑。
在图1-3基础上,图4提供一种人机共译方法的流程图。所述方法包括步骤S100-S700,具体来说,各个步骤实现方式如下:
S100:接收源译文source;
S200:分别利用机器翻译引擎ICAT、TRADOS、LINGOES对所述源译文进行翻译,各自输出第一目译文des1、第二目译文des2以及第三目译文des3;
S300:将具备可拆卸的集成化通信接口的评测引擎并行连接至所述ICAT、TRADOS、LINGOES的输出端,获得所述第一目译文des1、第二目译文des2以及第三目译文des3后,对其进行评测,获取第一评测得分score1、第二评测得分score2以及第三评测得分score3;
S400:计算max{score1,score2,score3}以及min{score1,score2,score3};
S500:将min{score1,score2,score3}对应的机器翻译引擎作为逆向翻译引擎,并将max{score1,score2,score3}对应的目译文输入至所述逆向翻译引擎,输出逆向翻译结果-Des;
S600:将逆向翻译结果-Des与源译文source进行相似度以及差异度比对;
S700:在所述人机交互界面上对差异部分的翻译结果进行编辑。
在所述步骤S600之后,在步骤S700之前,还包括:
在人机交互界面上高亮显示所述源译文与所述逆向翻译结果的差异部分;
并且并排显示机器翻译引擎ICAT、TRADOS、LINGOES对于所述差异部分的翻译结果。
值得指出的是,在本发明中,ICAT是本发明的申请人相关单位的云译客团队面向翻译市场推出的一款翻译工具,TRADOS则是国际上早期发布的翻译软件;Lingoes即灵格斯翻译软件。本申请的发明人充分研究并比对了市面上各种机器翻译引擎的特点,从而选择了这三种翻译工具进行组合,从而既能最大程度的满足机器翻译的效率,也能最有可能的发现翻译结果的缺陷。
具体来说,发明人发现,ICAT、TRADOS和Lingoes内核完全不同,TRADOS具备重复记忆功能,因此适用于文本分布特性趋于一致的待译资料的翻译,而ICAT则侧重于云端系统更新,因此,对于分散性的待译资料效果更好;Lingoes则兼有其他各种软件的不足,作为上述两款软件的补充,可以更好的校正翻译结果。
作为优选,如果三款翻译工具的评分均接近,则选择Lingoes作为机器翻译工具并进行编辑校对。
实验数据表明,本发明的技术方案能够最大程度的利用机器翻译的结果,同时最大可能的针对可能错误的翻译结果进行人工校对,在保证效率的同时,提高了准确度。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (6)
1.一种基于逆向翻译结果比对的人机交互翻译系统,所述人机交互翻译系统包括源译文输入接口,其特征在于:
三个机器翻译引擎ICAT、TRADOS、LINGOES与所述源译文输入接口分别进行数据通信;所述三个机器翻译引擎分别输出第一目译文、第二目译文以及第三目译文;
评测引擎接收所述第一目译文、第二目译文以及第三目译文并对其进行结果评测,输出所述第一目译文、第二目译文以及第三目译文的评测得分;基于所述评测得分,将最高评测得分对应的目译文,作为逆向翻译引擎的输入;
所述逆向翻译引擎对输入的目译文进行逆向翻译,将逆向翻译结果作为逆向比对模块的输入;所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出;
其中,
将评测得分最低的目译文对应的机器翻译引擎,作为所述逆向翻译引擎,所述逆向翻译结果是将选择的目译文翻译成所述源译文对应的语种;
在人机交互界面上高亮显示所述源译文与所述逆向翻译结果的差异部分,并在人机交互界面上提供编辑工具,所述编辑工具用于对所述差异部分的翻译结果进行编辑;如果三个机器翻译引擎ICAT、TRADOS、LINGOES的评测得分均接近,则选择Lingoes作为机器翻译工具并进行编辑校对;
所述评测引擎包括基于句子级别的评测引擎和基于词语级别的评测引擎;
在所述基于句子级别的评测引擎上,包括至少一个预测器,所述预测器采用双向LSTM进行建模,并且输出所述基于句子级别的评测引擎和所述基于词语级别的评估引擎各自输出结果的相似度;
在所述基于词语级别的评测引擎上,包括至少一个评估器,所述评估器用于评估所述基于句子级别的评测引擎和所述基于词语级别的评估引擎各自输出结果的差异度。
2.如权利要求1所述的人机交互翻译系统,其特征在于:并排显示所述三个机器翻译引擎ICAT、TRADOS、LINGOES对于所述差异部分的翻译结果。
3.如权利要求1所述的人机交互翻译系统,其特征在于:
所述评测引擎对外提供集成化的通信接口,通过所述通信接口与翻译引擎通信,并对所述翻译引擎的翻译结果进行评测。
4.一种利用集成化评测引擎进行翻译比对的人机共译方法,所述方法采用权利要求1-3任一项所述的人机交互翻译系统实现,其特征在于,所述方法包括如下步骤:
S100:接收源译文source;
S200:分别利用机器翻译引擎ICAT、TRADOS、LINGOES对所述源译文进行翻译,各自输出第一目译文des1、第二目译文des2以及第三目译文des3;
S300:将具备可拆卸的集成化通信接口的评测引擎并行连接至所述ICAT、TRADOS、LINGOES的输出端,获得所述第一目译文des1、第二目译文des2以及第三目译文des3后,对其进行评测,获取第一评测得分score1、第二评测得分score2以及第三评测得分score3;
S400:计算max{score1,score2,score3}以及min{score1,score2,score3};
S500:将min{score1,score2,score3}对应的机器翻译引擎作为逆向翻译引擎,并将max{score1,score2,score3}对应的目译文输入至所述逆向翻译引擎,输出逆向翻译结果-Des;
S600:将逆向翻译结果-Des与源译文source进行相似度以及差异度比对;
S700:在所述人机交互界面上对差异部分的翻译结果进行编辑。
5.如权利要求4所述的方法,其特征在于:
在所述步骤S600之后,在步骤S700之前,还包括:
在人机交互界面上高亮显示所述源译文与所述逆向翻译结果的差异部分;
并且并排显示机器翻译引擎ICAT、TRADOS、LINGOES对于所述差异部分的翻译结果。
6.一种计算机可读存储介质,其上存储有计算机可执行程序指令,通过存储器和处理器执行所述可执行程序指令,用于实现权利要求4或5所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010508292.5A CN111680526B (zh) | 2020-06-09 | 2020-06-09 | 基于逆向翻译结果比对的人机交互翻译系统与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010508292.5A CN111680526B (zh) | 2020-06-09 | 2020-06-09 | 基于逆向翻译结果比对的人机交互翻译系统与方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111680526A CN111680526A (zh) | 2020-09-18 |
CN111680526B true CN111680526B (zh) | 2023-09-08 |
Family
ID=72435220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010508292.5A Active CN111680526B (zh) | 2020-06-09 | 2020-06-09 | 基于逆向翻译结果比对的人机交互翻译系统与方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111680526B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112818709B (zh) * | 2021-01-19 | 2024-02-27 | 传神语联网网络科技股份有限公司 | 用于多用户语音会议记录标记的语音翻译系统与方法 |
CN112818706B (zh) * | 2021-01-19 | 2024-02-27 | 传神语联网网络科技股份有限公司 | 基于逆向结果稳定性的语音翻译实时争端记录系统与方法 |
CN112818705B (zh) * | 2021-01-19 | 2024-02-27 | 传神语联网网络科技股份有限公司 | 基于组间共识的多语种语音翻译系统与方法 |
CN112818707B (zh) * | 2021-01-19 | 2024-02-27 | 传神语联网网络科技股份有限公司 | 基于逆向文本共识的多翻引擎协作语音翻译系统与方法 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040065468A (ko) * | 2003-01-14 | 2004-07-22 | 주식회사 크로스랭귀지 (영업소) | 특허문서의 다국어 번역 처리방법 및 이 번역소프트웨어를 기록한 판독 가능한 기록매체 |
JP2007149112A (ja) * | 2007-01-05 | 2007-06-14 | Nec Corp | 翻訳支援装置、翻訳支援システム及び翻訳支援プログラム |
CN102043774A (zh) * | 2011-01-13 | 2011-05-04 | 北京交通大学 | 机器翻译测评装置和方法 |
CN102662934A (zh) * | 2012-04-01 | 2012-09-12 | 百度在线网络技术(北京)有限公司 | 一种在跨语言交流中对译文进行验证的方法和装置 |
US8756050B1 (en) * | 2010-09-14 | 2014-06-17 | Amazon Technologies, Inc. | Techniques for translating content |
GB201721633D0 (en) * | 2017-12-21 | 2018-02-07 | Exp Ltd | Improvements in or relating to translation |
JP2018022269A (ja) * | 2016-08-02 | 2018-02-08 | 国立研究開発法人情報通信研究機構 | 自動翻訳システム、自動翻訳方法、およびプログラム |
CN108804428A (zh) * | 2018-06-12 | 2018-11-13 | 苏州大学 | 一种译文中术语错译的纠正方法、系统及相关装置 |
JP2018206356A (ja) * | 2017-06-08 | 2018-12-27 | パナソニックIpマネジメント株式会社 | 翻訳情報提供方法、翻訳情報提供プログラム、及び翻訳情報提供装置 |
CN109190132A (zh) * | 2018-11-02 | 2019-01-11 | 语联网(武汉)信息技术有限公司 | 翻译质量测评方法及装置 |
CN109299481A (zh) * | 2018-11-15 | 2019-02-01 | 语联网(武汉)信息技术有限公司 | 机器翻译引擎推荐方法、装置及电子设备 |
CN109558602A (zh) * | 2018-11-21 | 2019-04-02 | 传神语联网网络科技股份有限公司 | 翻译工具的分布式选择与融合 |
CN109710948A (zh) * | 2018-11-27 | 2019-05-03 | 语联网(武汉)信息技术有限公司 | 机器翻译引擎推荐方法及装置 |
CN110543643A (zh) * | 2019-08-21 | 2019-12-06 | 语联网(武汉)信息技术有限公司 | 文本翻译模型的训练方法及装置 |
CN110705318A (zh) * | 2019-09-04 | 2020-01-17 | 南京题麦壳斯信息科技有限公司 | 一种机器翻译引擎测评优选方法及系统 |
CN110991193A (zh) * | 2019-11-27 | 2020-04-10 | 语联网(武汉)信息技术有限公司 | 一种基于OpenKiWi的翻译矩阵模型选择系统 |
CN111144134A (zh) * | 2019-11-27 | 2020-05-12 | 语联网(武汉)信息技术有限公司 | 基于OpenKiWi的翻译引擎自动化评测系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8843359B2 (en) * | 2009-02-27 | 2014-09-23 | Andrew Nelthropp Lauder | Language translation employing a combination of machine and human translations |
FI125823B (en) * | 2011-11-03 | 2016-02-29 | Rex Partners Oy | A measure of the quality of machine translation |
KR102458244B1 (ko) * | 2017-11-23 | 2022-10-24 | 삼성전자주식회사 | 기계 번역 방법 및 장치 |
-
2020
- 2020-06-09 CN CN202010508292.5A patent/CN111680526B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004220616A (ja) * | 2003-01-14 | 2004-08-05 | Cross Language Inc | 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置 |
KR20040065468A (ko) * | 2003-01-14 | 2004-07-22 | 주식회사 크로스랭귀지 (영업소) | 특허문서의 다국어 번역 처리방법 및 이 번역소프트웨어를 기록한 판독 가능한 기록매체 |
JP2007149112A (ja) * | 2007-01-05 | 2007-06-14 | Nec Corp | 翻訳支援装置、翻訳支援システム及び翻訳支援プログラム |
US8756050B1 (en) * | 2010-09-14 | 2014-06-17 | Amazon Technologies, Inc. | Techniques for translating content |
CN102043774A (zh) * | 2011-01-13 | 2011-05-04 | 北京交通大学 | 机器翻译测评装置和方法 |
CN102662934A (zh) * | 2012-04-01 | 2012-09-12 | 百度在线网络技术(北京)有限公司 | 一种在跨语言交流中对译文进行验证的方法和装置 |
JP2018022269A (ja) * | 2016-08-02 | 2018-02-08 | 国立研究開発法人情報通信研究機構 | 自動翻訳システム、自動翻訳方法、およびプログラム |
JP2018206356A (ja) * | 2017-06-08 | 2018-12-27 | パナソニックIpマネジメント株式会社 | 翻訳情報提供方法、翻訳情報提供プログラム、及び翻訳情報提供装置 |
GB201721633D0 (en) * | 2017-12-21 | 2018-02-07 | Exp Ltd | Improvements in or relating to translation |
CN108804428A (zh) * | 2018-06-12 | 2018-11-13 | 苏州大学 | 一种译文中术语错译的纠正方法、系统及相关装置 |
CN109190132A (zh) * | 2018-11-02 | 2019-01-11 | 语联网(武汉)信息技术有限公司 | 翻译质量测评方法及装置 |
CN109299481A (zh) * | 2018-11-15 | 2019-02-01 | 语联网(武汉)信息技术有限公司 | 机器翻译引擎推荐方法、装置及电子设备 |
CN109558602A (zh) * | 2018-11-21 | 2019-04-02 | 传神语联网网络科技股份有限公司 | 翻译工具的分布式选择与融合 |
CN109710948A (zh) * | 2018-11-27 | 2019-05-03 | 语联网(武汉)信息技术有限公司 | 机器翻译引擎推荐方法及装置 |
CN110543643A (zh) * | 2019-08-21 | 2019-12-06 | 语联网(武汉)信息技术有限公司 | 文本翻译模型的训练方法及装置 |
CN110705318A (zh) * | 2019-09-04 | 2020-01-17 | 南京题麦壳斯信息科技有限公司 | 一种机器翻译引擎测评优选方法及系统 |
CN110991193A (zh) * | 2019-11-27 | 2020-04-10 | 语联网(武汉)信息技术有限公司 | 一种基于OpenKiWi的翻译矩阵模型选择系统 |
CN111144134A (zh) * | 2019-11-27 | 2020-05-12 | 语联网(武汉)信息技术有限公司 | 基于OpenKiWi的翻译引擎自动化评测系统 |
Non-Patent Citations (1)
Title |
---|
统计机器翻译综述;刘群;中文信息学报(04);2-13 * |
Also Published As
Publication number | Publication date |
---|---|
CN111680526A (zh) | 2020-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111680526B (zh) | 基于逆向翻译结果比对的人机交互翻译系统与方法 | |
CN110532573B (zh) | 一种翻译方法和系统 | |
CN109783826B (zh) | 一种文档自动翻译方法 | |
Do Carmo et al. | Differentiating editing, post-editing and revision | |
JP2963463B2 (ja) | 対話型言語解析装置 | |
Novák et al. | Creation of an annotated corpus of Old and Middle Hungarian court records and private correspondence | |
ITUD20000228A1 (it) | Sistema e metodo di traduzione automatica o semiautomatica con posteditazione per la correzione degli errori | |
CN103116578A (zh) | 一种融合句法树和统计机器翻译技术的翻译方法与装置 | |
JPS62163173A (ja) | 機械翻訳方法 | |
CN111680524B (zh) | 基于逆向矩阵分析的人机反馈翻译方法与系统 | |
CN110688863A (zh) | 一种文档翻译系统及文档翻译方法 | |
CN112800184A (zh) | 基于Target-Aspect-Opinion联合抽取的短文本评论情感分析方法 | |
Krielke et al. | Tracing syntactic change in the scientific genre: Two Universal Dependency-parsed diachronic corpora of scientific English and German | |
CN117473971A (zh) | 一种基于采购文本库的招标文件自动生成方法及系统 | |
CN111680525B (zh) | 基于逆向差异识别的人机共译方法与系统 | |
Nzuanke et al. | Technology and translation: the impact of recent technology tools on professional translation | |
CN102955842A (zh) | 一种多特征融合识别中文机构名的控制方法 | |
CN107491443B (zh) | 一种包含非常规词汇的中文句子翻译方法及系统 | |
CN107870905B (zh) | 一种特定词汇的识别方法 | |
MILAD | Comparative evaluation of translation memory (tm) and machine translation (mt) systems in translation between arabic and english | |
Blahuš et al. | Extending Czech WordNet using a bilingual dictionary | |
AlOtaibi | Statistical MT Training for the translation of English-Arabic UN Resolutions | |
CN115965017B (zh) | 一种基于开发平台的多语言录入和解析系统及方法 | |
AlShuhayeb et al. | Noor-Ghateh: A Benchmark Dataset for Evaluating Arabic Word Segmenters in Hadith Domain | |
CN118569275A (zh) | 一种多语言会议的实现方法、系统、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |