CN111160048A

CN111160048A - 一种基于聚类进化的翻译引擎优化系统及方法

Info

Publication number: CN111160048A
Application number: CN201911164194.8A
Authority: CN
Inventors: 刘婧婧
Original assignee: Iol Wuhan Information Technology Co ltd
Current assignee: Iol Wuhan Information Technology Co ltd
Priority date: 2019-11-27
Filing date: 2019-11-27
Publication date: 2020-05-15
Anticipated expiration: 2039-11-27
Also published as: CN111160048B

Abstract

本发明提出一种基于聚类进化的翻译引擎优化系统、方法以及对应的计算机可读存储介质和OpenKiwi评测系统，属于翻译技术领域。所述引擎优化系统包括文档输入子系统、与所述文档输入子系统输出连接的聚类子系统、以及与所述聚类子系统反馈连接的自动评测模型系统。本发明引入评测矩阵，并且基于评测矩阵的特征根判断使得内部的基础数据会不断迭代，使得基础数据的质量和有效性得到保障，通过引擎映射表将某个类别的最佳引擎，或者最好的几个引擎的排序进行映射的表；同时引入openkiwi和人工反馈干预，能够使得整个评测过程客观准确，优化进化无需先验规则，从而进化/选择出最佳的翻译引擎。

Description

一种基于聚类进化的翻译引擎优化系统及方法

技术领域

本发明属于翻译技术领域，尤其涉及一种基于聚类进化的翻译引擎优化系统、方法以及对应的计算机可读存储介质和OpenKiwi评测系统。

背景技术

在人工智能火热的时代，当下的机器翻译引擎众多，译员应该如何选择适合自己的翻译引擎，成为一个亟待解决的技术问题；同时，已有的翻译引擎如何根据实际翻译结果以及人工反馈不断进化选择，已经成为制约翻译效率的重要因素。

近年来，在自然语言研究领域中，评测问题越来越受到广泛的重视，可以说，评测是整个自然语言领域最核心和关键的部分。而机器翻译评价对于机器翻译的研究和发展具有重要意义：机器翻译系统的开发者可以通过评测得知系统存在的问题而不断进化，用户也可以根据评测报告选择满足自己需求的产品，而对于机器翻译的研究人员来说，评测能够给他们的技术发展方向提供最可靠的依据。

机器翻译领域最困难的任务之一就是对给定的翻译系统或者翻译算法进行评价，我们称其为机器翻译评测。由于机器翻译所处理的对象——语言本身存在某种程度的歧义，无法像数学公式或者物理模型那样简单客观地描述出来，这使得为机器翻译结果进行客观的打分变得非常困难。最早的方法是人工评测，这种方法得到的结果一般是十分准确的，但评测的成本太高，周期过长(评测过程可能长达几周甚至数月)，评价结果也会随着评价人的变化和时间的推移而不同，这使得评价结果不可重复，缺乏客观性。因此，机器翻译的自动评测应运而生。实践证明，机器翻译的评测尤其是自动评测对机器翻译研究的影响十分巨大，对研究发展和技术进步起着非常重要的引导作用。

申请号为CN201710877029.1的中国发明专利申请提出一种多译员模式下翻译知识有效性判别方法，为多译员模式下翻译知识的有效性判别提供了方法，通过分析译员的翻译状态，来评价系统从译员反馈中学到的翻译知识的有效性，有助于解决来自不同译员反馈的翻译知识存在冲突的问题，实现不同译员翻译知识的有效融合，改善翻译引擎的优化效果，降低人机交互代价，提高翻译效率；申请号为CN201910131256.9的中国发明专利申请提出一种MerCube机器翻译管理控制系统及方法、计算机程序，融合了多项业界领先的机器翻译系统技术，包含神经网络机器翻译技术、统计机器翻译技术、专业术语翻译技术以及翻译记忆库技术等。其中神经网络机器翻译技术主要采用基于Attention的机器翻译模型框架，是一种新型的以注意力机制为主的编码器到解码器的机器翻译结构；符合工业应用标准的数据前处理与后处理技术，在保证处理速度的前提下大幅提升了翻译的准确性。

评价的目的通常是对于给定的待译文档选择最合适的翻译引擎。现有技术对于翻译引擎的自动评测通常都是直接进行，其评测过程虽然是自动化进行，但是评测结果很大程度上取决于自动评测过程所采用的的标准和算法，而这些标准和算法大部分都是通过先验规则阈值的，事实上使得评测结果带有较强的主观性，导致选择结果准确度不高，客观性存疑。例如，传统的基于参考译文的自动评测方法就是如此，已很难满足技术发展和广大用户的需求。

发明内容

为解决上述技术问题，本发明提出一种基于聚类进化的翻译引擎优化系统、方法以及对应的计算机可读存储介质和OpenKiwi评测系统。本发明的技术方案将自学习，自动翻译质量评测，人工反馈等进行有机结合，对机翻擅长领域以很小的颗粒度进行区分以形成“小行业”，然后自动化的迭代评价出这些小行业上翻译引擎的表现度。通过引擎映射表将某个类别的最佳引擎，或者最好的几个引擎的排序进行映射的表。此表是整个系统的优化的最终目标，即需要将某个类映射到最好的引擎这一步达到最优，同时引入openkiwi和人工反馈干预，能够使得整个评测过程客观准确，优化进化无需先验规则，从而进化/选择出最佳的翻译引擎。

在本发明的第一个方面，提出一种基于聚类进化的翻译引擎优化系统，所述引擎优化系统包括文档输入子系统、与所述文档输入子系统输出连接的聚类子系统、以及与所述聚类子系统反馈连接的自动评测模型系统；

通过所述文档输入子系统输入待译文档，所述聚类子系统基于所述待译文档数据属性进行内聚划分，得到所述待译文档的多个分类；

需要指出的是，作为本发明技术方案实现过程中的客观性规律体现，本发明选用聚类而不是分类。这是因为，聚类是按照数据内部自身的属性进行内聚划分，而分类则需要人为的预先制定类别。机翻的翻译质量不一定是对某个人认为的类别效果就好，而聚类直接使用数据内部性质，有助于提升引擎的翻译准确度。

具体而言，其中，所述聚类子系统基于所述待译文档数据属性进行内聚划分，包括：采用高斯混合模型(GMM)，并使用期望最大算法训练所述模型。

所述引擎优化系统还包括引擎映射数据表，所述引擎映射数据表存储有分类数据及其对应的至少一个翻译引擎；

基于所述待译文档的多个分类，所述引擎映射数据表选择对应的多个翻译引擎，对所述待译文档进行翻译，并输出多个翻译结果,所述翻译结果包括每一种分类Ji(i＝1，……，N)对应的N个翻译引擎的翻译结果TR_i1,TR_i2,……TR_iN；

作为体现本发明的创新点之一，所述自动评测模型系统对所述翻译结果进行评测，具体包括：

将所述翻译结果转化成N阶评测矩阵P_N；

计算所述N阶评测矩阵P_N的特征根；

如果所有特征根的绝对值均小于1，则输出所述评测矩阵P_N对角线元素对应的翻译结果，并将所述对角线元素对应的翻译结果更新到所述引擎映射数据表中；

否则，依次计算所述N阶评测矩阵P_N的M阶子矩阵P_M的特征根，直到所述M阶子矩阵P_M的所有特征根的绝对值均小于1，其中，所述M＝N-1，N-2，……2。

具体而言，其中，将所述翻译结果转化成N阶评测矩阵P_N，具体包括：

对每一种分类Ji(i＝1，……，N)对应的N个翻译引擎的翻译结果TR_i1,TR_i2,……TR_iN进行评分，得到每一种分类Ji(i＝1，……，N)对应的N个翻译引擎的翻译结果TR_i1,TR_i2,……TR_iN的评分数值F_i1,F_i2,……F_in；

则所述N阶评测矩阵P_N为：

作为体现本发明的客观迭代进化的重要技术手段，如果M阶子矩阵P_M的特征根的绝对值均小于1，则将N阶评测矩阵P_N中除M阶子矩阵P_M之外的其他元素对应的其他翻译结果反馈给所述自动评测模型系统，所述自动评测模型系统再次对所述其他翻译结果进行评测。

在本发明第二个方面，提供一种翻译引擎的评测系统优化方法，所述方法可以在前述基于聚类进化的翻译引擎优化系统上运行，该方法包括如下步骤：

S101：输入待译文档；

S102：对所述待译文档进行内聚划分，得到多个分类类别；

S103：针对每一个分类类别，利用所述评测系统中储存的引擎映射数据表，选择选择对应的多个翻译引擎，对所述待译文档进行翻译，得到多个翻译结果；

作为本方法的最重要的创新之处，本方法利用OpenKiwi对所述多个翻译结果进行评测，并将评测结果进行相对量化的归一化评分，得到N阶评测矩阵P_N；

同时，为了使得迭代优化客观执行，令K＝N，执行如下迭代计算：

S201：计算K阶矩阵P_K的2-范数；

S202：判断所述2-范数是否小于1；

如果是，则输出所述评测矩阵P_K对角线元素对应的翻译结果，并将所述对角线元素对应的翻译结果更新到所述引擎映射数据表中；

否则，令K＝K-1；判断K是否大于1，如果是，返回步骤S201；否则，退出；

其中，当K<N时，P_K为N阶评测矩阵P_N的K阶子矩阵。

进一步的，如果所述方法退出时，所述引擎映射数据表仍未得到更新，则引入人工反馈参数，重新执行所述步骤S102。

上述手段同时引入openkiwi和人工反馈干预，能够使得整个评测过程客观准确，优化进化无需先验规则，从而进化/选择出最佳的翻译引擎。

其中，将评测结果进行相对量化的归一化评分，得到N阶评测矩阵P_N，具体包括：

则所述N阶评测矩阵P_N为：

作为优选，其中，步骤S102采用高斯混合模型(GMM)，并使用期望最大算法训练所述模型后，利用所述模型对所述待译文档进行内聚划分，得到多个分类类别。

训练流程需要在GMM聚类中不断优选迭代聚类模型，使得其分类最具代表性；翻译矩阵会将所有引擎的翻译都输出；openkiwi是一个深度自动质量评价引擎，会自动对翻译质量进行评价；人工反馈是加入人工的外在信息，灌入系统以新的信息，提升系统的优化天花板；

本发明还提供一种计算机可读存储介质，其上存储有计算机可执行指令，通过处理器执行所述可执行指令，用于实现所述的翻译引擎的评测系统优化方法。

此外，配合上述方法和系统，本发明还提供一种OpenKiwi评测系统，所述评测系统连接所述的基于聚类进化的引擎优化系统，用于实现翻译引擎的评测系统优化方法。

采用本发明的技术方案，实现系统自迭代，用尽量少的成本达到尽量好的效果，主要优势如下：

1)使用GMM聚类取代分类，尽量使用文本的内生性质就行聚合，这样有效提升他们内在相似一致性；

2)引入评测矩阵，并且基于评测矩阵的特征根判断使得内部的基础数据会不断迭代，使得基础数据的质量和有效性得到保障；

3)使用openkiwi深度评测框架进行评测，有效节省了人力时间成本，将原始文本信息有效性吃够；

4)人工不断反馈干预，系统在一定迭代程度后，如果没有适当有效反馈进行输入，整个系统迭代是处于一种无法优化的平衡状态，如果需要系统继续优化，则需要有效信息的输入，不断人工干预则提供了这一信息。

本发明的进一步优点将结合说明书附图，通过具体的实施例进一步体现。

附图说明

图1是本发明一个实施例的翻译引擎优化系统框架图

图2是图1所述系统的评测进化流程图

图3本发明一个实施例的评测系统优化方法流程图

图4是图3所述方法的迭代计算具体实现方式

图5是图1-4所述迭代计算中所述M阶子矩阵的一个示意图

图6是本发明一个实施例的OpenKiwi评测系统结构示意图

具体实施例

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和实施例对本发明做进一步说明。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

参见图1，示出一种基于聚类进化的翻译引擎优化系统，所述引擎优化系统包括文档输入子系统、与所述文档输入子系统输出连接的聚类子系统、以及与所述聚类子系统反馈连接的自动评测模型系统；

其中，通过所述文档输入子系统输入待译文档，所述聚类子系统基于所述待译文档数据属性进行内聚划分，得到所述待译文档的多个分类；

所述自动评测模型系统对所述翻译结果进行评测后，得到N评测矩阵P_N。

进一步结合图2，所述自动评测模型系统对所述翻译结果进行评测，具体包括：

将所述翻译结果转化成N阶评测矩阵P_N；

计算所述N阶评测矩阵P_N的特征根；

作为一个实例，将所述翻译结果转化成N阶评测矩阵P_N，具体包括：

则所述N阶评测矩阵P_N为：

所述N阶评测矩阵P_N的M阶子矩阵P_M，是指所述N阶评测矩阵P_N中连续M行M列元素组成的子矩阵；

图5给出了M＝N-1时，所述迭代计算中所述M阶子矩阵的一个示意图。

如果M阶子矩阵P_M的特征根的绝对值均小于1，则将N阶评测矩阵P_N中除M阶子矩阵P_M之外的其他元素对应的其他翻译结果反馈给所述自动评测模型系统，所述自动评测模型系统再次对所述其他翻译结果进行评测。

如果不存在评测矩阵或者子矩阵的特征根均小于1的情形，则所述聚类子系统引入人工反馈参数，重新进行聚类。

在这里，本发明首次将矩阵特征根的性质应用到翻译领域的评测中。根据赫尔维兹稳定性判据，当矩阵主行列式及其对角线上各子行列式均具有正值时，系统稳定有效。本发明将这一论据结合翻译评测评分矩阵，从而判据进化为判断特征根的绝对值是否小于1的问题。实际评测结果表明，该判据简单有效，并且与赫尔维兹稳定性判据相吻合。

当然，作为更稳定的优选方案，优选的技术方案还包括对N阶评测矩阵P_N以及其M阶子矩阵P_M计算行列式及其对角线上各子行列式是否具备正值的替换方案。

参见图3，该实施例给出评测系统优化方法流程图。在该流程图中，各个步骤具体执行功能如下：

S101：输入待译文档；

S102：对所述待译文档进行内聚划分，得到多个分类类别；

最后，利用OpenKiwi对所述多个翻译结果进行评测，并将评测结果进行相对量化的归一化评分，得到N阶评测矩阵P_N，然后进行迭代计算。

迭代计算的具体过程参见图4：

令K＝N，执行如下迭代计算：

S201：计算K阶矩阵P_K的2-范数；

S202：判断所述2-范数是否小于1；

其中，当K<N时，P_K为N阶评测矩阵P_N的K阶子矩阵。

系统在一定迭代程度后，如果没有适当有效反馈进行输入，整个系统迭代是处于一种无法优化的平衡状态，如果需要系统继续优化，则需要有效信息的输入，不断人工干预则提供了这一信息。因此，如果所述方法退出时，所述引擎映射数据表仍未得到更新，则引入人工反馈参数，重新执行所述步骤S102。

值得指出的是，图4计算的是矩阵P_K的2-范数，作为可替换的技术方案，同样可以参照图2改为计算特征根。

图6是连接图1-2所述的基于聚类进化的引擎优化系统的OpenKiwi评测系统的示意图。

Openkiwi是以pytorch为基础开发的一个深度翻译质量评测框架，其项目完全开源。本实施例首次将OpenKiwi评测引入到翻译技术领域并结合高斯混合模型(GMM)以及评测矩阵进行判断，属于本发明的突出性贡献，现有技术未见有相关公开技术。

在图1-6所述的实施方式中，选用聚类而不是分类的主要原因是聚类是按照数据内部自身的属性进行内聚划分，而分类则需要人为的预先制定类别。机翻的翻译质量不一定是对某个人认为的类别效果就好，而聚类直接使用数据内部性质，有助于提升引擎的翻译准确度。高斯混合模型(Gaussian Mixture Model)通常简称GMM，是一种业界广泛使用的聚类算法，该方法使用了高斯分布作为参数模型，并使用了期望最大(ExpectationMaximization，简称EM)算法进行训练。GMM多个高斯模型线性叠加混合而成。

在本发明中，GMM以数据内部性质为基础进行聚类，数据的质量非常重要，但是数据量不宜太多，太多造成离线训练时间比较长，也不好控制其质量，基础数据会保持一定范围内进行迭代。基础数据的迭代初步采用译员按照实际中使用效果较好的翻译语料进行积累，同时会按照时间的逆排序进行检查后删除。

总而言之，本发明引入评测矩阵，并且基于评测矩阵的特征根判断使得内部的基础数据会不断迭代，使得基础数据的质量和有效性得到保障，通过引擎映射表将某个类别的最佳引擎，或者最好的几个引擎的排序进行映射的表；同时引入openkiwi和人工反馈干预，能够使得整个评测过程客观准确，优化进化无需先验规则，从而进化/选择出最佳的翻译引擎。

Claims

1.一种基于聚类进化的翻译引擎优化系统，所述引擎优化系统包括文档输入子系统、与所述文档输入子系统输出连接的聚类子系统、以及与所述聚类子系统反馈连接的自动评测模型系统；

其特征在于：

所述自动评测模型系统对所述翻译结果进行评测，具体包括：

将所述翻译结果转化成N阶评测矩阵P_N；

计算所述N阶评测矩阵P_N的特征根；

否则，依次计算所述N阶评测矩阵P_N的M阶子矩阵P_M的特征根，直到所述M阶子矩阵P_M的所有特征根的绝对值均小于1，

其中，所述M＝N-1，N-2，……2。

2.如权利要求1所述的引擎优化系统，其中，将所述翻译结果转化成N阶评测矩阵P_N，具体包括：

则所述N阶评测矩阵P_N为：

3.如权利要求1所述的引擎优化系统，其特征在于：如果M阶子矩阵P_M的特征根的绝对值均小于1，则将N阶评测矩阵P_N中除M阶子矩阵P_M之外的其他元素对应的其他翻译结果反馈给所述自动评测模型系统，所述自动评测模型系统再次对所述其他翻译结果进行评测。

4.如权利要求1-3任一项所述的引擎优化系统，其中，所述聚类子系统基于所述待译文档数据属性进行内聚划分，包括：采用高斯混合模型(GMM)，并使用期望最大算法训练所述模型。

5.一种翻译引擎的评测系统优化方法，所述方法包括如下步骤：

S101：输入待译文档；

S102：对所述待译文档进行内聚划分，得到多个分类类别；

其特征在于：

利用openwiki对所述多个翻译结果进行评测，并将评测结果进行相对量化的归一化评分，得到N阶评测矩阵P_N；

令K＝N，执行如下迭代计算：

S201：计算K阶矩阵P_K的2-范数；

S202：判断所述2-范数是否小于1；

其中，当K<N时，P_K为N阶评测矩阵P_N的K阶子矩阵。

6.如权利要求5所述的方法，其中，如果所述方法退出时，所述引擎映射数据表仍未得到更新，则引入人工反馈参数，重新执行所述步骤S102。

7.如权利要求5所述的方法，其中，将评测结果进行相对量化的归一化评分，得到N阶评测矩阵P_N，具体包括：

则所述N阶评测矩阵P_N为：

8.如权利要求6所述的方法，其中，步骤S102采用高斯混合模型(GMM)，并使用期望最大算法训练所述模型后，利用所述模型对所述待译文档进行内聚划分，得到多个分类类别。

9.一种计算机可读存储介质，其上存储有计算机可执行指令，通过处理器执行所述可执行指令，用于实现权利要求5-8任一项所述的方法。

10.一种Openwiki评测系统，所述评测系统连接权利要求1-4任一项所述的基于聚类进化的引擎优化系统，用于实现权利要求5-8任一项所述的方法。