CN110991193A

CN110991193A - 一种基于OpenKiWi的翻译矩阵模型选择系统

Info

Publication number: CN110991193A
Application number: CN201911145580.2A
Authority: CN
Inventors: 刘国
Original assignee: Iol Wuhan Information Technology Co ltd
Current assignee: Iol Wuhan Information Technology Co ltd
Priority date: 2019-11-27
Filing date: 2019-11-27
Publication date: 2020-04-10
Anticipated expiration: 2039-11-27
Also published as: CN110991193B

Abstract

本发明提出基于OpenKiWi的翻译矩阵模型选择系统、基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法以及翻译终端。所述选择系统包括待译源文输入组件、GMM聚类引擎、基于OpenKiWi核心的评测引擎以及选择输出界面；所述基于OpenKiWi核心的评测引擎对翻译结果进行句子级别的评测以及词语级别的评测，分别得到句子级评测矩阵和词语级评测矩阵，将所述句子级评测矩阵和词语级评测矩阵组合，得到所述N阶评测矩阵P_N后，对所述N阶评测矩阵P_N迭代计算，并基于迭代计算结果，输出最优翻译结果。

Description

一种基于OpenKiWi的翻译矩阵模型选择系统

技术领域

本发明属于翻译技术领域，尤其涉及一种基于OpenKiWi的翻译矩阵模型选择系统、基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法以及翻译终端。

背景技术

机器翻译(Machine Translation，MT)，又称为自动翻译，是利用计算机程序将文字从一种自然语言(源语言)翻译成另一种自然语言(目标语言)。它是自然语言处理(Natural Language Processing)的一个分支，与计算语言学(ComputationalLinguistics)、自然语言理解(Natural Language Understanding)之间存在着密不可分的关系。

通常来讲，一个成型的统计机器翻译系统使用了大规模的双语对照语料做训练，而且这些数据往往是来自于不同领域的，这其中包括政治、财经、军事、科技、体育、教育、娱乐等。除此之外，不同领域的语料涵盖了不同的文体，其中包括书面文体、口语文体、网络语言等。这种领域和文体的差异性给统计机器翻译的研究带来两个问题：其一，使用某一个领域或文体的双语语料训练出的机器翻译系统在翻译同一领域的文本时效果最佳，而翻译其他领域的文本时结果往往不尽如人意，有时翻译结果甚至不可接受；其二，使用多领域混合的双语语料训练出的机器翻译系统通用性虽然较好，但由于多个领域的数据相互影响相互制约，系统在某一特定领域往往无法达到最佳效果。

例如，申请号为CN201910382004.3的中国发明专利申请提出一种融合发音特征汉语-越南语统计机器翻译方法，解决了汉语-越南语机器翻译资源受限继而导致翻译质量差的技术缺陷，所述方法提取汉语-越南语发音特征，这在汉语-越南越统计机器翻译领域是一个新方法，该方法减少了统计机器翻译对大规模平行语料的依赖，提升了汉语-越南语的翻译质量；申请号为CN201910066709.4的中国发明专利申请提出的机器翻译的校准优化方法、装置与电子设备，用以将机器翻译自动质量评估和自动后编辑进行有效的结合，从而能够更有效的提高后编辑效率及翻译质量。

译文质量评估是在无参考译文的情况下通过有监督的机器学习算法对翻译译文进行质量评价，该技术是自然语言处理领域中研究的热点和难点。译文质量评估的结果可以反映出机器翻译系统的性能，指出翻译系统存在的缺陷和不足，从而帮助了系统的研发人员对系统进行改进。精准的评估方法是翻译系统研发的主要依据，是推动机器翻译系统发展的主要动力之一，因此译文质量评估技术的研究对机器翻译系统的发展和改进有重要的指导作用。例如，申请号为CN201611186415.8的中国发明专利申请提出的一种基于众投的译文评价方法及系统，从同一译文文档中提取所有译句；从译文文档对应的原文文档中，提取与每一译句对应的原句；将译句和原句推送给至少一个评价用户；获取至少一个评价用户对每一译句的翻译质量评价；统计所有译句的翻译质量评价，根据翻译质量评价，确定译文文档的翻译质量。

然而，人工评测耗时费力，效率低下，而且由于人的主观因素，对于同一篇译文不同的评测人员可能给出不同的判断。无参考的译文质量评测主要是基于统计的N-Gram语言模型来衡量，语言模型可以通过对目标语言的特定语料训练得到，它可以给出一个混乱度来反映测试句子在训练语料中观察到的可能性，该方法已经用于机器翻译系统译文质量的评测中。使用大规模的语料训练出来的语言模型对于预测某个在训练语料中学习到的字符序列出现的概率可以取得较好的效果，但是在实际的应用中，由于训练语料的不平衡性，难免会出现数据稀疏问题。

现有的各种翻译工具都至少内置了多种翻译引擎，例如将谷歌翻译、搜狗翻译、有道翻译、百度翻译等组合成一个包含对外接口的翻译引擎矩阵，实际翻译时，翻译引擎矩阵将会从中选择一个或者多个翻译引擎进行翻译，从而输出对应的翻译结果。

然而，在这个过程中，翻译引擎矩阵选择的记忆效应，将会导致翻译结果准确度出现极端的两极化，即如果初始选择恰当，则后续选择会越来越准确；反之，后续选择也会越来越不符合实际情况。通常，为避免这种情况，需要研发人员引入人工反馈，从而使得翻译引擎矩阵的自动化程度降低，极大的降低了工作效率；并且这个人工反馈过程依赖于研发人员的先验规则，导致结果准确度降低的同时，客观性也会降低。

发明内容

为解决上述技术问题，本发明提出基于OpenKiWi的翻译矩阵模型选择系统、基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法以及翻译终端。所述选择系统包括待译源文输入组件、GMM聚类引擎、基于OpenKiWi核心的评测引擎以及选择输出界面；所述基于OpenKiWi核心的评测引擎对翻译结果进行句子级别的评测以及词语级别的评测，分别得到句子级评测矩阵和词语级评测矩阵，将所述句子级评测矩阵和词语级评测矩阵组合，得到所述N阶评测矩阵P_N后，对所述N阶评测矩阵P_N迭代计算，并基于迭代计算结果，输出最优翻译结果。

在本发明的第一个方面，提出一种基于OpenKiWi的翻译矩阵模型选择系统，所述选择系统包括待译源文输入组件、GMM聚类引擎、基于OpenKiWi核心的评测引擎以及选择输出界面。

其中，通过所述待译源文输入组件输入待译文档，所述GMM聚类引擎基于所述待译文档数据属性进行内聚划分，得到所述待译文档的多个分类；在所述翻译矩阵中选择所述多个分类对应的多个翻译引擎，对所述待译文档进行翻译，得到多个翻译结果。

作为体现本发明的创新之处之一，本发明采用所述基于OpenKiWi核心的评测引擎对所述多个翻译结果进行评测，并将评测结果进行归一化评分，得到N阶评测矩阵P_N；

基于所述N阶评测矩阵P_N的迭代计算结果，在所述选择输出界面上输出选择的翻译引擎及其对应的输出翻译结果。

作为上述创新点的进一步体现，其中，所述基于OpenKiWi核心的评测引擎对所述多个翻译结果进行评测，包括：对翻译结果进行句子级别的评测以及词语级别的评测。

作为进一步的优选，其中，如果在所述迭代计算结束后，所述选择输出界面上仍未输出结果，则引入人工调节反馈参数，对所述GMM聚类引擎进行重新训练；所述GMM聚类引擎采用期望最大算法进行训练。

所述迭代计算，包括计算所述N阶评测矩阵P_N以及P_N的各子阶次矩阵的2-范数。

作为上述创新点的进一步体现，对翻译结果进行句子级别的评测以及词语级别的评测，分别得到句子级评测矩阵和词语级评测矩阵，将所述句子级评测矩阵和词语级评测矩阵组合，得到所述N阶评测矩阵P_N。

在本发明的第二个方面，提出一种基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法，所述基于OpenKiWi核心的评测引擎包括句子级别评估器和词语级别评估器，所述方法包括如下步骤：

S100：采用所述句子级别评估器对所述多个翻译结果进行评测，得到所述多个翻译结果的句子级评测矩阵；

S200：采用所述词语级别评估器对所述多个翻译结果进行评测，得到所述多个翻译结果的词语级别评测矩阵；

S300：将所述句子级评测矩阵与所述词语级别评测矩阵组合，得到N阶评测矩阵P_N；

S400：对所述N阶评测矩阵P_N迭代计算，并基于迭代计算结果，输出最优翻译结果。

其中，对所述N阶评测矩阵P_N迭代计算，具体包括如下步骤：

令K＝N，执行如下迭代计算：

S401：判断所述K阶评测矩阵P_K是否正定；如果是，进入步骤S402；否则，进入步骤步骤S403；

S402：输出所述评测矩阵P_k对角线元素对应的翻译结果；

S403：令K＝K-1，判断K是否大于1，如果是，返回步骤S401；

否则，退出；

其中，当K<N时，P_K为N阶评测矩阵P_N的K阶子矩阵。

在这里，本发明首次将矩阵赫尔维兹稳定性判据应用到翻译领域的评测中。根据赫尔维兹稳定性判据，当矩阵主行列式及其对角线上各子行列式均具有正值时，系统稳定有效。本发明将这一论据结合翻译评测评分矩阵，从而判据进化为判断是否正定的问题。实际评测结果表明，该判据简单有效，并且与赫尔维兹稳定性判据相吻合。

上述过程可以通过计算机，通过计算机程序指令的方式自动化实现，因此，本发明还提供一种计算机可读存储介质，其上存储有计算机可执行指令，通过处理器执行所述可执行指令，用于实现所述的基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法。

本发明的上述方案可以在各种翻译引擎矩阵模型上实现，因此，还提供一种翻译终端，所述翻译终端包括前述的基于OpenKiWi的翻译矩阵模型选择系统。

本发明的进一步优点将在具体实施例部分结合说明书附图进一步体现。

附图说明

图1是本发明基于OpenKiWi的翻译矩阵模型选择系统的整体结构图。

图2是图1所述选择系统获得评测矩阵的示意图

图3是迭代计算中所述M阶子矩阵的一个示意图。

图4是对多个翻译引擎输出的多个翻译结果进行评测的方法流程图

图5是图3中所述迭代计算的计算机流程化图

图6是本发明所述技术方案最终输出翻译结果和现有技术的准确度对比。

具体实施例

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和实施例对本发明做进一步说明。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

参照图1，示出一种基于OpenKiWi的翻译矩阵模型选择系统，所述选择系统包括待译源文输入组件、GMM聚类引擎、基于OpenKiWi核心的评测引擎以及选择输出界面。

其中，通过所述待译源文输入组件输入待译文档，所述GMM聚类引擎基于所述待译文档数据属性进行内聚划分，得到所述待译文档的多个分类；

所述翻译矩阵为包括多个不同翻译引擎集成化翻译工具包。作为一个非限制性的例子，例如将谷歌翻译、搜狗翻译、有道翻译、百度翻译等组合成一个包含对外接口的翻译引擎矩阵，实际翻译时，翻译引擎矩阵将会从中选择一个或者多个翻译引擎进行翻译，从而输出对应的翻译结果。

在本实例中，通过所述GMM聚类引擎分类后，在所述翻译矩阵中选择所述多个分类对应的多个翻译引擎，对所述待译文档进行翻译，得到多个翻译结果。

需要指出的是，作为本发明技术方案实现过程中的客观性规律体现，本实施例选用聚类而不是分类。这是因为，聚类是按照数据内部自身的属性进行内聚划分，而分类则需要人为的预先制定类别。机翻的翻译质量有事不一定是对某个人认为的类别效果就好，而聚类直接使用数据内部性质，有助于提升引擎的翻译准确度。

具体而言，其中，所述聚类子系统基于所述待译文档数据属性进行内聚划分，包括：采用高斯混合模型(GMM)，并使用期望最大算法训练所述模型。

作为一个具体的实例，所述多个翻译结果包括每一种分类Ji(i＝1，……，N)对应的N个翻译引擎的翻译结果TR_i1,TR_i2,……TR_iN；

对每一种分类Ji(i＝1，……，N)对应的N个翻译引擎的翻译结果TR_i1,TR_i2,……TR_iN进行评分，得到每一种分类Ji(i＝1，……，N)对应的N个翻译引擎的翻译结果TR_i1,TR_i2,……TR_iN的评分数值F_i1,F_i2,……F_in；

则所述N阶评测矩阵P_N为：

所述N阶评测矩阵P_N的M阶子矩阵P_M，是指所述N阶评测矩阵P_N中连续M行M列元素组成的子矩阵；

图3给出了M＝N-1时，所述迭代计算中所述M阶子矩阵的一个示意图。

参见图2，作为上述创新点的进一步体现，对翻译结果进行句子级别的评测以及词语级别的评测，分别得到句子级评测矩阵和词语级评测矩阵，将所述句子级评测矩阵和词语级评测矩阵组合，得到所述N阶评测矩阵P_N。

句子级别的评测和词语级别的评测属于本领域技术人员熟知的两种评测标准。例如2010年第届计算自然语言学习会议就以此为任务，组织了一次交流性的国际评测。词语级别和句子级别是这次国际评测的评测标准，词语级别要准确的找出句子中表达模糊限制信息的单词或者短语，粒度比较细，而句子级别只要正确给出句子的是否模糊，至于哪个词表达了不确定则不需要进行考虑，因此句子级别的最终值会比词语级别高。因此，在本实施例中，所述组合指的是两个矩阵进行差值运算，即将所述句子级评测矩阵和词语级评测矩阵的对应元素相减。

参见图4的一种基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法，所述基于OpenKiWi核心的评测引擎包括句子级别评估器和词语级别评估器，所述方法包括如下步骤：

进一步的，参加图5，对所述N阶评测矩阵P_N迭代计算，具体包括如下步骤：

令K＝N，执行如下迭代计算：

系统在一定迭代程度后，如果没有适当有效反馈进行输入，整个系统迭代是处于一种无法优化的平衡状态，如果需要系统继续优化，则需要有效信息的输入，不断人工干预则提供了这一信息。因此，如果在所述迭代计算结束后，所述选择输出界面上仍未输出结果，则引入人工调节反馈参数，对所述GMM聚类引擎进行重新训练；然后再重新进行聚类分类后，在所述翻译矩阵中选择所述多个分类对应的多个翻译引擎，对所述待译文档进行翻译，得到多个翻译结果，然后执行对应的方法。

当然，基于赫尔维兹稳定性判据，作为更稳定的优选方案，优选的技术方案还包括对N阶评测矩阵P_N以及其M阶子矩阵P_M计算行列式及其对角线上各子行列式是否具备正值的替换方案。

S402：输出所述评测矩阵P_k对角线元素对应的翻译结果；

S403：令K＝K-1，判断K是否大于1，

如果是，返回步骤S401；否则，退出；

其中，当K<N时，P_K为N阶评测矩阵P_N的K阶子矩阵，例如图3所述。

需要指出的是，本发明所述基于句子级别的评测和基于短语级别的评测过程均不需要引入参考译文。

图6是本发明所述技术方案最终输出翻译结果和现有技术的准确度对比。从图6技术效果看，随着待译文档的数量级上升，本发明的技术方案准确度越来越明显，因此，本发明的技术方案尤其适合于大规模语料的准确翻译。

Claims

1.一种基于OpenKiWi的翻译矩阵模型选择系统，所述选择系统包括待译源文输入组件、GMM聚类引擎、基于OpenKiWi核心的评测引擎以及选择输出界面；

其特征在于：

通过所述待译源文输入组件输入待译文档，所述GMM聚类引擎基于所述待译文档数据属性进行内聚划分，得到所述待译文档的多个分类；

在所述翻译矩阵中选择所述多个分类对应的多个翻译引擎，对所述待译文档进行翻译，得到多个翻译结果；

采用所述基于OpenKiWi核心的评测引擎对所述多个翻译结果进行评测，并将评测结果进行归一化评分，得到N阶评测矩阵P_N；

基于所述N阶评测矩阵P_N的迭代计算结果，在所述选择输出界面上输出选择的翻译引擎及其对应的输出翻译结果；

其中，所述基于OpenKiWi核心的评测引擎对所述多个翻译结果进行评测，包括：对翻译结果进行句子级别的评测以及词语级别的评测。

2.如权利要求1所述的选择系统，其中，如果在所述迭代计算结束后，所述选择输出界面上仍未输出结果，则引入人工调节反馈参数，对所述GMM聚类引擎进行重新训练。

3.如权利要求1所述的选择系统，其中，所述迭代计算，包括计算所述N阶评测矩阵P_N以及P_N的各子阶次矩阵的2-范数。

4.如权利要求2所述的选择系统，其中，所述GMM聚类引擎采用期望最大算法进行训练。

5.如权利要求1所述的选择系统，其中，对翻译结果进行句子级别的评测以及词语级别的评测，分别得到句子级评测矩阵和词语级评测矩阵，将所述句子级评测矩阵和词语级评测矩阵组合，得到所述N阶评测矩阵P_N。

6.一种基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法，所述基于OpenKiWi核心的评测引擎包括句子级别评估器和词语级别评估器，所述方法包括如下步骤：

7.如权利要求6所述的方法，其中，对所述N阶评测矩阵P_N迭代计算，具体包括如下步骤：

令K＝N，执行如下迭代计算：

S402：输出所述评测矩阵P_k对角线元素对应的翻译结果；

S403：令K＝K-1，判断K是否大于1，如果是，返回步骤S401；

否则，退出；

其中，当K<N时，P_K为N阶评测矩阵P_N的K阶子矩阵。

8.一种计算机可读存储介质，其上存储有计算机可执行指令，通过处理器执行所述可执行指令，用于实现权利要求6-7任一项所述的方法。

9.一种翻译终端，所述翻译终端包括权利要求1-5任一项所述的选择系统。