CN110991193A - 一种基于OpenKiWi的翻译矩阵模型选择系统 - Google Patents

一种基于OpenKiWi的翻译矩阵模型选择系统 Download PDF

Info

Publication number
CN110991193A
CN110991193A CN201911145580.2A CN201911145580A CN110991193A CN 110991193 A CN110991193 A CN 110991193A CN 201911145580 A CN201911145580 A CN 201911145580A CN 110991193 A CN110991193 A CN 110991193A
Authority
CN
China
Prior art keywords
translation
matrix
evaluation
evaluating
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911145580.2A
Other languages
English (en)
Other versions
CN110991193B (zh
Inventor
刘国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iol Wuhan Information Technology Co ltd
Original Assignee
Iol Wuhan Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iol Wuhan Information Technology Co ltd filed Critical Iol Wuhan Information Technology Co ltd
Priority to CN201911145580.2A priority Critical patent/CN110991193B/zh
Publication of CN110991193A publication Critical patent/CN110991193A/zh
Application granted granted Critical
Publication of CN110991193B publication Critical patent/CN110991193B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明提出基于OpenKiWi的翻译矩阵模型选择系统、基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法以及翻译终端。所述选择系统包括待译源文输入组件、GMM聚类引擎、基于OpenKiWi核心的评测引擎以及选择输出界面;所述基于OpenKiWi核心的评测引擎对翻译结果进行句子级别的评测以及词语级别的评测,分别得到句子级评测矩阵和词语级评测矩阵,将所述句子级评测矩阵和词语级评测矩阵组合,得到所述N阶评测矩阵PN后,对所述N阶评测矩阵PN迭代计算,并基于迭代计算结果,输出最优翻译结果。

Description

一种基于OpenKiWi的翻译矩阵模型选择系统
技术领域
本发明属于翻译技术领域,尤其涉及一种基于OpenKiWi的翻译矩阵模型选择系统、基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法以及翻译终端。
背景技术
机器翻译(Machine Translation,MT),又称为自动翻译,是利用计算机程序将文字从一种自然语言(源语言)翻译成另一种自然语言(目标语言)。它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(ComputationalLinguistics)、自然语言理解(Natural Language Understanding)之间存在着密不可分的关系。
通常来讲,一个成型的统计机器翻译系统使用了大规模的双语对照语料做训练,而且这些数据往往是来自于不同领域的,这其中包括政治、财经、军事、科技、体育、教育、娱乐等。除此之外,不同领域的语料涵盖了不同的文体,其中包括书面文体、口语文体、网络语言等。这种领域和文体的差异性给统计机器翻译的研究带来两个问题:其一,使用某一个领域或文体的双语语料训练出的机器翻译系统在翻译同一领域的文本时效果最佳,而翻译其他领域的文本时结果往往不尽如人意,有时翻译结果甚至不可接受;其二,使用多领域混合的双语语料训练出的机器翻译系统通用性虽然较好,但由于多个领域的数据相互影响相互制约,系统在某一特定领域往往无法达到最佳效果。
例如,申请号为CN201910382004.3的中国发明专利申请提出一种融合发音特征汉语-越南语统计机器翻译方法,解决了汉语-越南语机器翻译资源受限继而导致翻译质量差的技术缺陷,所述方法提取汉语-越南语发音特征,这在汉语-越南越统计机器翻译领域是一个新方法,该方法减少了统计机器翻译对大规模平行语料的依赖,提升了汉语-越南语的翻译质量;申请号为CN201910066709.4的中国发明专利申请提出的机器翻译的校准优化方法、装置与电子设备,用以将机器翻译自动质量评估和自动后编辑进行有效的结合,从而能够更有效的提高后编辑效率及翻译质量。
译文质量评估是在无参考译文的情况下通过有监督的机器学习算法对翻译译文进行质量评价,该技术是自然语言处理领域中研究的热点和难点。译文质量评估的结果可以反映出机器翻译系统的性能,指出翻译系统存在的缺陷和不足,从而帮助了系统的研发人员对系统进行改进。精准的评估方法是翻译系统研发的主要依据,是推动机器翻译系统发展的主要动力之一,因此译文质量评估技术的研究对机器翻译系统的发展和改进有重要的指导作用。例如,申请号为CN201611186415.8的中国发明专利申请提出的一种基于众投的译文评价方法及系统,从同一译文文档中提取所有译句;从译文文档对应的原文文档中,提取与每一译句对应的原句;将译句和原句推送给至少一个评价用户;获取至少一个评价用户对每一译句的翻译质量评价;统计所有译句的翻译质量评价,根据翻译质量评价,确定译文文档的翻译质量。
然而,人工评测耗时费力,效率低下,而且由于人的主观因素,对于同一篇译文不同的评测人员可能给出不同的判断。无参考的译文质量评测主要是基于统计的N-Gram语言模型来衡量,语言模型可以通过对目标语言的特定语料训练得到,它可以给出一个混乱度来反映测试句子在训练语料中观察到的可能性,该方法已经用于机器翻译系统译文质量的评测中。使用大规模的语料训练出来的语言模型对于预测某个在训练语料中学习到的字符序列出现的概率可以取得较好的效果,但是在实际的应用中,由于训练语料的不平衡性,难免会出现数据稀疏问题。
现有的各种翻译工具都至少内置了多种翻译引擎,例如将谷歌翻译、搜狗翻译、有道翻译、百度翻译等组合成一个包含对外接口的翻译引擎矩阵,实际翻译时,翻译引擎矩阵将会从中选择一个或者多个翻译引擎进行翻译,从而输出对应的翻译结果。
然而,在这个过程中,翻译引擎矩阵选择的记忆效应,将会导致翻译结果准确度出现极端的两极化,即如果初始选择恰当,则后续选择会越来越准确;反之,后续选择也会越来越不符合实际情况。通常,为避免这种情况,需要研发人员引入人工反馈,从而使得翻译引擎矩阵的自动化程度降低,极大的降低了工作效率;并且这个人工反馈过程依赖于研发人员的先验规则,导致结果准确度降低的同时,客观性也会降低。
发明内容
为解决上述技术问题,本发明提出基于OpenKiWi的翻译矩阵模型选择系统、基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法以及翻译终端。所述选择系统包括待译源文输入组件、GMM聚类引擎、基于OpenKiWi核心的评测引擎以及选择输出界面;所述基于OpenKiWi核心的评测引擎对翻译结果进行句子级别的评测以及词语级别的评测,分别得到句子级评测矩阵和词语级评测矩阵,将所述句子级评测矩阵和词语级评测矩阵组合,得到所述N阶评测矩阵PN后,对所述N阶评测矩阵PN迭代计算,并基于迭代计算结果,输出最优翻译结果。
在本发明的第一个方面,提出一种基于OpenKiWi的翻译矩阵模型选择系统,所述选择系统包括待译源文输入组件、GMM聚类引擎、基于OpenKiWi核心的评测引擎以及选择输出界面。
其中,通过所述待译源文输入组件输入待译文档,所述GMM聚类引擎基于所述待译文档数据属性进行内聚划分,得到所述待译文档的多个分类;在所述翻译矩阵中选择所述多个分类对应的多个翻译引擎,对所述待译文档进行翻译,得到多个翻译结果。
作为体现本发明的创新之处之一,本发明采用所述基于OpenKiWi核心的评测引擎对所述多个翻译结果进行评测,并将评测结果进行归一化评分,得到N阶评测矩阵PN
基于所述N阶评测矩阵PN的迭代计算结果,在所述选择输出界面上输出选择的翻译引擎及其对应的输出翻译结果。
作为上述创新点的进一步体现,其中,所述基于OpenKiWi核心的评测引擎对所述多个翻译结果进行评测,包括:对翻译结果进行句子级别的评测以及词语级别的评测。
作为进一步的优选,其中,如果在所述迭代计算结束后,所述选择输出界面上仍未输出结果,则引入人工调节反馈参数,对所述GMM聚类引擎进行重新训练;所述GMM聚类引擎采用期望最大算法进行训练。
所述迭代计算,包括计算所述N阶评测矩阵PN以及PN的各子阶次矩阵的2-范数。
作为上述创新点的进一步体现,对翻译结果进行句子级别的评测以及词语级别的评测,分别得到句子级评测矩阵和词语级评测矩阵,将所述句子级评测矩阵和词语级评测矩阵组合,得到所述N阶评测矩阵PN
在本发明的第二个方面,提出一种基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法,所述基于OpenKiWi核心的评测引擎包括句子级别评估器和词语级别评估器,所述方法包括如下步骤:
S100:采用所述句子级别评估器对所述多个翻译结果进行评测,得到所述多个翻译结果的句子级评测矩阵;
S200:采用所述词语级别评估器对所述多个翻译结果进行评测,得到所述多个翻译结果的词语级别评测矩阵;
S300:将所述句子级评测矩阵与所述词语级别评测矩阵组合,得到N阶评测矩阵PN
S400:对所述N阶评测矩阵PN迭代计算,并基于迭代计算结果,输出最优翻译结果。
其中,对所述N阶评测矩阵PN迭代计算,具体包括如下步骤:
令K=N,执行如下迭代计算:
S401:判断所述K阶评测矩阵PK是否正定;如果是,进入步骤S402;否则,进入步骤步骤S403;
S402:输出所述评测矩阵Pk对角线元素对应的翻译结果;
S403:令K=K-1,判断K是否大于1,如果是,返回步骤S401;
否则,退出;
其中,当K<N时,PK为N阶评测矩阵PN的K阶子矩阵。
在这里,本发明首次将矩阵赫尔维兹稳定性判据应用到翻译领域的评测中。根据赫尔维兹稳定性判据,当矩阵主行列式及其对角线上各子行列式均具有正值时,系统稳定有效。本发明将这一论据结合翻译评测评分矩阵,从而判据进化为判断是否正定的问题。实际评测结果表明,该判据简单有效,并且与赫尔维兹稳定性判据相吻合。
上述过程可以通过计算机,通过计算机程序指令的方式自动化实现,因此,本发明还提供一种计算机可读存储介质,其上存储有计算机可执行指令,通过处理器执行所述可执行指令,用于实现所述的基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法。
本发明的上述方案可以在各种翻译引擎矩阵模型上实现,因此,还提供一种翻译终端,所述翻译终端包括前述的基于OpenKiWi的翻译矩阵模型选择系统。
本发明的进一步优点将在具体实施例部分结合说明书附图进一步体现。
附图说明
图1是本发明基于OpenKiWi的翻译矩阵模型选择系统的整体结构图。
图2是图1所述选择系统获得评测矩阵的示意图
图3是迭代计算中所述M阶子矩阵的一个示意图。
图4是对多个翻译引擎输出的多个翻译结果进行评测的方法流程图
图5是图3中所述迭代计算的计算机流程化图
图6是本发明所述技术方案最终输出翻译结果和现有技术的准确度对比。
具体实施例
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和实施例对本发明做进一步说明。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
参照图1,示出一种基于OpenKiWi的翻译矩阵模型选择系统,所述选择系统包括待译源文输入组件、GMM聚类引擎、基于OpenKiWi核心的评测引擎以及选择输出界面。
其中,通过所述待译源文输入组件输入待译文档,所述GMM聚类引擎基于所述待译文档数据属性进行内聚划分,得到所述待译文档的多个分类;
所述翻译矩阵为包括多个不同翻译引擎集成化翻译工具包。作为一个非限制性的例子,例如将谷歌翻译、搜狗翻译、有道翻译、百度翻译等组合成一个包含对外接口的翻译引擎矩阵,实际翻译时,翻译引擎矩阵将会从中选择一个或者多个翻译引擎进行翻译,从而输出对应的翻译结果。
在本实例中,通过所述GMM聚类引擎分类后,在所述翻译矩阵中选择所述多个分类对应的多个翻译引擎,对所述待译文档进行翻译,得到多个翻译结果。
需要指出的是,作为本发明技术方案实现过程中的客观性规律体现,本实施例选用聚类而不是分类。这是因为,聚类是按照数据内部自身的属性进行内聚划分,而分类则需要人为的预先制定类别。机翻的翻译质量有事不一定是对某个人认为的类别效果就好,而聚类直接使用数据内部性质,有助于提升引擎的翻译准确度。
具体而言,其中,所述聚类子系统基于所述待译文档数据属性进行内聚划分,包括:采用高斯混合模型(GMM),并使用期望最大算法训练所述模型。
作为体现本发明的创新之处之一,本发明采用所述基于OpenKiWi核心的评测引擎对所述多个翻译结果进行评测,并将评测结果进行归一化评分,得到N阶评测矩阵PN
基于所述N阶评测矩阵PN的迭代计算结果,在所述选择输出界面上输出选择的翻译引擎及其对应的输出翻译结果。
作为一个具体的实例,所述多个翻译结果包括每一种分类Ji(i=1,……,N)对应的N个翻译引擎的翻译结果TRi1,TRi2,……TRiN
对每一种分类Ji(i=1,……,N)对应的N个翻译引擎的翻译结果TRi1,TRi2,……TRiN进行评分,得到每一种分类Ji(i=1,……,N)对应的N个翻译引擎的翻译结果TRi1,TRi2,……TRiN的评分数值Fi1,Fi2,……Fin
则所述N阶评测矩阵PN为:
Figure BDA0002288692510000091
作为上述创新点的进一步体现,其中,所述基于OpenKiWi核心的评测引擎对所述多个翻译结果进行评测,包括:对翻译结果进行句子级别的评测以及词语级别的评测。
作为进一步的优选,其中,如果在所述迭代计算结束后,所述选择输出界面上仍未输出结果,则引入人工调节反馈参数,对所述GMM聚类引擎进行重新训练;所述GMM聚类引擎采用期望最大算法进行训练。
所述迭代计算,包括计算所述N阶评测矩阵PN以及PN的各子阶次矩阵的2-范数。
所述N阶评测矩阵PN的M阶子矩阵PM,是指所述N阶评测矩阵PN中连续M行M列元素组成的子矩阵;
图3给出了M=N-1时,所述迭代计算中所述M阶子矩阵的一个示意图。
参见图2,作为上述创新点的进一步体现,对翻译结果进行句子级别的评测以及词语级别的评测,分别得到句子级评测矩阵和词语级评测矩阵,将所述句子级评测矩阵和词语级评测矩阵组合,得到所述N阶评测矩阵PN
句子级别的评测和词语级别的评测属于本领域技术人员熟知的两种评测标准。例如2010年第届计算自然语言学习会议就以此为任务,组织了一次交流性的国际评测。词语级别和句子级别是这次国际评测的评测标准,词语级别要准确的找出句子中表达模糊限制信息的单词或者短语,粒度比较细,而句子级别只要正确给出句子的是否模糊,至于哪个词表达了不确定则不需要进行考虑,因此句子级别的最终值会比词语级别高。因此,在本实施例中,所述组合指的是两个矩阵进行差值运算,即将所述句子级评测矩阵和词语级评测矩阵的对应元素相减。
参见图4的一种基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法,所述基于OpenKiWi核心的评测引擎包括句子级别评估器和词语级别评估器,所述方法包括如下步骤:
S100:采用所述句子级别评估器对所述多个翻译结果进行评测,得到所述多个翻译结果的句子级评测矩阵;
S200:采用所述词语级别评估器对所述多个翻译结果进行评测,得到所述多个翻译结果的词语级别评测矩阵;
S300:将所述句子级评测矩阵与所述词语级别评测矩阵组合,得到N阶评测矩阵PN
S400:对所述N阶评测矩阵PN迭代计算,并基于迭代计算结果,输出最优翻译结果。
进一步的,参加图5,对所述N阶评测矩阵PN迭代计算,具体包括如下步骤:
令K=N,执行如下迭代计算:
S401:判断所述K阶评测矩阵PK是否正定;如果是,进入步骤S402;否则,进入步骤步骤S403;
系统在一定迭代程度后,如果没有适当有效反馈进行输入,整个系统迭代是处于一种无法优化的平衡状态,如果需要系统继续优化,则需要有效信息的输入,不断人工干预则提供了这一信息。因此,如果在所述迭代计算结束后,所述选择输出界面上仍未输出结果,则引入人工调节反馈参数,对所述GMM聚类引擎进行重新训练;然后再重新进行聚类分类后,在所述翻译矩阵中选择所述多个分类对应的多个翻译引擎,对所述待译文档进行翻译,得到多个翻译结果,然后执行对应的方法。
当然,基于赫尔维兹稳定性判据,作为更稳定的优选方案,优选的技术方案还包括对N阶评测矩阵PN以及其M阶子矩阵PM计算行列式及其对角线上各子行列式是否具备正值的替换方案。
S402:输出所述评测矩阵Pk对角线元素对应的翻译结果;
S403:令K=K-1,判断K是否大于1,
如果是,返回步骤S401;否则,退出;
其中,当K<N时,PK为N阶评测矩阵PN的K阶子矩阵,例如图3所述。
需要指出的是,本发明所述基于句子级别的评测和基于短语级别的评测过程均不需要引入参考译文。
图6是本发明所述技术方案最终输出翻译结果和现有技术的准确度对比。从图6技术效果看,随着待译文档的数量级上升,本发明的技术方案准确度越来越明显,因此,本发明的技术方案尤其适合于大规模语料的准确翻译。

Claims (9)

1.一种基于OpenKiWi的翻译矩阵模型选择系统,所述选择系统包括待译源文输入组件、GMM聚类引擎、基于OpenKiWi核心的评测引擎以及选择输出界面;
其特征在于:
通过所述待译源文输入组件输入待译文档,所述GMM聚类引擎基于所述待译文档数据属性进行内聚划分,得到所述待译文档的多个分类;
在所述翻译矩阵中选择所述多个分类对应的多个翻译引擎,对所述待译文档进行翻译,得到多个翻译结果;
采用所述基于OpenKiWi核心的评测引擎对所述多个翻译结果进行评测,并将评测结果进行归一化评分,得到N阶评测矩阵PN
基于所述N阶评测矩阵PN的迭代计算结果,在所述选择输出界面上输出选择的翻译引擎及其对应的输出翻译结果;
其中,所述基于OpenKiWi核心的评测引擎对所述多个翻译结果进行评测,包括:对翻译结果进行句子级别的评测以及词语级别的评测。
2.如权利要求1所述的选择系统,其中,如果在所述迭代计算结束后,所述选择输出界面上仍未输出结果,则引入人工调节反馈参数,对所述GMM聚类引擎进行重新训练。
3.如权利要求1所述的选择系统,其中,所述迭代计算,包括计算所述N阶评测矩阵PN以及PN的各子阶次矩阵的2-范数。
4.如权利要求2所述的选择系统,其中,所述GMM聚类引擎采用期望最大算法进行训练。
5.如权利要求1所述的选择系统,其中,对翻译结果进行句子级别的评测以及词语级别的评测,分别得到句子级评测矩阵和词语级评测矩阵,将所述句子级评测矩阵和词语级评测矩阵组合,得到所述N阶评测矩阵PN
6.一种基于OpenKiWi核心的评测引擎对多个翻译引擎输出的多个翻译结果进行评测的方法,所述基于OpenKiWi核心的评测引擎包括句子级别评估器和词语级别评估器,所述方法包括如下步骤:
S100:采用所述句子级别评估器对所述多个翻译结果进行评测,得到所述多个翻译结果的句子级评测矩阵;
S200:采用所述词语级别评估器对所述多个翻译结果进行评测,得到所述多个翻译结果的词语级别评测矩阵;
S300:将所述句子级评测矩阵与所述词语级别评测矩阵组合,得到N阶评测矩阵PN
S400:对所述N阶评测矩阵PN迭代计算,并基于迭代计算结果,输出最优翻译结果。
7.如权利要求6所述的方法,其中,对所述N阶评测矩阵PN迭代计算,具体包括如下步骤:
令K=N,执行如下迭代计算:
S401:判断所述K阶评测矩阵PK是否正定;如果是,进入步骤S402;否则,进入步骤步骤S403;
S402:输出所述评测矩阵Pk对角线元素对应的翻译结果;
S403:令K=K-1,判断K是否大于1,如果是,返回步骤S401;
否则,退出;
其中,当K<N时,PK为N阶评测矩阵PN的K阶子矩阵。
8.一种计算机可读存储介质,其上存储有计算机可执行指令,通过处理器执行所述可执行指令,用于实现权利要求6-7任一项所述的方法。
9.一种翻译终端,所述翻译终端包括权利要求1-5任一项所述的选择系统。
CN201911145580.2A 2019-11-27 2019-11-27 一种基于OpenKiWi的翻译矩阵模型选择系统 Active CN110991193B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911145580.2A CN110991193B (zh) 2019-11-27 2019-11-27 一种基于OpenKiWi的翻译矩阵模型选择系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911145580.2A CN110991193B (zh) 2019-11-27 2019-11-27 一种基于OpenKiWi的翻译矩阵模型选择系统

Publications (2)

Publication Number Publication Date
CN110991193A true CN110991193A (zh) 2020-04-10
CN110991193B CN110991193B (zh) 2023-06-09

Family

ID=70085424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911145580.2A Active CN110991193B (zh) 2019-11-27 2019-11-27 一种基于OpenKiWi的翻译矩阵模型选择系统

Country Status (1)

Country Link
CN (1) CN110991193B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680526A (zh) * 2020-06-09 2020-09-18 语联网(武汉)信息技术有限公司 基于逆向翻译结果比对的人机交互翻译系统与方法
CN111680524A (zh) * 2020-06-09 2020-09-18 语联网(武汉)信息技术有限公司 基于逆向矩阵分析的人机反馈翻译方法与系统
CN112526945A (zh) * 2020-11-09 2021-03-19 福建福瑞康信息技术有限公司 具备反馈与闭环控制功能的全流程监控与预警系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007034621A (ja) * 2005-07-26 2007-02-08 Fuji Xerox Co Ltd 翻訳装置及び翻訳方法
US20090063126A1 (en) * 2007-08-29 2009-03-05 Microsoft Corporation Validation of the consistency of automatic terminology translation
US20110137636A1 (en) * 2009-12-02 2011-06-09 Janya, Inc. Context aware back-transliteration and translation of names and common phrases using web resources
US8326598B1 (en) * 2007-03-26 2012-12-04 Google Inc. Consensus translations from multiple machine translation systems
WO2015063536A1 (en) * 2013-10-28 2015-05-07 Translation Management Systems Ltd. Networked language translation system and method
US20160124944A1 (en) * 2014-11-04 2016-05-05 Xerox Corporation Predicting the quality of automatic translation of an entire document
US20180314689A1 (en) * 2015-12-22 2018-11-01 Sri International Multi-lingual virtual personal assistant
CN109118109A (zh) * 2018-08-31 2019-01-01 传神语联网网络科技股份有限公司 基于etm的质量评估
CN109299481A (zh) * 2018-11-15 2019-02-01 语联网(武汉)信息技术有限公司 机器翻译引擎推荐方法、装置及电子设备
CN109710948A (zh) * 2018-11-27 2019-05-03 语联网(武汉)信息技术有限公司 机器翻译引擎推荐方法及装置
CN110472257A (zh) * 2019-08-20 2019-11-19 南京题麦壳斯信息科技有限公司 一种基于句对的机器翻译引擎测评优选方法及系统
CN110472256A (zh) * 2019-08-20 2019-11-19 南京题麦壳斯信息科技有限公司 一种基于篇章的机器翻译引擎测评优选方法及系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007034621A (ja) * 2005-07-26 2007-02-08 Fuji Xerox Co Ltd 翻訳装置及び翻訳方法
US8326598B1 (en) * 2007-03-26 2012-12-04 Google Inc. Consensus translations from multiple machine translation systems
US20090063126A1 (en) * 2007-08-29 2009-03-05 Microsoft Corporation Validation of the consistency of automatic terminology translation
US20110137636A1 (en) * 2009-12-02 2011-06-09 Janya, Inc. Context aware back-transliteration and translation of names and common phrases using web resources
WO2015063536A1 (en) * 2013-10-28 2015-05-07 Translation Management Systems Ltd. Networked language translation system and method
US20160124944A1 (en) * 2014-11-04 2016-05-05 Xerox Corporation Predicting the quality of automatic translation of an entire document
US20180314689A1 (en) * 2015-12-22 2018-11-01 Sri International Multi-lingual virtual personal assistant
CN109118109A (zh) * 2018-08-31 2019-01-01 传神语联网网络科技股份有限公司 基于etm的质量评估
CN109299481A (zh) * 2018-11-15 2019-02-01 语联网(武汉)信息技术有限公司 机器翻译引擎推荐方法、装置及电子设备
CN109710948A (zh) * 2018-11-27 2019-05-03 语联网(武汉)信息技术有限公司 机器翻译引擎推荐方法及装置
CN110472257A (zh) * 2019-08-20 2019-11-19 南京题麦壳斯信息科技有限公司 一种基于句对的机器翻译引擎测评优选方法及系统
CN110472256A (zh) * 2019-08-20 2019-11-19 南京题麦壳斯信息科技有限公司 一种基于篇章的机器翻译引擎测评优选方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
F KEPLER: "OpenKiwi: An Open Source Framework for Quality Estimation" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680526A (zh) * 2020-06-09 2020-09-18 语联网(武汉)信息技术有限公司 基于逆向翻译结果比对的人机交互翻译系统与方法
CN111680524A (zh) * 2020-06-09 2020-09-18 语联网(武汉)信息技术有限公司 基于逆向矩阵分析的人机反馈翻译方法与系统
CN111680526B (zh) * 2020-06-09 2023-09-08 语联网(武汉)信息技术有限公司 基于逆向翻译结果比对的人机交互翻译系统与方法
CN112526945A (zh) * 2020-11-09 2021-03-19 福建福瑞康信息技术有限公司 具备反馈与闭环控制功能的全流程监控与预警系统

Also Published As

Publication number Publication date
CN110991193B (zh) 2023-06-09

Similar Documents

Publication Publication Date Title
CN108363790B (zh) 用于对评论进行评估的方法、装置、设备和存储介质
CN109344236B (zh) 一种基于多种特征的问题相似度计算方法
US11640515B2 (en) Method and neural network system for human-computer interaction, and user equipment
CN109670191B (zh) 机器翻译的校准优化方法、装置与电子设备
CN112069295B (zh) 相似题推荐方法、装置、电子设备和存储介质
CN110991193B (zh) 一种基于OpenKiWi的翻译矩阵模型选择系统
CN111666401A (zh) 基于图结构的公文推荐方法、装置、计算机设备及介质
CN112883193A (zh) 一种文本分类模型的训练方法、装置、设备以及可读介质
WO2023137911A1 (zh) 基于小样本语料的意图分类方法、装置及计算机设备
CN115309910B (zh) 语篇要素和要素关系联合抽取方法、知识图谱构建方法
CN111639247A (zh) 用于评估评论的质量的方法、装置、设备以及计算机可读存储介质
CN114818891A (zh) 小样本多标签文本分类模型训练方法及文本分类方法
CN114217766A (zh) 基于预训练语言微调与依存特征的半自动需求抽取方法
CN115935959A (zh) 一种低资源黏着语序列标注的方法
KR102608867B1 (ko) 업계 텍스트를 증분하는 방법, 관련 장치 및 매체에 저장된 컴퓨터 프로그램
CN114970506A (zh) 基于多粒度语法错误模板学习微调的语法纠错方法和系统
CN115033753A (zh) 训练语料集构建方法、文本处理方法及装置
CN111259147A (zh) 基于自适应注意力机制的句子级情感预测方法及系统
CN110969005B (zh) 一种确定实体语料之间的相似性的方法及装置
CN110852071A (zh) 知识点检测方法、装置、设备及可读存储介质
CN111144134B (zh) 基于OpenKiWi的翻译引擎自动化评测系统
CN113705207A (zh) 语法错误识别方法及装置
CN112836525A (zh) 一种基于人机交互机器翻译系统及其自动优化方法
CN115809658A (zh) 平行语料的生成方法及装置和无监督同义转写方法及装置
CN110633363B (zh) 一种基于nlp和模糊多准则决策的文本实体推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant