CN110991194B - 基于OpenKiWi进化的引擎优化方法以及翻译系统 - Google Patents

基于OpenKiWi进化的引擎优化方法以及翻译系统 Download PDF

Info

Publication number
CN110991194B
CN110991194B CN201911163238.5A CN201911163238A CN110991194B CN 110991194 B CN110991194 B CN 110991194B CN 201911163238 A CN201911163238 A CN 201911163238A CN 110991194 B CN110991194 B CN 110991194B
Authority
CN
China
Prior art keywords
translation
engine
norm
kernel
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911163238.5A
Other languages
English (en)
Other versions
CN110991194A (zh
Inventor
刘国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iol Wuhan Information Technology Co ltd
Original Assignee
Iol Wuhan Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iol Wuhan Information Technology Co ltd filed Critical Iol Wuhan Information Technology Co ltd
Priority to CN201911163238.5A priority Critical patent/CN110991194B/zh
Publication of CN110991194A publication Critical patent/CN110991194A/zh
Application granted granted Critical
Publication of CN110991194B publication Critical patent/CN110991194B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种基于OpenKiWi进化的引擎优化方法以及翻译系统以及实现对应方法的计算机可读存储介质。本发明的翻译系统包括翻译引擎矩阵、文档输入组件、能显示多个不同翻译结果的多个显示界面组件、随机选择组件、反馈组件以及评测组件库。所述评测组件库包括OpenKiWi引擎、Bleu内核、gleu内核、向量化组件以及范数计算引擎。相对于现有技术,本发明首次在翻译引擎矩阵选择中以OpenKiWi为核心评测组件,结合基于GLEU内核和BLEU内核的评测组件,引入评分矩阵的范数进行判断,从而避免了翻译引擎矩阵选择中的记忆效应问题。

Description

基于OpenKiWi进化的引擎优化方法以及翻译系统
技术领域
本发明属于翻译技术领域,尤其涉及一种基于OpenKiWi进化的引擎优化方法以及翻译系统以及实现对应方法的计算机可读存储介质。
背景技术
不同语言之间的语音转文字和翻译,是近年来机器学习领域的热门研究方向,尤其是语音到语音的直接翻译。
通常来讲,语音翻译过程可以分解成三个步骤。第一步是语音识别,就是将英文语音内容识别出来,并且以文字的形式表达出来,比如听到“How are you?”这句话,就写出How,are,you三个单词和问号。第二步是文字翻译,就是将上一步拿到的文字翻译成目标语种,比如写出“你好吗?”这句话。最后一步是语音合成,也就是将翻译好的文本组合成一段语音,然后播放出来。
谷歌翻译等当下常见的语音翻译软件都遵循了这一思路,并且对每一步骤进行了很多优化,比如引入端到端模型(End-to-end model)。这是一种将三个步骤结合起来,比如建立语音信号到文字映射,进而实现整体优化的模式。
发明人发现,现有技术过于注重整体优化的同时,大多忽略了中间翻译过程中翻译引擎的选择与进化。现有的各种翻译工具都至少内置了多种翻译引擎,例如将谷歌翻译、搜狗翻译、有道翻译、百度翻译等组合成一个包含对外接口的翻译引擎矩阵,实际翻译时,翻译引擎矩阵将会从中选择一个或者多个翻译引擎进行翻译,从而输出对应的翻译结果。
然而,在这个过程中,翻译引擎矩阵选择的记忆效应,将会导致翻译结果准确度出现极端的两极化,即如果初始选择恰当,则后续选择会越来越准确;反之,后续选择也会越来越不符合实际情况。通常,为避免这种情况,需要研发人员引入人工反馈,从而使得翻译引擎矩阵的自动化程度降低,极大的降低了工作效率;并且这个人工反馈过程依赖于研发人员的先验规则,导致结果准确度降低的同时,客观性也会降低。
申请号为CN201910611919.7的中国发明专利申请提出一种机器翻译方法及装置、电子设备及存储介质,在该方法中,在接收待翻译语句后,调用训练得到的机器翻译模型,该机器翻译模型包括分块模型和翻译模型,然后基于分块模型,根据待翻译词的词向量,对待翻译语句进行分块得到待翻译块,最后基于翻译模型以及待翻译块,对待翻译语句进行翻译得到翻译结果;在本发明中,由于分块模型是根据词向量对待翻译语句进行分块得到待翻译块的,这样就可以将待翻译语句划分为更小的待翻译块,进而翻译模型基于这些待翻译块进行翻译时,各待翻译块对应的翻译结果更准确,将这些待翻译块对应的翻译结果进行组合,得到整个待翻译语句的翻译结果也更准确,即本发明可以对待翻译语句进行更细粒度的分块,提高了机器翻译的准确度。
申请号为CN201810357897.1的中国发明专利申请提出基于似谓词演算形式的机器思维语言翻译的方法及系统,分块模型是根据词向量对待翻译语句进行分块得到待翻译块的,这样就可以将待翻译语句划分为更小的待翻译块,进而翻译模型基于这些待翻译块进行翻译时,各待翻译块对应的翻译结果更准确,将这些待翻译块对应的翻译结果进行组合,得到整个待翻译语句的翻译结果也更准确,提高了机器翻译的准确度。
但是,上述现有技术均不能解决由于翻译引擎矩阵选择的记忆效应带来的翻译准确度降低的问题。
发明内容
为解决上述技术问题,本发明提出一种基于OpenKiWi进化的引擎优化方法以及翻译系统以及实现对应方法的计算机可读存储介质。本发明的翻译系统包括翻译引擎矩阵、文档输入组件、能显示多个不同翻译结果的多个显示界面组件、随机选择组件、反馈组件以及评测组件库。所述评测组件库包括OpenKiWi引擎、Bleu内核、gleu内核、向量化组件以及范数计算引擎。相对于现有技术,本发明首次在翻译引擎矩阵选择中以OpenKiWi为核心评测组件,结合基于GLEU内核和BLEU内核的评测组件,引入评分矩阵的范数进行判断,从而避免了翻译引擎矩阵选择中的记忆效应问题。
在本发明的第一个方面,提供一种基于OpenKiWi进化的引擎优化方法,所述方法应用于包含翻译引擎矩阵的评测系统中,该方法包括:
S100:获得翻译引擎矩阵对于源语言文档的翻译结果,所述翻译结果为从所述翻译引擎矩阵中随机选择的多个不同翻译引擎对于同一源语言文档的多个翻译结果;
S200:采用包含OpenKiWi核心的评测组件,对所述多个翻译结果进行自动评测,并量化得到每一个翻译结果的评分;
S300:从所述多个翻译结果中随机选择第一数量的部分翻译结果,采用基于BLEU内核的评测组件进行评测,得到所述第一数量的部分翻译结果的评分;
S400:采用基于GLEU内核的评测组件,对所述多个翻译结果中除步骤S300选择的部分翻译结果之外的其他翻译结果进行评测,得到第二数量的其他翻译结果的评分;
S500:基于步骤S200-S400的三个评分,输出所述源语言文档的最终翻译结果,具体包括:
步骤S200得到的每一个翻译结果的评分为向量序列X={X1,X2,……,Xn};
步骤S300得到的部分翻译结果的评分为向量序列Y={Y1,Y2,……,Ys};
步骤S400得到的其他翻译结果的评分为向量序列Z={Z1,Z2,……Zq};
计算向量序列X的n-范数、向量序列Y的s-范数以及向量序列Z的q-范数;
如果所述n-范数>(s-范数+q-范数);
则输出所述S200步骤中评分最高的翻译结果;
否则,返回步骤S100;
其中,s+q=n。
进一步的,如果所述n-范数<(s-范数+q-范数),则将所述步骤S300-S400的评测结果反馈给所述翻译引擎矩阵。
作为进一步的优选技术方案,在所述步骤S400之后,还包括如下步骤:
S401:计算所述向量序列Y和向量序列Z的相似度;
S402:判断所述相似度是否超过预定阈值;如果是,将所述步骤S200中评分最高的翻译结果输出。
为了确保更好的防记忆效果,上述技术方案中,步骤S100中,每次随机选择的多个不同翻译引擎不完全相同。
在本发明的第二个方面,提供一种基于OpenKiWi引擎云的翻译优化系统,所述优化系统包括:
文档输入组件,用于输入待译文档,所述待译文档包括多种形式:文本、音频、视频等;
翻译引擎选择器,所述翻译引擎选择器用于从所述翻译优化系统的翻译引擎矩阵中随机选择多个翻译引擎;
翻译结果分组显示界面,在所述显示界面上,分组显示所述多个翻译引擎对所述待译文档执行翻译后的多个翻译结果;
作为体现本发明重要创新点之一,所述翻译优化系统还包括OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件;
所述OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件执行对翻译结果的评测,并输出评测向量序列。
作为体现本发明重要创新点之一,所述翻译优化系统还包括范数计算引擎模块,用于计算向量序列的不同类型范数。
具体而言,作为本发明的另一关键技术,在所述OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件输出各自的评测向量序列X、Y、Z之后,所述范数计算引擎模块执行如下计算:
计算向量序列X的n-范数、向量序列Y的s-范数以及向量序列Z的q-范数;
其中n、s、q为对应向量序列各自的元素个数。
作为优选,所述范数计算引擎、OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件封装成整体引擎,对外提供统一反馈接口;
其中,翻译结果分组显示界面包括至少三个并排显示的分组显示界面,如果所述n-范数>(s-范数+q-范数),则在最中间的显示界面上,显示所述OpenKiWi引擎云评测得分最高的翻译结果;
作为优选,在另外的显示界面上,显示基于BLEU内核的评测组件以及基于GLEU内核的评测组件评测得分最高的翻译结果;
作为优选,所述整体引擎连接反馈组件,所述反馈组件连接所述翻译引擎矩阵,并反馈信号给所述翻译引擎选择器。
本发明所述的基于OpenKiWi进化的引擎优化方法,通过所述翻译优化系统实现。
作为再一个方面,本发明还提供一个评测引擎组合接口,所述评测引擎组合接口包括OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件,通过反馈组件,与翻译引擎矩阵通信连接。
本发明的上述方法可以通过计算机程序指令实现,因此,本发明还提供一种计算机可读存储介质,通过计算机系统的存储器和处理器,执行所述指令实现本发明的上述方法。
采用本发明的技术方案,通过在翻译引擎矩阵选择中以OpenKiWi为核心评测组件,结合基于GLEU内核和BLEU内核的评测组件,引入评分矩阵的范数进行判断,从而避免了翻译引擎矩阵选择中的记忆效应问题。
本发明的进一步细节以及优点将在具体实例中结合附图进一步展现。
附图说明
图1是本发明所述引擎优化方法主体流程图。
图2是图1所述方法的进一步实施例示意图。
图3是本发明一个实施例的所述翻译优化系统整体示意图。
图4是图3所述翻译优化系统的具体指令实现时序图。
图5是图3所述翻译优化系统的流程框架图。
图6是本发明技术方案与现有技术的准确度对比图
具体实施例
参见图1,本发明所述引擎优化方法主体流程图。在图1中,所述方法具体包括:
S100:获得翻译引擎矩阵对于源语言文档的翻译结果,所述翻译结果为从所述翻译引擎矩阵中随机选择的多个不同翻译引擎对于同一源语言文档的多个翻译结果;
现有的各种翻译工具都至少内置了多种翻译引擎,例如将谷歌翻译、搜狗翻译、有道翻译、百度翻译等组合成一个包含对外接口的翻译引擎矩阵。
S200:采用包含OpenKiWi核心的评测组件,对所述多个翻译结果进行自动评测,并量化得到每一个翻译结果的评分。
S300:从所述多个翻译结果中随机选择第一数量的部分翻译结果,采用基于BLEU内核的评测组件进行评测,得到所述第一数量的部分翻译结果的评分;
S400:采用基于GLEU内核的评测组件,对所述多个翻译结果中除步骤S300选择的部分翻译结果之外的其他翻译结果进行评测,得到第二数量的其他翻译结果的评分;
S500:基于步骤S200-S400的三个评分,输出所述源语言文档的最终翻译结果。
在本实施例中,步骤S500具体包括:
步骤S200得到的每一个翻译结果的评分为向量序列X={X1,X2,……,Xn};
步骤S300得到的部分翻译结果的评分为向量序列Y={Y1,Y2,……,Ys};
步骤S400得到的其他翻译结果的评分为向量序列Z={Z1,Z2,……Zq};
计算向量序列X的n-范数、向量序列Y的s-范数以及向量序列Z的q-范数;
如果所述n-范数>(s-范数+q-范数);
则输出所述S200步骤中评分最高的翻译结果;
否则,返回步骤S100;
其中,s+q=n。
进一步的,如果所述n-范数<(s-范数+q-范数),则将所述步骤S300-S400的评测结果反馈给所述翻译引擎矩阵。
作为进一步的优选技术方案,在所述步骤S400之后,还包括如下步骤:
S401:计算所述向量序列Y和向量序列Z的相似度;
S402:判断所述相似度是否超过预定阈值;如果是,将所述步骤S200中评分最高的翻译结果输出。
通过实验证明,在翻译引擎矩阵选择中以OpenKiWi为核心评测组件,结合基于GLEU内核和BLEU内核的评测组件,引入评分矩阵的范数进行判断,有效避免了翻译引擎矩阵选择中的记忆效应问题。
进一步参见图2,是图1所述方法的进一步实施例示意图。
在所述步骤S400之后,还包括如下步骤:
S401:计算所述向量序列Y和向量序列Z的相似度;
S402:判断所述相似度是否超过预定阈值;如果是,将所述步骤S200中评分最高的翻译结果输出。
为了确保更好的防记忆效果,上述技术方案中,步骤S100中,每次随机选择的多个不同翻译引擎不完全相同。
图1-2所述的方法可以在计算机翻译系统中集成,因此,参见图3-5,是本发明所述翻译优化系统的具体实施例。
参见图3,提供一种基于OpenKiWi引擎云的翻译优化系统,所述优化系统包括:
文档输入组件,用于输入待译文档,所述待译文档包括多种形式:文本、音频、视频等;
翻译引擎选择器,所述翻译引擎选择器用于从所述翻译优化系统的翻译引擎矩阵中随机选择多个翻译引擎;
翻译结果分组显示界面,在所述显示界面上,分组显示所述多个翻译引擎对所述待译文档执行翻译后的多个翻译结果;
图3示意性的示出所述翻译优化系统还包括OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件,这是实现本发明的技术效果的关键技术手段之一;
进一步参见图4,所述OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件执行对翻译结果的评测,并输出评测向量序列。
具体来说,采用包含OpenKiWi核心的评测组件,对所有翻译引擎输出的多个翻译结果进行自动评测,并量化得到每一个翻译结果的评分作为评测向量序列。
采用基于BLEU内核的评测组件从所述多个翻译结果中随机选择第一数量的部分翻译结果进行评测,得到所述第一数量的部分翻译结果的评分作为评测向量序列;
采用基于GLEU内核的评测组件,对所述多个翻译结果中除基于BLEU内核的评测组件选择的部分翻译结果之外的其他翻译结果进行评测,得到第二数量的其他翻译结果的评分作为评测向量序列;
所述翻译优化系统还包括范数计算引擎模块,用于计算向量序列的不同类型范数。
在本实施例中,在所述OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件输出各自的评测向量序列X、Y、Z之后,所述范数计算引擎模块执行如下计算:
计算向量序列X的n-范数、向量序列Y的s-范数以及向量序列Z的q-范数;
其中n、s、q为对应向量序列各自的元素个数。
作为优选,所述范数计算引擎、OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件封装成整体引擎,对外提供统一反馈接口;
其中,翻译结果分组显示界面包括至少三个并排显示的分组显示界面,如果所述n-范数>(s-范数+q-范数),则在最中间的显示界面上,显示所述OpenKiWi引擎云评测得分最高的翻译结果;
作为优选,在另外的显示界面上,显示基于BLEU内核的评测组件以及基于GLEU内核的评测组件评测得分最高的翻译结果;
作为优选,所述整体引擎连接反馈组件,所述反馈组件连接所述翻译引擎矩阵,并反馈信号给所述翻译引擎选择器。
本发明所述的基于OpenKiWi进化的引擎优化方法,通过所述翻译优化系统实现。
参见图4,所述OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件可以集成为评测引擎组合接口,对外显示为黑盒状态。通过反馈组件,与翻译引擎矩阵通信连接,这样则可以体现本发明的技术方案的另一个优点:普适性以及可推广性。
本发明使用到的各种英文缩写遵循翻译技术领域的标准表达。
BLEU为IBM提出的自动评测算法BLEU(bilingual evaluation understudy)。简单来说,BLEU算法的思想就是机器翻译的译文越接近人工翻译的结果,它的翻译质量就越高。所以评测算法就是如何定义机器翻译译文与参考译文之间的相似度。
机器翻译(Machine Translation,MT),又称为自动翻译,是利用计算机程序将文字从一种自然语言(源语言)翻译成另一种自然语言(目标语言)。它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(ComputationalLinguistics)、自然语言理解(Natural Language Understanding)之间存在着密不可分的关系。
GLEU是在BLEU基础上的改进评测指标,在实际测试中,会比BLEU的表现和译员评测的效果较为接近一些,尤其在自然语言评测领域,逐渐取代Bleu有更好的表现,类似的技术可参见Wang A,Singh A,Michael J,et al.GLUE:A Multi-Task Benchmark andAnalysis Platform for Natural Language Understanding[J].2018.
上述技术概念虽然为本领域技术人员所熟知,但是本发明首次首次在翻译引擎矩阵选择中以OpenKiWi为核心评测组件,结合基于GLEU内核和BLEU内核的评测组件,引入评分矩阵的范数进行判断,从而避免了翻译引擎矩阵选择中的记忆效应问题,现有技术未见相关报告;并且从图6技术效果看,随着待译文档的数量级上升,本发明的技术方案准确度越来越明显,因此,本发明的技术方案尤其适合于大规模语料的准确翻译。

Claims (8)

1.一种基于OpenKiWi进化的引擎优化方法,所述方法应用于包含翻译引擎矩阵的评测系统中,其特征在于,所述方法包括如下步骤:
S100:获得翻译引擎矩阵对于源语言文档的翻译结果,所述翻译结果为从所述翻译引擎矩阵中随机选择的多个不同翻译引擎对于同一源语言文档的多个翻译结果;
S200:采用包含OpenKiWi核心的评测组件,对所述多个翻译结果进行自动评测,并量化得到每一个翻译结果的评分;
S300:从所述多个翻译结果中随机选择第一数量的部分翻译结果,采用基于BLEU内核的评测组件进行评测,得到所述第一数量的部分翻译结果的评分;
S400:采用基于GLEU内核的评测组件,对所述多个翻译结果中除步骤S300选择的部分翻译结果之外的其他翻译结果进行评测,得到第二数量的其他翻译结果的评分;
S500:基于步骤S200-S400的三个评分,输出所述源语言文档的最终翻译结果,具体包括:
步骤S200得到的每一个翻译结果的评分为向量序列X={X1,X2,......,Xn};
步骤S300得到的部分翻译结果的评分为向量序列Y={Y1,Y2,......,Ys};
步骤S400得到的其他翻译结果的评分为向量序列Z={Z1,Z2,......Zq};
计算向量序列X的n-范数、向量序列Y的s-范数以及向量序列Z的q-范数;
如果所述n-范数>(s-范数+q-范数);
则输出所述S200步骤中评分最高的翻译结果;
否则,返回步骤S100;
其中,s+q=n。
2.如权利要求1所述的方法,其特征在于:
如果所述n-范数<(s-范数+q-范数),则将步骤S300、步骤S400的评测结果反馈给所述翻译引擎矩阵。
3.如权利要求1所述的方法,其特征在于:
在所述步骤S400之后,还包括如下步骤:
S401:计算所述向量序列Y和向量序列Z的相似度;
S402:判断所述相似度是否超过预定阈值;如果是,将所述步骤S200中评分最高的翻译结果输出。
4.如权利要求1-3任一项所述的方法,其特征在于:
步骤S100中,每次随机选择的多个不同翻译引擎不完全相同。
5.一种基于OpenKiWi引擎云的翻译优化系统,所述优化系统包括:
文档输入组件,用于输入待译文档,所述待译文档包括多种形式:
文本、音频、视频或者其组合;
翻译引擎选择器,所述翻译引擎选择器用于从所述翻译优化系统的翻译引擎矩阵中随机选择多个翻译引擎;
翻译结果分组显示界面,在所述显示界面上,分组显示所述多个翻译引擎对所述待译文档执行翻译后的多个翻译结果;
其特征在于:
所述翻译优化系统还包括OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件;
所述OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件执行对翻译结果的评测,并输出评测向量序列;
在所述OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件输出各自的评测向量序列X、Y、Z之后,执行如下计算:
计算向量序列X的n-范数、向量序列Y的s-范数以及向量序列Z的q-范数;
其中n、s、q为对应向量序列各自的元素个数;
所述翻译结果分组显示界面包括至少三个并排显示的分组显示界面,如果所述n-范数>(s-范数+q-范数),则在最中间的显示界面上,显示所述OpenKiWi引擎云评测得分最高的翻译结果。
6.如权利要求5所述的系统,其特征在于:所述翻译优化系统还包括范数计算引擎模块,用于计算向量序列的不同类型范数。
7.如权利要求6所述的系统,其特征在于:所述范数计算引擎模块、OpenKiWi引擎云、基于BLEU内核的评测组件以及基于GLEU内核的评测组件封装成整体引擎,对外提供统一反馈接口。
8.一种计算机可读存储介质,通过计算机系统的存储器和处理器,执行程序指令,实现权利要求1-4任一项所述的一种基于OpenKiWi进化的引擎优化方法的全部步骤。
CN201911163238.5A 2019-11-27 2019-11-27 基于OpenKiWi进化的引擎优化方法以及翻译系统 Active CN110991194B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911163238.5A CN110991194B (zh) 2019-11-27 2019-11-27 基于OpenKiWi进化的引擎优化方法以及翻译系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911163238.5A CN110991194B (zh) 2019-11-27 2019-11-27 基于OpenKiWi进化的引擎优化方法以及翻译系统

Publications (2)

Publication Number Publication Date
CN110991194A CN110991194A (zh) 2020-04-10
CN110991194B true CN110991194B (zh) 2023-05-16

Family

ID=70086170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911163238.5A Active CN110991194B (zh) 2019-11-27 2019-11-27 基于OpenKiWi进化的引擎优化方法以及翻译系统

Country Status (1)

Country Link
CN (1) CN110991194B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006053683A (ja) * 2004-08-10 2006-02-23 Advanced Telecommunication Research Institute International 音声認識および機械翻訳装置
JP2007034621A (ja) * 2005-07-26 2007-02-08 Fuji Xerox Co Ltd 翻訳装置及び翻訳方法
CN110472257A (zh) * 2019-08-20 2019-11-19 南京题麦壳斯信息科技有限公司 一种基于句对的机器翻译引擎测评优选方法及系统
CN110472256A (zh) * 2019-08-20 2019-11-19 南京题麦壳斯信息科技有限公司 一种基于篇章的机器翻译引擎测评优选方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8326598B1 (en) * 2007-03-26 2012-12-04 Google Inc. Consensus translations from multiple machine translation systems
US8265923B2 (en) * 2010-05-11 2012-09-11 Xerox Corporation Statistical machine translation employing efficient parameter training
CN104731774B (zh) * 2013-12-24 2018-02-02 哈尔滨工业大学 面向通用机译引擎的个性化翻译方法及装置
US9652453B2 (en) * 2014-04-14 2017-05-16 Xerox Corporation Estimation of parameters for machine translation without in-domain parallel data
CN109710948A (zh) * 2018-11-27 2019-05-03 语联网(武汉)信息技术有限公司 机器翻译引擎推荐方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006053683A (ja) * 2004-08-10 2006-02-23 Advanced Telecommunication Research Institute International 音声認識および機械翻訳装置
JP2007034621A (ja) * 2005-07-26 2007-02-08 Fuji Xerox Co Ltd 翻訳装置及び翻訳方法
CN110472257A (zh) * 2019-08-20 2019-11-19 南京题麦壳斯信息科技有限公司 一种基于句对的机器翻译引擎测评优选方法及系统
CN110472256A (zh) * 2019-08-20 2019-11-19 南京题麦壳斯信息科技有限公司 一种基于篇章的机器翻译引擎测评优选方法及系统

Also Published As

Publication number Publication date
CN110991194A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN110162627B (zh) 数据增量方法、装置、计算机设备及存储介质
JP6493866B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US9176952B2 (en) Computerized statistical machine translation with phrasal decoder
US9342499B2 (en) Round-trip translation for automated grammatical error correction
CN1578954B (zh) 计算机语言翻译扩展系统
JP5915326B2 (ja) 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム
CN104239289B (zh) 音节划分方法和音节划分设备
KR100853173B1 (ko) 통계적 자동 번역 방식에 기반한 음성 자동 통역 시스템 및그에 적용되는 번역 처리 방법 및 그 훈련방법
KR20210035721A (ko) 다중-언어 코퍼스를 이용하여 기계번역 하는 방법 및 이를 구현한 시스템
CN101290616A (zh) 一种统计机器翻译方法和系统
EP4060526A1 (en) Text processing method and device
KR20140049150A (ko) 사용자 참여 기반의 자동 번역 생성 후처리 시스템
CN107229613B (zh) 一种基于向量空间模型的英汉语料提取方法
CN107491441B (zh) 一种基于强制解码的动态抽取翻译模板的方法
CN110991194B (zh) 基于OpenKiWi进化的引擎优化方法以及翻译系统
Kalimuthu et al. Incremental domain adaptation for neural machine translation in low-resource settings
CN113705251B (zh) 机器翻译模型的训练方法、语言翻译方法及设备
JP2006004366A (ja) 機械翻訳システム及びそのためのコンピュータプログラム
JP2007323476A (ja) 機械翻訳装置及びコンピュータプログラム
CN113886424A (zh) 样本数据生成方法、装置、电子设备及存储介质
CN107491443B (zh) 一种包含非常规词汇的中文句子翻译方法及系统
CN107870905B (zh) 一种特定词汇的识别方法
KR20160085100A (ko) 하이브리드 번역 장치 및 그 방법
CN111444676A (zh) 词性标注方法、装置、设备及存储介质
CN115965017B (zh) 一种基于开发平台的多语言录入和解析系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant