CN100543727C - 一种融合了句型模板和统计机器翻译技术的翻译方法 - Google Patents

一种融合了句型模板和统计机器翻译技术的翻译方法 Download PDF

Info

Publication number
CN100543727C
CN100543727C CNB2006101655326A CN200610165532A CN100543727C CN 100543727 C CN100543727 C CN 100543727C CN B2006101655326 A CNB2006101655326 A CN B2006101655326A CN 200610165532 A CN200610165532 A CN 200610165532A CN 100543727 C CN100543727 C CN 100543727C
Authority
CN
China
Prior art keywords
sentence pattern
pattern template
sentence
source language
machine translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2006101655326A
Other languages
English (en)
Other versions
CN101206643A (zh
Inventor
付雷
黄瑾
何中军
吕雅娟
刘群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CNB2006101655326A priority Critical patent/CN100543727C/zh
Publication of CN101206643A publication Critical patent/CN101206643A/zh
Application granted granted Critical
Publication of CN100543727C publication Critical patent/CN100543727C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种融合了句型模板和统计机器翻译技术的翻译方法,该方法包括:A、配置句型模板,建立句型模板库;B、利用配置的句型模板对输入的源语言进行匹配,如果匹配成功,则将输入的源语言转换成包含源语言词语与目标语言词语的句子,并执行步骤D;否则,执行步骤C;C、将输入的源语言按照标点符号切分成子句,对切分的子句进行匹配,将切分的子句转换成包含源语言词语与目标语言词语的句子;D、将匹配得到的包含源语言词语与目标语言词语的句子输出给统计机器翻译系统进行翻译,得到翻译结果。利用本发明,解决了统计机器翻译系统不能很好的翻译具有固定句型结构句子的问题,使对具有固定句型结构的句子的翻译更加流畅。

Description

一种融合了句型模板和统计机器翻译技术的翻译方法
技术领域
本发明涉及统计机器翻译技术领域,尤其涉及一种融合了句型模板和统计机器翻译技术的翻译方法。
背景技术
随着世界经济的迅猛发展,各国间的文化,经济等的交往越来越频繁,人们每天的工作和生活有时不得不面对来自各个国家的各种语言的资料和信息,随之而来的一个主要问题便是语言理解问题,如何能够在较短的时间内理解使用非母语写成的资料,成为了一个急需解决的问题。
因此,机器翻译软件应运而生,早期的机器翻译主要集中在规则翻译系统的研究,但翻译规则的书写需要语言专家的参与,而且通常每更换一个翻译领域就要重写一大批的规则,需要耗费大量的人力、物力、财力,在这种情形下,统计机器翻译方法在机器翻译领域迅速崛起。
统计机器翻译通过利用大规模的平行双语语料对翻译系统进行训练(统计建模),只要拥有足够多的双语平行语料,就可以在无人干预的情形下短时间内搭建一个任何语言对象之间的机器翻译系统,而且从目前国际上主流的统计机器翻译系统的效果来看,已基本上赶上甚至超越了规则翻译系统。
但是,统计机器翻译方法也仍然存在着一些缺陷。由于统计建模的过程中完全依赖于对平行语料的概率统计基础之上,而没有对句子的结构,句法等进行分析、利用,使得翻译的句子常常会出现语序、多词、少词等方面的错误。
随着统计机器翻译技术近几年的快速发展,逐渐将句法分析,规则等融入到统计机器翻译系统中,一定程度上提高了系统的翻译效果。但当把统计机器翻译系统真正应用到某些领域的翻译中时,仍然还是会存在一些问题,其中一个主要的问题就是不能充分利用该领域中的大量出现的固定句型的信息,这是因为统计机器翻译在翻译过程中完全是依赖于句子翻译概率的计算,而很少去考虑句子的结构信息。因此,对这种固定句型的句子仍然单纯的采用统计方法进行翻译,翻译结果往往都不能尽如人意。
发明内容
(一)要解决的技术问题
有鉴于此,本发明的主要目的在于提供一种融合了句型模板和统计机器翻译技术的翻译方法,以解决统计机器翻译系统不能很好的翻译具有固定句型结构的句子的问题,从而使对具有固定句型结构的句子的翻译更加流畅,符合领域常用句型的翻译结构。
(二)技术方案
为达到上述目的,本发明的技术方案是这样实现的:
一种融合了句型模板和统计机器翻译技术的翻译方法,该方法包括:
A、配置句型模板,建立句型模板库;
B、利用配置的句型模板对输入的源语言进行匹配,如果匹配成功,则将输入的源语言转换成包含源语言词语与目标语言词语的句子,并执行步骤D;否则,执行步骤C;
C、将输入的源语言按照标点符号切分成子句,对切分的子句进行匹配,将切分的子句转换成包含源语言词语与目标语言词语的句子;
D、将匹配得到的包含源语言词语与目标语言词语的句子输出给统计机器翻译系统进行翻译,得到翻译结果。
所述步骤A包括:从大规模的语言资料库中或从日常工作遇到的包含固定句型的句子中抽象出句型模板,并将抽象出的句型模板按照一定的策略加入到系统的句型模板库中,建立句型模板库。
所述句型模板包括模板的常量和模板的变量两个部分。
配置句型模板库中句型模板的优先级,步骤B中所述利用配置的句型模板对输入的源语言进行匹配采用嵌套匹配策略进行,具体包括:按句型模板优先级由高到低的顺序依次对输入的源语言进行匹配,首先利用句型模板库中优先级较高的句型模板对输入的源语言进行匹配,然后利用句型模板库中优先级较低的句型模板对输入的源语言进行匹配,直至句型模板库中没有句型模板能够匹配上输入的源语言为止。
所述步骤C包括:按照句号、逗号、分号和冒号的先后顺序依次对源语言进行切分,如果按照句号、逗号、分号和冒号中任何一种切分方式能够将源语言切分成与句型模板相匹配的子句,则结束切分,对切分得到的子句进行匹配,并将切分得到的子句转换成包含源语言词语与目标语言词语的句子。
所述匹配包括整句匹配和部分匹配两种匹配方式,在采用整句匹配方式时,源语言的句首与句型模板的句首相对应,源语言的句尾与句型模板的句尾相对应;在采用部分匹配方式时,源语言中的部分词语与句型模板中的部分词语相对应。
所述步骤D包括:将匹配得到的包含源语言词语与目标语言词语的句子输出给统计机器翻译系统,统计机器翻译系统将源语言切分成不同的短语,并到短语表中查找与所述短语相匹配的目标短语,顺序连接目标短语构成不同的译文,计算译文的分数,选择分数最高的译文作为最终的译文。
所述统计机器翻译系统为基于短语的单调解码的翻译系统;
所述短语表包括多条记录,每条记录包括源语言短语、目标语言短语以及源语言短语与目标语言短语之间的翻译概率三个部分;
在计算译文的分数时,所述译文分数等于翻译概率与语言模型概率的乘积。
所述源语言短语与目标语言短语中的短语为连续的单词串。
所述语言模型概率用于计算翻译的目标语言的流畅程度,采用概率统计方法揭示语言单位内在的统计规律;
所述概率统计方法为基于N元组统计的方法。
(三)有益效果
从上述技术方案可以看出,本发明具有以下有益效果:
1、本发明提供的这种融合了句型模板和统计机器翻译技术的翻译方法,采用句型模板的定义方法、句型模板的匹配算法及其句型模板方法与统计机器翻译的融合策略,很好地解决了统计机器翻译系统不能很好的翻译具有固定句型结构的句子的问题,使对具有固定句型结构的句子的翻译更加流畅,符合领域常用句型的翻译结构。
2、本发明提供的这种融合了句型模板和统计机器翻译技术的翻译方法,结合了基于模板的技术和统计机器翻译的技术,仅仅只需要用户定义一定量的常用固定句型的模板,就能够翻译出符合特定领域句型结构的标准化的目标译文,同时又具有成本低,耗时短,不存在版权纠纷等优点。
附图说明
图1为本发明提供的融合了句型模板和统计机器翻译技术的翻译方法总体技术方案的实现流程图;
图2为依照本发明实施例提供的融合了句型模板和统计机器翻译技术的翻译方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
如图1所示,图1为本发明提供的融合了句型模板和统计机器翻译技术的翻译方法总体技术方案的实现流程图,该方法包括以下步骤:
步骤101:配置句型模板,建立句型模板库;
步骤102:利用配置的句型模板对输入的源语言进行匹配,如果匹配成功,则将输入的源语言转换成包含源语言词语与目标语言词语的句子,并执行步骤104;否则,执行步骤103;
步骤103:将输入的源语言按照标点符号切分成子句,对切分的子句进行匹配,将切分的子句转换成包含源语言词语与目标语言词语的句子;
步骤104:将匹配得到的包含源语言词语与目标语言词语的句子输出给统计机器翻译系统进行翻译,得到翻译结果。
上述步骤101包括:从大规模的语言资料库中或从日常工作遇到的包含固定句型的句子中抽象出句型模板,并将抽象出的句型模板按照一定的策略加入到系统的句型模板库中,建立句型模板库。所述句型模板包括模板的常量和模板的变量两个部分。
上述在从大规模的语言资料库中或从日常工作遇到的包含固定句型的句子中抽象出句型模板时,由用户针对某些领域的特殊翻译需求,按照句型模板的定义方法进行。由于某个特定领域的特定句型不会太多,所以句型模板库不会像规则库那样庞大,而且句型模板库的构建不需要语言学家的参与,普通的用户完全可以胜任,并且可以在使用中逐步的将新的句型模板加入库中,句型模板库的构建所要耗费的人力、物力要比规则库的构建小很多。然后,在用户输入一个待翻译的句子时,首先调用句型模板的匹配算法对该句子进行匹配替换,然后将匹配替换后生成的句子送入统计机器翻译系统进行翻译。
预先配置句型模板库中句型模板的优先级,上述步骤102中所述利用配置的句型模板对输入的源语言进行匹配采用嵌套匹配策略进行,具体包括:按句型模板优先级由高到低的顺序依次对输入的源语言进行匹配,首先利用句型模板库中优先级较高的句型模板对输入的源语言进行匹配,然后利用句型模板库中优先级较低的句型模板对输入的源语言进行匹配,直至句型模板库中没有句型模板能够匹配上输入的源语言为止。
上述步骤103包括:按照句号、逗号、分号和冒号的先后顺序依次对源语言进行切分,如果按照句号、逗号、分号和冒号中任何一种切分方式能够将源语言切分成与句型模板相匹配的子句,则结束切分,对切分得到的子句进行匹配,并将切分得到的子句转换成包含源语言词语与目标语言词语的句子。
上述匹配包括整句匹配和部分匹配两种匹配方式。整句匹配是指对于模板库中的模板,输入句子的句首和句尾必须与模板的首尾完全对应才能匹配,而部分匹配则允许对句子中的任何部分进行模板匹配,不局限于对输入句子首尾的完全匹配。整句匹配的优点是匹配精度较高,但匹配能力不够强,而部分匹配则恰恰相反,其匹配能力很强但精度不够高,容易造成错误调序,须根据实际的情况进行衡量选择匹配策略。在采用整句匹配方式时,源语言的句首与句型模板的句首相对应,源语言的句尾与句型模板的句尾相对应;在采用部分匹配方式时,源语言中的部分词语与句型模板中的部分词语相对应。
上述步骤104包括:将匹配得到的包含源语言词语与目标语言词语的句子输出给统计机器翻译系统,统计机器翻译系统将源语言切分成不同的短语,并到短语表中查找与所述短语相匹配的目标短语,顺序连接目标短语构成不同的译文,计算译文的分数,选择分数最高的译文作为最终的译文。
上述统计机器翻译系统为基于短语的单调解码的翻译系统。所述短语表包括多条记录,每条记录包括源语言短语、目标语言短语以及源语言短语与目标语言短语之间的翻译概率三个部分;在计算译文的分数时,所述译文分数等于翻译概率与语言模型概率的乘积。短语表可以采用两种方法自动获取,一种是从词典中获取,另一种从平行语料库中自动获取。从字典中获取的短语的翻译概率可以手动设置成较高的值。
所述的从平行语料库中自动获取短语翻译对的过程如下:首先收集两种语言互为对齐的句子对,然后利用自动对齐软件获取句子对中单词之间的对齐关系,最后短语抽取工具从单词级对齐好的语料中抽取短语,并计算它们的之间的翻译概率。
上述源语言短语与目标语言短语中的短语不一定是语言学意义上的短语,准确地说是连续的单词串,如“并计算它们的”。所述语言模型概率用于计算翻译的目标语言的流畅程度,采用概率统计方法揭示语言单位内在的统计规律;所述概率统计方法为基于N元组(N-Gram)统计的方法。所述的N-Gram是指该模型基于这样一种假设,第N个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。这些概率可以通过直接从语料中统计N个词同时出现的次数得到。常用的模型多是二元组(Bi-Gram)或三元组(Tri-Gram)。
基于图1所述的融合了句型模板和统计机器翻译技术的翻译方法总体技术方案的实现流程图,以下结合具体的实施例对本发明融合了句型模板和统计机器翻译技术的翻译方法进一步详细说明。
实施例
如图2所示,图2为依照本发明实施例提供的融合了句型模板和统计机器翻译技术的翻译方法流程图,该方法包括以下步骤:
步骤201:配置句型模板,建立句型模板库。
在本步骤中,配置的句型模板包括“模板的常量”部分和“模板的变量”两部分。例如对于平行语料库中的如下句对:
一种治疗糖尿病的药物组合物及制备方法
A pharmaceutical composition for the treatment of diabetes and itspreparation method
抽象成句型模板变成下面的形式:
一种治疗##1[,10]{0}?的##2[,6]{0}及制备方法
A##2 for treatment of ## 1 and its preparation method
其中的##1[,10]{0}?,##2[,6]{0},##1及##2为句型模板的变量部分,其余为句型模板的常量部分,源语言中的##N与目标语言中的##N一一对应。
句型模板的变量部分的定义的完整形式及含义如下:
源语言中句型模板变量部分的完整形式为:##N[m,n]{+/—word}?
目标语言中句型模板变量部分的完整形式为:##N
各部分的含义如下:
##N:句子中可以被泛化成变量部分的标志符,N从1开始编号
[m,n]:变量部分的长度限制。表示被泛化的变量部分的长度必须在某个范围之内。有以下几种变种形式
[m,n]表示m=<变量的长度<=n
[m,]表示m=<变量的长度
[,n]表示0=<变量的长度<=n
[0]表示对变量的长度没有限制
{+/—word}:表示变量部分必须含有{+word}或必须不能含有{-word}某些词语,{0}表示对是否含有哪些词没有限制。
?:表示对句型变量进行匹配时,如果句子中有多处符合的情形,是匹配到第一次出现还是最后一次出现。例如对于例子中的句型模板,下面的这个句子在匹配时:
一种治疗肝炎的新研制的药物及制备方法
一种治疗##1[,10]{0}?的##2[,6]{0}及制备方法
对于##1[,10]{0}这个变量部分,如果加问号则变量将替换“肝炎”,变为
A药物for treatment of肝炎and its preparation method
否则,变量将替换“肝炎的新研制”,变为
A药物for treatment of肝炎的新研制and its preparation method
步骤202:根据输入的源语言决定采用何种模板匹配策略,是采用整句匹配还是部分匹配,所谓整句匹配是指除了模板中的常量部分完全匹配外,还要求模板的首尾与句子的首尾要严格相同,例如下面的句子和模板就是整句匹配:
一种治疗糖尿病的药物组合物及制备方法
一种治疗##1[,10]{0}?的##2[,6]{0}及制备方法
而下面的句子和模板就是部分匹配:
下面介绍一种治疗糖尿病的药物组合物及制备方法
一种治疗##1[,10]{0}?的##2[,6]{0}及制备方法
步骤203:在决定了匹配策略后,进行句型模板的匹配过程,整个匹配过程采取嵌套匹配策略,即在匹配了句型模板库中优先级较高的句型模板后仍允许对匹配替换后的句子匹配库中优先级较低的句型模板,直到没有句型模板可以匹配上句子为止,如果句型模板库中有句型模板可以匹配输入的源语言的句子,则执行步骤204;否则,执行步骤205。
步骤204:输出匹配替换后的结果到统计机器翻译系统进行翻译,执行步骤206。
步骤205:将输入的源语言的句子按标点符号切分成子句,首先按句号切分,如果仍不能匹配,则按逗号切分,如果仍不成功,则依次再按分号和冒号进行切分,只要有一种切分能匹配上句型模板库中的句型模板就将匹配的结果句子输出到统计机器翻译系统进行翻译。
步骤206:统计机器翻译系统将源语言切分成不同的短语,并到短语表中查找与所述短语相匹配的目标短语,顺序连接目标短语构成不同的译文,计算译文的分数,选择分数最高的译文作为最终的译文。
在本步骤中,翻译系统只需翻译句子中非目标语言的部分,这样既保留了句子的结构信息又减轻了翻译系统的负担,将句型模板和统计机器翻译系统有效的融合到了一起。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1、一种融合了句型模板和统计机器翻译技术的翻译方法,其特征在于,该方法包括:
A、配置句型模板,建立句型模板库;
B、利用配置的句型模板对输入的源语言进行匹配,如果匹配成功,则将输入的源语言转换成包含源语言词语与目标语言词语的句子,并执行步骤D;否则,执行步骤C;
C、将输入的源语言按照标点符号切分成子句,对切分的子句进行匹配,将切分的子句转换成包含源语言词语与目标语言词语的句子;
D、将匹配得到的包含源语言词语与目标语言词语的句子输出给统计机器翻译系统,统计机器翻译系统将源语言切分成不同的短语,并到短语表中查找与所述短语相匹配的目标短语,顺序连接目标短语构成不同的译文,计算译文的分数,选择分数最高的译文作为最终的译文。
2、根据权利要求1所述的融合了句型模板和统计机器翻译技术的翻译方法,其特征在于,所述步骤A包括:
从大规模的语言资料库中或从日常工作遇到的包含固定句型的句子中抽象出句型模板,并将抽象出的句型模板按照一定的策略加入到系统的句型模板库中,建立句型模板库。
3、根据权利要求1或2所述的融合了句型模板和统计机器翻译技术的翻译方法,其特征在于,所述句型模板包括模板的常量和模板的变量两个部分。
4、根据权利要求1所述的融合了句型模板和统计机器翻译技术的翻译方法,其特征在于,配置句型模板库中句型模板的优先级,步骤B中所述利用配置的句型模板对输入的源语言进行匹配采用嵌套匹配策略进行,具体包括:
按句型模板优先级由高到低的顺序依次对输入的源语言进行匹配,首先利用句型模板库中优先级较高的句型模板对输入的源语言进行匹配,然后利用句型模板库中优先级较低的句型模板对输入的源语言进行匹配,直至句型模板库中没有句型模板能够匹配上输入的源语言为止。
5、根据权利要求1所述的融合了句型模板和统计机器翻译技术的翻译方法,其特征在于,所述步骤C包括:
按照句号、逗号、分号和冒号的先后顺序依次对源语言进行切分,如果按照句号、逗号、分号和冒号中任何一种切分方式能够将源语言切分成与句型模板相匹配的子句,则结束切分,对切分得到的子句进行匹配,并将切分得到的子句转换成包含源语言词语与目标语言词语的句子。
6、根据权利要求1、4或5任一项所述的融合了句型模板和统计机器翻译技术的翻译方法,其特征在于,所述匹配包括整句匹配和部分匹配两种匹配方式,在采用整句匹配方式时,源语言的句首与句型模板的句首相对应,源语言的句尾与句型模板的句尾相对应;在采用部分匹配方式时,源语言中的部分词语与句型模板中的部分词语相对应。
7、根据权利要求1所述的融合了句型模板和统计机器翻译技术的翻译方法,其特征在于,步骤D中所述统计机器翻译系统为基于短语的单调解码的翻译系统;
所述短语表包括多条记录,每条记录包括源语言短语、目标语言短语以及源语言短语与目标语言短语之间的翻译概率三个部分;
在计算译文的分数时,所述译文分数等于翻译概率与语言模型概率的乘积。
8、根据权利要求7所述的融合了句型模板和统计机器翻译技术的翻译方法,其特征在于,所述源语言短语与目标语言短语中的短语为连续的单词串。
9、根据权利要求7所述的融合了句型模板和统计机器翻译技术的翻译方法,其特征在于,
所述语言模型概率用于计算翻译的目标语言的流畅程度,采用概率统计方法揭示语言单位内在的统计规律;
所述概率统计方法为基于N元组统计的方法。
CNB2006101655326A 2006-12-21 2006-12-21 一种融合了句型模板和统计机器翻译技术的翻译方法 Active CN100543727C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006101655326A CN100543727C (zh) 2006-12-21 2006-12-21 一种融合了句型模板和统计机器翻译技术的翻译方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006101655326A CN100543727C (zh) 2006-12-21 2006-12-21 一种融合了句型模板和统计机器翻译技术的翻译方法

Publications (2)

Publication Number Publication Date
CN101206643A CN101206643A (zh) 2008-06-25
CN100543727C true CN100543727C (zh) 2009-09-23

Family

ID=39566854

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101655326A Active CN100543727C (zh) 2006-12-21 2006-12-21 一种融合了句型模板和统计机器翻译技术的翻译方法

Country Status (1)

Country Link
CN (1) CN100543727C (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510194B (zh) * 2009-03-15 2015-09-09 刘树根 一种基于语句构件的多语种专业翻译方法
WO2010113691A1 (ja) * 2009-03-30 2010-10-07 日本電気株式会社 言語解析装置、方法、及びプログラム
CN101996166B (zh) * 2009-08-14 2015-08-05 张龙哺 双语句对模式化记录方法以及翻译方法和翻译系统
CN102043773B (zh) * 2009-10-20 2014-09-03 张龙哺 模式化双语句对形成方法及其形成装置
CN102043849B (zh) * 2010-12-20 2015-03-25 惠州市表意软件有限公司 表意构件电子词典系统的实现方法
CN102541837A (zh) * 2010-12-22 2012-07-04 张家港市赫图阿拉信息技术有限公司 一种校正输入中文拼写的方法
CN102789464B (zh) * 2011-05-20 2017-11-17 陈伯妤 基于语意识别的自然语言处理方法、装置和系统
CN102831109B (zh) * 2012-08-08 2016-01-13 中国专利信息中心 一种基于智能匹配的机器翻译装置及其方法
CN103793375A (zh) * 2012-10-31 2014-05-14 上海勇金懿信息科技有限公司 一种在自动化翻译处理中精准替换术语及短语的方法
CN104239294B (zh) * 2014-09-10 2017-06-06 华建宇通科技(北京)有限责任公司 藏汉翻译系统的多策略藏语长句切分方法
CN108763225A (zh) * 2016-06-28 2018-11-06 大连民族大学 属性信息多语机器翻译子系统的翻译方法
CN106649288B (zh) 2016-12-12 2020-06-23 北京百度网讯科技有限公司 基于人工智能的翻译方法和装置
CN106844357B (zh) * 2017-01-19 2019-12-17 深圳大学 大句库翻译方法
CN107391500A (zh) * 2017-08-21 2017-11-24 阿里巴巴集团控股有限公司 文本翻译方法、装置及设备
CN107832308B (zh) * 2017-12-11 2021-06-04 中译语通科技股份有限公司 一种机器翻译的断句方法及系统、计算机程序、计算机
CN108763229B (zh) * 2018-05-31 2020-06-12 东华大学 一种基于特征性句干提取的机器翻译方法及装置
CN109086272B (zh) * 2018-08-01 2023-02-17 浙江蓝鸽科技有限公司 句型识别方法及其系统
CN109585024B (zh) * 2018-11-14 2021-03-09 金色熊猫有限公司 数据挖掘方法及装置、存储介质、电子设备
CN110826343B (zh) * 2019-11-01 2022-02-08 北京中献电子技术开发有限公司 基于专利数据的半自动化翻译双语模板的构建方法及系统
CN113191162A (zh) * 2021-04-21 2021-07-30 零壹人工智能科技研究院(南京)有限公司 一种基于人工智能ai翻译的医疗翻译系统
CN113377276A (zh) * 2021-05-19 2021-09-10 深圳云译科技有限公司 速录转译的系统、方法、装置、电子设备以及存储介质
CN113408307B (zh) * 2021-07-14 2022-06-14 北京理工大学 一种基于翻译模板的神经机器翻译方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010029443A1 (en) * 2000-03-27 2001-10-11 International Business Machines Corporation Machine translation system, machine translation method, and storage medium storing program for executing machine translation method
CN1652106A (zh) * 2004-02-04 2005-08-10 北京赛迪翻译技术有限公司 基于语言知识库的机器翻译方法与装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010029443A1 (en) * 2000-03-27 2001-10-11 International Business Machines Corporation Machine translation system, machine translation method, and storage medium storing program for executing machine translation method
CN1652106A (zh) * 2004-02-04 2005-08-10 北京赛迪翻译技术有限公司 基于语言知识库的机器翻译方法与装置

Also Published As

Publication number Publication date
CN101206643A (zh) 2008-06-25

Similar Documents

Publication Publication Date Title
CN100543727C (zh) 一种融合了句型模板和统计机器翻译技术的翻译方法
CN103500160B (zh) 一种基于滑动语义串匹配的句法分析方法
US10496756B2 (en) Sentence creation system
CN105975625A (zh) 一种面向英文搜索引擎的中式英文查询纠错方法和系统
CN102591857B (zh) 一种平行语料资源获取方法及系统
CN1465018A (zh) 机器翻译技术
WO2011017902A1 (zh) 双语句对模式化记录方法以及翻译方法和翻译系统
CN102394061B (zh) 基于语义检索的文语转换方法及系统
CN102339294B (zh) 一种对关键词进行预处理的搜索方法和系统
CN102693222A (zh) 基于实例的甲骨文释文机器翻译方法
Shiwen et al. Rule-based machine translation
CN102789461A (zh) 多语词典构建装置和多语词典构建方法
WO2008059111A2 (en) Natural language processing
CN108665141A (zh) 一种从突发事件预案中自动抽取应急响应流程模型的方法
CN105630770A (zh) 一种基于sc文法的分词标音连写方法及装置
CN108519963B (zh) 一种将流程模型自动转换为多语言文本的方法
CN102929865B (zh) 一种用于中文和东盟各国语言互译的pda翻译系统
CN103927176B (zh) 一种基于层次主题模型的程序特征树的生成方法
Li et al. Enriching Word Alignment with Linguistic Tags.
Akbari An Overall Perspective of Machine Translation with Its Shortcomings.
CN103164398A (zh) 汉维电子辞典及其自动转译汉维语的方法
CN101833376A (zh) 基于汉字拆分的智能语句级汉字输入系统
JP2018072979A (ja) 対訳文抽出装置、対訳文抽出方法およびプログラム
CN112380877B (zh) 一种用于篇章级英译中机器翻译测试集的构建方法
CN105045784A (zh) 英语词句的存取装置方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: HUAWEI TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: INSTITUTE OF COMPUTING TECHNOLOGY, CHINESE ACADEMY OF SCIENCES

Effective date: 20130620

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100080 HAIDIAN, BEIJING TO: 518129 SHENZHEN, GUANGDONG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20130620

Address after: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee after: Huawei Technologies Co., Ltd.

Address before: 100080 Haidian District, Zhongguancun Academy of Sciences, South Road, No. 6, No.

Patentee before: Institute of Computing Technology, Chinese Academy of Sciences