CN102662937A - 自动翻译系统及其自动翻译方法 - Google Patents
自动翻译系统及其自动翻译方法 Download PDFInfo
- Publication number
- CN102662937A CN102662937A CN2012101074874A CN201210107487A CN102662937A CN 102662937 A CN102662937 A CN 102662937A CN 2012101074874 A CN2012101074874 A CN 2012101074874A CN 201210107487 A CN201210107487 A CN 201210107487A CN 102662937 A CN102662937 A CN 102662937A
- Authority
- CN
- China
- Prior art keywords
- standard
- vocabulary
- word
- foreign
- automatic translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 109
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000013507 mapping Methods 0.000 claims abstract description 48
- 230000014616 translation Effects 0.000 claims description 100
- 238000001514 detection method Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开了一种自动翻译系统,包括规范文档辅助写作系统和规范文档自动翻译系统,所述规范文档辅助写作系统包括规范词汇库、规范语法规则库和辅助写作模块;所述规范文档自动翻译系统包括自动翻译模块、中外规范词汇映射库、双语规范语法规则映射库。本发明还公开了一种自动翻译方法。本发明能够形成规范文档并提高了翻译的准确率。
Description
技术领域
本发明是一种涉及文字自动翻译的技术,具体说,涉及一种自动翻译系统及其自动翻译方法。
背景技术
目前主流的机器翻译系统可以分为两大类:基于规则的机器翻译系统和基于语料库的机器翻译系统。其中基于语料库的机器翻译系统又可以分为:基于统计的机器翻译系统和基于实例的机器翻译系统。无论上述那种类型的机器翻译系统在翻译过程中完全依赖计算机最终都会陷入到歧义裁决的泥潭中。
基于规则的机器翻译系统在规则不足的情况下翻译结果很难准确,但随着规则的不断增多又会导致规则所覆盖的语言实例产生交叉最终互相干扰影响翻译结果。基于统计的翻译系统,是通过对既存语料数据利用预设的统计模型进行分析统计,依靠统计结果来消除机器翻译过程中的词义和语义上的歧义。统计方法的引入在一定程度上解决了歧义问题,但是其效果却受限于语料数据本身的特征。例如:构成语料库文本的文体类型、文章所涉及的行业范畴、文章编写的时代等等,同样的词义、语义或语法现象在不同的文体或行业领域中有不同的出现概率,在A类里概率高的在B类中可能反而会很低,从而导致统计的结果相互抵消降低了歧义消除的效果。因此,基于统计的翻译系统需要有一个类别纯粹且数量足够大的语料库。基于实例的机器翻译系统,是参照已有的语料数据按照一定的策略通过类比和替换产生译文,同样这种方法也需要依赖一个庞大的语料库,而随着语料数据的增加也同样带来了歧义问题。
发明内容
本发明所解决的技术问题是提供一种自动翻译系统,能够形成规范文档并提高了翻译的准确率。
技术方案如下:
一种自动翻译系统,包括:规范文档辅助写作系统和规范文档自动翻译系统,所述规范文档辅助写作系统包括规范词汇库、规范语法规则库和辅助写作模块;所述规范文档自动翻译系统包括自动翻译模块、中外规范词汇映射库、双语规范语法规则映射库;其中,
规范词汇库,用于保存定义的词本身属性;
规范语法规则库,用于存放用于保存定义的语法规则;
辅助写作模块,接收输入文字信息,调取所述词本身属性和语法规则,按照所述词本身属性和语法规则对所述输入文字信息进行规范并作出标记,将标记后的输入文字信息展示给用户;将输入文字信息转换为规范语句,将规范语句生成规范化文章后发送给自动翻译模块;
中外规范词汇映射库,用于存放相同语义词汇之间的关联关系;
双语规范语法规则映射库,用于存放所述关联关系确定的外文译文;
自动翻译模块,用于将接收规范化文章,调取所述关联关系和外文译文,将所述规范化文章转化为相应语种的规范化译文。
进一步:所述词本身属性包括有对应关系的词汇身份标识号码ID、词汇、词性类别、概念属性类别、场景属性类别、关联词汇和备注,所述词汇ID用于定义词汇的唯一标识,词汇表示词语本身,所述词性类别、概念属性类别和场景属性类别用来描述词汇语义的特征字段,所述关联词汇用于定义经常一起出现的搭配词汇以及同义词汇,所述备注用于定义词汇语义的自然语言描述;所述中外规范词汇映射库的关联关系包括具有一一对应关系的中文词汇ID和外文词汇ID,所述中文词汇ID表示中文词汇的身份标识号码,所述外文词汇ID表示外文词汇的身份标识号码。
进一步:所述辅助写作模块用于调取所述规范词汇库中的词本身属性和所述规范语法规则库中的相同语义词汇的关联关系,按照所述词本身属性和关联关系对用户输入文字信息进行规范并做出标记。
本发明所解决的另一个技术问题是提供一种自动翻译方法,能够形成规范文档并提高了翻译的准确率。
技术方案如下:
一种自动翻译方法,包括:
规范词汇库保存定义的词本身属性;
规范语法规则库存放用于保存定义的语法规则;
辅助写作模块接收输入文字信息,调取所述词本身属性和语法规则,按照所述词本身属性和语法规则对所述输入文字信息进行规范并作出标记,将标记后的输入文字信息展示给用户;将输入文字信息转换为规范语句,将规范语句生成规范化文章后发送给自动翻译模块;
中外规范词汇映射库存放相同语义词汇之间的关联关系;
双语规范语法规则映射库存放所述关联关系确定的外文译文;
自动翻译模块将接收规范化文章,调取中外规范词汇映射库中关联关系和外文译文,将所述规范化文章转化为相应语种的规范化译文。
进一步:所述词本身属性包括有对应关系的词汇身份标识号码ID、词汇、词性类别、概念属性类别、场景属性类别、关联词汇和备注,所述词汇ID用于定义词汇的唯一标识,词汇表示词语本身,所述词性类别、概念属性类别和场景属性类别用来描述词汇语义的特征字段,所述关联词汇用于定义经常一起出现的搭配词汇以及同义词汇,所述备注用于定义词汇语义的自然语言描述;所述中外规范词汇映射库的关联关系包括具有一一对应关系的中文词汇ID和外文词汇ID,所述中文词汇ID表示中文词汇的身份标识号码,所述外文词汇ID表示外文词汇的身份标识号码。
进一步:所述辅助写作模块调取所述规范词汇库中的词本身属性和所述规范语法规则库中的相同语义词汇的关联关系,按照所述词本身属性和关联关系对用户输入文字信息进行规范并做出标记。
进一步:根据规范词汇库词中词汇本身属性,对当前接收到的所述输入文字信息中的词汇进行检测,如果存在歧义词汇则标记所述输入文字信息中的歧义词汇。
进一步:根据所述规范语法规则库中相同语义词汇的语法规则,对当前接收到的所述输入文字信息进行语句语法检测,并对非规范句子进行标记,将输入文字信息转换为规范语句。
进一步:所述自动翻译模块动翻译模块调取中外规范词汇映射库中的关联关系,以及双语规范语法规则映射库中的外文语法规则,判断规范化文章的原文句子中是否有歧义词汇和非规范语句,从双语规范语法规则映射库获得用户选择的确切含义,将规范化句子按照所述对应关系翻译为对应译文句子,将所述译文句子组成所述规范化译文。
本发明技术方案带来的技术效果包括:
1、借助本系统形成规范文档。根据规范词库以及规范语法库中的数据检测用户输入,以交互的方式给出提示,让用户在机器辅助的情况下写作出标准的译文,同时让用户指定有歧义词汇在用户文档语境下的确切含义。
2、借助翻译系统中双语词汇的唯一映射规则和双语的语法映射规则对规范文档进行翻译,提高了翻译的准确率。
3、辅助写作工具将尽可能确保产生的文档为后续的机器翻译系统提供了足够的参照信息以便生成高可读性的译文。
4、与单纯依赖计算机消除歧义相比本发明中的方法在实际效果和实现难度上都有明显的优势。
附图说明
图1是本发明中是本发明中自动翻译系统的结构框图;
图2是本发明中自动翻译方法的工作流程图。
具体实施方式
自动翻译系统包括规范文档辅助写作系统和规范文档自动翻译系统。本发明中,通过规范文档辅助写作系统进行数据检测并规范用户输入文字信息,以交互的方式给出提示,用户在规范文档辅助写作系统的规范下,使用户完成标准的句子或者文章。用户输入信息不限于中文,可以是任一种语言。在完成标准的句子或者文章的过程中,系统会提示并指出在文档语境下表达不规范的词汇。规范文档辅助写作系统对用户写作进行了标准化规范,系统会及时对文档进行词汇唯一语义标志,规范文档句式,形成规范文档。尽可能确保产生的文档为后续的机器翻译系统提供了足够的参照信息,以便生成高可读性的译文。
规范文档自动翻译系统完成原文到外文的机器自动翻译,最大程度避免在机器翻译生成译文的过程中遇到的词汇歧义的裁决问题。
下面参考附图和优选实施例,对本发明技术方案作详细描述。
如图1所示,是本发明中自动翻译系统的结构框图。规范文档辅助写作系统可以嵌入到自动翻译系统中,使用户完成标准的句子或者文章,便于后续的机器自动翻译。规范文档辅助写作系统检测用户输入文字信息,对歧义词汇和非规范句式以交互的方式给出提示,辅助用户完成规范文档;规范文档在规范文档自动翻译系统中自动完成翻译,生成译文。
规范文档辅助写作系统的结构整体上包括:辅助写作模块、规范词汇库和规范语法规则库。
规范词汇库用于保存定义的词本身属性,具体结构如表1所示。
表1
中文词汇ID |
词汇 |
词性类别 |
概念属性类别 |
场景属性类别 |
关联词汇 |
备注 |
词汇身份标识号码(中文词汇ID)、词汇、词性类别、概念属性类别、场景属性类别、关联词汇和备注是一一对应关系。
词汇身份标识号码(即中文词汇ID):用于定义词汇的唯一标识,词汇的每一种单独的含义(词性类别、概念属性类别、场景属性类别、关联词汇等特征组合)作为一条记录唯一标识一条词汇,同样名称的词汇由于特征不同会有多条记录,每条记录拥有不同的中文词汇ID;
词汇:词语本身;
词性类别、概念属性类别、场景属性类别:用来描述词汇语义的特征字段;
关联词汇:用于定义经常一起出现的搭配词汇以及同义词汇;
备注:用于定义词汇语义的自然语言描述,为写作人员进行词义选择做参考。
规范语法规则库用于保存定义的语法规则,以适应不同的语境语法规则中定义的相同语义词汇的关联关系。规范语法规则库不同于一般数据库,不是由众多则字段组成,规范语法规则库是一系列内部符号描述的规则的集合,规则之间也是有关联或包含关系的,是一种网络型的结构,关联关系如表2所示。
表2
辅助写作模块接收输入文字信息,调取规范词汇库中的词本身属性和规范语法规则库中的相同语义词汇的关联关系,按照词本身属性和关联关系对用户输入文字信息进行规范并作出标记,将标记后的输入文字信息展示给用户,消除词汇歧义和语法错误后,将输入文字信息形成规范化文字。
规范文档自动翻译系统的结构整体上包括:自动翻译模块、中外规范词汇映射库、双语规范语法规则映射库。
中外规范词汇映射库用于存放两个相同语义词汇的关联关系,具体结构如表3所示。用于机器翻译引擎中的词汇ID。
表3
中文词汇ID |
外文词汇ID |
中文词汇ID是指中文词汇的身份标识号码,外文词汇ID是指外文词汇的身份标识号码,中文词汇ID和外文词汇ID是一一对应关系。
双语规范语法规则映射库用于存放中文词汇ID对应的外文译文,双语规范语法规则映射库的结构如表4所示。
表4
名称 | 备注 |
映射ID | 用以唯一区别不同的映射关系 |
源语言 | 双语规则映射中,源规则的语言 |
目标语言 | 双语规则映射中,目标规则的语言 |
源规则ID | 双语规则映射中,源规则的唯一标识 |
目标规则ID | 双语规则映射中,源规则的唯一标识 |
映射类别 | 规则映射的类型,例如等价映射、同源映射等 |
自动翻译模块,接收规范化文章,调取中外规范词汇映射库中关联关系和双语规范语法规则映射库中的外文译文,将规范化文字转化为相应语种的规范化外文。
如图2所示,是本发明中自动翻译方法的工作流程图,自动翻译方法包括以下步骤:
步骤201:启动自动翻译系统,开始规范化文章的写作;
步骤202:辅助写作模块接收用户输入文字信息,并显示给用户;
步骤203:辅助写作模块解析用户输入文字中的所有词汇;
步骤204:通过检查规范词汇库中相同词汇的记录,按照规范词汇库中保存的词本身属性判断用户输入到的词汇是否有歧义;如果有进行步骤205,否则进行步骤207;
步骤205:当输入文字信息中是有歧义词汇或者非规范句式时,标注歧义词汇或者非规范句式,并提示用户从规范词汇库中选择歧义词的确切含义,或者根据语法规则进行句式调整/拆分复杂句,将输入文字信息转换为规范语法规则库汇总存在的句式;
步骤206:将标注后的词汇或者非规范句式的位置及用户的选择记录到单独的数据文件中;
步骤207:判断是否完成规范化文章的写作(包括多条规范语句和词汇);如果完成继续步骤208,如果没有完成进行步骤202,继续接收用户输入文字;
步骤208:将规范化文章生成规范化原文包发送给规范文档自动翻译系统;
步骤209:自动翻译系统接收规范化原文包,并对规范化文章进行自动翻译;
步骤210:自动翻译模块调取中外规范词汇映射库中的关联关系,以及双语规范语法规则映射库中的外文语法规则,判断规范化文章的原文句子中是否有歧义词汇和非规范语句,如果发现进行步骤212,否则进行步骤215;
步骤215:将规范化文章按照中文词汇ID和外文词汇ID的对应关系翻译为对应译文;
步骤211:从规范化原文包中获得用户选择的确切含义;
步骤212:从双语规范语法规则映射库中获得当前中文词汇对应的外文译文;
步骤213:判断是否全部翻译完成;如果是进行步骤214,否则获取下一条句子,进行步骤209;
步骤214:自动翻译模块将每一个译文句子组成译文文章。
Claims (9)
1.一种自动翻译系统,包括:规范文档辅助写作系统和规范文档自动翻译系统,所述规范文档辅助写作系统包括规范词汇库、规范语法规则库和辅助写作模块;所述规范文档自动翻译系统包括自动翻译模块、中外规范词汇映射库、双语规范语法规则映射库;其中,
规范词汇库,用于保存定义的词本身属性;
规范语法规则库,用于存放用于保存定义的语法规则;
辅助写作模块,接收输入文字信息,调取所述词本身属性和语法规则,按照所述词本身属性和语法规则对所述输入文字信息进行规范并作出标记,将标记后的输入文字信息展示给用户;将输入文字信息转换为规范语句,将规范语句生成规范化文章后发送给自动翻译模块;
中外规范词汇映射库,用于存放相同语义词汇之间的关联关系;
双语规范语法规则映射库,用于存放所述关联关系确定的外文译文;
自动翻译模块,用于将接收规范化文章,调取所述关联关系和外文译文,将所述规范化文章转化为相应语种的规范化译文。
2.如权利要求1所述的自动翻译系统,其特征在于:所述词本身属性包括有对应关系的词汇身份标识号码ID、词汇、词性类别、概念属性类别、场景属性类别、关联词汇和备注,所述词汇ID用于定义词汇的唯一标识,词汇表示词语本身,所述词性类别、概念属性类别和场景属性类别用来描述词汇语义的特征字段,所述关联词汇用于定义经常一起出现的搭配词汇以及同义词汇,所述备注用于定义词汇语义的自然语言描述;所述中外规范词汇映射库的关联关系包括具有一一对应关系的中文词汇ID和外文词汇ID,所述中文词汇ID表示中文词汇的身份标识号码,所述外文词汇ID表示外文词汇的身份标识号码。
3.如权利要求1所述的自动翻译系统,其特征在于:所述辅助写作模块用于调取所述规范词汇库中的词本身属性和所述规范语法规则库中的相同语义词汇的关联关系,按照所述词本身属性和关联关系对用户输入文字信息进行规范并做出标记。
4.一种自动翻译方法,包括:
规范词汇库保存定义的词本身属性;
规范语法规则库存放用于保存定义的语法规则;
辅助写作模块接收输入文字信息,调取所述词本身属性和语法规则,按照所述词本身属性和语法规则对所述输入文字信息进行规范并作出标记,将标记后的输入文字信息展示给用户;将输入文字信息转换为规范语句,将规范语句生成规范化文章后发送给自动翻译模块;
中外规范词汇映射库存放相同语义词汇之间的关联关系;
双语规范语法规则映射库存放所述关联关系确定的外文译文;
自动翻译模块将接收规范化文章,调取中外规范词汇映射库中关联关系和外文译文,将所述规范化文章转化为相应语种的规范化译文。
5.如权利要求4所述的自动翻译方法,其特征在于:所述词本身属性包括有对应关系的词汇身份标识号码ID、词汇、词性类别、概念属性类别、场景属性类别、关联词汇和备注,所述词汇ID用于定义词汇的唯一标识,词汇表示词语本身,所述词性类别、概念属性类别和场景属性类别用来描述词汇语义的特征字段,所述关联词汇用于定义经常一起出现的搭配词汇以及同义词汇,所述备注用于定义词汇语义的自然语言描述;所述中外规范词汇映射库的关联关系包括具有一一对应关系的中文词汇ID和外文词汇ID,所述中文词汇ID表示中文词汇的身份标识号码,所述外文词汇ID表示外文词汇的身份标识号码。
6.如权利要求4所述的自动翻译方法,其特征在于:所述辅助写作模块调取所述规范词汇库中的词本身属性和所述规范语法规则库中的相同语义词汇的关联关系,按照所述词本身属性和关联关系对用户输入文字信息进行规范并做出标记。
7.如权利要求4至6任一项所述的自动翻译方法,其特征在于:根据规范词汇库词中词汇本身属性,对当前接收到的所述输入文字信息中的词汇进行检测,如果存在歧义词汇则标记所述输入文字信息中的歧义词汇。
8.如权利要求4至6任一项所述的自动翻译方法,其特征在于:根据所述规范语法规则库中相同语义词汇的语法规则,对当前接收到的所述输入文字信息进行语句语法检测,并对非规范句子进行标记,将输入文字信息转换为规范语句。
9.如权利要求4至6任一项所述的自动翻译方法,其特征在于:所述自动翻译模块动翻译模块调取中外规范词汇映射库中的关联关系,以及双语规范语法规则映射库中的外文语法规则,判断规范化文章的原文句子中是否有歧义词汇和非规范语句,从双语规范语法规则映射库获得用户选择的确切含义,将规范化句子按照所述对应关系翻译为对应译文句子,将所述译文句子组成所述规范化译文。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210107487.4A CN102662937B (zh) | 2012-04-12 | 2012-04-12 | 自动翻译系统及其自动翻译方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210107487.4A CN102662937B (zh) | 2012-04-12 | 2012-04-12 | 自动翻译系统及其自动翻译方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102662937A true CN102662937A (zh) | 2012-09-12 |
CN102662937B CN102662937B (zh) | 2016-03-02 |
Family
ID=46772432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210107487.4A Active CN102662937B (zh) | 2012-04-12 | 2012-04-12 | 自动翻译系统及其自动翻译方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102662937B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103544147A (zh) * | 2013-11-06 | 2014-01-29 | 北京百度网讯科技有限公司 | 训练翻译模型的方法和装置 |
CN104537066A (zh) * | 2014-12-30 | 2015-04-22 | 郑州市中业科技有限公司 | 基于多语言翻译的近义词关联方法 |
CN105677643A (zh) * | 2016-03-14 | 2016-06-15 | 张广睿 | 一种人工结合机器的笔译方法 |
CN105989428A (zh) * | 2015-02-02 | 2016-10-05 | 成都优译信息技术有限公司 | 一种自动分发稿件的方法 |
CN106202062A (zh) * | 2016-06-29 | 2016-12-07 | 宁波市由乐讯通讯科技有限公司 | 一种无线通信过程中语言转换方法及系统 |
CN106202063A (zh) * | 2016-06-29 | 2016-12-07 | 宁波市由乐讯通讯科技有限公司 | 一种改进型无线通信过程中语言转换方法及系统 |
CN106202064A (zh) * | 2016-06-29 | 2016-12-07 | 宁波市由乐讯通讯科技有限公司 | 一种可反馈的无线通信过程中语言转换方法及系统 |
WO2018153130A1 (zh) * | 2017-02-22 | 2018-08-30 | 华为技术有限公司 | 一种翻译方法及装置 |
CN108491399A (zh) * | 2018-04-02 | 2018-09-04 | 上海杓衡信息科技有限公司 | 基于语境迭代分析的汉译英机器翻译方法 |
CN108519979A (zh) * | 2018-02-28 | 2018-09-11 | 成都优译信息技术股份有限公司 | 一种cat系统中翻译记忆库和mt结合的方法及系统 |
CN110866406A (zh) * | 2019-11-15 | 2020-03-06 | 上海醍顶信息科技有限公司 | 用于翻译集成服务优化方法、电子装置及储存介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1955953A (zh) * | 2005-10-27 | 2007-05-02 | 株式会社东芝 | 根据单词之间的语义关系优化翻译的装置和方法 |
CN101539910A (zh) * | 2009-01-15 | 2009-09-23 | 传神联合(北京)信息技术有限公司 | 一种用于计算机辅助翻译的取句方法及其系统 |
CN101739395A (zh) * | 2009-12-31 | 2010-06-16 | 程光远 | 机器翻译方法和系统 |
US20100204977A1 (en) * | 2009-02-09 | 2010-08-12 | Inventec Corporation | Real-time translation system that automatically distinguishes multiple languages and the method thereof |
-
2012
- 2012-04-12 CN CN201210107487.4A patent/CN102662937B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1955953A (zh) * | 2005-10-27 | 2007-05-02 | 株式会社东芝 | 根据单词之间的语义关系优化翻译的装置和方法 |
CN101539910A (zh) * | 2009-01-15 | 2009-09-23 | 传神联合(北京)信息技术有限公司 | 一种用于计算机辅助翻译的取句方法及其系统 |
US20100204977A1 (en) * | 2009-02-09 | 2010-08-12 | Inventec Corporation | Real-time translation system that automatically distinguishes multiple languages and the method thereof |
CN101739395A (zh) * | 2009-12-31 | 2010-06-16 | 程光远 | 机器翻译方法和系统 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103544147A (zh) * | 2013-11-06 | 2014-01-29 | 北京百度网讯科技有限公司 | 训练翻译模型的方法和装置 |
CN104537066B (zh) * | 2014-12-30 | 2017-10-03 | 郑州中业科技股份有限公司 | 基于多语言翻译的近义词关联方法 |
CN104537066A (zh) * | 2014-12-30 | 2015-04-22 | 郑州市中业科技有限公司 | 基于多语言翻译的近义词关联方法 |
CN105989428A (zh) * | 2015-02-02 | 2016-10-05 | 成都优译信息技术有限公司 | 一种自动分发稿件的方法 |
CN105677643A (zh) * | 2016-03-14 | 2016-06-15 | 张广睿 | 一种人工结合机器的笔译方法 |
CN106202062B (zh) * | 2016-06-29 | 2019-02-12 | 宁波市由乐讯通讯科技有限公司 | 一种无线通信过程中语言转换方法及系统 |
CN106202064A (zh) * | 2016-06-29 | 2016-12-07 | 宁波市由乐讯通讯科技有限公司 | 一种可反馈的无线通信过程中语言转换方法及系统 |
CN106202063A (zh) * | 2016-06-29 | 2016-12-07 | 宁波市由乐讯通讯科技有限公司 | 一种改进型无线通信过程中语言转换方法及系统 |
CN106202064B (zh) * | 2016-06-29 | 2019-02-12 | 宁波市由乐讯通讯科技有限公司 | 一种可反馈的无线通信过程中语言转换方法及系统 |
CN106202062A (zh) * | 2016-06-29 | 2016-12-07 | 宁波市由乐讯通讯科技有限公司 | 一种无线通信过程中语言转换方法及系统 |
CN106202063B (zh) * | 2016-06-29 | 2019-02-12 | 宁波市由乐讯通讯科技有限公司 | 一种改进型无线通信过程中语言转换方法及系统 |
WO2018153130A1 (zh) * | 2017-02-22 | 2018-08-30 | 华为技术有限公司 | 一种翻译方法及装置 |
US11244108B2 (en) | 2017-02-22 | 2022-02-08 | Huawei Technologies Co., Ltd. | Translation method and apparatus |
CN108519979A (zh) * | 2018-02-28 | 2018-09-11 | 成都优译信息技术股份有限公司 | 一种cat系统中翻译记忆库和mt结合的方法及系统 |
CN108491399A (zh) * | 2018-04-02 | 2018-09-04 | 上海杓衡信息科技有限公司 | 基于语境迭代分析的汉译英机器翻译方法 |
CN108491399B (zh) * | 2018-04-02 | 2021-08-06 | 上海杓衡信息科技有限公司 | 基于语境迭代分析的汉译英机器翻译方法 |
CN110866406A (zh) * | 2019-11-15 | 2020-03-06 | 上海醍顶信息科技有限公司 | 用于翻译集成服务优化方法、电子装置及储存介质 |
CN110866406B (zh) * | 2019-11-15 | 2023-08-15 | 上海醍顶信息科技有限公司 | 用于翻译集成服务优化方法、电子装置及储存介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102662937B (zh) | 2016-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102662937B (zh) | 自动翻译系统及其自动翻译方法 | |
Karimi et al. | Machine transliteration survey | |
US8706472B2 (en) | Method for disambiguating multiple readings in language conversion | |
Baldwin et al. | Translation by machine of complex nominals: Getting it right | |
CN107045496A (zh) | 语音识别后文本的纠错方法及纠错装置 | |
CN102789504A (zh) | 一种基于xml规则的中文语法校正方法与系统 | |
CN103020230A (zh) | 一种语义模糊匹配方法 | |
US20140039879A1 (en) | Generic system for linguistic analysis and transformation | |
CN103309926A (zh) | 基于条件随机场的中英文混合命名实体识别方法及系统 | |
JP2002215617A (ja) | 品詞タグ付けをする方法 | |
CN102298582A (zh) | 数据搜索和匹配方法和系统 | |
CN110770735A (zh) | 具有嵌入式数学表达式的文档的编码转换 | |
CN105760359B (zh) | 问句处理系统及其方法 | |
WO2014205232A1 (en) | Language input method editor to disambiguate ambiguous phrases via diacriticization | |
CN102609410B (zh) | 规范文档辅助写作系统及规范文档生成方法 | |
CN110348003A (zh) | 文本有效信息的抽取方法及装置 | |
CN114118053A (zh) | 一种合同信息提取方法及装置 | |
Neumann et al. | Experiments on robust NL question interpretation and multi-layered document annotation for a cross–language question/answering system | |
US20100094615A1 (en) | Document translation apparatus and method | |
Specia et al. | A hybrid approach for extracting semantic relations from texts | |
Huang et al. | Words without boundaries: Computational approaches to Chinese word segmentation | |
KR101941692B1 (ko) | 한국어 개체명 인식방법 및 장치 | |
Nooralahzadeh et al. | Part of speech tagging for french social media data | |
CN103049434B (zh) | 一种变形词证认系统及证认方法 | |
Andrés et al. | Search for hyphenated words in probabilistic indices: a machine learning approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |