CN102402503A - 基于扩展的层次化短语模型的统计机器翻译装置和方法 - Google Patents

基于扩展的层次化短语模型的统计机器翻译装置和方法 Download PDF

Info

Publication number
CN102402503A
CN102402503A CN2010102865347A CN201010286534A CN102402503A CN 102402503 A CN102402503 A CN 102402503A CN 2010102865347 A CN2010102865347 A CN 2010102865347A CN 201010286534 A CN201010286534 A CN 201010286534A CN 102402503 A CN102402503 A CN 102402503A
Authority
CN
China
Prior art keywords
phrase
rule
target language
translation
statistical machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102865347A
Other languages
English (en)
Inventor
何中军
孟遥
于浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CN2010102865347A priority Critical patent/CN102402503A/zh
Publication of CN102402503A publication Critical patent/CN102402503A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种基于扩展的层次化短语模型的统计机器翻译装置和方法,其中该统计机器翻译装置包括:翻译规则提取单元,用于从双语语料库中提取包括短语规则和层次化短语规则的翻译规则;粘合规则规定单元,用于规定包括顺序规则和逆序规则的粘合规则;以及解码单元,用于利用所述翻译规则将源语言句子翻译成目标语言短语序列,以及不断地利用所述粘合规则中的顺序规则顺序地结合相邻的目标语言短语,以及利用所述粘合规则中的逆序规则逆序地结合相邻的目标语言短语,直至产生候选目标语言句子,然后根据每个候选目标语言句子的得分确定最终的目标语言句子。根据本发明的技术方案,可以有效地提高翻译的准确度。

Description

基于扩展的层次化短语模型的统计机器翻译装置和方法
技术领域
本发明涉及机器翻译领域,更具体地涉及一种基于扩展的层次化短语模型的统计机器翻译装置和方法。 
背景技术
基于层次化短语的模型(下面也称为HPB模型)构建于加权的同步上下文无关语法(CFG)之上,其为统计机器翻译提供了一种强大的机制来捕获短、长距离的短语次序调整。其中,它利用两种规则:1)翻译规则,其是从词对齐的双语语料库中学习而来的。翻译规则可以是由词构成的短语规则,或者由词和变量两者构成的层次化规则。在解码期间,短语规则执行词法翻译,而层次化规则既执行词法翻译,又执行短语次序调整;2)粘合规则,其被定义为顺序地结合相邻的短语。 
然而,HPB模型的一个缺点是粘合规则仅仅提供短语的顺序结合。具体地说,对于两种语言之间的翻译,经常会遇到短语需要逆序结合的情况。而在HPB模型中,只能通过具体的层次化规则进行短语次序调整。因此,利用现有的HPB模型进行机器翻译时,如果需要逆序结合的短语找不到相应的层次化规则来进行短语次序调整,则只能根据HPB模型中的粘合规则来顺序地结合短语,这样就会造成翻译错误。 
有关HPB模型的更多细节可以例如参见David Chiang所著的“A hierarchical phrase-based model for statistical machine translation”,Proceedings of the 43rd Annual Meeting of the Association for Computational Linguistics,pages 263-270,2005。 
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。但是,应当理解,这个概述并不是关于本发明的穷举 性概述。它并不是意图用来确定本发明的关键性部分或重要部分,也不是意图用来限定本发明的范围。其目的仅仅是以简化的形式给出关于本发明的某些概念,以此作为稍后给出的更详细描述的前序。 
鉴于现有技术的上述情形,本发明的目的是提供一种基于扩展的层次化短语模型(HPB模型)的统计机器翻译装置和方法,其可以解决现有技术问题中的一个或多个。 
为了实现上述目的,根据本发明的一个方面,提供了一种基于扩展的HPB模型的统计机器翻译装置,包括:翻译规则提取单元,用于从双语语料库中提取包括短语规则和层次化短语规则的翻译规则;粘合规则规定单元,用于规定包括顺序规则和逆序规则的粘合规则;以及解码单元,用于利用所述翻译规则将源语言句子翻译成目标语言短语序列,以及不断地利用所述粘合规则中的顺序规则顺序地结合相邻的目标语言短语,以及利用所述粘合规则中的逆序规则逆序地结合相邻的目标语言短语,直至产生候选目标语言句子,然后根据每个候选目标语言句子的得分确定最终的目标语言句子。 
根据本发明的另一个方面,还提供了一种基于扩展的HPB模型的统计机器翻译方法,包括:从双语语料库中提取包括短语规则和层次化短语规则的翻译规则;规定包括顺序规则和逆序规则的粘合规则;以及利用所述翻译规则将源语言句子翻译成目标语言短语序列,以及不断地利用所述粘合规则中的顺序规则顺序地结合相邻的目标语言短语,以及利用所述粘合规则中的逆序规则逆序地结合相邻的目标语言短语,直至产生候选目标语言句子,然后根据每个候选目标语言句子的得分确定最终的目标语言句子。 
根据本发明的另一个方面,还提供了用于实现上述基于扩展的HPB模型的统计机器翻译方法的计算机程序产品。 
根据本发明的另一个方面,还提供了计算机可读介质,其上记录有用于实现上述基于扩展的HPB模型的统计机器翻译方法的计算机程序代码。 
根据本发明的上述技术方案,通过规定包括顺序规则和逆序规则的粘合规则,在解码期间以顺序和逆序两种方式进行相邻短语的结合,从而可以有效地提高翻译的准确度。 
附图说明
本发明可以通过参考下文中结合附图所给出的详细描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并形成说明书的一部分,用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。在附图中: 
图1示出了根据本发明实施例的基于扩展的HPB模型的统计机器翻译装置的结构框图; 
图2示出了用于说明在解码过程中相邻短语之间的结合方式的示意图; 
图3示出了根据本发明另一实施例的基于扩展的HPB模型的统计机器翻译装置的结构框图; 
图4示出了根据本发明实施例的基于扩展的HPB模型的统计机器翻译方法的总体流程图;以及 
图5示出了其中实现本发明的计算机的示例性结构框图。 
本领域技术人员应当理解,附图中的元件仅仅是为了简单和清楚起见而示出的,而且不一定是按比例绘制的。例如,附图中某些元件的尺寸可能相对于其它元件放大了,以便有助于提高对本发明实施例的理解。 
具体实施方式
在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。 
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其它细节。 
首先将参考附图详细描述根据本发明实施例的基于扩展的HPB模型的统计机器翻译装置。 
图1示出了根据本发明实施例的基于扩展的HPB模型的统计机器翻译装置的结构框图。如图1所示,根据本发明实施例的基于扩展的HPB模型的统计机器翻译装置100包括翻译规则提取单元110、粘合规则规定单元120、以及解码单元130。 
其中,翻译规则提取单元110可以用于从双语语料库中提取包括短语规则和层次化短语规则的翻译规则。有关该提取处理的更多细节可以例如参见David Chiang所著的“A hierarchical phrase-based model for statistical machine translation”,Proceedings of the 43rd Annual Meeting of the Association for Computational Linguistics,pages 263-270,2005,这里不再赘述。 
粘合规则规定单元120可以用于规定包括顺序规则和逆序规则的粘合规则。 
具体地说,在现有的HPB模型中存在如下两条粘合规则: 
S→<SX,SX>                          (1) 
S→<X,X>                            (2) 
其中,S和X是变量。S表示句子的开始,X表示短语。这两条粘合规则用来顺序地结合短语。例如,对于翻译中文句子“在经济领域的合作”的推导过程如下: 
S &DoubleRightArrow; < SX , SX >
Figure BSA00000276362800042
Figure BSA00000276362800043
Figure BSA00000276362800044
在本发明中,通过包括如下三条规则的括号转录语法(BTG)来扩展现有的HPB模型中的粘合规则: 
X &RightArrow; < f ~ , e ~ > - - - ( 3 )
X→<X1X2,X1X2>    (4) 
X→<X1X2,X2X1>    (5) 
规则(3)用来将源语言短语 
Figure BSA00000276362800048
翻译成目标语言短语 
Figure BSA00000276362800049
规则(4)用来顺序地结合两个相邻短语,而规则(5)用来逆序地结合两个相邻短语。有关BTG的更多细节可以例如参见Dekai Wu所著的“A polynomial-time algorithm for statistical machine translation”,Proceedings of the 34th Annual  Meeting of the Association for Computational Linguistics,1996。 
在本发明中利用BTG中的粘合规则来代替现有的HPB模型中的粘合规则。在本文中,将本发明的翻译模型称为扩展HPB模型。 
根据本发明的扩展HPB模型,对于翻译中文句子“在经济领域的合作”的推导过程如下: 
S &DoubleRightArrow; < X , X >
&DoubleRightArrow; < X 1 X 2 , X 2 X 1 >
Figure BSA00000276362800053
Figure BSA00000276362800054
解码单元130可以用于利用翻译规则中的短语规则和层次化短语规则将源语言句子翻译成目标语言短语序列,以及不断地利用粘合规则中的顺序规则顺序地结合相邻的目标语言短语,以及利用粘合规则中的逆序规则逆序地结合相邻的目标语言短语,直至产生候选目标语言句子,然后根据每个候选目标语言句子的得分确定最终的目标语言句子。 
在一个示例中,解码单元130可以利用CKY算法来进行自底向上的解码。有关该解码处理的更多细节可以例如参见David Chiang所著的“Hierarchical phrase-based translation”,Computational Linguistics,pages 33(2):201-228,2007。 
具体地说,对于源语言句子,解码单元130可以产生翻译以及相应的解析树(如图2(a)所示)。假定源语言句子F1 J,解码的目标是为S[1,J]搜索最佳的推导结果,其中S表示句子的开始。解码单元130可以自底向上地通过使用翻译规则来为每个其范围从j1到j2的句子片段产生部分推导结果。这保证了当范围[j1,j2]被展开时,其所有子范围都已经被展开。最后,可以搜索范围[1,J]的最佳推导结果,由此可以得到最终的翻译。 
在解码期间,对于不能被任何翻译规则覆盖的范围,可以通过粘合规则来结合相邻的短语。利用现有的HPB模型,仅仅是利用顺序粘合规则来顺序地结合相邻的短语,例如,在图2(a)中示出了对于不能被任何翻译规则覆盖的范围[i,j],利用顺序粘合规则来结合短语范围[i,k]和[k,j],而利用本发明的扩展HPB模型,不仅采用顺序粘合规则来顺序地结合相邻的短语,而且采用逆序粘合规则来逆序地结合相邻的短语,例如,在图2(b)中示出了对于范围[i,j],采用逆序粘合规则来结合短语范围[i,k]和[k,j]。由此,相比于现有的HPB模型,本发明的扩展HPB模型可以产生更准确的翻译。 
另外,上述技术方案中的短语次序调整是内容无关的,也就是说,以顺序和逆序方式结合任何相邻的两个短语而不考虑这两个短语的含义或内容。因此,为了提高翻译质量,优选地,可以在解码期间通过考虑利用短语(包括源语言短语和/或目标语言短语)的上下文信息来引导短语次序的调整。 
相应地,图3示出了根据本发明另一实施例的基于扩展的HPB模型的统计机器翻译装置的结构框图。如图3所示,该基于扩展的HPB模型的统计机器翻译装置300包括翻译规则提取单元110、粘合规则规定单元120、解码单元130、以及短语次序分类器310。其中,翻译规则提取单元110、粘合规则规定单元120以及解码单元130的功能与图1中所示的相同,因此这里不再赘述。 
短语次序分类器310可以用于在解码期间基于相邻短语(包括源语言短语和/或目标语言短语)的上下文信息来引导是顺序地还是逆序地结合相邻的目标语言短语。 
在一个示例中,短语次序分类器310可以是基于最大熵的分类器,其可以以最大熵方式进行训练。具体地说,该分类器可以按照下述公式来预测相邻短语的次序: 
P ( o | X 1 , X 2 ) = exp ( &Sigma; i &lambda; i h i ( o , X 1 , X 2 ) ) &Sigma; o exp ( &Sigma; i &lambda; i h i ( o , X 1 , X 2 ) )
其中,o∈{顺序,逆序},表示两个短语X1和X2的次序,hi(o,X1,X2)是特征函数,并且λi是hi的权重。有关基于最大熵的分类器的更多细节可以参见Deyi Xiong,Qun Liu和Shouxun Lin所著的“Maximum entropy based phrase reordering model for statistical machine translation”,Proceedings of the 44th Annual Meeting of the Association for Computational Linguistics,pages 521-528,2006。 
在一个示例中,可以采用短语的边界词(第一个词和/或最后一个词)及其词性作为特征函数。 
上面结合附图详细描述了本发明实施例的基于扩展的HPB模型的统计机器翻译装置。下面将结合附图描述根据本发明实施例的基于扩展的HPB模型的统计机器翻译方法。 
图4示出了根据本发明实施例的基于扩展的HPB模型的统计机器 翻译方法的总体流程图。 
如图4所示,首先,在步骤S410,从双语语料库中提取包括短语规则和层次化短语规则的翻译规则。 
接下来,在步骤S420,规定包括顺序规则和逆序规则的粘合规则。 
接下来,在步骤S430,利用翻译规则中的短语规则和层次化短语规则将源语言句子翻译成目标语言短语序列,以及不断地利用粘合规则中的顺序规则顺序地结合相邻的目标语言短语,以及利用粘合规则中的逆序规则逆序地结合相邻的目标语言短语,直至产生候选目标语言句子,然后利用每个候选目标语言句子的得分确定最终的目标语言句子。 
通过阅读前面给出的相应处理的描述,基于扩展的HPB模型的统计机器翻译方法的各个步骤如何实现就变得很清楚了,所以在此就不再赘述了。 
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。 
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。 
在通过软件和/或固件实现本发明的实施例的情况下,从存储介质或网络向具有专用硬件结构的计算机,例如图5所示的通用计算机500安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等等。 
在图5中,中央处理模块(CPU)501根据只读存储器(ROM)502中存 储的程序或从存储部分508加载到随机存取存储器(RAM)503的程序执行各种处理。在RAM 503中,也根据需要存储当CPU 501执行各种处理等等时所需的数据。CPU 501、ROM 502和RAM 503经由总线504彼此连接。输入/输出接口505也连接到总线504。 
下述部件连接到输入/输出接口505:输入部分506,包括键盘、鼠标等等;输出部分507,包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等等,和扬声器等等;存储部分508,包括硬盘等等;和通信部分509,包括网络接口卡比如LAN卡、调制解调器等等。通信部分509经由网络比如因特网执行通信处理。 
根据需要,驱动器510也连接到输入/输出接口505。可拆卸介质511比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器510上,使得从中读出的计算机程序根据需要被安装到存储部分508中。 
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质511安装构成软件的程序。 
本领域的技术人员应当理解,这种存储介质不局限于图5所示的其中存储有程序、与装置相分离地分发以向用户提供程序的可拆卸介质511。可拆卸介质511的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 502、存储部分508中包含的硬盘等等,其中存有程序,并且与包含它们的装置一起被分发给用户。 
还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。 
虽然已经详细说明了本发明及其优点,但是应当理解在不脱离由所附的权利要求所限定的本发明的精神和范围的情况下可以进行各种改变、 替代和变换。而且,本申请的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者装置中还存在另外的相同要素。 

Claims (8)

1.一种基于扩展的层次化短语模型的统计机器翻译装置,包括:
翻译规则提取单元,用于从双语语料库中提取包括短语规则和层次化短语规则的翻译规则;
粘合规则规定单元,用于规定包括顺序规则和逆序规则的粘合规则;以及
解码单元,用于利用所述翻译规则将源语言句子翻译成目标语言短语序列,以及不断地利用所述粘合规则中的顺序规则顺序地结合相邻的目标语言短语,以及利用所述粘合规则中的逆序规则逆序地结合相邻的目标语言短语,直至产生候选目标语言句子,然后根据每个候选目标语言句子的得分确定最终的目标语言句子。
2.如权利要求1所述的统计机器翻译装置,还包括短语次序分类器,用于在解码期间基于相邻短语的上下文信息来引导是顺序地还是逆序地结合相邻的目标语言短语。
3.如权利要求2所述的统计机器翻译装置,其中短语次序分类器以最大熵方式进行训练。
4.如权利要求3所述的统计机器翻译装置,其中训练短语次序分类器所用的短语特征是短语的边界词及其词性。
5.一种基于扩展的层次化短语模型的统计机器翻译方法,包括:
从双语语料库中提取包括短语规则和层次化短语规则的翻译规则;
规定包括顺序规则和逆序规则的粘合规则;以及
利用所述翻译规则将源语言句子翻译成目标语言短语序列,以及不断地利用所述粘合规则中的顺序规则顺序地结合相邻的目标语言短语,以及利用所述粘合规则中的逆序规则逆序地结合相邻的目标语言短语,直至产生候选目标语言句子,然后根据每个候选目标语言句子的得分确定最终的目标语言句子。
6.如权利要求5所述的统计机器翻译方法,其中利用短语次序分类器在解码期间基于相邻短语的上下文信息来引导是顺序地还是逆序地结合相邻的目标语言短语。
7.如权利要求6所述的统计机器翻译方法,其中短语次序分类器以最大熵方式进行训练。
8.如权利要求7所述的统计机器翻译方法,其中训练短语次序分类器所用的短语特征是短语的边界词及其词性。
CN2010102865347A 2010-09-15 2010-09-15 基于扩展的层次化短语模型的统计机器翻译装置和方法 Pending CN102402503A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102865347A CN102402503A (zh) 2010-09-15 2010-09-15 基于扩展的层次化短语模型的统计机器翻译装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102865347A CN102402503A (zh) 2010-09-15 2010-09-15 基于扩展的层次化短语模型的统计机器翻译装置和方法

Publications (1)

Publication Number Publication Date
CN102402503A true CN102402503A (zh) 2012-04-04

Family

ID=45884723

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102865347A Pending CN102402503A (zh) 2010-09-15 2010-09-15 基于扩展的层次化短语模型的统计机器翻译装置和方法

Country Status (1)

Country Link
CN (1) CN102402503A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572636A (zh) * 2015-02-04 2015-04-29 苏州大学 一种调序模型建立方法、装置及翻译方法
CN113366484A (zh) * 2018-11-19 2021-09-07 因韦克有限责任公司 用于解释自然语言句子的神经网络

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685441A (zh) * 2008-09-24 2010-03-31 中国科学院自动化研究所 一种基于非连续短语的泛化重排序统计翻译方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685441A (zh) * 2008-09-24 2010-03-31 中国科学院自动化研究所 一种基于非连续短语的泛化重排序统计翻译方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DAVID CHIANG: "《A Hierarchical Phrase-Based Model for Statistical Machine Translation》", 《PROCEEDINGS OF THE 43TH ANMUAL MEETING OF THE ACL》 *
DAVID CHIANG: "《Hierarchical Phrase-Based Translation》", 《COMPUTATIONAL LINGUISTICS》 *
DEKAI WU: "《A Polynomial-Time Algorithm for Statistical Machine Translation》", 《PROCEEDINGS OF THE 34TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS》 *
DEYI XIONG ET AL.: "《Maximum Entropy Based Phrase Reordering Model for Statistical Machine Translation》", 《PROCEEDINGS OF THE 21ST INTERNATIONAL CONFERENCE ON COMPUTATIONAL LINGUISTICS AND 44TH ANNUAL MEETING OF THE ACL》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572636A (zh) * 2015-02-04 2015-04-29 苏州大学 一种调序模型建立方法、装置及翻译方法
CN113366484A (zh) * 2018-11-19 2021-09-07 因韦克有限责任公司 用于解释自然语言句子的神经网络

Similar Documents

Publication Publication Date Title
CN108091328B (zh) 基于人工智能的语音识别纠错方法、装置及可读介质
CN100527125C (zh) 一种统计机器翻译中的在线翻译模型选择方法和系统
US10073673B2 (en) Method and system for robust tagging of named entities in the presence of source or translation errors
US7778837B2 (en) Demographic based classification for local word wheeling/web search
Wang et al. Joint word alignment and bilingual named entity recognition using dual decomposition
CN106383818A (zh) 一种机器翻译方法及装置
JP5586817B2 (ja) ツリーレット翻訳対の抽出
CN105468585A (zh) 机器翻译装置和机器翻译方法
KR101266361B1 (ko) 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법
CN103678285A (zh) 机器翻译方法和机器翻译系统
CN104462072A (zh) 面向计算机辅助翻译的输入方法与装置
CN103631772A (zh) 机器翻译方法及装置
CN108549629B (zh) 一种结合相似度和图匹配的老-汉双语句子对齐方法
US20120296633A1 (en) Syntax-based augmentation of statistical machine translation phrase tables
US9311299B1 (en) Weakly supervised part-of-speech tagging with coupled token and type constraints
CN101271451A (zh) 计算机辅助翻译的方法和装置
CN110874535B (zh) 依存关系对齐组件、依存关系对齐训练方法、设备及介质
CN102662932B (zh) 构建树结构及基于树结构的机器翻译系统的方法
Prabhakar et al. Machine transliteration and transliterated text retrieval: a survey
CN104881397A (zh) 缩写词扩展方法和装置
CN105573994B (zh) 基于句法骨架的统计机器翻译系统
CN108664464B (zh) 一种语义相关度的确定方法及确定装置
CN116468009A (zh) 文章生成方法、装置、电子设备和存储介质
KR101709693B1 (ko) 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법
CN112836525A (zh) 一种基于人机交互机器翻译系统及其自动优化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120404