CN104899193B - 一种计算机中限定翻译片段的交互式翻译方法 - Google Patents
一种计算机中限定翻译片段的交互式翻译方法 Download PDFInfo
- Publication number
- CN104899193B CN104899193B CN201510330285.XA CN201510330285A CN104899193B CN 104899193 B CN104899193 B CN 104899193B CN 201510330285 A CN201510330285 A CN 201510330285A CN 104899193 B CN104899193 B CN 104899193B
- Authority
- CN
- China
- Prior art keywords
- translation
- fragment
- user
- mrow
- translated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
Abstract
本发明提出了一种计算机中限定翻译片段的交互式翻译方法,包括:用户输入需要翻译的句子,由系统给出原始翻译结果,当用户对系统给出的翻译结果的顺序有不同意见,通过点击操作对源语言片段进行限制,使得其作为一个完整的整体,系统根据重新翻译,避免系统翻译中存在的某些整体被作为多个子部分而分别翻译时,与其他部分发生的调序错误。对比现有的简单的网页翻译系统,本方法突出在不需要用户提供正确翻译结果的情况下,仅提供翻译片段切分信息,即可以让系统利用用户提供的信息进行重新解码,针对调序问题进行限制;对比已有的交互式翻译系统,本方法提供了更有效的交互信息及交互方式,在实际实验情况下可提高翻译质量。
Description
技术领域
本发明涉及一种计算机中限定翻译片段的交互式翻译方法,特别是一种用户向系统提供源语言正确切分信息,系统接收信息并进行重新解码的翻译方法。
背景技术
统计机器翻译,自上世纪90年代以来发展十分迅速,取得了很大的进步,已成为机器翻译领域中的研究热点。
虽然统计机器翻译已经有了长足的进步,但目前的机器翻译的实用性和可用性还并不非常高,对于复杂的源语言句子的翻译结果不理想,尤其是不同语系之间的机器翻译的质量更是急需提高,在提升机器翻译模型的翻译能力的难度越来越大、机器翻译系统的翻译结果的直接可用性不够强的条件下,如何通过更好的人机交互来辅助用户进行翻译,提高用户的翻译效率成为了一个重要问题。
统计机器翻译系统中,一种非常高效的方法是基于短语的统计机器翻译系统,其工作过程如下:输入待翻译的句子S,系统随之将其切分为n个短语,即S=s1,s2,……sn,进一步地,接着将每个源短语si翻译成目标语言短语ti,并利用已训练完毕的调序模型描述每个短语ti的调序信息,对所有短语进行组合,生成目标语言句子T=t1,t2,……tn。最后在所有可能的候选翻译中搜索出概率最高的句子。由上可知,短语的翻译准确程度、翻译的调序准确程度都是影响机器翻译的翻译能力的重要因素,用户参与系统的翻译,帮助系统对上述两个因素进行正确的判断,对于整个基于短语的机器翻译系统的翻译能力有很大的提升作用,本发明着重于对翻译的调序准确程度的研究,在实际使用中,可以提高翻译质量。
在现有的发明技术中,如中国科学计算技术研究所2011年申请的《计算机辅助翻译的方法及系统》专利中,着重于在机器翻译的基础上,对机器翻译的结果利用一些交互方式,提供记忆库、词典等方式进行翻译的后编辑,并没有提供系统对翻译结果进行重新解码的功能,仅仅是对翻译结果的修改,需要用户提供词或短语或句子的正确翻译结果,且对用户提供的信息利用不够充分,对机器翻译系统本身的解码过程没有起到调整优化作用,因此需要寻求可支持用户提供更简单的信息,对用户提供的信息利用更充分的交互方法。
发明内容
发明目的:本发明所要解决的技术问题是针对目前的机器辅助翻译系统中,只提供了简单的后编辑和记忆库等交互信息,并没有充分利用用户提供的信息进行重新解码,对机器翻译系统的解码输出没有起到调整优化作用的弱点,提出一种限定翻译片段的交互式翻译方法。
为了解决上述技术问题,本发明公开了一种交互式机器翻译中用户向系统提供源语言翻译片段正确切分信息,系统接收信息并进行重新解码的新型交互方法。
本发明所述用户向系统提供源语言翻译片段正确切分信息包括如下步骤:
步骤1,用户通过系统提供的Web平台开始翻译,并向系统提供源语言翻译片段正确切分信息;
步骤2,系统接收用户提供的正确切分信息后进行重新翻译。
其中,步骤1包括如下步骤:
步骤1-1,用户在输入框中输入需要翻译的内容作为源语言,系统开始翻译,翻译结束后得到格式化的初始翻译结果;
步骤1-2,用户观察步骤1-1中生成的初始翻译结果,在源语言上选择片段的起始词和结束词,从而将源语言中翻译片段正确切分信息提供给系统。
步骤2包括如下步骤:
步骤2-1,系统接收用户选择片段的起始词和结束词,根据源语言的词结构,从起始词开始至结束词,确定用户所要求限定的翻译片段;
步骤2-2,系统对源语言进行重新翻译,用户限定的翻译片段的内部不与片段外的短语进行调序,即将用户限定的翻译片段作为整体进行翻译,用户限定的翻译片段的内部翻译若要进行调序,必须生成连续的整体翻译结果,在系统得到新的翻译结果后,结构化输出该翻译结果,若用户接收翻译结果,则结束本步骤,否则返回步骤2-1。
步骤2-2包括:
系统在机器翻译过程中,进行如下的限制:
如果正在翻译的片段与限定的翻译片段无重叠,即还未进入用户限定的翻译片段则继续标准的机器翻译流程,不做任何另外处理工作,即:
p(t|s,cst,cflag)=p(t|s)if cflag=false,
如果正在翻译的片段与限定的翻译片段有重叠,即正在翻译的片段进入了限定的翻译片段,则系统必须将限定的翻译片段翻译完毕后再进行其他部分的翻译,从而达到限定的翻译片段内部不与其他部分进行调序,保证限定的翻译片段是一个完整的整体的目标,即:
其中s为源语言短语;t为短语s的翻译结果;cst为用户限定的翻译片段;cflag为正在翻译的片段是否进入限定的翻译片段的标记,初始值为false,一旦正在翻译的片段进入了限定的翻译片段,cflag的值则重置为true,当限定的翻译片段被完全翻译后,cflag的值重置为false;cover(a,b)表示a,b是否重叠;p(t|s,cst,cflag)表示正在翻译的短语进入了用户限定的翻译片段cst时(此时cflag为true),源语言短语s翻译为t的概率;p(t|s)表示源语言短语s翻译成t在机器翻译系统中的概率。
有益效果:本发明从整体上达到避免翻译中出现的某些整体被作为多个子部分而分别翻译时,与其他部分发生的调序错误,以此提高翻译质量的目标。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1是本发明的流程图。
具体实施方式
本发明提出了一种交互式机器翻译中的新型交互方式。用户向系统提供源语言正确翻译片段切分信息;系统在此基础上进行重新解码获得新的翻译结果。现有技术中一方面提供的交互信息较弱,另一方面系统并没有利用本发明中用户可提供的信息进行重新解码,或者解码方式不同。
如图1所示,本发明公开了一种交互式机器翻译中的新型交互方式,基于本发明开发的Web的短语统计翻译系统上开发了若干新型交互方式,即系统提供源语言正确切分信息;系统在此基础上进行重新解码获得新的翻译结果。
本发明所述用户向系统提供源语言正确切分信息包括如下步骤:
步骤11,用户通过基于本发明开发的系统提供的Web平台开始翻译工作:用户在输入框中输入需要翻译的内容,系统开始翻译,翻译结束后提供格式化的初始翻译结果。
步骤12,用户观察步骤11中生成的初始翻译,寻找在翻译过程中短语调序问题严重、与标准翻译的顺序差别较大、应该作为整体翻译而非分开翻译的片段,利用简单的交互方式,比如鼠标点击,用户选择片段的起始词和结束词,提供给系统源语言正确切分信息。
本发明所述系统接收用户提供的正确翻译片段切分信息后进行重新解码包括以下步骤:
步骤21,系统接收用户提供的信息,即源语言的起始、结束词,根据该信息及源端句子的词结构,从起始词开始至结束词,确定用户所要求限制的片段,转入一下步骤。
步骤22,系统利用该信息对源语言进行重新解码(翻译),限定该切分片段内部不与片段外的短语进行调序,即用户限定的片段作为整体进行翻译,整体内部可以调序,但必须生成连续的整体翻译结果。由此可以解决翻译过程中某些严重的短语调序问题,在系统得到新的翻译结果后,结构化输出。若用户接收翻译结果,则结束,否则返回21。
本发明所述系统接收用户提供的正确切分信息后进行重新解码中步骤22包括:
系统在机器翻译的解码(翻译)过程中,进行如下的限制:
如果正在翻译翻译的片段与限制的切分片段无重叠,即还未进入用户限制的翻译片段,则继续标准的机器翻译流程,不做任何另外处理工作。即
p(t|s,cst,cflag)=p(t|s)if cflag=false
如果正在翻译的片段与限制的切分片段有重叠,即正在翻译的片段进入了限制的切分片段,则限制机器翻译的过程必须将限制的切分片段完全翻译完毕后再进行其他部分的翻译,从而达到限制该切分片段内部不与其他部分进行调序,保证该切分片段是一个完整的整体的目标。
即
其中s为源语言短语;t为短语s的翻译结果;cst为用户给定的翻译片段;cflag为正在翻译的片段是否进入限制片段的标记,初始为false,一旦正在翻译的片段中某个翻译短语进入了限制片段,cflag为true,当限制片段被完全翻译后,cflag重置为false;cover(a,b)表示a,b是否重叠;p(t|s,cst,cflag)表示正在翻译的短语进入了用户限定的翻译片段cst时(此时cflag为true),源语言短语s翻译为t的概率;p(t|s)表示给定源语言短语s翻译成目标端短语t在机器翻译系统中的概率。
实施例1
本实施例用户向系统提供翻译切分片段信息,系统接收用户提供的正确翻译片段切分信息后进行重新解码运行如下:
1.通过基于本发明开发的系统提供的Web平台开始翻译工作:用户在输入框中输入需要翻译的内容:“在美国九一一恐怖攻击周年左右,东南亚各地的西方外交使节团纷纷关闭。”
2.系统开始翻译,翻译结束后提供格式化的初始翻译结果:”the 11septemberterrorist attacks in the united states,southeast asia around the anniversaryof the western diplomatic missions have been closed.”。
3.观察步骤11中生成的初始翻译,寻找在翻译过程中短语调序问题严重、与标准翻译的顺序差别较大、应该作为整体翻译而非分开翻译的片段:“恐怖攻击周年”应作为整体被翻译,而系统将“周年”的翻译调序到第二个子句,此时用户鼠标点击片段的起始词(恐怖)和结束词(周年),提供给系统源语言正确切分信息。
4.系统接收到用户提供的限制片段起始词和结束词信息,分析源端句子的词结构,确定用户所限制的具体片段信息,源端句子的第一个子句的词结构应分词为“在美国九一一恐怖攻击周年左右”,根据起始词和结束词,确定用户限制的片段为“恐怖攻击周年”。
5.在机器翻译中,句子的解码(翻译)过程是短语翻译假设扩展的过程,当解码过程第一次进用户入限制的片段中时,cflag置为true,表示此时需要进行限制。由于在机器翻译的解码过程中可以选择不同短语进行假设扩展,在本例中,如果选择的短语与限制的片段(“恐怖攻击周年”)有重叠,如选择了“攻击”,则可以进行翻译假设扩展,得到下一个翻译假设;如果选择的短语是“东南亚”,则与限制的片段无重叠,则不用该短语进行翻译假设扩展,保证用户限制的片段在翻译过程中被翻译为一个整体。当用户限制的片段被完全翻译(扩展)后,cflag置为false,此时限制解除,剩余的翻译假设仍然按照机器翻译的传统流程进行扩展。
6.利用上述的切分片段信息对源语言进行重新翻译,得到新的翻译结果:”the11september terrorist attacks anniversary in the united states,southeast asiaacross western diplomatic missions have been closed.”。达到翻译要求,结束。
本发明的目标是为了在同样的环境下,提供更利于用户使用的交互方式,让用户提供更简单的信息,同时更高效地利用用户提供的信息,更大程度地提高系统的翻译能力。
表1所示为进行实验的配置。表2为标准的机器翻译系统与本系统中的交互方式:用户提供源语言的一个正确翻译切分信息,系统接收到该信息之后重新解码,得到的翻译结果的质量的对比。我们使用的基线系统是标准的基于短语的机器翻译系统。实验数据是从MT03.ce.dev中随机抽取的120句中文句子。首先,我们用基线系统对这120句进行翻译,利用我们的评价指标BLEU进行打分;其次,对这120句中文句子,人工利用本专利要求的交互方式限制翻译片段,并重新解码,得到新的翻译结果。表3所示为利用人工提供正确翻译结果与利用人工提供片段切分信息,在该120句上所需要的时间对比。
句子总数 | 120 |
需要限制的句子数 | 71 |
表1
BLEU | |
基线系统 | 30.23 |
人工提供正确切分 | 32.78 |
表2
交互时间(单位:分钟) | 操作 | |
人工提供正确翻译 | 90 | 点击、选择、输入等 |
人工提供正确切分 | 60 | 点击 |
表3
由表1可以看出,大部分句子(71/120)存在调序问题,本发明的方法可以针对此种问题进行限制,从而调整翻译结构。
从表2可以看出,本发明的方法对比基线系统的技术支持用户简单的片段切分信息输入,可以起到帮助机器提高翻译水平的效果,更大程度上地利用了用户提供的信息,提高了翻译修正的效率和质量,其提高程度也是统计上显著的。
从表3可以看出,对比已有的辅助翻译技术直接更改、输入短语或句子的翻译的方法,在不人为直接提供新的翻译的前提下,通过提供简单的片段信息,能在一定程度上节省用户交互的时间。
本发明提供了一种计算机中限定翻译片段的交互式翻译方法,具体实现该技术方案的方法和途径很多,以上所述是本发明的优选实施方式。本发明基于短语机器翻译系统,在基于短语的机器翻译系统中,加入限定短语边界并重新解码的交互式翻译方法,使得用户对翻译错误的修正效率提高。在具体实验中,本发明提出的方法与简单的后编辑等简单的交互方法相比,需要用户提供的信息更少,对用户提供的信息的利用效率更高,减少了用户的工作量。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (1)
1.一种计算机中限定翻译片段的交互式翻译方法,其特征在于,包括如下步骤:
步骤1,用户通过系统提供的Web平台开始翻译,并向系统提供源语言翻译片段正确切分信息;
步骤2,系统接收用户提供的正确切分信息后进行重新翻译;
步骤1包括如下步骤:
步骤1-1,用户在输入框中输入需要翻译的内容作为源语言,系统开始翻译,翻译结束后得到格式化的初始翻译结果;
步骤1-2,用户观察步骤1-1中生成的初始翻译结果,在源语言中选择片段的起始词和结束词,从而将源语言中片段正确切分信息提供给系统;
步骤2包括如下步骤:
步骤2-1,系统接收用户选择的源语言中片段的起始词和结束词,根据源语言的词结构,从起始词开始至结束词,确定用户所要求限定的翻译片段;
步骤2-2,系统对源语言进行重新翻译,用户限定的翻译片段的内部不与片段外的短语进行调序,即将用户限定的翻译片段作为整体进行翻译,用户限定的翻译片段的内部翻译若要进行调序,必须生成连续的整体翻译结果,在系统得到新的翻译结果后,结构化输出该翻译结果,若用户接收翻译结果,则结束本步骤,否则返回步骤2-1;
步骤2-2包括:
系统在机器翻译过程中,进行如下的限制:
如果正在翻译的片段与限定的翻译片段无重叠,即还未进入用户限定的翻译片段,则继续标准的机器翻译流程,不做任何另外处理工作,即:
p(t|s,cst,cflag)=p(t|s)if(cflag=false),
如果正在翻译的片段与限定的翻译片段有重叠,即正在翻译的片段进入了限定的翻译片段,则系统必须将限定的翻译片段翻译完毕后再进行其他部分的翻译,从而达到限定的翻译片段内部不与其他部分进行调序,保证限定的翻译片段是一个完整的整体的目标,即:
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>|</mo>
<mi>s</mi>
<mo>,</mo>
<mi>c</mi>
<mi>s</mi>
<mi>t</mi>
<mo>,</mo>
<mi>c</mi>
<mi>f</mi>
<mi>l</mi>
<mi>a</mi>
<mi>g</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>|</mo>
<mi>s</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>c</mi>
<mi>f</mi>
<mi>l</mi>
<mi>a</mi>
<mi>g</mi>
<mo>=</mo>
<mi>t</mi>
<mi>r</mi>
<mi>u</mi>
<mi>e</mi>
<mo>)</mo>
</mrow>
<mi>a</mi>
<mi>n</mi>
<mi>d</mi>
<mi> </mi>
<mi>cov</mi>
<mi>e</mi>
<mi>r</mi>
<mrow>
<mo>(</mo>
<mi>c</mi>
<mi>s</mi>
<mi>t</mi>
<mo>,</mo>
<mi>s</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>c</mi>
<mi>f</mi>
<mi>l</mi>
<mi>a</mi>
<mi>g</mi>
<mo>=</mo>
<mi>t</mi>
<mi>r</mi>
<mi>u</mi>
<mi>e</mi>
<mo>)</mo>
</mrow>
<mi>a</mi>
<mi>n</mi>
<mi>d</mi>
<mi> </mi>
<mi>n</mi>
<mi>o</mi>
<mi>t</mi>
<mi> </mi>
<mi>cov</mi>
<mi>e</mi>
<mi>r</mi>
<mrow>
<mo>(</mo>
<mi>c</mi>
<mi>s</mi>
<mi>t</mi>
<mo>,</mo>
<mi>s</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>,</mo>
</mrow>
其中s为源语言短语;t为短语s的翻译结果;cst为用户限定的翻译片段;cflag为正在翻译的片段是否进入限定的翻译片段的标记,初始值为false,一旦正在翻译的片段进入了限定的翻译片段,cflag的值则重置为true,当限定的翻译片段被完全翻译后,cflag的值重置为false;cover(a,b)表示a,b是否重叠;p(t|s,cst,cflag)表示正在翻译的短语进入了用户限定的翻译片段cst时(此时cflag为true),源语言短语s翻译为t的概率;p(t|s)表示源语言短语s翻译成t在机器翻译系统中的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510330285.XA CN104899193B (zh) | 2015-06-15 | 2015-06-15 | 一种计算机中限定翻译片段的交互式翻译方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510330285.XA CN104899193B (zh) | 2015-06-15 | 2015-06-15 | 一种计算机中限定翻译片段的交互式翻译方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104899193A CN104899193A (zh) | 2015-09-09 |
CN104899193B true CN104899193B (zh) | 2017-10-17 |
Family
ID=54031862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510330285.XA Active CN104899193B (zh) | 2015-06-15 | 2015-06-15 | 一种计算机中限定翻译片段的交互式翻译方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104899193B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9734142B2 (en) * | 2015-09-22 | 2017-08-15 | Facebook, Inc. | Universal translation |
CN106649283B (zh) * | 2015-11-02 | 2020-04-28 | 姚珍强 | 用于移动设备的基于自然对话方式的翻译装置和方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102193914A (zh) * | 2011-05-26 | 2011-09-21 | 中国科学院计算技术研究所 | 计算机辅助翻译的方法及系统 |
CN102270198A (zh) * | 2011-08-16 | 2011-12-07 | 上海交通大学出版社有限公司 | 计算机辅助翻译系统 |
CN102662935A (zh) * | 2012-04-08 | 2012-09-12 | 北京语智云帆科技有限公司 | 一种交互式的机器翻译方法和机器翻译系统 |
US8805669B2 (en) * | 2010-07-13 | 2014-08-12 | Dublin City University | Method of and a system for translation |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2675208A1 (en) * | 2007-01-10 | 2008-07-17 | National Research Council Of Canada | Means and method for automatic post-editing of translations |
-
2015
- 2015-06-15 CN CN201510330285.XA patent/CN104899193B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8805669B2 (en) * | 2010-07-13 | 2014-08-12 | Dublin City University | Method of and a system for translation |
CN102193914A (zh) * | 2011-05-26 | 2011-09-21 | 中国科学院计算技术研究所 | 计算机辅助翻译的方法及系统 |
CN102270198A (zh) * | 2011-08-16 | 2011-12-07 | 上海交通大学出版社有限公司 | 计算机辅助翻译系统 |
CN102662935A (zh) * | 2012-04-08 | 2012-09-12 | 北京语智云帆科技有限公司 | 一种交互式的机器翻译方法和机器翻译系统 |
Non-Patent Citations (2)
Title |
---|
交互式机器翻译中译文查询行为的预测技术;季铎等;《计算机用用》;20150410;第35卷(第4期);全文 * |
通过人机交互与机器学习提高日汉机器翻译系统的实用性;周玉龙;《南开大学学报(自然科学)》;20000630;第33卷(第2期);44-47 * |
Also Published As
Publication number | Publication date |
---|---|
CN104899193A (zh) | 2015-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI629601B (zh) | 提供翻譯與分類翻譯結果的系統,電腦可讀存儲媒體,檔案分配系統及其方法 | |
Boudin et al. | Keyphrase extraction for n-best reranking in multi-sentence compression | |
CN105068997B (zh) | 平行语料的构建方法及装置 | |
US8874433B2 (en) | Syntax-based augmentation of statistical machine translation phrase tables | |
US20080120092A1 (en) | Phrase pair extraction for statistical machine translation | |
WO2015096529A1 (zh) | 面向通用机译引擎的个性化翻译方法及装置 | |
WO2020000764A1 (zh) | 一种面向印地语的多语言混合输入方法及装置 | |
Loginova et al. | Reference lists for the evaluation of term extraction tools | |
He et al. | Integrating N-best SMT Outputs into a TM System | |
CN107133223A (zh) | 一种自动探索更多参考译文信息的机器翻译优化方法 | |
CN101271451A (zh) | 计算机辅助翻译的方法和装置 | |
CN105956158A (zh) | 基于海量微博文本和用户信息的网络新词自动提取的方法 | |
US10496758B2 (en) | Machine translation method and machine translation apparatus | |
CN101763403A (zh) | 面向多语言信息检索系统的查询翻译方法 | |
CN104899193B (zh) | 一种计算机中限定翻译片段的交互式翻译方法 | |
Xiong et al. | Topic-based term translation models for statistical machine translation | |
Costa-Jussà et al. | Evaluating indirect strategies for chinese-spanish statistical machine translation | |
CN110888940A (zh) | 文本信息提取方法、装置、计算机设备及存储介质 | |
CN102012897A (zh) | 一种实现高命中率的逐词比对方法 | |
Hogan et al. | Dcu@ fire 2011: Sms-based faq retrieval | |
Gao et al. | Chinese-Naxi machine translation method based on Naxi dependency language model | |
Su et al. | A Topic‐Triggered Translation Model for Statistical Machine Translation | |
Hemati et al. | PCoQA: Persian Conversational Question Answering Dataset | |
Finch et al. | A bayesian model of transliteration and its human evaluation when integrated into a machine translation system | |
Chinea-Rios et al. | Vector sentences representation for data selection in statisticalmachine translation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |