CN108363702B

CN108363702B - 翻译方法和设备以及翻译系统

Info

Publication number: CN108363702B
Application number: CN201711259277.6A
Authority: CN
Inventors: 李知炫; 罗辉栋; 李镐式
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2017-01-26
Filing date: 2017-12-04
Publication date: 2023-10-31
Anticipated expiration: 2037-12-04
Also published as: CN108363702A; JP2018120584A; US11954452B2; US20180210878A1; US20200356731A1; KR20180087945A; US20220374613A1; KR102637338B1; US10762302B2; JP7111464B2; US11409967B2; EP3355203A1

Abstract

公开一种翻译方法和设备以及翻译系统。一种翻译校正方法包括：从源句子选择源词；生成包括映射到源句子中的选择的源词的选择的源词的位置信息的映射信息；基于通过翻译源句子而生成的目标词的特征值的位置信息和映射信息来校正目标词。

Description

翻译方法和设备以及翻译系统

本申请要求于2017年1月26日提交到韩国知识产权局的第10-2017-0012361号韩国专利申请的权益，所述韩国专利申请的全部公开出于所有目的通过引用包含于此。

技术领域

以下描述涉及一种翻译方法和设备以及翻译系统。

背景技术

用户可使用机器翻译来翻译不同于用户的母语的语言的句子、段落、短语或词。然而，当机器翻译的结果中包括错误时，用户不能容易地和正确地理解机器翻译的结果。因此，正确地翻译另一种语言的句子可能是重要的。

发明内容

提供本发明内容来以简化的形式介绍在下面的具体实施方式中进一步描述的构思的选择。本发明内容不意图确定要求保护的主题的关键特征和必要特征，本发明内容也不意图作为对确定要求保护的主题的范围的帮助。

在一个总体方面，一种翻译方法包括：从源句子选择源词；生成包括选择的源词的位置信息的映射信息，其中，选择的源词的位置信息被映射到源句子中的选择的源词；基于通过翻译源句子而生成的目标词的特征值的位置信息和映射信息来校正目标词。

校正目标词的步骤可包括：确定特征值的位置信息是否包括在映射信息中；响应于特征值的位置信息包括在映射信息中，用映射到特征值的位置信息的源词来替换目标词。

校正目标词的步骤可包括：响应于目标词基于子目标词被确定，确定每一个子目标词的最大特征值；响应于每一个最大特征值的位置信息包括在映射信息中，用映射到每一个最大特征值的位置信息的源词来替换目标词。

校正目标词的步骤可包括：从通过完成源句子的翻译而生成的目标句子，选择对应于预设类型的目标词；确定选择的目标词的最大特征值的位置信息是否包括在映射信息中；响应于最大特征值的位置信息包括在映射信息中，用映射到最大特征值的位置信息的源词来替换选择的目标词。

校正目标词的步骤可包括：基于通过完成源句子的翻译而生成的目标句子中的子目标词来确定目标词；响应于确定的目标词对应于预设类型，确定子目标词的各个最大特征值中的代表值；确定代表值的位置信息是否包括在映射信息中；响应于代表值的位置信息包括在映射信息中，用映射到代表值的位置信息的源词来替换确定的目标词。

选择的源词可对应于专有名词、数字、包括数字和字符的词、用目标语言表达的词、未在字典中登记的词、和短语中的任何一个，所述短语包括专有名词、数字、包括数字和字符的词、用目标语言表达的词和未在字典中登记的词中的任何一个或者任何两个或更多个的任何组合。

所述翻译方法还可包括预处理选择的源词。

预处理选择的源词的步骤可包括改变选择的源词的标音。

所述翻译方法还可包括：响应于源句子为子词级句子或者字符级句子，将源句子中的子源词或者子源字符转换为单个源词。

生成映射信息的步骤可包括：响应于所述单个源词对应于预设类型，将源句子中的子源词或者子源字符中的每一个的位置信息映射到所述单个源词。

目标词可通过源句子的神经网络机器翻译而生成。

可在完成将源句子翻译成目标句子之后执行校正目标词的步骤。

可在翻译源句子的同时并且在完成源句子的翻译之前执行校正目标词的步骤。

一种非暂时性计算机可读存储介质可存储当由处理器执行时使得处理器执行所述方法的指令。

在另一总体方面，一种翻译设备包括：控制器；存储器，存储能够由控制器执行的指令，其中，控制器被配置为：响应于执行所述指令，从源句子选择源词；生成包括选择的源词的位置信息的映射信息，其中，选择的源词的位置信息被映射到源句子中的选择的源词；基于通过翻译源句子而生成的目标词的特征值的位置信息和映射信息来校正目标词。

控制器可被配置为：确定特征值的位置信息是否包括在映射信息中；响应于特征值的位置信息包括在映射信息中，用映射到特征值的位置信息的源词来替换目标词。

控制器可被配置为：响应于目标词基于子目标词被确定，确定每一个子目标词的最大特征值；响应于每一个最大特征值的位置信息包括在映射信息中，用映射到每一个最大特征值的位置信息的源词来替换目标词。

控制器可被配置为：响应于对应于预设类型的目标词从通过完成源句子的翻译而生成的目标句子被选择，确定选择的目标词的最大特征值的位置信息是否包括在映射信息中。控制器可被配置为：响应于选择的目标词的最大特征值的位置信息包括在映射信息中，用映射到最大特征值的位置信息的源词来替换选择的目标词。

控制器可被配置为基于通过完成源句子的翻译而生成的目标句子中的子目标词来确定目标词。控制器可被配置为：响应于确定的目标词对应于预设类型，确定子目标词的各个最大特征值中的代表值，并确定代表值的位置信息是否包括在映射信息中。控制器可被配置为：响应于代表值的位置信息包括在映射信息中，用映射到代表值的位置信息的源词来替换确定的目标词。

选择的源词可对应于专有名词、数字、包括数字和字符的词、用目标语言表达的词、未在字典中登记的词、和短语中的任何一个，所述短语包括专有名词、数字、包括数字和字符的词、用目标语言表达的词、未在字典中登记的词中的任何一个或者任何两个或更多个的任何组合。

控制器可被配置为预处理选择的源词。

控制器可被配置为改变选择的源词的标音。

控制器可被配置为：响应于源句子为子词级句子或字符级句子，将源句子中的子源词或子源字符转换为单个源词。

控制器可被配置为：响应于所述单个源词响应于对应于预设类型，将源句子中的子源词或者子源字符中的每一个的位置信息映射到所述单个源词。

目标词可通过源句子的神经网络机器翻译而生成。

控制器可被配置为在完成将源句子翻译成目标句子之后校正目标词。

控制器可被配置为在翻译源句子的同时并且在完成源句子的翻译之前校正目标词。

在另一总体方面，一种翻译系统包括：句子分析器，被配置为从源句子选择源词，并生成包括映射到源句子中的选择的源词的选择的源词的位置信息的映射信息；翻译器，被配置为基于源句子的翻译来确定多个目标词；校正器，被配置为每当所述多个目标词中的目标词被确定时，基于确定的目标词的特征值的位置信息和映射信息来确定是否校正确定的目标词，或者被配置为响应于目标句子被翻译器完成，基于所述多个目标词中的从目标句子选择的目标词的特征值的位置信息和映射信息来确定是否校正选择的目标词。

校正器可被配置为：响应于确定的目标词的最大特征值的位置信息包括在映射信息中，用映射到确定的目标词的最大特征值的位置信息的源词来替换确定的目标词。

校正器可被配置为：响应于选择的目标词的最大特征值的位置信息包括在映射信息中，用映射到选择的目标词的最大特征值的位置信息的源词来替换选择的目标词。

源词的位置信息可表示源句子中的源词的位置。

特征值可表示在执行机器翻译中多个源词中的源词对确定目标词贡献的程度。

通过下面的具体实施方式、附图和权利要求，其他特征和方面将是清楚的。

附图说明

图1是示出翻译系统的操作的示例的示图。

图2是示出句子分析器的操作的示例的示图。

图3至图5是示出翻译器的操作的示例的示图。

图6和图7是示出校正器的操作的示例的示图。

图8和图9是示出校正器的操作的另一示例的示图。

图10是示出翻译系统的操作的另一示例的示图。

图11是示出翻译设备的示例的示图。

图12是示出翻译方法的示例的流程图。

图13是示出翻译方法的另一示例的流程图。

图14是示出翻译方法的另一示例的流程图。

贯穿附图和具体实施方式，除非另有描述或提供，否则相同的附图参考标号将被理解为表示相同元件、特征和结构。附图可能不按比例，并且为了清楚、说明和方便，附图中的元件的相对大小、比例和描绘可能被夸大。

具体实施方式

提供下面的详细的描述以帮助读者获得对在此描述的方法、设备和/或系统的全面理解。然而，在理解本申请的公开之后，在此描述的方法、设备和/或系统的各种改变、修改和等同物将是清楚的。例如，在此描述的操作的顺序仅是示例，并且不限于在此阐述的那些顺序，而是除了必须以特定的顺序发生的操作之外，可如在理解本申请的公开之后将是清楚地那样被改变。此外，为了更加清楚和简明，可省略本领域中公知的特征的描述。

在此描述的特征可以以不同的形式来实现，并且不被解释为限于在此描述的示例。更确切地说，已经提供在此描述的示例，仅用于示出在理解了本申请的公开之后将是清楚的实现在此描述的方法、设备和/或系统的许多可能方式中的一些方式。

虽然诸如“第一”、“第二”和“第三”的术语可在这里用于描述各种构件、组件、区域、层或者部分，但是这些构件、组件、区域、层或者部分不限于这些术语。更确切地说，这些术语仅用于将一个构件、组件、区域、层或者部分与另一构件、组件、区域、层或者部分区分开来。因此，在不脱离示例的教导的情况下，这里描述的示例中表示的第一构件、组件、区域、层或者部分也可被称为第二构件、组件、区域、层或者部分。

贯穿本说明书，当组件被描述为“连接到”或“结合到”另一组件时，它可直接“连接到”或“结合到”该另一组件，或者它们之间可存在一个或多个其他组件。相比之下，当元件被描述为“直接连接到”或者“直接结合到”另一元件时，它们之间可不存在其他元件。类似地，例如“在…之间”和“紧密地在…之间”以及“与…相邻”和“与…紧密相邻”的表述也可如前面所述地被解释。

如这里所使用的，术语“和/或”包括两个或更多个相关联的列出项中的任何一个和任何组合。

这里使用的术语仅用于描述各种示例，并不用于限制本公开。除非上下文另有明确指出，否则单数形式的冠词也意在包括复数形式。术语“包括”、“包含”、“具有”指定存在叙述的特征、数量、操作、构件、元件和/或它们的组合，但并不排除存在或添加一个或多个其他特征、数量、操作、构件、元件和/或它们的组合。

除非另有定义，否则这里使用的所有术语(包括技术术语和科学术语)具有基于本公开的理解与本公开所属领域的普通技术人员通常理解的含义相同的含义。除非在此明确定义，否则术语(诸如，在通用字典中定义的术语)将被解释为具有与它们在相关领域的上下文和本公开中的含义一致的含义，并且将不被解释为理想化或过于形式化的意义。

图1是示出翻译系统100的操作的示例的示图。

参考图1，翻译系统100包括句子分析器110、翻译器120和校正器130。

句子分析器110分析源句子。例如，句子分析器110对源句子执行语素分析和语法分析。句子分析器110通过分析源句子来生成副本列表(copy list)。副本列表包括将被复制到目标句子中的至少一个源词以及每一个源词的位置信息。以下将参考图2来描述句子分析器110的详细操作。

翻译器120通过对源句子执行机器翻译来完成包括目标词的目标句子。例如，翻译器120对源句子进行编码并通过解码顺序地确定目标词，以完成目标句子。以下将参考图3至图5来描述翻译器120的详细操作。

校正器130在每一个解码时间(例如，当每一个目标词被确定时)进行操作，或者当完成目标句子时(例如，当全部解码被完成时)进行操作。在一个示例中，当在当前解码时间t的目标词被确定时，校正器130确定是否校正目标词。确定可基于与在当前解码时间t的确定的目标词的一个或多个特征值(例如，最大特征值)相关联的源词的位置，以及该位置是否在副本列表上。将参考图6和图7来描述校正器130的这种操作。在另一示例中，当目标句子被完成时，校正器130基于与目标句子中的目标词的一个或多个特征值(例如，最大特征值)相关联的源词的位置以及该位置是否在副本列表上来确定是否校正目标句子中的一些目标词。将参考图8和图9来描述校正器130的这样的操作。

通过上面描述的校正器130的操作，翻译系统100生成校正的目标句子。因此，翻译错误被最小化并且翻译准确性被相应地提高。

图2是示出句子分析器200的操作的示例的示图。

在图2的示例中，句子分析器200分析如下提供的第一源句子和第二源句子。

第一源句子：1990/>

4,868,5202000/>4,019,991/>

3,829,998

第二源句子：Hutton,Lee Jihyun/>

1000/>

表1示出第一源句子中的源词的位置信息的示例，并且表2示出第二源句子中的源词的位置信息的示例。

表1

表2

参考图2，在阶段210中，句子分析器200从源句子选择一个或多个源词。句子分析器200提前选择可能发生翻译错误的源词。在一个示例中，句子分析器200选择源句子中的源词之中的对应于预设类型的源词。句子分析器200选择与下述内容对应的源词：专有名词、数字、包括数字和字符(例如，字母字符和特定字符(例如，账号、电话号码或者型号名称))的词、用目标语言表达的词、未在字典中登记的词、复合名词或者短语中的任何一个，其中，复合名词或者短语包括专有名词、数字、包括数字和字符的词、用目标语言表达的词和未在字典中登记的词中的任何一个或者任何两个或更多个的任何组合。

例如，句子分析器200从第一源句子选择对应于数字的“1990”、“4,868,520”、“2000”、“4,019,991”以及“3,829,998”。另外，句子分析器200从第二源句子选择对应于专有名词的“Hutton”、“Lee”以及“Jihyun”。句子分析器200还从第二源句子选择对应于数字的/>

在阶段220中，句子分析器200预处理选择的源词。句子分析器200改变选择的源词的标音(transcription)。例如，句子分析器200使专有名词罗马化为“SeokMiYeon”，并将/>改变为“10million”或者“10,000,000”。此外，句子分析器200将选择的源词作为单个源词进行处理。例如，“Lee”和“Jihyun”是没有逗号的彼此相邻的源词，因此句子分析器200将“Lee”和“Jihyun”作为单个源词“Lee Jihyun”进行处理。

在阶段230中，句子分析器200生成包括选择的源词和选择的源词的位置信息的副本列表。换句话说，句子分析器200生成包括彼此映射的选择的源词和选择的源词的位置信息的映射信息。当预处理选择的源词时，句子分析器200映射选择的源词的位置信息和预处理的结果。例如，句子分析器200映射作为预处理的结果的“Seok MiYeon”和的位置信息3。此外，句子分析器200映射作为预处理/>的结果的“10million”和/>的位置信息14。类似地，句子分析器200映射作为预处理“Lee”和“Jihyun”的结果的“Lee Jihyun”以及“Lee”的位置信息6和“Jihyun”的位置信息7。

下面表3示出与第一源句子相关联的副本列表的示例，下面表4示出与第二源句子相关联的副本列表的示例。

表3

位置信息	源词
		7	1990
8	4,868,520
		11	2000
12	4,019,991
		17	3,829,998

表4

校正器(未示出)使用由句子分析器200生成的副本列表，其中，将稍后描述校正器的示例。

图3至图5是示出翻译器的操作的示例的示图。

参考图3至图5，翻译器是例如包括编码器310和解码器330的神经网络机器翻译(NMT)模型，其中，编码器310被配置为对源句子进行编码，解码器330被配置为将编码的结果解码为目标语言。编码器310和解码器330基于例如递归神经网络(RNN)的神经网络。

注意机制被应用于NMT模型的翻译器，以对准源词和对应于源词的目标词。参考图3，应用注意机制的翻译器包括编码器310、解码器330以及被配置为计算用于确定目标词的特征值的中间网络320。以下将参考图4和图5来描述应用注意机制的翻译器的详细操作。

参考图4，翻译器对源句子中的每一个源词(例如，x₁，x₂，…，x_n)进行编码。x₁，x₂，…，x_n中的下标(例如1、2、…和n)表示各个源词x₁，x₂，…，x_n中的每一个的位置信息。作为对源词进行编码的结果，各个向量(例如，h₁，h₂，…，h_n)被生成。向量h₁，h₂，…，h_n中的每一个是实数向量。

当源词被编码时，翻译器通过解码按顺序次序确定目标词。在图4的示例中，目标词y_t将被确定，其中，目标词y_t表示当前解码时间为t。

翻译器计算特征值a_t,1，a_t,2，…，a_t,n。翻译器基于在先前的解码时间t-1的与目标词y_t-1相关联的RNN隐藏状态信息s_t-1以及向量h₁，h₂，…，h_n来计算特征值a_t,1，a_t,2，…，a_t,n。例如，翻译器基于s_t-1和h₁来计算a_t,1。翻译器通过用于计算特征值a_t,1的类似方法来计算剩余的特征值a_t,2…，a_t,n。

特征值表示向量或者源词对确定目标词y_t的贡献的多少。例如，a_t,1表示h₁或者对应于位置信息1的源词对目标词y_t的确定的贡献的程度。类似地，a_t,n表示h_n或者对应于位置信息n的源词对目标词y_t的确定的贡献的程度。这种特征值还被称为注意值。

翻译器使用特征值和向量来计算语境向量c_t。例如，翻译器计算c_t＝a_t,1×h₁+a_t,2×h₂+...+a_t,n×h_n。

翻译器基于在先前的解码时间t-1的与目标词y_t-1相关联的RNN隐藏状态信息s_t-1和在先前的解码时间t-1的目标词y_t-1来确定在当前解码时间t的RNN隐藏状态信息s_t。翻译器通过基于在当前解码时间t的RNN隐藏状态信息s_t执行解码来确定目标词y_t。

在图5的示例中，第一源句子510被输入到翻译器。翻译器对第一源句子510中的每一个源词进行编码，并生成用于源词的各个向量h₁，h₂，…，h₁₉作为编码的结果。

参考图5，当翻译器确定四个目标词“After”、“that”、“(comma)”以及“the”时，是翻译器根据顺序次序确定第五目标词的时间。因此，当前解码时间t是5(t＝5)，翻译器计算特征值a_5,1,a_5,2,…,a_5,19。翻译器使用向量h₁，h₂，…，h₁₉和特征值a_5,1，a_5,2，…,a_5,19来计算语境向量c₅。翻译器基于语境向量c₅、与先前的目标词“the”相关联的RNN隐藏状态信息以及先前的目标词“the”来确定在当前解码时间t的RNN隐藏状态信息。翻译器通过基于在当前解码时间t的RNN隐藏状态信息执行解码来确定目标词“figure”。向量h₃或源词对目标词“figure”的确定的贡献是最大的，因此a_5,3对应于a_5,1，a_5,2，…,a_5,19中的最大特征值。

翻译器在每一个随后的解码时间确定目标词，并完成包括确定的目标词的目标句子。

图6和图7是示出校正器600的操作的示例的示图。

图6示出当在当前的解码时间t确定目标词y_t时执行的校正器600的操作的流程图。参考图6，在操作610中，校正器600确定目标词y_t的最大特征值。最大特征值指的是与目标词y_t相关联的特征值a_t,1，a_t,2，…,a_t,n中的最大值。在操作620中，校正器600确定最大特征值的位置信息是否包括在副本列表中。最大特征值的位置信息表示与用于计算最大特征值的向量对应的源词的位置信息。在操作630中，响应于最大特征值的位置信息包括在副本列表中，校正器600使用映射到最大特征值的位置信息的源词来替换目标词y_t。在操作640中，响应于最大特征值的位置信息不包括在副本列表中，校正器600保持目标词y_t。换句话说，当最大特征值的位置信息不包括在副本列表中时，校正器600不校正目标y_t。

如图7中所示，710表示源句子。在阶段730中，翻译器在解码时间5确定目标词“figure”。校正器确定目标词“figure”的特征值(例如，a_5,1，a_5,2，…,a_5,19)中的最大特征值。这里，a_5,3对应于a_5,1，a_5,2，…,a_5,19中的最大特征值。参考图5描述了这样的最大特征值，因此为简洁起见，在这里省略最大特征值的更详细的和重复的描述。当确定最大特征值时，校正器验证a_5,3的位置信息。例如，向量h₃用于计算a_5,3，因此校正器将对应于向量h₃的源词的位置信息3验证为a_5,3的位置信息。校正器确定位置信息3是否包括在副本列表720中。由于位置信息3不包括在副本列表720中，所以校正器保持目标词“figure”。

在阶段740中，翻译器在解码时间6至解码时间9顺序地确定目标词，并在解码时间10确定目标词“486,820”。校正器确定目标词“486,820”的特征值a_10,1，a_10,2，…,a_10,19中的最大特征值。因为a_10,8对应于a_10,1，a_10,2，…,a_10,18中的最大特征值，所以翻译器最关注用于确定目标词“486,820”的对应于位置信息8的源词“4,868,520”。校正器确定a_10,8的位置信息8是否包括在副本列表720中。由于位置信息8包括在副本列表720中，所以校正器使用副本列表720中的映射到位置信息8的“4,868,520”来替换目标词“486,820”。

翻译器在每一个随后的解码时间确定目标词，并且校正器在随后的解码时间校正或者不校正确定的目标词。

校正的目标句子750包括校正的目标词。在校正的目标句子750中，校正器用校正的目标词“4,868,520”替换目标词“486,820”，因此可确定：翻译错误被减少并且翻译准确性被提高。

图8和图9是示出校正器800的操作的另一示例的示图。

图8示出当完成目标句子时执行的校正器800的操作的流程图。参考图8，校正器800从翻译器接收目标句子以及目标句子中的每一个目标词的最大特征值。校正器800确定每一个目标词是否对应于预设类型。在操作810中，校正器800选择对应于可能需要校正的预设类型的一个或多个目标词。在操作820中，校正器800确定选择的目标词的最大特征值的位置信息是否包括在副本列表中。在操作830中，响应于最大特征值的位置信息包括在副本列表中，校正器800用映射到最大特征值的位置信息的源词来替换选择的目标词。在操作840中，响应于最大特征值的位置信息不包括在副本列表中，校正器800保持选择的目标词。

如图9中所示，当翻译器920完成对应于源句子910的目标句子930时，校正器从翻译器920接收目标句子930以及包括例如“Sukmyun”的最大特征值a_1,1的每一个目标词的最大特征值。如上关于最大特征值所述，对应于位置信息1的源词对确定“Sukmyun”贡献最大，因此“Sukmyun”的最大特征值是a_1,1。

校正器从目标句子930选择对应于预设类型的目标词(例如，专有名词、数字、包括数字和字符的词以及未在字典中登记的词)。校正器从目标句子930选择与未在字典中登记的词或者专有名词对应的“Sukmyun”以及对应于数字的“100”和“million”。

校正器验证“Sukmyun”的最大特征值a_1,1、“100”的最大特征值a_8,8和“million”的最大特征值a_9,8中的每一个的位置信息。校正器将a_1,1的位置信息验证为位置信息1，并将a_8,8和a_9,8的位置信息验证为位置信息8。

校正器确定位置信息1是否包括在副本列表940中。由于位置信息1包括在副本列表940中，所以校正器用映射到位置信息1的“Seok MiYeon”来替换“Sukmyun”。

选择的目标词“100”和“million”的最大特征值具有相同的位置信息。如图9中所示，a_8,8的位置信息和a_9,8的位置信息与位置信息8相同。在这种情况下，当位置信息包括在副本列表940中时，校正器用映射到位置信息的源词来替换选择的目标词。在图9的示例中，位置信息8包括在副本列表940中，因此校正器用映射到位置信息8的“10million”来替换通过顺序地将选择的目标词“100”和“million”组合而获得的“100million”

目标句子930被校正为校正的目标句子950。在源句子910中的专有名词被处理为未知词或者未被正确地翻译的情况下，校正的目标句子950包括源句子910的专有名词或者预处理的专有名词。例如，当专有名词被翻译为“Sukmyun”，并不被处理为未知词时，预处理的专有名词“Seok MiYeon”在校正的目标句子950中替换它。因此，翻译准确性可被提高并且翻译错误可被减少。

<翻译子词单元(subword-unit)源句子：子词级(subword-level)机器翻译>

根据一个示例，翻译系统可如参考图1至图9所述翻译词单元(word-unit)源句子。根据另一示例，翻译系统可翻译子词单元源句子(还被称为子词级句子)。以下将参考图10描述其的示例。

图10是示出翻译系统的操作的另一示例的示图。

翻译系统可将原始词单元源句子转换为子词单元源句子。在图10的示例中，翻译系统将原始源词“Hutton”划分为子源词(sub-source word)“H@@”、“u@@、“tt@@”以及“on”。因此，原始源句子被转换为源句子

子源词“H@@”“u@@”和tt@@包括表示子词的标签@@，子源词“on”不包括标签。子源词“on”是原始源词“Hutton”的最后一个子源词，因此子源词“on”不包括标签。

句子分析器1020通过预处理将子词单元源句子1010转换为词单元句子。也就是说，句子分析器1020通过经由预处理组合子源词来生成单个源词。例如，句子分析器1020通过组合子源词“H@@”“u@@”“tt@@”和“on”来生成单个源词“Hutton”。

句子分析器1020确定单个源词是否对应于预设类型。响应于单个源词对应于预设类型，句子分析器1020将每一个子源词的位置信息映射到单个源词。例如，句子分析器1020将“H@@”的位置信息2、“u@@”的位置信息3、“tt@@”的位置信息4以及“on”的位置信息5映射到“Hutton”。句子分析器1020生成包括子源词中的每一个的映射的位置信息和单个源词的副本列表。表5示出与源句子1010相关联的副本列表的示例。

表5

位置信息	源词
		2	Hutton
3	Hutton
		4	Hutton
5	Hutton

翻译器对包括子源词的源句子1010进行编码。翻译器可以是例如子词级NMT模型。

翻译器在第一目标词“Dear”被确定之后计算用于确定第二目标词的特征值a_2,1，a_2,2，…，a_2,n。由于子源词“H@@”包括标签，所以第二目标词包括标签。换句话说，第二目标词对应于子词单元的子目标词。作为第一确定的子目标词sub₁的第二目标词为“H@@”。类似地，翻译器按照顺序次序确定子目标词sub₂至sub₄。这里，sub₂是“u@@”，sub₃是“tch@@”，sub₃是“et”。

在这个示例中，a_2,2是子目标词“H@@”的特征值(例如a_2,1，a_2,2，…,a_2,n)中的最大特征值，a_3,3是子目标词“u@@”的特征值(例如，a_3,1，a_3,2，…,a_3,n)中的最大特征值。此外，a_4,4是子目标词“tch@@”的特征值(例如a_4,1，a_4,2，…,a_4,n)中的最大特征值，a_5,5是子目标词“et”的特征值(例如，a_5,1，a_5,2，…,a_5,n)中的最大特征值。上面描述了确定特征值中的最大特征值，因此为简洁起见，在这里省略确定最大特征值的更详细的和重复的描述。

翻译器基于确定的子目标词来确定目标词。在图10的示例中，解码不正确，因此如“H@@”、“u@@”、“tch@@”以及“et”这样的子目标词被确定。因此，不对应于原始源词的目标词“Hutchet”被确定并且翻译错误发生。

当目标词基于子目标词被确定时或者当目标句子被完成时，校正器1030进行操作。当目标词基于子目标词被确定时，校正器1030如下进行操作。

在一个示例中，当目标词“Hutchet”被确定时，校正器1030基于每一个子目标词的最大特征值的位置信息是否包括在副本列表中来校正目标词“Hutchet”。换句话说，根据这个示例，在目标句子被完成之前，校正器1030可在目标词“Hutchet”被确定之后立即校正目标词“Hutchet”。参考图10中示出的副本列表，a_2,2的位置信息2、a_3,3的位置信息3、a_4,4的位置信息4以及a_5,5的位置信息5包括在副本列表中。在这种情况下，校正器1030用“Hutton”来替换目标词“Hutchet”。

根据另一示例，校正器1030可确定子目标词的各个最大特征值的代表值。例如，校正器1030可选择子目标词的最大特征值中的任何一个。校正器1030可确定代表值的位置信息是否包括在副本列表中。响应于代表值的位置信息包括在副本列表中，校正器1030可用映射到代表值的位置信息的源词来替换目标词。在图10的示例中，校正器1030确定a_2,2，a_3,3，a_4,4以及a_5,5中的代表值。例如，校正器1030将a_2,2，a_3,3，a_4,4和a_5,5中的最大值或者最接近a_2,2，a_3,3，a_4,4和a_5,5的平均值的值确定为代表值。在这种情况下，响应于校正器1030将a_2,2确定为代表值，校正器1030确定a_2,2的位置信息2是否包括在副本列表中。由于a_2,2的位置信息2包括在副本列表中，因此校正器1030用映射到位置信息2的源词“Hutton”来替换目标词“Hutchet”。

因此，原始源词“Hutton”包括在目标句子中，从而翻译错误可被减少。

当目标词基于子目标词被确定时，校正器1030如上所述进行操作。当目标句子被完成时，校正器1030如下进行操作。在一个示例中，翻译器或者校正器1030对目标句子“Dear H@@u@@tch@@et,your order…”进行操作，并将基于子词的目标句子转换为基于词的句子。例如，翻译器或者校正器1030基于“H@@”、“u@@”、“tch@@”以及“et”来确定“Hutchet”，并将目标句子“Dear H@@u@@tch@@et,your order…”转换为“Dear Hutchet,your order…”。

校正器1030从通过转换基于子词的目标句子获得的目标句子，选择对应于预设类型的目标词。例如，校正器1030从通过转换获得的目标句子，选择对应于未在字典中登记的词或者对应于专有名词的“Hutchet”。对于校正器1030的随后的操作，可参考当基于子目标词确定目标词时执行的校正器1030的操作的描述。因此，为简洁起见，这里省略这样的操作的更详细和重复的描述。

<翻译字符单元(character-unit)源句子：字符级(character-level)机器翻译>

根据另一示例，翻译系统可翻译字符单元源句子(还被称为字符级句子)。翻译系统可使用与上面参考图10描述的子词处理方法类似的方法来处理字符单元源句子中的每一个字符(还被称为子源字符)，并完成字符单元源句子的翻译。以下将详细描述其示例。

例如，当翻译系统接收原始源句子作为输入时，翻译系统将标签@输入到原始源句子中的词间隔的位置，以将原始源句子转换为字符单元源句子/>这里，翻译系统认为@是单个字符，并且_被用作用于区分字符单元源句子中的每一个字符的指示符。

句子分析器通过将字符单元源句子中的字符“H”的位置信息6和字符“n”的位置信息11映射到原始源句子中的源词“Hutton”，来生成下面表6中所示的副本列表。这里，每一个子源词的位置信息与源词的映射可适用于每一个字符的位置信息与源词的映射，因此，为简洁起见，这里将省略更详细和重复的描述。

表6

位置信息	源词
		6	Hutton
7	Hutton
		8	Hutton
9	Hutton
		10	Hutton
11	Hutton

翻译器对字符单元源句子进行编码，并基于编码的结果执行解码。翻译器可以是例如字符级NMT模型。每当翻译器执行解码时，翻译器确定目标字符。这里，翻译器可使用与参考图3至图5描述的由翻译器执行的目标词确定方法或参考图10描述的由翻译器执行的子目标词确定方法类似的方法来确定目标字符，因此，为简洁起见，这里将省略更详细和重复的描述。

当翻译器通过执行解码来确定目标字符“H_u_t_c_h_e_t”时，翻译器基于确定的目标字符来确定目标词“Hutchet”。这里，校正器用包括在表6的副本列表中的源词“Hutton”来替换目标词“Hutchet”。换句话说，校正器在翻译被完成之前用源词“Hutton”来替换目标词“Hutchet”。可选择地，当将字符单元源句子翻译成字符单元目标句子被完成并且字符单元目标句子被转换为词单元目标句子时，校正器可校正词单元目标句子。例如，当字符单元目标句子是“D_e_a_r_@_H_u_t_c_h_e_t_,@_y_o_u_r_@_o_r_d_e_r...”时，翻译器将字符单元目标句子转换为词单元目标句子“Dear Hutchet,your order...”。这里，校正器将词单元目标句子中的目标词“Hutchet”替换为包括在表6的副本列表中的源词“Hutton”。

以上参考图6和图10描述的校正器的操作可适用于校正器如何用“Hutton”来替换“Hutchet”，因此，为简洁起见，将省略更详细和重复的描述。

图11是示出翻译设备1100的示例的示图。

参考图11，翻译设备1100包括控制器或处理器1110和存储器1120。翻译设备1100对应于这里描述的翻译系统。

存储器1120包括可由控制器1110执行的一个或多个指令。

当由控制器1110执行指令时，控制器1110从源句子选择源词。控制器1110生成包括映射到选择的源词的选择的源词的位置信息的映射信息。此外，控制器1110基于映射信息和目标词的一个或多个特征值的位置信息来校正目标词。

参考图1至图10提供的描述可适用于翻译设备1100，因此，为简洁起见，这里省略更详细和重复的描述。

图12是示出翻译方法的示例的流程图。

以下将参考图12描述的翻译方法可由这里描述的翻译设备或翻译系统执行。

参考图12，在操作1210中，翻译设备或翻译系统从源句子选择源词。

在操作1220中，翻译设备或翻译系统生成包括映射到选择的源词的选择的源词的位置信息的映射信息。

在操作1230中，翻译设备或翻译系统基于与目标词的一个或多个特征值相关联位置信息和映射信息来校正目标词。

参考图1至图11提供的描述可适用于参考图12描述的操作，因此，为简洁起见，这里省略更详细和重复的描述。

图13是示出翻译方法的另一示例的流程图。

以下将参考图13描述的翻译方法可由这里描述的翻译设备或翻译系统执行。

参考图13，在操作1310中，翻译设备或翻译系统从源句子选择源词。

在操作1320中，翻译设备或翻译系统生成包括映射到选择的源词的选择的源词的位置信息的映射信息。

在操作1330中，翻译设备或翻译系统通过翻译器来确定目标词。

在操作1340中，翻译设备或翻译系统基于与目标词的一个或多个特征值相关联位置信息是否包括在映射信息中来校正目标词。

参考图1至图11提供的描述可适用于参考图13描述的操作，因此，为简洁起见，这里省略更详细和重复的描述。

图14是示出翻译方法的另一示例的流程图。

以下将参考图14描述的翻译方法可由这里描述的翻译设备或翻译系统执行。

参考图14，在操作1410中，翻译设备或翻译系统从源句子选择源词。

在操作1420中，翻译设备或翻译系统生成包括映射到选择的源词的选择的源词的位置信息的映射信息。

在操作1430中，翻译设备或翻译系统通过翻译器来完成目标句子。

在操作1440中，翻译设备或翻译系统基于与从目标句子选择的目标词的一个或多个特征值相关联的位置信息是否包括在映射信息中来校正选择的目标词。

参考图1至图11提供的描述可适用于参考图14描述的操作，因此，为简洁起见，这里省略更详细和重复的描述。

通过硬件组件来实现执行本申请中描述的操作的图1中的句子分析器110、翻译器120和校正器130、图3中的编码器310、中间网络320和解码器330、图11中的控制器1110和存储器1120，其中，硬件组件被配置为执行本申请中描述的由硬件组件执行的操作。可被用于执行本申请中描述的操作的硬件组件的示例在适当的情况下包括：控制器、传感器、生成器、驱动器、存储器、比较器、算术逻辑单元、加法器、减法器、乘法器、除法器、积分器以及被配置为执行本申请中描述的操作的任何其他电子组件。在其他示例中，通过计算硬件(例如，通过一个或多个处理器或计算机)来实现执行本申请中描述的操作的一个或多个硬件组件。处理器或计算机可通过一个或多个处理元件(诸如，逻辑门阵列、控制器和算术逻辑单元、数字信号处理器、微型计算机、可编程逻辑控制器、现场可编程门阵列、可编程逻辑阵列、微处理器或者被配置为以限定的方式响应并执行指令以实现期望的结果的任何其他装置或装置的组合)来实现。在一个示例中，处理器或计算机包括或连接到存储由处理器或计算机执行的指令或软件的一个或多个存储器。通过处理器或计算机实现的硬件组件可执行指令或软件(诸如，操作系统(OS)以及在OS上运行的一个或多个软件应用)，以执行本申请中描述的操作。硬件组件还可响应于指令或软件的执行来访问、操控、处理、创建和存储数据。为了简明起见，单数术语“处理器”或“计算机”可用于本申请中描述的示例的描述，但是在其他示例中，多个处理器或计算机可被使用，或者处理器或计算机可包括多个处理元件或多种类型的处理元件或者两者。例如，单个硬件组件或者两个或更多个硬件组件可通过单个处理器或者两个或更多个处理器或者处理器和控制器来实现。一个或多个硬件组件可通过一个或多个处理器或者处理器和控制器来实现，一个或多个其他硬件组件可通过一个或多个其他处理器或者另一处理器和另一控制器来实现。一个或多个处理器或者处理器和控制器可实现单个硬件组件或者两个或更多个硬件组件。硬件组件可具有任意一个或多个不同的处理配置，其示例包括：单个处理器、独立处理器、并行处理器、单指令单数据(SISD)多处理、单指令多数据(SIMD)多处理、多指令单数据(MISD)多处理和多指令多数据(MIMD)多处理。

通过计算硬件(例如，通过被实现为如上面描述地执行指令或软件以执行本申请中描述的由方法执行的操作的一个或多个处理器或者计算机)来执行图2、图4至图10以及图12至图14所示的执行本申请中描述的操作的方法。例如，单个操作或者两个或更多个操作可通过单个处理器或者两个或更多个处理器或者处理器和控制器来执行。一个或多个操作可通过一个或多个处理器或者处理器和控制器来执行，一个或多个其他操作可通过一个或多个其他处理器或者另一处理器和另一控制器来执行。一个或多个处理器或者处理器和控制器可执行单个操作或者两个或更多个操作。

用于控制计算硬件(例如，一个或多个处理器或计算机)实现硬件组件并且执行如上所述的方法的指令或软件可被编写为计算机程序、代码段、指令或它们的任意组合，以单独地或共同地指示或者配置一个或多个处理器或计算机作为用于执行由硬件组件执行的操作和如上所述的方法的机器或专用计算机进行操作。在一个示例中，指令或软件包括由一个或多个处理器或者计算机直接执行的机器代码(诸如，由编译器生成的机器代码)。在另一示例中，指令或软件包括由一个或多个处理器或计算机使用解释器执行的高级代码。可基于附图中所示的框图和流程图以及说明书(其公开了用于执行由硬件组件执行的操作和如上所述的方法的算法)中的相应描述，使用任意编程语言来编写指令或软件。

用于控制计算硬件(例如，一个或多个处理器或计算机)实现硬件组件并且执行如上所述的方法的指令或软件以及任何关联的数据、数据文件和数据结构可被记录、存储或固定在一个或多个非暂时性计算机可读存储介质中，或者可被记录、存储或固定在一个或多个非暂时性计算机可读存储介质上。非暂时性计算机可读存储介质的示例包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-R LTH、BD-RE、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置，其中，该任何其他装置被配置为：以非暂时性方式存储指令或软件以及任何关联的数据、数据文件和数据结构，并向一个或多个处理器或者计算机提供指令或软件以及任何关联的数据、数据文件和数据结构，使得一个或多个处理器或者计算机能够执行指令。在一个示例中，指令或软件以及任何关联的数据、数据文件以及数据结构分布于联网的计算机系统上，使得指令和软件以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式的方式被存储、访问和执行。

虽然本公开包括特定的示例，但是本领域普通技术人员将清楚，在不脱离权利要求和它们的等同物的精神和范围的情况下，可在这些示例中进行形式和细节的各种改变。在此描述的示例仅在描述性意义上被考虑，而不是为了限制的目的。每个示例中的特征或方面的描述被认为可适用于其他示例中的类似特征或方面。如果描述的技术以不同的顺序被执行，和/或如果描述的系统、架构、装置或电路中的组件以不同的方式被结合和/或由其他部件或它们的等同物替换或补充，则可实现适当的结果。因此，本公开的范围不是由具体实施方式限定，而是由权利要求及其等同物限定，并且权利要求及其等同物的范围内的所有变化将被解释为包括在本公开中。

Claims

1.一种翻译方法，包括：

从源句子选择源词；

生成包括选择的源词的位置信息的映射信息，其中，选择的源词的位置信息被映射到源句子中的选择的源词；

基于通过翻译源句子而生成的目标词的特征值的位置信息和映射信息来校正目标词，

其中，校正目标词的步骤包括：

确定特征值的位置信息是否包括在映射信息中；

响应于特征值的位置信息包括在映射信息中，用映射到特征值的位置信息的源词来替换目标词。

2.根据权利要求1所述的翻译方法，其中，校正目标词的步骤包括：

响应于目标词基于子目标词被确定，确定每一个子目标词的最大特征值；

响应于每一个最大特征值的位置信息包括在映射信息中，用映射到每一个最大特征值的位置信息的源词来替换目标词。

3.根据权利要求1所述的翻译方法，其中，校正目标词的步骤包括：

从通过完成源句子的翻译而生成的目标句子，选择对应于预设类型的目标词；

确定选择的目标词的最大特征值的位置信息是否包括在映射信息中；

响应于最大特征值的位置信息包括在映射信息中，用映射到最大特征值的位置信息的源词来替换选择的目标词。

4.根据权利要求1所述的翻译方法，其中，校正目标词的步骤包括：

基于通过完成源句子的翻译而生成的目标句子中的子目标词来确定目标词；

响应于确定的目标词对应于预设类型，确定子目标词的各个最大特征值中的代表值；

确定代表值的位置信息是否包括在映射信息中；

响应于代表值的位置信息包括在映射信息中，用映射到代表值的位置信息的源词来替换确定的目标词。

5.根据权利要求1所述的翻译方法，其中，选择的源词对应于专有名词、数字、包括数字和字符的词、用目标语言表达的词、未在字典中登记的词、和短语中的任何一个，所述短语包括专有名词、数字、包括数字和字符的词、用目标语言表达的词和未在字典中登记的词中的任何一个或者任何两个或更多个的任何组合。

6.根据权利要求1所述的翻译方法，还包括：

预处理选择的源词。

7.根据权利要求6所述的翻译方法，其中，预处理选择的源词的步骤包括改变选择的源词的标音。

8.根据权利要求1所述的翻译方法，还包括：

响应于源句子为子词级句子或者字符级句子，将源句子中的子源词或者子源字符转换为单个源词。

9.根据权利要求8所述的翻译方法，其中，生成映射信息的步骤包括：响应于所述单个源词对应于预设类型，将源句子中的子源词或者子源字符中的每一个的位置信息映射到所述单个源词。

10.根据权利要求1所述的翻译方法，其中，目标词通过源句子的神经网络机器翻译而生成。

11.根据权利要求1所述的翻译方法，其中，在完成将源句子翻译成目标句子之后，执行校正目标词的步骤。

12.根据权利要求1所述的翻译方法，其中，在翻译源句子的同时并且在完成源句子的翻译之前，执行校正目标词的步骤。

13.根据权利要求1所述的翻译方法，其中，源词的位置信息表示源句子中的源词的位置。

14.根据权利要求1所述的翻译方法，其中，特征值表示在执行机器翻译中源词对确定目标词贡献的程度。

15.一种存储当由处理器执行时使得处理器执行如权利要求1所述的方法的指令的非暂时性计算机可读存储介质。

16.一种翻译设备，包括：

控制器；

存储器，存储能够由控制器执行的指令，

其中，控制器被配置为：响应于执行所述指令，

从源句子选择源词，

生成包括选择的源词的位置信息的映射信息，其中，选择的源词的位置信息被映射到源句子中的选择的源词，

其中，控制器被配置为：确定特征值的位置信息是否包括在映射信息中；响应于特征值的位置信息包括在映射信息中，用映射到特征值的位置信息的源词来替换目标词。

17.根据权利要求16所述的翻译设备，其中，控制器被配置为：响应于目标词基于子目标词被确定，确定每一个子目标词的最大特征值；响应于每一个最大特征值的位置信息包括在映射信息中，用映射到每一个最大特征值的位置信息的源词来替换目标词。

18.根据权利要求16所述的翻译设备，其中，

控制器被配置为：响应于对应于预设类型的目标词从通过完成源句子的翻译而生成的目标句子被选择，确定选择的目标词的最大特征值的位置信息是否包括在映射信息中，

控制器被配置为：响应于选择的目标词的最大特征值的位置信息包括在映射信息中，用映射到最大特征值的位置信息的源词来替换选择的目标词。

19.根据权利要求16所述的翻译设备，其中，控制器被配置为：

响应于确定的目标词对应于预设类型，确定子目标词的各个最大特征值中的代表值，并确定代表值的位置信息是否包括在映射信息中；

20.根据权利要求16所述的翻译设备，其中，选择的源词对应于专有名词、数字、包括数字和字符的词、用目标语言表达的词、未在字典中登记的词、和短语中的任何一个，所述短语包括专有名词、数字、包括数字和字符的词、用目标语言表达的词和未在字典中登记的词中的任何一个或者任何两个或更多个的任何组合。

21.根据权利要求16所述的翻译设备，其中，控制器还被配置为预处理选择的源词。

22.根据权利要求21所述的翻译设备，其中，控制器被配置为改变选择的源词的标音。

23.根据权利要求16所述的翻译设备，其中，控制器还被配置为：响应于源句子为子词级句子或字符级句子，将源句子中的子源词或子源字符转换为单个源词。

24.根据权利要求23所述的翻译设备，其中，控制器被配置为：响应于所述单个源词对应于预设类型，将源句子中的子源词或者子源字符中的每一个的位置信息映射到所述单个源词。

25.根据权利要求16所述的翻译设备，其中，目标词通过源句子的神经网络机器翻译而生成。

26.根据权利要求16所述的翻译设备，其中，控制器被配置为在完成将源句子翻译成目标句子之后校正目标词。

27.根据权利要求16所述的翻译设备，其中，控制器被配置为在翻译源句子的同时并且在完成源句子的翻译之前校正目标词。

28.根据权利要求16所述的翻译设备，其中，特征值表示在执行机器翻译中源词对确定目标词贡献的程度。

29.根据权利要求16所述的翻译设备，其中，源词的位置信息表示源句子中的源词的位置。

30.一种翻译系统，包括：

句子分析器，被配置为从源句子选择源词，并生成包括映射到源句子中的选择的源词的选择的源词的位置信息的映射信息；

翻译器，被配置为基于源句子的翻译来确定一个或多个目标词；

校正器，被配置为每当所述一个或多个目标词中的目标词被确定时，基于确定的目标词的特征值的位置信息和映射信息来确定是否校正确定的目标词，或者被配置为响应于目标句子被翻译器完成，基于所述一个或多个目标词中的从目标句子选择的目标词的特征值的位置信息和映射信息来确定是否校正选择的目标词，

校正器被配置为：响应于确定的目标词的最大特征值的位置信息包括在映射信息中，用映射到确定的目标词的最大特征值的位置信息的源词来替换确定的目标词，或者响应于选择的目标词的最大特征值的位置信息包括在映射信息中，用映射到选择的目标词的最大特征值的位置信息的源词来替换选择的目标词。