CN110298045B

CN110298045B - 机器翻译方法、装置、设备及存储介质

Info

Publication number: CN110298045B
Application number: CN201910471418.3A
Authority: CN
Inventors: 熊皓; 张睿卿; 何中军; 李芝; 吴华; 王海峰
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-05-31
Filing date: 2019-05-31
Publication date: 2023-03-24
Anticipated expiration: 2039-05-31
Also published as: CN110298045A

Abstract

本申请实施例提供一种机器翻译方法、装置、设备及存储介质。包括：获取待翻译语句，待翻译语句包括：P个待翻译词；获取当前待翻译词的前一个待翻译词对应的M个第一候选词，以及，前一个待翻译词在N个位置上的概率；根据M个第一候选词和前一个待翻译词在N个位置上的概率，确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率；根据P个待翻译词中每个待翻译词为对应各个候选词的概率，对待翻译语句进行翻译。从而可以提高翻译准确率。

Description

机器翻译方法、装置、设备及存储介质

技术领域

本申请实施例涉及翻译技术领域，尤其涉及一种机器翻译方法、装置、设备及存储介质。

背景技术

机器翻译是人们常常用到的终端功能，其主要涉及候选词选择和词序推定。所谓候选词选择指的是为待翻译词选择对应的候选词。所谓词序推定指的是翻译顺序。

目前翻译设备常常采用自左向右或者自右向左的翻译顺序，即翻译设备采用固定的顺序，根据当前待翻译词的前一个词对应的候选词确定当前待翻译词对应的候选词。由于前一个词产生的预测错误可能造成待翻译词的翻译错误，即越往后翻译，出错的概率越高，但是一条待翻译语句中重要词汇的位置未必位于靠前的位置，因此这种按照固定顺序翻译的方式，可能造成待翻译语句中的重要词汇无法被准确翻译的问题，从而造成翻译准确率低的问题。

发明内容

本申请实施例提供一种机器翻译方法、装置、设备及存储介质。从而可以提高翻译准确率。

第一方面，本申请提供一种机器翻译方法，包括：获取待翻译语句，待翻译语句包括：P个待翻译词，P为大于1的整数；获取当前待翻译词的前一个待翻译词对应的M个第一候选词，以及，前一个待翻译词在N个位置上的概率，M和N均为大于1的整数，当前待翻译词为P个待翻译词中除第一个待翻译词之外的任一待翻译词；根据M个第一候选词和前一个待翻译词在N 个位置上的概率，确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率；根据P个待翻译词中每个待翻译词为对应各个候选词的概率，对待翻译语句进行翻译。

基于此，翻译设备并不是采用固定顺序进行翻译的，而是基于前一个待翻译词的条件概率和前一个待翻译词在N个位置上的概率确定当前待翻译词为各个候选词的概率，并且确定当前待翻译词为各个候选词在N个位置上的概率，可以确定最优的翻译顺序进行翻译，从而可以提高翻译准确率。

可选地，通过公式(1)和公式(2)确定当前待翻译词为各个第二候选词的概率：

其中，y_t表示当前待翻译词，e_i，e_j表示当前待翻译词的第二候选词， y_t-1表示当前待翻译词的前一个待翻译词，a表示前一个待翻译词对应的任一个第一候选词，q(pos＝n|y_t-1＝a)表示当y_t-1＝a时，y_t-1在位置n上的概率， P(y_t＝e_i|y_t-1＝a)表示在不考虑y_t-1的位置且在y_t-1＝a的条件下，y_t＝e_i出现的概率，P'(y_t＝e_i|y_t-1＝a)为在考虑y_t-1的位置且y_t-1＝a的条件下，y_t＝e_i出现的概率，P”(y_t＝e_i|y_t-1＝a)是对P'(y_t＝e_i|y_t-1＝a)经过归一化处理之后，得到的 y_t＝e_i出现的概率。

通过公式(1)和(2)可以准确的确定当前待翻译词为各个第二候选词的概率。

可选地，方法还包括：获取词表中各个词在N个位置上的概率分布，根据概率分布确定当前待翻译词在N个位置上的概率。通过该方法可以确定当前待翻译词在N个位置上的概率，即翻译设备并不是采用固定顺序进行翻译的，而是根据该概率确定最优翻译顺序，进而提高翻译准确率。

根据P个待翻译词中每个待翻译词为对应各个候选词的概率，对待翻译语句进行翻译的一种可选方式包括：针对P个待翻译词中最后一个待翻译词，选择概率最大的候选词；根据概率最大的候选词以及P个待翻译词中除最后一个待翻译词为对应各个候选词的概率，依次确定最后一个待翻译词之前的各待翻译词对应的候选词。

根据P个待翻译词中每个待翻译词为对应各个候选词的概率，对待翻译语句进行翻译的另一种可选方式包括：按照P个待翻译词中最后一个待翻译词对应的各个候选词的概率由大到小的顺序，选择前Q个最大的概率对应的候选词，Q为大于1的整数；针对前Q个最大的概率对应的每个候选词，确定之前的各个待翻译词对应的各候选词对应的概率；分别计算前Q个最大的概率中每个概率与之前的各个待翻译词对应的各候选词对应的概率之和，得到概率和；分别计算概率和与待翻译语句的长度的商，以得到概率平均值；将概率平均值最大的翻译语句确定为待翻译语句对应的翻译语句。

由上述两种可选方式可知，根据P个待翻译词中每个待翻译词为对应各个候选词的概率，对待翻译语句进行翻译，即考虑了待翻译词与前一个待翻译词的关联性，以及在各个位置上的概率，进而可以提高翻译准确率。

可选地，待翻译语句中第一个待翻译词为对应各个候选词的概率，以及，第一个待翻译词在N个位置上的概率均为预设概率。

下面将提供一种翻译装置、设备、存储介质及计算机程序产品，其内容和效果可参考上述方法部分，对此不再赘述。

第二方面，本申请提供一种翻译装置，包括：

第一获取模块，用于获取待翻译语句，待翻译语句包括：P个待翻译词， P为大于1的整数。

第二获取模块，用于获取当前待翻译词的前一个待翻译词对应的M个第一候选词，以及，前一个待翻译词在N个位置上的概率，M和N均为大于1 的整数，当前待翻译词为P个待翻译词中除第一个待翻译词之外的任一待翻译词。

第一确定模块，用于根据M个第一候选词和前一个待翻译词在N个位置上的概率，确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率。

翻译模块，用于根据P个待翻译词中每个待翻译词为对应各个候选词的概率，对待翻译语句进行翻译。

第三方面，本申请提供一种翻译设备，包括：存储器和处理器。

存储器用于存储计算机指令。

处理器用于执行计算机指令，以实现上述的机器翻译方法。

本申请第四方面提供一种存储介质，包括：可读存储介质和计算机指令，所述计算机指令存储在所述可读存储介质中。所述计算机指令用于实现第一方面任一实现方式提供的机器翻译方法。

本发明第五方面提供一种程序产品，该程序产品包括计算机指令(即计算机程序)，该计算机指令存储在可读存储介质中。翻译设备的至少一个处理器可以从可读存储介质读取该计算机指令，至少一个处理器执行该计算机指令使得翻译设备实施前述第一方面任一实施方式提供的机器翻译方法。

本申请实施例提供的机器翻译方法、装置、设备及存储介质。由于考虑到当前待翻译词在前一个待翻译词对应的候选词的条件概率，以及，前一个待翻译词在N个位置上的概率，基于此，确定当前待翻译词为各个候选词的概率，并且确定当前待翻译词为各个候选词在N个位置上的概率，从而可以确定最优的翻译顺序进行翻译，进而可以提高翻译准确率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1为本申请一实施例提供的一种机器翻译方法的流程图；

图2为本申请一实施例提供的确定当前待翻译词在N个位置上的概率的方法流程图；

图3为本申请一实施例提供的翻译顺序示意图；

图4为本申请一实施例提供的翻译过程示意图；

图5为本申请一实施例提供的对待翻译语句进行翻译的方法流程图；

图6为本申请另一实施例提供的对待翻译语句进行翻译的方法流程图；

图7为本申请一实施例提供的一种翻译装置的示意图；

图8为本申请一实施例提供的翻译设备的示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

如上所述，目前翻译设备采用固定的顺序，根据当前待翻译词的前一个词对应的候选词确定当前待翻译词对应的候选词。由于前一个词产生的预测错误可能造成待翻译词的翻译错误，即越往后翻译，出错的概率越高，但是一条待翻译语句中重要词汇的位置未必位于靠前的位置，因此这种按照固定顺序翻译的方式，可能造成待翻译语句中的重要词汇无法被准确翻译的问题，从而造成翻译准确率低的问题。

为了提高翻译准确率，本申请提供一种机器翻译方法、装置、设备及存储介质。

图1为本申请一实施例提供的一种机器翻译方法的流程图，该方法可以应用于翻译设备，该翻译设备可以是计算机、平板、手机等智能设备中的部分或者全部，该智能设备可以安装有翻译应用(Application，APP)或者用户可以在智能设备上登录浏览器，通过浏览器使用翻译软件，下面以该方法的执行主体为翻译设备对该方法进行说明，如图1所示，该方法包括如下步骤：

步骤S101：翻译设备获取待翻译语句，待翻译语句包括：P个待翻译词， P为大于1的整数。

步骤S102：翻译设备获取当前待翻译词的前一个待翻译词对应的M个第一候选词，以及，前一个待翻译词在N个位置上的概率，M和N均为大于 1的整数，当前待翻译词为P个待翻译词中除第一个待翻译词之外的任一待翻译词。

步骤S103：翻译设备根据M个第一候选词和前一个待翻译词在N个位置上的概率，确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率。

步骤S104：翻译设备根据P个待翻译词中每个待翻译词为对应各个候选词的概率，对待翻译语句进行翻译。

其中，P个待翻译词中当前待翻译词为对应各个候选词的概率是在当前待翻译词的前一个待翻译词为对应各个候选词的条件下，当前待翻译词为对应各个候选词的概率，当前待翻译词为P个待翻译词中除第一个待翻译词之外的任一个待翻译词。

针对步骤S102和步骤S103进行说明：

所述待翻译语句中第一个待翻译词为对应各个候选词的概率，以及，第一个待翻译词对应的各个候选词在N个位置上的概率均为预设概率。其中，第一个待翻译词为对应各个候选词的概率可以相同，也可以不同。第一个待翻译词对应的各个候选词在N个位置上的概率可以相同，也可以不同。本申请对此不做限制。

或者，

假设第一个待翻译词的前一个待翻译词对应的候选词为BOS，前一个待翻译词在位置-1(该位置不属于所述N个位置)上的概率为1，在其他位置上的概率为0。基于此，根据候选词BOS和前一个待翻译词对应的各个候选词在N个位置上的概率0，确定第一个待翻译词在候选词BOS的条件下为各个候选词的概率。

具体地，通过公式(1)和公式(2)确定第一个待翻译词为各个候选词的概率：

其中，y₀表示第一个待翻译词，e_i，e_j表示第一个待翻译词的候选词， y_-1表示第一个待翻译词的前一个待翻译词，q(pos＝n|y_-1＝BOS)表示当 y_-1＝BOS时，y_-1在位置n上的概率，P(y₀＝e_i|y_-1＝BOS)表示在不考虑y_-1的位置且在y_-1＝BOS的条件下，y₀＝e_i出现的概率，P'(y₀＝e_i|y_-1＝BOS)为在考虑 y_-1的位置且y_-1＝BOS的条件下，y₀＝e_i出现的概率，P”(y₀＝e_i|y_-1＝BOS)是对 P'(y₀＝e_i|y_-1＝BOS)经过归一化处理之后，得到的y₀＝e_i出现的概率，即最终确定的y₀＝e_i出现的概率。

需要说明的是，在本申请中，第一个待翻译词指的是第一个被翻译的词，它可以是物理意义上的位于待翻译语句中第一个位置上的待翻译词，也可以不是位于待翻译语句中第一个位置上的待翻译词。

在本申请中，待翻译语句中每个待翻译词对应的候选词一般不同，例如：待翻译语句为：“A人物与B人物举行会谈”，“A人物”、“与”、“B 人物”、“举行”、“会谈”对应的候选词均不同。

示例性地，针对待翻译语句中除第一个待翻译词之外的其他待翻译词，翻译设备确定各个待翻译词为对应候选词的概率的方式相同，并且翻译设备确定各个待翻译词对应的各个候选词在N个位置上的概率也相同。因此，在本申请中，假设当前待翻译词为除第一个待翻译词之外的任一个待翻译词，其前一个待翻译词对应的候选词以及在N个位置上的概率已经确定。

在本申请中，前一个待翻译词指的不是物理意义上前一个位置上的待翻译词，而是在当前待翻译词之前待翻译的词，这两个词的翻译时刻相邻。

基于此，翻译设备可以通过公式(3)和公式(4)确定当前待翻译词为各个第二候选词的概率：

上述过程假定y_t-1＝a，由于y_t-1还可以取其他第一候选词，基于此，翻译设备还可以采用上述过程确定当前待翻译词在其他第一候选词的条件下为各个第二候选词的概率。

需要说明的是，当前待翻译词在不同第一候选词的条件下对应的第二候选词可能不同，例如：当第一候选词为“我”时，第二候选词可能为“是”，当第一候选词为“和”时，第二候选词可能为“你”。当前待翻译词在不同第一候选词的条件下对应的第二候选词也可能相同，例如：当第一候选词为“我”时，第二候选词可能为“是”，当第一候选词为“你”时，第二候选词可能为“是”。

值得一提的是，上述公式(1)中的P(y₀＝e_i|y_-1＝BOS)、公式(3)中的 P(y_t＝e_i|y_t-1＝a)还涉及参数θ₁，公式(1)中的q(pos＝n|y_-1＝BOS)、公式(3) 中的q(pos＝n|y_t-1＝a)还涉及参数θ₂。

其中，θ₁包含编码端，解码端(即上述的翻译设备侧)，翻译模型中的 softmaxlayer预测层模块的所有模型参数；θ₂和θ₁的不同之处为在softmax layer即最后一层预测具体分类时，θ₁包含的参数为W1(其中，W1＝d*V)，而θ₂包含的参数为W2(其中，W2＝d*C+V*C)。d为翻译模型的大小，一般为1024，V是词表大小，一般为30000，而C为可预测的位置数值，一般为200，表示当前待翻译词出现的位置在0～200之间。

图2为本申请一实施例提供的确定当前待翻译词在N个位置上的概率的方法流程图，如图2所示，该方法包括如下步骤：

步骤S201：翻译设备获取词表中各个词在N个位置上的概率分布。

步骤S202：翻译设备根据概率分布确定当前待翻译词在N个位置上的概率。

示例性地，各个词在N个位置上的概率分布可以是多项式分布或者是正态分布等，本申请对此不做限制。

例如：q(pos|y_t)＝Multinomial(0,P)，q(pos|y_t)表示y_t在位置pos(1～N)的概率，Multinomial表示多项式分布，0和P表示多项式分布涉及的参数。

翻译设备根据概率分布确定当前待翻译词对应的各个候选词在N个位置上的概率，例如，翻译设备确定当前待翻译词“我”在第一个位置上的概率为0.95，在第二个位置上的概率为0.1。

图3为本申请一实施例提供的翻译顺序示意图，如图3所示，这里的翻译顺序并不是从左向右的翻译顺序或者从右向左的翻译顺序，而是根据上述的概率分布确定的3-1-2-0-4的顺序。

图4为本申请一实施例提供的翻译过程示意图，如图4所示，待翻译语句为“A人物与B人物举行会谈”，经过编码器编码之后，解码器(即上述的翻译设备)通过内部的翻译模型(包括多个神经网络层)对待翻译语句进行翻译，例如，在t＝0时刻，神经网络层1翻译出了“B人物”对应的英文，以及，神经网络层2根据“B人物”对应的英文输出了“B人物”对应的位置“3”，实际上，“B人物”对应的英文只是一种候选词，在测试过程中，“B人物”对应的英文还可以是其他的候选词，并且对应相应的位置。在 t＝1时刻，神经网络层1翻译出了“A人物”对应的英文，以及，神经网络层 2输出了“A人物”对应的位置“1”，如图4所示，解码器在神经网络层1，根据t＝0时刻，神经网络层1输出的“B人物”对应的英文，以及，t＝0时刻，神经网络层1输出的位置“3”确定的，在t＝1时刻，神经网络层2根据“A 人物”对应的英文输出了“A人物”对应的位置“1”。

针对步骤S104进行说明：

示例性地，图5为本申请一实施例提供的对待翻译语句进行翻译的方法流程图，如图5所示，该方法包括如下步骤：

步骤501：翻译设备针对P个待翻译词中最后一个待翻译词，选择概率最大的候选词。

步骤502：翻译设备根据概率最大的候选词以及P个待翻译词中除最后一个待翻译词为对应各个候选词的概率，依次确定最后一个待翻译词之前的各待翻译词对应的候选词。

其中，由于当前待翻译词对应的概率为当前待翻译词在每个第一候选词 (当前待翻译词的前一个待翻译词对应的候选词)的条件下为各个第二候选词的概率，即当前待翻译词对应的概率为条件概率，因此，当翻译设备针对最后一个待翻译词选择概率最大的候选词之后，基于该条件概率，可以确定最后的候选词对应的第一候选词(为了方面起见，将该第一候选词称为目标候选词)。再根据所述前一个待翻译词对应的条件概率，当前一个待翻译词为目标候选词时，选择最大的条件概率对应的所述前一个待翻译词的前一个待翻译词对应的候选词，需要说明的是，每个待翻译词可以根据上述确定位置概率的方法，选择概率最大的位置，以此类推，确定最后一个待翻译词之前的各待翻译词对应的候选词。

示例性地，图6为本申请另一实施例提供的对待翻译语句进行翻译的方法流程图，如图6所示，该方法包括如下步骤：

步骤S601：翻译设备按照P个待翻译词中最后一个待翻译词对应的各个候选词的概率由大到小的顺序，选择前Q个最大的概率对应的候选词，Q为大于1的整数。

步骤S602：翻译设备针对前Q个最大的概率对应的每个候选词，确定之前的各个待翻译词对应的各候选词对应的概率。

步骤S603：翻译设备分别计算前Q个最大的概率中每个概率与之前的各个待翻译词对应的各候选词对应的概率之和，得到概率和。

步骤S604：翻译设备分别计算概率和与待翻译语句的长度的商，以得到概率平均值。

步骤S605：翻译设备将概率平均值最大的翻译语句确定为待翻译语句对应的翻译语句。

可选地，Q＝3，针对前Q个最大的概率对应的每个候选词，由于每个待翻译词对应的概率为条件概率，因此可以确定倒数第二个待翻译词对应的候选词，以及倒数第二个待翻译词为对应候选词的概率(该概率也是条件概率，如果存在多个条件概率，则选择其中一个条件概率即可)，以此类推，确定各个待翻译词对应的各候选词对应的概率，计算计算前Q个最大的概率中每个概率与之前的各个待翻译词对应的各候选词对应的概率之和，得到概率和，翻译设备分别计算概率和与待翻译语句的长度的商，以得到概率平均值。翻译设备将概率平均值最大的翻译语句确定为待翻译语句对应的翻译语句。

需要说明的是，在步骤S104之后，假设翻译设备已经获取到待翻译语句对应的正确的翻译语句，基于此，翻译设备可以采用反向梯度传播算法对正确的翻译语句和通过本申请提供的方法得到的翻译语句进行比对，以调整上述参数θ₁和θ₂。

综上，本申请提供一种机器翻译方法，包括：翻译设备获取待翻译语句，待翻译语句包括：P个待翻译词，P为大于1的整数。翻译设备获取当前待翻译词的前一个待翻译词对应的M个第一候选词，以及，前一个待翻译词在N 个位置上的概率，M和N均为大于1的整数，当前待翻译词为P个待翻译词中除第一个待翻译词之外的任一待翻译词。翻译设备根据M个第一候选词和前一个待翻译词在N个位置上的概率，确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率。翻译设备根据P个待翻译词中每个待翻译词为对应各个候选词的概率，对待翻译语句进行翻译。基于此，翻译设备并不是采用固定顺序进行翻译的，而是基于前一个待翻译词的条件概率和前一个待翻译词在N个位置上的概率确定当前待翻译词为各个候选词的概率，并且确定当前待翻译词为各个候选词在N个位置上的概率，基于此，可以确定最优的翻译顺序进行翻译，从而可以提高翻译准确率。

图7为本申请一实施例提供的一种翻译装置的示意图，如图7所示，该翻译装置包括：

第一获取模块71，用于获取待翻译语句，待翻译语句包括：P个待翻译词，P为大于1的整数。

第二获取模块72，用于获取当前待翻译词的前一个待翻译词对应的M 个第一候选词，以及，前一个待翻译词在N个位置上的概率，M和N均为大于1的整数，当前待翻译词为P个待翻译词中除第一个待翻译词之外的任一待翻译词。

第一确定模块73，用于根据M个第一候选词和前一个待翻译词在N个位置上的概率，确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率。

翻译模块74，用于根据P个待翻译词中每个待翻译词为对应各个候选词的概率，对待翻译语句进行翻译。

可选地，第一确定模块73具有用于：通过公式(1)和公式(2)确定当前待翻译词为各个第二候选词的概率：

可选地，翻译装置还包括：

第三获取模块75，用于获取词表中各个词在N个位置上的概率分布。

第二确定模块76，用于根据概率分布确定当前待翻译词在N个位置上的概率。

可选地，翻译模块74具体用于：针对P个待翻译词中最后一个待翻译词，选择概率最大的候选词。根据概率最大的候选词以及P个待翻译词中除最后一个待翻译词为对应各个候选词的概率，依次确定最后一个待翻译词之前的各待翻译词对应的候选词。

可选地，翻译模块74具体用于：按照P个待翻译词中最后一个待翻译词对应的各个候选词的概率由大到小的顺序，选择前Q个最大的概率对应的候选词，Q为大于1的整数。针对前Q个最大的概率对应的每个候选词，确定之前的各个待翻译词对应的各候选词对应的概率。分别计算前Q个最大的概率中每个概率与之前的各个待翻译词对应的各候选词对应的概率之和，得到概率和。分别计算概率和与待翻译语句的长度的商，以得到概率平均值。将概率平均值最大的翻译语句确定为待翻译语句对应的翻译语句。

本申请提供的翻译装置用于执行上述的机器翻译方法，其内容和效果可参考上述方法实施例部分，对此不再赘述。

图8为本申请一实施例提供的翻译设备的示意图，如图8所示，该翻译设备包括：存储器81、处理器82和收发器83，其中该收发器83用于翻译设备与其他设备之间的数据传输。存储器81用于存储计算机指令。处理器82 用于执行计算机指令，以实现上述的机器翻译方法，其内容和效果可参考上述方法实施例部分，对此不再赘述。

本申请还提供一种存储介质，包括：可读存储介质和计算机指令，所述计算机指令存储在所述可读存储介质中；所述计算机指令用于实现前述任一方法实施例提供的机器翻译方法。

本申请实施例还提供一种程序产品，该程序产品包括计算机指令(即计算机程序)，该计算机指令存储在可读存储介质中。翻译设备的至少一个处理器可以从可读存储介质读取该计算机指令，至少一个处理器执行该计算机指令使得翻译设备实施前述任一实施例提供的机器翻译方法。

在上述翻译设备的具体实现中，应理解，处理器可以是中央处理单元 (英文：Central Processing Unit，简称：CPU)，还可以是其他通用处理器、数字信号处理器(英文：Digital Signal Processor，简称：DSP)、专用集成电路(英文：Application SpecificIntegrated Circuit，简称：ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：只读存储器(英文：read-only memory，缩写：ROM)、 RAM、快闪存储器、硬盘、固态硬盘、磁带(英文：magnetic tape)、软盘 (英文：floppy disk)、光盘(英文：optical disc)及其任意组合。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

1.一种机器翻译方法，其特征在于，包括：

获取待翻译语句，所述待翻译语句包括：P个待翻译词，P为大于1的整数；

获取当前待翻译词的前一个待翻译词对应的M个第一候选词，以及，所述前一个待翻译词在N个位置上的概率，M和N均为大于1的整数，所述当前待翻译词为所述P个待翻译词中除第一个待翻译词之外的任一待翻译词；

根据所述M个第一候选词和所述前一个待翻译词在所述N个位置上的概率，确定所述当前待翻译词在每个所述第一候选词的条件下为各个第二候选词的概率；

根据所述P个待翻译词中每个待翻译词为对应各个候选词的概率，对所述待翻译语句进行翻译；

通过公式(1)和公式(2)确定所述当前待翻译词为各个第二候选词的概率：

其中，y_t表示所述当前待翻译词，e_i，e_j表示所述当前待翻译词的第二候选词，y_t-1表示所述当前待翻译词的前一个待翻译词，a表示所述前一个待翻译词对应的任一个第一候选词，q(pos＝n|y_t-1＝a)表示当y_t-1＝a时，y_t-1在位置n上的概率，P(y_t＝e_i|y_t-1＝a)表示在不考虑y_t-1的位置且在y_t-1＝a的条件下，y_t＝e_i出现的概率，P'(y_t＝e_i|y_t-1＝a)为在考虑y_t-1的位置且y_t-1＝a的条件下，y_t＝e_i出现的概率，P”(y_t＝e_i|y_t-1＝a)是对P'(y_t＝e_i|y_t-1＝a)经过归一化处理之后，得到的y_t＝e_i出现的概率。

2.根据权利要求1所述的方法，其特征在于，还包括：

获取词表中各个词在所述N个位置上的概率分布；

根据所述概率分布确定所述当前待翻译词在所述N个位置上的概率。

3.根据权利要求1所述的方法，其特征在于，所述根据所述P个待翻译词中每个待翻译词为对应各个候选词的概率，对所述待翻译语句进行翻译，包括：

针对所述P个待翻译词中最后一个待翻译词，选择概率最大的候选词；

根据所述概率最大的候选词以及所述P个待翻译词中除所述最后一个待翻译词为对应各个候选词的概率，依次确定所述最后一个待翻译词之前的各待翻译词对应的候选词。

4.根据权利要求1所述的方法，其特征在于，所述根据所述P个待翻译词中每个待翻译词为对应各个候选词的概率，对所述待翻译语句进行翻译，包括：

按照所述P个待翻译词中最后一个待翻译词对应的各个候选词的概率由大到小的顺序，选择前Q个最大的概率对应的候选词，Q为大于1的整数；

针对所述前Q个最大的概率对应的每个候选词，确定之前的各个待翻译词对应的各候选词对应的概率；

分别计算所述前Q个最大的概率中每个概率与之前的各个待翻译词对应的各候选词对应的概率之和，得到概率和；

分别计算所述概率和与所述待翻译语句的长度的商，以得到概率平均值；

将所述概率平均值最大的翻译语句确定为所述待翻译语句对应的翻译语句。

5.根据权利要求1所述的方法，其特征在于，所述待翻译语句中第一个待翻译词为对应各个候选词的概率，以及，第一个待翻译词在所述N个位置上的概率均为预设概率。

6.一种翻译装置，其特征在于，包括：

第一获取模块，用于获取待翻译语句，所述待翻译语句包括：P个待翻译词，P为大于1的整数；

第二获取模块，用于获取当前待翻译词的前一个待翻译词对应的M个第一候选词，以及，所述前一个待翻译词在N个位置上的概率，M和N均为大于1的整数，所述当前待翻译词为所述P个待翻译词中除第一个待翻译词之外的任一待翻译词；

第一确定模块，用于根据所述M个第一候选词和所述前一个待翻译词在所述N个位置上的概率，确定所述当前待翻译词在每个所述第一候选词的条件下为各个第二候选词的概率；

翻译模块，用于根据所述P个待翻译词中每个待翻译词为对应各个候选词的概率，对所述待翻译语句进行翻译；

所述第一确定模块具有用于：通过公式(1)和公式(2)确定所述当前待翻译词为各个第二候选词的概率：

7.根据权利要求6所述的装置，其特征在于，还包括：

第三获取模块，用于获取词表中各个词在所述N个位置上的概率分布；

第二确定模块，用于根据所述概率分布确定所述当前待翻译词在所述N个位置上的概率。

8.根据权利要求6所述的装置，其特征在于，所述翻译模块具体用于：

9.根据权利要求6所述的装置，其特征在于，所述翻译模块具体用于：

10.根据权利要求6所述的装置，其特征在于，所述待翻译语句中第一个待翻译词为对应各个候选词的概率，以及，第一个待翻译词在所述N个位置上的概率均为预设概率。

11.一种翻译设备，其特征在于，包括：存储器和处理器；

所述存储器用于存储计算机指令；

所述处理器用于执行所述计算机指令，以实现如权利要求1-5任一项所述的机器翻译方法。

12.一种存储介质，其特征在于，包括：可读存储介质和计算机指令，所述计算机指令存储在所述可读存储介质中；所述计算机指令用于实现权利要求1至5任一项所述的机器翻译方法。