CN110298045B - 机器翻译方法、装置、设备及存储介质 - Google Patents
机器翻译方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110298045B CN110298045B CN201910471418.3A CN201910471418A CN110298045B CN 110298045 B CN110298045 B CN 110298045B CN 201910471418 A CN201910471418 A CN 201910471418A CN 110298045 B CN110298045 B CN 110298045B
- Authority
- CN
- China
- Prior art keywords
- translated
- word
- probability
- candidate
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例提供一种机器翻译方法、装置、设备及存储介质。包括:获取待翻译语句,待翻译语句包括:P个待翻译词;获取当前待翻译词的前一个待翻译词对应的M个第一候选词,以及,前一个待翻译词在N个位置上的概率;根据M个第一候选词和前一个待翻译词在N个位置上的概率,确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率;根据P个待翻译词中每个待翻译词为对应各个候选词的概率,对待翻译语句进行翻译。从而可以提高翻译准确率。
Description
技术领域
本申请实施例涉及翻译技术领域,尤其涉及一种机器翻译方法、装置、设备及存储介质。
背景技术
机器翻译是人们常常用到的终端功能,其主要涉及候选词选择和词序推定。所谓候选词选择指的是为待翻译词选择对应的候选词。所谓词序推定指的是翻译顺序。
目前翻译设备常常采用自左向右或者自右向左的翻译顺序,即翻译设备采用固定的顺序,根据当前待翻译词的前一个词对应的候选词确定当前待翻译词对应的候选词。由于前一个词产生的预测错误可能造成待翻译词的翻译错误,即越往后翻译,出错的概率越高,但是一条待翻译语句中重要词汇的位置未必位于靠前的位置,因此这种按照固定顺序翻译的方式,可能造成待翻译语句中的重要词汇无法被准确翻译的问题,从而造成翻译准确率低的问题。
发明内容
本申请实施例提供一种机器翻译方法、装置、设备及存储介质。从而可以提高翻译准确率。
第一方面,本申请提供一种机器翻译方法,包括:获取待翻译语句,待翻译语句包括:P个待翻译词,P为大于1的整数;获取当前待翻译词的前一个待翻译词对应的M个第一候选词,以及,前一个待翻译词在N个位置上的概率,M和N均为大于1的整数,当前待翻译词为P个待翻译词中除第一个待翻译词之外的任一待翻译词;根据M个第一候选词和前一个待翻译词在N 个位置上的概率,确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率;根据P个待翻译词中每个待翻译词为对应各个候选词的概率,对待翻译语句进行翻译。
基于此,翻译设备并不是采用固定顺序进行翻译的,而是基于前一个待翻译词的条件概率和前一个待翻译词在N个位置上的概率确定当前待翻译词为各个候选词的概率,并且确定当前待翻译词为各个候选词在N个位置上的概率,可以确定最优的翻译顺序进行翻译,从而可以提高翻译准确率。
可选地,通过公式(1)和公式(2)确定当前待翻译词为各个第二候选词的概率:
其中,yt表示当前待翻译词,ei,ej表示当前待翻译词的第二候选词, yt-1表示当前待翻译词的前一个待翻译词,a表示前一个待翻译词对应的任一个第一候选词,q(pos=n|yt-1=a)表示当yt-1=a时,yt-1在位置n上的概率, P(yt=ei|yt-1=a)表示在不考虑yt-1的位置且在yt-1=a的条件下,yt=ei出现的概率,P'(yt=ei|yt-1=a)为在考虑yt-1的位置且yt-1=a的条件下,yt=ei出现的概率,P”(yt=ei|yt-1=a)是对P'(yt=ei|yt-1=a)经过归一化处理之后,得到的 yt=ei出现的概率。
通过公式(1)和(2)可以准确的确定当前待翻译词为各个第二候选词的概率。
可选地,方法还包括:获取词表中各个词在N个位置上的概率分布,根据概率分布确定当前待翻译词在N个位置上的概率。通过该方法可以确定当前待翻译词在N个位置上的概率,即翻译设备并不是采用固定顺序进行翻译的,而是根据该概率确定最优翻译顺序,进而提高翻译准确率。
根据P个待翻译词中每个待翻译词为对应各个候选词的概率,对待翻译语句进行翻译的一种可选方式包括:针对P个待翻译词中最后一个待翻译词,选择概率最大的候选词;根据概率最大的候选词以及P个待翻译词中除最后一个待翻译词为对应各个候选词的概率,依次确定最后一个待翻译词之前的各待翻译词对应的候选词。
根据P个待翻译词中每个待翻译词为对应各个候选词的概率,对待翻译语句进行翻译的另一种可选方式包括:按照P个待翻译词中最后一个待翻译词对应的各个候选词的概率由大到小的顺序,选择前Q个最大的概率对应的候选词,Q为大于1的整数;针对前Q个最大的概率对应的每个候选词,确定之前的各个待翻译词对应的各候选词对应的概率;分别计算前Q个最大的概率中每个概率与之前的各个待翻译词对应的各候选词对应的概率之和,得到概率和;分别计算概率和与待翻译语句的长度的商,以得到概率平均值;将概率平均值最大的翻译语句确定为待翻译语句对应的翻译语句。
由上述两种可选方式可知,根据P个待翻译词中每个待翻译词为对应各个候选词的概率,对待翻译语句进行翻译,即考虑了待翻译词与前一个待翻译词的关联性,以及在各个位置上的概率,进而可以提高翻译准确率。
可选地,待翻译语句中第一个待翻译词为对应各个候选词的概率,以及,第一个待翻译词在N个位置上的概率均为预设概率。
下面将提供一种翻译装置、设备、存储介质及计算机程序产品,其内容和效果可参考上述方法部分,对此不再赘述。
第二方面,本申请提供一种翻译装置,包括:
第一获取模块,用于获取待翻译语句,待翻译语句包括:P个待翻译词, P为大于1的整数。
第二获取模块,用于获取当前待翻译词的前一个待翻译词对应的M个第一候选词,以及,前一个待翻译词在N个位置上的概率,M和N均为大于1 的整数,当前待翻译词为P个待翻译词中除第一个待翻译词之外的任一待翻译词。
第一确定模块,用于根据M个第一候选词和前一个待翻译词在N个位置上的概率,确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率。
翻译模块,用于根据P个待翻译词中每个待翻译词为对应各个候选词的概率,对待翻译语句进行翻译。
第三方面,本申请提供一种翻译设备,包括:存储器和处理器。
存储器用于存储计算机指令。
处理器用于执行计算机指令,以实现上述的机器翻译方法。
本申请第四方面提供一种存储介质,包括:可读存储介质和计算机指令,所述计算机指令存储在所述可读存储介质中。所述计算机指令用于实现第一方面任一实现方式提供的机器翻译方法。
本发明第五方面提供一种程序产品,该程序产品包括计算机指令(即计算机程序),该计算机指令存储在可读存储介质中。翻译设备的至少一个处理器可以从可读存储介质读取该计算机指令,至少一个处理器执行该计算机指令使得翻译设备实施前述第一方面任一实施方式提供的机器翻译方法。
本申请实施例提供的机器翻译方法、装置、设备及存储介质。由于考虑到当前待翻译词在前一个待翻译词对应的候选词的条件概率,以及,前一个待翻译词在N个位置上的概率,基于此,确定当前待翻译词为各个候选词的概率,并且确定当前待翻译词为各个候选词在N个位置上的概率,从而可以确定最优的翻译顺序进行翻译,进而可以提高翻译准确率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请一实施例提供的一种机器翻译方法的流程图;
图2为本申请一实施例提供的确定当前待翻译词在N个位置上的概率的方法流程图;
图3为本申请一实施例提供的翻译顺序示意图;
图4为本申请一实施例提供的翻译过程示意图;
图5为本申请一实施例提供的对待翻译语句进行翻译的方法流程图;
图6为本申请另一实施例提供的对待翻译语句进行翻译的方法流程图;
图7为本申请一实施例提供的一种翻译装置的示意图;
图8为本申请一实施例提供的翻译设备的示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
如上所述,目前翻译设备采用固定的顺序,根据当前待翻译词的前一个词对应的候选词确定当前待翻译词对应的候选词。由于前一个词产生的预测错误可能造成待翻译词的翻译错误,即越往后翻译,出错的概率越高,但是一条待翻译语句中重要词汇的位置未必位于靠前的位置,因此这种按照固定顺序翻译的方式,可能造成待翻译语句中的重要词汇无法被准确翻译的问题,从而造成翻译准确率低的问题。
为了提高翻译准确率,本申请提供一种机器翻译方法、装置、设备及存储介质。
图1为本申请一实施例提供的一种机器翻译方法的流程图,该方法可以应用于翻译设备,该翻译设备可以是计算机、平板、手机等智能设备中的部分或者全部,该智能设备可以安装有翻译应用(Application,APP)或者用户可以在智能设备上登录浏览器,通过浏览器使用翻译软件,下面以该方法的执行主体为翻译设备对该方法进行说明,如图1所示,该方法包括如下步骤:
步骤S101:翻译设备获取待翻译语句,待翻译语句包括:P个待翻译词, P为大于1的整数。
步骤S102:翻译设备获取当前待翻译词的前一个待翻译词对应的M个第一候选词,以及,前一个待翻译词在N个位置上的概率,M和N均为大于 1的整数,当前待翻译词为P个待翻译词中除第一个待翻译词之外的任一待翻译词。
步骤S103:翻译设备根据M个第一候选词和前一个待翻译词在N个位置上的概率,确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率。
步骤S104:翻译设备根据P个待翻译词中每个待翻译词为对应各个候选词的概率,对待翻译语句进行翻译。
其中,P个待翻译词中当前待翻译词为对应各个候选词的概率是在当前待翻译词的前一个待翻译词为对应各个候选词的条件下,当前待翻译词为对应各个候选词的概率,当前待翻译词为P个待翻译词中除第一个待翻译词之外的任一个待翻译词。
针对步骤S102和步骤S103进行说明:
所述待翻译语句中第一个待翻译词为对应各个候选词的概率,以及,第一个待翻译词对应的各个候选词在N个位置上的概率均为预设概率。其中,第一个待翻译词为对应各个候选词的概率可以相同,也可以不同。第一个待翻译词对应的各个候选词在N个位置上的概率可以相同,也可以不同。本申请对此不做限制。
或者,
假设第一个待翻译词的前一个待翻译词对应的候选词为BOS,前一个待翻译词在位置-1(该位置不属于所述N个位置)上的概率为1,在其他位置上的概率为0。基于此,根据候选词BOS和前一个待翻译词对应的各个候选词在N个位置上的概率0,确定第一个待翻译词在候选词BOS的条件下为各个候选词的概率。
具体地,通过公式(1)和公式(2)确定第一个待翻译词为各个候选词的概率:
其中,y0表示第一个待翻译词,ei,ej表示第一个待翻译词的候选词, y-1表示第一个待翻译词的前一个待翻译词,q(pos=n|y-1=BOS)表示当 y-1=BOS时,y-1在位置n上的概率,P(y0=ei|y-1=BOS)表示在不考虑y-1的位置且在y-1=BOS的条件下,y0=ei出现的概率,P'(y0=ei|y-1=BOS)为在考虑 y-1的位置且y-1=BOS的条件下,y0=ei出现的概率,P”(y0=ei|y-1=BOS)是对 P'(y0=ei|y-1=BOS)经过归一化处理之后,得到的y0=ei出现的概率,即最终确定的y0=ei出现的概率。
需要说明的是,在本申请中,第一个待翻译词指的是第一个被翻译的词,它可以是物理意义上的位于待翻译语句中第一个位置上的待翻译词,也可以不是位于待翻译语句中第一个位置上的待翻译词。
在本申请中,待翻译语句中每个待翻译词对应的候选词一般不同,例如:待翻译语句为:“A人物与B人物举行会谈”,“A人物”、“与”、“B 人物”、“举行”、“会谈”对应的候选词均不同。
示例性地,针对待翻译语句中除第一个待翻译词之外的其他待翻译词,翻译设备确定各个待翻译词为对应候选词的概率的方式相同,并且翻译设备确定各个待翻译词对应的各个候选词在N个位置上的概率也相同。因此,在本申请中,假设当前待翻译词为除第一个待翻译词之外的任一个待翻译词,其前一个待翻译词对应的候选词以及在N个位置上的概率已经确定。
在本申请中,前一个待翻译词指的不是物理意义上前一个位置上的待翻译词,而是在当前待翻译词之前待翻译的词,这两个词的翻译时刻相邻。
基于此,翻译设备可以通过公式(3)和公式(4)确定当前待翻译词为各个第二候选词的概率:
其中,yt表示当前待翻译词,ei,ej表示当前待翻译词的第二候选词, yt-1表示当前待翻译词的前一个待翻译词,a表示前一个待翻译词对应的任一个第一候选词,q(pos=n|yt-1=a)表示当yt-1=a时,yt-1在位置n上的概率, P(yt=ei|yt-1=a)表示在不考虑yt-1的位置且在yt-1=a的条件下,yt=ei出现的概率,P'(yt=ei|yt-1=a)为在考虑yt-1的位置且yt-1=a的条件下,yt=ei出现的概率,P”(yt=ei|yt-1=a)是对P'(yt=ei|yt-1=a)经过归一化处理之后,得到的 yt=ei出现的概率。
上述过程假定yt-1=a,由于yt-1还可以取其他第一候选词,基于此,翻译设备还可以采用上述过程确定当前待翻译词在其他第一候选词的条件下为各个第二候选词的概率。
需要说明的是,当前待翻译词在不同第一候选词的条件下对应的第二候选词可能不同,例如:当第一候选词为“我”时,第二候选词可能为“是”,当第一候选词为“和”时,第二候选词可能为“你”。当前待翻译词在不同第一候选词的条件下对应的第二候选词也可能相同,例如:当第一候选词为“我”时,第二候选词可能为“是”,当第一候选词为“你”时,第二候选词可能为“是”。
值得一提的是,上述公式(1)中的P(y0=ei|y-1=BOS)、公式(3)中的 P(yt=ei|yt-1=a)还涉及参数θ1,公式(1)中的q(pos=n|y-1=BOS)、公式(3) 中的q(pos=n|yt-1=a)还涉及参数θ2。
其中,θ1包含编码端,解码端(即上述的翻译设备侧),翻译模型中的 softmaxlayer预测层模块的所有模型参数;θ2和θ1的不同之处为在softmax layer即最后一层预测具体分类时,θ1包含的参数为W1(其中,W1=d*V),而θ2包含的参数为W2(其中,W2=d*C+V*C)。d为翻译模型的大小,一般为1024,V是词表大小,一般为30000,而C为可预测的位置数值,一般为200,表示当前待翻译词出现的位置在0~200之间。
图2为本申请一实施例提供的确定当前待翻译词在N个位置上的概率的方法流程图,如图2所示,该方法包括如下步骤:
步骤S201:翻译设备获取词表中各个词在N个位置上的概率分布。
步骤S202:翻译设备根据概率分布确定当前待翻译词在N个位置上的概率。
示例性地,各个词在N个位置上的概率分布可以是多项式分布或者是正态分布等,本申请对此不做限制。
例如:q(pos|yt)=Multinomial(0,P),q(pos|yt)表示yt在位置pos(1~N)的概率,Multinomial表示多项式分布,0和P表示多项式分布涉及的参数。
翻译设备根据概率分布确定当前待翻译词对应的各个候选词在N个位置上的概率,例如,翻译设备确定当前待翻译词“我”在第一个位置上的概率为0.95,在第二个位置上的概率为0.1。
图3为本申请一实施例提供的翻译顺序示意图,如图3所示,这里的翻译顺序并不是从左向右的翻译顺序或者从右向左的翻译顺序,而是根据上述的概率分布确定的3-1-2-0-4的顺序。
图4为本申请一实施例提供的翻译过程示意图,如图4所示,待翻译语句为“A人物与B人物举行会谈”,经过编码器编码之后,解码器(即上述的翻译设备)通过内部的翻译模型(包括多个神经网络层)对待翻译语句进行翻译,例如,在t=0时刻,神经网络层1翻译出了“B人物”对应的英文,以及,神经网络层2根据“B人物”对应的英文输出了“B人物”对应的位置“3”,实际上,“B人物”对应的英文只是一种候选词,在测试过程中,“B人物”对应的英文还可以是其他的候选词,并且对应相应的位置。在 t=1时刻,神经网络层1翻译出了“A人物”对应的英文,以及,神经网络层 2输出了“A人物”对应的位置“1”,如图4所示,解码器在神经网络层1,根据t=0时刻,神经网络层1输出的“B人物”对应的英文,以及,t=0时刻,神经网络层1输出的位置“3”确定的,在t=1时刻,神经网络层2根据“A 人物”对应的英文输出了“A人物”对应的位置“1”。
针对步骤S104进行说明:
示例性地,图5为本申请一实施例提供的对待翻译语句进行翻译的方法流程图,如图5所示,该方法包括如下步骤:
步骤501:翻译设备针对P个待翻译词中最后一个待翻译词,选择概率最大的候选词。
步骤502:翻译设备根据概率最大的候选词以及P个待翻译词中除最后一个待翻译词为对应各个候选词的概率,依次确定最后一个待翻译词之前的各待翻译词对应的候选词。
其中,由于当前待翻译词对应的概率为当前待翻译词在每个第一候选词 (当前待翻译词的前一个待翻译词对应的候选词)的条件下为各个第二候选词的概率,即当前待翻译词对应的概率为条件概率,因此,当翻译设备针对最后一个待翻译词选择概率最大的候选词之后,基于该条件概率,可以确定最后的候选词对应的第一候选词(为了方面起见,将该第一候选词称为目标候选词)。再根据所述前一个待翻译词对应的条件概率,当前一个待翻译词为目标候选词时,选择最大的条件概率对应的所述前一个待翻译词的前一个待翻译词对应的候选词,需要说明的是,每个待翻译词可以根据上述确定位置概率的方法,选择概率最大的位置,以此类推,确定最后一个待翻译词之前的各待翻译词对应的候选词。
示例性地,图6为本申请另一实施例提供的对待翻译语句进行翻译的方法流程图,如图6所示,该方法包括如下步骤:
步骤S601:翻译设备按照P个待翻译词中最后一个待翻译词对应的各个候选词的概率由大到小的顺序,选择前Q个最大的概率对应的候选词,Q为大于1的整数。
步骤S602:翻译设备针对前Q个最大的概率对应的每个候选词,确定之前的各个待翻译词对应的各候选词对应的概率。
步骤S603:翻译设备分别计算前Q个最大的概率中每个概率与之前的各个待翻译词对应的各候选词对应的概率之和,得到概率和。
步骤S604:翻译设备分别计算概率和与待翻译语句的长度的商,以得到概率平均值。
步骤S605:翻译设备将概率平均值最大的翻译语句确定为待翻译语句对应的翻译语句。
可选地,Q=3,针对前Q个最大的概率对应的每个候选词,由于每个待翻译词对应的概率为条件概率,因此可以确定倒数第二个待翻译词对应的候选词,以及倒数第二个待翻译词为对应候选词的概率(该概率也是条件概率,如果存在多个条件概率,则选择其中一个条件概率即可),以此类推,确定各个待翻译词对应的各候选词对应的概率,计算计算前Q个最大的概率中每个概率与之前的各个待翻译词对应的各候选词对应的概率之和,得到概率和,翻译设备分别计算概率和与待翻译语句的长度的商,以得到概率平均值。翻译设备将概率平均值最大的翻译语句确定为待翻译语句对应的翻译语句。
需要说明的是,在步骤S104之后,假设翻译设备已经获取到待翻译语句对应的正确的翻译语句,基于此,翻译设备可以采用反向梯度传播算法对正确的翻译语句和通过本申请提供的方法得到的翻译语句进行比对,以调整上述参数θ1和θ2。
综上,本申请提供一种机器翻译方法,包括:翻译设备获取待翻译语句,待翻译语句包括:P个待翻译词,P为大于1的整数。翻译设备获取当前待翻译词的前一个待翻译词对应的M个第一候选词,以及,前一个待翻译词在N 个位置上的概率,M和N均为大于1的整数,当前待翻译词为P个待翻译词中除第一个待翻译词之外的任一待翻译词。翻译设备根据M个第一候选词和前一个待翻译词在N个位置上的概率,确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率。翻译设备根据P个待翻译词中每个待翻译词为对应各个候选词的概率,对待翻译语句进行翻译。基于此,翻译设备并不是采用固定顺序进行翻译的,而是基于前一个待翻译词的条件概率和前一个待翻译词在N个位置上的概率确定当前待翻译词为各个候选词的概率,并且确定当前待翻译词为各个候选词在N个位置上的概率,基于此,可以确定最优的翻译顺序进行翻译,从而可以提高翻译准确率。
图7为本申请一实施例提供的一种翻译装置的示意图,如图7所示,该翻译装置包括:
第一获取模块71,用于获取待翻译语句,待翻译语句包括:P个待翻译词,P为大于1的整数。
第二获取模块72,用于获取当前待翻译词的前一个待翻译词对应的M 个第一候选词,以及,前一个待翻译词在N个位置上的概率,M和N均为大于1的整数,当前待翻译词为P个待翻译词中除第一个待翻译词之外的任一待翻译词。
第一确定模块73,用于根据M个第一候选词和前一个待翻译词在N个位置上的概率,确定当前待翻译词在每个第一候选词的条件下为各个第二候选词的概率。
翻译模块74,用于根据P个待翻译词中每个待翻译词为对应各个候选词的概率,对待翻译语句进行翻译。
可选地,第一确定模块73具有用于:通过公式(1)和公式(2)确定当前待翻译词为各个第二候选词的概率:
其中,yt表示当前待翻译词,ei,ej表示当前待翻译词的第二候选词, yt-1表示当前待翻译词的前一个待翻译词,a表示前一个待翻译词对应的任一个第一候选词,q(pos=n|yt-1=a)表示当yt-1=a时,yt-1在位置n上的概率, P(yt=ei|yt-1=a)表示在不考虑yt-1的位置且在yt-1=a的条件下,yt=ei出现的概率,P'(yt=ei|yt-1=a)为在考虑yt-1的位置且yt-1=a的条件下,yt=ei出现的概率,P”(yt=ei|yt-1=a)是对P'(yt=ei|yt-1=a)经过归一化处理之后,得到的 yt=ei出现的概率。
可选地,翻译装置还包括:
第三获取模块75,用于获取词表中各个词在N个位置上的概率分布。
第二确定模块76,用于根据概率分布确定当前待翻译词在N个位置上的概率。
可选地,翻译模块74具体用于:针对P个待翻译词中最后一个待翻译词,选择概率最大的候选词。根据概率最大的候选词以及P个待翻译词中除最后一个待翻译词为对应各个候选词的概率,依次确定最后一个待翻译词之前的各待翻译词对应的候选词。
可选地,翻译模块74具体用于:按照P个待翻译词中最后一个待翻译词对应的各个候选词的概率由大到小的顺序,选择前Q个最大的概率对应的候选词,Q为大于1的整数。针对前Q个最大的概率对应的每个候选词,确定之前的各个待翻译词对应的各候选词对应的概率。分别计算前Q个最大的概率中每个概率与之前的各个待翻译词对应的各候选词对应的概率之和,得到概率和。分别计算概率和与待翻译语句的长度的商,以得到概率平均值。将概率平均值最大的翻译语句确定为待翻译语句对应的翻译语句。
可选地,待翻译语句中第一个待翻译词为对应各个候选词的概率,以及,第一个待翻译词在N个位置上的概率均为预设概率。
本申请提供的翻译装置用于执行上述的机器翻译方法,其内容和效果可参考上述方法实施例部分,对此不再赘述。
图8为本申请一实施例提供的翻译设备的示意图,如图8所示,该翻译设备包括:存储器81、处理器82和收发器83,其中该收发器83用于翻译设备与其他设备之间的数据传输。存储器81用于存储计算机指令。处理器82 用于执行计算机指令,以实现上述的机器翻译方法,其内容和效果可参考上述方法实施例部分,对此不再赘述。
本申请还提供一种存储介质,包括:可读存储介质和计算机指令,所述计算机指令存储在所述可读存储介质中;所述计算机指令用于实现前述任一方法实施例提供的机器翻译方法。
本申请实施例还提供一种程序产品,该程序产品包括计算机指令(即计算机程序),该计算机指令存储在可读存储介质中。翻译设备的至少一个处理器可以从可读存储介质读取该计算机指令,至少一个处理器执行该计算机指令使得翻译设备实施前述任一实施例提供的机器翻译方法。
在上述翻译设备的具体实现中,应理解,处理器可以是中央处理单元 (英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:只读存储器(英文:read-only memory,缩写:ROM)、 RAM、快闪存储器、硬盘、固态硬盘、磁带(英文:magnetic tape)、软盘 (英文:floppy disk)、光盘(英文:optical disc)及其任意组合。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (12)
1.一种机器翻译方法,其特征在于,包括:
获取待翻译语句,所述待翻译语句包括:P个待翻译词,P为大于1的整数;
获取当前待翻译词的前一个待翻译词对应的M个第一候选词,以及,所述前一个待翻译词在N个位置上的概率,M和N均为大于1的整数,所述当前待翻译词为所述P个待翻译词中除第一个待翻译词之外的任一待翻译词;
根据所述M个第一候选词和所述前一个待翻译词在所述N个位置上的概率,确定所述当前待翻译词在每个所述第一候选词的条件下为各个第二候选词的概率;
根据所述P个待翻译词中每个待翻译词为对应各个候选词的概率,对所述待翻译语句进行翻译;
通过公式(1)和公式(2)确定所述当前待翻译词为各个第二候选词的概率:
其中,yt表示所述当前待翻译词,ei,ej表示所述当前待翻译词的第二候选词,yt-1表示所述当前待翻译词的前一个待翻译词,a表示所述前一个待翻译词对应的任一个第一候选词,q(pos=n|yt-1=a)表示当yt-1=a时,yt-1在位置n上的概率,P(yt=ei|yt-1=a)表示在不考虑yt-1的位置且在yt-1=a的条件下,yt=ei出现的概率,P'(yt=ei|yt-1=a)为在考虑yt-1的位置且yt-1=a的条件下,yt=ei出现的概率,P”(yt=ei|yt-1=a)是对P'(yt=ei|yt-1=a)经过归一化处理之后,得到的yt=ei出现的概率。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取词表中各个词在所述N个位置上的概率分布;
根据所述概率分布确定所述当前待翻译词在所述N个位置上的概率。
3.根据权利要求1所述的方法,其特征在于,所述根据所述P个待翻译词中每个待翻译词为对应各个候选词的概率,对所述待翻译语句进行翻译,包括:
针对所述P个待翻译词中最后一个待翻译词,选择概率最大的候选词;
根据所述概率最大的候选词以及所述P个待翻译词中除所述最后一个待翻译词为对应各个候选词的概率,依次确定所述最后一个待翻译词之前的各待翻译词对应的候选词。
4.根据权利要求1所述的方法,其特征在于,所述根据所述P个待翻译词中每个待翻译词为对应各个候选词的概率,对所述待翻译语句进行翻译,包括:
按照所述P个待翻译词中最后一个待翻译词对应的各个候选词的概率由大到小的顺序,选择前Q个最大的概率对应的候选词,Q为大于1的整数;
针对所述前Q个最大的概率对应的每个候选词,确定之前的各个待翻译词对应的各候选词对应的概率;
分别计算所述前Q个最大的概率中每个概率与之前的各个待翻译词对应的各候选词对应的概率之和,得到概率和;
分别计算所述概率和与所述待翻译语句的长度的商,以得到概率平均值;
将所述概率平均值最大的翻译语句确定为所述待翻译语句对应的翻译语句。
5.根据权利要求1所述的方法,其特征在于,所述待翻译语句中第一个待翻译词为对应各个候选词的概率,以及,第一个待翻译词在所述N个位置上的概率均为预设概率。
6.一种翻译装置,其特征在于,包括:
第一获取模块,用于获取待翻译语句,所述待翻译语句包括:P个待翻译词,P为大于1的整数;
第二获取模块,用于获取当前待翻译词的前一个待翻译词对应的M个第一候选词,以及,所述前一个待翻译词在N个位置上的概率,M和N均为大于1的整数,所述当前待翻译词为所述P个待翻译词中除第一个待翻译词之外的任一待翻译词;
第一确定模块,用于根据所述M个第一候选词和所述前一个待翻译词在所述N个位置上的概率,确定所述当前待翻译词在每个所述第一候选词的条件下为各个第二候选词的概率;
翻译模块,用于根据所述P个待翻译词中每个待翻译词为对应各个候选词的概率,对所述待翻译语句进行翻译;
所述第一确定模块具有用于:通过公式(1)和公式(2)确定所述当前待翻译词为各个第二候选词的概率:
其中,yt表示所述当前待翻译词,ei,ej表示所述当前待翻译词的第二候选词,yt-1表示所述当前待翻译词的前一个待翻译词,a表示所述前一个待翻译词对应的任一个第一候选词,q(pos=n|yt-1=a)表示当yt-1=a时,yt-1在位置n上的概率,P(yt=ei|yt-1=a)表示在不考虑yt-1的位置且在yt-1=a的条件下,yt=ei出现的概率,P'(yt=ei|yt-1=a)为在考虑yt-1的位置且yt-1=a的条件下,yt=ei出现的概率,P”(yt=ei|yt-1=a)是对P'(yt=ei|yt-1=a)经过归一化处理之后,得到的yt=ei出现的概率。
7.根据权利要求6所述的装置,其特征在于,还包括:
第三获取模块,用于获取词表中各个词在所述N个位置上的概率分布;
第二确定模块,用于根据所述概率分布确定所述当前待翻译词在所述N个位置上的概率。
8.根据权利要求6所述的装置,其特征在于,所述翻译模块具体用于:
针对所述P个待翻译词中最后一个待翻译词,选择概率最大的候选词;
根据所述概率最大的候选词以及所述P个待翻译词中除所述最后一个待翻译词为对应各个候选词的概率,依次确定所述最后一个待翻译词之前的各待翻译词对应的候选词。
9.根据权利要求6所述的装置,其特征在于,所述翻译模块具体用于:
按照所述P个待翻译词中最后一个待翻译词对应的各个候选词的概率由大到小的顺序,选择前Q个最大的概率对应的候选词,Q为大于1的整数;
针对所述前Q个最大的概率对应的每个候选词,确定之前的各个待翻译词对应的各候选词对应的概率;
分别计算所述前Q个最大的概率中每个概率与之前的各个待翻译词对应的各候选词对应的概率之和,得到概率和;
分别计算所述概率和与所述待翻译语句的长度的商,以得到概率平均值;
将所述概率平均值最大的翻译语句确定为所述待翻译语句对应的翻译语句。
10.根据权利要求6所述的装置,其特征在于,所述待翻译语句中第一个待翻译词为对应各个候选词的概率,以及,第一个待翻译词在所述N个位置上的概率均为预设概率。
11.一种翻译设备,其特征在于,包括:存储器和处理器;
所述存储器用于存储计算机指令;
所述处理器用于执行所述计算机指令,以实现如权利要求1-5任一项所述的机器翻译方法。
12.一种存储介质,其特征在于,包括:可读存储介质和计算机指令,所述计算机指令存储在所述可读存储介质中;所述计算机指令用于实现权利要求1至5任一项所述的机器翻译方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910471418.3A CN110298045B (zh) | 2019-05-31 | 2019-05-31 | 机器翻译方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910471418.3A CN110298045B (zh) | 2019-05-31 | 2019-05-31 | 机器翻译方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110298045A CN110298045A (zh) | 2019-10-01 |
CN110298045B true CN110298045B (zh) | 2023-03-24 |
Family
ID=68027430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910471418.3A Active CN110298045B (zh) | 2019-05-31 | 2019-05-31 | 机器翻译方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110298045B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111611811B (zh) * | 2020-05-25 | 2023-01-13 | 腾讯科技(深圳)有限公司 | 翻译方法、装置、电子设备及计算机可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103631772A (zh) * | 2012-08-29 | 2014-03-12 | 阿里巴巴集团控股有限公司 | 机器翻译方法及装置 |
US8788258B1 (en) * | 2007-03-15 | 2014-07-22 | At&T Intellectual Property Ii, L.P. | Machine translation using global lexical selection and sentence reconstruction |
CN105144149A (zh) * | 2013-05-29 | 2015-12-09 | 国立研究开发法人情报通信研究机构 | 翻译词序信息输出装置、翻译词序信息输出方法及存储介质 |
CN105183720A (zh) * | 2015-08-05 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 基于rnn模型的机器翻译方法和装置 |
CN107273363A (zh) * | 2017-05-12 | 2017-10-20 | 清华大学 | 一种语言文本翻译方法及系统 |
CN108304388A (zh) * | 2017-09-12 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 机器翻译方法及装置 |
CN109684648A (zh) * | 2019-01-14 | 2019-04-26 | 浙江大学 | 一种多特征融合的古今汉语自动翻译方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160132491A1 (en) * | 2013-06-17 | 2016-05-12 | National Institute Of Information And Communications Technology | Bilingual phrase learning apparatus, statistical machine translation apparatus, bilingual phrase learning method, and storage medium |
-
2019
- 2019-05-31 CN CN201910471418.3A patent/CN110298045B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8788258B1 (en) * | 2007-03-15 | 2014-07-22 | At&T Intellectual Property Ii, L.P. | Machine translation using global lexical selection and sentence reconstruction |
CN103631772A (zh) * | 2012-08-29 | 2014-03-12 | 阿里巴巴集团控股有限公司 | 机器翻译方法及装置 |
CN105144149A (zh) * | 2013-05-29 | 2015-12-09 | 国立研究开发法人情报通信研究机构 | 翻译词序信息输出装置、翻译词序信息输出方法及存储介质 |
CN105183720A (zh) * | 2015-08-05 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 基于rnn模型的机器翻译方法和装置 |
CN107273363A (zh) * | 2017-05-12 | 2017-10-20 | 清华大学 | 一种语言文本翻译方法及系统 |
CN108304388A (zh) * | 2017-09-12 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 机器翻译方法及装置 |
CN109684648A (zh) * | 2019-01-14 | 2019-04-26 | 浙江大学 | 一种多特征融合的古今汉语自动翻译方法 |
Non-Patent Citations (3)
Title |
---|
Combining Discrete Lexicon Probabilities with NMT for Low-Resource Mongolian-Chinese Translation;Li Jinting 等;《2017 18th International Conference on Parallel and Distributed Computing, Applications and Technologies (PDCAT)》;20180329;第104-111页 * |
神经机器翻译综述;李亚超 等;《计算机学报》;20181231;第41卷(第12期);第2734-2755页 * |
融入依存关联指导的神经机器翻译方法;汪琪 等;《厦门大学学报(自然科学版)》;20190331;第58卷(第2期);第158-163页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110298045A (zh) | 2019-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109840589B (zh) | 一种在fpga上运行卷积神经网络的方法和装置 | |
JP7278477B2 (ja) | 復号化ネットワーク構築方法、音声認識方法、装置、設備及び記憶媒体 | |
US8655647B2 (en) | N-gram selection for practical-sized language models | |
CN108182001B (zh) | 输入纠错方法及装置、存储介质、电子设备 | |
US10902555B2 (en) | Method and device for processing picture | |
CN105869633A (zh) | 语言模型的跨语种初始化 | |
CN112270200B (zh) | 一种文本信息的翻译方法、装置、电子设备和存储介质 | |
WO2023197933A1 (zh) | 信号处理方法、装置、电子设备及介质 | |
CN110875059A (zh) | 收音结束的判断方法、装置以及储存装置 | |
CN113327599B (zh) | 语音识别方法、装置、介质及电子设备 | |
CN112446221A (zh) | 翻译评估方法、装置、系统及计算机存储介质 | |
CN110298045B (zh) | 机器翻译方法、装置、设备及存储介质 | |
JP5790646B2 (ja) | パープレキシティ算出装置 | |
CN109359727B (zh) | 神经网络的结构确定方法、装置、设备及可读介质 | |
US20210150154A1 (en) | Chapter-level text translation method and device | |
WO2021057926A1 (zh) | 一种神经网络模型训练方法及装置 | |
CN113656544A (zh) | 嵌套命名实体识别模型的训练方法、装置、设备和介质 | |
US8886612B2 (en) | Method, apparatus and computer program product for providing improved data compression | |
CN117173269A (zh) | 一种人脸图像生成方法、装置、电子设备和存储介质 | |
KR20210023674A (ko) | Dna 저장 장치의 연성 정보 기반 복호화 방법, 프로그램 및 장치 | |
JP6261669B2 (ja) | クエリ校正システムおよび方法 | |
CN114841325A (zh) | 神经网络模型的数据处理方法、介质及电子设备 | |
CN109285559B (zh) | 角色转换点检测方法及装置、存储介质、电子设备 | |
CN114037965A (zh) | 模型训练和车道线预测方法、设备及自动驾驶车辆 | |
CN109710927B (zh) | 命名实体的识别方法、装置、可读存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |