CN107967262A

CN107967262A - 一种神经网络蒙汉机器翻译方法

Info

Publication number: CN107967262A
Application number: CN201711066025.1A
Authority: CN
Inventors: 苏依拉; 乌尼尔; 刘婉婉; 牛向华; 赵亚平; 王宇飞; 张振; 孙晓骞; 高芬
Original assignee: Inner Mongolia University of Technology
Current assignee: Inner Mongolia University of Technology
Priority date: 2017-11-02
Filing date: 2017-11-02
Publication date: 2018-04-27
Anticipated expiration: 2037-11-02
Also published as: CN107967262B

Abstract

一种神经网络蒙汉机器翻译方法，首先对大规模蒙汉双语语料做规范化处理，在此基础上构建出双语字典；然后进行建模，最终基于所搭建模型，实现机器翻译；其特征在于，所述建模包括编码器建模、解码器建模以及蒙汉双语词对齐所需的注意力层的建模，从而针对蒙古语特定词性的词语进行相应处理，以达到最好的翻译效果和最小的语义困惑度。本发明首先在翻译模型中包含了蒙古语词法信息，用编码器网络对蒙古语的编码进行了较为准确的刻画；其次，算法保证了蒙汉翻译质量；最后，通过运用神经网络，把蒙汉双语翻译问题分解为对蒙古语的编码和对汉语的解码两部分，提出了可扩展性强的神经网络算法，有效提高蒙汉机器翻译译文流利度和翻译质量。

Description

一种神经网络蒙汉机器翻译方法

技术领域

本发明属于机器翻译技术领域，特别涉及一种神经网络蒙汉机器翻译方法。

背景技术

随着目前包含信息技术在内的一系列网络服务的蓬勃发展，自然语言处理尤其是机器翻译在互联网发展过程中起到至关重要的作用。许多的大型搜索企业和服务中心例如谷歌、百度等针对机器翻译都进行了大规模的研究，为获取机器翻译的高质量译文而不懈努力。

然而，随着科学家和语言学家几十年的不断努力，机器翻译在发展的过程中也暴露出无法忽略的问题——歧义词处理、未登录词处理以及双语结构差异而存在的编码混乱导致的译文质量低等问题。目前，国外很多知名大学和企业例如斯坦福大学自然语言处理小组、谷歌NLP小组和Facebook神经机器翻译部门都在相关领域的翻译任务中对上述问题提出了一定的假设解决方案并实施，无论是在英法翻译任务还是在英中翻译任务中，都没有一种兼容性很强的处理方法来解决上述出现的问题。实验结果表明，针对每一种翻译任务，有且仅存在一种符合源语言和目标语言两种语言特性的处理方案来缓解编码过程造成的一系列问题。有文献指出，从统计机器翻译的盛行的20世纪90年代到利用神经网络进行翻译建模的21世纪前10年，虽然在大体上机器翻译质量得到的不小的提高，但是在歧义词处理，非字典词语的替换等问题上仍没有得到有效的解决。因此针对翻译质量的有效提高迫在眉睫。

目前，利用神经网络技术将处理过后的双语语料进行压缩编码并导入神经网络节点中，通过神经网络层与层之间和节点与节点之间的参数变换和传递来不断对语义进行学习。虽然能够通过了解句子意思的方式在一定程度上缓解统计翻译方法中出现的很多问题，例如译码不明、错译、未登陆词处理等问题，但是在精准度上面相比人工翻译仍然存在不小的劣势。

最新的研究显示，谷歌、百度和全国知名院校的机器翻译工作进展中存在或多或少的翻译问题，有文献指出，由于世界语言的复杂性，没有一个完全解决翻译问题的系统出现，因此在粗译的前提下，如何做好细译的工作是各大企业院校的工作重点。

本系统翻译利用CPU和GPU并行工作的方式对语料进行处理使得速度提高近一倍，且通过设定的学习率对语料进行学习可以有效的缓解学习语料语义表达过程中存在的局部最优问题和由于快速收敛导致的编码质量低的问题，通过设定特殊的结构和算法来改进整体系统的质量。

发明内容

为了克服上述中主要存在的翻译过程中的漏译、错译、未登录词处理等缺点，本发明的目的在于提供一种神经网络蒙汉机器翻译方法，针对小语料中的数据稀少和字典小的问题，在降低系统复杂度，对用户可视化系统结构的条件下保证用户翻译服务质量，从而完善蒙汉机器翻译系统，达到较好译文翻译的目标。

为了实现上述目的，本发明采用的技术方案是：

一种神经网络蒙汉机器翻译方法，首先对大规模蒙汉双语语料做规范化处理，在此基础上构建出双语字典；然后进行建模，最终基于所搭建模型，实现机器翻译；所述建模包括编码器建模、解码器建模以及蒙汉双语词对齐所需的注意力层的建模，从而针对蒙古语特定词性的词语进行相应处理，以达到最好的翻译效果和最小的语义困惑度。

所述对大规模蒙汉双语语料做规范化处理是根据分词要求和蒙古语特定词性短语或单词进行切分，其中汉语分词和蒙古语动词词根形态切分建模公式为：

其中，p(y|x)表示当观测数据为x时与观测数据对应的标记数据为y的概率，T(x)表示捕获标记转移的特征函数对应的正因子，c表示常量，k表示节点号，a_k表示模型参数，为特征函数的权重，λ_k表示待学习的模型参数； f_k(y_t-1,y_t,x)是蒙古语单词或汉语单词序列x中t和t-1位置上的输出特征， g_k(y_t,x)是t位置上的捕获当前标记的输出特征函数且表示训练数据上的单一状态，g_k(y_t,x)对应的输出特征函数的状态观测值对y和x定义特征，使建立的模型能够针对双语词汇进行分词和分词根。

所述编码器共有三种，分别为单词编码器、字素编码器和短语编码器；

单词编码器用于源端语言的向量化，将每个单词表示成向量形式，最终构建以单词向量为基础的句向量，其模型公式为：

h_t＝φ(h_t-1,Cw_t)

其中，h_t为t时刻编码器神经网络隐藏层状态，φ为神经网络激活函数， C为映射矩阵，w_t为蒙古语词的向量，通过编码终止符EOS来确定编码的完成，当t为0时刻，h₀就是一个全零的向量，当编码结束时，神经网络中即包含所有蒙古语语言信息；

字素编码器用于缓解源语料和带翻译语料中出现的错误词语，以构词字素为基本单元来遍历检索和编码源语言句子，当出现错误单词时将单词中错误的字素替换为正确字素从而达到改错目的，其模型公式为：

h_tc＝ψ(h_(t-1)c,C_cw_tc)

其中，h_tc为t时刻字素编码器的网络隐藏层状态，ψ为激活函数，C_c为字素的映射矩阵，w_tc为蒙古语构词字素的向量表示；

短语编码器用于将源语言句子中成组出现的短语作为编码器的基本单元进行编码，通过对源语言句子的短语划分来构建基于字典的短语库，进而构建短语编码器，其模型公式为：

h_tp＝γ(h_(t-1)p,C_pw_tp)

其中，h_tp为t时刻短语编码器的网络隐藏层状态，γ为神经网络隐藏层节点激活函数，C_p为短语映射矩阵，w_tp为蒙古语句子包含短语的向量表示；

通过一个融合函数将三种编码器中编码信息进行融合，融合函数中的融合因子为三种编码器在编码条件下对应的激活函数，通过加权得到，如下式所示：

Γ(h_t,h_tc,h_tp)＝α₁h_t+α₂h_tc+α₃h_tp

混合编码器的模型公式为：

h_h＝Γ(h_t,h_tc,h_tp)

其中，Γ为融合函数，包含三种激活函数集合，α₁,α₂,α₃表示三种编码器通过随机初始化的对应权重，通过加入三种编码状态整合成为包含字素、单词、短语三类向量信息的编码器。

所述解码器建模的模型公式为：

p(y_t)＝softmax(W_sφ_θ'(c,y_t-1,z_t-1)+b_z)

其中，p(y_t)表示t时刻解码汉语词汇的概率，c表示蒙古语句子的向量化压缩表示，z_t-1表示前一时刻解码器神经网络隐藏层状态，b_z表示t时刻隐藏层偏置，下标z表示t时刻解码器神经网络隐藏层状态y_t表示t时刻的目标词，W_s表示神经网络节点之间的连接权重，φ_θ'表示隐藏层神经元激活函数。

所述蒙汉双语词对齐所需的注意力层的建模如下：a表示编码器中的蒙古语句子和解码器汉语句子中的对齐比重，以加权模式和加权激活模式两种方法对注意力层进行设计，其建模公式为：

其中，W为神经网络权重矩阵，m_t和m_s表示蒙汉双语中对应的词向量， m_t表示目标端汉语词向量，m_s表示源端蒙古语词向量，S′表示源端句子中蒙古语词语个数。

所述基于所搭建模型，实现机器翻译的步骤包括编码环节和解码环节，所述编码环节，将蒙古语进行向量化处理并确定维度；所述解码环节分为注意力层部分和解码部分，其中注意力层部分为对齐概率计算模型和对齐位置预测模型；通过对齐概率计算模型计算出蒙汉双语在句子对齐的基础上，词语之间对齐的概率，而对齐位置预测模型能够将每个词出现的位置信息进行相应的预测；所述解码部分又分为遍历隐藏层节点和输出两部分，通过遍历隐藏层节点来对当前时刻的向量信息进行检索，判定是否符合语义要求，若符合语义要求则将符合要求的向量信息传送给输出函数，通过归一化操作将输出向量解码为译文进行输出，且输出函数符合最优值。

所述编码环节，基于单词编码器、字素编码器和短语编码器，将蒙古语进行向量化处理并确定维度；

所述对齐概率计算模型如下式所示：

align_t(S)表示双语句子之间的词对齐概率，同时作为输出函数，a_t(h_t,h_s)表示源端和目标端词语对齐权重，表示高斯分布；通过词对齐概率计算公式来计算t时刻源语言词语对应的目标词；

所述对齐位置预测模型如下式所示：

sigmoid为激活函数，取值为-1到1，和W_p都是学习预测位置的模型参数，p表示位置信息，T表示总时序数，S表示源语言长度；

所述通过遍历隐藏层节点来对当前时刻的信息进行检索，判定是否符合语义要求的具体实现过程如下：

当前时刻隐藏层节点记忆单元获取来自上一时刻隐藏层节点信息和当前时刻输入信息，通过门控单元激活函数来确定是否准许信息进入当前时刻记忆单元，若准许进入则判定为符合语义要求，否则不能进入，门控单元激活函数公式如下所示：

input_t＝θ(W_i·[C_t-1,h_t-1x_t]+b_i)

W_i表示与门控单元连接的t-1刻隐藏层信息和当前输入信息的连接权重， C_t-1为t-1时刻上下文信息，h_t-1为t-1时刻隐藏层信息，x_t为t时刻输入信息， b_i为门控单元偏置，θ为双曲正切函数。

所述针对蒙古语特定词性的词语进行相应处理指将蒙古语动词以词干词缀形式切分，并将切分向量导入编码器中。

翻译整体过程执行算法如下：

1)：将蒙古语汉语语料向量化；

2)：根据编码器编码信息来对解码器进行处理；

3)：采用输出函数进行输出特征的操作； p(y_t)＝softmax(W_sφ_θ'(c,y_t-1,z_t-1)+b_z)

4)：根据时间序列t和t-1时刻目标词y_t-1预测目标词y_t的概率。

在翻译之后，还可进行评测，评测算法如下：

1)：导入评测译文E进蒙汉机器翻译模型；

2)：利用下式进行翻译

3)：评测译文质量算法如下：

其中，E表示待评测译文，Ec表示评测译文的质量，S_t表示t时刻对应的源语言句子，T_t表示t时刻源语言句子对应的目标语句子。I_t表示t时刻源语言句子对应的参考译文。ls表示参考译文的有效长度，lc表示候选译文的有效长度， cP(c,s)表示精确度度量，ω_n表示候选译文对应语言模型的权重。

与现有的蒙汉机器翻译算法相比，本发明首先在翻译模型中包含了蒙古语词法信息，对编码器网络对蒙古语的编码进行了较为准确的刻画；其次，算法保证了蒙汉翻译质量；最后，通过运用神经网络，把蒙汉双语翻译问题分解为对蒙古语的编码器和对汉语的解码两部分，提出了可扩展性强的神经网络算法，解决机器翻译系统中存在漏译、错译问题并有效提高蒙汉机器翻译译文流利度和翻译质量。

附图说明

图1是混合编码器架构图。

图2是神经网络蒙汉机器翻译整体结构图。

图3是本发明所搭建模型的流程图。

具体实施方式

下面结合附图和实施例详细说明本发明的实施方式。

问题描述：基于神经网络的蒙汉翻译系统模型包括混合编码器和解码器的构建+错译漏译处理模型。

如图1所示为混合编码器的构成，由三类编码器构成，包括字素级编码器、词级编码器以及短语编码器，分别以字素、词和短语为构成句子的基本单位来编码，在编码器结尾通过融合函数将三类编码器对应的向量信息进行融合，进而构成混合编码器。

图2为机器翻译系统的整体结构图，由混合编码器、注意力机制和解码器构成，训练时混合编码器编码三种形态的句子编码信息并送入解码器，解码器通过注意力机制计算目标端词语对应的源端词语概率，通过参数存入神经网络中，翻译时通过解码器端softmax输出函数进行翻译预测。

图3为模型流程图，蒙古语语料进入编码器前需要进行词性处理，包括蒙古语词干词缀切分，同时保证蒙古语和汉语双语语料为句对齐语料。由神经网络构建混合编码器和解码器的过程中加入注意力机制来获取双语词对齐概率并以参数形式存于神经网络记忆单元中，以此来完成模型的搭建。测试时利用蒙古语作为源语言导入蒙汉机器翻译模型中，生成译文来进行系统的评测。

蒙汉翻译系统结构约束：神经网络词编码器节点数<＝D_n、层数<＝L_n。

决策变量：在编码器端输入蒙古语句子，在解码器输出端输出对应的汉语句子。

其中，D_n是编码器神经网络中的单层节点数上界，L_n是编码器神经网络层次数目上界。

本发明包括以下部分：

1.蒙汉机器翻译系统模型，包括一下几个部分：

A.神经网络系统编码器描述：假设编码器数量为n，编码器隐藏层数量l，层次数量为a，隐藏层节点激活函数为o。则一个编码器的编码源语言s的建模函数的表示形式如公式：

Encoder＝n·l·a·o(s)

其中，Encoder表示编码器编码状态，包括编码器类型、编码器层数、节点数和激活函数等。总编码状态也可表示为

B.神经网络系统解码器描述：假设解码器源语言端上下文向量为k。对齐词计算注意力机制函数为attention，输出接口函数为softmax，则输出解码函数为：

p(y_t|y_<t,x)＝softmax(y_t-1,h_t,k_t)

其中，p代表t时刻生成目标词的概率。x表示当前输入端词语。将公式中上下文向量k进一步细化为：

其中，V代表权重矩阵，U表示权重逆矩阵，在激活函数tanh下的激活值。不失一般性，可假设激活函数的激活范围在[-1，1]之间，因此解码器端输出目标词概率可整理为：

2.错译漏译处理模型，包括以下部分：

A.集外词及罕见词处理：集外词对于翻译性能和实用性的影响非常巨大，如何处理集外词并达到开放词典一直是NMT的主要研究方向。传统方法基于单词级别来处理该问题，比如使用UNK替换、扩大词典规模等方法，往往治标不治本。因此本系统针对蒙古语语言和语法特点提出基于蒙古语字素的NMT集外词处理模型。这种字符级方法的主要优势包括不受语言的形态变化、能预测出词典中未出现的单词并降低词典大小等。其中蒙古语字素的拆分策略借鉴BPE 压缩算法。不同于霍夫曼编码，该压缩算法不是针对于词做变长编码，而是对于子词来操作。这样，即使是训练语料里未见过的新词，也可以通过子词的拼接来生成翻译。集外词处理算法如下：

B.翻译结果的惩罚函数

根据翻译结果设定惩罚函数，利用惩罚函数的归一功能将翻译结果长度归一化，从而实现翻译的功能。

模型具体算法如下：

1：将蒙古语汉语语料向量化；

2：根据编码器编码信息来对解码器进行处理；

3：采用输出函数进行输出特征的操作；

p(y_t)＝softmax(W_sφ_θ'(c,y_t-1,z_t-1)+b_z)

4：根据时间序列t和t-1时刻目标词y_t-1预测目标词y_t的概率；

所述用户端评测执行算法如下：

1：loop

2：导入评测译文E进蒙汉机器翻译模型；

3：利用下式进行翻译

4：评测译文质量算法如下：

5：end loop。

Claims

1.一种神经网络蒙汉机器翻译方法，首先对大规模蒙汉双语语料做规范化处理，在此基础上构建出双语字典；然后进行建模，最终基于所搭建模型，实现机器翻译；其特征在于，所述建模包括编码器建模、解码器建模以及蒙汉双语词对齐所需的注意力层的建模，从而针对蒙古语特定词性的词语进行相应处理，以达到最好的翻译效果和最小的语义困惑度。

2.根据权利要求1所述神经网络蒙汉机器翻译方法，其特征在于，所述对大规模蒙汉双语语料做规范化处理是根据分词要求和蒙古语特定词性短语或单词进行切分，其中汉语分词和蒙古语动词词根形态切分建模公式为：

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>y</mi> <mo>|</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mi>T</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mi>exp</mi> <munder> <mo>&Sigma;</mo> <mrow> <mi>t</mi> <mo>,</mo> <mi>k</mi> </mrow> </munder> <msub> <mi>&lambda;</mi> <mi>k</mi> </msub> <msub> <mi>f</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>y</mi> <mi>t</mi> </msub> <mo>,</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>+</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>t</mi> <mo>,</mo> <mi>k</mi> </mrow> </munder> <msub> <mi>a</mi> <mi>k</mi> </msub> <msub> <mi>g</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>t</mi> </msub> <mo>,</mo> <mi>x</mi> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>T</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>exp</mi> <mrow> <mo>(</mo> <munder> <mo>&Sigma;</mo> <mi>t</mi> </munder> <munder> <mo>&Sigma;</mo> <mi>k</mi> </munder> <msub> <mi>&lambda;</mi> <mi>k</mi> </msub> <msub> <mi>f</mi> <mi>k</mi> </msub> <mo>(</mo> <mrow> <mi>c</mi> <mo>,</mo> <msub> <mi>y</mi> <mi>t</mi> </msub> <mo>,</mo> <mi>x</mi> </mrow> <mo>)</mo> <mo>)</mo> </mrow> </mrow>

其中，p(y|x)表示当观测数据为x时与观测数据对应的标记数据为y的概率，T(x)表示捕获标记转移的特征函数对应的正因子，c表示常量，k表示节点号，a_k表示模型参数，为特征函数的权重，λ_k表示待学习的模型参数；f_k(y_t-1,y_t,x)是蒙古语单词或汉语单词序列x中t和t-1位置上的输出特征，g_k(y_t,x)是t位置上的捕获当前标记的输出特征函数且表示训练数据上的单一状态，g_k(y_t,x)对应的输出特征函数的状态观测值对y和x定义特征，使建立的模型能够针对双语词汇进行分词和分词根。

3.根据权利要求1所述神经网络蒙汉机器翻译方法，其特征在于，所述编码器共有三种，分别为单词编码器、字素编码器和短语编码器；

h_t＝φ(h_t-1,Cw_t)

其中，h_t为t时刻编码器神经网络隐藏层状态，φ为神经网络激活函数，C为映射矩阵，w_t为蒙古语词的向量，通过编码终止符EOS来确定编码的完成，当t为0时刻，h₀就是一个全零的向量，当编码结束时，神经网络中即包含所有蒙古语语言信息；

h_tc＝ψ(h_(t-1)c,C_cw_tc)

h_tp＝γ(h_(t-1)p,C_pw_tp)

Γ(h_t,h_tc,h_tp)＝α₁h_t+α₂h_tc+α₃h_tp

混合编码器的模型公式为：

h_h＝Γ(h_t,h_tc,h_tp)

4.根据权利要求3所述神经网络蒙汉机器翻译方法，其特征在于，所述解码器建模的模型公式为：

p(y_t)＝soft max(W_sφ_θ'(c,y_t-1,z_t-1)+b_z)

5.根据权利要求1所述神经网络蒙汉机器翻译方法，其特征在于，所述蒙汉双语词对齐所需的注意力层的建模如下：a表示编码器中的蒙古语句子和解码器汉语句子中的对齐比重，以加权模式和加权激活模式两种方法对注意力层进行设计，其建模公式为：

<mrow> <msub> <mi>a</mi> <mi>t</mi> </msub> <mo>=</mo> <mfrac> <mrow> <mi>exp</mi> <mrow> <mo>(</mo> <msub> <mi>W</mi> <mi>a</mi> </msub> <mo>&lsqb;</mo> <msub> <mi>m</mi> <mi>t</mi> </msub> <mo>;</mo> <msub> <mi>m</mi> <mi>s</mi> </msub> <mo>&rsqb;</mo> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>&Sigma;</mi> <msup> <mi>s</mi> <mo>&prime;</mo> </msup> </msub> <mi>exp</mi> <mrow> <mo>(</mo> <msub> <mi>W</mi> <mi>a</mi> </msub> <mo>&lsqb;</mo> <msub> <mi>m</mi> <mi>t</mi> </msub> <mo>;</mo> <msub> <mi>m</mi> <mi>s</mi> </msub> <mo>&rsqb;</mo> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>

其中，W为神经网络权重矩阵，m_t和m_s表示蒙汉双语中对应的词向量，m_t表示目标端汉语词向量，m_s表示源端蒙古语词向量，S′表示源端句子中蒙古语词语个数。

6.根据权利要求1所述神经网络蒙汉机器翻译方法，其特征在于，所述基于所搭建模型，实现机器翻译的步骤包括编码环节和解码环节，所述编码环节，将蒙古语进行向量化处理并确定维度；所述解码环节分为注意力层部分和解码部分，其中注意力层部分为对齐概率计算模型和对齐位置预测模型；通过对齐概率计算模型计算出蒙汉双语在句子对齐的基础上，词语之间对齐的概率，而对齐位置预测模型能够将每个词出现的位置信息进行相应的预测；所述解码部分又分为遍历隐藏层节点和输出两部分，通过遍历隐藏层节点来对当前时刻的向量信息进行检索，判定是否符合语义要求，若符合语义要求则将符合要求的向量信息传送给输出函数，通过归一化操作将输出向量解码为译文进行输出，且输出函数符合最优值。

7.根据权利要求6所述神经网络蒙汉机器翻译方法，其特征在于，所述编码环节，基于单词编码器、字素编码器和短语编码器，将蒙古语进行向量化处理并确定维度；

所述对齐概率计算模型如下式所示：

<mrow> <msub> <mi>align</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mi>S</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>a</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>t</mi> </msub> <mo>,</mo> <msub> <mi>h</mi> <mi>s</mi> </msub> <mo>)</mo> </mrow> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mfrac> <msup> <mrow> <mo>(</mo> <mi>s</mi> <mo>-</mo> <msub> <mi>p</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mrow> <mn>2</mn> <msup> <mi>&sigma;</mi> <mn>2</mn> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> </mrow>

所述对齐位置预测模型如下式所示：

<mrow> <msub> <mi>position</mi> <mi>t</mi> </msub> <mo>=</mo> <mi>S</mi> <mo>&CenterDot;</mo> <mi>s</mi> <mi>i</mi> <mi>g</mi> <mi>m</mi> <mi>o</mi> <mi>i</mi> <mi>d</mi> <mrow> <mo>(</mo> <msubsup> <mi>v</mi> <mi>p</mi> <mi>T</mi> </msubsup> <mi>tanh</mi> <mo>(</mo> <mrow> <msub> <mi>W</mi> <mi>p</mi> </msub> <msub> <mi>h</mi> <mi>t</mi> </msub> </mrow> <mo>)</mo> <mo>)</mo> </mrow> </mrow>

input_t＝θ(W_i·[C_t-1,h_t-1x_t]+b_i)

W_i表示与门控单元连接的t-1刻隐藏层信息和当前输入信息的连接权重，C_t-1为t-1时刻上下文信息，h_t-1为t-1时刻隐藏层信息，x_t为t时刻输入信息，b_i为门控单元偏置，θ为双曲正切函数。

8.根据权利要求1所述神经网络蒙汉机器翻译方法，其特征在于，所述针对蒙古语特定词性的词语进行相应处理指将蒙古语动词以词干词缀形式切分，并将切分向量导入编码器中。

9.根据权利要求1所述神经网络蒙汉机器翻译方法，其特征在于，翻译整体过程执行算法如下：

1)：将蒙古语汉语语料向量化；

2)：根据编码器编码信息来对解码器进行处理；

3)：采用输出函数进行输出特征的操作；p(y_t)＝softmax(W_sφ_θ'(c,y_t-1,z_t-1)+b_z)

10.根据权利要求1所述神经网络蒙汉机器翻译方法，其特征在于，在翻译之后，还进行评测，评测算法如下：

1)：导入评测译文E进蒙汉机器翻译模型；

2)：利用下式进行翻译

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>t</mi> </msub> <mo>|</mo> <msub> <mi>S</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>I</mi> <mi>t</mi> </mrow> </munder> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>t</mi> </msub> <mo>,</mo> <msub> <mi>I</mi> <mi>t</mi> </msub> <mo>|</mo> <msub> <mi>S</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> </mrow>

3)：评测译文质量算法如下：

<mrow> <mi>E</mi> <mi>c</mi> <mo>,</mo> <mi>s</mi> <mo>=</mo> <mo>{</mo> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>,</mo> <mi>l</mi> <mi>c</mi> <mo>></mo> <mi>l</mi> <mi>s</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msup> <mi>e</mi> <mrow> <mn>1</mn> <mo>-</mo> <mfrac> <mrow> <mi>l</mi> <mi>s</mi> </mrow> <mrow> <mi>l</mi> <mi>c</mi> </mrow> </mfrac> </mrow> </msup> <mo>,</mo> <mi>l</mi> <mi>c</mi> <mo>&le;</mo> <mi>l</mi> <mi>s</mi> </mrow> </mtd> </mtr> </mtable> <mo>,</mo> <mi>exp</mi> <mrow> <mo>(</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>&omega;</mi> <mi>n</mi> </msub> <mi>log</mi> <mi>c</mi> <mi> </mi> <mi>P</mi> <mo>(</mo> <mrow> <mi>c</mi> <mo>,</mo> <mi>s</mi> </mrow> <mo>)</mo> <mo>)</mo> </mrow> </mrow>

其中，E表示待评测译文，Ec表示评测译文的质量，S_t表示t时刻对应的源语言句子，T_t表示t时刻源语言句子对应的目标语句子。I_t表示t时刻源语言句子对应的参考译文。ls表示参考译文的有效长度，lc表示候选译文的有效长度，cP(c,s)表示精确度度量，ω_n表示候选译文对应语言模型的权重。