CN110826345B - 一种机器翻译方法和装置 - Google Patents
一种机器翻译方法和装置 Download PDFInfo
- Publication number
- CN110826345B CN110826345B CN201911115167.1A CN201911115167A CN110826345B CN 110826345 B CN110826345 B CN 110826345B CN 201911115167 A CN201911115167 A CN 201911115167A CN 110826345 B CN110826345 B CN 110826345B
- Authority
- CN
- China
- Prior art keywords
- translation result
- preliminary
- source language
- character
- language text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明提供了一种机器翻译方法和装置,其中,该方法包括:获取源语言文本,对所述源语言文本进行处理,得到所述源语言文本中各字符的上下文相关编码表示;对所述源语言文本中各所述字符的上下文相关编码表示进行对齐翻译,得到所述源语言文本的初步翻译结果;其中,所述初步翻译结果与所述源语言文本的语义一致;对所述初步翻译结果中的字符进行修正,得到所述源语言文本对应的目标语言翻译结果。通过本发明实施例提供的机器翻译方法和装置,无需逐字对源语言文本进行翻译,即使源语言文本较长字数较多,也可以保证对源语言文本的翻译效率。
Description
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种机器翻译方法和装置。
背景技术
目前,机器翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。本国人可以在外国旅游或者与外国人交流时,使用机器翻译软件,将本国人使用的语言转换成旅游地或者外国人懂的语言,从而与外国人交流。
机器翻译软件在获取到源语言文本后,会逐字对源语言文本中的字符进行翻译,得到目标语言文本。
当源语言文本较长字数较多时,逐字翻译的效率较低。
发明内容
为解决上述问题,本发明实施例的目的在于提供一种机器翻译方法和装置。
第一方面,本发明实施例提供了一种机器翻译方法,包括:
获取源语言文本,对所述源语言文本进行处理,得到所述源语言文本中各字符的上下文相关编码表示;
对所述源语言文本中各所述字符的上下文相关编码表示进行对齐翻译,得到所述源语言文本的初步翻译结果;其中,所述初步翻译结果与所述源语言文本的语义一致;
对所述初步翻译结果中的字符进行修正,得到所述源语言文本对应的目标语言翻译结果。
第二方面,本发明实施例还提供了一种机器翻译装置,包括:
获取模块,用于获取源语言文本,对所述源语言文本进行处理,得到所述源语言文本中各字符的上下文相关编码表示;
翻译模块,用于对所述源语言文本中各所述字符的上下文相关编码表示进行对齐翻译,得到所述源语言文本的初步翻译结果;其中,所述初步翻译结果与所述源语言文本的语义一致;
修正模块,用于对所述初步翻译结果中的字符进行修正,得到所述源语言文本对应的目标语言翻译结果。
第三方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面所述的方法的步骤。
第四方面,本发明实施例还提供了一种机器翻译装置,所述机器翻译装置包括有存储器,处理器以及一个或者一个以上的程序,其中所述一个或者一个以上程序存储于所述存储器中,且经配置以由所述处理器执行上述第一方面所述的方法的步骤。
本发明实施例上述第一方面至第四方面提供的方案中,通过对源语言文本中各字符的上下文相关编码表示进行对齐翻译,得到与所述源语言文本语义一致的初步翻译结果,并对初步翻译结果进行修正,就可以得到所述源语言文本对应的目标语言翻译结果,与相关技术中逐字对源语言文本中的字符进行翻译得到目标语言文本的方式相比,先一次得到与所述源语言文本语义一致的初步翻译结果,然后对得到的初步翻译结果进行修正,得到所述源语言文本对应的目标语言翻译结果,无需逐字对源语言文本进行翻译,就可以得到目标语言翻译结果,即使源语言文本较长字数较多,也可以保证对源语言文本的翻译效率。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例1所提供的一种机器翻译方法的流程图;
图2示出了本发明实施例2所提供的一种机器翻译装置的结构示意图;
图3示出了本发明实施例3所提供的另一种机器翻译装置的结构示意图。
具体实施方式
目前,机器翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。本国人可以在外国旅游或者与外国人交流时,使用机器翻译软件,将本国人使用的语言转换成旅游地或者外国人懂的语言,从而与外国人交流。
现有的机器翻译过程大都是基于自回归的方法。所谓自回归,也就是机器翻译软件使用的机器翻译模型对句子一个一个进行字符生成。比如句子“我爱北京”这个简单的句子,机器翻译模型首先生成了“我”,然后再生成“爱”,接下来生成“北”,最后才是生成“京”。
这样的使用自回归过程的机器翻译模型有两大缺点:一是生成效率十分低下,如果要生成的序列很长,那么会非常耗时;比如,对于一个长为50个字的句子,机器翻译模型需要进行50次迭代,才可以得到目标语言文本;如果机器翻译模型的计算量很大,那么将非常耗时。
二是存在记忆遗忘问题,即机器翻译模型在生成后面的字符时会遗忘之前生成的字符,从而导致生成的句子中字符的重复生成和生成的句子前后不一致的问题。而且,当生成后面的字符时,使用自回归过程的机器翻译模型很可能已经遗忘了前面字符的信息,导致生成句子的前后不一致。比如前面生成了“北京”,后面却生成了“上海”,这样会带来巨大的干扰。
而如果使用非自回归的机器翻译模型,可以同时解决上述两个问题:一次生成、修改多个字符既可以提高效率,比如还是“我爱北京”,模型就需要3次迭代,第1次生成“我”,第2次生成“爱”,第3次生成“北京”。所以,当要生成的句子非常长的时候,非自回归的机器翻译模型迭代的次数会显著减少。而且,还可以保留过去生成和修改字符的已执行修正记录。
非自回归的机器翻译模型可以使用非自回归的迭代修改生成方法,可以有效解决自回归的机器翻译模型翻译过程中出现的字符重复生成和生成的句子前后不一致的问题。
对于源语言和目标语言之间的不一致,由于迭代修改方法第一次就生成了源语言对应的目标语言翻译句子,虽然这个句子不通顺,但是语义上是和源语言保持一致的,之后的迭代修改也是在此基础上进行的,无论如何都不会脱离源语言的语义范畴;对于翻译句子前后的不一致,迭代修改可以对句子的任意位置进行修改,从而避免句子中前后字词之间的遗忘情况出现。
基于此,本实施例提出一种机器翻译方法和装置,先一次得到与所述源语言文本语义一致的初步翻译结果,然后对得到的初步翻译结果进行修正,得到所述源语言文本对应的目标语言翻译结果,无需逐字对源语言文本进行翻译,就可以得到目标语言翻译结果,即使源语言文本较长字数较多,也可以保证对源语言文本的翻译效率。
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请做进一步详细的说明。
实施例1
本实施例提出一种机器翻译方法,执行主体是服务器。
所述服务器为了对源语言文本进行翻译,运行有注意力变换模型、字到字或词到词的对齐翻译器、以及解码器。
所述注意力变换模型,用于对服务器得到的源语言文本进行处理,得到所述源语言文本中各字符的上下文相关编码表示。
所述字到字或词到词的对齐翻译器,用于对所述源语言文本中各字符的上下文相关编码表示进行翻译,得到所述源语言文本的初步翻译结果。
所述解码器,用于得到源语言文本中各字符的操作标签。
所述服务器,可以是任何可以将源语言文本翻译成目标语言结果的计算设备,这里不再一一赘述。
参见图1所示的一种机器翻译方法的流程图,本实施例提出一种机器翻译方法,包括以下具体步骤:
步骤100、获取源语言文本,对所述源语言文本进行处理,得到所述源语言文本中各字符的上下文相关编码表示。
在上述步骤100中,服务器获取用户输入的源语言文本后,将所述源语言文本输入到服务器中运行的注意力变换模型中,对所述源语言文本进行处理,得到所述源语言文本的上下文相关编码表示。
所述上下文相关编码表示,为能够表达源语言文本中各字符的含义、以及相邻字或者词之间相互关系的特征向量。
所述字符,可以是但不限于:字、词组、以及短语。
步骤102、对所述源语言文本中各所述字符的上下文相关编码表示进行对齐翻译,得到所述源语言文本的初步翻译结果;其中,所述初步翻译结果与所述源语言文本的语义一致。
在上述步骤102中,服务器将得到的所述源语言文本中各所述字符的上下文相关编码表示输入到字到字或词到词的对齐翻译器,得到所述源语言文本的初步翻译结果,具体翻译得到初步翻译结果的过程是现有技术,这里不再赘述。
所述字到字或词到词的对齐翻译器,可以是但不限于:预训练得到的机器翻译神经网络和翻译词典。所述字到字或词到词的对齐翻译器能够在语义不变的情况下对所述源语言文本进行翻译,从而得到与所述源语言文本语义一致的初步翻译结果。
步骤104、对所述初步翻译结果中的字符进行修正,得到所述源语言文本对应的目标语言翻译结果。
具体地,为了对所述初步翻译结果中的字符进行修正,上述步骤104可以执行以下步骤(1)至步骤(9):
(1)获取所述初步翻译结果的已执行修正记录;所述已执行修正记录,包括:每次对所述初步翻译结果中各字符进行修正时使用的操作标签;所述操作标签,包括:交换标签、删除标签、插入标签、替换标签或者保留标签;
(2)对所述初步翻译结果的字符进行特征提取,得到所述初步翻译结果的字符的语义特征,并根据得到的语义特征确定所述初步翻译结果的字符的语义表示;
(3)根据所述源语言文本中各字符的上下文相关编码表示、所述初步翻译结果的字符的语义表示、以及所述已执行修正记录,确定当前对所述初步翻译结果中各字符的操作标签;
(4)当确定当前所述初步翻译结果中各字符的操作标签中都是保留标签时,将所述初步翻译结果作为所述源语言文本对应的目标语言翻译结果;
(5)当确定当前对所述初步翻译结果中各字符的操作标签中存在除所述保留标签的其他操作标签时,根据当前确定的各字符的操作标签对应的修正方式对所述初步翻译结果中各字符进行修正,得到修正后的初步翻译结果;
(6)对修正操作次数进行增量操作,当所述修正操作次数达到修正操作阈值时,将所述修正后的初步翻译结果作为所述源语言文本对应的目标语言翻译结果;
(7)当所述修正操作次数未达到修正操作次数时,通过语言模型对修正后的初步翻译结果进行处理,得到修正后的初步翻译结果的分数;
(8)当所述分数大于等于分数阈值时,将所述修正后的初步翻译结果作为所述源语言文本对应的目标语言翻译结果;
(9)当所述分数小于分数阈值时,将当前对所述初步翻译结果中各字符的操作标签存储到所述已执行修正记录中,利用所述修正后的初步翻译结果对所述初步翻译结果进行更新,并返回所述步骤(1)。
在上述步骤(1)中,所述已执行修正记录,缓存在服务器中。
所述交换标签,用于指示服务器将所述初步翻译结果中具有交换标签的字符的位置进行交换。
所述删除标签,用于指示服务器将所述初步翻译结果中具有删除标签的字符删除。
所述插入标签,用于指示服务器在所述初步翻译结果中具有插入标签的字符之前插入其他的字符。
所述替换标签,用于指示服务器将所述初步翻译结果中具有替换标签的字符替换成其他的字符。
所述保留标签,用于指示服务器不对所述初步翻译结果中具有保留标签的字符进行任何操作。
在上述步骤(2)中,可以使用现有的任何神经网络模型,对所述初步翻译结果的字符进行特征提取,得到所述初步翻译结果的字符的语义特征,并根据得到的语义特征确定所述初步翻译结果的字符的语义表示,这里不再赘述。
在上述步骤(3)中,针对所述源语言文本中的一个字符来说,将所述源语言文本中该字符的上下文相关编码表示、所述初步翻译结果中该字符的语义表示、以及所述已执行修正记录中该字符的修正记录输入解码器中,解码器先把该字符的上下文相关编码表示、该字符的语义表示、以及该字符的修正记录输入一个五元分类器中,该五元分类器的输出结果就是该字符的操作标签。
所述五元分类器根据输入的该字符的上下文相关编码表示、该字符的语义表示、以及该字符的修正记录,可以先得到该字符执行各操作的处理概率,取处理概率最大的操作标签作为当前该字符的操作标签。具体过程是现有技术,这里不再赘述。
如:所述五元分类器得到该字符执行各操作的处理概率如下:交换操作概率=0.1,删除操作概率=0.1,插入操作概率=0.2,替换操作概率=0.1,保留操作概率=0.5,那么就可以确定当前该字符的操作标签为保留标签。
当该字符的操作标签是交换标签时,解码器将该字符的语义表示和交换标签输入另一个分类器中,另一个分类器就可以得到该字符需要交换的字符。
当该字符的操作标签是插入标签时,解码器将该字符的语义表示和插入标签输入另一个分类器中,就可以得到在该字符之前需要插入的字符。
当该字符的操作标签是替换标签时,解码器将该字符的语义表示和替换标签输入另一个分类器中,就可以得到替换该字符使用的字符。
当该字符的操作标签是删除标签时,解码器向服务器反馈该字符需要删除,对该字符进行删除操作。
上述另一个分类器根据解码器输入的字符和各种操作标签,在操作标签是交换标签时得到该字符需要交换的字符的过程、在操作标签是插入标签时得到在该字符之前需要插入的字符的过程、以及在操作标签是替换标签时得到替换该字符使用的字符的过程,均为现有技术,这里不再赘述。
当该字符的操作标签是保留标签时,解码器向服务器反馈该字符需要保留,当前不应进行任何操作。
在一个实施方式中,每个字符的操作标签P可以表示为P=(X,R,Y),其中,X表示所述源语言文本中各字符的上下文相关编码表示;R表示所述初步翻译结果的各字符的语义表示;Y表示所述初步翻译结果的各字符的已执行修正记录;P的长度为当前句子的长度,每一个操作标签P都表示了当前该字符应该进行怎样的操作。
在上述步骤(4)中,当前对所述初步翻译结果中各字符的操作标签中都是保留标签,说明无需再对所述初步翻译结果进行修正,可以将所述初步翻译结果作为所述源语言文本对应的目标语言翻译结果。
在上述步骤(6)中,所述修正操作次数和所述修正操作阈值,缓存在服务器中。
对修正操作次数进行增量操作,就是对当前的所述修正操作次数进行加一操作。
在上述步骤(7)中,在一个实施方式中,所述语言模型,可以采用注意力变换模型。
所述分数,用于表示修正后的初步翻译结果的阅读通顺程度。所述分数越高,说明修正后的初步翻译结果的阅读通顺程度越好。
所述分数阈值,缓存在所述服务器中,用于表示修正后的初步翻译结果阅读起来比较通顺的情况下,初步翻译结果得到的分数。
通过语言模型对修正后的初步翻译结果进行处理,得到修正后的初步翻译结果的分数的过程为现有技术,这里不再赘述。
而且,可以通过具体的学习策略去控制字符修正的顺序,比如可以控制服务器先生成主语,再生成谓语;当然也可以让服务器自动学习迭代修正的顺序。再者,因为服务器自动学习修正的顺序就是服务器自身认为最容易学习的顺序,因此可以将服务器的修正顺序解释为“最优”顺序,体现了服务器自动学习迭代修正的顺序的可解释性。
综上所述,本实施例提出的一种机器翻译方法,通过对源语言文本中各字符的上下文相关编码表示进行对齐翻译,得到与所述源语言文本语义一致的初步翻译结果,并对初步翻译结果进行修正,就可以得到所述源语言文本对应的目标语言翻译结果,与相关技术中逐字对源语言文本中的字符进行翻译得到目标语言文本的方式相比,先一次得到与所述源语言文本语义一致的初步翻译结果,然后对得到的初步翻译结果进行修正,得到所述源语言文本对应的目标语言翻译结果,无需逐字对源语言文本进行翻译,就可以得到目标语言翻译结果,即使源语言文本较长字数较多,也可以保证对源语言文本的翻译效率。
实施例2
本实施例提出一种机器翻译装置,用于执行上述实施例1提出的机器翻译方法。
参见图2所示的一种机器翻译装置的结构流程图,本实施例提出的一种机器翻译装置,包括:
获取模块200,用于获取源语言文本,对所述源语言文本进行处理,得到所述源语言文本中各字符的上下文相关编码表示;
翻译模块202,用于对所述源语言文本中各所述字符的上下文相关编码表示进行对齐翻译,得到所述源语言文本的初步翻译结果;其中,所述初步翻译结果与所述源语言文本的语义一致;
修正模块204,用于对所述初步翻译结果中的字符进行修正,得到所述源语言文本对应的目标语言翻译结果。
所述修正模块204,具体用于:
获取所述初步翻译结果的已执行修正记录;所述已执行修正记录,包括:每次对所述初步翻译结果中各字符进行修正时使用的操作标签;所述操作标签,包括:交换标签、删除标签、插入标签、替换标签或者保留标签;
对所述初步翻译结果的字符进行特征提取,得到所述初步翻译结果的字符的语义特征,并根据得到的语义特征确定所述初步翻译结果的字符的语义表示;
根据所述源语言文本中各字符的上下文相关编码表示、所述初步翻译结果的字符的语义表示、以及所述已执行修正记录,确定当前对所述初步翻译结果中各字符的操作标签;
根据当前确定的各字符的操作标签对应的修正方式对所述初步翻译结果中各字符进行修正,得到修正后的初步翻译结果;
对修正操作次数进行增量操作,当所述修正操作次数达到修正操作阈值时,将所述修正后的初步翻译结果作为所述源语言文本对应的目标语言翻译结果。
所述修正模块204,还具体用于:
当所述修正操作次数未达到修正操作次数时,通过语言模型对修正后的初步翻译结果进行处理,得到修正后的初步翻译结果的分数;
当所述分数大于等于分数阈值时,将所述修正后的初步翻译结果作为所述源语言文本对应的目标语言翻译结果;
当所述分数小于分数阈值时,将当前对所述初步翻译结果中各字符的操作标签存储到所述已执行修正记录中,利用所述修正后的初步翻译结果对所述初步翻译结果进行更新,并返回所述获取所述初步翻译结果的已执行修正记录步骤。
所述修正模块204,还具体用于:
当确定当前所述初步翻译结果中各字符的操作标签中都是保留标签时,将所述初步翻译结果作为所述源语言文本对应的目标语言翻译结果;
当确定当前对所述初步翻译结果中各字符的操作标签中存在除所述保留标签的其他操作标签时,继续执行所述根据当前确定的各字符的操作标签对应的修正方式对所述初步翻译结果中各字符进行修正,得到修正后的初步翻译结果步骤。
综上所述,本实施例提出的一种机器翻译装置,通过对源语言文本中各字符的上下文相关编码表示进行对齐翻译,得到与所述源语言文本语义一致的初步翻译结果,并对初步翻译结果进行修正,就可以得到所述源语言文本对应的目标语言翻译结果,与相关技术中逐字对源语言文本中的字符进行翻译得到目标语言文本的方式相比,先一次得到与所述源语言文本语义一致的初步翻译结果,然后对得到的初步翻译结果进行修正,得到所述源语言文本对应的目标语言翻译结果,无需逐字对源语言文本进行翻译,就可以得到目标语言翻译结果,即使源语言文本较长字数较多,也可以保证对源语言文本的翻译效率。
实施例3
本实施例提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例1描述的数据处理方法的步骤。具体实现可参见方法实施例1,在此不再赘述。
此外,参见图3所示的另一种机器翻译装置的结构示意图,本实施例还提出一种机器翻译装置,上述机器翻译装置包括总线51、处理器52、收发机53、总线接口54、存储器55和用户接口56。上述机器翻译装置包括有存储器55。
本实施例中,上述机器翻译装置还包括:存储在存储器55上并可在处理器52上运行的一个或者一个以上的程序,经配置以由上述处理器执行上述一个或者一个以上程序用于进行以下步骤(1)至步骤(3):
(1)获取源语言文本,对所述源语言文本进行处理,得到所述源语言文本中各字符的上下文相关编码表示;
(2)对所述源语言文本中各所述字符的上下文相关编码表示进行对齐翻译,得到所述源语言文本的初步翻译结果;其中,所述初步翻译结果与所述源语言文本的语义一致;
(3)对所述初步翻译结果中的字符进行修正,得到所述源语言文本对应的目标语言翻译结果。
收发机53,用于在处理器52的控制下接收和发送数据。
在图3中,总线架构(用总线51来代表),总线51可以包括任意数量的互联的总线和桥,总线51将包括由通用处理器52代表的一个或多个处理器和存储器55代表的存储器的各种电路链接在一起。总线51还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本实施例不再对其进行进一步描述。总线接口54在总线51和收发机53之间提供接口。收发机53可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。例如:收发机53从其他设备接收外部数据。收发机53用于将处理器52处理后的数据发送给其他设备。取决于计算系统的性质,还可以提供用户接口56,例如小键盘、显示器、扬声器、麦克风、操纵杆。
处理器52负责管理总线51和通常的处理,如前述上述运行通用操作系统。而存储器55可以被用于存储处理器52在执行操作时所使用的数据。
可选的,处理器52可以是但不限于:中央处理器、单片机、微处理器或者可编程逻辑器件。
可以理解,本发明实施例中的存储器55可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本实施例描述的系统和方法的存储器55旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器55存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统551和应用程序552。
其中,操作系统551,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序552,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序552中。
综上所述,本实施例提出的一种计算机可读存储介质和机器翻译装置,通过对源语言文本中各字符的上下文相关编码表示进行对齐翻译,得到与所述源语言文本语义一致的初步翻译结果,并对初步翻译结果进行修正,就可以得到所述源语言文本对应的目标语言翻译结果,与相关技术中逐字对源语言文本中的字符进行翻译得到目标语言文本的方式相比,先一次得到与所述源语言文本语义一致的初步翻译结果,然后对得到的初步翻译结果进行修正,得到所述源语言文本对应的目标语言翻译结果,无需逐字对源语言文本进行翻译,就可以得到目标语言翻译结果,即使源语言文本较长字数较多,也可以保证对源语言文本的翻译效率。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (9)
1.一种机器翻译方法,其特征在于,包括:
获取源语言文本,将所述源语言文本输入到服务器中运行的注意力变换模型中,对所述源语言文本进行处理,得到所述源语言文本的上下文相关编码表示,字符,可以是但不限于:字、词组、以及短语;
对所述源语言文本中各所述字符的上下文相关编码表示进行对齐翻译,得到所述源语言文本的初步翻译结果;其中,所述初步翻译结果与所述源语言文本的语义一致;
对所述初步翻译结果中的字符进行修正,得到所述源语言文本对应的目标语言翻译结果,包括:
获取所述初步翻译结果的已执行修正记录;所述已执行修正记录,包括:每次对所述初步翻译结果中各字符进行修正时使用的操作标签;所述操作标签,包括:交换标签、删除标签、插入标签、替换标签或者保留标签;
对所述初步翻译结果的字符进行特征提取,得到所述初步翻译结果的字符的语义特征,并根据得到的语义特征确定所述初步翻译结果的字符的语义表示;
根据所述源语言文本中各字符的上下文相关编码表示、所述初步翻译结果的字符的语义表示、以及所述已执行修正记录,确定当前对所述初步翻译结果中各字符的操作标签;
根据当前确定的各字符的操作标签对应的修正方式对所述初步翻译结果中各字符进行修正,得到修正后的初步翻译结果;
对修正操作次数进行增量操作,当所述修正操作次数达到修正操作阈值时,将所述修正后的初步翻译结果作为所述源语言文本对应的目标语言翻译结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述初步翻译结果中的字符进行修正,得到所述源语言文本对应的目标语言翻译结果,还包括:
当所述修正操作次数未达到修正操作次数时,通过语言模型对修正后的初步翻译结果进行处理,得到修正后的初步翻译结果的分数;
当所述分数大于等于分数阈值时,将所述修正后的初步翻译结果作为所述源语言文本对应的目标语言翻译结果;
当所述分数小于分数阈值时,将当前对所述初步翻译结果中各字符的操作标签存储到所述已执行修正记录中,利用所述修正后的初步翻译结果对所述初步翻译结果进行更新,并返回所述获取所述初步翻译结果的已执行修正记录步骤。
3.根据权利要求1所述的方法,其特征在于,在所述根据当前确定的各字符的操作标签对应的修正方式对所述初步翻译结果中各字符进行修正,得到修正后的初步翻译结果步骤之前,所述对所述初步翻译结果中的字符进行修正,得到所述源语言文本对应的目标语言翻译结果,还包括:
当确定当前所述初步翻译结果中各字符的操作标签中都是保留标签时,将所述初步翻译结果作为所述源语言文本对应的目标语言翻译结果;
当确定当前对所述初步翻译结果中各字符的操作标签中存在除所述保留标签的其他操作标签时,继续执行所述根据当前确定的各字符的操作标签对应的修正方式对所述初步翻译结果中各字符进行修正,得到修正后的初步翻译结果步骤。
4.一种机器翻译装置,其特征在于,包括:
获取模块,将源语言文本输入到服务器中运行的注意力变换模型中,对所述源语言文本进行处理,得到所述源语言文本的上下文相关编码表示,字符,可以是但不限于:字、词组、以及短语;
翻译模块,用于对所述源语言文本中各所述字符的上下文相关编码表示进行对齐翻译,得到所述源语言文本的初步翻译结果;其中,所述初步翻译结果与所述源语言文本的语义一致;
修正模块,用于对所述初步翻译结果中的字符进行修正,得到所述源语言文本对应的目标语言翻译结果,包括:
获取所述初步翻译结果的已执行修正记录;所述已执行修正记录,包括:每次对所述初步翻译结果中各字符进行修正时使用的操作标签;所述操作标签,包括:交换标签、删除标签、插入标签、替换标签或者保留标签;
对所述初步翻译结果的字符进行特征提取,得到所述初步翻译结果的字符的语义特征,并根据得到的语义特征确定所述初步翻译结果的字符的语义表示;
根据所述源语言文本中各字符的上下文相关编码表示、所述初步翻译结果的字符的语义表示、以及所述已执行修正记录,确定当前对所述初步翻译结果中各字符的操作标签;
根据当前确定的各字符的操作标签对应的修正方式对所述初步翻译结果中各字符进行修正,得到修正后的初步翻译结果;
对修正操作次数进行增量操作,当所述修正操作次数达到修正操作阈值时,将所述修正后的初步翻译结果作为所述源语言文本对应的目标语言翻译结果。
5.根据权利要求4所述的装置,其特征在于,所述修正模块,具体用于:
获取所述初步翻译结果的已执行修正记录;所述已执行修正记录,包括:每次对所述初步翻译结果中各字符进行修正时使用的操作标签;所述操作标签,包括:交换标签、删除标签、插入标签、替换标签或者保留标签;
对所述初步翻译结果的字符进行特征提取,得到所述初步翻译结果的字符的语义特征,并根据得到的语义特征确定所述初步翻译结果的字符的语义表示;
根据所述源语言文本中各字符的上下文相关编码表示、所述初步翻译结果的字符的语义表示、以及所述已执行修正记录,确定当前对所述初步翻译结果中各字符的操作标签;
根据当前确定的各字符的操作标签对应的修正方式对所述初步翻译结果中各字符进行修正,得到修正后的初步翻译结果;
对修正操作次数进行增量操作,当所述修正操作次数达到修正操作阈值时,将所述修正后的初步翻译结果作为所述源语言文本对应的目标语言翻译结果。
6.根据权利要求5所述的装置,其特征在于,所述修正模块,还具体用于:
当所述修正操作次数未达到修正操作次数时,通过语言模型对修正后的初步翻译结果进行处理,得到修正后的初步翻译结果的分数;
当所述分数大于等于分数阈值时,将所述修正后的初步翻译结果作为所述源语言文本对应的目标语言翻译结果;
当所述分数小于分数阈值时,将当前对所述初步翻译结果中各字符的操作标签存储到所述已执行修正记录中,利用所述修正后的初步翻译结果对所述初步翻译结果进行更新,并返回所述获取所述初步翻译结果的已执行修正记录步骤。
7.根据权利要求5所述的装置,其特征在于,所述修正模块,还具体用于:
当确定当前所述初步翻译结果中各字符的操作标签中都是保留标签时,将所述初步翻译结果作为所述源语言文本对应的目标语言翻译结果;
当确定当前对所述初步翻译结果中各字符的操作标签中存在除所述保留标签的其他操作标签时,继续执行所述根据当前确定的各字符的操作标签对应的修正方式对所述初步翻译结果中各字符进行修正,得到修正后的初步翻译结果步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1-3任一项所述的方法的步骤。
9.一种机器翻译装置,其特征在于,所述机器翻译装置包括有存储器,处理器以及一个或者一个以上的程序,其中所述一个或者一个以上程序存储于所述存储器中,且经配置以由所述处理器执行权利要求1-3任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911115167.1A CN110826345B (zh) | 2019-11-14 | 2019-11-14 | 一种机器翻译方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911115167.1A CN110826345B (zh) | 2019-11-14 | 2019-11-14 | 一种机器翻译方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110826345A CN110826345A (zh) | 2020-02-21 |
CN110826345B true CN110826345B (zh) | 2023-09-05 |
Family
ID=69555192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911115167.1A Active CN110826345B (zh) | 2019-11-14 | 2019-11-14 | 一种机器翻译方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110826345B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401052A (zh) * | 2020-04-24 | 2020-07-10 | 南京莱科智能工程研究院有限公司 | 基于语义理解的多语种文本匹配方法与系统 |
CN112257462A (zh) * | 2020-11-03 | 2021-01-22 | 沈阳雅译网络技术有限公司 | 一种基于神经机器翻译技术的超文本标记语言翻译方法 |
CN112487833A (zh) * | 2020-12-01 | 2021-03-12 | 中译语通科技(青岛)有限公司 | 一种机器翻译方法及其翻译系统 |
CN112784612B (zh) * | 2021-01-26 | 2023-12-22 | 浙江香侬慧语科技有限责任公司 | 基于迭代修改的同步机器翻译的方法、装置、介质及设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105468585A (zh) * | 2014-09-30 | 2016-04-06 | 株式会社东芝 | 机器翻译装置和机器翻译方法 |
CN105723362A (zh) * | 2013-10-28 | 2016-06-29 | 余自立 | 自然表达处理方法、处理及回应方法、设备及系统 |
CN109344413A (zh) * | 2018-10-16 | 2019-02-15 | 北京百度网讯科技有限公司 | 翻译处理方法和装置 |
CN109446534A (zh) * | 2018-09-21 | 2019-03-08 | 清华大学 | 机器翻译方法及装置 |
CN109558597A (zh) * | 2018-12-17 | 2019-04-02 | 北京百度网讯科技有限公司 | 文本翻译方法及装置、设备及存储介质 |
CN109582977A (zh) * | 2018-11-20 | 2019-04-05 | 科大讯飞股份有限公司 | 一种交互式文本翻译方法及装置 |
CN109800805A (zh) * | 2019-01-14 | 2019-05-24 | 上海联影智能医疗科技有限公司 | 基于人工智能的图像处理系统以及计算机设备 |
CN109858045A (zh) * | 2019-02-01 | 2019-06-07 | 北京字节跳动网络技术有限公司 | 机器翻译方法和装置 |
CN110210043A (zh) * | 2019-06-14 | 2019-09-06 | 科大讯飞股份有限公司 | 文本翻译方法、装置、电子设备及可读存储介质 |
-
2019
- 2019-11-14 CN CN201911115167.1A patent/CN110826345B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105723362A (zh) * | 2013-10-28 | 2016-06-29 | 余自立 | 自然表达处理方法、处理及回应方法、设备及系统 |
CN105468585A (zh) * | 2014-09-30 | 2016-04-06 | 株式会社东芝 | 机器翻译装置和机器翻译方法 |
CN109446534A (zh) * | 2018-09-21 | 2019-03-08 | 清华大学 | 机器翻译方法及装置 |
CN109344413A (zh) * | 2018-10-16 | 2019-02-15 | 北京百度网讯科技有限公司 | 翻译处理方法和装置 |
CN109582977A (zh) * | 2018-11-20 | 2019-04-05 | 科大讯飞股份有限公司 | 一种交互式文本翻译方法及装置 |
CN109558597A (zh) * | 2018-12-17 | 2019-04-02 | 北京百度网讯科技有限公司 | 文本翻译方法及装置、设备及存储介质 |
CN109800805A (zh) * | 2019-01-14 | 2019-05-24 | 上海联影智能医疗科技有限公司 | 基于人工智能的图像处理系统以及计算机设备 |
CN109858045A (zh) * | 2019-02-01 | 2019-06-07 | 北京字节跳动网络技术有限公司 | 机器翻译方法和装置 |
CN110210043A (zh) * | 2019-06-14 | 2019-09-06 | 科大讯飞股份有限公司 | 文本翻译方法、装置、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110826345A (zh) | 2020-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110826345B (zh) | 一种机器翻译方法和装置 | |
CN107273356B (zh) | 基于人工智能的分词方法、装置、服务器和存储介质 | |
CN110134968B (zh) | 基于深度学习的诗歌生成方法、装置、设备及存储介质 | |
US20240054767A1 (en) | Multi-modal Model Training Method, Apparatus and Device, and Storage Medium | |
US20220215183A1 (en) | Automatic post-editing model for neural machine translation | |
CN109543165B (zh) | 基于循环卷积注意力模型的文本生成方法及装置 | |
CN110555213B (zh) | 文本翻译模型的训练方法、文本翻译方法及装置 | |
CN107291692B (zh) | 基于人工智能的分词模型的定制方法、装置、设备和介质 | |
CN107273357B (zh) | 基于人工智能的分词模型的修正方法、装置、设备和介质 | |
CN112287080B (zh) | 问题语句的改写方法、装置、计算机设备和存储介质 | |
US20220222447A1 (en) | Translation method and apparatus, electronic device, and computer-readable storage medium | |
CN111666775B (zh) | 文本处理方法、装置、设备及存储介质 | |
CN116820429B (zh) | 代码处理模型的训练方法、装置、电子设备及存储介质 | |
CN112214608A (zh) | 基于知识推理的文本生成方法、介质、装置和计算设备 | |
CN111144137B (zh) | 机器翻译后编辑模型语料的生成方法及装置 | |
CN110633724A (zh) | 意图识别模型动态训练方法、装置、设备和存储介质 | |
CN115906815A (zh) | 一种用于修改一种或多种类型错误句子的纠错方法及装置 | |
US11481609B2 (en) | Computationally efficient expressive output layers for neural networks | |
CN110888976B (zh) | 一种文本摘要生成方法和装置 | |
CN111368056A (zh) | 一种古诗词生成方法和装置 | |
US20200279024A1 (en) | Non-transitory computer readable medium | |
CN117057321B (zh) | 语音转文字处理方法、模型训练方法、装置、设备及介质 | |
CN112347793B (zh) | 一种基于规则与学习的语义解析方法、装置和电子设备 | |
RU2818693C2 (ru) | Способ и система классификации текста | |
CN114564562B (zh) | 基于答案指导的题目生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |