CN110909552B - 翻译方法及装置 - Google Patents

翻译方法及装置 Download PDF

Info

Publication number
CN110909552B
CN110909552B CN201811075653.0A CN201811075653A CN110909552B CN 110909552 B CN110909552 B CN 110909552B CN 201811075653 A CN201811075653 A CN 201811075653A CN 110909552 B CN110909552 B CN 110909552B
Authority
CN
China
Prior art keywords
translation
target
sentence
source
intervention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811075653.0A
Other languages
English (en)
Other versions
CN110909552A (zh
Inventor
宋楷
于恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811075653.0A priority Critical patent/CN110909552B/zh
Publication of CN110909552A publication Critical patent/CN110909552A/zh
Application granted granted Critical
Publication of CN110909552B publication Critical patent/CN110909552B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种翻译方法及装置。该方法包括:获取源端句子,其中,源端句子为输入到神经网络中的待翻译的句子,神经网络用于将源端句子从源语言翻译成目标语言;在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将目标词汇从源语言翻译成预定的目标语言;根据选择出的翻译方式对源端句子中的目标词汇进行翻译,本发明解决了由于相关技术中翻译方法较单一,难以针对翻译内容进行翻译方式的选择的技术问题。

Description

翻译方法及装置
技术领域
本发明涉及翻译技术领域,具体而言,涉及一种翻译方法及装置。
背景技术
随着技术的发展,各种翻译工具已上线了神经网络翻译系统,简称NMT模型,干预机制是支持线上翻译场景的基本必备机制,可以用于对误翻译的修复,以及提高场景内的专业术语和商品核心关键信息的翻译准确度等重要问题,当前翻译干预机制实现了基于标签替换的硬干预,上线后对于NMT具备了基本的干预能力,效果明显。但是存在以下缺点:1)基于标签替换的硬干预的方式会使翻译过程损失原文信息,导致译文忠诚度和流畅度的下降,这种方式只能保证干预译文片段出现在最终译文中,但对整体译文的质量有较大损失。2)基于标签的硬干预方式不具备消歧能力,针对一个源语言片段,只能给出一种固定的干预译文,不能从多个给定候选译文中选择最适合当前语境的译文。3)当一个句子中待干预片段较多时,基于标签替换的方式不能保证所有待干预片段都在最终译文中生效,生效比率取决于源端句子中的干预标签在译文中被成功预测出来的比率。相关技术中的翻译方法较单一,难以针对不同的翻译内容进行翻译方式的选择。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种翻译方法及装置,以至少解决由于相关技术中翻译方法较单一,难以针对翻译内容进行翻译方式的选择的技术问题。
根据本发明实施例的一个方面,提供了一种翻译方法,包括:获取源端句子,其中,所述源端句子为输入到神经网络中的待翻译的句子,所述神经网络用于将所述源端句子从源语言翻译成目标语言;在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式,其中,所述翻译方式包括以下之一:从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文、使用所述神经网络生成所述目标词汇的目标译文,所述干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译。
进一步地,获取所述源端句子包括:获取待翻译的原始句子;将所述原始句子中的目标词汇用对应的干预译文替换;将替换后得到的句子作为所述源端句子。
进一步地,将所述原始句子中的目标词汇用对应的干预译文替换包括:获取存在所述干预译文的片段对应的第一向量;获取所述干预译文对应的第二向量;将所述第一向量替换为所述第二向量,其中,所述源端句子转换后得到的一组向量。
进一步地,将所述原始句子中的目标词汇用对应的干预译文替换包括:获取存在所述干预译文的片段对应的第一向量包括:从所述源语言的词嵌入矩阵中获取存在所述干预译文的片段对应的第一向量;获取所述干预译文对应的第二向量包括:从所述目标语言的词嵌入矩阵中获取所述干预译文对应的第二向量,其中,所述源端句子经过所述源语言的词嵌入处理后得到的一组向量。
进一步地,在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式包括:通过训练得到的分类器选择对所述目标词汇进行翻译的方式。
进一步地,若选择出的翻译方式为使用所述神经网络生成所述目标词汇的目标译文,根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译包括:使用所述神经网络对所述源端句子中的目标词汇进行预测,使用预测出的词语替代所述源端句子中的目标词汇。
进一步地,若选择出的翻译方式为从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文,根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译包括:在预设目标词汇库中查询所述源端句子中的目标词汇对应的词汇;采用查询到的词汇替代所述源端句子中的目标词汇。
根据本发明实施例的另一方面,还提供了一种翻译装置,包括:获取单元,用于获取源端句子,其中,所述源端句子为输入到神经网络中的待翻译的句子,所述神经网络用于将所述源端句子从源语言翻译成目标语言;选择单元,用于在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式,其中,所述翻译方式包括以下之一:从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文、使用所述神经网络生成所述目标词汇的目标译文,所述干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;翻译单元,用于根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译。
进一步地,所述获取单元包括:第一获取模块,用于获取待翻译的原始句子;第一替换模块,用于将所述原始句子中的目标词汇用对应的干预译文替换;确定模块,用于将替换后得到的句子作为所述源端句子。
进一步地,所述第一替换模块包括:第一获取子模块,用于获取存在所述干预译文的片段对应的第一向量;第二获取子模块,用于获取所述干预译文对应的第二向量;替换子模块,用于将所述第一向量替换为所述第二向量,其中,所述源端句子转换后得到的一组向量。
进一步地,所述第一替换模块包括:第三获取子模块,用于获取存在所述干预译文的片段对应的第一向量包括:从所述源语言的词嵌入矩阵中获取存在所述干预译文的片段对应的第一向量;第四获取子模块,用于获取所述干预译文对应的第二向量包括:从所述目标语言的词嵌入矩阵中获取所述干预译文对应的第二向量,其中,所述源端句子经过所述源语言的词嵌入处理后得到的一组向量。
进一步地,所述选择单元包括:选择模块,用于通过训练得到的分类器选择对所述目标词汇进行翻译的方式。
进一步地,若选择出的翻译方式为从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文,所述翻译单元还包括:查询模块,用于在预设目标词汇库中查询所述源端句子中的目标词汇对应的词汇;第二替换模块,用于采用查询到的词汇替代所述源端句子中的目标词汇。
在本发明实施例中,通过获取源端句子,其中,源端句子为输入到神经网络中的待翻译的句子,神经网络用于将所述源端句子从源语言翻译成目标语言;在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式,其中,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;根据选择出的翻译方式对源端句子中的目标词汇进行翻译,达到了可以选择对源端句子的目标词汇的翻译方式的目的,从而实现了增添对翻译方法的选择,可以根据具体地源端句子中的目标词汇选择对应的翻译方式从而获得最适合的译文,形成“软”干预,提升翻译准确率的技术效果。进而解决了由于相关技术中翻译方法较单一,难以针对翻译内容进行翻译方式的选择的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种翻译方法的流程图;
图2是根据本发明实施例的一种翻译装置的示意图;
图3是根据本发明实施例的计算机终端的硬件结构框图;以及
图4是根据本发明实施例的可选的计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
神经网络机器翻译(Neural Machine Trans lation,简称NMT):基于端到端的神经网络模型设计实现的机器翻译系统。
干预翻译:为翻译系统提供额外信息,通常的方式是指定原文中某一个源语言片段的译文为一个固定的目标语片段,使模型翻译源语言句子的过程中参照这个额外信息产生最终译文。
硬干预:基于标签替换的干预方式,将原文中待干预的片段替换为一个固定标签,并将最终译文中的该标签替换为干预译文。
标签替换:在翻译前处理阶段用固定标签替换掉原文中的某个片段,在翻译后处理阶段用干预译文替换掉整句译文中的标签。
干预成功率:源端干预片段在译文中生效的比率。
实施例1
本发明实施例1所提供的方法实施例可以广泛应用在翻译装置中,通过干预译文替换源端句子中待干预片段再进行解码,原文信息不会损失。解码时的“Point&Copy”子网络可以由模型决定不同的时间步骤在Predict和Copy这两个模块之间切换,模型具备消歧能力,可以根据具体语境选择最适合的译文,形成“软”干预。从而增添对翻译方法的选择,可以根据具体地源端句子中的目标词汇选择对应的翻译方式从而获得最适合的译文,形成“软”干预,提升翻译准确率的技术效果。进而解决了由于相关技术中翻译方法较单一,难以针对翻译内容进行翻译方式的选择的技术问题。
根据本发明实施例,还提供了一种翻译方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明提供了如图1所示的翻译方法。图1是根据本发明实施例一的翻译方法的流程图。
步骤S102,获取源端句子,其中,源端句子为输入到神经网络中的待翻译的句子,神经网络用于将所述源端句子从源语言翻译成目标语言。
例如上述的源端句子为:“他split express并扔掉包装”。将其输入神经网络中准备翻译。
可选地,在本发明实施例提供的翻译方法中,获取源端句子包括:获取待翻译的原始句子;将原始句子中的目标词汇用对应的干预译文替换;将替换后得到的句子作为源端句子。
例如,原始句子为:“他拆开快递并扔掉包装”,句子中的“拆开快递”存在干预英文“split express”,将使用干预译文替代“拆开快递”,得到源端句子为:“他split express并扔掉包装”。
步骤S104,在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式,其中,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言。
在本发明实施例提供的翻译方法中,在相关技术中的NMT的解码器的基础上,加入了一个“point&copy”的子网络,该子网络用于在解码器的某个步骤选择对目标词汇的翻译方式,其中,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言。
例如,对于上述的源端句子为:“他split express并扔掉包装”,在将“splitexpress”翻译成目标译文之前,选择对目标词汇的翻译方式。可以选择使用神经网络生成“split express”的目标译文,也可以选择将“split express”作为目标译文。
步骤S106,根据选择出的翻译方式对源端句子中的目标词汇进行翻译。
在本发明实施例提供的翻译方法中,通过获取源端句子,其中,源端句子为输入到神经网络中的待翻译的句子,神经网络用于将所述源端句子从源语言翻译成目标语言;在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式,其中,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;根据选择出的翻译方式对源端句子中的目标词汇进行翻译,达到了可以选择对源端句子的目标词汇的翻译方式的目的,从而实现了增添对翻译方法的选择,可以根据具体地源端句子中的目标词汇选择对应的翻译方式从而获得最适合的译文,形成“软”干预,提升翻译准确率的技术效果。进而解决了由于相关技术中翻译方法较单一,难以针对翻译内容进行翻译方式的选择的技术问题。
可选地,在本发明实施例提供的翻译方法中,将原始句子中的目标词汇用对应的干预译文替换包括:获取的目标词汇对应的第一向量;获取干预译文对应的第二向量;将第一向量替换为第二向量,其中,源端句子转换后得到的一组向量。
计算机用于做数值运算,将原始句子中的目标词汇用对应的干预译文替换,需要将单原始句子中的目标词汇转换成数字向量,才能进行存入计算机进行计算。
例如,源端句子为:“他split express并扔掉包装”,的目标词汇为“拆开快递”,获取其对应的第一向量为(1,0,0,1,0),干预译文“split express”对于向量为(0,1,0,0,1),将的目标词汇对应的第一向量替换为第二向量,将替换后的干预片段的片段所在的源端句子进行转换,得到一组向量。
可选地,获取的目标词汇对应的第一向量包括:从源语言的词嵌入矩阵中获取的目标词汇对应的第一向量;获取干预译文对应的第二向量包括:从目标语言的词嵌入矩阵中获取干预译文对应的第二向量,其中,源端句子经过源语言的词嵌入处理后得到的一组向量。
上述的词嵌入矩阵可以是通过word2Vec的方法建立的,word2Vec是基于神经网络来训练得到的,每个词拥有一个向量来表征它,词与词之间可以通过向量来求相似度,并且向量是非离散的。
可选地,在本发明实施例提供的翻译方法中,在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式包括:通过训练得到的分类器选择对目标词汇进行翻译的方式。
通过上述提及的“point&copy”的子网络利用训练得到的分类器,例如,在到达翻译目标词汇的时间时,从下面两种模式中选择一种翻译方式:1)通过神经网络翻译预测对应的译文词;2)从源端复制对应的译文词。
可选地,在本发明实施例提供的翻译方法中,若选择出的翻译方式为使用神经网络生成目标词汇的目标译文,根据选择出的翻译方式对源端句子中的目标词汇进行翻译包括:使用神经网络对源端句子中的目标词汇进行预测,使用预测出的词语替代源端句子中的目标词汇。
在上述方案中,若选择的翻译方式是通过神经网络翻译预测对应的译文词,例如,目标词汇为“breadboard”,使用神经网络对“breadboard”进行预测,预测出为“макетньIе платьI”,使用预测出的词语“макетньIе платьI”,替代源端句子中的“breadboard”。
可选地,在本发明实施例提供的翻译方法中,若选择出的翻译方式为从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文,根据选择出的翻译方式对源端句子中的目标词汇进行翻译包括:在预设目标词汇库中查询源端句子中的目标词汇对应的词汇;采用查询到的词汇替代源端句子中的目标词汇。
在上述方案中,预设目标词汇库为预先创建的包括将多个词汇翻译成预定的目标语言后对应的词汇,例如,新闻,翻译为英文后对应的词汇为news,新闻报纸,翻译为英文后对应的词汇为newspaper,预设目标词汇库中包括news、newspaper等词汇。
另外,如果当前时间步长是执行从源端的预设目标词汇库中复制对应的词,可以采用softmax函数,从源端的所有位置中预测一个当前时间步长要复制的词的位置,利用“point&copy”机制,实现NMT解码过程中,有选择的复制源端句子中的干预译文,实现在解码过程中完成干预译文的产生。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述翻译方法的装置,如图2所示,该装置包括:获取单元10、选择单元20和翻译单元30。
获取单元10,用于获取源端句子,其中,源端句子为输入到神经网络中的待翻译的句子,神经网络用于将所述源端句子从源语言翻译成目标语言;
选择单元20,用于在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式,其中,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;
翻译单元30,用于根据选择出的翻译方式对源端句子中的目标词汇进行翻译。
在本发明实施例提供的翻译装置中,通过获取单元10获取源端句子,其中,源端句子为输入到神经网络中的待翻译的句子,神经网络用于将所述源端句子从源语言翻译成目标语言;选择单元20在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式,其中,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;翻译单元30根据选择出的翻译方式对源端句子中的目标词汇进行翻译,达到了可以选择对源端句子的目标词汇的翻译方式的目的,从而实现了增添对翻译方法的选择,可以根据具体地源端句子中的目标词汇选择对应的翻译方式从而获得最适合的译文,形成“软”干预,提升翻译准确率的技术效果。进而解决了由于相关技术中翻译方法较单一,难以针对翻译内容进行翻译方式的选择的技术问题。
可选地,在本发明实施例提供的翻译装置中,获取单元10包括:第一获取模块,用于获取待翻译的原始句子;第一替换模块,用于将原始句子中的目标词汇用对应的干预译文替换;确定模块,用于将替换后得到的句子作为源端句子。
可选地,在本发明实施例提供的翻译装置中,第一替换模块包括:第一获取子模块,用于获取的目标词汇对应的第一向量;第二获取子模块,用于获取干预译文对应的第二向量;替换子模块,用于将第一向量替换为第二向量,其中,源端句子转换后得到的一组向量。
可选地,在本发明实施例提供的翻译装置中,第一替换模块包括:第三获取子模块,用于获取的目标词汇对应的第一向量包括:从源语言的词嵌入矩阵中获取的目标词汇对应的第一向量;第四获取子模块,用于获取干预译文对应的第二向量包括:从目标语言的词嵌入矩阵中获取干预译文对应的第二向量,其中,源端句子经过源语言的词嵌入处理后得到的一组向量。
可选地,在本发明实施例提供的翻译装置中,选择单元20包括:选择模块,用于通过训练得到的分类器选择对目标词汇进行翻译的方式。
可选地,在本发明实施例提供的翻译装置中,若选择出的翻译方式为从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文,翻译单元还包括:查询模块,用于在预设目标词汇库中查询源端句子中的目标词汇对应的词汇;第二替换模块,用于采用查询到的词汇替代源端句子中的目标词汇。
此处需要说明的是,上述获取单元10、选择单元20和翻译单元30对应于实施例1中的步骤S102至步骤S106,三个单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。
实施例3
本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行应用程序的翻译方法中以下步骤的程序代码:获取源端句子,其中,源端句子为输入到神经网络中的待翻译的句子,神经网络用于将所述源端句子从源语言翻译成目标语言;在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式,其中,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;根据选择出的翻译方式对源端句子中的目标词汇进行翻译。
可选地,上述计算机终端还可以执行应用程序的翻译方法中以下步骤的程序代码:获取源端句子包括:获取待翻译的原始句子;将原始句子中的目标词汇用对应的干预译文替换;将替换后得到的句子作为源端句子。
可选地,上述计算机终端还可以执行应用程序的翻译方法中以下步骤的程序代码:将原始句子中的目标词汇用对应的干预译文替换包括:获取的目标词汇对应的第一向量;获取干预译文对应的第二向量;将第一向量替换为第二向量,其中,源端句子转换后得到的一组向量。
可选地,上述计算机终端还可以执行应用程序的翻译方法中以下步骤的程序代码:将原始句子中的目标词汇用对应的干预译文替换包括:获取的目标词汇对应的第一向量包括:从源语言的词嵌入矩阵中获取的目标词汇对应的第一向量;获取干预译文对应的第二向量包括:从目标语言的词嵌入矩阵中获取干预译文对应的第二向量,其中,源端句子经过源语言的词嵌入处理后得到的一组向量。
可选地,上述计算机终端还可以执行应用程序的翻译方法中以下步骤的程序代码:在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式包括:通过训练得到的分类器选择对目标词汇进行翻译的方式。
可选地,上述计算机终端还可以执行应用程序的翻译方法中以下步骤的程序代码:若选择出的翻译方式为使用神经网络生成目标词汇的目标译文,根据选择出的翻译方式对源端句子中的目标词汇进行翻译包括:使用神经网络对源端句子中的目标词汇进行预测,使用预测出的词语替代源端句子中的目标词汇。
可选地,上述计算机终端还可以执行应用程序的翻译方法中以下步骤的程序代码:若选择出的翻译方式为从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文,根据选择出的翻译方式对源端句子中的目标词汇进行翻译包括:在预设目标词汇库中查询源端句子中的目标词汇对应的词汇;采用查询到的词汇替代源端句子中的目标词汇。
可选地,图3是根据本发明实施例的一种计算机终端的结构框图。如图3所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器和存储器。
其中,存储器可用于存储软件程序以及模块,如本发明实施例中的翻译方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的翻译方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取源端句子,其中,源端句子为输入到神经网络中的待翻译的句子,神经网络用于将所述源端句子从源语言翻译成目标语言;在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式,其中,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;根据选择出的翻译方式对源端句子中的目标词汇进行翻译。
可选的,上述处理器还可以执行如下步骤的程序代码:获取源端句子包括:获取待翻译的原始句子;将原始句子中的目标词汇用对应的干预译文替换;将替换后得到的句子作为源端句子。
可选的,上述处理器还可以执行如下步骤的程序代码:将原始句子中的目标词汇用对应的干预译文替换包括:获取的目标词汇对应的第一向量;获取干预译文对应的第二向量;将第一向量替换为第二向量,其中,源端句子转换后得到的一组向量。
可选的,上述处理器还可以执行如下步骤的程序代码:将原始句子中的目标词汇用对应的干预译文替换包括:获取的目标词汇对应的第一向量包括:从源语言的词嵌入矩阵中获取的目标词汇对应的第一向量;获取干预译文对应的第二向量包括:从目标语言的词嵌入矩阵中获取干预译文对应的第二向量,其中,源端句子经过源语言的词嵌入处理后得到的一组向量。
可选的,上述处理器还可以执行如下步骤的程序代码:在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式包括:通过训练得到的分类器选择对目标词汇进行翻译的方式。
可选的,上述处理器还可以执行如下步骤的程序代码:若选择出的翻译方式为使用神经网络生成目标词汇的目标译文,根据选择出的翻译方式对源端句子中的目标词汇进行翻译包括:使用神经网络对源端句子中的目标词汇进行预测,使用预测出的词语替代源端句子中的目标词汇。
可选的,上述处理器还可以执行如下步骤的程序代码:若选择出的翻译方式为从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文,根据选择出的翻译方式对源端句子中的目标词汇进行翻译包括:在预设目标词汇库中查询源端句子中的目标词汇对应的词汇;采用查询到的词汇替代源端句子中的目标词汇。
采用本发明实施例,提供了一种翻译方法的方案。通过获取源端句子,其中,源端句子为输入到神经网络中的待翻译的句子,神经网络用于将所述源端句子从源语言翻译成目标语言;在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式,其中,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;根据选择出的翻译方式对源端句子中的目标词汇进行翻译,达到了可以选择对源端句子的目标词汇的翻译方式的目的,从而实现了增添对翻译方法的选择,可以根据具体地源端句子中的目标词汇选择对应的翻译方式从而获得最适合的译文,形成“软”干预,提升翻译准确率的技术效果。进而解决了由于相关技术中翻译方法较单一,难以针对翻译内容进行翻译方式的选择的技术问题。
本领域普通技术人员可以理解,图4所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图4其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图4中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图4所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例4
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的翻译方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取源端句子,其中,源端句子为输入到神经网络中的待翻译的句子,神经网络用于将所述源端句子从源语言翻译成目标语言;在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式,其中,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;根据选择出的翻译方式对源端句子中的目标词汇进行翻译。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:获取源端句子包括:获取待翻译的原始句子;将原始句子中的目标词汇用对应的干预译文替换;将替换后得到的句子作为源端句子。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:将原始句子中的目标词汇用对应的干预译文替换包括:获取的目标词汇对应的第一向量;获取干预译文对应的第二向量;将第一向量替换为第二向量,其中,源端句子转换后得到的一组向量。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:将原始句子中的目标词汇用对应的干预译文替换包括:获取的目标词汇对应的第一向量包括:从源语言的词嵌入矩阵中获取的目标词汇对应的第一向量;获取干预译文对应的第二向量包括:从目标语言的词嵌入矩阵中获取干预译文对应的第二向量,其中,源端句子经过源语言的词嵌入处理后得到的一组向量。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式包括:通过训练得到的分类器选择对目标词汇进行翻译的方式。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:若选择出的翻译方式为使用神经网络生成目标词汇的目标译文,根据选择出的翻译方式对源端句子中的目标词汇进行翻译包括:使用神经网络对源端句子中的目标词汇进行预测,使用预测出的词语替代源端句子中的目标词汇。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:若选择出的翻译方式为从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文,根据选择出的翻译方式对源端句子中的目标词汇进行翻译包括:在预设目标词汇库中查询源端句子中的目标词汇对应的词汇;采用查询到的词汇替代源端句子中的目标词汇。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (11)

1.一种翻译方法,其特征在于,包括:
获取源端句子,其中,所述源端句子为输入到神经网络中的待翻译的句子,所述神经网络用于将所述源端句子从源语言翻译成目标语言;
在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式,其中,所述翻译方式包括:从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文、使用所述神经网络生成所述目标词汇的目标译文,所述干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;
根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译;
其中,获取所述源端句子包括:
获取待翻译的原始句子;
将所述原始句子中的目标词汇用对应的干预译文替换;
将替换后得到的句子作为所述源端句子。
2.根据权利要求1所述的方法,其特征在于,将所述原始句子中的目标词汇用对应的干预译文替换包括:
获取存在所述干预译文的片段对应的第一向量;
获取所述干预译文对应的第二向量;
将所述第一向量替换为所述第二向量,其中,所述源端句子转换后得到的一组向量。
3.根据权利要求2所述的方法,其特征在于,将所述原始句子中的目标词汇用对应的干预译文替换包括:
获取存在所述干预译文的片段对应的第一向量包括:从所述源语言的词嵌入矩阵中获取存在所述干预译文的片段对应的第一向量;
获取所述干预译文对应的第二向量包括:从所述目标语言的词嵌入矩阵中获取所述干预译文对应的第二向量,其中,所述源端句子经过所述源语言的词嵌入处理后得到的一组向量。
4.根据权利要求1至3中任一项所述的方法,其特征在于,在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式包括:
通过训练得到的分类器选择对所述目标词汇进行翻译的方式。
5.根据权利要求1中所述的方法,其特征在于,若选择出的翻译方式为使用所述神经网络生成所述目标词汇的目标译文,根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译包括:
使用所述神经网络对所述源端句子中的目标词汇进行预测,使用预测出的词语替代所述源端句子中的目标词汇。
6.根据权利要求1中所述的方法,其特征在于,若选择出的翻译方式为从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文,根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译包括:
在预设目标词汇库中查询所述源端句子中的目标词汇对应的词汇;
采用查询到的词汇替代所述源端句子中的目标词汇。
7.一种翻译装置,其特征在于,包括:
获取单元,用于获取源端句子,其中,所述源端句子为输入到神经网络中的待翻译的句子,所述神经网络用于将所述源端句子从源语言翻译成目标语言;
选择单元,用于在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式,其中,所述翻译方式包括:从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文、使用所述神经网络生成所述目标词汇的目标译文,所述干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;
翻译单元,用于根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译;
其中,所述获取单元包括:
第一获取模块,用于获取待翻译的原始句子;
第一替换模块,用于将所述原始句子中的目标词汇用对应的干预译文替换;
确定模块,用于将替换后得到的句子作为所述源端句子。
8.根据权利要求7所述的装置,其特征在于,所述第一替换模块包括:
第一获取子模块,用于获取存在所述干预译文的片段对应的第一向量;
第二获取子模块,用于获取所述干预译文对应的第二向量;
替换子模块,用于将所述第一向量替换为所述第二向量,其中,所述源端句子转换后得到的一组向量。
9.根据权利要求8所述的装置,其特征在于,所述第一替换模块包括:
第三获取子模块,用于获取存在所述干预译文的片段对应的第一向量包括:从所述源语言的词嵌入矩阵中获取存在所述干预译文的片段对应的第一向量;
第四获取子模块,用于获取所述干预译文对应的第二向量包括:从所述目标语言的词嵌入矩阵中获取所述干预译文对应的第二向量,其中,所述源端句子经过所述源语言的词嵌入处理后得到的一组向量。
10.根据权利要求7至9中任一项所述的装置,其特征在于,所述选择单元包括:
选择模块,用于通过训练得到的分类器选择对所述目标词汇进行翻译的方式。
11.根据权利要求7中所述的装置,其特征在于,若选择出的翻译方式为从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文,所述翻译单元还包括:
查询模块,用于在预设目标词汇库中查询所述源端句子中的目标词汇对应的词汇;
第二替换模块,用于采用查询到的词汇替代所述源端句子中的目标词汇。
CN201811075653.0A 2018-09-14 2018-09-14 翻译方法及装置 Active CN110909552B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811075653.0A CN110909552B (zh) 2018-09-14 2018-09-14 翻译方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811075653.0A CN110909552B (zh) 2018-09-14 2018-09-14 翻译方法及装置

Publications (2)

Publication Number Publication Date
CN110909552A CN110909552A (zh) 2020-03-24
CN110909552B true CN110909552B (zh) 2023-05-30

Family

ID=69812241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811075653.0A Active CN110909552B (zh) 2018-09-14 2018-09-14 翻译方法及装置

Country Status (1)

Country Link
CN (1) CN110909552B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112613327B (zh) * 2021-01-07 2024-07-16 北京捷通华声科技股份有限公司 一种信息处理方法及装置
CN113342437B (zh) * 2021-06-10 2023-03-24 网易(杭州)网络有限公司 一种软件翻译方法和装置
CN114462434B (zh) * 2021-11-22 2025-03-25 北京中科凡语科技有限公司 增强词汇一致性的神经机器翻译方法、设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1212407A (zh) * 1997-09-22 1999-03-31 信快达电脑公司 在机器翻译中能够翻译文化上细微差异的方法
CN1801141A (zh) * 2004-06-24 2006-07-12 夏普株式会社 一种基于现有译文的储存库的翻译方法及设备
JP2008176536A (ja) * 2007-01-18 2008-07-31 Toshiba Corp 入力された原言語文を目的言語に機械翻訳する装置、方法およびプログラム
CN102467498A (zh) * 2010-11-18 2012-05-23 阿里巴巴集团控股有限公司 翻译方法及装置
CN103631772A (zh) * 2012-08-29 2014-03-12 阿里巴巴集团控股有限公司 机器翻译方法及装置
CN106484682A (zh) * 2015-08-25 2017-03-08 阿里巴巴集团控股有限公司 基于统计的机器翻译方法、装置及电子设备
CN106649288A (zh) * 2016-12-12 2017-05-10 北京百度网讯科技有限公司 基于人工智能的翻译方法和装置
CN107608973A (zh) * 2016-07-12 2018-01-19 华为技术有限公司 一种基于神经网络的翻译方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020091509A1 (en) * 2001-01-02 2002-07-11 Yacov Zoarez Method and system for translating text
US20100082324A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Replacing terms in machine translation
US8914276B2 (en) * 2011-06-08 2014-12-16 Microsoft Corporation Dynamic video caption translation player
CN106484681B (zh) * 2015-08-25 2019-07-09 阿里巴巴集团控股有限公司 一种生成候选译文的方法、装置及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1212407A (zh) * 1997-09-22 1999-03-31 信快达电脑公司 在机器翻译中能够翻译文化上细微差异的方法
CN1801141A (zh) * 2004-06-24 2006-07-12 夏普株式会社 一种基于现有译文的储存库的翻译方法及设备
JP2008176536A (ja) * 2007-01-18 2008-07-31 Toshiba Corp 入力された原言語文を目的言語に機械翻訳する装置、方法およびプログラム
CN102467498A (zh) * 2010-11-18 2012-05-23 阿里巴巴集团控股有限公司 翻译方法及装置
CN103631772A (zh) * 2012-08-29 2014-03-12 阿里巴巴集团控股有限公司 机器翻译方法及装置
CN106484682A (zh) * 2015-08-25 2017-03-08 阿里巴巴集团控股有限公司 基于统计的机器翻译方法、装置及电子设备
CN107608973A (zh) * 2016-07-12 2018-01-19 华为技术有限公司 一种基于神经网络的翻译方法及装置
CN106649288A (zh) * 2016-12-12 2017-05-10 北京百度网讯科技有限公司 基于人工智能的翻译方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
熊德意 ; 李军辉 ; 王星 ; 张飚 ; .基于约束的神经机器翻译.中国科学:信息科学.2018,第48卷(第05期),全文. *

Also Published As

Publication number Publication date
CN110909552A (zh) 2020-03-24

Similar Documents

Publication Publication Date Title
US8990066B2 (en) Resolving out-of-vocabulary words during machine translation
CN110457713B (zh) 基于机器翻译模型的翻译方法、装置、设备和存储介质
CN111046659B (zh) 上下文信息生成方法、上下文信息生成装置及计算机可读记录介质
CN110909552B (zh) 翻译方法及装置
US20200192941A1 (en) Search method, electronic device and storage medium
CN105095367B (zh) 一种客户端数据的采集方法和装置
CN117033585A (zh) 多模态的任务处理和对话任务处理的方法、系统及设备
JP2021504784A (ja) 文書構造抽出に基づいた多言語文書の検索
WO2021239631A1 (en) Neural machine translation method, neural machine translation system, learning method, learning system, and programm
CN116306603B (zh) 标题生成模型的训练方法和标题生成方法、装置和介质
CN114842473A (zh) 文本识别方法、装置、存储介质及电子设备
CN111613219B (zh) 语音数据识别方法、设备及介质
JP2021524095A (ja) 文章レベルテキストの翻訳方法及び装置
CN111985251B (zh) 翻译质量测评方法及装置
WO2025152397A1 (zh) 一种大语言模型的推理方法以及装置
CN108388549B (zh) 信息转换方法、装置、存储介质和电子装置
CN114328861A (zh) 一种智能知识库扩充方法、装置、电子设备及存储介质
WO2024045792A1 (zh) 译文处理方法、译后编辑模型的训练方法和相关装置
CN116822604A (zh) 模型训练方法、文本处理方法及翻译系统
US10477245B2 (en) Methods and devices for coding and decoding depth information, and video processing and playing device
WO2024243109A1 (en) Stable output streaming speech translation system
CN110705215B (zh) Mipi配置文件的编码方法、编码装置及显示装置
CN113283249A (zh) 机器翻译方法、装置及计算机可读存储介质
CN118378096A (zh) 视频字幕匹配方法、设备及计算机可读介质
CN117828035A (zh) 对话意图的标注方法、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant