CN112163434B - 基于人工智能的文本翻译方法、装置、介质及电子设备 - Google Patents
基于人工智能的文本翻译方法、装置、介质及电子设备 Download PDFInfo
- Publication number
- CN112163434B CN112163434B CN202011126438.6A CN202011126438A CN112163434B CN 112163434 B CN112163434 B CN 112163434B CN 202011126438 A CN202011126438 A CN 202011126438A CN 112163434 B CN112163434 B CN 112163434B
- Authority
- CN
- China
- Prior art keywords
- translation
- prompt
- text
- preset
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013519 translation Methods 0.000 title claims abstract description 551
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 49
- 230000014616 translation Effects 0.000 claims abstract description 552
- 238000012549 training Methods 0.000 claims abstract description 47
- 238000002372 labelling Methods 0.000 claims abstract description 30
- 230000006870 function Effects 0.000 claims description 58
- 239000013598 vector Substances 0.000 claims description 55
- 238000004590 computer program Methods 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 description 19
- 238000010586 diagram Methods 0.000 description 17
- 238000005516 engineering process Methods 0.000 description 17
- 238000013528 artificial neural network Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本申请提供一种基于人工智能的文本翻译方法、基于人工智能的文本翻译装置、计算机可读存储介质及电子设备;涉及机器翻译(Machine Translation)技术领域;包括:通过预设翻译提示对原文进行标注,得到样本原文;根据预设对应关系确定与预设翻译提示相对应的预设提示反馈,并通过预设提示反馈对译文进行标注,得到样本译文;根据样本原文和样本译文训练翻译模型;将检测到的待翻译文本和目标翻译提示输入训练后的翻译模型,触发训练后的翻译模型根据预设对应关系确定目标翻译提示对应的目标提示反馈,并根据目标提示反馈对待翻译文本进行翻译。可见,实施本申请的技术方案,可以提升翻译准确率,还可以提升交互性,改善用户的使用体验,提升用户的使用黏度。
Description
技术领域
本申请涉及机器翻译(Machine Translation)技术领域,具体而言,涉及一种基于人工智能的文本翻译方法、基于人工智能的文本翻译装置、计算机可读存储介质及电子设备。
背景技术
随着计算机技术的不断发展,用户可以通过翻译软件进行文本翻译,例如,将中文翻译为英文。一般来说,翻译软件在接收到用户输入的待翻译文本之后,可以生成与该文本相对应的译文并返回给用户。但是,一般来说,这样的翻译方式生成的译文中会存在翻译偏差,用户还需要手动对该译文进行调整,才能得到符合预期的翻译结果。可见,上述翻译方式存在着翻译准确率不高的问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本申请的目的在于提供一种基于人工智能的文本翻译方法、基于人工智能的文本翻译装置、计算机可读存储介质及电子设备,可以提升翻译准确率。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请的一方面,提供一种基于人工智能的文本翻译方法,包括:
通过预设翻译提示对原文进行标注,得到样本原文;
根据预设对应关系确定与预设翻译提示相对应的预设提示反馈并通过预设提示反馈对译文进行标注,得到样本译文;其中,原文与译文相对应;
根据样本原文和样本译文训练翻译模型;
将检测到的待翻译文本和目标翻译提示输入训练后的翻译模型,触发训练后的翻译模型根据预设对应关系确定目标翻译提示对应的目标提示反馈,并根据目标提示反馈对待翻译文本进行翻译。
在本申请的一种示例性实施例中,触发训练后的翻译模型根据预设对应关系确定目标翻译提示对应的目标提示反馈,包括:
当检测到用于输入目标翻译提示的用户输入操作时,确定移动焦点的所处位置;
触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定目标翻译提示对应的目标提示反馈。
在本申请的一种示例性实施例中,触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定目标翻译提示对应的目标提示反馈,包括:
触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定与目标翻译提示对应的至少一个待选提示反馈;
展示至少一个待选提示反馈并检测针对至少一个待选提示反馈的提示反馈选取操作;
若检测到提示反馈选取操作,将至少一个待选提示反馈中与提示反馈选取操作对应的待选提示反馈确定为目标提示反馈。
在本申请的一种示例性实施例中,根据样本原文和样本译文训练翻译模型,包括:
将样本原文输入翻译模型,以使得翻译模型输出与样本原文对应的译文结果;
计算译文结果与样本译文之间的损失函数;
若损失函数不满足预设条件,根据损失函数调整翻译模型对应的模型参数,直到损失函数满足预设条件为止。
在本申请的一种示例性实施例中,将样本原文输入翻译模型,以使得翻译模型输出与样本原文对应的译文结果,包括:
将样本原文输入翻译模型,以使得翻译模型中的编码器生成与样本原文对应的特征向量,并将特征向量输入翻译模型中的解码器,通过解码器将特征向量转换为译文结果。
在本申请的一种示例性实施例中,通过预设翻译提示对原文进行标注,得到样本原文,包括:
根据用于表征预设翻译提示的第一标签和用于分隔文本序列的第二标签将预设翻译提示和原文进行拼接,得到样本原文;
其中,样本原文中包括第一标签和第二标签,第一标签之后为预设翻译提示,第二标签之后为原文,第二标签之前为预设翻译提示和第一标签。
在本申请的一种示例性实施例中,通过预设提示反馈对译文进行标注,得到样本译文,包括:
根据用于表征预设提示反馈的第三标签和用于分隔文本序列的第二标签将预设提示反馈和译文进行拼接,得到样本译文;
其中,样本译文中包括第三标签和第二标签,第三标签之后为预设提示反馈,第二标签之后为译文,第二标签之前为预设提示反馈和第三标签。
根据本申请的一方面,提供一种基于人工智能的文本翻译装置,包括样本标注单元、模型训练单元以及文本翻译单元,其中:
样本标注单元,用于通过预设翻译提示对原文进行标注,得到样本原文;
样本标注单元,还用于根据预设对应关系确定与预设翻译提示相对应的预设提示反馈,并通过预设提示反馈对译文进行标注,得到样本译文;其中,原文与译文相对应;
模型训练单元,用于根据样本原文和样本译文训练翻译模型;
文本翻译单元,用于将检测到的待翻译文本和目标翻译提示输入训练后的翻译模型,触发训练后的翻译模型根据预设对应关系确定目标翻译提示对应的目标提示反馈,并根据目标提示反馈对待翻译文本进行翻译。
在本申请的一种示例性实施例中,文本翻译单元触发训练后的翻译模型根据预设对应关系确定目标翻译提示对应的目标提示反馈,包括:
当检测到用于输入目标翻译提示的用户输入操作时,确定移动焦点的所处位置;
触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定目标翻译提示对应的目标提示反馈。
在本申请的一种示例性实施例中,文本翻译单元触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定目标翻译提示对应的目标提示反馈,包括:
触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定与目标翻译提示对应的至少一个待选提示反馈;
展示至少一个待选提示反馈并检测针对至少一个待选提示反馈的提示反馈选取操作;
若检测到提示反馈选取操作,将至少一个待选提示反馈中与提示反馈选取操作对应的待选提示反馈确定为目标提示反馈。
在本申请的一种示例性实施例中,模型训练单元根据样本原文和样本译文训练翻译模型,包括:
将样本原文输入翻译模型,以使得翻译模型输出与样本原文对应的译文结果;
计算译文结果与样本译文之间的损失函数;
若损失函数不满足预设条件,根据损失函数调整翻译模型对应的模型参数,直到损失函数满足预设条件为止。
在本申请的一种示例性实施例中,模型训练单元将样本原文输入翻译模型,以使得翻译模型输出与样本原文对应的译文结果,包括:
将样本原文输入翻译模型,以使得翻译模型中的编码器生成与样本原文对应的特征向量,并将特征向量输入翻译模型中的解码器,通过解码器将特征向量转换为译文结果。
在本申请的一种示例性实施例中,样本标注单元通过预设翻译提示对原文进行标注,得到样本原文,包括:
根据用于表征预设翻译提示的第一标签和用于分隔文本序列的第二标签将预设翻译提示和原文进行拼接,得到样本原文;
其中,样本原文中包括第一标签和第二标签,第一标签之后为预设翻译提示,第二标签之后为原文,第二标签之前为预设翻译提示和第一标签。
在本申请的一种示例性实施例中,样本标注单元通过预设提示反馈对译文进行标注,得到样本译文,包括:
根据用于表征预设提示反馈的第三标签和用于分隔文本序列的第二标签将预设提示反馈和译文进行拼接,得到样本译文;
其中,样本译文中包括第三标签和第二标签,第三标签之后为预设提示反馈,第二标签之后为译文,第二标签之前为预设提示反馈和第三标签。
根据本申请的一方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的方法。
根据本申请的一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的方法。
根据本申请的一方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的各种可选实现方式中提供的方法。
在本申请的一示例实施方式所提供的基于人工智能的文本翻译方法中,可以通过预设翻译提示对原文进行标注,得到样本原文;根据预设对应关系确定与预设翻译提示相对应的预设提示反馈,并通过预设提示反馈对译文进行标注,得到样本译文;根据样本原文和样本译文训练翻译模型;将检测到的待翻译文本和目标翻译提示输入训练后的翻译模型,触发训练后的翻译模型根据预设对应关系确定目标翻译提示对应的目标提示反馈,并根据目标提示反馈对待翻译文本进行翻译。依据上述方案描述,本申请一方面可以改进训练样本,使得翻译模型能够依据用户输入的目标翻译提示进行文本翻译,从而可以提升翻译准确率,使得文本翻译的结果符合用户的预期。本申请又一方面可以提升交互性,改善用户的使用体验,提升用户的使用黏度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用本申请实施例的一种基于人工智能的文本翻译方法及基于人工智能的文本翻译装置的示例性系统架构的示意图;
图2示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图;
图3示意性示出了根据本申请的一个实施例的基于人工智能的文本翻译方法的流程图;
图4示意性示出了现有技术中的模型架构示意图;
图5示意性示出了现有技术中的模型架构示意图;
图6示意性示出了根据本申请的一个实施例的翻译模型执行翻译过程的示意图;
图7示意性示出了根据本申请的一个实施例的基于人工智能的文本翻译方法的用户界面示意图;
图8示意性示出了根据本申请的一个实施例的基于人工智能的文本翻译方法的流程图;
图9示意性示出了根据本申请的一个实施例中的基于人工智能的文本翻译装置的结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本申请的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本申请的各方面变得模糊。
此外,附图仅为本申请的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出了可以应用本申请实施例的一种基于人工智能的文本翻译方法及基于人工智能的文本翻译装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本申请实施例所提供的基于人工智能的文本翻译方法一般由服务器105执行,相应地,基于人工智能的文本翻译装置一般设置于服务器105中。但本领域技术人员容易理解的是,本申请实施例所提供的基于人工智能的文本翻译方法也可以由终端设备101、102或103执行,相应的,基于人工智能的文本翻译装置也可以设置于终端设备101、102或103中,本示例性实施例中对此不做特殊限定。举例而言,在一种示例性实施例中,服务器105可以通过预设翻译提示对原文进行标注,得到样本原文;根据预设对应关系确定与预设翻译提示相对应的预设提示反馈,并通过预设提示反馈对译文进行标注,得到样本译文;根据样本原文和样本译文训练翻译模型;将检测到的待翻译文本和目标翻译提示输入训练后的翻译模型,触发训练后的翻译模型根据预设对应关系确定目标翻译提示对应的目标提示反馈,并根据目标提示反馈对待翻译文本进行翻译。
图2示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图2示出的电子设备的计算机系统200仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统200包括中央处理单元(CPU)201,其可以根据存储在只读存储器(ROM)202中的程序或者从储存部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有系统操作所需的各种程序和数据。CPU201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207;包括硬盘等的储存部分208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入储存部分208。
特别地,根据本申请的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时,执行本申请的方法和装置中限定的各种功能。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的机器翻译技术,具体通过如下实施例进行说明。
随着人工智能的不断发展,机器翻译的质量不断提升。一般来说,专业人员在进行翻译的时候,可借助机器翻译引先翻译一次文本,再二次修改编辑。但是,这种翻译方式存在交互性不强、翻译效率不高的问题。
基于上述问题,本示例实施方式提供了一种基于人工智能的文本翻译方法。该基于人工智能的文本翻译方法可以应用于上述服务器105,也可以应用于上述终端设备101、102、103中的一个或多个,本示例性实施例中对此不做特殊限定。参考图3所示,该基于人工智能的文本翻译方法可以包括以下步骤S310至步骤S340。
步骤S310:通过预设翻译提示对原文进行标注,得到样本原文。
步骤S320:根据预设对应关系确定与预设翻译提示相对应的预设提示反馈,并通过预设提示反馈对译文进行标注,得到样本译文;其中,原文与译文相对应。
步骤S330:根据样本原文和样本译文训练翻译模型。
步骤S340:将检测到的待翻译文本和目标翻译提示输入训练后的翻译模型,触发训练后的翻译模型根据预设对应关系确定目标翻译提示对应的目标提示反馈,并根据目标提示反馈对待翻译文本进行翻译。
实施图3所示的方法,可以改进训练样本,使得翻译模型能够依据用户输入的目标翻译提示进行文本翻译,从而可以提升翻译准确率,使得文本翻译的结果符合用户的预期。此外,还可以提升交互性,改善用户的使用体验,提升用户的使用黏度。
下面,对于本示例实施方式的上述步骤进行更加详细的说明。
在步骤S310中,通过预设翻译提示对原文进行标注,得到样本原文。
具体地,预设翻译提示的数量可以为一个或多个,预设翻译提示用于表征用户的翻译意向,得到的样本原文可以用于训练翻译模型。
另外,在通过预设翻译提示对原文进行标注之前,还可以执行:从数据库中读取预设翻译提示和与预设翻译提示对应的预设提示反馈。
其中,预设翻译提示可以为采集到的用户输入的历史翻译提示,一个预设翻译提示(如,zg)可以对应一个或多个预设提示反馈(如,中国,这个,整个)。需要说明的是,预设翻译提示和预设提示反馈可以以键值形式(key-value)存储于数据库中。
作为一种可选的实施例,通过预设翻译提示对原文进行标注,得到样本原文,包括:根据用于表征预设翻译提示的第一标签和用于分隔文本序列的第二标签将预设翻译提示和原文进行拼接,得到样本原文;其中,样本原文中包括第一标签和第二标签,第一标签之后为预设翻译提示,第二标签之后为原文,第二标签之前为预设翻译提示和第一标签。
具体地,第一标签和第二标签可以为令牌(token)。
另外,根据用于表征预设翻译提示的第一标签和用于分隔文本序列的第二标签将预设翻译提示和原文进行拼接,得到样本原文的方式可以为:将用于表征预设翻译提示的第一标签(如,<typ>)、用于分隔文本序列的第二标签(如,<sep>)、预设翻译提示(如,ch)以及原文(如,中国是一个美丽的国家)按照预设顺序进行拼接,得到样本原文(如,<typ>ch<sep>中国是一个美丽的国家)。
另外,可选的,在对原文或译文进行标注之前,还可以执行以下步骤:若原文或译文中存在中文文本,则对中文文本进行分词处理。
具体地,对中文文本进行分词处理的方式可以为:确定中文文本中各字符对应的字符级别特征向量,根据相邻的字符级别特征向量之间的相关联程度对中文文本进行切分,得到多个分词(如,中国、是、一个、美丽、的、国家)。
可见,实施该可选的实施例,能够通过对于训练样本的改进,提升训练得到的翻译模型在提示信息辅助下的翻译效率以及翻译准确率。
在步骤S320中,根据预设对应关系确定与预设翻译提示相对应的预设提示反馈,并通过预设提示反馈对译文进行标注,得到样本译文;其中,原文与译文相对应。
具体地,样本译文和样本原文可以为平行语料,该平行语料用于训练翻译模型。
作为一种可选的实施例,通过预设提示反馈对译文进行标注,得到样本译文,包括:根据用于表征预设提示反馈的第三标签和用于分隔文本序列的第二标签将预设提示反馈和译文进行拼接,得到样本译文;其中,样本译文中包括第三标签和第二标签,第三标签之后为预设提示反馈,第二标签之后为译文,第二标签之前为预设提示反馈和第三标签。
具体地,第三标签也可以为令牌(token)。另外,根据用于表征预设提示反馈的第三标签和用于分隔文本序列的第二标签将预设提示反馈和译文进行拼接,得到样本译文的方式可以为:将用于表征预设提示反馈的第三标签(如,<sug>)、用于分隔文本序列的第二标签(如,<sep>)、预设提示反馈(如,China)以及译文(如,China is a beautifulcountry)进行拼接,得到样本译文(如,<sug>China<sep>China is a beautifulcountry)。
可见,实施该可选的实施例,能够通过对于训练样本的改进,提升训练得到的翻译模型在提示信息辅助下的翻译效率以及翻译准确率。
在步骤S330中,根据样本原文和样本译文训练翻译模型。
具体地,翻译模型中可以包括编码器和解码,可以为神经网络机器翻译(neuralmachine translation,nmt)模型,其中,nmt是一种序列到序列(sequence-to-sequence,seq2seq)的模型。
作为一种可选的实施例,根据样本原文和样本译文训练翻译模型,包括:将样本原文输入翻译模型,以使得翻译模型输出与样本原文对应的译文结果;计算译文结果与样本译文之间的损失函数;若损失函数不满足预设条件,根据损失函数调整翻译模型对应的模型参数,直到损失函数满足预设条件为止。
具体地,预设条件用于限定翻译模型的训练标准,预设条件可以为:大于预设损失函数值。另外,翻译模型对应的模型参数至少可以包括:权重和偏置项。
其中,可选的,计算译文结果与样本译文之间的损失函数可以为:计算译文结果对应的特征向量C1以及样本译文对应的特征向量C2,计算特征向量C1和特征向量C2之间的均方误差(Mean Square Error,MSE),作为译文结果与样本译文之间的损失函数;其中,MSE是一种回归损失函数,计算方法是求预测值与真实值之间距离的平方和,表达式为:
其中,n为正整数,yi为样本译文i对应的特征向量C1,为译文结果i对应的特征向量C2。
另外,可选的,译文结果与样本译文之间的损失函数也可以为:回归损失函数、绝对误差损失函数、Huber损失函数、二分类损失函数、二分类交叉熵、Hinge损失函数、多分类损失函数、多分类交叉熵损失或KL散度(Kullback Leibler Divergence Loss),本申请实施例不作限定。
可见,实施该可选的实施例,能够通过对于翻译模型的训练,使其具备根据提示准确翻译文本的功能,能够改善现有技术中存在的翻译效率和翻译准确率较低的问题。
作为一种可选的实施例,将样本原文输入翻译模型,以使得翻译模型输出与样本原文对应的译文结果,包括:将样本原文输入翻译模型,以使得翻译模型中的编码器生成与样本原文对应的特征向量,并将特征向量输入翻译模型中的解码器,通过解码器将特征向量转换为译文结果。
具体地,翻译模型采用了机器翻译(Transformer)模型的编解码模式,Transformer模型由编码组件和解码组件构成,编码组件由多个编码器构成,解码组件由多个解码器构成,编码器和解码器的数量相同;其中,每个编码器中均包括前馈神经网络和自注意力层,每个解码器中均包括前馈神经网络、编码-解码注意力层以及自注意力层。
其中,可选的,翻译模型中的编码器生成与样本原文对应的特征向量的方式可以为:编码器生成与样本原文对应的矩阵组,矩阵组包括查询矩阵、键矩阵、值矩阵;根据矩阵组计算样本原文对应的自注意力向量;根据前馈神经网络计算自注意力向量对应的中间向量;基于自注意力算法以及前馈神经网络计算中间向量对应的特征向量。
可选的,若自注意力层中存在多头自注意力,编码器生成与样本原文对应的矩阵组的方式可以为:生成与样本原文对应的至少两个参考矩阵组并拼接,得到样本原文对应的矩阵组;其中,参考矩阵组的数量与自注意力的头数(如,8)一致。
可选的,编码器生成与样本原文对应的矩阵组的方式可以为:确定样本原文i对应的查询权重矩阵ωQ、键权重矩阵ωK以及值权重矩阵ωV;将ωQ、ωK以及ωV相乘,得到包括查询矩阵Qi、键矩阵Ki、值矩阵Vi的与样本原文i对应的矩阵组;其中,i∈[1、2、……、n],n为正整数。
进一步地,根据矩阵组计算样本原文对应的自注意力向量的方式可以为:依据表达式计算样本原文i对应的自注意力向量Zi;其中,/>用于稳定梯度,/>(如,8)为常数。
进一步地,根据前馈神经网络计算自注意力向量对应的中间向量的方式可以为:根据前馈神经网络FFN(Z)=max(0,ZW1+b1)W2+b2对自注意力向量进行特征提取,得到自注意力向量对应的中间向量;其中,W1、b1、W2以及b2为可调参数,可以表示为常数。前馈神经网络包括激活函数层和整流性单元函数层,用于对向量中的元素进行归一化,防止梯度消失。具体地,激活函数层可以包括sigmoid函数或tanh函数;整流性单元函数层可以包括relu函数。
更进一步地,基于自注意力算法以及前馈神经网络计算中间向量对应的特征向量的方式可以为:通过多次编解码处理上述的中间向量,以计算得到中间向量对应的特征向量;其中,编解码处理可以依赖于自注意力算法以及前馈神经网络。
进而,可以通过解码器对特征向量进行解码从而得到样本原文的翻译结果。当翻译模型对于样本原文的翻译结果与样本译文之间的损失函数小于预设阈值时,可以判定翻译模型训练完成,若损失函数大于等于预设阈值,则调整翻译模型中的模型参数,直到翻译模型可以对样本原文进行准确翻译为止;其中,对样本原文进行准确翻译具体可以表现在,损失函数小于预设阈值。
请参阅图4,图4示意性示出了现有技术中的模型架构示意图。如图4所示,翻译模型400可以包括编码器401和解码器402;其中,编码器401用于将输入的原文E转换为特征向量c,进而,将特征向量c输入解码器402,以使得解码器402对特征向量c进行解码,得到译文F。
其中,在对翻译模型400进行训练的过程中可以依赖训练方法(TeacherForcing),Teacher Forcing是一种用于快速有效训练循环神经网络模型的方法,一般以上一时刻的输出作为下一时刻的输入。即,可以将译文F按照字符粒度右移一位之后输入解码器402中,以训练翻译模型400学习E与F之间的字符对应关系,从而增强文本翻译能力。
举例来说,原文F=x1,x2,……,xT,译文E=y1,y2,……,yT’。,最大化译文E基于原文F的条件概率可以得到:进而,代入原文E和译文F并取对数,可以得到损失函数:
当原文F经过编码器401编码后可以得到特征向量c,将征向量c代入损失函数可以得到:根据该损失函数可以调整翻译模型400对应的模型参数。
但是,这样容易存在翻译效果未能达到用户预期的问题。因此,本申请对现有技术中输入的原文E和译文F进行了改进,将训练样本改进为本申请中的样本原文E和样本译文F其中包括了用户输入的翻译提示以及对应的提示反馈。从而有助于依据用户输入的提示更快地翻译出符合用户预期的文本,相较于现有技术,具备更高的翻译效率。另外,通过独立模型的输入输出即可完成翻译操作,还可以提升交互性。
请参阅图5,图5示意性示出了现有技术中的模型架构示意图。如图5所示,翻译模型500可以包括编码器501和解码器502。
以原文为“中国是一个美丽的国家”且译文为“China is a beautiful country”为例;F=中国,是,一个,美丽,的,国家;译文E=China,is,a,beautiful,country。将原文F输入编码器501之后可以触发编码器501对原文F进行编码,得到特征向量c并输入解码器502。进而,解码器502可以解码特征向量c,得到译文E。其中,可以通过<b>标识译文E的开启,以及通过<e>标识译文E的结束,从而可以将上一时刻的输出作为下一时刻的输入,以使得解码器502在解码特征向量c的过程中,每解码得到一个英文单词(例如,China),则将该英文单词作为解码下一英文单词(如,is)时的输入,从而实现通过Teacher Forcing的方式对翻译模型500进行训练。
但是,这样容易存在翻译效果未能达到用户预期的问题。因此,本申请对现有技术中输入的原文E和译文F进行了改进,将训练样本改进为本申请中的样本原文E和样本译文F其中包括了用户输入的翻译提示以及对应的提示反馈。从而有助于依据用户输入的提示更快地翻译出符合用户预期的文本,相较于现有技术,具备更高的翻译效率。另外,通过独立模型的输入输出即可完成翻译操作,还可以提升交互性。
可见,实施该可选的实施例,能够基于对训练样本的改进,扩展模型的翻译功能,现有技术中的翻译模型只能够根据用户输入的待翻译文本直接翻译出译文。但是,一个词汇通常可以对应一个或多个意思。因此,通过现有技术中的方式翻译出的译文通常是不准确的,需要用户进一步进行手动调整,这样容易造成用户体验不佳的问题。而本申请可以将训练样本中加入提示信息,以使得训练后的翻译模型可以在翻译的过程中根据用户输入的提示信息提供待选项,根据用户对于待选项的选择翻译文本,这种方式得到的译文文本更符合用户的预期,可以改善用户的使用体验,提升用户的使用黏度。
在步骤S340中,将检测到的待翻译文本和目标翻译提示输入训练后的翻译模型,触发训练后的翻译模型根据预设对应关系确定目标翻译提示对应的目标提示反馈,并根据目标提示反馈对待翻译文本进行翻译。
具体地,训练后的翻译模型对待翻译文本进行翻译之后获得的翻译结果与待翻译文本对应于相同含义不同语种,例如,翻译结果为英文,待翻译文本为中文。
另外,目标翻译提示可以为首字母缩写、拼音缩写、英文缩写等,目标翻译提示可以包括字符、数字以及符号中至少一种,本申请实施例不作限定。
其中,可选的,在将检测到的待翻译文本和目标翻译提示输入训练后的翻译模型之前,还可以执行以下步骤:检测用于输入/导入待翻译文本的用户交互操作以及用于输入目标翻译提示的用户输入操作;若检测到用户交互操作和用户输入操作,则将待翻译文本和目标翻译提示显示于用户界面中。
这样可以便于用户随时查看输入/导入的信息是否正确,在输入的信息存在问题时,方便用户及时发现、修改。其中,用户交互操作可以为语音输入操作或键入操作,用户输入操作同理。
作为一种可选的实施例,触发训练后的翻译模型根据预设对应关系确定目标翻译提示对应的目标提示反馈,包括:当检测到用于输入目标翻译提示的用户输入操作时,确定移动焦点的所处位置;触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定目标翻译提示对应的目标提示反馈。
具体地,移动焦点可以为鼠标指针,移动焦点的所处位置可以通过坐标进行表示,例如,(124,254),也可以通过字符位置进行限定,例如,移动焦点处于字符“China”的左侧。
其中,触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定目标翻译提示对应的目标提示反馈的方式可以为:触发训练后的翻译模型确定所处位置相邻的字符,其中,所处位置相邻的字符可以包括左相邻字符和右相邻字符;确定所处位置相邻的字符中的目标字符(左相邻字符或右相邻字符);根据目标字符以及预设对应关系确定目标翻译提示对应的目标提示反馈。
可见,实施该可选的实施例,能够根据移动焦点的位置确定用户当前输入的提示与哪个字符相关,从而有利于根据与提示相关的该字符确定出更准确的目标提示反馈,改善用户使用体验。
作为一种可选的实施例,触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定目标翻译提示对应的目标提示反馈,包括:触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定与目标翻译提示对应的至少一个待选提示反馈;展示至少一个待选提示反馈并检测针对至少一个待选提示反馈的提示反馈选取操作;若检测到提示反馈选取操作,将至少一个待选提示反馈中与提示反馈选取操作对应的待选提示反馈确定为目标提示反馈。
具体地,触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定与目标翻译提示对应的至少一个待选提示反馈的方式可以为:触发训练后的翻译模型根据所处位置相邻的字符从预设对应关系中筛选与其相关的目标对应关系;从目标对应关系中选取与目标翻译提示对应的至少一个待选提示反馈。
进而,检测针对至少一个待选提示反馈的提示反馈选取操作的方式可以为:检测作用于至少一个待选提示反馈中任一待选提示反馈的提示反馈选取操作。
可见,实施该可选的实施例,能够通过对选取操作的检测,提升本申请的交互性,以及,有利于根据用户选取的目标提示反馈为用户生成更符合预期的译文,从而有利于改善用户的使用体验,提升用户的使用黏度。
请参阅图6,图6示意性示出了根据本申请的一个实施例的翻译模型执行翻译过程的示意图。如图6所示,以待翻译文本为“中国是一个美丽的国家”且翻译结果为“China isa beautiful country”为例。
具体地,翻译模型600可以根据用户输入的目标翻译提示“ch”确定与目标翻译提示“ch”对应的至少一个待选提示反馈,并根据用户选择操作从至少一个待选提示反馈中确定出目标提示反馈“China”。
进而,可以根据“ch”对应的第一标签“<typ>”、目标提示反馈“China”对应的第二标签“<sug>”、待翻译文本“中国是一个美丽的国家”对应的第二标签“<sep>”确定待翻译文本对应的翻译结果“China is a beautiful country”。
进一步地,请参阅图7,图7示意性示出了根据本申请的一个实施例的基于人工智能的文本翻译方法的用户界面示意图。
如图7所示,用户界面700可以包括待翻译文本的显示区域710、目标翻译提示的显示区域720、至少一个待选提示反馈的显示区域730、待翻译文本对应的翻译结果的显示区域740以及交互控件750。
其中,待翻译文本的显示区域710可以用于显示用户导入/输入的待翻译文本,待翻译文本至少包括:前一句712、当前句713以及后一句714。目标翻译提示的显示区域720可以用于显示用户输入的目标翻译提示,如,zg。至少一个待选提示反馈的显示区域730用于显示与目标翻译提示相对应的至少一个待选提示反馈,具体包括:1中国2这个3整个。待翻译文本对应的翻译结果的显示区域740用于显示与待翻译文本对应的翻译结果;其中,包括与当前句713相对应的翻译结果741。另外,表示为“确定”的交互控件750被触发时,可以判定当前句的翻译结果与当前句相匹配。
下面参照上述对于图7中图例的描述,进行具体地实施例展开:
当用户界面700的显示区域710中检测到待翻译文本时,可以按照预设窗口长度对待翻译文本进行依次翻译;其中,预设窗口长度用于限定一次翻译的字符数量(如,20)。例如,可以每次翻译20个字直到翻译完待翻译文本中的所有字。
或者,当用户界面700的显示区域710中检测到待翻译文本时,可以按照检测到的预设字符(如,中文句号、英文句号)对翻译文本进行依次翻译。例如,当检测到预设字符时,将该预设字符与前一预设字符之间的多个字符判定为一句话,并对这一句话进行翻译,进而可以循环执行上述步骤。
或者,当用户界面700的显示区域710中检测到待翻译文本时,可以按照段落对翻译文本进行依次翻译。即,一次翻译一段。
进而,当检测到移动焦点711处于当前句713中的字符“China”的左侧(即,移动焦点711与字符“China”相邻)时,可以判定用户输入的目标翻译提示“zg”与字符“China”相关,并根据目标翻译提示“zg”、字符“China”以及预设对应关系确定目标翻译提示对应的至少一个待选提示反馈“1中国2这个3整个”。其中,“zg”为“中国”、“这个”以及“整个”的拼音首字母。
进而,若检测到作用于待选提示反馈“中国”的用户选取操作,可以根据“中国”翻译当前句713,得到当前句对应的翻译结果741并展示于待翻译文本对应的翻译结果的显示区域740中。若用户对于当前句对应的翻译结果741不满意,还可以将移动焦点711移动至所聚焦的字符(如,beautiful)左侧,并在目标翻译提示的显示区域720中输入与该字符(如,beautiful)相关的提示,以得到关于该提示反馈的至少一个待选提示反馈。进而,可以根据用户选择的与字符(如,beautiful)相关的目标提示反馈以及与字符“China”相关的目标提示反馈更新当前句对应的翻译结果741。
进而,若检测到触发交互控件750的用户操作,则判定对于当前句713翻译完成,进而通过对上述步骤的循环执行,以完成对于后一句714以及后一句714之后文本的翻译。
请参阅图8,图8示意性示出了根据本申请的一个实施例的基于人工智能的文本翻译方法的流程图。如图8所示,基于人工智能的文本翻译方法包括:步骤S800~步骤S870。
步骤S800:根据用于表征预设翻译提示的第一标签和用于分隔文本序列的第二标签将预设翻译提示和原文进行拼接,得到样本原文;其中,样本原文中包括第一标签和第二标签,第一标签之后为预设翻译提示,第二标签之后为原文,第二标签之前为预设翻译提示和第一标签。
步骤S810:根据预设对应关系确定与预设翻译提示相对应的预设提示反馈。
步骤S820:根据用于表征预设提示反馈的第三标签和用于分隔文本序列的第二标签将预设提示反馈和译文进行拼接,得到样本译文;其中,样本译文中包括第三标签和第二标签,第三标签之后为预设提示反馈,第二标签之后为译文,第二标签之前为预设提示反馈和第三标签。
步骤S830:将样本原文输入翻译模型,以使得翻译模型中的编码器生成与样本原文对应的特征向量,并将特征向量输入翻译模型中的解码器,通过解码器将特征向量转换为译文结果。
步骤S840:计算译文结果与样本译文之间的损失函数,若损失函数不满足预设条件,根据损失函数调整翻译模型对应的模型参数,直到损失函数满足预设条件为止。
步骤S850:将检测到的待翻译文本和目标翻译提示输入训练后的翻译模型,当检测到用于输入目标翻译提示的用户输入操作时,确定移动焦点的所处位置,进而,触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定与目标翻译提示对应的至少一个待选提示反馈。
步骤S860:展示至少一个待选提示反馈并检测针对至少一个待选提示反馈的提示反馈选取操作。
步骤S870:若检测到提示反馈选取操作,将至少一个待选提示反馈中与提示反馈选取操作对应的待选提示反馈确定为目标提示反馈。
需要说明的是,步骤S800~步骤S870与图3所示的各步骤及其实施例相对应,针对步骤S800~步骤S870的具体实施方式,请参阅图3所示的各步骤及其实施例,此处不再赘述。
本示例实施方式中,还提供了一种基于人工智能的文本翻译系统。该系统可以包括:客户端和服务器。
服务器,可以用于通过预设翻译提示对原文进行标注,得到样本原文;根据预设对应关系确定与所述预设翻译提示相对应的预设提示反馈,并通过所述预设提示反馈对译文进行标注,得到样本译文;其中,所述原文与所述译文相对应;根据所述样本原文和所述样本译文训练翻译模型。
客户端,用于接收待翻译文本和目标翻译提示,并根据待翻译文本和目标翻译提示生成翻译请求,将翻译请求反馈至服务器。
服务器,还可以用于接收翻译请求,并将翻译请求中的待翻译文本和目标翻译提示输入训练后的翻译模型,触发所述训练后的翻译模型根据所述预设对应关系确定所述目标翻译提示对应的目标提示反馈并根据所述目标提示反馈对所述待翻译文本进行翻译。
可见,实施上述实施方式中的系统,可以改进训练样本,使得翻译模型能够依据用户输入的目标翻译提示进行文本翻译,从而可以提升翻译准确率,使得文本翻译的结果符合用户的预期。此外,还可以提升交互性,改善用户的使用体验,提升用户的使用黏度。
进一步的,本示例实施方式中,还提供了一种基于人工智能的文本翻译装置。参考图9所示,该基于人工智能的文本翻译装置900可以包括:样本标注单元901、模型训练单元902以及文本翻译单元903,其中:
样本标注单元901,用于通过预设翻译提示对原文进行标注,得到样本原文;
样本标注单元901,还用于根据预设对应关系确定与预设翻译提示相对应的预设提示反馈,并通过预设提示反馈对译文进行标注,得到样本译文;其中,原文与译文相对应;
模型训练单元902,用于根据样本原文和样本译文训练翻译模型;
文本翻译单元903,用于将检测到的待翻译文本和目标翻译提示输入训练后的翻译模型,触发训练后的翻译模型根据预设对应关系确定目标翻译提示对应的目标提示反馈,并根据目标提示反馈对待翻译文本进行翻译。
可见,实施图9所示的装置,可以改进训练样本,使得翻译模型能够依据用户输入的目标翻译提示进行文本翻译,从而可以提升翻译准确率,使得文本翻译的结果符合用户的预期。此外,还可以提升交互性,改善用户的使用体验,提升用户的使用黏度。
在本申请的一种示例性实施例中,文本翻译单元903触发训练后的翻译模型根据预设对应关系确定目标翻译提示对应的目标提示反馈,包括:
当检测到用于输入目标翻译提示的用户输入操作时,确定移动焦点的所处位置;
触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定目标翻译提示对应的目标提示反馈。
可见,实施该可选的实施例,能够根据移动焦点的位置确定用户当前输入的提示与哪个字符相关,从而有利于根据与提示相关的该字符确定出更准确的目标提示反馈,改善用户使用体验。
在本申请的一种示例性实施例中,文本翻译单元903触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定目标翻译提示对应的目标提示反馈,包括:
触发训练后的翻译模型根据所处位置相邻的字符以及预设对应关系确定与目标翻译提示对应的至少一个待选提示反馈;
展示至少一个待选提示反馈并检测针对至少一个待选提示反馈的提示反馈选取操作;
若检测到提示反馈选取操作,将至少一个待选提示反馈中与提示反馈选取操作对应的待选提示反馈确定为目标提示反馈。
可见,实施该可选的实施例,能够通过对选取操作的检测,提升本申请的交互性,以及,有利于根据用户选取的目标提示反馈为用户生成更符合预期的译文,从而有利于改善用户的使用体验,提升用户的使用黏度。
在本申请的一种示例性实施例中,模型训练单元902根据样本原文和样本译文训练翻译模型,包括:
将样本原文输入翻译模型,以使得翻译模型输出与样本原文对应的译文结果;
计算译文结果与样本译文之间的损失函数;
若损失函数不满足预设条件,根据损失函数调整翻译模型对应的模型参数,直到损失函数满足预设条件为止。
可见,实施该可选的实施例,能够通过对于翻译模型的训练,使其具备根据提示准确翻译文本的功能,能够改善现有技术中存在的翻译效率和翻译准确率较低的问题。
在本申请的一种示例性实施例中,模型训练单元902将样本原文输入翻译模型,以使得翻译模型输出与样本原文对应的译文结果,包括:
将样本原文输入翻译模型,以使得翻译模型中的编码器生成与样本原文对应的特征向量,并将特征向量输入翻译模型中的解码器,通过解码器将特征向量转换为译文结果。
可见,实施该可选的实施例,能够基于对训练样本的改进,扩展模型的翻译功能,现有技术中的翻译模型只能够根据用户输入的待翻译文本直接翻译出译文。但是,一个词汇通常可以对应一个或多个意思。因此,通过现有技术中的方式翻译出的译文通常是不准确的,需要用户进一步进行手动调整,这样容易造成用户体验不佳的问题。而本申请可以将训练样本中加入提示信息,以使得训练后的翻译模型可以在翻译的过程中根据用户输入的提示信息提供待选项,根据用户对于待选项的选择翻译文本,这种方式得到的译文文本更符合用户的预期,可以改善用户的使用体验,提升用户的使用黏度。
在本申请的一种示例性实施例中,样本标注单元901通过预设翻译提示对原文进行标注,得到样本原文,包括:
根据用于表征预设翻译提示的第一标签和用于分隔文本序列的第二标签将预设翻译提示和原文进行拼接,得到样本原文;
其中,样本原文中包括第一标签和第二标签,第一标签之后为预设翻译提示,第二标签之后为原文,第二标签之前为预设翻译提示和第一标签。
可见,实施该可选的实施例,能够通过对于训练样本的改进,提升训练得到的翻译模型在提示信息辅助下的翻译效率以及翻译准确率。
在本申请的一种示例性实施例中,样本标注单元901通过预设提示反馈对译文进行标注,得到样本译文,包括:
根据用于表征预设提示反馈的第三标签和用于分隔文本序列的第二标签将预设提示反馈和译文进行拼接,得到样本译文;
其中,样本译文中包括第三标签和第二标签,第三标签之后为预设提示反馈,第二标签之后为译文,第二标签之前为预设提示反馈和第三标签。
可见,实施该可选的实施例,能够通过对于训练样本的改进,提升训练得到的翻译模型在提示信息辅助下的翻译效率以及翻译准确率。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
由于本申请的示例实施例的基于人工智能的文本翻译装置的各个功能模块与上述基于人工智能的文本翻译方法的示例实施例的步骤对应,因此对于本申请装置实施例中未披露的细节,请参照本申请上述的基于人工智能的文本翻译方法的实施例。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (9)
1.一种基于人工智能的文本翻译方法,其特征在于,包括:
通过预设翻译提示对原文进行标注,得到样本原文;
根据预设对应关系确定与所述预设翻译提示相对应的预设提示反馈,并通过所述预设提示反馈对译文进行标注,得到样本译文;其中,所述原文与所述译文相对应;
根据所述样本原文和所述样本译文训练翻译模型;
将检测到的待翻译文本和目标翻译提示输入训练后的翻译模型,触发所述训练后的翻译模型根据所述预设对应关系确定所述目标翻译提示对应的目标提示反馈,并根据所述目标提示反馈对所述待翻译文本进行翻译;
其中,所述通过所述预设提示反馈对译文进行标注,得到样本译文,包括:
根据用于表征所述预设提示反馈的第三标签和用于分隔文本序列的第二标签将所述预设提示反馈和所述译文进行拼接,得到所述样本译文;
其中,所述样本译文中包括所述第三标签和所述第二标签,所述第三标签之后为所述预设提示反馈,所述第二标签之后为所述译文,所述第二标签之前为所述预设提示反馈和所述第三标签。
2.根据权利要求1所述的方法,其特征在于,触发所述训练后的翻译模型根据所述预设对应关系确定所述目标翻译提示对应的目标提示反馈,包括:
当检测到用于输入所述目标翻译提示的用户输入操作时,确定移动焦点的所处位置;
触发所述训练后的翻译模型根据所述所处位置相邻的字符以及所述预设对应关系确定所述目标翻译提示对应的目标提示反馈。
3.根据权利要求2所述的方法,其特征在于,触发所述训练后的翻译模型根据所述所处位置相邻的字符以及所述预设对应关系确定所述目标翻译提示对应的目标提示反馈,包括:
触发所述训练后的翻译模型根据所述所处位置相邻的字符以及所述预设对应关系确定与所述目标翻译提示对应的至少一个待选提示反馈;
展示所述至少一个待选提示反馈并检测针对所述至少一个待选提示反馈的提示反馈选取操作;
若检测到所述提示反馈选取操作,将所述至少一个待选提示反馈中与所述提示反馈选取操作对应的待选提示反馈确定为所述目标提示反馈。
4.根据权利要求1所述的方法,其特征在于,根据所述样本原文和所述样本译文训练翻译模型,包括:
将所述样本原文输入所述翻译模型,以使得所述翻译模型输出与所述样本原文对应的译文结果;
计算所述译文结果与所述样本译文之间的损失函数;
若所述损失函数不满足预设条件,根据所述损失函数调整所述翻译模型对应的模型参数,直到所述损失函数满足所述预设条件为止。
5.根据权利要求4所述的方法,其特征在于,将所述样本原文输入所述翻译模型,以使得所述翻译模型输出与所述样本原文对应的译文结果,包括:
将所述样本原文输入所述翻译模型,以使得所述翻译模型中的编码器生成与所述样本原文对应的特征向量,并将所述特征向量输入所述翻译模型中的解码器,通过所述解码器将所述特征向量转换为译文结果。
6.根据权利要求1所述的方法,其特征在于,通过预设翻译提示对原文进行标注,得到样本原文,包括:
根据用于表征所述预设翻译提示的第一标签和用于分隔文本序列的第二标签将所述预设翻译提示和所述原文进行拼接,得到所述样本原文;
其中,所述样本原文中包括所述第一标签和所述第二标签,所述第一标签之后为所述预设翻译提示,所述第二标签之后为所述原文,所述第二标签之前为所述预设翻译提示和所述第一标签。
7.一种基于人工智能的文本翻译装置,其特征在于,包括:
样本标注单元,用于通过预设翻译提示对原文进行标注,得到样本原文;
所述样本标注单元,还用于根据预设对应关系确定与所述预设翻译提示相对应的预设提示反馈,并通过所述预设提示反馈对译文进行标注,得到样本译文;其中,所述原文与所述译文相对应;
模型训练单元,用于根据所述样本原文和所述样本译文训练翻译模型;
文本翻译单元,用于将检测到的待翻译文本和目标翻译提示输入训练后的翻译模型,触发所述训练后的翻译模型根据所述预设对应关系确定所述目标翻译提示对应的目标提示反馈,并根据所述目标提示反馈对所述待翻译文本进行翻译;
其中,所述通过所述预设提示反馈对译文进行标注,得到样本译文,包括:
根据用于表征所述预设提示反馈的第三标签和用于分隔文本序列的第二标签将所述预设提示反馈和所述译文进行拼接,得到所述样本译文;
其中,所述样本译文中包括所述第三标签和所述第二标签,所述第三标签之后为所述预设提示反馈,所述第二标签之后为所述译文,所述第二标签之前为所述预设提示反馈和所述第三标签。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6任一项所述的方法。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011126438.6A CN112163434B (zh) | 2020-10-20 | 2020-10-20 | 基于人工智能的文本翻译方法、装置、介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011126438.6A CN112163434B (zh) | 2020-10-20 | 2020-10-20 | 基于人工智能的文本翻译方法、装置、介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112163434A CN112163434A (zh) | 2021-01-01 |
CN112163434B true CN112163434B (zh) | 2024-03-08 |
Family
ID=73867642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011126438.6A Active CN112163434B (zh) | 2020-10-20 | 2020-10-20 | 基于人工智能的文本翻译方法、装置、介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112163434B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114997185B (zh) * | 2021-10-27 | 2023-07-04 | 荣耀终端有限公司 | 翻译方法、介质、程序产品及电子设备 |
CN116933807B (zh) * | 2023-09-14 | 2023-12-29 | 成都帆点创想科技有限公司 | 一种文本翻译方法、装置、设备及可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8543563B1 (en) * | 2012-05-24 | 2013-09-24 | Xerox Corporation | Domain adaptation for query translation |
CN104731777A (zh) * | 2015-03-31 | 2015-06-24 | 网易有道信息技术(北京)有限公司 | 一种译文评价方法及装置 |
CN110083842A (zh) * | 2019-03-27 | 2019-08-02 | 华为技术有限公司 | 译文质量检测方法、装置、机器翻译系统和存储介质 |
CN110532575A (zh) * | 2019-08-21 | 2019-12-03 | 语联网(武汉)信息技术有限公司 | 文本翻译方法及装置 |
CN110765791A (zh) * | 2019-11-01 | 2020-02-07 | 清华大学 | 机器翻译自动后编辑方法及装置 |
CN111182162A (zh) * | 2019-12-26 | 2020-05-19 | 深圳壹账通智能科技有限公司 | 基于人工智能的电话质检方法、装置、设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050027664A1 (en) * | 2003-07-31 | 2005-02-03 | Johnson David E. | Interactive machine learning system for automated annotation of information in text |
-
2020
- 2020-10-20 CN CN202011126438.6A patent/CN112163434B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8543563B1 (en) * | 2012-05-24 | 2013-09-24 | Xerox Corporation | Domain adaptation for query translation |
CN104731777A (zh) * | 2015-03-31 | 2015-06-24 | 网易有道信息技术(北京)有限公司 | 一种译文评价方法及装置 |
CN110083842A (zh) * | 2019-03-27 | 2019-08-02 | 华为技术有限公司 | 译文质量检测方法、装置、机器翻译系统和存储介质 |
CN110532575A (zh) * | 2019-08-21 | 2019-12-03 | 语联网(武汉)信息技术有限公司 | 文本翻译方法及装置 |
CN110765791A (zh) * | 2019-11-01 | 2020-02-07 | 清华大学 | 机器翻译自动后编辑方法及装置 |
CN111182162A (zh) * | 2019-12-26 | 2020-05-19 | 深圳壹账通智能科技有限公司 | 基于人工智能的电话质检方法、装置、设备和存储介质 |
Non-Patent Citations (4)
Title |
---|
Recognizing learning emotion based on convolutional neural networks and transfer learning;Jason C. Hung 等;《Applied Soft Computing》;第84卷;1-19 * |
人工智能翻译下的大数据语料库建设;陆艳;《甘肃科技》;第35卷(第17期);80-84 * |
基于GRA-MEA-BP耦合模型的城市需水预测研究;李晓英 等;《水资源与水工程学报》;第29卷(第01期);50-54 * |
基于污染源追踪的PHP源代码漏洞检测方法研究;张媛;《环境科学与管理》;第45卷(第07期);23-27 * |
Also Published As
Publication number | Publication date |
---|---|
CN112163434A (zh) | 2021-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10380996B2 (en) | Method and apparatus for correcting speech recognition result, device and computer-readable storage medium | |
US11481562B2 (en) | Method and apparatus for evaluating translation quality | |
US11501182B2 (en) | Method and apparatus for generating model | |
CN107705784B (zh) | 文本正则化模型训练方法和装置、文本正则化方法和装置 | |
CN107680580B (zh) | 文本转换模型训练方法和装置、文本转换方法和装置 | |
CN110956018B (zh) | 文本处理模型的训练方法、文本处理方法、装置及存储介质 | |
CN109063174B (zh) | 查询答案的生成方法及装置、计算机存储介质、电子设备 | |
CN110163181B (zh) | 手语识别方法及装置 | |
JP7312799B2 (ja) | 情報抽出方法、抽出モデル訓練方法、装置及び電子機器 | |
CN113470619B (zh) | 语音识别方法、装置、介质及设备 | |
CN112528637B (zh) | 文本处理模型训练方法、装置、计算机设备和存储介质 | |
CN112163434B (zh) | 基于人工智能的文本翻译方法、装置、介质及电子设备 | |
CN112100332A (zh) | 词嵌入表示学习方法及装置、文本召回方法及装置 | |
CN110705273B (zh) | 基于神经网络的信息处理方法及装置、介质和电子设备 | |
CN112883967B (zh) | 图像字符识别方法、装置、介质及电子设备 | |
CN113743101A (zh) | 文本纠错方法、装置、电子设备和计算机存储介质 | |
CN117217233A (zh) | 文本纠正、文本纠正模型训练方法及装置 | |
CN116434752A (zh) | 语音识别纠错方法和装置 | |
CN108920560B (zh) | 生成方法、训练方法、装置、计算机可读介质及电子设备 | |
CN111666405B (zh) | 用于识别文本蕴含关系的方法和装置 | |
CN113947060A (zh) | 文本转换方法、装置、介质及电子设备 | |
CN110728137B (zh) | 用于分词的方法和装置 | |
CN113421551B (zh) | 语音识别方法、装置、计算机可读介质及电子设备 | |
CN113761157B (zh) | 应答语句生成方法和装置 | |
CN117392379B (zh) | 目标检测的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |