CN114330311A - 一种翻译方法、装置、电子设备和计算机可读存储介质 - Google Patents
一种翻译方法、装置、电子设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN114330311A CN114330311A CN202111646858.1A CN202111646858A CN114330311A CN 114330311 A CN114330311 A CN 114330311A CN 202111646858 A CN202111646858 A CN 202111646858A CN 114330311 A CN114330311 A CN 114330311A
- Authority
- CN
- China
- Prior art keywords
- translation result
- sentence
- modified
- candidate
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 341
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012986 modification Methods 0.000 claims abstract description 89
- 230000004048 modification Effects 0.000 claims abstract description 89
- 238000012937 correction Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 10
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000004576 sand Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
本申请公开了一种翻译方法、装置、电子设备和计算机可读存储介质,该方法包括:接收来自客户端设备的对翻译结果进行修改的修改意见,修改意见包括修改语句;计算修改语句对候选翻译结果的权重的影响系数;候选翻译结果为对待译文本进行翻译得到的翻译结果,待译文本包括修改语句的源语句;结合影响系数计算各候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为待译文本的翻译结果。通过上述方式,本申请能够提高翻译结果的准确性。
Description
技术领域
本申请涉及翻译技术领域,特别是涉及一种翻译方法、装置、电子设备和计算机可读存储介质。
背景技术
目前,在会议或者演讲等应用场景中,在会议或者演讲进行过程中,会有相关人员对显示界面上的内容的准确性进行保障。但是,由于翻译的中间结果不能被修改且翻译的中间结果展示较长,导致显示界面上出现错误的翻译结果无法被修改。
发明内容
本申请主要解决的技术问题是提供一种翻译方法、装置、电子设备和计算机可读存储介质,能够提高翻译结果的准确性。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种翻译方法,该方法包括:接收来自客户端设备的对翻译结果进行修改的修改意见,修改意见包括修改语句;计算修改语句对候选翻译结果的权重的影响系数;候选翻译结果为对待译文本进行翻译得到的翻译结果,待译文本包括修改语句的源语句;结合影响系数计算各候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为待译文本的翻译结果。
其中,结合影响系数计算各候选翻译结果的权重,包括:获取修改结果,并计算修改结果与各候选翻译结果的重合度;融合影响系数与各重合度,得到各候选翻译结果的权重。
其中,计算修改语句对候选翻译结果的权重的影响系数,包括:影响系数至少包括修改语句的拼写准确系数,拼写准确系数为修改语句与语句数据库中目标样本语句的重叠率,目标样本语句为语句数据库中与修改语句重叠率最高的样本语句,语句数据库中的样本语句为各候选翻译结果中修改语句的源语句的翻译语句。
其中,响应于候选翻译结果包含修改语句,候选翻译结果的权重为重合度与影响系数的和。
其中,响应于候选翻译结果不包含修改语句,且重合度大于预设值,则候选翻译结果的权重为重合度与拼写准确系数的乘积加影响系数。
其中,响应于候选翻译结果不包含修改语句,基于修改语句对待译文本进行翻译,得到反向翻译结果,计算反向翻译结果与候选翻译结果的重合度,候选翻译结果的权重为反向翻译结果与候选翻译结果的重合度与拼写准确系数的乘积。
其中,计算修改语句对候选翻译结果的权重的影响系数,包括:影响系数还包括修改语句的语法准确系数和/或语义准确系数,影响系数为单词准确系数、语法准确系数、语义准确系数的乘积;语法准确系数是利用翻译语法纠错系统对修改语句进行语法校核得到的;语义准确系数是利用语言语法纠错模型对修改语句进行语义评估得到的。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种翻译方法,该方法包括:客户端设备接收来自服务器的翻译结果;客户端设备接收对翻译结果进行修改的修改意见,修改意见包括修改语句;将修改意见反馈给服务器,以使服务器计算修改语句对候选翻译结果的权重的影响系数,结合影响系数计算各候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为待译文本的翻译结果,候选翻译结果为对待译文本进行翻译得到的翻译结果,待译文本包括修改语句的源语句。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种翻译装置,该装置包括:第一接收模块,用于接收来自客户端设备的对翻译结果进行修改的修改意见,修改意见包括修改语句;计算模块,用于计算修改语句对候选翻译结果的权重的影响系数;候选翻译结果为对待译文本进行翻译得到的翻译结果,待译文本包括修改语句的源语句;选择模块,用于结合影响系数计算各候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为待译文本的翻译结果。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种翻译装置,该装置包括:第二接收模块,用于接收来自服务器的翻译结果;第三接收模块,用于接收对翻译结果进行修改的修改意见,修改意见包括修改语句;反馈模块,用于将修改意见反馈给服务器,以使服务器计算修改语句对候选翻译结果的权重的影响系数,结合影响系数计算各候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为待译文本的翻译结果,候选翻译结果为对待译文本进行翻译得到的翻译结果,待译文本包括修改语句的源语句。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述的翻译方法。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质存储有能够被处理器运行的程序指令,程序指令用于实现上述的翻译方法。
本申请的有益效果是:区别于现有技术的情况,本申请提供一种翻译方法,该方法包括:接收来自客户端设备的对翻译结果进行修改的修改意见,修改意见包括修改语句;计算修改语句对候选翻译结果的权重的影响系数;候选翻译结果为对待译文本进行翻译得到的翻译结果,待译文本包括修改语句的源语句;结合影响系数计算各候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为待译文本的翻译结果。通过结合修改语句对候选翻译结果的权重的影响系数计算各候选翻译结果的权重,能够实时根据修改语句对各候选翻译结果的权重进行调整,实现从影响系数的维度调整各候选翻译结果的权重,以获取在修改语句的影响系数条件影响下的待译文本的翻译结果,翻译结果的准确性更高。
附图说明
图1是本申请提供的翻译方法一实施例的流程示意图;
图2是本申请提供的结合影响系数计算各候选翻译结果的权重一实施例的流程示意图;
图3是本申请提供的翻译方法另一实施例的流程示意图;
图4是本申请提供的第一翻译装置一实施例的框架示意图;
图5是本申请提供的第二翻译装置一实施例的框架示意图;
图6是本申请提供的电子设备一实施例的框架示意图;
图7是本申请提供的计算机可读存储介质一实施例的框架示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请提供的翻译方法一实施例的流程示意图。需要注意的是,若有实质上相同的结果,本实施例并不以图1所示的流程顺序为限。如图1所示,本实施例包括:
步骤S11:接收来自客户端设备的对翻译结果进行修改的修改意见。
由于在会议或者演讲等应用场景时,在进行过程中,会有相关人员对显示界面上的内容的准确性进行保障。但是,由于翻译的中间结果不能被修改且翻译的中间结果展示较长,导致显示界面上出现的错误的翻译结果无法被修改。因此,本实施方式中,接收来自客户端设备的对翻译结果进行修改的修改意见。其中,修改意见包括修改语句。也就是说,本申请能够对翻译结果即上述提及的翻译的中间结果进行修改,即增加了对翻译结果的可编辑操作性,能够使得后续根据对翻译结果的修改意见调整候选翻译结果的权重,以提高翻译结果的准确性。
在一实施方式中,本实施例的执行主体是服务器,具体可以为流式翻译引擎等,在此不做具体限定。
步骤S12:计算修改语句对候选翻译结果的权重的影响系数。
本实施方式中,计算修改语句对候选翻译结果的权重的影响系数,以便于后续根据影响系数计算得到候选翻译结果的权重,从而提高翻译结构的准确性。其中,候选翻译结果为对待译文本进行翻译得到的翻译结果,待译文本包括修改语句的源语句,也就是说,对待译文本中的源语句对应的翻译结果进行修改后,得到源语句对应的修改语句。
在一实施方式中,影响系数至少包括修改语句的拼写准确系数,拼写准确系数为修改语句与语句数据库中目标样本语句的重叠率,目标样本语句为语句数据库中与修改语句重叠率最高的样本语句,语句数据库中的样本语句为各候选翻译结果中修改语句的源语句的翻译语句。也就是说,修改语句的拼写准确系数为修改语句与语句数据库中与修改语句重叠率最高的样本语句的重叠率。
具体地,会计算出修改语句与语句数据库中的各样本语句的重叠率,即会计算出修改语句与各候选翻译结果中修改语句的源语句的翻译语句之间的重叠率;将与修改语句重叠率最高的样本语句作为目标样本语句,并将修改语句与目标样本语句之间的重叠率作为修改语句的拼写准确系数K1,修改语句的拼写准确系数K1≤1。修改语句与目标样本语句之间的重叠率越高,修改语句的拼写准确系数越高。其中,不对计算修改语句与语句数据库中的各样本语句的重叠率的算法进行限定,可根据实际使用需要具体设置。举例来说,修改语句为As,语句数据库中的各样本语句分别为:A1、A2、A3和A4,修改语句As与语句数据库中的各样本语句的重叠率分别是:0.8、0.5、0.6和0.7;所以目标样本语句为A1,修改语句的拼写准确系数K1即为修改语句As与目标样本语句A1之间的重叠率0.8,即K1=0.8。
在其他实施方式中,影响系数还包括修改语句的语法准确系数和语义准确系数,即影响系数包括修改语句的拼写准确系数、语法准确系数和语义准确系数,影响系数为修改语句的拼写准确系数、语法准确系数、语义准确系数的乘积。其中,语法准确系数是利用翻译语法纠错系统对修改语句进行语法校核得到的,语义准确系数是利用语言语法纠错模型对修改语句进行语义评估得到的。也就是说,对于修改语句,会从语义连贯、语法、单词和转写内容匹配等多维度去定义修改语句的权重比例。
具体地,建立翻译语音的语法库,利用翻译语法纠错系统(GEC)对修改语句中的语法进行检测,得到修改语句的语法准确系数K2,语法准确系数K2≤1。利用语言语法纠错模型对修改语句的语义和识别内容中的语义语境进行匹配,得到匹配程度即语义准确系数K3,匹配程度越高,语义准确系数K3越大,K3≤1。进一步地,将修改语句的拼写准确系数K1、语法准确系数K2和语义准确系数K3相乘,得到影响系数K,即K=K1×K2×K3。
在其他实施方式中,影响系数也可只包括修改语句的语法准确系数和拼写准确系数,影响系数为修改语句的拼写准确系数和语法准确系数的乘积。在其他实施方式中,影响系数也可只包括修改语句的语义准确系数和拼写准确系数,影响系数为修改语句的拼写准确系数和语义准确系数的乘积,可根据实际使用需要具体设置,在此不做具体限定。
步骤S13:结合影响系数计算各候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为待译文本的翻译结果。
本实施方式中,结合影响系数计算各候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为待译文本的翻译结果。其中,预设条件可以是候选翻译结果的权重为各候选翻译结果的权重中最大,即各候选翻译结果中权重最大的候选翻译结果作为待译文本的翻译结果。通过结合修改语句对候选翻译结果的权重的影响系数计算各候选翻译结果的权重,能够实时根据修改语句对各候选翻译结果的权重进行调整,实现从影响系数的维度调整各候选翻译结果的权重,以获取在修改语句的影响系数条件影响下的待译文本的翻译结果,翻译结果的准确性更高。
上述实施方式中,接收来自客户端设备的对翻译结果进行修改的修改意见,修改意见包括修改语句;计算修改语句对候选翻译结果的权重的影响系数;候选翻译结果为对待译文本进行翻译得到的翻译结果,待译文本包括修改语句的源语句;结合影响系数计算各候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为待译文本的翻译结果。通过结合修改语句对候选翻译结果的权重的影响系数计算各候选翻译结果的权重,能够实时根据修改语句对各候选翻译结果的权重进行调整,实现从影响系数的维度调整各候选翻译结果的权重,以获取在修改语句的影响系数条件影响下的待译文本的翻译结果,翻译结果的准确性更高。
请参阅图2,图2是本申请提供的结合影响系数计算各候选翻译结果的权重一实施例的流程示意图。需要注意的是,若有实质上相同的结果,本实施例并不以图2所示的流程顺序为限。如图2所示,本实施例包括:
步骤S131:获取修改结果,并计算修改结果与各候选翻译结果的重合度。
本实施方式中,获取修改结果,并计算修改结果与各候选翻译结果的重合度。其中,不对计算修改结果与各候选翻译结果的重合度算法进行限定,可根据实际使用需要具体设置。
举例来说,获取到的修改结果为“Text contrast method”,各候选翻译结果为“Text contrast methods”、“Text contrast methoded”和“Text contrast means”;修改结果“Text contrast method”与候选翻译结果“Text contrast methods”的重合度为T1,修改结果“Text contrast method”与候选翻译结果“Text contrast methoded”的重合度为T2,修改结果“Text contrast method”与候选翻译结果“Text contrast means”的重合度为T3。
步骤S132:融合影响系数与各重合度,得到各候选翻译结果的权重。
本实施方式中,融合影响系数与各重合度,得到各候选翻译结果的权重。也就是说,根据修改语句对候选翻译结果的权重的影响系数和修改结果与各候选翻译结果的重合度,会重新生成各候选翻译结果的权重。权重越高,翻译结果的准确性越高,所以根据实时的修改结果,能够动态调整各候选翻译结果的权重,从而能够获取到准确度更高的翻译结果,提高翻译结果的准确性。
在一实施方式中,响应于候选翻译结果包含修改语句,候选翻译结果的权重为重合度与影响系数的和。也就是说,在候选翻译结果中包含修改语句,则将修改结果与候选翻译结果的重合度和修改语句对候选翻译结果的权重的影响系数之和作为候选翻译结果的权重。举例来说,假定修改结果与候选翻译结果的重合度为T,修改语句对候选翻译结果的权重的影响系数为K,该候选翻译结果中包含修改语句,所以该候选翻译结果的权重Q=K+T。
在一实施方式中,响应于候选翻译结果不包含修改语句,且重合度大于预设值,则候选翻译结果的权重为重合度与拼写准确系数的乘积加影响系数。其中,不对预设值的大小进行限定,可根据实际使用需要具体设置。例如,预设值为0.7等。举例来说,以预设值为0.7为例,假定修改结果与候选翻译结果的重合度T=0.8大于预设值,修改语句的拼写准确系数为K1,该候选翻译结果中不包含修改语句,所以该候选翻译结果的权重Q=K+T×K1。
在一实施方式中,响应于候选翻译结果不包含修改语句,根据修改语句对待译文本进行翻译,得到反向翻译结果,计算反向翻译结果与候选翻译结果的重合度,候选翻译结果的权重为反向翻译结果与候选翻译结果的重合度与拼写准确系数的乘积。举例来说,假定反向翻译结果与候选翻译结果的重合度K4,修改语句的拼写准确系数为K1,该候选翻译结果不包含修改语句,所以该候选翻译结果的权重Q=K1×K4。
请参阅图3,图3是本申请提供的翻译方法另一实施例的流程示意图。需要注意的是,若有实质上相同的结果,本实施例并不以图1所示的流程顺序为限。如图1所示,本实施例包括:
步骤S31:客户端设备接收来自服务器的翻译结果。
本实施方式中,客户端设备接收来自服务器的翻译结果,以使得后续能够将翻译结果通过逐个出字的效果在客户端设备的显示界面进行显示。
步骤S32:客户端设备接收对翻译结果进行修改的修改意见。
步骤S32与步骤S11类似,在此不再赘述。
步骤S33:将修改意见反馈给服务器,以使服务器计算修改语句对候选翻译结果的权重的影响系数,结合影响系数计算各候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为待译文本的翻译结果,候选翻译结果为对待译文本进行翻译得到的翻译结果。
步骤S33和步骤S12-步骤S13类似,在此不再赘述。
在一实施方式中,客户端在接收到新的修改意见之后,会将当前的修改和之前的修改意见同时反馈给服务器,直至服务器计算出最终的翻译结果。
在一实施方式中,客户端将翻译结果进行拆分。在一具体实施方式中,可根据中英文特点将翻译结果拆分为单词形式或者单个文字形式,具体拆分规则是:英文按照空格拆分、中文按照空字符拆分,拆分后的结构如下:以英文为“Text contrast method”为例,拆分后的结构为[“Text”,“contrast”,“method”];以中文为“文本对比方法”为例,拆分后的结构为[“文”,“本”,“对”,“比”,“方”,“法”]。将翻译结果拆分成单词形式或者单个文字形式,以便于后续对翻译结果进行修改,可直观地确定翻译结果哪部分内容被修改了。
在一实施方式中,客户端在将翻译结果拆分后,会将翻译结果的拆分结果逐个展示到显示界面,并在显示界面的界面标签中存储当前翻译结果以及当前翻译结果对应的索引,具体结构如下所示:
<span data-original="Text"data-index="1">Text</span>
其中,需要说明的是,界面标签为浏览器内置内容的承载容器,用户不可见,在翻译结果被删除时,其对应的界面标签会同时被清除。另外,界面标签的内容是一个迭代的过程,在翻译结果被修改时,存储于界面标签内的翻译结果也会被修改。举例来说,在将翻译结果中的“Text”修改为“Text 1”后,界面标签中存储的翻译结果中的“Text”对应也修改为“Text 1”。
在一实施方式中,客户端在接收到新的翻译结果之后,会将新的翻译结果和已经在显示界面上展示的翻译结果进行比对和替换。具体的替换方式为:将展示的翻译结果中翻译错误且用户未修改的内容;如果显示界面展示的翻译结果中存在用户修改的内容,并且修改的内容与客户端接收到的新的翻译结果中的内容不一致,则保留用户修改的内容。
在一实施方式中,客户端在接收到最终的翻译结果后,会将最终翻译结果和用户的修改语句进行比对,在显示界面上展示用户修改语句和最终的翻译结果之前的差异,并给出替换符号,用户可选择替换全部翻译结果或者某一单词或者语句的翻译结果;用户也可主动取消翻译结果的替换、差异展示等。在一具体实施方式中,客户端的显示界面设置有替换按钮,用户可点击替换按钮对翻译结果进行替换等,并在客户端接收到最终的翻译结果后,显示界面的替换按钮自动消失。
在一实施方式中,在用户选择利用最终的翻译结果替换显示界面上的翻译结果,此时客户端会将替换后的翻译结果和最终的翻译结果发送给服务器,用于优化下一次的翻译结果,提高翻译结果的准确性。
请参阅图4,图4是本申请提供的第一翻译装置一实施例的框架示意图。第一翻译装置40包括第一接收模块41、计算模块42和选择模块43。第一接收模块41用于接收来自客户端设备的对翻译结果进行修改的修改意见,修改意见包括修改语句;计算模块42用于计算修改语句对候选翻译结果的权重的影响系数;候选翻译结果为对待译文本进行翻译得到的翻译结果,待译文本包括修改语句的源语句;选择模块43用于结合影响系数计算各候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为待译文本的翻译结果。
其中,选择模块43用于结合影响系数计算各候选翻译结果的权重,具体包括:获取修改结果,并计算修改结果与各候选翻译结果的重合度;融合影响系数与各重合度,得到各候选翻译结果的权重。
其中,计算模块42用于计算修改语句对候选翻译结果的权重的影响系数,具体包括:影响系数至少包括修改语句的拼写准确系数,拼写准确系数为修改语句与语句数据库中目标样本语句的重叠率,目标样本语句为语句数据库中与修改语句重叠率最高的样本语句,语句数据库中的样本语句为各候选翻译结果中修改语句的源语句的翻译语句。
其中,响应于候选翻译结果包含修改语句,候选翻译结果的权重为重合度与影响系数的和。
其中,响应于候选翻译结果不包含修改语句,且重合度大于预设值,则候选翻译结果的权重为重合度与拼写准确系数的乘积加影响系数。
其中,响应于候选翻译结果不包含修改语句,基于修改语句对待译文本进行翻译,得到反向翻译结果,计算反向翻译结果与候选翻译结果的重合度,候选翻译结果的权重为反向翻译结果与候选翻译结果的重合度与拼写准确系数的乘积。
其中,计算模块42用于计算修改语句对候选翻译结果的权重的影响系数,具体包括:影响系数还包括修改语句的语法准确系数和/或语义准确系数,影响系数为单词准确系数、语法准确系数、语义准确系数的乘积;语法准确系数是利用翻译语法纠错系统对修改语句进行语法校核得到的;语义准确系数是利用语言语法纠错模型对修改语句进行语义评估得到的。
请参阅图5,图5是本申请提供的第二翻译装置一实施例的框架示意图。第二翻译装置50包括第二接收模块51、第三接收模块52和反馈模块53。第二接收模块51用于接收来自服务器的翻译结果;第三接收模块52用于接收对翻译结果进行修改的修改意见,修改意见包括修改语句;反馈模块53用于将修改意见反馈给服务器,以使服务器计算修改语句对候选翻译结果的权重的影响系数,结合影响系数计算各候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为待译文本的翻译结果,候选翻译结果为对待译文本进行翻译得到的翻译结果,待译文本包括修改语句的源语句。
请参阅图6,图6是本申请提供的电子设备一实施例的框架示意图。电子设备60包括相互耦接的存储器61和处理器62,存储器61中存储有程序指令,处理器62用于执行程序指令以实现上述任一翻译方法实施例中的步骤。具体地,电子设备60可以包括但不限于:台式计算机、笔记本电脑、服务器、手机、平板电脑等等,在此不做限定。
具体而言,处理器62用于控制其自身以及存储器61以实现上述任一翻译方法实施例中的步骤。处理器62还可以称为CPU(Central Processing Unit,中央处理单元)。处理器62可能是一种集成电路芯片,具有信号的处理能力。处理器62还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器62可以由集成电路芯片共同实现。
请参阅图7,图7是本申请提供的计算机可读存储介质一实施例的框架示意图。计算机可读存储介质70存储有能够被处理器运行的程序指令71,程序指令71用于实现上述任一翻译方法实施例中的步骤。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (12)
1.一种翻译方法,其特征在于,所述方法包括:
接收来自客户端设备的对翻译结果进行修改的修改意见,所述修改意见包括修改语句;
计算所述修改语句对候选翻译结果的权重的影响系数;所述候选翻译结果为对待译文本进行翻译得到的翻译结果,所述待译文本包括所述修改语句的源语句;
结合所述影响系数计算各所述候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为所述待译文本的翻译结果。
2.根据权利要求1所述的翻译方法,其特征在于,所述结合所述影响系数计算各所述候选翻译结果的权重,包括:
获取修改结果,并计算所述修改结果与各所述候选翻译结果的重合度;
融合所述影响系数与各所述重合度,得到各所述候选翻译结果的权重。
3.根据权利要求2所述的翻译方法,其特征在于,所述计算所述修改语句对候选翻译结果的权重的影响系数,包括:
所述影响系数至少包括所述修改语句的拼写准确系数,所述拼写准确系数为所述修改语句与语句数据库中目标样本语句的重叠率,所述目标样本语句为所述语句数据库中与所述修改语句重叠率最高的样本语句,所述语句数据库中的样本语句为各所述候选翻译结果中所述修改语句的源语句的翻译语句。
4.根据权利要求3所述的翻译方法,其特征在于,
响应于所述候选翻译结果包含所述修改语句,所述候选翻译结果的权重为所述重合度与所述影响系数的和。
5.根据权利要求3所述的翻译方法,其特征在于,
响应于所述候选翻译结果不包含所述修改语句,且所述重合度大于预设值,则所述候选翻译结果的权重为所述重合度与所述拼写准确系数的乘积加所述影响系数。
6.根据权利要求3所述的翻译方法,其特征在于,
响应于所述候选翻译结果不包含所述修改语句,基于所述修改语句对所述待译文本进行翻译,得到反向翻译结果,计算所述反向翻译结果与所述候选翻译结果的重合度,所述候选翻译结果的权重为所述反向翻译结果与所述候选翻译结果的重合度与所述拼写准确系数的乘积。
7.根据权利要求3-6任一项所述的翻译方法,其特征在于,所述计算所述修改语句对候选翻译结果的权重的影响系数,包括:
所述影响系数还包括所述修改语句的语法准确系数和/或语义准确系数,所述影响系数为所述修改语句的拼写准确系数、语法准确系数、语义准确系数的乘积;
所述语法准确系数是利用翻译语法纠错系统对所述修改语句进行语法校核得到的;所述语义准确系数是利用语言语法纠错模型对所述修改语句进行语义评估得到的。
8.一种翻译方法,其特征在于,包括:
客户端设备接收来自服务器的翻译结果;
客户端设备接收对所述翻译结果进行修改的修改意见,所述修改意见包括修改语句;
将所述修改意见反馈给所述服务器,以使所述服务器计算所述修改语句对候选翻译结果的权重的影响系数,结合所述影响系数计算各所述候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为所述待译文本的翻译结果,所述候选翻译结果为对待译文本进行翻译得到的翻译结果,所述待译文本包括所述修改语句的源语句。
9.一种翻译装置,其特征在于,包括:
第一接收模块,用于接收来自客户端设备的对翻译结果进行修改的修改意见,所述修改意见包括修改语句;
计算模块,用于计算所述修改语句对候选翻译结果的权重的影响系数;所述候选翻译结果为对待译文本进行翻译得到的翻译结果,所述待译文本包括所述修改语句的源语句;
选择模块,用于结合所述影响系数计算各所述候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为所述待译文本的翻译结果。
10.一种翻译装置,其特征在于,包括:
第二接收模块,用于接收来自服务器的翻译结果;
第三接收模块,用于接收对所述翻译结果进行修改的修改意见,所述修改意见包括修改语句;
反馈模块,用于将所述修改意见反馈给所述服务器,以使所述服务器计算所述修改语句对候选翻译结果的权重的影响系数,结合所述影响系数计算各所述候选翻译结果的权重,将权重满足预设条件的候选翻译结果作为所述待译文本的翻译结果,所述候选翻译结果为对待译文本进行翻译得到的翻译结果,所述待译文本包括所述修改语句的源语句。
11.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至7任一项或权利要求8所述的翻译方法。
12.一种计算机可读存储介质,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至7任一项或权利要求8所述的翻译方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111646858.1A CN114330311A (zh) | 2021-12-30 | 2021-12-30 | 一种翻译方法、装置、电子设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111646858.1A CN114330311A (zh) | 2021-12-30 | 2021-12-30 | 一种翻译方法、装置、电子设备和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114330311A true CN114330311A (zh) | 2022-04-12 |
Family
ID=81016761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111646858.1A Pending CN114330311A (zh) | 2021-12-30 | 2021-12-30 | 一种翻译方法、装置、电子设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114330311A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115113787A (zh) * | 2022-07-05 | 2022-09-27 | 北京字跳网络技术有限公司 | 一种消息处理方法、装置、设备及介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101593173A (zh) * | 2008-05-28 | 2009-12-02 | 中国科学院自动化研究所 | 一种汉英反向音译方法及装置 |
CN102193914A (zh) * | 2011-05-26 | 2011-09-21 | 中国科学院计算技术研究所 | 计算机辅助翻译的方法及系统 |
CN102467498A (zh) * | 2010-11-18 | 2012-05-23 | 阿里巴巴集团控股有限公司 | 翻译方法及装置 |
CN103324608A (zh) * | 2012-03-21 | 2013-09-25 | 北京百度网讯科技有限公司 | 一种词形还原方法及装置 |
CN109582977A (zh) * | 2018-11-20 | 2019-04-05 | 科大讯飞股份有限公司 | 一种交互式文本翻译方法及装置 |
CN109657251A (zh) * | 2018-12-17 | 2019-04-19 | 北京百度网讯科技有限公司 | 用于翻译语句的方法和装置 |
CN110263348A (zh) * | 2019-03-06 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 翻译方法、装置、计算机设备和存储介质 |
CN111027331A (zh) * | 2019-12-05 | 2020-04-17 | 百度在线网络技术(北京)有限公司 | 用于评估翻译质量的方法和装置 |
CN111339788A (zh) * | 2020-02-18 | 2020-06-26 | 北京字节跳动网络技术有限公司 | 交互式机器翻译方法、装置、设备和介质 |
CN111611811A (zh) * | 2020-05-25 | 2020-09-01 | 腾讯科技(深圳)有限公司 | 翻译方法、装置、电子设备及计算机可读存储介质 |
-
2021
- 2021-12-30 CN CN202111646858.1A patent/CN114330311A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101593173A (zh) * | 2008-05-28 | 2009-12-02 | 中国科学院自动化研究所 | 一种汉英反向音译方法及装置 |
CN102467498A (zh) * | 2010-11-18 | 2012-05-23 | 阿里巴巴集团控股有限公司 | 翻译方法及装置 |
CN102193914A (zh) * | 2011-05-26 | 2011-09-21 | 中国科学院计算技术研究所 | 计算机辅助翻译的方法及系统 |
CN103324608A (zh) * | 2012-03-21 | 2013-09-25 | 北京百度网讯科技有限公司 | 一种词形还原方法及装置 |
CN109582977A (zh) * | 2018-11-20 | 2019-04-05 | 科大讯飞股份有限公司 | 一种交互式文本翻译方法及装置 |
CN109657251A (zh) * | 2018-12-17 | 2019-04-19 | 北京百度网讯科技有限公司 | 用于翻译语句的方法和装置 |
CN110263348A (zh) * | 2019-03-06 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 翻译方法、装置、计算机设备和存储介质 |
CN111027331A (zh) * | 2019-12-05 | 2020-04-17 | 百度在线网络技术(北京)有限公司 | 用于评估翻译质量的方法和装置 |
CN111339788A (zh) * | 2020-02-18 | 2020-06-26 | 北京字节跳动网络技术有限公司 | 交互式机器翻译方法、装置、设备和介质 |
CN111611811A (zh) * | 2020-05-25 | 2020-09-01 | 腾讯科技(深圳)有限公司 | 翻译方法、装置、电子设备及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
史黎鑫: ""基于统计的模糊翻译记忆关键技术研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 December 2018 (2018-12-15), pages 138 - 1888 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115113787A (zh) * | 2022-07-05 | 2022-09-27 | 北京字跳网络技术有限公司 | 一种消息处理方法、装置、设备及介质 |
CN115113787B (zh) * | 2022-07-05 | 2024-04-19 | 北京字跳网络技术有限公司 | 一种消息处理方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11900056B2 (en) | Stylistic text rewriting for a target author | |
CN111860753B (zh) | 用于训练模型的基于有向无环图的框架 | |
CN106202059B (zh) | 机器翻译方法以及机器翻译装置 | |
US11586827B2 (en) | Generating desired discourse structure from an arbitrary text | |
JP7301922B2 (ja) | 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
US20210312139A1 (en) | Method and apparatus of generating semantic feature, method and apparatus of training model, electronic device, and storage medium | |
US20230091886A1 (en) | Using semantic frames for intent classification | |
CN116724305B (zh) | 上下文标签与命名实体识别模型的集成 | |
CN105074694B (zh) | 自然语言处理的系统和方法 | |
CN114429133A (zh) | 通过神经机器阅读理解依赖于话语分析来回答复杂问题 | |
JP2017097882A (ja) | 機械翻訳評価方法および装置、並びに機械翻訳方法および装置 | |
CN111241237A (zh) | 一种基于运维业务的智能问答数据处理方法及装置 | |
WO2021208460A1 (zh) | 语句补全方法、设备及可读存储介质 | |
US20230186026A1 (en) | Data manufacturing frameworks for synthesizing synthetic training data to facilitate training a natural language to logical form model | |
US10496751B2 (en) | Avoiding sentiment model overfitting in a machine language model | |
US11170765B2 (en) | Contextual multi-channel speech to text | |
US11222628B2 (en) | Machine learning based product solution recommendation | |
US20240061833A1 (en) | Techniques for augmenting training data for aggregation and sorting database operations in a natural language to database query system | |
CN116635862A (zh) | 用于自然语言处理的域外数据扩充 | |
JP2021082306A (ja) | 目標内容の確定方法、装置、機器及びコンピュータ可読記憶媒体 | |
CN113051894A (zh) | 一种文本纠错的方法和装置 | |
CN114330311A (zh) | 一种翻译方法、装置、电子设备和计算机可读存储介质 | |
KR20200057277A (ko) | 자동 번역 오류를 자동으로 진단 및 교정하는 장치 및 방법 | |
US20230342561A1 (en) | Machine translation method and apparatus, device and storage medium | |
CN112470216B (zh) | 语音应用平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |