CN114065785B - 实时在线通讯翻译方法及系统 - Google Patents

实时在线通讯翻译方法及系统 Download PDF

Info

Publication number
CN114065785B
CN114065785B CN202111373407.5A CN202111373407A CN114065785B CN 114065785 B CN114065785 B CN 114065785B CN 202111373407 A CN202111373407 A CN 202111373407A CN 114065785 B CN114065785 B CN 114065785B
Authority
CN
China
Prior art keywords
translation
target
content
translated
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111373407.5A
Other languages
English (en)
Other versions
CN114065785A (zh
Inventor
宋海冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Queen Bee Network Technology Shenzhen Co ltd
Original Assignee
Queen Bee Network Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Queen Bee Network Technology Shenzhen Co ltd filed Critical Queen Bee Network Technology Shenzhen Co ltd
Priority to CN202111373407.5A priority Critical patent/CN114065785B/zh
Publication of CN114065785A publication Critical patent/CN114065785A/zh
Application granted granted Critical
Publication of CN114065785B publication Critical patent/CN114065785B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例公开了一种实时在线通讯翻译方法及系统,该方法包括:获取待翻译内容,所述待翻译内容为目标文件中的一个片段;确定所述待翻译内容的目标属性信息;确定与所述目标属性信息对应的目标翻译处理参数;根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容。采用本申请实施例可以提升翻译效果。

Description

实时在线通讯翻译方法及系统
技术领域
本申请涉及语言翻译技术领域,具体涉及一种实时在线通讯翻译方法及系统。
背景技术
随着电子技术以及互联网技术迅速发展,也促进文化交融进行火热发展。实际应用中,对翻译的需求也越来越大,例如,一些老的国外电影,可能没相应的中文,导致用户看电影的时候体会不到电影的精髓,又例如,有些小视频,由于其采用地方方言进行播放,导致用户无法把握其中的笑点,从而,导致用户体验降低,因此,如何提升翻译效果的问题亟待解决。
发明内容
本申请实施例提供了一种实时在线通讯翻译方法及系统,可以提升翻译效果。
第一方面,本申请实施例提供一种实时在线通讯翻译方法,所述方法包括:
获取待翻译内容,所述待翻译内容为目标文件中的一个片段;
确定所述待翻译内容的目标属性信息;
确定与所述目标属性信息对应的目标翻译处理参数;
根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容。
第二方面,本申请实施例提供了一种实时在线通讯翻译系统,所述系统包括:获取单元、第一确定单元、第二确定单元和翻译单元,其中,
所述获取单元,用于获取待翻译内容,所述待翻译内容为目标文件中的一个片段;
所述第一确定单元,用于确定所述待翻译内容的目标属性信息;
所述第二确定单元,用于确定与所述目标属性信息对应的目标翻译处理参数;
所述翻译单元,用于根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,具备如下有益效果:
可以看出,本申请实施例中所描述的实时在线通讯翻译方法及系统,获取待翻译内容,待翻译内容为目标文件中的一个片段,确定待翻译内容的目标属性信息,确定与目标属性信息对应的目标翻译处理参数,根据目标翻译处理参数对待翻译内容进行翻译,得到目标译文内容,如此,可以基于需要翻译内容的相关属性,确定相应的翻译处理参数,使得翻译更加符合用户需求,有助于提升翻译效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实时在线通讯翻译方法的流程示意图;
图2是本申请实施例提供的另一种实时在线通讯翻译方法的流程示意图;
图3是本申请实施例提供的一种电子设备的结构示意图;
图4是本申请实施例提供的一种实时在线通讯翻译系统的功能单元组成框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例中,电子设备可以包括通信功能的设备,例如,手机、平板电脑、台式机、服务器等等,在此不做限定。
下面对本申请实施例进行详细介绍。
请参阅图1,图1是本申请实施例提供的一种实时在线通讯翻译方法的流程示意图,如图所示,应用于电子设备,本实时在线通讯翻译方法包括:
101、获取待翻译内容,所述待翻译内容为目标文件中的一个片段。
其中,目标文件可以包括以下至少一种:音频文件、视频文件、图片、文本文件等等,在此不做限定。待翻译内容可以包括至少一种语言,该语言可以为不同国家或者地区的语言,或者,也可以是手势语言或者动作语言。待翻译内容则可以为目标文件中的任意一个片段。目标文件还可以为实时录制的音频文件或者视频文件。本申请实施例可以应用于音乐播放场景,或者,会议场景,或者,电影播放场景,或者,游戏场景,或者,视频教学场景等等,在此不做限定,具体实现中,可以实时获取待翻译内容。
102、确定所述待翻译内容的目标属性信息。
其中,本申请实施例中,目标属性信息可以包括以下至少一种:语言类型、文化背景、时代背景、地域特色、文件格式、具体场景、内容复杂度、角色性别、角色地位、角色身份等等,在此不做限定。例如,在待翻译内容为老电影时,目标属性信息可以包括以下至少一种:历史背景、地域特色、剧情场景等等,在此不做限定。又例如,在待翻译内容为小视频时,则目标属性信息可以包括以下至少一种:时代背景、地域特色等等,在此不做限定。具体实现中,可以基于待翻译内容进行搜索,得到相关信息,对该相关信息进行关键字提取,基于关键字,可以得到目标属性信息,或者,也可以对目标文件的一些相关信息加以搜索,再提炼得到相应的目标属性信息。
可选的,上述步骤102,确定所述待翻译内容的目标属性信息,可以包括如下步骤:
21、获取所述目标文件的第一属性信息;
22、根据所述待翻译内容进行搜索,得到参考信息;
23、根据所述参考信息确定所述待翻译内容的第二属性信息;
24、根据所述第一属性信息和所述第二属性信息确定所述目标属性信息。
其中,第一属性信息可以包括以下至少一种: 语言类型、文化背景、时代背景、地域特色、文件格式、内容复杂度、声源性别、内容简介等等,在此不做限定。第二属性信息可以包括以下至少一种:语言类型、文化背景、时代背景、地域特色、文件格式、内容复杂度、声源性别、内容简介等等,在此不做限定。
具体实现中,可以在互联网进行搜索,获取目标文件的相关信息,对相关信息进行关键字提取以及筛选,可以得到目标文件的第一属性信息,进而,可以根据待翻译内容进行搜索,得到参考信息,参考信息可以理解为待翻译内容对应的相关搜索信息,对参考信息进行关键字提取以及筛选,则可以确定待翻译内容的第二属性信息,再可以将第一属性信息和第二属性信息的交集或者并集确定目标属性信息,如此,可以得到需要翻译内容的相关时代背景、风土人情,有助于后续提供接地气的翻译处理效果。
103、确定与所述目标属性信息对应的目标翻译处理参数。
其中,本申请实施例中,翻译处理参数可以包括以下至少一种:翻译算法、翻译算法的控制参数等等,在此不做限定。翻译算法可以包括以下至少一种:卷积神经网络模型、循环神经网络模型、全连接神经网络模型、隐马尔科夫模型-神经网络模型(Hidden MarkovModel-Neural Network,HMM-NN)或隐马尔科夫模型-高斯混合模型(Hidden MarkovModel-Gaussian Mixed Model,HMM-GMM)等等,在此不做限定。翻译算法的控制参数可以用于调节翻译的精准性或者翻译结果展示方式,例如,翻译结果展示方式可以理解为是语音展示,还是文本展示,或者,还是以不同的方言展示。
具体实现中,可以预先存储预设的属性信息与翻译处理参数之间的映射关系。进而,可以依据该映射关系确定目标属性信息对应的目标翻译处理参数。
可选的,上述步骤103,确定与所述目标属性信息对应的目标翻译处理参数,可以包括如下步骤:
A31、获取用户需求参数;
A32、确定与所述用户需求参数对应的第一翻译处理参数;
A33、按照预设的属性信息与翻译处理参数之间的映射关系确定所述目标属性信息对应的第二翻译处理参数;
A34、根据所述第一翻译处理参数和所述第二翻译处理参数确定所述目标翻译处理参数。
具体实现中,用户需求参数可以包括以下至少一种:需要被译成的语言、文化层次、擅长领域等等,在此不做限定。翻译的目的在于用户能够轻松理解被翻译的内容,因此,可以获取用户需求参数,确定与用户需求参数对应的第一翻译处理参数,该第一翻译处理参数可以包括用户常用的翻译处理参数。还可以预先存储预设的属性信息与翻译处理参数之间的映射关系,进而,按照预设的属性信息与翻译处理参数之间的映射关系确定目标属性信息对应的第二翻译处理参数,再根据第一翻译处理参数和第二翻译处理参数确定目标翻译处理参数,例如,可以第一翻译处理参数和第二翻译处理参数的交集作为目标翻译处理参数,或者,可以对两者进行加权处理,得到目标翻译处理参数,如此,可以实际翻译效果与用户需求以及翻译内容本身的属性深度相关,即便于用于理解,又可以更加深入反映被翻译内容的精髓。
可选的,上述步骤103,确定与所述目标属性信息对应的目标翻译处理参数,可以包括如下步骤:
B31、搜索与所述目标属性信息对应的翻译记录,得到N条翻译记录,每一翻译记录对应一个翻译评分,N为大于1的整数;
B32、根据翻译评分对所述N条翻译记录进行筛选,得到M条翻译记录,所述M为小于或等于N的整数;
B33、获取所述M条翻译记录的用户年龄,得到M个用户年龄;
B34、根据所述M个翻译记录中的每一翻译记录的用户年龄和翻译评分构造三维直方图,所述三维直方图包括P个柱状体,所述三维直方图的横轴为年龄,纵轴为用户数量,竖轴为平均翻译评分,所述P为大于1的整数;
B35、获取用户的参考年龄,并根据所述参考年龄从所述P个柱状体中选取处于预设年龄段对应的Q个柱状体,所述预设年龄段包括所述参考年龄,所述Q为小于或等于所述P的正整数;
B36、根据所述Q个柱状体中每一柱状体对应的比重,得到Q个比重;
B37、获取所述Q个柱状体对应的 翻译记录对应的翻译处理参数,得到参考翻译处理参数,根据该参考翻译处理参数以及所述Q个比重确定所述目标翻译处理参数。
具体实现中,在针对翻译应用,也可以采用大数据,结合其他用户的翻译记录,来调节自身的翻译参数的目的。
本申请实施例中,有可能待翻译内容未被翻译过,或者,已经被翻译过,则均可以搜索与目标属性信息对应的翻译记录,得到N条翻译记录,每一翻译记录对应一个翻译评分,N为大于1的整数,即每次用户使用了翻译功能之后,则可以对其进行翻译评分。
进而,可以根据翻译评分对N条翻译记录进行筛选,得到M条翻译记录,例如,筛选出翻译评分大于预设评分的翻译记录,预设评分可以预先设置或者系统默认,M为小于或等于N的整数,如此,可以筛选出高评分的翻译评价。再获取M条翻译记录的用户信息,基于用户信息获取用户年龄,得到M个用户年龄,翻译结果也会与用户的年龄层次相关,因此,还可以根据M个翻译记录中的每一翻译记录的用户年龄和翻译评分构造三维直方图,该三维直方图包括P个柱状体,每一柱状体可以对应一个年龄段,三维直方图的横轴为年龄,纵轴为用户数量,竖轴为平均翻译评分,P为大于1的整数,还可以获取用户的参考年龄,并根据参考年龄从P个柱状体中选取处于预设年龄段对应的Q个柱状体,预设年龄段包括参考年龄,Q为小于或等于P的正整数,即用户最关心的往往是本身年龄段或者与其相近的年龄段的人的评价。
进一步的,可以根据Q个柱状体中每一柱状体对应的比重,得到Q个比重,即可以将Q个柱状体中每一柱状体的体积与Q个柱状体的总体积进行运算,得到Q个比重,再获取Q个柱状体对应的翻译记录对应的翻译处理参数,得到参考翻译处理参数,根据该参考翻译处理参数以及Q个比重确定目标翻译处理参数,即可以将相应的翻译处理参数进行加权运算,或者,可以选择使用人数最多的一类翻译算法,再对相应的翻译算法对应的翻译控制参数进行加权运算。如此,可以基于用户自身的情况,通过大数据选择与其年龄相仿的用户的翻译处理参数决策出最终的翻译处理参数,有助于得到与用户时代更加相宜的翻译效果。
104、根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容。
其中,具体实现中,基于目标翻译参数可以实现将待翻译内容进行翻译,得到目标译文内容,该目标译文内容可以为文本内容,或者语音内容,还可以展示目标译文内容。当然,倘若目标译文内容中出现预设内容的相关关键字,还可以根据该关键字进行搜索,并展示搜索结果,例如,当译文内容中出现“高斯公式”,则可以搜索高斯公式,并展示高斯公式。预设内容可以预先设置或者系统默认。
可选的,在所述待翻译内容为语音内容时,上述步骤104,根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容,可以包括如下步骤:
41、根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到参考文本;
42、确定所述待翻译内容的目标语音特征;
43、根据所述目标语音特征确定所述待翻译内容的第一参考标点符号集,所述第一参考标点符号集包括至少一个参考标点符号位置以及符号标记;
44、对所述参考文本进行断句处理,得到第二参考标点符号集,所述第二参考标点符号集包括至少一个参考标点符号位置以及符号标记;
45、根据所述第一参考标点符号集和所述第二参考标点符号集确定目标标点符号集;
46、根据所述目标标点符号集对所述参考文本进行标记,得到所述目标译文内容。
其中,本申请实施例中,语音特征可以为音频特征,和/或,声学特征,音频特征可以包括以下至少一种:语音的转移差分倒谱(Shifted delta cepstral,SDC)特征、感知线性预测(Perceptual Linear Predictive,PLP)特征、瓶颈(Bottleneck,BN)特征等等,在此不做限定,声学特征可以包括语音的梅尔频率倒谱系数(Mel Frequency CepstrumCoefficient,MFCC),在此不做限定。
具体实现中,可以根据目标翻译处理参数对所述待翻译内容进行翻译,得到参考文本,即先可以识别需要翻译内容的文本内容,再确定待翻译内容的目标语音特征,根据目标语音特征确定待翻译内容的第一参考标点符号集,即可以实现通过语言感情色彩、用户习惯性停顿等特性对待翻译内容进行标点符号确定,第一参考标点符号集可以包括至少一个参考标点符号位置以及符号标记,还可以对参考文本进行断句处理,得到第二参考标点符号集,第二参考标点符号集可以包括至少一个参考标点符号位置以及符号标记,根据第一参考标点符号集和第二参考标点符号集确定目标标点符号集,例如,将两者的共性内容加以标记,当然,针对其他地方,则可以作为一种可能的情况先进行标记,然后再对每一种情况加以评价,再选择最优的一组作为需要的,最后,可以根据目标标点符号集对参考文本进行标记,得到目标译文内容,从而,使得译文内容可以深度反映发音者的情绪或者情感。
可以看出,本申请实施例中所描述的实时在线通讯翻译方法,获取待翻译内容,待翻译内容为目标文件中的一个片段,确定待翻译内容的目标属性信息,确定与目标属性信息对应的目标翻译处理参数,根据目标翻译处理参数对待翻译内容进行翻译,得到目标译文内容,如此,可以基于需要翻译内容的相关属性,确定相应的翻译处理参数,使得翻译更加符合用户需求,有助于提升翻译效果。
与上述图1所示的实施例一致的,请参阅图2,图2是本申请实施例提供的一种实时在线通讯翻译方法的流程示意图,应用于电子设备,如图所示,本实时在线通讯翻译方法包括:
201、获取待翻译内容,所述待翻译内容为目标文件中的一个片段。
202、确定所述待翻译内容的目标属性信息。
203、获取用户需求参数。
204、确定与所述用户需求参数对应的第一翻译处理参数。
205、按照预设的属性信息与翻译处理参数之间的映射关系确定所述目标属性信息对应的第二翻译处理参数。
206、根据所述第一翻译处理参数和所述第二翻译处理参数确定目标翻译处理参数;
207、根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容。
其中,上述步骤201-步骤207的具体描述可以参照上述图1所描述的实时在线通讯翻译方法的相应步骤,在此不再赘述。
如此,可以基于用户自身的情况,通过大数据选择与其年龄相仿的用户的翻译处理参数决策出最终的翻译处理参数,有助于得到与用户时代更加相宜的翻译效果,使得翻译更加符合用户需求,有助于提升翻译效果。
与上述实施例一致地,请参阅图3,图3是本申请实施例提供的一种电子设备的结构示意图,如图所示,该电子设备包括处理器、存储器、通信接口以及一个或多个程序,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,本申请实施例中,上述程序包括用于执行以下步骤的指令:
获取待翻译内容,所述待翻译内容为目标文件中的一个片段;
确定所述待翻译内容的目标属性信息;
确定与所述目标属性信息对应的目标翻译处理参数;
根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容。
可选的,在所述确定所述待翻译内容的目标属性信息方面,上述程序包括用于执行以下步骤的指令:
获取所述目标文件的第一属性信息;
根据所述待翻译内容进行搜索,得到参考信息;
根据所述参考信息确定所述待翻译内容的第二属性信息;
根据所述第一属性信息和所述第二属性信息确定所述目标属性信息。
可选的,在所述确定与所述目标属性信息对应的目标翻译处理参数方面,上述程序包括用于执行以下步骤的指令:
获取用户需求参数;
确定与所述用户需求参数对应的第一翻译处理参数;
按照预设的属性信息与翻译处理参数之间的映射关系确定所述目标属性信息对应的第二翻译处理参数;
根据所述第一翻译处理参数和所述第二翻译处理参数确定所述目标翻译处理参数。
可选的,在所述确定与所述目标属性信息对应的目标翻译处理参数方面,上述程序包括用于执行以下步骤的指令:
搜索与所述目标属性信息对应的翻译记录,得到N条翻译记录,每一翻译记录对应一个翻译评分,N为大于1的整数;
根据翻译评分对所述N条翻译记录进行筛选,得到M条翻译记录,所述M为小于或等于N的整数;
获取所述M条翻译记录的用户年龄,得到M个用户年龄;
根据所述M个翻译记录中的每一翻译记录的用户年龄和翻译评分构造三维直方图,所述三维直方图包括P个柱状体,所述三维直方图的横轴为年龄,纵轴为用户数量,竖轴为平均翻译评分,所述P为大于1的整数;
获取用户的参考年龄,并根据所述参考年龄从所述P个柱状体中选取处于预设年龄段对应的Q个柱状体,所述预设年龄段包括所述参考年龄,所述Q为小于或等于所述P的正整数;
根据所述Q个柱状体中每一柱状体对应的比重,得到Q个比重;
获取所述Q个柱状体对应的翻译记录对应的翻译处理参数,得到参考翻译处理参数,根据该参考翻译处理参数以及所述Q个比重确定所述目标翻译处理参数。
可选的,在所述待翻译内容为语音内容时,在所述根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容方面,上述程序包括用于执行以下步骤的指令:
根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到参考文本;
确定所述待翻译内容的目标语音特征;
根据所述目标语音特征确定所述待翻译内容的第一参考标点符号集,所述第一参考标点符号集包括至少一个参考标点符号位置以及符号标记;
对所述参考文本进行断句处理,得到第二参考标点符号集,所述第二参考标点符号集包括至少一个参考标点符号位置以及符号标记;
根据所述第一参考标点符号集和所述第二参考标点符号集确定目标标点符号集;
根据所述目标标点符号集对所述参考文本进行标记,得到所述目标译文内容。
图4是本申请实施例中所涉及的实时在线通讯翻译系统400的功能单元组成框图。该实时在线通讯翻译系统400,所述系统400可以包括:获取单元401、第一确定单元402、第二确定单元403和翻译单元404,其中,
所述获取单元401,用于获取待翻译内容,所述待翻译内容为目标文件中的一个片段;
所述第一确定单元402,用于确定所述待翻译内容的目标属性信息;
所述第二确定单元403,用于确定与所述目标属性信息对应的目标翻译处理参数;
所述翻译单元404,用于根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容。
可选的,在所述确定所述待翻译内容的目标属性信息方面,所述第一确定单元402具体用于:
获取所述目标文件的第一属性信息;
根据所述待翻译内容进行搜索,得到参考信息;
根据所述参考信息确定所述待翻译内容的第二属性信息;
根据所述第一属性信息和所述第二属性信息确定所述目标属性信息。
可选的,在所述确定与所述目标属性信息对应的目标翻译处理参数方面,所述第二确定单元403具体用于:
获取用户需求参数;
确定与所述用户需求参数对应的第一翻译处理参数;
按照预设的属性信息与翻译处理参数之间的映射关系确定所述目标属性信息对应的第二翻译处理参数;
根据所述第一翻译处理参数和所述第二翻译处理参数确定所述目标翻译处理参数。
可选的,在所述确定与所述目标属性信息对应的目标翻译处理参数方面,所述第二确定单元403具体用于:
搜索与所述目标属性信息对应的翻译记录,得到N条翻译记录,每一翻译记录对应一个翻译评分,N为大于1的整数;
根据翻译评分对所述N条翻译记录进行筛选,得到M条翻译记录,所述M为小于或等于N的整数;
获取所述M条翻译记录的用户年龄,得到M个用户年龄;
根据所述M个翻译记录中的每一翻译记录的用户年龄和翻译评分构造三维直方图,所述三维直方图包括P个柱状体,所述三维直方图的横轴为年龄,纵轴为用户数量,竖轴为平均翻译评分,所述P为大于1的整数;
获取用户的参考年龄,并根据所述参考年龄从所述P个柱状体中选取处于预设年龄段对应的Q个柱状体,所述预设年龄段包括所述参考年龄,所述Q为小于或等于所述P的正整数;
根据所述Q个柱状体中每一柱状体对应的比重,得到Q个比重;
获取所述Q个柱状体对应的翻译记录对应的翻译处理参数,得到参考翻译处理参数,根据该参考翻译处理参数以及所述Q个比重确定所述目标翻译处理参数。
可选的,在所述待翻译内容为语音内容时,在所述根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容方面,所述翻译单元404具体用于:
根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到参考文本;
确定所述待翻译内容的目标语音特征;
根据所述目标语音特征确定所述待翻译内容的第一参考标点符号集,所述第一参考标点符号集包括至少一个参考标点符号位置以及符号标记;
对所述参考文本进行断句处理,得到第二参考标点符号集,所述第二参考标点符号集包括至少一个参考标点符号位置以及符号标记;
根据所述第一参考标点符号集和所述第二参考标点符号集确定目标标点符号集;
根据所述目标标点符号集对所述参考文本进行标记,得到所述目标译文内容。
可以看出,本申请实施例中所描述的实时在线通讯翻译系统,获取待翻译内容,待翻译内容为目标文件中的一个片段,确定待翻译内容的目标属性信息,确定与目标属性信息对应的目标翻译处理参数,根据目标翻译处理参数对待翻译内容进行翻译,得到目标译文内容,如此,可以基于需要翻译内容的相关属性,确定相应的翻译处理参数,使得翻译更加符合用户需求,有助于提升翻译效果。
可以理解的是,本实施例的实时在线通讯翻译系统的各程序模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory ,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (8)

1.一种实时在线通讯翻译方法,其特征在于,所述方法包括:
获取待翻译内容,所述待翻译内容为目标文件中的一个片段;
确定所述待翻译内容的目标属性信息;
确定与所述目标属性信息对应的目标翻译处理参数;
根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容;
所述确定与所述目标属性信息对应的目标翻译处理参数,包括:
搜索与所述目标属性信息对应的翻译记录,得到N条翻译记录,每一翻译记录对应一个翻译评分,N为大于1的整数;
根据翻译评分对所述N条翻译记录进行筛选,得到M条翻译记录,所述M为小于或等于N的整数;
获取所述M条翻译记录的用户年龄,得到M个用户年龄;
根据所述M个翻译记录中的每一翻译记录的用户年龄和翻译评分构造三维直方图,所述三维直方图包括P个柱状体,所述三维直方图的横轴为年龄,纵轴为用户数量,竖轴为平均翻译评分,所述P为大于1的整数;
获取用户的参考年龄,并根据所述参考年龄从所述P个柱状体中选取处于预设年龄段对应的Q个柱状体,所述预设年龄段包括所述参考年龄,所述Q为小于或等于所述P的正整数;
根据所述Q个柱状体中每一柱状体对应的比重,得到Q个比重;
获取所述Q个柱状体对应的翻译记录对应的翻译处理参数,得到参考翻译处理参数,根据该参考翻译处理参数以及所述Q个比重确定所述目标翻译处理参数。
2.根据权利要求1所述的方法,其特征在于,所述确定所述待翻译内容的目标属性信息,包括:
获取所述目标文件的第一属性信息;
根据所述待翻译内容进行搜索,得到参考信息;
根据所述参考信息确定所述待翻译内容的第二属性信息;
根据所述第一属性信息和所述第二属性信息确定所述目标属性信息。
3.根据权利要求1或2所述的方法,其特征在于,所述确定与所述目标属性信息对应的目标翻译处理参数,包括:
获取用户需求参数;
确定与所述用户需求参数对应的第一翻译处理参数;
按照预设的属性信息与翻译处理参数之间的映射关系确定所述目标属性信息对应的第二翻译处理参数;
根据所述第一翻译处理参数和所述第二翻译处理参数确定所述目标翻译处理参数。
4.根据权利要求1或2所述的方法,其特征在于,在所述待翻译内容为语音内容时,所述根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容,包括:
根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到参考文本;
确定所述待翻译内容的目标语音特征;
根据所述目标语音特征确定所述待翻译内容的第一参考标点符号集,所述第一参考标点符号集包括至少一个参考标点符号位置以及符号标记;
对所述参考文本进行断句处理,得到第二参考标点符号集,所述第二参考标点符号集包括至少一个参考标点符号位置以及符号标记;
根据所述第一参考标点符号集和所述第二参考标点符号集确定目标标点符号集;
根据所述目标标点符号集对所述参考文本进行标记,得到所述目标译文内容。
5.一种实时在线通讯翻译系统,其特征在于,所述系统包括:获取单元、第一确定单元、第二确定单元和翻译单元,其中,
所述获取单元,用于获取待翻译内容,所述待翻译内容为目标文件中的一个片段;
所述第一确定单元,用于确定所述待翻译内容的目标属性信息;
所述第二确定单元,用于确定与所述目标属性信息对应的目标翻译处理参数;
所述翻译单元,用于根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容;
在所述确定与所述目标属性信息对应的目标翻译处理参数方面,所述第二确定单元具体用于:
搜索与所述目标属性信息对应的翻译记录,得到N条翻译记录,每一翻译记录对应一个翻译评分,N为大于1的整数;
根据翻译评分对所述N条翻译记录进行筛选,得到M条翻译记录,所述M为小于或等于N的整数;
获取所述M条翻译记录的用户年龄,得到M个用户年龄;
根据所述M个翻译记录中的每一翻译记录的用户年龄和翻译评分构造三维直方图,所述三维直方图包括P个柱状体,所述三维直方图的横轴为年龄,纵轴为用户数量,竖轴为平均翻译评分,所述P为大于1的整数;
获取用户的参考年龄,并根据所述参考年龄从所述P个柱状体中选取处于预设年龄段对应的Q个柱状体,所述预设年龄段包括所述参考年龄,所述Q为小于或等于所述P的正整数;
根据所述Q个柱状体中每一柱状体对应的比重,得到Q个比重;
获取所述Q个柱状体对应的翻译记录对应的翻译处理参数,得到参考翻译处理参数,根据该参考翻译处理参数以及所述Q个比重确定所述目标翻译处理参数。
6.根据权利要求5所述的系统,其特征在于,在所述确定所述待翻译内容的目标属性信息方面,所述第一确定单元具体用于:
获取所述目标文件的第一属性信息;
根据所述待翻译内容进行搜索,得到参考信息;
根据所述参考信息确定所述待翻译内容的第二属性信息;
根据所述第一属性信息和所述第二属性信息确定所述目标属性信息。
7.根据权利要求5或6所述的系统,其特征在于,在所述确定与所述目标属性信息对应的目标翻译处理参数方面,所述第二确定单元具体用于:
获取用户需求参数;
确定与所述用户需求参数对应的第一翻译处理参数;
按照预设的属性信息与翻译处理参数之间的映射关系确定所述目标属性信息对应的第二翻译处理参数;
根据所述第一翻译处理参数和所述第二翻译处理参数确定所述目标翻译处理参数。
8.根据权利要求5或6所述的系统,其特征在于,在所述待翻译内容为语音内容时,在所述根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到目标译文内容方面,所述翻译单元具体用于:
根据所述目标翻译处理参数对所述待翻译内容进行翻译,得到参考文本;
确定所述待翻译内容的目标语音特征;
根据所述目标语音特征确定所述待翻译内容的第一参考标点符号集,所述第一参考标点符号集包括至少一个参考标点符号位置以及符号标记;
对所述参考文本进行断句处理,得到第二参考标点符号集,所述第二参考标点符号集包括至少一个参考标点符号位置以及符号标记;
根据所述第一参考标点符号集和所述第二参考标点符号集确定目标标点符号集;
根据所述目标标点符号集对所述参考文本进行标记,得到所述目标译文内容。
CN202111373407.5A 2021-11-19 2021-11-19 实时在线通讯翻译方法及系统 Active CN114065785B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111373407.5A CN114065785B (zh) 2021-11-19 2021-11-19 实时在线通讯翻译方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111373407.5A CN114065785B (zh) 2021-11-19 2021-11-19 实时在线通讯翻译方法及系统

Publications (2)

Publication Number Publication Date
CN114065785A CN114065785A (zh) 2022-02-18
CN114065785B true CN114065785B (zh) 2023-04-11

Family

ID=80278251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111373407.5A Active CN114065785B (zh) 2021-11-19 2021-11-19 实时在线通讯翻译方法及系统

Country Status (1)

Country Link
CN (1) CN114065785B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649282A (zh) * 2015-10-30 2017-05-10 阿里巴巴集团控股有限公司 基于统计的机器翻译方法、装置及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699528B (zh) * 2013-12-30 2017-01-11 北京百度网讯科技有限公司 翻译译文的提供方法、装置和系统
KR102449875B1 (ko) * 2017-10-18 2022-09-30 삼성전자주식회사 음성 신호 번역 방법 및 그에 따른 전자 장치
CN109710949B (zh) * 2018-12-04 2023-06-23 深圳市酷达通讯有限公司 一种翻译方法及翻译机
CN110083846B (zh) * 2019-04-28 2023-11-24 北京小米移动软件有限公司 翻译语音输出方法、装置、存储介质和电子设备
CN110264997A (zh) * 2019-05-30 2019-09-20 北京百度网讯科技有限公司 语音断句的方法、装置和存储介质
WO2021184249A1 (en) * 2020-03-18 2021-09-23 Citrix Systems, Inc. Machine translation of digital content

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649282A (zh) * 2015-10-30 2017-05-10 阿里巴巴集团控股有限公司 基于统计的机器翻译方法、装置及电子设备

Also Published As

Publication number Publication date
CN114065785A (zh) 2022-02-18

Similar Documents

Publication Publication Date Title
KR102080315B1 (ko) 동영상 서비스 제공 방법 및 이를 이용하는 서비스 서버
CN105895087B (zh) 一种语音识别方法及装置
CN112533051B (zh) 弹幕信息显示方法、装置、计算机设备和存储介质
JP6967059B2 (ja) 映像を生成するための方法、装置、サーバ、コンピュータ可読記憶媒体およびコンピュータプログラム
US20150243279A1 (en) Systems and methods for recommending responses
CN110557659B (zh) 视频推荐方法、装置、服务器及存储介质
CN110234018B (zh) 多媒体内容描述生成方法、训练方法、装置、设备及介质
CN112040263A (zh) 视频处理方法、视频播放方法、装置、存储介质和设备
CN111372141B (zh) 表情图像生成方法、装置及电子设备
CN111708915B (zh) 内容推荐方法、装置、计算机设备和存储介质
WO2014137942A1 (en) Surfacing information about items mentioned or presented in a film in association with viewing the film
CN112528637B (zh) 文本处理模型训练方法、装置、计算机设备和存储介质
CN110166802B (zh) 弹幕处理方法、装置及存储介质
US10915756B2 (en) Method and apparatus for determining (raw) video materials for news
CN113380271B (zh) 情绪识别方法、系统、设备及介质
KR102104294B1 (ko) 디스플레이 장치로 읽을 수 있는 저장매체에 저장된 수화 영상 챗봇 애플리케이션
KR102345625B1 (ko) 자막 생성 방법 및 이를 수행하는 장치
CN117251552B (zh) 基于大型语言模型的对话处理方法、装置及电子设备
CN110895656B (zh) 一种文本相似度计算方法、装置、电子设备及存储介质
CN114065785B (zh) 实时在线通讯翻译方法及系统
CN110781329A (zh) 图像搜索方法、装置、终端设备及存储介质
CN114254634A (zh) 一种多媒体数据的挖掘方法、装置、存储介质及设备
CN116561294A (zh) 手语视频的生成方法、装置、计算机设备及存储介质
CN117009574B (zh) 热点视频模板的生成方法、系统、设备及存储介质
KR102648990B1 (ko) 또래 학습 추천 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant