CN111178086B - 数据处理方法、装置和介质 - Google Patents

数据处理方法、装置和介质 Download PDF

Info

Publication number
CN111178086B
CN111178086B CN201911319945.9A CN201911319945A CN111178086B CN 111178086 B CN111178086 B CN 111178086B CN 201911319945 A CN201911319945 A CN 201911319945A CN 111178086 B CN111178086 B CN 111178086B
Authority
CN
China
Prior art keywords
page
translation
content
voice data
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911319945.9A
Other languages
English (en)
Other versions
CN111178086A (zh
Inventor
陈小敏
张晶晶
陈伟
王小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201911319945.9A priority Critical patent/CN111178086B/zh
Publication of CN111178086A publication Critical patent/CN111178086A/zh
Application granted granted Critical
Publication of CN111178086B publication Critical patent/CN111178086B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例提供了一种数据处理方法和装置、一种用于数据处理的装置,其中的方法具体包括:获取源演示页;对所述源演示页中的原文内容进行翻译,得到的翻译演示页中包括:所述原文内容对应的译文内容;向客户端发送所述翻译演示页的页面内容。本发明实施例能够克服用户在演示场景中看不清PPT内容的问题,以及能够克服用户因为语言不通而看不懂PPT内容的问题。

Description

数据处理方法、装置和介质
技术领域
本发明涉及通信技术领域,特别是涉及一种数据处理方法和装置、一种机器可读介质。
背景技术
同声传译(Simultaneous Interpretation),简称“同传”,是指在不打断演讲者演讲的情况下,不间断地将演讲内容翻译给观众的翻译方式。同声传译不仅应用于国际会议中,也在外交外事、会晤谈判、商务活动、新闻传媒、培训授课、电视广播、国际仲裁等诸多领域被广泛使用。
目前,可以在会场内设置显示屏,并在显示屏上显示演讲者的PPT(演示文稿,PowerPoint),以将需要演讲的内容展示给用户。
发明人在实施本发明实施例的过程中发现,在会场的空间较大的情况下,坐在会场后端的用户有可能看不清显示屏上的PPT内容。或者,即使能够看清显示屏上的PPT内容,但由于语言不通等因素,导致看不懂PPT内容。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的数据处理方法、数据处理装置及用于数据处理的装置,本发明实施例能够克服用户在演示场景中看不清PPT内容的问题,以及能够克服用户因为语言不通而看不懂PPT内容的问题。
为了解决上述问题,本发明公开了一种数据处理方法,应用于服务端,包括:
获取源演示页;
对所述源演示页中的原文内容进行翻译,得到的翻译演示页中包括:所述原文内容对应的译文内容;
向客户端发送所述翻译演示页的页面内容。
另一方面,本发明实施例公开了一种数据处理装置,
应用于服务端,所述装置包括:
获取模块,用于获取源演示页;
翻译模块,用于对所述源演示页中的原文内容进行翻译,得到的翻译演示页中包括:所述原文内容对应的译文内容;
页面内容发送模块,用于向客户端发送所述翻译演示页的页面内容。
再一方面,本发明实施例公开了一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取源演示页;
对所述源演示页中的原文内容进行翻译,得到的翻译演示页中包括:所述原文内容对应的译文内容;
向客户端发送所述翻译演示页的页面内容。
本发明实施例包括以下优点:
本发明实施例通过客户端向用户呈现译文内容,客户端可以运行在用户的终端上,因此能够克服用户在会议场景中看不清PPT内容的问题。
并且,译文内容对应的第二语种可以为符合用户习惯或正在学习的语言种类,如用户的母语种类等;因此本发明实施例能够克服用户因为语言不通而看不懂PPT内容的问题。
附图说明
图1是本发明实施例的一种数据处理方法的流程的示意;
图2是本发明的一种数据处理方法实施例一的步骤流程图;
图3是本发明的一种数据处理方法实施例二的步骤流程图;
图4是本发明实施例的一种知识图谱的示意;
图5是本发明的一种数据处理方法实施例三的步骤流程图;
图6是本发明的一种数据处理方法实施例四的步骤流程图;
图7是本发明的一种数据处理方法实施例五的步骤流程图;
图8是本发明的一种数据处理装置的结构框图;
图9是本发明的一种数据处理装置的结构框图;
图10是本发明的一种用于数据处理的装置1300的框图;及
图11是本发明的一种服务端的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例可以适用于演示场景。演示场景可以包括:会议场景、晚会等综艺活动、儿童剧、话剧等场景。在演示场景下,场地内通常设置有显示屏,显示屏上显示演讲者或表演者的PPT,以将需要演讲的内容展示给用户,演讲者或表演者可以统称为发声者。
在实际应用中,在会场的空间较大的情况下,坐在会场后端的用户有可能看不清显示屏上的PPT内容。或者,即使能够看清显示屏上的PPT内容,但由于语言不通等因素,导致看不懂PPT内容。
针对看不清或看不懂PPT的技术问题,本发明实施例提供了一种数据处理方案,该方案具体包括:获取源演示页;对上述源演示页中的原文内容进行翻译,得到的翻译演示页中可以包括:上述原文内容对应的译文内容;向客户端发送上述翻译演示页的页面内容。
源演示页可以指演示文稿中的页面,通常在会场的显示屏上显示源演示页。源演示页中的原文内容可以对应有第一语种。
本发明实施例对上述源演示页中的原文内容进行翻译,并向客户端发送翻译得到的翻译演示页的页面内容,以使客户端向用户提供译文内容。其中,翻译演示页中可以包括:上述原文内容对应的译文内容,译文内容可以对应有第二语种,第二语种可以为符合用户习惯或正在学习的语言种类。
本发明实施例通过客户端向用户呈现译文内容,客户端可以运行在用户的终端上,因此能够克服用户在会议场景中看不清PPT内容的问题。
并且,译文内容对应的第二语种可以为符合用户习惯或正在学习的语言种类,如符合用户习惯的语言种类为用户的母语种类,或者用户正在学习某种外语,查看该外语的译文内容,能够加强和校验对于该外语的学习效果。因此本发明实施例能够克服用户因为语言不通而看不懂PPT内容的问题。
参照图1,示出了本发明实施例的一种数据处理方法的应用环境的示意图,该方法可以应用于会议场景,其中,会议终端101、服务端102和客户端103位于有线或无线网络中,通过该有线或无线网络,会议终端101、服务端102和客户端103进行数据交互。
会议终端101可以包括:处理器111和显示屏112。其中,显示屏112可以显示演示文稿。处理器111可以获取演示文稿中源演示页的内容。例如,处理器111读取演示文稿对应的文件;又如,处理器111可以获取演示文稿中源演示页对应的图像等。
服务端102可以从会议终端101获取会议对应的源演示页,对所述源演示页中的原文内容进行翻译,并向客户端103发送所述翻译演示页的页面内容。
客户端103可以运行在终端上。上述终端可以包括:智能手机、平板电脑、电子书阅读器、MP3 (动态影像专家压缩标准音频层面3,Moving Picture Experts Group AudioLayer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture ExpertsGroup Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备、智能音响等等。可以理解,本发明实施例对于具体的终端不加以限制。
客户端103可以从服务端102接收翻译演示页的页面内容,并对所述翻译演示页的页面内容进行展示,以向用户提供译文内容。
方法实施例一
参照图2,示出了本发明的一种数据处理方法实施例一的步骤流程图,该方法应用于服务端,具体可以包括如下步骤:
步骤201、获取源演示页;
步骤202、对上述源演示页中的原文内容进行翻译,得到的翻译演示页中可以包括:上述原文内容对应的译文内容;
步骤203、向客户端发送上述翻译演示页的页面内容。
步骤201中,源演示页可以指演示文稿中的页面。可选地,可以在会场的显示屏上显示源演示页。源演示页中的原文内容可以对应有第一语种。
可选地,服务端可以从场地终端获取会议对应的源演示页。场地终端可以指设置于场地的终端。
根据一种实施例,服务端可以从场地终端获取演示文稿对应的文件,并从该文件中读取源演示页。
根据另一种实施例,服务端可以从场地终端接收源演示页对应的图像。在演示文稿对应的文件不公开的情况下,本发明实施例可以可以通过场地终端获取源演示页对应的图像。源演示页对应的图像可以为截屏图像或拍照图像,可以理解,本发明实施例对于源演示页对应的图像的具体类型不加以限制。
本发明实施例可以采用OCR(光学字符识别,Optical Character Recognition)技术,识别源演示页对应的图像中的原文内容,以对上述原文内容进行处理,如对原文内容进行翻译等等。
步骤202中,对上述源演示页中的原文内容进行翻译,可以得到翻译演示页中的译文内容。
译文内容可以对应第二语种,第二语种可以为与第一语种不同的语种。第二语种可以为符合用户习惯或正在学习的语言种类。例如,第二语种可以为用户的母语对应的语言种类等。可以理解,本发明实施例对于具体的第二语种不加以限制。
根据本发明实施例,不同的用户可以对应不同的第二语种,因此,本发明实施例可以向不同的用户提供不同第二语种对应的译文内容。在第一语种为英文的情况下,假设用户A喜好的第二语种为中文,则可以向用户A提供中文对应的译文内容,假设用户B喜好的第二语种为日文,则可以向用户B提供日文对应的译文内容。
在本发明的一种可选实施例中,所述方法还可以包括:
依据用户针对语种的选择的操作,确定所述译文内容对应的语种;或者
依据用户的历史数据,确定所述译文内容对应的语种。
根据一种实施例,可以提供多种语种,供用户选择,以使用户将喜好的语种用于译文内容。可以理解,用户可以根据实际应用需求,对译文内容对应的语种进行切换。
根据另一种实施例,可以依据用户的历史数据,确定所述译文内容对应的语种。可选地,可以统计用户的历史数据中语种的使用频率,依据使用频率确定第二语种。例如,将使用频率最高的语种作为第二语种。又如,将使用频率最高的、且不同于第一语种的语种作为第二语种。
可选地,历史数据可以具有时效性。历史数据对应有时间段,该时间段的起始时间可由用户确定,例如,起始时间为一个月前等,可以使历史数据具有时效性,从而能够增强历史数据所反映的用户习惯的时效性。
在本发明的一种可选实施例中,上述对上述源演示页中的原文内容进行翻译,具体可以包括:将上述源演示页中的原文内容翻译为译文内容;将上述源演示页中的原文内容替换为上述译文内容,以得到翻译演示页。
本发明实施例可以从上述源演示页中的字符区域去除原文内容,并将上述译文内容回贴至上述字符区域,由此可以实现翻译演示页与源演示页之间的匹配度。当然,本发明实施例对于翻译演示页的具体确定过程不加以限制。
在本发明的另一种可选实施例中,翻译演示页的页面内容除了包括译文内容之外,还可以包括原文内容,相应地,翻译演示页的页面内容可以包括:对照的原文内容和译文内容,可以按照段落或句子,对原文内容和译文内容进行对照显示。
步骤203中,向客户端发送上述翻译演示页的页面内容,可以使客户端向用户提供翻译演示页的页面内容。
在本发明的一种可选实施例中,上述方法还可以包括:确定发声者的语音数据对应的翻译文本;依据所述发声者的音色参数,确定所述翻译文本对应的翻译语音数据;向客户端发送所述翻译语音数据。
综上,本发明实施例的数据处理方法,通过客户端向用户呈现译文内容,客户端可以运行在用户的终端上,因此能够克服用户在会议场景中看不清PPT内容的问题。
并且,译文内容对应的第二语种可以为符合用户习惯或正在学习的语言种类,如用户的母语种类等;因此本发明实施例能够克服用户因为语言不通而看不懂PPT内容的问题。
方法实施例二
参照图3,示出了本发明的一种数据处理方法实施例二的步骤流程图,该方法应用于服务端,具体可以包括如下步骤:
步骤301、获取源演示页;
步骤302、对上述源演示页中的原文内容进行翻译,得到的翻译演示页中可以包括:上述原文内容对应的译文内容;
步骤303、向客户端发送上述翻译演示页的页面内容。
相对于图2所示方法实施例一,本实施例的方法还可以包括:
步骤304、从上述原文内容或译文内容中提取关键词;
步骤305、依据知识图谱,确定上述关键词对应的相关信息;
步骤306、向客户端发送上述关键词对应的相关信息。
在实际应用中,用户可能因为缺乏背景知识,看不懂PPT内容。
本发明实施例中,依据知识图谱,确定原文内容或译文内容中关键词对应的相关信息,并通过客户端向用户提供上述关键词对应的相关信息;上述相关信息可以向用户普及关键词相关的知识,因此能够在一定程度上克服因为缺乏背景知识而看不懂PPT内容的问题。
知识图谱(Knowledge Graph)是一种叫做语义网络(semantic network)的知识库,即具有有向图结构的一个知识库。其中,图的节点代表实体(entity)或者概念(concept),而图的边代表实体/概念之间的各种语义关系,图中的不同节点通过语义关系相连。
实体可以由若干个属性表示,例如,人物这类实体有生日、身高、妻子等属性。电影实体有导演、演员、制片国家、上映日期等。
通过实体的属性可以将不同的实体建立关联关系,例如:
人物A (实体)-- 妻子(属性) ->人物B(另一个实体);
人物A -- 电影作品 ->无间道;
无间道 -- 制片国家/地区 ->中国香港;
人物(实体)-- 出生地(属性) ->地名(另一个实体);
人物(实体)-- 职业(属性) ->职业名称(另一个实体);
人物(实体)-- 代表作品(属性) ->应用程序名称(另一个实体)。
在知识图谱中,可以用来表达图里的节点、用关系来表达图中的边。实体指的是现实世界中的事物比如人、地名、概念、药物、公司等,关系则用来表达不同实体之间的某种联系,比如人-“居住在”-北京、张三和李四是“朋友”、逻辑回归是深度学习的“先导知识”等等。
知识图谱利用交互式机器学习技术,支持根据推理、纠错、标注等交互动作的学习功能,不断沉淀知识逻辑和模型,能够提高知识图谱中的准确性、广度和覆盖性。
可选地,知识图谱的推理可以包括:给定一个关系,去判断任意两个实体之间有没有这个关系;或者,挖掘出新的关系等;或者,挖掘出与给定实体相关的实体等。例如,可以利用推理,挖掘出与“专家系统”相关的实体,如“监督学习”、“强化学习”、“贝叶斯分类器”、“协方差矩阵”等。
可选地,可以利用规则,对知识图谱进行纠错。例如,可以根据关系的互逆属性,对知识图谱进行纠错。例如实体1的关系A是实体2,实体2的关系A’是实体3,若实体1与实体3不匹配,则可以认为实体1或实体3存在错误。其中,关系A与关系A’为可逆关系,如关系A为妻子、关系A’为丈夫,又如关系A为母公司、关系A’为子公司等。
参照图4,示出了本发明实施例的一种知识图谱的示意,其中,“人物C”通过实体属性与如下实体相连接:
出生地:安徽桐城;
职业:罗辑思维创始人;
代表作品:得到APP;
朋友:XXX;
联系方式:手机号;
参加节目:综艺节目的导师等。
可以理解,图4中的实体属性只是作为可选实施例,实际上,本发明实施例对于具体的实体属性不加以限制。另外,可以理解,图4中,“桐城”、“罗辑思维”等实体可以与除了“人物C”之外的其他实体相连接,本发明实施例对于知识图谱中具体的节点、以及节点之间的具体连接不加以限制。
在本发明的一种可选实施例中,上述确定上述关键词对应的相关信息,具体可以包括:依据所述关键词在所述知识图谱中的位置,确定上述关键词对应的相关信息。关键词在所述知识图谱中的位置可以指知识图谱中与关键词相匹配的实体或概念所在的位置。
根据一种实施例,若所述关键词对应所述知识图谱中的第一节点、且第一节点为起始节点,则依据所述知识图谱的所有节点得到相关信息。起始节点可以指向非起始节点,而可以不被其他节点指向。起始节点可以为树形知识图谱的根节点;或者起始节点可以为非树形知识图谱的中心节点,如图4中,节点“人物C”处于图谱的中心,且箭头向外。
根据另一种实施例,若所述关键词对应所述知识图谱中的第二节点、且第二节点为非起始节点,则依据所述第二节点和所述第二节点下属的节点得到相关信息。第二节点下属的节点可以包括:第二节点指向的第三节点、第三节点指向的第四节点、或者第四节点指向的第五节点等。
在实际应用中,可以首先将第二节点指向的第三节点对应的关键词作为相关信息。可以依据第四节点对应关键词与关键词之间的相关性,确定是否将第四节点对应关键词作为相关信息。例如,若相关性超过相关性阈值,则将第四节点对应关键词作为相关信息等。同理,可以依据第五节点对应关键词与关键词之间的相关性,确定是否将第五节点对应关键词作为相关信息。
在实际应用中,可以采用树形等图形表示上述相关信息,或者,可以采用结构化的文字表示上述相关信息,可以理解,本发明实施例对于相关信息的具体表示方式不加以限制。
例如,会议的源演示页或翻译演示页中包括关键词“人物C”,则可以依据知识图谱实时得到“人物C”对应的如下相关信息:
出生地:安徽桐城
职业:罗辑思维创始人
代表作品:创办得到APP、罗辑思维节目
主要成就:商务电视、经济与法、对话。
综上,本发明实施例的数据处理方法,依据知识图谱,确定原文内容或译文内容中关键词对应的相关信息,并通过客户端向用户提供上述关键词对应的相关信息;上述相关信息可以向用户普及关键词相关的知识,因此能够在一定程度上克服因为缺乏背景知识而看不懂PPT内容的问题。
方法实施例三
参照图5,示出了本发明的一种数据处理方法实施例三的步骤流程图,应用于客户端,该方法具体可以包括如下步骤:
步骤501、从服务端接收翻译演示页的页面内容;上述页面内容可以包括:源演示页中原文内容对应的译文内容;
步骤502、对上述翻译演示页的页面内容进行展示。
本发明实施例通过客户端向用户呈现译文内容,客户端可以运行在用户的终端上,因此能够在一定程度上克服用户在会议场景中看不清PPT内容的问题。
本发明实施例中,可选的是,可以在会场内提供二维码,以供用户使用,例如用户可以使用终端对上述二维码进行扫描。上述二维码对应的扫描结果中可以包括:客户端的信息,如客户端对应的访问地址。
在本发明的一种可选实施例中,可以依据上述二维码对应的扫描结果,显示客户端对应的页面。客户端对应的页面中可以包括现场功能对应的入口,如第一入口,第一入口用于提供翻译演示页的页面内容。
在本发明的一种可选实施例中,上述从服务端接收翻译演示页的页面内容,具体可以包括:提供翻译演示页的第一入口;响应于针对上述第一入口的触发操作,向服务端发送页面请求;接收上述服务端依据上述页面请求返回的翻译演示页的页面内容。
在本发明的另一种可选实施例中,可以预先从服务端接收翻译演示页的页面内容,然后响应于针对上述第一入口的触发操作,对上述翻译演示页的页面内容进行展示。
本发明实施例中,可选的是,上述翻译演示页包括:实时的翻译演示页、或者历史的翻译演示页。实时的翻译演示页可以对应会议中正在播放的源演示页。历史的翻译演示页可以对应会议中过去播放的源演示页。
可选地,上述对上述翻译演示页的页面内容进行展示,具体可以包括:
响应于针对第一入口的触发操作,对实时的翻译演示页的页面内容进行展示。
进一步可选地,上述方法还可以包括:响应于切换操作,对展示的翻译演示页进行切换。本发明实施例可以提供不同翻译演示页对应的切换入口,切换入口可以为滚动条、或者滑动手势、或者快捷键、或语音口令等,以使用户对不同的翻译演示页进行切换。
在本发明的一种可选实施例中,上述方法还可以包括:接收上述原文内容或译文内容中关键词对应的相关信息;上述相关信息可以为依据知识图谱得到;展示上述关键词对应的相关信息。上述相关信息可以向用户普及关键词相关的知识,因此能够在一定程度上克服因为缺乏背景知识而看不懂PPT内容的问题。
可选地,客户端对应的页面中可以包括现场功能对应的其他入口,如第二入口和/或第三入口和/或第四入口。
所述第二入口用于提供所述原文内容或译文内容中关键词对应的相关信息;
所述第三入口用于提供发声者的语音数据对应的语音识别文本和翻译文本;
所述第四入口用于提供发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据目标音色参数和所述语音数据对应的翻译文本得到。
相应地,上述展示上述关键词对应的相关信息,具体可以包括:响应于针对第二入口的触发操作,展示上述关键词对应的相关信息。
本发明实施例中,第一入口、第二入口、第三入口和第四入口中任一对应的提供数据可以具有实时性,上述提供数据可以随着发声者的语音数据的更新而更新。
在本发明的一种可选实施例中,客户端的页面的上部显示有翻译演示页的页面内容,底部显示有发声者的语音数据对应的语音识别文本和翻译文本。可以理解,翻译演示页的页面内容可以随着会议中正在播放的源演示页的更新而更新。发声者的语音数据对应的语音识别文本和翻译文本,可以随着发声者的语音数据的更新而更新。
可选地,客户端的页面中还可以显示有第二入口,如在翻译演示页的页面内容中的关键词附近设置有第二入口,若用户欲要获得某个关键词对应的相关信息,可以触发该关键词对应的第二入口,则本发明实施例可以提供该关键词对应的相关信息。
在本发明的一种可选实施例中,上述方法还可以包括:接收发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据目标音色参数和所述语音数据对应的翻译文本得到;播放所述翻译语音数据。
本发明实施例中,音色参数可以指不同的声音的频率表现在波形方面的与众不同的特性,通常不同的发声体对应不同的音色。
在实际应用中,可以依据发声者的语音数据,得到发声者的音色参数。
本发明实施例中,可以利用TTS(语音合成,Text To Speech)技术,将翻译文本转换为音色参数对应的翻译语音数据。本发明实施例对于具体的语音合成过程不加以限制。
根据一种实施例,目标音色参数可以包括:发声者的音色参数。本发明实施例在会议过程中向用户提供翻译文本对应的翻译语音数据,可以提高翻译语音数据对应的自然度、以及用户与演讲者之间交流的流畅性,进而可以提升用户体验。
根据另一种实施例,目标音色参数可以包括:用户选择的音色参数。可以提供多种音色参数,供用户选择,以使用户选择喜好的目标音色参数。
综上,本发明实施例的数据处理方法,通过客户端向用户呈现译文内容,客户端可以运行在用户的终端上,因此能够克服用户在会议场景中看不清PPT内容的问题。
并且,译文内容对应的第二语种可以为符合用户习惯或正在学习的语言种类,如用户的母语种类等;因此本发明实施例能够克服用户因为语言不通而看不懂PPT内容的问题。
方法实施例四
参照图6,示出了本发明的一种数据处理方法实施例四的步骤流程图,应用于服务端,该方法具体可以包括如下步骤:
步骤601、确定发声者的语音数据对应的翻译文本;
步骤602、依据上述发声者的音色参数,确定上述翻译文本对应的翻译语音数据;
步骤603、向客户端发送上述翻译语音数据。
本发明实施例依据发声者的音色参数,对翻译文本进行语音合成,以得到上述翻译文本对应的翻译语音数据,可以提高翻译语音数据对应的自然度、以及用户与演讲者之间交流的流畅性,进而可以提升用户体验。
例如,在某手机的发布会上,演讲者用英文演讲,客户端除了提供发声者的语音数据对应的中文形式的翻译文本之外,还可以播放基于演讲者的音色表达的翻译语音数据。翻译语音数据采用中文表达,且基于演讲者的音色表达。
方法实施例五
参照图7,示出了本发明的一种数据处理方法实施例五的步骤流程图,应用于客户端,该方法具体可以包括如下步骤:
步骤701、从服务端接收发声者的语音数据对应的翻译语音数据;上述翻译语音数据可以为依据上述发声者的音色参数和上述语音数据对应的翻译文本得到;
步骤702、播放上述翻译语音数据。
本发明实施例在会议过程中向用户提供翻译文本对应的翻译语音数据,可以提高翻译语音数据对应的自然度、以及用户与演讲者之间交流的流畅性,进而可以提升用户体验。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的运动动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。
装置实施例
参照图8,示出了本发明的一种数据处理装置实施例的结构框图,应用于服务端,具体可以包括:
获取模块801,用于获取源演示页;
翻译模块802,用于对所述源演示页中的原文内容进行翻译,得到的翻译演示页中可以包括:所述原文内容对应的译文内容;
页面内容发送模块803,用于向客户端发送所述翻译演示页的页面内容。
可选地,获取模块801可以包括:
接收模块,用于接收源演示页对应的图像。
可选地,翻译模块802可以包括:
内容翻译模块,用于将所述源演示页中的原文内容翻译为译文内容;
替换模块,用于将所述源演示页中的原文内容替换为所述译文内容,以得到翻译演示页。
可选地,所述装置还可以包括:
提取模块,用于从所述原文内容或译文内容中提取关键词;
相关信息确定模块,用于依据知识图谱,确定所述关键词对应的相关信息;
相关信息发送模块,用于向客户端发送所述关键词对应的相关信息。
可选地,所述装置还可以包括:
翻译文本确定模块,用于确定发声者的语音数据对应的翻译文本;
语音合成模块,用于依据目标音色参数,确定所述翻译文本对应的翻译语音数据;
翻译语音数据发送模块,用于向客户端发送所述翻译语音数据。
参照图9,示出了本发明的一种数据处理装置实施例的结构框图,应用于客户端,具体可以包括:
页面内容接收模块901,用于从服务端接收翻译演示页的页面内容;所述页面内容可以包括:源演示页中原文内容对应的译文内容;
页面内容展示模块902,用于对所述翻译演示页的页面内容进行展示。
可选地,所述装置还可以包括:
第一语种确定模块,用于依据用户针对语种的选择的操作,确定所述译文内容对应的语种;或者
第二语种确定模块,用于依据用户的历史数据,确定所述译文内容对应的语种。
可选地,所述页面内容接收模块可以包括:
入口提供模块,用于提供翻译演示页的第一入口;
请求发送模块,用于响应于针对所述第一入口的触发操作,向服务端发送页面请求;
接收模块,用于接收所述服务端依据所述页面请求返回的翻译演示页的页面内容。
可选地,所述翻译演示页可以包括:实时的翻译演示页、或者历史的翻译演示页;
所述页面内容展示模块可以包括:
第一触发展示模块,用于响应于针对第一入口的触发操作,对实时的翻译演示页的页面内容进行展示。
可选地,所述装置还可以包括:
切换模块,用于响应于切换操作,对展示的翻译演示页进行切换。
可选地,所述装置还可以包括:
相关信息接收模块,用于接收所述原文内容或译文内容中关键词对应的相关信息;所述相关信息为依据知识图谱得到;
相关信息展示模块,用于展示所述关键词对应的相关信息。
可选地,所述展示所述关键词对应的相关信息,可以包括:
第二触发展示模块,用于响应于针对第二入口的触发操作,展示所述关键词对应的相关信息。
可选地,所述装置还可以包括:
翻译语音数据接收模块,用于接收发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据所述目标音色参数和所述语音数据对应的翻译文本得到;
翻译语音数据播放模块,用于播放所述翻译语音数据。
可选地,所述目标音色参数可以包括:
所述发声者的音色参数;或者
用户选择的音色参数。
可选地,所述装置还可以包括:
客户端页面显示模块,用于依据二维码对应的扫描结果,显示客户端对应的页面;所述页面中可以包括:第一入口,所述第一入口用于提供所述翻译演示页的页面内容。
可选地,所述客户端对应的页面中还可以包括:第二入口和/或,第三入口,和/或第四入口;
所述第二入口用于提供所述原文内容或译文内容中关键词对应的相关信息;
所述第三入口用于提供发声者的语音数据对应的语音识别文本和翻译文本;
所述第四入口用于提供发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据目标音色参数和所述语音数据对应的翻译文本得到。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图10是根据一示例性实施例示出的一种用于数据处理的装置1300的框图。例如,装置1300可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图10,装置1300可以包括以下一个或多个组件:处理组件1302,存储器1304,电源组件1306,多媒体组件1308,音频组件1310,输入/输出(I/ O)的接口1312,传感器组件1314,以及通信组件1316。
处理组件1302通常控制装置1300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件1302可以包括一个或多个处理器1320来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1302可以包括一个或多个模块,便于处理组件1302和其他组件之间的交互。例如,处理组件1302可以包括多媒体模块,以方便多媒体组件1308和处理组件1302之间的交互。
存储器1304被配置为存储各种类型的数据以支持在设备1300的操作。这些数据的示例包括用于在装置1300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件1306为装置1300的各种组件提供电力。电源组件1306可以包括电源管理系统,一个或多个电源,及其他与为装置1300生成、管理和分配电力相关联的组件。
多媒体组件1308包括在所述装置1300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1308包括一个前置摄像头和/或后置摄像头。当设备1300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1310被配置为输出和/或输入音频信号。例如,音频组件1310包括一个麦克风(MIC),当装置1300处于操作模式,如呼叫模式、记录模式和语音数据处理模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1304或经由通信组件1316发送。在一些实施例中,音频组件1310还包括一个扬声器,用于输出音频信号。
I/ O接口1312为处理组件1302和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1314包括一个或多个传感器,用于为装置1300提供各个方面的状态评估。例如,传感器组件1314可以检测到设备1300的打开/关闭状态,组件的相对定位,例如所述组件为装置1300的显示器和小键盘,传感器组件1314还可以检测装置1300或装置1300一个组件的位置改变,用户与装置1300接触的存在或不存在,装置1300方位或加速/减速和装置1300的温度变化。传感器组件1314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1314还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1314还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1316被配置为便于装置1300和其他设备之间有线或无线方式的通信。装置1300可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件1316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件1316还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频数据处理(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置1300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1304,上述指令可由装置1300的处理器1320执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由智能终端的处理器执行时,使得智能终端能够执行一种数据处理方法,所述方法包括:获取源演示页;对所述源演示页中的原文内容进行翻译,得到的翻译演示页中包括:所述原文内容对应的译文内容;向客户端发送所述翻译演示页的页面内容。
图11是本发明实施例中服务端的结构示意图。该服务端1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务端中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务端1900上执行存储介质1930中的一系列指令操作。
服务端1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM, LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
本发明实施例公开了A1、一种数据处理方法,应用于服务端,包括:
获取源演示页;
对所述源演示页中的原文内容进行翻译,得到的翻译演示页中包括:所述原文内容对应的译文内容;
向客户端发送所述翻译演示页的页面内容。
A2、根据A1所述的方法,所述获取源演示页,包括:
接收源演示页对应的图像。
A3、根据A1所述的方法,所述对所述源演示页中的原文内容进行翻译,包括:
将所述源演示页中的原文内容翻译为译文内容;
将所述源演示页中的原文内容替换为所述译文内容,以得到翻译演示页。
A4、根据A1至A3中任一所述的方法,所述方法还包括:
从所述原文内容或译文内容中提取关键词;
依据知识图谱,确定所述关键词对应的相关信息;
向客户端发送所述关键词对应的相关信息。
A5、根据A1至A3中任一所述的方法,所述方法还包括:
确定发声者的语音数据对应的翻译文本;
依据目标音色参数,确定所述翻译文本对应的翻译语音数据;
向客户端发送所述翻译语音数据。
本发明实施例公开了B6、一种数据处理方法,应用于客户端,所述方法包括:
从服务端接收翻译演示页的页面内容;所述页面内容包括:源演示页中原文内容对应的译文内容;
对所述翻译演示页的页面内容进行展示。
B7、根据B6所述的方法,所述方法还包括:
依据用户针对语种的选择的操作,确定所述译文内容对应的语种;或者
依据用户的历史数据,确定所述译文内容对应的语种。
B8、根据B6所述的方法,所述从服务端接收翻译演示页的页面内容,包括:
提供翻译演示页的第一入口;
响应于针对所述第一入口的触发操作,向服务端发送页面请求;
接收所述服务端依据所述页面请求返回的翻译演示页的页面内容。
B9、根据B6所述的方法,所述翻译演示页包括:实时的翻译演示页、或者历史的翻译演示页;
所述对所述翻译演示页的页面内容进行展示,包括:
响应于针对第一入口的触发操作,对实时的翻译演示页的页面内容进行展示。
B10、根据B9所述的方法,所述方法还包括:
响应于切换操作,对展示的翻译演示页进行切换。
B11、根据B6所述的方法,所述方法还包括:
接收所述原文内容或译文内容中关键词对应的相关信息;所述相关信息为依据知识图谱得到;
展示所述关键词对应的相关信息。
B12、根据B11所述的方法,所述展示所述关键词对应的相关信息,包括:
响应于针对第二入口的触发操作,展示所述关键词对应的相关信息。
B13、根据B6所述的方法,所述方法还包括:
接收发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据所述目标音色参数和所述语音数据对应的翻译文本得到;
播放所述翻译语音数据。
B14、根据B13所述的方法,所述目标音色参数包括:
所述发声者的音色参数;或者
用户选择的音色参数。
B15、根据B6所述的方法,所述方法还包括:
依据二维码对应的扫描结果,显示客户端对应的页面;所述页面中包括:第一入口,所述第一入口用于提供所述翻译演示页的页面内容。
B16、根据B15所述的方法,所述客户端对应的页面中还包括:第二入口和/或,第三入口,和/或第四入口;
所述第二入口用于提供所述原文内容或译文内容中关键词对应的相关信息;
所述第三入口用于提供发声者的语音数据对应的语音识别文本和翻译文本;
所述第四入口用于提供发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据目标音色参数和所述语音数据对应的翻译文本得到。
本发明实施例公开了C17、一种数据处理方法,应用于服务端,所述方法包括:
确定发声者的语音数据对应的翻译文本;
依据所述发声者的音色参数,确定所述翻译文本对应的翻译语音数据;
向客户端发送所述翻译语音数据。
本发明实施例公开了D18、一种数据处理方法,应用于客户端,所述方法包括:
从服务端接收发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据所述发声者的音色参数和所述语音数据对应的翻译文本得到;
播放所述翻译语音数据。
本发明实施例公开了E19、一种数据处理装置,应用于服务端,所述装置包括:
获取模块,用于获取源演示页;
翻译模块,用于对所述源演示页中的原文内容进行翻译,得到的翻译演示页中包括:所述原文内容对应的译文内容;
页面内容发送模块,用于向客户端发送所述翻译演示页的页面内容。
E20、根据E19所述的装置,所述获取模块包括:
接收模块,用于接收源演示页对应的图像。
E21、根据E19所述的装置,所述翻译模块包括:
内容翻译模块,用于将所述源演示页中的原文内容翻译为译文内容;
替换模块,用于将所述源演示页中的原文内容替换为所述译文内容,以得到翻译演示页。
E22、根据E19至21中任一所述的装置,所述装置还包括:
提取模块,用于从所述原文内容或译文内容中提取关键词;
相关信息确定模块,用于依据知识图谱,确定所述关键词对应的相关信息;
相关信息发送模块,用于向客户端发送所述关键词对应的相关信息。
E23、根据E19至21中任一所述的装置,所述装置还包括:
翻译文本确定模块,用于确定发声者的语音数据对应的翻译文本;
语音合成模块,用于依据目标音色参数,确定所述翻译文本对应的翻译语音数据;
翻译语音数据发送模块,用于向客户端发送所述翻译语音数据。
本发明实施例公开了F24、一种数据处理装置,应用于客户端,所述装置包括:
页面内容接收模块,用于从服务端接收翻译演示页的页面内容;所述页面内容包括:源演示页中原文内容对应的译文内容;
页面内容展示模块,用于对所述翻译演示页的页面内容进行展示。
F25、根据F24所述的装置,所述装置还包括:
第一语种确定模块,用于依据用户针对语种的选择的操作,确定所述译文内容对应的语种;或者
第二语种确定模块,用于依据用户的历史数据,确定所述译文内容对应的语种。
F26、根据F24所述的装置,所述页面内容接收模块包括:
入口提供模块,用于提供翻译演示页的第一入口;
请求发送模块,用于响应于针对所述第一入口的触发操作,向服务端发送页面请求;
接收模块,用于接收所述服务端依据所述页面请求返回的翻译演示页的页面内容。
F27、根据F24所述的装置,所述翻译演示页包括:实时的翻译演示页、或者历史的翻译演示页;
所述页面内容展示模块包括:
第一触发展示模块,用于响应于针对第一入口的触发操作,对实时的翻译演示页的页面内容进行展示。
F28、根据F27所述的装置,所述装置还包括:
切换模块,用于响应于切换操作,对展示的翻译演示页进行切换。
F29、根据F24所述的装置,所述装置还包括:
相关信息接收模块,用于接收所述原文内容或译文内容中关键词对应的相关信息;所述相关信息为依据知识图谱得到;
相关信息展示模块,用于展示所述关键词对应的相关信息。
F30、根据F29所述的装置,所述展示所述关键词对应的相关信息,包括:
第二触发展示模块,用于响应于针对第二入口的触发操作,展示所述关键词对应的相关信息。
F31、根据F24所述的装置,所述装置还包括:
翻译语音数据接收模块,用于接收发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据所述目标音色参数和所述语音数据对应的翻译文本得到;
翻译语音数据播放模块,用于播放所述翻译语音数据。
F32、根据F31所述的装置,所述目标音色参数包括:
所述发声者的音色参数;或者
用户选择的音色参数。
F33、根据F24所述的装置,所述装置还包括:
客户端页面显示模块,用于依据二维码对应的扫描结果,显示客户端对应的页面;所述页面中包括:第一入口,所述第一入口用于提供所述翻译演示页的页面内容。
F34、根据F33所述的装置,所述客户端对应的页面中还包括:第二入口和/或,第三入口,和/或第四入口;
所述第二入口用于提供所述原文内容或译文内容中关键词对应的相关信息;
所述第三入口用于提供发声者的语音数据对应的语音识别文本和翻译文本;
所述第四入口用于提供发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据目标音色参数和所述语音数据对应的翻译文本得到。
本发明实施例公开了G35、一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取源演示页;
对所述源演示页中的原文内容进行翻译,得到的翻译演示页中包括:所述原文内容对应的译文内容;
向客户端发送所述翻译演示页的页面内容。
G36、根据G35所述的装置,所述获取源演示页,包括:
接收源演示页对应的图像。
G37、根据G35所述的装置,所述对所述源演示页中的原文内容进行翻译,包括:
将所述源演示页中的原文内容翻译为译文内容;
将所述源演示页中的原文内容替换为所述译文内容,以得到翻译演示页。
G38、根据G35至37中任一所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
从所述原文内容或译文内容中提取关键词;
依据知识图谱,确定所述关键词对应的相关信息;
向客户端发送所述关键词对应的相关信息。
G39、根据G35至37中任一所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定发声者的语音数据对应的翻译文本;
依据目标音色参数,确定所述翻译文本对应的翻译语音数据;
向客户端发送所述翻译语音数据。
本发明实施例公开了H40、一种数据处理装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
从服务端接收翻译演示页的页面内容;所述页面内容包括:源演示页中原文内容对应的译文内容;
对所述翻译演示页的页面内容进行展示。
H41、根据H40所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令::
依据用户针对语种的选择的操作,确定所述译文内容对应的语种;或者
依据用户的历史数据,确定所述译文内容对应的语种。
H42、根据H40所述的装置,所述从服务端接收翻译演示页的页面内容,包括:
提供翻译演示页的第一入口;
响应于针对所述第一入口的触发操作,向服务端发送页面请求;
接收所述服务端依据所述页面请求返回的翻译演示页的页面内容。
H43、根据H40所述的装置,所述翻译演示页包括:实时的翻译演示页、或者历史的翻译演示页;
所述对所述翻译演示页的页面内容进行展示,包括:
响应于针对第一入口的触发操作,对实时的翻译演示页的页面内容进行展示。
H44、根据H43所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令::
响应于切换操作,对展示的翻译演示页进行切换。
H45、根据H40所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令::
接收所述原文内容或译文内容中关键词对应的相关信息;所述相关信息为依据知识图谱得到;
展示所述关键词对应的相关信息。
H46、根据H45所述的装置,所述展示所述关键词对应的相关信息,包括:
响应于针对第二入口的触发操作,展示所述关键词对应的相关信息。
H47、根据H40所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令::
接收发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据所述目标音色参数和所述语音数据对应的翻译文本得到;
播放所述翻译语音数据。
H48、根据H47所述的装置,所述目标音色参数包括:
所述发声者的音色参数;或者
用户选择的音色参数。
49、根据H40所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令::
依据二维码对应的扫描结果,显示客户端对应的页面;所述页面中包括:第一入口,所述第一入口用于提供所述翻译演示页的页面内容。
H50、根据H49所述的装置,所述客户端对应的页面中还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令::第二入口和/或,第三入口,和/或第四入口;
所述第二入口用于提供所述原文内容或译文内容中关键词对应的相关信息;
所述第三入口用于提供发声者的语音数据对应的语音识别文本和翻译文本;
所述第四入口用于提供发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据目标音色参数和所述语音数据对应的翻译文本得到。
本发明实施例公开了I51、一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如A1至A5中一个或多个所述的方法。
本发明实施例公开J52、一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如B6至B16中一个或多个所述的方法。
以上对本发明所提供的一种数据处理方法、一种数据处理装置和一种用于数据处理的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (43)

1.一种数据处理方法,其特征在于,应用于会议场景,所述会议场景的设备包括:服务端、会议终端和客户端,所述方法包括:
获取源演示页;所述会议终端向服务端发送所述源演示页;
对所述源演示页中的原文内容进行翻译,得到的翻译演示页中包括:所述原文内容对应的译文内容;
向客户端发送所述翻译演示页的页面内容;客户端依据二维码对应的扫描结果,显示客户端对应的页面;所述页面中包括:第一入口,所述第一入口用于提供所述翻译演示页的页面内容;
从所述原文内容或译文内容中提取关键词;
依据知识图谱,确定所述关键词对应的相关信息;
向客户端发送所述关键词对应的相关信息;所述客户端的页面的上部显示有翻译演示页的页面内容,底部显示有发声者的语音数据对应的语音识别文本和翻译文本;所述翻译演示页的页面内容随着会议中正在播放的源演示页的更新而更新;发声者的语音数据对应的语音识别文本和翻译文本,随着发声者的语音数据的更新而更新;所述客户端还播放基于发声者的音色表达的翻译语音数据。
2.根据权利要求1所述的方法,其特征在于,所述获取源演示页,包括:
接收源演示页对应的图像。
3.根据权利要求1所述的方法,其特征在于,所述对所述源演示页中的原文内容进行翻译,包括:
将所述源演示页中的原文内容翻译为译文内容;
将所述源演示页中的原文内容替换为所述译文内容,以得到翻译演示页。
4.根据权利要求1至3中任一所述的方法,其特征在于,所述方法还包括:
确定发声者的语音数据对应的翻译文本;
依据目标音色参数,确定所述翻译文本对应的翻译语音数据;
向客户端发送所述翻译语音数据。
5.一种数据处理方法,其特征在于,应用于会议场景,所述会议场景的设备包括:服务端、会议终端和客户端,所述方法包括:
从服务端接收翻译演示页的页面内容;所述页面内容包括:源演示页中原文内容对应的译文内容;依据二维码对应的扫描结果,显示客户端对应的页面;所述页面中包括:第一入口,所述第一入口用于提供所述翻译演示页的页面内容;所述会议终端向服务端发送所述源演示页;
对所述翻译演示页的页面内容进行展示;
接收所述原文内容或译文内容中关键词对应的相关信息;所述相关信息为依据知识图谱得到;
展示所述关键词对应的相关信息;所述客户端的页面的上部显示有翻译演示页的页面内容,底部显示有发声者的语音数据对应的语音识别文本和翻译文本;所述翻译演示页的页面内容随着会议中正在播放的源演示页的更新而更新;发声者的语音数据对应的语音识别文本和翻译文本,随着发声者的语音数据的更新而更新;所述客户端还播放基于发声者的音色表达的翻译语音数据。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
依据用户针对语种的选择的操作,确定所述译文内容对应的语种;或者
依据用户的历史数据,确定所述译文内容对应的语种。
7.根据权利要求5所述的方法,其特征在于,所述从服务端接收翻译演示页的页面内容,包括:
提供翻译演示页的第一入口;
响应于针对所述第一入口的触发操作,向服务端发送页面请求;
接收所述服务端依据所述页面请求返回的翻译演示页的页面内容。
8.根据权利要求5所述的方法,其特征在于,所述翻译演示页包括:实时的翻译演示页、或者历史的翻译演示页;
所述对所述翻译演示页的页面内容进行展示,包括:
响应于针对第一入口的触发操作,对实时的翻译演示页的页面内容进行展示。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
响应于切换操作,对展示的翻译演示页进行切换。
10.根据权利要求5所述的方法,其特征在于,所述展示所述关键词对应的相关信息,包括:
响应于针对第二入口的触发操作,展示所述关键词对应的相关信息。
11.根据权利要求5所述的方法,其特征在于,所述方法还包括:
接收发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据目标音色参数和所述语音数据对应的翻译文本得到;
播放所述翻译语音数据。
12.根据权利要求11所述的方法,其特征在于,所述目标音色参数包括:
所述发声者的音色参数;或者
用户选择的音色参数。
13.根据权利要求5所述的方法,其特征在于,所述客户端对应的页面中还包括:第二入口和/或,第三入口,和/或第四入口;
所述第二入口用于提供所述原文内容或译文内容中关键词对应的相关信息;
所述第三入口用于提供发声者的语音数据对应的语音识别文本和翻译文本;
所述第四入口用于提供发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据目标音色参数和所述语音数据对应的翻译文本得到。
14.一种数据处理方法,其特征在于,应用于会议场景,所述会议场景的设备包括:服务端、会议终端和客户端,所述方法包括:
向客户端发送翻译演示页的页面内容;客户端依据二维码对应的扫描结果,显示客户端对应的页面;所述页面中包括:第一入口,所述第一入口用于提供所述翻译演示页的页面内容;所述会议终端向服务端发送源演示页,以使服务端确定翻译演示页的页面内容;
从原文内容或译文内容中提取关键词;
依据知识图谱,确定所述关键词对应的相关信息;
向客户端发送所述关键词对应的相关信息;
确定发声者的语音数据对应的翻译文本;
依据所述发声者的音色参数,确定所述翻译文本对应的翻译语音数据;
向客户端发送所述翻译语音数据;所述客户端的页面的上部显示有翻译演示页的页面内容,底部显示有发声者的语音数据对应的语音识别文本和翻译文本;所述翻译演示页的页面内容随着会议中正在播放的源演示页的更新而更新;发声者的语音数据对应的语音识别文本和翻译文本,随着发声者的语音数据的更新而更新;所述客户端还播放基于发声者的音色表达的翻译语音数据。
15.一种数据处理方法,其特征在于,应用于会议场景,所述会议场景的设备包括:服务端、会议终端和客户端,所述方法包括:
从服务端接收翻译演示页的页面内容;所述页面内容包括:源演示页中原文内容对应的译文内容;依据二维码对应的扫描结果,显示客户端对应的页面;所述页面中包括:第一入口,所述第一入口用于提供所述翻译演示页的页面内容;所述会议终端向服务端发送源演示页,以使服务端确定翻译演示页的页面内容;
对所述翻译演示页的页面内容进行展示;
接收所述原文内容或译文内容中关键词对应的相关信息;所述相关信息为依据知识图谱得到;
展示所述关键词对应的相关信息;
从服务端接收发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据所述发声者的音色参数和所述语音数据对应的翻译文本得到;
播放所述翻译语音数据;所述客户端的页面的上部显示有翻译演示页的页面内容,底部显示有发声者的语音数据对应的语音识别文本和翻译文本;所述翻译演示页的页面内容随着会议中正在播放的源演示页的更新而更新;发声者的语音数据对应的语音识别文本和翻译文本,随着发声者的语音数据的更新而更新。
16.一种数据处理装置,其特征在于,应用于会议场景,所述会议场景的设备包括:服务端、会议终端和客户端,所述装置包括:
获取模块,用于获取源演示页;
翻译模块,用于对所述源演示页中的原文内容进行翻译,得到的翻译演示页中包括:所述原文内容对应的译文内容;所述会议终端向服务端发送源演示页;
页面内容发送模块,用于向客户端发送所述翻译演示页的页面内容;
提取模块,用于从所述原文内容或译文内容中提取关键词;
相关信息确定模块,用于依据知识图谱,确定所述关键词对应的相关信息;
相关信息发送模块,用于向客户端发送所述关键词对应的相关信息;所述客户端的页面的上部显示有翻译演示页的页面内容,底部显示有发声者的语音数据对应的语音识别文本和翻译文本;所述翻译演示页的页面内容随着会议中正在播放的源演示页的更新而更新;发声者的语音数据对应的语音识别文本和翻译文本,随着发声者的语音数据的更新而更新;所述客户端还播放基于发声者的音色表达的翻译语音数据。
17.根据权利要求16所述的装置,其特征在于,所述获取模块包括:
接收模块,用于接收源演示页对应的图像。
18.根据权利要求16所述的装置,其特征在于,所述翻译模块包括:
内容翻译模块,用于将所述源演示页中的原文内容翻译为译文内容;
替换模块,用于将所述源演示页中的原文内容替换为所述译文内容,以得到翻译演示页。
19.根据权利要求16至18中任一所述的装置,其特征在于,所述装置还包括:
翻译文本确定模块,用于确定发声者的语音数据对应的翻译文本;
语音合成模块,用于依据目标音色参数,确定所述翻译文本对应的翻译语音数据;
翻译语音数据发送模块,用于向客户端发送所述翻译语音数据。
20.一种数据处理装置,其特征在于,应用于会议场景,所述会议场景的设备包括:服务端、会议终端和客户端,所述装置包括:
客户端页面显示模块,用于依据二维码对应的扫描结果,显示客户端对应的页面;所述页面中包括:第一入口,所述第一入口用于提供翻译演示页的页面内容;
页面内容接收模块,用于从服务端接收翻译演示页的页面内容;所述页面内容包括:源演示页中原文内容对应的译文内容;所述会议终端向服务端发送源演示页,以使服务端确定翻译演示页的页面内容;
页面内容展示模块,用于对所述翻译演示页的页面内容进行展示;
相关信息接收模块,用于接收所述原文内容或译文内容中关键词对应的相关信息;所述相关信息为依据知识图谱得到;
相关信息展示模块,用于展示所述关键词对应的相关信息;所述客户端的页面的上部显示有翻译演示页的页面内容,底部显示有发声者的语音数据对应的语音识别文本和翻译文本;所述翻译演示页的页面内容随着会议中正在播放的源演示页的更新而更新;发声者的语音数据对应的语音识别文本和翻译文本,随着发声者的语音数据的更新而更新;所述客户端还播放基于发声者的音色表达的翻译语音数据。
21.根据权利要求20所述的装置,其特征在于,所述装置还包括:
第一语种确定模块,用于依据用户针对语种的选择的操作,确定所述译文内容对应的语种;或者
第二语种确定模块,用于依据用户的历史数据,确定所述译文内容对应的语种。
22.根据权利要求20所述的装置,其特征在于,所述页面内容接收模块包括:
入口提供模块,用于提供翻译演示页的第一入口;
请求发送模块,用于响应于针对所述第一入口的触发操作,向服务端发送页面请求;
接收模块,用于接收所述服务端依据所述页面请求返回的翻译演示页的页面内容。
23.根据权利要求20所述的装置,其特征在于,所述翻译演示页包括:实时的翻译演示页、或者历史的翻译演示页;
所述页面内容展示模块包括:
第一触发展示模块,用于响应于针对第一入口的触发操作,对实时的翻译演示页的页面内容进行展示。
24.根据权利要求23所述的装置,其特征在于,所述装置还包括:
切换模块,用于响应于切换操作,对展示的翻译演示页进行切换。
25.根据权利要求20所述的装置,其特征在于,所述展示所述关键词对应的相关信息,包括:
第二触发展示模块,用于响应于针对第二入口的触发操作,展示所述关键词对应的相关信息。
26.根据权利要求20所述的装置,其特征在于,所述装置还包括:
翻译语音数据接收模块,用于接收发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据目标音色参数和所述语音数据对应的翻译文本得到;
翻译语音数据播放模块,用于播放所述翻译语音数据。
27.根据权利要求26所述的装置,其特征在于,所述目标音色参数包括:
所述发声者的音色参数;或者
用户选择的音色参数。
28.根据权利要求20所述的装置,其特征在于,所述客户端对应的页面中还包括:第二入口和/或,第三入口,和/或第四入口;
所述第二入口用于提供所述原文内容或译文内容中关键词对应的相关信息;
所述第三入口用于提供发声者的语音数据对应的语音识别文本和翻译文本;
所述第四入口用于提供发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据目标音色参数和所述语音数据对应的翻译文本得到。
29.一种用于数据处理的装置,其特征在于,应用于会议场景,所述会议场景的设备包括:服务端、会议终端和客户端,所述装置包括有存储器,以及一个或者多个程序,其中一个或者多个程序存储于存储器中,且经配置以由一个或者多个处理器执行所述一个或者多个程序包含用于进行以下操作的指令:
获取源演示页;所述会议终端向服务端发送源演示页;
对所述源演示页中的原文内容进行翻译,得到的翻译演示页中包括:所述原文内容对应的译文内容;
向客户端发送所述翻译演示页的页面内容;
从所述原文内容或译文内容中提取关键词;
依据知识图谱,确定所述关键词对应的相关信息;
向客户端发送所述关键词对应的相关信息;所述客户端的页面的上部显示有翻译演示页的页面内容,底部显示有发声者的语音数据对应的语音识别文本和翻译文本;所述翻译演示页的页面内容随着会议中正在播放的源演示页的更新而更新;发声者的语音数据对应的语音识别文本和翻译文本,随着发声者的语音数据的更新而更新;所述客户端还播放基于发声者的音色表达的翻译语音数据。
30.根据权利要求29所述的装置,其特征在于,所述获取源演示页,包括:
接收源演示页对应的图像。
31.根据权利要求29所述的装置,其特征在于,所述对所述源演示页中的原文内容进行翻译,包括:
将所述源演示页中的原文内容翻译为译文内容;
将所述源演示页中的原文内容替换为所述译文内容,以得到翻译演示页。
32.根据权利要求29至31中任一所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定发声者的语音数据对应的翻译文本;
依据目标音色参数,确定所述翻译文本对应的翻译语音数据;
向客户端发送所述翻译语音数据。
33.一种数据处理装置,其特征在于,其特征在于,应用于会议场景,所述会议场景的设备包括:服务端、会议终端和客户端,所述装置包括有存储器,以及一个或者多个程序,其中一个或者多个程序存储于存储器中,且经配置以由一个或者多个处理器执行所述一个或者多个程序包含用于进行以下操作的指令:
从服务端接收翻译演示页的页面内容;所述页面内容包括:源演示页中原文内容对应的译文内容;依据二维码对应的扫描结果,显示客户端对应的页面;所述页面中包括:第一入口,所述第一入口用于提供所述翻译演示页的页面内容;所述会议终端向服务端发送源演示页,以使服务端确定翻译演示页的页面内容;
对所述翻译演示页的页面内容进行展示;
接收所述原文内容或译文内容中关键词对应的相关信息;所述相关信息为依据知识图谱得到;
展示所述关键词对应的相关信息;所述客户端的页面的上部显示有翻译演示页的页面内容,底部显示有发声者的语音数据对应的语音识别文本和翻译文本;所述翻译演示页的页面内容随着会议中正在播放的源演示页的更新而更新;发声者的语音数据对应的语音识别文本和翻译文本,随着发声者的语音数据的更新而更新;所述客户端还播放基于发声者的音色表达的翻译语音数据。
34.根据权利要求33所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据用户针对语种的选择的操作,确定所述译文内容对应的语种;或者
依据用户的历史数据,确定所述译文内容对应的语种。
35.根据权利要求33所述的装置,其特征在于,所述从服务端接收翻译演示页的页面内容,包括:
提供翻译演示页的第一入口;
响应于针对所述第一入口的触发操作,向服务端发送页面请求;
接收所述服务端依据所述页面请求返回的翻译演示页的页面内容。
36.根据权利要求33所述的装置,其特征在于,所述翻译演示页包括:实时的翻译演示页、或者历史的翻译演示页;
所述对所述翻译演示页的页面内容进行展示,包括:
响应于针对第一入口的触发操作,对实时的翻译演示页的页面内容进行展示。
37.根据权利要求36所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
响应于切换操作,对展示的翻译演示页进行切换。
38.根据权利要求33所述的装置,其特征在于,所述展示所述关键词对应的相关信息,包括:
响应于针对第二入口的触发操作,展示所述关键词对应的相关信息。
39.根据权利要求33所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据目标音色参数和所述语音数据对应的翻译文本得到;
播放所述翻译语音数据。
40.根据权利要求39所述的装置,其特征在于,所述目标音色参数包括:
所述发声者的音色参数;或者
用户选择的音色参数。
41.根据权利要求33所述的装置,其特征在于,所述客户端对应的页面中还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:第二入口和/或,第三入口,和/或第四入口;
所述第二入口用于提供所述原文内容或译文内容中关键词对应的相关信息;
所述第三入口用于提供发声者的语音数据对应的语音识别文本和翻译文本;
所述第四入口用于提供发声者的语音数据对应的翻译语音数据;所述翻译语音数据为依据目标音色参数和所述语音数据对应的翻译文本得到。
42.一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至4中一个或多个所述的方法。
43.一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求5至15中一个或多个所述的方法。
CN201911319945.9A 2019-12-19 2019-12-19 数据处理方法、装置和介质 Active CN111178086B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911319945.9A CN111178086B (zh) 2019-12-19 2019-12-19 数据处理方法、装置和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911319945.9A CN111178086B (zh) 2019-12-19 2019-12-19 数据处理方法、装置和介质

Publications (2)

Publication Number Publication Date
CN111178086A CN111178086A (zh) 2020-05-19
CN111178086B true CN111178086B (zh) 2024-05-17

Family

ID=70646616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911319945.9A Active CN111178086B (zh) 2019-12-19 2019-12-19 数据处理方法、装置和介质

Country Status (1)

Country Link
CN (1) CN111178086B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313433B (zh) * 2021-07-13 2022-03-08 平安科技(深圳)有限公司 基于知识图谱的会议资源分配方法及相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760542A (zh) * 2016-03-15 2016-07-13 腾讯科技(深圳)有限公司 一种显示控制方法、终端及服务器
CN108369585A (zh) * 2015-11-30 2018-08-03 三星电子株式会社 用于提供翻译服务的方法及其电子装置
CN108538284A (zh) * 2017-03-06 2018-09-14 北京搜狗科技发展有限公司 同声翻译结果的展现方法及装置、同声翻译方法及装置
CN108549643A (zh) * 2018-04-08 2018-09-18 北京百度网讯科技有限公司 翻译处理方法和装置
CN110444196A (zh) * 2018-05-10 2019-11-12 腾讯科技(北京)有限公司 基于同声传译的数据处理方法、装置、系统和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108369585A (zh) * 2015-11-30 2018-08-03 三星电子株式会社 用于提供翻译服务的方法及其电子装置
CN105760542A (zh) * 2016-03-15 2016-07-13 腾讯科技(深圳)有限公司 一种显示控制方法、终端及服务器
CN108538284A (zh) * 2017-03-06 2018-09-14 北京搜狗科技发展有限公司 同声翻译结果的展现方法及装置、同声翻译方法及装置
CN108549643A (zh) * 2018-04-08 2018-09-18 北京百度网讯科技有限公司 翻译处理方法和装置
CN110444196A (zh) * 2018-05-10 2019-11-12 腾讯科技(北京)有限公司 基于同声传译的数据处理方法、装置、系统和存储介质

Also Published As

Publication number Publication date
CN111178086A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
WO2020237937A1 (zh) 一种图像处理方法及装置、电子设备和存储介质
CN107644646B (zh) 语音处理方法、装置以及用于语音处理的装置
WO2017031875A1 (zh) 在聊天界面更改表情符号的方法、装置及终端设备
KR102338918B1 (ko) 기계 번역 모델의 훈련 방법, 장치 및 시스템
CN111128183B (zh) 语音识别方法、装置和介质
CN108038102B (zh) 表情图像的推荐方法、装置、终端及存储介质
US20210407495A1 (en) Method, apparatus, electronic device and storage medium for semantic recognition
WO2019165832A1 (zh) 文字信息处理方法、装置及终端
CN109413478B (zh) 视频编辑方法、装置、电子设备及存储介质
US11335348B2 (en) Input method, device, apparatus, and storage medium
JP2015115892A (ja) コメント作成装置およびその制御方法
US20210029304A1 (en) Methods for generating video, electronic device and storage medium
EP3933656A1 (en) Method for semantic recognition and electronic device
CN113673261A (zh) 数据生成方法、装置及可读存储介质
CN111797262A (zh) 诗词生成方法、装置、电子设备和存储介质
CN111178086B (zh) 数据处理方法、装置和介质
CN109814730B (zh) 输入方法和装置、用于输入的装置
CN107247794B (zh) 直播中的话题引导方法、直播装置及终端设备
US20230267282A1 (en) Poetry generation
CN112328809A (zh) 实体分类方法、装置及计算机可读存储介质
CN109977390B (zh) 一种生成文本的方法及装置
CN111984767A (zh) 一种信息推荐方法、装置和电子设备
CN114462410A (zh) 实体识别方法、装置、终端及存储介质
CN110929122B (zh) 一种数据处理方法、装置和用于数据处理的装置
CN113901832A (zh) 人机对话方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant