CN111506278A - 数据同传的方法、音频翻译的方法、装置和系统 - Google Patents

数据同传的方法、音频翻译的方法、装置和系统 Download PDF

Info

Publication number
CN111506278A
CN111506278A CN201910091995.XA CN201910091995A CN111506278A CN 111506278 A CN111506278 A CN 111506278A CN 201910091995 A CN201910091995 A CN 201910091995A CN 111506278 A CN111506278 A CN 111506278A
Authority
CN
China
Prior art keywords
translation
audio
information
result
product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910091995.XA
Other languages
English (en)
Inventor
葛正晗
韩玉洁
李洋
赵宇
白鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910091995.XA priority Critical patent/CN111506278A/zh
Publication of CN111506278A publication Critical patent/CN111506278A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/1454Digital output to display device ; Cooperation and interconnection of the display device with other functional units involving copying of the display data of a local workstation or window to a remote workstation or window so that an actual copy of the data is displayed simultaneously on two or more displays, e.g. teledisplay

Abstract

本发明公开了一种数据同传的方法、音频翻译的方法、装置和系统。其中,该方法包括:登陆产品主页;通过产品主页显示的创建选项,配置目标地址的信息和翻译信息;显示配置后的信息,并根据翻译信息获取待识别音频进行会场翻译;将翻译结果发送至与产品主页连接的屏幕上。本发明解决了由于不同系统平台中语音翻译软件的兼容性低,导致的会场演示沟通时效率低的技术问题。

Description

数据同传的方法、音频翻译的方法、装置和系统
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种数据同传的方法、音频翻译的方法、装置和系统。
背景技术
语音翻译作为将语音识别和机器翻译等人工智能技术结合的产品形态,通过软硬件技术将云和端连接到一起,解决用户随时随地交流沟通需求,这将会是一个在很多业务场景都能够对业务和生活有较大改变的产品。在大型会议场景下,由于语言不通,造成会议沟通效率低下,需要辅以同传产品来优化会议体验。
业界比较常用的大会同传产品,都是基于Windows或者Mac OS操作系统的客户端程序,其缺点主要包括以下几点:1.需要相对固定的演示设备,当更换演示设备时需要重新安装客户端程序。2.客户端程序通常不具备跨平台性,例如Windows的客户端无法在Mac OS操作系统上运行。3.当客户端需要做更新迭代时,需要重新打包并分发。
针对上述由于不同系统平台中语音翻译软件的兼容性低,导致的会场演示沟通时效率低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据同传的方法、音频翻译的方法、装置和系统,以至少解决由于不同系统平台中语音翻译软件的兼容性低,导致的会场演示沟通时效率低的技术问题。
根据本发明实施例的一个方面,提供了一种数据同传的方法,包括:登陆产品主页;通过产品主页显示的创建选项,配置目标地址的信息和翻译信息;显示配置后的信息,并根据翻译信息获取待识别音频进行会场翻译;将翻译结果发送至与产品主页连接的屏幕上。
可选的,通过产品主页显示的创建选项,配置目标地址的信息和翻译信息包括:根据创建选项选择创建目标地址的信息,其中,目标地址包括:与产品主页连接的屏幕端口地址;在翻译信息包括语音识别模型和机器翻译模型的情况下,通过产品主页配置语音识别模型和机器翻译模型。
可选的,显示配置后的信息包括:显示屏幕的展示样式,以及屏幕中字幕的样式信息,其中,样式信息包括:字幕的显示位置,字体,字体颜色或字体大小。
可选的,根据翻译信息获取待识别音频进行会场翻译包括:当用户进入展示页面时,实时收音;根据实时收音的音频通过语音识别模型进行识别,得到识别结果;根据识别结果通过机器翻译模型进行翻译,得到翻译结果。
进一步地,翻译结果还包括:对翻译结果进行编辑校正,得到编辑校正后的翻译结果。
可选的,根据识别结果通过机器翻译模型进行翻译包括:向服务终端发送识别结果,并接收服务终端返回的翻译结果。
可选的,该方法还包括:回收展示的音频及翻译结果。
根据本发明实施例的一方面,还提供了一种音频翻译的方法,包括:接收产品主页的翻译请求;根据翻译请求获取待识别音频;依据待识别音频进行翻译得到翻译结果;将翻译结果返回产品主页。
可选的,接收产品主页的翻译请求包括:通过网页套接字应用程序编程接口接收产品主页的翻译请求。
可选的,依据待识别音频进行翻译得到翻译结果包括:根据用户选择的语音识别模型及机器翻译模型,将翻译服务转发给相应的集群;调用语音识别服务,其中,将语音识别的结果作为原文,调用机器翻译服务对原文进行翻译,得到翻译结果。
可选的,该方法还包括:对翻译结果进行数据沉淀,并对数据沉淀后的数据进行数据分析。
根据本发明实施例的另一方面,还提供了一种数据同传的装置,包括:载入模块,用于登陆产品主页;配置模块,用于通过产品主页显示的创建选项,配置目标地址的信息和翻译信息;翻译模块,用于显示配置后的信息,并根据翻译信息获取待识别音频进行会场翻译;传送模块,用于将翻译结果发送至与产品主页连接的屏幕上。
根据本发明实施例的另一方面,还提供了一种音频翻译的装置,包括:接收模块,用于接收产品主页的翻译请求;获取模块,用于根据翻译请求获取待识别音频;翻译模块,用于依据待识别音频进行翻译得到翻译结果;发送模块,用于将翻译结果返回产品主页。
根据本发明实施例的又一方面,还提供了一种数据同传的系统,包括:产品主页和服务终端,其中通过获取用户输入的账号信息登陆产品主页;通过产品主页显示的创建选项,配置目标地址的信息和翻译信息;显示配置后的信息,并根据翻译信息获取待识别音频进行会场翻译;服务终端接收产品主页的翻译请求;根据翻译请求获取待识别音频;依据待识别音频进行翻译得到翻译结果;将翻译结果返回产品主页;产品主页将翻译结果发送至与产品主页连接的会场屏幕上。
根据本发明实施例的再一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述数据同传的方法,或,上述音频翻译的方法。
在本发明实施例中,采用将会议同传产品开发在web页面上的方式,登陆产品主页;通过产品主页显示的创建选项,配置目标地址的信息和翻译信息;显示配置后的信息,并根据翻译信息获取待识别音频进行会场翻译;将翻译结果发送至与产品主页连接的屏幕上,达到了克服了软件与系统平台之间的兼容性的目的,从而实现了免安装,跨平台,自动更新,进而大大降低了使用者上手门槛,并能灵活支持各种场景的会议,直播及演示,方便后续数据采集及分析,为问题排查,数据评测等后续工作提供了便捷的技术效果,进而解决了由于不同系统平台中语音翻译软件的兼容性低,导致的会场演示沟通时效率低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种数据同传的方法的计算机终端的硬件结构框图;
图2是根据本发明实施例一的数据同传的方法的流程图;
图3是根据本发明实施例二的音频翻译的方法的流程图;
图4是根据本发明实施例三的数据同传的装置的示意图;
图5是根据本发明实施例四的音频翻译的装置的示意图;
图6是根据本发明实施例五的数据同传的系统的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请涉及的技术名词:
ASR(Automatic Speech Recognition):自动语音识别;
SDK(Software Development Kit):软件开发工具包;
API(Application Programming Interface):应用程序编程接口;
WebSocket:基于TCP的一种新的网络协议,实现了浏览器与服务器全双工(full-duplex)通信——允许服务器主动发送信息给客户端基于TCP的一种新的网络协议,实现了浏览器与服务器全双工(full-duplex)通信——允许服务器主动发送信息给客户端。
实施例1
根据本发明实施例,还提供了一种数据同传的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种数据同传的方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的数据同传的方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的数据同传的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
在上述运行环境下,本申请提供了如图2所示的数据同传的方法。在终端设备侧,图2是根据本发明实施例一的数据同传的方法的流程图。
步骤S202,登陆产品主页;
本申请上述步骤S202,本申请实施例提供的数据同传的方法可以适用于用户大会现场字幕,直播字幕,展台演示等场景,其中,在实现过程中,通过用户使用内网账号登录产品主页,这里内网账号,可以是用于登录基于虚拟机设立的可以适用于各个系统平台的虚拟操作系统的账号,用户通过登录该内网将会场使用的屏幕与内网中产品主页进行连接,通过验证账号信息中的用户名和密码,登录产品主页,其中,产品主页,用于创建新会场,以及配置用户在会场中需要使用的ASR模型及机器翻译模型。
步骤S204,通过产品主页显示的创建选项,配置目标地址的信息和翻译信息;
本申请上述步骤S204,基于步骤S202中登录的产品主页,用户能够通过登录产品主页,用户选择创建选项,在目标地址包括与产品主页连接的屏幕端口地址的情况下,创建与屏幕连接的展示场景,在翻译信息包括语音识别模型和机器翻译模型的情况下,用户配置需要使用的ASR模型及机器翻译模型。
步骤S206,显示配置后的信息,并根据翻译信息获取待识别音频进行会场翻译;
本申请上述步骤S206,基于步骤S204配置好的展示场景,语音识别模型和机器翻译模型,显示配置后的信息,并在现场进行实时采音,获取用户实时输出的待识别音频,识别该待识别音频,并对识别后的待识别音频进行实时翻译。
步骤S208,将翻译结果发送至与产品主页连接的屏幕上。
本申请上述步骤S208,基于步骤S206中翻译后的翻译结果,将该翻译结果发送至与产品主页连接的屏幕上。
本申请实施例提供的数据同传的方法将会议同传产品开发在web页面上,可以实现免安装,跨平台,自动更新,该方案在语音翻译基本功能的基础上,扩展了会场管理,模型选择,页面样式配置,实时编辑,数据回收等功能,从而大大降低了使用者上手门槛,并能灵活支持各种场景的会议,直播及演示。
在本发明实施例中,采用将会议同传产品开发在web页面上的方式,通过获取用户输入的账号信息登陆产品主页;通过产品主页显示的创建选项,配置目标地址的信息和翻译信息;显示配置后的信息,并根据翻译信息获取待识别音频进行会场翻译;将翻译结果发送至与产品主页连接的屏幕上,达到了克服了软件与系统平台之间的兼容性的目的,从而实现了免安装,跨平台,自动更新,进而大大降低了使用者上手门槛,并能灵活支持各种场景的会议,直播及演示,方便后续数据采集及分析,为问题排查,数据评测等后续工作提供了便捷的技术效果,进而解决了由于不同系统平台中语音翻译软件的兼容性低,导致的会场演示沟通时效率低的技术问题。
可选的,步骤S204中通过产品主页显示的创建选项,配置目标地址的信息和翻译信息包括:根据创建选项选择创建目标地址的信息,其中,目标地址包括:与产品主页连接的屏幕端口地址;在翻译信息包括语音识别模型和机器翻译模型的情况下,通过产品主页配置语音识别模型和机器翻译模型。
可选的,步骤S206中显示配置后的信息包括:显示屏幕的展示样式,以及屏幕中字幕的样式信息,其中,样式信息包括:字幕的显示位置,字体,字体颜色或字体大小。
综上,本申请实施例提供的数据同传的方法中用户使用内网账号登录产品主页,用户选择创建新会场。用户在会场中配置需要使用的ASR模型及机器翻译模型。并且通过用户配置会场的展示样式,支持调整双语字幕的展示位置,字体颜色、大小等。
可选的,步骤S206中根据翻译信息获取待识别音频进行会场翻译包括:当用户进入展示页面时,实时收音;根据实时收音的音频通过语音识别模型进行识别,得到识别结果;根据识别结果通过机器翻译模型进行翻译,得到翻译结果。
进一步地,翻译结果还包括:对翻译结果进行编辑校正,得到编辑校正后的翻译结果。
可选的,根据识别结果通过机器翻译模型进行翻译包括:向服务终端发送识别结果,并接收服务终端返回的翻译结果。
综上,本申请实施例提供的数据同传的方法中用户进入会场页面开始实时收音,双语字幕会按用户配置的样式展示在页面上。可以将该产品主页的页面连接现场屏幕进行现场字幕展示,或者给到导播台用户直播流中的字幕合成。其中,在语音翻译的过程中,用户可以实时编辑语音识别或机器翻译的结果,能够使翻译结果更加精确。
可选的,本申请实施例提供的数据同传的方法还包括:步骤S210,回收展示的音频及翻译结果。
具体的,本申请实施例提供的数据同传的方法通过回收展示的音频及翻译结果,方便后续数据采集及分析,为问题排查,数据评测等后续工作提供了便捷。
综上,结合步骤S202至步骤S210,本申请实施例提供的数据同传的方法将用户大会现场字幕,直播字幕,展台演示三大业务场景。在产品层,即,用户通过登录预先获取的账号密码,登录产品主页,其中,用户使用该产品的流程如下:
1.用户使用内网账号登录产品主页。
2.用户选择创建新会场。
3.用户在会场中配置需要使用的ASR模型及机器翻译模型。
4.用户配置会场的展示样式,支持调整双语字幕的展示位置,字体颜色、大小等。
5.用户进入会场页面开始实时收音,双语字幕会按用户配置的样式展示在页面上。可以将该页面连接现场屏幕进行现场字幕展示,或者给到导播台用户直播流中的字幕合成。
6.在语音翻译的过程中,用户可以实时编辑语音识别或机器翻译的结果,使结果更加精确。
7.会场翻译完成后,用户可以回收会场的音频及翻译结果数据。
实施例2
根据本发明实施例的一方面,还提供了一种音频翻译的方法,在服务终端侧,图3是根据本发明实施例二的音频翻译的方法的流程图,包括:
步骤S302,接收产品主页的翻译请求;
本申请上述步骤S302,本申请实施例提供的音频翻译的方法中在服务终端侧,这里本申请实施例提供的服务终端位于网络侧,可以是具备数据处理功能的服务器,也可以是由至少两个服务器组成的服务器集群。
具体的,服务终端通过websocket api与产品主页进行交互,通过websocket api接收产品主页的翻译请求。
此外,在接收到翻译请求后,首先进行权限校验及计费,在鉴权成功后,执行步骤S304。
步骤S304,根据翻译请求获取待识别音频;
本申请上述步骤S304,根据用户通过产品主页选择的ASR模型及机器翻译模型,将语音识别和语音翻译服务转发给相应的集群。通过ASR模型调用语音识别服务,通过语音识别得到结果作为原文。
步骤S306,依据待识别音频进行翻译得到翻译结果;
本申请上述步骤S306,基于步骤S304中通过识别后的待识别音频,通过调用用户选择的机械翻译模型对该识别后的待识别音频进行翻译,得到翻译结果。
步骤S308,将翻译结果返回产品主页。
在本发明实施例中,采用将会议同传产品开发在web页面上的方式,通过接收产品主页的翻译请求;根据翻译请求获取待识别音频;依据待识别音频进行翻译得到翻译结果;将翻译结果返回产品主页,达到了克服了软件与系统平台之间的兼容性的目的,从而实现了免安装,跨平台,自动更新,进而大大降低了使用者上手门槛,并能灵活支持各种场景的会议,直播及演示,方便后续数据采集及分析,为问题排查,数据评测等后续工作提供了便捷的技术效果,进而解决了由于不同系统平台中语音翻译软件的兼容性低,导致的会场演示沟通时效率低的技术问题。
可选的,步骤S302中接收产品主页的翻译请求包括:通过网页套接字应用程序编程接口接收产品主页的翻译请求。
其中,在本申请实施例通过的音频翻译的方法中通过websocket api接口接收产品主页的翻译请求。
可选的,步骤S306中依据待识别音频进行翻译得到翻译结果包括:根据用户选择的语音识别模型及机器翻译模型,将翻译服务转发给相应的集群;调用语音识别服务,其中,将语音识别的结果作为原文,调用机器翻译服务对原文进行翻译,得到翻译结果。
可选的,本申请实施例提供的音频翻译的方法还包括:步骤S310,对翻译结果进行数据沉淀,并对数据沉淀后的数据进行数据分析。
具体的,本申请实施例提供的音频翻译的方法通过对翻译结果进行数据沉淀,将每次翻译后的翻译结果作为历史数据,以使得在后续数据分析过程中,通过人工智能技术对历史数据进行学习,提升ASR模型和机器翻译模型的翻译效率和翻译准确度。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的音频翻译的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例3
根据本发明实施例,还提供了一种用于实施上述数据同传的方法的装置,如图4所示,图4是根据本发明实施例三的数据同传的装置的示意图,该装置包括:
载入模块42,用于登陆产品主页;配置模块44,用于通过产品主页显示的创建选项,配置目标地址的信息和翻译信息;翻译模块46,用于显示配置后的信息,并根据翻译信息获取待识别音频进行会场翻译;传送模块48,用于将翻译结果发送至与产品主页连接的屏幕上。
其中,本申请实施例提供的数据同传的装置可以适用于实施例1中数据同传的方法。
实施例4
根据本发明实施例,还提供了一种用于实施上述音频翻译的方法的装置,如图5所示,图5是根据本发明实施例四的音频翻译的装置的示意图,该装置包括:
接收模块52,用于接收产品主页的翻译请求;获取模块54,用于根据翻译请求获取待识别音频;翻译模块56,用于依据待识别音频进行翻译得到翻译结果;发送模块58,用于将翻译结果返回产品主页。
其中,本申请实施例提供的音频翻译的装置可以适用于实施例2中音频翻译的方法。
实施例5
根据本发明实施例的又一方面,还提供了一种数据同传的系统,如图6所示,图6是根据本发明实施例五的数据同传的系统的示意图,包括:产品主页和服务终端,其中,通过获取用户输入的账号信息登陆产品主页;通过产品主页显示的创建选项,配置目标地址的信息和翻译信息;显示配置后的信息,并根据翻译信息获取待识别音频进行会场翻译;服务终端接收产品主页的翻译请求;根据翻译请求获取待识别音频;依据待识别音频进行翻译得到翻译结果;将翻译结果返回产品主页;产品主页将翻译结果发送至与产品主页连接的会场屏幕上。
具体的,如图6所示,在本申请实施例提供的数据同传的系统中,主要可以应用于用户大会现场字幕,直播字幕,展台演示三大业务场景。
在本申请实施例中产品层,本申请实施例提供的产品主页,用户使用该产品主页如下:
1.用户使用内网账号登录产品主页。
2.用户选择创建新会场。
3.用户在会场中配置需要使用的ASR模型及机器翻译模型。
4.用户配置会场的展示样式,支持调整双语字幕的展示位置,字体颜色、大小等。
5.用户进入会场页面开始实时收音,双语字幕会按用户配置的样式展示在页面上。可以将该页面连接现场屏幕进行现场字幕展示,或者给到导播台用户直播流中的字幕合成。
6.在语音翻译的过程中,用户可以实时编辑语音识别或机器翻译的结果,使结果更加精确。
7.会场翻译完成后,用户可以回收会场的音频及翻译结果数据。
接入层:网页通过websocket api与服务端进行交互服务层;
本申请实施例中服务终端接收到产品主页web页面的翻译请求后:
1.首先进行权限校验及计费。
2.根据用户选择的ASR模型及机器翻译模型,将语音识别和语音翻译服务转发给相应的集群。
3.调用语音识别服务。
4.将语音识别的结果作为原文,调用机器翻译服务。
5.组装双语数据,将结果返回给web端。
6.服务端进行数据沉淀,用户后续数据分析。
此外,本申请实施例提供的数据同传的系统除上述使用情景外,在展台演示场景,可以使用无线app的方案,将手机屏幕投在展台的屏幕中。
实施例6
根据本发明实施例的再一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述实施例1中的数据同传的方法,或,上述实施例2中的音频翻译的方法。
实施例7
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的数据同传的方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:登陆产品主页;通过产品主页显示的创建选项,配置目标地址的信息和翻译信息;显示配置后的信息,并根据翻译信息获取待识别音频进行会场翻译;将翻译结果发送至与产品主页连接的屏幕上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过产品主页显示的创建选项,配置目标地址的信息和翻译信息包括:根据创建选项选择创建目标地址的信息,其中,目标地址包括:与产品主页连接的屏幕端口地址;在翻译信息包括语音识别模型和机器翻译模型的情况下,通过产品主页配置语音识别模型和机器翻译模型。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:显示配置后的信息包括:显示屏幕的展示样式,以及屏幕中字幕的样式信息,其中,样式信息包括:字幕的显示位置,字体,字体颜色或字体大小。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:根据翻译信息获取待识别音频进行会场翻译包括:当用户进入展示页面时,实时收音;根据实时收音的音频通过语音识别模型进行识别,得到识别结果;根据识别结果通过机器翻译模型进行翻译,得到翻译结果。
进一步地,可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:翻译结果还包括:对翻译结果进行编辑校正,得到编辑校正后的翻译结果。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:根据识别结果通过机器翻译模型进行翻译包括:向服务终端发送识别结果,并接收服务终端返回的翻译结果。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:回收展示的音频及翻译结果。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (15)

1.一种数据同传的方法,包括:
登陆产品主页;
通过所述产品主页显示的创建选项,配置目标地址的信息和翻译信息;
显示配置后的信息,并根据所述翻译信息获取待识别音频进行会场翻译;
将翻译结果发送至与所述产品主页连接的屏幕上。
2.根据权利要求1所述的方法,其中,所述通过所述产品主页显示的创建选项,配置目标地址的信息和翻译信息包括:
根据所述创建选项选择创建所述目标地址的信息,其中,所述目标地址包括:与所述产品主页连接的屏幕端口地址;
在所述翻译信息包括语音识别模型和机器翻译模型的情况下,通过所述产品主页配置所述语音识别模型和所述机器翻译模型。
3.根据权利要求1所述的方法,其中,所述显示配置后的信息包括:显示屏幕的展示样式,以及所述屏幕中字幕的样式信息,其中,所述样式信息包括:字幕的显示位置,字体,字体颜色或字体大小。
4.根据权利要求1或2所述的方法,其中,根据所述翻译信息获取待识别音频进行会场翻译包括:
当用户进入展示页面时,实时收音;
根据所述实时收音的音频通过语音识别模型进行识别,得到识别结果;
根据所述识别结果通过机器翻译模型进行翻译,得到所述翻译结果。
5.根据权利要求4所述的方法,其中,所述翻译结果还包括:对所述翻译结果进行编辑校正,得到编辑校正后的翻译结果。
6.根据权利要求4所述的方法,其中,所述根据所述识别结果通过机器翻译模型进行翻译包括:向服务终端发送所述识别结果,并接收所述服务终端返回的所述翻译结果。
7.根据权利要求1所述的方法,其中,所述方法还包括:回收展示的音频及所述翻译结果。
8.一种音频翻译的方法,包括:
接收产品主页的翻译请求;
根据所述翻译请求获取待识别音频;
依据所述待识别音频进行翻译得到翻译结果;
将所述翻译结果返回所述产品主页。
9.根据权利要求8所述的方法,其中,所述接收产品主页的翻译请求包括:通过网页套接字应用程序编程接口接收所述产品主页的翻译请求。
10.根据权利要求8所述的方法,其中,所述依据所述待识别音频进行翻译得到翻译结果包括:
根据用户选择的语音识别模型及机器翻译模型,将翻译服务转发给相应的集群;
调用语音识别服务,其中,将语音识别的结果作为原文,调用机器翻译服务对所述原文进行翻译,得到所述翻译结果。
11.根据权利要求8所述的方法,其中,所述方法还包括:对所述翻译结果进行数据沉淀,并对所述数据沉淀后的数据进行数据分析。
12.一种数据同传的装置,包括:
载入模块,用于登陆产品主页;
配置模块,用于通过所述产品主页显示的创建选项,配置目标地址的信息和翻译信息;
翻译模块,用于显示配置后的信息,并根据所述翻译信息获取待识别音频进行会场翻译;
传送模块,用于将翻译结果发送至与所述产品主页连接的屏幕上。
13.一种音频翻译的装置,包括:
接收模块,用于接收产品主页的翻译请求;
获取模块,用于根据所述翻译请求获取待识别音频;
翻译模块,用于依据所述待识别音频进行翻译得到翻译结果;
发送模块,用于将所述翻译结果返回所述产品主页。
14.一种数据同传的系统,包括:产品主页和服务终端,其中,通过获取用户输入的账号信息登陆所述产品主页;通过所述产品主页显示的创建选项,配置目标地址的信息和翻译信息;显示配置后的信息,并根据所述翻译信息获取待识别音频进行会场翻译;所述服务终端接收产品主页的翻译请求;根据所述翻译请求获取待识别音频;依据所述待识别音频进行翻译得到翻译结果;将所述翻译结果返回所述产品主页;所述产品主页将翻译结果发送至与所述产品主页连接的会场屏幕上。
15.一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1所述的数据同传的方法,或,权利要求8所述的音频翻译的方法。
CN201910091995.XA 2019-01-30 2019-01-30 数据同传的方法、音频翻译的方法、装置和系统 Pending CN111506278A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910091995.XA CN111506278A (zh) 2019-01-30 2019-01-30 数据同传的方法、音频翻译的方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910091995.XA CN111506278A (zh) 2019-01-30 2019-01-30 数据同传的方法、音频翻译的方法、装置和系统

Publications (1)

Publication Number Publication Date
CN111506278A true CN111506278A (zh) 2020-08-07

Family

ID=71864594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910091995.XA Pending CN111506278A (zh) 2019-01-30 2019-01-30 数据同传的方法、音频翻译的方法、装置和系统

Country Status (1)

Country Link
CN (1) CN111506278A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106340294A (zh) * 2016-09-29 2017-01-18 安徽声讯信息技术有限公司 基于同步翻译的新闻直播字幕在线制作系统
CN108615527A (zh) * 2018-05-10 2018-10-02 腾讯科技(深圳)有限公司 基于同声传译的数据处理方法、装置和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106340294A (zh) * 2016-09-29 2017-01-18 安徽声讯信息技术有限公司 基于同步翻译的新闻直播字幕在线制作系统
CN108615527A (zh) * 2018-05-10 2018-10-02 腾讯科技(深圳)有限公司 基于同声传译的数据处理方法、装置和存储介质

Similar Documents

Publication Publication Date Title
EP3605323B1 (en) Method for generating network slice template and for applying network slice template, and apparatus
CN109068179A (zh) 一种多平台直播方法、计算机装置及计算机可读存储介质
CN109901938B (zh) 基于WebSocket通信的可交互大屏系统及可视化展示方法
CN104618806A (zh) 获取视频的评论信息的方法、装置及系统
CN111639503B (zh) 会议数据处理方法、装置、存储介质及设备
CN105337984A (zh) 一种账号登录方法与装置
CN108304368B (zh) 文本信息的类型识别方法和装置及存储介质和处理器
CN108880983B (zh) 一种虚拟三维空间的语音实时处理方法及装置
WO2017157135A1 (zh) 媒体信息处理方法及媒体信息处理装置、存储介质
CN104363507A (zh) 一种基于ott机顶盒的视音频录制及分享方法及系统
CN105550934A (zh) 虚拟现实中微信软文的推送系统及方法
CN110019058B (zh) 文件操作的共享方法和装置
CN111182348B (zh) 直播画面展示的方法、装置、存储装置和终端
CN104392366B (zh) 数据比对信息获取的方法、装置及系统
CN106791494A (zh) 视频字幕的生成方法和装置
CN106231393B (zh) 视频信息的处理方法、装置和系统
CN104853252B (zh) 一种互动的多主页控制方法、装置和系统
CN105451229A (zh) 一种便携式wifi无线设备连接装置及方法
WO2023155685A1 (zh) 通信方法、系统、装置、存储介质以及处理器
CN104639976A (zh) 机顶盒与移动终端节目同步的方法、机顶盒及移动终端
CN111506278A (zh) 数据同传的方法、音频翻译的方法、装置和系统
CN103294193A (zh) 多终端互动的方法、装置和系统
US20220377122A1 (en) Directing method and system
CN113805966A (zh) 一种多端设备动态视图渲染实现方法和系统
CN111459637A (zh) 教学资源的控制方法及装置、智能教学系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination