一种导游用翻译扩音器、导游语音翻译方法和翻译系统
技术领域
本发明涉及语音翻译技术领域,特别涉及一种导游用翻译扩音器、导游语音翻译方法和翻译系统。
背景技术
随着经济全球化的发展以及国际旅行的盛行,跨国旅游已经越来越普遍。游客在跨国旅游过程中不仅可以领略异国风土人情,还能加深对不同民族文化的了解。
通常,在旅游过程中,导游会详细介绍旅游行程、旅游地点的人文历史,每个景点的由来以及历史意义等。因此,导游和游客之间的交流是不可避免的。但是,游客可能来自世界各地,精通不同的语言,因此导游和游客之间可能因语种不同而存在沟通障碍。导游必须具备很强的外语能力才能直接与来自各个国家的游客进行交流。而且,当导游同时接待语种不同的游客时,导游对旅游景点的讲解无法同时顾及所有游客对语言的需求。
目前,导游在对景点进行解说的过程中,会使用扩音器来增大声音,方便游客听到。然而现有的导游用扩音器通常只能用于广播语音信息,并不具备翻译功能。
发明内容
为了克服导游和游客之间因语种不同而存在的沟通障碍,本发明的目的在于提供一种导游用翻译扩音器,能够将导游语言和游客语言翻译成对方能听懂的目标语言,实现语言不通的导游和游客之间的交流和互动。
为了实现上述目的,第一方面,本发明实施例提供了一种导游用翻译扩音器,所述导游用翻译扩音器包括:导游用麦克风、至少一个游客用麦克风和扩音组件,所述导游用麦克风和所述游客用麦克风均与所述扩音组件通信连接;
所述扩音组件包括控制单元、扩音单元和通信单元,所述控制单元包括:至少一个处理器与存储器,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行:
获取所述导游用麦克风或所述游客用麦克风传送的音频数据;
通过通信单元将所述音频数据传送至电子设备,以使所述电子设备根据所述音频数据获得目标语言语音、并将所述目标语言语音发送所述扩音组件;
接收所述目标语言语音并将所述目标语言语音在所述扩音单元中播放。
可选的,所述导游用麦克风和所述扩音组件有线通信连接,所述游客用麦克风和所述扩音组件无线通信连接。
可选的,所述目标语言语音包括至少两种目标语言语音。
第二方面,本发明实施例还提供了一种导游语音翻译方法,用于导游用翻译扩音器,所述方法包括:
获取所述导游用麦克风或所述游客用麦克风传送的音频数据;
通过通信单元将所述音频数据传送至移动终端,以使所述移动终端根据所述音频数据获得目标语言语音、并将所述目标语言语音发送至所述扩音组件;
接收所述目标语言语音并将所述目标语言语音在所述扩音单元中播放。
可选的,所述目标语言语音包括至少两种目标语言语音。
第三方面,本发明实施例还提供了一种导游语音翻译方法,用于移动终端,所述方法包括:
接收导游用翻译扩音器传送的音频数据;
基于所述音频数据进行文字识别获得所述音频数据对应的文本字符;
将所述文本字符翻译成目标语言对应的文本字符;
基于目标语言对应的文本字符获得目标语言语音。
可选的,所述目标语言包括至少两种,则所述基于目标语言对应的文本字符获得目标语言语音,包括:
基于至少两种目标语言对应的文本字符获得每种目标语言对应的目标语言语音。
第四方面,本发明实施例还提供了一种导游用翻译系统,导游用翻译扩音器和移动终端,所述移动终端包括:
至少一个第二处理器与第二存储器,所述第二存储器存储有可被所述至少一个第二处理器执行的指令,所述指令被所述至少一个第二处理器执行,以使所述至少一个第二处理器能够执行导游语音翻译方法。
第五方面,本发明实施例还提供了一种导游用翻译系统,导游用翻译扩音器和移动终端、第一服务器和第二服务器;
所述移动终端用于:
接收导游用翻译扩音器传送的音频数据,并将所述音频数据传送第一服务器;
接收所述第一服务器发送的目标语言对应的文本字符,并将所述文本字符发送第二服务器;
接收第二服务器发送的目标语言语音;
所述第一服务器用于执行:
接收所述移动终端发送的音频数据,并基于所述音频数据进行文字识别获得所述音频数据对应的文本字符;
将所述文本字符翻译成目标语言对应的文本字符;
所述第二服务器用于执行:
接收所述移动终端发送的目标语言对应的文本字符,并基于目标语言对应的文本字符获得目标语言语音。
第六方面,本发明实施例还提供了一种存储介质,所述存储介质存储有可执行指令,所述可执行指令适用于由处理器加载并执行上述的方法。
有益效果:本发明实施例提供的导游用翻译扩音器、导游用语音翻译方法、导游用翻译系统,能够将导游音频数据翻译成游客能听懂的目标语言,并通过扩音组件进行播报,使游客听懂导游的讲话;也能将游客音频数据翻译成导游能够听懂的目标语言,并通过扩应组件进行播报,使导游能听懂游客的讲话,帮助来自不同国家、语种不同的导游和游客进行交流和互动。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1a和图1b是本发明导游用翻译扩音器的应用场景示意图;
图2是本发明实施例提供的游用翻译扩音器的硬件结构示意图;
图3是本发明实施例提供的应用于导游用翻译扩音器的导游语音翻译方法流程示意图;
图4是本发明实施例提供的应用于移动终端的导游语音翻译方法流程示意图;
图5是本发明实施例提供的导游用翻译系统中各设备之间的交互流程图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的导游用翻译扩音器,适用于如图1a和图1b所示的应用场景。图1a所示的应用场景中包括移动终端21和翻译扩音器,移动终端21可以是任何合适的、能够将接收到的音频数据翻译成目标语言语音的各类型电子设备,例如,智能手机、平板电脑和个人电脑等。移动终端21包含用于在语言之间翻译的应用软件(“app”)。
本发明实施例中的翻译扩音器的硬件结构包括扩音组件11、导游用麦克风12和游客用麦克风13。请参阅图2,扩音组件11包括控制单元111、扩音单元112和通信单元113。其中,扩音单元112用于接收并播放翻译后的导游和游客的音频数据,通信单元113同于将导游扩音器接收到的音频数据传送至移动终端21。扩音组件11可以是任何能将电信号转换为声音信号的电子设备,例如,音箱、立体声喇叭等。
本发明实施例中的导游用麦克风12和游客用麦克风13可以是任意形式的麦克风设备,如:耳麦和话筒等。导游用麦克风12和游客用麦克风13分别用于获取导游和游客的语音信息。导游用麦克风12和扩音组件11可以建立有线通信连接,以将导游音频数据传送给扩音组件11。游客用麦克风13和扩音组件11可以建立无线通信连接(例如蓝牙通信连接),以将游客音频数据传送给扩音组件11。扩音组件11和移动终端21可以建立无线通信连接(例如蓝牙通信连接、WIFI连接等),以将从导游用麦克风12和游客用麦克风13获取的音频数据传送给移动终端21。
移动终端21将导游音频数据翻译成游客能听懂的第一目标语音,并通过扩音组件11播放第一目标语言语音,使游客能够听懂导游的语言;移动终端21也可以将游客音频数据翻译成导游能够听懂的第二目标语言,通过扩音组件11播放第二目标语言,使导游能听懂游客的语言。其中,翻译程序将自一种语言的音频数据翻译成另一语言的音频数据,“另一语言”可以被称为“目标语言”。
为了降低对移动终端21功能的要求,在图1b所示的应用场景中,还包括与移动终端21通信连接的第一服务器22和第二服务器23。第一服务器22用于根据移动终端21发送的音频数据获得目标语言对应的文本字符,并将文本字符发送给移动终端21,第二服务器23用于根据移动终端21发送的文本字符获得目标语言语音并将目标语言语音返回给移动终端21。
本发明实施例中的导游用翻译扩音器除具现有扩音器的输入、输出等能力外,还支持近场通信能力,和/或远距离通信能力。其中近场通信能力包括但不限于蓝牙、wifi、zigbee和NFC,远距离通信能力包括但不限于2G、3G、4G、5G等。
本发明实施例提供了一种导游语音翻译方法,用于上述导游用翻译扩音器,如图3所示,所述方法包括:
步骤S11:获取导游用麦克风12或游客用麦克风13传送的音频数据;
具体的,扩音组件11与导游用麦克风12有线通信连接,获取导游用麦克风12传送的音频数据;扩音组件11与游客用麦克风13无线通信连接,获取游客用麦克风13传送的音频数据。导游用麦克风12或游客用麦克风13传送的音频数据可以是一个词、一句话或者一段话。可选的,当导游用麦克风12和游客用麦克风13同时传输音频数据时,控制单元111优先获取导游用麦克风传输的音频数据。
在一些实施例中,导游用翻译扩音器的运行模式包括翻译模式和非翻译模式,用户可以通过翻译扩音器本身的按键、开关、触控、声控或配合终端配置等方法对翻译扩音器的模式进行设置。当导游用翻译扩音器处于翻译模式时进入步骤S12;当导游用翻译扩音处于非翻译模式时,则进入步骤S13。例如,当中国导游带领中国游客时,则不需要对导游/游客音频数据进行翻译,通信单元113接收到导游用麦克风12或游客用麦克风13发送的音频数据后直接通过扩音单元112播放该音频数据,不需要通过通信单元113将其发送给移动终端21。
步骤S12:通过通信单元113将所述音频数据传送至移动终端21,以使移动终端21根据音频数据获得目标语言语音、并将所述目标语言语音发送所述扩音组件11;
本发明实施例中,通信单元113传送给移动终端21的音频数据包括导游音频数据和游客音频数据。因此,上述目标语言语音包括导游音频数据对应的第一目标语言语音和游客音频数据对应的第二目标语言语音。
在一些实施例中,导游可以在移动终端APP上预先设置好导游母语的语种、第一目标语言语音对应的语种和第二目标语言语音对应的语种。可选的,在某些实施例中,游客用麦克风13包括多个按键,每个按键对应一种语种;游客可以通过游客用麦克风13上的按键预先设置好游客母语的语种。导游母语语种、游客母语语种、第一目标语言语音和第二目标语言语音对应的语种,可以根据实际情况设置成任意语种,如,汉语、英语、德语和法语等。
在本发明导游用翻译扩音器的应用场景中,通常是一个导游带领多个游客进行游览,游客可以来自同一个国家,讲同一种母语,也可以来自不同的国家,掌握不同的母语。当游客来自同一个国家时,用户只需在移动终端21上设置一种第一目标语言。
为了方便导游能同时与来自不同国家的游客进行交流,用户可以设置多种第一目标语言,每种目标语言对应不同的语种。例如,导游为中国人,游客分别来自英国、法国、美国、日本和韩国等不同的国家,此时需要将第一目标语言语种设置同时设置成法语、英语、日语和韩语等,以使移动终端21将中国导游讲述的汉语同时翻译成英语、法语、日语和韩语,来自不同国家的游客都便都能听懂导游的讲话。
由于导游只有一人,故第二目标语言语种通常只设置成一种。在另一些实施例中,为了使来自不同国家的游客也能进行交流,第二目标语言也可以设置成多种。例如,在上述示例中,法国游客可以将第二目标语言设置成汉语和英语,移动终端便会将法国游客将的话翻译成汉语和英语,导游和精通英语的游客便可听懂法国游客的讲话。
步骤S13:接收所述目标语言语音并将所述目标语言语音在所述扩音单元中播放。
具体的,本实施例中的导游用翻译扩音器包括单语输出模式和多语言输出模式,其中,单语输出模式是通过单个语音通道输出语音信息,多语言输出模式是通过多个语音通道依次输出同一句话翻译后的目标语言语音。
可选的,当翻译扩音器处于非翻译模式,导游用翻译扩音器开启单语输出模式。
当扩音器处于翻译模式时,包括如下情况:
(1)当游客的语种只有一种时,导游用翻译扩音器开启单语输出模式。例如,导游是韩国人,游客是日本人。移动终端只需将导游讲述的韩语翻译成日语,并通过单个语音输出通道输出。
(2)当游客的语种为至少两种时,导游用翻译扩音器开启多语输出模式,依次播放属于不同语种的第一目标语言。例如,导游为中国人,游客分别来自中国、英国、日本和韩国,当导游跟大家讲“你好!”时,导游用翻译扩音器通过多个语音输出通道依次输出“你好!”、“Hello!”、“にいはお!”和从而使所有的游客都能听懂导游的讲话。
进一步地,在某些实施例中,考虑到在扩音组件11输出目标语言语音时,导游或游客一般不会再说话,因此,扩音组件11在输出翻译处理后的目标语言语音时,通信单元113停止采集音频数据,从而降低导游用翻译扩音器的功耗。当目标语言语音输出结束后,通信单元113再恢复音频数据的采集。
为了进一步降低导游用翻译扩音机的功耗,在一些实施例中,上述语音翻译方法还包括如下步骤:
步骤S14:判断在预设时间内是否接收到音频数据;若否,则使导游用翻译扩音器进入待机状态。
预设时间可以根据实际情况设定,例如,可以设置为5分钟,若通信单元113在5分钟内未接收到导游用麦克风12或游客用麦克风13发送的音频数据,则使导游用翻译扩音器进入待机状态。
需要说明的是,上述导游用翻译扩音器可执行本发明实施例所提供的导游语音翻译方法,具备执行方法相应的功能模块和有益效果。未在导游用翻译扩音器实施例中详细描述的技术细节,可参见本发明实施例所提供的导游语音翻译方法。
本发明实施例还提供一种语音翻译方法,应用于移动终端,请参阅图4,该方法包括如下步骤:
步骤S201:接收导游用翻译扩音器传送的音频数据;
导游用翻译扩音器在向移动终端发送音频数据前,对导游音频数据和游客音频数据进行区分与标识,以使移动终端能够分辨出接收的语音信息是来自导游还是来自游客。
步骤S202:基于所述音频数据进行文字识别获得所述音频数据对应的文本字符;
本实施例的文本是表示一个或多个从句、短语、词或句子的字符串。例如,假设音频数据对应的语种为中文,那么文字识别文本为中文文本。
步骤S203:将所述文本字符翻译成目标语言对应的文本字符;
在上述示例中,假设翻译后的目标语言对应的语种被设定为英文,移动终端可以将中文文本通过“中”译“英”的翻译模型得到英文翻译文本,比如将中文文本“苹果”进行文字翻译,得到英文文本“apple”。可选的,在本发明的某些事实例中,目标语言可以包括至少两种。例如,假设音频数据对应的语种为中文,目标语言对应的语种可以被设定为英文,日文和法文时。此时,移动终端可以将中文文本通过“中”译“英”、“中”译“日”以及“中”译“法”的翻译模型得到中文文本对应的英文翻译文本、日文翻译文本和法文翻译文本。
步骤S204:基于目标语言对应的文本字符获得目标语言语音。
本实施例中,通过对目标语言对应的所有的文本字符进行语音合成,生成目标语言语音。
为了更加详细地介绍本发明,图5出示了图1b所示的应用场景中各设备之间的交互流程图。各设备之间的交互流程步骤如下:
S101:导游或游客分别通过导游用麦克风12或游客用麦克风13将相应的音频数据发送给扩音组件11;
S102:扩音组件11接收导游用麦克风12或游客用麦克风13发送的音频数据,并将其发送给移动终端21;
S103:移动终端21接收扩音组件11发送的音频数据,并将其发送给第一服务器22;
S104:第一服务器22接收移动终端21发送的音频数据,并基于所述音频数据进行文字识别获得音频数据对应的文本字符,并将所述文本字符翻译成目标语言对应的文本字符;
S105:第一服务器22将目标语言对应的文本字符传送给移动终端21;
S106:移动终端21将目标语言对应的文本字符发送给第二服务器23;
S107:第二服务器接收移动终端21发送的目标语言对应的文本字符,并基于目标语言对应的文本字符获得目标语言语音;
S108:第二服务器23将目标语言语音传送给移动终端21;
S109:移动终端21将目标语言语音传送给扩音组件11;
S110:扩音组件11对目标语言语音进行播报。
在本发明的一些实施例中,控制单元111包括:一个或多个第一处理器111a以及第一存储器111b,图2中以一个第一处理器111a为例。
第一处理器111a和第一存储器111b可以通过总线或者其他方式连接,图2中以通过总线连接为例。
第一存储器111b作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的导游语音翻译方法对应的程序指令/单元。第一处理器111a通过运行存储在第一存储器111b中的非易失性软件程序、指令以及单元,从而执行扩音组件11的各种功能应用以及数据处理,即实现上述方法实施例导游语音翻译方法。
第一存储器111b可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据扩音组件11使用所创建的数据等。此外,第一存储器111b可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,第一存储器111b可选包括相对于第一处理器111a远程设置的存储器,这些远程存储器可以通过网络连接至扩音组件11。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述第一存储器111b中,当被所述一个或者多个第一处理器111a执行时,执行上述任意方法实施例中的导游语音翻译方法,例如,执行以上描述的图3中的方法步骤S11-S13。
上述扩音组件11可执行本申请实施例所提供的导游语音翻译方法,具备执行方法相应的功能模块和有益效果。未在扩音组件11实施例中详尽描述的技术细节,可参见本申请实施例所提供的导游语音翻译方法。
本申请实施例提供了一种非易失性计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如,执行以上描述的图3中的方法步骤S11-S13、图4中的方法步骤S201-S204。
本申请实施例还提供了一种导游用翻译系统,包括移动终端21、导游用麦克风12、游客用麦克风13、以及上述任一实施例中描述的扩音组件11。其中,移动终端21包括:至少一个第二处理器与第二存储器,所述第二存储器存储有可被所述至少一个第二处理器执行的指令,所述指令被所述至少一个第二处理器执行,以使所述至少一个第二处理器能够执行上述导游语音翻译方法。例如,执行以上描述的图4中的方法步骤S201-S204。
本发明另一实施例提供的导游用翻译系统包括移动终端21、第一服务器22和其二服务器23、导游用麦克风12、游客用麦克风13、以及上述任一实施例中描述的扩音组件11。
移动终端21用于:接收导游用翻译扩音器传送的音频数据,并将音频数据传送第一服务器;接收第一服务器发送的目标语言对应的文本字符,并将所述文本字符发送第二服务器;接收第二服务器发送的目标语言语音;
第一服务器22用于执行:接收所述移动终端发送的音频数据,并基于所述音频数据进行文字识别获得所述音频数据对应的文本字符;将所述文本字符翻译成目标语言对应的文本字符;
第二服务器23用于执行:接收所述移动终端发送的目标语言对应的文本字符,并基于目标语言对应的文本字符获得目标语言语音。
上述移动终端21、第一服务器22和第二服务器23执行的步骤可以通过执行软件程序指令的方式来实现,各自在移动终端21、第一服务器22和第二服务器23对应的硬件设备内部设置至少一个处理器和与所述至少一个处理器通信连接的存储器。在存储器内存储可被处理器执行的指令,该指令被处理器执行时,即执行上述各个步骤。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施例的描述,本领域普通技术人员可以清楚地了解到各实施例可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请的不同方面的许多其它变化,为了简明,它们没有在细节中提供;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。