CN107885731A - 语音翻译方法和装置 - Google Patents

语音翻译方法和装置 Download PDF

Info

Publication number
CN107885731A
CN107885731A CN201711078885.7A CN201711078885A CN107885731A CN 107885731 A CN107885731 A CN 107885731A CN 201711078885 A CN201711078885 A CN 201711078885A CN 107885731 A CN107885731 A CN 107885731A
Authority
CN
China
Prior art keywords
bluetooth earphone
translation
bluetooth
instruction
voice messaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711078885.7A
Other languages
English (en)
Inventor
郑勇
王文祺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Water World Co Ltd
Original Assignee
Shenzhen Water World Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Water World Co Ltd filed Critical Shenzhen Water World Co Ltd
Priority to CN201711078885.7A priority Critical patent/CN107885731A/zh
Publication of CN107885731A publication Critical patent/CN107885731A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

本发明揭示了一种语音翻译方法和装置,所述方法包括以下步骤:与第一蓝牙耳机建立连接;接收第一蓝牙耳机发送的语音信息,并对语音信息进行翻译处理;断开与第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接;将翻译处理后的语音信息发送给第二蓝牙耳机。从而,利用翻译机的半双工交互特点,通过翻译机在两个蓝牙耳机之间的分时切换连接,实现了翻译机与两个蓝牙耳机的分时通信,达到了不同语言的语音互译的目的。本发明实施例只需两个普通的蓝牙耳机与翻译机配合就能实现语音翻译,无需将普通的蓝牙耳机改进为专门的蓝牙翻译耳机,既降低了实现成本又扩展了应用范围,并降低了用户的使用成本,提升了用户体验。

Description

语音翻译方法和装置
技术领域
本发明涉及电子技术领域,特别是涉及到一种语音翻译方法和装置。
背景技术
目前,两个说不同语言的用户交流时,可以通过翻译机进行翻译,从而实现无障碍交流。为了增加私密性,两个用户可以分别佩戴一个蓝牙耳机,翻译机与蓝牙耳机建立连接,就可以实现两个用户的私密交谈。
现有技术中,与翻译机连接的蓝牙耳机必须是专门的蓝牙翻译耳机,才能实现上述翻译过程。蓝牙翻译耳机是在普通的蓝牙耳机基础上改进而成的,一种改进方式是修改普通的蓝牙耳机的蓝牙协议,另一种修改方式是为普通的蓝牙耳机增加特殊的硬件,无论哪种方式无疑都增加了实现成本。而且用户必须专门购买蓝牙翻译耳机,无法使用通用的蓝牙耳机,限制了翻译机的应用范围,提高了用户的使用成本,用户体验不佳。
发明内容
本发明的主要目的为提供一种语音翻译方法和装置,旨在降低语音翻译的实现成本,扩展应用范围。
为达以上目的,本发明实施例提出一种语音翻译方法,所述方法包括以下步骤:
与第一蓝牙耳机建立连接;
接收所述第一蓝牙耳机发送的语音信息,并对所述语音信息进行翻译处理;
断开与所述第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接;
将翻译处理后的语音信息发送给所述第二蓝牙耳机。
可选地,所述与第一蓝牙耳机建立连接的步骤包括:
判断是否接收到第一指令;
当接收到所述第一指令时,与第一蓝牙耳机建立连接。
可选地,所述判断是否接收到所述第一指令的步骤包括:
检测第一按键是否被触发;
当所述第一按键被触发时,判决接收到所述第一指令。
可选地,所述断开与所述第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接的步骤包括:
判断是否接收到第二指令;
当接收到所述第二指令时,与所述第一蓝牙耳机断开连接,并与第二蓝牙耳机建立连接。
可选地,所述判断是否接收到所述第二指令的步骤包括:
检测第二按键是否被触发;
当所述第二按键被触发时,判决接收到所述第二指令。
可选地,所述断开与所述第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接的步骤包括:
检测所述第一蓝牙耳机是否已停止发送所述语音信息;
当所述第一蓝牙耳机停止发送所述语音信息时,断开与所述第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接。
可选地,所述检测所述第一蓝牙耳机是否已停止发送所述语音信息的步骤包括:
判断是否超过预设时间未接收到所述第一蓝牙耳机发送的语音信息;
当超过预设时间未接收到所述第一蓝牙耳机发送的语音信息时,判决所述第一蓝牙耳机已停止发送所述语音信息。
可选地,所述预设时间为2-5秒。
本发明实施例同时提出一种语音翻译装置,所述装置包括:
第一连接模块,用于与第一蓝牙耳机建立连接;
处理模块,用于接收所述第一蓝牙耳机发送的语音信息,并对所述语音信息进行翻译处理;
第二连接模块,用于断开与所述第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接;
发送模块,用于将翻译处理后的语音信息发送给所述第二蓝牙耳机。
可选地,所述第一连接模块包括:
第一判断单元,用于判断是否接收到第一指令;
第一连接单元,用于当接收到所述第一指令时,与第一蓝牙耳机建立连接。
可选地,所述第一判断单元包括:
第一检测子单元,用于检测第一按键是否被触发;
第一判决子单元,用于当所述第一按键被触发时,判决接收到所述第一指令。
可选地,所述第二连接模块包括:
第二判断单元,用于判断是否接收到第二指令;
第二连接单元,用于当接收到所述第二指令时,与所述第一蓝牙耳机断开连接,并与第二蓝牙耳机建立连接。
可选地,所述第二判断单元包括:
第二检测子单元,用于检测第二按键是否被触发;
第二判决子单元,用于当所述第二按键被触发时,判决接收到所述第二指令。
可选地,所述第二连接模块包括:
发送检测单元,用于检测所述第一蓝牙耳机是否已停止发送所述语音信息;
第三连接单元,用于当所述第一蓝牙耳机停止发送所述语音信息时,断开与所述第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接。
可选地,所述发送检测单元包括:
接收判断子单元,用于判断是否超过预设时间未接收到所述第一蓝牙耳机发送的语音信息;
停止判决子单元,用于当超过预设时间未接收到所述第一蓝牙耳机发送的语音信息时,判决所述第一蓝牙耳机已停止发送所述语音信息。
本发明实施例还提出一种翻译机,其包括存储器、处理器和至少一个被存储在所述存储器中并被配置为由所述处理器执行的应用程序,所述应用程序被配置为用于执行前述语音翻译方法。
本发明实施例所提供的一种语音翻译方法,利用翻译机的半双工交互特点,通过翻译机在两个蓝牙耳机之间的分时切换连接,实现了翻译机与两个蓝牙耳机的分时通信,达到了不同语言的语音互译的目的。本发明实施例只需两个普通的蓝牙耳机与翻译机配合就能实现语音翻译,无需将普通的蓝牙耳机改进为专门的蓝牙翻译耳机,既降低了实现成本又扩展了应用范围,并降低了用户的使用成本,提升了用户体验。同时,翻译机与蓝牙耳机的连接切换时间短于语音信息的翻译处理时间,即连接切换操作无需额外的等待时间,因此连接切换操作不会影响语音信息的输出,不会产生额外的输出时延,保证用户体验不受影响。
附图说明
图1是本发明的语音翻译方法第一实施例的流程图;
图2是本发明的语音翻译方法第二实施例的流程图;
图3是本发明的语音翻译装置一实施例的模块示意图;
图4是图3中的第一连接模块的模块示意图;
图5是图4中的第一判断单元的模块示意图;
图6是图3中的第二连接模块的模块示意图;
图7是图6中的第二判断单元的模块示意图;
图8是图3中的第二连接模块的又一模块示意图;
图9是图8中的发送检测单元的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本技术领域技术人员可以理解,这里所使用的服务器,其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本发明的实施例中,服务器、终端设备与WNS服务器之间可通过任何通信方式实现通信,包括但不限于,基于3GPP、LTE、WIMAX的移动通信、基于TCP/IP、UDP协议的计算机网络通信以及基于蓝牙、红外传输标准的近距无线传输方式。
本发明实施例的语音翻译方法和装置,主要应用于翻译机,当然也可以应用于其它的终端设备,如手机、平板等移动终端。以下以应用于翻译机为例进行详细说明。
参照图1,提出本发明的语音翻译方法第一实施例,所述方法包括以下步骤:
S11、与第一蓝牙耳机建立连接。
本发明实施例中,翻译机为支持移动通信(如4G)、蓝牙、WIFI等连接技术的终端设备,它通过4G和WIFI等无线连接技术与远程的语音识别、翻译、合成等服务器引擎进行交互,实现不同语言的互译和语音输出,采用半双工的人机语音交互方式,同一时刻,翻译机的语音只能处于输入或输出一个状态。
翻译机开启蓝牙,分别与两个蓝牙耳机建立配对,翻译机可以在用户界面上显示蓝牙已配对的设备列表,方便用户查看。配对成功后,翻译机则与欲发言的用户佩戴的第一蓝牙耳机建立连接。
可选地,翻译机判断是否接收到第一指令,当接收到第一指令时,翻译机即与第一蓝牙耳机建立连接。在具体实施时,可以为翻译机设置第一按键,该第一按键可以是实体按键或虚拟按键,翻译机检测第一按键是否被触发,当检测到第一按键被触发时,则判决接收到第一指令。
此外,第一指令也可以是手势动作、语音命令等,翻译机通过摄像头捕捉手势动作或通过麦克风采集语音命令,当捕捉到特定的手势动作或采集到特定的语音命令时,则判决接收到第一指令。
除了通过接收第一指令的方式与第一蓝牙耳机建立连接外,还可以采用现有技术中的其它方式,例如,翻译机可以将最先建立配对的蓝牙耳机作为第一蓝牙耳机,首先与其建立连接。本发明对此不再一一列举赘述。
S12、接收第一蓝牙耳机发送的语音信息,并对语音信息进行翻译处理。
翻译机与第一蓝牙耳机建立连接后,第一蓝牙耳机则采集用户的语音信息,并将语音信息以PCM(Pulse-Code Modulation,脉冲编码调制)码流的形式发送给翻译机。翻译机接收第一蓝牙耳机发送的语音信息,并对该语音信息进行翻译处理。
具体的,翻译机接收第一蓝牙耳机发送的语音信息并存储,通过4G、WIFI等无线网络与语音识别、翻译、合成服务器建立HTTP连接,并将语音信息依次传输给语音识别、翻译、合成服务器处理,得到另一种语言的语音码流。整个翻译处理的时间(包括处理的时间和网络传输时延)大概在2秒左右。
例如,翻译机首先将语音信息发送给语音识别服务器,语音识别服务器将语音信息识别为第一语言的字符串后返回给翻译机;翻译机接收第一语言的字符串并发送给翻译服务器,翻译服务器将第一语言的字符串翻译为第二语言的字符串并返回给翻译机;翻译机接收第二语言的字符串并发送给合成服务器,合成服务器将第二语言的字符串语音合成为第二语言的语音码流并返回给翻译机。翻译机接收第二语言的语音码流,该语音码流即为翻译处理后的语音信息。
在其它实施例中,翻译机也可以在本地对语音信息进行语音识别、翻译和合成处理。整个翻译处理的时间也大概在2秒左右。
S13、断开与第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接。
当第一蓝牙耳机侧的用户发言完毕,或者第二蓝牙耳机侧的用户想要发言时,翻译机则断开与第一蓝牙耳机的连接,切换为与第二蓝牙耳机建立连接。翻译机在进行连接切换的同时还在翻译处理最后一部分语音信息,而整个连接切换过程只需要1秒左右,短于2秒左右的语音信息的翻译处理时间,因此不会额外增加等待时间。
可选地,翻译机判断是否接收到第二指令,当接收到第二指令时,则与第一蓝牙耳机断开连接,并与第二蓝牙耳机建立连接。在具体实施时,可以为翻译机设置第二按键,该第二按键可以是实体按键或虚拟按键,翻译机检测第二按键是否被触发,当检测到第二按键被触发时,则判决接收到第二指令。采用这种方式,第二蓝牙耳机侧的用户可以在需要的时候随时介入发言,无需等待第一蓝牙耳机侧的用户发言完毕才能介入,灵活性较高。
在某些实施例中,当第一按键被按下时,翻译机判决接收到第一指令,当第一按键被释放时,翻译机判决接收到第二指令;或者当第一按键被首次触发时,翻译机判决接收到第一指令,当第一按键被再次触发时,翻译机判决接收到第二指令。
在另一些实施例中,翻译机判断是否检测到特定的语音命令,当检测到特定的语音命令时,则判决接收到第二指令。所述语音命令如“完毕”、“结束”等关键词,用户可以在发言完毕时在结尾说出前述关键词。为了防止误判,翻译机确定上述关键词在句尾时才判定为语音命令,如在检测到上述关键词后超过预设时间(如2-5秒)未继续接收到语音信息时,则判决接收到第二指令。
可选地,翻译机检测第一蓝牙耳机是否已停止发送语音信息,当检测到第一蓝牙耳机停止发送语音信息时,则断开与第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接。具体实施时,翻译机判断是否超过预设时间未接收到第一蓝牙耳机发送的语音信息,当超过预设时间未接收到第一蓝牙耳机发送的语音信息时,则判决第一蓝牙耳机已停止发送语音信息。
考虑到用户在连续发言过程中,中间的停顿一般不会超过2-5秒,超过这个时间一般可以认为发言完毕,因此可以将预设时间设置为2-5秒,当然也可以根据实际需要进行调整。
本领域技术人员可以理解,除此之外还可以采用现有技术中的其它方式进行连接切换,本发明对此不再一一列举赘述。
S14、将翻译处理后的语音信息发送给第二蓝牙耳机。
当与第二蓝牙耳机建立连接后,翻译机则将翻译处理后的语音信息以语音码流的方式发送给第二蓝牙耳机,第二蓝牙耳机接收翻译处理后的语音信息并输出,从而完成了一次语音翻译流程。
当第二蓝牙耳机输出翻译处理后的语音信息完毕后,第二蓝牙耳机侧的用户可以发言,此时第二蓝牙耳机则转换为第一蓝牙耳机,返回步骤S12,向翻译机发送语音信息。当然,第二蓝牙耳机侧的用户也可以不发言,继续由第一蓝牙耳机侧的用户发言,则返回步骤S11,断开与第二蓝牙耳机的连接,转而切换为与第一蓝牙耳机建立连接。
参照图2,提出本发明的语音翻译方法第二实施例,所述方法包括以下步骤:
S21、翻译机与蓝牙耳机A建立连接。
佩戴蓝牙耳机A的用户A触发按键A,翻译机检测到按键A被触发时,则与蓝牙耳机A建立连接。
S22、蓝牙耳机A采集用户A的语音信息,并发送给翻译机。
S23、翻译机接收蓝牙耳机A发送的语音信息,并对语音信息进行翻译处理。
S24、翻译机断开与蓝牙耳机A的连接,与蓝牙耳机B建立连接。
可选地,用户A发言完毕后,则释放被按压的按键A或者再次按压按键A使得按键A被再次触发,翻译机检测到按键A被再次触发时,则断开与蓝牙耳机A的连接,转而与蓝牙耳机B建立连接。
可选地,用户A发言完毕后或在发言过程中,佩戴蓝牙耳机B的用户B触发按键B,翻译机检测到按键B被触发时,则断开与蓝牙耳机A的连接,转而与蓝牙耳机B建立连接。
S25、翻译机将翻译处理后的语音信息发送给蓝牙耳机B。
S26、蓝牙耳机B接收翻译处理后的语音信息并予以输出。
S27、蓝牙耳机B采集用户B的语音信息,并发送给翻译机。
S28、翻译机接收蓝牙耳机B发送的语音信息,并对语音信息进行翻译处理。
S29、翻译机断开与蓝牙耳机B的连接,与蓝牙耳机A建立连接。
可选地,用户B发言完毕后,则释放被按压的按键B或者再次按压按键B使得按键B被再次触发,翻译机检测到按键B被再次触发时,则断开与蓝牙耳机B的连接,转而与蓝牙耳机A建立连接。
可选地,用户B发言完毕后或在发言过程中,佩戴蓝牙耳机A的用户A触发按键A,翻译机检测到按键A被触发时,则断开与蓝牙耳机B的连接,转而与蓝牙耳机A建立连接。
S30、翻译机将翻译处理后的语音信息发送给蓝牙耳机A。
S31、蓝牙耳机A接收翻译处理后的语音信息并予以输出。
从而,用户A和用户B完成了一轮语音交流过程,翻译机完成了一轮语音交互翻译流程,重复上述步骤,即可以实现多轮语音交互翻译过程。
本发明实施例的语音翻译方法,利用翻译机的半双工交互特点,通过翻译机在两个蓝牙耳机之间的分时切换连接,实现了翻译机与两个蓝牙耳机的分时通信,达到了不同语言的语音互译的目的。本发明实施例只需两个普通的蓝牙耳机与翻译机配合就能实现语音翻译,无需将普通的蓝牙耳机改进为专门的蓝牙翻译耳机,既降低了实现成本又扩展了应用范围,并降低了用户的使用成本,提升了用户体验。同时,翻译机与蓝牙耳机的连接切换时间短于语音信息的翻译处理时间,即连接切换操作无需额外的等待时间,因此连接切换操作不会影响语音信息的输出,不会产生额外的输出时延,保证用户体验不受影响。
参照图3,提出本发明的语音翻译装置一实施例,所述装置包括第一连接模块10、处理模块20、第二连接模块30和发送模块40,其中:第一连接模块10,用于与第一蓝牙耳机建立连接;处理模块20,用于接收第一蓝牙耳机发送的语音信息,并对语音信息进行翻译处理;第二连接模块30,用于断开与第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接;发送模块40,用于将翻译处理后的语音信息发送给第二蓝牙耳机。
翻译机开启蓝牙,分别与两个蓝牙耳机建立配对,翻译机可以在用户界面上显示蓝牙已配对的设备列表,方便用户查看。配对成功后,第一连接模块10则与欲发言的用户佩戴的第一蓝牙耳机建立连接。
可选地,如图4所示,第一连接模块10包括第一判断单元11和第一连接单元12,其中:第一判断单元11,用于判断是否接收到第一指令;第一连接单元12,用于当接收到第一指令时,与第一蓝牙耳机建立连接。
在具体实施时,可以为翻译机设置第一按键,该第一按键可以是实体按键或虚拟按键,此时,第一判断单元11如图5所示,包括第一检测子单元111和第一判决子单元112,其中:第一检测子单元111,用于检测第一按键是否被触发;第一判决子单元112,用于当第一按键被触发时,判决接收到第一指令。
此外,第一指令也可以是手势动作、语音命令等,第一判断单元11通过摄像头捕捉手势动作或通过麦克风采集语音命令,当捕捉到特定的手势动作或采集到特定的语音命令时,则判决接收到第一指令。
除了通过接收第一指令的方式与第一蓝牙耳机建立连接外,还可以采用现有技术中的其它方式,例如,第一连接模块10可以将最先建立配对的蓝牙耳机作为第一蓝牙耳机,首先与其建立连接。本发明对此不再一一列举赘述。
第一连接模块10与第一蓝牙耳机建立连接后,第一蓝牙耳机则采集用户的语音信息,并将语音信息以PCM码流的形式发送给翻译机。处理模块20接收第一蓝牙耳机发送的语音信息,并对该语音信息进行翻译处理。
具体的,处理模块20接收第一蓝牙耳机发送的语音信息并存储,通过4G、WIFI等无线网络与语音识别、翻译、合成服务器建立HTTP连接,并将语音信息依次传输给语音识别、翻译、合成服务器处理,得到另一种语言的语音码流。整个翻译处理的时间(包括处理的时间和网络传输时延)大概在2秒左右。
例如,处理模块20首先将语音信息发送给语音识别服务器,语音识别服务器将语音信息识别为第一语言的字符串后返回给翻译机;处理模块20接收第一语言的字符串并发送给翻译服务器,翻译服务器将第一语言的字符串翻译为第二语言的字符串并返回给翻译机;处理模块20接收第二语言的字符串并发送给合成服务器,合成服务器将第二语言的字符串语音合成为第二语言的语音码流并返回给翻译机。处理模块20接收第二语言的语音码流,该语音码流即为翻译处理后的语音信息。
在其它实施例中,处理模块20也可以在本地对语音信息进行语音识别、翻译和合成处理。整个翻译处理的时间也大概在2秒左右。
当第一蓝牙耳机侧的用户发言完毕,或者第二蓝牙耳机侧的用户想要发言时,第二连接模块30则断开与第一蓝牙耳机的连接,切换为与第二蓝牙耳机建立连接。第二连接模块30在进行连接切换的同时,处理模块20还在翻译处理最后一部分语音信息,而整个连接切换过程只需要1秒左右,短于2秒左右的语音信息的翻译处理时间,因此不会额外增加等待时间。
可选地,如图6所示,第二连接模块30包括第二判断单元31和第二连接单元32,其中:第二判断单元31,用于判断是否接收到第二指令;第二连接单元32,用于当接收到第二指令时,与第一蓝牙耳机断开连接,并与第二蓝牙耳机建立连接。
在具体实施时,可以为翻译机设置第二按键,该第二按键可以是实体按键或虚拟按键,此时,第二判断单元31如图7所示,包括第二检测子单元311和第二判决子单元312,其中:第二检测子单元311,用于检测第二按键是否被触发;第二判决子单元312,用于当所述第二按键被触发时,判决接收到第二指令。采用这种方式,第二蓝牙耳机侧的用户可以在需要的时候随时介入发言,无需等待第一蓝牙耳机侧的用户发言完毕才能介入,灵活性较高。
在某些实施例中,当第一按键被按下时,第一判断单元11则判决接收到第一指令,当第一按键被释放时,第二判断单元31则判决接收到第二指令;或者当第一按键被首次触发时,第一判断单元11则判决接收到第一指令,当第一按键被再次触发时,第二判断单元31则判决接收到第二指令。
在另一些实施例中,第二判断单元31判断是否检测到特定的语音命令,当检测到特定的语音命令时,则判决接收到第二指令。所述语音命令如“完毕”、“结束”等关键词,用户可以在发言完毕时在结尾说出前述关键词。为了防止误判,第二判断单元31确定上述关键词在句尾时才判定为语音命令,如在检测到上述关键词后超过预设时间(如2-5秒)未继续接收到语音信息时,则判决接收到第二指令。
可选地,如图8所示,第二连接模块30包括发送检测单元33和第三连接单元34,其中:发送检测单元33,用于检测第一蓝牙耳机是否已停止发送语音信息;第三连接单元34,用于当第一蓝牙耳机停止发送语音信息时,断开与第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接。
发送检测单元33如图9所示,包括接收判断子单元331和停止判决子单元332,其中:接收判断子单元331,用于判断是否超过预设时间未接收到第一蓝牙耳机发送的语音信息;停止判决子单元332,用于当超过预设时间未接收到第一蓝牙耳机发送的语音信息时,判决第一蓝牙耳机已停止发送语音信息。
考虑到用户在连续发言过程中,中间的停顿一般不会超过2-5秒,超过这个时间一般可以认为发言完毕,因此可以将预设时间设置为2-5秒,当然也可以根据实际需要进行调整。
本领域技术人员可以理解,除此之外还可以采用现有技术中的其它方式进行连接切换,本发明对此不再一一列举赘述。
当与第二蓝牙耳机建立连接后,发送模块40则将翻译处理后的语音信息以语音码流的方式发送给第二蓝牙耳机,第二蓝牙耳机接收翻译处理后的语音信息并输出,从而完成了一次语音翻译流程。
当第二蓝牙耳机输出翻译处理后的语音信息完毕后,第二蓝牙耳机侧的用户可以发言,此时第二蓝牙耳机则转换为第一蓝牙耳机,向翻译机发送语音信息。当然,第二蓝牙耳机侧的用户也可以不发言,继续由第一蓝牙耳机侧的用户发言,此时第一连接模块10则断开与第二蓝牙耳机的连接,转而切换为与第一蓝牙耳机建立连接。
本发明实施例的语音翻译装置,利用翻译机的半双工交互特点,通过翻译机在两个蓝牙耳机之间的分时切换连接,实现了翻译机与两个蓝牙耳机的分时通信,达到了不同语言的语音互译的目的。本发明实施例只需两个普通的蓝牙耳机与翻译机配合就能实现语音翻译,无需将普通的蓝牙耳机改进为专门的蓝牙翻译耳机,既降低了实现成本又扩展了应用范围,并降低了用户的使用成本,提升了用户体验。同时,翻译机与蓝牙耳机的连接切换时间短于语音信息的翻译处理时间,即连接切换操作无需额外的等待时间,因此连接切换操作不会影响语音信息的输出,不会产生额外的输出时延,保证用户体验不受影响。
本发明同时提出一种翻译机,其包括存储器、处理器和至少一个被存储在存储器中并被配置为由处理器执行的应用程序,所述应用程序被配置为用于执行语音翻译方法。所述语音翻译方法包括以下步骤:与第一蓝牙耳机建立连接;接收第一蓝牙耳机发送的语音信息,并对语音信息进行翻译处理;断开与第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接;将翻译处理后的语音信息发送给第二蓝牙耳机。本实施例中所描述的语音翻译方法为本发明中上述实施例所涉及的语音翻译方法,在此不再赘述。
本领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随机存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable ProgrammableRead-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种语音翻译方法,其特征在于,包括以下步骤:
与第一蓝牙耳机建立连接;
接收所述第一蓝牙耳机发送的语音信息,并对所述语音信息进行翻译处理;
断开与所述第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接;
将翻译处理后的语音信息发送给所述第二蓝牙耳机。
2.根据权利要求1所述的语音翻译方法,其特征在于,所述与第一蓝牙耳机建立连接的步骤包括:
判断是否接收到第一指令;
当接收到所述第一指令时,与第一蓝牙耳机建立连接。
3.根据权利要求2所述的语音翻译方法,其特征在于,所述判断是否接收到所述第一指令的步骤包括:
检测第一按键是否被触发;
当所述第一按键被触发时,判决接收到所述第一指令。
4.根据权利要求1所述的语音翻译方法,其特征在于,所述断开与所述第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接的步骤包括:
判断是否接收到第二指令;
当接收到所述第二指令时,与所述第一蓝牙耳机断开连接,并与第二蓝牙耳机建立连接。
5.根据权利要求4所述的语音翻译方法,其特征在于,所述判断是否接收到所述第二指令的步骤包括:
检测第二按键是否被触发;
当所述第二按键被触发时,判决接收到所述第二指令。
6.一种语音翻译装置,其特征在于,包括:
第一连接模块,用于与第一蓝牙耳机建立连接;
处理模块,用于接收所述第一蓝牙耳机发送的语音信息,并对所述语音信息进行翻译处理;
第二连接模块,用于断开与所述第一蓝牙耳机的连接,并与第二蓝牙耳机建立连接;
发送模块,用于将翻译处理后的语音信息发送给所述第二蓝牙耳机。
7.根据权利要求6所述的语音翻译装置,其特征在于,所述第一连接模块包括:
第一判断单元,用于判断是否接收到第一指令;
第一连接单元,用于当接收到所述第一指令时,与第一蓝牙耳机建立连接。
8.根据权利要求7所述的语音翻译装置,其特征在于,所述第一判断单元包括:
第一检测子单元,用于检测第一按键是否被触发;
第一判决子单元,用于当所述第一按键被触发时,判决接收到所述第一指令。
9.根据权利要求8所述的语音翻译装置,其特征在于,所述第二连接模块包括:
第二判断单元,用于判断是否接收到第二指令;
第二连接单元,用于当接收到所述第二指令时,与所述第一蓝牙耳机断开连接,并与第二蓝牙耳机建立连接。
10.根据权利要求9所述的语音翻译装置,其特征在于,所述第二判断单元包括:
第二检测子单元,用于检测第二按键是否被触发;
第二判决子单元,用于当所述第二按键被触发时,判决接收到所述第二指令。
CN201711078885.7A 2017-11-06 2017-11-06 语音翻译方法和装置 Pending CN107885731A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711078885.7A CN107885731A (zh) 2017-11-06 2017-11-06 语音翻译方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711078885.7A CN107885731A (zh) 2017-11-06 2017-11-06 语音翻译方法和装置

Publications (1)

Publication Number Publication Date
CN107885731A true CN107885731A (zh) 2018-04-06

Family

ID=61778871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711078885.7A Pending CN107885731A (zh) 2017-11-06 2017-11-06 语音翻译方法和装置

Country Status (1)

Country Link
CN (1) CN107885731A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108922537A (zh) * 2018-05-28 2018-11-30 Oppo广东移动通信有限公司 音频识别方法、装置、终端、耳机及可读存储介质
CN109217897A (zh) * 2018-09-29 2019-01-15 与德科技有限公司 一种语音处理装置和语音处理方法
CN109446533A (zh) * 2018-09-17 2019-03-08 深圳市沃特沃德股份有限公司 蓝牙翻译机、蓝牙翻译的交互方式及其装置
CN109618258A (zh) * 2018-12-10 2019-04-12 深圳市友杰智新科技有限公司 一种蓝牙耳机的语音实时翻译方法及系统
WO2019084962A1 (zh) * 2017-11-06 2019-05-09 深圳市沃特沃德股份有限公司 语音翻译方法、装置和翻译机
CN110069788A (zh) * 2019-04-04 2019-07-30 上海易景信息科技有限公司 基于蓝牙的通信装置、在线翻译系统及方法
CN110365371A (zh) * 2019-07-05 2019-10-22 深圳市声临科技有限公司 基于蓝牙设备提供触发信号实现翻译系统控制的方法及其系统、电子设备
CN110765786A (zh) * 2019-10-12 2020-02-07 深圳情景智能有限公司 翻译系统、耳机翻译方法及翻译设备
WO2020078267A1 (zh) * 2018-10-15 2020-04-23 华为技术有限公司 在线翻译过程中的语音数据处理方法及装置
WO2021031290A1 (zh) * 2019-08-22 2021-02-25 歌尔股份有限公司 一种用于耳机对的翻译方法、装置、耳机对及翻译系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1602483A (zh) * 2001-12-17 2005-03-30 内维尼·加雅拉特尼 进行多语种口述词语实时翻译的实时翻译装置与方法
CN102547486A (zh) * 2011-01-04 2012-07-04 上海华勤通讯技术有限公司 蓝牙耳机对讲系统
WO2013163293A1 (en) * 2012-04-25 2013-10-31 Kopin Corporation Instant translation system
CN104540175A (zh) * 2014-11-26 2015-04-22 青岛歌尔声学科技有限公司 一种不间断蓝牙连接的切换方法、蓝牙设备和系统
CN105101058A (zh) * 2015-07-13 2015-11-25 惠州Tcl移动通信有限公司 多个蓝牙耳机协同工作的实现方法及设备
CN106911857A (zh) * 2017-03-08 2017-06-30 青岛中云时代信息技术有限公司 一种语音数据交互方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1602483A (zh) * 2001-12-17 2005-03-30 内维尼·加雅拉特尼 进行多语种口述词语实时翻译的实时翻译装置与方法
CN102547486A (zh) * 2011-01-04 2012-07-04 上海华勤通讯技术有限公司 蓝牙耳机对讲系统
WO2013163293A1 (en) * 2012-04-25 2013-10-31 Kopin Corporation Instant translation system
CN104540175A (zh) * 2014-11-26 2015-04-22 青岛歌尔声学科技有限公司 一种不间断蓝牙连接的切换方法、蓝牙设备和系统
CN105101058A (zh) * 2015-07-13 2015-11-25 惠州Tcl移动通信有限公司 多个蓝牙耳机协同工作的实现方法及设备
CN106911857A (zh) * 2017-03-08 2017-06-30 青岛中云时代信息技术有限公司 一种语音数据交互方法及装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019084962A1 (zh) * 2017-11-06 2019-05-09 深圳市沃特沃德股份有限公司 语音翻译方法、装置和翻译机
CN108922537A (zh) * 2018-05-28 2018-11-30 Oppo广东移动通信有限公司 音频识别方法、装置、终端、耳机及可读存储介质
CN108922537B (zh) * 2018-05-28 2021-05-18 Oppo广东移动通信有限公司 音频识别方法、装置、终端、耳机及可读存储介质
CN109446533A (zh) * 2018-09-17 2019-03-08 深圳市沃特沃德股份有限公司 蓝牙翻译机、蓝牙翻译的交互方式及其装置
CN109446533B (zh) * 2018-09-17 2020-12-22 深圳市沃特沃德股份有限公司 蓝牙翻译机、蓝牙翻译的交互方式及其装置
CN109217897A (zh) * 2018-09-29 2019-01-15 与德科技有限公司 一种语音处理装置和语音处理方法
WO2020078267A1 (zh) * 2018-10-15 2020-04-23 华为技术有限公司 在线翻译过程中的语音数据处理方法及装置
CN109618258A (zh) * 2018-12-10 2019-04-12 深圳市友杰智新科技有限公司 一种蓝牙耳机的语音实时翻译方法及系统
CN110069788A (zh) * 2019-04-04 2019-07-30 上海易景信息科技有限公司 基于蓝牙的通信装置、在线翻译系统及方法
CN110365371A (zh) * 2019-07-05 2019-10-22 深圳市声临科技有限公司 基于蓝牙设备提供触发信号实现翻译系统控制的方法及其系统、电子设备
WO2021031290A1 (zh) * 2019-08-22 2021-02-25 歌尔股份有限公司 一种用于耳机对的翻译方法、装置、耳机对及翻译系统
CN110765786A (zh) * 2019-10-12 2020-02-07 深圳情景智能有限公司 翻译系统、耳机翻译方法及翻译设备
CN110765786B (zh) * 2019-10-12 2023-11-03 深圳动听汽车经纪有限公司 翻译系统、耳机翻译方法及翻译设备

Similar Documents

Publication Publication Date Title
CN107885731A (zh) 语音翻译方法和装置
CN107885732A (zh) 语音翻译方法、系统和装置
CN108090052A (zh) 语音翻译方法和装置
CN108989552B (zh) 屏幕点亮方法、双屏移动终端和计算机可读存储介质
CN107343113A (zh) 语音通话方法和装置
US20180203850A1 (en) Method for Multilingual Translation in Network Voice Communications
CN106406931A (zh) 应用程序中直播间快捷启动方法、装置及终端设备
EP1349361A3 (en) Image data processing system
WO2007047056A3 (en) Improved method, apparatus, and system for transfering data between mobile telephones and other digital devices
CN108538289A (zh) 基于蓝牙实现语音遥控的方法、装置和终端设备
CN106982286B (zh) 一种录音方法、设备和计算机可读存储介质
CN105975063B (zh) 一种控制智能终端的方法和装置
WO2018214314A1 (zh) 同声翻译的实现方法和装置
CN105872444A (zh) 一种视频通话方法、装置及系统
CN107168959A (zh) 翻译方法和翻译系统
CN106507286A (zh) 一种文件传输方法、源设备和非源设备
WO2005125164A2 (en) Audio session management system and method for a mobile communication device
KR20150021707A (ko) 동시 통역 단말기
CN105551491A (zh) 语音识别方法和设备
CN101147340A (zh) 一键通通信系统及一键通通信方法
CN107656923A (zh) 语音翻译方法和装置
CN104322139A (zh) 终端、服务器和信息推送方法
CN108712271A (zh) 翻译方法和翻译装置
JP2016139952A (ja) ハイブリッド端末
CN107341148A (zh) 翻译方法、翻译设备及翻译系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180406

RJ01 Rejection of invention patent application after publication