CN111739538A - 一种翻译方法、装置、耳机和服务器 - Google Patents

一种翻译方法、装置、耳机和服务器 Download PDF

Info

Publication number
CN111739538A
CN111739538A CN202010508210.7A CN202010508210A CN111739538A CN 111739538 A CN111739538 A CN 111739538A CN 202010508210 A CN202010508210 A CN 202010508210A CN 111739538 A CN111739538 A CN 111739538A
Authority
CN
China
Prior art keywords
earphone
voice data
user
server
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010508210.7A
Other languages
English (en)
Other versions
CN111739538B (zh
Inventor
王颖
李健涛
张丹
刘宝
张硕
杨天府
梁宵
荣河江
李鹏翀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202010508210.7A priority Critical patent/CN111739538B/zh
Publication of CN111739538A publication Critical patent/CN111739538A/zh
Application granted granted Critical
Publication of CN111739538B publication Critical patent/CN111739538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1091Details not provided for in groups H04R1/1008 - H04R1/1083

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供了一种翻译方法、装置、耳机和服务器,其中,所述方法包括:所述耳机获取源语音数据;所述耳机将所述源语音数据发送至服务器,以使所述服务器对所述源语音数据进行翻译,生成目标语音数据并返回;所述耳机接收所述服务器返回的目标语音数据;进而用户只需采用耳机即可以实现翻译,无需采用专用翻译设备。

Description

一种翻译方法、装置、耳机和服务器
技术领域
本发明涉及数据处理技术领域,特别是涉及一种翻译方法、装置、耳机和服务器。
背景技术
随着全球化的推进,各国在商业、生活上的交流变得日益频繁;例如,跨国贸易、国际交流会议、跨国旅游等等。
由于各国/各地区使用的语言不同,使得语言成为了各国在商业和生活交流过程中的主要障碍之一;为了解决语言障碍,翻译设备应运而生;如翻译机、翻译笔等等。也就是说,现有技术必须使用专用翻译设备,才能实现翻译。
发明内容
本发明实施例提供一种翻译方法,以基于耳机实现翻译。
相应的,本发明实施例还提供了一种翻译装置、一种耳机和一种服务器,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种翻译方法,应用于耳机中,所述耳机与服务器连接,所述的方法包括:所述耳机获取源语音数据;所述耳机将所述源语音数据发送至服务器,以使所述服务器对所述源语音数据进行翻译,生成目标语音数据并返回;所述耳机接收所述服务器返回的目标语音数据。
可选地,所述耳机还与终端设备连接,所述耳机由所述终端设备对应的第一通讯用户使用;所述耳机获取源语音数据,包括:所述耳机接收所述终端设备发送的语音数据,作为源语音数据;其中,所述终端设备发送的语音数据是所述第一通讯用户通过所述终端设备与至少一个第二通讯用户语音通话的过程中,所述终端设备接收到的第二通讯用户的语音数据;所述的方法还包括:所述耳机播放所述目标语音数据。
可选地,所述耳机还与终端设备连接,所述耳机由所述终端设备对应的第一通讯用户使用;所述耳机获取源语音数据,包括:在所述第一通讯用户通过所述终端设备与至少一个第二通讯用户通讯的过程中,所述耳机采集所述第一通讯用户的语音数据,作为源语音数据;所述的方法还包括:所述耳机将所述目标语音数据发送至所述终端设备,以使所述终端设备将所述目标语音数据发送至所述第二通讯用户的终端设备。
可选地,所述耳机包括:第一耳机和至少一个第二耳机,所述第一耳机由第一用户使用,所述第二耳机由至少一个第二用户使用;所述耳机获取源语音数据,包括:所述第一耳机采集所述第一用户的语音数据,作为源语音数据;所述耳机将所述源语音数据发送至服务器,包括:所述第一耳机将所述源语音数据发送至服务器;所述接收所述服务器返回的目标语音数据,包括:所述第二耳机接收所述服务器返回的目标语音数据;所述的方法还包括:所述第二耳机播放所述目标语音数据。
可选地,所述耳机还与耳机收纳装置连接,所述耳机包括至少一个,所述耳机收纳装置包括至少一个,所述耳机由至少一个第一用户使用,所述耳机收纳装置由至少一个第二用户使用;所述耳机获取源语音数据,包括:所述第一耳机采集所述第一用户的语音数据,作为源语音数据;所述的方法还包括:所述耳机将所述目标语音数据发送至所述耳机收纳装置,以使所述耳机收纳装置播放所述目标语音数据。
可选地,所述耳机还与耳机收纳装置连接,所述耳机包括至少一个,所述耳机收纳装置包括至少一个,所述耳机由至少一个第一用户使用,所述耳机收纳装置由至少一个第二用户使用;所述耳机获取源语音数据,包括:所述耳机接收所述耳机收纳装置发送的语音数据,作为源语音数据,所述耳机收纳装置发送的语音数据是所述耳机收纳装置采集的所述第二用户的语音数据;所述的方法还包括:所述耳机播放所述目标语音数据。
可选地,所述的方法还包括:所述耳机根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配,所述语音数据包括源语音数据和/或目标语音数据。
可选地,所述耳机根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配,包括:当两个耳机均被使用时,两个耳机分别播放所述源语音数据和目标语音数据。
可选地,所述的方法还包括:接收用户的切换指令,切换所述两个耳机中播放的语音数据的种类;或接收用户的音量调节指令,调节所述音乐调节指令对应耳机的音量;或接收用户的种类选取指令,所述两个耳机均播放所述目标语音数据或均播放源语音数据。
可选地,所述耳机根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配,包括:当其中一个耳机被使用时,被使用的耳机播放所述源语音数据和目标语音数据的混音。
可选地,所述翻译包括同声传译。
可选地,所述耳机将所述源语音数据发送至服务器,包括:所述耳机将所述目标语音数据发送至中继设备,由所述中继设备将所述目标语音数据转发至服务器。
本发明实施例还公开了一种翻译装置,应用于服务器中,所述服务器与耳机连接,包括:所述服务器接收所述耳机发送的源语音数据;所述服务器对所述源语音数据进行翻译,生成目标语音数据;所述服务器将所述目标语音数据返回给所述耳机。
可选地,所述耳机包括:第一耳机和至少一个第二耳机,所述第一耳机由第一用户使用,所述第二耳机由至少一个第二用户使用;所述源语音数据是所述第一耳机采集的第一用户的语音数据;所述的方法还包括:所述服务器将所述目标语音数据发送至第二耳机,由所述第二耳机播放所述目标语音数据。
可选地,所述对所述源语音数据进行翻译,生成目标语音数据,包括:对所述源语音数据进行同声传译,生成目标语音数据。
本发明实施例还公开了一种翻译装置,应用于耳机中,所述耳机与服务器连接,所述的装置包括:获取模块,用于获取源语音数据;第一发送模块,用于将所述源语音数据发送至服务器,以使所述服务器对所述源语音数据进行翻译,生成目标语音数据并返回;第一接收模块,用于接收所述服务器返回的目标语音数据。
可选地,所述耳机还与终端设备连接,所述耳机由所述终端设备对应的第一通讯用户使用;所述获取模块,包括:第一语音数据接收子模块,用于接收所述终端设备发送的语音数据,作为源语音数据;其中,所述终端设备发送的语音数据是所述第一通讯用户通过所述终端设备与至少一个第二通讯用户语音通话的过程中,所述终端设备接收到的第二通讯用户的语音数据;所述的装置还包括:第一播放模块,用于播放所述目标语音数据。
可选地,所述耳机还与终端设备连接,所述耳机由所述终端设备对应的第一通讯用户使用;所述获取模块,包括:第一语音数据采集子模块,用于在所述第一通讯用户通过所述终端设备与至少一个第二通讯用户通讯的过程中,采集所述第一通讯用户的语音数据,作为源语音数据;所述的装置还包括:第二发送模块,用于将所述目标语音数据发送至所述终端设备,以使所述终端设备将所述目标语音数据发送至所述第二通讯用户的终端设备。
可选地,所述耳机包括:第一耳机和至少一个第二耳机,所述第一耳机由第一用户使用,所述第二耳机由至少一个第二用户使用;所述获取模块,包括:第二语音数据采集子模块,用于调用所述第一耳机采集所述第一用户的语音数据,作为源语音数据;所述第一发送模块,用于调用所述第一耳机将所述源语音数据发送至服务器;所述第一接收模块,用于调用所述第二耳机接收所述服务器返回的目标语音数据;所述的装置还包括:第二播放模块,用于调用所述第二耳机播放所述目标语音数据。
可选地,所述耳机还与耳机收纳装置连接,所述耳机包括至少一个,所述耳机收纳装置包括至少一个,所述耳机由至少一个第一用户使用,所述耳机收纳装置由至少一个第二用户使用;所述获取模块,包括:第三语音数据采集子模块,用于调用所述第一耳机采集所述第一用户的语音数据,作为源语音数据;所述的装置还包括:第三发送模块,用于将所述目标语音数据发送至所述耳机收纳装置,以使所述耳机收纳装置播放所述目标语音数据。
可选地,所述耳机还与耳机收纳装置连接,所述耳机包括至少一个,所述耳机收纳装置包括至少一个,所述耳机由至少一个第一用户使用,所述耳机收纳装置由至少一个第二用户使用;所述获取模块,包括:第二语音数据接收子模块,用于接收所述耳机收纳装置发送的语音数据,作为源语音数据,所述耳机收纳装置发送的语音数据是所述耳机收纳装置采集的所述第二用户的语音数据;所述的装置还包括:第三播放模块,用于播放所述目标语音数据。
可选地,所述的装置还包括:分配模块,用于根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配,所述语音数据包括源语音数据和/或目标语音数据。
可选地,所述分配模块,包括:第一声道分配子模块,用于当两个耳机均被使用时,两个耳机分别播放所述源语音数据和目标语音数据。
可选地,所述的装置还包括:切换模块,用于接收用户的切换指令,切换所述两个耳机中播放的语音数据的种类;调节模块,用于接收用户的音量调节指令,调节所述音乐调节指令对应耳机的音量;选取模块,用于接收用户的种类选取指令,所述两个耳机均播放所述目标语音数据或均播放源语音数据。
可选地,所述分配模块,包括:第二声道分配子模块,用于当其中一个耳机被使用时,被使用的耳机播放所述源语音数据和目标语音数据的混音。
可选地,所述翻译包括同声传译。
可选地,所述第一发送模块,用于将所述目标语音数据发送至中继设备,由所述中继设备将所述目标语音数据转发至服务器。
本发明实施例还公开了一种翻译装置,应用于服务器中,所述服务器与耳机连接,所述的装置包括:第二接收模块,用于接收所述耳机发送的源语音数据;翻译模块,用于对所述源语音数据进行翻译,生成目标语音数据;返回模块,用于将所述目标语音数据返回给所述耳机。
可选地,所述耳机包括:第一耳机和至少一个第二耳机,所述第一耳机由第一用户使用,所述第二耳机由至少一个第二用户使用;所述源语音数据是所述第一耳机采集的第一用户的语音数据;所述的装置还包括:第四发送模块,用于将所述目标语音数据发送至第二耳机,由所述第二耳机播放所述目标语音数据。
可选地,所述翻译模块,用于对所述源语音数据进行同声传译,生成目标语音数据。
本发明实施例还公开了一种可读存储介质,当所述存储介质中的指令由耳机的处理器执行时,使得耳机能够执行如本发明实施例任一所述的翻译方法。
本发明实施例还公开了一种可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如本发明实施例任一所述的翻译方法。
本发明实施例还公开了一种耳机,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取源语音数据;将所述源语音数据发送至服务器,以使所述服务器对所述源语音数据进行翻译,生成目标语音数据并返回;接收所述服务器返回的目标语音数据。
可选地,所述耳机还与终端设备连接,所述耳机由所述终端设备对应的第一通讯用户使用;所述获取源语音数据,包括:接收所述终端设备发送的语音数据,作为源语音数据;其中,所述终端设备发送的语音数据是所述第一通讯用户通过所述终端设备与至少一个第二通讯用户语音通话的过程中,所述终端设备接收到的第二通讯用户的语音数据;还包含用于进行以下操作的指令:播放所述目标语音数据。
可选地,所述耳机还与终端设备连接,所述耳机由所述终端设备对应的第一通讯用户使用;所述获取源语音数据,包括:在所述第一通讯用户通过所述终端设备与至少一个第二通讯用户通讯的过程中,采集所述第一通讯用户的语音数据,作为源语音数据;还包含用于进行以下操作的指令:将所述目标语音数据发送至所述终端设备,以使所述终端设备将所述目标语音数据发送至所述第二通讯用户的终端设备。
可选地,所述耳机包括:第一耳机和至少一个第二耳机,所述第一耳机由第一用户使用,所述第二耳机由至少一个第二用户使用;所述获取源语音数据,包括:所述第一耳机采集所述第一用户的语音数据,作为源语音数据;所述将所述源语音数据发送至服务器,包括:所述第一耳机将所述源语音数据发送至服务器;所述接收所述服务器返回的目标语音数据,包括:所述第二耳机接收所述服务器返回的目标语音数据;还包含用于进行以下操作的指令:所述第二耳机播放所述目标语音数据。
可选地,所述耳机还与耳机收纳装置连接,所述耳机包括至少一个,所述耳机收纳装置包括至少一个,所述耳机由至少一个第一用户使用,所述耳机收纳装置由至少一个第二用户使用;所述获取源语音数据,包括:所述第一耳机采集所述第一用户的语音数据,作为源语音数据;还包含用于进行以下操作的指令:将所述目标语音数据发送至所述耳机收纳装置,以使所述耳机收纳装置播放所述目标语音数据。
可选地,所述耳机还与耳机收纳装置连接,所述耳机包括至少一个,所述耳机收纳装置包括至少一个,所述耳机由至少一个第一用户使用,所述耳机收纳装置由至少一个第二用户使用;所述获取源语音数据,包括:接收所述耳机收纳装置发送的语音数据,作为源语音数据,所述耳机收纳装置发送的语音数据是所述耳机收纳装置采集的所述第二用户的语音数据;还包含用于进行以下操作的指令:播放所述目标语音数据。
可选地,还包含用于进行以下操作的指令:根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配,所述语音数据包括源语音数据和/或目标语音数据。
可选地,所述耳机根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配,包括:当两个耳机均被使用时,两个耳机分别播放所述源语音数据和目标语音数据。
可选地,还包含用于进行以下操作的指令:接收用户的切换指令,切换所述两个耳机中播放的语音数据的种类;或接收用户的音量调节指令,调节所述音乐调节指令对应耳机的音量;或接收用户的种类选取指令,所述两个耳机均播放所述目标语音数据或均播放源语音数据。
可选地,所述耳机根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配,包括:当其中一个耳机被使用时,被使用的耳机播放所述源语音数据和目标语音数据的混音。
可选地,所述翻译包括同声传译。
可选地,所述将所述源语音数据发送至服务器,包括:将所述目标语音数据发送至中继设备,由所述中继设备将所述目标语音数据转发至服务器。
本发明实施例还公开了一种服务器,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:接收所述耳机发送的源语音数据;对所述源语音数据进行翻译,生成目标语音数据;将所述目标语音数据返回给所述耳机。
可选地,所述耳机包括:第一耳机和至少一个第二耳机,所述第一耳机由第一用户使用,所述第二耳机由至少一个第二用户使用;所述源语音数据是所述第一耳机采集的第一用户的语音数据;还包含用于进行以下操作的指令:将所述目标语音数据发送至第二耳机,由所述第二耳机播放所述目标语音数据。
可选地,所述对所述源语音数据进行翻译,生成目标语音数据,包括:对所述源语音数据进行同声传译,生成目标语音数据。
本发明实施例包括以下优点:
本发明实施例中,耳机可以获取源语音数据,然后对将所述源语音数据发送服务器,由服务器对所述源语音数据进行翻译,生成目标语音数据并返回给耳机;进而用户只需采用耳机即可以实现翻译,无需采用专用翻译设备。
附图说明
图1是本发明的一种耳机侧翻译方法实施例的步骤流程图;
图2是本发明的一种服务器侧翻译方法实施例的步骤流程图;
图3a是本发明的一种通讯场景实施例的示意图;
图3b是本发明的一种翻译方法可选实施例的步骤流程图;
图4是本发明的又一种翻译方法可选实施例的步骤流程图;
图5是本发明的又一种翻译方法可选实施例的步骤流程图;
图6a是本发明的一种一对一翻译场景实施例的示意图;
图6b是本发明的又一种翻译方法可选实施例的步骤流程图;
图7a是本发明的又一种一对一翻译场景实施例的示意图;
图7b是本发明的又一种翻译方法可选实施例的步骤流程图;
图8a是本发明的又一种一对一翻译场景实施例的示意图;
图8b是本发明的又一种翻译方法可选实施例的步骤流程图;
图9a是本发明的又一种一对一翻译场景实施例的示意图;
图9b是本发明的又一种翻译方法可选实施例的步骤流程图;
图10是本发明的又一种翻译方法可选实施例的步骤流程图;
图11是本发明的一种耳机侧翻译装置实施例的结构框图;
图12是本发明的一种耳机侧翻译装置可选实施例的结构框图;
图13是本发明的一种服务器侧翻译装置实施例的结构框图;
图14是本发明的一种服务器侧翻译装置可选实施例的结构框图;
图15根据一示例性实施例示出的一种用于翻译的耳机的结构框图;
图16是本发明根据另一示例性实施例示出的一种用于翻译的服务器的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
随着计算机技术和通信技术的不断发展,人们的工作、生活也逐渐趋向电子化、信息化和网络化。终端设备是实现电子化、信息化和网络化的重要载体之一,例如采用终端设备进行办公、采用终端设备进行通讯等等;进而终端设备也被普遍使用。在很多场景下,用户会在终端设备中接入耳机:如在通讯的场景下,接入耳机不仅能够更清楚的听到对端的语音,还能够解放双手;又例如,在观看视频、听音乐、直播、视频/语音通话等等,接入耳机不仅能获取到高质量的音频,还能够保护隐私,降低对他人的干扰;这使得耳机也逐渐成为用户常用常备的外部设备之一。基于此,本发明实施例可以在耳机中增加实现翻译功能,然后基于耳机实现翻译,无需用户使用专用翻译设备进行翻译。
本发明实施例中,所述耳机具有联网功能,可以连接到服务器,结合服务器实现翻译。
以下对耳机侧的翻译方法进行说明。
参照图1,示出了本发明的一种耳机侧翻译方法实施例的步骤流程图,具体可以包括如下步骤:
步骤102、所述耳机获取源语音数据。
步骤104、所述耳机将所述源语音数据发送至服务器,以使所述服务器对所述源语音数据进行翻译,生成目标语音数据并返回。
步骤106、接收所述服务器返回的目标语音数据。
本发明实施例中,所述源语音数据可以是耳机采集的,也可以是与耳机连接的其他设备采集的,如终端设备,本发明实施例对此不作限制。其中,所述耳机可以内置声音采集模块如麦克风阵列,以使耳机可以采集语音数据。其中,所述源语音数据可以是指未被翻译的语音数据。
本发明实施例中,耳机在获取到源语音数据后,可以将源语音数据发送给服务器;由服务器对源语音数据进行翻译,生成目标语音数据。其中,服务器的翻译过程在后续进行说明。
服务器在生成目标语音数据后,可以将目标语音数据返回给耳机;对应的,耳机可以接收到该目标语音数据。然后耳机可以对该目标语音数据进行播放;也可以将该目标语音数据发送与耳机连接的其他设备;具体可以根据应用场景确定,本发明实施例对此不作限制。
综上,本发明实施例中,耳机可以获取源语音数据,然后对将所述源语音数据发送服务器,由服务器对所述源语音数据进行翻译,生成目标语音数据并返回给耳机;进而用户只需采用耳机即可以实现翻译,无需采用专用翻译设备。
以下对服务器侧的翻译方法进行说明。
参照图2,示出了本发明的一种服务器侧翻译方法实施例的步骤流程图,具体可以包括如下步骤:
步骤202、服务器接收所述耳机发送的源语音数据。
步骤204、所述服务器对所述源语音数据进行翻译,生成目标语音数据。
步骤206、将所述目标语音数据返回给所述耳机。
本发明实施例中,服务器接收到与其连接的耳机发送的源语音数据后,可以对该源语音数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本翻译为目标语言的翻译文本,再将目标语言的翻译文本转换为对应的目标语音数据。
其中,目标语言可以是使用该耳机的用户所使用的语言,也可以与使用该耳机的用户进行语音交流的其他用户所使用的语言,具体可以按照具有应用场景确定,本发明实施例对此不作限制。其中,可以由耳机在发送源语音数据的同时,将所述目标语言发送给服务器。
在生成目标语音数据后,所述服务器可以将所述目标语音数据发送至耳机。
综上,本发明实施例中,服务器在获取到耳机发送的源语音数据后,可以对所述源语音数据进行翻译,生成目标语音数据并返回给耳机;进而用户只需采用耳机即可以实现翻译,无需采用专用翻译设备。
以下将耳机和服务器结合说明本发明实施例的翻译方法。
本发明实施例中,所述耳机可以与终端设备连接。对应的,本发明实施例的一种应用场景可以是:使用不同语言的用户进行通讯的场景;可参照图3a,图3a中仅示出了两个用户通讯的场景。其中,所述通讯可以是指拨号进行的语音通话,也可以是通过即时通讯软件进行的语音通话/视频通话,本发明实施例对此不作限制。
其中,参与通讯的用户可以包括至少两个,各参与通讯的用户均使用所述耳机,且参与通讯的用户所使用的耳机分别与其使用的终端设备连接。可以将任一使用所述耳机的用户称为第一通讯用户,将参与通讯的其他用户称为第二通讯用户;所述第二通讯用户包括至少一个,一个第二通讯用户可以使用一个终端设备,一个终端设备对应连接一套耳机设备中的耳机。
本发明实施例中,所述耳机可以是有线耳机,也可以是无线耳机;当所述耳机为无线耳机时,所述耳机可以通过蓝牙与终端设备连接;当然也可以采用其他的方式与终端设备连接,本发明实施例对此不作限制。
本发明的一个可选实施例中,所述耳机可以是TWS(True Wireless Stereo,真无线耳机)。
以下以第一通讯用户使用的耳机为例,说明本发明实施例的翻译方法。
参照图3b,示出了本发明的一种翻译方法可选实施例的步骤流程图。
步骤302、所述耳机接收所述终端设备发送的语音数据,作为源语音数据;其中,所述终端设备发送的语音数据是所述第一通讯用户通过所述终端设备与第二通讯用户通讯过程中,所述终端设备接收到的第二通讯用户的语音数据。
本发明实施例中,在所述第一通讯用户通过其终端设备与至少一个第二通讯用户通讯的场景下,任意一个第二通讯用户说话的过程中(为了便于本发明实施例的后续说明,可以将通讯过程中说话的第二通讯用户称为目标第二通讯用户),目标第二通讯用户的终端设备可以采集目标第二通讯用户的语音数据。当然,也可以是目标第二通讯用户对应的耳机采集目标第二通讯用户的语音数据,并发送给目标第二通讯用户的终端设备。然后由目标第二通讯用户的耳机将目标第二通讯用户的语音数据,发送至第一通讯用户的终端设备。
对应的,第一通讯用户的终端设备可以接收到目标第二通讯用户的终端设备发送的语音数据;然后将接收到的目标第二通讯用户的语音数据,发送至第一通讯用户使用的耳机。第一通讯用户使用的耳机接收到第一通讯用户的终端设备发送的语音数据后,可以将接收的语音数据,作为源语音数据。
步骤304、所述耳机将所述源语音数据发送至所述服务器。
本发明的一个示例中,第一通讯用户使用的耳机可以依据源语音数据,判断第一通讯用户使用的语言与目标第二通讯用户使用的语言是否相同。其中,第一通讯用户使用的耳机可以依据所述源语音数据(也就是目标第二通讯用户的语音数据),确定目标第二通讯用户使用的语言;也可以根据第一通讯用户设置的目标第二通讯用户的语言,确定目标第二通讯用户使用的语言,本发明实施例对此不作限制。以及第一通讯用户使用的耳机可以通过获取第一通讯用户设置的第一通讯用户的语言,确定第一通讯用户使用的语言;也可以根据第一通讯用户对应终端设备的系统语言,确定第一通讯用户使用的语言,本发明实施例对此不作限制。
其中,第一通讯用户可以在终端设备的耳机对应应用程序中,设置第一通讯用户的语言和目标第二通讯用户的语言,本发明实施例对此不作限制。若第一通讯用户使用的语言与目标第二通讯用户使用的语言相同,则无需对该源语音数据进行翻译,直接播放该源语音数据用即可。若第一通讯用户使用的语言与目标第二通讯用户使用的语言不同,则将源语音数据发送至对应的服务器,由服务器对源语音数据进行翻译。
本发明的一个示例中,所述耳机也可以无需判断第一通讯用户使用的语言与目标第二通讯用户使用的语言是否相同,直接将所述源语音数据发送至所述服务器;由服务器进行判断第一通讯用户使用的语言与目标第二通讯用户使用的语言是否相同。
步骤306、所述服务器对所述源语音数据进行翻译,生成目标语音数据。
步骤308、所述服务器将所述目标语音数据发送至所述耳机。
本发明的一个示例中,当所述耳机已确定第一通讯用户使用的语言与目标第二通讯用户使用的语言不同时,所述服务器可以对获取的源语音数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本,翻译为第一通讯用户所使用的语言对应的翻译文本,再将该翻译文本转换为对应的目标语音数据并返回给耳机。其中,当用户是在终端设备的耳机对应应用程序中,设置的第一通讯用户的语言时,可以由耳机将第一通讯用户设置的第一通讯用户的语言发送至服务器。以及当用户未设置其所使用的语言,可以由耳机将第一通讯用户对应终端设备的系统语言,发送至服务器。
本发明又一示例中,当所述耳机未判断第一通讯用户使用的语言与第二通讯用户使用的语言是否相同时;服务器在接收到源语音数据后,可以依据所述源语音数据判断第一通讯用户使用的语言与目标第二通讯用户使用的语言是否相同。当第一通讯用户使用的语言与目标第二通讯用户使用的语言相同时,可以将源语音数据返回给耳机,耳机可以直接播放该源语音数据。当第一通讯用户使用的语言与目标第二通讯用户使用的语言不相同时,服务器可以执行步骤306,生成目标语音数据。
步骤310、所述耳机播放所述目标语音数据。
然后第一通讯用户的耳机可以对所述目标语音数据进行播放。进而参与通讯的用户中,每个第一通讯用户的耳机可以通过服务器将第二通讯的语音数据进行翻译,生成本身所使用语言的语音数据并播放;从而实现使用不同语言用户在通讯过程中的跨语言沟通。
综上,本发明实施例中,在第一通讯用户通过所述终端设备与至少一个第二通讯用户通讯过程中,所述第一通讯用户的耳机可以将由第一通讯用户的终端设备发送的第二通讯用户的语音数据,作为源语音数据;然后将所述源语音数据发送至服务器,由服务器对所述源语音数据进行翻译,生成目标语音数据并返回给耳机;再由第一通讯用户的耳机对目标语音数据进行播放,从而实现使用不同语言用户通讯过程中的跨语言沟通。此外,相对于现有技术在通讯过程中,需要开启功放后采用专用的翻译设备进行翻译而言,本发明实施例在通讯过程中无需开启功放,即可完成翻译;不仅可以保护隐私,还可以提高翻译的准确性。
可参照图3a的通讯场景,本发明实施例的又一种翻译方法如下。
以下以第一通讯用户使用的耳机为例,说明本发明实施例的翻译方法。
参照图4,示出了本发明的又一种翻译方法可选实施例的步骤流程图。
步骤402、所述耳机采集所述第一通讯用户的语音数据,作为源语音数据。
本发明实施例中,在所述第一通讯用户通过其终端设备与第二通讯用户通讯的场景下,第一通讯用户说话过程中,第一通讯用户的耳机可以采集的第一通讯用户的语音数据;并将采集到的第一通讯用户的语音数据作为源语音数据。
步骤404、所述耳机将所述源语音数据发送至所述服务器。
本发明的一个示例中,当第一通讯用户使用的语言与各第二通讯用户使用的语言相同时,所述耳机可以直接将所述源语音数据发送至第一通讯用户的终端设备;由第一通讯用户的终端设备将所述源语音数据发送至各第二通讯用户的终端设备,再由各第二通讯用户的终端设备将源语音数据发送至各第二通讯用户使用的耳机,由各第二通讯用户使用的耳机播放源语音数据。当第一通讯用户的语言与至少一个第二通讯用户所使用的语言不相同时,所述耳机可以执行步骤404。其中,第一通讯用户使用的耳机判断第一通讯用户使用的语言和各第二通讯用户使用的语言是否相同的方式与上述类似,在此不再赘述。
本发明的另一个示例中,所述耳机可以无需判断第一通讯用户使用的语言与各第二通讯用户使用的语言是否相同,直接将所述源语音数据发送至所述服务器;由服务器进行判断第一通讯用户使用的语言与各第二通讯用户使用的语言是否相同。
步骤406、所述服务器对所述源语音数据进行翻译,生成目标语音数据。
步骤408、所述服务器将所述目标语音数据返回至所述耳机。
本发明的一个示例中,当所述耳机已确定第一通讯用户使用的语言与至少一个第二通讯用户使用的语言不同时,所述服务器可以对该源语音数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本,翻译为第二通讯用户所使用的语言对应的翻译文本,再将该翻译文本转换为对应的目标语音数据并返回给耳机。
本发明又一示例中,当所述耳机未判断第一通讯用户使用的语言与各第二通讯用户使用的语言是否相同时;服务器在接收到源语音数据后,可以依据所述源语音数据判断第一通讯用户使用的语言与各第二通讯用户使用的语言是否相同。当第一通讯用户使用的语言与各第二通讯用户使用的语言均相同时,可以将源语音数据返回给耳机,耳机可以直接将源语音数据发送至第一通讯用户的终端设备。当第一通讯用户使用的语言与至少一个第二通讯用户使用的语言不相同时,服务器可以执行步骤406,生成目标语音数据并返回给耳机。
其中,当参与通讯的用户包括多个,且与第一通讯用户使用的语言不同的第二通讯用户包括多个时,服务器可以分别对源语音数据进行翻译,生成与第一通讯用户使用语言不同的各第二通讯用户所使用的语言对应的目标语音数据;再将各目标语音数据发送至第一通讯用户的耳机。
步骤410、所述耳机将所述目标语音数据发送至所述终端设备,以由所述终端设备将所述目标语音数据发送至所述第二通讯用户的终端设备。
第一通讯用户使用的耳机在得到目标语音数据后,可以将所述目标语音数据发送至第一通讯用户的终端设备。然后由第一通讯用户的终端设备,将所述目标语音数据发送中第二通讯用户的终端设备。进而第二通讯用户的终端设备可以将目标语音数据发送至第二通讯用户的耳机,由第二通讯用户的耳机对所述目标语音数据进行播放,从而实现通讯过程中的无障碍沟通。
其中,当服务器将源语音数据翻译成了多个目标语音数据时,第一通讯用户的终端设备可以依次将目标语音数据发送至各第二通讯用户的终端设备;然后各第二通讯用户的终端设备依次将各目标语音数据,发送至对应的第二通讯用户使用的耳机,由第二通讯用户使用的耳机依次对各目标语音数据进行播放。进而参与通讯的各第二通讯用户可以从依次播放的多个目标语音数据中,获取到所能听懂的目标语音数据。当然,也可以是由各第二通讯用户使用的耳机从接收到的多个目标语音数据中,选取与对应第二通讯用户使用语言匹配的目标语音数据进行播放。
当然,当务器将源语音数据翻译成了多个目标语音数据时,第一通讯用户的终端设备也可以将各目标语音数据,分别发送至对应的第二通讯用户的终端设备;然后第二通讯用户的终端设备将接收到的目标语音数据,发送至对应的第二通讯用户使用的耳机,由第二通讯用户使用的耳机对接收到的目标语音数据进行播放。
此外,当多个第二通讯用户中存在与第一通讯用户使用语言相同的第二通讯用户时,第一通讯用户的耳机还可以将源语音数据发送至第一通讯用户对应的终端设备;由第一通讯用户对应的终端设备将源语音数据,发送与第一通讯用户使用语言相同的第二通讯用户的终端设备。
综上,本发明实施例中,所述耳机可以获取所述第一通讯用户的语音数据,作为源语音数据,并将所述源语音数据发送至服务器;由所述服务器对所述源语音数据进行翻译,生成目标语音数据再返回给所述耳机,然后由所述耳机将所述目标语音数据发送至所述终端设备;第一通讯用户的终端设备再将所述目标语音数据发送至所述第二通讯用户的终端设备,第二通讯用户的终端设备将所述目标语音数据发送至第二通讯用户的耳机,由第二通讯用户的耳机播放所述目标语音数据;进而实现使用不同语言用户通讯过程中的跨语言沟通。此外,相对于现有技术在通讯过程中,需要开启功放后采用专用的翻译设备进行翻译而言,本发明实施例在通讯过程中无需开启功放,即可完成翻译;不仅可以保护隐私,还可以提高翻译的准确性。
本发明的一个实施例中,参与通讯的用户中可以仅存在部分用户使用所述耳机;然后结合上述步骤302-步骤310,与上述步骤402-步骤410,实现使用不同语言用户通讯过程中的跨语言沟通。其中,可以将任一使用所述耳机的用户称为第一通讯用户,将参与通讯的其他用户称为第二通讯用户。
参照图5、示出了本发明的又一种翻译方法可选实施例的步骤流程图。
步骤502、所述耳机接收所述终端设备发送的语音数据,作为源语音数据;其中,所述源语音数据是所述第一通讯用户通过所述终端设备与至少一个第二通讯用户通讯的过程中,所述终端设备接收到的第二通讯用户的语音数据。
步骤504、所述耳机将所述源语音数据发送至所述服务器。
步骤506、所述服务器对所述源语音数据进行翻译,生成目标语音数据。
步骤508、所述服务器将所述目标语音数据发送至所述耳机。
步骤510、所述耳机播放所述目标语音数据。
步骤512、所述耳机采集所述第一通讯用户的语音数据,作为源语音数据。
步骤514、所述耳机将所述源语音数据发送至所述服务器。
步骤516、所述服务器对所述源语音数据进行翻译,生成目标语音数据。
步骤518、所述服务器将所述目标语音数据返回至所述耳机。
步骤520、所述耳机将所述目标语音数据发送至所述终端设备,以由所述终端设备将所述目标语音数据发送至所述第二通讯用户的终端设备。
其中,步骤502-步骤510,与上述步骤302-步骤310类似,步骤512-步骤520,与上述步骤402-步骤410类似,在此不再赘述。
此外,本发明实施例不限制先执行步骤502-步骤510,还是先执行步骤512-步骤520。
综上,本发明实施例中,在所述第一通讯用户通过所述终端设备与至少一个第二通讯用户通讯过程中,可以由耳机将由第一通讯用户的终端设备发送的第二通讯用户的语音数据,作为源语音数据并发送至服务器,由服务器对所述源语音数据进行翻译,生成目标语音数据并返回给所述耳机进行播放;以及可以由耳机获取所述第一通讯用户的语音数据,作为源语音数据并发送至服务器,由服务器对所述源语音数据进行翻译,生成目标语音数据并返回给所述耳机;然后耳机将所述目标语音数据发送至第一通讯用户的终端设备,由第一通讯用户的终端设备将所述目标语音数据发送至所述第二通讯用户的终端设备。其中,可以由第二通讯用户的终端设备播放所述目标语音数据,也可以是第二通讯用户的终端设备将所述目标语音数据发送至第二通讯用户的耳机,由第二通讯用户的耳机播放所述目标语音数据;进而即使在参与通讯的用户中存在部分用户未使用耳机,也能够实现使用不同语言用户通讯过程中的跨语言沟通。
本发明实施例的又一个场景可以是:多人翻译(包括一对一翻译);可参照图6a,图6a中仅示出了一对一翻译的场景。其中,所述耳机可以包括多个,其中,可以将其中的一个耳机称为第一耳机,其他的耳机称为第二耳机,所述第一耳机包括一个,所述第二耳机可以包括至少一个。即所述耳机可以包括:第一耳机和至少一个第二耳机,所述第一耳机和第二耳机分别与所述耳机收纳装置连接。所述第一耳机由第一用户使用,所述第二耳机由至少一个第二用户使用,一个第二用户可以使用一个第二耳机;进而可以通过第一耳机和第二耳机,实现面对面语音交流过程中的翻译。
当第二耳机为一个时,第一耳机和第二耳机可以是同一对耳机,也可以是不同对耳机。
参照图6b,示出了本发明的又一种翻译方法可选实施例的步骤流程图。
步骤602、所述第一耳机采集所述第一用户的语音数据,作为源语音数据。
步骤604、所述第一耳机将所述源语音数据发送至所述服务器。
步骤606、所述服务器对所述源语音数据进行翻译,生成目标语音数据。
步骤608、所述服务器将所述目标语音数据发送至第二耳机。
步骤610、所述第二耳机播放所述目标语音数据。
本发明实施例中,在第一用户和至少一个第二用户面对面语音交流的场景中,第一用户发言的过程中,第一耳机可以采集第一用户的语音数据,并将第一用户的语音数据作为源语音数据。
然后第一耳机可以将所述源语音数据发送至服务器;服务器接收到该源语音数据后,可以对该源语音数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本翻译为第二用户对应语言的翻译文本,并将该翻译文本转换为对应的目标语音数据。再将所述目标语音数据发送至第二用户使用的第二耳机,由所述第二耳机播放所述目标语音数据。
其中,当第二用户包括多个时,服务器可以将源语音数据翻译为多个第二用户所使用语言匹配的目标语音数据;此时,服务器可以依次将目标语音数据发送至各第二用户的第二耳机;由各第二用户的第二耳机依次对各目标语音数据进行播放。进而面对面交流的各第二用户可以从依次播放的多个目标语音数据中,获取到所能听懂的目标语音数据。当然,也可以是由各第二用户使用的第二耳机从接收到的多个目标语音数据中,选取与对应第二用户使用语言匹配的目标语音数据进行播放。
当然,当第二用户包括多个时,服务器可以将源语音数据翻译为多个第二用户所使用语言匹配的目标语音数据;此时,服务器也可以将各目标语音数据,分别发送至对应第二用户的第二耳机;然后各第二耳机可以对接收到的目标语音数据进行播放。
此外,当多个第二用户中存在与第一用户使用语言相同的第二用户时,服务器还可以将源语音数据,发送至与第一用户使用语言相同的第二用户的第二耳机。与第一用户使用语言相同的第二用户的第二耳机直接播放源语音数据即可。
步骤612、所述第二耳机采集所述第二用户的语音数据,作为源语音数据。
步骤614、所述第二耳机将所述源语音数据发送至所述服务器。
步骤616、所述服务器对所述源语音数据进行翻译,生成目标语音数据。
步骤618、所述服务器将所述目标语音数据发送至第一耳机。
步骤620、所述第一耳机播放所述目标语音数据。
对应的,在第一用户和至少一个第二用户面对面语音交流的场景下,任意一个第二用户发言的过程中(为了便于本发明实施例后续说明,可以将发言的第二用户称为目标第二用户,目标第二用户对应的第二耳机可以称为目标第二耳机),目标第二耳机可以采集目标第二用户的语音数据,并将目标第二用户的语音数据作为源语音数据。
然后目标第二耳机可以将所述源语音数据发送至服务器;服务器接收到该源语音数据后,可以对该源语音数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本翻译为第一用户对应语言的翻译文本,并将该翻译文本转换为对应的目标语音数据。再将所述目标语音数据发送至第一用户使用的第一耳机,由所述第一耳机播放所述目标语音数据。
当第二用户包括多个时,服务器还可以将语音识别文本翻译为其他第二用户对应语言的翻译文本,并将该翻译文本转换为对应的目标语音数据;然后将所述目标语音数据发送至对应的其他第二用户使用的其他第二耳机,由其他第二耳机播放对应的目标语音数据。
当然,当服务器生成了多个目标语音数据时,可以依次将目标语音数据发送至各其他第二用户的其他第二耳机,以及第一用户的第一耳机;由其他第二用户的其他第二耳机以及第一用户的第一耳机,依次对各目标语音数据进行播放。进而面对面交流的各其他第二用户和第一用户可以从依次播放的多个目标语音数据中,获取到所能听懂的目标语音数据。当然,也可以是由各其他第二用户使用的其他第二耳机从接收到的多个目标语音数据中,选取与对应第二用户使用语言匹配的目标语音数据进行播放。以及由第一用户的第一耳机,从接收到的多个目标语音数据中,选取与第一用户使用语言匹配的目标语音数据进行播放。
此外,当服务器将源语音数据翻译成了多个目标语音数据时,服务器也可以将各目标语音数据分别发送至对应的第二耳机/第一耳机;然后第二耳机/第一耳机可以接收到的目标语音数据并播放。
此外,当多个第二用户中存在与目标第二用户使用语言相同的其他第二用户时,服务器还可以将源语音数据,发送至与目标第二用户使用语言相同的其他第二用户的其他第二耳机。与目标第二用户使用语言相同的其他第二用户的其他第二耳机直接播放源语音数据即可。
其中,本发明实施例不限制先执行步骤602-步骤610,还是先执行步骤612-步骤620。
综上,本发明实施例中,在第一用户与至少一个第二用户面对面语音交流的场景下,在第一用户发言的过程中,所述第一耳机采集所述第一用户的语音数据,作为源语音数据并将所述源语音数据发送至服务器,由服务器对所述源语音数据进行翻译,生成目标语音数据并发送至所述第二耳机,由所述第二耳机播放所述目标语音数据。对应的,在第二用户说话的过程中,所述第二耳机可以采集所述第二用户的语音数据,作为源语音数据并将所述源语音数据发送至服务器,由服务器对所述源语音数据进行翻译,生成目标语音数据并发送至所述第一耳机,由所述第一耳机播放所述目标语音数据。进而本发明实施例可以基于两只耳机快速的实现多人翻译,无需交流各方不断的交换翻译设备查看翻译设备中针对对方的翻译结果,不仅能够提高翻译效率,且还能够提高用户体验。
本发明的一个实施例中,所述耳机与耳机收纳装置连接,所述耳机包括至少一个,所述耳机收纳装置包括至少一个;所述耳机由至少一个第一用户使用,所述耳机收纳装置由至少一个第二用户使用;进而通过耳机和耳机收纳装置实现多人翻译;可参照图7a,图7a仅示出了一对一翻译的场景。其中,一个第一用户可以使用一个耳机,一个第二用户可以使用一个耳机收纳装置。。
参照图7b、示出了本发明的又一种翻译方法实施例的步骤流程图。
步骤702、所述耳机采集所述第一用户的语音数据,作为源语音数据。
步骤704、所述耳机将所述源语音数据发送至所述服务器。
步骤706、所述服务器对所述源语音数据进行翻译,生成目标语音数据。
本发明实施例中,在多个用户(包括至少一个第一用户和至少一个第二用户)面对面语音交流的场景中,任意一个第一用户发言的过程中(为了便于本发明实施例的后续说明,后续将发言的第一用户称为目标第一用户,目标第一用户使用的耳机称为目标耳机),目标耳机可以采集目标第一用户的语音数据,并将目标第一用户的语音数据作为源语音数据。然后目标耳机可以将获取的源语音数据发送至服务器。
服务器可以对所述源语言数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本翻译为使用该服务器对应第二用户所使用语言的翻译文本,并将该翻译文本转换为对应的目标语音数据。
步骤708、所述服务器将所述目标语音数据返回给所述耳机。
步骤710、所述耳机将所述目标语音数据发送至耳机收纳装置。
步骤712、所述耳机收纳装置播放所述目标语音数据。
本发明实施例中,所述服务器可以将所述目标语音数据返回给所述目标耳机;由所述目标耳机将所述目标语音数据转发给耳机收纳装置;然后由耳机收纳装置对所述目标语音数据进行播放,进而使用耳机收纳装置的第二用户可以听到第一用户的源语音数据的翻译结果。
当多个第二用户中存在与目标第一用户使用语言相同的用户时,目标耳机可以直接将源语音数据,发送至与目标第一用户使用语言相同的第二用户的耳机收纳装置,该耳机收纳装置直接播放所述源语音数据即可。
其中,当第一用户包括多个时,服务器还可以将源语音数据,翻译成其他第一用户所使用语言对应的多个目标语音数据。此时,目标服务器可以依次将目标语音数据发送至各其他第一用户使用的其他耳机;由各其他第一用户的其他耳机依次对各目标语音数据进行播放。进而面对面交流的各其他第一用户可以从依次播放的多个目标语音数据中,获取到所能听懂的目标语音数据。当然,也可以是由各其他第一用户使用的其他耳机从接收到的多个目标语音数据中,选取与对应第一用户使用语言匹配的目标语音数据进行播放。
当然,当第一用户包括多个时,服务器将源语音数据,翻译成各其他第一用户所使用语言对应的多个目标语音数据后,服务器也可以将各目标语音数据,分别发送至对应其他第一用户的其他耳机;其他第一用户的耳机可以接收到的目标语音数据并播放。
当其他第一用户中存在与目标第一用户用语言相同的用户时,服务器还可以将源语音数据,发送至与目标第一用户使用语言相同的其他第一用户的其他耳机。与第一用户使用语言相同的其他第一用户的其他耳机可以直接播放源语音数据即可。
本发明的一个示例中,所述耳机收纳装置可以设置有显示屏。所述服务器还可以将源语音数据对应的翻译文本返回给所述耳机,然后所述耳机可以将源语音数据对应的翻译文本,发送至耳机收纳装置。进而所述耳机收纳装置在播放所述目标语音数据的同时,还可以在显示屏中同步展示源语音数据的翻译文本,也就是与目标语音数据对应的文本;进而便于第二用户对目标语音数据的理解,进一步提高用户体验。
此外,所述耳机收纳装置还具有收纳功能,可以收到所述耳机。当所述耳机为无线耳机时,所述耳机收纳装置还可以为所述耳机充电。
步骤714、所述耳机收纳装置采集第二用户的语音数据。
步骤716、所述耳机收纳装置将采集第二用户的语音数据,发送至所述耳机。
步骤718、所述耳机接收所述耳机收纳装置发送的语音数据,作为源语音数据。
步骤720、所述耳机将所述源语音数据发送至服务器。
步骤722、所述服务器对所述源语音数据进行翻译,生成目标语音数据。
步骤724、所述服务器将所述目标语音数据发送给所述耳机。
步骤726、所述耳机播放所述目标语音数据。
在第一用户和至少第二用户面对面语音交流的场景下,任意一个第二用户发言的过程中为了便于本发明实施例的后续说明,可以将发言的第二用户称为目标第二用户,目标第二用户对应的耳机收纳装置可以称为目标耳机收纳装置),所述目标耳机收纳装置可以采集目标第二用户的语音数据,并将目标第二用户的语音数据发送给第一用户的耳机。
然后第一用户的耳机可以将接收到的第二用户的语音数据作为源语音数据,发送给服务器。服务器接收到源语音数据后,可以对源语音数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本翻译为第一用户对应语言的翻译文本,再将该翻译文本转换为对应的目标语音数据。再将所述目标语音数据发送至第一用户使用的耳机,由所述耳机播放所述目标语音数据;进而使用耳机的第一用户可以听到第二用户的源语音数据的翻译结果。
当所述第一用户包括多个时,服务器可以将源语音数据,翻译为各第一用户所使用语言对应的目标语音数据。然后可以依次将目标语音数据发送至各第一用户使用的耳机;由各第一用户的耳机依次对各目标语音数据进行播放。进而面对面交流的各第一用户可以从依次播放的多个目标语音数据中,获取到所能听懂的目标语音数据。当然,也可以是由各第一用户使用的耳机从接收到的多个目标语音数据中,选取与对应第一用户使用语言匹配的目标语音数据进行播放。
当然,当第一用户包括多个时,服务器将源语音数据,翻译成各第一用户所使用语言对应的多个目标语音数据后,服务器也可以将各目标语音数据,分别发送至对应的第一用户的耳机;第一用户的耳机可以接收到的目标语音数据并播放。
当多个第一用户中存在与目标第二用户用语言相同的用户时,目标第二用户的服务器还可以将源语音数据,发送至与目标第二用户使用语言相同的第一用户的耳机。与目标第二用户使用语言相同的第一用户的耳机可以直接播放源语音数据即可。
当第二用户包括多个时,服务器还可以将源语音数据翻译为其他第二用户所使用语言对应的目标语音数据;然后将各目标语音数据,发送至任一第一用户的耳机;由第二用户的耳机将目标语音数据,发送至对应的其他第二用户的耳机收纳装置中,由各其他第二用户的耳机收纳装置对对应的目标语音数据进行播放。
此外,当其他第二用户中存在与目标第二用户使用语言相同的用户时,服务器还可以将源语音数据,发送至任一第一用户的耳机;由第二用户的耳机将源语音数据,发送至与目标第二用户使用语言相同的其他第二用户的耳机收纳装置。与目标第二用户使用语言相同的其他第二用户的耳机收纳装置可以直接播放源语音数据即可。
其中,本发明实施例不限制先执行步骤702-步骤712,还是先执行步骤714-步骤726。
综上,本发明实施例中,在第一用户和至少一个第二用户面对面语音交流场景下,在第一用户发言的过程中,所述耳机采集所述第一用户的语音数据,作为源语音数据并发送至服务器,由服务器对所述源语音数据进行翻译,生成目标语音数据并返回给耳机;再由耳机将目标语音数据发送给耳机收纳装置进行播放;进而使用耳机收纳装置的第二用户可以听到第一用户的源语音数据的翻译结果。对应的,在第二用户发言的过程中,所述耳机收纳装置可以采集所述第二用户的语音数据并发送给耳机;耳机将第二用户的语音数据作为源语音数据并发送至服务器,由服务器对所述源语音数据进行翻译,生成目标语音数据并返回给耳机进行播放;进而使用耳机的第一用户可以听到第二用户的源语音数据的翻译结果。从而本发明实施例可以基于耳机和与耳机连接的耳机收纳装置,以及服务器快速的实现一对一的翻译,无需交流双方不断的交换翻译设备查看翻译设备中针对对方的翻译结果,不仅可以提高翻译效率,还能够提高用户体验。此外,相对于使用一对耳机中的两个耳机进行一对一翻译而言,本发明实施例还可以避免双方交流过程中对卫生的顾虑,进一步提高用户体验。
本发明的一个示例中,所述耳机收纳装置也可以具有联网功能;进而耳机和耳机收纳装置均可以直接与服务器连接。进而通过耳机、耳机收纳装置和服务器实现多人翻译。可参照图8a,图8a仅示出了一对一翻译的场景。
参照图8b、示出了本发明的又一种翻译方法实施例的步骤流程图。
步骤802、所述耳机采集所述第一用户的语音数据,作为源语音数据。
步骤804、所述耳机将所述源语音数据发送至所述服务器。
步骤806、所述服务器对所述源语音数据进行翻译,生成目标语音数据。
步骤808、所述服务器将所述目标语音数据返回给所述耳机收纳装置。
步骤810、所述耳机收纳装置播放所述目标语音数据。
步骤812、所述耳机收纳装置采集第二用户的语音数据。
步骤814、所述耳机收纳装置将采集第二用户的语音数据作为源语音数据,发送至服务器。
步骤816、所述服务器对所述源语音数据进行翻译,生成目标语音数据。
步骤818、所述服务器将所述目标语音数据发送给所述耳机。
步骤820、所述耳机播放所述目标语音数据。
本发明实施例与上述实施例类似,在此不再赘述。
本发明的一个实施例中,所述耳机将所述源语音数据发送至服务器的一种方式可以是:所述耳机将所述目标语音数据发送至中继设备,由所述中继设备将所述目标语音数据转发至服务器。以及后续可以接收中继设备返回的目标语音数据。
本发明的一个示例中,所述中继设备可以是耳机收纳装置。进而通过耳机、耳机收纳装置和服务器实现翻译。可参照图9a,图9a仅示出了一对一翻译的场景。
参照图9b、示出了本发明的又一种翻译方法实施例的步骤流程图。
步骤902、所述耳机采集所述第一用户的语音数据,作为源语音数据。
步骤904、所述耳机将所述源语音数据发送至所述耳机收纳装置。
步骤906、所述耳机收纳装置将所述源语音设备发送至服务器。
步骤908、所述服务器对所述源语音数据进行翻译,生成目标语音数据并返回给耳机收纳装置。
步骤910、所述耳机收纳装置播放所述目标语音数据。
步骤912、所述耳机收纳装置采集第二用户的语音数据,作为源语音数据并发送至服务器。
步骤914、所述服务器对所述源语音数据进行翻译,生成目标语音数据。
步骤916、所述服务器将所述目标语音数据发送给所述耳机收纳装置。
步骤918、所述耳机收纳装置将所述目标语音数据发送至所述耳机。
步骤920、所述耳机播放所述目标语音数据。
本发明实施例与上述实施例类似,在此不再赘述。
本发明实施例中,可以基于所述耳机和服务器可以进行同声传译,以实时的对源语音数据进行翻译,提高用户体验。
参照图10,示出了本发明的又一种翻译方法实施例的步骤流程图。
步骤1002、所述耳机获取源语音数据。
步骤1004、所述耳机将所述源语音数据发送至所述服务器。
步骤1006、所述服务器对所述源语音数据进行同声传译,生成目标语音数据。
步骤1008、所述服务器将所述目标语音数据返回至所述耳机。
本发明实施例中,无论是在上述通讯场景中,还是多人翻译场景中,所述耳机在获取源语音数据后,均可以对将所述源语音数据发送给服务器进行同声传译,生成目标语音数据;以提高翻译的效率和沟通的流畅性。
当然,在其他场景中,基于耳机和服务器也可以进行同声传译。例如线上会议、线上采访/面试,观看外媒演讲、新闻、外媒影视等场景,耳机将终端设备发送的源语音数据发送至服务器,服务器可以对该源语音数据进行同声传译,生成目标语音数据然后返回给耳机进行播放。又例如,参加国际会议/论坛时,可以由耳机收纳装置采集源语音数据并发送给耳机,由耳机将该源语音数据发送给服务器进行同声传译,生成目标语音数据并返回给耳机进行播放。当然,当耳机收纳装置可以联网时,也可以由耳机收纳装置直接将所述源语言数据发送给服务器进行同声传译,生成目标语音数据并返回给耳机进行播放。
综上,本发明实施例中,所述耳机获取源语音数据后,可以将所述源语音数据发送至所述服务器,由服务器对所述源语音数据进行同声传译,生成目标语音数据并返回给耳机;进而能够实时的对源语音数据进行翻译,提高了翻译效率。耳机获取的源语音数据由终端设备发送的或耳机采集的,源语音数据的噪音小,能够提高同声传译的准确性,进一步提高用户体验。此外,在同声传译过程中,无论是耳机是与耳机收纳装置连接,还是与终端设备连接;相对于现有技术而言,本发明实施例能够实现更远距离的同声传译。
所述耳机可以包括组成一对的两个耳机。不同用户对耳机的使用习惯不同,例如有些用户习惯使用一对耳机中的一个,而有些用户习惯同时使用一对耳机。且同一用户在不同场景下对耳机的使用习惯也不同,例如在跑步时,习惯同时使用一对耳机;在语音通话时,习惯使用其中的一个耳机。对应的,所述耳机播放语音数据的一种方式可以是:所述耳机根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配,所述语音数据包括源语音数据和/或目标语音数据。进而能够根据用户使用耳机的情况,合理的分配耳机的声道,提高用户体验。
本发明的一个示例中,一种所述耳机根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配的方式可以是:当两个耳机均被使用时,两个耳机分别播放所述源语音数据和目标语音数据。其中,两个耳机中的源语音数据和目标语音数据可以是同步播放的。例如,可以在左耳对应使用的一个耳机中播放源语音数据,在右耳对应使用的一个耳机中播放目标语音数据。又例如,可以在右耳对应使用的一个耳机中播放源语音数据,在左耳对应使用的一个耳机中播放目标语音数据;本发明实施例对此不作限制。
由于不同用户用于听母语的耳朵不同,例如有些用户习惯采用右耳听母语,左耳听外语;而有些用户习惯采用左耳听母语,右耳听外语。因此为了更好的满足用户个性化需求,本发明实施例的耳机支持用户对两个耳机中播放的语音数据的种类进行切换。其中,用户可以针对耳机执行切换操作,也可以在终端设备的与所述耳机对应的应用程序中执行切换操作;对应的,所述耳机接收用户的切换指令,切换两个耳机中播放的语音数据的种类。例如,若当前是在右耳对应使用的一个耳机中播放源语音数据,在左耳对应使用的一个耳机中播放目标语音数据;则在接收到切换指令后,可以在左耳对应使用的一个耳机中播放源语音数据,以及在右耳对应使用的一个耳机中播放目标语音数据。其中,所述针对耳机的切换操作可以是触控操作;也可以是用户发出的语音指令;还可以是用户使用耳机时头部的动作,本发明实施例对此不作限制。
本发明的一个实施例中,用户还可以针对所述耳机执行音量调节操作,也可以在终端设备中执行音量调节操作,以调节耳机的播放音量。对应的,所述耳机可以接收用户的音量调节指令,调节所述音乐调节指令对应耳机的音量;进而可以分别对每个耳机的音量进行调节。其中,所述针对耳机的音量调节操作可以是触控操作;也可以是用户发出的语音指令;还可以是用户使用耳机时头部的动作,本发明实施例对此不作限制。
本发明的一个实施例中,所述耳机可以接收用户的音量调节指令,调节两个耳机的音量;进而同时调节两个耳机的音量。
此外,有些用户可能不习惯两个耳机中播放不同语言的语音数据;对应的,所述耳机还可以提供种类选取的功能,用户可以针对耳机执行种类选取操作,也可以在终端设备中与所述耳机对应的应用程序中执行切换操作,使两个耳机中播放同一语言的语音数据。待用户执行种类选取操作后,所述耳机接收用户的种类选取指令,所述两个耳机均播放所述目标语音数据或均播放源语音数据。其中,所述针对耳机执行种类选取操作可以是触控操作,也可以是用户发出的语音指令,还可以是用户使用耳机时头部的动作,本发明实施例对此不作限制。
本发明的另一个示例中,另一种所述耳机根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配的方式可以是:当其中一个耳机被使用时,被使用的耳机播放所述源语音数据和目标语音数据的混音。其中,可以将源语音数据和目标语音数据进行混音后,在所述耳机中播放该混音。后续用户可以调节混音中源语音数据和目标语音数据的音量,以及混音的整体音量,以更的满足用户个性化需求,提高用户体验。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
本发明实施例还公开了一种翻译装置,应用于耳机中。
参照图11,示出了本发明的一种耳机侧翻译装置实施例的结构框图,具体可以包括如下模块:
获取模块1102,用于获取源语音数据;
第一发送模块1104,用于将所述源语音数据发送至服务器,以使所述服务器对所述源语音数据进行翻译,生成目标语音数据并返回;
第一接收模块1106,用于接收所述服务器返回的目标语音数据。
参照图12,示出了本发明的一种耳机侧翻译装置可选实施例的结构框图。
本发明一个可选的实施例中,所述耳机还与终端设备连接,所述耳机由所述终端设备对应的第一通讯用户使用;
所述获取模块1102,包括:
第一语音数据接收子模块11022,用于接收所述终端设备发送的语音数据,作为源语音数据;其中,所述终端设备发送的语音数据是所述第一通讯用户通过所述终端设备与至少一个第二通讯用户语音通话的过程中,所述终端设备接收到的第二通讯用户的语音数据;
所述的装置还包括:
第一播放模块1108,用于播放所述目标语音数据。
本发明一个可选的实施例中,所述耳机还与终端设备连接,所述耳机由所述终端设备对应的第一通讯用户使用;
所述获取模块1102,包括:
第一语音数据采集子模块11024,用于在所述第一通讯用户通过所述终端设备与至少一个第二通讯用户通讯的过程中,采集所述第一通讯用户的语音数据,作为源语音数据;
所述的装置还包括:
第二发送模块1110,用于将所述目标语音数据发送至所述终端设备,以使所述终端设备将所述目标语音数据发送至所述第二通讯用户的终端设备。
本发明一个可选的实施例中,所述耳机包括:第一耳机和至少一个第二耳机,所述第一耳机由第一用户使用,所述第二耳机由至少一个第二用户使用;
所述获取模块1102,包括:
第二语音数据采集子模块11026,用于调用所述第一耳机采集所述第一用户的语音数据,作为源语音数据;
所述第一发送模块1104,用于调用所述第一耳机将所述源语音数据发送至服务器;
所述第一接收模块1106,用于调用所述第二耳机接收所述服务器返回的目标语音数据;
所述的装置还包括:
第二播放模块1112,用于调用所述第二耳机播放所述目标语音数据。
本发明一个可选的实施例中,所述耳机还与耳机收纳装置连接,所述耳机包括至少一个,所述耳机收纳装置包括至少一个,所述耳机由至少一个第一用户使用,所述耳机收纳装置由至少一个第二用户使用;
所述获取模块1102,包括:
第三语音数据采集子模块11028,用于调用所述第一耳机采集所述第一用户的语音数据,作为源语音数据;
所述的装置还包括:
第三发送模块1114,用于将所述目标语音数据发送至所述耳机收纳装置,以使所述耳机收纳装置播放所述目标语音数据。
本发明一个可选的实施例中,所述耳机还与耳机收纳装置连接,所述耳机包括至少一个,所述耳机收纳装置包括至少一个,所述耳机由至少一个第一用户使用,所述耳机收纳装置由至少一个第二用户使用;
所述获取模块1102,包括:
第二语音数据接收子模块110210,用于接收所述耳机收纳装置发送的语音数据,作为源语音数据,所述耳机收纳装置发送的语音数据是所述耳机收纳装置采集的所述第二用户的语音数据;
所述的装置还包括:
第三播放模块1116,用于播放所述目标语音数据。
本发明一个可选的实施例中,所述的装置还包括:
分配模块1118,用于根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配,所述语音数据包括源语音数据和/或目标语音数据
本发明一个可选的实施例中,所述分配模块1118,包括:
第一声道分配子模块11182,用于当两个耳机均被使用时,两个耳机分别播放所述源语音数据和目标语音数据。
本发明一个可选的实施例中,所述的装置还包括:
切换模块1120,用于接收用户的切换指令,切换所述两个耳机中播放的语音数据的种类;
调节模块1122,用于接收用户的音量调节指令,调节所述音乐调节指令对应耳机的音量;
选取模块1124,用于接收用户的种类选取指令,所述两个耳机均播放所述目标语音数据或均播放源语音数据。
本发明一个可选的实施例中,所述分配模块1118,包括:
第二声道分配子模块11184,用于当其中一个耳机被使用时,被使用的耳机播放所述源语音数据和目标语音数据的混音
本发明一个可选的实施例中,所述翻译包括同声传译。
本发明一个可选的实施例中,
所述第一发送模块1104,用于将所述目标语音数据发送至中继设备,由所述中继设备将所述目标语音数据转发至服务器。
综上,本发明实施例中,耳机可以获取源语音数据,然后对将所述源语音数据发送服务器,由服务器对所述源语音数据进行翻译,生成目标语音数据并返回给耳机;进而用户只需采用耳机即可以实现翻译,无需采用专用翻译设备。
本发明实施例还公开了一种翻译装置,应用于服务器中。
参照图13,示出了本发明的一种服务器侧翻译装置实施例的结构框图,具体可以包括如下模块:
第二接收模块1302,用于接收所述耳机发送的源语音数据;
翻译模块1304,用于对所述源语音数据进行翻译,生成目标语音数据;
返回模块1306,用于将所述目标语音数据返回给所述耳机。
参照图14,示出了本发明的一种服务器侧翻译装置可选实施例的结构框图,具体可以包括如下模块:
本发明一个可选的实施例中,所述耳机包括:第一耳机和至少一个第二耳机,所述第一耳机由第一用户使用,所述第二耳机由至少一个第二用户使用;所述源语音数据是所述第一耳机采集的第一用户的语音数据;
所述的装置还包括:
第四发送模块1308,用于将所述目标语音数据发送至第二耳机,由所述第二耳机播放所述目标语音数据。
本发明一个可选的实施例中,所述翻译模块1306,用于对所述源语音数据进行同声传译,生成目标语音数据。
综上,本发明实施例中,服务器在获取到耳机发送的源语音数据后,可以对所述源语音数据进行翻译,生成目标语音数据并返回给耳机;进而用户只需采用耳机即可以实现翻译,无需采用专用翻译设备。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图15是根据一示例性实施例示出的一种用于翻译的耳机1500的结构框图。
参照图15,耳机1500可以包括以下一个或多个组件:处理组件1502,存储器1504,电力组件1506,多媒体组件1508,音频组件1510,输入/输出(I/O)的接口1512,传感器组件1514,以及通信组件1516。
处理组件1502通常控制耳机1500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件1502可以包括一个或多个处理器1520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1502可以包括一个或多个模块,便于处理组件1502和其他组件之间的交互。例如,处理部件1502可以包括多媒体模块,以方便多媒体组件1508和处理组件1502之间的交互。
存储器1504被配置为存储各种类型的数据以支持在耳机1500的操作。这些数据的示例包括用于在耳机1500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件1506为耳机1500的各种组件提供电力。电力组件1506可以包括电源管理系统,一个或多个电源,及其他与为耳机1500生成、管理和分配电力相关联的组件。
多媒体组件1508包括在所述耳机1500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1508包括一个前置摄像头和/或后置摄像头。当耳机1500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1510被配置为输出和/或输入音频信号。例如,音频组件1510包括一个麦克风(MIC),当耳机1500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1504或经由通信组件1516发送。在一些实施例中,音频组件1510还包括一个扬声器,用于输出音频信号。
I/O接口1512为处理组件1502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1514包括一个或多个传感器,用于为耳机1500提供各个方面的状态评估。例如,传感器组件1514可以检测到耳机1500的打开/关闭状态,组件的相对定位,例如所述组件为耳机1500的显示器和小键盘,传感器组件1514还可以检测耳机1500或耳机1500一个组件的位置改变,用户与耳机1500接触的存在或不存在,耳机1500方位或加速/减速和耳机1500的温度变化。传感器组件1514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1514还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1516被配置为便于耳机1500和其他设备之间有线或无线方式的通信。耳机1500可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件1514经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件1514还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,耳机1500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1504,上述指令可由耳机1500的处理器1520执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由耳机的处理器执行时,使得耳机能够执行一种翻译方法,所述方法包括:获取源语音数据;将所述源语音数据发送至服务器,以使所述服务器对所述源语音数据进行翻译,生成目标语音数据并返回;接收所述服务器返回的目标语音数据。
可选地,所述耳机还与终端设备连接,所述耳机由所述终端设备对应的第一通讯用户使用;所述获取源语音数据,包括:接收所述终端设备发送的语音数据,作为源语音数据;其中,所述终端设备发送的语音数据是所述第一通讯用户通过所述终端设备与至少一个第二通讯用户语音通话的过程中,所述终端设备接收到的第二通讯用户的语音数据;还包含用于进行以下操作的指令:播放所述目标语音数据。
可选地,所述耳机还与终端设备连接,所述耳机由所述终端设备对应的第一通讯用户使用;所述获取源语音数据,包括:在所述第一通讯用户通过所述终端设备与至少一个第二通讯用户通讯的过程中,采集所述第一通讯用户的语音数据,作为源语音数据;还包含用于进行以下操作的指令:将所述目标语音数据发送至所述终端设备,以使所述终端设备将所述目标语音数据发送至所述第二通讯用户的终端设备。
可选地,所述耳机包括:第一耳机和至少一个第二耳机,所述第一耳机由第一用户使用,所述第二耳机由至少一个第二用户使用;所述获取源语音数据,包括:所述第一耳机采集所述第一用户的语音数据,作为源语音数据;所述将所述源语音数据发送至服务器,包括:所述第一耳机将所述源语音数据发送至服务器;所述接收所述服务器返回的目标语音数据,包括:所述第二耳机接收所述服务器返回的目标语音数据;还包含用于进行以下操作的指令:所述第二耳机播放所述目标语音数据。
可选地,所述耳机还与耳机收纳装置连接,所述耳机包括至少一个,所述耳机收纳装置包括至少一个,所述耳机由至少一个第一用户使用,所述耳机收纳装置由至少一个第二用户使用;所述获取源语音数据,包括:所述第一耳机采集所述第一用户的语音数据,作为源语音数据;还包含用于进行以下操作的指令:将所述目标语音数据发送至所述耳机收纳装置,以使所述耳机收纳装置播放所述目标语音数据。
可选地,所述耳机还与耳机收纳装置连接,所述耳机包括至少一个,所述耳机收纳装置包括至少一个,所述耳机由至少一个第一用户使用,所述耳机收纳装置由至少一个第二用户使用;所述获取源语音数据,包括:接收所述耳机收纳装置发送的语音数据,作为源语音数据,所述耳机收纳装置发送的语音数据是所述耳机收纳装置采集的所述第二用户的语音数据;还包含用于进行以下操作的指令:播放所述目标语音数据。
可选地,还包含用于进行以下操作的指令:根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配,所述语音数据包括源语音数据和/或目标语音数据。
可选地,所述耳机根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配,包括:当两个耳机均被使用时,两个耳机分别播放所述源语音数据和目标语音数据。
可选地,还包含用于进行以下操作的指令:接收用户的切换指令,切换所述两个耳机中播放的语音数据的种类;或接收用户的音量调节指令,调节所述音乐调节指令对应耳机的音量;或接收用户的种类选取指令,所述两个耳机均播放所述目标语音数据或均播放源语音数据。
可选地,所述耳机根据所述耳机的使用情况,控制所述耳机在播放语音数据时的声道分配,包括:当其中一个耳机被使用时,被使用的耳机播放所述源语音数据和目标语音数据的混音。
可选地,所述翻译包括同声传译。
可选地,所述将所述源语音数据发送至服务器,包括:将所述目标语音数据发送至中继设备,由所述中继设备将所述目标语音数据转发至服务器。
图16是本发明根据另一示例性实施例示出的一种用于翻译的服务器1600的结构示意图。该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1622(例如,一个或一个以上处理器)和存储器1632,一个或一个以上存储应用程序1642或数据1644的存储介质1630(例如一个或一个以上海量存储设备)。其中,存储器1632和存储介质1630可以是短暂存储或持久存储。存储在存储介质1630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1622可以设置为与存储介质1630通信,在服务器上执行存储介质1630中的一系列指令操作。
服务器还可以包括一个或一个以上电源1626,一个或一个以上有线或无线网络接口1650,一个或一个以上输入输出接口1658,一个或一个以上键盘1656,和/或,一个或一个以上操作系统1641,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种服务器,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:接收所述耳机发送的源语音数据;对所述源语音数据进行翻译,生成目标语音数据;将所述目标语音数据返回给所述耳机。
可选地,所述耳机包括:第一耳机和至少一个第二耳机,所述第一耳机由第一用户使用,所述第二耳机由至少一个第二用户使用;所述源语音数据是所述第一耳机采集的第一用户的语音数据;还包含用于进行以下操作的指令:将所述目标语音数据发送至第二耳机,由所述第二耳机播放所述目标语音数据。
可选地,所述对所述源语音数据进行翻译,生成目标语音数据,包括:对所述源语音数据进行同声传译,生成目标语音数据。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种翻译方法、一种翻译装置、一种耳机和一种服务器,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种翻译方法,其特征在于,应用于耳机中,所述耳机与服务器连接,所述的方法包括:
所述耳机获取源语音数据;
所述耳机将所述源语音数据发送至服务器,以使所述服务器对所述源语音数据进行翻译,生成目标语音数据并返回;
所述耳机接收所述服务器返回的目标语音数据。
2.根据权利要求1所述的方法,其特征在于,所述耳机还与终端设备连接,所述耳机由所述终端设备对应的第一通讯用户使用;
所述耳机获取源语音数据,包括:
所述耳机接收所述终端设备发送的语音数据,作为源语音数据;其中,所述终端设备发送的语音数据是所述第一通讯用户通过所述终端设备与至少一个第二通讯用户语音通话的过程中,所述终端设备接收到的第二通讯用户的语音数据;
所述的方法还包括:
所述耳机播放所述目标语音数据。
3.一种翻译方法,其特征在于,应用于服务器中,所述服务器与耳机连接,包括:
所述服务器接收所述耳机发送的源语音数据;
所述服务器对所述源语音数据进行翻译,生成目标语音数据;
所述服务器将所述目标语音数据返回给所述耳机。
4.根据权利要求3所述的方法,其特征在于,所述耳机包括:第一耳机和至少一个第二耳机,所述第一耳机由第一用户使用,所述第二耳机由至少一个第二用户使用;所述源语音数据是所述第一耳机采集的第一用户的语音数据;
所述的方法还包括:
所述服务器将所述目标语音数据发送至第二耳机,由所述第二耳机播放所述目标语音数据。
5.一种翻译装置,其特征在于,应用于耳机中,所述耳机与服务器连接,所述的装置包括:
获取模块,用于获取源语音数据;
第一发送模块,用于将所述源语音数据发送至服务器,以使所述服务器对所述源语音数据进行翻译,生成目标语音数据并返回;
第一接收模块,用于接收所述服务器返回的目标语音数据。
6.一种翻译装置,其特征在于,应用于服务器中,所述服务器与耳机连接,所述的装置包括:
第二接收模块,用于接收所述耳机发送的源语音数据;
翻译模块,用于对所述源语音数据进行翻译,生成目标语音数据;
返回模块,用于将所述目标语音数据返回给所述耳机。
7.一种耳机,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取源语音数据;
将所述源语音数据发送至服务器,以使所述服务器对所述源语音数据进行翻译,生成目标语音数据并返回;
接收所述服务器返回的目标语音数据。
8.一种服务器,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收所述耳机发送的源语音数据;
对所述源语音数据进行翻译,生成目标语音数据;
将所述目标语音数据返回给所述耳机。
9.一种可读存储介质,其特征在于,当所述存储介质中的指令由耳机的处理器执行时,使得耳机能够执行如方法权利要求1-2任一所述的翻译方法。
10.一种可读存储介质,其特征在于,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如方法权利要求3-4任一所述的翻译方法。
CN202010508210.7A 2020-06-05 2020-06-05 一种翻译方法、装置、耳机和服务器 Active CN111739538B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010508210.7A CN111739538B (zh) 2020-06-05 2020-06-05 一种翻译方法、装置、耳机和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010508210.7A CN111739538B (zh) 2020-06-05 2020-06-05 一种翻译方法、装置、耳机和服务器

Publications (2)

Publication Number Publication Date
CN111739538A true CN111739538A (zh) 2020-10-02
CN111739538B CN111739538B (zh) 2022-04-26

Family

ID=72648354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010508210.7A Active CN111739538B (zh) 2020-06-05 2020-06-05 一种翻译方法、装置、耳机和服务器

Country Status (1)

Country Link
CN (1) CN111739538B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112331179A (zh) * 2020-11-11 2021-02-05 北京搜狗科技发展有限公司 一种数据处理方法和耳机收纳装置
CN113286217A (zh) * 2021-04-23 2021-08-20 北京搜狗智能科技有限公司 一种通话语音翻译方法、装置和耳机设备

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107333200A (zh) * 2017-07-24 2017-11-07 歌尔科技有限公司 一种翻译耳机收纳盒、无线翻译耳机和无线翻译系统
CN107333201A (zh) * 2017-07-24 2017-11-07 歌尔科技有限公司 一种翻译耳机收纳盒、无线翻译耳机和无线翻译系统
CN108509428A (zh) * 2018-02-26 2018-09-07 深圳市百泰实业股份有限公司 耳机翻译方法和系统
CN108572950A (zh) * 2017-03-08 2018-09-25 捷音特科技股份有限公司 耳麦翻译系统
CN108710615A (zh) * 2018-05-03 2018-10-26 Oppo广东移动通信有限公司 翻译方法及相关设备
US20180322116A1 (en) * 2017-05-03 2018-11-08 Jetvox Acoustic Corp. Interactive translation system
CN108923810A (zh) * 2018-06-15 2018-11-30 Oppo广东移动通信有限公司 翻译方法及相关设备
CN109033092A (zh) * 2018-06-13 2018-12-18 深圳市思创达塑胶模具有限公司 一种实时翻译系统、方法及翻译设备
CN109067965A (zh) * 2018-06-15 2018-12-21 Oppo广东移动通信有限公司 翻译方法、翻译装置、可穿戴装置及存储介质
CN109275057A (zh) * 2018-08-31 2019-01-25 歌尔科技有限公司 一种翻译耳机语音输出方法、系统及翻译耳机和存储介质
CN109543198A (zh) * 2018-11-29 2019-03-29 与德科技有限公司 翻译方法、装置、系统及存储介质
CN109614628A (zh) * 2018-11-16 2019-04-12 广州市讯飞樽鸿信息技术有限公司 一种基于智能硬件的翻译方法与翻译系统
KR20190080305A (ko) * 2017-12-28 2019-07-08 주식회사 오르페오사운드웍스 인-이어 마이크로폰을 갖는 이어셋을 이용한 실시간 통역서비스 시스템 및 방법
CN110147557A (zh) * 2019-05-23 2019-08-20 歌尔科技有限公司 一种翻译方法、系统及无线耳机的充电盒和存储介质
WO2019164078A1 (ko) * 2018-02-23 2019-08-29 (주)에어사운드 주제문 추출 가능한 실시간 다자 통역 무선 송수신 시스템 및 이를 이용한 송수신 방법
CN110381485A (zh) * 2019-06-14 2019-10-25 华为技术有限公司 蓝牙通信方法、tws蓝牙耳机及终端
CN110446132A (zh) * 2019-08-07 2019-11-12 深圳市和信电子有限公司 一种实时翻译tws蓝牙耳机及其使用方法

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108572950A (zh) * 2017-03-08 2018-09-25 捷音特科技股份有限公司 耳麦翻译系统
US20180322116A1 (en) * 2017-05-03 2018-11-08 Jetvox Acoustic Corp. Interactive translation system
CN107333201A (zh) * 2017-07-24 2017-11-07 歌尔科技有限公司 一种翻译耳机收纳盒、无线翻译耳机和无线翻译系统
CN107333200A (zh) * 2017-07-24 2017-11-07 歌尔科技有限公司 一种翻译耳机收纳盒、无线翻译耳机和无线翻译系统
KR20190080305A (ko) * 2017-12-28 2019-07-08 주식회사 오르페오사운드웍스 인-이어 마이크로폰을 갖는 이어셋을 이용한 실시간 통역서비스 시스템 및 방법
WO2019164078A1 (ko) * 2018-02-23 2019-08-29 (주)에어사운드 주제문 추출 가능한 실시간 다자 통역 무선 송수신 시스템 및 이를 이용한 송수신 방법
CN108509428A (zh) * 2018-02-26 2018-09-07 深圳市百泰实业股份有限公司 耳机翻译方法和系统
CN108710615A (zh) * 2018-05-03 2018-10-26 Oppo广东移动通信有限公司 翻译方法及相关设备
CN109033092A (zh) * 2018-06-13 2018-12-18 深圳市思创达塑胶模具有限公司 一种实时翻译系统、方法及翻译设备
CN109067965A (zh) * 2018-06-15 2018-12-21 Oppo广东移动通信有限公司 翻译方法、翻译装置、可穿戴装置及存储介质
CN108923810A (zh) * 2018-06-15 2018-11-30 Oppo广东移动通信有限公司 翻译方法及相关设备
CN109275057A (zh) * 2018-08-31 2019-01-25 歌尔科技有限公司 一种翻译耳机语音输出方法、系统及翻译耳机和存储介质
CN109614628A (zh) * 2018-11-16 2019-04-12 广州市讯飞樽鸿信息技术有限公司 一种基于智能硬件的翻译方法与翻译系统
CN109543198A (zh) * 2018-11-29 2019-03-29 与德科技有限公司 翻译方法、装置、系统及存储介质
CN110147557A (zh) * 2019-05-23 2019-08-20 歌尔科技有限公司 一种翻译方法、系统及无线耳机的充电盒和存储介质
CN110381485A (zh) * 2019-06-14 2019-10-25 华为技术有限公司 蓝牙通信方法、tws蓝牙耳机及终端
CN110446132A (zh) * 2019-08-07 2019-11-12 深圳市和信电子有限公司 一种实时翻译tws蓝牙耳机及其使用方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112331179A (zh) * 2020-11-11 2021-02-05 北京搜狗科技发展有限公司 一种数据处理方法和耳机收纳装置
CN113286217A (zh) * 2021-04-23 2021-08-20 北京搜狗智能科技有限公司 一种通话语音翻译方法、装置和耳机设备

Also Published As

Publication number Publication date
CN111739538B (zh) 2022-04-26

Similar Documents

Publication Publication Date Title
JP6121621B2 (ja) 音声通話方法、装置、プログラム、及び記録媒体
CN111696554B (zh) 一种翻译方法、装置、耳机和耳机收纳装置
CN109360549B (zh) 一种数据处理方法、穿戴设备和用于数据处理的装置
WO2017181551A1 (zh) 视频处理方法及装置
CN111583952B (zh) 音频处理方法、装置、电子设备及存储介质
CN106454644B (zh) 音频播放方法及装置
CN109151565B (zh) 播放语音的方法、装置、电子设备及存储介质
CN111739538B (zh) 一种翻译方法、装置、耳机和服务器
CN105407368A (zh) 多媒体播放方法、装置及系统
WO2021244135A1 (zh) 一种翻译方法、装置和耳机
CN109788364B (zh) 视频通话互动方法、装置及电子设备
US20220210501A1 (en) Method and apparatus for playing data
CN114513571A (zh) 设备连接方法、装置、电子设备及可读储存介质
CN110913276B (zh) 数据处理的方法、装置、服务器、终端及存储介质
CN112511686A (zh) 一种录音方法和耳机设备
CN116758896A (zh) 会议音频语种调整方法、装置、电子设备和存储介质
CN116320514A (zh) 一种音视频会议直播的方法、系统、电子设备和介质
CN113286217A (zh) 一种通话语音翻译方法、装置和耳机设备
CN117813652A (zh) 音频信号编码方法、装置、电子设备和存储介质
CN111694539B (zh) 在听筒和扬声器之间切换的方法、装置及介质
CN110213531B (zh) 监控录像处理方法及装置
CN107340990B (zh) 播放方法及装置
CN112039756A (zh) 一种建立实时通信的方法、装置、电子设备及介质
CN105700878B (zh) 消息编辑的处理方法和装置
CN113286218B (zh) 一种翻译方法、装置和耳机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant