CN112331179A - 一种数据处理方法和耳机收纳装置 - Google Patents
一种数据处理方法和耳机收纳装置 Download PDFInfo
- Publication number
- CN112331179A CN112331179A CN202011255959.1A CN202011255959A CN112331179A CN 112331179 A CN112331179 A CN 112331179A CN 202011255959 A CN202011255959 A CN 202011255959A CN 112331179 A CN112331179 A CN 112331179A
- Authority
- CN
- China
- Prior art keywords
- voice
- earphone
- processing module
- data
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 762
- 238000000034 method Methods 0.000 claims abstract description 265
- 230000008569 process Effects 0.000 claims abstract description 130
- 238000013519 translation Methods 0.000 claims description 186
- 230000006854 communication Effects 0.000 description 67
- 230000002452 interceptive effect Effects 0.000 description 51
- 238000004891 communication Methods 0.000 description 46
- 230000003993 interaction Effects 0.000 description 33
- 230000008451 emotion Effects 0.000 description 21
- 230000009467 reduction Effects 0.000 description 15
- 230000007613 environmental effect Effects 0.000 description 14
- 230000000694 effects Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000008859 change Effects 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 9
- 238000001914 filtration Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 230000005389 magnetism Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000033764 rhythmic process Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 206010048909 Boredom Diseases 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
Abstract
本发明实施例提供了一种数据处理方法和耳机收纳装置,其中,所述方法应用于耳机收纳装置中,所述耳机收纳装置与耳机无线连接,所述耳机收纳装置包括语音处理模块,所述的方法包括:所述语音处理模块获取目标数据,所述目标数据由所述耳机收纳装置采集和/或由所述耳机发送;所述语音处理模块对所述目标数据进行处理;从而增加对耳机收纳装置的资源利用,以及增加耳机/耳机收纳装置的用途。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种数据处理方法和耳机收纳装置。
背景技术
随着计算机技术和通信技术的不断发展,人们的工作、生活也逐渐趋向电子化、信息化和网络化。终端设备是实现电子化、信息化和网络化的重要载体之一,例如采用终端设备进行办公、采用终端设备进行通讯等等;进而终端设备也被普遍使用。
在很多场景下,用户会在终端设备中接入耳机:如在通讯的场景下,接入耳机不仅能够更清楚的听到对端的语音,还能够解放双手;又例如,在观看视频、听音乐、直播、视频/语音通话等等,接入耳机不仅能获取到高质量的音频,还能够保护隐私,降低对他人的干扰;这使得耳机也逐渐成为用户常用常备的外部设备之一。
目前,为无线耳机通常配备了耳机盒,采用耳机盒收纳耳机和为耳机充电。显然,耳机盒仅用于收纳耳机和无线耳机充电,造成了对耳机盒的资源浪费。且用户仅能采用耳机听音乐、接听/拨打电话等等,用途局限。
发明内容
本发明实施例提供一种数据处理方法,以通过增加耳机收纳装置的语音处理模块,使得耳机收纳装置能够进行数据处理,进而增加对耳机收纳装置的资源利用,以及增加耳机/耳机收纳装置的用途。
相应的,本发明实施例还提供了一种耳机收纳装置,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种数据处理方法,应用于耳机收纳装置中,所述耳机收纳装置与耳机无线连接,所述耳机收纳装置包括语音处理模块,所述的方法包括:所述语音处理模块获取目标数据,所述目标数据由所述耳机收纳装置采集和/或由所述耳机发送;所述语音处理模块对所述目标数据进行处理。
可选地,所述耳机还与第一用户使用的第一终端设备连接;所述语音处理模块获取目标数据,包括:在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是由所述耳机采集的第一用户的语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行翻译,得到第一翻译语音数据;所述的方法还包括:所述语音处理模块将所述第一翻译语音数据发送至所述耳机,以由所述耳机将所述第一翻译语音数据发送至第一终端设备后,所述第一终端设备将所述第一翻译语音数据发送至第二终端设备。
可选地,所述耳机还与第一用户使用的第一终端设备连接,所述语音处理模块获取目标数据,包括:在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是第二用户的语音数据,由第二终端设备发送至第一终端设备并由第一终端设备发送至所述耳机;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行翻译,得到第二翻译语音数据;所述的方法还包括:所述语音处理模块将所述第二翻译数据发送至所述耳机,由所述耳机播放所述第二翻译语音数据。
可选地,所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述目标数据进行同声传译,得到同声传译结果;所述耳机收纳装置还包括播放模块,所述的方法还包括:所述语音处理模块将同声传译结果发送至所述播放模块,所述播放模块播放所述同声传译结果;或,所述语音处理模块将同声传译结果发送至所述耳机,以由所述耳机播放所述同声传译结果;或,所述语音处理模块将同声传译结果发送至所述耳机,以由所述耳机将所述同声传译结果发送至与所述耳机连接的终端设备后,所述终端设备将同声传译结果发送至与所述终端设备通话的其他终端设备。
可选地,应用于翻译场景中,所述耳机由第一用户使用,所述耳机收纳装置由至少一个第二用户使用;所述语音处理模块获取目标数据,包括:所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是所述耳机采集的第一用户的语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行翻译,得到第三翻译语音数据;所述耳机收纳装置还包括播放模块,所述的方法还包括:所述语音处理模块将所述第三翻译语音数据发送至所述播放模块,由所述播放模块播放所述第三翻译语音数据。
可选地,所述耳机收纳装置还包括语音采集模块,所述语音处理模块获取目标数据,还包括:所述语音处理模块获取所述语音采集模块采集的语音数据,所述语音数据是第二用户的语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行翻译,得到第四翻译语音数据;所述的方法还包括:所述语音处理模块将第四翻译语音数据发送至所述耳机,由所述耳机播放所述第四翻译语音数据。
可选地,所述耳机包括:第一耳机和至少一个第二耳机,所述第二耳机和第一耳机,分别与所述耳机收纳装置连接;所述第一耳机由第一用户使用,所述第二耳机由第二用户使用;所述语音处理模块获取目标数据,包括:所述语音处理模块接收所述第一耳机发送的语音数据,所述语音数据是所述第一耳机采集的第一用户的语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行翻译,得到第五翻译语音数据;所述的方法还包括:所述语音处理模块将第五翻译语音数据发送至所述至少一个第二耳机,由所述至少一个第二耳机播放所述第五翻译数据。
可选地,所述耳机还与终端设备连接,所述语音处理模块获取目标数据,包括:所述语音处理模块接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果并基于所述识别结果生成播报信息;所述的方法还包括:所述语音处理模块将所述播报信息返回至所述耳机,由耳机基于所述播报信息进行语音播报。
可选地,所述耳机还与终端设备连接,所述语音处理模块获取目标数据,包括:所述语音处理模块接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果;所述的方法还包括:若所述识别结果是预设识别结果,则生成来电拦截指令并将所述来电拦截指令发送至所述耳机,由所述耳机将所述来电拦截指令发送至所述终端设备,以对所述来电进行拦截。
可选地,所述耳机还与终端设备连接,所述语音处理模块获取目标数据,包括:所述语音处理模块接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果;基于所述识别结果对所述终端设备接收到的来电进行代接。
可选地,所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述目标数据进行美化处理,得到美化语音数据;所述耳机收纳装置还包括播放模块,所述的方法还包括:所述语音处理模块将所述美化语音数据发送至所述播放模块,所述播放模块播放所述美化语音数据;或,所述语音处理模块将所述美化语音数据返回给所述耳机,由所述耳机将所述美化语音数据发送至与所述耳机连接的终端设备。
可选地,所述美化处理包括以下至少一种:滤除所述目标数据中的用户噪音,所述用户噪音表征用户产生的噪音,所述用户噪音包括:哈气音、颤音和口音中的至少一种;音效处理;所述音效处理包括如下处理中的至少一种:环绕处理、信道均衡处理、以及混响处理。
可选地,所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行变声处理,得到变声语音数据;所述耳机收纳装置还包括播放模块,所述的方法还包括:所述语音处理模块将所述变声语音数据发送至所述播放模块,所述播放模块播放所述变声语音数据;或,所述语音处理模块将所述变声语音数据返回给所述耳机,由所述耳机将所述变声语音数据发送至与所述耳机连接的终端设备。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取对话的语音数据;所述对话的参与方包括:至少两个用户;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块确定所述语音数据对应的提示信息;所述提示信息为依据所述语音数据对应的语义信息、和/或、情绪信息得到;所述的方法还包括:所述语音处理模块在对话过程中、和/或、在对话结束后,输出所述提示信息。
可选地,所述耳机还与终端设备连接,所述语音处理模块获取目标数据,包括:在所述终端设备通话过程中,所述语音处理模块从所述耳机接收通话语音数据;所述语音处理模块对所述目标数据进行处理,包括:对所述通话语音数据进行存储。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取环境音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块根据所述环境音数据,识别环境中的潜在风险事件;所述的方法还包括:所述语音处理模块向所述耳机发送所述潜在风险事件,由所述耳机根据所述潜在风险事件进行声音提醒。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取通话语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述通话语音数据进行语音增强;所述的方法还包括:所述语音处理模块将经过语音增强的通话语音数据发送至所述耳机,由所述耳机播放经过语音增强的通话语音数据;或,所述语音处理模块将经过语音增强的通话语音数据发送至所述耳机,由所述耳机将经过语音增强的通话语音数据发送至与耳机连接的终端设备。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取导航查询语音数据;所述的方法还包括:所述语音处理模块获取用户地理位置信息和用户方位信息;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块根据所述用户方位信息和所述用户地理位置信息,生成所述导航查询语音数据对应的导航结果语音数据;所述耳机收纳装置还包括播放模块,所述的方法还包括:所述语音处理模块将所述导航结果语音数据发送至所述播放模块,所述播放模块播放所述导航结果语音数据;或,所述语音处理模块将所述导航结果语音数据发送至所述耳机,由所述耳机播放所述导航结果语音数据。
可选地,所述耳机收纳装置设置有交互助手,所述语音处理模块获取目标数据,包括:所述语音处理模块获取语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行指令识别,得到对应的交互指令;所述的方法还包括:所述语音处理模块将所述交互指令发送至所述交互助手,以调用所述交互助手执行所述交互指令对应的交互操作。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行识别,获取所述所述语音数据中的问题语句并确定所述问题语句对应的答复语句;所述耳机收纳装置还包括播放模块,所述的方法还包括:所述语音处理模块将答复语句发送至所述播放模块,所述播放模块播放所述答复语句;或,所述语音处理模块将答复语句发送至所述耳机,由所述耳机播放所述答复语句。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行降噪处理/回音消除处理。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行语音识别,得到语音识别文本。
可选地,所述耳机还与终端设备连接,所述耳机收纳装置还包括显示模块和存储模块;所述的方法还包括:所述语音处理模块将所述语音识别文本,发送至所述耳机收纳装置的显示模块中显示;和/或,所述语音处理模块将所述语音识别文本,发送至所述耳机收纳装置的存储模块中存储;和/或,所述语音处理模块将所述语音识别文本发送至所述耳机,由所述耳机将所述语音识别文本发送至所述终端设备存储和/或显示。
可选地,所述的方法还包括:依据所述语音识别文本生成备忘信息。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块从所述语音数据中识别目标语音片段并标记。
可选地,所述耳机收纳装置还包括显示模块,所述语音处理模块获取目标数据,包括:所述语音处理模块获取语音数据,所述语音数据是用户针对所述显示模块中显示信息进行操作的语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行指令识别,得到对应的操作指令;所述的方法还包括:所述语音处理模块将所述操作指令发送至所述显示模块,由所述显示模块获取所述操作指令对应的待显示信息,显示所述待显示信息。
本发明实施例还公开了一种耳机收纳装置,所述耳机收纳装置与耳机无线连接,所述耳机收纳装置包括:语音处理模块,所述语音处理模块,用于获取目标数据,所述目标数据由所述耳机收纳装置采集和/或由所述耳机发送;对所述目标数据进行处理。
可选地,所述耳机还与第一用户使用的第一终端设备连接;所述语音处理模块,用于在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,接收所述耳机发送的语音数据,所述语音数据是由所述耳机采集的第一用户的语音数据;对所述语音数据进行翻译,得到第一翻译语音数据;所述语音处理模块,还用于将所述第一翻译语音数据发送至所述耳机,以由所述耳机将所述第一翻译语音数据发送至第一终端设备后,所述第一终端设备将所述第一翻译语音数据发送至第二终端设备。
可选地,所述耳机还与第一用户使用的第一终端设备连接,所述语音处理模块,用于在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,接收所述耳机发送的语音数据,所述语音数据是第二用户的语音数据,由第二终端设备发送至第一终端设备并由第一终端设备发送至所述耳机;对所述语音数据进行翻译,得到第二翻译语音数据;所述语音处理模块,还用于将所述第二翻译数据发送至所述耳机,由所述耳机播放所述第二翻译语音数据。
可选地,所述语音处理模块,用于对所述目标数据进行同声传译,得到同声传译结果;所述耳机收纳装置还包括播放模块,所述语音处理模块,还用于将同声传译结果发送至所述播放模块,所述播放模块播放所述同声传译结果;或,将同声传译结果发送至所述耳机,以由所述耳机播放所述同声传译结果;或,将同声传译结果发送至所述耳机,以由所述耳机将所述同声传译结果发送至与所述耳机连接的终端设备后,所述终端设备将同声传译结果发送至与所述终端设备通话的其他终端设备。
可选地,应用于翻译场景中,所述耳机由第一用户使用,所述耳机收纳装置由至少一个第二用户使用;所述语音处理模块,用于接收所述耳机发送的语音数据,所述语音数据是所述耳机采集的第一用户的语音数据;对所述语音数据进行翻译,得到第三翻译语音数据;所述耳机收纳装置还包括播放模块,所述语音处理模块,还用于将所述第三翻译语音数据发送至所述播放模块,由所述播放模块播放所述第三翻译语音数据。
可选地,所述耳机收纳装置还包括语音采集模块,所述语音处理模块,还用于获取所述语音采集模块采集的语音数据,所述语音数据是第二用户的语音数据;所述语音处理模块,用于对所述语音数据进行翻译,得到第四翻译语音数据;所述语音处理模块,还用于将第四翻译语音数据发送至所述耳机,由所述耳机播放所述第四翻译语音数据。
可选地,所述耳机包括:第一耳机和至少一个第二耳机,所述第二耳机和第一耳机,分别与所述耳机收纳装置连接;所述第一耳机由第一用户使用,所述第二耳机由第二用户使用;所述语音处理模块,用于接收所述第一耳机发送的语音数据,所述语音数据是所述第一耳机采集的第一用户的语音数据;对所述语音数据进行翻译,得到第五翻译语音数据;所述语音处理模块,还用于将第五翻译语音数据发送至所述至少一个第二耳机,由所述至少一个第二耳机播放所述第五翻译数据。
可选地,所述耳机还与终端设备连接,所述语音处理模块,用于接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果并基于所述识别结果生成播报信息;所述语音处理模块,还用于将所述播报信息返回至所述耳机,由耳机基于所述播报信息进行语音播报。
可选地,所述耳机还与终端设备连接,所述语音处理模块,用于接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果;所述语音处理模块,还用于若所述识别结果是预设识别结果,则生成来电拦截指令并将所述来电拦截指令发送至所述耳机,由所述耳机将所述来电拦截指令发送至所述终端设备,以对所述来电进行拦截。
可选地,所述耳机还与终端设备连接,所述语音处理模块,用于接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果;基于所述识别结果对所述终端设备接收到的来电进行代接。
可选地,所述语音处理模块,用于对所述目标数据进行美化处理,得到美化语音数据;所述耳机收纳装置还包括播放模块,所述语音处理模块,还用于将所述美化语音数据发送至所述播放模块,所述播放模块播放所述美化语音数据;或,对将所述美化语音数据返回给所述耳机,由所述耳机将所述美化语音数据发送至与所述耳机连接的终端设备。
可选地,所述美化处理包括以下至少一种:滤除所述目标数据中的用户噪音,所述用户噪音表征用户产生的噪音,所述用户噪音包括:哈气音、颤音和口音中的至少一种;音效处理;所述音效处理包括如下处理中的至少一种:环绕处理、信道均衡处理、以及混响处理。
可选地,所述语音处理模块,用于对所述语音数据进行变声处理,得到变声语音数据;所述耳机收纳装置还包括播放模块,所述语音处理模块,还用于将所述变声语音数据发送至所述播放模块,所述播放模块播放所述变声语音数据;或,对将所述变声语音数据返回给所述耳机,由所述耳机将所述变声语音数据发送至与所述耳机连接的终端设备。
可选地,所述语音处理模块,用于获取对话的语音数据;所述对话的参与方包括:至少两个用户;确定所述语音数据对应的提示信息;所述提示信息为依据所述语音数据对应的语义信息、和/或、情绪信息得到;所述语音处理模块,还用于在对话过程中、和/或、在对话结束后,输出所述提示信息。
可选地,所述耳机还与终端设备连接,所述语音处理模块,用于在所述终端设备通话过程中,对从所述耳机接收通话语音数据;对所述通话语音数据进行存储。
可选地,所述语音处理模块,用于获取环境音数据;根据所述环境音数据,识别环境中的潜在风险事件;所述语音处理模块,还用于向所述耳机发送所述潜在风险事件,由所述耳机根据所述潜在风险事件进行声音提醒。
可选地,所述语音处理模块,用于获取通话语音数据;对所述通话语音数据进行语音增强;所述语音处理模块,还用于将经过语音增强的通话语音数据发送至所述耳机,由所述耳机播放经过语音增强的通话语音数据;或,将经过语音增强的通话语音数据发送至所述耳机,由所述耳机将经过语音增强的通话语音数据发送至与耳机连接的终端设备。
可选地,所述语音处理模块,用于获取导航查询语音数据;所述语音处理模块,还用于获取用户地理位置信息和用户方位信息;所述语音处理模块,用于根据所述用户方位信息和所述用户地理位置信息,生成所述导航查询语音数据对应的导航结果语音数据;所述耳机收纳装置还包括播放模块,所述语音处理模块,还用于将所述导航结果语音数据发送至所述播放模块,所述播放模块播放所述导航结果语音数据;或,将所述导航结果语音数据发送至所述耳机,由所述耳机播放所述导航结果语音数据。
可选地,所述耳机收纳装置设置有交互助手,所述语音处理模块,用于获取语音数据;对所述语音数据进行指令识别,得到对应的交互指令;所述语音处理模块,还用于将所述交互指令发送至所述交互助手,以调用所述交互助手执行所述交互指令对应的交互操作。
可选地,所述语音处理模块,用于获取语音数据;对所述语音数据进行识别,获取所述所述语音数据中的问题语句并确定所述问题语句对应的答复语句;所述耳机收纳装置还包括播放模块,所述语音处理模块,还用于将答复语句发送至所述播放模块,所述播放模块播放所述答复语句;或,对将答复语句发送至所述耳机,由所述耳机播放所述答复语句。
可选地,所述语音处理模块,用于获取语音数据;对所述语音数据进行降噪处理/回音消除处理。
可选地,所述语音处理模块,用于获取语音数据;对所述语音数据进行语音识别,得到语音识别文本。
可选地,所述耳机还与终端设备连接,所述耳机收纳装置还包括显示模块和存储模块;所述语音处理模块,还用于将所述语音识别文本,发送至所述耳机收纳装置的显示模块中显示;和/或,对将所述语音识别文本,发送至所述耳机收纳装置的存储模块中存储;和/或,对将所述语音识别文本发送至所述耳机,由所述耳机将所述语音识别文本发送至所述终端设备存储和/或显示。
可选地,所述语音处理模块,还用于依据所述语音识别文本生成备忘信息。
可选地,所述语音处理模块,用于获取语音数据;从所述语音数据中识别目标语音片段并标记。
可选地,所述耳机收纳装置还包括显示模块,所述语音处理模块,用于获取语音数据,所述语音数据是用户针对所述显示模块中显示信息进行操作的语音数据;对所述语音数据进行指令识别,得到对应的操作指令;所述语音处理模块,还用于将所述操作指令发送至所述显示模块,由所述显示模块获取所述操作指令对应的待显示信息,显示所述待显示信息。
本发明实施例还公开了一种可读存储介质,当所述存储介质中的指令由耳机收纳装置的处理器执行时,使得耳机收纳装置能够执行如本发明实施例任一所述的数据处理方法。
本发明实施例还公开了一种耳机收纳装置,所述耳机收纳装置与耳机无线连接,所述耳机收纳装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取目标数据,所述目标数据由所述耳机收纳装置采集和/或由所述耳机发送;对所述目标数据进行处理。
可选地,所述耳机还与第一用户使用的第一终端设备连接;获取目标数据,包括:在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,接收所述耳机发送的语音数据,所述语音数据是由所述耳机采集的第一用户的语音数据;对所述目标数据进行处理,包括:对所述语音数据进行翻译,得到第一翻译语音数据;还包含用于进行以下操作的指令:将所述第一翻译语音数据发送至所述耳机,以由所述耳机将所述第一翻译语音数据发送至第一终端设备后,所述第一终端设备将所述第一翻译语音数据发送至第二终端设备。
可选地,所述耳机还与第一用户使用的第一终端设备连接,获取目标数据,包括:在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,接收所述耳机发送的语音数据,所述语音数据是第二用户的语音数据,由第二终端设备发送至第一终端设备并由第一终端设备发送至所述耳机;对所述目标数据进行处理,包括:对所述语音数据进行翻译,得到第二翻译语音数据;还包含用于进行以下操作的指令:将所述第二翻译数据发送至所述耳机,由所述耳机播放所述第二翻译语音数据。
可选地,对所述目标数据进行处理,包括:对所述目标数据进行同声传译,得到同声传译结果;所述耳机收纳装置还包括播放模块,还包含用于进行以下操作的指令:将同声传译结果发送至所述播放模块,所述播放模块播放所述同声传译结果;或,将同声传译结果发送至所述耳机,以由所述耳机播放所述同声传译结果;或,将同声传译结果发送至所述耳机,以由所述耳机将所述同声传译结果发送至与所述耳机连接的终端设备后,所述终端设备将同声传译结果发送至与所述终端设备通话的其他终端设备。
可选地,应用于翻译场景中,所述耳机由第一用户使用,所述耳机收纳装置由至少一个第二用户使用;获取目标数据,包括:接收所述耳机发送的语音数据,所述语音数据是所述耳机采集的第一用户的语音数据;对所述目标数据进行处理,包括:对所述语音数据进行翻译,得到第三翻译语音数据;所述耳机收纳装置还包括播放模块,还包含用于进行以下操作的指令:将所述第三翻译语音数据发送至所述播放模块,由所述播放模块播放所述第三翻译语音数据。
可选地,所述耳机收纳装置还包括语音采集模块,获取目标数据,还包括:获取所述语音采集模块采集的语音数据,所述语音数据是第二用户的语音数据;对所述目标数据进行处理,包括:对所述语音数据进行翻译,得到第四翻译语音数据;还包含用于进行以下操作的指令:将第四翻译语音数据发送至所述耳机,由所述耳机播放所述第四翻译语音数据。
可选地,所述耳机包括:第一耳机和至少一个第二耳机,所述第二耳机和第一耳机,分别与所述耳机收纳装置连接;所述第一耳机由第一用户使用,所述第二耳机由第二用户使用;获取目标数据,包括:接收所述第一耳机发送的语音数据,所述语音数据是所述第一耳机采集的第一用户的语音数据;对所述目标数据进行处理,包括:对所述语音数据进行翻译,得到第五翻译语音数据;还包含用于进行以下操作的指令:将第五翻译语音数据发送至所述至少一个第二耳机,由所述至少一个第二耳机播放所述第五翻译数据。
可选地,所述耳机还与终端设备连接,获取目标数据,包括:接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;对所述目标数据进行处理,包括:对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果并基于所述识别结果生成播报信息;还包含用于进行以下操作的指令:将所述播报信息返回至所述耳机,由耳机基于所述播报信息进行语音播报。
可选地,所述耳机还与终端设备连接,获取目标数据,包括:接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;对所述目标数据进行处理,包括:对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果;还包含用于进行以下操作的指令:若所述识别结果是预设识别结果,则生成来电拦截指令并将所述来电拦截指令发送至所述耳机,由所述耳机将所述来电拦截指令发送至所述终端设备,以对所述来电进行拦截。
可选地,所述耳机还与终端设备连接,获取目标数据,包括:接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;对所述目标数据进行处理,包括:对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果;基于所述识别结果对所述终端设备接收到的来电进行代接。
可选地,对所述目标数据进行处理,包括:对所述目标数据进行美化处理,得到美化语音数据;所述耳机收纳装置还包括播放模块,还包含用于进行以下操作的指令:将所述美化语音数据发送至所述播放模块,所述播放模块播放所述美化语音数据;或,将所述美化语音数据返回给所述耳机,由所述耳机将所述美化语音数据发送至与所述耳机连接的终端设备。
可选地,所述美化处理包括以下至少一种:滤除所述目标数据中的用户噪音,所述用户噪音表征用户产生的噪音,所述用户噪音包括:哈气音、颤音和口音中的至少一种;音效处理;所述音效处理包括如下处理中的至少一种:环绕处理、信道均衡处理、以及混响处理。
可选地,对所述目标数据进行处理,包括:对所述语音数据进行变声处理,得到变声语音数据;所述耳机收纳装置还包括播放模块,还包含用于进行以下操作的指令:将所述变声语音数据发送至所述播放模块,所述播放模块播放所述变声语音数据;或,将所述变声语音数据返回给所述耳机,由所述耳机将所述变声语音数据发送至与所述耳机连接的终端设备。
可选地,获取目标数据,包括:获取对话的语音数据;所述对话的参与方包括:至少两个用户;对所述目标数据进行处理,包括:确定所述语音数据对应的提示信息;所述提示信息为依据所述语音数据对应的语义信息、和/或、情绪信息得到;还包含用于进行以下操作的指令:在对话过程中、和/或、在对话结束后,输出所述提示信息。
可选地,所述耳机还与终端设备连接,获取目标数据,包括:在所述终端设备通话过程中,从所述耳机接收通话语音数据;对所述目标数据进行处理,包括:对所述通话语音数据进行存储。
可选地,获取目标数据,包括:获取环境音数据;对所述目标数据进行处理,包括:根据所述环境音数据,识别环境中的潜在风险事件;还包含用于进行以下操作的指令:向所述耳机发送所述潜在风险事件,由所述耳机根据所述潜在风险事件进行声音提醒。
可选地,获取目标数据,包括:获取通话语音数据;对所述目标数据进行处理,包括:对所述通话语音数据进行语音增强;还包含用于进行以下操作的指令:将经过语音增强的通话语音数据发送至所述耳机,由所述耳机播放经过语音增强的通话语音数据;或,将经过语音增强的通话语音数据发送至所述耳机,由所述耳机将经过语音增强的通话语音数据发送至与耳机连接的终端设备。
可选地,获取目标数据,包括:获取导航查询语音数据;还包含用于进行以下操作的指令:获取用户地理位置信息和用户方位信息;对所述目标数据进行处理,包括:根据所述用户方位信息和所述用户地理位置信息,生成所述导航查询语音数据对应的导航结果语音数据;所述耳机收纳装置还包括播放模块,还包含用于进行以下操作的指令:将所述导航结果语音数据发送至所述播放模块,所述播放模块播放所述导航结果语音数据;或,将所述导航结果语音数据发送至所述耳机,由所述耳机播放所述导航结果语音数据。
可选地,所述耳机收纳装置设置有交互助手,获取目标数据,包括:获取语音数据;对所述目标数据进行处理,包括:对所述语音数据进行指令识别,得到对应的交互指令;还包含用于进行以下操作的指令:将所述交互指令发送至所述交互助手,以调用所述交互助手执行所述交互指令对应的交互操作。
可选地,获取目标数据,包括:获取语音数据;对所述目标数据进行处理,包括:对所述语音数据进行识别,获取所述所述语音数据中的问题语句并确定所述问题语句对应的答复语句;所述耳机收纳装置还包括播放模块,还包含用于进行以下操作的指令:将答复语句发送至所述播放模块,所述播放模块播放所述答复语句;或,将答复语句发送至所述耳机,由所述耳机播放所述答复语句。
可选地,获取目标数据,包括:获取语音数据;对所述目标数据进行处理,包括:对所述语音数据进行降噪处理/回音消除处理。
可选地,获取目标数据,包括:获取语音数据;对所述目标数据进行处理,包括:对所述语音数据进行语音识别,得到语音识别文本。
可选地,所述耳机还与终端设备连接,所述耳机收纳装置还包括显示模块和存储模块;还包含用于进行以下操作的指令:将所述语音识别文本,发送至所述耳机收纳装置的显示模块中显示;和/或,将所述语音识别文本,发送至所述耳机收纳装置的存储模块中存储;和/或,将所述语音识别文本发送至所述耳机,由所述耳机将所述语音识别文本发送至所述终端设备存储和/或显示。
可选地,还包含用于进行以下操作的指令:依据所述语音识别文本生成备忘信息。
可选地,获取目标数据,包括:获取语音数据;对所述目标数据进行处理,包括:从所述语音数据中识别目标语音片段并标记。
可选地,所述耳机收纳装置还包括显示模块,获取目标数据,包括:获取语音数据,所述语音数据是用户针对所述显示模块中显示信息进行操作的语音数据;对所述目标数据进行处理,包括:对所述语音数据进行指令识别,得到对应的操作指令;还包含用于进行以下操作的指令:将所述操作指令发送至所述显示模块,由所述显示模块获取所述操作指令对应的待显示信息,显示所述待显示信息。
本发明实施例包括以下优点:
本发明实施例中,可以在耳机收纳装置增加语音处理模块,进而的语音处理模块可以获取所述耳机收纳装置采集和/或由所述耳机发送的目标数据,然后对所述目标数据进行处理;从而增加对耳机收纳装置的资源利用,以及增加耳机/耳机收纳装置的用途。
附图说明
图1是本发明的一种数据处理方法实施例的步骤流程图;
图2是本发明的一种通话语音翻译方法实施例的步骤流程图;
图3是本发明的一种通话语音翻译方法可选实施例的步骤流程图;
图4是本发明的另一种通话语音翻译方法可选实施例的步骤流程图;
图5是本发明的一种同声传译方法实施例的步骤流程图;
图6是本发明的一种语音翻译方法实施例的步骤流程图;
图7是本发明的一种语音翻译方法可选实施例的步骤流程图;
图8是本发明的一种语音播报方法实施例的步骤流程图;
图9是本发明的一种电话拦截方法实施例的步骤流程图;
图10是本发明的一种电话代接方法实施例的步骤流程图;
图11是本发明的一种声音美化方法实施例的步骤流程图;
图12是本发明的一种变声方法实施例的步骤流程图;
图13是本发明的一种对话分析方法实施例的步骤流程图;
图14是本发明的一种电话录音方法实施例的步骤流程图;
图15是本发明的一种语音提示方法实施例的步骤流程图;
图16是本发明的一种语音增强方法实施例的步骤流程图;
图17是本发明的一种导航方法实施例的步骤流程图;
图18是本发明的一种语音交互方法实施例的步骤流程图;
图19是本发明的一种智能问答方法实施例的步骤流程图;
图20是本发明的一种降噪/回音消除方法实施例的步骤流程图;
图21是本发明的一种语音识别方法实施例的步骤流程图;
图22是本发明的一种存储/显示方法实施例的步骤流程图;
图23是本发明的一种语音片段标记方法实施例的步骤流程图;
图24是本发明的一种语音交互方法可选实施例的步骤流程图;
图25是本发明的一种耳机收纳装置实施例的结构框图;
图26根据一示例性实施例示出的一种用于数据处理的耳机收纳装置的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例提供了一种耳机设备,所述耳机设备包括耳机和与所述耳机连接耳机收纳装置。一个示例中,所述耳机收纳装置可以与耳机无线连接。一个示例中,所述耳机收纳装置可以与耳机通过蓝牙连接。
本发明实施例中,可以在耳机收纳装置中增加数据处理模块,进而使得所述耳机收纳装置可以除了用于收纳耳机、为耳机充电外,还可以用于数据处理。一个示例中,可以在所述耳机收纳装置设置数据处理模块可以包括语音处理模块。
在上述基础上,本发明实施例提供的一种数据处理方法,可以应用于耳机收纳装置中,由耳机收纳装置中的语音处理模块执行该数据处理方法。
参照图1,示出了本发明的一种数据处理方法实施例的步骤流程图,具体可以包括如下步骤:
步骤102、所述语音处理模块获取目标数据,所述目标数据由所述耳机收纳装置采集和/或由所述耳机发送。
步骤104、所述语音处理模块对所述目标数据进行处理。
本发明的一个示例中,还可以在所述耳机收纳装置中设置语音采集模块如麦克风阵列;该语音采集模块可以用于采集语音数据。进而在耳机收纳装置中的语音采集模块采集语音数据后,可以将采集的语音数据发送至耳机收纳装置中的语音处理模块。进而,耳机收纳装置中的语音处理模块可以获取该语音数据,并将该语音数据作为目标数据,然后可以对该目标数据进行处理。
本发明的一个示例中,所述耳机中可以设置有语音采集模块如麦克风阵列,该语音采集模块可以用于采集语音数据。进而在耳机中的语音采集模块采集语音数据后,可以将采集的语音数据发送至耳机收纳装置的语音处理模块;对应的,耳机收纳装置的语音处理模块可以获取到该语音数据,然后将该语音数据作为目标数据,并对该目标数据进行处理。
本发明的一个示例中,所述耳机还可以与终端设备连接。一个示例中,所述耳机收纳装置可以与耳机通过蓝牙无线连接。进而当耳机与终端设备连接的过程中,所述耳机可以获取到终端设备发送的语音数据,然后可以将该语音数据发送至耳机收纳装置的语音处理模块。对应的,耳机收纳装置的语音处理模块可以获取到该语音数据,然后将该语音数据作为目标数据,并对该目标数据进行处理。
其中,所述耳机收纳装置的语音处理模块对目标数据进行的处理,可以包括以下至少一种:语音翻译、同声传译、来电语音播报、电话拦截、电话代接、声音美化、变声处理、对话分析、电话录音、事件提示、语音增强、导航、语音交互、智能问答、降噪、回音消除、语音识别、语音片段标记。当然,还可以包括其他处理,具体可以按照需求设置,本发明实施例对此不作限制。
综上,本发明实施例中,可以在耳机收纳装置增加语音处理模块,进而的语音处理模块可以获取所述耳机收纳装置采集和/或由所述耳机发送的目标数据,然后对所述目标数据进行处理;从而增加对耳机收纳装置的资源利用,以及增加耳机/耳机收纳装置的用途。
以下分别对耳机收纳装置中的语音处理模块进行的不同处理进行说明。
本发明实施例中,所述耳机在与耳机收纳装置的连接的同时,还可以与终端设备连接。对应的,本发明实施例的一种应用场景可以是:使用不同语言的用户通话的场景。其中,所述通话可以是指拨号进行的语音通话,也可以是通过即时通讯软件进行的语音/视频通话,本发明实施例对此不作限制。
其中,参与通话的用户可以包括至少两个,各参与通话的用户均使用所述耳机设备,且参与通话的用户所使用的耳机设备中的耳机分别与其使用的终端设备连接。可以将参与通话的用户中任一使用所述耳机设备的用户称为第一用户,将参与通话的用户中其他用户称为第二用户;所述第二用户包括至少一个,一个第二用户可以使用一个终端设备,一个终端设备对应连接一套耳机设备中的耳机。
本发明的一个可选实施例中,所述耳机可以是TWS(True Wireless Stereo,真无线耳机)。
以下以第一用户使用的耳机设备为例,说明本发明实施例中语音处理模块对目标数据的处理方法。
参照图2,示出了本发明的一种通话语音翻译方法可选实施例的步骤流程图,具体可以包括如下步骤:
步骤202、在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是由所述耳机采集的第一用户的语音数据。
本发明实施例中,在所述第一用户与至少一个第二用户通话的场景下,第一用户说话过程中,第一用户的耳机可以采集的第一用户的语音数据。然后第一耳机可以将采集到的第一用户的语音数据,发送至耳机收纳装置的语音处理模块;进而耳机收纳装置的语音处理模块,可以接收所述耳机发送的语音数据(也就是目标数据)。
步骤204、所述语音处理模块对所述语音数据进行翻译,得到第一翻译语音数据。
本发明的一个示例中,语音处理模块可以依据接收到的语音数据,判断第一用户使用的语言与第二用户使用的语言是否相同。其中,语音处理模块可以依据该接收到语音数据,确定第一用户使用的语言;也可以通过获取第一用户设置的第一用户的语言,确定第一用户使用的语言;还可以根据第一用户对应终端设备的系统语言,确定第一用户使用的语言,本发明实施例对此不作限制。以及语音处理模块可以根据第一用户设置的第二用户的语言,确定第二用户使用的语言;或者根据在先获取的第二用户的语音数据,确定第二用户使用的语言;本发明实施例对此不作限制。
本发明的一个示例中,第一用户可以在耳机收纳装置中设置第一用户的语言和第二用户的语言,也可以在第一终端设备与耳机设备对应应用程序中,设置第一用户的语言和第二用户的语言,本发明实施例对此不作限制。若第一用户使用的语言与第二用户使用的语言相同,则无需对该语音数据进行翻译,直接将该语音数据返回给耳机即可。若第一用户使用的语言与第二用户使用的语言不同,则语音处理模块可以对获取的语音数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本,翻译为第一用户所使用的语言对应的翻译文本,再将该翻译文本转换为对应的第一翻译语音数据。
步骤206、所述语音处理模块将所述第一翻译语音数据发送至所述耳机,以由所述耳机将所述第一翻译语音数据发送至第一终端设备后,所述第一终端设备将所述第一翻译语音数据发送至第二终端设备。
本发明实施例中,语音处理模块在对接收的语音数据进行翻译,得到第一翻译语音数据后,可以将该第一翻译语音数据返回给耳机。耳机接收到第一翻译语音数据后,可以将该第一翻译语音数据发送给第一终端设备;然后由第一终端设备将该第一翻译语音数据发送至第二终端设备。进而第二终端设备可以将第一翻译语音数据发送至第二用户的耳机,由第二用户的耳机对所述第一翻译语音数据进行播放,从而实现通话过程中的无障碍沟通。
其中,当第二用户包括多个,且所有第二用户所对应使用的语言也包括多个时,第一用户的耳机收纳装置的语音处理模块,可以将接收到的语音数据翻译成多个第一翻译语音数据。此时,第一终端设备可以依次将多个第一翻译语音数据发送至各第二终端设备;然后各第二终端设备依次将多个第一翻译语音数据,发送至对应的第二用户使用的耳机,由第二用户使用的耳机依次对多个第一翻译语音数据进行播放。进而参与通话的各第二用户可以从依次播放的多个第一翻译语音数据中,获取到所能听懂的第一翻译语音数据。当然,也可以是由各第二用户使用的耳机从接收到的多个第一翻译语音数据中,选取与对应第二用户使用语言匹配的第一翻译语音数据进行播放。
当第一用户的耳机收纳装置中的语音处理模块,将接收到的语音数据翻译成了多个第一翻译语音数据后,第一终端设备也可以将各第一翻译语音数据,分别发送至对应的第二终端设备;然后第二终端设备将接收到的第一翻译语音数据,发送至对应的第二用户使用的耳机,由第二用户使用的耳机对接收到的第一翻译语音数据进行播放。
此外,当多个第二用户中存在与第一用户使用语言相同的第二用户时,第一用户的耳机还可以将接收语音数据发送至第一终端设备;由第一终端设备将该语音数据,发送与第一用户使用语言相同的第二终端设备。
综上,本发明实施例中,在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,所述语音处理模块可以接收所述耳机采集并发送的第一用户的语音数据;然后对所述语音数据进行翻译,得到第一翻译语音数据,并将所述第一翻译语音数据发送至所述耳机,以由所述耳机将所述第一翻译语音数据发送至第一终端设备后,再由所述第一终端设备将所述第一翻译语音数据发送至第二终端设备;进而实现使用不同语言用户通话过程中的跨语言沟通。此外,相对于现有技术在通话过程中,需要开启功放后采用专用的翻译设备进行翻译而言,本发明实施例在通话过程中无需开启功放,即可完成翻译;不仅可以保护隐私,还可以提高翻译的准确性。
参照图3,示出了本发明的一种通话语音翻译方法可选实施例的步骤流程图,具体可以包括如下步骤:
步骤302、在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是第二用户的语音数据,由第二终端设备发送至第一终端设备并由第一终端设备发送至所述耳机。
本发明实施例中,在所述第一用户与至少一个第二用户通话的场景下,任意一个第二用户说话的过程中(为了便于本发明实施例的后续说明,可以将通话过程中说话的第二用户称为目标第二用户),目标第二用户的第二终端设备可以采集目标第二用户的语音数据。当然,也可以是目标第二用户对应的耳机采集目标第二用户的语音数据,并发送给目标第二用户的第二终端设备。然后由目标第二用户的第二终端设备将目标第二用户的语音数据,发送至第一用户的终端设备。
对应的,第一用户的第一终端设备可以接收到目标第二用户的第二终端设备发送的语音数据;然后将接收到的目标第二用户的语音数据,发送至第一用户使用的耳机。第一用户使用的耳机接收到第一终端设备发送的语音数据后,可以将接收的语音数据,发送给耳机收纳装置的语音处理模块;进而耳机收纳装置的语音处理模块,可以接收所述耳机发送的语音数据。
步骤304、所述语音处理模块对所述语音数据进行翻译,得到第二翻译语音数据。
本发明的一个示例中,语音处理模块可以依据接收到的语音数据,判断第一用户使用的语言与目标第二用户使用的语言是否相同。其中,语音处理模块,可以依据接收到的语音数据(也就是目标第二用户的语音数据),确定目标第二用户使用的语言;也可以根据第一用户设置的目标第二用户的语言,确定目标第二用户使用的语言,本发明实施例对此不作限制。以及语音处理模块可以通过获取第一用户设置的第一用户的语言,确定第一用户使用的语言;也可以根据第一用户对应终端设备的系统语言,确定第一用户使用的语言,本发明实施例对此不作限制。
本发明的一个示例中,第一用户可以在耳机收纳装置中设置第一用户的语言和目标第二用户的语言,也可以在终端设备与耳机设备对应应用程序中,设置第一用户的语言和第二用户的语言,本发明实施例对此不作限制。若第一用户使用的语言与目标第二用户使用的语言相同,则无需对该语音数据进行翻译,直接将该语音数据返回给耳机即可。若第一用户使用的语言与目标第二用户使用的语言不同,则所述耳机收纳装置的语音处理模块,可以对获取的语音数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本,翻译为第一用户所使用的语言对应的翻译文本,再将该翻译文本转换为对应的第二翻译语音数据。
步骤306、所述语音处理模块将所述第二翻译数据发送至所述耳机,由所述耳机播放所述第二翻译语音数据。
本发明实施例中,语音处理模块在对接收的语音数据进行翻译,得到第二翻译语音数据后,可以将该第二翻译语音数据发送给耳机;耳机接收到第二翻译语音数据后,可以播放该第二翻译语音数据。进而参与通话的用户中,每个用户的使用的耳机收纳装置的语音处理模块,均可以将参与通话的其他用户的语音数据进行翻译,生成本身所使用语言的语音数据并播放;从而实现使用不同语言用户在通话过程中的跨语言沟通。
当然,本发明的一个可选实施例中,语音处理模块对接收到的语音数据进行翻译,生成第二翻译语音数据后,也可以播放所述第二翻译语音数据;进而无需将第二翻译语音数据返回给耳机,提高了播放语音数据的效率,且还能够实现将翻译后的语音数据进行声音外放。
综上,本发明实施例中,在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,所述语音处理模块可以接收第二用户的语音数据;然后对所述语音数据进行翻译,得到第二翻译语音数据,并将所述第二翻译数据发送至所述耳机,由所述耳机播放所述第二翻译语音数据;从而实现使用不同语言用户通话过程中的跨语言沟通。此外,相对于现有技术在通话过程中,需要开启功放后采用专用的翻译设备进行翻译而言,本发明实施例在通话过程中无需开启功放,即可完成翻译;不仅可以保护隐私,还可以提高翻译的准确性。
本发明的一个实施例中,参与通话的用户中可以仅存在部分用户使用所述耳机设备;因此可以结合上述步骤202-步骤206,与上述步骤302-步骤306,实现使用不同语言用户通话过程中的跨语言沟通。
参照图4,示出了本发明的另一种通话语音翻译方法可选实施例的步骤流程图,具体可以包括如下步骤:
步骤402、在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是由所述耳机采集的第一用户的语音数据。
步骤404、所述语音处理模块对所述语音数据进行翻译,得到第一翻译语音数据。
步骤406、所述语音处理模块将所述第一翻译语音数据发送至所述耳机,以由所述耳机将所述第一翻译语音数据发送至第一终端设备后,所述第一终端设备将所述第一翻译语音数据发送至第二终端设备。
步骤408、所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是第二用户的语音数据,由第二终端设备发送至第一终端设备并由第一终端设备发送至所述耳机。
步骤410、所述语音处理模块对所述语音数据进行翻译,得到第二翻译语音数据。
步骤412、所述语音处理模块将所述第二翻译数据发送至所述耳机,由所述耳机播放所述第二翻译语音数据。
其中,步骤402-步骤406,与上述步骤202-步骤206类似,步骤408-步骤412,与上述步骤302-步骤306类似,在此不再赘述。
此外,本发明实施例不限制先执行步骤402-步骤406,还是先执行步骤408-步骤412。
综上,本发明实施例中,在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,所述语音处理模块可以接收第一用户的语音数据;然后对所述语音数据进行翻译,得到第一翻译语音数据,并将所述第一翻译语音数据发送至所述耳机,以由所述耳机将所述第一翻译语音数据发送至第一终端设备后,所述第一终端设备将所述第一翻译语音数据发送至第二终端设备。以及所述语音处理模块可以接收第二用户的语音数据,然后所述语音处理模块对所述语音数据进行翻译,得到第二翻译语音数据;并将所述第二翻译数据发送至所述耳机,由所述耳机播放所述第二翻译语音数据。进而即使在参与通讯的用户中存在部分用户未使用耳机设备,也能够实现使用不同语言用户通讯过程中的跨语言沟通。
本发明实施例的一种应用场景可以是:同声传译的场景。其中,可以是在多个用户通话过程中进行同声传译,也可以是在采访过程中的同声传译,还是在会议、观看外媒演讲、外媒新闻、外媒影视过程中的同声传译,本发明实施例对此不作限制。
参照图5,示出了本发明实施例的一种同声传译方法实施例的步骤流图。
步骤502、所述语音处理模块获取目标数据。
本发明的一个示例中,在多个用户通话的场景中,可以由耳机采集用户的语音数据,并发送至对应的耳机收纳装置中的语音处理模块。也可以是与耳机连接的终端设备,接收与其通话的其他终端设备发送的语音数据;然后将接收到语音数据发送至耳机,由耳机将该语音数据发送至对应的耳机收纳装置中的语音处理模块。
本发明的一个示例中,在采访场景中,可以由耳机采集用户的语音数据,并发送至对应的耳机收纳装置中的语音处理模块;也可以由耳机收纳装置中的语音采集模块采集语音数据,并将该语音数据发送至对应的耳机收纳装置中的语音处理模块。
本发明的一个示例中,在会议、观看外媒演讲、外媒新闻、外媒影视场景中,可以由耳机收纳装置中的语音采集模块采集语音数据,并将该语音数据发送至对应的耳机收纳装置中的语音处理模块。
进而耳机收纳装置中的语音处理模块,可以将接收到的语音数据确定为目标数据;然后可以对目标数据进行语音处理。
步骤504、所述语音处理模块对所述目标数据进行同声传译,得到同声传译结果。
耳机收纳装置的语音处理模块接收到语音数据后,可以对语音数据进行同声传译,得到同声传译结果。
其中,在不同的场景下,所述语音处理模块对同声传译结果的处理方式不同,可以如下:
步骤506、所述语音处理模块将同声传译结果发送至所述播放模块,所述播放模块播放所述同声传译结果。
本发明实施例中,所述耳机收纳装置还可以包括播放模块,可以用于播放语音数据。
在多个用户通话的场景中,若耳机收纳装置的语音处理模块获取的是由终端设备发送给耳机的语音数据,则在得到同声传译结果后,可以将同声传译结果发送至耳机收纳装置的播放模块,由该播放模块播放该语音数据。
在采访场景中,若仅使用了耳机收纳装置,则耳机收纳装置的语音处理模块在得到同声传译结果后,可以将同声传译结果发送至耳机收纳装置的播放模块,由该播放模块播放该语音数据。当使用了耳机和耳机收纳装置,则在耳机收纳装置的语音处理模块获取的是由耳机采集的语音数据;此时,语音处理模块在得到同声传译结果后,可以将同声传译结果发送至耳机收纳装置的播放模块,由该播放模块播放该语音数据。
在会议、观看外媒演讲、外媒新闻、外媒影视场景中,若仅使用了耳机收纳装置,则耳机收纳装置的语音处理模块在得到同声传译结果后,可以将同声传译结果发送至耳机收纳装置的播放模块,由该播放模块播放该语音数据。
步骤508、所述语音处理模块将同声传译结果发送至所述耳机,以由所述耳机播放所述同声传译结果。
在多个用户通话的场景中,若耳机收纳装置的语音处理模块获取的是由终端设备发送给耳机的语音数据,则在得到同声传译结果后,可以将同声传译结果发送至耳机,由耳机播放该语音数据。
在采访场景中,当使用了耳机和耳机收纳装置,则在耳机收纳装置的语音处理模块获取的是由耳机收纳装置的语音采集模块采集的语音数据;此时,语音处理模块在得到同声传译结果后,可以将同声传译结果发送至耳机,由该耳机播放该语音数据。
在会议、观看外媒演讲、外媒新闻、外媒影视场景中,当使用了耳机和耳机收纳装置,则耳机收纳装置的语音处理模块获取的是由耳机收纳装置的语音采集模块采集的语音数据;此时,语音处理模块在得到同声传译结果后,可以将同声传译结果发送至耳机,由耳机播放该语音数据。
步骤510、所述语音处理模块将同声传译结果发送至所述耳机,以由所述耳机将所述同声传译结果发送至与所述耳机连接的终端设备后,所述终端设备将同声传译结果发送至与所述终端设备通话的其他终端设备。
在多个用户通话的场景中,若耳机收纳装置的语音处理模块获取的是由耳机采集的语音数据,则在得到同声传译结果后,可以将同声传译结果发送至耳机,由所述耳机将所述同声传译结果发送至与所述耳机连接的终端设备后,所述终端设备将同声传译结果发送至与所述终端设备通话的其他终端设备。
综上,本发明实施例中,耳机收纳装置的语音处理模块在获取目标数据后,可以对所述目标数据进行同声传译,得到同声传译结果;然后可以将同声传译结果发送至所述播放模块,所述播放模块播放所述同声传译结果;也可以将同声传译结果发送至所述耳机,以由所述耳机播放所述同声传译结果;还可以将同声传译结果发送至所述耳机,以由所述耳机将所述同声传译结果发送至与所述耳机连接的终端设备后,所述终端设备将同声传译结果发送至与所述终端设备通话的其他终端设备。进而可以将耳机设备应用在各种场景中,通过在耳机设备中耳机收纳装置进行同声传译,来实现在各种应用场景中的同声传译。
本发明实施例的又一个场景可以是:多人翻译(包括一对一翻译)。其中,所述耳机由第一用户使用,所述耳机收纳装置由第二用户使用,进而通过耳机和耳机收纳装置实现面对面语音交流过程中的翻译。其中,所述耳机可以包括至少一个,所述耳机收纳装置可以包括至少一个,一个第一用户可以使用一个耳机,一个第二用户可以使用一个耳机收纳装置。当然,也可以多个第二用户共用一个耳机收纳装置。
参照图6,示出了本发明实施例的一种语音翻译方法实施例的步骤流图。
步骤602、所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是所述耳机采集的第一用户的语音数据。
本发明实施例中,在多个用户(包括至少一个第一用户和至少一个第二用户)面对面语音交流的场景中,任意一个第一用户发言的过程中(为了便于本发明实施例的后续说明,后续将发言的第一用户称为目标第一用户,目标第一用户使用的耳机称为目标耳机),目标耳机可以采集目标第一用户的语音数据,并将目标第一用户的语音数据发送至耳机收纳装置的语音处理模块。进而耳机收纳装置的语音处理模块可以接收到语音数据,并将该语音数据作为目标数据。
步骤604、所述语音处理模块对所述语音数据进行翻译,得到第三翻译语音数据。
步骤606、所述语音处理模块将所述第三翻译语音数据发送至所述播放模块,由所述播放模块播放所述第三翻译语音数据。
耳机收纳装置的语音处理模块,可以对目标数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本翻译为使用该耳机收纳装置对应第二用户所使用语言的翻译文本,并将该翻译文本转换为对应的第三翻译语音数据。然后可以将所述第三翻译语音数据发送至所述播放模块,由所述播放模块播放所述第三翻译语音数据。
其中,当第一用户包括多个时,任意一个耳机收纳装置的语音处理模块,还可以将接收到的目标第一用户的语音数据,翻译成其他第一用户所使用语言对应的多个第三翻译语音数据;为了便于后续说明,可以将该耳机收纳装置称为目标耳机收纳装置。此时,目标耳机收纳装置的语音处理模块,可以依次将该多个第三翻译语音数据发送至各其他第一用户使用的耳机;由各其他第一用户的耳机依次对各第三翻译语音数据进行播放。进而面对面交流的各其他第一用户可以从依次播放的多个第三翻译语音数据中,获取到所能听懂的第三翻译语音数据。当然,也可以是由各其他第一用户使用的其他耳机从接收到的多个第三翻译语音数据中,选取与对应第一用户使用语言匹配的第三翻译语音数据进行播放。
当然,当第一用户包括多个时,目标耳机收纳装置的语音处理模块可以将目标数据,翻译成各其他第一用户所使用语言对应的多个第三翻译语音数据后,目标耳机收纳装置也可以将各第三翻译语音数据,分别发送至对应其他第一用户的耳机;其他第一用户的耳机可以接收到的第三翻译语音数据并播放。
本发明的一个示例中,所述耳机收纳装置可以设置有显示模块。进而所述耳机收纳装置的播放模块在播放所述第三翻译语音数据的同时,还可以耳机收纳装置的显示模块可以同步展示目标数据的翻译文本,也就是与第三翻译语音数据对应的文本;进而便于第二用户对第三翻译语音数据的理解,进一步提高用户体验。
步骤608、所述语音处理模块获取所述采集模块采集的语音数据,所述语音数据是第二用户的语音数据。
步骤610、所述语音处理模块对所述语音数据进行翻译,得到第四翻译语音数据。
步骤612、所述语音处理模块将第四翻译语音数据发送至所述耳机,由所述耳机播放所述第四翻译语音数据。
在多个用户(包括至少一个第一用户和至少一个第二用户)面对面语音交流的场景中,任意一个第二用户发言的过程中(为了便于本发明实施例的后续说明,可以将发言的第二用户称为目标第二用户,目标第二用户对应的耳机收纳装置可以称为目标耳机收纳装置),所述目标耳机收纳装置的语音采集模块可以采集目标第二用户的语音数据,并将目标第二用户的语音数据发送给目标耳机收纳装置的语音处理模块。进而语音处理模块可以将目标第二用户的语音数据,确定为目标数据。
然后所述目标耳机收纳装置的语音处理模块,可以对目标数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本翻译为第一用户对应语言的翻译文本,再将该翻译文本转换为对应的第四翻译语音数据。再将所述第四翻译语音数据发送至第一用户使用的耳机,由所述耳机播放所述四翻译语音数据;进而使用耳机的第一用户可以听到第二用户的语音数据的翻译结果。
当所述第一用户包括多个时,目标耳机收纳装置的语音处理模块可以将目标数据,翻译为各第一用户所使用语言对应的第四翻译语音数据。然后可以依次将第四翻译语音数据发送至各第一用户使用的耳机;由各第一用户的耳机依次对各第四翻译语音数据进行播放。进而面对面交流的各第一用户可以从依次播放的多个第四翻译语音数据中,获取到所能听懂的第四翻译语音数据。当然,也可以是由各第一用户使用的耳机从接收到的多个第四翻译语音数据中,选取与对应第一用户使用语言匹配的第四翻译语音数据进行播放。
当然,当第一用户包括多个时,目标耳机收纳装置的语音处理模块可以将目标数据,翻译成各第一用户所使用语言对应的多个第四翻译语音数据后,目标耳机收纳装置也可以将各第四翻译语音数据,分别发送至对应的第一用户的耳机;第一用户的耳机可以接收到的第四翻译语音数据并播放。
当第二用户包括多个时,目标耳机收纳装置的语音处理模块还可以将目标数据翻译为其他第二用户所使用语言对应的第四翻译语音数据;然后将各第四翻译语音数据,发送至对应的其他第二用户的耳机收纳装置中,由各其他第二用户的耳机收纳装置的播放模块对对应的第四翻译数据进行播放。
其中,当目标耳机收纳装置生成了多个其他第二用户所使用语言对应的第四翻译语音数据时,可以依次将第四翻译语音数据发送至各其他第二用户的其他耳机收纳装置;由其他第二用户的其他耳机收纳装置中的播放模块,依次对各第四翻译语音数据进行播放。进而面对面交流的各其他第二用户可以从依次播放的多个第四翻译语音数据中,获取到所能听懂的第四翻译语音数据。当然,也可以是由各其他第二用户使用的耳机收纳装置从接收到的多个第四翻译语音数据中,选取与对应第二用户使用语言匹配的第四翻译语音数据进行播放。
当然,第二用户包括多个时,目标耳机收纳装置的语音处理模块,还可以直接将目标数据发送至其他第二用户的耳机收纳装置;由其他第二用户的耳机收纳装置的语音处理模块将目标数据,翻译为其对应的其他第二用户所使用语言对应的第四翻译语音数据并播放。
其中,本发明实施例不限制先执行步骤602-步骤606,还是先执行步骤608-步骤612。
综上,本发明实施例中,在多个用户面对面语音交流的场景下,在第一用户发言的过程中,所述语音处理模块接收第一用户的语音数据后,可以对所述语音数据进行翻译,得到第三翻译语音数据;并将所述第三翻译语音数据发送至所述播放模块,由所述播放模块播放所述第三翻译语音数据;进而使用耳机收纳装置的第二用户可以听到使用耳机的第一用户的语音数据的翻译结果。以及在第二用户发言过程中,所述语音处理模块可以获取第二用户的语音数据,然后对所述语音数据进行翻译,得到第四翻译语音数据,并第四翻译语音数据发送至所述耳机,由所述耳机播放所述第四翻译语音数据;进而使用耳机的第一用户可以听到使用耳机收纳装置的第二用户的语音数据的翻译结果。从而本发明实施例可以基于耳机和与耳机连接的耳机收纳装置快速的实现的翻译,无需交流各方不断的交换翻译设备查看翻译设备中针对对方的翻译结果,不仅可以提高翻译效率,还能够提高用户体验。且本发明实施例中,第一用户使用耳机,第二用户使用耳机收纳装置,能够避免双方交流过程中对卫生的顾虑,进一步提高用户体验。
本发明的一个实施例中,所述耳机可以包括多个,其中,可以将其中的一个耳机称为第一耳机,其他的耳机称为第二耳机,所述第一耳机包括一个,所述第二耳机可以包括至少一个。即所述耳机可以包括:第一耳机和至少一个第二耳机,所述第一耳机和第二耳机分别与所述耳机收纳装置连接。所述第一耳机由第一用户使用,所述第二耳机由第二用户使用;进而可以通过第一耳机和第二耳机,实现面对面语音交流过程中的翻译。
当第二耳机为一个时,第一耳机和第二耳机可以是同一对耳机,也可以是不同对耳机。
其中,第一耳机、第二耳机与耳机收纳装置连接的方式可以包括多种,例如在终端设备与耳机设备对应应用程序中执行触控操作,连接第一耳机与耳机收纳装置,以及连接第二耳机与耳机收纳装置。也可以在耳机收纳装置中执行触控操作,连接第一耳机与耳机收纳装置,以及连接第二耳机与耳机收纳装置。还可以是发出语音连接指令,连接第一耳机与耳机收纳装置,以及连接第二耳机与耳机收纳装置,等等;本发明实施例对此不作限制。
参照图7,示出了本发明的一种语音翻译处理方法可选实施例的步骤流程图。
步骤702、所述语音处理模块接收所述第一耳机发送的语音数据,所述语音数据是所述第一耳机采集的第一用户的语音数据。
步骤704、所述语音处理模块对所述语音数据进行翻译,得到第五翻译语音数据。
步骤706、所述语音处理模块将第五翻译语音数据发送至所述至少一个第二耳机,由所述至少一个第二耳机播放所述第五翻译数据。
本发明实施例中,在多个用户(包括至少一个第一用户和至少一个第二用户)面对面语音交流的场景中,在第一用户发言的过程中,第一耳机可以采集第一用户的语音数据,并将第一用户的语音数据发送给耳机收纳装置的语音处理模块。对应的,耳机收纳装置的语音处理模块可以接收到第一用户的语音数据,然后可以将第一用户的语音数据作为目标数据。
然后耳机收纳装置中的语音处理模块,可以对目标数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本翻译为第二用户对应语言的翻译文本,并将该翻译文本转换为对应的第五翻译语音数据。再将所述第五翻译语音数据发送至第二用户使用的第二耳机,由所述第二耳机播放所述第五翻译语音数据。
其中,当第二用户包括多个时,耳机收纳装置的语音处理模块,可以将目标数据翻译为多个第二用户所使用语言匹配的第五翻译语音数据;此时,耳机收纳装置可以依次将第五翻译语音数据发送至各第二用户的第二耳机;由各第二用户的第二耳机依次对各第五翻译语音数据进行播放。进而面对面交流的各第二用户可以从依次播放的多个第五翻译语音数据中,获取到所能听懂的第五翻译语音数据。当然,也可以是由各第二用户使用的第二耳机从接收到的多个第五翻译语音数据中,选取与对应第二用户使用语言匹配的第五翻译语音数据进行播放。
当然,当第二用户包括多个时,耳机收纳装置可以将目标数据翻译为多个第二用户所使用语言匹配的第五翻译语音数据;此时,耳机收纳装置也可以将各第五翻译语音数据,分别发送至对应第二用户的第二耳机;然后各第二耳机可以对接收到的第五翻译语音数据进行播放。
步骤708、所述语音处理模块接收所述第二耳机发送的语音数据,所述语音数据是所述第二耳机采集的第二用户的语音数据。
步骤710、所述语音处理模块对所述语音数据进行翻译,得到第六翻译语音数据。
步骤712、所述语音处理模块将第六翻译语音数据发送至所述至少一个第一耳机,由所述至少一个第一耳机播放所述第六翻译数据。
本发明实施例中,在多个用户(包括至少一个第一用户和至少一个第二用户)面对面语音交流的场景中,在第二用户发言的过程中,第二耳机可以采集第二用户的语音数据,并将第二用户的语音数据发送给耳机收纳装置的语音处理模块。对应的,耳机收纳装置的语音处理模块可以接收到第二用户的语音数据,然后可以将第二用户的语音数据作为目标数据。
然后耳机收纳装置中的语音处理模块,可以对目标数据进行语音识别,确定对应的语音识别文本;然后将语音识别文本翻译为第一用户对应语言的翻译文本,并将该翻译文本转换为对应的第六翻译语音数据。再将所述第六翻译语音数据发送至第一用户使用的第一耳机,由所述第一耳机播放所述第六翻译语音数据。
其中,当第一用户包括多个时,耳机收纳装置的语音处理模块,可以将目标数据翻译为多个第一用户所使用语言匹配的第六翻译语音数据;此时,耳机收纳装置可以依次将第六翻译语音数据发送至各第一用户的第一耳机;由各第一用户的第一耳机依次对各第六翻译语音数据进行播放。进而面对面交流的各第一用户可以从依次播放的多个第六翻译语音数据中,获取到所能听懂的第六翻译语音数据。当然,也可以是由各第一用户使用的第一耳机从接收到的多个第六翻译语音数据中,选取与对应第一用户使用语言匹配的第六翻译语音数据进行播放。
当然,当第一用户包括多个时,耳机收纳装置可以将目标数据翻译为多个第一用户所使用语言匹配的第六翻译语音数据;此时,耳机收纳装置也可以将各第六翻译语音数据,分别发送至对应第一用户的第一耳机;然后各第一耳机可以对接收到的第六翻译语音数据进行播放。
其中,本发明实施例不限制先执行步骤702-步骤706,还是先执行步骤708-步骤712。
综上,本发明实施例中,在多个用户面对面语音交流的场景下,在第一用户发言的过程中,所述语音处理模块接收所述第一耳机发送的语音数据后,可以对所述语音数据进行翻译,得到第五翻译语音数据,并将第五翻译语音数据发送至所述至少一个第二耳机,由所述至少一个第二耳机播放所述第五翻译数据。在第二用户发言过程中,所述语音处理模块接收所述第二耳机发送的语音数据后,可以对所述语音数据进行翻译,得到第六翻译语音数据,并将第六翻译语音数据发送至所述至少一个第一耳机,由所述至少一个第一耳机播放所述第六翻译数据。进而本发明实施例可以基于耳机和耳机收纳装置快速的实现多人翻译,无需交流各方不断的交换翻译设备查看翻译设备中针对对方的翻译结果,不仅能够提高翻译效率,且还能够提高用户体验。
本发明实施例中,当耳机还与终端设备连接时,本发明实施例的一个应用场景可以是:来电语音播报。通过耳机和耳机收纳装置可以联合对终端设备中的来电进行语音播报,简化用户获知来电用户的操作,使得用户可以快捷获知来电用户,提高用户体验。
参照图8,示出了本发明一种语音播报方法实施例的步骤流程图。
步骤802、所述语音处理模块接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的。
步骤804、所述语音处理模块对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果并基于所述识别结果生成播报信息。
步骤806、所述语音处理模块将所述播报信息返回至所述耳机,由耳机基于所述播报信息进行语音播报。
在终端设备接收到来电时,可以将接收到的来电所对应的来电信息发送与其连接的耳机;由耳机基于所述来电信息进行语音播报。其中,耳机可以将来电信息发送至耳机收纳装置的语音处理模块,由该语音处理模块对该来电信息进行处理,生成播报信息并返回给耳机,由耳机基于所述播报信息进行语音播报。
耳机收纳装置的语音处理模块接收到来电信息后,可以将来电信息确定为目标数据,然后对目标数据进行语音处理。
其中,所述来电信息中可以包括多种信息,如来电用户的MDN(MobileDirectoryNumber,移动用户号码簿号码)等,本发明实施例对此不作限制。耳机收纳装置中的语音处理模块可以对来电信息中的来电MDN进行识别,确定对应的识别结果,并基于识别结果生成播报信息返回给所述耳机。耳机接收到播报信息后,可以基于该播报信息进行语音播报。
本发明的一个示例中,语音处理模块对来电信息中的来电MDN进行识别的方式可以包括多种;例如可以将来电MDN与预先存储的终端设备的通讯录进行比对,对从来电信息中提取的来电MDN进行识别。又例如可以将来电MDN与预设身份号码库中的MDN(如推销、中介、外卖等对应的MDN)进行匹配,对从来电信息中提取的来电MDN进行识别,本发明实施例对此不作限制。
其中,语音处理模块可以先将所述来电MDN与预先存储的通讯录中各MDN进行匹配。若从所述通讯录中查找与所述来电MDN匹配的MDN,则可以确定来电用户是通讯录中的用户;其中,为了便于后续说明,可以将通讯录中与来电MDN匹配的MDN,称为第一目标MDN。此时可以基于第一目标MDN对应的用户名称生成识别结果。其中,可以将第一目标MDN对应的用户名称,直接作为识别结果;也可以将第一目标MDN对应的用户名称,和与第一目标MDN关联的其他信息,作为识别结果,本发明实施例对此不作限制。其中,所述与第一目标MDN关联的其他信息可以包括多种,如第一目标MDN对应的用户与本端通话用户的关系、第一目标MDN、第一目标MDN的属性信息如归属地、最近一段时间内的来电次数等,本发明实施例对此不作限制。其中,可以在通讯录中查找第一目标MDN对应的分组信息或备注信息,依据第一目标MDN对应的分组信息或备注信息,确定第一目标MDN对应的用户与本端通话用户的关系。若从所述通讯录中未查找到与所述来电MDN匹配的第一目标MDN,则将所述来电MDN与所述耳机中预存的预设身份号码库进行匹配。若从所述预设身份号码库中查找到与所述来电MDN匹配的MDN时,则可以说明来电用户存在预设身份;其中,为了便于后续说明,可以将预设身份号码库中查找到与所述来电MDN匹配的MDN,称为第二目标MDN。此时可以依据所述第二目标MDN的预设身份标签生成识别结果。其中,可以仅将第二目标MDN对应的预设身份标签,作为识别结果;也可以将第二目标MDN对应的预设身份标签与第二目标MDN的属性信息(如归属地、最近一段时间内的来电次数、最近一段时间内被标记的次数等),作为识别结果等;本发明实施例对此不作限制。
在得到识别结果后,耳机收纳装置的语音处理模块,可以基于所述识别结果生成播报信息;例如直接将识别结果作为播放信息,也可以基于识别结果生成语音播报文本,然后将语音播报文本转换为语音数据,将该语音数据作为播报信息,本发明实施例对此不作限制。再将播报信息返回给耳机,耳机接收到播报信息后,可以基于播报信息进行语音播报。
综上,本发明实施例中,在终端设备接收到来电时,可以将来电信息发送至耳机,由耳机将来电信息发送给耳机收纳装置的语音处理模块;进而所述语音处理模块接收所述耳机发送的来电信息后,可以对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果并基于所述识别结果生成播报信息;再将所述播报信息返回至所述耳机,由耳机基于所述播报信息进行语音播报。进而在终端设备接收到来电时,用户通过耳机的语音播报,可以快捷的获知来电用户,无需查看终端设备,提高了用户体验。
本发明实施例中,当耳机还与终端设备连接时,本发明实施例的一个应用场景可以是:电话拦截。通过耳机和耳机收纳装置可以联合对终端设备中的来电进行拦截,降低骚扰电话对用户的打扰,提高用户体验。
参照图9,示出了本发明的一种电话拦截方法实施例的步骤流程图。
步骤902、所述语音处理模块接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的。
在终端设备接收到来电时,可以将接收到的来电所对应的来电信息发送给与其连接的耳机;耳机可以将来电信息发送至耳机收纳装置的语音处理模块,由该语音处理模块对该来电信息进行处理,以判断是否对来电进行拦截。
耳机收纳装置的语音处理模块接收到来电信息后,可以将来电信息确定为目标数据,然后对目标数据进行语音处理。
步骤904、所述语音处理模块对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果。
其中,所述来电信息中可以包括多种信息,如来电用户的MDN(MobileDirectoryNumber,移动用户号码簿号码)等,本发明实施例对此不作限制。耳机收纳装置中的语音处理模块可以对来电信息中的来电MDN进行识别,确定对应的识别结果。
本发明的一个示例中,语音处理模块对来电信息中的来电MDN进行识别的方式可以包括多种;例如可以将来电MDN与预设身份号码库中的MDN(如推销、中介、外卖等对应的MDN)进行匹配,对从来电信息中提取的来电MDN进行识别。还例如将来电MDN与预先设置的拦截MDN进行匹配,对从来电信息中提取的来电MDN进行识别;本发明实施例对此不作限制。
其中,语音处理模块可以先将所述来电MDN与预设身份号码库中的MDN进行匹配。若从所述预设身份号码库中查找与所述来电MDN匹配的MDN,则可以生成预设识别结果。若从所述预设身份号码库中未查找到与所述来电MDN匹配的MDN时,则将所述来电MDN与预先设置的拦截MDN进行匹配。若存在与来电MDN匹配的拦截MDN时,可以生成预设识别结果。若不存在与来电MDN匹配的拦截MDN时,可以生成其他识别结果,或忽略该来电信息。
步骤906、若所述识别结果是预设识别结果,则生成来电拦截指令并将所述来电拦截指令发送至所述耳机,由所述耳机将所述来电拦截指令发送至所述终端设备,以对所述来电进行拦截。
当识别结果是预设识别结果时,耳机收纳装置的语音处理模块可以生成来电拦截指令;然后将所述来电拦截指令发送至耳机,再由耳机将所述来电拦截指令发送给终端设备。然后可以由终端设备可以响应于该来电拦截指令,对来电进行拦截;当然,也可以由终端设备中与耳机设备对应的应用程序,响应于该该来电拦截指令,对来电进行拦截。
综上,本发明实施例中,在终端设备接收到来电时,终端设备可以将来电信息发送至与终端设备连接的耳机,然后耳机可以将该来电信息发送至耳机收纳装置的语音处理模块;进而语音处理模块可以接收所述耳机发送的来电信息,并对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果;若所述识别结果是预设识别结果,则生成来电拦截指令并将所述来电拦截指令发送至所述耳机,由所述耳机将所述来电拦截指令发送至所述终端设备,实现对所述来电进行拦截。
本发明实施例中,当耳机还与终端设备连接时,本发明实施例的一个应用场景可以是:电话代接。进而在用户不方便接听电话时,通过耳机和耳机收纳装置联合对终端设备中的来电进行代接,提高用户体验。
参照图10,示出了本发明的一种电话代接方法实施例的步骤流程图。
步骤1002、所述语音处理模块接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的。
步骤1002与上述步骤902类似,在此不再赘述。
步骤1004、所述语音处理模块对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果。
本发明的一个示例中,语音处理模块对来电信息中的来电MDN进行识别的方式可以包括多种;例如可以将来电MDN与预先存储的终端设备的通讯录进行比对,对从来电信息中提取的来电MDN进行识别。又例如可以将来电MDN与预设身份号码库中的MDN(如推销、中介、外卖等对应的MDN)进行匹配,对从来电信息中提取的来电MDN进行识别,本发明实施例对此不作限制。
其中,语音处理模块可以先将所述来电MDN与预先存储的通讯录中各MDN进行匹配。若从所述通讯录中查找与所述来电MDN匹配的MDN,则可以确定来电用户是通讯录中的用户;其中,为了便于后续说明,可以将通讯录中与来电MDN匹配的MDN,称为第一目标MDN。此时可以基于第一目标MDN对应的用户名称生成识别结果。其中,可以将第一目标MDN对应的用户名称,直接作为识别结果;也可以将第一目标MDN对应的用户名称,和与第一目标MDN关联的其他信息,作为识别结果,本发明实施例对此不作限制。其中,所述与第一目标MDN关联的其他信息可以包括多种,如第一目标MDN对应的用户与本端通话用户的关系、第一目标MDN、第一目标MDN的属性信息如归属地、最近一段时间内的来电次数等,本发明实施例对此不作限制。其中,可以在通讯录中查找第一目标MDN对应的分组信息或备注信息,依据第一目标MDN对应的分组信息或备注信息,确定第一目标MDN对应的用户与本端通话用户的关系。若从所述通讯录中未查找到与所述来电MDN匹配的第一目标MDN,则将所述来电MDN与所述耳机中预存的预设身份号码库进行匹配。若从所述预设身份号码库中查找到与所述来电MDN匹配的MDN时,则可以说明来电用户存在预设身份;其中,为了便于后续说明,可以将预设身份号码库中查找到与所述来电MDN匹配的MDN,称为第二目标MDN。此时可以依据所述第二目标MDN的预设身份标签生成识别结果。其中,可以仅将第二目标MDN对应的预设身份标签,作为识别结果;也可以将第二目标MDN对应的预设身份标签与第二目标MDN的属性信息(如归属地、最近一段时间内的来电次数、最近一段时间内被标记的次数等),作为识别结果等;本发明实施例对此不作限制。
步骤1006、基于所述识别结果对所述终端设备接收到的来电进行代接。
然后语音处理模块得到识别结果后,可以基于识别结果生成代接指令,并发送给耳机;由耳机将所述代接指令发送至终端设备,以接听来电。例如,当识别结果为基于第一目标MDN的名称生成的识别结果时,可以生成代接指令;当识别结果为基于第二目标MND的预设身份标签生成的识别结果,则可以无需生成代接指令。其中,可以是在来电响铃或振动设定时长后,语音处理模块生成代接指令;也可以是用户执行代接操作后,语音处理模块生成代接指令,本发明实施例对此不作限制。执行代接操作方式可以包括多种,如语音、触控(其中,耳机收纳装置还可以设置有显示模块,用户可以在显示模块中进行触控)等,本发明实施例对此不作限制。
然后在来电接通后,终端设备可以将来电用户的语音数据发送至耳机,耳机可以将来电用户的语音数据发送至耳机收纳装置的语音处理模块。进而语音处理模块可以根据来电用户的语音数据和识别结果,生成对应的对话回复语音数据;然后可以将该回复语音数据发送至耳机,由耳机发送至终端终端,再由终端设备将回复语音数据发送至来电用户的终端设备,以实现代接。
综上,本发明实施例中,在终端设备接收到来电时,终端设备可以将来电信息发送至与终端设备连接的耳机,然后耳机可以将该来电信息发送至耳机收纳装置的语音处理模块;进而语音处理模块可以接收所述耳机发送的来电信息,并对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果;再基于所述识别结果对所述终端设备接收到的来电进行代接;进而在用户不方便接听电话时,进行电话代接。
本发明实施例的的一个应用场景还可以是:声音美化。
参照图11、示出了本发明的一种声音美化方法实施例的步骤流程图。
步骤1102、所述语音处理模块获取目标数据。
本发明的一个示例中,耳机还可以与终端设备连接,在终端设备通信过程中,耳机收纳装置的语音处理模块,可以获取耳机采集的本端通话用户的语音数据。然后可以本端通话用户的语音数据,作为目标数据。
本发明的另一个示例中,在K歌/直播过程中,语音处理模块可以用户的语音数据,作为目标数据。
步骤1104、所述语音处理模块对所述目标数据进行美化处理,得到美化语音数据。
语音处理模块可以对目标数据进行美化处理,可以包括如下至少一种:
滤除所述目标数据中的用户噪音。进而能够提高语音信号的清晰度和质量,进而能够帮助用户实现打动其他用户和增强自信的目的。这样,既可以保留用户自身独立的声音风格,又能够实现声音的美化。其中,所述用户噪音表征用户产生的噪音,所述用户噪音包括:哈气音、颤音和口音中的至少一种。可以理解,本领域技术人员可以根据实际应用需求,采用其他用户噪音,如走路音等,用户自身产生的噪音均在用户噪音的保护范围之内。
本发明实施例可以预先收集噪音样本,并提取噪音样本的声纹特征,作为预设声纹特征。可选地,可以对噪音样本进行分类,并针对多个噪音类别,分别确定对应的预设声纹特征。这样,在进行美化处理的过程中,可以从目标数据中滤除与上述预设声纹特征相对应的声音信号,以得到不包含用户噪音的语音信号,也即美化语音数据。这样,既可以保留用户自身独立的声音风格,又能够实现声音的美化。本发明实施例对于预设声纹特征的具体种类不加以限制。例如,预设声纹特征的种类可以包括:梅尔频率倒谱系数(MFCC,Mel-frequency Cepstrum Coefficients)、基频参数、滤波器组(Fbank,FilterBanks)等。
确定所述目标数据对应的目标语音类别;依据目标语音类别对应的第一语音参数,对所述目标数据进行处理,得到美化语音数据。
本发明实施例可以预先收集语音样本,并对语音样本进行分类。可以对语音样本进行筛选,以得到不包含用户噪音的清晰度较高的语音。
语音类别可以包括:女音、男音、童音等。其中,女音可以包括:磁性女声、傻白甜妹子声;男音可以包括:磁性男音、沙哑男音等。可以理解,本领域技术人员可以根据实际应用需求,进行语音样本的分类,本发明实施例对于具体的语音类别不加以限制。
本发明实施例在美化处理的过程中,可以首先确定目标数据对应的目标语音类别,以确定目标数据属于哪种语音类别;然后,可以将目标语音类别的第一语音参数,作为目标数据的参考依据。例如,可以对目标数据进行调整,以使调整后的美化语音数据对应的第二语音参数与上述目标数据相匹配等。由于美化语音数据具有与目标语音类别相匹配的语音参数,而目标语音类别对应的语音样本可以对应经过筛选不包含用户噪音的清晰度较高的语音;因此本发明实施例依据目标语音类别对应的第一语音参数,得到美化语音数据,也可以提高语音信号的清晰度和质量,进而能够帮助用户实现打动听众和增强自信的目的。这样,既可以保留用户自身独立的声音风格,又能够实现声音的美化。
在本发明的一种可选实施例中,目标语音类别可由用户指定,以将用户喜好的语音类别用于第二语音信号的确定过程,由此可以提高第二语音信号与用户需求之间的匹配度。
音效处理;所述音效处理包括如下处理中的至少一种:环绕处理、信道均衡处理、以及混响处理。
其中,环绕处理可以提高语音信号的空间感。信道均衡处理可以提升语音信号的磁性、浑厚度,进而提升语音信号的魅力感。混响处理可以提升语音信号的动听感和圆润度,不同的混响处理可以使用户处于不同的空间和场所中。场所的例子可以包括:ktv、录音棚、演唱会等,本发明实施例可以依据用户指定的场所,提供对应的混响处理。
在本发明的一种实施例中,可以采用头部相关传输函数(HRTF,Head RelatedTransferFunction)技术,对第二语音信号进行环绕处理。HRTF技术可以计算不同方向或位置声音所产生的大小和音调等,进而制造出立体空间声音定位的效果。
在本发明的一种实施例中,信道均衡处理可以确定第二语音信号对应的目标频段,然后依据目标频段对应的预设频率,对第二语音信号对应的频率参数进行调整。假设目标频段A为20~60Hz,目标频段A中20Hz左右的声音具有空虚感,而60Hz左右的声音可能出现低频共振问题,本发明实施例可以将目标频段A中的预设频率调整为45Hz左右,以提升语音信号的磁性。可以理解,本领域技术人员可以根据实际应用需求,进行所需的信道均衡处理,本发明实施例对于具体的信道均衡处理过程不加以限制。
本发明实施例可以采用如下混响处理方式产生混响声。一种混响处理方式,通过与所需模拟空间的单位冲击响应进行卷积运算来产生混响声,该方式将空间的单位冲击响应和语音信号进行卷积运算,得到系统的输出信号。另一种混响处理方式,通过梳状滤波器和全通滤波器的简单级联或嵌套来产生混响声,利用滤波器的特性来产生混响信号。可以理解,本发明实施例对于具体的混响处理方式不加以限制。
步骤1106、所述语音处理模块将所述美化语音数据发送至所述播放模块,所述播放模块播放所述美化语音数据。
在K歌或直播过程中,语音处理模块在得到美化语音数据后,可以将所述美化语音数据发送至所述播放模块,所述播放模块播放所述美化语音数据。
步骤1108、所述语音处理模块将所述美化语音数据返回给所述耳机,由所述耳机将所述美化语音数据发送至与所述耳机连接的终端设备。
在终端设备通信过程中,目标数据可以是本端通话用户的语音数据,则所述语音处理模块将所述美化语音数据返回给所述耳机,由所述耳机将所述美化语音数据发送至与所述耳机连接的终端设备。然后再由于耳机连接的终端设备,发送至对端用户的终端设备。
综上,本发明实施例中,在终端设备通信过程中,耳机收纳装置的语音处理模块语音数据后,可以对所述语音数据进行美化处理,得到美化语音数据;然后可以所述语音处理模块将所述美化语音数据发送至所述播放模块,所述播放模块播放所述美化语音数据;或,所述语音处理模块将所述美化语音数据返回给所述耳机,由所述耳机将所述美化语音数据发送至与所述耳机连接的终端设备;进而实现通信过程/K歌过程/直播过程等场景中的声音美化。
本发明实施例的一种应用场景可以是:变声。
参照图12、示出了本发明的一种变声方法实施例的步骤流程图。
步骤1202、所述语音处理模块获取目标数据。
本发明的一个示例中,耳机还可以与终端设备连接,在终端设备通信过程中,耳机收纳装置的语音处理模块,可以获取耳机采集的本端通话用户的语音数据。然后可以本端通话用户的语音数据,作为目标数据。
本发明的另一个示例中,在K歌/直播过程中,语音处理模块可以用户的语音数据,作为目标数据。
步骤1204、所述语音处理模块对所述语音数据进行变声处理,得到变声语音数据。
语音处理模块接收到目标数据后,可以对目标数据进行变声处理,可以得到变声语音数据。
本发明的一个示例中,对目标数据进行变声处理,可以改变音色、音调和语速等,得到变声语音数据。
本发明的一个示例中,可以预先收集预设用户的语音数据,然后通过对预设用户的语音数据进行处理,生成预设用户的声学特征。进而在对目标数据进行处理时,可以识别出目标数据对应的文本信息;然后将目标数据的文本信息和预设用户的声学特征进行合成,得到变声语音数据。所述预设用户可以按照用户需求设置,如卡通人物、动漫人物、影视剧人物等等,本发明实施例对此不作限制。
步骤1206、所述语音处理模块将所述变声语音数据返回给所述耳机,由所述耳机将所述变声语音数据发送至与所述耳机连接的终端设备。
在终端设备通信过程中,目标数据可以是本端通话用户的语音数据,则所述语音处理模块将所述变声语音数据返回给所述耳机,由所述耳机将所述变声语音数据发送至与所述耳机连接的终端设备。然后再由于耳机连接的终端设备,发送至对端用户的终端设备。
步骤1208、所述语音处理模块将所述变声语音数据发送至所述播放模块,所述播放模块播放所述变声语音数据。
在K歌或直播过程中,语音处理模块在得到变声语音数据后,可以将所述变声语音数据发送至所述播放模块,所述播放模块播放所述变声语音数据。
综上,本发明实施例中,耳机收纳装置的语音处理模块接收语音数据后,然后对所述语音数据进行变声处理,得到变声语音数据;再将所述变声语音数据返回给所述耳机,由所述耳机将所述变声语音数据发送至与所述耳机连接的终端设备;进而实现通信过程/K歌过程/直播过程等场景中的变声。
本发明实施例的一个应用场景可以是:对话分析。
参照图13,示出了本发明的一种对话分析方法实施例的步骤流程图。
步骤1302、所述语音处理模块获取对话的语音数据;所述对话的参与方包括:至少两个用户。
步骤1304、所述语音处理模块确定所述语音数据对应的提示信息;所述提示信息为依据所述语音数据对应的语义信息、和/或、情绪信息得到。
步骤1306、所述语音处理模块在对话过程中、和/或、在对话结束后,输出所述提示信息。
其中,所述对话可以是通话过程中的对话,也可以是面对面沟通过程中的对话,本发明实施例对此不作限制。所述对话的语音数据可以包括对话中用户的语音数据。
所述语音数据可以是耳机采集的,也可以是耳机收纳装置采集的,还可以耳机从终端设备接收到的。
由于上述提示信息可以为依据语音数据对应的语义信息、和/或、情绪信息得到,故上述提示信息可以提示用户在对话过程中出现的问题。
语义信息是信息的表现形式之一,指能够消除事物不确定性的有一定意义的信息。本发明实施例中,可以对语音数据进行语义分析,以得到对应的语义信息。可用的语义分析方法可以包括:关键词提取方法、句子成分分析方法、或者机器学习方法等,可以理解,本发明实施例对于具体的语义分析方法不加以限制。
本发明实施例中,可选的是,可以利用语音识别方法,将语音数据转换为对话文本,并对上述对话文本进行语义分析,以得到对应的语义信息。
本发明实施例中,可选的是,可以依据对话身份信息,识别对话文本中的第一对话文本和第二对话文本,并确定第一对话文本和第二对话文本分别对应的第一语义信息和第二语义信息。其中,第一对话文本和第二对话文本可以对应不同的对话身份信息,例如,第一对话文本对应对话中第一用户,第二对话文本对应对话中第二用户等。
本发明实施例中,可选的是,可以利用声纹识别方法,确定对话身份信息。声纹识别方法是一种根据语音波形中反映发声用户生理和行为特征的语音参数,来识别待测语音话者身份的方法。由于不同的用户对于不同的声纹,因此可以利用声纹识别方法,确定不同的对话身份信息。
在本发明的一种可选实施例中,语义信息表明,任一参与方的语音数据与所述语音数据对应的主题不匹配,则所述语音处理模块在对话过程中、和/或、在对话结束后,可以向任一参与方的耳机输出对应的提示信息;由耳机对提示信息进行播放。也可以向耳机收纳装置的播放模块输出所述提示信息,由播放模块播放该提示信息。
主题是指语音数据所要表现的中心思想,泛指主要内容。可以采用主题分析方法,确定主题数据对应的主题。可以理解,语音数据可以包括至少一个主题。
例如,按照时间对语音数据进行分析,不同的时间可以对应不同的主题。又如,按照对话身份信息对语音数据进行分析,不同的对话身份信可以对应不同的主题。
例如,在采访场景下,采访者设定了若干主题,并计划按照设定的主题引导对话;然而,在实际的对话过程中,被采访者的语音数据与采访者设定的主题不匹配,则可以向采访者的耳机输出对应的提示信息,以使采访者根据需求切换主题。
又如,在面试场景下,面试官设定了若干主题,并计划按照设定的主题引导对话;然而,在实际的对话过程中,求职者的语音数据与面试者设定的主题不匹配,则可以向面试官的耳机输出提示信息,由耳机向与其连接的终端设备发送提示信息;再由该终端设备向与其通信的其它终端设备发送该提示信息,进而实现向求职者输出对应的提示信息,以使求职者根据实际情况调整自身的语音内容。或者,可以向面试官的耳机输出对应的提示信息,由耳机对该提示信息进行播放,以使面试官根据需求切换主题。
本发明实施例中,情绪是指人有喜、怒、哀、乐、惧等心理体验,这种体验是人对客观事物的态度的一种反映。情绪具有肯定和否定的性质。能满足人的需要的事物会引起人的肯定性质的体验,如快乐、满意等;不能满足人需要的事物会引起人的否定性质的体验,如愤怒、憎恨、哀怨等。
在本发明的一种可选实施例中,情绪信息可以包括:正面情绪、或者负面情绪,其中,正面情绪具有建设性和积极性,负面情绪具有破坏性和消极性。其中,负面情绪可以包括但不限于:着急、焦虑、紧张、愤怒、沮丧、悲伤、痛苦、无聊等。正面情绪可以包括但不限于:开心、乐观、自信、欣赏、放松等。可选地,情绪信息还可以包括:中性情绪,中性情绪可以包括但不限于:平静等。
本发明实施例中,可选的是,所述情绪信息可以为依据所述语音数据对应的语音特征得到;和/或
所述情绪信息为对用户的体感数据进行分析得到。
语音特征可以表征语音方面的特征。所述语音特征包括如下特征中的至少一种:语气特征、节奏特征、以及强度特征。
例如,在处于紧张状态的情况下,发音器官的正常颤动被抑制,此时说话时,发音的颤动不能人为的随意控制,因此可通过监测用户的语音特征获得用户的情绪信息。
本发明实施例可以利用语音特征与情绪信息之间的映射关系,确定用户的情绪信息。
本发明实施例的提示信息可以包括如下信息中的至少一种:
提示信息1、对端通话用户针对本端通话用户的评价信息;
提示信息2、对端通话用户的信任信息;
提示信息3、情绪提示信息;
提示信息4、节奏提示信息;
提示信息5、对话质量信息;
提示信息6、对话气氛信息。
综上,本发明实施例中,在对话过程中,所述语音处理模块获取对话的语音数据后,可以确定所述语音数据对应的提示信息;所述提示信息为依据所述语音数据对应的语义信息、和/或、情绪信息得到;再在对话过程中、和/或、在对话结束后,输出所述提示信息。由于上述提示信息可以为依据语音数据对应的语义信息、和/或、情绪信息得到,故上述提示信息可以提示用户在对话过程中出现的问题,使得用户在对话过程中及时改善问题,因此能够提升本次对话的对话质量;或者,可以使用户在对话结束后改善问题,以提升后续对话的对话质量。
若耳机还与终端设备连接,本发明实施例的一个的应用场景可以是:电话录音。
参照图14、示出了本发明的一种电话录音方法实施例的步骤流程图。
步骤1402、在所述终端设备通话过程中,所述语音处理模块从所述耳机接收通话语音数据。
步骤1404、对所述通话语音数据进行存储。
本发明实施例中,在终端设备在通话过程中,若对端通话用户进行了发言,则对端通话用户的终端设备可以将对端通话用户的语音数据,发送给本端通话用户的终端设备。然后本端通话用户的终端设备可以将对端通话用户的语音数据发送给耳机,由耳机将对端通话用户的语音数据发送给耳机收纳装置的语音处理模块。若本端用户进行了发言,则耳机可以采集本端通话用户的语音数据,然后将本端通话用户的语音数据发送给耳机收纳装置的语音处理模块。
所述语音处理模块可以将接收到的语音数据,确定为通话语音数据;然后可以对该通话语音数据进行存储。其中,当通信过程中,仅本端通话用户进行了发言时,所述通话语音数据中可以仅包含本端通话用户的语音数据;仅对端通话用户进行了发云时,可以仅包含对端通话用户的语音数据。以及当本端通话用户和对端通话用户均进行了发言时,通话语音数据可以包括本端通话用户的语音数据和对端通话用户的语音数据。
本发明实施例中,当通话语音数据包括本端通话用户的语音数据和对端通话用户的语音数据时,可以根据用户选择操作,确定是对通话语音数据中的本端通话用户的语音数据进行存储,还是对通话语音数据中的对端通话用户的语音数据进行存储,还是对通话语音数据中的本端通话用户的语音数据和对端通话用户的语音数据均进行存储。
本发明实施例中,还可以根据用户的录音操作,确定从通话过程中的哪个时刻对通话语音数据进行存储。即当接收到用户录音操作对应的录音指令时,执行步骤1404。
综上,本发明实施例中,在所述终端设备通话过程中,所述语音处理模块从所述耳机接收通话语音数据;然后对所述通话语音数据进行存储,进而实现电话录音。
本发明实施例的一个应用场景可以是:对潜在风险事件进行声音提醒。
参照图15、示出了本发明的一种语音提示方法实施例的步骤流程。
步骤1502、所述语音处理模块获取环境音数据。
步骤1504、所述语音处理模块根据所述环境音数据,识别环境中的潜在风险事件。
步骤1506、所述语音处理模块向所述耳机发送所述潜在风险事件,由所述耳机根据所述潜在风险事件进行声音提醒。
本发明实施例中,可以由耳机收纳装置的语音采集模块获取环境中的环境音数据,并将环境音数据发送给耳机收纳装置的语音处理模块;也可以由耳机采集环境中的环境音数据,然后发送给耳机收纳装置的语音处理模块。
环境音数据是指用户当前环境周围的声音数据。在室外环境中,环境音数据繁杂,可以包括多种叠加在一起的声音,例如可以包括汽车声、火车声、行人脚步声、自行车声、红绿灯切换时的提示声、虫鸣鸟叫声等等。
然后由耳机收纳装置中的语音处理模块,根据所述环境音数据,识别环境中的潜在风险事件。其中,语音处理模块可以采用预先训练的声音识别模型,识别环境中的潜在风险事件,声音识别模型可以是采用收集大量环境音数据作为训练样本训练得到的模型。
环境中的潜在风险事件是具有潜在风险的事件,潜在风险事件可以包括:在用户的预设范围内有车辆靠近,预设范围内有车辆鸣笛,红绿灯即将切换,预设范围内有行人等等。
待语音处理模块识别出环境中的潜在风险事件后,可以向耳机发送该潜在风险事件,由耳机播放与所述潜在风险事件相应的提醒语音数据。例如,潜在风险事件为有车辆靠近,或有车辆发出喇叭声,则可以播放“注意车辆”的提醒声音。又例如,潜在风险事件为有人大声呼叫,则可以播放“注意行人呼叫”的提醒声音。当然,待语音处理模块识别出环境中的潜在风险事件后,也可以生成对应的提示语音数据;然后将提示语音数据发送给耳机,耳机直接播放该提示语音数据即可。
综上,本发明实施例中,所述语音处理模块获取环境音数据后,可以根据所述环境音数据,识别环境中的潜在风险事件;然后向所述耳机发送所述潜在风险事件,由所述耳机根据所述潜在风险事件进行声音提醒,使得用户在佩戴耳机的过程中,耳机能及时告知用户环境中存在的危险从而使得用户可以及时规避风险。
本发明实施例中,当用户在采用所述耳机进行通话的过程中,可以开启至少一个耳机的近场拾音模式采集近场声音数据。
在耳机与耳机收纳装置通信连接情况下,耳机可以只负责开启近场拾音模式,采集近场声音数据。耳机收纳装置可以负责开启远场拾音模块,采集远场声音数据。
在本发明实施例中,若识别到潜在风险事件且所述耳机正在播放声音数据,则耳机收纳装置可以控制耳机降低播放所述声音数据的音量或停止播放所述声音数据。例如,在耳机播放歌曲的过程中,若在识别到潜在风险事件,则耳机收纳装置可以控制耳机降低播放歌曲的声音,或停止播放歌曲。又例如,在使用耳机通话的过程中,若在识别到潜在风险事件,则耳机收纳装置可以控制耳机降低通话语音的音量。
在本发明实施例中,若识别到潜在风险事件且所述耳机正在进行通话,则调用预设电话助手代接所述通话。具体的,终端设备的通话过程可以由耳机收纳装置的语音处理模块接管,若在使用耳机通话的过程中,识别到潜在风险事件,则可以耳机收纳装置的语音处理模块可以进行电话代接,自动回复电话内容。
若耳机还与终端设备连接,则本发明实施例的一个应用场景可以是:语音增强。
参照图16、示出了本发明的一种语音增强方法实施例的步骤流程。
步骤1602、所述语音处理模块获取通话语音数据。
本发明实施例中,在终端设备在通话过程中,若对端通话用户进行了发言,则对端通话用户的终端设备可以将对端通话用户的语音数据,发送给本端通话用户的终端设备。然后本端通话用户的终端设备可以将对端通话用户的语音数据发送给耳机,由耳机将对端通话用户的语音数据发送给耳机收纳装置的语音处理模块。若本端用户进行了发言,则耳机可以采集本端通话用户的语音数据,然后将本端通话用户的语音数据发送给耳机收纳装置的语音处理模块。
步骤1604、所述语音处理模块对所述通话语音数据进行语音增强。
所述语音处理模块可以将接收到的语音数据,确定为通话语音数据;然后可以对该通话语音数据进行语音增强。其中,所述语音增强可以是指从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术,即从含噪语音中提取尽可能纯净的原始语音。
其中,可以仅对通话语音数据中的本端通话用户的语音数据进行语音增强,也可以仅对通话语音数据中的对端用户的语音数据进行语音增强;可以对通话语音数据中的本端通话用户和对端通话用户进行语音增强,本发明实施例对此不作限制。
步骤1606、所述语音处理模块将经过语音增强的语音数据发送至所述耳机,由所述耳机播放经过语音增强的语音数据。
在语音处理模块对通话语音数据中的对端通话用户的语音数据进行语音增强后,可以将经过语音增强的对端通话用户的语音数据发送至所述耳机,由所述耳机播放经过语音增强的对端通话用户的语音数据。
步骤1608、所述语音处理模块将经过语音增强的语音数据发送至所述耳机,由所述耳机将经过语音增强的语音数据发送至与耳机连接的终端设备。
在语音处理模块对通话语音数据中的本端通话用户的语音数据进行语音增强后,可以将经过语音增强的本端通话用户的语音数据发送至所述耳机,由所述耳机将经过语音增强的本端通话用户的语音数据发送至与耳机连接的终端设备。然后再由该终端设备将语音增强的本端通话用户的语音数据至对端通话用户的终端设备中。
综上,本发明实施例中,所述语音处理模块可以获取通话语音数据;然后对所述通话语音数据进行语音增强;再将经过语音增强的语音数据发送至所述耳机,由所述耳机播放经过语音增强的语音数据;或,所述语音处理模块将经过语音增强的语音数据发送至所述耳机,由所述耳机将经过语音增强的语音数据发送至与耳机连接的终端设备;进而实现在通话过程中进行语音增强。
本发明实施例的一个应用场景可以是:导航。
参照图17、示出了本发明的一种导航方法实施例的步骤流程。
步骤1702、所述语音处理模块获取导航查询语音数据。
本发明实施例中,用户可以单独使用耳机收纳装置进行导航,可以将耳机和耳机收纳装置配合使用进行导航,本发明实施例对此不作限制。
本发明实施例中,当用户需要使用导航时,可以针对耳机发出导航查询语音数据;对应的,耳机可以采集到该航查询语音数据,然后可以将该航查询语音数据发送至耳机收纳装置的语音处理模块;进而所述语音处理模块获取导航查询语音数据。
本发明的实施例中,当用户需要使用导航时,可以针对耳机收纳装置发出导航查询语音数据;对应的,耳机收纳装置的语音采集模块可以采集到该航查询语音数据,然后可以将该航查询语音数据发送至耳机收纳装置的语音处理模块;进而所述语音处理模块获取导航查询语音数据。
步骤1704、所述语音处理模块获取用户地理位置信息和用户方位信息。
本发明实施例中,耳机收纳装置中还可以设置有定位模块如GPS(GlobalPositioning System,全球定位系统)模块;采集用户地理位置信息。进而语音处理模块可以从定位模块中,获取用户地理位置信息。
其中,用户方位信息是指用户的正面朝向,在本发明实施例中,耳机收纳装置中可以具有方位传感器,在用户携带耳机收纳装置时,方位传感器可以实时检测用户方位信息。
步骤1706、所述语音处理模块根据所述用户方位信息和所述用户地理位置信息,生成所述导航查询语音数据对应的导航结果语音数据。
步骤1708、所述语音处理模块将所述导航结果语音数据发送至所述耳机,由所述耳机播放所述导航结果语音数据。
步骤1710、所述语音处理模块将所述导航结果语音数据发送至所述播放模块,所述播放模块播放所述导航结果语音数据。
然后所述语音处理模块根据所述用户方位信息和所述用户地理位置信息,生成所述导航查询语音数据对应的导航结果语音数据。然后可以将所述导航结果语音数据发送至所述耳机,由所述耳机播放所述导航结果语音数据。也可以将所述导航结果语音数据发送至所述播放模块,所述播放模块播放所述导航结果语音数据。由于通过耳机和耳机收纳装置进行语音播报导航,能够解放用户双眼,从而能够提高导航过程中用户的安全,提高用户体验。
其中,所述语音处理模块可以进行多轮导航,即可以获取多轮导航查询语音数据和将对应的导航结果语音数据发送至耳机播放。
综上,本发明实施例中,所述语音处理模块获取导航查询语音数据后,可以获取用户地理位置信息和用户方位信息;然后根据所述用户方位信息和所述用户地理位置信息,生成所述导航查询语音数据对应的导航结果语音数据;并所述语音处理模块将所述导航结果语音数据发送至所述耳机,由所述耳机播放所述导航结果语音数据;也可以将所述导航结果语音数据发送至所述播放模块,所述播放模块播放所述导航结果语音数据;进而实现导航。且由于通过耳机和耳机收纳装置进行语音播报导航,能够解放用户双眼,从而能够提高导航过程中用户的安全,提高用户体验。
本发明实施例的一个应用场景可以是:语音交互。
参照图18、示出了本发明的一种语音交互方法实施例的步骤流程。
步骤1802、所述语音处理模块获取语音数据。
步骤1804、所述语音处理模块对所述语音数据进行指令识别,得到对应的交互指令。
步骤1806、所述语音处理模块将所述交互指令发送至所述交互助手,以调用所述交互助手执行所述交互指令对应的交互操作。
本发明实施例中,所述耳机收纳装置中还可以设置有交互助手,用户可以通过语音与交互助手进行交互。在交互过程中,所述语音处理模块可以获取用于交互的语音数据,然后对该语音数据进行指令识别,得到对应的交互指令。然后语音处理模块可以将交互指令发送给交互助手,以调用交互助手执行所述交互指令对应的交互操作。
本发明实施例中,用户可以单独使用耳机收纳装置进行交互,可以将耳机和耳机收纳装置配合使用进行交互,本发明实施例对此不作限制。其中,在交互过程中,可以是由耳机采集用户发出的用于交互的语音数据,然后将该语音数据发送给耳机收纳装置的语音处理模块。也可以是由耳机收纳装置中的语音采集模块采集用户发出的用于交互的语音数据,然后将该语音数据发送给耳机收纳装置的语音处理模块;本发明实施例对此不作限制。
其中,交互指令可以包括多种,对应交互助手执行的交互操作也可以包括多种:
例如:交互指令为歌曲推荐指令,则交互助手可以根据用户关联信息为用户推荐歌曲,并通过耳机收纳装置的播放模块或耳机播放推荐的歌曲。
例如:交互指令为备忘信息记录指令,则交互助手可以将该备忘信息记录指令对应的备忘信息进行记录。
例如:交互指令为导航指令,则交互助手可以根据用户当前位置和导航指令对应的目的地生成导航路线;并依据导航路线,通过耳机收纳装置的播放模块或耳机播放对应的导航语音。
综上,本发明实施例中,耳机收纳装置中设置有交互助手,所述语音处理模块获取语音数据后,可以对所述语音数据进行指令识别,得到对应的交互指令;然后将所述交互指令发送至所述交互助手,以调用所述交互助手执行所述交互指令对应的交互操作;进而在耳机收纳装置进行语音交互。
本发明实施例的一个应用场景可以是:智能问答。
参照图19、示出了本发明的一种智能问答方法实施例的步骤流程。
步骤1902、所述语音处理模块获取语音数据。
步骤1904、所述语音处理模块对所述语音数据进行识别,获取所述所述语音数据中的问题语句并确定所述问题语句对应的答复语句。
步骤1906、所述语音处理模块将答复语句发送至所述播放模块,所述播放模块播放所述答复语句。
步骤1908、所述语音处理模块将答复语句发送至所述耳机,由所述耳机播放所述答复语句。
本发明实施例中,用户可以单独使用耳机收纳装置进行智能问答,可以将耳机和耳机收纳装置配合使用进行智能问答,本发明实施例对此不作限制。
一个示例中,当用户单独使用耳机收纳装置进行智能问答时,在用户发出问题的语音数据过程中,耳机收纳装置的语音采集模块可以采集到用户问题的语音数据;并将该语音数据发送给语音处理模块。然后语音处理模块可以对该语音数据进行识别,获取所述所述语音数据中的问题语句;再将问题语句输入预先训练好的问答模型中,由问答模型输出对应的答复语句。语音处理模块确定答复语句后,可以将该答复语句发送耳机收纳装置的播放模块进行播放。
一个示例中,当用户将耳机和耳机收纳装置配合使用进行智能问答时,在用户发出问题的语音数据过程中,耳可以采集到用户问题的语音数据;并将该语音数据发送给耳机收纳装置的语音处理模块。然后语音处理模块可以对该语音数据进行识别,获取所述所述语音数据中的问题语句;再将问题语句输入预先训练好的问答模型中,由问答模型输出对应的答复语句。语音处理模块确定答复语句后,可以将该答复语句发送耳机收进行播放。
综上,本发明实施例中,耳机收纳装置的语音处理模块获取语音数据后,可以对所述语音数据进行识别,并获取所述所述语音数据中的问题语句并确定所述问题语句对应的答复语句;然后再将答复语句发送至所述播放模块,所述播放模块播放所述答复语句;或,块将答复语句发送至所述耳机,由所述耳机播放所述答复语句;进而在耳机设备中实现智能问答。
本发明实施例的一个应用场景可以是:降噪/回音消除。
参照图20,示出了本发明的一种降噪/回音消除方法实施例的步骤流程。
步骤2002、所述语音处理模块获取语音数据。
步骤2004、所述语音处理模块对所述语音数据进行降噪处理/回音消除处理。
一个示例中,在跨语言的面对面采访的场景下,若采访的环境比较嘈杂,则在获取参与对话的用户的语音数据后,需要对语音数据进行降噪处理;然后在基于降噪处理后的语音数据进行翻译,以提高翻译的准确率。
一个示例中,在通信过程中,若参与通信的任一参与方所处的环境比较嘈杂如菜市场、操场等,在获取到该参与方的语音数据后,可以先对该参与方的语音数据进行降噪处理,再播放降噪处理后的语音数据;以提高语音清晰度,提高其他参与方的听感。
一个示例中,在通信过程中,若某个参与方开启免提后,可能会造成声学回声;因此可以在获取到该参与方的语音数据后,可以先对该参与方的语音数据进行回声消除处理,再播放回声消除处理后的语音数据;以提高语音清晰度,提高其他参与方的听感。
综上,本发明实施例中,所述语音处理模块获取语音数据后,所述语音处理模块对所述语音数据进行降噪处理/回音消除处理;进而能够提高语音清晰度,提高用户体验。
本发明实施例的一个应用场景可以是:语音识别。
参照图21,示出了本发明的一种语音识别方法实施例的步骤流程。
步骤2102、所述语音处理模块获取语音数据。
步骤2104、所述语音处理模块对所述语音数据进行语音识别,得到语音识别文本。
本发明实施例中,耳机收纳装置的语音处理模块,可以对获取的语音数据进行语音识别,得到对应的语音识别结果。其中,可以先对语音数据进行语音增强;然后将语音增强后的语音数据输入至预先训练好的语音识别模型中,由语音识别模型输出对应的语音识别文本。
其中,可以直接使用该语音识别文本如显示,也可以基于该语音识别文本进行其他操作,如翻译、语音交互、智能问答、导航、对话分析等等,本发明实施例对此不作限制。
在上述实施例的基础上,本发明实施例的一个应用场景可以是:存储/显示语音识别文本。
参照图22、示出了本发明的一种存储/显示方法实施例的步骤流程。
步骤2202、所述语音处理模块获取语音数据。
步骤2204、所述语音处理模块对所述语音数据进行语音识别,得到语音识别文本。
步骤2206、所述语音处理模块将所述语音识别文本,发送至所述耳机收纳装置的显示模块中显示。
步骤2208、所述语音处理模块将所述语音识别文本,发送至所述耳机收纳装置的存储模块中存储。
步骤2210、所述语音处理模块将所述语音识别文本发送至所述耳机,由所述耳机将所述语音识别文本发送至所述终端设备存储和/或显示。
本发明实施例中,在得到语音识别文本后,可以对该语音识别文本进行显示/或存储。
一个示例中,可以在耳机收纳装置中显示语音识别文本。对应的,语音处理模块可以将所述语音识别文本,发送至所述耳机收纳装置的显示模块中显示。
一个示例中,可以在耳机连接的终端设备中显示语音识别文本。对应的,所述语音处理模块将所述语音识别文本发送至所述耳机,由所述耳机将所述语音识别文本发送至所述终端设备;由终端设备对该语音识别文本进行显示。
一个示例中,可以在耳机收纳装置中存储语音识别文本。所述耳机收纳装置还可以设置有存储模块,对应的,语音处理模块可以将所述语音识别文本,发送至所述耳机收纳装置的存储模块中显示。
一个示例中,可以在耳机连接的终端设备中存储语音识别文本。对应的,所述语音处理模块将所述语音识别文本发送至所述耳机,由所述耳机将所述语音识别文本发送至所述终端设备;由终端设备对该语音识别文本进行存储。
本发明一个可选实施例中,还可以基于所述语音识别文本生成备忘信息。其中,可以在耳机收纳装置中存储/显示该备忘信息,对应的所述语音处理模块将所述备忘信息,发送至所述耳机收纳装置的显示模块中显示;和/或,所述语音处理模块将所述备忘信息,发送至所述耳机收纳装置的存储模块中存储。也可以在与耳机连接的终端设备中存储/显示所述备忘信息;对应的,所述语音处理模块可以将所述备忘信息发送至所述耳机,由所述耳机将所述语音识别文本发送至所述终端设备存储和/或显示。
本发明实施例的一个应用场景可以是:标记语音片段。
参照图23、示出了本发明的一种语音片段标记方法实施例的步骤流程。
步骤2302、所述语音处理模块获取语音数据。
步骤2304、所述语音处理模块从所述语音数据中识别目标语音片段并标记。
其中,可以按照需求确定目标语音片段。例如,可以是语音数据中具有重要内容的语音片段;又如,可以是语音数据中目标说话人的语音片段;又例如,可以是语音数据中具有声音事件(如掌声、欢呼声等)的声音片段,等等,本年发明实施例对此不作限制。
耳机收纳装置还可以设置有显示模块,本发明实施例的一个应用场景可以是:基于显示模块的语音交互。
参照图24、示出了本发明的一种语音交互方法可选实施例的步骤流程。
步骤2402、所述语音处理模块获取语音数据,所述语音数据是用户针对所述显示模块中显示信息进行操作的语音数据。
步骤2404、所述语音处理模块对所述语音数据进行指令识别,得到对应的操作指令。
步骤2406、所述语音处理模块将所述操作指令发送至所述显示模块,由所述显示模块获取所述操作指令对应的待显示信息,显示所述待显示信息。
本发明实施例中,所述显示模块可以包括显示屏,所述显示屏中可以显示多种信息,如显示耳机收纳装置中各种功能的功能入口,各种应用程序的入口等等;还可以显示语音识别文本、翻译文本等等,本发明实施例对此不作限制。
进而用户可以基于显示模块中的显示信息与耳机收纳装置进行交互。其中,一种方式可以是语音交互。用户发出针对所述显示模块中显示信息进行操作的语音数据后,可以由耳机采集用户的语音数据并发送给耳机收纳装置的语音处理模块;也可以由耳机收纳装置的语音采集模块采集用户的语音数据,并发送给耳机收纳装置的语音处理模块。
语音处理模块获取到语音数据后,可以将该语音数据输入至预先训练好的指令识别模型中,由该指令识别模型对该语音数据进行指令识别,得到对应的操作指令;并将所述操作指令发送至所述显示模块。所述显示模块接收到操作指令后,可以确定所述操作指令对应的待显示信息;然后显示所述待显示信息。
例如,当显示模块显示的是部分语音识别文本和针对语音识别文本的展示功能入口;确定操作指令为展开指令时,可以将整个语音识别文本确定为待显示信息,然后显示整个语音识别文本。
又例如,当显示模块显示的应用程序的功能入口时,若确定操作指令为应用程序A的启动指令,则可以将该应用程序A的界面确定为待显示信息,然后显示该应用程序A的界面。
又例如,当显示模块显示的是应用程序A的界面和翻页功能入口时,若确定操作指令为下一页指令,则可以将该应用程序A当前界面的下一页确定为待显示信息,然后显示应用程序A当前界面的下一页。
当然,用户也可以通过触控显示屏,来针对显示模块中显示信息进行操作。此外,用户还可以通过手部运动带动耳机收纳装置运动,来显示模块中显示信息进行操作,本发明实施例对此均不作限制。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图25,示出了本发明的一种耳机收纳装置实施例的结构框图,具体可以包括如下模块:语音处理模块2502,
所述语音处理模块2502,用于获取目标数据,所述目标数据由所述耳机收纳装置采集和/或由所述耳机发送;对所述目标数据进行处理。
本发明一个可选的实施例中,所述耳机还与第一用户使用的第一终端设备连接;
所述语音处理模块2502,用于在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,接收所述耳机发送的语音数据,所述语音数据是由所述耳机采集的第一用户的语音数据;对所述语音数据进行翻译,得到第一翻译语音数据;
所述语音处理模块2502,还用于将所述第一翻译语音数据发送至所述耳机,以由所述耳机将所述第一翻译语音数据发送至第一终端设备后,所述第一终端设备将所述第一翻译语音数据发送至第二终端设备。
本发明一个可选的实施例中,所述耳机还与第一用户使用的第一终端设备连接,
所述语音处理模块2502,用于在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,接收所述耳机发送的语音数据,所述语音数据是第二用户的语音数据,由第二终端设备发送至第一终端设备并由第一终端设备发送至所述耳机;对所述语音数据进行翻译,得到第二翻译语音数据;
所述语音处理模块2502,还用于将所述第二翻译数据发送至所述耳机,由所述耳机播放所述第二翻译语音数据。
本发明一个可选的实施例中,
所述语音处理模块2502,用于对所述目标数据进行同声传译,得到同声传译结果;
所述耳机收纳装置还包括播放模块,所述语音处理模块2502,还用于将同声传译结果发送至所述播放模块,所述播放模块播放所述同声传译结果;或,将同声传译结果发送至所述耳机,以由所述耳机播放所述同声传译结果;或,将同声传译结果发送至所述耳机,以由所述耳机将所述同声传译结果发送至与所述耳机连接的终端设备后,所述终端设备将同声传译结果发送至与所述终端设备通话的其他终端设备。
本发明一个可选的实施例中,应用于翻译场景中,所述耳机由第一用户使用,所述耳机收纳装置由至少一个第二用户使用;
所述语音处理模块2502,用于接收所述耳机发送的语音数据,所述语音数据是所述耳机采集的第一用户的语音数据;对所述语音数据进行翻译,得到第三翻译语音数据;
所述耳机收纳装置还包括播放模块,所述语音处理模块2502,还用于将所述第三翻译语音数据发送至所述播放模块,由所述播放模块播放所述第三翻译语音数据。
本发明一个可选的实施例中,所述耳机收纳装置还包括语音采集模块,
所述语音处理模块2502,还用于获取所述语音采集模块采集的语音数据,所述语音数据是第二用户的语音数据;
所述语音处理模块2502,用于对所述语音数据进行翻译,得到第四翻译语音数据;
所述语音处理模块2502,还用于将第四翻译语音数据发送至所述耳机,由所述耳机播放所述第四翻译语音数据。
本发明一个可选的实施例中,所述耳机包括:第一耳机和至少一个第二耳机,所述第二耳机和第一耳机,分别与所述耳机收纳装置连接;所述第一耳机由第一用户使用,所述第二耳机由第二用户使用;
所述语音处理模块2502,用于接收所述第一耳机发送的语音数据,所述语音数据是所述第一耳机采集的第一用户的语音数据;对所述语音数据进行翻译,得到第五翻译语音数据;
所述语音处理模块2502,还用于将第五翻译语音数据发送至所述至少一个第二耳机,由所述至少一个第二耳机播放所述第五翻译数据。
本发明一个可选的实施例中,所述耳机还与终端设备连接,
所述语音处理模块2502,用于接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果并基于所述识别结果生成播报信息;
所述语音处理模块2502,还用于将所述播报信息返回至所述耳机,由耳机基于所述播报信息进行语音播报。
本发明一个可选的实施例中,所述耳机还与终端设备连接,
所述语音处理模块2502,用于接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果;
所述语音处理模块2502,还用于若所述识别结果是预设识别结果,则生成来电拦截指令并将所述来电拦截指令发送至所述耳机,由所述耳机将所述来电拦截指令发送至所述终端设备,以对所述来电进行拦截。
本发明一个可选的实施例中,所述耳机还与终端设备连接,
所述语音处理模块2502,用于接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果;基于所述识别结果对所述终端设备接收到的来电进行代接。
本发明一个可选的实施例中,
所述语音处理模块2502,用于对所述目标数据进行美化处理,得到美化语音数据;
所述耳机收纳装置还包括播放模块,所述语音处理模块2502,还用于将所述美化语音数据发送至所述播放模块,所述播放模块播放所述美化语音数据;或,对将所述美化语音数据返回给所述耳机,由所述耳机将所述美化语音数据发送至与所述耳机连接的终端设备。
本发明一个可选的实施例中,所述美化处理包括以下至少一种:
滤除所述目标数据中的用户噪音,所述用户噪音表征用户产生的噪音,所述用户噪音包括:哈气音、颤音和口音中的至少一种;
音效处理;所述音效处理包括如下处理中的至少一种:环绕处理、信道均衡处理、以及混响处理。
本发明一个可选的实施例中,
所述语音处理模块2502,用于对所述语音数据进行变声处理,得到变声语音数据;
所述耳机收纳装置还包括播放模块,所述语音处理模块2502,还用于将所述变声语音数据发送至所述播放模块,所述播放模块播放所述变声语音数据;或,对将所述变声语音数据返回给所述耳机,由所述耳机将所述变声语音数据发送至与所述耳机连接的终端设备。
本发明一个可选的实施例中,
所述语音处理模块2502,用于获取对话的语音数据;所述对话的参与方包括:至少两个用户;确定所述语音数据对应的提示信息;所述提示信息为依据所述语音数据对应的语义信息、和/或、情绪信息得到;
所述语音处理模块2502,还用于在对话过程中、和/或、在对话结束后,输出所述提示信息。
本发明一个可选的实施例中,所述耳机还与终端设备连接,
所述语音处理模块2502,用于在所述终端设备通话过程中,对从所述耳机接收通话语音数据;对所述通话语音数据进行存储。
本发明一个可选的实施例中,
所述语音处理模块2502,用于获取环境音数据;根据所述环境音数据,识别环境中的潜在风险事件;
所述语音处理模块2502,还用于向所述耳机发送所述潜在风险事件,由所述耳机根据所述潜在风险事件进行声音提醒。
本发明一个可选的实施例中,
所述语音处理模块2502,用于获取通话语音数据;对所述通话语音数据进行语音增强;
所述语音处理模块2502,还用于将经过语音增强的通话语音数据发送至所述耳机,由所述耳机播放经过语音增强的通话语音数据;或,将经过语音增强的通话语音数据发送至所述耳机,由所述耳机将经过语音增强的通话语音数据发送至与耳机连接的终端设备。
本发明一个可选的实施例中,
所述语音处理模块2502,用于获取导航查询语音数据;
所述语音处理模块2502,还用于获取用户地理位置信息和用户方位信息;
所述语音处理模块2502,用于根据所述用户方位信息和所述用户地理位置信息,生成所述导航查询语音数据对应的导航结果语音数据;
所述耳机收纳装置还包括播放模块,所述语音处理模块2502,还用于将所述导航结果语音数据发送至所述播放模块,所述播放模块播放所述导航结果语音数据;或,将所述导航结果语音数据发送至所述耳机,由所述耳机播放所述导航结果语音数据。
本发明一个可选的实施例中,所述耳机收纳装置设置有交互助手,
所述语音处理模块2502,用于获取语音数据;对所述语音数据进行指令识别,得到对应的交互指令;
所述语音处理模块2502,还用于将所述交互指令发送至所述交互助手,以调用所述交互助手执行所述交互指令对应的交互操作。
本发明一个可选的实施例中,
所述语音处理模块2502,用于获取语音数据;对所述语音数据进行识别,获取所述所述语音数据中的问题语句并确定所述问题语句对应的答复语句;
所述耳机收纳装置还包括播放模块,所述语音处理模块2502,还用于将答复语句发送至所述播放模块,所述播放模块播放所述答复语句;或,对将答复语句发送至所述耳机,由所述耳机播放所述答复语句。
本发明一个可选的实施例中,
所述语音处理模块2502,用于获取语音数据;对所述语音数据进行降噪处理/回音消除处理。
本发明一个可选的实施例中,
所述语音处理模块2502,用于获取语音数据;对所述语音数据进行语音识别,得到语音识别文本。
本发明一个可选的实施例中,所述耳机还与终端设备连接,所述耳机收纳装置还包括显示模块和存储模块;
所述语音处理模块2502,还用于将所述语音识别文本,发送至所述耳机收纳装置的显示模块中显示;和/或,对将所述语音识别文本,发送至所述耳机收纳装置的存储模块中存储;和/或,对将所述语音识别文本发送至所述耳机,由所述耳机将所述语音识别文本发送至所述终端设备存储和/或显示。
本发明一个可选的实施例中,
所述语音处理模块2502,还用于依据所述语音识别文本生成备忘信息。
本发明一个可选的实施例中,
所述语音处理模块2502,用于获取语音数据;从所述语音数据中识别目标语音片段并标记。
本发明一个可选的实施例中,所述耳机收纳装置还包括显示模块,
所述语音处理模块2502,用于获取语音数据,所述语音数据是用户针对所述显示模块中显示信息进行操作的语音数据;对所述语音数据进行指令识别,得到对应的操作指令;
所述语音处理模块2502,还用于将所述操作指令发送至所述显示模块,由所述显示模块获取所述操作指令对应的待显示信息,显示所述待显示信息。
综上,本发明实施例中,可以在耳机收纳装置增加语音处理模块,进而的语音处理模块可以获取所述耳机收纳装置采集和/或由所述耳机发送的目标数据,然后对所述目标数据进行处理;从而增加对耳机收纳装置的资源利用,以及增加耳机/耳机收纳装置的用途。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图26是根据一示例性实施例示出的一种用于数据处理的耳机收纳装置2600的结构框图。
参照图26,耳机收纳装置2600可以包括以下一个或多个组件:处理组件2602,存储器2604,电力组件2606,多媒体组件2608,音频组件2610,输入/输出(I/O)的接口2612,传感器组件2614,以及通信组件2616。
处理组件2602通常控制耳机收纳装置2600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件2602可以包括一个或多个处理器2620来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件2602可以包括一个或多个模块,便于处理组件2602和其他组件之间的交互。例如,处理部件2602可以包括多媒体模块,以方便多媒体组件2608和处理组件2602之间的交互。
存储器2604被配置为存储各种类型的数据以支持在耳机收纳装置2600的操作。这些数据的示例包括用于在耳机收纳装置2600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器2604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件2606为耳机收纳装置2600的各种组件提供电力。电力组件2606可以包括电源管理系统,一个或多个电源,及其他与为耳机收纳装置2600生成、管理和分配电力相关联的组件。
多媒体组件2608包括在所述耳机收纳装置2600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件2608包括一个前置摄像头和/或后置摄像头。当耳机收纳装置2600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件2610被配置为输出和/或输入音频信号。例如,音频组件2610包括一个麦克风(MIC),当耳机收纳装置2600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器2604或经由通信组件2616发送。在一些实施例中,音频组件2610还包括一个扬声器,用于输出音频信号。
I/O接口2612为处理组件2602和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件2614包括一个或多个传感器,用于为耳机收纳装置2600提供各个方面的状态评估。例如,传感器组件2614可以检测到耳机收纳装置2600的打开/关闭状态,组件的相对定位,例如所述组件为耳机收纳装置2600的显示器和小键盘,传感器组件2614还可以检测耳机收纳装置2600或耳机收纳装置2600一个组件的位置改变,用户与耳机收纳装置2600接触的存在或不存在,耳机收纳装置2600方位或加速/减速和耳机收纳装置2600的温度变化。传感器组件2614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件2614还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件2614还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件2616被配置为便于耳机收纳装置2600和其他设备之间有线或无线方式的通信。耳机收纳装置2600可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件2614经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件2614还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,耳机收纳装置2600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器2604,上述指令可由耳机收纳装置2600的处理器2620执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由耳机收纳装置的处理器执行时,使得耳机收纳装置能够执行一种数据处理方法,所述方法包括:所述语音处理模块获取目标数据,所述目标数据由所述耳机收纳装置采集和/或由所述耳机发送;所述语音处理模块对所述目标数据进行处理。
可选地,所述耳机还与第一用户使用的第一终端设备连接;所述语音处理模块获取目标数据,包括:在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是由所述耳机采集的第一用户的语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行翻译,得到第一翻译语音数据;所述的方法还包括:所述语音处理模块将所述第一翻译语音数据发送至所述耳机,以由所述耳机将所述第一翻译语音数据发送至第一终端设备后,所述第一终端设备将所述第一翻译语音数据发送至第二终端设备。
可选地,所述耳机还与第一用户使用的第一终端设备连接,所述语音处理模块获取目标数据,包括:在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是第二用户的语音数据,由第二终端设备发送至第一终端设备并由第一终端设备发送至所述耳机;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行翻译,得到第二翻译语音数据;所述的方法还包括:所述语音处理模块将所述第二翻译数据发送至所述耳机,由所述耳机播放所述第二翻译语音数据。
可选地,所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述目标数据进行同声传译,得到同声传译结果;所述耳机收纳装置还包括播放模块,所述的方法还包括:所述语音处理模块将同声传译结果发送至所述播放模块,所述播放模块播放所述同声传译结果;或,所述语音处理模块将同声传译结果发送至所述耳机,以由所述耳机播放所述同声传译结果;或,所述语音处理模块将同声传译结果发送至所述耳机,以由所述耳机将所述同声传译结果发送至与所述耳机连接的终端设备后,所述终端设备将同声传译结果发送至与所述终端设备通话的其他终端设备。
可选地,应用于翻译场景中,所述耳机由第一用户使用,所述耳机收纳装置由至少一个第二用户使用;所述语音处理模块获取目标数据,包括:所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是所述耳机采集的第一用户的语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行翻译,得到第三翻译语音数据;所述耳机收纳装置还包括播放模块,所述的方法还包括:所述语音处理模块将所述第三翻译语音数据发送至所述播放模块,由所述播放模块播放所述第三翻译语音数据。
可选地,所述耳机收纳装置还包括语音采集模块,所述语音处理模块获取目标数据,还包括:所述语音处理模块获取所述语音采集模块采集的语音数据,所述语音数据是第二用户的语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行翻译,得到第四翻译语音数据;所述的方法还包括:所述语音处理模块将第四翻译语音数据发送至所述耳机,由所述耳机播放所述第四翻译语音数据。
可选地,所述耳机包括:第一耳机和至少一个第二耳机,所述第二耳机和第一耳机,分别与所述耳机收纳装置连接;所述第一耳机由第一用户使用,所述第二耳机由第二用户使用;所述语音处理模块获取目标数据,包括:所述语音处理模块接收所述第一耳机发送的语音数据,所述语音数据是所述第一耳机采集的第一用户的语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行翻译,得到第五翻译语音数据;所述的方法还包括:所述语音处理模块将第五翻译语音数据发送至所述至少一个第二耳机,由所述至少一个第二耳机播放所述第五翻译数据。
可选地,所述耳机还与终端设备连接,所述语音处理模块获取目标数据,包括:所述语音处理模块接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果并基于所述识别结果生成播报信息;所述的方法还包括:所述语音处理模块将所述播报信息返回至所述耳机,由耳机基于所述播报信息进行语音播报。
可选地,所述耳机还与终端设备连接,所述语音处理模块获取目标数据,包括:所述语音处理模块接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果;所述的方法还包括:若所述识别结果是预设识别结果,则生成来电拦截指令并将所述来电拦截指令发送至所述耳机,由所述耳机将所述来电拦截指令发送至所述终端设备,以对所述来电进行拦截。
可选地,所述耳机还与终端设备连接,所述语音处理模块获取目标数据,包括:所述语音处理模块接收所述耳机发送的来电信息,所述来电信息是由所述终端设备接收到来电时生成并发送至所述耳机的;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述来电信息中的来电移动用户号码簿号码MDN进行识别,得到对应的识别结果;基于所述识别结果对所述终端设备接收到的来电进行代接。
可选地,所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述目标数据进行美化处理,得到美化语音数据;所述耳机收纳装置还包括播放模块,所述的方法还包括:所述语音处理模块将所述美化语音数据发送至所述播放模块,所述播放模块播放所述美化语音数据;或,所述语音处理模块将所述美化语音数据返回给所述耳机,由所述耳机将所述美化语音数据发送至与所述耳机连接的终端设备。
可选地,所述美化处理包括以下至少一种:滤除所述目标数据中的用户噪音,所述用户噪音表征用户产生的噪音,所述用户噪音包括:哈气音、颤音和口音中的至少一种;音效处理;所述音效处理包括如下处理中的至少一种:环绕处理、信道均衡处理、以及混响处理。
可选地,所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行变声处理,得到变声语音数据;所述耳机收纳装置还包括播放模块,所述的方法还包括:所述语音处理模块将所述变声语音数据发送至所述播放模块,所述播放模块播放所述变声语音数据;或,所述语音处理模块将所述变声语音数据返回给所述耳机,由所述耳机将所述变声语音数据发送至与所述耳机连接的终端设备。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取对话的语音数据;所述对话的参与方包括:至少两个用户;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块确定所述语音数据对应的提示信息;所述提示信息为依据所述语音数据对应的语义信息、和/或、情绪信息得到;所述的方法还包括:所述语音处理模块在对话过程中、和/或、在对话结束后,输出所述提示信息。
可选地,所述耳机还与终端设备连接,所述语音处理模块获取目标数据,包括:在所述终端设备通话过程中,所述语音处理模块从所述耳机接收通话语音数据;所述语音处理模块对所述目标数据进行处理,包括:对所述通话语音数据进行存储。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取环境音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块根据所述环境音数据,识别环境中的潜在风险事件;所述的方法还包括:所述语音处理模块向所述耳机发送所述潜在风险事件,由所述耳机根据所述潜在风险事件进行声音提醒。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取通话语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述通话语音数据进行语音增强;所述的方法还包括:所述语音处理模块将经过语音增强的通话语音数据发送至所述耳机,由所述耳机播放经过语音增强的通话语音数据;或,所述语音处理模块将经过语音增强的通话语音数据发送至所述耳机,由所述耳机将经过语音增强的通话语音数据发送至与耳机连接的终端设备。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取导航查询语音数据;所述的方法还包括:所述语音处理模块获取用户地理位置信息和用户方位信息;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块根据所述用户方位信息和所述用户地理位置信息,生成所述导航查询语音数据对应的导航结果语音数据;所述耳机收纳装置还包括播放模块,所述的方法还包括:所述语音处理模块将所述导航结果语音数据发送至所述播放模块,所述播放模块播放所述导航结果语音数据;或,所述语音处理模块将所述导航结果语音数据发送至所述耳机,由所述耳机播放所述导航结果语音数据。
可选地,所述耳机收纳装置设置有交互助手,所述语音处理模块获取目标数据,包括:所述语音处理模块获取语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行指令识别,得到对应的交互指令;所述的方法还包括:所述语音处理模块将所述交互指令发送至所述交互助手,以调用所述交互助手执行所述交互指令对应的交互操作。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行识别,获取所述所述语音数据中的问题语句并确定所述问题语句对应的答复语句;所述耳机收纳装置还包括播放模块,所述的方法还包括:所述语音处理模块将答复语句发送至所述播放模块,所述播放模块播放所述答复语句;或,所述语音处理模块将答复语句发送至所述耳机,由所述耳机播放所述答复语句。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行降噪处理/回音消除处理。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行语音识别,得到语音识别文本。
可选地,所述耳机还与终端设备连接,所述耳机收纳装置还包括显示模块和存储模块;所述的方法还包括:所述语音处理模块将所述语音识别文本,发送至所述耳机收纳装置的显示模块中显示;和/或,所述语音处理模块将所述语音识别文本,发送至所述耳机收纳装置的存储模块中存储;和/或,所述语音处理模块将所述语音识别文本发送至所述耳机,由所述耳机将所述语音识别文本发送至所述终端设备存储和/或显示。
可选地,所述的方法还包括:依据所述语音识别文本生成备忘信息。
可选地,所述语音处理模块获取目标数据,包括:所述语音处理模块获取语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块从所述语音数据中识别目标语音片段并标记。
可选地,所述耳机收纳装置还包括显示模块,所述语音处理模块获取目标数据,包括:所述语音处理模块获取语音数据,所述语音数据是用户针对所述显示模块中显示信息进行操作的语音数据;所述语音处理模块对所述目标数据进行处理,包括:所述语音处理模块对所述语音数据进行指令识别,得到对应的操作指令;所述的方法还包括:所述语音处理模块将所述操作指令发送至所述显示模块,由所述显示模块获取所述操作指令对应的待显示信息,显示所述待显示信息。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种数据处理方法和一种耳机收纳装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种数据处理方法,其特征在于,应用于耳机收纳装置中,所述耳机收纳装置与耳机无线连接,所述耳机收纳装置包括语音处理模块,所述的方法包括:
所述语音处理模块获取目标数据,所述目标数据由所述耳机收纳装置采集和/或由所述耳机发送;
所述语音处理模块对所述目标数据进行处理。
2.根据权利要求1所述的方法,其特征在于,所述耳机还与第一用户使用的第一终端设备连接;
所述语音处理模块获取目标数据,包括:
在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是由所述耳机采集的第一用户的语音数据;
所述语音处理模块对所述目标数据进行处理,包括:
所述语音处理模块对所述语音数据进行翻译,得到第一翻译语音数据;
所述的方法还包括:
所述语音处理模块将所述第一翻译语音数据发送至所述耳机,以由所述耳机将所述第一翻译语音数据发送至第一终端设备后,所述第一终端设备将所述第一翻译语音数据发送至第二终端设备。
3.根据权利要求1所述的方法,其特征在于,所述耳机还与第一用户使用的第一终端设备连接,
所述语音处理模块获取目标数据,包括:
在第一用户通过所述第一终端设备与第二用户的第二终端设备通话过程中,所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是第二用户的语音数据,由第二终端设备发送至第一终端设备并由第一终端设备发送至所述耳机;
所述语音处理模块对所述目标数据进行处理,包括:
所述语音处理模块对所述语音数据进行翻译,得到第二翻译语音数据;
所述的方法还包括:
所述语音处理模块将所述第二翻译数据发送至所述耳机,由所述耳机播放所述第二翻译语音数据。
4.根据权利要求1所述的方法,其特征在于,
所述语音处理模块对所述目标数据进行处理,包括:
所述语音处理模块对所述目标数据进行同声传译,得到同声传译结果;
所述耳机收纳装置还包括播放模块,所述的方法还包括:
所述语音处理模块将同声传译结果发送至所述播放模块,所述播放模块播放所述同声传译结果;或,
所述语音处理模块将同声传译结果发送至所述耳机,以由所述耳机播放所述同声传译结果;或,
所述语音处理模块将同声传译结果发送至所述耳机,以由所述耳机将所述同声传译结果发送至与所述耳机连接的终端设备后,所述终端设备将同声传译结果发送至与所述终端设备通话的其他终端设备。
5.根据权利要求1所述的方法,其特征在于,应用于翻译场景中,所述耳机由第一用户使用,所述耳机收纳装置由至少一个第二用户使用;
所述语音处理模块获取目标数据,包括:
所述语音处理模块接收所述耳机发送的语音数据,所述语音数据是所述耳机采集的第一用户的语音数据;
所述语音处理模块对所述目标数据进行处理,包括:
所述语音处理模块对所述语音数据进行翻译,得到第三翻译语音数据;
所述耳机收纳装置还包括播放模块,所述的方法还包括:
所述语音处理模块将所述第三翻译语音数据发送至所述播放模块,由所述播放模块播放所述第三翻译语音数据。
6.根据权利要求5所述的方法,其特征在于,所述耳机收纳装置还包括语音采集模块,
所述语音处理模块获取目标数据,还包括:
所述语音处理模块获取所述语音采集模块采集的语音数据,所述语音数据是第二用户的语音数据;
所述语音处理模块对所述目标数据进行处理,包括:
所述语音处理模块对所述语音数据进行翻译,得到第四翻译语音数据;
所述的方法还包括:
所述语音处理模块将第四翻译语音数据发送至所述耳机,由所述耳机播放所述第四翻译语音数据。
7.根据权利要求1所述的方法,其特征在于,所述耳机包括:第一耳机和至少一个第二耳机,所述第二耳机和第一耳机,分别与所述耳机收纳装置连接;所述第一耳机由第一用户使用,所述第二耳机由第二用户使用;
所述语音处理模块获取目标数据,包括:
所述语音处理模块接收所述第一耳机发送的语音数据,所述语音数据是所述第一耳机采集的第一用户的语音数据;
所述语音处理模块对所述目标数据进行处理,包括:
所述语音处理模块对所述语音数据进行翻译,得到第五翻译语音数据;
所述的方法还包括:
所述语音处理模块将第五翻译语音数据发送至所述至少一个第二耳机,由所述至少一个第二耳机播放所述第五翻译数据。
8.一种耳机收纳装置,其特征在于,所述耳机收纳装置与耳机无线连接,所述耳机收纳装置包括:语音处理模块,
所述语音处理模块,用于获取目标数据,所述目标数据由所述耳机收纳装置采集和/或由所述耳机发送;对所述目标数据进行处理。
9.一种耳机收纳装置,其特征在于,所述耳机收纳装置与耳机无线连接,所述耳机收纳装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取目标数据,所述目标数据由所述耳机收纳装置采集和/或由所述耳机发送;
对所述目标数据进行处理。
10.一种可读存储介质,其特征在于,当所述存储介质中的指令由耳机收纳装置的处理器执行时,使得耳机收纳装置能够执行如方法权利要求1-7任一所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011255959.1A CN112331179A (zh) | 2020-11-11 | 2020-11-11 | 一种数据处理方法和耳机收纳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011255959.1A CN112331179A (zh) | 2020-11-11 | 2020-11-11 | 一种数据处理方法和耳机收纳装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112331179A true CN112331179A (zh) | 2021-02-05 |
Family
ID=74317311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011255959.1A Pending CN112331179A (zh) | 2020-11-11 | 2020-11-11 | 一种数据处理方法和耳机收纳装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112331179A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111696536A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 语音处理方法、装置和介质 |
CN111698373A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 一种语音播报方法、装置、耳机和耳机收纳装置 |
CN111696538A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 语音处理方法、装置和介质 |
CN111696537A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 语音处理方法、装置和介质 |
CN111696552A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 一种翻译方法、装置和耳机 |
CN111696554A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 一种翻译方法、装置、耳机和耳机收纳装置 |
CN111696566A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 语音处理方法、装置和介质 |
CN111739538A (zh) * | 2020-06-05 | 2020-10-02 | 北京搜狗科技发展有限公司 | 一种翻译方法、装置、耳机和服务器 |
CN111739530A (zh) * | 2020-06-05 | 2020-10-02 | 北京搜狗科技发展有限公司 | 一种交互方法、装置、耳机和耳机收纳装置 |
CN111739529A (zh) * | 2020-06-05 | 2020-10-02 | 北京搜狗科技发展有限公司 | 一种交互方法、装置、耳机和服务器 |
CN111739528A (zh) * | 2020-06-05 | 2020-10-02 | 北京搜狗科技发展有限公司 | 一种交互方法、装置和耳机 |
CN111741394A (zh) * | 2020-06-05 | 2020-10-02 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置及可读介质 |
-
2020
- 2020-11-11 CN CN202011255959.1A patent/CN112331179A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111696536A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 语音处理方法、装置和介质 |
CN111698373A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 一种语音播报方法、装置、耳机和耳机收纳装置 |
CN111696538A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 语音处理方法、装置和介质 |
CN111696537A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 语音处理方法、装置和介质 |
CN111696552A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 一种翻译方法、装置和耳机 |
CN111696554A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 一种翻译方法、装置、耳机和耳机收纳装置 |
CN111696566A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 语音处理方法、装置和介质 |
CN111739538A (zh) * | 2020-06-05 | 2020-10-02 | 北京搜狗科技发展有限公司 | 一种翻译方法、装置、耳机和服务器 |
CN111739530A (zh) * | 2020-06-05 | 2020-10-02 | 北京搜狗科技发展有限公司 | 一种交互方法、装置、耳机和耳机收纳装置 |
CN111739529A (zh) * | 2020-06-05 | 2020-10-02 | 北京搜狗科技发展有限公司 | 一种交互方法、装置、耳机和服务器 |
CN111739528A (zh) * | 2020-06-05 | 2020-10-02 | 北京搜狗科技发展有限公司 | 一种交互方法、装置和耳机 |
CN111741394A (zh) * | 2020-06-05 | 2020-10-02 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置及可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12069470B2 (en) | System and method for assisting selective hearing | |
CN109360549B (zh) | 一种数据处理方法、穿戴设备和用于数据处理的装置 | |
CN113409764B (zh) | 一种语音合成方法、装置和用于语音合成的装置 | |
CN110149805A (zh) | 双向语音翻译系统、双向语音翻译方法和程序 | |
US9277178B2 (en) | Information processing system and storage medium | |
CN110503968B (zh) | 一种音频处理方法、装置、设备及可读存储介质 | |
KR20120011280A (ko) | 음향 객체 정보 융합 장치 및 방법 | |
US20230164509A1 (en) | System and method for headphone equalization and room adjustment for binaural playback in augmented reality | |
US20180054688A1 (en) | Personal Audio Lifestyle Analytics and Behavior Modification Feedback | |
WO2021244056A1 (zh) | 一种数据处理方法、装置和可读介质 | |
CN107945806B (zh) | 基于声音特征的用户识别方法及装置 | |
US11354520B2 (en) | Data processing method and apparatus providing translation based on acoustic model, and storage medium | |
CN111739530A (zh) | 一种交互方法、装置、耳机和耳机收纳装置 | |
CN110431549A (zh) | 信息处理装置、信息处理方法及程序 | |
CN111696538A (zh) | 语音处理方法、装置和介质 | |
CN110232909B (zh) | 一种音频处理方法、装置、设备及可读存储介质 | |
JPWO2018055898A1 (ja) | 情報処理装置、及び情報処理方法 | |
CN113113044B (zh) | 音频处理方法及装置、终端及存储介质 | |
CN111739529A (zh) | 一种交互方法、装置、耳机和服务器 | |
CN114898736A (zh) | 语音信号识别方法、装置、电子设备和存储介质 | |
US12073844B2 (en) | Audio-visual hearing aid | |
CN113299309A (zh) | 语音翻译方法及装置、计算机可读介质和电子设备 | |
CN111739528A (zh) | 一种交互方法、装置和耳机 | |
JP7284570B2 (ja) | 音声再生システムおよびプログラム | |
CN111696536A (zh) | 语音处理方法、装置和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |