CN104599675A - 语音处理方法、语音处理装置和终端 - Google Patents

语音处理方法、语音处理装置和终端 Download PDF

Info

Publication number
CN104599675A
CN104599675A CN201510066942.4A CN201510066942A CN104599675A CN 104599675 A CN104599675 A CN 104599675A CN 201510066942 A CN201510066942 A CN 201510066942A CN 104599675 A CN104599675 A CN 104599675A
Authority
CN
China
Prior art keywords
voice messaging
default
voice
collected
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510066942.4A
Other languages
English (en)
Inventor
尹宾
卢纯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Original Assignee
Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yulong Computer Telecommunication Scientific Shenzhen Co Ltd filed Critical Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Priority to CN201510066942.4A priority Critical patent/CN104599675A/zh
Priority to PCT/CN2015/078091 priority patent/WO2016127506A1/zh
Publication of CN104599675A publication Critical patent/CN104599675A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Abstract

本发明提供了一种语音处理方法、一种语音处理装置和一种终端,其中的语音处理方法包括:在预设噪音过滤模式下,收集语音信息;确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分;当确定所述语音信息中具有与所述预设语音信息相匹配的部分时,将所述预设语音信息与收集到的所述语音信息同步,并消除所述预设语音信息的频谱,以供对收集到的所述语音信息进行降噪处理。通过本发明的技术方案,可以消除且仅消除预设语音信息带来的背景噪音,避免因双麦克降噪带来的噪音外的正常语音也被消除的问题,提升了噪音消除的准确性和通话的质量,提升了用户体验。

Description

语音处理方法、语音处理装置和终端
技术领域
本发明涉及终端技术领域,具体而言,涉及一种语音处理方法、一种语音处理装置和一种终端。
背景技术
目前的终端普遍使用双麦克降噪方式来降低语音噪音,在通话或执行其他语音识别命令时,终端可以使用降噪麦克风将收录到的噪音滤掉,从而在嘈杂的环境中依旧能够保证语音质量的清晰。
然而,双麦克降噪方式只能过滤嘈杂的背景音,对于安静环境下的音乐等背景语音信息中的人声无法有效过滤,而当背景语音的音量较大时,通常会对通话或者语音识别造成干扰,比如,在汽车行驶中,开启车内的音响,此时用户如果接听电话,车内的音乐中的人声就会给通话造成极大的干扰。另外,双麦克降噪方式由于其本身的特性还会降低语音的音量,从而会影响通话或者语音识别的质量。
因此需要一种新的技术方案,可以在保证语音质量的同时降低语音中的噪音。
发明内容
本发明正是基于上述问题,提出了一种新的技术方案,可以在保证语音质量的同时降低语音中的噪音。
有鉴于此,本发明的一方面提出了一种语音处理方法,用于终端,包括:在预设噪音过滤模式下,收集语音信息;确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分;当确定所述语音信息中具有与所述预设语音信息相匹配的部分时,将所述预设语音信息与收集到的所述语音信息同步,并消除所述预设语音信息的频谱,以供对收集到的所述语音信息进行降噪处理。
在该技术方案中,可以在进行通话或进行语音识别时采集语音信息,并判断终端中或与终端相连的云端中是否具有与该语音信息相符的预设语音信息,若有,则在通话或进行语音识别的同时,消除预设语音信息的频谱,从而实现了消除背景噪音的功能。比如,用户在播放歌曲的汽车中进行通话时,手机可采集一段歌曲信息,并比对手机中是否存储有该歌曲,如果手机存储有该歌曲,则同步消除该歌曲的频谱,从而消除且仅消除歌曲带来的背景噪音,避免因双麦克降噪带来的噪音外的正常语音也被消除的问题,提升了噪音消除的准确性和通话的质量,提升了用户体验。另外,本技术方案所说的相匹配指的是完全相同,或相似度大于预定值。
在上述技术方案中,优选地,在所述收集语音信息之前,还包括:当检测到通话命令或语音识别命令时,在开启通话功能或语音识别功能的同时,进入所述预设噪音过滤模式。
在该技术方案中,只有在终端进行通话或语音识别时才开启预设噪音过滤模式,以降低终端的能耗,避免因预设噪音过滤模式长期开启而一直采集、匹配语音信息,进而避免终端的性能降低。
在上述技术方案中,优选地,所述确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分,具体包括:从预定位置获取所述预设语音信息,其中,所述预定位置包括与所述终端相连的云端和/或所述终端的存储装置,所述预设语音信息包括至少一个语音片段;以及确定获取到的所述预设语音信息中的所述至少一个语音片段中是否有任一语音片段与收集到的所述语音信息相匹配。
在该技术方案中,终端可以将收集的语音信息与自身存储的语音信息进行比对,也可以与连接的云端等服务器中的语音信息进行比对。终端收集的语音信息只是一个语音片段,终端可以判断预设语音信息中是否具有相同的片段,在确定预设语音信息中具有相同的片段时,将收集的语音与预设语音在相同的片段处同步,进而一边收集语音信息,一边在语音信息中消除预设语音信息的频谱,即实现了同步消除噪音的功能,并且不会影响用户进行正常的通话或语音识别。
在上述技术方案中,优选地,还包括:当确定收集到的所述语音信息中不具有与所述预设语音信息相匹配的部分时,重新收集所述语音信息,以供根据重新收集的所述语音信息确定是否对重新收集的所述语音信息进行所述降噪处理。
在该技术方案中,如果终端收集的语音信息在终端或云端中无法匹配到相同或相近的预设语音信息,则可以重新收集语音信息进行匹配,直至匹配成功,或者通话或语音识别结束,整个匹配过程耗时很短,最长一般不超过10s。
在上述技术方案中,优选地,还包括:当检测到通话结束命令或语音识别终止命令时,在关闭所述通话功能或所述语音识别功能的同时,退出所述预设噪音过滤模式。
在该技术方案中,在结束通话后,或在停止进行语音识别后,可以关闭预设噪音过滤模式,以节省能耗,避免终端的性能降低。
本发明的另一方面提出了一种语音处理装置,用于终端,包括:语音收集单元,在预设噪音过滤模式下,收集语音信息;确定单元,确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分;降噪处理单元,当确定所述语音信息中具有与所述预设语音信息相匹配的部分时,将所述预设语音信息与收集到的所述语音信息同步,并消除所述预设语音信息的频谱,以供对收集到的所述语音信息进行降噪处理。
在该技术方案中,可以在进行通话或进行语音识别时采集语音信息,并判断终端中或与终端相连的云端中是否具有与该语音信息相符的预设语音信息,若有,则在通话或进行语音识别的同时,消除预设语音信息的频谱,从而实现了消除背景噪音的功能。比如,用户在播放歌曲的汽车中进行通话时,手机可采集一段歌曲信息,并比对手机中是否存储有该歌曲,如果手机存储有该歌曲,则同步消除该歌曲的频谱,从而消除且仅消除歌曲带来的背景噪音,避免因双麦克降噪带来的噪音外的正常语音也被消除的问题,提升了噪音消除的准确性和通话的质量,提升了用户体验。另外,本技术方案所说的相匹配指的是完全相同,或相似度大于预定值。
在上述技术方案中,优选地,还包括:开启单元,在所述收集语音信息之前,当检测到通话命令或语音识别命令时,在开启通话功能或语音识别功能的同时,进入所述预设噪音过滤模式。
在该技术方案中,只有在终端进行通话或语音识别时才开启预设噪音过滤模式,以降低终端的能耗,避免因预设噪音过滤模式长期开启而一直采集、匹配语音信息,进而避免终端的性能降低。
在上述技术方案中,优选地,所述确定单元具体用于:从预定位置获取所述预设语音信息,其中,所述预定位置包括与所述终端相连的云端和/或所述终端的存储装置,所述预设语音信息包括至少一个语音片段,以及确定获取到的所述预设语音信息中的所述至少一个语音片段中是否有任一语音片段与收集到的所述语音信息相匹配。
在该技术方案中,终端可以将收集的语音信息与自身存储的语音信息进行比对,也可以与连接的云端等服务器中的语音信息进行比对。终端收集的语音信息只是一个语音片段,终端可以判断预设语音信息中是否具有相同的片段,在确定预设语音信息中具有相同的片段时,将收集的语音与预设语音在相同的片段处同步,进而一边收集语音信息,一边在语音信息中消除预设语音信息的频谱,即实现了同步消除噪音的功能,并且不会影响用户进行正常的通话或语音识别。
在上述技术方案中,优选地,所述语音收集单元还用于:当确定收集到的所述语音信息中不具有与所述预设语音信息相匹配的部分时,重新收集所述语音信息,以供根据重新收集的所述语音信息确定是否对重新收集的所述语音信息进行所述降噪处理。
在该技术方案中,如果终端收集的语音信息在终端或云端中无法匹配到相同或相近的预设语音信息,则可以重新收集语音信息进行匹配,直至匹配成功,或者通话或语音识别结束,整个匹配过程耗时很短,最长一般不超过10s。
在上述技术方案中,优选地,还包括:关闭单元,当检测到通话结束命令或语音识别终止命令时,在关闭所述通话功能或所述语音识别功能的同时,退出所述预设噪音过滤模式。
在该技术方案中,在结束通话后,或在停止进行语音识别后,可以关闭预设噪音过滤模式,以节省能耗,避免终端的性能降低。
本发明的第三方面的实施例提出了一种终端,包括如上述技术方案中任一项所述的语音处理装置,因此,该终端具有和上述技术方案中任一项所述的语音处理装置相同的技术效果,在此不再赘述。
通过以上技术方案,可以消除且仅消除预设语音信息带来的背景噪音,避免因双麦克降噪带来的噪音外的正常语音也被消除的问题,提升了噪音消除的准确性和通话的质量,提升了用户体验。
附图说明
图1示出了根据本发明的一个实施例的语音处理方法的流程图;
图2示出了根据本发明的一个实施例的语音处理装置的框图;
图3示出了根据本发明的一个实施例的终端的框图;
图4A示出了根据本发明的另一个实施例的语音处理方法的流程图;
图4B示出了图4A中从云端进行歌曲匹配的示意图;
图4C示出了图4A中从本地终端进行歌曲匹配的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的一个实施例的语音处理方法的流程图。
如图1所示,根据本发明的一个实施例的语音处理方法,用于终端,包括:
步骤102,在预设噪音过滤模式下,收集语音信息。
步骤104,确定收集到的语音信息中是否具有与预设语音信息相匹配的部分。
步骤106,当确定语音信息中具有与预设语音信息相匹配的部分时,将预设语音信息与收集到的语音信息同步,并消除预设语音信息的频谱,以供对收集到的语音信息进行降噪处理。
在该技术方案中,可以在进行通话或进行语音识别时采集语音信息,并判断终端中或与终端相连的云端中是否具有与该语音信息相符的预设语音信息,若有,则在通话或进行语音识别的同时,消除预设语音信息的频谱,从而实现了消除背景噪音的功能。比如,用户在播放歌曲的汽车中进行通话时,手机可采集一段歌曲信息,并比对手机中是否存储有该歌曲,如果手机存储有该歌曲,则同步消除该歌曲的频谱,从而消除且仅消除歌曲带来的背景噪音,避免因双麦克降噪带来的噪音外的正常语音也被消除的问题,提升了噪音消除的准确性和通话的质量,提升了用户体验。另外,本技术方案所说的相匹配指的是完全相同,或相似度大于预定值。
在上述技术方案中,优选地,在步骤102之前,还包括:当检测到通话命令或语音识别命令时,在开启通话功能或语音识别功能的同时,进入预设噪音过滤模式。
在该技术方案中,只有在终端进行通话或语音识别时才开启预设噪音过滤模式,以降低终端的能耗,避免因预设噪音过滤模式长期开启而一直采集、匹配语音信息,进而避免终端的性能降低。
在上述技术方案中,优选地,步骤104具体包括:从预定位置获取预设语音信息,其中,预定位置包括与终端相连的云端和/或终端的存储装置,预设语音信息包括至少一个语音片段;以及确定获取到的预设语音信息中的至少一个语音片段中是否有任一语音片段与收集到的语音信息相匹配。
在该技术方案中,终端可以将收集的语音信息与自身存储的语音信息进行比对,也可以与连接的云端等服务器中的语音信息进行比对。终端收集的语音信息只是一个语音片段,终端可以判断预设语音信息中是否具有相同的片段,在确定预设语音信息中具有相同的片段时,将收集的语音与预设语音在相同的片段处同步,进而一边收集语音信息,一边在语音信息中消除预设语音信息的频谱,即实现了同步消除噪音的功能,并且不会影响用户进行正常的通话或语音识别。
在上述技术方案中,优选地,还包括:当确定收集到的语音信息中不具有与预设语音信息相匹配的部分时,重新收集语音信息,以供根据重新收集的语音信息确定是否对重新收集的语音信息进行降噪处理。
在该技术方案中,如果终端收集的语音信息在终端或云端中无法匹配到相同或相近的预设语音信息,则可以重新收集语音信息进行匹配,直至匹配成功,或者通话或语音识别结束,整个匹配过程耗时很短,最长一般不超过10s。
在上述技术方案中,优选地,还包括:当检测到通话结束命令或语音识别终止命令时,在关闭通话功能或语音识别功能的同时,退出预设噪音过滤模式。
在该技术方案中,在结束通话后,或在停止进行语音识别后,可以关闭预设噪音过滤模式,以节省能耗,避免终端的性能降低。
图2示出了根据本发明的一个实施例的语音处理装置的框图。
如图2所示,根据本发明的一个实施例的语音处理装置200,用于终端,包括:语音收集单元202,在预设噪音过滤模式下,收集语音信息;确定单元204,确定收集到的语音信息中是否具有与预设语音信息相匹配的部分;降噪处理单元206,当确定语音信息中具有与预设语音信息相匹配的部分时,将预设语音信息与收集到的语音信息同步,并消除预设语音信息的频谱,以供对收集到的语音信息进行降噪处理。
在该技术方案中,可以在进行通话或进行语音识别时采集语音信息,并判断终端中或与终端相连的云端中是否具有与该语音信息相符的预设语音信息,若有,则在通话或进行语音识别的同时,消除预设语音信息的频谱,从而实现了消除背景噪音的功能。比如,用户在播放歌曲的汽车中进行通话时,手机可采集一段歌曲信息,并比对手机中是否存储有该歌曲,如果手机存储有该歌曲,则同步消除该歌曲的频谱,从而消除且仅消除歌曲带来的背景噪音,避免因双麦克降噪带来的噪音外的正常语音也被消除的问题,提升了噪音消除的准确性和通话的质量,提升了用户体验。另外,本技术方案所说的相匹配指的是完全相同,或相似度大于预定值。
在上述技术方案中,优选地,还包括:开启单元208,在收集语音信息之前,当检测到通话命令或语音识别命令时,在开启通话功能或语音识别功能的同时,进入预设噪音过滤模式。
在该技术方案中,只有在终端进行通话或语音识别时才开启预设噪音过滤模式,以降低终端的能耗,避免因预设噪音过滤模式长期开启而一直采集、匹配语音信息,进而避免终端的性能降低。
在上述技术方案中,优选地,确定单元204具体用于:从预定位置获取预设语音信息,其中,预定位置包括与终端相连的云端和/或终端的存储装置,预设语音信息包括至少一个语音片段,以及确定获取到的预设语音信息中的至少一个语音片段中是否有任一语音片段与收集到的语音信息相匹配。
在该技术方案中,终端可以将收集的语音信息与自身存储的语音信息进行比对,也可以与连接的云端等服务器中的语音信息进行比对。终端收集的语音信息只是一个语音片段,终端可以判断预设语音信息中是否具有相同的片段,在确定预设语音信息中具有相同的片段时,将收集的语音与预设语音在相同的片段处同步,进而一边收集语音信息,一边在语音信息中消除预设语音信息的频谱,即实现了同步消除噪音的功能,并且不会影响用户进行正常的通话或语音识别。
在上述技术方案中,优选地,语音收集单元202还用于:当确定收集到的语音信息中不具有与预设语音信息相匹配的部分时,重新收集语音信息,以供根据重新收集的语音信息确定是否对重新收集的语音信息进行降噪处理。
在该技术方案中,如果终端收集的语音信息在终端或云端中无法匹配到相同或相近的预设语音信息,则可以重新收集语音信息进行匹配,直至匹配成功,或者通话或语音识别结束,整个匹配过程耗时很短,最长一般不超过10s。
在上述技术方案中,优选地,还包括:关闭单元210,当检测到通话结束命令或语音识别终止命令时,在关闭通话功能或语音识别功能的同时,退出预设噪音过滤模式。
在该技术方案中,在结束通话后,或在停止进行语音识别后,可以关闭预设噪音过滤模式,以节省能耗,避免终端的性能降低。
图3示出了根据本发明的一个实施例的终端的框图。
如图3所示,根据本发明的一个实施例的终端300,包括:语音处理装置302(相当于图2示出的实施例中的语音处理装置200),可以在预设噪音过滤模式下,收集语音信息,并确定收集到的语音信息中是否具有与预设语音信息相匹配的部分,以及当确定语音信息中具有与预设语音信息相匹配的部分时,将预设语音信息与收集到的语音信息同步,并消除预设语音信息的频谱,以供对收集到的语音信息进行降噪处理。
在该技术方案中,可以在进行通话或进行语音识别时采集语音信息,并判断终端中或与终端相连的云端中是否具有与该语音信息相符的预设语音信息,若有,则在通话或进行语音识别的同时,消除预设语音信息的频谱,从而实现了消除背景噪音的功能。比如,用户在播放歌曲的汽车中进行通话时,手机可采集一段歌曲信息,并比对手机中是否存储有该歌曲,如果手机存储有该歌曲,则同步消除该歌曲的频谱,从而消除且仅消除歌曲带来的背景噪音,避免因双麦克降噪带来的噪音外的正常语音也被消除的问题,提升了噪音消除的准确性和通话的质量,提升了用户体验。另外,本技术方案所说的相匹配指的是完全相同,或相似度大于预定值。
另外,由于语音处理装置302相当于图2示出的实施例中的语音处理装置200,因此,终端300具有和上述技术方案中任一项所述的语音处理装置200相同的技术效果,在此不再赘述。
图4A示出了根据本发明的另一个实施例的语音处理方法的流程图。
如图4A所示,根据本发明的另一个实施例的语音处理方法,应用于在播放背景音乐的同时进行通话或语音识别的应用场景,其包括:
步骤402,是否启用预设噪音过滤模式,当判断结果为是时,进入步骤404,当判断结果为否时,结束进程。
步骤404,检测到通话或者开始进行语音识别。
步骤406,检测当前是否有背景音乐,当检测结果为是时,进入步骤408,当检测结果为否时,结束进程。
步骤408,收集背景音乐,并在终端中或与终端相连的云端中进行匹配,其中,图4B示出了图4A中从云端进行歌曲匹配的示意图,图4C示出了图4A中从本地终端进行歌曲匹配的示意图,终端可以判断自身或与终端相连的云端中是否具有与该语音信息相符的预设语音信息,若有,则在通话或进行语音识别的同时,消除预设语音信息的频谱,从而实现了消除背景噪音的功能。
步骤410,判断是否匹配成功,当判断结果为是时,进入步骤412,当判断结果为否时,返回步骤408,重新收集背景音乐。具体地,如果终端收集的语音信息在终端或云端中无法匹配到相同或相近的预设语音信息,则可以重新收集语音信息进行匹配,直至匹配成功,或者通话或语音识别结束,整个匹配过程耗时很短,最长一般不超过10s。
步骤412,同步背景音乐与匹配到的音乐,在收集到的音频中消除匹配到的音乐的频谱。同步消除该背景音乐的频谱,可消除且仅消除背景音乐带来的背景噪音,避免因双麦克降噪带来的噪音外的正常语音也被消除的问题,提升了噪音消除的准确性和通话的质量,提升了用户体验。另外,本技术方案所说的相匹配指的是完全相同,或相似度大于预定值。
以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,可以消除且仅消除预设语音信息带来的背景噪音,避免因双麦克降噪带来的噪音外的正常语音也被消除的问题,提升了噪音消除的准确性和通话的质量,提升了用户体验。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种语音处理方法,用于终端,其特征在于,包括:
在预设噪音过滤模式下,收集语音信息;
确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分;
当确定所述语音信息中具有与所述预设语音信息相匹配的部分时,将所述预设语音信息与收集到的所述语音信息同步,并消除所述预设语音信息的频谱,以供对收集到的所述语音信息进行降噪处理。
2.根据权利要求1所述的语音处理方法,其特征在于,在所述收集语音信息之前,还包括:
当检测到通话命令或语音识别命令时,在开启通话功能或语音识别功能的同时,进入所述预设噪音过滤模式。
3.根据权利要求2所述的语音处理方法,其特征在于,所述确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分,具体包括:
从预定位置获取所述预设语音信息,其中,所述预定位置包括与所述终端相连的云端和/或所述终端的存储装置,所述预设语音信息包括至少一个语音片段;以及
确定获取到的所述预设语音信息中的所述至少一个语音片段中是否有任一语音片段与收集到的所述语音信息相匹配。
4.根据权利要求3所述的语音处理方法,其特征在于,还包括:
当确定收集到的所述语音信息中不具有与所述预设语音信息相匹配的部分时,重新收集所述语音信息,以供根据重新收集的所述语音信息确定是否对重新收集的所述语音信息进行所述降噪处理。
5.根据权利要求2至4中任一项所述的语音处理方法,其特征在于,还包括:
当检测到通话结束命令或语音识别终止命令时,在关闭所述通话功能或所述语音识别功能的同时,退出所述预设噪音过滤模式。
6.一种语音处理装置,用于终端,其特征在于,包括:
语音收集单元,在预设噪音过滤模式下,收集语音信息;
确定单元,确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分;
降噪处理单元,当确定所述语音信息中具有与所述预设语音信息相匹配的部分时,将所述预设语音信息与收集到的所述语音信息同步,并消除所述预设语音信息的频谱,以供对收集到的所述语音信息进行降噪处理。
7.根据权利要求6所述的语音处理装置,其特征在于,还包括:
开启单元,在所述收集语音信息之前,当检测到通话命令或语音识别命令时,在开启通话功能或语音识别功能的同时,进入所述预设噪音过滤模式。
8.根据权利要求7所述的语音处理装置,其特征在于,所述确定单元具体用于:
从预定位置获取所述预设语音信息,其中,所述预定位置包括与所述终端相连的云端和/或所述终端的存储装置,所述预设语音信息包括至少一个语音片段,以及确定获取到的所述预设语音信息中的所述至少一个语音片段中是否有任一语音片段与收集到的所述语音信息相匹配。
9.根据权利要求8所述的语音处理装置,其特征在于,所述语音收集单元还用于:
当确定收集到的所述语音信息中不具有与所述预设语音信息相匹配的部分时,重新收集所述语音信息,以供根据重新收集的所述语音信息确定是否对重新收集的所述语音信息进行所述降噪处理。
10.根据权利要求7至9中任一项所述的语音处理装置,其特征在于,还包括:
关闭单元,当检测到通话结束命令或语音识别终止命令时,在关闭所述通话功能或所述语音识别功能的同时,退出所述预设噪音过滤模式。
11.一种终端,其特征在于,包括如权利要求6至10中任一项所述的语音处理装置。
CN201510066942.4A 2015-02-09 2015-02-09 语音处理方法、语音处理装置和终端 Pending CN104599675A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510066942.4A CN104599675A (zh) 2015-02-09 2015-02-09 语音处理方法、语音处理装置和终端
PCT/CN2015/078091 WO2016127506A1 (zh) 2015-02-09 2015-04-30 语音处理方法、语音处理装置和终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510066942.4A CN104599675A (zh) 2015-02-09 2015-02-09 语音处理方法、语音处理装置和终端

Publications (1)

Publication Number Publication Date
CN104599675A true CN104599675A (zh) 2015-05-06

Family

ID=53125408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510066942.4A Pending CN104599675A (zh) 2015-02-09 2015-02-09 语音处理方法、语音处理装置和终端

Country Status (2)

Country Link
CN (1) CN104599675A (zh)
WO (1) WO2016127506A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105338170A (zh) * 2015-09-23 2016-02-17 广东小天才科技有限公司 一种滤除背景噪声的方法及装置
CN106328137A (zh) * 2016-08-19 2017-01-11 镇江惠通电子有限公司 语音控制方法、装置及系统
CN106453761A (zh) * 2016-10-31 2017-02-22 北京小米移动软件有限公司 语音信号的处理方法及装置
CN107028524A (zh) * 2015-12-08 2017-08-11 太琦科技股份有限公司 语音控制型洗浴系统及其操作方法
CN107240403A (zh) * 2016-03-28 2017-10-10 阿里巴巴集团控股有限公司 声波传输方法及装置
CN107819964A (zh) * 2017-11-10 2018-03-20 广东欧珀移动通信有限公司 提高通话质量的方法、装置、终端和计算机可读存储介质
CN108173740A (zh) * 2017-11-30 2018-06-15 维沃移动通信有限公司 一种语音通信的方法和装置
CN108881652A (zh) * 2018-07-11 2018-11-23 北京大米科技有限公司 回音检测方法、存储介质和电子设备
CN109215688A (zh) * 2018-10-10 2019-01-15 麦片科技(深圳)有限公司 同场景音频处理方法、装置、计算机可读存储介质及系统
CN109389979A (zh) * 2018-12-05 2019-02-26 广东美的制冷设备有限公司 语音交互方法、语音交互系统以及家用电器

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11694705B2 (en) 2018-07-20 2023-07-04 Sony Interactive Entertainment Inc. Sound signal processing system apparatus for avoiding adverse effects on speech recognition

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124084A (ja) * 1996-10-18 1998-05-15 Oki Electric Ind Co Ltd 音声処理装置
US6711536B2 (en) * 1998-10-20 2004-03-23 Canon Kabushiki Kaisha Speech processing apparatus and method
JP2000194392A (ja) * 1998-12-25 2000-07-14 Sharp Corp 騒音適応型音声認識装置及び騒音適応型音声認識プログラムを記録した記録媒体
CN101859567B (zh) * 2009-04-10 2012-05-30 比亚迪股份有限公司 一种语音背景噪声的消除方法和装置
CN102354499B (zh) * 2011-07-25 2017-12-19 中兴通讯股份有限公司 降低噪音的方法和设备
US9881616B2 (en) * 2012-06-06 2018-01-30 Qualcomm Incorporated Method and systems having improved speech recognition
CN103514884A (zh) * 2012-06-26 2014-01-15 华为终端有限公司 通话音降噪方法及终端
CN103514876A (zh) * 2012-06-28 2014-01-15 腾讯科技(深圳)有限公司 噪音消除方法和装置、以及移动终端
CN102969003A (zh) * 2012-11-15 2013-03-13 东莞宇龙通信科技有限公司 摄像声音提取方法及装置
CN103888580B (zh) * 2014-03-31 2016-08-17 宇龙计算机通信科技(深圳)有限公司 一种终端录音过程中降噪处理方法及终端
CN104517607A (zh) * 2014-12-16 2015-04-15 佛山市顺德区美的电热电器制造有限公司 滤除语音控制电器中的噪声的方法及语音控制电器

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105338170A (zh) * 2015-09-23 2016-02-17 广东小天才科技有限公司 一种滤除背景噪声的方法及装置
CN107028524A (zh) * 2015-12-08 2017-08-11 太琦科技股份有限公司 语音控制型洗浴系统及其操作方法
CN107240403B (zh) * 2016-03-28 2021-08-27 阿里巴巴集团控股有限公司 声波传输方法及装置
CN107240403A (zh) * 2016-03-28 2017-10-10 阿里巴巴集团控股有限公司 声波传输方法及装置
CN106328137A (zh) * 2016-08-19 2017-01-11 镇江惠通电子有限公司 语音控制方法、装置及系统
CN106453761A (zh) * 2016-10-31 2017-02-22 北京小米移动软件有限公司 语音信号的处理方法及装置
CN107819964A (zh) * 2017-11-10 2018-03-20 广东欧珀移动通信有限公司 提高通话质量的方法、装置、终端和计算机可读存储介质
CN108173740A (zh) * 2017-11-30 2018-06-15 维沃移动通信有限公司 一种语音通信的方法和装置
CN108881652A (zh) * 2018-07-11 2018-11-23 北京大米科技有限公司 回音检测方法、存储介质和电子设备
CN109215688A (zh) * 2018-10-10 2019-01-15 麦片科技(深圳)有限公司 同场景音频处理方法、装置、计算机可读存储介质及系统
CN109215688B (zh) * 2018-10-10 2020-12-22 麦片科技(深圳)有限公司 同场景音频处理方法、装置、计算机可读存储介质及系统
CN109389979A (zh) * 2018-12-05 2019-02-26 广东美的制冷设备有限公司 语音交互方法、语音交互系统以及家用电器
CN109389979B (zh) * 2018-12-05 2022-05-20 广东美的制冷设备有限公司 语音交互方法、语音交互系统以及家用电器

Also Published As

Publication number Publication date
WO2016127506A1 (zh) 2016-08-18

Similar Documents

Publication Publication Date Title
CN104599675A (zh) 语音处理方法、语音处理装置和终端
KR101954550B1 (ko) 음량조절 방법, 시스템, 디바이스 및 컴퓨터 저장매체
CN103456305B (zh) 终端和基于多个声音采集单元的语音处理方法
CN108305637B (zh) 耳机语音处理方法、终端设备及存储介质
CN106911996A (zh) 麦克风状态的检测方法、装置及终端设备
CN106100676A (zh) 控制音频输出的方法、用户终端和对讲机终端
CN103685757B (zh) 手机语音通话控制系统及方法
CN103219011A (zh) 降噪方法、装置与通信终端
US8606573B2 (en) Voice recognition improved accuracy in mobile environments
US20090248411A1 (en) Front-End Noise Reduction for Speech Recognition Engine
WO2014117722A1 (zh) 语音处理方法、装置及终端设备
CN107240405B (zh) 一种音箱及告警方法
CN105979197A (zh) 基于啸叫音自动识别的远程会议控制方法及装置
CN107564523B (zh) 一种耳机接听方法、装置以及耳机
CN104980337A (zh) 一种音频处理的性能提升方法及装置
CN112004177B (zh) 一种啸叫检测方法、麦克风音量调节方法及存储介质
CN105848052B (zh) 一种麦克切换方法及终端
CN104092801A (zh) 智能终端通话降噪方法及智能终端
CN105096977A (zh) 一种多媒体播放的控制方法及移动终端
CN110277103A (zh) 基于语音识别的降噪方法及终端
CN103379231A (zh) 一种无线会议电话及其进行语音信号传递的方法
CN110265056A (zh) 音源的控制方法以及扬声设备、装置
CN102781075A (zh) 一种降低移动终端通话功耗的方法及移动终端
CN112992153B (zh) 音频处理方法、声纹识别方法、装置、计算机设备
CN101193384A (zh) 通过模式识别滤除环境音的方法及手机

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150506

RJ01 Rejection of invention patent application after publication