WO2016127506A1

WO2016127506A1 - 语音处理方法、语音处理装置和终端

Info

Publication number: WO2016127506A1
Application number: PCT/CN2015/078091
Authority: WO
Inventors: 尹宾; 卢纯
Original assignee: 宇龙计算机通信科技(深圳)有限公司
Priority date: 2015-02-09
Filing date: 2015-04-30
Publication date: 2016-08-18
Also published as: CN104599675A

Abstract

一种语音处理方法、一种语音处理装置和一种终端，其中的语音处理方法包括：在预设噪音过滤模式下，收集语音信息（102）；确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分（104）；当确定所述语音信息中具有与所述预设语音信息相匹配的部分时，将所述预设语音信息与收集到的所述语音信息同步，并消除所述预设语音信息的频谱，以供对收集到的所述语音信息进行降噪处理（106）。该语音处理方法可以消除且仅消除预设语音信息带来的背景噪音，避免因双麦克降噪带来的噪音外的正常语音也被消除的问题，提升了噪音消除的准确性和通话的质量，提升了用户体验。

Description

语音处理方法、语音处理装置和终端

本申请要求于2015年2月9日提交中国专利局、申请号为201510066942.4，发明名称为“语音处理方法、语音处理装置和终端”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及终端技术领域，具体而言，涉及一种语音处理方法、一种语音处理装置和一种终端。

背景技术

目前的终端普遍使用双麦克降噪方式来降低语音噪音，在通话或执行其他语音识别命令时，终端可以使用降噪麦克风将收录到的噪音滤掉，从而在嘈杂的环境中依旧能够保证语音质量的清晰。

然而，双麦克降噪方式只能过滤嘈杂的背景音，对于安静环境下的音乐等背景语音信息中的人声无法有效过滤，而当背景语音的音量较大时，通常会对通话或者语音识别造成干扰，比如，在汽车行驶中，开启车内的音响，此时用户如果接听电话，车内的音乐中的人声就会给通话造成极大的干扰。另外，双麦克降噪方式由于其本身的特性还会降低语音的音量，从而会影响通话或者语音识别的质量。

因此需要一种新的技术方案，可以在保证语音质量的同时降低语音中的噪音。

发明内容

本发明正是基于上述问题，提出了一种新的技术方案，可以在保证语音质量的同时降低语音中的噪音。

有鉴于此，本发明的一方面提出了一种语音处理方法，用于终端，包括：在预设噪音过滤模式下，收集语音信息；确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分；当确定所述语音信息中具有与所述预设语音信息相匹配的部分时，将所述预设语音信息与收集到的所述语音信息同步，并消除所述预设语音信息的频谱，以供对收集到的所述语音信息进行降噪处理。

在该技术方案中，可以在进行通话或进行语音识别时采集语音信息，并判断终端中或与终端相连的云端中是否具有与该语音信息相符的预设语音信息，若有，则在通话或进行语音识别的同时，消除预设语音信息的频谱，从而实现了消除背景噪音的功能。比如，用户在播放歌曲的汽车中进行通话时，手机可采集一段歌曲信息，并比对手机中是否存储有该歌曲，如果手机存储有该歌曲，则同步消除该歌曲的频谱，从而消除且仅消除歌曲带来的背景噪音，避免因双麦克降噪带来的噪音外的正常语音也被消除的问题，提升了噪音消除的准确性和通话的质量，提升了用户体验。另外，本技术方案所说的相匹配指的是完全相同，或相似度大于预定值。

在上述技术方案中，优选地，在所述收集语音信息之前，还包括：当检测到通话命令或语音识别命令时，在开启通话功能或语音识别功能的同时，进入所述预设噪音过滤模式。

在该技术方案中，只有在终端进行通话或语音识别时才开启预设噪音过滤模式，以降低终端的能耗，避免因预设噪音过滤模式长期开启而一直采集、匹配语音信息，进而避免终端的性能降低。

在上述技术方案中，优选地，所述确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分，具体包括：从预定位置获取所述预设语音信息，其中，所述预定位置包括与所述终端相连的云端和/或所述终端的存储装置，所述预设语音信息包括至少一个语音片段；以及确定获取到的所述预设语音信息中的所述至少一个语音片段中是否有任一语音片段与收集到的所述语音信息相匹配。

在该技术方案中，终端可以将收集的语音信息与自身存储的语音信息进行比对，也可以与连接的云端等服务器中的语音信息进行比对。终端收集的语音信息只是一个语音片段，终端可以判断预设语音信息中是否具有相同的片段，在确定预设语音信息中具有相同的片段时，将收集的语音与预设语音在相同的片段处同步，进而一边收集语音信息，一边在语音信息中消除预设语音信息的频谱，即实现了同步消除噪音的功能，并且不会影响用户进行正常的通话或语音识别。

在上述技术方案中，优选地，还包括：当确定收集到的所述语音信息中不具有与所述预设语音信息相匹配的部分时，重新收集所述语音信息，以供根据重新收集的所述语音信息确定是否对重新收集的所述语音信息进行所述降噪处理。

在该技术方案中，如果终端收集的语音信息在终端或云端中无法匹配到相同或相近的预设语音信息，则可以重新收集语音信息进行匹配，直至匹配成功，或者通话或语音识别结束，整个匹配过程耗时很短，最长一般不超过10s。

在上述技术方案中，优选地，还包括：当检测到通话结束命令或语音识别终止命令时，在关闭所述通话功能或所述语音识别功能的同时，退出所述预设噪音过滤模式。

在该技术方案中，在结束通话后，或在停止进行语音识别后，可以关闭预设噪音过滤模式，以节省能耗，避免终端的性能降低。

本发明的另一方面提出了一种语音处理装置，用于终端，包括：语音收集单元，在预设噪音过滤模式下，收集语音信息；确定单元，确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分；降噪处理单元，当确定所述语音信息中具有与所述预设语音信息相匹配的部分时，将所述预设语音信息与收集到的所述语音信息同步，并消除所述预设语音信息的频谱，以供对收集到的所述语音信息进行降噪处理。

在上述技术方案中，优选地，还包括：开启单元，在所述收集语音信息之前，当检测到通话命令或语音识别命令时，在开启通话功能或语音识别功能的同时，进入所述预设噪音过滤模式。

在上述技术方案中，优选地，所述确定单元具体用于：从预定位置获取所述预设语音信息，其中，所述预定位置包括与所述终端相连的云端和/或所述终端的存储装置，所述预设语音信息包括至少一个语音片段，以及确定获取到的所述预设语音信息中的所述至少一个语音片段中是否有任一语音片段与收集到的所述语音信息相匹配。

在上述技术方案中，优选地，所述语音收集单元还用于：当确定收集到的所述语音信息中不具有与所述预设语音信息相匹配的部分时，重新收集所述语音信息，以供根据重新收集的所述语音信息确定是否对重新收集的所述语音信息进行所述降噪处理。

在上述技术方案中，优选地，还包括：关闭单元，当检测到通话结束命令或语音识别终止命令时，在关闭所述通话功能或所述语音识别功能的同时，退出所述预设噪音过滤模式。

本发明的第三方面的实施例提出了一种终端，所述终端包括通信总线、收发装置、存储器以及处理器，其中：

所述通信总线，用于实现所述收发装置、所述存储器以及所述处理器之间的连接通信；

所述存储器中存储一组程序代码，且所述处理器调用所述存储器中存储的程序代码，用于执行以下操作：

所述收发装置，用于在预设噪音过滤模式下，收集语音信息；

所述处理器，用于确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分；

所述处理器，还用于当确定所述语音信息中具有与所述预设语音信息相匹配的部分时，将所述预设语音信息与收集到的所述语音信息同步，并消除所述预设语音信息的频谱，以供对收集到的所述语音信息进行降噪处理。

在上述技术方案中，优选地，所述处理器还用于执行如下步骤：

当检测到通话命令或语音识别命令时，在开启通话功能或语音识别功能的同时，进入所述预设噪音过滤模式。

在上述技术方案中，优选地，所述处理器确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分，具体包括：

从预定位置获取所述预设语音信息，其中，所述预定位置包括与所述终端相连的云端和/或所述终端的存储装置，所述预设语音信息包括至少一个语音片段；以及

确定获取到的所述预设语音信息中的所述至少一个语音片段中是否有任一语音片段与收集到的所述语音信息相匹配。

当确定收集到的所述语音信息中不具有与所述预设语音信息相匹配的部分时，重新收集所述语音信息，以供根据重新收集的所述语音信息确定是否对重新收集的所述语音信息进行所述降噪处理。

当检测到通话结束命令或语音识别终止命令时，在关闭所述通话功能或所述语音识别功能的同时，退出所述预设噪音过滤模式。

通过以上技术方案，可以消除且仅消除预设语音信息带来的背景噪音，避免因双麦克降噪带来的噪音外的正常语音也被消除的问题，提升了噪音消除的准确性和通话的质量，提升了用户体验。

附图说明

图1示出了根据本发明的一个实施例的语音处理方法的流程图；

图2示出了根据本发明的一个实施例的语音处理装置的框图；

图3示出了根据本发明的一个实施例的终端的框图；

图4A示出了根据本发明的另一个实施例的语音处理方法的流程图；

图4B示出了图4A中从云端进行歌曲匹配的示意图；

图4C示出了图4A中从本地终端进行歌曲匹配的示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了根据本发明的一个实施例的语音处理方法的流程图。

如图1所示，根据本发明的一个实施例的语音处理方法，用于终端，包括：

步骤102，在预设噪音过滤模式下，收集语音信息。

步骤104，确定收集到的语音信息中是否具有与预设语音信息相匹配的部分。

步骤106，当确定语音信息中具有与预设语音信息相匹配的部分时，将预设语音信息与收集到的语音信息同步，并消除预设语音信息的频谱，以供对收集到的语音信息进行降噪处理。

在上述技术方案中，优选地，在步骤102之前，还包括：当检测到通话命令或语音识别命令时，在开启通话功能或语音识别功能的同时，进入预设噪音过滤模式。

在上述技术方案中，优选地，步骤104具体包括：从预定位置获取预设语音信息，其中，预定位置包括与终端相连的云端和/或终端的存储装置，预设语音信息包括至少一个语音片段；以及确定获取到的预设语音信息中的至少一个语音片段中是否有任一语音片段与收集到的语音信息相匹配。

在上述技术方案中，优选地，还包括：当确定收集到的语音信息中不具有与预设语音信息相匹配的部分时，重新收集语音信息，以供根据重新收集的语音信息确定是否对重新收集的语音信息进行降噪处理。

在上述技术方案中，优选地，还包括：当检测到通话结束命令或语音识别终止命令时，在关闭通话功能或语音识别功能的同时，退出预设噪音过滤模式。

图2示出了根据本发明的一个实施例的语音处理装置的框图。

如图2所示，根据本发明的一个实施例的语音处理装置200，用于终端，包括：语音收集单元202，在预设噪音过滤模式下，收集语音信息；确定单元204，确定收集到的语音信息中是否具有与预设语音信息相匹配的部分；降噪处理单元206，当确定语音信息中具有与预设语音信息相匹配的部分时，将预设语音信息与收集到的语音信息同步，并消除预设语音信息的频谱，以供对收集到的语音信息进行降噪处理。

在上述技术方案中，优选地，还包括：开启单元208，在收集语音信息之前，当检测到通话命令或语音识别命令时，在开启通话功能或语音识别功能的同时，进入预设噪音过滤模式。

在上述技术方案中，优选地，确定单元204具体用于：从预定位置获取预设语音信息，其中，预定位置包括与终端相连的云端和/或终端的存储装置，预设语音信息包括至少一个语音片段，以及确定获取到的预设语音信息中的至少一个语音片段中是否有任一语音片段与收集到的语音信息相匹配。

在上述技术方案中，优选地，语音收集单元202还用于：当确定收集到的语音信息中不具有与预设语音信息相匹配的部分时，重新收集语音信息，以供根据重新收集的语音信息确定是否对重新收集的语音信息进行降噪处理。

在上述技术方案中，优选地，还包括：关闭单元210，当检测到通话结束命令或语音识别终止命令时，在关闭通话功能或语音识别功能的同时，退出预设噪音过滤模式。

图3示出了根据本发明的一个实施例的终端的框图。

如图3所示，根据本发明的一个实施例的终端，包括：至少一个收发装置303，至少一个处理器301，例如CPU，存储器304和至少一个通信总线 302。

其中，上述通信总线302用于连接上述收发装置303、处理器301和存储器304。

上述存储器304可以是高速RAM存储器，也可为非不稳定的存储器(non-volatile memory)，例如磁盘存储器。上述存储器304还用于存储一组程序代码，上述收发装置303和处理器301用于调用存储器304中存储的程序代码，执行如下操作：

所述收发装置303，用于在预设噪音过滤模式下，收集语音信息；

所述处理器301，用于确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分；

所述处理器301，还用于当确定所述语音信息中具有与所述预设语音信息相匹配的部分时，将所述预设语音信息与收集到的所述语音信息同步，并消除所述预设语音信息的频谱，以供对收集到的所述语音信息进行降噪处理。

在上述技术方案中，优选地，所述处理器301还用于执行如下步骤：

在上述技术方案中，优选地，所述处理器301确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分，具体包括：

当检测到通话结束命令或语音识别终止命令时，在关闭所述通话功能或所述语音识别功能的同时，退出所述预设噪音过滤模式。可以在预设噪音过滤模式下，收集语音信息，并确定收集到的语音信息中是否具有与预设语音信息相匹配的部分，以及当确定语音信息中具有与预设语音信息相匹配的部分时，将预设语音信息与收集到的语音信息同步，并消除预设语音信息的频谱，以供对收集到的语音信息进行降噪处理。

图4A示出了根据本发明的另一个实施例的语音处理方法的流程图。

如图4所示，根据本发明的另一个实施例的语音处理方法，应用于在播放背景音乐的同时进行通话或语音识别的应用场景，其包括：

步骤402，是否启用预设噪音过滤模式，当判断结果为是时，进入步骤404，当判断结果为否时，结束进程。

步骤404，检测到通话或者开始进行语音识别。

步骤406，检测当前是否有背景音乐，当检测结果为是时，进入步骤408，当检测结果为否时，结束进程。

步骤408，收集背景音乐，并在终端中或与终端相连的云端中进行匹配，其中，图4B示出了图4A中从云端进行歌曲匹配的示意图，图4C示出了图4A中从本地终端进行歌曲匹配的示意图，终端可以判断自身或与终端相连的云端中是否具有与该语音信息相符的预设语音信息，若有，则在通话或进行语音识别的同时，消除预设语音信息的频谱，从而实现了消除背景噪音的功能。

步骤410，判断是否匹配成功，当判断结果为是时，进入步骤412，当判断结果为否时，返回步骤408，重新收集背景音乐。具体地，如果终端收集的语音信息在终端或云端中无法匹配到相同或相近的预设语音信息，则可以重新收集语音信息进行匹配，直至匹配成功，或者通话或语音识别结束，整个匹配过程耗时很短，最长一般不超过10s。

步骤412，同步背景音乐与匹配到的音乐，在收集到的音频中消除匹配到的音乐的频谱。同步消除该背景音乐的频谱，可消除且仅消除背景音乐带来的背景噪音，避免因双麦克降噪带来的噪音外的正常语音也被消除的问题，提升了噪音消除的准确性和通话的质量，提升了用户体验。另外，本技术方案所说的相匹配指的是完全相同，或相似度大于预定值。

以上结合附图详细说明了本发明的技术方案，通过本发明的技术方案，可以消除且仅消除预设语音信息带来的背景噪音，避免因双麦克降噪带来的噪音外的正常语音也被消除的问题，提升了噪音消除的准确性和通话的质量，提升了用户体验。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种语音处理方法，用于终端，其特征在于，包括：

在预设噪音过滤模式下，收集语音信息；

确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分；

当确定所述语音信息中具有与所述预设语音信息相匹配的部分时，将所述预设语音信息与收集到的所述语音信息同步，并消除所述预设语音信息的频谱，以供对收集到的所述语音信息进行降噪处理。
根据权利要求1所述的语音处理方法，其特征在于，在所述收集语音信息之前，还包括：

当检测到通话命令或语音识别命令时，在开启通话功能或语音识别功能的同时，进入所述预设噪音过滤模式。
根据权利要求2所述的语音处理方法，其特征在于，所述确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分，具体包括：

从预定位置获取所述预设语音信息，其中，所述预定位置包括与所述终端相连的云端和/或所述终端的存储装置，所述预设语音信息包括至少一个语音片段；以及

确定获取到的所述预设语音信息中的所述至少一个语音片段中是否有任一语音片段与收集到的所述语音信息相匹配。
根据权利要求3所述的语音处理方法，其特征在于，还包括：

当确定收集到的所述语音信息中不具有与所述预设语音信息相匹配的部分时，重新收集所述语音信息，以供根据重新收集的所述语音信息确定是否对重新收集的所述语音信息进行所述降噪处理。
根据权利要求2至4中任一项所述的语音处理方法，其特征在于，还包括：

当检测到通话结束命令或语音识别终止命令时，在关闭所述通话功能或所述语音识别功能的同时，退出所述预设噪音过滤模式。
一种语音处理装置，用于终端，其特征在于，包括：

语音收集单元，在预设噪音过滤模式下，收集语音信息；

确定单元，确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分；

降噪处理单元，当确定所述语音信息中具有与所述预设语音信息相匹配的部分时，将所述预设语音信息与收集到的所述语音信息同步，并消除所述预设语音信息的频谱，以供对收集到的所述语音信息进行降噪处理。
根据权利要求6所述的语音处理装置，其特征在于，还包括：

开启单元，在所述收集语音信息之前，当检测到通话命令或语音识别命令时，在开启通话功能或语音识别功能的同时，进入所述预设噪音过滤模式。
根据权利要求7所述的语音处理装置，其特征在于，所述确定单元具体用于：

从预定位置获取所述预设语音信息，其中，所述预定位置包括与所述终端相连的云端和/或所述终端的存储装置，所述预设语音信息包括至少一个语音片段，以及确定获取到的所述预设语音信息中的所述至少一个语音片段中是否有任一语音片段与收集到的所述语音信息相匹配。
根据权利要求8所述的语音处理装置，其特征在于，所述语音收集单元还用于：

当确定收集到的所述语音信息中不具有与所述预设语音信息相匹配的部分时，重新收集所述语音信息，以供根据重新收集的所述语音信息确定是否对重新收集的所述语音信息进行所述降噪处理。
根据权利要求7至9中任一项所述的语音处理装置，其特征在于，还包括：

关闭单元，当检测到通话结束命令或语音识别终止命令时，在关闭所述通话功能或所述语音识别功能的同时，退出所述预设噪音过滤模式。
一种终端，其特征在于，所述终端包括通信总线、收发装置、存储器以及处理器，其中：

所述通信总线，用于实现所述收发装置、所述存储器以及所述处理器之间的连接通信；

所述存储器中存储一组程序代码，且所述处理器调用所述存储器中存储的程序代码，用于执行以下操作：

所述收发装置，用于在预设噪音过滤模式下，收集语音信息；

所述处理器，用于确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分；

所述处理器，还用于当确定所述语音信息中具有与所述预设语音信息相匹配的部分时，将所述预设语音信息与收集到的所述语音信息同步，并消除所述预设语音信息的频谱，以供对收集到的所述语音信息进行降噪处理。
根据权利要求11所述的终端，其特征在于，所述处理器还用于执行如下步骤：

当检测到通话命令或语音识别命令时，在开启通话功能或语音识别功能的同时，进入所述预设噪音过滤模式。
根据权利要求12所述的终端，其特征在于，所述处理器确定收集到的所述语音信息中是否具有与预设语音信息相匹配的部分，具体包括：

从预定位置获取所述预设语音信息，其中，所述预定位置包括与所述终端相连的云端和/或所述终端的存储装置，所述预设语音信息包括至少一个语音片段；以及

确定获取到的所述预设语音信息中的所述至少一个语音片段中是否有任一语音片段与收集到的所述语音信息相匹配。
根据权利要求13所述的终端，其特征在于，所述处理器还用于执行如下步骤：

当确定收集到的所述语音信息中不具有与所述预设语音信息相匹配的部分时，重新收集所述语音信息，以供根据重新收集的所述语音信息确定是否对重新收集的所述语音信息进行所述降噪处理。
根据权利要求12至14中任一项所述的终端，其特征在于，所述处理器还用于执行如下步骤：

当检测到通话结束命令或语音识别终止命令时，在关闭所述通话功能或所述语音识别功能的同时，退出所述预设噪音过滤模式。