CN110536215B

CN110536215B - 音频信号处理的方法、装置、计算设置及存储介质

Info

Publication number: CN110536215B
Application number: CN201910849421.4A
Authority: CN
Inventors: 熊伟浩
Original assignee: TP Link Technologies Co Ltd
Current assignee: TP Link Technologies Co Ltd
Priority date: 2019-09-09
Filing date: 2019-09-09
Publication date: 2021-06-29
Anticipated expiration: 2039-09-09
Also published as: CN110536215A

Abstract

本申请适用于计算机技术领域，提出一种音频信号处理方法，包括：对检测到的音频信号进行分帧处理，获得多帧信号；对所述每帧信号分别进行加窗处理后，做傅里叶变换，得到所述每帧信号的频谱；利用预设的频点聚类算法分别分析所述每帧信号的频谱，检测出啸叫帧信号；利用预设的啸叫频点判断准则从所述啸叫帧信号中检测出啸叫频点；对所述啸叫频点进行陷波处理，输出陷波处理之后的帧信号。由于利用预设的频点聚类算法分析每帧信号的频谱，从每帧信号的频谱中检测出啸叫帧信号后，继续检测出啸叫频点，对啸叫频点进行了陷波处理，并输出陷波处理之后的帧信号，能够有效地抑制音频设备的啸叫现象，提高音频设备的音质，提高用户的体验效果。

Description

音频信号处理的方法、装置、计算设置及存储介质

技术领域

本申请属于计算机技术领域，尤其涉及一种音频信号处理的方法、装置、计算设备及存储介质。

背景技术

随着通信技术的发展，随着通信技术的发展，无线通信设备极大地便利了人们的日常生活和工作，尤其是移动终端设备，不仅仅广泛应用于个人生活中，各行业对无线通信设备的需求也越来越广泛，例如轨道交通、安防、公安等行业对专用无线通信设备有着更特殊的需求。

由于专网行业的特殊使用场景，对音频终端设备的音量要求比较大，这就存在音频设备之间产生啸叫现象。啸叫现象是声反馈的一种，当两部设备通话过程中，距离过近、扬声器音量足够大时，会产生啸叫现象，啸叫产生需要满足三个条件：一是话筒与扬声器同时使用；二是扬声器声音能够通过空间传到话筒；三是扬声器发出的声音能量足够大，话筒的拾音灵敏度足够高。音频设备的啸叫现象对设备音频的音质有非常大的影响，啸叫会使音质急剧下降，影响用户使用体验，由于啸叫是系统形成正反馈产生的，会使系统负荷逐渐变大，甚至会损坏设备。因此，如何抑制音频信号中的啸叫信号是亟待解决的技术问题。

发明内容

有鉴于此，本申请实施例提供了音频信号处理方法、装置、计算设备及存储介质，以解决现有技术中音频设备的啸叫现象，提高音频设备的音质，提高用户的体验效果。

本申请实施例的第一方面提供了一种音频信号处理方法，其特征在于，包括：

对检测到的音频信号进行分帧处理，获得多帧信号；每帧信号包括当前帧对应的多个音频数据及与所述当前帧相邻的前一帧的多个音频数据；

对所述每帧信号进行加窗处理后，做傅里叶变换，得到所述每帧信号的频谱；

利用预设的频点聚类算法分别分析所述每帧信号的频谱，检测出啸叫帧信号；

利用预设的啸叫频点判断准则从所述啸叫帧信号中检测出啸叫频点；

对所述啸叫频点进行陷波处理，输出陷波处理之后的帧信号。

可选地，所述利用预设的频点聚类算法分别分析所述每帧信号的频谱，检测出发生啸叫的帧信号，包括：

计算所述每帧信号的频谱的总能量；

若所述每帧信号的频谱的总能量大于预设的能量阈值，则利用预设的频点聚类算法分析所述每帧信号的频谱，从所述每帧信号的频谱中检测出啸叫信号。

可选地，所述若所述每帧信号的频谱的总能量大于预设的能量阈值，则利用预设的频点聚类算法分析所述每帧信号的频谱，从所述每帧信号的频谱中检测出啸叫信号，包括：

分别将所述每帧信号的频谱划分为多个子频带；

从多个所述子频带中获取目标子频带，所述目标子频带包含的峰值数小于预设峰值数阈值且频带宽度小于预设频带宽度阈值；

基于所述目标子频带的能量值以及与相邻的所述目标子频带之间的频带间隔确定啸叫帧信号。

可选地，所述子频带包含有连续多个频点，且所述连续多个频点中的每个频点的能量值均大于预设的能量阈值。

可选地，所述基于所述目标子频带的能量值以及相邻的所述目标子频带之间的频带间隔确定啸叫帧信号，包括：

若所述目标子频带的能量值的总和占所述目标音频信号的频谱的总能量值的百分比大于预设的能量值百分比阈值，且每两个相邻所述目标子频带之间的频带间隔不相等，则判定当前帧信号为啸叫帧信号。

可选地，所述利用预设的啸叫频点判断准则从所述啸叫帧信号中检测出啸叫频点，包括：

将所述啸叫帧信号的频谱划分为第一频段和第二频段，所述第二频段的频率高于所述第一频段；

基于所述第一频段的峰均功率比、所述第一频段的峰谐波功率比和所述第一频段的帧间峰值保持度，确定所述第一频段中的第一啸叫频点；

基于所述第二频段的峰均功率比和所述第二频段的帧间峰值保持度，确定所述第二频段中的第二啸叫频点。

可选地，所述对所述啸叫频点进行陷波处理，输出陷波处理之后的帧信号，包括：

基于滤波器级联方法分别对所述第一啸叫频点和所述第二啸叫频点进行窄带陷波处理，输出陷波处理之后的帧信号。

可选地，所述滤波器级联方法，包括：

根据预设的陷波频率、陷波带宽和采样频率设置模拟滤波参数；

根据预设的转换公式将所述模拟滤波参数转换为数字滤波参数；

基于所述数字滤波参数审查滤波器，基于所述滤波器得到数字传递函数，基于所述数字传递函数确定滤波器系数；

将所述滤波器系数进行级联生成滤波器组，基于所述滤波器组对所述啸叫频点进行窄带陷波处理，输出陷波处理之后的帧信号。

本申请实施例的第二方面提供了音频信号处理装置，包括：

获取模块，用于对检测到的音频信号进行分帧处理，获得多帧信号；每帧信号包括当前帧对应的多个音频数据及与所述当前帧相邻的前一帧的多个音频数据；

获得模块，用于对所述每帧信号进行加窗处理后，做傅里叶变换，得到所述每帧信号的频谱；

第一检测模块，用于利用预设的频点聚类算法分别分析所述每帧信号的频谱，检测出啸叫帧信号；

第二检测模块，用于利用预设的啸叫频点判断准则从所述啸叫帧信号中检测出啸叫频点；

陷波模块，用于对所述啸叫频点进行陷波处理，输出陷波处理之后的帧信号。

本申请实施例的第三方面提供了一种计算设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上任一实施例所述音频信号处理方法。

本申请实施例通过对检测到的音频信号进行分帧处理，获得多帧信号；每帧信号包括当前帧对应的多个音频数据及与所述当前帧相邻的前一帧的多个音频数据；对所述每帧信号进行加窗处理后，做傅里叶变换，得到所述每帧信号的频谱；利用预设的频点聚类算法分别分析所述每帧信号的频谱，检测出啸叫帧信号；利用预设的啸叫频点判断准则从所述啸叫帧信号中检测出啸叫频点；对所述啸叫频点进行陷波处理，输出陷波处理之后的帧信号。由于利用预设的频点聚类算法分析目标音频信号的频谱，从目标音频信号的频谱中检测出啸叫信号后，利用预设的啸叫频点判断准则从所述啸叫帧信号中检测出啸叫频点；对啸叫频点进行了陷波处理，并输出陷波处理之后的帧信号，能够有效地抑制音频设备的啸叫现象，提高音频设备的音质，提高用户的体验效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请第一实施例提供的音频信号处理方法的实现流程图；

图2是图1中S103的具体实施流程图；

图3是图1中S103的另一具体实施流程图；

图4是图1中S104的具体实施流程图；

图5是图1中S105的具体实施流程图；

图6是本申请提供的音频信号处理装置的装置示意图；

图7是本申请提供的计算设备的示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

为了说明本申请所述的技术方案，下面通过具体实施例来进行说明。如图1所示，是本申请第一实施例提供的音频信号处理方法的实现流程图，本实施例的执行主体为音频信号处理设备。详述如下：

S101，对检测到的音频信号进行分帧处理，获得多帧信号，每帧信号包括当前帧对应的多个音频数据及与所述当前帧相邻的前一帧的多个音频数据。

具体地，在实际应用中，由于音频设备输出的连续帧对应的音频信号包含的啸叫频点(啸叫信号对应的频点)通常具有差异，在常见的音频信号处理过程中，通常会选择对连续帧进行不同的陷波处理，以抑制啸叫信号，这种处理方式会导致连续帧的音频信号发生突变，出现音频信号不连续的现象，使得输出的音频信号出现类似电流声的杂音。在本实施例中，为了防止上述问题的出现，在检测到音频信号时，从检测到的音频信号中获取多帧信号，所述多帧信号包括当前帧对应的多个音频数据及与所述当前帧相邻的前一帧的多个音频数据。

可选的，可以从当前帧以及与所述当前帧相邻的前一帧获取相同个数的音频数据，也可以从当前帧以及与所述当前帧相邻的前一帧获取不同个数的音频数据。

在一种可能的实现方式中，从当前帧获取M个音频数据，从与所述当前帧相邻的前一帧获取N个音频数据，具体地，对M和N的取值不做具体限制，在实际应用中，可以根据实际需求进行调整。

例如，作为示例而非限定，在本实施例中，所述目标音频信号包含有M个音频数据，所述M个音频数据包括从当前帧获取的N个音频数据，以及从与所述当前帧相邻的前一帧获取的M-N个音频数据，其中，M大于N，且均为正整数。

S102，对所述每帧信号分别进行加窗处理后，做傅里叶变换，得到所述每帧信号的频谱。

由于傅里叶变换是研究整个时间域和频率域的关系，当运用于计算机工程实现信号处理时，不可能对无限长的信号进行运算，而是取其有限的片段进行分析，加窗处理的过程就是截取信号片段的过程，不同的窗函数对信号频谱的影响是不一样的，主要是因为不同的窗函数，产生泄露的大小不一样。

具体地，可以通过窗函数对所述每帧信号分别进行加窗处理，例如，作为示例而非限定，在本实施例中，通过混合汉宁窗对所述每帧信号分别进行加窗处理，并对加窗处理之后得到的音频信号，做傅里叶变换。

S103，利用预设的频点聚类算法分别分析所述每帧信号的频谱，检测出啸叫帧信号。

由于啸叫通常发生在高频处，且啸叫的能量值较高，因此，可以利用预设的频点聚类算法分别分析所述每帧信号的频谱对应的不同频点的能量值，来检测出啸叫帧信号。

具体地，如图2所示，是图1中S103的具体实施流程图。由图2可知，S103包括：

S1031，计算所述每帧信号的频谱的总能量。

需要说明的是，由于啸叫容易发生在高频处，且啸叫的能量值相对于正常声音信号较高，因此，为了减少计算量，提高声音信号传输效率，在一种可选的实现方式中，通过计算所述每帧信号的总能量来确定是否需要进行聚类分析。

S1032，若所述每帧信号的频谱的总能量大于预设的能量阈值，则利用预设的频点聚类算法分析所述每帧信号的频谱，从所述每帧信号的频谱中检测出啸叫帧信号。

具体地，若所述每帧信号的总能量大于预设的声音信号总能量阈值，则所述每帧信号可能包含有啸叫信号，利用预设的频点聚类算法分析所述每帧信号的频谱；否则，直接输出所述每帧信号。

可选地，所述预设的频点聚类算法为通过将所述每帧信号的频带划分为多个子频带，将每个子频带称为频点聚类算法的一个类。如果当前类的终点和下一个类的起点之间的距离小于预设的距离阀值，则将当前类与下一个类进行聚类，得到频点聚类的结果。

可选地，从所述频点聚类的结果中删除无效类。具体地，若类中最大频点能量大于预设的频点能量阀值，则确定该类为有效类；若类中最大频点的能量值小于或者等于预设的频点能量阈值，则确定该类为无效类，删除所述无效类。

作为示例而非限定，在本实施例中，从所述频点聚类的结果中提取出每类的信号特征，所述信号特征包括峰值个数、最大频点的能量值、频带宽度；基于所述信号特征，从所述每帧信号的频谱中检测出啸叫信号。

具体地，如图3所示，是图1中S103的另一具体实施流程图。由图3可知，S103包括：

S1033，分别将所述每帧信号的频谱划分为多个子频带。

需要说明的是，所述子频带为预设的频点聚类算法的一个类，预设的频点聚类算法的类包含的每帧信号可以根据需要进行预设，例如，在本实施例中，预设的类与每帧信号的频带包含的帧信号以及帧信号的能量值相关，作为示例而非限定，分别将所述每帧信号的频谱划分为多个子频带，包括：

分别确定所述每帧信号的频谱中包含的所述子频带；所述子频带包含有连续多个频点，所述连续多个频点中的每个频点的能量值均大于预设的能量阈值；

基于确定的所述每帧信号包含的子频带，将所述每帧信号的频谱划分为多个所述子频带。

S1034，从多个所述子频带中获取目标子频带，所述目标子频带包含的峰值数小于预设峰值数阈值且频带宽度小于预设频带宽度阈值。

需要说明的是，啸叫和大声说话都会导致对应的音频信号的能量值较高，但是二者的频谱有明显的区别，啸叫信号对应的频谱通常包含有一个较大的单峰，且啸叫信息的频带宽度一般较窄而且相对尖锐，而大声说话产生的音频信号对应的频谱通常会形成多个较大的峰，且存在谐波。

可选地，在本实施例中，通过统计每个子频带包含的峰值个数以及每个子频带的频带宽度，可以区分啸叫信号和大声说话产生的音频信号。

具体地，在本实施例中，所述目标子频带对应为啸叫信号的频带，所述目标子频带包含的峰值数小于预设峰值数阈值，例如，预设峰值数阈值为3，且频带宽度小于预设频带宽度阈值，例如，预设频带宽度阈值为100Hz。

S1035，基于所述目标子频带的能量值以及相邻的所述目标子频带之间的频带间隔确定啸叫帧信号。

具体地，由于啸叫和大声说话都会产生较高的能量；可选地，通过计算所述目标子频带的能量值的和，以及确定所述目标子频带的能量值的和占目标音频信号的频谱的总能量的百分比，可以确定目标子频带对应的信号为啸叫帧信号或者由于大声说话产生的音频信号。

进一步地，由于大声说话会产生谐波，而啸叫通常不会产生谐波。在一种可能的实现方式中，通过确定所述目标子频带是否包含有谐波，来确定啸叫帧信号。而谐波与目标子频带之间的频带间隔相关。

具体地，基于所述目标子频带的能量值以及相邻的所述目标子频带之间的频带间隔确定啸叫帧信号，包括：

若所述目标子频带的能量总和占所述目标音频信号的频谱的总能量的百分比大于预设的能量百分比阈值，且每两个相邻所述目标子频带之间的频带间隔不相等，则可判定该帧为啸叫帧信号。

具体地，通过目标子频带的能量总和占所述目标音频信号的频谱的总能量的百分比可以确定出啸叫信号或者由于大声说话产生的音频信号。进一步通过相邻所述目标子频带之间的频带间隔可以确定所述目标子频带是否包含有谐波，若每两个相邻所述目标子频带之间的频带间隔不相等，则确定所述目标子频带不包含有谐波，此时，则可判定该帧为啸叫帧信号。

S104，利用预设的啸叫频点判断准则从所述啸叫帧信号中检测出啸叫频点。

具体地，如图4所示，是图1中S104的具体实施流程图。由图4可知，S104包括：

S1041，将所述目标子频带划分为第一频段和第二频段，所述第二频段的频率高于所述第一频段。

具体地，在本实施例中，为减小后期陷波对人声音质的损害，将所述目标子频带划分为第一频段和第二频段。

可选地，以人声基频为临界点，例如，以1.5KHz为划分临界点，将所述目标子频带划分为0～1.5KHz的第一频段和高于1.5KHz的第二频段。

S1042，基于所述第一频段的峰均功率比为、所述第一频段的峰斜波功率比和所述第一频段的帧间峰值保持度，确定所述第一频段中的第一啸叫频点。

具体地，所述峰均功率比为：PAPR(Peak-to-Average Power Ratio)，用于判断频点功率与平均功率的比，具体通过将频点功率与平均功率的比与预设功率比阈值的比较来确定当前频点是否为啸叫频点。所述峰谐波功率比为：PHPR(Peak-to-Harmonic PowerRatio)，用与判断频点功率与谐波功率的比。所述帧间峰值保持度为：IPMP(Inter-framePeak Magnitude Persistence)，用于判断帧峰持久度特征，通过PAPR、PHPR和IPMP可以确定所述第一频段中是否包含有谐波以及帧峰的持久度，通常啸叫不产生谐波，且啸叫的帧峰持久度大于正常说话的帧峰持久度。

S1043，基于所述第二频段的峰均功率比和所述第二频段的帧间峰值保持度，确定所述第二频段中的第二啸叫频点。

具体地，由于第二频段的频点高于第一频段，在较高频点通常不存在谐波，因此，在本实施例中，通过所述峰均功率比为：PAPR(Peak-to-Average Power Ratio)，用于判断频点功率与平均功率的比，具体通过将频点功率与平均功率的比与预设功率比阈值的比较来确定当前频点是否为啸叫频点。

S105，对所述啸叫频点进行陷波处理，输出陷波处理之后的音频信号。

具体地，基于级联滤波算法分别对所述第一啸叫频点和所述第二啸叫频点进行窄带陷波处理，输出陷波处理之后的帧信号。

可以理解的是，由于人的声音通常在低频段，例如1.5KHz以下，因此在通过滤波器级联对啸叫频点进行陷波处理的过程中，对低频的陷波强度相对于高频的陷波强度较弱，具体地，陷波强度可以通过Q值来标识，具体地：

其中，B是滤波器的带宽，w₀是预先设置的模拟滤波参数。

需要说明的是，当对不同频点进行陷波时，Q值可调，具体地，陷波强度用于表示陷波器在陷波频点的衰减程度，衰减越多，即陷波深度越大。通常，B越小时，陷波深度越大。

在本实施例中，采用多个二阶IIR滤波器(N＝M＝2)级联的方式实现多个频点陷波的功能。实现思路是根据陷波频点f0、陷波带宽B和采样率fs设置滤波系数。具体地，IIR滤波器的输入输出关系为

a₀y(n)＝b₀x(n)+b₁x(n-1)+…b_Nx(n-N)-a₁y(n-1)-…a_My(n-M)

可以理解地，在实际使用中，Q值可以根据实际需要进行调试。

需要说明的是，采用窄带陷波处理时，需要根据陷波频点、陷波带宽和采样率设置滤波参数。在本实施例中，通过采用窄带陷波处理的思想，确定所述啸叫频点对应的滤波器系数，将所述啸叫频点对应的滤波器系数进行级联，实现将啸叫信号依次通过不同的滤波器进行滤波处理，达到对所述啸叫频点进行陷波处理的目的。

具体地，如图5所示，是图1中S105的具体实施流程图。由图5可知，S105包括：

S1051，根据预设的陷波频率、陷波带宽和采样频率设置模拟滤波参数。

具体地，例如，假设预设的陷波频率为f₀、陷波带宽为B、采样频率为f_s，则在一种可实现的实施方式中，设置模拟滤波参数为：

根据预设的转换公式将所述模拟滤波系数转换为数字滤波参数。

具体地，在一种可能的实现方式中，预设的转换公式为：

β＝cosw₀S1053，基于所述数字滤波参数生成滤波器，基于所述滤波器得到数字传递函数，基于所述数字传递函数确定滤波器系数。

具体地，作为示例而非限定，假设所述数字传递函数为：

则根据上述数字传递函数确定的滤波系数为：

b_o＝1+α

b1＝2B

b₂＝1+α

a₀＝1

a₁＝-β(1+α)

a₂＝α

S1054，将所述滤波器系数进行级联生成滤波器组，基于所述滤波器组对所述啸叫频点进行窄带陷波处理，输出陷波处理之后的帧信号。

具体地，通过所述级联滤波函数，可以对所述啸叫频点依次进行陷波处理。

需要说明的是，在窄带陷波中，记录上一帧的啸叫频点对应的滤波系数和输出的数值；若当前帧的啸叫频点出现在记录中，则直接利用记录的滤波系数和输出的数值。若当前帧的啸叫频点没有出现在记录中，则更新记录的滤波系数和输出的数值，直至所有当前帧的啸叫频点出现在记录中。

需要说明的是，当采样频率不同时，采用的陷波频率对应不同，例如，在一种实现方式中，假设采用的音频在频点M产生了啸叫，频点M对应的采样频率为

其中，

为不同于图5所示实施例中的采样频率f_s的采样频率，在本实施例中，为了使图5所示实施例的方法适配于采样频率

将图5所示实施例中的陷波频率对应设置为

即采用陷波频点为

的滤波器进行陷波处理，可完成频点M的音频数据的陷波处理，上述方法通过采用不同陷波频率的滤波器可以进行不同采样率的陷波处理，适用于任意的采样频率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

通过上述分析可知，本申请提出的音频信号处理方法，从检测到的音频信号中获取目标音频信号，所述目标音频信号包括当前帧对应的多个音频信号及与所述当前帧相邻的前一帧的多个音频信号；对所述目标音频信号进行加窗处理后，做傅里叶变换，得到所述目标音频信号的频谱；利用预设的频点聚类算法分析所述目标音频信号的频谱，从所述目标音频信号的频谱中检测出啸叫帧；利用预设的啸叫频点判断准则检测出啸叫频点；对所述啸叫频点进行陷波处理，输出陷波处理之后的音频信号。由于利用预设的频点聚类算法分析目标音频信号的频谱，从目标音频信号的频谱中检测出啸叫信号后，对啸叫信号进行了陷波处理，并输出陷波处理之后的音频信号，能够有效地抑制音频设备的啸叫现象，提高音频设备的音质，提高用户的体验效果。

图6是本申请提供的音频信号处理装置的装置示意图。如图6所示，该实施例的音频信号处理装置6包括：获取模块601、获得模块602、第一检测模块603、第二检测模块604以及陷波模块605。其中，

获取模块601，用于对检测到的音频信号进行分帧处理，获得多帧信号；每帧信号包括当前帧对应的多个音频数据及与所述当前帧相邻的前一帧的多个音频数据；

获得模块602，用于对所述每帧信号分别进行加窗处理后，做傅里叶变换，得到所述每帧信号的频谱；

第一检测模块603，用于利用预设的频点聚类算法分别分析所述每帧信号的频谱，检测出啸叫帧信号；

第二检测模块604，用于利用预设的啸叫频点判断准则从所述啸叫帧信号中检测出啸叫频点；

陷波模块605，用于对所述啸叫频点进行陷波处理，输出陷波处理之后的帧信号。

优选地，第一检测模块603包括：

计算单元，用于计算所述每帧信号的频谱的总能量；

分析单元，用于在若所述频谱的总能量大于预设的能量阈值，则利用预设的频点聚类算法分析所述每帧信号的频谱，从所述每帧信号的频谱中检测出啸叫帧信号。

优选地，分析单元包括：

划分单元，用于在若所述每帧信号的频谱的总能量大于预设的能量阈值，则分别将所述每帧信号的频谱划分为多个子频带；

获取单元，用于从多个所述子频带中获取目标子频带，所述目标子频带包含的峰值数小于预设峰值数阈值且频带宽度小于预设频带宽度阈值；

确定单元，用于基于所述目标子频带的能量值以及相邻的所述目标子频带之间的频带间隔确定啸叫帧信号。

优选地，划分单元包括：

第一确定子单元，用于分别确定所述每帧信号的频谱中包含的所述子频带；所述子频带包含有连续多个频点，所述连续多个频点中的每个频点的能量值均大于预设的能量阈值；

第一划分子单元，用于基于确定的所述每帧信号包含的子频带，将所述每帧信号的频谱划分为多个所述子频带。

优选地，确定单元具体用于：

若所述目标子频带的能量值总和占所述目标音频信号的频谱的总能量值的百分比大于预设的能量值百分比阈值，且每两个相邻所述目标子频带之间的频带间隔不相等，则判定当前帧信号为啸叫帧信号。

优选地，第二检测模块，包括：

第一划分子单元，用于将所述啸叫帧信号的频谱划分为第一频段和第二频段，所述第二频段的频率高于所述第一频段；

第二确定子单元，用于基于所述第一频段的峰均功率比、所述第一频段的峰斜波功率比和所述第一频段的帧间峰值保持度，确定所述第一频段中的第一啸叫频点；

第三确定子单元，用于基于所述第二频段的峰均功率比和所述第二频段的帧间峰值保持度，确定所述第二频段中的第二啸叫频点。

优选地，陷波模块605具体用于：基于级联滤波算法分别对所述第一啸叫频点和所述第二啸叫频点进行窄带陷波处理，输出陷波处理之后的帧信号。

优选地，陷波模块605包括：

设置单元，用于根据预设的陷波频率、陷波带宽和采样频率设置模拟滤波参数；

转换单元，用于根据预设的转换公式将所述模拟滤波参数转换为数字滤波参数；

构建单元，用于基于所述数字滤波参数构建数字传递函数，基于所述数字传递函数确定滤波系数；

处理单元，用于基于所述滤波系数生成级联滤波函数，基于所述级联滤波函数对所述啸叫频点进行窄带陷波处理，输出陷波处理之后的帧信号。

图7是本申请提供的计算设备的示意图。如图7所示，该实施例的计算设备7包括：处理器70、存储器71以及存储在所述存储器71中并可在所述处理器70上运行的计算机程序72，例如音频信号处理程序。所述处理器70执行所述计算机程序72时实现上述各个音频信号处理方法实施例中的步骤，例如图1所示的步骤101至105。或者，所述处理器70执行所述计算机程序72时实现上述样本音频信号处理装置实施例中各模块/单元的功能，例如图6所示模块601至605的功能。

示例性的，所述计算机程序72可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器71中，并由所述处理器70执行，以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序72在所述计算设备7中的执行过程。例如，所述计算机程序72可以被分割成获取模块、获得模块、第一检测模块、第二检测模块、以及陷波模块(虚拟装置中的模块)，各模块具体功能如下：

获取模块，用于从检测到的音频信号中获取目标音频信号，所述目标音频信号包括当前帧对应的多个音频信号及与所述当前帧相邻的前一帧的多个音频信号；

获得模块，用于对所述目标音频信号进行加窗处理后，做傅里叶变换，获得所述目标音频信号的频谱；

第一检测模块，用于用于利用预设的频点聚类算法分别分析所述每帧信号的频谱，检测出啸叫帧信号；；

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个通信单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种音频信号处理方法，其特征在于，包括：

对所述每帧信号分别进行加窗处理后，做傅里叶变换，得到所述每帧信号的频谱；

对所述啸叫频点进行陷波处理，输出陷波处理之后的帧信号；

所述利用预设的频点聚类算法分别分析所述每帧信号的频谱，检测出啸叫帧信号，包括：计算所述每帧信号的频谱的总能量；若所述每帧信号的频谱的总能量大于预设的能量阈值，则利用预设的频点聚类算法分析所述每帧信号的频谱，从所述每帧信号的频谱中检测出啸叫帧信号；

所述若所述每帧信号的频谱的总能量大于预设的能量阈值，则利用预设的频点聚类算法分析所述每帧信号的频谱，从所述每帧信号的频谱中检测出啸叫帧信号，包括：若所述每帧信号的频谱的总能量大于预设的能量阈值，则分别将所述每帧信号的频谱划分为多个子频带；从多个所述子频带中获取目标子频带，所述目标子频带包含的峰值数小于预设峰值数阈值且频带宽度小于预设频带宽度阈值；基于所述目标子频带的能量值以及与相邻的所述目标子频带之间的频带间隔确定啸叫帧信号；

所述预设的频点聚类算法为通过将所述每帧信号的频带划分为多个子频带，将每个子频带称为频点聚类算法的一个类；如果当前类的终点和下一个类的起点之间的距离小于预设的距离阈值，则将当前类与下一个类进行聚类，得到频点聚类的结果。

2.如权利要求1所述的音频信号处理方法，其特征在于，所述子频带包含有连续多个频点，且所述连续多个频点中每个频点的能量值均大于预设的能量阈值。

3.如权利要求1所述的音频信号处理方法，其特征在于，所述基于所述目标子频带的能量值以及相邻的所述目标子频带之间的频带间隔确定啸叫帧信号，包括：

若所述目标子频带的能量值的总和占目标音频信号的频谱的总能量值的百分比大于预设的能量值百分比阈值，且每两个相邻所述目标子频带之间的频带间隔不相等，则判定当前帧信号为啸叫帧信号；

所述目标音频信号包括所述当前帧对应的多个音频信号及与所述当前帧相邻的前一帧的多个音频信号。

4.如权利要求1所述的音频信号处理方法，其特征在于，所述利用预设的啸叫频点判断准则从所述啸叫帧信号中检测出啸叫频点，包括：

5.如权利要求4所述的音频信号处理方法，其特征在于，所述对所述啸叫频点进行陷波处理，输出陷波处理之后的帧信号，包括：

6.如权利要求5所述的音频信号处理方法，其特征在于，所述滤波器级联方法，包括：

基于所述数字滤波参数生成滤波器，基于所述滤波器得到数字传递函数，基于所述数字传递函数确定滤波器系数；

7.一种音频信号处理装置，其特征在于，包括：

陷波模块，用于对所述啸叫频点进行陷波处理，输出陷波处理之后的帧信号；

8.一种计算设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述音频信号处理方法的步骤。