CN116805999A

CN116805999A - 音频发射端的啸叫检测方法、系统、编码方法及编码器

Info

Publication number: CN116805999A
Application number: CN202310761506.3A
Authority: CN
Inventors: 李强; 王尧; 叶东翔; 朱勇
Original assignee: Bairui Interconnection Integrated Circuit Shanghai Co ltd
Current assignee: Bairui Interconnection Integrated Circuit Shanghai Co ltd
Priority date: 2023-06-27
Filing date: 2023-06-27
Publication date: 2023-09-26

Abstract

本申请公开了一种音频发射端的啸叫检测方法、系统、编码方法及编码器，属于蓝牙音频技术领域。该方法包括：在音频编码过程中确定音频帧的第一谱系数；根据第一谱系数计算倒谱系数，并对倒谱系数进行优化；将优化后的倒谱系数变换得到第二谱系数，并根据第二谱系数进行啸叫检测。本申请在根据谱系数进行啸叫检测之前，首先根据谱系数进行倒谱系数的计算，然后对倒谱系数进行优化，避免其他因素对啸叫检测产生影响，然后将优化后的倒谱系数转换得到谱系数，再进行啸叫检测，提高啸叫检测的准确性。

Description

音频发射端的啸叫检测方法、系统、编码方法及编码器

技术领域

本申请涉及蓝牙音频技术领域，特别涉及一种音频发射端的啸叫检测方法、系统、编码方法及编码器。

背景技术

在无线音频的应用过程中，譬如说基于蓝牙的卡拉OK、基于蓝牙的无线麦克风/音箱等，从数据流的角度，从扬声器到麦克风的反馈路径中，当系统在增益增大到一定状态时有可能趋于不稳定，产生自激振荡发生啸叫。为了避免啸叫的产生，现有方案中基于频域的方法检测较为准确使用广泛，但其需要完成时频变换，再基于频域得到的特征来检测啸叫，运算量较大，与低功耗蓝牙音频的核心理念不符。另外，现有技术在进行是否存在啸叫的判断时，是基于啸叫发生时，通常会出现一个或多个单频正弦波的啸叫频率。然而在没有发生啸叫时，语音通话中的浊音中也有较强的谐波成分，这些谐波成分与正弦波有类似的频率特性，因此会导致啸叫检测的误判，导致啸叫检测错误。

发明内容

针对在进行啸叫检测时，存在检测误判的问题，本申请提出一种音频发射端的啸叫检测方法、系统、编码方法及编码器。

第一方面，本申请提出一种音频发射端的啸叫检测方法，包括：在音频编码过程中确定音频帧的第一谱系数；根据第一谱系数计算倒谱系数，并对倒谱系数进行优化；将优化后的倒谱系数变换得到第二谱系数，并根据第二谱系数进行啸叫检测。

可选的，对倒谱系数进行优化，包括：在倒谱系数上进行浊音谐波的检测，在存在浊音谐波的条件下，对倒谱系数进行优化。

可选的，在倒谱系数上进行浊音谐波的检测，在存在浊音谐波的条件下，对倒谱系数进行优化，包括：在基音范围内确定倒谱系数的最大值；将倒谱系数最大值与预设门限值进行比较，其中在倒谱系数最大值大于或等于预设门限值的条件下，存在浊音谐波，对倒谱系数优化。

可选的，在倒谱系数最大值大于或等于预设门限值的条件下，对倒谱系数优化，包括：确定倒谱系数的倒谱系数优化区间，并将倒谱系数优化区间内的倒谱系数修改为优化值，倒谱系数优化区间外的倒谱系数维持不变。

可选的，确定倒谱系数的倒谱系数优化区间，包括：确定倒谱系数最大值对应的倒谱索引；以倒谱索引为基准，确定倒谱索引优化区间，其中倒谱索引位于倒谱索引优化区间内，倒谱索引优化区间与倒谱系数优化区间对应。

第二方面，本申请提出一种音频发射端的啸叫检测系统，包括：倒谱系数优化模块，其对音频编码过程中确定的音频帧的第一谱系数进行计算，得到倒谱系数，并对倒谱系数进行优化；啸叫检测模块，其将优化后的倒谱系数变换得到第二谱系数，并根据第二谱系数进行啸叫检测。

第三方面，本申请提出一种音频编码方法，包括：在音频编码过程中确定音频帧的第一谱系数；根据第一谱系数计算倒谱系数，并对倒谱系数进行优化；将优化后的倒谱系数变换得到第二谱系数，并根据第二谱系数进行啸叫检测；若存在啸叫，则进行啸叫抑制，并进行后续的编码过程。

第四方面，本申请提出一种计算机可读存储介质，其存储有计算机程序，其中计算机程序被操作以执行方案一中的音频发射端的啸叫检测方法或方案三中的音频编码方法。

第五方面，本申请提出一种计算机设备，其包括处理器和存储器，存储器存储有计算机程序，其中：处理器操作计算机程序以执行方案一中的音频发射端的啸叫检测方法或方案三中的音频编码方法。

本申请在根据谱系数进行啸叫检测之前，首先根据谱系数进行倒谱系数的计算，然后对倒谱系数进行优化，避免其他因素对啸叫检测产生影响，然后将优化后的倒谱系数转换得到谱系数，再进行啸叫检测，提高啸叫检测的准确性。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图示例性的示出了本申请的一些实施例。

图1是本申请音频发射端的啸叫检测方法的一个实施方式的示意图；

图2是不含语音的啸叫幅度谱及其倒谱的示意图；

图3是纯净语音的幅度谱及其倒谱的示意图；

图4是本申请音频发射端的啸叫检测系统的一个实施方式的示意图；

图5是本申请音频编码方法的一个实施方式的示意图；

图6是本申请音频编码过程的一个实例的示意图。

通过上述附图，已示出本申请明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围，而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

下面结合附图对本申请的较佳实施例进行详细阐述，以使本申请的优点和特征能更易于被本领域技术人员理解，从而对本申请的保护范围做出更为清楚明确的界定。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

在无线音频的应用过程中，譬如说基于蓝牙的卡拉OK、基于蓝牙的无线麦克风/音箱等，从数据流的角度，从扬声器到麦克风的反馈路径中，当系统在增益增大到一定状态时有可能趋于不稳定，产生自激振荡发生啸叫。为了避免啸叫的产生，现有方案中基于频域的方法检测较为准确使用广泛，但其需要完成时频变换，再基于频域得到的特征来检测啸叫，运算量较大，与低功耗蓝牙音频的核心理念不符。另外，现有技术在进行是否存在啸叫的判断时，是基于啸叫发生时，通常会出现一个或多个单频正弦波的啸叫频率。然后在没有发生啸叫时，语音通话中的浊音中也有较强的谐波成分，这些谐波成分与正弦波有类似的频率特性，因此会导致啸叫检测的误判，导致啸叫检测错误。

针对上述问题，本申请提出一种音频发射端的啸叫检测方法、系统、编码方法及编码器，该方法包括：在音频编码过程中确定音频帧的第一谱系数；根据第一谱系数计算倒谱系数，并对倒谱系数进行优化；将优化后的倒谱系数变换得到第二谱系数，并根据第二谱系数进行啸叫检测。

本申请在根据谱系数进行啸叫检测之前，首先根据谱系数进行倒谱系数的计算，然后对倒谱系数进行优化，通过对浊音谐波等影响啸叫检测准确性的因素进行滤除，避免浊音谐波对啸叫检测的影响，然后将优化后的倒谱系数转换得到新的谱系数，再进行啸叫的检测，提高啸叫检测的准确性。

下面，以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面述及的具体的实施例可以相互结合形成新的实施例。对于在一个实施例中描述过的相同或相似的思想或过程，可能在其他某些实施例中不再赘述。下面将结合附图，对本申请的实施例进行描述。

图1是本申请音频发射端的啸叫检测方法的一个实施方式的示意图。

在图1所示的实施方式中，本申请的音频发射端的啸叫检测方法包括过程S101，在音频编码过程中确定音频帧的第一谱系数。

在该实施方式中，在编码过程中对输入的音频PCM信号执行分帧、加窗和低延迟改进型离散余弦变换，得到音频帧对应的离散余弦变换谱系数，也就是第一谱系数。

具体的，t(n)＝x_s(Z-N_F+n),for n＝0…2·N_F-1-Z

t(2N_F-Z+n)＝0,for n＝0…Z-1

其中x_s(n)是输入音频信号，是LC3中的分析窗，X(k)是MDCT谱系数。

在图1所示的实施方式中，本申请的音频发射端的啸叫检测方法包括过程S102，根据第一谱系数计算倒谱系数，并对倒谱系数进行优化。

在该实施方式中，在得到离散余弦变换谱系数后，将谱系数计算得到倒谱系数，然后根据倒谱系数对其他影响啸叫检测的因素进行滤除，对倒谱系数进行优化。

在该可选实施例中，因为语音通话时，浊音有较强的谐波成分。浊音谐波的存在会使啸叫检测的结果产生误判，影响检测的准确性，因此本申请通过在倒谱系数中将浊音进行消除，从而避免浊音的影响，提高啸叫检测的准确率。

具体的，图2是不含语音的啸叫幅度谱及其倒谱的示意图。

在图2所示的实例中，从啸叫幅度谱可以看出，当产生啸叫时有一个峰值，根据这个峰值很容易判断啸叫是存在的。另外，从啸叫倒谱可以看出，其在50～500Hz范围的倒谱值都很小，几乎小于0.02。

图3是纯净语音的幅度谱及其倒谱的示意图。

在图3所示的实例中，语音中的浊音也会导致语音幅度谱中出现峰值，与图2所示的啸叫幅度谱有着相似的现象。语音幅度谱的峰值(277.4)可能超过图2所示的啸叫幅度谱的峰值(216.2)。此时根据幅度谱中的峰值来判断是否有啸叫有可能产生误判。

但是在图3所示的语音倒谱中，倒谱的峰值0.0736，远远大于图2所示的啸叫倒谱峰值，其峰值小于0.02。因此本申请通过两者在倒谱峰值上的不同，对倒谱系数进行优化，去除浊音谐波对啸叫检测的影响，提高啸叫检测的准确性。

可选的，在倒谱系数上进行浊音谐波的检测，在存在浊音谐波的条件下，对倒谱系数进行优化，包括：在基音范围内确定倒谱系数的最大值；将倒谱系数最大值与预设门限值进行比较，其中在倒谱系数最大值大于或等于预设门限值的条件下，则存在浊音谐波，对倒谱系数优化。

在该可选实施例中，在对倒谱系数进行浊音谐波的滤除，进行倒谱系数的优化时，首先确定音频中是否有浊音谐波的存在。在得到音频帧对应的倒谱系数后，在基音范围内确定倒谱系数的最大值，通过最大值与预设门限值的比较，在最大值大于或等于预设门限值的条件下，则说明音频中存在浊音谐波，需要将浊音谐波进行滤除，然后再进行后续的啸叫检测过程。

具体的，在计算倒谱系数时，以第m帧音频为例，首先计算幅度谱对数：

其中X_m(k)表示第m帧的谱系数；

再计算倒谱系数：

然后在基因范围内搜索倒谱系数的最大值，其中基音范围通常是50～500Hz之间，所以可以搜索倒频范围是[BW/500，BW/50]，即[16，160)，其中BW是奈奎斯特带宽。

I_max＝max(C_m(n)),n＝16～159

再将最大索引对应的倒谱与预设门限比较：

其中预设门限值，可以根据典型的语音浊音的倒谱值统计得出，譬如设为0.025。

可选的，在倒谱系数最大值大于或等于预设门限值的条件下，对倒谱系数优化，包括：确定倒谱系数的倒谱系数优化区间，其中将倒谱系数优化区间内的倒谱系数修改为优化值，将倒谱系数优化区间外的倒谱系数维持不变。

在该可选实施例中，在确定存在浊音谐波时，在倒谱系数中对浊音谐波进行滤除时，要确定进行优化的倒谱系数的区间，然后将该区间内的倒谱系数修正为相应的优化值，而该区间外的倒谱系数维持不变。

在该可选实施例中，在对倒谱系数进行优化以对浊音谐波的影响进行消除。其中因为浊音谐波的存在，导致倒谱系数的最大值存在变化，因此在进行优化区间的确定时，也以倒谱系数的最大值为依据，以最大值对应的倒谱索引进行优化区间的确定。例如，可以以最大值对应的索引为中心，确定一定范围的优化区间等。

具体的，在确定存在浊音谐波后，确定浊音谐波对应的倒谱系数的最大值，得到相应的索引值，确定优化区间。将优化区间内的倒谱系数设置为优化值，例如设置为0，进行倒谱系数的优化。

具体的，如果不存在浊音谐波，则基于下面的Y(k)来检测啸叫：

Y(k)＝Y_m(k),k＝0…N_F-1，

如果存在浊音谐波，则基于下面的Y(k)来检测啸叫：

由于上述谱系数中已经消除了浊音谐波的影响，所以在检测啸叫时比较准确。其中浊音清除谱系数计算方法如下：

首先更新倒谱系数，将倒谱系数中与浊音谐波相关的系数置0

其次根据新的倒谱系数，求取对应的浊音清除后的谱系数

上面的公式中，I_max表示倒谱系数最大值对应的索引，因此优化区间为[I_max-2，I_max+2]，在该区间内的倒谱系数设定为0，从而消除浊音谐波的影响。

具体的，在对优化区间内的倒谱系数进行优化时，可对该优化区间内的倒谱系数进行衰减，或者直接设置为一个较小的值，例如上述实施例中，将倒谱系数设置为0。另外，优化区间的确定时，优化区间的范围可根据实际情况进行适当调整，上面的实例中，以最大值对应的索引分别左右扩展两个单位的长度，得到优化区间，其中也可根据实际情况进行优化区间的调整，例如优化区间设定为[I_max-3，I_max+3]，[I_max-1，I_max+1]等。

在图1所示的实施方式中，本申请的音频发射端的啸叫检测方法包括过程S103，将优化后的倒谱系数变换得到第二谱系数，并根据第二谱系数进行啸叫检测。

在该实施方式中，在得到优化后的第二谱系数后，如上述实施例中的然后根据优化后的谱系数进行啸叫检测。其中根据谱系数进行啸叫检测，可以基于现有技术的谱熵法进行啸叫检测，其检测过程简述如下：划分子带、计算子带能量及子带总能量、计算每个子带的能量概率、计算子带谱熵，根据谱熵与预定门限判决是否发生啸叫并输出啸叫标志和啸叫位置。此为成熟技术，不再赘述。

本申请音频发射端的啸叫检测方法，在倒谱系数中进行浊音谐波的检测并进行倒谱系数的优化，将浊音谐波等影响啸叫检测的因素进行滤除，从而在进行啸叫检测时，提高啸叫检测的准确性。

图4是本申请音频发射端的啸叫检测系统的一个实施方式的示意图。

在图4所示的实施方式中，本申请的音频发射端的啸叫检测系统包括：倒谱系数优化模块401，其对音频编码过程中确定的音频帧的第一谱系数进行计算，得到倒谱系数，并对倒谱系数进行优化；啸叫检测模块402，其将优化后的倒谱系数变换得到第二谱系数，并根据第二谱系数进行啸叫检测。

可选的，在倒谱系数优化模块401中，在倒谱系数上进行浊音谐波的检测，在存在浊音谐波的条件下，对倒谱系数进行优化。

可选的，在倒谱系数优化模块401中，在基音范围内确定倒谱系数的最大值；将倒谱系数最大值与预设门限值进行比较，其中在倒谱系数最大值大于或等于预设门限值的条件下，存在浊音谐波，对倒谱系数优化。

可选的，在倒谱系数优化模块401中，确定倒谱系数的倒谱系数优化区间，并将倒谱系数优化区间内的倒谱系数修改为优化值，倒谱系数优化区间外的倒谱系数维持不变。

可选的，在倒谱系数优化模块401中，确定倒谱系数最大值对应的倒谱索引；以倒谱索引为基准，确定倒谱索引优化区间，其中倒谱索引位于倒谱索引优化区间内，倒谱索引优化区间与倒谱系数优化区间对应。

图5是本申请音频编码方法的一个实施方式的示意图。

在图5所示的实施方式中，本申请的音频编码方法包括：过程S501，在音频编码过程中确定音频帧的第一谱系数；过程S502，根据谱系数计算倒谱系数，并对倒谱系数进行优化；过程S503，将优化后的倒谱系数变换得到第二谱系数，并根据第二谱系数进行啸叫检测；过程S504，若存在啸叫，则进行啸叫抑制，并进行后续的编码过程。

具体的，图6是本申请音频编码过程的一个实例的示意图。

如图6所示，本申请的啸叫检测过程充分利用音频编码器已有的信息，使用编码过程中输出的谱系数进行啸叫检测，避免了时域到频域的转换、复用编解码器已有的低延迟改进型离散余弦逆变换避免增加相关的代码，复杂度低，计算量小。如图6所示，在进行低延迟改进型离散余弦变换后得到谱系数，利用谱系数计算倒谱系数，然后在倒谱系数中进行浊音谐波的抑制，然后再进行低延迟改进型离散余弦逆变换，得到优化后的谱系数再进行后续的啸叫检测过程，提高啸叫检测的准确性。

在本申请的一个实施方式中，一种音频编码器，其包括上述任一实施例的音频发射端的啸叫检测系统。

在本申请的一个实施方式中，一种计算机可读存储介质，其存储有计算机指令，其中计算机指令被操作以执行任一实施例描述的音频发射端的啸叫检测方法或音频编码方法。其中，该存储介质可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。

软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器，使得处理器可从存储介质读取信息和向存储介质写入信息。

处理器可以是中央处理单元(英文：Central Processing Unit，简称：CPU)，还可以是其他通用处理器、数字信号处理器(英文：Digital Signal Processor，简称：DSP)、专用集成电路(英文：Application Specific Integrated Circuit，简称：ASIC)、现场可编程门阵列(英文：Field Programmable Gate Array，简称：FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器，但在替代方案中，处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合，例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中，存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中，处理器和存储介质可作为离散组件驻留在用户终端中。

在本申请的一个具体实施方式中，一种计算机设备，其包括处理器和存储器，存储器存储有计算机指令，其中：处理器操作计算机指令以执行任一实施例描述的音频发射端的啸叫检测方法或音频编码方法。

在本申请所提供的实施方式中，应该理解到，所揭露的装置，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上仅为本申请的实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种音频发射端的啸叫检测方法，其特征在于，包括：

在音频编码过程中确定音频帧的第一谱系数；

根据所述第一谱系数计算倒谱系数，并对所述倒谱系数进行优化；

将优化后的所述倒谱系数变换得到第二谱系数，并根据所述第二谱系数进行啸叫检测。

2.根据权利要求1所述的音频发射端的啸叫检测方法，其特征在于，所述对所述倒谱系数进行优化，包括：

在所述倒谱系数上进行浊音谐波的检测，在存在浊音谐波的条件下，对所述倒谱系数进行优化。

3.根据权利要求2所述的音频发射端的啸叫检测方法，其特征在于，所述在所述倒谱系数上进行浊音谐波的检测，在存在浊音谐波的条件下，对所述倒谱系数进行优化，包括：

在基音范围内确定所述倒谱系数的最大值；

将倒谱系数最大值与预设门限值进行比较，其中

在所述倒谱系数最大值大于或等于所述预设门限值的条件下，存在浊音谐波，对所述倒谱系数优化。

4.根据权利要求3所述的音频发射端的啸叫检测方法，其特征在于，所述在所述倒谱系数最大值大于或等于所述预设门限值的条件下，对所述倒谱系数优化，包括：

确定所述倒谱系数的倒谱系数优化区间，并将所述倒谱系数优化区间内的所述倒谱系数修改为优化值，所述倒谱系数优化区间外的所述倒谱系数维持不变。

5.根据权利要求4所述的音频发射端的啸叫检测方法，其特征在于，所述确定所述倒谱系数的倒谱系数优化区间，包括：

确定所述倒谱系数最大值对应的倒谱索引；

以所述倒谱索引为基准，确定倒谱索引优化区间，其中所述倒谱索引位于所述倒谱索引优化区间内，所述倒谱索引优化区间与所述倒谱系数优化区间对应。

6.一种音频发射端的啸叫检测系统，其特征在于，包括：

倒谱系数优化模块，其对音频编码过程中确定的音频帧的第一谱系数进行计算，得到倒谱系数，并对所述倒谱系数进行优化；

啸叫检测模块，其将优化后的所述倒谱系数变换得到第二谱系数，并根据所述第二谱系数进行啸叫检测。

7.一种音频编码方法，其特征在于，包括：

在音频编码过程中确定音频帧的第一谱系数；

将优化后的所述倒谱系数变换得到第二谱系数，并根据所述第二谱系数进行啸叫检测；

若存在啸叫，则进行啸叫抑制，并进行后续的编码过程。

8.一种音频编码器，其特征在于，包括如权利要求6所述的音频发射端的啸叫检测系统。

9.一种计算机可读存储介质，其存储有计算机程序，其中所述计算机程序被操作以执行权利要求1-5中任一项所述的音频发射端的啸叫检测方法。

10.一种计算机设备，其包括处理器和存储器，所述存储器存储有计算机程序，其中：所述处理器操作所述计算机程序以执行权利要求1-5中任一项所述的音频发射端的啸叫检测方法。