WO2024093307A1

WO2024093307A1 - 音频处理方法、装置、电子设备和计算机可读存储介质

Info

Publication number: WO2024093307A1
Application number: PCT/CN2023/103752
Authority: WO
Inventors: 李倩
Original assignee: 恒玄科技(上海)股份有限公司
Priority date: 2022-11-04
Filing date: 2023-06-29
Publication date: 2024-05-10
Also published as: CN115835093A

Abstract

本申请提供了一种音频处理方法、装置、电子设备及计算机可读存储介质，涉及语音处理领域。其中，音频处理方法包括：获取当前采样时段的音频输入信号，对音频输入信号进行音频信号处理得到音频输出信号，将音频输出信号进行播放；音频信号处理包括：获取前音频输出信号，前音频输出信号为前一采样时段的音频输出信号，根据前音频输出信号获取反馈信号，根据反馈信号对音频输入信号进行信号补偿得到补偿音频信号，对补偿音频信号的相位进行非线性调制。与现有技术相比，本申请所提供的音频处理方法、装置、电子设备和计算机可读存储介质，能够在消除啸叫的同时减少扬声器播放的音频信号失真。

Description

音频处理方法、装置、电子设备和计算机可读存储介质

技术领域

本发明涉及语音通信领域，具体而言，涉及一种音频处理方法、装置、电子设备和计算机可读存储介质。

背景技术

随着技术的发展，耳机、扩音器、辅听产品等音频设备得到广泛的应用。然而，为了达到降噪、扩音、辅听等不同功能，在现有的音频设备中会同时安装配备麦克风和扬声器。在这种同时安装配备麦克风和扬声器的音频设备中，由扬声器播放的声音会被麦克风回采，声通路形成闭合回路，信号在声反馈回路中不断叠加放大形成正反馈，产生单频的啸叫。为了从根本上消除啸叫，现有的回声抑制方案需要将扬声器反馈到麦克风的反馈信号从麦克风采集的音频信号中消除，但是由于麦克风和扬声器之间距离较近，反馈路径较短，麦克风输入信号和扬声器播放的参考信号的相关性较强，现有的回声抑制方案会导致扬声器播放的佩戴者自己的语音信号失真，影响用户体验。

发明内容

本发明的目的包括，例如，提供了一种音频处理方法、装置、电子设备和计算机可读存储介质，其能够在消除啸叫的同时减少扬声器播放的音频信号失真。

本发明的实施例可以这样实现：第一方面，本发明提供一种音频处理方法，应用于包括音频输入设备和音频输出设备的音频处理装置，所述方法包括：获取当前采样时段所述音频输入设备采集的音频输入信号，对所述音频输入信号进行音频信号处理得到音频输出信号，将所述音频输出信号经由所述音频输出设备进行播放；所述音频信号处理至少包括：获取前音频输出信号，所述前音频输出信号为前一采样时段的所述音频输出信号，根据所述前音频输出信号获取反馈信号，根据所述反馈信号对所述音频输入信号进行信号补偿得到补偿音频信号，对所述补偿音频信号的相位进行非线性调制。

在可选的实施方式中，所述音频信号处理还包括：获取前补偿音频信号，所述前补偿音频信号为前一采样时段的补偿音频信号；根据所述前音频输出信号和所述前补偿音频信号计算得到反馈频响数据，判断所述反馈频响数据是否大于预设频响数据；若所述反馈频响数据大于预设频响数据，执行对所述补偿音频信号的相位进行非线性调制。

在可选的实施方式中，所述根据所述前音频输出信号和所述前补偿音频信号计算得到反馈频响数据，包括：获取前反馈频响数据，所述前反馈频响数据为前一采样时段的所述反馈频响数据；根据所述前音频输出信号、所述补偿音频信号、以及所述前反馈频响数据计算得到当前采样时段的所述反馈频响数据。

在可选的实施方式中，所述根据所述前音频输出信号、所述前补偿音频信号、以及所述前反馈频响数据计算得到当前采样时段的所述反馈频响数据，包括：根据预设反馈路径长度确定采样数量K；获取与当前采样时段相邻的K个采样时段的所述音频输出信号形成音频输出阵列；根据所述音频输出阵列、所述补偿音频信号、以及所述前反馈频响数据计算得到当前采样时段的所述反馈频响数据。

在可选的实施方式中，所述对所述补偿音频信号的相位进行非线性调制，包括：根据频率大小对所述补偿音频信号进行子带分解，得到多个子带信号；根据第一调制方法分别对各个所述子带信号的相位进行非线性调制，得到多个调制子带信号；将所述多个调制子带信号进行信号合成。

在可选的实施方式中，所述对所述补偿音频信号的相位进行非线性调制，包括：根据频率大小对所述补偿音频信号进行子带分解，得到多个子带信号；分别对各个所述子带信号进行卷积和限幅处理；将所述卷积和限幅处理后的所述多个子带信号进行信号合成，得到合成信号；根据第一调制方法对所述合成信号的相位进行非线性调制。

在可选的实施方式中，所述第一调制方法，包括：获取第一调制参数和第二调制参数，根据所述第一调制参数和所述第二调制参数构建第一调制公式，所述第一调制参数用于调整所述第一调制公式的非线性程度，所述第二调制参数用于调整所述第一调制公式的斜率；使用所述第一调制公式进行非线性调制。

在可选的实施方式中，所述对所述补偿音频信号的相位进行非线性调制，包括：根据频率大小对所述补偿音频信号进行子带分解，得到多个子带信号；获取频率大于预设频率的所述子带信号作为目标子带信号；根据第二调制方法分别对各个所述目标子带信号的相位进行非线性调制，得到多个调制子带信号；将除所述目标子带信号外的所述子带信号和所述调制子带信号进行信号合成。

在可选的实施方式中，所述对所述补偿音频信号的相位进行非线性调制，包括：根据频率大小对所述补偿音频信号进行子带分解，得到多个子带信号；获取频率大于预设频率的所述子带信号作为目标子带信号；将所述目标子带信号进行信号合成，得到第一合成信号；根据第二调制方法对第一合成信号的相位进行非线性调制，得到第一调制合成信号；将除所述目标子带信号外的所述子带信号和所述第一调制合成信号进行信号合成。

在可选的实施方式中，所述第二调制方法，包括：获取第一调制参数，根据所述第一调制参数构建第二调制公式，所述第一调制参数用于调整所述第二调制公式的非线性程度；使用所述第二调制公式进行非线性调制。

第二方面，本发明提供一种音频处理装置，包括：音频输入模块，所述音频输入模块用于采集音频输入信号；处理模块，所述处理模块用于获取当前采样时段所述音频输入模块采集的音频输入信号，对所述音频输入信号进行音频信号处理得到音频输出信号，所述音频信号处理至少包括：获取前音频输出信号，所述前音频输出信号为前一采样时段的所述音频输出信号，根据所述前音频输出信号获取反馈信号，根据所述反馈信号对所述音频输入信号进行信号补偿得到补偿音频信号，对所述补偿音频信号的相位进行非线性调制；音频输出模块，所述音频输出模块用于对所述音频输出信号进行播放；存储模块，所述存储模块用于存储所述前音频输出信号。

第三方面，本发明提供一种电子设备，包括：音频输入设备、音频输出设备、至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如前述实施方式中任意一项所述的音频处理方法。

第四方面，本发明提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行实现前述实施方式中任意一项所述的音频处理方法。

与现有技术相比，本发明实施例所提供的音频处理方法、装置、电子设备和计算机可读存储介质中，音频输入设备采集到音频输入信号后，根据前音频输出信号获取反馈信号，前音频输出信号即为前一采样时段经由音频输出设备进行播放的音频输出信号，根据前音频输出信号获取得到的反馈信号即为预估的前音频输出信号经由音频输出设备进行播放后被音频输入设备重新采集的部分形成的信号，根据反馈信号对音频输入信号进行信号补偿，即可消除音频输入信号中所包含的音频输出设备播放的音频被重新采集的部分，如此得到的补偿音频信号即为实际的环境音频的音频信号，将补偿音频信号作为音频输出信号进行播放既可有效的消除可能产生的啸叫；此外，由于音频处理是一个连续的过程，当前采样时段得到的音频输出信号会在下一采样时刻作为前音频输出信号对下一采样时刻采集到的音频输入信号进行音频信号处理，对补偿音频信号的相位进行非线性调制，可以增大补偿音频信号与下一采样时刻采集到的音频输入信号的差异度，从而避免补偿音频信号与下一采样时刻采集到的音频输入信号的音频内容相似度过高、导致对下一采样时刻采集到的音频输入信号进行信号补偿时消除了过多的音频内容，从而减少信号补偿过程可能导致的音频失真，实现在消除啸叫的同时减少音频信号失真的效果。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为实施例一所提供的音频处理方法的流程示意图；

图2为实施例一所提供的音频处理方法中音频信号处理的流程示意图；

图3为实施例一所提供的音频处理方法中第一调制公式的频率-相位响应图像的示意图；

图4为实施例一所提供的音频处理方法中第二调制公式的频率-相位响应图像的示意图；

图5为另一实施例所提供的音频处理方法中音频信号处理的流程示意图；

图6为实施例二所提供的音频处理装置的结构示意图；

图7为实施例三所提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

在本发明的描述中，需要说明的是，若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，或者是该发明产品使用时惯常摆放的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，若出现术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

需要说明的是，在不冲突的情况下，本发明的实施例中的特征可以相互结合。

本发明实施例一提供了一种音频处理方法，应用于包括音频输入设备和音频输出设备的音频处理装置，如图1所示，包括以下步骤：

步骤S101：获取当前采样时段音频输入设备采集的音频输入信号。

在本步骤中，音频输入设备持续采集外界音频，每间隔一个预设的采样时长将这一采样时段内采集的外界音频数据整合形成音频输入信号。

步骤S102：对音频输入信号进行音频信号处理得到音频输出信号。

在本步骤中，音频信号处理过程如图2所示，包括以下步骤：

步骤S201：获取前音频输出信号。

具体的，前音频输出信号即为当前采样时段的前一采样时段的音频输出信号。

步骤S202：根据前音频输出信号获取反馈信号。

具体的，在本实施例中，可以用归一化LMS算法编写算法滤波器，从而建立滤波预估反馈路径，将前音频输出信号与滤波预估反馈路径相卷积，得到反馈信号。反馈信号即为预估的前音频输出信号经由音频输出设备播放后可能被音频输入设备重新采集的音频信号。可以理解的是，前述仅为本实施例中获取反馈信号的一种具体的举例说明，并不构成限定，在本发明的其它实施例中，也可以使用其它方法，例如通过测量设备预先测量音频输入设备和音频输出设备之间的音频反馈参数，使用时根据已经测量得到的音频反馈参数得到反馈信号等其它方法，具体可以根据实际需要进行灵活的使用。

步骤S203：根据反馈信号对音频输入信号进行信号补偿得到补偿音频信号。

具体的，在本步骤中，将反馈信号从当前采样时刻的音频输入信号中去除，即可得到回声啸叫消除后的补偿音频信号。

步骤S204：对补偿音频信号的相位进行非线性调制。

具体的，在本步骤中，预先根据频率大小对补偿音频信号进行子带分解，分解后得到多个不同频率的子带信号，然后根据第一调制方法分别对各个子带信号的相位进行非线性调制，得到多个调制子带信号；将多个调制子带信号进行信号合成得到当前采样时段的音频输出信号。其中，第一调制方法为使用第一调制公式对各个子带信号的相位进行非线性调制，第一调制公式包括第一调制参数和第二调制参数，第一调制参数用于调整第一调制公式的非线性程度，第二调制参数用于调整第一调制公式的斜率。

进一步的，在本发明的一种实施例中，第一调制公式为：

其中，α为第一调制参数，α的大小影响第一调制公式的非线性程度，β为第二调制参数，β的大小影响第一调制公式的斜率，H(z)为不同频率对应的需调整的相位大小，Z为频率，N为预设常数。

具体的，如图3所示为α设置为0.4、β设置为0.6时，第一调制公式的频率-相位响应图像的示意图。如图3所示，第一调制公式在高频部分(大于1.0×10⁴Hz的部分)的相位调节非线性程度较之低频部分(小于0.5×10⁴Hz的部分)的相位调节非线性程度更大，由于人类听觉系统通常对于低频的相位非线性变化比较敏感，而对于高频的相位非线性变化不敏感。因此第一调制公式在高频部分的相位调节幅度较之低频部分的相位调节幅度更大，可以在不改变听感的情况下达到一个比较好的减弱音频输入信号和音频输出信号之间相关性的效果。

在本发明的另一实施例中，也可以是根据频率大小对补偿音频信号进行子带分解，得到多个子带信号；分别对各个子带信号进行卷积和限幅处理；将卷积和限幅处理后的多个子带信号进行信号合成，得到合成信号；根据第一调制方法对合成信号的相位进行非线性调制。将卷积和限幅处理后的多个子带信号进行信号合成，得到合成信号，然后使用第一调制方法对合成信号的相位进行非线性调制，可以减少相位调制过程中的计算量，提升整体的音频处理效率。

在本发明的另一实施例中，也可以是根据频率大小对补偿音频信号进行子带分解，得到多个子带信号；获取频率大于预设频率的子带信号作为目标子带信号；根据第二调制方法分别对各个目标子带信号的相位进行非线性调制，得到多个调制子带信号；将除目标子带信号外的子带信号和调制子带信号进行信号合成。其中，第二调制方法为使用第二调制公式对各个目标子带信号的相位进行非线性调制，第二调制公式包括第一调制参数，第一调制参数用于调整第一调制公式的非线性程度。

进一步的，在本发明的一种实施例中，第二调制公式为：

其中，α为第一调制参数，α的大小影响第一调制公式的非线性程度，H(z)为不同频率对应的需调整的相位大小，Z为频率，N为预设常数。

具体的，如图4所示为α设置为0.4时，第二调制公式的频率-相位响应图像的示意图。对大于预设频率的目标子带信号使用第二调制方法进行相位调制，不会对小于预设频率的部分子带信号产生影响，同时还可以减少相位调制过程的计算量，提升音频处理效率的同时，提升播放音频的保真度。

在本发明的另一实施例中，也可以是根据频率大小对补偿音频信号进行子带分解，得到多个子带信号；将频率大于预设频率的子带信号进行信号合成，得到第一合成信号；根据第二调制方法对第一合成信号的相位进行非线性调制，得到第一调制合成信号；将除目标子带信号外的子带信号和第一调制合成信号进行信号合成。将将频率大于预设频率的子带信号进行信号合成，得到第一合成信号；根据第二调制方法对第一合成信号的相位进行非线性调制，可以减少相位调制过程中的计算量，提升整体的音频处理效率。

进一步的，前述步骤S201至步骤S204仅为本发明一种实施例中音频信号处理过程的举例说明，在本发明的另一种实施例中，音频信号处理过程还可以是如图5所示，包括以下步骤。

步骤S301：获取前音频输出信号。

步骤S302：根据前音频输出信号获取反馈信号。

步骤S303：根据反馈信号对音频输入信号进行信号补偿得到补偿音频信号。

可以理解的是，本实施例中的步骤S301至步骤S303与前一种实施例中的步骤S201至步骤S203大致相同，具体可以参照前述实施例的具体说明。

步骤S304：获取前补偿音频信号。

前补偿音频信号为前一采样时段的补偿音频信号。

步骤S305：根据前音频输出信号和前补偿音频信号计算得到反馈频响数据。

具体的，在发明的一种实施例中，可以获取前反馈频响数据，前反馈频响数据为前一采样时段的反馈频响数据；根据前音频输出信号、前补偿音频信号、以及前反馈频响数据计算得到当前采样时段的反馈频响数据。

进一步的，可以根据公式计算得到反馈频响数据。

其中，μ是迭代步长系数，W(n)＝[w₀(n),w₁(n),w₂(n),...,w_L-1(n)]^T，w(n)为估计出来的反馈路径，n为采样时段,W(n)为前一采样时段的反馈频响数据，W(n+1)为当前采样时段的反馈频响数据，R(n)＝[r(n),r(n-1),...,r(n-L+1)]^T，r(n)为前一采样时段的补偿音频信号，r(n-L+1)为前L+2采样时段的补偿音频信号，L为预设的音频输出设备输出的音频反馈至音频输入设备的反馈路径长度。即为根据预设反馈路径长度L确定采样数量K，K＝L+2，获取与当前采样时段相邻的K个采样时段的音频输出信号形成音频输出阵列，R(n)即为音频输出阵列的逆转阵列，d(n)＝s(n)-z(n)，z(n)＝W^T(n)R(n)，其中，s(n)为采样时段n的音频输入信号，z(n)为采样时段n的反馈信号，d(n)为采样时段n的补偿音频信号。使用上述公式即可以根据音频输出阵列、前补偿音频信号、以及前反馈频响数据计算得到当前采样时段的反馈频响数据。

步骤S306：判断反馈频响数据是否大于预设频响数据，若是，执行步骤S307，若否，执行步骤S308。

在本步骤中，预设频响数据为产生啸叫风险的门槛数据，反馈频响数据大于预设频响数据说明可能产生啸叫风险，此时执行步骤S306，反之反馈频响数据不大于预设频响数据说明不会产生啸叫风险，此时执行步骤S307。

步骤S307：对补偿音频信号的相位进行非线性调制。

步骤S308：将补偿音频信号作为音频输出信号。

在对补偿音频信号的相位进行非线性调制前先计算反馈频响数据，当反馈频响数据大于预设频响数据说明可能产生啸叫风险时才对补偿音频信号的相位进行非线性调制，反之则不对补偿音频信号的相位进行非线性调制，从而在保证不产生啸叫的前提下，减少对补偿音频信号的相位进行调制的次数，减少相位调制的计算量，提升音频信号处理的效率。

步骤S103：将音频输出信号经由音频输出设备进行播放。

与现有技术相比，本发明实施例一所提供的音频处理方法中，音频输入设备采集到音频输入信号后，根据前音频输出信号获取反馈信号，前音频输出信号即为前一采样时段经由音频输出设备进行播放的音频输出信号，根据前音频输出信号获取得到的反馈信号即为预估的前音频输出信号经由音频输出设备进行播放后被音频输入设备重新采集的部分形成的信号，根据反馈信号对音频输入信号进行信号补偿，即可消除音频输入信号中所包含的音频输出设备播放的音频被重新采集的部分，如此得到的补偿音频信号即为实际的环境音频的音频信号，将补偿音频信号作为音频输出信号进行播放既可有效的消除可能产生的啸叫；此外，由于音频处理是一个连续的过程，当前采样时段得到的音频输出信号会在下一采样时刻作为前音频输出信号对下一采样时刻采集到的音频输入信号进行音频信号处理，对补偿音频信号的相位进行非线性调制，可以增大补偿音频信号与下一采样时刻采集到的音频输入信号的差异度，从而避免补偿音频信号与下一采样时刻采集到的音频输入信号的音频内容相似度过高、导致对下一采样时刻采集到的音频输入信号进行信号补偿时消除了过多的音频内容，从而减少信号补偿过程可能导致的音频失真，实现在消除啸叫的同时减少音频信号失真的效果。

本发明实施例二提供了一种音频处理装置，如图6所示，包括：音频输入模块601，音频输入模块601用于采集音频输入信号；处理模块602，处理模块602用于获取当前采样时段音频输入模块601采集的音频输入信号，对音频输入信号进行音频信号处理得到音频输出信号，音频信号处理至少包括：获取前音频输出信号，前音频输出信号为前一采样时段的音频输出信号，根据前音频输出信号获取反馈信号，根据反馈信号对音频输入信号进行信号补偿得到补偿音频信号，对补偿音频信号的相位进行非线性调制；音频输出模块603，音频输出模块603用于对音频输出信号进行播放；存储模块604，存储模块604用于存储前音频输出信号。

与现有技术相比，本发明实施例二所提供的音频处理装置中，音频输入模块601采集到音频输入信号后，处理模块602根据存储模块604中存储的前音频输出信号获取反馈信号，前音频输出信号为存储模块604中存储的前一采样时段经由音频输出模块603进行播放的音频输出信号，根据前音频输出信号获取得到的反馈信号即为预估的前音频输出信号经由音频输出模块603进行播放后被音频输入模块601重新采集的部分形成的信号，根据反馈信号对音频输入信号进行信号补偿，即可消除音频输入信号中所包含的音频输出模块603播放的音频被重新采集的部分，如此得到的补偿音频信号即为实际的环境音频的音频信号，处理模块602将补偿音频信号作为音频输出信号进行播放既可有效的消除可能产生的啸叫；此外，由于音频处理是一个连续的过程，当前采样时段得到的音频输出信号会在下一采样时刻作为前音频输出信号对下一采样时刻采集到的音频输入信号进行音频信号处理，对补偿音频信号的相位进行非线性调制，可以增大补偿音频信号与下一采样时刻采集到的音频输入信号的差异度，从而避免补偿音频信号与下一采样时刻采集到的音频输入信号的音频内容相似度过高、导致对下一采样时刻采集到的音频输入信号进行信号补偿时消除了过多的音频内容，从而减少信号补偿过程可能导致的音频失真，实现在消除啸叫的同时减少音频信号失真的效果。

本发明实施例三涉及一种电子设备，如图7所示，包括：音频输入设备701、音频输出设备702、至少一个处理器703；以及，与至少一个处理器703通信连接的存储器704；其中，存储器704存储有可被至少一个处理器703执行的指令，指令被至少一个处理器703执行，以使至少一个处理器703能够执行上述各实施例中的音频处理方法。

其中，存储器和处理器采用总线方式连接，总线可以包括任意数量的互联的总线和桥，总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件，也可以是多个元件，比如多个接收器和发送器，提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输，进一步，天线还接收数据并将数据传送给处理器。

处理器负责管理总线和通常的处理，还可以提供各种功能，包括定时，外围接口，电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。

本发明实施例四涉及一种计算机可读存储介质，存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。

即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

一种音频处理方法，其特征在于，应用于包括音频输入设备和音频输出设备的音频处理装置，所述方法包括：

获取当前采样时段所述音频输入设备采集的音频输入信号，对所述音频输入信号进行音频信号处理得到音频输出信号，将所述音频输出信号经由所述音频输出设备进行播放；

所述音频信号处理包括：获取前音频输出信号，所述前音频输出信号为前一采样时段的所述音频输出信号，根据所述前音频输出信号获取反馈信号，根据所述反馈信号对所述音频输入信号进行信号补偿得到补偿音频信号，对所述补偿音频信号的相位进行非线性调制。
根据权利要求1所述的方法，其特征在于，所述音频信号处理还包括：

获取前补偿音频信号，所述前补偿音频信号为前一采样时段的补偿音频信号；

根据所述前音频输出信号和所述前补偿音频信号计算得到反馈频响数据，判断所述反馈频响数据是否大于预设频响数据；

若所述反馈频响数据大于预设频响数据，执行步骤：对所述补偿音频信号的相位进行非线性调制。
根据权利要求2所述的方法，其特征在于，所述根据所述前音频输出信号和所述前补偿音频信号计算得到反馈频响数据，包括：

获取前反馈频响数据，所述前反馈频响数据为前一采样时段的所述反馈频响数据；

根据所述前音频输出信号、所述前补偿音频信号、以及所述前反馈频响数据计算得到当前采样时段的所述反馈频响数据。
根据权利要求3所述的方法，其特征在于，所述根据所述前音频输出信号、所述前补偿音频信号、以及所述前反馈频响数据计算得到当前采样时段的所述反馈频响数据，包括：

根据预设反馈路径长度确定采样数量K；

获取与当前采样时段相邻的K个采样时段的所述音频输出信号形成音频输出阵列；

根据所述音频输出阵列、所述补偿音频信号、以及所述前反馈频响数据计算得到当前采样时段的所述反馈频响数据。
根据权利要求1所述的方法，其特征在于，所述对所述补偿音频信号的相位进行非线性调制，包括：

根据频率大小对所述补偿音频信号进行子带分解，得到多个子带信号；

根据第一调制方法分别对各个所述子带信号的相位进行非线性调制，得到多个调制子带信号；

将所述多个调制子带信号进行信号合成。
根据权利要求1所述的方法，其特征在于，所述对所述补偿音频信号的相位进行非线性调制，包括：

根据频率大小对所述补偿音频信号进行子带分解，得到多个子带信号；

分别对各个所述子带信号进行卷积和限幅处理；

将所述卷积和限幅处理后的所述多个子带信号进行信号合成，得到合成信号；

根据第一调制方法对所述合成信号的相位进行非线性调制。
根据权利要求5或6所述的方法，其特征在于，所述第一调制方法，包括：

使用第一调制公式进行非线性调制；

所述第一调制公式包括第一调制参数和第二调制参数，所述第一调制参数用于调整所述第一调制公式的非线性程度，所述第二调制参数用于调整所述第一调制公式的斜率。
根据权利要求1所述的方法，其特征在于，所述对所述补偿音频信号的相位进行非线性调制，包括：

根据频率大小对所述补偿音频信号进行子带分解，得到多个子带信号；

获取频率大于预设频率的所述子带信号作为目标子带信号；

根据第二调制方法分别对各个所述目标子带信号的相位进行非线性调制，得到多个调制子带信号；

将除所述目标子带信号外的所述子带信号和所述调制子带信号进行信号合成。
根据权利要求1所述的方法，其特征在于，所述对所述补偿音频信号的相位进行非线性调制，包括：

根据频率大小对所述补偿音频信号进行子带分解，得到多个子带信号；

获取频率大于预设频率的所述子带信号作为目标子带信号；

将所述目标子带信号进行信号合成，得到第一合成信号；

根据第二调制方法对第一合成信号的相位进行非线性调制，得到第一调制合成信号；

将除所述目标子带信号外的所述子带信号和所述第一调制合成信号进行信号合成。
根据权利要求8或9所述的方法，其特征在于，所述第二调制方法，包括：

使用第二调制公式进行非线性调制；

所述第二调制公式包括第一调制参数，所述第一调制参数用于调整所述第二调制公式的非线性程度。
一种音频处理装置，其特征在于，包括：

音频输入模块，所述音频输入模块用于采集音频输入信号；

处理模块，所述处理模块用于获取当前采样时段所述音频输入模块采集的音频输入信号，对所述音频输入信号进行音频信号处理得到音频输出信号，所述音频信号处理至少包括：获取前音频输出信号，所述前音频输出信号为前一采样时段的所述音频输出信号，根据所述前音频输出信号获取反馈信号，根据所述反馈信号对所述音频输入信号进行信号补偿得到补偿音频信号，对所述补偿音频信号的相位进行非线性调制；

音频输出模块，所述音频输出模块用于对所述音频输出信号进行播放；

存储模块，所述存储模块用于存储所述前音频输出信号。
一种电子设备，其特征在于，包括：

音频输入设备、音频输出设备、至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至10中任意一项所述的音频处理方法。
一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行实现权利要求1至10中任意一项所述的音频处理方法。