CN103380628A

CN103380628A - 音频处理装置、音频处理方法和程序

Info

Publication number: CN103380628A
Application number: CN2012800089936A
Authority: CN
Inventors: 樱庭洋平; 木原信之
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2011-02-22
Filing date: 2012-02-14
Publication date: 2013-10-30
Also published as: EP2680609A1; JP2012175453A; WO2012114946A1; US20130322649A1

Abstract

[问题]提供一种新颖的和改进的音频处理装置、音频处理方法和程序，即使生成反射声音或无反馈声音，它们也能够有利地抑制反馈。[技术方案]该音频处理装置提供有：频域转换单元，在每帧中将从麦克风输入的音频信号转换为频域；以及增益调节单元，对每个频带对于转换为频域的音频信号执行增益调节。所述增益调节单元对每个频带获取各帧之间的音频信号的功率的自相关值，并且根据获取的自相关值设置增益的调节量。

Description

音频处理装置、音频处理方法和程序

技术领域

本发明涉及音频处理装置、音频处理方法和程序。

背景技术

已知所谓的啸声（howling）出现在各种音频信号传输系统（如从麦克风到扬声器的音频放大系统）中。抑制该啸声是重要的问题。

例如，专利文献1和2中公开的技术用作抑制啸声的方式。专利文献1公开了这样的技术，其在检测持续预定时间或更多的包络（envelope）增加趋势时检测啸声的出现。专利文献2公开了用于逐渐抑制啸声的技术。

引用列表

专利文献

专利文献1：JP H8-223684A

专利文献2：JP H3-237899A

发明内容

技术问题

然而，即使采用上述技术，由于延迟到达的各种反射声音和各种非啸声声音（如噪声和要输入麦克风的语音），也不可能适当地检测实际环境中的啸声。结果，存在没有适当地抑制啸声的问题。

考虑这些问题，本公开的目的是提供一种新颖的和改进的音频处理设备、音频处理方法和程序，即使反射声音或非啸声声音出现，也能够适当地抑制啸声。

解决问题的技术方案

根据为了解决上述问题的本公开的第一方面，提供了一种音频处理装置，包括：频域转换单元，配置为对于每帧将从麦克风输入的音频信号转换为频域；以及增益调节单元，配置为对每个频带对于转换为频域的音频信号执行增益调节。所述增益调节单元对每个频带获取各帧之间的音频信号的功率的自相关值，并且根据获取的自相关值设置增益的调节量。

所述调节量可以包括具有用于抑制增益的长时间的第一抑制量和具有用于抑制增益的短时间的第二抑制量。

所述增益调节单元可以对每个频带设置组合抑制量，所述组合抑制量是所述第一抑制量和所述第二抑制量的组合。

所述增益调节单元可以在获取的自相关值的最大值大于预定阈值时设置通过增加所述第一抑制量获得的组合抑制量，并且在获取的自相关值的最大值小于阈值时设置通过增加所述第二抑制量获得的组合抑制量。

所述功率的自相关值可以是基于功率归一化的自相关的绝对值。

时域转换单元配置为将通过所述增益调节单元经历增益调节的音频信号转换为时域，以及输出单元配置为将转换为时域的音频信号输出到可以进一步包括的扬声器。

系数转换单元配置为将滤波器系数转换为最小相位滤波器系数，所述滤波器系数对应于根据自相关值的增益的调节量，以及卷积单元配置为将所述最小相位滤波器系数与时域中的音频信号卷积，所述音频信号从可以进一步包括的麦克风输入。

根据为了解决上述问题的本公开的另一方面，提供了一种音频处理装置，包括：频域转换单元，配置为对于每帧将从麦克风输入的音频信号转换为频域；以及增益调节单元，配置为对每个频带对于转换为频域的音频信号执行增益调节。所述增益条件单元利用组合抑制量对每个频带调节增益，所述组合抑制量通过组合具有长抑制时间的第一抑制量和具有短抑制时间的第二抑制量获得。

根据为了解决上述问题的本公开的另一方面，提供了一种音频处理方法，包括：对于每帧将从麦克风输入的音频信号转换为频域；以及对每个频带对于转换为频域的音频信号执行增益调节。在执行增益调节时，对每个频带获取各帧之间的音频信号的功率的自相关值，并且根据获取的自相关值设置增益的调节量。

根据为了解决上述问题的本公开的另一方面，提供了一种音频处理方法，包括以下步骤：对于每帧将从麦克风输入的音频信号转换为频域；以及对每个频带对于转换为频域的音频信号执行增益调节。在执行增益调节时，利用组合抑制量对每个频带调节增益，所述组合抑制量通过组合具有长抑制时间的第一抑制量和具有短抑制时间的第二抑制量获得。

根据为了解决上述问题的本公开的另一方面，提供了一种用于使得计算机用作音频处理装置的程序，所述音频处理装置包括：频域转换单元，配置为对于每帧将从麦克风输入的音频信号转换为频域；以及增益调节单元，配置为对每个频带对于转换为频域的音频信号执行增益调节。所述增益调节单元对每个频带获取各帧之间的音频信号的功率的自相关值，并且根据获取的自相关值设置增益的调节量。

根据为了解决上述问题的本公开的另一方面，提供了一种用于使得计算机用作音频处理装置的程序，所述音频处理装置包括：频域转换单元，配置为对于每帧将从麦克风输入的音频信号转换为频域；以及增益调节单元，配置为对每个频带对于转换为频域的音频信号执行增益调节。所述增益调节单元利用组合抑制量对每个频带调节增益，所述组合抑制量通过组合具有长抑制时间的第一抑制量和具有短抑制时间的第二抑制量获得。

本发明的有利效果

如上所述，根据本发明，即使反射声音或非啸声声音出现，也能够适当地抑制啸声。

附图说明

图1是根据第一实施例的音频处理装置的功能方块图。

图2是用于描述方块处理的示意图。

图3A是图示一个频带中的功率差Δp(ω)的图。

图3B是图示基于功率归一化的自相关的绝对值的图。

图4是描述啸声抑制处理的流程图。

图5是根据第二实施例的音频处理装置的功能方块图。

图6是用于描述线性相位FIR滤波器系数的图。

图7是用于描述FIR滤波器系数到最小相位FIR滤波器系数的转换的图。

具体实施方式

以下，将参考附图详细描述本发明的优选实施例。注意，在本说明书和附图中，具有基本相同功能和结构的元件用相同参考标号表示，并且省略重复描述。

将按照以下顺序进行描述。

1．第一实施例

1-1．音频处理装置的配置

1-2．啸声的抑制

1-3．信号处理单元的配置

1-4．啸声抑制处理

2．第二实施例

3．结论

<1．第一实施例>

（1-1.音频处理装置的配置）

将参考图1描述根据第一实施例的音频处理装置的配置。图1是根据第一实施例的音频处理装置的功能方块图。

如图1所示，根据第一实施例的音频处理装置10包括麦克风20、A/D转换器30、信号处理单元40、D/A转换器50和扬声器60。

麦克风20收集声音，并且将收集的声音转换为音频信号。麦克风20将音频信号输出到A/D转换器30。此外，从麦克风20输出的音频信号通过图中未示出的放大器放大，并且输入A/D转换器30。

A/D转换器30对从麦克风20输入的音频信号执行数字转换。A/D转换器30将经历数字转换的音频信号输出到信号处理单元40。此外，输入A/D转换器30的音频信号可以是从不同于麦克风20的外部设备输入的信号。

信号处理单元40对从A/D转换器30输入的音频信号执行各种信号处理，如增益调节。信号处理单元40将经历信号处理的音频信号输出到D/A转换器50。根据本实施例的信号处理单元40执行用于抑制啸声的增益调节，如下面将详细描述的。下面将描述信号处理单元40的详细配置。

D/A转换器50对从信号处理单元40输入的音频信号执行模拟转换。D/A转换器50将经历模拟转换的音频信号输出到扬声器60。扬声器60将从D/A转换器50输入的音频信号发出。

此外，音频处理装置10包括用于存储各种数据的存储器（未示出）。存储器例如存储从麦克风输入的音频信号的数据、和由信号处理单元40处理的数据。存储器还存储用于操作音频处理装置10的程序。图中未示出的CPU执行程序，使得实现要由音频处理装置10执行的处理（如下面描述的啸声抑制处理）。

（1-2.啸声的抑制）

在上述音频处理装置中，在音频信号从麦克风20传输到扬声器60时可能出现啸声。抑制该啸声是重要的问题。

顺带提及，在抑制啸声时，已知用于检测啸声相似性的指示器和用于恢复啸声抑制增益所花的时间对抑制啸声的性能具有很大影响。

首先，将描述用于确定啸声相似性的指示器（换句话说，用于检测啸声的指示器）。作为用于确定啸声相似性的指示器，已知这样的技术，由于对经历傅里叶变换的音频信号的功率差（Δpower）执行的计数处理，如果其中Δpower值持续等于或大于阈值的状态持续，则确定啸声。然而，在实际环境中，存在由于延迟到达的各种反射声音和各种非啸声声音（如噪声和要输入麦克风的语音），没有适当地抑制啸声的问题。

接着，将描述用于恢复啸声抑制增益所花的时间。如果直到啸声抑制增益已经恢复所花的时间延长，则优点是啸声在一定时间内不会再次出现，同时也存在非啸声声音的质量在该时段期间劣化的可能性。相反，如果直到啸声抑制增益已经恢复所花的时间缩短，则非啸声声音的质量没有如此明显劣化，同时啸声可能很快再次出现或者啸声没有彻底地适当消除。因此，必须防止声音质量劣化和啸声再次出现两者。

为此，在根据本实施例的音频处理装置10中，下面将详细描述的经历傅里叶变换的音频信号的功率差的自相关用作用于确定啸声相似性的指示器，并且根据自相关值控制啸声抑制。因此，即使反射声音和非啸声声音出现，也可能适当地抑制啸声。还可能通过组合具有不同抑制时间的多个抑制量作为啸声抑制量，防止声音质量劣化和啸声再次出现两者。

（1-3．信号处理单元的配置）

将参考图1描述信号处理单元40的配置。如图1所示，信号处理单元40包括作为频域变换单元的示例的傅里叶变换单元42、增益调节单元44、和作为时域转换单元的傅里叶逆变换单元46。

（傅里叶变换单元）

傅里叶变换单元42对于作为单位时间的每个帧，对从A/D转换器30输入的音频信号（输入声音）执行傅里叶变换（FFT），并且将音频信号转换为频域中的信号。傅里叶变换单元42将已经经历傅里叶变换并转换为频域的音频信号划分为多个频带，并且将每个频带中的音频信号输出到增益调节单元44。已知的滤波器组可以将音频信号划分为多个频带。

这里，使用图2，将描述傅里叶变换处理中的方块处理。图2是用于描述方块处理的示意图。这里，从麦克风20输入的输入声音的数据例如是512样本，并且假设512样本包括例如样本S（1）、S（2）、S（3）、......、S（n）。在方块处理中使用两个样本执行傅里叶变换。例如，对样本S（1）和样本S（2）两者执行傅里叶变换以获取频谱F（1），并且对样本S（2）和样本S（3）两者执行傅里叶变换以获取频谱F（2）。结果，方块处理的处理帧1024样本。

（增益调节单元）

增益调节单元44对于每个频带，对从傅里叶变换单元42输入的音频信号执行增益调节。增益调节单元44还通过使用频谱产生各帧之间的功率差，并且获取用于检测啸声的自相关值。下面将描述如何获取自相关值。

首先，增益调节单元44从获取的频谱F（1）、F（2）、......、F（n）获取各帧之间的功率差。例如，增益调节单元44获取如图3A所示的功率差Δp(ω)。图3A是图示一个频带中的功率差Δp(ω)的图。为了说明方便，在图3A中，实线指示啸声期间的Δp(ω)，并且虚线指示非啸声期间的Δp(ω)。如从图3A看到的，啸声期间的Δp(ω)表示比非啸声期间的Δp(ω)大的值。

增益调节单元44基于获取的Δp(ω)获取Δp(ω)的自相关。这里，将描述自相关。自相关是用于衡量信号与通过对信号自身执行时移获得的信号匹配到什么程度的度量。如下面的公式1所述，自相关以用于时移的幅度的函数的形式表示。也就是说，公式1中的自相关r_m(ω)是Δp(ω)和通过将Δp(ω)偏移m点获得的点的积的和。

[公式1]

r_{m} (ω) = Σ_{t}^{N} Δp (ω, t) \times Δp (ω, t + m), m = 1, \cdot \cdot \cdot, N

（公式1）

此外，Δp(ω,t)表示频率ω和时间t的Δpower值。

自相关在寻找信号中包括的重复模式时是有用的。例如，自相关用于确定噪声内的周期性信号的存在。如果存在周期性，则自相关具有较大的值，而如果不存在周期性，则自相关具有较小的值。因为Δpower在啸声期间是周期性的，所以显示了高自相关。因为在非啸声期间Δpower不是周期性的，所以显示了低自相关。

增益调节单元44使用获取的自相关r_m(ω)来获取基于功率归一化的自相关的绝对值（称为自相关值），如以下公式2所描述的。基于功率的归一化使得啸声和非啸声之间的自相关更可区别。

[公式2]

| \frac{r_{m} (ω)}{r_{0} (ω)} |

（公式2）

在图3B中图示了从图3A中的Δp(ω)获取的自相关值。图3B是图示基于功率归一化的自相关的绝对值的图。在图3B中，实线指示啸声期间的自相关值，并且虚线指示非啸声期间的自相关值。如从图3B看到的，啸声期间的自相关值是周期性的，并且大于非啸声期间的自相关值。使用该自相关的特性，可能适当地从非啸声中区分啸声。

以此方式，例如，使用自相关检测啸声相对于当Δpower超过阈值时使用计数处理检测啸声具有以下优点。也就是说，特别是在观察到复杂反射的环境下，啸声在短时间内被重复放大和衰减以逐渐地变更大（啸声不是简单地被放大，而是有时候也被衰减以变更大），Δpower值暂时变小，并且计数器被重置使得啸声不可能被抑制。相反，因为本实施例只关注Δpower的周期性，所以即使Δpower暂时变小，也可以抑制啸声。

增益调节单元44还根据获取的自相关值，对于每个频带设置增益调节量。具体地，增益调节单元44通过使用通过组合多个抑制量获得的组合抑制量，对于每个频带调节增益。在本实施例中，组合抑制量描述为通过组合长时间抑制量和短时间抑制量获得的量。长时间抑制量对应于具有长抑制时间的第一抑制量，并且短时间抑制量对应于具有短抑制时间的第二抑制量。此外，组合抑制量可以通过组合三个或更多抑制量获得。例如，当使用三个抑制量时，第三抑制量的抑制时间设为比短时间抑制量的抑制时间长，并且比长时间抑制量的抑制时间短。

增益调节单元44比较获取的自相关值的最大值（图3B中的x(ω)）和预定阈值，以设置组合抑制量（最终抑制量）。预定阈值是指示啸声和非啸声之间的边界的值。当自相关值的最大值x(ω)大于阈值时，增益调节单元44确定啸声出现。相反，当自相关值的最大值x(ω)小于阈值时，增益调节单元44确定啸声没有出现。此外，当获取的自相关值的最大值大于阈值时，增益调节单元44设置通过增加长时间抑制量获得的组合抑制量。相反，当获取的自相关值的最大值小于阈值时，增益调节单元44设置通过增加短时间抑制量获得的组合抑制量。

增益调节单元44还执行用于恢复长时间抑制量和短时间抑制量的处理，因为当啸声抑制持续时频率特性持续劣化。长时间抑制量缓慢地恢复，并且短时间抑制量快速地恢复。通过以此方式使用具有不同的用于恢复抑制所花的时间的多个抑制量，可能防止声音质量劣化和啸声再次出现两者。已经经历增益调节的每个频带中的音频信号的数据（如图2所示的数据D(1)和D(2)）输出到傅里叶逆变换单元46。

（傅里叶逆变换单元）

傅里叶逆变换单元46合成已经从傅里叶变换单元46输入的每个频带中的音频信号，并且执行傅里叶逆变换处理以将音频信号转换到时域。根据本实施例的傅里叶逆变换单元46将其抑制量被打开的音频信号转换为时域。傅里叶逆变换单元46将转换为时域的音频信号输出到D/A转换器50。其抑制量已经被打开的音频信号从而输出到扬声器60。

根据上述信号处理单元40，增益调节单元44获取自相关值，并且根据获取的自相关值设置最终抑制量。因此，即使反射声音或非啸声声音出现，也可能适当地抑制啸声。通过组合具有不同抑制时间的两个抑制量（长时间抑制量和短时间抑制量）作为最终抑制量，还可能防止声音质量劣化和啸声再次出现。

（1-4．啸声抑制处理）

下面将参考图4描述根据本实施例的啸声抑制处理。图4是描述啸声抑制处理的流程图。音频处理装置10的CUP执行存储器中存储的程序以实现本处理。

当信号处理单元40的傅里叶变换单元42将从麦克风20输入的音频信号转换为频域，并且将转换的音频信号输出到增益调节单元44时，图4中的流程图开始。

首先，增益调节单元44基于各帧之间的功率差Δp(ω)，获取如图3B所示的指示啸声相似性的自相关值的最大值x(ω)（步骤S2）。

接着，增益调节单元44根据获取的自相关值的最大值x(ω)，对于每个频带设置短时间抑制量G1(ω)和长时间抑制量G2(ω)。增益调节单元44通过组合两个抑制量G1(ω)和G2(ω)设置最终抑制量G(ω)。此外，每个抑制量的单位是分贝（dB）。重复本处理，然后最后的值用作短时间抑制量G1(ω)和长时间抑制量G2(ω)。也就是说，短时间抑制量G1(ω)和长时间抑制量G2(ω)是要积分的值。

接着，增益调节单元44确定自相关值的最大值x(ω)是否等于或大于预定阈值（步骤S4）。当自相关值x(ω)等于或大于预定阈值（步骤S4：是）时，增益调节单元44增加两个抑制量G1(ω)和G2(ω)中的长时间抑制量G2(ω)（步骤S6）。

例如，增益调节单元44根据x(ω)的值增加长时间抑制量G2(ω)，如下面的公式3所示。

[公式3]

G2(ω)＝G2(ω)+T2(x(ω)) （公式3）

其中T2(x(ω))例如是常数值或与啸声相似性成比例的值，但是不限于此。

增益调节单元44还可以通过使用乘法增加长时间抑制量G2(ω)，如下面的公式4所述。

[公式4]

G2(ω)＝G2(ω)×T2(x(ω)) （公式4）

此外，当自相关值的最大值x(ω)等于或大于预定阈值时，增益调节单元44保持短时间抑制量G1(ω)的幅度。

相反，在步骤S4如果自相关值的最大值x(ω)等于或小于预定值（步骤S4：否），则增益调节单元44增加两个抑制量G1(ω)和G2(ω)中的短时间抑制量G1(ω)（步骤S8）。

例如，增益调节单元44根据x(ω)的值增加短时间抑制量G1(ω)，如下面的公式5所示。

[公式5]

G1(ω)＝G1(ω)+T1(x(ω)) （公式5）

其中T1(x(ω))例如是常数值或与啸声相似性成比例的值，但是不限于此。

增益调节单元44还可以通过使用乘法增加短时间抑制量G1(ω)，如下面的公式6所述。

[公式6]

G1(ω)＝G1(ω)×T1(x(ω)) （公式6）

此外，如果自相关值的最大值x(ω)等于或小于预定值，则增益调节单元44保持长时间抑制量G2(ω)的幅度。

接着，增益调节单元44通过组合两个抑制量G1(ω)和G2(ω)产生最终抑制量G(ω)（步骤S10）。例如，增益调节单元44产生最终抑制量G(ω)，如下面的公式7所示。

[公式7]

G(ω)＝G1(ω)+G2(ω) （公式7）

增益调节单元44通过组合两个抑制量G1(ω)和G2(ω)产生最终抑制量G(ω)，但是产生最终抑制量G(ω)的方式不限于此。例如，当关注抑制啸声时，增益调节单元44可以采用具有较大抑制增益的两个抑制量G1(ω)和G2(ω)之一作为最终抑制量G(ω)。当关注非啸声声音的质量时，增益调节单元44还可以采用具有较小抑制增益的抑制量作为最终抑制量G(ω)。

顺带提及，增益调节单元44还执行用于恢复抑制量的处理（步骤S12），因为当啸声抑制持续时频率特性持续劣化。例如，增益调节单元44控制抑制增益，如下面公式8和9中描述的。此外，通过恢复抑制量获得的短时间抑制量G1(ω)和长时间抑制量G2(ω)在步骤S6和S8中使用。

[公式8]

G1(ω)＝G1(ω)-R1 （公式8）

[公式9]

G2(ω)＝G2(ω)-R2 （公式9）

这里假设R1是大于R2的值。结果，在短时间内恢复短时间抑制量G1(ω)，而长时间抑制量G2(ω)恢复缓慢。也就是说，当啸声相似性小（自相关值小）时，增益恢复快。当啸声相似性大（自相关值大）时，增益恢复慢。

关于这点将进行更详细的描述。当自相关值x(ω)还小时需要开始抑制，以便在啸声明显之前执行抑制。然而，如果从自相关值x(ω)还小时已经执行抑制，则非啸声声音（如语音）可能被错误地抑制。同时，因为在本实施例中短时间抑制量G1(ω)恢复快，所以防止非啸声声音由于错误抑制而劣化。

当啸声实际发生时，通过使用长时间抑制量G2(ω)抑制啸声，因为在短时间抑制期间自相关值x(ω)变成大的值。此时，在本实施例中啸声不太明显，因为通过使用短时间抑制量G1(ω)抑制了啸声。因为通过使用长时间抑制量G2(ω)还长时间地持续抑制啸声，所以可以防止啸声很快再次出现。

顺带提及，当只使用短时间抑制量G1(ω)抑制啸声时，非啸声声音的质量劣化不明显，然而啸声可能很快再次出现或者没有完全消除。相反，只使用长时间抑制量G2(ω)抑制啸声时，啸声在一定时间内不再次出现，然而非啸声声音可能劣化。对于这些问题，在上述本实施例中通过使用具有不同抑制时间的多个抑制量G1(ω)和G2(ω)，执行抑制，使得即使在非啸声声音出现时，也适当地执行抑制。还可能防止声音质量劣化和啸声再次出现两者。

返回图4中的流程图，将进行处理的描述。增益调节单元44将输入S(ω)乘以产生的最终抑制量G(ω)，如下面的公式10所示，以获取处理的输出Y(ω)（步骤S14）。

[公式10]

Y(ω)＝G(ω)×S(ω) （公式10）

经历啸声抑制处理的音频信号输出到扬声器60。

在上述步骤S12中的处理之后，执行步骤S14中的处理，但是顺序不限于此。例如，步骤S12中的处理和步骤S14中的处理可以并行执行。步骤S12中的处理可以在步骤S14中的处理之后执行。

<2．第二实施例>

将参考图5描述根据第二实施例的音频处理装置。图5是根据第二实施例的音频处理装置的功能方块图。

在上述第一实施例中啸声的抑制增益G(ω)在频域中相乘。同时，在第二实施例中通过使用具有最小相位的FIR系数在时域中抑制啸声，如下面将详细描述的。从而能够克服输出声音的延迟，这可能由于傅里叶变换的方块处理（见图2）而出现。

与根据第一实施例的音频处理装置10相比，图5中的根据第二实施例的音频处理装置100具有不同配置的信号处理单元40，并且其他以相同方式配置。主要地，因此下面将描述音频处理装置100中的信号处理单元140的配置，并且将省略其他配置的描述。

信号处理单元140对从A/D转换器30输入的音频信号（输入声音）执行各种信号处理（如增益调节），并且将经历信号处理的音频信号输出到D/A转换器50。信号处理单元140包括傅里叶变换单元142、增益调节单元144、FIR系数计算单元146、系数转换单元148和卷积单元150。

傅里叶变换单元142以与第一实施例相同的方式将转换为频域的音频信号划分为多个频带，并且将每个频带中的音频信号输出到增益调节单元144。

增益调节单元144以与第一实施例相同的方式获取自相关值，并且根据获取的自相关值设置最终抑制量G(ω)。结果，即使反射声音或非啸声声音出现，在第二实施例中也可以适当地抑制啸声。增益调节单元144还可以通过组合多个抑制量并执行抑制，防止声音质量劣化和啸声再次出现两者。

FIR系数计算单元146计算用于实现从增益调节单元144输入的最终抑制量G(ω)的线性相位FIR滤波器系数。例如，FIR系数计算单元146通过使用已知的窗口函数方法、Remez方法等，计算线性相位FIR滤波器系数，如图6所示。FIR系数计算单元146将计算的线性相位FIR滤波器系数输出到系数转换单元148。自然地，线性相位FIR滤波器系数可以通过使用不同于窗口函数方法和Remez方法的技术计算。图6是用于描述线性相位FIR滤波器系数的图。

系数转换单元148将从FIR系数计算单元146输入的线性相位FIR滤波器系数转换为最小相位FIR滤波器系数。例如，如图7所示，系数转换单元148通过使用诸如Remez方法的已知的方法，将FIR滤波器系数转换为最小相位FIR滤波器系数。系数转换单元148将最小相位FIR滤波器系数输出到卷积单元150。相应地，图7是用于描述FIR滤波器系数到最小相位FIR滤波器系数的转换的图。

卷积单元150将从系数转换单元148输出的最小相位FIR滤波器系数与来自麦克风20的输入声音（时域中的输入声音）进行卷积。卷积单元150将最小相位FIR滤波器系数已经与其卷积的输入声音经由D/A转换器50输出到扬声器60。

以此方式，根据第二实施例，最小相位FIR滤波器系数与输入声音卷积，使得可能通过使用最小相位FIR滤波器系数在时域中抑制啸声。结果，可能抑制啸声而没有输入声音的延迟。

<3．结论>

在上述音频处理装置10和100中，增益调节单元44对于每个频带获取各帧之间的音频信号的功率的自相关值x(ω)，并且根据获取的自相关值x(ω)设置增益的调节量。根据该配置，如果使用具有周期性的啸声的功率差的自相关，则即使在反射声音或非啸声声音出现时，也可能适当地检测啸声。结果，可能适当地抑制啸声。

同时，通过使用通过组合具有长抑制时间的长时间抑制量G2(ω)和具有短抑制时间的短时间抑制量G1(ω)获得的组合抑制量G(ω)，增益调节单元44对于每个频带调整增益。根据该配置，长时间抑制量G2(ω)和短时间抑制量G1(ω)每个具有不同的在恢复抑制量时使用的时间，以解决在只使用一个抑制量执行抑制时出现的问题。也就是说，可能防止在抑制啸声时成为问题的声音质量劣化和啸声再次出现两者。

已经参考附图在上面描述了本发明的优选实施例，然而当然本发明不限于上述示例。本领域技术人员可以找到所附权利要求的范围内的各种替代和修改，并且应当理解的是，它们将自如地在本发明的技术范围内。

在上述实施例中音频处理装置包括麦克风和扬声器两者，但该情况不是必须的。例如，音频处理装置不一定包括麦克风和扬声器，并且麦克风和扬声器可以在连接到音频处理装置的外部装置中提供。

在上述实施例中已经描述的一系列处理可以通过专用硬件或软件（应用）执行。当通过软件执行该一系列处理时，该一系列处理可以通过使得通用或专用计算机执行程序来执行。

上述实施例中的流程图中图示的步骤自然包括以所述顺序序时执行的处理，并且也包括不一定序时执行的，而是并行执行或单独执行的处理。不用说，即使在序时执行的步骤中，也可以根据需要改变顺序。

参考标号列表

10 音频处理装置

20 麦克风

30 A/D转换器

40 信号处理单元

42 傅里叶变换单元

44 增益调节单元

46 傅里叶逆变换单元

50 D/A转换器

60 扬声器

100 音频处理装置

140 信号处理单元

142 傅里叶变换单元

144 增益调节单元

146 FIR系数计算单元

148 系数转换单元

150 卷积单元

Claims

1.一种音频处理装置，包括：

频域转换单元，配置为对于每帧将从麦克风输入的音频信号转换为频域；以及

增益调节单元，配置为对每个频带对于转换为频域的音频信号执行增益调节，

其中，所述增益调节单元对每个频带获取各帧之间的音频信号的功率的自相关值，并且根据获取的自相关值设置增益的调节量。

2.如权利要求1所述的音频处理装置，其中所述调节量包括具有用于抑制增益的长时间的第一抑制量和具有用于抑制增益的短时间的第二抑制量。

3.如权利要求2所述的音频处理装置，其中，所述增益调节单元对每个频带设置组合抑制量，所述组合抑制量是所述第一抑制量和所述第二抑制量的组合。

4.如权利要求3所述的音频处理装置，其中，所述增益调节单元在获取的自相关值的最大值大于预定阈值时设置通过增加所述第一抑制量获得的组合抑制量，并且在获取的自相关值的最大值小于阈值时设置通过增加所述第二抑制量获得的组合抑制量。

5.如权利要求1所述的音频处理装置，其中所述功率的自相关值是基于功率归一化的自相关的绝对值。

6.如权利要求1所述的音频处理装置，还包括：

时域转换单元，配置为将通过所述增益调节单元经历增益调节的音频信号转换为时域；以及

输出单元，配置为将转换为时域的音频信号输出到扬声器。

7.如权利要求1所述的音频处理装置，还包括：

系数转换单元，配置为将滤波器系数转换为最小相位滤波器系数，所述滤波器系数对应于根据自相关值的增益的调节量；以及

卷积单元，配置为将所述最小相位滤波器系数与时域中的音频信号卷积，所述音频信号从麦克风输入。

8.一种音频处理装置，包括：

其中，所述增益条件单元利用组合抑制量对每个频带调节增益，所述组合抑制量通过组合具有长抑制时间的第一抑制量和具有短抑制时间的第二抑制量获得。

9.一种音频处理方法，包括：

对于每帧将从麦克风输入的音频信号转换为频域；以及

对每个频带对于转换为频域的音频信号执行增益调节，

其中，在执行增益调节时，对每个频带获取各帧之间的音频信号的功率的自相关值，并且根据获取的自相关值设置增益的调节量。

10.一种音频处理方法，包括：

对于每帧将从麦克风输入的音频信号转换为频域；以及

对每个频带对于转换为频域的音频信号执行增益调节，

其中，在执行增益调节时，利用组合抑制量对每个频带调节增益，所述组合抑制量通过组合具有长抑制时间的第一抑制量和具有短抑制时间的第二抑制量获得。

11.一种用于使得计算机用作音频处理装置的程序，所述音频处理装置包括：

12.一种用于使得计算机用作音频处理装置的程序，所述音频处理装置包括：

其中，所述增益调节单元利用组合抑制量对每个频带调节增益，所述组合抑制量通过组合具有长抑制时间的第一抑制量和具有短抑制时间的第二抑制量获得。