CN108140396B

CN108140396B - 音频信号处理

Info

Publication number: CN108140396B
Application number: CN201680055177.9A
Authority: CN
Inventors: C.P.詹森; L.C.A.范斯图伊文伯格
Original assignee: Koninklijke Philips NV
Current assignee: Koninklijke Philips NV
Priority date: 2015-09-22
Filing date: 2016-09-19
Publication date: 2022-11-25
Anticipated expiration: 2036-09-19
Also published as: WO2017050669A1; JP6564135B2; EP3353785B1; EP3353785B2; US10477313B2; CN108140396A; BR112018005391A2; BR112018005391B1; RU2018114673A; TR201908841T4; US20190052959A1; RU2727968C2; RU2018114673A3; EP3353785A1; JP2018535444A

Abstract

一种音频信号处理装置，包括接收器（403），其接收在第一采样频率处采样的音频信号，该音频信号具有比第一采样频率的一半低第一频率裕度的最大频率。滤波器组（405）使用重叠的子滤波器生成数字音频信号的子带信号。第一频移器（407）向子带组中的至少一个子带应用频移，并且抽取器（409）以抽取因子抽取子带信号，导致抽取采样频率是每个重叠子滤波器的带宽的至少两倍。针对子带的频移被布置成将子带移位到为从零到抽取采样频率的一半的频率间隔的倍数的频率间隔。子带可以单独地处理，并且经处理的子带可以随后被组合以生成全带输出信号。

Description

音频信号处理

技术领域

本发明涉及用于音频信号处理的方法和装置，并且特别地但非排他地涉及音频语音信号的处理。

背景技术

音频信号的数字处理已经变得越来越普遍，并且现在是许多实际应用的一部分。实际上，它目前在许多日常消费电子设备中被执行，包括例如移动电话、音乐发行和呈现、电视等。

为了提供改进的、新的或更灵活的处理，所使用的音频处理算法趋向于变得越来越复杂，并且实际上在许多情况下，信号处理受到可用计算资源的限制。一个示例是用于语音通信设备的语音信号处理，其中语音编码连同语音增强典型地消耗计算资源的非常大的部分。因此，存在改进音频处理算法的计算效率的普遍期望。

在一些应用和场景中，数字音频信号的处理可以有利地在并行子带中执行。因为子带具有减小的带宽，所以这种处理可以在抽取的（decimated）子带信号上执行，即可以减小采样频率。例如，音频信号可以被分成两个相等的子带，其中子带信号在被单独处理之前以因子2进行抽取。

作为一个特定的示例，语音信号可以被分成分别对应于较低频带和较高频带的两个单独的分量。然后，可以在每个带中单独地执行编码，即可以通过对两个子带信号应用个别的且单独的音频处理来执行编码。作为另一个示例，可以在不同的子带中单独执行回波消除过程。

在对单独子带进行处理之后，这些子带可以再次组合以生成具有与输入信号相同的采样频率的单个全带处理的音频信号。

通过将信号分成子带并且在不同子带中单独应用处理来对音频信号进行处理可以在许多情况下提供显著的益处。

例如，对于许多处理算法，计算资源使用率不与频率带宽或采样频率线性地成比例。实际上，对于许多处理算法，计算要求可能会例如随频率带宽/采样频率的平方而增加。

子带处理的另一个优点是它可以允许处理更密切地适应于音频信号的不同特性。例如，语音信号在高达例如4kHz的频率范围中与其在4kHz以上的频率范围中相比具有非常不同的性质。因此，改进的语音编码通常可以通过以不同频带中的特定特性为目标的编码算法来实现，并且因此与针对4kHz以上的子带相比，可以针对4kHz以下的子带应用不同的编码。例如，可以使用不同的语音模型。

而且，通过在不同的子带中操作，也许有可能的是通过使处理适应于不同的特性来优化计算效率。例如，已知混响对于较低频率比对于较高频率持续长得多的时间。因此，用于低频的（如例如用在回波消除器中的）混响估计滤波器需要具有足够的系数（对于FIR滤波器）以提供足以对长混响效果建模的脉冲响应。然而，通过将音频信号分成例如低频和高频带，长滤波器只需（以抽取采样率）应用于低频带，而（反映短高频混响的）短得多的滤波器可以（以抽取采样率）应用在高频带中。与使用长混响滤波器以全采样率对全带宽信号进行滤波相比，总体计算资源使用率可以用这种方式显著减少。

目前存在朝向增加（例如用于语音或音乐音频的）音频信号的带宽的趋势，并且这趋向于导致由于增加的采样率而显著增加的计算资源使用率。为了增加音频信号的带宽，使用子带处理的重要性可能增加，并且实际上它可以在许多情况下甚至允许执行由于设备中的资源限制而无法针对全速率更高带宽信号执行的音频处理。

例如，（免提）语音通信设备的带宽正在迅速增加。窄带（4 kHz带宽）和宽带（8kHz）系统被广泛使用，但超宽带（16 kHz）以及甚至全带（24 kHz）系统正在进入市场（尤其用于VoIP应用）。

作为一个特定示例，语音增强算法不得不应对带宽的这种增加。针对整个频带使用相同的语音增强算法形成一些挑战。对于高频和低频而言，要解决的语音增强问题是不同的。以超宽带算法为例，其中带宽为16 kHz。从0到8kHz的范围中的语音信号与从8到16kHz的范围中的语音信号大不相同。具有其重要的前三个共振峰的元音主要存在于较低频带，而一些辅音扩展显著超过8 kHz。而且，人类听觉的频率选择性在较低的频率处高得多。

作为另一个示例，房间的音响效果一般随频率而改变，这主要归因于空气吸收随频率的增加而增加。因此，对于较高的频率，高频处的混响时间将是较低的。因此，对于较低频率，去混响尤其重要。用于例如声学回波消除的自适应滤波器长度对于较高频率可能相应地较短，因为混响对于较高频率而言典型地是短得多的。

例如对于声学回波消除，将带宽以及因而采样频率以因子2进行扩展并且然后应用相同的算法导致自适应滤波器长度以因子2增加，以便针对低频带实现相同的回波补偿。

对于超宽带语音回波消除，典型地需要4096或更多的滤波器长度。自适应滤波器需要良好的去相关性质以允许快速适应。实质上，这意味着自适应滤波器的更新项必须与输入信号（扬声器信号）的自相关去卷积（deconvolved）。由于高频带中语音的低水平，所以这种自相关在时域中具有长的支持，并且导致非完美的去相关且因而导致针对高频的较低适应速度。

针对这样的应用的有吸引力的解决方案是通过应用滤波器组将信号分成单独的频带。在这样的滤波器组中，信号可以被分成例如两个（对于超宽带）或三个（对于全带）子带，其随后被下采样（抽取），然后被单独地处理。在该单独处理之后，所得到的经处理的信号被上采样并重新组合。

如所提及的，分成不同的带提供了下述优点：每个带可以被独立地处理，反映每个带中的特定特性。例如，从0到8kHz的带的处理可以与宽带情况完全相同，并且对于较高频率，不同的处理是可能的。具体地，对于声学回波消除，针对从0到8kHz的带的典型地2048个系数的自适应滤波器仍然可以使用，而例如1024个系数可以用于从8到16kHz的带。这可以与典型地针对超宽带采用4096个系数或者甚至针对全带采用6144个系数的单个带解决方案进行比较。

然而，这种子带处理的问题在于原则上应该使用理想滤波器（即具有无限陡峭过渡的非重叠滤波器）将音频信号分成子带。因为这是不可能的，滤波器之间的一些重叠典型地导致原始信号的一些信号频率存在于两个相邻的子带信号中。

非理想滤波的一个特定问题在于混叠典型地可以作为抽取的一部分发生。抽取的频率优选尽可能低，并且典型地它被设置为对应于原始采样频率除以子带的数量。然而，当在这种情况下使用非理想滤波器时，一个子带的频率分量到另一个子带中的一些混叠是不可避免的。

然而，这种混叠可以由包括抵消混叠分量的互补滤波器的合成单元（根据经处理的子带信号生成输出数字音频信号）解决。因此，常规地通过在用于生成导致混叠被消除的全带宽信号的合成功能中选择滤波器来解决由非理想滤波器引起的混叠。

子带处理可能引入显著的延迟。EP0721251A1通过在分析和合成滤波器组二者中采用最小相位滤波器来减小音频系统的子带处理中的延迟。

然而，尽管有这样的补偿，发明人已经认识到提供改进的音频信号处理仍然是一个期望。特别地，改进的音频信号处理将是有利的，并且特别地允许增加的灵活性、降低的复杂度、减少的计算资源使用和/或改进的性能的音频处理将是有利的。

发明内容

相应地，本发明寻求优选地单独地或以任何组合方式减轻、缓和或消除上述缺点中的一个或多个。

根据本发明的一个方面，提供一种音频信号处理装置，包括：接收器，其用于接收在第一采样频率处采样的音频信号，该音频信号具有不超过阈值频率的最大频率，该阈值频率比第一采样频率的一半低第一频率裕度；滤波器组，其用于生成数字音频信号的子带信号，该滤波器组包括提供一组子带的一组重叠的子滤波器；第一频移器，其用于向该组子带中的至少一个子带应用频移；抽取器，其用于以抽取因子来抽取子带信号，导致具有等于第一采样频率除以抽取因子的抽取采样频率的抽取子带信号，该抽取采样频率是每个重叠子滤波器的带宽的至少两倍；并且

其中子带的频移被布置成将该子带移位到作为从零到抽取采样频率的一半的频率间隔的倍数的频率间隔。

本发明可以为许多应用提供音频信号的改进的处理和/或促进音频信号的处理，并且可以在许多情境下提供改进的音频质量。该方案可以特别地允许具有减少的子带混叠分量的音频信号的子带处理，同时仍然允许子带分割以表示音频信号的整个频谱而没有间隙。特别地，在许多实施例中，该方案可以促进、改进或允许子带处理而没有子带混叠分量，同时仍然提供针对成为子带的分割的基本平坦的总体频率响应。

子带处理可以例如允许该处理适应于不同频率间隔中的音频信号的特定特性。例如，滤波器长度可以被定制以反映单独子带中的特定要求，而不是针对音频信号的整体最坏情况要求。子带中的信号处理典型地可以显著降低复杂度和计算资源要求。子带混叠的减少可以提供各个子带之间的改进的分离，这在许多实施例中可以导致改进的性能，比如例如单独的子带自适应滤波器的改进的适应。

各个操作的确切次序或顺序在不同的实施例中可以变化。例如，在大多数实施例中，抽取器被布置成在频移之后执行抽取。然而，在一些实施例中，频移可以作为抽取的一部分执行，或甚至在一些情况下频移可以在抽取之后执行。

子带到作为从零到抽取采样频率的一半的频率间隔的倍数的频率间隔的移位可以特别地将用于子带的子滤波器的带宽移位到从零到抽取采样频率的一半的频率间隔的倍数内。带宽可以例如为6dB、10dB、20dB或30dB带宽。所考虑的带宽可以取决于单独的实施例，以及例如取决于混叠分量的可接受的水平和处理要求。

每个子带与输入音频信号的频率间隔相关联。单独的子带可以在频率方面移动/移位，因为子带信号的频率可以被改变。然而，虽然子带或子带信号的频率可以改变，但是子带仍然对应于/表示音频信号的相同频率间隔。

对频率的引用是指正频率。技术人员将清楚的是，对于在频域中具有埃尔米特（Hermitian）性质的实际物理时域信号，这样的频率如何与负频率相关。

作为从零到抽取的采样频率的一半的频率间隔的倍数的频率间隔包括一倍，即它包括从零到抽取采样频率的一半的频率间隔。

子带的数量在许多实施例中可以有利地是两个子带。典型地，使用相对较少数量的子带，并且通常该数量为不超过五。阈值频率在许多实施例中可以不大于20kHz、14kHz、12kHz、10kHz、8kHz或6kHz。在许多实施例中，每个子带的带宽有利地不小于1kHz、2kHz、4kHz、6kHz或8kHz。

根据本发明的可选特征，音频信号处理装置进一步包括信号处理器，其被布置成通过在每个子带中应用单独的子带信号处理而将信号处理算法应用于音频信号。

本发明可以在减少子带之间的混叠的情况下提供对信号的改进的和/或便利的子带处理。子带处理可以包括使用相同的方案对可能被转换成对应子带或可能不被转换成对应子带的其他信号的处理。

根据本发明的可选特征，信号处理算法是语音处理算法，并且信号处理器被布置成在不同的子带中应用不同的算法。

本发明可以提供特别有利的语音处理，其中每个子带中的处理可以适应于不同频带中语音的特定特性。语音性质在不同的子带之间显著地变化，并且没有混叠分量的子带处理可以提供具有改进的质量和/或降低的复杂度/资源使用率的特别高效的处理。

语音处理可以特别地为语音编码或语音增强。

根据本发明的可选特征，信号处理算法包括应用自适应滤波器，并且信号处理器被布置成在不同的子带中单独地调适自适应滤波器。

该方案可以提供对不同频率间隔中变化的音频性质的特别有效的适应。自适应滤波器可以包括用于每个子带的自适应子滤波器，并且该装置可以被布置成针对每个子带生成滤波器更新信号，其中对应的自适应子带滤波器响应于针对该子带的滤波器更新信号而被更新。

根据本发明的可选特征，音频信号和自适应滤波器是用于估计音频信号的回波的回波消除滤波器，该回波消除滤波器包括用于每个子带的子回波消除滤波器；并且该信号处理器被布置成：通过将子回波消除滤波器应用于每个子带中的抽取的子带信号来确定每个子带的估计的回波信号；通过将每个子带中的估计的回波信号与包括音频信号的回波的捕获的音频信号进行比较来确定每个子带的误差信号；以及响应于对应子带的误差信号来更新每个子回波消除滤波器。

该方案可以产生高性能和有效的回波消除，同时保持低复杂度和资源使用率。

根据本发明的可选特征，音频信号处理包括：合成器，其用于从通过每个子带中的子带信号处理生成的经处理的子带信号合成第一采样频率处的音频输出信号；该合成器包括：上采样器，其用于将经处理的子带信号上采样到第一采样频率以生成经上采样的经处理的子带信号；第二频移器，其用于向经上采样的经处理的子带信号应用反向频移，用于第一子带的反向频移导致第一子带被移位到用于第一子带的子滤波器的频率范围；子带合并器，其用于在应用反向频移之后合并经上采样的经处理的子带信号以生成经处理的音频信号；一组子带滤波器，其用于对经上采样的经处理的子带信号进行滤波以衰减每个子带的上采样混叠谱，该组滤波器中的每个滤波器具有不超过第一采样频率的一半的带宽。

该方案可以提供一种非常有利的方案，其中可以通过子带处理来处理全带音频信号，其中由子带处理所引起的伪影或降级被减轻。特别地，子带混叠的效果可以被非常显著地降低。

根据本发明的可选特征，子带合并器包括该组子带滤波器中的至少一个以及组合器，该组合器用于通过在子带滤波之后组合经上采样的经处理的信号子带来生成经处理的音频信号。

这可以在许多实施例中提供特别高效的处理。

根据本发明的可选特征，用于第一子带的频移基本上被给出为：

其中f_d是抽取采样频率，f_m是频移之前第一子带的中心频率，并且n是整数（n≥1）。

这可以提供特别高效的方案，并且在许多实施例中可能导致子带混叠分量的增加的衰减。

在许多实施例中，用于子带的频移可以使得子带的中心频率被移位到基本上由抽取采样频率加上抽取采样频率的一半的倍数构成的频率。

根据本发明的可选特征，用于第一子带的子滤波器的衰减在以对应于频移的值移位的抽取采样频率的一半的倍数的频率处不小于6dB。

这可以允许子带信号中的子带混叠分量的非常高效的衰减。在许多实施例中，用于第一子带的子滤波器的衰减在以对应于频移的值移位的抽取采样频率的一半的倍数的频率处可以不小于10dB、20dB或30dB。

根据本发明的可选特征，滤波器组由一组基本上功率互补的子滤波器形成。

这可以减少全带音频信号的失真。基本上功率互补的子滤波器在许多实施例中可以是在1dB到2dB的精度内功率互补的。因此，在许多实施例中，滤波器组提供在1dB或2dB内平坦的整体组合响应。

在许多实施例中，由重叠滤波器的组合形成的组合滤波器具有不超过2dB（或者在许多实施例中不超过1dB）的通带幅度变化。

根据本发明的可选特征，该组子滤波器中的每个滤波器具有不超过抽取频率一半的6dB带宽。

这可以提供具有子带混叠分量的高效衰减的高效操作。在许多实施例中，该组子滤波器中的每个滤波器可以具有不超过抽取频率一半的10dB、20dB或30dB带宽。

根据本发明的可选特征，阈值频率比第一采样频率的一半低不小于10％。

这可以在许多实施例中提供实际开销，并且可以允许通过实际滤波器进行有效滤波以将子带混叠分量衰减到足够的水平。在许多实施例中，阈值频率不超过第一采样频率的90％。在许多实施例中，阈值频率不小于第一采样频率的60％。这可以通过不采用过高的采样频率来保持低复杂度。

根据本发明的一个方面，提供了一种音频信号处理装置，包括：接收器，其用于接收在抽取采样率处的一组抽取子带信号，该抽取子带信号表示第一采样频率处的音频信号并且具有不超过阈值频率的最大频率，该阈值频率比第一采样频率的一半低第一频率裕度，抽取的子带信号被频移到作为从零到抽取采样频率的一半的频率间隔的倍数的频率间隔，并且随后以抽取因子被抽取；以及合成器，其用于从该组抽取的子带信号合成第一采样频率处的音频输出信号；该合成器包括：上采样器，其用于将抽取的子带信号上采样到第一采样频率以生成经上采样的子带信号；第二频移器，其用于向经上采样的子带信号应用反向频移，用于第一抽取的子带信号的反向频移导致第一抽取的子带信号被移位到与在频移和抽取之前的音频信号中抽取子带信号的频率范围相对应的频率范围；子带合并器，其用于在应用反向频移之后合并经上采样的子带信号以生成合并的音频信号；一组子带滤波器，其用于对经上采样的经处理的子带信号进行滤波以衰减每个子带的上采样混叠谱，该组滤波器中的每个滤波器具有不超过第一采样频率一半的带宽。

根据本发明的一个方面，音频信号处理的方法包括：接收在第一采样频率处采样的音频信号，该音频信号具有不超过阈值频率的最大频率，该阈值频率比第一采样频率的一半低第一频率裕度；滤波器组生成音频信号的子带信号，该滤波器组包括提供一组子带的一组重叠的子滤波器；将频移应用于该组子带中的至少一个子带；以抽取因子抽取子带信号，导致具有等于第一采样频率除以抽取因子的抽取采样频率的抽取的子带信号，该抽取采样频率是每个重叠子滤波器的带宽的至少两倍；并且其中子带的频移将该子带移位到作为从零到抽取采样频率一半的频率间隔的倍数的频率间隔。

本发明的这些和其他方面、特征和优点根据下文描述的实施例将是显然的并且将参照下文描述的实施例进行阐述。

附图说明

将参考附图仅以举例的方式描述本发明的实施例，其中：

图1图示了音频子带处理方案的示例；

图2图示了图1的音频子带处理方案的信号的频谱的示例；

图3图示了回波消除系统的示例；

图4图示了根据本发明的一些实施例的用于音频子带处理系统的子带生成器的示例；

图5图示了图4的音频子带处理方案的信号的频谱的示例；

图6图示了根据本发明的一些实施例的音频子带处理系统的示例；

图7图示了根据本发明的一些实施例的音频子带处理系统的音频信号合成器的示例；

图8图示了根据本发明的一些实施例的音频子带处理系统的示例；

图9图示了根据本发明的一些实施例的用于音频子带处理系统的滤波器组的示例；

图10图示了根据本发明的一些实施例的用于音频子带处理系统的滤波器组的示例；

图11图示了根据本发明的一些实施例的用于音频子带处理系统的频移器的示例；

图12图示了根据本发明的一些实施例的用于音频子带处理系统的滤波器组的示例；以及

图13图示了根据本发明的一些实施例的使用子带处理系统的回波消除器的示例。

具体实施方式

以下描述集中于本发明的适用于数字化语音信号的有效处理并且特别适用于针对语音应用的回波消除的实施例。然而，将领会的是，本发明不限于此应用，而是可以应用于许多其他音频信号和音频应用。

如所提到的，已知将音频信号分成对应于音频信号的不同频带的几个子带信号。该分割典型地分成两个子带，并且下面的描述将集中于其中音频信号被分成随后被个别地且单独地处理的两个子带的实施例。

在分成子带（并且特别地分成两个子带）之后，信号可以被抽取以便降低后续处理的复杂度和资源需求。由于滤波器将音频信号分成子带，所以这种抽取将典型地引入混叠，其中其他子带的不充分衰减的信号分量被折叠到当前子带中。这种混叠常规地通过在合成对应的全带输出信号时、即当经处理的子带被组合以形成全带宽输出音频信号时补偿和抵消混叠的分量来解决。然而，发明人已经认识到，虽然在许多系统中这种补偿可以消除混叠的影响，但是在其他实施例中该混叠可能降低性能。此外，发明人已经认识到，与作为合成的一部分的补偿混叠的传统方案相比，减少各个子带中的混叠的方案是可行的，并且这可以在许多实施例中提供显著改进的性能，并且实际上这样的方案甚至可以为还包括作为合成操作一部分的混叠补偿的系统提供显著改进的性能。

更详细地，可以考虑图1的现有技术方案。该图图示了一种典型的现有技术方案，其使用具有分析和合成带滤波器的临界采样滤波器组，分析和合成带滤波器匹配使得分析组中的混叠被补偿在合成组中。进一步的描述可以例如在例如P.P. Vaidyanathan,Multirate systems and filter banks, Prentice Hall 1993中被找到。

图1的系统使用具有分析滤波器A _LP(ω)和A _HP(ω)的分析滤波器组以及具有合成滤波器F ₀(ω)和F ₁(ω)的合成滤波器组。此外，分析滤波器之间的交叉在音频信号X(ω)的采样率的一半处，并且滤波器的输出被以因子2抽取。抽取的子带信号可以被单独处理，但是在图1的示例中被示出为直接馈送到作为合成操作一部分的上采样器。上采样因子对应于分析抽取器的抽取因子，从而将采样频率恢复到输入采样频率。

分析滤波器的幅度特性的一个示例在图2中示出，图2首先示出幅度特性，随后是抽取之后得到的特性。实线表示非混叠贡献，而虚线表示混叠分布。频率由用于输入信号的采样率的归一化弧度频率表示（即，f_s1 =2π，其中f_s1是输入音频信号的采样频率，也被称为第一采样频率）。

如图2中所图示的，低于π/2的低通分析滤波器A _LP(ω)的频率特性的部分不受影响，因为π/2对应于用于抽取信号的奈奎斯特（Nyquist）频率。然而，由于抽取，高于π/2的幅度特性被折叠回到低于奈奎斯特频率的频带中，即它被折叠在π/2的奈奎斯特频率附近。结果，子带信号将包括显著的混叠信号分量。

类似地，对于高频子带，低于π/2的高通分析滤波器A _HP(ω)的频率特性的部分不受影响，而高于π/2的幅度特性被折叠回到低于奈奎斯特频率的频带中，即它被折叠在π/2的奈奎斯特频率附近。结果，高频子带信号也将包括显著的混叠信号分量。应该指出的是，下采样后的高频带的输出主要由在上采样之后折叠回到非混叠项的混叠项组成。

还应该注意的是，图2仅图示了[0，π/2]的频带中的各个子带的信号分量。

因此，由于分成子带需要滤波器之间的重叠（以便不忽略重叠区域中的信号分量），所生成的抽取子带将固有地包括来自其他子带的大量混叠分量。实际上，滤波器组被设计成具有互补的功率响应，导致平坦的整体幅度响应。对于抽取的子带信号，在奈奎斯特频率处的衰减相应地仅为3dB，并且因此该频率附近的混叠分量固有地仅衰减约3dB。

从分析上讲，当馈送信号X(ω)时分析滤波器的抽取输出可以被表示为：

X _L(ω)=A _LP(ω)X(ω)+ A _LP(π-ω)X(π-ω)

以及

X _H(ω)=A _HP(ω)X(ω)+ A _HP(π-ω)X(π-ω)。

在合成中执行上采样和求和之后，得到的输出信号由下式给出：

从该公式可以看出，有可能设置

以及

，导致混叠项被抵消。这导致：

。

因此，通过适当地设计滤波器A _LP(ω)和A _HP(ω)，可以实现期望的线性响应（参考例如P.P. Vaidyanathan, Multirate systems and filter banks, Prentice Hall1993）。

例如，使用奇数阶半频带椭圆低通滤波器A _LP(ω)及其功率互补高通滤波器A _HP(ω)，输出信号可由下式给出：

其中A(ω)是全通滤波器。

相应地，在这种情况下，输入信号（例如期望语音）的幅度特性保持恒定。（在交叉频率附近的）相位失真典型地存在，但是这对于诸如特别多的语音处理算法之类的许多应用而言是可接受的。然而，在交叉频率处，低通和高通滤波器仅提供3dB的衰减，并且因此在子带中将会存在相当大的混叠。然而，这在合成阶段被有效地补偿或消除，并且因此该方案被用于许多实际应用。

然而，发明人已经认识到，尽管作为合成的一部分执行的混叠补偿在许多情境中可以提供可接受的性能，但是在许多应用中子带信号中的混叠分量的存在仍可能降低性能，并且在一些情况下甚至降低到致使该方案不可用的不可接受的程度。

一个特定的示例是针对回波消除器。图3图示了回波消除器的示例，其中接收的信号可以包括期望的语音信号S(ω)和由扬声器信号X(ω)的呈现所造成的不期望的回波分量E(ω)二者。回波分量E(ω)作为通过从扬声器到麦克风的信号路径的响应修改的扬声器信号X(ω)被给出（并且包括这些信号的特性以及任何相关联的信号电路）。因此，

，

其中H _lm(ω)是扬声器和麦克风之间的声学路径。

自适应滤波器

试图估计声学路径H _lm(ω)，使得当扬声器信号X(ω)被应用于它时时，它提供回波的估计

。通过从麦克风信号中减去估计的回波获得残差信号，即，

。

在没有语音（即其中S(ω)= 0）的时间间隔期间，残差信号被用来更新滤波器。

典型地对于声学回波消除来说，自适应滤波器必须被设计成使得所谓的回波返回损耗增强（ERLE）为至少20dB。ERLE被定义为

。

在典型的声学环境中，对于8 kHz的带宽，这将作为一个典型示例在时域中需要至少2048个系数的滤波器长度。这意味着频率分辨率必须为至少4 Hz，这指示H _lm(ω)在4 Hz以上可以存在显著变化。对于更高的语音带宽，需要明显更长的滤波器。例如，对于16kHz的带宽并且因此对于加倍的带宽和两倍的采样率，需要在时域中至少有4096个系数的滤波器长度，以便解决相同的回波持续时间。然而，典型地，回波在从8 kHz到16 kHz范围中比它处于从0到8 kHz范围中短得多。因此，如果处理改为在两个单独的带中进行，一个从0到8kHz且一个从8kHz到16kHz，则2048个系数的自适应滤波器可以用于第一带，并且典型地512个系数的滤波器可以用于第二带。因此，可以实现复杂度的显著降低。

因此，在图3的系统中，扬声器信号X(ω)和捕获的麦克风信号S(ω)+ E(ω)可以使用图1和图2的方案被分成两个子带。自适应滤波器

可以类似地被分成应用于低频子带的低频滤波器和应用于高频子带的高频滤波器。得到的输出信号R(ω)相应地在两个单独的子带中生成，并且每个子滤波器的更新可以基于该子带中的残差信号。此外，可以通过将图1的合成部分应用于所生成的R(ω)的两个子带来提供回波消除的全速率输出信号。

如发明人所认识到的，尽管在合成输出音频信号时包括混叠补偿，但是在下采样之后混叠项对各个带中应用的自适应滤波器的影响可能导致降级。

使用索引LP和HP分别指代低频子带和高频子带，可以针对已经发生了自适应滤波器的收敛的情形（对应于残差信号为零并且因此自适应滤波器的输出等于捕获的信号）导出以下表达式。特别地，设定：

得到

从而：

，

其中

。

因此，低频子带中回波的估计由非混叠贡献H _lm(ω)和混叠贡献H _lm(π-ω)的加权和构成。注意到，在特定示例中，ω和π-ω相差超过4 Hz时，H _lm(ω)和H _lm(π-ω)之间可能存在显著差异。

一个问题在于α(ω)是数据相关的，并且（对于典型的语音应用）随时间迅速变化。事实上，在实践中α(ω)变化得比自适应滤波器可以跟踪的快得多。因此，将不会达到最佳解决方案，并且混叠分量和非混叠分量二者将不会被消除。

通过用A _HP(ω)代替A _LP(ω)，可以针对较高频率子带进行相同的推导。因此，关于较低频带，混叠或非混叠项都将不被消除。因此，在交叉频率附近（通常为几百Hz），输出信号中将趋向于存在非常大的回波贡献。这些回波贡献将包括混叠和非混叠的贡献。（后者，因为用于两个带的自适应滤波器独立工作，以及混叠贡献并非完全相互抵消）。因此，在这种情况下，子带处理可能引入显著的降级。

作为另一个示例，可以将单独的语音编码应用于不同子带中的语音信号。例如，可以执行高达8kHz的频带的CELP编码，而对从8kHz到16kHz的频带中的语音分量的编码可以通过低复杂度的频谱编码执行。在这种情境中，由于CELP编码的非线性属性，交叉子带混叠将导致编码伪影，并且因此混叠在解码端不能被完全消除。

图4图示了可以减轻所描述问题的方案。图4具体图示了用于音频处理装置的子带生成器401。除下面描述的差异之外，子带生成器401与图1的系统的分析部分相对应。

子带生成器401包括接收音频信号的接收器403。音频信号在下文被称为第一采样频率的频率处被采样。与图2的系统相比，音频信号的信号分量被限制于低于比第一采样频率的奈奎斯特频率低的阈值频率的频带，即音频信号的最大频率以给定的裕度低于奈奎斯特频率。确切的裕度可能取决于个别实施例的特定偏好和需要。然而，在许多实施例中，音频信号的最大频率被限制为低于阈值频率，该阈值频率比第一采样频率的一半低不超过10％，或者在一些实施例中甚至例如低不超过20％。

将领会的是，最大频率可以被认为是这样的频率：在该频率以上，频率分量的信号能量足够低。例如，在许多实施例中，最大频率可以被认为是这样的频率：在该频率以上，信号分量比最大幅度低至少20dB或30dB。在一些情境中，最大频率可以被认为是这样的频率：针对该频率，在该频率以上，信号分量的组合能量小于音频信号的总体信号能量的给定比例。该比例可以取决于可接受的混叠的水平，并且典型地可以是5％、1％、0.5％、0.1％或甚至更低。

在许多实施例中，音频信号可以是经滤波的音频信号，并且最大频率可以是这样的频率：对于该频率而言，衰减超过给定阈值。例如，最大频率可以是这样的频率：在该频率处，音频信号的（先前的）滤波提供至少例如20dB、30dB或40dB的衰减。

将领会的是，滤波可以是模拟或数字滤波。例如，滤波可以是在采样之前执行的模拟低通滤波。特别地，滤波可以是在第一采样频率处采样之前执行的抗混叠滤波。音频信号的最大频率可以相应地是这样的频率：在该频率处，模拟抗混叠滤波超过至少例如10dB、20dB、30dB或40dB的衰减。

在一些实施例中，接收器403可以包括数字滤波器，该数字滤波器被应用于采样的音频信号以便降低信号的最大频率以为奈奎斯特频率提供裕度。例如，可以应用数字滤波器，其将奈奎斯特频率的例如90％以上的频率分量衰减至少例如20dB。因此，在一些实施例中，它可以是这样的频率：在该频率处，数字（低通）滤波器超过至少例如10dB、20dB、30dB或40dB的衰减。将领会的是，这种滤波器可以与滤波器组进行组合，例如通过用于最高子带的滤波器组滤波器提供高于最大频率的频率的衰减来进行组合。

因此，与其中可以容纳具有高达奈奎斯特频率的带宽的信号的常规系统相比，图4的系统将最大频率限制在阈值频率以下，该阈值频率通常比奈奎斯特频率小约10％。因此，该系统在频谱中创建裕度或开销。例如，对于接收到的语音信号的32ksps（千次采样每秒）采样率和16kHz带宽，该系统可以通过应用在低于奈奎斯特频率的阈值频率之上提供强衰减（例如20dB）的低通滤波器来创建奈奎斯特频率附近的净空（headroom）。例如，可以使用例如14kHz的阈值频率。

因此，针对其生成子带的采样音频信号具有不超过阈值频率的最大频率，该阈值频率比奈奎斯特频率低合适的裕度（例如10％）。

图5图示了图1的子带生成器401的处理中的各种信号的频谱。它图示了执行滤波的第一步骤，以确保信号的最大频率以给定的合适裕度低于输入音频信号的奈奎斯特频率。

接收器403耦合到滤波器组405，滤波器组405被布置成生成音频信号的子带信号，其中滤波器组包括提供一组子带的一组重叠子滤波器。每个子带表示（输入）音频信号的频率间隔。

在特定示例中，滤波器组405包括两个滤波器，并且音频信号被划分成两个子带。然而，将领会的是，在其他实施例中，信号可以被划分成更多的子带。然而，典型地，针对相对较低数量的子带，发现最佳权衡，并且特别地在大多数实施例中子带的数量不超过五。

滤波器组405包括将（音频信号的）频带分成多个子带的多个重叠滤波器。滤波器是重叠的，使得滤波器一起包括（具有超过典型地不大于4-5dB的阈值的衰减的）至少一个子带中的音频滤波器的所有信号分量。作为对其而言两个相邻滤波器的衰减相同的频率给出的在不同滤波器之间的交叉在大多数实施例中被保持具有尽可能接近3dB的衰减（对应于在该频率处的信号分量均匀划分成两个子带），并且典型地不会偏离此超过例如1dB或2dB。

在许多实施例中，滤波器组405的相邻滤波器被生成为基本上是功率互补的。因此，滤波器的组合衰减在许多实施例中优选地基本上是平坦的，并且在典型地1dB或2dB的精度内可以特别地是平坦的。因此，将图4的滤波器组405中的两个滤波器的幅度响应表示为A _LP(ω)和A _HP(ω)，度量（measure）：

对于高达输入音频信号的阈值频率/最大频率的频率是基本恒定的。

将领会的是，在实际实施例中可能会发生一些变化，但典型地跨频带的偏差小于1-2dB。将领会的是，这些考虑很容易扩展到更多的子带，即对于n个子带/滤波器而言，度量：

跨频带是基本恒定的。

滤波器组405耦合到频移器407且耦合到抽取器409。频移器407进一步耦合到抽取器409。

抽取器409被布置成抽取由滤波器组405产生的每个子带的采样频率。特别地，抽取器409可以以抽取因子抽取由滤波器组405生成的子带信号，导致具有等于第一采样频率除以抽取因子的抽取采样频率的抽取子带信号。在大多数实施例中，抽取因子是整数值，但将领会的是，这不是必要的。

实际上，在大多数实施例中，抽取因子等于由滤波器组405生成的子带的数量。因此，在其中生成两个子带的图4的特定示例中，抽取器409使用抽取因子2。因此，抽取器生成若干子带，每个子带具有等于第一采样率除以抽取因子的采样频率，并且特别地在图4中，抽取器409生成两个子带，每个子带具有第一采样频率的一半的采样频率。

在图4的示例中，最低频率子带（此后称为较低子带）被直接馈送到抽取器409以进行抽取。然而，最高频率子带（此后称为较高子带）在被馈送到抽取器409以进行抽取之前被频移器407频移。因此，抽取是在较高子带的频移版本上执行的。

在该系统中，滤波器组405的子带滤波器具有低于抽取采样率的一半（即低于抽取频带的奈奎斯特频率）的带宽。因此，在该系统中，抽取采样频率，即第一采样频率除以抽取因子，大于每个子带滤波器的带宽。带宽可以具体为6dB、10dB、20dB或甚至30dB带宽。

相应地，两个滤波器的示例中的子带滤波器之间的交叉频率小于抽取信号的奈奎斯特频率，并且特别地小于第一采样频率的四分之一。实际上，交叉频率低足够的阈值，使得它允许信号的衰减在抽取奈奎斯特频率（第一采样频率除以四）处达到足够高的值。

这在图5中图示，图5示出了低通滤波，所述低通滤波具有低于抽取奈奎斯特频率（对应于用于第一采样频率的π/2）的截止频率并且在抽取奈奎斯特频率处具有非常高的衰减。实际上，该衰减足以使混叠分量充分衰减。典型地，衰减不小于10dB、20dB或甚至更高。

作为该滤波的结果，在第一采样频率处生成较低的子带信号，其可以容易地被抽取器409抽取而不引入（显著）混叠分量。这在图5中图示，图5示出了所得到的低通滤波器（其相对于在下采样/抽取之后的抽取采样频率被归一化）。

然而，由于较低的交叉频率以及因此非临界采样滤波器的使用，如果直接抽取，较高频带将生成非常大的混叠。然而，如图5中所图示的，当归一化到第一采样频率时，较高的子带被频移以使得它落入从π/2到π的频率间隔。此外，由于较高子带滤波器的带宽低于抽取奈奎斯特频率，因此用于第一采样频率的奈奎斯特频率和用于抽取采样频率的奈奎斯特频率二者处的衰减可以非常高。实际上，典型地，滤波器将被设计用于在这些频率处的衰减不小于10dB、20dB或甚至更高。

此外，当频移的较高子带随后被抽取时，该频带将混叠到从0到抽取奈奎斯特频率的频率间隔。因此，生成较高子带的基带表示。此外，由于在分别移位到第一采样频率的奈奎斯特频率和抽取采样频率的奈奎斯特频率的频率处的较高子带滤波器的衰减，该抽取不导致来自其他带的任何（显著的）混叠分量被引入基带表示。

实际上，滤波器组405的子带滤波器在频移之后将是抽取采样频率的一半的倍数的频率处提供高衰减。在大多数实施例中，对于这些频率而言，该衰减为至少6dB，并且通常为10dB、20dB或甚至30dB。

应该注意的是，由于由抽取产生的基带表示以及所造成的进入基带的混叠，较高的子带信号的频谱将在基带表示中反转。还应该注意的是，图5仅图示正在讨论的间隔中的频谱（并且不是例如相同信号、子带信号或滤波器特性的混叠版本，并且不是负频率）。

因此，作为图4的系统中的处理的结果，生成两个子带信号，其具有来自其他子带的非常低水平的混叠分量。这些信号可以相应地被个别地且单独地处理，而这样的混叠分量不降低性能。

将领会的是，尽管图4描述的系统将较高频子带移位到从π/2到π的频率范围（归一化到第一采样频率），原则上可以将其移位到从0到π/2的基带带宽的其他倍数。实际上，在一些实施例中，频移可以直接将较高子带信号移位到从0到π/2的基带。

还将领会的是，该方案不限于两个子带，而是可以应用于更多的子带。在这样的情况下，频移将寻求将子带的带宽移位以落入由抽取奈奎斯特频率、即f_s1/d给出的基带的倍数内，其中f_s1是第一采样频率且d是抽取因子。例如，对于三个子带，两个较高的子带可以被移位到具有为第一采样频率除以3的倍数的端点的频率间隔。例如中间子带可以被移位到从π/3到2π/3的范围，并且较高子带可以被从2π/3移位到π；或者实际上两个子带可以被移位到从0到π/3的间隔。

因此，在该方案中，使用过采样而不是临界采样以便限制各个子带中的混叠。这看起来与期望平坦的幅度特性的要求相矛盾。然而，该方案在频谱的顶端生成随后被利用的某种净空/裕度。例如，对于具有32 kHz的采样频率的超宽带语音信号，全通带可能被限制在14 kHz，并且对于具有48 kHz的采样频率的全带，通带可能被限制在20 kHz。与频移相结合此净空允许每个子带的过采样，并且显著减少子带混叠，同时仍然允许基本平坦的整体幅度特性。

因此，在特定示例中，创建具有低于π/2的交叉频率的频带分割器，使得在ω=π/2处，低通具有足够（大于20dB）的衰减。因此，较低带可以安全地被下采样。对较高子带的直接下采样将遭受显著的混叠。然而，在下采样之前，较高的子带信号被馈送到频移器，使得频带在频率方面移位并且在ω=π/2和ω=π处的衰减是足够的（至少20dB）以避免下采样之后的混叠（或者至少保持此混叠足够低）。

相应地，生成没有子带混叠分量的子带。诸如语音增强算法、特别是自适应滤波算法之类的音频处理现在可以应用在无混叠子带信号上。

图6图示了音频处理系统的示例。该系统包括如关于图4所描述的子带生成器401。因此，子带生成器401接收音频信号并在第一采样频率的一半的抽取频率处生成两个子带信号。两个子带中的每一个都被馈送到单独的音频处理器601、603，音频处理器601、603中的每一个执行音频信号的单独且个别的处理。例如，音频处理器601、603可以执行语音增强过程。经处理的子带信号被馈送到合成器605，合成器605被布置成从经处理的子带信号生成单个全带音频输出信号。因此，合成器605合并子带以生成单个输出信号。

合成器605实质上可以表示子带生成器401的转置（transpose）。与图4的子带生成器401互补的合成器605的示例在图7中图示。

在该示例中，由合成器605接收的子带信号，即经处理的子带信号首先由上采样器701上采样到第一采样频率。因此，上采样器701以对应于抽取器409所使用的抽取因子的上采样因子执行各个子带的上采样。在该特定示例中，相应地以因子2执行上采样。

该上采样可以例如通过零填充来执行，例如在该特定示例中，可以在每个接收到的样本之间插入附加的零样本。在典型的上采样器中，零填充之后是合适的滤波器，该滤波器选择上采样信号的适当频率副本。

特别地，当通过零填充或补零进行上采样时，额外采样的结果是基频谱在频域中以对应于抽取采样频率的重复因子重复。因此，在特定示例中，通过零填充进行的到第一采样频率的上采样导致抽取的频谱以与第一采样频率除以上采样因子（对应于分析端处的抽取因子）相对应的重复频率重复。

因此，在抽取因子为2的示例中，上采样频谱将以π的频率（归一化到第一采样频率）重复。

对于较低的子带，这将导致0到π/2频率范围中的基带频谱接近从π/2到π的频谱副本（或者如果考虑-π/2到π/2频率范围中的负频率接近从π/2到3π/2的频谱的副本）。为了将子带分量保持在适当的频带（即抽取之前的带）中，可以应用低通滤波器，其选择从0到π/2的频谱。因为较低的子带没有完全扩展到π/2（由于滤波器的过采样而不是临界采样），所以可以在没有过度的计算负担的情况下从实际的滤波器获得良好的结果。

然而，对于较高的子带，从π/2到π的频谱的副本被选择，因为这对应于抽取之前的频谱的频率。因此，取代低通滤波器的是，使用高通滤波器以选择适当的副本。该通带滤波器具有从π/2到π（在从0到π的基带间隔中）的带宽，从而移除从0到π/2的上采样混叠副本。结果，来自子带生成器401的子带信号（在抽取之前但在频移之后）通过简单的上采样和滤波被恢复。

将领会的是，所描述的（以第一采样频率除以抽取因子倍数）上采样和滤波的原理通常适用于任何抽取因子和任何子带。特别地，对于比2更高的采样因子，可以分别使用低通和高通滤波器来恢复较低的子带和较高的子带，而可以使用带通滤波器恢复中间带。实际上，由于低通滤波器和高通滤波器可以被认为是带通滤波器的特定示例，所以上采样、之后是选择对应于抽取之前的子带频带的混叠副本的带通滤波的方法可以被认为适合用于所有子带。

将领会的是，尽管这样的滤波器可以是上采样器701的一部分，但这不是必需的，并且在其他实施例中，滤波器可以应用在信号路径的其他部分。例如，滤波器可以是在频移之后执行的后续子带合并的一部分。还将领会的是，优选地选择滤波器以提供基本平坦的幅度/功率响应。特别地，通过选择滤波器作为互补功率滤波器，可以获得平坦的全通行为。

合成器进一步包括第二频移器703，该第二频移器703被布置成将反向频移应用于作为子带生成的一部分被频移的经上采样的经处理的子带信号。在特定示例中，较高的子带信号被相应地馈送到第二频移器703。

第二频移器703应用频移（称为反向频移），该频移对于给定子带应用导致子带移动到子带所表示的频率范围的移位，即它将子带的信号分量恢复到与它们在输入音频信号中最初具有的频率相同的频率。因此，反向频移使得子带并移位到创建子带的子滤波器的范围。

例如，在特定示例中，第一子带可以覆盖从0-7kHz的范围，而第二子带可以覆盖从7-14kHz的范围。由于抽取和处理的子带信号都由基带信号表示，所以第二频移器703可以应用反向频移，其将较高的子带信号从基带表示移动到适当的7-14kHz范围。

反向频移被布置成使由通过第一频移器407的频移造成的组合频移反向。如前所讨论，由抽取造成的频移（即到基带的移位）通过经由滤波器选择适当的频率副本来补偿。

例如，如果第一频移器407通过应用f_sh的频移将较高子带移动到从π/2到π的范围（归一化到第一采样频率）中并且由抽取器进行的混叠将其移动到0到π/2（归一化到第一采样频率）的通带，则第二频移器703可以执行-f_sh的频移。

第二频移器703的输出被馈送到子带合并器705，该子带合并器705也耦合到上采样器701，它从上采样器701接收较低的子带信号。子带合并器705被布置成合并经上采样的经处理的子带信号以生成具有对应于输入信号的采样率的经处理的输出音频信号。

子带合并器705可以直接组合接收到的子带信号，因为这些子带信号现在位于适当的频率处，即对应于由每个子带信号表示的输入信号的频率范围的子带频率。

实际上，在一些实施例中，子带合并器705可以简单地实现为对接收到的子带信号求和的加法器。特别地，如果已经在上采样器中采用适当的滤波器（例如用于带通滤波零填充信号以选择用于各个子带的适当频率副本的混叠滤波器），则可以执行简单相加。在其他实施例中，可以执行更复杂的合并，例如包括执行带选择的滤波器。

例如，可以采用也补偿滤波器组405的子带滤波器的滤波的滤波器。特别地，合并器可以包括应用于经上采样的经处理的子带信号的一组子带滤波器。组合器然后可以组合所得到的经滤波的子带信号。在这样的示例中，子滤波器可以被布置成使得滤波器组405中的子带滤波器和子带合并器705中的对应子带滤波器的级联对于所有子带而言是基本相同的。

在该示例中，子带合并器705的输出被馈送到具有小于第一采样频率的一半的带宽（例如6dB、10dB或20dB的带宽）的低通滤波器707。因此，尽管执行零填充上采样，但是低通滤波器707可以执行上采样抗混叠滤波，导致上采样不生成高频信号分量。

低通滤波器707的输出相应地是具有与输入音频信号相同的采样率的经处理的音频信号。然而，音频信号的处理已经在每个子带上个别地且单独地执行，而没有引入由于子带混叠引起的（不可接受的）降级。

如所描述的，第一频移器407被布置成移位较高的子带，使得这些较高子带被移动到为从零到抽取采样频率的一半的频率间隔的倍数的间隔。在不同的应用和实施例之间（或者甚至对于不同的信号或不同的子带），确切的移位可能不同。然而，在许多实施例中，移位有利地使得子带在这样的频率间隔内居中定位。

因此，在许多实施例中，第一频移器407可以被布置成选择移位频率，使得子带的中心频率基本上移位到为从零到抽取采样频率的一半的基本间隔的倍数的间隔的中心。

特别地，给定子带的频移可以基本上被给出为：

其中f_d是抽取采样频率，f_m是频移之前子带的中心频率，并且n是整数（n≥1）。

在许多实施例中，可以基本上如上给出频移，其中与频率f_s的最大偏差是子带带宽的10％、或甚至5％或1％。

图8中图示所描述的方案的实施方式的特定示例，图8示出了分析侧（对应于子带生成器401）和合成侧（对应于合成器605）。该示例是具有32 kHz采样频率的语音处理超宽带系统。

在该示例中，对应于子带生成器401的分析部分包括以下特定方案：

具有在14 kHz处的截止频率的初始低通滤波。该滤波器可以例如是椭圆滤波器。

具有在7.5kHz处的交叉频率的带分割器（实现滤波器组405）。

1250Hz的频移，以便将较高的子带的中心频率（14kHz-7.5kHz）/2）=10.750kHz移位到从8kHz到16kHz的频率间隔（对应于π/2–π的间隔）的中心频率，即移位到12kHz。

下采样器以因子2抽取子带信号。

在合成部分，执行反向操作：

接收到的信号被以因子2上采样。

对于高频带，-1250Hz的频移被应用为直接频移。

应用具有7.5 kHz处的交叉频率的带合并器。

应用在具有在14 kHz处的截止频率的奈奎斯特周围的低通滤波器。

将领会的是，各个实体和处理器可以通过任何合适的方案来实现。

例如，对于滤波器组405，可以使用7.5kHz处的奇数阶椭圆低通滤波器及其功率补偿高通滤波器，如图9中所示。

这样的滤波器可以利用全通滤波器来实现。在两个滤波器是功率互补滤波器的情况下，它们共享相同的全通滤波器。图10的结构可以例如利用全通区段A ₀(z)和A ₁(z)来实现。

如图11中所图示，可以使用分析信号来实现频移器。分析信号是复数（时间）信号，其中原始信号形成实部并且希尔伯特（Hilbert）变换部分形成虚信号。在频域中，这样的信号只对正频率有贡献。将该信号乘以

将频谱移位ω _s。取这个信号的实部给出移位了ω _s的原始信号。复数滤波器可以利用FIR和IIR滤波器二者来设计。

在合成部分中，可以使用相同的构建块。子带合并器705可以例如如图12中所图示那样实现。

该方案可用于许多不同的应用中，并且可以提供针对许多不同类型的音频信号和音频处理的优势。

然而，该方案可能特别地高度适合用于语音处理。实际上，对于语音，特性趋向于在不同的频带中是非常不同的，并且所描述的方案允许可以反映并适应于这样的特性变化的子带处理。该效果日益重要，因为按目前的趋势，用于表示语音的频带增加。

因此，作为示例，由图6的信号处理器601、603应用的算法可以是语音处理算法，并且特别地可以是语音增强处理算法。由于在两个子带（例如，从0-7.5kHz和从7.5-14kHz）中语音的显著不同的性质，信号处理器601、603可以被布置成在不同的子带中应用不同的算法。

作为特定的示例，采取平稳的噪音抑制。利用平稳的噪声抑制，经常试图在静音期间估计背景噪声的频谱幅度并且改变输入信号的频谱幅度，以使得净化的信号的频谱幅度类似于所期望的信号的谱幅度，而相位保持不变。频谱通常通过重叠的加汉宁窗时间信号的短时快速傅立叶变换（STFFT）来计算。所需的频率分辨率由人类听觉的频率分辨率确定，人类听觉的频率分辨率在低频处高且在高频处低。频带分割允许我们在较低带中应用具有足够长度的STFFT的平稳的噪声抑制算法以提供足够的频率分辨率，并且在较高带中应用具有较小尺寸的STFFT的平稳的噪声抑制算法，其提供较低的频率分辨率但是因此提供高的时域分辨率。

在一些实施例中，信号处理算法可以是回波消除。图13图示了图3的回波消除的示例，但被修改以执行单独的子带处理。

如可以看出的，在该示例中，扬声器信号X(ω)被馈送到对应于图4的子带生成器401的第一子带生成器1301。这两个得到的子带信号被馈送到回波消除滤波器1303，该回波消除滤波器1303在这个示例中由两个子回波消除滤波器1305、1307形成，子回波消除滤波器1305、1307中的每一个都在抽取的频率处（即在第一采样频率的一半处）操作。因此，在该示例中，为每个频带提供一个子回波消除滤波器。

类似地，接收到的信号S(ω)+E(ω)由对应于图4的子带生成器401的第二子带生成器1309分成两个子带信号。通过在每个子带中单独地比较估计的和接收的信号，针对两个子带个别地生成残差信号。

此外，每个自适应子回波消除滤波器1305、1307基于每个子带中的残差信号被更新（例如，使用最小均方自适应算法来最小化残差信号的功率）。因此，子回波消除滤波器1305、1307的更新在每个子带中单独地执行，并且实际上回波消除作为两个子带中的两个单独过程被执行。这尤其允许自适应子回波消除滤波器1305、1307的长度不同，从而允许显著的复杂度降低。

在该示例中，残差信号还被馈送到根据图7的示例的合成器1311。合成器1311可以合并残差信号的子带，从而生成全带回波消除语音信号。

在上文中，已经描述了具有特定信号流程和操作顺序的各种示例性实施例。然而，将领会的是，在特定处理中可能存在变化，并且实际上在不同的实施例中所执行的操作的顺序或次序可能不同。例如，如前所述，合成的子带滤波可以作为上采样的一部分或者作为子带合并的一部分被执行。

作为另一个示例，图4图示了其中在频移之后执行抽取的示例。然而，在一些实施例中，抽取也许可能在频移之前执行或实际上作为频移的一部分来执行。

为了说明该方案，可以考虑FIR滤波器，之后是通过仅保留偶数编号的采样来实现2的抽取因子的抽取器。这样的FIR滤波器可能被设计成使得从脉冲响应的观点来看，所有奇数阶系数都是零。在这种情况下，有可能创建新的FIR滤波器，其只包含非零系数并且抽取器位于滤波器前面。这将导致FIR滤波器完全相同、但具有较低复杂度的输出。

例如，对于若干系数N=5，系数h0、h2、h4是非零的，而h1 = h3 = 0。用x表示输入，用y表示输出，可以生成下面的滤波器输出：

y(n) = h(0)x(n) + h(1)x(n-1)+ h(2)x(n-2)+h(3)x(n-3)+h(4)x(n-4)

y(n+1) = h(0)x(n+1) + h(1)x(n)+ h(2)x(n-1)+h(3)x(n-2)+h(4)x(n-3)

y(n+2) = h(0)x(n+2) + h(1)x(n+1)+ h(2)x(n)+h(3)x(n-1)+h(4)x(n-2)

y(n+3) = h(0)x(n+3) + h(1)x(n+2)+ h(2)x(n+1)+h(3)x(n)+h(4)x(n-1)

并且在抽取器之后：

y(n) = h(0)x(n) + h(1)x(n-1)+ h(2)x(n-2)+h(3)x(n-3)+h(4)x(n-4)

y(n+2) = h(0)x(n+2) + h(1)x(n+1)+ h(2)x(n)+h(3)x(n-1)+h(4)x(n-2)

由于h1 = h3 = 0，我们可以写成：

y(n) = h(0)x(n) + h(2)x(n-2) + h(4)x(n-4)

y(n+2) = h(0)x(n+2) + h(2)x(n) +h(4)x(n-2) 。

这相当于具有系数h(0)、h(2)、h(4)的滤波器前的抽取器。因此，在该示例中，抽取可以在FIR滤波之前执行。

在一些实施例中，类似的方案可以用于频移。特别地，如果选择频率以提供周期性重复的零系数，则可以将剩余系数应用于抽取的信号（可能地部分抽取的信号，即抽取可以在两个阶段中执行）。

作为被作为频移的一部分执行的抽取的特定示例，可以考虑图11的频移器。在该示例中，频移器之后是抽取器，但可以容易地看出，取代在频移器的输出处选择采样子集的抽取的是，可以改为在各个路径中执行抽取。例如，抽取可以在到加法器的输入处或者实际上在到乘法器的输入处的各个路径上执行（因此需要两个抽取器，每个路径中一个）。

将领会的是，为了清楚起见，以上说明书已经参照不同的功能电路、单元和处理器描述了本发明的实施例。然而，将清楚的是，在不减损本发明的情况下，可以使用不同功能电路、单元或处理器之间的任何合适的功能性分布。例如，所图示为由单独的处理器或控制器执行的功能可以由相同的处理器或控制器执行。因此，对特定功能单元或电路的引用仅被视为对用于提供所描述功能的合适构件的引用，而不是指示严格的逻辑或物理结构或组织。

本发明可以以包括硬件、软件、固件或这些的任何组合的任何合适的形式来实现。本发明可以可选地至少部分地实现为运行在一个或多个数据处理器和/或数字信号处理器上的计算机软件。本发明的实施例的元件和组件可以以任何合适的方式在物理上、功能上和逻辑上实现。实际上，功能可以在单个单元中、在多个单元中或作为其他功能单元的一部分来实现。这样，本发明可以在单个单元中实现，或者可以在物理上和功能上分布在不同的单元、电路和处理器之间。

尽管已经结合一些实施例描述了本发明，但是本发明并旨在被限于本文所阐述的特定形式。相反，本发明的范围仅由所附权利要求来限定。另外，尽管特征可能看起来结合特定实施例被描述，但本领域技术人员将认识到，所描述的实施例的各种特征可以根据本发明进行组合。在权利要求中，术语“包括”不排除其他元件或步骤的存在。

此外，尽管单独列出，但多个构件、元件、电路或方法步骤可以通过例如单个电路、单元或处理器来实现。另外，尽管各个特征可以被包括在不同的权利要求中，但是这些特征可能地可以有利地组合，并且包含在不同的权利要求中并不意味着特征的组合不是可行的和/或有利的。此外，特征包含于一种权利要求类别中并不意味着限于该类别，而是表示该特征同样适当地适用于其他权利要求类别。此外，权利要求中特征的顺序并不意味着其中特征必须起作用的任何特定顺序，并且特别地，方法权利要求中各步骤的顺序并不意味着这些步骤必须按照该顺序来执行。相反地，这些步骤可以以任何适当的顺序执行。此外，单数引用并没有排除复数。因此，对于“一”、“一个”、“第一”、“第二”等的引用并没有排除复数。权利要求中的附图标记仅仅作为澄清的实例而被提供，不应当以任何方式被解释为限制权利要求的范围。

Claims

1.一种音频信号处理装置，包括：

接收器（403），其用于接收在第一采样频率处采样的音频信号，所述音频信号具有不超过阈值频率的最大频率，所述阈值频率比第一采样频率的一半低第一频率裕度；

滤波器组（405），其用于生成数字音频信号的子带信号，所述滤波器组包括提供一组子带的一组重叠的子滤波器；

第一频移器（407），其用于向所述子带组中的至少一个子带应用频移；

抽取器（409），其用于以抽取因子来抽取子带信号，导致具有等于第一采样频率除以抽取因子的抽取采样频率的抽取子带信号，所述抽取采样频率至少是所述重叠的子滤波器中每一个的带宽的两倍；并且

其中用于子带的所述频移被布置成将所述子带移位到为从零到抽取采样频率的一半的频率间隔的倍数的频率间隔。

2.根据权利要求1所述的音频信号处理装置，进一步包括信号处理器，其被布置成通过在每个子带中应用单独的子带信号处理将信号处理算法应用于所述音频信号。

3.根据权利要求2所述的音频信号处理装置，其中所述信号处理算法是语音处理算法，并且所述信号处理器被布置成在不同的子带中应用不同的算法。

4.根据权利要求2所述的音频信号处理装置，其中所述信号处理算法包括应用自适应滤波器，并且所述信号处理器被布置成在不同的子带中单独地调适自适应滤波器。

5.根据权利要求4所述的音频信号处理装置，其中所述音频信号和所述自适应滤波器是用于估计音频信号的回波的回波消除滤波器，所述回波消除滤波器包括用于每个子带的子回波消除滤波器；并且所述信号处理器被布置成：

通过在每个子带中将子回波消除滤波器应用于抽取的子带信号来确定针对每个子带的估计的回波信号；

通过将每个子带中的估计的回波信号与包括音频信号的回波的捕获的音频信号进行比较来确定针对每个子带的误差信号；以及

响应于针对对应子带的误差信号更新每个子回波消除滤波器。

6.根据权利要求2所述的音频信号处理装置，进一步包括合成器（605），其用于从通过每个子带中的子带信号处理生成的经处理的子带信号合成第一采样频率处的音频输出信号；所述合成器（605）包括：

上采样器（701），其用于将经处理的子带信号上采样到第一采样频率以生成经上采样的经处理的子带信号；

第二频移器（703），其用于向经上采样的经处理的子带信号应用反向频移，针对第一子带的所述反向频移导致第一子带被移位到第一子带的子滤波器的频率范围；

子带合并器（705），其用于在应用所述反向频移之后合并经上采样的经处理的子带信号以生成经处理的音频信号；

一组子带滤波器（707），其用于对经上采样的经处理的子带信号进行滤波以衰减每个子带的上采样混叠频谱，所述组子带滤波器中的每个滤波器具有不超过第一采样频率的一半的带宽。

7.根据权利要求6所述的音频信号处理装置，其中所述子带合并器（705）包括所述子带滤波器组中的至少一个，以及

组合器，其用于通过在子带滤波之后组合经上采样的经处理的信号子带来生成经处理的音频信号。

8.根据权利要求1所述的音频信号处理装置，其中针对第一子带的所述频移被给出为：

其中f_d是抽取采样频率，f_m是频移之前的第一子带的中心频率，并且n是整数，n≥1。

9.根据权利要求1所述的音频信号处理装置，其中用于第一子带的子滤波器的衰减在抽取采样频率的一半的倍数的频率处不小于6dB，所述抽取采样频率的一半的倍数的频率以对应于频移的值移位。

10.根据权利要求1所述的音频信号处理装置，其中所述滤波器组由一组功率互补的子滤波器形成。

11.根据权利要求1所述的音频信号处理装置，其中所述组重叠的子滤波器中的每个滤波器具有不超过抽取频率的一半的6dB带宽。

12.根据权利要求1所述的音频信号处理装置，其中所述阈值频率比第一采样频率的一半低不超过10％。

13.一种音频信号处理装置，包括：

接收器，其用于接收在抽取采样率处的一组抽取子带信号，所述抽取的子带信号表示第一采样频率处的音频信号并且具有不超过阈值频率的最大频率，所述阈值频率比第一采样频率的一半低第一频率裕度，所述抽取的子带信号被频移到为从零到抽取采样频率的一半的频率间隔的倍数的频率间隔并且随后以抽取因子被抽取；以及

合成器（605），其用于从所述抽取的子带信号组合成第一采样频率处的音频输出信号；所述合成器（605）包括：

上采样器（701），其用于将抽取的子带信号上采样到第一采样频率以生成经上采样的子带信号；

频移器，其用于向经上采样的子带信号应用反向频移，针对第一抽取的子带信号的所述反向频移导致第一抽取的子带信号被移位到与在频移和抽取之前的音频信号中所述抽取子带信号的频率范围相对应的频率范围；

子带合并器（705），其用于在应用反向频移之后合并经上采样的子带信号以生成合并的音频信号；

14.一种音频信号处理方法，包括：

接收在第一采样频率处采样的音频信号，所述音频信号具有不超过阈值频率的最大频率，所述阈值频率比第一采样频率的一半低第一频率裕度；

滤波器组生成音频信号的子带信号，所述滤波器组包括提供一组子带的一组重叠的子滤波器；

将频移应用于所述子带组中的至少一个子带；

以抽取因子抽取子带信号，导致具有等于第一采样频率除以抽取因子的抽取采样频率的抽取的子带信号，所述抽取采样频率是所述重叠的子滤波器中每一个的带宽的至少两倍；并且

其中针对子带的所述频移将所述子带移位到为从零到抽取采样频率的一半的频率间隔的倍数的频率间隔。

15.一种计算机程序产品，包括适于当所述程序在计算机上运行时执行权利要求14所述的所有步骤的计算机程序代码构件。