CN105895113A - 音频信号处理 - Google Patents

音频信号处理 Download PDF

Info

Publication number
CN105895113A
CN105895113A CN201410253259.7A CN201410253259A CN105895113A CN 105895113 A CN105895113 A CN 105895113A CN 201410253259 A CN201410253259 A CN 201410253259A CN 105895113 A CN105895113 A CN 105895113A
Authority
CN
China
Prior art keywords
signal
time
domain
filtering
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410253259.7A
Other languages
English (en)
Inventor
施栋
孙学京
G·迪金斯
D·麦格拉斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Priority to CN201410253259.7A priority Critical patent/CN105895113A/zh
Priority to PCT/US2015/033808 priority patent/WO2015187711A1/en
Publication of CN105895113A publication Critical patent/CN105895113A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0266Filter banks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

本发明的实施方式涉及音频信号处理。具体而言,公开了一种用于处理时域音频信号的方法。该方法包括对所述时域音频信号进行滤波,以获得时域滤波信号。该方法还包括将所述时域音频信号与所述时域滤波信号相减,以获得与所述时域滤波信号互补的时域互补信号,从而获得多个频带的所述时域音频信号。还公开了相应的系统和计算机程序产品。

Description

音频信号处理
技术领域
本发明总体上涉及音频信号处理,更具体地,涉及用于处理时域音频信号的方法和系统。
背景技术
为了对音频信号进行增强处理或者查看音频信号的特定频带的特性,通常需要首先将该音频信号的频率分成多个频带。然后,利用各种音频增强算法,例如动态均衡、响度补偿、噪声抑制等,对音频信号的多个频带中的每个频带独立地进行处理。通常采用等效矩形带宽(equivalent rectangular bandwidth,ERB)滤波器组将音频信号的频率分成多个频带。
由于上述增强处理操作实际上或多或少地等效于利用不同的滤波器对输入的音频信号进行卷积,因此为了有效地实现该卷积操作,ERB滤波器组的传统实现方式通常在很大程度上依赖于频域处理。在ERB滤波器组,输入的时域音频信号首先被分成加窗的非重叠帧/重叠帧以及不加窗的非重叠帧/重叠帧,随后采用快速傅里叶变换(FFT)将其转换成线性频点。然后,将这些线性频点组合成具有不同带宽的不同ERB频带,以便进一步进行增强处理。为了获得处理后的时域信号,需要利用快速傅里叶逆变换(IFFT)将处理后的频点转换回时域。这种实现方式固有地为多速率系统,并且很有可能在对个别频点进行操作期间引入谐波失真。此外,在ERB滤波器组的传统实现方式中,输入的样本即频点必须被组成帧。这意味着不得不引入额外的帧延迟。
由此,本领域中需要一种能够实现完美重建和无谐波失真的音频信号处理的解决方案。
发明内容
为了解决上述以及其他潜在的问题,本发明提出一种用于处理时域音频信号的方法和系统。
在一方面,本发明的实施方式提供了一种用于处理时域音频信号的方法。该方法包括:对所述时域音频信号进行滤波,以获得时域滤波信号;以及将所述时域音频信号与所述时域滤波信号相减,以获得与所述时域滤波信号互补的时域互补信号,从而获得多个频带的所述时域音频信号。这方面的实施方式还包括相应的计算机程序产品。
在另一方面,本发明的实施方式提供了一种用于处理时域音频信号的系统。该系统包括:滤波单元,被配置为对所述时域音频信号进行滤波,以获得时域滤波信号;以及相减单元,被配置为将所述时域音频信号与所述时域滤波信号相减,以获得与所述时域滤波信号互补的时域互补信号,从而获得多个频带的所述时域音频信号
通过下文描述将会理解,根据本发明的实施方式,能够通过将时域音频信号与时域滤波信号相减而获得与该时域滤波信号互补的时域互补信号。因而,时域滤波信号与时域互补信号的总和严格地等于输入的时域音频信号。换言之,输出信号的总和严格地等于输入信号,因而能够实现输入信号的完美重建。此外,由于所有信号均以单一速率运行在时域,意味着没有像多速率系统那样进行信号的下采样和上采样,因而不会引起谐波失真。本发明的实施方式所带来的其他益处将通过下文描述而清楚。
附图说明
通过参考附图阅读下文的详细描述,本发明实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例而非限制性的方式示出了本发明的若干实施例,其中:
图1示出了根据本发明的示例实施方式的用于处理时域音频信号的方法的流程图;
图2示出适于实施根据本发明的示例实施方式的用于处理时域音频信号的方法的多级滤波器组;
图3示出用于图2中第1级的示例构建块;
图4示意性地示出使音频信号x(n)通过图3所示构建块时的频率响应的幅度;
图5示出说明图2中的某一级的输入与输出之间的关系的图;
图6示出用于滤出图5中的频带1的原型滤波器的幅度响应;
图7示出图6所示原型滤波器的内插版本;
图8示出优化后的滤波器及其原始对称的线性相位滤波器的冲击响应;
图9-11示出根据本发明的一个示例实施方式设计的滤波器组的特性;
图12示出根据本发明的示例实施方式的用于处理时域音频信号的系统的框图;以及
图13示出适于实现本发明的示例实施方式的计算机系统的框图。
在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考附图中示出的若干示例实施例来描述本发明的原理。应当理解,描述这些实施例只是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。
首先参照图1,其示出了根据本发明的示例实施方式的用于处理时域音频信号的方法100的流程图。
在步骤S101,对时域音频信号进行滤波,以获得时域滤波信号。根据本发明的实施方式,所述时域音频信号可以在某个频率范围内。该频率范围可以预先定义,例如根据人类听觉特性或者模型来定义。例如,可以预先定义待处理的时域音频信号在0-24kHz范围内,包括人类用户对其敏感的20Hz-20kHz的频率范围。
在步骤S102,将所述时域音频信号与所述时域滤波信号相减,以获得与所述时域滤波信号互补的时域互补信号,从而获得多个频带的所述时域音频信号。
由此,时域滤波信号与时域互补信号的总和严格地等于输入的时域音频信号。换言之,输出信号的总和严格地等于输入信号,因而利用根据本发明实施方式的方法能够实现输入信号的完美重建。
根据本发明的实施方式,该方法进一步包括对所述时域滤波信号和所述时域互补信号迭代地进行所述滤波和所述相减,以获得期望数目的所述频带。
根据本发明的实施方式,期望数目的所述频带可以预先定义,例如根据人类听觉特性或者模型来定义。在某些实施方式中,通过将0-24kHz的频率范围分成20个频带来获得期望数目的所述频带。例如,可以基于ERB频率标度(scale)来将0-24kHz的频率范围分成20个频带。
根据本发明的实施方式,对时域音频信号进行滤波包括对该时域音频信号进行低通滤波以获得第一低通滤波信号,将时域音频信号与时域滤波信号相减包括将该时域音频信号与该第一低通滤波信号相减,以获得与该第一低通滤波信号互补的第一互补信号。具体而言,在低通滤波中采用的通带的截止频率可以至少部分地基于期望获得的频带来确定,如下文所述。
然后,在第一低通滤波信号和第一互补信号上迭代地进行所述滤波和所述相减,直至获得期望数目的频带。
在下文中将参照图2-11来详细描述根据本发明的实施方式的用于处理时域音频信号的方法。
图2示出了适于实施根据本发明的示例实施方式的用于处理时域音频信号的方法的多级滤波器组200。滤波器组200包括以树形结构布置的多个级,即第1级、第2级......第M级。
时域音频信号x(n)被输入到第1级。如上所述,时域音频信号x(n)的频率范围可以预先定义。例如,时域音频信号x(n)可以在0-24kHz范围内。
时域音频信号x(n)被滤波器组200分成期望数目的频带的信号。所述期望数目的频带例如可以为ERB频带或Bark频带。出于说明目的,下文中将以ERB频带为例进行描述。
具体而言,每个ERB频带的中心频率可以通过如下等式来确定:
f = ( 1000 4.37 ) * ( 10 ( 2 B / 21.4 ) - 1 ) (等式1)
其中f表示每个ERB频带的中心频率,B表示范围在1到20内的频带索引。
表1示意性地示出了通过等式1获得的20个ERB频带的相应中心频率。
表1
应当注意,上面的示例仅仅是出于说明目的,在实施中可以采用任何其他适合的频率范围和/或频带数目。例如,在0-24kHz频率范围内的输入音频信号可以基于Bark频率标度被分成24个频带。应当理解,以Hz为单位的频率与Bark频率标度之间的转换是已知的,因此在此省略其详述。
可以利用各种音频增强算法对期望数目的频带中的每个频带独立地进行处理。由于所有信号均以单一速率在时域被处理,意味着没有像多速率系统那样进行信号的下采样和上采样,因而利用所提出的方法不会引起谐波失真。
第1级、第2级......第M级中的每一级包括具有相同结构的一个或多个构建块。图3示出了用于图2中第1级的示例构建块300。构建块300适于实施根据本发明的示例实施方式的用于处理时域音频信号的方法。
构建块300包括滤波器301和减法器302。输入的时域音频信号x(n)经滤波器301滤波后产生时域滤波信号Hs。减法器302将时域音频信号x(n)与时域滤波信号Hs相减而产生与时域滤波信号Hs互补的互补信号Hc。
根据一个实施方式,滤波器301被配置成低通滤波器,用于对时域音频信号x(n)进行低通滤波以产生第一低通滤波信号Hs。然后,减法器302将时域音频信号x(n)与第一低通滤波信号Hs相减而产生与第一低通滤波信号Hs互补的第一互补信号Hc。
在一个具体实施例中,采用最大误差最小化准则(minimaxcriterion)将低通滤波器301设计成有限长单位冲激响应(FIR)滤波器,其中最大误差最小化准则也被称为切比雪夫准则(Chebyshevcriterion)。在该实施例中,输入的时域音频信号x(n)的全频带(full-band)由低通滤波器301分成两部分:频带1至频带15,以及频带16至频带20。低通滤波器301的期望的通带截止频率基于频带15的中心频率来确定。换言之,低通滤波器301的期望的通带截止频率约为5543Hz。对于低通滤波器301而言,通带和截止带波纹(ripple)均等于-30dB。而且,低通滤波器301被设计为具有线性相位特性。
图4示意性地示出了使时域音频信号x(n)通过图3所示(包括低通滤波器301和减法器302的)构建块时的频率响应的幅度。如图4所示,输入的时域音频信号x(n)通过低通滤波器301和减法器302后产生标记为401的第一低通滤波信号以及标记为402的第一互补信号,第一互补信号402与第一低通滤波信号401互补。从图4中可以看出,第一低通滤波信号401与第一互补信号402的总和恰好等于输入的时域音频信号x(n)。从图4中还可以看出,低通滤波器301的通带截止频率约为5543Hz。
返回到图2,第一低通滤波信号Hs与第一互补信号Hc被进一步输入到随后的第2级.......第M级,以迭代地进行滤波和相减。
具体地,对第一互补信号Hc迭代地进行滤波和相减包括:对第一互补信号Hc进行低通滤波,以获得第二低通滤波信号;将第一互补信号Hc与第二低通滤波信号相减,以获得与第二低通滤波信号互补的第二互补信号;以及对第二低通滤波信号和第二互补信号迭代地进行低通滤波和相减。
下面以图4所示的频率响应为例进行描述。如图4所示,曲线402表示第一互补信号Hc。为了对第一互补信号Hc进行低通滤波以获得例如在5000-10000Hz频带内的第二低通滤波信号,对第一互补信号Hc进行低通滤波时所采用的通带截止频率应当被确定为高于10000Hz。就此而言,可以通过确定适当的通带截止频率来对第一互补信号Hc进行低通滤波,从而获得期望频带内的第二低通滤波信号。
对于上述具体实施例,如上所述,输入的时域音频信号x(n)的全频带由低通滤波器301分成两部分:频带1至频带15,以及频带16至频带20。随着逐级进行滤波,某些级的输入,尤其是在后的几级的输入的频带变窄。实际上,如果设计一个全频带滤波器而仅滤出窄带信号的一部分,其成本是非常高的。相反地,通过在所设计的原型滤波器中内插简单地多的滤波器同样可以达到相同的滤波效果。这将在频率范围内产生多个不期望的副本,而随后通过应用相对简单的滤波器即可去除这些不期望的副本,从而得到期望频带的信号。为了说明这一点,下面参照图5-7来描述如何执行内插操作。
图5示出了说明图2中的某一级的输入与输出之间的关系的图。如图5所示,某一级的输入仅包括频带1和频带2的信号,如标记501所示。期望通过该级滤出标记为502的频带1的信号,并且同时输出与频带1互补的、标记为503的频带2的信号。由于频带2的信号可以通过将输入信号501与频带1的信号相减来获得,因此不需要对频带2的信号执行乘法操作。因而,需要将该级中的滤波器设计为滤出频带1。可以理解,直接实现用于滤出频带1的滤波器将需要非常多的乘法操作,因为频带1的过渡带带宽相当窄,这意味着需要非常长的滤波器。根据本发明的一个实施方式,执行以下操作来降低用于滤出频带1的滤波器的设计复杂度。
首先,设计具有如图6所示的幅度响应的原型滤波器。从图6可以看出,该原型滤波器的过渡带带宽比用于滤出频带1的滤波器的过渡带带宽要宽得多。这意味着该原型滤波器是非常短的。
然后,为了获得所期望的用于滤出频带1的滤波器,应当使该原型滤波器的过渡带带宽变窄。用于使过渡带带宽变窄的一种方式是在该原型滤波器中内插预定数目的冲击响应。图7示出了内插后的原型滤波器。图7所示的滤波器将发挥与所期望的用于滤出频带1的滤波器相同的作用,而其复杂度比所期望的滤波器要低得多。因此,通过将这一思想应用于所有级中的所有滤波器,可以显著减低实施复杂度,意味着需要少得多的乘法操作。用于在原型滤波器中内插冲击响应的很多技术是已知的并且可以用于本发明的实施方式。本发明的范围在这方面不受限制。
返回到图2,经过第M级处理之后,滤波器组200输出频带1、频带2......频带N的信号。可以理解,滤波器组200的级数M可以至少部分地基于待输出的频带的数目N来确定。
从图2可以看出,时域滤波信号Hs与其互补信号Hc的总和等于输入的时域音频信号x(n)。换言之,每个构建块的输出信号的总和均等于该构建块的输入信号。因而,所输出的频带1、频带2......频带N的信号的总和等于输入的时域音频信号x(n)。这意味着利用图2所示的滤波器组200能够实现信号的完美重建。
此外,图2所示结构的另一优点在于,如果仅期望处理频带1、频带2......频带N中的某些频带,那么可以在某些级抽出(tap out)这些频带,从而避免了实现随后的所有级。相比于传统的基于FFT的实现方式,在该实现方式中不得不应用完整的FFT以获得所有的频点,但是可能仅对其中的某些频点感兴趣,所提出的方案可以在很大程度上降低复杂度。
为了降低整个滤波器组200的群时延,需要降低每一级中的每个滤波器的群时延。在采用ERB频带的情况下,由于前几个ERB频带具有非常陡的过渡带,因此显然其冲击响应是非常长的,因而需要占用大量时间来处理。因此,需要对前几个ERB频带进行优化以显著降低群时延。本质上,这可以通过将滤波器的频率响应稍向左移来实现。这将不可避免的产生频率响应失真。然而,只要所产生的失真在可接受水平内,所设计的滤波器则可以认为是可接受的。
对于由其滤波器系数h=[h_0h_1...h_N]来规定的线性相位滤波器,需要找到这样一种最优方案,其中滤波器的频率响应在通带内具有预定义的群时延,并且同时仍保持适当的截止带衰减。可以采用很多已知的优化技术,例如加权最小平方(weighted least squares,WLS)以及二阶锥规划(second order cone programming,SOCP)等。具体地,在采用WLS的情况下,用于频率响应中的每个频点的权重(weight)被迭代地调整。在采用SOCP的情况下,滤波器系数被直接优化以聚合成一种全局最优方案。
图8分别示出了优化后的滤波器及其原始对称的线性相位滤波器的冲击响应。在图8中,曲线801表示优化后的滤波器的冲击响应,而曲线802表示与优化后的滤波器对应的原始对称的线性相位滤波器的冲击响应。从曲线801可以看出,优化后的滤波器具有降低的群时延并且在通带内具有接近线性的相位。如图8所示,具有优化后的低群时延的冲击响应801的主瓣向左进行了移动,意味着该滤波器将对输入的音频信号更快速地做出响应。
出于说明的目的,以上对第1级中的滤波器的设计过程进行了描述。应当理解,在设计M级中的每一级的滤波器时采用不同的原型滤波器。此外,M级中的每一级的滤波器基于相应级的输入频带和期望从其输出的频带来设计。
图9-11示出了根据本发明的一个示例实施方式设计的滤波器组200的特性。在图9-11所示的实施方式中,如上所述的例如内插和降低群时延的优化操作被应用于所有级中的所有滤波器。具体地,图9示出了全部20个频带的幅频响应,图10示出了滤波器组200的总冲击响应,图11示出了滤波器组200的总频率响应。图11(a)表明输入的音频信号的所有频率分量在通过根据本发明的实施方式设计的滤波器组后获得相同的增益1。图11(b)表明输入的音频信号的所有频率分量在通过根据本发明的实施方式设计的滤波器组时被延迟相同的时间。因而,从图10和11可以看出,总冲击响应表明实现了完美重建。换言之,通过根据本发明的实施方式设计的滤波器组能够实现输入音频信号的完美重建。此外,在该实施方式中,在48kHz采样速率下,482个样本的群延迟为10ms,并且对每个输入样本需执行215次乘法操作。
此外,由于滤波器组200的所有操作实质上均为滤波操作,因此能够采用现代数字信号处理器(DSP)有效地执行这些操作,在该DSP中可以完全利用乘法和加法(MAC)操作。因此,滤波器组200具有低复杂度并且是DSP友好的。此外,由于滤波器系数全部为实数且输入信号为实信号,因而无需复杂的乘法操作和FFT。
图12示出根据本发明的示例实施方式的用于处理时域音频信号的系统1200的框图。如图12所示,系统1200包括:滤波单元1201,被配置为对所述时域音频信号进行滤波,以获得时域滤波信号;以及相减单元1202,被配置为将所述时域音频信号与所述时域滤波信号相减,以获得与所述时域滤波信号互补的时域互补信号,从而获得多个频带的所述时域音频信号。
在某些实施方式中,系统1200进一步包括迭代单元,其被配置为对所述时域滤波信号和所述时域互补信号迭代地进行所述滤波和所述相减,以获得期望数目的所述频带。
在某些实施方式中,滤波单元1201进一步被配置为对所述时域音频信号进行低通滤波,以获得第一低通滤波信号。
在某些实施方式中,相减单元1202进一步被配置为将所述时域音频信号与所述第一低通滤波信号相减,以获得与所述第一低通滤波信号互补的第一互补信号。
在某些实施方式中,所述迭代单元进一步被配置为:对所述第一互补信号进行低通滤波,以获得第二低通滤波信号;将所述第一互补信号与所述第二低通滤波信号相减,以获得与所述第二低通滤波信号互补的第二互补信号;以及对所述第二低通滤波信号和所述第二互补信号迭代地进行所述低通滤波和所述相减。
在某些实施方式中,滤波单元1201和所述迭代单元进一步被配置为具有线性相位特性。
在某些实施方式中,滤波单元1201和所述迭代单元中的每一个均包括内插单元,所述内插单元被配置为在所述低通滤波期间,至少部分地基于所述期望数目的所述频带来内插预定数目的冲击响应。
在某些实施方式中,所述期望数目的所述频带具有不同的频带宽度。在某些实施方式中,所述期望数目的所述频带包括等效矩形带宽ERB频带或Bark频带。
为清晰起见,在图12中没有示出系统1200的某些可选部件。然而,应当理解,上文参考图1到图2所描述的各个特征同样适用于系统1200。而且,系统1200中的各部件可以是硬件模块,也可以是软件单元模块。例如,在某些实施例中,系统1200可以部分或者全部利用软件和/或固件来实现,例如被实现为包含在计算机可读介质上的计算机程序产品。备选地或附加地,系统1200可以部分或者全部基于硬件来实现,例如被实现为集成电路(IC)、专用集成电路(ASIC)、片上系统(SOC)、现场可编程门阵列(FPGA)等。本发明的范围在此方面不受限制。
下面参考图13,其示出了适于用来实现本发明实施例的计算机系统1300的示意性框图。如图13所示,计算机系统1300包括中央处理单元(CPU)1301,其可以根据存储在只读存储器(ROM)1302中的程序或者从存储单元1308加载到随机访问存储器(RAM)1303中的程序而执行各种适当的动作和处理。在RAM 1303中,还存储有设备1300操作所需的各种程序和数据。CPU 1301、ROM 1302以及RAM 1303通过总线1304彼此相连。输入/输出(I/O)单元1305也连接至总线1304。
以下部件连接至I/O接口1305:包括键盘、鼠标等的输入单元1306;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出单元1307;包括硬盘等的存储单元1308;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信单元1309。通信单元1309经由诸如因特网的网络执行通信处理。驱动器1310也根据需要连接至I/O接口1305。可移动介质1311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动1310上,以便于从其上读出的计算机程序根据需要被安装入存储单元1308。
特别地,根据本发明的实施例,上文参考图1和图2描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行方法100和/或方法200的程序代码。在这样的实施例中,该计算机程序可以通过通信单元1309从网络上被下载和安装,和/或从可拆卸存储单元1311被安装。
一般而言,本发明的各种示例实施例可以在硬件或专用电路、软件、逻辑,或其任何组合中实施。某些方面可以在硬件中实施,而其他方面可以在可以由控制器、微处理器或其他计算设备执行的固件或软件中实施。当本发明的实施例的各方面被图示或描述为框图、流程图或使用某些其他图形表示时,将理解此处描述的方框、装置、系统、技术或方法可以作为非限制性的示例在硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备,或其某些组合中实施。
而且,流程图中的各框可以被看作是方法步骤,和/或计算机程序代码的操作生成的操作,和/或理解为执行相关功能的多个耦合的逻辑电路元件。例如,本发明的实施例包括计算机程序产品,该计算机程序产品包括有形地实现在机器可读介质上的计算机程序,该计算机程序包含被配置为实现上文描述方法的程序代码。
在本公开的上下文中,机器可读介质可以是包含或存储用于或有关于指令执行系统、装置或设备的程序的任何有形介质。机器可读介质可以是机器可读信号介质或机器可读存储介质。机器可读介质可以包括但不限于电子的、磁的、光学的、电磁的、红外的或半导体系统、装置或设备,或其任意合适的组合。机器可读存储介质的更详细示例包括带有一根或多根导线的电气连接、便携式计算机磁盘、硬盘、随机存储存取器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、光存储设备、磁存储设备,或其任意合适的组合。
用于实现本发明的方法的计算机程序代码可以用一种或多种编程语言编写。这些计算机程序代码可以提供给通用计算机、专用计算机或其他可编程的数据处理装置的处理器,使得程序代码在被计算机或其他可编程的数据处理装置执行的时候,引起在流程图和/或框图中规定的功能/操作被实施。程序代码可以完全在计算机上、部分在计算机上、作为独立的软件包、部分在计算机上且部分在远程计算机上或完全在远程计算机或服务器上执行。
另外,尽管操作以特定顺序被描绘,但这并不应该理解为要求此类操作以示出的特定顺序或以相继顺序完成,或者执行所有图示的操作以获取期望结果。在某些情况下,多任务或并行处理会是有益的。同样地,尽管上述讨论包含了某些特定的实施细节,但这并不应解释为限制任何发明或权利要求的范围,而应解释为对可以针对特定发明的特定实施例的描述。本说明书中在分开的实施例的上下文中描述的某些特征也可以整合实施在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以分离地在多个实施例或在任意合适的子组合中实施。
针对前述本发明的示例实施例的各种修改、改变将在连同附图查看前述描述时对相关技术领域的技术人员变得明显。任何及所有修改将仍落入非限制的和本发明的示例实施例范围。此外,前述说明书和附图存在启发的益处,涉及本发明的这些实施例的技术领域的技术人员将会想到此处阐明的本发明的其他实施例。

Claims (19)

1.一种用于处理时域音频信号的方法,所述方法包括:
对所述时域音频信号进行滤波,以获得时域滤波信号;以及
将所述时域音频信号与所述时域滤波信号相减,以获得与所述时域滤波信号互补的时域互补信号,从而获得多个频带的所述时域音频信号。
2.根据权利要求1所述的方法,进一步包括:
对所述时域滤波信号和所述时域互补信号迭代地进行所述滤波和所述相减,以获得期望数目的所述频带。
3.根据权利要求1或2所述的方法,其中对所述时域音频信号进行滤波包括:
对所述时域音频信号进行低通滤波,以获得第一低通滤波信号。
4.根据权利要求3所述的方法,其中将所述时域音频信号与所述时域滤波信号相减包括将所述时域音频信号与所述第一低通滤波信号相减,以获得与所述第一低通滤波信号互补的第一互补信号。
5.根据权利要求4所述的方法,其中对所述时域互补信号迭代地进行所述滤波和所述相减包括:
对所述第一互补信号进行低通滤波,以获得第二低通滤波信号;
将所述第一互补信号与所述第二低通滤波信号相减,以获得与所述第二低通滤波信号互补的第二互补信号;以及
对所述第二低通滤波信号和所述第二互补信号迭代地进行所述低通滤波和所述相减。
6.根据权利要求1至5中任一项所述的方法,其中所述滤波包括应用具有线性相位特性的滤波器。
7.根据权利要求2至6中任一项所述的方法,进一步包括:
在所述低通滤波期间,至少部分地基于所述期望数目的所述频带来内插预定数目的冲击响应。
8.根据权利要求2至7中任一项所述的方法,其中所述期望数目的所述频带具有不同的频带宽度。
9.根据权利要求2至8中任一项所述的方法,其中所述期望数目的所述频带包括等效矩形带宽ERB频带或Bark频带。
10.一种用于处理时域音频信号的系统,所述系统包括:
滤波单元,被配置为对所述时域音频信号进行滤波,以获得时域滤波信号;以及
相减单元,被配置为将所述时域音频信号与所述时域滤波信号相减,以获得与所述时域滤波信号互补的时域互补信号,从而获得多个频带的所述时域音频信号。
11.根据权利要求10所述的系统,进一步包括:
迭代单元,被配置为对所述时域滤波信号和所述时域互补信号迭代地进行所述滤波和所述相减,以获得期望数目的所述频带。
12.根据权利要求10或11所述的系统,其中所述滤波单元进一步被配置为对所述时域音频信号进行低通滤波,以获得第一低通滤波信号。
13.根据权利要求12所述的系统,其中所述相减单元进一步被配置为将所述时域音频信号与所述第一低通滤波信号相减,以获得与所述第一低通滤波信号互补的第一互补信号。
14.根据权利要求13所述的系统,其中所述迭代单元进一步被配置为:
对所述第一互补信号进行低通滤波,以获得第二低通滤波信号;
将所述第一互补信号与所述第二低通滤波信号相减,以获得与所述第二低通滤波信号互补的第二互补信号;以及
对所述第二低通滤波信号和所述第二互补信号迭代地进行所述低通滤波和所述相减。
15.根据权利要求10至14中任一项所述的系统,其中所述滤波单元和所述迭代单元进一步被配置为具有线性相位特性。
16.根据权利要求11至15中任一项所述的系统,其中所述滤波单元和所述迭代单元中的每一个均包括内插单元,所述内插单元被配置为在所述低通滤波期间,至少部分地基于所述期望数目的所述频带来内插预定数目的冲击响应。
17.根据权利要求11至16中任一项所述的系统,其中所述期望数目的所述频带具有不同的频带宽度。
18.根据权利要求11至17中任一项所述的系统,其中所述期望数目的所述频带包括等效矩形带宽ERB频带或Bark频带。
19.一种用于处理时域音频信号的计算机程序产品,所述计算机程序产品被有形地存储在非瞬态计算机可读介质上,并且包括机器可执行指令,所述指令在被执行时使得所述机器执行根据权利要求1到9中任一项所述的方法的步骤。
CN201410253259.7A 2014-06-06 2014-06-06 音频信号处理 Pending CN105895113A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410253259.7A CN105895113A (zh) 2014-06-06 2014-06-06 音频信号处理
PCT/US2015/033808 WO2015187711A1 (en) 2014-06-06 2015-06-02 Audio signal processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410253259.7A CN105895113A (zh) 2014-06-06 2014-06-06 音频信号处理

Publications (1)

Publication Number Publication Date
CN105895113A true CN105895113A (zh) 2016-08-24

Family

ID=54767288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410253259.7A Pending CN105895113A (zh) 2014-06-06 2014-06-06 音频信号处理

Country Status (2)

Country Link
CN (1) CN105895113A (zh)
WO (1) WO2015187711A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110335620A (zh) * 2019-07-08 2019-10-15 广州欢聊网络科技有限公司 一种噪声抑制方法、装置和移动终端

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2760011A (en) * 1954-10-25 1956-08-21 Cons Electrodynamics Corp Frequency separating apparatus
US4137510A (en) * 1976-01-22 1979-01-30 Victor Company Of Japan, Ltd. Frequency band dividing filter

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110335620A (zh) * 2019-07-08 2019-10-15 广州欢聊网络科技有限公司 一种噪声抑制方法、装置和移动终端
CN110335620B (zh) * 2019-07-08 2021-07-27 广州欢聊网络科技有限公司 一种噪声抑制方法、装置和移动终端

Also Published As

Publication number Publication date
WO2015187711A1 (en) 2015-12-10

Similar Documents

Publication Publication Date Title
AU2011304113B2 (en) Cross product enhanced subband block based harmonic transposition
CN104681034A (zh) 音频信号处理
EP2036201B1 (en) Filter unit and method for generating subband filter impulse responses
JPS634710A (ja) 周波数域ブロック適応ディジタルフィルタ
CN105141285A (zh) 对音频信号处理的装置和对时域音频信号进行处理的方法
CN101627428A (zh) 抑制杂音的方法、装置以及程序
CN106601266A (zh) 回声消除方法、装置及系统
Balan On signal reconstruction from its spectrogram
Tseng et al. Designs of fractional derivative constrained 1-D and 2-D FIR filters in the complex domain
Haghshenas Lari et al. Nonstationary blind deconvolution of seismic records
US20170317663A1 (en) Signal Processing Method and Apparatus
Boashash et al. Efficient software platform TFSAP 7.1 and Matlab package to compute Time–Frequency Distributions and related Time-Scale methods with extraction of signal characteristics
CN105895113A (zh) 音频信号处理
Guo et al. A spectral method for reflectivity estimation
CN103714825A (zh) 基于听觉感知模型的多通道语音增强方法
Okoniewski et al. A concept of IIR filters with time-varying coefficients and equalised group delay response
US20160179458A1 (en) Digital signal processing using a combination of direct and multi-band convolution algorithms in the time domain
Yatabe et al. Convex-optimization-based post-processing for computing room impulse response by frequency-domain FEM
CN106549652A (zh) 时域滤波中的滤波器系数更新
CN106297813A (zh) 分离的音频分析和处理
CN104079513B (zh) 初始均衡器系数的高效计算
US10816584B2 (en) Spectrum extension edgeless gating for reduced time domain gating edge errors
CN103004086B (zh) 基于误差子带的自适应滤波方法及系统
AU2023201183B2 (en) Cross Product Enhanced Subband Block Based Harmonic Transposition
EP2871641A1 (en) Enhancement of narrowband audio signals using a single sideband AM modulation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160824