CN102576537A - 用于处理音频信号的方法和装置 - Google Patents

用于处理音频信号的方法和装置 Download PDF

Info

Publication number
CN102576537A
CN102576537A CN2010800453798A CN201080045379A CN102576537A CN 102576537 A CN102576537 A CN 102576537A CN 2010800453798 A CN2010800453798 A CN 2010800453798A CN 201080045379 A CN201080045379 A CN 201080045379A CN 102576537 A CN102576537 A CN 102576537A
Authority
CN
China
Prior art keywords
signal
band
filter
band signal
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800453798A
Other languages
English (en)
Other versions
CN102576537B (zh
Inventor
R·尼尔米斯托
J·P·瓦尔蒂艾宁
B·杜米特雷斯库
R·布赖戈维茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Origin Asset Group Co ltd
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of CN102576537A publication Critical patent/CN102576537A/zh
Application granted granted Critical
Publication of CN102576537B publication Critical patent/CN102576537B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

本发明涉及用于处理音频信号的方法和装置,其中该方法包括以下步骤:将音频信号滤波为至少三个频带信号,为每个频带信号生成多个子带信号,处理来自至少一个频带的至少一个子带信号,以及将处理的子带信号进行组合、以形成组合的处理音频信号;该装置包括至少一个处理器和至少一个包括计算机程序代码的存储器,该至少一个存储器和计算机程序代码配置为与至少一个处理器一起使得该装置执行该方法。

Description

用于处理音频信号的方法和装置
技术领域
本申请涉及用于音频信号处理的装置。本申请进一步、但不限于涉及用于处理移动设备中的音频信号的装置。
背景技术
电子装置、特别是移动或便携式电子装置可以配备有整体麦克风装置或用于接收麦克风信号的合适的音频输入。这允许了捕获和处理合适的音频信号,以用于处理、解码、存储或传输至另外的设备。例如,蜂窝电话可以具有配置为生成音频信号的麦克风装置,该音频信号的格式适于处理并通过蜂窝通信网络传输至另一设备,在该另一设备处,该信号继而可被解码并传递至合适的收听装置,例如头戴式耳机或扬声器。类似地,一些多媒体设备配备有用于音频捕获事件的单声道或多声道麦克风装置,以用于随后的回放或传输。
发明内容
电子装置可进一步包括音频捕获装置,其可包括麦克风装置或接收来自一个或多个麦克风的音频信号,且可执行一些预编码处理以降低噪声。例如,模拟信号可转换为数字格式,以用于进一步处理。
在试图记录来自远处的音频信号源的全谱带音频信号时,所需信号可能比背景或干扰噪声弱,因而可能需要此预处理。一些噪声是记录器外部的,其可被认为是固定声音背景或环境噪声。
这种固定声音背景噪声的典型来源为例如空调单元、投影机风扇、计算机风扇、或其他机器的风扇。举例来说,机器噪声的示例为例如洗衣机和洗碗机的家用机器,例如交通噪声的车辆噪声。干扰的其他来源可能来自附近环境中的其他人,例如在音乐会上录音机附近的人的哼唱,或者例如风吹过树的自然噪声。
其他干扰噪声可能为系统内部。例如,“麦克风噪声”或者麦克风自噪声。麦克风自噪声与任何特定的麦克风组件无关,但是其为一普遍问题,其与远离信号源的任何麦克风的基本噪声限制和距离衰减有关。在这种情况下,简单地在麦克风输出处增加放大器不能有效地解决该问题,因为放大器同等地放大信号和噪声。
除了麦克风自噪声以外,音频捕获装置中还有其他的噪声源。例如,模拟数字转换器可以是麦克风的噪声源。典型使用的麦克风与在普通电话和音频捕获设备中使用的类似,其针对采样率在8kHz或16kHz的范围而设计。由于这些设计限制,典型的设计使得量化噪声最低低于8kHz。进一步地,在过采样的模拟数字转换器的抽取器中使用的低通滤波器规定了高频在混杂(aliase)在低频上之前所衰减的程度。
由麦克风产生的这些音频信号的音频信号处理是已知的。除了用于噪声抑制或补偿以衰减麦克风噪声(或其他噪声)的需求以外,用于麦克风噪声抑制和类似的噪声抑制任务的滤波器组结构具有如下设计需求,以降低噪声水平:
1、音频质量(音频信号应当被记录且不失真);
2、存储器(滤波器组应当不需要大量的存储器来存储滤波器组配置,换句话说,滤波器应当不需要存储大量的值);
3、计算复杂度(滤波器组不应当复杂到需要强大的处理能力,并因此增大用于移动设备等的电池的能量负担);以及
4、延迟(在处理中不应当存在非常大的延迟,因为其可能影响通信通路)。
已知的滤波器组技术典型地产生大量的量化噪声,或针对合适的计算复杂度和存储器,不能产生用于全带音频的足够质量。已知的其他方法需要在用于低频的滤波器上设置非常窄的频带。为了在低频上产生足够的频率分辨率,可能需要许多滤波器,这在存储器和计算能力上是很昂贵的。其他的方法产生特别长的延迟,且对于高频带信号不具有足够的频率分辨率。
本申请着手于考虑改进滤波器组机构,其可以配置为具有可容许的延迟、存储要求和计算复杂度,而不牺牲音频质量。进一步地,设计了一种结构和装置,使得除了噪声抑制以外,其他的音频处理可以利用该滤波器组结构,并因此节省处理器系统的计算和存储能力。
根据本发明的一个方面,提供了一种方法,包括将音频信号滤波为至少三个频带信号;为每个频带信号生成多个子带信号;处理来自至少一个频带的至少一个子带信号;以及将处理的子带信号组合、以形成组合的处理音频信号。
将音频信号滤波为至少三个频带信号可包括:将该音频信号高通滤波为至少三个频带信号的第一频带信号;将该音频信号低通滤波为低通滤波信号;以及将该低通滤波音频信号下采样、以生成所述至少三个频带信号的组合的第二和第三频带信号。
将该低通滤波音频信号进行下采样以生成所述至少三个频带信号的组合的第二和第三频带信号的因子优选为3。
将音频信号滤波为至少三个频带信号可进一步包括:将所述至少三个频带信号的组合的第二和第三频带信号进行高通滤波、以形成所述至少三个频带信号的第二频带信号;将所述至少三个频带信号的组合的第二和第三频带信号进行低通滤波;以及将所述至少三个频带信号的低通滤波的组合第二和第三频带信号下采样、以生成所述至少三个频带信号的第三频带信号。
将所述至少三个频带信号的低通滤波的组合第二和第三频带信号进行下采样以生成所述至少三个频带信号的第三频带信号的因子优选为2。
为每个频带信号生成多个子带信号可包括将该频带信号滤波为多个子带。
将该频带信号滤波为多个子带可包括:生成M带频带滤波器;从该M带频带滤波器中选择至少两个带,并组合用于该至少两个带的输出;以及将修改的M带频带滤波器应用至该频带,以生成该频带的子带信号。
处理来自至少一个频带的至少一个子带信号可包括将噪声抑制应用至所述来自至少一个频率信号的至少一个子带信号。
将处理的子带信号组合、以形成组合的处理音频信号可包括:将处理的子带信号进行组合、以形成至少三个处理的频带信号。
将处理的子带信号组合、以形成组合的处理音频信号可进一步包括:将所述至少三个处理的频带信号的第一频带信号上采样;将该至少三个处理的频带信号的上采样的第一频带信号进行低通滤波;以及
将至少三个处理的频带信号的低通滤波的、上采样的第一频带信号与所述至少三个处理的频带信号的第二频带信号进行组合,以生成至少三个处理的频带信号的组合的第一和第二频带信号。
将所述至少三个处理的频带信号的第一频带信号进行上采样的因子优选为2。
将处理的子带信号组合、以形成组合的处理音频信号可进一步包括:延迟至少三个处理的频带信号的第二频带信号,以将至少三个处理的频带信号的低通滤波的、上采样的第一频带信号与至少三个处理的频带信号的第二频带信号同步。
将处理的子带信号组合可包括:将至少三个处理的频带信号的组合的第一和第二频带信号进行上采样;将至少三个处理的频带信号的上采样的、组合的第一和第二频带信号进行低通滤波;以及
将至少三个处理的频带信号的低通滤波的、升频的组合第一和第二频带信号与至少三个处理的频带信号的第三频带信号进行组合,以生成组合的处理音频信号。
将至少三个处理的频带信号的组合的第一和第二频带信号进行上采样的因子优选为3。
将处理的子带信号组合、以形成组合的处理音频信号可进一步包括:将至少三个处理的频带信号的第三频带信号延迟,以将至少三个处理的频带信号的低通滤波的、上采样的组合第一和第二频带信号与至少三个处理的频带信号的第三频带信号同步。
该方法可进一步包括配置第一组滤波器,其包括:用于将音频信号高通滤波为至少三个频带信号的第一频带信号的第一滤波器;用于将音频信号低通滤波为低通滤波信号的第二滤波器;以及用于将至少三个处理的频带信号的上采样的组合第一和第二频带信号进行低通滤波的第三滤波器。
配置第一组滤波器可包括在将与平坦频率响应的偏差保持在低于预定水平的条件下,通过将用于第一和第二滤波器的阻带能量最小化来配置用于第一和第二滤波器的至少一个滤波器参数。
配置第一组滤波器可包括:针对至少一次迭代执行如下操作:在保持用于第一滤波器的滤波器参数固定的条件下,配置用于第二和第三滤波器的至少一个滤波器参数,然后在保持用于第三滤波器的滤波器参数固定的条件下,配置用于第一和第二滤波器的至少一个滤波器参数。
该方法可进一步包括配置第二组滤波器,其包括:用于将至少三个频带信号的组合的第二和第三频带信号进行高通滤波、以形成至少三个频带信号的第二频带信号的第一滤波器;用于将至少三个频带信号的组合的第二和第三频带信号进行低通滤波的第二滤波器;和用于将至少三个处理频带信号的上采样的第一频带信号进行低通滤波的第三滤波器。
配置第二组滤波器可包括:在将与平坦频率响应的偏差保持在低于预定水平的条件下,通过将用于第一和第二滤波器的阻带能量最小化来配置用于第一和第二滤波器的至少一个滤波器参数。
配置第二组滤波器可进一步包括:针对至少一次迭代执行如下操作:在保持用于第一滤波器的滤波器参数固定的条件下,配置用于第二和第三滤波器的至少一个滤波器参数,然后在保持用于第三滤波器的滤波器参数固定的条件下,配置用于第一和第二滤波器的至少一个滤波器参数。
根据本发明的第二方面,提供了一种装置,包括至少一个处理器和至少一个包括计算机程序代码的存储器,该至少一个存储器和计算机程序代码配置为与所述至少一个处理器一起,使得该装置至少执行:将音频信号滤波为至少三个频带信号;为每个频带信号生成多个子带信号;处理来自至少一个频带的至少一个子带信号;以及将处理的子带信号组合、以形成组合的处理音频信号。
将音频信号滤波为至少三个频带信号可使得该装置至少进一步执行:将该音频信号高通滤波为至少三个频带信号的第一频带信号;将该音频信号低通滤波为低通滤波信号;以及将该低通滤波音频信号进行下采样、以生成所述至少三个频带信号的组合的第二和第三频带信号。
将该低通滤波音频信号进行下采样、以生成所述至少三个频带信号的组合的第二和第三频带信号的因子优选为3。
将音频信号滤波为至少三个频带信号可使得该装置至少进一步执行:将所述至少三个频带信号的组合的第二和第三频带信号进行高通滤波、以形成所述至少三个频带信号的第二频带信号;将所述至少三个频带信号的组合的第二和第三频带信号进行低通滤波;以及将所述至少三个频带信号的低通滤波的组合第二和第三频带信号进行下采样、以生成所述至少三个频带信号的第三频带信号。
将所述至少三个频带信号的低通滤波的组合第二和第三频带信号进行下采样、以生成所述至少三个频带信号的第三频带信号的因子优选为2。
为每个频带信号生成多个子带信号可使得该装置至少进一步执行将该频带信号滤波为多个子带。
将该频带信号滤波为多个子带可使得该装置至少进一步执行:生成M带频带滤波器;从该M带频带滤波器中选择至少两个带,并组合用于该至少两个带的输出;以及将修改的M带频带滤波器应用至该频带,以生成该频带的子带信号。
处理来自至少一个频带的至少一个子带信号可使得该装置至少进一步执行将噪声抑制应用至所述来自至少一个频率信号的至少一个子带信号。
将处理的子带信号进行组合、以形成组合的处理音频信号可使得该装置至少进一步执行:将处理的子带信号进行组合、以形成至少三个处理的频带信号。
将处理的子带信号进行组合、以形成组合的处理音频信号可使得该装置至少进一步执行:将所述至少三个处理的频带信号的第一频带信号进行上采样;将该至少三个处理的频带信号的上采样的第一频带信号进行低通滤波;以及将至少三个处理的频带信号的低通滤波的、上采样的第一频带信号与所述至少三个处理的频带信号的第二频带信号进行组合,以生成至少三个处理的频带信号的组合的第一和第二频带信号。
将所述至少三个处理的频带信号的第一频带信号进行上采样的因子优选为2。
将处理的子带信号进行组合、以形成组合的处理音频信号可使得该装置至少进一步执行:延迟至少三个处理的频带信号的第二频带信号,以将至少三个处理的频带信号的低通滤波的、上采样的第一频带信号与至少三个处理的频带信号的第二频带信号同步。
将处理的子带信号进行组合可使得该装置至少进一步执行:将至少三个处理的频带信号的组合的第一和第二频带信号进行上采样;将至少三个处理的频带信号的上采样的组合的第一和第二频带信号进行低通滤波;以及将至少三个处理的频带信号的低通滤波的、上采样的组合第一和第二频带信号与至少三个处理的频带信号的第三频带信号进行组合,以生成组合的处理音频信号。
将至少三个处理的频带信号的组合的第一和第二频带信号进行上采样的因子优选为3。
将处理的子带信号进行组合、以形成组合的处理音频信号可使得该装置至少进一步执行:将至少三个处理的频带信号的第三频带信号延迟,以将至少三个处理的频带信号的低通滤波的、上采样的组合第一和第二频带信号与至少三个处理的频带信号的第三频带信号同步。
该装置优选地进一步配置为执行:配置第一组滤波器,其包括:用于将音频信号高通滤波为至少三个频带信号的第一频带信号的第一滤波器;用于将音频信号低通滤波为低通滤波信号的第二滤波器;以及用于将至少三个处理的频带信号的上采样的、组合的第一和第二频带信号进行低通滤波的第三滤波器。
配置第一组滤波器可使得该装置至少进一步执行:在将与平坦频率响应的偏差保持在低于预定水平的条件下,通过将用于第一和第二滤波器的阻带能量最小化来配置用于第一和第二滤波器的至少一个滤波器参数。
配置第一组滤波器可使得该装置至少进一步执行:针对至少一次迭代执行如下操作:在保持用于第一滤波器的滤波器参数固定的条件下,配置用于第二和第三滤波器的至少一个滤波器参数,然后在保持用于第三滤波器的滤波器参数固定的条件下,配置用于第一和第二滤波器的至少一个滤波器参数。
该装置优选地进一步配置为执行:配置第二组滤波器,其包括:用于将至少三个频带信号的组合的第二和第三频带信号进行高通滤波、以形成至少三个频带信号的第二频带信号的第一滤波器;用于将至少三个频带信号的组合的第二和第三频带信号进行低通滤波的第二滤波器;和用于将至少三个处理频带信号的上采样的第一频带信号进行低通滤波的第三滤波器。
配置第二组滤波器可使得该装置至少进一步执行:在将与平坦频率响应的偏差保持在低于预定水平的条件下,通过将用于第一和第二滤波器的阻带能量最小化来配置用于第一和第二滤波器的至少一个滤波器参数。
配置第二组滤波器可使得该装置至少进一步执行:针对至少一次迭代执行如下操作:在保持用于第一滤波器的滤波器参数固定的条件下,配置用于第二和第三滤波器的至少一个滤波器参数,然后在保持用于第三滤波器的滤波器参数固定的条件下,配置用于第一和第二滤波器的至少一个滤波器参数。
根据本发明的第三方面,提供了一种编码有指令的计算机可读介质,当其由计算机实施时,其执行:将音频信号滤波为至少三个频带信号;为每个频带信号生成多个子带信号;处理来自至少一个频带的至少一个子带信号;以及将处理的子带信号组合、以形成组合的处理音频信号。
根据本发明的第四方面,提供了一种装置,其包括:用于将音频信号滤波为至少三个频带信号的滤波装置;用于为每个频带信号生成多个子带信号的子带生成装置;用于处理来自至少一个频带的至少一个子带信号的处理装置;以及用于将处理的子带信号组合、以形成组合的处理音频信号的组合装置。
一种电子设备,其可包括如上所述的装置。
一种芯片组,其可包括如上所述的装置。
根据本发明的第五方面,提供了一种装置,其包括至少一个滤波器,其配置为将音频信号滤波为至少三个频带信号;至少一个滤波器组,其配置为为每个频带信号生成多个子带信号;信号处理器,其配置为处理来自至少一个频带的至少一个子带信号;以及信号组合器,其配置为将处理的子带信号组合、以形成组合的处理音频信号。
附图说明
为了更好地理解本发明,现将以示例的方式参照附图如下:
图1示意性示出了使用本发明的实施例的电子设备;
图2示意性示出了使用本发明的实施例的音频捕获系统;
图3示意性示出了根据本发明的一些实施例的音频捕获数字处理器;
图4示出了说明根据本发明的一些实施例的音频捕获数字处理器的操作的流程图;
图5示出了说明根据本发明的实施例的音频捕获数字处理器控制器的操作的流程图;
图6示出了说明根据本发明的实施例的外部滤波器组优化的操作的流程图;
图7示出了说明根据本发明的实施例的内部滤波器组优化的操作的流程图;
图8示意性示出了根据本发明的实施例的描述外部滤波器组响应的光谱图;
图9示意性示出了根据本发明的实施例的描述内部滤波器组响应的光谱图;
图10示意性示出了根据本发明的实施例的描述子带滤波器组响应的光谱图;以及
图11示意性示出了根据本发明的一些实施例的描述第M个原型频带滤波器的幅度响应的光谱图,其中M=16。
具体实施方式
以下描述了用于提供改进音频捕获设备和装置的装置和方法。就此而言首先参见图1,其图示了示例性电子设备或装置10的框图,其包括根据本发明的一些实施例的音频捕获装置。
在一些实施例中,电子设备10为移动终端、移动电话或用于在无线通信系统中操作的用户设备。
电子设备10包括麦克风11,其通过模数转换器14连接至处理器21。处理器21进一步通过数模转换器32连接至扬声器33。处理器21进一步连接至收发器(TX/RX)13、用户接口(UI)15和存储器22。
处理器21可以配置为执行多种程序代码23。在一些实施例中,实施的程序代码23包括音频捕获数字处理或配置代码。在一些实施例中,实施的程序代码23进一步包括用于进一步处理音频信号的附加代码。在一些实施例中,实施的程序代码23例如可在存储器22中存储,以用于在需要时由处理器21取回。在一些实施例中,存储器22可以进一步提供用于存储数据的部分24,例如根据本发明处理的数据。
在一些实施例中,音频捕获装置可以至少部分地以硬件实现,而无需软件或固件。
在一些实施例中,用户接口15使用户能够例如通过小键盘向电子设备10输入命令,和/或例如通过显示器从电子设备10获得信息。收发器13例如通过无线通信网络能够与其他电子设备通信。
还可以理解的是,电子设备10的结构可以以多种方式补充或变化。
电子设备10的用户可以使用用于输入语音的麦克风11,该语音将被传输至一些其他的电子设备或存储在存储器22的数据部分24中。在一些实施例中,对应的应用可以由用户通过用户接口15为此而激活。在一些实施例中,此应用可以由处理器21运行,以使处理器21执行存储器22中存储的代码。
在一些实施例中,模数转换器14可以配置为将输入的模拟音频信号转换为数字音频信号,并将该数字音频信号提供给处理器21。
然后,处理器21可以以参照图2和图3描述的相同方式处理该数字音频信号。
在一些实施例中,由此产生的比特流可以被提供给收发器13,用于传输至另一个电子设备。或者,编码数据可以存储在存储器22的数据部分24,例如用于由同一电子设备10随后的传输或呈现。
在一些实施例中,电子设备10也可以通过其收发器13从另一个电子设备接收带有音频信号数据的比特流。在这些实施例中,处理器21执行存储在存储器22中的处理程序代码。在一些实施例中,处理器21然后可以处理接收的数据,并可以将解码的数据提供给数模转换器32。在一些实施例中,数模转换器32可以将数字数据转换为模拟音频数据,并通过扬声器33输出该音频数据。在一些实施例中,接收的音频处理程序代码的执行也可以由用户通过用户接口15调用的应用来触发。
在一些实施例中,接收的信号可以按照与参照图2和图3的从麦克风11和模数转换器14接收的音频信号的处理方式类似的方式进行处理,以从记录的音频信号中去除噪声。
在一些实施例中,代替于经由扬声器33立即呈现,接收的已处理音频数据也可以存储在存储器22的数据部分24中,例如用于支持随后的呈现或转发至又一个电子设备。
可以意识到,图2和图3中描述的图示结构以及图4至图7中的方法步骤只呈现了完整系统的操作的一部分,该完整系统包括在如图1中示出的电子设备中实现的应用的一些实施例。
图2示出了音频捕获装置的示意性配置图,该音频捕获装置包括麦克风、模数转换器、数字信号处理器、数字音频控制器和数字音频编码器。在该应用的其他实施例中,音频捕获装置可以仅包括数字音频处理器,其中来自外部源的数字信号输入至预先配置的数字音频处理器,并进一步将音频已处理信号输出至外部编码器。
与图1中描述的那些类似的元件使用相同的附图标记。麦克风11接收音频波并将其转换为模拟电信号。麦克风11可以为任意合适的声电换能器。可能的麦克风的示例可以为电容麦克风、电子麦克风、动圈麦克风、炭精麦克风、压电式麦克风、光纤麦克风、液体麦克风和微机电系统(MEMS)麦克风。
从音频声波捕获模拟音频信号在图4的步骤301中示出。
电信号可以被传递至模数转换器(ADC)14。
模数转换器14可以为用于转换来自麦克风的模拟电信号并输出数字信号的任意合适的模数转换器。模数转换器可以输出任意合适形式的数字信号。进一步地,取决于实施例,模数转换器14可以为线性或非线性模数转换器。例如,在一些实施例中,模数转换器可以为对数模数转换器。数字输出可以被传递至数字音频处理器101。
模拟音频信号至数字信号的转换通过图4中的步骤303示出。
数字音频处理器101可以配置为对数字信号进行处理以试图提高音频源与多种噪声或干扰源的信号噪声干扰比(SNIR)。
数字音频处理器的结构的示意性表示在图3中详细示出。
数字音频处理器101可包括频带和子带发生器部分281,其接收来自模数转换器14的数字信号,在一些实施例中以及如图3所示,其可以将数字信号分为三个频带。图3中示出的三个频带为第一(高频)带291;第二(中频)带293;和第三(低频)带295。频带和子带发生器部分281可进一步从每个带生成子带值。在一些实施例中,高频带295可以为8kHz至24kHz(因此具有采样频率48kHz),中频带293可以为4kHz至8kHz(需要采样频率16kHz),以及低频带293可以直至4kHz(需要采样频率8kHz)。
频带和子带发生器部分281可包括分析滤波器组251和子带滤波器组253。分析滤波器组251可接收数字输入并执行数字信号的初始分析滤波以生成以上指出的频带。换句话说,分析滤波器组251可以以高、中、低频带输出频带滤波信号至子带滤波器组253。
如图3中所示,分析滤波器组251可以包括分析滤波器组外部部分261和分析滤波器组内部部分263,分析滤波器组外部部分261配置为将信号分为高频带和组合的中、低频带,分析滤波器组内部部分263配置为将混合的中、低频带分为中频带和低频带。
在一些实施例中,分析滤波器组外部部分261可包括第一分析滤波器组外部滤波器H01 201,其配置为接收数字信号并将滤波信号输出至子带滤波器组253,更具体地,输出至高频带子带滤波器组211。随后将详细讨论第一分析滤波器组外部滤波器H01的配置和设计,但是在一些实施例中,其可被认为是在中频带/高频带门限具有确定门限频率的高通滤波器。
在一些实施例中,分析滤波器组外部部分261可进一步包括第二分析滤波器组外部滤波器H00 203,其接收数字信号并将滤波信号输出至分析滤波器组外部中频带下采样器205。随后也将详细讨论第二分析滤波器组外部滤波器H00 203的配置和设计,但是在一些实施例中,其可被认为是在中频带/高频带具有确定门限频率的低通滤波器。分析滤波器组外部中频带下采样器205可以为任意合适的下采样器。在一些实施例中,中频带下采样器205是值为3的整数下采样器。继而,中频带下采样器205可以输出一下采样输出信号至分析滤波器组内部部分263。换句话说,在一些实施例中,中频带下采样器205从滤波输入样本中选择并输出每第三个样本,以将采样频率“降低”至16kHz,并将此滤波和下采样信号输出至分析滤波器组内部部分263。
在一些实施例中,第二分析滤波器组外部滤波器H00 203和中频带下采样器205的组合可以认为是用于将采样率从48kHz降低至16kHz的抽取器。
分析滤波器组内部部分263可以接收分析滤波器组外部中频带下采样器205的输出,也就是组合的中频带和低频带信号,并进一步地将组合的中频带和低频带信号分为中频带信号和低频带信号。分析滤波器组内部部分263可包括第一分析滤波器组内部滤波器H11 207,其配置为自中频带下采样器205接收输出并将滤波信号输出至子带滤波器组253,更具体地,输出至中频带子带滤波器组213。随后将详细讨论第一分析滤波器组内部滤波器H11的配置和设计,但是在一些实施例中,其可被认为是在低频带/中频带具有确定门限频率的高通滤波器。
分析滤波器组内部部分263也可包括第二分析滤波器组内部滤波器H10 208,其配置为自中带下采样器205接收输出并将滤波信号输出至分析滤波器组内部低频带下采样器209。随后将详细讨论第二分析滤波器组内部滤波器H10 208的配置和设计,但是在一些实施例中,其可被认为是在低频带/中频带具有确定门限频率的低通滤波器。分析滤波器组内部低频带下采样器209可以为任意合适的下采样器。在一些实施例中,低频带下采样器209是值为2的整数下采样器。然后,低频带下采样器205将下采样输出信号输出至子带滤波器组253,更具体地,输出至低频带子带滤波器组215。换句话说,在一些实施例中,低频带下采样器209从滤波样本中选择并输出每第二个样本,以将采样频率“降低”至8kHz,并将此滤波和下采样器信号输出至子带滤波器组。
在一些实施例中,第二分析滤波器组内部滤波器H10 208和低频带下采样器209的组合可以认为是用于将采样率从16kHz降低至8kHz的另一抽取器。
使用分析滤波器和下采样器将信号分为多个频带的划分通过图4的步骤305示出。
在一些实施例中,诸如图3中所示的子带滤波器组253可以包括用于每个频带的子带滤波器。来自第一分析滤波器组外部滤波器H01 201的高频带信号可以被传递至高频带子带滤波器211,来自第一分析滤波器组内部滤波器H11 207的中频带信号可以被传递至中频带子带滤波器211,来自内部低频带下采样器209的低频带信号被传递至低频带子带滤波器215。
每个子带滤波器211、213和215可以实现和/或设计为由数字音频控制器105所控制。子带滤波的执行是为了获得足够的频率分辨率,以用于噪声抑制处理。在本发明的一些实施例中,数字音频控制器105可以配置基于余弦调制滤波器组。由于这些实施例可以使用求和来将已处理的子带重新组合为带,因此可以选择该实现来简化合成实现(如随后所述)。
在一些实施例中,数字音频控制器105可以将子带滤波器组实现为第M个频带滤波器,其标准为求得该滤波器和理想滤波器之间的误差的最小二乘值的最小值。换句话说,可以选择子带滤波器以最小化如下公式:
Σ ω ∈ Ω λ | H d ( ω ) - H ( ω ) | 2
其中,λ(ω)表示加权值,Hd(ω)指代理想滤波器,Ω指代频率的坐标或范围,H(z)=∑hkz-k为第M个频带滤波器。在一些实施例中,子带滤波器可以关于中间抽头1对称,例如
Figure BPA00001531439600161
和h1±kM=0。在一些实施例中,数字音频控制器105可以根据基于余弦调制滤波器组的子带的数量和宽带为M选择合适的值。在一些实施例中,由于输入信号本身只在某些频率上具有有意义的内容,因此数字音频控制器105可以将由子带滤波器组生成的子带进行组合。数字音频控制器105可以通过将对应的子带滤波器组滤波系数相加来合并相邻的子带,以在这些实施例中实现此配置。
进一步地,在一些实施例中,数字音频控制器105可以使用以便节省用于所有的三个子带滤波器组的相同的滤波器设计的存储。可以意识到,数字音频控制器105因此可以实现相同的滤波器设计并产生不同的结果。使用前述三种频带示例,其中,高频带使用48kHz采样频率,中频带使用16kHz采样频率,低频带使用8kHz采样频率,适用于所有三种频带子带滤波器的原型滤波器可以输出两倍于低频带子带带宽的中频带子带带宽。类似地,在使用相同的原型滤波器的实施例中,用于高频带的子带带宽是低频带子带带宽的六倍(或者换句话说,是中频带子带带宽的三倍)。
图10示出了子带配置频率响应输出的示例,其中高频带子带滤波器用于接收48kHz采样信号FB48 211,中频带子带滤波器用于接收16kHz采样信号FB16 213,低频带子带滤波器用于接收8kHz采样信号FB8 215。在此示例中,M=16的滤波器组设计用于所有的三种子带滤波器。可以参考图11所示的幅值响应对归一化频率图示出合适的M=16的滤波器组。来自“低频带子带滤波器组215’的低频响应由加号“+”901显示。在此示例中,通过将用于三个最高子带的对应的滤波器组系数相加来合并三个最高子带而产生七个子带滤波信号。在此示例中显示的频率响应是在与滤波器H00、和插值(下采样)H10滤波器响应的卷积之后。
代表“中频带子带滤波器组FB16 213’的来自相同的滤波器组设计的频率响应由叉号“×”903显示。在此示例中,通过将用于五个最低和三个最高子带的对应的子带滤波器组系数相加来将五个最低的子带合并至单个子带和三个最高子带,从而自滤波器产生三个子带滤波信号。在此示例中显示的频率响应是在与滤波器H00、和插值(下采样)H11滤波器响应的卷积之后。
对于“高频带子带滤波器组FB48 211’的频率响应由三角“△”905显示。在此示例中,通过将用于最低的三个和最高的三个子带的对应的滤波器组系数相加,最低的三个子带被合并至单个子带中,最高的三个子带被合并至单个子带中。在此示例中显示的频率响应是在与滤波器H01的卷积之后。
因此,在这些实施例中,共有9个具有不同系数的滤波器,这些是用于低频子带滤波器组FB8的七个滤波器,和与中频子带滤波器组FB16和高频子带滤波器组FB48中各自的最低频带对应的滤波器。
在一些实施例中,音频控制器可以配置子带滤波器组,使得阻带衰减适度。这可适用于这些实施例,因为没有抽取或插值,因此可能不需要更强的衰减。
从带至子带的划分在图4中的步骤309中显示。
这些子带滤波器组的输出被传递至噪声处理设备255,更具体地,传递至处理模块221。
数字音频处理器101可进一步包括噪声处理设备255,更具体地是处理模块221,其配置为接收子带音频信号、对子带信号执行噪声降低算法、以及将处理的子带信号输出至子带至带转换器257。
处理模块221可以由数字音频控制器105设计或配置为抑制低水平背景噪声。由处理模块221处理的子带数量可由数字音频控制器105根据音频应用来确定。因此,在一些需要相当强的背景噪声衰减的实施例中,可能需要更好的频率分辨率以用于最低的频率,因此,选择处理更低频率的子带。但是,在其他实施例中,如果需要简单修改音频频谱(例如在动态范围控制(DRC)或等同化),可以选择更小数量的子带。
处理模块221可以配置为使用任意适于音频信号子带处理的合适的噪声抑制技术来执行噪声抑制。例如,在一些实施例中,处理模块221可以配置为执行例如在US5839101、或US-2007/078645中示出的噪声抑制技术。
对至少一个子带应用抑制算法在图4的步骤311中示出。
噪声处理设备255向数字音频处理器101的组合部分285输出已处理信号。组合部分285可包括子带至带转换器257和合成滤波器组259。
噪声滤波设备255的输出可以配置为与子带至带转换器257连接,在一些实施例中,可自噪声滤波设备255,更具体地,在一些实施例中,自处理模块221接收已处理子带信号并向合成滤波器组259输出组合的已处理频带信号。
子带至带转换器257可包括三个求和设备,每个设备配置为接收针对频带之一的已处理子带信号,并进一步配置为对接收的子带信号求和,以生成已处理频带信号。
换句话说,子带至带转换器257可包括高频带求和设备231,其配置为对与用于48kHz高频带的子带关联的已处理音频信号求和,并将信号进行组合,以将高频带处理信号输出至合成滤波器组259。在一些实施例中,高频带求和设备将高频带处理信号输出至第一合成滤波器组外部滤波器F01 241,在一些实施例中,其可为单纯的延迟滤波器,其标记为Z-D48
进一步地,在一些实施例中,子带至带转换器257可包括中频带求和设备233,其配置为对与用于16kHz中频带的子带关联的已处理音频信号求和,并将信号进行组合,以将中频带处理信号输出至合成滤波器组259。在一些实施例中,中频带求和设备可以将中频带处理信号输出至第一合成滤波器组内部滤波器F11 243,在一些实施例中,其可为单纯的延迟滤波器,其标记为Z-D16
在这些实施例中,子带至带转换器257可进一步包括低频带求和设备235,其配置为对与用于8kHz低频带的子带关联的已处理音频信号求和,并将信号进行组合,以将低频带处理信号输出至合成滤波器组259。在一些实施例中,低频带求和设备235将低频带处理信号输出至第一合成滤波器组内部插值器247。
将已处理子带组合以输出已处理频带信号在图4的步骤313中示出。
因此,在一些实施例中,合成滤波器组259可以接收划分为频带的处理数字音频信号,滤波并组合诸频带以生成单个的处理数字音频信号。
如图3中所示,合成滤波器组259可包括合成滤波器组内部部分265和合成滤波器组输出部分267,合成滤波器组内部部分265配置为将来自低、中频带的信号组合至组合的中、低频带中,合成滤波器组输出部分267配置为将组合的中、低频带信号与高频带信号组合至单个处理音频信号输出中。
合成滤波器组内部部分265可以接收中频带求和设备233和低频带求和设备235的输出,换言之,接收组合的处理中、低频带信号,对它们进行滤波并组合成组合的处理中、低频信号。
合成滤波器组内部部分265可包括第一合成滤波器组内部滤波器F11 243(在一些实施例中也可标记为Z-D16),其配置为接收来自中频带求和设备233的输出,并将滤波信号输出至合成滤波器组内部组合器244的第一输入。第一合成滤波器组内部滤波器243的设计和实现将在以下进一步详细讨论,但在一些实施例中,其可以认为是单纯的延迟滤波器,其延迟选择为与合成滤波器组内部部分的低频带分支的滤波延迟相匹配。
合成滤波器组内部部分265也可包括合成滤波器组内部低频带上采样器247,其配置为接收处理低频带信号,在此示例中,其以8kHz采样,并将该信号上采样至中频带采样频率。在此示例中,插值器是值为2的整数上采样器,换句话说,上采样器在每一对样本之间加入一新的样本值,其可认为是以16kHz对处理低频信号的重新采样。然后,低频带上采样器247可将上采样输出信号输出至第二合成滤波器组内部滤波器F1 248(在一些实施例中,第二合成滤波器组内部滤波器也可标记为F10)。
第二合成滤波器组内部滤波器F1248的配置和设计也将在随后详细讨论,但在一些实施例中,其可以认为是在低频带/中频带具有确定门限频率的低通滤波器。第二合成滤波器组内部滤波器F1 248的输出可以输出至合成滤波器组内部组合器244的第二输入。
在一些实施例中,第二合成滤波器组内部滤波器F1 248和低频带插值器209的组合可以认为是对信号插值,使采样率从8kHz至16kHz。
合成滤波器组内部组合器244接收滤波处理中频带信号和滤波处理低频带信号,并将组合的处理中、低频带信号输出至合成滤波器组输出部分267。
在一些实施例中,合成滤波器组输出部分267可包括第一合成滤波器组外部滤波器F01 241(在一些实施例中也可标记为Z-D48),并配置为接收来自高频带求和设备231的输出,以及将滤波信号输出至合成滤波器组外部组合器249的第一输入。第一合成滤波器组外部滤波器F01的配置和设计将在随后详细讨论,但在一些实施例中,其可以认为是单纯的延迟滤波器,其具有足够确定延迟以使其与第二合成滤波器组外部滤波器F0 246的输出同步。
在一些实施例中,合成滤波器组输出部分267可进一步包括合成滤波器组外部中/低频带上采样器245,其配置为接收合成滤波器组内部组合器244的输出,并输出适于与高频带信号组合的上采样版本。在一些实施例中,中/低频带上采样器245是值为3的整数上采样器。换句话说,在一些实施例中,中/低频带上采样器245在每对样本之间增加两个新的样本,以将采样频率从16kHz “提高”至48kHz。然后,中/低频带上采样器245可将上采样输出信号输出至第二合成滤波器组外部滤波器F0 246。
在一些实施例中,第二合成滤波器组外部滤波器F0 246可被标记为F00,其从合成滤波器组外部中/低频带上采样器245接收上采样信号,并将滤波信号输出至合成滤波器组外部组合器249的第二输入。第二合成滤波器组外部滤波器F0 246的配置和设计也将在随后详细讨论,但在一些实施例中,其可以认为是在中频带/高频带具有确定门限频率的低通滤波器。
在一些实施例中,第二合成滤波器组外部滤波器F0 246和中/低频带上采样器245的组合可以认为是将采样率从16kHz提高至48kHz的插值器。
合成滤波器组外部组合器249接收滤波处理高频带信号和滤波处理中/低频带信号,并输出组合信号。在一些实施例中,此输出被输出至数字音频编码器103,以用于在存储或传输之前进一步编码。
组合已处理频带的操作在图4的步骤317中显示。
数字音频编码器103可进一步根据任何合适的编码处理对处理数字音频信号进行编码。例如,数字音频编码器103可实施例如国际电信联盟技术板块(ITU-T)G.722或G729编码族中任意的合适的无损或有损编码处理。在一些实施例中,数字音频编码器103为可选的,可以不实施。
音频信号进一步编码的操作在图4的步骤319中显示。
根据本发明的实施例的数字音频控制器105可配置为选择用于实现滤波器组滤波器H00、H01、H10、H11、F0和F1的参数。在音频信号中,通常在最低频率上可以有很强的分量。这些分量在任意插值处理期间可以镜像至高带频率上。换句话说,插值滤波器(合成滤波器)F0和F1可以由数字音频控制器进行配置,以具有对应于最强镜像频率的一个或多个零并使这些镜像分量衰减。由数字音频控制器对滤波器的配置可以在以上描述的音频处理前执行,且可以取决于实施例来执行一次或多次。例如,在一些实施例中,数字音频控制器105可以为与数字音频处理器分离的设备,在工厂初始化和测试过程中,数字音频控制器105在被从装置上移除之前配置数字音频处理器的参数。在其他实施例中,数字音频控制器能够应装置或用户的需要频繁地重新配置数字音频处理器。例如,如果装置初始配置为用于例如古典音乐会的复杂音乐的高保真捕获,控制器可以用于将装置和数字音频处理器重新配置为用于在蜂窝通信系统上声音通信的语音音频捕获。
数字音频控制器105对滤波器的配置或设置可参照图5看出,其示出了用于确定合成和分析滤波器参数的两阶段过程。
数字音频控制器105的第一操作为确定用于分析滤波器组外部滤波器和合成滤波器组外部滤波器的实现参数。换句话说,滤波器H00 203、H01 201、F0 246(也标记为F00)和F10 241(也标记为Z-D48)的配置。
关于图3中所示的装置,如果在Z域、离散拉普拉斯域中,数字音频处理器101的输入定义为X0(z)、从数字音频处理器101的输出定义为Y0(z),则对于滤波器组的外部部分的输入-输出关系(如果我们假设在处理模块和内滤波器组中没有处理的话)可由如下等式表示:
Y 0 ( z ) = 1 3 F 00 ( z ) H 00 ( z ) X 0 ( z ) + F 01 ( z ) H 01 ( z ) X 0 ( z )
+ 1 3 ( F 00 ( z ) H 00 ( e j 2 / 3 π z ) X 0 ( e j 2 / 3 π Z ) + F 00 ( z ) H 00 ( e j 4 / 3 π z ) X 0 ( e j 4 / 3 π Z ) )
在一些实施例中,控制器试图使输出为具有低失真的输入的延迟版本,换句话说,
Figure BPA00001531439600223
其中L0代表由滤波器组产生的延迟。
在本发明的一些实施例中,如果进一步假设合成(或插值)滤波器的形式为
Figure BPA00001531439600224
其中,
G0(z)=(z-1-ej2/3π)(z-1-e-j2/3π)=z-2-2cos(2/3π)z-1+1
则插值器(上采样器245和F0滤波器246的组合)可以配置为在16kHz具有一个零。
在一些实施例中实现的分析滤波器组外部滤波器和合成滤波器组外部滤波器的确定将在图6中进一步详细描述。
对于初始操作,控制器将合成外部滤波器F01(z-D48)241和F00246分别配置为分析外部滤波器H01 201和H00 203的时间翻转版本。
控制器105在合成滤波器为分析滤波器的时间翻转版本的初始假设下操作。该初始假设操作通过图6中的步骤501可见。
已执行的控制器现试图使用如下表示来初始计算用于分析滤波器H00和H01的参数:
min H 00 , H 01 λ 00 ∫ ω 00 π | H 00 ( ω ) | 2 + λ 01 ∫ 0 ω 01 | H 01 ( ω ) | 2
s . t . | 1 3 | H 00 ( ω ) | 2 + | H 01 ( ω ) | 2 - 1 | ≤ δ 0 ( ω ) , ω∈Ω
其中Ω代表频率坐标,δ0(ω)定义了在这些频率中的每一个中允许的失真(与平坦频率响应的偏差),ω00和ω01分别代表中/低频带和高频带的阻带边缘,λ00和λ01代表加权函数值。
现在,控制器105可将此最小化认为表示成半正定规划(SDP)问题,其唯一的解可以使用任意已知的半正定规划解来得到。
因此,在一些实施例中,控制器可以确定初始滤波器参数,其使得阻带能量最小化,其约束为只具有一个小的总失真(与平坦频率响应的小偏差),其也使通带值接近一。
通过在只有一个小的总失真条件下将阻带能量最小化(换句话说将阻带能量最小化,而将与平坦频率响应的偏差保持在预定水平之下)来确定H00和H01滤波器参数的操作可在图6中通过步骤503可见。
然后,控制器105可去除合成外部滤波器F01(z-D48)241和F00246分别为分析外部滤波器H01 201和H00 203的时间翻转版本的假设。
在一些实施例中,控制器105可以初始化迭代步骤处理。
控制器可以使用以下表达式确定用于第二合成滤波器组外部滤波器F0 246和第一分析滤波器组外部滤波器H01 201的参数,其中第二分析滤波器组外部滤波器H00 203固定:
min F ~ 0 , H 01 λ 02 ∫ ω 00 π | F ~ 0 ( ω ) G 0 ( ω ) | 2 + λ 01 ∫ 0 ω 01 | H 01 ( ω ) | 2
s . t . | 1 3 H 00 ( ω ) F ~ 0 ( ω ) G 0 ( ω ) + H 01 ( ω ) e - jω D 48 - e jω L 0 | ≤ δ 0 ( ω ) , ω∈Ω,其中
H00(ω)固定。
关于固定的H00而选择用于F0和H01的滤波器参数的迭代的第一部分操作通过图6中的步骤505显示。
然后,在迭代的第二部分中,控制器105可试图针对以下表达式确定用于第一分析滤波器组外部滤波器H01201和第二分析滤波器组外部滤波器H00 203的参数:
min H 00 , H 01 λ 00 ∫ ω 00 π | H 00 ( ω ) | 2 + λ 01 ∫ 0 ω 01 | H 01 ( ω ) | 2
s . t . | 1 3 H 00 ( ω ) F ~ 0 ( ω ) G 0 ( ω ) + H 01 ( ω ) e - jω D 48 - e - jω L 0 | ≤ δ 0 ( ω ) , ω∈Ω,其中
Figure BPA00001531439600245
固定。
在固定第二合成滤波器组外部滤波器的条件下确定用于第一和第二分析滤波器H01 201和H00 203的参数的操作通过图6中的步骤507显示。
以上迭代过程均可以表示为二阶锥(SOC)问题,其可由控制器105迭代式求解。如前述,Ω代表频率坐标,δ0(ω)定义了控制在每个频率中允许多少失真的参数,ω00和ω01分别代表中/低频带和高频带的边缘频率,λ00、λ01和λ02代表加权函数。
因此,控制器105可以尝试在只具有一个小的总体失真的约束下,最小化阻带能量(换句话说,降低阻带能量,而将与平坦频率响应的偏差保持在预定水平之下)。此处理可使通带接近一。
然后,控制器105可执行检查步骤以确定由当前参数生成的滤波器关于预定条件是否可接受。检查步骤在图6中由步骤509显示。
当检查步骤确定滤波器可接受时,则操作转至步骤511。当检查步骤确定需要进一步迭代时,控制器105转回至迭代的第一部分,关于固定的H00确定用于合成滤波器F0和分析滤波器H01的参数。
迭代处理可以与初始化处理非常相关。在由发明人执行的测试中可以观察到,初始滤波器H00和H01越短,一般提供的解越好。进一步地,控制器可将时间翻转的H00(换句话说是最大相位滤波器)用作用于H00滤波器的初始估计,其中在子带之间的时间同步很重要。因此,在一些实施例中,尽管通常分析滤波器为最小相位,而合成滤波器为最大相位,但是对于初始估计来说,将H00设定为最大相位可能与H01延迟(其为近似线性相位)更匹配。
关于由滤波器组产生的总延迟L0,控制器105可以根据任意合适的值来设定该值。也如同之前所述,控制器可以根据H01滤波器的长度来确定用于第一合成滤波器组外部滤波器F01 201和单纯延迟滤波器z-D48的参数。z-D48参数的确定通过图6中的步骤511显示。在实施例中,H01和单纯延迟滤波器z-D48的群延迟将确定与定义为用于L0的值近似。在一些实施例中,控制器105可以确定用于第一分析滤波器组外部滤波器H01 201的参数为具有近似线性相位,换言之,具有恒定的延迟。在一些实施例中,控制器105可以确定滤波器参数,使得滤波器H00 203和F0 246延迟可以随频率而不同,但是卷积滤波器特征H00(z)F01(z)在所有频率上具有近似恒定的延迟L0
关于图8,其显示了关于第二合成滤波器组外部滤波器F0 246、第一分析滤波器组外部滤波器H01 201和第二分析滤波器组外部滤波器H00 203的频率响应的合适示例。在这些示例中,高频带分析滤波器,即第一分析滤波器组外部滤波器H01 201的频率响应由加号“+”703标记,其具有在8kHz以上的通带中的近似线性响应。中/低频带分析滤波器,即第二分析滤波器组外部滤波器H00 203的频率响应由叉号“×”701标记的轨迹显示,其显示为具有从8kHz(衰减大于40db)的阻带。中/低合成滤波器,即第二合成滤波器组外部滤波器F0 246的频率响应由三角“△”705标记的轨迹定义,其显示为具有从8kHz的阻带和在16kHz的零。
在一些实施例中,控制器105关注于插值器滤波器,即第二合成滤波器组外部滤波器F0 246,由于典型的音频信号低频分量相对较强,在这些实施例中,控制器可以将插值器滤波器F0 246配置为显著衰减低频分量镜像图像。
在本发明的一些实施例中,外部的滤波器组和内部的滤波器组下采样器可不配置为具有强的衰减,因为与用于低频带上的音频信号的频率分量相比,在衰减后混淆的频率相对低。
在一些实施例中,在迭代步骤的第一优化中,控制器105可提高λ02的加权,其可随之提高第二合成滤波器组外部滤波器F0 246的阻带衰减。同样如图中所示,可以在2/3π的归一化频率处引入一个或多个零来衰减最强的镜像频率。
确定用于分析滤波器组外部滤波器和合成滤波器组外部滤波器的实施参数通过图5中的步骤401显示。
数字音频控制器105的第二操作为确定用于分析滤波器组内部滤波器和合成滤波器组内部滤波器的实施参数。换句话说是滤波器H11 207、H10 208、F1 246(也标记为F10)和F11 243(也标记为z-D16)的配置。内组滤波器参数的确定过程在图7中进一步详细显示。
关于图3中所示的设备,在Z域中,如果数字音频处理器101的内部分析滤波器组的输入定义为X1(z),从内部合成滤波器组的输出定义为Y1(z),则输入输出关系(假设处理模块没有处理)可以如下表达式所定义:
Y 1 ( z ) = 1 2 F 10 ( z ) H 10 ( z ) X 1 ( z ) + 1 2 F 10 ( z ) H 10 ( - z ) X 1 ( - z ) + F 11 ( z ) H 11 ( z ) X 1 ( z ) .
控制器105可试图配置滤波器以使输出Y1为输入X1的具有低失真的延迟版本,换句话说,
Figure BPA00001531439600262
其中L1代表内部滤波器组滤波器产生的延迟。
控制器105合成滤波器为分析滤波器的时间翻转版本的初始假设下操作。初始假设操作可通过图7中的步骤601可见。
在此假设下,控制器105可通过选择在只具有一个小的总失真的约束下具有最小化阻带能量的滤波器(换句话说,降低阻带能量,而将与平坦频率响应的偏差保持在预定水平之下)来产生用于分析滤波器H10和H11的初始估计。换句话说,通过求解出如下表达式:
min H 10 , H 11 λ 10 ∫ ω 10 π | H 10 ( ω ) | 2 + λ 11 ∫ 0 ω 11 | H 11 ( ω ) | 2
s . t . | 1 2 | H 10 ( ω ) | 2 + | H 11 ( ω ) | 2 - 1 | ≤ δ 1 ( ω ) , ω∈Ω
其中,Ω代表频率坐标,δ1(ω)定义了这些频率的每个中允许的失真,ω10和ω11分别代表低频带和中频带频率范围的阻带边缘,λ10和λ11代表加权函数。
现在,控制器105可将此最小化认为是以半正定规划(SDP)问题来表示,其唯一的解可以使用任意已知的半正定规划解来得到。半正定规划解的可行示例为已知的,例如在http://sedumi.ie.lehigh.edu/可获得的SeDuMi(自对偶最小化)。半正定规划解进一步在关于以下主题的论文中描述:Lieven Vandenberghe和Stephen Boyd于1996年三月在SIAM Review 38第49-95页发表的“Semidefinite Programming(半正定规划)”(http://stanford.edu/~boyd/papers/pdf/semidef_prog.pdf)。
用于H10和H11的初始化滤波器参数的操作在图7的步骤603中显示。
现在,控制器105可去除合成内部滤波器F11(z-D16)243和F10 248分别是分析内部滤波器H11 207和H10 208的时间翻转版本的假设。在一些实施例中,控制器105可初始化迭代步骤过程以产生更能接受的滤波器参数。
控制器105可以在固定第二分析滤波器组内部滤波器H10 208的条件下确定用于第二合成滤波器组内部滤波器F1 248和第一分析滤波器组内部滤波器H11 207的参数,换句话说,试图选择F1和H11滤波器来求解出以下表达式:
min F 1 , H 11 λ 12 ∫ ω 10 π | F 1 ( ω ) | 2 + λ 11 ∫ 0 ω 11 | H 11 ( ω ) | 2
s . t . | 1 2 H 10 ( ω ) F 1 ( ω ) + H 11 ( ω ) e - jω D 16 - e - jω L 1 | ≤ δ 1 ( ω ) , ω ∈ Ω
其中H10(ω)固定,其中,Ω代表频率坐标,δ1(ω)定义了这些频率的每个中允许的失真,ω10和ω11代表低频带和中频带的阻带,λ10和λ11代表加权函数。
在固定H10的条件下确定滤波器F1和H11的迭代步骤1的执行在图7中由步骤605显示。
然后在迭代的第二部分中,控制器105试图以如下等式来确定用于第一分析滤波器组内部滤波器H11207和第二分析滤波器组内部滤波器H10208的参数:
min H 10 , H 11 λ 10 ∫ ω 10 π | H 10 ( ω ) | 2 + λ 11 ∫ 0 ω 11 | H 11 ( ω ) | 2
s . t . | 1 2 H 10 ( ω ) F 1 ( ω ) + H 11 ( ω ) e - jω D 16 - e - jω L 1 | ≤ δ 1 ( ω ) , ω∈Ω
其中具有固定的F1(ω)。如前所述,Ω代表频率坐标,δ1(ω)定义了这些频率的每个中允许的失真,ω10和ω11代表低频带和中频带的阻带,λ10和λ11代表加权函数。这两个迭代处理问题均可表示为二阶锥问题,并由控制器105迭代式求解。二阶锥问题是半正定问题的特殊情况。因此在一些实施例中,可以应用与以上应用于半正定解类似的解。在一些其他的实施例中,可以应用这样的二阶锥解,例如由F.Alizadeh和D.Goldfarb在Mathematical Programming,2003年第95卷第1册第3-51页提出的“Second-order cone programming(二阶锥规划)”中给出的方法,其可从以下网址参考,http://www.springerlink.com/index/J5G1 JR7C4BR8Y656.pdf。
控制器105可选择参数以在只具有一个小的总失真的约束下使阻带能量最小化,其也使得通带接近一。
在固定第二合成滤波器组内部滤波器F1 248的条件下,确定用于第一和第二分析滤波器组滤波器H11 207和H10 208的参数的操作在图7中通过步骤607显示。
然后,控制器105可执行检查步骤,以确定由当前参数生成的滤波器关于预定条件是否可接受。检查步骤在图7中通过步骤609显示。
当检查步骤确定该滤波器可接受时,然后操作转至步骤611。当检查步骤确定需要进一步迭代时,控制器105转回至迭代的第一部分,其中针对固定的H10确定用于合成滤波器F1和分析滤波器H11的参数。
控制器105的迭代将取决于初始化和加权值。在发明人的试验中显示,确定的初始滤波器H10和H11越短,所提供的滤波器解越好。进一步地,控制器可将时间翻转的H10(换句话说是最大相位滤波器)用作用于F1滤波器的初始估计,其中子带之间的时间同步很重要。
内部滤波器组的总延迟L1可根据任意合适的值来设定。控制器105可根据确定的滤波器H11的长度来选择用于单纯延迟滤波器F11(Z-D16)的值。特别在一些实施例中,控制器可确定用于滤波器F11的值,以使滤波器H11和滤波器F11的群延迟加起来近似为总延迟L1。F11参数的确定在图7中通过步骤611显示。
在一些实施例中,控制器105可确定用于第一分析滤波器组内部滤波器H11 207的参数,其具有近似线性的相位,换句话说具有恒定的延迟。在一些实施例中,控制器105可确定滤波器参数以使滤波器H10 208和F1 248的延迟随频率而不同,但是其卷积滤波器特性H10(z)F1(z)在所有的频率上具有近似恒定的延迟L1
关于图9,其显示了对于第二合成滤波器组内部滤波器F1 248、第一分析滤波器组内部滤波器H11 207和第二分析滤波器组内部滤波器H10 208的频率响应的合适示例。在这些示例中,中频带分析滤波器,即第一分析滤波器组内部滤波器H11 207的频率响应使用加号“+”803标记,其具有在从4kHz以上的通带中接近线性的响应。低频带分析滤波器,即第二分析滤波器组内部滤波器H10 208的频率响应通过使用叉号“×”801标记的轨迹显示,其显示具有从4kHz开始的阻带(衰减大于40db)。低合成滤波器,即第二合成滤波器组内部滤波器F1 248的频率响应由使用三角“△”805标记的轨迹定义,其显示为具有从4kHz开始的阻带。
控制器105特别关注于为插值器滤波器F1设计特性。控制器可以这样做是因为低频可能特别强,而滤波器被配置为衰减镜像图象。抽取器可能不产生显著的衰减,因为与低频带上的频率相比,衰减后混淆的频率相对低。由控制器处理的设计可能不提供严格的手段来单独控制衰减,但是控制器可以提高第一迭代操作中的λ12来提高F1滤波器的阻带衰减。
尽管以上关于单声道信号进行了描述,但是多声道信号和多音节信号也可实施在多个实施例中。在这些实施例中,首先计算关于所有信道或信道对、以及每个带的背景噪声估计,然后对于每个带,最小的值被存储为背景噪声估计。在这些实施例中,这些实施例的目标在于衰减远距离噪声源。当录音源或信号源足够接近录制设备,以使得其水平在不同的麦克风或录制点处显著不同时,如上所述的这些实施例中的处理的操作不会抑制音频信息。
尽管以上描述的装置和数字音频处理器103具有特定的结构,应当理解的是,根据实施例可以有多个替换的可能的实现方式。
例如,在应用的一些实施例中,数字音频处理器103可以具有用于外部和内部滤波器组的不同的顺序。在这些实施例中,分析内部滤波器组操作可以发生在外部滤波器组操作之前,类似的,合成外部滤波器组可以发生在内部组操作之前。
在一些实施例中,用于高、中、或低频带中任意一个的采样率可与以上所述的值不同。例如,在一些实施例中,中频带可以具有24kHz的采样频率。
进一步地,在一些实施例中,除了使用48kHz采样频率输入信号以外,输入信号可以为44.1kHz采样信号,换句话说,为紧致盘(CD)格式数字信号。在这些实施例中,使用在以上实施例中描述的结构的中频带和低频带可以认为是分别具有14.7kHz(中频带)和7.35kHz(低频带)的采样率。
在本发明的一些实施例中,输入可以为具有32kHz采样频率的信号,因为通常大于14kHz的信号被认为是不重要的,且在那些频率具有很少的信息。在这种实施例中,外部和内部滤波器组均可配置为上采样和下采样的因子为二。
在本发明的其他实施例中,控制器105可将外插值器滤波器F0 246配置为具有多于一个“零”,且根据要处理的信号来将这些“零”配置在合适的频率。
进一步地,由于主带上的子带的数量和大小由噪声抑制的需求来指示,因此例如动态范围控制(DRC)的其他应用可使用不同数量的边带以及具有不同子带宽度的边带。
在本发明的一些实施例中,可使用少于或多于在以上描述的实施例中示出的三个带。例如,在一些实施例中,为了获得足够的频率分辨率以用于抑制对于越低频率分量越强的噪声,低频带可进一步分割。例如,在这些实施例中,0至4kHz的低频带可分为2kHz至4kHz的高-低频带和上至2kHz的低-低频带。
在一些实施例中,针对在子带滤波器中的操作描述的基于余弦的调制滤波器组可使用用于原型滤波器的更高或更低的M值,并组合合适的滤波器系数以产生需要的子带分布。
为了产生更好的频率分辨率,在本发明的一些实施例中,可在最低频带上使用快速傅里叶变换。
进一步地,数字音频处理器103可配置为用于音频渲染,换句话说,用于音乐动态范围控制DRC。在这种实施例中,16比特和更高的处理可以用于提供足够的质量。
本发明的这种实施例可产生足够用于音频录制的音频质量,其具有需要相对低存储需求的滤波器(对于缓冲器大小和滤波器系数存储均适用)。进一步地,在上述的实施例中,滤波器可以具有可容许的计算复杂度和相对短的延迟,因为抽取器和插值器只在其需要的时候使用。
因此,在本申请的一些实施例中,提供一种方法,其包括以下操作:将音频信号滤波为至少三个频带信号,为每个频带信号生成多个子带信号,处理来自至少一个频带的至少一个子带信号,以及将处理的子带信号进行组合以形成组合的处理音频信号。
在一些其他的实施例中,提供一种装置,包括至少一个处理器和至少一个包括计算机程序代码的存储器,该至少一个存储器和计算机程序代码配置为与所示至少一个处理器一起使得该装置至少执行以上所述操作。
进一步地,在一些实施例中,装置可包括配置为将音频信号滤波为至少三个频带信号的至少一个滤波器、配置为为每个频带信号生成多个子带信号的至少一个滤波器组、配置为处理来自至少一个频带的至少一个子带信号的信号处理器、以及配置为将处理的子带信号进行组合以形成组合的处理音频信号的信号组合器。
尽管本发明的上述示例实施例在电子设备10或装置内部操作,但是可以意识到,如以下所述的本发明可以实现为一系列音频处理阶段中的任意音频处理阶段的一部分。
进一步地,用户设备、通用串行总线(USB)棒和调制解调数据卡可包括音频捕获装置,例如以上实施例所描述的装置。
可以意识到,术语用户设备旨在覆盖任意合适类型的无线用户设备,例如移动电话、便携式数据处理设备或便携式网络浏览器。
进一步地,公共陆地移动网络(PLMN)的元件也可包括如上所述的音频捕获和处理装置。
一般的,以上所述的各种实施例可实现在硬件或专用电路、软件、逻辑或其任意组合中。例如,一部分可实现在硬件中,而另一方面可实现在由控制器、微处理器或其他计算设备执行的固件或软件中,但是本发明并不仅限于此。尽管本发明的多个方面可由模块图、流程表或是使用一些其他的图示表达进行图示或描述,可以理解的是,作为非限定性示例,这些在此描述的模块、装置、系统、技术或方法可以实现在硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或者其他的计算设备,或者是其一些组合。
本申请的实施例可以实现为由数据处理器执行的计算机软件,例如在处理器实体内,或是实现为硬件、或者软件和硬件的组合。进一步地,在此方面,应当注意到如图中的逻辑流的任意模块可以表示程序步骤、互联逻辑电路、模块和函数、或者是程序步骤和逻辑电路与模块和函数的组合。软件可以存储在例如存储芯片、实现在处理器中的存储块的这种物理介质上,或者例如硬盘或软磁盘的磁介质上,以及例如数字多功能光盘(DVD)、光盘(CD)和两者的数据变体的光介质上。
存储器可以为适合于本地技术环境的任意类型,其可使用任意合适的数据存储技术实现,例如基于半导体存储设备、磁存储设备和系统、光存储设备和系统、固定存储器和可擦除存储器。数据处理器可以为适合于本地技术环境的任意类型,作为非限定性示例,其可包括一个或多个通用计算机、专用计算机、微处理器、数字信号处理器(DSPs)、专用集成电路(ASIC)、门级电路和基于多核处理器架构的处理器。
本发明的实施例可以实践在例如集成电路模块的各种组件中。集成电路的设计大体上为高度自动化过程。复杂且功效强大的软件工具可将逻辑级设计转换为准备在半导体基板上蚀刻和形成的半导体电路设计。
例如由加州芒廷维尤的Synopsys公司和加州圣何塞的CadenceDesign公司提供的程序使用已完善建立的设计规则和预存的设计模块库,自动地在半导体芯片上布线导体和定位组件。当半导体电路的设计完成时,标准电子格式(例如Opus、GDSII等)的设计结果可以传输至半导体工厂或“代工厂”以用于制造。
以上的说明书以示例和非限定性的方式提供了本发明的示例性实施例的全面且有益的说明。但是,在看到以上说明书、并结合附图和所附权利要求阅读时,多种修改和调整对于相关领域技术人员可变得明显。但是,本发明的教导的所有这种或类似的修改仍将落入如所附权利要求定义的本发明的范围内。
如在此申请中使用的,术语电路可以指代以下所有:(a)纯硬件电路实现(例如在纯模拟和/或数字电路中的实现)和(b)电路和软件(和/或固件)的组合,例如可应用在:(i)处理器的组合或者(ii)处理器/软件(包括数字信号处理器)、软件、和存储器的一部分,其一起工作以使得例如移动电话或服务器的装置执行多种功能,和(c)例如微处理器或者微处理器的一部分之类的电路,其需要用于操作的软件或固件,即使该软件或固件没有实体存在。
电路的这种定义应用至此申请的所有使用此术语处,包括在任一权利要求中。作为一个进一步的示例,如此申请中所使用的,术语电路也可覆盖仅有一个处理器(或多个处理器)或者处理器的一部分以及其所附的软件和/或固件的实现。举例来说,若其可应用于特定要求的组成部分中,术语电路也可覆盖基带集成电路或用于移动电话的应用处理器集成电路,或者服务器、蜂窝网络设备或其他网络设备中类似的集成电路。
在本申请中,术语处理器和存储器可包括但不限于:(1)一个或多个微处理器,(2)一个或多个具有数字信号处理器的处理器,(3)一个或多个没有数字信号处理器的处理器,(3)一个或多个专用计算机芯片,(4)一个或多个现场可编程门阵列(FPGAS),(5)一个或多个控制器,(6)一个或多个专用集成电路(ASICS),或者检测器、处理器(包括单核或多核处理器)、数字信号处理器、控制器、接收器、发射器、编码器、解码器、存储器(以及多个存储器)、软件、固件、RAM、ROM、显示器、用户接口、显示电路、用户接口电路、用户接口软件、显示软件、电路、天线、天线电路和电路。

Claims (47)

1.一种方法,包括:
将音频信号滤波为至少三个频带信号;
为每个频带信号生成多个子带信号;
处理来自至少一个频带的至少一个子带信号;以及
将处理的子带信号进行组合、以形成组合的处理音频信号。
2.如权利要求1所述的方法,其中,将音频信号滤波为至少三个频带信号包括:
将该音频信号高通滤波为至少三个频带信号的第一频带信号;
将该音频信号低通滤波为低通滤波信号;以及
将该低通滤波信号进行下采样、以生成所述至少三个频带信号的组合第二和第三频带信号。
3.如权利要求2所述的方法,其中,将该低通滤波音频信号进行下采样、以生成所述至少三个频带信号的组合第二和第三频带信号的因子为3。
4.如权利要求2和3所述的方法,其中,将音频信号滤波为至少三个频带信号进一步包括:
将所述至少三个频带信号的组合第二和第三频带信号进行高通滤波、以形成所述至少三个频带信号的第二频带信号;
将所述至少三个频带信号的组合第二和第三频带信号进行低通滤波;以及
将所述至少三个频带信号的低通滤波的组合第二和第三频带信号进行下采样、以生成所述至少三个频带信号的第三频带信号。
5.如权利要求4所述的方法,其中,将所述至少三个频带信号的低通滤波的组合第二和第三频带信号进行下采样、以生成所述至少三个频带信号的第三频带信号的因子为2。
6.如权利要求1至5所述的方法,其中,为每个频带信号生成多个子带信号包括:
将该频带信号滤波为多个子带。
7.如权利要求6所述的方法,其中,将该频带信号滤波为多个子带包括:
生成M带频带滤波器;
从该M带频带滤波器中选择至少两个带,并组合用于该至少两个带的输出;以及
将修改的M带频带滤波器应用至该频带,以生成该频带的子带信号。
8.如权利要求1至7所述的方法,其中,处理来自至少一个频带的至少一个子带信号包括:
将噪声抑制应用至所述来自至少一个频率信号的至少一个子带信号。
9.如权利要求1至8所述的方法,其中,将处理的子带信号进行组合、以形成组合的处理音频信号包括:
将处理的子带信号进行组合、以形成至少三个处理的频带信号。
10.如权利要求9所述的方法,其中,将处理的子带信号进行组合、以形成组合的处理音频信号进一步包括:
将所述至少三个处理的频带信号的第一频带信号进行上采样;
将所述至少三个处理的频带信号的上采样的第一频带信号进行低通滤波;以及
将所述至少三个处理的频带信号的低通滤波的、上采样的第一频带信号与所述至少三个处理的频带信号的第二频带信号进行组合,以生成所述至少三个处理的频带信号的组合第一和第二频带信号。
11.如权利要求10所述的方法,其中,将所述至少三个处理的频带信号的第一频带信号进行上采样的因子为2。
12.如权利要求10和11所述的方法,其中,将处理的子带信号进行组合、以形成组合的处理音频信号进一步包括:延迟所述至少三个处理的频带信号的第二频带信号,以使得所述至少三个处理的频带信号的低通滤波的、上采样的第一频带信号与所述至少三个处理的频带信号的第二频带信号同步。
13.如权利要求10至12所述的方法,其中,将处理的子带信号进行组合包括:
将所述至少三个处理的频带信号的所述组合第一和第二频带信号进行上采样;
将所述至少三个处理的频带信号的上采样的组合第一和第二频带信号进行低通滤波;以及
将所述至少三个处理的频带信号的低通滤波的、上采样的组合第一和第二频带信号与所述至少三个处理的频带信号的第三频带信号进行组合,以生成组合的处理音频信号。
14.如权利要求13所述的方法,其中,将所述至少三个处理的频带信号的所述组合第一和第二频带信号进行上采样的因子为3。
15.根据权利要求13和14所述的方法,其中,将处理的子带信号进行组合、以形成组合的处理音频信号进一步包括将所述至少三个处理的频带信号的第三频带信号延迟,以使得所述至少三个处理的频带信号的低通滤波的、上采样的组合第一和第二频带信号与所述至少三个处理的频带信号的第三频带信号同步。
16.如权利要求2和13或引用权利要求2和13的任意权利要求所述的方法,进一步包括配置第一组滤波器,其包括:
用于将所述音频信号高通滤波为至少三个频带信号的第一频带信号的第一滤波器;
用于将所述音频信号低通滤波为低通滤波信号的第二滤波器;以及
用于将所述至少三个处理的频带信号的上采样的组合第一和第二频带信号进行低通滤波的第三滤波器。
17.如权利要求16所述的方法,其中配置第一组滤波器包括:
在将与平坦频率响应的偏差保持在低于预定水平的条件下,通过将第一和第二滤波器的阻带能量最小化来配置用于第一和第二滤波器的至少一个滤波器参数。
18.如权利要求17所述的方法,其中,配置第一组滤波器包括:
执行包括如下操作的至少一次迭代:在保持用于第一滤波器的滤波器参数固定的条件下,配置用于第二和第三滤波器的至少一个滤波器参数,然后在保持用于第三滤波器的滤波器参数固定的条件下,配置用于第一和第二滤波器的至少一个滤波器参数。
19.如权利要求4和10或引用权利要求4和10的任意权利要求所述的方法,进一步包括配置第二组滤波器,其包括:
用于将所述至少三个频带信号的所述组合第二和第三频带信号进行高通滤波、以形成所述至少三个频带信号的第二频带信号的第一滤波器;
用于将所述至少三个频带信号的所述组合第二和第三频带信号进行低通滤波的第二滤波器;以及
用于将所述至少三个处理的频带信号的上采样的第一频带信号进行低通滤波的第三滤波器。
20.如权利要求19所述的方法,其中,配置第二组滤波器包括:
在将与平坦频率响应的偏差保持在低于预定水平的条件下,通过将第一和第二滤波器的阻带能量最小化来配置用于第一和第二滤波器的至少一个滤波器参数。
21.如权利要求20所述的方法,其中配置第二组滤波器进一步包括:
执行包括如下操作的至少一次迭代:在保持用于第一滤波器的滤波器参数固定的条件下,配置用于第二和第三滤波器的至少一个滤波器参数,然后在保持用于第三滤波器的滤波器参数固定的条件下,配置用于第一和第二滤波器的至少一个滤波器参数。
22.一种装置,包括至少一个处理器和至少一个包括计算机程序代码的存储器,该至少一个存储器和计算机程序代码配置为与所述至少一个处理器一起,使得该装置至少执行:
将音频信号滤波为至少三个频带信号;
为每个频带信号生成多个子带信号;
处理来自至少一个频带的至少一个子带信号;以及
将处理的子带信号进行组合、以形成组合的处理音频信号。
23.如权利要求22所述的装置,其中,将音频信号滤波为至少三个频带信号使得所述装置至少进一步执行:
将该音频信号高通滤波为至少三个频带信号的第一频带信号;
将该音频信号低通滤波为低通滤波信号;以及
将该低通滤波音频信号进行下采样、以生成所述至少三个频带信号的组合第二和第三频带信号。
24.如权利要求23所述的装置,其中,将该低通滤波音频信号进行下采样、以生成所述至少三个频带信号的组合第二和第三频带信号的因子为3。
25.如权利要求23和24所述的装置,其中,将音频信号滤波为至少三个频带信号使得所述装置至少进一步执行:
将所述至少三个频带信号的所述组合第二和第三频带信号进行高通滤波、以形成所述至少三个频带信号的第二频带信号;
将所述至少三个频带信号的所述组合第二和第三频带信号进行低通滤波;以及
将所述至少三个频带信号的低通滤波的组合第二和第三频带信号进行下采样、以生成所述至少三个频带信号的第三频带信号。
26.如权利要求25所述的装置,其中,将所述至少三个频带信号的低通滤波的组合第二和第三频带信号进行下采样、以生成所述至少三个频带信号的第三频带信号的因子为2。
27.如权利要求22至26所述的装置,其中,为每个频带信号生成多个子带信号使得所述装置至少进一步执行:
将该频带信号滤波为多个子带。
28.如权利要求27所述的装置,其中,将该频带信号滤波为多个子带使得所述装置至少进一步执行:
生成M带频带滤波器;
从该M带频带滤波器中选择至少两个带,并组合用于该至少两个带的输出;以及
将修改的M带频带滤波器应用至该频带,以生成该频带的子带信号。
29.如权利要求22至28所述的装置,其中,处理来自至少一个频带的至少一个子带信号使得所述装置至少进一步执行:
将噪声抑制应用至所述来自至少一个频率信号的至少一个子带信号。
30.如权利要求22至29所述的装置,其中,将处理的子带信号进行组合、以形成组合的处理音频信号使得所述装置至少进一步执行:
将处理的子带信号进行组合、以形成至少三个处理的频带信号。
31.如权利要求30所述的装置,其中,将处理的子带信号进行组合、以形成组合的处理音频信号进一步使得所述装置至少进一步执行:
将所述至少三个处理的频带信号的第一频带信号进行上采样;
将所述至少三个处理的频带信号的上采样的第一频带信号进行低通滤波;以及
将所述至少三个处理的频带信号的低通滤波的、上采样的第一频带信号与所述至少三个处理的频带信号的第二频带信号进行组合,以生成至少三个处理的频带信号的组合第一和第二频带信号。
32.如权利要求31所述的装置,其中,将所述至少三个处理的频带信号的第一频带信号进行上采样的因子为2。
33.如权利要求31和32所述的装置,其中,将处理的子带信号进行组合、以形成组合的处理音频信号使得所述装置至少进一步执行:延迟所述至少三个处理的频带信号的第二频带信号,以使得所述至少三个处理的频带信号的低通滤波的、上采样的第一频带信号与所述至少三个处理的频带信号的第二频带信号同步。
34.如权利要求31至33所述的装置,其中,将处理的子带信号进行组合使得所述装置至少进一步执行:
将所述至少三个处理的频带信号的所述组合第一和第二频带信号进行上采样;
将所述至少三个处理的频带信号的上采样的组合第一和第二频带信号进行低通滤波;以及
将所述至少三个处理的频带信号的低通滤波的、上采样的组合第一和第二频带信号与至少三个处理的频带信号的第三频带信号进行组合,以生成组合的处理音频信号。
35.如权利要求34所述的装置,其中,将所述至少三个处理的频带信号的所述组合第一和第二频带信号进行上采样的因子为3。
36.如权利要求34和35所述的装置,其中,将处理的子带信号进行组合、以形成组合的处理音频信号使得所述装置至少进一步执行将所述至少三个处理的频带信号的第三频带信号延迟,以使得所述至少三个处理的频带信号的低通滤波的、上采样的组合第一和第二频带信号与所述至少三个处理的频带信号的第三频带信号同步。
37.如权利要求23和34或引用权利要求23和34的任意权利要求所述的装置,其中所述至少一个处理器和至少一个存储器进一步配置用于执行配置第一组滤波器,其包括:
用于将所述音频信号高通滤波为至少三个频带信号的第一频带信号的第一滤波器;
用于将所述音频信号低通滤波为低通滤波信号的第二滤波器;以及
用于将所述至少三个处理的频带信号的上采样的组合第一和第二频带信号进行低通滤波的第三滤波器。
38.如权利要求37所述的装置,其中配置第一组滤波器使得所述装置至少进一步执行:
在将与平坦频率响应的偏差保持在低于预定水平的条件下,通过将第一和第二滤波器的阻带能量最小化来配置用于第一和第二滤波器的至少一个滤波器参数。
39.如权利要求38所述的装置,其中,配置第一组滤波器使得所述装置至少进一步执行:
执行包括如下操作的至少一次迭代:在保持用于第一滤波器的滤波器参数固定的条件下,配置用于第二和第三滤波器的至少一个滤波器参数,然后在保持用于第三滤波器的滤波器参数固定的条件下,配置用于第一和第二滤波器的至少一个滤波器参数。
40.如权利要求25和31或引用权利要求25和31的任意权利要求所述的装置,其中所述至少一个处理器和至少一个存储器进一步配置用于执行配置第二组滤波器,其包括:
用于将所述至少三个频带信号的所述组合第二和第三频带信号进行高通滤波、以形成所述至少三个频带信号的第二频带信号的第一滤波器;
用于将至少三个频带信号的所述组合第二和第三频带信号进行低通滤波的第二滤波器;以及
用于将所述至少三个处理的频带信号的上采样的第一频带信号进行低通滤波的第三滤波器。
41.如权利要求40所述的装置,其中,配置第二组滤波器使得所述装置至少进一步执行:
在将与平坦频率响应的偏差保持在低于预定水平的条件下,通过将第一和第二滤波器的阻带能量最小化来配置用于第一和第二滤波器的至少一个滤波器参数。
42.如权利要求41所述的装置,其中配置第二组滤波器使得所述装置至少进一步执行:
执行包括如下操作的至少一次迭代:在保持用于第一滤波器的滤波器参数固定的条件下,配置用于第二和第三滤波器的至少一个滤波器参数,然后在保持用于第三滤波器的滤波器参数固定的条件下,配置用于第一和第二滤波器的至少一个滤波器参数。
43.一种编码有指令的计算机可读介质,当由计算机实施时,其执行:
将音频信号滤波为至少三个频带信号;
为每个频带信号生成多个子带信号;
处理来自至少一个频带的至少一个子带信号;以及
将处理的子带信号进行组合、以形成组合的处理音频信号。
44.一种装置,其包括:
用于将音频信号滤波为至少三个频带信号的滤波装置;
用于为每个频带信号生成多个子带信号的子带生成装置;
用于处理来自至少一个频带的至少一个子带信号的处理装置;以及
用于将处理的子带信号进行组合、以形成组合的处理音频信号的组合装置。
45.一种电子设备,其包括如权利要求22至42所述的装置。
46.一种芯片组,其包括如权利要求22至42所述的装置。
47.一种装置,其包括:
至少一个滤波器,其配置为将音频信号滤波为至少三个频带信号;
至少一个滤波器组,其配置为为每个频带信号生成多个子带信号;
信号处理器,其配置为处理来自至少一个频带的至少一个子带信号;以及
信号组合器,其配置为将处理的子带信号进行组合、以形成组合的处理音频信号。
CN201080045379.8A 2009-09-07 2010-09-07 用于处理音频信号的方法和装置 Expired - Fee Related CN102576537B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0915594.6 2009-09-07
GB0915594A GB2473266A (en) 2009-09-07 2009-09-07 An improved filter bank
PCT/IB2010/002232 WO2011027215A1 (en) 2009-09-07 2010-09-07 Method and apparatus for processing audio signals

Publications (2)

Publication Number Publication Date
CN102576537A true CN102576537A (zh) 2012-07-11
CN102576537B CN102576537B (zh) 2014-07-16

Family

ID=41203307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080045379.8A Expired - Fee Related CN102576537B (zh) 2009-09-07 2010-09-07 用于处理音频信号的方法和装置

Country Status (5)

Country Link
US (1) US9076437B2 (zh)
EP (1) EP2476115A4 (zh)
CN (1) CN102576537B (zh)
GB (1) GB2473266A (zh)
WO (1) WO2011027215A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106982045A (zh) * 2017-03-17 2017-07-25 东南大学 一种基于socp优化的eir‑cmfb结构的设计方法
CN107735969A (zh) * 2015-02-12 2018-02-23 Dts(英属维尔京群岛)有限公司 用于音频处理的多速率系统
CN109087653A (zh) * 2014-03-24 2018-12-25 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
CN113302690A (zh) * 2019-01-15 2021-08-24 诺基亚技术有限公司 音频处理

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8180063B2 (en) * 2007-03-30 2012-05-15 Audiofile Engineering Llc Audio signal processing system for live music performance
US9986356B2 (en) * 2012-02-15 2018-05-29 Harman International Industries, Incorporated Audio surround processing system
US9721584B2 (en) * 2014-07-14 2017-08-01 Intel IP Corporation Wind noise reduction for audio reception
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6310963B1 (en) * 1994-09-30 2001-10-30 Sensormatic Electronics Corp Method and apparatus for detecting an EAS (electronic article surveillance) marker using wavelet transform signal processing
US6856653B1 (en) * 1999-11-26 2005-02-15 Matsushita Electric Industrial Co., Ltd. Digital signal sub-band separating/combining apparatus achieving band-separation and band-combining filtering processing with reduced amount of group delay
US20070276656A1 (en) * 2006-05-25 2007-11-29 Audience, Inc. System and method for processing an audio signal
US20070288235A1 (en) * 2006-06-09 2007-12-13 Nokia Corporation Equalization based on digital signal processing in downsampled domains
US20080189116A1 (en) * 2002-09-27 2008-08-07 Leblanc Wilfrid Method and System for Dual Mode Subband Acoustic Echo Canceller with Integrated Noise Suppression
CN101477800A (zh) * 2008-12-31 2009-07-08 瑞声声学科技(深圳)有限公司 语音增强的方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
JPH09281995A (ja) * 1996-04-12 1997-10-31 Nec Corp 信号符号化装置及び方法
US6904404B1 (en) * 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US20070078645A1 (en) * 2005-09-30 2007-04-05 Nokia Corporation Filterbank-based processing of speech signals
US7783478B2 (en) * 2007-01-03 2010-08-24 Alexander Goldin Two stage frequency subband decomposition

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6310963B1 (en) * 1994-09-30 2001-10-30 Sensormatic Electronics Corp Method and apparatus for detecting an EAS (electronic article surveillance) marker using wavelet transform signal processing
US6856653B1 (en) * 1999-11-26 2005-02-15 Matsushita Electric Industrial Co., Ltd. Digital signal sub-band separating/combining apparatus achieving band-separation and band-combining filtering processing with reduced amount of group delay
US20080189116A1 (en) * 2002-09-27 2008-08-07 Leblanc Wilfrid Method and System for Dual Mode Subband Acoustic Echo Canceller with Integrated Noise Suppression
US20070276656A1 (en) * 2006-05-25 2007-11-29 Audience, Inc. System and method for processing an audio signal
US20070288235A1 (en) * 2006-06-09 2007-12-13 Nokia Corporation Equalization based on digital signal processing in downsampled domains
CN101477800A (zh) * 2008-12-31 2009-07-08 瑞声声学科技(深圳)有限公司 语音增强的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TED PAINTER ET.AL: "Perceptual Coding of Digital Audio", 《PROCEEDINGS OF THE IEEE》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087653A (zh) * 2014-03-24 2018-12-25 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
CN109087653B (zh) * 2014-03-24 2023-09-15 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
CN107735969A (zh) * 2015-02-12 2018-02-23 Dts(英属维尔京群岛)有限公司 用于音频处理的多速率系统
CN106982045A (zh) * 2017-03-17 2017-07-25 东南大学 一种基于socp优化的eir‑cmfb结构的设计方法
CN106982045B (zh) * 2017-03-17 2020-07-24 东南大学 一种基于socp优化的eir-cmfb结构的设计方法
CN113302690A (zh) * 2019-01-15 2021-08-24 诺基亚技术有限公司 音频处理

Also Published As

Publication number Publication date
EP2476115A4 (en) 2013-05-29
CN102576537B (zh) 2014-07-16
US20110058687A1 (en) 2011-03-10
US9076437B2 (en) 2015-07-07
GB0915594D0 (en) 2009-10-07
EP2476115A1 (en) 2012-07-18
WO2011027215A1 (en) 2011-03-10
GB2473266A (en) 2011-03-09

Similar Documents

Publication Publication Date Title
CN102576537B (zh) 用于处理音频信号的方法和装置
US9640187B2 (en) Method and an apparatus for processing an audio signal using noise suppression or echo suppression
CN102648492B (zh) 主动噪声消除电路或执行对被抽取系数的滤波的其它电路中的延迟技术
EP1451812B1 (en) Audio signal bandwidth extension
CN101167250B (zh) 使用变形处理的数字音频的动态范围控制与均衡的方法和设备
CN101192832B (zh) 处理音频信号的方法和系统
JP5551258B2 (ja) 狭帯域信号から「より上の帯域」の信号を決定すること
CN101401305B (zh) 利用复调制滤波器组的滤波器、抽头产生器及滤波方法
KR20040035749A (ko) 사운드 신호의 대역폭 확장 방법
CN105141285A (zh) 对音频信号处理的装置和对时域音频信号进行处理的方法
CN102667920A (zh) Sbr比特流参数缩混
US20080004868A1 (en) Sub-band periodic signal enhancement system
US20190103088A1 (en) Multichannel Sub-Band Processing
EP2834815A1 (en) Adaptive audio signal filtering
US20160179458A1 (en) Digital signal processing using a combination of direct and multi-band convolution algorithms in the time domain
US11488574B2 (en) Method and system for implementing a modal processor
Lin et al. Frequency response masking approach for designing filter banks with rational sampling factors
Karachalios et al. Multiband analysis and equalization of loudspeaker responses
US20070096964A1 (en) System and method for efficient upsampled signal processing
CN113542983A (zh) 一种音频信号处理方法、装置、设备及存储介质
JP2006033448A (ja) マルチサンプリングレートσδdacシステム、及び音響機器
Lin et al. High-Definition Audio Spectrum Separation via Frequency Response Masking Filter Banks
CN102013879A (zh) Mp3音乐均衡调节装置及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160127

Address after: Espoo, Finland

Patentee after: NOKIA TECHNOLOGIES OY

Address before: Espoo, Finland

Patentee before: NOKIA Corp.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190521

Address after: American New York

Patentee after: Origin Asset Group Co.,Ltd.

Address before: Espoo, Finland

Patentee before: NOKIA TECHNOLOGIES OY

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140716

Termination date: 20210907