CN102576538A - 用于处理音频信号的方法和设备 - Google Patents
用于处理音频信号的方法和设备 Download PDFInfo
- Publication number
- CN102576538A CN102576538A CN2010800456550A CN201080045655A CN102576538A CN 102576538 A CN102576538 A CN 102576538A CN 2010800456550 A CN2010800456550 A CN 2010800456550A CN 201080045655 A CN201080045655 A CN 201080045655A CN 102576538 A CN102576538 A CN 102576538A
- Authority
- CN
- China
- Prior art keywords
- signal
- band
- subband
- equipment
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 113
- 238000012545 processing Methods 0.000 title claims abstract description 93
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000001914 filtration Methods 0.000 claims abstract description 28
- 238000004590 computer program Methods 0.000 claims abstract description 8
- 238000005070 sampling Methods 0.000 claims description 46
- 238000007493 shaping process Methods 0.000 claims description 8
- 230000001360 synchronised effect Effects 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 description 31
- 239000002131 composite material Substances 0.000 description 31
- 238000013461 design Methods 0.000 description 13
- 230000004044 response Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 239000004065 semiconductor Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 230000008521 reorganization Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 206010038743 Restlessness Diseases 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000011284 combination treatment Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000004851 dishwashing Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000005039 memory span Effects 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
- Stereophonic System (AREA)
Abstract
本发明涉及一种用于处理音频信号的方法和设备,其中所述包括以下步骤:将音频信号滤波成至少两个频带信号;针对每个频带信号生成多个子带信号;其中针对至少一个频带信号,使用时域至频域变换来生成所述多个子带信号,并且针对至少一个其它频带,使用子带滤波器组来生成用于所述一个其它频带的所述多个子带信号。并且所述设备包括至少一个处理器和包括计算机程序代码的至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置为用所述至少一个处理器促使所述设备至少执行所述方法。
Description
技术领域
本申请涉及用于音频信号的处理的设备。本申请还涉及但不限于用于处理移动设备中的音频信号的设备。
背景技术
电子设备且特别是移动或便携式电子设备可以装配有集成扩音器设备或适当的音频输入以便接收扩音器信号。这允许捕捉和处理适当的音频信号以便处理、编码、存储或传送到其它设备。例如,蜂窝式电话可以具有被配置为以适合于处理并经由蜂窝式通信网络传送至另一设备的格式生成音频信号的扩音器设备,然后可以对所述另一设备处的信号进行解码并传递至诸如头戴式耳机或扬声器的适当收听设备。类似地,某些多媒体设备装配有用于事件的音频捕捉以用于稍后重放或传输的单声道或立体声扩音器设备。
电子设备还可以包括用于从一个或多个扩音器接收音频信号的扩音器设备或输入且可以执行某些预编码处理以减少噪声。例如,可以将模拟信号转换成数字格式以进行进一步处理。
当尝试记录来自远音频信号源的全谱带音频信号时可能要求此预处理,期望的信号与背景或干扰噪声相比可能是弱的。某些噪声在记录器外部且可能作为固定声学背景或环境噪声已知。
此类固定声学背景噪声的典型来源是诸如空调单元、投影仪风扇、计算机风扇或其它机器的风扇。机器噪声的示例例如是诸如洗衣机和洗碗机的家庭机器、诸如交通噪声的车辆噪声。其它干扰源可能来自附近环境中的其他人,例如在音乐会中来自与记录器邻近的人的嗡嗡声或诸如通过树的风的自然噪声。
其它干扰噪声可能在系统内部。噪声抑制器电路通常利用快速傅立叶变换(FFT)在频域中操作以便获得足够的频率分辨率。由于宽带信号与窄带信号相比具有双倍的样本数目(通常对于移动设备语音应用而言,将8kHz采样频率定义为窄带并将16kHz采样频率定义为宽带),所以必须将FFT长度加倍。这大致上使处理宽带音频信号所需的计算和存储器的所需量加倍,但是由于处理相同水平的FFT的固定点,所以不能提供如在窄带处理中提供的准确度。
音频信号的有限精度还产生量化噪声。该量化噪声在显著时变成可听的且使得信号的收听困难且令人讨厌。在语音系统中,这例如在音频信号被作为宽带信号处理时发生(换言之,具有16kHz采样频率),但是仅具有窄带内容(换言之,没有在4kHz以上的有效内容(significantcontent))。这种情况通常被忽视,因为假设其很少发生,但是已实现的系统显示这种情况下可能相当频繁地发生。例如如果载送宽带呼叫的电话被附着于仅具有窄带能力的蓝牙附件,则只有窄带内容被宽带呼叫载送。此外,已经观察到即使当所处理的信号是真实宽带信号时,量化噪声也可能是可听的。
虽然可以使用具有更好质量的FFT来产生部分解,但已经观察到不可能在不使用大量的存储器和处理能力且因此对用于移动设备的电池功率和成本具有显著影响的情况下单独地使用FFT来解决问题。
使用将宽带信号划分成两个信号:低频带和高频带的双通道分析-综合滤波器组已被视为处理的基础。然而,通常存在具有混叠补偿的高和低频带的抽取。
这些音频信号的音频信号处理应遵循以下标准:
1.音频质量(音频信号不应失真);
2.存储器(滤波器组不应要求大量的存储器以存储滤波器组配置,换言之不应需要滤波器来存储大量的值);
3.计算复杂性(滤波器组不应复杂到足以要求显著的处理器能力并因此增加用于移动设备或类似物的电池上的功率消耗);以及
4.延迟(在处理中不应存在明显大的延迟,因为这可能影响通信通道)。
已知技术通常产生大量的量化噪声,或者对于适当的计算复杂性和存储器而言,不能产生用于宽带语音目的的足够的质量。已知其它方法要求针对低频率在滤波器上设置非常窄的频带。为了在低频率上产生足够的频率分辨率,将要求许多滤波器,这在存储器和计算容量方面将是昂贵的。其它方法产生明显长的延迟且具有用于高频带信号的不足的频率分辨率。
发明内容
本申请从可以在不牺牲音频质量的情况下将改进的滤波器组结构配置为具有容许延迟、存储器要求和计算复杂性的考虑出发。此外,所述结构和设备被设计为使得除噪声抑制之外,其它音频处理可以利用滤波器组结构且因此可以节省处理器系统上的计算和存储器容量。
根据本发明的一方面,提供了一种方法,包括:将音频信号滤波成至少两个频带信号;以及针对每个频带信号生成多个子带信号;其中针对至少一个频带信号,使用时域至频域变换来生成所述多个子带信号,并且针对至少一个其它频带,使用子带滤波器组来生成用于所述一个其它频带的所述多个子带信号。
所述时域至频域变换可以包括以下各项中的至少一个:快速傅立叶变换;离散傅立叶变换;以及离散余弦变换。
子带滤波器组可以包括基于余弦的调制滤波器组。
将音频信号滤波成至少两个频带信号可以包括:将音频信号高通滤波成至少两个频带信号中的第一个;将音频信号低通滤波成低通滤波信号;以及对低通滤波音频信号进行下采样以生成所述至少两个频带信号中的第二个。
对低通滤波音频信号进行下采样以生成所述至少两个频带信号中的第二个优选地是用因子2进行的。
该方法还可以包括;处理来自至少一个频带的至少一个子带信号;将子带信号组合以形成至少两个已处理频带音频信号;以及将所述至少两个已处理频带音频信号组合以生成已处理音频信号。
处理来自至少一个频带的至少一个子带信号可以包括向来自至少一个频率信号的至少一个子带信号施加噪声抑制。
将子带信号组合以形成至少两个已处理频率信号可以包括:使用频域至时域变换从第一组子带信号生成所述至少两个已处理频带中的第一个;以及将第二组子带信号求和以形成所述至少两个已处理频带中的第二个。
优选地使第一组子带信号与使用时域至频域变换生成的所述多个子带信号相关联,并且优选地使第二组子带信号与使用子带滤波器组生成的所述多个子带信号相关联。
将所述至少两个已处理频带音频信号组合以生成已处理音频信号还可以包括:对所述至少两个已处理频带信号中的第一个进行上采样;对所述至少两个已处理频带信号中的被上采样的第一个进行低通滤波;以及将所述至少两个已处理频带信号中的被低通滤波、上采样的第一个与所述至少两个已处理频带信号中的第二个组合以生成已处理音频信号。
对所述至少两个已处理频带信号中的第一个进行上采样优选地是用因子2进行的。
将所述至少两个已处理频带音频信号组合以生成已处理音频信号还可以包括使所述至少两个已处理频带信号中的第二个延迟以使所述至少两个已处理频带信号中的被低通滤波、上采样的第一个与所述至少两个已处理频带信号中的第二个同步。
该方法还可以包括在将所述至少两个已处理频带音频信号组合以生成已处理音频信号之前处理子带信号,其中所述子带信号的处理包括对子带信号的信号水平控制。
该方法还可以包括配置滤波器,该滤波器优选地包括:第一滤波器,其用于音频信号到至少两个频带信号中的第一个的高通滤波;第二滤波器,其用于音频信号到低通滤波信号的低通滤波;以及第三滤波器,其用于已处理频带信号中的被上采样的第一个的低通滤波。
配置第一组滤波器可以包括通过仅用一个失真来使用于第一滤波器和第二滤波器的阻带能量最小化来配置用于第一滤波器和第二滤波器的至少一个滤波器参数。
配置第一组滤波器可以包括执行在保持用于第一滤波器的滤波器参数固定的同时配置用于第二滤波器和第三滤波器的至少一个滤波器参数且然后在保持用于第三滤波器的滤波器参数固定的同时配置用于第一滤波器和第二滤波器的至少一个滤波器参数的操作的至少一个迭代。
该方法还可以包括:在针对每个频带信号生成多个子带信号之前处理至少两个频带信号,其中所述至少两个频带信号的处理优选地包括以下各项中的至少一个:音频波束形成处理;以及自适应滤波。
根据本申请的第二方面,提供了一种设备,其包括至少一个处理器和包括计算机程序代码的至少一个存储器,所述至少一个存储器和计算机程序代码被配置为用所述至少一个处理器促使所述设备至少执行:将音频信号滤波成至少两个频带信号;以及针对每个频带信号生成多个子带信号;其中针对至少一个频带信号,使用时域至频域变换来生成所述多个子带信号,并且针对至少一个其它频带,使用子带滤波器组来生成用于所述一个其它频带的所述多个子带信号。
所述时域至频域变换可以包括以下各项中的至少一个:快速傅立叶变换;离散傅立叶变换;以及离散余弦变换。
子带滤波器组可以包括基于余弦的调制滤波器组。
将音频信号滤波成至少两个频带信号还可以包括促使所述设备执行:将音频信号高通滤波成至少两个频带信号中的第一个;将音频信号低通滤波成低通滤波信号;以及对低通滤波音频信号进行下采样以生成所述至少两个频带信号中的第二个。
对低通滤波音频信号进行下采样以生成所述至少两个频带信号中的第二个还可以包括促使所述设备用因子2来执行下采样。
所述至少一个处理器可以促使所述设备至少还执行:处理来自至少一个频带的至少一个子带信号;将子带信号组合以形成至少两个已处理频带音频信号;以及将所述至少两个已处理频带音频信号组合以生成已处理音频信号。
处理来自至少一个频带的至少一个子带信号还可以包括促使所述设备执行向来自至少一个频率信号的至少一个子带信号施加噪声抑制。
促使所述设备执行将子带信号组合以形成至少两个已处理频率信号还可以包括促使所述设备执行:使用频域至时域变换从第一组子带信号生成所述至少两个已处理频带中的第一个;以及将第二组子带信号求和以形成所述至少两个已处理频带中的第二个。
优选地使第一组子带信号与使用时域至频域变换生成的所述多个子带信号相关联,并且优选地使第二组子带信号与使用子带滤波器组生成的所述多个子带信号相关联。
促使所述设备执行将所述至少两个已处理频带音频信号组合以生成已处理音频信号还可以包括促使所述设备执行:对所述至少两个已处理频带信号中的第一个进行上采样;对所述至少两个已处理频带信号中的被上采样的第一个进行低通滤波;以及将所述至少两个已处理频带信号中的被低通滤波、上采样的第一个与所述至少两个已处理频带信号中的第二个组合以生成已处理音频信号。
促使所述设备执行对所述至少两个已处理频带信号进行上采样还可以包括促使所述设备用因子2来执行上采样。
促使所述设备执行将所述至少两个已处理频带音频信号组合以生成已处理音频信号还可以包括促使所述设备执行使所述至少两个已处理频带信号中的第二个延迟以使所述至少两个已处理频带信号中的被低通滤波、上采样的第一个与所述至少两个已处理频带信号中的第二个同步。
所述至少一个处理器可以促使所述设备至少还执行在将所述至少两个已处理频带音频信号组合以生成已处理音频信号之前处理子带信号,其中所述子带信号的处理包括对子带信号的信号水平控制。
所述至少一个处理器可以促使所述设备至少还执行配置滤波器,该滤波器可以包括:第一滤波器,其用于音频信号到至少两个频带信号中的第一个的高通滤波;第二滤波器,其用于音频信号到低通滤波信号的低通滤波;以及第三滤波器,其用于已处理频带信号中的被上采样的第一个的低通滤波。
配置第一组滤波器可以包括促使所述设备执行通过仅用一个失真使用于第一滤波器和第二滤波器的阻带能量最小化来配置用于第一滤波器和第二滤波器的至少一个滤波器参数。
配置第一组滤波器可以包括促使所述设备执行:执行在保持用于第一滤波器的滤波器参数固定的同时配置用于第二滤波器和第三滤波器的至少一个滤波器参数且然后在保持用于第三滤波器的滤波器参数固定的同时配置用于第一滤波器和第二滤波器的至少一个滤波器参数的操作的至少一个迭代。
所述至少一个处理器可以促使所述设备至少还执行:在针对每个频带信号生成多个子带信号之前处理所述至少两个频带信号,其中所述至少两个频带信号的处理可以包括以下各项中的至少一个:音频波束成形处理;以及自适应滤波。
根据本发明的第三方面,提供了一种设备,包括:滤波装置,其被配置为将音频信号滤波成至少两个频带信号;以及处理装置,其用于针对每个频带信号生成多个子带信号;其中针对至少一个频带信号,使用时域至频域变换来生成所述多个子带信号,并且针对至少一个其它频带,使用子带滤波器组来生成用于所述一个其它频带的所述多个子带信号。
根据本发明的第四方面,提供了一种设备,包括滤波器,其被配置为将音频信号滤波成至少两个频带信号;时域至频域变换器,其被配置为针对至少一个频带信号生成多个子带信号;以及子带滤波器组,其被配置为针对至少一个其它频带生成所述多个子带信号。
根据本发明的第五方面,提供了一种用指令编码的计算机可读介质,所述指令在被计算机执行时执行:将音频信号滤波成至少两个频带信号;以及针对每个频带信号生成多个子带信号;其中针对至少一个频带信号,使用时域至频域变换来生成所述多个子带信号,并且针对至少一个其它频带,使用子带滤波器组来生成用于所述一个其它频带的所述多个子带信号。
如上所述的设备可以包括编码器。
电子设备可以包括如上所述的设备。
芯片组可以包括如上所述的设备。
本发明的实施例旨在解决是上述问题。
附图说明
为了更好地理解本发明,现在将以示例的方式对附图进行参考,在所述附图中:
图1示意性地示出采用本发明的实施例的电子设备;
图2示意性地示出采用本发明的某些实施例的音频增强系统;
图3示意性地示出根据本发明的某些实施例的音频增强数字处理器;
图4示出举例说明如图2和图3所示的音频增强系统的操作的流程图;
图5示出举例说明根据本发明的某些实施例的音频增强数字处理器滤波器参数的确定的流程图;
图6示意性地示出根据本发明的某些实施例的描绘音频增强数字处理器滤波器的典型频率响应;
图7示意性地示出根据本发明的某些实施例的描绘子带滤波器组响应的典型频率响应;以及
图8示意性地示出根据本发明的某些实施例的描绘原型子带滤波器的量值响应的典型频率响应。
具体实施方式
下面描述用于提供适合于操作音频增强算法的改进音频增强处理器的设备和方法。在这方面,首先对示例性电子设备10或设备的图1示意性框图进行参考,其结合了根据本发明的某些实施例的音频增强算法。
在某些实施例中,电子设备10是用于无线通信系统中的操作的移动终端、移动电话或用户设备。
电子设备10包括扩音器11,其被经由模数转换器14链接到处理器21。处理器21还经由数模转换器32被链接到扬声器33。处理器21还被链接到收发机(TX/RX)13、用户接口(UI)15和存储器22。
可以将处理器21配置为执行各种程序代码23。在某些实施例中,实现的程序代码23包括音频捕捉数字处理或配置代码。在某些实施例中,实现的程序代码23还包括用于音频信号的进一步处理的附加代码。在某些实施例中,可以例如将实现的程序代码23存储在存储器22中以便每当需要时被处理器21检索。在某些实施例中,存储器22还可以提供用于存储数据(例如已经根据应用被处理的数据)的部分24。
在某些实施例中,可以在不需要软件或固件的情况下至少部分地用硬件来实现能够实现音频增强算法的设备。
在某些实施例中,用户接口15使得用户能够例如经由键盘向电子设备10输入命令和/或例如经由显示器从电子设备10获得信息。收发机13使得能够实现与其它电子设备的通信,例如经由无线通信网络。
再次应理解的是可以许多方式来补充并修改电子设备10的结构。
电子设备10的用户可以将扩音器11用于输入将被传送到某个其它电子设备或将被存储在存储器22的数据部24中的语音。在某些实施例中,可以为此目的由用户经由用户接口15来激活相应的应用。在某些实施例中可以被处理器21运行的此应用促使处理器21执行存储在存储器22中的代码。
在某些实施例中,可以将模数转换器14配置为将输入的模拟音频信号转换成数字音频信号并将数字音频信号提供给处理器21。
处理器21然后可以以与参考图2和图3所述的相同的方式来处理数字音频信号。
在某些实施例中,可以将结果得到的位流提供给收发机13以便传输到另一电子设备。替换地,可以将编码数据存储在存储器22的数据部24中,例如以用于稍后传输或用于由相同电子设备10进行的稍后呈现。
在某些实施例中,电子设备10还可以经由其收发机13从另一电子设备接收具有音频信号的位流。在这些实施例中,处理器21执行存储在存储器22中的处理程序代码。在这些实施例中,处理器21然后可以处理接收到的数据,并且可以将解码数据提供给数模转换器32。在某些实施例中,数模转换器32将数字数据转换成模拟音频数据并经由扬声器33输出音频数据。在某些实施例中,也可以由已被用户经由用户接口15调用的应用来触发接收到的处理程序代码的执行。
在某些实施例中,可以以与从扩音器11和模数转换器14接收到的音频信号的处理类似的方式且参考图2和图3来处理接收到的信号以从记录的音频信号中去除噪声。
在某些实施例中,取代经由扬声器33的立即呈现,还可以将接收到的已处理音频数据存储在存储器22的数据部24中,例如以便使得能够实现稍后的呈现或到仍另一电子设备的转送。
将认识到的是图2和图3中所述的示意性结构及图4和图5中的方法步骤仅表示包括如在图1所示的电子设备中实现的应用的某些实施例的完整系统的操作的一部分。
图2示出用于语音的音频增强设备的示意性配置,包括扩音器11、模数转换器14、数字音频处理器101、数字音频控制器105和数字音频编码器103。在本申请的某些实施例中,音频增强设备可以包括某些但不是所有上述部分。例如,在某些实施例中,所述设备可以仅包括数字音频处理器101,其中来自外部源的数字信号被输入到具有预配置结构和滤波器参数的数字音频处理器101,并且数字音频处理器101进一步将音频处理信号输出到外部编码器。在本发明的其它实施例中,数字音频处理器101可以是音频增强设备的‘核心’元件,并且根据应用可以添加或去除其它部分。
在描述与图1所示的那些类似的元件的情况下,使用相同的附图标记。扩音器11接收音频波并将其转换成模拟电信号。扩音器11可以是任何适当的声电换能器。可能的扩音器的示例可以是电容器扩音器、电扩音器、动态扩音器、碳扩音器、压电扩音器、光纤扩音器、液体扩音器以及微机电系统(MEMS)扩音器。
在步骤301中相对于图4示出从音频声波进行的模拟音频信号的捕捉。
可以将电信号传递至模数转换器(ADC)14。
模数转换器14可以是用于转换来自扩音器的模拟电信号并输出数字信号的任何适当的模数转换器。该模数转换器可以以任何适当的形式输出数字信号。此外,根据实施例,模数转换器14可以是线性或非线性模数转换器。例如,在某些实施例中,模数转换器可以是对数响应模数转换器。可以将数字输出传递给数字音频处理器101。
在图4中通过步骤303示出模拟音频信号到数字信号的转换。
可以将数字音频处理器101配置为处理数字信号以尝试针对各种噪声或干扰源改善音频源的信号噪声干扰比。
在某些实施例中,数字音频处理器101可以将基于FFT的处理与基于滤波器组的处理组合。在这些实施例中,首先将数字音频信号分成两个通道或频带,使得存在第一抽取低频带信号和第二未抽取高频带信号。此外,在这些实施例中,在低频带信号上,换言之在音频/语音信号的较低频率分量上仅使用基于FFT的处理,在那里需要高频率分辨率。在这些实施例中,使用未抽取滤波器组将高频带进一步划分成子带。在某些实施例中,带和子带划分是不均匀且心理声学激发的。换言之,在某些实施例中,使用心理声学原理来确定高和低频带之间的间隔和此外的来自每个高和低频带的频率分量的间隔。
在某些实施例中,可以通过在滤波器组滤波器为双正交且整个滤波器组产生小延迟的情况下设计的分析-合成滤波器组结构来执行从数字音频信号生成两个通道/频带和已处理的两个通道到单个已处理数字音频信号的重组。在此类实施例中,高频带不要求合成滤波器,因为通道/频带未被抽取。此外,在这些实施例中,因为由于低频率通道/频带合成滤波器而仅在低频带上存在延迟,所以此‘延迟’能够在不向整个结构添加任何进一步延迟的情况下被高频带的子带划分所利用。
此外,如在这些实施例中,高频带/通道未被抽取,将高频带进一步划分成子带分量的子带滤波器组仅要求相对小的阻带衰减水平。在某些实施例中,这导致具有短延迟和低计算复杂性的高效结构。
如下所示,在某些实施例中,整个结构可以具有5ms的延迟,其满足用于与自适应多速率(AMR)编解码器(被设计为用于语音处理的编解码器)一起使用的噪声抑制的最低要求。此外,虽然仅针对窄带处理定义了5ms的要求,但本申请也将其视为用于宽带处理的良好指南。
在图3中更详细地示出了某些实施例中的数字音频处理器的结构的示意性表示。
数字音频处理器101可以包括接收数字音频信号并将其划分成频带的分析滤波器部281、接收频带并对频带分量执行初级处理的第一处理块211、接收已处理频带并将信号进一步划分成子带的子带发生器部285、接收子带分量并执行进一步处理器的第二处理块231、接收已处理子带分量并将其组合回成子带分量的子带组合器部287、接收频带并执行到频带分量的某些后处理处理的第三处理块251和将后处理频带分量重组以输出已处理音频信号的合成滤波器部283。
在某些实施例中,分析滤波器部281从模数转换器14接收数字信号并如图3所示,将该数字信号划分成两个频带或通道。图3所示的两个频带或通道是第一(低频)带或通道291和第二(高频)带或通道293。在某些实施例中,低频通道可以达到4kHz(并要求8kHz的采样频率)并表示窄带信号的频率分量,并且高频通道293可以是4kHz至8kHz(并因此具有16kHz的采样频率)并表示附加宽带信号。
在某些实施例中,分析滤波器部281可以如上文所指示地生成频带。在某些实施例中,分析滤波器部281可以包括被配置为接收数字信号并将已滤波信号输出到下采样器203的第一分析滤波器H0201。稍后将详细地讨论第一分析滤波器H0201的配置和设计,但是在某些实施例中可以将其视为在低频带/高频带阈值下具有定义阈值频率的低通滤波器。
下采样器203可以是任何适当的下采样器。在某些实施例中,下采样器203是值为2的整数下采样器。下采样器203然后可以将下采样输出信号输出到第一处理块211。换言之,在某些实施例中,下采样器203从已滤波输入样本选择并输出每隔一个样本以将采样频率‘降低至’8kHz(或窄带采样频率)并将此已滤波和下采样信号输出到第一处理块211。
在某些实施例中,可以将组合的第一分析滤波器H0201和下采样器203视为抽取器以便将采样率从16kHz降低至8kHz。
在某些实施例中,分析滤波器部281还可以包括第二分析滤波器H1205,其接收数字信号并将已滤波信号输出到第一处理块211。稍后还将详细地讨论第二分析滤波器H1205的配置和设计,但是在某些实施例中,可以将其视为在低频带/高频带下具有定义阈值频率的高通滤波器。
在图4中用步骤305来示出使用分析滤波器和下采样器进行的信号到频带/通道的划分。
第一处理块211可以接收高293和低291频率通道且在某些实施例中对这些信号执行波束成形处理和/或自适应滤波。第一处理块可以应用任何适当的波束成形和/或自适应滤波以便实现诸如声学回波控制(AEC)和对来自每个频率通道的信号分量的多扩音器处理的应用。在某些实施例中,可以缩短用于低频通道291的自适应滤波中的自适应滤波器,因为后面是音频信号的下采样的低通滤波允许自适应滤波器长度的二等分。因此,这能够改善滤波过程,因为已知较短的自适应滤波器在这些类型的应用中比较长的一些执行得更好。此外,由于在较高频率上不能利用方向性,所以可以实现由第一处理块执行的声学回波控制(AEC)和多扩音器处理应用两者,使得可以仅对低频带或通道信号执行用于这些应用的波束成形和自适应滤波。在这些实施例中,高频带/通道信号可以使用第二处理块231中的子带频域处理来实现AEC和多扩音器处理。这是因为其中多扩音器或扩音器阵列处理最有效的频带取决于扩音器之间的距离。最常见的是,移动设备中的距离使得只有较低频率处理起来是合理的。此外,通常人类听力具有对数频率解释更好的频率分辨率,并且可以针对较低的频率使用较高的处理保真度来产生更好的结果。
在某些实施例中,第一处理器211可以对低频带/通道分量执行时域处理。例如,第一处理器可以将时域处理用于语音活动检测(VAD)并具体地用于某个时域特征提取。可以将VAD视为一般或高水平控制信息,大部分言语/语音处理算法受益于信号是语音还是别的东西。例如,最典型地,VAD被噪声抑制器(NS)应用用来指示何时可以估计噪声特性(当不存在噪声时)。第一处理器211可以对低频带/通道信号执行时域处理,因为语音信号通常在低频带上载送其大部分信息和能量。
在图4中用步骤307示出频带/通道中的至少一个的预处理,例如由第一处理块进行的波束成形和/或自适应滤波的应用。
子带发生器285可以从第一处理块接收输出。换言之,在某些实施例中,子带发生器在滤波器组223处接收已处理高频带/通道并在快速傅立叶变换器(FFT)处接收已处理低频带/通道。
快速傅立叶变换器221接收已处理低频带/通道信号,换言之为局限于窄带采样频率的时域信号带,并执行快速傅立叶变换以产生频带限制处理音频信号的频域表示。在某些实施例的第一示例中,低频带/通道信号可以被采样为包括80个样本的帧、换言之以8kHz采样的10ms周期。在某些其它实施例中,低频带/通道信号可以被采样为具有160个样本或20ms的帧长的帧。
在某些实施例中,该帧被加窗,换言之,乘以窗口函数。在这些实施例中,并且由于在帧之间加窗部分地重叠,所以重叠样本被存储在存储器中以用于下一个帧。在这些实施例中,快速傅立叶变换可以将用于此帧的这80个样本与来自前一帧的存储的16个样本组合,得到总共96个样本。在此类实施例中,可以存储用于此帧的最后16个样本以便计算下一个帧频率系数。在这些实施例中,FFT可以获取96个样本并将样本乘以包括96个样本值的窗,窗的前8个值形成窗的上升条,并且最后8个值形成窗的下降条。窗函数I可以是任何适当的函数,但是在某些实施例中,可以如下定义:
I(n)=(n+1)/9;n=0,…,7
I(n)=1;n=8,…,87
I(n)=(96-n)/9n=88,…,95
在某些实施例中,由于用于中间80个样本值(n=8,…,87)的窗函数I(n)=1,并且因此与这些函数样本值的乘法不改变音频信号样本值,所以能够省略该乘法。换言之,在这些实施例中,只须乘以窗中的前8个样本和最后8个样本。
此外,由于FFT的长度必须是二的幂,所以FFT 221在从块11获得的96个样本的结尾处添加32个零(0),得到包括128个样本的语音帧。
帧中的样本x(0),x(1),…,x(n);n=127(或所述128个样本)被FFT 221采用实数(real)FFT(快速傅立叶变换)变换到频域,给定频域样本X(0),X(1),…,X(f);f=64(更一般地f=(n+1)/2),其中每个样本包括实部Xr(f)和虚部Xi(f):X(f)=Xr(f)+jXi(f),f=0,…,64
在某些实施例中,可以对FFT 221进行量值平方并将虚部和实部成对地加在一起以生成语音帧的功率谱。
FFT然后可以将信号的频率分量表示输出到第二处理块231。
滤波器组223接收高频带/通道信号并生成具有足以用于第二处理块中的噪声抑制及其它应用的频率分辨率的一系列信号。在某些实施例中,可以在数字音频控制器105的控制下实现和/或设计滤波器组223。在本发明的某些实施例中,数字音频控制器105可以将滤波器组223配置为基于余弦的调制滤波器组。可以将此结构选择为简化重组过程。
在某些实施例中,数字音频控制器105可以用标准将滤波器组223实现为第M带滤波器,所述标准使滤波器与理想滤波器之间的误差的最小二乘方值最小化。换言之,可以将子带滤波器选择为使以下等式最小化:
其中λ(ω)表示加权值,Hd(ω)指的是理想滤波器,Ω指的是一定网格(grid)或范围的频率,并且H(z)=∑hkz-k是第M带滤波器。在实施例中,滤波器组223可以是关于中间抽头l对称的,使得且hl±kM=0。在某些实施例中,数字音频控制器105可以根据基于余弦的已调制滤波器组的子带的数目和宽度来选择用于M的适当的值。在某些实施例中,数字音频控制器105将由滤波器组生成的子带组合为仅在某些频率上具有“有意义”内容的输入信号。在这些实施例中,数字音频控制器105可以通过经由将相应的滤波器组滤波器系数相加来将相邻子带合并而实现此配置。
图7示出滤波器组223频率响应的示例。用H1(z)对所有滤波器求卷积,通过将相应的滤波器组系数相加来将最低的四个和最高的两个频带合并。用从约3.4kHz至4kHz的第一子带区域701、从约4kHz至5.1kHz的第二子带区域703、从约5.1kHz至6.3kHz的第三子带区域705和从约6.3kHz至8kHz的第四子带区域707来突出显示用于四个子带的滤波器组输出。在某些实施例中,数字音频控制器可以设计具有滤波器组滤波器的适度阻带衰减的滤波器组滤波器,因为不存在抽取或内插,并且因此不存在要防止的附加混叠。
此外,图4示出用于被用作用于上述滤波器组滤波器的起始点的原型第M带滤波器(在本示例中为M=14)的量值响应。
可以认识到的是虽然滤波器组具有用于滤波器组的相对短的延迟,但其仍产生延迟。然而,来自滤波器组的这些延迟是无意义的,并且可能不确定系统的总延迟,因为通常从FFT 221产生的延迟将更大。因此,在某些实施例中,在合成滤波器部中可能需要额外延迟滤波器z-D265以补偿FFT 221延迟。
在图4中在步骤309示出带至子带的划分。
这些子带划分的输出被传递至第二处理块231。
第二处理块231被配置为处理子带信号以执行噪声抑制并用于残余回波衰减。在某些实施例中,第二处理块可以计算用于高频带信号的每个子带上的信号功率,并将其与用于每个低频带子带的功率谱密度分量一起使用。
在某些实施例中,第二处理块231被配置为使用任何适当的噪声抑制技术(诸如在US5839101或US-2007/078645中示出的技术)来执行噪声抑制。
在某些实施例中,第二处理块231向来自FFT 221和滤波器组223的子带分量施加任何适当的残余回波抑制处理。
在图4中用步骤311示出应用第二处理块231以便向至少一个子带施加处理以进行噪声抑制和/或回波抑制。
子带组合器287包括快速傅里叶逆变换器241和求和部243。
快速傅立叶逆变换器(IFFT)241接收低频带已处理子带并施加快速傅立叶逆变换以生成时域低频带表示。快速傅立叶逆变换可以是任何适当的快速傅立叶逆变换。IFFT 241将低频带信号信息输出到第三处理块251。
求和部243接收高频带已处理子带并将分量加在一起以生成高频带/通道信号。求和部将高频带信号信息输出到第三处理块251。
在图4中用步骤313示出用以生成已处理频带的已处理子带的重组。
第三处理块从IFFT 241接收低频带/通道信息并从求和部243接收高频带/通道信息并对信号执行后处理。在某些实施例中,第三处理块251执行信号水平控制。在某些实施例中,当稍后将信号求和或组合时,用于水平控制的实施方式首先是在使用定点表示法时可能存在溢出。在这些实施例中,可以估计此溢出条件且信号水平相应地被第三处理块降低。其次,在这些实施例中,可以例如根据扩音器和扬声器距离来改变信号水平,并且可以由第三处理块251以收听者始终具有最佳且稳定的音量水平的方式来控制。
第三处理块251的输出被传递至合成滤波器部283。
在图4中用步骤315示出第三处理块251的应用。
在某些实施例中,合成滤波器部283接收被划分成频带和滤波器的已处理数字音频信号并将频带组合以生成单个已处理数字音频信号。
如图3所示,合成滤波器部283在某些实施例中包括被配置为接收处理块的低频带/通道信号输出并输出适合于与高频带/通道信号组合的上采样形式的上采样器261。在某些实施例中,上采样器251是值2的整数上采样器。换言之,上采样器261将每对样本之间的新样本相加以将采样频率从8kHz“增加”至16kHz。上采样器261然后将上采样的输出信号输出到第一合成滤波器F0263。
第一合成滤波器F0263从上采样器263接收经上采样的信号并将已滤波信号输出到组合器267的第一输入端。稍后还将详细地讨论第一合成滤波器F0263的配置和设计,但是在某些实施例中,可以将其示为在低频带/高频带边界处具有定义阈值频率的低通滤波器。
在某些实施例中,可以将组合的第一合成滤波器F0263和上采样器261视为用于将采样率从8kHz增加至16kHz的内插器。
第二合成滤波器F1265(在某些实施例中其可以是命名为z-D的纯延迟滤波器)被配置为从来自第三处理块251的高频带输出端接收输出并将已滤波信号输出到组合器267的第二输入端。稍后将详细地讨论第二合成滤波器F1265的配置和设计,但是在某些实施例中,可以将其视为具有足以与第一合成滤波器F0263的输出同步的定义延迟的纯延迟滤波器。
组合器267接收已滤波已处理高频带信号和已滤波已处理低频带信号并输出组合信号。在某些实施例中,此输出是到数字音频编码器103以用于存储或传送之前的进一步编码。
在图4中用步骤317示出将已处理频带组合的操作。
数字音频编码器103还可以根据任何适当的编码过程将已处理数字音频信号编码。例如,数字音频编码器103可以应用任何适当的无损耗或有损耗编码过程,诸如国际电信联合会技术委员会(ITU-T)G.722或G729编码族中的任何一个。在某些实施例中,数字音频编码器103是可选的且可以不实现。
在图4中用步骤319示出音频信号的进一步编码的操作。
可以将根据本发明的实施例的数字音频控制器105配置为选择用于实现滤波器H0、H1、F0和F1的参数。在音频信号中,在最低频率上可以存在通常非常强的分量。可以在任何内插过程期间将这些分量镜像到高频带频率上。换言之,可以用数字音频控制器将内插滤波器(合成滤波器)F0和F1配置为具有对应于最强镜像频率且使这些镜像分量衰减的一个或多个零。可以在上述音频处理之前执行由数字音频控制器进行的滤波器的配置且根据实施例可以执行一次或不止一次。
例如,在某些实施例中,数字音频控制器105可以是与数字音频处理器分离的设备且在出厂初始化和测试程序上,数字音频控制器105在被从设备去除之前对数字音频处理器的参数进行配置。在其它实施例中,数字音频控制器能够每当设备或用户要求时重配置数字音频处理器。例如,如果设备最初被配置为用于低噪声环境中的语音的高保真度捕捉,则可以使用控制器来将设备和数字音频处理器重配置为用于具有高回波环境的高噪声环境中的语音音频捕捉。
参考图5可以看到由数字音频控制器105进行的滤波器的配置或设置,其中确定用于滤波器H0201、H1205、F0263和F1265的实现参数。
相对于图3所示的设备,如果在Z域、离散拉普拉斯域中,到数字音频处理器101的输入被定义为X(z)且来自数字音频处理器101的输出被定义为Y(z),则可以将用于滤波器组的外部部分的输入-输出关系(如果我们假设在处理块和内部滤波器组内不存在处理)表示为以下等式:
在某些实施例中,控制器寻求使得输出为具有低失真的输入的延迟形式,换言之
Y(z)≈z-LX(z)
其中L指的是由滤波器产生的延迟。
数字音频控制器105将合成滤波器F1265和F0263配置为分别是分析滤波器H1205和H0201的时间反转形式。
在图5中用步骤501可以看到此初始假设操作。
使用此假设的数字音频控制器105现在尝试最初使用以下等式来计算用于分析滤波器H0和H1的参数:
其中Ω指的是一定网格的频率,δ(ω)定义在这些频率中的每一个中允许的失真,ω0和ω1分别指的是低和高频带的阻带边缘,并且λ0和λ1表示加权函数值。
数字音频控制器105现在可以认为此最小化将被表示为可以使用任何已知半定规划解来找到其唯一解的半定规划(SDP)问题。
因此,在某些实施例中,控制器可以确定初始滤波器参数,其用仅具有一个小的总失真的约束使阻带能量最小化,并且其还迫使通带值接近于一。
在图5中用步骤503可以看到通过用仅一个小的总失真标准使阻带能量最小化来确定H0、H1滤波器参数的操作。
数字音频控制器105然后可以去除合成滤波器F1265和F0263分别是分析滤波器H1205和H0201的时间反转形式的假设。
在某些实施例中,数字音频控制器105可以对迭代步骤过程进行初始化。
数字音频控制器可以使用以下表达式用固定第一分析滤波器H0201来确定用于第一合成滤波器F0263和第二分析滤波器H1205的参数:
具有固定的H0(ω).
在图5中用步骤505示出其中相对于固定H0来选择用于F0和F1的滤波器参数的迭代的第一部分的操作。
迭代的第二部分中的控制器105然后尝试相对于以下等式用固定第一合成滤波器F0263来确定用于第二分析滤波器H1205和第一分析滤波器H0201的参数:
其中存在固定F0(ω).
在图5中用步骤507示出用固定第一合成滤波器F0(ω)来确定用于第一分析滤波器H0201和第二分析滤波器H1205的参数。
可以将两个上述迭代过程操作表示为二阶锥(SOC)问题并由控制器105来迭代地求解。如前所述,Ω指的是一定网格的频率,δ(ω)定义控制在每个频率中允许多少失真的参数,ω0和ω1分别指的是低和高频带边缘频率,并且λ0、λ1和λ2表示加权函数。
数字音频控制器105因此可以尝试用仅具有一个总的小失真的约束使阻带能量最小化。此过程可以迫使通带接近于一。
数字音频控制器105然后可以执行检查步骤以确定由当前参数生成的滤波器相对于预定义标准而言是否是可接受的。在图5中用步骤509示出检查步骤。
在检查步骤确定滤波器为可接受的情况下,操作然后转到步骤511。在检查步骤确定要求进一步迭代的情况下,数字音频控制器105返回到迭代的第一部分,其相对于固定H0来确定用于合成滤波器F0和分析滤波器H1的参数。
迭代过程可以在很大程度上取决于初始化过程。在由本发明人执行的测试中,已经观察到较短的初始滤波器H0和H1一般地提供较好的解。此外,数字音频控制器105可以使用时间反转H0(换言之最大相位滤波器)作为用于F0滤波器的初始估计,其中子带之间的时间同步是重要的。
相对于由滤波器产生的总延迟L,数字音频控制器105可以根据任何适当的值来设置该值。并且,如前文所指示的,数字音频控制器105可以根据H1滤波器的长度来确定用于第二合成滤波器F1的参数。在图5中用步骤511示出F1参数的确定。在某些实施例中,H1和滤波器F1的群组延迟将确定近似于针对L定义的值。在某些实施例中,数字音频控制器105可以将用于第一分析滤波器组外部滤波器H1的参数确定为具有近似线性相位,换言之具有恒定的延迟。在某些实施例中,控制器105确定滤波器参数,使得滤波器H0201和F0263延迟在频率之间可以不同,但是具有卷积滤波器特性H0(z)F0(z),其在所有频率上具有近似恒定的延迟L。
相对于图6,示出了用于第一合成滤波器F0263、第一分析滤波器H1205和第二分析滤波器H0201的适当频率响应。在这些示例中,用虚线601来标记高频带分析滤波器、第二分析滤波器H1205、频率响应且其具有从3.2kHz向上的通带。用以十字形‘+’605标记的轨迹来示出低频带分析滤波器、第一分析滤波器H0201、频率响应,并且用大约从4kHz开始的阻带示出。用以十字形‘x’705标记的轨迹来定义低频带合成滤波器、第二合成滤波器F0263、频率响应,并且用从3.2kHz开始的阻带示出。
在某些实施例中,数字音频控制器105集中于内插器滤波器、第一合成滤波器F0263,因为典型的音频信号低频分量是相对强的,并且在这些实施例中,控制器可以将滤波器F0263配置为使低频分量镜像显著地衰减。
在某些实施例中,数字音频控制器105可以在迭代步骤的第一最优化中增加用于λ2的加权,这可以随后增加第一合成滤波器F0263的阻带衰减。
在图5中用步骤401示出用于分析滤波器组外部滤波器和合成滤波器组外部滤波器的实现参数的确定。
虽然上述示例示出三个单独的处理块211、231、251。应认识到的是在某些实施例中仅要求第二处理块231的操作,因此可能不存在第一和第三处理块两者。例如,可以不执行上述后处理信号水平控制操作,或者在某些实施例中可以作为第二处理块231操作的一部分来执行。同样地,在某些实施例,在第一处理块221中可以不执行预处理操作,但是可以作为第二处理块231的一部分来执行。
可以使用扩音器阵列处理或波束成形(上文所述)来实现上述实施例,其中要求多个扩音器,并且因此实现了立体声或多音信号。换言之,某些实施例接收多个信号作为输入,但是提供较少的输出。在某些实施例中,较少的输出可以仅仅是单输出。此外,在某些实施例中,使用用于波束成形的频率范围来实现用于所有输入的类似频率划分方法。在这些实施例中,首先针对所有通道或成对通道且针对每个频带来计算背景噪声估计,然后针对每个频带将较小的值存储为背景噪声估计。在其中目的在于使远处噪声源衰减的这些实施例中,诸如由第二处理块231执行的噪声消除操作不抑制其中记录源或信号起源接近于记录设备、使得音频水平在不同的扩音器或记录点处明显不同的音频信息。
虽然上文描述了具有特定结构的设备和数字音频处理器103,但应理解的是根据本实施例,可以存在许多可能的替换实施方式。
在某些实施例中,用于高或低频带中的任何一个的采样率可以不同于上述值。例如,在某些实施例中,高频带可以具有48kHz的采样频率。
此外,在某些实施例中,输入信号可以是44.1kHz采样信号,换言之是压缩盘(CD)格式化数字信号。在这些实施例中,可以将使用在以上实施例中描述的结构的低频带视为具有22.1kHz(低频带)采样率。
此外,由于主频带上的子带的数目和尺寸是由噪声抑制的要求规定的,所以其它实施例可以使用不同数目的子带和具有不同子带宽度的子带。
在本发明的某些实施例中,可以使用多于在上述实施例中示出的两个频带。例如,在某些实施例中,为了获得足够的频率分辨率以便针对较低的频率分量抑制较强的噪声,可以进一步划分低频带。例如,在这些实施例中,可以将低频带0至4kHz划分成高-低频带2kHz至4kHz和达到2kHz的低-低频带。
在某些实施例中,针对子带滤波器中的操作所述的基于余弦的已调制滤波器组可以使用用于原型滤波器的M的较高或较低值,并将适当的滤波器系数组合以产生要求的子带分布。
数字音频处理器101当被根据上述实施例的数字音频控制器105控制时因此将能够根据模拟生成相比于常规方法而言具有改善的质量且具有下降10~20dB的量化噪声的增强宽带语音音频信号。量化噪声的此降低现在实际上消失了或者对于正常用户而言是不可察觉的。此外,以上所示的设备使得能够使用具有较低计算复杂性的音频增强系统,这有助于对功率效率的恒定需求以使得设备能够在不增加电池容量的情况下更便宜且具有更长的操作时间。
此外,可以将这些实施例设计为使得与其它种类的滤波器组结构相比存在短的延迟,因此放松了对用于语音信号的传输或存储的信号编码的处理时间约束。
在上述实施例中,由于已经对被抽取的频带执行自适应滤波并因此需要外部2通道分析-合成滤波器组,频率划分框架的特定布局/实施方式可以提供诸如在上述实施例中用处理块1、2和3示出的许多划分可能性。在某些实施例中,这些划分可能性可以被算法以频带使用和计算需要被最优化的方式灵活地使用。
此外,某些实施例与先前滤波器组系统(例如其中两通道分析-合成滤波器组后面是对再合成宽带信号的基于FFT的处理的结构)相比可以减少对静态存储器的需要。
虽然以上示例描述了在电子设备10或设备内操作的本发明的实施例,但将认识到的是可以将如下所述的本发明实现为一连串的音频处理级内的任何音频处理级的一部分。
因此,在某些实施例中,存在一种包括将音频信号滤波成至少两个频带信号并针对每个频带信号生成多个子带信号的操作的方法。在此类实施例中,针对至少一个频带信号,使用时域至频域变换来生成所述多个子带信号,并且针对至少一个其它频带,使用子带滤波器组来生成用于所述一个其它频带的所述多个子带信号。
此外,在某些实施例中,存在一种包括至少一个处理器和包括计算机程序代码的至少一个存储器的设备,所述至少一个存储器和所述计算机程序代码被配置为用所述至少一个处理器促使所述设备至少执行上述操作。
在某些其它实施例中,存在一种设备,包括滤波器,其被配置为将音频信号滤波成至少两个频带信号;时域至频域变换器,其被配置为针对至少一个频带信号生成多个子带信号;以及子带滤波器组,其被配置为针对至少一个其它频带生成所述多个子带信号。
此外,用户设备、通用串行总线(USB)棒以及调制解调器数据卡可以包括诸如在以上实施例中描述的设备的音频增强设备。
应认识到的是术语用户设备意图覆盖任何适当类型的无线用户设备,诸如移动电话、便携式数据处理设备或便携式网页浏览器。
此外,公共陆地移动网(PLMN)的元件也可以包括如上所述的设备。
通常,可以用硬件或专用电路、软件、逻辑或其任何组合来实现上述各种实施例。例如,可以在硬件中实现某些方面,同时可以在可以由控制器、微处理器或其它计算设备执行的固件或软件中实现其它方面,虽然本发明不限于此。虽然可以将本发明的各种方面示为并描述为框图、流程图、或使用某些其它图示,但应理解的是可以在作为非限制性示例的硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其它计算设备或其某些组合中实现本文所述的这些块、设备、系统、技术或方法。
可以用可由数据处理器执行的计算机软件,诸如在处理器实体中、或用硬件或用软件和硬件的组合来实现本申请的实施例。此外,在这方面,应注意的是如在附图中的逻辑流的任何框可以表示程序步骤或互连逻辑电路、块和功能或程序步骤和逻辑电路、块和功能的组合。可以将软件存储在诸如存储器芯片或在处理器内实现的存储器块、诸如硬盘或软盘的磁介质以及诸如例如示例性数字多功能盘(DVD)、压缩盘(CD)和两者的数据变体的物理介质上。
存储器可以是适合于本地技术环境的任何类型,并且可以使用任何适当的数据存储技术来实现,诸如基于半导体的存储器件、磁存储器件和系统、光学存储器件和系统、固定存储器和可移动存储器。数据处理器可以是适合于本地技术环境的任何类型,并且作为非限制性示例,可以包括通用计算机、专用计算机、微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、门电平电路和基于多核处理器架构的处理器。
可以在诸如集成电路模块的各种组件中实施本发明的实施例。集成电路的设计是大体上高度自动化的过程。复杂且强大的软件工具可用于将逻辑水平设计转换成准备好被蚀刻和在半导体衬底上形成的半导体电路设计。
诸如由Mountain View,California的Synopsys公司和San Jose,California的Cadence Design提供的那些程序使用良好建立的设计规则以及预存设计模块库在半导体芯片上自动地布置导线和定位组件。一旦用于半导体电路的设计已完成,则可以将呈标准化电子格式(例如Opus、GDSII等)的设计结果传送到半导体制造机构或“工厂(fab)”以进行制造。
前述说明已以示例性且非限制性示例的方式提供了本发明的示例性实施例的完整且信息丰富的描述。然而,当结合附图和所附权利要求来阅读时,鉴于前述说明,各种修改和变更可以变得对于相关领域的技术人员来说显而易见。然而,本发明的讲授内容的所有此类和类似修改将仍在如在所附权利要求中定义的本发明的范围内。
如在本申请中使用的术语电路可以指的是所有以下各项:(a)仅硬件电路实施方式(诸如用仅模拟和/或数字电路的实施方式)和(b)电路与软件(和/或固件)的组合,诸如当适用时:(i)(多个)处理器的组合或(ii)(多个)处理器/软件(包括(多个)数字信号处理器)的各部分、软件和一起工作以促使诸如移动电话或服务器的设备执行各种功能的(多个)存储器,和(c)要求软件或固件以进行操作的电路,诸如(多个)微处理器或(多个)微处理器的一部分,即使软件或固件实际上是不存在的。
电路的此定义适用于此术语在本申请的所有使用,包括在任何权利要求中。作为另一示例,如在本申请中所使用的术语电路也将覆盖仅处理器(或多个处理器)或处理器的一部分及其随附软件和/或固件的实施方式。例如且如果可适用于特定权利要求元件,术语电路还将覆盖用于移动电话或服务器、蜂窝式网络设备或其它网络设备中的类似集成电路的基带集成电路或应用处理器集成电路。
在本申请中,术语处理器和存储器可以包括但不限于:(1)一个或多个微处理器,(2)具有随附(多个)数字信号处理器的一个或多个处理器,(3)没有随附(多个)数字信号处理器的一个或多个处理器,(3)一个或多个专用计算机芯片,(4)一个或多个现场可编程门阵列(FPGAS),(5)一个或多个控制器,(6)一个或多个专用集成电路(ASICS)或(多个)检测器、(多个)处理器(包括双核或多核处理器)、(多个)数字信号处理器、(多个)控制器、接收器、发送器、编码器、解码器、存储器(和多个存储器)、软件、固件、RAM、ROM、显示器、用户接口、显示电路、用户接口电路、用户接口软件、显示软件、(多个)电路、天线、天线电路以及电路。
Claims (40)
1.一种方法,包括:
将音频信号滤波成至少两个频带信号;以及
针对每个频带信号生成多个子带信号;其中针对至少一个频带信号,使用时域至频域变换来生成所述多个子带信号,并且针对至少一个其它频带,使用子带滤波器组来生成用于所述一个其它频带的所述多个子带信号。
2.如权利要求1所述的方法,其中所述时域至频域变换包括以下各项中的至少一个:
快速傅立叶变换;
离散傅立叶变换;以及
离散余弦变换。
3.如权利要求1和2所述的方法,其中所述子带滤波器组包括基于余弦的调制滤波器组。
4.如权利要求1至3所述的方法,其中将音频信号滤波成至少两个频带信号包括:
将所述音频信号高通滤波成至少两个频带信号中的第一个;
将所述音频信号低通滤波成低通滤波信号;以及
对所述低通滤波音频信号进行下采样以生成所述至少两个频带信号中的第二个。
5.如权利要求3所述的方法,其中所述对所述低通滤波音频信号进行下采样以生成所述至少两个频带信号中的第二个是用因子2进行的。
6.如权利要求1至5所述的方法,其中所述方法还包括:
处理来自至少一个频带的至少一个子带信号;
将所述子带信号组合以形成至少两个已处理频带音频信号;以及
将所述至少两个已处理频带音频信号组合以生成已处理音频信号。
7.如权利要求6所述的方法,其中处理来自至少一个频带的至少一个子带信号包括:
向来自所述至少一个频率信号的至少一个子带信号施加噪声抑制。
8.如权利要求6和7所述的方法,其中将所述子带信号组合以形成至少两个已处理频带信号包括:
使用频域至时域变换从第一组子带信号生成所述至少两个已处理频带中的第一个;以及
将第二组子带信号求和以形成所述至少两个已处理频带中的第二个。
9.如权利要求8所述的方法,其中使所述第一组子带信号与使用时域至频域变换生成的所述多个子带信号相关联,并使所述第二组子带信号与使用子带滤波器组生成的所述多个子带信号相关联。
10.如权利要求6至9所述的方法,其中将所述至少两个已处理频带音频信号组合以生成已处理音频信号还包括:
对所述至少两个已处理频带信号中的第一个进行上采样;
对所述至少两个已处理频带信号中的被上采样的第一个进行低通滤波;以及
将所述至少两个已处理频带信号中的被低通滤波、上采样的第一个与所述至少两个已处理频带信号中的第二个组合以生成已处理音频信号。
11.如权利要求10所述的方法,其中对所述至少两个已处理频带信号中的第一个进行上采样是用因子2进行的。
12.如权利要求10和11所述的方法,其中将所述至少两个已处理频带音频信号组合以生成已处理音频信号还包括使所述至少两个已处理频带信号中的第二个延迟以使所述至少两个已处理频带信号中的被低通滤波、上采样的第一个与所述至少两个已处理频带信号中的第二个同步。
13.如权利要求6至12所述的方法,还包括在将所述至少两个已处理频带音频信号组合以生成已处理音频信号之前处理所述子带信号,其中所述子带信号的处理包括对所述子带信号的信号水平控制。
14.如从属于权利要求4时的权利要求6至13所述的方法,还包括配置包括以下各项的滤波器:
第一滤波器,其用于所述音频信号到至少两个频带信号中的第一个的高通滤波;
第二滤波器,其用于所述音频信号到低通滤波信号的低通滤波;以及
第三滤波器,其用于所述已处理频带信号中的被上采样的第一个的低通滤波。
15.如权利要求14所述的方法,其中配置所述第一组滤波器包括:
通过仅用一个失真来使用于第一滤波器和第二滤波器的阻带能量最小化来配置用于所述第一滤波器和第二滤波器的至少一个滤波器参数。
16.如权利要求15所述的方法,其中配置第一组滤波器包括:
执行在保持用于第一滤波器的滤波器参数固定的同时配置用于第二滤波器和第三滤波器的至少一个滤波器参数且然后在保持用于第三滤波器的滤波器参数固定的同时配置用于所述第一滤波器和第二滤波器的至少一个滤波器参数的操作的至少一个迭代。
17.如权利要求1至16所述的方法,还包括:
在针对每个频带信号生成多个子带信号之前处理至少两个频带信号,其中所述至少两个频带信号的处理优选地包括以下各项中的至少一个:
音频波束形成处理;以及
自适应滤波。
18.一种包括至少一个处理器和包括计算机程序代码的至少一个存储器的设备,所述至少一个存储器和所述计算机程序代码被配置为用所述至少一个处理器促使所述设备至少执行:
将音频信号滤波成至少两个频带信号;以及
针对每个频带信号生成多个子带信号;其中针对至少一个频带信号,使用时域至频域变换来生成所述多个子带信号,并且针对至少一个其它频带,使用子带滤波器组来生成用于所述一个其它频带的所述多个子带信号。
19.如权利要求18所述的设备,其中所述时域至频域变换包括以下各项中的至少一个:
快速傅立叶变换;
离散傅立叶变换;以及
离散余弦变换。
20.如权利要求18和19所述的设备,其中所述子带滤波器组包括基于余弦的调制滤波器组。
21.如权利要求18至20所述的设备,其中当促使所述设备执行将音频信号滤波成至少两个频带信号时还包括促使所述设备执行:
将所述音频信号高通滤波成至少两个频带信号中的第一个;
将所述音频信号低通滤波成低通滤波信号;以及
对所述低通滤波音频信号进行下采样以生成所述至少两个频带信号中的第二个。
22.如权利要求21所述的设备,其中当促使设备执行对低通滤波音频信号进行下采样以生成所述至少两个频带信号中的第二个时还包括促使设备用因子2来执行下采样。
23.如权利要求18至22所述的设备,其中所述至少一个处理器促使所述设备进一步执行:
处理来自至少一个频带的至少一个子带信号;
将所述子带信号组合以形成至少两个已处理频带音频信号;以及
将所述至少两个已处理频带音频信号组合以生成已处理音频信号。
24.如权利要求23所述的设备,其中当促使所述设备执行处理来自至少一个频带的至少一个子带信号时还包括促使所述设备执行:
向来自所述至少一个频率信号的至少一个子带信号施加噪声抑制。
25.如权利要求23和24所述的设备,其中在促使所述设备执行将所述子带信号组合以形成至少两个已处理频率信号时还包括促使所述设备执行:
使用频域至时域变换从第一组子带信号生成所述至少两个已处理频带中的第一个;以及
将第二组子带信号求和以形成所述至少两个已处理频带中的第二个。
26.如权利要求25所述的设备,其中使所述第一组子带信号与使用时域至频域变换生成的所述多个子带信号相关联,并使所述第二组子带信号与使用子带滤波器组生成的所述多个子带信号相关联。
27.如权利要求23至26所述的设备,其中当促使所述设备执行将所述至少两个已处理频带音频信号组合以生成已处理音频信号时还包括促使所述设备执行:
对所述至少两个已处理频带信号中的第一个进行上采样;
对所述至少两个已处理频带信号中的被上采样的第一个进行低通滤波;以及
将所述至少两个已处理频带信号中的被低通滤波、上采样的第一个与所述至少两个已处理频带信号中的第二个组合以生成已处理音频信号。
28.如权利要求27所述的设备,其中当促使所述设备执行对所述至少两个已处理频带信号中的第一个进行上采样时还包括促使所述设备用因子2来执行上采样。
29.如权利要求27和28所述的设备,其中当促使所述设备将所述至少两个已处理频带音频信号组合以生成已处理音频信号时还包括促使所述设备执行使所述至少两个已处理频带信号中的第二个延迟以使所述至少两个已处理频带信号中的被低通滤波、上采样的第一个与所述至少两个已处理频带信号中的第二个同步。
30.如权利要求23至29所述的设备,其中所述至少一个处理器促使所述设备至少还执行在将所述至少两个已处理频带音频信号组合以生成已处理音频信号之前处理所述子带信号,其中所述子带信号的处理包括对所述子带信号的信号水平控制。
31.如从属于权利要求21时的权利要求23至28所述的设备,其中所述至少一个处理器促使所述设备至少还执行配置包括以下各项的滤波器:
第一滤波器,其用于所述音频信号到至少两个频带信号中的第一个的高通滤波;
第二滤波器,其用于所述音频信号到低通滤波信号的低通滤波;以及
第三滤波器,其用于已处理频带信号中的被上采样的第一个的低通滤波。
32.如权利要求31所述的设备,其中当促使所述设备执行配置第一组滤波器时包括促使所述设备执行:
通过仅用一个失真来使用于第一滤波器和第二滤波器的阻带能量最小化来配置用于所述第一滤波器和第二滤波器的至少一个滤波器参数。
33.如权利要求32所述的设备,其中当促使所述设备执行配置第一组滤波器时包括促使所述设备执行:
执行在保持用于第一滤波器的滤波器参数固定的同时配置用于第二滤波器和第三滤波器的至少一个滤波器参数且然后在保持用于第三滤波器的滤波器参数固定的同时配置用于第一滤波器和第二滤波器的至少一个滤波器参数的操作的至少一个迭代。
34.如权利要求18至33所述的设备,其中所述至少一个处理器促使所述设备进一步执行:
在针对每个频带信号生成多个子带信号之前处理至少两个频带信号,其中所述至少两个频带信号的处理包括以下各项中的至少一个:
音频波束成形处理;以及
自适应滤波。
35.一种设备,包括:
滤波装置,其被配置为将音频信号滤波成至少两个频带信号;以及
处理装置,其用于针对每个频带信号生成多个子带信号;其中针对至少一个频带信号,使用时域至频域变换来生成所述多个子带信号,并且针对至少一个其它频带,使用子带滤波器组来生成用于所述一个其它频带的所述多个子带信号。
36.一种设备,包括:
滤波器,其被配置为将音频信号滤波成至少两个频带信号;
时域至频域变换器,其被配置为针对至少一个频带信号生成多个子带信号;以及
子带滤波器组,其被配置为针对至少一个其它频带生成所述多个子带信号。
37.一种用指令编码的计算机可读介质,所述指令在被计算机执行时执行:
将音频信号滤波成至少两个频带信号;以及
针对每个频带信号生成多个子带信号;其中针对至少一个频带信号,使用时域至频域变换来生成所述多个子带信号,并且针对至少一个其它频带,使用子带滤波器组来生成用于一个其它频带的所述多个子带信号。
38.如权利要求18至36所述的设备,包括编码器。
39.一种包括如权利要求18至36所述的设备的电子设备。
40.一种包括如权利要求18至36所述的设备的芯片组。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0915595A GB2473267A (en) | 2009-09-07 | 2009-09-07 | Processing audio signals to reduce noise |
GB0915595.3 | 2009-09-07 | ||
PCT/IB2010/054033 WO2011027337A1 (en) | 2009-09-07 | 2010-09-07 | A method and an apparatus for processing an audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102576538A true CN102576538A (zh) | 2012-07-11 |
CN102576538B CN102576538B (zh) | 2015-05-20 |
Family
ID=41203308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080045655.0A Expired - Fee Related CN102576538B (zh) | 2009-09-07 | 2010-09-07 | 用于处理音频信号的方法和设备 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9640187B2 (zh) |
EP (1) | EP2476116A4 (zh) |
KR (1) | KR101422368B1 (zh) |
CN (1) | CN102576538B (zh) |
GB (1) | GB2473267A (zh) |
RU (1) | RU2517315C2 (zh) |
WO (1) | WO2011027337A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102708860A (zh) * | 2012-06-27 | 2012-10-03 | 昆明信诺莱伯科技有限公司 | 一种基于声信号识别鸟类种类的判断标准建立方法 |
CN106571147A (zh) * | 2016-11-13 | 2017-04-19 | 南京汉隆科技有限公司 | 用于网络话机声学回声抑制的方法 |
CN108028670A (zh) * | 2015-08-12 | 2018-05-11 | 舒尔获得控股公司 | 宽带可调谐组合器系统 |
CN108140396A (zh) * | 2015-09-22 | 2018-06-08 | 皇家飞利浦有限公司 | 音频信号处理 |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102623016A (zh) * | 2012-03-26 | 2012-08-01 | 华为技术有限公司 | 宽带语音处理方法及装置 |
US9319791B2 (en) * | 2012-04-30 | 2016-04-19 | Conexant Systems, Inc. | Reduced-delay subband signal processing system and method |
JP6018408B2 (ja) * | 2012-05-02 | 2016-11-02 | 任天堂株式会社 | 情報処理プログラム、情報処理装置、情報処理システム及び情報処理方法 |
KR20160010606A (ko) | 2013-05-23 | 2016-01-27 | 노우레스 일렉트로닉스, 엘엘시 | Vad 탐지 마이크로폰 및 그 마이크로폰을 동작시키는 방법 |
US10020008B2 (en) | 2013-05-23 | 2018-07-10 | Knowles Electronics, Llc | Microphone and corresponding digital interface |
US10028054B2 (en) | 2013-10-21 | 2018-07-17 | Knowles Electronics, Llc | Apparatus and method for frequency detection |
US20180317019A1 (en) | 2013-05-23 | 2018-11-01 | Knowles Electronics, Llc | Acoustic activity detecting microphone |
US9711166B2 (en) | 2013-05-23 | 2017-07-18 | Knowles Electronics, Llc | Decimation synchronization in a microphone |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
US10609475B2 (en) | 2014-12-05 | 2020-03-31 | Stages Llc | Active noise control and customized audio system |
US20160165339A1 (en) * | 2014-12-05 | 2016-06-09 | Stages Pcs, Llc | Microphone array and audio source tracking system |
US9747367B2 (en) | 2014-12-05 | 2017-08-29 | Stages Llc | Communication system for establishing and providing preferred audio |
US9654868B2 (en) | 2014-12-05 | 2017-05-16 | Stages Llc | Multi-channel multi-domain source identification and tracking |
CN107210046B (zh) * | 2014-12-24 | 2021-01-22 | 伊夫斯·吉恩-保罗·盖伊·雷扎 | 用于处理和分析信号的方法,以及实现这种方法的装置 |
US10045140B2 (en) | 2015-01-07 | 2018-08-07 | Knowles Electronics, Llc | Utilizing digital microphones for low power keyword detection and noise suppression |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US9565493B2 (en) | 2015-04-30 | 2017-02-07 | Shure Acquisition Holdings, Inc. | Array microphone system and method of assembling the same |
US9554207B2 (en) | 2015-04-30 | 2017-01-24 | Shure Acquisition Holdings, Inc. | Offset cartridge microphones |
CN105743911B (zh) * | 2016-03-30 | 2018-11-13 | 武汉随锐亿山科技有限公司 | 一种提升视频会议系统混音容量的方法 |
US10945080B2 (en) | 2016-11-18 | 2021-03-09 | Stages Llc | Audio analysis and processing system |
US9980042B1 (en) | 2016-11-18 | 2018-05-22 | Stages Llc | Beamformer direction of arrival and orientation analysis system |
US9980075B1 (en) | 2016-11-18 | 2018-05-22 | Stages Llc | Audio source spatialization relative to orientation sensor and output |
US10367948B2 (en) | 2017-01-13 | 2019-07-30 | Shure Acquisition Holdings, Inc. | Post-mixing acoustic echo cancellation systems and methods |
US10200540B1 (en) * | 2017-08-03 | 2019-02-05 | Bose Corporation | Efficient reutilization of acoustic echo canceler channels |
CN112335261B (zh) | 2018-06-01 | 2023-07-18 | 舒尔获得控股公司 | 图案形成麦克风阵列 |
US11374666B2 (en) * | 2018-06-08 | 2022-06-28 | Nokia Technologies Oy | Noise floor estimation for signal detection |
JP7187183B2 (ja) * | 2018-06-14 | 2022-12-12 | 株式会社トランストロン | エコー抑圧装置、エコー抑圧方法およびエコー抑圧プログラム |
US11297423B2 (en) | 2018-06-15 | 2022-04-05 | Shure Acquisition Holdings, Inc. | Endfire linear array microphone |
US11310596B2 (en) | 2018-09-20 | 2022-04-19 | Shure Acquisition Holdings, Inc. | Adjustable lobe shape for array microphones |
EP3644313A1 (en) | 2018-10-26 | 2020-04-29 | Fraunhofer Gesellschaft zur Förderung der Angewand | Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction |
US11558693B2 (en) | 2019-03-21 | 2023-01-17 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality |
US11303981B2 (en) | 2019-03-21 | 2022-04-12 | Shure Acquisition Holdings, Inc. | Housings and associated design features for ceiling array microphones |
US11438691B2 (en) | 2019-03-21 | 2022-09-06 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality |
WO2020237206A1 (en) | 2019-05-23 | 2020-11-26 | Shure Acquisition Holdings, Inc. | Steerable speaker array, system, and method for the same |
WO2020243471A1 (en) | 2019-05-31 | 2020-12-03 | Shure Acquisition Holdings, Inc. | Low latency automixer integrated with voice and noise activity detection |
CN110517703B (zh) * | 2019-08-15 | 2021-12-07 | 北京小米移动软件有限公司 | 一种声音采集方法、装置及介质 |
EP4018680A1 (en) | 2019-08-23 | 2022-06-29 | Shure Acquisition Holdings, Inc. | Two-dimensional microphone array with improved directivity |
US12028678B2 (en) | 2019-11-01 | 2024-07-02 | Shure Acquisition Holdings, Inc. | Proximity microphone |
US11657828B2 (en) * | 2020-01-31 | 2023-05-23 | Nuance Communications, Inc. | Method and system for speech enhancement |
US11552611B2 (en) | 2020-02-07 | 2023-01-10 | Shure Acquisition Holdings, Inc. | System and method for automatic adjustment of reference gain |
CN111510910B (zh) * | 2020-03-10 | 2023-03-14 | 深圳市广和通无线股份有限公司 | 通信模块频段设置方法、装置、计算机设备和存储介质 |
US11676598B2 (en) | 2020-05-08 | 2023-06-13 | Nuance Communications, Inc. | System and method for data augmentation for multi-microphone signal processing |
WO2021243368A2 (en) | 2020-05-29 | 2021-12-02 | Shure Acquisition Holdings, Inc. | Transducer steering and configuration systems and methods using a local positioning system |
KR102276006B1 (ko) | 2021-01-14 | 2021-07-13 | 주식회사 에머스 | Qr코드를 이용한 재활용쓰레기 회수장치 |
JP2024505068A (ja) | 2021-01-28 | 2024-02-02 | シュアー アクイジッション ホールディングス インコーポレイテッド | ハイブリッドオーディオビーム形成システム |
KR20220114365A (ko) * | 2021-02-08 | 2022-08-17 | 라인플러스 주식회사 | 풀 밴드 신호의 노이즈 제거 방법 및 장치 |
EP4106346A1 (en) * | 2021-06-16 | 2022-12-21 | Oticon A/s | A hearing device comprising an adaptive filter bank |
CN113973250B (zh) * | 2021-10-26 | 2023-12-08 | 恒玄科技(上海)股份有限公司 | 一种噪声抑制方法、装置及辅听耳机 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0858159A2 (en) * | 1997-02-06 | 1998-08-12 | Sony Corporation | Band synthesis and band splitting filter bank encoder and decoder, encoding and decoding method |
US6868377B1 (en) * | 1999-11-23 | 2005-03-15 | Creative Technology Ltd. | Multiband phase-vocoder for the modification of audio or speech signals |
CN101227537A (zh) * | 2007-01-19 | 2008-07-23 | 中兴通讯股份有限公司 | 一种宽带声学回声消除方法 |
US20080189116A1 (en) * | 2002-09-27 | 2008-08-07 | Leblanc Wilfrid | Method and System for Dual Mode Subband Acoustic Echo Canceller with Integrated Noise Suppression |
CN101477800A (zh) * | 2008-12-31 | 2009-07-08 | 瑞声声学科技(深圳)有限公司 | 语音增强的方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3707116B2 (ja) * | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
FI100840B (fi) | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
US5806025A (en) * | 1996-08-07 | 1998-09-08 | U S West, Inc. | Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank |
FI116643B (fi) | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
JP4290917B2 (ja) * | 2002-02-08 | 2009-07-08 | 株式会社エヌ・ティ・ティ・ドコモ | 復号装置、符号化装置、復号方法、及び、符号化方法 |
KR100513729B1 (ko) * | 2003-07-03 | 2005-09-08 | 삼성전자주식회사 | 계층적인 대역폭 구조를 갖는 음성 압축 및 복원 장치와그 방법 |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
US20070078645A1 (en) | 2005-09-30 | 2007-04-05 | Nokia Corporation | Filterbank-based processing of speech signals |
GB2437559B (en) * | 2006-04-26 | 2010-12-22 | Zarlink Semiconductor Inc | Low complexity noise reduction method |
US7818079B2 (en) * | 2006-06-09 | 2010-10-19 | Nokia Corporation | Equalization based on digital signal processing in downsampled domains |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
KR101449433B1 (ko) * | 2007-11-30 | 2014-10-13 | 삼성전자주식회사 | 마이크로폰을 통해 입력된 사운드 신호로부터 잡음을제거하는 방법 및 장치 |
US8463603B2 (en) * | 2008-09-06 | 2013-06-11 | Huawei Technologies Co., Ltd. | Spectral envelope coding of energy attack signal |
-
2009
- 2009-09-07 GB GB0915595A patent/GB2473267A/en not_active Withdrawn
-
2010
- 2010-09-07 EP EP10813426.3A patent/EP2476116A4/en not_active Ceased
- 2010-09-07 CN CN201080045655.0A patent/CN102576538B/zh not_active Expired - Fee Related
- 2010-09-07 US US13/394,783 patent/US9640187B2/en active Active
- 2010-09-07 WO PCT/IB2010/054033 patent/WO2011027337A1/en active Application Filing
- 2010-09-07 RU RU2012113254/08A patent/RU2517315C2/ru not_active IP Right Cessation
- 2010-09-07 KR KR1020127009043A patent/KR101422368B1/ko not_active IP Right Cessation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0858159A2 (en) * | 1997-02-06 | 1998-08-12 | Sony Corporation | Band synthesis and band splitting filter bank encoder and decoder, encoding and decoding method |
US6868377B1 (en) * | 1999-11-23 | 2005-03-15 | Creative Technology Ltd. | Multiband phase-vocoder for the modification of audio or speech signals |
US20080189116A1 (en) * | 2002-09-27 | 2008-08-07 | Leblanc Wilfrid | Method and System for Dual Mode Subband Acoustic Echo Canceller with Integrated Noise Suppression |
CN101227537A (zh) * | 2007-01-19 | 2008-07-23 | 中兴通讯股份有限公司 | 一种宽带声学回声消除方法 |
CN101477800A (zh) * | 2008-12-31 | 2009-07-08 | 瑞声声学科技(深圳)有限公司 | 语音增强的方法 |
Non-Patent Citations (1)
Title |
---|
K.BRANDENBURG ET.AL: "Second Generation Perceptual Audio Coding: The Hybrid Coder", 《AES 88TH CONVENTION》, 16 March 1990 (1990-03-16) * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102708860A (zh) * | 2012-06-27 | 2012-10-03 | 昆明信诺莱伯科技有限公司 | 一种基于声信号识别鸟类种类的判断标准建立方法 |
CN102708860B (zh) * | 2012-06-27 | 2014-04-23 | 昆明信诺莱伯科技有限公司 | 一种基于声信号识别鸟类种类的判断标准建立方法 |
CN108028670A (zh) * | 2015-08-12 | 2018-05-11 | 舒尔获得控股公司 | 宽带可调谐组合器系统 |
CN108028670B (zh) * | 2015-08-12 | 2020-09-22 | 舒尔获得控股公司 | 宽带可调谐组合器系统 |
CN108140396A (zh) * | 2015-09-22 | 2018-06-08 | 皇家飞利浦有限公司 | 音频信号处理 |
CN106571147A (zh) * | 2016-11-13 | 2017-04-19 | 南京汉隆科技有限公司 | 用于网络话机声学回声抑制的方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20120063514A (ko) | 2012-06-15 |
GB2473267A (en) | 2011-03-09 |
EP2476116A4 (en) | 2013-05-29 |
EP2476116A1 (en) | 2012-07-18 |
US20130035777A1 (en) | 2013-02-07 |
GB0915595D0 (en) | 2009-10-07 |
CN102576538B (zh) | 2015-05-20 |
WO2011027337A1 (en) | 2011-03-10 |
US9640187B2 (en) | 2017-05-02 |
KR101422368B1 (ko) | 2014-07-22 |
RU2012113254A (ru) | 2013-10-27 |
RU2517315C2 (ru) | 2014-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102576538B (zh) | 用于处理音频信号的方法和设备 | |
CN102074246B (zh) | 基于双麦克风语音增强装置及方法 | |
CN101916567B (zh) | 应用于双麦克风系统的语音增强方法 | |
JP5551258B2 (ja) | 狭帯域信号から「より上の帯域」の信号を決定すること | |
CN101167250B (zh) | 使用变形处理的数字音频的动态范围控制与均衡的方法和设备 | |
CN102074245B (zh) | 基于双麦克风语音增强装置及语音增强方法 | |
CN103325380B (zh) | 用于信号增强的增益后处理 | |
JP5671147B2 (ja) | 後期残響成分のモデリングを含むエコー抑制 | |
JP5221117B2 (ja) | 低複雑性のエコー補償 | |
US20130044896A1 (en) | Virtual Bass Synthesis Using Harmonic Transposition | |
US20130231925A1 (en) | Monaural Noise Suppression Based on Computational Auditory Scene Analysis | |
CN102576537B (zh) | 用于处理音频信号的方法和装置 | |
US20060206320A1 (en) | Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers | |
US20110096942A1 (en) | Noise suppression system and method | |
US20100232616A1 (en) | Noise error amplitude reduction | |
CN105324982A (zh) | 用于抑制不需要的音频信号的方法和设备 | |
CN102347027A (zh) | 双麦克风语音增强装置及其语音增强方法 | |
CN102652336A (zh) | 声音信号复原装置以及声音信号复原方法 | |
CN113299313B (zh) | 音频处理方法、装置及电子设备 | |
US9245538B1 (en) | Bandwidth enhancement of speech signals assisted by noise reduction | |
EP2720477B1 (en) | Virtual bass synthesis using harmonic transposition | |
CN102246230B (zh) | 用于提高噪声环境中话音的可理解性的系统和方法 | |
WO2013150340A1 (en) | Adaptive audio signal filtering | |
CN101221767A (zh) | 语音加强装置与应用于其上的方法 | |
Kang et al. | Audio Effect for Highlighting Speaker’s Voice Corrupted by Background Noise on Portable Digital Imaging Devices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20160128 Address after: Espoo, Finland Patentee after: Technology Co., Ltd. of Nokia Address before: Espoo, Finland Patentee before: Nokia Oyj |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150520 Termination date: 20180907 |