CN102388418B - 低复杂度频谱带复制(sbr)滤波器组 - Google Patents
低复杂度频谱带复制(sbr)滤波器组 Download PDFInfo
- Publication number
- CN102388418B CN102388418B CN2010800162379A CN201080016237A CN102388418B CN 102388418 B CN102388418 B CN 102388418B CN 2010800162379 A CN2010800162379 A CN 2010800162379A CN 201080016237 A CN201080016237 A CN 201080016237A CN 102388418 B CN102388418 B CN 102388418B
- Authority
- CN
- China
- Prior art keywords
- group
- bank
- coefficient
- filters
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000003595 spectral effect Effects 0.000 title claims description 23
- 230000010076 replication Effects 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims abstract description 48
- 238000006243 chemical reaction Methods 0.000 claims description 73
- 238000000034 method Methods 0.000 claims description 58
- 230000009466 transformation Effects 0.000 claims description 37
- 238000013519 translation Methods 0.000 claims description 18
- 230000002441 reversible effect Effects 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 abstract description 32
- 238000007792 addition Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 24
- 239000002131 composite material Substances 0.000 description 23
- 238000010586 diagram Methods 0.000 description 18
- 238000004422 calculation algorithm Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 12
- 238000005070 sampling Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 8
- 238000009795 derivation Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000013507 mapping Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000008707 rearrangement Effects 0.000 description 4
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000007474 system interaction Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0223—Computation saving measures; Accelerating measures
- H03H17/0227—Measures concerning the coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0211—Frequency selective networks using specific transformation algorithms, e.g. WALSH functions, Fermat transforms, Mersenne transforms, polynomial transforms, Hilbert transforms
- H03H17/0213—Frequency domain filters using Fourier transforms
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0266—Filter banks
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0272—Quadrature mirror filters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H2218/00—Indexing scheme relating to details of digital filters
- H03H2218/04—In-phase and quadrature [I/Q] signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种复数分析滤波器组通过获得输入音频信号作为多个,即N个,时域输入样本而实施。执行所述时域输入样本的成对加法及减法以获得中间样本的第一群组及第二群组,每一群组具有N/2个中间样本。接着反转所述第二群组中的奇数索引中间样本的正负号。将第一变换应用于中间样本的所述第一群组以获得频域中的输出系数的第一群组。将第二变换应用于中间样本的所述第二群组以获得所述频域中的输出系数的中间第二群组。接着逆转输出系数的所述中间第二群组中的系数的次序以获得输出系数的第二群组。输出系数的所述第一群组及所述第二群组可作为所述音频信号的频域表示来存储及/或传输。
Description
根据35 U.S.C.§119主张优先权
本专利申请案主张2009年4月14日所申请的题为“用于AAC-ELD、HE-AAC及USAC的快速SBR滤波器组(Fast SBR filterbanks for AAC-ELD,HE-AAC,and USAC)”的第61/169,132号美国临时申请案的优先权,所述临时申请案已转让给本发明的受让人,且在此以引用的方式明确地并入本文中。
技术领域
以下描述大体涉及编码器及解码器,且确切地说,涉及用于例如高效率高级音频编码(HE-AAC)、增强型低延迟(ELD)、空间音频(SAOC)及统一的语音与音频(USAC)编解码器的音频编解码器的MPEG族的高计算效率的滤波器组结构。
背景技术
音频编码的一目标为将音频信号压缩为所要的有限信息量,同时尽可能多地保持原始声音质量。在编码过程中,将时域中的输入音频信号变换成频域音频信号,且对应解码过程通过将频域音频信号变换成时域中的输出音频信号来逆转此操作。
音频编解码器可基于为人类听觉系统的心理声学特性建模。举例而言,音频信号可分成若干频带,且人耳的掩蔽性质可用以移除心理声学冗余。因此,音频编解码器一般依赖于用于压缩的变换编码技术。音频编解码器通常适用于以低位速率编码任何一般性音频材料。由于音频编解码器为了良好频率选择性而对较长帧长度操作,且还由于音频编解码器通常使用正交滤波器组,因此其往返算法延迟较高,从而使其不适用于全双工通信。然而,对高质量、低位速率、全双工音频通信应用(例如音频及视频会议)的需要正日益增长。
MPEG标准化称为MPEG-4高级音频编码(AAC)-增强型低延迟(ELD)的低延迟音频编解码器,其尝试改良编码效率同时保持编解码器延迟对于全双工通信足够低。AAC为采用两个主要编码策略以显著地减小表示高质量数字音频所需的数据量的宽带音频编码算法。首先,丢弃在感知上无关的信号分量,且其次,消除经编码的音频信号中的冗 余。
编码效率通过使用频谱带复制(SBR)得以提高。为最小化经引入的延迟,使用分析及合成SBR滤波器组的低延迟版本。通常,这些音频编解码器可在处理功率及电池寿命均有限的移动平台上操作。因此,存在对用于音频编解码器的计算密集型操作的快速算法的需要。通常,滤波器组及变换促成计算复杂度的显著部分。对于用于AAC-ELD中的低延迟SBR(LD-SBR)滤波器组,对应矩阵乘法操作可为计算最密集部分中的一者。
因此,需要一种高计算效率的滤波器组来减小音频编解码器中的计算复杂度及/或延迟。
发明内容
下文呈现一个或一个以上实施例的简化概述以便提供对一些实施例的基本理解。此概述并非所有预期实施例的广泛综述,且既不意在识别所有实施例的关键或决定性要素,也不意在描绘任何或所有实施例的范畴。其唯一目的为以简化形式来呈现一个或一个以上实施例的一些概念以作为稍后所呈现的更详细描述的序部。
提供一种用于计算变换值的编码方法及/或装置。接收表示音频信号的时域输入值。所述时域输入值可使用(例如)离散余弦变换(DCT)变换成频域(例如,实数分量及虚数分量)输出值。
提供一种用于计算变换值的解码方法及/或装置。接收表示音频信号的频谱系数。所述频谱系数可使用(例如)逆离散余弦变换(IDCT)变换成时域输出值。
离散余弦变换实际上为重要的,部分地因为其通过其变换矩阵的因子分解而允许极有效的计算。因此,如果N点向量乘以一般NxN矩阵的乘法需要O(N2)次乘法及加法,则向量乘以经恰当地因子分解的DCT矩阵的乘积的计算通常仅需要O(N log N)次乘法及/或加法。
实际上,类型II的离散余弦变换及类型IV的DCT为最常用或最常实施的。类型IV的DCT具有一额外优点:其为对合的(involutary),即,其对于正变换及逆变换两者而言具有相同变换矩阵。尽管DCT-II及/或DCT-IV为便利的,但实际上,常常出现对实施基函数不严格符合DCT-II或DCT-IV中的各者的滤波器组的需要。此发生在(例如)低延迟滤波器组(例如AAC-ELD,或HE-AAC,或SAOC编解码器的SBR滤波器组中的各者)的设计中。因而,本文中揭示允许通过使用DCT-II或DCT-IV变换来计算用于各种编解码器的一类SBR滤波器组的技术。此计算引起SBR滤波器组的复杂度的显著减小。
提供一种用于实施滤波器组(例如复数分析滤波器组)的方法及/或设备。获得输入音频信号作为多个(N个)时域输入样本。接着执行所述多个(N个)时域输入样本的成对加法及减法以获得中间样本的第一群组及第二群组,每一群组具有N/2个中间样本。输出系数的第一群组可由实系数组成,且输出系数的第二群组可由虚系数组成。接着反转所述第二群组中的奇数索引中间样本的正负号。将第一变换应用于中间样本的第一群组以获得频域中的N/2个输出系数的第一群组。将第二变换应用于中间样本的第二群组以获得频域中的N/2个输出系数的中间第二群组。第一变换及第二变换可同时操作以变换中间样本的第一群组及第二群组。第一变换及第二变换可均为离散余弦变换(DCT)类型IV变换。所述分析滤波器组可由一在分子中具有因子(2n±x)的方程式表示,其中n为样本索引且x为奇数。逆转输出系数的中间第二群组中的系数的次序以获得N/2个输出系数的第二群组。所使用的时域输入样本可为实域中的样本,而频域可为复域。在各种实施方案中,所述滤波器组可为(例如)分析正交镜像滤波器组、音频编码器及/或解码器的部分,及/或频谱带复制(SBR)编码器及/或解码器的部分。音频编码器及/或解码器可实施MPEG高级音频编码增强型低延迟(AAC-ELD)标准、MPEG高效率AAC(HE-AAC)标准、MPEG空间音频编码(SAOC),及MPEG统一语音与音频编码(USAC)标准中的至少一者。
提供一种用于实施滤波器组(例如复数合成滤波器组)的方法及/或设备。可获得表示频域中的音频信号的多个(N/2个)复值输入系数,其中N/2个输入系数的第一群组为所述N/2个复值输入系数的实数分量且N/2个输入系数的第二群组为所述N/2个复值输入系数的虚数分量,其中相对于第二群组中的偶数索引系数来反转第二群组中的奇数索引系数的正负号。输入系数的第一群组可由实系数组成,且输入系数的第二群组可由虚系数组成。可将第一逆变换应用于输入系数的第一群组以获得时域中的N/2个输出样本的中间第一群组。可将第二逆变换应用于输入系数的第二群组以获得时域中的N/2个输出样本的中间第二群组。第一逆变换及第二逆变换可同时操作以变换输入系数的第一群组及第二群组。第一逆变换及第二逆变换可均为逆离散余弦变换(IDCT)类型IV变换。所述滤波器组可由在分子中具有因子(2n±x)的方程式表示,其中n为系数索引且x为奇数。可执行从输出样本的中间第一群组减去输出样本的中间第二群组的成对减法,以获得多个(N个)时域输出样本。频域可为复域,而时域样本为实域中的样本。在各种实施方案中,滤波器组可为(例如)合成正交镜像滤波器组、音频解码器的部分,及/或频谱带复制(SBR)解码器的部分。音频解码器可实施MPEG-4高级音频编码(AAC)-低延迟(ELD)标准、MPEG-4 AAC-增强型低延迟(ELD)标准,及MPEG-4 MPEG-4 高效率(HE)-AAC标准中的至少一者。
提供一种用于实施滤波器组(例如实数分析滤波器组)的方法及/或设备。获得输入音频信号作为多个(N个)时域输入样本。可执行时域输入样本的成对加法及减法以获得N/2个中间样本的群组。可将变换应用于N/2个中间样本的群组以获得频域中的N/2个输出系数。时域输入样本及频域系数两者可均为实数。所述变换可为离散余弦变换(DCT)类型IV变换。所述滤波器组可由在分子中具有因子(2n±x)的方程式表示,其中x为奇数。所述滤波器组可为(例如)分析正交镜像滤波器组、音频编码器及/或解码器的部分,及/或频谱带复制(SBR)编码器及/或解码器的部分。音频编码器及/或解码器可实施MPEG高级音频编码增强型低延迟(AAC-ELD)标准、MPEG高效率AAC(HE-AAC)标准、MPEG空间音频编码(SAOC),及MPEG统一语音与音频编码(USAC)标准中的至少一者。
提供一种用于实施滤波器组(例如实数合成滤波器组)的方法及/或设备。获得用于频域中的音频信号的多个(N/2个)输入系数。将逆变换应用于N/2个输入系数的群组以获得时域中的N个输出样本的中间群组。可对N个输入系数的中间群组执行系数的复制、正负号反转及重新排序,以获得多个(N个)时域输出样本。输入系数及时域输出样本两者可均为实数(即,实域)。所述逆变换为离散余弦变换(DCT)类型IV变换。所述滤波器组由在分子中具有因子(2n±x)的方程式表示,其中x为奇数。在各种实施方案中,所述滤波器组可为(例如)合成正交镜像滤波器组、音频解码器的部分,及/或频谱带复制(SBR)解码器的部分。音频解码器实施MPEG高级音频编码增强型低延迟(AAC-ELD)标准、MPEG高效率AAC(HE-AAC)标准、MPEG空间音频编码(SAOC),及MPEG统一语音与音频编码(USAC)标准中的至少一者。
附图说明
当结合图式阅读时,各种特征、性质及优点可通过下文阐述的具体实施方式显而易见,在各图中,相同参考符号始终相应地进行识别。
图1为说明适于用于经由无线网络通信的移动装置的实例的框图。
图2为说明可包括有效分析滤波器组的AAC-ELD编码器的实例的框图。
图3为说明可包括有效分析滤波器组及/或有效合成滤波器组的AAC-ELD解码器的实例的框图。
图4说明有效复数分析滤波器组的实例。
图5说明用于实施根据一个实例的分析滤波器组的方法。
图6为说明用于实施根据一个实例的分析滤波器组的功能组件的框图。
图7说明有效复数合成滤波器组的实例。
图8说明用以实施根据一个实例的合成滤波器组的方法。
图9为说明用于实施根据一个实例的合成滤波器组的功能组件的框图。
图10说明有效实域分析滤波器组的实例。
图11说明用于实施根据一个实例的分析滤波器组的方法。
图12为说明用于实施根据一个实例的分析滤波器组的功能组件的框图。
图13说明有效实域合成滤波器组的实例。
图14说明用于实施根据一个实例的合成滤波器组的方法。
图15为说明用于实施根据一个实例的合成滤波器组的功能组件的框图。
具体实施方式
现参看图式来描述各种实施例,其中相同参考数字始终用以指代相同元件。在以下描述中,为实现解释的目的,阐述许多特定细节以便提供对一个或一个以上实施例的透彻理解。然而,可明显地看出,可在无这些特定细节的情况下实践此(此些)实施例。在其它例子中,以框图形式来展示众所周知的结构及装置,以便促进描述一个或一个以上实施例。
具有音频编解码器的示范性移动装置
图1为说明适于用于经由无线网络通信的移动装置的实例的框图。移动装置102可包括耦合到音频编解码器106及无线通信收发器108的处理电路104。无线通信收发器108允许所述移动装置经由天线110空中传输及/或接收通信。音频编解码器106可耦合到音频输入装置112(例如,麦克风)以接收输入音频信号114,且耦合到音频输出装置116(例如,一个或一个以上扬声器)以输出音频信号118。
在各种实例中,音频编解码器106可包括编码器120,编码器120适于接收时域输入音频信号且通过将时域输入音频信号变换成频域输出信号来有效地编码所述时域输入音频信号。所述频域输出信号可接着由移动装置存储,通过移动装置经由音频输出装置116播放,及/或经由无线通信收发器108传输。另外,音频编解码器106还可包括解码器122,解码器122适于通过将频域音频信号变换成经重新建构的时域音频信号来解码所述频域音频信号。经重新建构的时域音频信号可接着通过移动装置经由音频输出装置116播放。在各种实例中,音频编解码器106可经配置以根据MPEG AAC-增强型低延迟(ELD)标准及/或MPEG高效率(HE)-AAC标准等标准操作。
根据一个特征,音频编解码器106可包括编码器及/或解码器的有效实施方案。
示范性编码器结构
图2为说明可包括有效分析滤波器组的AAC-ELD编码器的实例的框图。AAC-ELD编码器202可接收输入音频信号204。降低取样器206可降低取样输入音频信号204以降低其取样速率。经降低取样的输入音频信号204接着传递到AAC-ELD核心编码器208,AAC-ELD核心编码器208压缩音频信号,所述音频信号接着通过位流格式器210格式化成位流以产生经编码的音频位流212。
除了AAC编码器208之外,编码器202还可包括低延迟(LD)频谱带复制(SBR)编码器214。频谱带复制可用以增强音频或语音编解码器(尤其以低位速率),且是基于频域中的谐波冗余。SBR可与任何音频压缩编解码器组合:编解码器自身传输频谱的较低及中间频率,而SBR通过向上转置来自解码器处的较低及中间频率的谐波来复制较高频率成分。用于高频率频谱包络的重新建构的一些指导信息通过编码器202作为辅助信息传输。SBR可在复值域中操作以避免混叠效应,且因此可能引起相当大时间延迟。
SBR编码器214可包括分析正交镜像滤波器组(QMF)216及包络计算器218。分析QMF组216又可实施开窗函数220及分析QMF(AQMF)函数222。视应用及其所允许功率使用而定,AAC-ELD编码器可指导SBR编码器214在复值域或实值域中操作。在这两种状况下,相应实域或复域分析滤波器组均可通过AQMF函数222实施。
示范性解码器结构
图3为说明可包括有效分析滤波器组及/或有效合成滤波器组的AAC-ELD解码器的实例的框图。AAC-ELD解码器302可接收经编码的音频位流304。熵解码器306、反向量化器308及增强型低延迟核心解码器310可接着处理经编码的音频位流304,以重新建构输出音频信号314。作为重新建构输出音频信号314的一部分,低延迟SBR解码器312可处理来自增强型低延迟核心解码器310的所得信号。
SBR解码器312可包括分析正交镜像滤波器组(QMF)316、高频率产生器318、高频率调整器320,及合成QMF组322。分析QMF组116又可实施开窗函数324及分析QMF(AQMF)函数326。为解决与在复值域或实值域中操作的SBR解码器312相关联的时间延迟,有效分析滤波器组可通过AQMF函数326实施。合成QMF组322又可实施合成QMF(SQMF)函数328及开窗函数330。视解码器的复杂度而定,SBR解码器312可在复值域或实值域中操作。对应实域或复域合成滤波器组可通过SQMF函数328实施。此外,如果归因于复杂度或应用需求,合成仅一半标称频带为合理的,则解码器可通过SQMF函数328实施经降低取样的合成滤波器组。
低延迟SBR滤波器组
存在AAC-ELD中所界定的两种类型的低延迟SBR滤波器组:
·复数低延迟滤波器组(CLDFB),及
·实数(或低复杂度)低延迟滤波器组。
其中复数低延迟滤波器组意在用于需要任何给定位速率下的最佳可能音频质量的应用中,而低复杂度低延迟滤波器组意在为仍产生可接受结果(即,在质量/速率方面)的较低复杂度版本。
SBR复数低延迟滤波器组(CLDFB)操作界定如下(忽略正规化因子):
复数分析QMF:
复数合成QMF:
复数经降低取样的合成QMF:
其中 且x(n), X(k),
AAC-ELD中的实数分析及合成滤波器组还界定如下:
实数分析QMF:
实数合成QMF:
实数经降低取样的合成QMF:
大小为N的DCT-IV变换界定如下:
根据一个方面,方程式1至6的滤波器组经因子分解以使得其基本矩阵向量乘积运算变成方程式7。
用于复数分析QMF的映射
在将方程式1的复数分析QMF映射到方程式7的DCT-IV变换的过程中,方程式1可表示为:
假设p=n-48。则X(k)可分解如下:
在求和中现假设n=p+64。则:
其中x′(n)可经界定为两个分量:
则X(k)可表示为:
接着,X(k)可进一步分解为:
接着,在第二求和中,n可用63-n替换,得到
另外,x1(n)及x2(n)可经界定为:
其通过方程式11意味着:
通过将x1(n)及x2(n)代入所得方程式14,X(k)可经界定为:
应注意,方程式17中的第一求和为32点离散余弦变换类型IV(DCT-IV),且方程 式17的第二求和为32点离散正弦变换类型IV(DST-IV)。
此外,DST-IV可通过输入正负号改变及输出置换而映射到DCT-IV。换句话说,方程式17的两个分量可如下表示为X1(k)及X2(k):
其中X2(k)为已经转换的DST-IV分量。
则X(k)可表示为:
X(k)=X1(k)+iX2(31-k)k=0,…,31。 (方程式19)
其中两个部分的计算仅为呈方程式7的形式的DCT-IV变换。
用于复数合成QMF的映射
在将方程式2的复数合成QMF映射到方程式7的DCT-IV变换的过程中,方程式2可表示为:
则:
接着, 可分解且表示为:
因此,对于n=0,…,95:
且对于n=96,…,127:
及
根据方程式28及29的以上两个结果,应注意,
对于n=32,…,63,还具有:
及
用于复数经降低取样的合成QMF的映射
对复数经降低取样的合成QMF的从方程式3至方程式7的形式的推导类似于关于分析QMF及合成QMF所展示的推导。
假设
还假设:
则:
及
用于实数分析QMF的映射
对实数分析QMF的从方程式4至方程式7的形式的推导类似于上文描述的关于复数分析QMF所展示的推导。所得的用于实数分析QMF的滤波器组方程式给定为:
其中:
用于实数合成QMF的映射
对实数合成QMF的从方程式5至方程式7的形式的推导类似于上文描述的关于复数合成QMF所展示的推导。所得的用于实数合成QMF的滤波器组方程式给定为:
用于实数经降低取样的合成QMF的映射
对实数经降低取样的合成QMF的从方程式6至方程式7的形式的推导类似于上文描述的关于复数经降低取样的合成QMF所展示的推导。所得的用于实数经降低取样的合成QMF的滤波器组方程式给定为:
在上文提及的所有实例中,滤波器组计算有效地减少成大小为N=32或N=64的DCT-IV变换的计算。
复数分析滤波器组的示范性因子分解
应注意,方程式1、2、3、4、5及6的滤波器组为奇数相或奇数索引的,这意味着SBR方程式的分子包括因子(2n±x),其中x为奇数。在上文的实例中,方程式1及4包括(2n-95),方程式2及5包括(2n-63),且方程式3及6包括(2n-31)。实际上,归因于这些滤波器组的复杂度,在编码器/解码器中实施这些滤波器组为困难的,其引起延迟且需要更多处理资源。
因此,一个特征变换这些SBR算法(例如,方程式1、2、3、4、5及/或6),使得这些SBR算法可基于核心DCT-IV变换(例如,方程式7)来表示。即,通过实施基于有效DCT-IV变换的SBR算法,可更有效地执行SBR算法(例如,需要更少处理资源或可更快速地执行)。
图4说明有效复数分析滤波器组的实例。输入音频信号经取样成多个时域输入样本406(即,N点样本)。采用时域输入样本(例如,值)的成对求和及减法407来产生中间样本的第一群组409及第二群组411,每一群组具有N/2个中间样本。对于第二群组 411中的中间样本,反转奇数索引样本的正负号(例如,乘以(-1)n,其中n可介于(例如)0与N/2-1之间)。将第一DCT-IV变换402应用于中间样本的第一群组409以获得频域中的输出系数的第一群组408。将第二DCT-IV变换404应用于中间值的第二群组411以获得频域中的输出系数的中间第二群组415。逆转输出系数的中间第二群组415的次序以获得输出系数的第二群组410。因此,将时域信号输入样本406转换成频域(即,复域频谱)。此处,所得的输出系数的第一群组408表示实部,而输出系数的第二群组410表示虚部。
图5说明用于实施根据一个实例的分析滤波器组的方法。可获得输入音频信号作为多个(N个)时域输入样本(502)。可执行时域输入样本的成对加法及减法以获得中间样本的第一群组及第二群组,每一群组具有N/2个中间样本(504)。输出系数的第一群组可由实系数组成,且输出系数的第二群组由虚系数组成。可接着反转第二群组中的奇数索引中间样本的正负号(506)。可将第一变换应用于中间样本的第一群组以获得频域中的输出系数的第一群组(508)。可将第二变换应用于中间样本的第二群组以获得频域中的输出系数的中间第二群组(510)。第一变换及第二变换可均为离散余弦变换(DCT)类型IV变换。第一变换及第二变换可同时操作以变换中间样本的第一群组及第二群组。可逆转输出系数的中间第二群组中的系数的次序以获得输出系数的第二群组(512)。所使用的时域输入样本可为实域中的样本,而频域为复域。
在各种实施方案中,滤波器组可为分析正交镜像滤波器组、音频编码器的部分、频谱带复制(SBR)编码器/解码器的部分,及/或音频解码器的部分。音频编码器/解码器可实施MPEG高级音频编码增强型低延迟(AAC-ELD)标准、MPEG高效率AAC(HE-AAC)标准、MPEG空间音频编码(SAOC),及MPEG统一语音与音频编码(USAC)标准中的至少一者。
图6为说明用于实施根据一个实例的分析滤波器组的功能组件的框图。滤波器组装置可包括接口604,接口604适于获得输入音频信号601作为多个(N个)时域输入样本。预变换电路606可接着:(a)执行时域输入样本的成对加法及减法以获得中间样本的第一群组及第二群组,每一群组具有N/2个中间样本;及(b)反转第二群组中的奇数索引中间样本的正负号。第一变换电路608可接着将第一变换应用于中间样本的第一群组以获得频域中的输出系数的第一群组614。第二变换电路610可接着将第二变换应用于中间样本的第二群组以获得频域中的输出系数的中间第二群组。后变换电路612可接着逆转输出系数的中间第二群组中的系数的次序以获得输出系数的第二群组616。
复数合成滤波器组的示范性因子分解
图7说明有效复数合成滤波器组的实例。获得频域(例如,复域)中的输入系数,其中输入系数的第一群组706为实数分量,且输入系数的第二群组708为虚数分量。对于输入系数的第二群组708,相对于偶数索引系数来反转奇数索引样本的正负号(例如,乘以(例如)(-1)n,其中n可介于(例如)0与N/2-1之间)。将第一逆DCT-IV变换702应用于输入系数的第一群组706以获得时域中的输出样本的中间第一群组707。将第二逆DCT-IV变换704应用于输入系数的第二群组708以获得时域中的输出样本的中间第二群组709。接着执行从中间第一群组707减去中间第二群组709的成对减法以获得时域输出样本710(例如,值)。
图8说明用以实施根据一个实例的合成滤波器组的方法。可获得表示频域中的音频信号的多个(N/2个)复值输入系数,其中N/2个输入系数的第一群组为所述N/2个复值输入系数的实数分量,且N/2个输入系数的第二群组为所述N/2个复值输入系数的虚数分量,其中相对于第二群组中的偶数索引系数来反转第二群组中的奇数索引系数的正负号(802)。输入系数的第一群组可由实系数组成,且输入系数的第二群组由虚系数组成。频域可为复域,而时域样本为实域中的样本。可接着将第一逆变换应用于输入系数的第一群组以获得时域中的N/2个输出样本的中间第一群组(804)。还可将第二逆变换应用于输入系数的第二群组以获得时域中的N/2个输出样本的中间第二群组(806)。第一逆变换及第二逆变换可同时操作以变换输入系数的第一群组及第二群组。第一逆变换及第二逆变换可为逆离散余弦变换(IDCT)类型IV变换。可执行从输出样本的中间第一群组减去输出样本的中间第二群组的成对减法以获得多个(N个)时域输出样本(808)。
在各种实施方案中,滤波器组可为合成正交镜像滤波器组、音频解码器的部分,及/或频谱带复制(SBR)解码器的部分。音频解码器实施MPEG-4高级音频编码(AAC)-低延迟(ELD)标准、MPEG-4 AAC-增强型低延迟(ELD)标准,及MPEG-4 MPEG-4高效率(HE)-AAC标准中的至少一者。
图9为说明用于实施根据一个实例的合成滤波器组的功能组件的框图。合成滤波器组902可包括接口,所述接口适于获得用于频域中的音频信号的多个(N个)输入系数,其中N/2个输入系数的第一群组914为实数分量,且N/2个输入系数的第二群组916为虚数分量。预处理电路912可适于相对于第二群组中的偶数索引系数来反转第二群组中的奇数索引样本的正负号。第一变换电路908可适于将第一逆变换应用于输入系数的第一群组以获得时域中的输出样本的中间第一群组。第二变换电路910可适于将第二逆变 换应用于输入系数的第二群组以获得时域中的输出样本的中间第二群组。后变换电路906可适于执行从输入系数的中间第一群组减去输入系数的中间第二群组的成对减法,以获得多个(N个)时域输出样本901。
实数分析滤波器组的示范性因子分解
应注意,方程式48的实数分析滤波器组为奇数相或奇数索引的,这意味着SBR方程式的分子包括因子(2n±x),其中n为系数索引且x为奇数。在上文的实例中,方程式48包括(2n+1)。实际上,归因于这些滤波器组的复杂度,在编码器/解码器中实施这些滤波器组为困难的,其引起延迟且需要更多处理资源。
因此,一个特征变换这些SBR算法(例如,方程式48),使得其可基于核心DCT-IV变换(例如,方程式7)来表示。即,通过实施基于有效DCT-IV变换的SBR算法,可更有效地执行SBR算法(例如,需要更少处理资源或可更快速地执行)。
图10说明有效实域分析滤波器组的实例。输入音频信号经取样成多个时域输入样本1006(即,N点样本)。采用时域输入样本(例如,值)的成对求和及减法1007来获得N/2个中间样本上的群组1007。将第一DCT-IV变换1002应用于N/2个中间样本的群组1007以获得频域中的输出系数的群组1008。此处,所得的输出系数的群组1008表示实数分量。
图11说明用于实施根据一个实例的分析滤波器组的方法。可获得输入音频信号作为多个(N个)时域输入样本(1102)。可执行时域输入样本的成对加法及减法以获得N/2个中间样本的群组(1104)。可接着将变换应用于N/2个中间样本的群组以获得频域中的N/2个输出系数(1106)。时域输入样本及频域系数可为实数。所述变换可为离散余弦变换(DCT)类型IV变换。
在各种实施方案中,滤波器组可为分析正交镜像滤波器组、音频编码器的部分、频谱带复制(SBR)编码器/解码器的部分,及/或音频解码器的部分。音频编码器/解码器可实施MPEG高级音频编码增强型低延迟(AAC-ELD)标准、MPEG高效率AAC(HE-AAC)标准、MPEG空间音频编码(SAOC),及MPEG统一语音与音频编码(USAC)标准中的至少一者。
图12为说明用于实施根据一个实例的分析滤波器组的功能组件的框图。滤波器组装置1202可包括接口,所述接口适于获得输入音频信号1214作为多个(N个)时域输入样本。预变换电路1212可适于执行时域输入样本1214的成对加法及减法以获得N/2个中间样本的群组。变换电路1208可适于将变换应用于N/2个中间样本的群组以获得频域中的N/2个输出系数1201。
实数合成滤波器组的示范性因子分解
应注意,方程式50的实数合成滤波器组为奇数相或奇数索引的,这意味着SBR方程式的分子包括因子(2n±x),其中x为奇数。在上文的实例中,方程式50包括(2n+1)。实际上,归因于这些滤波器组的复杂度,在解码器中实施这些滤波器组为困难的,其引起延迟及/或需要更多处理资源。
因此,一个特征变换这些SBR算法(例如,方程式50),使得其可基于核心DCT-IV变换(例如,方程式7)来表示。即,通过实施基于有效DCT-IV变换的SBR算法,可更有效地执行SBR算法(例如,需要更少处理资源或可更快速地执行)。
图13说明有效实域合成滤波器组的实例。获得用于频域中的音频信号的多个(N/2个)输入系数1306。将逆变换1302应用于N/2个输入系数的群组以获得时域中的N个输出样本的中间群组1307。可执行来自N个输入系数的中间群组1307的系数的复制、正负号反转及重新排序以获得多个(N个)时域输出样本1310。
图14说明用于实施根据一个实例的合成滤波器组的方法。可获得用于频域中的音频信号的多个(N/2个)输入系数(1402)。可将逆变换应用于N/2个输入系数的群组以获得时域中的N个输出样本的中间群组(1404)。可执行来自N个输入系数的中间群组的系数的复制、正负号反转及重新排序以获得多个(N个)时域输出样本(1406)。
在各种实施方案中,滤波器组可为合成正交镜像滤波器组、音频解码器的部分、频谱带复制(SBR)解码器的部分。音频解码器可实施MPEG高级音频编码增强型低延迟(AAC-ELD)标准、MPEG高效率AAC(HE-AAC)标准、MPEG空间音频编码(SAOC),及MPEG统一语音与音频编码(USAC)标准中的至少一者。
图15为说明用于实施根据一个实例的合成滤波器组的功能组件的框图。滤波器组装置1502可包括接口,所述接口适于获得用于频域中的音频信号的多个(N/2个)输入系数1514。变换电路1512可适于将逆变换应用于N/2个输入系数的群组1514,以获得时域中的N个输出样本的中间群组。后变换电路1508可适于执行来自N个输入系数的中间群组的系数的复制、正负号反转及重新排序,以获得多个(N个)时域输出样本1501。
用于HE-AAC及USAC中的SBR滤波器组的快速算法
HE-AAC、HE-AAC v2及USAC使用与本文中先前描述的SBR滤波器组结构类似的SBR滤波器组结构。或许最重要的区别在于其相移由偶数表示(如与AAC-ELD状况中的奇数相反)。举例而言,HE-AAC中的实数分析滤波器组界定如下:
(其使用n移位48,而非ELD-AAC中的95)。
可使用各种不同技术及技艺中的任一者来表示信息与信号。举例而言,可由电压、电流、电磁波、磁场或磁粒子、光场或光粒子或其任何组合来表示贯穿上文的描述而参考的数据、指令、命令、信息、信号及其类似者。
本文中所描述的各种说明性逻辑块、模块及电路及算法步骤可实施或执行为电子硬件、软件或两者的组合。为清楚地说明硬件与软件的此可互换性,上文已大体上在功能性方面描述各种说明性组件、块、模块、电路及步骤。所述功能性是实施为硬件抑或软件视特定应用及强加于整个系统的设计约束而定。应注意,可将配置描述为一过程,所述过程经描绘为流程图、流程框图、结构图或框图。尽管流程图可将操作描述为顺序过程,但操作中的许多者可并行或同时执行。另外,可重新排列所述操作的次序。当一过程的操作完成时,所述过程终止。过程可对应于方法、函数、程序、子例程、子程序等。当一过程对应于函数时,其终止对应于所述函数返回到调用函数或主函数。
当以硬件实施时,各种实例可使用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列信号(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件,或经设计以执行本文中所描述的功能的其任何组合。通用处理器可为微处理器,但在替代例中,所述处理器可为任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器,或任何其它此配置。
当以软件实施时,各种实例可使用固件、中间件或微码。可将用以执行必要任务的程序代码或代码段存储于例如存储媒体或其它存储装置的计算机可读媒体中。处理器可执行必要任务。代码段可表示程序(procedure)、函数、子程序、程序(program)、例程、子例程、模块、软件包、类或指令、数据结构或程序语句的任何组合。可通过传递及/或接收信息、数据、自变量、参数或存储器内容而将一代码段耦合到另一代码段或硬件电路。可经由包括存储器共享、消息传递、令牌传递、网络传输等等的任何合适手段来传递、转发或传输信息、自变量、参数、数据等等。
如此申请案中所使用,术语“组件”、“模块”、“系统”及其类似者意在指代计算机相关实体,其为硬件、固件、硬件与软件的组合、软件或执行中的软件。举例而言,组件可为(但不限于)在处理器上运行的过程、处理器、对象、可执行文件、执行线程、程序及/或计算机。通过说明,在计算装置上运行的应用程序与计算装置两者均可为组件。一个或一个以上组件可驻留于过程及/或执行线程内,且组件可位于一个计算机上及/或 分布于两个或两个以上计算机之间。另外,可从存储有各种数据结构在其上的各种计算机可读媒体执行这些组件。组件可通过本地过程及/或远程过程通信,例如根据具有一个或一个以上数据包的信号(来自一个借助所述信号与在本地系统、分布式系统中的另一组件及/或跨越例如因特网的网络与其它系统交互的组件的数据)。
在本文中的一个或一个以上实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,则可将所述功能作为一个或一个以上指令或代码而存储于计算机可读媒体上或经由计算机可读媒体来传输。计算机可读媒体包括计算机存储媒体与通信媒体两者,通信媒体包括促进计算机程序从一处传送至另一处的任何媒体。存储媒体可为可由计算机存取的任何可用媒体。通过实例且并非限制,这些计算机可读媒体可包含:RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用以载运或存储呈指令或数据结构形式的所要程序代码并可由计算机存取的任何其它媒体。又,将任何连接恰当地称为计算机可读媒体。举例而言,如果使用同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或无线技术(例如红外线、无线电及微波)从网站、服务器或其它远程源传输软件,则同轴电缆、光纤电缆、双绞线、DSL或无线技术(例如红外线、无线电及微波)包括于媒体的定义中。如本文中所使用,磁盘及光盘包括压缩光盘(CD)、激光光盘、光盘、数字通用光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘通过激光以光学方式再现数据。上述各物的组合也应包括在计算机可读媒体的范畴内。软件可包含单一指令或许多指令,且可在若干不同代码段上、在不同程序当中及跨越多个存储媒体分布。可将示范性存储媒体耦合到处理器,使得处理器可从所述存储媒体读取信息及将信息写入到存储媒体。在替代例中,存储媒体可与处理器形成一体。
本文中所揭示的方法包含用于实现所描述方法的一个或一个以上步骤或动作。方法步骤及/或动作可在不背离权利要求书的范畴的情况下彼此互换。换句话说,除非所描述的实施例的恰当操作需要步骤或动作的特定次序,否则在不背离权利要求书的范畴的情况下可修改特定步骤及/或动作的次序及/或使用。
可将各图中所说明的组件、步骤及/或功能中的一者或一者以上重新布置及/或组合为单一组件、步骤或功能或体现于若干组件、步骤或功能中。还可添加额外元件、组件、步骤及/或功能。各图中所说明的设备、装置及/或组件可经配置以或适于执行其它图中所描述的方法、特征或步骤中的一者或一者以上。举例而言,本文中所描述的算法可有效地实施于软件及/或嵌入式硬件中。
应注意,前述配置仅为实例且并不意在解释为限制权利要求书。所述配置的描述意在为说明性的且不限制权利要求书的范畴。因此,本发明的教示可易于应用于其它类型的设备,且许多替代、修改及变化对于所属领域的技术人员而言将为显而易见的。
Claims (48)
1.一种实施滤波器组的方法,其包含:
获得输入音频信号作为多个,即N个,时域输入样本;
执行所述多个,即N个,时域输入样本的成对加法及减法以获得中间样本的第一群组及第二群组,每一群组具有N/2个中间样本;
反转所述第二群组中的奇数索引中间样本的正负号;
将第一变换应用于中间样本的所述第一群组以获得频域中的N/2个输出系数的第一群组;
将第二变换应用于中间样本的所述第二群组以获得所述频域中的N/2个输出系数的中间第二群组;及
逆转N/2个输出系数的所述中间第二群组中的系数的次序以获得N/2个输出系数的第二群组。
2.根据权利要求1所述的方法,其中所述所使用的时域输入样本为实域中的样本,而所述频域为复域。
3.根据权利要求1所述的方法,其中输出系数的所述第一群组由实系数组成,且输出系数的所述第二群组由虚系数组成。
4.根据权利要求1所述的方法,其中所述第一变换及所述第二变换均为离散余弦变换DCT类型IV变换,且所述滤波器组由在分子中具有因子(2n±x)的方程式表示,其中n为样本索引且x为奇数。
5.根据权利要求1所述的方法,其中所述第一变换及所述第二变换同时操作以变换中间样本的所述第一群组及所述第二群组。
6.根据权利要求1所述的方法,其中所述滤波器组为分析正交镜像滤波器组。
7.根据权利要求1所述的方法,其中所述滤波器组为音频编码器的部分。
8.根据权利要求7所述的方法,其中所述音频编码器实施MPEG高级音频编码增强型低延迟AAC-ELD标准、MPEG高效率AAC HE-AAC标准、MPEG空间音频编码SAOC,及MPEG统一语音与音频编码USAC标准中的至少一者。
9.根据权利要求1所述的方法,其中所述滤波器组为频谱带复制SBR编码器的部分。
10.根据权利要求1所述的方法,其中所述滤波器组为音频解码器的部分。
11.根据权利要求10所述的方法,其中所述音频解码器实施MPEG高级音频编码增强型低延迟AAC-ELD标准、MPEG高效率AAC HE-AAC标准、MPEG空间音频编码SAOC,及MPEG统一语音与音频编码USAC标准中的至少一者。
12.根据权利要求1所述的方法,其中所述滤波器组为频谱带复制SBR解码器的部分。
13.一种滤波器组装置,其包含:
接口,其适于获得输入音频信号作为多个,即N个,时域输入样本;
预变换电路,其适于:
执行所述多个,即N个,时域输入样本的成对加法及减法以获得中间样本的第一群组及第二群组,每一群组具有N/2个中间样本;
反转所述第二群组中的奇数索引中间样本的正负号;
第一变换电路,其适于将第一变换应用于中间样本的所述第一群组以获得频域中的N/2个输出系数的第一群组;
第二变换电路,其适于将第二变换应用于中间样本的所述第二群组以获得所述频域中的N/2个输出系数的中间第二群组;及
后变换电路,其适于逆转N/2个输出系数的所述中间第二群组中的系数的次序以获得N/2个输出系数的第二群组。
14.根据权利要求13所述的滤波器组装置,其中所述所使用的时域输入样本为实域中的样本,而所述频域为复域。
15.根据权利要求13所述的滤波器组装置,其中输出系数的所述第一群组由实系数组成,且输出系数的所述第二群组由虚系数组成。
16.根据权利要求13所述的滤波器组装置,其中所述第一变换及所述第二变换均为离散余弦变换DCT类型IV变换,且所述滤波器组由在分子中具有因子(2n±x)的方程式表示,其中n为样本索引且x为奇数。
17.根据权利要求13所述的滤波器组装置,其中所述第一变换及所述第二变换同时操作以变换中间样本的所述第一群组及所述第二群组。
18.根据权利要求13所述的滤波器组装置,其中所述滤波器组装置为分析正交镜像滤波器组。
19.根据权利要求13所述的滤波器组装置,其中所述滤波器组为音频编码器的部分。
20.根据权利要求19所述的滤波器组装置,其中所述音频编码器实施MPEG高级音频编码增强型低延迟AAC-ELD标准、MPEG高效率AAC HE-AAC标准、MPEG空间音频编码SAOC,及MPEG统一语音与音频编码USAC标准中的至少一者。
21.根据权利要求13所述的滤波器组装置,其中所述滤波器组为频谱带复制SBR编码器的部分。
22.根据权利要求13所述的滤波器组装置,其中所述滤波器组为音频解码器的部分。
23.根据权利要求22所述的滤波器组装置,其中所述音频解码器实施MPEG高级音频编码增强型低延迟AAC-ELD标准、MPEG高效率AAC HE-AAC标准、MPEG空间音频编码SAOC,及MPEG统一语音与音频编码USAC标准中的至少一者。
24.根据权利要求13所述的滤波器组装置,其中所述滤波器组为频谱带复制SBR解码器的部分。
25.一种滤波器组装置,其包含:
用于获得输入音频信号作为多个,即N个,时域输入样本的装置;
用于执行所述多个,即N个,时域输入样本的成对加法及减法以获得中间样本的第一群组及第二群组的装置,每一群组具有N/2个中间样本;
用于反转所述第二群组中的奇数索引中间样本的正负号的装置;
用于将第一变换应用于中间样本的所述第一群组以获得频域中的N/2个输出系数的第一群组的装置;
用于将第二变换应用于中间样本的所述第二群组以获得所述频域中的N/2个输出系数的中间第二群组的装置;及
用于逆转N/2个输出系数的所述中间第二群组中的系数的次序以获得N/2个输出系数的第二群组的装置。
26.根据权利要求25所述的滤波器组装置,其中所述滤波器组为音频编码器的部分。
27.根据权利要求26所述的滤波器组装置,其中所述音频编码器实施MPEG高级音频编码增强型低延迟AAC-ELD标准、MPEG高效率AAC HE-AAC标准、MPEG空间音频编码SAOC,及MPEG统一语音与音频编码USAC标准中的至少一者。
28.根据权利要求25所述的滤波器组装置,其中所述滤波器组为频谱带复制SBR编码器的部分。
29.根据权利要求25所述的滤波器组装置,其中所述滤波器组为音频解码器的部分。
30.一种实施滤波器组的方法,其包含:
获得表示频域中的音频信号的多个,即N/2个,复值输入系数,其中N/2个输入系数的第一群组为所述N/2个复值输入系数的实数分量且N/2个输入系数的第二群组为所述N/2个复值输入系数的虚数分量,其中相对于所述第二群组中的偶数索引系数来反转所述第二群组中的奇数索引系数的正负号;
将第一逆变换应用于输入系数的所述第一群组以获得时域中的N/2个输出样本的中间第一群组;
将第二逆变换应用于输入系数的所述第二群组以获得所述时域中的N/2个输出样本的中间第二群组;及
执行从输出样本的所述中间第一群组减去输出样本的所述中间第二群组的成对减法以获得多个,即N个,时域输出样本。
31.根据权利要求30所述的方法,其中所述第一逆变换及所述第二逆变换均为逆离散余弦变换IDCT类型IV变换,且所述滤波器组由在分子中具有因子(2n±x)的方程式表示,其中n为系数索引且x为奇数。
32.根据权利要求30所述的方法,其中所述第一逆变换及所述第二逆变换同时操作以变换输入系数的所述第一群组及所述第二群组。
33.根据权利要求30所述的方法,其中所述滤波器组为合成正交镜像滤波器组。
34.根据权利要求30所述的方法,其中所述滤波器组为音频解码器的部分。
35.根据权利要求34所述的方法,其中所述音频解码器实施MPEG-4高级音频编码AAC-低延迟ELD标准、MPEG-4AAC-增强型低延迟ELD标准,及MPEG-4MPEG-4高效率HE-AAC标准中的至少一者。
36.根据权利要求30所述的方法,其中所述滤波器组为频谱带复制SBR解码器的部分。
37.一种滤波器组装置,其包含:
接口,其适于获得表示频域中的音频信号的多个,即N/2个,复值输入系数,其中N/2个输入系数的第一群组为所述N/2个复值输入系数的实数分量,且N/2个输入系数的第二群组为所述N/2个复值输入系数的虚数分量;
预处理电路,其适于相对于所述第二群组中的偶数索引系数来反转所述第二群组中的奇数索引系数的正负号;
第一变换电路,其适于将第一逆变换应用于输入系数的所述第一群组以获得时域中的N/2个输出样本的中间第一群组;
第二变换电路,其适于将第二逆变换应用于输入系数的所述第二群组以获得所述时域中的N/2个输出样本的中间第二群组;及
后变换电路,其适于执行从输出样本的所述中间第一群组减去输出样本的所述中间第二群组的成对减法以获得多个,即N个,时域输出样本。
38.根据权利要求37所述的滤波器组装置,其中所述第一逆变换及所述第二逆变换均为逆离散余弦变换IDCT类型IV变换,且所述滤波器组由在分子中具有因子(2n±x)的方程式表示,其中n为系数索引且x为奇数。
39.根据权利要求37所述的滤波器组装置,其中所述第一逆变换及所述第二逆变换同时操作以变换输入系数的所述第一群组及所述第二群组。
40.根据权利要求37所述的滤波器组装置,其中所述滤波器组为合成正交镜像滤波器组。
41.根据权利要求37所述的滤波器组装置,其中所述滤波器组为音频解码器的部分。
42.根据权利要求41所述的滤波器组装置,其中所述音频解码器实施MPEG-4高级音频编码AAC-低延迟ELD标准、MPEG-4AAC-增强型低延迟ELD标准,及MPEG-4MPEG-4高效率HE-AAC标准中的至少一者。
43.根据权利要求37所述的滤波器组装置,其中所述滤波器组为频谱带复制SBR解码器的部分。
44.一种滤波器组装置,其包含:
用于获得表示频域中的音频信号的多个,即N/2个,复值输入系数的装置,其中N/2个输入系数的第一群组为所述N/2个复值输入系数的实数分量且N/2个输入系数的第二群组为所述N/2个复值输入系数的虚数分量,其中相对于所述第二群组中的偶数索引系数来反转所述第二群组中的奇数索引系数的正负号;
用于将第一逆变换应用于输入系数的所述第一群组以获得时域中的N/2个输出样本的中间第一群组的装置;
用于将第二逆变换应用于输入系数的所述第二群组以获得所述时域中的N/2个输出样本的中间第二群组的装置;及
用于执行从输出样本的所述中间第一群组减去输出样本的所述中间第二群组的成对减法以获得多个,即N个,时域输出样本的装置。
45.根据权利要求44所述的滤波器组装置,其中所述滤波器组为合成正交镜像滤波器组。
46.根据权利要求44所述的滤波器组装置,其中所述滤波器组为音频解码器的部分。
47.根据权利要求46所述的滤波器组装置,其中所述音频解码器实施MPEG-4高级音频编码AAC-低延迟ELD标准、MPEG-4AAC-增强型低延迟ELD标准,及MPEG-4MPEG-4高效率HE-AAC标准中的至少一者。
48.根据权利要求44所述的滤波器组装置,其中所述滤波器组为频谱带复制SBR解码器的部分。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16913209P | 2009-04-14 | 2009-04-14 | |
US61/169,132 | 2009-04-14 | ||
US12/759,248 | 2010-04-13 | ||
US12/759,248 US8392200B2 (en) | 2009-04-14 | 2010-04-13 | Low complexity spectral band replication (SBR) filterbanks |
PCT/US2010/031089 WO2010120924A1 (en) | 2009-04-14 | 2010-04-14 | Low complexity spectral band replication (sbr) filterbanks |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102388418A CN102388418A (zh) | 2012-03-21 |
CN102388418B true CN102388418B (zh) | 2013-09-25 |
Family
ID=42935075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800162379A Expired - Fee Related CN102388418B (zh) | 2009-04-14 | 2010-04-14 | 低复杂度频谱带复制(sbr)滤波器组 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8392200B2 (zh) |
EP (1) | EP2419901A1 (zh) |
JP (1) | JP5559304B2 (zh) |
KR (1) | KR101286329B1 (zh) |
CN (1) | CN102388418B (zh) |
TW (1) | TW201118861A (zh) |
WO (1) | WO2010120924A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11842743B2 (en) | 2015-03-13 | 2023-12-12 | Dolby International Ab | Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
TWI484473B (zh) * | 2009-10-30 | 2015-05-11 | Dolby Int Ab | 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統 |
AU2011237882B2 (en) | 2010-04-09 | 2014-07-24 | Dolby International Ab | MDCT-based complex prediction stereo coding |
JP5850216B2 (ja) * | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
MY156027A (en) * | 2010-08-12 | 2015-12-31 | Fraunhofer Ges Forschung | Resampling output signals of qmf based audio codecs |
CN102568481B (zh) * | 2010-12-21 | 2014-11-26 | 富士通株式会社 | 用于实现aqmf处理的方法、和用于实现sqmf处理的方法 |
JP6155274B2 (ja) * | 2011-11-11 | 2017-06-28 | ドルビー・インターナショナル・アーベー | 過剰サンプリングされたsbrを使ったアップサンプリング |
EP2951825B1 (en) | 2013-01-29 | 2021-11-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a frequency enhanced signal using temporal smoothing of subbands |
JP6094322B2 (ja) * | 2013-03-28 | 2017-03-15 | 富士通株式会社 | 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 |
CN105849801B (zh) | 2013-12-27 | 2020-02-14 | 索尼公司 | 解码设备和方法以及程序 |
CN104732979A (zh) * | 2015-03-24 | 2015-06-24 | 无锡天脉聚源传媒科技有限公司 | 一种音频数据的处理方法及装置 |
CN104735512A (zh) * | 2015-03-24 | 2015-06-24 | 无锡天脉聚源传媒科技有限公司 | 一种同步音频数据的方法、设备及系统 |
RU2685024C1 (ru) * | 2016-02-17 | 2019-04-16 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Постпроцессор, препроцессор, аудиокодер, аудиодекодер и соответствующие способы для улучшения обработки транзиентов |
GB2561594A (en) * | 2017-04-20 | 2018-10-24 | Nokia Technologies Oy | Spatially extending in the elevation domain by spectral extension |
CN113870884B (zh) * | 2021-12-01 | 2022-03-08 | 全时云商务服务股份有限公司 | 单麦克风噪声抑制方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1914669A (zh) * | 2004-01-28 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 使用复数值数据的音频信号解码 |
CN101053019A (zh) * | 2004-11-02 | 2007-10-10 | 皇家飞利浦电子股份有限公司 | 使用复值滤波器组的音频信号的编码和解码 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0101175D0 (sv) * | 2001-04-02 | 2001-04-02 | Coding Technologies Sweden Ab | Aliasing reduction using complex-exponential-modulated filterbanks |
ES2631906T3 (es) | 2006-10-25 | 2017-09-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la generación de valores de subbanda de audio, aparato y procedimiento para la generación de muestras de audio en el dominio temporal |
US8015368B2 (en) * | 2007-04-20 | 2011-09-06 | Siport, Inc. | Processor extensions for accelerating spectral band replication |
WO2008146263A2 (en) | 2007-05-19 | 2008-12-04 | Roy Rosser | Bistable electrowetting light valve |
US20090099844A1 (en) * | 2007-10-16 | 2009-04-16 | Qualcomm Incorporated | Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders |
-
2010
- 2010-04-13 US US12/759,248 patent/US8392200B2/en active Active
- 2010-04-14 WO PCT/US2010/031089 patent/WO2010120924A1/en active Application Filing
- 2010-04-14 JP JP2012506178A patent/JP5559304B2/ja not_active Expired - Fee Related
- 2010-04-14 KR KR1020117027093A patent/KR101286329B1/ko active IP Right Grant
- 2010-04-14 EP EP10715049A patent/EP2419901A1/en not_active Withdrawn
- 2010-04-14 TW TW099111673A patent/TW201118861A/zh unknown
- 2010-04-14 CN CN2010800162379A patent/CN102388418B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1914669A (zh) * | 2004-01-28 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 使用复数值数据的音频信号解码 |
CN101053019A (zh) * | 2004-11-02 | 2007-10-10 | 皇家飞利浦电子股份有限公司 | 使用复值滤波器组的音频信号的编码和解码 |
Non-Patent Citations (1)
Title |
---|
RAVI KIRAN CHIVUKULA.FAST ALGORITHMS FOR MDCT AND LOW DELAY FILTERBANKS USED IN AUDIO CODING.《URL:http://dspace.uta.edu/handle/10106/921》.2008, * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11842743B2 (en) | 2015-03-13 | 2023-12-12 | Dolby International Ab | Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element |
Also Published As
Publication number | Publication date |
---|---|
JP2012524301A (ja) | 2012-10-11 |
WO2010120924A1 (en) | 2010-10-21 |
TW201118861A (en) | 2011-06-01 |
JP5559304B2 (ja) | 2014-07-23 |
KR101286329B1 (ko) | 2013-07-15 |
US8392200B2 (en) | 2013-03-05 |
US20100262427A1 (en) | 2010-10-14 |
KR20120018324A (ko) | 2012-03-02 |
CN102388418A (zh) | 2012-03-21 |
EP2419901A1 (en) | 2012-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102388418B (zh) | 低复杂度频谱带复制(sbr)滤波器组 | |
US20230179940A1 (en) | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field | |
KR101226094B1 (ko) | 5-포인트 dct-ⅱ, dct-ⅳ, 및 dst-ⅳ 및 아키텍쳐들의 계산을 위한 고속 알고리즘들 | |
CN107424618B (zh) | 用于对hoa音频信号进行解码的方法、设备和计算机可读介质 | |
JP4374233B2 (ja) | 複数因子分解可逆変換(multiplefactorizationreversibletransform)を用いたプログレッシブ・ツー・ロスレス埋込みオーディオ・コーダ(ProgressivetoLosslessEmbeddedAudioCoder:PLEAC) | |
EP3270375B1 (en) | Reconstruction of audio scenes from a downmix | |
RU2645271C2 (ru) | Стереофонический кодер и декодер аудиосигналов | |
US8548815B2 (en) | Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications | |
CN104718572A (zh) | 音频编码方法和装置、音频解码方法和装置及采用该方法和装置的多媒体装置 | |
JP3814611B2 (ja) | 時間離散オーディオサンプル値を処理する方法と装置 | |
CN102842337A (zh) | 基于wifi的高保真音频传输方法 | |
Britanak et al. | Cosine-/Sine-Modulated Filter Banks | |
GB2550459A (en) | Encoding apparatus for processing an input signal and decoding apparatus for processing an encoded signal | |
WO2023241222A1 (zh) | 音频处理方法、装置、设备、存储介质及计算机程序产品 | |
JP5215404B2 (ja) | Mpeg・aac及びmpeg・aac・eld符号器/復号器のための分析及び合成フィルタバンクの有効な実施 | |
CN113314132B (zh) | 交互式音频系统中的音频对象编码方法、解码方法及装置 | |
JP2022505789A (ja) | サブバンド併合および時間領域エイリアシング低減を使用した適応的な非均一時間/周波数タイリングによる知覚音声符号化 | |
Goodwin et al. | Parametric coding and frequency-domain processing in multichannel audio applications | |
RU2464540C2 (ru) | Быстрые алгоритмы для вычисления 5-точечного dct-ii, dct-iv и dst-iv, и архитектуры | |
Huang | Lossless audio coding for MPEG-4 | |
Smyth et al. | Reducing the complexity of sub-band ADPCM coding to enable high-quality audio streaming from mobile devices | |
Gbur et al. | Realtime implementation of an ISO/MPEG layer 3 encoder on Pentium PCs | |
Chan et al. | An Introduction to AVS Lossless Audio Coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130925 Termination date: 20190414 |