CN101540171A - 音频信号编码或解码 - Google Patents

音频信号编码或解码 Download PDF

Info

Publication number
CN101540171A
CN101540171A CN200910128606A CN200910128606A CN101540171A CN 101540171 A CN101540171 A CN 101540171A CN 200910128606 A CN200910128606 A CN 200910128606A CN 200910128606 A CN200910128606 A CN 200910128606A CN 101540171 A CN101540171 A CN 101540171A
Authority
CN
China
Prior art keywords
stereo
parameter
spectral band
subband
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910128606A
Other languages
English (en)
Other versions
CN101540171B (zh
Inventor
L·F·维勒莫斯
P·厄克斯特兰德
H·普恩哈根
E·G·P·舒贾斯
F·M·J·德邦特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Coding Technologies Sweden AB
Original Assignee
Koninklijke Philips Electronics NV
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34530779&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN101540171(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninklijke Philips Electronics NV, Coding Technologies Sweden AB filed Critical Koninklijke Philips Electronics NV
Publication of CN101540171A publication Critical patent/CN101540171A/zh
Application granted granted Critical
Publication of CN101540171B publication Critical patent/CN101540171B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0266Filter banks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Insulated Conductors (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Stereophonic System (AREA)

Abstract

本发明提供一种组合参数化立体声和谱带复制增强的音频编码方法,其包括:将时域立体声输入信号转换成子带域;为子带域中的立体声输入信号计算参数化立体声参数,以便获得参数化立体声比特流;创建子带域中的单声道向下混合;估计子带域中的单声道向下混合的谱带复制参数,以便获得谱带复制比特流;将单声道向下混合从子带域转换到时域中;以及对时域单声道向下混合进行核心编码以便获得核心比特流。本发明还提供一种组合参数化立体声和谱带复制增强的音频编码器。此外,本发明还提供一种用于对编码输入信号进行组合参数化立体声和谱带复制增强的音频解码的方法以及一种组合参数化立体声和谱带复制增强的音频解码器。

Description

音频信号编码或解码
本发明涉及对音频信号进行编码或者对已编码音频信号进行解码。
Erik Schuijers、Werner Oomen、Bert den Brinker和JeroenBreebaart的“Advances in Parameric Coding for High-Quality Audio(用于高质量音频的参数化编码的进展)”(Preprint 5852,114th AESConvention,Amsterdam,The Netherlands,22-25March 2003)公开了一种参数化编码方案,该方案使用了用于立体图像的高效参数化表示。两个输入信号被合并成一个单声道音频信号。感觉上相关的空间方位信息(spatial cue)被明确地模拟,如图1所示。该合并的信号使用单声道参数化编码器来编码。声道间强度差(IID)、声道间时间差(ITD)和声道间互相关(ICC)等立体声参数被量化、编码并和经量化及编码的单声道音频信号一起被复用成一个比特流。在解码器侧,该比特流被解复用为一个已编码单声道信号和各立体声参数。该已编码单声道音频信号被解码,从而获得已解码单声道音频信号m’(参见图2)。使用产生感觉去相关的滤波器D、从该单声道时域信号来计算经过去相关的信号。该单声道时域信号m’和经过去相关的信号d被变换到烦域。然后在一个参数处理单元中,利用IID、ITD和ICC等参数、通过分别进行缩放、相位修改和混合来处理该频域立体声信号,以便获得已解码立体声对l’和r’。最终得到的频域表示被变换回时域。
本发明的一个目的是使用空间参数提供有利的音频编码或解码。为此,本发明提供一种如独立权利要求中所限定的编码方法、音频编码器、用于传送或存储的设备、解码方法、音频解码器、再现设备和计算机程序产品。在从属权利要求中限定各有利实施例。
根据本发明的第一个方面,一个音频信号被编码,该音频信号包括第一音频声道和第二音频声道,该编码包括:在一个复数调制滤波器组中对第一音频声道和第二音频声道当中的每一个进行子带滤波,以便为第一音频声道提供第一多个子带信号并为第二音频声道提供第二多个子带信号;对所述子带信号当中的每一个进行向下采样,以便提供第一多个向下采样的子带信号和第二多个向下采样的子带信号;在另一个滤波器组中对至少一个经向下采样的子带信号进行进一步的子带滤波,以便提供多个次子带(sub-subband)信号;从所述次子带信号以及从那些没有被进一步子带滤波的经向下采样的子带信号中导出空间参数;以及导出一个单声道音频信号,该单声道音频信号包含从第一多个经向下采样的子带信号和第二多个经向下采样的子带信号中所导出的导出子带信号。通过在子带中提供进一步的子带滤波,提高了所述子带的频率分辨率。提高频率分辨率的优点在于,可以以高效的实现方式(因为只有很少的几个频带必须被变换)获得更高的音频质量(在人类听觉系统中,单个子带信号的带宽通常比临界频带的带宽高的多)。该参数化空间编码器试图模拟双耳方位信息(cue),所述双耳方位信息在非统一频率尺度上被感知,该非统一频率尺度类似于等效矩形频带(ERB)尺度。该单声道音频信号可以从第一多个经向下采样的子带信号和第二多个经向下采样的子带信号中直接导出。然而,该单声道音频信号有利地从对应于那些被进一步子带滤波的经向下采样的子带的次子带信号中导出,在这种情况下,每个子带的次子带信号被相加以便形成新的子带信号,并且其中该单声道音频信号从这些新的子带信号以及来自没有被进一步滤波的所述第一和第二多个子带的子带中导出。
根据本发明的另一个主要方面,提供了对已编码音频信号的音频解码,该已编码音频信号包括一个已编码单声道音频信号和一组空间参数,该音频解码包括:解码该已编码单声道音频声道以便获得多个经向下采样的子带信号;在另一个滤波器组中进一步子带滤波所述多个经向下采样的子带信号当中的至少一个,以便提供多个次子带信号;以及从所述空间参数、次子带信号和那些没有被进一步子带滤波的子带的经向下采样的子带信号中导出两个音频声道。通过在子带中提供进一步的子带滤波,提高了所述子带的频率分辨率,从而可以获得更高质量的音频解码。
本发明这些方面的其中一个主要优点在于:参数化空间编解码可以和谱带复制(“SBR”)技术容易地结合。SBR可以从以下文献中获知:Martin Dietz、Lars Liljeryd、Kristofer Kjorling和Oliver Kunz的“Spectral Band Replication,a novel approach in audio coding(谱带复制:音频编解码领域中的新颖方法)”(Preprint 5553,112th AESConvention,Munich,Germany,10-13May 2002)以及Per Ekstrand的“Bandwidth extension of audio signals by spectral band replication(通过谱带复制来扩展音频信号的带宽)”(Proc.1st IEEE BeneluxWorkshop on Model based Processing and Coding of Audio(MPCA-2002),pp.53-58,Leuven,Belgium,November 15,2002)。其他参考文献有:MPEG-4标准ISO/IEC 14496-3:2001/FDAM1,JTC1/SC29/WGll,Coding of Moving Pictures and Audio,BandwidthExtension(其描述利用SBR的音频编解码器)。
SBR基于这样的概念:音频信号中低频和高频之间通常具有大的相关性。因此,SBR处理包括将频谱的较低部分复制到较高部分,然后使用在比特流中编码的很少信息为频谱的较高部分调整频谱包络。这种经SBR增强的解码器的简化框图如图3所示。该比特流被解复用并被解码成核心数据(例如MPEG-2/4高级音频编码(AAC))和SBR数据。使用该核心数据,该信号在全带宽信号的一半采样频率下被解码。该核心解码器的输出借助于一个32频带复数(伪)正交镜像滤波器(QMF)组而被分析。这32个频带然后被扩展到全带宽,即64个频带,其中通过复制部分较低频带而产生高频(HF)内容。根据SBR数据调整为之产生HF内容的频带的包络。最后,借助于一个64频带复数QMF合成组,重建PCM输出信号。
图3所示的SBR解码器是所谓的双速率解码器。这表示核心解码器在一半采样频率下运行,因此只使用了一个32频带分析QMF组。其中核心编码器以全采样频率运行并且分析QMF组包含64个频带的单速率解码器也是可能的。实际上,通过(伪)复数QMF组完成重建。因为复数QMF滤波器组并不是被临界采样的,因此不需要额外的规定来考虑混叠。应注意到,在Ekstrand公开的SBR解码器中,分析QMF组只包含32个频带,而合成QMF组包括64个频带,与整个音频解码器相比,核心解码器运行在一半采样频率下。但是在相应的编码器中,使用一个64频带分析QMF组来覆盖整个频率范围。
虽然本发明尤其有利于立体声音频编解码,但是本发明还有利于对具有大于2个音频声道的信号进行编解码。
本发明的这些和其他方面将通过以下所述的实施例变得显而易见并且得到阐述。
在附图中:
图1显示了在参数化立体声(“PS”)编码器中使用的用于立体声参数提取的单元的框图;
图2显示了在PS解码器中使用的用于立体声信号重建的单元的框图;
图3显示了频带复制(“SBR”)解码器的框图;
图4显示了根据本发明一个实施例的、组合的PS及经SBR增强的编码器的框图;
图5显示了根据本发明一个实施例的、组合的PS及经SBR增强的解码器的框图;
图6显示了一个M频带经向下采样的复数QMF分析(左)和合成组(右);
图7显示了原型滤波器的以dB为单位的幅度响应;
图8显示了64个未经向下采样的复数已调制分析滤波器中的前4个的以dB为单位的幅度响应;
图9显示了具有平凡(trivial)合成的Q频带滤波器组的框图;
图10显示了第一个未经向下采样的已调制QMF滤波器和8频带复数已调制滤波器组的以dB为单位的组合幅度响应;
图11显示了根据本发明一个实施例的4频带偶数堆叠滤波器组(上)和奇数堆叠滤波器组(下)的固定格式的幅度响应;
图12显示了根据本发明一个实施例的基于64频带复数分析QMF的77频带非统一混合分析滤波器组;
图13显示了在音频解码器中使用的基于64频带复数分析QMF的71频带非统一混合分析滤波器组;以及
图14显示了复数已调制分析滤波器组的高效实现方式的框图。
附图仅仅显示了那些对于理解本发明而言是必要的元件。
将SBR和PS相结合潜在地产生了非常强大的编解码器。SBR和PS都是在结构非常相似(即某种形式的时频转换、处理以及最后进行频时转换)的解码器中的后处理算法。当将这两种算法相结合时,要求这两个算法能同时在例如DSP应用上运行。因此,有利的是尽可能多的为另一个编解码器重复使用一个编解码器所计算的中间结果。在将PS和SBR相结合的情况下,这导致了为PS处理重复使用复数(伪)QMF子带信号。在一个组合编码器中(参见图4)中,借助于两个64频带分析滤波器组来分析立体声输入信号。使用该复数子带域表示,PS计算单元估计立体声参数并创建一个单声道(子带)向下混合。然后该单声道向下混合被馈送到SBR参数估计单元。最后,该单声道向下混合被一个32频带合成滤波器组转换回时域,以使其能够被核心解码器解码(核心解码器仅仅需要一半带宽)。
在图5所示的组合解码器中,不管使用的是双速率还是单速率系统,在包络调整之后的全带宽(64个频带)子带域信号根据所述立体声参数被转换成一个立体声子带域信号组。这两组子带信号最后被所述64频带合成QMF组转换到时域。如果仅仅将PS和SBR相结合,那么QMF滤波器的较低频带的带宽大于高质量立体声表示所需的带宽。因此,为了能够给出立体声图像的高质量表示,根据本发明的有利实施例,将执行对所述较低子带信号的进一步细分。
为了更好的理解本发明,首先解释复数QMF子带滤波器的理论。
QMF子带滤波器
以下将描述QMF分析子带滤波器。在给出一个实数值线性相位原型滤波器p(v)的情况下,一个M频带复数已调制分析滤波器组可以由以下分析滤波器定义:
h k ( v ) = p ( v ) exp { l π M ( k + 1 / 2 ) ( v - θ ) } - - - ( 1 )
其中k=0,1,...,M-1。相位参数θ对于接下来的分析并不重要,但是通常的选择是(N+M)/2,其中N是原型滤波器的阶数。在给出一个实数值离散时间信号x(v)的情况下,通过用hk(v)对x(v)进行滤波(卷积)而获得子带信号vk(n),然后使用因子M对其结果进行向下采样(参见图6的左侧)。
合成操作包括:首先使用因子M对QMF子带信号进行向上采样,然后使用类型(1)的复数已调制滤波器进行滤波,将结果相加,以及最后获取两倍的实数部分(参见图6的右侧)。然后通过适当设计实数值线性相位原型滤波器p(v)来获得对实数值信号的近乎完美的重建。在64个频带的情况下,在(上述)MPEG-4标准的SBR系统中使用的原型滤波器的幅度响应如图7所示。通过将原型滤波器p(v)的幅度响应偏移
Figure A20091012860600091
而获得64个复数已调制分析滤波器的幅度响应。这些响应的一部分显示在图8中。应注意到,只有正频率被滤波,除了k=0以及k=M-1之外。因此,在向下采样之前,子带信号是接近解析的,从而有利于对实数值正弦进行容易的振幅和相位修改。相位修改也可以用于第一和最后一个频带,只要驻留在这些频带中的正弦具有大于π/2M或者小于π-π/2M的频率。对于在该区域之外的频率,由于负频率的干扰,相位修改的性能急剧恶化。
从上述的QMF分析滤波器开始,在本发明的各实施例中,通过进一步将经过向下采样的子带信号vk(n)滤波成Qk次子带而获得更精细的频率分辨率。以下将导出该进一步子带滤波的特性。
在复数QMF子带域中的信号修改
以下,让 Z ( ω ) = Σ n = - ∞ ∞ z ( n ) exp ( - inω ) 成为对离散时间信号z(n)的离散时间傅立叶变换。假设上述近乎完美的重建特性以及这样一个设计,其中p(v)的傅立叶变换P(ω)基本上在频率区间[-π/M,π/M]之外消失,这就是上述原型滤波器p(v)的情况,下一步就是考虑一个系统,其中子带信号vk(n)在合成之前被修改。现在,通过使用滤波器Bk(ω)进行滤波来修改每个子带k。使用以下的扩展定义:
Bk(ω)=B-1-k(-ω)* for k<0(2)
其中*表示复共轭,然后可以示出(忽略总体延迟,假设实数值输入和单速率系统)所得到的系统包括对应于使用以下滤波器进行滤波的滤波器组合成:
B ( ω ) = Σ k = - M M - 1 B k ( Mω ) | P ( ω - π ( k + 1 / 2 ) / M ) | 2 - - - ( 3 )
根据有关P(ω)的特性的假设,对于(3)式中所有的k插入Bk(ω)=1导致B(ω)=1,从而对于经偏移的原型滤波器响应得到一个平方和恒等式。通过选择实数值常数Bk(ω)=bk≥0,该系统起到均衡器的作用,其在频率π(k+1/2)/M处内插增益值bk。具有吸引力的特征就是整个系统是时不变的,即不会有混叠,尽管其中使用了向下和向上采样。当然,这只有在与所述原型滤波器假设的偏差量之内才成立。
为了导出单声道音频信号,对复数子带信号的附加子滤波不应该仅仅保持这些特性,还应该将这些特性扩展到对已滤波子带信号的操作。保持这些特性的子滤波能够利用对被称为第M频带滤波器的修改来执行,所述滤波器参见P.P.Vaidyanathan的“Multirate systems andfilter banks(多速率系统及滤波器组)”(Prentice Hall SignalProcessing Series,1993,sections 4.6.1-4.6.2)。
具有平凡合成的已调制滤波器组
离散时间信号v(n)可以被一组具有脉冲响应gq(n),q=0,1,...,Q-1的滤波器分解为Q个不同的信号,如图9所示。令相应的分析输出为yq(n),并考虑该平凡合成操作:
y ( n ) = Σ q = 0 Q - 1 y q ( n ) - - - ( 4 )
然后通过选择滤波器来获得完美重建y(n)=v(n),其中使得:
Σ q = 0 Q - 1 g q ( n ) = δ ( n ) - - - ( 5 )
其中如果n=0则δ(n)=1,如果n≠0则δ(n)=0。对于因果滤波器,式(5)的右侧将必须被δ(n-d)代替,其中d是正延迟,但是为了清楚起见省略了该直接的修改。
滤波器gq(n)可以通过下式被选择成对原型滤波器g(n)的复数调制:
g q ( n ) = g ( n ) exp { l 2 π Q ( q + 1 / 2 ) n } - - - ( 6 )
在本发明的该优选实施例中,滤波器被奇数堆叠(因子q+1/2)。该优选实施例的优点将在后面解释。当且仅当满足下式时获得完美重建(5):
g(Qn)=δ(n)/Q     (7)
该式的一个变型是实数值余弦调制:
g q ( n ) = g ( n ) cos { π Q ( q + 1 / 2 ) n } - - - ( 8 )
其中实数值原型滤波器g(m)满足:
g(2Qn)=δ(n)/Q    (9)
(这在考虑了(6)式中的gq(n)+gQ-1-q(n)时能简单的实现。)
对复指数已调制滤波器组进行子滤波
从上述的QMF分析滤波器开始,通过使用上面(6)或(8)式的已调制结构当中的一个将每个经向下采样的子带信号vk(n)进一步滤波成Qk个次子带而获得更精细的频率分辨率。将所得到的输出信号表示为yq k(n),并用gq k(n)描述在子带k中采用的滤波器组。如果Qk=1,那么就没有滤波并且 g q k ( n ) = δ ( n ) . 一个典型的应用实例是:M=64,Q0=8,Qk=4(其中k=1,2),以及Qk=1(其中k>2)。
从x(v)到yq k(n)的两个滤波器组的组合效果可以被描述为利用滤波器Fq k(ω)的滤波,其后是利用因子M的向下采样,其中:
F q k ( ω ) = H k ( ω ) G q k ( Mω ) - - - ( 10 )
如果原型滤波器响应P(ω)在区间[-π/M,π/M]之外基本上是0的话(SBR分析滤波器就是这样的情况(参见图7)),那么滤波器Fq k(ω)具有单个标称中心频率,该标称中心频率在复数已调制的情况下由下式定义:
ω k , q = 2 π ( q + Q k s + 1 2 ) / ( MQ k ) - - - ( 11 )
其中s是整数,其被选择成使得 Q k ( k - 1 2 ) ≤ 2 ( q + Q k s ) + 1 ≤ Q k ( k + 1 2 ) . 例如,如图10所示,如果k=0并且Q0=8,那么ω0,0,ω0,1,...,ω0,7的值是
π 8 M ( 1,3,5,7,9,11 , - 3 , - 1 )
具有非统一频率分辨率的信号修改
如上所述的次子带滤波器组的插入不引入进一步的向下采样,这样就保持了如上所示的仅在复数QMF情况下的信号修改的无混叠性能。考虑到下面的通常的组合操作:M子带分析,在子带k中使用Qk个次子带进行进一步的子带滤波,由滤波器Ak,q(ω)对每个次子带信号yq k(n)进行滤波,在每个子带k中通过加法进行合成,以及最后通过M频带合成组进行合成。该系统的总体转移函数由等式(3)给出,其中k≥0,
B k ( ω ) = Σ q = 0 Q k - 1 A k , q ( ω ) G q k ( ω ) - - - ( 12 )
从而对于ω>π/(2M)给出:
B ( ω ) = Σ k = 0 M - 1 Σ q = 0 Q k - 1 A k , q ( Mω ) G q k ( Mω ) | p ( ω - π ( k + 1 / 2 ) / M ) | 2 - - - ( 13 )
这样,次子带(k,q)的吞吐量响应是
Figure A20091012860600118
对于|ω|≤π/(2M),由于等式(2)所以必须多加注意。在该频率范围中,下式成立:
B(ω)=B0(Mω)|P(ω-π/(2M))|2+B0(-Mω)*|P(ω+π/(2M))|2  (14)
并且假设实数次子带原型滤波器系数,则下式成立:
G q 0 ( - ω ) * = G Q 0 - 1 - q 0 ( ω ) - - - ( 15 )
因此如果如下选择修改滤波器,
A 0 , q ( - ω ) * = A 0 , Q 0 - 1 - q ( ω ) - - - ( 16 )
则有B0(-Mω)*=B0(Mω),并且结合式(3)所提及的平方和恒等式导致下式:
B ( ω ) = B 0 ( Mω ) = Σ q = 0 Q k - 1 A 0 , q ( Mω ) G q 0 ( Mω ) - - - ( 17 )
其中对于|ω|≤π/(2M),其对应于次子带(0,q)的吞吐量响应Gq 0(Mω)。
等式(15)到(17)表明希望区分正频率和负频率。这就是为什么奇数堆叠的(复数)滤波器被用于对QMF次子带信号进行子滤波,而不是使用偶数堆叠的(复数)滤波器(参见图11)。对于偶数堆叠的滤波器,不可能应用驻留在中心滤波器(即中心频率为0的滤波器)中的正弦的相位修改,因为正、负频率不可能被区分。假设原型滤波器具有限制到[-2π/Q,2π/Q]的响应G(ω)频带,其中Q是频带数量,对于偶数堆叠的情况,可近似应用相位修改的下限是2π/Q,而对于奇数堆叠的情况,可近似应用相位修改的下限是π/Q。
如导言中所述,对于PS合成,上述重要的特殊情况是均衡化和相位修改。对于均衡化,Ak,q(ω)=ak,q≥0以及条件(16)简化为:
a 0 , q = a 0 , Q 0 - 1 - q - - - ( 18 )
相位修改情况对应于Ak,q(ω)=exp(iαk,q),在该情况下,如果下式成立就满足条件(16):
α 0 , Q 0 - 1 - q = - α 0 , q - - - ( 19 )
立体声参数估计
如上所述,非统一复数滤波器组(即QMF组,接下来是进一步子带滤波)可以用来估计下述立体声参数:声道间强度差(IID),声道间相位差(IPD)和声道间互相关(ICC)。应注意到,在该实际实施例中,IPD被用作ITD的实际等效替代,在Schuijers等的论文中使用的是ITD。在组合的PS编码器中(参见图4)中,前3个复数QMF声道被子滤波,这样获得总共77个复数值信号(参见图12)。
从此,根据yq k(n)的索引,77个复数值的时间对准的左、右次子带信号被分别表示为lq k(n)和rq k(n)。
为了估计在某一子带样本位置n′处的立体声参数,所述左、右和非归一化跨声道激励被计算如下:
e l ( b ) = Σ q = q l q h Σ k = k l k h Σ n = 0 L - 1 h 2 ( n ) ( | l q k ( n ′ - L 2 + 1 + n ) | 2 + ϵ )
e r ( b ) = Σ q = q l q h Σ k = k l k h Σ n = 0 L - 1 h 2 ( n ) ( | r q k ( n ′ - L 2 + 1 + n ) | 2 + ϵ ) - - - ( 20 )
e R ( b ) = Σ q = q l q h Σ k = k l k h Σ n = 0 L - 1 h 2 ( n ) ( l q k ( n ′ - L 2 + 1 + n ) r q k * ( n ′ - L 2 + 1 + n ) + ϵ )
对于每个立体声元(stereo bin)b,h(n)是长度为L的子带域窗口,ε是防止被0除的非常小的值(例如ε=1e-10),lq k(n)和rq k(n)是左、右次子带域信号。在20个立体声元的情况下,从kl到kh(包括kh)以及从ql到qh(包括qh)的加法被显示在下表中。应注意到,“负”频率(例如k=0,其中q=4...7)没有包括在(20)的参数估计中。
表1:在k和q上的加法的开始和结束索引
  b   kl   kh   ql   qh   通带频率区域
  0   0   0   0   0   0-π/256
  1   0   0   1   1   π/256-2π/256
  2   0   0   2   2   2π/256-3π/256
  3   0   0   3   3   3π/256-π/64
  4   1   1   2   2   π/64-3π/128
  5   1   1   3   3   3π/128-2π/64
  6   2   2   0   0   2π/64-5π/128
  7   2   2   1   1   5π/128-3π/64
  8   3   3   0   0   3π/64-4π/64
  9   4   4   0   0   4π/64-5π/64
  10   5   5   0   0   5π/64-6π/64
  11   6   6   0   0   6π/64-7π/64
  12   7   7   0   0   7π/64-8π/64
  13   8   8   0   0   8π/64-9π/64
  14   9   10   0   0   9π/64-11π/64
  15   11   13   0   0   11π/64-14π/64
  16   14   17   0   0   14π/64-18π/64
  17   18   22   0   0   18π/64-23π/64
  18   23   34   0   0   23π/64-35π/64
  19   35   63   0   0   35π/64-π
计算el(b)、er(b)和eR(b)的加法被对准,这样,这些信号在加法中的中点与参数位置一致,因此偏移
Figure A20091012860600141
从表1中清楚看出,只有具有正中心频率的次子带信号和子带信号被用来估计立体声参数。
对于每个立体元b,IID(记为I(b))、IIC(记为C(b))和IPD(记为P(b))被如下计算:
I ( b ) = 10 log 10 ( e l ( b ) e r ( b ) )
C ( b ) = | e R ( b ) | e l ( b ) e r ( b ) - - - ( 21 )
P(b)=∠eR(b)
在等式P(b)=∠eR(b)中的角度是使用给出在-π和π之间的值的4象限arctangent(反正切)函数来计算的。根据目标比特率和应用,这些参数或者这些参数的一个子集被量化,并被编码到比特流的PS部分中。
立体声信号合成
为了将解码器中的计算成本(在RAM使用方面)保持得尽可能低,使用了一个类似的分析结构。然而,第一频带仅仅是部分复数的(参见图13)。这是通过将各中间频带对G2 0(ω)和G5 0(ω)以及G3 0(ω)和G4 0(ω)进行相加而获得的。此外,第二和第三频带是两频带实数值滤波器组,这是通过对G0 k(ω)和G3 k(ω)的输出进行相加以及对G1 k(ω)和G2 k(ω)的输出进行相加而获得的(也参见有关已调制滤波器组的章节的讨论)。使用解码器滤波器组结构的这一简化,通过对第一子带滤波器进行细分保持了正、负频率之间的可区分特征。该解码器分析滤波器组被显示在图13中。应注意到,第一QMF已滤波(次)子带信号的索引根据频率被存储。
单个帧的立体声(次)子带信号被如下构造:
lk(n)=Λ11sk(n)+Λ21dk(n)
                                (22)
rk(n)=Λ12sk(n)+Λ22dk(n)
l k ( n ) = l k ( n ) e j P rt
                                  (23)
r k ( n ) = r k ( n ) e - j P rt
其中sk(n)是单声道(次)子带信号,dk(n)是从单声道(次)子带信号sk(n)导出的用来合成ICC参数的单声道去相关(次)子带信号,k是子带索引,k=0,...,K-1(K是子带的总数,即K=71),QMF子带样本索引是n=0,...,N-1,N是一个帧的子带样本的数量,Λ11,Λ12,Λ21,Λ22是操作矩阵的尺度因子,并且Prt是相位旋转操作矩阵。该操作矩阵被定义为时间和频率的函数,并且可以从操作矢量中直接导出,这在MPEG-4标准ISO/IEC 14496-3:2001/FPDAM2,JTC1/SC29/WG11,Coding ofMoving Pictures and Audio,Extension 2中被描述。
根据图12,sk(n)被定义为图13的结果:
s 0 ( n ) = y 6 0 ( n )
s 1 ( n ) = y 7 0 ( n )
s 2 ( n ) = y 0 0 ( n )
s 3 ( n ) = y 1 0 ( n )
s 4 ( n ) = y 2 0 ( n ) + y 5 0 ( n )
s 5 ( n ) = y 3 0 ( n ) + y 4 0 ( n ) - - - ( 24 )
s 6 ( n ) = y 0 1 ( n ) + y 3 1 ( n )
s 7 ( n ) = y 1 1 ( n ) + y 2 1 ( n )
s 8 ( n ) = y 0 2 ( n ) + y 3 2 ( n )
s 9 ( n ) = y 1 2 ( n ) + y 2 2 ( n )
s k ( n ) = y 0 k - 7 ( n ) k=10...70
立体声参数的合成根据表1的索引进行。
表1:参数索引表
  k   i(k)   通带频率区域
  0   1*   -2π/256--π/256
  1   0*   -π/256-0
  2   0   0-π/256
  3   1   π/256-2π/256
  4   2   2π/256-3π/256
  5   3   3π/256-π/64
  6   5   3π/128-2π/64
  7   4   2π/128-3π/128
  8   6   4π/128-5π/128
  9   7   5π/128-6π/128
  10   8   3π/64-4π/64
  11   9   4π/64-5π/64
  12   10   5π/64-6π/64
  13   11   6π/64-7π/64
  14   12   7π/64-8π/64
  15   13   8π/64-9π/64
  16-17   14   9π/64-11π/64
  18-20   15   11π/64-14π/64
  21-24   16   14π/64-18π/64
  25-29   17   18π/64-23π/64
  30-41   18   23π/64-35π/64
  42-70   19   35π/64-π
该合成等式因此可以变成:
lk(n)=Λ11(i(k),n)sk(n)+Λ21(i(k),n)dk(n)
                                               (25)
rk(n)=Λ12(i(k),n)sk(n)+Λ22(i(k),n)dk(n)
l k ( n ) = l k ( n ) e j P rt ( l ( k ) , n )
                            (26)
r k ( n ) = r k ( n ) e - j P rt ( l ( k ) , n )
应注意到,在表格中如果遇到了a*,那么在上面等式中Prt的符号就改变。因此这就是等式(19),即对于负频率必须应用反向相位旋转。
具有平凡合成的已调制滤波器的高效实现方式
在给定具有长度为L的原型滤波器的已调制滤波器组的情况下,一种直接形式的实现方式对于每个输入样本将要求QL操作,但等式(6)中的调制是对于周期Q反周期的(antiperiodic)这一事实可以用来将所述滤波分解成长度为L的多相加窗操作,其后是对于每个输入样本的大小为Q的变换。应当注意,上述多相表示可从以下文献中获知:P.P.Vaidyanathan的“Multirate systems and filter banks多速率系统及滤波器组”(Prentice Hall Signal Processing Series,1993,section4.3)。以下根据本发明的一个优选实施例提供该多相表示的有利应用。
所述变换是DFT,之后是相位旋转(twiddle),当Q是2的幂时,其具有Qlog2Q的阶数。因此,在其中L远远大于log2Q的通常情况下能获得大量的节省。在实数已调制的情况下(8),与围绕n=0和n=Q的偶数/奇数对称性相结合的对于2Q的周期的反周期性可以被再次用于多相加窗,并且该变换内核是类型III的DCT。以下将给出该复数调制情况的详细说明。
使用FFT核心处理的次子滤波(sub-subfiltering)的有效实现方式可以利用其后跟随着调制的原型滤波器的多相分解来实现。假设原型滤波器g(n)的阶数为N,其中N=mQ,m是正整数。该条件并不是限制性的,因为任意阶数的原型滤波器可以被零填充(zero padded),以便满足该约束条件。被设计用于复数已调制系统(6)的原型滤波器的Z变换如下:
G ( z ) = Σ n = - N / 2 N / 2 g ( n ) z - n - - - ( 27 )
这可以表示为多相符号:
G ( z ) = Σ l = 0 Q - 1 E l ( z Q ) z - 1 - - - ( 28 )
其中
E l ( z ) = Σ n = - N / ( 2 Q ) N / ( 2 Q ) g ( Qn + l ) z - n - - - ( 29 )
该滤波器组的所有滤波器都是原型滤波器的频率已调制版本。滤波器gq(n)的Z变换如下:
G q ( z ) = G ( z W q + 1 2 ) - - - ( 30 )
其中
W = e - j 2 π Q - - - ( 31 )
从一个滤波器的输出表示为:
Y q ( z ) = G q ( z ) V ( z ) = G ( z W q + 1 2 ) V ( z ) =
= Σ l = 0 Q - 1 E l ( - z Q ) V ( z ) z - 1 W 1 2 W - ql = - - - ( 32 )
= Σ l = 0 Q - 1 E l ( - z Q ) V ( z ) z - 1 e j π Q l e l 2 π Q ql
通过识别最后的合的各分量,可以看出各多相分量处理输入信号的延迟版本,其随后被乘以一个复指数。最后,通过应用逆FFT(不需要缩放因子)来找到所有的输出信号Yq(z),q=1...Q-1。图14显示了分析滤波器组的布局。因为(29)中的多相滤波器是非因果的,因此一个适量的延迟必须被添加到所有的多相分量中。
应当注意,上述实施例说明而不是限制本发明,在不背离所附权利要求书的范围的情况下,本领域的技术人员将能够设计许多替换实施例。在权利要求书中,括号里面的任何附图标记并不限制该权利要求。“包括”一词并不排除在权利要求中列出的元件或步骤之外的其它元件或步骤的存在。本发明可以通过包括若干不同元件的硬件和适当编程的计算机来实现。在列举几个装置的设备权利要求中,这些装置当中的几个可以被同一硬件项实现。在彼此不同的从属权利要求中引述某些措施这一事实,并不表示不能使用这些措施的组合来获益。

Claims (7)

1.组合参数化立体声和谱带复制增强的音频编码器,包括:
分析滤波器组,用于将时域立体声输入信号转换成子带域;
参数化立体声计算单元,其用于为子带域中的立体声输入信号计算参数化立体声参数以便获得参数化立体声比特流,以及用于创建子带域中的单声道向下混合;
谱带复制参数估计单元,用于估计子带域中的单声道向下混合的谱带复制参数,以便获得谱带复制比特流;
频时转换器,用于将单声道向下混合从子带域转换到时域中;以及
核心编码器,用于对时域单声道向下混合进行编码以便获得核心比特流。
2.组合参数化立体声和谱带复制增强的音频编码方法,包括:
将时域立体声输入信号转换成子带域;
为子带域中的立体声输入信号计算参数化立体声参数,以便获得参数化立体声比特流;
创建子带域中的单声道向下混合;
估计子带域中的单声道向下混合的谱带复制参数,以便获得谱带复制比特流;
将单声道向下混合从子带域转换到时域中;以及
对时域单声道向下混合进行核心编码以便获得核心比特流。
3.组合参数化立体声和谱带复制增强编码的音频信号,包括:
参数化立体声比特流,其包括从立体声信号导出的参数化立体声参数;
谱带复制比特流,其包括从立体声信号导出的单声道向下混合的谱带复制参数;以及
表示核心编码的单声道向下混合的核心比特流。
4.组合参数化立体声和谱带复制增强的音频解码器,其用于对包括核心编码的音频信号、频带复制参数和参数化立体声参数的编码输入信号进行解码,该解码器包括:
核心解码器,用于对编码的音频信号进行解码以便获得解码的音频信号;
分析滤波器组,用于将解码的音频信号时域转换成子带域;
高频产生器和包络调整器,用于使用子带域中的谱带复制参数来产生全带宽音频信号;
参数化立体声合成单元,用于使用参数化立体声参数将全带宽音频信号转换成子带域中的立体声音频信号;以及
合成滤波器组,用于将全带宽音频信号从子带域转换到时域。
5.用于对编码输入信号进行组合参数化立体声和谱带复制增强的音频解码的方法,该编码输入信号包括核心编码的音频信号、频带复制参数和参数化立体声参数,该方法包括:
对编码的音频信号进行核心解码以便获得解码的音频信号;
将解码的音频信号时域转换成子带域;
使用子带域中的谱带复制参数来产生全带宽音频信号;
使用参数化立体声参数将全带宽音频信号转换成子带域中的立体声音频信号;以及
将全带宽音频信号从子带域转换到时域。
6.一种计算机程序产品,包括用于指示计算机执行组合参数化立体声和谱带复制增强的音频编码方法的代码,该方法包括:将时域立体声输入信号转换成子带域;为子带域中的立体声输入信号计算参数化立体声参数以便获得参数化立体声比特流;创建子带域中的单声道向下混合;估计子带域中的单声道向下混合的谱带复制参数以便获得谱带复制比特流;将单声道向下混合从子带域转换到时域中;以及对时域单声道向下混合进行核心编码以便获得核心比特流。
7.一种计算机程序产品,包括用于指示计算机执行对编码输入信号进行组合参数化立体声和谱带复制增强的音频解码的方法,该编码输入信号包括核心编码的音频信号、频带复制参数和参数化立体声参数,该方法包括:对编码的音频信号进行核心解码以便获得解码的音频信号;将解码的音频信号时域转换成子带域;使用子带域中的谱带复制参数来产生全带宽音频信号;使用参数化立体声参数将全带宽音频信号转换成子带域中的立体声音频信号;以及将全带宽音频信号从子带域转换到时域。
CN2009101286062A 2003-10-30 2004-10-28 音频信号编码或解码 Active CN101540171B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03104034.8 2003-10-30
EP03104034 2003-10-30

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2004800323426A Division CN1875402B (zh) 2003-10-30 2004-10-28 音频信号编码或解码

Publications (2)

Publication Number Publication Date
CN101540171A true CN101540171A (zh) 2009-09-23
CN101540171B CN101540171B (zh) 2013-11-06

Family

ID=34530779

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2009101286062A Active CN101540171B (zh) 2003-10-30 2004-10-28 音频信号编码或解码
CN2004800323426A Active CN1875402B (zh) 2003-10-30 2004-10-28 音频信号编码或解码

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN2004800323426A Active CN1875402B (zh) 2003-10-30 2004-10-28 音频信号编码或解码

Country Status (12)

Country Link
US (3) US7519538B2 (zh)
EP (1) EP1683133B1 (zh)
JP (4) JP4966013B2 (zh)
KR (2) KR101217649B1 (zh)
CN (2) CN101540171B (zh)
AT (1) ATE354160T1 (zh)
BR (2) BR122018007834B1 (zh)
DE (1) DE602004004818T2 (zh)
ES (1) ES2282899T3 (zh)
PL (1) PL1683133T3 (zh)
RU (1) RU2374703C2 (zh)
WO (1) WO2005043511A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103854651A (zh) * 2009-12-16 2014-06-11 杜比国际公司 Sbr比特流参数缩混
CN107046668A (zh) * 2016-02-08 2017-08-15 奥迪康有限公司 单耳语音可懂度预测单元、助听器及双耳听力系统
CN109243475A (zh) * 2015-03-13 2019-01-18 杜比国际公司 解码在填充元素中具有增强频谱带复制元数据的音频位流
CN110010140A (zh) * 2013-04-05 2019-07-12 杜比国际公司 立体声音频编码器和解码器
CN111970630A (zh) * 2015-08-25 2020-11-20 杜比实验室特许公司 音频解码器和解码方法

Families Citing this family (103)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
ATE430360T1 (de) 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
PL1810281T3 (pl) * 2004-11-02 2020-07-27 Koninklijke Philips N.V. Kodowanie i dekodowanie sygnałów audio z wykorzystaniem banków filtrów o wartościach zespolonych
RU2007120056A (ru) * 2004-11-30 2008-12-10 Мацусита Электрик Индастриал Ко. Устройство стереокодирования, устройство стереодекодирования и способы стереокодирования и стереодекодирования
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
JP4988716B2 (ja) * 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8917874B2 (en) 2005-05-26 2014-12-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
WO2006126859A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
EP1946294A2 (en) * 2005-06-30 2008-07-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
AU2006266579B2 (en) * 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
JP2009500657A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
KR101356586B1 (ko) 2005-07-19 2014-02-11 코닌클리케 필립스 엔.브이. 다중 채널 오디오 신호를 생성하기 위한 디코더, 수신기 및 방법
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7987097B2 (en) * 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
AU2006285538B2 (en) * 2005-08-30 2011-03-24 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
KR100857115B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
EP1946302A4 (en) * 2005-10-05 2009-08-19 Lg Electronics Inc SIGNAL PROCESSING METHOD AND APPARATUS, ENCODING AND DECODING METHOD, AND ASSOCIATED APPARATUS
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7716043B2 (en) * 2005-10-24 2010-05-11 Lg Electronics Inc. Removing time delays in signal paths
JP4806031B2 (ja) 2006-01-19 2011-11-02 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
JP5147727B2 (ja) 2006-01-19 2013-02-20 エルジー エレクトロニクス インコーポレイティド 信号デコーディング方法及び装置
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
KR100983286B1 (ko) 2006-02-07 2010-09-24 엘지전자 주식회사 부호화/복호화 장치 및 방법
KR100754220B1 (ko) * 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
US7676374B2 (en) 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
ES2609449T3 (es) 2006-03-29 2017-04-20 Koninklijke Philips N.V. Decodificación de audio
US7612275B2 (en) * 2006-04-18 2009-11-03 Nokia Corporation Method, apparatus and computer program product for providing rhythm information from an audio signal
US7818079B2 (en) * 2006-06-09 2010-10-19 Nokia Corporation Equalization based on digital signal processing in downsampled domains
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US20080004866A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Artificial Bandwidth Expansion Method For A Multichannel Signal
EP3236587B1 (en) 2006-07-04 2018-11-21 Dolby International AB Filter system comprising a filter converter and a filter compressor and method for operating the filter system
US7876904B2 (en) * 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
JP2008076847A (ja) * 2006-09-22 2008-04-03 Matsushita Electric Ind Co Ltd 復号器及び信号処理システム
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
AU2007331763B2 (en) 2006-12-12 2011-06-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
US7783478B2 (en) * 2007-01-03 2010-08-24 Alexander Goldin Two stage frequency subband decomposition
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
JP5147851B2 (ja) * 2007-10-26 2013-02-20 株式会社ディーアンドエムホールディングス オーディオ信号補間装置及びオーディオ信号補間方法
EP2215629A1 (en) * 2007-11-27 2010-08-11 Nokia Corporation Multichannel audio coding
WO2009078681A1 (en) 2007-12-18 2009-06-25 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
EP2250641B1 (en) * 2008-03-04 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for mixing a plurality of input data streams
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及系统
AU2016262695B2 (en) * 2009-02-18 2017-11-09 Dolby International Ab Low Delay Modulated Filter Bank
TWI621332B (zh) * 2009-02-18 2018-04-11 杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
AU2012204076B2 (en) * 2009-04-03 2013-12-12 Ntt Docomo, Inc. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
JP5365363B2 (ja) * 2009-06-23 2013-12-11 ソニー株式会社 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム
US9055374B2 (en) * 2009-06-24 2015-06-09 Arizona Board Of Regents For And On Behalf Of Arizona State University Method and system for determining an auditory pattern of an audio segment
JP5345737B2 (ja) 2009-10-21 2013-11-20 ドルビー インターナショナル アーベー 結合されたトランスポーザーフィルターバンクにおけるオーバーサンプリング
UA102347C2 (ru) 2010-01-19 2013-06-25 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
ES2935911T3 (es) 2010-04-09 2023-03-13 Dolby Int Ab Descodificación estéreo de predicción compleja basada en MDCT
JP5554876B2 (ja) 2010-04-16 2014-07-23 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. ガイドされた帯域幅拡張およびブラインド帯域幅拡張を用いて広帯域信号を生成するため装置、方法およびコンピュータプログラム
MY176904A (en) 2010-06-09 2020-08-26 Panasonic Ip Corp America Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
CA3027803C (en) * 2010-07-19 2020-04-07 Dolby International Ab Processing of audio signals during high frequency reconstruction
CN103270553B (zh) 2010-08-12 2015-08-12 弗兰霍菲尔运输应用研究公司 对正交镜像滤波器式音频编译码器的输出信号的重新取样
CA3067155C (en) 2010-09-16 2021-01-19 Dolby International Ab Cross product enhanced subband block based harmonic transposition
KR20120038311A (ko) 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
WO2012110415A1 (en) * 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
KR101551046B1 (ko) 2011-02-14 2015-09-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
EP2676265B1 (en) 2011-02-14 2019-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using an aligned look-ahead portion
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
EP2676270B1 (en) 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding a portion of an audio signal using a transient detection and a quality result
JP5969513B2 (ja) 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
WO2012110478A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Information signal representation using lapped transform
US9530424B2 (en) 2011-11-11 2016-12-27 Dolby International Ab Upsampling using oversampled SBR
EP2828854B1 (en) 2012-03-23 2016-03-16 Dolby Laboratories Licensing Corporation Hierarchical active voice detection
EP2862168B1 (en) * 2012-06-14 2017-08-09 Dolby International AB Smooth configuration switching for multichannel audio
KR102243688B1 (ko) 2013-04-05 2021-04-27 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
WO2015189533A1 (en) * 2014-06-10 2015-12-17 Meridian Audio Limited Digital encapsulation of audio signals
EP2963646A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
WO2016040623A1 (en) * 2014-09-12 2016-03-17 Dolby Laboratories Licensing Corporation Rendering audio objects in a reproduction environment that includes surround and/or height speakers
US9837065B2 (en) 2014-12-08 2017-12-05 Ford Global Technologies, Llc Variable bandwidth delayless subband algorithm for broadband active noise control system
EP3067889A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
US20180308507A1 (en) * 2016-01-15 2018-10-25 Dolby Laboratories Licensing Corporation Audio signal processing with low latency
TW202341126A (zh) 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
CN111316353B (zh) * 2017-11-10 2023-11-17 诺基亚技术有限公司 确定空间音频参数编码和相关联的解码
CN107918710B (zh) * 2017-11-22 2020-11-06 桂林电子科技大学 基于凸优化的非下采样图滤波器组的设计方法
CN108806705A (zh) * 2018-06-19 2018-11-13 合肥凌极西雅电子科技有限公司 音频处理方法和处理系统
US11195543B2 (en) * 2019-03-22 2021-12-07 Clear Peaks LLC Systems, devices, and methods for synchronizing audio
CN113314132B (zh) * 2021-05-17 2022-05-17 武汉大学 交互式音频系统中的音频对象编码方法、解码方法及装置
CN117292694B (zh) * 2023-11-22 2024-02-27 中国科学院自动化研究所 基于时不变编码的少令牌神经语音编解码方法和系统

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3211752C2 (de) 1982-03-30 1985-09-26 Siemens AG, 1000 Berlin und 8000 München Verfahren zum selektiven Abscheiden von aus Siliziden hochschmelzender Metalle bestehenden Schichtstrukturen auf im wesentlichen aus Silizium bestehenden Substraten und deren Verwendung
JPS621228A (ja) 1985-06-26 1987-01-07 Fujitsu Ltd タングステンシリサイドの選択成長方法
US4692343A (en) 1985-08-05 1987-09-08 Spectrum Cvd, Inc. Plasma enhanced CVD
US4737474A (en) 1986-11-17 1988-04-12 Spectrum Cvd, Inc. Silicide to silicon bonding process
EP0305143B1 (en) 1987-08-24 1993-12-08 Fujitsu Limited Method of selectively forming a conductor layer
EP0446037B1 (en) * 1990-03-09 1997-10-08 AT&T Corp. Hybrid perceptual audio coding
JPH0410429A (ja) 1990-04-26 1992-01-14 Matsushita Electron Corp 半導体装置
JP2892451B2 (ja) 1990-07-13 1999-05-17 住友重機械工業株式会社 電気―空気サーボアクチュエータ
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5392037A (en) * 1991-05-21 1995-02-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for encoding and decoding
JP2778324B2 (ja) * 1992-01-24 1998-07-23 日本電気株式会社 サブバンド分割方式
JPH05235701A (ja) * 1992-02-25 1993-09-10 Nippon Steel Corp 環状畳み込みによるディジタルフィルタバンク処理方法及び装置
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US5926791A (en) * 1995-10-26 1999-07-20 Sony Corporation Recursively splitting the low-frequency band with successively fewer filter taps in methods and apparatuses for sub-band encoding, decoding, and encoding and decoding
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5852806A (en) * 1996-03-19 1998-12-22 Lucent Technologies Inc. Switched filterbank for use in audio signal coding
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
KR100354531B1 (ko) * 1998-05-06 2005-12-21 삼성전자 주식회사 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6996198B2 (en) * 2000-10-27 2006-02-07 At&T Corp. Nonuniform oversampled filter banks for audio signal processing
ES2237706T3 (es) * 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
WO2004072956A1 (en) * 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9508351B2 (en) 2009-12-16 2016-11-29 Dobly International AB SBR bitstream parameter downmix
CN103854651B (zh) * 2009-12-16 2017-04-12 杜比国际公司 Sbr比特流参数缩混
CN103854651A (zh) * 2009-12-16 2014-06-11 杜比国际公司 Sbr比特流参数缩混
CN110010140A (zh) * 2013-04-05 2019-07-12 杜比国际公司 立体声音频编码器和解码器
CN110010140B (zh) * 2013-04-05 2023-04-18 杜比国际公司 立体声音频编码器和解码器
US11631417B2 (en) 2013-04-05 2023-04-18 Dolby International Ab Stereo audio encoder and decoder
CN109273015B (zh) * 2015-03-13 2022-12-09 杜比国际公司 解码在填充元素中具有增强频谱带复制元数据的音频位流
CN109410969A (zh) * 2015-03-13 2019-03-01 杜比国际公司 解码在填充元素中具有增强频谱带复制元数据的音频位流
CN109273015A (zh) * 2015-03-13 2019-01-25 杜比国际公司 解码在填充元素中具有增强频谱带复制元数据的音频位流
CN109243475B (zh) * 2015-03-13 2022-12-20 杜比国际公司 解码在填充元素中具有增强频谱带复制元数据的音频位流
CN109410969B (zh) * 2015-03-13 2022-12-20 杜比国际公司 解码在填充元素中具有增强频谱带复制元数据的音频位流
CN109243475A (zh) * 2015-03-13 2019-01-18 杜比国际公司 解码在填充元素中具有增强频谱带复制元数据的音频位流
US11664038B2 (en) 2015-03-13 2023-05-30 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
CN111970630A (zh) * 2015-08-25 2020-11-20 杜比实验室特许公司 音频解码器和解码方法
CN111970630B (zh) * 2015-08-25 2021-11-02 杜比实验室特许公司 音频解码器和解码方法
US11423917B2 (en) 2015-08-25 2022-08-23 Dolby International Ab Audio decoder and decoding method
US11705143B2 (en) 2015-08-25 2023-07-18 Dolby Laboratories Licensing Corporation Audio decoder and decoding method
CN107046668B (zh) * 2016-02-08 2021-01-05 奥迪康有限公司 单耳语音可懂度预测单元、助听器及双耳听力系统
CN107046668A (zh) * 2016-02-08 2017-08-15 奥迪康有限公司 单耳语音可懂度预测单元、助听器及双耳听力系统

Also Published As

Publication number Publication date
JP5889828B2 (ja) 2016-03-22
US20070067162A1 (en) 2007-03-22
JP5335015B2 (ja) 2013-11-06
KR20110113765A (ko) 2011-10-18
BR122018007834B1 (pt) 2019-03-19
JP2011128649A (ja) 2011-06-30
ATE354160T1 (de) 2007-03-15
EP1683133B1 (en) 2007-02-14
US7519538B2 (en) 2009-04-14
PL1683133T3 (pl) 2007-07-31
US8073685B2 (en) 2011-12-06
JP4966013B2 (ja) 2012-07-04
JP2009163257A (ja) 2009-07-23
JP2007514962A (ja) 2007-06-07
DE602004004818T2 (de) 2007-12-06
CN101540171B (zh) 2013-11-06
JP2013167908A (ja) 2013-08-29
US20110178810A1 (en) 2011-07-21
ES2282899T3 (es) 2007-10-16
EP1683133A1 (en) 2006-07-26
DE602004004818D1 (de) 2007-03-29
CN1875402A (zh) 2006-12-06
WO2005043511A1 (en) 2005-05-12
JP5192424B2 (ja) 2013-05-08
US20090216544A1 (en) 2009-08-27
CN1875402B (zh) 2012-03-21
KR101106026B1 (ko) 2012-01-17
KR101217649B1 (ko) 2013-01-02
BRPI0415951A8 (pt) 2018-05-02
KR20060131745A (ko) 2006-12-20
RU2006118682A (ru) 2007-12-10
BRPI0415951B1 (pt) 2018-08-28
US8260607B2 (en) 2012-09-04
RU2374703C2 (ru) 2009-11-27
BRPI0415951A (pt) 2007-01-02

Similar Documents

Publication Publication Date Title
CN101540171B (zh) 音频信号编码或解码
CN1774956B (zh) 音频信号合成
CN103329197B (zh) 用于反相声道的改进的立体声参数编码/解码
EP1943643B1 (en) Audio compression
CN101276587B (zh) 声音编码装置及其方法和声音解码装置及其方法
Schuijers et al. Low complexity parametric stereo coding
TWI446337B (zh) 用以使用級聯濾波器排組處理輸入音訊信號的裝置與方法
CN101529501B (zh) 音频对象编码器和音频对象编码方法
EP2212884B1 (en) An encoder
US8254584B2 (en) Method, medium, and system encoding/decoding multi-channel signal
CN104798131A (zh) 用于空间音频对象编码中信号相依缩放变换的编码器、解码器及方法
CN103366750B (zh) 一种声音编解码装置及其方法
CN103366749A (zh) 一种声音编解码装置及其方法
Britanak et al. Cosine-/Sine-Modulated Filter Banks
CN102460574A (zh) 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备
CN103366751A (zh) 一种声音编解码装置及其方法
RU2409874C9 (ru) Сжатие звуковых сигналов

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: Holland Ian Deho Finn

Applicant after: KONINKLIJKE PHILIPS ELECTRONICS N.V.

Co-applicant after: Dolby International Ltd.

Address before: Holland Ian Deho Finn

Applicant before: Koninklijke Philips Electronics N.V.

Co-applicant before: Dolby Sweden AB

Address after: Holland Ian Deho Finn

Applicant after: KONINKLIJKE PHILIPS ELECTRONICS N.V.

Co-applicant after: Dolby Sweden AB

Address before: Holland Ian Deho Finn

Applicant before: Koninklijke Philips Electronics N.V.

Co-applicant before: CODING TECH AB

C14 Grant of patent or utility model
GR01 Patent grant