CN116741187A - 立体声音频编码器和解码器 - Google Patents
立体声音频编码器和解码器 Download PDFInfo
- Publication number
- CN116741187A CN116741187A CN202310863596.7A CN202310863596A CN116741187A CN 116741187 A CN116741187 A CN 116741187A CN 202310863596 A CN202310863596 A CN 202310863596A CN 116741187 A CN116741187 A CN 116741187A
- Authority
- CN
- China
- Prior art keywords
- signal
- waveform
- frequency
- frequencies
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 17
- 230000003595 spectral effect Effects 0.000 claims description 43
- 238000004590 computer program Methods 0.000 abstract description 5
- 238000013459 approach Methods 0.000 abstract description 3
- 230000000295 complement effect Effects 0.000 description 14
- 230000008901 benefit Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000001131 transforming effect Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
公开了立体声音频编码器和解码器。本公开提供用于基于输入信号编码和解码立体声音频信号的方法、装置和计算机程序产品。根据本公开,使用同时使用参数化立体声编码和立体声音频信号的离散表示的混合方法,该混合方法可提高某些比特率的编码和解码音频的质量。
Description
本申请是申请号为201910434435.X,申请日为2014年4月4日,题为“立体声音频编码器和解码器”的中国发明专利申请的分案申请。
技术领域
本公开在这里一般地涉及立体声音频编码。具体而言,它涉及用于包含下混和离散立体声编码的混合编码的解码器和编码器。
背景技术
在常规的立体声音频编码中,可能的编码方案包括在低比特率应用中使用的参数化立体声编码技术。在中间速率上,常常使用左/右(Left/Right,L/R)或中间/侧(Mid/Side,M/S)波形立体声编码。现有的分发格式和相关的编码技术可在它们的带宽效率的观点上得到提高,特别是在具有低比特率和中间比特率之间的比特率的应用中。
在Unified Speech and Audio Coding(USAC)标准中尝试提高立体声音频系统中的音频分发的效率。USAC标准与参数化立体声编码器技术组合地引入基于低带宽波形编码的立体声编码。但是,由USAC提出的方案使用参数化立体声参数以在改进的离散余弦变换(MDCT)域中引导立体声编码,从而比普通M/S或L/R编码更有效地完成一些事情。该方案的缺点在于,可能难以基于在正交镜像滤波器(QMF)域中提取和计算的参数化立体声参数得到在MDCT域中基于低带宽波形的立体声编码中的最佳输出。
鉴于以上,可能需要进一步的改善,以解决或至少减小以上讨论的缺点的一个或更多个。
发明内容
根据本发明的一方面,提供了一种用于解码两个音频信号的解码方法,包括以下步骤:接收与两个音频信号的时间帧对应的第一信号和第二信号,其中,第一信号包含第一波形编码信号和下混信号,该第一波形编码信号含有与直到第一分频频率的频率对应的频谱数据,该下混信号含有与在第一分频频率和第二分频频率之间的频率对应的波形编码频谱数据,并且其中,第二信号包含第二波形编码信号,该第二波形编码信号含有与直到第一分频频率的频率对应的频谱数据,其中,接收的第一波形编码信号和第二波形编码信号以左右形式、和差形式和/或下混互补形式被波形编码,其中以下混互补形式被波形编码的第一波形编码信号和第二波形编码信号依赖于具有信号自适应性并且除了接收的第一信号和第二信号之外而被接收的加权参数a,其中,和差形式与加权参数的特定值对应;检查第一信号波形编码信号和第二信号波形编码信号对于直到第一分频频率的所有频率是否是和差形式的,并且,如果不是,那么将第一波形编码信号和第二波形编码信号变换成和差形式,使得第一信号是含有与直到第一分频频率的频率对应的频谱数据的波形编码和信号及含有与在第一分频频率和第二分频频率之间的频率对应的频谱数据的所述下混信号的组合,并且第二信号包含含有与直到第一分频频率的频率对应的频谱数据的波形编码差信号;接收高频重构参数;通过利用高频重构参数执行高频重构,来将所述下混信号扩展到高于第二分频频率的频率范围;接收上混参数;混合第一信号和第二信号,以产生立体声信号的左声道和右声道,其中,对于低于第一分频频率的频率,混合包含执行第一信号和第二信号的逆和差变换,并且对于高于第一分频频率的频率,混合包含通过使用上混参数来执行所述下混信号的参数化上混。
附图说明
现在参照附图描述示例性实施例,其中,
图1是根据示例性实施例的解码系统的一般化框图;
图2示出图1中的解码系统的第一部分;
图3示出图1中的解码系统的第二部分;
图4示出图1中的解码系统的第三部分;
图5是根据第一示例性实施例的编码系统的一般化框图;
图6是根据第二示例性实施例的编码系统的一般化框图。
所有附图是示意性的,并且,为了阐明本公开,一般仅表示必要的部分,而其它的部分可能被省略或仅仅被建议。除非另外指示,否则,类似的附图标记在不同的附图中指的是类似的部分。
具体实施方式
I.概要-解码器
如这里使用的,左右编码(coding or encoding)意味着不在信号之间执行任何变换的情况下编码左(L)和右(R)立体声信号。
这里,和差(sum-and-difference)编码意味着,左和右立体声信号的和M被编码为一个信号(和),并且,左和右立体声信号之间的差S被编码为一个信号(差)。和差编码也可被称为中间侧编码。由此,左右形式和和差形式之间的关系是M=L+R和S=L-R。应当注意,当将左和右立体声信号变换成和差形式或者执行相反的变换时,只要沿两个方向的变换匹配,不同的归一化或缩放就是可能的。在本公开中,主要使用M=L+R和S=L-R,但是,使用不同的缩放、例如使用M=(L+R)/2和S=(L-R)/2的系统也同样很好地工作。
这里,下混互补(downmix-complemetary,dmx/comp)编码意味着,在编码之前根据加权参数a使左和右立体声信号经历矩阵乘法。dmx/comp编码由此也可被称为dmx/comp/a编码。下混互补形式、左右形式和和差形式之间的关系一般是dmx=L+R=M和comp=(1-a)L-(1+a)R=-aM+S。注意,下混互补表示中的下混信号由此等于和差表示的和信号M。
这里,音频信号可以是纯音频信号、音频视觉信号或多媒体信号的音频部分或与元数据组合的这些信号中的任一个。
根据第一方面,示例性实施例提出用于基于输入信号解码立体声声道音频信号的方法、装置和计算机程序产品。提出的方法、装置和计算机程序产品可一般具有相同的特征和优点。
根据示例性实施例,提供用于解码两个音频的解码器。解码器包括被配置为接收与两个音频信号的时间帧对应的第一信号和第二信号的接收级,其中,第一信号包含含有与直到第一分频频率(cross-over frequency)的频率对应的频谱数据的第一波形编码信号和含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号,并且其中,第二信号包含含有与直到第一分频频率的频率对应的频谱数据的第二波形编码信号。
解码器还包括接收级的下游的混合级。混合级被配置为检查第一和第二信号波形编码信号是否对于直到第一分频频率的所有频率为和差形式,并且,如果不是,那么将第一和第二波形编码信号变换成和差形式,使得第一信号是含有与直到第一分频频率的频率对应的频谱数据的波形编码和信号及含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号的组合,并且,第二信号包含含有与直到第一分频频率的频率对应的频谱数据的波形编码差信号。
解码器还包括混合级的下游的被配置成上混第一和第二信号以产生立体声信号的左右声道的上混级,其中,对于低于第一分频频率的频率,上混级被配置为执行第一和第二信号的逆和差变换,并且,对于高于第一分频频率的频率,上混级被配置为执行第一信号的下混信号的参数化上混。
具有纯波形编码的较低频率即立体声音频信号的离散表示的优点可能在于,人耳对音频的具有低频率的部分更敏感。通过以更好的质量编码该部分,可以增大解码音频的整体效果。
具有第一信号的参数化立体声编码部分即波形编码下混信号和提到的立体声音频信号的离散表示的优点在于,与使用常规的参数化立体声方法相比,对某些比特率,可提高解码音频信号的质量。在约32~40千比特每秒(kbps)的比特率上,参数化立体声模型可饱和,即,解码音频信号的质量由参数化模型的缺点限制,而不是由于缺少编码比特。因此,对于从约32kbps起的比特率,在波形编码较低频率方面使用比特可能更有益。同时,使用第一信号的参数化立体声编码部分和分发的立体声音频信号的离散表示的混合方法在于,与使用在波形编码较低频率方面使用所有比特的方法和对剩余的频率使用频谱带复制(SBR)相比,这可对于例如低于48kbps的某些比特率提高解码音频的质量。
因此,解码器有利地用于解码二声道立体声音频信号。
根据另一实施例,在重叠加窗变换域中,执行在混合级中的将第一和第二波形编码信号变换成和差形式。重叠加窗变换域可例如是改进的离散余弦变换域(MDCT)域。这可能是有利的,原因是,在MDCT域中,很容易实现诸如左/右形式或dmx/comp形式的其它可用的音频分布格式向和差形式的变换。因此,可通过根据编码的信号的特性对低于第一分频频率的频率的至少一子集使用不同的格式来编码信号。这可允许提高编码质量和编码效果。
根据又一实施例,在正交镜像滤波器域即QMF域中执行上混级中的第一和第二信号的上混。执行上混,以产生左和右立体声信号。
根据另一实施例,波形编码下混信号包含与在第一分频频率和第二分频频率之间的频率对应的频谱数据。高频重构(HFR)参数例如在接收级上通过解码器被接收并然后被发送到高频重构级,该HFR参数用于通过用高频重构参数执行高频重构来将第一信号的下混信号扩展到高于第二分频频率的频率范围。高频重构可例如包含执行频谱带复制SBR。
具有仅包含与在第一分频频率和第二分频频率之间的频率对应的频谱数据的波形编码下混信号的优点在于,可减小立体声系统的需要的比特传送率。作为替代方案,可在波形编码较低频率方面使用通过具有带通滤波的下混信号而节省的比特,例如,这些频率的量化可更细,或者第一分频频率可增大。
由于如上面描述的那样人耳对音频信号的具有低频率的部分更敏感,因此,可在不降低解码音频信号的感觉音频质量的情况下通过高频重构重新创建诸如音频信号的具有高于第二分频频率的频率的部分的高频。
根据另一实施例,在执行第一和第二信号的上混之前,将第一信号的下混信号扩展到高于第二分频频率的频率范围。这可能是有利的,原因是,上混级将具有并输入具有与所有频率对应的频谱数据的和信号。
根据另一实施例,在将第一和第二波形编码信号变换成和差形式之后,将第一信号的下混信号扩展到高于第二分频频率的频率范围。这可能是有利的,原因是,给定下混信号与和差表示中的和信号对应,则高频重构级将具有有着以相同的形式即以和形式表示的与直到第二分频频率的频率对应的频谱数据的输入信号。
根据另一实施例,通过使用上混参数完成上混级中的上混。上混参数例如在接收级上通过解码器被接收并且发送到上混级。产生下混信号的去相关版本,并且,使下混信号和下混信号的去相关版本经历矩阵运算。矩阵运算的参数由上混参数给出。
根据另一实施例,在接收级上接收的第一和第二波形编码信号以左右形式、和差形式和/或下混互补形式被波形编码,其中,互补信号依赖于具有信号自适应性的加权参数a。波形编码的信号可由此根据信号的特性以不同的形式被编码,并且仍可通过解码器被解码。这样,给定系统的一定比特率,可允许提高编码质量并由此提高解码音频立体声信号的质量。在另一实施例中,加权参数a被取实数值。这可简化解码器,原因是不需要接近信号的虚部的额外级。另一优点在于,可降低解码器的计算复杂性,这也可导致减小的解码延迟/解码器反应时间。
根据另一实施例,在接收级上接收的第一和第二波形编码信号以和差形式被波形编码。这意味着,第一和第二信号可分别通过使用对第一和第二信号进行独立加窗的重叠加窗变换被编码,并且仍可通过解码器被解码。这样,给定系统的一定比特率,可允许提高的编码质量并由此允许提高的解码音频立体声信号的质量。例如,如果在和信号中而不是在差信号中检测到瞬变,那么波形解码器可用较短的窗编码和信号,而对于差信号,可以保持较长的缺省窗。与侧信号也通过较短的窗序列被编码的情况相比,这可提供更高的编码效率。
II.概要-编码器
根据第二方面,示例性实施例提出用于基于输入信号编码立体声声道音频信号的方法、装置和计算机程序产品。
提出的方法、装置和计算机程序产品可一般具有相同的特征和优点。
对于编码器的相应的特征和设置,关于在以上的解码器的概要中给出的特征和设置的优点可一般是有效的。
根据示例性实施例,提供用于编码两个音频信号的编码器。编码器包括被配置为接收要被编码的与两个信号的时间帧对应的第一信号和第二信号。
编码器还包括被配置为从接收级接收第一和第二信号并且将它们变换成作为和信号的第一变换信号和作为差信号的第二变换信号的变换级。
编码器还包括被配置为从变换级接收第一和第二变换信号并且分别将它们波形编码成第一和第二波形编码信号的波形编码级,其中,对于高于第一分频频率的频率,波形编码级被配置为波形编码第一变换信号,并且,对于直到第一分频频率的频率,波形编码级被配置为波形编码第一和第二变换信号。
编码器还包括被配置为从接收级接收第一和第二信号并且为了提取参数化立体声参数从而使得能够对高于第一分频频率的频率重构第一和第二信号的频谱数据而使第一和第二信号经历参数化立体声编码的参数化立体声编码级。
编码器还包括被配置为从波形编码级接收第一和第二波形编码信号并从参数化立体声编码级接收参数化立体声参数并且产生包含第一和第二波形编码信号和参数化立体声参数的比特流的比特流产生级。
根据另一实施例,在时间域中执行变换级中的第一和第二信号的变换。
根据另一实施例,对于低于第一分频频率的频率的至少一子集,编码器可通过执行逆和差变换将第一和第二波形编码信号变换成左/右形式。
根据另一实施例,对于低于第一分频频率的频率的至少一子集,编码器可通过对第一和第二波形编码信号执行矩阵运算来将第一和第二波形编码信号变换成下混/互补形式,矩阵运算依赖于加权参数a。加权参数a可然后包含于比特流产生级中的比特流中。
根据又一实施例,对于高于第一分频频率的频率,在变换级中波形编码第一和第二变换信号包含:对第一分频频率与第二分频频率之间的频率,波形编码第一变换信号,和在第二分频频率以上将第一波形编码信号设定为零。然后,为了产生使得能够实现下混信号的高频重构的高频重构参数,可使第一的下混信号和第二信号在高频重构级中经历高频重构。高频重构参数可然后包含在比特流产生级中的比特流中。
根据另一实施例,基于第一和第二信号计算下混信号。
根据另一实施例,通过首先将第一和第二信号变换成作为和信号的第一变换信号和作为差信号的第二变换信号并然后使第一和第二变换信号经历参数化立体声编码,来在参数化立体声编码级中使第一和第二信号经历参数化立体声编码,其中,经历高频重构编码的下混信号是第一变换信号。
III.示例性实施例
图1是包括三个概念部分200、300、400的解码系统100的一般化框图,将结合下图2~4更详细地解释这些概念部分。在第一概念部分200中,比特流被接收并且被解码为第一和第二信号。第一信号包含如下两个信号:含有与直到第一分频频率的频率对应的频谱数据的第一波形编码信号,和含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号。第二信号仅包含含有与直到第一分频频率的频率对应的频谱数据的第二波形编码信号。
在第二概念部分300中,在第一和第二信号的波形编码部分不是例如M/S形式的和差形式的情况下,第一和第二信号的波形编码部分变换成和差形式。然后,第一和第二信号变换到时域并然后变换成正交镜像滤波器域即QMF域。在第三概念部分400中,第一信号被高频重构(HRF)。第一和第二信号二者然后被上混以创建具有与正通过解码系统100解码的编码信号的整个频带对应的频谱系数的左和右立体声信号输出。
图2示出图1中的解码系统100的第一概念部分200。解码系统100包含接收级212。在接收级212中,比特流帧202被解码并且去量化为第一信号204a和第二信号204b。比特流帧202与正被解码的两个音频信号的时间帧对应。第一信号204a包含含有与直到第一分频频率ky的频率对应的频谱数据的第一波形编码信号208和含有与高于第一分频频率ky的频率对应的频谱数据的波形编码下混信号206。作为例子,第一分频频率ky是1.1kHz。
根据一些实施例,波形编码下混信号206包含与第一分频频率ky和第二分频频率kx之间的频率对应的频谱数据。作为例子,第二分频频率kx位于5.6~8kHz的范围内。
接收的第一和第二波形编码信号208、210可以按左右形式、和差形式和/或下混互补形式被波形编码,其中,互补信号依赖于具有信号自适应性的加权参数a。波形编码下混信号206与适用于参数化立体声的下混对应,根据以上,该下混与和形式对应。但是,信号204b不具有高于第一分频频率ky的内容。在改进的离散余弦变换(MDCT)域中表示信号206、208、210中的每一个。
图3示出图1中的解码系统100的第二概念部分300。解码系统100包含混合级302。解码系统100的设计要求:对于高频重构级(将在后面更详细地描述)的输入需要为和格式。因此,混合级被配置为检查第一和第二信号波形编码信号208、210是否为和差形式。如果第一和第二信号波形编码信号208、210不对于直到第一分频频率ky的所有频率为和差形式,那么混合级302将整个波形编码信号208、210变换成和差形式。在到混合级302的输入信号208、210的频率的至少一子集为下混互补形式的情况下,需要加权参数a作为到混合级302的输入。应当注意,输入信号208、210可包含以下混互补形式编码的频率的几个子集,并且,在这种情况下,各子集不必通过使用加权参数a的相同值被编码。在这种情况下,需要几个加权参数a作为到混合级302的输入。
如上所述,混合级302总是输出输入信号204a~b的和差表示。为了能够将以MDCT域表示的信号变换成和差表示,MDCT编码信号的加窗(windowing)需要相同。这意味着,在第一和第二信号波形编码信号208、210为L/R或下混互补形式的情况下,用于信号204a的加窗和用于信号204b的加窗不能是独立的。
因此,在第一和第二信号波形编码信号208、210为和差形式的情况下,用于信号204a的加窗和用于信号204b的加窗可以是独立的。
在混合级302之后,通过应用改进的逆离散余弦变换(MDCT-1)312,和差信号变换成时域。
两个信号304a~b然后通过两个QMF组(bank)314被分析。由于下混信号306不包含较低频率,因此,不需要用Nyquist滤波器组分析信号以增大频率分辨率。这可与下混信号包含低频率的系统(例如诸如MPEG-4参数化立体声的常规的参数化立体声解码)比较。在那些系统中,为了超出由QMF组实现的频率分辨率地增大频率分辨率并由此更好地匹配例如由Bark频率标尺表示的人听觉系统的频率选择性,需要用Nyquist滤波器组分析下混信号。
来自QMF组314的输出信号304包含第一信号304a,该第一信号304a是如下信号的组合:含有与直到第一分频频率ky的频率对应的频谱数据的波形编码和信号308,和含有与在第一分频频率ky和第二分频频率kx之间的频率对应的频谱数据的波形编码下混信号306。输出信号304还包含第二信号304b,该第二信号304b含有包含与直到第一分频频率ky的频率对应的频谱数据的波形编码差信号310。信号304b不具有高于第一分频频率ky的内容。
如将在后面描述的,高频重构级416(结合图4示出)使用较低频率(即,输出信号304中的第一波形编码信号308和波形编码下混信号306)来重构高于第二分频频率kx的频率。高频重构级416对其进行操作的信号是跨较低频率的类似类型的信号,这是有利的。根据该观点,使得混合级302总是输出第一和第二信号波形编码信号208、210的和差表示是有利的,原因是这意味着输出的第一信号304a的第一波形编码信号308和波形编码下混信号306具有类似的特性。
图4示出图1中的解码系统100的第三概念部分400。高频重构(HRF)级416通过执行高频重构将第一信号输入信号304a的下混信号306扩展到高于第二分频频率kx的频率范围。根据HFR级416的配置,到HFR级416的输入是整个信号304a或者仅仅是下混信号306。通过以任何适当的方式使用可通过高频重构级416接收的高频重构参数来完成高频重构。根据一实施例,执行的高频重构包含执行频谱带复制SBR。
来自高频重构级413的输出是包含施加了SBR扩展412的下混信号406的信号404。高频重构信号404和信号304b然后被馈送到上混级420中,以产生左L和右R立体声信号412a-b。对于与低于第一分频频率ky的频率对应的频谱系数,上混包含执行第一和第二信号408、310的逆和差变换。这只意味着如上面概述的那样从中间侧表示前进到左右表示。对于与超出第一分频频率ky的频率对应的频谱系数,通过去相关器418馈送下混信号406和SBR扩展412。下混信号406和SBR扩展412及下混信号406和SBR扩展412的去相关版本然后通过使用参数化混合参数被上混,以对于高于第一分频频率ky的频率重构左和右声道416、414。可以应用在本领域中已知的任何参数化上混过程。
应当注意,在图1~4所示的编码器的以上的示例性实施例100中,需要高频重构,原因是第一接收信号204a仅包含与直到第二分频频率kx的频率对应的频谱数据。在其它的实施例中,第一接收信号包含与编码信号的所有频率对应的频谱数据。根据这种实施例,不需要高频重构。本领域技术人员理解如何在这种情况下调整示例性编码器100。
图5作为例子示出根据一实施例的编码系统500的一般化框图。
在编码系统中,要被编码的第一和第二信号540、542由接收级(未示出)接收。这些信号540、542代表左540和右542立体声音频声道的时间帧。在时域中表示信号540、542。编码系统包含变换级510。信号540、542在变换级510中变换成和差格式544、546。
编码系统还包含被配置为从变换级510接收第一和第二变换信号544、546的波形编码级514。波形编码级一般在MDCT域中操作。出于这种原因,变换信号544、546在波形编码级514之前经历MDCT变换512。在波形编码级中,第一和第二变换信号544、546分别被波形编码成第一和第二波形编码信号518、520。
对于高于第一分频频率ky的频率,波形编码级514被配置为将第一变换信号544波形编码成第一波形编码信号518的波形编码信号552。波形编码级514可被配置为在第一分频频率ky以上将第二波形编码信号520设定为零或者根本不编码这些频率。对于高于第一分频频率ky的频率,波形编码级514被配置为将第一变换信号544波形编码成第一波形编码信号518的波形编码信号552。
对于低于第一分频频率ky的频率,在波形编码级514中判定对于两个信号548、550使用什么类型的立体声编码。根据低于第一分频频率ky的变换信号544、546的特性,可对波形编码信号548、550的不同子集做出不同的判定。编码可任意地为左/右编码、中间/侧编码(即,对和差编码)、或者dmx/comp/a编码。在在波形编码级514中通过和差编码波形编码信号548、550的情况下,可分别对信号518、520使用具有独立加窗的重叠加窗变换来编码波形编码信号518、520。
示例性第一分频频率ky是1.1kHz,但该频率可根据立体声音频系统的比特传送率或者根据要被编码的音频的特性而改变。
由此,从波形编码级514输出至少两个信号518、520。在根据加权参数a,通过执行矩阵运算而在下混/互补形式中编码低于第一分频频率ky的信号的一个或几个子集或者整个频带的情况下,该参数也作为信号522被输出。在以下混/互补形式编码几个子集的情况下,各子集不必通过使用加权参数a的相同值被编码。在这种情况下,几个加权参数作为信号522被输出。
这两个或三个信号518、520、522被编码并且量化524为单个复合信号558。
为了能够在解码器侧对于高于第一分频频率的频率重构第一和第二信号540、542的频谱数据,需要从信号540、542提取参数化立体声参数536。出于这种目的,编码器500包含参数化立体声(PS)编码级530。PS编码级530一般在QMF域中操作。因此,在输入到PS编码级530之前,第一和第二信号540、542通过QMF分析级526变换到QMF域。PS编码器级530适于仅对于高于第一分频频率ky的频率提取参数化立体声参数536。
应当注意,参数化立体声参数536反映被参数化立体声编码的信号的特性。因此,它们具有频率选择性,即,参数536的各参数可与左或右输入信号540、542的频率的子集对应。PS编码级530计算参数化立体声参数536并且以均匀或非均匀的方式量化它们。如上面提到的那样,参数被频率选择地计算,这里,输入信号540、542的整个频率范围分成例如15个参数带。它们可根据人听觉系统的频率分辨率的模型(例如Bark尺度)分开。
在图5所示的编码器500的示例性实施例中,波形编码级514被配置为对于第一分频频率ky与第二分频频率kx之间的频率波形编码第一变换信号544,并且,在第二分频频率kx之上将第一波形编码信号518设定为零。可以完成这一点,以进一步减小编码器500是一部分的音频系统的需要的传送率。为了能够重构高于第二分频频率kx的信号,需要产生高频重构参数538。根据本示例性实施例,通过在下混级534处下混以QMF域表示的两个信号540、542完成这一点。然后,为了产生高频重构参数538,在高频重构HFR编码级532处,使得到的例如等于信号540、542的和的下混信号经历高频重构。如本领域技术人员公知的那样,参数538可例如包含高于第二分频频率kx的频率的频谱包络、噪声添加信息等。
示例性第二分频频率kx为5.6~8kHz,但该频率可根据立体声音频系统的比特传送率或者根据要被编码的音频的特性而改变。
编码器500还包括比特流产生级即比特流多路复用器524。根据编码器500的示例性实施例,比特流产生级被配置为接收编码且量化的信号544和两个参数信号536、538。它们通过比特流产生级562被变换成比特流560,以进一步在立体声音频系统中分发。
根据另一实施例,波形编码级514被配置为对于高于第一分频频率ky的所有频率波形编码第一变换信号544。在这种情况下,不需要HFR编码级532,因此,在比特流中不包含高频重构参数538。
图6作为例子示出根据另一实施例的编码器系统600的一般化框图。本实施例与图5所示的实施例的不同在于,通过QMF分析级526变换的信号544、546为和差格式。因此,不需要单独的下混级534,原因是和信号544已为下混信号的形式。因此,SBR编码级532只需要对和信号544操作以提取高频重构参数538。PS编码器530适于对和信号544和差信号546二者操作以提取参数化立体声参数536。
等同物、扩展、替代和混杂
本领域技术人员在研究以上的描述之后很容易想到本公开的其它实施例。尽管本说明书和附图公开了实施例和例子,但本公开不限于这些特定的例子。在不背离由所附的权利要求限定的本公开的范围的情况下,可以做出大量的修改和变化。在权利要求中出现的任何附图标记不应被理解为限制它们的范围。
另外,本领域技术人员在通过研究附图、本公开和所附的权利要求实践本公开时可以理解和实施公开的实施例的变更例。在权利要求中,词语“包括”不排除其它的要素或步骤,并且,不定冠词“一个”或“一种”不排除多个。在多个不同的从属权利要求中仅仅记载某些措施不表示这些措施的组合不能被充分利用。
以上公开的系统和方法可实现为软件、固件、硬件或它们的组合。在硬件实现中,在以上的描述中提到的功能单元之间的任务的分割未必与分成多个实体单元对应;相反,一个实体部件可具有多个功能,并且,可通过协作的几个实体部件来实现一个任务。某些部件或所有部件可实现为由数字信号处理器或微处理器执行的软件,或者实现为硬件或依应用而定的集成电路。这种软件可分布于可包含计算机存储介质(或非暂时性介质)或通信介质(或暂时性介质)的计算机可读介质上。本领域技术人员很容易理解,术语计算机存储介质包括以任何方法或技术实现的易失性和非易失性、可去除和不可去除介质,这些介质用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字万用盘(DVD)或其它光盘存储器、磁盒、磁带、磁盘存储器或其它磁存储装置或可用于存储希望的信息并且可通过计算机访问的任何其它介质。并且,本领域技术人员公知,通信介质一般在诸如载波或其它传输机制的调制数据信号中体现计算机可读指令、数据结构、程序模块或其它数据,并且包含任何信息递送介质。
Claims (5)
1.一种用于对编码音频比特流进行解码的方法,该方法包括:
对于第一时间段,从所述编码音频比特流提取第一波形编码信号,第一波形编码信号包括与直到第一分频频率的频率对应的第一频谱系数;
对于第一时间段,从所述编码音频比特流提取第二波形编码信号,第二波形编码信号包括与高于第一分频频率的频率子集对应的第二频谱系数,其中对于第一时间段,第二波形编码信号不包括与直到第一分频频率的频率对应的第二频谱系数;
从所述编码音频比特流提取重构参数;
基于第二频谱系数,确定第二波形编码信号具有特定格式;
对于第一时间段,基于所述特定格式执行频率重构以将所述频率子集扩展到高于第二分频频率从而生成扩展信号,其中第二分频频率高于第一分频频率,其中频率重构使用所述重构参数,并且其中所述重构参数包括高于第二分频频率的所述子集频率的频谱包络。
2.根据权利要求1所述的方法,其中,第一波形编码信号和第二波形编码信号共享使用心理声学模型的共用比特池。
3.根据权利要求1所述的方法,其中,第一波形编码信号和第二波形编码信号是表示频域中的音频信号的波形的信号。
4.一种包括指令的非暂时性计算机可读介质,所述指令在被处理器执行时使得处理器执行根据权利要求1所述的方法。
5.一种用于对编码音频比特流进行解码的音频解码器,该音频解码器包括:
第一解复用器,用于对于第一时间段,从所述编码音频比特流提取第一波形编码信号,第一波形编码信号包括与直到第一分频频率的频率对应的第一频谱系数;
第二解复用器,用于对于第一时间段,从所述编码音频比特流提取第二波形编码信号,第二波形编码信号包括与高于第一分频频率的频率子集对应的第二频谱系数,其中对于第一时间段,第二波形编码信号不包括与直到第一分频频率的频率对应的第二频谱系数;
频率重构器,用于基于第二频谱系数,确定第二波形编码信号具有特定格式,并且用于对于第一时间段,基于所述特定格式执行频率重构以将所述频率子集扩展到高于第二分频频率从而生成扩展信号,其中第二分频频率高于第一分频频率,其中频率重构使用从所述编码音频比特流提取的重构参数,并且其中所述重构参数包括高于第二分频频率的所述子集频率的频谱包络。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361808684P | 2013-04-05 | 2013-04-05 | |
US61/808,684 | 2013-04-05 | ||
PCT/EP2014/056854 WO2014161993A1 (en) | 2013-04-05 | 2014-04-04 | Stereo audio encoder and decoder |
CN201480019354.9A CN105103225B (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480019354.9A Division CN105103225B (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116741187A true CN116741187A (zh) | 2023-09-12 |
Family
ID=50473291
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310871997.7A Pending CN116741188A (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
CN202310862055.2A Pending CN116741186A (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
CN202310863596.7A Pending CN116741187A (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
CN201910434435.XA Active CN110047496B (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
CN201480019354.9A Active CN105103225B (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
CN201910434427.5A Active CN110010140B (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310871997.7A Pending CN116741188A (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
CN202310862055.2A Pending CN116741186A (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910434435.XA Active CN110047496B (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
CN201480019354.9A Active CN105103225B (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
CN201910434427.5A Active CN110010140B (zh) | 2013-04-05 | 2014-04-04 | 立体声音频编码器和解码器 |
Country Status (9)
Country | Link |
---|---|
US (5) | US9570083B2 (zh) |
EP (3) | EP3528249A1 (zh) |
JP (1) | JP6019266B2 (zh) |
KR (4) | KR20150126651A (zh) |
CN (6) | CN116741188A (zh) |
BR (4) | BR122021009025B1 (zh) |
HK (1) | HK1214882A1 (zh) |
RU (3) | RU2645271C2 (zh) |
WO (1) | WO2014161993A1 (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
CA3211308A1 (en) | 2013-05-24 | 2014-11-27 | Dolby International Ab | Coding of audio scenes |
RU2630754C2 (ru) | 2013-05-24 | 2017-09-12 | Долби Интернешнл Аб | Эффективное кодирование звуковых сцен, содержащих звуковые объекты |
EP3005353B1 (en) | 2013-05-24 | 2017-08-16 | Dolby International AB | Efficient coding of audio scenes comprising audio objects |
EP2973551B1 (en) | 2013-05-24 | 2017-05-03 | Dolby International AB | Reconstruction of audio scenes from a downmix |
CN105493182B (zh) * | 2013-08-28 | 2020-01-21 | 杜比实验室特许公司 | 混合波形编码和参数编码语音增强 |
CN105556597B (zh) | 2013-09-12 | 2019-10-29 | 杜比国际公司 | 多声道音频内容的编码和解码 |
WO2015036350A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby International Ab | Audio decoding system and audio encoding system |
EP2922055A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information |
EP2922056A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation |
EP2922054A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation |
WO2015150384A1 (en) | 2014-04-01 | 2015-10-08 | Dolby International Ab | Efficient coding of audio scenes comprising audio objects |
KR102244612B1 (ko) * | 2014-04-21 | 2021-04-26 | 삼성전자주식회사 | 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법 |
WO2016066743A1 (en) * | 2014-10-31 | 2016-05-06 | Dolby International Ab | Parametric encoding and decoding of multichannel audio signals |
EP3246923A1 (en) | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a multichannel audio signal |
US10249307B2 (en) * | 2016-06-27 | 2019-04-02 | Qualcomm Incorporated | Audio decoding using intermediate sampling rate |
US10362423B2 (en) | 2016-10-13 | 2019-07-23 | Qualcomm Incorporated | Parametric audio decoding |
TWI702594B (zh) | 2018-01-26 | 2020-08-21 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建技術之回溯相容整合 |
CN112951252B (zh) * | 2021-05-13 | 2021-08-03 | 北京百瑞互联技术有限公司 | 一种lc3音频码流的混音方法、装置、介质及设备 |
WO2024147370A1 (ko) * | 2023-01-02 | 2024-07-11 | 엘지전자 주식회사 | 디스플레이 장치 및 그의 오디오 신호 처리 방법 |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5796844A (en) | 1996-07-19 | 1998-08-18 | Lexicon | Multichannel active matrix sound reproduction with maximum lateral separation |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6226616B1 (en) * | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
US7644003B2 (en) | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7583805B2 (en) | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7006636B2 (en) | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
ES2280736T3 (es) | 2002-04-22 | 2007-09-16 | Koninklijke Philips Electronics N.V. | Sintetizacion de señal. |
DE60326782D1 (de) | 2002-04-22 | 2009-04-30 | Koninkl Philips Electronics Nv | Dekodiervorrichtung mit Dekorreliereinheit |
US7039204B2 (en) | 2002-06-24 | 2006-05-02 | Agere Systems Inc. | Equalization for audio mixing |
DE60327039D1 (de) * | 2002-07-19 | 2009-05-20 | Nec Corp | Audiodekodierungseinrichtung, dekodierungsverfahren und programm |
DE10328777A1 (de) * | 2003-06-25 | 2005-01-27 | Coding Technologies Ab | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
RU2374703C2 (ru) * | 2003-10-30 | 2009-11-27 | Конинклейке Филипс Электроникс Н.В. | Кодирование или декодирование аудиосигнала |
ATE527654T1 (de) | 2004-03-01 | 2011-10-15 | Dolby Lab Licensing Corp | Mehrkanal-audiodecodierung |
DE602005022235D1 (de) | 2004-05-19 | 2010-08-19 | Panasonic Corp | Audiosignalkodierer und Audiosignaldekodierer |
WO2006000842A1 (en) | 2004-05-28 | 2006-01-05 | Nokia Corporation | Multichannel audio extension |
DE102004042819A1 (de) * | 2004-09-03 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals |
JP4939424B2 (ja) * | 2004-11-02 | 2012-05-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化 |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
BRPI0517949B1 (pt) | 2004-11-04 | 2019-09-03 | Koninklijke Philips Nv | dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador |
CN101116136B (zh) | 2005-02-10 | 2011-05-18 | 皇家飞利浦电子股份有限公司 | 声音合成的装置和方法 |
US7573912B2 (en) | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
WO2007110103A1 (en) * | 2006-03-24 | 2007-10-04 | Dolby Sweden Ab | Generation of spatial downmixes from parametric representations of multi channel signals |
KR101435893B1 (ko) * | 2006-09-22 | 2014-09-02 | 삼성전자주식회사 | 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치 |
WO2008035949A1 (en) | 2006-09-22 | 2008-03-27 | Samsung Electronics Co., Ltd. | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding |
DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US8290167B2 (en) | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US20080232601A1 (en) | 2007-03-21 | 2008-09-25 | Ville Pulkki | Method and apparatus for enhancement of audio reconstruction |
JPWO2008132850A1 (ja) | 2007-04-25 | 2010-07-22 | パナソニック株式会社 | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 |
ES2452348T3 (es) * | 2007-04-26 | 2014-04-01 | Dolby International Ab | Aparato y procedimiento para sintetizar una señal de salida |
DK2571024T3 (en) * | 2007-08-27 | 2015-01-05 | Ericsson Telefon Ab L M | Adaptive transition frequency between the noise filling and bandwidth extension |
WO2009067741A1 (en) * | 2007-11-27 | 2009-06-04 | Acouity Pty Ltd | Bandwidth compression of parametric soundfield representations for transmission and storage |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
EP3296992B1 (en) * | 2008-03-20 | 2021-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for modifying a parameterized representation |
ES2796552T3 (es) * | 2008-07-11 | 2020-11-27 | Fraunhofer Ges Forschung | Sintetizador de señales de audio y codificador de señales de audio |
KR101433701B1 (ko) | 2009-03-17 | 2014-08-28 | 돌비 인터네셔널 에이비 | 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩 |
AU2010303039B9 (en) * | 2009-09-29 | 2014-10-23 | Dolby International Ab | Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value |
CN102667920B (zh) | 2009-12-16 | 2014-03-12 | 杜比国际公司 | Sbr比特流参数缩混 |
CA3097372C (en) * | 2010-04-09 | 2021-11-30 | Dolby International Ab | Mdct-based complex prediction stereo coding |
-
2014
- 2014-04-04 EP EP19161888.3A patent/EP3528249A1/en not_active Ceased
- 2014-04-04 KR KR1020157027442A patent/KR20150126651A/ko not_active IP Right Cessation
- 2014-04-04 RU RU2015147181A patent/RU2645271C2/ru active
- 2014-04-04 RU RU2017145579A patent/RU2665214C1/ru active
- 2014-04-04 EP EP14716280.4A patent/EP2981960B1/en active Active
- 2014-04-04 US US14/781,712 patent/US9570083B2/en active Active
- 2014-04-04 KR KR1020237002590A patent/KR20230020553A/ko not_active Application Discontinuation
- 2014-04-04 BR BR122021009025-4A patent/BR122021009025B1/pt active IP Right Grant
- 2014-04-04 CN CN202310871997.7A patent/CN116741188A/zh active Pending
- 2014-04-04 CN CN202310862055.2A patent/CN116741186A/zh active Pending
- 2014-04-04 EP EP23197482.5A patent/EP4300488A3/en active Pending
- 2014-04-04 BR BR112015025080-7A patent/BR112015025080B1/pt active IP Right Grant
- 2014-04-04 CN CN202310863596.7A patent/CN116741187A/zh active Pending
- 2014-04-04 WO PCT/EP2014/056854 patent/WO2014161993A1/en active Application Filing
- 2014-04-04 KR KR1020197034896A patent/KR20190134821A/ko not_active IP Right Cessation
- 2014-04-04 JP JP2016505842A patent/JP6019266B2/ja active Active
- 2014-04-04 CN CN201910434435.XA patent/CN110047496B/zh active Active
- 2014-04-04 KR KR1020167025114A patent/KR20160111042A/ko active Application Filing
- 2014-04-04 BR BR122021009022-0A patent/BR122021009022B1/pt active IP Right Grant
- 2014-04-04 CN CN201480019354.9A patent/CN105103225B/zh active Active
- 2014-04-04 BR BR122017006701-0A patent/BR122017006701B1/pt active IP Right Grant
- 2014-04-04 CN CN201910434427.5A patent/CN110010140B/zh active Active
-
2016
- 2016-03-10 HK HK16102784.8A patent/HK1214882A1/zh unknown
-
2017
- 2017-01-19 US US15/410,377 patent/US10163449B2/en active Active
-
2018
- 2018-07-27 RU RU2018127639A patent/RU2690885C1/ru active
- 2018-11-19 US US16/195,745 patent/US10600429B2/en active Active
-
2020
- 2020-03-23 US US16/827,414 patent/US11631417B2/en active Active
-
2023
- 2023-04-04 US US18/295,701 patent/US12080307B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11631417B2 (en) | Stereo audio encoder and decoder | |
EP3279893B1 (en) | Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering | |
EP1921606B1 (en) | Energy shaping device and energy shaping method | |
US11830510B2 (en) | Audio decoder for interleaving signals | |
CN110648674B (zh) | 多声道音频内容的编码 | |
JP2021507316A (ja) | オーディオ信号の高周波再構成技術の後方互換性のある統合 | |
EP2690622B1 (en) | Audio decoding device and audio decoding method | |
RU2798009C2 (ru) | Стереофонический кодер и декодер аудиосигналов |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40091167 Country of ref document: HK |