CN110047496B - 立体声音频编码器和解码器 - Google Patents

立体声音频编码器和解码器 Download PDF

Info

Publication number
CN110047496B
CN110047496B CN201910434435.XA CN201910434435A CN110047496B CN 110047496 B CN110047496 B CN 110047496B CN 201910434435 A CN201910434435 A CN 201910434435A CN 110047496 B CN110047496 B CN 110047496B
Authority
CN
China
Prior art keywords
signal
frequency
waveform
encoded
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910434435.XA
Other languages
English (en)
Other versions
CN110047496A (zh
Inventor
H·普恩哈根
K·克约尔林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Priority to CN201910434435.XA priority Critical patent/CN110047496B/zh
Publication of CN110047496A publication Critical patent/CN110047496A/zh
Application granted granted Critical
Publication of CN110047496B publication Critical patent/CN110047496B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

公开了立体声音频编码器和解码器。本公开提供用于基于输入信号编码和解码立体声音频信号的方法、装置和计算机程序产品。根据本公开,使用同时使用参数化立体声编码和立体声音频信号的离散表示的混合方法,该混合方法可提高某些比特率的编码和解码音频的质量。

Description

立体声音频编码器和解码器
本申请是申请号为201480019354.9,申请日为2014年4月4日,题为“立体声音频编码器和解码器”的中国发明专利申请的分案申请。
技术领域
本公开在这里一般地涉及立体声音频编码。具体而言,它涉及用于包含下混和离散立体声编码的混合编码的解码器和编码器。
背景技术
在常规的立体声音频编码中,可能的编码方案包括在低比特率应用中使用的参数化立体声编码技术。在中间速率上,常常使用左/右(Left/Right,L/R)或中间/侧(Mid/Side,M/S)波形立体声编码。现有的分发格式和相关的编码技术可在它们的带宽效率的观点上得到提高,特别是在具有低比特率和中间比特率之间的比特率的应用中。
在Unified Speech and Audio Coding(USAC)标准中尝试提高立体声音频系统中的音频分发的效率。USAC标准与参数化立体声编码器技术组合地引入基于低带宽波形编码的立体声编码。但是,由USAC提出的方案使用参数化立体声参数以在改进的离散余弦变换(MDCT)域中引导立体声编码,从而比普通M/S或L/R编码更有效地完成一些事情。该方案的缺点在于,可能难以基于在正交镜像滤波器(QMF)域中提取和计算的参数化立体声参数得到在MDCT域中基于低带宽波形的立体声编码中的最佳输出。
鉴于以上,可能需要进一步的改善,以解决或至少减小以上讨论的缺点的一个或更多个。
发明内容
根据本发明的一方面,提供了一种用于解码两个音频信号的解码方法,包括以下步骤:接收与两个音频信号的时间帧对应的第一信号和第二信号,其中,第一信号包含第一波形编码信号和下混信号,该第一波形编码信号含有与直到第一分频频率的频率对应的频谱数据,该下混信号含有与在第一分频频率和第二分频频率之间的频率对应的波形编码频谱数据,并且其中,第二信号包含第二波形编码信号,该第二波形编码信号含有与直到第一分频频率的频率对应的频谱数据,其中,接收的第一波形编码信号和第二波形编码信号以左右形式、和差形式和/或下混互补形式被波形编码,其中以下混互补形式被波形编码的第一波形编码信号和第二波形编码信号依赖于具有信号自适应性并且除了接收的第一信号和第二信号之外而被接收的加权参数a,其中,和差形式与加权参数的特定值对应;检查第一信号波形编码信号和第二信号波形编码信号对于直到第一分频频率的所有频率是否是和差形式的,并且,如果不是,那么将第一波形编码信号和第二波形编码信号变换成和差形式,使得第一信号是含有与直到第一分频频率的频率对应的频谱数据的波形编码和信号及含有与在第一分频频率和第二分频频率之间的频率对应的频谱数据的所述下混信号的组合,并且第二信号包含含有与直到第一分频频率的频率对应的频谱数据的波形编码差信号;接收高频重构参数;通过利用高频重构参数执行高频重构,来将所述下混信号扩展到高于第二分频频率的频率范围;接收上混参数;混合第一信号和第二信号,以产生立体声信号的左声道和右声道,其中,对于低于第一分频频率的频率,混合包含执行第一信号和第二信号的逆和差变换,并且对于高于第一分频频率的频率,混合包含通过使用上混参数来执行所述下混信号的参数化上混。
附图说明
现在参照附图描述示例性实施例,其中,
图1是根据示例性实施例的解码系统的一般化框图;
图2示出图1中的解码系统的第一部分;
图3示出图1中的解码系统的第二部分;
图4示出图1中的解码系统的第三部分;
图5是根据第一示例性实施例的编码系统的一般化框图;
图6是根据第二示例性实施例的编码系统的一般化框图。
所有附图是示意性的,并且,为了阐明本公开,一般仅表示必要的部分,而其它的部分可能被省略或仅仅被建议。除非另外指示,否则,类似的附图标记在不同的附图中指的是类似的部分。
具体实施方式
I.概要-解码器
如这里使用的,左右编码(coding or encoding)意味着不在信号之间执行任何变换的情况下编码左(L)和右(R)立体声信号。
这里,和差(sum-and-difference)编码意味着,左和右立体声信号的和M被编码为一个信号(和),并且,左和右立体声信号之间的差S被编码为一个信号(差)。和差编码也可被称为中间侧编码。由此,左右形式和和差形式之间的关系是M=L+R和S=L-R。应当注意,当将左和右立体声信号变换成和差形式或者执行相反的变换时,只要沿两个方向的变换匹配,不同的归一化或缩放就是可能的。在本公开中,主要使用M=L+R和S=L-R,但是,使用不同的缩放、例如使用M=(L+R)/2和S=(L-R)/2的系统也同样很好地工作。
这里,下混互补(downmix-complemetary,dmx/comp)编码意味着,在编码之前根据加权参数a使左和右立体声信号经历矩阵乘法。dmx/comp编码由此也可被称为dmx/comp/a编码。下混互补形式、左右形式和和差形式之间的关系一般是dmx=L+R=M和comp=(1-a)L-(1+a)R=-aM+S。注意,下混互补表示中的下混信号由此等于和差表示的和信号M。
这里,音频信号可以是纯音频信号、音频视觉信号或多媒体信号的音频部分或与元数据组合的这些信号中的任一个。
根据第一方面,示例性实施例提出用于基于输入信号解码立体声声道音频信号的方法、装置和计算机程序产品。提出的方法、装置和计算机程序产品可一般具有相同的特征和优点。
根据示例性实施例,提供用于解码两个音频的解码器。解码器包括被配置为接收与两个音频信号的时间帧对应的第一信号和第二信号的接收级,其中,第一信号包含含有与直到第一分频频率(cross-over frequency)的频率对应的频谱数据的第一波形编码信号和含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号,并且其中,第二信号包含含有与直到第一分频频率的频率对应的频谱数据的第二波形编码信号。
解码器还包括接收级的下游的混合级。混合级被配置为检查第一和第二信号波形编码信号是否对于直到第一分频频率的所有频率为和差形式,并且,如果不是,那么将第一和第二波形编码信号变换成和差形式,使得第一信号是含有与直到第一分频频率的频率对应的频谱数据的波形编码和信号及含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号的组合,并且,第二信号包含含有与直到第一分频频率的频率对应的频谱数据的波形编码差信号。
解码器还包括混合级的下游的被配置成上混第一和第二信号以产生立体声信号的左右声道的上混级,其中,对于低于第一分频频率的频率,上混级被配置为执行第一和第二信号的逆和差变换,并且,对于高于第一分频频率的频率,上混级被配置为执行第一信号的下混信号的参数化上混。
具有纯波形编码的较低频率即立体声音频信号的离散表示的优点可能在于,人耳对音频的具有低频率的部分更敏感。通过以更好的质量编码该部分,可以增大解码音频的整体效果。
具有第一信号的参数化立体声编码部分即波形编码下混信号和提到的立体声音频信号的离散表示的优点在于,与使用常规的参数化立体声方法相比,对某些比特率,可提高解码音频信号的质量。在约32~40千比特每秒(kbps)的比特率上,参数化立体声模型可饱和,即,解码音频信号的质量由参数化模型的缺点限制,而不是由于缺少编码比特。因此,对于从约32kbps起的比特率,在波形编码较低频率方面使用比特可能更有益。同时,使用第一信号的参数化立体声编码部分和分发的立体声音频信号的离散表示的混合方法在于,与使用在波形编码较低频率方面使用所有比特的方法和对剩余的频率使用频谱带复制(SBR)相比,这可对于例如低于48kbps的某些比特率提高解码音频的质量。
因此,解码器有利地用于解码二声道立体声音频信号。
根据另一实施例,在重叠加窗变换域中,执行在混合级中的将第一和第二波形编码信号变换成和差形式。重叠加窗变换域可例如是改进的离散余弦变换域(MDCT)域。这可能是有利的,原因是,在MDCT域中,很容易实现诸如左/右形式或dmx/comp形式的其它可用的音频分布格式向和差形式的变换。因此,可通过根据编码的信号的特性对低于第一分频频率的频率的至少一子集使用不同的格式来编码信号。这可允许提高编码质量和编码效果。
根据又一实施例,在正交镜像滤波器域即QMF域中执行上混级中的第一和第二信号的上混。执行上混,以产生左和右立体声信号。
根据另一实施例,波形编码下混信号包含与在第一分频频率和第二分频频率之间的频率对应的频谱数据。高频重构(HFR)参数例如在接收级上通过解码器被接收并然后被发送到高频重构级,该HFR参数用于通过用高频重构参数执行高频重构来将第一信号的下混信号扩展到高于第二分频频率的频率范围。高频重构可例如包含执行频谱带复制SBR。
具有仅包含与在第一分频频率和第二分频频率之间的频率对应的频谱数据的波形编码下混信号的优点在于,可减小立体声系统的需要的比特传送率。作为替代方案,可在波形编码较低频率方面使用通过具有带通滤波的下混信号而节省的比特,例如,这些频率的量化可更细,或者第一分频频率可增大。
由于如上面描述的那样人耳对音频信号的具有低频率的部分更敏感,因此,可在不降低解码音频信号的感觉音频质量的情况下通过高频重构重新创建诸如音频信号的具有高于第二分频频率的频率的部分的高频。
根据另一实施例,在执行第一和第二信号的上混之前,将第一信号的下混信号扩展到高于第二分频频率的频率范围。这可能是有利的,原因是,上混级将具有并输入具有与所有频率对应的频谱数据的和信号。
根据另一实施例,在将第一和第二波形编码信号变换成和差形式之后,将第一信号的下混信号扩展到高于第二分频频率的频率范围。这可能是有利的,原因是,给定下混信号与和差表示中的和信号对应,则高频重构级将具有有着以相同的形式即以和形式表示的与直到第二分频频率的频率对应的频谱数据的输入信号。
根据另一实施例,通过使用上混参数完成上混级中的上混。上混参数例如在接收级上通过解码器被接收并且发送到上混级。产生下混信号的去相关版本,并且,使下混信号和下混信号的去相关版本经历矩阵运算。矩阵运算的参数由上混参数给出。
根据另一实施例,在接收级上接收的第一和第二波形编码信号以左右形式、和差形式和/或下混互补形式被波形编码,其中,互补信号依赖于具有信号自适应性的加权参数a。波形编码的信号可由此根据信号的特性以不同的形式被编码,并且仍可通过解码器被解码。这样,给定系统的一定比特率,可允许提高编码质量并由此提高解码音频立体声信号的质量。在另一实施例中,加权参数a被取实数值。这可简化解码器,原因是不需要接近信号的虚部的额外级。另一优点在于,可降低解码器的计算复杂性,这也可导致减小的解码延迟/解码器反应时间。
根据另一实施例,在接收级上接收的第一和第二波形编码信号以和差形式被波形编码。这意味着,第一和第二信号可分别通过使用对第一和第二信号进行独立加窗的重叠加窗变换被编码,并且仍可通过解码器被解码。这样,给定系统的一定比特率,可允许提高的编码质量并由此允许提高的解码音频立体声信号的质量。例如,如果在和信号中而不是在差信号中检测到瞬变,那么波形解码器可用较短的窗编码和信号,而对于差信号,可以保持较长的缺省窗。与侧信号也通过较短的窗序列被编码的情况相比,这可提供更高的编码效率。
II.概要-编码器
根据第二方面,示例性实施例提出用于基于输入信号编码立体声声道音频信号的方法、装置和计算机程序产品。
提出的方法、装置和计算机程序产品可一般具有相同的特征和优点。
对于编码器的相应的特征和设置,关于在以上的解码器的概要中给出的特征和设置的优点可一般是有效的。
根据示例性实施例,提供用于编码两个音频信号的编码器。编码器包括被配置为接收要被编码的与两个信号的时间帧对应的第一信号和第二信号。
编码器还包括被配置为从接收级接收第一和第二信号并且将它们变换成作为和信号的第一变换信号和作为差信号的第二变换信号的变换级。
编码器还包括被配置为从变换级接收第一和第二变换信号并且分别将它们波形编码成第一和第二波形编码信号的波形编码级,其中,对于高于第一分频频率的频率,波形编码级被配置为波形编码第一变换信号,并且,对于直到第一分频频率的频率,波形编码级被配置为波形编码第一和第二变换信号。
编码器还包括被配置为从接收级接收第一和第二信号并且为了提取参数化立体声参数从而使得能够对高于第一分频频率的频率重构第一和第二信号的频谱数据而使第一和第二信号经历参数化立体声编码的参数化立体声编码级。
编码器还包括被配置为从波形编码级接收第一和第二波形编码信号并从参数化立体声编码级接收参数化立体声参数并且产生包含第一和第二波形编码信号和参数化立体声参数的比特流的比特流产生级。
根据另一实施例,在时间域中执行变换级中的第一和第二信号的变换。
根据另一实施例,对于低于第一分频频率的频率的至少一子集,编码器可通过执行逆和差变换将第一和第二波形编码信号变换成左/右形式。
根据另一实施例,对于低于第一分频频率的频率的至少一子集,编码器可通过对第一和第二波形编码信号执行矩阵运算来将第一和第二波形编码信号变换成下混/互补形式,矩阵运算依赖于加权参数a。加权参数a可然后包含于比特流产生级中的比特流中。
根据又一实施例,对于高于第一分频频率的频率,在变换级中波形编码第一和第二变换信号包含:对第一分频频率与第二分频频率之间的频率,波形编码第一变换信号,和在第二分频频率以上将第一波形编码信号设定为零。然后,为了产生使得能够实现下混信号的高频重构的高频重构参数,可使第一的下混信号和第二信号在高频重构级中经历高频重构。高频重构参数可然后包含在比特流产生级中的比特流中。
根据另一实施例,基于第一和第二信号计算下混信号。
根据另一实施例,通过首先将第一和第二信号变换成作为和信号的第一变换信号和作为差信号的第二变换信号并然后使第一和第二变换信号经历参数化立体声编码,来在参数化立体声编码级中使第一和第二信号经历参数化立体声编码,其中,经历高频重构编码的下混信号是第一变换信号。
III.示例性实施例
图1是包括三个概念部分200、300、400的解码系统100的一般化框图,将结合下图2~4更详细地解释这些概念部分。在第一概念部分200中,比特流被接收并且被解码为第一和第二信号。第一信号包含如下两个信号:含有与直到第一分频频率的频率对应的频谱数据的第一波形编码信号,和含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号。第二信号仅包含含有与直到第一分频频率的频率对应的频谱数据的第二波形编码信号。
在第二概念部分300中,在第一和第二信号的波形编码部分不是例如M/S形式的和差形式的情况下,第一和第二信号的波形编码部分变换成和差形式。然后,第一和第二信号变换到时域并然后变换成正交镜像滤波器域即QMF域。在第三概念部分400中,第一信号被高频重构(HRF)。第一和第二信号二者然后被上混以创建具有与正通过解码系统100解码的编码信号的整个频带对应的频谱系数的左和右立体声信号输出。
图2示出图1中的解码系统100的第一概念部分200。解码系统100包含接收级212。在接收级212中,比特流帧202被解码并且去量化为第一信号204a和第二信号204b。比特流帧202与正被解码的两个音频信号的时间帧对应。第一信号204a包含含有与直到第一分频频率ky的频率对应的频谱数据的第一波形编码信号208和含有与高于第一分频频率ky的频率对应的频谱数据的波形编码下混信号206。作为例子,第一分频频率ky是1.1kHz。
根据一些实施例,波形编码下混信号206包含与第一分频频率ky和第二分频频率kx之间的频率对应的频谱数据。作为例子,第二分频频率kx位于5.6~8kHz的范围内。
接收的第一和第二波形编码信号208、210可以按左右形式、和差形式和/或下混互补形式被波形编码,其中,互补信号依赖于具有信号自适应性的加权参数a。波形编码下混信号206与适用于参数化立体声的下混对应,根据以上,该下混与和形式对应。但是,信号204b不具有高于第一分频频率ky的内容。在改进的离散余弦变换(MDCT)域中表示信号206、208、210中的每一个。
图3示出图1中的解码系统100的第二概念部分300。解码系统100包含混合级302。解码系统100的设计要求:对于高频重构级(将在后面更详细地描述)的输入需要为和格式。因此,混合级被配置为检查第一和第二信号波形编码信号208、210是否为和差形式。如果第一和第二信号波形编码信号208、210不对于直到第一分频频率ky的所有频率为和差形式,那么混合级302将整个波形编码信号208、210变换成和差形式。在到混合级302的输入信号208、210的频率的至少一子集为下混互补形式的情况下,需要加权参数a作为到混合级302的输入。应当注意,输入信号208、210可包含以下混互补形式编码的频率的几个子集,并且,在这种情况下,各子集不必通过使用加权参数a的相同值被编码。在这种情况下,需要几个加权参数a作为到混合级302的输入。
如上所述,混合级302总是输出输入信号204a~b的和差表示。为了能够将以MDCT域表示的信号变换成和差表示,MDCT编码信号的加窗(windowing)需要相同。这意味着,在第一和第二信号波形编码信号208、210为L/R或下混互补形式的情况下,用于信号204a的加窗和用于信号204b的加窗不能是独立的。
因此,在第一和第二信号波形编码信号208、210为和差形式的情况下,用于信号204a的加窗和用于信号204b的加窗可以是独立的。
在混合级302之后,通过应用改进的逆离散余弦变换(MDCT-1)312,和差信号变换成时域。
两个信号304a~b然后通过两个QMF组(bank)314被分析。由于下混信号306不包含较低频率,因此,不需要用Nyquist滤波器组分析信号以增大频率分辨率。这可与下混信号包含低频率的系统(例如诸如MPEG-4参数化立体声的常规的参数化立体声解码)比较。在那些系统中,为了超出由QMF组实现的频率分辨率地增大频率分辨率并由此更好地匹配例如由Bark频率标尺表示的人听觉系统的频率选择性,需要用Nyquist滤波器组分析下混信号。
来自QMF组314的输出信号304包含第一信号304a,该第一信号304a是如下信号的组合:含有与直到第一分频频率ky的频率对应的频谱数据的波形编码和信号308,和含有与在第一分频频率ky和第二分频频率kx之间的频率对应的频谱数据的波形编码下混信号306。输出信号304还包含第二信号304b,该第二信号304b含有包含与直到第一分频频率ky的频率对应的频谱数据的波形编码差信号310。信号304b不具有高于第一分频频率ky的内容。
如将在后面描述的,高频重构级416(结合图4示出)使用较低频率(即,输出信号304中的第一波形编码信号308和波形编码下混信号306)来重构高于第二分频频率kx的频率。高频重构级416对其进行操作的信号是跨较低频率的类似类型的信号,这是有利的。根据该观点,使得混合级302总是输出第一和第二信号波形编码信号208、210的和差表示是有利的,原因是这意味着输出的第一信号304a的第一波形编码信号308和波形编码下混信号306具有类似的特性。
图4示出图1中的解码系统100的第三概念部分400。高频重构(HRF)级416通过执行高频重构将第一信号输入信号304a的下混信号306扩展到高于第二分频频率kx的频率范围。根据HFR级416的配置,到HFR级416的输入是整个信号304a或者仅仅是下混信号306。通过以任何适当的方式使用可通过高频重构级416接收的高频重构参数来完成高频重构。根据一实施例,执行的高频重构包含执行频谱带复制SBR。
来自高频重构级413的输出是包含施加了SBR扩展412的下混信号406的信号404。高频重构信号404和信号304b然后被馈送到上混级420中,以产生左L和右R立体声信号412a-b。对于与低于第一分频频率ky的频率对应的频谱系数,上混包含执行第一和第二信号408、310的逆和差变换。这只意味着如上面概述的那样从中间侧表示前进到左右表示。对于与超出第一分频频率ky的频率对应的频谱系数,通过去相关器418馈送下混信号406和SBR扩展412。下混信号406和SBR扩展412及下混信号406和SBR扩展412的去相关版本然后通过使用参数化混合参数被上混,以对于高于第一分频频率ky的频率重构左和右声道416、414。可以应用在本领域中已知的任何参数化上混过程。
应当注意,在图1~4所示的编码器的以上的示例性实施例100中,需要高频重构,原因是第一接收信号204a仅包含与直到第二分频频率kx的频率对应的频谱数据。在其它的实施例中,第一接收信号包含与编码信号的所有频率对应的频谱数据。根据这种实施例,不需要高频重构。本领域技术人员理解如何在这种情况下调整示例性编码器100。
图5作为例子示出根据一实施例的编码系统500的一般化框图。
在编码系统中,要被编码的第一和第二信号540、542由接收级(未示出)接收。这些信号540、542代表左540和右542立体声音频声道的时间帧。在时域中表示信号540、542。编码系统包含变换级510。信号540、542在变换级510中变换成和差格式544、546。
编码系统还包含被配置为从变换级510接收第一和第二变换信号544、546的波形编码级514。波形编码级一般在MDCT域中操作。出于这种原因,变换信号544、546在波形编码级514之前经历MDCT变换512。在波形编码级中,第一和第二变换信号544、546分别被波形编码成第一和第二波形编码信号518、520。
对于高于第一分频频率ky的频率,波形编码级514被配置为将第一变换信号544波形编码成第一波形编码信号518的波形编码信号552。波形编码级514可被配置为在第一分频频率ky以上将第二波形编码信号520设定为零或者根本不编码这些频率。对于高于第一分频频率ky的频率,波形编码级514被配置为将第一变换信号544波形编码成第一波形编码信号518的波形编码信号552。
对于低于第一分频频率ky的频率,在波形编码级514中判定对于两个信号548、550使用什么类型的立体声编码。根据低于第一分频频率ky的变换信号544、546的特性,可对波形编码信号548、550的不同子集做出不同的判定。编码可任意地为左/右编码、中间/侧编码(即,对和差编码)、或者dmx/comp/a编码。在在波形编码级514中通过和差编码波形编码信号548、550的情况下,可分别对信号518、520使用具有独立加窗的重叠加窗变换来编码波形编码信号518、520。
示例性第一分频频率ky是1.1kHz,但该频率可根据立体声音频系统的比特传送率或者根据要被编码的音频的特性而改变。
由此,从波形编码级514输出至少两个信号518、520。在根据加权参数a,通过执行矩阵运算而在下混/互补形式中编码低于第一分频频率ky的信号的一个或几个子集或者整个频带的情况下,该参数也作为信号522被输出。在以下混/互补形式编码几个子集的情况下,各子集不必通过使用加权参数a的相同值被编码。在这种情况下,几个加权参数作为信号522被输出。
这两个或三个信号518、520、522被编码并且量化524为单个复合信号558。
为了能够在解码器侧对于高于第一分频频率的频率重构第一和第二信号540、542的频谱数据,需要从信号540、542提取参数化立体声参数536。出于这种目的,编码器500包含参数化立体声(PS)编码级530。PS编码级530一般在QMF域中操作。因此,在输入到PS编码级530之前,第一和第二信号540、542通过QMF分析级526变换到QMF域。PS编码器级530适于仅对于高于第一分频频率ky的频率提取参数化立体声参数536。
应当注意,参数化立体声参数536反映被参数化立体声编码的信号的特性。因此,它们具有频率选择性,即,参数536的各参数可与左或右输入信号540、542的频率的子集对应。PS编码级530计算参数化立体声参数536并且以均匀或非均匀的方式量化它们。如上面提到的那样,参数被频率选择地计算,这里,输入信号540、542的整个频率范围分成例如15个参数带。它们可根据人听觉系统的频率分辨率的模型(例如Bark尺度)分开。
在图5所示的编码器500的示例性实施例中,波形编码级514被配置为对于第一分频频率ky与第二分频频率kx之间的频率波形编码第一变换信号544,并且,在第二分频频率kx之上将第一波形编码信号518设定为零。可以完成这一点,以进一步减小编码器500是一部分的音频系统的需要的传送率。为了能够重构高于第二分频频率kx的信号,需要产生高频重构参数538。根据本示例性实施例,通过在下混级534处下混以QMF域表示的两个信号540、542完成这一点。然后,为了产生高频重构参数538,在高频重构HFR编码级532处,使得到的例如等于信号540、542的和的下混信号经历高频重构。如本领域技术人员公知的那样,参数538可例如包含高于第二分频频率kx的频率的频谱包络、噪声添加信息等。
示例性第二分频频率kx为5.6~8kHz,但该频率可根据立体声音频系统的比特传送率或者根据要被编码的音频的特性而改变。
编码器500还包括比特流产生级即比特流多路复用器524。根据编码器500的示例性实施例,比特流产生级被配置为接收编码且量化的信号544和两个参数信号536、538。它们通过比特流产生级562被变换成比特流560,以进一步在立体声音频系统中分发。
根据另一实施例,波形编码级514被配置为对于高于第一分频频率ky的所有频率波形编码第一变换信号544。在这种情况下,不需要HFR编码级532,因此,在比特流中不包含高频重构参数538。
图6作为例子示出根据另一实施例的编码器系统600的一般化框图。本实施例与图5所示的实施例的不同在于,通过QMF分析级526变换的信号544、546为和差格式。因此,不需要单独的下混级534,原因是和信号544已为下混信号的形式。因此,SBR编码级532只需要对和信号544操作以提取高频重构参数538。PS编码器530适于对和信号544和差信号546二者操作以提取参数化立体声参数536。
等同物、扩展、替代和混杂
本领域技术人员在研究以上的描述之后很容易想到本公开的其它实施例。尽管本说明书和附图公开了实施例和例子,但本公开不限于这些特定的例子。在不背离由所附的权利要求限定的本公开的范围的情况下,可以做出大量的修改和变化。在权利要求中出现的任何附图标记不应被理解为限制它们的范围。
另外,本领域技术人员在通过研究附图、本公开和所附的权利要求实践本公开时可以理解和实施公开的实施例的变更例。在权利要求中,词语“包括”不排除其它的要素或步骤,并且,不定冠词“一个”或“一种”不排除多个。在多个不同的从属权利要求中仅仅记载某些措施不表示这些措施的组合不能被充分利用。
以上公开的系统和方法可实现为软件、固件、硬件或它们的组合。在硬件实现中,在以上的描述中提到的功能单元之间的任务的分割未必与分成多个实体单元对应;相反,一个实体部件可具有多个功能,并且,可通过协作的几个实体部件来实现一个任务。某些部件或所有部件可实现为由数字信号处理器或微处理器执行的软件,或者实现为硬件或依应用而定的集成电路。这种软件可分布于可包含计算机存储介质(或非暂时性介质)或通信介质(或暂时性介质)的计算机可读介质上。本领域技术人员很容易理解,术语计算机存储介质包括以任何方法或技术实现的易失性和非易失性、可去除和不可去除介质,这些介质用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字万用盘(DVD)或其它光盘存储器、磁盒、磁带、磁盘存储器或其它磁存储装置或可用于存储希望的信息并且可通过计算机访问的任何其它介质。并且,本领域技术人员公知,通信介质一般在诸如载波或其它传输机制的调制数据信号中体现计算机可读指令、数据结构、程序模块或其它数据,并且包含任何信息递送介质。

Claims (9)

1.一种在音频处理系统中对编码音频比特流进行解码的方法,该方法包括:
对于第一时间段,从所述编码音频比特流提取第一波形编码信号,该第一波形编码信号包括仅与直到第一分频频率的频率对应的频谱系数;
对于第一时间段,从所述编码音频比特流提取波形编码下混信号,该波形编码下混信号包括仅与大于第一分频频率的频率的子集对应的频谱系数;
对于第一时间段,对所述波形编码下混信号执行第二分频频率以上的高频重构从而生成重构信号,其中第二分频频率大于第一分频频率,并且高频重构使用从所述编码音频比特流导出的重构参数来生成重构信号;以及
输出所述重构信号,
其中,第二分频频率依赖于所述编码音频比特流的特性。
2.根据权利要求1所述的方法,其中,第一分频频率依赖于音频处理系统的比特传输速率。
3.根据权利要求1所述的方法,其中,执行高频重构是在正交镜像滤波器QMF域中进行的。
4.根据权利要求1所述的方法,其中,重构参数包括针对重构信号的频率范围的频谱包络或噪声添加信息的表示。
5.根据权利要求1所述的方法,其中,执行高频重构包括执行频谱带复制SBR。
6.根据权利要求1所述的方法,其中,音频处理系统是执行波形解码和参数解码的混合解码器。
7.一种用于对编码音频比特流进行解码的音频解码器,该音频解码器包括:
第一解复用器,用于对于第一时间段从所述编码音频比特流提取第一波形编码信号,该第一波形编码信号包括与直到第一分频频率的频率对应的频谱系数;
第二解复用器,用于对于第一时间段从所述编码音频比特流提取波形编码下混信号,该波形编码下混信号包括与大于第一分频频率的频率的子集对应的频谱系数;
高频重构器,对于第一时间段在对所述波形编码下混信号执行第二分频频率以上的高频重构从而生成重构信号,其中第二分频频率大于第一分频频率,并且高频重构器使用从所述编码音频比特流导出的重构参数来生成重构信号;
输出端,用于输出所述重构信号,
其中,第二分频频率依赖于所述编码音频比特流的特性。
8.一种非暂时性计算机可读介质,包括指令,所述指令在被处理器执行时使得处理器执行包括以下项的操作:
对于第一时间段,从编码音频比特流提取第一波形编码信号,该第一波形编码信号包括仅与直到第一分频频率的频率对应的频谱系数;
对于第一时间段,从所述编码音频比特流提取波形编码下混信号,该波形编码下混信号包括仅与大于第一分频频率的频率的子集对应的频谱系数;
对于第一时间段,对所述波形编码下混信号执行第二分频频率以上的高频重构从而生成重构信号,其中第二分频频率大于第一分频频率,并且高频重构使用从所述编码音频比特流导出的重构参数来生成重构信号;以及
输出所述重构信号,
其中,第二分频频率依赖于所述编码音频比特流的特性。
9.一种对编码音频比特流进行解码的装置,该装置包括:
存储器,被配置成存储程序指令,及
耦接到存储器的处理器,被配置成执行程序指令,
其中程序指令在被处理器执行时使得处理器执行根据权利要求1-6中的任一项所述的方法。
CN201910434435.XA 2013-04-05 2014-04-04 立体声音频编码器和解码器 Active CN110047496B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910434435.XA CN110047496B (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361808684P 2013-04-05 2013-04-05
US61/808,684 2013-04-05
CN201480019354.9A CN105103225B (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器
PCT/EP2014/056854 WO2014161993A1 (en) 2013-04-05 2014-04-04 Stereo audio encoder and decoder
CN201910434435.XA CN110047496B (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201480019354.9A Division CN105103225B (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器

Publications (2)

Publication Number Publication Date
CN110047496A CN110047496A (zh) 2019-07-23
CN110047496B true CN110047496B (zh) 2023-08-04

Family

ID=50473291

Family Applications (6)

Application Number Title Priority Date Filing Date
CN202310871997.7A Pending CN116741188A (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器
CN202310862055.2A Pending CN116741186A (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器
CN201910434435.XA Active CN110047496B (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器
CN201910434427.5A Active CN110010140B (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器
CN202310863596.7A Pending CN116741187A (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器
CN201480019354.9A Active CN105103225B (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN202310871997.7A Pending CN116741188A (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器
CN202310862055.2A Pending CN116741186A (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN201910434427.5A Active CN110010140B (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器
CN202310863596.7A Pending CN116741187A (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器
CN201480019354.9A Active CN105103225B (zh) 2013-04-05 2014-04-04 立体声音频编码器和解码器

Country Status (9)

Country Link
US (5) US9570083B2 (zh)
EP (3) EP3528249A1 (zh)
JP (1) JP6019266B2 (zh)
KR (4) KR20160111042A (zh)
CN (6) CN116741188A (zh)
BR (4) BR112015025080B1 (zh)
HK (1) HK1214882A1 (zh)
RU (3) RU2645271C2 (zh)
WO (1) WO2014161993A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
RU2630754C2 (ru) 2013-05-24 2017-09-12 Долби Интернешнл Аб Эффективное кодирование звуковых сцен, содержащих звуковые объекты
US9666198B2 (en) 2013-05-24 2017-05-30 Dolby International Ab Reconstruction of audio scenes from a downmix
IL290275B2 (en) 2013-05-24 2023-02-01 Dolby Int Ab Encoding audio scenes
ES2643789T3 (es) 2013-05-24 2017-11-24 Dolby International Ab Codificación eficiente de escenas de audio que comprenden objetos de audio
EP3503095A1 (en) 2013-08-28 2019-06-26 Dolby Laboratories Licensing Corp. Hybrid waveform-coded and parametric-coded speech enhancement
EP3044783B1 (en) * 2013-09-12 2017-07-19 Dolby International AB Audio coding
JP6392353B2 (ja) 2013-09-12 2018-09-19 ドルビー・インターナショナル・アーベー マルチチャネル・オーディオ・コンテンツの符号化
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
EP2922055A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
WO2015150384A1 (en) 2014-04-01 2015-10-08 Dolby International Ab Efficient coding of audio scenes comprising audio objects
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
CN107004421B (zh) * 2014-10-31 2020-07-07 杜比国际公司 多通道音频信号的参数编码和解码
EP3246923A1 (en) 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
US10362423B2 (en) 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
TWI702594B (zh) * 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
CN112951252B (zh) * 2021-05-13 2021-08-03 北京百瑞互联技术有限公司 一种lc3音频码流的混音方法、装置、介质及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1357136A (zh) * 1999-06-21 2002-07-03 数字剧场系统股份有限公司 不损失译码器兼容性下低比特率音频编码系统的音质提高
CA3057366A1 (en) * 2009-03-17 2010-09-23 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
CN101939782A (zh) * 2007-08-27 2011-01-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
CA2793140A1 (en) * 2010-04-09 2011-10-13 Dolby International Ab Mdct-based complex prediction stereo coding

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5796844A (en) 1996-07-19 1998-08-18 Lexicon Multichannel active matrix sound reproduction with maximum lateral separation
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
DE60311794C5 (de) 2002-04-22 2022-11-10 Koninklijke Philips N.V. Signalsynthese
KR101016982B1 (ko) 2002-04-22 2011-02-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 디코딩 장치
US7039204B2 (en) 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
BR0311601A (pt) * 2002-07-19 2005-02-22 Nec Corp Aparelho e método decodificador de áudio e programa para habilitar computador
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
EP1683133B1 (en) * 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
ATE430360T1 (de) 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
JP4939933B2 (ja) 2004-05-19 2012-05-30 パナソニック株式会社 オーディオ信号符号化装置及びオーディオ信号復号化装置
ATE474310T1 (de) 2004-05-28 2010-07-15 Nokia Corp Mehrkanalige audio-erweiterung
DE102004042819A1 (de) * 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
PL1810281T3 (pl) * 2004-11-02 2020-07-27 Koninklijke Philips N.V. Kodowanie i dekodowanie sygnałów audio z wykorzystaniem banków filtrów o wartościach zespolonych
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
MX2007005261A (es) 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
EP1851760B1 (en) 2005-02-10 2015-10-07 Koninklijke Philips N.V. Sound synthesis
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
ATE532350T1 (de) * 2006-03-24 2011-11-15 Dolby Sweden Ab Erzeugung räumlicher heruntermischungen aus parametrischen darstellungen mehrkanaliger signale
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
WO2008035949A1 (en) 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
US8290167B2 (en) 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US20080232601A1 (en) 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
JPWO2008132850A1 (ja) 2007-04-25 2010-07-22 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
PL2137725T3 (pl) * 2007-04-26 2014-06-30 Dolby Int Ab Urządzenie i sposób do syntetyzowania sygnału wyjściowego
WO2009067741A1 (en) * 2007-11-27 2009-06-04 Acouity Pty Ltd Bandwidth compression of parametric soundfield representations for transmission and storage
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
ES2898865T3 (es) * 2008-03-20 2022-03-09 Fraunhofer Ges Forschung Aparato y método para sintetizar una representación parametrizada de una señal de audio
CN102089816B (zh) * 2008-07-11 2013-01-30 弗朗霍夫应用科学研究促进协会 音频信号合成器及音频信号编码器
EP2483887B1 (en) * 2009-09-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mpeg-saoc audio signal decoder, method for providing an upmix signal representation using mpeg-saoc decoding and computer program using a time/frequency-dependent common inter-object-correlation parameter value
EP2513899B1 (en) 2009-12-16 2018-02-14 Dolby International AB Sbr bitstream parameter downmix

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1357136A (zh) * 1999-06-21 2002-07-03 数字剧场系统股份有限公司 不损失译码器兼容性下低比特率音频编码系统的音质提高
CN101939782A (zh) * 2007-08-27 2011-01-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
CA3057366A1 (en) * 2009-03-17 2010-09-23 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
CN102388417A (zh) * 2009-03-17 2012-03-21 杜比国际公司 基于自适应地可选择的左/右或中央/侧边立体声编码和参数立体声编码的组合的高级立体声编码
CA2793140A1 (en) * 2010-04-09 2011-10-13 Dolby International Ab Mdct-based complex prediction stereo coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Enhanced aacPlus general audio codec Encoder specification Parametric Stereo part;ETSI TS 126 405;《3GPP TS 26.405 version 6.0.0 Release 6》;20050331;全文 *

Also Published As

Publication number Publication date
US20190088266A1 (en) 2019-03-21
WO2014161993A1 (en) 2014-10-09
EP4300488A3 (en) 2024-02-28
BR122021009022B1 (pt) 2022-08-16
BR112015025080A2 (pt) 2017-07-18
BR122021009025B1 (pt) 2022-08-30
CN110047496A (zh) 2019-07-23
CN116741188A (zh) 2023-09-12
CN110010140B (zh) 2023-04-18
US10163449B2 (en) 2018-12-25
US20230245667A1 (en) 2023-08-03
KR20190134821A (ko) 2019-12-04
US20200286497A1 (en) 2020-09-10
CN110010140A (zh) 2019-07-12
RU2665214C1 (ru) 2018-08-28
CN105103225A (zh) 2015-11-25
EP3528249A1 (en) 2019-08-21
CN116741187A (zh) 2023-09-12
JP6019266B2 (ja) 2016-11-02
US20160027446A1 (en) 2016-01-28
CN105103225B (zh) 2019-06-21
BR122017006701B1 (pt) 2022-03-03
US9570083B2 (en) 2017-02-14
CN116741186A (zh) 2023-09-12
JP2016519786A (ja) 2016-07-07
KR20230020553A (ko) 2023-02-10
US11631417B2 (en) 2023-04-18
RU2690885C1 (ru) 2019-06-06
HK1214882A1 (zh) 2016-08-05
RU2015147181A (ru) 2017-05-16
KR20160111042A (ko) 2016-09-23
EP2981960A1 (en) 2016-02-10
US20170133025A1 (en) 2017-05-11
BR112015025080B1 (pt) 2021-12-21
EP4300488A2 (en) 2024-01-03
RU2645271C2 (ru) 2018-02-19
EP2981960B1 (en) 2019-03-13
BR122017006701A2 (pt) 2019-09-03
KR20150126651A (ko) 2015-11-12
RU2019116192A (ru) 2020-11-27
US10600429B2 (en) 2020-03-24

Similar Documents

Publication Publication Date Title
CN110047496B (zh) 立体声音频编码器和解码器
KR102230727B1 (ko) 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
EP3279893B1 (en) Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering
EP1921606B1 (en) Energy shaping device and energy shaping method
KR101763129B1 (ko) 오디오 인코더 및 디코더
US20130226570A1 (en) Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac)
JP2021507316A (ja) オーディオ信号の高周波再構成技術の後方互換性のある統合
CN110648674B (zh) 多声道音频内容的编码
EP2690622B1 (en) Audio decoding device and audio decoding method
RU2798009C2 (ru) Стереофонический кодер и декодер аудиосигналов

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40010359

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant