CN109410966A - 音频编码器和解码器 - Google Patents

音频编码器和解码器 Download PDF

Info

Publication number
CN109410966A
CN109410966A CN201910025733.3A CN201910025733A CN109410966A CN 109410966 A CN109410966 A CN 109410966A CN 201910025733 A CN201910025733 A CN 201910025733A CN 109410966 A CN109410966 A CN 109410966A
Authority
CN
China
Prior art keywords
signal
frequency
waveform
cross
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910025733.3A
Other languages
English (en)
Other versions
CN109410966B (zh
Inventor
K·克约尔林
H·普恩哈根
H·默德
K·J·罗德恩
L·塞勒斯特罗姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Priority to CN201910025733.3A priority Critical patent/CN109410966B/zh
Publication of CN109410966A publication Critical patent/CN109410966A/zh
Application granted granted Critical
Publication of CN109410966B publication Critical patent/CN109410966B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

本发明涉及音频编码器和解码器。本公开提供了基于输入信号编码和解码多声道音频信号的方法、设备和计算机程序产品。根据本公开,使用了利用参数立体声编码和处理后的多声道音频信号的离散表示的混合方法,这对于某些比特速率可以提高编码和解码的音频的质量。

Description

音频编码器和解码器
本申请是申请号为201480011081.3、申请日为2014年4月4日、发明名称为“音频编码器和解码器”的发明专利申请的分案申请。
对相关申请的交叉引用
本申请要求于2013年4月5日提交的美国临时专利申请No.61/808680的优先权,其全部内容通过引用并入于此。
技术领域
本文的公开内容一般涉及多声道音频编码。特别地,它涉及用于包括参数编码和离散多声道编码的混合编码的编码器和解码器。
背景技术
在传统的多声道音频编码中,可能的编码方案包括离散多声道编码或者诸如MPEG环绕(MPEG Surround)之类的参数编码。所使用的方案取决于音频系统的带宽。已知参数编码方法就收听质量而言是可扩展和高效的,这使得它们在低比特速率应用中特别有吸引力。在高比特速率应用中,常常使用离散多声道编码。从带宽效率的角度看,现有的分发或处理格式以及相关联的编码技术可以被改进,尤其是在具有介于低比特速率和高比特速率之间的比特速率的应用中。
US7292901(Kroon等人)涉及混合编码方法,其中混合音频信号由至少一个下混的(downmixed)频谱成分和至少一个未混合的(unmixed)频谱成分形成。在该申请中提出的方法可以提高具有某比特速率的应用的能力,但是可以需要进一步的改进来进一步提高音频处理系统的效率。
附图说明
现在将参考附图来描述示例性实施例,其中:
图1是根据示例性实施例的解码系统的概括框图;
图2示出了图1中的解码系统的第一部分;
图3示出了图1中的解码系统的第二部分;
图4示出了图1中的解码系统的第三部分;
图5是根据示例性实施例的编码系统的概括框图;
图6是根据示例性实施例的解码系统的概括框图;
图7示出了图6中的解码系统的第三部分;以及
图8是根据示例性实施例的编码系统的概括框图。
所有附图都是示意性的,并且一般只示出了阐明本公开内容所必需的部分,而其它部分可能被略去或者仅作暗示。除非另有表明,否则在不同的图中相同的标号指代相同的部分。
具体实施方式
概述–解码器
如在本文所使用的,音频信号可以是纯音频信号、视听信号或多媒体信号中的音频部分或者这些信号中的任何一个与元数据的结合。
如在本文所使用的,多个信号的下混(downmixing)意味着例如通过形成线性组合来组合这多个信号,使得获得更少数量的信号。下混的逆操作被称为上混(upmixing),即,对更少数量的信号执行操作以获得更多数量的信号。
根据第一方面,示例性实施例提出了基于输入信号来重构多声道音频信号的方法、设备和计算机程序产品。所提出的方法、设备和计算机程序产品一般可以具有相同的特征和优点。
根据示例性实施例,提供了用于重构M个编码声道的多声道音频处理系统的解码器,其中M>2。解码器包括第一接收级,所述第一接收级被配置为接收包括与介于第一和第二交越频率(cross-over frequency)之间的频率对应的频谱系数的N个波形编码(waveform-coded)下混信号,其中1<N<M。
解码器还包括第二接收级,所述第二接收级被配置为接收包括与高至第一交越频率的频率对应的频谱系数的M个波形编码信号,这M个波形编码信号中的每一个对应于M个编码声道中相应的一个。
解码器还包括位于第二接收级下游的下混级,所述下混级被配置为把M个波形编码信号下混成包括与高至第一交越频率的频率对应的频谱系数的N个下混信号。
解码器还包括位于第一接收级和下混级下游的第一组合级,所述第一组合级被配置为把由第一接收级接收的N个下混信号中的每一个下混信号和来自下混级的N个下混信号中的对应的一个下混信号组合成N个组合下混信号。
解码器还包括位于第一组合级下游的高频重构级,所述高频重构级被配置为通过执行高频重构把来自组合级的N个组合下混信号中的每一个组合下混信号扩展到高于第二交越频率的频率范围。
解码器还包括位于高频重构级下游的上混级,所述上混级被配置为执行把来自高频重构级的N个频率扩展信号参数上混成包括与高于第一交越频率的频率对应的频谱系数的M个上混信号,这M个上混信号中的每一个上混信号对应于M个编码声道之一。
解码器还包括位于上混级和第二接收级下游的第二组合级,所述第二组合级被配置为使来自上混级的M个上混信号与由第二接收级接收的M个波形编码信号组合。
M个波形编码信号是未混入参数信号的纯波形编码信号,即,它们是被处理过的多声道音频信号的未下混离散表示。具有以这些波形编码信号表示的较低频率的优点可以是人耳对音频信号中具有低频的部分更敏感。通过以更好的质量对该部分进行编码,可以提高被解码的音频的整体印象。
具有至少两个下混信号的优点是:与只有一个下混声道的系统相比,本实施例提供了增加维度的下混信号。因此,根据本实施例,可以提供更好的解码音频质量,这可能比一个下混信号的系统所提供的比特速率益处更重要。
使用包括参数下混和离散多声道编码的混合编码的优点是:与使用传统的参数编码方法(即,带HE-AAC的MPEG环绕)相比,这可以针对某些比特速率提高解码音频信号的质量。在大约72千比特每秒(kbps)的比特速率处,传统的参数编码模型可能饱和,即,解码音频信号的质量受参数模型的缺点限制,而非受用于编码的比特不足限制。因此,对于从大约72kbps开始的比特速率,在离散地波形编码较低频率上使用比特可能更有利。同时,使用参数下混和离散多声道编码的混合方法是:与使用其中所有比特都用于波形编码较低频率的方法以及对剩余频率使用谱带复制(spectral band replication,SBR)相比,这可以针对例如128kbps或以下的某些比特速率提高解码音频的质量。
具有只包括与介于第一交越频率和第二交越频率之间的频率对应的频谱数据的N个波形编码下混信号的优点是:音频信号处理系统所需的比特传输速率可以降低。可替代地,通过具有带通滤波的下混信号而节省的比特可以用于波形编码较低的频率,例如,用于那些频率的采样频率可以更高或者第一交越频率可以增大。
如上面所提到的,由于人耳对音频信号中具有低频的部分更敏感,因此,作为音频信号中具有高于第二交越频率的频率的部分,高频可以在不降低解码音频信号的感知音频质量的情况下通过高频重构来重建。
本实施例的另一优点可以是:由于在上混级中执行的参数上混只对与高于第一交越频率的频率对应的频谱系数操作,因此降低了上混的复杂度。
根据另一实施例,在第一组合级中执行的所述组合是在频域中执行的,其中包括与介于第一和第二交越频率之间的频率对应的频谱系数的N个波形编码下混信号中的每一个和包括与高至第一交越频率的频率对应的频谱系数的N个下混信号中的对应下混信号组合成N个组合下混。
本实施例的优点可以是:M个波形编码信号和N个波形编码下混信号可以由波形编码器分别使用为所述M个的波形编码的信号和N个波形编码的下混信号独立加窗(independent windowing)的重叠窗变换(overlapping windowed transforms)来编码,并且仍然能够被解码器解码。
根据另一实施例,在高频重构级中把N个组合下混信号中的每一个扩展到第二交越频率以上的频率范围是在频域中执行的。
根据另一实施例,在第二组合步骤中执行的组合,即,包括与高于第一交越频率的频率对应的频谱系数的M个上混信号和包括与高至第一交越频率的频率对应的频谱系数的M个波形编码信号的组合,是在频域中执行的。如上面所提到的,在QMF域中组合信号的优点是:可以使用用来对MDCT中的信号进行编码的重叠窗变换的独立加窗。
根据另一实施例,在上混级执行的N个频率扩展的组合下混信号到M个上混信号的参数上混是在频域中执行的。
根据又一实施例,把M个波形编码信号下混成包括与高至第一交越频率的频率对应的频谱系数的N个下混信号是在频域中执行的。
根据实施例,频域是正交镜像滤波器(QMF)域。
根据另一实施例,在下混级中执行的下混是在时域中执行的,其中M个波形编码信号被下混成包括与高至第一交越频率的频率对应的频谱系数的N个下混信号。
根据又一实施例,第一交越频率取决于多声道音频处理系统的比特传输速率。这会导致可用带宽被用来提高解码音频信号的质量,因为音频信号中具有低于第一交越频率的频率的部分是纯波形编码的。
根据另一实施例,通过在高频重构级执行高频重构把N个组合下混信号中的每一个扩展到第二交越频率以上的频率范围是使用高频重构参数来执行的。高频重构参数可以例如在接收级由解码器接收,然后被发送到高频重构级。高频重构例如可以包括执行谱带复制(SBR)。
根据另一实施例,上混级中的参数上混是利用上混参数进行的。上混参数例如在接收级由编码器接收,并被发送到上混级。N个频率扩展的组合下混信号的去相关版本被生成,并且N个频率扩展的组合下混信号和N个频率扩展的组合下混信号的去相关版本经受矩阵运算。矩阵运算的参数由上混参数给出。
根据另一种实施例,在第一接收级中接收到的N个波形编码下混信号和在第二接收级中接收到的M个波形编码信号分别使用为所述N个波形编码下混信号和M个波形编码信号独立加窗的重叠窗变换来编码。
这样做的优点可以是:这允许提高编码质量,从而允许提高被解码的多声道音频信号的质量。例如,如果在某个时间点在较高频带中检测到瞬变,则波形编码器可以用较短的窗序列来编码该特定时间帧,而对于较低的频带,可以保持默认的窗序列。
根据实施例,解码器可以包括第三接收级,所述第三接收级被配置为接收包括与高于第一交越频率的频率的子集对应的频谱系数的另一波形编码信号。解码器还可以包括位于上混级下游的交织级。交织级可以被配置为使该另一波形编码信号与M个上混信号之一交织。第三接收级还可以被配置为接收多个其它波形编码信号,并且交织级还可以被配置为使这多个其它波形编码信号与多个M上混信号交织。
其优点在于:高于第一交越频率的频率范围中难以根据下混信号来参数重构的某些部分可以以波形编码的形式提供,以便与经参数重构的上混信号交织。
在一个示例性实施例中,所述交织是通过使该另一波形编码信号与M个上混信号之一相加来执行的。根据另一种示例性实施例,使该另一波形编码信号与M个上混信号之一交织的步骤包括:在高于第一交越频率的频率的与该另一波形编码信号的频谱系数对应的子集中用该另一波形编码信号替换M个上混信号之一。
根据示例性实施例,解码器还可以被配置为例如通过第三接收级接收控制信号。控制信号可以指示如何使该另一波形编码信号与M个上混信号之一交织,其中使这另一波形编码信号与M个上混信号之一交织的步骤基于该控制信号。具体而言,控制信号可以指示该另一波形编码信号要与M个上混信号之一交织的频率范围和时间范围,诸如QMF域中的一个或多个时间/频率块。相应地,交织可以按时间和频率在一个声道内发生。
这样做的优点是:可以选择不遭受用来编码波形编码信号的重叠窗变换的混叠或启动/渐隐问题的时间范围和频率范围。
概述–编码器
根据第二方面,示例性实施例提出了基于输入信号来对多声道音频信号进行编码的方法、设备和计算机程序产品。
所提出的方法、设备和计算机程序产品一般可以具有相同的特征和优点。
关于如在以上对解码器的概述中介绍的特征和设置的优点对于用于编码器的对应特征和设置一般可以有效。
根据示例性实施例,提供了用于编码M个声道的多声道音频处理系统的编码器,其中M>2。
编码器包括被配置为接收与要编码的M个声道对应的M个信号的接收级。
编码器还包括第一波形编码级,所述第一波形编码级被配置为接收来自接收级的M个信号,并通过针对与高至第一交越频率的频率对应的频率范围单独地波形编码这M个信号来生成M个波形编码信号,由此这M个波形编码信号包括与高至第一交越频率的频率对应的频谱系数。
编码器还包括下混级,所述下混级被配置为接收来自接收级的M个信号,并把这M个信号下混成N个下混信号,其中1<N<M。
编码器还包括高频重构编码级,所述高频重构编码级被配置为接收来自下混级的N个下混信号,并使这N个下混信号经受高频重构编码,由此高频重构编码级被配置为提取使得能够在第二交越频率以上对N个下混信号进行高频重构的高频重构参数。
编码器还包括参数编码级,所述参数编码级被配置为接收来自接收级的M个信号和来自下混级的N个下混信号,并针对与高于第一交越频率的频率对应的频率范围使这M个信号接受参数编码,由此参数编码级被配置为提取使得能够针对第一交越频率以上的频率范围把N个下混信号上混成与M个声道对应的M个重构信号的上混参数。
编码器还包括第二波形编码级,所述第二波形编码级被配置为接收来自下混级的N个下混信号,并通过针对与介于第一和第二交越频率之间的频率对应的频率范围,波形编码这N个下混信号,来生成N个波形编码下混信号,由此这N个波形编码下混信号包括与介于第一交越频率和第二交越频率之间的频率对应的频谱系数。
根据实施例,在高频重构编码级中使N个下混信号经受高频重构编码是在频域中执行的,优选地是正交镜像滤波器(QMF)域。
根据另一实施例,在参数编码级中使M个信号经受参数编码是在频域中执行的,优选地是在正交镜像滤波器(QMF)域中。
根据又一实施例,在第一波形编码级中通过单独地波形编码M个信号来生成M个波形编码信号包括对这M个信号应用重叠窗变换,其中对于这M个信号中的至少两个使用不同的重叠窗序列。
根据实施例,编码器还可以包括第三波形编码级,所述第三波形编码级被配置为通过针对与第一交越频率以上的频率范围的子集对应的频率范围,波形编码这M个信号之一,来生成另一波形编码信号的。
根据实施例,编码器可以包括控制信号生成级。控制信号生成级被配置为生成指示在解码器中如何使所述另一波形编码信号与M个信号之一的参数重构交织的控制信号。例如,控制信号可以指示该另一波形编码信号与M个信号之一交织的频率范围和时间范围。
示例性实施例
图1是多声道音频处理系统中用于重构M个编码声道的解码器100的概括框图。解码器100包括三个概念性部分200、300、400,将结合下面的图2-4来更详细地说明这个概念性部分。在第一概念性部分200中,编码器接收代表要解码的多声道音频信号的M个波形编码信号和N个波形编码下混信号,其中1<N<M。在所例示的例子中,N被设置为2。在第二概念性部分300中,M个波形编码信号被下混,并与N个波形编码下混信号组合。然后,对组合的下混信号执行高频重构(HFR)。在第三概念性部分400中,高频重构信号被上混,并且将M个波形编码信号与上混信号组合,以重构M个编码声道。
在结合图2-4描述的示例性实施例中,描述了被编码的5.1环绕声的重构。注意,在所述实施例中或者在附图中未提到低频效果信号。这并非意味着忽略了任何低频效果。以本领域技术人员周知的任何合适的方式,将低频效果(Lfe)添加到重构的5个声道。还要注意,所描述的解码器同样较好地适于其它类型的编码环绕声,诸如7.1或9.1环绕声。
图2示出了图1中的解码器100的第一概念性部分200。解码器包括两个接收级212、214。在第一接收级212中,比特流202被解码和解量化成两个波形编码下混信号208a-b。这两个波形编码下混信号208a-b中的每一个都包括与介于第一交越频率ky和第二交越频率kx之间的频率对应的频谱系数。
在第二接收级212中,比特流202被解码和解量化成五个波形编码下混信号210a-e。这五个波形编码下混信号208a-e中的每一个都包括与高至第一交越频率kx的频率对应的频谱系数。
以举例的方式,信号210a-e包括两个声道对元素和一个用于中央的单声道元素。声道对元素例如可以是左前和左环绕声信号的组合以及右前和右环绕声信号的组合。另一个例子是左前和右前信号的组合以及左环绕声和右环绕声信号的组合。这些声道对元素例如可以按和差格式(sum-and-difference format)来编码。所有五个信号210a-e都可以通过使用具有独立加窗的重叠窗变换来编码,并且仍然能够被解码器解码。这可以允许提高编码质量并因此允许提高解码信号的质量。
以举例的方式,第一交越频率ky是1.1kHz。以举例的方式,第二交越频率kx在5.6-8kHz的范围内。应当注意,第一交越频率ky可以变化,甚至基于逐个信号,即,编码器可以检测到特定输出信号中的信号分量可能未被立体声下混信号208a-b如实地再现,并且可以针对该特定的时刻增加相关波形编码信号(即,210a-e)的带宽,即,第一交越频率ky,以便对信号分量进行合适的波形编码。
如随后将在本说明书中描述的,编码器100的剩下的级典型地在正交镜像滤波器(QMF)域中操作。出于这个原因,通过应用逆MDCT 216,由第一和第二接收级212、214以修正离散余弦变换(MDCT)形式接收的信号208a-b、210a-e中的每一个被变换到时域。然后,通过应用QMF变换218,每个信号被变换回到频域。
在图3中,五个波形编码信号210在下混级308被下混成包括与高至第一交越频率ky的频率对应的频谱系数的两个下混信号310、312。可以通过使用与图2中所示的在编码器中用来创建两个下混信号208a-b的相同下混方案,对低通多声道信号210a-e执行下混,来形成这些下混信号310、312。
然后,这两个新的下混信号310、312在第一组合级320、322中与对应的下混信号208a-b组合,以形成组合下混信号302a-b。因此,组合下混信号302a-b中的每一个包括源自下混信号310、312的、与高至第一交越频率ky的频率对应的频谱系数以及源自在第一接收级212中接收的两个波形编码下混信号208a-b的、与介于第一交越频率ky和第二交越频率kx之间的频率对应的频谱系数(图2中所示)。
编码器还包括高频重构(HFR)级314。HFR级被配置为通过执行高频重构把来自组合级的两个组合下混信号302a-b中的每一个扩展到第二交越频率kx以上的频率范围。根据一些实施例,所执行的高频重构可以包括执行谱带复制(SBR)。可以通过以任何适当方式使用由HFR级314接收的高频重构参数来进行高频重构。
来自高频重构级314的输出是包括下混信号208a-b和所应用的HFR扩展316、318的两个信号304a-b。如上所述,HFR级314基于在与两个下混信号208a-b组合的、来自第二接收级214(图2中所示的)的输入信号210a-e中存在的频率来执行高频重构。简而言之,HFR范围316、318包括来自下混信号310、312的频谱系数中的已被拷贝至HFR范围316、318的的部分。因此,五个波形编码信号210a-e的部分将在来自HFR级314的输出304的HFR范围316、318中出现。
应当注意,在高频重构级314之前的下混级308处的下混和第一组合级320、322中的组合可以在时域中进行,即,在通过应用(图2中所示的)逆修正离散余弦变换(MDCT)216将每个信号变换到时域之后进行。但是,假定波形编码信号210a-e和波形编码下混信号208a-b可以由波形编码器使用具有独立加窗的重叠窗变换来编码,信号210a-e和208a-b可能无法在时域中无缝地组合。因此,如果至少第一组合级320、322中的组合在QMF域中进行,则获得受到更好控制的场景。
图4示出了编码器100的第三概念性部分400,也是最后一个。来自HFR级314的输出304构成上混级402的输入。上混级402通过对频率扩展的信号304a-e执行参数上混来创建五个信号输出404a-e。对于高于第一交越频率ky的频率,五个上混信号404a-e中的每一个对应于经编码的5.1环绕声中的五个编码声道之一。根据示例性的参数上混过程,上混级402首先接收参数混合参数。上混级402还生成两个频率扩展的组合下混信号304a-b的去相关版本。上混级402还使两个频率扩展的组合下混信号304a-b和两个频率扩展的组合下混信号304a-b的去相关版本接受矩阵运算,其中矩阵运算的参数由上混参数给出。可替代地,可以应用本领域中已知的任何其它参数上混过程。可应用的参数上混过程被描述在例如“MPEG Surround—The ISO/MPEG Standard for Efficient and CompatibleMultichannel Audio Coding”(Herre等人,Journal of the Audio EngineeringSociety,Vol.56,No.11,2008年11月)中。
因此,来自上混级402的输出404a-e不包括低于第一交越频率ky的频率。与高至第一交越频率ky的频率对应的剩余频谱系数存在于五个波形编码信号210a-e中,这五个波形编码信号210a-e已经被延迟级412延迟以匹配上混信号404的定时。
编码器100还包括第二组合级416、418。第二组合级416、418被配置为组合五个上混信号404a-e与由第二接收级214(图2中所示)接收的五个波形编码信号210a-e。
注意,任何存在的Lfe信号都可以作为单独的信号被添加到所得到的组合信号422。然后,通过应用逆QMF变换420,将信号422中的每一个变换到时域。因此,来自逆QMF变换414的输出是完全解码的5.1声道音频信号。
图6示出了作为图1的解码系统100的变型的解码系统100’。解码系统100’具有与图1的概念性部分100、200、300对应的概念性部分200’、300’和400’。图6的解码系统100’与图1的解码系统之间的差别在于:在概念性部分200’中存在第三接收级616,并且在第三概念性部分400’中存在交织级714。
第三接收级616被配置为接收另一波形编码信号。这另一波形编码信号包括与高于第一交越频率的频率的子集对应的频谱系数。可以通过应用逆MDCT 216将该另一波形编码信号变换到时域。然后,可以通过应用QMF变换218将其变换回到频域。
应当理解,该另一波形编码信号可以被接收为单独的信号。但是,该另一波形编码信号还可以构成五个波形编码信号210a-e中的一个或多个的一部分。换句话说,该另一波形编码信号可以例如使用相同的MCDT变换来与五个波形编码信号210a-e中的一个或多个联合编码。如果是这样,则第三接收级616对应于第二接收级,即,该另一波形编码信号是经由第二接收级214与五个波形编码信号210a-e一起接收的。
图7更详细地示出了图6的解码器100’的第三概念性部分300’。除了高频扩展的下混信号304a-b和五个波形编码信号210a-e之外,另一波形编码信号710也被输入到第三概念性部分400’。在所例示的例子中,该另一波形编码信号710对应于五个声道中的第三个声道。该另一波形编码信号710还包括与从第一交越频率ky开始的频率间隔对应的频谱系数。但是,高于第一交越频率的频率范围中的被该另一波形编码信号710覆盖的子集的形式在不同的实施例中当然可以变化。还要注意,可以接收多个波形编码信号710a-e,其中不同的波形编码信号可以对应于不同的输出声道。被这多个其它波形编码信号710a-e覆盖的频率范围的子集可以在这多个其它波形编码信号710a-e的不同信号之间有所变化。
该另一波形编码信号710可以被延迟级712延迟,以匹配从上混级402输出的上混信号404的定时。然后,上混信号404和该另一波形编码信号710被输入到交织级714。交织级714进行交织,即,组合上混信号404和该另一波形编码信号710,以生成交织信号704。在本示例中,交织级714因此使第三上混信号404c和该另一波形编码信号710交织。可以通过把两个信号相加到一起来执行交织。但是,典型地,通过在信号重叠的频率范围和时间范围内用该另一波形编码信号710替换上混信号404来执行交织。
然后,交织信号704被输入到第二组合级416、418,在那里它与波形编码信号201a-e组合,从而以与参考图4所描述的相同方式生成输出信号722。要注意,交织级714和第二组合级416、418的次序可以颠倒,使得组合在交织之前执行。
此外,在该另一波形编码信号710构成五个波形编码信号210a-e中的一个或多个的一部分的情况下,第二组合级416、418和交织级714可以结合为单个级。具体而言,这种结合的级将针对高至第一交越频率ky的频率使用五个波形编码信号210a-e的频谱成分。对于高于第一交越频率的频率,结合的级将使用与另一波形编码信号710交织的上混信号404。
交织级714可以在控制信号的控制下操作。出于此目的,解码器100’可以例如经由第三接收级616接收控制信号,该控制信号指示如何交织该另一波形编码信号与M个上混信号之一。例如,控制信号可以指示该另一波形编码信号710与上混信号404之一要交织的频率范围和时间范围。例如,可以按照要进行交织的时间/频率块来表示频率范围和时间范围。时间/频率块可以是关于发生交织的QMF域的时间/频率网格的时间/频率块。
控制信号可以使用向量,诸如二进制向量,来指示要进行交织的时间/频率块。具体而言,可以存在关于频率方向的第一向量,以指示要执行交织的频率。例如可以通过针对第一向量中的对应频率间隔指示逻辑1来作出该指示。还可以存在关于时间方向的第二向量,以指示要执行交织的时间间隔。例如可以通过针对第二向量中对应时间间隔指示逻辑1来作出该指示。出于此目的,时间帧典型地被划分成多个时隙,使得可以逐子帧地作出时间指示。通过使第一向量和第二向量相交,可以构造时间/频率矩阵。例如,时间/频率矩阵可以是这样的二进制矩阵:对于第一和第二向量指示逻辑1的每个时间/频率块,该二进制矩阵包括逻辑1。然后,交织级714可以在执行交织时使用时间/频率矩阵,例如使得对于在时间/频率矩阵中诸如由逻辑1指示的时间/频率块,上混信号704中的一个或多个被所述另一波形编码信号710替换。
注意,向量可以使用除二进制方案之外的其它方案来指示要进行交织的时间/频率块。例如,向量可以借助于诸如0之类的第一值来指示不进行交织,并且通过第二值来指示关于被第二值标识的某个声道要进行交织。
图5以举例的方式示出了根据实施例的用于编码M个声道的多声道音频处理系统的编码系统500的概括框图。
在图5所描述的示例性实施例中,描述了5.1环绕声的编码。因此,在所例示的例子中,M被设置为五。注意,在所述实施例中或者在附图中没有提到低频效果信号。这并非意味着忽略了任何低频效果。低频效果(Lfe)以本领域技术人员周知的任何合适方式被添加到比特流552。还要注意,所描述的编码器同样良好地适于编码其它类型的环绕声,诸如7.1或9.1环绕声。在编码器500中,五个信号502、504在接收级(未示出)被接收。编码器500包括第一波形编码级506,第一波形编码级506被配置为从接收级接收五个信号502、504并且通过逐个地波形编码这五个信号502、504来生成五个波形编码信号518。波形编码级506例如可以使五个接收信号502、504中的每一个接受MDCT变换。如关于解码器所讨论的,编码器可以选择使用具有独立加窗的MDCT变换来编码五个信号502、504中的每一个。这可以允许提高编码质量并因此允许提高解码信号的质量。
对于与高至第一交越频率的频率对应的频率范围,五个波形编码信号518被波形编码。因此,五个波形编码信号518包括与高至第一交越频率的频率对应的频谱系数。这可以通过让五个波形编码信号518中的每一个经受低通滤波器来实现。然后,五个波形编码信号518根据心理声学模型被量化520。心理模型被配置为尽可能准确,考虑多声道音频处理系统中的可用比特速率,当在系统的解码器侧被解码时再现如收听者感知的编码信号。
如以上所讨论的,编码器500执行包括离散多声道编码和参数编码的混合编码。如上所述,对于高至第一交越频率的频率,在波形编码级506中对输入信号502、504中的每一个执行离散多声道编码。对于高于第一交越频率的频率,执行参数编码,以便能够在解码器侧根据N个下混信号重构五个输入信号502、504。在图5所例示的例子中,N被设置为2。五个输入信号502、504的下混在下混级534中执行。下混级534有利地在QMF域中操作。因此,在被输入到下混级534之前,五个信号502、504由QMF分析级526变换到QMF域。下混级对五个信号502、504执行线性下混操作,并输出两个下混信号544、546。
在这两个下混信号544、546通过经受逆QMF变换554而被变换回时域之后,它们由第二波形编码级508接收。第二波形编码级508通过针对与介于第一和第二交越频率之间的频率对应的频率范围来波形编码两个下混信号544、546而生成两个波形编码下混信号。波形编码级508可以例如使两个下混信号中的每一个经受MDCT变换。因此,这两个波形编码下混信号包括与介于第一交越频率和第二交越频率之间的频率对应的频谱系数。然后,根据心理声学模型,这两个波形编码下混信号被量化522。
为了能够在解码器侧重构第二交越频率以上的频率,从两个下混信号544、546中提取高频重构(HFR)参数538。这些参数在HFR编码级532提取。
为了能够在解码器侧根据两个下混信号544、546重构五个信号,由参数编码级530接收五个输入信号502、504。对于与高于第一交越频率的频率对于的频率范围,这五个信号502、504经受参数编码。然后,参数编码级530被配置为提取上混参数536,该上混参数536使得对于第一交越频率以上的频率范围,能够把两个下混信号544、546上混成对应于五个输入信号502、504(即,经编码的5.1环绕声中的五个声道)的五个重构信号。注意,只针对第一交越频率以上的频率范围提取上混参数536。这可以降低参数编码级530的复杂度,以及对应参数数据的比特速率。
注意,下混534可以在时域中实现。在这种情况下,QMF分析级526应当位于下混级534的下游、HFR编码级532之前,因为HFR编码级532典型地在QMF域中操作。在这种情况下,逆QMF级554可以省略。
编码器500还包括比特流生成级(即,比特流多路复用器)524。根据编码器500的示例性实施例,比特流生成级被配置为接收五个经编码和量化的信号548、两个参数信号536、538以及两个经编码和量化的下混信号550。这些信号被比特流生成级524转换为比特流552,以进一步在多声道音频系统中分发。
在所描述的多声道音频系统中,例如当在互联网上流传输音频时,常常存在最大可用比特速率。由于输入信号502、504的每个时间帧的特性不同,因此在五个波形编码信号548和两个下混波形编码信号550之间不能使用完全相同的比特分配。此外,每个个体信号548和550可能需要更多或更少的分配的比特,使得信号可以根据心理声学模型来重构。根据示例性实施例,第一和第二波形编码级506、508共享公共的比特池(bit reservoir)。取决于待编码的信号的特性以及当前的心理声学模型,每个编码帧可用的比特首先在第一和第二波形编码级506、508之间分配。然后如上所述,比特在个体信号548、550之间分配。在分配可用的比特时,用于高频重构参数538和上混参数536的比特数当然要被考虑。关于在特定时间帧分配的比特数,要注意调整用于第一和第二波形编码级506、508的心理声学模型,以在第一交越频率周围在感知上平滑地转变。
图8示出了编码系统800的可替代实施例。图8的编码系统800与图5的编码系统500之间的差别在于编码器800被布置为通过针对与第一交越频率以上的频率范围的子集对应的频率范围,波形编码输入信号502、504中的一个或多个,来生成另一波形编码信号。
出于此目的,编码器800包括交织检测级802。交织检测级802被配置为识别输入信号502、504中在由参数编码级530和高频重构编码级532编码时通过参数重构未被良好重构的部分。例如,交织检测级802可以将输入信号502、504与由参数编码级530和高频重构编码级532定义的输入信号502、504的参数重构相比较。基于该比较,交织检测级802可以标识第一交越频率以上的频率范围中的要被波形编码的子集804。交织检测级802还可以标识其间第一交越频率以上的频率范围的已标识出的子集804要被波形编码的时间范围。所标识出的频率和时间子集804、806可以被输入到第一波形编码级506。基于所接收的频率和时间子集804和806,第一波形编码级506通过针对由子集804、806标识出的时间和频率范围,波形编码输入信号502、504中的一个或多个来生成另一波形编码信号808。然后,该另一波形编码信号808可以被级520编码和量化,并被添加到比特流846。
交织检测级802还可以包括控制信号生成级。控制信号生成级被配置为生成控制信号810,该控制信号810指示在解码器中如何使所述另一波形编码信号与输入信号502、504之一的参数重构交织。例如,如参考图7所描述的,控制信号可以指示该另一波形编码信号要与参数重构交织的频率范围和时间范围。控制信号可以被添加到比特流846。
等效、扩展、替代及其他
在研究以上描述之后,对于本领域技术人员来说,本公开内容的更多实施例将变得显然。虽然本说明书和附图公开了实施例和例子,但是本公开内容不限于这些具体的例子。在不脱离由所附权利要求书限定的本公开内容的范围的情况下,可以作出各种变型和变化。在权利要求中出现的任何附图标记都不应当被理解为对其范围的限制。
另外,根据对附图、公开内容和所附权利要求的研究,本领域技术人员在实践本公开内容时可以理解和实现所公开的实施例的变化。在权利要求中,词语“包括”不排除其它要素或步骤,并且不定冠词“一个”不排除多个。某些措施在相互不同的从属权利要求中陈述的单纯事实并非指示这些措施的组合不能用来获益。
以上公开的系统和方法可以被实现为软件、固件、硬件或者其组合。在硬件实现中,在以上描述中提到的功能单元之间任务的划分不一定对应于物理单元的划分;相反,一个物理部件可以具有多个功能,并且一个任务可以由几个物理部件合作实行。某些部件或所有部件可以被实现为由数字信号处理器或微处理器执行的软件,或者被实现为硬件或者被实现为专用集成电路。这种软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非临时性介质)和通信介质(或临时介质)。如本领域技术人员周知的,术语“计算机存储介质”包括以任何方法或技术实现的易失性和非易失性、可移除和不可移除的介质,以便存储诸如计算机可读指令、数据结构、程序模块或其它数据之类的信息。计算机存储介质包括但不限于:RAM、ROM、EEPROM、闪存存储器或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光学盘储存器、盒式磁带、磁带、磁盘储存器或其它磁性存储设备、或者可用来存储期望的信息并且可以被计算机访问的任何其它介质。另外,本领域技术人员周知:通信介质典型地在诸如载波或其它传输机制之类的调制数据信号中包含计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传送介质。

Claims (14)

1.一种用于在音频处理系统中对编码音频比特流的时间帧进行解码的方法,该方法包括:
针对时间帧从所述编码音频比特流中提取第一波形编码信号,该第一波形编码信号包括与高达第一交越频率的频率对应的频谱系数;
针对所述时间帧在重构范围中执行第二交越频率以上的参数解码以生成重构信号,其中,所述第二交越频率高于所述第一交越频率并且所述参数解码使用从所述编码比特流导出的重构参数来生成重构信号;
针对所述时间帧从所述编码音频比特流中提取第二波形编码信号,该第二波形编码信号包括与高于所述第一交越频率的频率的子集对应的频谱系数;以及
针对所述时间帧使所述第二波形编码信号与所述重构信号交织以产生交织信号。
2.如权利要求1所述的方法,其中,所述第一交越频率取决于所述音频处理系统的比特传输速率。
3.如权利要求1所述的方法,其中,所述交织包括:(i)使所述第二波形编码信号与所述重构信号相加,(ii)使所述第二波形编码信号与所述重构信号组合,或者(iii)用所述第二波形编码信号替换所述重构信号。
4.如权利要求1所述的方法,其中,执行所述第二交越频率以上的参数解码以生成重构信号是在频域中执行的。
5.如权利要求1所述的方法,其中,执行参数解码包括以下任意一个:(i)使用混合参数的参数混合,或(ii)使用高频重构参数的高频重构。
6.如权利要求1所述的方法,其中,执行参数解码包括执行谱带复制SBR。
7.如权利要求1所述的方法,还包括接收在进行交织以产生交织信号期间使用的控制信号。
8.如权利要求7所述的方法,其中,所述控制信号通过指定所述交织的频率范围或时间范围来指示如何使所述第二波形编码信号与所述重构信号交织。
9.如权利要求7所述的方法,其中,所述控制信号的第一值指示针对相应频率区域执行交织。
10.如权利要求1所述的方法,其中,所述音频处理系统是执行波形解码和参数解码的混合解码器。
11.如权利要求1所述的方法,其中,所述第一波形编码信号和第二波形编码信号使用心理声学模型来共享公共的比特池。
12.如权利要求1所述的方法,其中,所述第一波形编码信号和第二波形编码信号是在频域中表示音频信号的波形的信号。
13.一种用于对编码音频比特流的时间帧进行解码的音频解码器,该音频解码器包括:
第一解复用器,用于针对时间帧从所述编码音频比特流中提取第一波形编码信号,该第一波形编码信号包括与高达第一交越频率的频率对应的频谱系数;
参数解码器,针对所述时间帧在重构范围中在第二交越频率以上操作,其中,所述第二交越频率高于所述第一交越频率并且所述参数解码使用从所述编码比特流导出的重构参数来生成重构信号;
第二解复用器,用于针对所述时间帧从所述编码音频比特流中提取第二波形编码信号,该第二波形编码信号包括与高于所述第一交越频率的频率的子集对应的频谱系数;以及
交织器,用于针对所述时间帧使所述第二波形编码信号与所述重构信号交织以产生交织信号。
14.一种包括指令的非临时性计算机可读介质,所述指令当被处理器运行时执行如权利要求1所述的方法。
CN201910025733.3A 2013-04-05 2014-04-04 音频编码器和解码器 Active CN109410966B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910025733.3A CN109410966B (zh) 2013-04-05 2014-04-04 音频编码器和解码器

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361808680P 2013-04-05 2013-04-05
US61/808,680 2013-04-05
CN201480011081.3A CN105308680B (zh) 2013-04-05 2014-04-04 音频编码器和解码器
CN201910025733.3A CN109410966B (zh) 2013-04-05 2014-04-04 音频编码器和解码器
PCT/EP2014/056852 WO2014161992A1 (en) 2013-04-05 2014-04-04 Audio encoder and decoder

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201480011081.3A Division CN105308680B (zh) 2013-04-05 2014-04-04 音频编码器和解码器

Publications (2)

Publication Number Publication Date
CN109410966A true CN109410966A (zh) 2019-03-01
CN109410966B CN109410966B (zh) 2023-08-29

Family

ID=50439393

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201480011081.3A Active CN105308680B (zh) 2013-04-05 2014-04-04 音频编码器和解码器
CN201910025733.3A Active CN109410966B (zh) 2013-04-05 2014-04-04 音频编码器和解码器

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201480011081.3A Active CN105308680B (zh) 2013-04-05 2014-04-04 音频编码器和解码器

Country Status (21)

Country Link
US (6) US9489957B2 (zh)
EP (3) EP3627506A1 (zh)
JP (7) JP6031201B2 (zh)
KR (7) KR20220044609A (zh)
CN (2) CN105308680B (zh)
AU (1) AU2014247001B2 (zh)
BR (7) BR122020017065B1 (zh)
CA (1) CA2900743C (zh)
DK (1) DK2954519T3 (zh)
ES (2) ES2748939T3 (zh)
HK (1) HK1213080A1 (zh)
HU (1) HUE031660T2 (zh)
IL (1) IL240117A0 (zh)
MX (4) MX347936B (zh)
MY (3) MY196084A (zh)
PL (1) PL2954519T3 (zh)
RU (2) RU2641265C1 (zh)
SG (1) SG11201506139YA (zh)
TW (1) TWI546799B (zh)
UA (1) UA113117C2 (zh)
WO (1) WO2014161992A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
JP6273003B2 (ja) 2013-07-18 2018-01-31 ビーエーエスエフ ソシエタス・ヨーロピアBasf Se ポリアリーレンエーテル溶液の分割
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
EP3285257A4 (en) 2015-06-17 2018-03-07 Samsung Electronics Co., Ltd. Method and device for processing internal channels for low complexity format conversion
PL3503097T3 (pl) 2016-01-22 2024-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie oraz sposób do enkodowania lub dekodowania sygnału wielokanałowego z wykorzystaniem ponownego próbkowania w dziedzinie widmowej
US10146500B2 (en) * 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
US10339947B2 (en) 2017-03-22 2019-07-02 Immersion Networks, Inc. System and method for processing audio data
EP3588495A1 (en) 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US20070140499A1 (en) * 2004-03-01 2007-06-21 Dolby Laboratories Licensing Corporation Multichannel audio coding
CN101371447A (zh) * 2006-01-20 2009-02-18 微软公司 使用扩展带频率编码的复变换信道编码
CN101518083A (zh) * 2006-09-22 2009-08-26 三星电子株式会社 通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法、介质和系统
WO2010003545A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. An apparatus and a method for decoding an encoded audio signal
WO2010105926A2 (en) * 2009-03-17 2010-09-23 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
WO2011048792A1 (ja) * 2009-10-21 2011-04-28 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
WO2011048117A1 (en) * 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
CN102884570A (zh) * 2010-04-09 2013-01-16 杜比国际公司 基于mdct的复数预测立体声编码

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5459B2 (zh) 1973-12-20 1979-01-05
IT1044736B (it) * 1975-04-23 1980-04-21 Cselt Centro Studi Lab Telecom Sistema numerico per la trasmissione dei canali di due fasci modulati a impulsi codificati alla velocita di un solo fascio
JP2000122679A (ja) * 1998-10-15 2000-04-28 Sony Corp 音声帯域拡張方法及び装置、音声合成方法及び装置
JP3677185B2 (ja) * 1999-11-29 2005-07-27 株式会社東芝 符号分割多重伝送方式と送信装置及び受信装置
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030220800A1 (en) 2002-05-21 2003-11-27 Budnikov Dmitry N. Coding multichannel audio signals
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
WO2005098824A1 (en) 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
KR101183857B1 (ko) 2004-06-21 2012-09-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치
CN1981326B (zh) * 2004-07-02 2011-05-04 松下电器产业株式会社 音频信号解码装置和方法及音频信号编码装置和方法
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
CN101151658B (zh) 2005-03-30 2011-07-06 皇家飞利浦电子股份有限公司 多声道音频编码和解码方法、编码器和解码器
JP2006323037A (ja) * 2005-05-18 2006-11-30 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置
KR101228630B1 (ko) * 2005-09-02 2013-01-31 파나소닉 주식회사 에너지 정형 장치 및 에너지 정형 방법
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
US20080255859A1 (en) * 2005-10-20 2008-10-16 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
ATE463028T1 (de) * 2006-09-13 2010-04-15 Ericsson Telefon Ab L M Verfahren und anordnungen für einen sprach- /audiosender und empfänger
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
KR101405972B1 (ko) 2007-07-02 2014-06-12 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
PL2198632T3 (pl) 2007-10-09 2014-08-29 Koninklijke Philips Nv Sposób i urządzenie do generowania dwuusznego sygnału audio
US20110282674A1 (en) * 2007-11-27 2011-11-17 Nokia Corporation Multichannel audio coding
JP5400059B2 (ja) * 2007-12-18 2014-01-29 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
CN101911732A (zh) * 2008-01-01 2010-12-08 Lg电子株式会社 用于处理音频信号的方法和装置
RU2562395C2 (ru) * 2008-03-04 2015-09-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Микширование входящих информационных потоков
ES2592416T3 (es) * 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
TWI413109B (zh) * 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
WO2010097748A1 (en) 2009-02-27 2010-09-02 Koninklijke Philips Electronics N.V. Parametric stereo encoding and decoding
US20100223061A1 (en) 2009-02-27 2010-09-02 Nokia Corporation Method and Apparatus for Audio Coding
MY160545A (en) 2009-04-08 2017-03-15 Fraunhofer-Gesellschaft Zur Frderung Der Angewandten Forschung E V Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing
KR20110018107A (ko) 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
BR112012007138B1 (pt) * 2009-09-29 2021-11-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de sinal de áudio, codificador de sinal de áudio, método para prover uma representação de mescla ascendente de sinal, método para prover uma representação de mescla descendente de sinal e fluxo de bits usando um valor de parâmetro comum de correlação intra- objetos
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP4254951A3 (en) 2010-04-13 2023-11-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoding method for processing stereo audio signals using a variable prediction direction
SG187950A1 (en) 2010-08-25 2013-03-28 Fraunhofer Ges Forschung Apparatus for generating a decorrelated signal using transmitted phase information
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
FR2973551A1 (fr) 2011-03-29 2012-10-05 France Telecom Allocation par sous-bandes de bits de quantification de parametres d'information spatiale pour un codage parametrique
JP6185457B2 (ja) 2011-04-28 2017-08-23 ドルビー・インターナショナル・アーベー 効率的なコンテンツ分類及びラウドネス推定
US9117440B2 (en) 2011-05-19 2015-08-25 Dolby International Ab Method, apparatus, and medium for detecting frequency extension coding in the coding history of an audio signal
US9166864B1 (en) * 2012-01-18 2015-10-20 Google Inc. Adaptive streaming for legacy media frameworks
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
KR20230020553A (ko) * 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
EP2830065A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US20070140499A1 (en) * 2004-03-01 2007-06-21 Dolby Laboratories Licensing Corporation Multichannel audio coding
CN101371447A (zh) * 2006-01-20 2009-02-18 微软公司 使用扩展带频率编码的复变换信道编码
CN101518083A (zh) * 2006-09-22 2009-08-26 三星电子株式会社 通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法、介质和系统
WO2010003545A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. An apparatus and a method for decoding an encoded audio signal
WO2010105926A2 (en) * 2009-03-17 2010-09-23 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
WO2011048117A1 (en) * 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
WO2011048792A1 (ja) * 2009-10-21 2011-04-28 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
CN102884570A (zh) * 2010-04-09 2013-01-16 杜比国际公司 基于mdct的复数预测立体声编码

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
S. WABNIK: "Packet loss concealment in predictive audio coding", 《IEEE WORKSHOP ON APPLICATIONS OF SIGNAL PROCESSING TO AUDIO AND ACOUSTICS, 2005.》 *
王立炜: "MPEG-4AAC音频解码器的优化与实现", 《中国优秀硕士学位论文全文数据库》 *

Also Published As

Publication number Publication date
US20220059110A1 (en) 2022-02-24
MY196084A (en) 2023-03-14
KR102094129B1 (ko) 2020-03-30
RU2641265C1 (ru) 2018-01-16
HK1213080A1 (zh) 2016-06-24
WO2014161992A1 (en) 2014-10-09
ES2748939T3 (es) 2020-03-18
UA113117C2 (xx) 2016-12-12
MX2019012711A (es) 2019-12-16
JP2017078858A (ja) 2017-04-27
KR20200033988A (ko) 2020-03-30
AU2014247001B2 (en) 2015-08-27
BR122022004786B1 (pt) 2022-10-04
US11114107B2 (en) 2021-09-07
JP6537683B2 (ja) 2019-07-03
AU2014247001A1 (en) 2015-08-13
BR112015019711B1 (pt) 2022-04-26
BR122017006819B1 (pt) 2022-07-26
EP3171361A1 (en) 2017-05-24
EP3171361B1 (en) 2019-07-24
KR20210005315A (ko) 2021-01-13
HUE031660T2 (en) 2017-07-28
JP6377110B2 (ja) 2018-08-22
BR122017006819A2 (pt) 2019-09-03
KR101763129B1 (ko) 2017-07-31
US20170301362A1 (en) 2017-10-19
KR102380370B1 (ko) 2022-04-01
ES2619117T3 (es) 2017-06-23
BR122022004784B1 (pt) 2022-06-07
JP6808781B2 (ja) 2021-01-06
KR20200096328A (ko) 2020-08-11
KR20220044609A (ko) 2022-04-08
TW201505024A (zh) 2015-02-01
RU2602988C1 (ru) 2016-11-20
JP7413418B2 (ja) 2024-01-15
CN105308680B (zh) 2019-03-19
KR102201951B1 (ko) 2021-01-12
US20160343383A1 (en) 2016-11-24
JP2022068353A (ja) 2022-05-09
MY183360A (en) 2021-02-18
BR122022004784B8 (pt) 2022-09-13
JP2018185536A (ja) 2018-11-22
CA2900743A1 (en) 2014-10-09
BR122020017065B1 (pt) 2022-03-22
IL240117A0 (en) 2015-09-24
SG11201506139YA (en) 2015-09-29
TWI546799B (zh) 2016-08-21
MX347936B (es) 2017-05-19
JP2024038139A (ja) 2024-03-19
BR122022004787A2 (zh) 2017-07-18
BR112015019711A2 (pt) 2017-07-18
EP2954519A1 (en) 2015-12-16
US9489957B2 (en) 2016-11-08
EP2954519B1 (en) 2017-02-01
US20240153517A1 (en) 2024-05-09
MY185848A (en) 2021-06-14
KR20170087529A (ko) 2017-07-28
PL2954519T3 (pl) 2017-06-30
BR122021004537B1 (pt) 2022-03-22
JP2021047450A (ja) 2021-03-25
KR20150113976A (ko) 2015-10-08
JP2019191596A (ja) 2019-10-31
JP7033182B2 (ja) 2022-03-09
MX369023B (es) 2019-10-25
US11830510B2 (en) 2023-11-28
JP6031201B2 (ja) 2016-11-24
KR102142837B1 (ko) 2020-08-28
BR122022004787A8 (pt) 2022-09-06
CA2900743C (en) 2016-08-16
CN109410966B (zh) 2023-08-29
BR122022004787B1 (pt) 2022-10-18
BR122022004786A2 (zh) 2017-07-18
US9728199B2 (en) 2017-08-08
DK2954519T3 (en) 2017-03-20
US20160012825A1 (en) 2016-01-14
BR122022004786A8 (pt) 2022-09-06
KR20240038819A (ko) 2024-03-25
JP2016513287A (ja) 2016-05-12
MX2022004397A (es) 2022-06-16
EP3627506A1 (en) 2020-03-25
MX2015011145A (es) 2016-01-12
US10438602B2 (en) 2019-10-08
US20200098381A1 (en) 2020-03-26
CN105308680A (zh) 2016-02-03

Similar Documents

Publication Publication Date Title
CN105308680B (zh) 音频编码器和解码器
CN110010140A (zh) 立体声音频编码器和解码器
CN107134280A (zh) 多声道音频内容的编码

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40001584

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant