CN110114826B - 使用相位补偿对多声道信号进行下混合或上混合的装置和方法 - Google Patents

使用相位补偿对多声道信号进行下混合或上混合的装置和方法 Download PDF

Info

Publication number
CN110114826B
CN110114826B CN201780080571.2A CN201780080571A CN110114826B CN 110114826 B CN110114826 B CN 110114826B CN 201780080571 A CN201780080571 A CN 201780080571A CN 110114826 B CN110114826 B CN 110114826B
Authority
CN
China
Prior art keywords
channel
signal
gain
reconstructed
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780080571.2A
Other languages
English (en)
Other versions
CN110114826A (zh
Inventor
扬·比特
纪尧姆·福克斯
沃尔夫冈·耶格斯
弗伦茨·罗伊特尔胡贝尔
于尔根·赫勒
埃伦尼·福托普楼
马库斯·马特拉斯
斯里坎斯·科塞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority to CN202311048157.7A priority Critical patent/CN116994592A/zh
Publication of CN110114826A publication Critical patent/CN110114826A/zh
Application granted granted Critical
Publication of CN110114826B publication Critical patent/CN110114826B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Analogue/Digital Conversion (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Amplifiers (AREA)

Abstract

一种用于对包括至少两个声道(101、102)在内的多声道信号(100)进行下混合的装置,包括:下混合器(120),用于根据所述多声道信号(100)来计算(34)下混合信号(122),其中所述下混合器被配置为使用绝对相位补偿来计算(34)所述下混合,使得在计算所述下混合信号(122)时,所述至少两个声道中的仅具有较低能量的声道被旋转,或者所述至少两个声道中的具有较低能量的声道比具有较高能量的声道旋转得更强;以及输出接口(160),用于产生输出信号,所述输出信号包括与所述下混合信号(122)有关的信息。

Description

使用相位补偿对多声道信号进行下混合或上混合的装置和 方法
技术领域
本发明涉及音频编码的领域,并且具体地涉及立体声或多声道编码/解码的领域。
背景技术
用于在低比特率下对立体声信号进行有损参数化编码的现有技术方法基于如MPEG-4第3部分中标准化的参数化立体声。总的构思是在提取作为边信息而被发送给解码器的立体声参数之后,通过计算来自两个输入声道的下混合信号来减少声道的数量。这些立体声参数通常是声道间电平差(inter-channel-level-difference)ILD、声道间相位差(inter-channel-phase-difference)IPD和声道间相干性(inter-channel-coherence)ICC,这些参数在子带中计算并且在一定程度上捕获空间图像。
解码器执行单声道输入的上混合,从而产生满足ILD、IPD和ICC关系的两个声道。这是通过将输入信号与在解码器处产生的该信号的去相关的版本一起矩阵化来完成的。
已经发现,例如这些参数的使用使得计算和处理这些参数显著复杂。特别地,ILD参数是有问题的,因为它可以具有非常小或非常大的值,并且这种几乎不受限制的值范围引起关于有效计算、量化等的问题。
发明内容
本发明的目的是提供一种用于处理多声道数据的改进的构思。
该目的通过根据本发明的实施例所述的用于对多声道信号进行下混合的装置、用于对经编码的多声道信号进行上混合的装置、对多声道信号进行下混合的方法、对经编码的多声道信号进行上混合的方法、或者计算机程序来实现。
本发明的第一方面基于以下发现:与现有技术相比,采用不同的参数化编码过程,其依赖于两个增益参数,即,边增益(side gain)参数和残差增益(residual gain)参数。根据多声道信号的至少两个声道中的第一声道和多声道信号的至少两个声道中的第二声道来计算这两个增益参数。这两个增益参数(即,边增益和残差增益)都被发送或存储、或者通常与下混合信号一起输出,其中下混合信号是由下混合器根据多声道信号而计算的。
本发明的第一方面的实施例基于新的中间/边方法,从而产生新的参数集合:在编码器处,中间/边变换被应用于输入声道,其中输入声道一起捕获两个输入声道的完整信息。中间信号是左右声道的经加权的均值,其中权重是复数并且被选择用于补偿相位差。因此,边信号是输入声道的对应的经加权后的差。仅中间信号是波形编码的,而边信号是参数化建模的。编码器在子带中操作,在其中它提取IPD和两个增益参数作为立体声参数。第一增益(称为边增益)通过由中间信号预测边信号而获得,第二增益(称为残差增益)捕获相对于中间信号的能量的其余项的能量。然后,中间信号用作下混合信号,其与立体声参数一起被发送给解码器。
解码器通过基于边增益和残差增益估计丢失的边声道并使用其余项的替代项来合成两个声道。
本发明的第一方面的优点在于,一方面,边增益是限于某一小范围的数的增益,并且另一方面,残差增益是限于某一小范围的数的增益。具体地,在优选实施例中,边增益限于-1到+1的范围内,并且残差增益甚至限于0与1的范围内。并且,在优选实施例中,甚至更有用的是残差增益取决于边增益,使得随着边增益变得越大,残差增益可以具有的值的范围变得越小。
具体地,边增益被计算为边预测增益,其可应用于第一声道和第二声道的中间信号,以便预测第一声道和第二声道的边信号。并且,参数计算器还被配置为将残差增益计算为残差预测增益,其中残差预测增益指示通过中间信号和边增益对边信号进行这种预测的残差信号的能量或幅度。
然而,重要的是,不必在编码器侧实际执行预测或在编码器侧实际对边信号进行编码。相反,可以通过仅使用幅度相关测量(例如,能量、功率或与左右声道的幅度相关的其它特性)来计算边增益和残差增益。附加地,边增益和残差增益的计算仅与两个声道之间的内积相关,即,在实施例中,不必计算除了左声道和右声道之外的任何其它声道(例如,下混合声道本身或边声道本身)。然而,在其它实施例中,可以计算边信号,可以计算用于预测的不同试验,并且可以根据残差信号计算增益参数(例如,边增益和残差增益),其中残差信号与在不同的试验中产生预定义准则(例如,残差或其余信号的最小能量)的某个边增益预测相关联。因此,存在高灵活性,并且尽管如此,在一方面存在用于计算边增益的低复杂度,并且在另一方面存在用于计算残差增益的低复杂度。
与ILD和ICC相比,存在增益参数的两个示例性优点。首先,它们自然位于有限区间(边增益在[-1,1]中,并且残差增益在[0,1]中),这与ILD参数相反,其中ILD参数可以取任意大或小的值。其次,计算不那么复杂,因为它仅涉及单个特殊的函数评估,而ILD和ICC的计算涉及两个。
第一方面的优选实施例依赖于参数在频谱域中的计算,即,针对不同频率段(frequency bin)计算参数,或者更优选地,针对不同子带计算参数,其中每个子带包括某一数量的频率段。在优选实施例中,子带内包括的频率段的数量从较低子带到较高子带增加,以便模仿人类收听感知的特性,即较高频带覆盖较高频率范围或带宽,而较低频带覆盖较低频率范围或带宽。
在优选实施例中,下混合器计算经绝对相位补偿的下混合信号,其中,基于IPD参数,相位旋转被应用于左声道和右声道,但是以使得具有更多能量的声道比具有更少能量的声道更少地旋转的方式来执行相位补偿。为了控制相位补偿,可以优选地使用边增益,然而,在其它实施例中,可以使用任何其它下混合,并且这也是本发明的特定优点,即,边信号的参数化表示(即,一方面的边信号和另一方面的残差信号)仅基于原始的第一声道和第二声道计算,而不需要关于所发送的下混合的任何信息。因此,任何下混合可以与由边增益和残差增益组成的新参数化表示一起使用,但是本发明对于与基于边增益的绝对相位补偿一起应用也是特别有用的。
在绝对相位补偿的另一实施例中,相位补偿参数具体地基于特定的预定数来计算,使得在计算相位补偿参数时出现的反正切函数(atan或tan-1)的奇点从中心移动到某一边位置。奇点的这种移位确保了对于+/-180°的相移和接近0的增益参数(即,具有非常相似的能量的左右声道),不会发生由于奇点引起的任何问题。已经发现这种信号经常发生,但是在自然情况下不会出现彼此异相但是具有例如在3dB与12dB之间或者大约6dB的差值的信号。因此,尽管奇点仅被移位,但是已经发现这种移位仍然改进了下混合器的整体性能,因为相比于直接反正切函数的奇点的情况,这种移位确保了奇点更少地出现在信号星座图(signal constellation)情况下(这在正常情况下出现)。
另外的实施例利用边增益和残差增益的依赖性来实现有效的量化过程。为此,优选地执行联合量化,在第一实施例中,执行联合量化以便首先量化边增益,然后使用基于边增益的值的量化步长来量化残差增益。然而,其它实施例依赖于联合量化,其中两个参数被量化为单个代码,并且该代码的某些部分依赖于某些量化点组,这些量化点组属于由编码器编码的两个声道的某一电平差特性。
第二方面涉及一种用于对包括至少两个声道在内的多声道信号进行下混合的装置,该装置包括:下混合器,用于根据多声道信号来计算下混合信号,其中下混合器被配置为使用绝对相位补偿来计算下混合,使得在计算下混合信号时,至少两个声道之中的仅具有较低能量的声道被旋转,或者至少两个声道之中的具有较低能量的声道比具有较高能量的声道旋转得更强;以及输出接口,用于产生输出信号,该输出信号包括与下混合信号有关的信息。
优选地,旋转优选地在次要声道上进行,但是这种情况可以是能量差很小时的情况,即次要声道并不总是比主要声道旋转得更多,但是,如果能量比率足够大或足够小,则优选实施例使次要声道比主要声道旋转得更多。因此,优选地,仅当能量差很显著或者大于预定义阈值(例如,1dB或更大)时,次要声道才比主要声道旋转得更多。这不仅适用于下混合器,也适用于上混合器。
附图说明
随后将关于附图讨论本发明的优选实施例,在附图中:
图1是实施例的用于对多声道信号进行编码的装置的框图;
图2是参数计算器的实施例的框图;
图3是参数计算器的另外的实施例;
图4是执行绝对相位补偿的下混合器的实施例;
图5a是执行特定量化的输出接口的实施例的框图;
图5b指示了示例性码字;
图6是用于对经编码的多声道信号进行解码的装置的实施例;
图7是上混合器的实施例;
图8是残差信号合成器的实施例;
图9是输入接口的实施例;
图10a示出了重叠帧的处理;
图10b示出了时间频谱转换器的实施例;
图10c示出了左声道或右声道的频谱以及不同子带的结构;
图10d示出了频谱时间转换器的实施例;
图11示出了第一实施例中的针对条件量化的线;
图12示出了根据另一实施例的针对联合量化的线;以及
图13示出了针对边增益和残差增益的联合量化点。
具体实施方式
图1示出了用于对包括至少两个声道在内的多声道信号进行编码的装置。具体地,多声道信号在图1中以100示出,并且具有第一声道101和第二声道102,并且没有附加声道,或者具有任意选择数量的附加声道,其中另外的附加声道以103示出。
多声道信号100被输入到下混合器120,用于根据多声道信号100计算下混合信号122。根据某一实施方式,下混合器可以使用多声道信号的第一声道101、第二声道102和第三声道103或者仅使用第一声道和第二声道或者使用所有声道来计算多声道信号。
此外,用于编码的装置包括参数计算器140,用于根据至少两个声道中的第一声道101和第二声道102来计算边增益141,附加地,参数计算器104根据第一声道和第二声道计算残差增益142。在其它实施例中,还计算可选的声道间相位差(IPD),如143所示。下混合信号122、边增益141和残差增益142被转发到输出接口160,其中输出接口160产生经编码的多声道信号162,其包括与下混合信号122、边增益141和残差增益142有关的信息。
应注意,通常针对帧计算边增益和残差增益,使得对于每个帧,计算单个边增益和单个残差增益。然而,在其它实施例中,不仅针对每个帧计算单个边增益和单个残差增益,而且还针对帧计算边增益组和残差增益组,其中每个边增益和每个残差增益与第一声道和第二声道的某个子带相关。因此,在优选实施例中,参数计算器针对第一声道和第二声道的每个帧计算边增益组和残差增益组,其中帧的边增益和残差增益的数量通常等于子带的数量。当应用诸如DFT之类的高分辨率时间频谱转换时,根据第一声道和第二声道的频率段组来计算某一子带的边增益和残差增益。然而,当应用产生子带信号的低分辨率时间频率变换时,则参数计算器140针对每个子带或甚至针对子带组计算边增益和残差增益。
当针对子带信号组计算边增益和残差增益时,则参数分辨率降低,从而导致较低的比特率,但也导致边信号的参数化表示的较低的质量表示。在其它实施例中,还可以修改时间分辨率,使得不针对每个帧计算边增益和残差增益,而是针对帧组来计算边增益和残差增益,其中该帧组具有两个或更多个帧。因此,在这样的实施例中,优选地计算子带相关边增益/残差增益,其中边增益/残差增益指代某个子带,但是指代包括两个或更多个帧在内的帧组。因此,根据本发明,可以高度灵活性地修改由块140执行的参数计算的时间和频率分辨率。
优选地,参数计算器140如图2中关于第一实施例所概述的那样实现,或者如图3中关于第二实施例概述的那样实现。在图2的实施例中,参数计算器包括第一时间频谱转换器21和第二时间频谱转换器22。此外,图1的参数计算器140包括用于计算第一幅度相关特性的计算器23、用于计算第二幅度相关特性的计算器24、和用于计算块21和块22(即,第一声道和第二声道的频谱表示)的输出的内积的计算器25。
块23、24、25的输出被转发到边增益计算器26,并且还被转发到残差增益计算器27。边增益计算器26和残差增益计算器27在第一幅度相关特性、第二幅度相关特性和内积之间应用某一关系,并且由残差增益计算器应用的用于组合两个输入的关系不同于由边增益计算器26应用的关系。
在优选实施例中,第一幅度相关特性和第二幅度相关特性是子带中的能量。然而,其它幅度相关特性涉及子带本身的幅度、子带中的信号功率或指数大于1的任何其它次幂的幅度,其中指数可以是大于1的实数或大于1的整数,例如与信号功率和能量相关的整数2或者与响度相关联的数字3。因此,每个幅度相关特性可以用于计算边增益和残差增益。
在优选实施例中,边增益计算器和残差增益计算器27被配置为将边增益计算为边预测增益,其中该边预测增益适用于第一声道和第二声道的中间信号以预测第一声道和第二声道的边信号,或者参数计算器(并且特别是残差增益计算器27)被配置为将残差增益计算为残差预测增益,其中该残差预测增益指示使用边增益通过中间信号来预测边信号的残差信号的幅度相关测量。
特别地,图2的参数计算器140和边增益计算器26被配置为使用具有分子和分母的分数来计算边信号,其中分子包括第一声道和第二声道的幅度特性,分母包括第一声道和第二声道的幅度特性和根据内积导出的值。优选地,根据内积导出的值是内积的绝对值,但备选地也可以是绝对值的任何次幂(例如,大于1的幂),或者甚至可以是与绝对值不同的特性(例如,共轭复数项或内积本身等)。
在另外的实施例中,参数计算器、图2的残差增益计算器27还使用具有分子和分母(这两者都使用根据内积导出的值)的分数并且附加地使用其它参数。同样,根据内积导出的值优选地是内积的绝对值,但备选地也可以是绝对值的任何次幂(例如,大于1的幂),或者甚至可以是与绝对值不同的特性(例如,共轭复数项或内积本身等)。
具体地,图2的边计算器26被配置为使用第一声道的能量差来计算边增益,并且分母使用两个声道的能量或幅度特性以及附加的内积(优选地使用内积的两倍,但是也可以使用内积的其它倍数)之和。
残差增益计算器27被配置用于在分子中使用第一声道和第二声道的幅度特性的加权和以及内积,其中从第一声道和第二声道的幅度特性的加权和中减去内积。用于计算残差增益计算器的分母包括第一声道和第二声道的幅度特性以及内积之和,其中内积优选地乘以2但也可以乘以其它因子。
此外,如连接线28所示,残差增益计算器27被配置为使用由边增益计算器计算的边增益来计算残差增益。
在优选实施例中,残差增益和边增益如下操作。具体地,可以计算或者不计算稍后将描述的逐带声道间相位差。然而,在具体地概述如稍后在等式(9)中所示的边增益的计算和稍后在等式(10)中所示的边增益的特定优选计算之前,给出了对编码器的进一步描述,除了增益参数的计算之外,其还涉及IPD的计算和下混合。
立体声参数的编码和下混合信号的计算在频域中完成。为此,通过同时应用分析窗口然后进行离散傅立叶变换(DFT)来产生左右声道的时间频率向量Lt和Rt:然后,将DFT段分别分组成子带(Lt,k)k∈Ib、(Rt,k)k∈Ib,其中Ib表示子带索引的集合。
IPD的计算和下混合
对于下混合,逐带声道间相位差(IPD)被计算为
其中,z*表示z的复共轭。这用于针对k∈Ib产生逐带中间信号和边信号
以及
绝对相位旋转参数β由下式给出
其中gt,b表示将在下面说明的边增益。这里,atan2(y,x)是两自变量反正切函数,其值是点(x,y)与正x轴之间的角度。其旨在对能量较少的声道进行IPD补偿。因子2将位于IPDt,b=±π且gt,b=0处的奇点移动到IPDt,b=±π且gt.b=-1/3处。这种方式可以在左右声道中具有近似相等的能量分布的情况下避免在异相情况下切换β。通过将由合成窗口和重叠加法跟随的逆DFT应用于Mt来产生下混合信号。
在其它实施例中,也可以使用与atan2函数不同的其它反正切函数(例如,直接正切函数),但是atan2函数由于其对所提出的问题的安全应用而是优选的。
增益参数的计算
除了逐带IPD之外,还提取另外两个立体声参数。用于通过Mt,b预测St,b的最优增益,即,使得以下剩余信号的能量最小的数gt,b
pt,k=St,k-gt,bMt,k (5)
以及增益因子rt,b,其如果应用于中间信号Mt,则均衡每个频带中的pt和Mt的能量,即
可以根据子带中的能量
和/>
以及Lt和Rt的内积的绝对值
将最优预测增益计算为
由此得出结论,gt,b位于[-1,1]内。残差增益可以类似地根据能量和内积被计算为
这意味着
具体地,这表明rt,b∈[0,1]。这样,通过计算对应的能量和内积,可以独立于下混合来计算立体声参数。具体地,没有必要计算残差pt,k以计算其能量。值得注意的是,增益的计算仅涉及一个特殊函数评估,而根据EL,t,b、ER,t,b和XL/R,t,b计算ILD和ICC涉及如下两项,即平方根和对数:
以及
降低参数分辨率
如果期望由窗口长度给出的较低的参数分辨率,则可以通过用下式来替换等式(9)和(10)中的XL/R,t,b
并且用下式分别来替换EL,t,b、ER,t,b
来在连续h个窗口上计算增益参数。然后,边增益是各个窗口的边增益的加权平均值,其中权重取决于能量Mt+i,k或取决于逐带能量EM,s,b,其中s是等式14和15中的求和索引。
类似地,然后在若干个窗口上将IPD值计算为
优选地,图1中所示的参数计算器140被配置为将逐子带表示计算为复值频谱的序列,其中每个频谱与第一声道或第二声道的时间帧相关,其中序列的时间帧彼此相邻并且相邻的时间帧彼此重叠。
此外,参数产生器140被配置为通过对子带中的复频谱值的大小求平方并且通过对子带中经求平方的大小求和(例如,如先前在等式(7)中所示,其中索引b表示子带)来计算第一幅度相关测量和第二幅度相关测量。
此外,如等式8中所概述的,参数计算器140(并且具体是图2的内积计算器25)被配置为通过在子带中对积求和来计算内积,其中每个积涉及第一声道的频率段中的频谱值和针对该频率段的、第二声道的共轭复频谱值。随后,形成一起求和的结果的大小。
还如等式1至4中所概述的,优选使用绝对相位补偿。因此,在该实施例中,下混合器120被配置为使用绝对相位补偿来计算下混合122,使得在计算下混合信号时,仅两个声道之中的具有较低能量的声道旋转,或者两个声道之中的具有较低能量的声道比具有更高能量的另一声道旋转得更强。在图4中示出了这样的下混合器120。具体地,下混合器包括声道间相位差(IPD)计算器30、绝对相位旋转计算器32、下混合计算器34和能量差或边增益计算器36。需要强调的是,能量差或边增益计算器36可以被实现为图2中的边增益计算器26。然而,备选地,出于相位旋转的目的,块36中还可以存在不同的实施方式,其仅计算能量差,或者通常计算幅度相关特性差,其中该幅度相关特性可以是能量、功率或者幅度自身或者被相加在一起的多个幂次的幅度,其中该幂不是2(例如,该幂在1与2之间或者大于2)。
特别地,指数或幂3与例如响度而不是能量相对应。
具体地,图4的IPD计算器30被配置为通常针对被输入到块30中的第一声道101和第二声道102中的每一个声道的多个子带中的每个子带计算声道间相位差。此外,下混合器具有同样通常针对基于由块36提供的、第一声道和第二声道之间的能量差操作或者通常基于两个声道101、102之间的幅度相关特性差操作的多个子带中的每个子带的绝对相位旋转参数。此外,下混合计算器34被配置为在计算下混合信号时使用IPD参数和表示为β的绝对相位旋转参数来对第一声道和第二声道进行加权。
优选地,块36被实现为边增益计算器,使得绝对相位旋转计算器基于边增益进行操作。
因此,在优选实施例中,图4的块30被配置用于实现等式(1),块32被配置用于实现等式(4),并且块34被配置用于实现等式(2)。
具体地,等式(4)中的在涉及边增益gt,b的项之前的因子2可以被设置为不同于2,并且可以是例如优选地是在0.1与100之间的值。当然,也可以使用-0.1和-100。该值确保在几乎相等的左右声道的+-180°的IPD处存在的奇点被移动到不同的位置,即,例如针对因子2被移动到-1/3的不同的边增益。然而,可以使用与2不同的其它因子。然后,这些其它因子将奇点移动到与-1/3不同的边增益参数。已经表明所有这些不同的因子是有用的,因为这些因子实现了有问题的奇点处于声级中的这样的“位置”:所述“位置”具有相关联的左右声道信号,其中该相关联的左右声道信号通常不像异相的且具有相等或几乎相等的能量的信号那样频繁地出现。
在优选实施例中,图1的输出接口160被配置用于执行参数化信息的量化,即,如由参数计算器140在线141上提供的边增益的量化和如由图1的参数计算器140在线142上提供的残差增益的量化。
具体地,在残差增益取决于边增益的实施例中,如果优选量化边增益然后量化残差增益,则在本实施例中,用于残差增益的量化步长取决于边增益的值。
具体地,这在图11中示出,并且类似地在图12和图13中也示出。
图11示出了用于条件量化的线。具体地,已经示出残差增益总是在由(1-g2)1/2确定的范围内。因此,当g=0时,则r可以在0和1之间的范围内。然而,当g等于0.5时,则r可以在0.866和0的范围内。此外,当例如g=0.75时,则r的范围限于0和0.66之间。在g=0.9的极端实施例中,r仅可以在0和0.43之间的范围内。此外,当g=0.99时,则r仅可以在例如0和0.14之间的范围内。
因此,可以通过针对较高的边增益降低用于残差增益量化的量化步长来使用该依赖性。因此,当考虑图11时,可以总是将表示r的值范围的竖直线除以某个整数(例如,8),使得每条线具有八个量化步长。因此,很明显,对于反映较高的边增益的线,量化步长比具有较低的边增益的线要小。因此,可以更精细地量化更高的边增益,而不会增加比特率。
在另外的实施例中,量化器被配置为使用多个量化点组来执行联合量化,其中每个量化点组由第一声道和第二声道之间的固定的幅度相关比率来定义。用于幅度相关比率的一个示例是左和右之间的能量,即,这指的是用于第一声道和第二声道之间的相同ILD的线,如图12所示。在该实施例中,输出接口被配置为如图5a所示的那样,并且包括逐子带ILD计算器,其接收第一声道和第二声道作为输入,或者备选地,接收边增益g和残差增益r作为输入。由附图标记50指示的逐子带ILD计算器针对要被量化的参数值g、r输出某一ILD。ILD或通常幅度相关比率被转发给组匹配器52。组匹配器52确定最佳匹配组并且将该信息转发给点匹配器54。组匹配器52和点匹配器54两者都馈入代码构建器56,其中代码构建器56最终从码本输出诸如码字之类的代码。
具体地,代码构建器接收边增益g的符号,并且确定如图5b中所示的符号比特57a,其中图5b示出了用于子带的g、r的代码。此外,已经确定与所确定的ILD匹配的某一量化点组的组匹配器输出第2至第5个比特(如57b处所示)来作为组ID。最后,点匹配器输出图5b的实施例中的第6比特至第8个比特(如在57c处所示),其中这些比特指示点ID,即由比特57b指示的组内的量化点的ID。尽管图5b示出了具有单个符号比特、4个组比特和3个点比特的8比特代码,但是可以使用具有符号比特和更多或更少的组比特以及更多或更少的点比特的其它代码。由于边增益具有正值和负值的事实,当如等式(9)所示的规则应用于计算边增益时,组比特和点比特(即,比特集合57b和比特集合57c)仅具有纯负值或者优选地仅具有纯正值,并且如果符号比特指示负符号,则残差增益总是被解码为正值,但是边增益被解码为负值,这意味着左声道的能量低于右声道的能量。
随后,概述了用于量化的其它实施例。
边增益和残差增益的量化
(11)中的不等式揭示了残差增益对边增益的强烈依赖性,因为后者确定前者的范围。因此,通过选择[-1,1]和[0,1]中的量化点来独立地量化边增益g和残差增益r是低效的,因为用于r的可能的量化点的数量将随着g倾向于±1而减小。
条件量化
存在用于处理该问题的不同方法。最简单的方法是首先量化g,然后以经量化的值为条件来量化r,由此量化点将位于区间/>中。然后例如可以在这些量化线上均匀地选择量化点,其中一些量化线在图11中示出。
联合量化
用于选择量化点的更复杂的方法是查看(g,r)平面中的线,这些线与L和R之间的固定能量比率相对应。如果c2≥1表示这样的能量比率,则对应的线在c=1情况下由(0,s)(其中0≤s≤1)给出或者由下式给出
这也涵盖了c2<1的情况,因为交换的Lt和Rt仅改变gt,b的符号并且使rt,b保持不变。
该方法覆盖了具有相同数量的量化点的较大区域,如图12所示。同样,线上的量化点可以是例如根据各条线的长度而均匀选择的。其它可能性包括选择它们以匹配预先选择的ICC值或以声学方式优化它们。
已经发现效果良好的量化方案基于与如下ILD值相对应的能量线:
±{0,2,4,6,8,10,13,16,19,22,25,30,35,40,45,50},(23)
在每条能量线上选择8个量化点。这产生了具有256个条目的码本,其被组织为8×16的量化点表,该表保存与g和符号比特的非负值相对应的值。这产生了量化点(g,r)的8比特整数表示,其中,例如,第一个比特指定g的符号,接下来的四个比特保存8×16表中的列索引,最后的三个比特保存行索引。
(gt,b,rt,b)的量化可以通过穷举码本搜索来完成,但是更有效的是首先计算子带ILD并将搜索限制到最佳匹配能量线。这样,只需要考虑8个点。
通过简单的表查找完成去量化。
在图12中示出了覆盖g的非负值的该方案的128个量化点。
尽管已经公开了用于计算边增益和残差增益而不实际计算边信号(即,如等式(9)和等式(10)所示的左信号和右信号之间的差信号)的过程,但是另外的实施例进行操作以不同地计算边增益和残差增益(即,在实际计算边信号的情况下)。图3中示出了该过程。
在该实施例中,图1中所示的参数计算器140包括边信号计算器60,其接收第一声道101和第二声道102作为输入,并且输出可以位于时域中但是优选地在频域中计算(例如,如等式3所示)的实际边信号。然而,尽管等式3指示了利用每个频带和子帧的绝对相位旋转参数β和IPD参数来计算边信号的情况,但是也可以在没有相位补偿的情况下计算边信号。等式3变为仅出现Lt,k和Rt,k的等式。因此,边信号也可以被计算为左声道和右声道或第一声道和第二声道之间的简单的差,并且可以使用或可以不使用利用平方根2进行的归一化。
由边信号计算器60计算的边信号被转发给残差信号计算器61。例如,残差信号计算器62执行等式(5)中所示的过程。残差信号计算器61被配置为使用不同的测试边增益(即,用于边增益gd,b的不同值,即,用于同一频带和帧的不同的测试边增益),并且因此获得不同的残差信号(如块61的多个输出所示)。
图3中的边增益选择器62接收所有不同的残差信号,并且选择不同残差信号中满足预定条件的一个残差信号,或者选择与不同残差信号中满足预定条件的一个残差信号相关联的测试边增益。例如,该预定义条件可以是选择导致在所有不同残差信号之中的具有最小能量的残差信号的边增益。然而,可以使用其它预定条件,例如与诸如响度之类的能量不同的最小幅度相关条件。然而,也可以应用其它过程,例如使用不具有最小能量但是能量处于五个最小能量之中的残差信号。实际上,预定义条件还可以是选择显示某个其它音频特性(例如,某些频率范围中的某些特征)的残差信号。
边增益选择器62将所选择的特定测试边增益确定为用于某一帧或用于某一频带和某一帧的边增益参数。在实施例中,所选择的残差信号被转发给残差增益计算器63,并且残差增益计算器可以简单地计算所选择的残差信号的幅度相关特性,或者可以优选地将残差增益计算为残差信号的幅度相关特性关于下混合信号或中间信号的幅度相关特性之间的关系。即使在使用与经相位补偿的下混合或者与由左和右的总和组成的下混合不同的下混合时,然而残差增益也可以视情况将与左右的非相位补偿的相加相关。
因此,图3示出了在实际计算边信号的情况下计算边增益和残差增益的方法,而在粗略地反映等式9和等式10的图2的实施例中,在没有明确计算边信号并且在不利用不同的测试边增益来执行残差信号计算的情况下计算边增益和残差增益。因此,变得清楚的是,这两个实施例都产生边增益和参数化来自预测的残差信号的残差增益,并且除了图2和图3中所示的或者通过对应的等式5至10所示的过程之外,用于计算边增益和残差增益的其它过程也是可能的。
此外,这里应注意,给出的所有等式总是用于由对应等式确定的值的优选实施例。然而,已经发现,与由对应的等式确定的值相差优选在±20%的范围内的不同的值也是有用的,并且已经提供优于现有技术的优点,然而当与由等式确定的值的偏差变小时,优点变得更大。因此,在其它实施例中,优选使用仅与由对应等式确定的值相差±10%的值,并且在最优选的实施例中,由等式确定的值是用于计算若干个数据项的值。
图6示出了用于对经编码的多声道信号200进行解码的装置。用于解码的装置包括输入接口204、连接到输入接口204的残差信号合成器208、以及一方面连接到输入接口204并且另一方面连接到残差信号合成器208的上混合器212。在优选实施例中,解码器附加地包括频谱时间转换器260,以便最终输出时域的第一声道和第二声道(如217和218所示)。
具体地,输入接口204被配置用于接收经编码的多声道信号200,并且用于根据经编码的多声道信号200获得下混合信号207、边增益g206和残差增益r 205。残差信号合成器208使用残差增益205合成残差信号,并且上混合器212被配置用于使用边增益206和由残差信号合成器208确定的残差信号209来对下混合信号207进行上混合,以获得重构的第一声道213和重构的第二声道214。在残差信号合成器208和上混合器212在频谱域中操作或者至少上混合器212在频谱域中操作的实施例中,重构的第一声道213和第二声道214以频谱域表示给出,并且用于每个声道的频谱域表示可以通过频谱时间转换器216被转换成时域,以最终输出时域的第一重构声道和第二重构声道。
具体地,上混合器212被配置为使用图7中所示的第一加权器70执行第一加权操作以获得第一经加权的下混合声道。此外,上混合器一方面再次使用边增益206另一方面使用下混合信号207使用第二加权器执行第二加权操作,以获得第二经加权的下混合信号。优选地,由块70执行的第一加权操作不同于由块71执行的第二加权操作,使得第一经加权的下混合76与第二经加权的下混合77不同。此外,上混合器212被配置为使用由第一组合器72对第一经加权的下混合信号76和残差信号209执行的组合来计算重构的第一声道。此外,上混合器附加地包括第二组合器73,用于执行第二经加权的下混合信号77和残差信号209的第二组合。
优选地,由第一组合器72和第二组合器73执行的组合规则彼此不同,使得一方面块72的输出和另一方面块73的输出由于块72、73中的不同组合规则并且由于由块70和块71执行的不同的加权规则而实质上彼此不同。
优选地,由于一个组合规则是加法操作而另一操作规则是减法操作,因此第一组合规则和第二组合规则彼此不同。然而,也可以使用其它成对的第一组合规则和第二组合规则。
此外,在块70和块71中使用的加权规则彼此不同,因为一个加权规则使用具有由预定数和边增益之差确定的加权因子的加权,而另一加权规则使用由预定数和边增益之和确定的加权因子。预定数在两个加权器中可以彼此相等,或者可以彼此不同,并且预定数不等于0,并且可以是整数或非整数,并且优选地等于1。
图8示出了残差信号合成器208的优选实现方式。残差信号合成器208包括一种原始残差信号选择器,或者通常包括去相关信号计算器80。此外,由块80输出的信号被输入到加权器82中,加权器82接收由图6的输入接口204输出的残差增益(附图标记205所示)作为输入。此外,残差信号合成器优选地包括归一化器84,其接收当前帧的中间信号85作为输入,并且接收由块80输出的信号(即,原始信号或者去相关信号86)作为另一输入。基于这两个信号,计算归一化因子gnorm 87,其中归一化因子87优选地连同残差增益r一起被加权器82使用,以最终获得合成的残差信号209。
在优选实施例中,原始残差信号选择器80被配置用于选择前一帧的下混合信号,例如紧接在前的帧或甚至更早的帧。然而,根据实施方式,原始残差信号选择器80被配置用于选择针对前一帧而计算的左或右信号或第一声道或第二声道信号,或者原始残差信号选择器80还可以基于例如针对更的、紧接在前的帧或甚至更早的在前的帧而确定的左右信号的和、差之类的组合来确定残差信号。在其它实施例中,去相关信号计算器80还可以被配置为实际产生去相关信号。然而,优选的是,原始残差信号选择器80在没有特定去相关器(例如,诸如混响滤波器之类的去相关滤波器)的情况下操作,但是出于低复杂性的原因,仅从过去的信号(例如,中间信号、重构的左信号、重构的右信号、或者根据更早重构的左右信号通过不依赖于特定混响或去相关滤波器的简单操作(例如,加权组合,即(加权)相加、(加权)相减等)而导出的信号)中选择已存在的信号。
通常,加权器82被配置为计算残差信号,使得残差信号的能量等于由残差增益r指示的信号能量,其中该能量可以以绝对项来表示,但优选地以相对于当前帧的中间信号207的相对项来表示。
在编码器侧和解码器侧的优选实施例中,边增益的值和来自残差增益的值(如果有的话)不等于0。
随后,以等式形式给出解码器的另外的优选实施例。
上混也在频域中完成。为此,将来自编码器的时间频率变换应用于经解码的下混合,产生了时间频率向量使用去量化的值/> 和/>对于k∈Ib,左右声道被计算为:
以及
其中是来自编码器的丢失残差ρt,k的替代项,而gnorm是能量调整因子
该能量调整因子将相对增益系数变为绝对增益系数。取值可以如下:/>
其中,db>0表示逐带的帧延迟。同样将相位旋转因子计算为:
然后,通过对和/>应用逆DFT,然后是合成窗口和重叠加法来产生左声道和右声道。
图9示出了输入接口204的另外的实施例。该实施例反映了如前面关于图5a和图5b对编码器侧所讨论的去量化操作。特别地,输入接口204包括提取器90,其从经编码的多声道信号中提取联合代码。该联合代码91被转发到联合码本92,联合码本92被配置为针对每个代码输出符号信息、组信息或点信息,或者被配置为针对每个代码输出最终的去量化的值g和最终的去量化的值r,即去量化的边增益和残差增益。
图10a示出了时域的第一声道和第二声道或左声道l(t)和右声道r(t)的示意图。
在频谱域中计算边增益和残差增益的实施例中,优选地,左声道和右声道或第一声道和第二声道被划分成重叠的帧F(1)、F(2)、F(3)和F(4)等。在图10a所示的实施例中,帧重叠50%,但是其它重叠也是有用的。此外,仅示出了两帧重叠,即,总是仅两个随后的帧彼此重叠。然而,也可以使用多重叠帧,例如三个、四个或五个重叠帧。然后,提前值(即,后一帧与当前帧相差的量)不是如图10a所示的实施例中的50%,而仅是较小的,例如10%、20%或30%左右。
图10b示出了时间频谱转换器(例如,图2中所示的块21或块22)的优选实施方式。这种时间频率转换器接收帧序列l(t)或r(t)作为输入。然后,分析加窗器1300输出窗口化的帧的序列,这些窗口化的帧已经全部被窗口化,优选地使用相同的分析窗口对其进行窗口化。分析窗口可以是正弦窗口或任何其它窗口,并且针对第一声道计算单独的序列,并且针对第二声道计算另外的单独序列。
然后,将窗口化的帧的序列输入到变换块1302中。优选地,变换块1302执行变换算法,从而产生复频谱值(例如,DFT,具体地为FFT)。然而,在其它实施例中,也可以使用诸如DCT或MDCT(改进的离散余弦变换)之类的纯实数变换算法,并且随后,可以根据纯实部估计虚部,如本领域中已知的那样,并且如例如在USAC(统一的语音和音频编码)标准中实现的那样。其它变换算法可以是子带滤波器组(例如,QMF滤波器组),其产生复值子带信号。通常,子带信号滤波器频带具有比FFT算法更低的频率分辨率,并且具有某一数量的DFT段的FFT或DFT频谱可以通过收集某些段而被变换为逐子带表示。这在图10c中示出。
具体地,图10c示出了用于特定帧t的第一声道Lk或第二声道Rk的频域表示的复频谱。频谱值以幅度/相位表示或实部/虚部表示给出。通常,DFT产生具有相同的频率分辨率或带宽的频率段。然而,优选地,逐子带地计算边增益和残差增益,以便减少用于发送残差增益和边增益的比特数。优选地,使用从较低频率到较高频率增加的子带来产生子带表示。因此,在示例中,子带1可以具有第一数量的频率段(例如,2个段),并且第二更高的子带(例如,子带2、子带3或任何其它子带)可以具有更多数量的频率段(例如,如子带3所示的8个频率段)。因此,各个子带的频率带宽可以优选地被调整到如本领域中关于叫声标度(Barkscal e)所公知的人耳的特性。
因此,图10c示出了由前面公开的等式中的参数k指示的不同频率段,并且图10c中示出的各个子带由子带索引b指示。
图10d示出了频谱时间转换器(例如,图6中的块216所实现的)的实施方式。频谱时间转换器需要后向变换器1310、随后连接的合成加窗器1312和随后连接的重叠/加法器1314以最终获得时域声道。因此,进入到1310中的输入是图6中所示的重构的频谱域声道213、214,并且在重叠/加法器1340的输出处,存在时域重构的第一声道217和第二声道218。
后向变换器1310被配置为执行导致后向变换的算法,并且具体地,执行优选地与编码器侧的、图10b的块1302中应用的算法相逆的算法。此外,合成窗口1312被配置为应用与对应的分析窗口匹配的合成窗口,并且优选地,使用相同的分析和合成窗口,但不一定是这种情况。重叠/加法器1314被配置为执行如图10a所示的重叠。因此,重叠/加法器1314例如采用与图10a的F(3)相对应的合成窗口化帧,并且另外地采用图10a的合成窗口化帧F(4),然后以逐样本的方式将F(3)的后半部分的对应样本添加到F(4)的前半部分的对应样本中,以最终获得实际时域输出声道的样本。
随后,简要给出了本发明的不同具体方面。
·根据等式(4)的具有IPD补偿和绝对相位补偿的立体声M/S。
·具有IPD补偿和根据(10)通过M来预测S的立体声M/S。
·具有IPD补偿、根据(9)通过M预测S并且根据增益因子(10)的残差预测的立体声M/S。
·通过联合量化对边增益因子和残差增益因子进行的有效量化。
·对与(g,r)平面中的Lt和Rt的固定能量比率相对应对的线上的边增益因子和残差增益因子进行联合量化。
应注意,优选地,所有上述五个不同方面都在同一个编码器/解码器框架中实现。然而,还应注意,之前给出的各个方面也可以彼此分开实现。因此,可以在任何下混合器中执行具有IPD补偿和绝对相位补偿的第一方面,而不考虑任何边增益/残差增益计算。此外,例如,可以利用任何下混合,即也可以利用不通过某一相位补偿而计算的下混合来执行边增益计算和残差增益计算的方面。
此外,甚至一方面边增益的计算和另一方面残差增益的计算也可以彼此独立地执行,其中单独的边增益的计算或者与不同于残差增益的任何其它参数一起的边增益的计算相对于现有技术也是有利的,特别是关于ICC或者ILD计算方面,甚至单独的残差增益的计算或者与不同于边增益的任何其它参数一起的残差增益的计算也是有用的。
此外,边增益和残差增益或增益因子的有效联合或条件量化以及对于任何特定的下混合都是有用的。因此,也可以在没有任伺下混合的情况下使用有效量化。并且,这种有效量化也可以应用于第二参数关于其值范围依赖于第一参数的任何其它参数,从而可以对这样的相关参数执行非常有效和低复杂的量化,这些相关参数当然可以是与边增益和残差增益不同的参数。
因此,所有上述五个方面可以在某个编码器/解码器实现中彼此独立地或一起执行和实现,并且,也可以仅一起实现这些方面的子组,即,三个方面一起实现而不实现其它两个方面,或者只有五个方面中的两个方面被一起实现而其它三个方面可以不被实现。
尽管已经在装置的上下文中描述了一些方面,但是将清楚的是,这些方面还表示对应方法的描述,其中,块或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也表示对对应块或者对应装置的项或特征的描述。
取决于某些实现要求,可以在硬件中或在软件中实现本发明的实施例。可以使用其上存储有电子可读控制信号的数字存储介质(例如,软盘、DVD、CD、ROM、PROM、EPROM、EEPROM或闪存)来执行该实现,该电子可读控制信号与可编程计算机系统协作(或者能够与之协作)从而执行相应方法。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,该电子可读控制信号能够与可编程计算机系统协作从而执行本文所述的方法之一。
通常,本发明的实施例可以被实现为具有程序代码的计算机程序产品,程序代码可操作用于在计算机程序产品在计算机上运行时执行方法之一。程序代码可以例如存储在机器可读载体上。
其他实施例包括用于执行本文所述的方法之一的计算机程序,其中将所述计算机程序存储在机器可读的载体或非暂时性存储介质上。
换言之,本发明方法的实施例因此是具有程序代码的计算机程序,该程序代码用于在计算机程序在计算机上运行时执行本文所述的方法之一。
因此,本发明方法的另外的实施例是其上记录有计算机程序的数据载体(或者数字存储介质或计算机可读介质),该计算机程序用于执行本文所述的方法之一。
因此,本发明方法的另一实施例是表示计算机程序的数据流或信号序列,所述计算机程序用于执行本文所述的方法之一。数据流或信号序列可以例如被配置为经由数据通信连接(例如,经由互联网)传送。
另外的实施例包括处理装置,例如,计算机或可编程逻辑器件,所述处理装置被配置为或适于执行本文所述的方法之一。
另一实施例包括其上安装有计算机程序的计算机,该计算机程序用于执行本文所述的方法之一。
在一些实施例中,可编程逻辑器件(例如,现场可编程门阵列)可以用于执行本文所述的方法的功能中的一些或全部。在一些实施例中,现场可编程门阵列可以与微处理器协作以执行本文所述的方法之一。通常,方法优选地由任意硬件装置来执行。
上述实施例对于本发明的原理仅是说明性的。应当理解的是:本文所述的布置和细节的修改和变形对于本领域其他技术人员将是显而易见的。因此,旨在仅由所附专利权利要求的范围来限制而不是由借助对本文实施例的描述和解释所给出的具体细节来限制。
参考文献
MPEG-4 High Efficiency Advanced Audio Coding(HE-AAC)v2
FROM JOINT STEREO TO SPATIAL AUDIO CODING-RECENT PROGRESS ANDSTANDARDIZATION,Proc.of the 7th Int.Conference on digital Audio Effects(DAFX-04),Naples,Italy,October 5-8,2004。

Claims (35)

1.一种用于对包括至少两个声道(101、102)在内的多声道信号(100)进行下混合的装置,所述至少两个声道至少包括第一声道(101)和第二声道(102),所述装置包括:
下混合器(120),用于根据所述多声道信号(100)来计算(34)下混合信号(122),其中所述下混合器被配置为使用绝对相位旋转参数来计算(34)所述下混合信号,使得在计算所述下混合信号(122)时,所述至少两个声道(101、102)中的仅具有较低能量的声道被旋转,或者所述至少两个声道(101、102)中的具有较低能量的声道比具有较高能量的声道旋转得更强;以及
输出接口(160),用于产生输出信号,所述输出信号包括与所述下混合信号(122)有关的信息。
2.根据权利要求1所述的装置,
其中,所述下混合器(120)被配置为使用所述至少两个声道(101、102)来计算(30)声道间相位差,以及
其中,所述下混合器(120)被配置为计算(32)所述绝对相位旋转参数,并且
其中,所述下混合器(120)被配置为:在计算所述下混合信号时,使用所述声道间相位差和所述绝对相位旋转参数来对所述第一声道(101)和所述第二声道(102)进行加权。
3.根据权利要求2所述的装置,
其中,所述装置还包括参数计算器(140),用于根据所述至少两个声道(101、102)中的所述第一声道(101)和所述第二声道(102)计算边增益(141),并且
其中,所述下混合器(120)被配置为基于由所述参数计算器(140)确定的所述边增益(141)来计算(32)所述绝对相位旋转参数。
4.根据权利要求2所述的装置,
其中,所述下混合器(120)被配置为针对帧的每个子带计算(30)所述声道间相位差,并且其中,所述下混合器(120)被配置为针对所述帧的每个子带计算(32)所述绝对相位旋转参数。
5.根据权利要求1所述的装置,
其中,所述下混合器(120)被配置为计算所述绝对相位旋转参数,使得所述绝对相位旋转参数在由以下等式确定的值的±20%内:
其中,atan是反正切函数,其中β是所述绝对相位旋转参数,其中IPD是所述声道间相位差,其中t是帧索引,b是子带索引,并且gt,b是帧t和子带b的边增益,并且其中A是介于0.1与100或者介于-0.1与-100之间的值。
6.根据权利要求5所述的装置,其中,所述atan函数包括atan2函数,所述atan2(y,x)函数是两自变量反正切函数,其中所述两自变量反正切函数的值是点(x,y)与正x轴之间的角度。
7.根据权利要求1所述的装置,
其中,所述下混合器(120)被配置为计算(34)所述下混合信号(122),使得所述下混合信号(122)的值在由以下等式确定的值的±20%内:
其中,Mt,k是帧t和频率段k的下混合信号,其中Lt,k是帧t和频率段k的所述第一声道(101),其中Rt,k是所述帧t和所述频率段k的所述第二声道(102),其中IPDt,b是所述帧t和包括所述频率段k在内的子带b的声道间相位差,并且其中β是所述绝对相位旋转参数。
8.根据权利要求1所述的装置,还包括:
参数计算器(140),用于根据所述至少两个声道(101、102)中的所述第一声道(101)和所述至少两个声道(101、102)中的所述第二声道(102)计算边增益(141),或者用于根据所述第一声道(101)和所述第二声道(102)计算残差增益(142);以及
其中,所述输出接口(160)被配置用于产生所述输出信号,使得所述输出信号还包括与所述边增益(141)有关的信息和与所述残差增益(142)有关的信息。
9.根据权利要求8所述的装置,其中,所述参数计算器(140)被配置为:
产生(21)所述第一声道(101)和所述第二声道(102)的逐子带表示,
计算(21、22、23、24)子带中所述第一声道(101)的第一幅度相关特性,并且计算所述子带中所述第二声道(102)的第二幅度相关特性,
计算(25)所述子带中所述第一声道(101)与所述第二声道(102)的内积;
使用涉及所述第一幅度相关特性、所述第二幅度相关特性和所述内积的第一关系来计算(26)所述子带中的所述边增益;或者
使用涉及所述第一幅度相关特性、所述第二幅度相关特性和所述内积的第二关系来计算(27)所述子带中的残差增益,所述第二关系不同于所述第一关系,
其中,所述幅度相关特性是根据幅度、功率、能量或指数大于1的任何次幂的幅度而确定的。
10.根据权利要求8所述的装置,
其中,所述参数计算器(140)被配置为针对所述第一声道(101)和所述第二声道(102)的多个子带中的每个子带,计算所述边增益(141)或者所述残差增益(142),或者
其中,所述参数计算器(140)被配置为将所述边增益计算为边预测增益,其中所述边预测增益适用于所述第一声道(101)和所述第二声道(102)的中间信号,以预测所述第一声道(101)和所述第二声道(102)的边信号,或者
其中,所述参数计算器(140)被配置为使用所述边增益将所述残差增益计算为残差预测增益,其中所述残差预测增益指示通过所述中间信号预测所述边信号的残差信号的幅度相关特性。
11.根据权利要求9所述的装置,
其中,所述参数计算器(140)被配置为使用具有分子和分母的分数来计算(26)所述边增益,所述分子涉及所述第一声道(101)的幅度相关特性和所述第二声道(102)的幅度相关特性,并且所述分母涉及所述第一声道(101)的所述幅度相关特性、所述第二声道(102)的所述幅度相关特性、以及根据所述内积导出的值,或者
其中,所述参数计算器(140)被配置为使用具有分子和分母的分数来计算(27)所述残差增益,所述分子涉及根据内积导出的值,并且所述分母涉及所述内积。
12.根据权利要求11所述的装置,
其中,所述参数计算器(140)被配置为计算(26)所述边增益,其中,所述分子包括所述第一声道(101)的第一幅度相关特性与所述第二声道(102)的第二幅度相关特性之差,并且其中,所述分母包括所述第一声道(101)的所述第一幅度相关特性、所述第二声道(102)的所述第二幅度相关特性以及根据所述内积导出的值之和,或者
其中,所述参数计算器(140)被配置为使用具有分子和分母的分数来计算(27)所述残差增益,其中所述分子包括所述第一声道(101)的所述第一幅度相关特性和所述第二声道(102)的所述第二幅度相关特性的加权和与根据所述内积导出的值之差,并且其中,所述分母包括所述第一声道(101)的所述幅度相关特性、所述第二声道(102)的所述幅度相关特性以及根据所述内积导出的值之和。
13.根据权利要求8所述的装置,
其中,所述参数计算器(140)被配置为计算子带的所述边增益,并且使用(28)所述子带的所述边增益来计算所述子带的所述残差增益。
14.根据权利要求8所述的装置,
其中,所述参数计算器(140)被配置为计算所述边增益,使得所述边增益的值在基于以下等式确定的值的±20%的范围内:
或者
其中,所述参数计算器(140)被配置为计算残差增益,使得所述残差增益的值在基于以下等式确定的值的±20%的范围内:
其中t是帧索引,其中b是子带索引,其中El是帧和子带中所述第一声道(101)的能量,其中ER是帧t和子带b中所述第二声道(102)的能量,并且其中X是所述帧t和所述子带b中所述第一声道(101)与所述第二声道(102)之间的内积。
15.根据权利要求9所述的装置,
其中,所述参数计算器(140)被配置为将所述第一声道(101)和所述第二声道(102)的逐子带表示计算为复值频谱的序列,其中每个频谱与所述第一声道(101)或所述第二声道(102)的时间帧相关,其中所述序列的时间帧在所述频谱的序列中相邻并且彼此重叠,或者
其中,所述参数计算器(140)被配置为通过对子带中复频谱值的大小求平方并且通过对所述子带中经求平方的大小求和来计算第一幅度相关特性和第二幅度相关特性,或者
其中,所述参数计算器(140)被配置为通过在所述子带中对积求和,并且通过形成所述求和的结果的大小来计算内积,其中每个积涉及所述第一声道(101)的频率段中的频谱值和针对所述频率段的、所述第二声道(102)的共轭复频谱值。
16.根据权利要求1所述的装置,
其中,所述输出接口(160)包括波形编码器,所述波形编码器被配置为对所述下混合信号(122)进行波形编码以获得与所述下混合信号(122)有关的信息,或者
其中,所述下混合器被配置为仅当所述第一声道(101)和所述第二声道(102)之间的能量差大于预定义阈值时,使具有较低能量的声道比具有较高能量的声道旋转得更多。
17.一种用于对经编码的多声道信号(200)进行上混合的装置,包括:
输入接口(204),用于接收所述经编码的多声道信号(200),并且用于根据所述经编码的多声道信号(200)获得下混合信号(207);以及
上混合器(212),用于对所述下混合信号(207)进行上混合,其中所述上混合器被配置为使用绝对相位旋转参数来计算重构的第一声道(213)和重构的第二声道(214),使得在重构所述重构的第一声道(213)和所述重构的第二声道(214)中的具有较低能量的声道时仅旋转所述下混合信号,或者在重构所述重构的第一声道(213)和所述重构的第二声道(214)中的具有较低能量的声道时使所述下混合信号比所述重构的第一声道(213)和所述重构的第二声道(214)中的具有较高能量的声道旋转得更强。
18.根据权利要求17所述的装置,
其中,所述输入接口(204)被配置为根据所述经编码的多声道信号(200)获得声道间相位差值,并且
其中,所述上混合器(212)被配置为在计算所述重构的第一声道(213)和所述重构的第二声道(214)时应用所述声道间相位差值。
19.根据权利要求18所述的装置,其中,所述上混合器(212)被配置为:
根据声道间相位差值计算所述绝对相位旋转参数,以及
在以第一方式计算所述重构的第一声道(213)时应用所述绝对相位旋转参数,并且在以第二方式计算所述重构的第二声道(214)时应用所述声道间相位差值和/或所述绝对相位旋转参数,其中,所述第一方式不同于所述第二方式。
20.根据权利要求19所述的装置,
其中,所述输入接口(204)被配置用于接收所述经编码的多声道信号(200),并且用于根据所述经编码的多声道信号(200)获得边增益(206);
其中,所述上混合器(212)被配置为计算所述绝对相位旋转参数,使得所述绝对相位旋转参数在由以下等式确定的值的±20%内:
其中,atan是反正切函数,其中β是所述绝对相位旋转参数,其中IPD是所述声道间相位差,其中t是帧索引,b是子带索引,并且gt,b是帧t和子带b的所述边增益,并且其中A是介于0.1与100或者介于-0.1与-100之间的值。
21.根据权利要求20所述的装置,其中,所述atan函数包括atan2函数,所述atan2(y,x)函数是两自变量反正切函数,所述两自变量反正切函数的值是点(x,y)与正x轴之间的角度。
22.根据权利要求20所述的装置,
其中,所述上混合器(212)被配置为计算所述重构的第一声道(213)和所述重构的第二声道(214),使得所述重构的第一声道(213)和所述重构的第二声道(214)的值在相对于由以下等式确定的值的±20%的范围内:
以及
其中是帧t和频率段k的所述下混合信号。
23.根据权利要求20所述的装置,
其中,所述上混合器(212)被配置为计算所述重构的第一声道(213)和所述重构的第二声道(214),使得所述重构的第一声道(213)和所述重构的第二声道(214)的值在相对于由以下等式确定的值的±20%的范围内:
以及
其中是帧t和频率段k的所述下混合信号,其中/>是帧t和子带b的边增益,其中/>是帧t和子带b的残差增益,其中gnorm是能够存在或不存在的能量归一化因子,并且其中/>是帧t和频率段k的原始残差信号。
24.根据权利要求17所述的装置,
其中,所述输入接口(204)被配置用于接收所述经编码的多声道信号(200),并且用于根据所述经编码的多声道信号(200)获得边增益(206)和残差增益(205);
其中,所述装置还包括残差信号合成器(208),用于使用所述残差增益(205)来合成残差信号(209);
其中,所述上混合器(212)被配置为使用所述边增益(206)对所述下混合信号(207)执行第一加权操作(70),以获得第一经加权的下混合信号(76),
其中,所述上混合器(212)被配置为使用所述边增益(206)和所述下混合信号(207)执行第二加权操作(71)以获得第二经加权的下混合信号(77),
其中,所述第一加权操作(70)与所述第二加权操作(71)不同,使得所述第一经加权的下混合信号(76)与所述第二经加权的下混合信号(77)不同,并且
其中,所述上混合器(212)被配置为使用所述第一经加权的下混合信号(76)和所述残差信号(209)的组合(72)并使用所述第二经加权的下混合信号(77)和所述残差信号(209)的第二组合(73)来计算所述重构的第一声道。
25.根据权利要求24所述的装置,
其中,所述上混合器(212)被配置为在计算所述重构的第一声道(213)时,使用第一组合规则来组合(72)所述经加权的下混合信号(76)和所述残差信号(209),以及
其中,所述上混合器(212)被配置为在计算所述重构的第二声道(214)时,使用第二组合规则来组合(73)所述第二经加权的下混合信号(77)和所述残差信号(209),其中所述第一组合规则与所述第二组合规则彼此不同,或者
其中,所述第一组合规则和所述第二组合规则中的一个是加法操作,而所述第一组合规则和所述第二组合规则中的另一个是减法操作。
26.根据权利要求24所述的装置,
其中,所述上混合器(212)被配置为执行包括根据所述边增益与第一预定数之和而导出的加权因子在内的所述第一加权操作(70),并且
其中,所述上混合器(212)被配置为执行包括根据第二预定数与所述边增益之差导出的加权因子在内的所述第二加权操作(71),其中所述第一预定数和所述第二预定数彼此相等或彼此不同。
27.根据权利要求24所述的装置,
其中,所述残差信号合成器(208)被配置为使用当前帧的所述残差增益(209)对前一帧的下混合信号(207)进行加权,以获得所述当前帧的所述残差信号(209),或者
使用所述当前帧的所述残差增益(205)来对根据所述当前帧或根据一个或多个先前帧而导出(80)的经去相关的信号进行加权(87),以获得所述当前帧的所述残差信号(209)。
28.根据权利要求24所述的装置,
其中,所述残差信号合成器(208)被配置为计算所述残差信号(209),使得所述残差信号(209)的能量等于由所述残差增益(205)指示的信号能量。
29.根据权利要求24所述的装置,
其中,所述残差信号合成器(208)被配置为计算所述残差信号,使得所述残差信号的值在基于以下等式确定的值的±20%的范围内:
其中Rt,k是帧t和频率段k的残差信号,其中是帧t和包括频率段k在内的子带b的所述残差增益,其中/>是残差信号,并且其中gnorm是能够存在或不存在的能量归一化因子。
30.根据权利要求23所述的装置,
其中,gnorm是值在由下式确定的值的±20%的范围内的所述能量归一化因子:
其中,是帧t和子带b的所述下混合信号的能量,并且其中/>是子带b和帧t的所述残差信号的能量,或者
其中,基于以下等式确定所述残差信号的原始信号:
其中,是所述残差信号的所述原始信号,
其中是帧t-tb和频率段k的所述下混合信号,其中db是大于0的帧延迟,或者
其中,所述上混合器(212)被配置为计算所述重构的第一声道(213)和所述重构的第二声道(214),使得所述重构的第一声道(213)和所述重构的第二声道(214)的值在相对于由以下等式确定的值的±20%的范围内:
以及
其中是帧t和频率段k的所述下混合信号,其中/>是帧t和子带b的所述边增益,其中/>是帧t和子带b的所述残差增益,其中gnorm是能够存在或不存在的能量归一化因子,并且其中/>是帧t和频率段k的原始残差信号。
31.根据权利要求17所述的装置,
其中,所述上混合器(212)被配置为在频谱域中计算所述重构的第一声道(213)和所述重构的第二声道(214),
其中,所述装置还包括频谱时间转换器(216),所述频谱时间转换器(216)用于将所述重构的第一声道(213)和所述重构的第二声道(214)转换到时域,
其中,所述上混合器被配置为仅当所述所述重构的第一声道(213)和所述重构的第二声道(214)之间的能量差大于预定义阈值时,使具有较低能量的声道比具有较高能量的声道旋转得更多。
32.根据权利要求31所述的装置,
其中,所述频谱时间转换器(216)被配置为针对所述重构的第一声道(213)和所述重构的第二声道(214)中的每一个,将随后的帧转换(301)为帧的时间序列;
使用合成窗口对每个时间帧进行加权(1312);以及
对随后窗口化的时间帧进行重叠和相加(1314)以获得所述重构的第一声道(217)的时间块和所述重构的第二声道(218)的时间块。
33.一种对包括至少两个声道(101、102)在内的多声道信号(100)进行下混合的方法,包括:
根据所述多声道信号(100)来计算(34)下混合信号(122),其中所述计算包括:使用绝对相位旋转参数来计算所述下混合信号,使得在计算所述下混合信号(122)时,所述至少两个声道(101、102)中的仅具有较低能量的声道被旋转,或者使所述至少两个声道(101、102)中的具有较低能量的声道比具有较高能量的声道旋转得更强;以及
产生(160)输出信号,所述输出信号包括与所述下混合信号(122)有关的信息。
34.一种对经编码的多声道信号(200)进行上混合的方法,包括:
接收(204)所述经编码的多声道信号(200),并且根据所述经编码的多声道信号(200)获得下混合信号(207);
对所述下混合信号(207)进行上混合(212),所述上混合包括:使用绝对相位旋转参数来计算重构的第一声道(213)和重构的第二声道(214),使得在重构所述重构的第一声道(213)和所述重构的第二声道(214)中的具有较低能量的声道时仅旋转所述下混合信号,或者在重构所述重构的第一声道(213)和所述重构的第二声道(214)中的具有较低能量的声道时使所述下混合信号比所述重构的第一声道(213)和所述重构的第二声道(214)中的具有较高能量的声道旋转得更强。
35.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于当在计算机或处理器上运行时执行根据权利要求33所述的方法或权利要求34所述的方法。
CN201780080571.2A 2016-11-08 2017-10-30 使用相位补偿对多声道信号进行下混合或上混合的装置和方法 Active CN110114826B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311048157.7A CN116994592A (zh) 2016-11-08 2017-10-30 使用相位补偿对多声道信号进行下混合或上混合的装置和方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16197816 2016-11-08
EP16197816.8 2016-11-08
PCT/EP2017/077824 WO2018086948A1 (en) 2016-11-08 2017-10-30 Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202311048157.7A Division CN116994592A (zh) 2016-11-08 2017-10-30 使用相位补偿对多声道信号进行下混合或上混合的装置和方法

Publications (2)

Publication Number Publication Date
CN110114826A CN110114826A (zh) 2019-08-09
CN110114826B true CN110114826B (zh) 2023-09-05

Family

ID=60190886

Family Applications (4)

Application Number Title Priority Date Filing Date
CN201780080571.2A Active CN110114826B (zh) 2016-11-08 2017-10-30 使用相位补偿对多声道信号进行下混合或上混合的装置和方法
CN202311619874.0A Pending CN117676451A (zh) 2016-11-08 2017-10-30 使用边增益和残差增益对多声道信号进行编码或解码的装置和方法
CN202311048157.7A Pending CN116994592A (zh) 2016-11-08 2017-10-30 使用相位补偿对多声道信号进行下混合或上混合的装置和方法
CN201780079910.5A Active CN110100279B (zh) 2016-11-08 2017-10-30 对多声道信号进行编码或解码的装置和方法

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN202311619874.0A Pending CN117676451A (zh) 2016-11-08 2017-10-30 使用边增益和残差增益对多声道信号进行编码或解码的装置和方法
CN202311048157.7A Pending CN116994592A (zh) 2016-11-08 2017-10-30 使用相位补偿对多声道信号进行下混合或上混合的装置和方法
CN201780079910.5A Active CN110100279B (zh) 2016-11-08 2017-10-30 对多声道信号进行编码或解码的装置和方法

Country Status (19)

Country Link
US (4) US11488609B2 (zh)
EP (4) EP3761311A1 (zh)
JP (5) JP7008716B2 (zh)
KR (2) KR102327767B1 (zh)
CN (4) CN110114826B (zh)
AR (2) AR110146A1 (zh)
AU (3) AU2017357454B2 (zh)
BR (2) BR112019009318A2 (zh)
CA (3) CA3127805C (zh)
ES (2) ES2938244T3 (zh)
FI (1) FI3539125T3 (zh)
MX (2) MX2019005147A (zh)
MY (1) MY196198A (zh)
PL (2) PL3539126T3 (zh)
PT (2) PT3539125T (zh)
RU (2) RU2727799C1 (zh)
TW (2) TWI664625B (zh)
WO (2) WO2018086947A1 (zh)
ZA (2) ZA201903535B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI3539125T3 (fi) * 2016-11-08 2023-03-21 Fraunhofer Ges Forschung Laite ja menetelmä monikanavasignaalin koodaamiseksi ja dekoodaamiseksi käyttäen sivuvahvistusta ja jäännösvahvistusta
EP3588495A1 (en) * 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding
CN115132214A (zh) 2018-06-29 2022-09-30 华为技术有限公司 立体声信号的编码、解码方法、编码装置和解码装置
WO2020178321A1 (en) * 2019-03-06 2020-09-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer and method of downmixing
EP3928315A4 (en) 2019-03-14 2022-11-30 Boomcloud 360, Inc. SPATIALLY SENSITIVE MULTIBAND COMPRESSION SYSTEM WITH PRIORITY
US11361776B2 (en) * 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
US11538489B2 (en) 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
JP7380838B2 (ja) 2020-03-09 2023-11-15 日本電信電話株式会社 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体
WO2021181746A1 (ja) * 2020-03-09 2021-09-16 日本電信電話株式会社 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
JP7396459B2 (ja) 2020-03-09 2023-12-12 日本電信電話株式会社 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
WO2021181472A1 (ja) * 2020-03-09 2021-09-16 日本電信電話株式会社 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体
WO2022074201A2 (en) 2020-10-09 2022-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, or computer program for processing an encoded audio scene using a bandwidth extension
JP2023549033A (ja) 2020-10-09 2023-11-22 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン パラメータ平滑化を用いて符号化されたオーディオシーンを処理するための装置、方法、またはコンピュータプログラム
JP2023549038A (ja) 2020-10-09 2023-11-22 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン パラメータ変換を用いて符号化されたオーディオシーンを処理するための装置、方法、またはコンピュータプログラム
CN116962955A (zh) * 2022-04-15 2023-10-27 华为技术有限公司 多通道的混音方法、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101552007A (zh) * 2004-03-01 2009-10-07 杜比实验室特许公司 多信道音频编码
WO2010097748A1 (en) * 2009-02-27 2010-09-02 Koninklijke Philips Electronics N.V. Parametric stereo encoding and decoding
CN102446507A (zh) * 2011-09-27 2012-05-09 华为技术有限公司 一种下混信号生成、还原的方法和装置
AU2013206557A1 (en) * 2009-03-17 2013-07-18 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
EP2790419A1 (en) * 2013-04-12 2014-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
US9269361B2 (en) * 2010-10-22 2016-02-23 France Telecom Stereo parametric coding/decoding for channels in phase opposition

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6161089A (en) 1997-03-14 2000-12-12 Digital Voice Systems, Inc. Multi-subframe quantization of spectral parameters
MY149792A (en) * 1999-04-07 2013-10-14 Dolby Lab Licensing Corp Matrix improvements to lossless encoding and decoding
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
KR100490717B1 (ko) * 2000-03-28 2005-05-24 인터디지탈 테크날러지 코포레이션 전송 전에 사전 회전을 이용하는 코드 분할 다중 접속시스템
DE60311794C5 (de) * 2002-04-22 2022-11-10 Koninklijke Philips N.V. Signalsynthese
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
JPWO2005081229A1 (ja) * 2004-02-25 2007-10-25 松下電器産業株式会社 オーディオエンコーダ及びオーディオデコーダ
KR101079066B1 (ko) * 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
PL1866911T3 (pl) * 2005-03-30 2010-12-31 Koninl Philips Electronics Nv Skalowalne, wielokanałowe kodowanie dźwięku
KR100878371B1 (ko) * 2005-04-19 2009-01-15 돌비 스웨덴 에이비 공간적 오디오 파라미터들의 효율적인 부호화를 위한에너지 종속 양자화
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
CN101390443B (zh) * 2006-02-21 2010-12-01 皇家飞利浦电子股份有限公司 音频编码和解码
US7536006B2 (en) 2006-07-21 2009-05-19 Motorola, Inc. Method and system for near-end detection
CN101479787B (zh) * 2006-09-29 2012-12-26 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
KR101453732B1 (ko) * 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统
RU2443075C2 (ru) 2007-10-09 2012-02-20 Конинклейке Филипс Электроникс Н.В. Способ и устройство для генерации бинаурального аудиосигнала
MX2010012580A (es) * 2008-05-23 2010-12-20 Koninkl Philips Electronics Nv Aparato de mezcla ascendente estereo parametrico, decodificador estereo parametrico, aparato de mezcla descendente estereo parametrico, codificador estereo parametrico.
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
EP2374124B1 (fr) * 2008-12-15 2013-05-29 France Telecom Codage perfectionne de signaux audionumériques multicanaux
EP2374123B1 (fr) * 2008-12-15 2019-04-10 Orange Codage perfectionne de signaux audionumeriques multicanaux
US9082395B2 (en) * 2009-03-17 2015-07-14 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
JP5212407B2 (ja) 2009-03-24 2013-06-19 株式会社豊田中央研究所 熱疲労試験装置
MX2011006248A (es) 2009-04-08 2011-07-20 Fraunhofer Ges Forschung Aparato, metodo y programa de computacion para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavizacion de valor de fase.
JP4725691B2 (ja) 2009-08-31 2011-07-13 凸版印刷株式会社 コーティング量測定方法及び装置、コーティング量判定方法及び装置、並びにコーティング装置、コーティング製品の製造方法
EP2323130A1 (en) 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
RU2425040C1 (ru) * 2010-02-24 2011-07-27 Новосибирский институт органической химии им. Н.Н. Ворожцова Сибирского отделения Российской академии наук (НИОХ СО РАН) Способ получения 2,3-эпоксипинана из скипидара
AU2011237882B2 (en) * 2010-04-09 2014-07-24 Dolby International Ab MDCT-based complex prediction stereo coding
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
BR112012026324B1 (pt) 2010-04-13 2021-08-17 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável
KR20110116079A (ko) * 2010-04-17 2011-10-25 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
EP2609590B1 (en) 2010-08-25 2015-05-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for decoding a signal comprising transients using a combining unit and a mixer
KR20120038311A (ko) * 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
AR088777A1 (es) * 2011-03-18 2014-07-10 Fraunhofer Ges Forschung Transmision de longitud de elemento de cuadro en la codificacion de audio
UA107771C2 (en) 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
KR20140128564A (ko) 2013-04-27 2014-11-06 인텔렉추얼디스커버리 주식회사 음상 정위를 위한 오디오 시스템 및 방법
EP2838086A1 (en) 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
TWI579831B (zh) 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
EP3067889A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
CA3011915C (en) 2016-01-22 2021-07-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for estimating an inter-channel time difference
FI3539125T3 (fi) * 2016-11-08 2023-03-21 Fraunhofer Ges Forschung Laite ja menetelmä monikanavasignaalin koodaamiseksi ja dekoodaamiseksi käyttäen sivuvahvistusta ja jäännösvahvistusta
GB2559199A (en) * 2017-01-31 2018-08-01 Nokia Technologies Oy Stereo audio signal encoder
RU2741379C1 (ru) * 2017-07-28 2021-01-25 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Оборудование для кодирования или декодирования кодированного многоканального сигнала с использованием заполняющего сигнала, сформированного посредством широкополосного фильтра

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101552007A (zh) * 2004-03-01 2009-10-07 杜比实验室特许公司 多信道音频编码
WO2010097748A1 (en) * 2009-02-27 2010-09-02 Koninklijke Philips Electronics N.V. Parametric stereo encoding and decoding
AU2013206557A1 (en) * 2009-03-17 2013-07-18 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
US9269361B2 (en) * 2010-10-22 2016-02-23 France Telecom Stereo parametric coding/decoding for channels in phase opposition
CN102446507A (zh) * 2011-09-27 2012-05-09 华为技术有限公司 一种下混信号生成、还原的方法和装置
EP2790419A1 (en) * 2013-04-12 2014-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"A Stereo to Mono Dowmixing Scheme for MPEG-4 Parametric Stereo Encoder";SAMSUDIN等;《ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2006》;20061231;全文 *

Also Published As

Publication number Publication date
CA3042580C (en) 2022-05-03
TW201820310A (zh) 2018-06-01
CN110114826A (zh) 2019-08-09
WO2018086948A1 (en) 2018-05-17
JP7443307B2 (ja) 2024-03-05
US11488609B2 (en) 2022-11-01
BR112019009318A2 (pt) 2019-07-30
AU2021202390B2 (en) 2022-12-15
EP4167233A1 (en) 2023-04-19
PL3539126T3 (pl) 2021-04-06
KR102327767B1 (ko) 2021-11-17
US20190259395A1 (en) 2019-08-22
EP3539126A1 (en) 2019-09-18
ZA201903534B (en) 2021-04-28
AR110148A1 (es) 2019-02-27
WO2018086947A1 (en) 2018-05-17
JP2022003405A (ja) 2022-01-11
ES2834083T3 (es) 2021-06-16
MY196198A (en) 2023-03-22
JP2019536112A (ja) 2019-12-12
AU2017357453A1 (en) 2019-05-30
CN117676451A (zh) 2024-03-08
CA3045948C (en) 2023-09-19
ES2938244T3 (es) 2023-04-05
TWI664625B (zh) 2019-07-01
JP7102427B2 (ja) 2022-07-19
JP2022132345A (ja) 2022-09-08
EP3539125A1 (en) 2019-09-18
EP3539125B1 (en) 2022-11-30
CN116994592A (zh) 2023-11-03
CA3127805C (en) 2023-12-19
PL3539125T3 (pl) 2023-05-15
RU2725178C1 (ru) 2020-06-30
JP2024008967A (ja) 2024-01-19
EP3539126B1 (en) 2020-09-30
US20220392464A1 (en) 2022-12-08
US20190259398A1 (en) 2019-08-22
US11450328B2 (en) 2022-09-20
KR20190072647A (ko) 2019-06-25
JP2020500336A (ja) 2020-01-09
FI3539125T3 (fi) 2023-03-21
KR102291811B1 (ko) 2021-08-23
AU2017357454A1 (en) 2019-06-27
MX2019005147A (es) 2019-06-24
PT3539126T (pt) 2020-12-24
CA3045948A1 (en) 2018-05-17
CN110100279A (zh) 2019-08-06
TW201830379A (zh) 2018-08-16
JP7008716B2 (ja) 2022-01-25
AU2017357454B2 (en) 2021-02-04
CA3042580A1 (en) 2018-05-17
EP3761311A1 (en) 2021-01-06
KR20190082870A (ko) 2019-07-10
US20220293111A1 (en) 2022-09-15
CA3127805A1 (en) 2018-05-17
AU2021202390A1 (en) 2021-05-20
RU2727799C1 (ru) 2020-07-24
CN110100279B (zh) 2024-03-08
BR112019009315A2 (pt) 2019-07-30
PT3539125T (pt) 2023-01-27
AU2017357453B2 (en) 2021-01-28
AR110146A1 (es) 2019-02-27
TWI669705B (zh) 2019-08-21
MX2019005145A (es) 2019-06-24
ZA201903535B (en) 2021-04-28

Similar Documents

Publication Publication Date Title
CN110114826B (zh) 使用相位补偿对多声道信号进行下混合或上混合的装置和方法
CN110998721B (zh) 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant