CN102598122A - 参量编码和解码 - Google Patents

参量编码和解码 Download PDF

Info

Publication number
CN102598122A
CN102598122A CN2010800514151A CN201080051415A CN102598122A CN 102598122 A CN102598122 A CN 102598122A CN 2010800514151 A CN2010800514151 A CN 2010800514151A CN 201080051415 A CN201080051415 A CN 201080051415A CN 102598122 A CN102598122 A CN 102598122A
Authority
CN
China
Prior art keywords
weight
signal
channel
energy
mixing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800514151A
Other languages
English (en)
Other versions
CN102598122B (zh
Inventor
A.C.登布林克
E.G.P.舒伊杰斯
A.W.J.奥门
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN102598122A publication Critical patent/CN102598122A/zh
Application granted granted Critical
Publication of CN102598122B publication Critical patent/CN102598122B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

一种用于多通道音频信号的编码器,所述编码器包括:下混合器(201、203、205),用于生成作为至少分别由第一和第二权重加权的第一和第二通道信号的组合的下混合,该第一和第二权重对于至少一些时频间隔具有不同的幅度。此外,电路(201、203、209)生成表征通道信号之间关系以及表征权重的上混合参量数据。电路根据上混合参量数据生成编码器权重的权重估计;以及包括上混合器(407),其响应于上混合参量数据、第一权重估计和第二权重估计,通过对该下混合进行上混合来重新创建多通道音频信号,该上混合取决于一个或多个权重估计的至少一个的幅度。

Description

参量编码和解码
技术领域
本发明涉及参量(parametric)编码和解码,并且尤其涉及使用下混合(down-mixing)和参量上混合(up-mixing)数据的多通道信号的参量编码和解码。
背景技术
随着数字信号表示和通信逐渐取代模拟表示和通信,各种源信号的数字编码在过去的几十年里已变得日益重要。例如,诸如视频和音乐的媒体内容的分发愈加基于数字内容编码。
多通道信号的编码可以通过将多通道信号下混合成更少的通道并对这些通道进行编码和传输来执行。例如,立体声信号可以被下混合成单声道信号,该单声道信号随后被编码。在参量多通道编码中,此外生成参量数据,其支持下混合的上混合以重新创建原始的多通道信号(的近似值)。使用下混合/上混合以及关联的参量数据的多通道系统的示例包括称为参量立体声(PS)标准的技术以及其到多通道参量编码的扩展(例如,环绕MPEG:MPS)。
以其最简单的形式,将立体声信号下混合成单声道信号可以简单地通过生成两个立体声通道的均值,即通过简单地生成中信号或和信号来执行。该单声道信号随后可以被分发并可以进一步直接用作单声道信号。在诸如由参数立体声使用的编码方法中,除了下混合信号还提供了立体声提示(stereo cue)。具体地,通道间等级差异、时差或相位差和相干或相关性参数按照时频分块(其典型地对应于频率轴的Bark或ERB带(band)划分和时间轴的固定均匀分割)来确定。该数据典型地与下混合信号一起被分发并允许通过取决于参数的上混合进行的原始立体声信号的精确重新创建。
然而,众所周知的是,创建中信号(mid signal)典型地导致稍微枯燥的信号,即具有降低的亮度/高频内容。原因是对于典型的音频信号,不同通道针对低频而不是针对较高频率趋于相当相关的。两个立体声通道的直接求和有效地抑制了未对齐的(non-aligned)信号分量。事实上,对于左信号和右信号完全异相位的频率子带来说,获得的中信号为0。
已提出的解决方案是在执行求和之前使用通道的相位对齐。因此,理想地,在左信号和右信号被加到一起之前,针对频域中的任何相位差(对应于时域中的时间差)对该左信号和右信号进行补偿。然而,这样的方法趋于复杂并可能引入算法延迟。同时,在实践中,该方法趋于未提供最佳的质量。例如,如果测量了通道间的相位差,则存在是否将左通道相位对齐到右通道相位的模糊性,或者反之亦然。同时,尝试偏移两个通道的相位同样导致模糊性。进一步地,当相关性为低时,相位差在数值上是劣性的,从而导致不精确和健壮的系统。当通过相位对齐创建下混合时,全部这些问题趋于导致可察觉到的伪像。典型地,音调分量的调制由该方法造成。
结果,最实用的系统趋于使用简单地作为左信号和右信号的平均值(mean)生成的所谓被动(passive)下混合。不幸地,被动下混合也具有一些关联的缺点。缺点的其中之一是声学能量可能大量地降低并且对于异相位信号甚至完全丧失。所提出的用于解决该问题的方法是使用所谓的主动下混合,其中下混合被重新按比例调整(rescale)以具有与原始信号相同的能量。另一提出的解决方案是提供解码器侧能量补偿。然而,这样的补偿趋于在更总体的等级上,而没有区别(补偿是必要的)声调分量和(补偿不是必要的)噪音。此外,在被动和主动下混合两种方法中,问题出现在接近异相位的信号。事实上,在下混合信号中,异相位分量是完全缺少的。
因此,针对多通道参量编码/解码的改进系统将会是有利的,并且尤其是对于允许增加的灵活性、便于操作、便于实现、降低的复杂性、改进的健壮性、异相位信号分量的改进编码、降低的数据率对质量比和/或改进的性能的系统将会是有利的。
发明内容
相应地,本发明寻求优选地单独或以任意组合来减轻、缓解或消除以上提及的缺点的一个或多个。
根据本发明的一方面,提供了一种用于生成多通道音频信号的解码器,所述解码器包括:第一接收器,用于接收作为至少由第一权重加权的第一通道信号和由第二权重加权的第二通道信号的组合的下混合,第一权重和第二权重对于至少一些时频间隔具有不同的幅度;第二接收器,用于接收表征第一通道信号和第二通道信号之间关系的上混合参量数据;电路,用于根据上混合参量数据生成第一权重的第一权重估计和第二权重的第二权重估计;以及上混合器,用于响应于上混合参量数据、第一权重估计和第二权重估计,通过对所述下混合进行上混合来生成多通道音频信号,所述上混合取决于第一权重估计和第二权重估计的至少一个的幅度。
本发明可以在很多场景中可以获得改进的和/或便利的操作。该方法可以典型地减轻异相位的问题和/或相位对齐编码的缺点。该方法可以往往获得改进的音频质量而不必增加数据速率。经常可以实现更健壮的编码/解码系统,并且尤其是,编码/解码可以对特定的信号条件更不敏感。该方法可以获得低复杂度的实现和/或具有低的计算资源需求。
该处理可以是基于子带的。编码和解码可以在频率子带和时间间隔中执行。具体地,可以为每个频率子带和每个(时间)分段与下混合信号值一起提供第一权重和第二权重。可以通过在每个子带中单独组合由用于该子带的权重加权的第一和第二通道信号的频率子带值 生成下混合。子带的权重(以及因此的权重估计)对于第一和第二通道信号的至少一些值具有不同的幅度(以及因此的能量)。每个时频间隔可以具体地对应于编码/解码时间分段和频率子带。
上混合参量数据包括可以用来根据下混合生成与原始下混合的多通道信号相对应的上混合的参数。上混合参量数据可以具体地包括通道间等级差(ILD)、通道间相干性/相关性(IC/ICC)、通道间相位差(IPD)和/或通道间时间差(ITD)参数。可以为频率子带提供参数,并且该参数可以提供有合适的更新间隔。具体地,可以对于每个编码/解码时间分段、为多个频率带的每一个提供参数集合。用于参量数据的频率带和/或时间分段可以与用于下混合的频率带和/或时间分段相等,但是不需要一定相等。例如,相同的频率子带可以用于较低的频率但不可以用于较高的频率。因此,第一和第二权重的时频分辨率与上混合参量数据的参数不需要相等。
对于一些信号值,第一和第二权重(并且因此相应的权重估计)之一在一个子带中可以为零。第一和第二通道信号的组合可以是线性组合,例如具体是在求和之前通过相应的权重按比例调整的每个信号的线性求和。
多通道信号包括两个或更多通道。具体地,多通道信号可以是双通道(立体声)信号。
该方法可以尤其减轻异相位问题以提供更健壮的系统,同时维持低的复杂度和低的数据速率。具体地,该方法可以允许确定不同(具有不同幅度)的权重而无需发送另外的数据。因此,可以获得改进的音频质量而不必增加数据速率。
第一和/或第二权重估计的确定可以使用与(假设)用于在编码器中确定第一和/或第二权重相同的方法。在许多实施例中,可以基于用于根据上混合参量数据的参数确定权重/权重估计的假设的函数来确定一个或两个权重/权重估计。
解码器可以不具有所接收信号的精确特性的明确信息,但是可以简单地通过以下假设来操作,即下混合是至少以第一权重加权的第一通道信号和以第二权重加权的第二通道信号的组合,其中第一权重和第二权重对于至少一些时频间隔具有不同的幅度。时频间隔可以对应于时间间隔、频率间隔或者时间间隔和频率间隔的组合,诸如例如时间分段中的频率子带。
根据本发明可选的特征,电路被布置为利用与针对所述至少一些时频间隔的参量数据的至少一些参数的不同关系生成第一权重估计和第二权重估计。
这可以获得改进的编码/解码系统,并尤其可以减轻异相位的问题以提供更加健壮的系统。根据参数确定权重估计的函数可以因此对于两个权重是不同的,以使得相同的参数将导致具有不同幅度的权重估计。
编码器可以相应地被布置为确定第一权重和第二权重具有与针对所述至少一些时频间隔的参量数据的至少一些参数不同的关系。
时频间隔可以对应于时间间隔、频率间隔或时间间隔和频率间隔的组合,诸如例如时间分段中的频率子带。
根据本发明可选的特征,上混合器被布置为将第一权重估计和第二权重估计的至少一个确定为上混合参量数据的能量参数的函数,该能量参数指示第一通道信号和第二通道信号的相对能量特性。
这可以提供改进的性能和/或便利的操作和/或实现。能量考虑对于确定合适的权重可以是尤其相关的,并且这些可以相应地被更合适地表示并与上混合参量数据的能量参数相互关联。因此,使用能量参数来确定权重/权重估计实现了允许确定具有不同幅度的权重/权重估计的信息的高效传输。具体地,使用能量参数来确定权重/权重估计允许高效地确定权重的幅度而不仅仅是权重的相位。能量参数可以具体地提供第一通道信号、第二通道信号、第一通道信号和第二通道信号之间的差或者组合信号的能量(例如交叉功率特性)的能量(或等效地,功率)特性的信息。
根据本发明的可选特征,能量参数是以下各项之一:通道间强度差IID参数、通道间等级差ILD参数和通道间相干性/相关性IC/ICC参数。
这可以提供尤其有利的性能并可以提供改进的向后兼容性。
根据本发明的可选特征,上混合参量数据包括第一权重和第二权重,与上混合参量数据之间关系的准确度指示,并且解码器被布置为响应于该准确度指示生成第一权重估计和第二权重估计的至少一个。
这可以在很多场景中提供改进的性能并尤其可以实现不同信号条件的更准确权重估计的改进确定。
准确度指示可以指示在根据参量数据计算权重估计时可以获取的权重估计的准确度。该准确度指示可以具体地指示可获得的准确度是否满足准确度标准。例如准确度指示可以是简单地指示是否可以使用该参量数据的二元指示。准确度指示可以包括每个子带的单独值,或者可以包括可应用于多个甚至所有子带的一个或多个指示。
解码器可以被布置为只有准确度指示表明足够的准确度时才根据参量数据来估计权重估计。
根据本发明的可选特征,针对至少一个频率间隔的第一权重和第二权重的至少一个具有比上混合参量数据的相应参数更精细的频时分辨率。
这在许多场景中可以提供改进的性能,因为更准确的权重可以用来生成下混合,而同时允许维持低的数据速率。
类似地,针对至少一个频率间隔的第一权重估计和第二权重估计的至少一个可以具有比上混合参量数据的相应参数更精细的频时分辨率。
该相应的参数是包括相同的时间频率间隔的参数。在许多实施例中,解码器可以继续进行以基于相应的参数生成第一和/或第二权重的估计。因此,虽然参数可以表示较大的时间和/或频率间隔上的信号特性,但是它仍旧可以用作权重的时间和/或频率间隔的近似。
根据本发明的可选特征,上混合器被布置为生成针对所述响应于参量数据的整体相位差值,并且响应于该整体相位差值执行上混合,该整体相位差值取决于第一权重估计和第二权重估计。
这可以允许高质量的高效解码。在一些场景中,其可以提供改进的向后兼容性。OPD单独地取决于第一和第二权重估计两者(包括其幅度),并且可以具体地被定义为权重的函数,即OPD=f(w1,w2
上混合可以例如基本上生成为:
Figure DEST_PATH_IMAGE001
其中s是下混合信号而sd是解码器生成的下混合信号的解相关(decorrelated)的信号。c1和c2为增益参数,其用来确保恢复左和右输出通道之间的正确等级差。
Figure 611111DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE003
是可以根据上混合参量数据生成的值。
OPD值可以例如基本上生成为:
Figure 465934DEST_PATH_IMAGE004
或者例如基本上为:
Figure DEST_PATH_IMAGE005
其中w1 和w2分别是第一和第二权重,并且下混合信号通过 
Figure 245672DEST_PATH_IMAGE006
来生成。
根据本发明的可选特征,除了整体相位差值以外,上混合独立于第一权重估计和第二权重估计的至少一个的幅度。
这可以获得改进的性能和/或操作。
根据本发明的可选特征,上混合器被布置为:根据下混合生成解相关的信号,该解相关的信号与该下混合解相关;通过将矩阵乘法应用到下混合和解相关的信号来对该下混合进行上混合,其中该矩阵乘法的系数取决于第一权重估计和第二权重估计。
这可以获得高质量的高效解码。在一些场景中它可以提供改进的向后兼容性。
矩阵乘法可以包括表示根据下混合信号预测差信号的预测系数。预测系数可以根据权重来确定。矩阵乘法可以包括表示来自解相关信号的差信号的贡献的解相关缩放因子。解相关缩放因子可以根据权重来确定。
矩阵乘法的系数可以根据估计的权重来确定。不同的系数对第一和第二权重可以具有不同的依赖性,并且第一和第二权重可以不同地影响每个系数。
上混合可以具体地基本上执行为:
其中是预测因子,
Figure 330619DEST_PATH_IMAGE003
是解相关缩放因子,s是下混合,sd是解码器生成的解相关的信号,w1和w2分别是第一和第二权重并且*表示复共轭。
和/或
Figure 420115DEST_PATH_IMAGE003
可以例如根据估计的权重和参量数据基本上确定为:
Figure 55233DEST_PATH_IMAGE008
Figure DEST_PATH_IMAGE009
根据本发明的可选特征,上混合器被布置为通过以下步骤确定第一权重估计:响应于上混合参量数据确定第一能量度量,其指示第一通道信号和第二通道信号的非相位对齐组合的能量;响应于上混合参量数据确定第二能量度量,其指示第一通道和第二通道的相位对齐组合的能量;确定第一能量度量相对于第二能量度量的第一度量;响应于第一度量,确定第一权重估计。
这可以提供第一权重估计的高度有利的确定。该特征可以提供改进的性能和/或便利的操作。
第一能量度量可以是第一通道信号和第二通道信号的求和的能量的指示。第二能量度量可以是第一通道信号和第二通道信号的相干求和的能量的指示。第一度量可以表示第一通道信号和第二通道信号之间相位抵消程度的指示。第一和/或第二能量度量可以是能量的任意指示,并且可以具体涉及例如相对于第一和/或第二通道信号的能量的能量归一化度量。
第一度量可以例如被确定为第一能量度量和第二能量度量之间的比率。例如,第一度量可以被基本上确定为:
Figure 724112DEST_PATH_IMAGE010
第一权重可以被确定为第一度量的非线性和/或单调函数。第二权重可以例如根据第一权重来确定,以例如使得两个权重的幅度之和具有预定的值。在一些实施例中,生成第一和/或第二权重可以包括下混合能量的归一化。例如,权重可以按比例调整以获得基本上具有与左通道信号的能量和右通道信号的能量之和相同的能量的下混合。
权重可以具体地被基本上生成如下:
Figure DEST_PATH_IMAGE011
或者
Figure 655159DEST_PATH_IMAGE012
结合
Figure DEST_PATH_IMAGE013
Figure 347172DEST_PATH_IMAGE014
获得
Figure DEST_PATH_IMAGE015
Figure 21867DEST_PATH_IMAGE016
其中c被选择以提供期望的能量归一化。
编码器可以执行相同的操作并导出如参考该编码器所述的第一权重(和可能的第二权重)。
根据本发明的可选特征,上混合器被布置为通过以下步骤确定第一权重估计:针对多个第一权重和第二权重的预定值对的每一个,响应于参量数据确定指示与所述预定值对相对应的下混合能量的能量度量;并且响应于所述能量度量和所述预定值对确定第一权重。
这可以提供对第一权重估计的高度有利确定。该特征可以提供改进的性能和/或便利的操作。
解码器可以假设下混合是使用预定的固定权重的多个下混合的组合,该组合取决于每个下混合的信号能量。因此,第一权重估计(和/或第二权重估计)可以被确定为对应于预定的权重的组合,其中响应于下混合的每一个的估计能量(或等效地,功率)来确定各个预定权重的组合。每个下混合的估计能量可以基于上混合参量数据来确定。
具体地,第一权重估计可以通过将预定值对与每个预定值对的加权组合来确定,该加权取决于预定值对的能量度量。
预定值对的能量度量可以具体地被基本上确定为:
Figure DEST_PATH_IMAGE017
其中m是预定权重对的索引,而M(m, k)表示第m个预定权重对的第k个权重。
在一些实施例中,可以对权重对的一个或多个引入偏置。例如,能量度量可以被确定为:
Figure 545252DEST_PATH_IMAGE018
其中
Figure DEST_PATH_IMAGE019
是可以为下混合的一个或多个引入另外偏置的偏置函数。该偏置函数可以是上混合参量数据的函数。
根据本发明的一方面,提供了一种用于生成至少包括第一通道和第二通道的多通道音频信号的编码表示的编码器,所述编码器包括:下混合器,用于生成作为至少以第一权重加权的第一通道的第一通道信号和以第二权重加权的第二通道的第二通道信号的组合的下混合,所述第一权重和所述第二权重对于至少一些时频间隔具有不同的幅度;用于生成表征第一通道信号和第二通道信号之间关系的上混合参量数据的电路,该上混合参量数据进一步对第一权重和第二权重进行表征;以及用于生成编码表示以包括所述下混合和所述上混合参量数据的电路。
这可以提供与上述解码器兼容的尤其有利的编码。将会明了,参考解码器提供的大多数说明同样酌情适于编码器。
第一和第二权重可以不包括在上混合参量数据中,或者事实上可以不通过编码器来传输或分发。下混合可以根据任何合适的编码算法来编码。
根据本发明的可选特征,下混合器被布置为:确定指示第一通道信号和第二通道信号的非相位对齐组合的能量的第一能量度量;确定指示第一通道信号和第二通道信号的相位对齐组合的能量的第二能量度量;确定第一能量度量相对于第二能量度量的第一度量;以及响应于所述第一度量,确定第一权重和第二权重。
这可以提供尤其有利的编码。
根据本发明的可选特征,下混合器被布置为:为第一权重和第二权重的多个预定值对的每一个生成下混合;为这些下混合的每一个确定指示下混合能量的能量度量;以及响应于该能量度量通过组合这些下混合来生成下混合。
这可以提供尤其有利的编码。
根据本发明的一方面,提供了一种生成多通道音频信号的方法,该方法包括:接收作为至少以第一权重加权的第一通道信号和以第二权重加权的第二通道信号的组合的下混合,所述第一权重和所述第二权重对于至少一些时频间隔具有不同的幅度;接收表征第一通道信号和第二通道信号之间关系的上混合参量数据;根据上混合参量数据生成第一权重的第一权重估计和第二权重的第二权重估计;以及响应于上混合参量数据、第一权重估计和第二权重估计,通过对该下混合进行上混合来生成所述多通道音频信号,所述上混合取决于第一权重估计和第二权重估计的至少一个的幅度。
根据本发明的一方面,提供了一种生成至少包括第一通道和第二通道的多通道音频信号的编码表示的方法,该方法包括:生成作为至少以第一权重加权的第一通道的第一通道信号和以第二权重加权的第二通道的第二通道信号的组合的下混合,所述第一权重和所述第二权重对于至少一些时频间隔具有不同的幅度;生成表征第一通道信号和第二通道信号之间关系的上混合参量数据,所述上混合参量数据进一步对第一权重和第二权重进行表征;以及生成所述编码表示以包括下混合和上混合参量数据。
根据本发明的一方面,提供了一种用于多通道音频信号的音频比特流,包括作为至少以第一权重加权的第一通道信号和以第二权重加权的第二通道信号的组合的下混合,所述第一权重和所述第二权重对于至少一些时频间隔具有不同的幅度;以及表征第一通道信号和第二通道信号之间关系的上混合参量数据,该上混合参量数据进一步对第一权重和第二权重进行表征。第一和第二权重可以不包括在比特流中。
本发明的这些和其他方面、特征和优点根据下文描述的一个或多个实施例将是明显的,并参考该一个或多个实施例进行阐述。
根据下文描述的一个或多个实施例,本发明的这些或其他方面、特征和优点将是明显的,并参考该一个或多个实施例来阐明。
附图说明
将参考附图仅以示例的方式来描述本发明的实施例。
图1是根据本发明的一些实施例的音频分发系统的图示,
图2是根据本发明的一些实施例的音频编码器的元件的图示;
图3是根据本发明的一些实施例的音频编码器的元件的图示;以及
图4是根据本发明的一些实施例的音频解码器的元件的图示。
具体实施方式
以下描述关注适于对具有两个通道的多通道信号(即立体声信号)进行编码和解码的本发明的实施例。具体地,该描述关注于将立体声信号下混合成单声道下混合和关联的参数,并下混合成关联的上混合。然而,将会明了,本发明不限于此应用而是可以应用到许多其他多通道(包括立体声)系统,比如例如HE-AAC v2中的参量立体声和环绕MPEG。
图1示出根据本发明的一些实施例的用于传输音频信号的传送系统100。传送系统100包括发射器101,其通过网络105耦合到接收器103,该网络105具体可以是因特网。
在具体示例中,发射器101是信号记录设备而接收器103是信号播放器设备,但是将会明了,在其他实施例中,发射器和接收器可以用在其他应用中以及用于其他目的。例如,发射器101和/或接收器103可以是代码转换功能的一部分,并且可以例如提供到其他信号源或目的的接口连接。
在支持信号记录功能的特定实施例中,发射器101包括数字化器(digitizer)107,其接收模拟信号,该模拟信号通过抽样和模数转换被转换成数字PCM(脉冲编码调制)多通道信号。
数字化器107耦合到图1的编码器109,该编码器109根据编码算法对多通道PCM信号进行编码。编码器109耦合到网络发射器111,其接收编码的信号并接口连接到因特网105。网络发射器可以通过因特网105将编码的信号发送到接收器103。
接收器103包括网络接收器113,其接口连接到因特网105,并且被布置为从发射器101接收编码的信号。
网络接收器113耦合到解码器115。解码器115接收编码的信号并根据解码算法对其进行解码。
在支持信号播放功能的特定实施例中,接收器103进一步包括信号播放器117,其从解码器115接收解码的音频信号并将该解码的音频信号呈现给用户。具体地,信号播放器117可以包括所需的数模转换器、放大器和扬声器以用于输出解码的多通道音频信号。
图2更详细地示出编码器109。接收的左信号和右信号首先被转换到频域。在具体示例中,右信号被馈送至第一频率子带转换器201,其将右信号转换到多个频率子带。类似地,左信号被馈送至第二频率子带转换器203,其将左信号转换到多个频率子带。
子带右信号和左信号被馈送至下混合处理器205,其被布置为生成立体声信号的下混合,这将在以后更详细地描述。在具体示例中,下混合是这样的单声道信号,其通过组合右信号和左信号的各个子带以生成频域子带下混合单声道信号来生成。因此,在子带的基础上执行下混合。下混合处理器205耦合到下混合编码器207,其接收下混合单声道信号并根据合适的编码算法对其进行编码。传递至下混合编码器207的下混合单声道信号可以是频域子带信号,或者可以首先被变换回至时域。
编码器109此外包括参数处理器209,其生成参量空间数据,该参量空间数据可以由解码器115用来将该下混合上混合至多通道信号。
具体地,参数处理器209可以将频率子带分组为针对其提取立体声提示的Bark子带或ERB子带。参数处理器209可以具体使用用于生成参量数据的标准方法。尤其可以使用根据参量立体声和环绕MPEG技术已知的算法。因此,参数处理器209可以为每个参数子带生成通道间等级差(ILD)、通道间相干性/相关性(IC/ICC)、通道间相位差(IPD)或通道间时间差(ITD),这对于本领域技术人员将是已知的。
参数处理器209和下混合编码器207耦合到数据输出处理器211,其多路复用编码的下混合数据和参量数据以生成紧凑的编码数据信号,其具体地可以是比特流。
图3示出编码器109的下混合生成的原理并示出将在以下描述中使用的引用。如图所示,左()和右(
Figure 411314DEST_PATH_IMAGE022
)输入信号被分开输入到第一和第二频率子带转换器201、203。输出分别是
Figure DEST_PATH_IMAGE023
个频率子带信号
Figure 590623DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE025
,它们被馈送至下混合处理器205。下混合处理器205根据左和右子带信号(
Figure 803430DEST_PATH_IMAGE024
Figure 446901DEST_PATH_IMAGE025
)生成下混合(
Figure 719750DEST_PATH_IMAGE026
),该下混合(
Figure 448672DEST_PATH_IMAGE026
)被馈送至下混合编码器207以生成时域下混合信号,其随后可以被编码(在一些实施例中,子带下混合被直接编码)。
在常规的系统中,通过对每个子带中的左信号和右信号进行线性求和来执行下混合。典型地,通过简单地对左信号和右信号求和或取平均来执行被动下混合。然而,这样的方法在左信号和右信号彼此接近异相位时导致大量的问题,因为获得的求和信号将被显著降低,并且对于完全异相位信号甚至可能降低至零。在一些常规系统中,已求和的信号可以被按比例调整以获得能量与输入信号相当的下混合信号。然而,这样仍然可能是有问题的,因为对于低的值来说,生成的下混合样本的相对误差和不确定性变得更加显著。能量归一化将不仅按比例调整下混合而且按比例调整该关联的误差信号。事实上,对于完全异相位的信号,获得的和或平均信号为零并且相应地不能被按比例调整。
在一些系统中,使用了加权的求和,其中该权重不是简单的单位或标量(scalar)值,而是此外引入左和右信号的相位移位(phase shift)。该方法用来提供相位对齐,使得以相位来执行左信号和右信号的求和,即,它用来相位对齐信号以用于相干求和。然而,生成此相位对齐的下混合具有一些缺点。特别地,它趋于是复杂和模糊的操作,这可能导致降低的音频质量。
然而,与这些方法比起来,图1-3的系统的下混合通过使用不仅具有不同相位而且可能还具有不同幅度的权重来生成。因此,两个通道的权重的幅度可以至少针对一些信号特性具有不同的值。因此,在生成的下混合中,两个立体声通道的加权是不同的。
此外,用于将左和右子带信号组合成下混合子带的应用的子带权重也是依赖信号的,并且作为左和右信号的信号特性的函数而变化。具体地,在每个子带中,根据子带中的信号特性来确定权重。因此,相位和幅度两者都是依赖信号的并可能变化。因而,权重的幅度将是时变的。
具体地,可以修改权重以使得为彼此逐渐异相位的左和右信号引入对权重的不同幅度的偏置(bias)。例如,权重之间的幅度差异可以取决于左和右信号的交叉功率(cross-power)度量。交叉功率度量可以是左和右信号的交叉相关性。交叉功率度量可以是相对于右和左通道至少一个中的能量的归一化度量。
因此,在特定示例中,权重(以及具体地相位和幅度)取决于左信号和右信号的能量度量,以及它们之间的相关性(例如,由交叉功率度量表示)。
权重根据左和右信号的信号特性来确定,并且具体地可以被确定而无需考虑由参数处理器209生成的参量数据。然而,如将在以后展示的,生成的参量数据还取决于信号能量,并且这可以允许解码器根据参量数据重新创建用在下混合中的权重。因此,虽然使用了具有不同幅度的变化权重,但是这些权重不需要显式地传输到解码器,而是可以基于所接收的参量数据进行估计。因此,与预期相比较,不需要传输另外的数据开销来支持具有不同幅度的权重。
此外,使用不同的权重可以用来避免或减轻与常规的固定求和相关的异相位问题而无需执行相位对齐并因此不会引入与其相关的缺点。
例如,可以生成指示左和右信号的非相位对齐组合的功率相对于左和右信号的组合功率的度量。具体地,左和右信号的和信号的功率/能量可以被确定,并且与左信号的功率/能量和右信号的功率/能量之和相关。该度量的较高值将指示左和右信号没有异相位,并且相应地对称(相等的能量)权重可以用于下混合。然而,对于逐渐异相位的信号,(和信号的)第一功率降低向零,并因此度量的较低值将指示左和右信号逐渐地异相位,并且相应地,简单的求和作为下混合信号将不是有利的。相应地,权重可以是逐渐地不对称,其导致下混合中来自一个通道的比另一个通道更多的贡献,从而降低一个信号对另一个信号的抵消。事实上,对于异相位信号,下混合可以例如简单地被确定为左和右信号之一,即一个权重的能量可能为零。
作为更特定的示例,可以确定反映左和右信号之和的能量与相位对齐的左和右信号之和的能量(即遵循左和右信号的相干的同相位相加的能量)之间的比率的度量r:
Figure 963704DEST_PATH_IMAGE028
其中ipd是左信号和右信号之间的相位差(其也是参数处理器209确定的参数之一),<.>表示内积并且E{.}是期望操作符。
以上的相对值因此被生成以反映左和右信号之和的能量度量与指示左和右信号的相位对齐组合的能量的能量度量之间的相对关系。随后根据该相对值确定权重。
比率r指示两个信号异相位的程度。具体地,对于完全异相位的信号,比率等于0而对于完全同相位信号,比率等于1。因此,比率提供了由于左和右通道之间的相位差而导致多少能量降低出现的归一化([0,1])的度量。
它可以示出为:
Figure DEST_PATH_IMAGE029
其中E l E r 是左和右信号的能量,并且E lr 是左和右信号之间的交叉相关性。
随后使用:
Figure 399365DEST_PATH_IMAGE030
,
Figure DEST_PATH_IMAGE031
,
其中iid是通道间强度差,并且icc是通道间相干性,这可以示出为导致:
因此,如图所示,指示信号异相位的程度的度量r可以根据参量数据导出,并且因此可以可以通过解码器115确定而无需要求传输任何附加的数据。
比率可以用来生成下混合信号的权重。具体地,下混合信号可以在每个子带被生成为:
Figure 59333DEST_PATH_IMAGE032
可以根据比率r生成权重,以使得不对称性(能量差)随着r接近零而增加。例如,中间值可以被生成为:
Figure 879522DEST_PATH_IMAGE012
使用中间值
Figure DEST_PATH_IMAGE033
时,两个增益被计算为:
Figure 232006DEST_PATH_IMAGE013
Figure 604913DEST_PATH_IMAGE014
随后可以根据可选的能量归一化来确定权重:
Figure 42847DEST_PATH_IMAGE015
Figure 463464DEST_PATH_IMAGE016
其中
Figure 873717DEST_PATH_IMAGE034
被选择以提供期望的归一化。具体地,可以选择这样的
Figure 987167DEST_PATH_IMAGE034
以使得获得的下混合的能量等于左信号的功率加上右信号的功率。
作为另一示例,中间值可以被生成为:
Figure 850081DEST_PATH_IMAGE011
其将趋于为日益多样的信号条件提供恒定(完全对称的或者完全不对称的)的权重。
因此,在这样的实施例中,编码器109可以采用灵活和动态的下混合,其中权重自动地适配于特定的信号条件以使得可以避免或减轻与固定的或相位对齐的下混合相关的缺点。事实上,该方法可以从等同对待两个通道的完全对称下混合逐渐地和自动地适配到完全忽略一个通道的完全不对称下混合。这样的适配可以允许下混合提供上混合基于其上的改进信号,而同时生成可以被直接使用的下混合信号(即它可以用作单声道信号)。此外,所描述的示例提供了非常渐进和平滑的能量差过渡,从而提供了改进的收听体验。
同时,如将在以后展示的,可以获得该改进的性能而不需要分配任何另外的数据来提供所选权重的信息。具体地,如以上展示的,可以根据发送的参量数据来确定权重,并且如以后将展示的,用于基于相等的下混合权重假设进行上混合的常规方法可以被修改并扩展以允许针对具有不同能量(或等效地不同的幅度或功率)的权重进行上混合。
接下来,将描述使用不同下混合权重的编码方法的另一示例。在一些场景中,可以创建下混合而无需使用参量数据。在其他场景或实施例中,参量数据还可以用在编码器中来确定权重。该方法基于使用预定权重(其具体地可以是能量对称的,即,可以具有相同的能量并且例如仅引入相位偏移)确定多个中间下混合。中间下混合随后被组合成单个下混合,其中中间下混合的每一个根据中间下混合的能量来加权。因此,因为源自基本异相位的信号的组合而具有低的能量的中间下混合被加的权重低于因为源自更相干的组合而具有高的能量的中间下混合。得到的下混合然后可以相对于输入信号被能量归一化。
更详细地,不同的先验(中间)子带下混合
Figure DEST_PATH_IMAGE035
,的集合被生成为:
典型地,中间下混合的数目可以保持为低,从而导致低复杂性和降低的计算需求。具体地,中间子带下混合的数目为10或更少,并且已经发现4个中间下混合是复杂性和性能之间特别有利的取舍。
在特定示例中,利用特定的权重来使用4个(
Figure 73569DEST_PATH_IMAGE038
)先验的(预定的和固定的)中间下混合:
Figure DEST_PATH_IMAGE039
Figure 794138DEST_PATH_IMAGE040
Figure DEST_PATH_IMAGE041
1 1 1
2
Figure 144347DEST_PATH_IMAGE042
Figure DEST_PATH_IMAGE043
3
Figure 172346DEST_PATH_IMAGE043
Figure 291612DEST_PATH_IMAGE042
4 1 -1
其中
Figure 481285DEST_PATH_IMAGE044
Figure DEST_PATH_IMAGE045
并且*表示共轭。权重还可以以矩阵的形式表达:
Figure 318791DEST_PATH_IMAGE046
对于左和右信号在幅度上相等并且异相位0、90、180或270度的情况,这些先验的下混合对应于最佳的下混合。可替换地,可以使用仅有两个先验的下混合的集合,例如
Figure DEST_PATH_IMAGE047
Figure 321120DEST_PATH_IMAGE048
接着,这些选项的每一个的能量
Figure DEST_PATH_IMAGE049
通过以下公式来确定:
其中
Figure DEST_PATH_IMAGE051
是以样本索引
Figure 921045DEST_PATH_IMAGE052
为中心的可选窗口。子带下混合通过以下公式被组合以形成新的子带下混合
Figure DEST_PATH_IMAGE053
其中权重
Figure DEST_PATH_IMAGE055
根据下混合的相对强度(strength)来确定。因此,不同的中间混合可以通过根据它们的相对强度对它们的每一个加权而被组合成单个下混合。
相对强度可以基于能量,诸如例如
Figure 553332DEST_PATH_IMAGE056
其中
Figure DEST_PATH_IMAGE057
是小的正常数以防止除以零。当然也可以使用其他度量,例如包络度量(envelope measure)。
最终的下混合通过能量归一化根据而生成。具体地,可以确定能量
Figure 286037DEST_PATH_IMAGE053
,并且可以执行所需的按比例调整以便将其调节为等于左和右信号的能量之和。
作为特定的示例,对于每个下混合,偏置的和能量比率可以被计算为:
其中
Figure 407893DEST_PATH_IMAGE019
是偏置函数,其可以根据以下公式将附加的偏置引进到缺省的下混合:
随后,两个增益被计算为:
Figure 313532DEST_PATH_IMAGE060
Figure DEST_PATH_IMAGE061
并且最终的权重通过能量归一化来确定:
Figure 347348DEST_PATH_IMAGE015
其中
Figure 924139DEST_PATH_IMAGE062
被这样选择,以使获得的下混合的能量等于左通道的功率加上右通道的功率。
应当注意的是,这些方法允许权重通过解码器115使用接收的参量数据来生成,并且不需要发送任何另外的信息。
描述的方法既避免或减轻了与异相位信号相关联的被动和主动(固定的)下混合的缺点而不必使用相位对齐,也避免和减轻了相关的缺点。
所描述的方法的优点是,多个不同中间下混合的线性组合提供了附加的健壮性,因为异相位问题可能限于下混合的仅仅一个或者可能的两个。此外,通过仅使用4个中间下混合,可以获得高效并低的计算资源需求。
还值得指出的是,最终,下混合信号只是左和右信号的线性组合,即,
Figure DEST_PATH_IMAGE063
其中每个
Figure 26186DEST_PATH_IMAGE064
Figure DEST_PATH_IMAGE065
取决于
Figure 275901DEST_PATH_IMAGE066
和所选取的
Figure DEST_PATH_IMAGE067
还值得指出的是,
Figure 198858DEST_PATH_IMAGE066
取决于左和右的能量以及交叉能量。具体地,它可以示出为:
Figure 508617DEST_PATH_IMAGE068
其中表示复数的实数部分。这样允许在计算上更简单的方案,因为中间下混合能量不需要被测量,并且事实上中间下混合不需要显式地生成。相反,
Figure 517024DEST_PATH_IMAGE055
值可以根据所选择的先验下混合权重
Figure 6649DEST_PATH_IMAGE070
和能量
Figure 846429DEST_PATH_IMAGE066
而导出,其中直接由测量的能量和原始信号的交叉能量推得,如上所述。
因此,
Figure 557213DEST_PATH_IMAGE064
由选取的
Figure DEST_PATH_IMAGE071
和测量的能量和交叉能量推得,因为
Figure 351994DEST_PATH_IMAGE072
同时能量补偿轻易地由输入能量和获知的
Figure 46280DEST_PATH_IMAGE064
推得。
所描述的方法对于其中左和右信号的相关性为低,或者在左和右信号的能量存在巨大差异时的场景可能不是很有效。然而,在这些情况下,通过左和右信号的简单和提供了很好的下混合。
这样的考虑可以用来修改该方法如下。首先,调制索引
Figure DEST_PATH_IMAGE073
被定义为:
Figure 635524DEST_PATH_IMAGE074
其中
Figure DEST_PATH_IMAGE077
分别是左信号、右信号和交叉能量的能量。注意
Figure 512268DEST_PATH_IMAGE078
如果
Figure 998744DEST_PATH_IMAGE073
为低,则通过例如以下公式计算
Figure 86786DEST_PATH_IMAGE002
现在可以适于优选下混合
Figure 353819DEST_PATH_IMAGE047
(假设其对应于我们的示例中的中信号):
Figure DEST_PATH_IMAGE079
对于
Figure 490403DEST_PATH_IMAGE080
Figure DEST_PATH_IMAGE081
这使得创建了这样的下混合,其具有数值健壮性还将异相位分量也包括在该下混合中。
再次,应当注意的是,使用中间固定下混合的下混合生成基于下混合参数,该下混合参数事实上是依赖信号的。然而,获得的下混合权重的依赖仅取决于能量
Figure 90328DEST_PATH_IMAGE076
和交叉能量
Figure 280876DEST_PATH_IMAGE077
。因为这对于参数数据(例如生成的ILD、IPD和IC)也是这种情况,所以对于解码器115来说根据发送的参量数据导出所应用的权重是可能的。具体地,权重可以通过评估如以上参考编码器109所述的相同函数的解码器来找到。
更详细地,给定的下混合信号的权重可以通过首先将
Figure 17888DEST_PATH_IMAGE073
考虑为以下公式根据参数来找到:
Figure 541273DEST_PATH_IMAGE082
随后,使用以下关系,可以为所有p计算
Figure DEST_PATH_IMAGE083
Figure 908800DEST_PATH_IMAGE084
据此,得出
Figure 822530DEST_PATH_IMAGE064
为:
在以上内容中,已经描述了应用下混合权重的信号依赖动态变化(包括幅度变化)来提供更健壮的和改进的下混合信号的各种编码器方法。这些方法具体地利用不对称权重(具有潜在不同的幅度)来改进性能。此外,如已经展示的,下混合权重可以根据权重导出,并且因此可以通过解码器来确定,从而允许基于针对权重使用不同能量的解码器方法的假设执行上混合的解码器操作。该上混合仅基于下混合和空间参数,并且不需要任何另外的信息。因此,已将解码器操作修改以说明具有不同幅度的权重,并且因此该解码器操作不是像常规的解码器那样基于相等幅度下混合权重的假设。接下来将描述这样的解码器的不同示例,并且将展示的是,不仅可以修改上混合方法来利用不对称幅度下混合权重来操作,而且此外,这还可以基于现有的参量数据并且无需传输另外的数据来获得。
图4示出了根据本发明的一些实施例的解码器的示例。
解码器包括接收器401,其从解码器109接收数据流。接收器401耦合到参数处理器403,其从数据流接收参量数据。因此,参数处理器403从数据流接收IID、IPD和ICC值。
接收器401此外耦合到下混合解码器405,其对接收的经编码的下混合信号进行解码。下混合解码器405执行编码器109的下混合编码器207的逆向功能,并且因此生成解码的频域子带信号(或者时域信号,其随后被转换成频域子带信号)。
下混合解码器405此外耦合到上混合处理器407,该上混合处理器407也耦合到参数处理器403。上混合处理器407将下混合信号进行上混合以生成多通道信号(其在特定示例中为立体声信号)。在特定示例中,单声道下混合被上混合至立体声信号的左和右通道。基于参量数据和可能根据参量数据生成的下行链路权重的确定的估计来执行该上混合。上混合的立体声通道被馈送至输出电路409,其在特定的示例中可以包括从频率子带域到时域的转换。输出电路409可以具体包括逆QMF或FFT变换。
在图4的解码器中,参数处理器403耦合到权重处理器411,该权重处理器411进一步耦合到上混合处理器。权重处理器411被布置为根据接收的参量数据来估计下混合权重。该确定不限于相等权重的假设。相反,虽然解码器115可以不必准确地知晓在编码器109中已应用哪些下混合权重,但是解码基于使用具有权重之间(幅度)差异的潜在不对称权重。因此,接收的参数用来确定权重的能量/幅度和/或角度。特别地,响应于指示通道之间的能量关系的参数来执行权重的确定。具体地,该确定不限于IPD的相位值而是响应于IID和/或ICC值。
确定应用的权重具体地使用与之前描述的针对编码器115的一样的方法。因此,与之前描述的针对编码器109的一样的计算可以通过权重处理器411来执行以获得权重w1和w2,它们将(或假设)已被相应的编码器109使用。
由常规的解码器执行的上混合基于应用的权重对于两个通道完全相同的或者仅在相位值上有区别的假设。然而,在图4的解码器115中,上混合还将权重之间的幅度差考虑在内,并且具体地被修改以使得来自参数处理器403的实际估计的权重w1和w2被用来修改上混合。因此,已经修改了常规的上混合方法以进一步考虑动态地变化的信号依赖的权重,针对所述权重根据接收的参量数据计算估计。
接下来,将给出已被扩展来容纳具有不同能量的权重的上混合算法的特定示例。
使用指示子带左和右通道相对于固定的基准(典型地为左通道)的绝对(平均)相位偏移的整体相位差的上混合算法是已知的。
具体地,参量立体声标准使用以下上混合:
Figure 6704DEST_PATH_IMAGE001
其中s是接收的单声道下混合而sd是本领域技术人员已知的通过解码器生成的解相关(decorrelated)的信号。c1和c2为增益以确保左和右信号之间的正确等级差。
具体地,c1、c2
Figure 8475DEST_PATH_IMAGE003
可以被确定为:
Figure DEST_PATH_IMAGE085
Figure 541085DEST_PATH_IMAGE086
Figure 976746DEST_PATH_IMAGE088
如果OPD值被合适地修改,则该等式对于其中权重w1和w2具有不同能量的场景仍旧是有效的。因此,不必修改以上等式以用于对允许权重之间能量差的信号进行解码。这是因为上混合矩阵总是独立于OPD恢复正确的空间提示(IID、ICC、IPD)。OPD可以被视为另外的自由度。
OPD被定义为左通道与和信号之间的角度,Ss通过对左和右信号求和生成:
Figure DEST_PATH_IMAGE089
此外,
Figure 482814DEST_PATH_IMAGE090
并且
Figure DEST_PATH_IMAGE091
其中Pll是左信号的功率,而Plr是左和右信号的交叉功率或交叉相关性。
因此:
Figure 636715DEST_PATH_IMAGE092
其中Prr是右信号的功率。
因此,可以首先通过权重处理器411基于之前描述的参量数据确定权重w1和w2,并且估计的权重随后可以与参量数据一起被用来生成将潜在不对称加权考虑在内的整体相位值(即权重之间的差异包括幅度不对称)。生成的整体相位值可以随后用来根据下混合信号和相关的信号生成上混合信号。
在一些实施例中,OPD值可以在通道相互关联(即icc参数具有单位值(unity value))的假设下生成。这导致以下的OPD值:
Figure 456903DEST_PATH_IMAGE005
因此,解码器可以生成没有同样多地遭受与固定求和或相位对齐下混合方法关联的典型缺点的上混合信号。此外,这在无需发送另外的数据的情况下实现。
作为另一示例,上混合可以基于根据下混合信号的解相关信号的预测。下混合被生成为:
Figure 809387DEST_PATH_IMAGE006
其中w1和w2可以都是复的。随后可以使用导致以下整体下混合矩阵的按比例调整的复旋转来构造辅助信号:
Figure DEST_PATH_IMAGE093
因此,信号d表示左和右信号的差信号。
获得的理论上混合矩阵可以被确定为:
Figure 188153DEST_PATH_IMAGE094
差信号可以通过可预测的分量来表达,该可预测的分量可以根据下混合信号s和与该下混合信号s解相关的不可预测分量来预测。因此,d可以表达为:
Figure DEST_PATH_IMAGE095
其中
Figure 563771DEST_PATH_IMAGE096
是解码器生成的解相关和信号,
Figure 984388DEST_PATH_IMAGE002
是复的预测因子,而
Figure 456958DEST_PATH_IMAGE003
是(实值的)解相关缩放因子。这导致:
Figure DEST_PATH_IMAGE097
因此,假如可以确定预测因子
Figure 242511DEST_PATH_IMAGE002
和解相关缩放因子
Figure 105425DEST_PATH_IMAGE003
,则可以通过该方法生成上混合。
在之前的用于生成差信号的等式中,第二项表示不能根据下混合信号s预测的差信号的部分。为了保持低的数据速率,该剩余的信号分量典型地不被传输到解码器,并且因而上混合基于本地生成的解相关的信号和解相关缩放因子。
然而,在一些情况下,剩余的信号
Figure 656809DEST_PATH_IMAGE098
被编码为信号dres,并被传输到解码器。在此情况下,差信号可以被给出为:
Figure DEST_PATH_IMAGE099
其导致:
Figure 377378DEST_PATH_IMAGE100
此外,预测因子
Figure 727588DEST_PATH_IMAGE002
和解相关缩放因子
Figure 490008DEST_PATH_IMAGE003
两者都可以根据接收的参量数据来确定:
Figure 64525DEST_PATH_IMAGE009
因此,基于预测的方法允许执行上混合,这是基于不对称能量权重用于下混合的假设。此外,上混合过程通过参量数据来控制并且不需要从编码器发送另外的信息。
更详细地,复预测因子
Figure 964348DEST_PATH_IMAGE002
和解相关缩放因子可以根据以下考虑而导出。
首先,预测参数
Figure 504231DEST_PATH_IMAGE002
被给出为:
Figure DEST_PATH_IMAGE101
其中
Figure 130385DEST_PATH_IMAGE102
,这导致:
Figure DEST_PATH_IMAGE103
随后,使用参数定义:
Figure 953722DEST_PATH_IMAGE104
这产生:
解相关缩放因子
Figure 995627DEST_PATH_IMAGE003
被给出为:
Figure 89485DEST_PATH_IMAGE106
使用解相关信号的功率与和信号的功率相匹配的假设。
Figure DEST_PATH_IMAGE107
从其得出:
Figure 886540DEST_PATH_IMAGE108
之前的示例已经描述了允许变化的和不对称的权重(包括权重之间的幅度不对称)与下混合/上混合系统一起使用而无需传输任何另外的参数的系统。相反,权重和上混合操作可以基于参量数据。
这样的方法在用于下混合和上混合的子带相对紧密地对应于针对其计算参数的分析带时是尤其有利的。
对于其中下混合子带和参量分析频带趋于一致的较低频率可能往往是这种情况。然而,在一些实施例中,例如具有这样的下混合子带可能是有利的,该下混合子带具有比分析频带更精细的(finer)频率和/或时间量化,因为这在一些场景中可能导致改进的音频质量。这对于较高的频率可能尤其如此。
因此,在较高频率范围处,下混合的子带和参数分析之间的相关性可能相异。因为权重对于各个下混合子带可以不同,所以参量数据和针对每个子带的各个权重之间的相关性可能不那么准确。然而,参量数据可以典型地用来生成下混合权重的较粗略的估计,并且典型地,关联的质量下降将是可接受的。
具体地,在一些实施例中,编码器可以评估用在每个子带中的实际下混合权重和可以基于较宽的分析带的参量数据计算的下混合权重之间的差。如果相差变得过大,则编码器可以包括这方面的指示。因此,编码器可以包括参量数据是否应该被用来生成用于至少一个频时间隔(例如用于一个分段的下混合子带)的权重的指示。如果该指示为不应该使用参量数据,则编码器可以代之使用另一方法,诸如例如将上混合基于下混合是简单求和的假设。
在一些实施例中,编码器可以进一步被布置为包括对于其而言准确度指示表明参量数据不足以估计权重的、用于子带的下混合权重的指示。在这样的实施例中,解码器115因此可以直接提取这些权重并将它们应用到适当的子带。权重可以作为绝对值传输,或者例如可以作为相对值(例如,实际权重和使用参量数据计算的权重之间的差)来传输。
将会明了,为清楚起见,以上描述参考不同的功能电路、单元和处理器描述了本发明的实施例。然而,明显的是,可以使用不同功能电路、单元或处理器之间的任何合适的功能性分布而不脱离本发明。例如,示出为由分开的处理器或控制器执行的功能性可以通过同一处理器或控制器来执行。因此,引用特定的功能单元或电路仅被视为引用用于提供所描述的功能性的合适装置,而不是指示严格的逻辑或物理结构或组织。
本发明可以以任意合适的形式实现,包括硬件、软件、固件或其任意组合。本发明可以可选地至少部分实现为运行在一个或多个数据处理器和/或数字信号处理器上的计算机软件。本发明实施例的元件和组件可以以任何合适的方式来物理地、功能性地和逻辑地实现。事实上,功能性可以实现在单个单元中、多个单元或作为其他功能单元的部分中。同样地,本发明可以实现在单个单元中,或者可以物理和功能性地分布在不同的单元、电路和处理器之间。
虽然已结合一些实施例描述了本发明,但是并非旨在限于在此阐述的特定形式。相反,本发明的范围仅由所附权利要求限定。另外,虽然看起来结合特定的实施例来描述特征,本领域技术人员将认识到,所描述的实施例的各种特征可以根据本发明来组合。在权利要求中,术语包括不排除存在其他元件或步骤。
此外,虽然被单独列出,但是多个装置、元件、电路或方法步骤可以例如通过单个电路、单元或处理器来实现。另外,虽然各个特征可以包括在不同的权利要求中,但是这些特征可以有利地组合,并且包括在不同权利要求中并非暗示这些特征的组合不是可行和/或有利的。同时,特征包括在一类权利要求中并不暗示限于该类别,而是指示特征同样酌情可应用于其他权利要求类别。
此外,权利要求中特征的顺序并不暗示特征必须按其操作的任何特定顺序,并且特别地,方法权利要求中各个步骤的顺序并不暗示这些步骤必须以该顺序执行。相反,可以以任何合适的顺序执行这些步骤。另外,单数引用不排除复数。引用“一”、“第一”、“第二”等不排除多个。权利要求中的附图标记仅作为澄清的示例来提供,不应以任何方式被解释为限制权利要求的范围。

Claims (17)

1.一种用于生成多通道音频信号的解码器(115),所述解码器(115)包括:
第一接收器(401、405),用于接收作为至少由第一权重加权的第一通道信号和由第二权重加权的第二通道信号的组合的下混合,所述第一权重和所述第二权重对于至少一些时频间隔具有不同的幅度;
第二接收器(401、403),用于接收表征所述第一通道信号和所述第二通道信号之间关系的上混合参量数据;
电路(411),用于根据上混合参量数据生成所述第一权重的第一权重估计和所述第二权重的第二权重估计;以及
上混合器(407),用于响应于所述上混合参量数据、所述第一权重估计和所述第二权重估计,通过对所述下混合进行上混合来生成所述多通道音频信号,所述上混合取决于所述第一权重估计和所述第二权重估计的至少一个的幅度。
2. 如权利要求1所述的解码器(115),其中所述电路(411)被布置为利用与针对所述至少一些时域间隔的参量数据的至少一些参数的不同关系生成所述第一权重估计和所述第二权重估计。
3. 如权利要求2所述的解码器(115),其中所述上混合器(407)被布置为将所述第一权重估计和所述第二权重估计的至少一个确定为所述上混合参量数据的能量参数的函数,所述能量参数指示所述第一通道信号和所述第二通道信号的相对能量特性。
4. 如权利要求3所述的解码器(115),其中所述能量参数为以下项中的至少一个:
通道间强度差IID参数;
通道间等级差ILD参数;以及
通道间相干性/相关性IC/ICC参数。
5. 如权利要求1所述的解码器(115),其中所述上混合参量数据包括所述第一权重和所述第二权重与所述上混合参量数据之间关系的准确度指示,并且所述解码器(115)被布置为响应于所述准确度指示生成所述第一权重估计和所述第二权重估计的至少一个。
6. 如权利要求1所述的解码器(115),其中针对至少一个频率间隔的所述第一权重和所述第二权重的至少一个具有比所述上混合参量数据的相应参数更精细的频时分辨率。
7. 如权利要求1所述的解码器(115),其中所述上混合器(407)被布置为生成针对所述响应于参量数据的整体相位差值,并且响应于所述整体相位差值执行所述上混合,所述整体相位差值取决于所述第一权重估计和所述第二权重估计。
8. 如权利要求1所述的解码器(115),其中除了所述整体相位差值以外,所述上混合独立于所述第一权重估计和所述第二权重估计的至少一个的幅度。
9. 如权利要求1所述的解码器(115),其中所述上混合器(407)被布置为:
根据下混合生成解相关的信号,所述解相关的信号与所述下混合解相关;
通过将矩阵乘法应用到所述下混合和所述解相关的信号来对所述下混合进行上混合,其中所述矩阵乘法的系数取决于所述第一权重估计和所述第二权重估计。
10. 如权利要求1所述的解码器(115),其中所述上混合器(407)被布置为通过以下方式确定所述第一权重估计:
响应于所述上混合参量数据确定第一能量度量,其指示所述第一通道信号和所述第二通道信号的非相位对齐组合的能量;
响应于所述上混合参量数据确定第二能量度量,其指示所述第一通道信号和所述第二通道信号的相位对齐组合的能量;
确定所述第一能量度量相对于所述第二能量度量的第一度量;
响应于所述第一度量,确定所述第一权重估计。
11. 如权利要求1所述的解码器(115),其中所述上混合器(407)被布置为通过以下方式确定所述第一权重估计:
针对多个第一权重和第二权重的预定值对的每一个,响应于所述参量数据确定指示与所述预定值对相对应的下混合的能量的能量度量;以及
响应于所述能量度量和所述预定值对确定所述第一权重。
12. 一种用于生成至少包括第一通道和第二通道的多通道音频信号的编码表示的编码器(109),所述编码器包括:
下混合器(201、203、205),用于生成作为至少由第一权重加权的第一通道的第一通道信号和由第二权重加权的第二通道的第二通道信号的组合的下混合,所述第一权重和所述第二权重对于至少一些时频间隔具有不同的幅度;
电路(201、203、209),用于生成表征所述第一通道信号和所述第二通道信号之间关系的上混合参量数据,所述上混合参量数据进一步对所述第一权重和所述第二权重进行表征;以及
电路(207、211),用于生成所述编码表示以包括所述下混合和所述上混合参量数据,
其中所述下混合器(201、203、205)布置为:
确定第一能量度量,其指示所述第一通道信号和所述第二通道信号的非相位对齐组合的能量;
确定第二能量度量,其指示所述第一通道信号和所述第二通道信号的相位对齐组合的能量;
确定所述第一能量度量相对于所述第二能量度量的第一度量;以及
响应于所述第一度量确定所述第一权重和所述第二权重。
13. 一种生成多通道音频信号的方法,该方法包括:
接收作为至少由第一权重加权的第一通道信号和由第二权重加权的第二通道信号的组合的下混合,所述第一权重和所述第二权重对于至少一些时频间隔具有不同的幅度;
接收表征所述第一通道信号和所述第二通道信号之间关系的上混合参量数据;
根据所述上混合参量数据生成所述第一权重的第一权重估计和所述第二权重的第二权重估计;以及
响应于所述上混合参量数据、所述第一权重估计和所述第二权重估计,通过对所述下混合进行上混合来生成所述多通道音频信号,所述上混合取决于所述第一权重估计和所述第二权重估计的至少一个的幅度。
14. 一种生成至少包括第一通道和第二通道的多通道音频信号的编码表示的方法,该方法包括:
生成作为至少由第一权重加权的第一通道的第一通道信号和由第二权重加权的第二通道的第二通道信号的组合的下混合,所述第一权重和所述第二权重对于至少一些时频间隔具有不同的幅度;
生成表征所述第一通道信号和所述第二通道信号之间关系的上混合参量数据,所述上混合参量数据进一步对所述第一权重和所述第二权重进行表征;以及
生成所述编码表示以包括所述下混合和所述上混合参量数据。
15. 一种计算机程序产品,用于执行权利要求13或14任一项所述的方法。
16. 一种用于多通道音频信号的音频比特流,包括作为至少由第一权重加权的第一通道信号和由第二权重加权的第二通道信号的组合的下混合,所述第一权重和所述第二权重对于至少一些时频间隔具有不同的幅度;以及表征所述第一通道信号和所述第二通道信号之间关系的上混合参量数据,所述上混合参量数据进一步对所述第一权重和所述第二权重进行表征。
17. 一种存储介质,其上存储权利要求16所述的音频比特流。
CN201080051415.1A 2009-11-12 2010-11-05 参量编码和解码 Active CN102598122B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP09175771A EP2323130A1 (en) 2009-11-12 2009-11-12 Parametric encoding and decoding
EP09175771.6 2009-11-12
PCT/IB2010/055025 WO2011058484A1 (en) 2009-11-12 2010-11-05 Parametric encoding and decoding

Publications (2)

Publication Number Publication Date
CN102598122A true CN102598122A (zh) 2012-07-18
CN102598122B CN102598122B (zh) 2014-10-29

Family

ID=42008564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080051415.1A Active CN102598122B (zh) 2009-11-12 2010-11-05 参量编码和解码

Country Status (10)

Country Link
US (1) US9070358B2 (zh)
EP (2) EP2323130A1 (zh)
JP (1) JP5643834B2 (zh)
KR (1) KR101732338B1 (zh)
CN (1) CN102598122B (zh)
BR (1) BR112012011084B1 (zh)
MX (1) MX2012005414A (zh)
RU (1) RU2560790C2 (zh)
TW (1) TWI573130B (zh)
WO (1) WO2011058484A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104299615A (zh) * 2013-07-16 2015-01-21 华为技术有限公司 一种声道间电平差处理方法及装置
CN104509131A (zh) * 2012-07-31 2015-04-08 英迪股份有限公司 一种用于处理音频信号的方法和设备
CN107690123A (zh) * 2012-12-04 2018-02-13 三星电子株式会社 音频提供方法
CN113544774A (zh) * 2019-03-06 2021-10-22 弗劳恩霍夫应用研究促进协会 降混器及降混方法

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
EP2464146A1 (en) * 2010-12-10 2012-06-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decomposing an input signal using a pre-calculated reference curve
WO2013029225A1 (en) * 2011-08-29 2013-03-07 Huawei Technologies Co., Ltd. Parametric multichannel encoder and decoder
WO2013120531A1 (en) * 2012-02-17 2013-08-22 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
KR101662682B1 (ko) * 2012-04-05 2016-10-05 후아웨이 테크놀러지 컴퍼니 리미티드 채널간 차이 추정 방법 및 공간적 오디오 코딩 장치
MY176406A (en) * 2012-08-10 2020-08-06 Fraunhofer Ges Forschung Encoder, decoder, system and method employing a residual concept for parametric audio object coding
EP2717261A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
CN105336335B (zh) * 2014-07-25 2020-12-08 杜比实验室特许公司 利用子带对象概率估计的音频对象提取
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
KR102636396B1 (ko) 2015-09-25 2024-02-15 보이세지 코포레이션 스테레오 사운드 신호를 1차 및 2차 채널로 시간 영역 다운 믹싱하기 위해 좌측 및 우측 채널들간의 장기 상관 차이를 이용하는 방법 및 시스템
EP3301673A1 (en) * 2016-09-30 2018-04-04 Nxp B.V. Audio communication method and apparatus
US10224042B2 (en) 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
AU2017357454B2 (en) * 2016-11-08 2021-02-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
BR112019009424A2 (pt) 2016-11-08 2019-07-30 Fraunhofer Ges Forschung mixador de redução, método para mixagem de redução de pelo menos dois canais, codificador multicanal, método para codificar um sinal multicanal, sistema e método de processamento de áudio
CN109389984B (zh) 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品
CN114898761A (zh) 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
CN113782039A (zh) * 2017-08-10 2021-12-10 华为技术有限公司 时域立体声编解码方法和相关产品
US10580420B2 (en) * 2017-10-05 2020-03-03 Qualcomm Incorporated Encoding or decoding of audio signals
EP3550561A1 (en) * 2018-04-06 2019-10-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
US10904690B1 (en) * 2019-12-15 2021-01-26 Nuvoton Technology Corporation Energy and phase correlated audio channels mixer
US20220399026A1 (en) * 2021-06-11 2022-12-15 Nuance Communications, Inc. System and Method for Self-attention-based Combining of Multichannel Signals for Speech Processing

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050074127A1 (en) * 2003-10-02 2005-04-07 Jurgen Herre Compatible multi-channel coding/decoding
CN1910655A (zh) * 2004-01-20 2007-02-07 弗劳恩霍夫应用研究促进协会 构造多通道输出信号或生成下混信号的设备和方法
CN101248483A (zh) * 2005-07-19 2008-08-20 皇家飞利浦电子股份有限公司 多声道音频信号的生成
CN101390443A (zh) * 2006-02-21 2009-03-18 皇家飞利浦电子股份有限公司 音频编码和解码
CN101517637A (zh) * 2006-09-18 2009-08-26 皇家飞利浦电子股份有限公司 音频对象的编码与解码
CN101529504A (zh) * 2006-10-16 2009-09-09 弗劳恩霍夫应用研究促进协会 多通道参数转换的装置和方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
ATE487213T1 (de) * 2003-03-17 2010-11-15 Koninkl Philips Electronics Nv Verarbeitung von mehrkanalsignalen
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
CN102122509B (zh) 2004-04-05 2016-03-23 皇家飞利浦电子股份有限公司 多信道解码器和多信道解码方法
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
JP2006325162A (ja) * 2005-05-20 2006-11-30 Matsushita Electric Ind Co Ltd バイノーラルキューを用いてマルチチャネル空間音声符号化を行うための装置
US7706905B2 (en) 2005-07-29 2010-04-27 Lg Electronics Inc. Method for processing audio signal
US20080255859A1 (en) 2005-10-20 2008-10-16 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
WO2007111568A2 (en) 2006-03-28 2007-10-04 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for a decoder for multi-channel surround sound

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050074127A1 (en) * 2003-10-02 2005-04-07 Jurgen Herre Compatible multi-channel coding/decoding
CN1910655A (zh) * 2004-01-20 2007-02-07 弗劳恩霍夫应用研究促进协会 构造多通道输出信号或生成下混信号的设备和方法
CN101248483A (zh) * 2005-07-19 2008-08-20 皇家飞利浦电子股份有限公司 多声道音频信号的生成
CN101390443A (zh) * 2006-02-21 2009-03-18 皇家飞利浦电子股份有限公司 音频编码和解码
CN101517637A (zh) * 2006-09-18 2009-08-26 皇家飞利浦电子股份有限公司 音频对象的编码与解码
CN101529504A (zh) * 2006-10-16 2009-09-09 弗劳恩霍夫应用研究促进协会 多通道参数转换的装置和方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DONGIL HYUN ET AL.: "Robust Interchannel Correlation (ICC) Estimation Using Constant Interchannel Time Difference (ICTD) Compensation", 《AUDIO ENGINEERING SOCIETY(AES)127TH CONVENTION》, 12 October 2009 (2009-10-12), pages 1 - 6 *
JEFFREY THOMPSON ET AL.: "An Active Multichannal Downmix Enhancement for Minimizing Spatial and Spectral Distortions", 《AUDIO ENGINEERING SOCIETY(AES)127TH CONVENTION》, 12 October 2009 (2009-10-12), pages 1 - 7 *
JIMMY LAPIERRE ET AL.: "On Improving Parametric Stereo Audio Coding", 《AUDIO ENGINEERING SOCIETY(AES)120TH CONVENTION》, 23 May 2006 (2006-05-23), pages 1 - 9 *
JUNGHOE KIM ET AL.: "Enhanced Stereo Coding with phase parameters for MPEG Unified Speech and Audio Coding", 《AUDIO ENGINEERING SOCIETY(AES)127TH CONVENTION》, 12 October 2009 (2009-10-12), pages 1 - 7 *
SAMSUDIN ET AL.: "A Subband Domain Downmixing Scheme for Parametric Stereo Encoder", 《AUDIO ENGINEERING SOCIETY(AES)120TH CONVENTION》, 23 May 2006 (2006-05-23), pages 1 - 6 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104509131A (zh) * 2012-07-31 2015-04-08 英迪股份有限公司 一种用于处理音频信号的方法和设备
CN107690123A (zh) * 2012-12-04 2018-02-13 三星电子株式会社 音频提供方法
US10341800B2 (en) 2012-12-04 2019-07-02 Samsung Electronics Co., Ltd. Audio providing apparatus and audio providing method
CN107690123B (zh) * 2012-12-04 2021-04-02 三星电子株式会社 音频提供方法
CN104299615A (zh) * 2013-07-16 2015-01-21 华为技术有限公司 一种声道间电平差处理方法及装置
WO2015007075A1 (zh) * 2013-07-16 2015-01-22 华为技术有限公司 一种声道间电平差处理方法及装置
US10002615B2 (en) 2013-07-16 2018-06-19 Huawei Technologies Co., Ltd. Inter-channel level difference processing method and apparatus
CN113544774A (zh) * 2019-03-06 2021-10-22 弗劳恩霍夫应用研究促进协会 降混器及降混方法

Also Published As

Publication number Publication date
KR101732338B1 (ko) 2017-05-04
US9070358B2 (en) 2015-06-30
JP5643834B2 (ja) 2014-12-17
TWI573130B (zh) 2017-03-01
BR112012011084A2 (pt) 2017-09-19
JP2013511062A (ja) 2013-03-28
BR112012011084B1 (pt) 2020-12-08
EP2499638A1 (en) 2012-09-19
MX2012005414A (es) 2012-06-14
US20120224702A1 (en) 2012-09-06
RU2012123750A (ru) 2013-12-20
TW201145259A (en) 2011-12-16
KR20120089335A (ko) 2012-08-09
RU2560790C2 (ru) 2015-08-20
EP2323130A1 (en) 2011-05-18
WO2011058484A1 (en) 2011-05-19
CN102598122B (zh) 2014-10-29
EP2499638B1 (en) 2015-02-25

Similar Documents

Publication Publication Date Title
CN102598122B (zh) 参量编码和解码
JP6641018B2 (ja) チャネル間時間差を推定する装置及び方法
EP1999747B1 (en) Audio decoding
CN102598717B (zh) 使用参数化立体声的fm立体声无线电接收机的音频信号的改进
NO20200106A1 (no) Kompatibel flerkanal-koding/dekoding
JP5455647B2 (ja) オーディオデコーダ
RU2417458C2 (ru) Генерирование многоканальных звуковых сигналов
TWI714046B (zh) 用於估計聲道間時間差的裝置、方法或計算機程式
CN104885150B (zh) 用于多声道缩混/上混情况的通用空间音频对象编码参数化概念的解码器和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant