CN103403801A - 参数多通道编码器和解码器 - Google Patents
参数多通道编码器和解码器 Download PDFInfo
- Publication number
- CN103403801A CN103403801A CN2011800686896A CN201180068689A CN103403801A CN 103403801 A CN103403801 A CN 103403801A CN 2011800686896 A CN2011800686896 A CN 2011800686896A CN 201180068689 A CN201180068689 A CN 201180068689A CN 103403801 A CN103403801 A CN 103403801A
- Authority
- CN
- China
- Prior art keywords
- signal
- channel
- time difference
- ear
- ambiguity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 2
- 230000000977 initiatory effect Effects 0.000 claims description 2
- 210000005069 ears Anatomy 0.000 description 5
- 238000009499 grossing Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及一种参数多通道编码器501,其用于编码包括第一通道信号和第二通道信号的多通道信号,所述参数多通道编码器501包括:估计器505,其用于估计所述第一通道信号与所述第二通道信号之间的耳间时差以获得所述耳间时差的估计,所述估计器505经进一步配置以确定模糊性指示符,所述模糊性指示符指示所述耳间时差的所述估计的不可靠性等级;降频混合信号产生器507,其用于从所述第一通道信号和所述第二通道信号产生降频混合信号;以及多路复用器511,其用于多路复用所述降频混合信号、所述耳间时差和模糊性参数以获得经编码信号。
Description
技术领域
本发明涉及音频译码。
背景技术
C.Faller和F.Baumgarte在2001年10月的音频和声音信号处理应用的IEEE工作会议会刊第199到202页中描述了参数立体声或多通道音频译码,其使用空间换片信号和通常为单声道或立体声的降频混合的音频信号来用较多通道合成信号。通常,降频混合的音频信号是得自例如立体声音频信号的多通道音频信号的多个音频通道信号的叠加。对这些较少通道进行波形译码,且将与原始信号信道关系相关的辅助信息,即空间换片信号添加到经译码的音频通道。解码器使用此辅助信息,基于降频混合的音频通道的经解码波形来重新产生原始数目的音频通道。
发明内容
本发明将实现的目标是提供用于从降频混合音频信号合成多通道音频信号的有效概念。
此目的通过独立权利要求的特征来实现。从附属权利要求、描述内容和附图中明了另外的实施方案形式。
根据第一方面,本发明涉及一种参数多通道编码器,其用于编码包括第一通道信号和第二通道信号的多通道信号,所述参数多通道编码器包括:估计器,其用于估计所述第一通道信号与所述第二通道信号之间的耳间时差以获得所述耳间时差的估计,所述估计器经进一步配置以确定模糊性指示符,所述模糊性指示符指示所述耳间时差的所述估计的不可靠性等级;降频混合信号产生器,其用于从所述第一通道信号和所述第二通道信号产生降频混合信号;以及多路复用器,其用于多路复用所述降频混合信号、所述耳间时差和模糊性参数以获得经编码信号。
在根据第一方面的音频信号处理器的第一可能实施方案形式中,所述估计器经配置以确定所述第一通道信号与所述第二通道信号之间的延迟以估计所述耳间时差。
在根据第一方面或根据第一方面的第一实施方案形式的音频信号处理器的第二可能实施方案形式中,所述估计器包括傅立叶变换器,用于将所述第一通道信号和所述第二通道信号变换到频域中以获得第一经变换通道信号和第二经变换通道信号,且其中所述估计器经配置以估计所述第一与所述第二经变换通道信号之间的相位差,所述相位差指示所述耳间时差。
在根据第一方面或根据第一方面的前述实施方案形式中的任一者的音频信号处理器的第三可能实施方案形式中,所述估计器经配置以在不同带宽上确定所述第一通道信号与所述第二通道信号之间的延迟的标准偏差以确定所述模糊性指示符。
在根据第一方面或根据第一方面的前述实施方案形式中的任一者的音频信号处理器的第四可能实施方案形式中,所述估计器经配置以确定所述模糊性指示符的第一值或所述模糊性指示符的第二值,所述第一值指示所述耳间时差不可靠,所述第二值指示所述耳间时差可靠。
在根据第一方面或根据第一方面的前述实施方案形式中的任一者的音频信号处理器的第五可能实施方案形式中,所述估计器经配置以确定所述模糊性指示符的多个值中的一者,每一值与所述耳间时差的所述估计的不同的不可靠性等级相关联。
在根据第一方面或根据第一方面的前述实施方案形式中的任一者的音频信号处理器的第六可能实施方案形式中,所述估计器经配置以确定所述第一通道信号与所述第二通道信号之间的交叉相关以估计所述耳间时差。
在根据第一方面或根据第一方面的前述实施方案形式中的任一者的音频信号处理器的第七可能实施方案形式中,所述耳间时差的所述估计的所述不可靠性等级是通过所述第一通道信号与所述第二通道信号之间的延迟来确定。
在根据第一方面或根据第一方面的前述实施方案形式中的任一者的音频信号处理器的第八可能实施方案形式中,所述降频混合信号产生器经配置以组合所述第一通道信号与所述第二通道信号以获得所述降频混合信号。
在根据第一方面或根据第一方面的前述实施方案形式中的任一者的音频信号处理器的第九可能实施方案形式中,所述估计器经配置以量化所述耳间时差以获得经量化耳间时差,且其中所述多路复用器经配置以将所述经量化耳间时差包含到所述经编码信号中。
在根据第一方面或根据第一方面的前述实施方案形式中的任一者的音频信号处理器的第十可能实施方案形式中,第一音频信号是从来自不同方向的第一音频信号源和第二音频信号源发起的音频信号分量的叠加。
根据第二方面,本发明涉及一种参数多通道解码器,其用于解码接收的信号以获得具有第一经解码通道信号和第二经解码通道信号的多通道音频信号,所述接收的信号包括降频混合信号、所述第一通道信号与所述第二通道信号之间的耳间时差的估计以及模糊性指示符,所述模糊性指示符指示所述耳间时差的所述估计的不可靠性等级,所述参数多通道解码器包括:多路分用器,其用于多路分用所述接收的信号以提供所述降频混合信号、所述耳间时差的所述估计和所述模糊性指示符;
以及合成器,其用于使用所述经编码降频混合信号、所述耳间时差的所述估计和所述模糊性指示符从所述多通道音频信号合成所述第一经解码通道信号和所述第二经解码通道信号。
在根据第二方面的音频信号处理器的第一可能实施方案形式中,所述多路分用器经配置以提取所述接收的信号的第一部分以获得所述多通道音频信号,提取所述接收的信号的第二部分以获得所述耳间时差的所述估计,且提取所述接收的信号的第三部分以获得所述模糊性指示符。
在根据第二方面或根据第二方面的第一实施方案形式的音频信号处理器的第二可能实施方案形式中,所述参数多通道解码器经配置以在所述模糊性指示符指示对应于所述耳间时差的所述估计的可靠性的等级的情况下基于所述估计耳间时差来修正所述第一经解码通道信号和所述第二经解码通道信号的相位。
在根据第二方面或根据第二方面的前述实施方案形式中的任一者的音频信号处理器的第三可能实施方案形式中,所述参数多通道解码器经配置以在所述模糊性指示符指示对应于所述耳间时差的所述估计的不可靠性等级的等级的情况下调制所述耳间时差的所述估计,且基于所述耳间时差的所述经调制估计来修正所述第一经解码通道信号和所述第二经解码通道信号的相位。
根据第三方面,本发明涉及一种用于参数多通道编码包括第一通道信号和第二通道信号的多通道信号的编码方法,所述编码方法包括:估计所述第一通道信号与所述第二通道信号之间的耳间时差以获得所述耳间时差的估计,估计器经进一步配置以确定模糊性指示符,所述模糊性指示符指示所述耳间时差的所述估计的不可靠性等级;从所述第一通道信号和所述第二通道信号产生降频混合信号;以及多路复用所述降频混合信号、所述耳间时差和模糊性参数以获得经编码信号。
根据第四方面,本发明涉及一种用于参数多通道解码接收的信号以获得具有第一经解码通道信号和第二经解码通道信号的多通道音频信号的解码方法,所述接收的信号包括降频混合信号、所述第一通道信号与所述第二通道信号之间的耳间时差的估计以及模糊性指示符,所述模糊性指示符指示所述耳间时差的所述估计的不可靠性等级,所述解码方法包括:多路分用所述接收的信号以提供所述降频混合信号、所述耳间时差的所述估计和所述模糊性指示符;以及使用所述经编码降频混合信号、所述耳间时差的所述估计和所述模糊性指示符合成所述多通道音频信号的所述第一经解码通道信号和所述第二经解码通道信号。
根据第五方面,本发明涉及一种计算机程序,其用于当在计算机上运行时执行第三方面或第四方面的方法。
附图说明
将关于附图描述本发明的另外实施例,其中:
图1展示耳间时差(ITD)的原理的说明;
图2展示ITD切换问题的典型情形;
图3展示ITD估计和标准偏差的实例;
图4展示ITD提取和合成的技术;以及
图5展示模糊ITD合成的图。
具体实施方式
耳间时差(ITD)是声音在收听者的两耳之间的到达时间差。ITD在声音定位方面是重要的,因为其提供了声音源相对于头部的方向或角度的换片信号。如果信号从一侧到达头部,那么与较近的耳相比,信号要行进较远的路程来到达较远的耳。此路径长度差导致声音到达两耳的时间差,这被感知且有助于识别声音源方向的过程。
图1展示ITD的实例。通过声波的延迟来指示收听者101的两耳103与105的到达时间差。可界定,如果波形首先到达左耳,那么ITD为正,否则为负。如果声音源在收听者的正前方,那么ITD为零。
当用固有的ITD换片信号来译码音频项目时,例如通过安装在虚拟头部上的双耳麦克风或两个高保真麦克风记录的双耳音频,ITD估计是不可靠的,而且当来自不同方向的多个源同时作用时,估计的ITD经常快速变化。在此情况下,参数立体声解码信号经常是不稳定的,即,感知到源具有不稳定的方向。
图2展示此问题的典型情形。在左侧和右侧存在两个讲话者。左边的讲话者201首先开始说话,即,他的ITD是正的,随后右边的讲话者205开始讲话,即,他的ITD是负的。当两个讲话者同时讲话时,这两个讲话者之间存在串音203。在串音期间,单个ITD无法正确表示通道关系。
如果ITD从正值直接切换到负值,那么在切换点附近感知到咯声。然而,如果在从正值切换到负值之前将ITD设定为零,那么右边的讲话者将被感知为从左侧移动到右侧并保持在右侧。
图3展示图2中所示的双耳话音的ITD估计301和标准偏差303的实例。大约在时间600处发生从一个话音源到另一话音源的切换,中间存在重叠。ITD标准偏差303展现出峰,表明不稳定的ITD。不稳定的ITD表明定位信息是模糊的。因此,不可能仅依赖于一个延迟参数来维持立体声声像。
在不稳定的ITD的情形中,例如在对应于两个源的两个值之间切换,ITD是不明确的。其可能取决于每一频率和时间并根据哪一个源较强,即具有比另一者多的能量,而从一个源到另一个源随机取值。在此情况下,使用“模糊ITD”,即,将立体声信号再现,使得其被感知为不清楚的。通过使用此策略,ITD的直接切换和不稳定性不会被感知到太多。
使用模糊ITD的参数立体声编码器可通过以下步骤来描述:接收立体声信号;估计通道间换片信号,包含估计ITD;如果ITD在波动或不清楚,那么将ITD估计为模糊的;以及如果进行估计或确定,那么将单声道降频混合加上包含模糊ITD的通道间换片信号封装到位流中。
使用模糊ITD的参数立体声解码器可通过以下步骤来描述:接收位流;从位流获得单声道信号加上通道间换片信号;使用通道间换片信号合成立体声信号;以及如果检测到模糊ITD,则在对应频率和时间将立体声信号合成为不清楚的。
模糊ITD可以各种方式来表示,例如在位流中:除了使用常规ITD,还可将一个或一个以上ITD界定为模糊的,并可界定不同程度的模糊性;可使用仅一个参数,例如将模糊ITD界定为零(ITD=0),但具有不同的模糊性等级;或者可使用两个参数,例如一个是常规ITD,一个是模糊性程度。
在解码器处,可以不同方式合成模糊ITD:取决于所需的模糊性程度来合成所需ITD并将左通道和右通道解相关;合成对应于所需模糊性的所需ITD和ICC;合成随着时间而波动的ITD;或者合成随着频率而波动的ITD。
图4展示包括编码器401和解码器403的ITD提取与合成的实施例。
参数多通道编码器401包括估计器405、降频混合装置407、编码器409和多路复用器411。参数多通道解码器403包括多路分用器413、解码器417和解量化器419。根据实施方案形式,估计器405经配置以根据本文描述的原理来提取模糊性因数。
在编码器401中,在短时离散傅立叶变换域(STFT域)中从左通道x1(n)和右通道x2(n)提取ITD。在不失一般性的情况下,可将技术描述为使用取样信号。用小写字母写出时域信号,例如x(n),其中n是时间指数。对时域信号进行取样的取样频率是fs Hz。将对应的短时离散傅立叶变换(STFT)表示为X(k,i),其中k是帧指数,即向下取样的时间指数,且i是频率指数。将离散傅立叶变换(DFT)大小表示为N。
通过单极平均来估计时间平滑的交叉谱
其中*表示复共轭,并决定指数时间平滑的衰退。α是范围从0到1的平滑因数。随着时间和频率而变的延迟如下给定
其中∠C(k,i)是C(k,i)的未展开相位。相位展开确保了2PI的所有适当倍数都包含在∠C(k,i)中。
最终,将全频带延迟估计为
其中il和ih是可根据等式(4)计算的STFT区间指数
其中[fl,fh]Hz是延迟估计频率范围。l和h是低和高的简写。
使用交叉谱的经平滑型式和频带的仅用于ITD估计的一部分可使得延迟估计稳健且可靠。
在参数立体声解码器处,可通过修改左频谱和右频谱来合成延迟d(k),
应注意,等式(5)对左通道给出d(k)/2的延迟,对右通道给出-d(k)/2的延迟。或者,还可能不修改一个通道,并对另一通道给出全部延迟。
在下文中,将描述模糊性指示符提取。
在复合音频信号中,单个延迟经常无法精确表示音频通道之间的关系。样本中的延迟的标准偏差,
可用作单个延迟如何精确地描述通道关系,或同等地,延迟随着频率变化多少的指标。
如果σd(k)高于阈值,那么可将模糊性指示符设定为1,否则将指示符设定为0。
可使用交叉相关来提取模糊性指示符。如果两个通道的最大交叉相关低于阈值,那么可将模糊性指示符设定为1,否则将指示符设定为0。
在下文中,将描述模糊时间延迟合成。
如等式(5)所完成的全频带单个延迟的应用仍可改进。如果一个双耳信号具有位于左侧和右侧的两个源,那么在每次仅一个源作用的情况下,音频通道之间的延迟在与两个源的方向相关的延迟之间跳变。然而,如果两个源同时作用,那么单个延迟无法表示通道关系。
当源同时作用时,定位的不清楚增加。在此情况下,单个延迟将导致在特定方向上感知到并不模糊的对象。为了改善单个延迟参数立体声合成,可使用额外的定位模糊参数。
合成模糊源的一种方式是随着频率改变估计的延迟,例如
其中β是样本中的调制振幅,且γ决定直到奈奎斯特频率含有多少正弦调制周期。
给定d%(k,i)模糊时间延迟,如下实施合成
为了防止模糊性过快地接通和断开,在解码器处对模糊性指示符进行时间平滑。如果将范围从0到1的经时间平滑的模糊性指示符表示为f(k),那么适于模糊性程度的模糊延迟可计算为:
或者当某一模糊性程度存在时,可减小d(k)或将其设定为零。
与使用延迟调制相比,也可能将不同的全通滤波器应用于左边和右边而获得模糊空间声像:
其中A1(i)和A2(i)表示全通滤波器。更一般来说,可使用解相关器来代替全通滤波器。
参数立体声编码器例如按上文所述来估计时间延迟d(k)。另外,确定模糊性指示符f(k)。举例来说,可使用0或1的指示符,其中1指示延迟为模糊的。延迟和模糊性指示符通常作为参数立体声参数与例如电平差等其它参数一起发射到解码器。如果f(k)=0(可靠的ITD),那么参数立体声解码器使用等式(5)用于延迟合成。如果f(k)=1(不可靠的ITD),那么参数立体声解码器使用等式(8)用于延迟合成。
或者,可使用具有不同值的模糊性指示符。在此情况下,参数解码器能够用不同的模糊性程度来合成延迟。举例来说,可通过改变等式(9)中的β来改变模糊性程度。模糊性程度越高,源就越不稳定。
图5展示模糊ITD合成的图。模糊ITD合成实施方案包含参数多通道编码器501和参数多通道解码器503。参数多通道编码器501包括估计器505、降频混合装置507、编码器509、模糊性指示符提取装置523和多路复用器511。参数多通道解码器503包括多路分用器513、模糊性指示器515、解码器517和解量化器519。
在下文中,将描述多通道实施方案。
使用以下等式从多通道信号提取ITD。
其中ICi(d)是如下界定的经正规化交叉相关
其中xref表示参考信号,且xj表示通道信号j。参考信号xref可在通道中的一者xj(j在[1,M]中)中选择,且随后在解码器中计算M-1个空间换片信号。参考信号xref也可为单声道降频混合信号,其为全部M个通道的平均,且随后可在解码器中计算M个空间换片信号。
使用降频混合信号作为多通道音频信号的参考的优点是避免使用静默信号作为参考信号。实际上,降频混合表示所有通道的能量的平均,且因此较不容易经受静默。
如果ICj(d)低于给定阈值,那么可将通道j的模糊性指示符设定为1,否则设定为0。此模糊性指示符需要发射到解码器。
在解码器中,以相同方式合成模糊源。
估计的延迟随着频率改变,例如
其中β是样本中的调制振幅,且γ决定直到奈奎斯特频率含有多少正弦调制周期。j是通道的指数。
给定d%j(k,i)模糊时间延迟,如下实施合成
为了防止模糊性过快地接通和断开,在解码器处对模糊性指示符进行时间平滑。如果将范围从0到1的经时间平滑的模糊性指示符表示为fj(k),那么适于模糊性程度的模糊延迟可计算为:
或者当某一模糊性程度存在时,可减小dj(k)或将其设定为零。
与使用延迟调制相比,将不同的全通滤波器应用于所有通道而获得模糊空间声像:
其中Aj(i)表示应用的全通滤波器。更一般来说,可使用解相关器来代替全通滤波器。
如果模糊性指示符指示第一等级的耳间时差估计的不可靠性,尤其是耳间时差估计的不可靠性,其小于第二等级的耳间时差估计的不可靠性,尤其是耳间时差估计的可靠性,那么参数多通道解码器403、503可经配置以基于估计耳间时差来修正第一经解码通道信号和第二经解码通道信号的相位。
如果模糊性指示符指示第二等级的耳间时差估计的不可靠性,尤其是耳间时差估计的可靠性,其大于第一等级的耳间时差估计的不可靠性,尤其是耳间时差估计的不可靠性,那么参数多通道解码器403、503可经进一步配置以基于耳间时差的经调制估计来修正第一经解码通道信号和第二经解码通道信号的相位。
Claims (18)
1.一种参数多通道编码器(401、501),其用于编码包括第一通道信号和第二通道信号的多通道信号,所述参数多通道编码器(401、501)包括:
估计器(405、505),其用于估计所述第一通道信号与所述第二通道信号之间的耳间时差以获得所述耳间时差的估计,所述估计器(405、505)经进一步配置以确定模糊性指示符,所述模糊性指示符指示所述耳间时差的所述估计的不可靠性等级;
降频混合信号产生器(407、507),其用于从所述第一通道信号和所述第二通道信号产生降频混合信号;以及
多路复用器(411、511),其用于多路复用所述降频混合信号、所述耳间时差和模糊性参数以获得经编码信号。
2.根据权利要求1所述的参数多通道编码器(401、501),其中所述估计器(405、505)经配置以确定所述第一通道信号与所述第二通道信号之间的延迟以估计所述耳间时差。
3.根据前述权利要求中任一权利要求所述的参数多通道编码器(401、501),其中所述估计器(405、505)包括傅立叶变换器,用于将所述第一通道信号和所述第二通道信号变换到频域中以获得第一经变换通道信号和第二经变换通道信号,且其中所述估计器(405、505)经配置以估计所述第一与所述第二经变换通道信号之间的相位差,所述相位差指示所述耳间时差。
4.根据前述权利要求中任一权利要求所述的参数多通道编码器(401、501),其中所述估计器(405、505)经配置以在不同带宽上确定所述第一通道信号与所述第二通道信号之间的所述延迟的标准偏差以确定所述模糊性指示符。
5.根据前述权利要求中任一权利要求所述的参数多通道编码器(401、501),其中所述估计器(405、505)经配置以确定所述模糊性指示符的第一值或所述模糊性指示符的第二值,所述第一值指示所述耳间时差不可靠,所述第二值指示所述耳间时差可靠。
6.根据前述权利要求中任一权利要求所述的参数多通道编码器(401、501),其中所述估计器(405、505)经配置以确定所述模糊性指示符的多个值中的一者,每一值与所述耳间时差的所述估计的不同的不可靠性等级相关联。
7.根据前述权利要求中任一权利要求所述的参数多通道编码器(401、501),其中所述估计器(405、505)经配置以确定所述第一通道信号与所述第二通道信号之间的交叉相关以估计所述耳间时差。
8.根据前述权利要求中任一权利要求所述的参数多通道编码器(401、501),其中所述耳间时差的所述估计的所述不可靠性等级是通过所述第一通道信号与所述第二通道信号之间的交叉相关来确定。
9.根据前述权利要求中任一权利要求所述的参数多通道编码器(401、501),其中所述降频混合信号产生器(407、507)经配置以组合所述第一通道信号与所述第二通道信号以获得所述降频混合信号。
10.根据前述权利要求中任一权利要求所述的参数多通道编码器(401、501),其中所述估计器(405、505)经配置以量化所述耳间时差以获得经量化耳间时差,且其中所述多路复用器(411、511)经配置以将所述经量化耳间时差包含到所述经编码信号中。
11.根据前述权利要求中任一权利要求所述的参数多通道编码器(401、501),其中第一音频信号是从来自不同方向的第一音频信号源和第二音频信号源发起的音频信号分量的叠加。
12.一种参数多通道解码器(403、503),其用于解码接收的信号以获得具有第一经解码通道信号和第二经解码通道信号的多通道音频信号,所述接收的信号包括降频混合信号、所述第一通道信号与所述第二通道信号之间的耳间时差的估计以及模糊性指示符,所述模糊性指示符指示所述耳间时差的所述估计的不可靠性等级,所述参数多通道解码器(403、503)包括:
多路分用器(413、513),其用于多路分用所述接收的信号以提供所述降频混合信号、所述耳间时差的所述估计和所述模糊性指示符;以及
合成器(421、521),其用于使用所述经编码降频混合信号、所述耳间时差的所述估计和所述模糊性指示符从所述多通道音频信号合成所述第一经解码通道信号和所述第二经解码通道信号。
13.根据权利要求12所述的参数多通道解码器(403、503),其中所述多路分用器(513)经配置以提取所述接收的信号的第一部分以获得所述多通道音频信号,提取所述接收的信号的第二部分以获得所述耳间时差的所述估计,且提取所述接收的信号的第三部分以获得所述模糊性指示符。
14.根据权利要求12或13所述的参数多通道解码器(403、503),其中所述参数多通道解码器(403、503)经配置以在所述模糊性指示符指示对应于所述耳间时差的所述估计的可靠性的等级的情况下基于所述估计耳间时差来修正所述第一经解码通道信号和所述第二经解码通道信号的相位。
15.根据权利要求12、13或14所述的参数多通道解码器(403、503),其中所述参数多通道解码器(403、503)经配置以在所述模糊性指示符指示对应于所述耳间时差的所述估计的不可靠性等级的等级的情况下调制所述耳间时差的所述估计,且基于所述耳间时差的所述经调制估计来修正所述第一经解码通道信号和所述第二经解码通道信号的相位。
16.一种用于参数多通道编码包括第一通道信号和第二通道信号的多通道信号的编码方法,所述编码方法包括:
估计所述第一通道信号与所述第二通道信号之间的耳间时差以获得所述耳间时差的估计,估计器(405、505)经进一步配置以确定模糊性指示符,所述模糊性指示符指示所述耳间时差的所述估计的不可靠性等级;
从所述第一通道信号和所述第二通道信号产生降频混合信号;以及
多路复用所述降频混合信号、所述耳间时差和模糊性参数以获得经编码信号。
17.一种用于参数多通道解码接收的信号以获得具有第一经解码通道信号和第二经解码通道信号的多通道音频信号的解码方法,所述接收的信号包括降频混合信号、所述第一通道信号与所述第二通道信号之间的耳间时差的估计以及模糊性指示符,所述模糊性指示符指示所述耳间时差的所述估计的不可靠性等级,所述解码方法包括:
多路分用所述接收的信号以提供所述降频混合信号、所述耳间时差的所述估计和所述模糊性指示符;以及
使用所述经编码降频混合信号、所述耳间时差的所述估计和所述模糊性指示符合成所述多通道音频信号的所述第一经解码通道信号和所述第二经解码通道信号。
18.一种计算机程序,其用于当在计算机上运行时执行根据权利要求16或17所述的方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2011/079051 WO2013029225A1 (en) | 2011-08-29 | 2011-08-29 | Parametric multichannel encoder and decoder |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103403801A true CN103403801A (zh) | 2013-11-20 |
CN103403801B CN103403801B (zh) | 2015-11-25 |
Family
ID=47755184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180068689.6A Active CN103403801B (zh) | 2011-08-29 | 2011-08-29 | 参数多通道编码器和解码器 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN103403801B (zh) |
WO (1) | WO2013029225A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103916217A (zh) * | 2014-03-25 | 2014-07-09 | 烽火通信科技股份有限公司 | Xlgmii接口多通道降频dic机制的实现方法及装置 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107742521B (zh) * | 2016-08-10 | 2021-08-13 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
AU2021451130A1 (en) * | 2021-06-15 | 2023-11-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Improved stability of inter-channel time difference (itd) estimator for coincident stereo capture |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1600791A1 (en) * | 2004-05-26 | 2005-11-30 | Honda Research Institute Europe GmbH | Sound source localization based on binaural signals |
WO2009042386A1 (en) * | 2007-09-25 | 2009-04-02 | Motorola, Inc. | Apparatus and method for encoding a multi channel audio signal |
CN101408615A (zh) * | 2008-11-26 | 2009-04-15 | 武汉大学 | 双耳时间差itd临界感知特性的测量方法及其装置 |
EP2323130A1 (en) * | 2009-11-12 | 2011-05-18 | Koninklijke Philips Electronics N.V. | Parametric encoding and decoding |
-
2011
- 2011-08-29 WO PCT/CN2011/079051 patent/WO2013029225A1/en active Application Filing
- 2011-08-29 CN CN201180068689.6A patent/CN103403801B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1600791A1 (en) * | 2004-05-26 | 2005-11-30 | Honda Research Institute Europe GmbH | Sound source localization based on binaural signals |
WO2009042386A1 (en) * | 2007-09-25 | 2009-04-02 | Motorola, Inc. | Apparatus and method for encoding a multi channel audio signal |
CN101408615A (zh) * | 2008-11-26 | 2009-04-15 | 武汉大学 | 双耳时间差itd临界感知特性的测量方法及其装置 |
EP2323130A1 (en) * | 2009-11-12 | 2011-05-18 | Koninklijke Philips Electronics N.V. | Parametric encoding and decoding |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103916217A (zh) * | 2014-03-25 | 2014-07-09 | 烽火通信科技股份有限公司 | Xlgmii接口多通道降频dic机制的实现方法及装置 |
CN103916217B (zh) * | 2014-03-25 | 2017-06-13 | 烽火通信科技股份有限公司 | Xlgmii接口多通道降频dic机制的实现方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103403801B (zh) | 2015-11-25 |
WO2013029225A1 (en) | 2013-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7342091B2 (ja) | 二次元または三次元音場のアンビソニックス表現の一連のフレームをエンコードおよびデコードする方法および装置 | |
EP1595247B1 (en) | Audio coding | |
KR100754220B1 (ko) | Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법 | |
EP2476113B1 (en) | Method, apparatus and computer program product for audio coding | |
US8332229B2 (en) | Low complexity MPEG encoding for surround sound recordings | |
EP3122073B1 (en) | Audio signal processing method and apparatus | |
CN101410889B (zh) | 对作为听觉事件的函数的空间音频编码参数进行控制 | |
US20050177360A1 (en) | Audio coding | |
CN101542597B (zh) | 用于编码和解码基于对象的音频信号的方法和装置 | |
CN102682773B (zh) | 多对象音频解码设备 | |
CN104246873B (zh) | 用于编码多声道音频信号的参数编码器 | |
CN105190747A (zh) | 用于空间音频对象编码中时间/频率分辨率的反向兼容动态适应的编码器、解码器及方法 | |
EP2633520B1 (en) | Parametric encoder for encoding a multi-channel audio signal | |
CN101529504A (zh) | 多通道参数转换的装置和方法 | |
CN101911732A (zh) | 用于处理音频信号的方法和装置 | |
CN101911181A (zh) | 用于处理音频信号的方法和装置 | |
MX2013013058A (es) | Aparato y metodo para generar una señal de salida que emplea un descomponedor. | |
JP2015517121A (ja) | インターチャネル差分推定方法及び空間オーディオ符号化装置 | |
Kraft et al. | Stereo signal separation and upmixing by mid-side decomposition in the frequency-domain | |
CN103262158A (zh) | 对解码的多声道音频信号或立体声信号进行后处理的装置和方法 | |
CN103403801B (zh) | 参数多通道编码器和解码器 | |
WO2011097916A1 (zh) | 立体声解码方法及装置 | |
EP2413598B1 (en) | Method for estimating inter-channel delay and apparatus and encoder thereof | |
Cheng et al. | A spatial squeezing approach to ambisonic audio compression | |
US20200314580A1 (en) | Method and apparatus for voice or sound activity detection for spatial audio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210427 Address after: Unit 3401, unit a, building 6, Shenye Zhongcheng, No. 8089, Hongli West Road, Donghai community, Xiangmihu street, Futian District, Shenzhen, Guangdong 518040 Patentee after: Honor Device Co.,Ltd. Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd. |