CN1669358A - 音频编码 - Google Patents
音频编码 Download PDFInfo
- Publication number
- CN1669358A CN1669358A CNA03816440XA CN03816440A CN1669358A CN 1669358 A CN1669358 A CN 1669358A CN A03816440X A CNA03816440X A CN A03816440XA CN 03816440 A CN03816440 A CN 03816440A CN 1669358 A CN1669358 A CN 1669358A
- Authority
- CN
- China
- Prior art keywords
- signal
- transient
- spatial parameters
- monophonic
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001052 transient effect Effects 0.000 claims abstract description 91
- 230000005236 sound signal Effects 0.000 claims description 30
- 238000000034 method Methods 0.000 claims description 28
- 238000005314 correlation function Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 5
- 230000000875 corresponding effect Effects 0.000 description 23
- 238000013139 quantization Methods 0.000 description 18
- 230000014509 gene expression Effects 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 10
- 238000011002 quantification Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 241001123248 Arma Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
在双声道立体声编码中,仅对一个单声道进行编码。附加层保存参数以便检索左、右信号。公开一种编码器,它把从单声道编码信号提取的瞬态信息链接到参数多声道层,从而提供增加的性能。瞬态位置可以直接从比特流中得到,或者也可从其它编码参数(例如mp3中的窗口交换标志)中估算。
Description
发明领域
本发明涉及音频编码。
发明背景
在传统的基于波形的音频编码方案、如MPEG-LII、mp3和AAC(MPEG-2高级音频编码)中,通过把两个单声道音频信号编码为一个比特流来对立体声信号编码。但是,通过以诸如中/侧立体声编码和强度编码之类的技术利用信道间相关性和不相关性,可进行比特率节省。
在中/侧立体声编码的情况下,具有大量单声道内容的立体声信号可分为和M=(L+R)/2以及差S=(L-R)/2信号。这个分解有时与主要分量分析或时变比例因子结合。然后,通过参数编码器或者波形编码器(例如变换或子带编码器)独立地将这些信号编码。对于某些频率范围,这种技术可能为M或S信号产生略高的能量。但是,对于某些频率范围,可为M或S信号获得能量的显著减少。通过这种技术得到的信息量减少主要取决于源信号的空间属性。例如,如果源信号为单声道的,则差信号为零并且可被丢弃。但是,如果左和右音频信号的相关性很低(对于较高频率范围,常常是这样),则这个方案几乎未提供优点。
在强度立体声编码的情况下,对于某些频率范围,仅一个信号I=(L+R)/2与L和R信号的强度信息一起编码。在解码器侧,在利用对应的强度信息对这个信号I进行缩放之后将其用于L和R信号。在这种技术中,高频(通常在5kHz以上)由单一音频信号(即单声道)表示,与时变和频率相关比例因子结合。
音频信号的参数描述在过去数年中已经受到关注,尤其是在音频编码领域。已经表明,描述音频信号的传输(量化)参数只要极少的传送容量在接收端重新合成感觉相等的信号。但是,当前的参数音频编码器重点放在对单声道信号编码,而立体声信号则常常作为双单声道来处理。
EP-A-1107232公开一种产生由左声道信号和右声道信号组成的立体声音频信号的表示的参数编码方案。为了有效地利用传输带宽,这种表示包含仅与或者是左声道信号或者是右声道信号的单声道信号有关的信息以及参数信息。另一个立体声信号可根据单声道信号结合参数信息来恢复。参数信息包含立体声音频信号的定位线索,包括左右声道的强度和相位特性。
在双声道立体声编码中,与强度立体声编码相似,仅对一个单声道进行编码。附加侧信息保存参数以便检索左、右信号。2002年4月提交的欧洲专利申请第02076588.9号(代理人档案号PHNL020356)公开了多声道音频的参数描述,它涉及Breebaart等人在以下文献中提出的双声道处理模型:“Binaural processing model based oncontralateral inhibition.I.Model setup”,J.Acoust.Soc.Am.,110,1074-1088,2001年8月;“Binaural processing model based on contralateralinhibition.II.Dependence on spectral parameters”,J.Acoust.Soc.Am.,110,1089-1104,2001年8月;以及“Binaural processing model based oncontralateral inhibition.III.Dependence on temporal parameters” ,J.Acoust.Soc.Am.,110,1105-1117,2001年8月,公开了一种双声道处理模型。这包括把输入音频信号分为若干限带信号,它们按照(等效矩形带宽)ERB速率比例来线性间隔。这些信号的带宽取决于中心频率,跟随ERB速率。随后,对于每个频带,分析输入信号的以下属性:
由出自左、右耳的限带信号的相对电平所定义的耳间电平差(ILD),
耳间时间(或相位)差(ITD或IPD),由对应于耳间互相关函数中的峰值的耳间延迟(或相移)来定义,以及
无法通过ITD或ILD说明的波形相似性(相异性),可通过最大耳间互相关(即在最大峰值的位置的互相关值)来参数化。因此,从以上公开中知道,任何多声道音频信号的空间属性可通过指定ILD、ITD(或IPD)以及最大相关、作为时间和频率的函数来描述。
这种参数编码技术为一般的音频信号提供相当优良的质量。但是,特别是对于具有较高不稳定性能的信号,例如响板、大键琴、钟琴等,该技术就会遇到前回声人工信号。
本发明的一个目的是提供一种音频编码器和解码器以及相应的方法,它们减少与参数多声道编码有关的人工信号。
发明公开
根据本发明,提供一种如权利要求1所述的对音频信号编码的方法以及一种如权利要求13所述的对比特流解码的方法。
根据本发明的一个方面,对多声道音频信号的空间属性进行参数化。空间属性最好包括:左右信号之间的电平差、时间差以及相关性。
利用本发明,瞬态位置直接或间接地从单声道信号中提取,并链接到参数多声道表示层。在参数多声道层中利用这个瞬态信息提供提高的性能。
普遍认为,在许多音频编码器中,用瞬态信息来指导编码过程以取得更好的性能。例如,在WO01/69593-A1中所述的正弦编码器中,瞬态位置被编码到比特流中。编码器可把这些瞬态位置用于比特流的自适应分段(自适应组帧)。另外,在解码器中,这些位置可用来指导正弦和噪声合成的开窗。但是,这些技术一直局限于单声道信号。
在本发明的优选实施例中,在对已经由这种正弦编码器产生了单声道内容的比特流进行解码时,瞬态位置可直接从比特流中得出。
在波形编码器、如mp3和AAC中,瞬态位置不是直接编码在比特流中;而是假定例如在mp3的情况下,通过在单声道层中交换到更短的窗口长度(窗口交换)来标记瞬态间隔,因此可根据例如mp3窗口交换标志等参数来估算瞬态位置。
附图简介
下面将通过实例,参照附图来描述本发明的优选实施例,附图中:
图1是示意图,说明根据本发明的一个实施例的编码器;
图2是示意图,说明根据本发明的一个实施例的解码器;
图3表示编码在单声道信号的各个子帧以及多声道层的对应帧中的瞬态位置;以及
图4表示来自单声道编码层的瞬态位置用于对参数多声道层解码的实例。
优选实施例说明
现在参照图1,图中表示根据本发明的一个优选实施例的编码器10,它用于对包含左(L)和右(R)输入信号的立体声音频信号编码。在优选实施例中,如2002年4月提交的欧洲专利申请第02076588.9号(代理人档案号PHNL020356)中所述,编码器用以下各项描述多声道音频信号:
一个单声道信号12,包括多个输入音频信号的组合,以及
对于各个附加声道,一组空间参数14包括:最好是用于每个时间/频率间隙的两个定位线索(ILD和ITD或IPD)以及描述无法通过ILD和/或ITD说明的波形相似性或相异性(例如互相关函数的最大值)的参数(r)。
空间参数集可被音频编码器用作增强层。例如,如果仅允许低比特率,则传送单声道信号,同时,通过包含空间增强层,解码器可再现立体声或多声道声音。
可以看到,虽然在本实施例中,一个空间参数集与单声道(单一信道)音频编码器结合,以便对立体声音频信号编码,但整体思想可应用于n声道音频信号,其中n>1。因此,如果传送(n-1)个空间参数集,则本发明原则上可用于从一个单声道信号产生n个声道。在这些情况下,空间参数描述如何从单一单声道信号形成n个不同的音频声道。因此,在解码器中,通过将空间参数的后续集与单声道编码信号结合,得到后续声道。
分析方法
一般来说,编码器10包括相应的变换模块20,它把各输入信号(L,R)分为子带信号16(最好是采用随频率而增加的带宽)。在优选实施例中,模块20采用开时间窗,然后是变换运算,从而执行时间/频率分片,但是也可使用时间连续方法(例如滤波器组)。
确定和信号12以及提取参数14的后续步骤在分析模块18中执行,并且包括:
求出对应子带信号16的电平差(ILD),
求出对应子带信号16的时间差(ITD或IPD),以及
描述无法通过ILD或ITD说明的波形相似性或相异性的量。
ILD的分析
ILD由对于给定频带在某个时刻的信号的电平差来确定。确定ILD的一种方法是测量两个输入声道的对应频带的均方根值,以及计算这些均方根值的比率(最好以dB表示)。
ITD的分析
ITD通过提供两个声道的波形之间最佳匹配的时间或相位对准来确定。获得ITD的一种方法是计算两个对应子带信号之间的互相关函数并找出最大值。与互相关函数中这个最大值对应的延迟可用作ITD值。
第二种方法是计算左右子带的分析信号(即计算相位和包络值),以及使用声道之间的相位差作为IPD参数。这里,采用复合滤波器组(例如FFT),通过查看某个仓位(频率范围),可随时间过去而得出相位函数。通过对左右声道进行这个操作,可估算相位差IPD(而不是把两个滤波后信号互相关)。
相关性的分析
通过首先找出提供对应子带信号之间最佳匹配的ILD和ITD,然后在对ITD和/或ILD补偿之后再测量波形的相似性,得到相关性。因此,在这个构架中,相关性被定义为无法归因于ILD和/或ITD的对应子带信号的相似性或相异性。此参数的适当量度是互相关函数的最大值(即一组延迟中的最大值)。但是,也可采用其它量度,例如ILD和/或ITD补偿之后的差信号与对应子带的和信号(最好也对ILD和/或ITD进行了补偿)相比的相对能量。这个差值参数基本上是(最大)相关性的线性变换。
参数量化
参数传输的一个重要问题是参数表示的准确度(即量化误差的大小),它与必需的传输容量和音频质量直接相关。在这个部分,将论述关于空间参数的量化的若干问题。基本思想是让量化误差基于空间线索的所谓的恰可察觉差异(JND)。更明确地说,量化误差由人的听觉系统对参数变化的灵敏度来决定。由于众所周知,对参数变化的灵敏度很大程度上取决于参数本身的值,因此应用以下方法来确定离散量化步长。
ILD的量化
通过心理声学研究得知,对ILD变化的灵敏度取决于ILD本身。如果ILD以dB表示,则与0dB参考的大约1dB的偏差是可检测的,而如果参考电平差达到20dB,则要求大约3dB的变化。因此,如果左右声道的信号具有较大的电平差,则量化误差可以较大。例如,可通过首先测量声道之间的电平差,然后再对所得电平差进行非线性(压缩)变换以及随后的线性量化过程,或者通过利用查找表找到具有非线性分布的可用ILD值,从而应用这个方法。在优选实施例中,ILD(单位为dB)被量化为来自以下集合I的最接近值:
I=[-19-16-13-10-8-6-4-2 0 2 4 6 8 10 13 16 19]
ITD的量化
人类主体对ITD变化的灵敏度可表征为具有恒定相位门限。这意味着,在延迟时间方面,ITD的量化步长应当随频率而减小。或者,如果ITD以相位差的形式表示,则量化步长应当与频率无关。实现这一点的一个方法是把固定相位差作为量化步长,并确定各频带的相应时延。这个ITD值则被用作量化步长。在优选实施例中,ITD量化步长由0.1弧度(rad)的各子带中的恒定相位差来确定。因此,对于各子带,对应于子带中心频率的0.1弧度的时间差被用作量化步长。对于2kHz以上的频率,没有传送任何ITD信息。
另一种方法是传送按照频率无关量化方案的相位差。大家还知道,在某个频率以上,人的听觉系统不易感受精细结构波形中的ITD。可通过仅传送一直到某个频率(通常为2kHz)的ITD参数来利用这个现象。
比特流减小的第三种方法是结合取决于ILD和/或相同子带的相关性参数的ITD量化步长。对于大ILD,可对ITD以较低精确度进行编码。此外,如果相关性极低,则已知人对ITD变化的灵敏度减小。因此,如果相关性小,则可应用更大的ITD量化误差。这种思想的一个极端实例是,如果相关性低于一定的门限,则根本不传送任何ITD。
相关性的量化
相关性的量化误差取决于(1)相关值本身,以及可能(2)取决于ILD。接近+1的相关值以高精确度进行编码(即小量化步长),而接近0的相关值则以低精确度进行编码(即大量化步长)。在优选实施例中,一组非线性分布的相关值(r)被量化为以下集合R的最接近值:
R=[1 0.95 0.9 0.82 0.75 0.6 0.3 0]
以及这对每个相关值耗用另外3位。
如果当前子带的(量化)ILD的绝对值达到19dB,则对于此子带,不传送任何ITD和相关值。如果某个子带的(量化)相关值等于零,则对该子带不传送任何ITD值。
这样,各帧要求最多233位来传送空间参数。对于1024个样本的更新帧长以及44.1kHz的采样率,传输的最大比特率低于10.25千比特/秒[233*44100/1024=10.034千比特/秒]。(应当指出,利用熵编码或差分编码,这个比特率还可进一步减小。)
第二种可能性是使用取决于相同子带的测量ILD的相关性的量化步长:对于大ILD(即一个声道在能量上占主导地位),相关性中的量化误差变得较大。这个原理的一个极端实例是,如果某个子带的IID的绝对值超过某个门限,则根本不传送那个子带的任何相关值。
详细实现
更具体来说,在模块20中,左右输入信号被分离为各种时间帧(44.1kHz采样率的2048个样本)以及采用平方根汉宁窗进行开窗。随后计算FFT。负FFT频率被丢弃,以及所得FFT被细分为FFT仓位的组或子带16。组合成子带g的FFT仓位的数量取决于频率:在较高频率上比在较低频率上组合更多仓位。在当前实现中,对应于大约1.8ERB的FFT仓位被组成组,产生20个子带以表示整个可听的频率范围。各后续子带的所得FFT仓位数量S[g](从最低频率开始)为
S=[4 4 4 5 6 8 9 12 13 17 21 25 30 38 45 55 68 82 100 477]
这样,前三个子带包含4个FFT仓位、第四个子带包含5个FFT仓位等等。对于各子带,分析模块18计算对应的ILD、ITD及相关性(r)。ITD和相关性仅通过把属于其它组的所有FFT仓位设置为零、把来自左右声道的所得(限带)FFT相乘、然后进行FFT逆变换来计算。扫描所得的互相关函数,寻找-64与+63样本之间的声道间延迟中的峰值。对应于该峰值的内部延迟被用作ITD值,此峰值处的互相关函数的值被用作这个子带的声道间相关值。最后,仅通过取各子带的左右声道的功率比来计算ILD。
和信号的产生
分析器18包含和信号生成器17,它在对信号求和之前对左右子带执行相位校正(时间对准)。这个相位校正是根据该子带的所计算ITD得出的,并包括把左声道子带延迟ITD/2以及把右声道子带延迟-ITD/2。通过适当修改各FFT仓位的相位角在频域中执行该延迟。然后,通过相加左右子带信号的相位修改后形式来计算和信号。最后,为了补偿不相关或相关加法,和信号的各子带与sqrt(2/(1+r))、与对应子带的相关性(r)相乘以产生最终的和信号12。必要时,和信号可通过以下方式转换到时域:(1)在负频率上插入复共轭,(2)逆FFT,(3)开窗,以及(4)叠加。
如上所述,给定时域和/或频域中的和信号12的表示,信号可以任何数量的传统方式编码在比特流50的单声道层40中。例如,mp3编码器可用来产生比特流的单声道层40。当这种编码器检测到输入信号的快速变化时,它可改变它用于那个特定时间周期的窗口长度,从而在对输入信号的那个部分编码时改进时间和/或频率定位。然后,窗口交换标志被嵌入比特流中,以便向稍后合成信号的解码器指明这个交换。为了本发明的目的,这个窗口交换标志被用作输入信号中瞬态位置的估算值。
但是,在优选实施例中,WO01/69593-A1中所述类型的正弦编码器30被用来产生单声道层40。编码器30包括瞬态编码器11、正弦编码器13以及噪声编码器15。
当信号12进入瞬态编码器11时,对于各更新间隔,编码器估算在分析窗口内是否存在瞬态信号分量及其位置(到样本精确度)。如果瞬态信号分量的位置被确定,则编码器11尝试提取瞬态信号分量(的主要部分)。它通过采用例如几个(少量)正弦分量把形状函数与最好是从估算的开始位置开始的信号段进行匹配,以及确定形状函数下的内容,并把这个信息包含在瞬态编码CT中。
减去瞬态分量的和信号12被提供给正弦编码器13,在其中对它进行分析以确定(确定性)正弦分量。简言之,正弦编码器把输入信号编码为从一个帧段链接到下一个的正弦分量的轨迹。这些轨迹最初由在给定段中开始的正弦的开始频率、开始幅度以及开始相位表示(诞生)。此后,轨迹在后续段中由频率差、幅度差以及可能的相位差(连续)表示,直到轨迹在其中结束的段为止(死去),以及把这个信息包含在正弦代码CS中。
减去瞬态和正弦分量的信号被假定为主要包含噪声,以及优选实施例的噪声分析器15产生表示这个噪声的噪声代码CN。按照传统方法,例如WO01/89086-A1中所述,噪声的频谱由噪声编码器根据等效矩形带宽(ERB)比例、采用组合的AR(自回归)MA(移动平均)滤波器参数(pi,qi)来建模。在解码器中,滤波器参数被馈入噪声合成器,噪声合成器主要是具有近似于噪声频谱的频率响应的滤波器。合成器通过采用ARMA滤波参数(pi,qi)对白噪声信号进行滤波来产生重构噪声,以及随后把它加入合成的瞬态和正弦信号,从而产生原始和信号的估算值。
多路复用器41产生单声道音频层40,它分为帧42,这些帧表示长度为16ms的重叠时间段以及每8ms被更新,如图4所示。各帧包含相应代码CT、CS和CN,以及在解码器中,当合成单声道和信号时,连续帧的代码在其重叠区域中被混合。在本实施例中,假定各帧仅可包含最多1个瞬态代码CT,这种瞬态的一个实例由标号44表示。
空间参数集的生成
分析器18还包括空间参数层生成器19。这个组件对各空间参数帧执行空间参数量化,如上所述。一般来说,生成器19把各空间层声道14分为帧46,这些帧表示长度为64ms的重叠时间段以及每32ms被更新,如图4所示。各帧包含相应的ILD、ITD或IPD以及相关系数,而在解码器中,当合成信号时,连续帧的值在其重叠区域中被混合,以便确定任何给定时间的空间层参数。
在优选实施例中,瞬态编码器11在单声道层40中(或者由对应分析器模块在和信号12中)检测的瞬态位置由生成器19用来确定是否需要空间参数层14中的不均匀时间分段。如果编码器正使用mp3编码器产生单声道层,则单声道流中的窗口交换标志的存在由生成器用作瞬态位置的估算值。
参照图4,生成器19可接收瞬态44需要被编码在与要为其产生帧的空间参数层的时间窗口对应的单声道层的后续帧之一中的指示。可以看到,由于各空间参数层包含表示重叠时间段的帧,因此对于任何给定时间,生成器将对于每个空间参数层产生两帧。在任何情况下,生成器继续对表示瞬态位置周围的较短长度窗口48的帧产生空间参数。应当指出,这个帧将与正常空间参数层帧的格式相同,并以同样方式计算,但它涉及瞬态位置44周围的较短时间窗口。这个短窗口长度帧为多信道图像提供增加的时间分辨率。然后,在瞬态窗口帧之前和之后原本已产生的帧用来表示特殊瞬态窗口47、49,它们把短瞬态窗口48连接到正常帧表示的窗口46。
在优选实施例中,表示瞬态窗口48的帧是空间表示层比特流14中的附加帧,但是,由于瞬态很少出现,所以它对整体比特率增加极少。不过关键的是,读取利用优选实施例产生的比特流的解码器考虑这个附加帧,否则单声道和空间表示层的同步将会受到损害。
在本实施例中还假定,由于瞬态很少出现,使得正常帧46的窗口长度中只有一个瞬态可能与空间参数层表示相关。即使在正常帧的周期中确实出现两个瞬态,也假定不均匀分段将出现在第一瞬态周围,如图3所示。这里,表示了三个瞬态44,它们编码在相应的单声道帧中。但是,正是第二瞬态而不是第三瞬态将用来表明,表示相同时间周期的空间参数层帧(表示在这些瞬态之下)应当用作第一瞬态窗口,在由编码器插入的附加空间参数层帧得出的瞬态窗口之前,以及其后又跟随表示第二瞬态窗口的帧。
但有可能的是,并非单声道层中编码的所有瞬态位置对于空间参数层都是相关的,如图3中的第一瞬态44的情况那样。因此,单声道或者空间表示层的比特流语法可包括对于空间表示层是相关或不相关的瞬态位置的指示符。
在优选实施例中,正是生成器19通过考察从围绕瞬态位置44的较大窗口(例如1024个样本)得出的估算空间参数(ILD、ITD及相关性(r))与从围绕瞬态位置的较短窗口48得出的那些参数之间的差,确定对于空间表示层的瞬态的相关性。如果在来自短和粗略时间间隔的参数之间存在明显变化,则在瞬态位置周围估算的额外空间参数被插入表示短时间窗口48的附加帧中。如果存在极少差异,则没有选择瞬态位置以用于空间表示中,以及指示相应地被包含在比特流中。
最后,一旦已经产生单声道40和空间表示14层,它们又由多路复用器43写入比特流50。这个音频流50又被提供给例如数据总线、天线系统、存储媒体等。
合成
现在参照图2,解码器60包括多路分离器62,它把输入音频流50分为单声道层40’以及在这种情况下的单一空间表示层14’。单声道层40’由对应于产生了该层的编码器的传统合成器64读取,从而提供原始和信号12’的时域估算。
然后,多路分离器62提取的空间参数14’由后处理模块66应用于和信号12’,以产生左右输出信号。优选实施例的后处理模块还读取单声道层14’信息,以便在这个信号中定位瞬态的位置。(或者,合成器64可向后处理器提供这种指示;但是,这将要求对其它方式的传统合成器64略作修改。)
在任何情况下,当后处理器检测到与待处理的空间参数层14’的帧的正常时间窗口对应的单声道层帧42内的瞬态44时,它知道这个帧表示短瞬态窗口48之前的瞬态窗口47。后处理器知道瞬态44的时间位置,因此知道该瞬态窗口之前的瞬态窗口47的长度,还知道瞬态窗口48之后的瞬态窗口49的长度。在优选实施例中,后处理器66包括混合模块68,在合成空间表示层时,它对于窗口47的第一部分混合窗口47的参数与前一帧的那些参数。从当时直到瞬态窗口48的开始,只有表示窗口47的帧的参数用于合成空间表示层。对于瞬态窗口48的第一部分,瞬态窗口47和瞬态窗口48的参数被混合,以及对于瞬态窗口48的第二部分,瞬态窗口49和瞬态窗口48的参数被混合,等等,直到瞬态窗口49的中间为止,此后,帧间混合照常继续进行。
如上所述,在任何给定时间所用的空间参数是两个正常窗口46帧的参数的混合,正常46和瞬态帧47、49的参数的混合,单独的瞬态窗口帧47、49的参数,或者瞬态窗口帧47、49的参数与瞬态窗口帧48的参数的混合。利用空间表示层的语法,模块68可选择表明空间表示层的不均匀时间分段的那些瞬态,以及在这些适当的瞬态位置上,短长度瞬态窗口提供多信道图像的更好的时间定位。
在后处理器66内,假定如分析部分中所述的,和信号12’的频域表示可用于处理。这个表示可通过对合成器64产生的时域波形进行分窗和FFT运算来获得。然后,和信号被复制到左、右输出信号通路。随后,左和右信号之间的相关性通过去相关器69’、69”利用参数r进行修改。关于这如何可实现的详细描述,参照标题为“信号合成”、2002年7月12日提交、D.J.Breebaart为第一发明人的欧洲专利申请(我方参考号PHNL020639)。该欧洲专利申请公开了一种从输入信号合成第一和第二输出信号的方法,该方法包括对输入信号滤波以产生滤波信号、得到相关性参数、得到指示第一和第二输出信号之间预期电平差的电平参数、以及通过矩阵运算把输入信号和滤波信号变换为第一和第二输出信号,其中矩阵运算取决于相关性参数和电平参数。随后,在各级70’、70”,给定对应该子带的(量化)ITD,左信号的各子带被延迟-ITD/2,右信号被延迟ITD/2。最后,左和右子带根据该子带的ILD在各级71’、71”中被缩放。然后,各变换级72’、72”通过执行以下步骤把输出信号转换到时域:(1)在负频率上插入复共轭,(2)逆FFT,(3)开窗,以及(4)叠加。
已经就产生作为两个信号的组合的单声道信号(主要在只有单声道信号用于解码器的情况下)描述了解码器和编码器的优选实施例。但应当看到,本发明不限于这些实施例,以及单声道信号可相当于单一输入和/或输出信道,其中空间参数层被应用于这个信道的相应副本以产生附加的信道。
可以看出,本发明可通过专用硬件、运行于DSP(数字信号处理器)或通用计算机上的软件来实现。本发明可包含在携带用于执行根据本发明的编码方法的计算机程序的实际媒体、如CD-ROM或DVD-ROM中。本发明还可作为通过例如因特网等数据网传送的信号、或者作为通过广播服务传送的信号来实施。本发明特别适用于以下领域:因特网下载,因特网无线电台,固态音频(SSA),带宽扩展方案,例如mp3PRO、CT-aacPlus等(参见www.codingtechnologies.com)以及大部分音频编码方案。
Claims (15)
1.一种对音频信号编码的方法,所述方法包括:
产生单声道信号,
分析至少两个音频信道的空间特性以得到连续时隙的一个或多个空间参数集,
响应在给定时间包含瞬态的所述单声道信号,为包含所述瞬态时间的周期确定所述空间参数集的不均匀时间分段,以及
产生包含所述单声道信号和所述一个或多个空间参数集的编码信号。
2.如权利要求1所述的方法,其特征在于,所述单声道信号包括至少两个输入音频信道的组合。
3.如权利要求1所述的方法,其特征在于,采用参数正弦编码器来产生所述单声道信号,所述编码器产生与所述单声道信号的连续时隙对应的帧,至少一部分所述帧包含表示在所述帧表示的相应时隙中出现的瞬态的参数。
4.如权利要求1所述的方法,其特征在于,采用波形编码器产生所述单声道信号,所述编码器为包含所述瞬态时间的周期确定所述单声道信号的不均匀时间分段。
5.如权利要求4所述的方法,其特征在于,所述波形编码器是mp3编码器。
6.如权利要求1所述的方法,其特征在于,所述空间参数集包括至少两个定位线索。
7.如权利要求6所述的方法,其特征在于,所述空间参数集还包括描述无法通过所述定位线索说明的波形的相似性或相异性的参数。
8.如权利要求7所述的方法,其特征在于,所述参数为互相关函数的最大值。
9.一种用于对音频信号编码的编码器,所述编码器包括:
用于产生单声道信号的部件,
用于分析至少两个音频信道的空间特性以得到连续时隙的一个或多个空间参数集的部件,
响应在给定时间包含瞬态的所述单声道信号、用于为包含所述瞬态时间的周期确定所述空间参数集的不均匀时间分段的部件,以及
用于产生包含所述单声道信号和所述一个或多个空间参数集的编码信号的部件。
10.一种用于提供音频信号的设备,所述设备包括:
用于接收音频信号的输入端,
用于对所述音频信号编码以得到编码音频信号的如权利要求9所述的编码器,以及
用于提供所述编码音频信号的输出端。
11.一种编码音频信号,所述信号包括:
单声道信号,包含在给定时间在所述单声道信号中出现的瞬态的至少一个指示;以及
用于所述信号的连续时隙的一个或多个空间参数集,所述空间参数集为包含所述瞬态时间的周期提供音频信号的不均匀时间分段。
12.一种存储媒体,其中已经存储如权利要求11所述的编码信号。
13.一种对编码音频信号解码的方法,所述方法包括:
从所述编码音频信号得到单声道信号,
从所述编码音频信号得到一个或多个空间参数集,以及
响应在给定时间包含瞬态的所述单声道信号,为包含所述瞬态时间的周期确定所述空间参数集的不均匀时间分段,以及
把所述一个或多个空间参数集应用于所述单声道信号以产生多信道输出信号。
14.一种用于对编码音频信号解码的解码器,包括
用于从所述编码音频信号得到单声道信号的部件,
用于从所述编码音频信号得到一个或多个空间参数集的部件,以及
响应在给定时间包含瞬态的所述单声道信号、用于为包含所述瞬态时间的周期确定所述空间参数集的不均匀时间分段的部件,以及
用于把所述一个或多个空间参数集应用于所述单声道信号以产生多信道输出信号的部件。
15.一种用于提供解码音频信号的设备,所述设备包括:
用于接收编码音频信号的输入端,
用于对所述编码音频信号解码以得到多信道输出信号的如权利要求14所述的解码器,
用于提供或再现所述多信道输出信号的输出端。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02077871.8 | 2002-07-16 | ||
EP02077871 | 2002-07-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1669358A true CN1669358A (zh) | 2005-09-14 |
Family
ID=30011205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA03816440XA Pending CN1669358A (zh) | 2002-07-16 | 2003-07-01 | 音频编码 |
Country Status (9)
Country | Link |
---|---|
US (1) | US7542896B2 (zh) |
EP (1) | EP1523863A1 (zh) |
JP (1) | JP2005533271A (zh) |
KR (1) | KR20050021484A (zh) |
CN (1) | CN1669358A (zh) |
AU (1) | AU2003281128A1 (zh) |
BR (1) | BR0305555A (zh) |
RU (1) | RU2325046C2 (zh) |
WO (1) | WO2004008806A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101188878B (zh) * | 2007-12-05 | 2010-06-02 | 武汉大学 | 立体声音频信号的空间参数量化及熵编码方法和所用系统 |
WO2011097916A1 (zh) * | 2010-02-12 | 2011-08-18 | 华为技术有限公司 | 立体声解码方法及装置 |
US8355921B2 (en) | 2008-06-13 | 2013-01-15 | Nokia Corporation | Method, apparatus and computer program product for providing improved audio processing |
CN103366747A (zh) * | 2006-02-03 | 2013-10-23 | 韩国电子通信研究院 | 用于控制音频信号的渲染的设备和方法 |
CN104364844A (zh) * | 2012-06-08 | 2015-02-18 | 英特尔公司 | 针对长延迟回声的回声消除算法 |
CN106782573A (zh) * | 2016-11-30 | 2017-05-31 | 北京酷我科技有限公司 | 一种编码生成aac文件的方法 |
CN107358960A (zh) * | 2016-05-10 | 2017-11-17 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN112424861A (zh) * | 2018-06-22 | 2021-02-26 | 弗劳恩霍夫应用研究促进协会 | 多声道音频编码 |
Families Citing this family (128)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7116787B2 (en) | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7644003B2 (en) | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
US20090299756A1 (en) * | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
KR101079066B1 (ko) | 2004-03-01 | 2011-11-02 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 멀티채널 오디오 코딩 |
US7805313B2 (en) | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
EP1914723B1 (en) * | 2004-05-19 | 2010-07-07 | Panasonic Corporation | Audio signal encoder and audio signal decoder |
EP1749296B1 (en) * | 2004-05-28 | 2010-07-14 | Nokia Corporation | Multichannel audio extension |
CN101015230B (zh) | 2004-09-06 | 2012-09-05 | 皇家飞利浦电子股份有限公司 | 音频信号增强 |
WO2006030754A1 (ja) * | 2004-09-17 | 2006-03-23 | Matsushita Electric Industrial Co., Ltd. | オーディオ符号化装置、復号化装置、方法、及びプログラム |
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
EP1817767B1 (en) | 2004-11-30 | 2015-11-11 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
DE602005017302D1 (de) | 2004-11-30 | 2009-12-03 | Agere Systems Inc | Synchronisierung von parametrischer raumtonkodierung mit extern bereitgestelltem downmix |
US7787631B2 (en) | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
EP1691348A1 (en) | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
US7573912B2 (en) | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
EP1858006B1 (en) * | 2005-03-25 | 2017-01-25 | Panasonic Intellectual Property Corporation of America | Sound encoding device and sound encoding method |
US7961890B2 (en) | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
JP5461835B2 (ja) | 2005-05-26 | 2014-04-02 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の符号化/復号化方法及び符号化/復号化装置 |
US8577686B2 (en) | 2005-05-26 | 2013-11-05 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
AU2006255662B2 (en) * | 2005-06-03 | 2012-08-23 | Dolby Laboratories Licensing Corporation | Apparatus and method for encoding audio signals with decoding instructions |
WO2007004829A2 (en) | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8214221B2 (en) | 2005-06-30 | 2012-07-03 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal and identifying information included in the audio signal |
US8082157B2 (en) | 2005-06-30 | 2011-12-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8626503B2 (en) | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
US20070055510A1 (en) * | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
KR100880645B1 (ko) * | 2005-08-30 | 2009-01-30 | 엘지전자 주식회사 | 오디오 신호의 인코딩 및 디코딩 장치, 및 방법 |
US7788107B2 (en) | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
WO2007027055A1 (en) * | 2005-08-30 | 2007-03-08 | Lg Electronics Inc. | A method for decoding an audio signal |
KR20080049735A (ko) | 2005-08-30 | 2008-06-04 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 장치 |
WO2007055463A1 (en) | 2005-08-30 | 2007-05-18 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8577483B2 (en) | 2005-08-30 | 2013-11-05 | Lg Electronics, Inc. | Method for decoding an audio signal |
RU2473062C2 (ru) * | 2005-08-30 | 2013-01-20 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ кодирования и декодирования аудиосигнала и устройство для его осуществления |
JP2009518659A (ja) * | 2005-09-27 | 2009-05-07 | エルジー エレクトロニクス インコーポレイティド | マルチチャネルオーディオ信号の符号化/復号化方法及び装置 |
US7751485B2 (en) | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
US8068569B2 (en) | 2005-10-05 | 2011-11-29 | Lg Electronics, Inc. | Method and apparatus for signal processing and encoding and decoding |
KR100857120B1 (ko) | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7646319B2 (en) | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7696907B2 (en) | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
WO2007040361A1 (en) | 2005-10-05 | 2007-04-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
KR100813269B1 (ko) | 2005-10-12 | 2008-03-13 | 삼성전자주식회사 | 비트 스트림 처리/전송 방법 및 장치, 비트 스트림수신/처리 방법 및 장치 |
WO2007043811A1 (en) * | 2005-10-12 | 2007-04-19 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding audio data and extension data |
CN101288309B (zh) * | 2005-10-12 | 2011-09-21 | 三星电子株式会社 | 处理/发送以及接收/处理比特流的方法和设备 |
WO2007046660A1 (en) * | 2005-10-20 | 2007-04-26 | Lg Electronics Inc. | Method for encoding and decoding multi-channel audio signal and apparatus thereof |
US7742913B2 (en) | 2005-10-24 | 2010-06-22 | Lg Electronics Inc. | Removing time delays in signal paths |
JP2009514008A (ja) * | 2005-10-26 | 2009-04-02 | エルジー エレクトロニクス インコーポレイティド | マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置 |
WO2007080225A1 (en) * | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
WO2007080211A1 (en) * | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
EP1974347B1 (en) | 2006-01-19 | 2014-08-06 | LG Electronics Inc. | Method and apparatus for processing a media signal |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
KR100921453B1 (ko) | 2006-02-07 | 2009-10-13 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
FR2899423A1 (fr) | 2006-03-28 | 2007-10-05 | France Telecom | Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme. |
DE102006017280A1 (de) | 2006-04-12 | 2007-10-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals |
US20080004883A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Scalable audio coding |
CN101518103B (zh) * | 2006-09-14 | 2016-03-23 | 皇家飞利浦电子股份有限公司 | 多通道信号的甜点操纵 |
RU2407072C1 (ru) * | 2006-09-29 | 2010-12-20 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов |
AU2007300810B2 (en) | 2006-09-29 | 2010-06-17 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
CA2874454C (en) | 2006-10-16 | 2017-05-02 | Dolby International Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
AU2007312597B2 (en) | 2006-10-16 | 2011-04-14 | Dolby International Ab | Apparatus and method for multi -channel parameter transformation |
US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8126721B2 (en) | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
JP5463143B2 (ja) | 2006-12-07 | 2014-04-09 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及びその装置 |
WO2008069594A1 (en) | 2006-12-07 | 2008-06-12 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
WO2008096313A1 (en) * | 2007-02-06 | 2008-08-14 | Koninklijke Philips Electronics N.V. | Low complexity parametric stereo decoder |
CA2645915C (en) | 2007-02-14 | 2012-10-23 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
WO2008132826A1 (ja) * | 2007-04-20 | 2008-11-06 | Panasonic Corporation | ステレオ音声符号化装置およびステレオ音声符号化方法 |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
KR101425355B1 (ko) * | 2007-09-05 | 2014-08-06 | 삼성전자주식회사 | 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법 |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
RU2443075C2 (ru) | 2007-10-09 | 2012-02-20 | Конинклейке Филипс Электроникс Н.В. | Способ и устройство для генерации бинаурального аудиосигнала |
US8352249B2 (en) * | 2007-11-01 | 2013-01-08 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
JP2011504250A (ja) | 2007-11-21 | 2011-02-03 | エルジー エレクトロニクス インコーポレイティド | 信号処理方法及び装置 |
EP2212883B1 (en) | 2007-11-27 | 2012-06-06 | Nokia Corporation | An encoder |
AU2008344073B2 (en) | 2008-01-01 | 2011-08-11 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
EP2225893B1 (en) * | 2008-01-01 | 2012-09-05 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
KR101441897B1 (ko) * | 2008-01-31 | 2014-09-23 | 삼성전자주식회사 | 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치 |
CN102789782B (zh) * | 2008-03-04 | 2015-10-14 | 弗劳恩霍夫应用研究促进协会 | 对输入数据流进行混合以及从中产生输出数据流 |
KR101414412B1 (ko) * | 2008-05-09 | 2014-07-01 | 노키아 코포레이션 | 오디오 신호의 인코딩 장치, 오디오 신호의 디코딩 장치, 오디오 신호의 인코딩 방법, 스케일러블 인코딩 오디오 신호의 디코딩 방법, 인코더, 디코더, 전자기기 및 컴퓨터 판독가능한 기록 매체 |
US8644526B2 (en) | 2008-06-27 | 2014-02-04 | Panasonic Corporation | Audio signal decoding device and balance adjustment method for audio signal decoding device |
EP2346029B1 (en) * | 2008-07-11 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and corresponding computer program |
MX2011000372A (es) | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Sintetizador de señales de audio y codificador de señales de audio. |
EP2144229A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
JP5243527B2 (ja) * | 2008-07-29 | 2013-07-24 | パナソニック株式会社 | 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム |
US20110206223A1 (en) * | 2008-10-03 | 2011-08-25 | Pasi Ojala | Apparatus for Binaural Audio Coding |
US8892450B2 (en) | 2008-10-29 | 2014-11-18 | Dolby International Ab | Signal clipping protection using pre-existing audio gain metadata |
US9384748B2 (en) | 2008-11-26 | 2016-07-05 | Electronics And Telecommunications Research Institute | Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching |
KR101315617B1 (ko) * | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
EP2378515B1 (en) | 2009-01-13 | 2013-09-25 | Panasonic Corporation | Audio signal decoding device and method of balance adjustment |
US8504378B2 (en) | 2009-01-22 | 2013-08-06 | Panasonic Corporation | Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same |
JP5340378B2 (ja) | 2009-02-26 | 2013-11-13 | パナソニック株式会社 | チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法 |
EP2439736A1 (en) | 2009-06-02 | 2012-04-11 | Panasonic Corporation | Down-mixing device, encoder, and method therefor |
US20100324915A1 (en) * | 2009-06-23 | 2010-12-23 | Electronic And Telecommunications Research Institute | Encoding and decoding apparatuses for high quality multi-channel audio codec |
KR20110018107A (ko) * | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치 |
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
WO2011046329A2 (ko) * | 2009-10-14 | 2011-04-21 | 한국전자통신연구원 | 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법 |
KR101137652B1 (ko) * | 2009-10-14 | 2012-04-23 | 광운대학교 산학협력단 | 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법 |
CN102157152B (zh) | 2010-02-12 | 2014-04-30 | 华为技术有限公司 | 立体声编码的方法、装置 |
EP2375410B1 (en) * | 2010-03-29 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal |
JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
EP2609592B1 (en) | 2010-08-24 | 2014-11-05 | Dolby International AB | Concealment of intermittent mono reception of fm stereo radio receivers |
CN103180899B (zh) | 2010-11-17 | 2015-07-22 | 松下电器(美国)知识产权公司 | 立体声信号的编码装置、解码装置、编码方法及解码方法 |
EP2477188A1 (en) | 2011-01-18 | 2012-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of slot positions of events in an audio signal frame |
CA2848275C (en) | 2012-01-20 | 2016-03-08 | Sascha Disch | Apparatus and method for audio encoding and decoding employing sinusoidal substitution |
ES2560402T3 (es) * | 2012-04-05 | 2016-02-18 | Huawei Technologies Co., Ltd | Método para la codificación y la decodificación de audio espacial paramétrica, codificador de audio espacial paramétrico y decodificador de audio espacial paramétrico |
FR2990551A1 (fr) * | 2012-05-31 | 2013-11-15 | France Telecom | Codage/decodage parametrique d'un signal audio multi-canal, en presence de sons transitoires |
US10219093B2 (en) * | 2013-03-14 | 2019-02-26 | Michael Luna | Mono-spatial audio processing to provide spatial messaging |
CN104050969A (zh) | 2013-03-14 | 2014-09-17 | 杜比实验室特许公司 | 空间舒适噪声 |
FR3008533A1 (fr) * | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
CN103413553B (zh) * | 2013-08-20 | 2016-03-09 | 腾讯科技(深圳)有限公司 | 音频编码方法、音频解码方法、编码端、解码端和系统 |
EP2963649A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
EP3107096A1 (en) | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
GB2559199A (en) * | 2017-01-31 | 2018-08-01 | Nokia Technologies Oy | Stereo audio signal encoder |
GB2559200A (en) | 2017-01-31 | 2018-08-01 | Nokia Technologies Oy | Stereo audio signal encoder |
CN109427337B (zh) | 2017-08-23 | 2021-03-30 | 华为技术有限公司 | 立体声信号编码时重建信号的方法和装置 |
US11451919B2 (en) * | 2021-02-19 | 2022-09-20 | Boomcloud 360, Inc. | All-pass network system for colorless decorrelation with constraints |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5388181A (en) * | 1990-05-29 | 1995-02-07 | Anderson; David J. | Digital audio compression system |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
US5278909A (en) * | 1992-06-08 | 1994-01-11 | International Business Machines Corporation | System and method for stereo digital audio compression with co-channel steering |
JP3343962B2 (ja) * | 1992-11-11 | 2002-11-11 | ソニー株式会社 | 高能率符号化方法及び装置 |
US5451954A (en) * | 1993-08-04 | 1995-09-19 | Dolby Laboratories Licensing Corporation | Quantization noise suppression for encoder/decoder system |
DE69431622T2 (de) * | 1993-12-23 | 2003-06-26 | Koninkl Philips Electronics Nv | Verfahren und gerät zum kodieren von mit mehreren bits kodiertem digitalem ton durch subtraktion eines adaptiven zittersignals, einfügen von versteckten kanalbits und filtrierung, sowie kodiergerät zur verwendung bei diesem verfahren |
US5781130A (en) * | 1995-05-12 | 1998-07-14 | Optex Corporation | M-ary (d,k) runlength limited coding for multi-level data |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5848391A (en) * | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
US6049766A (en) * | 1996-11-07 | 2000-04-11 | Creative Technology Ltd. | Time-domain time/pitch scaling of speech or audio signals with transient handling |
US6931291B1 (en) * | 1997-05-08 | 2005-08-16 | Stmicroelectronics Asia Pacific Pte Ltd. | Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions |
US6173061B1 (en) * | 1997-06-23 | 2001-01-09 | Harman International Industries, Inc. | Steering of monaural sources of sound using head related transfer functions |
US5890125A (en) | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
DE19736669C1 (de) * | 1997-08-22 | 1998-10-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals |
US6430529B1 (en) * | 1999-02-26 | 2002-08-06 | Sony Corporation | System and method for efficient time-domain aliasing cancellation |
US6539357B1 (en) | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
US6691082B1 (en) * | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
ATE369600T1 (de) * | 2000-03-15 | 2007-08-15 | Koninkl Philips Electronics Nv | Laguerre funktion für audiokodierung |
US7212872B1 (en) * | 2000-05-10 | 2007-05-01 | Dts, Inc. | Discrete multichannel audio with a backward compatible mix |
TR200200103T1 (tr) | 2000-05-17 | 2002-06-21 | Koninklijke Philips Electronics N. V. | Spektrum modelleme |
US6778953B1 (en) * | 2000-06-02 | 2004-08-17 | Agere Systems Inc. | Method and apparatus for representing masked thresholds in a perceptual audio coder |
CN1408146A (zh) * | 2000-11-03 | 2003-04-02 | 皇家菲利浦电子有限公司 | 音频信号的参数编码 |
US6636830B1 (en) * | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
JP2002196792A (ja) * | 2000-12-25 | 2002-07-12 | Matsushita Electric Ind Co Ltd | 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム |
US7069208B2 (en) * | 2001-01-24 | 2006-06-27 | Nokia, Corp. | System and method for concealment of data loss in digital audio transmission |
BR0204835A (pt) * | 2001-04-18 | 2003-06-10 | Koninkl Philips Electronics Nv | Métodos para codificar um sinal de áudio, e para decodificar um fluxo de áudio, codificador de áudio, reprodutor de áudio, sistema de áudio, fluxo de áudio, e, meio de armazenamento |
JP2004519741A (ja) * | 2001-04-18 | 2004-07-02 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声の符号化 |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
JP4359499B2 (ja) * | 2001-06-08 | 2009-11-04 | アイピージー エレクトロニクス 503 リミテッド | オーディオ信号の編集 |
US7460993B2 (en) * | 2001-12-14 | 2008-12-02 | Microsoft Corporation | Adaptive window-size selection in transform coding |
ES2273216T3 (es) * | 2003-02-11 | 2007-05-01 | Koninklijke Philips Electronics N.V. | Codificacion de audio. |
-
2003
- 2003-07-01 KR KR10-2005-7000761A patent/KR20050021484A/ko not_active Application Discontinuation
- 2003-07-01 RU RU2005104123/09A patent/RU2325046C2/ru not_active IP Right Cessation
- 2003-07-01 CN CNA03816440XA patent/CN1669358A/zh active Pending
- 2003-07-01 JP JP2004520996A patent/JP2005533271A/ja not_active Withdrawn
- 2003-07-01 US US10/520,872 patent/US7542896B2/en not_active Expired - Fee Related
- 2003-07-01 BR BR0305555-8A patent/BR0305555A/pt not_active IP Right Cessation
- 2003-07-01 WO PCT/IB2003/003041 patent/WO2004008806A1/en active Application Filing
- 2003-07-01 AU AU2003281128A patent/AU2003281128A1/en not_active Abandoned
- 2003-07-01 EP EP03740950A patent/EP1523863A1/en not_active Withdrawn
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103366747B (zh) * | 2006-02-03 | 2017-05-17 | 韩国电子通信研究院 | 用于控制音频信号的渲染的设备和方法 |
CN103366747A (zh) * | 2006-02-03 | 2013-10-23 | 韩国电子通信研究院 | 用于控制音频信号的渲染的设备和方法 |
US10277999B2 (en) | 2006-02-03 | 2019-04-30 | Electronics And Telecommunications Research Institute | Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue |
US9426596B2 (en) | 2006-02-03 | 2016-08-23 | Electronics And Telecommunications Research Institute | Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue |
CN101188878B (zh) * | 2007-12-05 | 2010-06-02 | 武汉大学 | 立体声音频信号的空间参数量化及熵编码方法和所用系统 |
US8355921B2 (en) | 2008-06-13 | 2013-01-15 | Nokia Corporation | Method, apparatus and computer program product for providing improved audio processing |
CN102089809B (zh) * | 2008-06-13 | 2013-06-05 | 诺基亚公司 | 用于提供改进的音频处理的方法、装置 |
WO2011097916A1 (zh) * | 2010-02-12 | 2011-08-18 | 华为技术有限公司 | 立体声解码方法及装置 |
CN102157150B (zh) * | 2010-02-12 | 2012-08-08 | 华为技术有限公司 | 立体声解码方法及装置 |
US9443524B2 (en) | 2010-02-12 | 2016-09-13 | Huawei Technologies Co., Ltd. | Stereo decoding method and apparatus |
US9584944B2 (en) | 2010-02-12 | 2017-02-28 | Huawei Technologies Co., Ltd. | Stereo decoding method and apparatus using group delay and group phase parameters |
CN104364844B (zh) * | 2012-06-08 | 2018-12-04 | 英特尔公司 | 针对长延迟回声的回声消除算法 |
CN104364844A (zh) * | 2012-06-08 | 2015-02-18 | 英特尔公司 | 针对长延迟回声的回声消除算法 |
CN107358960A (zh) * | 2016-05-10 | 2017-11-17 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN107358960B (zh) * | 2016-05-10 | 2021-10-26 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN106782573A (zh) * | 2016-11-30 | 2017-05-31 | 北京酷我科技有限公司 | 一种编码生成aac文件的方法 |
CN106782573B (zh) * | 2016-11-30 | 2020-04-24 | 北京酷我科技有限公司 | 一种编码生成aac文件的方法 |
CN112424861A (zh) * | 2018-06-22 | 2021-02-26 | 弗劳恩霍夫应用研究促进协会 | 多声道音频编码 |
US11978459B2 (en) | 2018-06-22 | 2024-05-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
CN112424861B (zh) * | 2018-06-22 | 2024-04-16 | 弗劳恩霍夫应用研究促进协会 | 多声道音频编码 |
Also Published As
Publication number | Publication date |
---|---|
RU2325046C2 (ru) | 2008-05-20 |
BR0305555A (pt) | 2004-09-28 |
EP1523863A1 (en) | 2005-04-20 |
US7542896B2 (en) | 2009-06-02 |
WO2004008806A1 (en) | 2004-01-22 |
RU2005104123A (ru) | 2005-07-10 |
US20050177360A1 (en) | 2005-08-11 |
KR20050021484A (ko) | 2005-03-07 |
JP2005533271A (ja) | 2005-11-04 |
AU2003281128A1 (en) | 2004-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1669358A (zh) | 音频编码 | |
JP5498525B2 (ja) | 空間的オーディオのパラメータ表示 | |
CN1748247B (zh) | 音频编码 | |
EP2278582B1 (en) | A method and an apparatus for processing an audio signal | |
CA2645912C (en) | Methods and apparatuses for encoding and decoding object-based audio signals | |
US9992599B2 (en) | Method, device, encoder apparatus, decoder apparatus and audio system | |
RU2406166C2 (ru) | Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов | |
CN101542597B (zh) | 用于编码和解码基于对象的音频信号的方法和装置 | |
CN102165520B (zh) | 处理信号的方法和装置 | |
CN102547549A (zh) | 编码解码2或3维声场环绕声表示的连续帧的方法和装置 | |
CN101149925A (zh) | 一种用于参数立体声编码的空间参数选取方法 | |
CN101162904A (zh) | 一种空间参数立体声编解码方法及其装置 | |
Cheng et al. | A spatial squeezing approach to ambisonic audio compression | |
Kim et al. | Improved channel level difference quantization for spatial audio coding | |
Li et al. | The perceptual lossless quantization of spatial parameter for 3D audio signals | |
Yang | High fidelity multichannel audio compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20050914 |