CN101124727B - 编码器、解码器以及用于编码/解码的方法 - Google Patents
编码器、解码器以及用于编码/解码的方法 Download PDFInfo
- Publication number
- CN101124727B CN101124727B CN2006800031658A CN200680003165A CN101124727B CN 101124727 B CN101124727 B CN 101124727B CN 2006800031658 A CN2006800031658 A CN 2006800031658A CN 200680003165 A CN200680003165 A CN 200680003165A CN 101124727 B CN101124727 B CN 101124727B
- Authority
- CN
- China
- Prior art keywords
- passage
- signal
- channel
- residual signal
- forecast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 18
- 230000005236 sound signal Effects 0.000 claims description 39
- 238000001914 filtration Methods 0.000 claims description 13
- 230000003044 adaptive effect Effects 0.000 claims description 8
- 238000011002 quantification Methods 0.000 claims description 4
- 239000002243 precursor Substances 0.000 description 59
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Error Detection And Correction (AREA)
Abstract
描述了一种用于编码代表第一通道的第一数字信号和代表第二通道的第二数字信号的编码器。编码器包括用于基于通道内相关性压缩第一数字信号和第二数字信号的级联通道内预报元件;和用于基于通道间的相关性压缩第一数字信号和第二数字信号的通道间预报元件。
Description
技术领域
本发明涉及一种编码器、一种解码器、一种用于编码的方法、一种用于解码的方法、计算机可读介质和计算机程序元件。
背景技术
无损的音频编码器是一种音频编码器,其从原始的音频信号产生编码的音频信号以使得相应的音频解码器能够从该编码的音频信号产生原始音频信号的精确拷贝。
在MPEG-4标准化形成过程中,产生了针对音频无损编码(ALS)的标准。无损音频编码器典型地包括两部分:线性预报器,其通过减小包含于原始音频信号中的音频采样的相关性来从原始音频信号产生残留信号;和熵编码器,其编码残留信号以形成编码的音频信号。在产生残留信号的过程中,预报器将相关性减小得越多,就可以得到对原始音频信号的压缩越多,即所编码的音频信号相对于原始音频信号的压缩比越高。
如果原始音频信号是立体声的信号,即包括针对第一通道和第二通道的音频采样,那么具有通道内的相关性,即相同通道的音频采样之间的相关性,以及通道间的相关性,即不同通道的音频采样之间的相关性。
在[1]和[2]中,公开了使用级联预报器减小通道内的相关性。在[3]中,通过颠倒相关性矩阵来计算最佳的维纳滤波器权数来考虑减小通道间和通道内的相关性的问题。
发明内容
本发明的目的是为了提供一种用于编码包括针对多于一个通道的音频采样的数字音频信号的改进方法。
该目的通过根据独立权利要求所述的编码器、解码器、用于编码的方法、用于解码的方法、计算机可编程介质以及带有这些特征的计算机程序元件来实现。
提供了用于编码代表第一通道的第一数字信号和代表第二通道的第二数字信号的编码器,编码器包括处理第一数字信号,从而提供针对第一通道的第一残留信号的第一通道内的预报元件;以及处理第二数字信号,从而提供针对第二通道的第一残留信号的第二通道内的预报元件。编码器进一步包括通过线性地组合针对第一通道的第一残留信号和针对第二通道的第一残留信号,处理针对第一通道的第一残留信号和针对第二通道的第一残留信号,从而提供针对第一通道的第二残留信号和针对第二通道的第二残留信号的通道间预报元件。
此外,提供了与上面所描述的编码器相应的编码方法、解码器、用于解码的方法、计算机可编程介质和计算机程序元件。
作为例证地,第一数字信号和第二数字信号通过包括通道内预报器元件和通道间预报器元件的预报器级联被处理。通道内预报器元件基于通道内的相关性,即仅使用来自各自的数字信号的信息,分别计算针对第一数字信号和第二数字信号的预报。通道间的预报器元件基于通道间的相关性,即使用来自第一数字信号和第二数字信号这两者的信息,计算针对第一数字信号和第二数字信号的预报。
这样,可以达到第一数字信号和第二数字信号的高压缩。
本发明优选的实施例出现在从属权利要求。在编码器环境下描述的实施例对于编码、解码器、用于解码的方法、计算机可编程介质和计算机程序元件也类似地有效。
优选地,编码器进一步包括第三通道内的预报元件,其通过从针对第一通道的第二残留信号中减去针对所述第一通道的第二残留信号的预报信号来处理针对第一通道的第二残留信号,从而提供针对第一通道的第三残留信号;和第四通道内的预报元件,其通过从针对第二通道的第二残留信号中减去针对第二通道的第二残留信号的预报信号来处理针对第二通道的第二残留信号,从而提供针对第二通道的第三残留信号。
进一步优选地,第一通道内的预报元件进一步提供针对第一通道的第一预报信号,第二通道内的预报元件进一步提供针对第二通道的第一预报信号,通道间的预报元件进一步提供针对第一通道的第二预报信号和针对第二通道的第二预报信号,第三通道内的预报元件进一步提供针对第一通道的第三预报信号,以及第四通道内的预报元件进一步提供针对第二通道的第三预报信号。
进一步优选地,编码器进一步包括通道内预报元件的第一级联,其中通道内预报元件的第一级联的第一通道内预报元件通过对针对第一通道的第三残留信号的信号值进行滤波来提供针对第一通道的进一步的预报信号,并通过从针对第一通道的第三残留信号中减去针对第一通道的进一步的预报信号来提供针对第一通道的进一步的残留信号,通道内预报元件的第一级联的每个其他通道内预报元件通过对由通道内预报元件的第一级联的在先通道内预报元件所提供的针对第一通道的进一步的残留信号的信号值进行滤波,来提供针对第一通道的更进一步的预报信号,并且通过从由通道内预报元件的第一级联的在先通道内预报元件所提供的进一步的残留信号中减去针对第一通道的更进一步的预报信号,来提供针对第一通道的更进一步的残留信号。
进一步优选地,编码器进一步包括通道内预报元件的第二级联,其中通道内预报元件的第二级联的第一通道内预报元件通过对针对第二通道的第三残留信号的信号值进行滤波来提供针对第二通道的进一步的预报信号,并通过从针对第二通道的第三残留信号中减去针对第二通道的进一步的预报信号来提供针对第二通道的进一步的残留信号,并且通道内预报元件的第二级联的每个其他通道内预报元件通过对由通道内预报元件的第二级联的在先通道内预报元件所提供的针对第二通道的进一步的残留信号的信号值进行滤波,来提供针对第二通道的更进一步的预报信号,并且通过从由通道内预报元件的第二级联的在先通道内预报元件所提供的进一步的残留信号中减去针对第二通道的更进一步的预报信号,来提供针对第二通道的更进一步的残留信号。
进一步优选地,编码器进一步包括第一线性组合器,第一线性组合器将针对第一通道的第一残留信号、针对第一通道的第二残留信号、针对第一通道的第三残留信号、针对第一通道的进一步的残留信号以及针对第一通道的更进一步的残留信号中的至少两个乘以第一线性组合器权数,并且将结果相加以形成针对第一通道的最终预报信号。
进一步优选地,编码器进一步包括第二线性组合器,第二线性组合器将针对第二通道的第一残留信号、针对第二通道的第二残留信号、针对第二通道的第三残留信号、针对第二通道的进一步的残留信号以及针对第二通道的更进一步的残留信号中的至少两个乘以第二线性组合器权数,并且将结果相加以形成针对第二通道的最终预报信号。
进一步优选地,编码器中,第三通道内预报元件和/或第四通道内预报元件和/或通道内预报元件的第一级联的通道内预报元件包括自适应的FIR滤波器单元。
进一步优选地,编码器中,第三通道内预报元件和/或第四通道内预报元件和/或通道内预报元件的第二级联的通道内预报元件包括自适应的FIR滤波器单元。
进一步优选地,编码器进一步包括通道内预报元件的第一级联,其中通道内预报元件的第一级联的第一通道内预报元件通过处理针对第一通道的第三残留信号来提供针对第一通道的进一步的残留信号和针对第一通道的进一步的预报信号,以及通道内预报元件的第一级联的每个其他通道内预报元件通过处理由通道内预报元件的第一级联的在先通道内预报元件所提供的针对第一通道的进一步的残留信号来提供针对第一通道的进一步的残留信号和针对第一通道的进一步的预报信号。
类似地,优选地,编码器进一步包括通道内预报元件的第二级联,其中通道内预报元件的第二级联的第一通道内预报元件通过处理针对第二通道的第三残留信号来提供针对第二通道的进一步的残留信号和针对第二通道的进一步的预报信号,以及通道内预报元件的第二级联的每个其他通道内预报元件通过处理由通道内预报元件的第二级联的在先通道内预报元件所提供的针对第二通道的进一步的残留信号来提供针对第二通道的进一步的残留信号和针对第二通道的进一步的预报信号。
作为例证地,针对第一通道的第三残留信号和针对第二通道的第三残留信号通过进一步的通道内预报元件而被处理,以使得通过使用通道内的相关性来达到更高的压缩。
进一步优选地,编码器进一步包括第一线性组合器,其线性地组合针对第一通道的第一残留信号、针对第一通道的第二残留信号、针对第一通道的第三残留信号和针对第一通道的进一步的残留信号中的至少两个,从而提供针对第一通道的最终预报信号。
优选地,编码器还包括第一减法单元,其从第一数字信号减去针对第一通道的量化的最终预报信号。
进一步优选地,第一线性组合器将所述针对第一通道的第一残留信号、针对第一通道的第二残留信号、针对第一通道的第三残留信号和针对第一通道的进一步的残留信号中的至少两个乘以第一线性组合器权数,并将结果相加以形成针对第一通道的最终预报信号。
类似地,进一步优选地,编码器进一步包括第二线性组合器,其线性地组合针对第二通道的第一残留信号、针对第二通道的第二残留信号、针对第二通道的第三残留信号和针对第二通道的进一步的残留信号中的至少两个,从而提供针对第二通道的最终预报信号。
优选地,编码器进一步包括第二减法单元,其从第二数字信号减去针对第二通道的量化的最终预报信号。
进一步优选地,第二线性组合器将所述针对第二通道的第一残留信号、针对第二通道的第二残留信号、针对第二通道的第三残留信号和针对第二通道的进一步的残留信号中的至少两个乘以第二线性组合器权数,并将结果相加以形成针对第二通道的最终预报信号。
作为例证地,来自通道内预报和通道间预报的结果通过第一线性组合器和第二线性组合器以有效的方式被组合。
优选地,第一线性组合器和/或第二线性组合器设置为使得在编码过程期间,根据Sign-Sign LMS算法,分别调整第一线性组合器权数和第二线性组合器权数。
优选地,第一通道内预报元件和/或第二通道内预报元件包括FIR滤波器单元,例如DPCM(差分脉冲编码调制)滤波器单元。
优选地,通道间预报元件包括多个自适应FIR滤波器单元,例如RLS(递归最小平方)滤波器单元。
作为例证地,使用多个自适应FIR滤波器,例如RLS滤波器来执行针对第一通道的第一残留信号和针对第二通道的第一残留信号的线性组合步骤。RLS滤波器是自适应横向滤波器。RLS算法因其快速收敛而闻名。
进一步优选地,第三通道内预报元件和/或第四通道内预报元件和/或通道内预报元件的第一级联的通道内预报元件和/或通道内预报元件的第二级联的通道内预报元件包括自适应FIR滤波器单元,例如NLMS(归一化最小均方)滤波器单元。
优选地,第一数字信号和第二数字信号是数字化的音频信号。
作为例证地,第一数字信号和第二数字信号一起形成立体声音频信号。
在一个实施例内,编码器适合来进一步编码代表第三或者更多通道的第三或更多的数字信号。
作为例证地,编码器可以进一步包括类似于以上描述的单元以使得另外的数字信号能够类似于第一数字信号和第二数字信号而被编码,特别地,以使得多个通道间的通道间相关性能够被利用来达到压缩。
附图说明
下面参考附图说明本发明作为例证的实施例。
图1示出了根据本发明实施例的编码器。
图2示出了根据本发明实施例的预报器。
图3示出了根据本发明实施例的预报器级。
图4示出了根据本发明实施例的联合立体声预报器。
具体实施方式
图1示出了根据本发明实施例的编码器100。
编码器100接收原始音频信号101作为输入。
原始音频信号101是数字音频信号,并且例如是通过以某采样率(例如48kHz,96kHz或192kHz)来采样模拟音频信号而产生的,其中每个样品具有某分辨率(例如8比特,16比特,20比特或24比特)。
音频信号包括音频信息,即针对第一音频通道(在下面被指示为“左通道”)和针对第二音频通道(在下面被指示为“右通道”)的音频采样。
编码器100的目的是编码原始音频信号101以产生无损地编码的编码音频信号102,即对应于编码器100的解码器可以根据编码音频信号102重构原始音频信号101的准确拷贝。
原始音频信号101通过预报器103处理,所述预报器103由原始音频信号101产生残留信号104。预报器103的功能性将在下面详细说明。
残留信号104然后通过熵编码器105被熵编码。熵编码器105能够例如执行Rice编码或BGMC(块式Gilbert-Moore编码)编码。
所编码的残留信号、描述由熵编码器105执行的残留信号104的编码的编码指数、和任选地其他信息通过多路复用器106被多路复用,以使得编码音频信号102被形成。编码音频信号102持有无损地编码的原始音频信号101和把它解码的信息。
下面,参考图2、图3和图4说明预报器103的功能性。
图2示出了根据本发明实施例的预报器200。
如上所述,假设原始音频信号101包括针对第一(左)通道和第二(右)通道的音频采样。针对左通道的音频采样用xL(i)表示,并且针对右通道的音频采样用xR(i)表示(其中i是在所有音频采样上应用的指数)。针对左通道的音频采样xL(i)对应于带有相同指数的针对右通道的音频采样xR(i)(意思是它是应该在同一时间被播放的音频信号)。假设在原始音频信号101中,xL(i)先于xR(i)。因此原始音频信号101可以被写作音频采样流...,xL(i-1),xR(i-1),xL(i),xR(i),xL(i+1),xR(i+1),...
针对左通道的音频采样被随后输入到第一DPCM预报器201。由预报器200对于针对左通道的音频信号的处理作为针对左通道的第n个音频采样xL(n)的例子而被说明。
类似地,针对右通道的音频采样随后被输入到第二DPCM预报器202。作为例子,针对右通道的第n个音频采样xR(n)被考虑。
第一DPCM预报器201和第二DPCM预报器202被形成为如图3所示。
图3示出了根据本发明实施例的预报器级300。
信号值的序列输入到预报器级300。作为例子,第n个信号值x(n)被考虑。第n个信号值x(n)被输入到延迟单元301。延迟单元301输出在第n个信号值x(n)之前的信号值。例如,当预报器级300是阶次k时,延迟单元301输出信号值x(n-k),...,x(n-1)。
在第n个信号值x(n)之前的信号值被输入到FIR滤波器单元302。FIR滤波器单元302实现FIR(有限输入响应)滤波器。在第一DPCM预报器201和第二DPCM预报器202的情况下,FIR滤波器单元302实现DPCM滤波器。从先于第n个信号值x(n)的信号值,FIR滤波器单元302计算针对第n个信号值x(n)的预报,其由y(n)表示。
预报信号值y(n)通过减法单元303被从第n个信号值x(n)中减去。减法单元303的输出被称为第n个残留值e(n),其和预报信号值y(n)一起是预报器级300的输出。
所预报的信号值y(n)是通过线性地组合过去的信号值所产生的第n个信号值x(n)的近似值,即通过组合先于第n个信号值x(n)的信号值。
在第一DPCM预报器201的情况下,输入到预报器级300的第n个信号值x(n)是针对左通道的第n个音频采样xL(n),输出残留值e(n)用eL,1(n)表示,预报信号值y(n)用yL,1(n)表示(见图2)。eL,1(n)被输入到联合立体声预报器203。
类似地,第二DPCM预报器202根据针对右通道的第n个信号值xR(n)和针对右通道的预报信号值yR,1(n)产生残留值eR,1(n)。eR,1(n)也被输入到联合立体声预报器203。
下面参考图4说明联合立体声预报器203的功能性。
图4示出了根据本发明实施例的联合立体声预报器400。
联合立体声预报器400接收针对左通道的信号值xL(n)和针对右通道的信号值xR(n)作为输入,其中针对左通道的信号值xL(n)是来自图2的残留值eL,1(n)(并且不与来自图2的针对左通道的第n个音频采样xL(n)混合),而针对右通道的信号值xR(n)是来自图2的残留值eR,1(n)(并且不与来自图2的针对右通道的第n个音频采样xR(n)混合)。
针对左通道的信号值xL(n)被输入到第一延迟单元401。针对右通道的信号值xR(n)被输入到第二延迟单元402并且输入到第三延迟单元403。如上所述,当信号值输入时,延迟单元401、402、403输出先于输入信号值的信号值。
因此,第一延迟单元401输出先于信号值xL(n)的信号值,并且这些信号值被输入到第一FIR滤波器单元404。
针对左通道,先于信号值的信号值的数目依赖于通过第一FIR滤波器单元404实现的FIR滤波器的阶次。例如,通过第一FIR滤波器单元404所实现的FIR滤波器具有阶次k。因此,当针对左通道的信号值xL(n)(其如上所述对应于图2中的eL,1(n))被输入到第一延迟单元401时,先于针对左通道的信号值xL(n)的信号值xL(n-k),...,xL(n-1)被输入到第一FIR滤波器级404。(作为例证地,延迟单元存储输入信号值并且稍候输出它。)信号值xL(n-k),...,xL(n-1)对应于残留值eL,1(n-k),...,eL,1(n-k)。
类似地,第二延迟单元402输出先于针对右通道的信号值xR(n)的信号值,其输入到第二FIR滤波器单元405,并且第三延迟单元403输出先于针对右通道的信号值xR(n)的信号值,其输入到第四FIR滤波器单元(数目如上所述依赖于所实现的FIR滤波器的阶次)。针对左通道的信号值xL(n)被直接地,即无延迟地输入到第三FIR滤波器单元406。
第一FIR滤波器单元404和第二FIR滤波器单元405的输出通过第一加法单元408被相加,其产生针对左通道的预报yL(n)作为结果。
第三FIR滤波器单元406的输出和第四FIR滤波器单元407的输出通过第二加法单元409被相加,其产生针对右通道的预报yR(n)作为结果。
针对左通道的预报yL(n)通过第一减法单元410从针对左通道的信号值yL(n)被减去。第一减法单元410的输出是针对左通道eL(n)的残留值。
针对右通道的预报yR(n)通过第二减法单元411从针对右通道的信号值xR(n)被减去。第二减法单元411的输出是针对右通道的残留值eR(n)。
作为例证地,对于针对左通道的信号值xL(n),针对左通道的预报yL(n)通过线性地组合针对左通道和右通道的过去的信号值被产生。对于针对右通道的信号值xR(n),预报yR(n)通过线性地组合来自左通道和右通道的过去信号值以及来自针对左通道的当前信号值xL(n)来被产生。
第一滤波器单元404、第二滤波器单元405、第三滤波器单元406和第四滤波器单元407是自适应滤波器,滤波器的权数是根据RLS算法(其他算法的使用,例如,LMS算法也是可能的)来被自适应地调整。在另一实施例中,第一滤波器单元404、第二滤波器单元405、第三滤波器单元406和第四滤波器单元407具有确定的,例如预先计算的滤波器权数。
联合立体声预报器400的输出是针对左通道的残留值eL(n),在图2中用eL,2(n)表示,针对右通道的残留值eR(n),在图2中用eR,2(n)表示,针对左通道的预报yL(n),在图2中用yL,2(n)表示,针对右通道的预报yR(n),在图2中用yR,2(n)表示。
eL,2(n)通过包括用i=3,...,k编号的K-2个NLMS预报器的第一多个NLMS预报器204(给定值i=1对应于第一DPCM预报器201并且给定值i=2对应于联合立体声预报器203,见图2)被处理。
第一多个NLMS预报器204的每个NLMS预报器被如图3所示进行调整。其中FIR滤波器单元302在这种情况下根据NLMS(归一化最小均方)算法实现FIR滤波器。多个NLMS预报器204的每个NLMS预报器输出预报值,其针对第一多个NLMS预报器204中带有指数i的NLMS预报器用yL,i(n)表示;以及残留值,其针对多个NLMS预报器204中带有指数i的NLMS预报器用eL,i(n)表示。
类似地,eR,2(n)通过第二多个NLMS预报器205被处理,多个NLMS预报器205的每个NLMS预报器输出残留值(类似于上面用eR,i(n),i=3,...,K表示的)和预报值(类似于上面用yR,i(n),i=3,...,K表示的)。
所有的预报值yL,i(n)(i=1,...,K)通过第一线性组合器206被处理。第一线性组合器206用权数cL,i乘以每个预报值yL,i(n)。在编码过程期间,第一线性组合器206的权数cL,i(i=1,...,K)根据Sign-Sign LMS算法被自适应地调整。
Sign-Sign LMS因为它的简单被用来调整线性组合器权数cL,i(i=1,...,K)。在实践中,它表现出很好的性能。然而,其他类型的自适应算法也可以被使用。同样,一些线性组合器权数cL,i(i=1,...,K)可被设置为常数。在实验中发现,设定头两个线性组合器权数为1.0会得到最好的总结果。
由第一线性组合器206所执行的所有这些乘法的结果通过第一线性组合器206相加以形成预报值yL(n),该预报值y1(n)通过第一量化器207被量化并且从针对左通道的音频采样xL(n)被减去以产生针对左通道的残留值
第一量化器207和第二量化器209执行量化以得到整数值。针对左通道的残留值和针对右通道的残留值是整数。
当编码音频信号102如参考图1所说明的那样已经被产生时,可以将编码音频信号102传输到对应于编码器100的解码器,以解码该编码音频信号102和无损重构原始音频信号101。解码器类似于编码器100被形成。特别地,解码器包括类似于预报器200的预报器。主要差异是,因为解码器的预报器接收残留值作为输入,所以相应的预报值由已经重构的原始音频信号101的信号值来计算,并且被加到残留值以形成对应于残留值的重构信号值。
在一个实施例中,使用浮点C,根据图2所示的联合立体声预报被集成到MPEG-4ALS RM8(仅音频无损编码参考模块8)音频编码器中。在这个实施例中,无损压缩比相对于普通的MPEG-4ALS RM8可以被提高到1.56%,其是一个重要的改善。另外,在这个实施例中,关于OFR(最佳FROG)音频编码器可以实现0.1%的提高。
为了容易说明,以上所述的实施例涉及两通道的情况。本专利所介绍的技术可以直接被扩展到多通道的情况。在带有N个通道(以及相应的数字信号)的多通道情况下,针对通道(即代表通道的数字信号)的通道间预报是通道间预报(由其他N-1通道产生)和通道内预报(由该通道产生)的总和。
在该文件中,引用了下列出版物:
[1]Rongshan Yu,Chi Chung Ko“Lossless Compression of DigitalAudio Using Cascaded RLS-LMS Prediction”,IEEE TRANSACTIONS ONSPEECH AND AUDIO PROCESSING,VOL.11,No.6,pp.532-537 November2003
[2]Gerald D.T.Schuller,et al.“Perceptual Audio CodingUsing Adaptive Pre-and Post-Filters and Lossless Compression”,IEEE TRANSACTION ON SPEECH AND AUDIO PROCESSING,VOL.10,NO.6,pp.379-390,September 2002
[3]Florin Ghido“An Asymptotically Optimal Predictor forStereo Lossless Audio Compression”,PROCEEDINGS OF THE DATACOMPRESSION CONFERENCE,2003
参考标号
101原始的音频信号
102编码音频信号
103预报器
104残留信号
105熵编码器
106多路复用器
200预报器
201,202DPCM预报器
203联合立体声预报器
204,205NLMS预报器
206线性组合器
207量化器
208线性组合器
209量化器
300预报级
301延迟单元
302FIR滤波器单元
303减法单元
400联合立体声预报器
401-403延迟单元
404-407FIR滤波器单元
408,409加法单元
410,411减法单元
Claims (20)
1.一种用于编码代表第一通道的第一数字信号和代表第二通道的第二数字信号的编码器,所述编码器包括:
第一通道内预报元件,其处理所述第一数字信号,从而提供针对所述第一通道的第一残留信号;
第二通道内预报元件,其处理所述第二数字信号,从而提供针对所述第二通道的第一残留信号;
通道间预报元件,其通过线性地组合针对所述第一通道的第一残留信号和针对所述第二通道的第一残留信号来处理针对所述第一通道的第一残留信号和针对所述第二通道的第一残留信号,从而提供针对所述第一通道的第二残留信号和针对所述第二通道的第二残留信号。
2.根据权利要求1所述的编码器,进一步包括:
第三通道内预报元件,其通过从针对所述第一通道的第二残留信号中减去针对所述第一通道的第二残留信号的预报信号来处理针对所述第一通道的第二残留信号,从而提供针对所述第一通道的第三残留信号;
第四通道内预报元件,其通过从针对所述第二通道的第二残留信号中减去针对所述第二通道的第二残留信号的预报信号来处理针对所述第二通道的第二残留信号,从而提供针对所述第二通道的第三残留信号。
3.根据权利要求2所述的编码器,其中所述第一通道内预报元件通过对所述第一数字信号的信号值进行滤波进一步提供针对所述第一通道的第一预报信号,所述第二通道内预报元件通过对所述第二数字信号的信号值进行滤波进一步提供针对所述第二通道的第一预报信号,通道间预报元件通过对针对所述第一通道的第一残留信号的信号值和针对所述第二通道的第一残留信号的信号值进行滤波,进一步提供针对所述第一通道的第二预报信号和针对所述第二通道的第二预报信号,第三通道内预报元件通过对针对所述第一通道的第二残留信号的信号值进行滤波进一步提供针对所述第一通道的第三预报信号,并且所述第四通道内预报元件通过对针对所述第二通道的第二残留信号的信号值进行滤波进一步提供针对所述第二通道的第三预报信号。
4.根据权利要求2所述的编码器,进一步包括通道内预报元件的第一级联,其中通道内预报元件的所述第一级联的第一通道内预报元件通过对针对所述第一通道的第三残留信号的信号值进行滤波来提供针对所述第一通道的进一步的预报信号,并通过从针对所述第一通道的第三残留信号中减去针对所述第一通道的进一步的预报信号来提供针对所述第一通道的进一步的残留信号,通道内预报元件的所述第一级联的每个其他通道内预报元件通过对由通道内预报元件的所述第一级联的在先通道内预报元件所提供的针对所述第一通道的进一步的残留信号的信号值进行滤波,来提供针对所述第一通道的更进一步的预报信号,并且通过从由通道内预报元件的所述第一级联的在先通道内预报元件所提供的所述进一步的残留信号中减去针对所述第一通道的更进一步的预报信号,来提供针对所述第一通道的更进一步的残留信号。
5.根据权利要求2所述的编码器,进一步包括通道内预报元件的第二级联,其中通道内预报元件的所述第二级联的第一通道内预报元件通过对针对所述第二通道的第三残留信号的信号值进行滤波来提供针对所述第二通道的进一步的预报信号,并通过从针对所述第二通道的第三残留信号中减去针对所述第二通道的进一步的预报信号来提供针对所述第二通道的进一步的残留信号,并且通道内预报元件的所述第二级联的每个其他通道内预报元件通过对由通道内预报元件的所述第二级联的在先通道内预报元件所提供的针对所述第二通道的进一步的残留信号的信号值进行滤波,来提供针对所述第二通道的更进一步的预报信号,并且通过从由通道内预报元件的所述第二级联的在先通道内预报元件所提供的所述进一步的残留信号中减去针对所述第二通道的更进一步的预报信号,来提供针对所述第二通道的更进一步的残留信号。
6.根据权利要求4或5所述的编码器,进一步包括第一线性组合器,所述第一线性组合器将针对所述第一通道的第一残留信号、针对所述第一通道的第二残留信号、针对所述第一通道的第三残留信号、针对所述第一通道的进一步的残留信号以及针对所述第一通道的更进一步的残留信号中的至少两个乘以第一线性组合器权数,并且将结果相加以形成针对所述第一通道的最终预报信号。
7.根据权利要求6所述的编码器,进一步包括第一减法单元,其从所述第一数字信号减去针对所述第一通道的量化的最终预报信号。
8.根据权利要求6所述的编码器,其中所述第一线性组合器被调整,以使得在编码过程期间所述第一线性组合器权数根据Sign-Sign LMS算法被调整。
9.根据权利要求4或5所述的编码器,进一步包括第二线性组合器,所述第二线性组合器将针对所述第二通道的第一残留信号、针对所述第二通道的第二残留信号、针对所述第二通道的第三残留信号、针对所述第二通道的进一步的残留信号以及针对所述第二通道的更进一步的残留信号中的至少两个乘以第二线性组合器权数,并且将结果相加以形成针对所述第二通道的最终预报信号。
10.根据权利要求9所述的编码器,进一步包括第二减法单元,其从所述第二数字信号中减去针对所述第二通道的量化的最终预报信号。
11.根据权利要求9所述的编码器,其中所述第二线性组合器被调整,以使得在编码过程期间所述第二线性组合器权数根据Sign-Sign LMS算法被调整。
12.根据权利要求1或2所述的编码器,其中所述第一通道内预报元件和/或所述第二通道内预报元件包括FIR滤波器单元。
13.根据权利要求1或2所述的编码器,其中所述通道间预报元件包括多个自适应的FIR滤波器单元。
14.根据权利要求4所述的编码器,其中所述第三通道内预报元件和/或所述第四通道内预报元件和/或通道内预报元件的所述第一级联的通道内预报元件包括自适应的FIR滤波器单元。
15.根据权利要求5所述的编码器,其中所述第三通道内预报元件和/或所述第四通道内预报元件和/或通道内预报元件的所述第二级联的通道内预报元件包括自适应的FIR滤波器单元。
16.根据权利要求1或2所述的编码器,其中所述第一数字信号和所述第二数字信号是数字化的音频信号。
17.根据权利要求1或2所述的编码器,适于进一步编码代表第三或更多通道的第三或更多的数字信号。
18.一种用于编码代表第一通道的第一数字信号和代表第二通道的第二数字信号的方法,包括以下步骤:
处理所述第一数字信号,从而提供针对所述第一通道的第一残留信号;
处理所述第二数字信号,从而提供针对所述第二通道的第一残留信号;
通过线性地组合针对所述第一通道的第一残留信号和针对所述第二通道的第一残留信号,来处理针对所述第一通道的第一残留信号和针对所述第二通道的第一残留信号,从而提供针对所述第一通道的第二残留信号和针对所述第二通道的第二残留信号。
19.一种用于解码代表第一通道的编码第一数字信号和代表第二通道的编码第二数字信号的解码器,所述解码器包括:
第一通道内预报元件,其处理所述编码第一数字信号,从而提供针对所述第一通道的第一残留信号;
第二通道内预报元件,其处理所述编码第二数字信号,从而提供针对所述第二通道的第一残留信号;
通道间预报元件,其通过线性地组合针对所述第一通道的第一残留信号和针对所述第二通道的第一残留信号,来处理针对所述第一通道的第一残留信号和针对所述第二通道的第一残留信号,从而提供针对所述第一通道的第二残留信号和针对所述第二通道的第二残留信号。
20.一种用于解码代表第一通道的第一数字信号和代表第二通道的第二数字信号的方法,包括以下步骤:
处理经编码的所述第一数字信号,从而提供针对所述第一通道的第一残留信号;
处理经编码的所述第二数字信号,从而提供针对所述第二通道的第一残留信号;
通过线性地组合针对所述第一通道的第一残留信号和针对所述第二通道的第一残留信号,来处理针对所述第一通道的第一残留信号和针对所述第二通道的第一残留信号,从而提供针对所述第一通道的第二残留信号和针对所述第二通道的第二残留信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US64331705P | 2005-01-11 | 2005-01-11 | |
US60/643,317 | 2005-01-11 | ||
PCT/SG2006/000002 WO2006075975A1 (en) | 2005-01-11 | 2006-01-09 | Encoder, decoder, method for encoding/deconding, computer readable media and computer program elements |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101124727A CN101124727A (zh) | 2008-02-13 |
CN101124727B true CN101124727B (zh) | 2011-11-09 |
Family
ID=36677933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800031658A Expired - Fee Related CN101124727B (zh) | 2005-01-11 | 2006-01-09 | 编码器、解码器以及用于编码/解码的方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20090028240A1 (zh) |
EP (1) | EP1847022B1 (zh) |
CN (1) | CN101124727B (zh) |
AT (1) | ATE480050T1 (zh) |
DE (1) | DE602006016556D1 (zh) |
MY (1) | MY145282A (zh) |
SG (1) | SG158868A1 (zh) |
TW (1) | TW200705386A (zh) |
WO (1) | WO2006075975A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4555299B2 (ja) * | 2004-09-28 | 2010-09-29 | パナソニック株式会社 | スケーラブル符号化装置およびスケーラブル符号化方法 |
CN101147191B (zh) * | 2005-03-25 | 2011-07-13 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
EP1876585B1 (en) * | 2005-04-28 | 2010-06-16 | Panasonic Corporation | Audio encoding device and audio encoding method |
DE602006011600D1 (de) * | 2005-04-28 | 2010-02-25 | Panasonic Corp | Audiocodierungseinrichtung und audiocodierungsverfahren |
KR101341993B1 (ko) * | 2010-10-06 | 2013-12-16 | 에스케이텔레콤 주식회사 | 고정밀 필터를 이용한 영상 부호화/복호화 방법 및 장치 |
DE102012205907B4 (de) * | 2012-04-11 | 2018-11-08 | Trumpf Werkzeugmaschinen Gmbh + Co. Kg | System und Verfahren zur Maschinenwartung |
JP5997592B2 (ja) | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
US9398312B2 (en) * | 2013-11-04 | 2016-07-19 | Samsung Display Co., Ltd. | Adaptive inter-channel transform for wavelet color image compression |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1320258A (zh) * | 1998-09-30 | 2001-10-31 | 艾利森电话股份有限公司 | 多信道信号编码和解码 |
US6360200B1 (en) * | 1995-07-20 | 2002-03-19 | Robert Bosch Gmbh | Process for reducing redundancy during the coding of multichannel signals and device for decoding redundancy-reduced multichannel signals |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6307868B1 (en) * | 1995-08-25 | 2001-10-23 | Terayon Communication Systems, Inc. | Apparatus and method for SCDMA digital data transmission using orthogonal codes and a head end modem with no tracking loops |
US7930184B2 (en) * | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
EP1876585B1 (en) * | 2005-04-28 | 2010-06-16 | Panasonic Corporation | Audio encoding device and audio encoding method |
-
2006
- 2006-01-09 TW TW095100744A patent/TW200705386A/zh unknown
- 2006-01-09 AT AT06700585T patent/ATE480050T1/de not_active IP Right Cessation
- 2006-01-09 SG SG201000148-5A patent/SG158868A1/en unknown
- 2006-01-09 MY MYPI20060076A patent/MY145282A/en unknown
- 2006-01-09 US US11/813,645 patent/US20090028240A1/en not_active Abandoned
- 2006-01-09 CN CN2006800031658A patent/CN101124727B/zh not_active Expired - Fee Related
- 2006-01-09 WO PCT/SG2006/000002 patent/WO2006075975A1/en active Application Filing
- 2006-01-09 DE DE602006016556T patent/DE602006016556D1/de active Active
- 2006-01-09 EP EP06700585A patent/EP1847022B1/en not_active Not-in-force
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6360200B1 (en) * | 1995-07-20 | 2002-03-19 | Robert Bosch Gmbh | Process for reducing redundancy during the coding of multichannel signals and device for decoding redundancy-reduced multichannel signals |
CN1320258A (zh) * | 1998-09-30 | 2001-10-31 | 艾利森电话股份有限公司 | 多信道信号编码和解码 |
Non-Patent Citations (5)
Title |
---|
Pallo Prandoni,Martion Vetterli.An FIR Cascade Structure for Adaptive Linear Prediction.IEEE TRANSACTIONS ON SIGNAL PROCESSING46 9.1998,46(9),2566-2571. |
Pallo Prandoni,Martion Vetterli.An FIR Cascade Structure for Adaptive Linear Prediction.IEEE TRANSACTIONS ON SIGNAL PROCESSING46 9.1998,46(9),2566-2571. * |
Rongshan Yu,Chi Chung Ko.Lossless Compression of Digital Audio Using Cascaded RLS-LMS Prediction.IEEE TRANSACTIONS ON SPEECH AUDIO PROCESSING11 6.2003,11(6),532-537. |
Rongshan Yu,Chi Chung Ko.Lossless Compression of Digital Audio Using Cascaded RLS-LMS Prediction.IEEE TRANSACTIONS ON SPEECH AUDIO PROCESSING11 6.2003,11(6),532-537. * |
全文. |
Also Published As
Publication number | Publication date |
---|---|
EP1847022B1 (en) | 2010-09-01 |
EP1847022A1 (en) | 2007-10-24 |
WO2006075975A1 (en) | 2006-07-20 |
CN101124727A (zh) | 2008-02-13 |
TW200705386A (en) | 2007-02-01 |
WO2006075975A8 (en) | 2006-10-12 |
DE602006016556D1 (de) | 2010-10-14 |
MY145282A (en) | 2012-01-13 |
SG158868A1 (en) | 2010-02-26 |
EP1847022A4 (en) | 2008-05-21 |
ATE480050T1 (de) | 2010-09-15 |
US20090028240A1 (en) | 2009-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101124727B (zh) | 编码器、解码器以及用于编码/解码的方法 | |
CN1918632B (zh) | 音频编码 | |
AU733156B2 (en) | Audio coding method and apparatus | |
Schuller et al. | Perceptual audio coding using adaptive pre-and post-filters and lossless compression | |
CN101120615B (zh) | 多声道编码器和解码器以及相应的编码和解码方法 | |
AU726762B2 (en) | A method and a device for coding audio signals and a method and a device for decoding a bit stream | |
KR101397736B1 (ko) | 유손실 인코딩 데이터 스트림 및 무손실 확장 데이터 스트림을 이용하는 소스 신호의 무손실 인코딩을 위한 방법및 장치 | |
JP5215994B2 (ja) | 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置 | |
CN1918630B (zh) | 量化信息信号的方法和设备 | |
CN1117346C (zh) | 编码离散信号和解码已编码的离散信号的方法和设备 | |
NO340674B1 (no) | Koding av informasjonssignal | |
KR20070030841A (ko) | 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및장치 | |
WO2006000842A1 (en) | Multichannel audio extension | |
Huang et al. | Cascaded RLS–LMS prediction in MPEG-4 lossless audio coding | |
CN1918631B (zh) | 音频编码设备、方法和音频解码设备、方法 | |
KR20070046752A (ko) | 신호 처리 방법 및 장치 | |
JPH09106299A (ja) | 音響信号変換符号化方法および復号化方法 | |
Muin et al. | A review of lossless audio compression standards and algorithms | |
CN116153320A (zh) | 语音信号联合降噪压缩方法和系统 | |
Hidayat et al. | A critical assessment of advanced coding standards for lossless audio compression | |
Chao | Sub-band CRASys speech coder for increased speech quality | |
Li et al. | Perceptually adaptive bit-plane coding for scalable audio | |
JPH05289699A (ja) | 信号の符号化復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111109 Termination date: 20130109 |