CN101371294A - 使用相关变换的多描述编码 - Google Patents
使用相关变换的多描述编码 Download PDFInfo
- Publication number
- CN101371294A CN101371294A CNA2006800526415A CN200680052641A CN101371294A CN 101371294 A CN101371294 A CN 101371294A CN A2006800526415 A CNA2006800526415 A CN A2006800526415A CN 200680052641 A CN200680052641 A CN 200680052641A CN 101371294 A CN101371294 A CN 101371294A
- Authority
- CN
- China
- Prior art keywords
- group
- conversion
- quantized
- quantization
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 38
- 238000006243 chemical reaction Methods 0.000 claims description 197
- 238000013139 quantization Methods 0.000 claims description 147
- 238000013507 mapping Methods 0.000 claims description 76
- 230000014509 gene expression Effects 0.000 claims description 54
- 230000002441 reversible effect Effects 0.000 claims description 38
- 230000009466 transformation Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 17
- 238000009795 derivation Methods 0.000 claims description 14
- 230000003760 hair shine Effects 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 230000000295 complement effect Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims 6
- 230000005540 biological transmission Effects 0.000 abstract description 10
- 230000008569 process Effects 0.000 abstract description 3
- 238000011084 recovery Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 40
- 238000001228 spectrum Methods 0.000 description 36
- 238000010586 diagram Methods 0.000 description 23
- 238000005516 engineering process Methods 0.000 description 23
- 238000011002 quantification Methods 0.000 description 17
- 239000011159 matrix material Substances 0.000 description 11
- 230000000875 corresponding effect Effects 0.000 description 8
- 239000012634 fragment Substances 0.000 description 6
- 230000001771 impaired effect Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 239000002131 composite material Substances 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Color Television Systems (AREA)
- Error Detection And Correction (AREA)
- Image Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
多描述编码系统中的发送机和接收机使用相关和去相关变换产生和处理输入信号元的多个描述。多个描述包括相关变换系数的组,如果在传输期间一些相关变换系数被丢失或损坏,允许恢复原始信号的不精确复制品。描述允许利用不同的量化分辨率对信号元进行量化的相关和去相关变换的无噪声实现。描述减少为执行变换所需资源的使用快速Hadamard变换的实现。
Description
技术领域
本发明通常涉及音频和视频编码,更具体地涉及多描述编码系统和技术。
背景技术
多描述(MD)编码系统和技术编码信源信号到两个或更多的部分或者“描述”中,每个描述包含足以允许重构较低质量版本的原始信源信号的信息量。理想情况下,MD编码系统中的解码器能够根据这些描述中一个或更多重构信源信号的适当复制品,但是重构复制品的保真度随描述数量的增加而增加。
MD编码系统后面的基本思想是将编码的信号分割成两个或更多的描述,以便每个描述表示原始信源信号的适当复制品以及每个描述与其他描述共享一些信息。MD编码系统中的解码器从尽可能多的这些描述收集信息,根据包含在所接收的描述中的信息估计任何丢失描述的内容,以及根据接收和估计的描述重构信源信号的复制品。
MD编码技术在编码信号的部分可能在传输期间被丢失或损坏的各种应用中是具有吸引力的,因为它们能够在传输信道条件变得愈加复杂时提供重构复制品的质量的舒缓退化。这种特性对于在相对有损耗的传输信道上操作的无线分组网络特别具有吸引力。从Goyal的“Multiple description coding:compression meets the network”(IEEESignal Processing Magazine,2001年9月)能够获得有关MD编码系统和技术的其他信息。
许多MD技术已知可以用于将编码的信息分割成多个部分或描述。一些技术应用相关变换于编码的信息,该相关变换将所述信息以可逆的或可反转的方式分配到两个或更多部分中。每个部分能够被汇编到单独的比特流或分组中用于存储或传输。不幸的是,使用相关变换的已知技术可能将量化噪声引入被分割成多个部分的编码信息中,这会降低通过解码器重构的复制品的感知质量。此外,实现相关变换的已知方式计算强度大,其需要相当大的计算资源量来执行所述变换所需的计算。
需要一种应用相关变换于编码信息的方式,这种方式几乎不引入量化噪声并且能够被有效地实现。
发明内容
根据本发明的一个方面,通过应用相关变换于量化信号元的组以产生相应的变换系数组,对信号进行处理以在多描述编码系统中使用该信号,其中所述量化信号元的组具有表示信号的信号分量的不同量化分辨率,以及所述相关变换允许通过互补的去相关变换根据变换系数精确恢复所述量化信号元。
根据本发明的另一个方面,通过应用Hadamard变换于量化信号元的组以产生值,对信号进行处理以在多编码系统中使用该信号,其中从所述值推导相应的变换系数组,每组量化信号元比相应的变换系数组较不相关。
根据本发明的再一个方面,通过应用去相关变换于从编码信号获得的变换系数组以恢复被输入到互补的相关变换的量化信号元的组的精确复制品,对编码的信号进行处理以在多描述编码系统中使用该信号,其中量化信号元具有不同的量化分辨率和表示信号的信号分量。
根据本发明的又一个方面,通过应用逆Hadamard变换于从变换系数组推导的值以产生相应的量化信号元的组,对编码的信号进行处理以在多描述编码系统中使用该信号,其中每组变换系数比相应的量化信号元的组更相关。
通过参考以下讨论和附图可以更好地理解本发明各个特征及其优选实施例,其中在若干附图中相同的附图标记指代相同的单元。以下讨论和附图的内容仅仅作为示例被阐述而不应该被理解成表示对本发明范围的限制。
附图说明
图1和图2是本发明的各个方面可以被包含在其中的编码系统中的发送机和接收机的示意框图。
图3是编码器的一种实现的示意框图。
图4是解码器的一种实现的示意框图。
图5是使用具有同类量化分辨率的量化器的相关变换的第一级的示意框图。
图6是使用具有同类量化分辨率的量化器的去相关变换的最后级的示意框图。
图7是使用具有异类量化分辨率的量化器的相关变换的第一级的示意框图。
图8是使用具有异类量化分辨率的量化器的去相关变换的最后级的示意框图。
图9是使用具有异类量化分辨率的量化器的具有三级的相关变换的示意框图。
图10是使用具有异类量化分辨率的量化器的具有三级的去相关变换的示意框图。
图11是在其输入端具有映射函数的相关变换的示意框图。
图12是在其输出端具有反映射函数的去相关变换的示意框图。
图13是可以用于实现本发明各个方面的设备的示意框图。
具体实施方式
A.介绍
1.系统概述
图1是感知编码系统中的发送机10的一个实例的示意框图。在该特定的实例中,发送机10应用分析滤波器组12给信源信号2以产生频率子频带信号13,和应用感知模型14给子频带信号13以评估信源信号2的感知掩蔽特性。编码器16利用根据从感知模型14接收的控制信息15所选择的量化分辨率量化子频带信号13的单元以及编码该量化的子频带信号元到多个描述17中,该描述通过格式化器18汇编到编码信号4中。在优选实现中,编码器16还提供信源信号2的估计的频谱轮廓19用以包括在编码的信号4中。本发明的各个方面可以被包含在编码器16中以方便产生多个描述17。
图2是感知编码系统中的接收机20的一个实例的示意框图。接收机20使用去格式化器22从编码的信号4获得多个描述23以及,在优选实现中,从编码的信号4获得信源信号2的估计的频谱轮廓27。解码器24从全部或部分的多个描述恢复子频带信号25的复制品。通过应用合成滤波器组26给恢复的子频带信号25产生输出信号6,该信号是信源信号2的重构复制品。本发明的各个方面可以被包含在解码器24中以方便处理多个描述23。
2.滤波器组
分析和合成滤波器组12、26可以以包括分组和小波变换、像正交镜像滤波器、递归滤波器和网格滤波器的数字滤波器的组或级联的各种方式实现。在以下将更详细讨论的音频编码系统的一个特定实现中,分析滤波器组12通过修改离散余弦变换(MDCT)实现以及合成滤波器组26通过互补逆修改离散余弦变换(IMDCT)实现,这些内容在Princen等人的“Subb and/Transform Coding Using FilterBank Designs Based on Time Domain Aliasing Cancellation”(Proceedings of the 1987 International Conference on Acoustics,Speech and Signal Processing(ICASSP),1987年5月,第2161-64页)中描述。根据这种实现,应用分析滤波器组12到信源信号2的重叠段以产生表示信源信号的频谱分量的MDCT系数块或信号元,每个段中具有2N个采样。所述滤波器组在每个块中产生2N个系数。编码器16利用改变根据感知模型选择的量化分辨率量化每个块中一半的MDCT系数,以及汇编表示量化系数的信息到编码信号4中。应用合成滤波器组26到解码器24从编码信号4恢复的MDCT系数块以产生信号采样块,每个块具有2N个采样。由于另一半MDCT系数包含冗余信息,只编码和输入每个块中的一半MDCT系数到解码器24。以特定的方式即取消时域混淆非自然信号以产生输出信号16的段合并这些采样块,该输出信号是输入信源信号2的复制品。
这里讨论的实例参考根据感知模型量化诸如MDCT系数的信号元的感知编码系统;但是,使用感知编码并不是关键。进一步,可以在不使用滤波器组分离信源信号成子频带信号的编码系统中使用本发明。在使用根据可以期望的任何准则选择的不同量化分辨率量化诸如变换系数或信号采样的基本上任何类型信号元的编码系统中可以使用本发明。在以下讨论中参考的MDCT系数、频谱系数或频谱分量等等仅仅是信号元的实例。
3.编码器
图3是编码器16的一种实现的示意框图,在该编码器中为信源信号2的段产生2N个MDCT系数的块或单元。通过量化器162使用响应于从感知模型14接收的控制信息15所选择的量化分辨率量化每个块中的一半MDCT系数。应用相关变换164给量化MDCT系数的块以产生相关变换(CT)系数组。分配器166通过将CT系数分配到包含足够信息的量化值组中产生信源信号2的多个描述17以允许根据一个或多个组将重构信源信号的不精确复制品但是根据较大数量的组能够重构更精确的复制品。所述组被汇编到编码信号4中。在该图所示的实现中,频谱轮廓估计器168获得MDCT系数的方差并提供它们作为信源信号2的估计的频谱轮廓19。可以熵编码多个描述17和估计的频谱轮廓19。
在一个示例性实现中,通过编码信号4传送的信息被安排在分组中。在不同的分组中传送信源信号2段的CT系数。每个分组传送信源信号2的两个或更多段的CT系数。这种安排产生时间分集的形式,其增加了编码系统的延迟但是减小了MDCT系数的任何块的总损失的可能性。接收机20能够根据小于全部的CT系数重构MDCT系数的每个块的可使用信息,这允许即使在传输期间部分CT系数被丢失或损坏的情况下也将会重构信源信号2的不精确复制品。
4.解码器
图4是解码器24的一个实现的示意框图,在该解码器中逆分配器242使用分配器166执行的分配处理的逆处理从根据编码信号4获得的量化值的组收集CT系数。如果任何量化值组丢失或被损坏,一个或多个CT系数也将丢失或被损坏。系数估计器244获得任何丢失或被损坏CT系数的估计。当在传输期间一个或多个分组被丢失或损坏时接收机20可以使用估计的频谱轮廓27提高重构信号的精度。应用去相关变换246给CT系数组以恢复N个量化MDCT系数的块。如果没有信源信号2的特定段的CT系数丢失或被损坏,那么通过去相关变换246恢复的量化MDCT系数的块应该与被输入到相关变换164的量化MDCT系数的块相同。如果部分CT系数丢失或被损坏,系数估计器244和去相关变换246可以使用各种内插和统计估计技术来根据其他CT系数和估计的频谱轮廓推导丢失或被损坏CT系数的估计以尽可能少错误地产生量化MDCT系数。在Goyal等人的“Generalized Multiple Descriptions with Correlating Transforms”(IEEE Trans.on Information Theory,vol.47,no.6,2001年9月,第2199-2224页)中讨论这些统计技术的实例。如果信源信号2的特定段的所有CT系数丢失或被损坏,可以使用诸如重复前一段的信息的其他形式的错误减轻。
5.相关变换
相关变换164可以通过相互级联的线性2×2变换的等级或级实现,其中每个2×2变换在输入值对上进行操作以产生输出值对。一种已知的可以用于实现相关变换164的线性2×2变换能够如下表示:
其中yn,t=恰在总共T级的变换级t之前的N系数块中的量化MDCT系数n;和
α=相关参数。
在方程1中表示的变换能够通过计算机程序中的两个“for”循环实现,其中特定级或等级t中的2×2变换在进行到下一级之前在块中的所有N个系数上操作。这种相关变换能够被解释为根据参数α混合低频MDCT系数的值与高频MDCT系数值的变换。对于大值α输出值受低频系数值的支配以及对于小值α所述输出值受高频系数值的支配。随着T的值增加更多次地执行相关变换164。通过这种相关变换产生的输出值构成一组CT系数,其可以表示为{yn,T},0≤n≤N-1。由于存在已知的能够估计被丢失或损坏的CT系数的最佳方法,在方程1中表示的变换是在许多实际的编码系统中具有吸引力的选择。例如,参见以上引用的Goyal等人的文献(IEEE Trans.on Info.Theory,vol.47,no.6,2001年9月)。
尽管T可以被设置成任何值,设置T=log2(N)使得每个CT系数将依赖于每个MDCT系数。结果,如果任何附加错误减轻使用值T>log2(N)提供很少的益处。在许多实际音频编码系统中,N通常大于或等于512。在具有T>log2(N)的这种系统中需要实现相关变换的计算资源可能无法接受的大;所以,可能必须为T选择小于log2(N)的值,诸如1,2,3或4。进一步,由于CT系数被分割成不同的描述,T的值还可以规定极限为能够被使用的不同描述的数量。对于在方程1中表示的相关变换,设置描述D的数量等于2T。
6.去相关变换
通过去相关变换从CT系数能够恢复MDCT系数。互补的去相关变换246可以被表示为:
这种变换能够通过计算机程序中的两个“for”循环实现,其中t具有等于T的初始值并且减小到1。
7.分配器
分配器166将所述组CT系数分组成相互排斥的CT系数子集。每个子集构成信源信号2的多个描述17中一个。所述分配器构造描述以便每个描述包含有关信源的足够信息以允许恢复信源的低质量版本。优选地,如果所有的描述可获得,所述描述被如此构造以便解码器能够恢复编码信源信号的精确复制品。如果任何描述被丢失或损坏,在解码器可获得的描述中系数之间的相关性能够被用于估计丢失或被损坏的信息。
在一个实现中,分配器166通过将每个第D个CT系数汇编到各自的描述中构造D个描述。如果分配器166构造例如四个描述,然后CT系数0,4,8,12,...可以被汇编到第一描述中,CT系数1,5,9,13可以被汇编到第二描述中,CT系数2,6,19,14,...可以被汇编到第三描述中,以及CT系数3,7,11和15可以被汇编到第四描述中。分配器166可以以各种方式实现。
分配器166可以以许多方式“多样化”描述,诸如例如分割在不同时间周期期间用于传输的描述(时间多样化),分割使用不同载波频率传输的描述(频率多样化),使用不同信道传输的描述(信道多样化),或通过使用这些和其他多样化方法的各种组合。作为另一个实例,分配器166可以将来自不同信源的用于传输的若干描述进行分组(信源多样化)。
8.逆分配器
逆分配器242尽可能完整地根据在已编码信号4中接收的描述形成一组CT系数。可以缓冲和处理该描述中的系数以撤销诸如以上描述的任何多样化方案的影响。当已经接收给定信源的所有描述时,或者当在解码器的任何实时性能约束指示必须继续进行信源的解码时,逆分配器242以与分配器166所执行的分配相反的方式安排CT系数。
在使用如上所述的分配器166实现的编码系统中,逆分配器242可以校对来自可获得的描述的CT系数。如果例如来自四个描述的第四个描述丢失或被损坏,那么校对的该组系数将会包括CT系数0,1,2,X,4,5,6,X,8,9,10,X,12,13,14,X,...,这里符号X表示丢失或被损坏的系数。从解码器可获得的所述CT系数可以估计这些丢失或被损坏的系数。在提供编码信号4中估计的频谱轮廓的优选实现中,各种轮廓估计技术诸如频谱内插、频谱再归一化和低频方差估计可以使用这种轮廓来提高估计的精度。
基本上在频谱轮廓估计器168中能够使用上述的轮廓估计技术的任何组合。频谱内插和频谱再归一化是众所周知的技术,这些技术在Lauber等人的“Error Concealment for Compressed Digital Audio”(Audio Eng.Soc.111th Convention,New York,2001年9月)中描述。以下描述低频方差估计。用于使用频谱轮廓信息估计丢失系数的统计技术能够在以上引用的Goyal等人的文献(IEEE Trans.onInfo.Theory,vol.47,no.6,2001年9月)中找到。
B.本发明的方面
关于根据方程1和2直接实现的相关和去相关变换存在两个问题。第一个问题是增加的量化噪声。在典型的编码系统中,输入到去相关变换164的MDCT系数通过已经利用根据来自感知模型14的控制信息15选择的量化分辨率被量化的值表示以满足感知准则和比特率约束。但是,由于参数α的值可以被选择以满足编码系统的需要,从方程1获得的CT系数是通常不具有相同量化分辨率的值。CT系数在汇编到编码信号4中之前被量化以满足比特率约束。
由于增加了已经将在通过解码器24恢复的MDCT系数中存在的噪声,CT系数的量化不是想要的。这种噪声增加可以降低编码信号的感知质量。换言之,CT系数的量化阻止解码器24恢复输入到编码器16的相同MDCT系数。这些系数之间的差可以本身清楚表示为可听的噪声。
对于除 之外α的所有值存在这个问题。如果α具有该特定的值,由于方程1和2中所有矩阵的幅度是相同的,原始量化的MDCT系数的精确恢复是有可能的。需要执行相关和去相关变换的计算能够表示为整数算术运算的单一定标。由于整数算术运算是无损的,所以通过方程2的去相关变换能够精确地恢复输入到方程1的相关变换的MDCT系数。
在方程1和2中变换直接实现的第二问题是对于甚至最适度的T值这些实现需要相当的计算资源。对于需要廉价实现的接收机20的那些应用来说这个问题对解码器24中的去相关变换246特别地严重。以下描述这两个变换的有效实现。
1.无噪声变换
以下在方程3和4中分别地示出了类似于方程1和2中相关和去相关变换的变换。
这里(V)Q表示通过量化器Q对向量V的单元的量化。
通过图5中用于八个MDCT系数块的示意框图显示方程3中相关变换的第一等级或级t=1。音频和视频编码系统通常利用相当更多的系数处理块但是选择八个系数的块用于这里讨论的实例以减小示例的复杂性。图中的Q块表示量化器。A#块表示图3中所示的三个2×2矩阵中一个。例如,块A0表示方程右手侧上的第三矩阵以及块A2表示第一矩阵。连接这些块的线显示系数如何流动通过相关变换。在该图左手侧上被标记0到7的圆形端子输入八个量化的MDCT系数(n=0到7)的块到所述变换。在所述图中未示出的变换的下一级t=2,接收这些CT系数和以类似的方式处理它们。
通过图6中用于一组八个CT系数的示意框图显示方程4中去相关变换的最后等级或级t=1。图中的Q块表示量化器。B#块表示在方程4中所示的三个2×2矩阵中一个。例如,块B0表示方程右手侧上的第三矩阵以及块B2表示第一矩阵。连接这些块的线显示系数如何流动通过去相关变换。从变换的前一级t=2接收八个CT系数(n=0到7)的组并将其输入到该图的左右侧上被标记0到7的圆形端子。输出八个量化的MDCT系数(n=0到7)的块到该图右手侧上被标记0到7的圆形端子。
如果两个变换的所有级中的所有量化器Q利用相同的量化分辨率量化其输入以及如果它们遵守特性:
Q(p+q)=p+Q(q) (5a)
Q(-p)=-Q(p) (5b)
这里p和q是2个向量,那么方程3中所示的相关变换产生量化的CT系数,不像通过方程1中所示的相关变换产生的CT系数,这些系数不需要进一步量化满足比特率约束。通过方程4的去相关变换能够精确地恢复输入到方程3的相关变换的MDCT系数。不增加任何量化噪声。
不幸的是,由于对量化器Q施加的限制,在许多实际的编码系统中方程3和4中所示的变换不是有用的。必须利用相同的量化分辨率量化所有MDCT系数以及方程5a和5b中表示的两个特性隐含仅仅能够使用均匀的奇对称量化器。这些限制是不实际的。感知编码系统利用不同的量化分辨率量化MDCT系数以尽可能更多地利用心理声学掩蔽效应。进一步,许多编码系统使用非均匀的量化器。使用以下描述的技术能够消除对于施加在量化器的同类和均匀的量化分辨率上的限制。
a)异类均匀的量化分辨率
利用使用不同或异类量化分辨率的量化器能够实现无噪声相关和去相关变换。以下将讨论规定在相关和去相关变换中的中间点上将使用哪种量化分辨率的算法。根据用于量化输入的MDCT系数的所述组量化分辨率获得在变换中使用的所有量化分辨率。解码器24必须能够确定使用哪些量化分辨率。如果必须,编码器16能够在编码的信号4中包括解码器24将会需要的任何信息。
用于量化输入到2×2矩阵中的一对值中每个值的量化分辨率可以相互不同。这样可能有助于说明如何量化分辨率通过相关和去相关变换跟随所述系数。
上述的算法在下面计算机程序源代码的片段中表示,所述源代码含有具有BASIC编程语言的某些语法特征的语句。这些源代码片段不代表实际的程序而是被提供用于帮助说明如何规定和使用量化分辨率。程序-1的源代码段描述规定用于相关变换的量化器的算法。程序-2的源代码段描述规定去相关变换的量化器的算法。程序-3和程序-4的源代码段描述规定如何分别在相关和去相关变换中使用各种量化器的算法。
源代码段具有使用以下符号的语句:
Q{n}=用于量化MDCT系数n的量化器,这里0≤n≤N-1。
Q{n,t}=用于在变换级t中量化yn,t的量化器,这里1≤t≤T。
这样可以有助于指出相关变换中的第一级别或级是级t=1以及最后一级是t=T,但是去相关变换中的第一级是t=T以及最后一级是t=1。
量化器Q{n}和Q{n,t}遵守以上在方程5a和5b中表示的特性,其可以表示为:
Q{n}(p+q)=p+Q{n}(q) (5c)
Q{n}(-p)=-Q{n}(p) (5d)
Q{n,t}(p+q)=p+Q{n,t}(q) (5e)
Q{n,t}(-p)=-Q{n,t}(p) (5f)
程序-1:规定用于相关变换的量化器
For n=0 to N-1 //初始化变换级1
Q{n,0}=Q{n}
For t=1 to T //初始化所有其他阶段和级
For n=0 to 1/2N-1
Q{2n,t}=Q{n,t-1}
Q{2n+1,t}=Q{1/2N+n,t-1}
程序-2:规定用于去相关变换的量化器
For n=0 to 1/2N-1//初始化变换级T
Q{2n,T}=Q{n}
Q{2n+1,T}=Q{1/2N+n}
For t=T to 1 step-1//初始化所有其他级
For n=0 to 1/2N-1
Q{2n,t-1}=Q{n,t}
Q{2n+1,t-1}=Q{1/2N+n,t}
程序-3:规定如何在相关变换内使用量化器
For t=1 to T
For n=0 to 1/2N-1
符号(V)Q{a,b,c},Q{x,y,z}表示通过量化器Q{a,b,c}量化两单元向量V的第一单元以及通过量化器Q{x,y,z}量化向量V的第二单元。
程序-4:规定如何在去相关变换内使用量化器
For t=T to 1 step-1
For n=0 to 1/2N-1
通过图7中用于8MDCT系数块的示意框图显示在方程6a到6c中相关变换的第一级别或级t=1。在附图左手侧上标记有Q0到Q7的量化器并不是变换的部分而是表示用于利用改变的量化分辨率量化MDCT系数的不同量化器162。例如,标记Q3的方块表示量化MDCT系数3的量化器162。标记Q#的其他方块表示在变换级内用于量化各自系数的量化器。用于量化特定系数的量化分辨率在整个所述级中是相同的。例如,标记Q3的所有量化器使用相同的量化分辨率。A#方块表示在方程6a到6c中所示的2×2矩阵中一个。例如,方块A0表示在方程6a中出现的矩阵。连接这些方块的线显示系数如何流动通过变换级。利用粗体线显示系数3流动通过该变换级的路径。
通过图8中用于一组8个CT系数的示意框图显示方程7a到7c中去相关变换的最后级别或级t=1。标记Q#的方块表示在变换级内用于量化各自系数的量化器。用于量化特定系数的量化分辨率在整个所述级中是相同的。例如,标记Q3的所有量化器使用相同的量化分辨率。B#方块表示在方程7a到7c的组中所示的2×2矩阵中一个。例如,方块B2表示在方程7c中出现的矩阵。连接这些方块的线显示系数如何流动通过变换级。利用粗体线显示系数3流动通过该变换级的路径。
图9中的示意框图图示在相关变换中的级t=1,2和3。该图中的每个方块表示所有2×2矩阵以及在变换的一级中用于一对系数的量化器。例如,标记AQ0,Q4的方块表示具有在图7顶部所示用于系数0和4的三对量化器Q0、Q4的三个方块A0、A1和A2。连接这些方块的线显示如何系数流动通过三个变换级。利用粗体线显示系数3流动通过该变换级的路径。
图10的示意框图图示在去相关变换中的级t=3、2和1。该图中的每个方块表示所有2×2矩阵以及在变换的一级中用于一对系数的量化器。例如,标记BQ0,Q4的方块表示具有在图8顶部所示用于系数0和4的三对量化器Q0、Q4的三个方块B0、B1和B2。连接这些方块的线显示如何系数流动通过三个变换级。利用粗体线显示系数3流动通过该变换级的路径。
b)非均匀量化分辨率
方程5a到5f中表示的限制意味着量化器函数必须是均匀的并且是奇对称的。不幸的是,许多编码系统使用不遵循这些限制的量化器。通过使用映射函数F及其反函数F-1映射任意量化的MDCT系数到和从适合于变换的中间均匀量化的系数能够减轻这些限制。相关和去相关变换处理这些中间系数以及映射函数F和F-1将任意量化的MDCT系数转换成中间系数和再转换回原来以提供无噪声系统。
映射函数F和F-1映射一组量化级到另一组量化级和从另一组量化级映射所述组量化级。通过函数F映射的量化级可以是非均匀间隔的但是量化级在映射之后是均匀间隔的。映射函数F和F-1可以以各种方式实现,其中包括封闭形式的分析表示或定义任意间隔的量化级和均匀间隔值之间映射的查询表。映射函数F的输出被输入到相关变换以及去相关变换的输出被输入到反映射函数F-1。
可以使用一个或更多映射函数映射方块中的MDCT系数。例如,如果编码系统形成MDCT系数组来定义频率子频带,那么能够使用映射函数用于每个子频带。替换地,如在图11和12图示的实例中所示能够使用不同的映射函数用于每个MDCT系数。如果使用不止一个映射函数,映射域中的特定值可以对应于量化MDCT系数域中的不止一个量化级。例如,可以使用一个映射函数F0及其反函数F0-1映射特定的MDCT系数X0以及可以使用不同的映射函数F1及其反函数F1-1映射不同的MDCT系数X1。不同的映射函数Fn可以映射不同的量化级到相同的映射值。由于相关和去相关变换是无噪声系统这不导致问题产生,允许通过去相关变换恢复被映射系数的正确值,以及使用正确的反映射函数Fn-1映射恢复的系数值回到其正确的量化级。在表格I中图示了一个实例。
表格I
参考表格I,MDCT系数X0能够被量化成级{0,1,2,4,8}集合中的任何级。MDCT系数X1能够被量化成级{0,1,3,9}的集合中的任何级,以及MDCT系数X2能够被量化成级{0,2,4,6,8}的集合中的任何级。能够使用一组映射函数F0、F1和F2映射这些量化的MDCT系数Xn到均匀间隔的值Un以及能够使用相应的反映射函数F0-1、F1-1和F2-1组映射均匀间隔的值Un回到量化的MDCT系数Xn。在所示的实例中,映射函数F0映射X0的量化级{0,1,2,4,8}到U0的均匀间隔的值{0,1,2,3,4};映射函数F1映射X1的量化级{0,1,3,9}到U1的均匀间隔的值{0,1,2,3};以及映射函数F2映射X2的量化级{0,2,4,6,8}到U2的均匀间隔的值{0,1,2,3,4}。相应的函数F0-1、F1-1和F2-1以相反的方向映射这些值和级。
如果MDCT系数被量化为X0=8,X1=3和X2=0,那么函数F0映射X0=8到值U0=4,函数F1映射X1=3到值U1=2,以及函数F2映射X2=0到值U2=0。通过方程6a到6c以及7a到7c中所示的变换能够无噪声地处理映射的值Un。反函数F0-1映射U0=4到X0=8,反函数F1-1映射U1=2到X1=3,以及反函数F2-1映射U2=0到X2=0,从而恢复量化的MDCT系数的正确量化级。
在方程3和4中表示的变换以及在方程6和7中表示的变换可以使用映射函数。在方程3和4中表示的变换还能够使用映射函数映射具有异类量化分辨率的量化MDCT系数到具有同类量化分辨率的量化MDCT系数以及从后者映射到前者。编码器16能够在编码信号4中包括解码器24所需的使用正确的反映射函数的任何控制信息。
2.变换的有效实现
由于这些变换必须在许多对值上一次一对地进行操作,所以以上讨论的相关和去相关变换的直接实现计算强度大。需要附加的资源执行在方程3、4、6和7中所表示变换的中间量化操作。在需要接收机20的廉价实现的应用中这种情况非常不想要。以下描述一种更加有效地实现这些变换的方式。
a)快速Hadamard变换
能够示出当 时快速Hadamard变换(FHT)对于通过方程1和2中表示的相关和去相关变换的直接实现获得的变换能够产生相同的结果。FHT实现能够提高效率超出70%,这里提高的精确数量取决于变换级T的数量以及块大小N。实验研究也已经显示当若干MDCT系数被丢失或损坏时选 提供相关变换引入的编码信号比特率增加和解码信号的感知质量之间的优良折衷。
在方程1中表示的相关变换可以通过以下实现
以及在方程2中表示的去相关变换可以通过以下实现
其中:T=变换级的数量,这里T≥1;
N=块中MDCT系数的数量;
D=描述的数量,这里D=2T;
G=组的数量,这里 以及T是这样以便G为偶数;
xn=MDCT系数n,这里0≤n≤N-1;
yn,t=在变换级t的CT系数n,这里1≤t≤T;以及
Hk=k级Hadamard矩阵。
k级Hadamard矩阵是2k乘以2k的维数并且被定义为:
其中,
实现FHT的有效技术能够计算Hadamard矩阵Hk,计算复杂度是2klog2(2k)。有关如何能够实现FHT的附加信息可以从Lee等人的“Fast Hadamard Transform Based on a Simple Matrix Factorization”(IEEE Trans.on Acoust.,Speech and Sig.Proc.,1986,vol.ASSSP-34,no.6,pp.1666-1667)获得。
在方程8中表示的相关变换将MDCT系数分离成G组D个系数和使用FHT为每个组计算Hadamard矩阵Hk。在方程9中表示的去相关变换类似地操作。
b)异类和非均匀量化分辨率
如在方程8和9中所表示变换的实现比如在方程1和2中表示的直接实现更加地有效但是去相关变换恢复MDCT系数精确值的能力仍然遭受较不有效实现所施加的相同约束。MDCT系数的完美恢复是不可能的,除非利用相同的量化分辨率均匀地量化MDCT系数。
通过使用如上所述的以及例如在图11和12中图示的映射函数能够避免在MDCT系数量化上施加的限制。能够使用一个或更多映射函数F映射任意量化的MDCT系数到均匀和异类量化的中间系数,通过方程7和8中表示的变换能够无噪声地处理这些系数,或者一个或更多反映射函数F-1能够映射恢复的中间系数回到原始任意量化的MDCT系数。
3.变型
以上讨论的不同实现相互提供优点。在方程6和7中表示的变换实现允许灵活地选择相关参数α的值以折衷比特率和可以被施加于编码系统上的声音质量约束。在方程8和9中表示的变换实现指示相关参数α的值但是它更加的有效。这些两种实现可以以各种方式一起被使用。
在一种变型中,方程8和9的有效实现用于处理系数块中的绝大多数MDCT系数以及方程6和7利用相关参数α的更加优化值的灵活实现用于处理对于信号感知质量更加重要的频谱部分中的MDCT系数。两种实现之间的频谱分配可以是固定的或者它可以是自适应的。
在另一种变型中,响应于信号特征或响应于改变编码系统的需求自适应地选择两种实现。
4.其他考虑
在诸如无线多媒体应用的编码应用中可以有利地使用本发明的各个方面,在该多媒体应用中编码信号的部分在传输期间可以被丢失或损坏。仿真和实验研究表明当在解码器24中实现一种或更多错误减轻技术时能够改善解码的输出信号6的感知质量。
被称为“频谱再归一化”的技术调整一个或更多已恢复子频带信号25的电平以遵循估计的频谱轮廓19。在解码器24必须估计已经被丢失或损坏的频谱信息的情况下,所产生的输出信号6的频谱轮廓可以显著不同于原信源信号2的频谱轮廓。频谱归一化根据需要调整一个或更多子频带信号25的电平以获得类似于原始频谱轮廓的频谱轮廓。优选地,估计的频谱轮廓19包括具有均匀频谱带宽的若干子频带中的每个子频带的频谱电平。根据需要可以使用非均匀子频带带宽以满足各种系统或声音质量要求。
被称为“交错”的技术是单个信源信号2的时间分集的形式。相同信号的不同时间间隔在输入到编码器16之前被重新安排以及时间多路复用。正确和相反的处理被应用于解码器24的输出。
被称为“重复最后已知值”的技术估计被估计频谱轮廓19的丢失或被损坏的信息。如果对于信源信号2的特定段任何轮廓信息丢失或被损坏,它能够被其最后已知的值所替换。
当其他技术失败或不能够使用时,类似于“重复最后已知值”的技术可以被用于减轻错误。这种技术利用前一部分替换编码信号4的丢失或被损坏的部分。例如,如果在分组中安排编码的信号4,能够通过前一分组的内容替换丢失分组的内容。
被称为“低频率方差估计”的技术是可以在解码器24中使用以推导低频频谱轮廓的估计的统计估计技术。这种技术利用CT系数之间的相关根据在用于较高频率MDCT系数的编码信号4中接收的方差信息和根据由解码器24计算的CT系数的方差估计低频频谱轮廓信息。低频率方差估计能够通过允许解码器24依赖于用于仅仅一组有限的较高频率系数的轮廓信息减小包括在编码信号4中的频谱轮廓信息量。
例如,假设存在两个MDCT系数以及一个变换级从而在方程1中N=2以及T=1。那么相关变换能够被写为:
这里y0,0和y1,0分别=低频和高频MDCT系数,以及y0,1和y1,1=两个CT系数。
假设MDCT系数是不相关的,能够使用表达式11中的方程找到低频MDCT系数y0,0的方差的两个不同的表达式:
这里讨论的解码器24的实现需要通过两个MDCT系数y0,0和y1,0的方差和表示的频谱轮廓信息使用频谱内插、再归一化和以上描述的丢失系数技术。但是,表达式11提供低频MDCT系数y0,0的方差信息的两个估计。这些估计仅仅取决于高频MDCT系数y1,0的方差和CT系数的方差。由于能够通过解码器24计算CT系数的方差,在编码信号4中仅需要提供高频MDCT系数y1,0的方差给解码器24。解码器24可以选择使用表达式11中的方差,或它可以使用这些表达式的平均或某些其他组合以推导低频方差的估计。
在典型编码系统的实现中,N远大于2以及MDCT系数的方差和CT系数的方差之间的关系典型并不像以上给出的那样简单。而且,编码信号4中的某些MDCT方差信息,可以被作为以上讨论的估计的频谱轮廓发送,可以在到解码器的途中被丢失或损坏。在诸如这些的情况下,能够使用诸如平均的各种技术根据可获得的MDCT方差信息和可获得的CT系数估计低频方差信息。相同方差信息的替换表达式,诸如用于低频方差信息的表达式11中的两个方程,使得这些技术成为可能。
C.实现
包含本发明各个方面的装置可以以各种方式实现,包括由计算机或包括诸如耦合到类似于在通用计算机中找到的那些组件的信号处理器(DSP)电路的更多专门组件的某些其他装置执行的软件。图13是可以用于实现本发明方面的装置70的示意框图。处理器72提供计算资源。RAM 73是处理器72进行处理使用的系统随机存取存储器(RAM)。ROM 74表示某种形式的永久存储器,诸如用于存储操作装置70所需的程序和可能用于执行本发明各个方面的只读存储器(ROM)。I/O(输入/输出)控制器75表示通过通信信道76、77的方式接收和发送信号的接口电路。在所示的实施例中,所有主要系统组件连接到总线71,该总线可以表示不止一条物理或逻辑总线;但是,总线体系结构并不需要用于实现本发明。
在由通用计算机系统实现的实施例中,可以包括其他的组件用于接口到诸如键盘或鼠标以及显示器的装置,和用于控制具有诸如磁带或磁盘、或光介质的存储介质的存储装置78。存储介质可以用于记录操作系统指令的程序、实用程序和应用程序,以及可以包括实现本发明各个方面的程序。
通过组件以包括分立的逻辑组件、集成电路、一个或更多ASIC和/或程序控制处理器的范围广泛的方式能够执行需要实践本发明各个方面的功能。实现这些组件的方式对于本发明并不重要。
本发明的软件实现可以通过诸如在包括从超声波到紫外线频率的整个频谱中的基带或调制通信通道的各种机器可读介质,或使用基本上任何记录技术传送信息的存储介质,以及在包括纸的介质上的可检测标记传送,这些记录技术包括磁带、磁卡或磁盘、光卡或光盘。
Claims (54)
1.一种在编码系统中用于信号处理的方法,包括:
接收量化信号元的组,每组量化信号元表示信号的相应段,其中该量化信号元是具有不同量化分辨率的信号分量的量化表示;
应用相关变换于所述量化信号元的组以产生相应的变换系数组,其中每组量化信号元比相应的变换系数组较不相关,以及当不存在由于用来实现相关和去相关变换的算术计算不够精确而引起的误差时,相关变换允许通过互补的去相关变换根据所述变换系数精确恢复所述量化信号元;
根据所述变换系数组推导量化值的组,其中量化值的相应组包含足够的信息,根据该信息能够恢复信号的一个或更多段的不精确复制品,其中根据数量增加的量化值组能够恢复所述信号的一个或更多段的愈加精确的复制品;以及
产生传送表示所述量化值组的信息的一个或更多输出信号。
2.根据权利要求1所述的方法,其中通过与量化函数交错的多个变换实现所述相关变换,所述量化函数具有的量化分辨率对应于量化信号元的量化分辨率。
3.根据权利要求2所述的方法,其中通过可逆的映射函数以及随后的与量化函数交错的多个变换实现所述相关变换,该可逆的映射函数将量化信号元映射到根据量化函数Q量化的一组值{x},使得对于{x}中的所有x以及为实数的所有y,Q(x+y)=x+Q(y)和Q(-y)=-Q(y)。
4.根据权利要求3所述的方法,其中所述可逆的映射函数将量化信号元映射到在各自的组中具有相同量化分辨率的一组或多组均匀量化的值。
5.根据权利要求3所述的方法,其中通过Hadamard变换实现所述多个变换中的每个变换。
6.根据权利要求1所述的方法,其中通过可逆的映射函数以及随后的与量化函数交错的多个变换实现所述相关变换,该可逆的映射函数将量化信号元映射到根据量化函数Q量化的一组值{x},使得对于{x}中的所有x以及为实数的所有y,Q(x+y)=x+Q(y)和Q(-y)=-Q(y)。
7.根据权利要求6所述的方法,其中所述可逆的映射函数将量化信号元映射到在各自的组中具有相同量化分辨率的一组或多组均匀量化的值。
8.根据权利要求6所述的方法,其中通过Hadamard变换实现所述多个变换中的每个变换。
9.一种在编码系统中用于信号处理的方法,包括:
接收量化信号元的组,每组量化信号元表示信号的相应段,其中该量化信号元是信号分量的量化表示;
在量化信号元的组中重新安排量化信号元,并应用Hadamard变换于重新安排的量化信号元的组以产生根据其推导相应的变换系数组的值,其中每组量化信号元比相应的变换系数组较不相关;
根据所述变换系数组推导量化值的组,其中量化值的相应组包含足够的信息,根据该信息能够恢复信号的一个或更多段的不精确复制品,以及其中根据数量增加的量化值组能够恢复所述信号的一个或更多段的愈加精确的复制品;以及
产生传送表示所述量化值组的信息的一个或更多输出信号。
10.一种在编码系统中用于信号处理的方法,包括:
接收量化值的组,其中量化值的相应组包含足够的信息,根据该信息能够恢复信号的一个或更多段的不精确复制品,以及其中根据数量增加的量化值组能够恢复所述信号的一个或更多段的愈加精确的复制品;
根据所述量化值的组推导变换系数的组;
应用去相关变换于所述变换系数的组以产生相应的量化信号元的组,其中每组变换系数比相应的量化信号元的组更相关以及每组量化信号元表示信号的相应段,其中量化信号元是具有不同量化分辨率的信号分量的量化表示,以及当不存在由于用来实现相关和去相关变换的算术计算不够精确而引起的误差时,所述去相关变换允许根据由互补的相关变换产生的变换系数精确恢复所述量化信号元;以及
产生传送表示所述量化信号元的组的信息的一个或更多输出信号。
11.根据权利要求10所述的方法,其中通过与量化函数交错的多个变换实现所述去相关变换,以及该量化函数具有的量化分辨率对应于量化信号元的量化分辨率。
12.根据权利要求11所述的方法,其中通过与量化函数交错的多个变换以及随后的可逆的映射函数实现所述去相关变换,该可逆的映射函数从根据量化函数Q量化的一组值{x}映射所述量化信号元,使得对于{x}中的所有x以及为实数的所有y,Q(x+y)=x+Q(y)和Q(-y)=-Q(y)。
13.根据权利要求12所述的方法,其中所述可逆的映射函数从在各自的组中具有相同量化分辨率的一组或多组均匀量化的值映射所述量化信号元。
14.根据权利要求12所述的方法,其中通过逆Hadamard变换实现所述多个变换中的每个变换。
15.根据权利要求10所述的方法,其中通过与量化函数交错的多个变换以及随后的可逆的映射函数实现所述去相关变换,该可逆的映射函数从根据量化函数Q量化的一组值{x}映射所述量化信号元,使得对于{x}中的所有x以及为实数的所有y,Q(x+y)=x+Q(y)和Q(-y)=-Q(y)。
16.根据权利要求15所述的方法,其中所述可逆的映射函数从在各自的组中具有相同量化分辨率的一组或多组均匀量化的值映射所述量化信号元。
17.根据权利要求15所述的方法,其中通过逆Hadamard变换实现所述多个变换中的每个变换。
18.一种在编码系统中用于信号处理的方法,包括:
接收量化值的组,其中量化值的相应组包含足够的信息,根据该信息能够恢复信号的一个或更多段的不精确复制品,以及其中根据数量增加的量化值组能够恢复所述信号的一个或更多段的愈加精确的复制品;
根据所述量化值的组推导变换系数的组;
应用逆Hadamard变换于根据所述变换系数的组推导的值以产生相应的量化信号元的组,并在所述量化信号元的组内重新安排量化信号元,其中每组变换系数比相应的量化信号元的组更相关以及每组量化信号元表示信号的相应段,其中量化信号元是信号分量的量化表示,以及其中去相关变换;和
产生传送表示所述量化信号元的组的信息的一个或更多输出信号。
19.一种在编码系统中用于信号处理的设备,其中该设备包括:
用于接收量化信号元的组的装置,每组量化信号元表示信号的相应段,其中该量化信号元是具有不同量化分辨率的信号分量的量化表示;
用于应用相关变换于所述量化信号元的组以产生相应的变换系数组的装置,其中每组量化信号元比相应的变换系数组较不相关,以及当不存在由于用来实现相关和去相关变换的算术计算不够精确而引起的误差时,相关变换允许通过互补的去相关变换根据所述变换系数精确恢复所述量化信号元;
用于根据所述变换系数组推导量化值的组的装置,其中量化值的相应组包含足够的信息,根据该信息能够恢复信号的一个或更多段的不精确复制品,其中根据数量增加的量化值组能够恢复所述信号的一个或更多段的愈加精确的复制品;以及
用于产生传送表示所述量化值组的信息的一个或更多输出信号的装置。
20.根据权利要求19所述的设备,其中所述相关变换通过与量化函数交错的多个变换实现,所述量化函数具有的量化分辨率对应于量化信号元的量化分辨率。
21.根据权利要求20所述的设备,其中所述相关变换通过可逆的映射函数以及随后的与量化函数交错的多个变换实现,该可逆的映射函数将量化信号元映射到根据量化函数Q量化的一组值{x},使得对于{x}中的所有x以及为实数的所有y,Q(x+y)=x+Q(y)和Q(-y)=-Q(y)。
22.根据权利要求21所述的设备,其中所述可逆的映射函数将量化信号元映射到在各自的组中具有相同量化分辨率的一组或多组均匀量化的值。
23.根据权利要求21所述的设备,其中所述多个变换中的每个变换通过Hadamard变换实现。
24.根据权利要求19所述的设备,其中所述相关变换通过可逆的映射函数以及随后的与量化函数交错的多个变换实现,该可逆的映射函数将量化信号元映射到根据量化函数Q量化的一组值{x},使得对于{x}中的所有x以及为实数的所有y,Q(x+y)=x+Q(y)和Q(-y)=-Q(y)。
25.根据权利要求24所述的设备,其中所述可逆的映射函数将量化信号元映射到在各自的组中具有相同量化分辨率的一组或多组均匀量化的值。
26.根据权利要求24所述的设备,其中所述多个变换中的每个变换通过Hadamard变换实现。
27.一种在编码系统中用于信号处理的设备,其中该设备包括:
用于接收量化信号元的组的装置,每组量化信号元表示信号的相应段,其中该量化信号元是信号分量的量化表示;
用于在量化信号元的组中重新安排量化信号元,并应用Hadamard变换于重新安排的量化信号元的组以产生根据其推导相应的变换系数组的值的装置,其中每组量化信号元比相应的变换系数组较不相关;
用于根据所述变换系数组推导量化值的组的装置,其中量化值的相应组包含足够的信息,根据该信息能够恢复信号的一个或更多段的不精确复制品,以及其中根据数量增加的量化值组能够恢复所述信号的一个或更多段的愈加精确的复制品;以及
用于产生传送表示所述量化值组的信息的一个或更多输出信号的装置。
28.一种在编码系统中用于信号处理的设备,其中该设备包括:
用于接收量化值的组的装置,其中量化值的相应组包含足够的信息,根据该信息能够恢复信号的一个或更多段的不精确复制品,以及其中根据数量增加的量化值组能够恢复所述信号的一个或更多段的愈加精确的复制品;
用于根据所述量化值的组推导变换系数的组的装置;
用于应用去相关变换于所述变换系数的组以产生相应的量化信号元的组的装置,其中每组变换系数比相应的量化信号元的组更相关以及每组量化信号元表示信号的相应段,其中量化信号元是具有不同量化分辨率的信号分量的量化表示,以及当不存在由于用来实现相关和去相关变换的算术计算不够精确而引起的误差时,所述去相关变换允许根据由互补的相关变换产生的变换系数精确恢复所述量化信号元;以及
用于产生传送表示所述量化信号元的组的信息的一个或更多输出信号的装置。
29.根据权利要求28所述的设备,其中所述去相关变换通过与量化函数交错的多个变换实现,以及该量化函数具有的量化分辨率对应于量化信号元的量化分辨率。
30.根据权利要求29所述的设备,其中所述去相关变换通过与量化函数交错的多个变换以及随后的可逆的映射函数实现,该可逆的映射函数从根据量化函数Q量化的一组值{x}映射所述量化信号元,使得对于{x}中的所有x以及为实数的所有y,Q(x+y)=x+Q(y)和Q(-y)=-Q(y)。
31.根据权利要求30所述的设备,其中所述可逆的映射函数从在各自的组中具有相同量化分辨率的一组或多组均匀量化的值映射所述量化信号元。
32.根据权利要求30所述的设备,其中所述多个变换中的每个变换通过逆Hadamard变换实现。
33.根据权利要求28所述的设备,其中所述去相关变换通过与量化函数交错的多个变换以及随后的可逆的映射函数实现,该可逆的映射函数从根据量化函数Q量化的一组值{x}映射所述量化信号元,使得对于{x}中的所有x以及为实数的所有y,Q(x+y)=x+Q(y)和Q(-y)=-Q(y)。
34.根据权利要求33所述的设备,其中所述可逆的映射函数从在各自的组中具有相同量化分辨率的一组或多组均匀量化的值映射所述量化信号元。
35.根据权利要求33所述的设备,其中所述多个变换中的每个变换通过逆Hadamard变换实现。
36.一种在编码系统中用于信号处理的设备,其中该设备包括:
用于接收量化值的组的装置,其中量化值的相应组包含足够的信息,根据该信息能够恢复信号的一个或更多段的不精确复制品,以及其中根据数量增加的量化值组能够恢复所述信号的一个或更多段的愈加精确的复制品;
用于根据所述量化值的组推导变换系数的组的装置;
用于应用逆Hadamard变换于根据所述变换系数的组推导的值以产生相应的量化信号元的组以及在所述量化信号元的组内重新安排量化信号元的装置,其中每组变换系数比相应的量化信号元的组更相关以及每组量化信号元表示信号的相应段,其中量化信号元是信号分量的量化表示,以及其中去相关变换;和
用于产生传送表示所述量化信号元的组的信息的一个或更多输出信号的装置。
37.一种传送装置可执行以执行在编码系统中用于信号处理的方法的指令程序的介质,其中该方法包括:
接收量化信号元的组,每组量化信号元表示信号的相应段,其中该量化信号元是具有不同量化分辨率的信号分量的量化表示;
应用相关变换于所述量化信号元的组以产生相应的变换系数组,其中每组量化信号元比相应的变换系数组较不相关,以及当不存在由于用来实现相关和去相关变换的算术计算不够精确而引起的误差时,相关变换允许通过互补的去相关变换根据所述变换系数精确恢复所述量化信号元;
根据所述变换系数组推导量化值的组,其中量化值的相应组包含足够的信息,根据该信息能够恢复信号的一个或更多段的不精确复制品,其中根据数量增加的量化值组能够恢复所述信号的一个或更多段的愈加精确的复制品;以及
产生传送表示所述量化值组的信息的一个或更多输出信号。
38.根据权利要求37所述的介质,其中通过与量化函数交错的多个变换实现所述相关变换,所述量化函数具有的量化分辨率对应于量化信号元的量化分辨率。
39.根据权利要求38所述的介质,其中通过可逆的映射函数以及随后的与量化函数交错的多个变换实现所述相关变换,该可逆的映射函数将量化信号元映射到根据量化函数Q量化的一组值{x},使得对于{x}中的所有x以及为实数的所有y,Q(x+y)=x+Q(y)和Q(-y)=-Q(y)。
40.根据权利要求39所述的介质,其中所述可逆的映射函数将量化信号元映射到在各自的组中具有相同量化分辨率的一组或多组均匀量化的值。
41.根据权利要求39所述的介质,其中通过Hadamard变换实现所述多个变换中的每个变换。
42.根据权利要求37所述的介质,其中通过可逆的映射函数以及随后的与量化函数交错的多个变换实现所述相关变换,该可逆的映射函数将量化信号元映射到根据量化函数Q量化的一组值{x},使得对于{x}中的所有x以及为实数的所有y,Q(x+y)=x+Q(y)和Q(-y)=-Q(y)。
43.根据权利要求42所述的介质,其中所述可逆的映射函数将量化信号元映射到在各自的组中具有相同量化分辨率的一组或多组均匀量化的值。
44.根据权利要求42所述的介质,其中通过Hadamard变换实现所述多个变换中的每个变换。
45.一种传送装置可执行以执行在编码系统中用于信号处理的方法的指令程序的介质,其中该方法包括:
接收量化信号元的组,每组量化信号元表示信号的相应段,其中该量化信号元是信号分量的量化表示;
在量化信号元的组中重新安排量化信号元,并应用Hadamard变换于重新安排的量化信号元的组以产生根据其推导相应的变换系数组的值,其中每组量化信号元比相应的变换系数组较不相关;
根据所述变换系数组推导量化值的组,其中量化值的相应组包含足够的信息,根据该信息能够恢复信号的一个或更多段的不精确复制品,以及其中根据数量增加的量化值组能够恢复所述信号的一个或更多段的愈加精确的复制品;以及
产生传送表示所述量化值组的信息的一个或更多输出信号。
46.一种传送装置可执行以执行在编码系统中用于信号处理的方法的指令程序的介质,其中该方法包括:
接收量化值的组,其中量化值的相应组包含足够的信息,根据该信息能够恢复信号的一个或更多段的不精确复制品,以及其中根据数量增加的量化值组能够恢复所述信号的一个或更多段的愈加精确的复制品;
根据所述量化值的组推导变换系数的组;
应用去相关变换于所述变换系数的组以产生相应的量化信号元的组,其中每组变换系数比相应的量化信号元的组更相关以及每组量化信号元表示信号的相应段,其中量化信号元是具有不同量化分辨率的信号分量的量化表示,以及当不存在由于用来实现相关和去相关变换的算术计算不够精确而引起的误差时,所述去相关变换允许根据由互补的相关变换产生的变换系数精确恢复所述量化信号元;以及
产生传送表示所述量化信号元的组的信息的一个或更多输出信号。
47.根据权利要求46所述的介质,其中通过与量化函数交错的多个变换实现所述去相关变换,以及该量化函数具有的量化分辨率对应于量化信号元的量化分辨率。
48.根据权利要求47所述的介质,其中通过与量化函数交错的多个变换以及随后的可逆的映射函数实现所述去相关变换,该可逆的映射函数从根据量化函数Q量化的一组值{x}映射所述量化信号元,使得对于{x}中的所有x以及为实数的所有y,Q(x+y)=x+Q(y)和Q(-y)=-Q(y)。
49.根据权利要求48所述的介质,其中所述可逆的映射函数从在各自的组中具有相同量化分辨率的一组或多组均匀量化的值映射所述量化信号元。
50.根据权利要求48所述的介质,其中通过逆Hadamard变换实现所述多个变换中的每个变换。
51.根据权利要求46所述的介质,其中通过与量化函数交错的多个变换以及随后的可逆的映射函数实现所述去相关变换,该可逆的映射函数从根据量化函数Q量化的一组值{x}映射所述量化信号元,使得对于{x}中的所有x以及为实数的所有y,Q(x+y)=x+Q(y)和Q(-y)=-Q(y)。
52.根据权利要求51所述的介质,其中所述可逆的映射函数从在各自的组中具有相同量化分辨率的一组或多组均匀量化的值映射所述量化信号元。
53.根据权利要求51所述的介质,其中通过逆Hadamard变换实现所述多个变换中的每个变换。
54.一种传送装置可执行以执行在编码系统中用于信号处理的方法的指令程序的介质,其中该方法包括:
接收量化值的组,其中量化值的相应组包含足够的信息,根据该信息能够恢复信号的一个或更多段的不精确复制品,以及其中根据数量增加的量化值组能够恢复所述信号的一个或更多段的愈加精确的复制品;
根据所述量化值的组推导变换系数的组;
应用逆Hadamard变换于根据所述变换系数的组推导的值以产生相应的量化信号元的组以及在所述量化信号元的组内重新安排量化信号元,其中每组变换系数比相应的量化信号元的组更相关以及每组量化信号元表示信号的相应段,其中量化信号元是信号分量的量化表示,以及其中去相关变换;和
产生传送表示所述量化信号元的组的信息的一个或更多输出信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/312,230 | 2005-12-19 | ||
US11/312,230 US7536299B2 (en) | 2005-12-19 | 2005-12-19 | Correlating and decorrelating transforms for multiple description coding systems |
PCT/US2006/044346 WO2007075230A1 (en) | 2005-12-19 | 2006-11-16 | Multiple description coding using correlating transforms |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101371294A true CN101371294A (zh) | 2009-02-18 |
CN101371294B CN101371294B (zh) | 2012-01-18 |
Family
ID=37891736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800526415A Active CN101371294B (zh) | 2005-12-19 | 2006-11-16 | 用于信号处理的方法与用于信号处理的设备 |
Country Status (9)
Country | Link |
---|---|
US (1) | US7536299B2 (zh) |
EP (1) | EP1969593B1 (zh) |
JP (1) | JP4971357B2 (zh) |
CN (1) | CN101371294B (zh) |
AT (1) | ATE438174T1 (zh) |
DE (1) | DE602006008185D1 (zh) |
HK (1) | HK1120327A1 (zh) |
TW (1) | TWI395203B (zh) |
WO (1) | WO2007075230A1 (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101989425B (zh) * | 2009-07-30 | 2012-05-23 | 华为终端有限公司 | 多描述音频编解码的方法、装置及系统 |
EP2306456A1 (en) * | 2009-09-04 | 2011-04-06 | Thomson Licensing | Method for decoding an audio signal that has a base layer and an enhancement layer |
TWI413110B (zh) | 2009-10-06 | 2013-10-21 | Dolby Int Ab | 以選擇性通道解碼的有效多通道信號處理 |
US7932847B1 (en) * | 2009-12-04 | 2011-04-26 | Realtek Semiconductor Corp. | Hybrid coarse-fine time-to-digital converter |
US20110164672A1 (en) * | 2010-01-05 | 2011-07-07 | Hong Jiang | Orthogonal Multiple Description Coding |
US8886523B2 (en) * | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
TWI476760B (zh) | 2011-02-14 | 2015-03-11 | Fraunhofer Ges Forschung | 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法 |
JP5712288B2 (ja) | 2011-02-14 | 2015-05-07 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 重複変換を使用した情報信号表記 |
AR085218A1 (es) | 2011-02-14 | 2013-09-18 | Fraunhofer Ges Forschung | Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio |
SG192721A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
AU2012217269B2 (en) | 2011-02-14 | 2015-10-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
RU2586838C2 (ru) | 2011-02-14 | 2016-06-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодек, использующий синтез шума в течение неактивной фазы |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
AR085361A1 (es) | 2011-02-14 | 2013-09-25 | Fraunhofer Ges Forschung | Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio |
JP5890963B2 (ja) | 2011-03-17 | 2016-03-22 | 富士通株式会社 | データ保存プログラム及びデータ保存方法 |
RU2509437C1 (ru) * | 2012-07-17 | 2014-03-10 | Федеральное государственное унитарное предприятие "Государственный научно-исследовательский институт авиационных систем" | Способ формирования целочисленных ортогональных декоррелирующих матриц заданных размеров для прямого и обратного декоррелирующего преобразования видеоизображений и устройство для его осуществления |
RU2630370C9 (ru) | 2013-02-14 | 2017-09-26 | Долби Лабораторис Лайсэнзин Корпорейшн | Способы управления межканальной когерентностью звуковых сигналов, подвергнутых повышающему микшированию |
TWI618050B (zh) * | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
US9830917B2 (en) | 2013-02-14 | 2017-11-28 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
PL232466B1 (pl) * | 2015-01-19 | 2019-06-28 | Zylia Spolka Z Ograniczona Odpowiedzialnoscia | Sposób kodowania, sposób dekodowania, koder oraz dekoder sygnału audio |
US10395664B2 (en) | 2016-01-26 | 2019-08-27 | Dolby Laboratories Licensing Corporation | Adaptive Quantization |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6301222B1 (en) * | 1997-10-24 | 2001-10-09 | Lucent Technologies Inc. | Signal data transmission over lossy packet networks |
US6330370B2 (en) * | 1998-02-25 | 2001-12-11 | Lucent Technologies Inc. | Multiple description transform coding of images using optimal transforms of arbitrary dimension |
US6253185B1 (en) * | 1998-02-25 | 2001-06-26 | Lucent Technologies Inc. | Multiple description transform coding of audio using optimal transforms of arbitrary dimension |
US6345125B2 (en) * | 1998-02-25 | 2002-02-05 | Lucent Technologies Inc. | Multiple description transform coding using optimal transforms of arbitrary dimension |
US6198412B1 (en) * | 1999-01-20 | 2001-03-06 | Lucent Technologies Inc. | Method and apparatus for reduced complexity entropy coding |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6556624B1 (en) * | 1999-07-27 | 2003-04-29 | At&T Corp. | Method and apparatus for accomplishing multiple description coding for video |
SE0001727L (sv) * | 2000-05-10 | 2001-11-11 | Global Ip Sound Ab | Överföring över paketförmedlade nät |
EP1527607A1 (en) * | 2002-07-31 | 2005-05-04 | Koninklijke Philips Electronics N.V. | Method and apparatus for performing multiple description motion compensation using hybrid predictive codes |
US20040102968A1 (en) * | 2002-08-07 | 2004-05-27 | Shumin Tian | Mulitple description coding via data fusion |
ATE527591T1 (de) * | 2002-11-15 | 2011-10-15 | Qualcomm Inc | Vorrichtung und verfahren zur mehrfachbeschreibungscodierung |
KR100923297B1 (ko) * | 2002-12-14 | 2009-10-23 | 삼성전자주식회사 | 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치 |
-
2005
- 2005-12-19 US US11/312,230 patent/US7536299B2/en active Active
-
2006
- 2006-10-30 TW TW095140015A patent/TWI395203B/zh active
- 2006-11-16 AT AT06837671T patent/ATE438174T1/de not_active IP Right Cessation
- 2006-11-16 CN CN2006800526415A patent/CN101371294B/zh active Active
- 2006-11-16 EP EP06837671A patent/EP1969593B1/en active Active
- 2006-11-16 DE DE602006008185T patent/DE602006008185D1/de active Active
- 2006-11-16 JP JP2008547236A patent/JP4971357B2/ja active Active
- 2006-11-16 WO PCT/US2006/044346 patent/WO2007075230A1/en active Application Filing
-
2008
- 2008-09-30 HK HK08110892.0A patent/HK1120327A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
CN101371294B (zh) | 2012-01-18 |
EP1969593B1 (en) | 2009-07-29 |
JP4971357B2 (ja) | 2012-07-11 |
DE602006008185D1 (de) | 2009-09-10 |
WO2007075230A1 (en) | 2007-07-05 |
US20070150272A1 (en) | 2007-06-28 |
TW200729156A (en) | 2007-08-01 |
TWI395203B (zh) | 2013-05-01 |
ATE438174T1 (de) | 2009-08-15 |
EP1969593A1 (en) | 2008-09-17 |
US7536299B2 (en) | 2009-05-19 |
JP2009520237A (ja) | 2009-05-21 |
HK1120327A1 (en) | 2009-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101371294B (zh) | 用于信号处理的方法与用于信号处理的设备 | |
CN101199121B (zh) | 编码输入信号方法和编码器/译码器 | |
US7275036B2 (en) | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data | |
CN102150207B (zh) | 通过二维变换压缩音频比例因子 | |
Soman et al. | Coding gain in paraunitary analysis/synthesis systems | |
US7620554B2 (en) | Multichannel audio extension | |
CN1910655B (zh) | 构造多通道输出信号或生成下混信号的设备和方法 | |
CN101115051B (zh) | 音频信号处理方法、系统以及音频信号收发装置 | |
CN1860527B (zh) | 一种处理具有离散值序列的信号的设备和方法 | |
KR101679083B1 (ko) | 2개의 블록 변환으로의 중첩 변환의 분해 | |
CN101160619A (zh) | 适应性残余音频编码 | |
CN101878504A (zh) | 使用时间分辨率能选择的低复杂性频谱分析/合成 | |
US10403292B2 (en) | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation | |
CN106663432A (zh) | 对压缩的hoa表示解码的方法和装置以及对压缩的hoa表示编码的方法和装置 | |
US10194257B2 (en) | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation | |
Dragotti et al. | Optimal filter banks for multiple description coding: analysis and synthesis | |
US20080292028A1 (en) | Method and Apparatus for Signal Processing and Encoding and Decoding Method, and Apparatus Therefor | |
EP2293292B1 (en) | Quantizing apparatus, quantizing method and encoding apparatus | |
JP3475985B2 (ja) | 情報符号化装置および方法、情報復号化装置および方法 | |
CN101582259B (zh) | 立体声信号编解码方法、装置及编解码系统 | |
US9800986B2 (en) | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation | |
KR20210076134A (ko) | 서브밴드 병합 및 시간 도메인 에일리어싱 감소를 사용하는 적응형 비-균일 시간/주파수 타일링을 갖는 지각 오디오 코딩 | |
Ostergaard et al. | Perceptual audio coding using n-channel lattice vector quantization | |
Kovačević et al. | Multiple descriptions: Source-channel coding methods for communications | |
Mandridake et al. | Joint wavelet transform and vector quantization for speech coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |