CN102132494A - 通信方法和通信装置 - Google Patents
通信方法和通信装置 Download PDFInfo
- Publication number
- CN102132494A CN102132494A CN2008801287020A CN200880128702A CN102132494A CN 102132494 A CN102132494 A CN 102132494A CN 2008801287020 A CN2008801287020 A CN 2008801287020A CN 200880128702 A CN200880128702 A CN 200880128702A CN 102132494 A CN102132494 A CN 102132494A
- Authority
- CN
- China
- Prior art keywords
- msub
- vector
- mrow
- class
- root
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000004891 communication Methods 0.000 title claims description 49
- 239000013598 vector Substances 0.000 claims abstract description 387
- 238000013139 quantization Methods 0.000 claims abstract description 70
- 238000009826 distribution Methods 0.000 claims description 43
- 238000012545 processing Methods 0.000 claims description 40
- 230000015654 memory Effects 0.000 claims description 24
- 230000001131 transforming effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 description 36
- 239000011159 matrix material Substances 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 238000007906 compression Methods 0.000 description 12
- 230000006835 compression Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 239000010754 BS 2869 Class F Substances 0.000 description 8
- 238000013507 mapping Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000011664 signaling Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000017105 transposition Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000009977 dual effect Effects 0.000 description 4
- 238000005192 partition Methods 0.000 description 3
- 238000005295 random walk Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 description 1
- 241000284156 Clerodendrum quadriloculare Species 0.000 description 1
- 241000545744 Hirudinea Species 0.000 description 1
- 241000081385 Marchesinia Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- JXASPPWQHFOWPL-UHFFFAOYSA-N Tamarixin Natural products C1=C(O)C(OC)=CC=C1C1=C(OC2C(C(O)C(O)C(CO)O2)O)C(=O)C2=C(O)C=C(O)C=C2O1 JXASPPWQHFOWPL-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 235000019993 champagne Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004870 electrical engineering Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及一种方法和一种装置,用于对矢量量化数据进行高效编码和解码。该方法和系统探究如何对包含首类矢量的量化矢量空间进行细分,以及如何用首类根矢量集来表示首类矢量,并予以实施,以便提高编码和解码的速度,同时降低存储要求。
Description
技术领域
本发明涉及的技术领域包括通信和信号处理;更具体地,涉及用于进行球形矢量量化(SVQ)低复杂度数据处理的方法和装置。
背景技术
如今的通信在很大程度上是数字通信。这些通信都基于数字样本,在时间和幅值上都是离散的。上世纪70和80年代,模拟电话的数字化,音乐光盘(CD)取代黑胶唱片,这些都是体现技术从模拟通信系统发展到数字通信系统的有名的例子。之后还有一些例子出现,例如相继出现便携式数字音频播放器和数字电视广播,再一次体现了技术的发展。
对于模拟固定电话,模拟语音以电信号形式分布于电话线。模拟电话系统实现了数字化后,语音仍然以模拟电信号的形式从电话传输到运营商那边的交换机,然后,语音被数字化,以允许按照预定义的要求或标准对语音进行重建,从而避免模拟信号失真。为了用有限的位数实现所需的动态特性,语音信号在数字化之前进行了压缩,从而获得可供分发的数字信号。压缩器提供动态特性较小的信号,但这些信号本质上并不会损失,因为这些模拟信号可以在接收器中进行扩展。这种压缩包括A律压缩或μ律压缩。然后,信号在接收端被扩展。如今,也有一些固定电话系统是全数字化的。在本文中,压缩是指有损压缩或无损压缩。
就CD来说,时间上连续的声音的模拟样本被量化为固定位数(16位),不会对量化数据进行压缩。将声音样本限定为固定电平使数字样本与模拟样本之间出现差异。这种差异称为量化噪声或失真。由于量化电平的数量很大(216),因此,与大多数CD播放器或扩音器和扬声器的模拟部件产生的噪声相比,这种失真可以忽略不计。
携式音频播放器和视频广播要求减少进行存储或传输所需的位数,同时要求不使用需要大容量储备器或大功率的复杂设备来满足速度非常快(功耗也非常高)的计算机。如今,许多家庭都有便携式数字音频播放器和数字电视机顶盒,这是编码、存储介质(例如闪存)和计算能力等各方面的技术发展的必然趋势。存储在大多数便携式数字音频播放器的数字内容或者存储在数字电视系统或声音无线电系统中的广播都用有损压缩方法进行压缩。
通信信道可以包括诸如电磁存储器和电子存储器等介质,信号以电磁波的形式从发射天线传播到接收天线,或者以光信号的形式从光发射器传播到光信号接收器。
电话系统、CD、便携式数字音频播放器和电视广播均通过通信信道进行通信。固定电线是电话系统的通信通路;CD通过CD播放器从播音室向听众发送音频;便携式音频播放器使用闪存或其他存储介质;电视广播使用无线电信道。
R.M.Gray和D.L.Neuhoff在其合著的一篇名为《Quantization》的文章中(于1998年发表在《IEEE信息论汇刊》第44卷第6期,见第2325-2383页),从源头(始于1898年)开始追溯量化的历史,并研究了许多普遍和具有发展潜力的量化技术的基本原理。
Gray和Neuhoff将量化解释为“将一个量细分为多个离散的部分”。举例来说,任何实数都可以舍入到最接近的整数。在二进制计算中,整数通常用二进制数字序列(“位”序列)来表示,以此提供量化实数的二进制表示法。当然,也存在着一些其他的数据表示法。
量化和信源编码起源于脉冲编码调制(PCM)系统,该系统用于录制CD。参见图1,PCM系统主要由三个部件组成:采样器(11)、量化器(12)和编码器(13)。通过采样将连续的时域波形(14)转化为离散的时域波形(14)。通过对样本(15)进行量化使得量化过的样本(量化样本)(16)的值近似等于没量化过的样本(15)的值。量化过的样本或其索引通过编码器(13)提供的通信信道(17)进行传输。通过标量量化(SQ)时,每个(量化过的)样本都被独立编码成固定位数,然后相应地解码恢复出样本。由于标量量化存在一定的失真或重建误差,因此通常比矢量量化(VQ)需要更大的数据速率。
矢量量化(VQ)可同时对许多样本进行量化。在比特率不变的情况下,VQ的量化性能远远优于标量量化(SQ)。如果要量化k个连续的样本,VQ会使用k维分区或k维码本C,包含k维码矢(码向量);根据预设的条件(如最小欧氏距离),每个码矢表示失真度最小的一组矢量。为了方便理解,不妨将量化和编码看作是两个紧密相关的两个概念,甚至将其看作为一个概念,如图1中的虚框(18)所示。VQ优于SQ的地方是,前者在本质上可以充分利用要量化的源信号(例如,采样后的波形的离散时间序列)的存储器。因此,可以更有效地表示源信号(例如语音信号或图像信号,其不同样本之间通常具有记忆性或相关性)。此外,VQ本身也有很多优点,但最主要的,是在比特率一定的情况下,从失真方面来说,VQ要比SQ好。就现有技术来说,这一进步的代价使系统变得更加复杂,尤其体现在编码器上。
图2显示了矢量量化的简化方框图。信号序列(285)用矢量(281)表示,包含矢量的信号(286)映射到对应于码本的一个表示法或码字(即码矢)的索引(287),从而根据预定义的标准(例如,欧氏距离)对矢量(286)进行失真度最小的编码。要表示的矢量(288)以及量化矢量或其表示形式(289)可以在确定最小失真度的实体(282)与包含码本表示法(283)的实体之间互换。在信道的输出端口(接收端),通过使用类似的码本并查找收到的索引所表示的码矢来获得重建矢量。
本质上,通过通信信道进行传输需要使用各种技术设备,用以将信号从信源发送器发布或传送到目的地,如图3所示。表示编码索引(34,35)的序列通过通信信道(32)传输到目的地,继而在接收器(33)中被解码。从信源编码和信源解码的角度看,可以将通信信道用于进行信道编码,以便在传输信道上传输或检测误差。但实际上,参与信源编码和信源解码的信道编码器和信道解码器分别包含在发送器和接收器中。因此,从信源编码的角度看,通信信道(32)通常也包含发送器和接收器的部件。
在低比特率的情况下,从率失真(rate distortion)的角度看,一种设计矢量量化器的好方法是,通过调整矢量量化器,使之与给定的输入源(例如,训练序列)特性相适应。图4所示的流程图用于根据广义Lloyd算法(通常称为LBG算法,因为是由Y.Linde A.Buzo和R.Gray研究得出的)以迭代方式确定码本Y。这种算法的初始化(41)包括初始化计数器m、初始码本Y0、(本申请文件适用应用范围内的)最大可能失真度D-1以及精确度ε。对于每次迭代m,会为码本Ym确定分区Sm,Sm定义了码本的各个码矢周围的信元(42),并确定失真度Dm(43)。如果相对失真度小于最初设定的精确度,这种算法将会中断(44)。如果相对失真度大于预设的精确度ε,则对码本进行改进,更新迭代计数器(46),以及对另一次迭代重复同一过程,该过程从确定改进后的码本分区(42)开始。
外界普遍认为LBG算法是一种需要大量计算的算法,因为在有大量量化电平的情况下,这种算法需要很多指令。最初选择的码本(41)对这种算法也有影响。此外,训练矢量量化器通常也被认为占用了过多的只读内存(ROM)。LBG算法的另一个问题是,需要经过训练才能使特定训练数据序列的失真度降至最小。如果对来自统计特性明显不同的另一个来源的数据进行量化,那么性能通常都是次优的。对于一维矢量,LBG量化器会变成性能较低的Lloyd-Max标量量化器。
对于高比特率,给定一个特定的输入信号的统计数据(基于从输入信号的概率密度函数(PDF)中计算得到的点密度函数),VQ理论提供了一种创建失真度最小的码本的方法(以欧氏距离或欧氏距离平方等为标准)。结构化码本不会利用线性或非线性相关性来提高矢量量化器的量化性能。但是,至少可以通过线性预测或变换编码的方法来改变线性相关性,从而提高量化性能。因此,结构化矢量量化器用于无记忆信源时具有较高的性能。
点阵矢量量化器是一种特殊的矢量量化器,其码本由根据数学法则排列成规则点阵的矢量组成。当矢量量化器的维数Lv=1时,便成为均匀标量量化器——这就是一种简化的点阵量化器。高阶维数的点阵能从更有效率的空间填充中受益。换句话说,如以下式所示,点阵Λ包含Lv维矢量空间里的所有矢量:
其中,□表示整数,表示Lv实数元组。矢量v=[vi,0,vi,1,...,vi,Lv-1]是点阵的基矢量,所有点阵矢量都是这些基矢量的线性组合。因子λj(用于对每个基矢量进行加权)是整数。一般来说,点阵是Lv维矢量空间的子集,但包含可数无限个点。
式2
加权因子λi的数量LL决定点阵的自由度,也被称为点阵的维数。LL可大于或小于Lv。大多数情况下,点阵的维数等于在其中定义基矢量的矢量空间的维数,即LL=Lv。
如果点阵的维数等于码矢空间的维数,则式1相当于一个包含生成矩阵M的表示形式,如下所示:
其中,因子λj仍然是整数加权因子,Lv是矢量空间的维数。如果多个矩阵中的点根据式3中所有λ因子以相同的方式分布,那么,这些矩阵都是同一个点阵的生成矩阵。
点阵的其中一个生成矩阵如下:
点阵的另一个生成矩阵如下:
在图5中,上述二维六角点阵的另一种可选的等价定义A2如下如下所示:
Jacques Martinet编著的《Perfect Lattices in Euclidean Spaces》一书中(2003年德国柏林施普林格出版社出版,见第110-114页),定义了现有技术条件下的点阵,例如,六角点阵及其对偶点阵棋盘点阵及其对偶点阵以及Lv是任意维数的整数矩阵在下文中,星号这个印刷符号除了用来表示对偶点阵外,也将会用于其他用途。
其他众所周知的点阵包括Gosset点阵E8、Coxeter-Todd点阵K12、Barnes-Wall点阵L16和Leech点阵L24。
wl是与实数值μl相关的加权因子,且是实数值μl,0≤l<LP出现的次数。
以下显示了一个倒转序列顺序的转置矢量:
转置处理最好在针对所需转置进行过调整的数字信号处理器(DSP)中进行。高速应用程序可能要求在硬件中实施转置,例如可以通过移位寄存器电路之类的硬件来实现。倒转序列顺序的其中一种方法是,按分量顺序在与矢量等长的移位寄存器中存储矢量分量,然后按相反顺序输出移位寄存器中的内容。图6说明了这种方法,图中的移位寄存器由多个D型插销组成(601-603)。要倒转的矢量在一系列时钟周期期间通过闭合的开关(605-607)输入到(604)移位寄存器,在这个过程中,矢量的分量一个接一个输入到移位寄存器。整个矢量都转移到D锁存器(601-603)后,之前闭合的开关(605-607)会打开,而在将矢量转移到寄存器的过程中打开的开关(608-610)会闭合。在接下来的时钟周期,会按与移入时相反的顺序将分量从移位寄存器(611)中移出。实际上,图6中的移位寄存器可以替换为记忆电路或存储介质,以便信号处理器控制数据存储情况。对应的处理过程包括以下步骤:将矢量分量存储在存储器或存储介质中,然后按与分量顺序相反的顺序读取存储器或存储介质中的内容。
在给出一个首类矢量以及对应的加权因子wl的情况下,可能转置次数的计算式如下:
NP是多项式系数。要在所有可能的转置中确定其中一种转置,一种有效的做法是用矢量索引iP(0≤iP<NP)来描述和理解编码过程以及码矢映射过程。由于所有转置矢量都是由相同的坐标值按不同的顺序组成,因此,码矢的绝对值(或者说,码矢的长度)对于所有转置矢量都是一样的。通过使用矢量索引,可得出:
量化过程的另一个问题与压缩有关,或者说,如何用较少级的表示方法来表示各个矢量,以使因压缩造成的信息丢失而引起的误差减少至可接受甚至不会被用户注意到的程度。可通过如下方式得出基于一个转置码(实现最小欧氏距离)的首类矢量的矢量x的一种表示法。对于维数为Lv的矢量x,要(进一步)被量化或压缩,对矢量坐标进行转置,以使转置矢量的各个分量按降序排列所需的转置用矩阵Px(x*=Px·x.)表示。进行了排序的矢量x*用式7中指定的首类矢量来表示,其分量按照大小进行排序。
为了从x*重建x,对上述过程进行逆操作:x=(Px)-1·x*.。矩阵P=(Px)-1也为要被量化或压缩的矢量x提供最小欧氏距离的表示形式
为了进行压缩,需要为矢量代表确定矢量索引iP。可以通过索引映射转置来确定矢量索引,首选方法是使用J.Pieter和M.Schalkwijk建议的映射。
这种映射会将转置矢量变换为索引iP。解码器可实现与上述过程相反的操作,它将索引iP映射回到与原始转置矢量对应的转置矢量因此,转置矢量与索引iP之间形成了一对一的映射关系;索引iP以一种适合传输、存储或进一步处理(例如,对于信道编码)的方式来表示转置矢量简而言之,该索引适用于通过通信信道进行传输。索引数量|IP|等于可能转置的次数NP(参考式11)。
《专利号为4075622的美国专利》介绍了一种数据压缩方法及相关的装置,这种方法利用由输入的二进制信源序列引导的帕斯卡三角(杨辉三角)内部的随机游动。这种随机游动从帕斯卡三角的顶点开始,根据一种算法继续向下游动,直至到达一条特殊的分界线;这条分界线使每个信源序列的编码都可以用固定的位数来完成。
《专利号为6054943的美国专利》介绍了一种可变区块大小通用多层数字信息压缩方法,这种方法利用帕斯卡超体积(这是帕斯卡三角的多维广义化)内部的随机游动。码字和经过解码的信源序列可以分别在编码器和解码器中进行编码/解码时确定,也可以通过预计算或事先存储的方式来确定。信源符号的变长序列被编码成定长码字区块。流程图显示了内置专用硬件(包括寄存器、计数器和锁存器)的编码器和解码器。专利号为US6054943的文件中,图26以图表形式显示了一个三元信源序列的编码(和解码)过程。根据该信源序列,会为每个输入的信源符号选择一个特定的候选项前缀,并会动态更新和值。符号序列的和值(rs)的终值至少对应于一个索引或码字的一部分,其计算式如下:
其中,jk∈[0,m-1]是在阶段k时的输入符号,是对全部n个输入符号的求和,wi k是在经过k个阶段后获得的符号数量(i∈[0,m-1])。通过递归的方式对每个要编码的输入符号进行内部求各,以确定外部和值。编码过程在帕斯卡超体积的某个点终止。该点是添加上去的,作为解码器的起点前缀,以指明应从帕斯卡超体积的哪个位置开始追溯。专利号为US6054943的文件还建议添加可实现未编码传输的前缀,以避免某些序列出现编码器膨胀(encoder expansion)现象。编码时,用于确定输入符号j的动态和值的递归式如下:
其中,oldPos是指该符号在帕斯卡超体积中的旧的位置。下一次迭代后,符号在帕斯卡超体积中的位置也会同样以递归方式进行更新,如下所示:
l←l+1, 式16
其中,l表示已输入的符号的数量。
用于进行解码的递归式会计算通过帕斯卡超体积的路径,以便选择符号j;该符号可提供不大于帕斯卡超体积中对应位置的候选成分的位置。在专利号为US6054943的文件中,用于逆向计算动态和值(对码字的位置l进行解码)的递归式如下:
解码下一个位置的相关递归式如下:
l←l+1, 式19
Khalid Sayood编著的《Introduction to Data Compression》一书(第二版,2000年出版,见第290和291页)首次介绍了球形矢量量化器。对于高斯概率分布,恒定概率等高线是二维圆形。在二维条件下,可以通过将输入矢量转变为包含半径r和相位θ的极坐标来对其进行量化。极坐标覆盖的空间与笛卡尔坐标(直角坐标)的相同。可以分别对r和θ进行量化,也可以将r的量化值用作θ的量化器的索引。与要依赖r的量化来对θ进行量化的量化器相比,分别对r和θ进行量化的好处是可以降低复杂性。在介绍标量量化器时已经说过,不充分利用区块内的相关性会降低量化性能。
Jon Hamkins在其一篇名为《Design and analysis of spherical codes》的论文(撰写于1996年,是Jon Hamkins在利诺伊大学厄本那-香槟分校攻读电气工程博士学位期间的毕业论文之一)的第2章中,简要定义并介绍了根点阵Ak、Dk、E8和Zk及其对偶点阵,这些根点阵与某些李代数(Lie algebras)的根系统相关。Hamkins还将码本定义为一组形成码点或码矢的输出点或输出矢量。他将k维球形码定义为□k中一组数量有限的点,这些点位于k维单位半径球形Ωk上,如下所示:
在论文的第6章中,Hamkins将包装的(wrapped)球形码定义为适用于无记忆高斯信源的矢量量化器,并在表6.1中提供了对一个编码器的算法描述——这种算法分别对矢量的增益和形状进行量化,增益对应于矢量的长度或半径,形状对应于归一化为1的矢量。增益码本用Lloyd-Max算法进行优化。由于PDF(概率密度函数)已知(高斯信源),因此无需进行训练。Jon Hamkins和Kenneth Zeger合著的《Gaussian Source Coding with Spherical Codes》(于2002年发表在《IEEE信息论汇刊》第48卷第11期,见第2980-2989页)也包含该算法描述。
发明内容
在现有技术条件下,往往要用大量首类矢量(class-leader vectors)来表示源数据(例如语音),因此,在数字通信设备中需要很多存储设备来存储进行编码和解码时的表示信息(如码本)。大量的首类意味着在编码过程中需要很多时间来确定码矢,以便尽量降低失真度。
引用的文档均没有提供量化方法/系统或编码方法/系统;在这当中,符合规范的度量值或失真度通过E点阵中缩减的码矢集合来确定,其中,根据规范,一个信号、或者码矢或码字(使用矢量记法)用于对一个未量化的输出信号或矢量进行输出;其中,E点阵通过符号分布与码矢的(全)集合相联系。
在通信领域,尤其是在当今的数字通信领域,要提供能够满足不断提升的速度传输日益大量的数据的通信资源,同时提供更加廉价的通信服务,是一件很具挑战性的事。要使向大众提供数字通信在经济上和技术上都可行,其中一个关键因素是对数据进行高效量化以实现高效信令。众所周知的一些通信实例包括,移动电话系统中通过语音编码和语音解码可实现语音通信;对声音进行编码存储为歌曲,在声音重建(播放时),通过便携式音频播放器或环绕音箱设备对声音进行解码来播放电影插曲或其他多声道的音频,其中,这些音频数据通常存储在DVD或CD中,或者也可以通过有线或无线的方式从公共广播公司接收);以及数字电视采用图像编码和图像解码。
通信领域未来发展面临的挑战是,如何降低特定代码的复杂性或存储要求,或者如何保持代码目前的复杂性或存储要求,同时允许更为复杂的编码原理;此外,需要提高编码和解码的效率。
因此,本发明实施例的其中一个目的是,令使用一组首类矢量表示特定代码时的处理要求或存储要求与目前相比有所降低。
本发明的优选实施例的其中一个目的是,减少用于确定量化输出的码矢集合的数量,同时获得像用整组码矢时一样的衡量标准/失真度和输出。
本发明实施例的另一个目的是,在不增加编码器或解码器的费用或复杂性的前提下,实现更复杂的编码和解码。
本发明实施例的又一目的是,允许对受特定的区块长度(与矢量空间中维数的矢量概念相对应)影响较小信号进行量化或编码。
本发明实施例的其中一个目的是,通过对码本进行细分以提供信号或信令表示,以便用适合存储在电子介质、磁介质或光存储介质中的(少量)矢量以一对一的方式来表示首类
本发明优选实施例的另一目的是,提供适用于使用通信信道的通信的关联索引。
本发明提供了一种方法和系统来细分矢量量化编码器或解码器的一组首类矢量;矢量量化编码器/解码器的作用是对通信数据进行编码/解码,以及映射相应的数据(在后面有关编码和解码过程的部分中有详细介绍)。
附图说明
图1为现有技术的一个采样器、一个量化器和一个编码器原理图;
图2为现有技术的矢量量化的简化方框图;
图3为采用现有技术的通信信道传输示意图;
图4为根据现有技术条件下的广义Lloyd算法以迭代方式确定码本的流程图;
图5为一个采用现有技术的二维六角点阵示意图;
图6为现有技术的移位寄存器的方框图;
图7为采用现有技术的一个半径和一个法矢的并行量化的基本方框图;
图8为本发明实施例一个半径和一个法矢的串行量化的基本方框图;
图9为本发明实施例的一种码矢分布方式示意图;
图10为本发明实施例一个高效量化过程的流程图;
图11为本发明一个简化实施例中对应于根矢量类的等价类的子范围;
图12为本发明实施例中一个索引的流程图;
图13为本发明实施例的量化的基本流程图;
图14为本发明优选实施例确定变换的失真度度规的简化流程图;
图15为本发明实施例通过量化数据提供码字的索引流程图;
图16为本发明的一个优选解码器的流程图;
图17为本发明A类码矢的优选索引处理过程流程图;
图18为本发明B类码矢的优选索引处理过程流程图;
图19为本发明一种设备的简化方框图。
具体实施方式
一般来说,基于结构化码本的矢量量化器在实际应用中可使内存要求、计算复杂性与量化性能之间获得平衡。对于给定的输入信号概率分布函数(PDF),其理论上最佳的码矢密度函数可以通过结构化码本(例如,点阵码本和转置码本)准确地估算出来。这些码本并不是全都存储在存储器中,可以根据本发明对其进行高效搜索。
使用结构化码本需要对概率分布函数(PDF)有一定的了解。假设音频信号的某些(统计)特性是无用的,最好进行最差情况假设,这样,即使对于最难以量化的信号,设计的VQ仍具有良好的性能。在所有信号特性中,高斯噪声具有最高微分熵。因此,根据最差情况假定法,最好将用于音频编码的量化器设计成对于高斯信源具有良好的性能。
球形矢量量化(SVQ)是一种可以准确估算高斯分布的最佳码矢点密度的量化方法,而且可以高效地实现。因此,如果设计适当,获得的与SVQ相关的信噪比(SNR)将会独立于输入信号的PDF,并能获得一个很大的动态范围。
在量化过程中,代表输入信号矢量x的一个示例输入信号被变换成一个代表矢量x的信号,其中,矢量x的半径Rx=||x||,法矢(normalized vector)c=x/Rx。半径和法矢分别使用码本和进行量化,得到量化半径和量化法矢在下文中,是指球形码矢,是指球形矢量的码本。如果使用对数量化法(例如,电话系统中用于PCM压缩的A律量化)来量化半径,则量化信噪比(SNR)将会独立于输入信号的概率密度函数,这也称为对数SVQ。
其中的量化输入信号矢量如下:
图7显示了一个半径(72)和一个法矢(73)的并行量化的基本方框图。其中的半径和法矢是分别进行量化的。功能模块(71)(用于将半径和球形矢量分离)以及量化器(72)和(73)最好都位于一个编码器实体中,合并实体(74)则最好位于一个解码器实体中。合并实体(74)输出矢量的用一个输出信号表示,输入矢量x用一个输入信号表示,输出信号是输入信号的重建值。为了简单起见,这个图没有包括用于确定索引的处理装置。承载着对应于索引的码字的信令最好通过通信信道来传输。相对应地,本发明最好包括用于确定索引的处置装置。
图8显示了一个半径(82)和一个法矢(83)的串行量化的基本框图。对于并行量化,功能模块(81)(将半径和球形矢量分开)以及量化器(82)和(83)最好位于一个编码器实体中,合并实体(84)则最好位于一个解码器实体中。与并行量化相反,在进行串行量化时,半径量化是在法矢c量化之后执行。这样,允许将量化信元的曲率考虑在内,这对于大的信元尤其有效。尤其是在低比特率的情况下,串行量化法的性能比并行量化法要高一点。合并实体(84)输出矢量的用一个输出信号表示,输入矢量x用一个输入信号表示,输出信号是输入信号的重建值。这个图没有包括确定或的索引的过程。与并行量化相似,编码器最好包含用于确定一个或多个索引的装置。包含对应于索引(而非对应于量化矢量)的码字的信令最好通过通信信道来传输。
图9显示了一种码矢的分布,图中黑点(91)、(92)和(93)表示球形量化的码矢,量化信元(cell)(94)和(95)对应于Lv=2和信号矢量x=[x0x1]的并行量化。码矢位于球形表面上,在二维条件下,球形是圆。在不同的圆上,码矢的半径有所不同。
有各种编码方法来表示量化矢量(码矢)。标量半径量化器QR((72),(82))最好通过使用查找表的电路来实现,因为量化和重建级别的数量通常是有限的,因此,需要存储的条目数量不大,尤其是在采用对数量化法的情况下。对于图8中的串行量化器,实现量化过程的其中一种方法是,使用根据一个包含所有区间界的表采用二等分的处理电路。量化器的循序组合称为半径的再量化。
将量化矢量(码矢)表示为码矢的索引iQ表示在解码器中重建码矢所需的足够的信息。以对数SVQ为例,有两个索引,iQ,R和iQ,sp,分别对应于为半径和量化法矢所选的量化重建级别。在本发明中,有两种方式可将这两个索引合并成一个索引。第一种方式是优选方式,因为这种方式使用通信信道进行传输时产生的信道误差较小。这两种方式如下:
iQ=iQ,R·Nsp+iQ,sp和 式23
iQ=iQ,sp·NR+iQ,R, 式24
其中,Nsp是法矢的码矢个数,NR是半径的可用量化器重建值的个数。
根据本发明的一个实施例,Gosset低复杂度矢量量化器是基于从著名的Gosset点阵E8得出的一个点阵中的码矢。E8点阵在八个维度具有最高的可能点密度。本发明在基于广义Gosset点阵(E点阵)进行编码和解码时会具有一些优点,可在计算复杂度和内存/存储要求方面提高效率。
Gosset点阵最初设计为八维(即,Lv=8)。为了不使本发明局限为Lv=8,在本发明中,E点阵(后面将会进一步介绍)从Gosset点阵被广义化为Lv等于任意维数的点阵,如下所示:
其中,
是维数Lv等于E点阵的维数的棋盘点阵(又称为D点阵)。通过公知的模运算得出余数,即模2表示除以2时得到的余数。
E点阵的有效比特率为
其中,是位于半径等于的壳层上的码矢数。位于的各个壳层上的码矢数取决于半径以及特定的E点阵。表1列出了常见的Gosset点阵E8的码矢数与半径平方的半值。相对应的,该表中还包括表征壳层的各个码矢的有效比特率。
如果给出球形码本的特定每样本有效目标比特率reff,sp,,便可在构建码本时逐一研究所需点阵中半径依次增大的壳层,从半径最小(如自然数u最小)的壳层开始。码本最终以壳层usp为基础,包含尽可能多的码矢,这样每个样本的有效比特率不超过每个样本有效目标比特率,如下所示:
表1:GOSSET点阵各个壳层上的码矢数。
为了简单起见,根据以特定E点阵为依据的发明用于进行编码和解码的码本也由特定壳层或其半径平方的半值usp指代。
在矢量坐标互换过程中,E点阵不变。所有球形码矢都可以分组到数量为的等价类Em中,其中m=0,1,...,假设给定的首类矢量为那么每个等价类都包含转置码Pm生成的矢量。因此,球形矢量码本可表示为转置码Pm的个码本的叠加,如下所示:
表2列出了与半径平方半值u=1,2,...,10的各个壳层的球形码本相关的相应等价类数量。
将E点阵球形码本分解成等价类并对转置码进行量化后,根据本发明可得出一个如下所示的高效量化过程(另见图10的流程图)。
对于要量化的法矢c,会确定对应于转置矩阵Pc的重排序,以便在将该矩阵应用于法矢c时,矢量的坐标会按降序(101)重新排列。转置矢量c*=Pc·c如下:
其中,
首类矢量通常预先存储在只读存储器或其他存储介质中。根据所有首类矢量(m=0,1,...,),处理电路可以从存储的首类矢量以外的个等价类中搜索并选择(102)一个候选项该候选项可根据预定义的标准(例如,最小欧氏距离平方)使(未量化的)矢量c*的失真度减至最小,如下所示:
用于表示c的优选球形码矢通过处理首类矢量代表来确定(103),对应于逆置换矩阵P=(Pc)-1的应用过程。因此,确定用于表示法矢c的球形码矢如下:
在数字信号处理装置中,量化矢量被映射(104)到码字(或者说,索引)iQ,sp。最好通过将Schalkwijk算法(本领域中的一种公知的算法)应用于本发明下文中的特定代码来实现这种映射。
如果置换码多于一个,在所有可能的索引范围内(iQ,sp∈[0,Nsp-1]),以四个等价类的情况为例,确定对应于等价类E0、E1、E2和E3的子范围(111)、(112)、(113)和(114)的过程如图11所示。这四个子范围并不统一。优选地,子范围(111)、(112)、(113)和(114)分别存储对应的索引偏移 (如图11所示,其中),以便加快编码或解码的速度,从而不需要通过通信信道进行传输。
下面简要介绍了确定索引iP的过程。对于索引范围IP,索引数量为NP,假设那么需要确定剩下Lv-1个坐标(与特定值μl关联)。剩余子矢量的可能置换次数用公式11中的置换次数以及经过调整的加权因子计算出来,其中,
这些子范围进一步细分成更小的子范围,最后将剩下一个索引。
图12以流程图形式说明了上述其中一个索引(用于对序列进行编码以便在通信信道进行通信)的生成方法。包括:初始化索引(121),其中wt(·)表示特定符号的权值或出现次数;确定输入符号的范围(122),并根据对应子范围中的索引数量之和对索引进行更新(123)。更新权值(权重因子)(124),继续对下一个输入符号执行递归过程(125),直至码矢的最后一个Lv符号被编码(126)。索引将会在最后一个递归过程中生成(127)。
本发明实施例中,在许多情况下,会涉及大量等价类,具体取决于维数和球半径等参数。如表2所示(仅为其中一种情况),当u=10时,等价类数量为162。对于此类情况,在量化过程中如果使用常规方法强行(Brute-Force)实现,往往需要很多内存(所需的字节数)和很强的计算能力(每秒运算次数)。
表2:GOSSET点阵各个壳层的等价类和根类的数量。
本发明实施例提供了一个优选实施例,本发明实施例中的量化器可在根类Fm′中对等价类Em进行分组,大大降低了对量化装置的要求。对于半径u=10的情况,Gosset点阵的等价类数量从162减少为11(减少了超过10倍),使得在相同数量级的情况下载荷有所减少,同时可提供与等价类没有减少时完全相同的码字和失真度(如在最小欧氏距离方面)。
对于根类的定义,应考虑两类码矢,分别为A类和B类。A类矢量位于中,符合式26中的要求,B类矢量位于中,符合式25中的要求。考虑A类球形码矢并将其表示为如果改变单个坐标位置(例如,位置j0)的符号,得出的矢量也是A类矢量,因为
且矢量的半径将保持不变。
根据本发明,会定义码矢的符号奇偶校验和。
其中,
研究证明,每个首类矢量都可以从首类根矢量构建,其中, 是根类Fm′的数量,每个根类包含一个首类根矢量这样做的其中一个好处是,实际操作中,大多数基于E点阵的代码所需的码本大小可以显著减少。此外,编码复杂度也有所降低,因为在编码过程中无需搜索所有首类矢量。根据本发明,最好搜索首类根矢量。在本优选实施例中,因为要搜索提供最小失真度的B类矢量,因此计算量略有增加。
与式7中的首类矢量类似,首类根矢量可如下表示:
对于B类首类根矢量,会考虑成对分量的可能符号置换次数,以便保持符号奇偶性。因此,符号偶校验和符号奇校验的符号置换次数分别是
表2还列出了Gosset点阵E8的各个壳层的根类数量。
为了说明如何从首类根矢量构建首类矢量,表3列出了半径为2(u=2)的壳层的首类矢量。
表3:首类根矢量和对应的首类矢量(U=2)。
在点阵矢量量化的应用中,会限制码矢的数量,且只考虑使用根据点阵规则构建的有限数量的矢量。
上述本发明一些实施例可以大大减少了量化过程的计算量。
一般来说,点阵矢量量化器非常适合用于进行量化,这其中的另一个原因是,不需要存储任何显式码本,而是可以根据生成矩阵等来确定显式码本。如果是用点阵生成码本,码本就能够被结构化,这有助于加快搜索码矢的速度。简而言之,点阵矢量量化是一种高效的量化方式。
图13显示了根据本发明实施例的量化的基本流程图。对于要量化的矢量x,最好归一化为半径等于1的矢量c(131),以便简化后续处理。(法)矢量的每个分量分配给相应的幅度和符号,以形成幅度矢量和符号矢量(132),如下所示:
对幅度矢量进行转置,以便按降序排列分量,如下所示:
符号矢量会相应地被转置(133),如下所示:
通过使用分量顺序记法,被转置的幅度矢量也可以表示为:
度量值通常被看作是要最大化的数量。但在本发明说明书中,度量值是指要最小化的数量,类似于距离。唯一的差异体现在符号上。负距离将被最大化,而正距离将被最小化。优选地,为每个与转置过的幅度矢量相关的首类根矢量确定失真度度量值Dm′(首选为欧氏距离),如下所示:
像式33和34一样,作为式53中所示的失真度的替代,可以将相关性最大化。同样,可以最小化负相关性,因为式53中的失真度测量式如下:
其中,是对应于矢量和的长度的常数。对于法矢和 等于2。后续处理取决于所选的首类根矢量属于A类还是B类;最初确定的失真度Dm′在某些情况下需要进行变换,以便与首类矢量的失真度对应(135)。选择可实现最小失真度(经过变换)的首类根矢量,用于输出量化处理的结果(136)。
图14以简化流程图形式显示了确定变换后的失真度度量值的过程。对于A类首类根矢量(141),其与等价类Em′相对应,且在式53中最小化失真度。最小失真度的首类矢量通过转置符号矢量的符号分布(与首类矢量的符号分布相同)来确定。在此情况下,首类矢量的失真度与A类首类根矢量的失真度相同(142)。因此,无需像对首类根矢量一样为A类矢量确定失真度变换(142),因为
对于B类首类根矢量(表示为),要考虑两种情况,具体取决于转置符号矢量和首类根矢量的符号奇偶性。如果符号奇偶性相同(143),则不需要对计算出的失真度进行变换(142),因为该失真度是各个首类矢量都可以实现的最小失真度,因此,
式58
情况,则m′=m′Q。
如上所述,采用通信信道进行信息传输时,最好使用一个或多个索引,而不是码矢。为此,本发明实施例给出了一种索引装置和相关的处理流程,超越了Pieter和Schalkwijk前期研究成果。
154、如第26页的式36所示,根据转置矩阵Pc确定量化索引码字:
其中,法矢c的转置矩阵Pc(可从Pieter和Schalkwijk研究出的索引编制方法得出)会取代式36中的P。会根据所需的等价类设置偏移量并将其集成到索引iQ,sp中,以便用通信信道进行通信。图11显示了一些根矢量类的索引范围分组。在图11中,根类F0(115)表示等价类E0(111)、E1(112)和E2(113),根类F1(116)对应于等价类E3(114)。等价类偏移量和同时也分别是根类F0和F1的偏移量。最好将等价类偏移量 和存储在只读存储器中。
根据本发明的一个实施例,首类矢量的索引编制以式52中的符号矢量为依据。式51中的索引编制最好以类似的方式执行,但不一定要采用二进制,而则必须采用二进制。对于B类首类矢量,最好对带有调整后的位置j0(如式59中所示)的符号矢量编制索引。
根据本发明的优选实施例,通过利用符号分隔和奇偶性约束,用一个首类根矢量而不是多个首类矢量来表示码字,这大大降低了复杂度。相应地,本发明的优选实施例只会为可实现最小失真度的码字搜索一个等价根类,而不会搜索多个等价类,从而减少了矢量搜索次数。
本发明实施例中,等价类E(与一个等价根类F相关)基于幅值相同但符号不同的矢量分量。对于等价根类F,需要在解码器中确定其中一个等价类,以获得有关符号分布的信息。
最好通过对等价根类进行索引比较来确定所需的等价类,等价根类的索引范围对应于一个或多个等价类的索引范围,如图11所示。
对于输入的矢量量化索引iQ,sp(优选地结合存储的偏移量),确定已由编码器识别的首类根矢量以及用于标识等价首类的对应的符号分布索引。消除偏移量后,将得到的索引iP输入到解码器中,最好按照Schalkwijk和Pieter的建议进行操作。根据首类根矢量和指示负矢量分量的符号分布,可得出解码器确定等价首类所需的相关信息。
对于所有首类根矢量,权值wl和幅值μl,0≤l<LP在存储时最好不要使用符号;然后,解码器从接收到的解码过的索引的符号分布中,根据式59中的符号调整来修改/调整这些值,以产生一个特定的首类矢量。会相应地调整权值wl。在根据Schalkwijk和Peter建议的解码过程中,最好包括得出的权值(为了简单起见,这些权值在图16的流程图中显示时省略“(adj)”)和幅值,如下所示。
权值和幅值成对显示为wl,μl。如上所述,索引iP包含有关幅值在矢量中的组合顺序的信息(称为首类矢量的转置)。图16的流程图中的序列显示了如何排列和的序列,包括调整过的符号。除了经过调整的符号外,一旦知道序列lc,便可如下确定输出码矢
图16显示了根据本发明的一个解码器的流程图。索引偏移量存储在接收每个等价类(图11(111,112,113))的接收器中。如图11所示,这些偏移量的其中一些同时也是特定根类(115,116)的索引偏移量。此外,某个根类(115)的特定偏移量对应于一个等价类和符号分布(111,112,113)。存储的根类(115,116)偏移量根据收到的索引确定特定根类(115,116)。存储的偏移量确定对应于特定符号分布的特定等价类。将确定后的等价类变换成符号分布。根据得到的符号分布(1602)对权值进行调整,最好从收到(1601)的索引中减去索引偏移量,以便形成残差索引(1602),iP,用于根据Schalkwijk和Pieter提出的原理进行处理。
初始化了值μl和权值wl后(1603),对于对应于偏移量或索引范围的首类根矢量的预存值(l∈[0,LP-1]),会确定一个范围(1604),以便对于某些m∈[0,Lv-1],会有一个lm满足以下条件:
其中,是式38的索引子范围(为方便印刷,省略了中的~)。根据已确定的范围和索引给量化后的码矢分量分配(1605)幅值,并通过减去(1606)之前确定的量和更新权值(1607)来更新索引。对下一个分量执行类似的递归过程(1608),直至确定所有矢量分量(1609)并得出幅值、权值和码矢。
编码器和解码器最好存储权值wl、幅值wl以及模式或类别标志M,这个标志指明代码的每个首类根矢量属于A类还是B类。此外,最好至少为B类首类根矢量存储符号奇偶性标志该标志指明二进制符号矢量的奇校验或偶校验。
如有必要,通过通信信道将符号σl(指明将首类根矢量变换成首类矢量所需的负符号数量)的分布从编码器传输到解码器。
举例来说,对于长度为5的矢量,应考虑使用带有一个非零幅值2,权值为3,且带有一个负符号的首类根矢量。对于分量为[22200]的首类根矢量,首类矢量的分量为[2200-2]。需要记住的是,首类矢量的分量按降序排列(参加式7)。
再举例,将权值分布w0=3,w1=2和符号分布σ0,σ1纳入考虑范围。对应于w0=3的三个位置有4种可能的符号分布。
对应于w1=2的两个位置有3种可能的符号分布。
因此,这五个位置一共有12种不同的符号分布。然后,可以根据例如w1对索引子空间进行细分,以使整数倍数3对应于w0位置的另一种符号分布。
当然,以上只是为了说明而列举的一个简单例子。大多数代码都有两个以上的权值。在索引处理过程中,最好为被纳入考虑范围内的每个额外权值细分(子)空间。
对于A类矢量,考虑到剩余位置,符号分布(例如σ0)中特定位置上的特定值并不构成可能符号分布的限定数量的前提条件,因为所有符号分布对于A类矢量都是可能的。在前面列举的简单例子中,12种符号分布对于A类矢量都是可能的。
但对于B类矢量,还需要考虑符号奇偶性约束。再拿上面的简单例子来说,σ0的值提供σ0(模2)的符号奇偶性分布。例如,假设首类根矢量的对应位置的符号奇偶性分布为π0,则例子中对应于权值w1的后续位置的符号奇偶性约束将会限制与后续位置相关的索引子分组;所以,最好将索引子分组限定为满足π1=π0+σ0(模2)这个条件的子集。因此,在上述涉及12个索引的简单例子中,如果首类根矢量的前三个位置(w0=3)为符号偶校验,会考虑使用索引0-2和6-8;如果首类根矢量的前三个位置(w0=3)为符号奇校验,会考虑使用索引3-5和9-11。
以此类推,下面分别详细介绍了A类和B类码矢的优选索引编制方法。
如上所述,编码器和解码器优先为根等价类F的首类根矢量存储权值wl和幅值μl(0≤l<NF),其中,非零分量幅值μl有NF个权值。优选地,权值和幅值存储在只读存储器(ROM)中。可用于存储权值和幅值的存储介质还包括(但不限于)随机存取存储器(RAM)以及磁/电磁存储设备,这些存储设备用于将幅值和权值读取到RAM中(例如,在启动时)。当然,通过通信信道传输幅值和权值可能会增加通信信道的负担。
在编码器中,存储的权值和幅值与符号分布σl(0≤σl≤wl,0≤l<NF)相结合,以生成索引IE;解码器可根据该索引重建量化矢量。实际上,可以使解码器根据索引和预存储的数据来重建首类矢量和等价类。
式65
其中,
帮助函数和对应于用于符号转置的索引空间的大小。对于B类矢量,鉴于首类根矢量的符号奇偶性约束π,帮助函数对应于用于符号转置的索引空间的大小。对于以符号奇偶性约束为前提条件的B类矢量,帮助函数还对应于可从当前首类根矢量生成的首类矢量和等价类的数量。
图17显示了A类码矢的优选索引处理方法(该方法形成图14所示的分量(142),采用图12所示的原理)。目标索引IE和迭代次数k被初始化(171),权值wl被优先加载到某个处理实体的运算存储器中。通过每次迭代更新索引(172,175)。在迭代次数为k的前提下,索引的增量为或σk(175),其中,NF是首类根矢量的非零分量幅值μl的权值个数。
非零权值分布w0=1,w1=3,w2=3和符号分布σ0=1,σ1=0,σ2=1说明了图17所示的对目标首类矢量[μ1μ1μ1μ2μ2-μ2-μ0]的处理过程。根据帮助函数,与这个例子中的首类根矢量相关的等价类有个。第一次迭代后,索引IE的候选项确定为16。第二次迭代不会改变该候选索引,因为σ1=0。第三次迭代后,根据上一个候选索引且σ2=1,将索引最终确定为17。
图18显示了B类码矢的优选索引处理方法(该方法形成图14所示的分量(144),采用图12所示的原理)。模式标志设置为:M=1,以指明是B类矢量(对于A类矢量,M=0)。包括如下步骤:初始化目标索引IE和迭代次数k(181),权值wl优先被加载到某个处理实体的运算存储器中。奇偶性标志初始化(181)为对应于等价类首类矢量的首类根矢量的优先预存储的符号奇偶性π。每次迭代后,索引IE的候选索引都会更新(182,185)。对于除最后一次迭代以外的所有迭代,会用索引(子)空间大小之和来更新候选索引,其中,p*是针对对应于各个权值的各种符号组合的奇偶校验而调整过的候选奇偶校验,如上述简例所示。NF仍是非零分量幅值μl的权值个数。这种调整在图18中表示为模2求和;为简洁起见,用表示,但t不必一定是二进制的。对于每次迭代,都会根据符号分布更新候选奇偶校验,并会将下一个权值-符号组合纳入考虑范围内(183),直至将所有非零权值都纳入考虑范围内(184)。再次重申,表示(183)模2求和。在最后一次更新候选奇偶校验时,最好验证是偶数,且等于该数一半的整数是候选索引的增量,以便形成B类矢量的最终索引(185)。
图19显示了根据本发明一种设备(191)的简化方框图。该设备会进行输入(192)和输出(193)过程,前者输入要量化或编制索引的信号(这些信号的数据块用矢量x表示),后者提供信号码字。输入信号包含对应于输入矢量x或半径为1的法矢和径矢的码字或索引,具体取决于实施方式。如果处理电路(194)中不进行索引编制,则在本发明的一种实施方式下输出(192)包含码矢的信号。为了实现高效编码和解码,最好将等价类偏移量存储在只读存储器(ROM)、闪存或其他存储介质中。该设备(191)的处理电路(194)实施上述量化。处理电路优先执行索引编制。首类根矢量最好存储在存储器或其他存储介质(195)中,以便加快解码速度或减少数据通信量;处理电路(194)会访问存储器或存储介质(195)并读取其中的内容(197)。对于某些操作,处理电路还会优先访问某些随机存取存储器(RAM)。
这里用了一些具体实施例来介绍本发明,还可以对本发明作进一步修改。本申请文件涵盖了本发明的任何变化、使用、调整或实施,包括下述权利要求(一般来说,这些权利要求是本发明涉及的领域的技术人员应了解的原理)范围内的可使用软件的单元和装置。
Claims (30)
1.一种用量化样本来表示信号样本的方法,以便通过通信信道进行通信,其特征在于:
信号样本被量化为对应于E点阵的点的信号,每个被量化的信号包括确定的包含符号分布的首类根矢量代表,以及由所述首类根矢量代表和所述符号分布确定的量化信号。
2.根据权利要求1所述的方法,其特征在于:
所述符号分布是通过通信信道进行传输。
3.根据权利要求2所述的方法,其特征在于:
所述量化使根据E点阵的首类根矢量确定的失真度降至最小。
4.根据权利要求3所述的方法,其特征在于:
最小失真度在必要时会被变换,以形成一组首类矢量的最小失真度。
5.根据权利要求4所述的方法,其特征在于:
根据在某些情况下变换所述E点阵的首类根矢量确定的失真度,具体取决于要量化的信号样本的矢量表示的分量符号分布。
6.根据权利要求5所述的方法,其特征在于:
包括有条件的符号奇偶性更新。
7.根据权利要求6所述的方法,其特征在于:
所述信号样本的表示包括在信号样本的符号奇偶校验与首类根矢量的符号奇偶校验不同的情况下对符号位进行求逆操作。
8.根据权利要求5所述的方法,其特征在于:
每个信号样本都用一个矢量来表示,该矢量的每个分量都包含幅值和符号位;在矢量表示的符号奇偶校验与首类根矢量的符号奇偶校验不同的情况下,会变换根据一个或多个所述首类根矢量确定的失真度。
9.根据权利要求8所述的方法,其特征在于:
所述确定的失真度根据信号幅度表示的幅值与一个首类根矢量的乘积成比例地增加,该首类根矢量用于为一个分量提供最小变换后的失真度;对于该分量,已排序的信号样本的符号位不同于首类根矢量的符号位。
10.根据权利要求8所述的方法,其特征在于,还包括:
为一个包含幅值分量的矢量确定一个索引。
12.根据权利要求3所述的方法,其特征在于:
所述E点阵的首类根矢量集的基数小于E点阵的点的首类集的基数。
13.根据权利要求3所述的方法,其特征在于:
所述失真度标准包括欧氏距离平方。
14.根据权利要求3所述的方法,其特征在于:
确定一个索引,用以表示一个包含符号分布的矢量。
15.根据权利要求14所述的方法,其特征在于:
所述索引是为一个经过调整的矢量确定的,其中,一个矢量分量已根据符号求逆进行了调整。
16.根据权利要求3所述的方法,其特征在于:
所述量化样本是以偏移码字的方式通过通信信道传输的,所述偏移码字的确定方法为,确定此类码字的方法是:对为根据大小对幅值数据块的分量进行排序而生成的索引进行偏移操作;并且,偏移量表示对应于量化信号的根类代表的特定等价类。
17.一种用量化样本来表示信号样本以便通过通信信道进行通信的装置,该装置会输入包含要量化的信号样本的信号以及输出生成的码字或码矢,其特征在于:对于输入信号,
包括处理电路,用于确定对应于E点阵的点的量化信号;每个量化信号都有一个确定的包括符号分布的首类根矢量代表;所述处理电路还用于,根据符号分布和首类根矢量代表来识别量化信号。
18.根据权利要求17所述的装置,其特征在于:
所述处理电路还用于,输出对应于根据E点阵的首类根矢量确定的失真度的量化输出码字或码矢。
19.根据权利要求18所述的装置包括通信手段,用于通过通信信道传输信号分布。
20.根据权利要求19所述的装置,其特征在于:
所述E点阵的首类根矢量集的基数小于E点阵的点的首类集的基数,对于输入信号矢量代表,可以用E点阵的一个或多个首类根矢量来表示所述信号样本的处理电路能够根据首类根矢量将失真度标准降至最低,并且,处理电路可以在首类根矢量集中进行搜索。
21.根据权利要求20所述的装置,其特征在于:
所述处理电路还用于,必要时变换为首类根矢量确定的失真度,以便得出首类矢量集的最小失真度。
22.根据权利要求18所述的装置,其特征在于:
包括存储器或存储单元,用于存储首类根矢量的权值和幅值。
23.根据权利要求18所述的装置,其特征在于:
所述处理电路还用于,在某些情况下变换所述E点阵的首类根矢量确定的失真度,具体取决于要量化的输入信号的矢量表示的分量符号分布。
24.根据权利要求23所述的装置包括
随机存取存储器,用于存储输入信号的分量;每个分量都包括幅值和符号位;并且,
处理电路还用于,确定用于表示输入信号的矢量的符号奇偶校验;其中,
处理电路还用于,确定至少一个首类根矢量的符号奇偶校验以及输入信号,在矢量表示的符号奇偶校验与首类根矢量的符号奇偶校验不同的情况下,该处理电路变换根据一个或多个首类根矢量确定的失真度。
25.根据权利要求24所述的装置,其特征在于:
所述处理电路还用于,根据信号幅度表示的幅值与一个首类根矢量的乘积成比例地增加所述确定的失真度,该首类根矢量用于为一个分量提供最小变换后的失真度;对于该分量,已排序的信号样本的符号位不同于首类根矢量的符号位。
26.根据权利要求19所述的装置,对于信号样本表示,其特征在于:所述处理电路还用于,在信号样本的符号奇偶校验与首类根矢量的符号奇偶校验不同的情况下对符号位进行求逆。
27.根据权利要求26所述的装置,其特征在于:所述处理电路还用于,确定包括求逆的二进制符号矢量的一个索引。
28.根据权利要求19所述的装置,其特征在于:所述处理电路经过特殊布置,可根据索引表示确定码矢。
29.根据权利要求28所述的装置包括
存储器或存储电路,用于存储一个或多个首类根矢量权值或幅值,并且
处理电路可包括一个或多个首类根矢量权值或幅值,在确定码矢的过程中将这些权值或幅值用作参数。
30.根据权利要求19所述的装置,其特征在于:所述处理电路还用于,确定偏移码字,所述偏移码字的确定方法为:对为根据大小对幅值数据块的分量进行排序而生成的索引进行偏移),并且,其特征在于:所述偏移量表示对应于量化信号的根类代表的特定等价类。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2008/070719 WO2009127097A1 (en) | 2008-04-16 | 2008-04-16 | Method and apparatus of communication |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102132494A true CN102132494A (zh) | 2011-07-20 |
CN102132494B CN102132494B (zh) | 2013-10-02 |
Family
ID=41198764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008801287020A Active CN102132494B (zh) | 2008-04-16 | 2008-04-16 | 通信方法和通信装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8364476B2 (zh) |
EP (1) | EP2274833B1 (zh) |
CN (1) | CN102132494B (zh) |
WO (1) | WO2009127097A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103905149A (zh) * | 2012-12-27 | 2014-07-02 | 联发科技(新加坡)私人有限公司 | 码本设计方法、通信设备以及码本训练方法 |
CN106030703A (zh) * | 2013-12-17 | 2016-10-12 | 诺基亚技术有限公司 | 音频信号编码器 |
CN109644030A (zh) * | 2016-08-10 | 2019-04-16 | 华为技术有限公司 | 单位范数码本设计和量化 |
CN116388769A (zh) * | 2023-06-06 | 2023-07-04 | 莱芜职业技术学院 | 一种环境检测数据的计算机存储优化方法 |
US20240283945A1 (en) * | 2016-09-30 | 2024-08-22 | The Mitre Corporation | Systems and methods for distributed quantization of multimodal images |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2274833B1 (en) | 2008-04-16 | 2016-08-10 | Huawei Technologies Co., Ltd. | Vector quantisation method |
FR2931964A1 (fr) * | 2008-06-02 | 2009-12-04 | Centre Nat Rech Scient | Procede de denombrement des vecteurs dans les reseaux reguliers de points. |
KR101624904B1 (ko) | 2009-11-09 | 2016-05-27 | 삼성전자주식회사 | 휴대용 단말기에서 디엔엘에이를 이용하여 멀티 사운드 채널 컨텐츠를 재생하기 위한 장치 및 방법 |
EP3685320A4 (en) * | 2017-09-20 | 2021-06-16 | Look Dynamics, Inc. | PHOTONIC NEURAL NETWORK SYSTEM |
US10547869B2 (en) | 2017-12-08 | 2020-01-28 | Google Llc | Template-based entropy coding of quantized transform coefficients |
US10609421B2 (en) | 2018-07-12 | 2020-03-31 | Google Llc | Context derivation for coefficient coding |
RU2769429C2 (ru) * | 2018-08-17 | 2022-03-31 | Нокиа Текнолоджиз Ой | Кодер звукового сигнала |
CN115426229B (zh) * | 2022-07-21 | 2024-05-28 | 华力智芯(成都)集成电路有限公司 | 一种基于gmsk调制系统的快速高斯滤波的方法 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4075622A (en) | 1975-01-31 | 1978-02-21 | The United States Of America As Represented By The Secretary Of The Navy | Variable-to-block-with-prefix source coding technique |
GB9622055D0 (en) * | 1996-10-23 | 1996-12-18 | Univ Strathclyde | Vector quantisation |
US6054943A (en) | 1998-03-25 | 2000-04-25 | Lawrence; John Clifton | Multilevel digital information compression based on lawrence algorithm |
US6148283A (en) * | 1998-09-23 | 2000-11-14 | Qualcomm Inc. | Method and apparatus using multi-path multi-stage vector quantizer |
US6363338B1 (en) * | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
CA2388358A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
US7272566B2 (en) * | 2003-01-02 | 2007-09-18 | Dolby Laboratories Licensing Corporation | Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique |
KR100487719B1 (ko) * | 2003-03-05 | 2005-05-04 | 한국전자통신연구원 | 광대역 음성 부호화를 위한 엘에스에프 계수 벡터 양자화기 |
EP1709743A1 (fr) * | 2004-01-30 | 2006-10-11 | France Telecom S.A. | Quantification vectorielle en dimension et resolution variables |
CN101292427B (zh) * | 2005-09-23 | 2012-05-23 | 艾利森电话股份有限公司 | 用于矢量量化、编码、解码的方法及装置 |
US20070168197A1 (en) * | 2006-01-18 | 2007-07-19 | Nokia Corporation | Audio coding |
CN100455024C (zh) * | 2006-05-15 | 2009-01-21 | 西安理工大学 | 基于图像块动态划分矢量量化算法的图像压缩芯片 |
US7966175B2 (en) * | 2006-10-18 | 2011-06-21 | Polycom, Inc. | Fast lattice vector quantization |
US7953595B2 (en) * | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
US8483854B2 (en) * | 2008-01-28 | 2013-07-09 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multiple microphones |
EP2274833B1 (en) | 2008-04-16 | 2016-08-10 | Huawei Technologies Co., Ltd. | Vector quantisation method |
GB2466666B (en) * | 2009-01-06 | 2013-01-23 | Skype | Speech coding |
-
2008
- 2008-04-16 EP EP08734077.4A patent/EP2274833B1/en active Active
- 2008-04-16 WO PCT/CN2008/070719 patent/WO2009127097A1/en active Application Filing
- 2008-04-16 CN CN2008801287020A patent/CN102132494B/zh active Active
-
2010
- 2010-10-15 US US12/905,852 patent/US8364476B2/en active Active
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103905149A (zh) * | 2012-12-27 | 2014-07-02 | 联发科技(新加坡)私人有限公司 | 码本设计方法、通信设备以及码本训练方法 |
CN103905149B (zh) * | 2012-12-27 | 2017-12-29 | 联发科技(新加坡)私人有限公司 | 码本设计方法、通信设备以及码本训练方法 |
CN106030703A (zh) * | 2013-12-17 | 2016-10-12 | 诺基亚技术有限公司 | 音频信号编码器 |
CN106030703B (zh) * | 2013-12-17 | 2020-02-04 | 诺基亚技术有限公司 | 音频信号编码器 |
CN109644030A (zh) * | 2016-08-10 | 2019-04-16 | 华为技术有限公司 | 单位范数码本设计和量化 |
US10700750B2 (en) | 2016-08-10 | 2020-06-30 | Huawei Technologies Co., Ltd. | Unit-norm codebook design and quantization |
US20240283945A1 (en) * | 2016-09-30 | 2024-08-22 | The Mitre Corporation | Systems and methods for distributed quantization of multimodal images |
CN116388769A (zh) * | 2023-06-06 | 2023-07-04 | 莱芜职业技术学院 | 一种环境检测数据的计算机存储优化方法 |
CN116388769B (zh) * | 2023-06-06 | 2023-12-29 | 莱芜职业技术学院 | 一种环境检测数据的计算机存储优化方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2009127097A1 (en) | 2009-10-22 |
EP2274833B1 (en) | 2016-08-10 |
US8364476B2 (en) | 2013-01-29 |
US20110137645A1 (en) | 2011-06-09 |
EP2274833A1 (en) | 2011-01-19 |
EP2274833A4 (en) | 2011-04-06 |
CN102132494B (zh) | 2013-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102132494B (zh) | 通信方法和通信装置 | |
Gersho et al. | Vector quantization and signal compression | |
US7106228B2 (en) | Method and system for multi-rate lattice vector quantization of a signal | |
WO2009025676A1 (en) | Encoding and/or decoding digital content | |
TW201007706A (en) | Method for encoding a symbol, method for decoding a symbol, method for transmitting a symbol from a transmitter to a receiver, encoder, decoder and system for transmitting a symbol from a transmitter to a receiver | |
JP2009506368A (ja) | マルチレート・アプリケーションの単一コードブック・ベクトル量子化 | |
Skoglund et al. | Hadamard-based soft decoding for vector quantization over noisy channels | |
Haneche et al. | Compressed sensing-speech coding scheme for mobile communications | |
US20100257174A1 (en) | Method for data compression utilizing pattern-analysis and matching means such as neural networks | |
US20100017196A1 (en) | Method, system, and apparatus for compression or decompression of digital signals | |
WO2011097963A1 (zh) | 编码方法、解码方法、编码器和解码器 | |
CN101266795A (zh) | 一种格矢量量化编解码的实现方法及装置 | |
CN101266796A (zh) | 一种量化编解码方法及装置 | |
Cheng et al. | Robust zero-redundancy vector quantization for noisy channels | |
JP2002158589A (ja) | 符号化装置および復号化装置 | |
JP4960791B2 (ja) | ベクトル量子化符号化装置、ベクトル量子化復号化装置、それらの方法、それらのプログラム、及びそれらの記録媒体 | |
Vasilache et al. | Robust indexing of lattices and permutation codes over binary symmetric channels | |
Khandelwal et al. | Implementation of Direct Indexing and 2-V Golomb Coding of Lattice Vectors for Image Compression | |
CA2482994C (en) | Method and system for multi-rate lattice vector quantization of a signal | |
JP4534112B2 (ja) | 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム | |
Kim et al. | Sample-adaptive product quantizers with affine index assignments for noisy channels | |
Huang et al. | VQ Coding in Data Hiding Using Correlated Neighboring Blocks in Security Performance | |
Hwang et al. | Genetic channel-optimized vector quantizer design for burst error channels | |
Michieli et al. | LBG Algorithm for CD-Quality Audio Signals | |
Kyriakakis et al. | High-fidelity multichannel audio coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230714 Address after: Texas, USA Patentee after: Chaoqing codec Co.,Ltd. Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd. |
|
TR01 | Transfer of patent right |