CN102084595A - 用于对规则点网中的矢量进行计数的方法 - Google Patents

用于对规则点网中的矢量进行计数的方法 Download PDF

Info

Publication number
CN102084595A
CN102084595A CN2009801255857A CN200980125585A CN102084595A CN 102084595 A CN102084595 A CN 102084595A CN 2009801255857 A CN2009801255857 A CN 2009801255857A CN 200980125585 A CN200980125585 A CN 200980125585A CN 102084595 A CN102084595 A CN 102084595A
Authority
CN
China
Prior art keywords
vector
head
norm
function
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801255857A
Other languages
English (en)
Other versions
CN102084595B (zh
Inventor
马克·安东尼尼
莱昂纳多·海德·方特赖斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Universite de Nice Sophia Antipolis UNSA
Original Assignee
Centre National de la Recherche Scientifique CNRS
Universite de Nice Sophia Antipolis UNSA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National de la Recherche Scientifique CNRS, Universite de Nice Sophia Antipolis UNSA filed Critical Centre National de la Recherche Scientifique CNRS
Publication of CN102084595A publication Critical patent/CN102084595A/zh
Application granted granted Critical
Publication of CN102084595B publication Critical patent/CN102084595B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种用于估计范数lp等于坐标小于或等于k的d维首领矢量数目的方法。所述方法的特征在于,通过函数T(xi)对于在1到d之间变化的i的结果的和确定
Figure 200980125585.7_AB_1
所述函数T(xi)为所述首领矢量中的至少一些提供坐标xi的p次幂除以精度因子δ的结果,所述除法的结果四舍五入到最接近的整数。所述方法不包括确定首领矢量的步骤。

Description

用于对规则点网中的矢量进行计数的方法
技术领域
本发明涉及数字数据处理领域,着眼于诸如数字数据压缩、数字数据搜索、数字数据比较或数字数据解压缩之类的应用。本发明涉及视听数据、更具体为各种类型数字数据的处理。本发明的目的是减少与计算能力和内存需求有关的处理时间以及计算资源需求。
这些应用特别地但不排它地涉及需要超大量数据来对其进行描述的图像的处理。为了减少传输时间和存储所需的大小,通过提取将被单独编码的可视信息来压缩信息。该编码的信息必须在频率和空间方面处于最优形式,以允许最优再现、同时避免任何不利于编码性能的冗余。为此目的,已知使用小波变换技术,其坐标构成随后经受矢量量化(vector quantisation)步骤的矢量网。
矢量量化(VQ)的原理是对形成矢量的样本序列进行编码,而不是对每个样本单独编码。编码是通过用属于通常被称为“码本”(codebook)的目录形式的矢量对要被编码的序列进行近似来完成的。码本的每个矢量都被编以索引。编码期间,将使用最接近要被编码的样本序列的矢量的索引来表示要被编码的样本序列。
已知解决方案需要确定每个矢量、将其记录在内存中,然后对所有矢量进行处理,以对这些矢量进行计数。矢量基(vector base)可能需要数千兆(gigabyte)字节,并且这样大的基所需的计算时间超长。本发明的目的是提出一种避免这些缺陷的计数和索引方法。
背景技术
现有技术中已知国际专利申请WO9933185,其涉及一种编码方法,该方法包括:确定被称为首领(leader)矢量的矢量,该矢量包括与量化矢量相同、但按预定次序排列的分量;然后确定在所述形成的矢量集合中,所述量化矢量的等级或级别,这些矢量具有与首领矢量相同、并按预定方式排列在所述集合中的分量。该方法然后包括一方面根据表示因此确定的所述首领矢量的索引、另一方面根据所述级别来形成编码。
设计用于压缩的代数矢量量化器遇到的主要困难与对规则点网(其构成量化字典)中的矢量进行计数和编索引的问题相关。我们在此呈现在广义高斯分布源的情况下(例如小波系数)我们为解决这些问题而提出的解决方案。
代数矢量量化
迄今为止,对量化的研究已有几十年,完成的工作已经形成了关于速率/失真理论的如今已成为常规的许多成果。特别地,已经证明当需要固定长度编码时,与标量量化(SQ)相比,矢量量化(VQ)具有许多优点。此外,香农(Shannon)的工作已经证明,如果量化矢量的维数n足够大,则VQ的性能接近最优理论性能。
然而,重要的是,应注意到,VQ达到这些最优性能要以高计算复杂度为代价;复杂度随矢量维数呈指数增加。通常,使用根据表示源的统计数据(学习序列)构造的非结构式字典来执行VQ。在这种情况下,由于字典大小导致的复杂度和存储需求是压缩应用所无法承受的。此外,存在这样的字典稳健性(robustness)问题:虽然对于给定的学习序列是优化的,但对于学习序列外面的图像给出很差性能。克服这些问题的一个解决方案是使用n-维结构式VQ,例如代数矢量量化(AVQ)或关于规则点网的矢量量化。当字典的矢量被强迫属于结构式规则网时,AVQ的性能一般比非结构式VQ的性能差。
然而,在大多数应用中,该轻微缺点被以下事实抵消:对于AVQ,不需要生成或存储字典,并且降低了编码复杂度。
可将规则点网的量化看作是均匀标量量化的扩展。如在非结构式VQ的情况中那样,在文档的其余部分,术语AVQ将用于或者表示矢量量化,或者表示矢量量化器。AVQ考虑矢量系数与分割排列的增益之间的空间依赖性。无论源分布为何,AVQ总是比SQ更有效。
Rn表示的规则点网由构成该网的基{y|y=u1a1+u2a2+...+unan}的一组线性无关的矢量ai的所有可能的组合组成,其中系数ui是整数。因而空间的分割是规则的,并仅取决于选择的基矢量。每个基定义不同的规则点网。与通过基于广义Lloyd算法的算法而设计的VQ相比,AVQ提供了相当大地降低计算和存储成本的可能性。这是因为使用规则网矢量作为量化值消除了构造字典的操作:通过选择的网的结构隐式地构造字典。Conway和Sloane发表在IEEE Trans.On Information Theory,vol.28,no2,pp.227-232March 1982上的文章“Fast quantizing and decoding algorithms for quantizers and codes”描述了简单地使用计数操作且仅依赖于矢量的维数n的快速量化算法。1979年,Gersho做出猜想,在渐进情况下(即对于高速率),AVQ的速率/失真性能接近最优。然而,尽管AVQ对于低速率在数学上不是最优的,但这种量化器给予的复杂度的降低使得能够使用大维数的矢量,对于给定速率产生了更好的实验性能。能通过将AVQ与熵编码器组合来得到好的速率/失真性能,这促进了小波领域中关于AVQ的一些工作。已经针对高斯和拉普拉斯源进行了关于VQ的许多理论工作;然而,在衰减参数小于1的广义高斯类型源的情况下,证明了在速率/失真方面,立方网Zn要好于网E8和网Leech。该结果鼓励了我们将AVQ与小波变换相结合的工作。
发明内容
本发明要解决的问题
尽管由于字典的规则几何结构,通过AVQ量化并不是很复杂,然而其实现并不直接。在非渐进模型的情况下,忽略超载噪音(overload noise),因为我们假设使用可变长度编码和无限字典。实际上这提出了一定数量的具体问题,特别是在计算和存储方面的问题。在设计AVQ时可以提出两个基本问题:
a)索引:索引是独立于量化的操作。其包括向每个量化矢量分配索引,一旦被编码,则通过信道发送给解码器。
在压缩链中该操作是基本的。其实际上确定比特率并使得能无歧义地对矢量解码。已知方法在内存方面通常非常廉价,但是具有不容忽视的计算复杂度(递归算法),或仅在特定情况下(特定网或截断(truncation)的类型)起作用。本发明涉及允许关于广义高斯类型分布的索引的更通用方法,导致了内存成本和计算成本之间的良好折衷。第一个专利提出了对此问题的解决方案。
b)计数。索引方法通常基于网的总体(population)的知识。因此我们必须能对依赖于源的分布的n-维面上(或n-维体积内)的网中的矢量进行计数。常规计数方法基于生成级数的使用。在此形式中,已经引入了函数Nu。它们允许在金字塔(pyramid)上,即在拉普拉斯分布的情况下进行计数。
本发明更具体地涉及在广义高斯类型分布上计数的步骤,实现了内存成本和计算成本之间的良好折衷。第二个专利提出了对此问题的解决方案。我们的贡献主要在于计数和索引,以及在图像或视频压缩应用中AVQ的实现。这两种方法以及AVQ的使用对于音频信号(声音、语音、音乐)的压缩也完全有效。
为此,根据其一般承诺,本发明涉及一种用于估计范数lp等于
Figure BDA0000042433250000041
坐标小于或等于k的d维首领矢量的数目的方法,其特征在于,通过函数T(xi)对于在1到d之间变化的i的结果的和确定
Figure BDA0000042433250000042
所述函数T(xi)为所述首领矢量中的至少一些提供坐标xi的p次幂除以精度因子δ的结果,所述除法的结果四舍五入到最接近的整数,所述方法不包括确定首领矢量的步骤。
优选地,对于在d和1之间的n值,对函数
Figure BDA0000042433250000043
的结果进行求和,其中u在最小值umin(r,n)和k之间变化,所述函数
Figure BDA0000042433250000044
提供范数坐标小于或等于k的n维首领矢量的数量,所述函数umin提供满足T(u)大于或等于r/n的最小整数值u。
有利地,进行在先初始化步骤,包括对于n=l,为函数
Figure BDA0000042433250000046
赋予与小于或等于k的u的可能值数目相对应的一个值,使得T(u)=r,然后执行所述求和步骤。
本发明还涉及估计方法的应用,用于估计数据压缩率以及用于为首领矢量编索引。
附图说明
阅读了参照附图的非限制示例实施方式之后,将更好地理解本发明,附图中:
图1示出了对于网Z2
Figure BDA0000042433250000047
p=0.4且δ=0.3的包络线示例,
图2示出了对于p=1、δ=1且B=4来说通常方法和提出的方法的内存需求之间的比较,
附录1和附录2示出用于实现本发明的计数算法的两个示例。
具体实施方式
网矢量的索引是网量化应用中的重要问题。本发明涉及使用网首领矢量以及分拆理论(theory of partitions)语境的对该问题的解决方案。其对广义高斯分布源起作用并允许使用乘积码。还使得能为高维矢量编索引。
如果矢量维数任意高,矢量量化(VQ)可使得获得最优理论性能是可能的。遗憾的是,最优非结构式VQ(例如LBG)的计算复杂度随维数呈指数增长。此外,存储需求可能非常大。对该维数问题的一个解决方案是使用受约束的VQ,例如网矢量量化(LVQ)。
LVQ方法导致了码矢量规则地分布在空间中的结构式字典的设计。因此,可通过根据其分布的形式为网矢量编索引来对源自适应,而不是优化矢量在空间中的位置。对于大多数真实数据源来说,这可以通过使用乘积码来有效地完成,导致了对称单峰源分布的最优速率/失真折衷。
事实上,能将这样的分布解释为一组根据源分布具有相同形式的同心超曲面。然后能通过分配与各个面的范数(半径)相对应的第一索引(前缀)和与属于同一面的矢量的计数相对应的第二单一索引(后缀)来为网码字编索引。
大量重要数据源(例如子带话音和图像系数,特别是通过小波变换得到的那些)能通过广义高斯分布模型化。该分布族通过单变量随机变量的唯一形状因子p(GG(p))而参数化。具有分布(GG(p))的源的一个有趣特性是,范数lp的包络线对应于常概率面。这导致了有效乘积码的发展。
即使前缀的计算较平凡,但后缀需要位于给定超曲面上的网矢量的计数和索引。此外,由于位于包络线上的矢量数随范数而极大地增长,空间维数的增加可能使得索引操作非常复杂,如下表所示,其示出了对于网Zn以及不同维数和范数值,在范数l1的情况下,给定正四面体锥(hyperpyramid)的首领数目以及位于该正四面体锥上的网矢量总数(基数)的比较。
Figure BDA0000042433250000051
在文献中,一般根据两种不同技术执行后缀的索引。
第一种考虑位于给定超曲面上的矢量总数(基数)来赋予索引。另一种方法利用网的对称,使用首领(leader)概念。范数lp的包络线的首领对应于一些网矢量,根据这些网矢量,能通过其坐标的置换(permutation)和符号变化来得到位于对应包络线上的所有其它网矢量。对于各向同性源来说,这两种方法的趋势是具有类似的速率/失真性能。
然而,关于网索引的大多数著作仅为拉普拉斯或高斯分布提出解决方案,这两种分布是GG(p)的特定情况,形状参数分别为p=1和p=2。少数作者提出了对于特定情况p=0.5的解决方案。然而,该计数方法不能构造乘数码,且在实践中索引方法非常复杂,对于具有高维数和范数的p≠0.5,1或2来说,尤其如此。
本发明提出了对位于0<p≤2的包络线GG(p)上的网矢量Zn计数、首领类型的索引方法的新颖替代方案,并使用分拆理论。分拆理论的使用使得我们能够克服为了生成首领并为其编索引的复杂度和存储需求。我们提出了一种经济的计数算法,对半径为r、维数为d、最强坐标为k的包络线的首领数目进行计数,用于例如对首领进行索引以及对速率进行估计等应用。
在下面的描述中,第一部分展示了LVQ的原理,并描述了索引/计数问题。第二部分提出了对超大规模的LVQ码本进行计数的有效解决方案,而无论形状参数p为何。描述然后说明了提出的方法在内存方面的代价。
2.网矢量索引
2.1网的定义
以Rn表示的网Λ由一组线性无关的矢量ai(网的基)的任意积分组合组成,使得:
Λ={x|x=u1a1+u2a2+...unan}(1)
其中ui是整数。空间分割因此是规则的,并仅取决于选择的基矢量ai∈Rm(m≥n)。必须注意,每组基矢量定义了不同的网。
可以认为网的每个矢量v属于包含具有由下式给出的固定范数lp的矢量的曲面或超曲面:
| | v | | p = ( Σ i = 1 n | v i | p ) 1 p .
然后能使用乘积码对给定网矢量编码。很明显,如果源矢量的分布是拉普拉斯分布,则合适的乘积码包含与矢量的范数l1相对应的前缀,以及与其在具有等于讨论中的范数l1的半径的正四面体锥上的位置相对应的后缀。固定范数l1的超曲面称为正四面体锥。能使用计数算法得到矢量在超曲面上的位置。这样的乘积码保证了解码的唯一性。
在广义高斯分布源的形状参数小于或等于1的情况下,D4、E8上的立方网Zn或网Leech的优越性已经被证明[12]。因此,本文剩余部分关注基于立方网Zn的LVQ设计。
2.2基于总计数的索引
现有技术中已知一些为高斯或拉普拉斯分布的情况、以及为基于总计数原理的不同网提出的计数解决方案。特别地,在拉普拉斯源分布的情况下以及对于网Zn,已知一种用于对位于范数l1的正四面体锥上的网矢量的总数进行计数的递归公式。该计数公式已经扩展到形状因子p位于0和2之间的广义高斯源分布。这些解决方案使得确定位于给定截断范数lp内的矢量数是可能的,但是它们没有提出为网Zn的矢量分配实际索引的算法。此外,该解决方案不确定位于给定超曲面上的矢量数,使得很难使用乘积码。
现有技术的著作提出的算法对于0<p≤2根据乘积码方案为矢量编索引。其基于广义θ级数(theta series)[4]并使用网几何。对于p=1或2,该级数的展开相对简单。然而,对于其它p值,因为不产生闭合的形状,并且禁止使用形式数学(formal mathematics),该级数的展开非常复杂。对于提出的解决方案,有必要确定各个维数和高维数的每个可能的范数值,这在有限时间内往往是不可行的。
此外,假定超曲面的基数可迅速达到对于实际实现、特别对于高维数(见下面的表)来说难解(intractable)的值,则基于包络线的基数的索引技术可迅速超过计算精度。
2.3基于首领的索引
基于首领的方法利用了网的对称。这些方法使用关于固定范数包络线的有效索引算法,并且在称为首领的少数矢量的基础上、而不是在网的所有矢量的基础上赋予索引。分别处理网的不同对称,与总计数技术相比,构成了不都存在对称时更有效的为源编索引的方法。此外,由编码算法管理的索引比包络线的基数要小的多,这使得对于给定二进制精度,能为不能由基于总计数的方法进行索引的矢量编索引。
在乘积码体系中,除了网的对称之外,后缀索引包含少量矢量(首领)的索引,根据这些矢量,能分配超曲面的所有其它矢量。对于网Zn,对称对应于两种基本操作:矢量坐标符号的改变以及置换。第一种操作对应于矢量所在卦限(octant)的改变。例如,2维矢量(7,-3)在第四卦限,而矢量(-7,-3)在第三卦限。这些矢量相对于y轴对称。第二种操作对应于卦限内对称,例如,矢量(-7,3)和(-3,7)都在第二卦限且相对于卦限的平分线对称。在这种情况下,可以看出,所有这些矢量都能根据矢量(3,7)的置换和符号变化而产生,矢量(3,7)是所有这些矢量的首领。利用所有的置换和符号变化,首领(3,7)能表示8个矢量。该比例随着超曲面的维数而快速增长(见表1)。
因此,该索引方法为每个矢量分配一组三个索引:一个对应于其首领,另两个对应于首领的置换和首领的符号变化,而不是直接为超曲面上的所有矢量编索引。关于计算置换和符号索引的方法的更多细节见1′[5]。
3.提出的计数方法
本发明提出了对首领进行计数的解决方案。为了更好地理解有关这种计数算法的使用,我们将在下面给出为首领编索引的使用的非限制性示例。首先,我们将谈到范数l1的索引,其次,我们将给出更一般情况范数lp的示例。
接下来,在3.3节,我们将详述本发明。
3.1对于范数l1的首领索引
3.1.1原理
提出的计数算法应用到的用于为首领编索引的方法基于按反字典序(in reverse lexicographical order)将所有首领分类、并根据要被编索引的首领之前的首领数赋予索引。在此情况下,索引不再基于资源消耗高或直接寻址的搜索算法,而是基于低成本计数算法,该算法仅依靠首领数量而非每个首领的具体知识,这使得能避免构造转换表。
半径为r的正四面体锥由所有矢量v=(v1,v2,...,vd)组成,从而||v||1=r。如前所述,首领是超曲面的基本矢量,根据首领进行置换和符号变化操作得到位于该超曲面上的所有其它矢量。事实上,首领是具有以升序(或降序)排序的正坐标的矢量。因此,等于r的范数l1的d维首领是满足以下条件的矢量:
1 - Σ i = 1 d v i = r ;
2-对于i<j并且i,j∈[1,d],0≤vi≤vj
3.1.2与分拆理论的关联
在范数l1的情况下,可以注意到,3.1.1节所列的条件与数论中的分拆理论相关。事实上,在数论中,正整数r的分拆是将r写成d个正整数(也称为部分)的和的方式。分拆函数P(r)给出r的不同分拆的数目(与次序无关),从而
Σ r = 0 ∞ P ( r ) y r = Π d = 1 ∞ ( 1 1 - y d ) - - - ( 2 )
其对应于欧拉函数的倒数,也称为级数q[10,16,17]。附加的数学展开得到了函数P(r)的表示,使得能加速计算。
例如,对于r=5,方程(2)给出了结果P(5)=7。事实上,数字5所有可能的分拆是(5)、(1,4)、(2,3)、(1,1,3)、(1,2,2)、(1,1,1,2)和(1,1,1,1,1)。通过用5维矢量的形式重写这些分拆,例如(0,0,0,0,5)、(0,0,0,1,4)、(0,0,0,2,3)、(0,0,1,1,3)、(0,0,1,2,2)、(0,1,1,1,2)和(1,1,1,1,1),我们看到这些正好对应于范数r=5和维数d=5的正四面体锥的首领,也就是说,这些是范数r=5和维数d=5的正四面体锥中满足3.1.1节的两个条件的仅有的矢量。
然而,我们一般关心d维网中等于r的范数l1的包络线,其中r≠d。在这种情况下,能使用函数q(r,d)[10,18],该函数计算具有不超过d个部分的r的分拆数目(在分拆理论中,这等同于计算r的、包括任意元素的部分数都不大于d的分拆数目)。因此,对于范数r=5和维数d=3的正四面体锥,我们得到q(5,3)=5,也就是说,由(0,0,5)、(0,1,4)、(0,2,3)、(1,1,3)和(1,2,2)给出5个首领。
能根据下述递归方程计算函数q(r,d):
q(r,d)=q(r,d-1)+q(r-d,d)                       (3)
其中对于d≥r,q(r,d)=P(r),q(1,d)=1且q(r,0)=0。
3.1.3为首领编索引而对函数q(r,d)的使用
如下面所描述的,方程(3)不仅给出位于给定正四面体锥上的首领的总数,还能用于运行时为首领分配唯一索引,而无需转换表。为了说明提出的算法的原理,我们假设给定正四面体锥的首领按反字典序如下分类:
Figure BDA0000042433250000101
因此,首领l的索引对应于其前面的首领的数目。在上面描述的示例中,首领(0,...,1,1,rn-2)必须被分配给索引3。
数学命题1描述了提出的为首领编索引的算法:
命题1。设v=(v1,v2,...,vn)为位于固定范数l1的包络线上的首领l=(x1,x2,...,xn)的网矢量Zn。其首领索引I1由下式给出:
Figure BDA0000042433250000102
其中
Figure BDA0000042433250000103
计算具有不超过小于或等于k的d部分的r的分拆数目,
Figure BDA0000042433250000104
且xn+1=+∞。
证明。我们考虑为维数为n和范数l1
Figure BDA0000042433250000105
的首领l=(x1,x2,...,xn)编索引。由于首领按反字典序排序,置于1之前的第一组首领由第n个分量严格大于xn的所有首领组成,这就是说,由具有满足xn+1≤gn≤rn的最高坐标gn的所有首领组成。
为了对该第一组中的首领数目进行计数,而不列出所有,我们使用分拆函数q(r,d)。事实上,使用下面的推论可以容易地计算出第n个坐标等于gn的首领的数目:
推论:计算最大坐标等于gn的范数为rn维数为n的首领的数目相当于计算具有不超过n-1部分、每部分都不大于gn的数字rn-gn的分拆数目。
在大多数情况下,我们能通过应用q(rn-gn,n-1)对该分拆数进行计数。然而,该方法仅当rn-gn≤gn时有效,在这种情况下隐含地假设rn-gn的所有分拆没有大于gn的部分。然而,在不保证rn-gn≤gn的更一般的情况下(例如,最大部分等于7的范数rn=20和维数n=5的首领数目将得到q(20-7,5-1)=q(13,4),其中20-7>7),由于rn-gn的一些分拆将使其最大部分超过gn,在这种情况下将不能遵守3.1.1节的条件2,因而q(rn-gn,n-1)的计算将得到错误的有效首领数。
在这种情况下,我们必须对分拆数目的计算应用第二约束:最大部分的值。我们因此引入由函数
Figure BDA0000042433250000111
得到的归纳
Figure BDA0000042433250000112
其计算具有不超过d部分且任一部分都不大于k的给定数字r的分拆数目。通过计数算法完成
Figure BDA0000042433250000113
的计算,计数算法例如是作为本发明主题的算法。
因此,我们能通过应用
Figure BDA0000042433250000114
计算有效首领的正确数目。因此,gn的从xn+1到rn的变化使得能确定最大坐标严格大于xn的首领的数目,由下式给出:
Σ i = x n + 1 r n q ‾ ( r n - i , n - 1 , i ) - - - ( 5 )
其中假设
Figure BDA0000042433250000117
Figure BDA0000042433250000118
在这种情况下,我们使用数论中使用的集合符号,其中Z+表示所有正整数{i∈Z|i>0},Z*表示所有非负整数{i∈Z|i>0}。
1之前的第二组首领由第n个坐标等于Xn、但第(n-1)个坐标严格大于xn-1的所有首领组成。为了对该首领数目进行计数,我们能使用前面提到的相同的推论,但是这次应用到n-1维。然后我们能通过使gn-1从xn-1+1变化到min(xnrn-1)、使用
Figure BDA00000424332500001110
Figure BDA00000424332500001111
来计算最大分量gn=xn且第二大分量gn-1>xn-1的首领的数目。min函数保证了符合范数rn以及gn-1≤gn=xn
等待附加维数的结果时,能由下式得到l之前的最高坐标等于xn的首领的数目:
方程(5)和(6)的组合产生了用于计算置于l之前的首领的总数、以及因此l的索引I1的通式(方程(4)):
Figure BDA00000424332500001113
其中对于j=0,xn+1=+∞。
3.2范数lp的情况的归纳
为了计算位于固定范数lp的包络线之上的矢量v=(v1,v2,...,vn)的首领l=(x1,x2,...,xn)的索引,其中0<p≤2,应用与l1的情况相同的原理。按反字典序列出首领,并使用同样的计数方法赋予索引。因此方程(4)的结构再次适用,其中关于i的总和利用函数
Figure BDA0000042433250000121
根据给定坐标计算首领数目,关于j的总和允许对维数递归。
然而,
Figure BDA0000042433250000122
的使用暗含地表示范数r的和项
Figure BDA0000042433250000123
是整数,并且可以是区间[0,r]内的任意整数。很明显这对于p=1有效,其中和项是正整数网坐标自身。另一方面,对于p≠1,和项不必是整数,或可不必是区间[0,r]内的任意整数(例如,对于p=2,和项是整数,但仅是平方数)。
可通过将
Figure BDA0000042433250000125
四舍五入到精度为δ的最接近整数来解决该问题。[7,9]中使用了类似的技术。该运算引入了由所有整数
Figure BDA0000042433250000126
组成的新的整数子集其中[·]是最接近的整数且xi∈Z*
则得知矢量的范数lp具有精度δ,且由下式得到:
r δ , n p = Σ i = 1 n x ‾ i = Σ i = 1 n [ x i p δ ] - - - ( 7 )
其中精度δ限定了固定范数的包络线宽度,随着其值增加,包括更多矢量(见图2)。
图1:对于网Z2p=0.4且δ=0.3的包络线的示例。
因此,计算固定范数lp中矢量的首领索引对应于计算整数的分拆的正确数目,但是仅使用属于子集
Figure BDA00000424332500001212
的整数。数学命题2描述了对于lp的情况提出的索引算法:
命题2。设v=(v1,v2,...,vn)为位于固定范数lp的包络线上的首领l=(x1,x2,m,xn)的网矢量Zn。其首领索引I1由下式给出:
Figure BDA00000424332500001213
Figure BDA00000424332500001214
其中
Figure BDA00000424332500001215
计算具有不超过小于或等于k∈Z*的d部分的
Figure BDA00000424332500001216
的分拆数目,
Figure BDA00000424332500001217
且xn+1=+∞。f(a)返回最大值i∈Z*,从而对于
Figure BDA00000424332500001218
Figure BDA00000424332500001219
t(i)≤a。
证明:我们考虑为维数为n和范数lp
Figure BDA0000042433250000131
的首领l=(x1,x2,...,xn)编索引。如前所述,我们提出使用与方程(4)相同的原理。然而,由于p≠1时范数lp的和项不总是整数,因而不再能使用函数
Figure BDA0000042433250000132
Figure BDA0000042433250000133
四舍五入到精度δ的最接近整数使得能根据正整数值
Figure BDA0000042433250000134
的总和得到整数范数
Figure BDA0000042433250000135
如方程(7)中所定义的。因此,能通过对将
Figure BDA0000042433250000136
写成的和的不同方式的数目进行计数,来计算精度为δ位于p≠1的包络线上的首领l的索引,其中是t:
Figure BDA0000042433250000139
定义的函数t的整个图像,匹配其中
Figure BDA00000424332500001311
Figure BDA00000424332500001312
重要的是,这里注意,鉴于Z*的不同值能与
Figure BDA00000424332500001313
中的相同值匹配,取决于p和δ的值,函数t可表示非内射函数。因此,不同首领
Figure BDA00000424332500001314
中能具有相同表示,并且用于对中的分拆数目计数的任意朴素法(naive procedure)将不仅导致错误首领索引,还导致将相同的错误索引被赋予不同首领。
我们定义解决方案,函数
Figure BDA00000424332500001317
为对具有不超过d部分的的分拆数目计数,其中
Figure BDA00000424332500001319
给定每部分,对于i,k∈Z*,不存在i大于k。应该注意,间接使用Z*的值k的对中最大部分的值的约束使得能计数导致
Figure BDA00000424332500001321
中产生相同分拆的不同首领的数目。
因此,使用
Figure BDA00000424332500001322
对于范数lp方程式(4)能扩展为:
Figure BDA00000424332500001323
其中f(a)返回最大值i∈Z*,使得对于
Figure BDA00000424332500001324
t(i)≤a。
通过使方程(9)中的j从0变化到n-2,对于坐标xn到x2正确地对l之前的首领数目进行计数。在范数l1的情况下,鉴于存在
Figure BDA00000424332500001325
的单个值x1∈Z*,计算以前的首领的总数是充分条件。然而,对于范数lp,由于函数t的非内射,一些值x1∈Z*导致
Figure BDA00000424332500001326
是可能的。因此,为了保证索引的唯一性,计算
Figure BDA0000042433250000141
和x1之间的差,并添加到方程(9)的结果中,以便得到由方程(8)给出的唯一可解码首领索引:
鉴于
Figure BDA0000042433250000144
可能大于x2,而x1可能小于或等于x2,需要min函数。通过计数算法完成
Figure BDA0000042433250000145
的计算。在下一节,我们公开作为本发明主题的算法。
3.3计数算法
提出的函数
Figure BDA0000042433250000146
被定义为等于具有不超过d部分、最大部分为t(i)的范数
Figure BDA0000042433250000147
的分拆数目,其中i≤k。因此,我们对维数进行递归如下计算
q ‾ δ p ( r , d , k ) = Σ i = i min ( r , d ) k q ‾ δ p ( r - t ( i ) , d - 1 , t ) - - - ( 10 )
其中imin(r,d)提供满足
Figure BDA00000424332500001410
的i∈Z*的最小值。这表示按反字典顺序的范数
Figure BDA00000424332500001411
以及维数为d的最后分拆的主要部分。
对于维数d=1,初始化
Figure BDA00000424332500001412
其中不同正整数的数目i≤k,从而t(i)=r。例如,对于p=0.5和δ=0.1,鉴于使用函数t仅当i=32和
Figure BDA00000424332500001413
时在
Figure BDA00000424332500001414
中匹配r=57,我们如此定义
Figure BDA00000424332500001415
如果k≤31为0,如果k=32为1,如果k≥32为2。
应该注意,鉴于对于p=1和δ=1,我们得到
Figure BDA00000424332500001416
因此函数
Figure BDA00000424332500001417
是函数
Figure BDA00000424332500001418
的归纳。
附录中呈现的算法1和算法2初始化并计算
3.4内存成本
在不在线计算
Figure BDA00000424332500001420
的情况下,能如下面描述的那样计算内存需求。
能将存储的
Figure BDA00000424332500001421
解释为三维表,其中第一个输入是值
Figure BDA00000424332500001422
第二个是维数d∈Z+,第三个是最大网值k∈Z*。则预计最大内存需求是r·d·k·B字节,其中B是的每个元素的字节数。
然而,对于给定最大范数
Figure BDA0000042433250000152
以及维数d,有效编码和解码步骤的限制更低。这是因为,根据方程(8)和(10),可以看出当j=0且i=imin(r,d)时,得到
Figure BDA0000042433250000153
的前两个输入变量的最大值。在这种情况下,我们计算
Figure BDA0000042433250000154
因此,使用区间
Figure BDA0000042433250000156
上的第一输入变量(与范数相关)以及区间[1,d-1]上的第二输入变量(与维数相关)就足够了。
能根据r确定k的值。由于仅当
Figure BDA0000042433250000157
时需要第二约束,能在
Figure BDA0000042433250000158
时确定k的最大值,以便为具有位于区间[0,r]内的范数以及维数为[1,d]的任意首领编索引。因此,由下式给出编码和解码步骤的内存成本上限:
Figure BDA0000042433250000159
应该注意,内存需求主要取决于包络线的范数和维数。首领数目决定B的选择。
图3示出了使用索引算法的节省内存,其中表
Figure BDA00000424332500001510
离线计算。内存需求根据p=1、δ=1且B=4(即整数型数据)时的半径r由方程(13)表示,并与如[5]中描述的基于首领的常规方法的内存上限进行比较。应该注意,即使维数和半径分别低到16和20,常规方法也需要不超过10千兆字节(gigabyte)的内存,而提出的方法需要少于100千字节(kilobyte)。
极小的内存需求以及不必知道所有首领的事实使得能为高达64、128、256、512等维数的网矢量编索引。在现有工作中,实际应用限制在16维。
附录
计数算法
算法1
/*表
Figure BDA00000424332500001511
[r][d][k]的构造。对于最大范数值
Figure BDA00000424332500001512
以及维数d,该算法创建
Figure BDA00000424332500001513
维3-D表
Figure BDA00000424332500001514
rbckp=r;
k=f[floor((double)r/2.)];
r=r-ceil((double)r/(double)d);
d--;
Figure BDA0000042433250000161
//初始化
for(j=1;j<d;R++)
{
    for(R=1;R<=r;R++)
    {
    Np=0;
    for(i=imin(R,j+1);i<=f[R];i++)
{
    rmd=R-t[i];
    if(t[i]>rmd)//没有第二约束
N p + = q ‾ δ p [ rmd ] [ j - 1 ] [ 0 ] ;
    else
N p + = q ‾ δ p [ rmd ] [ j - 1 ] [ i ] ;
    if(i<=k)
Figure BDA0000042433250000165
//有第二约束的值
     }
Figure BDA0000042433250000166
//没有第二约束的值
     }
}
return
Figure BDA0000042433250000167
;//函数在此结束
/*算法2详细说明了函数init(rbckp,r,d,k)。
函数imin(r,d)提供了最小值i∈Z*,使得
Figure BDA0000042433250000168
(见方程(???).)*/
算法2
/*用于初始化表
Figure BDA0000042433250000169
[r][d][k]的函数init(rbckp,r,d,k),以及算法1中使用的矢量f和t的创建。*/
Figure BDA00000424332500001610
//(r+1)x d x(k+1)维零表
f=0rbckp+1;//rbckp+1维零矢量
t=0f(rbckp)+2;//f(rbckp)+2维零矢量
f[rbckp]=f(rbckp);
for(i=0;i<=f  [rbckp];i++)
{
    do{
    if(t[i]<=r)
    {
q ‾ δ p [ t [ i ] ] [ 0 ] [ 0 ] + + ; / / a
    if(i<=k)
q ‾ δ p [ t [ i ] ] [ 0 ] [ i ] = e [ t [ i ] ] [ 0 ] [ 0 ] ; / / b
    }
    i++;
    t[i]=t(i);
    }while(t[i]==t[i-1]);
    i--;
    f[t[i]]=f(t[i]);
    for(j=t[i]+1;j<min(t[i+1],rbckp);j++)
    f[j]=f[t[i]];
}
for(j=1;j<d;j++)//c
q ‾ δ p [ 0 ] [ j ] [ 0 ] = 1 ;
return
Figure BDA0000042433250000174
;//函数在此终止
/*a初始化
Figure BDA0000042433250000175
第一维,从0到r的所有范数没有第二约束。
b初始化
Figure BDA0000042433250000176
第一维,从0到r的所有范数具有第二约束imin(t(i),1)af(t(i))。
c初始化
Figure BDA0000042433250000177
除第一维之外的维数,对于范数0没有第二约束。使用函数f和t分别初始化矢量f和t。*/

Claims (5)

1.一种用于估计范数lp等于
Figure FDA0000042433240000011
坐标小于或等于k的d维首领矢量的数目的方法,其特征在于,通过函数T(xi)对于在1到d之间变化的i的结果的和确定
Figure FDA0000042433240000012
所述函数T(xi)为所述首领矢量中的至少一些提供坐标xi的p次幂除以精度因子δ的结果,所述除法的结果四舍五入到最接近的整数,所述方法不包括任何确定首领矢量的步骤。
2.根据权利要求1所述的用于估计首领矢量的数目的方法,其特征在于,对于在d和1之间的n值,对函数
Figure FDA0000042433240000013
的结果进行求和,其中u在最小值umin(r,n)和k之间变化,所述函数
Figure FDA0000042433240000014
提供范数坐标小于或等于k的n维首领矢量的数量,所述函数umin提供满足T(u)大于或等于r/n的最小整数值u。
3.根据权利要求2所述的用于估计首领矢量的数目的方法,其特征在于,进行在先初始化步骤,该步骤包括对于n=1,为函数
Figure FDA0000042433240000016
赋予与小于或等于k的u的可能值的数目相对应的一个值,使得T(u)=r,然后执行所述求和步骤。
4.根据权利要求1-3中的至少一项所述的估计方法的应用,用于估计数据压缩率。
5.根据权利要求1-3中的至少一项所述的估计方法的应用,用于为首领矢量编索引。
CN200980125585.7A 2008-06-02 2009-05-27 用于对规则点网中的矢量进行计数的方法 Expired - Fee Related CN102084595B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR08/03020 2008-06-02
FR0803020A FR2931964A1 (fr) 2008-06-02 2008-06-02 Procede de denombrement des vecteurs dans les reseaux reguliers de points.
PCT/FR2009/000618 WO2009156606A2 (fr) 2008-06-02 2009-05-27 Procédé de dénombrement des vecteurs dans les réseaux réguliers de points

Publications (2)

Publication Number Publication Date
CN102084595A true CN102084595A (zh) 2011-06-01
CN102084595B CN102084595B (zh) 2014-11-12

Family

ID=40086719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980125585.7A Expired - Fee Related CN102084595B (zh) 2008-06-02 2009-05-27 用于对规则点网中的矢量进行计数的方法

Country Status (8)

Country Link
US (1) US8745110B2 (zh)
EP (1) EP2289172B1 (zh)
JP (1) JP5580295B2 (zh)
KR (1) KR101577848B1 (zh)
CN (1) CN102084595B (zh)
CA (1) CA2725809A1 (zh)
FR (1) FR2931964A1 (zh)
WO (1) WO2009156606A2 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2931963A1 (fr) 2008-06-02 2009-12-04 Centre Nat Rech Scient Procede de traitement de donnees numeriques
FR2931964A1 (fr) * 2008-06-02 2009-12-04 Centre Nat Rech Scient Procede de denombrement des vecteurs dans les reseaux reguliers de points.
US11709270B1 (en) 2018-06-01 2023-07-25 Cintoo SAS, France Method of processing azimuth, elevation and range data from laser scanning an object

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1188957A (zh) * 1996-09-24 1998-07-29 索尼公司 矢量量化方法和语音编码方法及其装置
WO1999033185A1 (fr) * 1997-12-22 1999-07-01 France Telecom S.A. Procede de codage d'un vecteur d'un reseau representatif d'un signal quantifie et procede de decodage correspondant
CN1659785A (zh) * 2002-05-31 2005-08-24 沃伊斯亚吉公司 信号多速率点阵矢量量化的方法和系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02215230A (ja) * 1989-02-15 1990-08-28 Matsushita Electric Ind Co Ltd ベクトル量子化装置
FR2795589B1 (fr) 1999-06-11 2001-10-05 Centre Nat Rech Scient Decodeur video optimal base sur les standards de type mpeg
JP4590747B2 (ja) * 2001-02-06 2010-12-01 ソニー株式会社 ベクトル量子化のコードブック生成方法及びコードブック生成装置
JP4579930B2 (ja) * 2004-01-30 2010-11-10 フランス・テレコム 次元ベクトルおよび可変解像度量子化
WO2008104725A1 (fr) 2007-02-21 2008-09-04 France Telecom Procede de codage et decodage algebrique optimise, modules et programmes d'ordinateur associes
WO2009127097A1 (en) * 2008-04-16 2009-10-22 Huawei Technologies Co., Ltd. Method and apparatus of communication
FR2931964A1 (fr) * 2008-06-02 2009-12-04 Centre Nat Rech Scient Procede de denombrement des vecteurs dans les reseaux reguliers de points.
FR2931963A1 (fr) 2008-06-02 2009-12-04 Centre Nat Rech Scient Procede de traitement de donnees numeriques
WO2010001020A2 (fr) 2008-06-06 2010-01-07 France Telecom Codage/decodage par plans de bits, perfectionne
GB2464447B (en) * 2008-07-01 2011-02-23 Toshiba Res Europ Ltd Wireless communications apparatus
CN101430881B (zh) * 2008-11-10 2013-04-17 华为技术有限公司 一种编码、解码、编解码方法、编解码系统以及相关装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1188957A (zh) * 1996-09-24 1998-07-29 索尼公司 矢量量化方法和语音编码方法及其装置
WO1999033185A1 (fr) * 1997-12-22 1999-07-01 France Telecom S.A. Procede de codage d'un vecteur d'un reseau representatif d'un signal quantifie et procede de decodage correspondant
CN1659785A (zh) * 2002-05-31 2005-08-24 沃伊斯亚吉公司 信号多速率点阵矢量量化的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FONTELES, L.H.ETC.: "《Indexing Zn Lattice Vectors for Generalized Gaussian Distributions》", 《INFORMATION THEORY》 *

Also Published As

Publication number Publication date
CN102084595B (zh) 2014-11-12
US8745110B2 (en) 2014-06-03
US20110131433A1 (en) 2011-06-02
WO2009156606A2 (fr) 2009-12-30
FR2931964A1 (fr) 2009-12-04
KR101577848B1 (ko) 2015-12-15
CA2725809A1 (fr) 2009-12-30
JP2011522497A (ja) 2011-07-28
KR20110033154A (ko) 2011-03-30
WO2009156606A3 (fr) 2010-10-07
EP2289172B1 (fr) 2018-07-04
WO2009156606A8 (fr) 2010-11-04
EP2289172A2 (fr) 2011-03-02
JP5580295B2 (ja) 2014-08-27

Similar Documents

Publication Publication Date Title
CN100518325C (zh) 用于视频压缩的组合的游程长度编码和可变长度编码
CN100553152C (zh) 基于cabac的编码方法和设备及解码方法和设备
CN109450596B (zh) 编码方法、解码方法、编码设备、解码设备、存储介质及终端
US8990217B2 (en) Lossless compression of high nominal-range data
CN102084594B (zh) 用于处理数字数据的方法
KR101790463B1 (ko) 오디오/비디오 샘플 벡터의 피라미드 벡터 양자화 인덱싱 및 디인덱싱을 위한 방법 및 장치
CN101212685B (zh) 对图像进行编码/解码的方法和设备
CN103067022A (zh) 一种整型数据无损压缩方法、解压缩方法及装置
CN101842988A (zh) 基于概率表动态计算的符号平面编码/解码
CN101430881A (zh) 一种编码、解码、编解码方法、编解码系统以及相关装置
KR20130001494A (ko) 폴라 코드 시퀀스를 이용한 디코딩 방법
CN114424568A (zh) 预测方法、编码器、解码器及计算机存储介质
US20230101072A1 (en) Nearest neighbour search method, encoder, decoder and storage medium
CN102084595B (zh) 用于对规则点网中的矢量进行计数的方法
JP5570409B2 (ja) データ圧縮装置及びデータ圧縮方法及びデータ圧縮プログラム
EP1341314A2 (en) Improved huffman decoding method and apparatus
WO2011097963A1 (zh) 编码方法、解码方法、编码器和解码器
CN108574849A (zh) Dct逆变换方法、逆变换装置、电子设备及存储介质
WO2007102518A1 (ja) 算術符号化装置、算術符号化方法、算術符号化プログラム及びプログラムを格納したコンピュータで読み取り可能な記録媒体
CN102132342B (zh) 一种通过内插滤波器更新编码器的方法
Sano et al. Segment-parallel predictor for FPGA-based hardware compressor and decompressor of floating-point data streams to enhance memory I/O bandwidth
CN104679775A (zh) 一种基于Huffman表的数据处理方法
JP5087166B2 (ja) 符号表選択方法、符号化装置、及びプログラム
Lorandel et al. Efficient compression technique for noc-based deep neural network accelerators
Liu et al. A simple and real-time parallel compression of time series scientific simulation data for interactive and cooperative supercomputing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20141112

Termination date: 20190527