CN102084595A

CN102084595A - 用于对规则点网中的矢量进行计数的方法

Info

Publication number: CN102084595A
Application number: CN2009801255857A
Authority: CN
Inventors: 马克·安东尼尼; 莱昂纳多·海德·方特赖斯
Original assignee: Centre National de la Recherche Scientifique CNRS; Universite de Nice Sophia Antipolis UNSA
Current assignee: Centre National de la Recherche Scientifique CNRS; Universite de Nice Sophia Antipolis UNSA
Priority date: 2008-06-02
Filing date: 2009-05-27
Publication date: 2011-06-01
Anticipated expiration: 2029-05-27
Also published as: CN102084595B; US8745110B2; US20110131433A1; WO2009156606A2; FR2931964A1; KR101577848B1; CA2725809A1; JP2011522497A; KR20110033154A; WO2009156606A3; EP2289172B1; WO2009156606A8; EP2289172A2; JP5580295B2

Abstract

本发明涉及一种用于估计范数l_p等于坐标小于或等于k的d维首领矢量数目的方法。所述方法的特征在于，通过函数T(x_i)对于在1到d之间变化的i的结果的和确定

所述函数T(x_i)为所述首领矢量中的至少一些提供坐标x_i的p次幂除以精度因子δ的结果，所述除法的结果四舍五入到最接近的整数。所述方法不包括确定首领矢量的步骤。

Description

用于对规则点网中的矢量进行计数的方法

技术领域

本发明涉及数字数据处理领域，着眼于诸如数字数据压缩、数字数据搜索、数字数据比较或数字数据解压缩之类的应用。本发明涉及视听数据、更具体为各种类型数字数据的处理。本发明的目的是减少与计算能力和内存需求有关的处理时间以及计算资源需求。

这些应用特别地但不排它地涉及需要超大量数据来对其进行描述的图像的处理。为了减少传输时间和存储所需的大小，通过提取将被单独编码的可视信息来压缩信息。该编码的信息必须在频率和空间方面处于最优形式，以允许最优再现、同时避免任何不利于编码性能的冗余。为此目的，已知使用小波变换技术，其坐标构成随后经受矢量量化(vector quantisation)步骤的矢量网。

矢量量化(VQ)的原理是对形成矢量的样本序列进行编码，而不是对每个样本单独编码。编码是通过用属于通常被称为“码本”(codebook)的目录形式的矢量对要被编码的序列进行近似来完成的。码本的每个矢量都被编以索引。编码期间，将使用最接近要被编码的样本序列的矢量的索引来表示要被编码的样本序列。

已知解决方案需要确定每个矢量、将其记录在内存中，然后对所有矢量进行处理，以对这些矢量进行计数。矢量基(vector base)可能需要数千兆(gigabyte)字节，并且这样大的基所需的计算时间超长。本发明的目的是提出一种避免这些缺陷的计数和索引方法。

背景技术

现有技术中已知国际专利申请WO9933185，其涉及一种编码方法，该方法包括：确定被称为首领(leader)矢量的矢量，该矢量包括与量化矢量相同、但按预定次序排列的分量；然后确定在所述形成的矢量集合中，所述量化矢量的等级或级别，这些矢量具有与首领矢量相同、并按预定方式排列在所述集合中的分量。该方法然后包括一方面根据表示因此确定的所述首领矢量的索引、另一方面根据所述级别来形成编码。

设计用于压缩的代数矢量量化器遇到的主要困难与对规则点网(其构成量化字典)中的矢量进行计数和编索引的问题相关。我们在此呈现在广义高斯分布源的情况下(例如小波系数)我们为解决这些问题而提出的解决方案。

代数矢量量化

迄今为止，对量化的研究已有几十年，完成的工作已经形成了关于速率/失真理论的如今已成为常规的许多成果。特别地，已经证明当需要固定长度编码时，与标量量化(SQ)相比，矢量量化(VQ)具有许多优点。此外，香农(Shannon)的工作已经证明，如果量化矢量的维数n足够大，则VQ的性能接近最优理论性能。

然而，重要的是，应注意到，VQ达到这些最优性能要以高计算复杂度为代价；复杂度随矢量维数呈指数增加。通常，使用根据表示源的统计数据(学习序列)构造的非结构式字典来执行VQ。在这种情况下，由于字典大小导致的复杂度和存储需求是压缩应用所无法承受的。此外，存在这样的字典稳健性(robustness)问题：虽然对于给定的学习序列是优化的，但对于学习序列外面的图像给出很差性能。克服这些问题的一个解决方案是使用n-维结构式VQ，例如代数矢量量化(AVQ)或关于规则点网的矢量量化。当字典的矢量被强迫属于结构式规则网时，AVQ的性能一般比非结构式VQ的性能差。

然而，在大多数应用中，该轻微缺点被以下事实抵消：对于AVQ，不需要生成或存储字典，并且降低了编码复杂度。

可将规则点网的量化看作是均匀标量量化的扩展。如在非结构式VQ的情况中那样，在文档的其余部分，术语AVQ将用于或者表示矢量量化，或者表示矢量量化器。AVQ考虑矢量系数与分割排列的增益之间的空间依赖性。无论源分布为何，AVQ总是比SQ更有效。

Rⁿ表示的规则点网由构成该网的基{y|y＝u₁a₁+u₂a₂+...+u_na_n}的一组线性无关的矢量a_i的所有可能的组合组成，其中系数u_i是整数。因而空间的分割是规则的，并仅取决于选择的基矢量。每个基定义不同的规则点网。与通过基于广义Lloyd算法的算法而设计的VQ相比，AVQ提供了相当大地降低计算和存储成本的可能性。这是因为使用规则网矢量作为量化值消除了构造字典的操作：通过选择的网的结构隐式地构造字典。Conway和Sloane发表在IEEE Trans.On Information Theory，vol.28，n^o2，pp.227-232March 1982上的文章“Fast quantizing and decoding algorithms for quantizers and codes”描述了简单地使用计数操作且仅依赖于矢量的维数n的快速量化算法。1979年，Gersho做出猜想，在渐进情况下(即对于高速率)，AVQ的速率/失真性能接近最优。然而，尽管AVQ对于低速率在数学上不是最优的，但这种量化器给予的复杂度的降低使得能够使用大维数的矢量，对于给定速率产生了更好的实验性能。能通过将AVQ与熵编码器组合来得到好的速率/失真性能，这促进了小波领域中关于AVQ的一些工作。已经针对高斯和拉普拉斯源进行了关于VQ的许多理论工作；然而，在衰减参数小于1的广义高斯类型源的情况下，证明了在速率/失真方面，立方网Zⁿ要好于网E₈和网Leech。该结果鼓励了我们将AVQ与小波变换相结合的工作。

发明内容

本发明要解决的问题

尽管由于字典的规则几何结构，通过AVQ量化并不是很复杂，然而其实现并不直接。在非渐进模型的情况下，忽略超载噪音(overload noise)，因为我们假设使用可变长度编码和无限字典。实际上这提出了一定数量的具体问题，特别是在计算和存储方面的问题。在设计AVQ时可以提出两个基本问题：

a)索引：索引是独立于量化的操作。其包括向每个量化矢量分配索引，一旦被编码，则通过信道发送给解码器。

在压缩链中该操作是基本的。其实际上确定比特率并使得能无歧义地对矢量解码。已知方法在内存方面通常非常廉价，但是具有不容忽视的计算复杂度(递归算法)，或仅在特定情况下(特定网或截断(truncation)的类型)起作用。本发明涉及允许关于广义高斯类型分布的索引的更通用方法，导致了内存成本和计算成本之间的良好折衷。第一个专利提出了对此问题的解决方案。

b)计数。索引方法通常基于网的总体(population)的知识。因此我们必须能对依赖于源的分布的n-维面上(或n-维体积内)的网中的矢量进行计数。常规计数方法基于生成级数的使用。在此形式中，已经引入了函数Nu。它们允许在金字塔(pyramid)上，即在拉普拉斯分布的情况下进行计数。

本发明更具体地涉及在广义高斯类型分布上计数的步骤，实现了内存成本和计算成本之间的良好折衷。第二个专利提出了对此问题的解决方案。我们的贡献主要在于计数和索引，以及在图像或视频压缩应用中AVQ的实现。这两种方法以及AVQ的使用对于音频信号(声音、语音、音乐)的压缩也完全有效。

为此，根据其一般承诺，本发明涉及一种用于估计范数l_p等于

坐标小于或等于k的d维首领矢量的数目的方法，其特征在于，通过函数T(x_i)对于在1到d之间变化的i的结果的和确定

所述函数T(x_i)为所述首领矢量中的至少一些提供坐标x_i的p次幂除以精度因子δ的结果，所述除法的结果四舍五入到最接近的整数，所述方法不包括确定首领矢量的步骤。

优选地，对于在d和1之间的n值，对函数

的结果进行求和，其中u在最小值u_min(r，n)和k之间变化，所述函数

提供范数坐标小于或等于k的n维首领矢量的数量，所述函数u_min提供满足T(u)大于或等于r/n的最小整数值u。

有利地，进行在先初始化步骤，包括对于n＝l，为函数

赋予与小于或等于k的u的可能值数目相对应的一个值，使得T(u)＝r，然后执行所述求和步骤。

本发明还涉及估计方法的应用，用于估计数据压缩率以及用于为首领矢量编索引。

附图说明

阅读了参照附图的非限制示例实施方式之后，将更好地理解本发明，附图中：

图1示出了对于网Z²的

p＝0.4且δ＝0.3的包络线示例，

图2示出了对于p＝1、δ＝1且B＝4来说通常方法和提出的方法的内存需求之间的比较，

附录1和附录2示出用于实现本发明的计数算法的两个示例。

具体实施方式

网矢量的索引是网量化应用中的重要问题。本发明涉及使用网首领矢量以及分拆理论(theory of partitions)语境的对该问题的解决方案。其对广义高斯分布源起作用并允许使用乘积码。还使得能为高维矢量编索引。

如果矢量维数任意高，矢量量化(VQ)可使得获得最优理论性能是可能的。遗憾的是，最优非结构式VQ(例如LBG)的计算复杂度随维数呈指数增长。此外，存储需求可能非常大。对该维数问题的一个解决方案是使用受约束的VQ，例如网矢量量化(LVQ)。

LVQ方法导致了码矢量规则地分布在空间中的结构式字典的设计。因此，可通过根据其分布的形式为网矢量编索引来对源自适应，而不是优化矢量在空间中的位置。对于大多数真实数据源来说，这可以通过使用乘积码来有效地完成，导致了对称单峰源分布的最优速率/失真折衷。

事实上，能将这样的分布解释为一组根据源分布具有相同形式的同心超曲面。然后能通过分配与各个面的范数(半径)相对应的第一索引(前缀)和与属于同一面的矢量的计数相对应的第二单一索引(后缀)来为网码字编索引。

大量重要数据源(例如子带话音和图像系数，特别是通过小波变换得到的那些)能通过广义高斯分布模型化。该分布族通过单变量随机变量的唯一形状因子p(GG(p))而参数化。具有分布(GG(p))的源的一个有趣特性是，范数l_p的包络线对应于常概率面。这导致了有效乘积码的发展。

即使前缀的计算较平凡，但后缀需要位于给定超曲面上的网矢量的计数和索引。此外，由于位于包络线上的矢量数随范数而极大地增长，空间维数的增加可能使得索引操作非常复杂，如下表所示，其示出了对于网Zⁿ以及不同维数和范数值，在范数l₁的情况下，给定正四面体锥(hyperpyramid)的首领数目以及位于该正四面体锥上的网矢量总数(基数)的比较。

在文献中，一般根据两种不同技术执行后缀的索引。

第一种考虑位于给定超曲面上的矢量总数(基数)来赋予索引。另一种方法利用网的对称，使用首领(leader)概念。范数l_p的包络线的首领对应于一些网矢量，根据这些网矢量，能通过其坐标的置换(permutation)和符号变化来得到位于对应包络线上的所有其它网矢量。对于各向同性源来说，这两种方法的趋势是具有类似的速率/失真性能。

然而，关于网索引的大多数著作仅为拉普拉斯或高斯分布提出解决方案，这两种分布是GG(p)的特定情况，形状参数分别为p＝1和p＝2。少数作者提出了对于特定情况p＝0.5的解决方案。然而，该计数方法不能构造乘数码，且在实践中索引方法非常复杂，对于具有高维数和范数的p≠0.5，1或2来说，尤其如此。

本发明提出了对位于0＜p≤2的包络线GG(p)上的网矢量Zⁿ计数、首领类型的索引方法的新颖替代方案，并使用分拆理论。分拆理论的使用使得我们能够克服为了生成首领并为其编索引的复杂度和存储需求。我们提出了一种经济的计数算法，对半径为r、维数为d、最强坐标为k的包络线的首领数目进行计数，用于例如对首领进行索引以及对速率进行估计等应用。

在下面的描述中，第一部分展示了LVQ的原理，并描述了索引/计数问题。第二部分提出了对超大规模的LVQ码本进行计数的有效解决方案，而无论形状参数p为何。描述然后说明了提出的方法在内存方面的代价。

2.网矢量索引

2.1网的定义

以Rⁿ表示的网Λ由一组线性无关的矢量a_i(网的基)的任意积分组合组成，使得：

Λ＝{x|x＝u₁a₁+u₂a₂+...u_na_n}(1)

其中u_i是整数。空间分割因此是规则的，并仅取决于选择的基矢量a_i∈R^m(m≥n)。必须注意，每组基矢量定义了不同的网。

可以认为网的每个矢量v属于包含具有由下式给出的固定范数l_p的矢量的曲面或超曲面：

{| | v | |}_{p} = {(Σ_{i = 1}^{n} {| v_{i} |}^{p})}^{\frac{1}{p}} .

然后能使用乘积码对给定网矢量编码。很明显，如果源矢量的分布是拉普拉斯分布，则合适的乘积码包含与矢量的范数l₁相对应的前缀，以及与其在具有等于讨论中的范数l₁的半径的正四面体锥上的位置相对应的后缀。固定范数l₁的超曲面称为正四面体锥。能使用计数算法得到矢量在超曲面上的位置。这样的乘积码保证了解码的唯一性。

在广义高斯分布源的形状参数小于或等于1的情况下，D₄、E₈上的立方网Zⁿ或网Leech的优越性已经被证明[12]。因此，本文剩余部分关注基于立方网Zⁿ的LVQ设计。

2.2基于总计数的索引

现有技术中已知一些为高斯或拉普拉斯分布的情况、以及为基于总计数原理的不同网提出的计数解决方案。特别地，在拉普拉斯源分布的情况下以及对于网Zⁿ，已知一种用于对位于范数l₁的正四面体锥上的网矢量的总数进行计数的递归公式。该计数公式已经扩展到形状因子p位于0和2之间的广义高斯源分布。这些解决方案使得确定位于给定截断范数l_p内的矢量数是可能的，但是它们没有提出为网Zⁿ的矢量分配实际索引的算法。此外，该解决方案不确定位于给定超曲面上的矢量数，使得很难使用乘积码。

现有技术的著作提出的算法对于0＜p≤2根据乘积码方案为矢量编索引。其基于广义θ级数(theta series)[4]并使用网几何。对于p＝1或2，该级数的展开相对简单。然而，对于其它p值，因为不产生闭合的形状，并且禁止使用形式数学(formal mathematics)，该级数的展开非常复杂。对于提出的解决方案，有必要确定各个维数和高维数的每个可能的范数值，这在有限时间内往往是不可行的。

此外，假定超曲面的基数可迅速达到对于实际实现、特别对于高维数(见下面的表)来说难解(intractable)的值，则基于包络线的基数的索引技术可迅速超过计算精度。

2.3基于首领的索引

基于首领的方法利用了网的对称。这些方法使用关于固定范数包络线的有效索引算法，并且在称为首领的少数矢量的基础上、而不是在网的所有矢量的基础上赋予索引。分别处理网的不同对称，与总计数技术相比，构成了不都存在对称时更有效的为源编索引的方法。此外，由编码算法管理的索引比包络线的基数要小的多，这使得对于给定二进制精度，能为不能由基于总计数的方法进行索引的矢量编索引。

在乘积码体系中，除了网的对称之外，后缀索引包含少量矢量(首领)的索引，根据这些矢量，能分配超曲面的所有其它矢量。对于网Zⁿ，对称对应于两种基本操作：矢量坐标符号的改变以及置换。第一种操作对应于矢量所在卦限(octant)的改变。例如，2维矢量(7，-3)在第四卦限，而矢量(-7，-3)在第三卦限。这些矢量相对于y轴对称。第二种操作对应于卦限内对称，例如，矢量(-7，3)和(-3，7)都在第二卦限且相对于卦限的平分线对称。在这种情况下，可以看出，所有这些矢量都能根据矢量(3，7)的置换和符号变化而产生，矢量(3，7)是所有这些矢量的首领。利用所有的置换和符号变化，首领(3，7)能表示8个矢量。该比例随着超曲面的维数而快速增长(见表1)。

因此，该索引方法为每个矢量分配一组三个索引：一个对应于其首领，另两个对应于首领的置换和首领的符号变化，而不是直接为超曲面上的所有矢量编索引。关于计算置换和符号索引的方法的更多细节见1′[5]。

3.提出的计数方法

本发明提出了对首领进行计数的解决方案。为了更好地理解有关这种计数算法的使用，我们将在下面给出为首领编索引的使用的非限制性示例。首先，我们将谈到范数l₁的索引，其次，我们将给出更一般情况范数l_p的示例。

接下来，在3.3节，我们将详述本发明。

3.1对于范数l₁的首领索引

3.1.1原理

提出的计数算法应用到的用于为首领编索引的方法基于按反字典序(in reverse lexicographical order)将所有首领分类、并根据要被编索引的首领之前的首领数赋予索引。在此情况下，索引不再基于资源消耗高或直接寻址的搜索算法，而是基于低成本计数算法，该算法仅依靠首领数量而非每个首领的具体知识，这使得能避免构造转换表。

半径为r的正四面体锥由所有矢量v＝(v₁，v₂，...，v_d)组成，从而||v||₁＝r。如前所述，首领是超曲面的基本矢量，根据首领进行置换和符号变化操作得到位于该超曲面上的所有其它矢量。事实上，首领是具有以升序(或降序)排序的正坐标的矢量。因此，等于r的范数l₁的d维首领是满足以下条件的矢量：

1 - Σ_{i = 1}^{d} v_{i} = r;

2-对于i＜j并且i，j∈[1，d]，0≤v_i≤v_j。

3.1.2与分拆理论的关联

在范数l₁的情况下，可以注意到，3.1.1节所列的条件与数论中的分拆理论相关。事实上，在数论中，正整数r的分拆是将r写成d个正整数(也称为部分)的和的方式。分拆函数P(r)给出r的不同分拆的数目(与次序无关)，从而

Σ_{r = 0}^{\infty} P (r) y^{r} = Π_{d = 1}^{\infty} (\frac{1}{1 - y^{d}}) - - - (2)

其对应于欧拉函数的倒数，也称为级数q[10，16，17]。附加的数学展开得到了函数P(r)的表示，使得能加速计算。

例如，对于r＝5，方程(2)给出了结果P(5)＝7。事实上，数字5所有可能的分拆是(5)、(1，4)、(2，3)、(1，1，3)、(1，2，2)、(1，1，1，2)和(1，1，1，1，1)。通过用5维矢量的形式重写这些分拆，例如(0，0，0，0，5)、(0，0，0，1，4)、(0，0，0，2，3)、(0，0，1，1，3)、(0，0，1，2，2)、(0，1，1，1，2)和(1，1，1，1，1)，我们看到这些正好对应于范数r＝5和维数d＝5的正四面体锥的首领，也就是说，这些是范数r＝5和维数d＝5的正四面体锥中满足3.1.1节的两个条件的仅有的矢量。

然而，我们一般关心d维网中等于r的范数l1的包络线，其中r≠d。在这种情况下，能使用函数q(r，d)[10，18]，该函数计算具有不超过d个部分的r的分拆数目(在分拆理论中，这等同于计算r的、包括任意元素的部分数都不大于d的分拆数目)。因此，对于范数r＝5和维数d＝3的正四面体锥，我们得到q(5，3)＝5，也就是说，由(0，0，5)、(0，1，4)、(0，2，3)、(1，1，3)和(1，2，2)给出5个首领。

能根据下述递归方程计算函数q(r，d)：

q(r，d)＝q(r，d-1)+q(r-d，d) (3)

其中对于d≥r，q(r，d)＝P(r)，q(1，d)＝1且q(r，0)＝0。

3.1.3为首领编索引而对函数q(r，d)的使用

如下面所描述的，方程(3)不仅给出位于给定正四面体锥上的首领的总数，还能用于运行时为首领分配唯一索引，而无需转换表。为了说明提出的算法的原理，我们假设给定正四面体锥的首领按反字典序如下分类：

因此，首领l的索引对应于其前面的首领的数目。在上面描述的示例中，首领(0，...，1，1，r_n-2)必须被分配给索引3。

数学命题1描述了提出的为首领编索引的算法：

命题1。设v＝(v₁，v₂，...，v_n)为位于固定范数l₁的包络线上的首领l＝(x₁，x₂，...，x_n)的网矢量Zⁿ。其首领索引I₁由下式给出：

其中

计算具有不超过小于或等于k的d部分的r的分拆数目，

且x_n+1＝+∞。

证明。我们考虑为维数为n和范数l₁为

的首领l＝(x₁，x₂，...，x_n)编索引。由于首领按反字典序排序，置于1之前的第一组首领由第n个分量严格大于x_n的所有首领组成，这就是说，由具有满足x_n+1≤g_n≤r_n的最高坐标g_n的所有首领组成。

为了对该第一组中的首领数目进行计数，而不列出所有，我们使用分拆函数q(r，d)。事实上，使用下面的推论可以容易地计算出第n个坐标等于g_n的首领的数目：

推论：计算最大坐标等于g_n的范数为r_n维数为n的首领的数目相当于计算具有不超过n-1部分、每部分都不大于g_n的数字r_n-g_n的分拆数目。

在大多数情况下，我们能通过应用q(r_n-g_n，n-1)对该分拆数进行计数。然而，该方法仅当r_n-g_n≤g_n时有效，在这种情况下隐含地假设r_n-g_n的所有分拆没有大于g_n的部分。然而，在不保证r_n-g_n≤g_n的更一般的情况下(例如，最大部分等于7的范数r_n＝20和维数n＝5的首领数目将得到q(20-7，5-1)＝q(13，4)，其中20-7＞7)，由于r_n-g_n的一些分拆将使其最大部分超过g_n，在这种情况下将不能遵守3.1.1节的条件2，因而q(r_n-g_n，n-1)的计算将得到错误的有效首领数。

在这种情况下，我们必须对分拆数目的计算应用第二约束：最大部分的值。我们因此引入由函数

得到的归纳

其计算具有不超过d部分且任一部分都不大于k的给定数字r的分拆数目。通过计数算法完成

的计算，计数算法例如是作为本发明主题的算法。

因此，我们能通过应用

计算有效首领的正确数目。因此，g_n的从x_n+1到r_n的变化使得能确定最大坐标严格大于x_n的首领的数目，由下式给出：

Σ_{i = x_{n} + 1}^{r_{n}} \overset{&OverBar;}{q} (r_{n} - i, n - 1, i) - - - (5)

其中假设

且

在这种情况下，我们使用数论中使用的集合符号，其中Z⁺表示所有正整数{i∈Z|i＞0}，Z^*表示所有非负整数{i∈Z|i＞0}。

1之前的第二组首领由第n个坐标等于X_n、但第(n-1)个坐标严格大于x_n-1的所有首领组成。为了对该首领数目进行计数，我们能使用前面提到的相同的推论，但是这次应用到n-1维。然后我们能通过使g_n-1从x_n-1+1变化到min(x_nr_n-1)、使用

或

来计算最大分量g_n＝x_n且第二大分量g_n-1＞x_n-1的首领的数目。min函数保证了符合范数r_n以及g_n-1≤g_n＝x_n。

等待附加维数的结果时，能由下式得到l之前的最高坐标等于x_n的首领的数目：

方程(5)和(6)的组合产生了用于计算置于l之前的首领的总数、以及因此l的索引I₁的通式(方程(4))：

其中对于j＝0，x_n+1＝+∞。

3.2范数l_p的情况的归纳

为了计算位于固定范数l_p的包络线之上的矢量v＝(v₁，v₂，...，v_n)的首领l＝(x₁，x₂，...，x_n)的索引，其中0＜p≤2，应用与l₁的情况相同的原理。按反字典序列出首领，并使用同样的计数方法赋予索引。因此方程(4)的结构再次适用，其中关于i的总和利用函数

根据给定坐标计算首领数目，关于j的总和允许对维数递归。

然而，

的使用暗含地表示范数r的和项

是整数，并且可以是区间[0，r]内的任意整数。很明显这对于p＝1有效，其中和项是正整数网坐标自身。另一方面，对于p≠1，和项不必是整数，或可不必是区间[0，r]内的任意整数(例如，对于p＝2，和项是整数，但仅是平方数)。

可通过将

四舍五入到精度为δ的最接近整数来解决该问题。[7，9]中使用了类似的技术。该运算引入了由所有整数

组成的新的整数子集其中[·]是最接近的整数且x_i∈Z^*。

则得知矢量的范数l_p具有精度δ，且由下式得到：

r_{δ, n}^{p} = Σ_{i = 1}^{n} {\overset{&OverBar;}{x}}_{i} = Σ_{i = 1}^{n} [\frac{x_{i}^{p}}{δ}] - - - (7)

其中精度δ限定了固定范数的包络线宽度，随着其值增加，包括更多矢量(见图2)。

图1：对于网Z²的p＝0.4且δ＝0.3的包络线的示例。

因此，计算固定范数l_p中矢量的首领索引对应于计算整数的分拆的正确数目，但是仅使用属于子集

的整数。数学命题2描述了对于l_p的情况提出的索引算法：

命题2。设v＝(v₁，v₂，...，v_n)为位于固定范数l_p的包络线上的首领l＝(x₁，x₂，m，x_n)的网矢量Zⁿ。其首领索引I₁由下式给出：

其中

计算具有不超过小于或等于k∈Z^*的d部分的

的分拆数目，

且x_n+1＝+∞。f(a)返回最大值i∈Z^*，从而对于

和

t(i)≤a。

证明：我们考虑为维数为n和范数l_p为

的首领l＝(x₁，x₂，...，x_n)编索引。如前所述，我们提出使用与方程(4)相同的原理。然而，由于p≠1时范数l_p的和项不总是整数，因而不再能使用函数

将

四舍五入到精度δ的最接近整数使得能根据正整数值

的总和得到整数范数

如方程(7)中所定义的。因此，能通过对将

写成的和的不同方式的数目进行计数，来计算精度为δ位于p≠1的包络线上的首领l的索引，其中是t：

定义的函数t的整个图像，匹配其中

重要的是，这里注意，鉴于Z^*的不同值能与

中的相同值匹配，取决于p和δ的值，函数t可表示非内射函数。因此，不同首领

在中能具有相同表示，并且用于对中的分拆数目计数的任意朴素法(naive procedure)将不仅导致错误首领索引，还导致将相同的错误索引被赋予不同首领。

我们定义解决方案，函数

为对具有不超过d部分的的分拆数目计数，其中

给定每部分，对于i，k∈Z^*，不存在i大于k。应该注意，间接使用Z^*的值k的对中最大部分的值的约束使得能计数导致

中产生相同分拆的不同首领的数目。

因此，使用

对于范数l_p方程式(4)能扩展为：

其中f(a)返回最大值i∈Z^*，使得对于

t(i)≤a。

通过使方程(9)中的j从0变化到n-2，对于坐标x_n到x₂正确地对l之前的首领数目进行计数。在范数l₁的情况下，鉴于存在

的单个值x₁∈Z^*，计算以前的首领的总数是充分条件。然而，对于范数l_p，由于函数t的非内射，一些值x₁∈Z^*导致

是可能的。因此，为了保证索引的唯一性，计算

和x₁之间的差，并添加到方程(9)的结果中，以便得到由方程(8)给出的唯一可解码首领索引：

鉴于

可能大于x₂，而x₁可能小于或等于x₂，需要min函数。通过计数算法完成

的计算。在下一节，我们公开作为本发明主题的算法。

3.3计数算法

提出的函数

被定义为等于具有不超过d部分、最大部分为t(i)的范数

的分拆数目，其中i≤k。因此，我们对维数进行递归如下计算

{\overset{&OverBar;}{q}}_{δ}^{p} (r, d, k) = Σ_{i = i_{\min} (r, d)}^{k} {\overset{&OverBar;}{q}}_{δ}^{p} (r - t (i), d - 1, t) - - - (10)

其中imin(r，d)提供满足

的i∈Z^*的最小值。这表示按反字典顺序的范数

以及维数为d的最后分拆的主要部分。

对于维数d＝1，初始化

其中不同正整数的数目i≤k，从而t(i)＝r。例如，对于p＝0.5和δ＝0.1，鉴于使用函数t仅当i＝32和

时在

中匹配r＝57，我们如此定义

如果k≤31为0，如果k＝32为1，如果k≥32为2。

应该注意，鉴于对于p＝1和δ＝1，我们得到

因此函数

是函数

的归纳。

附录中呈现的算法1和算法2初始化并计算

3.4内存成本

在不在线计算

的情况下，能如下面描述的那样计算内存需求。

能将存储的

解释为三维表，其中第一个输入是值

第二个是维数d∈Z⁺，第三个是最大网值k∈Z^*。则预计最大内存需求是r·d·k·B字节，其中B是的每个元素的字节数。

然而，对于给定最大范数

以及维数d，有效编码和解码步骤的限制更低。这是因为，根据方程(8)和(10)，可以看出当j＝0且i＝imin(r，d)时，得到

的前两个输入变量的最大值。在这种情况下，我们计算

因此，使用区间

上的第一输入变量(与范数相关)以及区间[1，d-1]上的第二输入变量(与维数相关)就足够了。

能根据r确定k的值。由于仅当

时需要第二约束，能在

时确定k的最大值，以便为具有位于区间[0，r]内的范数以及维数为[1，d]的任意首领编索引。因此，由下式给出编码和解码步骤的内存成本上限：

应该注意，内存需求主要取决于包络线的范数和维数。首领数目决定B的选择。

图3示出了使用索引算法的节省内存，其中表

离线计算。内存需求根据p＝1、δ＝1且B＝4(即整数型数据)时的半径r由方程(13)表示，并与如[5]中描述的基于首领的常规方法的内存上限进行比较。应该注意，即使维数和半径分别低到16和20，常规方法也需要不超过10千兆字节(gigabyte)的内存，而提出的方法需要少于100千字节(kilobyte)。

极小的内存需求以及不必知道所有首领的事实使得能为高达64、128、256、512等维数的网矢量编索引。在现有工作中，实际应用限制在16维。

附录

计数算法

算法1

/＊表

[r][d][k]的构造。对于最大范数值

以及维数d，该算法创建

维3-D表

r_bckp＝r；

k＝f[floor((double)r/2.)]；

r＝r-ceil((double)r/(double)d)；

d--；

//初始化

for(j＝1；j＜d；R++)

{

for(R＝1；R＜＝r；R++)

{

N_p＝0；

for(i＝imin(R，j+1)；i＜＝f[R]；i++)

{

rmd＝R-t[i]；

if(t[i]＞rmd)//没有第二约束

N_{p} + = {\overset{&OverBar;}{q}}_{δ}^{p} [rmd] [j - 1] [0];

else

N_{p} + = {\overset{&OverBar;}{q}}_{δ}^{p} [rmd] [j - 1] [i];

if(i＜＝k)

//有第二约束的值

}

//没有第二约束的值

}

return

；//函数在此结束

/＊算法2详细说明了函数init(r_bckp，r，d，k)。

函数imin(r，d)提供了最小值i∈Z＊，使得

(见方程(？？？).)＊/

算法2

/＊用于初始化表

[r][d][k]的函数init(r_bckp，r，d，k)，以及算法1中使用的矢量f和t的创建。＊/

//(r+1)x d x(k+1)维零表

f＝0_rbckp+1；//r_bckp+1维零矢量

t＝0_f(rbckp)+2；//f(r_bckp)+2维零矢量

f[r_bckp]＝f(r_bckp)；

for(i＝0；i＜＝f [r_bckp]；i++)

{

do{

if(t[i]＜＝r)

{

{\overset{&OverBar;}{q}}_{δ}^{p} [t [i]] [0] [0] + +; {/ /}^{a}

if(i＜＝k)

{\overset{&OverBar;}{q}}_{δ}^{p} [t [i]] [0] [i] = e [t [i]] [0] [0]; {/ /}^{b}

}

i++；

t[i]＝t(i)；

}while(t[i]＝＝t[i-1])；

i--；

f[t[i]]＝f(t[i])；

for(j＝t[i]+1；j＜min(t[i+1]，r_bckp)；j++)

f[j]＝f[t[i]]；

}

for(j＝1；j＜d；j++)//^c

{\overset{&OverBar;}{q}}_{δ}^{p} [0] [j] [0] = 1;

return

；//函数在此终止

/＊^a初始化

第一维，从0到r的所有范数没有第二约束。

^b初始化

第一维，从0到r的所有范数具有第二约束imin(t(i)，1)af(t(i))。

^c初始化

除第一维之外的维数，对于范数0没有第二约束。使用函数f和t分别初始化矢量f和t。＊/