CN114780781B

CN114780781B - 一种基于模糊聚类和非对称距离计算的乘积量化方法

Info

Publication number: CN114780781B
Application number: CN202210683090.3A
Authority: CN
Inventors: 刘鑫; 杨志祥; 丁雪峰; 程佳斌; 余将其; 皮辉; 杨小涛; 熊筠轲; 谈俊; 郭朝霞; 许雷; 范俊甫; 蔡烨彬; 谢倩
Original assignee: Csic Wuhan Lingjiu Hi Tech Co ltd
Current assignee: Csic Wuhan Lingjiu Hi Tech Co ltd
Priority date: 2022-06-17
Filing date: 2022-06-17
Publication date: 2022-09-23
Anticipated expiration: 2042-06-17
Also published as: CN114780781A

Abstract

本发明适用于计算机视觉和大数据领域，提供一种基于模糊聚类和非对称距离计算的乘积量化方法，本发明方法首先对于原始向量集进行初聚类，计算其残差向量集，通过对残差子向量模糊聚类，得到隶属度矩阵；然后根据隶属度进行子向量分类；对于查询向量按照相应方式进行加权距离计算，统计每个子段距离排名序号的和。本发明在乘积量化索引子空间向量聚类中应用了模糊聚类方法，避免了硬划分因样本类别分布不均匀造成的误差，使向量的聚类更客观；在相似度度量中采用了加权非对称距离计算和距离排名统计方法，避免了因向量某一段距离计算过大而产生的检索误差。本发明方法对比原始乘积向量方法在复杂背景图片的检索中精度更高。

Description

一种基于模糊聚类和非对称距离计算的乘积量化方法

技术领域

本发明属于计算机视觉和大数据技术领域，尤其涉及一种基于模糊聚类和非对称距离计算的乘积量化方法。

背景技术

伴随着计算机和互联网快速的飞度发展，网络上的信息也呈爆炸式的增长。在具体的如智慧交通、智能安防等实用领域中，动辄就会接入数百部、万部的摄像头和光电设备，这些机器汇聚成大规模的监控网络。在大型的景区、商场等场景中，往往一天就会产生几百太字节的视频数据，那么解决在如此大量的视频数据中快速、精确的搜索到目标图片的问题，将会带来很大的实际应用价值。

基于内容的图像检索技术，主流的分为两种：一种是乘积量化方法，一种是哈希方法。图像检索任务中大多对于精度的要求要高一些，所以乘积量化的方法应用更广泛。现有乘积量化方法在向量子空间中用QMeans聚类划分子向量，如果原始数据的类别不平衡，会导致分类结果很差。相似度度量使用的是非对称距离的计算和距离排名的方法确定Topk的样本，对于分段不均匀的样本向量，会使检索精度下降。

目前的图像检索方法，主要面临两个基本问题，一是面对大量的视频、图像数据，如何进行快速的搜索。二是有些图像的背景非常复杂，如何进行精确的搜索。现有方法均会存在上述问题。

发明内容

鉴于上述问题，本发明的目的在于提供一种基于模糊聚类和非对称距离计算的乘积量化方法，旨在解决现有方法的图像搜素速度和精度均不高的技术问题。

本发明采用如下技术方案：

所述基于模糊聚类和非对称距离计算的乘积量化方法，包括下述步骤：

步骤S1、对原始向量集进行初聚类，每个簇类分别计算其残差向量集，将残差向量集中残差向量切分多段，对每段残差子向量进行模糊聚类，输出隶属度矩阵；

步骤S2、根据所述隶属度矩阵，取每个残差子向量关于每个簇类的最大若干个隶属度进行子向量分类；

步骤S3、针对查询向量，将其划分到所属的初聚类簇类中并计算残差向量，然后将残差向量划分为若干子段，通过加权计算每子段到向量子空间所有聚类中心的加权距离；

步骤S4、计算查询向量所在的簇类中所有子段的加权距离，统计每个子段距离排名序号的和，其中最大的Q个值对应的样本即查询向量的Q近邻样本。

进一步的，所述步骤S1具体过程如下：

将图片库中的m张图片均转换成n维向量形成原始向量集，将原始向量集中的m个样本向量进行初聚类，划分为g个簇类，簇中心向量为

；

对于划分的g个簇类中的每个样本向量，计算其残差向量，形成残差向量集；

将n维的残差向量平均切分为s段，每段残差子向量的维度为

；

针对每段残差子向量进行模糊聚类，聚类分为k类，得到k个聚类中心，每段残差子向量属于某一类的隶属度为

，设定一个模糊聚类的目标函数J；

当前残差子向量的隶属度矩阵是一个h*k的矩阵，其中h为簇类中残差向量数量，聚类开始时，随机生成一个满足约束条件的隶属度，通过隶属度矩阵迭代以及聚类中心迭代，当目标函数J的取值趋于稳定时，停止迭代，得到最终的隶属度矩阵，其中矩阵的每一行代表一个样本，共有h个样本，矩阵的每一列每个值代表属于每个聚类的隶属度，共有k列。

进一步的，所述步骤S2具体过程如下：

根据残差子向量的隶属度矩阵，把每个残差子向量关于每个簇类的隶属度按从小到大排序，取最大的若干个隶属度进行子向量分类；

将每个簇类中的每个残差向量用数字id表示进行数字量化编码。

进一步的，所述步骤S3具体过程如下：

对于需要查询的图片，将其转化为n维向量形成查询向量，依次计算查询向量到g个簇类的聚类中心的欧氏距离，找到距其距离最短的聚类中心；

在查询向量所属的初聚类簇类中计算残差向量，把残差向量划分为若干子段，每一子段计算其到k个聚类中心的欧式距离，生成距离表。

进一步的，所述步骤S4具体过程如下：

计算查询向量所在的簇类中h个残差向量的每个子段到查询向量对应子段的距离，形成h个距离的距离集合；

把距离集合中的距离按从小到大排序，得到1到h的共h个排名序号，以排名序号给距离对应的子段打标签，每个残差向量的每个子段都有一个标签，得到h个排名序号编码的编码集合；

编码集合中，计算每个数字编码的数字之和，值按从小到大排序，形成新集合，新集合中排序前Q个值对应的样本，即为查询向量的Q近邻样本。

本发明的有益效果是：

1、现有乘积量化的子空间划分使用的QMeans聚类，其对离群数据的存在极为敏感，如果原始数据的类别不平衡，会导致分类结果很差；本发明采用模糊聚类的方法，避免了硬化分因样本类别分布不均匀造成的误差，使类簇中数据的关联度更高。

2、现有乘积量化的子空间划分使用的是非对称距离计算，其存在目标向量的量化误差；本发明采用模糊聚类后的样本隶属度进行加权距离计算，进一步减小距离计算误差，而且采用距离排名统计的方法确定近邻样本，使相似度度量结果更客观。

3、现有乘积量化方法在面对背景复杂图片的情况时，由于其聚类硬化分出错和非对称距离计算误差大，会使检索到的Q近邻样本相似度很低，本发明结合处两种改进的方法，提高了复杂背景图片的检索精度。

附图说明

图1是本发明实施例提供的基于模糊聚类和非对称距离计算的乘积量化方法的流程图；

图2是本发明实施例提供的残差子向量分类示意图；

图3是本发明实施例提供的向量量化编码示意图；

图4是本发明实施例提供的加权非对称距离计算示意图；

图5是本发明实施例提供的距离表和距离计算示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。

图1示出了本发明实施例提供的基于模糊聚类和非对称距离计算的乘积量化方法的流程，为了便于说明仅示出了与本发明实施例相关的部分。

步骤S1、对原始向量集进行初聚类，每个簇类分别计算其残差向量集，将残差向量集中残差向量切分多段，对每段残差子向量进行模糊聚类，输出隶属度矩阵。

本步骤主要实现对图片转化的向量进行初聚类，初聚类后的残差向量进行样本切分，对切分得到的残差子向量进行模糊聚类，得到隶属度矩阵。具体实现时，本步骤具体过程如下：

S11、将图片库中的m张图片均转换成n维向量形成原始向量集，将原始向量集中的m个样本向量进行初聚类，划分为g个簇类，簇中心向量为

。

假设图片库中有m张图片，将每张图片均转化成n维向量，表示为

：

用聚类算法将原始向量集中的m个样本向量划分为g个簇类，聚类得到的簇中心向量集为

，每个簇的簇中心向量

表示为：

S12、对于划分的g个簇类中的每个样本向量，计算其残差向量，形成残差向量集。

对于g个簇中的每个样本向量，计算其残差向量r，假设簇中心向量

代表的簇中有h个原始样本向量，则其h个残差向量

为：

每个簇中心向量

所代表的簇中包含的是原始样本向量的残差向量。

S13、将n维的残差向量平均切分为s段，每段残差子向量的维度为

。

为了便于描述，初聚类中簇中心向量

代表的簇作为样例，可知其中包含h个残差向量，设其向量空间为H，表示为：

把n维的残差向量平均切分为s段，每个段残差子向量的维度为

维。对于n和s，可取n=512，s=8，所有残差向量的残差子向量可表示为：

S14、针对每段残差子向量进行模糊聚类，聚类分为k类，得到k个聚类中心，每段残差子向量属于某一类的隶属度为

，设定一个模糊聚类的目标函数J。

残差子向量做模糊聚类，设定分为k类，那么就会得到k个聚类中心

，每段残差子向量

属于某一类

的隶属度为

，就此定义一个模糊聚类的目标函数J及其约束条件如下：

m是隶属度因子，

表示

到聚类中心

的欧氏距离。

S15、当前残差子向量的隶属度矩阵是一个h*k的矩阵，其中h为簇类中残差向量数量，聚类开始时，随机生成一个满足约束条件的隶属度，通过隶属度矩阵迭代以及聚类中心迭代，当目标函数J的取值趋于稳定时，停止迭代，得到最终的隶属度矩阵，其中矩阵的每一行代表一个样本，共有h个样本，矩阵的每一列每个值代表属于每个聚类的隶属度，共有k列。

本步骤通过隶属度矩阵迭代以及聚类中心迭代来得到隶属度矩阵，隶属度矩阵是h*k的矩阵。

隶属度

的迭代公式为：

聚类中心

的迭代公式：

类开始时，随机生成一个满足约束条件的

，通过聚类中心迭代公式可以求得

。重复隶属度迭代公式和聚类中心迭代公式。当目标函数J的取值趋于稳定，停止迭代。停止迭代的条件为：

其中

取一个极小的常数作为误差的阈值，t为迭代的轮数。当

满足条件时，可得到最终的聚类结果。

以一段残差子向量聚类结果的隶属度矩阵为例，其中矩阵的每一行代表一个样本，共有h个样本。每一列的每个值代表属于每个聚类的隶属度，共有k列。下面为模糊聚类迭代之后输出的隶属度矩阵结果：

例如：

。

步骤S2、根据所述隶属度矩阵，取每个残差子向量关于每个簇类的最大若干个隶属度进行子向量分类。

比如，取每个残差子向量关于每个簇类的排名前2的隶属度进行子向量的分类。那么每个残差子向量都可以用2个数字id来表述，整个残差向量就可以用2个8位的数字id来表示。本步骤具体过程如下：

S21、根据残差子向量的隶属度矩阵，把每个残差子向量关于每个簇类的隶属度按从小到大排序，取最大的若干个隶属度进行子向量分类。

按照上述的隶属度矩阵输出结果，把每个残差子向量关于每个簇类的隶属度按从小到大排序，取最大的若干隶属度进行子段向量的分类。以最大两个隶属度为例，残差子向量分类示意图如图2所示。

按照上述的表示方法，每个类可以用一个数字id来表示，那么k个聚类可以用1到k来代表。例如图2中残差子向量1可以用

两个id来表示，残差子向量h以

来表示。

S22、将每个簇类中的每个残差向量用数字id表示进行数字量化编码。

把初聚类后簇中的每个残差向量所划分的8段都以数字id来表示。完整的残差向量样本就可以表示为：

例如：

记U和U’为模糊聚类的两个聚类中心id。

聚类中心

所代表的g个簇类中包含的残差向量都量化为8位的数字编码。向量量化编码示意图如图3所示。

步骤S3、针对查询向量，将其划分到所属的初聚类簇类中并计算残差向量，然后将残差向量划分为若干子段，通过加权计算每子段到向量子空间所有聚类中心的加权距离。

本步骤具体过程如下：

S31、对于需要查询的图片，将其转化为n维向量形成查询向量，依次计算查询向量到g个簇类的聚类中心的欧氏距离，找到距其距离最短的聚类中心。

近似最近邻搜索的方法的结果取决于查询向量和库向量之间的距离，本实施例提出了一种加权求和的非对称距离计算方法，加权非对称距离计算示意图如图4所示。

考虑一个查询向量

和一个库中向量

。查询向量

经过步骤S1得出其残差向量

但没有进行量化编码，库向量

用其所属的两个模糊聚类中心

表示。由于存在量化编码的误差，向量

与

之间的距离为近似距离，表示为：

其中

为向量

属于所有聚类的最大两个隶属度。

然后针对本实施例的需要查询的图片，将其转化为n维向量，这里标记为查询向量ρ，依次计算查询向量ρ到步骤S11中g个初聚类中心的欧氏距离，找到距其距离最短的聚类中心：

把ρ归距离最短为那个类，然后计算其残差向量，表示为

。

S32、在查询向量所属的初聚类簇类中计算残差向量，把残差向量划分为若干子段，每一子段计算其到k个聚类中心的欧式距离，生成距离表。

在ρ所属的初聚类的类簇中进行，设此簇类中有h个库向量的残差向量。按照S1方式把

平均划分为8段，每一段计算其到k个聚类中心的欧式距离，生成k*8的距离表。假设

所在的簇类中h张库图片的残差向量的量化编码为：

那么h个残差向量每一子段到查询向量的对应子段的距离为：

其中

为h个残差向量的序号，

代表向量的第几段的序号。

表示查询向量的第

段到

所代表的类中心的距离。距离表和距离计算示意图如图5所示。

本步骤具体过程如下：

S41、计算查询向量所在的簇类中h个残差向量的每个子段到查询向量对应子段的距离，形成h个距离的距离集合。

以第一子段为例，查询向量

所在的簇类中h个残差向量的第一子段到查询向量第一子段的距离，其h个距离的距离集合为：

S42、把距离集合中的距离按从小到大排序，得到1到h的共h个排名序号，以排名序号给距离对应的子段打标签，每个残差向量的每个子段都有一个标签，得到h个排名序号编码的编码集合。

把距离集合中的距离按从小到大排序，有1到h共h个排名序号，以排名的序号给距离对应的子段打标签，那么每个残差向量的第一子段都会有一个标签。

把h个残差向量的其余7个子段都按上述的方法打标签。那么就会得到h个排名序号编码的编码集合，表示为：

其中

为8位的数字编码。

S43、编码集合中，计算每个数字编码的数字之和，值按从小到大排序，形成新集合，新集合中排序前Q个值对应的样本，即为查询向量的Q近邻样本。

计算每个

编码的8位数字之和，形成新集合，并按从小到大排序：

那么新集合中排序前Q个值对应的库中的样本，就是查询样本的Q近邻样本。

为了便于理解，下面列举一具体计算实例过程：

假设查询向量所在的初聚类簇类中第一张原始图片的残差向量为：

那么查询向量第一段到此残差向量第一段的距离可以计算为：

依次计算此簇类中所有的图片的残差向量的第一段到查询向量第一段的距离：

把这n段距离进行倒序排序，并按照排序的名次进行打标签。把此簇类中所有的图片的残差向量的其余7段，按照上述的方法进行距离计算并打标签。

假设此簇类中有2个样本排序名次8位数字编码分别为，样本1：

，样本2：

。

统计2个样本向量排序名次的和，样本1名次的和为24，样本2的名次的和为17。依据本方法可得出样本2的和查询向量更相似。

综上，本发明在乘积量化索引子空间向量聚类中应用了模糊聚类方法，避免了硬划分因样本类别分布不均匀造成的误差，使向量的聚类更客观；在相似度度量中采用了加权非对称距离计算和距离排名统计方法，避免了因向量某一段距离计算过大而产生的检索误差。本发明方法对比现有乘积向量方法在复杂背景图片的检索中精度更高

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于模糊聚类和非对称距离计算的乘积量化方法，其特征在于，所述方法包括下述步骤：

步骤S4、计算查询向量所在的簇类中所有子段的加权距离，统计每个子段距离排名序号的和，其中最大的Q个值对应的样本即查询向量的Q近邻样本；

所述步骤S1具体过程如下：

；

将n维的残差向量平均切分为s段，每段残差子向量的维度为

；

，设定一个模糊聚类的目标函数

，其中

，约束条件为

，m是隶属度因子，

表示残差子向量

到聚类中心

的欧氏距离；

当前残差子向量的隶属度矩阵是一个h*k的矩阵，其中h为簇类中残差向量数量，聚类开始时，随机生成一个满足约束条件的隶属度，通过隶属度矩阵迭代以及聚类中心迭代，当目标函数

的取值趋于稳定时，停止迭代，得到最终的隶属度矩阵，其中矩阵的每一行代表一个样本，共有h个样本，矩阵的每一列每个值代表属于每个聚类的隶属度，共有k列；具体的，隶属度

的迭代公式为

，聚类中心

的迭代公式为

，停止迭代的条件为

，其中

取一个极小的常数作为误差的阈值，t为迭代的轮数。

2.如权利要求1所述基于模糊聚类和非对称距离计算的乘积量化方法，其特征在于，所述步骤S2具体过程如下：

3.如权利要求2所述基于模糊聚类和非对称距离计算的乘积量化方法，其特征在于，所述步骤S3具体过程如下：

4.如权利要求3所述基于模糊聚类和非对称距离计算的乘积量化方法，其特征在于，所述步骤S4具体过程如下：