CN114022701B

CN114022701B - 基于近邻监督离散判别哈希的图像分类方法

Info

Publication number: CN114022701B
Application number: CN202111228626.4A
Authority: CN
Inventors: 万鸣华; 谭海; 陈雪宇; 詹天明; 杨国为
Original assignee: NANJING AUDIT UNIVERSITY
Current assignee: NANJING AUDIT UNIVERSITY
Priority date: 2021-10-21
Filing date: 2021-10-21
Publication date: 2022-06-24
Anticipated expiration: 2041-10-21
Also published as: CN114022701A

Abstract

本发明公开了基于近邻监督离散判别哈希的图像分类方法，获取标准的图像库，并构建新的待分类标准图像库；计算新的待分类标准图像的类间权重矩阵和类内权重矩阵，并得到类内哈希关系函数和类间哈希关系函数；在待分类标准图像库中对采集到的图像训练样本选择锚点，并计算每个训练样本与锚点之间的距离；得到最终的目标函数；对最终的目标函数进行分解，并求得特征矩阵；基于特征矩阵并利用最近邻分类器对图像进行分类；本发明可以更好的刻画样本之间的关系，加强局部类间可分性和类内紧凑性，从而学习得到更高效的哈希函数，进而学习得到紧促二进制哈希码，旨在提高用于海量数据的高维图像识别的准确性，加快查找与检索速度。

Description

基于近邻监督离散判别哈希的图像分类方法

技术领域

本发明涉及图像分类技术领域，具体涉及基于近邻监督离散判别哈希的图像分类方法。

背景技术

人类生产生活数据的信息化使得数据量呈现爆炸式增长，面对这些庞大的图像库，人们提出了一系列特征提取方法来进行数据压缩，而以往计算机视觉中提出的高维数据处理方法在鲁棒性和可扩展性方面有待提高。哈希算法通过随机排列或投影将原始特征映射到一个新的特征空间，并将其转换成紧凑的二进制哈希码。这不仅提高了图像搜索和检索的速度，并且提高了大规模数据的存储效率。基于这些优点，哈希算法在模式识别和数字图像处理领域受到了广泛关注。

近年来，数据依赖型哈希受到了广泛的关注,与数据独立型哈希不同，数据依赖型哈希考虑了训练样本信息。如Liu等人提出了一种无监督的锚图哈希算法(anchor graphhashing，AGH)，它是一种基于图的算法，用于保持离散空间中数据固有的邻域结构，选择远少于样本数的聚类中心作为锚点，构造每个样本点与锚定点之间的相似度矩阵代替样本点与样本点之间的相似度矩阵，大大降低了计算和存储的复杂度。之后他们又提出了离散图哈希算法(discrete graph hashing，DGH)，其创建锚图的方式与AGH类似，但在训练时没有考虑松弛约束，而是采用交替最大化算法求解离散约束，从而得到离散的哈希码。

但这些方法都没有考虑训练样本的标签信息，为了进一步考虑离散优化问题，Shen等人提出了离散监督哈希算法(supervised discrete hashing，SDH)，有效地提高了较长哈希码的学习效率。SDH是一种最小二乘分类法，它采用离散循环坐标下降法逐位学习哈希码，目的是将哈希码回归到其相应的标签上。Cui等人提出的监督离散判别哈希算法(supervised discrete discriminant hashing，SDDH)采用一步法更新所有比特位，提高了求解速度。考虑图像的二维特征，Ding等人提出了双线性监督离散哈希算法(bilinearsupervised hashing，BSDH)，利用双线性投影对图像矩阵特征进行二值化，使二维图像空间的固有特征保留在哈希码中。而以往大部分的监督哈希算法都只考虑了训练样本的标签信息，而没有进一步考虑样本与样本之间的近邻关系；因此，需要设计基于近邻监督离散判别哈希的图像分类方法。

发明内容

本发明的目的是克服现有技术的不足，为更好的有效解决上述问题，提供了一种基于近邻监督离散判别哈希的图像分类方法，该方法在考虑训练样本标签信息的基础上进一步考虑样本之间的近邻关系，以此构建出一种新的邻域图。这种算法可以更好的刻画样本之间的关系，加强局部类间可分性和类内紧凑性，从而学习得到更高效的哈希函数，进而学习得到紧促二进制哈希码，旨在提高用于海量数据的高维图像识别的准确性，加快查找与检索速度。

为了达到上述目的，本发明所采用的技术方案是：

基于近邻监督离散判别哈希的图像分类方法，包括以下步骤，

步骤(A)，获取标准的图像库，并构建新的待分类标准图像库；

步骤(B)，计算新的待分类标准图像的类间权重矩阵和类内权重矩阵，并得到类内哈希关系函数和类间哈希关系函数；

步骤(C)，在待分类标准图像库中对采集到的图像训练样本选择锚点，并计算每个训练样本与锚点之间的距离；

步骤(D)，根据步骤(B)和步骤(C)的计算结果相结合得到最终的目标函数；

步骤(E)，对最终的目标函数进行分解，并求得特征矩阵；

步骤(F)，基于特征矩阵并利用最近邻分类器对图像进行分类，输出图像的分类结果。

前述的基于近邻监督离散判别哈希的图像分类方法，步骤(A)，获取标准的图像库，并构建新的待分类标准图像库，其中标准的图像库是MNIST图像库或CIFAR-10图像库，并对标准的图像库进行剪切构建新的待分类标准图像库。

前述的基于近邻监督离散判别哈希的图像分类方法，步骤(B)，计算新的待分类标准图像的类间权重矩阵S_b和类内权重矩阵S_w，并得到类内哈希关系函数G(s)和类间哈希关系函数G(d)，其具体步骤如下，

步骤(B1)，定义类间权重矩阵S_b如公式(1)所示，

其中，ON^-(x_i)表示与样本x_i属于不同类且不是x_i近邻的点的集合，N^-(x_i)表示与样本x_i不属于同一类且与x_i近邻的点的集合，||x_i-x_j||表示样本x_i与x_j之间的欧式距离，t是值为正的参数，exp(·)是一个瞬时变化率较快的指数函数；

步骤(B2)，定义类内权重矩阵S_w如公式(2)所示，

其中，N⁺(x_i)表示与样本x_i属于同一类且与x_i近邻的点的集合；

步骤(B3)，得到类内哈希关系函数G(s)和类间哈希关系函数G(d)如公式(3)所示，

s.t. b_k＝sgn(F(x_i)) i＝1,2,...,n (3)

其中，sgn(·)为符号函数，当自变量为正数时输出+1，否则输出-1,W∈R^L×L为相似性度量矩阵用来比较哈希码之间的相似度，B＝{b₁,b₂,...,b_n}∈{-1,1}^L×n为哈希码矩阵，T表示向量或者矩阵的转置；

步骤(B4)，计算类内哈希关系函数G(s)和类间哈希关系函数G(d)之差，如公式(4)，

s.t. B∈{-1,1}^L×n (4)

其中，U表示投影矩阵，tr[·]表示矩阵的迹。

前述的基于近邻监督离散判别哈希的图像分类方法，步骤(C)，在待分类标准图像库中对采集到的图像X训练样本选择m个锚点，并计算每个训练样本与锚点之间距离的得到Φ(X)，如公式(5)所示，

其中，

是从训练样本中随机选择的m个锚点，且m<<n；t为阈值。

前述的基于近邻监督离散判别哈希的图像分类方法，步骤(D)，根据步骤(B)和步骤(C)的计算结果相结合得到最终的目标函数，如公式(6)所示，

s.t. b_k＝sgn(F(x_i)) i＝1,2,...,n (6)

其中，υ表示可调节参数，且目标函数中的F(·)定义如公式(7)所示，

F(x)＝P^TΦ(x) (7)

其中，P∈R^m×L为投影矩阵。

前述的基于近邻监督离散判别哈希的图像分类方法，步骤(E)，对最终的目标函数进行分解，并求得特征矩阵，其具体步骤如下，

步骤(E1)，构建近邻监督离散判别哈希的图像检索方法的最终目标函数，如公式(8)所示，

s.t. B∈{-1,1}^L×n (8)

其中，

表示求最大损失函数B、U和P，S_w表示类内权重矩阵，S_b表示类间权重矩阵；

步骤(E2)，构建增广Lagrange乘子法函数L(B,U,P)，如公式(9)所示，

其中，υ>0是惩罚参数，

表示F范数；

步骤(E3)，求解变量B、U和P，具体步骤如下，

步骤(E31)，F-Step，通过目标函数得出P的值仅与B有关，固定B得到如公式(10)所示，

P＝(Φ(X)Φ(X)^T)^-1Φ(X)B^T (10)；

步骤(E32)，G-Step，与F-Step类似，U只依赖于B，因此在目标函数中是固定B，U转化为如公式(11)所示，

其中，U由BS_wB^T-BS_bB^T较大的特征值对应的特征值向量组成；

步骤(E33)，B-Step，P和U固定，优化的目标函数转化为如公式(12)所示，

tr(U^TBSwB^TU)-tr(U^TBSbB^TU)-νtr((B((P^TΦ)X))^T(B-P^TΦ(X))) (12)

其中，由于tr(B^TB)和tr((P^TΦ(X))^T(P^TΦ(X)))是常数，进一步得到如公式(13)所示，

tr(B^T(UU^TBS_w-UU^TBS_b))-νtr(B^TP^TΦ(X)) (13)；

定义B^t为迭代学习中第t次循环所得到的二进制哈希码矩阵，可以用一个封闭形式的方案更新第t+1次循环的二进制哈希码如公式(14)所示，

B^t+1＝sgn((UU^TB^tSw-UU^TBS_b)-νP^TΦ(X)) (14)；

步骤(E4)，由于相似性度量矩阵W是对称且半正定的，这样将其分解为W＝UU^T，这样公式(6)可以被改写为如公式(15)所示，

s.t. b_k＝sgn(F(x_i)) i＝1,2,...,n (15)；

步骤(E5)，由Y_i＝U^TX_i，求得特征矩阵如公式(16)所示，

Y＝(Y₁,…,Y_i,…,Y_N)^T (16)

其中，U^T表示U的转置矩阵，Y_i表示第i个投影后样本矩阵，N表示样本总数，X_i表示第i个训练样本矩阵。

前述的基于近邻监督离散判别哈希的图像分类方法，步骤(F)，基于特征矩阵并利用最近邻分类器对图像进行分类，输出图像的分类结果，具体步骤如下，

步骤(F1)，定义d(Y₁,Y₂)如公式(17)所示，

其中，

Y₁为特征矩阵；

Y₂为特征矩阵；Y₁ ^k为Y₁的第k列特征矩阵；

为Y₂的第k列特征矩阵；d为特征值，||·||²为L2范数；

步骤(F2)，总的特征距离为Y₁,Y₂,…,Y_N，每一幅图像都有类标签c_i，对应一个新的测试样本Y，如果

且Y_j∈c_l，则分类结果是Y∈c_l，其中，

为求最小损失函数j，c_l为第l类；

步骤(F3)，求解所有图像的最终类别，并输出图像的分类结果。

本发明的有益效果是：

第一、为了克服大部分的监督哈希算法都只考虑了训练样本的标签信息，而没有进一步考虑样本与样本之间的近邻关系；本发明在考虑训练样本标签信息的基础上进一步考虑样本之间的近邻关系，以此构建出一种新的邻域图，提出一种基于近邻监督离散判别哈希的图像检索算法(NSDDH)，该算法主要构建新的邻域图以刻画样本间几何关系，从而提高了图像检索性能；这种算法可以更好的刻画样本之间的关系，加强局部类间可分性和类内紧凑性，从而学习得到更高效的哈希函数，进而学习得到紧促二进制哈希码，旨在提高用于海量数据的高维图像识别的准确性，加快查找与检索速度。

第二、本发明利用基于近邻监督离散判别哈希的图像检索算法模型和设计优化算法抽取图像识别特征，一方面，NSDDH方法利用流形学习中的图嵌入方法进行特征提取，能够更多的提取图像特征，且该方法类内协方差矩阵是可逆的，从而不存在小样品问题；另一方面，NSDDH算法利用哈希算法通过随机排列或投影将原始特征映射到一个新的特征空间，并将其转换成紧凑的二进制哈希码。这不仅提高了图像搜索和检索的速度，并且提高了大规模数据的存储效率。

第三、本发明利用最近邻分类器进行分类，可有效提高图像分类精度，促进图像的哈希特点的进一步挖掘。

第四、现有基于子空间学习和图嵌入学习模型不能解决海量数据的高维图像识别的准确性的技术问题，本发明结合哈希学习解决现有基于图嵌入学习模型的图像分类中存在的分类精度较低、检索速度慢的技术问题，提高了识别精度，可用于国家公共安全，社会安全、信息安全、金融安全以及人机交互等等领域，具有良好的应用前景。

附图说明

图1是本发明基于近邻监督离散判别哈希的图像分类方法的原理示意图；

图2是本发明的流程图；

图3是本发明的MNIST图像库中的10幅图像；

图4是本发明的CIFAR-10图像库中的部分图像；

图5是本发明在MNIST图像库上的准确率与召回率示意图；

图6是本发明在CIFAR-10图像库上的准确率与召回率示意图。

具体实施方式

下面将结合说明书附图，对本发明作进一步的说明。

如图1-6所示，本发明的基于近邻监督离散判别哈希的图像分类方法，包括以下步骤，

步骤(A)，获取标准的图像库，并构建新的待分类标准图像库，其中标准的图像库是MNIST图像库或CIFAR-10图像库，并对标准的图像库进行剪切构建新的待分类标准图像库。

其中，针对新的待分类标准图像进行特征提取和特征选择：如图2所述，得到训练和测试的图像库，通过基于近邻监督离散判别哈希的图像检索方法获得最优的图像特征。

步骤(B)，计算新的待分类标准图像的类间权重矩阵S_b和类内权重矩阵S_w，并得到类内哈希关系函数G(s)和类间哈希关系函数G(d)，其具体步骤如下，

步骤(B1)，定义类间权重矩阵S_b如公式(1)所示，

其中，ON^-(x_i)表示与样本x_i属于不同类且不是x_i近邻的点的集合，N^-(x_i)表示与样本x_i不属于同一类且与x_i近邻的点的集合，||x_i-x_j||表示样本x_i与x_j之间的欧式距离，t是值为正的参数，exp(·)是一个瞬时变化率较快的指数函数；利用这个函数可以为样本之间的关系赋予不同的权重；

步骤(B2)，定义类内权重矩阵S_w如公式(2)所示，

s.t. b_k＝sgn(F(x_i)) i＝1,2,...,n (3)

s.t. B∈{-1,1}^L×n (4)

其中，U表示投影矩阵，tr[·]表示矩阵的迹。

步骤(C)，在待分类标准图像库中对采集到的图像X训练样本选择m个锚点，并计算每个训练样本与锚点之间距离的得到Φ(X)，如公式(5)所示，

其中，

是从训练样本中随机选择的m个锚点，且m<<n；t为阈值。

步骤(D)，根据步骤(B)和步骤(C)的计算结果相结合得到最终的目标函数，如公式(6)所示，

s.t. b_k＝sgn(F(x_i)) i＝1,2,...,n (6)

F(x)＝P^TΦ(x) (7)

其中，P∈R^m×L为投影矩阵。

步骤(E)，对最终的目标函数进行分解，并求得特征矩阵，其具体步骤如下，

s.t. B∈{-1,1}^L×n (8)

其中，

其中，υ>0是惩罚参数，

表示F范数；

步骤(E3)，求解变量B、U和P，具体步骤如下，

P＝(Φ(X)Φ(X)^T)^-1Φ(X)B^T (10)；

其中，U由BS_wB^T-BS_bB^T较大的特征值对应的特征值向量组成；

tr(U^TBSwB^TU)-tr(U^TBSbB^TU)-νtr((B((P^TΦ)X))^T(B-P^TΦ(X))) (12)

tr(B^T(UU^TBS_w-UU^TBS_b))-νtr(B^TP^TΦ(X)) (13)；

B^t+1＝sgn((UU^TB^tSw-UU^TBS_b)-νP^TΦ(X)) (14)；

s.t. b_k＝sgn(F(x_i)) i＝1,2,...,n (15)；

步骤(E5)，由Y_i＝U^TX_i，求得特征矩阵如公式(16)所示，

Y＝(Y₁,…,Y_i,…,Y_N)^T (16)

步骤(F)，基于特征矩阵并利用最近邻分类器对图像进行分类，输出图像的分类结果，具体步骤如下，

步骤(F1)，定义d(Y₁,Y₂)如公式(17)所示，

其中，

Y₁为特征矩阵；

Y₂为特征矩阵；Y₁ ^k为Y₁的第k列特征矩阵；

为Y₂的第k列特征矩阵；d为特征值，||·||²为L2范数；

且Y_j∈c_l，则分类结果是Y∈c_l，其中，

为求最小损失函数j，c_l为第l类；

下面介绍本发明的一个具体实施例：

一种基于近邻监督离散判别哈希的图像分类装置，包括构建图像库单元、第一计算单元、第一图像处理单元、第二计算单元、特征矩阵计算单元和最近邻分类器单元，且每个单元的具体作用如下，

构建图像库单元，用于获取标准的图像库，构建新的待分类标准图像库；

第一计算单元，用于计算新的待分类标准图像的类内权重矩阵S_w和类间权重矩阵S_b，得到类内哈希关系函数G(s)和类间哈希关系函数G(d)；

具体地，第一计算单元包括构建类内紧致图单元、构建边缘分离图单元和计算单元；其中，构建类内紧致图单元，用于通过图嵌入公式来构建类内紧致图；构建边缘分离图单元，用于通过图嵌入公式来构建边缘分离图；计算单元，得到类内哈希关系函数G(s)和类间哈希关系函数G(d)；

第一图像处理单元，用于对采集到的图像X训练样本中随机选择的m(m<<n)个锚点,得到计算每个训练样本与锚点之间距离得到Φ(X)；

第二计算单元，根据第一计算单元和第一图像处理单元的结果相结合得到最终的目标函数；

具体地，第二计算单元包括构建最终目标函数单元、构建增广Lagrange乘子法函数单元和求解单元，其中，构建最终目标函数单元，用于构建近邻监督离散判别哈希的图像检索算法的最终目标函数；构建增广Lagrange乘子法函数单元，用于构建增广Lagrange乘子法函数L(B,U,P)；求解单元，用于求解变量B、U和P；

特征矩阵计算单元，用于根据Y_i＝P^TX_i,求得特征矩阵Y＝(Y₁,…,Y_i,…,Y_N)^T；

最近邻分类器单元，用于利用最近邻分类器对图像进行分类，输出图像的分类结果。

基于上述装置，下面结合常用的2种数据库进行实验分析并与现有技术进行比较，为了验证基于近邻监督离散判别哈希的图像检索方法在图像识别中的有效性,分别在MNIST和CIFAR-10图像库上进行了识别的实验,选择训练样本数为20000条，锚点数为2000；将本文所提出的NSDDH算法与AGH、SDH、SDDH三种算法进行比较，NSDDH算法的近邻数取为400；在实验过程中，设置不同的哈希码长度，分别在16，32，64，128，256五个不同的哈希码长度上进行测试；为了保证实验结果的准确性，选取迭代更新次数为5次；实验环境DellPC，且CPU为Inter Athlon(tm)64Processor，内存为1024M，Matlab 7.01。

(1)在MNIST数据库上的实验，MNIST图像库为手写数字0到9这10种不同类别的图片组成，如图3所示，均为28×28的灰度图像；实验中用784维的向量表示每幅图片，随机选择每个类中2000个数据训练，共20000条数据作为训练集，剩下1000张图片作为测试集；在MNIST图像库上的准确率测试结果的准确率、召回率、MAP值分别如图5、表1所示。

表1不同的哈希位数在MNIST图像库上的MAP值

(2)在CIFAR-10手写体数据库上的实验，CIFAR-10图像库包含鸟、鹿、猫、汽车、飞机等10种不同类别的图片，如图4所示，均为32×32的RGB彩色图像；实验中用512维的向量表示每幅图片，随机选择每个类中2000个数据训练，共20000条数据作为训练集，剩下10000张图片作为测试集；在CIFAR-10图像库上的准确率测试结果的准确率、召回率、MAP值分别如图6、表2所示。

表2不同的哈希位数在CIFAR-10图像库上的MAP值

通过上述实施例分析，本发明可有效提高图像分类精度，具有识别率高的优点，可用于国家公共安全，社会安全、信息安全、金融安全以及人机交互等等领域，具有良好的应用前景。

综上所述，本发明的基于近邻监督离散判别哈希的图像分类方法，利用一种基于近邻监督离散判别哈希的图像检索方法模型和设计优化算法抽取图像识别特征，该算法主要构建新的邻域图以刻画样本间几何关系，从而提高了图像检索性能。这种算法可以更好的刻画样本之间的关系，加强局部类间可分性和类内紧凑性，从而学习得到更高效的哈希函数，进而学习得到紧促二进制哈希码，旨在提高用于海量数据的高维图像识别的准确性，加快查找与检索速度。

以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。