CN114022701A - 基于近邻监督离散判别哈希的图像分类方法 - Google Patents

基于近邻监督离散判别哈希的图像分类方法 Download PDF

Info

Publication number
CN114022701A
CN114022701A CN202111228626.4A CN202111228626A CN114022701A CN 114022701 A CN114022701 A CN 114022701A CN 202111228626 A CN202111228626 A CN 202111228626A CN 114022701 A CN114022701 A CN 114022701A
Authority
CN
China
Prior art keywords
class
image
matrix
hash
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111228626.4A
Other languages
English (en)
Other versions
CN114022701B (zh
Inventor
万鸣华
谭海
陈雪宇
詹天明
杨国为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NANJING AUDIT UNIVERSITY
Original Assignee
NANJING AUDIT UNIVERSITY
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NANJING AUDIT UNIVERSITY filed Critical NANJING AUDIT UNIVERSITY
Priority to CN202111228626.4A priority Critical patent/CN114022701B/zh
Publication of CN114022701A publication Critical patent/CN114022701A/zh
Application granted granted Critical
Publication of CN114022701B publication Critical patent/CN114022701B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Optimization (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于近邻监督离散判别哈希的图像分类方法,获取标准的图像库,并构建新的待分类标准图像库;计算新的待分类标准图像的类间邻域图和类内邻域图,并得到类内哈希关系函数和类间哈希关系函数;在待分类标准图像库中对采集到的图像训练样本选择锚点,并计算每个训练样本与锚点之间的距离;得到最终的目标函数;对最终的目标函数进行分解,并求得特征矩阵;基于特征矩阵并利用最近邻分类器对图像进行分类;本发明可以更好的刻画样本之间的关系,加强局部类间可分性和类内紧凑性,从而学习得到更高效的哈希函数,进而学习得到紧促二进制哈希码,旨在提高用于海量数据的高维图像识别的准确性,加快查找与检索速度。

Description

基于近邻监督离散判别哈希的图像分类方法
技术领域
本发明涉及图像分类技术领域,具体涉及基于近邻监督离散判别哈希的图像分类方法。
背景技术
人类生产生活数据的信息化使得数据量呈现爆炸式增长,面对这些庞大的图像库,人们提出了一系列特征提取方法来进行数据压缩,而以往计算机视觉中提出的高维数据处理方法在鲁棒性和可扩展性方面有待提高。哈希算法通过随机排列或投影将原始特征映射到一个新的特征空间,并将其转换成紧凑的二进制哈希码。这不仅提高了图像搜索和检索的速度,并且提高了大规模数据的存储效率。基于这些优点,哈希算法在模式识别和数字图像处理领域受到了广泛关注。
近年来,数据依赖型哈希受到了广泛的关注,与数据独立型哈希不同,数据依赖型哈希考虑了训练样本信息。如Liu等人提出了一种无监督的锚图哈希算法(anchor graphhashing,AGH),它是一种基于图的算法,用于保持离散空间中数据固有的邻域结构,选择远少于样本数的聚类中心作为锚点,构造每个样本点与锚定点之间的相似度矩阵代替样本点与样本点之间的相似度矩阵,大大降低了计算和存储的复杂度。之后他们又提出了离散图哈希算法(discrete graph hashing,DGH),其创建锚图的方式与AGH类似,但在训练时没有考虑松弛约束,而是采用交替最大化算法求解离散约束,从而得到离散的哈希码。
但这些方法都没有考虑训练样本的标签信息,为了进一步考虑离散优化问题,Shen等人提出了离散监督哈希算法(supervised discrete hashing,SDH),有效地提高了较长哈希码的学习效率。SDH是一种最小二乘分类法,它采用离散循环坐标下降法逐位学习哈希码,目的是将哈希码回归到其相应的标签上。Cui等人提出的监督离散判别哈希算法(supervised discrete discriminant hashing,SDDH)采用一步法更新所有比特位,提高了求解速度。考虑图像的二维特征,Ding等人提出了双线性监督离散哈希算法(bilinearsupervised hashing,BSDH),利用双线性投影对图像矩阵特征进行二值化,使二维图像空间的固有特征保留在哈希码中。而以往大部分的监督哈希算法都只考虑了训练样本的标签信息,而没有进一步考虑样本与样本之间的近邻关系;因此,需要设计基于近邻监督离散判别哈希的图像分类方法。
发明内容
本发明的目的是克服现有技术的不足,为更好的有效解决上述问题,提供了一种基于近邻监督离散判别哈希的图像分类方法,该方法在考虑训练样本标签信息的基础上进一步考虑样本之间的近邻关系,以此构建出一种新的邻域图。这种算法可以更好的刻画样本之间的关系,加强局部类间可分性和类内紧凑性,从而学习得到更高效的哈希函数,进而学习得到紧促二进制哈希码,旨在提高用于海量数据的高维图像识别的准确性,加快查找与检索速度。
为了达到上述目的,本发明所采用的技术方案是:
基于近邻监督离散判别哈希的图像分类方法,包括以下步骤,
步骤(A),获取标准的图像库,并构建新的待分类标准图像库;
步骤(B),计算新的待分类标准图像的类间邻域图和类内邻域图,并得到类内哈希关系函数和类间哈希关系函数;
步骤(C),在待分类标准图像库中对采集到的图像训练样本选择锚点,并计算每个训练样本与锚点之间的距离;
步骤(D),根据步骤(B)和步骤(C)的计算结果相结合得到最终的目标函数;
步骤(E),对最终的目标函数进行分解,并求得特征矩阵;
步骤(F),基于特征矩阵并利用最近邻分类器对图像进行分类,输出图像的分类结果。
前述的基于近邻监督离散判别哈希的图像分类方法,步骤(A),获取标准的图像库,并构建新的待分类标准图像库,其中标准的图像库是MNIST图像库或CIFAR-10图像库,并对标准的图像库进行剪切构建新的待分类标准图像库。
前述的基于近邻监督离散判别哈希的图像分类方法,步骤(B),计算新的待分类标准图像的类间邻域图Sb和类内邻域图Sw,并得到类内哈希关系函数G(s)和类间哈希关系函数G(d),其具体步骤如下,
步骤(B1),定义类间邻域图Sb如公式(1)所示,
Figure BDA0003315168320000031
其中,ON-(xi)表示与样本xi属于不同类且不是xi近邻的点的集合,N-(xi)表示与样本xi不属于同一类且与xi近邻的点的集合,||xi-xj||表示样本xi与xj之间的欧式距离,t是值为正的参数,exp(·)是一个瞬时变化率较快的指数函数;
步骤(B2),定义类内邻域图Sw如公式(2)所示:
Figure BDA0003315168320000041
其中,N+(xi)表示与样本xi属于同一类且与xi近邻的点的集合,ON+(xi)表示与样本xi属于同一类但不是xi近邻的点的集合;
步骤(B3),得到类内哈希关系函数G(s)和类间哈希关系函数G(d)如公式(3)所示,
Figure BDA0003315168320000042
Figure BDA0003315168320000043
s.t.bk=sgn(F(xi))i=1,2,...,n (3)
其中,sgn(·)为符号函数,当自变量为正数时输出+1,否则输出-1,W∈RL×L为相似性度量矩阵用来比较哈希码之间的相似度,B={b1,b2,...,bn}∈{-1,1}L×n为哈希码矩阵,T表示向量或者矩阵的转置;
步骤(B4),计算最类内哈希关系函数G(s)和类间哈希关系函数G(d)之差,如公式(4),
Figure BDA0003315168320000044
s.t.B∈{-1,1}L×n (4)
其中,U表示投影矩阵,tr[·]表示矩阵的迹。
前述的基于近邻监督离散判别哈希的图像分类方法,步骤(C),在待分类标准图像库中对采集到的图像X训练样本选择m(m<<n)个锚点,并计算每个训练样本与锚点之间距离的得到Φ(X),如公式(5)所示,
Figure BDA0003315168320000051
其中,
Figure BDA0003315168320000052
是从训练样本中随机选择的m(m<<n)个锚点,t为阈值。
前述的基于近邻监督离散判别哈希的图像分类方法,步骤(D),根据步骤(B)和步骤(C)的计算结果相结合得到最终的目标函数,如公式(6)所示,
Figure BDA0003315168320000053
s.t.bk=sgn(F(xi))i=1,2,...,n (6)
其中,υ表示可调节参数,且目标函数中的F(·)定义如公式(7)所示,
F(x)=PTΦ(x) (7)
其中,P∈Rm×L为投影矩阵。
前述的基于近邻监督离散判别哈希的图像分类方法,步骤(E),对最终的目标函数进行分解,并求得特征矩阵,其具体步骤如下,
步骤(E1),构建近邻监督离散判别哈希的图像检索方法的最终目标函数,如公式(8)所示,
Figure BDA0003315168320000054
s.t.B∈{-1,1}L×n (8)
其中,
Figure BDA0003315168320000055
表示求最大损失函数B、U和P,Sw表示类内权重矩阵,Sb表示类间权重矩阵;
步骤(E2),构建增广Lagrange乘子法函数L(B,U,P),如公式(9)所示,
Figure BDA0003315168320000056
其中,υ>0是惩罚参数,
Figure BDA0003315168320000057
表示F范数;
步骤(E3),求解变量B、U和P,具体步骤如下,
步骤(E31),F-Step,通过目标函数得出P的值仅与B有关,固定B得到如公式(10)所示,
P=(Φ(X)Φ(X)T)-1Φ(X)BT (10);
步骤(E32),G-Step,与F-Step类似,U只依赖于B,因此在目标函数中是固定B,U转化为如公式(11)所示,
Figure BDA0003315168320000061
其中,U由BSwBT-BSbBT较大的特征值对应的特征值向量组成;
步骤(E33),B-Step,P和U固定,优化的目标函数转化为如公式(12)所示,
tr(UTBSwBTU)-tr(UTBSbBTU)-νtr((B((PTΦ)X))T(B-PTΦ(X))) (12)
其中,由于tr(BTB)和tr((PTΦ(X))T(PTΦ(X)))是常数,进一步得到如公式(13)所示,
tr(BT(UUTBSw-UUTBSb))-νtr(BTPTΦ(X)) (13);
定义Bt为迭代学习中第t次循环所得到的二进制哈希码矩阵,可以用一个封、闭形式的方案更新第t+1次循环的二进制哈希码如公式(14)所示,
Bt+1=sgn((UU TBtSw-UU TBSb)-νPTΦ(X)) (14);
步骤(E4),由于相似性度量矩阵W是对称且半正定的,这样将其分解为W=UUT,这样公式(6)可以被改写为如公式(15)所示,
Figure BDA0003315168320000062
s.t.bk=sgn(F(xi))i=1,2,...,n (15);
步骤(E5),由Yi=UTXi,求得特征矩阵如公式(16)所示,
Y=(Y1,…,Yi,…,YN)T (16)
其中,UT表示U的转置矩阵,Yi表示第i个投影后样本矩阵,N表示样本总数,Xi表示第i个训练样本矩阵。
前述的基于近邻监督离散判别哈希的图像分类方法,步骤(F),基于特征矩阵并利用最近邻分类器对图像进行分类,输出图像的分类结果,具体步骤如下,
步骤(F1),定义d(Y1,Y2)如公式(17)所示,
Figure BDA0003315168320000071
其中,
Figure BDA0003315168320000072
Y1为特征矩阵;
Figure BDA0003315168320000073
Y2为特征矩阵;
Figure BDA0003315168320000074
为Y1的第k列特征矩阵;
Figure BDA0003315168320000075
为Y2的第k列特征矩阵;d为特征值,||·||2为L2范数;
步骤(F2),总的特征距离为Y1,Y2,…,YN,每一幅图像都有类标签ci,对应一个新的测试样本Y,如果
Figure BDA0003315168320000076
且Yj∈cl,则分类结果是Y∈cl,其中,
Figure BDA0003315168320000077
为求最小损失函数j,cl为第l类;
步骤(F3),求解所有图像的最终类别,并输出图像的分类结果。
本发明的有益效果是:
第一、为了克服大部分的监督哈希算法都只考虑了训练样本的标签信息,而没有进一步考虑样本与样本之间的近邻关系;本发明在考虑训练样本标签信息的基础上进一步考虑样本之间的近邻关系,以此构建出一种新的邻域图,提出一种基于近邻监督离散判别哈希的图像检索算法(NSDDH),该算法主要构建新的邻域图以刻画样本间几何关系,从而提高了图像检索性能;这种算法可以更好的刻画样本之间的关系,加强局部类间可分性和类内紧凑性,从而学习得到更高效的哈希函数,进而学习得到紧促二进制哈希码,旨在提高用于海量数据的高维图像识别的准确性,加快查找与检索速度。
第二、本发明利用基于近邻监督离散判别哈希的图像检索算法模型和设计优化算法抽取图像识别特征,一方面,NSDDH方法利用流形学习中的图嵌入方法进行特征提取,能够更多的提取图像特征,且该方法类内协方差矩阵是可逆的,从而不存在小样品问题;另一方面,NSDDH算法利用哈希算法通过随机排列或投影将原始特征映射到一个新的特征空间,并将其转换成紧凑的二进制哈希码。这不仅提高了图像搜索和检索的速度,并且提高了大规模数据的存储效率。
第三、本发明利用最近邻分类器进行分类,可有效提高图像分类精度,促进图像的哈希特点的进一步挖掘。
第四、现有基于子空间学习和图嵌入学习模型不能解决海量数据的高维图像识别的准确性的技术问题,本发明结合哈希学习解决现有基于图嵌入学习模型的图像分类中存在的分类精度较低、检索速度慢的技术问题,提高了识别精度,可用于国家公共安全,社会安全、信息安全、金融安全以及人机交互等等领域,具有良好的应用前景。
附图说明
图1是本发明基于近邻监督离散判别哈希的图像分类方法的原理示意图;
图2是本发明的流程图;
图3是本发明的MNIST图像库中的10幅图像;
图4是本发明的CIFAR-10图像库中的部分图像;
图5是本发明在MNIST图像库上的准确率与召回率示意图;
图6是本发明在CIFAR-10图像库上的准确率与召回率示意图。
具体实施方式
下面将结合说明书附图,对本发明作进一步的说明。
如图1-6所示,本发明的基于近邻监督离散判别哈希的图像分类方法,包括以下步骤,
步骤(A),获取标准的图像库,并构建新的待分类标准图像库,其中标准的图像库是MNIST图像库或CIFAR-10图像库,并对标准的图像库进行剪切构建新的待分类标准图像库。
其中,针对新的待分类标准图像进行特征提取和特征选择:如图2所述,得到训练和测试的图像库,通过基于近邻监督离散判别哈希的图像检索方法获得最优的图像特征。
步骤(B),计算新的待分类标准图像的类间邻域图Sb和类内邻域图Sw,并得到类内哈希关系函数G(s)和类间哈希关系函数G(d),其具体步骤如下,
步骤(B1),定义类间邻域图Sb如公式(1)所示,
Figure BDA0003315168320000091
其中,ON-(xi)表示与样本xi属于不同类且不是xi近邻的点的集合,N-(xi)表示与样本xi不属于同一类且与xi近邻的点的集合,||xi-xj||表示样本xi与xj之间的欧式距离,t是值为正的参数,exp(·)是一个瞬时变化率较快的指数函数;利用这个函数可以为样本之间的关系赋予不同的权重;
步骤(B2),定义类内邻域图Sw如公式(2)所示:
Figure BDA0003315168320000101
其中,N+(xi)表示与样本xi属于同一类且与xi近邻的点的集合,ON+(xi)表示与样本xi属于同一类但不是xi近邻的点的集合;
步骤(B3),得到类内哈希关系函数G(s)和类间哈希关系函数G(d)如公式(3)所示,
Figure BDA0003315168320000102
Figure BDA0003315168320000103
s.t.bk=sgn(F(xi))i=1,2,...,n (3)
其中,sgn(·)为符号函数,当自变量为正数时输出+1,否则输出-1,W∈RL×L为相似性度量矩阵用来比较哈希码之间的相似度,B={b1,b2,...,bn}∈{-1,1}L×n为哈希码矩阵,T表示向量或者矩阵的转置;
步骤(B4),计算最类内哈希关系函数G(s)和类间哈希关系函数G(d)之差,如公式(4),
Figure BDA0003315168320000104
s.t.B∈{-1,1}L×n (4)
其中,U表示投影矩阵,tr[·]表示矩阵的迹。
步骤(C),在待分类标准图像库中对采集到的图像X训练样本选择m个锚点,并计算每个训练样本与锚点之间距离的得到Φ(X),如公式(5)所示,
Figure BDA0003315168320000111
其中,
Figure BDA0003315168320000112
是从训练样本中随机选择的m(m<<n)个锚点,t为阈值。
步骤(D),根据步骤(B)和步骤(C)的计算结果相结合得到最终的目标函数,如公式(6)所示,
Figure BDA0003315168320000113
s.t.bk=sgn(F(xi))i=1,2,...,n (6)
其中,υ表示可调节参数,且目标函数中的F(·)定义如公式(7)所示,
F(x)=PTΦ(x) (7)
其中,P∈Rm×L为投影矩阵。
步骤(E),对最终的目标函数进行分解,并求得特征矩阵,其具体步骤如下,
步骤(E1),构建近邻监督离散判别哈希的图像检索方法的最终目标函数,如公式(8)所示,
Figure BDA0003315168320000114
s.t.B∈{-1,1}L×n (8)
其中,
Figure BDA0003315168320000115
表示求最大损失函数B、U和P,Sw表示类内权重矩阵,Sb表示类间权重矩阵;
步骤(E2),构建增广Lagrange乘子法函数L(B,U,P),如公式(9)所示,
Figure BDA0003315168320000116
其中,υ>0是惩罚参数,
Figure BDA0003315168320000117
表示F范数;
步骤(E3),求解变量B、U和P,具体步骤如下,
步骤(E31),F-Step,通过目标函数得出P的值仅与B有关,固定B得到如公式(10)所示,
P=(Φ(X)Φ(X)T)-1Φ(X)BT (10);
步骤(E32),G-Step,与F-Step类似,U只依赖于B,因此在目标函数中是固定B,U转化为如公式(11)所示,
Figure BDA0003315168320000121
其中,U由BSwBT-BSbBT较大的特征值对应的特征值向量组成;
步骤(E33),B-Step,P和U固定,优化的目标函数转化为如公式(12)所示,
tr(UTBSwBTU)-tr(UTBSbBTU)-νtr((B((PTΦ)X))T(B-PTΦ(X))) (12)
其中,由于tr(BTB)和tr((PTΦ(X))T(PTΦ(X)))是常数,进一步得到如公式(13)所示,
tr(BT(UUTBSw-UUTBSb))-νtr(BTPTΦ(X)) (13);
定义Bt为迭代学习中第t次循环所得到的二进制哈希码矩阵,可以用一个封、闭形式的方案更新第t+1次循环的二进制哈希码如公式(14)所示,
Bt+1=sgn((UU TBtSw-UU TBSb)-νPTΦ(X)) (14);
步骤(E4),由于相似性度量矩阵W是对称且半正定的,这样将其分解为W=UUT,这样公式(6)可以被改写为如公式(15)所示,
Figure BDA0003315168320000122
s.t.bk=sgn(F(xi))i=1,2,...,n (15);
步骤(E5),由Yi=UTXi,求得特征矩阵如公式(16)所示,
Y=(Y1,…,Yi,…,YN)T (16)
其中,UT表示U的转置矩阵,Yi表示第i个投影后样本矩阵,N表示样本总数,Xi表示第i个训练样本矩阵。
步骤(F),基于特征矩阵并利用最近邻分类器对图像进行分类,输出图像的分类结果,具体步骤如下,
步骤(F1),定义d(Y1,Y2)如公式(17)所示,
Figure BDA0003315168320000131
其中,
Figure BDA0003315168320000132
Y1为特征矩阵;
Figure BDA0003315168320000133
Y2为特征矩阵;
Figure BDA0003315168320000134
为Y1的第k列特征矩阵;
Figure BDA0003315168320000135
为Y2的第k列特征矩阵;d为特征值,||·||2为L2范数;
步骤(F2),总的特征距离为Y1,Y2,…,YN,每一幅图像都有类标签ci,对应一个新的测试样本Y,如果
Figure BDA0003315168320000136
且Yj∈cl,则分类结果是Y∈cl,其中,
Figure BDA0003315168320000137
为求最小损失函数j,cl为第l类;
步骤(F3),求解所有图像的最终类别,并输出图像的分类结果。
下面介绍本发明的一个具体实施例:
一种基于近邻监督离散判别哈希的图像分类装置,包括构建图像库单元、第一计算单元、第一图像处理单元、第二计算单元、特征矩阵计算单元和最近邻分类器单元,且每个单元的具体作用如下,
构建图像库单元,用于获取标准的图像库,构建新的待分类标准图像库;
第一计算单元,用于计算新的待分类标准图像的类内邻域图Sw和类间邻域图Sb,得到类内哈希关系函数G(s)和类间哈希关系函数G(d);
具体地,第一计算单元包括构建类内紧致图单元、构建边缘分离图单元和计算单元;其中,构建类内紧致图单元,用于通过图嵌入公式来构建类内紧致图;构建边缘分离图单元,用于通过图嵌入公式来构建边缘分离图;计算单元,得到类内哈希关系函数G(s)和类间哈希关系函数G(d);
第一图像处理单元,用于对采集到的图像X训练样本中随机选择的m(m<<n)个锚点,得到计算每个训练样本与锚点之间距离得到Φ(X);
第二计算单元,根据第一计算单元和第一图像处理单元的结果相结合得到最终的目标函数;
具体地,第二计算单元包括构建最终目标函数单元、构建增广Lagrange乘子法函数单元和求解单元,其中,构建最终目标函数单元,用于构建近邻监督离散判别哈希的图像检索算法的最终目标函数;构建增广Lagrange乘子法函数单元,用于构建增广Lagrange乘子法函数L(B,U,P);求解单元,用于求解变量B、U和P;
特征矩阵计算单元,用于根据Yi=PTXi,求得特征矩阵Y=(Y1,…,Yi,…,YN)T
最近邻分类器单元,用于利用最近邻分类器对图像进行分类,输出图像的分类结果。
基于上述装置,下面结合常用的2种数据库进行实验分析并与现有技术进行比较,为了验证基于近邻监督离散判别哈希的图像检索方法在图像识别中的有效性,分别在MNIST和CIFAR-10图像库上进行了识别的实验,选择训练样本数为20000条,锚点数为2000;将本文所提出的NSDDH算法与AGH、SDH、SDDH三种算法进行比较,NSDDH算法的近邻数取为400;在实验过程中,设置不同的哈希码长度,分别在16,32,64,128,256五个不同的哈希码长度上进行测试;为了保证实验结果的准确性,选取迭代更新次数为5次;实验环境DellPC,且CPU为Inter Athlon(tm)64 Processor,内存为1024M,Matlab 7.01。
(1)在MNIST数据库上的实验,MNIST图像库为手写数字0到9这10种不同类别的图片组成,如图3所示,均为28×28的灰度图像;实验中用784维的向量表示每幅图片,随机选择每个类中2000个数据训练,共20000条数据作为训练集,剩下1000张图片作为测试集;在MNIST图像库上的准确率测试结果的准确率、召回率、MAP值分别如图5、表1所示。
表1不同的哈希位数在MNIST图像库上的MAP值
Figure BDA0003315168320000151
(2)在CIFAR-10手写体数据库上的实验,CIFAR-10图像库包含鸟、鹿、猫、汽车、飞机等10种不同类别的图片,如图4所示,均为32×32的RGB彩色图像;实验中用512维的向量表示每幅图片,随机选择每个类中2000个数据训练,共20000条数据作为训练集,剩下10000张图片作为测试集;在CIFAR-10图像库上的准确率测试结果的准确率、召回率、MAP值分别如图6、表2所示。
表2不同的哈希位数在CIFAR-10图像库上的MAP值
Figure BDA0003315168320000152
通过上述实施例分析,本发明可有效提高图像分类精度,具有识别率高的优点,可用于国家公共安全,社会安全、信息安全、金融安全以及人机交互等等领域,具有良好的应用前景。
综上所述,本发明的基于近邻监督离散判别哈希的图像分类方法,利用一种基于近邻监督离散判别哈希的图像检索方法模型和设计优化算法抽取图像识别特征,该算法主要构建新的邻域图以刻画样本间几何关系,从而提高了图像检索性能。这种算法可以更好的刻画样本之间的关系,加强局部类间可分性和类内紧凑性,从而学习得到更高效的哈希函数,进而学习得到紧促二进制哈希码,旨在提高用于海量数据的高维图像识别的准确性,加快查找与检索速度。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (7)

1.基于近邻监督离散判别哈希的图像分类方法,其特征在于:包括以下步骤,
步骤(A),获取标准的图像库,并构建新的待分类标准图像库;
步骤(B),计算新的待分类标准图像的类间邻域图和类内邻域图,并得到类内哈希关系函数和类间哈希关系函数;
步骤(C),在待分类标准图像库中对采集到的图像训练样本选择锚点,并计算每个训练样本与锚点之间的距离;
步骤(D),根据步骤(B)和步骤(C)的计算结果相结合得到最终的目标函数;
步骤(E),对最终的目标函数进行分解,并求得特征矩阵;
步骤(F),基于特征矩阵并利用最近邻分类器对图像进行分类,输出图像的分类结果。
2.根据权利要求1所述的基于近邻监督离散判别哈希的图像分类方法,其特征在于:步骤(A),获取标准的图像库,并构建新的待分类标准图像库,其中标准的图像库是MNIST图像库或CIFAR-10图像库,并对标准的图像库进行剪切构建新的待分类标准图像库。
3.根据权利要求2所述的基于近邻监督离散判别哈希的图像分类方法,其特征在于:步骤(B),计算新的待分类标准图像的类间邻域图Sb和类内邻域图Sw,并得到类内哈希关系函数G(s)和类间哈希关系函数G(d),其具体步骤如下,
步骤(B1),定义类间邻域图Sb如公式(1)所示,
Figure FDA0003315168310000021
其中,ON-(xi)表示与样本xi属于不同类且不是xi近邻的点的集合,N-(xi)表示与样本xi不属于同一类且与xi近邻的点的集合,||xi-xj||表示样本xi与xj之间的欧式距离,t是值为正的参数,exp(·)是一个瞬时变化率较快的指数函数;
步骤(B2),定义类内邻域图Sw如公式(2)所示:
Figure FDA0003315168310000022
其中,N+(xi)表示与样本xi属于同一类且与xi近邻的点的集合,ON+(xi)表示与样本xi属于同一类但不是xi近邻的点的集合;
步骤(B3),得到类内哈希关系函数G(s)和类间哈希关系函数G(d)如公式(3)所示,
Figure FDA0003315168310000023
Figure FDA0003315168310000024
s.t.bk=sgn(F(xi))i=1,2,...,n (3)
其中,sgn(·)为符号函数,当自变量为正数时输出+1,否则输出-1,W∈RL×L为相似性度量矩阵用来比较哈希码之间的相似度,B={b1,b2,...,bn}∈{-1,1}L×n为哈希码矩阵,T表示向量或者矩阵的转置;
步骤(B4),计算最类内哈希关系函数G(s)和类间哈希关系函数G(d)之差,如公式(4),
Figure FDA0003315168310000031
s.t.B∈{-1,1}L×n (4)
其中,U表示投影矩阵,tr[·]表示矩阵的迹。
4.根据权利要求3所述的基于近邻监督离散判别哈希的图像分类方法,其特征在于:步骤(C),在待分类标准图像库中对采集到的图像X训练样本选择m个锚点,并计算每个训练样本与锚点之间距离的得到Φ(X),如公式(5)所示,
Figure FDA0003315168310000032
其中,
Figure FDA0003315168310000033
是从训练样本中随机选择的m(m<<n)个锚点,t为阈值。
5.根据权利要求4所述的基于近邻监督离散判别哈希的图像分类方法,其特征在于:步骤(D),根据步骤(B)和步骤(C)的计算结果相结合得到最终的目标函数,如公式(6)所示,
Figure FDA0003315168310000034
s.t.bk=sgn(F(xi)) i=1,2,...,n (6)
其中,υ表示可调节参数,且目标函数中的F(·)定义如公式(7)所示,
F(x)=PTΦ(x) (7)
其中,P∈Rm×L为投影矩阵。
6.根据权利要求5所述的基于近邻监督离散判别哈希的图像分类方法,其特征在于:步骤(E),对最终的目标函数进行分解,并求得特征矩阵,其具体步骤如下,
步骤(E1),构建近邻监督离散判别哈希的图像检索方法的最终目标函数,如公式(8)所示,
Figure FDA0003315168310000041
s.t.B∈{-1,1}L×n (8)
其中,
Figure FDA0003315168310000042
表示求最大损失函数B、U和P,Sw表示类内权重矩阵,Sb表示类间权重矩阵;
步骤(E2),构建增广Lagrange乘子法函数L(B,U,P),如公式(9)所示,
Figure FDA0003315168310000043
其中,υ>0是惩罚参数,
Figure FDA0003315168310000044
表示F范数;
步骤(E3),求解变量B、U和P,具体步骤如下,
步骤(E31),F-Step,通过目标函数得出P的值仅与B有关,固定B得到如公式(10)所示,
P=(Φ(X)Φ(X)T)-1Φ(X)BT (10);
步骤(E32),G-Step,与F-Step类似,U只依赖于B,因此在目标函数中是固定B,U转化为如公式(11)所示,
Figure FDA0003315168310000045
其中,U由BSwBT-BSbBT较大的特征值对应的特征值向量组成;
步骤(E33),B-Step,P和U固定,优化的目标函数转化为如公式(12)所示,
tr(UTBSwBTU)-tr(UTBSbBTU)-νtr((B((PTΦ)X))T(B-PTΦ(X))) (12)
其中,由于tr(BTB)和tr((PTΦ(X))T(PTΦ(X)))是常数,进一步得到如公式(13)所示,
tr(BT(UUTBSw-UUTBSb))-νtr(BTPTΦ(X)) (13);
定义Bt为迭代学习中第t次循环所得到的二进制哈希码矩阵,可以用一个封、闭形式的方案更新第t+1次循环的二进制哈希码如公式(14)所示,
Bt+1=sgn((UUTBtSw-UUTBSb)-νPTΦ(X)) (14);
步骤(E4),由于相似性度量矩阵W是对称且半正定的,这样将其分解为W=UUT,这样公式(6)可以被改写为如公式(15)所示,
Figure FDA0003315168310000051
s.t.bk=sgn(F(xi)) i=1,2,...,n (15);
步骤(E5),由Yi=UTXi,求得特征矩阵如公式(16)所示,
Y=(Y1,…,Yi,…,YN)T (16)
其中,UT表示U的转置矩阵,Yi表示第i个投影后样本矩阵,N表示样本总数,Xi表示第i个训练样本矩阵。
7.根据权利要求6所述的基于近邻监督离散判别哈希的图像分类方法,其特征在于:步骤(F),基于特征矩阵并利用最近邻分类器对图像进行分类,输出图像的分类结果,具体步骤如下,
步骤(F1),定义d(Y1,Y2)如公式(17)所示,
Figure FDA0003315168310000052
其中,
Figure FDA0003315168310000053
Y1为特征矩阵;
Figure FDA0003315168310000054
Y2为特征矩阵;
Figure FDA0003315168310000055
为Y1的第k列特征矩阵;
Figure FDA0003315168310000056
为Y2的第k列特征矩阵;d为特征值,||·||2为L2范数;
步骤(F2),总的特征距离为Y1,Y2,…,YN,每一幅图像都有类标签ci,对应一个新的测试样本Y,如果d(Y,Yl)=mjind(Y,Yj)且Yj∈cl,则分类结果是Y∈cl,其中
Figure FDA0003315168310000061
为求最小损失函数j,cl为第l类;
步骤(F3),求解所有图像的最终类别,并输出图像的分类结果。
CN202111228626.4A 2021-10-21 2021-10-21 基于近邻监督离散判别哈希的图像分类方法 Active CN114022701B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111228626.4A CN114022701B (zh) 2021-10-21 2021-10-21 基于近邻监督离散判别哈希的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111228626.4A CN114022701B (zh) 2021-10-21 2021-10-21 基于近邻监督离散判别哈希的图像分类方法

Publications (2)

Publication Number Publication Date
CN114022701A true CN114022701A (zh) 2022-02-08
CN114022701B CN114022701B (zh) 2022-06-24

Family

ID=80057088

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111228626.4A Active CN114022701B (zh) 2021-10-21 2021-10-21 基于近邻监督离散判别哈希的图像分类方法

Country Status (1)

Country Link
CN (1) CN114022701B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108805157A (zh) * 2018-04-11 2018-11-13 南京理工大学 基于部分随机监督离散式哈希的遥感图像分类方法
CN109063113A (zh) * 2018-07-30 2018-12-21 成都快眼科技有限公司 一种基于不对称深度离散哈希的快速图像检索方法、检索模型及模型构建方法
CN109284411A (zh) * 2017-07-19 2019-01-29 哈尔滨工业大学深圳研究生院 一种基于有监督超图离散化图像二值编码方法
CN110110128A (zh) * 2019-05-06 2019-08-09 西南大学 用于分布式架构的快速监督离散哈希图像检索系统
CN111325275A (zh) * 2020-02-20 2020-06-23 南京审计大学 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置
CN111611427A (zh) * 2020-05-21 2020-09-01 湖北工业大学 基于线性鉴别分析深度哈希算法的图像检索方法及系统
CN112528065A (zh) * 2020-12-17 2021-03-19 重庆邮电大学 一种流形相似度保持自编码器的医学超声图像检索方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284411A (zh) * 2017-07-19 2019-01-29 哈尔滨工业大学深圳研究生院 一种基于有监督超图离散化图像二值编码方法
CN108805157A (zh) * 2018-04-11 2018-11-13 南京理工大学 基于部分随机监督离散式哈希的遥感图像分类方法
CN109063113A (zh) * 2018-07-30 2018-12-21 成都快眼科技有限公司 一种基于不对称深度离散哈希的快速图像检索方法、检索模型及模型构建方法
CN110110128A (zh) * 2019-05-06 2019-08-09 西南大学 用于分布式架构的快速监督离散哈希图像检索系统
CN111325275A (zh) * 2020-02-20 2020-06-23 南京审计大学 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置
CN111611427A (zh) * 2020-05-21 2020-09-01 湖北工业大学 基于线性鉴别分析深度哈希算法的图像检索方法及系统
CN112528065A (zh) * 2020-12-17 2021-03-19 重庆邮电大学 一种流形相似度保持自编码器的医学超声图像检索方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
FUMIN SHEN等: "Supervised Discrete Hashing", 《ARXIV:1503.01557V1 [CS.CV]》 *
LIU YANZHEN等: "Bilinear discriminant analysis hashing:A supervised hashing approach for high-dimensional data", 《LECTURE NOTES IN COMPUTER SCIENCE》 *
RONGKAI XIA等: "Supervised hashing for image retrieval via image representation learning", 《RESEARCHGATE》 *
YAN CUIDENG: "Supervised discrete discriminant hashing for image retrieval", 《PATTERN RECOGNITION》 *
刘兴波: "监督哈希学习方法研究", 《中国优秀博硕士学位论文全文数据库(博士) 信息科技辑》 *
刘洋: "基于图的哈希方法的多媒体数据检索研究", 《中国优秀博硕士学位论文全文数据库(博士) 信息科技辑》 *
曹路等: "基于离散监督哈希的相似性检索算法", 《科学技术与工程》 *
梁娟: "基于目标约束优化哈希算法的大规模图像检索研究", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *

Also Published As

Publication number Publication date
CN114022701B (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
Huang et al. Deep embedding network for clustering
Lin et al. Spec hashing: Similarity preserving algorithm for entropy-based coding
CN111198959A (zh) 一种基于卷积神经网络的两阶段图像检索方法
CN112085059B (zh) 一种基于改进正余弦优化算法的乳腺癌图像特征选择方法
Ahmed Recent review on image clustering
CN112163114B (zh) 一种基于特征融合的图像检索方法
Chen et al. Spatial weighting for bag-of-visual-words and its application in content-based image retrieval
Fan et al. A hierarchical Dirichlet process mixture of generalized Dirichlet distributions for feature selection
Chalabi et al. Particle swarm optimization based block feature selection in face recognition system
Al Zorgani et al. Comparative study of image classification using machine learning algorithms
Alalyan et al. Model-based hierarchical clustering for categorical data
Wilber et al. Exemplar codes for facial attributes and tattoo recognition
Martey et al. Effective Image Representation using Double Colour Histograms for Content-Based Image Retrieval
Ansari et al. An optimized feature selection technique in diversified natural scene text for classification using genetic algorithm
CN114022701B (zh) 基于近邻监督离散判别哈希的图像分类方法
Kostinger et al. Joint learning of discriminative prototypes and large margin nearest neighbor classifiers
Yin et al. Combining pyramid representation and AdaBoost for urban scene classification using high-resolution synthetic aperture radar images
Silva et al. Improving malware detection accuracy by extracting icon information
Azzawi et al. Face recognition based on mixed between selected feature by multiwavelet and particle swarm optimization
CN106778775B (zh) 一种基于sift特征软匹配的图像分类方法
Wang et al. Classification of remotely sensed images using an ensemble of improved convolutional network
Gao et al. Scene text recognition by learning co‐occurrence of strokes based on spatiality embedded dictionary
Altintakan et al. An improved BOW approach using fuzzy feature encoding and visual-word weighting
Zeng et al. Discriminative bag-of-words-based adaptive appearance model for robust visual tracking
Khan et al. Gender classification using multi-level wavelets on real world face images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Wan Minghua

Inventor after: Chen Xueyu

Inventor after: Zhan Tianming

Inventor after: Tan Hai

Inventor after: Yang Guowei

Inventor before: Wan Minghua

Inventor before: Tan Hai

Inventor before: Chen Xueyu

Inventor before: Zhan Tianming

Inventor before: Yang Guowei

CB03 Change of inventor or designer information