CN114022701B - 基于近邻监督离散判别哈希的图像分类方法 - Google Patents
基于近邻监督离散判别哈希的图像分类方法 Download PDFInfo
- Publication number
- CN114022701B CN114022701B CN202111228626.4A CN202111228626A CN114022701B CN 114022701 B CN114022701 B CN 114022701B CN 202111228626 A CN202111228626 A CN 202111228626A CN 114022701 B CN114022701 B CN 114022701B
- Authority
- CN
- China
- Prior art keywords
- matrix
- image
- hash
- class
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 239000011159 matrix material Substances 0.000 claims abstract description 92
- 230000006870 function Effects 0.000 claims abstract description 83
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 8
- 230000003190 augmentative effect Effects 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 5
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000010008 shearing Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 25
- 238000010276 construction Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241000271566 Aves Species 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011480 coordinate descent method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Optimization (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于近邻监督离散判别哈希的图像分类方法,获取标准的图像库,并构建新的待分类标准图像库;计算新的待分类标准图像的类间权重矩阵和类内权重矩阵,并得到类内哈希关系函数和类间哈希关系函数;在待分类标准图像库中对采集到的图像训练样本选择锚点,并计算每个训练样本与锚点之间的距离;得到最终的目标函数;对最终的目标函数进行分解,并求得特征矩阵;基于特征矩阵并利用最近邻分类器对图像进行分类;本发明可以更好的刻画样本之间的关系,加强局部类间可分性和类内紧凑性,从而学习得到更高效的哈希函数,进而学习得到紧促二进制哈希码,旨在提高用于海量数据的高维图像识别的准确性,加快查找与检索速度。
Description
技术领域
本发明涉及图像分类技术领域,具体涉及基于近邻监督离散判别哈希的图像分类方法。
背景技术
人类生产生活数据的信息化使得数据量呈现爆炸式增长,面对这些庞大的图像库,人们提出了一系列特征提取方法来进行数据压缩,而以往计算机视觉中提出的高维数据处理方法在鲁棒性和可扩展性方面有待提高。哈希算法通过随机排列或投影将原始特征映射到一个新的特征空间,并将其转换成紧凑的二进制哈希码。这不仅提高了图像搜索和检索的速度,并且提高了大规模数据的存储效率。基于这些优点,哈希算法在模式识别和数字图像处理领域受到了广泛关注。
近年来,数据依赖型哈希受到了广泛的关注,与数据独立型哈希不同,数据依赖型哈希考虑了训练样本信息。如Liu等人提出了一种无监督的锚图哈希算法(anchor graphhashing,AGH),它是一种基于图的算法,用于保持离散空间中数据固有的邻域结构,选择远少于样本数的聚类中心作为锚点,构造每个样本点与锚定点之间的相似度矩阵代替样本点与样本点之间的相似度矩阵,大大降低了计算和存储的复杂度。之后他们又提出了离散图哈希算法(discrete graph hashing,DGH),其创建锚图的方式与AGH类似,但在训练时没有考虑松弛约束,而是采用交替最大化算法求解离散约束,从而得到离散的哈希码。
但这些方法都没有考虑训练样本的标签信息,为了进一步考虑离散优化问题,Shen等人提出了离散监督哈希算法(supervised discrete hashing,SDH),有效地提高了较长哈希码的学习效率。SDH是一种最小二乘分类法,它采用离散循环坐标下降法逐位学习哈希码,目的是将哈希码回归到其相应的标签上。Cui等人提出的监督离散判别哈希算法(supervised discrete discriminant hashing,SDDH)采用一步法更新所有比特位,提高了求解速度。考虑图像的二维特征,Ding等人提出了双线性监督离散哈希算法(bilinearsupervised hashing,BSDH),利用双线性投影对图像矩阵特征进行二值化,使二维图像空间的固有特征保留在哈希码中。而以往大部分的监督哈希算法都只考虑了训练样本的标签信息,而没有进一步考虑样本与样本之间的近邻关系;因此,需要设计基于近邻监督离散判别哈希的图像分类方法。
发明内容
本发明的目的是克服现有技术的不足,为更好的有效解决上述问题,提供了一种基于近邻监督离散判别哈希的图像分类方法,该方法在考虑训练样本标签信息的基础上进一步考虑样本之间的近邻关系,以此构建出一种新的邻域图。这种算法可以更好的刻画样本之间的关系,加强局部类间可分性和类内紧凑性,从而学习得到更高效的哈希函数,进而学习得到紧促二进制哈希码,旨在提高用于海量数据的高维图像识别的准确性,加快查找与检索速度。
为了达到上述目的,本发明所采用的技术方案是:
基于近邻监督离散判别哈希的图像分类方法,包括以下步骤,
步骤(A),获取标准的图像库,并构建新的待分类标准图像库;
步骤(B),计算新的待分类标准图像的类间权重矩阵和类内权重矩阵,并得到类内哈希关系函数和类间哈希关系函数;
步骤(C),在待分类标准图像库中对采集到的图像训练样本选择锚点,并计算每个训练样本与锚点之间的距离;
步骤(D),根据步骤(B)和步骤(C)的计算结果相结合得到最终的目标函数;
步骤(E),对最终的目标函数进行分解,并求得特征矩阵;
步骤(F),基于特征矩阵并利用最近邻分类器对图像进行分类,输出图像的分类结果。
前述的基于近邻监督离散判别哈希的图像分类方法,步骤(A),获取标准的图像库,并构建新的待分类标准图像库,其中标准的图像库是MNIST图像库或CIFAR-10图像库,并对标准的图像库进行剪切构建新的待分类标准图像库。
前述的基于近邻监督离散判别哈希的图像分类方法,步骤(B),计算新的待分类标准图像的类间权重矩阵Sb和类内权重矩阵Sw,并得到类内哈希关系函数G(s)和类间哈希关系函数G(d),其具体步骤如下,
步骤(B1),定义类间权重矩阵Sb如公式(1)所示,
其中,ON-(xi)表示与样本xi属于不同类且不是xi近邻的点的集合,N-(xi)表示与样本xi不属于同一类且与xi近邻的点的集合,||xi-xj||表示样本xi与xj之间的欧式距离,t是值为正的参数,exp(·)是一个瞬时变化率较快的指数函数;
步骤(B2),定义类内权重矩阵Sw如公式(2)所示,
其中,N+(xi)表示与样本xi属于同一类且与xi近邻的点的集合;
步骤(B3),得到类内哈希关系函数G(s)和类间哈希关系函数G(d)如公式(3)所示,
s.t. bk=sgn(F(xi)) i=1,2,...,n (3)
其中,sgn(·)为符号函数,当自变量为正数时输出+1,否则输出-1,W∈RL×L为相似性度量矩阵用来比较哈希码之间的相似度,B={b1,b2,...,bn}∈{-1,1}L×n为哈希码矩阵,T表示向量或者矩阵的转置;
步骤(B4),计算类内哈希关系函数G(s)和类间哈希关系函数G(d)之差,如公式(4),
s.t. B∈{-1,1}L×n (4)
其中,U表示投影矩阵,tr[·]表示矩阵的迹。
前述的基于近邻监督离散判别哈希的图像分类方法,步骤(C),在待分类标准图像库中对采集到的图像X训练样本选择m个锚点,并计算每个训练样本与锚点之间距离的得到Φ(X),如公式(5)所示,
前述的基于近邻监督离散判别哈希的图像分类方法,步骤(D),根据步骤(B)和步骤(C)的计算结果相结合得到最终的目标函数,如公式(6)所示,
s.t. bk=sgn(F(xi)) i=1,2,...,n (6)
其中,υ表示可调节参数,且目标函数中的F(·)定义如公式(7)所示,
F(x)=PTΦ(x) (7)
其中,P∈Rm×L为投影矩阵。
前述的基于近邻监督离散判别哈希的图像分类方法,步骤(E),对最终的目标函数进行分解,并求得特征矩阵,其具体步骤如下,
步骤(E1),构建近邻监督离散判别哈希的图像检索方法的最终目标函数,如公式(8)所示,
s.t. B∈{-1,1}L×n (8)
步骤(E2),构建增广Lagrange乘子法函数L(B,U,P),如公式(9)所示,
步骤(E3),求解变量B、U和P,具体步骤如下,
步骤(E31),F-Step,通过目标函数得出P的值仅与B有关,固定B得到如公式(10)所示,
P=(Φ(X)Φ(X)T)-1Φ(X)BT (10);
步骤(E32),G-Step,与F-Step类似,U只依赖于B,因此在目标函数中是固定B,U转化为如公式(11)所示,
其中,U由BSwBT-BSbBT较大的特征值对应的特征值向量组成;
步骤(E33),B-Step,P和U固定,优化的目标函数转化为如公式(12)所示,
tr(UTBSwBTU)-tr(UTBSbBTU)-νtr((B((PTΦ)X))T(B-PTΦ(X))) (12)
其中,由于tr(BTB)和tr((PTΦ(X))T(PTΦ(X)))是常数,进一步得到如公式(13)所示,
tr(BT(UUTBSw-UUTBSb))-νtr(BTPTΦ(X)) (13);
定义Bt为迭代学习中第t次循环所得到的二进制哈希码矩阵,可以用一个封闭形式的方案更新第t+1次循环的二进制哈希码如公式(14)所示,
Bt+1=sgn((UUTBtSw-UUTBSb)-νPTΦ(X)) (14);
步骤(E4),由于相似性度量矩阵W是对称且半正定的,这样将其分解为W=UUT,这样公式(6)可以被改写为如公式(15)所示,
s.t. bk=sgn(F(xi)) i=1,2,...,n (15);
步骤(E5),由Yi=UTXi,求得特征矩阵如公式(16)所示,
Y=(Y1,…,Yi,…,YN)T (16)
其中,UT表示U的转置矩阵,Yi表示第i个投影后样本矩阵,N表示样本总数,Xi表示第i个训练样本矩阵。
前述的基于近邻监督离散判别哈希的图像分类方法,步骤(F),基于特征矩阵并利用最近邻分类器对图像进行分类,输出图像的分类结果,具体步骤如下,
步骤(F1),定义d(Y1,Y2)如公式(17)所示,
步骤(F3),求解所有图像的最终类别,并输出图像的分类结果。
本发明的有益效果是:
第一、为了克服大部分的监督哈希算法都只考虑了训练样本的标签信息,而没有进一步考虑样本与样本之间的近邻关系;本发明在考虑训练样本标签信息的基础上进一步考虑样本之间的近邻关系,以此构建出一种新的邻域图,提出一种基于近邻监督离散判别哈希的图像检索算法(NSDDH),该算法主要构建新的邻域图以刻画样本间几何关系,从而提高了图像检索性能;这种算法可以更好的刻画样本之间的关系,加强局部类间可分性和类内紧凑性,从而学习得到更高效的哈希函数,进而学习得到紧促二进制哈希码,旨在提高用于海量数据的高维图像识别的准确性,加快查找与检索速度。
第二、本发明利用基于近邻监督离散判别哈希的图像检索算法模型和设计优化算法抽取图像识别特征,一方面,NSDDH方法利用流形学习中的图嵌入方法进行特征提取,能够更多的提取图像特征,且该方法类内协方差矩阵是可逆的,从而不存在小样品问题;另一方面,NSDDH算法利用哈希算法通过随机排列或投影将原始特征映射到一个新的特征空间,并将其转换成紧凑的二进制哈希码。这不仅提高了图像搜索和检索的速度,并且提高了大规模数据的存储效率。
第三、本发明利用最近邻分类器进行分类,可有效提高图像分类精度,促进图像的哈希特点的进一步挖掘。
第四、现有基于子空间学习和图嵌入学习模型不能解决海量数据的高维图像识别的准确性的技术问题,本发明结合哈希学习解决现有基于图嵌入学习模型的图像分类中存在的分类精度较低、检索速度慢的技术问题,提高了识别精度,可用于国家公共安全,社会安全、信息安全、金融安全以及人机交互等等领域,具有良好的应用前景。
附图说明
图1是本发明基于近邻监督离散判别哈希的图像分类方法的原理示意图;
图2是本发明的流程图;
图3是本发明的MNIST图像库中的10幅图像;
图4是本发明的CIFAR-10图像库中的部分图像;
图5是本发明在MNIST图像库上的准确率与召回率示意图;
图6是本发明在CIFAR-10图像库上的准确率与召回率示意图。
具体实施方式
下面将结合说明书附图,对本发明作进一步的说明。
如图1-6所示,本发明的基于近邻监督离散判别哈希的图像分类方法,包括以下步骤,
步骤(A),获取标准的图像库,并构建新的待分类标准图像库,其中标准的图像库是MNIST图像库或CIFAR-10图像库,并对标准的图像库进行剪切构建新的待分类标准图像库。
其中,针对新的待分类标准图像进行特征提取和特征选择:如图2所述,得到训练和测试的图像库,通过基于近邻监督离散判别哈希的图像检索方法获得最优的图像特征。
步骤(B),计算新的待分类标准图像的类间权重矩阵Sb和类内权重矩阵Sw,并得到类内哈希关系函数G(s)和类间哈希关系函数G(d),其具体步骤如下,
步骤(B1),定义类间权重矩阵Sb如公式(1)所示,
其中,ON-(xi)表示与样本xi属于不同类且不是xi近邻的点的集合,N-(xi)表示与样本xi不属于同一类且与xi近邻的点的集合,||xi-xj||表示样本xi与xj之间的欧式距离,t是值为正的参数,exp(·)是一个瞬时变化率较快的指数函数;利用这个函数可以为样本之间的关系赋予不同的权重;
步骤(B2),定义类内权重矩阵Sw如公式(2)所示,
其中,N+(xi)表示与样本xi属于同一类且与xi近邻的点的集合;
步骤(B3),得到类内哈希关系函数G(s)和类间哈希关系函数G(d)如公式(3)所示,
s.t. bk=sgn(F(xi)) i=1,2,...,n (3)
其中,sgn(·)为符号函数,当自变量为正数时输出+1,否则输出-1,W∈RL×L为相似性度量矩阵用来比较哈希码之间的相似度,B={b1,b2,...,bn}∈{-1,1}L×n为哈希码矩阵,T表示向量或者矩阵的转置;
步骤(B4),计算类内哈希关系函数G(s)和类间哈希关系函数G(d)之差,如公式(4),
s.t. B∈{-1,1}L×n (4)
其中,U表示投影矩阵,tr[·]表示矩阵的迹。
步骤(C),在待分类标准图像库中对采集到的图像X训练样本选择m个锚点,并计算每个训练样本与锚点之间距离的得到Φ(X),如公式(5)所示,
步骤(D),根据步骤(B)和步骤(C)的计算结果相结合得到最终的目标函数,如公式(6)所示,
s.t. bk=sgn(F(xi)) i=1,2,...,n (6)
其中,υ表示可调节参数,且目标函数中的F(·)定义如公式(7)所示,
F(x)=PTΦ(x) (7)
其中,P∈Rm×L为投影矩阵。
步骤(E),对最终的目标函数进行分解,并求得特征矩阵,其具体步骤如下,
步骤(E1),构建近邻监督离散判别哈希的图像检索方法的最终目标函数,如公式(8)所示,
s.t. B∈{-1,1}L×n (8)
步骤(E2),构建增广Lagrange乘子法函数L(B,U,P),如公式(9)所示,
步骤(E3),求解变量B、U和P,具体步骤如下,
步骤(E31),F-Step,通过目标函数得出P的值仅与B有关,固定B得到如公式(10)所示,
P=(Φ(X)Φ(X)T)-1Φ(X)BT (10);
步骤(E32),G-Step,与F-Step类似,U只依赖于B,因此在目标函数中是固定B,U转化为如公式(11)所示,
其中,U由BSwBT-BSbBT较大的特征值对应的特征值向量组成;
步骤(E33),B-Step,P和U固定,优化的目标函数转化为如公式(12)所示,
tr(UTBSwBTU)-tr(UTBSbBTU)-νtr((B((PTΦ)X))T(B-PTΦ(X))) (12)
其中,由于tr(BTB)和tr((PTΦ(X))T(PTΦ(X)))是常数,进一步得到如公式(13)所示,
tr(BT(UUTBSw-UUTBSb))-νtr(BTPTΦ(X)) (13);
定义Bt为迭代学习中第t次循环所得到的二进制哈希码矩阵,可以用一个封闭形式的方案更新第t+1次循环的二进制哈希码如公式(14)所示,
Bt+1=sgn((UUTBtSw-UUTBSb)-νPTΦ(X)) (14);
步骤(E4),由于相似性度量矩阵W是对称且半正定的,这样将其分解为W=UUT,这样公式(6)可以被改写为如公式(15)所示,
s.t. bk=sgn(F(xi)) i=1,2,...,n (15);
步骤(E5),由Yi=UTXi,求得特征矩阵如公式(16)所示,
Y=(Y1,…,Yi,…,YN)T (16)
其中,UT表示U的转置矩阵,Yi表示第i个投影后样本矩阵,N表示样本总数,Xi表示第i个训练样本矩阵。
步骤(F),基于特征矩阵并利用最近邻分类器对图像进行分类,输出图像的分类结果,具体步骤如下,
步骤(F1),定义d(Y1,Y2)如公式(17)所示,
步骤(F3),求解所有图像的最终类别,并输出图像的分类结果。
下面介绍本发明的一个具体实施例:
一种基于近邻监督离散判别哈希的图像分类装置,包括构建图像库单元、第一计算单元、第一图像处理单元、第二计算单元、特征矩阵计算单元和最近邻分类器单元,且每个单元的具体作用如下,
构建图像库单元,用于获取标准的图像库,构建新的待分类标准图像库;
第一计算单元,用于计算新的待分类标准图像的类内权重矩阵Sw和类间权重矩阵Sb,得到类内哈希关系函数G(s)和类间哈希关系函数G(d);
具体地,第一计算单元包括构建类内紧致图单元、构建边缘分离图单元和计算单元;其中,构建类内紧致图单元,用于通过图嵌入公式来构建类内紧致图;构建边缘分离图单元,用于通过图嵌入公式来构建边缘分离图;计算单元,得到类内哈希关系函数G(s)和类间哈希关系函数G(d);
第一图像处理单元,用于对采集到的图像X训练样本中随机选择的m(m<<n)个锚点,得到计算每个训练样本与锚点之间距离得到Φ(X);
第二计算单元,根据第一计算单元和第一图像处理单元的结果相结合得到最终的目标函数;
具体地,第二计算单元包括构建最终目标函数单元、构建增广Lagrange乘子法函数单元和求解单元,其中,构建最终目标函数单元,用于构建近邻监督离散判别哈希的图像检索算法的最终目标函数;构建增广Lagrange乘子法函数单元,用于构建增广Lagrange乘子法函数L(B,U,P);求解单元,用于求解变量B、U和P;
特征矩阵计算单元,用于根据Yi=PTXi,求得特征矩阵Y=(Y1,…,Yi,…,YN)T;
最近邻分类器单元,用于利用最近邻分类器对图像进行分类,输出图像的分类结果。
基于上述装置,下面结合常用的2种数据库进行实验分析并与现有技术进行比较,为了验证基于近邻监督离散判别哈希的图像检索方法在图像识别中的有效性,分别在MNIST和CIFAR-10图像库上进行了识别的实验,选择训练样本数为20000条,锚点数为2000;将本文所提出的NSDDH算法与AGH、SDH、SDDH三种算法进行比较,NSDDH算法的近邻数取为400;在实验过程中,设置不同的哈希码长度,分别在16,32,64,128,256五个不同的哈希码长度上进行测试;为了保证实验结果的准确性,选取迭代更新次数为5次;实验环境DellPC,且CPU为Inter Athlon(tm)64Processor,内存为1024M,Matlab 7.01。
(1)在MNIST数据库上的实验,MNIST图像库为手写数字0到9这10种不同类别的图片组成,如图3所示,均为28×28的灰度图像;实验中用784维的向量表示每幅图片,随机选择每个类中2000个数据训练,共20000条数据作为训练集,剩下1000张图片作为测试集;在MNIST图像库上的准确率测试结果的准确率、召回率、MAP值分别如图5、表1所示。
表1不同的哈希位数在MNIST图像库上的MAP值
(2)在CIFAR-10手写体数据库上的实验,CIFAR-10图像库包含鸟、鹿、猫、汽车、飞机等10种不同类别的图片,如图4所示,均为32×32的RGB彩色图像;实验中用512维的向量表示每幅图片,随机选择每个类中2000个数据训练,共20000条数据作为训练集,剩下10000张图片作为测试集;在CIFAR-10图像库上的准确率测试结果的准确率、召回率、MAP值分别如图6、表2所示。
表2不同的哈希位数在CIFAR-10图像库上的MAP值
通过上述实施例分析,本发明可有效提高图像分类精度,具有识别率高的优点,可用于国家公共安全,社会安全、信息安全、金融安全以及人机交互等等领域,具有良好的应用前景。
综上所述,本发明的基于近邻监督离散判别哈希的图像分类方法,利用一种基于近邻监督离散判别哈希的图像检索方法模型和设计优化算法抽取图像识别特征,该算法主要构建新的邻域图以刻画样本间几何关系,从而提高了图像检索性能。这种算法可以更好的刻画样本之间的关系,加强局部类间可分性和类内紧凑性,从而学习得到更高效的哈希函数,进而学习得到紧促二进制哈希码,旨在提高用于海量数据的高维图像识别的准确性,加快查找与检索速度。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (6)
1.基于近邻监督离散判别哈希的图像分类方法,其特征在于:包括以下步骤,
步骤(A),获取标准的图像库,并构建新的待分类标准图像库;
步骤(B),计算新的待分类标准图像的类间权重矩阵Sb和类内权重矩阵Sw,并得到类内哈希关系函数G(s)和类间哈希关系函数G(d),其具体步骤如下,
步骤(B1),定义类间权重矩阵Sb如公式(1)所示,
其中,ON-(xi)表示与样本xi属于不同类且不是xi近邻的点的集合,N-(xi)表示与样本xi不属于同一类且与xi近邻的点的集合,||xi-xj||表示样本xi与xj之间的欧式距离,t是值为正的参数,exp(·)是一个瞬时变化率较快的指数函数;
步骤(B2),定义类内权重矩阵Sw如公式(2)所示,
其中,N+(xi)表示与样本xi属于同一类且与xi近邻的点的集合;
步骤(B3),得到类内哈希关系函数G(s)和类间哈希关系函数G(d)如公式(3)所示,
其中,sgn(·)为符号函数,当自变量为正数时输出+1,否则输出-1,W∈RL×L为相似性度量矩阵用来比较哈希码之间的相似度,B={b1,b2,...,bn}∈{-1,1}L×n为哈希码矩阵,T表示向量或者矩阵的转置;
步骤(B4),计算类内哈希关系函数G(s)和类间哈希关系函数G(d)之差,如公式(4),
其中,U表示投影矩阵,tr[·]表示矩阵的迹;
步骤(C),在待分类标准图像库中对采集到的图像训练样本选择锚点,并计算每个训练样本与锚点之间的距离;
步骤(D),根据步骤(B)和步骤(C)的计算结果相结合得到最终的目标函数;
步骤(E),对最终的目标函数进行分解,并求得特征矩阵;
步骤(F),基于特征矩阵并利用最近邻分类器对图像进行分类,输出图像的分类结果。
2.根据权利要求1所述的基于近邻监督离散判别哈希的图像分类方法,其特征在于:步骤(A),获取标准的图像库,并构建新的待分类标准图像库,其中标准的图像库是MNIST图像库或CIFAR-10图像库,并对标准的图像库进行剪切构建新的待分类标准图像库。
5.根据权利要求4所述的基于近邻监督离散判别哈希的图像分类方法,其特征在于:步骤(E),对最终的目标函数进行分解,并求得特征矩阵,其具体步骤如下,
步骤(E1),构建近邻监督离散判别哈希的图像检索方法的最终目标函数,如公式(8)所示,
步骤(E2),构建增广Lagrange乘子法函数L(B,U,P),如公式(9)所示,
步骤(E3),求解变量B、U和P,具体步骤如下,
步骤(E31),F-Step,通过目标函数得出P的值仅与B有关,固定B得到如公式(10)所示,
P=(Φ(X)Φ(X)T)-1Φ(X)BT (10);
步骤(E32),G-Step,与F-Step类似,U只依赖于B,因此在目标函数中是固定B,U转化为如公式(11)所示,
其中,U由BSwBT-BSbBT较大的特征值对应的特征值向量组成;
步骤(E33),B-Step,P和U固定,优化的目标函数转化为如公式(12)所示,
tr(UTBSwBTU)-tr(UTBSbBTU)-νtr((B((PTΦ)X))T(B-PTΦ(X))) (12)
其中,由于tr(BTB)和tr((PTΦ(X))T(PTΦ(X)))是常数,进一步得到如公式(13)所示,
tr(BT(UUTBSw-UUTBSb))-νtr(BTPTΦ(X)) (13);
定义Bt为迭代学习中第t次循环所得到的二进制哈希码矩阵,可以用一个封闭形式的方案更新第t+1次循环的二进制哈希码如公式(14)所示,
Bt+1=sgn((UUTBtSw-UUTBSb)-νPTΦ(X)) (14);
步骤(E4),由于相似性度量矩阵W是对称且半正定的,这样将其分解为W=UUT,这样公式(6)可以被改写为如公式(15)所示,
步骤(E5),由Yi=UTXi,求得特征矩阵如公式(16)所示,
Y=(Y1,…,Yi,…,YN)T (16)
其中,UT表示U的转置矩阵,Yi表示第i个投影后样本矩阵,N表示样本总数,Xi表示第i个训练样本矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111228626.4A CN114022701B (zh) | 2021-10-21 | 2021-10-21 | 基于近邻监督离散判别哈希的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111228626.4A CN114022701B (zh) | 2021-10-21 | 2021-10-21 | 基于近邻监督离散判别哈希的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114022701A CN114022701A (zh) | 2022-02-08 |
CN114022701B true CN114022701B (zh) | 2022-06-24 |
Family
ID=80057088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111228626.4A Active CN114022701B (zh) | 2021-10-21 | 2021-10-21 | 基于近邻监督离散判别哈希的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114022701B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108805157A (zh) * | 2018-04-11 | 2018-11-13 | 南京理工大学 | 基于部分随机监督离散式哈希的遥感图像分类方法 |
CN109063113A (zh) * | 2018-07-30 | 2018-12-21 | 成都快眼科技有限公司 | 一种基于不对称深度离散哈希的快速图像检索方法、检索模型及模型构建方法 |
CN109284411A (zh) * | 2017-07-19 | 2019-01-29 | 哈尔滨工业大学深圳研究生院 | 一种基于有监督超图离散化图像二值编码方法 |
CN110110128A (zh) * | 2019-05-06 | 2019-08-09 | 西南大学 | 用于分布式架构的快速监督离散哈希图像检索系统 |
CN111325275A (zh) * | 2020-02-20 | 2020-06-23 | 南京审计大学 | 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置 |
CN111611427A (zh) * | 2020-05-21 | 2020-09-01 | 湖北工业大学 | 基于线性鉴别分析深度哈希算法的图像检索方法及系统 |
CN112528065A (zh) * | 2020-12-17 | 2021-03-19 | 重庆邮电大学 | 一种流形相似度保持自编码器的医学超声图像检索方法 |
-
2021
- 2021-10-21 CN CN202111228626.4A patent/CN114022701B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109284411A (zh) * | 2017-07-19 | 2019-01-29 | 哈尔滨工业大学深圳研究生院 | 一种基于有监督超图离散化图像二值编码方法 |
CN108805157A (zh) * | 2018-04-11 | 2018-11-13 | 南京理工大学 | 基于部分随机监督离散式哈希的遥感图像分类方法 |
CN109063113A (zh) * | 2018-07-30 | 2018-12-21 | 成都快眼科技有限公司 | 一种基于不对称深度离散哈希的快速图像检索方法、检索模型及模型构建方法 |
CN110110128A (zh) * | 2019-05-06 | 2019-08-09 | 西南大学 | 用于分布式架构的快速监督离散哈希图像检索系统 |
CN111325275A (zh) * | 2020-02-20 | 2020-06-23 | 南京审计大学 | 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置 |
CN111611427A (zh) * | 2020-05-21 | 2020-09-01 | 湖北工业大学 | 基于线性鉴别分析深度哈希算法的图像检索方法及系统 |
CN112528065A (zh) * | 2020-12-17 | 2021-03-19 | 重庆邮电大学 | 一种流形相似度保持自编码器的医学超声图像检索方法 |
Non-Patent Citations (8)
Title |
---|
Bilinear discriminant analysis hashing:A supervised hashing approach for high-dimensional data;Liu Yanzhen等;《Lecture Notes in Computer Science》;20171231;第1-14页 * |
Supervised discrete discriminant hashing for image retrieval;Yan Cuideng;《Pattern Recognition》;20180630;第79-90页 * |
Supervised Discrete Hashing;Fumin Shen等;《arXiv:1503.01557v1 [cs.CV]》;20150305;第1-10页 * |
Supervised hashing for image retrieval via image representation learning;Rongkai Xia等;《ResearchGate》;20140131;第1-8页 * |
基于图的哈希方法的多媒体数据检索研究;刘洋;《中国优秀博硕士学位论文全文数据库(博士) 信息科技辑》;20200115(第01期);I138-126 * |
基于目标约束优化哈希算法的大规模图像检索研究;梁娟;《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》;20190115(第01期);I138-3539 * |
基于离散监督哈希的相似性检索算法;曹路等;《科学技术与工程》;20170930;第17卷(第26期);第245-250页 * |
监督哈希学习方法研究;刘兴波;《中国优秀博硕士学位论文全文数据库(博士) 信息科技辑》;20211015(第10期);I140-1 * |
Also Published As
Publication number | Publication date |
---|---|
CN114022701A (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ghasedi et al. | Balanced self-paced learning for generative adversarial clustering network | |
CN111695467B (zh) | 基于超像素样本扩充的空谱全卷积高光谱图像分类方法 | |
Lin et al. | Spec hashing: Similarity preserving algorithm for entropy-based coding | |
CN112085059B (zh) | 一种基于改进正余弦优化算法的乳腺癌图像特征选择方法 | |
CN111738143B (zh) | 一种基于期望最大化的行人重识别方法 | |
CN111198959A (zh) | 一种基于卷积神经网络的两阶段图像检索方法 | |
CN111008224B (zh) | 一种基于深度多任务表示学习的时间序列分类和检索方法 | |
CN103366182B (zh) | 基于全监督非负矩阵分解的人脸识别方法 | |
Dornaika et al. | Semi-supervised classification via simultaneous label and discriminant embedding estimation | |
CN114329031B (zh) | 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法 | |
Ahmed | Recent review on image clustering | |
CN112597324A (zh) | 一种基于相关滤波的图像哈希索引构建方法、系统及设备 | |
Chalabi et al. | Particle swarm optimization based block feature selection in face recognition system | |
CN112364809A (zh) | 一种高准确率的人脸识别改进算法 | |
Al Zorgani et al. | Comparative study of image classification using machine learning algorithms | |
An et al. | Multi-level common space learning for person re-identification | |
CN114022701B (zh) | 基于近邻监督离散判别哈希的图像分类方法 | |
Kostinger et al. | Joint learning of discriminative prototypes and large margin nearest neighbor classifiers | |
Yin et al. | Combining pyramid representation and AdaBoost for urban scene classification using high-resolution synthetic aperture radar images | |
Wang et al. | Classification of remotely sensed images using an ensemble of improved convolutional network | |
CN115329821A (zh) | 一种基于配对编码网络和对比学习的舰船噪声识别方法 | |
Silva et al. | Improving malware detection accuracy by extracting icon information | |
CN112308151A (zh) | 基于加权的旋转森林高光谱图像分类方法 | |
CN106778775B (zh) | 一种基于sift特征软匹配的图像分类方法 | |
Zeng et al. | Discriminative bag-of-words-based adaptive appearance model for robust visual tracking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CB03 | Change of inventor or designer information |
Inventor after: Wan Minghua Inventor after: Chen Xueyu Inventor after: Zhan Tianming Inventor after: Tan Hai Inventor after: Yang Guowei Inventor before: Wan Minghua Inventor before: Tan Hai Inventor before: Chen Xueyu Inventor before: Zhan Tianming Inventor before: Yang Guowei |
|
CB03 | Change of inventor or designer information |