CN106599932A - 一种基于多视角谱聚类的图像识别方法 - Google Patents
一种基于多视角谱聚类的图像识别方法 Download PDFInfo
- Publication number
- CN106599932A CN106599932A CN201611204912.6A CN201611204912A CN106599932A CN 106599932 A CN106599932 A CN 106599932A CN 201611204912 A CN201611204912 A CN 201611204912A CN 106599932 A CN106599932 A CN 106599932A
- Authority
- CN
- China
- Prior art keywords
- hessian
- visual angles
- image
- hessian matrixes
- matrixes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于多视角谱聚类的图像识别方法,该方法包括以下步骤,首先分别计算不同视角样本的Hessian矩阵,求取其特征值及特征向量,两视角间采取相互投影的方式不断修正Hessian矩阵,最后采用K‑means方法对合适的特征向量划分类别。该发明采用图像样本的Hessian矩阵,更好的获取样本内部结构信息,并通过多视角之间不断修正补充完善,提高Hessian矩阵对聚类效果提升的贡献。
Description
技术领域
本发明涉及一种基于多视角特征的图像识别方法,特别涉及到一种基于Hessian正则化的多视角谱聚类的图像识别方法,属于图像识别领域。
背景技术
随着计算机技术和存储技术的不断发展,大数据量的图像获取也越来越容易。图像识别是对输入的图像信息分析并提取图像的特征,根据图像的特征进行识别分类的技术,是模式识别与人工智能领域的研究热点。在实际应用中,大部分图像信息都是未标记的,对数据标记费时费力。随着社会的需要,需要分类识别对象的内容越来越复杂,如何能高效准确地将大量未标记图像数据进行识别分类是当前研究的热点问题。
谱聚类算法是无监督学习的一个重要的研究方向。它以图论作为理论基础,将聚类问题转化为图论中的对无向加权图的最优分割问题。
现有的多视角的图像识别方法大多是基于拉普拉斯正则化的多视角谱聚类方法,首先分别构造不同视角样本之间的相似度矩阵,然后计算其拉普拉斯矩阵,求取其特征值及特征向量,再根据合适的特征向量聚类不同的数据点。
拉普拉斯正则化是基于函数的一阶导数,Hessian正则化是基于对模型误差泛函参数的二阶导数,相比于拉普拉斯,Hessian方法能够更准确地描述数据潜在的局部几何特征,反应出更精细的局部结构,从而有更好的识别精确度。
发明内容
为实现有效的多视角图像识别,本发明提出一种基于Hessian正则化的多视角谱聚类的图像识别方法。该方法利用Hessian矩阵更好的挖掘出样本数据的内部结构信息,并通过多视角之间Hessian矩阵的相互修正实现信息互换,从而使样本的多视角信息可以得到充分且有效的利用,提高识别的准确度。
本发明提出的技术方案如下:
一种基于Hessian正则化的多视角谱聚类的图像识别方法,其特征在于:该方法利用图像样本的Hessian矩阵,更好的获取样本内部结构信息,通过多视角之间Hessian矩阵的不断修正,提高Hessian矩阵对聚类效果提升的贡献,具体包括如下步骤:
(1)提取输入图像的两个不同视角的特征;
(2)分别计算每个视角的Hessian矩阵,第一视角样本的Hessian矩阵用H1表示,第二视角样本的Hessian矩阵用H2表示;
(3)将矩阵H1和H2分别进行归一化处理,分别求取前k个最大的特征值及其对应的特征向量,并将所述两个视角各自的特征向量分别按列排成矩阵U1和U2;
(4)对每一个视角,将其Hessian矩阵沿着另一个视角获取的特征向量方向投影,从而获取聚类的有效信息,摒弃聚类无关信息,然后再投影回n维空间中,这样就得到了修正后的该视角的Hessian矩阵;
(5)将步骤(3)和(4)迭代规定的次数后,选取两个视角中具有代表性的最终修正的Hessian矩阵,求取前k个最大的特征值及其对应的特征向量,利用K-means方法聚类。
更具体地,所述不同视角是指同一图像的不同方面,可以是不同的颜色信息、形状信息,可以是高频分量和低频分量,也可以是两种不同特征提取方法获取的特征。
更具体地,步骤(1)还包括将提取的特征数据通过低通滤波去除高频噪声,以及对去噪后的数据进行降维和归一化处理。
更具体地,步骤(4)中,各视角Hessian矩阵的修正方法为:和其中sym(S)=(S+ST)/2,S1和S2分别是两个视角修正后的Hessian矩阵,符号T表示矩阵转置运算。
附图说明
图1所示为图像识别装置的工作流程图;
图2所示为本发明方法的流程图;
图3所示为本发明所采用的预处理方法的流程图;
图4所示为本发明所采用的Hessian正则处理的流程图;
图5所示为本发明所采用的相互投影及迭代过程的流程图。
具体实施方式
下面将结合附图对本发明进行详细说明。
如图1所示,数字图像存储设备中存放了图像信息,首先提取原始图像数据样本的两个视角的特征子图,两个视角可以是不同的颜色信息、形状信息,可以是高频分量和低频分量,也可以是两种不同特征提取方法获取的特征。只要是获取的同一图像的不同的特征信息,就可以看作是两个不同的视角。总之,所选取的特征子图能够反映出原始样本的不同信息。接下来,采取预设的图像处理的方法(如,谱聚类)对样本进行学习,并对学习所得的特征向量采用k均值方法进行类别划分。
本发明涉及的方法如图2所示。步骤10是起始动作。步骤11是对输入的图像提取两个视角特征,进行预处理,得到低维的向量表示,其详细降维过程说明如图3所示。接下来,分别计算每个样本的Hessian矩阵,获取图像样本的局部结构信息,第一视角样本的Hessian矩阵用H1表示,第二视角样本的Hessian矩阵用H2表示。并求取Hessian矩阵的特征值及其对应的特征向量。步骤13是两视角之间互换信息的过程,利用一个视角的Hessian矩阵的特征向量去修正另一个视角的Hessian矩阵,反之亦然,该过程迭代重复几次(步骤14),直到两个视角对数据聚类划分趋于一致。步骤15是对学得的特征向量,利用k均值方法进行类别划分。步骤16为结束状态。
图3给出了图2步骤11的详细描述。具体描述了如何对提取的特征进行降维的过程。步骤1100是起始状态,步骤1101是将提取后的图像特征作为预处理数据的来源。由于Hessian矩阵涉及二阶梯度,实际计算图像特征数据量较大,又因为Hessian对噪声比较敏感,因此要对数据进行预处理。步骤1102是将数据通过低通滤波,去除高频噪声。步骤1103是采用K-L变换降维的方法,对去噪后的数据进行降维处理。步骤1104是对降维后的数据进行归一化处理。步骤1105为结束状态,得到了预处理后得归一化的降维数据信息。
图4给出了图2步骤12的详细描述。具体说明如何利用Hessian矩阵。步骤1200是起始状态。步骤1201是列举数据样本集,两个视角特征样本集用表示,v表示第v个视角,n表示样本图像数。步骤1202是分别计算两个视角的Hessian矩阵,Hessian能够更好的展现数据样本之间的局部结构信息,能够提高数据划分的正确率。步骤1203是分别计算两个视角Hessian矩阵的特征值,取前k个特征值并求出对应的特征向量将前k个特征向量,按列排列成矩阵U(v)。步骤1205为结束状态。
图5给出了图2中步骤13的详细描述,具体说明了两视角数据之间如何互相修正,实现相互补充完善来提高最终聚类划分效果。步骤1300是起始状态。步骤1301是两视角之间通过投影实现信息相互补充完善。已知Hessian矩阵的前k个特征向量含有聚类判别信息,因此将Hessian矩阵H沿着另一个视角获取的特征向量U方向投影,获取聚类的有效信息,从来摒弃聚类无关信息,然后再投影回n维空间中,这样就得到了修正后的Hessian矩阵。如步骤1301所示,各视角修正后的Hessian矩阵:和 其中sym(S)=(S+ST)/2,使得修正后的Hessian矩阵为对阵半正定矩阵。步骤1302开始迭代过程,将修正后的矩阵作为新的Hessian矩阵,然后求取前k个特征值及其特征向量,继续投影修正,具体计算如1303所示,直到迭代设定的iter次后。步骤1305为结束状态。
为了验证本发明方法的有效性,我们采用COIL-20图片数据集进行了实验。实验采用召回率(Recall)、精确度(Precision)来展示聚类精确度。设置迭代次数iter为5,所有的实验都被重复执行10次,记录实验的平均结果。从下表可以看出,本发明方法有较好的聚类效果。基于Hessian正则化的多视角谱聚类方法HesMSC能够提高聚类精确度。
Claims (4)
1.一种基于Hessian正则化的多视角谱聚类的图像识别方法,其特征在于:该方法利用图像样本的Hessian矩阵,更好的获取样本内部结构信息,通过多视角之间Hessian矩阵的不断修正,提高Hessian矩阵对聚类效果提升的贡献,具体包括如下步骤:
(1)提取输入图像的两个不同视角的特征;
(2)分别计算每个视角的Hessian矩阵,第一视角样本的Hessian矩阵用H1表示,第二视角样本的Hessian矩阵用H2表示;
(3)将矩阵H1和H2分别进行归一化处理,分别求取前k个最大的特征值及其对应的特征向量,并将所述两个视角各自的特征向量分别按列排成矩阵U1和U2;
(4)对每一个视角,将其Hessian矩阵沿着另一个视角获取的特征向量方向投影,从而获取聚类的有效信息,摒弃聚类无关信息,然后再投影回n维空间中,这样就得到了修正后的该视角的Hessian矩阵;
(5)将步骤(3)和(4)迭代规定的次数后,选取两个视角中具有代表性的最终修正的Hessian矩阵,求取前k个最大的特征值及其对应的特征向量,利用K-means方法聚类。
2.根据权利要求1所述的所述一种基于多视角谱聚类的图像识别方法,其特征在于:所述不同视角是指同一图像的不同方面,可以是不同的颜色信息、形状信息,可以是高频分量和低频分量,也可以是两种不同特征提取方法获取的特征。
3.根据权利要求1所述的所述一种基于多视角谱聚类的图像识别方法,其特征在于:步骤(1)还包括将提取的特征数据通过低通滤波去除高频噪声,以及对去噪后的数据进行降维和归一化处理。
4.根据权利要求1所述的所述一种基于多视角谱聚类的图像识别方法,其特征在于:步骤(4)中,各视角Hessian矩阵的修正方法为:和其中sym(S)=(S+ST)/2,S1和S2分别是两个视角修正后的Hessian矩阵,符号T表示矩阵转置运算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611204912.6A CN106599932A (zh) | 2016-12-23 | 2016-12-23 | 一种基于多视角谱聚类的图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611204912.6A CN106599932A (zh) | 2016-12-23 | 2016-12-23 | 一种基于多视角谱聚类的图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106599932A true CN106599932A (zh) | 2017-04-26 |
Family
ID=58603317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611204912.6A Pending CN106599932A (zh) | 2016-12-23 | 2016-12-23 | 一种基于多视角谱聚类的图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106599932A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982338A (zh) * | 2012-10-25 | 2013-03-20 | 西安电子科技大学 | 基于谱聚类的极化sar图像分类方法 |
CN103489003A (zh) * | 2013-09-29 | 2014-01-01 | 华南理工大学 | 一种基于云计算的手机图像标注方法 |
CN105718915A (zh) * | 2016-01-27 | 2016-06-29 | 中国石油大学(华东) | 一种基于多视角典型相关分析的人脸识别方法及其系统 |
-
2016
- 2016-12-23 CN CN201611204912.6A patent/CN106599932A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982338A (zh) * | 2012-10-25 | 2013-03-20 | 西安电子科技大学 | 基于谱聚类的极化sar图像分类方法 |
CN103489003A (zh) * | 2013-09-29 | 2014-01-01 | 华南理工大学 | 一种基于云计算的手机图像标注方法 |
CN105718915A (zh) * | 2016-01-27 | 2016-06-29 | 中国石油大学(华东) | 一种基于多视角典型相关分析的人脸识别方法及其系统 |
Non-Patent Citations (2)
Title |
---|
YANG LI ET AL.: ""Co-Spectral Clustering Based Density Peak"", 《2015 IEEE 16TH INTERNATIONAL CONFERENCE ON COMMUNICATION TECHNOLOGY (ICCT)》 * |
李波 著: "《高维数据的流形学习分析方法》", 31 May 2016 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110348399B (zh) | 基于原型学习机制和多维残差网络的高光谱智能分类方法 | |
US20240202871A1 (en) | Three-dimensional point cloud upsampling method, system and device, and medium | |
CN108615010B (zh) | 基于平行卷积神经网络特征图融合的人脸表情识别方法 | |
CN108304357B (zh) | 一种基于字体流形的中文字库自动生成方法 | |
Wu et al. | Harvesting discriminative meta objects with deep CNN features for scene classification | |
CN105760821B (zh) | 基于核空间的分类聚集稀疏表示的人脸识别方法 | |
Reddy Mopuri et al. | Object level deep feature pooling for compact image representation | |
CN107368807B (zh) | 一种基于视觉词袋模型的监控视频车型分类方法 | |
CN104268593B (zh) | 一种小样本情况下多稀疏表示的人脸识别方法 | |
CN109740679B (zh) | 一种基于卷积神经网络和朴素贝叶斯的目标识别方法 | |
CN107609503A (zh) | 智能癌变细胞识别系统及方法、云平台、服务器、计算机 | |
CN106503727B (zh) | 一种高光谱图像分类的方法及装置 | |
CN103942571B (zh) | 一种基于遗传规划算法的图形图像分类方法 | |
CN109544511B (zh) | 基于粒子群算法优化的卷积神经网络对肺结节识别的方法 | |
CN111126361B (zh) | 基于半监督学习和特征约束的sar目标鉴别方法 | |
Champ et al. | A comparative study of fine-grained classification methods in the context of the LifeCLEF plant identification challenge 2015 | |
CN103425996A (zh) | 一种并行分布式的大规模图像识别方法 | |
CN111028923B (zh) | 数字病理图像染色归一化方法、电子装置及存储介质 | |
CN106529586A (zh) | 基于补充文本特征的图像分类方法 | |
CN115049814B (zh) | 采用神经网络模型的护眼灯智能调节方法 | |
CN105654122A (zh) | 基于核函数匹配的空间金字塔物体识别方法 | |
CN110119455A (zh) | 一种基于卷积深度置信网络的图像分类检索方法 | |
CN110543916A (zh) | 一种缺失多视图数据的分类方法及系统 | |
CN114299362A (zh) | 一种基于k-means聚类的小样本图像分类方法 | |
CN114202694A (zh) | 基于流形混合插值和对比学习的小样本遥感场景图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170426 |
|
WD01 | Invention patent application deemed withdrawn after publication |