CN106599932A

CN106599932A - 一种基于多视角谱聚类的图像识别方法

Info

Publication number: CN106599932A
Application number: CN201611204912.6A
Authority: CN
Inventors: 李阳; 张元元; 姜树明; 李凤娇; 聂明钰
Original assignee: INFORMATION RESEARCH INSTITUTE OF SHANDONG ACADEMY OF SCIENCES
Current assignee: INFORMATION RESEARCH INSTITUTE OF SHANDONG ACADEMY OF SCIENCES
Priority date: 2016-12-23
Filing date: 2016-12-23
Publication date: 2017-04-26

Abstract

本发明公开一种基于多视角谱聚类的图像识别方法，该方法包括以下步骤，首先分别计算不同视角样本的Hessian矩阵，求取其特征值及特征向量，两视角间采取相互投影的方式不断修正Hessian矩阵，最后采用K‑means方法对合适的特征向量划分类别。该发明采用图像样本的Hessian矩阵，更好的获取样本内部结构信息，并通过多视角之间不断修正补充完善，提高Hessian矩阵对聚类效果提升的贡献。

Description

一种基于多视角谱聚类的图像识别方法

技术领域

本发明涉及一种基于多视角特征的图像识别方法，特别涉及到一种基于Hessian正则化的多视角谱聚类的图像识别方法，属于图像识别领域。

背景技术

随着计算机技术和存储技术的不断发展，大数据量的图像获取也越来越容易。图像识别是对输入的图像信息分析并提取图像的特征，根据图像的特征进行识别分类的技术，是模式识别与人工智能领域的研究热点。在实际应用中，大部分图像信息都是未标记的，对数据标记费时费力。随着社会的需要，需要分类识别对象的内容越来越复杂，如何能高效准确地将大量未标记图像数据进行识别分类是当前研究的热点问题。

谱聚类算法是无监督学习的一个重要的研究方向。它以图论作为理论基础，将聚类问题转化为图论中的对无向加权图的最优分割问题。

现有的多视角的图像识别方法大多是基于拉普拉斯正则化的多视角谱聚类方法，首先分别构造不同视角样本之间的相似度矩阵，然后计算其拉普拉斯矩阵，求取其特征值及特征向量，再根据合适的特征向量聚类不同的数据点。

拉普拉斯正则化是基于函数的一阶导数，Hessian正则化是基于对模型误差泛函参数的二阶导数，相比于拉普拉斯，Hessian方法能够更准确地描述数据潜在的局部几何特征，反应出更精细的局部结构，从而有更好的识别精确度。

发明内容

为实现有效的多视角图像识别，本发明提出一种基于Hessian正则化的多视角谱聚类的图像识别方法。该方法利用Hessian矩阵更好的挖掘出样本数据的内部结构信息，并通过多视角之间Hessian矩阵的相互修正实现信息互换，从而使样本的多视角信息可以得到充分且有效的利用，提高识别的准确度。

本发明提出的技术方案如下：

一种基于Hessian正则化的多视角谱聚类的图像识别方法，其特征在于：该方法利用图像样本的Hessian矩阵，更好的获取样本内部结构信息，通过多视角之间Hessian矩阵的不断修正，提高Hessian矩阵对聚类效果提升的贡献，具体包括如下步骤：

(1)提取输入图像的两个不同视角的特征；

(2)分别计算每个视角的Hessian矩阵，第一视角样本的Hessian矩阵用H¹表示，第二视角样本的Hessian矩阵用H²表示；

(3)将矩阵H¹和H²分别进行归一化处理，分别求取前k个最大的特征值及其对应的特征向量，并将所述两个视角各自的特征向量分别按列排成矩阵U¹和U²；

(4)对每一个视角，将其Hessian矩阵沿着另一个视角获取的特征向量方向投影，从而获取聚类的有效信息，摒弃聚类无关信息，然后再投影回n维空间中，这样就得到了修正后的该视角的Hessian矩阵；

(5)将步骤(3)和(4)迭代规定的次数后，选取两个视角中具有代表性的最终修正的Hessian矩阵，求取前k个最大的特征值及其对应的特征向量，利用K-means方法聚类。

更具体地，所述不同视角是指同一图像的不同方面，可以是不同的颜色信息、形状信息，可以是高频分量和低频分量，也可以是两种不同特征提取方法获取的特征。

更具体地，步骤(1)还包括将提取的特征数据通过低通滤波去除高频噪声，以及对去噪后的数据进行降维和归一化处理。

更具体地，步骤(4)中，各视角Hessian矩阵的修正方法为：和其中sym(S)＝(S+S^T)/2，S¹和S²分别是两个视角修正后的Hessian矩阵，符号T表示矩阵转置运算。

附图说明

图1所示为图像识别装置的工作流程图；

图2所示为本发明方法的流程图；

图3所示为本发明所采用的预处理方法的流程图；

图4所示为本发明所采用的Hessian正则处理的流程图；

图5所示为本发明所采用的相互投影及迭代过程的流程图。

具体实施方式

下面将结合附图对本发明进行详细说明。

如图1所示，数字图像存储设备中存放了图像信息，首先提取原始图像数据样本的两个视角的特征子图，两个视角可以是不同的颜色信息、形状信息，可以是高频分量和低频分量，也可以是两种不同特征提取方法获取的特征。只要是获取的同一图像的不同的特征信息，就可以看作是两个不同的视角。总之，所选取的特征子图能够反映出原始样本的不同信息。接下来，采取预设的图像处理的方法(如，谱聚类)对样本进行学习，并对学习所得的特征向量采用k均值方法进行类别划分。

本发明涉及的方法如图2所示。步骤10是起始动作。步骤11是对输入的图像提取两个视角特征，进行预处理，得到低维的向量表示，其详细降维过程说明如图3所示。接下来，分别计算每个样本的Hessian矩阵，获取图像样本的局部结构信息，第一视角样本的Hessian矩阵用H¹表示，第二视角样本的Hessian矩阵用H²表示。并求取Hessian矩阵的特征值及其对应的特征向量。步骤13是两视角之间互换信息的过程，利用一个视角的Hessian矩阵的特征向量去修正另一个视角的Hessian矩阵，反之亦然，该过程迭代重复几次(步骤14)，直到两个视角对数据聚类划分趋于一致。步骤15是对学得的特征向量，利用k均值方法进行类别划分。步骤16为结束状态。

图3给出了图2步骤11的详细描述。具体描述了如何对提取的特征进行降维的过程。步骤1100是起始状态，步骤1101是将提取后的图像特征作为预处理数据的来源。由于Hessian矩阵涉及二阶梯度，实际计算图像特征数据量较大，又因为Hessian对噪声比较敏感，因此要对数据进行预处理。步骤1102是将数据通过低通滤波，去除高频噪声。步骤1103是采用K-L变换降维的方法，对去噪后的数据进行降维处理。步骤1104是对降维后的数据进行归一化处理。步骤1105为结束状态，得到了预处理后得归一化的降维数据信息。

图4给出了图2步骤12的详细描述。具体说明如何利用Hessian矩阵。步骤1200是起始状态。步骤1201是列举数据样本集，两个视角特征样本集用表示，v表示第v个视角，n表示样本图像数。步骤1202是分别计算两个视角的Hessian矩阵，Hessian能够更好的展现数据样本之间的局部结构信息，能够提高数据划分的正确率。步骤1203是分别计算两个视角Hessian矩阵的特征值，取前k个特征值并求出对应的特征向量将前k个特征向量，按列排列成矩阵U^(v)。步骤1205为结束状态。

图5给出了图2中步骤13的详细描述，具体说明了两视角数据之间如何互相修正，实现相互补充完善来提高最终聚类划分效果。步骤1300是起始状态。步骤1301是两视角之间通过投影实现信息相互补充完善。已知Hessian矩阵的前k个特征向量含有聚类判别信息，因此将Hessian矩阵H沿着另一个视角获取的特征向量U方向投影，获取聚类的有效信息，从来摒弃聚类无关信息，然后再投影回n维空间中，这样就得到了修正后的Hessian矩阵。如步骤1301所示，各视角修正后的Hessian矩阵：和其中sym(S)＝(S+S^T)/2，使得修正后的Hessian矩阵为对阵半正定矩阵。步骤1302开始迭代过程，将修正后的矩阵作为新的Hessian矩阵，然后求取前k个特征值及其特征向量，继续投影修正，具体计算如1303所示，直到迭代设定的iter次后。步骤1305为结束状态。

为了验证本发明方法的有效性，我们采用COIL-20图片数据集进行了实验。实验采用召回率(Recall)、精确度(Precision)来展示聚类精确度。设置迭代次数iter为5，所有的实验都被重复执行10次，记录实验的平均结果。从下表可以看出，本发明方法有较好的聚类效果。基于Hessian正则化的多视角谱聚类方法HesMSC能够提高聚类精确度。

Claims

1.一种基于Hessian正则化的多视角谱聚类的图像识别方法，其特征在于：该方法利用图像样本的Hessian矩阵，更好的获取样本内部结构信息，通过多视角之间Hessian矩阵的不断修正，提高Hessian矩阵对聚类效果提升的贡献，具体包括如下步骤：

(1)提取输入图像的两个不同视角的特征；

2.根据权利要求1所述的所述一种基于多视角谱聚类的图像识别方法，其特征在于：所述不同视角是指同一图像的不同方面，可以是不同的颜色信息、形状信息，可以是高频分量和低频分量，也可以是两种不同特征提取方法获取的特征。

3.根据权利要求1所述的所述一种基于多视角谱聚类的图像识别方法，其特征在于：步骤(1)还包括将提取的特征数据通过低通滤波去除高频噪声，以及对去噪后的数据进行降维和归一化处理。

4.根据权利要求1所述的所述一种基于多视角谱聚类的图像识别方法，其特征在于：步骤(4)中，各视角Hessian矩阵的修正方法为：和其中sym(S)＝(S+S^T)/2，S¹和S²分别是两个视角修正后的Hessian矩阵，符号T表示矩阵转置运算。