CN113378807A - 一种类一致邻域的连续谱投影图像识别方法 - Google Patents
一种类一致邻域的连续谱投影图像识别方法 Download PDFInfo
- Publication number
- CN113378807A CN113378807A CN202110934806.8A CN202110934806A CN113378807A CN 113378807 A CN113378807 A CN 113378807A CN 202110934806 A CN202110934806 A CN 202110934806A CN 113378807 A CN113378807 A CN 113378807A
- Authority
- CN
- China
- Prior art keywords
- neighborhood
- image
- consistent
- class
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及模式识别,机器学习技术领域,公开一种类一致邻域的连续谱投影图像识别方法,包括以下步骤:设定图像数据的初始类一致邻域;估计类一致邻域的信赖概率密度;基于类一致概率密度函数构造邻接矩阵;通过谱投影扩展类一致邻域;再次估计类一致邻域的概率密度并强化邻接矩阵;再次谱投影并聚类完成识别。相比于传统方法,本发明能够针对图像数据的特点,有效学习具有强同类连接和弱异类连接的邻接矩阵,实现具有明显优势的高精度聚类,且相比于其他的深度学习方法,提供了具有可解释性、计算快速简单、适用面广泛的双层简单网络结构,无需训练图像和优化计算即可实现数据重表示,能够在多种类型的图像上,实现简便,快速,精准的种类识别。
Description
技术领域
本发明涉及模式识别,机器学习技术领域,特别涉及一种类一致邻域的连续谱投影图像识别方法。
背景技术
图像识别是机器学习领域的重要组成部分,其目的在于恢复图像背后的潜在类别结构。图像识别方法分为有监督和无监督两种类型。其中,无监督的图像识别能降低对图像进行标记人力和时间成本,同时适用于犯罪预防与侦破等无法对图像进行标记的场合。然而,在无监督图像识别中,由于没有先验知识给定,检索潜在图像类别结构是一个很大的挑战。在现实生活中,人们所需要处理的图像数据往往具有较高的维数,同时具有复杂的数据结构和属性,这大大增加了识别的难度。
现有的常用无监督图像识别方法多有缺陷。经典的K-均值算法和高斯混合模型需要每个类之间有明显的间隔,并且要求图像数据集近似线性可分。在科研和工程中,图像数据集往往是线性不可分的,因此直接使用K-均值算法和高斯混合模型难以取得满意的效果。后续发展的谱方法效果好于前面描述的经典方法,但通常难以学习出同时具备类内强连接和类间弱连接的邻接矩阵。因此,在具有噪音或者分布杂乱的高维图像数据集上,谱方法的效果提升非常有限。相对于以上算法,近年来热度较高的深度学习方法能取得较好的图像识别效果,但其问题依然存在。其一,深度学习框架需要针对图像数据的属性特别地设计网络的结构和超参数,这限制了深度框架的可扩展性。其二,深度学习需要训练大量的参数用于获得图像的良好表示,这一过程非常耗时。其三,深度学习是黑箱模型,其操作的可解释性较差。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提出了一种类一致邻域的连续谱投影图像识别方法,通过估算每个图像样本类一致邻域的信赖概率密度,并利用连续的谱投影,获得了具有强连通类内连接和弱类间连接的近似理想邻接矩阵,并得到了图像数据的高度可分特征表示,便于识别, 最后使用一种稳定快速的方法实现聚类,完成图像识别,其具体技术方案如下:
一种类一致邻域的连续谱投影图像识别方法,包括如下步骤:
步骤一,设置图像数据集中每个样本的初始类一致邻域;
步骤二,估计每个图像样本类一致邻域的信赖概率密度;
步骤三,基于每个图像样本的类一致邻域的信赖概率密度函数构造邻接矩阵A;
步骤四,按照规范切图的方式计算邻接矩阵A的谱投影Y,并通过Y扩展每个样本的类一致邻域;
步骤五,再次估计类一致邻域的信赖概率密度并强化邻接矩阵B;
步骤六,按照商连接的方式计算邻接矩阵B的谱投影U,并对U聚类,完成图像识别。
进一步的,所述步骤一具体为:设置图像数据集中每个样本的初始类一致邻域:对
于图像数据集中的每个图像样本,设置其初始类一致邻域半径为,并设置为的初始类一致邻域;是距离度量,采用欧式距离,代表数据集中的第个近邻点,设置为 , 代表不超过的最大整数,代表数据集的样本数目,K代表数据集的类别
数目。
进一步的,所述步骤四具体包括如下步骤:
(4.4)对于每个,把所有图像样本的谱投影与它的距离从小到大排序为,通过 ,即对每个,
记,并记为中的最大元素所对应下标中的第二个分
量,使用估算的类一致邻域的规模,并扩展的类一致邻域半径为扩展的类一致邻域为。
进一步的,所述步骤五具体包括如下步骤:
进一步的,所述步骤六具体包括如下步骤:
本发明的优点:
相比于传统方法,本发明能够有效地针对图像数据学习出具有强同类连接和弱异类连接的邻接矩阵,实现具有明显优势的高精度图像识别;相比于近年兴起的深度学习方法,本发明提供了具有可解释性、计算快速简单、适用面广泛的双层简单网络结构,无需训练样本和优化计算即可实现数据重表示;本发明能够在多种类型的图像数据集上,实现简便,快速,精准的种类识别。
附图说明
图1是本发明方法流程图;
图2a是本发明所实施的图像案例之一:COIL-20物品图像数据集;
图2b是本发明所实施的图像案例之二:PIE人脸图像数据集;
图2c 是本发明所实施的图像案例之三:MNIST手写数字图像数据集;
图3是本发明实施例的邻接矩阵A与高斯邻接矩阵的连接纯度对比示意图;
图4a是本发明实施例的数据集COIL-20的X和Y中每一个样本的真实类一致邻域的规模示意图;
图4b是本发明实施例的数据集COIL-20的X和Y中每一个样本的估计类一致邻域的查准率示意图;
图4c是本发明实施例的数据集COIL-20的 X和Y中每一个样本的估计类一致邻域的查全率示意图;
图5a是本发明实施例的邻接矩阵A的类内连接模式示意图;
图5b是本发明实施例的邻接矩阵B的类内连接模式示意图。
具体实施方式
为了使本发明的目的、技术方案和技术效果更加清楚明白,以下结合说明书附图,以物品图像数据集COIL-20为例,对本发明作进一步详细说明。
如图1所示,一种类一致邻域的连续谱投影图像识别方法,包括如下步骤:
步骤一,设置图像数据集中每个样本的初始类一致邻域:对于图像数据集中的每个样本,设置其初始类一致邻域半径为,并
设置为的初始类一致邻域;是距离度量, 代
表数据集中的第个近邻点,设置为,代表不超过的最大整数,代
表图像数据集的样本数目,代表图像数据集的类别数目。对于物品图像数据集COIL-20,
距离度量采用欧氏距离。
步骤三,基于每个图像样本的类一致概率密度函数构造邻接矩阵:计算与的
类一致信任度为 并构造邻接矩阵,使得的第
行,第列的元素为 = 。这样学习出的邻接矩阵在保证同类连接强度的同时,能
够抑制异类样本的连接强度。通过“连接纯度”这一统计量可以说明本发明中的邻接矩阵
相比传统高斯邻接矩阵的优势,所述图像样本的“连接纯度(purity)”的定义为
其中代表的真实标签,的值介于0到1之间,且越接近1越好。如
图3所示,对于图像数据集COIL-20,本发明得到邻接矩阵和传统的高斯邻接矩阵的样本连
接纯度对比。可以得到,高斯邻接矩阵的部分样本具有较低的连接纯度,而本发明的邻接矩
阵对于几乎所有点都有更接近1的连接纯度。
(4.4)对于每个,把所有图像样本的谱投影与它的距离从小到大排序为,通过 ,即对每个,
记,并记为中的最大元素所对应下标中的第二个分
量,使用估算的类一致邻域的规模,并扩展的类一致邻域半径为扩展的类一致邻域为。
相比于步骤一中的初始邻域,步骤四中的扩充邻域有下面三个方面的提升:
(1)由于比原始图像具有更好的邻域一致性,因此每个拥
有更多的同类点作为邻域。如图4a所示,展示了图像数据集COIL-20的 = 和中每一个样本的真实类一致邻域的规模。可以发现,的真实类一致邻域规
模要大于的。
查准率越高,说明邻域中同类的比例越高。如图4b所示,展示了图像数据集COIL-
20的和中每一个样本的估计类一致邻域的查准率,可以发现,图像的谱投影数据中的
样本的估计类一致邻域的同类比例要高于原始图像数据中的。
查全率越高,说明邻域捕捉到同类占所有同类的比例越高。如图4c所示,展示了图
像数据集COIL-20的和中每一个样本的估计类一致邻域的查全率,可以发现,图像的谱
投影数据中的样本类一致邻域捕获的同类的能力要强于原始数据中的。
以下举出多个实例,体现本发明中方法的优势。首先对8个公开的图像数据集进行聚类,所述图像数据集包括:两个静物图像集:COIL-20和COIL-100,三个人脸图像集:PIE,ORL,UMist, 三个手写数字图像集: USPS,MNIST, Pendigit。如图2a、图2b和图2c所示,分别为其中的三个典型图像数据集COIL-20、PIE、 MNIST的实例展示。比较本发明方法与近年常用的无监督图像识别方法:稀疏自适应谱聚类(S-STSC), 基于标记点的谱聚类(LSC),可扩展的弹性网络子空间聚类 (EnSC), 高效稠密子空间聚类(EDSC), 图度链接分层聚类(GDL)和图平均分层聚类(GAL)。评价的标准是聚类准确率,结果见表1,可得到本发明的识别准确率在所有的图像数据集上都表现最佳,且明显优于其他所有方法。
表1
表2统计了这些方法在同一台计算机上所需的运行时间。可以得到本发明的方法在所有的方法中,属于低时耗的方法。
表2
表1和表2说明了,相比以往的图像识别方法,本发明的方法同时具有高性能和高效率的特点。
除了图像例子,还可以通过一些其他领域的实际例子说明本发明方法具有的广泛适用性。本发明对6个公开的其他数据集进行识别,这些数据集包括:文本数据集RCV1-4,医疗诊断数据集Breast Tissue, 植物学数据集Seeds和Iris, 遥感数据集Satillite和图像分割数据集Segmentation。 表3统计了本发明的方法和对比方法在这些数据集上的识别准确率。由于这些数据集不具有子空间特性,因此子空间方法EnSC和EDSC不参与比较。可以得到对于不同领域的数据集,本发明总能提供最佳的识别结果。
表 3
以上所述,仅为本发明的优选实施案例,并非对本发明做任何形式上的限制。虽然前文对本发明的实施过程进行了详细说明,对于熟悉本领域的人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行同等替换。凡在本发明精神和原则之内所做修改、同等替换等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种类一致邻域的连续谱投影图像识别方法,其特征在于,包括如下步骤:
步骤一,设置图像数据集中每个样本的初始类一致邻域;
步骤二,估计每个图像样本类一致邻域的信赖概率密度;
步骤三,基于每个图像样本的类一致邻域的信赖概率密度函数构造邻接矩阵A;
步骤四,按照规范切图的方式计算邻接矩阵A的谱投影Y,并通过Y扩展每个样本的类一致邻域;
步骤五,再次估计类一致邻域的信赖概率密度并强化邻接矩阵B;
步骤六,按照商连接的方式计算邻接矩阵B的谱投影U,并对U聚类,完成图像识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110934806.8A CN113378807B (zh) | 2021-08-16 | 2021-08-16 | 一种类一致邻域的连续谱投影图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110934806.8A CN113378807B (zh) | 2021-08-16 | 2021-08-16 | 一种类一致邻域的连续谱投影图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113378807A true CN113378807A (zh) | 2021-09-10 |
CN113378807B CN113378807B (zh) | 2021-11-02 |
Family
ID=77577223
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110934806.8A Active CN113378807B (zh) | 2021-08-16 | 2021-08-16 | 一种类一致邻域的连续谱投影图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113378807B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480623A (zh) * | 2017-08-07 | 2017-12-15 | 西安电子科技大学 | 基于协作表示的近邻保持人脸识别方法 |
CN107832715A (zh) * | 2017-11-15 | 2018-03-23 | 天津大学 | 一种自适应近邻的人脸识别算法 |
-
2021
- 2021-08-16 CN CN202110934806.8A patent/CN113378807B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480623A (zh) * | 2017-08-07 | 2017-12-15 | 西安电子科技大学 | 基于协作表示的近邻保持人脸识别方法 |
CN107832715A (zh) * | 2017-11-15 | 2018-03-23 | 天津大学 | 一种自适应近邻的人脸识别算法 |
Non-Patent Citations (1)
Title |
---|
FREDERICK TUNG等: "Enabling scalable spectral clustering for image segmentation", 《PATTERN RECOGNITION》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113378807B (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102609681B (zh) | 基于字典学习模型的人脸识别方法 | |
Law et al. | Incremental nonlinear dimensionality reduction by manifold learning | |
Singh et al. | Svm-bdt pnn and fourier moment technique for classification of leaf shape | |
Liu et al. | Shape retrieval using hierarchical total Bregman soft clustering | |
Tao et al. | Supervised tensor learning | |
Si et al. | Learning hybrid image templates (hit) by information projection | |
CN107368807B (zh) | 一种基于视觉词袋模型的监控视频车型分类方法 | |
CN110097060B (zh) | 一种面向树干图像的开集识别方法 | |
CN107169117B (zh) | 一种基于自动编码器和dtw的手绘图人体运动检索方法 | |
CN110516533B (zh) | 一种基于深度度量的行人再辨识方法 | |
Shrivastava et al. | Unsupervised domain adaptation using parallel transport on Grassmann manifold | |
CN108509925B (zh) | 一种基于视觉词袋模型的行人重识别方法 | |
CN107358172B (zh) | 一种基于人脸朝向分类的人脸特征点初始化方法 | |
Johnsson et al. | Low bias local intrinsic dimension estimation from expected simplex skewness | |
Xu et al. | Iterative manifold embedding layer learned by incomplete data for large-scale image retrieval | |
CN106503743B (zh) | 一种数量多且维数高的图像局部特征点自适应聚类方法 | |
Jouili et al. | Median graph shift: A new clustering algorithm for graph domain | |
CN101986295A (zh) | 基于流形稀疏编码的图像聚类的方法 | |
CN110188864B (zh) | 基于分布表示和分布度量的小样本学习方法 | |
Lu et al. | Modulation recognition for incomplete signals through dictionary learning | |
CN110929801B (zh) | 一种基于改进的Euclid距离KNN分类方法和系统 | |
CN111027609B (zh) | 一种图像数据加权分类方法和系统 | |
Du et al. | Recognition of leaf image set based on manifold–manifold distance | |
CN105844299B (zh) | 一种基于词袋模型的图像分类方法 | |
Sun et al. | Multiple-kernel, multiple-instance similarity features for efficient visual object detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |