CN113378807A - 一种类一致邻域的连续谱投影图像识别方法 - Google Patents

一种类一致邻域的连续谱投影图像识别方法 Download PDF

Info

Publication number
CN113378807A
CN113378807A CN202110934806.8A CN202110934806A CN113378807A CN 113378807 A CN113378807 A CN 113378807A CN 202110934806 A CN202110934806 A CN 202110934806A CN 113378807 A CN113378807 A CN 113378807A
Authority
CN
China
Prior art keywords
neighborhood
image
consistent
class
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110934806.8A
Other languages
English (en)
Other versions
CN113378807B (zh
Inventor
张振跃
李冰杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202110934806.8A priority Critical patent/CN113378807B/zh
Publication of CN113378807A publication Critical patent/CN113378807A/zh
Application granted granted Critical
Publication of CN113378807B publication Critical patent/CN113378807B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及模式识别,机器学习技术领域,公开一种类一致邻域的连续谱投影图像识别方法,包括以下步骤:设定图像数据的初始类一致邻域;估计类一致邻域的信赖概率密度;基于类一致概率密度函数构造邻接矩阵;通过谱投影扩展类一致邻域;再次估计类一致邻域的概率密度并强化邻接矩阵;再次谱投影并聚类完成识别。相比于传统方法,本发明能够针对图像数据的特点,有效学习具有强同类连接和弱异类连接的邻接矩阵,实现具有明显优势的高精度聚类,且相比于其他的深度学习方法,提供了具有可解释性、计算快速简单、适用面广泛的双层简单网络结构,无需训练图像和优化计算即可实现数据重表示,能够在多种类型的图像上,实现简便,快速,精准的种类识别。

Description

一种类一致邻域的连续谱投影图像识别方法
技术领域
本发明涉及模式识别,机器学习技术领域,特别涉及一种类一致邻域的连续谱投影图像识别方法。
背景技术
图像识别是机器学习领域的重要组成部分,其目的在于恢复图像背后的潜在类别结构。图像识别方法分为有监督和无监督两种类型。其中,无监督的图像识别能降低对图像进行标记人力和时间成本,同时适用于犯罪预防与侦破等无法对图像进行标记的场合。然而,在无监督图像识别中,由于没有先验知识给定,检索潜在图像类别结构是一个很大的挑战。在现实生活中,人们所需要处理的图像数据往往具有较高的维数,同时具有复杂的数据结构和属性,这大大增加了识别的难度。
现有的常用无监督图像识别方法多有缺陷。经典的K-均值算法和高斯混合模型需要每个类之间有明显的间隔,并且要求图像数据集近似线性可分。在科研和工程中,图像数据集往往是线性不可分的,因此直接使用K-均值算法和高斯混合模型难以取得满意的效果。后续发展的谱方法效果好于前面描述的经典方法,但通常难以学习出同时具备类内强连接和类间弱连接的邻接矩阵。因此,在具有噪音或者分布杂乱的高维图像数据集上,谱方法的效果提升非常有限。相对于以上算法,近年来热度较高的深度学习方法能取得较好的图像识别效果,但其问题依然存在。其一,深度学习框架需要针对图像数据的属性特别地设计网络的结构和超参数,这限制了深度框架的可扩展性。其二,深度学习需要训练大量的参数用于获得图像的良好表示,这一过程非常耗时。其三,深度学习是黑箱模型,其操作的可解释性较差。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提出了一种类一致邻域的连续谱投影图像识别方法,通过估算每个图像样本类一致邻域的信赖概率密度,并利用连续的谱投影,获得了具有强连通类内连接和弱类间连接的近似理想邻接矩阵,并得到了图像数据的高度可分特征表示,便于识别, 最后使用一种稳定快速的方法实现聚类,完成图像识别,其具体技术方案如下:
一种类一致邻域的连续谱投影图像识别方法,包括如下步骤:
步骤一,设置图像数据集中每个样本的初始类一致邻域;
步骤二,估计每个图像样本类一致邻域的信赖概率密度;
步骤三,基于每个图像样本的类一致邻域的信赖概率密度函数构造邻接矩阵A
步骤四,按照规范切图的方式计算邻接矩阵A的谱投影Y,并通过Y扩展每个样本的类一致邻域;
步骤五,再次估计类一致邻域的信赖概率密度并强化邻接矩阵B
步骤六,按照商连接的方式计算邻接矩阵B的谱投影U,并对U聚类,完成图像识别。
进一步的,所述步骤一具体为:设置图像数据集中每个样本的初始类一致邻域:对 于图像数据集
Figure 538311DEST_PATH_IMAGE001
中的每个图像样本
Figure 252189DEST_PATH_IMAGE002
,设置其初始类一致邻域半径为
Figure 828664DEST_PATH_IMAGE003
,并设置
Figure 272808DEST_PATH_IMAGE004
Figure 883918DEST_PATH_IMAGE002
的初始类一致邻域;
Figure 503118DEST_PATH_IMAGE005
是距离度量,采用欧式距离,
Figure 317622DEST_PATH_IMAGE006
代表数据集中
Figure 313260DEST_PATH_IMAGE002
的第
Figure 28144DEST_PATH_IMAGE007
个近邻点,
Figure 818245DEST_PATH_IMAGE008
设置为
Figure 634891DEST_PATH_IMAGE009
Figure 919373DEST_PATH_IMAGE010
代表不超过
Figure 239496DEST_PATH_IMAGE011
的最大整数,
Figure 718275DEST_PATH_IMAGE012
代表数据集的样本数目,K代表数据集的类别 数目。
进一步的,所述步骤二具体为:对于图像样本
Figure 22218DEST_PATH_IMAGE002
,估计其类一致邻域的信赖概率密 度函数
Figure 828500DEST_PATH_IMAGE013
为:
Figure 19441DEST_PATH_IMAGE014
这里参数
Figure 151345DEST_PATH_IMAGE015
选取为:当
Figure 677004DEST_PATH_IMAGE016
时,
Figure 864141DEST_PATH_IMAGE017
, 否则
Figure 440747DEST_PATH_IMAGE018
进一步的,所述步骤三具体为:计算图像样本
Figure 323645DEST_PATH_IMAGE002
与图像样本
Figure 71022DEST_PATH_IMAGE019
的类一致信任度为
Figure 500997DEST_PATH_IMAGE020
并构造邻接矩阵A,使得A的第i行,第j列的元素为
Figure 650219DEST_PATH_IMAGE021
=
Figure 169931DEST_PATH_IMAGE022
进一步的,所述图像样本
Figure 670182DEST_PATH_IMAGE002
的连接纯度(purity)的定义为:
Figure 169428DEST_PATH_IMAGE023
其中
Figure 438735DEST_PATH_IMAGE024
代表
Figure 83343DEST_PATH_IMAGE002
的真实标签,
Figure 600386DEST_PATH_IMAGE025
的值介于0到1之间。
进一步的,所述步骤四具体包括如下步骤:
(4.1)计算邻接矩阵A的正规化矩阵
Figure 887011DEST_PATH_IMAGE026
,并对
Figure 292715DEST_PATH_IMAGE027
进行特征值分解,其 中
Figure 419809DEST_PATH_IMAGE028
Figure 629073DEST_PATH_IMAGE029
的所有行之和构成的对角矩阵;
(4.2)求解G的最大K个特征值对应的特征向量
Figure 204542DEST_PATH_IMAGE030
,并构成谱投影
Figure 182863DEST_PATH_IMAGE031
,记
Figure 169273DEST_PATH_IMAGE032
,即
Figure 649190DEST_PATH_IMAGE033
表示
Figure 12038DEST_PATH_IMAGE034
的第i个行向量;
(4.3)通过余弦度量
Figure 392335DEST_PATH_IMAGE035
计算
Figure 284067DEST_PATH_IMAGE033
Figure 717192DEST_PATH_IMAGE036
的距离;
(4.4)对于每个
Figure 149310DEST_PATH_IMAGE033
,把所有图像样本的谱投影与它的距离从小到大排序为
Figure 852955DEST_PATH_IMAGE037
,通过
Figure 181168DEST_PATH_IMAGE038
,即对每个
Figure 586742DEST_PATH_IMAGE039
, 记
Figure 809169DEST_PATH_IMAGE040
,并记
Figure 413325DEST_PATH_IMAGE041
Figure 663172DEST_PATH_IMAGE042
中的最大元素所对应下标中的第二个分 量,使用
Figure 821621DEST_PATH_IMAGE043
估算
Figure 64384DEST_PATH_IMAGE033
的类一致邻域的规模,并扩展
Figure 975577DEST_PATH_IMAGE033
的类一致邻域半径为
Figure 176751DEST_PATH_IMAGE044
扩展的类一致邻域为
Figure 307649DEST_PATH_IMAGE045
进一步的,所述步骤五具体包括如下步骤:
(5.1)估计图像样本谱投影
Figure 354103DEST_PATH_IMAGE033
的类一致邻域的信赖概率密度函数
Figure 136114DEST_PATH_IMAGE046
为:
Figure 760387DEST_PATH_IMAGE047
参数
Figure 893428DEST_PATH_IMAGE015
选取为:
Figure 494304DEST_PATH_IMAGE048
(5.2)计算
Figure 396401DEST_PATH_IMAGE033
Figure 923066DEST_PATH_IMAGE036
的类一致信任度为
Figure 12245DEST_PATH_IMAGE049
并 构造邻接矩阵B,使得B的第i行,第j列的元素为
Figure 666080DEST_PATH_IMAGE050
(5.3)当
Figure 907837DEST_PATH_IMAGE033
Figure 356136DEST_PATH_IMAGE036
所对应
Figure 438669DEST_PATH_IMAGE002
Figure 161774DEST_PATH_IMAGE019
的距离不大于
Figure 258037DEST_PATH_IMAGE051
时,强化邻接矩阵
Figure 877237DEST_PATH_IMAGE052
的第i 行,第j列的元素为
Figure 941008DEST_PATH_IMAGE053
,这里
Figure 451493DEST_PATH_IMAGE054
Figure 385951DEST_PATH_IMAGE055
进一步的,所述步骤六具体包括如下步骤:
(6.1)求解邻接矩阵B的最大K个特征值对应的特征向量
Figure 441631DEST_PATH_IMAGE056
,并构成
Figure 743431DEST_PATH_IMAGE057
(6.2)以
Figure 277180DEST_PATH_IMAGE058
作为初值,
Figure 115080DEST_PATH_IMAGE059
代表以
Figure 341662DEST_PATH_IMAGE060
作为对角元 的对角矩阵,其中
Figure 114446DEST_PATH_IMAGE061
代表
Figure 202619DEST_PATH_IMAGE062
的所有元素之和
Figure 642827DEST_PATH_IMAGE063
的符号, 通过非线性共轭梯度法求解
Figure 774731DEST_PATH_IMAGE064
得到解为K阶实矩阵Q,并通过Q的奇异值分解
Figure 549658DEST_PATH_IMAGE065
得到正交阵
Figure 425210DEST_PATH_IMAGE066
sgn代表符号函数,
Figure 736237DEST_PATH_IMAGE067
代表矩阵的F-范数,
Figure 39042DEST_PATH_IMAGE068
代表UQ的负部,
Figure 51998DEST_PATH_IMAGE069
代表矩阵N的转 置;
(6.3) 令
Figure 717859DEST_PATH_IMAGE070
,对于任意的
Figure 867080DEST_PATH_IMAGE071
把第i个图像样本的标签设置为
Figure 606366DEST_PATH_IMAGE072
,这里
Figure 326192DEST_PATH_IMAGE073
代表
Figure 543546DEST_PATH_IMAGE074
的第i行,第k列的元素。
本发明的优点:
相比于传统方法,本发明能够有效地针对图像数据学习出具有强同类连接和弱异类连接的邻接矩阵,实现具有明显优势的高精度图像识别;相比于近年兴起的深度学习方法,本发明提供了具有可解释性、计算快速简单、适用面广泛的双层简单网络结构,无需训练样本和优化计算即可实现数据重表示;本发明能够在多种类型的图像数据集上,实现简便,快速,精准的种类识别。
附图说明
图1是本发明方法流程图;
图2a是本发明所实施的图像案例之一:COIL-20物品图像数据集;
图2b是本发明所实施的图像案例之二:PIE人脸图像数据集;
图2c 是本发明所实施的图像案例之三:MNIST手写数字图像数据集;
图3是本发明实施例的邻接矩阵A与高斯邻接矩阵的连接纯度对比示意图;
图4a是本发明实施例的数据集COIL-20的XY中每一个样本的真实类一致邻域的规模示意图;
图4b是本发明实施例的数据集COIL-20的XY中每一个样本的估计类一致邻域的查准率示意图;
图4c是本发明实施例的数据集COIL-20的 XY中每一个样本的估计类一致邻域的查全率示意图;
图5a是本发明实施例的邻接矩阵A的类内连接模式示意图;
图5b是本发明实施例的邻接矩阵B的类内连接模式示意图。
具体实施方式
为了使本发明的目的、技术方案和技术效果更加清楚明白,以下结合说明书附图,以物品图像数据集COIL-20为例,对本发明作进一步详细说明。
如图1所示,一种类一致邻域的连续谱投影图像识别方法,包括如下步骤:
步骤一,设置图像数据集中每个样本的初始类一致邻域:对于图像数据集
Figure 655597DEST_PATH_IMAGE075
中的每个样本
Figure 50937DEST_PATH_IMAGE002
,设置其初始类一致邻域半径为
Figure 772905DEST_PATH_IMAGE076
,并 设置
Figure 793951DEST_PATH_IMAGE077
Figure 169962DEST_PATH_IMAGE002
的初始类一致邻域;
Figure 251051DEST_PATH_IMAGE078
是距离度量
Figure 194736DEST_PATH_IMAGE079
代 表数据集中
Figure 504626DEST_PATH_IMAGE002
的第
Figure 482946DEST_PATH_IMAGE080
个近邻点,
Figure 469356DEST_PATH_IMAGE081
设置为
Figure 415185DEST_PATH_IMAGE082
Figure 778033DEST_PATH_IMAGE083
代表不超过
Figure 627171DEST_PATH_IMAGE084
的最大整数,
Figure 50062DEST_PATH_IMAGE012
代 表图像数据集的样本数目,
Figure 499498DEST_PATH_IMAGE085
代表图像数据集的类别数目。对于物品图像数据集COIL-20, 距离度量
Figure 929953DEST_PATH_IMAGE078
采用欧氏距离。
步骤二,估计每个样本类一致邻域的信赖概率密度:对于图像样本
Figure 164757DEST_PATH_IMAGE002
,估计其类一 致邻域的信赖概率密度函数
Figure 758549DEST_PATH_IMAGE086
为:
Figure 164123DEST_PATH_IMAGE087
这里参数
Figure 383620DEST_PATH_IMAGE015
选取为:当
Figure 925460DEST_PATH_IMAGE088
时,
Figure 690154DEST_PATH_IMAGE089
, 否则
Figure 333756DEST_PATH_IMAGE090
步骤三,基于每个图像样本的类一致概率密度函数构造邻接矩阵
Figure 576518DEST_PATH_IMAGE029
:计算
Figure 238444DEST_PATH_IMAGE002
Figure 691815DEST_PATH_IMAGE019
的 类一致信任度为
Figure 71981DEST_PATH_IMAGE091
并构造邻接矩阵
Figure 869167DEST_PATH_IMAGE029
,使得
Figure 651178DEST_PATH_IMAGE029
的第
Figure 492095DEST_PATH_IMAGE092
行,第
Figure 608825DEST_PATH_IMAGE093
列的元素为
Figure 458969DEST_PATH_IMAGE094
=
Figure 95487DEST_PATH_IMAGE095
。这样学习出的邻接矩阵在保证同类连接强度的同时,能 够抑制异类样本的连接强度。通过“连接纯度”这一统计量可以说明本发明中的邻接矩阵
Figure 123617DEST_PATH_IMAGE029
相比传统高斯邻接矩阵的优势,所述图像样本
Figure 947216DEST_PATH_IMAGE002
的“连接纯度(purity)”的定义为
Figure 601051DEST_PATH_IMAGE023
其中
Figure 344273DEST_PATH_IMAGE096
代表
Figure 792572DEST_PATH_IMAGE002
的真实标签,
Figure 369047DEST_PATH_IMAGE097
的值介于0到1之间,且越接近1越好。如 图3所示,对于图像数据集COIL-20,本发明得到邻接矩阵
Figure 311726DEST_PATH_IMAGE029
和传统的高斯邻接矩阵的样本连 接纯度对比。可以得到,高斯邻接矩阵的部分样本具有较低的连接纯度,而本发明的邻接矩 阵对于几乎所有点都有更接近1的连接纯度。
步骤四,通过谱投影扩展类一致邻域:按照规范切图(Normalized cut)的方式计 算邻接矩阵
Figure 657257DEST_PATH_IMAGE029
的谱投影
Figure 276457DEST_PATH_IMAGE034
,并通过
Figure 589495DEST_PATH_IMAGE034
扩展每个样本的类一致邻域,具体分为下面4步:
(4.1)计算
Figure 319554DEST_PATH_IMAGE029
的正规化矩阵
Figure 647155DEST_PATH_IMAGE098
,并对
Figure 748840DEST_PATH_IMAGE027
进行特征值分解,其中
Figure 316219DEST_PATH_IMAGE028
Figure 849969DEST_PATH_IMAGE029
的所有行之和,构成的对角矩阵;
(4.2)求解
Figure 170092DEST_PATH_IMAGE027
的最大
Figure 371573DEST_PATH_IMAGE085
个特征值对应的特征向量
Figure 144357DEST_PATH_IMAGE099
,并构成
Figure 481797DEST_PATH_IMAGE100
, 记
Figure 407159DEST_PATH_IMAGE101
,即
Figure 539063DEST_PATH_IMAGE033
表示
Figure 799143DEST_PATH_IMAGE034
的第
Figure 923963DEST_PATH_IMAGE092
个行向量;
(4.3)通过余弦度量
Figure 218678DEST_PATH_IMAGE102
计算
Figure 521483DEST_PATH_IMAGE033
Figure 19592DEST_PATH_IMAGE036
的距离;
(4.4)对于每个
Figure 698835DEST_PATH_IMAGE033
,把所有图像样本的谱投影与它的距离从小到大排序为
Figure 582477DEST_PATH_IMAGE103
,通过
Figure 308381DEST_PATH_IMAGE104
,即对每个
Figure 543053DEST_PATH_IMAGE105
, 记
Figure 760408DEST_PATH_IMAGE106
,并记
Figure 514869DEST_PATH_IMAGE041
Figure 425056DEST_PATH_IMAGE107
中的最大元素所对应下标中的第二个分 量,使用
Figure 881445DEST_PATH_IMAGE108
估算
Figure 151758DEST_PATH_IMAGE033
的类一致邻域的规模,并扩展
Figure 9993DEST_PATH_IMAGE033
的类一致邻域半径为
Figure 91081DEST_PATH_IMAGE109
扩展的类一致邻域为
Figure 785499DEST_PATH_IMAGE110
相比于步骤一中的初始邻域,步骤四中的扩充邻域有下面三个方面的提升:
其中图4a、图4b和图4c是本发明实施例的数据集
Figure 344656DEST_PATH_IMAGE111
中样本的类一致邻域和
Figure 322977DEST_PATH_IMAGE112
中样本的信赖邻域对比;
(1)由于
Figure 827164DEST_PATH_IMAGE113
比原始图像
Figure 523724DEST_PATH_IMAGE114
具有更好的邻域一致性,因此每个
Figure 620993DEST_PATH_IMAGE033
拥 有更多的同类点作为邻域。如图4a所示,展示了图像数据集COIL-20的
Figure 204552DEST_PATH_IMAGE115
=
Figure 627443DEST_PATH_IMAGE114
Figure 545721DEST_PATH_IMAGE116
中每一个样本的真实类一致邻域的规模。可以发现,
Figure 961528DEST_PATH_IMAGE034
的真实类一致邻域规 模要大于
Figure 648861DEST_PATH_IMAGE115
的。
(2)对于一般的图像样本谱投影
Figure 242653DEST_PATH_IMAGE033
,其邻域中同类的“查准率”比对应的原始图像 样本
Figure 398959DEST_PATH_IMAGE002
更高,查准率(precision)的定义是
Figure 838031DEST_PATH_IMAGE117
查准率越高,说明邻域中同类的比例越高。如图4b所示,展示了图像数据集COIL- 20的
Figure 645450DEST_PATH_IMAGE115
Figure 662341DEST_PATH_IMAGE034
中每一个样本的估计类一致邻域的查准率,可以发现,图像的谱投影数据
Figure 289631DEST_PATH_IMAGE034
中的 样本的估计类一致邻域的同类比例要高于原始图像数据
Figure 797973DEST_PATH_IMAGE115
中的。
(3)对于一般的图像样本谱投影
Figure 210631DEST_PATH_IMAGE033
,其邻域中同类的“查全率”比对应的
Figure 146226DEST_PATH_IMAGE002
更高。查 全率(recall)的定义是:
Figure 260812DEST_PATH_IMAGE118
查全率越高,说明邻域捕捉到同类占所有同类的比例越高。如图4c所示,展示了图 像数据集COIL-20的
Figure 556533DEST_PATH_IMAGE115
Figure 338545DEST_PATH_IMAGE034
中每一个样本的估计类一致邻域的查全率,可以发现,图像的谱 投影数据
Figure 445041DEST_PATH_IMAGE034
中的样本类一致邻域捕获的同类的能力要强于原始数据
Figure 797656DEST_PATH_IMAGE115
中的。
步骤五,再次估计类一致邻域的概率密度并强化邻接矩阵
Figure 382221DEST_PATH_IMAGE119
,具体分为以下3步:
(5.1)估计图像样本的谱投影
Figure 18739DEST_PATH_IMAGE033
的类一致邻域的信赖概率密度函数
Figure 560052DEST_PATH_IMAGE120
为:
Figure 914810DEST_PATH_IMAGE121
这里参数
Figure 584957DEST_PATH_IMAGE015
选取为:
Figure 607140DEST_PATH_IMAGE048
(5.2)计算
Figure 789859DEST_PATH_IMAGE033
Figure 615602DEST_PATH_IMAGE036
的类一致信任度为 :
Figure 807549DEST_PATH_IMAGE049
并构 造邻接矩阵
Figure 153079DEST_PATH_IMAGE119
,使得
Figure 523012DEST_PATH_IMAGE119
的第
Figure 321204DEST_PATH_IMAGE092
行,第
Figure 316842DEST_PATH_IMAGE093
列的元素为
Figure 34655DEST_PATH_IMAGE050
(5.3)当
Figure 824757DEST_PATH_IMAGE033
Figure 110245DEST_PATH_IMAGE036
所对应
Figure 660306DEST_PATH_IMAGE002
Figure 980429DEST_PATH_IMAGE019
的距离不大于
Figure 675852DEST_PATH_IMAGE051
时,强化邻接矩阵
Figure 963483DEST_PATH_IMAGE052
的第
Figure 35344DEST_PATH_IMAGE092
行,第
Figure 209974DEST_PATH_IMAGE093
列的元素为
Figure 358189DEST_PATH_IMAGE053
,这里
Figure 352690DEST_PATH_IMAGE054
Figure 493821DEST_PATH_IMAGE055
相比于
Figure 775155DEST_PATH_IMAGE029
只保证了类间弱连接,
Figure 77960DEST_PATH_IMAGE119
同时保证了类间的弱连接和类内的强连接,如图 5a和图5b所示,分别显示了
Figure 825336DEST_PATH_IMAGE029
Figure 989732DEST_PATH_IMAGE119
的类内连接模式,灰色区域代表非零元,白色区域代表零 元,可以看出
Figure 138954DEST_PATH_IMAGE119
的类内连接远比
Figure 878240DEST_PATH_IMAGE029
的充分。
步骤六.按照商连接(Ratio association)的方式计算邻接矩阵
Figure 96600DEST_PATH_IMAGE119
的谱投影
Figure 579534DEST_PATH_IMAGE122
,并 对
Figure 583262DEST_PATH_IMAGE122
聚类:具体分为下面3步。
(6.1)求解邻接矩阵
Figure 978603DEST_PATH_IMAGE119
的最大
Figure 700571DEST_PATH_IMAGE085
个特征值对应的特征向量
Figure 456038DEST_PATH_IMAGE056
,并构成
Figure 832049DEST_PATH_IMAGE057
(6.2)以
Figure 647558DEST_PATH_IMAGE123
作为初值,
Figure 591243DEST_PATH_IMAGE124
代表以
Figure 166712DEST_PATH_IMAGE060
作为对角元 的对角矩阵,其中
Figure 145032DEST_PATH_IMAGE125
代表
Figure 131443DEST_PATH_IMAGE062
的所有元素之和
Figure 811692DEST_PATH_IMAGE063
的符号, 通过非线性共轭梯度法求解:
Figure 174540DEST_PATH_IMAGE064
得到解为
Figure 272946DEST_PATH_IMAGE085
阶实矩阵
Figure 180990DEST_PATH_IMAGE126
,并通过
Figure 99268DEST_PATH_IMAGE126
的奇异值分解
Figure 228DEST_PATH_IMAGE065
得到正交阵
Figure 193619DEST_PATH_IMAGE066
Figure 787411DEST_PATH_IMAGE127
代表符号函数,
Figure 927405DEST_PATH_IMAGE067
代表矩阵的F-范数,
Figure 382789DEST_PATH_IMAGE068
代表
Figure 190208DEST_PATH_IMAGE128
的负部,
Figure 689322DEST_PATH_IMAGE069
代表矩阵
Figure 831459DEST_PATH_IMAGE129
的转 置;
(6.3) 令
Figure 339801DEST_PATH_IMAGE070
,对于任意的
Figure 736147DEST_PATH_IMAGE071
把第
Figure 422475DEST_PATH_IMAGE092
个图像样本的标签设置为
Figure 802640DEST_PATH_IMAGE072
,这里
Figure 849094DEST_PATH_IMAGE073
代表
Figure 617723DEST_PATH_IMAGE074
的第
Figure 458640DEST_PATH_IMAGE092
行,第
Figure 326102DEST_PATH_IMAGE130
列的元素。至此,每个图像样本都拥有了 一个标签,图像识别任务完成。
以下举出多个实例,体现本发明中方法的优势。首先对8个公开的图像数据集进行聚类,所述图像数据集包括:两个静物图像集:COIL-20和COIL-100,三个人脸图像集:PIE,ORL,UMist, 三个手写数字图像集: USPS,MNIST, Pendigit。如图2a、图2b和图2c所示,分别为其中的三个典型图像数据集COIL-20、PIE、 MNIST的实例展示。比较本发明方法与近年常用的无监督图像识别方法:稀疏自适应谱聚类(S-STSC), 基于标记点的谱聚类(LSC),可扩展的弹性网络子空间聚类 (EnSC), 高效稠密子空间聚类(EDSC), 图度链接分层聚类(GDL)和图平均分层聚类(GAL)。评价的标准是聚类准确率,结果见表1,可得到本发明的识别准确率在所有的图像数据集上都表现最佳,且明显优于其他所有方法。
表1
Figure 661400DEST_PATH_IMAGE131
表2统计了这些方法在同一台计算机上所需的运行时间。可以得到本发明的方法在所有的方法中,属于低时耗的方法。
表2
Figure 297917DEST_PATH_IMAGE132
表1和表2说明了,相比以往的图像识别方法,本发明的方法同时具有高性能和高效率的特点。
除了图像例子,还可以通过一些其他领域的实际例子说明本发明方法具有的广泛适用性。本发明对6个公开的其他数据集进行识别,这些数据集包括:文本数据集RCV1-4,医疗诊断数据集Breast Tissue, 植物学数据集Seeds和Iris, 遥感数据集Satillite和图像分割数据集Segmentation。 表3统计了本发明的方法和对比方法在这些数据集上的识别准确率。由于这些数据集不具有子空间特性,因此子空间方法EnSC和EDSC不参与比较。可以得到对于不同领域的数据集,本发明总能提供最佳的识别结果。
表 3
Figure 575315DEST_PATH_IMAGE133
以上所述,仅为本发明的优选实施案例,并非对本发明做任何形式上的限制。虽然前文对本发明的实施过程进行了详细说明,对于熟悉本领域的人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行同等替换。凡在本发明精神和原则之内所做修改、同等替换等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种类一致邻域的连续谱投影图像识别方法,其特征在于,包括如下步骤:
步骤一,设置图像数据集中每个样本的初始类一致邻域;
步骤二,估计每个图像样本类一致邻域的信赖概率密度;
步骤三,基于每个图像样本的类一致邻域的信赖概率密度函数构造邻接矩阵A
步骤四,按照规范切图的方式计算邻接矩阵A的谱投影Y,并通过Y扩展每个样本的类一致邻域;
步骤五,再次估计类一致邻域的信赖概率密度并强化邻接矩阵B
步骤六,按照商连接的方式计算邻接矩阵B的谱投影U,并对U聚类,完成图像识别。
2.如权利要求1所述的一种类一致邻域的连续谱投影图像识别方法,其特征在于,所述 步骤一具体为:设置图像数据集中每个样本的初始类一致邻域:对于图像数据集
Figure 741465DEST_PATH_IMAGE001
中的每个图像样本
Figure 629787DEST_PATH_IMAGE002
,设置其初始类一致邻域半径为
Figure 43451DEST_PATH_IMAGE003
, 并设置
Figure 815841DEST_PATH_IMAGE004
Figure 164914DEST_PATH_IMAGE002
的初始类一致邻域;
Figure 399586DEST_PATH_IMAGE005
是距离度量,采用 欧式距离,
Figure 475996DEST_PATH_IMAGE006
代表数据集中
Figure 620669DEST_PATH_IMAGE002
的第
Figure 999698DEST_PATH_IMAGE007
个近邻点,
Figure 347765DEST_PATH_IMAGE008
设置为
Figure 103231DEST_PATH_IMAGE009
Figure 102411DEST_PATH_IMAGE010
代表不超过
Figure 308134DEST_PATH_IMAGE011
的最大整数,
Figure 392764DEST_PATH_IMAGE012
代表数据集的样本数目,K代表数据集的类别数目。
3.如权利要求2所述的一种类一致邻域的连续谱投影图像识别方法,其特征在于,所述 步骤二具体为:对于图像样本
Figure 951922DEST_PATH_IMAGE002
,估计其类一致邻域的信赖概率密度函数
Figure 553411DEST_PATH_IMAGE013
为:
Figure 680767DEST_PATH_IMAGE014
这里参数
Figure 501961DEST_PATH_IMAGE015
选取为:当
Figure 599230DEST_PATH_IMAGE016
时,
Figure 307423DEST_PATH_IMAGE017
, 否则
Figure 464735DEST_PATH_IMAGE018
4.如权利要求3所述的一种类一致邻域的连续谱投影图像识别方法,其特征在于,所述 步骤三具体为:计算图像样本
Figure 274690DEST_PATH_IMAGE002
与图像样本
Figure 785437DEST_PATH_IMAGE019
的类一致信任度为
Figure 738350DEST_PATH_IMAGE020
并构造邻接矩阵A,使得A的第i行,第j列的元素为
Figure 191197DEST_PATH_IMAGE021
=
Figure 472137DEST_PATH_IMAGE022
5.如权利要求4所述的一种类一致邻域的连续谱投影图像识别方法,其特征在于,所述 图像样本
Figure 442367DEST_PATH_IMAGE002
的连接纯度(purity)的定义为:
Figure 607375DEST_PATH_IMAGE023
其中
Figure 106490DEST_PATH_IMAGE024
代表
Figure 874726DEST_PATH_IMAGE002
的真实标签,
Figure 976543DEST_PATH_IMAGE025
的值介于0到1之间。
6.如权利要求4所述的一种类一致邻域的连续谱投影图像识别方法,其特征在于,所述步骤四具体包括如下步骤:
(4.1)计算邻接矩阵A的正规化矩阵
Figure 904047DEST_PATH_IMAGE026
,并对
Figure 715009DEST_PATH_IMAGE027
进行特征值分解,其中
Figure 455694DEST_PATH_IMAGE028
Figure 502147DEST_PATH_IMAGE029
的所有行之和构成的对角矩阵;
(4.2)求解G的最大K个特征值对应的特征向量
Figure 159525DEST_PATH_IMAGE030
,并构成谱投影
Figure 125075DEST_PATH_IMAGE031
, 记
Figure 992537DEST_PATH_IMAGE032
,即
Figure 452469DEST_PATH_IMAGE033
表示
Figure 735593DEST_PATH_IMAGE034
的第i个行向量;
(4.3)通过余弦度量
Figure 12990DEST_PATH_IMAGE035
计算
Figure 711956DEST_PATH_IMAGE033
Figure 490425DEST_PATH_IMAGE036
的距离;
(4.4)对于每个
Figure 715870DEST_PATH_IMAGE033
,把所有图像样本的谱投影与它的距离从小到大排序为
Figure 773956DEST_PATH_IMAGE037
,通过
Figure 616010DEST_PATH_IMAGE038
,即对每个
Figure 168476DEST_PATH_IMAGE039
, 记
Figure 248428DEST_PATH_IMAGE040
,并记
Figure 8573DEST_PATH_IMAGE041
Figure 931399DEST_PATH_IMAGE042
中的最大元素所对应下 标中的第二个分量,使用
Figure 395878DEST_PATH_IMAGE043
估算
Figure 736861DEST_PATH_IMAGE033
的类一致邻域的规模,并扩展
Figure 526962DEST_PATH_IMAGE033
的类一致 邻域半径为
Figure 435619DEST_PATH_IMAGE044
扩展的类一致邻域为
Figure 844735DEST_PATH_IMAGE045
7.如权利要求6所述的一种类一致邻域的连续谱投影图像识别方法,其特征在于,所述步骤五具体包括如下步骤:
(5.1)估计图像样本谱投影
Figure 899279DEST_PATH_IMAGE033
的类一致邻域的信赖概率密度函数
Figure 719336DEST_PATH_IMAGE046
为:
Figure 757699DEST_PATH_IMAGE047
参数
Figure 704926DEST_PATH_IMAGE015
选取为:
Figure 613977DEST_PATH_IMAGE048
(5.2)计算
Figure 637559DEST_PATH_IMAGE033
Figure 507426DEST_PATH_IMAGE036
的类一致信任度为
Figure 648557DEST_PATH_IMAGE049
并构造 邻接矩阵B,使得B的第i行,第j列的元素为
Figure 802327DEST_PATH_IMAGE050
(5.3)当
Figure 980498DEST_PATH_IMAGE033
Figure 727874DEST_PATH_IMAGE036
所对应
Figure 30286DEST_PATH_IMAGE002
Figure 913929DEST_PATH_IMAGE019
的距离不大于
Figure 997422DEST_PATH_IMAGE051
时,强化邻接矩阵
Figure 356728DEST_PATH_IMAGE052
的第i行,第j列的元素为
Figure 574083DEST_PATH_IMAGE053
,这里
Figure 453177DEST_PATH_IMAGE054
Figure 97785DEST_PATH_IMAGE055
8.如权利要求7所述的一种类一致邻域的连续谱投影图像识别方法,其特征在于,所述步骤六具体包括如下步骤:
(6.1)求解邻接矩阵B的最大K个特征值对应的特征向量
Figure 180273DEST_PATH_IMAGE056
,并构成
Figure 935740DEST_PATH_IMAGE057
(6.2)以
Figure 934920DEST_PATH_IMAGE058
作为初值,
Figure 875063DEST_PATH_IMAGE059
代表以
Figure 553169DEST_PATH_IMAGE060
作为对角元的对 角矩阵,其中
Figure 253271DEST_PATH_IMAGE061
代表
Figure 966012DEST_PATH_IMAGE062
的所有元素之和
Figure 575592DEST_PATH_IMAGE063
的符号,通过 非线性共轭梯度法求解
Figure 147519DEST_PATH_IMAGE064
得到解为K阶实矩阵Q,并通过Q的奇异值分解
Figure 244788DEST_PATH_IMAGE065
得到正交阵
Figure 936669DEST_PATH_IMAGE066
sgn代 表符号函数,
Figure 359560DEST_PATH_IMAGE067
代表矩阵的F-范数,
Figure 887625DEST_PATH_IMAGE068
代表UQ的负部,
Figure 788584DEST_PATH_IMAGE069
代表矩阵N的转置;
(6.3) 令
Figure 367596DEST_PATH_IMAGE070
,对于任意的
Figure 571175DEST_PATH_IMAGE071
把第i个图像样本的标签设置为
Figure 711169DEST_PATH_IMAGE072
,这里
Figure 540454DEST_PATH_IMAGE073
代表
Figure 82294DEST_PATH_IMAGE074
的第i行,第k列的元素。
CN202110934806.8A 2021-08-16 2021-08-16 一种类一致邻域的连续谱投影图像识别方法 Active CN113378807B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110934806.8A CN113378807B (zh) 2021-08-16 2021-08-16 一种类一致邻域的连续谱投影图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110934806.8A CN113378807B (zh) 2021-08-16 2021-08-16 一种类一致邻域的连续谱投影图像识别方法

Publications (2)

Publication Number Publication Date
CN113378807A true CN113378807A (zh) 2021-09-10
CN113378807B CN113378807B (zh) 2021-11-02

Family

ID=77577223

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110934806.8A Active CN113378807B (zh) 2021-08-16 2021-08-16 一种类一致邻域的连续谱投影图像识别方法

Country Status (1)

Country Link
CN (1) CN113378807B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480623A (zh) * 2017-08-07 2017-12-15 西安电子科技大学 基于协作表示的近邻保持人脸识别方法
CN107832715A (zh) * 2017-11-15 2018-03-23 天津大学 一种自适应近邻的人脸识别算法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480623A (zh) * 2017-08-07 2017-12-15 西安电子科技大学 基于协作表示的近邻保持人脸识别方法
CN107832715A (zh) * 2017-11-15 2018-03-23 天津大学 一种自适应近邻的人脸识别算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FREDERICK TUNG等: "Enabling scalable spectral clustering for image segmentation", 《PATTERN RECOGNITION》 *

Also Published As

Publication number Publication date
CN113378807B (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN102609681B (zh) 基于字典学习模型的人脸识别方法
Law et al. Incremental nonlinear dimensionality reduction by manifold learning
Singh et al. Svm-bdt pnn and fourier moment technique for classification of leaf shape
Liu et al. Shape retrieval using hierarchical total Bregman soft clustering
Tao et al. Supervised tensor learning
Si et al. Learning hybrid image templates (hit) by information projection
CN107368807B (zh) 一种基于视觉词袋模型的监控视频车型分类方法
CN110097060B (zh) 一种面向树干图像的开集识别方法
CN107169117B (zh) 一种基于自动编码器和dtw的手绘图人体运动检索方法
CN110516533B (zh) 一种基于深度度量的行人再辨识方法
Shrivastava et al. Unsupervised domain adaptation using parallel transport on Grassmann manifold
CN108509925B (zh) 一种基于视觉词袋模型的行人重识别方法
CN107358172B (zh) 一种基于人脸朝向分类的人脸特征点初始化方法
Johnsson et al. Low bias local intrinsic dimension estimation from expected simplex skewness
Xu et al. Iterative manifold embedding layer learned by incomplete data for large-scale image retrieval
CN106503743B (zh) 一种数量多且维数高的图像局部特征点自适应聚类方法
Jouili et al. Median graph shift: A new clustering algorithm for graph domain
CN101986295A (zh) 基于流形稀疏编码的图像聚类的方法
CN110188864B (zh) 基于分布表示和分布度量的小样本学习方法
Lu et al. Modulation recognition for incomplete signals through dictionary learning
CN110929801B (zh) 一种基于改进的Euclid距离KNN分类方法和系统
CN111027609B (zh) 一种图像数据加权分类方法和系统
Du et al. Recognition of leaf image set based on manifold–manifold distance
CN105844299B (zh) 一种基于词袋模型的图像分类方法
Sun et al. Multiple-kernel, multiple-instance similarity features for efficient visual object detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant