CN111027582A - 基于低秩图学习的半监督特征子空间学习方法及装置 - Google Patents
基于低秩图学习的半监督特征子空间学习方法及装置 Download PDFInfo
- Publication number
- CN111027582A CN111027582A CN201910891913.XA CN201910891913A CN111027582A CN 111027582 A CN111027582 A CN 111027582A CN 201910891913 A CN201910891913 A CN 201910891913A CN 111027582 A CN111027582 A CN 111027582A
- Authority
- CN
- China
- Prior art keywords
- objective function
- samples
- function
- matrix
- variables
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000006870 function Effects 0.000 claims abstract description 158
- 238000012549 training Methods 0.000 claims abstract description 54
- 238000012360 testing method Methods 0.000 claims abstract description 25
- 239000011159 matrix material Substances 0.000 claims description 69
- 230000003190 augmentative effect Effects 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000004088 simulation Methods 0.000 claims description 4
- 230000008602 contraction Effects 0.000 claims description 3
- 230000007812 deficiency Effects 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 12
- 230000008901 benefit Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000001815 facial effect Effects 0.000 description 4
- 238000012417 linear regression Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000011524 similarity measure Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000009795 derivation Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明的实施方式提供了一种基于低秩图学习的半监督特征子空间学习方法及装置。该方法包括:将图像数据集分成测试集和训练集,训练集中包括有标签及无标签的样本;定义关于特征子空间学习模型的目标函数;用标签传播的方式,构建有关标签的不同约束项,进而预测出无标签样本的标签信息,重新拟定目标函数;将重新拟定的目标函数中的特征子空间施加正交约束;利用训练集,求解出目标函数值最小化时各个变量的值,以通过目标函数求解后得到一个特征子空间;以及通过所述特征子空间投影测试集,得到所述数据集里所有类别图像的所有特征,通过预定分类器获得所述数据集的识别率。本发明的上述技术克服了现有技术的不足。
Description
技术领域
本发明的实施方式涉及图像分类领域,更具体地,本发明的实施方式 涉及一种基于低秩图学习的半监督特征子空间学习方法及装置。
背景技术
特征子空间学习在模式识别中起着重要作用,并且已经做出许多努力 来产生更具判别性的学习模型。近年来,提出了许多基于表示模型的判别 特征学习方法,不仅引起了人们的广泛关注,而且在实际工作中也取得了 成功的应用。然而,这些方法大多数是在有监督条件下完成,忽略了现实 生活中包含大量无标签样本的情况。
发明内容
在本上下文中,本发明的实施方式期望提供一种基于低秩图学习的半 监督特征子空间学习方法及装置,以使用低秩约束来构造用于特征学习和 标签预测的约束项,将非负低秩表示系数作为衡量子空间结构相似性和样 本标签相似性的约束引入到用于分类的学习模型中,用于学习预测训练样 本完整的标签信息和特征投影空间,促进模型自适应性和鲁棒性;此外, 通过将特征子空间学习、低秩表示和标签传播学习放入统一的框架中,可以在迭代期间彼此促进以获得整体最优;还包含基于学习到的类别标签信 息的线性回归项以增强投影的特征,并且使相同类别的样本靠近同一聚类 中心,不同类别的聚类中心相互远离,采用迭代数值方案来解决目标函数 并保证收敛。
在本发明实施方式的第一方面中,提供了一种基于低秩图学习的半监 督特征子空间学习方法,包括:将图像数据集分成测试集和训练集,训练 集中的样本包括有标签的样本以及无标签的样本;定义关于特征子空间学习 模型的目标函数,其中,目标函数中的第一项为矩阵的低秩约束,第二项为 正则化约束项,将低秩表示系数作为正则化参数来约束两个样本投影后的距 离,矩阵中的元素被视为对两个样本的低维结构相似性的测量,对矩阵中的 每个元素引入非负约束;用标签传播的方式,构建有关标签的不同约束项, 进而预测出无标签样本的的标签信息,重新拟定目标函数;将重新拟定的目 标函数中的特征子空间施加正交约束;利用训练集,求解出目标函数值最 小化时各个变量的值,以通过目标函数求解后得到一个特征子空间;以及通 过所述特征子空间投影测试集,得到所述数据集里所有类别图像的所有特征, 通过预定分类器获得所述数据集的识别率。
进一步地,在所述定义关于特征子空间学习模型的目标函数的步骤中 所定义的目标函数如下:
其中,X=[X1,X2,...,Xm]表示训练集,Xi(i=1,2,...,m)表示X的每一列, m表示训练样本的总数,Z表示系数矩阵,P表示特征子空间,E表示误 差矩阵,λ和η是平衡三项的参数。
进一步地,重新拟定的目标函数如下:
其中,U=[U1,U2,...,Um]是由类别标签决定的矩阵, Ui=[-1,...,-1,1,-1,...,-1,0,...,0]T∈RC表示U的第i列。
进一步地,根据下式将目标函数中的特征子空间施加正交约束:
进一步地,将目标函数引入三个辅助变量J,H和R求解最小化问题, 所述目标函数表示为:
进一步地,所述利用训练集求解出目标函数值最小化时各个变量的值的 步骤包括:通过增广拉格朗日乘子法,确定目标函数问题中的拉格朗日函 数;将拉格朗日函数进行化简和最小化转换;利用交替方向乘子算法,在 其他变量不变的条件下针对每个变量迭代地求解最小化;固定其他变量, 删除与F无关的函数项,将目标函数式重写为基于图的化简公式;利用目 标函数的导数,进行求解;固定其他变量,删除与P无关的函数项,得到 变量P的目标函数式,将特征投影空间的目标函数式重写为基于图的化简 公式,利用目标函数的导数进行求解;固定其他变量,删除与J无关的函 数项,得到变量J的目标函数式,通过奇异值收缩算子求解;固定其他变 量,删除与R无关的函数项,得到变量R的目标函数式,并重写;固定其 他变量,删除与Z无关的函数项,得到变量Z的目标函数式,并重写;固 定其他变量,删除与H无关的函数项,得到变量H的目标函数式,进行 强制目标函数式导数为零的求解,得到封闭形式;固定其他变量,删除与 E无关的函数项,得到变量E的目标函数式,将矩阵E进行更新;逐项更 新拉格朗日乘子和参数。
进一步地,在训练集中:有标签的样本的数量与无标签的样本的数量 相同;或有标签的样本的数量与无标签的样本的数量不同。
根据本发明的另一个方面,还提供了一种基于低秩图学习的半监督特 征子空间学习装置,包括:存储单元,用于存储图像数据集,其中存储单 元中的图像数据集分为测试集和训练集,训练集中的样本包括有标签的样 本以及无标签的样本;定义单元,用于定义关于特征子空间学习模型的目 标函数,其中,目标函数中的第一项为矩阵的低秩约束,第二项为正则化 约束项,将低秩表示系数作为正则化参数来约束两个样本投影后的距离,矩阵中的元素被视为对两个样本的低维结构相似性的测量,对矩阵中的每 个元素引入非负约束;目标函数重拟单元,用于采用标签传播的方式,构 建有关标签的不同约束项,进而预测出无标签样本的的标签信息,重新拟 定目标函数;正交约束单元,用于将目标函数重拟单元重新拟定的目标函 数中的特征子空间施加正交约束;求解单元,用于利用训练集,求解出目 标函数值最小化时各个变量的值;通过目标函数求解后得到所有变量的 值,求解后得到特征子空间;以及获得单元用于通过所述特征子空间投影 测试集,得到数据集里所有类别图像的所有特征,最终通过分类器得到所 述数据集的识别率。
根据本发明实施方式的基于低秩图学习的半监督特征子空间学习方 法及装置,用于图像分类,使用低秩约束来构造用于特征学习和标签预测 的约束性项,将非负低秩表示系数作为衡量子空间结构相似性和样本标签 信息相似性的约束引入到用于分类的学习模型中,用于学习预测训练样本 完整的标签信息和特征投影空间,促进模型自适应性和鲁棒性;此外,通 过将特征子空间学习、低秩表示和标签传播学习放入统一的框架中,可以在迭代期间彼此促进以获得整体最优;还包含基于学习到的类别标签信息 的线性回归项以增强投影的特征,并且使相同类别的样本靠近同一聚类中 心,不同类别的聚类中心相互远离,采用迭代数值方案来解决目标函数并 保证收敛;本发明与其他方法相比,识别率更高,性能更加稳健。
具体优势如下:
1.本发明的实施例采用了一个新的半监督特征子空间学习模型,将标 签传播学习、低秩表示和特征学习结合到一个统一的框架中;新模型中, 低秩表示系数被分别用作子空间和类别标签信息的相似性度量来指导特 征学习和标签学习;此外,基于学习到的标签的线性回归被结合到所提出 的模型中作为另一种监督信息以扩大类内边界,这可以使提取的特征更适 用于分类任务。
2.本发明的实施例提出的目标函数对低秩表示系数引入了非负约束, 使系数用作判别正则化的惩罚参数。
3.本发明的实施例利用增广拉格朗日乘数(ALM)方法和乘法器的替 代方向法(ADMM)提供了一种迭代方案,通过该方案有效地解决了目标 函数,并保证了收敛性。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以 及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制 性的方式示出了本发明的若干实施方式,其中:
图1是示意性地示出了根据本发明实施方式的基于低秩图学习的半监 督特征子空间学习方法的一个示例性处理的流程图;
图2是示意性地示出了根据本发明实施方式的基于低秩图学习的半监 督特征子空间学习装置的一个示例的结构框图;
图3是示出图2中的求解单元的一种可能结构的示意图;
图4A-4D是四个公开数据集中部分样本的示例对比图;
图5是示出四个公开数据集中部分样本的示例对比图;
图6是示出在COIL20测试集上不同脉冲噪声干扰水平下的分类结果图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理 解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而 实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施 方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传 达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、 设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式, 即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者 硬件和软件结合的形式。
示例性方法
图1示意性地示出了根据本公开实施例的基于低秩图学习的半监督特 征子空间学习方法的一种示例性的处理流程100。
如图1所示,处理流程100开始后,首先执行步骤S110。
在步骤S110中,将图像数据集分成测试集和训练集,训练集中的样本 包括有标签的样本以及无标签的样本。
其中,上述图像数据集可以预先获得,也可以从外部接收。
在一个示例中,在训练集中,有标签的样本与无标签的样本的数量可以 相同。
在另一个示例中,在训练集中,有标签的样本与无标签的样本的数量也 可以不同。
接着,在步骤S120中,定义关于特征子空间学习模型的目标函数,其 中,目标函数中的第一项为矩阵(即自表示系数矩阵)的低秩约束,第二项 为正则化约束项,将低秩表示系数作为正则化参数来约束两个样本投影后的 距离,矩阵中的元素被视为对两个样本的低维结构相似性的测量,对矩阵中 的每个元素引入非负约束。
作为示例,步骤S120中定义的目标函数可以采用如下表达形式:
其中,X=[X1,X2,...,Xm]表示训练集,Xi(i=1,2,...,m)表示X的第i列,m 表示训练样本的总数,Z表示自表示系数矩阵,P表示特征子空间,E表示误 差矩阵,λ是平衡三项的一个参数,Xj(j=1,2,...,m,且j不等于i)表示X的 第j列,Zij表示矩阵Z中的每个元素(即第i行、第j列元素),PT表示矩 阵P的转置。
目标函数中第一项对矩阵进行低秩约束,第二项为局部结构保持约束项, 将低秩表示系数作为正则化参数来约束两个样本投影后的距离,矩阵中的元 素被视为对两个样本的低维结构相似性的测量同时,为了使该系数能够用做 正则化约束参数,对矩阵Z中的每个元素还引入非负约束;通过判别的正则 化约束,样本的结构相似性信息不仅可以保留在特征子空间中,还可以用于 指导特征子空间学习。对于第二项,P和Z将联合学习,这将在迭代期间促 进性能更加稳健。此外,目标函数中的第三项表示对对误差矩阵E的2,1范 数约束。
然后,在步骤S130中,采用标签传播的方式,构建有关标签的不同约 束项,进而预测出无标签样本的的标签信息,重新拟定目标函数。
作为示例,步骤S130中重新拟定的目标函数例如可以采用如下表达形 式:
其中,U=[U1,U2,...,Um]是由类别标签决定的矩阵,Ui=[-1,...,-1,1,-1,...,-1]T∈RC表示U的第i列,如果第i个示例属于第c类,则Ui中第c个元素为1,其余 为-1。B表示学习到的所有训练样本的标签信息,其中Bi、Bj表示第i个、第 j个训练样本的标签信息。其中,c为大于0、且小于样本总类别数的整数。
公式(2)前三项可以看作是基于图的标签传播学习的判别性约束项。如 步骤S120中可以得知,低秩表示系数可以衡量样本之间的相似性,样本的 标签信息同时也反应样本之间的相似性,因此将低秩表示系数作为标签学习 过程中的测量标准。进而利用学习到的标签信息作为聚类中心,扩大不同类 别样本的距离,这有助于本发明方法在分类问题上实现更好的判别和适应性。
接着,在步骤S140中,将步骤S130中重新拟定的目标函数中的特征 子空间施加正交约束,如下:
其中,I是单位阵,P表示特征子空间,实施正交约束后可以有效减少学 习到的特征子空间中冗余的信息;
作为示例,将步骤S140所得到的施加正交约束的目标函数引入三个辅 助变量R,H和J,求解引入上述三个辅助变量后的目标函数的最小化问题, 如下:
其中,Rij表示矩阵R的第i行且第j列上的元素,Hij表示矩阵H的第i 行且第j列上的元素。
然后,在步骤S150中,利用训练集,求解出目标函数值最小化时各个 变量的值。
作为示例,步骤S150例如可以包括如下将要描述的子流程,该子流程包 括步骤S1501~S1512。
在步骤S1501中,通过增广拉格朗日乘子法ALM(Augmented Lagrange Method),确定目标函数问题中的拉格朗日函数,如下:
接着,在步骤S1502中,将拉格朗日函数进行化简和最小化转换,如 下:
然后,在步骤S1503中,利用交替方向乘子算法ADMM(Alternating DirectionMethod of Multipliers),针对每个变量迭代地求解最小化,固定其 他变量(此处“其他变量”是指B以外的所有变量),删除与B无关的函数 项,得到如下公式:
将目标函数式重写为基于图的化简公式,如下:
然后,在步骤S1504中,令目标函数导数为0,得到如下结果:
B=(U+PTX)(2I+L)-1 (10)
在步骤S1505中,同样利用交替方向乘子算法ADMM,针对每个变量 迭代地求解最小化,固定其他变量(此处“其他变量”是指P以外的所有变 量),删除与P无关的函数项,如下:
将投影子空间的目标函数式重写为基于图的化简公式,如下:
在步骤S1506中,由于含有正交约束,最小化问题不能被视为简单的二 次问题。先求出目标函数导数,再进行求解,如下:
其中,表示为删除与P无关函数项后,只含P的目标函数式。表 示对目标函数式中的P进行求导。XT表示矩阵X的转置,BT表示矩阵B的 转置;设P(k)表示第k次迭代后投影子空间矩阵P的表达式,令 则P(k+1)可用下式计算:
式中τ(k+1)为迭代步进量,满足τ(k+1)=τ(k)+0.05,M(k)表示第k次迭代后矩 阵M的表达式;
在步骤S1507中,固定其他变量(此处“其他变量”是指J以外的所有 变量),删除与J无关的函数项,得到变量J的目标函数式,如下:
在步骤S1508中,固定其他变量(此处“其他变量”是指R以外的所有 变量),删除与R无关的函数项,得到变量R的目标函数式,如下:
s.t.Rij≥0 (16)
Sk+1表示第k+1次迭代后的矩阵S;
上式中问题可以看作是非负加权范数最小化问题,其解决方案如下:
接着,在步骤S1509中,固定其他变量(此处“其他变量”是指H以外 的所有变量),删除与H无关的函数项,得到变量H的目标函数式,并重写, 如下:
s.t.Hij≥0
s.t.Hij≥0
Gk+1表示第k+1次迭代后的矩阵G;
上式中问题可以看作是非负加权范数最小化问题,其解决方案如下:
然后,在步骤S1510中,固定其他变量(此处“其他变量”是指Z以外 的所有变量),删除与Z无关的函数项,得到变量Z的目标函数式,如下:
其中,Ek,Y1 k,Y2 k,Y3 k,Y4 k,Hk表示第k次迭代后的矩阵E,Y1,Y2, Y3,Y4,H式;Jk+1表示第k+1次迭代后的矩阵J;
进行强制目标函数式导数为零的求解,得到封闭形式,如下:
其中,Zk+1表示第k+1次迭代后的矩阵Z;XT表示矩阵X的转置;
在步骤S1511中,固定其他变量(此处“其他变量”是指E以外的所 有变量),删除与E无关的函数项,得到变量E的目标函数式,将矩阵E进 行更新,如下:
在步骤S1512中,逐项更新拉格朗日乘子和参数,公式如下:
Y1 k+1=Y1 k+μ(X-XZk+1-Ek+1)
μ=min(μmax,ρμ)(28)
Y1、Y2、Y3、Y4为拉格朗日乘子,ρ和μ为ALM引入的参数,μmax表示为参数μ允许范围内的最大值。
这样,通过执行完步骤S150,目标函数求解后得到所有变量的值, 其中P为求解后得到的特征子空间。
然后,在步骤S160中,通过所述特征子空间投影测试集,得到数据 集里所有类别图像的所有特征,最终通过预定分类器(如下文提到的KNN或 SRC分类器)得到所述数据集的识别率。
通过本实施方式学习到特征子空间,之后将每个训练样本投影到特征 子空间上得到该训练样本的特征来提取该训练样本所属类别的特征,随后根 据投影特征进行图片识别和分类。
示例性装置
参见图2,示意性地示出了根据本发明一实施例的基于低秩图学习的 半监督特征子空间学习装置的结构示意图,该装置可以设置于终端设备 中,例如,该装置可以设置于台式计算机、笔记型计算机、智能移动电话 以及平板电脑等智能电子设备中;当然,本发明实施方式的装置也可以设 置于服务器中。本发明实施方式的装置300可以包括下述组成单元:存储 单元310、定义单元320、目标函数重拟单元330、正交约束单元340、求解 单元350以及获得单元360。
存储单元310,用于存储图像数据集,其中存储单元310中的图像数 据集分为测试集和训练集,训练集中的样本包括有标签的样本以及无标签的 样本。
在一个示例中,在训练集中,有标签的样本与无标签的样本的数量可以 相同。
在另一个示例中,在训练集中,有标签的样本与无标签的样本的数量也 可以不同。
定义单元320,用于定义关于特征子空间学习模型的目标函数,其中, 目标函数中的第一项为矩阵的低秩约束,第二项为正则化约束项,将低秩表 示系数作为正则化参数来约束两个样本投影后的距离,矩阵中的元素被视为 对两个样本的低维结构相似性的测量,对矩阵中的每个元素引入非负约束。
作为示例,定义单元320定义的目标函数可以采用上文所述的公式(1) 的表达形式,这里不再赘述。
目标函数重拟单元330,用于采用标签传播的方式,构建有关标签的不 同约束项,进而预测出无标签样本的的标签信息,重新拟定目标函数。
作为示例,目标函数重拟单元330重新拟定的目标函数可以采用上文所 述的公式(2)的表达形式,这里不再赘述。
正交约束单元340,用于将目标函数重拟单元330重新拟定的目标函数 中的特征子空间施加正交约束,如上文所述的公式(3)以及(4)所示。
其中,I是单位阵,P表示特征子空间,实施正交约束后可以有效减少学 习到的特征子空间中冗余的信息;
求解单元350,用于利用训练集,求解出目标函数值最小化时各个变量 的值。
这样,通过求解单元350的处理,目标函数求解后得到所有变量的值, 其中P为求解后得到的特征子空间。
获得单元360用于通过所述特征子空间投影测试集,得到数据集里所 有类别图像的所有特征,最终通过分类器得到所述数据集的识别率。
作为示例,求解单元350例如可以包括如图3所示的结构。
如图3所示,求解单元350可以包括拉格朗日函数确定模块350-1、化简 和最小化转换模块350-2、第一计算模块350-3、求导模块350-4、第二计 算模块350-5、第三计算模块350-6、第四计算模块350-7、第五计算模块 350-8、第六计算模块350-9、第七计算模块350-10、第八计算模块350-11 和更新模块350-12。
拉格朗日函数确定模块350-1可用于执行上文中所描述的步骤S1501中 的处理,并能够达到相类似的功能和效果,这里不再赘述。
化简和最小化转换模块350-2可以用于执行上文中所描述的步骤S1502 中的处理,并能够达到相类似的功能和效果,这里不再赘述。
第一计算模块350-3可以用于执行上文中所描述的步骤S1503中的处 理,并能够达到相类似的功能和效果,这里不再赘述。
求导模块350-4可以用于执行上文中所描述的步骤S1504中的处理,并 能够达到相类似的功能和效果,这里不再赘述。
第二计算模块350-5可以用于执行上文中所描述的步骤S1505中的处 理,并能够达到相类似的功能和效果,这里不再赘述。
第三计算模块350-6可以用于执行上文中所描述的步骤S1506中的处 理,并能够达到相类似的功能和效果,这里不再赘述。
第四计算模块350-7可以用于执行上文中所描述的步骤S1507中的处 理,并能够达到相类似的功能和效果,这里不再赘述。
第五计算模块350-8可以用于执行上文中所描述的步骤S1508中的处 理,并能够达到相类似的功能和效果,这里不再赘述。
第六计算模块350-9可以用于执行上文中所描述的步骤S1509中的处 理,并能够达到相类似的功能和效果,这里不再赘述。
第七计算模块350-10可以用于执行上文中所描述的步骤S1510中的处 理,并能够达到相类似的功能和效果,这里不再赘述。
第八计算模块350-11可以用于执行上文中所描述的步骤S1511中的 处理,并能够达到相类似的功能和效果,这里不再赘述。
更新模块350-12可以用于执行上文中所描述的步骤S1512中的处理, 并能够达到相类似的功能和效果,这里不再赘述。
优选实施例
在该优选实施例中,采用四个已公开的数据集,数据集包括两个人脸 数据集(即下文所提到的第一面部数据集和第二面部数据集),一个物体数 据集(即下文所提到的对象数据集)和一个手写数字数据集。
其中,第一面部数据集例如采用ExtendedYaleB,包括3814个2414正 面图像,每个人具有约64个具有不同光照条件的图像。部分实例图像如图 4A所示。第一面部数据集使用测试图像的大小被裁剪为32×32。随机选择每 个人的32个图像作为训练集,其中一半为有标签样本、一半为无标签样本, 而其余的图像用作测试集。
此外,第二面部数据集为AR数据集(该数据集为公知的面部数据集), 该数据集包括120个人的3120个灰度图像。对于第二面部数据集中的每个人, 均包括正面视图的26个图像,其中各个图像可采用不同的表达方式,例如 光照条件和遮挡。部分实例图像如图4B所示。所述面部数据集中的面部图像 均被裁剪,调整为55×40,每个人的一半用作训练,训练样本中一半为有标 签样本、一半为无标签样本,其余的用作测试。
另外,对象数据集例如采用COIL20,包括20个对象的1440个图像, 每个对象具有从连续角度以5度的间隔获得的72个图像,部分图像如图4C 所示。本实施例中,对象数据集中的所有图像均被调整为32×32,并进行了 规范化。每个对象的10个图像用于训练,其中一半为有标签样本、一半为无 标签样本,其余用于测试。
手写数字数据集采用Hand written dataset USPS,包括9298个手写数字图 像,其中10个类从0到9,部分实例图像如图4D所示。所述手写数字数据 集中所有图像大小均为16×16,对于每个数字,随机选择10个图像对训练 集进行分组,训练样本中一半为有标签样本、一半为无标签样本,其余图像 用于测试。
将本实施例(Ours)与几种现有的特征子空间学习方法进行了比较,分 别包括PCA,LDA,NPE,LSDA。在不失一般性的情况下,使用两种分类 器SRC和KNN来分别测试比较方法。SRC用于AR和Extended YaleB数据 集,KNN用于USPS和COIL20。对于SRC,训练实例用作字典中的原子, 识别或分类结果由最小的特定于类的回归误差决定。对于KNN,分类结果由特征子空间中的前K个近邻决定,并且在实施方式中K被设置为1。每个数 据集均实施五次,求得的平均识别结果作为各对比方法的识别率,如表一所 示。
表一
Methods | ExtendedYaleB+SRC | AR+SRC | COIL20+KNN | USPS+KNN |
PCA | 80.29% | 81.24% | 89.51% | 76.47% |
LDA | 82.58% | 93.93% | 89.38% | 72.49% |
NPE | 76.85% | 81.47% | 85.51% | 62.10% |
LSDA | 87.53% | 81.54% | 84.23% | 56.18% |
Ours | 95.74% | 96.33% | 91.58% | 78.70% |
通过上表中数据对比,本优选实施例在所有测试数据集上均显示出比其 他对比方法更高的识别率。而且,使用KNN和SRC分类器都可以得到良好 的实施结果,这表明模型在分类任务上具有稳定的性能。原因是使用低秩模 型很好地挖掘了样本在低维子空间中的结构,并且其系数被有效地用作不同 样本相似性测量和标签相似性测量以约束所学习到的投影子空间和未知样本 的标签预测。而且,通过将标签全波、低秩表示和特征学习放入统一框架中, 这两个变量可以在迭代求解过程中相互促进,从而得到更好的解决方案。
为了测试本实施例的稳健性,在两个选定的数据集上添加了不同级别的 随机脉冲噪声,测试数据集选用COIL20,原始测试图像中加入了不同百分比 的脉冲噪声,在图5中给出了加入噪声后的图像示例,并在图6中分别显示 它们的分类结果。含噪样本分类实施中,参数的设置与无噪声干扰数据集实 验中的设置相同。从分类结果可以看出,与传统的特征学习方法相比,本实 施例(Ours)在噪声条件下显示出优势。这是因为虽然本实施例为半监督特 征学习方法,但是低秩模型可以帮助消除噪声成分并探索原始无噪声干扰时 数据中存在的更重要的结构信息指导道样本相似性和标签传播当训练样本受 到噪声干扰时,本实施例的识别和分类结果相比其他方法性能得到了明显的 提升,体现了一定的鲁棒性。
本实施例提出了一种基于低秩图学习的半监督特征子空间学习方法,用 于图像特征提取以及识别和分类任务。建立了一个基于标签传播、低秩表示 和类别标签三种约束方式的半监督特征子空间学习模型,并对该模型设计了 一种基于交替方向乘子法的数值求解方法来保证算法的收敛性。在四个不同 的公开测试数据集上的实验结果表明了本实施方式的优越性。此外,当训练 样本受噪声干扰时,本实施方式的实验结果比其他对比方法具有明显提升, 性能更稳健。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该 理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着 这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本 发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
Claims (8)
1.基于低秩图学习的半监督特征子空间学习方法,其特征在于,包括:
将图像数据集分成测试集和训练集,训练集中的样本包括有标签的样本以及无标签的样本;
定义关于特征子空间学习模型的目标函数,其中,目标函数中的第一项为矩阵的低秩约束,第二项为正则化约束项,将低秩表示系数作为正则化参数来约束两个样本投影后的距离,矩阵中的元素被视为对两个样本的低维结构相似性的测量,对矩阵中的每个元素引入非负约束;
采用标签传播的方式,构建有关标签的不同约束项,进而预测出无标签样本的的标签信息,重新拟定目标函数;
将重新拟定的目标函数中的特征子空间施加正交约束;
利用训练集,求解出目标函数值最小化时各个变量的值,以通过目标函数求解后得到一个特征子空间;以及
通过所述特征子空间投影测试集,得到所述数据集里所有类别图像的所有特征,通过预定分类器获得所述数据集的识别率。
6.根据权利要求5所述的半监督特征子空间学习方法,其特征在于,所述利用训练集求解出目标函数值最小化时各个变量的值的步骤包括:
通过增广拉格朗日乘子法,确定目标函数问题中的拉格朗日函数;
将拉格朗日函数进行化简和最小化转换;
利用交替方向乘子算法,在其他变量不变的条件下针对每个变量迭代地求解最小化;固定其他变量,删除与F无关的函数项,将目标函数式重写为基于图的化简公式;
利用目标函数的导数,进行求解;
固定其他变量,删除与P无关的函数项,得到变量P的目标函数式,将特征投影空间的目标函数式重写为基于图的化简公式,利用目标函数的导数进行求解;
固定其他变量,删除与J无关的函数项,得到变量J的目标函数式,通过奇异值收缩算子求解;
固定其他变量,删除与R无关的函数项,得到变量R的目标函数式,并重写;
固定其他变量,删除与Z无关的函数项,得到变量Z的目标函数式,并重写;
固定其他变量,删除与H无关的函数项,得到变量H的目标函数式,进行强制目标函数式导数为零的求解,得到封闭形式;
固定其他变量,删除与E无关的函数项,得到变量E的目标函数式,将矩阵E进行更新;
逐项更新拉格朗日乘子和参数。
7.根据权利要求1-6中任一项所述的半监督特征子空间学习方法,其特征在于,在训练集中:
有标签的样本的数量与无标签的样本的数量相同;或
有标签的样本的数量与无标签的样本的数量不同。
8.基于低秩图学习的半监督特征子空间学习装置,包括:
存储单元,用于存储图像数据集,其中存储单元中的图像数据集分为测试集和训练集,训练集中的样本包括有标签的样本以及无标签的样本;
定义单元,用于定义关于特征子空间学习模型的目标函数,其中,目标函数中的第一项为矩阵的低秩约束,第二项为正则化约束项,将低秩表示系数作为正则化参数来约束两个样本投影后的距离,矩阵中的元素被视为对两个样本的低维结构相似性的测量,对矩阵中的每个元素引入非负约束;
目标函数重拟单元,用于采用标签传播的方式,构建有关标签的不同约束项,进而预测出无标签样本的的标签信息,重新拟定目标函数;
正交约束单元,用于将目标函数重拟单元重新拟定的目标函数中的特征子空间施加正交约束;
求解单元,用于利用训练集,求解出目标函数值最小化时各个变量的值;通过目标函数求解后得到所有变量的值,求解后得到特征子空间;以及
获得单元用于通过所述特征子空间投影测试集,得到数据集里所有类别图像的所有特征,最终通过分类器得到所述数据集的识别率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910891913.XA CN111027582B (zh) | 2019-09-20 | 2019-09-20 | 基于低秩图学习的半监督特征子空间学习方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910891913.XA CN111027582B (zh) | 2019-09-20 | 2019-09-20 | 基于低秩图学习的半监督特征子空间学习方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111027582A true CN111027582A (zh) | 2020-04-17 |
CN111027582B CN111027582B (zh) | 2023-06-27 |
Family
ID=70203795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910891913.XA Active CN111027582B (zh) | 2019-09-20 | 2019-09-20 | 基于低秩图学习的半监督特征子空间学习方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111027582B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112162560A (zh) * | 2020-10-10 | 2021-01-01 | 金陵科技学院 | 基于非线性字典的回归误差抗干扰导航控制系统 |
CN113033641A (zh) * | 2021-03-17 | 2021-06-25 | 华南理工大学 | 一种高维数据半监督分类方法 |
CN113095408A (zh) * | 2021-04-14 | 2021-07-09 | 中国工商银行股份有限公司 | 风险的确定方法、装置和服务器 |
CN113902950A (zh) * | 2021-10-16 | 2022-01-07 | 江苏大学 | 一种基于几何保持双投影的图像多标签分类方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880875A (zh) * | 2012-10-12 | 2013-01-16 | 西安电子科技大学 | 基于lrr图的半监督学习人脸识别方法 |
US20130191425A1 (en) * | 2012-01-20 | 2013-07-25 | Fatih Porikli | Method for Recovering Low-Rank Matrices and Subspaces from Data in High-Dimensional Matrices |
CN106021170A (zh) * | 2016-05-19 | 2016-10-12 | 中国科学技术大学 | 采用半监督低秩表示模型的图构建方法 |
US9544550B1 (en) * | 2013-03-14 | 2017-01-10 | Hrl Laboratories, Llc | Low power surveillance camera system for intruder detection |
CN107689053A (zh) * | 2017-07-31 | 2018-02-13 | 温州大学 | 一种基于标签传播和排序约束的目标跟踪方法 |
CN108009571A (zh) * | 2017-11-16 | 2018-05-08 | 苏州大学 | 一种新的直推式半监督数据分类方法及系统 |
CN109308486A (zh) * | 2018-08-03 | 2019-02-05 | 天津大学 | 基于深度学习的多源图像融合和特征提取算法 |
CN109522956A (zh) * | 2018-11-16 | 2019-03-26 | 哈尔滨理工大学 | 一种低秩判别特征子空间学习方法 |
WO2019100724A1 (zh) * | 2017-11-24 | 2019-05-31 | 华为技术有限公司 | 训练多标签分类模型的方法和装置 |
-
2019
- 2019-09-20 CN CN201910891913.XA patent/CN111027582B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130191425A1 (en) * | 2012-01-20 | 2013-07-25 | Fatih Porikli | Method for Recovering Low-Rank Matrices and Subspaces from Data in High-Dimensional Matrices |
CN102880875A (zh) * | 2012-10-12 | 2013-01-16 | 西安电子科技大学 | 基于lrr图的半监督学习人脸识别方法 |
US9544550B1 (en) * | 2013-03-14 | 2017-01-10 | Hrl Laboratories, Llc | Low power surveillance camera system for intruder detection |
CN106021170A (zh) * | 2016-05-19 | 2016-10-12 | 中国科学技术大学 | 采用半监督低秩表示模型的图构建方法 |
CN107689053A (zh) * | 2017-07-31 | 2018-02-13 | 温州大学 | 一种基于标签传播和排序约束的目标跟踪方法 |
CN108009571A (zh) * | 2017-11-16 | 2018-05-08 | 苏州大学 | 一种新的直推式半监督数据分类方法及系统 |
WO2019100724A1 (zh) * | 2017-11-24 | 2019-05-31 | 华为技术有限公司 | 训练多标签分类模型的方法和装置 |
CN109308486A (zh) * | 2018-08-03 | 2019-02-05 | 天津大学 | 基于深度学习的多源图像融合和特征提取算法 |
CN109522956A (zh) * | 2018-11-16 | 2019-03-26 | 哈尔滨理工大学 | 一种低秩判别特征子空间学习方法 |
Non-Patent Citations (2)
Title |
---|
SHUYUAN YANG, ZHIXI FENG, YU REN, HONGYING LIU, LICHENG JIAO: "Semi-supervised classification via kernel low-rank representation graph", pages 150 - 158 * |
万源,陈晓丽,张景会,欧卓玲: "低秩稀疏图嵌入的半监督特征选择", pages 1316 - 1325 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112162560A (zh) * | 2020-10-10 | 2021-01-01 | 金陵科技学院 | 基于非线性字典的回归误差抗干扰导航控制系统 |
CN113033641A (zh) * | 2021-03-17 | 2021-06-25 | 华南理工大学 | 一种高维数据半监督分类方法 |
CN113033641B (zh) * | 2021-03-17 | 2022-12-16 | 华南理工大学 | 一种高维数据半监督分类方法 |
CN113095408A (zh) * | 2021-04-14 | 2021-07-09 | 中国工商银行股份有限公司 | 风险的确定方法、装置和服务器 |
CN113902950A (zh) * | 2021-10-16 | 2022-01-07 | 江苏大学 | 一种基于几何保持双投影的图像多标签分类方法 |
CN113902950B (zh) * | 2021-10-16 | 2024-03-19 | 江苏大学 | 一种基于几何保持双投影的图像多标签分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111027582B (zh) | 2023-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109522956B (zh) | 一种低秩判别特征子空间学习方法 | |
CN111027582B (zh) | 基于低秩图学习的半监督特征子空间学习方法及装置 | |
CN103605972B (zh) | 一种基于分块深度神经网络的非限制环境人脸验证方法 | |
Yan et al. | Ranking with uncertain labels | |
WO2022105117A1 (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
CN108415883B (zh) | 基于子空间聚类的凸非负矩阵分解方法 | |
CN105160312A (zh) | 基于人脸相似度匹配的明星脸装扮推荐方法 | |
CN110929802A (zh) | 基于信息熵的细分类识别模型训练、图像识别方法及装置 | |
CN105608478B (zh) | 一种图像的特征提取与分类联合方法及系统 | |
CN110781970B (zh) | 分类器的生成方法、装置、设备及存储介质 | |
CN110751027B (zh) | 一种基于深度多示例学习的行人重识别方法 | |
WO2017092022A1 (zh) | 一种张量模式下的有监督学习优化方法及系统 | |
Afsari et al. | Group action induced distances for averaging and clustering linear dynamical systems with applications to the analysis of dynamic scenes | |
CN105528620B (zh) | 一种联合鲁棒主成分特征学习与视觉分类方法及系统 | |
CN105740912A (zh) | 基于核范数正则化的低秩图像特征提取的识别方法及系统 | |
CN106096517A (zh) | 一种基于低秩矩阵与特征脸的人脸识别方法 | |
CN108171261A (zh) | 鲁棒的自适应半监督图像分类方法、装置、设备及介质 | |
CN110097499B (zh) | 基于谱混合核高斯过程回归的单帧图像超分辨率重建方法 | |
CN114863151B (zh) | 一种基于模糊理论的图像降维聚类方法 | |
CN117935299A (zh) | 基于多阶特征分支和局部注意力的行人重识别模型 | |
CN110443169B (zh) | 一种边缘保留判别分析的人脸识别方法 | |
Yang et al. | Unsupervised feature selection based on reconstruction error minimization | |
CN116258938A (zh) | 基于自主进化损失的图像检索与识别方法 | |
CN105389560B (zh) | 基于局部约束的图优化维数约简方法 | |
US8891884B2 (en) | Regression tree fields |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |