CN105354595B - 一种鲁棒视觉图像分类方法及系统 - Google Patents

一种鲁棒视觉图像分类方法及系统 Download PDF

Info

Publication number
CN105354595B
CN105354595B CN201510728736.5A CN201510728736A CN105354595B CN 105354595 B CN105354595 B CN 105354595B CN 201510728736 A CN201510728736 A CN 201510728736A CN 105354595 B CN105354595 B CN 105354595B
Authority
CN
China
Prior art keywords
matrix
label
sample
training sample
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510728736.5A
Other languages
English (en)
Other versions
CN105354595A (zh
Inventor
张召
梁雨宸
李凡长
张莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201510728736.5A priority Critical patent/CN105354595B/zh
Publication of CN105354595A publication Critical patent/CN105354595A/zh
Application granted granted Critical
Publication of CN105354595B publication Critical patent/CN105354595B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes

Abstract

本发明公开了一种鲁棒视觉图像分类方法及系统,为了有效实现训练样本内无标签样本的类别预测和待测样本的快速归纳与合理降维,通过将基于弹性回归分析的误差度量集成到训练样本外的标签传播模型,并通过参数权衡归一化流形正则化项、基于软标签l2,1范数正则化的标签拟合项及基于l2,1范数正则化的弹性回归残差项对样本描述及类别鉴定的影响,完成标签传播模型的建立;进而通过对标签传播模型的迭代优化获取用于确定待测样本的类别的投影矩阵。因此,本申请中通过引入基于l2,1范数正则化的回归误差项及软标签l2,1范数正则化,能够在继承标签传播分类方法的优点的同时有效提高了系统的鲁棒性,使待测样本的归纳过程快速且精确。

Description

一种鲁棒视觉图像分类方法及系统
技术领域
本发明涉及数据挖掘技术领域,更具体地说,涉及一种鲁棒视觉图像分类方法及系统。
背景技术
分类技术一直是数据挖掘中最根本、最核心的研究课题。近年,分类技术发展迅速,涌现了许多优秀的分类方法,如SVM,决策树,关联规则,神经网络和深度学习等等。许多分类系统已经投入使用并产生了巨大的社会、经济效益。而标签传播领域出现了一种基于投影的快速诱导式分类方法,大大提高了标签传播分类的精确度和速度。
标签传播分类是一种基于相似图构造的半监督学习方法。在实际操作中,用于监督学习的监督数据(具有类别标签的数据)十分稀缺,只能通过人工来标定,而这会耗费大量的时间及人力;但是大量的不具有类别标签的数据却能轻易收集到,因此半监督学习具有极高的实用价值与现实意义。在半监督学习中,标签传播分类因其快速、有效、简单的优点而引起人们的广泛关注。但是,大多数标签传播分类的方法均采用诱导式分类方法来实现,而诱导式分类方法由于其近邻选择会导致分类速度较慢。
综上所述,现有技术中的标签传播分类的方法存在分类速度较慢的问题。
发明内容
本发明的目的是提供一种鲁棒视觉图像分类方法及系统,以解决现有技术的标签传播分类的方法中存在的分类速度较慢的问题。
为了实现上述目的,本发明提供如下技术方案:
一种鲁棒视觉图像分类方法,包括:
步骤1:基于近邻定义及重构权的构造方法对预先获取的训练集中的训练样本进行处理,得到相似度量矩阵,对所述相似度量矩阵进行预设处理,得到重构系数矩阵,所述训练样本包括已知其类别并标定有与其类别对应的类别标签的有标签样本及未知其类别且未标定有类别标签的无标签样本;根据每个所述训练样本的类别标签确定初始类别标签矩阵;
步骤2:基于所述重构系数矩阵及所述初始类别标签矩阵,将归一化流形正则化项、标签拟合项及弹性回归残差项集成到统一的标签传播模型的框架中,并利用参数权衡所述归一化流形正则化项、标签拟合项及弹性回归残差项的贡献程度,通过迭代优化所述标签传播模型获得投影矩阵及与所述训练样本的类别对应的软标签矩阵;
步骤3:利用所述投影矩阵对待测样本进行映射,得到与所述待测样本的类别对应的软标签;所述待测样本为未知其类别且未标定类别标签的样本。
优选的,步骤2包括:
利用下列公式计算所述投影矩阵及所述软标签矩阵:
Subj fi≥0,eT fi=1 for i=1,2,...,l+u
其中,F表示软标签矩阵,P表示投影矩阵,b表示弹性常量;W表示重构系数矩阵,Wi,j表示训练样本xi的近邻训练样本xj对训练样本xi的协同重构权重;D是一个对角矩阵,其对角元素Dii=ΣjWi,j为软标签矩阵F中的一列,其最大值元素所在位置对应的软标签为训练样本xi的软标签,其中的表示c乘以l的矩阵空间;ri为矩阵的一个行向量,其中的表示回归余数项,而表示l+u乘以c的矩阵空间;μi,α,β和γ均为大于零的参数,用于权衡所述归一化流形正则化项、标签拟合项及弹性回归残差项的贡献程度。
优选的,步骤2包括:
利用下列公式计算所述投影矩阵及所述软标签矩阵:
Subj F≥0,eTF=eT
其中,F表示软标签矩阵,P表示投影矩阵,b表示弹性常量;W表示重构系数矩阵,Wi,j表示训练样本xi的近邻训练样本xj对训练样本xi的协同重构权重;D是一个对角矩阵,其对角元素Dii=ΣjWi,j;L=D-1/2(D-W)D-1/2=I-D-1/2WD-1/2,其是一个归一化的拉普拉斯矩阵;U是一个对角矩阵,其对角元素为μi;α,β和γ均为大于零的参数,用于权衡所述归一化流形正则化项、所述标签拟合项及所述弹性回归残差项的贡献程度;Y表示初始类别标签矩阵,X表示原始的训练集,e为自然常数。
优选的,所述对所述相似度量矩阵进行预设处理,得到重构系数矩阵,包括:
利用下列公式对所述相似度量矩阵进行对称化处理:
利用下列公式对所述相似度量矩阵进行归一化处理:
其中,表示相似度量矩阵,为对角矩阵,对角元素
优选的,步骤3包括:
获取待测样本xi
利用PTxi将所述待测样本xi嵌入到投影矩阵P中,得到预测向量;
确定所述预测向量中最大概率的元素对应的软标签即为所述待测样本xi的软标签。
优选的,所述基于近邻定义及重构权的构造方法对预先获取的训练集中的训练样本进行处理,得到相似度量矩阵,包括:
利用K近邻算法对每个所述训练样本进行处理,得到每个训练样本的K个最近邻样本,K为正整数;
采用LLE-重构权的构造方法利用所述训练样本及每个所述训练样本的K个最近邻样本获取与所述训练样本对应的相似度量矩阵。
优选的,所述根据每个所述训练样本的类别标签确定初始类别标签矩阵,包括:
初始化定义一个行数为c、列数为N的矩阵Y;
对于任一有标签样本xj,若该有标签样本xj属于第i类,则Yi,j=1,若有标签样本xj不属于第i类,则Yi,j=0;对于任一无标签样本xj,则Yi,j=0。
一种鲁棒视觉图像分类系统,包括:
预处理模块,用于:基于近邻定义及重构权的构造方法对预先获取的训练集中的训练样本进行处理,得到相似度量矩阵,对所述相似度量矩阵进行预设处理,得到重构系数矩阵,所述训练样本包括已知其类别并标定有与其类别对应的类别标签的有标签样本及未知其类别且未标定有类别标签的无标签样本;根据每个所述训练样本的类别标签确定初始类别标签矩阵;
训练模块,用于:基于所述重构系数矩阵及所述初始类别标签矩阵,将归一化流形正则化项、标签拟合项及弹性回归残差项集成到统一的标签传播模型的框架中,并利用参数权衡所述归一化流形正则化项、标签拟合项及弹性回归残差项的贡献程度,通过迭代优化所述标签传播模型获得投影矩阵及与所述训练样本的类别对应的软标签矩阵;
测试模块,用于:利用所述投影矩阵对待测样本进行映射,得到与所述待测样本的类别对应的软标签;所述待测样本为未知其类别且未标定类别标签的样本。
本发明提供了一种鲁棒视觉图像分类方法及系统,该方法包括:步骤1:基于近邻定义及重构权的构造方法对预先获取的训练集中的训练样本进行处理,得到相似度量矩阵,对所述相似度量矩阵进行预设处理,得到重构系数矩阵,所述训练样本包括已知其类别并标定有与其类别对应的类别标签的有标签样本及未知其类别且未标定有类别标签的无标签样本;根据每个所述训练样本的类别标签确定初始类别标签矩阵;步骤2:基于所述重构系数矩阵及所述初始类别标签矩阵,将归一化流形正则化项、标签拟合项及弹性回归残差项集成到统一的标签传播模型的框架中,并利用参数权衡所述归一化流形正则化项、标签拟合项及弹性回归残差项的贡献程度,通过迭代优化所述标签传播模型获得投影矩阵及与所述训练样本的类别对应的软标签矩阵;步骤3:利用所述投影矩阵对待测样本进行映射,得到与所述待测样本的类别对应的软标签;所述待测样本为未知其类别且未标定类别标签的样本。
与现有技术相比,本发明公开的一种鲁棒视觉图像分类方法,为了有效实现训练样本内无标签样本的类别预测和待测样本的快速归纳与合理降维,通过将基于弹性回归分析的误差度量集成到训练样本外的标签传播模型,并通过参数权衡归一化流形正则化项、基于软标签l2,1范数正则化的标签拟合项及基于l2,1范数正则化的弹性回归残差项对样本描述及类别鉴定的影响,完成标签传播模型的建立;进而通过对标签传播模型的迭代优化获取用于确定待测样本的类别的投影矩阵。因此,本申请中通过引入基于l2,1范数正则化的回归误差项及软标签l2,1范数正则化,能够在继承标签传播分类方法的优点的同时有效提高了系统的鲁棒性,使待测样本的归纳过程快速且精确,另外,增强了系统的可拓展性。即,本发明提供的一种鲁棒视觉图像分类方法及系统,能够在提高分类性能的同时大大提高诱导式过程的速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种鲁棒视觉图像分类方法的流程图;
图2为本发明实施例提供的一种鲁棒视觉图像分类系统的结构示意图;
图3为本发明实施例提供的一种鲁棒视觉图像分类方法及系统中获取人脸图像测试样本的类别的标签预测示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的一种鲁棒视觉图像分类方法的流程图,可以包括以下步骤:
S11:基于近邻定义及重构权的构造方法对预先获取的训练集中的训练样本进行处理,得到相似度量矩阵,对相似度量矩阵进行预设处理,得到重构系数矩阵,训练样本包括已知其类别并标定有与其类别对应的类别标签的有标签样本及未知其类别且未标定有类别标签的无标签样本;根据每个训练样本的类别标签确定初始类别标签矩阵。
其中,训练集中训练样本的数量可以根据实际需要进行确定。训练样本的类别标签是与训练样本的类别相对应的,对于未知其类别的训练样本,不对其进行类别标签的标定,对于已知其类别的训练样本,利用与其类别对应的类别标签对其进行标定。
该部分主要完成对于训练样本的预处理,包括进行相关变量、参数的设置和初始化,即对训练集中的训练样本进行相似性学习,以构造重构系数矩阵,并人工标定初始类别标签矩阵Y。
S12:基于重构系数矩阵及初始类别标签矩阵,将归一化流形正则化项、标签拟合项及弹性回归残差项集成到统一的标签传播模型的框架中,并利用参数权衡归一化流形正则化项、标签拟合项及弹性回归残差项的贡献程度,通过迭代优化标签传播模型获得投影矩阵及与训练样本的类别对应的软标签矩阵。
根据软标签矩阵可以获知全部训练样本的类别标签,包括原始的无标签样本。即,通过上述步骤,完成了对于无标签样本的类别预测。
S13:利用投影矩阵对待测样本进行映射,得到与待测样本的类别对应的软标签;待测样本为未知其类别且未标定类别标签的样本。
步骤S13即为利用投影矩阵预测待测样本的类别,包括对其进行软标签预测或者特征降维处理,将待测样本的投影嵌入至标签空间以确定待测样本的类别。
该步骤主要是对待测样本进行诱导式标签预测,即利用投影矩阵对待测样本进行投影,将待测样本由高维图像张量空间嵌入至低维标签空间,并预测得到其软标签,从而完成诱导式半监督图像分类过程。
本发明公开的一种鲁棒视觉图像分类方法,为了有效实现训练样本内无标签样本的类别预测和待测样本的快速归纳与合理降维,通过将基于弹性回归分析的误差度量集成到训练样本外的标签传播模型,并通过参数权衡归一化流形正则化项、基于软标签l2,1范数正则化的标签拟合项及基于l2,1范数正则化的弹性回归残差项对样本描述及类别鉴定的影响,完成标签传播模型的建立;进而通过对标签传播模型的迭代优化获取用于确定待测样本的类别的投影矩阵。因此,本申请中通过引入基于l2,1范数正则化的回归误差项及软标签l2,1范数正则化,能够在继承标签传播分类方法的优点的同时有效提高了系统的鲁棒性,使待测样本的归纳过程快速且精确,另外,增强了系统的可拓展性。即,本发明提供的一种鲁棒视觉图像分类方法,能够在提高分类性能的同时大大提高诱导式过程的速度。
上述实施例提供的一种鲁棒视觉图像分类方法中,根据每个训练样本的类别标签确定初始类别标签矩阵,可以包括:
初始化定义一个行数为c(类别数)、列数为N(训练样本总数)的矩阵Y(所有元素均初始化为0);
对于任一有标签样本xj,若该有标签样本xj属于第i类,则Yi,j=1,若有标签样本xj不属于第i类,则Yi,j=0;对于任一无标签样本xj,则Yi,j=0。
具体的,可以令为训练集中训练样本的初始类别标签矩阵,作用为对训练集中训练样本的已知的类别标签进行标记。其中,表示n乘以l+u的矩阵空间,yi为列向量,对应第i个训练样本xi。对于原始标签矩阵Y,在训练集的有标签样本中,如果已知训练样本xj属于第i类,则赋值yi,j=1(1≤i≤c),同列其他元素均赋值为0,即yi,j=0(1≤i≤c);对于训练集中的无标签样本,其所有列元素均赋值为0,即yi,j=0(1≤i≤c)。即,从而保证Y的每列元素之和均为1(即类别标签的位置的值为1,其他位置的值均为0),表示每个有标签样本有且仅有一个已知、假定正确的类别标签。
另外,基于近邻定义及重构权的构造方法对预先获取的训练集中的训练样本进行处理,得到相似度量矩阵可以,包括:
利用K近邻算法对每个训练样本进行处理,得到每个训练样本的K个最近邻样本,K为正整数;
采用LLE-重构权的构造方法利用训练样本及每个训练样本的K个最近邻样本获取与训练样本对应的相似度量矩阵。
即,对训练集中的所有训练样本使用LLE-重构权的构造方法构建相似度量矩阵,权重有效范围设定为K近邻。具体为:
在训练集中,对每个训练样本xi寻找K个最近邻,据此形成所有训练样本的K近邻集N(xi),其中,i=1,2,...,l+u。近邻训练样本间的权重由LLE-重构权进行衡量,非近邻训练样本间的权重设置为零。任意训练集中训练样本xi和xj间的相似度使用LLE-重构权的进行表征,具体为最小化近邻重构误差:
当xi为无标签样本时,当xi和xj均为有标签样本,且xj≠i∈N(xi),即xi和xj为近邻关系时, 通过对每个训练样本重复上述步骤,可以得到相似度量矩阵
由此,通过增强近邻域内有标签样本间的权重,一方面能更确定该区域的有标签样本的类别标签的标定结果准确,另一方面增强局部区域内顶点(即有标签样本)的权重影响力,使无标签样本落在该区域时,更倾向于分类为该区域的标签。
而对相似度量矩阵进行预设处理,得到重构系数矩阵,可以包括:
利用下列公式对相似度量矩阵进行对称化处理:
利用下列公式对相似度量矩阵进行归一化处理:
其中,表示相似度量矩阵,为对角矩阵,对角元素W为重构系数矩阵。
通过对相似度量矩阵进行归一化处理,训练集中训练样本构成的图构造中,低密度区域内的权重将被增大,高密度区域内的权重将被减小,能有效降低训练样本分布图中密度显著变化区域对分类性能的影响。
上述实施例提供的一种鲁棒视觉图像分类方法中,步骤S12可以包括:
利用下列公式计算投影矩阵及软标签矩阵:
Subj fi≥0,eT fi=1for i=1,2,...,l+u
其中,F表示软标签矩阵,P表示投影矩阵,b表示弹性常量,用于容纳回归余数项的波动;W表示重构系数矩阵,Wi,j表示训练样本xi的近邻训练样本xj对训练样本xi的协同重构权重;D是一个对角矩阵,其对角元素Dii=ΣjWi,j,表示训练样本xi在图上与近邻训练样本的权重之和;为软标签矩阵F中的一列,其最大值元素所在位置对应的软标签为训练样本xi的软标签,其中的表示c乘以l的矩阵空间;ri为矩阵的一个行向量,其中的表示回归余数项,其含义为训练样本的弹性投影结果与软标签的差距,而表示l+u乘以c的矩阵空间;μi,α,β和γ均为大于零的参数,用于权衡归一化流形正则化项、标签拟合项及弹性回归残差项的贡献程度。同时加入列和为一约束eT fi=1 for i=1,2,...,l+u和非负约束fi≥0,在两项约束的共同作用下,能确保F始终符合概率值的定义。为投影矩阵,或称为投影分类器,或特征提取器。
利用上述公式,实际实现为:在标签传播模型中集成参数权衡归一化流形正则化项、基于软标签l2,1范数正则化的标签拟合项、基于投影分类器l2,1范数正则化的弹性回归残差项。同时在标签传播模型中加入列和为1的约束和非负约束,在两项约束的共同作用下,能确保软标签始终符合概率值的定义;其中非负约束并不总是需要调用,因为软标签出现负值的概率较小,仅当迭代过程中出现负值时调用。
为增强模型的鉴别能力,引入l2,1-范数进行稀疏性约束;为更清楚表示l2,1-范数项,将上式转换写成矩阵形式,具体为:
Subj F≥0,eT F=eT
其中,F表示软标签矩阵,P表示投影矩阵,b表示弹性常量;W表示重构系数矩阵,Wi,j表示训练样本xi的近邻训练样本xj对训练样本xi的协同重构权重;D是一个对角矩阵,其对角元素Dii=ΣjWi,j;L=D-1/2(D-W)D-1/2=I-D-1/2WD-1/2,其是一个归一化的拉普拉斯矩阵;U是一个对角矩阵,其对角元素为μi;α,β和γ均为大于零的参数,用于权衡归一化流形正则化项、标签拟合项及弹性回归残差项的贡献程度;Y表示初始类别标签矩阵,X表示原始的训练集,e为自然常数。
上述模型中的l2,1-范数项共有三个,其中,||P||2,1使投影矩阵P的每行足够稀疏,增强了模型的鲁棒性和对噪音的容纳能力;l2,1正则化项||FT||2,1能使F中的许多微小元素变为零,进而大大降低数据中可能存在的混合信号以及噪音对分类性能的影响;l2,1-范数约束的回归余数||XTP+ebT-FT||2,1,或称损失函数,较之普遍使用的Frobenius范数,对噪音更具有鲁棒性。因此,上述模型较之FME,具有更好的鲁棒性和更优越的分类性能。
上述模型可以进一步转换为如下形式:
其中,为一个对角矩阵,其对角元素i=1,2,...,l+u;为一个对角矩阵,对角元素gii=1/2||pi||2,i=1,...,n;也为对角矩阵,对角元素vii=1/2||ri||2,i=1,2,...,l+u;R=XTP+ebT-FT=[r1,r2,...,rl+u],且,pi≠0,i=1,2,...,n,ri≠0,i=1,2,...,l+u。其中,最小化tr(FHFT)和tr(PTGP)的过程,实际分别是F和P和稀疏性约束。
上述实施例提供的一种鲁棒视觉图像分类方法中,步骤S13可以包括:
获取待测样本xi
利用PTxi将待测样本xi嵌入到投影矩阵P中,得到预测向量;
确定预测向量中最大概率的元素对应的软标签即为待测样本xi的软标签。
具体来说,其中xi为待测样本,对于任一待测样本诱导预测所得的最大值的位置对应预测得到的软标签,即即,利用投影矩阵P对待测样本进行投影分类,将待测样本从原始维度空间嵌入至低维标签空间,并预测得到待测样本的预测软标签,完成基于张量描述的诱导式半监督图像分类过程。并确定输出的相似性概率的最大值为待测样本的软标签,得到最准确的分类结果。
与上述方法实施例相对应,本发明实施例还提供了一种鲁棒视觉图像分类系统,如图2所示,可以包括:
预处理模块21,用于:基于近邻定义及重构权的构造方法对预先获取的训练集中的训练样本进行处理,得到相似度量矩阵,对相似度量矩阵进行预设处理,得到重构系数矩阵,训练样本包括已知其类别并标定有与其类别对应的类别标签的有标签样本及未知其类别且未标定有类别标签的无标签样本;根据每个训练样本的类别标签确定初始类别标签矩阵;
训练模块22,用于:基于重构系数矩阵及初始类别标签矩阵,将归一化流形正则化项、标签拟合项及弹性回归残差项集成到统一的标签传播模型的框架中,并利用参数权衡归一化流形正则化项、标签拟合项及弹性回归残差项的贡献程度,通过迭代优化标签传播模型获得投影矩阵及与训练样本的类别对应的软标签矩阵;
测试模块23,用于:利用投影矩阵对待测样本进行映射,得到与待测样本的类别对应的软标签;待测样本为未知其类别且未标定类别标签的样本。
本发明公开的一种鲁棒视觉图像分类系统,为了有效实现训练样本内无标签样本的类别预测和待测样本的快速归纳与合理降维,通过将基于弹性回归分析的误差度量集成到训练样本外的标签传播模型,并通过参数权衡归一化流形正则化项、基于软标签l2,1范数正则化的标签拟合项及基于l2,1范数正则化的弹性回归残差项对样本描述及类别鉴定的影响,完成标签传播模型的建立;进而通过对标签传播模型的迭代优化获取用于确定待测样本的类别的投影矩阵。因此,本申请中通过引入基于l2,1范数正则化的回归误差项及软标签l2,1范数正则化,能够在继承标签传播分类方法的优点的同时有效提高了系统的鲁棒性,使待测样本的归纳过程快速且精确,另外,增强了系统的可拓展性。即,本发明提供的一种鲁棒视觉图像分类系统,能够在提高分类性能的同时大大提高诱导式过程的速度。
上述实施例提供的一种鲁棒视觉图像分类系统中,训练模块可以包括:
第一训练单元,用于利用下列公式计算投影矩阵及软标签矩阵:
Subj fi≥0,eT fi=1 for i=1,2,...,l+u
其中,F表示软标签矩阵,P表示投影矩阵,b表示弹性常量;W表示重构系数矩阵,Wi,j表示训练样本xi的近邻训练样本xj对训练样本xi的协同重构权重;D是一个对角矩阵,其对角元素Dii=ΣjWi,j为软标签矩阵F中的一列,其最大值元素所在位置对应的软标签为训练样本xi的软标签,其中的表示c乘以l的矩阵空间;ri为矩阵的一个行向量,其中的表示回归余数项,而表示l+u乘以c的矩阵空间;μi,α,β和γ均为大于零的参数,用于权衡归一化流形正则化项、标签拟合项及弹性回归残差项的贡献程度。
上述实施例提供的一种鲁棒视觉图像分类系统中,训练模块可以包括:
第二训练单元,用于利用下列公式计算投影矩阵及软标签矩阵:
Subj F≥0,eT F=eT
其中,F表示软标签矩阵,P表示投影矩阵,b表示弹性常量;W表示重构系数矩阵,Wi,j表示训练样本xi的近邻训练样本xj对训练样本xi的协同重构权重;D是一个对角矩阵,其对角元素Dii=ΣjWi,j;L=D-1/2(D-W)D-1/2=I-D-1/2WD-1/2,其是一个归一化的拉普拉斯矩阵;U是一个对角矩阵,其对角元素为μi;α,β和γ均为大于零的参数,用于权衡归一化流形正则化项、标签拟合项及弹性回归残差项的贡献程度;Y表示初始类别标签矩阵,X表示原始的训练集,e为自然常数。
上述实施例提供的一种鲁棒视觉图像分类系统中,预处理模块可以包括:
第一预处理单元,用于利用下列公式对相似度量矩阵进行对称化处理:
利用下列公式对相似度量矩阵进行归一化处理:
其中,表示相似度量矩阵,为对角矩阵,对角元素
第二预处理单元,用于:利用K近邻算法对每个训练样本进行处理,得到每个训练样本的K个最近邻样本,K为正整数;采用LLE-重构权的构造方法利用训练样本及每个训练样本的K个最近邻样本获取与训练样本对应的相似度量矩阵。
第三预处理单元,用于:初始化定义一个行数为c、列数为N的矩阵Y;对于任一有标签样本xj,若该有标签样本xj属于第i类,则Yi,j=1,若有标签样本xj不属于第i类,则Yi,j=0;对于任一无标签样本xj,则Yi,j=0。
上述实施例提供的一种鲁棒视觉图像分类系统中,测试模块可以包括:
预测单元,用于:获取待测样本xi;利用PTxi将待测样本xi嵌入到投影矩阵P中,得到预测向量;确定预测向量中最大概率的元素对应的软标签即为待测样本xi的软标签。
对于本发明实施例提供的一种鲁棒视觉图像分类系统,由于其与上述实施例公开的一种鲁棒视觉图像分类方法相对应,因此,对于其具体说明可参阅上述方法实施例的相关内容。
另外需要说明的是,本发明实施例在5个真实人脸数据集中对本发明实施例提供的一种鲁棒视觉图像分类方法进行测试,包括Extended Yale-B人脸数据库、AR人脸数据库、CMU PIE人脸数据库、CMU Pose(lights and illumination change)人脸数据库和MITCBCL人脸数据库。基于计算的高效性考虑,所使用的人脸图像数据均统一压缩为32×32,即1024维的向量模型。其中,上述人脸数据集分别对应包括有2414、2600、11554、2856和3240个样本;其中CMU Pose人脸数据库共有20类,其他数据集均为10类。
以Extended Yale-B人脸数据库为例说明上述步骤,具体为:首先从ExtendedYale-B人脸数据库中随机选取一定比例的数据(包含少量有标签样本和适量无标签样本)组成训练集,剩余数据作为测试集(均为无标签的待测样本);设选出的训练集为其中,表示n乘以l+u的矩阵空间,n是数据的原始维度,l+u=N为训练样本中有标签样本与无标签样本的数量之和,为训练集中的有标签样本集,且XL中的每个样本有且仅有一个属于标签集{1,2,...,c}中的类别标签,同时标签集{1,2,...,c}中的每种类别标签均被包含于有标签样本集XL中;为训练样本中的无标签样本集。在本实施例Extended Yale-B人脸数据集中,数据维度n为1024,总样本数量为2414,标签类别数c为38,数据平衡度为0.9219,实验中每类标签取有标签样本个数分别为10、15和20。
为了避免Gaussian function不同核参数的选择带来的误差,所有方法将统一使用LLE-重构权进行相似性度量,构建重构系数矩阵,同时出于合理权重的考虑,对所有权重都进行对称化与归一化处理。实验中所有方法在K近邻选择中,K将统一在该范围{3,5,...,13,15}进行选择,并返回性能最好的K值。对于本发明方法在实验中使用的参数α,β,γ,λ,均从{10-8,10-6,...,106,108}中选取;训练集中的标签权重αl和αu分别设置为0和0.999999。
在分类实验中,数据集将被随机分为训练集与测试集,其中训练集中含有有标签样本与无标签样本,且有标签样本中包含了样本的所有类别;测试集中均为无标签的待测样本。请参阅表1,为本实验所使用的数据集的相关信息,包括样本维度、样本数量、标签类别数量、样本平衡度和实验采用的有标签样本集比例或每类中有标签样本集内有标签样本的数量。其中,样本平衡度表示样本数量最多的类与样本数量最少的类的样本数量比值,反映了数据分布的平衡性。为保证公平性,实验结果均为20次随机实验的平均结果。同时,所有使用的数据均经过主成分分析(PCA:Principal Component Analysis)处理,以保存95%的主成分。表2为本发明实施例提供的一种鲁棒视觉图像分类方法在针对Extended Yale-B人脸数据集进行的实验中与其他7个相关的标签传播算法在人脸图像数据集上的分类实验结果对比,其中其他7个相关的标签传播算法包括直推式的GFHF、LLFC、LNP、SLP和归纳式的SDA、LapLDA及FME。对于每个方法,分别给出了基于训练集中无标签样本的直推式预测结果(Unlab±STD);对于SDA、LapLDA、FME和本发明实施例提供的一种鲁棒视觉图像分类方法,还给出了各种方法在测试中无标签样本上的归纳预测结果(Test±STD)。
表1、本方法实验使用数据集的相关信息
表2、在Extended Yale-B人脸数据集上各方法分类实验结果对比表
请参阅图3,为本发明实施例公开的一种鲁棒图像视觉分类方法获取人脸图像测试样本的类别的标签预测示意图,其中,测试样本即为测试集中的任一待测样本。通过实验结果可以看出,本发明实施例提供的一种鲁棒图像视觉分类方法的分类效果明显优于传统经典的标签传播算法和以弹性标签嵌入为基础的FME,具有更高的适用性和鲁棒性。因此,本发明提出的图像分类系统也具有同样的效果。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (5)

1.一种鲁棒视觉图像分类方法,其特征在于,包括:
步骤1:基于近邻定义及重构权的构造方法对预先获取的训练集中的训练样本进行处理,得到相似度量矩阵,对所述相似度量矩阵进行预设处理,得到重构系数矩阵,所述训练样本包括已知其类别并标定有与其类别对应的类别标签的有标签样本及未知其类别且未标定有类别标签的无标签样本;根据每个所述训练样本的类别标签确定初始类别标签矩阵;
步骤2:基于所述重构系数矩阵及所述初始类别标签矩阵,将归一化流形正则化项、标签拟合项及弹性回归残差项集成到统一的标签传播模型的框架中,并利用参数权衡所述归一化流形正则化项、标签拟合项及弹性回归残差项的贡献程度,通过迭代优化所述标签传播模型获得投影矩阵及与所述训练样本的类别对应的软标签矩阵;
步骤3:利用所述投影矩阵对待测样本进行映射,得到与所述待测样本的类别对应的软标签;所述待测样本为未知其类别且未标定类别标签的样本;
所述基于近邻定义及重构权的构造方法对预先获取的训练集中的训练样本进行处理,得到相似度量矩阵,包括:
利用K近邻算法对每个所述训练样本进行处理,得到每个训练样本的K个最近邻样本,K为正整数;
采用LLE-重构权的构造方法利用所述训练样本及每个所述训练样本的K个最近邻样本获取与所述训练样本对应的相似度量矩阵;
其中,所述训练样本及所述待测样本均为人脸图像;
步骤2包括:
利用下列公式计算所述投影矩阵及所述软标签矩阵:
SubjF≥0,eTF=eT
其中,F表示软标签矩阵,P表示投影矩阵,b表示弹性常量;W表示重构系数矩阵,Wi,j表示训练样本xi的近邻训练样本xj对训练样本xi的协同重构权重;D是一个对角矩阵,其对角元素Dii=∑jWi,j;L=D-1/2(D-W)D-1/2=I-D-1/2WD-1/2,其是一个归一化的拉普拉斯矩阵;U是一个对角矩阵,其对角元素为μi;α,β和γ均为大于零的参数,用于权衡所述归一化流形正则化项、所述标签拟合项及所述弹性回归残差项的贡献程度;Y表示初始类别标签矩阵,X表示原始的训练集,e为自然常数。
2.根据权利要求1所述的方法,其特征在于,所述对所述相似度量矩阵进行预设处理,得到重构系数矩阵,包括:
利用下列公式对所述相似度量矩阵进行对称化处理:
利用下列公式对所述相似度量矩阵进行归一化处理:
其中,表示相似度量矩阵,为对角矩阵,对角元素
3.根据权利要求1所述的方法,其特征在于,步骤3包括:
获取待测样本xi
利用PTxi将所述待测样本xi嵌入到投影矩阵P中,得到预测向量;
确定所述预测向量中最大概率的元素对应的软标签即为所述待测样本xi的软标签。
4.根据权利要求1所述的方法,其特征在于,所述根据每个所述训练样本的类别标签确定初始类别标签矩阵,包括:
初始化定义一个行数为c、列数为N的矩阵Y;
对于任一有标签样本xj,若该有标签样本xj属于第i类,则Yi,j=1,若有标签样本xj不属于第i类,则Yi,j=0;对于任一无标签样本xj,则Yi,j=0。
5.一种鲁棒视觉图像分类系统,其特征在于,包括:
预处理模块,用于:基于近邻定义及重构权的构造方法对预先获取的训练集中的训练样本进行处理,得到相似度量矩阵,对所述相似度量矩阵进行预设处理,得到重构系数矩阵,所述训练样本包括已知其类别并标定有与其类别对应的类别标签的有标签样本及未知其类别且未标定有类别标签的无标签样本;根据每个所述训练样本的类别标签确定初始类别标签矩阵;
训练模块,用于:基于所述重构系数矩阵及所述初始类别标签矩阵,将归一化流形正则化项、标签拟合项及弹性回归残差项集成到统一的标签传播模型的框架中,并利用参数权衡所述归一化流形正则化项、标签拟合项及弹性回归残差项的贡献程度,通过迭代优化所述标签传播模型获得投影矩阵及与所述训练样本的类别对应的软标签矩阵;
测试模块,用于:利用所述投影矩阵对待测样本进行映射,得到与所述待测样本的类别对应的软标签;所述待测样本为未知其类别且未标定类别标签的样本;
所述预处理模块包括:第二预处理单元,用于:利用K近邻算法对每个所述训练样本进行处理,得到每个训练样本的K个最近邻样本,K为正整数;采用LLE-重构权的构造方法利用所述训练样本及每个所述训练样本的K个最近邻样本获取与所述训练样本对应的相似度量矩阵;
所述训练模块包括:
第二训练单元,用于:利用下列公式计算所述投影矩阵及所述软标签矩阵:
SubjF≥0,eTF=eT
其中,F表示软标签矩阵,P表示投影矩阵,b表示弹性常量;W表示重构系数矩阵,Wi,j表示训练样本xi的近邻训练样本xj对训练样本xi的协同重构权重;D是一个对角矩阵,其对角元素Dii=∑jWi,j;L=D-1/2(D-W)D-1/2=I-D-1/2WD-1/2,其是一个归一化的拉普拉斯矩阵;U是一个对角矩阵,其对角元素为μi;α,β和γ均为大于零的参数,用于权衡所述归一化流形正则化项、所述标签拟合项及所述弹性回归残差项的贡献程度;Y表示初始类别标签矩阵,X表示原始的训练集,e为自然常数;
其中,所述训练样本及所述待测样本均为人脸图像。
CN201510728736.5A 2015-10-30 2015-10-30 一种鲁棒视觉图像分类方法及系统 Active CN105354595B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510728736.5A CN105354595B (zh) 2015-10-30 2015-10-30 一种鲁棒视觉图像分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510728736.5A CN105354595B (zh) 2015-10-30 2015-10-30 一种鲁棒视觉图像分类方法及系统

Publications (2)

Publication Number Publication Date
CN105354595A CN105354595A (zh) 2016-02-24
CN105354595B true CN105354595B (zh) 2019-09-27

Family

ID=55330562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510728736.5A Active CN105354595B (zh) 2015-10-30 2015-10-30 一种鲁棒视觉图像分类方法及系统

Country Status (1)

Country Link
CN (1) CN105354595B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340120A (zh) * 2020-02-28 2020-06-26 南京林业大学 一种基于实用鲁棒pca的图像表示方法

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608478B (zh) * 2016-03-30 2019-12-06 苏州大学 一种图像的特征提取与分类联合方法及系统
CN106779217B (zh) * 2016-12-16 2020-11-20 北京工业大学 空气质量检测方法和空气质量检测系统
CN107766895B (zh) * 2017-11-16 2021-07-09 苏州大学 一种诱导式非负投影半监督数据分类方法及系统
CN108171261A (zh) * 2017-12-21 2018-06-15 苏州大学 鲁棒的自适应半监督图像分类方法、装置、设备及介质
CN108108769B (zh) * 2017-12-29 2020-08-25 咪咕文化科技有限公司 一种数据的分类方法、装置及存储介质
CN108376567B (zh) * 2018-01-05 2022-04-01 大连大学 一种基于标签传播算法的临床药品-药品不良反应检测方法
CN108717547B (zh) * 2018-03-30 2020-12-22 国信优易数据股份有限公司 样本数据生成方法及装置、训练模型的方法及装置
US11030486B2 (en) * 2018-04-20 2021-06-08 XNOR.ai, Inc. Image classification through label progression
CN110163252B (zh) * 2019-04-17 2023-11-24 平安科技(深圳)有限公司 数据分类方法及装置、电子设备、存储介质
CN110717513B (zh) * 2019-09-05 2023-04-07 华南理工大学 一种基于多分类器的零样本深海生物图片分类方法
CN110717547A (zh) * 2019-10-15 2020-01-21 重庆大学 一种基于回归超图的学习算法
CN111259938B (zh) * 2020-01-09 2022-04-12 浙江大学 基于流形学习和梯度提升模型的图片偏多标签分类方法
CN113221941B (zh) * 2021-03-22 2024-01-09 哈尔滨工业大学(深圳) 一种自适应对称图信息传播的鉴别回归分类方法
CN113449772B (zh) * 2021-05-26 2022-11-25 浙江工业大学 基于鲁棒多投影支持向量机的医学图像处理方法
CN113408606B (zh) * 2021-06-16 2022-07-22 中国石油大学(华东) 基于图协同训练的半监督小样本图像分类方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129570A (zh) * 2010-01-19 2011-07-20 中国科学院自动化研究所 用于动态视觉的基于流形正则化的半监督分类器设计方法
CN104463202A (zh) * 2014-11-28 2015-03-25 苏州大学 一种多类图像半监督分类方法及系统
CN104794489A (zh) * 2015-04-23 2015-07-22 苏州大学 一种基于深度标签预测的诱导式图像分类方法及系统
CN104933428A (zh) * 2015-07-23 2015-09-23 苏州大学 一种基于张量描述的人脸识别方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6990217B1 (en) * 1999-11-22 2006-01-24 Mitsubishi Electric Research Labs. Inc. Gender classification with support vector machines
US7039239B2 (en) * 2002-02-07 2006-05-02 Eastman Kodak Company Method for image region classification using unsupervised and supervised learning

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129570A (zh) * 2010-01-19 2011-07-20 中国科学院自动化研究所 用于动态视觉的基于流形正则化的半监督分类器设计方法
CN104463202A (zh) * 2014-11-28 2015-03-25 苏州大学 一种多类图像半监督分类方法及系统
CN104794489A (zh) * 2015-04-23 2015-07-22 苏州大学 一种基于深度标签预测的诱导式图像分类方法及系统
CN104933428A (zh) * 2015-07-23 2015-09-23 苏州大学 一种基于张量描述的人脸识别方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340120A (zh) * 2020-02-28 2020-06-26 南京林业大学 一种基于实用鲁棒pca的图像表示方法
CN111340120B (zh) * 2020-02-28 2021-05-07 南京林业大学 一种基于实用鲁棒pca的图像表示方法

Also Published As

Publication number Publication date
CN105354595A (zh) 2016-02-24

Similar Documents

Publication Publication Date Title
CN105354595B (zh) 一种鲁棒视觉图像分类方法及系统
Metcalf et al. The strong gravitational lens finding challenge
CN109344736B (zh) 一种基于联合学习的静态图像人群计数方法
Peel et al. Distinguishing standard and modified gravity cosmologies with machine learning
CN110135267A (zh) 一种大场景sar图像细微目标检测方法
CN112052755B (zh) 基于多路注意力机制的语义卷积高光谱图像分类方法
CN109961089A (zh) 基于度量学习和元学习的小样本和零样本图像分类方法
CN104933428B (zh) 一种基于张量描述的人脸识别方法及装置
CN110298249A (zh) 人脸识别方法、装置、终端及存储介质
CN103177265B (zh) 基于核函数与稀疏编码的高清图像分类方法
CN105740912A (zh) 基于核范数正则化的低秩图像特征提取的识别方法及系统
CN106096506A (zh) 基于子类类间判别双字典的sar目标识别方法
CN103955709B (zh) 基于加权合成核与tmf的极化sar图像分类方法
CN109598220A (zh) 一种基于多元输入多尺度卷积的人数统计方法
CN106127179A (zh) 基于自适应分层多尺度的高光谱遥感图像分类方法
CN103093243B (zh) 高分辨率全色遥感图像云判方法
CN109376787A (zh) 流形学习网络及基于其的计算机视觉图像集分类方法
CN110135505A (zh) 图像分类方法、装置、计算机设备及计算机可读存储介质
CN108629373A (zh) 一种图像分类方法、系统、设备及计算机可读存储介质
CN108228684A (zh) 聚类模型的训练方法、装置、电子设备和计算机存储介质
CN107798345A (zh) 基于块对角与低秩表示的高光谱伪装目标检测方法
CN110502989A (zh) 一种小样本高光谱人脸识别方法及系统
González et al. Multiclass support vector machines with example-dependent costs applied to plankton biomass estimation
CN110324178B (zh) 一种基于多经验核学习的网络入侵检测方法
CN105069471B (zh) 基于模糊标签的高光谱数据子空间投影和分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant