CN105469117B - 一种基于鲁棒特征提取的图像识别方法与装置 - Google Patents

一种基于鲁棒特征提取的图像识别方法与装置 Download PDF

Info

Publication number
CN105469117B
CN105469117B CN201510882718.2A CN201510882718A CN105469117B CN 105469117 B CN105469117 B CN 105469117B CN 201510882718 A CN201510882718 A CN 201510882718A CN 105469117 B CN105469117 B CN 105469117B
Authority
CN
China
Prior art keywords
sample
classification
training sample
original training
tested
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510882718.2A
Other languages
English (en)
Other versions
CN105469117A (zh
Inventor
张召
汤煜
李凡长
张莉
王邦军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Zhijing Infinite Network Technology Co Ltd
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201510882718.2A priority Critical patent/CN105469117B/zh
Publication of CN105469117A publication Critical patent/CN105469117A/zh
Application granted granted Critical
Publication of CN105469117B publication Critical patent/CN105469117B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于鲁棒特征提取的图像识别方法及装置,通过对原始训练样本进行判别学习,在紧凑局部类内散度和分离局部类间散度的同时有效保持图像像素间的拓扑结构,设计基于1范数度量的特征学习框架,可输出一个可用于样本内和样本外图像特征提取的投影矩阵,进而通过投影矩阵获取原始训练样本的二维鲁棒特征,构造出可用于对待测样本进行分类的最近邻分类器。可见,本申请中提供的上述方案无需将图像对应的二维矩阵转换到高维的向量空间,而是可直接作用于图像,由此,不但可有效保持图像像素间的拓扑结构和内在相关性,而且可有效降低模型计算过程的复杂度。此外,基于1范数度量,可确保在特征提取过程中对噪音的鲁棒性。

Description

一种基于鲁棒特征提取的图像识别方法与装置
技术领域
本发明涉及计算机视觉和图像识别技术领域,更具体地说,涉及一种基于鲁棒特征提取的图像识别方法与装置。
背景技术
在这高速发展日新月异的信息时代,科技发展之势如日中天,而数据与信息的重要性在这过程中也体现地越来越明显。其中,数据图像在人类日常生活中几乎无处不在,很多行业领域对其进行准确识别的需求变得越来越大,这极大地推动了图像识别技术的进步发展。迄今为止,图像识别已经发展成为计算机视觉与模式识别中一个极其重要的研究课题。图像识别技术是通过计算机,将图像数字化,从而完成数据分析、特征提取,以实现对图像的类别判定。该技术在机器视觉系统、身份识别系统等领域有着重大的意义,显然在实际应用中,它所能带来和衍生的社会与经济效益是不可估量的。然而值得注意的是,图像本身包含的信息并非都是有用的,其中夹杂着很多不利特征和冗余信息,毋庸置疑,这给图像的特征提取大大增加了难度。截止到目前,图像识别技术还有很大的发展空间,并且由于其巨大的研究价值和商业价值,越来越多的研究者投身于此,并不断地优化现有技术以实现更为准确有效的图像识别。
近年来,为了实现鲁棒图像特征提取,一些基于1范数的算法相继被提出,例如基于1范数的主成分分析算法(PCA-L1)、基于1范数的判别性局部保持投影算法(DLPP-L1)等,但是上述算法都是基于向量空间的模型框架,因此当处理图像时,这些算法不得不首先将图像对应的二维矩阵转换到一个高维的向量空间,但是这个过程将会破坏图像像素之间的拓扑结构,并使得计算过程在高维的数据空间更加复杂。
因此,现有技术中对于图像的处理存在破坏图像像素之间的拓扑结构,且计算过程在高维的数据空间较复杂的问题。
发明内容
本发明的目的是提供一种基于鲁棒特征提取的图像识别方法与装置,以基于矩阵描述进行判别特征提取,可直接作用于图像,从而解决现有技术对于图像的处理中存在的破坏图像像素之间的拓扑结构,且计算过程在高维的数据空间较复杂的问题。
为了实现上述目的,本发明提供如下技术方案:
一种基于鲁棒特征提取的图像识别方法,包括:
对原始训练集中包含的原始训练样本进行二维判别特征学习,通过紧凑局部类内散度和分离局部类间散度,进行图像特征学习建模,可有效保持图像像素间的拓扑结构和内在相关性;基于1范数度量,提升了图像描述的鲁棒性,进而通过优化一个特征分解问题,得到可用于图像样本的二维鲁棒特征提取的投影矩阵;其中,所述原始训练样本为具有与该原始训练样本的类别对应的类别标签的样本;
获取包含有每个所述原始训练样本的二维鲁棒特征的新训练样本集,并利用所述新训练样本集构建分类器;其中,每个所述原始训练样本的二维鲁棒特征为利用所述投影矩阵对每个所述原始训练样本进行投影得到的;
利用所述分类器对待测样本进行分类,得到与所述待测样本的类别对应的分类结果,其中,所述待测样本为未知其类别的样本。
优选的,所述利用所述分类器对待测样本进行分类,得到与所述待测样本的类别对应的分类结果,包括:
利用所述投影矩阵对所述待测样本进行投影,得到所述待测样本的待测二维鲁棒特征;
将所述待测二维鲁棒特征作为所述分类器的输入,得到至少一个与所述待测样本对应的类别,并确定得到的至少一个与所述待测样本对应的类别中与所述待测样本的相似性度量最大的类别为所述待测样本的类别。
优选的,确定得到的至少一个与所述待测样本对应的类别中与所述待测样本的相似性度量最大的类别为所述待测样本的类别,包括:
确定所述待测样本的待测二维鲁棒特征为所述分类器对应输出的任意输出二维鲁棒特征为
利用下列公式确定所述待测二维鲁棒特征与每个所述输出二维鲁棒特征之间基于1范数的距离,并确定该距离最小的输出二维鲁棒特征对应的原始训练样本的类别为所述待测样本的类别:
其中,d(Zi,Zj)表示所述待测二维鲁棒特征与任意输出二维鲁棒特征之间基于1范数的距离,||·||1表示1范数。
优选的,利用所述投影矩阵对所述原始训练样本进行投影,得到该原始训练样本的二维鲁棒特征,包括:
按照下列公式得到所述原始训练样本的二维鲁棒特征:
Zi=PTAi,i=1,2,…N
其中,Zi表示任一原始训练样本的二维鲁棒特征,Ai表示该原始训练样本,N表示原始训练样本的数量,P表示所述投影矩阵。
优选的,确定紧凑局部类内散度及分离局部类间散度,包括:
按照下列公式确定类间权重矩阵,并确定该类间权重矩阵为分离局部类间散度:
其中,Bij表示所述类间权重矩阵,Mi表示i类别对应的平均矩阵,Mj表示j类别对应的平均矩阵,yi为原始训练样本xi的类别标签,yj为原始训练样本xj的类别标签,为矩阵范数;
按照下列公式计算得到类内权重矩阵,并确定该类内权重矩阵为紧凑局部类内散度:
其中,表示类别c中第i个原始训练样本,表示类别c中第j个原始训练样本,为原始训练样本的向量化描述,为原始训练样本的向量化描述,为原始训练样本的近邻集合,表示类内重构权系数,表示类别c中第i个原始训练样本对应的权重矩阵。
优选的,获取可用于图像样本的二维鲁棒特征提取的投影矩阵,包括:
按照下列公式确定投影矩阵:
s.t.PTP=Id×d
其中,P表示投影矩阵,||·||1表示1范数,C表示原始训练集对应的类别的个数,Nc表示c类别中包含的原始训练样本的个数,Popt为最优的目标输出,Id×d为尺寸为d*d的单位矩阵。
一种基于鲁棒特征提取的图像识别装置,包括:
训练模块,用于利用对原始图像训练集中包含原始训练图像样本进行判别特征学习,通过紧凑局部类内散度和分离局部类间散度,完成图像特征学习建模;其中,所述原始训练样本为具有与该原始训练样本的类别对应的类别标签的样本;基于1范数度量,提升了图像描述的鲁棒性,进而通过优化一个特征分解问题,得到可用于图像样本的二维鲁棒特征提取的投影矩阵;
测试预处理模块,用于利用所述投影矩阵对每个所述原始训练样本进行投影,得到每个所述原始训练样本的二维鲁棒特征;
测试模块,用于获取包含有每个所述原始训练样本的二维鲁棒特征的新训练样本集,并利用所述新训练样本集构建分类器;利用所述分类器对待测样本进行分类,得到与所述待测样本的类别对应的分类结果,其中,所述待测样本为未知其类别的样本。
优选的,测试模块包括:
测试单元,用于利用所述投影矩阵对所述待测样本进行投影,得到所述待测样本的待测二维鲁棒特征;将所述待测二维鲁棒特征作为所述分类器的输入,得到至少一个与所述待测样本对应的类别,并确定得到的至少一个与所述待测样本对应的类别中与所述待测样本的相似性度量最大的类别为所述待测样本的类别。
优选的,训练预处理模块包括:
投影单元,用于按照下列公式得到所述原始训练样本的二维鲁棒特征:
Zi=PTAi,i=1,2,…N
其中,Zi表示任一原始训练样本的二维鲁棒特征,Ai表示该原始训练样本,N表示原始训练样本的数量,P表示所述投影矩阵。
优选的,训练模块包括:
训练单元,用于按照下列公式确定投影矩阵:
s.t.PTP=Id×d
其中,P表示投影矩阵,||·||1表示1范数,Mi表示i类别对应的平均矩阵,Mj表示j类别对应的平均矩阵,Bij表示与所述分离局部类间散度对应的类间权重矩阵,Wij表示与所述紧凑局部类内散度对应的类内重构权系数,Ai c表示类别c中第i个原始训练样本的图像矩阵,表示类别c中第j个原始训练样本的图像矩阵,NC表示类别c中原始训练样本的个数,C表示原始训练集对应的类别的个数,Popt为最优的目标输出,Id×d为尺寸为d*d的单位矩阵。
本申请提供的上述技术方案中,通过对原始训练样本进行判别学习,在紧凑局部类内散度和分离局部类间散度的同时有效保持图像像素间的拓扑结构,设计基于1范数度量的特征学习框架,可输出一个可用于样本内和样本外图像特征提取的投影矩阵,进而通过投影矩阵获取原始训练样本的二维鲁棒特征,构造出可用于对待测样本进行分类的最近邻分类器。可见,本申请中提供的上述方案无需将图像对应的二维矩阵转换到高维的向量空间,而是可直接作用于图像,由此,不但可有效保持图像像素间的拓扑结构和内在相关性,而且可有效降低模型计算过程的复杂度。此外,基于1范数度量,可确保在特征提取过程中对噪音的鲁棒性。因此,本发明提供的上述方案通过直接对图像进行特征提取及分类,有效的提高了识别图像的效率以及对于图像进行分类的准确性,系统性能良好且可扩展性好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种基于鲁棒特征提取的图像识别方法的流程图;
图2为本发明实施例提供的一种基于鲁棒特征提取的图像识别装置的结构示意图;
图3为本发明实施例提供的一种基于鲁棒特征提取的图像识别方法及装置中识别待测样本的类别的识别结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的一种基于鲁棒特征提取的图像识别方法的流程图,可以包括以下步骤:
S11:对原始训练集中包含的原始训练样本进行二维判别特征学习,通过紧凑局部类内散度和分离局部类间散度,进行图像特征学习建模,可有效保持图像像素间的拓扑结构和内在相关性;基于1范数度量,提升了图像描述的鲁棒性,进而通过优化一个特征分解问题,得到可用于图像样本的二维鲁棒特征提取的投影矩阵;其中,原始训练样本为具有与该原始训练样本的类别对应的类别标签的样本。
需要说明的是,原始训练样本的数量可以根据实际需要进行确定,而本申请中所涉及的样本均可以为图像样本,其中,原始训练样本为已知其类别且标注有与其类别对应的类别标签的样本,因此,本申请方案实际为基于有标签样本的判别性与样本局部保持的1范数投影的思想实现的。其中,对原始训练样本进行二维特征识别实际为通过建立一个基于图像矩阵模式的正交优化问题,对图像直接进行二维特征判别学习,因此,无需将图像转到高维的向量空间下。
1范数是指向量中各个元素绝对值之和,为机器学习中的经典学习方式,在此不再赘述。本申请中该步骤实际为:对原始训练样本进行基于1范数的二维特征判别学习,进而通过紧凑类局部内散度和分离局部类间散度优化一个特征分解问题,从而得到投影矩阵,以通过投影矩阵实现原始训练样本的特征提取。
S12:获取包含有每个原始训练样本的二维鲁棒特征的新训练样本集,并利用新训练样本集构建分类器;其中,每个原始训练样本的二维鲁棒特征为利用投影矩阵对每个原始训练样本进行投影得到的。
需要说明的是,利用新训练样本集可以构造用于对待测样本进行分类的分类器,而该分类器优选可以是最近邻分类器,也可以是其他可用于进行分类的分类器,均在本发明的保护范围之内。另外,训练分类器可以利用现有技术中任意对应的训练方法,在此不再赘述。
S13:利用分类器对待测样本进行分类,得到与待测样本的类别对应的分类结果,其中,待测样本为未知其类别的样本。
需要说明的是,待测样本为未知其类别的样本,通过将其作为分类器的输入,可以得到对应的输出,即对于待测样本所属类别的预测,进而确定待测样本的类别。
本申请公开的上述技术方案,通过对原始训练样本进行判别学习,在紧凑局部类内散度和分离局部类间散度的同时有效保持图像像素间的拓扑结构,设计基于1范数度量的特征学习框架,可输出一个可用于样本内和样本外图像特征提取的投影矩阵,进而通过投影矩阵获取原始训练样本的二维鲁棒特征,构造出可用于对待测样本进行分类的最近邻分类器。可见,本申请中提供的上述方案无需将图像对应的二维矩阵转换到高维的向量空间,而是可直接作用于图像,由此,不但可有效保持图像像素间的拓扑结构和内在相关性,而且可有效降低模型计算过程的复杂度。此外,基于1范数度量,可确保在特征提取过程中对噪音的鲁棒性。可见,本申请中提供的上述方案不仅降低了计算过程的复杂度,保持了图像像素间的拓扑结构、内存关联性,且保持了特征提取过程中对噪音的鲁棒性,因此,本发明提供的上述方案通过直接对图像进行特征提取及分类,有效的提高了识别图像的效率以及对于图像进行分类的准确性,系统性能良好且可扩展性好。
上述实施例提供的一种基于鲁棒特征提取的图像识别方法中,原始训练集可用来表示,其中,N表示原始训练样本的数量,表示第i个训练样本, 表示一个m×n的矩阵,表示i类中的第k个原始训练样本的图像矩阵,Ni表示标签为i的 样本总数,即:Mi表示i类中所有原始训练样本的图像矩阵的平均矩阵,即:同理:
确定紧凑局部类内散度及分离局部类间散度,可以包括:
按照下列公式确定类间权重矩阵,并确定该类间权重矩阵为分离局部类间散度:
其中,Bij表示类间权重矩阵,Mi表示i类别对应的平均矩阵,Mj表示j类别对应的平均矩阵,yi为原始训练样本xi的类别标签,yj为原始训练样本xj的类别标签,为矩阵范数。
按照下列公式计算得到类内权重矩阵,并确定该类内权重矩阵为紧凑局部类内散度:
其中,表示类别c中第i个原始训练样本,表示类别c中第j个原始训练样本,为原始训练样本的向量化描述,为原始训练样本的向量化描述,为原始训练样本的近邻集合,表示类内重构权系数,表示类别c中第i个原始训练样本对应的权重矩阵。
进一步,获取可用于图像样本的二维鲁棒特征提取的投影矩阵,可以包括:
按照下列公式确定投影矩阵:
s.t.PTP=Id×d
其中,P表示投影矩阵,||·||1表示1范数,C表示原始训练集对应的类别的个数,Nc表示c类别中包含的原始训练样本的个数,Popt为最优的目标输出,Id×d为尺寸为d*d的单位矩阵。需要说明的是,
上述步骤实际为对原始训练样本进行相似性学习,紧凑局部类内散度和分离局部类间散度,并将1范数度量应用于图像特征学习模型,从而计算投影矩阵,直接作用于图像,完成特征降维,具体为:
获取具有判别性特征与局部保持特征的投影矩阵,需解决以下优化问题:
s.t.PTP=Id×d
其中,||·||1表示1范数,定义如下:
类间权重矩阵Bij做如下定义:
而对于类内权重矩阵,本发明实施例中利用监督的LLE式的重构权来构造,具体的,用来重构每个的权重可以通过如下问题得到:
可见,Wc被定义在每个类内部,因此,通过在每个类内部的每处重复上述步骤,可以得到子重矩阵其中,表示Nc×Nc的矩阵,Nc表示c类别中原始训练样本的数量,进一步,通过设置每块Wc为对角元素,可以得到其中,C为类别的总数量。
在实际计算时,可以采用迭代方法对局部最优解逐步逼近,考虑将维数降到1维即d=1的情况,具体可以为:
首先,计算类间权重矩阵Bij及类内重构权系数
其次,进行1范数优化求解,将下列符号函数带入原优化函数:
得到:
再次,令增量做如下定义:
最后,更新p(t+1)=p(t)+βδ(t)。其中,β是一个很小的正数,如果F(p(t+1))的值增长不明显,则输出p*=p(t),否则一直迭代直到收敛,即直至F(p(t+1))的值增长不明显。
另外,考虑降至多维即d>1的情况,具体可以为:
首先,p0=0;(Mi)0=Mi(i=1,2,…,C);
其次,对于i=1,2,...,N中的每一个i,按照如下公式进行计算:
最后,将(Mi)k代入前述迭代方法计算pk。由此,求得投影矩阵P。
上述实施例提供的一种基于鲁棒特征提取的图像识别方法中,利用投影矩阵对原始训练样本进行投影,得到该原始训练样本的二维鲁棒特征,可以包括:
按照下列公式得到原始训练样本的二维鲁棒特征:
Zi=PTAi,i=1,2,…N
其中,Zi表示任一原始训练样本的二维鲁棒特征,Ai表示该原始训练样本,N表示原始训练样本的数量,P表示投影矩阵。需要说明的是,得到待测样本的二维鲁棒特征也可以按照上述公式计算。
对样本采用上述方法进行特征提取具体为:
Ai→Zi=PTAi,i=1,2,…N
其中,Zi对应每一个原始训练样本Ai的二维鲁棒特征,从而得到新训练集Ztrain=[Z1,Z2,...,ZN]。
上述实施例提供的一种基于鲁棒特征提取的图像识别方法中,利用分类器对待测样本进行分类,得到与待测样本的类别对应的分类结果,可以包括:
利用投影矩阵对待测样本进行投影,得到待测样本的待测二维鲁棒特征;
将待测二维鲁棒特征作为分类器的输入,得到至少一个与待测样本对应的类别,并确定得到的至少一个与待测样本对应的类别中与待测样本的相似性度量最大的类别为待测样本的类别。
其中,相似性度量最大也即基于1范数的距离最小,即确定得到的至少一个与待测样本对应的类别中与待测样本的相似性度量最大的类别为待测样本的类别,可以包括:
确定待测样本的待测二维鲁棒特征为分类器对应输出的任意输出二维鲁棒特征为
利用下列公式确定待测二维鲁棒特征与每个输出二维鲁棒特征之间基于1范数的距离,并确定该距离最小的输出二维鲁棒特征对应的原始训练样本的类别为待测样本的类别:
其中,d(Zi,Zj)表示待测二维鲁棒特征与任意输出二维鲁棒特征之间基于1范数的距离,||·||1表示1范数。
上述步骤具体为:利用投影矩阵对待测样本进行特征提取,得到其二维鲁棒特征, 当分类器为最近邻分类器时,利用分类器对其进行分类,可得到其中为待测样本的特征向量,为分类器输出 的特征向量,两个特征矩阵Zi和Zj之间基于1范数的距离定义为: 该距离越小,说明两个特征矩阵之间的相似性度量最大。而且每个样本都有一个类别Ck,例 如:一个待测样本X0,其特征矩阵Z0通过Z0=X0P可得,如果有d(Z0,Zj)=minid(Z0,Zi)且Xj∈ Ck,则可以下结论X0∈Ck,完成分类。由此,提高了获取的待测样本分类结果的准确性。
与上述方法实施例相对应,本发明实施例还提供一种基于鲁棒特征提取的图像识别装置,可以包括:
训练模块21,用于利用对原始图像训练集中包含原始训练图像样本进行判别特征学习,通过紧凑局部类内散度和分离局部类间散度,完成图像特征学习建模;其中,原始训练样本为具有与该原始训练样本的类别对应的类别标签的样本。基于1范数度量,提升了图像描述的鲁棒性,进而通过优化一个特征分解问题,得到可用于图像样本的二维鲁棒特征提取的投影矩阵;
测试预处理模块22,用于利用投影矩阵对每个原始训练样本进行投影,得到每个原始训练样本的二维鲁棒特征;
测试模块23,用于获取包含有每个原始训练样本的二维鲁棒特征的新训练样本集,并利用新训练样本集构建分类器;利用分类器对待测样本进行分类,得到与待测样本的类别对应的分类结果,其中,待测样本为未知其类别的样本。
需要说明的是,本发明实施例提供的一种基于鲁棒特征提取的图像识别方法,在对样本进行判别特征学习前,还可以根据实际需要对其进行初步处理及参数设置等,如可将样本的大小均设置为一个统一的尺寸等,对应的,本发明实施例提供的一种基于鲁棒特征提取的图像识别方法装置,可以包括训练预处理模块,用于在对样本进行判别特征学习前,还可以根据实际需要对其进行初步处理及参数设置等。
通过对原始训练样本进行判别学习,在紧凑局部类内散度和分离局部类间散度的同时有效保持图像像素间的拓扑结构,设计基于1范数度量的特征学习框架,可输出一个可用于样本内和样本外图像特征提取的投影矩阵,进而通过投影矩阵获取原始训练样本的二维鲁棒特征,构造出可用于对待测样本进行分类的最近邻分类器。可见,本申请中提供的上述方案无需将图像对应的二维矩阵转换到高维的向量空间,而是可直接作用于图像,由此,不但可有效保持图像像素间的拓扑结构和内在相关性,而且可有效降低模型计算过程的复杂度。此外,基于1范数度量,可确保在特征提取过程中对噪音的鲁棒性。可见,本申请中提供的上述方案不仅降低了计算过程的复杂度,保持了图像像素间的拓扑结构、内存关联性,且保持了特征提取过程中对噪音的鲁棒性,因此,本发明提供的上述方案通过直接对图像进行特征提取及分类,有效的提高了识别图像的效率以及对于图像进行分类的准确性,系统性能良好且可扩展性好。
优选的,测试模块可以包括:
测试单元,用于利用投影矩阵对待测样本进行投影,得到待测样本的待测二维鲁棒特征;将待测二维鲁棒特征作为分类器的输入,得到至少一个与待测样本对应的类别,并确定得到的至少一个与待测样本对应的类别中与待测样本的相似性度量最大的类别为待测样本的类别。
优选的,测试单元可以包括:
测试子单元,用于确定待测样本的待测二维鲁棒特征为分类器对应输出的任意输出二维鲁棒特征为其中,d表示一个数量。
利用下列公式确定待测二维鲁棒特征与每个输出二维鲁棒特征之间基于1范数的距离,并确定该距离最小的输出二维鲁棒特征对应的原始训练样本的类别为待测样本的类别:
其中,d(Zi,Zj)表示待测二维鲁棒特征与任意输出二维鲁棒特征之间基于1范数的距离,||·||1表示1范数。
优选的,训练预处理模块可以包括:
投影单元,用于按照下列公式得到原始训练样本的二维鲁棒特征:
Zi=PTAi,i=1,2,…N
其中,Zi表示任一原始训练样本的二维鲁棒特征,Ai表示该原始训练样本,N表示原始训练样本的数量,P表示投影矩阵。
优选的,训练模块可以包括:
确定单元,用于按照下列公式确定类间权重矩阵,并确定该类间权重矩阵为分离局部类间散度:
其中,Bij表示类间权重矩阵,Mi表示i类别对应的平均矩阵,Mj表示j类别对应的平均矩阵,yi为原始训练样本xi的类别标签,yj为原始训练样本xj的类别标签,为矩阵范数;
按照下列公式计算得到类内权重矩阵,并确定该类内权重矩阵为紧凑局部类内散度:
其中,表示类别c中第i个原始训练样本,表示类别c中第j个原始训练样本,为原始训练样本的向量化描述,为原始训练样本的向量化描述,为原始训练样本的近邻集合,表示类内重构权系数,表示类别c中第i个原始训练样本对应的权重矩阵;
训练单元,用于按照下列公式确定投影矩阵:
s.t.PTP=Id×d
其中,P表示投影矩阵,||·||1表示1范数,Mi表示i类别对应的平均矩阵,Mj表示j类别对应的平均矩阵,Bij表示与分离局部类间散度对应的类间权重矩阵,Wij表示与紧凑局部类内散度对应的类内重构权系数,表示类别c中第i个原始训练样本的图像矩阵,表示类别c中第j个原始训练样本的图像矩阵,NC表示类别c中原始训练样本的个数,C表示原始训练集对应的类别的个数,Popt为最优的目标输出,Id×d为尺寸为d*d的单位矩阵。
对于本发明实施例提供的一种基于鲁棒特征提取的图像识别装置,由于其与上述实施例公开的一种基于鲁棒特征提取的图像识别方法,因此,对于其具体说明可参阅上述方法实施例的相关内容。
另外需要说明的是,本发明实施例在3个公开的图像数据库对本发明实施例提供的一种基于鲁棒特征提取的图像识别方法及装置进行测试,包括Columbia Object ImageLibrary(COIL-20)数据集,混合Georgia与Yale人脸图像数据集和混合ORL与Yale人脸图像数据集。其中,COIL-2数据集包括20类目标的1440张图片,Georgia人脸图像数据集包括50位志愿者的750张人脸图片,ORL人脸图像数据集包括40位志愿者的400张人脸图片,包括光照、表情和姿势等改变,Yale人脸图像数据集含有15位志愿者的165幅图,局部志愿者的图像包括了姿势、表情和面部饰物等改变。混合Georgia与Yale人脸图像数据集一个由Georgia人脸图像数据集和Yale人脸图像数据集组合混合而成的混合数据集,包括65人共915幅面部图像。混合ORL与Yale数据集一个由ORL人脸图像数据集和Yale人脸图像数据集组合混合而成的混合数据集,包括55人共565幅面部图像。这些数据库从多方面收集,因而测试结果具有普遍说明性。为了计算高效考虑,在进行测试前,可以对上述图片进行预处理,本例中,具体为:把所有原始的目标由(1024×1×400)变为(32×32×400),选择的特征向量的数量为d=10,每个类别分别选择9个样本作为原始训练样本,剩余样本作为待测样本。
请参阅表1,为本发明与经典的2DPCA、2DLPP、2DOLPP、DLPP-L1方法获取的识别结果对比表。该表给出了各方法在两个公开的数据集测试中得到的平均结果及最好结果。平均结果是基于10次随机的训练集和测试集划分,其中,训练集即为原始训练集,测试集为由待测样本组成的测试集。参与比较的各方法,分别使用各自得到的投影矩阵对待测样本进行特征提取,为公平起见,各方法均采用最近邻分类器进行分类。
表1.识别结果对比表
请参阅附图3,为本发明实施例公开的一种基于鲁棒特征提取的图像识别方法及装置中识别待测样本的类别的识别结果示意图。通过实验结果,可以看出本发明的基于鲁棒特征提取的图像识别方法及装置在一定程度上优于相关的2DPCA、2DLPP、2DONPP及DLPP-L1方法,表现出了较强的稳定性与准确型,体现出一定的优势。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种基于鲁棒特征提取的图像识别方法,其特征在于,包括:
对原始训练集中包含的原始训练样本进行二维判别特征学习,通过紧凑局部类内散度和分离局部类间散度,进行图像特征学习建模,可有效保持图像像素间的拓扑结构和内在相关性;基于1范数度量,提升了图像描述的鲁棒性,进而通过优化一个特征分解问题,得到可用于图像样本的二维鲁棒特征提取的投影矩阵;其中,所述原始训练样本为具有与该原始训练样本的类别对应的类别标签的样本;
获取包含有每个所述原始训练样本的二维鲁棒特征的新训练样本集,并利用所述新训练样本集构建分类器;其中,每个所述原始训练样本的二维鲁棒特征为利用所述投影矩阵对每个所述原始训练样本进行投影得到的;
利用所述分类器对待测样本进行分类,得到与所述待测样本的类别对应的分类结果,其中,所述待测样本为未知其类别的样本;
确定紧凑局部类内散度及分离局部类间散度,包括:
按照下列公式确定类间权重矩阵,并确定该类间权重矩阵为分离局部类间散度:
其中,Bij表示所述类间权重矩阵,Mi表示i类别对应的平均矩阵,Mj表示j类别对应的平均矩阵,yi为原始训练样本xi的类别标签,yj为原始训练样本xj的类别标签,为矩阵范数;
按照下列公式计算得到类内权重矩阵,并确定该类内权重矩阵为紧凑局部类内散度:
其中,表示类别c中第i个原始训练样本,表示类别c中第j个原始训练样本,为原始训练样本的向量化描述,为原始训练样本的向量化描述,为原始训练样本的近邻集合,表示类内重构权系数,表示类别c中第i个原始训练样本对应的权重矩阵。
2.根据权利要求1所述的方法,其特征在于,所述利用所述分类器对待测样本进行分类,得到与所述待测样本的类别对应的分类结果,包括:
利用所述投影矩阵对所述待测样本进行投影,得到所述待测样本的待测二维鲁棒特征;
将所述待测二维鲁棒特征作为所述分类器的输入,得到至少一个与所述待测样本对应的类别,并确定得到的至少一个与所述待测样本对应的类别中与所述待测样本的相似性度量最大的类别为所述待测样本的类别。
3.根据权利要求2所述的方法,其特征在于,确定得到的至少一个与所述待测样本对应的类别中与所述待测样本的相似性度量最大的类别为所述待测样本的类别,包括:
确定所述待测样本的待测二维鲁棒特征为所述分类器对应输出的任意输出二维鲁棒特征为
利用下列公式确定所述待测二维鲁棒特征与每个所述输出二维鲁棒特征之间基于1范数的距离,并确定该距离最小的输出二维鲁棒特征对应的原始训练样本的类别为所述待测样本的类别:
其中,d(Zi,Zj)表示所述待测二维鲁棒特征与任意输出二维鲁棒特征之间基于1范数的距离,||·||1表示1范数。
4.根据权利要求1所述的方法,其特征在于,利用所述投影矩阵对所述原始训练样本进行投影,得到该原始训练样本的二维鲁棒特征,包括:
按照下列公式得到所述原始训练样本的二维鲁棒特征:
Zi=PTAi,i=1,2,…N
其中,Zi表示任一原始训练样本的二维鲁棒特征,Ai表示该原始训练样本,N表示原始训练样本的数量,P表示所述投影矩阵。
5.根据权利要求1所述的方法,其特征在于,获取可用于图像样本的二维鲁棒特征提取的投影矩阵,包括:
按照下列公式确定投影矩阵:
s.t.PTP=Id×d
其中,P表示投影矩阵,||·||1表示1范数,C表示原始训练集对应的类别的个数,Nc表示c类别中包含的原始训练样本的个数,Popt为最优的目标输出,Id×d为尺寸为d*d的单位矩阵,表示类内重构权系数。
6.一种基于鲁棒特征提取的图像识别装置,其特征在于,包括:
训练模块,用于利用对原始图像训练集中包含原始训练图像样本进行判别特征学习,通过紧凑局部类内散度和分离局部类间散度,完成图像特征学习建模;其中,所述原始训练样本为具有与该原始训练样本的类别对应的类别标签的样本;基于1范数度量,提升了图像描述的鲁棒性,进而通过优化一个特征分解问题,得到可用于图像样本的二维鲁棒特征提取的投影矩阵;
测试预处理模块,用于利用所述投影矩阵对每个所述原始训练样本进行投影,得到每个所述原始训练样本的二维鲁棒特征;
测试模块,用于获取包含有每个所述原始训练样本的二维鲁棒特征的新训练样本集,并利用所述新训练样本集构建分类器;利用所述分类器对待测样本进行分类,得到与所述待测样本的类别对应的分类结果,其中,所述待测样本为未知其类别的样本;
所述训练模块包括:
确定单元,用于:按照下列公式确定类间权重矩阵,并确定该类间权重矩阵为分离局部类间散度:
其中,Bij表示所述类间权重矩阵,Mi表示i类别对应的平均矩阵,Mj表示j类别对应的平均矩阵,yi为原始训练样本xi的类别标签,yj为原始训练样本xj的类别标签,为矩阵范数;
按照下列公式计算得到类内权重矩阵,并确定该类内权重矩阵为紧凑局部类内散度:
其中,表示类别c中第i个原始训练样本,表示类别c中第j个原始训练样本,为原始训练样本的向量化描述,为原始训练样本的向量化描述,为原始训练样本的近邻集合,表示类内重构权系数,表示类别c中第i个原始训练样本对应的权重矩阵。
7.根据权利要求6所述的装置,其特征在于,测试模块包括:
测试单元,用于利用所述投影矩阵对所述待测样本进行投影,得到所述待测样本的待测二维鲁棒特征;将所述待测二维鲁棒特征作为所述分类器的输入,得到至少一个与所述待测样本对应的类别,并确定得到的至少一个与所述待测样本对应的类别中与所述待测样本的相似性度量最大的类别为所述待测样本的类别。
8.根据权利要求6所述的装置,其特征在于,训练预处理模块包括:
投影单元,用于按照下列公式得到所述原始训练样本的二维鲁棒特征:
Zi=PTAi,i=1,2,…N
其中,Zi表示任一原始训练样本的二维鲁棒特征,Ai表示该原始训练样本,N表示原始训练样本的数量,P表示所述投影矩阵。
9.根据权利要求6所述的装置,其特征在于,训练模块包括:
训练单元,用于按照下列公式确定投影矩阵:
s.t.PTP=Id×d
其中,P表示投影矩阵,||·||1表示1范数,Mi表示i类别对应的平均矩阵,Mj表示j类别对应的平均矩阵,Bij表示与所述分离局部类间散度对应的类间权重矩阵,表示类别c中第i个原始训练样本的图像矩阵,表示类别c中第j个原始训练样本的图像矩阵,NC表示类别c中原始训练样本的个数,C表示原始训练集对应的类别的个数,Popt为最优的目标输出,Id×d为尺寸为d*d的单位矩阵,表示类内重构权系数。
CN201510882718.2A 2015-12-03 2015-12-03 一种基于鲁棒特征提取的图像识别方法与装置 Active CN105469117B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510882718.2A CN105469117B (zh) 2015-12-03 2015-12-03 一种基于鲁棒特征提取的图像识别方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510882718.2A CN105469117B (zh) 2015-12-03 2015-12-03 一种基于鲁棒特征提取的图像识别方法与装置

Publications (2)

Publication Number Publication Date
CN105469117A CN105469117A (zh) 2016-04-06
CN105469117B true CN105469117B (zh) 2019-01-01

Family

ID=55606788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510882718.2A Active CN105469117B (zh) 2015-12-03 2015-12-03 一种基于鲁棒特征提取的图像识别方法与装置

Country Status (1)

Country Link
CN (1) CN105469117B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106980875A (zh) * 2017-03-13 2017-07-25 南京邮电大学 基于属性低秩表示的零样本图像识别方法
CN108256588A (zh) * 2018-02-12 2018-07-06 兰州工业学院 一种几何图像识别特征提取方法及系统
CN108822186A (zh) * 2018-07-06 2018-11-16 广东石油化工学院 一种分子生物学试验用提取研钵及其提取方法
CN110147725A (zh) * 2019-04-12 2019-08-20 杭州电子科技大学 一种基于正交指数局保投影的高光谱图像特征提取方法
CN111325275B (zh) * 2020-02-20 2023-05-23 南京审计大学 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置
CN113705336B (zh) * 2021-07-15 2024-03-19 南京林业大学 一种灵活切割烟雾鲁棒特征提取方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102208020A (zh) * 2011-07-16 2011-10-05 西安电子科技大学 基于最优维数标度切判据的人脸识别方法
CN104915684A (zh) * 2015-06-30 2015-09-16 苏州大学 一种基于鲁棒多平面支持向量机的图像识别方法及装置
CN104933428A (zh) * 2015-07-23 2015-09-23 苏州大学 一种基于张量描述的人脸识别方法及装置
CN104966075A (zh) * 2015-07-16 2015-10-07 苏州大学 一种基于二维判别特征的人脸识别方法与系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4618098B2 (ja) * 2005-11-02 2011-01-26 ソニー株式会社 画像処理システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102208020A (zh) * 2011-07-16 2011-10-05 西安电子科技大学 基于最优维数标度切判据的人脸识别方法
CN104915684A (zh) * 2015-06-30 2015-09-16 苏州大学 一种基于鲁棒多平面支持向量机的图像识别方法及装置
CN104966075A (zh) * 2015-07-16 2015-10-07 苏州大学 一种基于二维判别特征的人脸识别方法与系统
CN104933428A (zh) * 2015-07-23 2015-09-23 苏州大学 一种基于张量描述的人脸识别方法及装置

Also Published As

Publication number Publication date
CN105469117A (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
CN105469117B (zh) 一种基于鲁棒特征提取的图像识别方法与装置
CN104182765B (zh) 一种互联网图像驱动的三维模型最优视图自动选择方法
CN108319957A (zh) 一种基于超点图的大规模点云语义分割方法
CN110399909A (zh) 一种基于标签约束弹性网图模型的高光谱图像分类方法
US20220222918A1 (en) Image retrieval method and apparatus, storage medium, and device
CN101706780A (zh) 一种基于视觉注意力模型的图像语义检索方法
CN109376787B (zh) 流形学习网络及基于其的计算机视觉图像集分类方法
CN108960288B (zh) 基于卷积神经网络的三维模型分类方法及系统
CN104966075B (zh) 一种基于二维判别特征的人脸识别方法与系统
CN105183795B (zh) 基于内容的遥感图像变化检测信息检索方法
Chen et al. Agricultural remote sensing image cultivated land extraction technology based on deep learning
CN107967461A (zh) Svm 差分模型训练及人脸验证方法、装置、终端及存储介质
Maji et al. Part discovery from partial correspondence
CN104899604B (zh) 一种基于数据集合并的特征级融合方法
Xu et al. Multi-view Feature Learning with Discriminative Regularization.
CN108875448B (zh) 一种行人再识别方法及装置
Zhang et al. l2, 1 norm regularized fisher criterion for optimal feature selection
CN111680579A (zh) 一种自适应权重多视角度量学习的遥感图像分类方法
Rehman et al. Person re-identification post-rank optimization via hypergraph-based learning
CN114782979A (zh) 一种行人重识别模型的训练方法、装置、存储介质及终端
CN114239754A (zh) 基于属性特征学习解耦的行人属性识别方法及系统
Li et al. High performance person re-identification via a boosting ranking ensemble
CN106886754A (zh) 一种基于三角面片的三维场景下的物体识别方法及系统
CN111414958B (zh) 一种视觉词袋金字塔的多特征图像分类方法及系统
Wang et al. Action recognition using linear dynamic systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191112

Address after: 276002 room 1102, unit 2, building 11, Binhe international, the intersection of Binhe Avenue and jinliu Road, Lanshan District, Linyi City, Shandong Province

Patentee after: Shandong Zhijing infinite network technology Co., Ltd

Address before: 215123 No. 199 benevolence Road, Suzhou Industrial Park, Jiangsu, China

Patentee before: Soochow University