CN104616027A - 一种非相邻的图结构稀疏人脸识别方法 - Google Patents

一种非相邻的图结构稀疏人脸识别方法 Download PDF

Info

Publication number
CN104616027A
CN104616027A CN201510063659.6A CN201510063659A CN104616027A CN 104616027 A CN104616027 A CN 104616027A CN 201510063659 A CN201510063659 A CN 201510063659A CN 104616027 A CN104616027 A CN 104616027A
Authority
CN
China
Prior art keywords
sparse
adjacent
search
graph structure
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510063659.6A
Other languages
English (en)
Other versions
CN104616027B (zh
Inventor
蔡体健
谢昕
曾德平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Jiaotong University
Original Assignee
East China Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Jiaotong University filed Critical East China Jiaotong University
Priority to CN201510063659.6A priority Critical patent/CN104616027B/zh
Publication of CN104616027A publication Critical patent/CN104616027A/zh
Application granted granted Critical
Publication of CN104616027B publication Critical patent/CN104616027B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

一种非相邻的图结构稀疏人脸识别方法,该方法包括非相邻的图结构稀疏、分块组合搜索、结构稀疏度的衡量方法和实现结构稀疏重构。所述方法在SRC模型的基础上,通过非相邻的图结构稀疏来增强系统的性能,非相邻图结构的组块是动态的,可重叠的,预先不可知的,组成员可以是不相邻的;为了实现非相邻图结构稀疏,通过组合方法来搜索所有可能的组合,从而获得相邻或非相邻组块;为了避免在搜索中产生组合爆炸,提出分块组合搜索的方法用于限制搜索空间,产生计算上可行的基子集空间;所述方法采用结构贪婪算法来实现非相邻的图结构稀疏重构,算法迭代中,根据基块贡献度大小来选择基块,以编码复杂度来衡量结构稀疏度。本发明可显著提高人脸识别率。

Description

一种非相邻的图结构稀疏人脸识别方法
技术领域
本发明涉及一种非相邻的图结构稀疏人脸识别方法,属稀疏表示人脸识别技术领域。
背景技术
压缩感知(Compressed sensing,CS)针对具有稀疏性或在特定域上具有稀疏性的信号,通过实施远低于奈奎斯特采样率的随机采样,利用信号的稀疏性和测量矩阵与测量基之间的非相干性,可高概率地精确重构原始信号。在压缩感知理论的推动下,近几年,稀疏编码和稀疏表示技术得到了飞速发展。稀疏表示的思想是假设观测数据y∈Rn可表示成数据字典D∈Rn×p的稀疏线性组合,即:y=Dα,式中α∈Rp是y在字典D下的表示系数。基于稀疏表示的人脸识别方法是在已知y和D的条件下,通过压缩感知重构算法求解稀疏表示系数α,再通过分析稀疏表示系数对样本进行判别归类。
稀疏表示的人脸识别技术可以分为传统的稀疏表示人脸识别、非重叠的组结构稀疏人脸识别和可重叠的图结构稀疏人脸识别三个阶段。
传统的稀疏表示分类模型(Sparse Representation-based Classification,SRC)是将一个人脸识别问题转变为一个稀疏表示问题,即将测试数据表示成数据字典的稀疏线性组合,如图1所示。SRC的数据字典是由已知分类的所有类别的训练样本构成,若训练样本有m个类别,每类别有q个训练数据,每个图像被堆叠为一维向量,则数据字典可表示为D=[d11...d1q,......,di1...diq,......,dm1...dmq],式中[di1,...diq]是第i类的训练样本。如果y是第i类的测试数据,则在理想的情况下,通过稀疏重构所获得的表示系数中,字典原子[di1,...diq]所对应的系数项为非零,而其他项为零,即表示系数可表示为:它是稀疏的,平均只有1/m个非零项,测试数据可表示为y=[di1,...,diq][αi1,...,αiq]T。但由于人脸图像都具有类似的特征,使得其他类别所对应的表示系数并不一定为零,因而存在着挑战的问题。
在SRC的基础上,有关文献提出了鲁棒的SRC模型(R-SRC),将噪声的影响考虑进来,则测试数据y=y0+e,y0可表示为训练字典D的稀疏线性组合,噪声e∈Rn可表示为单位矩阵Λ∈Rn×n的稀疏线性组合,将训练字典和单位矩阵合并可构成新的过完备字典基[DΛ],y可表示为新基下的稀疏线性组合,R-SRC模型对噪声和伪装具有很强的鲁棒性。有文献综合了此类稀疏分类模型,将各种保真函数与惩罚函数相结合,得到适合不同条件的人脸识别模型,统称为竞争表示模型(collaborative representation based classification,CRC)。有的文献提出了扩展的SRC模型(ESRC),ESRC模型假设各类别共享相同的环境条件,其字典不仅包含训练样本,还包括各类别的类内差异,ESRC模型可以应用于单个训练样本的场合。
传统的SRC模型将每个字典原子分隔开来,独立处理,没有考虑各原子之间的关系,所产生的稀疏是非结构的。近年来,研究人员根据SRC模型中数据字典的组块结构,提出了组结构的稀疏表示分类模型(Group SparseRepresentation-based Classification,GSRC),此模型利用了数据字典的组块特性,限制了搜索空间,从而提高了人脸识别的性能。但人们也发现如果组块内的成员能互相补充,互相促进,则能增强数据的表示能力;但如果组块内成员的作用互相抵消,则组结构会起到相反的作用。为此人们采用聚类方法或非线性流行学习的方法,将相似的样本进行聚类,然后根据聚类结果将类内样本进一步划分为多个小组,此方法一定程序上可以降低组块划分不当造成的影响。但并不是相似样本构成的组块其表示能力就能增强,组块内成员相似,意味着其产生的作用重复,因此相似样本所起到的作用较小;反而是一些差异较大的样本,由于他们互相补充,其数据表示能力增强较大。另外,如果组块内成员差异较大,也有可能其成员的作用互相抵消,则会降低组块的作用。因此对数据字典进行聚类处理,其作用有限。
图结构是比组结构更一般的数据结构,其组划分是动态的、可重叠的,其组划分预先是不可知的。为了寻找到最佳的组划分,需要通过搜索的方式分析所有可能的组合,这种搜索如果不加限制,则很可能产生组合爆炸,为此一般的图稀疏方法都是限制组成员由相邻元素构成,其组划分的方法就好像是用一个滑动窗口在数据上截取组块,所截取的组块,其成员是由相邻元素构成。一般图结构稀疏方法比较适合自然数据,因为自然数据都具有一定的连续性,由相邻元素构成的组块可以表示具有连续特性的自然数据。然而SRC模型其数据字典并没有这样的连续性,因而一般的图结构稀疏也不适合SRC模型。
发明内容
本发明需要解决的问题包括:如何表示非相邻的图结构?如何搜索表示能力最强的组块?为了避免搜索过程中的组合爆炸,采取什么样的限制策略?使算法既具有可行性,又能寻找到所需要的组块。在算法实现过程中,如何衡量结构稀疏度?并进行量化实现。最后选择哪种压缩感知重构算法?
本发明的技术方案是,本发明一种非相邻的图结构稀疏人脸识别方法包括非相邻的图结构稀疏、分块组合搜索方法、结构稀疏度的衡量方法及实现结构稀疏重构的算法。
本发明方法根据稀疏表示分类模型数据字典的结构特点,通过非相邻的图结构稀疏来增强系统的性能,非相邻图结构的组块是动态的,可重叠的,预先不可知的,组成员可以是不相邻的;为了实现非相邻图结构稀疏,所述方法采用组合搜索的方法获得所有可能的组块,包括相邻或不相邻的组块,从中寻找表示能力最强的组块;为了避免在搜索中产生组合爆炸,所述方法提出分块组合搜索的方法用于限制搜索空间;此外,所述方法还提出以编码复杂度来衡量结构稀疏度,采用结构贪婪算法来实现结构稀疏重构。
本发明是在SRC模型的基础上,利用数据字典中的结构先验知识,通过非相邻的图结构稀疏来提高人脸识别的性能。现有的结构稀疏方案,无论是非重叠的组稀疏,还是可重叠的图稀疏,其组成员都要求是相邻的,这种限制能缩小搜索范围,比较适合具有连续性的自然数据的处理。非相邻的图结构,其与一般的图结构的最大区别在于其组成员可以是不相邻的;一般的图结构稀疏方法为了缩小搜索范围,都要求组块成员是相邻的,这种限制符合一般自然数据的特征,因为自然数据都具有连续性,其组块由相邻元素构成,因此这种限制并不会丢失所需要的组块。但SRC数据字典的排列没有连续的特性,系统所需要的组块很可能是不相邻的,因此这种相邻的组结构或图结构并不适合SRC模型的结构特征。为此本发明提出非相邻的图结构,其组块是动态的,可重叠的,预先不可知的,组成员可以是不相邻的。
为了实现非相邻的图结构稀疏,需要搜索所有可能的组块,包括相邻或非相邻,为此,本发明设计使用组合搜索的方式来搜索所有可能组合。显而易见,如果不加限制,这种组合搜索很容易产生组合爆炸,造成不可行计算。
为了避免搜索过程中的组合爆炸,设计了相应限制策略以缩小搜索范围;首先可以仅搜索固定长度的小组块,把这些小组块作为基块,由基块的联合构成其他形式的组块;若b是基块的索引,B是所有基块的索引集合,称为基子集,则任何一个组块的索引F都能表示为基子集的并集,F=∪b∈Bb。因此仅需要搜索基子集空间,就能搜索到所有需要的组块。
但是通过以上方法所得到的基子集空间仍然是非常庞大的,例如,如果表示系数的维数为300,设置基块大小为3,则其组合数将达到如此大的基子集空间将产生非常大的计算负担,因此需要进一步缩小基子集空间。在数据维数较大时,组合搜索基本是不可行的,但数据维数不高时,组合搜索是可行的。为此可以采用将数据进行分块,再在数据块内进行组合搜索,最后将各数据块的搜索结果合并的方法解决。由于SRC模型的数据字典是按类排列,对应的表示系数可以按类别自然分块,在每个类别的训练样本数不多的情况下,可以对类内系数进行组合搜索,获得所有组合的基块,再将各类别的基块合并成基子集空间。
本发明分块组合搜索方法将数据字典按类别自然分块,再在数据块内进行组合搜索,最后将各数据块的搜索结果合并的方法;这种分块组合搜索所产生的空间是较小的,若表示系数的维数是300,共60个类别,每类别5个样本,每类别长度为3的基块组合共10个,则基子集空间的大小为分块组合搜索的基子集空间远小于不分块的组合搜索。通过以上方法可以极大地缩减搜索空间,将一个NP的组合搜索问题变为一个可行计算。
分块组合搜索的基子集空间虽然减小了,但它并没有丢失SRC模型需要的组块,因为SRC模型所需要的组块,其成员都是由同类的样本构成,分块组合搜索是在同类别的样本中进行组合,因而不会丢失所有可能入选的组块。再者分块组合搜索的基子空间包括不相邻元素构成的基块,因此不管数据字典如何排列,其组块成员都会进入搜索空间,因此数据字典的排列顺序不会影响系统的性能。
为了实现非相邻的图结构稀疏,结构稀疏度的衡量也是一个关键的问题。本发明不是采用常规的复合范数的方法,而是采用编码复杂度来衡量结构稀疏度。结构稀疏度的衡量不仅要考虑信号的支撑集大小,还要考虑数据中组块的多少。这个组块并不一定是连通域,它可以是人为定义的,由分布在不同区域的元素构成。结构稀疏度衡量了数据之间的关联性,实际上,它与信息编码理论中的编码复杂度是相对的概念,只是从不同角度分析了数据之间的相关性。信息编码理论认为给定数据集的任何规律(即关联性)都可以用来压缩数据,也就是说可以用更少的编码来表示数据,即数据之间的关联性越大,其编码复杂度越低。为了描述表示系数的编码复杂度,假设I={1,...,p}是表示系数的索引集,是I任意的稀疏子集,则集合F的编码复杂度可定义为下式:
C(F)=γ|F|+cl(F)
式中,γ是一个可调参数,通常取1,编码复杂度由数据集合的编码长度cl(F)和其支撑集的长度|F|两部分构成。不同的结构,其编码长度的计算方法不同,数据集合的编码长度的计算方法可以通过下式推导出来:
Σ F ⋐ I 2 - cl ( F ) ≤ 1
在信息理论中2-cl(F)被认为是选中F子集的概率下限,即F的编码长度越长,出现F子集的概率就越低。对于标准稀疏,表示系数中每个元素是一个基块,如果表示系数有p个元素,每个元素选中的概率相同,则单元素b选中的概率为1/p,那么2-cl(b)≤1/p,可得到编码长度为cl(b)≥log2p,对于稀疏度为k的表示系数,其编码复杂度为C(F)>klog22p。实际上一些范数惩罚的算法都仅考虑了集合支撑集的长度|F|,而忽略了集合的编码长度。对于组结构稀疏,可以使用组块代替单元素,则常规的编码复杂度将变为块编码复杂度,若表示系数被分成m个定长组,且假设每个组的编码长度相同,则组块b的编码长度为cl(b)≥log2m,若有g个非零组,其编码复杂度为显而易见,组结构稀疏的编码复杂度远小于标准稀疏的编码复杂度。对于图结构稀疏,由于各组长度不同,且组划分预先并不确定,因此不能简单地将各组的分布概率等价处理,对于二维或多维的图稀疏更应考虑每个节点的自由度,为了简化计算,通常采有一些近似公式:C(F)=gln(p)+|F|来近似计算其编码复杂度,其中g为非零组个数。
若采用编码复杂度来衡量结构稀疏度,则结构稀疏的SRC模型可表示为下式:
PC:minC(α)s.t.y=Dα
为了区分各结构稀疏,在以下的描述中,标准稀疏、非重叠的组结构稀疏、一般的图结构稀疏、非相邻的图结构稀疏分别用PC-1、PC-group、PC-graph、PC-unconnected来表示。
为了实现各结构稀疏模型,本发明选用结构贪婪算法(Structured GreedyAlgorithm,SGA)来实现结构稀疏重构。SGA算法在每次迭代中总是选择局部最优的基块进入活动集,为此需要确定基子集空间和基块的选择策略。
基子集的生成是在预处理阶段,不同的结构稀疏具有不同的基子集空间。对于标准稀疏,其基子集空间是由单元素构成;对于非重叠的组结构稀疏,其基子集空间中每个基块都互不重叠,每个组可以由若干个基块构成;对于一般的图结构稀疏,其组块是可重叠的,可以通过一个滑动窗口截取基块;对于非相邻的图结构稀疏,可按照以上所述的分块组合搜索方法,获得相邻或不相邻的基块,形成基子集空间;对于鲁棒的稀疏分类模型,其噪声部分的表示系数可以采用标准稀疏类似的方式处理,然后将两部分基子集联合,构成搜索空间B=Bα∪Be,其中Bα是表示系数α所对应的基子集空间,而Be是噪声部分的表示系数所对应的基子集空间。
SGA算法最关键的部分是基块的选择策略,在算法的每次迭代过程中,需要选择局部最优的基块进入活动集,由于每次进入活动集的元素大小不同,因此不仅要考虑对测试数据的逼近程度,还应考虑基块对表示系数的结构稀疏度的影响。为此本发明提出贡献度的概念,SGA算法根据贡献度的大小来选择基块,各基块贡献度的计算公式如下式所示。
Φ ( b ( k ) ) = | | y - Dα ( k - 1 ) | | 2 2 - | | y - D α ( k ) | | 2 2 C ( α k ) - C ( α k - 1 )
式中,Φ(bk)是基块b第k次迭代所产生的贡献度,αk是第k次迭代的表示系数,C(αk)是表示系数的编码复度度。基块的贡献度是一个比值,分子是添加基块前后的最小二范数差值,以此来度量数据的逼近程度;分母是添加基块前后编码复杂度的差值,以此来衡量结构稀疏程度。SGA算法在每次迭代时总是选择贡献度最大的基块进入活动集。
本发明的有益效果是,本发明可显著地提高人脸识别率。非相邻的图结构包括一般的图结构,也就是说本发明是在更广的范围内寻找表示能力最强的组块,因而在人脸识别过程中,总是能通过分块组合搜索快速找到与测试图像最接近的图像,人脸识别率能显著得到提高。实验一的结果证明非相邻的图结构稀疏人脸识别率高于一般的图结构稀疏、非重叠组稀疏和标准稀疏,其人脸识别错误率分别平均降低了10%、12%、13%。本发明的系统稳定性也得到提高,不受数据字典中原子排列顺序的影响。由于搜索空间中包括非相邻的组块,因此数据字典类内样本排列顺序无论如何改变,需要的组块都能搜索到,因此本发明方法的人脸识别性能不受数据字典排列顺序的影响;反之,一般图稀疏和组稀疏,由于其组块成员限制为由相邻的元素构成,因此,改变原子的排列,就会改变识别效果。实验2中的表1数据表明,类内样本排列的改变会明显影响一般图稀疏和非重叠组稀疏的人脸识别性能,影响率可以达到24%。而非相邻的图稀疏与标准稀疏的识别性能稳定,不受数据字典排列的影响。本发明可有效提高人脸识别的鲁棒性。由于非相邻图结构能寻找到表示能力最强的组块,即使在有噪声的条件下,此优势略有影响,但本发明方法仍取得较好的人脸识别效果。由实验可知,非相邻的图结构稀疏所得到的人脸识别率高于一般的图稀疏、非重叠组稀疏和标准稀疏。
本发明适于稀疏表示的人脸识别。
附图说明
图1为传统的稀疏表示分类模型;
图2本发明技术方案简图;
图3为四种结构稀疏的人脸识别错误率比较图;
图4为四种结构稀疏的识别时间比较图;
图5为平均人脸识别率随噪声大小的变化曲线。
具体实施方式
本发明用于改进SRC模型的人脸识别性能,其具体实施方案是,首先由已知分类的训练样本构成数据字典,所生成的数据字典D∈Rn×p按类排列;然后根据数据字典的结构,利用分块组合搜索生成基子集空间;将数据字典、基子集及测试集作为结构贪婪算法的输入,通过结构贪婪算法求解具有非相邻图结构稀疏的表示系数α;最后计算各类别的非线性逼近误差来进行判别分类。
下面通过一些人脸识别实验来验证本发明方法。数据库选用AR剪裁的人脸库和扩展的YaleB人脸库。AR库中共有100个人的2600张图像,被平分为两个子集,每个子集中每人有一张标准照,以及不同表情、光照、带墨镜、戴围巾的照片各三张;扩展的YaleB人脸库中共有38个人,每人64张图像,共2414张(其中有18张图像损坏)不同光照的人脸图像,根据光照角度不同,所有图像被分为五个子集。为运行方便,所有图片用下采样方式降维,数据字典进行了二范数规范化处理。实验所选用的机器是华硕笔记本电脑,CPU为i7-4700HQ,四核2.4G,4G内存,基于x64处理器的windows8操作系统。
实验1,比较各结构稀疏的人脸识别性能。
此实验比较各种结构稀疏的人脸识别性能,包括本发明提出的非相邻的图结构稀疏PC-unconnected与已有的标准稀疏PC-1、非重叠的组稀疏PC-group、可重叠的图稀疏PC-graph。此实验的训练集是从AR库的子集1中每人选8张图片,包括不同表情、光照、带墨镜、戴围巾的照片各两张,测试集为AR库的子集2中的不同表情、光照、带墨镜、戴围巾的照片。根据字典的结构特点,设置基块的大小为2,非重叠的组结构的组大小也设置为2,采用SGA算法来分别实现四组结构稀疏,并比较其人脸识别错误率,实验结果如图3、图4所示,图3是各类样本在不同结构稀疏下,所产生的平均人脸识别错误率;图4是对应的平均人脸识别时间。由图3、图4可知,在相近的运行时间内,PC-unconnected所得到的人脸识别错误率最低,与PC-graph、PC-group、PC_1相比较,人脸识别错误率分别平均降低了10%、12%、13%。
实验2,训练样本的排列顺序对人脸识别的影响。
此实验验证数据字典中样本的排列顺序对人脸识别性能的影响。本实验使用与实验一相同的实验环境,使用同样的训练集和测试集,仅改变训练集类内样本的排列顺序,比较改变排列前后的人脸识别错误率,实验结果如表1所示。由表1可知,改变样本的排列不会影响PC-unconnected和PC_1的识别性能,此两种方法具有一定的稳定性;但类内样本排列的改变会明显影响PC_graph和PC_group的人脸识别性能,影响率可以达到24%,数据字典排列对系统性能影响较大。
表1 数据字典类内样本改变排列前后的人脸识别错误率
实验3,含噪声的人脸识别。
此实验验证本发明所提出的方法对噪声的鲁棒性能。以下实验使用R-SRC模型来做含噪声的人脸识别实验,模型中噪声部分所对应的表示系数,仅考虑其稀疏性,即其基子集空间仅包含单元素基块。此实验使用扩展的YaleB人脸库,每张图像被处理为132×1像素,训练集是从YaleB的子集1和子集2中每人随机选择9张图片,基块大小设置为3,组大小也设置为3;测试集使用子集3,人为地为每个测试图像添加10%到60%的噪声,每个实验做20次。实验的结果如图5所示,由图可知,在相同条件、同样算法下,PC-unconnected对噪声的鲁棒性能优于其他结构稀疏。
实验4,算法之间的比较
以上实验都是使用SGA算法,本实验使用SGA算法与一些经典的压缩感知重构算法开展比较,包括spgL1、FISTA、OMP等算法。分别选择了AR库和扩展的YaleB库,对于AR库,每人随机抽取9张图片构成训练字典,将字典以外的样本做测试集;对于扩展的YaleB库,每人随机抽取18张图片构成训练字典,其他的做测试集。应用不同的算法实现同样的结构稀疏,比较各算法的人脸识别率和识别时间,结果如表2所示。由表可知,对于非重叠的组结构,无论组大小设置为2或3,SGA算法都取得较好的识别率,而非相邻的图结构稀疏SGA算法又优于组结构的SGA算法;对于标准稀疏,三种算法的识别性能相近。
表2 SGA算法与其他算法的人脸识别率比较

Claims (5)

1.一种非相邻的图结构稀疏人脸识别方法,其特征在于,所述方法包括非相邻的图结构稀疏、分块组合搜索方法、结构稀疏度的衡量方法及实现结构稀疏重构的算法;所述方法根据稀疏表示分类模型数据字典的结构特点,通过非相邻的图结构稀疏来增强系统的性能,非相邻图结构的组块是动态的,可重叠的,预先不可知的,组成员可以是不相邻的;为了实现非相邻图结构稀疏,所述方法采用组合搜索的方法获得所有可能的组块,包括相邻或不相邻的组块,从中寻找表示能力最强的组块;为了避免在搜索中产生组合爆炸,所述方法提出分块组合搜索的方法用于限制搜索空间;此外,所述方法还提出以编码复杂度来衡量结构稀疏度,采用结构贪婪算法来实现结构稀疏重构。
2.根据权利要求1所述的一种非相邻的图结构稀疏人脸识别方法,其特征在于,所述非相邻的图结构,其与一般的图结构的最大区别在于其组成员可以是不相邻的;一般的图结构稀疏方法为了缩小搜索范围,都要求组块成员是相邻的,这种限制符合一般自然数据的特征,因为自然数据都具有连续性,其组块由相邻元素构成,因此这种限制并不会丢失所需要的组块;但是SRC模型的数据字典并没有这样的连续性,系统所需要的组块很可能是不相邻的,因此一般的图结构不符合SRC模型的要求。
3.根据权利要求1所述的一种非相邻的图结构稀疏人脸识别方法,其特征在于,所述分块组合搜索方法是采用组合方法来搜索所有可能的组块,为了避免搜索过程中的组合爆炸,设计了相应限制策略以缩小搜索范围;首先可以仅搜索固定长度的小组块,把这些小组块作为基块,由基块的联合构成其他形式的组块;若b是基块的索引,B是所有基块的索引集合,称为基子集,则任何一个组块的索引F都能表示为基子集的并集,F=∪b∈Bb;因此仅需要搜索基子集空间,就能搜索到所有需要的组块;
所述分块组合搜索方法将数据字典按类别自然分块,再在数据块内进行组合搜索,最后将各数据块的搜索结果合并;这种分块组合搜索所产生的空间是较小的,假如表示系数的维数是300,共60个类别,每类别5个样本,则相应的基子集空间的大小为远小于不分块的组合搜索产生的搜索空间;通过所述方法可以极大地缩减搜索空间,将一个NP的组合搜索问题变为一个可行计算。
4.根据权利要求1所述的一种非相邻的图结构稀疏人脸识别方法,其特征在于,所述结构稀疏度的衡量是采用集合的编码复杂度方法;结构稀疏度衡量了数据之间的关联性,实际上,它与信息编码理论中的编码复杂度是相对的概念,只是从不同角度分析了数据之间的相关性;数据集合的编码复杂度由数据集合的编码长度和其支撑集的长度两部分构成:C(F)=γ|F|+cl(F);不同的结构,其编码复杂度的计算方法不同;对于标准稀疏,表示系数中每个元素是一个基块,如果表示系数有p个元素,稀疏度为k,则表示系数的编码复杂度为C(F)>klog22p;对于组结构稀疏,可以使用组块代替单元素,则常规的编码复杂度将变为块编码复杂度,若表示系数被分成m个定长组,且假设每个组的编码长度相同,共有g个非零组,则其编码复杂度为对于图结构稀疏,常采用近似公式C(F)=g1n(p)+|F|来计算其编码复杂度,其中g为非零组个数。
5.根据权利要求1所述的一种非相邻的图结构稀疏人脸识别方法,其特征在于,所述结构贪婪算法在每次迭代中总是选择局部最优的基块,而不是原子,为此需要确定基子集搜索空间和基块的选择策略;
基子集的产生是在预处理阶段,按照以上所述的分块组合搜索方法,获得相邻或不相邻的基块,形成基子集空间,SGA算法每次迭代总是从基子集空间中选择基块进入活动集;
所述结构贪婪算法的基块选择是根据基块的贡献度大小,贡献度的计算公式如下式所示:
Φ ( b k ) = | | y - Dα k - 1 | | 2 2 - | | y - Dα k | | 2 2 C ( α k ) - C ( α k - 1 )
式中,Φ(bk)是基块b第k次迭代所产生的贡献度,αk是第k次迭代的表示系数,C(αk)是表示系数的编码复杂度;基块的贡献度是一个比值,分子是添加基块前后的最小二范数差值,以此来度量数据的逼近程度;分母是添加基块前后编码复杂度的差值,以此来衡量结构稀疏程度;所述结构贪婪算法在每次迭代时总是选择贡献度最大的基块进入活动集。
CN201510063659.6A 2015-02-06 2015-02-06 一种非相邻的图结构稀疏人脸识别方法 Expired - Fee Related CN104616027B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510063659.6A CN104616027B (zh) 2015-02-06 2015-02-06 一种非相邻的图结构稀疏人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510063659.6A CN104616027B (zh) 2015-02-06 2015-02-06 一种非相邻的图结构稀疏人脸识别方法

Publications (2)

Publication Number Publication Date
CN104616027A true CN104616027A (zh) 2015-05-13
CN104616027B CN104616027B (zh) 2018-09-11

Family

ID=53150464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510063659.6A Expired - Fee Related CN104616027B (zh) 2015-02-06 2015-02-06 一种非相邻的图结构稀疏人脸识别方法

Country Status (1)

Country Link
CN (1) CN104616027B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056074A (zh) * 2016-05-27 2016-10-26 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于区域稀疏的单张训练样本人脸识别方法
CN108509833A (zh) * 2017-12-21 2018-09-07 苏州大学 一种基于结构化分析字典的人脸识别方法、装置及设备
CN109146797A (zh) * 2018-06-15 2019-01-04 闽南师范大学 一种基于Lp伪范数与交叠组稀疏的脉冲噪声古籍图像修复方法
CN109255770A (zh) * 2018-07-16 2019-01-22 电子科技大学 一种新型图像变换域降采样方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103632138A (zh) * 2013-11-20 2014-03-12 南京信息工程大学 一种低秩分块稀疏表示的人脸识别方法
CN103793694A (zh) * 2014-02-10 2014-05-14 天津大学 一种基于多特征空间稀疏分类器的人脸识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103632138A (zh) * 2013-11-20 2014-03-12 南京信息工程大学 一种低秩分块稀疏表示的人脸识别方法
CN103793694A (zh) * 2014-02-10 2014-05-14 天津大学 一种基于多特征空间稀疏分类器的人脸识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JUNZHOU HUANG 等: ""Learning with Structured Sparsity"", 《ICML’09 PROCEEDINGS OF THE 26TH ANNIAL INTERNATIONAL CONFERENCE ON MACHINE LEARNING》 *
RODOLPHE JENATTON 等: ""Structured Variable Selection with Sparisity Inducing Norms"", 《JOURNAL OF MACHINE LEARNING RESEARCHING》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056074A (zh) * 2016-05-27 2016-10-26 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于区域稀疏的单张训练样本人脸识别方法
CN108509833A (zh) * 2017-12-21 2018-09-07 苏州大学 一种基于结构化分析字典的人脸识别方法、装置及设备
CN108509833B (zh) * 2017-12-21 2021-11-05 苏州大学 一种基于结构化分析字典的人脸识别方法、装置及设备
CN109146797A (zh) * 2018-06-15 2019-01-04 闽南师范大学 一种基于Lp伪范数与交叠组稀疏的脉冲噪声古籍图像修复方法
CN109255770A (zh) * 2018-07-16 2019-01-22 电子科技大学 一种新型图像变换域降采样方法

Also Published As

Publication number Publication date
CN104616027B (zh) 2018-09-11

Similar Documents

Publication Publication Date Title
CN111667884B (zh) 基于注意力机制使用蛋白质一级序列预测蛋白质相互作用的卷积神经网络模型
CN104050247B (zh) 实现海量视频快速检索的方法
CN108280187B (zh) 一种基于卷积神经网络深度特征的分级图像检索方法
CN106096066A (zh) 基于随机近邻嵌入的文本聚类方法
Wei et al. Analysis and improvement of low rank representation for subspace segmentation
Wang et al. NNMF-based factorization techniques for high-accuracy privacy protection on non-negative-valued datasets
CN109241813B (zh) 基于判别稀疏保持嵌入的非约束人脸图像降维方法
CN109657011A (zh) 一种筛选恐怖袭击事件犯罪团伙的数据挖掘方法及系统
CN105844261A (zh) 基于优化特征投影矩阵的3d掌纹稀疏表示识别方法
CN104616027A (zh) 一种非相邻的图结构稀疏人脸识别方法
Sánchez et al. Efficient algorithms for a robust modularity-driven clustering of attributed graphs
Bruzzese et al. DESPOTA: DEndrogram slicing through a pemutation test approach
CN109582743A (zh) 一种针对恐怖袭击事件的数据挖掘方法
CN105046286A (zh) 基于自动视图生成和联合l1,2范数最小化的监督多视图特征选择方法
CN112861965B (zh) 基于多特征交叉一致性模型的图像匹配方法
CN114970684A (zh) 一种结合vae的提取网络核心结构的社区检测方法
US20230259818A1 (en) Learning device, feature calculation program generation method and similarity calculator
Xia et al. On the substructure countability of graph neural networks
Khotilin The technology of constructing an informative feature of a natural hyperspectral image area for the classification problem
Syahrir et al. Improvement of Apriori Algorithm Performance Using the TID-List Vertical Approach and Data Partitioning.
Guo et al. Semantic-driven automatic filter pruning for neural networks
CN113326791B (zh) 基于鲁棒性自适应图结构学习算法的人脸识别方法
CN103488997A (zh) 基于各类重要波段提取的高光谱图像波段选择方法
CN103678551B (zh) 一种基于随机稀疏编码的大规模医学图像检索方法
Zeng et al. Hand-written numeral recognition based on spectrum clustering

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180911

Termination date: 20190206

CF01 Termination of patent right due to non-payment of annual fee