CN108229512B

CN108229512B - 一种基于非负表示系数的两阶段识别方法

Info

Publication number: CN108229512B
Application number: CN201611196713.5A
Authority: CN
Inventors: 陈才扣; 李经善; 王蓉; 王禹
Original assignee: Yangzhou University
Current assignee: Yangzhou University
Priority date: 2016-12-22
Filing date: 2016-12-22
Publication date: 2021-10-08
Anticipated expiration: 2036-12-22
Also published as: CN108229512A

Abstract

本发明提出一种基于非负表示系数的两阶段识别方法。包括：用所有训练样本线性表示测试样本且约束表示系数非负，计算系数向量；将系数向量中元素降序排列，抽取出较大的系数及其对应的训练样本；将上一步所得的训练样本分类，计算每类样本的重构图像；用所有重构图像线性表示测试样本且约束表示系数非负，计算系数向量，根据残差对测试样本分类。本发明根据一定的筛选条件择优选取训练样本并用其线性表示测试样本，从而提高识别率。

Description

一种基于非负表示系数的两阶段识别方法

技术领域

本发明属于机器学习技术领域，具体涉及一种基于非负表示系数的两阶段识别方法。

背景技术

特征抽取在模式识别领域非常重要。主成分分析(Principle ComponentAnalysis,PCA)和线性鉴别分析(Linear Discriminant Analysis,LDA)作为经典的线性特征抽取方法，被广泛使用。PCA和LDA方法最终都需依赖于分类器将测试样本分类，其中应用较为广泛的分类器如最近邻(Nearest Neighbor,NN)，该分类器目的是将测试样本分类到与之距离最近的训练样本所属类别。

最新提出的稀疏表示作为人脸识别领域中的一个新方法，其基本思想是给定足够的训练样本，任何测试样本都可由训练样本的线性组合来表示，且大多数项的系数为零或接近零，只有同类样本的系数较大。John Wright等人提出的稀疏表示分类(Sparserepresentation classification,SRC)方法已被广泛使用，但由于该方法需计算l₁范数，因此计算过程复杂、耗时长。基于此，Lei Zhang等学者提出协同表达分类(Collaborativerepresentation based classification,CRC)方法，该方法克服了SRC方法存在的计算速度慢的缺点，但是，从非负矩阵分解的角度来看，在CRC中的负值不具有任何物理意义，这些正是CRC等算法的缺点和不足，而本发明方法希望解决该缺点。

发明内容

本发明的目的在于提供一种基于非负表示系数的两阶段识别方法，其根据一定的筛选条件择优选取训练样本并用其线性表示测试样本，从而提高识别率。

为了解决上述技术问题，本发明提供一种基于非负表示系数的两阶段识别方法，

第一阶段，用所有训练样本x_ij表示测试样本y且约束系数非负，并根据非负系数模型计算获得表示系数向量w；

第二阶段，取出表示系数向量w中前n个最大元素及其所对应的原始训练样本x₁,x₂,…,x_n，并用前n个最大元素对应的训练样本x₁,x₂,…,x_n组成字典矩阵D_new，对字典矩阵D_new中的全部样本进行分类，将所有属于第i类的训练样本组成字典矩阵D_i，同时，从表示系数向量w中抽取出字典矩阵D_i中各训练样本所对应的表示系数并组成表示系数向量α_i；使用公式z_j＝D_jα_j计算获得每类样本对应的重构样本z_j；用重构样本z_j表示测试样本y且约束系数非负，并根据非负系数模型计算获得表示系数向量b；根据测试样本y的残差对测试样本y进行分类。

本发明与现有技术相比，其显著优点在于：

(1)本发明在原CRC方法的基础上增加非负约束，构造非负表示系数模型，非负表示向量保证算法中系数具有物理意义，可以更好地反映数据点之间的依赖关系；

(2)本发明根据一定条件筛选出较为优秀的训练样本，使得分类结果更加精准；

(3)本发明.最终可以产生分类器，切合实际，计算机运行速度快，运用两阶段识别较为精确。

附图说明

图1是本发明方法流程示意图。

图2是本发明实施例所使用的训练样本。

具体实施方式

容易理解，依据本发明的技术方案，在不变更本发明的实质精神的情况下，本领域的一般技术人员可以想象出本发明基于非负表示系数的两阶段识别方法的多种实施方式。因此，以下具体实施方式和附图仅是对本发明的技术方案的示例性说明，而不应当视为本发明的全部或者视为对本发明技术方案的限制或限定。

本发明所述基于非负表示系数的两阶段识别方法，包括：用所有训练样本线性表示测试样本且约束表示系数非负，计算系数向量；将系数向量中元素降序排列，抽取出较大的系数及其对应的训练样本；将上一步所得的训练样本分类，计算每类样本的重构图像；用所有重构图像线性表示测试样本且约束表示系数非负，计算系数向量，根据残差对测试样本分类。

实施例

本实施例采用FERET人脸数据库作为实验数据。FERET人脸库是一个包含200个人，且每人7张人脸图像的数据库。为了验证本发明的有效性与实用性，本发明分别选取每人的前m＝1,2,3,4,5幅图像作为训练样本，并将每人剩余的7-m幅图像作为测试样本，这样训练样本总数为200×m，测试样本总数为200×(7-m)。本实施例中的作为训练样本的某张人脸前七张图像如图1所示。

本实施例中，进行如下定义：

设x_ij为p维列向量且表示第i类的第j个原始训练样本，i＝1,2,…,c,j＝1,2,…,n_i，其中，n_i为每类训练样本数，N＝n₁+n₂+…+n_c为训练样本总数，训练样本数据集D＝[D₁,D₂,…,D_c]∈R^p×N，其中，

为第i类训练样本矩阵，y为测试样本，R为欧式空间。

基于上述假设，本实施例所示的基于非负表示系数的两阶段识别方法的详细步骤如下：

第一阶段

本阶段的工作是，用所有原始训练样本表示测试样本且约束系数非负，根据非负系数模型计算获得第一阶段表示系数向量w。

根据稀疏表示思想，足够多的训练样本能近似表示测试样本，且除与测试样本同类的训练样本表示系数较大外，其余表示系数近似为0，现对每个用原始训练样表示测试样本的表示系数附加非负约束，给出如下非负系数模型：

其中D＝[x₁,x₂,…,x_N]为由原始训练样本组成的字典矩阵，本发明中称之为第一阶段字典矩阵，N为训练样本总数，λ₁为一个小的正常数，w为用原始训练样本组成字典矩阵D表示测试样本y时的表示系数向量，且第一阶段w＝[w₁,w₂,…,w_N]^T，w₁,w₂,…,w_N为各个用原始训练样表示原始测试样本的表示系数。

第二阶段

第二阶段分为以下几步：

2.1将表示系数向量w中的元素降序排列；

2.2取出前n个最大元素及其所对应的原始训练样本，设x₁,x₂,…,x_n为前n个表示系数最大的原始训练训练样本，

2.3用x₁,x₂,…,x_n组成第二阶段字典矩阵D_new＝[x₁,x₂,…,x_n]，将第二阶段字典矩阵D_new中所有经第一阶段处理得到的训练样本x₁,x₂,…,x_n分类，具体为：

第二阶段字典矩阵D_new中用所有属于第一类的样本组成字典矩阵D₁，所有属于第二类的样本组成字典矩阵D₂，……，所有属于第c类的样本组成字典矩阵D_c，若D_new中没有属于第i类(i＝1,2,…,c)的训练样本，则D_i＝0。同时，从第一阶段的系数向量w中抽取出字典矩阵D₁中各训练样本对应的表示系数组成的表示系数向量α₁；同样的，字典矩阵D₂对应的表示系数向量α₂；……；字典矩阵D_c对应的表示系数向量α_c。

2.4使用公式z_j＝D_jα_j计算第二阶段字典矩阵D_new中每类第二阶段得到的经第一阶段处理得到的训练样本的重构样本z_j，其中，j＝1,2,…,c；

2.5将所有重构样本z_j组成重构样本矩阵Z＝[z₁,z₂,…,z_c]。用重构样本z₁,z₂,…,z_c线性表示测试样本，即y＝Zb，其中b＝[b₁,b₂,…,b_c]^T为第二阶段表示系数，对其附加非负约束，有非负系数模型：

其中，λ₂为一个小的正常数。

2.6计算出第二阶段系数向量b，并根据测试样本残差对测试样本y进行分类，根据测试样本残差对测试样本y进行分类的方法为，b_j使测试样本残差最小时对应的t即为分类，使测试样本残差最小，若有下式成立：

则测试样本y所属类别为第t类。

Claims

1.一种基于非负表示系数的两阶段识别方法，其特征在于，

第二阶段，将表示系数向量w中的元素降序排列，取出表示系数向量w中前n个最大元素及其所对应的原始训练样本x₁，x₂，…，x_n，并用前n个最大元素对应的训练样本x₁，x₂，…，x_n组成字典矩阵D_new，对字典矩阵D_new中的全部样本进行分类，将所有属于第i类的训练样本组成字典矩阵D_i，同时，从表示系数向量w中抽取出字典矩阵D_i中各训练样本所对应的表示系数并组成表示系数向量α_i；使用公式z_j＝D_jα_j计算获得每类样本对应的重构样本z_j；用重构样本z_j表示测试样本y且约束系数非负，并根据非负系数模型计算获得表示系数向量b；根据测试样本y的残差对测试样本y进行分类；

其中，x_ij为第i类的第j个训练样本，i＝1，2，…，c；j＝1，2，…，n_i；c为训练样本总类数，n_i为每类训练样本的总个数；

用所有训练样本x_ij表示测试样本y且约束系数非负的非负系数模型为：

s.t w_i≥0，i＝1，2，…，N

其中D为由训练样本x_ij组成的字典矩阵，N为训练样本总数，λ₁为一个小的正常数，w_i为表示系数向量w中的元素；

用重构样本z_j表示测试样本y且约束系数非负的非负系数模型为：

s.tb_i≥0，i＝1，2，…，c

其中，Z为所有重构样本z_j组成重构样本矩阵，λ₂为一个小的正常数，b_i为表示系数向量b中的元素；

所述根据测试样本残差对测试样本y进行分类的方法为，b_j使测试样本残差最小时对应的t即为分类，使测试样本残差最小，若有下式成立：

则测试样本y所属类别为第t类。