CN103927529B

CN103927529B - 一种最终分类器的获得方法及应用方法、系统

Info

Publication number: CN103927529B
Application number: CN201410185212.1A
Authority: CN
Inventors: 张莉; 夏佩佩; 王邦军; 何书萍; 杨季文; 李凡长
Original assignee: Suzhou University
Current assignee: Suzhou University
Priority date: 2014-05-05
Filing date: 2014-05-05
Publication date: 2017-06-16
Anticipated expiration: 2034-05-05
Also published as: CN103927529A

Abstract

本发明公开了一种基于相似性学习的人脸集匹配方法及系统，首先通过选取部分样本作为训练样本，进行训练过程，实现对分类器的选取，避免了将所有的样本作为训练样本进行训练，并对训练集样本进行降维处理，得到降维训练样本，避免了高维数据对计算复杂度的增加，减少了训练周期，从而简化了训练过程，避免了复杂的过程，提高了训练速度。另外，本方案中通过选取训练集样本每类样本的几何平均值来构建多个不同的分类器，达到了通过简单的操作过程带来精确的结果的效果。

Description

一种最终分类器的获得方法及应用方法、系统

技术领域

本发明涉及分类器及人脸匹配领域，尤其涉及一种获取基于相似性学习的最终分类器的方法及应用该最终分类器的人脸集匹配方法及系统。

背景技术

传统的计算机视觉分类系统中，目标的训练和测试过程通常采用单幅图像。

然而，采用单幅图像作为摄像机及大容量存储设备的输入以供其训练和测试，其识别效果对光照、姿势、表情等较为敏感，系统的鲁棒性较弱。

因此，为解决采用单幅图像作为设备的输入以供其训练和测试的匹配方式带来的系统的鲁棒性较弱的问题，本领域技术人员通过采用图像集合作为整体输入的匹配方式及系统，与采用单幅图像的匹配方式相比，采用图像集合可以充分利用多幅图像提供的信息，以获得更好的匹配和识别精度，可以在很大程度上避免各因素的影响，提高系统的鲁棒性。

相似性学习是机器学习和模式识别领域很多任务的重要基础，利用相似性学习进行模式分类中，选择合适的相似度量是问题的关键。通常采用支持向量机在差空间中进行相似性学习。

然而，随着原始样本空间的增加，差空间的样本对数量也会增加，导致算法复杂度的增加，导致分类器的执行速度变慢，并且，对支持向量机而言，高维数据会带来计算复杂度的增加，使其执行过程繁琐，周期变长。

发明内容

有鉴于此，本发明提供一种获取基于相似性学习的最终分类器的方法及应用该最终分类器的人脸集匹配方法及系统，以解决现有技术中分类器的执行速度变慢，高维数据带来的计算复杂度的增加，导致执行过程繁琐、周期变长的问题，其具体方案如下：

一种获得基于相似性学习的最终分类器的方法，包括：

从原始数据样本库中选取训练集样本和测试集样本，其中，所述原始数据样本库中包含多类样本；

根据训练集样本获得变换矩阵，根据变换矩阵的转置得到训练集样本的降维训练样本；

从所述降维训练样本中挑选多组训练样本，每组训练样本包含两个训练样本，计算每组训练样本的真实相似度；

对所述降维训练样本中任意两类不同样本进行分队，每队样本包含两个不同类的降维训练样本，并获取每队样本的几何平均值，根据所述几何平均值获取所述每组训练样本的计算相似度；

比较所述计算相似度与真实相似度，得到错误率，根据所述错误率选取最终分类器。

进一步的，根据所述错误率选取最终分类器，具体包括：

根据所述错误率获取分类器的权值，根据所述分类器的权值，选取最终分类器，具体的，

选取对应权值大于平均权值的分类器作为最终分类器；

对所述最终分类器的权值进行归一化，使得所述最终分类器的权值和为1。

进一步的，获得降维训练样本的过程，具体包括：

由训练集样本确定训练样本矩阵；

由训练样本矩阵确定邻接矩阵，并由所述邻接矩阵确定其对应的对角矩阵，获得计算矩阵；

对所述计算矩阵进行特征分解，获得特征值及其对应的特征矢量；

取负的特征值所对应的特征矢量组成变换矩阵；

根据训练样本矩阵中的样本及所述变换矩阵的转置，获得所述降维训练样本。

一种应用最终分类器的人脸集匹配方法，包括：

比较所述计算相似度与真实相似度，得到错误率，根据所述错误率选取最终分类器；

获取所述训练样本集中每类样本的几何平均值；

根据所述最终分类器以及所述训练样本集中每类样本的几何平均值、每个测试样本，获取分类结果；

依据所述分类结果，按照预定规则获取每类测试样本的类别。

进一步的，获得降维训练样本的过程，具体包括：

由训练集样本确定训练样本矩阵；

取负的特征值所对应的特征矢量组成变换矩阵；

进一步的，根据所述错误率选取最终分类器，具体包括：

选取对应权值大于平均权值的分类器作为最终分类器；

进一步的，依据所述分类结果，按照预定规则获取每类测试样本的类别，具体包括：

依据所述分类结果，获取所述测试样本中被测样本与训练样本中每一类的相似性大小；

选取所述相似性大小所占比例多的类别作为被测样本的分类。

进一步的，所述根据所述几何平均值获取所述每组训练样本的计算相似度，具体包括：

根据所述几何平均值，采用余弦相似性获取每组训练样本的计算相似度。

一种应用最终分类器的人脸集匹配系统，包括：选择模块，与所述选择模块相连的降维模块，与所述选择模块相连的训练预处理模块，与所述训练预处理模块相连的训练模块，与所述训练模块相连的测试预处理模块，与所述测试预处理模块相连的测试模块，

所述选择模块从原始数据样本库中选取训练集样本和测试集样本，其中，所述原始数据样本库中包含多类样本；

所述降维模块根据训练集样本获得变换矩阵，根据所述变换矩阵的转置得到训练集样本的降维训练样本；

所述训练预处理模块从所述降维训练样本中挑选多组训练样本，每组训练样本包含两个训练样本，计算每组训练样本的真实相似度；

所述训练模块对降维训练样本中任意两类不同类样本进行分队，每队样本包含两个不同类的降维训练样本，并获取每队样本的几何平均值，根据所述几何平均值获取所述每组训练样本的计算相似度，比较所述计算相似度与真实相似度，得到错误率，根据所述错误率选取最终分类器；

所述测试预处理模块获取所述降维训练样本中每类样本的几何平均值以及每个测试样本；

所述测试模块根据所述测试预处理模块获取的降维训练样本中每类样本的几何平均值以及每个测试样本，获取所述最终分类器的分类结果，并依据分类结果，按照预定规则获取每类测试样本的类别。

进一步的，所述训练模块根据所述错误率选取最终分类器，具体包括：

所述训练模块根据所述错误率获取分类器的权值，根据所述分类器的权值，选取最终分类器，具体的，选取对应权值大于平均权值的分类器作为最终分类器，并对所述最终分类器的权值进行归一化，使得所述最终分类器的权值和为1。

从上述技术方案可以看出，本方案首先通过选取部分样本作为训练样本，进行训练过程，实现对分类器的选取，避免了将所有的样本作为训练样本进行训练，并对训练集样本进行降维处理，得到降维训练样本，避免了高维数据对计算复杂度的增加，减少了训练周期，从而简化了训练过程，避免了复杂的过程，提高了训练速度。另外，本方案中通过选取训练集样本每类样本的几何平均值来构建多个不同的分类器，达到了通过简单的操作过程带来精确的结果的效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例公开的一种获得基于相似性学习的最终分类器的方法的流程图；

图2为本发明实施例公开的一种获得基于相似性学习的最终分类器的方法的流程图；

图3为本发明实施例公开的一种应用最终分类器的人脸集匹配方法的流程图；

图4为本发明实施例公开的一种应用最终分类器的人脸集匹配系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本实施例公开了一种获得基于相似性学习的最终分类器的方法，其流程图如图1所示，包括：

步骤S11、从原始数据样本库中选取训练集样本和测试集样本；

其中，原始数据样本库中包含多类样本，每类样本含有多个原始数据样本。从原始数据样本库中任意选取一部分作为训练集样本，一部分作为测试集样本，优选的，训练集样本可以占原始数据样本库中数据的一半，测试集样本占原始数据样本库中数据的一半。

例如：原始样本数据库中包含有564张图像，共20个人的图像，即20类，涵盖了不同的种族、性别及外貌，该原始样本数据库中对每个人拍摄的图像都有从侧面到正面的不同角度的连续姿态变化。

实验中，从20类样本中随机选取一半作为训练集样本，另一半作为测试集样本。

步骤S12、根据训练集样本获得变换矩阵，根据变换矩阵的转置得到训练集样本的降维训练样本；

步骤S13、从降维训练样本中挑选多组训练样本，计算每组训练样本的真实相似度；

每组训练样本包含两个训练样本，其中，选取的每组训练样本为随机选取，与训练样本的类别无关，可以直接获得每组样本中两个训练样本的真实的相似度。

步骤S14、对降维训练样本中任意两类不同样本进行分队，每队样本包含两个不同类的降维训练样本，获取每队样本的几何平均值，根据几何平均值获取每组训练样本的计算相似度；

从降维训练样本中选取任意两类训练样本，每类训练样本选取其中的一个训练样本，组成一队，获取其几何平均值，由于其获取的几何平均值为原始数据样本库中任选的两个不同类训练样本，根据该几何平均值计算得到的每组训练样本的计算相似度为随机的，其可能相似，也可能不相似，因此，将该计算相似度与真实相似度进行比较。

根据几何平均值，采用余弦相似性获取每组训练样本的计算相似度，采用余弦相似性有效的避免了由于样本数的增加，导致的差空间中的样本存在明显不平衡的问题。

其具体公式如下：

其中，sim表示相似性，sgn表示符号函数，m_k表示每队样本的几何平均值，x_i及表示每组训练样本中的两个训练样本。

当sim大于0时，表示两个训练样本x_i及是相似的，否则，不相似。

步骤S15、比较计算相似度与真实相似度，得到错误率，根据错误率选取最终分类器。

只有当错误率低于一定的数值时，其对应的分类器才能够被选择为最终分类器。

不同的训练样本所产生的分类器是不同的，因此，最终分类器的个数是不定的。

具体的，根据错误率获取分类器的权值，根据分类器的权值，选取最终的分类器。

错误率与分类器权值的计算公式如下：

其中，err_k为错误率，α_k为分类器权值。

其中，选取对应权值大于平均权值的分类器作为最终分类器，对最终分类器的权值进行归一化，使得最终分类器的权值和为1。

本实施例公开的获取基于相似性学习的最终分类器的方法，首先通过选取部分样本作为训练样本，进行训练过程，实现对分类器的选取，并对原始数据样本库中的样本进行降维处理，得到降维训练样本，避免了高维数据对计算复杂度的增加，减少了训练周期，避免了将所有的样本作为训练样本进行训练，从而简化了训练过程，避免了复杂的过程，提高了训练速度。另外，本方案中通过选取训练集样本每类样本的几何平均值来构建多个不同的分类器，达到了通过简单的操作过程带来精确的结果的效果。

本实施例公开了一种获得降维训练样本的方法，其流程图如图2所示，包括：

步骤S21、由训练集样本确定训练样本矩阵；

设已有的训练集样本的图像数据为构造训练样本矩阵，为X＝[x₁,x₂,…，x₂₈₂]，其中，R为实数。

步骤S22、由训练样本矩阵确定邻接矩阵，并由邻接矩阵确定其对应的对角矩阵，获得计算矩阵；

上述训练样本矩阵对应的邻接矩阵为：

其中，当x_i和x_j同类并且为近邻时，F_ij＝+1；当x_i和x_j不同类且为近邻时，F_ij＝-1；其他情况下，F_ij＝0。

另外，选取对角矩阵S，其中，

选取同一类的训练样本，获得其中任意两个样本之间的距离，并对同一类内所有任意两个样本之间的距离求和，得到第一数据；

选取不同类的训练样本，获得其中任意两个样本之间的距离，并对该不同类的所有任意两个样本之间的距离求和，得到第二数据；

计算第一数据与第二数据的差。

那么，经过上述过程得到的计算矩阵为X(S-F)X。

步骤S23、对计算矩阵进行特征分解，获得特征值及其对应的特征矢量；

其中，特征矢量记为p_i,i＝1,…,282。

步骤S24、取负的特征值所对应的特征矢量组成变换矩阵；

假设所有负的特征值的个数为d，那么变换矩阵记为P＝[p_i,…,p_d]。

步骤S25、根据训练样本矩阵中的样本及变换矩阵的转置，获得降维训练样本。

降维训练样本记为其中，其中，P^T表示转置。

本实施例公开了一种获得降维训练样本的方法，通过对训练样本矩阵的邻接矩阵及对角矩阵的相关计算，得到计算矩阵，并进行特征分解，获得变换矩阵，进而获得降维训练样本的过程，有效实现了对样本数据的降维处理，避免了高维数据对计算复杂度的增加，减少了训练周期。

本实施例公开了一种应用最终分类器的人脸集匹配方法，其流程图如图3所示，包括：

步骤S31、从原始数据样本库中选取训练集样本和测试集样本；

其中，原始数据样本库中包含多类样本。

步骤S32、根据训练集样本获得变换矩阵，根据变换矩阵的转置得到训练集样本的降维训练样本；

步骤S33、从降维训练样本中挑选多组训练样本，计算每组训练样本的真实相似度；

每组训练样本包含两个训练样本。

步骤S34、对降维训练样本中任意两类不同样本进行分队，每队样本包含两个不同类的降维训练样本，获取每队样本的几何平均值，根据几何平均值获取每组训练样本的计算相似度；

其具体公式如下：

步骤S35、比较计算相似度与真实相似度，得到错误率，根据错误率选取最终分类器；

错误率与分类器权值的计算公式如下：

其中，err_k为错误率，α_k为分类器权值。

步骤S36、获取训练样本集中每类样本的几何平均值；

步骤S37、根据最终分类器以及训练样本集中每类样本的几何平均值、每个测试样本，获取分类结果；

步骤S38、依据分类结果，按照预定规则获取每类测试样本的类别。

本实施例公开的应用最终分类器的人脸集匹配方法，通过选取部分样本作为训练样本，进行训练过程，实现对分类器的选取，并对原始数据样本库中的样本进行降维处理，得到降维训练样本，避免了高维数据对计算复杂度的增加，减少了训练周期，避免了将所有的样本作为训练样本进行训练，从而简化了训练过程，避免了复杂的过程，提高了训练速度。另外，本方案中通过选取训练集样本每类样本的几何平均值来构建多个不同的分类器，达到了通过简单的操作过程带来精确的结果的效果，进而实现了对人脸集数据的分类，过程简单、精确。

进一步的，本实施例公开的应用最终分类器的人脸集匹配方法中，获得降维训练样本的过程，具体包括：

由训练集样本确定训练样本矩阵；

由训练样本矩阵确定邻接矩阵，并由邻接矩阵确定其对应的对角矩阵，获得计算矩阵；

对计算矩阵进行特征分解，获得特征值及其对应的特征矢量；

取负的特征值所对应的特征矢量组成变换矩阵；

根据训练样本矩阵中的样本及变换矩阵的转置，获得降维训练样本。

具体的，设已有的训练集样本的图像数据为构造训练样本矩阵，为X＝[x₁,x₂,…，x₂₈₂]，其中，R为实数。

上述训练样本矩阵对应的邻接矩阵为：

另外，选取对角矩阵S，其中，

计算第一数据与第二数据的差。

那么，经过上述过程得到的计算矩阵为X(S-F)X。

其中，特征矢量记为p_i,i＝1,…,282。

降维训练样本记为其中，其中，P^T表示转置。

优选的，本实施例公开的应用最终分类器的人脸集匹配方法中，依据分类结果，按照预定规则获取每类测试样本的类别，具体包括：

依据分类结果，获取测试样本中被测样本与训练样本中每一类的相似性大小，选取相似性大小所占比较较多的类别作为被测样本的分类，即通过相似性大小的比例获取被测样本的分类。

本实施例公开了一种应用最终分类器的人脸集匹配系统，其结构示意图如图4所示，包括：

选择模块41，与选择模块41相连的降维模块42，与所述降维模块42相连的训练预处理模块43，与训练预处理模块43相连的训练模块44，与训练摸44相连的测试预处理模块45，与测试预处理模块45相连的测试模块46。

选择模块41从原始数据样本库中选取训练集样本和测试集样本，其中，原始数据样本库中包含多类样本。

降维模块42根据训练集样本获得变换矩阵，根据变换矩阵的转置得到训练集样本的降维训练样本。

训练预处理模块43从降维训练样本中挑选多组训练样本，每组训练样本包含两个训练样本，计算每组训练样本的真实相似度。

训练模块44对降维训练样本中任意两类不同类样本进行分队，每队样本包含两个不同类的降维训练样本，并获取每队样本的几何平均值，根据几何平均值获取每组训练样本的计算相似度，比较计算相似度与真实相似度，得到错误率，根据错误率选取最终分类器。

其具体公式如下：

其中，错误率与分类器权值的计算公式如下：

其中，err_k为错误率，α_k为分类器权值。

测试预处理模块45获取降维训练样本中每类样本的几何平均值以及每个测试样本。

测试模块46根据测试预处理模块45获取的降维训练样本中每类样本的几何平均值及每个测试样本，获取最终分类器的分类结果，并依据分类结果，按照预定规则获取每类测试样本的类别。

本本实施例公开的应用最终分类器的人脸集匹配系统，通过选择模块选取部分样本作为训练样本，降维模块对训练样本进行降维处理，并通过训练模块进行训练的过程，实现对分类器的选取，避免了将所有的样本作为训练样本进行训练，并对原始数据样本库中的样本进行降维处理，得到降维训练样本，避免了高维数据对计算复杂度的增加，减少了训练周期，从而简化了训练过程，避免了复杂的过程，提高了训练速度。另外，本方案中通过选取训练集样本每类样本的几何平均值来构建多个不同的分类器，达到了通过简单的操作过程带来精确的结果的效果，进而通过测试模块实现了对人脸集数据的分类，过程简单，准确。

优选的，本实施例公开的训练模块根据错误率选取最终分类器，具体为：

训练模块根据错误率获取分类器的权值，根据分类器的权值，选取最终分类器，具体的，从众多分类器中选取对应权值大于平均权值的分类器作为最终分类器，并对最终分类器的权值进行归一化，使得最终分类器的权值和为1。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种获得基于相似性学习的最终分类器的方法，其特征在于，包括：

对所述降维训练样本中任意两类不同样本进行分队，每队样本包含两个不同类的降维训练样本，并获取每队样本的几何平均值，根据所述几何平均值，采用余弦相似性获取所述每组训练样本的计算相似度；

2.根据权利要求1所述的方法，其特征在于，根据所述错误率选取最终分类器，具体包括：

选取对应权值大于平均权值的分类器作为最终分类器；

3.根据权利要求1所述的方法，其特征在于，获得降维训练样本的过程，具体包括：

由训练集样本确定训练样本矩阵；

取负的特征值所对应的特征矢量组成变换矩阵；

4.一种应用最终分类器的人脸集匹配方法，其特征在于，包括：

获取所述训练样本集中每类样本的几何平均值；

5.根据权利要求4所述的方法，其特征在于，获得降维训练样本的过程，具体包括：

由训练集样本确定训练样本矩阵；

取负的特征值所对应的特征矢量组成变换矩阵；

6.根据权利要求4所述的方法，其特征在于，根据所述错误率选取最终分类器，具体包括：

选取对应权值大于平均权值的分类器作为最终分类器；

7.根据权利要求4所述的方法，其特征在于，依据所述分类结果，按照预定规则获取每类测试样本的类别，具体包括：

8.根据权利要求4所述的方法，其特征在于，所述根据所述几何平均值获取所述每组训练样本的计算相似度，具体包括：

9.一种应用最终分类器的人脸集匹配系统，其特征在于，包括：选择模块，与所述选择模块相连的降维模块，与所述降维模块相连的训练预处理模块，与所述训练预处理模块相连的训练模块，与所述训练模块相连的测试预处理模块，与所述测试预处理模块相连的测试模块，

所述训练模块对降维训练样本中任意两类不同类样本进行分队，每队样本包含两个不同类的降维训练样本，并获取每队样本的几何平均值，根据所述几何平均值，采用余弦相似性获取所述每组训练样本的计算相似度，比较所述计算相似度与真实相似度，得到错误率，根据所述错误率选取最终分类器；

10.根据权利要求9所述的系统，其特征在于，所述训练模块根据所述错误率选取最终分类器，具体包括：