CN107451538A

CN107451538A - 基于加权最大间距准则的人脸数据可分性特征提取方法

Info

Publication number: CN107451538A
Application number: CN201710568584.6A
Authority: CN
Inventors: 刘敬; 邱程程; 刘逸; 吴进; 刘鑫磊; 李梦岩; 张延冬
Original assignee: Xian University of Posts and Telecommunications
Current assignee: Xian University of Posts and Telecommunications
Priority date: 2017-07-13
Filing date: 2017-07-13
Publication date: 2017-12-08

Abstract

本发明公开了一种基于加权最大间距准则的人脸数据可分性特征提取方法，主要解决已有最大间距准则MMC特征提取用非常有限的训练样本无法较为准确地估计超高维空间样本的真实散布，导致了MMC所提取的特征推广能力差，最终影响了分类的准确率的问题。其实现方案是：1)计算原始数据的类间散布矩阵S_b和类内散布矩阵S_w；2)对类间和类内散布矩阵加权，得到加权最大间距准则WMMC函数；3)最大化WMMC准则函数，得出映射矩阵；4)将原始数据映射到WMMC子空间；5)在WMMC子空间分类。本发明能在超高维小样本情况下，提取出推广能力强的可分性特征，从而提高人脸识别率，可用于超高维小样本数据的可分性特征提取。

Description

基于加权最大间距准则的人脸数据可分性特征提取方法

技术领域

本发明属于图像处理技术领域，更进一步涉及人脸数据可分性特征提取方法，可用于超高维小样本数据的可分性特征提取。

背景技术

近年来，人脸识别技术是一个研究的热点。人脸数据与普通数据相比，具有超高维小样本的特点。由于人脸数据维数过高，等于图像像素个数，常达几千上万维；而样本个数常为几十个，相对于维数过低，使得人脸数据处理起来比较困难。通常在采用人脸数据进行分类之前需要对原始数据进行特征提取处理，以降低维数并提高人脸识别效率，因此人脸数据的特征提取技术也越来越多。数据的可分性特征提取技术，是指通过某种变换将原始数据映射到低维特征子空间，使得数据在该低维子空间获得较好的可分性。可分性特征提取方法常用于人脸识别领域，可降低维数，提高分类识别率和分类速度。

基于Fisher准则的线性判别分析LDA是经典的可分性特征提取方法，LDA将高维的原始样本投影到低维特征子空间，使得在子空间中数据的类间散布与类内散布之比最大。LDA的解为的前d个最大特征值对应的特征向量，S_w和S_b分别为原始空间数据的类内散布矩阵和类间散布矩阵。但是，对于超高维小样本数据，即训练样本数量远小于原始数据的维数时，会造成类内散布矩阵奇异，其逆矩阵不存在，使得LDA不能直接求解的前d个最大特征值对应的特征向量。

为了解决LDA存在的小样本问题，最大间距准则MMC方法被提出。MMC是一种比较新的可分性特征提取方法，MMC针对小样本情况下LDA因类内散布矩阵奇异而无法求解的缺点，将目标函数更改为特征子空间中类间散布与类内散布之差最大。因此，求解MMC无需计算S_w的逆，从根本上解决了小样本情况下Fisher准则因类内散布矩阵奇异而无法求解的问题。

基于MMC的人脸数据可分性特征提取方法近年来应用得越来越广泛。MMC方法与传统的LDA方法相比，可以从根本上解决小样本情况下的求解问题，基于MMC的特征提取技术也得到越来越多的应用。

但是，基于MMC的人脸数据可分性特征提取方法存在的不足之处是：人脸数据的维数高达几千甚至上万维，而样本个数往往仅为几十个，采用MMC提取人脸数据特征时，仅根据目前有限的训练样本估计数据的散布，由于样本个数与数据维数相差悬殊，用非常有限的训练样本无法较为准确地估计超高维空间样本的真实散布，导致了MMC所提取的特征推广能力差，最终影响了分类的准确率。

发明内容

本发明的目的在于针对上述现有技术的不足，提出一种基于加权最大间距准则的人脸数据可分性特征提取方法，以获得推广能力高的可分性特征，提高人脸识别精度。

本发明的技术思路是，通过将实际的数据散布考虑得更差的思想对超高维小样本人脸数据进行特征提取，认为实际的数据散布类间更聚集，类内更分散，即实际的类间散布比当前用有限的训练样本所计算的类间散布矩阵S_b反映得更小，实际的类内散布比当前用有限的训练样本所计算的类内散布矩阵S_w反映得更大。通过分别对类间散布矩阵S_b乘以小于1的权重，对类内散布矩阵S_w乘以大于1的权重，并结合MMC提出新的准则函数用于人脸数据的可分性特征提取，提取出推广能力强的可分性特征，从而提高人脸识别率。其实现步骤包括如下：

(1)将给定的人脸数据集划分为训练样本和测试样本，用训练样本计算原始数据的类间散布矩阵S_b和类内散布矩阵S_w；

(2)对类间散布矩阵S_b乘以小于1的权重α_b，对类内散布矩阵S_w乘以大于1的权重α_w，得出加权最大间距准则WMMC函数：

J(W)＝tr[W^T(α_bS_b-α_wS_w)W]，

其中，tr表示矩阵的迹，即矩阵主对角线元素的和，T表示矩阵的转置，α_b表示S_b的权重，α_w表示S_w的权重，且0＜α_b≤1，1≤α_w；

(3)求解加权最大间距准则WMMC函数中的映射矩阵W：

3a)在以W各列为基向量所支撑的特征子空间各维正交归一化作为约束条件，最大化WMMC函数，得到最优化模型：

其中，w_k表示W的列向量，为正交归一化约束条件，d表示特征子空间维数；

3b)利用拉格朗日乘数法，对最优化模型进行求解，得到映射矩阵W，该W的各列即为WMMC所提取的人脸数据的可分性特征。

本发明与现有的技术相比具有以下优点：

1.提取出人脸数据可分性特征具有更强的推广能力。

现有的超高维小样本情况下的特征提取技术，仅利用极为有限的训练样本，来估计数据的真实散布，造成所提取特征推广能力差的问题；本发明将实际数据的散布考虑得更差，即认为实际数据散布类间更聚集，类内更分散，从而可以在超高维小样本空间提取出推广能力更强的人脸数据可分性特征。

2.提高了人脸识别精度。

现有最大间距准则特征提取方法无法用训练样本的类间散布矩阵和类内散布矩阵，对超高维小样本情况下数据真实散布进行准确估计；本发明在超高维小样本情况下，通过对类间散布矩阵减小权重和对类内散布矩阵增大权重，实现将实际的数据散布考虑得更差，提出了新的准则函数，使得本发明提取出了推广能力更强的人脸数据可分性特征，从而提高了人脸识别精度。

附图说明

图1是本发明的实现流程图；

图2是仿真实验中用本发明WMMC方法和现有MMC方法对ORL数据进行特征提取后的识别结果图。

图3是仿真实验中采用本发明WMMC方法和现有MMC方法对Yale数据进行特征提取后的识别结果图。

具体实施方式

参照图1，本发明中基于加权最大间距准则的人脸数据的特征提取方法包括如下：

步骤1，计算原始人脸数据的类间散布矩阵S_b和类内散布矩阵S_w。

将原始人脸数据划分为训练样本和测试样本，用训练样本计算原始数据的类间散布矩阵S_b和类内散布矩阵S_w，其计算公式如下:

其中，C表示样本的类别数，P_i表示第i类训练样本的先验概率，其通过该类训练样本个数除以总训练样本个数估计得到，即P_i＝N_i/N，N表示总训练样本个数；N_i表示第i类训练样本的个数；m_i表示第i类训练样本的均值向量，表示第i类的第j个训练样本；m表示训练样本的整体均值向量，

步骤2，对类间和类内散布矩阵加权，得到加权最大间距准则WMMC函数。

对类间散布矩阵S_b乘以小于1的权重α_b，对类内散布矩阵S_w乘以大于1的权重α_w，得出加权最大间距准则WMMC函数：

其中，tr表示矩阵的迹，即矩阵主对角线元素的和；T表示矩阵的转置，α_b表示S_b的权重，α_w表示S_w的权重，且0＜α_b≤1，1≤α_w；

权重系数α_b和α_w的选取分三种情况：

第一种情况：固定α_w＝1，令10^-3≤α_b＜1，即将实际类间散布考虑得更差；

第二种情况：固定α_b＝1，令1＜α_w≤10³，即将实际类内散布考虑得更差；

第三种情况：同时改变α_b和α_w，令10^-3≤α_b＜1且1＜α_w≤10³，即将实际类间散布和类内散布均考虑得更差。

步骤3，求解加权最大间距准则WMMC函数中的映射矩阵W。

3b)利用拉格朗日乘数法，对最优化模型进行求解，得到映射矩阵W，实现步骤如下：

3b1)利用拉格朗日乘数法，构造拉格朗日函数：

3b2)用拉格朗日函数L(w_k,λ_k)对w_k求偏导数，令其偏导数为0，即

由式<2>得到(α_bS_b-α_wS_w)w_k＝λ_kw_k，则

其中，λ_k是(α_bS_b-α_wS_w)的特征值，w_k是该特征值对应的特征向量，由式<3>说明[w₁,w₂,...,w_k,...,w_d]矢量集为特征方程(α_bS_b-α_wS_w)w_k＝λ_kw_k的前d个最大特征值对应的特征向量；

对(α_bS_b-α_wS_w)进行特征值分解，取前d个最大特征值对应的特征向量w₁,w₂,...,w_k,...,w_d构成WMMC映射矩阵的各列，即W＝[w₁,w₂,...,w_k,...,w_d]。

步骤4，将原空间的训练样本和测试样本映射到WMMC特征子空间，得到映射后的样本y：

y＝W^Tx

其中x为原空间中任意样本。

本发明的效果可通过以下仿真实验进一步说明：

1.仿真实验条件

仿真实验环境：操作系统为Windows 7，CPU为2.50GHz，内存为4.0GB，编程平台为MATLAB R2014a。

主要采用的分类器：最小距离MD分类器和k近邻kNN分类器，kNN分类器中的距离选取余弦距离，近邻个数k取10。

实验采用的人脸数据包括ORL人脸数据和Yale人脸数据，其中：

ORL人脸库由40人组成，每人10幅大小为32×32的图像共400幅人脸图像数据，数据维数为1024维，随机选取每人的5张、6张、7张图像作为训练样本，其余作为测试样本；

Yale人脸库由15人组成，每人11幅大小为32×32的图像共165幅人脸图像数据，数据维数为1024维，随机选取每人的5张、6张、7张图像作为训练样本，其余作为测试样本；

2.仿真实验内容

仿真实验一，用本发明分别采用MD分类器和kNN分类器对ORL人脸数据进行分类识别，结果如图2，其中：

图2(a)为10^-3≤α_b≤1时采用MD分类器进行分类识别的识别率变化曲线图，

图2(b)为10^-3≤α_b≤1时采用kNN分类器进行分类识别的识别率变化曲线图，

图2(c)为1≤α_w≤10³时采用MD分类器进行分类识别的识别率变化曲线图，

图2(d)为1≤α_w≤10³时采用kNN分类器进行分类识别的识别率变化曲线图。

从图2(a)和图2(b)可以看出，当α_b＝1时即为MMC特征提取方法，随着α_b的减小，本发明方法的识别率随之增大且明显高于MMC方法对应的识别率，当权重α_b减小到一定程度后，对识别率没有影响，可选一个合适的权值作为该情况下的最优权值。

从图2(c)和图2(d)可以看出，当α_w＝1时即为MMC特征提取方法，随着α_w的增大，本发明方法的识别率随之增大且明显高于MMC方法对应的识别率，当权重α_w增大到一定程度后，对识别率没有影响，可选一个合适的权值作为该情况下的最优权值。

仿真实验二，用本发明分别采用MD分类器和kNN分类器对Yale人脸数据进行分类识别，结果如图3，其中：

图3(a)为10^-3≤α_b≤1时采用MD分类器进行分类识别的识别率变化曲线图，

图3(b)为10^-3≤α_b≤1时采用kNN分类器进行分类识别的识别率变化曲线图，

图3(c)为1≤α_w≤10³时采用MD分类器进行分类识别的识别率变化曲线，

图3(d)为1≤α_w≤10³时采用kNN分类器进行分类识别的识别率变化曲线图。

从图3(a)和图3(b)可以看出，当α_b＝1时即为MMC特征提取方法，随着α_b的减小，本发明方法的识别率随之增大且明显高于MMC方法对应的识别率，当权重α_b减小到一定程度后，对识别率没有影响，可选一个合适的权值作为该情况下的最优权值。

从图3(c)和图3(d)可以看出，当α_w＝1时即为原MMC特征提取方法，随着α_w的增大，本发明方法的识别率随之增大且明显高于MMC方法对应的识别率，当权重α_w增大到一定程度后，对识别率没有影响，可选一个合适的权值作为该情况下的最优权值。

3.统计出上述实验的平均识别率

对上述仿真实验一和仿真实验二中的数据均进行20次分类，统计出平均识别率，如下表所示。其中：

表1和表2分别为本发明在权重α_b取0.1至1，步长为0.1，固定权重α_w＝1不变的条件下，采用MD分类器和kNN分类器对ORL人脸数据分类识别后的平均识别率；

表3和表4分别为本发明在权重α_w取1至10，步长为1，固定权重α_b＝1不变的条件下，采用MD分类器和kNN分类器对ORL人脸数据分类识别后的平均识别率。

表5和表6分别为用本发明采用MD分类器和kNN分类器对ORL人脸数据分类识别后的平均识别率，其中，本发明权重α_b取0.1至1，步长为0.1，当α_b每取一个值时，依次将权重α_w从1至10取值且步长为1，直至α_b取到1，由于篇幅有限仅取部分权值下对应的分类结果。

表7和表8分别为本发明在权重α_b取0.1至1，步长为0.1，固定权重α_w＝1不变的条件下，采用MD分类器和kNN分类器对Yale人脸数据分类识别后的平均识别率。

表9和表10分别为本发明在权重α_w取1至10，步长为1，固定权重α_b＝1不变的条件下，采用MD分类器和kNN分类器对Yale人脸数据分类识别后的平均识别率。

表11和表12分别为用本发明采用MD分类器和kNN分类器对Yale人脸数据分类识别后的平均识别率，其中，本发明权重α_b取0.1至1，步长为0.1，当α_b每取一个值时，依次将权重α_w从1至10取值且步长为1，直至α_b取到1，由于篇幅有限仅取部分权值下对应的分类结果。

表1 ORL人脸数据在MD分类器下的识别率(％)

表2 ORL人脸数据在kNN分类器下的识别率(％)

由表1和表2可以看出，在不同训练样本数下，当α_b＝0.1时，用本发明进行分类识别后的识别率均最高。用本发明采用MD分类器的识别率比MMC分别提高了4.43、5.22和4.58个百分点；用本发明采用kNN分类器时的识别率比MMC分别提高了8.58、7.53和6.12个百分点。

表3 ORL人脸数据在MD分类器下的识别率(％)

表4 ORL人脸数据在kNN分类器下的识别率(％)

由表3和表4可以看出，在不同训练样本数下，当α_w＝10时，用本发明进行分类识别后的识别率均最高。用本发明采用MD分类器的识别率比MMC分别提高了4.43、5.22和4.58个百分点；用本发明采用kNN分类器时的识别率比MMC分别提高了8.53、7.57和6.12个百分点。

表5 ORL人脸数据在MD分类器下的识别率(％)

表6 ORL人脸数据在kNN分类器下的识别率(％)

由表5和表6可以看出，在本发明WMMC方法将类内和类间散布都考虑得更差的情况下，对ORL人脸数据的识别率比采用MMC方法有明显提高。当α_b＝0.3，α_w＝8时，用本发明采用MD分类器的识别率比MMC分别提高了5.03、5.53和4.62个百分点；用本发明采用kNN分类器时的识别率比MMC分别提高了9.03、8.5、6.12个百分点。

表7 Yale人脸数据在MD分类器下的识别率(％)

表8 Yale人脸数据在kNN分类器下的识别率(％)

由表7和表8可以看出，在不同训练样本数下，当α_b＝0.1时，用本发明进行分类识别后的识别率均最高。用本发明采用MD分类器的识别率比MMC分别提高了8.6、7.16和6.92个百分点；用本发明采用kNN分类器时的识别率比MMC分别提高了9.13、8.09和8个百分点。

表9 Yale人脸数据在MD分类器下的识别率(％)

表10 Yale人脸数据在kNN分类器下的识别率(％)

由表9和表10可以看出，在不同训练样本数下，当α_w＝10时，用本发明进行分类识别后的识别率均最高。用本发明采用MD分类器的识别率比MMC分别提高了8.6、7.16和6.89个百分点；用本发明采用kNN分类器时的识别率比MMC分别提高了9.59、8.25和8.08个百分点。

表11 Yale人脸数据在MD分类器下的识别率(％)

表12 Yale人脸数据在kNN分类器下的识别率(％)

由表11和表12可以看出，在本发明WMMC方法将类内和类间散布都考虑得更差的情况下，对Yale人脸数据的识别率比采用MMC方法有明显提高。当α_b＝0.3，α_w＝8时，用本发明采用MD分类器的识别率比MMC分别提高了9.8、8.5和7.75个百分点；采用kNN分类器时的识别率比MMC分别提高了10.13、9.25和8.42个百分点。

Claims

1.一种基于加权最大间距准则的人脸数据可分性特征提取方法，包括：

J(W)＝tr[W^T(α_bS_b-α_wS_w)W]，

(3)求解加权最大间距准则WMMC函数中的映射矩阵W：

<mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>d</mi> </munderover> <msubsup> <mi>w</mi> <mi>k</mi> <mi>T</mi> </msubsup> <mrow> <mo>(</mo> <msub> <mi>&alpha;</mi> <mi>b</mi> </msub> <msub> <mi>S</mi> <mi>b</mi> </msub> <mo>-</mo> <msub> <mi>&alpha;</mi> <mi>w</mi> </msub> <msub> <mi>S</mi> <mi>w</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>w</mi> <mi>k</mi> </msub> </mrow>

2.根据权利要求1所述的方法，其特征在于，步骤(1)中用训练样本计算原始数据的类间散布矩阵S_b和类内散布矩阵S_w，分别采用如下公式计算:

<mrow> <msub> <mi>S</mi> <mi>b</mi> </msub> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>C</mi> </munderover> <msub> <mi>P</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>m</mi> <mi>i</mi> </msub> <mo>-</mo> <mi>m</mi> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>m</mi> <mi>i</mi> </msub> <mo>-</mo> <mi>m</mi> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mo>,</mo> </mrow>

<mrow> <msub> <mi>S</mi> <mi>w</mi> </msub> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>C</mi> </munderover> <mfrac> <msub> <mi>P</mi> <mi>i</mi> </msub> <msub> <mi>N</mi> <mi>i</mi> </msub> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>N</mi> <mi>i</mi> </msub> </munderover> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mi>i</mi> </msubsup> <mo>-</mo> <msub> <mi>m</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mi>i</mi> </msubsup> <mo>-</mo> <msub> <mi>m</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mo>,</mo> </mrow>

3.根据权利要求1所述的方法，其特征在于，步骤(2)中加权最大间距准则WMMC函数,采用如下公式计算：

<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>J</mi> <mrow> <mo>(</mo> <mi>W</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>t</mi> <mi>r</mi> <mo>&lsqb;</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <mrow> <mo>(</mo> <msub> <mi>&alpha;</mi> <mi>b</mi> </msub> <msub> <mi>S</mi> <mi>b</mi> </msub> <mo>-</mo> <msub> <mi>&alpha;</mi> <mi>w</mi> </msub> <msub> <mi>S</mi> <mi>w</mi> </msub> <mo>)</mo> </mrow> <mi>W</mi> <mo>&rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>d</mi> </munderover> <msubsup> <mi>w</mi> <mi>k</mi> <mi>T</mi> </msubsup> <mrow> <mo>(</mo> <msub> <mi>&alpha;</mi> <mi>b</mi> </msub> <msub> <mi>S</mi> <mi>b</mi> </msub> <mo>-</mo> <msub> <mi>&alpha;</mi> <mi>w</mi> </msub> <msub> <mi>S</mi> <mi>w</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>w</mi> <mi>k</mi> </msub> <mo>;</mo> <mn>0</mn> <mo><</mo> <msub> <mi>&alpha;</mi> <mi>b</mi> </msub> <mo>&le;</mo> <mn>1</mn> <mo>,</mo> <mn>1</mn> <mo>&le;</mo> <msub> <mi>&alpha;</mi> <mi>w</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced>

其中，权重系数α_b和α_w的选取分三种情况：

4.根据权利要求1所述的方法，其特征在于，步骤3b)中利用拉格朗日乘数法，对最优化模型进行求解，得到映射矩阵W，实现步骤如下：

3b1)利用拉格朗日乘数法，构造拉格朗日函数：

<mrow> <mi>L</mi> <mrow> <mo>(</mo> <msub> <mi>w</mi> <mi>k</mi> </msub> <mo>,</mo> <msub> <mi>&lambda;</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>d</mi> </munderover> <msubsup> <mi>w</mi> <mi>k</mi> <mi>T</mi> </msubsup> <mrow> <mo>(</mo> <msub> <mi>&alpha;</mi> <mi>b</mi> </msub> <msub> <mi>S</mi> <mi>b</mi> </msub> <mo>-</mo> <msub> <mi>&alpha;</mi> <mi>w</mi> </msub> <msub> <mi>S</mi> <mi>w</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>w</mi> <mi>k</mi> </msub> <mo>-</mo> <msub> <mi>&lambda;</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <msubsup> <mi>w</mi> <mi>k</mi> <mi>T</mi> </msubsup> <msub> <mi>w</mi> <mi>k</mi> </msub> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mo><</mo> <mn>1</mn> <mo>></mo> </mrow>

<mrow> <mfrac> <mrow> <mo>&part;</mo> <mi>L</mi> <mrow> <mo>(</mo> <msub> <mi>w</mi> <mi>k</mi> </msub> <mo>,</mo> <msub> <mi>&lambda;</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&part;</mo> <msub> <mi>w</mi> <mi>k</mi> </msub> </mrow> </mfrac> <mo>=</mo> <mn>2</mn> <mrow> <mo>(</mo> <msub> <mi>&alpha;</mi> <mi>b</mi> </msub> <msub> <mi>S</mi> <mi>b</mi> </msub> <mo>-</mo> <msub> <mi>&alpha;</mi> <mi>w</mi> </msub> <msub> <mi>S</mi> <mi>w</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>w</mi> <mi>k</mi> </msub> <mo>-</mo> <mn>2</mn> <msub> <mi>&lambda;</mi> <mi>k</mi> </msub> <msub> <mi>w</mi> <mi>k</mi> </msub> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mo><</mo> <mn>2</mn> <mo>></mo> </mrow>

由式<2>得到(α_bS_b-α_wS_w)w_k＝λ_kw_k，则

<mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>d</mi> </munderover> <msubsup> <mi>w</mi> <mi>k</mi> <mi>T</mi> </msubsup> <mrow> <mo>(</mo> <msub> <mi>&alpha;</mi> <mi>b</mi> </msub> <msub> <mi>S</mi> <mi>b</mi> </msub> <mo>-</mo> <msub> <mi>&alpha;</mi> <mi>w</mi> </msub> <msub> <mi>S</mi> <mi>w</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>w</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>m</mi> <mi>a</mi> <mi>x</mi> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>d</mi> </munderover> <msub> <mi>&lambda;</mi> <mi>k</mi> </msub> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mo><</mo> <mn>3</mn> <mo>></mo> </mrow>

其中，λ_k是(α_bS_b-α_wS_w)的特征值，w_k是该特征值对应的特征向量，由式<3>说明[w₁,w₂,...,w_k,...,w_d]矢量集为特征方程(α_bS_b-α_wS_w)w_k＝λ_kw_k的前d个最大特征值对应的特征向量，将(α_bS_b-α_wS_w)特征值分解，取前d个最大特征值对应的特征向量w₁,w₂,...,w_k,...,w_d构成WMMC映射矩阵的各列，即W＝[w₁,w₂,...,w_k,...,w_d]；

3b3)将原空间的训练样本和测试样本映射到WMMC特征子空间，得到映射后的样本y：

y＝W^Tx

其中x为原空间中任意样本。