CN115169436A

CN115169436A - 一种基于模糊局部判别分析的数据降维方法

Info

Publication number: CN115169436A
Application number: CN202210673065.7A
Authority: CN
Inventors: 王靖宇; 尹恒姮; 聂飞平; 李学龙
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2022-06-14
Filing date: 2022-06-14
Publication date: 2022-10-11

Abstract

本发明涉及一种基于模糊局部判别分析的数据降维方法，构建数据矩阵、标签矩阵并进行数据预处理，建立基于模糊局部判别分析的数据降维模型，求解数据降维模型，取最后一次迭代得到的矩阵作为最终投影矩阵，则降维后的数据矩阵为

将

去中心化得到最终的投影结果Z。本发明降低计算复杂度和参数冗余度，同时保留每个类别的聚类结构。该算法在最优子空间中对每个类别进行模糊聚类，以适应同一类别的多模态数据，克服噪声和冗余特征的影响。此外，通过引入正则化最大总体散度，对投影矩阵施加正交约束，增强算法对数据的全局信息表征能力。

Description

一种基于模糊局部判别分析的数据降维方法

技术领域

本发明属于机器学习领域，涉及一种基于模糊局部判别分析的数据降维方法。

背景技术

随着计算机科学的发展，人们从各领域获取的原始数据存在维度高、冗余度高和分布复杂等特征，不仅计算效率低，还会导致“维数灾难”问题。数据降维方法通过将原始高维数据映射至低维空间，并保留原始空间的结构特征，达到减轻计算负担和提高泛化性能的效果。目前，数据降维技术已广泛应用于计算机视觉、模式识别和医疗等领域。近来，基于局部判别分析的有监督数据降维方法由于对有噪声数据和非高斯分布数据具有鲁棒性，能同时探究样本的局部和全局结构，相比于传统的线性判别分析方法(Linear DiscriminantAnalysis,LDA)具有更好的实践推广性能，受到研究人员的极大关注，并在高光谱图像处理、遥感图像分类等场景取得成功应用。

姚裕等人(《鲁棒的非负监督低秩鉴别嵌入算法》，智能科学与技术学报,2021,3(03):342-350.)将散度矩阵的判别信息与非负矩阵分解相结合，保留了数据的局部和全局特征，并通过L₁范数约束增强了噪声的稀疏性和鲁棒性。此外，该方法还引入了图嵌入理论与低秩表示以表征局部信息，避免了人工选择近邻参数的影响。然而，该模型本身是一个非确定性多项式(Non-deterministic Polynomial,NP)问题，在求解时将其近似约化为凸优化问题，难以得到准确的最优解。另外整个算法流程需要交替迭代优化七个变量，且模型参数复杂，计算难度大，无法在实际场景中大量应用。

现有的局部判别分析方法大多通过高斯核函数或k近邻方法在原始空间构造所有样本点之间的相似图，不仅参数调节困难，计算复杂度高，还容易受到原始空间中噪声和冗余特征的干扰。

发明内容

要解决的技术问题

为了避免现有技术的不足之处，本发明提出一种基于模糊局部判别分析的数据降维方法，降低计算复杂度和参数冗余度，同时保留每个类别的聚类结构。该算法在最优子空间中对每个类别进行模糊聚类，以适应同一类别的多模态数据，克服噪声和冗余特征的影响。此外，通过引入正则化最大总体散度，对投影矩阵施加正交约束，增强算法对数据的全局信息表征能力。

技术方案

一种基于模糊局部判别分析的数据降维方法，其特征在于步骤如下：

步骤1、对数据矩阵和标签矩阵进行数据预处理：

原始数据矩阵为

其中n为样本点的数量，d为样本点的维度；标签向量为

其中元素y_i代表类别序号，通常为1至c之间的整数，c为样本点的类别数；

根据标签向量的值表示的类别，将数据矩阵重新排列，并进行中心化处理，使得数据矩阵行和为0，即X1_n＝0，其中

为元素全为1的列向量；记录处理后的数据矩阵为X；

步骤2、建立基于模糊局部判别分析的数据降维模型：

其中，c_k表示第k类的聚类中心数量。

表示低维投影空间的聚类中心，满足

矩阵

为原始空间的聚类中心矩阵，每个

表示一个小类在原始空间的聚类中心坐标，

为聚类中心总数。S_t为总体散度矩阵，当数据矩阵完成中心化时S_t＝XX^T。正整数q是模糊聚类参数，

P1_n＝1_n表示P中元素

为0或

且每个样本点

对应q个模糊聚类中心

显然，对于所有类别k，q＜c_k。λ是平衡参数，其取值一般较大，目的是使样本点间尽可能分开，以便模型更准确地学习样本的局部特征；

所述

是由P⁽¹⁾,P⁽²⁾,...,P^(c)作为对角元构成的分块对角矩阵，即：

其中，

是第k类数据点与其各小类模糊聚类中心的隶属度矩阵；

步骤3、求解数据降维模型：

①固定W和P，优化M

②固定W和M，优化P

其中，r_t ^*是子空间中点

的k近邻点索引。

③固定M和P，优化W

最优解W由矩阵

的最小d₁个特征值对应的特征向量组成。其中，

是数据和聚类中心的联合矩阵，

L_S＝D_S-S，且：

此时三个变量M、P和W更新完毕，接下来重新按照步骤3进行下一次迭代计算，直到目标函数值收敛；取最后一次迭代得到的矩阵作为最终投影矩阵，则降维后的数据矩阵为

将

去中心化得到最终的投影结果Z。

有益效果

本发明提出的一种基于模糊局部判别分析的数据降维方法，构建数据矩阵、标签矩阵并进行数据预处理，建立基于模糊局部判别分析的数据降维模型，求解数据降维模型，取最后一次迭代得到的矩阵作为最终投影矩阵，则降维后的数据矩阵为

将

采用本发明的方法有益效果主要包括：

(1)提出了一种新的类内散度矩阵计算方法，对每类数据引入小类模糊聚类中心来简化类内散度矩阵的计算，减小了数据降维的计算复杂度。

(2)将低维空间的全局散度矩阵作为平衡项，在最小化子空间每类样本间距离的同时，所有样本点能尽可能分散开，使模型能自适应地学习样本点的不同局部特征，不仅避免了平凡解，还提高了数据降维的学习性能。

(3)对隶属度矩阵施加离散约束进行模糊聚类，并在低维空间中自适应迭代更新，为每个样本自动分配最佳的q个聚类中心，减少了原始空间噪声的影响。

附图说明

图1是算法流程图

图2是Yale_32×32人脸数据集上的灰度图像

具体实施方式

现结合实施例、附图对本发明作进一步描述：

本发明提出了一种基于模糊局部判别分析的数据降维方法，其具体步骤如下：

步骤1：构建数据矩阵、标签矩阵并进行数据预处理。

假设原始数据矩阵为

其中n为样本点的数量，d为样本点的维度。标签向量为

其中元素y_i代表类别序号，通常为1至c之间的整数，c为样本点的类别数。为后续数据处理方便，根据类别顺序将数据矩阵重新排列，并进行中心化处理，使得数据矩阵行和为0，即X1_n＝0，其中

为元素全为1的列向量。记录处理后的数据矩阵为X。

步骤2：建立基于模糊局部判别分析的数据降维模型。

步骤1中数据矩阵X已按照标签顺序排列，即X＝[X⁽¹⁾,X⁽²⁾,...,X^(c)]，其中

表示由第i类样本构成的数据矩阵，n_i表示第i类的样本个数。再设投影矩阵为

d₁为低维空间的维度。采用以下模型来探索每类中数据点之间的局部关系：

其中，

是单元数组，按照类别顺序排列，为每类所有数据对之间的隶属度矩阵，P^(k)是其第k个元素，共有c个。

表示P^(k)的第(i,j)个元素，反映了

和

之间的邻接关系。

与传统LDA方法相比，式(1)研究了每个类别数据点之间的分布，能更好地学习样本的局部结构。此外，通过施加正交约束使投影向量线性无关，且数据重构更为简单。然而，该模型依赖于每类中所有数据对的距离，时间复杂度高，容易导致模型冗余，因此本发明采用基于子空间模糊聚类的方法改善该模型，同时引入子空间总体散度矩阵作为平衡项避免平凡解，得到如下目标函数：

其中，c_k表示第k类的聚类中心数量。

表示低维投影空间的聚类中心，满足

矩阵

为原始空间的聚类中心矩阵，每个

表示一个小类在原始空间的聚类中心坐标，

P1_n＝1_n表示P中元素

为0或

且每个样本点

对应q个模糊聚类中心

显然，对于所有类别k，q＜c_k。λ是平衡参数，其取值一般较大，目的是使样本点间尽可能分开，以便模型更准确地学习样本的局部特征。

注意此时矩阵P的定义与式(1)不同，式(2)的

其中，

是第k类数据点与其各小类模糊聚类中心的隶属度矩阵。这样降低了矩阵P的维度，大大减轻了后续数据处理的计算负担。

步骤3：求解数据降维模型。

目标函数(2)共有3个优化变量，采用交替迭代方法优化求解。首先根据约束条件进行初始化，得到任意单位正交矩阵W₀和隶属度矩阵P₀。然后进行迭代优化，具体步骤如下所示：

①固定W和P，优化M。

此时仅有一个变量M，优化函数为：

由于每个类别的数据相互独立，可以分别进行优化，得到下式：

将式(5)中的目标函数对

求偏导，并令偏导数为0，得到等式：

可得：

上式已求得第k类的每个子空间聚类中心

对每个类别执行相同的操作，可以分别求得M⁽¹⁾,M⁽²⁾,...,M^(c)，最终合并得到所有子空间聚类中心矩阵M＝[M⁽¹⁾,M⁽²⁾,...,M^(c)]。

②固定W和M，优化P。

此时仅有P为变量，目标函数为：

与步骤①同理，由于每个类别相互独立，首先只考虑第k类数据。由P定义，约束

P1_n＝1_n可转化为

即P^(k)每行有q个元素为

其他元素都为0。于是，式(8)转化为对P^(k)进行分别优化，其向量形式表示为：

其中，

表示P^(k)的第i个行向量。假设向量

中非零元素的下标为{r₁,r₂,...,r_t,...,r_ck-q}(1≤r_t≤c_k-q)，式(9)可简化为：

显然，式(10)最优解r_t ^*是子空间中点

的k近邻点索引。因此，问题(9)的最优解为：

通过式(11)可求得

进而得到P^(k)。对每个类别分别执行上述步骤②的操作，得到P⁽¹⁾,P⁽²⁾,...,P^(c)，最终得到全部样本点的隶属度矩阵P。

③固定M和P，优化W。

该情况下的目标函数为：

根据拉普拉斯矩阵的嵌入表达，将式(12)的第一项转化为矩阵迹的形式，转换后上式变为：

其中，

是数据和聚类中心的联合矩阵，

L_S是拉普拉斯矩阵，由联合矩阵

的相似图矩阵S导出，矩阵S的定义如下：

度矩阵为：

则拉普拉斯矩阵L_S由公式L_S＝D_S-S计算得到。式(13)可等价转化为：

式(16)仅有一个正交约束，可由特征值分解得到约束变量的最优解。求得的最优解W由矩阵

的最小d₁个特征值对应的特征向量组成。

至此，三个变量M、P和W更新完毕，接下来重新按照步骤3进行下一次迭代计算，直到目标函数值收敛。取最后一次迭代得到的矩阵作为最终投影矩阵，则降维后的数据矩阵为

将

去中心化得到最终的投影结果Z。

本发明实施例基本流程图如图1所示。下面以Yale_32×32人脸数据集应用至数据降维问题为例介绍具体实施方式，包括以下步骤：

步骤1：构建数据矩阵、标签矩阵并进行数据预处理。

获取Yale_32×32人脸图像数据集，图像个数n＝165，图像分辨率为32×32，将每张图片拉长为d＝1024维度的向量，一共有c＝15类。由此得到原始数据矩阵为

标签向量为

元素y_i(i＝1,2,...,165)为1到15之间的整数，代表样本类别。将样本矩阵

中的数据点按照类别顺序排列并进行中心化处理，记录处理后的数据矩阵为X。

步骤2：建立基于模糊局部判别分析的数据降维模型。

数据矩阵X按照标签顺序排列为X＝[X⁽¹⁾,X⁽²⁾,...,X^(c)]，其中

表示由第i类样本构成的数据矩阵，n_i表示第i类的样本个数，本例中n_i均为13。投影矩阵为

d₁为低维空间的维度。模型的目标函数为：

其中，c_k表示第k类的聚类中心数量，一般取值为2至5之间的整数。S_t为总体散度矩阵，当数据矩阵完成中心化时S_t＝XX^T。正整数q一般设置为2或3(q＜c_k)。λ是平衡参数，可以设置为2。

步骤3：求解数据降维模型。

目标函数(17)共有3个优化变量，采用交替迭代方法优化求解。首先进行初始化得到任意单位正交矩阵W₀和隶属度矩阵P₀，然后进行迭代优化，具体步骤如下所示：①固定W和P，优化M。

此时仅有一个变量M，优化函数为：

将式(19)中的目标函数对

求偏导，并令偏导数为0，得到等式：

可得：

对每个类别执行相同的操作，分别求得M⁽¹⁾,M⁽²⁾,...,M⁽¹⁵⁾，最终合并得到所有子空间聚类中心矩阵M＝[M⁽¹⁾,M⁽²⁾,...,M⁽¹⁵⁾]。

②固定W和M，优化P。

此时仅有P为变量，目标函数为：

首先只考虑第k类数据，式(22)转化为对P^(k)进行分别优化，其向量形式表示为：

其中，

表示P^(k)的第i个行向量。假设向量

中非零元素的下标为{r₁,r₂,...,r_t,...,r_ck-q}(1≤r_t≤c_k-q)，式(23)简化为：

显然，式(24)最优解r_t ^*是子空间中点

的k近邻点索引。那么问题(23)的最优解为：

通过式(25)可求得

③固定M和P，优化W。

该情况下的目标函数为：

式(26)可等价转化为：

其中L_S是拉普拉斯矩阵，表达式为L_S＝D_S-S，其中：

由特征值分解得到式(26)中约束变量的最优解。最终求得的最优解W由矩阵

的最小d₁个特征值对应的特征向量组成。

至此，三个变量M、P和W更新完毕，接下来重新按照步骤3进行下一次迭代计算，直到目标函数值收敛(取偏差值ε＝10^-4)。取最后一次迭代得到的矩阵作为最终投影矩阵W。

步骤4：对得到的低维结果进行分类和识别。

利用步骤3得到的投影矩阵W计算低维投影结果

将

去中心化得到最终的投影结果

将Z的每一列作为新的人脸图像样本数据，对其利用分类算法(如K近邻分类器、支持向量机等)进行分类。最后，将分类结果与原始样本标签相比较，得到最终的识别精度。

Claims

1.一种基于模糊局部判别分析的数据降维方法，其特征在于步骤如下：

步骤1、对数据矩阵和标签矩阵进行数据预处理：

原始数据矩阵为

其中n为样本点的数量，d为样本点的维度；标签向量为

为元素全为1的列向量；记录处理后的数据矩阵为X；

步骤2、建立基于模糊局部判别分析的数据降维模型：

其中，c_k表示第k类的聚类中心数量。

表示低维投影空间的聚类中心，满足

矩阵

为原始空间的聚类中心矩阵，每个

表示一个小类在原始空间的聚类中心坐标，

P1_n＝1_n表示P中元素

为0或

且每个样本点

对应q个模糊聚类中心

所述

其中，

是第k类数据点与其各小类模糊聚类中心的隶属度矩阵；

步骤3、求解数据降维模型：

①固定W和P，优化M

②固定W和M，优化P

其中，r_t ^*是子空间中点

的k近邻点索引。

③固定M和P，优化W

最优解W由矩阵

的最小d₁个特征值对应的特征向量组成。其中，

是数据和聚类中心的联合矩阵，

L_S＝D_S-S，且：

将

去中心化得到最终的投影结果Z。