CN113469209A

CN113469209A - 一种基于噪声抑制的无监督数据降维方法

Info

Publication number: CN113469209A
Application number: CN202011567582.3A
Authority: CN
Inventors: 王靖宇; 王林; 聂飞平; 李学龙
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2020-12-26
Filing date: 2020-12-26
Publication date: 2021-10-01
Also published as: WO2022134420A1

Abstract

本发明公开了一种基于噪声抑制的无监督数据降维方法，首先初始化全局散度矩阵、图矩阵、投影矩阵、拉普拉斯矩阵及正则化参数，然后更新矩阵F，再更新投影矩阵P，重复迭代直到目标函数收敛，实现无监督数据降维。本发明减小了计算复杂度，加快了运算时间，可以实现对高位数据快速、有效的降维。

Description

一种基于噪声抑制的无监督数据降维方法

技术领域

本发明属于机器学习技术领域，具体涉及一种无监督数据降维方法。

背景技术

随着信息获取技术的不断发展，数据拥有了更多的样本数量和特征数量。然而，这些大量的特征并不是完全独立的，其中存在大量的噪声和冗余信息。为了剔除冗余、噪声信息，保留最主要的数据特征，以及缓解高维度带来的“维数灾难”的问题，研究人员提出了越来越多的数据降维方法。作为机器学习领域的研究热点之一，这些数据降维方法被广泛的应用到了人脸识别、图像压缩、高光谱波段选择和医学影像处理等领域。

周志华(周志华，机器学习[M].清华大学出版社，2016，P225-241)在《机器学习》书中介绍了基于流形学习的降维方法。这种降维方法借鉴了拓扑流形的概念，在高维空间中嵌入低维流型，则数据在高维空间的分布虽然看上去更加复杂，但是在局部仍然具备欧氏空间的性质。因此，这种方法先在局部建立映射关系，然后推广到全局。但是由于此方法在建立模型的过程是将局部的映射关系推广到全局，因此这种方法可能把噪声的局部结构也学习到投影矩阵中，从而导致了将位置后无法有效的去除噪声数据，影响了后续的数据处理。

发明内容

为了克服现有技术的不足，本发明提供了一种基于噪声抑制的无监督数据降维方法，首先初始化全局散度矩阵、图矩阵、投影矩阵、拉普拉斯矩阵及正则化参数，然后更新矩阵F，再更新投影矩阵P，重复迭代直到目标函数收敛，实现无监督数据降维。本发明减小了计算复杂度，加快了运算时间，可以实现对高位数据快速、有效的降维。

本发明解决其技术问题所采用的技术方案包括以下步骤：

步骤1：初始化；

步骤1-1：给定数据矩阵

其中矩阵X的每一列x₁,x₂,...,x_n为一个样本，d为样本的维度；

步骤1-2：采用高斯自调整方法计算图矩阵

图矩阵S中的元素0≤s_ij≤1，s_ij表示样本点x_i和x_j之间的相似性，s_ij的值与样本点x_i和x_j之间的相似性正相关，图矩阵S主对角线上的元素全为0；

其中σ_i＝||x_i-x_K||₂，σ_j＝||x_j-x_K||₂，x_K为样本点x_i或x_j的第K个近邻；

步骤1-3：计算全局散度矩阵

其中，1为n×1的列向量，向量的元素全为1；

步骤1-4：定义L＝D-S为拉普拉斯矩阵，其中

为度矩阵，D＝diag(d₁,d₂,...,d_n)，

步骤1-5：定义矩阵B＝λ(L+λI)^-1，λ为正则化参数，λ>0；

步骤1-6：构建投影矩阵

满足P^TP＝I，其中I为单位矩阵，d′为子空间维度，即高维数据降维之后的维度，d′<d；

步骤2：给定目标函数：

其中d′≤k≤d，

为中间变量，运算||·||_F表示矩阵的F范数，运算Tr(·)表示对矩阵取迹，运算||·||_2,0表示矩阵的2,0范数；

对式(1)的目标函数学习得到投影矩阵P，通过变换Y＝P^TX，将原始d维的数据投影到d′维的子空间中；

对式(1)的目标函数进行变换：

得到新的目标函数：

s.t.P^TP＝I,||P||_2,0＝k

采用交替优化算法求解式(2)的目标函数，如后续步骤；

步骤3：固定P更新F；

将目标函数转化为：

将式(3)对F求偏导，并令结果为0，得到：

得到F的更新策略如下：

F＝BX^TP (4)

步骤4：固定F更新P；

将目标函数变为：

s.t.P^TP＝I,||P||_2,0＝k

将式(4)代入式(5)，得：

目标函数变为：

s.t.P^TP＝I,||P||_2,0＝k

进一步，目标函数转化为如下形式：

其中C＝XB^TLBX^T+λ(XX^T-2XBX^T+XB^TBX^T)，α为一个标量，且α^*满足

令A＝S_t-αC，得到：

步骤5：求解式(6)如下：

①初始化矩阵

满足P₀ ^TP₀＝I，P₀为初始时刻的投影矩阵；令迭代次数t＝1；

②更新

③计算

④在P_t的主对角线上选取最大的k个元素，这k个元素所在行的值保持不变，为非零行；其余元素所在行所有元素的值清零；

⑤定义矩阵

取矩阵M中与P_t的非零行行号相同的行组成矩阵

用

的任意一个正交基更新P_t的非零行；

⑥令t加1，循环执行②-⑤步直到式(6)收敛；

步骤6：计算Y＝P_t ^TX，矩阵

即为降维之后的样本矩阵。

优选地，所述K＝7。

本发明的有益效果如下：

1、通过引入中间变量F，目标函数中

可以有效的减少原始数据中噪声对主要信息的影响；

2、本发明采用了无监督的方法进行数据降维，而且在迭代求解的过程中无需更新图矩阵S，因此减小了计算复杂度，加快了运算时间。

3、本发明无需用到标签数据，减小了大量的获取标签数据所用到的时间，可以实现对高位数据快速、有效的降维。

附图说明

图1是本发明方法的流程图。

图2是本发明方法在Wine数据集上不同子空间维度上的检测结果图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

针对目前已有的有监督数据降维算法需要耗费大量的时间获取数据标签，无监督数据降维方法计算复杂度高，以及无法针对性的解决噪声对数据降维影响，本发明采用一种基于噪声抑制的无监督流形学习降维算法，在数据降维的同时，去除噪声对主要信息的干扰，保留了数据最主要的信息。

如图1所示，一种基于噪声抑制的无监督数据降维方法，包括以下步骤：

步骤1：初始化；

步骤1-1：给定数据矩阵

步骤1-2：采用高斯自调整方法计算图矩阵

其中σ_i＝||x_i-x_K||₂，σ_j＝||x_j-x_K||₂，x_K为样本点x_i或x_j的第7个近邻；

步骤1-3：计算全局散度矩阵

其中，1为n×1的列向量，向量的元素全为1；

步骤1-4：定义L＝D-S为拉普拉斯矩阵，其中

为度矩阵，D＝diag(d₁,d₂,...,d_n)，

步骤1-5：定义矩阵B＝λ(L+λI)^-1，λ为正则化参数，λ>0；

步骤1-6：构建投影矩阵

步骤2：给定目标函数：

其中d′≤k≤d，

对式(1)的目标函数进行变换：

得到新的目标函数：

s.t.P^TP＝I,||P||_2,0＝k

采用交替优化算法求解式(2)的目标函数，如后续步骤；

步骤3：固定P更新F；

将目标函数转化为：

将式(3)对F求偏导，并令结果为0，得到：

得到F的更新策略如下：

F＝BX^TP (4)

步骤4：固定F更新P；

将目标函数变为：

s.t.P^TP＝I,||P||_2,0＝k

将式(4)代入式(5)，得：

目标函数变为：

s.t.P^TP＝I,||P||_2,0＝k

进一步，目标函数转化为如下形式：

令A＝S_t-αC，得到：

步骤5：求解式(6)如下：

①初始化矩阵

②更新

③计算

⑤定义矩阵

取矩阵M中与P_t的非零行行号相同的行组成矩阵

用

的任意一个正交基更新P_t的非零行；

⑥令t加1，循环执行②-⑤步直到式(6)收敛；

步骤6：计算Y＝P_t ^TX，矩阵

即为降维之后的样本矩阵。

具体实施例：

如图2所示，本发明提出的方法与对比算法主成分分析(Principal ComponentAnalysis,PCA)、核主成分分析(Kernel Principal Component Analysis,KPCA)在Wine数据集上的结果。Wine数据集一共178个样本，维度为13，总共3类。以上三种降维方法把原始数据降维到子空间之后会通过K-means进行聚类，聚类之后得到的标签和样本真实的标签进行对比得到整体分类精确度为评价指标，整体分类精确度取值为0-1，数值越大，证明降维方法越好。如下图所示，本发明提出的方法在子空间维度上的整体分类精确度都要高于对比算法，这也从实验方面证明了本方法在降维方面的有效性。