CN105718943A

CN105718943A - 基于粒子群优化算法的特征选择方法

Info

Publication number: CN105718943A
Application number: CN201610034479.XA
Authority: CN
Inventors: 王保云; 李策; 高�浩
Original assignee: Nanjing Post and Telecommunication University
Current assignee: Nanjing Post and Telecommunication University
Priority date: 2016-01-19
Filing date: 2016-01-19
Publication date: 2016-06-29

Abstract

本发明公开了一种基于粒子群优化算法的特征选择方法，步骤1、将输入的数据集进行预处理，分成训练集和测试集；步骤2、确定待优化参数及基于特定的特征选择方法适应度函数，建立并初始化第一代粒子群，进行迭代；步骤3、根据适应度函数，计算每个粒子的适应度、个体最优位置以及所有粒子的全局最优位置；步骤4、利用粒子群的迭代公式更新每个粒子的速度和位置向量，更新每个粒子的个体最优位置和所有粒子的全局最优位置；步骤5、重复步骤2～步骤4，直至达到最大迭代次数；步骤6、输出最优解。本发明基于粒子群优化算法的特征选择方法将被选择的特征数目引入到适应度函数中，不仅能够提高分类的精度,同时还能减少被选择特征的数目。

Description

基于粒子群优化算法的特征选择方法

技术领域

本发明涉及机器学习技术领域，特别涉及一种基于粒子群优化算法的特征选择方法。

背景技术

在模式系统分类系统中，输入的数据往往含有大量的特征，但是只有很少的一部分特征对于分类是有关系的，大量无关的特征会造成“维数灾难”同时降低新噪比。特征选择能剔除不相关或冗余的特征，从而达到减少特征个数，提高模型精确度，减少运行时间的目的。另一方面，选取出真正相关的特征简化了模型，使研究人员易于理解数据产生的过程。特征选择也称特征子集选择，或属性选择，是指从全部特征中选取一个特征子集，这个子集具有比特征全集更好或和特征全集一样的效果。

在机器学习领域，特征选择有两种模式:过滤式和封装模式。在过滤模式中，选择是作为一种预处理，不直接优化任何特定的预测器的性能，特征选择的子集和算法无关。而在封装模式中，选择的方法直接优化特定的预测器。一般来说过滤模式的效率更高，结果与采用的学习算法没有关系所以效果比较差，封装模式依赖于分类算法，效果更好，但是会占用大量的运算时间。一般在数据规模不大的情况下一般使用封装模式，而一般采用封装模式的适应度函数只考虑分类的准确率，往往忽略选择的特征数目对于分类效果的影响。

发明内容

本发明的目的是，提供一种基于粒子群优化算法的特征选择方法，以解决以上方法的缺陷，特别针对减少使用特征数目问题。

一种基于粒子群优化算法的特征选择方法，包括如下步骤：

步骤1、将输入的数据集进行预处理，分成训练集和测试集；

步骤2、确定待优化参数及基于特定的特征选择方法适应度函数，建立并初始化第一代粒子群，进行迭代；

步骤3、根据所述基于特定的特征选择方法适应度函数，计算每个粒子的适应度、个体最优位置以及所有粒子的全局最优位置；

步骤4、利用粒子群的迭代公式更新每个粒子的速度和位置向量，更新每个粒子的个体最优位置和所有粒子的全局最优位置；

步骤5、重复步骤2～步骤4，直至达到最大迭代次数；

步骤6、输出最优解。

所述步骤1的具体过程为：将数据集随机分成n份，把其中的一份作为训练集，剩余的n-1份作为测试集。

步骤2中所述基于特定的特征选择方法适应度函数为

F i t n e s s = α * A c c u r a c y + (1 - α) * \frac{1}{# S}

其中Fitness为适应度函数，Accuracy为使用K-NN分类器的分类准确率，#S是在分类过程中被选择的特征数目即粒子位置中“1”的个数，N表示特征总数目，粒子的适应度越大，要求精度越高，则使用的特征数目越少；α是惩罚因子，值越大表示特征数量越重要，α取值范围为[0，1]。

步骤2中所述初始化第一代粒子群的过程为：初始化粒子的编码为二进制X_i＝(x₁,x₂,…x_n)，粒子位置向量的长度表示特征总的数目，用1表示特征被选中，用0表示特征没有被选中。

步骤3中粒子的个体最优位置为：

其中F表示适应度函数；

所述所有粒子的全局最优位置为：

P_gbest(t+1)＝max(P₁(t+1)，P₂(t+2).....P_m(t+1))

本发明基于粒子群优化算法的特征选择方法将被选择的特征数目引入到适应度函数中，不仅能够提高分类的精度,同时还能减少被选择特征的数目。

附图说明

图1为基于粒子群优化算法的特征选择方法的流程图；

图2为利用图1实施例的方法输出的结果图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，基于粒子群优化算法的特征选择方法包括以下步骤：

步骤1、将输入的数据集进行分割，分成训练集和测试集；

将数据进行归一化处理，将数据集分成训练集和测试集。分割方法为留一交叉验证法，把数据集分割成n份，把其中的一份作为训练集，剩余的n-1份都作为测试集。

步骤2、确定待优化参数及基于特定的特征选择方法适应度函数，建立并初始化第一代粒子群并开始迭代；

根据特征选择的特点，把每一个特征定义为粒子的一位离散二进制变量，而变量的长度就是所有的特征数目，如果第i位为1，则就表示该特征被选择，如果该位为0，则代表该位特征没有被选中。开始初始化，随机产生一组粒子，初始化粒子的速度和位置。这种初始化方式得到的每一个个体的“1”和“0”的数量是大致相同的。初始化粒子的当前最佳位置和所有粒子的全局最佳位置。具体来说，随机初始化粒子的位置为X(0)，初始化各个粒子的最佳当前最优位置P_pi(0)＝X_i(0)，全局最优位置P_gbest(0)＝min[X₁(0),X₂(0).....X_m(0)],m是粒子的个数。

步骤3、根据适应度函数，计算每个粒子的适应度，并计算每个粒子的个体最优位置以及所有粒子的全局最优位置，具体来说：

适应度函数为：

F i t n e s s = α * A c c u r a c y + (1 - α) * \frac{1}{# S}

粒子个体最优位置的更新公式为：

其中F表示适应度函数；

所述所有粒子的全局最优位置为：

P_gbest(t+1)＝max(P₁(t+1)，P₂(t+2).....P_m(t+1))

步骤4、利用粒子群的迭代公式更新每个粒子的速度和位置向量，更新每个粒子的个体最优位置和所有粒子的全局最优位置；具体来说粒子速度和位置向量迭代更新公式为：

V_{i}^{t + 1} = w * V_{i}^{t} + c_{1} * r a n d * (p b e s t - X_{i}^{t}) + c_{2} * r a n d * (g b e s t - X_{i}^{t}) - - - (1)

X_{i}^{t + 1} = X_{i}^{t} + V_{i}^{t} - - - (2)

更新每一个粒子的速度和位置向量，w是迭代的权值，,c1和c2是加速因子，t代表迭代的次数，rand代表随机数，一般的取值为[0，1]。

步骤5、重复步骤2～步骤4，直至满足粒子群公式的迭代次数t＝T_max，假设迭代次数设置为100，则当迭代次数达到100时，算法停止，输出相应的结果。

步骤6、迭代结束，输出最优解。

将以上方法应用于数据分类，表1为机器学习UCI数据库的标准数据。

表1

数据	实例	特征数目	类别
				vowel	990	10	11
wine	178	13	3
				sonar	208	60	2
WDBC	569	30	2

以上应用与数据分类最终的效果比较如表2所示。

表2

本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段，还包括由以上技术特征任意组合所组成的技术方案。

Claims

1.一种基于粒子群优化算法的特征选择方法，其特征在于，包括如下步骤，

步骤1、将输入的数据集进行预处理，分成训练集和测试集；

步骤5、重复步骤2～步骤4，直至达到最大迭代次数；

步骤6、输出最优解。

2.根据权利要求1所述的基于粒子群优化算法的特征选择方法，其特征在于，所述步骤1的具体过程为：将数据集随机分成n份，把其中的一份作为训练集，剩余的n-1份作为测试集。

3.根据权利要求1所述的基于粒子群优化算法的特征选择方法，其特征在于，步骤2中所述基于特定的特征选择方法适应度函数为

F i t n e s s = α * A c c u r a c y + (1 - α) * \frac{1}{# S}

4.根据权利要求1所述的基于粒子群优化算法的特征选择方法，其特征在于，步骤2中所述初始化第一代粒子群的过程为：初始化粒子的编码为二进制X_i＝(x₁,x₂,…x_n)，粒子位置向量的长度表示特征总数目，用1表示特征被选中，用0表示特征没有被选中。

5.根据权利要求3所述的基于粒子群优化算法的特征选择方法，其特征在于，所述步骤3中粒子的个体最优位置为：

其中F表示适应度函数；

所述所有粒子的全局最优位置为：

P_gbest(t+1)＝max(P₁(t+1)，P₂(t+2).....P_m(t+1))。