CN105678380A

CN105678380A - 一种基于小生境和自适应负相关学习的进化神经网络集成方法

Info

Publication number: CN105678380A
Application number: CN201610010275.2A
Authority: CN
Inventors: 单鹏霄; 盛伟国; 陈志强; 卢梦雅; 徐琪琪
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2016-01-08
Filing date: 2016-01-08
Publication date: 2016-06-15

Abstract

一种基于小生境和自适应负相关学习的进化神经网络集成方法，初始化M个网络个体的种群，每个网络个体的隐结点个数，结点间链接的数量和链接的权值都被随机初始化；根据适应度公式，计算种群中每个个体的适应度值；基于小生境的方法选择个体；对选择的个体进行交叉、变异操作，生成父代的子代；使用自适应的负相关学习方法更新每个网络个体的链接的权值；计算每个后代的适应度值，并且将子代与父代合并成一个种群；使用精英策略选择个体生成新的种群，并且将新生成的种群的个体按照适应度从高到低进行排序；联结所有网络个体形成网络集成，并对测试集进行分类预测。本发明有效平衡集成中网络个体的精确度和网络个体间的差异度、提升泛化能力。

Description

一种基于小生境和自适应负相关学习的进化神经网络集成方法

技术领域

本发明属于神经网络领域，应用于人工智能、机器学习、模式识别、数据挖掘和语音识别等领域，尤其涉及一种进化神经网络集成方法。

背景技术

1990年，Hansen和Salamon提出了神经网络集成学习方法，该方法先是训练多个神经网络，然后将训练好的神经网络进行合成。与单个神经网络相比，神经网络集成能显著地提高神经网络的泛化能力。最近几年，越来越多的研究者意识到这一方法的巨大潜力和应用前景并投入了大量的研究。因此，神经网络集成学习也日益成为机器学习和神经计算领域的一个相当活跃的研究热点。

Hansen和Salamon采用数学概率公式证明，当每个神经网络的预测精确度都高于50％，且各网络的错误不相关，则集成中神经网络数量越多，神经网络集成的泛化能力越强。Krogh和Vedelsby在1995年给出了神经网络的泛化误差的计算公式。神经网络集成的泛化误差等于集成中个体网络的平均泛化误差和平均差异度之差。上述的研究从不同角度指出，神经网络集成的泛化能力很大程度上依赖于两个方面：一是集成中各个网络个体的泛化能力，各个网络个体泛化误差的平均值越小，则神经网络集成的泛化误差越小。二是集成中各个网络个体的差异度，网络个体差异程度越大，神经网络集成泛化误差将越小。然而，理论和实验证明提高了集成中网络个体的精确度，往往会降低网络个体间的差异度，反之亦然。因此，增强神经网络集成的泛化能力在于既要尽可能提高网络个体的精确度，同时也应尽可能地增大集成中各个网络个体之间的差异度。

研究者提出了很多构造神经网络集成的训练方法，其中Boosting和Bagging(BootstrapAggregating)是集成学习中最最重要的两种方法。使用Boosting算法训练时，各网络个体的训练集决定于在其之前产生的网络的性能，被已生成网络判断误差较大的样本将以较大的概率出现在新网络的训练集中，以保证新网络能处理原网络不能学习的样本。然而，使用Bagging算法训练时，自动采样技术从原始训练集中随机独立选若干样本形成不同的训练子集，训练子集的规模往往与原数据集一样，训练样本允许重复选择。这两种训练方法是基于变换训练数据，目的是得到有差异度的网络个体。然而，训练集的差异并不能保证网络个体的差异，并且这两种训练方法丧失了网络个体间的交互性。

YaoandLiu提出了一种负相关神经网络集成的训练方法。这种方法通过在神经网络集成中各个网络个体的误差函数中引入一个相关惩罚项来同时训练集成中的网络个体，能更好地得到精确度高的网络个体且增大网络个体间的差异度，以提高网络集成的泛化能力。假定一数据集所有个体都将被联结基于如下的公式：

F (x_{n}) = \frac{1}{M} Σ_{i = 1}^{M} F_{i} (x_{n})

其中M是集成中网络个体的数量，F_i(x_n)是指个体i在第n个训练样本上的输出，则F(x_n)是指网络集成在第n个训练样本上的输出。

在负相关学习过程中，每个网络个体的误差函数e_i的定义如下：

e_{i} = Σ_{n = 1}^{N} {(F_{i} (x_{n}) - y_{n})}^{2} + {λρ}_{i}

其中公式的第一项是每个网络个体的训练差，第二项是训练惩罚项，可以被定义为：

ρ_{i} = Σ_{n = 1}^{N} {(F_{i} (x_{n}) - F (x_{n})) \underset{j &NotEqual; i}{Σ} (F_{j} (x_{n}) - F (x_{n}))}

加入训练惩罚项的目的是能让个体产生与集成中其它个体不相关的错误。

由于负相关学习方法能构造网络个体精确度高且差异度大的集成，因此吸引了很多研究者的关注。很多研究者将该方法与进化算法(EvolutionaryAlgorithm)相结合训练神经网络集成，这样的结合能更好地促进集成中的个体相互合作和学习。然而，负相关学习中惩罚项参数的设置对训练有很重要的影响，现在仍不存在有效的方法来设定，很多应用是使用经验值的方法来设定。此外，在进化过程中怎样维持种群间个体的差异度是一个重要的问题。

发明内容

为了克服已有神经网络进化方法的无法平衡集成中网络个体的精确度和网络个体间的差异度、泛化能力较差的不足,本发明提供了一种有效平衡集成中网络个体的精确度和网络个体间的差异度、提升泛化能力的基于小生境和自适应负相关学习的进化神经网络集成方法。

本发明解决其技术问题所采用的技术方案是：

一种基于小生境和自适应负相关学习的进化神经网络集成方法，包括如下步骤：

步骤1、初始化一个有M个网络个体的种群，种群中每个网络个体的隐结点个数，结点间链接的数量和链接的权值都被随机初始化。

步骤2、根据适应度公式，计算种群中每个个体的适应度值；

步骤3、基于小生境的方法选择个体；

步骤4、对选择的个体进行交叉、变异操作，生成父代的子代；

步骤5、使用自适应的负相关学习方法更新每个网络个体的链接的权值，公式如下：

E = Σ_{n = 1}^{N} {(f_{i} (x_{n}) - y_{n})}^{2} - λ Σ_{n = 1}^{N} {(f_{i} (x_{n}) - f_{e n s} (x_{n}))}^{2}

\begin{matrix} \frac{\partial E}{\partial w_{i j}} = 2 Σ_{n = 1}^{N} (f_{i} (x_{n}) - y_{n}) \frac{\partial f_{i} (x_{n})}{w_{i j}} \\ - 2 λ Σ_{n = 1}^{N} (f_{i} (x_{n}) - f_{e n s} (x_{n})) (1 - \frac{1}{M}) \frac{\partial f_{i} (x_{n})}{\partial w_{i j}} \end{matrix}

其中，E是网络个体在负相关学习过程中的错误差，N为训练样本数，f_i(x_n)和y_n分别为网络输出值和目标值，f_ens(x_n)为网络集成的输出值，λ为惩罚项参数，w_ij为网络框架中的权值，M为网络集成中的个体的数量，通过求网络错误差与权值之间的偏导来重新调整权值；

步骤6、计算每个后代的适应度值，并且将子代与父代合并成一个种群；

步骤7、使用精英策略选择个体生成新的种群，并且将新生成的种群的个体按照适应度从高到低进行排序；

步骤8、判断是否到达进化的最大代数，如果是，则进入步骤9，否则返回步骤3；

步骤9、联结所有网络个体形成网络集成，并对测试集进行分类预测。

进一步，所述步骤5中，通过自适应的方式来设定惩罚项的参数λ，在训练的初始阶段，设置一个较大的惩罚项的参数λ，增加种群中网络个体的差异度，并且得到种群的最大多样性PD^max；接下来的训练，惩罚项的参数λ的设定基于当前种群的差异度：

λ^{'} = λ_{m a x} - \frac{P D}{{PD}^{m a x}} \times (λ_{m a x} - λ_{\min})

其中λ_max和λ_min分别是惩罚项参数的上限和下限，它们的大小设为0.9和0.1，PD为当前种群的多样性值。

更进一步，计算种群的多样性值PD的过程如下：

步骤5.1、初始化最大种群多样性值PD^max；

步骤5.2、根据网络个体含有的隐结点的数量，将种群划分成若干子群；

步骤5.3、计算每个子群中每两个网络个体的距离d_ij：

d_{i j} = \frac{1}{N} Σ_{n = 1}^{N} | (f_{i} (x_{n}) - f_{j} (x_{n})) |

其中N是训练样本的数量。f_i(.)和f_j(.)分别是网络i和网络j的输出值。

步骤5.4、计算每两个网络个体对子群的多样性的贡献值A_ij：

A_{i j} = \frac{f_{i} + f_{j}}{2 f_{a v e}} \times d_{i j}

其中f_ave是种群的平均适应度值，f_i和f_j分别是网络个体i和网络个体j的适应度；

步骤5.5、计算每个子群的多样性SPD：

S P D = \frac{2}{k (k - 1)} Σ_{i = 1}^{k - 1} Σ_{j = i + 1}^{k} A_{i j}

步骤5.6、通过各个子群的多样性相加来计算种群的多样性PD：

P D = Σ_{i = 1}^{c} {SPD}_{i}

步骤5.7、比较当前种群的多样性PD与已记录的种群的最大多样性PD^max，如果PD>PD^max，PD^max＝PD；

步骤5.8、判断种群的多样性是否连续预设数量的代数内没有提升，否，则返回步骤5.2继续循环计算，否则退出循环。

本发明的有益效果主要表现在：在训练过程中，本发明引入自适应的负相关学习方法来训练网络个体，这种自适应的负相关学习方法可以通过当前种群多样性的值来自动设定惩罚项的参数，目的是能更好地平衡种群中网络个体的精确度和网络个体的差异度。此外，本发明使用了小生境的方法来维持种群的多样性，避免种群中网络个体聚集在同一个局部搜索空间，提高种群的多样性。本发明的方法最终目的是为了获得一个网络个体精确度高且差异度大的网络集成，提高网络集成的泛化能力。

附图说明

图1为本发明的训练网络集成的流程图。

图2为本发明中使用的三层网络个体的框架图。

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1，一种基于小生境和自适应负相关学习的进化神经网络集成方法，包括如下步骤：

步骤2、根据适应度公式，计算种群中每个个体的适应度值；

步骤3、基于小生境的方法选择个体；

E = Σ_{n = 1}^{N} {(f_{i} (x_{n}) - y_{n})}^{2} - λ Σ_{n = 1}^{N} {(f_{i} (x_{n}) - f_{e n s} (x_{n}))}^{2}

\begin{matrix} \frac{\partial E}{\partial w_{i j}} = 2 Σ_{n = 1}^{N} (f_{i} (x_{n}) - y_{n}) \frac{\partial f_{i} (x_{n})}{w_{i j}} \\ - 2 λ Σ_{n = 1}^{N} (f_{i} (x_{n}) - f_{e n s} (x_{n})) (1 - \frac{1}{M}) \frac{\partial f_{i} (x_{n})}{\partial w_{i j}} \end{matrix}

λ^{'} = λ_{m a x} - \frac{P D}{{PD}^{m a x}} \times (λ_{m a x} - λ_{\min})

更进一步，计算种群的多样性值PD的过程如下：

步骤5.1、初始化最大种群多样性值PD^max；

步骤5.3、计算每个子群中每两个网络个体的距离d_ij：

d_{i j} = \frac{1}{N} Σ_{n = 1}^{N} | (f_{i} (x_{n}) - f_{j} (x_{n})) |

其中N是训练样本的数量，f_i(.)和f_j(.)分别是网络i和网络j的输出值。

步骤5.4、计算每两个网络个体对子群的多样性的贡献值A_ij：

A_{i j} = \frac{f_{i} + f_{j}}{2 f_{a v e}} \times d_{i j}

步骤5.5、计算每个子群的多样性SPD：

S P D = \frac{2}{k (k - 1)} Σ_{i = 1}^{k - 1} Σ_{j = i + 1}^{k} A_{i j}

P D = Σ_{i = 1}^{c} {SPD}_{i}

步骤5.7、比较当前种群的多样性PD与已记录的种群的最大多样性PD^max，如果PD>PD^max,PD^max＝PD；

步骤5.8、判断种群的多样性是否连续预设数量的代没有提升，否，则返回步骤5.2继续计算，否则退出循环。

本发明中应用了改进的小生境的技术(fitnesssharing)来维持种群的多样性。在进化过程中，所提出的小生境技术可动态地决定小生境的半径σ，其中M是种群个体的数量。此外，网络个体的隐结点数量的多样性也会被保持，并且在选择网络个体的交配的过程中，我们鼓励相似的个体进行竞争。改进了的小生境技术具体实现如下：在选择网络个体交叉时，我们根据网络个体的适应度值从高到低级进行选择，P1为适应度值最高的网络个体，P2是接下来适应度最高的网络个体，然后鼓励P1和P2进行竞争生成更好的后代，这样的过程直到所有的网络个体被选完才停止。

实例：本发明在不同的数据集合进行实施，这些数据集来源于UCI数据库，如表1所示，它们有着不同特征。

表1

在实施过程中，使用10-fold-cross-validation来验证本发明的方法。在试验过程中，每次实验运行的输出为所有网络个体的输出的平均值，所有实验结果的分类错误率，是取30次独立运行后的平均值。

在本发明的方法实施过程中，有些参数需要被提起设定。设定种群的大小为30，最大进化代数为100代，突变率和交叉率分为0.01和0.1。每个网络个体的隐结点数量的初始范围为3到10,链接权值的初始大小范围为-1到1。

本发明的方法具体实施过程，如图1所示，包括如下步骤：

步骤1、生成一个三层神经网络的种群，网络个体如图2所示。

步骤2、计算每个网络个体的适应度值，根据如下公式

F = Σ_{n = 1}^{N} {(f_{i} (x_{n}) - y_{n})}^{2} - Σ_{n = 1}^{N} {(f_{i} (x_{n}) - f_{e n s} (x_{n}))}^{2} + Σ_{i j} \frac{{w_{i j}}^{2}}{1 + {w_{i j}}^{2}}

步骤3、基于小生境的方法选择个体。

步骤4、对选择的个体进行交叉、变异操作。在交叉时，使用双点交叉方式来交换一个隐结点的权值，避免了毁坏网络个体的权值排序问题。在变异时，使用了三种变异操作，包括结点间的链接删除、增加和权值的高斯变异。

步骤5、每个网络个体进行负相关学习，学习次数设置为10。

步骤6、计算每个后代的适应度值，并且将子代与父代合并成一个种群。

步骤7、使用精英策略选择个体生成新的种群，并且将新生成的种群的个体按照适应度从高到低进行排序。

步骤8、判断是否到达进化的最大代数，是，则进行步骤9，否则重复步骤3到步骤8.

Claims

1.一种基于小生境和自适应负相关学习的进化神经网络集成方法，其特征在于：包括如下步骤：

步骤1、初始化一个有M个网络个体的种群，种群中每个网络个体的隐结点个数，结点间链接的数量和链接的权值都被随机初始化；

步骤2、根据适应度公式，计算种群中每个个体的适应度值；

步骤3、基于小生境的方法选择个体；

E = Σ_{n = 1}^{N} {(f_{i} (x_{n}) - y_{n})}^{2} - λ Σ_{n = 1}^{N} {(f_{i} (x_{n}) - f_{e n s} (x_{n}))}^{2}

\begin{matrix} \frac{\partial E}{\partial w_{i j}} = 2 Σ_{n = 1}^{N} (f_{i} (x_{n}) - y_{n}) \frac{\partial f_{i} (x_{n})}{w_{i j}} \\ - 2 λ Σ_{n = 1}^{N} (f_{i} (x_{n}) - f_{e n s} (x_{n})) (1 - \frac{1}{M}) \frac{\partial f_{i} (x_{n})}{w_{i j}} \end{matrix}

2.如权利要求1所述的一种基于小生境和自适应负相关学习的进化神经网络集成方法，其特征在于：所述步骤5中，通过自适应的方式来设定惩罚项的参数λ，在训练的初始阶段，设置一个较大的惩罚项的参数λ，增加种群中网络个体的差异度，并且得到种群的最大多样性PD^max；接下来的训练，惩罚项的参数λ的设定基于当前种群的差异度：

λ^{'} = λ_{m a x} - \frac{P D}{{PD}^{m a x}} \times (λ_{m a x} - λ_{\min})

3.如权利要求2所述的一种基于小生境和自适应负相关学习的进化神经网络集成方法，其特征在于：计算种群的多样性值PD的过程如下：

步骤5.1、初始化最大种群多样性值PD^max；

步骤5.3、计算每个子群中每两个网络个体的距离d_ij：

d_{i j} = \frac{1}{N} Σ_{n = 1}^{N} | (f_{i} (x_{n}) - f_{j} (x_{n})) |

其中N是训练样本的数量，f_i(.)和f_j(.)分别是网络i和网络j的输出值；

步骤5.4、计算每两个网络个体对子群的多样性的贡献值A_ij：

A_{i j} = \frac{f_{i} + f_{j}}{2 f_{a v e}} \times d_{i j}

步骤5.5、计算每个子群的多样性SPD：

S P D = \frac{2}{k (k - 1)} Σ_{i = 1}^{k - 1} Σ_{j = i + 1}^{k} A_{i j}

P D = Σ_{i = 1}^{c} {SPD}_{i}

步骤5.8、判断种群的多样性是否连续在预设代数内没有提升，否，则返回步骤5.2继续循环计算，否则退出循环。