CN110135584B

CN110135584B - 基于自适应并行遗传算法的大规模符号回归方法及系统

Info

Publication number: CN110135584B
Application number: CN201910254056.2A
Authority: CN
Inventors: 钟竞辉; 黄至行
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2019-03-30
Filing date: 2019-03-30
Publication date: 2022-11-18
Anticipated expiration: 2039-03-30
Also published as: CN110135584A

Abstract

本发明公开了一种基于自适应并行遗传算法的大规模符号回归方法及系统，所述系统包括：主进程模块，用于初始化，调用CPU线程模块，同步障与迁移操作；CPU线程模块，用于执行遗传编程算法，EV的更新，以及调用GPU适应值评估模块；GPU适应值评估模块，包括CPU辅助线程、CUDA库函数、及CUDA自定义函数，用于执行适应值评估。本发明为遗传编程算法引入自适应的多种群进化机制与异构计算资源的并行计算系统，运用自适应的多种群进化机制成功提取出有效构建元素，从而提高遗传编程算法在多构建元素的复杂问题中的性能，通过设计异构计算资源的并行计算系统，充分利用了CPU与GPU的计算资源，显著提高了搜索效率。

Description

基于自适应并行遗传算法的大规模符号回归方法及系统

技术领域

本发明涉及智能计算和高性能计算两大领域，主要涉及一种基于自适应并行遗传算法的大规模符号回归方法及系统。

背景技术

遗传编程算法是一种被广泛应用于符号回归问题、数据知识发现、规则挖掘的算法。早在2005年，Koza与Poli已将遗传编程算法应用于符号回归问题中并取得巨大的成功。经过十多年的发展，遗传编程算法领域已涌现了大量的改进变体，这些变体在各种应用中都证明了遗传编程算法的有效性与潜力。目前，遗传编程算法在金融分析，气候数据分析等领域有着广泛应用，具有巨大的经济价值。

然而现阶段，遗传编程算法仍有两个主要的不足。一是其在大规模的复杂问题中成功率较低，不易找出解空间中有效构建元素并得到符合数据的知识规律；二是其需要大量的迭代以达到充分进化，搜索速度较慢。为解决以上两个问题，目前研究者们已有各种不同的解决方案。一方面，研究者设计出不同的遗传算子以提高算法的全局搜索能力，如基于语法，语义的遗传变异，基于Levy概率分布的遗传算子和基于自定义函数的遗传算子等。但是目前已有的遗传算子仍难以解决含大量构建元素(如函数，终端符号)的复杂问题。另一方面，研究者使用各种高性能计算平台对遗传编程算法进行加速，如GPU-CUDA，MPI，SPARK等。现有的高性能计算框架已在算法加速问题上取得巨大成功，但是他们仅关注一种计算资源，如GPU。然而在实际应用生产中，往往存在多种异构的计算资源，如CPU与GPU。如何充分利用异构的计算资源协同计算，仍有待进一步研究。围绕上述问题，本发明通过自适应环境向量(EV)的多种群进化机制提取解空间中的有效构建元素，并基于该多种群进化机制设计异构计算资源并行计算系统，以有效解决大规模高维符号回归问题。

发明内容

针对上述技术问题之一，本发明提供了一种基于自适应并行遗传算法的大规模符号回归方法及系统。该方法主要涉及自适应多种群遗传编程算法，以及根据该方法的计算特点设计的异构计算资源并行框架。该自适应多种群遗传编程算法主要采用EV控制多种群的协同进化，异构计算资源并行框架以GPU和CPU作为计算资源。

本发明采用如下技术方案实现：

一种基于自适应并行遗传算法的大规模符号回归方法，包括步骤：

1)根据问题的构建元素集生成N_s个准正交的稀疏初始环境向量EV，并根据EV初始化N_s个子种群，每个子种群含M_s个个体；创建N_TC个CPU线程以及在GPU内存中申请N_B个GPU块、每个块中N_T个GPU线程与足够的内存空间，准备计算；

2)启动N_TC个CPU线程同时执行子种群的独立进化，所述子种群的独立进化包含遗传编程算法与EV更新操作，所述EV更新操作主要依据该子种群中各构建元素的出现频率进行调整；所述独立进化过程中的适应值评估由调用GPU计算资源完成；调用时，CPU线程首先将该子种群的信息进行解码，载入缓存，然后等待GPU返回结果，完成适应值评估；一个CPU线程等待GPU时，其他CPU线程可继续完成对应子种群的独立进化；子种群不断循环遗传算子直至到达同步障，当一个子种群到达同步障后，对应的CPU线程重新查询是否有子种群仍未执行独立进化，若有，CPU线程转去该子种群执行计算，若无，继续重新查询；

3)周期性检查缓存数据，当GPU检测来自CPU的到适应值评估请求时，GPU把缓存数据，即待适应值评估的子种群载入GPU内存，并启动GPU块及其中的GPU线程执行计算，当缓存中的所有个体完成计算后，GPU把计算结果汇总，并返回给CPU，完成适应值评估；

4)所有子种群到达同步障后，执行个体迁移操作，所述个体迁移操作包含个体的迁入与迁出；

5)迁移操作完成后，如果达到结束条件则终止，否则返回步骤2)。

进一步地，所述的步骤1)中，

为使初始环境向量EV正交化，假定每个初始环境向量EV中共有v_t(v_f)个终端符号的概率设成1，其余终端符号(函数)的概率设成1/T(1/F)；设成1的终端符号即为所述子种群的必选构建元素，所述v_t(v_f)由公式(1)决定：

T为终端符号的数量，每个初始环境向量EV设成1的终端符号不尽相同，以实现准正交化，随后根据初始环境向量EV初始化子种群中每个个体的每个基因片段，初始化过程对每个个体的基因根据EV进行赋值。

进一步地，所述的步骤1)中，

在申请GPU内存空间时，需要分配五个矩阵：输入数据矩阵TI，标签矩阵TO，个体数据矩阵DEV，适应值矩阵FIT，当前值矩阵CV，个矩阵的大小分别为MI×MV，MI，N_B×L，N_B，N_B×MI，其中MI是输入数据量，MV是数据的维度，N_B是GPU块的数目，L是个体的长度。

进一步地，所述的步骤1)中，

CPU线程的创建及启动采用Window自带的API中的CreateThread函数完成。

进一步地，步骤2)中，所述EV更新操作主要依据该子种群中各构建元素的出现频率进行调整具体包括：

针对第i个子种群的l+1代EV更新公式如公式(2)所示：

其中，τ是更新的动量系数，是0到1间的一个随机数，P_t，i和P_f，i是第i个子种群中，各构建元素的出现频率，它们的每个分量由公式(3)计算：

其中n_a是第a个终端符号在第i个子种群中的出现次数，每次更新完EV，都要对EV进行归一化为下一代根据EV执行遗传算子做准备，EV的每个分量的归一化如公式(4)所示：

进一步地，进行适应值评估具体包括步骤：

GPU中的流处理器簇(SM)从GPU内存中把个体信息读入高速缓存，每个流处理器簇下拥有多个物理核，每个核能负责计算多个GPU块，每个GPU块对应一个个体，GPU块中的各GPU线程对应测试数据的不同输入；

GPU线程接受输入并计算对应个体在不同输入时的输出后，个体的输出结果临时存放到当前值矩阵CV中，由于GPU是SIMD并行结构，GPU线程重新调度以计算个体输出与目标输出间的误差；

最后把各输入数据的误差求和，作为最终适应值评估结果放入适应值矩阵FIT中，一旦GPU完成计算并返回，CPU辅助线程重新调用cudaMemcpy把GPU内存中的适应值矩阵FIT导出到CPU中，完成适应值评估。

进一步地，所述的步骤4)具体包括：

首先，根据EV计算各个子种群间的相似度，若相似度低于预先设定的阈值，该子种群对不发生迁移操作，在迁入操作中，现计算阶段适应值最优的子种群把最优个体迁入到其他子种群，替换掉其他子种群的最优个体；在迁出操作中，任意两个子种群随机选出一个个体进行比较，适应值较优个体替换较差个体以实现迁出操作。

进一步地，步骤4)中，迁移操作采用余弦距离公式(5)来衡量两个子种群的相似性：

其中，G是现计算阶段最优适应值个体所在的子种群，K是待进行迁入操作的子种群序号，i，j是任意两个执行迁出操作的子种群，EV_t与EV_f分别是子种群关于终端符号与函数的EV，仅当Ω(·)小于阈值ω时，迁移操作才会执行，为了实际应用中的鲁棒性与灵活性，所述阈值ω是一个0到1之间的随机数，如公式(6)所示：

ω＝rand(0，1) (6)。

一种基于自适应并行遗传算法的大规模符号回归系统，包括：

主进程模块，用于根据求解问题的构建元素集生成若干个准正交的环境向量EV，并根据EV初始化遗传编程算法的多种群；其后，主进程模块调用CPU多线程模块进行多种群的独立进化，当子种群完成独立进化，到达同步障后，主进程模块执行迁移操作(含个体的迁入操作，迁出操作)以共享搜索信息。

CPU线程模块，用于每个子种群按照给定的算子独自进行遗传编程算法的进化，每个子种群的计算由一个CPU线程负责，多个CPU线程采用流水线并行技术异步地同时计算；各子种群的进化受各自对应的EV控制，进化结果对EV产生调整；每个子种群进化中的适应值评估通过调用GPU适应值评估模块实现；

GPU适应值评估模块，用于当GPU检测到解码后的子种群信息载入缓存后，把缓存数据拷入GPU内存并执行计算，每个GPU块对应子种群的一个个体的适应值评估，每个GPU线程对应测试数据的一个输入，计算完成后，GPU把计算结果返回给CPU。

进一步地，所述的GPU适应值评估模块包括一个CPU辅助线程、CUDA库函数，及CUDA自定义函数组成，所述CPU辅助线程周期性检查缓存，当缓存空间曾被写入或已被写满后，所述CPU辅助线程使用CUDA库函数cudaMemcpy把缓存中的数据载入GPU内存中并启动CUDA自定义函数执行适应值评估。

相比现有技术，本发明具有如下有益效果：

1、本发明从四个方面来提高遗传编程算法的搜索能力：第一方面是采用划分多个子种群的方式提高遗传编程算法的局部搜索能力；第二方面是采用EV对多种群的进化进行规划提高全局搜索能力；第三方面是采用个体迁移实现全局搜索信息的共享；第四方面是采用子种群根据搜索过程对EV进行调整从而实现解空间中有效构建元素的提取。

2、本发明从三方面加速遗传编程算法的计算速度：一方面使用GPU计算数据重复率高，数值运算密集的适应值评估环节；第二方面采用CPU多线程技术计算其他复杂算子；第三方面采用缓存缩短GPU与CPU相互等待的时间，实现并行流水线作业。

3、本发明充分利用了CPU与GPU的计算资源，显著提高了搜索效率，为算法的实际应用做了进一步的推进，以有效解决大规模高维符号回归问题。

附图说明

图1基于自适应并行遗传算法的大规模符号回归系统框架示意图。

图2为GPU适应值评估的一般步骤示意图。

具体实施方式

下面结合附图对本发明的方法作进一步的描述。

假设问题中含有T(F)个终端符号(函数)，这些终端符号与函数共同构成构建元素集。终端符号与函数在每个子种群中有其对应的EV。遗传编程算法需要利用这些给定的构建元素找到满足训练数据与目标函数的数学式。

3)周期性检查缓存数据，当GPU检测到来自CPU的适应值评估请求时，GPU把缓存数据，即待适应值评估的子种群载入GPU内存，并启动GPU块及其中的GPU线程执行计算，当缓存中的所有个体完成计算后，GPU把计算结果汇总，并返回给CPU，完成适应值评估；

下面结合附图1详细介绍本发明中的主进程模块，CPU线程模块与GPU适应值评估模块。

一种基于自适应并行遗传算法的大规模符号回归系统，包括主进程模块，CPU线程模块与GPU适应值评估模块。

1、主进程模块

主进程模块包含初始化，调用CPU线程模块，同步障与迁移操作。初始化操作分为三步：一是初始化EV并根据EV初始化N_s个子种群；二是创建N_TC个CPU线程；三是申请足够数量的GPU内存。EV实际上是各子种群选择终端符号(函数)参与构建个体的概率向量。为使多种群遗传编程算法具有较好的全局性，各子种群均匀地分配到解空间的不同子空间，即各初始EV需要尽量正交化。为使初始EV正交化，假定每个初始EV中共有v_t(v_f)个终端符号(函数)的概率设成1，其余终端符号(函数)的概率设成1/T(1/F)。设成1的终端符号(函数)即该子种群的必选构建元素。所述v_t(v_f)由公式(1)决定：

每个初始EV设成1的终端符号(函数)不尽相同，以实现准正交化。随后根据EV初始化子种群中每个个体的每个基因片段。初始化过程主要包含对每个个体的基因根据EV进行赋值。以终端符号的赋值为例，设x为待赋值的一个基因，初始化的具体步骤如算法(1)所示。

其中，EV_t，i，a是第i个子种群关于终端符号的EV向量的第a个分量。因此EV分量越大的终端符号越容易被选中参与个体的构建中。基于EV的函数的赋值与算法(1)同理。在申请GPU内存中，需要分配五个矩阵：输入数据矩阵TI，标签矩阵TO，个体数据矩阵DEV，适应值矩阵FIT，当前值矩阵CV，它们的大小分别为MI×MV，MI，N_B×L，N_B，N_B×MI，其中MI是输入数据量，MV是数据的维度，N_B是GPU块的数目，L是个体的长度。完成初始化后，主进程启动CPU线程模块并等待其完成独立进化。当所有子种群到达同步障后，主进程执行迁移操作。在本发明中，对CPU线程的创建及启动采用Window自带的API，CreateThread函数完成。迁移操作采用余弦距离公式(2)来衡量两个子种群的相似性：

其中，G是计算现阶段最优适应值个体所在的子种群，K是待进行迁入操作的子种群序号，i，j是任意两个执行迁出操作的子种群，EV_t与EV_f分别是子种群关于终端符号与函数的EV。只有当Ω(·)小于阈值ω时，迁移操作才会执行。为了实际应用中的鲁棒性与灵活性，阈值ω是一个0到1之间的随机数，如公式(3)所示。

主进程不断循环CPU线程模块的调用，同步障，与迁移操作，直至算法到达终止条件。

ω＝rand(0，1) (3)。

2、CPU线程模块

CPU线程模块主要执行遗传编程算法，EV的更新，以及调用GPU适应值评估模块。遗传编程算法的常见遗传算子包括交叉，变异与选择。交叉主要思想是现有种群中个体的基因相互交换而变异则是修改单个个体的基因。交叉与变异都主要用于产生新个体。值得注意的是这里的变异也是基于EV对基因进行赋值，如上文算法(1)所示。选择是根据适应值评估从新个体与已有种群中选择适应值较优的个体组成下一代种群的过程。子种群的每一代进化后，EV都需要被更新以调整子种群的搜索范围。第i个子种群的l+1代EV更新公式如公式(4)所示：

其中，τ是更新的动量系数，与ω一样是0到1间的一个随机数。P_t,i(P_f,i)是第i个子种群中，各构建元素的出现频率，他们的每个分量由公式(5)计算。

其中n_a是第a个终端符号(或函数)在第i个子种群中的出现次数。每次更新完EV，都要对EV进行归一化为下一代根据EV执行遗传算子做准备，EV的每个分量的归一化如公式(6)所示。

随着子种群个体适应值的不断提高，有效构建元素在子种群中的频率会不断提高，EV所描述的各构建元素的比重逐渐准确，这也使得子种群逐渐由搜索初期追求多样性逐渐转为追求精确性。CPU线程模块调用GPU适应值评估模块需要先把数据解码载入缓存区。缓存区是一个由多个CPU线程共享的内存空间，可以一次容纳多个子种群的信息。每个CPU线程执行适应值评估时，先把子种群解码并紧接缓存的已有数据后面载入缓存，然后等待GPU返回适应值评估结果。GPU返回结果后，缓存的数据将被清空。多个CPU线程采用流水线并行技术异步地执行遗传编程算法，EV更新与适应值评估。

3、GPU适应值评估模块

GPU适应值评估模块由一个CPU辅助线程，CUDA库函数，及CUDA自定义函数组成。CPU辅助线程周期性检查缓存，当缓存空间曾被写入或已被写满后，CPU辅助线程使用CUDA库函数cudaMemcpy把缓存中的数据载入GPU内存中并启动CUDA自定义函数执行适应值评估。结合附图2，GPU适应值评估模块的一般步骤是GPU中的流处理器簇(SM)首先从GPU内存中把个体信息读入高速缓存。每个SM下拥有多个物理核，每个核能负责计算多个GPU块。每个块对应一个个体，块中的各GPU线程对应输入数据的不同输入。GPU线程把接受输入后，个体的输出结果临时存放到当前值矩阵(CV)中。由于GPU是SIMD并行结构，GPU线程需要重新调度以计算个体输出与目标输出间的误差。最后把各输入数据的误差求和作为最终适应值评估结果放入FIT矩阵中。一旦GPU完成计算并返回，CPU辅助线程重新调用cudaMemcpy把GPU内存中的FIT矩阵导出到CPU中。完成适应值评估。

为了测试和评估发明的算法框架的性能，以12个数据集进行仿真测试，其中9个为人工定制数据集，3个为实际应用生产中的数据，分别为蒸馏塔的气体成分色谱分析数据，NASA航空飞机噪声数据，以及北京2010年至2012年PM2.5水平数据，本发明的算法的参数设置为：N_s＝6,M_s＝256,N_B＝512,N_T＝256。最终的结果显示，本发明的算法在多次的仿真测试中在成功率，均方误差，及平均运行时间上都要明显优于一些前沿的遗传编程算法和已有的并行计算框架。这说明采用本发明在提高遗传编程算法的搜索能力与搜索效率上是十分有效的。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于自适应并行遗传算法的大规模符号回归方法，其特征在于，包括步骤：

2.根据权利要求1所述的基于自适应并行遗传算法的大规模符号回归方法，其特征在于，所述的步骤1)中，

为使初始环境向量EV正交化，假定每个初始环境向量EV中共有v_t个终端符号的概率设成1，其余终端符号的概率设成1/T；每个初始环境向量EV中共有v_f个函数的概率设成1，其余函数的概率设成1/F；设成1的终端符号即为所述子种群的必选构建元素，所述v_t、v_f由公式(1)决定：

3.根据权利要求1所述的基于自适应并行遗传算法的大规模符号回归方法，其特征在于，所述的步骤1)中，

4.根据权利要求1所述的基于自适应并行遗传算法的大规模符号回归方法，其特征在于，所述的步骤1)中，

5.根据权利要求1所述的基于自适应并行遗传算法的大规模符号回归方法，其特征在于，步骤2)中，所述EV更新操作主要依据该子种群中各构建元素的出现频率进行调整，具体包括：

针对第i个子种群的l+1代EV更新公式如公式(2)所示：

其中，τ是更新的动量系数，是0到1间的一个随机数，P_t,i和P_f,i是第i个子种群中，各构建元素的出现频率，它们的每个分量由公式(3)计算：

其中n_a是第a个终端符号或函数在第i个子种群中的出现次数，每次更新完EV，都要对EV进行归一化为下一代根据EV执行遗传算子做准备，EV的每个分量的归一化如公式(4)所示：

6.根据权利要求1所述的基于自适应并行遗传算法的大规模符号回归方法，其特征在于，进行适应值评估具体包括步骤：

GPU中的流处理器簇从GPU内存中把个体信息读入高速缓存，每个流处理器簇下拥有多个物理核，每个核能负责计算多个GPU块，每个GPU块对应一个个体，GPU块中的各GPU线程对应测试数据的不同输入；

7.根据权利要求1所述的基于自适应并行遗传算法的大规模符号回归方法，其特征在于，所述的步骤4)具体包括：

8.根据权利要求1所述的基于自适应并行遗传算法的大规模符号回归方法，其特征在于，步骤4)中，迁移操作采用余弦距离公式(5)来衡量两个子种群的相似性:

其中，G是现计算阶段最优适应值个体所在的子种群，K是待进行迁入操作的子种群序号，i,j是任意两个执行迁出操作的子种群，EV_t与EV_f分别是子种群关于终端符号与函数的EV，仅当Ω(·)小于阈值ω时，迁移操作才会执行，为了实际应用中的鲁棒性与灵活性，所述阈值ω是一个0到1之间的随机数，如公式(6)所示：

ω＝rand(0,1) (6)。

9.一种基于自适应并行遗传算法的大规模符号回归系统，其特征在于，包括：

主进程模块，用于根据求解问题的构建元素集生成若干个准正交的环境向量EV，并根据EV初始化遗传编程算法的多种群；其后，主进程模块调用CPU多线程模块进行多种群的独立进化，当子种群完成独立进化，到达同步障后，主进程模块执行迁移操作以共享搜索信息；

10.根据权利要求要求9所述的一种基于自适应并行遗传算法的大规模符号回归系统，其特征在于：

所述的GPU适应值评估模块包括一个CPU辅助线程、CUDA库函数，及CUDA自定义函数组成，所述CPU辅助线程周期性检查缓存，当缓存空间曾被写入或已被写满后，所述CPU辅助线程使用CUDA库函数cudaMemcpy把缓存中的数据载入GPU内存中并启动CUDA自定义函数执行适应值评估。