CN113034343B

CN113034343B - 参数自适应的高光谱图像分类gpu并行方法

Info

Publication number: CN113034343B
Application number: CN202110588085.XA
Authority: CN
Inventors: 魏洁; 邓伟诗; 徐洋; 陆威; 张毅; 韦志辉; 吴泽彬
Original assignee: Nanjing University of Science and Technology
Current assignee: Nanjing University of Science and Technology
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2021-09-03
Anticipated expiration: 2041-05-28
Also published as: CN113034343A

Abstract

本发明公开了一种参数自适应的高光谱图像分类GPU并行方法，包括以下步骤：针对高光谱分类并行算法，在CPU+多GPU异构平台上构造并行计算负载均衡模型；根据CPU+多GPU异构系统负载均衡模型采用二进制编码来对异构系统的参数配置方案进行描述；根据异构系统负载均衡模型采用布谷鸟搜索算法求解CPU+多GPU异构系统负载均衡模型的最优解；根据获得的最优解为异构系统配置相应的参数并运行高光谱遥感图像分类并行算法，参数包括：CPU参与计算的核数、CPU频率、GPU参与计算的设备数、GPU频率和CPU计算的任务占总任务的百分比。本发明能够充分利用CPU与GPU的计算资源，对高光谱遥感数据进行快速地分类。

Description

参数自适应的高光谱图像分类GPU并行方法

技术领域

本发明属于遥感图像处理技术领域，尤其是一种参数自适应的高光谱图像分类GPU并行方法。

背景技术

高光谱遥感影像分类技术是遥感影像处理技术的重要研究课题之一，已经被成功应用在地质调查、生物科学、海洋勘探、大气监测等多个领域中，具有较高的研究意义和应用价值。但是，随着高光谱成像技术日益成熟和分类算法的不断发展，高光谱影像的数据量越来越大，算法复杂度越来越高，传统的计算机串行处理已经不能满足高光谱影像快速分类的需求。因此，如何实现快速高效的高光谱遥感影像分类成为高光谱遥感分类技术发展的关键问题之一。随着高性能计算技术的发展，GPU因其强大的并行计算能力被广泛应用在各个科学计算领域中，为高光谱遥感影像高效处理提供了新的机遇。

基于多GPU的高光谱分类算法可以实现明显的加速，但是，也存在一定的局限性。整个过程中CPU只负责数据传输、少部分逻辑计算和GPU管理，在GPU执行计算过程中属于空等状态，没有利用CPU的计算资源，运行时间并没有做到最小化。因此，可以在GPU计算的同时，将一部分的计算任务分配在CPU上进行，合理利用异构系统硬件资源，进一步减少计算时间。在异构系统带来明显速度提升的同时，异构系统的能耗也是广受关注的问题之一。在多GPU异构系统中，性能的提升往往也意味着能耗的增加。能耗的增加不仅提高了对系统散热技术的要求，同时还可能会对系统可靠性造成影响。因此，异构系统的能耗控制是实现高光谱影像分类高效并行处理必不可少的一部分。

发明内容

本发明的目的在于提供一种参数自适应的高光谱遥感图像分类GPU并行方法，能够实现参数自适应，且速度快、系统稳定性高。

实现本发明目的的技术解决方案为：一种参数自适应的高光谱遥感图像分类GPU并行方法，包括以下步骤：

步骤1，针对高光谱分类并行算法，构造CPU+多GPU异构系统并行计算负载均衡模型；

步骤2，根据CPU+多GPU异构系统并行计算负载均衡模型采用二进制编码来对异构系统的参数配置方案进行描述；

步骤3，根据异构系统负载均衡模型采用布谷鸟搜索算法求解CPU+多GPU异构系统负载均衡模型的最优解；

步骤4，根据获得的最优解为异构系统配置相应的参数并运行高光谱遥感图像分类并行算法，所述参数包括：CPU参与计算的核数、CPU频率、GPU参与计算的设备数、GPU频率和CPU计算的任务占总任务的百分比，称为任务比例。

进一步地，步骤1所述CPU+多GPU异构系统并行计算负载均衡模型，具体如下：

任务完整约束：在本模型中，P _c为CPU执行计算的任务比例，P _G为GPU执行计算的任务比例，任务完整约束要求任务被完整地执行，即满足P _c +P _G =1；

系统条件约束：在本模型中，各个参数的取值必须满足系统条件约束，即CPU用于任务计算的核数N _c在系统CPU所支持的核数集合F _NC中、CPU设定的频率f _C在CPU所支持的频率集合F _C中、GPU使用的设备数N _G在GPU支持的设备数集合F _NG中；

模型优化目标：为了更好地构造并且求解任务调度模型，引入了变量t和e，其中t变量代表了执行任务时间的最小值，由CPU的执行时间T _CPU和GPU的执行时间T _GPU的最大值决定；T _CPU由CPU核数N _c、频率f _C和任务比例P _C确定；e变量代表了执行所有任务所需的系统能耗，由CPU的能耗E _CPU和GPU的能耗E _GPU的总和决定；其中，E _CPU为CPU在N _c核、频率f _C配置下的功率与执行时间T _CPU的乘积，E _GPU为CPU在N _G核、频率f _G配置下的功率与执行时间T _GPU的乘积；

本模型的优化目标为最小化t和e的值，从而最小化系统执行时间和系统能耗。

进一步地，所述步骤2采用二进制编码来对异构系统负载均衡参数自适应配置的解进行描述时，编码方式如下：

设CPU核数集合为

，可选频率集合为

，根据CPU的核数量得到CPU上执行任务的最大核数为n；同理，GPU的个数集合为

，频率集合为

，CPU承担的比例集合为

；参数自适应配置解可用二进制字符串表示。

二进制字符串由左至右分为五个部分，分别用于表示CPU核参数，CPU频率， GPU承担任务计算的个数，GPU频率，CPU承担的任务比例。

设n=8, m=4, p=2, q=4，r=100，那么某一个参数自适应配置解可用以下二进制字符串表示：

该二进制字符串共15位，其中3位表示CPU核参数，2位表示CPU频率，1位表示GPU承担任务计算的个数，2位表示GPU频率，最后7位表示CPU承担的任务比例。以S _k为例，前3位101=5，即CPU采用

核参数进行计算；第4-5位10=2，即CPU频率设为

；第6位1=1，即GPU个数设为

；第7-8位 01=1，即GPU频率设为

；第9-15位0001000=8，即CPU承担计算的比例为

。

进一步地，所述步骤3包括：

步骤s31：采用布谷鸟搜索算法求解异构系统负载均衡参数自适应配置的全局最优解；

步骤s32：根据求解的最优解进行异构系统的参数配置和任务负载分配。

进一步地，所述步骤s31包括：

步骤 s311，初始化布谷鸟搜索算法的基本参数和鸟巢C _t。

步骤 s312，更新非支配鸟巢：通过评价函数计算非支配鸟巢集VC _t，并判断数量是否大于阈值Nd；如果超过阈值则计算非支配鸟巢集的拥挤度，并对非支配鸟巢集根据拥挤度从大到小排序，取前Nd个鸟巢组成C _t，否则令C _t =VC _t；

步骤 s313，判断是否满足终止条件：若超过迭代次数即

，输出C _t；否则令t=t+1；

步骤 s314，根据 Lévy飞行寻找鸟巢：C _t中的每一个布谷鸟根据Lévy飞行随机搜索新鸟巢；

步骤 s315，根据评价函数更新鸟巢：利用评价函数计算VC _t中每一个鸟巢的性能，若新鸟巢的性能比旧鸟巢好，则用新鸟巢替换旧鸟巢；

步骤s316，按比例抛弃鸟巢：遵循概率Pd随机抛弃C _t中的一部分鸟巢，并通过随机跳跃重建新鸟巢，转到步骤S312；

步骤 s317，更新最终结果：若Res为空，则将VC _t全部加入Res中；否则，加入VC _t中不被Res支配的鸟巢；

步骤s318，输出Res：Pareto最优解集。

进一步地，s312所述的评价函数计算具体包括：

步骤s3121，输入任意解S _K；

步骤s3122，根据S _K获得CPU执行任务的核数N _c与频率f _C、GPU执行任务的个数N _G与频率f _G，CPU执行任务的比例R _C；

步骤s3123，根据CPU核数N _c与频率f _C、比例R _C计算CPU执行任务的时间T _CPU、功率P _CPU；

步骤s3124，根据GPU个数N _G与频率f _G、比例1-R _C计算GPU执行任务的时间T _GPU、功率P _GPU；

步骤s3125，根据T _CPU、P _CPU，T _GPU、P _GPU计算异构系统总能耗和任务完成时间并输出，其中:

。

进一步地，所述异构系统参数自适应的最优解为解空间中的Pareto支配解。

与现有技术相比，本发明的方法有益效果是：以最短时间和系统能耗为目标，构造了CPU+多GPU异构系统负载均衡模型和评价函数，再进行二进制编码，最后采用布谷鸟搜索算法求解pareto前沿面，将布谷鸟搜索算法应用于异构系统负载均衡，提高了求解速度和求解质量，使参数自适应配置解能够同时在时间和能耗方面表现优异。

附图说明

图1是本发明参数自适应的高光谱遥感图像分类GPU并行方法的流程图。

图2是本发明基于布谷鸟搜索的高光谱分类负载均衡优化算法流程图。

图3为本发明实施例中获得的Pareto支配解前沿面示意图。

具体实施方式

针对时间、性能的多目标优化问题，启发式算法提供了有效且快速的求解手段，因其随机搜索路径优、求解速度快等优点已经被成功地应用在工业和科学计算等领域中。近年来流行的启发式算法有粒子群优化算法（Particle Swarm Optimization, PSO）、布谷鸟搜索算法（Cuckoo Search，CS）、遗传算法(Genetic Algorithm, GA)等，其中布谷鸟搜索算法从自然界布谷鸟巢寄生特性与Lévy飞行发展而来，具有适用域广、易操作、寻优能力强等待优点。

本发明提出一种参数自适应的高光谱遥感图像分类GPU并行方法，下面结合附图详细说明该方法内容。

参照图1，参数自适应的高光谱遥感图像分类GPU并行方法，包括以下步骤：

步骤1，针对高光谱分类并行算法，构造中央处理器(CPU)+多图形处理器(GPU)异构系统并行计算负载均衡模型。

步骤2，根据CPU+多GPU异构系统负载均衡模型采用二进制编码来对异构系统的参数配置方案进行描述；在本方法中，我们针对的是异构系统的参数配置，因此需要收集异构系统可配置的参数集合，具体包括：CPU参与计算的核数、CPU频率、GPU参与计算的设备数、GPU频率和CPU计算的任务占总任务的百分比。

步骤3，根据异构系统负载均衡模型采用布谷鸟搜索算法求解CPU+多GPU异构系统负载均衡模型的最优解。

步骤4，根据获得的最优解为异构系统配置相应的参数。

进一步作为优选的实施方式，针对高光谱遥感图像分类算法，设计了CPU+多GPU异构系统并行计算负载均衡模型模型；步骤1所述CPU+多GPU异构系统并行计算负载均衡模型表达式为：

其中，F _NC为CPU所支持的核数集合，F _C为CPU所支持的频率集合；F _NG为异构系统中GPU的个数，F _G为GPU所支持的频率集合。N _c为CPU用于任务计算的核数，N _G为GPU使用的个数，f _C为CPU设定的频率，f _G为GPU设定的频率，P _C、P _G为CPU、GPU分别计算的负载比例。

本实施例把异构系统中的最终完成时间设定为所有设备完成任务计算的最大时间，异构系统中的能耗设定为所有设备动态能耗的总和，即计算功率与时间的乘积。CPU的负载比例P _C满足约束条件

，并约束GPU的负载比例

。

针对CPU+多GPU异构系统设计了二进制编码方式来对异构系统负载均衡参数自适应配置的解进行描述。

示例性的，针对具体配置为1个20核CPU、2个GPU，且CPU支持13种频率、GPU支持4种频率、任务比例精度为0.1%的系统中，二进制编码方式可以通过下式对某一个参数自适应配置解进行表示：

该二进制字符串共23位，其中5位表示CPU核参数，4位表示CPU频率， 2位表示GPU承担任务计算的设备数，2位表示GPU频率，最后10位表示CPU承担的任务比例。以S _k为例，前5位10010=20，即CPU采用20核进行计算；第6-9位1000=8，即CPU频率设为

；第10-11位10=2，即GPU个数设为2；第12-13位 10=2，即GPU频率设为

；第14-24位1000010111=535，即CPU承担计算的比例为53.5%。

进一步作为优选的实施方式，所述步骤3包括：

本发明根据所建立的CPU+多GPU异构系统并行计算负载均衡模型，将参数自适应配置编码进了布谷鸟搜索算法的鸟巢坐标中，如图2所示，其中布谷鸟搜索算法求解过程如下：

步骤 s311，初始化布谷鸟搜索算法的基本参数和鸟巢C _t；

步骤 s313，判断是否满足终止条件：若超过迭代次数即

，输出C _t；否则令t=t+1；

步骤s316，按比例抛弃鸟巢：遵循概率Pd随机抛弃C _t中的一部分鸟巢，并通过随机跳跃重建新鸟巢，转到步骤 s312；

步骤s318，输出Res：Pareto最优解集；

进一步作为优选的实施方式，s312所述的评价函数计算具体包括：

步骤s3121，输入任意解S _K；

步骤s3122，根据S _K获得CPU执行任务的核数N _c与频率f _C、GPU执行任务的个数N _G与频率f _G；CPU执行任务的比例R _C；

。

进一步作为优选的实施方式，所述异构系统参数自适应的最优解为解空间中的Pareto支配解，其中Pareto支配解的概念为：

对于任意两个可行解X _A和X _B，当且仅当满足下式则称向量X _A支配X _B，记作

。

通过布谷鸟搜索算法求解，获得的Pareto支配解前沿面如图3所示，其中存在一系列的帕累托解。如解(16,2100,2,810,7.6%)表示当CPU使用16核、频率设为2100MHZ、GPU使用2个设备、频率设为810MHZ、CPU计算比例占7.6%时，系统计算时间达到最短；解(8,1800,1,745, 0.1%)表示当CPU使用8核、频率设为1800MHZ、GPU使用1个设备、频率设为745MHZ、CPU计算比例占0.1%时，系统能耗达到最小。

综上所述，本发明提出了一种基于布谷鸟搜索的高光谱分类负载均衡优化算法，并将其运用于CPU+多GPU异构系统负载均衡，且基于时间和能耗两个目标，采用了二进制编码方式应用基于布谷鸟搜索的高光谱分类负载均衡优化算法进行求解，从而能够在短时间寻取到更优的参数配置方案，使参数配置方案同时在时间和能耗方面表现良好，解决了异构系统负载不平衡，CPU资源存在浪费的问题。

以上是对本发明的较佳实施进行了具体说明，但是本发明创造并不限于所述实施例，熟悉本领域的技术人员在不违背发明精神的前提下还可以作出种种的等同变形或者替换，这些等同的变形或者替换均包含在本申请权利要求所限定的范围内。