CN113034343B - 参数自适应的高光谱图像分类gpu并行方法 - Google Patents

参数自适应的高光谱图像分类gpu并行方法 Download PDF

Info

Publication number
CN113034343B
CN113034343B CN202110588085.XA CN202110588085A CN113034343B CN 113034343 B CN113034343 B CN 113034343B CN 202110588085 A CN202110588085 A CN 202110588085A CN 113034343 B CN113034343 B CN 113034343B
Authority
CN
China
Prior art keywords
cpu
gpu
frequency
task
heterogeneous system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110588085.XA
Other languages
English (en)
Other versions
CN113034343A (zh
Inventor
魏洁
邓伟诗
徐洋
陆威
张毅
韦志辉
吴泽彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN202110588085.XA priority Critical patent/CN113034343B/zh
Publication of CN113034343A publication Critical patent/CN113034343A/zh
Application granted granted Critical
Publication of CN113034343B publication Critical patent/CN113034343B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/194Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种参数自适应的高光谱图像分类GPU并行方法,包括以下步骤:针对高光谱分类并行算法,在CPU+多GPU异构平台上构造并行计算负载均衡模型;根据CPU+多GPU异构系统负载均衡模型采用二进制编码来对异构系统的参数配置方案进行描述;根据异构系统负载均衡模型采用布谷鸟搜索算法求解CPU+多GPU异构系统负载均衡模型的最优解;根据获得的最优解为异构系统配置相应的参数并运行高光谱遥感图像分类并行算法,参数包括:CPU参与计算的核数、CPU频率、GPU参与计算的设备数、GPU频率和CPU计算的任务占总任务的百分比。本发明能够充分利用CPU与GPU的计算资源,对高光谱遥感数据进行快速地分类。

Description

参数自适应的高光谱图像分类GPU并行方法
技术领域
本发明属于遥感图像处理技术领域,尤其是一种参数自适应的高光谱图像分类GPU并行方法。
背景技术
高光谱遥感影像分类技术是遥感影像处理技术的重要研究课题之一,已经被成功应用在地质调查、生物科学、海洋勘探、大气监测等多个领域中,具有较高的研究意义和应用价值。但是,随着高光谱成像技术日益成熟和分类算法的不断发展,高光谱影像的数据量越来越大,算法复杂度越来越高,传统的计算机串行处理已经不能满足高光谱影像快速分类的需求。因此,如何实现快速高效的高光谱遥感影像分类成为高光谱遥感分类技术发展的关键问题之一。随着高性能计算技术的发展,GPU因其强大的并行计算能力被广泛应用在各个科学计算领域中,为高光谱遥感影像高效处理提供了新的机遇。
基于多GPU的高光谱分类算法可以实现明显的加速,但是,也存在一定的局限性。整个过程中CPU只负责数据传输、少部分逻辑计算和GPU管理,在GPU执行计算过程中属于空等状态,没有利用CPU的计算资源,运行时间并没有做到最小化。因此,可以在GPU计算的同时,将一部分的计算任务分配在CPU上进行,合理利用异构系统硬件资源,进一步减少计算时间。在异构系统带来明显速度提升的同时,异构系统的能耗也是广受关注的问题之一。在多GPU异构系统中,性能的提升往往也意味着能耗的增加。能耗的增加不仅提高了对系统散热技术的要求,同时还可能会对系统可靠性造成影响。因此,异构系统的能耗控制是实现高光谱影像分类高效并行处理必不可少的一部分。
发明内容
本发明的目的在于提供一种参数自适应的高光谱遥感图像分类GPU并行方法,能够实现参数自适应,且速度快、系统稳定性高。
实现本发明目的的技术解决方案为:一种参数自适应的高光谱遥感图像分类GPU并行方法,包括以下步骤:
步骤1,针对高光谱分类并行算法,构造CPU+多GPU异构系统并行计算负载均衡模型;
步骤2,根据CPU+多GPU异构系统并行计算负载均衡模型采用二进制编码来对异构系统的参数配置方案进行描述;
步骤3,根据异构系统负载均衡模型采用布谷鸟搜索算法求解CPU+多GPU异构系统负载均衡模型的最优解;
步骤4,根据获得的最优解为异构系统配置相应的参数并运行高光谱遥感图像分类并行算法,所述参数包括:CPU参与计算的核数、CPU频率、GPU参与计算的设备数、GPU频率和CPU计算的任务占总任务的百分比,称为任务比例。
进一步地,步骤1所述CPU+多GPU异构系统并行计算负载均衡模型,具体如下:
任务完整约束:在本模型中,P c 为CPU执行计算的任务比例,P G 为GPU执行计算的任务比例,任务完整约束要求任务被完整地执行,即满足P c +P G =1;
系统条件约束:在本模型中,各个参数的取值必须满足系统条件约束,即CPU用于任务计算的核数N c 在系统CPU所支持的核数集合F NC 中、CPU设定的频率f C 在CPU所支持的频率集合F C 中、GPU使用的设备数N G 在GPU支持的设备数集合F NG 中;
模型优化目标:为了更好地构造并且求解任务调度模型,引入了变量te,其中t变量代表了执行任务时间的最小值,由CPU的执行时间T CPU 和GPU的执行时间T GPU 的最大值决定;T CPU 由CPU核数N c 、频率f C 和任务比例P C 确定;e变量代表了执行所有任务所需的系统能耗,由CPU的能耗E CPU 和GPU的能耗E GPU 的总和决定;其中,E CPU 为CPU在N c 核、频率f C 配置下的功率与执行时间T CPU 的乘积,E GPU 为CPU在N G 核、频率f G 配置下的功率与执行时间T GPU 的乘积;
本模型的优化目标为最小化te的值,从而最小化系统执行时间和系统能耗。
进一步地,所述步骤2采用二进制编码来对异构系统负载均衡参数自适应配置的解进行描述时,编码方式如下:
设CPU核数集合为
Figure 100002_DEST_PATH_IMAGE001
,可选频率集合为
Figure DEST_PATH_IMAGE002
,根据CPU的核数量得到CPU上执行任务的最大核数为n;同理,GPU的个数集合为
Figure DEST_PATH_IMAGE003
,频率集合为
Figure DEST_PATH_IMAGE004
,CPU承担的比例集合为
Figure DEST_PATH_IMAGE005
;参数自适应配置解可用二进制字符串表示。
二进制字符串由左至右分为五个部分,分别用于表示CPU核参数,CPU频率, GPU承担任务计算的个数,GPU频率,CPU承担的任务比例。
设n=8, m=4, p=2, q=4,r=100,那么某一个参数自适应配置解可用以下二进制字符串表示:
Figure DEST_PATH_IMAGE006
该二进制字符串共15位,其中3位表示CPU核参数,2位表示CPU频率,1位表示GPU承担任务计算的个数,2位表示GPU频率,最后7位表示CPU承担的任务比例。以S k 为例,前3位101=5,即CPU采用
Figure DEST_PATH_IMAGE007
核参数进行计算;第4-5位10=2,即CPU频率设为
Figure DEST_PATH_IMAGE008
;第6位1=1,即GPU个数设为
Figure DEST_PATH_IMAGE009
;第7-8位 01=1,即GPU频率设为
Figure DEST_PATH_IMAGE010
;第9-15位0001000=8,即CPU承担计算的比例为
Figure DEST_PATH_IMAGE012
进一步地,所述步骤3包括:
步骤s31:采用布谷鸟搜索算法求解异构系统负载均衡参数自适应配置的全局最优解;
步骤s32:根据求解的最优解进行异构系统的参数配置和任务负载分配。
进一步地,所述步骤s31包括:
步骤 s311,初始化布谷鸟搜索算法的基本参数和鸟巢C t
步骤 s312,更新非支配鸟巢:通过评价函数计算非支配鸟巢集VC t ,并判断数量是否大于阈值Nd;如果超过阈值则计算非支配鸟巢集的拥挤度,并对非支配鸟巢集根据拥挤度从大到小排序,取前Nd个鸟巢组成C t ,否则令C t =VC t
步骤 s313,判断是否满足终止条件:若超过迭代次数即
Figure DEST_PATH_IMAGE013
,输出C t ;否则令t=t+1;
步骤 s314,根据 Lévy飞行寻找鸟巢:C t 中的每一个布谷鸟根据Lévy飞行随机搜索新鸟巢;
步骤 s315,根据评价函数更新鸟巢:利用评价函数计算VC t 中每一个鸟巢的性能,若新鸟巢的性能比旧鸟巢好,则用新鸟巢替换旧鸟巢;
步骤s316,按比例抛弃鸟巢:遵循概率Pd随机抛弃C t 中的一部分鸟巢,并通过随机跳跃重建新鸟巢,转到步骤S312;
步骤 s317,更新最终结果:若Res为空,则将VC t 全部加入Res中;否则,加入VC t 中不被Res支配的鸟巢;
步骤s318,输出Res:Pareto最优解集。
进一步地,s312所述的评价函数计算具体包括:
步骤s3121,输入任意解S K
步骤s3122,根据S K 获得CPU执行任务的核数N c 与频率f C 、GPU执行任务的个数N G 与频率f G ,CPU执行任务的比例R C
步骤s3123,根据CPU核数N c 与频率f C 、比例R C 计算CPU执行任务的时间T CPU 、功率P CPU
步骤s3124,根据GPU个数N G 与频率f G 、比例1-R C 计算GPU执行任务的时间T GPU 、功率P GPU
步骤s3125,根据T CPU P CPU T GPU P GPU 计算异构系统总能耗和任务完成时间并输出,其中:
Figure DEST_PATH_IMAGE014
进一步地,所述异构系统参数自适应的最优解为解空间中的Pareto支配解。
与现有技术相比,本发明的方法有益效果是:以最短时间和系统能耗为目标,构造了CPU+多GPU异构系统负载均衡模型和评价函数,再进行二进制编码,最后采用布谷鸟搜索算法求解pareto前沿面,将布谷鸟搜索算法应用于异构系统负载均衡,提高了求解速度和求解质量,使参数自适应配置解能够同时在时间和能耗方面表现优异。
附图说明
图1是本发明参数自适应的高光谱遥感图像分类GPU并行方法的流程图。
图2是本发明基于布谷鸟搜索的高光谱分类负载均衡优化算法流程图。
图3为本发明实施例中获得的Pareto支配解前沿面示意图。
具体实施方式
针对时间、性能的多目标优化问题,启发式算法提供了有效且快速的求解手段,因其随机搜索路径优、求解速度快等优点已经被成功地应用在工业和科学计算等领域中。近年来流行的启发式算法有粒子群优化算法(Particle Swarm Optimization, PSO)、布谷鸟搜索算法(Cuckoo Search,CS)、遗传算法(Genetic Algorithm, GA)等,其中布谷鸟搜索算法从自然界布谷鸟巢寄生特性与Lévy飞行发展而来,具有适用域广、易操作、寻优能力强等待优点。
本发明提出一种参数自适应的高光谱遥感图像分类GPU并行方法,下面结合附图详细说明该方法内容。
参照图1,参数自适应的高光谱遥感图像分类GPU并行方法,包括以下步骤:
步骤1,针对高光谱分类并行算法,构造中央处理器(CPU)+多图形处理器(GPU)异构系统并行计算负载均衡模型。
步骤2,根据CPU+多GPU异构系统负载均衡模型采用二进制编码来对异构系统的参数配置方案进行描述;在本方法中,我们针对的是异构系统的参数配置,因此需要收集异构系统可配置的参数集合,具体包括:CPU参与计算的核数、CPU频率、GPU参与计算的设备数、GPU频率和CPU计算的任务占总任务的百分比。
步骤3,根据异构系统负载均衡模型采用布谷鸟搜索算法求解CPU+多GPU异构系统负载均衡模型的最优解。
步骤4,根据获得的最优解为异构系统配置相应的参数。
进一步作为优选的实施方式,针对高光谱遥感图像分类算法,设计了CPU+多GPU异构系统并行计算负载均衡模型模型;步骤1所述CPU+多GPU异构系统并行计算负载均衡模型表达式为:
Figure DEST_PATH_IMAGE015
其中,F NC 为CPU所支持的核数集合,F C 为CPU所支持的频率集合;F NG 为异构系统中GPU的个数,F G 为GPU所支持的频率集合。N c 为CPU用于任务计算的核数,N G 为GPU使用的个数,f C 为CPU设定的频率,f G 为GPU设定的频率,P C P G 为CPU、GPU分别计算的负载比例。
本实施例把异构系统中的最终完成时间设定为所有设备完成任务计算的最大时间,异构系统中的能耗设定为所有设备动态能耗的总和,即计算功率与时间的乘积。CPU的负载比例P C 满足约束条件
Figure DEST_PATH_IMAGE016
,并约束GPU的负载比例
Figure DEST_PATH_IMAGE017
针对CPU+多GPU异构系统设计了二进制编码方式来对异构系统负载均衡参数自适应配置的解进行描述。
示例性的,针对具体配置为1个20核CPU、2个GPU,且CPU支持13种频率、GPU支持4种频率、任务比例精度为0.1%的系统中,二进制编码方式可以通过下式对某一个参数自适应配置解进行表示:
Figure DEST_PATH_IMAGE018
该二进制字符串共23位,其中5位表示CPU核参数,4位表示CPU频率, 2位表示GPU承担任务计算的设备数,2位表示GPU频率,最后10位表示CPU承担的任务比例。以S k 为例,前5位10010=20,即CPU采用20核进行计算;第6-9位1000=8,即CPU频率设为
Figure DEST_PATH_IMAGE019
;第10-11位10=2,即GPU个数设为2;第12-13位 10=2,即GPU频率设为
Figure DEST_PATH_IMAGE020
;第14-24位1000010111=535,即CPU承担计算的比例为53.5%。
进一步作为优选的实施方式,所述步骤3包括:
步骤s31:采用布谷鸟搜索算法求解异构系统负载均衡参数自适应配置的全局最优解;
步骤s32:根据求解的最优解进行异构系统的参数配置和任务负载分配。
本发明根据所建立的CPU+多GPU异构系统并行计算负载均衡模型,将参数自适应配置编码进了布谷鸟搜索算法的鸟巢坐标中,如图2所示,其中布谷鸟搜索算法求解过程如下:
步骤 s311,初始化布谷鸟搜索算法的基本参数和鸟巢C t
步骤 s312,更新非支配鸟巢:通过评价函数计算非支配鸟巢集VC t ,并判断数量是否大于阈值Nd;如果超过阈值则计算非支配鸟巢集的拥挤度,并对非支配鸟巢集根据拥挤度从大到小排序,取前Nd个鸟巢组成C t ,否则令C t =VC t
步骤 s313,判断是否满足终止条件:若超过迭代次数即
Figure 90566DEST_PATH_IMAGE013
,输出C t ;否则令t=t+1;
步骤 s314,根据 Lévy飞行寻找鸟巢:C t 中的每一个布谷鸟根据Lévy飞行随机搜索新鸟巢;
步骤 s315,根据评价函数更新鸟巢:利用评价函数计算VC t 中每一个鸟巢的性能,若新鸟巢的性能比旧鸟巢好,则用新鸟巢替换旧鸟巢;
步骤s316,按比例抛弃鸟巢:遵循概率Pd随机抛弃C t 中的一部分鸟巢,并通过随机跳跃重建新鸟巢,转到步骤 s312;
步骤 s317,更新最终结果:若Res为空,则将VC t 全部加入Res中;否则,加入VC t 中不被Res支配的鸟巢;
步骤s318,输出Res:Pareto最优解集;
进一步作为优选的实施方式,s312所述的评价函数计算具体包括:
步骤s3121,输入任意解S K
步骤s3122,根据S K 获得CPU执行任务的核数N c 与频率f C 、GPU执行任务的个数N G 与频率f G ;CPU执行任务的比例R C
步骤s3123,根据CPU核数N c 与频率f C 、比例R C 计算CPU执行任务的时间T CPU 、功率P CPU
步骤s3124,根据GPU个数N G 与频率f G 、比例1-R C 计算GPU执行任务的时间T GPU 、功率P GPU
步骤s3125,根据T CPU P CPU T GPU P GPU 计算异构系统总能耗和任务完成时间并输出,其中:
Figure 588543DEST_PATH_IMAGE014
进一步作为优选的实施方式,所述异构系统参数自适应的最优解为解空间中的Pareto支配解,其中Pareto支配解的概念为:
对于任意两个可行解X A X B ,当且仅当满足下式则称向量X A 支配X B ,记作
Figure DEST_PATH_IMAGE021
Figure DEST_PATH_IMAGE022
通过布谷鸟搜索算法求解,获得的Pareto支配解前沿面如图3所示,其中存在一系列的帕累托解。如解(16,2100,2,810,7.6%)表示当CPU使用16核、频率设为2100MHZ、GPU使用2个设备、频率设为810MHZ、CPU计算比例占7.6%时,系统计算时间达到最短;解(8,1800,1,745, 0.1%)表示当CPU使用8核、频率设为1800MHZ、GPU使用1个设备、频率设为745MHZ、CPU计算比例占0.1%时,系统能耗达到最小。
综上所述,本发明提出了一种基于布谷鸟搜索的高光谱分类负载均衡优化算法,并将其运用于CPU+多GPU异构系统负载均衡,且基于时间和能耗两个目标,采用了二进制编码方式应用基于布谷鸟搜索的高光谱分类负载均衡优化算法进行求解,从而能够在短时间寻取到更优的参数配置方案,使参数配置方案同时在时间和能耗方面表现良好,解决了异构系统负载不平衡,CPU资源存在浪费的问题。
以上是对本发明的较佳实施进行了具体说明,但是本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背发明精神的前提下还可以作出种种的等同变形或者替换,这些等同的变形或者替换均包含在本申请权利要求所限定的范围内。

Claims (5)

1.一种参数自适应的高光谱遥感图像分类GPU并行方法,其特征在于,包括以下步骤:
步骤1,针对高光谱分类并行算法,构造CPU+多GPU异构系统并行计算负载均衡模型;
所述CPU+多GPU异构系统并行计算负载均衡模型,具体如下:
任务完整约束:在所述模型中,P c 为CPU执行计算的任务比例,P G 为GPU执行计算的任务比例,任务完整约束要求任务被完整地执行,即满足P c +P G =1;
系统条件约束:在所述模型中,各个参数的取值必须满足系统条件约束,即CPU用于任务计算的核数N c 在系统CPU所支持的核数集合F NC 中、CPU设定的频率f C 在CPU所支持的频率集合F C 中、GPU使用的设备数N G 在GPU支持的设备数集合F NG 中;
模型优化目标:为了更好地构造并且求解任务调度模型,引入了变量te,其中t变量代表了执行任务时间的最小值,由CPU的执行时间T CPU 和GPU的执行时间T GPU 的最大值决定;T CPU 由CPU核数N c 、频率f C 和任务比例P C 确定;e变量代表了执行所有任务所需的系统能耗,由CPU的能耗E CPU 和GPU的能耗E GPU 的总和决定;其中,E CPU 为CPU在N c 核、频率f C 配置下的功率与执行时间T CPU 的乘积,E GPU 为CPU在N G 核、频率f G 配置下的功率与执行时间T GPU 的乘积;
所述模型的优化目标为最小化te的值,从而最小化系统执行时间和系统能耗;
所述CPU+多GPU异构系统并行计算负载均衡模型表达式为:
Figure DEST_PATH_IMAGE001
其中,F G 为GPU所支持的频率集合;
步骤2,根据CPU+多GPU异构系统并行计算负载均衡模型采用二进制编码来对异构系统的参数配置方案进行描述;具体编码方式如下:
设CPU核数集合为
Figure 967434DEST_PATH_IMAGE002
,CPU频率集合为
Figure 87837DEST_PATH_IMAGE003
,根据CPU核数得到CPU上执行任务的最大核数为n;同理,GPU个数集合为
Figure 133153DEST_PATH_IMAGE004
,GPU频率集合为
Figure 856259DEST_PATH_IMAGE005
,CPU承担的任务比例集合为
Figure 936210DEST_PATH_IMAGE006
;参数自适应配置解可用二进制字符串表示;
二进制字符串由左至右分为五个部分,分别用于表示CPU核数,CPU频率,GPU个数,GPU频率,CPU承担的任务比例;
步骤3,根据异构系统负载均衡模型采用布谷鸟搜索算法求解CPU+多GPU异构系统负载均衡模型的最优解;
步骤4,根据获得的最优解为异构系统配置相应的参数并运行高光谱遥感图像分类并行算法,所述参数包括:CPU参与计算的核数、CPU频率、GPU参与计算的设备数、GPU频率和CPU计算的任务占总任务的百分比。
2.根据权利要求1所述的参数自适应的高光谱遥感图像分类GPU并行方法,其特征在于,步骤3求解最优解的方法如下:
步骤s31:采用布谷鸟搜索算法求解异构系统负载均衡参数自适应配置的全局最优解;
步骤s32:根据求解的最优解进行异构系统的参数配置和任务负载分配。
3.根据权利要求2所述的参数自适应的高光谱遥感图像分类GPU并行方法,其特征在于,步骤s31包括:
步骤s311,初始化布谷鸟搜索算法的基本参数和鸟巢集C t
步骤s312,更新非支配鸟巢:通过评价函数计算非支配鸟巢集VC t ,并判断数量是否大于阈值Nd;如果超过阈值则计算非支配鸟巢集的拥挤度,并对非支配鸟巢集根据拥挤度从大到小排序,取前Nd个鸟巢组成C t ,否则令C t =VC t
步骤s313,判断是否满足终止条件:若超过迭代次数即
Figure 961935DEST_PATH_IMAGE007
,输出C t ;否则令t=t+1;
步骤s314,根据Lévy飞行寻找鸟巢:C t 中的每一个布谷鸟根据Lévy飞行随机搜索新鸟巢;
步骤s315,根据评价函数更新鸟巢:利用评价函数计算VC t 中每一个鸟巢的性能,若新鸟巢的性能比旧鸟巢好,则用新鸟巢替换旧鸟巢;
步骤s316,按比例抛弃鸟巢:遵循概率Pd随机抛弃C t 中的一部分鸟巢,并通过随机跳跃重建新鸟巢,转到步骤S312;
步骤 s317,更新最终结果:若Res为空,则将VC t 全部加入Res中;否则,加入VC t 中不被Res支配的鸟巢;
步骤s318,输出Res:Pareto最优解集。
4.根据权利要求3所述的参数自适应的高光谱遥感图像分类GPU并行方法,其特征在于,评价函数计算步骤包括:
1)输入任意解S K
2)根据S K 获得CPU执行任务的核数N c 与频率f C 、GPU执行任务的个数N G 与频率f G ,CPU执行任务的比例R C
3)根据CPU核数N c 与频率f C 、比例R C 计算CPU执行任务的时间T CPU 、功率P CPU
4)根据GPU个数N G 与频率f G 、比例1-R C 计算GPU执行任务的时间T GPU 、功率P GPU
5)根据T CPU P CPU T GPU P GPU 计算异构系统总能耗和任务完成时间并输出,其中,异构系统总能耗
Figure 494547DEST_PATH_IMAGE008
5.根据权利要求2-4任一所述的参数自适应的高光谱遥感图像分类GPU并行方法,其特征在于,所述的异构系统参数自适应的最优解为解空间中的Pareto支配解。
CN202110588085.XA 2021-05-28 2021-05-28 参数自适应的高光谱图像分类gpu并行方法 Active CN113034343B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110588085.XA CN113034343B (zh) 2021-05-28 2021-05-28 参数自适应的高光谱图像分类gpu并行方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110588085.XA CN113034343B (zh) 2021-05-28 2021-05-28 参数自适应的高光谱图像分类gpu并行方法

Publications (2)

Publication Number Publication Date
CN113034343A CN113034343A (zh) 2021-06-25
CN113034343B true CN113034343B (zh) 2021-09-03

Family

ID=76456012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110588085.XA Active CN113034343B (zh) 2021-05-28 2021-05-28 参数自适应的高光谱图像分类gpu并行方法

Country Status (1)

Country Link
CN (1) CN113034343B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114416365B (zh) * 2022-01-18 2022-09-27 北京拙河科技有限公司 基于gpu融合处理的超清画质图像数据处理方法与装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344777A (zh) * 2018-10-09 2019-02-15 电子科技大学 基于elm的高光谱遥感影像土地利用覆盖的优化分类方法
CN109558888A (zh) * 2017-09-27 2019-04-02 武汉嫦娥信息科技有限公司 一种高光谱遥感图像分类的并行化加速算法
CN109948462A (zh) * 2019-02-27 2019-06-28 南京理工大学 基于多gpu协同交互数据流组织的高光谱图像快速分类法
CN111428787A (zh) * 2020-03-24 2020-07-17 上海海洋大学 一种基于gpu的高光谱图像并行分类方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446936B (zh) * 2016-09-06 2019-07-02 哈尔滨工业大学 基于卷积神经网络的空谱联合数据转波形图的高光谱数据分类方法
US10832094B2 (en) * 2018-04-10 2020-11-10 International Business Machines Corporation Generating hyperspectral image database by machine learning and mapping of color images to hyperspectral domain

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109558888A (zh) * 2017-09-27 2019-04-02 武汉嫦娥信息科技有限公司 一种高光谱遥感图像分类的并行化加速算法
CN109344777A (zh) * 2018-10-09 2019-02-15 电子科技大学 基于elm的高光谱遥感影像土地利用覆盖的优化分类方法
CN109948462A (zh) * 2019-02-27 2019-06-28 南京理工大学 基于多gpu协同交互数据流组织的高光谱图像快速分类法
CN111428787A (zh) * 2020-03-24 2020-07-17 上海海洋大学 一种基于gpu的高光谱图像并行分类方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Binary Cuckoo SearchAlgorithm for Band Selection in Hyperspectral Image Classification;Seyyid Ahmed Medjahed等;《IAENG International Journal of Computer Science》;20150818;全文 *
MULTIPLE FEATURES FUSION FOR HYPERSPECTRAL IMAGE CLASSIFICATION BASED ON EXTREME LEARNING MACHINE;Wei Liu等;《IEEE Xplore》;20171204;全文 *
面向CPU-GPU异构系统的数据分析负载均衡策略;孙婷婷等;《计算机工程与科学》;20190331;全文 *
高光谱图像分类的GPU并行优化研究;王启聪;《万方学位论文全文数据库》;20151231;全文 *
高光谱图像波段选择的改进二进制布谷鸟算法;宋广钦等;《测绘通报》;20190430;全文 *

Also Published As

Publication number Publication date
CN113034343A (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
Zhang et al. BoostGCN: A framework for optimizing GCN inference on FPGA
Wu et al. Enabling on-device cnn training by self-supervised instance filtering and error map pruning
Du et al. Efficient softmax hardware architecture for deep neural networks
CN109934331A (zh) 用于执行人工神经网络正向运算的装置和方法
CN109858623A (zh) 用于执行人工神经网络正向运算的装置和方法
US20150262062A1 (en) Decision tree threshold coding
CN109388565B (zh) 基于生成式对抗网络的软件系统性能优化方法
Zhang et al. Efficient and merged biogeography-based optimization algorithm for global optimization problems
CN113868366B (zh) 一种面向流数据的在线跨模态检索方法与系统
Dai et al. SparseTrain: Exploiting dataflow sparsity for efficient convolutional neural networks training
CN110110402B (zh) 基于二叉决策图的资源分配系统可达状态的快速求解方法
Shimoda et al. All binarized convolutional neural network and its implementation on an FPGA
WO2023124342A1 (zh) 一种针对图像分类的神经网络结构低成本自动搜索方法
CN113034343B (zh) 参数自适应的高光谱图像分类gpu并行方法
Senge et al. Fast fuzzy pattern tree learning for classification
CN113255873A (zh) 一种聚类天牛群优化方法、系统、计算机设备和存储介质
TW202001611A (zh) 多元流動網路之可靠度計算方法及其系統
Peroni et al. ARGA: Approximate reuse for GPGPU acceleration
CN114546609A (zh) 一种面向异构集群的dnn推理任务批调度方法
CN110175287B (zh) 一种基于Flink的矩阵分解隐式反馈推荐方法和系统
Zhan et al. Field programmable gate array‐based all‐layer accelerator with quantization neural networks for sustainable cyber‐physical systems
Lin et al. Latency-driven model placement for efficient edge intelligence service
US20200134434A1 (en) Arithmetic processing device, learning program, and learning method
Sakellariou et al. An FPGA accelerator for spiking neural network simulation and training
Feng et al. Web service QoS classification based on optimized convolutional neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant