CN101937082A - 基于gpu众核平台的合成孔径雷达并行成像方法 - Google Patents
基于gpu众核平台的合成孔径雷达并行成像方法 Download PDFInfo
- Publication number
- CN101937082A CN101937082A CN2009100883719A CN200910088371A CN101937082A CN 101937082 A CN101937082 A CN 101937082A CN 2009100883719 A CN2009100883719 A CN 2009100883719A CN 200910088371 A CN200910088371 A CN 200910088371A CN 101937082 A CN101937082 A CN 101937082A
- Authority
- CN
- China
- Prior art keywords
- gpu
- cpu
- parallel
- imaging
- sar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明公开了一种基于GPU众核平台的合成孔径雷达并行成像方法,首先将原始回波数据导入GPU的全局存储器,然后由CPU发起运算请求,由GPU来完成运算,按照这种模式计算,直到得到SAR的成像结果,然后将结果数据导回内存,并由CPU完成结果保存。本发明通过并行编程实现了在GPU上SAR成像的并行实现,提高了程序的并行度,使得运行效率很大的提高,运算时间大大减少;在整个处理过程中,除数据的导入导出之外,所有的运算均是由GPU来并行完成和实现的,充分利用了GPU强大的计算能力,最大限度的提高了并行度。
Description
技术领域
本发明涉及一种基于GPU众核平台的合成孔径雷达成像方法及其并行实现。
背景技术
合成孔径雷达(SAR)是一种二维微波遥感成像雷达,这种雷达具有远距离全天候高分辨率成像、自动识别目标和先进的数字处理能力等特点。随着SAR技术的发展,对SAR图像的成像精度和实时性的要求也越来越高,尤其军用需求。一幅SAR图像的获得需要处理海量的原始数据,因而要想达到实时成像的目的,需要处理平台具有十亿次,甚至百亿次每秒的处理速度。完成这么大的数据量在单处理器的计算机上几乎不可能实现,因而需要利用并行计算的技术。
2007年,NVIDIA推出了新型架构的GPU,将GPU看作可以并行执行多个线程的计算设备,GPU作为协处理器,处理大量的并行运算,而且目前已经做到一个芯片含有数百个流处理器,浮点运算性能大大提高。然而,如此强大的计算设备如何用来完成对计算精度和实时性都要求苛刻的SAR成像呢?
发明内容
本发明要解决的问题就是在包含成百上千个流处理器的GPU上并行、高效的实现SAR成像方法并在工程实践中加以应用。
本发明的技术方案包括以下步骤:
第一步:计算回波数据所占存储空间的大小,标记为:A;
第二步:在内存分配大小为A的存储空间,标记为B;
第三步:将回波数据从磁盘复制到内存B;
第四步:在GPU的全局存储器分配大小为A的存储空间,标记为C;
第五步:将回波数据从内存B复制到GPU的全局存储器C;
第六步:按照SAR成像算法,编写第一个模块的代码:
a)根据该模块运算的输入输出,在GPU的全局存储器分配存储空间D、E;
b)编写该模块的由GPU来执行的内核函数的并行代码,输入输出分别为D、E,中间变量分配在隶属于每一个线程块的共享存储器、每个线程私有的本地存储器以及其他分布在GPU的存储空间;
c)根据运算数据的大小和硬件的资源,设置内核函数执行配置;
d)在主函数中编写CPU调用对应内核函数时所用的调用指令代码;
第七步:按照上述方法,顺序编写完成SAR成像的各个模块的程序,直到得到SAR最终的成像结果;
第八步:在CPU内存分配大小为A的存储空间,记为F;
第九步:将成像结果从GPU复制到CPU的内存F,然后CPU将成像结果数据F进行保存以待查看。
通过以上CPU与GPU的协作就完成了SAR成像的并行实现。
本发明的有益效果:
首先,通过并行编程,实现了在GPU上的SAR并行成像,提高了程序的并行度,使得运行效率很大的提高,运算时间大大减少;
其次,在整个处理过程中,除数据的导入导出之外,所有的运算均是由GPU来并行完成和实现的,充分利用了GPU强大的计算能力,最大限度的提高了并行度;
再有,整个处理过程中,在CPU与GPU之间只有两次也是不可避免的两次通信开销,即原始数据的导入和输出结果的导出,而处理过程中在CPU与GPU之间是没有数据通信开销的,因此,通信消耗在本方法中也压缩到了最小;
此外,在程序运行过程中,CPU和GPU的关系是:CPU发号施令,通知GPU,然后GPU并行完成所有运算,并保存运算结果,而运算的输入输出对于CPU而言是不可见的,因此,本方法也是善于完成流程控制的CPU与专注于高密集计算的GPU的精诚合作的结晶。
附图说明
图1为本发明的基于GPU众核平台的合成孔径雷达并行成像方法流程图;
具体实施方式
基本思路是,首先将原始回波数据导入GPU的全局存储器,然后由CPU发起运算请求,由GPU来完成运算,按照这种模式一直计算,直到得到SAR的成像结果,然后将结果数据导回内存,并由CPU完成结果保存。以在SAR系统中采用RD算法对图像尺寸是4096×4096的点目标来进行成像的应用为例,GPU平台是NVIDIA的GPU,型号Quadro_FX_5600,实现主要包括以下流程:
第一步:计算回波数据所占存储空间的大小,标记为:size;
第二步:在内存分配大小为size的存储空间,记为Echo_H;
第三步:将回波数据以复数形式从磁盘复制到内存Echo_H;
第四步:在GPU的全局存储器分配大小为size的存储空间,记为Echo_D;
第五步:通过函数cudaMemcpy将回波数据Echo_H从内存复制到GPU的Echo_D;
第六步:按照RD算法原理,编写第一个模块的代码:
a)根据该模块运算的输入输出,在GPU的全局存储器分配存储空间idata、odata;
b)编写完成该模块运算的内核函数的并行代码,输入输出分别为idata、odata,中间变量分配在隶属于每一个线程块的共享存储器、每个线程私有的本地存储器以及其他分布在GPU的存储空间;
c)根据运算数据的大小和硬件的资源,设置内核函数执行配置;
d)在主函数中编写CPU调用对应内核函数时所用的调用指令代码;
第七步:按照上述方法,顺序编写完成SAR成像的各个模块的程序,直到得到SAR最终的成像结果;
第八步:在CPU内存分配大小为size的存储空间,记为Result_H;
第九步:将成像结果通过函数cudaMemcpy从GPU的全局存储器复制到CPU的内存Result_H,然后CPU将成像结果数据Result_H进行保存以待查看。
遵循以上步骤,编写完成整个RD算法程序,即完成了在GPU众核平台的RD并行算法实现。
在本方法中,运算的部分除数据的导入导出之外完全由GPU来并行实现而流程的控制以及子函数的调用均是由CPU来发起和主导,因此实现了具有强大计算能力的GPU与具有良好流程控制能力的CPU的有效结合,再加上对通信消耗最大限度的压缩,使得SAR成像的工程效率在引入本方法后显著提升。
Claims (1)
1.一种基于GPU众核平台的合成孔径雷达并行成像方法,其特征在于:该方法包括以下步骤:
第一步:计算回波数据所占存储空间的大小,标记为:A;
第二步:在内存分配大小为A的存储空间,标记为B;
第三步:将回波数据从磁盘复制到内存B;
第四步:在GPU的全局存储器分配大小为A的存储空间,标记为C;
第五步:将回波数据从内存B复制到GPU的全局存储器C;
第六步:按照SAR成像算法,编写第一个模块的代码:
a)根据该模块运算的输入输出,在GPU的全局存储器分配存储空间D、E;
b)编写该模块的由GPU来执行的内核函数的并行代码,输入输出分别为D、E,中间变量分配在隶属于每一个线程块的共享存储器、每个线程私有的本地存储器以及其他分布在GPU的存储空间;
c)根据运算数据的大小和硬件的资源,设置内核函数执行配置;
d)在主函数中编写CPU调用对应内核函数时所用的调用指令代码;
第七步:按照上述方法,顺序编写完成SAR成像的各个模块的程序,直到得到SAR最终的成像结果;
第八步:在CPU内存分配大小为A的存储空间,记为F;
第九步:将成像结果从GPU复制到CPU的内存F,然后CPU将成像结果数据F进行保存以待查看。
通过以上CPU与GPU的协作就完成了SAR成像的并行实现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100883719A CN101937082A (zh) | 2009-07-02 | 2009-07-02 | 基于gpu众核平台的合成孔径雷达并行成像方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100883719A CN101937082A (zh) | 2009-07-02 | 2009-07-02 | 基于gpu众核平台的合成孔径雷达并行成像方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101937082A true CN101937082A (zh) | 2011-01-05 |
Family
ID=43390512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009100883719A Pending CN101937082A (zh) | 2009-07-02 | 2009-07-02 | 基于gpu众核平台的合成孔径雷达并行成像方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101937082A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102788979A (zh) * | 2012-07-20 | 2012-11-21 | 电子科技大学 | 一种基于后向投影InSAR成像配准的GPU实现方法 |
CN102854507A (zh) * | 2012-09-12 | 2013-01-02 | 电子科技大学 | 一种基于gpu后向投影双站合成孔径雷达成像方法 |
CN102901951A (zh) * | 2011-07-26 | 2013-01-30 | 张朝晖 | 基于gpu的雷达信号脉内特征实时分析实现方案 |
CN103376449A (zh) * | 2012-04-11 | 2013-10-30 | 中国科学院电子学研究所 | 基于图形处理器的合成孔径雷达成像方法 |
CN103427844A (zh) * | 2013-07-26 | 2013-12-04 | 华中科技大学 | 一种基于gpu和cpu混合平台的高速无损数据压缩方法 |
CN103809177A (zh) * | 2013-12-30 | 2014-05-21 | 南京大学 | 一种基于fpga的雷达成像并行化方法 |
CN104181510A (zh) * | 2014-09-05 | 2014-12-03 | 电子科技大学 | 一种并行雷达脉冲压缩方法 |
CN104459666A (zh) * | 2014-12-01 | 2015-03-25 | 西安电子科技大学 | 基于LabVIEW的弹载SAR回波仿真及成像方法 |
CN105182331A (zh) * | 2015-08-25 | 2015-12-23 | 电子科技大学 | 基于局域网和图形处理器的机载雷达实时信号处理方法 |
CN107301398A (zh) * | 2017-06-23 | 2017-10-27 | 电子科技大学 | 一种基于gpu实现的合成孔径雷达图像目标识别方法 |
CN109491796A (zh) * | 2018-11-23 | 2019-03-19 | 西安电子科技大学 | 基于累积和并行化的机载雷达运动速度估计方法 |
CN109884630A (zh) * | 2019-01-28 | 2019-06-14 | 南京航空航天大学 | 基于gpu的圆迹视频sar实时成像的方法 |
CN111289975A (zh) * | 2020-01-21 | 2020-06-16 | 博微太赫兹信息科技有限公司 | 一种多gpu并行计算的快速成像处理系统 |
CN112764029A (zh) * | 2020-12-16 | 2021-05-07 | 北京无线电测量研究所 | 一种基于gpu的sar实时成像实现方法和装置 |
CN114814843A (zh) * | 2022-06-27 | 2022-07-29 | 之江实验室 | 基于cpu-gpu异构并行的地表形变反演方法与系统 |
-
2009
- 2009-07-02 CN CN2009100883719A patent/CN101937082A/zh active Pending
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102901951A (zh) * | 2011-07-26 | 2013-01-30 | 张朝晖 | 基于gpu的雷达信号脉内特征实时分析实现方案 |
CN103376449A (zh) * | 2012-04-11 | 2013-10-30 | 中国科学院电子学研究所 | 基于图形处理器的合成孔径雷达成像方法 |
CN102788979B (zh) * | 2012-07-20 | 2014-04-09 | 电子科技大学 | 一种基于后向投影InSAR成像配准的GPU实现方法 |
CN102788979A (zh) * | 2012-07-20 | 2012-11-21 | 电子科技大学 | 一种基于后向投影InSAR成像配准的GPU实现方法 |
CN102854507A (zh) * | 2012-09-12 | 2013-01-02 | 电子科技大学 | 一种基于gpu后向投影双站合成孔径雷达成像方法 |
CN102854507B (zh) * | 2012-09-12 | 2014-04-09 | 电子科技大学 | 一种基于gpu后向投影双站合成孔径雷达成像方法 |
CN103427844B (zh) * | 2013-07-26 | 2016-03-02 | 华中科技大学 | 一种基于gpu和cpu混合平台的高速无损数据压缩方法 |
CN103427844A (zh) * | 2013-07-26 | 2013-12-04 | 华中科技大学 | 一种基于gpu和cpu混合平台的高速无损数据压缩方法 |
CN103809177A (zh) * | 2013-12-30 | 2014-05-21 | 南京大学 | 一种基于fpga的雷达成像并行化方法 |
CN104181510A (zh) * | 2014-09-05 | 2014-12-03 | 电子科技大学 | 一种并行雷达脉冲压缩方法 |
CN104459666B (zh) * | 2014-12-01 | 2017-03-08 | 西安电子科技大学 | 基于LabVIEW的弹载SAR回波仿真及成像方法 |
CN104459666A (zh) * | 2014-12-01 | 2015-03-25 | 西安电子科技大学 | 基于LabVIEW的弹载SAR回波仿真及成像方法 |
CN105182331A (zh) * | 2015-08-25 | 2015-12-23 | 电子科技大学 | 基于局域网和图形处理器的机载雷达实时信号处理方法 |
CN107301398A (zh) * | 2017-06-23 | 2017-10-27 | 电子科技大学 | 一种基于gpu实现的合成孔径雷达图像目标识别方法 |
CN107301398B (zh) * | 2017-06-23 | 2019-04-30 | 电子科技大学 | 一种基于gpu实现的合成孔径雷达图像目标识别方法 |
CN109491796B (zh) * | 2018-11-23 | 2021-07-27 | 西安电子科技大学 | 基于累积和并行化的机载雷达运动速度估计方法 |
CN109491796A (zh) * | 2018-11-23 | 2019-03-19 | 西安电子科技大学 | 基于累积和并行化的机载雷达运动速度估计方法 |
CN109884630A (zh) * | 2019-01-28 | 2019-06-14 | 南京航空航天大学 | 基于gpu的圆迹视频sar实时成像的方法 |
CN109884630B (zh) * | 2019-01-28 | 2022-11-01 | 南京航空航天大学 | 基于gpu的圆迹视频sar实时成像的方法 |
CN111289975A (zh) * | 2020-01-21 | 2020-06-16 | 博微太赫兹信息科技有限公司 | 一种多gpu并行计算的快速成像处理系统 |
CN111289975B (zh) * | 2020-01-21 | 2022-04-22 | 博微太赫兹信息科技有限公司 | 一种多gpu并行计算的快速成像处理系统 |
CN112764029A (zh) * | 2020-12-16 | 2021-05-07 | 北京无线电测量研究所 | 一种基于gpu的sar实时成像实现方法和装置 |
CN112764029B (zh) * | 2020-12-16 | 2024-03-22 | 北京无线电测量研究所 | 一种基于gpu的sar实时成像实现方法和装置 |
CN114814843A (zh) * | 2022-06-27 | 2022-07-29 | 之江实验室 | 基于cpu-gpu异构并行的地表形变反演方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101937082A (zh) | 基于gpu众核平台的合成孔径雷达并行成像方法 | |
CN110058883B (zh) | 一种基于opu的cnn加速方法及系统 | |
DE112020000846T5 (de) | Architektur für Block-Sparse-Operationen an einem systolischen Array | |
DE112020000850T5 (de) | Cache-Struktur und -Nutzung | |
DE102018133555A1 (de) | Berechnungsoptimierungsmechanismus für tiefe neuronale Netze | |
DE102020129251A1 (de) | Adaptives verformbares kernvorhersagenetzwerk zum bildentrauschen | |
DE102019120661A1 (de) | Videoverfeinerungsmechanismus | |
DE112020000854T5 (de) | Thread-gruppen-planung für die grafikverarbeitung | |
CN101860752B (zh) | 一种针对嵌入式多核系统的视频编码流水化并行方法 | |
DE112018005527T5 (de) | Automatisches aufwecken von leistungsdomänen fürgrafikkonfigurationsanforderungen | |
CN105550974A (zh) | 基于gpu的图像特征提取算法的加速方法 | |
DE112018004431T5 (de) | Ressourcenlastausgleich basierend auf gebrauchs- und leistungsgrenzen | |
CN113424219A (zh) | 用于多线程通道的同步的系统和方法 | |
DE102020108476A1 (de) | Mechanismus zum Ausführen nichtlinearer Funktionen in einem Beschleuniger des maschinellen Lernens | |
CN102880509A (zh) | 基于cuda的格网数字高程模型邻域分析的系统和方法 | |
DE112020000848T5 (de) | Skalarkernintegration | |
CN115526760A (zh) | 用于动态地改变高速缓存中的数据优先级的方法和装置 | |
US20190197658A1 (en) | Intelligent memory dvfs scheme exploiting graphics inter-frame level correlation | |
CN113671478A (zh) | 基于多核cpu的高速机动目标识别数据处理方法 | |
CN113406572B (zh) | 一种雷达并行处理系统及方法、存储介质、终端 | |
Liu et al. | Parallel program design for JPEG compression encoding | |
DE102019123443A1 (de) | Mechanismus zum gemeinsamen Benutzen von Registern | |
DE102020130081A1 (de) | Erweiterte prozessorfunktionen für berechnungen | |
Jensen et al. | A two-level real-time vision machine combining coarse-and fine-grained parallelism | |
CN107170017A (zh) | 基于cpu/gpu协同处理的遥感数据快速入库方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20110105 |