CN112764029A - 一种基于gpu的sar实时成像实现方法和装置 - Google Patents
一种基于gpu的sar实时成像实现方法和装置 Download PDFInfo
- Publication number
- CN112764029A CN112764029A CN202011490935.4A CN202011490935A CN112764029A CN 112764029 A CN112764029 A CN 112764029A CN 202011490935 A CN202011490935 A CN 202011490935A CN 112764029 A CN112764029 A CN 112764029A
- Authority
- CN
- China
- Prior art keywords
- echo data
- package
- processing
- imaging
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003384 imaging method Methods 0.000 title claims abstract description 103
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 124
- 230000008569 process Effects 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 87
- 230000035485 pulse pressure Effects 0.000 claims description 27
- 238000012937 correction Methods 0.000 claims description 22
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000005452 bending Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 235000019800 disodium phosphate Nutrition 0.000 description 13
- 230000003287 optical effect Effects 0.000 description 6
- 230000006872 improvement Effects 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 238000007667 floating Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- MFDFERRIHVXMIY-UHFFFAOYSA-N procaine Chemical compound CCN(CC)CCOC(=O)C1=CC=C(N)C=C1 MFDFERRIHVXMIY-UHFFFAOYSA-N 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S13/00—Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
- G01S13/88—Radar or analogous systems specially adapted for specific applications
- G01S13/89—Radar or analogous systems specially adapted for specific applications for mapping or imaging
- G01S13/90—Radar or analogous systems specially adapted for specific applications for mapping or imaging using synthetic aperture techniques, e.g. synthetic aperture radar [SAR] techniques
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S13/00—Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
- G01S13/88—Radar or analogous systems specially adapted for specific applications
- G01S13/89—Radar or analogous systems specially adapted for specific applications for mapping or imaging
- G01S13/90—Radar or analogous systems specially adapted for specific applications for mapping or imaging using synthetic aperture techniques, e.g. synthetic aperture radar [SAR] techniques
- G01S13/9004—SAR image acquisition techniques
Landscapes
- Engineering & Computer Science (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Physics & Mathematics (AREA)
- Electromagnetism (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Physics & Mathematics (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明的一个实施例公开了一种基于GPU的SAR实时成像实现方法和装置,包括:S100、CPU接收机载雷达获取的回波数据,并对所述回波数据进行预处理;S102、GPU接收所述经过预处理的回波数据,并对所述经过预处理的回波数据进行成像处理,得到成像结果;S104、GPU将所述成像结果返送给所述CPU。本发明根据成像需求采用了距离‑多普勒(R‑D)成像算法,并给出了算法的流程模块;根据机载SAR算法成像模块,采用了CPU+GPU的硬件处理平台进行算法实现,并对算法进行详细的任务划分,给出了详细的实现过程;通过对比GPU与DSP的实时性和成像结果,验证了本实现方法的正确性与有效性。
Description
技术领域
本发明涉及SAR实时成像实现领域。更具体地,涉及一种基于GPU的SAR实时成像实现方法,装置,计算机设备和计算机可读存储介质。
背景技术
合成孔径雷达(Synthetic Aperture Radar,SAR)具有全天时、全天候、远距离、高分辨成像的特点,可以大大提高雷达的信息获取能力,在军用和民用方面都得到广泛应用和发展;距离-多普勒(R-D)算法已成为一种标准的正侧视SAR成像处理算法,并且具有稳定好、对存储空间要求低、实时性好等优点,被广泛应用。
SAR具有高分辨、大测绘带宽的特点,这样就要求处理单元具有高效的处理以及快速的传输能力,现在单核的DSP已经很难满足要求,几个典型的处理器的运行效率如下:一个C6678有8个DSP,理论每秒浮点数计算能力为160Gflops;一个Intel Xeon E5-2630 v3CPU拥有16个核心,理论上每秒浮点数计算能力为307Gflops,而Tesla M6有1536个核心,每秒浮点数计算理论上可高达3383Gflops。
发明内容
本发明的目的在于提供一种基于GPU的SAR实时成像实现方法和装置。以解决现有技术存在的问题中的至少一个。
为达到上述目的,本发明采用下述技术方案:
第一方面,本发明提供了一种基于GPU的SAR实时成像实现方法,包括:
S100、CPU接收机载雷达获取的回波数据,并对所述回波数据进行预处理;
S102、GPU接收所述经过预处理的回波数据,并对所述经过预处理的回波数据进行成像处理,得到成像结果;
S104、GPU将所述成像结果返送给所述CPU。
在一个具体实施例中,所述步骤S100包括:
S1001,创建包裹,所述包裹包括:接收包裹、处理包裹和发送包裹,其中,所述接收包裹用于接收包头和所述经过预处理的回波数据,所述处理包裹用于对所述经过预处理的回波数据进行成像处理,得到成像结果,所述发送包裹用于将所述成像结果返送给所述CPU;
S1002,管理器从线程池获得第一子线程,第二子线程和第三子线程;
所述第一子线程运行发送包裹和接收包裹的start函数;
所述第二子线程运行manageLoop函数,所述manageLoop函数内部循环接收所述接收包裹的消息,接收到消息后调用解析控制字回调函数,从而得到待激活的处理包裹,
所述第三子线程运行所述处理包裹,并通过端口将所述消息发送给所述处理包裹。
在一个具体实施例中,所述S102包括:
S1020,将接收到的所述经过预处理的回波数据进行惯导补偿,得到惯导补偿后的回波数据并存储在显存中;
S1021,将步骤S1020得到的所述惯导补偿后的回波数据进行Deramp处理,得到Deramp处理后的回波数据并存储在显存中;
S1022,将步骤S1021得到的所述Deramp处理后的回波数据进行距离弯曲校正,得到距离弯曲校正后的回波数据并存储在显存中;
S1023,将步骤S1022得到的所述距离弯曲校正后的回波数据进行多普勒调频率估计,得到多普勒调频率估计后的回波数据并存储在显存中;
S1024,将步骤S1023得到的所述多普勒调频率估计后的回波数据进行运动补偿,得到运动补偿后的回波数据并存储在显存中;
S1025,将步骤S1024得到的所述运动补偿后的回波数据进行方位脉压,得到方位脉压后的回波数据并存储在显存中;
S1026,将步骤S1025得到的所述方位脉压后的回波数据进行多视处理,得到成像结果。
第二方面,本发明还提供了一种基于GPU的SAR实时成像装置,包括:
CPU,用于接收机载雷达获取的回波数据,并对所述回波数据进行预处理;
GPU,接收所述经过预处理的回波数据,并对所述经过预处理的回波数据进行成像处理,得到成像结果;并将所述成像结果返送给所述CPU。
在一个具体实施例中,所述预处理包括:
包裹建立模块:创建包裹,所述包裹包括:接收包裹、处理包裹和发送包裹,其中,所述接收包裹用于接收包头和所述经过预处理的回波数据,所述处理包裹用于对所述经过预处理的回波数据进行成像处理,得到成像结果,所述发送包裹用于将所述成像结果返送给所述CPU;
包裹启动模块:管理器从线程池获得第一子线程,第二子线程和第三子线程;
所述第一子线程运行发送包裹和接收包裹的start函数;
所述第二子线程运行manageLoop函数,所述manageLoop函数内部循环接收所述接收包裹的消息,接收到消息后调用解析控制字回调函数,从而得到待激活的处理包裹;
所述第三子线程运行所述处理包裹,并通过端口将所述消息发送给所述处理包裹。
在一个具体实施例中,所述成像处理包括:
惯导补偿模块:用于将接收到的所述经过预处理的回波数据进行惯导补偿,得到惯导补偿后的回波数据并存储在显存中;
Deramp处理模块:用于将在惯导补偿模块得到的所述惯导补偿后的回波数据进行Deramp处理,得到Deramp处理后的回波数据并存储在显存中;
距离弯曲校正模块:用于将在Deramp处理模块得到的所述Deramp处理后的回波数据进行距离弯曲校正,得到距离弯曲校正后的回波数据并存储在显存中;
多普勒调频率估计模块:用于将在距离弯曲校正模块得到的所述距离弯曲校正后的回波数据进行多普勒调频率估计,得到多普勒调频率估计后的回波数据并存储在显存中;
运动补偿模块:用于将在多普勒调频率估计模块得到的所述多普勒调频率估计后的回波数据进行运动补偿,得到运动补偿后的回波数据并存储在显存中;
方位脉压模块:用于将在运动补偿模块得到的所述运动补偿后的回波数据进行方位脉压,得到方位脉压后的回波数据并存储在显存中;
多视处理模块:用于将在方位脉压模块得到的所述方位脉压后的回波数据进行多视处理,得到成像结果。
第三方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请第一方面提供的方法。
第四方面,本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本申请第一方面提供的方法。
本发明的有益效果如下:
本发明充分利用了GPU的资源,相比传统的DSP成像,拥有更高的成像效率。在具体实现时,不需要对现有的机载雷达进行硬件改进,只需通过软件升级便可在实际工程中实现应用。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出根据本发明一个实施例的基于GPU的SAR实时成像实现方法的流程图。
图2示出根据本发明一个实施例的基于GPU的SAR实时成像实现方法的具体流程图。
图3示出根据本发明一个实施例的在GPU实现下的成像结果。
图4示出根据本发明一个实施例的在DSP实现下的成像结果。
图5示出适于用来实现本申请实施例的计算机设备的结构示意图。
具体实施方式
为了更清楚地说明本发明,下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。
第一实施例
如图1所示,本发明的一个实施例公开了一种基于GPU的SAR实时成像实现方法,包括:S100、CPU接收机载雷达获取的回波数据,并对所述回波数据进行预处理;S102、GPU接收所述经过预处理的回波数据,并对所述经过预处理的回波数据进行成像处理,得到成像结果;S104、GPU将所述成像结果返送给所述CPU。本发明根据成像需求采用了距离-多普勒(R-D)成像算法,根据机载SAR算法成像模块,采用了CPU+GPU的硬件处理平台进行算法实现,并对算法进行详细的任务划分,给出了详细的实现过程;通过对比GPU与DSP的实时性和成像结果,验证了本实现方法的正确性与有效性。
本发明的基于GPU的SAR实时成像实现方法的具体流程图如图2所示,具体的,所述成像实现方法包括:
S100、CPU接收机载雷达获取的回波数据,并对所述回波数据进行预处理;
在一个具体实施例中,所述步骤S100包括:
进行系统初始化,包括对管理器(managelnit)和包裹(wrapper)进行初始化;在一个具体实施例中,所述管理器用于创建线程池、内存池、发送缓存和包裹,并对包裹进行初始化。
S1001,创建包裹,所述包裹包括:接收包裹、处理包裹和发送包裹,其中,所述接收包裹用于接收包头和所述经过预处理的回波数据,所述处理包裹用于对所述经过预处理的回波数据进行成像处理,得到成像结果,所述发送包裹用于将所述成像结果返送给所述CPU;
S1002,管理器从线程池获得第一子线程,第二子线程和第三子线程;
在目前的信号处理系统中,单个计算节点必须有两个固定的包裹——接收包裹和发送包裹,其它包裹为信号处理包裹。
所述第一子线程运行发送包裹和接收包裹的start(启动)函数;
所述第二子线程运行manageLoop(管理循环)函数,所述manageLoop函数内部循环接收所述接收包裹的消息,接收到消息后调用解析控制字回调函数,从而得到待激活的处理包裹,
所述第三子线程运行所述处理包裹,并通过端口将所述消息发送给所述处理包裹。
S102、GPU接收所述经过预处理的回波数据,并对所述经过预处理的回波数据进行成像处理,得到成像结果;
在一个具体实施例中,所述S102包括:
S1020,将接收到的所述经过预处理的回波数据进行惯导补偿,得到惯导补偿后的回波数据并存储在显存中;
具体的,所述S1020包括:将接收到的所述经过预处理的回波数据放在所述GPU的显存,首先调用CUFFT函数库实现对放在显存的数据进行FFT处理,并放回显存,在Kernel1函数中实现补偿参数的生成,补偿参数与显存数据进行复乘并放回显存,最后调用CUFFT函数库实现对放在显存的数据进行IFFT处理,得到惯导补偿后的回波数据并存储在显存中。
S1021,将步骤S1020得到的所述惯导补偿后的回波数据进行Deramp(去斜坡技术)处理,得到Deramp处理后的回波数据并存储在显存中;
具体的,所述S1021包括:首先在Kernel1函数中进行参数的更新,在Kernel2函数中进行Deramp方位向去斜因子H1的生成和相乘并放回显存,然后进行数据在显存的转置操作,再调用CUFFT函数库实现对放在显存的数据进行FFT处理并且放回显存,在Kernel3函数中进行Deramp方位向去斜因子H2的生成和显存数据的相乘并放回显存,再调用CUFFT函数库实现对放在显存的数据进行FFT处理并且放回显存,在Kernel3函数中对显存数据进行Deramp方位向去斜因子H3的生成和显存数据的相乘并放回显存,再调用CUFFT函数库实现对放在显存的数据进行IFFT处理并且放回显存。
S1022,将步骤S1021得到的所述Deramp处理后的回波数据进行距离弯曲校正,得到距离弯曲校正后的回波数据并存储在显存中;
具体的,所述S1022包括:首先在Kernel1函数中利用归约法求出多普勒中心参数均值,在Kernel2函数中生成多普勒中心的补偿因子1并进行显存数据的补偿后放回显存,调用CUFFT函数库对放在显存的数据进行方位向的FFT处理,在Kernel3函数中生成弯曲补偿因子并进行显存数据的补偿后放回显存,调用CUFFT函数库实现对放在显存的数据进行距离向的IFFT处理,数据由距离连续转置成方位连续,调用CUFFT函数库实现对放在显存的数据进行方位向的IFFT处理,在Kernel4函数中生成多普勒中心的补偿因子2并进行显存数据的补偿后放回显存。
S1023,将步骤S1022得到的所述距离弯曲校正后的回波数据进行多普勒调频率估计,得到多普勒调频率估计后的回波数据并存储在显存中;步骤S1022通过分析算法流程,实现最高的资源利用率和数据处理的并行,达到实时性的最优。
具体的,所述S1023包括:对数据进行子块的划分,在显存允许的情况下对所有子块进行并行处理得出结果。
S1024,将步骤S1023得到的所述多普勒调频率估计后的回波数据进行运动补偿,得到运动补偿后的回波数据并存储在显存中;
具体的,所述S1024包括:在Kernel1函数中进行调频率因子的二次样条插值,在Kernel2函数中进行参数累加和,在Kernel3函数中生成运动补偿因子并进行显存数据的补偿;
S1025,将步骤S1024得到的所述运动补偿后的回波数据进行方位脉压,得到方位脉压后的回波数据并存储在显存中;
具体的,所述S1025包括:首先在Kernel1函数中生成方位脉压匹配因子,然后调用CUFFT函数库对放在显存的数据进行方位向的FFT处理,在Kernel2函数中进行数据与匹配因子的复乘;
S1026,将步骤S1025得到的所述方位脉压后的回波数据进行多视处理,得到成像结果。
具体的,所述S1026包括:在Kernel1函数中对显存数据进行多视处理,得到成像结果。
S104、GPU将所述成像结果返送给所述CPU。
CPU接收到成像结果后,执行结束指令,manageStop(管理停止)函数会被调用,该函数会逐级调用接收包裹,发送包裹和处理包裹的stop函数,使运行在子线程上的start函数和manageLoop函数一一退出多视处理模块,在程序退出前,利用manageUnInit(管理单元初始化)函数将注册的包裹和component逐级销毁。
本发明充分利用了GPU的资源,相比传统的DSP成像,拥有更高的成像效率。在具体实现时,不需要对现有的机载雷达进行硬件改进,只需通过软件升级便可在实际工程中实现应用。
第二实施例
本发明的一个实施例还公开了一种基于GPU的SAR实时成像装置,包括:
CPU,用于接收机载雷达获取的回波数据,并对所述回波数据进行预处理;
GPU,接收所述经过预处理的回波数据,并对所述经过预处理的回波数据进行成像处理,得到成像结果;并将所述成像结果返送给所述CPU。
在一个具体实施例中,所述预处理包括:
包裹建立模块:创建包裹,所述包裹包括:接收包裹、处理包裹和发送包裹,其中,所述接收包裹用于接收包头和所述经过预处理的回波数据,所述处理包裹用于对所述经过预处理的回波数据进行成像处理,得到成像结果,所述发送包裹用于将所述成像结果返送给所述CPU;
包裹启动模块:管理器从线程池获得第一子线程,第二子线程和第三子线程;
所述第一子线程运行发送包裹和接收包裹的start函数;
所述第二子线程运行manageLoop函数,所述manageLoop函数内部循环接收所述接收包裹的消息,接收到消息后调用解析控制字回调函数,从而得到待激活的处理包裹;
所述第三子线程运行所述处理包裹,并通过端口将所述消息发送给所述处理包裹。
在一个具体实施例中,所述成像处理包括:
惯导补偿模块:用于将接收到的所述经过预处理的回波数据进行惯导补偿,得到惯导补偿后的回波数据并存储在显存中;
具体的,所述惯导补偿模块包括:将接收到的所述经过预处理的回波数据放在所述GPU的显存,首先调用CUFFT函数库实现对放在显存的数据进行FFT处理,并放回显存,在Kernel1函数中实现补偿参数的生成,补偿参数与显存数据进行复乘并放回显存,最后调用CUFFT函数库实现对放在显存的数据进行IFFT处理,得到惯导补偿后的回波数据并存储在显存中。
Deramp处理模块:用于将在惯导补偿模块得到的所述惯导补偿后的回波数据进行Deramp处理,得到Deramp处理后的回波数据并存储在显存中;
具体的,所述Deramp处理模块包括:首先在Kernel1函数中进行参数的更新,在Kernel2函数中进行Deramp方位向去斜因子H1的生成和相乘并放回显存,然后进行数据在显存的转置操作,再调用CUFFT函数库实现对放在显存的数据进行FFT处理并且放回显存,在Kernel3函数中进行Deramp方位向去斜因子H2的生成和显存数据的相乘并放回显存,再调用CUFFT函数库实现对放在显存的数据进行FFT处理并且放回显存,在Kernel3函数中对显存数据进行Deramp方位向去斜因子H3的生成和显存数据的相乘并放回显存,再调用CUFFT函数库实现对放在显存的数据进行IFFT处理并且放回显存。
距离弯曲校正模块:用于将在Deramp处理模块得到的所述Deramp处理后的回波数据进行距离弯曲校正,得到距离弯曲校正后的回波数据并存储在显存中;
具体的,所述距离弯曲校正模块包括:首先在Kernel1函数中利用归约法求出多普勒中心参数均值,在Kernel2函数中生成多普勒中心的补偿因子1并进行显存数据的补偿后放回显存,调用CUFFT函数库对放在显存的数据进行方位向的FFT处理,在Kernel3函数中生成弯曲补偿因子并进行显存数据的补偿后放回显存,调用CUFFT函数库实现对放在显存的数据进行距离向的IFFT处理,数据由距离连续转置成方位连续,调用CUFFT函数库实现对放在显存的数据进行方位向的IFFT处理,在Kernel4函数中生成多普勒中心的补偿因子2并进行显存数据的补偿后放回显存。
多普勒调频率(Fdr)估计模块:用于将在距离弯曲校正模块得到的所述距离弯曲校正后的回波数据进行多普勒调频率估计,得到多普勒调频率估计后的回波数据并存储在显存中;
具体的,所述多普勒调频率估计模块包括:对数据进行子块的划分,在显存允许的情况下对所有子块进行并行处理得出结果。
运动补偿模块:用于将在多普勒调频率估计模块得到的所述多普勒调频率估计后的回波数据进行运动补偿,得到运动补偿后的回波数据并存储在显存中;
具体的,所述运动补偿模块包括:在Kernel1函数中进行调频率因子的二次样条插值,在Kernel2函数中进行参数累加和,在Kernel3函数中生成运动补偿因子并进行显存数据的补偿;
方位脉压模块:用于将在运动补偿模块得到的所述运动补偿后的回波数据进行方位脉压,得到方位脉压后的回波数据并存储在显存中;
具体的,所述方位脉压模块包括:首先在Kernel1函数中生成方位脉压匹配因子,然后调用CUFFT函数库对放在显存的数据进行方位向的FFT处理,在Kernel2函数中进行数据与匹配因子的复乘;
多视处理模块:用于将在方位脉压模块得到的所述方位脉压后的回波数据进行多视处理,得到成像结果。
具体的,所述多视处理模块包括:在Kernel1函数中对显存数据进行多视处理,得到成像结果。
GPU将所述成像结果返送给所述CPU。CPU接收到成像结果后,执行结束指令,manageStop函数会被调用,该函数会逐级调用接收包裹,发送包裹和处理包裹的stop函数,使运行在子线程上的start函数和manageLoop函数一一退出多视处理模块,在程序退出前,利用manageUnInit函数将注册的包裹和component逐级销毁。
在一个具体实施例中,利用本发明的技术方案和基于DSP的成像方案进行仿真实验,进行结果对比,其中,仿真实验环境为:CUDA,3383Gflops,Linux iSoft Server OS 4。仿真实验内容:将机载雷达获取的回波数据,在实验环境下,进行实时成像,数据的处理粒度为:距离点数16384,方位点数为16384。表1是GPU的成像时间,表2是DSP的成像时间,图3示出本发明在本实施例下的GPU成像结果,图4为在本实施例下DSP的成像结果。
表1
表2
对仿真进行结果分析:从表1可以看出,GPU的成像时间为:510ms+1296ms+1723ms+143ms+140ms+1144ms+261cm=5217ms;从表2可以看出,DSP的成像时间为:3600ms+4200ms+3200ms+300ms+600ms+3200ms+800cm=15900ms;通过对比可以看出,GPU的处理时间优于DSP的处理时间,从而证实了GPU在SAR成像处理时间的优势;
从图3和图4可以看出,SAR的成像效果几乎相同。
综上所述,通过GPU与DSP的成像时间和成像结果验证了本发明的正确性、有效性和可靠性。
本发明充分利用了GPU的资源,相比传统的DSP成像,拥有更高的成像效率。在具体实现时,不需要对现有的机载雷达进行硬件改进,只需通过软件升级便可在实际工程中实现应用。
第三实施例
图5示出了本申请的另一个实施例提供的一种计算机设备的结构示意图。图5显示的计算机设备50仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。如图5所示,计算机设备50以通用计算设备的形式表现。计算机设备50的组件可以包括但不限于:一个或者多个处理器或者处理单元500,系统存储器516,连接不同系统组件(包括系统存储器516和处理单元500)的总线501。
总线501表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设50典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备50访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器516可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)504和/或高速缓存存储器506。计算机设备50可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统508可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线501相连。存储器516可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行实施例一的功能。
具有一组(至少一个)程序模块512的程序/实用工具510,可以存储在例如存储器516中,这样的程序模块512包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块512通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备50也可以与一个或多个外部设备70(例如键盘、指向设备、显示器60等)通信,还可与一个或者多个使得用户能与该计算机设备50交互的设备通信,和/或与使得该计算机设备50能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口502进行。并且,计算机设备50还可以通过网络适配器514与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器514通过总线501与计算机设备50的其它模块通信。应当明白,尽管图5中未示出,可以结合计算机设备50使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器单元500通过运行存储在系统存储器516中的程序,从而执行各种功能应用以及数据处理,例如实现本申请实施例一所提供的一种基于GPU的SAR实时成像实现方法。
本申请针对目前现有的问题,制定一种适用于基于GPU的SAR实时成像实现方法的计算机设备,在具体实现时,不需要对现有的机载雷达进行硬件改进,只需通过软件升级便可在实际工程中实现应用。
第四实施例
本申请的另一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例一所提供的方法。在实际应用中,所述计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。
计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。
计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。
Claims (8)
1.一种基于GPU的SAR实时成像实现方法,其特征在于,包括:
S100、CPU接收机载雷达获取的回波数据,并对所述回波数据进行预处理;
S102、GPU接收所述经过预处理的回波数据,并对所述经过预处理的回波数据进行成像处理,得到成像结果;
S104、GPU将所述成像结果返送给所述CPU。
2.根据权利要求1所述的方法,其特征在于,所述步骤S100包括:
S1001,创建包裹,所述包裹包括:接收包裹、处理包裹和发送包裹,其中,所述接收包裹用于接收包头和所述经过预处理的回波数据,所述处理包裹用于对所述经过预处理的回波数据进行成像处理,得到成像结果,所述发送包裹用于将所述成像结果返送给所述CPU;
S1002,管理器从线程池获得第一子线程,第二子线程和第三子线程;
所述第一子线程运行发送包裹和接收包裹的start函数;
所述第二子线程运行manageLoop函数,所述manageLoop函数内部循环接收所述接收包裹的消息,接收到消息后调用解析控制字回调函数,从而得到待激活的处理包裹;
所述第三子线程运行所述处理包裹,并通过端口将所述消息发送给所述处理包裹。
3.根据权利要求1所述的方法,其特征在于,所述S102包括:
S1020,将接收到的所述经过预处理的回波数据进行惯导补偿,得到惯导补偿后的回波数据并存储在显存中;
S1021,将步骤S1020得到的所述惯导补偿后的回波数据进行Deramp处理,得到Deramp处理后的回波数据并存储在显存中;
S1022,将步骤S1021得到的所述Deramp处理后的回波数据进行距离弯曲校正,得到距离弯曲校正后的回波数据并存储在显存中;
S1023,将步骤S1022得到的所述距离弯曲校正后的回波数据进行多普勒调频率估计,得到多普勒调频率估计后的回波数据并存储在显存中;
S1024,将步骤S1023得到的所述多普勒调频率估计后的回波数据进行运动补偿,得到运动补偿后的回波数据并存储在显存中;
S1025,将步骤S1024得到的所述运动补偿后的回波数据进行方位脉压,得到方位脉压后的回波数据并存储在显存中;
S1026,将步骤S1025得到的所述方位脉压后的回波数据进行多视处理,得到成像结果。
4.一种基于GPU的SAR实时成像装置,其特征在于,包括:
CPU,用于接收机载雷达获取的回波数据,并对所述回波数据进行预处理;
GPU,接收所述经过预处理的回波数据,并对所述经过预处理的回波数据进行成像处理,得到成像结果;并将所述成像结果返送给所述CPU。
5.根据权利要求4所述的装置,其特征在于,所述预处理包括:
包裹建立模块:创建包裹,所述包裹包括:接收包裹、处理包裹和发送包裹,其中,所述接收包裹用于接收包头和所述经过预处理的回波数据,所述处理包裹用于对所述经过预处理的回波数据进行成像处理,得到成像结果,所述发送包裹用于将所述成像结果返送给所述CPU;
包裹启动模块:管理器从线程池获得第一子线程,第二子线程和第三子线程;
所述第一子线程运行发送包裹和接收包裹的start函数;
所述第二子线程运行manageLoop函数,所述manageLoop函数内部循环接收所述接收包裹的消息,接收到消息后调用解析控制字回调函数,从而得到待激活的处理包裹;
所述第三子线程运行所述处理包裹,并通过端口将所述消息发送给所述处理包裹。
6.根据权利要求4所述的装置,其特征在于,所述成像处理包括:
惯导补偿模块:用于将接收到的所述经过预处理的回波数据进行惯导补偿,得到惯导补偿后的回波数据并存储在显存中;
Deramp处理模块:用于将在惯导补偿模块得到的所述惯导补偿后的回波数据进行Deramp处理,得到Deramp处理后的回波数据并存储在显存中;
距离弯曲校正模块:用于将在Deramp处理模块得到的所述Deramp处理后的回波数据进行距离弯曲校正,得到距离弯曲校正后的回波数据并存储在显存中;
多普勒调频率估计模块:用于将在距离弯曲校正模块得到的所述距离弯曲校正后的回波数据进行多普勒调频率估计,得到多普勒调频率估计后的回波数据并存储在显存中;
运动补偿模块:用于将在多普勒调频率估计模块得到的所述多普勒调频率估计后的回波数据进行运动补偿,得到运动补偿后的回波数据并存储在显存中;
方位脉压模块:用于将在运动补偿模块得到的所述运动补偿后的回波数据进行方位脉压,得到方位脉压后的回波数据并存储在显存中;
多视处理模块:用于将在方位脉压模块得到的所述方位脉压后的回波数据进行多视处理,得到成像结果。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-3任一项所述的方法。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-3中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011490935.4A CN112764029B (zh) | 2020-12-16 | 2020-12-16 | 一种基于gpu的sar实时成像实现方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011490935.4A CN112764029B (zh) | 2020-12-16 | 2020-12-16 | 一种基于gpu的sar实时成像实现方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112764029A true CN112764029A (zh) | 2021-05-07 |
CN112764029B CN112764029B (zh) | 2024-03-22 |
Family
ID=75695407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011490935.4A Active CN112764029B (zh) | 2020-12-16 | 2020-12-16 | 一种基于gpu的sar实时成像实现方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112764029B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101937082A (zh) * | 2009-07-02 | 2011-01-05 | 北京理工大学 | 基于gpu众核平台的合成孔径雷达并行成像方法 |
CN102590812A (zh) * | 2012-01-13 | 2012-07-18 | 西安电子科技大学 | 基于调频连续波的sar实时成像方法 |
CN105137402A (zh) * | 2015-08-19 | 2015-12-09 | 电子科技大学 | 一种基于gpu的机载前视扫描雷达并行处理方法 |
CN105372657A (zh) * | 2015-12-10 | 2016-03-02 | 中国科学院电子学研究所 | 基于回波数据的视频合成孔径雷达运动补偿成像方法 |
CN105844580A (zh) * | 2016-03-18 | 2016-08-10 | 西安电子科技大学 | 基于单片fpga的弹载sar成像系统架构设计 |
CN106597437A (zh) * | 2016-11-23 | 2017-04-26 | 上海无线电设备研究所 | 高频机载调频连续波sar运动补偿及成像处理方法 |
CN106872974A (zh) * | 2017-01-23 | 2017-06-20 | 西安电子科技大学 | 基于高超声速平台双通道雷达的高精度运动目标成像方法 |
CN108919220A (zh) * | 2018-07-06 | 2018-11-30 | 西安电子科技大学 | 基于嵌入式gpu的弹载sar前侧视成像方法 |
KR101963895B1 (ko) * | 2018-10-25 | 2019-04-01 | 엘아이지넥스원 주식회사 | 해상 표적 탐지에 사용되는 sar 신호 처리 장치 및 그 방법 |
CN110954899A (zh) * | 2019-12-19 | 2020-04-03 | 北京无线电测量研究所 | 高海况下海面舰船目标成像方法及装置 |
CN111190181A (zh) * | 2020-01-09 | 2020-05-22 | 西安电子科技大学 | 颠簸平台无人机载sar实时成像处理方法 |
CN111551934A (zh) * | 2020-05-07 | 2020-08-18 | 东南大学 | 一种用于无人机载sar成像的运动补偿自聚焦方法与装置 |
-
2020
- 2020-12-16 CN CN202011490935.4A patent/CN112764029B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101937082A (zh) * | 2009-07-02 | 2011-01-05 | 北京理工大学 | 基于gpu众核平台的合成孔径雷达并行成像方法 |
CN102590812A (zh) * | 2012-01-13 | 2012-07-18 | 西安电子科技大学 | 基于调频连续波的sar实时成像方法 |
CN105137402A (zh) * | 2015-08-19 | 2015-12-09 | 电子科技大学 | 一种基于gpu的机载前视扫描雷达并行处理方法 |
CN105372657A (zh) * | 2015-12-10 | 2016-03-02 | 中国科学院电子学研究所 | 基于回波数据的视频合成孔径雷达运动补偿成像方法 |
CN105844580A (zh) * | 2016-03-18 | 2016-08-10 | 西安电子科技大学 | 基于单片fpga的弹载sar成像系统架构设计 |
CN106597437A (zh) * | 2016-11-23 | 2017-04-26 | 上海无线电设备研究所 | 高频机载调频连续波sar运动补偿及成像处理方法 |
CN106872974A (zh) * | 2017-01-23 | 2017-06-20 | 西安电子科技大学 | 基于高超声速平台双通道雷达的高精度运动目标成像方法 |
CN108919220A (zh) * | 2018-07-06 | 2018-11-30 | 西安电子科技大学 | 基于嵌入式gpu的弹载sar前侧视成像方法 |
KR101963895B1 (ko) * | 2018-10-25 | 2019-04-01 | 엘아이지넥스원 주식회사 | 해상 표적 탐지에 사용되는 sar 신호 처리 장치 및 그 방법 |
CN110954899A (zh) * | 2019-12-19 | 2020-04-03 | 北京无线电测量研究所 | 高海况下海面舰船目标成像方法及装置 |
CN111190181A (zh) * | 2020-01-09 | 2020-05-22 | 西安电子科技大学 | 颠簸平台无人机载sar实时成像处理方法 |
CN111551934A (zh) * | 2020-05-07 | 2020-08-18 | 东南大学 | 一种用于无人机载sar成像的运动补偿自聚焦方法与装置 |
Non-Patent Citations (8)
Title |
---|
FILIPPO SPIGA: "et al phiGEMM: a CPU-GPU library for porting Quantum ESPRESSO on hybrid systems", 《2012 20TH EUROMICRO INTERNATIONAL CONFERENCE ON PARALLEL, DISTRIBUTED AND NETWORK-BASED PROCESSING》, pages 368 - 375 * |
JING LIU,ET AL: "Modified real-time sub-aperture processing algorithm for airborne high-resolution SAR", 《IET INTERNATIONAL RADAR CONFERENCE (IRC 2018)》, 26 September 2019 (2019-09-26), pages 7144 - 7147 * |
JING LIU: "et al Modified real-time sub-aperture processing algorithm for airborne high-resolution SAR", 《IET INTERNATIONAL RADAR CONFERENCE (IRC 2018)》, pages 7144 - 7147 * |
你说: "12334", 《中国》 * |
党大龙: "基于TI DSP C6678的弹载SAR实时成像处理设计", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 February 2015 (2015-02-15) * |
方午梅: "SAR成像实时处理平台的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 March 2016 (2016-03-15) * |
李聪欣: "基于多核DSP的大前斜SAR并行实时处理技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 August 2016 (2016-08-15) * |
杨修齐: "基于GPU的合成孔径雷达高速成像方法", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Also Published As
Publication number | Publication date |
---|---|
CN112764029B (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109213611B (zh) | 跨进程通讯方法、装置、终端及存储介质 | |
CN109032706B (zh) | 智能合约执行方法、装置、设备和存储介质 | |
CN112035238B (zh) | 任务调度处理方法、装置、集群系统及可读存储介质 | |
CN110929860B (zh) | 一种卷积加速运算方法、装置、存储介质及终端设备 | |
CN109920056B (zh) | 建筑物渲染方法、装置、设备和介质 | |
JP7096213B2 (ja) | 人工知能チップに適用される算出方法および人工知能チップ | |
US20200004464A1 (en) | Method and apparatus for storing data | |
CN109766319B (zh) | 压缩任务处理方法、装置、存储介质及电子设备 | |
CN113220432B (zh) | 多云互联方法、装置、设备、存储介质及产品 | |
CN110825435B (zh) | 用于处理数据的方法和装置 | |
CN112966824A (zh) | 推理库的部署方法、装置和电子设备 | |
CN111859775A (zh) | 加速深度学习推断的软硬件协同设计 | |
JP2022551249A (ja) | 画像処理方法、画像処理用コマンドの生成方法および装置 | |
CN112764029B (zh) | 一种基于gpu的sar实时成像实现方法和装置 | |
KR20210115194A (ko) | 레이더 영상 생성 방법 및 이를 수행하는 장치 | |
EP3758288A1 (en) | Digital signature verification engine for reconfigurable circuit devices | |
CN112965788A (zh) | 一种混合虚拟化方式的任务执行方法、系统及设备 | |
CN110245027B (zh) | 一种进程间通信的方法和设备 | |
JP5528054B2 (ja) | 改善された直接メモリ・アクセス転送効率のための方法、プログラム、および装置 | |
CN112486413B (zh) | 一种数据读取方法、装置、介质和计算设备 | |
CN115292053B (zh) | 移动端cnn的cpu、gpu、npu统一调度方法 | |
CN114675265A (zh) | 基于软件定义的机载雷达成像方法、装置、设备及介质 | |
CN112104980B (zh) | 辅助终端定位的方法、装置 | |
CN118570352A (zh) | 一种渲染方法、装置、系统、设备和存储介质 | |
CN110311945B (zh) | 一种用于在实时视频流中呈现资源推送信息的方法与设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |