CN103927721A - 基于gpu的运动目标边缘增强方法 - Google Patents

基于gpu的运动目标边缘增强方法 Download PDF

Info

Publication number
CN103927721A
CN103927721A CN201410143317.0A CN201410143317A CN103927721A CN 103927721 A CN103927721 A CN 103927721A CN 201410143317 A CN201410143317 A CN 201410143317A CN 103927721 A CN103927721 A CN 103927721A
Authority
CN
China
Prior art keywords
gpu
image
cpu
moving object
edge enhancement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410143317.0A
Other languages
English (en)
Inventor
单明广
钟志
高鹏军
鲍珊珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201410143317.0A priority Critical patent/CN103927721A/zh
Publication of CN103927721A publication Critical patent/CN103927721A/zh
Pending legal-status Critical Current

Links

Abstract

本发明的目的在于提供基于GPU的运动目标边缘增强方法,先由CPU获取捕获图像RGB通道数据和图像的宽度和高度尺寸信息,并将图像RGB通道数据转换成单通道数据;然后,初始化GPU,由CPU内存转换为GPU内存;在GPU内对图像进行FFT变换运算,然后与螺旋相位板函数相乘,再对相乘结果进行IFFT换运算;由GPU内存转换为CPU内存,将运算结果回传给CPU,完成边缘增强图像输出显示;待判断运动目标捕获完成后,释放GPU内存,完成运动目标边缘增强。本方法可实现运动目标任意方向的实时边缘增强,且不需特殊的光学元件和构建复杂的光学系统,也不需复杂的计算。

Description

基于GPU的运动目标边缘增强方法
技术领域
本发明涉及的是一种图像处理方法。
背景技术
边缘增强是光信息处理中的一项重要的技术。由于边缘部分集中了物体的大部分信息,因此边缘的确定和提取在模式识别和视频处理等领域都是非常重要的技术环节。常用的对运动目标进行边缘增强的方法有:
1、计算机处理法。该方法是从连续的视频图像中提取出运动目标,利用Robert、Sobel、Canny、Prewitt和Gauss-Laplacian等边缘算子对图像进行边缘检测,不仅运算量大,仿真速度慢,而且选择性差,需大量后续工作消除冗余信息,进而导致算法实时性差。
2、传统光学滤波法。该方法在摄像机镜头前放置恰当的高通滤光片,通过光学系统直接获得边缘增强的图像,有利于突出样品的细节部分,并提高成像的信噪比,但该方法实验设备繁琐,对不同物体不同环境下进行边缘增强提取时,需要更换不同的滤波片。
近年,螺旋相衬法因为可实现待测目标的任意方向的边缘增强而得到广泛关注,并被成功应用于显微成像、光信息处理等领域。但该方法目前主要用于静态目标边缘增强,其照明系统通常采用相干激光光源,或采用非相干的LED光源并配以复杂的时间移相技术;同时,其核心元件螺旋相位板地制作并不容易,尽管近来国内外普遍采用可编程液晶空间光调制器来实现螺旋相位板的功能,但其价格昂贵,系统复杂,所有这些极大地限制了螺旋相衬法的应用范围。
由于GPU(Graphic Processing Unit,图形处理单元)拥有大量的运算单元,能够进行高效的并行计算,进而大大缩短算法的运行时间;同时,利用统一计算设备架构(CUDA)的运算平台,能够方便的使用C语言为CUDA架构编写程序,实现在GPU处理器上超高性能运行,因此成为运动目标图像处理的首选。
专利CN102622723“基于CUDA及边缘检测的图像插值”利用CUDA实现了边缘增强检测,相对CPU的运算速度可提高一百多倍,但仍需复杂的NEDI算法,影响了其检测的实时性。
发明内容
本发明的目的在于提供实现运动目标边缘各项均匀实时增强的目的基于GPU的运动目标边缘增强方法。
本发明的目的是这样实现的:
本发明基于GPU的运动目标边缘增强方法,其特征是:
(1)捕获运动目标图像,由CPU读入捕获图像,获取该帧图像RGB通道数据和图像的宽度和高度尺寸信息;将图像RGB通道数据转换成单通道数据并放入数据缓存堆栈中;
(2)GPU初始化,由CPU内存转换为GPU内存;
(3)在GPU内对图像进行FFT变换运算,然后与螺旋相位板函数相乘,再对相乘结果进行IFFT换运算;
(4)由GPU内存转换为CPU内存,将运算结果回传给CPU,完成一次边缘增强图像输出显示;
(5)选择是否终止,若为否,则重复步骤(1)~(4)过程;若为是,释放GPU内存,完成运动目标边缘增强。
本发明的优势在于:
1.利用GPU构建虚拟螺旋相衬成像系统,即不需要特殊的光学元件,也不需要构建复杂的光学系统,便可达到运动目标边缘增强的目的,同时极大地降低了系统构造成本;
2.利用螺旋相衬成像法实现运动目标边缘增强,即可避免复杂的计算,又可实现运动目标任意方向的边缘增强,同时利用GPU强大的并行计算能力,实现运动目标边缘实时增强。
附图说明
图1为本发明的流程图;
图2为螺旋相位板(已有技术);
图3为一帧运动目标捕获图像;
图4为利用本发明边缘增强图像;
图5为基于Canny算子的边缘增强图像(已有技术)。
具体实施方式
下面结合附图举例对本发明做更详细地描述:
结合图1~5,本发明一种基于GPU的运动目标边缘增强方法,该方法包含以下步骤:
①运动目标图像捕获完成后,由CPU读入捕获图像,获取该帧图像RGB通道数据和图像的宽度和高度尺寸信息;将图像RGB通道数据转换成单通道数据并放入数据缓存堆栈中,等待处理;
②GPU初始化,由CPU内存转换为GPU内存,其特征是:
③在GPU内对图像进行FFT变换运算,然后与螺旋相位板函数相乘,再对相乘结果进行IFFT换运算;
④由GPU内存转换为CPU内存,将运算结果回传给CPU,完成边缘增强图像输出显示;
⑤判断运动目标捕获是否完成,若为否,重复①~④过程;若为是,释放GPU内存,完成运动目标边缘增强。
图1是本发明的方法流程图,本发明依据的测试平台为:CPU为IntelCorei3-32203.3GHz(4CPUs),GPU为NVIDIAGeForceGTX650TI(4SM,768SP),操作系统为WindowsXP SP3,执行函数库包括计算机视觉库OpenCV2.3.1和并行傅立叶变换库CUFFT。
如图2所示,螺旋相位板是一种光学厚度与旋转方位角φ成正比的纯相位衍射光学原件,其复振幅透过率函数可表示为:
H ( ρ , φ ) = circ ( ρ R ) exp ( ilφ )
其中(ρ,φ)为螺旋相位板所在面内的极坐标,R是螺旋相位板的有效孔径,l为拓扑荷,φ为绕板中心的方位角,绕中心一周的相位变化为2lπ。本发明采用拓扑荷为1的螺旋相位板。
以货车为运动目标,本发明的具体步骤如下:
1、待运动目标图像捕获完成后,由CPU读入一帧捕获图像,如图3所示,获取该帧图像RGB通道数据和图像宽度和高度的尺寸信息;
2、将图像RGB通道数据转换成单通道数据并放入内存中,等待处理;
3、设置螺旋相位板尺寸与图像尺寸一样,即宽度和高度一样,并由CPU读入螺旋相位板数据并放入内存中;
4、GPU初始化,包括设置CUDA数组类型,为数据开辟GPU显存;
5、内存转换,将放在计算机内存中的图像数据和螺旋相位板数据转换到开辟的GPU显存中,分别存于CUDA数组A和数组B中;
6、启动CUFFT库函数,将数组A进行快速傅立叶变换,并将新生成的数组数据覆盖原数组A中数据并存于数组A中;
7、根据获取的图像尺寸信息确定执行kernel函数的线程数目,包括设置block尺寸和grid尺寸,所述block是指GPU线程块单元,grid是指GPU线程网单元。
8、启动kernel函数,将数组A中的数据和数组B中的数据对应相乘,并将新生成的数组数据覆盖原数组A中数据并存于数组A中;
9、再次启动CUFFT库函数,将数组A进行快速傅立叶逆变换,并将新生成的数组数据覆盖原数组A中数据并存于数组A中;
10、内存转换,将存放在GPU显存中的数组A中数据转换到计算机内存中,并根据新的图像数据显示此帧边缘增强的图像,如图4所示;
11、选择是否终止,如果终止,则释放内存和GPU显存,如果未终止,则重复步骤1,采集下一帧运动物体的图像。
为了更好的说明本发明优良边缘增强特性,本实施例同时运用Canny算子对图3的图像进行边缘增强,如图5所示。对比图4和图5可以看出,本发明除计算量小外,对运动目标具有更强的选择性,且可大大消除冗余背景噪声,进而降低后续处理工作,提高处理速度。
此实施实例在GPU中构建虚拟螺旋相衬成像系统,不需特殊的光学元件和复杂的光学系统,也不需复杂的计算,便可实现运动目标边缘实时增强。

Claims (1)

1.基于GPU的运动目标边缘增强方法,其特征是:
(1)捕获运动目标图像,由CPU读入捕获图像,获取该帧图像RGB通道数据和图像的宽度和高度尺寸信息;将图像RGB通道数据转换成单通道数据并放入数据缓存堆栈中;
(2)GPU初始化,由CPU内存转换为GPU内存;
(3)在GPU内对图像进行FFT变换运算,然后与螺旋相位板函数相乘,再对相乘结果进行IFFT换运算;
(4)由GPU内存转换为CPU内存,将运算结果回传给CPU,完成一次边缘增强图像输出显示;
(5)选择是否终止,若为否,则重复步骤(1)~(4)过程;若为是,释放GPU内存,完成运动目标边缘增强。
CN201410143317.0A 2014-04-10 2014-04-10 基于gpu的运动目标边缘增强方法 Pending CN103927721A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410143317.0A CN103927721A (zh) 2014-04-10 2014-04-10 基于gpu的运动目标边缘增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410143317.0A CN103927721A (zh) 2014-04-10 2014-04-10 基于gpu的运动目标边缘增强方法

Publications (1)

Publication Number Publication Date
CN103927721A true CN103927721A (zh) 2014-07-16

Family

ID=51145933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410143317.0A Pending CN103927721A (zh) 2014-04-10 2014-04-10 基于gpu的运动目标边缘增强方法

Country Status (1)

Country Link
CN (1) CN103927721A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105577229A (zh) * 2015-12-07 2016-05-11 中国电子科技集团公司第十研究所 Cpu辅助gpu实现扩频信号快速捕获方法
CN110033406A (zh) * 2019-04-11 2019-07-19 北京百度网讯科技有限公司 用于处理图像的方法和装置
CN112857750A (zh) * 2021-01-12 2021-05-28 四川中科朗星光电科技有限公司 一种基于边缘增强的扩展目标波前探测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
岳俊等: "《基于CPU与GPU/CUDA的数字图像处理程序的性能比较》", 《地理空间信息》 *
李志焕: "《螺旋相位板在产生涡旋光束及图像边缘增强中的应用》", 《中国优秀硕士学位论文全文数据库 基础科学辑》 *
虞芬等: "《图像抖动核函数估计与图像恢复》", 《计算机应用研究》 *
连远锋等: "《自适应耦合变分模型及其GPU实现》", 《仪器仪表学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105577229A (zh) * 2015-12-07 2016-05-11 中国电子科技集团公司第十研究所 Cpu辅助gpu实现扩频信号快速捕获方法
CN105577229B (zh) * 2015-12-07 2018-04-13 中国电子科技集团公司第十研究所 Cpu辅助gpu实现扩频信号快速捕获方法
CN110033406A (zh) * 2019-04-11 2019-07-19 北京百度网讯科技有限公司 用于处理图像的方法和装置
CN110033406B (zh) * 2019-04-11 2023-08-29 北京百度网讯科技有限公司 用于处理图像的方法和装置
CN112857750A (zh) * 2021-01-12 2021-05-28 四川中科朗星光电科技有限公司 一种基于边缘增强的扩展目标波前探测方法

Similar Documents

Publication Publication Date Title
US11488005B2 (en) Smart autonomous machines utilizing cloud, error corrections, and predictions
Zhang et al. Image parallel processing based on GPU
Marzat et al. Real-time dense and accurate parallel optical flow using CUDA
CN106991665B (zh) 基于cuda图像融合并行计算的方法
CN102073982B (zh) 用gpu实现超大sar图像各向异性扩散滤波加速方法
Hirabayashi et al. GPU implementations of object detection using HOG features and deformable models
CN104732490A (zh) 基于cuda的快速双边滤波方法
DE112020000854T5 (de) Thread-gruppen-planung für die grafikverarbeitung
Park et al. Low-cost, high-speed computer vision using NVIDIA's CUDA architecture
CN103927721A (zh) 基于gpu的运动目标边缘增强方法
Rahman et al. Parallel implementation of a spatio-temporal visual saliency model
CN101739670B (zh) 非局部均值空域时变图像滤波方法
Xiao et al. Image Sobel edge extraction algorithm accelerated by OpenCL
Bellas et al. Real-time fisheye lens distortion correction using automatically generated streaming accelerators
CN109781736A (zh) 一种晶元纹理图像周期的自动测量方法和系统
Jensen et al. A two-level real-time vision machine combining coarse-and fine-grained parallelism
Xie et al. GPU-based fast scale invariant interest point detector
de Andrade et al. An OpenCL framework for high performance extraction of image features
Mori et al. An unified approach for convolution-based image filtering on reconfigurable systems
Wang et al. Implementing and parallelizing real-time lane detection on heterogeneous platforms
Wu Paralleled Laplacian of Gaussian (LoG) edge detection algorithm by using GPU
DE102021121202A1 (de) Verfahren und Einrichtung zum Bestimmen einer Vorderkörperorientierung
CN113344765A (zh) 一种频域天文图像目标检测方法及系统
Barina et al. Accelerating discrete wavelet transforms on GPUs
Jacobsen et al. Fpga accelerated online boosting for multi-target tracking

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140716

WD01 Invention patent application deemed withdrawn after publication