CN111833264A - 一种基于cuda的图像快速去噪方法及系统 - Google Patents

一种基于cuda的图像快速去噪方法及系统 Download PDF

Info

Publication number
CN111833264A
CN111833264A CN202010543382.8A CN202010543382A CN111833264A CN 111833264 A CN111833264 A CN 111833264A CN 202010543382 A CN202010543382 A CN 202010543382A CN 111833264 A CN111833264 A CN 111833264A
Authority
CN
China
Prior art keywords
window
pixel
cuda
image data
gpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010543382.8A
Other languages
English (en)
Inventor
张立恒
刘怀广
肖骏松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Science and Engineering WUSE
Wuhan University of Science and Technology WHUST
Original Assignee
Wuhan University of Science and Engineering WUSE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Science and Engineering WUSE filed Critical Wuhan University of Science and Engineering WUSE
Priority to CN202010543382.8A priority Critical patent/CN111833264A/zh
Publication of CN111833264A publication Critical patent/CN111833264A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • G06T2207/20032Median filtering

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及一种基于CUDA的图像快速去噪方法及系统,其方法,包括以下步骤,S1,将CPU读取到的图像数据导入到GPU中;S2,基于CUDA,在GPU中对所述图像数据进行并行的滤波处理,得到处理结果;S3,将所述处理结果从所述GPU中导出至所述CPU中。本发明利用CUDA平台程序并行加速的特点运用到图像处理去噪中,大大缩短了传统CPU串行处理代码的时间,在一定的程度上缩短了图像滤波的时间,提高图像处理效率。

Description

一种基于CUDA的图像快速去噪方法及系统
技术领域
本发明涉及图像处理领域,具体涉及一种基于CUDA的图像快速去噪方法及系统。
背景技术
近些年来随着计算机技术和显示器硬件技术的不断发展与革新,机器视觉图像处理技术也在不断发展。但目前国内计算机图像处理的速度还是比较慢的,比如说对于运动物体的缺陷检测技术就必须要求低速检测,由于CPU完成代码都是串行“排队的”,所以其检测效率相对来说还是比较低的;因此,CPU串行代码实现图像去噪速度较慢。
发明内容
本发明所要解决的技术问题是提供一种基于CUDA的图像快速去噪方法及系统,解决了CPU串行代码实现所存在的图像去噪速度较慢的问题。
本发明解决上述技术问题的技术方案如下:一种基于CUDA的图像快速去噪方法,包括以下步骤,
S1,将CPU读取到的图像数据导入到GPU中;
S2,基于CUDA,在GPU中对所述图像数据进行并行的滤波处理,得到处理结果;
S3,将所述处理结果从所述GPU中导出至所述CPU中。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述滤波处理的具体过程为,
判断所述图像数据中像素点的像素是否为窗口极值;若是,则对所述像素点进行中值滤波;若否,则使所述像素点的像素灰度值保持不变。
进一步,判断所述图像数据中像素点的像素是否为窗口极值之前,还包括如下步骤,通过平滑窗口获取所述图像数据,并寻找窗口极值;
判断所述图像数据中像素点的像素是否为窗口极值具体包括,判断窗口中心点对应的像素灰度值是否为所述窗口极值。
进一步,对所述像素点进行中值滤波的具体步骤为,对窗口中像素点的像素灰度值从小到大排列,并将窗口中心点对应的像素灰度值更新为窗口中值;
使所述像素点的像素灰度值保持不变具体为,使窗口中心点对应的像素灰度值保持不变。
进一步,在所述S1之前,还包括以下步骤,
通过所述CPU读取所述图像数据,并为所述GPU分配内存和线程。
基于上述一种基于CUDA的图像快速去噪方法,本发明还提供一种基于CUDA的图像快速去噪系统。
一种基于CUDA的图像快速去噪系统,包括以下模块,
图像数据导入模块,其用于将CPU读取到的图像数据导入到GPU中;
滤波模块,其用于基于CUDA,在GPU中对所述图像数据进行并行的滤波处理,得到处理结果;
处理结果导出模块,其用于将所述处理结果从所述GPU中导出至所述CPU中。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述滤波模块具体用于,
判断所述图像数据中像素点的像素是否为窗口极值;若是,则对所述像素点进行中值滤波;若否,则使所述像素点的像素灰度值保持不变。
进一步,所述滤波模块具体用于,通过平滑窗口获取所述图像数据,并寻找窗口极值;判断窗口中心点对应的像素灰度值是否为所述窗口极值。
进一步,所述滤波模块还具体用于,判断窗口中心点对应的像素灰度值是否为所述窗口极值;若是,则对窗口中像素点的像素灰度值从小到大排列,并将窗口中心点对应的像素灰度值更新为窗口中值;若否,则使窗口中心点对应的像素灰度值保持不变。
进一步,还包括图像数据读取及内存线程分配模块,
所述图像数据读取及内存线程分配模块用于,通过所述CPU读取所述图像数据,并为所述GPU分配内存和线程。
本发明的有益效果是:一种基于CUDA的图像快速去噪方法及系统利用CUDA平台程序并行加速的特点运用到图像处理去噪中,大大缩短了传统CPU串行处理代码的时间,在一定的程度上缩短了图像滤波的时间,提高图像处理效率;另外相对于传统的中值滤波方式来说,本发明增加了一个寻找极值函数和一个判断极值函数,这样一来在图像滤波去噪的过程中更加具有针对性。
附图说明
图1为本发明一种基于CUDA的图像快速去噪方法的原理图;
图2为本发明一种基于CUDA的图像快速去噪方法的流程图;
图3为GPU处理器执行模块的结构示意图;
图4为本发明一种基于CUDA的图像快速去噪系统的结构框图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,一种基于CUDA的图像快速去噪方法,包括以下步骤,
S1,将CPU读取到的图像数据导入到GPU中;
S2,基于CUDA,在GPU中对所述图像数据进行并行的滤波处理,得到处理结果;
S3,将所述处理结果从所述GPU中导出至所述CPU中。
GPU作为大规模的并行处理器提供了一种快速高效的检测方法,与CPU相比,GPU能够大幅度的提升密集数据得处理速度,所以利用GPU处理器能够并行实现代码的特点来进行图像处理去噪方面在一定的程度上缩短时间,提高效率。CUDA是一种通用并行计算机平台和编程的模型,它能够管理GPU硬件资源使得GPU实现较为复杂的运算,具体来说GPU是实现计算的硬件基础,CUDA是实现并行代码的操作平台。
图像中的噪声对图像分割、边缘检测、特征提取等后续处理会造成不利的影响,因此在后续处理前必须对图像进行去噪处理。图像去噪也称为图像滤波,对于面积和形态比较大的噪声可以通过形态学的腐蚀、膨胀、开操作和闭操作实现,但是对于椒盐噪声而言,可以采用中值滤波的方法。
中值滤波是一种非线性滤波方法,原始的中值滤波是用平滑窗口的灰度中值来代替窗口中心的像素的灰度值对椒盐噪声有一定的抑制作用。
椒盐噪声像素点的灰度值为0或255,本发明提供了一种改进的中值滤波方法:判断所述图像数据中像素点的像素是否为窗口极值;若是,则对所述像素点进行中值滤波;若否,则使所述像素点的像素灰度值保持不变。此方法上的改进对去除椒盐噪声更加具有针对性。滤波效果也比传统的中值滤波方法要好,对于那些窗口中心对应像素不是极值的内核来说不会因此有失真的几率。同理均值滤波也一样。
优选的,判断所述图像数据中像素点的像素是否为窗口极值之前,还包括如下步骤,通过平滑窗口获取所述图像数据,并寻找窗口极值;判断所述图像数据中像素点的像素是否为窗口极值具体包括,判断窗口中心点对应的像素灰度值是否为所述窗口极值。
进一步,对所述像素点进行中值滤波的具体步骤为,对窗口中像素点的像素灰度值从小到大排列,并将窗口中心点对应的像素灰度值更新为窗口中值;使所述像素点的像素灰度值保持不变具体为,使窗口中心点对应的像素灰度值保持不变。
优选的,在所述S1之前,还包括以下步骤,通过所述CPU读取所述图像数据,并为所述GPU分配内存和线程。
综上,本发明一种基于CUDA的图像快速去噪方法的流程如图2所示。根据图2,首先CPU读取图像数据,然后分配GPU内存和线程,继而图像数据从CPU导入到GPU中,然后进行图像滤波,相对于传统的中值滤波方式来说,改进后的中值滤波比之前多增加了一个寻找极值函数和一个判断极值函数,这样一来在图像滤波去噪的过程中更加具有针对性!具体流程如图2所示,这个过程都是在GPU中完成,图3是GPU处理模块,GPU中的计算内核称为线程Thread,一个线程构成有一个线程块Block,一组线程块就构成了一个网格Grid。
具体来说,可以把上述S1至S3三个步骤的时间分别用tCTG,tGexe,tGTC来表示,基于CUDA的并行代码执行时间TGPU=tCTG+tGexe+tGTC,而传统的CPU串行执行代码的时间用TCPU来表示来表示,可以看出GPU执行比CPU执行多了两部分的时间,那么要想使得TGPU<TCPU,必须有tGexe<TCPU成立,其中tGexe是GPU核执行并行计算步骤的时间,也就是基于CUDA的程序加速部分的执行时间。CUDA程序中执行计算的核称为线程(Thread),一组线程组织成一个线程块(Block),一组线程块又组织成一个网格(Grid)。然后在目前的NVIDIA的显卡中,一个线程块内最大的线程数是1024,一个网格中最大的线程数量是65536,但是由于硬件的限制,同时执行的线程块在数目上是小于65536的,在一个和程序执行的时候,有各个线程块的粗粒度并行和线程块内每个线程的粗粒度并行,但是对于CPU来说的话,完成这些代码操作都是串行“排队”执行的,如果所要处理的数据量越大的话,CPU线程的并行度(同时执行的线程)就会越大,那么作为在CUDA程序加速部分的执行时间tGexe就会远远小于TCPU,另外的两部分时间tCTG,tGTC只是一个数据复制的时间,一般来说都是比较小的,这样的话就有TGPU<TCPU成立,从而使得CUDA程序的执行部分得到加速,本发明将此原理运用到图像处理当中,尤其是涉及图像去噪方面,大大节省了因为传统CPU串行代码处理所耗费的时间。如果数据量越大GPU线程的并行程度越高,S2中GPU执行并行计算的时间就越短,从而提高图像处理效率。
基于上述一种基于CUDA的图像快速去噪方法,本发明还提供一种基于CUDA的图像快速去噪系统。
如图4所示,一种基于CUDA的图像快速去噪系统,包括以下模块,
图像数据导入模块,其用于将CPU读取到的图像数据导入到GPU中;
滤波模块,其用于基于CUDA,在GPU中对所述图像数据进行并行的滤波处理,得到处理结果;
处理结果导出模块,其用于将所述处理结果从所述GPU中导出至所述CPU中。
在本具体实施例中:
所述滤波模块具体用于,判断所述图像数据中像素点的像素是否为窗口极值;若是,则对所述像素点进行中值滤波;若否,则使所述像素点的像素灰度值保持不变。
所述滤波模块具体用于,通过平滑窗口获取所述图像数据,并寻找窗口极值;判断窗口中心点对应的像素灰度值是否为所述窗口极值。
所述滤波模块还具体用于,判断窗口中心点对应的像素灰度值是否为所述窗口极值;若是,则对窗口中像素点的像素灰度值从小到大排列,并将窗口中心点对应的像素灰度值更新为窗口中值;若否,则使窗口中心点对应的像素灰度值保持不变。
本发明的系统还包括图像数据读取及内存线程分配模块,所述图像数据读取及内存线程分配模块用于,通过所述CPU读取所述图像数据,并为所述GPU分配内存和线程。
本发明一种基于CUDA的图像快速去噪方法及系统利用CUDA平台程序并行加速的特点运用到图像处理去噪中,大大缩短了传统CPU串行处理代码的时间,在一定的程度上缩短了图像滤波的时间,提高图像处理效率;另外相对于传统的中值滤波方式来说,本发明增加了一个寻找极值函数和一个判断极值函数,这样一来在图像滤波去噪的过程中更加具有针对性。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于CUDA的图像快速去噪方法,其特征在于:包括以下步骤,
S1,将CPU读取到的图像数据导入到GPU中;
S2,基于CUDA,在GPU中对所述图像数据进行并行的滤波处理,得到处理结果;
S3,将所述处理结果从所述GPU中导出至所述CPU中。
2.根据权利要求1所述的基于CUDA的图像快速去噪方法,其特征在于:所述滤波处理的具体过程为,
判断所述图像数据中像素点的像素是否为窗口极值;若是,则对所述像素点进行中值滤波;若否,则使所述像素点的像素灰度值保持不变。
3.根据权利要求2所述的基于CUDA的图像快速去噪方法,其特征在于:判断所述图像数据中像素点的像素是否为窗口极值之前,还包括如下步骤,通过平滑窗口获取所述图像数据,并寻找窗口极值;
判断所述图像数据中像素点的像素是否为窗口极值具体包括,判断窗口中心点对应的像素灰度值是否为所述窗口极值。
4.根据权利要求3所述的基于CUDA的图像快速去噪方法,其特征在于:对所述像素点进行中值滤波的具体步骤为,对窗口中像素点的像素灰度值从小到大排列,并将窗口中心点对应的像素灰度值更新为窗口中值;
使所述像素点的像素灰度值保持不变具体为,使窗口中心点对应的像素灰度值保持不变。
5.根据权利要求1至4任一项所述的基于CUDA的图像快速去噪方法,其特征在于:在所述S1之前,还包括以下步骤,
通过所述CPU读取所述图像数据,并为所述GPU分配内存和线程。
6.一种基于CUDA的图像快速去噪系统,其特征在于:包括以下模块,
图像数据导入模块,其用于将CPU读取到的图像数据导入到GPU中;
滤波模块,其用于基于CUDA,在GPU中对所述图像数据进行并行的滤波处理,得到处理结果;
处理结果导出模块,其用于将所述处理结果从所述GPU中导出至所述CPU中。
7.根据权利要求6所述的基于CUDA的图像快速去噪系统,其特征在于:所述滤波模块具体用于,
判断所述图像数据中像素点的像素是否为窗口极值;若是,则对所述像素点进行中值滤波;若否,则使所述像素点的像素灰度值保持不变。
8.根据权利要求7所述的基于CUDA的图像快速去噪系统,其特征在于:所述滤波模块具体用于,通过平滑窗口获取所述图像数据,并寻找窗口极值;判断窗口中心点对应的像素灰度值是否为所述窗口极值。
9.根据权利要求8所述的基于CUDA的图像快速去噪系统,其特征在于:所述滤波模块还具体用于,判断窗口中心点对应的像素灰度值是否为所述窗口极值;若是,则对窗口中像素点的像素灰度值从小到大排列,并将窗口中心点对应的像素灰度值更新为窗口中值;若否,则使窗口中心点对应的像素灰度值保持不变。
10.根据权利要求6至9任一项所述的基于CUDA的图像快速去噪系统,其特征在于:还包括图像数据读取及内存线程分配模块,
所述图像数据读取及内存线程分配模块用于,通过所述CPU读取所述图像数据,并为所述GPU分配内存和线程。
CN202010543382.8A 2020-06-15 2020-06-15 一种基于cuda的图像快速去噪方法及系统 Pending CN111833264A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010543382.8A CN111833264A (zh) 2020-06-15 2020-06-15 一种基于cuda的图像快速去噪方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010543382.8A CN111833264A (zh) 2020-06-15 2020-06-15 一种基于cuda的图像快速去噪方法及系统

Publications (1)

Publication Number Publication Date
CN111833264A true CN111833264A (zh) 2020-10-27

Family

ID=72897639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010543382.8A Pending CN111833264A (zh) 2020-06-15 2020-06-15 一种基于cuda的图像快速去噪方法及系统

Country Status (1)

Country Link
CN (1) CN111833264A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115942128A (zh) * 2022-12-12 2023-04-07 大连理工大学 一种基于异构平台的isp系统设计与实现方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408691A (zh) * 2014-11-17 2015-03-11 南昌大学 一种基于gpu并行选择式掩模平滑方法
CN104732490A (zh) * 2014-12-03 2015-06-24 南京理工大学 基于cuda的快速双边滤波方法
CN106355562A (zh) * 2016-08-30 2017-01-25 兰州交通大学 一种基于机器视觉的钢轨检测图像的去噪方法
CN106775999A (zh) * 2016-11-16 2017-05-31 华南师范大学 基于gpu的腔内扫描光声系统及数据处理方法
CN109727206A (zh) * 2018-12-05 2019-05-07 安徽紫薇帝星数字科技有限公司 一种二值图像中值滤波的快速计算方法以及其实现方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408691A (zh) * 2014-11-17 2015-03-11 南昌大学 一种基于gpu并行选择式掩模平滑方法
CN104732490A (zh) * 2014-12-03 2015-06-24 南京理工大学 基于cuda的快速双边滤波方法
CN106355562A (zh) * 2016-08-30 2017-01-25 兰州交通大学 一种基于机器视觉的钢轨检测图像的去噪方法
CN106775999A (zh) * 2016-11-16 2017-05-31 华南师范大学 基于gpu的腔内扫描光声系统及数据处理方法
CN109727206A (zh) * 2018-12-05 2019-05-07 安徽紫薇帝星数字科技有限公司 一种二值图像中值滤波的快速计算方法以及其实现方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115942128A (zh) * 2022-12-12 2023-04-07 大连理工大学 一种基于异构平台的isp系统设计与实现方法
CN115942128B (zh) * 2022-12-12 2024-04-12 大连理工大学 一种基于异构平台的isp系统设计与实现方法

Similar Documents

Publication Publication Date Title
WO2018103608A1 (zh) 一种文字检测方法、装置及存储介质
CN111583227A (zh) 一种荧光细胞自动计数方法、装置、设备和介质
CN110969046B (zh) 人脸识别方法、设备及计算机可读存储介质
CN110349112B (zh) 一种基于自适应奇异值阈值的两阶段图像去噪方法
CN113763371B (zh) 病理图像的细胞核分割方法及装置
CN113012068A (zh) 图像去噪方法、装置、电子设备及计算机可读存储介质
CN110246201B (zh) 一种基于线程级并行的铅笔画生成方法
CN114897782B (zh) 基于生成式对抗网络的胃癌病理切片图像分割预测方法
CN115953784A (zh) 基于残差和特征分块注意力的激光打码字符分割方法
Zhang et al. Using image processing technology to create a novel fry counting algorithm
CN115601330A (zh) 一种基于多尺度空间反向注意力机制的结肠息肉分割方法
CN117830142B (zh) 一种基于智能识别图像处理的视频逐帧去噪方法及系统
CN115909353A (zh) 一种图像二值化处理方法和装置
CN111833264A (zh) 一种基于cuda的图像快速去噪方法及系统
CN114298985B (zh) 缺陷检测方法、装置、设备及存储介质
CN113450355A (zh) 一种基于多膜态ct图像和3dcnn网络提取图像特征的方法
CN110111307B (zh) 一种免疫教学用免疫系统反馈模拟系统及方法
CN110827309A (zh) 一种基于超像素的偏光片外观缺陷分割方法
Qiu et al. Parallel fast pencil drawing generation algorithm based on GPU
CN110751150A (zh) 一种基于fpga的二值神经网络车牌识别方法及系统
CN113326847B (zh) 一种基于全卷积神经网络的遥感图像语义分割方法及装置
CN113627342B (zh) 视频深度特征提取优化的方法、系统、设备及存储介质
CN109671088A (zh) 一种纱线毛羽特征参数的数字化方法
CN111242140B (zh) 一种非均匀光照下快速提取轮廓线的方法
CN113936133A (zh) 一种面向目标检测的自适应数据增强方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201027