CN111833264A

CN111833264A - 一种基于cuda的图像快速去噪方法及系统

Info

Publication number: CN111833264A
Application number: CN202010543382.8A
Authority: CN
Inventors: 张立恒; 刘怀广; 肖骏松
Original assignee: Wuhan University of Science and Engineering WUSE
Current assignee: Wuhan University of Science and Engineering WUSE; Wuhan University of Science and Technology WHUST
Priority date: 2020-06-15
Filing date: 2020-06-15
Publication date: 2020-10-27

Abstract

本发明涉及一种基于CUDA的图像快速去噪方法及系统，其方法，包括以下步骤，S1，将CPU读取到的图像数据导入到GPU中；S2，基于CUDA，在GPU中对所述图像数据进行并行的滤波处理，得到处理结果；S3，将所述处理结果从所述GPU中导出至所述CPU中。本发明利用CUDA平台程序并行加速的特点运用到图像处理去噪中，大大缩短了传统CPU串行处理代码的时间，在一定的程度上缩短了图像滤波的时间，提高图像处理效率。

Description

一种基于CUDA的图像快速去噪方法及系统

技术领域

本发明涉及图像处理领域，具体涉及一种基于CUDA的图像快速去噪方法及系统。

背景技术

近些年来随着计算机技术和显示器硬件技术的不断发展与革新，机器视觉图像处理技术也在不断发展。但目前国内计算机图像处理的速度还是比较慢的，比如说对于运动物体的缺陷检测技术就必须要求低速检测，由于CPU完成代码都是串行“排队的”，所以其检测效率相对来说还是比较低的；因此，CPU串行代码实现图像去噪速度较慢。

发明内容

本发明所要解决的技术问题是提供一种基于CUDA的图像快速去噪方法及系统，解决了CPU串行代码实现所存在的图像去噪速度较慢的问题。

本发明解决上述技术问题的技术方案如下：一种基于CUDA的图像快速去噪方法，包括以下步骤，

S1，将CPU读取到的图像数据导入到GPU中；

S2，基于CUDA，在GPU中对所述图像数据进行并行的滤波处理，得到处理结果；

S3，将所述处理结果从所述GPU中导出至所述CPU中。

在上述技术方案的基础上，本发明还可以做如下改进。

进一步，所述滤波处理的具体过程为，

判断所述图像数据中像素点的像素是否为窗口极值；若是，则对所述像素点进行中值滤波；若否，则使所述像素点的像素灰度值保持不变。

进一步，判断所述图像数据中像素点的像素是否为窗口极值之前，还包括如下步骤，通过平滑窗口获取所述图像数据，并寻找窗口极值；

判断所述图像数据中像素点的像素是否为窗口极值具体包括，判断窗口中心点对应的像素灰度值是否为所述窗口极值。

进一步，对所述像素点进行中值滤波的具体步骤为，对窗口中像素点的像素灰度值从小到大排列，并将窗口中心点对应的像素灰度值更新为窗口中值；

使所述像素点的像素灰度值保持不变具体为，使窗口中心点对应的像素灰度值保持不变。

进一步，在所述S1之前，还包括以下步骤，

通过所述CPU读取所述图像数据，并为所述GPU分配内存和线程。

基于上述一种基于CUDA的图像快速去噪方法，本发明还提供一种基于CUDA的图像快速去噪系统。

一种基于CUDA的图像快速去噪系统，包括以下模块，

图像数据导入模块，其用于将CPU读取到的图像数据导入到GPU中；

滤波模块，其用于基于CUDA，在GPU中对所述图像数据进行并行的滤波处理，得到处理结果；

处理结果导出模块，其用于将所述处理结果从所述GPU中导出至所述CPU中。

在上述技术方案的基础上，本发明还可以做如下改进。

进一步，所述滤波模块具体用于，

进一步，所述滤波模块具体用于，通过平滑窗口获取所述图像数据，并寻找窗口极值；判断窗口中心点对应的像素灰度值是否为所述窗口极值。

进一步，所述滤波模块还具体用于，判断窗口中心点对应的像素灰度值是否为所述窗口极值；若是，则对窗口中像素点的像素灰度值从小到大排列，并将窗口中心点对应的像素灰度值更新为窗口中值；若否，则使窗口中心点对应的像素灰度值保持不变。

进一步，还包括图像数据读取及内存线程分配模块，

所述图像数据读取及内存线程分配模块用于，通过所述CPU读取所述图像数据，并为所述GPU分配内存和线程。

本发明的有益效果是：一种基于CUDA的图像快速去噪方法及系统利用CUDA平台程序并行加速的特点运用到图像处理去噪中，大大缩短了传统CPU串行处理代码的时间，在一定的程度上缩短了图像滤波的时间，提高图像处理效率；另外相对于传统的中值滤波方式来说，本发明增加了一个寻找极值函数和一个判断极值函数，这样一来在图像滤波去噪的过程中更加具有针对性。

附图说明

图1为本发明一种基于CUDA的图像快速去噪方法的原理图；

图2为本发明一种基于CUDA的图像快速去噪方法的流程图；

图3为GPU处理器执行模块的结构示意图；

图4为本发明一种基于CUDA的图像快速去噪系统的结构框图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

如图1所示，一种基于CUDA的图像快速去噪方法，包括以下步骤，

S1，将CPU读取到的图像数据导入到GPU中；

S3，将所述处理结果从所述GPU中导出至所述CPU中。

GPU作为大规模的并行处理器提供了一种快速高效的检测方法，与CPU相比，GPU能够大幅度的提升密集数据得处理速度，所以利用GPU处理器能够并行实现代码的特点来进行图像处理去噪方面在一定的程度上缩短时间，提高效率。CUDA是一种通用并行计算机平台和编程的模型，它能够管理GPU硬件资源使得GPU实现较为复杂的运算，具体来说GPU是实现计算的硬件基础，CUDA是实现并行代码的操作平台。

图像中的噪声对图像分割、边缘检测、特征提取等后续处理会造成不利的影响，因此在后续处理前必须对图像进行去噪处理。图像去噪也称为图像滤波，对于面积和形态比较大的噪声可以通过形态学的腐蚀、膨胀、开操作和闭操作实现，但是对于椒盐噪声而言，可以采用中值滤波的方法。

中值滤波是一种非线性滤波方法，原始的中值滤波是用平滑窗口的灰度中值来代替窗口中心的像素的灰度值对椒盐噪声有一定的抑制作用。

椒盐噪声像素点的灰度值为0或255，本发明提供了一种改进的中值滤波方法：判断所述图像数据中像素点的像素是否为窗口极值；若是，则对所述像素点进行中值滤波；若否，则使所述像素点的像素灰度值保持不变。此方法上的改进对去除椒盐噪声更加具有针对性。滤波效果也比传统的中值滤波方法要好，对于那些窗口中心对应像素不是极值的内核来说不会因此有失真的几率。同理均值滤波也一样。

优选的，判断所述图像数据中像素点的像素是否为窗口极值之前，还包括如下步骤，通过平滑窗口获取所述图像数据，并寻找窗口极值；判断所述图像数据中像素点的像素是否为窗口极值具体包括，判断窗口中心点对应的像素灰度值是否为所述窗口极值。

进一步，对所述像素点进行中值滤波的具体步骤为，对窗口中像素点的像素灰度值从小到大排列，并将窗口中心点对应的像素灰度值更新为窗口中值；使所述像素点的像素灰度值保持不变具体为，使窗口中心点对应的像素灰度值保持不变。

优选的，在所述S1之前，还包括以下步骤，通过所述CPU读取所述图像数据，并为所述GPU分配内存和线程。

综上，本发明一种基于CUDA的图像快速去噪方法的流程如图2所示。根据图2，首先CPU读取图像数据，然后分配GPU内存和线程，继而图像数据从CPU导入到GPU中，然后进行图像滤波，相对于传统的中值滤波方式来说，改进后的中值滤波比之前多增加了一个寻找极值函数和一个判断极值函数，这样一来在图像滤波去噪的过程中更加具有针对性！具体流程如图2所示，这个过程都是在GPU中完成，图3是GPU处理模块，GPU中的计算内核称为线程Thread,一个线程构成有一个线程块Block,一组线程块就构成了一个网格Grid。

具体来说，可以把上述S1至S3三个步骤的时间分别用t_CTG，t_Gexe，t_GTC来表示，基于CUDA的并行代码执行时间T_GPU＝t_CTG+t_Gexe+t_GTC，而传统的CPU串行执行代码的时间用T_CPU来表示来表示，可以看出GPU执行比CPU执行多了两部分的时间，那么要想使得T_GPU＜T_CPU，必须有t_Gexe＜T_CPU成立，其中t_Gexe是GPU核执行并行计算步骤的时间，也就是基于CUDA的程序加速部分的执行时间。CUDA程序中执行计算的核称为线程(Thread),一组线程组织成一个线程块(Block),一组线程块又组织成一个网格(Grid)。然后在目前的NVIDIA的显卡中，一个线程块内最大的线程数是1024，一个网格中最大的线程数量是65536，但是由于硬件的限制，同时执行的线程块在数目上是小于65536的，在一个和程序执行的时候，有各个线程块的粗粒度并行和线程块内每个线程的粗粒度并行，但是对于CPU来说的话，完成这些代码操作都是串行“排队”执行的，如果所要处理的数据量越大的话，CPU线程的并行度(同时执行的线程)就会越大，那么作为在CUDA程序加速部分的执行时间t_Gexe就会远远小于T_CPU,另外的两部分时间t_CTG，t_GTC只是一个数据复制的时间，一般来说都是比较小的，这样的话就有T_GPU＜T_CPU成立，从而使得CUDA程序的执行部分得到加速，本发明将此原理运用到图像处理当中，尤其是涉及图像去噪方面，大大节省了因为传统CPU串行代码处理所耗费的时间。如果数据量越大GPU线程的并行程度越高，S2中GPU执行并行计算的时间就越短，从而提高图像处理效率。

如图4所示，一种基于CUDA的图像快速去噪系统，包括以下模块，

在本具体实施例中：

所述滤波模块具体用于，判断所述图像数据中像素点的像素是否为窗口极值；若是，则对所述像素点进行中值滤波；若否，则使所述像素点的像素灰度值保持不变。

所述滤波模块具体用于，通过平滑窗口获取所述图像数据，并寻找窗口极值；判断窗口中心点对应的像素灰度值是否为所述窗口极值。

所述滤波模块还具体用于，判断窗口中心点对应的像素灰度值是否为所述窗口极值；若是，则对窗口中像素点的像素灰度值从小到大排列，并将窗口中心点对应的像素灰度值更新为窗口中值；若否，则使窗口中心点对应的像素灰度值保持不变。

本发明的系统还包括图像数据读取及内存线程分配模块，所述图像数据读取及内存线程分配模块用于，通过所述CPU读取所述图像数据，并为所述GPU分配内存和线程。

本发明一种基于CUDA的图像快速去噪方法及系统利用CUDA平台程序并行加速的特点运用到图像处理去噪中，大大缩短了传统CPU串行处理代码的时间，在一定的程度上缩短了图像滤波的时间，提高图像处理效率；另外相对于传统的中值滤波方式来说，本发明增加了一个寻找极值函数和一个判断极值函数，这样一来在图像滤波去噪的过程中更加具有针对性。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于CUDA的图像快速去噪方法，其特征在于：包括以下步骤，

S1，将CPU读取到的图像数据导入到GPU中；

S3，将所述处理结果从所述GPU中导出至所述CPU中。

2.根据权利要求1所述的基于CUDA的图像快速去噪方法，其特征在于：所述滤波处理的具体过程为，

3.根据权利要求2所述的基于CUDA的图像快速去噪方法，其特征在于：判断所述图像数据中像素点的像素是否为窗口极值之前，还包括如下步骤，通过平滑窗口获取所述图像数据，并寻找窗口极值；

4.根据权利要求3所述的基于CUDA的图像快速去噪方法，其特征在于：对所述像素点进行中值滤波的具体步骤为，对窗口中像素点的像素灰度值从小到大排列，并将窗口中心点对应的像素灰度值更新为窗口中值；

5.根据权利要求1至4任一项所述的基于CUDA的图像快速去噪方法，其特征在于：在所述S1之前，还包括以下步骤，

6.一种基于CUDA的图像快速去噪系统，其特征在于：包括以下模块，

7.根据权利要求6所述的基于CUDA的图像快速去噪系统，其特征在于：所述滤波模块具体用于，

8.根据权利要求7所述的基于CUDA的图像快速去噪系统，其特征在于：所述滤波模块具体用于，通过平滑窗口获取所述图像数据，并寻找窗口极值；判断窗口中心点对应的像素灰度值是否为所述窗口极值。

9.根据权利要求8所述的基于CUDA的图像快速去噪系统，其特征在于：所述滤波模块还具体用于，判断窗口中心点对应的像素灰度值是否为所述窗口极值；若是，则对窗口中像素点的像素灰度值从小到大排列，并将窗口中心点对应的像素灰度值更新为窗口中值；若否，则使窗口中心点对应的像素灰度值保持不变。

10.根据权利要求6至9任一项所述的基于CUDA的图像快速去噪系统，其特征在于：还包括图像数据读取及内存线程分配模块，