CN106682604B - 一种基于深度学习的模糊图像检测方法 - Google Patents
一种基于深度学习的模糊图像检测方法 Download PDFInfo
- Publication number
- CN106682604B CN106682604B CN201611181327.9A CN201611181327A CN106682604B CN 106682604 B CN106682604 B CN 106682604B CN 201611181327 A CN201611181327 A CN 201611181327A CN 106682604 B CN106682604 B CN 106682604B
- Authority
- CN
- China
- Prior art keywords
- image
- layer
- network
- fuzzy
- cepstrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
- G06F2218/06—Denoising by applying a scale-space analysis, e.g. using wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Abstract
本发明专利提出了一种基于频谱和倒谱特征的模糊图像检测方法,并利用深度分类网络计算图像存在模糊问题的概率,取得了很好的性能。该方法提出了利用向量化频谱特征和向量化倒谱特征两种特征作为图像的模糊特征,用于模糊检测。对所有图像进行模糊特征分析的基础上,建立深度分类网络模型,模型的输出值为图像属于模糊图像的概率,当该概率值较大时则判断为模糊图像。该方法由于引入了深度网络,有良好的分类效果,同时也是一种无参照的模糊图像检测方法,可以广泛的应用于图像识别领域。
Description
技术领域
本发明属于图像处理技术领域,特别涉及各类图像的模糊检测技术。
背景技术
图像模糊检测一直是图像处理的重要研究方向,它是指自动从输入图像序列中筛除存在模糊图像的过程。在车牌识别、人脸识别、物体识别和虹膜识别等多个计算机视觉问题中,都需要确保输入图像清晰,才能进一步提取有效的视觉特征进行识别。因此,如何利用图像处理技术去除掉模糊图像,是各种计算机视觉问题第一步需要解决的。目前的图像模糊检测算法可以分为两个类别:(1)有参照模糊检测方法和(2)无参照模糊检测方法。
有参照模糊检测方法是指通过比较失真图像和参照(清晰)图像来评价失真图像的模糊程度,该方法是目前为止客观评价图像模糊程度中最可靠的方法。其中,基于均方误差、峰值信噪比、和归一化最小平方误差等的方法为常见的评价方法。这类方法计算简单,同时能有效评测失真图像的模糊程度。然而,由于在实际应用中参照图像通常无法得到,因此该类方法的应用范围非常有限。参见文献“Rony Ferzli and Lina J.Karam,HumanVisual System Based No-Reference ObjectiveImage Sharpness Metric,2006IEEEInternational Conference on Image Processing,pp.2949-2952”。
非参照模糊图像检测方法是指不通过与参照(清晰)图像进行对比,直接根据模糊失真图像的特性定义检测指标,通过指标的数值判断图像是否模糊以及模糊程度。该类方法与有参照模糊图像检测方法相比,在检测准确性上略显不足。但是,由于该类方法不需要获取原始参照图像进行对比,应用范围很广。目前大多数研究工作都在针对如何寻找更有效的模糊检测指标而进行。参见文献“Pina Marziliano,Frederic Dufaux,StefanWinkler and Touradj Ebrahimi,A No-Reference Perceptual Blur Metric,2002IEEEInternational Conference on Image Processing,Vol.3,pp.57-60”。
发明内容
本发明的任务是提供一种基于多特征的图像模糊检测方法。该方法首先计算图像的频谱特征和倒谱特征,并将上述两种特征作为图像的模糊特征;之后,选用深度神经网络进行分类,利用已采集的带模糊和清晰两类类别标定的图像训练深度神经网络的相应参数;最终使用训练好的深度神经网络检测待测试图像是否为模糊图像。上述方法最大的优点在于作为一种非参照模糊图像检测方法,不需要参照图像,因此有非常广泛的应用。同时,由于定义的模糊特征有明确的物理意义,因此能够准确地区分清晰和模糊图像。
为了方便地描述本发明内容,首先对一些术语进行定义。
定义1:数字图像。由数组或矩阵表示图像,其光照位置和强度都是离散值。
定义2:傅里叶变换。傅里叶变换是一种分析信号成分的方法。在本专利中用到的二维离散傅里叶变换定义为:
其中f(m,n),m=1,...,M,n=1,...,N为二维时域信号,F(u,v)为其傅里叶变化。傅里叶反变换定义如下:
定义3:倒谱。功率谱对数值的反傅氏变换称为倒谱,又称作功率倒频谱。
定义4:模糊特征。用于区分图像清晰和模糊而定义的图像频谱和倒谱特征。
定义5:下采样。对数据进行等间隔的抽取,使得原有数据的规模变小。
定义6:深度分类网络。即利用栈式自编码器作为深度网络,并在将最后一层隐层节点送入到逻辑回归器中,得到类别概率。
定义8:后向传播算法。是一种监督学习算法,常被用来训练多层神经网络。一般包含两个阶段:(1)前向传播阶段将训练输入送入网络以获得激励响应;(2)反向传播阶段将激励响应同训练输入对应的目标输出求差,从而获得隐层和输出层的响应误差。
定义9:梯度法。梯度下降法是一个最优化算法,为求解函数f(x)取极值时,自变量的取值可以迭代求解,即:
直到梯度值为零,得到解。
按照本发明的一种基于深度学习的模糊图像检测方法,它包含以下步骤:
步骤3:对于每一幅输入数字图像It,It(m,n)表示其中任意一像素点的灰度值,(m,n)为该像素点的坐标位置,进行It与算子(-1)m+n的相乘运算以保证傅里叶变换之后的零频部分位于频谱图像的中心,得到
其中Ft(u,v)表示I′t的二维离散傅里叶变换,u,v为傅里叶变换后的空间坐标,进而得到总体频谱图|Ft|;
步骤5:将频谱图|Ft|做下采样,下采样的比例根据图像大小决定,下采样后频谱图的宽度和高度都不超过50个点,向量化下采样后频谱图得到向量ht;
步骤7:将倒谱图Ct做下采样,下采样的比例根据图像大小决定,下采样后倒谱图的宽度和高度都不超过50个点,向量化下采样倒谱图得到向量st;
其中θ是网络参数,λ是控制约束项强弱的因子,y(xt)为样本xt属于模糊图像的概率
p(yt=+1|xt,θ),对应的表达式为:
表示第L层的第j个单元的响应值,j=1,...,sl,表示第l+1层的第i个单元的输入,和表示连接深度神经网络第l层的所有sl个单元和第l+1层的第i个单元之间的参数;具体来讲,表示连接第l层的第j个单元和第l+1层第i个单元之间的参数,为与第l+1层的隐单元i相关的偏差项,sl+1为第l+1层隐单元的数目,输入层(即第0层)为xt(参见图2);因此网络参数
需要说明的是:
步骤1中选取摄像头采集的图像进行模糊检测分类器训练时,选择某一类图像,比如人脸、固定场景等。另外,选取N1+N2幅图像的目的在于用N1幅图像作训练样本,N2幅图像作测试样本,一般分类器的性能会随着N1的增加而改善。
本发明的创新之处在于:
提出了一种基于频谱和倒谱结合的深度网络分类器,用于检测模糊图像。该方法提出了利用向量化频谱特征和向量化倒谱特征两种特征作为图像的模糊特征,用于模糊检测。对所有图像进行模糊特征分析的基础上,建立深度分类网络模型,模型的输出值为图像属于模糊图像的概率,当该概率值较大时则判断为模糊图像。该方法由于引入了深度网络,有良好的分类效果,同时也是一种无参照的模糊图像检测方法,可以广泛的应用于图像识别领域。
附图说明
图1为清晰和模糊图像,及其频谱和倒谱。其中(a),(b)和(c)分别为清晰图像、离焦模糊以及运动模糊图像,及其三者的频谱和倒谱。
图2为本专利提出的模糊检测的示意图(以包含两个隐层的深度网络为例)。
具体实施方式
根据本发明的方法,首先采集一定数量的清晰和模糊图像,并对图像进行清晰与模糊的标注。根据本发明专利,利用Matlab或者C语言编写基于频谱和倒谱信息融合的图像模糊检测程序,并在采集数据上训练本发明对应的深度分类网络参数;接着在各种需要图像模糊检测的场景安装采集摄像头采集原始图像,提取对应图像的模糊特征,根据之前训练的分类器可以正确区分清晰与模糊图像。本发明的方法,可以用于各类图像的模糊检测。
一种基于深度学习的模糊图像检测方法,它包含以下步骤:
步骤3:对于每一幅输入数字图像It,It(m,n)表示其中任意一像素点的灰度值,(m,n)为该像素点的坐标位置,进行It与算子(-1)m+n的相乘运算以保证傅里叶变换之后的零频部分位于频谱图像的中心,得到
其中Ft(u,v)表示I′t的二维离散傅里叶变换,u,v为傅里叶变换后的空间坐标,进而得到总体频谱图|Ft|;
步骤5:将频谱图|Ft|做下采样,下采样的比例根据图像大小决定,下采样后频谱图的宽度和高度都不超过50个点,向量化下采样后频谱图得到向量ht;
步骤7:将倒谱图Ct做下采样,下采样的比例根据图像大小决定,下采样后倒谱图的宽度和高度都不超过50个点,向量化下采样倒谱图得到向量st;
其中θ是网络参数,λ是控制约束项强弱的因子,y(xt)为样本xt属于模糊图像的概率p(yt=+1|xt,θ),对应的表达式为:
表示第l层的第j个单元的响应值,j=1,...,sl,表示第l+1层的第i个单元的输入,和表示连接深度神经网络第l层的所有sl个单元和第l+1层的第i个单元之间的参数;具体来讲,表示连接第l层的第j个单元和第l+1层第i个单元之间的参数,为与第l+1层的隐单元i相关的偏差项,sl+1为第l+1层隐单元的数目,输入层(即第0层)为xt(参见图2);因此网络参数
Claims (1)
1.一种基于深度学习的模糊图像检测方法,它包含以下步骤:
步骤3:对于每一幅输入数字图像It,It(m,n)表示其中任意一像素点的灰度值,(m,n)为该像素点的坐标位置,进行It与算子(-1)m+n的相乘运算以保证傅里叶变换之后的零频部分位于频谱图像的中心,得到
其中Ft(u,v)表示I′t的二维离散傅里叶变换,u,v为傅里叶变换后的空间坐标,进而得到总体频谱图|Ft|;
步骤5:将频谱图|Ft|做下采样,下采样的比例根据图像大小决定,下采样后频谱图的宽度和高度都不超过50个点,向量化下采样后频谱图得到向量ht;
步骤7:将倒谱图Ct做下采样,下采样的比例根据图像大小决定,下采样后倒谱图的宽度和高度都不超过50个点,向量化下采样倒谱图得到向量st;
其中θ是网络参数,λ是控制约束项强弱的因子,y(xt)为样本xt属于模糊图像的概率p(yt=+1|xt,θ),对应的表达式为:
表示第l层的第j个单元的响应值,j=1,...,sl,表示第l+1层的第i个单元的输入,表示连接深度神经网络第l层的所有sl个单元和第l+1层的第i个单元之间的参数;表示连接第l层的第j个单元和第l+1层第i个单元之间的参数,为与第l层的隐单元i相关的偏差项,sl+1为第l+1层隐单元的数目,输入层为xt;因此网络参数
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611181327.9A CN106682604B (zh) | 2016-12-20 | 2016-12-20 | 一种基于深度学习的模糊图像检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611181327.9A CN106682604B (zh) | 2016-12-20 | 2016-12-20 | 一种基于深度学习的模糊图像检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106682604A CN106682604A (zh) | 2017-05-17 |
CN106682604B true CN106682604B (zh) | 2020-08-11 |
Family
ID=58869756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611181327.9A Active CN106682604B (zh) | 2016-12-20 | 2016-12-20 | 一种基于深度学习的模糊图像检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106682604B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108921178B (zh) * | 2018-06-22 | 2022-05-06 | 北京小米移动软件有限公司 | 获取图像模糊程度分类的方法、装置、电子设备 |
CN113326720A (zh) * | 2020-02-29 | 2021-08-31 | 湖南超能机器人技术有限公司 | 基于轮廓深度学习的图像模糊检测方法、设备 |
CN111460939A (zh) * | 2020-03-20 | 2020-07-28 | 深圳市优必选科技股份有限公司 | 一种去模糊的人脸识别方法、系统和一种巡检机器人 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101359398B (zh) * | 2008-06-16 | 2011-04-13 | 北京航空航天大学 | 运动模糊图像的盲恢复方法 |
JP2011134204A (ja) * | 2009-12-25 | 2011-07-07 | Sony Corp | 画像処理装置、画像処理方法、及びプログラム |
US8311973B1 (en) * | 2011-09-24 | 2012-11-13 | Zadeh Lotfi A | Methods and systems for applications for Z-numbers |
CN104282028A (zh) * | 2014-10-30 | 2015-01-14 | 电子科技大学 | 一种频谱和倒谱信息融合的模糊图像检测方法 |
-
2016
- 2016-12-20 CN CN201611181327.9A patent/CN106682604B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN106682604A (zh) | 2017-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107133948B (zh) | 基于多任务卷积神经网络的图像模糊与噪声评测方法 | |
CN110348319B (zh) | 一种基于人脸深度信息和边缘图像融合的人脸防伪方法 | |
CN111325713A (zh) | 基于神经网络的木材缺陷检测方法、系统及存储介质 | |
CN110879982B (zh) | 一种人群计数系统及方法 | |
CN111160249A (zh) | 基于跨尺度特征融合的光学遥感图像多类目标检测方法 | |
KR102122068B1 (ko) | 이미지 분석 시스템 및 분석 방법 | |
CN104751186A (zh) | 一种基于bp网络和小波变换的虹膜图像质量分类方法 | |
CN110633711B (zh) | 训练特征点检测器的计算机装置、方法及特征点检测方法 | |
CN106682604B (zh) | 一种基于深度学习的模糊图像检测方法 | |
CN111524132A (zh) | 识别待检测样本中异常细胞的方法、装置和存储介质 | |
CN116012291A (zh) | 工业零件图像缺陷检测方法及系统、电子设备和存储介质 | |
CN114445356A (zh) | 基于多分辨率的全视野病理切片图像肿瘤快速定位方法 | |
CN116071315A (zh) | 一种基于机器视觉的产品可视缺陷检测方法及系统 | |
CN116740652B (zh) | 一种基于神经网络模型的锈斑面积扩大的监测方法与系统 | |
CN114596244A (zh) | 基于视觉处理和多特征融合的红外图像识别方法及系统 | |
CN106709516B (zh) | 一种基于朴素贝叶斯方法的模糊图像检测方法 | |
CN115131503A (zh) | 一种虹膜三维识别的健康监测方法及其系统 | |
CN111127485B (zh) | 一种ct图像中目标区域提取方法、装置及设备 | |
CN114529852A (zh) | 一种基于视频数据的遗留物检测分析方法 | |
CN117689880B (zh) | 基于机器学习用于生物医学图像中目标识别的方法及系统 | |
CN111291624B (zh) | 一种挖掘机目标识别方法及系统 | |
CN117474916B (zh) | 一种图像检测方法、电子设备及存储介质 | |
Hsu et al. | An Improved Visual Recognition Model of Interference Noise Image | |
CN114743064A (zh) | 一种无监督域自适应目标检测方法和装置 | |
CN116993698A (zh) | 织物瑕疵检测方法、装置、终端设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |