CN109671061B - 一种图像分析方法、装置、计算设备及存储介质 - Google Patents
一种图像分析方法、装置、计算设备及存储介质 Download PDFInfo
- Publication number
- CN109671061B CN109671061B CN201811500056.8A CN201811500056A CN109671061B CN 109671061 B CN109671061 B CN 109671061B CN 201811500056 A CN201811500056 A CN 201811500056A CN 109671061 B CN109671061 B CN 109671061B
- Authority
- CN
- China
- Prior art keywords
- image
- distribution
- neural network
- convolutional neural
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003703 image analysis method Methods 0.000 title claims abstract description 16
- 238000003860 storage Methods 0.000 title claims description 18
- 238000009826 distribution Methods 0.000 claims abstract description 101
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 55
- 238000006073 displacement reaction Methods 0.000 claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 239000011159 matrix material Substances 0.000 claims abstract description 14
- 238000010191 image analysis Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 45
- 238000000034 method Methods 0.000 claims description 34
- 238000012549 training Methods 0.000 claims description 25
- 238000010586 diagram Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000005457 optimization Methods 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 11
- 230000003044 adaptive effect Effects 0.000 claims description 7
- 238000011176 pooling Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 description 17
- 238000001514 detection method Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 230000007723 transport mechanism Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种图像分析方法,该方法包括:对于每张图像,基于随机抖动分布生成预定数量的抖动图像,随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵;将抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,预测抖动分布为预测的抖动图像的像素分布矩阵;基于随机抖动分布和预测抖动分布,计算损失函数;基于损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络。该方案在提高模糊或抖动图像分析的精确度的同时,可以生成局部的抖动方向信息,以便用于后续去模糊算法的精确应用。
Description
技术领域
本发明涉及图像模糊检测技术领域,尤其涉及一种图像分析方法、装置计算设备及存储介质。
背景技术
在图像获取过程中因为诸多因素会产生抖动模糊的图像。产生图像模糊的原因很多,主要包括相机机身的抖动、机械或电子快门释放期间拍摄目标的运动、镜头失焦等原因。尽管光学图像防抖、数字图像防抖技术被引入,捕捉到抖动模糊的图像仍然是不可避免的。对于已经被采集的抖动模糊图像的分析、识别在数字图像优化和处理当中是十分重要的工作。
模糊图像识别算法包括小波分析、边缘强度分析、多尺度聚合和梯度强度分类转换系数模糊识别等。但上述算法多仅限于判断是否模糊和模糊区域,而且精确度欠佳。这使得很多情况下模糊识别还是会失效或误判。如果图像获取设备是在浅景深像场下获取的图片,在焦外的图像也时常引起误判,且利用算法产生的失焦效果也会导致误判。
因此,需要一种图像分析方法,能够提高模糊图像检测的精确度。
发明内容
为此,本发明提供了一种图像分析方法、装置、计算设备及存储介质,以力图解决或者至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种图像分析方法,可以预先采集大量用于训练卷积神经网络的高清图像,首先,对于每张各种场景下的高清图像,可以基于随机抖动分布生成预定数量的抖动图像,其中随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵。然后,可以将生成的抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,其中预测抖动分布为预测的抖动图像的像素分布矩阵。随后,可以基于预先生成的随机抖动分布和网络输出的预测抖动分布,计算卷积神经网络的损失函数.最后,可以基于损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络。
可选地,在上述方法中,可以将待分析图像输入优化后的卷积神经网络,输出待分析图像的抖动分布。
可选地,在上述方法中,随机抖动分布可以通过以下函数生成:
可选地,在上述方法中,卷积神经网络可以为全卷积网络,全卷积网络可以包括多个卷积层、池化层、反卷积层。
可选地,在上述方法中,可以使用反卷积层对卷积层的特征图进行上采样,使所述特征图恢复到输入的抖动图像的尺寸。然后,在上采样后的特征图上进行逐像素分类,输出抖动图像的预测抖动分布。
可选地,在上述方法中,可以基于随机抖动分布与预测抖动分布中每个对应的像素点之间的欧几里得距离,计算平方损失函数。
可选地,在上述方法中,可以使用自适应矩估计法训练优化所述卷积神经网络。
可选地,在上述方法中,可以基于损失函数,计算卷积神经网络中每个参数的梯度的一阶矩估计和二阶矩估计。然后,可以基于计算出的一阶矩估计和二阶矩估计,调整每个参数的学习率。
根据本发明另一个方面,提供了一种图像分析装置,该装置可以包括生成模块、训练模块、计算模块和优化模块。对于每张图像,生成模块可以基于随机抖动分布生成预定数量的抖动图像,随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵。训练模块可以将抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,预测抖动分布为预测的抖动图像的像素分布矩阵。计算模块可以基于随机抖动分布和预测抖动分布,计算损失函数。优化模块可以基于损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络。
可选地,在上述装置中,还可以包括分析模块,分析模块可以将待分析图像输入优化后的卷积神经网络,输出待分析图像的抖动分布。
可选地,在上述装置中,卷积神经网络可以为全卷积网络,全卷积网络包括若干数量的卷积层、池化层、反卷积层。训练模块可以包括采样单元和分类单元。其中,采样单元可以使用反卷积层对卷积层的特征图进行上采样,使特征图恢复到输入的抖动图像的尺寸。分类单元可以在上采样后的特征图上进行逐像素分类,输出抖动图像的预测抖动分布。
可选地,在上述装置中,计算模块可以包括第一计算单元,第一计算单元可以基于随机抖动分布与预测抖动分布中每个对应的像素点之间的欧几里得距离,计算平方损失函数。
可选地,在上述装置中,优化模块可以包括第二计算单元和调整单元。其中,第二计算单元可以基于损失函数,计算卷积神经网络中每个参数的梯度的一阶矩估计和二阶矩估计。调整单元可以基于一阶矩估计和二阶矩估计,调整每个参数的学习率,以得到优化后的卷积神经网络。
根据本发明另一个方面,提供了一种计算设备,包括一个或多个处理器、存储器、一个或多个程序。其中一个或多个程序可以存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行图像分析方法的指令。
根据本发明另一个方面,提供一种存储一个或多个程序的计算机可读存储介质,这一个或多个程序包括指令,当指令被计算设备执行时,使得计算设备执行图像分析方法。
通过上述方案,可以提高模糊或抖动图像分析的准确性和精确度。在提高检测精度的同时,可以生成局部的抖动方向信息,以便用于后续去模糊算法的精确应用。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明的一个实施例的计算设备100的构造示意图;
图2示出了根据本发明的一个实施例的图像分析方法的示意性流程图;
图3示出了根据本发明的一个实施例的生成随机抖动分布的示意图;
图4示出了根据本发明的一个实施例的高清图像生成抖动图像的示意图;
图5示出了根据本发明的一个实施例的卷积神经网络训练过程的示意图;
图6示出了根据本发明的一个实施例的待分析图像的抖动分布的示意图;
图7示出了根据本发明的一个实施例的图像分析装置700的示意性结构框图;
图8示出了根据本发明的一个实施例的图像分析装置700的示意性结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
目前图像模糊检测的方法主要基于对边缘清晰度的分析和对不同方向梯度信息的统计分析。这些方法只能检测模糊区域,并不能对图像进行像素级评价。深度学习是一类多层神经网络学习算法,将深度卷积神经网络应用于图像模糊检测,能够充分挖掘图像的像素级特征,进行提高图像模糊检测的精确度和效率。本方案提供一种图像分析方法,能够对模糊图像进行像素级抖动分析。
图1示出了根据本发明的一个实施例的计算设备100的构造示意图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个程序122以及程序数据124。在一些实施方式中,程序122可以布置为在操作系统上利用程序数据124进行操作。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
计算设备100还包括总线/接口控制器130、储存设备132和储存接口总线134,其中储存设备132包含可移除储存器136和不可移除储存器138。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备100也可以是小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备100可被配置为执行本发明的图像分析方法。其中,计算设备100的一个或多个程序122包括用于执行根据本发明的图像分析方法的指令。
根据本发明的一个实施例,计算设备100可以包括摄像头,可以拍摄大量用于训练模型的各种场景下的高清图。计算设备100也可以从数据库中获取预先存储的各种场景下的高清图。在工程实际中,模型训练通常使用缩略图。由于获取的高清图的尺寸可能不同,为了便于模型训练,可以对获取的高清图进行下采样,以使用相同大小的图像进行模型训练。其中,下采样即缩小图像尺寸,可以使图像符合实际需要的尺寸或生成对应图像的缩略图。例如,对于一幅图像尺寸为M*N,对其进行s倍下采样,即得到(M/s)*(N/s)尺寸的得分辨率图像,s是M和N的公约数,如果考虑的是矩阵形式的图像,就是把原始图像s*s窗口内的图像变成一个像素,这个像素点的值就是窗口内所有像素的均值。
图2示出了根据本发明的一个实施例的图像分析方法的示意性流程图。如图2所示,首先在步骤S210中,可以对于每张图像,基于随机抖动分布生成预定数量的抖动图像,其中随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵。
对于每张下采样处理后的高清图,可以人工随机生成每张高清图像对应的一定数量的抖动图像。图3示出了根据本发明的一个实施例的生成随机抖动分布的示意图。如图3所示,可以以高清图的水平方向为x轴、垂直方向为y轴、深度方向为z轴,建立三维坐标系。随机抖动分布可以通过以下函数生成:
s(i,j)=2d(i,j)tan(ω/2)
其中,分别为图像水平像素点沿z轴方向的旋转和垂直像素点沿z轴方向的旋转,ω为旋转角度,d(i,j)为任一像素点与中心像素点之间的距离,s(i,j)为任一像素点的旋转幅值,θ(i,j)为任一像素点的旋转角度。
图4示出了根据本发明的一个实施例的高清图像生成抖动图像的示意图。如图4所示,可以将随机抖动分布应用于每张高清图,每张高清图生成对应的20组抖动图,可以生成其他任意数量的抖动图,在此不做限定。
在获得大量用于训练神经网络的抖动图像之后,随后在步骤S220中,可以将抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,其中预测抖动分布为预测的抖动图像的像素分布矩阵。
根据本发明的一个实施例,卷积神经网络可以是全卷积网络,全卷积网络包括若干个卷积层、池化层。与经典的CNN在卷积层之后使用全连接层得到固定长度的特征向量进行分类(全联接层+softmax输出)不同,全卷积网络可以接受任意尺寸的输入图像,采用反卷积层对卷积层的特征图进行上采样,使它恢复到输入图像相同的尺寸,从而可以对每个像素都产生了一个预测,同时保留了原始输入图像中的空间信息,最后在上采样的特征图上进行逐像素分类。图5示出了根据本发明的一个实施例的全卷积网络训练过程的示意图。如图5所示,经过多层卷积conv、池化pool,特征图的数量依次是86、86、256、256、512、512,k为卷积核的大小。对原图进行卷积conv1、pool1后图像缩小为1/2;对图像进行第二次卷积conv2、pool2后图像缩小为1/4,此时可以保留pool2的特征图;对图像进行第三次卷积conv3、pool3后图像缩小为1/8,此时保留pool3的特征图。根据本发明的一个实施例,可以使用反卷积层对卷积层的特征图进行上采样,使特征图恢复到输入的抖动图像的尺寸。然后在上采样后的特征图上进行逐像素分类,输出抖动图像的预测抖动分布。例如,可以使用skip跳转结构(图5中长箭头所示)使用concat操作(图5中所示加号)融合两个层deconv1、deconv2、deconv3进行反卷积,对特征图进行上采样,使输出图像的尺寸与输入图像尺寸相同。最后可以使用softmax归一化函数对网络模型最后输出的像素进行分类。需要说明的是,图5所示的卷积神经网络模型仅仅是示例性的,可以采用其他适当数量的卷积层、池化层和反卷积层调整网络模型的结构。
随后在步骤S230中,可以基于随机抖动分布和预测抖动分布,计算损失函数。其中,损失函数可以用来估量模型预测值与真实值的不一致程度,如果损失函数比较大,那么说明神经网络性能并不是很好,需要使损失函数尽可能的小。损失函数越小,模型的鲁棒性就越好。根据本发明的一个实施例,可以基于随机抖动分布与预测抖动分布中每个对应的像素点之间的欧几里得距离,计算平方损失函数。平方损失函数主要是最小二乘法计算人工生成的随机抖动分布与模型输出的预测抖动分布中对应像素点之间的距离的平方差。最小二乘法最优拟合曲线应该使得所有点到回归直线的距离和最小。还可以使用交叉熵损失函数等评估当前训练得到的预测像素分布与真实分布的差异情况。
最后在步骤S240中,可以基于损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络。其中,调整参数是通过改善训练方式,来最小化损失函数。对于损失函数的优化算法可以基于梯度的,也可以不是基于梯度的,因为它们既可以使用函数提供的信息,还可以使用函数梯度提供的信息。为了确保损失函数的损失值降低,可以使用超参数(学习率)来控制一次能够改变多大。可以使用梯度下降法、随机梯度下降法、自适应算法等优化卷积神经网络。根据本发明的一个实施例,可以使用自适应矩估计法训练优化上述卷积神经网络。可以首先基于损失函数计算卷积神经网络中每个参数的梯度的一阶矩估计和二阶矩估计,然后,基于参数梯度的一阶矩估计和二阶矩估计,调整每个参数的学习率。
其中,Adam自适应矩估计优化算法是随机梯度下降算法的扩展式,能基于训练数据迭代地更新神经网络权重。由于随机梯度下降保持单一的学习率更新所有的权重,学习率在训练过程中并不会改变。而Adam通过计算梯度的一阶矩估计和二阶矩估计而为不同的参数设计独立的自适应性学习率。Adam算法根据损失函数对每个参数的梯度的一阶矩估计和二阶矩估计动态调整针对于每个参数的学习速率。每次迭代参数的学习步长都有一个确定的范围,不会因为很大的梯度导致很大的学习步长,参数的值比较稳定。
完成卷积神经网络的训练优化后,可以将待分析图像输入优化后的卷积神经网络,输出待分析图像的抖动分布。图6示出了根据本发明的一个实施例的生成预测抖动分布的示意图。从图6可以看出,利用上述图像分析方法能够输出图像得像素级抖动分布,且对双摄生成的虚化图片不会误检,图6中的最后一图ofo小黄车的图像就是虚化,但没有被误检。能够生成局部的像素级抖动结果,可以精确地用于后续去模糊算法。
图7示出了根据本发明的一个实施例的图像分析装置700的示意性结构框图。该图像分析装置700可以驻留在计算设备100中,如图7所示,装置700可以包括生成模块710、训练模块720、计算模块730和优化模块740。对于每张图像,生成模块710可以基于随机抖动分布生成预定数量的抖动图像,随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵。训练模块720可以将抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,预测抖动分布为预测的抖动图像的像素分布矩阵。计算模块730可以基于随机抖动分布和预测抖动分布,计算损失函数。优化模块740可以基于损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络。
图8示出了根据本发明的一个实施例的图像分析装置700的示意性结构框图。如图8所示,装置700还可以包括分析模块750,在完成网络模型的训练优化后,分析模块750可以将待分析图像输入优化后的卷积神经网络,输出待分析图像的抖动分布。
根据本发明的一个实施例,如图8所示,训练模块720可以包括采样单元721和分类单元722。其中,采样单元721可以使用反卷积层对卷积层的特征图进行上采样,使特征图恢复到输入的抖动图像的尺寸。分类单元722可以在上采样后的特征图上进行逐像素分类,输出抖动图像的预测抖动分布。
计算模块730可以包括第一计算单元731,第一计算单元731可以基于随机抖动分布与预测抖动分布中每个对应的像素点之间的欧几里得距离,计算平方损失函数。优化模块740可以包括第二计算单元741和调整单元742。其中,第二计算单元741可以基于损失函数,计算卷积神经网络中每个参数的梯度的一阶矩估计和二阶矩估计。调整单元742可以基于第二计算单元计算的一阶矩估计和二阶矩估计,调整每个参数的学习率。
根据本发明的方案,大大提高了图像模糊检测的精确度,与其他基于深度学习的图像模糊检测方法相比,检出率高,能够生成局部的像素级抖动信息,以便用于后续去模糊算法的精确应用。
应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明所述的方法。
以示例而非限制的方式,计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
Claims (9)
1.一种图像分析方法,适于在计算设备中执行,其中,所述计算设备预先存储多张用于训练卷积神经网络的图像,所述方法包括:
对于每张图像,基于随机抖动分布生成预定数量的抖动图像,所述随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵;
将所述抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,所述预测抖动分布为预测的抖动图像的像素分布矩阵,其中,所述卷积神经网络为全卷积网络,所述全卷积网络包括若干数量的卷积层、池化层和反卷积层;
基于所述随机抖动分布和预测抖动分布,计算损失函数;以及
基于所述损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络;
将待分析图像输入优化后的卷积神经网络,输出待分析图像的抖动分布,以便根据抖动分布对待分析图像进行去模糊算法,所述抖动分布为像素级抖动分布;
其中,所述随机抖动分布通过以下函数生成:
其中,所述将所述抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布的步骤包括:
使用反卷积层对卷积层的特征图进行上采样,使所述特征图恢复到输入的抖动图像的尺寸;
在上采样后的特征图上进行逐像素分类,输出抖动图像的预测抖动分布,所述预测抖动分布包括每个像素点的抖动预测。
2.如权利要求1所述的方法,其中,所述基于所述随机抖动分布和预测抖动分布,计算所述卷积神经网络的损失函数的步骤包括:
基于随机抖动分布与预测抖动分布中每个对应的像素点之间的欧几里得距离,计算平方损失函数。
3.如权利要求2所述的方法,其中,所述基于所述损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络的步骤包括:
使用自适应矩估计法训练优化所述卷积神经网络。
4.如权利要求3所述的方法,其中,所述使用自适应矩估计法训练优化所述卷积神经网络的步骤包括:
基于所述损失函数,计算卷积神经网络中每个参数的梯度的一阶矩估计和二阶矩估计;
基于所述一阶矩估计和二阶矩估计,调整每个参数的学习率。
5.一种图像分析装置,其中,所述装置包括:
生成模块,适于对于每张图像,基于随机抖动分布生成预定数量的抖动图像,所述随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵;
训练模块,适于将所述抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,所述预测抖动分布为预测的抖动图像的像素分布矩阵,其中,所述卷积神经网络为全卷积网络,所述全卷积网络包括若干数量的卷积层、池化层、反卷积层;
计算模块,适于基于所述随机抖动分布和预测抖动分布,计算损失函数;
优化模块,基于所述损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络;
分析模块,适于将待分析图像输入优化后的卷积神经网络,输出待分析图像的抖动分布,以便根据抖动分布对待分析图像进行去模糊算法,所述抖动分布为像素级抖动分布,其中,所述随机抖动分布通过以下函数生成:
其中,所述训练模块包括:
采样单元,适于使用反卷积层对卷积层的特征图进行上采样,使所述特征图恢复到输入的抖动图像的尺寸;
分类单元,适于在上采样后的特征图上进行逐像素分类,输出抖动图像的预测抖动分布,所述预测抖动分布包括每个像素点的抖动预测。
6.如权利要求5所述的装置,其中,所述计算模块包括:
第一计算单元,适于基于随机抖动分布与预测抖动分布中每个对应的像素点之间的欧几里得距离,计算平方损失函数。
7.如权利要求6所述的装置,其中,所述优化模块包括:
第二计算单元,适于基于所述损失函数,计算卷积神经网络中每个参数的梯度的一阶矩估计和二阶矩估计;
调整单元,适于基于所述一阶矩估计和二阶矩估计,调整每个参数的学习率。
8.一种计算设备,包括:
存储器;
一个或多个处理器;
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-4所述方法中的任一方法的指令。
9.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当计算设备执行时,使得所述计算设备执行根据权利要求1-4所述的方法中的任一方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811500056.8A CN109671061B (zh) | 2018-12-07 | 2018-12-07 | 一种图像分析方法、装置、计算设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811500056.8A CN109671061B (zh) | 2018-12-07 | 2018-12-07 | 一种图像分析方法、装置、计算设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109671061A CN109671061A (zh) | 2019-04-23 |
CN109671061B true CN109671061B (zh) | 2021-05-04 |
Family
ID=66144205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811500056.8A Active CN109671061B (zh) | 2018-12-07 | 2018-12-07 | 一种图像分析方法、装置、计算设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109671061B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110728661A (zh) * | 2019-09-18 | 2020-01-24 | 清华大学 | 基于随机生成样本的图像畸变评价网络训练方法及装置 |
CN113310987B (zh) * | 2020-02-26 | 2023-04-11 | 保定市天河电子技术有限公司 | 一种隧道衬砌表面检测系统及方法 |
CN111901532B (zh) * | 2020-09-30 | 2020-12-25 | 南京理工大学 | 基于循环神经网络迭代策略的视频稳定方法 |
CN113347352B (zh) * | 2021-05-21 | 2023-10-03 | Oppo广东移动通信有限公司 | 拍摄参数调整方法及装置、电子设备、计算机存储介质 |
CN113693561B (zh) * | 2021-08-26 | 2023-08-25 | 深圳平安智慧医健科技有限公司 | 基于神经网络的帕金森病预测设备、装置和存储介质 |
CN114168891A (zh) * | 2021-11-29 | 2022-03-11 | 昆山丘钛光电科技有限公司 | 震动图像数值化的方法、装置、终端设备及介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103839233B (zh) * | 2014-01-20 | 2017-05-10 | 左旺孟 | 一种相机抖动造成的模糊图像复原方法 |
CN106952239A (zh) * | 2017-03-28 | 2017-07-14 | 厦门幻世网络科技有限公司 | 图像生成方法和装置 |
CN107464261B (zh) * | 2017-07-07 | 2020-10-23 | 广州市百果园网络科技有限公司 | 一种图像数据标定训练方法及其设备、存储介质、服务器 |
CN108010031B (zh) * | 2017-12-15 | 2020-12-04 | 厦门美图之家科技有限公司 | 一种人像分割方法及移动终端 |
-
2018
- 2018-12-07 CN CN201811500056.8A patent/CN109671061B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109671061A (zh) | 2019-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109671061B (zh) | 一种图像分析方法、装置、计算设备及存储介质 | |
CN108154526B (zh) | 突发模式图像的图像对准 | |
CN109118542B (zh) | 激光雷达与相机之间的标定方法、装置、设备及存储介质 | |
US9692939B2 (en) | Device, system, and method of blind deblurring and blind super-resolution utilizing internal patch recurrence | |
CN110047069B (zh) | 一种图像检测装置 | |
US9076205B2 (en) | Edge direction and curve based image de-blurring | |
CN107454284B (zh) | 一种视频去噪方法及计算设备 | |
CN109753971B (zh) | 扭曲文字行的矫正方法及装置、字符识别方法及装置 | |
WO2016054779A1 (en) | Spatial pyramid pooling networks for image processing | |
CN105976328B (zh) | 图像噪声降低 | |
US20140247470A1 (en) | Camera-based document imaging | |
CN105976327B (zh) | 对第一图像进行变换的方法、处理模块和存储介质 | |
CN109919971B (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN110427946B (zh) | 一种文档图像二值化方法、装置和计算设备 | |
CN110276289B (zh) | 生成匹配模型的方法和人脸特征点追踪方法 | |
US9542732B2 (en) | Efficient image transformation | |
EP3101623B1 (en) | Homography rectification | |
JP2005269419A (ja) | 画像変形推定方法および画像変形推定装置 | |
CN111105452A (zh) | 基于双目视觉的高低分辨率融合立体匹配方法 | |
CN112084886B (zh) | 提升检测神经网络目标检测性能的方法及装置 | |
CN112418243A (zh) | 特征提取方法、装置及电子设备 | |
JP6121302B2 (ja) | 姿勢パラメータ推定装置、姿勢パラメータ推定システム、姿勢パラメータ推定方法、およびプログラム | |
WO2013089261A1 (ja) | 画像処理システム及び画像処理方法 | |
CN110288560A (zh) | 一种图像模糊检测方法及装置 | |
CN118735787A (zh) | 图像旋转 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |