CN109671061A - 一种图像分析方法、装置、计算设备及存储介质 - Google Patents

一种图像分析方法、装置、计算设备及存储介质 Download PDF

Info

Publication number
CN109671061A
CN109671061A CN201811500056.8A CN201811500056A CN109671061A CN 109671061 A CN109671061 A CN 109671061A CN 201811500056 A CN201811500056 A CN 201811500056A CN 109671061 A CN109671061 A CN 109671061A
Authority
CN
China
Prior art keywords
image
jitter
convolutional neural
neural networks
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811500056.8A
Other languages
English (en)
Other versions
CN109671061B (zh
Inventor
刘键涛
周凡
张长定
叶志鸿
张伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Creative Technology Ltd Shenzhen
Original Assignee
Creative Technology Ltd Shenzhen
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Creative Technology Ltd Shenzhen filed Critical Creative Technology Ltd Shenzhen
Priority to CN201811500056.8A priority Critical patent/CN109671061B/zh
Publication of CN109671061A publication Critical patent/CN109671061A/zh
Application granted granted Critical
Publication of CN109671061B publication Critical patent/CN109671061B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Abstract

本发明公开了一种图像分析方法,该方法包括:对于每张图像,基于随机抖动分布生成预定数量的抖动图像,随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵;将抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,预测抖动分布为预测的抖动图像的像素分布矩阵;基于随机抖动分布和预测抖动分布,计算损失函数;基于损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络。该方案在提高模糊或抖动图像分析的精确度的同时,可以生成局部的抖动方向信息,以便用于后续去模糊算法的精确应用。

Description

一种图像分析方法、装置、计算设备及存储介质
技术领域
本发明涉及图像模糊检测技术领域,尤其涉及一种图像分析方法、装置计算设备及存储介质。
背景技术
在图像获取过程中因为诸多因素会产生抖动模糊的图像。产生图像模糊的原因很多,主要包括相机机身的抖动、机械或电子快门释放期间拍摄目标的运动、镜头失焦等原因。尽管光学图像防抖、数字图像防抖动技术被引入,捕捉到抖动模糊的图像仍然是不可避免的。对于已经被采集的抖动模糊图像的分析、识别在数字图像优化和处理当中是十分重要的工作。
模糊图像识别算法包括小波分析、边缘强度分析、多尺度聚合和梯度强度分类转换系数模糊识别等。但上述算法多仅限于判断是否模糊和模糊区域,而且精确度欠佳。这使得很多情况下模糊识别还是会失效或误判。如果图像获取设备是在浅景深像场下获取的图片,在焦外的图像也时常引起误判,且利用算法产生的失焦效果也会导致误判。
因此,需要一种图像分析方法,能够提高模糊图像检测的精确度。
发明内容
为此,本发明提供了一种图像分析方法、装置、计算设备及存储介质,以力图解决或者至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种图像分析方法,可以预先采集大量用于训练卷积神经网络的高清图像,首先,对于每张各种场景下的高清图像,可以基于随机抖动分布生成预定数量的抖动图像,其中随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵。然后,可以将生成的抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,其中预测抖动分布为预测的抖动图像的像素分布矩阵。随后,可以基于预先生成的随机抖动分布和网络输出的预测抖动分布,计算卷积神经网络的损失函数.最后,可以基于损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络。
可选地,在上述方法中,可以将待分析图像输入优化后的卷积神经网络,输出待分析图像的抖动分布。
可选地,在上述方法中,随机抖动分布可以通过以下函数生成:
其中,分别为像素点沿图像三维坐标系中x轴、y轴、z轴方向的位移量,为图像绕z轴的旋转角度。
可选地,在上述方法中,卷积神经网络可以为全卷积网络,全卷积网络可以包括多个卷积层、池化层、反卷积层。
可选地,在上述方法中,可以使用反卷积层对卷积层的特征图进行上采样,使所述特征图恢复到输入的抖动图像的尺寸。然后,在上采样后的特征图上进行逐像素分类,输出抖动图像的预测抖动分布。
可选地,在上述方法中,可以基于随机抖动分布与预测抖动分布中每个对应的像素点之间的欧几里得距离,计算平方损失函数。
可选地,在上述方法中,可以使用自适应矩估计法训练优化所述卷积神经网络。
可选地,在上述方法中,可以基于损失函数,计算卷积神经网络中每个参数的梯度的一阶矩估计和二阶矩估计。然后,可以基于计算出的一阶矩估计和二阶矩估计,调整每个参数的学习率。
根据本发明另一个方面,提供了一种图像分析装置,该装置可以包括生成模块、训练模块、计算模块和优化模块。对于每张图像,生成模块可以基于随机抖动分布生成预定数量的抖动图像,随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵。训练模块可以将抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,预测抖动分布为预测的抖动图像的像素分布矩阵。计算模块可以基于随机抖动分布和预测抖动分布,计算损失函数。优化模块可以基于损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络。
可选地,在上述装置中,还可以包括分析模块,分析模块可以将待分析图像输入优化后的卷积神经网络,输出待分析图像的抖动分布。
可选地,在上述装置中,卷积神经网络可以为全卷积网络,全卷积网络包括若干数量的卷积层、池化层、反卷积层。训练模块可以包括采样单元和分类单元。其中,采样单元可以使用反卷积层对卷积层的特征图进行上采样,使特征图恢复到输入的抖动图像的尺寸。分类单元可以在上采样后的特征图上进行逐像素分类,输出抖动图像的预测抖动分布。
可选地,在上述装置中,计算模块可以包括第一计算单元,第一计算单元可以基于随机抖动分布与预测抖动分布中每个对应的像素点之间的欧几里得距离,计算平方损失函数。
可选地,在上述装置中,优化模块可以包括第二计算单元和调整单元。其中,第二计算单元可以基于损失函数,计算卷积神经网络中每个参数的梯度的一阶矩估计和二阶矩估计。调整单元可以基于一阶矩估计和二阶矩估计,调整每个参数的学习率,以得到优化后的卷积神经网络。
根据本发明另一个方面,提供了一种计算设备,包括一个或多个处理器、存储器、一个或多个程序。其中一个或多个程序可以存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行图像分析方法的指令。
根据本发明另一个方面,提供一种存储一个或多个程序的计算机可读存储介质,这一个或多个程序包括指令,当指令被计算设备执行时,使得计算设备执行图像分析方法。
通过上述方案,可以提高模糊或抖动图像分析的准确性和精确度。在提高检测精度的同时,可以生成局部的抖动方向信息,以便用于后续去模糊算法的精确应用。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明的一个实施例的计算设备100的构造示意图;
图2示出了根据本发明的一个实施例的图像分析方法的示意性流程图;
图3示出了根据本发明的一个实施例的生成随机抖动分布的示意图;
图4示出了根据本发明的一个实施例的高清图像生成抖动图像的示意图;
图5示出了根据本发明的一个实施例的卷积神经网络训练过程的示意图;
图6示出了根据本发明的一个实施例的待分析图像的抖动分布的示意图;
图7示出了根据本发明的一个实施例的图像分析装置700的示意性结构框图;
图8示出了根据本发明的一个实施例的图像分析装置700的示意性结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
目前图像模糊检测的方法主要基于对边缘清晰度的分析和对不同方向梯度信息的统计分析。这些方法只能检测模糊区域,并不能对图像进行像素级评价。深度学习是一类多层神经网络学习算法,将深度卷积神经网络应用于图像模糊检测,能够充分挖掘图像的像素级特征,进行提高图像模糊检测的精确度和效率。本方案提供一种图像分析方法,能够对模糊图像进行像素级抖动分析。
图1示出了根据本发明的一个实施例的计算设备100的构造示意图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个程序122以及程序数据124。在一些实施方式中,程序122可以布置为在操作系统上利用程序数据124进行操作。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备100也可以是小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备100可被配置为执行本发明的图像分析方法。其中,计算设备100的一个或多个程序122包括用于执行根据本发明的图像分析方法的指令。
根据本发明的一个实施例,计算设备100可以包括摄像头,可以拍摄大量用于训练模型的各种场景下的高清图。计算设备100也可以从数据库中获取预先存储的各种场景下的高清图。在工程实际中,模型训练通常使用缩略图。由于获取的高清图的尺寸可能不同,为了便于模型训练,可以对获取的高清图进行下采样,以使用相同大小的图像进行模型训练。其中,下采样即缩小图像尺寸,可以使图像符合实际需要的尺寸或生成对应图像的缩略图。例如,对于一幅图像尺寸为M*N,对其进行s倍下采样,即得到(M/s)*(N/s)尺寸的得分辨率图像,s是M和N的公约数,如果考虑的是矩阵形式的图像,就是把原始图像s*s窗口内的图像变成一个像素,这个像素点的值就是窗口内所有像素的均值。
图2示出了根据本发明的一个实施例的图像分析方法的示意性流程图。如图2所示,首先在步骤S210中,可以对于每张图像,基于随机抖动分布生成预定数量的抖动图像,其中随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵。
对于每张下采样处理后的高清图,可以人工随机生成每张高清图像对应的一定数量的抖动图像。图3示出了根据本发明的一个实施例的生成随机抖动分布的示意图。如图3所示,可以以高清图的水平方向为x轴、垂直方向为y轴、深度方向为z轴,建立三维坐标系。随机抖动分布可以通过以下函数生成:
其中,分别为像素点沿图像三维坐标系中x轴、y轴、z轴方向的位移,为图像绕z轴的旋转。可以设高清图沿x轴方向位移的中心像素点为则图像沿x轴方向的位移为:
其中,分别为图像水平像素点沿x轴方向的位移和垂直像素点沿x轴方向的位移,为像素点沿x轴位移的加速系数,为像素点沿x轴位移的基础位移量。设高清图沿y轴方向位移的中心像素点为则图像沿y轴方向位移量为:
其中,分别为图像水平像素点沿y轴方向的位移和垂直像素点沿y轴方向的位移,为像素点沿y轴位移的加速系数,为像素点沿y轴位移的基础位移量。高清图沿z轴方向的位移为:
其中,分别为像素点沿z轴方向的水平径向位移和垂直径向位移,d(i,j)为任一像素点与中心像素点之间的距离,ζ为预定系数,为任一像素点沿z轴位移的基础位移量。高清图沿z轴旋转的抖动分布为:
s(i,j)=2d(i,j)tan(ω/2)
其中,分别为图像水平像素点沿z轴方向的旋转和垂直像素点沿z轴方向的旋转,ω为旋转角度,d(i,j)为任一像素点与中心像素点之间的距离,s(i,j)为任一像素点的旋转幅值,θ(i,j)为任一像素点的旋转角度。
图4示出了根据本发明的一个实施例的高清图像生成抖动图像的示意图。如图4所示,可以将随机抖动分布应用于每张高清图,每张高清图生成对应的20组抖动图,可以生成其他任意数量的抖动图,在此不做限定。
在获得大量用于训练神经网络的抖动图像之后,随后在步骤S220中,可以将抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,其中预测抖动分布为预测的抖动图像的像素分布矩阵。
根据本发明的一个实施例,卷积神经网络可以是全卷积网络,全卷积网络包括若干个卷积层、池化层。与经典的CNN在卷积层之后使用全连接层得到固定长度的特征向量进行分类(全联接层+softmax输出)不同,全卷积网络可以接受任意尺寸的输入图像,采用反卷积层对卷积层的特征图进行上采样,使它恢复到输入图像相同的尺寸,从而可以对每个像素都产生了一个预测,同时保留了原始输入图像中的空间信息,最后在上采样的特征图上进行逐像素分类。图5示出了根据本发明的一个实施例的全卷积网络训练过程的示意图。如图5所示,经过多层卷积conv、池化poo1,特征图的数量依次是86、86、256、256、512、512,k为卷积核的大小。对原图进行卷积conv1、pool1后图像缩小为1/2;对图像进行第二次卷积conv2、pool2后图像缩小为1/4,此时可以保留pool2的特征图;对图像进行第三次卷积conv3、pool3后图像缩小为1/8,此时保留pool3的特征图。根据本发明的一个实施例,可以使用反卷积层对卷积层的特征图进行上采样,使特征图恢复到输入的抖动图像的尺寸。然后在上采样后的特征图上进行逐像素分类,输出抖动图像的预测抖动分布。例如,可以使用skip跳转结构(图5中长箭头所示)使用concat操作(图5中所示加号)融合两个层deconv1、deconv2、deconv3进行反卷积,对特征图进行上采样,使输出图像的尺寸与输入图像尺寸相同。最后可以使用softmax归一化函数对网络模型最后输出的像素进行分类。需要说明的是,图5所示的卷积神经网络模型仅仅是示例性的,可以采用其他适当数量的卷积层、池化层和反卷积层调整网络模型的结构。
随后在步骤S230中,可以基于随机抖动分布和预测抖动分布,计算损失函数。其中,损失函数可以用来估量模型预测值与真实值的不一致程度,如果损失函数比较大,那么说明神经网络性能并不是很好,需要使损失函数尽可能的小。损失函数越小,模型的鲁棒性就越好。根据本发明的一个实施例,可以基于随机抖动分布与预测抖动分布中每个对应的像素点之间的欧几里得距离,计算平方损失函数。平方损失函数主要是最小二乘法计算人工生成的随机抖动分布与模型输出的预测抖动分布中对应像素点之间的距离的平方差。最小二乘法最优拟合曲线应该使得所有点到回归直线的距离和最小。还可以使用交叉熵损失函数等评估当前训练得到的预测像素分布与真实分布的差异情况。
最后在步骤S240中,可以基于损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络。其中,调整参数是通过改善训练方式,来最小化损失函数。对于损失函数的优化算法可以基于梯度的,也可以不是基于梯度的,因为它们既可以使用函数提供的信息,还可以使用函数梯度提供的信息。为了确保损失函数的损失值降低,可以使用超参数(学习率)来控制一次能够改变多大。可以使用梯度下降法、随机梯度下降法、自适应算法等优化卷积神经网络。根据本发明的一个实施例,可以使用自适应矩估计法训练优化上述卷积神经网络。可以首先基于损失函数计算卷积神经网络中每个参数的梯度的一阶矩估计和二阶矩估计,然后,基于参数梯度的一阶矩估计和二阶矩估计,调整每个参数的学习率。
其中,Adam自适应矩估计优化算法是随机梯度下降算法的扩展式,能基于训练数据迭代地更新神经网络权重。由于随机梯度下降保持单一的学习率更新所有的权重,学习率在训练过程中并不会改变。而Adam通过计算梯度的一阶矩估计和二阶矩估计而为不同的参数设计独立的自适应性学习率。Adam算法根据损失函数对每个参数的梯度的一阶矩估计和二阶矩估计动态调整针对于每个参数的学习速率。每次迭代参数的学习步长都有一个确定的范围,不会因为很大的梯度导致很大的学习步长,参数的值比较稳定。
完成卷积神经网络的训练优化后,可以将待分析图像输入优化后的卷积神经网络,输出待分析图像的抖动分布。图6示出了根据本发明的一个实施例的生成预测抖动分布的示意图。从图6可以看出,利用上述图像分析方法能够输出图像得像素级抖动分布,且对双摄生成的虚化图片不会误检,图6中的最后一图ofo小黄车的图像就是虚化,但没有被误检。能够生成局部的像素级抖动结果,可以精确地用于后续去模糊算法。
图7示出了根据本发明的一个实施例的图像分析装置700的示意性结构框图。该图像分析装置700可以驻留在计算设备100中,如图7所示,装置700可以包括生成模块710、训练模块720、计算模块730和优化模块740。对于每张图像,生成模块710可以基于随机抖动分布生成预定数量的抖动图像,随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵。训练模块720可以将抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,预测抖动分布为预测的抖动图像的像素分布矩阵。计算模块730可以基于随机抖动分布和预测抖动分布,计算损失函数。优化模块740可以基于损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络。
图8示出了根据本发明的一个实施例的图像分析装置700的示意性结构框图。如图8所示,装置700还可以包括分析模块750,在完成网络模型的训练优化后,分析模块750可以将待分析图像输入优化后的卷积神经网络,输出待分析图像的抖动分布。
根据本发明的一个实施例,如图8所示,训练模块720可以包括采样单元721和分类单元722。其中,采样单元721可以使用反卷积层对卷积层的特征图进行上采样,使特征图恢复到输入的抖动图像的尺寸。分类单元722可以在上采样后的特征图上进行逐像素分类,输出抖动图像的预测抖动分布。
计算模块730可以包括第一计算单元731,第一计算单元731可以基于随机抖动分布与预测抖动分布中每个对应的像素点之间的欧几里得距离,计算平方损失函数。优化模块740可以包括第二计算单元741和调整单元742。其中,第二计算单元741可以基于损失函数,计算卷积神经网络中每个参数的梯度的一阶矩估计和二阶矩估计。调整单元742可以基于第二计算单元计算的一阶矩估计和二阶矩估计,调整每个参数的学习率。
根据本发明的方案,大大提高了图像模糊检测的精确度,与其他基于深度学习的图像模糊检测方法相比,检出率高,能够生成局部的像素级抖动信息,以便用于后续去模糊算法的精确应用。
A3、如A1所述的方法,其中,所述随机抖动分布通过以下函数生成:
其中,分别为像素点沿图像三维坐标系中x轴、y轴、z轴方向的位移,为图像绕z轴的旋转。
A8、如A7所述的方法,其中,所述使用自适应矩估计法训练优化所述卷积神经网络的步骤包括:基于所述损失函数,计算卷积神经网络中每个参数的梯度的一阶矩估计和二阶矩估计;基于所述一阶矩估计和二阶矩估计,调整每个参数的学习率。
B11、如B9所述的装置,其中,所述卷积神经网络为全卷积网络,所述全卷积网络包括若干数量的卷积层、池化层、反卷积层,所述训练模块包括:采样单元,适于使用反卷积层对卷积层的特征图进行上采样,使所述特征图恢复到输入的抖动图像的尺寸;分类单元,适于在上采样后的特征图上进行逐像素分类,输出抖动图像的预测抖动分布。
B12、如B11所述的装置,其中,所述计算模块包括:第一计算单元,适于基于随机抖动分布与预测抖动分布中每个对应的像素点之间的欧几里得距离,计算平方损失函数。
B13、如B12所述的装置,其中,所述优化模块包括:第二计算单元,适于基于所述损失函数,计算卷积神经网络中每个参数的梯度的一阶矩估计和二阶矩估计;调整单元,适于基于所述一阶矩估计和二阶矩估计,调整每个参数的学习率。
应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明所述的方法。
以示例而非限制的方式,计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种图像分析方法,适于在计算设备中执行,其中,所述计算设备预先存储多张用于训练卷积神经网络的图像,所述方法包括:
对于每张图像,基于随机抖动分布生成预定数量的抖动图像,所述随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵;
将所述抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,所述预测抖动分布为预测的抖动图像的像素分布矩阵;
基于所述随机抖动分布和预测抖动分布,计算损失函数;以及
基于所述损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络。
2.如权利要求1所述的方法,其中,所述方法还包括:
将待分析图像输入优化后的卷积神经网络,输出待分析图像的抖动分布。
3.如权利要求1所述的方法,其中,所述卷积神经网络为全卷积网络,所述全卷积网络包括若干数量的卷积层、池化层和反卷积层。
4.如权利要求3所述的方法,其中,所述将所述抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布的步骤包括:
使用反卷积层对卷积层的特征图进行上采样,使所述特征图恢复到输入的抖动图像的尺寸;
在上采样后的特征图上进行逐像素分类,输出抖动图像的预测抖动分布。
5.如权利要求4所述的方法,其中,所述基于所述随机抖动分布和预测抖动分布,计算所述卷积神经网络的损失函数的步骤包括:
基于随机抖动分布与预测抖动分布中每个对应的像素点之间的欧几里得距离,计算平方损失函数。
6.如权利要求5所述的方法,其中,所述基于所述损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络的步骤包括:
使用自适应矩估计法训练优化所述卷积神经网络。
7.一种图像分析装置,其中,所述装置包括:
生成模块,适于对于每张图像,基于随机抖动分布生成预定数量的抖动图像,所述随机抖动分布为图像中每个像素点在任意方向上位移/旋转后的像素分布矩阵;
训练模块,适于将所述抖动图像输入卷积神经网络,以便输出抖动图像的预测抖动分布,所述预测抖动分布为预测的抖动图像的像素分布矩阵;
计算模块,适于基于所述随机抖动分布和预测抖动分布,计算损失函数;
优化模块,基于所述损失函数调整卷积神经网络的参数,以得到优化后的卷积神经网络。
8.如权利要求7所述的装置,其中,所述装置还包括:
分析模块,适于将待分析图像输入优化后的卷积神经网络,输出待分析图像的抖动分布。
9.一种计算设备,包括:
存储器;
一个或多个处理器;
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-6所述方法中的任一方法的指令。
10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当计算设备执行时,使得所述计算设备执行根据权利要求1-6所述的方法中的任一方法。
CN201811500056.8A 2018-12-07 2018-12-07 一种图像分析方法、装置、计算设备及存储介质 Active CN109671061B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811500056.8A CN109671061B (zh) 2018-12-07 2018-12-07 一种图像分析方法、装置、计算设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811500056.8A CN109671061B (zh) 2018-12-07 2018-12-07 一种图像分析方法、装置、计算设备及存储介质

Publications (2)

Publication Number Publication Date
CN109671061A true CN109671061A (zh) 2019-04-23
CN109671061B CN109671061B (zh) 2021-05-04

Family

ID=66144205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811500056.8A Active CN109671061B (zh) 2018-12-07 2018-12-07 一种图像分析方法、装置、计算设备及存储介质

Country Status (1)

Country Link
CN (1) CN109671061B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110728661A (zh) * 2019-09-18 2020-01-24 清华大学 基于随机生成样本的图像畸变评价网络训练方法及装置
CN111901532A (zh) * 2020-09-30 2020-11-06 南京理工大学 基于循环神经网络迭代策略的视频稳定方法
CN113310987A (zh) * 2020-02-26 2021-08-27 保定市天河电子技术有限公司 一种隧道衬砌表面检测系统及方法
CN113347352A (zh) * 2021-05-21 2021-09-03 Oppo广东移动通信有限公司 拍摄参数调整方法及装置、电子设备、计算机存储介质
CN113693561A (zh) * 2021-08-26 2021-11-26 平安国际智慧城市科技股份有限公司 基于神经网络的帕金森病预测设备、装置和存储介质
CN115242966A (zh) * 2022-05-24 2022-10-25 浙江华感科技有限公司 一种摄像设备的防抖方法、装置和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103839233A (zh) * 2014-01-20 2014-06-04 左旺孟 一种相机抖动造成的模糊图像复原方法
CN106952239A (zh) * 2017-03-28 2017-07-14 厦门幻世网络科技有限公司 图像生成方法和装置
CN107464261A (zh) * 2017-07-07 2017-12-12 广州市百果园网络科技有限公司 一种图像数据标定训练方法及其设备、存储介质、服务器
CN108010031A (zh) * 2017-12-15 2018-05-08 厦门美图之家科技有限公司 一种人像分割方法及移动终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103839233A (zh) * 2014-01-20 2014-06-04 左旺孟 一种相机抖动造成的模糊图像复原方法
CN106952239A (zh) * 2017-03-28 2017-07-14 厦门幻世网络科技有限公司 图像生成方法和装置
CN107464261A (zh) * 2017-07-07 2017-12-12 广州市百果园网络科技有限公司 一种图像数据标定训练方法及其设备、存储介质、服务器
CN108010031A (zh) * 2017-12-15 2018-05-08 厦门美图之家科技有限公司 一种人像分割方法及移动终端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
OLIVER WHYTE等: "《Non-uniform deblurring for shaken images》", 《2010 IEEE COMPUTER SOCIETY CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
邓红: "《非均匀模糊图像复原方法研究》", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110728661A (zh) * 2019-09-18 2020-01-24 清华大学 基于随机生成样本的图像畸变评价网络训练方法及装置
CN113310987A (zh) * 2020-02-26 2021-08-27 保定市天河电子技术有限公司 一种隧道衬砌表面检测系统及方法
CN111901532A (zh) * 2020-09-30 2020-11-06 南京理工大学 基于循环神经网络迭代策略的视频稳定方法
CN113347352A (zh) * 2021-05-21 2021-09-03 Oppo广东移动通信有限公司 拍摄参数调整方法及装置、电子设备、计算机存储介质
CN113347352B (zh) * 2021-05-21 2023-10-03 Oppo广东移动通信有限公司 拍摄参数调整方法及装置、电子设备、计算机存储介质
CN113693561A (zh) * 2021-08-26 2021-11-26 平安国际智慧城市科技股份有限公司 基于神经网络的帕金森病预测设备、装置和存储介质
CN113693561B (zh) * 2021-08-26 2023-08-25 深圳平安智慧医健科技有限公司 基于神经网络的帕金森病预测设备、装置和存储介质
CN115242966A (zh) * 2022-05-24 2022-10-25 浙江华感科技有限公司 一种摄像设备的防抖方法、装置和计算机可读存储介质

Also Published As

Publication number Publication date
CN109671061B (zh) 2021-05-04

Similar Documents

Publication Publication Date Title
CN109671061A (zh) 一种图像分析方法、装置、计算设备及存储介质
CN111194458B (zh) 用于处理图像的图像信号处理器
US9747526B2 (en) Using machine learning to define user controls for photo adjustments
KR102442844B1 (ko) 실제 3차원 객체를 실제 객체의 2-차원 스푸프로부터 구별하기 위한 방법(Method for Distinguishing a Real Three-Dimensional Object from a Two-Dimensional Spoof of the Real Object)
Jo et al. Practical single-image super-resolution using look-up table
US10108884B2 (en) Learning user preferences for photo adjustments
WO2016054779A1 (en) Spatial pyramid pooling networks for image processing
US20180181796A1 (en) Image processing method and apparatus
CN110084313A (zh) 一种生成物体检测模型的方法
CN107454284A (zh) 一种视频去噪方法及计算设备
CN105453132B (zh) 实施图像处理的信息处理设备和图像处理方法
CN105976328B (zh) 图像噪声降低
CN105976327B (zh) 对第一图像进行变换的方法、处理模块和存储介质
CN108921810A (zh) 一种颜色迁移方法及计算设备
CN114078195A (zh) 分类模型的训练方法、超参数的搜索方法以及装置
CN108537208A (zh) 一种多尺度的人脸检测方法及计算设备
CN110276289A (zh) 生成匹配模型的方法和人脸特征点追踪方法
JP2013097467A (ja) 画像処理装置及びその制御方法
EP3529776B1 (en) Method, device, and system for processing multimedia signal
Lin et al. An HVS-directed neural-network-based image resolution enhancement scheme for image resizing
CN112836756A (zh) 图像识别模型训练方法、系统和计算机设备
CN105791659A (zh) 图像处理方法和电子设备
CN115696044B (zh) 成像控制方法、装置、计算机设备和存储介质
US20150089444A1 (en) Visual example-based user interface for adjusting photos along two dimensions
CN108492261A (zh) 一种图像增强方法及计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant