CN108810319A - 图像处理装置和图像处理方法 - Google Patents
图像处理装置和图像处理方法 Download PDFInfo
- Publication number
- CN108810319A CN108810319A CN201710282498.9A CN201710282498A CN108810319A CN 108810319 A CN108810319 A CN 108810319A CN 201710282498 A CN201710282498 A CN 201710282498A CN 108810319 A CN108810319 A CN 108810319A
- Authority
- CN
- China
- Prior art keywords
- fuzzy
- image
- block
- fuzzy core
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 73
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 78
- 238000000034 method Methods 0.000 claims description 27
- 238000013527 convolutional neural network Methods 0.000 claims description 24
- 230000033001 locomotion Effects 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 15
- 238000010586 diagram Methods 0.000 description 7
- 230000006854 communication Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/21—Circuitry for suppressing or minimising disturbance, e.g. moiré or halo
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本公开涉及图像处理装置和图像处理方法。根据一个实施例的图像处理装置包括选取部分、确定部分以及估计部分。选取部分被配置为根据预定规则选取目标图像中的代表块。确定部分被配置为基于第一训练数据集确定代表块针对多个预定模糊核的分类结果,其中第一训练数据集包括清晰训练图像以及针对多个预定模糊核中的每个生成的模糊训练图像。估计部分被配置为根据代表块的分类结果估计目标图像的模糊核。
Description
技术领域
本公开一般涉及图像处理,更具体地,涉及与图像去模糊有关的图像处理装置和图像处理方法。
背景技术
随着诸如移动电话或个人计算机及其应用的发展,导致诸如数字文档图像等大量图像的产生。由于多种原因,图像中可能存在模糊的现象。例如,在获取图像的装置为手持摄像装置时,由于抖动可能造成获取的图像的散焦。又例如,在拍摄图像时,如果图像拍摄装置与拍摄对象之间存在相对运动,也可能造成图像的模糊,这在光照水平较低以及曝光时间较长的情况下尤为严重。此外,还存在以下情况:摄像机聚焦在拍摄对象的一部分处,而未聚焦的区域将会模糊。图像去模糊处理旨在由模糊图像恢复清晰的图像。
发明内容
在下文中给出了关于本发明实施例的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,以下概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
根据一个实施例,提供一种图像处理装置,其包括选取部分、确定部分以及估计部分。选取部分被配置为根据预定规则选取目标图像中的代表块。确定部分被配置为基于第一训练数据集确定代表块针对多个预定模糊核的分类结果,其中第一训练数据集包括清晰训练图像以及针对多个预定模糊核中的每个生成的模糊训练图像。估计部分被配置为根据代表块的分类结果估计目标图像的模糊核。
根据另一个实施例,提供一种图像处理方法。该方法包括根据预定规则选取目标图像中的代表块的步骤。该方法还包括基于第一训练数据集确定代表块针对多个预定模糊核的分类结果的步骤,其中第一训练数据集包括清晰训练图像以及针对多个预定模糊核中的每个生成的模糊训练图像。该方法还包括根据代表块的分类结果估计目标图像的模糊核的步骤。
通过上述实施例的图像处理,能够高效地估计图像的模糊核,进而例如有利于有针对性地进行图像的去模糊。
附图说明
本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。在附图中:
图1是示出根据本发明一个实施例的图像处理装置的配置示例的框图;
图2是示出根据另一个实施例的图像处理装置的配置示例的框图;
图3是示出根据本发明一个实施例的图像处理方法的过程示例的流程图;
图4是用于说明本发明的一个示例实施例中的图像处理的总体过程的示意图;
图5是用于说明代表块的选取的图;
图6是用于说明分类网络的示意图;
图7示出了用于去模糊处理的模型的学习过程的示例;
图8示出了去模糊处理的示例结果;
图9是示出根据本发明一个实施例的图像处理装置的配置示例的框图;以及
图10是示出实现本公开的方法和设备的计算机的示例性结构的框图。
具体实施方式
下面将参照附图来说明本发明的实施例。在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
图1示出了根据本发明一个实施例的图像处理装置100的配置示例。图像处理装置例如可以被实现为个人计算机(例如桌上型计算机、膝上型计算机等)、工作站、移动终端(诸如智能电话、平板计算机、便携式游戏终端等)、游戏机、电视机、或者摄像装置(例如摄像机、监视器)等。然而,本发明实施例的应用范围不限于以上列举的方面,而是可以用于任何能够(直接地或从其他设备)获取图像并且对图像进行处理的装置。
本实施例的总体目的在于针对给定目标图像,高效地提供对于该目标图像的模糊核(blur kernel)的估计。根据具体应用,目标图像可以包括各种类型的图像,例如但不限于文档图像,在目标图像中可能由于运动、散焦等原因而存在模糊。
如图1所示,根据本实施例的图像处理装置100包括选取部分110、确定部分130以及估计部分150。接下来,分别结合具体实施例给出选取部分110、确定部分130以及估计部分150的配置的描述。
选取部分110被配置为根据预定规则选取目标图像中的代表块。
选取代表块的目的在于仅针对代表块而非针对整个图像进行处理以估计图像的模糊核。所选取的代表块为目标图像中对于模糊核而言具有代表性的块。根据具体应用,可以采用不同的预定规则来选取代表块。例如,可以采用基于图像的纹理特征或颜色特征等设置的预定规则来选取代表块。
根据一个实施例,选取部分110可以被配置为生成目标图像的梯度图,以及将与梯度图中满足以下条件的块相对应的块确定为代表块:在该块中,梯度值大于第一阈值的像素所占的比例高于第二阈值。
参照图5的示例更详细地说明代表块提取的示例方式。图5中的I指示输入的模糊图像,G指示由图像I生成的梯度图。
首先,根据输入模糊图像I生成梯度图G;
接下来,从输入图像I中截取预定尺寸m×n像素的子图像Is以及从梯度图G中截取与子图像Is相对应的子梯度图Gs;
对于子梯度图Gs,判断其是否满足以下条件:
nnz(max(0,Gs(u,v)-T))>ks×m×n,其中u∈[1,m],v∈[1,n],Gs(u,v)表示子图像Gs中的位置(u,v)处的梯度值,T为梯度阈值,ks表示比例阈值,nnz(x)表示不等于0的x的数量。上述条件的含义为,子梯度图Gs中梯度值大于阈值T的像素所占的比例高于阈值ks。可以根据具体应用设置上述各阈值的取值。
如果当前子梯度图Gs满足上述条件,则将相应的子图像Is选为代表块。
另外,根据一个实施例,选取部分110可以被配置为针对随机提取的块进行选取代表块的处理,直到找出预定数量个代表块。
仍以上述示例过程为例,可以循环进行子图像Is的选取以及针对相应子梯度图Gs的判断过程,直到获得预定数量例如3个代表块。在其他实施例中,可以根据识别准确度的要求以及处理速度的要求等设置代表块的数量和大小等。
继续参照图1,确定部分120被配置为基于第一训练数据集确定代表块针对多个预定模糊核的分类结果。第一训练数据集可以包括清晰训练图像以及针对多个预定模糊核中的每个生成的模糊训练图像。
根据具体应用,预定模糊核可以包括与多种模糊类型相对应的模糊核。作为示例而非限制,预定模糊核可以包括与运动模糊和散焦模糊相对应的模糊核。
更具体地,与运动模糊相对应的模糊核可以包括分别与多个预定运动长度以及多个预定运动角度相对应的模糊核,并且与散焦模糊相对应的模糊核可以包括分别与多个预定散焦半径相对应的模糊核。
在一个示例中,假设运动模糊核的运动长度l∈(0,14]像素,运动角度θ∈[0°,180°],散焦模糊核的焦半径r∈[0,6]像素。可以以2为间隔以l=1~13,以30°为间隔以θ=15°~165°,以及以r=3和5生成离散的模糊核。
可以从清晰训练图像中截取M个大小为m×n的图像块以构成集合P,从P中随机选择N(N<M)个图像块,并且用第i个模糊核进行模糊。每个模糊核被用于生成N个模糊图像块,以作为该模糊核的类型的N个样本。利用清晰训练图像块以及相应的模糊图像块,可以通过训练得到用于确定图像块的模糊类型的分类器。
根据一个实施例,确定部分120可以基于第一训练数据集获得针对多个预定模糊核的卷积神经网络(CNN)分类器,以及利用所获得的分类器确定代表块的分类结果。
训练CNN分类器的过程即使用训练数据集学习分类网络的参数,以获得用于估计模糊核的分类器。
接下来,参照图6说明CNN分类器的示例。传统分类器网络包括6个层,第一层(C1)为“卷积+修正线性单元(Conv+ReLU)”,其用于低层次特征提取。此后是最大池化(Max-pooling)层(M2),最大池化是一种形式的非线性下采样,其通过排除非最大值来减少针对上层的计算,并且还提供一种形式的平移不变性。此后,是另一个“卷积+修正线性单元”层(C3),其用于高层次的特征提取。之后是另一个最大池化层(M4),其用于下采样。接下来,是“全连接+修正线性单元(Fully conn.+ReLU)”层(F5),其用于特征拟合。最后,是柔性化最大值(Soft-max)层(S6),其用于预测每个类的可能性。
在利用分类器获得的每个代表块的模糊核分类结果中,可以包含针对多个预定模糊核类型中的每个模糊核类型的可能性。
继续参照图1,在确定部分120确定了代表块的分类结果的情况下,估计部分130可以根据代表块的分类结果估计目标图像的模糊核。
例如,在只有一个代表块的情况下,可以将目标图像的模糊核估计为该代表块的分类结果中指示的可能性最大的模糊核。此外,在有多个代表块的情况下,可以综合考虑多个代表块的分类结果来估计目标图像的模糊核。
根据一个实施例,在选取部分110根据预定规则选取目标图像中的多个代表块的情况下,估计部分130被配置为基于针对多个代表块确定的多组分类结果,通过投票方式估计目标图像的模糊核。
更具体地,投票方式可以包括:针对多个代表块中的每个,确定该代表块对应于每个预定模糊核的概率;以及将概率之和最大的预定模糊核确定为图像的模糊核。
接下来,为了便于说明,仍然以从目标图像中选取3个代表块并且应用CNN分类器的情况为例描述通过投票方式估计目标图像的模糊核的示例方式。然而,应当理解,该方式也可以适用于其他代表块数量以及其他分类器的情况。
对从目标图像中提取的代表块应用所训练的CNN,以得到分类结果。对于每个代表块,分类结果指示该代表块属于多个预定模糊核中的每个的可能性。因此,对于三个代表块,可以得到三组分类结果。
将分类结果分别记为R1、R2和R3,其中,Ri={(1,pi1),(2,pi2),...,(K,piK)},其中,K表示预定模糊核的种类数量,pij表示第i个代表块属于第j个模糊核的可能性。
可以将满足下式的第k个模糊核估计为目标图像的模糊核:
即,将代表块的分类结果指示的概率之和最大的预定模糊核确定为目标图像的模糊核。
以上参照具体示例说明了根据本发明实施的图像处理装置,应理解,本发明不限于以上示例中的具体细节。
利用上述实施例的图像处理,通过对目标图像中的代表块而不是对整个目标图像进行处理,能够高效地估计图像的模糊核。
此外,通过选取多个代表块并且以投票的方式估计模糊核,能够进一步提高模糊核估计的准确度。
所估计的模糊核指示了目标图像的模糊类型,可以以多种方式利用该信息。例如,根据一个实施例,可以利用所估计的模糊核对目标图像进行去模糊处理,从而能够有针对性地对模糊图像进行恢复处理。
如图2所示,根据本实施例的图像处理装置200包括选取部分210、确定部分230、估计部分250以及处理部分270。选取部分210、确定部分230和估计部分250的配置分别与前面的实施例中描述的选取部分110、确定部分130以及估计部分150类似,在此省略其重复说明。
处理部分270可以被配置为利用与估计部分250所估计的模糊核相对应的去模糊模型对目标图像进行去模糊处理。
根据一个实施例,与所估计的模糊核相对应的去模糊模型可以包括利用第二训练数据集得到的卷积神经网络(CNN)模型,其中第二训练数据集包括清晰训练图像以及与所估计的模糊核相对应的模糊训练图像。
可以预先针对前述多个预定模糊核中的每个类型的模糊核训练去模糊模型,并且在去模糊处理时根据目标图像的所估计的模糊核来选用相应的去模糊模型。
另外,与所估计的模糊核相对应的模糊训练图像可以包括:利用在与所估计的模糊核相对应的预定范围内随机选取的模糊核生成的模糊训练图像。
例如,对于核长度l=3和角度θ=15的运动模糊,可以使用从l=2到4以及θ=0°到30°的运动核随机地生成训练图像块的模糊图像。可以准备大量例如多达10万对训练图像块。
如前所述,去模糊模型可以是在进行去模糊处理之前预先训练的,处理部分270可以例如从存储装置获取预先训练的去模糊模型中与估计部分250估计的目标图像的模糊核相对应的去模糊模型,并且利用该去模糊模型对目标图像进行去模糊处理。
此外,根据一个实施例,CNN模型包括多层网络模型,并且,可以将利用多层网络模型得到的最终特征图作为去模糊处理的结果。
作为示例,可以利用仅具有卷积和修正线性单元的15层网络模型进行的去模糊处理。在本示例中,模糊图像的图像块大小例如为66×66,用于填充效应(padding effect)的标签图像的图像块大小例如为16×16。
下表示出了该示例15层网络模型中每一层对应的卷积核大小以及卷积特征图数目的配置。
在估计部分250将目标图像的模糊核估计为多个预定模糊核中的第k个模糊核的情况下,对模糊图像应用对应于第k个模糊核的第k个去模糊CNN模型,以恢复该目标图像。
图7示出了用于去模糊处理的多层网络模型的示例学习过程。该过程利用作为训练数据的模糊快和清晰快,并且包含N(例如多达30万)次迭代,并且每执行预定数量(例如5000)次迭代后进行对参数(即模型)的存储。
图8示出了利用上述多层网络模型得到的去模糊处理的结果示例,其中左图为模糊的文档图像,其对应于前述目标图像,右图为作为去模糊处理的结果的恢复图像。
前面描述了对目标图像的模糊和进行估计的实施例以及进一步利用所估计的模糊和进行去模糊处理的实施例。接下来,参照图4说明作为示例实施例的图像处理的整体过程,以作为对于上述示例实施方式的总结。该图像处理过程的输入图像为模糊图像,输出图像为经恢复的清晰图像。
需要指出,在图4所示的整体过程中包含模糊核估计阶段以及去模糊阶段的处理,然而本发明实施例也可以仅包括进行模糊核估计的处理。此外,该示例过程中包含了前述实施例中涉及的一些具体配置和处理,而本发明实施例不限于这些具体实现方式。
在模糊核估计阶段中,作为示例,从输入模糊图像中随机提取3个图像块作为输入图像的代表块,并且将代表块提供至CNN分类器,以生成三组分类结果。基于这些分类结果,通过投票将第k种模糊核选择为输入图像的模糊核。
在去模糊阶段中,模糊图像被提供至与第k个模糊核相对应的第k个CNN去模糊模型,以恢复出清晰的图像。
通过上述去模糊处理,能够在不需要针对整个输入图像进行模糊核估计以及进行从粗到精迭代的情况下,在保持背景亮度的情况下对真实的模糊图像进行去模糊。
因此,与已有的去模糊方式相比,根据本发明实施例的图像处理可以具有以下优点:
不需要模糊图像的具体特征以及确切的模糊核估计;以及
能够在保持图像的背景亮度的情况下高效地对运动模糊和散焦模糊等进行去模糊。
在前面针对根据本发明实施例的图像处理装置的描述过程中,显然也公开了一些处理和方法。接下来,在不重复前面已经描述过的细节的情况下,给出对于根据本发明实施例的图像处理方法的描述。
如图3所示,根据一个实施例的图像处理方法包括以下步骤:
在S310,根据预定规则选取目标图像中的代表块;
在S320,基于第一训练数据集确定代表块针对多个预定模糊核的分类结果,其中第一训练数据集包括清晰训练图像以及针对多个预定模糊核中的每个生成的模糊训练图像;以及
S330,根据代表块的分类结果估计目标图像的模糊核。
此外,虽然图中未示出,根据一个实施例,图像处理方法还可以包括利用与所估计的模糊核相对应的去模糊模型对目标图像进行去模糊处理的步骤。
另外,在步骤S320中,预定模糊核可以包括与运动模糊和散焦模糊相对应的模糊核。与运动模糊相对应的模糊核可以包括分别与多个预定运动长度以及多个预定运动角度相对应的模糊核。与散焦模糊相对应的模糊核可以包括分别与多个预定散焦半径相对应的模糊核。
在步骤S310中,选取代表块可以包括根据预定规则选取目标图像中的多个代表块。相应地,S330中估计目标图像的模糊核的步骤可以包括基于针对多个代表块确定的多组分类结果,通过投票方式估计目标图像的模糊核。
投票方式可以包括:针对多个代表块中的每个,确定该代表块对应于每个所述预定模糊核的概率;以及将概率之和最大的预定模糊核确定为目标图像的模糊核。
此外,在步骤S310中选取所述代表块的步骤可以包括:生成所述目标图像的梯度图;以及将与梯度图中满足以下条件的块相对应的块确定为所述代表块:在该块中,梯度值大于第一阈值的像素所占的比例高于第二阈值。
步骤S310可以包括:针对随机提取的块进行选取代表块的步骤,直到找出预定数量个代表块。
另外,在S320中,确定代表块的分类结果的步骤可以包括:基于第一训练数据集获得针对多个预定模糊核的卷积神经网络分类器;以及利用所获得的分类器确定代表块的分类结果。
在去模糊处理的步骤中,与所估计的模糊核相对应的去模糊模型可以包括:利用第二训练数据集得到的卷积神经网络模型,其中第二训练数据集包括清晰训练图像以及与所估计的模糊核相对应的模糊训练图像。
其中,与所估计的模糊核相对应的模糊训练图像可以包括:利用在与所估计的模糊核相对应的预定范围内随机选取的模糊核生成的模糊训练图像。
此外,卷积神经网络模型可以包括多层网络模型,并且,可以将利用多层网络模型得到的最终特征图作为去模糊处理的结果。
图9示出了根据一个实施例的图像处理装置的配置实例。如图9所示,根据本实施例的图像处理装置900包括处理电路910。处理电路910例如可以实现为特定芯片、芯片组或者中央处理单元(CPU)等。
处理电路910包括选取单元911、确定单元913和估计单元915。需要指出,虽然附图中以功能块的形式示出了选取单元911、确定单元913和估计单元915,然而应理解,各的功能也可以由处理电路910作为一个整体来实现,而并不一定是通过处理电路910中分立的实际部件来实现。另外,虽然图中以一个框示出处理电路910,然而图像处理装置900可以包括多个处理电路,并且可以将选取单元911、确定单元913和估计单元915的功能分布到多个处理电路中,从而由多个处理电路协同操作来执行这些功能。
选取单元911被配置为根据预定规则选取目标图像中的代表块。确定单元913被配置为基于第一训练数据集确定代表块针对多个预定模糊核的分类结果,其中第一训练数据集包括清晰训练图像以及针对多个预定模糊核中的每个生成的模糊训练图像。估计单元915被配置为根据代表块的分类结果估计目标图像的模糊核。
作为示例,上述方法的各个步骤以及上述装置的各个组成模块和/或单元可以实施为软件、固件、硬件或其组合。在通过软件或固件实现的情况下,可以从存储介质或网络向具有专用硬件结构的计算机(例如图10所示的通用计算机1000)安装构成用于实施上述方法的软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
在图10中,运算处理单元(即CPU)1001根据只读存储器(ROM)1002中存储的程序或从存储部分1008加载到随机存取存储器(RAM)1003的程序执行各种处理。在RAM 1003中,也根据需要存储当CPU 1001执行各种处理等等时所需的数据。CPU 1001、ROM 1002和RAM1003经由总线1004彼此链路。输入/输出接口1005也链路到总线1004。
下述部件链路到输入/输出接口1005:输入部分1006(包括键盘、鼠标等等)、输出部分1007(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分1008(包括硬盘等)、通信部分1009(包括网络接口卡比如LAN卡、调制解调器等)。通信部分1009经由网络比如因特网执行通信处理。根据需要,驱动器1010也可链路到输入/输出接口1005。可拆卸介质1011比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器1010上,使得从中读出的计算机程序根据需要被安装到存储部分1008中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质1011安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图10所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1011。可拆卸介质1011的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 1002、存储部分1008中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
本发明的实施例还涉及一种存储有机器可读取的指令代码的程序产品。所述指令代码由机器读取并执行时,可执行上述根据本发明实施例的方法。
相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。所述存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。
在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以用相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
在上述实施例和示例中,采用了数字组成的附图标记来表示各个步骤和/或单元。本领域的普通技术人员应理解,这些附图标记只是为了便于叙述和绘图,而并非表示其顺序或任何其他限定。
此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。
尽管上面已经通过对本发明的具体实施例的描述对本发明进行了披露,但是,应该理解,上述的所有实施例和示例均是示例性的,而非限制性的。本领域的技术人员可在所附权利要求的精神和范围内设计对本发明的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本发明的保护范围内。
(附记1)一种图像处理装置,包括:
选取部分,被配置为根据预定规则选取目标图像中的代表块;
确定部分,被配置为基于第一训练数据集确定所述代表块针对多个预定模糊核的分类结果,其中所述第一训练数据集包括清晰训练图像以及针对所述多个预定模糊核中的每个生成的模糊训练图像;以及
估计部分,被配置为根据所述代表块的所述分类结果估计所述目标图像的模糊核。(1)
(附记2)根据附记1所述的图像处理装置,还包括:
处理部分,被配置为利用与所估计的模糊核相对应的去模糊模型对所述目标图像进行去模糊处理。(2)
(附记3)根据附记1所述的图像处理装置,其中,所述预定模糊核包括与运动模糊和散焦模糊相对应的模糊核。(3)
(附记4)根据附记3所述的图像处理装置,其中,
与运动模糊相对应的模糊核包括分别与多个预定运动长度以及多个预定运动角度相对应的模糊核;并且
与散焦模糊相对应的模糊核包括分别与多个预定散焦半径相对应的模糊核。(4)
(附记5)根据附记1所述的图像处理装置,其中,所述选取部分被配置为:根据所述预定规则选取所述目标图像中的多个代表块,并且
所述估计部分被配置为:基于针对所述多个代表块确定的多组分类结果,通过投票方式估计所述目标图像的模糊核。(5)
(附记6)根据附记5所述的图像处理装置,其中,所述投票方式包括:
针对所述多个代表块中的每个,确定该代表块对应于每个所述预定模糊核的概率;以及
将所述概率之和最大的预定模糊核确定为所述目标图像的模糊核。
(附记7)根据附记1所述的图像处理装置,其中,所述选取部分被配置为:
生成所述目标图像的梯度图;以及
将与所述梯度图中满足以下条件的块相对应的块确定为所述代表块:在该块中,梯度值大于第一阈值的像素所占的比例高于第二阈值。(6)
(附记8)根据附记7所述的图像处理装置,其中,所述选取部分被配置为:针对随机提取的块进行选取所述代表块的处理,直到找出预定数量个代表块。
(附记9)根据附记1所述的图像处理装置,其中,所述确定部分被配置为:
基于所述第一训练数据集获得针对所述多个预定模糊核的卷积神经网络分类器;以及
利用所获得的分类器确定所述代表块的所述分类结果。(7)
(附记10)根据附记2所述的图像处理装置,其中,与所估计的模糊核相对应的去模糊模型包括:利用第二训练数据集得到的卷积神经网络模型,其中所述第二训练数据集包括清晰训练图像以及与所估计的模糊核相对应的模糊训练图像。(8)
(附记11)根据附记10所述的图像处理装置,其中,与所估计的模糊核相对应的模糊训练图像包括:利用在与所估计的模糊核相对应的预定范围内随机选取的模糊核生成的模糊训练图像。
(附记12)根据附记10所述的图像处理装置,其中,所述卷积神经网络模型包括多层网络模型,并且,将利用所述多层网络模型得到的最终特征图作为所述去模糊处理的结果。(9)
(附记13)一种图像处理方法,包括:
根据预定规则选取目标图像中的代表块;
基于第一训练数据集确定所述代表块针对多个预定模糊核的分类结果,其中所述第一训练数据集包括清晰训练图像以及针对所述多个预定模糊核中的每个生成的模糊训练图像;以及
根据所述代表块的所述分类结果估计所述目标图像的模糊核。(10)
(附记14)根据附记13所述的图像处理方法,还包括:
利用与所估计的模糊核相对应的去模糊模型对所述目标图像进行去模糊处理。
(附记15)根据附记13所述的图像处理方法,其中,所述预定模糊核包括与运动模糊和散焦模糊相对应的模糊核。
(附记16)根据附记13所述的图像处理方法,其中,选取所述代表块的步骤包括:根据所述预定规则选取所述目标图像中的多个代表块,并且
估计所述目标图像的模糊核的步骤包括:基于针对所述多个代表块确定的多组分类结果,通过投票方式估计所述目标图像的模糊核。
(附记17)根据附记13所述的图像处理方法,其中,选取所述代表块的步骤包括:
生成所述目标图像的梯度图;以及
将与所述梯度图中满足以下条件的块相对应的块确定为所述代表块:在该块中,梯度值大于第一阈值的像素所占的比例高于第二阈值。
(附记18)根据附记13所述的图像处理方法,其中,确定所述代表块的分类结果的步骤包括:
基于所述第一训练数据集获得针对所述多个预定模糊核的卷积神经网络分类器;以及
利用所获得的分类器确定所述代表块的所述分类结果。
(附记19)根据附记14所述的图像处理方法,其中,与所估计的模糊核相对应的去模糊模型包括:利用第二训练数据集得到的卷积神经网络模型,其中所述第二训练数据集包括清晰训练图像以及与所估计的模糊核相对应的模糊训练图像。
(附记20)根据附记19所述的图像处理方法,其中,所述卷积神经网络模型包括多层网络模型,并且,将利用所述多层网络模型得到的最终特征图作为所述去模糊处理的结果。
Claims (10)
1.一种图像处理装置,包括:
选取部分,被配置为根据预定规则选取目标图像中的代表块;
确定部分,被配置为基于第一训练数据集确定所述代表块针对多个预定模糊核的分类结果,其中所述第一训练数据集包括清晰训练图像以及针对所述多个预定模糊核中的每个生成的模糊训练图像;以及
估计部分,被配置为根据所述代表块的所述分类结果估计所述目标图像的模糊核。
2.根据权利要求1所述的图像处理装置,还包括:
处理部分,被配置为利用与所估计的模糊核相对应的去模糊模型对所述目标图像进行去模糊处理。
3.根据权利要求1所述的图像处理装置,其中,所述预定模糊核包括与运动模糊和散焦模糊相对应的模糊核。
4.根据权利要求3所述的图像处理装置,其中,
与运动模糊相对应的模糊核包括分别与多个预定运动长度以及多个预定运动角度相对应的模糊核;并且
与散焦模糊相对应的模糊核包括分别与多个预定散焦半径相对应的模糊核。
5.根据权利要求1所述的图像处理装置,其中,所述选取部分被配置为:根据所述预定规则选取所述目标图像中的多个代表块,并且
所述估计部分被配置为:基于针对所述多个代表块确定的多组分类结果,通过投票方式估计所述目标图像的模糊核。
6.根据权利要求1所述的图像处理装置,其中,所述选取部分被配置为:
生成所述目标图像的梯度图;以及
将与所述梯度图中满足以下条件的块相对应的块确定为所述代表块:在该块中,梯度值大于第一阈值的像素所占的比例高于第二阈值。
7.根据权利要求1所述的图像处理装置,其中,所述确定部分被配置为:
基于所述第一训练数据集获得针对所述多个预定模糊核的卷积神经网络分类器;以及
利用所获得的分类器确定所述代表块的所述分类结果。
8.根据权利要求2所述的图像处理装置,其中,与所估计的模糊核相对应的去模糊模型包括:利用第二训练数据集得到的卷积神经网络模型,其中所述第二训练数据集包括清晰训练图像以及与所估计的模糊核相对应的模糊训练图像。
9.根据权利要求8所述的图像处理装置,其中,所述卷积神经网络模型包括多层网络模型,并且,将利用所述多层网络模型得到的最终特征图作为所述去模糊处理的结果。
10.一种图像处理方法,包括:
根据预定规则选取目标图像中的代表块;
基于第一训练数据集确定所述代表块针对多个预定模糊核的分类结果,其中所述第一训练数据集包括清晰训练图像以及针对所述多个预定模糊核中的每个生成的模糊训练图像;以及
根据所述代表块的所述分类结果估计所述目标图像的模糊核。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710282498.9A CN108810319B (zh) | 2017-04-26 | 2017-04-26 | 图像处理装置和图像处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710282498.9A CN108810319B (zh) | 2017-04-26 | 2017-04-26 | 图像处理装置和图像处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108810319A true CN108810319A (zh) | 2018-11-13 |
CN108810319B CN108810319B (zh) | 2020-10-23 |
Family
ID=64068951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710282498.9A Active CN108810319B (zh) | 2017-04-26 | 2017-04-26 | 图像处理装置和图像处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108810319B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509159A (zh) * | 2018-11-20 | 2019-03-22 | 湖南湖工电气有限公司 | 一种基于深度学习的无人机模糊图像端到端复原方法 |
CN112581382A (zh) * | 2019-09-27 | 2021-03-30 | 佳能株式会社 | 图像处理方法、装置及系统、存储介质和学习模型制造方法 |
CN116468613A (zh) * | 2023-06-20 | 2023-07-21 | 深圳市景创科技电子股份有限公司 | 超高清虚拟显示及控制方法、装置、设备及计算机介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120045095A1 (en) * | 2010-08-18 | 2012-02-23 | Canon Kabushiki Kaisha | Image processing apparatus, method thereof, program, and image capturing apparatus |
CN104680491A (zh) * | 2015-02-28 | 2015-06-03 | 西安交通大学 | 一种基于深度神经网络的图像非均匀运动模糊去除方法 |
CN105976318A (zh) * | 2016-04-28 | 2016-09-28 | 北京工业大学 | 一种图像超分辨率重建方法 |
CN106033595A (zh) * | 2015-03-13 | 2016-10-19 | 中国科学院西安光学精密机械研究所 | 一种基于局部约束的图像盲去模糊方法 |
CN106447626A (zh) * | 2016-09-07 | 2017-02-22 | 华中科技大学 | 一种基于深度学习的模糊核尺寸估计方法与系统 |
-
2017
- 2017-04-26 CN CN201710282498.9A patent/CN108810319B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120045095A1 (en) * | 2010-08-18 | 2012-02-23 | Canon Kabushiki Kaisha | Image processing apparatus, method thereof, program, and image capturing apparatus |
CN104680491A (zh) * | 2015-02-28 | 2015-06-03 | 西安交通大学 | 一种基于深度神经网络的图像非均匀运动模糊去除方法 |
CN106033595A (zh) * | 2015-03-13 | 2016-10-19 | 中国科学院西安光学精密机械研究所 | 一种基于局部约束的图像盲去模糊方法 |
CN105976318A (zh) * | 2016-04-28 | 2016-09-28 | 北京工业大学 | 一种图像超分辨率重建方法 |
CN106447626A (zh) * | 2016-09-07 | 2017-02-22 | 华中科技大学 | 一种基于深度学习的模糊核尺寸估计方法与系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509159A (zh) * | 2018-11-20 | 2019-03-22 | 湖南湖工电气有限公司 | 一种基于深度学习的无人机模糊图像端到端复原方法 |
CN112581382A (zh) * | 2019-09-27 | 2021-03-30 | 佳能株式会社 | 图像处理方法、装置及系统、存储介质和学习模型制造方法 |
CN116468613A (zh) * | 2023-06-20 | 2023-07-21 | 深圳市景创科技电子股份有限公司 | 超高清虚拟显示及控制方法、装置、设备及计算机介质 |
CN116468613B (zh) * | 2023-06-20 | 2023-10-27 | 深圳市景创科技电子股份有限公司 | 超高清虚拟显示及控制方法、装置、设备及计算机介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108810319B (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109670558B (zh) | 使用深度学习的数字图像完成 | |
Fan et al. | Integrating semantic segmentation and retinex model for low-light image enhancement | |
CN106778928B (zh) | 图像处理方法及装置 | |
US11631162B2 (en) | Machine learning training method, system, and device | |
US20200356818A1 (en) | Logo detection | |
CN109544442B (zh) | 基于双重对抗的生成式对抗网络的图像局部风格迁移方法 | |
CN111950723B (zh) | 神经网络模型训练方法、图像处理方法、装置及终端设备 | |
CN111583097A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
Vasluianu et al. | NTIRE 2023 image shadow removal challenge report | |
CN111144215B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
Pan et al. | MIEGAN: Mobile image enhancement via a multi-module cascade neural network | |
CN111144491B (zh) | 图像处理方法、装置及电子系统 | |
Kim et al. | Multiple level feature-based universal blind image quality assessment model | |
CN104978750B (zh) | 用于处理视频文件的方法和装置 | |
Ting et al. | Image inpainting by global structure and texture propagation | |
CN112801911B (zh) | 一种去除自然图像中文字类噪声的方法及装置、存储介质 | |
CN108810319A (zh) | 图像处理装置和图像处理方法 | |
CN115115552B (zh) | 图像矫正模型训练及图像矫正方法、装置和计算机设备 | |
CN110969641A (zh) | 图像处理方法和装置 | |
CN114359789B (zh) | 视频图像的目标检测方法、装置、设备及介质 | |
CN113628259A (zh) | 图像的配准处理方法及装置 | |
TWI757965B (zh) | 擴增實境體感遊戲機之深度學習方法 | |
CN116977195A (zh) | 复原模型的调整方法、装置、设备及存储介质 | |
CN114547437A (zh) | 图像检索方法及装置 | |
Wang et al. | MobileSky: Real-Time Sky Replacement for Mobile AR |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |