CN113177890B - 图像处理方法及装置、电子设备和存储介质 - Google Patents
图像处理方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113177890B CN113177890B CN202110461649.3A CN202110461649A CN113177890B CN 113177890 B CN113177890 B CN 113177890B CN 202110461649 A CN202110461649 A CN 202110461649A CN 113177890 B CN113177890 B CN 113177890B
- Authority
- CN
- China
- Prior art keywords
- image
- blurred image
- deblurring
- blurred
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003860 storage Methods 0.000 title claims abstract description 24
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 157
- 238000012545 processing Methods 0.000 claims abstract description 128
- 239000011159 matrix material Substances 0.000 claims abstract description 106
- 229920006395 saturated elastomer Polymers 0.000 claims abstract description 72
- 230000008569 process Effects 0.000 claims description 103
- 238000013528 artificial neural network Methods 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 15
- 230000009467 reduction Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 13
- 238000012549 training Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 10
- 238000005457 optimization Methods 0.000 description 9
- YTZSZWSGFJFFKD-UHFFFAOYSA-N 1-(2-hydroxyethoxymethyl)-6-phenylsulfanylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)N(COCCO)C(SC=2C=CC=CC=2)=C1 YTZSZWSGFJFFKD-UHFFFAOYSA-N 0.000 description 8
- 238000003384 imaging method Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005286 illumination Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052754 neon Inorganic materials 0.000 description 1
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Processing (AREA)
Abstract
本公开涉及一种图像处理方法及装置、电子设备和存储介质,所述方法包括:根据模糊图像和所述模糊图像对应的模糊核,确定所述模糊图像对应的权重矩阵,所述权重矩阵中包括所述模糊图像中的像素点对应的置信度值,像素点i对应的置信度值小于预设置信度阈值,所述像素点i是所述模糊图像中的饱和像素点,和/或,所述像素点i是所述模糊图像中受所述饱和像素点影响的非饱和像素点;根据所述模糊图像,确定所述模糊图像对应的超参数,所述超参数用于对所述模糊图像进行去模糊处理;根据所述模糊核、所述权重矩阵和所述超参数,对所述模糊图像进行迭代去模糊处理,得到所述模糊图像对应的目标清晰图像。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种图像处理方法及装置、电子设备和存储介质。
背景技术
图像非盲去模糊是指给定模糊核,从模糊图像中恢复出清晰图像的过程,是计算机视觉和图像处理领域的热门研究话题。在弱光条件下(例如,夜间)拍摄图像时,由于受到光照和曝光时间的影响,拍摄得到的图像往往既存在一定程度的模糊,同时也存在一定量的饱和像素点。区别于非饱和像素点,对饱和像素点而言,它们的成像过程不符合线性图像模糊模型。因此,在对包含饱和像素点的模糊图像进行去模糊的情况下,受到饱和像素点的影响,导致去模糊效果较差。
发明内容
本公开提出了一种图像处理方法及装置、电子设备和存储介质的技术方案。
根据本公开的一方面,提供了一种图像处理方法,包括:根据模糊图像和所述模糊图像对应的模糊核,确定所述模糊图像对应的权重矩阵,所述权重矩阵中包括所述模糊图像中的像素点对应的置信度值,像素点i对应的置信度值小于预设置信度阈值,所述像素点i是所述模糊图像中的饱和像素点,和/或,所述像素点i是所述模糊图像中受所述饱和像素点影响的非饱和像素点;根据所述模糊图像,确定所述模糊图像对应的超参数,所述超参数用于对所述模糊图像进行去模糊处理;根据所述模糊核、所述权重矩阵和所述超参数,对所述模糊图像进行迭代去模糊处理,得到所述模糊图像对应的目标清晰图像。
根据模糊图像和模糊图像对应的模糊核,确定模糊图像对应的权重矩阵,以及确定超参数,由于权重矩阵可以使得模糊图像中的饱和像素点,和/或,模糊图像中受饱和像素点影响的非饱和像素点对应的置信度值,小于预设置信度阈值,从而可以降低饱和像素点对图像去模糊过程的影响,超参数可以降低图像去模糊过程的噪声影响,使得根据模糊核、权重矩阵和超参数,对模糊图像进行迭代去模糊处理之后,可以得到清晰度较高的目标清晰图像,从而有效提高了对包含饱和像素点的模糊图像的去模糊效果。
在一种可能的实现方式中,所述像素点i对应的置信度值小于像素点j对应的置信度值,所述像素点j是所述模糊图像中不受所述饱和像素点影响的非饱和像素点。
通过权重矩阵,为模糊图像中的饱和像素点,和/或,模糊图像中受饱和像素点影响的非饱和像素点,确定较低的置信度值,以及为模糊图像中不受饱和像素点影响的非饱和像素点确定较高的置信度值,以使得可以降低饱和像素点,和/或受饱和像素点影响的非饱和像素点,对图像去模糊过程的贡献,以及提高不受饱和像素点影响的非饱和像素点对图像去模糊过程中的贡献,从而可以提高去模糊效果。
在一种可能的实现方式中,所述像素点i对应的置信度值是0。
通过权重矩阵,直接为模糊图像中的饱和像素点,和/或,模糊图像中受饱和像素点影响的非饱和像素点,确定是0的置信度值,以使得可以将饱和像素点和/或受饱和像素点影响的非饱和像素点,对图像去模糊过程的影响降到最低,从而可以提高去模糊效果。
在一种可能的实现方式中,所述根据模糊图像和所述模糊图像对应的模糊核,确定所述模糊图像对应的权重矩阵,包括:根据所述模糊图像和所述模糊核,确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个权重矩阵Mt,t是大于或等于0的整数;所述根据所述模糊图像,确定所述模糊图像对应的超参数,包括:根据所述模糊图像,确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个超参数λt。
针对每次迭代优化过程,均确定用于本次迭代优化的权重矩阵和超参数,以在本次迭代优化过程中降低饱和像素点和噪声对图像去模糊的影响,从而可以提高本次迭代优化过程的去模糊效果。
在一种可能的实现方式中,所述根据所述模糊图像和所述模糊核,确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个权重矩阵Mt,包括:在t大于或等于1的情况下,根据所述模糊图像、所述模糊核,以及第t个预测清晰图像It,确定所述第t个权重矩阵Mt,所述第t个预测清晰图像It是对所述模糊图像进行第t次去模糊处理后生成的;在t=0的情况下,第0个权重矩阵M0是全0矩阵。
利用模糊图像、模糊核以及上一次迭代去模糊处理后生成的预测清晰图像,自动估计用于进行下一次迭代去模糊处理的权重矩阵,降低了去模糊过程所用的时间,从而既可以提高去模糊效果,又可以提高去模糊效率。
在一种可能的实现方式中,所述根据所述模糊图像,确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个超参数λt,包括:根据所述第t个预测清晰图像It,以及第t个隐藏状态张量HSt,确定所述第t个超参数λt,以及第(t+1)个隐藏状态张量HSt+1;其中,在t=0的情况下,第0个预测清晰图像I0是所述模糊图像,第0个隐藏状态张量HS0是全0矩阵。
利用上一次迭代去模糊处理后生成的预测清晰图像以及隐藏状态张量,动态的自动估计用于进行下一次迭代去模糊处理的超参数,降低了去模糊过程所用的时间,从而既可以提高去模糊效果,又可以提高去模糊效率。
在一种可能的实现方式中,所述根据所述模糊核、所述权重矩阵和所述超参数,对所述模糊图像进行迭代去模糊处理,得到所述模糊图像对应的目标清晰图像,包括:确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个先验图像Ut;根据所述模糊核、所述第t个权重矩阵Mt、所述第t个超参数λt和所述第t个先验图像Ut,对所述模糊图像进行第(t+1)次去模糊处理,生成第(t+1)个预测清晰图像It+1;在(t+1)达到预设迭代次数的情况下,将所述第(t+1)个预测清晰图像It+1确定为所述目标清晰图像。
根据模糊核、权重矩阵、超参数以及先验图像,对模糊图像进行多次迭代去模糊处理,降低了饱和像素点和噪声对图像去模糊过程的影响,可以得到清晰度较高的目标清晰图像,从而有效提高了对包含饱和像素点的模糊图像的去模糊效果。
在一种可能的实现方式中,所述确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个先验图像Ut,包括:在t大于或等于1的情况下,对第t个预测清晰图像It进行降噪处理,生成所述第t个先验图像Ut,所述第t个预测清晰图像是对所述模糊图像进行第t次去模糊处理后生成的;在t=0的情况下,第0个先验图像U0是全0矩阵。
在图像去模糊过程中,利用上一次迭代去模糊处理后生成的预测清晰图像,自动估计用于进行下一次迭代去模糊处理的先验图像,以使得可以规范化图像去模糊的求解空间,从而可以有效提高图像去模糊效果。
在一种可能的实现方式中,所述根据所述模糊核、所述第t个权重矩阵Mt、所述第t个超参数λt和所述第t个先验图像Ut,对所述模糊图像进行第(t+1)次去模糊处理,生成第(t+1)个预测清晰图像,包括:根据所述模糊图像、所述模糊核、所述第t个预测清晰图像It、所述第t个权重矩阵Mt、所述第t个超参数λt和所述第t个先验图像Ut,执行基于共轭梯度下降的反卷积处理,生成所述第(t+1)个预测清晰图像It+1。
由于图像去模糊过程中涉及Hadamard乘积,无法通过快速傅里叶变换(FastFourier Transformation,FFT)进行图像去模糊处理,因此,可以基于共轭梯度下降的反卷积处理,以快速实现对模糊图像进行多次迭代去模糊处理。
在一种可能的实现方式中,所述图像处理方法通过图像去模糊神经网络实现。
将模糊图像和模糊图像对应的模糊核输入图像去模糊神经网络,利用图像去模糊网络进行图像去模糊过程,以使得可以直接输出去模糊后得到的目标清晰图像,从而有效提高了图像去模糊的效率。
根据本公开的一方面,提供了一种图像处理装置,包括:第一确定模块,用于根据模糊图像和所述模糊图像对应的模糊核,确定所述模糊图像对应的权重矩阵,所述权重矩阵中包括所述模糊图像中的像素点对应的置信度值,像素点i对应的置信度值小于预设置信度阈值,所述像素点i是所述模糊图像中的饱和像素点,和/或,所述像素点i是所述模糊图像中受所述饱和像素点影响的非饱和像素点;第二确定模块,用于根据所述模糊图像,确定所述模糊图像对应的超参数,所述超参数用于对所述模糊图像进行去模糊处理;去模糊处理模块,用于根据所述模糊核、所述权重矩阵和所述超参数,对所述模糊图像进行迭代去模糊处理,得到所述模糊图像对应的目标清晰图像。
根据本公开的一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出根据本公开实施例的一种图像处理方法的流程图;
图2示出根据本公开实施例的一种图像去模糊神经网络的示意图;
图3示出根据本公开实施例的一种图像处理装置的框图;
图4示出根据本公开实施例的一种电子设备的框图;
图5示出根据本公开实施例的一种电子设备的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出根据本公开实施例的一种图像处理方法的流程图。该图像处理方法可以由终端设备或服务器等电子设备执行,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等,该图像处理方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。或者,可通过服务器执行该图像处理方法。如图1所示,该图像处理方法包括:
S11、根据模糊图像和模糊图像对应的模糊核,确定模糊图像对应的权重矩阵,权重矩阵中包括模糊图像中的像素点对应的置信度值,像素点i对应的置信度值小于预设置信度阈值,像素点i是模糊图像中的饱和像素点,和/或,像素点i是模糊图像中受饱和像素点影响的非饱和像素点。
模糊图像可以是图像采集设备在弱光条件下(例如,夜间)拍摄得到的,由于弱光条件下照明不足,图像采集设备为了达到正常曝光,需要增加曝光时间或增加感光度,但是,增加曝光时间可能会导致拍摄过程出现抖动而造成图像模糊,而增加感光度可能会使图像噪声变多。
此外,弱光条件下的照明不良的场景,通常都具有场景动态范围比较大的特性,例如,在夜景图像中,经常会有路灯或霓虹灯等非常量的区域,以及其它相对照明不足的暗区域,因此,即使在合理的曝光时间内,弱光条件下拍摄得到的图像,也会出现某些区域比较亮而某些区域比较暗。对于一般的图像而言,单个颜色通道的动态范围是0-255。对于动态范围较大的场景,非常明亮的区域会因为超出图像采集设备的动态范围而被截止到图像采集设备能够输出的最大值(例如,输出灰度值为255),这些因超过图像采集设备动态范围而被截止的像素点被称为饱和像素点。
由于弱光条件下拍摄得到的图像往往既存在一定程度的模糊,同时也存在一定量的饱和像素点,而饱和像素点的成像过程是非线性的,因此,在模糊图像对应的模糊核已知,利用模糊核对模糊图像进行非盲去模糊的情况下,为了降低饱和像素点对图像去模糊过程的影响,需要根据模糊图像和模糊图像对应的模糊核,确定包括模糊图像中的像素点对应的置信度值的权重矩阵,利用权重矩阵,使得模糊图像中的饱和像素点,和/或,模糊图像中受饱和像素点影响的非饱和像素点,在图像去模糊过程中的置信度值小于预设置信度阈值,以降低饱和像素点对图像去模糊过程的影响。后文会结合本公开可能的实现方式,对确定权重矩阵的过程做详细描述,此处不作赘述。
S12、根据模糊图像,确定模糊图像对应的超参数,超参数用于对模糊图像进行去模糊处理。
结合上述描述可知,弱光条件下拍摄得到的图像往往既存在一定程度的模糊,同时存在较多的噪声,因此,为了降低噪声对图像去模糊过程的影响,需要确定用于对模糊图像进行去模糊处理的超参数,以降低图像去模糊过程的噪声影响的超参数。后文会结合本公开可能的实现方式,对确定超参数的过程做详细描述,此处不作赘述。
S13、根据模糊核、权重矩阵和超参数,对模糊图像进行迭代去模糊处理,得到模糊图像对应的目标清晰图像。
由于模糊核已知,对模糊图像进行迭代去模糊处理的过程为非盲去模糊处理过程,下述简称为去模糊处理过程。后文会结合本公开可能的实现方式,对迭代去模糊处理过程进行详细描述,此处不作赘述。
在本公开实施例中,根据模糊图像和模糊图像对应的模糊核,确定模糊图像对应的权重矩阵,以及确定超参数,由于权重矩阵可以使得模糊图像中的饱和像素点,和/或,模糊图像中受饱和像素点影响的非饱和像素点对应的置信度值,小于预设置信度阈值,从而可以降低饱和像素点对图像去模糊过程的影响,超参数可以降低图像去模糊过程的噪声影响,使得根据模糊核、权重矩阵和超参数,对模糊图像进行迭代去模糊处理之后,可以得到清晰度较高的目标清晰图像,从而有效提高了对包含饱和像素点的模糊图像的去模糊效果。
在一种可能的实现方式中,像素点i对应的置信度值小于像素点j对应的置信度值,像素点j是模糊图像中不受饱和像素点影响的非饱和像素点。
通过权重矩阵,为模糊图像中的饱和像素点,和/或,模糊图像中受饱和像素点影响的非饱和像素点,确定较低的置信度值,以及为模糊图像中不受饱和像素点影响的非饱和像素点确定较高的置信度值,以使得可以降低饱和像素点,和/或受饱和像素点影响的非饱和像素点,对图像去模糊过程的贡献,以及提高不受饱和像素点影响的非饱和像素点对图像去模糊过程中的贡献,从而可以提高去模糊效果。
在一种可能的实现方式中,像素点i对应的置信度值是0。
通过权重矩阵,直接为模糊图像中的饱和像素点,和/或,模糊图像中受饱和像素点影响的非饱和像素点,确定是0的置信度值,以使得可以将饱和像素点,和/或,受饱和像素点影响的非饱和像素点,对图像去模糊过程的影响降到最低,从而可以提高去模糊效果。
在一种可能的实现方式中,该图像处理方法通过图像去模糊神经网络实现。
将模糊图像和模糊图像对应的模糊核输入图像去模糊神经网络,利用图像去模糊网络进行图像去模糊过程,以使得可以直接输出去模糊后得到的目标清晰图像,从而有效提高了图像去模糊的效率。
在一种可能的实现方式中,根据模糊图像和模糊图像对应的模糊核,确定模糊图像对应的权重矩阵,包括:根据模糊图像和模糊核,利用图像去模糊神经网络,确定权重矩阵。
与相关技术中需要人工设计复杂函数来定义权重矩阵的方式相比,本公开可以利用图像去模糊神经网络,自动估计权重矩阵,降低了去模糊过程所用的时间,从而使得既可以提高去模糊效果,又可以提高去模糊效率。
在一种可能的实现方式中,根据模糊图像,确定模糊图像对应的超参数,包括:根据模糊图像,利用图像去模糊神经网络,确定超参数。
与相关技术中需要手动进行超参数调整的方式相比,本公开可以利用图像去模糊神经网络,自动估计超参数,降低了去模糊过程所用的时间,从而使得既可以提高去模糊效果,又可以提高去模糊效率。
图2示出根据本公开实施例的一种图像去模糊神经网络的示意图。如图2所示,图像去模糊神经网络中包括权重矩阵估计模块(Confidence Estimation Unit,CEU)和超参数估计模块(Hyper-Parameter Estimation Unit,HPEU)。CEU模块用于在图像去模糊过程中进行权重矩阵估计,HPEU模块用于在图像去模糊过程中进行超参数估计。
在一示例中,线性图像成像过程可以通过下述公式(1)表示:
针对包含饱和像素点的模糊图像,由于饱和像素点的成像过程是非线性的,则在利用公式(1)所示的线性图像成像过程来进行图像去模糊处理时,可以通过权重矩阵M来降低饱和像素点对图像去模糊过程的影响,则图像去模糊过程可以通过下述公式(2)标示:
在一种可能的实现方式中,根据模糊图像和模糊图像对应的模糊核,确定模糊图像对应的权重矩阵,包括:根据模糊图像和模糊核,确定用于对模糊图像进行第(t+1)次去模糊处理的第t个权重矩阵Mt,t是大于或等于0的整数;根据模糊图像,确定模糊图像对应的超参数,包括:根据模糊图像,确定用于对模糊图像进行第(t+1)次去模糊处理的第t个超参数λt。
图像去模糊处理过程是对模糊图像进行多次迭代优化的过程,因此,针对每次迭代优化过程,均确定用于本次迭代优化的权重矩阵和超参数,以在本次迭代优化过程中降低饱和像素点和噪声对图像去模糊的影响,从而可以提高本次迭代优化过程的去模糊效果。
仍以上述图2为例,如图2所示,在进行第1次去模糊处理之前,确定用于进行第1次去模糊处理的第0个权重矩阵M0和第0个超参数λ0;在进行第2次去模糊处理之前,确定用于进行第2次去模糊处理的第1个权重矩阵M1和第1个超参数λ1;以此类推,直至迭代去模糊过程结束。
利用图像去模糊神经网络,通过下述公式(3)-(5)来执行迭代去模糊处理过程:
在一种可能的实现方式中,根据模糊图像和模糊核,确定用于对模糊图像进行第(t+1)次去模糊处理的第t个权重矩阵Mt,包括:在t大于或等于1的情况下,根据模糊图像、模糊核,以及第t个预测清晰图像It,确定第t个权重矩阵Mt,第t个预测清晰图像It是对模糊图像进行第t次去模糊处理后生成的;在t=0的情况下,第0个权重矩阵M0是全0矩阵。
相比于相关技术中需要人工设计复杂函数来定义权重矩阵的方式,本公开利用模糊图像、模糊核以及上一次迭代去模糊处理后生成的预测清晰图像,自动估计用于进行下一次迭代去模糊处理的权重矩阵,降低了去模糊过程所用的时间,从而既可以提高去模糊效果,又可以提高去模糊效率。
在一示例中,可以利用图像去模糊神经网络和公式(3),根据模糊图像、模糊核以及上一次迭代去模糊处理后生成的预测清晰图像,自动估计用于进行下一次迭代去模糊处理的权重矩阵。仍以上述图2为例,如图2所示,在t=1的情况下,将模糊图像B、第1个预测清晰图像I1(上一次迭代去模糊处理后生成的预测清晰图像)、以及第1个预测清晰图像I1和模糊核K的卷积结果输入图像去模糊神经网络中的CEU模块,则CEU模块可以直接输出用于对模糊图像进行第2次去模糊处理(下一次迭代去模糊处理)的第1个权重矩阵M1。
在一示例中,CEU模块的具体网络结构可以包括三个残差(residual,res)子模块,每个res子模块可以包括两个卷积层,以及在后一个卷积层之后设置一个线性整流层(Rectified Linear Unit,ReLU)和一个激活层。CEU模块的具体网络结构除了可以是上述网络结构之外,还可以根据实际情况设置为其它网络结构,本公开对此不作具体限定。
仍以上述图2为例,在t=0的情况下,也就是在未对模糊图像进行迭代去模糊处理的初始化阶段,可以将用于对模糊图像进行第1次去模糊处理的第0个权重矩阵M0初始化为全0矩阵。第0个权重矩阵M0还可以根据实际情况初始化为其它取值,本公开对此不作具体限定。
在一种可能的实现方式中,根据模糊图像,确定用于对模糊图像进行第(t+1)次去模糊处理的第t个超参数λt,包括:根据第t个预测清晰图像It,以及第t个隐藏状态张量HSt,确定第t个超参数λt,以及第(t+1)个隐藏状态张量HSt+1;其中,在t=0的情况下,第0个预测清晰图像I0是模糊图像,第0个隐藏状态张量HS0是全0矩阵。
相比于相关技术中在图像去模糊过程中需要手动进行超参数调整或设置固定超参数的方式,本公开利用上一次迭代去模糊处理后生成的预测清晰图像以及隐藏状态张量,动态的自动估计用于进行下一次迭代去模糊处理的超参数,降低了去模糊过程所用的时间,从而既可以提高去模糊效果,又可以提高去模糊效率。
在一示例中,可以利用图像去模糊神经网络,根据上一次迭代去模糊处理后生成的预测清晰图像以及隐藏状态张量,自动估计用于进行下一次迭代去模糊处理的超参数。仍以上述图2为例,如图2所示,在t=1的情况下,将第1个预测清晰图像I1(上一次迭代去模糊处理后生成的预测清晰图像),以及第1个隐藏状态张量HS1输入图像去模糊神经网络中的HEPU模块,则HEPU模块可以直接输出用于对模糊图像进行第2次去模糊处理(下一次迭代去模糊处理)的第1个超参数λ1。
在一示例中,HEPU模块的具体网络结构可以包括八个卷积层、一个自适应池化层,以及一个完全连接层。HEPU模块的具体网络结构除了可以是上述网络结构之外,还可以根据实际情况设置为其它网络结构,本公开对此不作具体限定。
在一示例中,隐藏状态张量是图像去模糊神经网络为了自动估计超参数而引入的参数,用于指示超参数估计过程中的状态信息。仍以上述图2为例,在t=0的情况下,也就是在未对模糊图像进行迭代去模糊处理的初始化阶段,第0个预测清晰图像I0初始化为模糊图像,第0个隐藏状态张量HS0初始化为全0矩阵,进而将第0个预测清晰图像I0和第0个隐藏状态张量HS0输入HEPU模块,以使得HEPU模块自动估计得到用于对模糊图像进行第1次去模糊处理的第0个超参数λ0,以及用于对下一次(第2次)迭代去模糊处理中用到的超参数λ1进行估计的第1个隐藏状态张量HS1。第0个预测清晰图像I0和第0个隐藏状态张量HS0还可以根据实际情况初始化为其它取值,本公开对此不作具体限定。
在一种可能的实现方式中,根据模糊核、权重矩阵和超参数,对模糊图像进行迭代去模糊处理,得到模糊图像对应的目标清晰图像,包括:确定用于对模糊图像进行第(t+1)次去模糊处理的第t个先验图像Ut;根据模糊核、第t个权重矩阵Mt、第t个超参数λt和第t个先验图像Ut,对模糊图像进行第(t+1)次去模糊处理,生成第(t+1)个预测清晰图像It+1;在(t+1)达到预设迭代次数的情况下,将第(t+1)个预测清晰图像It+1确定为目标清晰图像。
根据模糊核、权重矩阵、超参数以及先验图像,对模糊图像进行多次迭代去模糊处理,降低了饱和像素点和噪声对图像去模糊过程的影响,可以得到清晰度较高的目标清晰图像,从而有效提高了对包含饱和像素点的模糊图像的去模糊效果。
在一示例中,利用图像去模糊神经网络对包含饱和像素点的模糊图像进行多次迭代去模糊处理之前,图像去模糊神经网络中可以预先设置迭代次数tmax,在对模糊图像进行(t+1)次迭代去模糊处理,且(t+1)达到预设迭代次数tmax的情况下,结束迭代去模糊处理过程,并将对模糊图像进行(t+1)次迭代去模糊处理后生成的第(t+1)个预测清晰图像It+1,确定为目标清晰图像,即模糊图像进行非盲去模糊处理之后最终得到的清晰图像。仍以上述图2为例,如图2所示,在(t+1)达到预设迭代次数的情况下,将第(t+1)个预测清晰图像It+1确定为目标清晰图像I*。
预设迭代次数tmax的具体取值可以是经验性设置得到的,也可以是根据去模糊过程的实际情况进行设置得到的,本公开对此不作具体限定。
在一种可能的实现方式中,在(t+1)未达到预设迭代次数,且第(t+1)个预测清晰图像It+1和第t个预测清晰图像It之间的差值小于阈值的情况下,将第(t+1)个预测清晰图像It+1确定为目标清晰图像。
在(t+1)未达到预设迭代次数,且第(t+1)个预测清晰图像It+1和第t个预测清晰图像It之间的差值小于阈值的情况下,表示迭代去模糊处理已经提前达到收敛,则可以提前结束迭代去模糊处理过程。阈值的具体取值可以根据实际情况确定,本公开对此不作具体限定。
例如,预设迭代次数tmax=50,对模糊图像进行第30(t=30<tmax)次去模糊处理后生成的第30个预测清晰图像I30,和对模糊图像进行第31(t+1=31<tmax)次去模糊处理生成的第31个预测清晰图像I31,之间的差值小于阈值,表示迭代去模糊处理已经提前达到收敛,则可以提前结束迭代去模糊处理过程,将第31个预测清晰图像I31,确定为目标清晰图像,即无需再对模糊图像进行第32次至第50次的迭代去模糊处理过程。
在一种可能的实现方式中,确定用于对模糊图像进行第(t+1)次去模糊处理的第t个先验图像Ut,包括:在t大于或等于1的情况下,对第t个预测清晰图像It进行降噪处理,生成第t个先验图像Ut,第t个预测清晰图像是对模糊图像进行第t次去模糊处理后生成的;在t=0的情况下,第0个先验图像U0是全0矩阵。
在图像去模糊过程中,利用上一次迭代去模糊处理后生成的预测清晰图像,自动估计用于进行下一次迭代去模糊处理的先验图像,以使得可以规范化图像去模糊的求解空间,从而可以有效提高图像去模糊效果。
在一示例中,可以利用图像去模糊神经网络和公式(4),根据上一次迭代去模糊处理后生成的预测清晰图像,自动估计用于进行下一次迭代去模糊处理的先验图像。仍以上述图2为例,如图2所示,在图像去模糊神经网络中还包括先验图像估计模块(LearnedRegularization Unit,LRU),LRU模块用于在图像去模糊过程中进行先验图像估计。如图2所示,在t=1的情况下,将第1个预测清晰图像I1(上一次迭代去模糊处理后生成的预测清晰图像),输入图像去模糊神经网络中的LRU模块,则LRU模块可以直接输出用于对模糊图像进行第2次去模糊处理(下一次迭代去模糊处理)的第1个先验图像U1。其中,第1个先验图像U1为对第1个预测清晰图像I1去除噪声、振铃、伪影后的结果。
在一示例中,LRU模块的具体网络结构可以包括三阶轻量级U-Net子模块,每个U-Net子模块可以包括对应多个尺度的卷积层,每个尺度可以对应两个卷积层,以及在后一个卷积层之后设置用于激活的ReLU层,多个尺度可以根据实际情况确定,本公开对此不作具体限定。LRU模块的具体网络结构除了可以是上述网络结构之外,还可以根据实际情况设置为其它网络结构,本公开对此不作具体限定。
仍以上述图2为例,在t=0的情况下,也就是在未对模糊图像进行迭代去模糊处理的初始化阶段,可以将用于对模糊图像进行第1次去模糊处理的第0个先验图像U0初始化为全0矩阵。第0个先验图像U0还可以根据实际情况初始化为其它取值,本公开对此不作具体限定。
在一种可能的实现方式中,根据模糊核、第t个权重矩阵Mt、第t个超参数λt和第t个先验图像Ut,对模糊图像进行第(t+1)次去模糊处理,生成第(t+1)个预测清晰图像,包括:根据模糊图像、模糊核、第t个预测清晰图像It、第t个权重矩阵Mt、第t个超参数λt和第t个先验图像Ut,执行基于共轭梯度下降的反卷积处理,生成第(t+1)个预测清晰图像It+1。
由于图像去模糊过程中涉及Hadamard乘积,无法通过快速傅里叶变换(FastFourier Transformation,FFT)进行图像去模糊处理,因此,可以基于共轭梯度下降的反卷积处理,以快速实现对模糊图像进行多次迭代去模糊处理。
仍以上述图2为例,如图2所示,在图像去模糊神经网络中还包括共轭梯度模块(Conjugate-Gradient,CG),CG模块用于对模糊图像进行基于共轭梯度下降的反卷积处理。如图2所示,在t=1的情况下,将模糊图像B、模糊核K、第1个预测清晰图像I1(上一次迭代去模糊处理后生成的预测清晰图像)、第1个权重矩阵M1、第1个超参数λ1以及第1个先验图像U1,输入图像去模糊神经网络中的CG模块,则CG模块根据公式(5),可以直接输出本次迭代去模糊处理得到的第2个预测清晰图像I2。
在一示例中,图像去模糊神经网络中可以预先设置CG模块对应的梯度下降次数smax,CG模块基于输入执行smax次共轭梯度下降的反卷积处理之后,输出本次迭代去模糊处理的预测清晰图像。预设梯度下降次数smax的具体取值可以根据实际情况确定,本公开对此不作具体限定。
本公开实施例中,利用图像去模糊神经网络中的CEU模块、LRU模块、HEPU模块以及CG模块,可以实现对包含饱和像素点的模糊图像的非盲去模糊处理,得到清晰度较高的目标清晰图像,有效提高了对包含饱和像素点的模糊图像的去模糊效果,且提高了去模糊效率。
在一种可能的实现方式中,图像去模糊神经网络的训练样本包括:多个模糊样本图像,以及多个模糊样本图像对应的参考清晰图像;该图像处理方法还包括:根据多个模糊样本图像,以及多个模糊样本图像对应的参考清晰图像,对图像去模糊神经网络进行训练,得到训练后的图像去模糊神经网络。
在一示例中,首先构建用于对图像去模糊神经网络进行网络训练的训练样本。例如,训练样本中包括N个模糊样本图像(模糊样本图像中既存在一定程度的模糊,同时也存在一定量的饱和像素点),以及N个模糊样本图像对应的参考清晰图像。模糊样本图像对应的参考清晰图像可以为模糊样本图像对应的理想清晰图像。训练样本中包括的模糊样本图像的数量N的具体取值可以根据实际情况确定,本公开对此不作具体限定。通过最小化下述公式(6)所示的损失函数来实现对图像去模糊神经网络的训练:
其中,N是模糊样本图像的数量,tmax是图像去模糊神经网络对应的预设迭代次数,是LRU模块输出的第i个模糊样本图像对应的第t个先验图像,是CG模块输出的第i个模糊样本图像经过第(t+1)次去模糊图像处理后生成的第(t+1)个预测清晰图像,是CG模块输出的第i个模糊样本图像经过tmax次去模糊图像处理后生成的目标清晰图像,是第i个模糊样本图像对应的参考清晰图像,||·||1表示L1范数运算符号。
在对图像去模糊神经网络的训练过程中,首先,固定CEU模块对应的权重矩阵M为1,进而通过最小化上述公式(6)所示损失函数中的第一项来初步训练LEU模块,得到LRU模块对应的初步网络参数;然后,利用LRU模块对应的初步网络参数,通过最小化上述公式(6)所示损失函数的第二项来初步训练CEU模块,得到CEU模块对应的初步网络参数;最后,利用LRU模块对应的初步网络参数和CEU模块对应的初步网络参数,通过最小化上述公式(6)所示损失函数的第三项来训练图像去模糊神经网络中的各模块,即调整图像去模糊网络中CEU模块、LRU模块、HEPU模块以及CG模块中的网络参数,得到最终训练后的图像去模糊神经网络。
其中,在对LRU模块和CEU模块进行初步训练的过程中,可以基于相同的超参数设置策略来设置超参数λ,且确保λt+1大于λt。超参数设置策略可以根据实际情况进行设置,本公开对此不作具体限定。对图像去模糊神经网络进行训练时的损失函数除了可以是上述公式(6)所示形式外,还可以根据实际情况确定为其它形式,本公开对此不作具体限定。
利用训练好的图像去模糊神经网络,可以对包含饱和像素点的模糊图像进行非盲去模糊处理,并得到清晰度较高的目标清晰图像,有效提高了对包含饱和像素点的模糊图像的去模糊效果,且提高了去模糊效率。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了图像处理装置、电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种图像处理方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。
图3示出根据本公开实施例的一种图像处理装置的框图。如图3所示,装置30包括:
第一确定模块31,用于根据模糊图像和模糊图像对应的模糊核,确定模糊图像对应的权重矩阵,权重矩阵中包括模糊图像中的像素点对应的置信度值,像素点i对应的置信度值小于预设置信度阈值,像素点i是模糊图像中的饱和像素点,和/或,像素点i是模糊图像中受饱和像素点影响的非饱和像素点;
第二确定模块32,用于根据模糊图像,确定模糊图像对应的超参数,超参数用于对模糊图像进行去模糊处理;
去模糊处理模块33,用于根据模糊核、权重矩阵和超参数,对模糊图像进行迭代去模糊处理,得到模糊图像对应的目标清晰图像。
在一种可能的实现方式中,像素点i对应的置信度值小于像素点j对应的置信度值,像素点j是模糊图像中不受饱和像素点影响的非饱和像素点。
在一种可能的实现方式中,像素点i对应的置信度值是0。
在一种可能的实现方式中,第一确定模块31,包括:
第一确定子模块,用于根据模糊图像和模糊核,确定用于对模糊图像进行第(t+1)次去模糊处理的第t个权重矩阵Mt,t是大于或等于0的整数;
第二确定模块32,包括:
第二确定子模块,用于根据模糊图像,确定用于对模糊图像进行第(t+1)次去模糊处理的第t个超参数λt。
在一种可能的实现方式中,第一确定子模块,具体用于:
在t大于或等于1的情况下,根据模糊图像、模糊核,以及第t个预测清晰图像It,确定第t个权重矩阵Mt,第t个预测清晰图像It是对模糊图像进行第t次去模糊处理后生成的;
在t=0的情况下,第0个权重矩阵M0是全0矩阵。
在一种可能的实现方式中,第二确定子模块,具体用于:
根据第t个预测清晰图像It,以及第t个隐藏状态张量HSt,确定第t个超参数λt,以及第(t+1)个隐藏状态张量HSt+1;
其中,在t=0的情况下,第0个预测清晰图像I0是模糊图像,第0个隐藏状态张量HS0是全0矩阵。
在一种可能的实现方式中,去模糊处理模块33,包括:
第三确定子模块,用于确定用于对模糊图像进行第(t+1)次去模糊处理的第t个先验图像Ut;
去模糊处理子模块,用于根据模糊核、第t个权重矩阵Mt、第t个超参数λt和第t个先验图像Ut,对模糊图像进行第(t+1)次去模糊处理,生成第(t+1)个预测清晰图像It+1;
第四确定子模块,用于在(t+1)达到预设迭代次数的情况下,将第(t+1)个预测清晰图像It+1确定为目标清晰图像。
在一种可能的实现方式中,第三确定子模块,具体用于:
在t大于或等于1的情况下,对第t个预测清晰图像It进行降噪处理,生成第t个先验图像Ut,第t个预测清晰图像是对模糊图像进行第t次去模糊处理后生成的;
在t=0的情况下,第0个先验图像U0是全0矩阵。
在一种可能的实现方式中,去模糊处理子模块,具体用于:
根据模糊图像、模糊核、第t个预测清晰图像It、第t个权重矩阵Mt、第t个超参数λt和第t个先验图像Ut,执行基于共轭梯度下降的反卷积处理,生成第(t+1)个预测清晰图像It +1。
在一种可能的实现方式中,图像处理装置30通过图像去模糊神经网络执行图像处理方法。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,当计算机可读代码在设备上运行时,设备中的处理器执行用于实现如上任一实施例提供的图像处理方法的指令。
本公开实施例还提供了另一种计算机程序产品,用于存储计算机可读指令,指令被执行时使得计算机执行上述任一实施例提供的图像处理方法的操作。
电子设备可以被提供为终端、服务器或其它形态的设备。
图4示出根据本公开实施例的一种电子设备的框图。如图4所示,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等终端。
参照图4,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到电子设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如互补金属氧化物半导体(CMOS)或电荷耦合装置(CCD)图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如无线网络(WiFi),第二代移动通信技术(2G)或第三代移动通信技术(3G),或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器804,上述计算机程序指令可由电子设备800的处理器820执行以完成上述方法。
图5示出根据本公开实施例的一种电子设备的框图。如图5所示,电子设备1900可以被提供为一服务器。参照图5,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如微软服务器操作系统(Windows ServerTM),苹果公司推出的基于图形用户界面操作系统(Mac OSXTM),多用户多进程的计算机操作系统(UnixTM),自由和开放原代码的类Unix操作系统(LinuxTM),开放原代码的类Unix操作系统(FreeBSDTM)或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是(但不限于)电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (11)
1.一种图像处理方法,其特征在于,包括:
根据模糊图像和所述模糊图像对应的模糊核,确定所述模糊图像对应的权重矩阵,所述权重矩阵中包括所述模糊图像中的像素点对应的置信度值,像素点i对应的置信度值小于预设置信度阈值,所述像素点i是所述模糊图像中的饱和像素点,和/或,所述像素点i是所述模糊图像中受所述饱和像素点影响的非饱和像素点;
根据所述模糊图像,确定所述模糊图像对应的超参数,所述超参数用于对所述模糊图像进行去模糊处理;
根据所述模糊核、所述权重矩阵和所述超参数,对所述模糊图像进行迭代去模糊处理,得到所述模糊图像对应的目标清晰图像;
其中,所述根据模糊图像和所述模糊图像对应的模糊核,确定所述模糊图像对应的权重矩阵,包括:
根据所述模糊图像和所述模糊核,确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个权重矩阵Mt,t是大于或等于0的整数;
所述根据所述模糊图像,确定所述模糊图像对应的超参数,包括:
根据所述模糊图像,确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个超参数λt;
所述根据所述模糊核、所述权重矩阵和所述超参数,对所述模糊图像进行迭代去模糊处理,得到所述模糊图像对应的目标清晰图像,包括:
确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个先验图像Ut;
根据所述模糊核、所述第t个权重矩阵Mt、所述第t个超参数λt和所述第t个先验图像Ut,对所述模糊图像进行第(t+1)次去模糊处理,生成第(t+1)个预测清晰图像It+1;
在(t+1)达到预设迭代次数的情况下,将所述第(t+1)个预测清晰图像It+1确定为所述目标清晰图像。
2.根据权利要求1所述的方法,其特征在于,所述像素点i对应的置信度值小于像素点j对应的置信度值,所述像素点j是所述模糊图像中不受所述饱和像素点影响的非饱和像素点。
3.根据权利要求1或2所述的方法,其特征在于,所述像素点i对应的置信度值是0。
4.根据权利要求1所述的方法,其特征在于,所述根据所述模糊图像和所述模糊核,确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个权重矩阵Mt,包括:
在t大于或等于1的情况下,根据所述模糊图像、所述模糊核,以及第t个预测清晰图像It,确定所述第t个权重矩阵Mt,所述第t个预测清晰图像It是对所述模糊图像进行第t次去模糊处理后生成的;
在t=0的情况下,第0个权重矩阵M0是全0矩阵。
5.根据权利要求1或4所述的方法,其特征在于,所述根据所述模糊图像,确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个超参数λt,包括:
根据所述第t个预测清晰图像It,以及第t个隐藏状态张量HSt,确定所述第t个超参数λt,以及第(t+1)个隐藏状态张量HSt+1;
其中,在t=0的情况下,第0个预测清晰图像I0是所述模糊图像,第0个隐藏状态张量HS0是全0矩阵。
6.根据权利要求1所述的方法,其特征在于,所述确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个先验图像Ut,包括:
在t大于或等于1的情况下,对第t个预测清晰图像It进行降噪处理,生成所述第t个先验图像Ut,所述第t个预测清晰图像是对所述模糊图像进行第t次去模糊处理后生成的;
在t=0的情况下,第0个先验图像U0是全0矩阵。
7.根据权利要求1或6所述的方法,其特征在于,所述根据所述模糊核、所述第t个权重矩阵Mt、所述第t个超参数λt和所述第t个先验图像Ut,对所述模糊图像进行第(t+1)次去模糊处理,生成第(t+1)个预测清晰图像,包括:
根据所述模糊图像、所述模糊核、所述第t个预测清晰图像It、所述第t个权重矩阵Mt、所述第t个超参数λt和所述第t个先验图像Ut,执行基于共轭梯度下降的反卷积处理,生成所述第(t+1)个预测清晰图像It+1。
8.根据权利要求1或2所述的方法,其特征在于,所述图像处理方法通过图像去模糊神经网络实现。
9.一种图像处理装置,其特征在于,包括:
第一确定模块,用于根据模糊图像和所述模糊图像对应的模糊核,确定所述模糊图像对应的权重矩阵,所述权重矩阵中包括所述模糊图像中的像素点对应的置信度值,像素点i对应的置信度值小于预设置信度阈值,所述像素点i是所述模糊图像中的饱和像素点,和/或,所述像素点i是所述模糊图像中受所述饱和像素点影响的非饱和像素点;
第二确定模块,用于根据所述模糊图像,确定所述模糊图像对应的超参数,所述超参数用于对所述模糊图像进行去模糊处理;
去模糊处理模块,用于根据所述模糊核、所述权重矩阵和所述超参数,对所述模糊图像进行迭代去模糊处理,得到所述模糊图像对应的目标清晰图像;
其中,所述第一确定模块,包括:
第一确定子模块,用于根据所述模糊图像和所述模糊核,确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个权重矩阵Mt,t是大于或等于0的整数;
所述第二确定模块,包括:
第二确定子模块,用于根据所述模糊图像,确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个超参数λt;
所述去模糊处理模块,包括:
第三确定子模块,用于确定用于对所述模糊图像进行第(t+1)次去模糊处理的第t个先验图像Ut;
去模糊处理子模块,用于根据所述模糊核、所述第t个权重矩阵Mt、所述第t个超参数λt和所述第t个先验图像Ut,对所述模糊图像进行第(t+1)次去模糊处理,生成第(t+1)个预测清晰图像It+1;
第四确定子模块,用于在(t+1)达到预设迭代次数的情况下,将所述第(t+1)个预测清晰图像It+1确定为所述目标清晰图像。
10.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至8中任意一项所述的方法。
11.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至8中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110461649.3A CN113177890B (zh) | 2021-04-27 | 2021-04-27 | 图像处理方法及装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110461649.3A CN113177890B (zh) | 2021-04-27 | 2021-04-27 | 图像处理方法及装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113177890A CN113177890A (zh) | 2021-07-27 |
CN113177890B true CN113177890B (zh) | 2023-04-18 |
Family
ID=76926811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110461649.3A Active CN113177890B (zh) | 2021-04-27 | 2021-04-27 | 图像处理方法及装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113177890B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116205822B (zh) * | 2023-04-27 | 2023-10-03 | 荣耀终端有限公司 | 一种图像处理的方法、电子设备和计算机可读存储介质 |
CN117079058B (zh) * | 2023-10-11 | 2024-01-09 | 腾讯科技(深圳)有限公司 | 图像处理方法和装置、存储介质及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292842A (zh) * | 2017-06-15 | 2017-10-24 | 北京大学深圳研究生院 | 基于先验约束和离群值抑制的图像去模糊方法 |
CN108564544A (zh) * | 2018-04-11 | 2018-09-21 | 南京邮电大学 | 基于边缘感知的图像盲去模糊组合稀疏优化方法 |
CN109816620A (zh) * | 2019-01-31 | 2019-05-28 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN110502949A (zh) * | 2019-08-09 | 2019-11-26 | 广东技术师范大学 | 一种基于自适应尺度控制的qr码图像快速盲去模糊方法 |
CN110648286A (zh) * | 2019-08-02 | 2020-01-03 | 广东工业大学 | 一种毫米波图像非盲目去模糊的方法 |
CN111047544A (zh) * | 2020-01-08 | 2020-04-21 | 华中科技大学 | 一种基于非线性退化模型的饱和图像去模糊方法 |
CN112200745A (zh) * | 2020-10-13 | 2021-01-08 | 上海商汤智能科技有限公司 | 遥感影像的处理方法及装置、电子设备和存储介质 |
CN112215773A (zh) * | 2020-10-12 | 2021-01-12 | 新疆大学 | 基于视觉显著性的局部运动去模糊方法、装置及存储介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8576446B2 (en) * | 2009-08-21 | 2013-11-05 | Konica Minolta Laboratory U.S.A., Inc. | Deblurring and supervised adaptive thresholding for print-and-scan document image evaluation |
US8390704B2 (en) * | 2009-10-16 | 2013-03-05 | Eastman Kodak Company | Image deblurring using a spatial image prior |
US8867857B2 (en) * | 2011-12-28 | 2014-10-21 | Samsung Electronics Co., Ltd. | Method for restoration of blurred barcode images |
US20170316552A1 (en) * | 2016-04-27 | 2017-11-02 | Ramot At Tel-Aviv University Ltd. | Blind image deblurring via progressive removal of blur residual |
CN105976332B (zh) * | 2016-05-03 | 2019-03-01 | 北京大学深圳研究生院 | 基于图像中亮条纹信息的图像去模糊方法 |
CN109934775B (zh) * | 2018-11-20 | 2022-12-27 | 腾讯科技(深圳)有限公司 | 一种图像处理、模型训练、方法、装置和存储介质 |
CN109859111A (zh) * | 2018-11-20 | 2019-06-07 | 昆明理工大学 | 一种基于map方法的单幅图像盲去模糊方法 |
CN112581378B (zh) * | 2019-09-30 | 2022-09-13 | 河海大学常州校区 | 基于显著性强度和梯度先验的图像盲去模糊方法和装置 |
CN111028168B (zh) * | 2019-12-06 | 2022-09-13 | 河海大学常州校区 | 一种含噪声模糊的高能闪光图像去模糊方法 |
CN111340733B (zh) * | 2020-02-28 | 2022-07-26 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111445414B (zh) * | 2020-03-27 | 2023-04-14 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
-
2021
- 2021-04-27 CN CN202110461649.3A patent/CN113177890B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292842A (zh) * | 2017-06-15 | 2017-10-24 | 北京大学深圳研究生院 | 基于先验约束和离群值抑制的图像去模糊方法 |
CN108564544A (zh) * | 2018-04-11 | 2018-09-21 | 南京邮电大学 | 基于边缘感知的图像盲去模糊组合稀疏优化方法 |
CN109816620A (zh) * | 2019-01-31 | 2019-05-28 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN110648286A (zh) * | 2019-08-02 | 2020-01-03 | 广东工业大学 | 一种毫米波图像非盲目去模糊的方法 |
CN110502949A (zh) * | 2019-08-09 | 2019-11-26 | 广东技术师范大学 | 一种基于自适应尺度控制的qr码图像快速盲去模糊方法 |
CN111047544A (zh) * | 2020-01-08 | 2020-04-21 | 华中科技大学 | 一种基于非线性退化模型的饱和图像去模糊方法 |
CN112215773A (zh) * | 2020-10-12 | 2021-01-12 | 新疆大学 | 基于视觉显著性的局部运动去模糊方法、装置及存储介质 |
CN112200745A (zh) * | 2020-10-13 | 2021-01-08 | 上海商汤智能科技有限公司 | 遥感影像的处理方法及装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113177890A (zh) | 2021-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109522910B (zh) | 关键点检测方法及装置、电子设备和存储介质 | |
CN111462268B (zh) | 图像重建方法及装置、电子设备和存储介质 | |
CN111340731B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN111445414B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN111507408B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN111340733B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN110889469A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN113177890B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
WO2022021932A1 (zh) | 降噪方法及装置、电子设备、存储介质和计算机程序产品 | |
CN111369482B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN113689361B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN110675355B (zh) | 图像重建方法及装置、电子设备和存储介质 | |
CN113706421B (zh) | 一种图像处理方法及装置、电子设备和存储介质 | |
CN109840890B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN113660531A (zh) | 视频处理方法及装置、电子设备和存储介质 | |
CN111784773A (zh) | 图像处理方法及装置、神经网络训练方法及装置 | |
CN111507131B (zh) | 活体检测方法及装置、电子设备和存储介质 | |
CN111583142A (zh) | 图像降噪方法及装置、电子设备和存储介质 | |
CN107451972B (zh) | 图像增强方法、装置及计算机可读存储介质 | |
CN113689362B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN113034407B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN113177889B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN113592733A (zh) | 图像处理方法、装置、存储介质及电子设备 | |
CN112651880A (zh) | 视频数据处理方法及装置、电子设备和存储介质 | |
CN112200745A (zh) | 遥感影像的处理方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |