CN112561826A - 基于人工智能的图像去模糊方法、装置、设备及存储介质 - Google Patents

基于人工智能的图像去模糊方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112561826A
CN112561826A CN202011529759.0A CN202011529759A CN112561826A CN 112561826 A CN112561826 A CN 112561826A CN 202011529759 A CN202011529759 A CN 202011529759A CN 112561826 A CN112561826 A CN 112561826A
Authority
CN
China
Prior art keywords
image
network
deblurring
sub
stack
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011529759.0A
Other languages
English (en)
Inventor
李伟
蔡亮
张帅
李吉明
匡立中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Qulian Technology Co Ltd
Original Assignee
Hangzhou Qulian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Qulian Technology Co Ltd filed Critical Hangzhou Qulian Technology Co Ltd
Priority to CN202011529759.0A priority Critical patent/CN112561826A/zh
Publication of CN112561826A publication Critical patent/CN112561826A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于人工智能的图像去模糊方法、装置、设备和存储介质,所述方法包括:获取初始模糊图像,并将初始模糊图像输入到训练好的基于堆栈的多尺度循环网络模型中,其中,训练好的去模糊网络模型包括第一子网络和第二子网络,第一子网络和第二子网络均为多尺度循环神经网络模型,再通过第一子网络对初始模糊图像进行去模糊处理,得到第一输出结果,通过第二子网络对第一输出结果进行去模糊处理,得到目标图像,本发明提高了去模糊处理得到图像的质量。

Description

基于人工智能的图像去模糊方法、装置、设备及存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于人工智能的图像去模糊方法、装置、设备及存储介质。
背景技术
图像的清晰度和质量在科研、国防、通信以及医疗等各个领域尤其重要。例如,在人脸识别任务中,视觉上越清晰、质量越高的图像对人脸识别的准确率具有正面影响,反之,模糊的人脸图像可能会导致人脸识别任务出错。因此,图像去模糊的研究引起了越来越多研究者的关注。
现有方式主要利用自然图像先验来规范求解空间,包括稀疏图像先验,重尾梯度先验,L0范数梯度先验,超拉普拉斯先验等用于抑制伪影并改善去模糊图像的质量。现有方式还有通过基于深度学习的方法训练模型,进而通过训练好的模型实现恢复不同分辨率的清晰图像,这种方式可以提高去模糊图像的清晰度和质量。
在实现本发明的过程中,发明人意识到现有技术至少存在如下问题:利用自然图像先验来规范求解空间改善图像质量,涉及大量计算,使得处理效率较低,此外,因为空间均匀模糊内核的常见假设过于严格而导致去模糊效果不佳;现有的采用深度学习的方式,模型训练时间昂贵,而且通用深度学习模型的模糊内核模型结构单一,针对实际运动模糊图像的去模糊视觉效果不佳,使得去模糊图像的质量较差等问题,因而,亟需一种提高图像去模糊质量的方法。
发明内容
本发明实施例提供一种基于人工智能的图像去模糊方法、装置、计算机设备及存储介质,以提高图像去模糊得到的图像质量。
一种基于人工智能的图像去模糊方法,包括:
获取初始模糊图像;
将所述初始模糊图像输入到训练好的基于堆栈的多尺度循环网络模型中,其中,所述训练好的去模糊网络模型包括第一子网络和第二子网络,所述第一子网络和所述第二子网络均为多尺度循环神经网络模型;
通过所述第一子网络对所述初始模糊图像进行去模糊处理,得到第一输出结果;
通过所述第二子网络对所述第一输出结果进行去模糊处理,得到目标图像。
可选地,所述多尺度循环神经网络模型中的网络块采用基于卷积的长短时记忆神经网络Conv LSTM结构。
可选地,所述多尺度循环神经网络模型包括3个网络层级,每个网络层级由加入了残差结构的编码器-解码器网络组成,所述残差结构包含两个卷积层以及一个激活函数。
可选地,所述通过所述第一子网络对所述初始模糊图像进行去模糊处理,得到第一输出结果包括:
将所述初始模糊图像进行下采样处理,得到3个不同比例的下采样图像,分别为第一图像B1、第二图像B2和第三图像B3,其中,所述第一图像B1分辨率低于所述第二图像B2,所述第二图像B2分辨率低于所述第三图像B3;
将所述第一图像B1输入到第一网络层级,采用所述第一网络层级进行编码解码处理,得到第一处理图像;
将所述第一处理图像和所述第二图像B2输入到第二网络层级,采用所述第二网络层级进行编码解码处理,得到第二处理图像;
将所述第二处理图像和所述第二图像B2输入到第三网络层级,采用所述第三网络层级进行编码解码处理,得到第一输出结果。
可选地,在所述将所述初始模糊图像输入到训练好的基于堆栈的多尺度循环网络模型中之前,所述基于人工智能的图像去模糊方法还包括:
采用训练数据集对初始基于堆栈的多尺度循环网络模型进行训练,得到训练后的基于堆栈的多尺度循环网络模型;
采用测试数据集中的模糊图像对所述训练后的基于堆栈的多尺度循环网络模型进行测试,得到测试图像,其中,所述测试数据集中包含不同角度的测试图像对,每个所述测试图像对包括一张模糊图像和模糊图像对应的原始清晰图像;
采用均方方差损失函数,计算所述测试图像与所述测试图像对应的原始清晰图像之间的损失,得到损失评估值;
若所述损失评估值小于预设阈值,则将得到的训练后的基于堆栈的多尺度循环网络模型,作为所述训练好的基于堆栈的多尺度循环网络模型。
一种基于人工智能的图像去模糊装置,包括:
图像获取模块,用于获取初始模糊图像;
图像输入模块,用于将所述初始模糊图像输入到训练好的基于堆栈的多尺度循环网络模型中,其中,所述训练好的去模糊网络模型包括第一子网络和第二子网络,所述第一子网络和所述第二子网络均为多尺度循环神经网络模型;
第一去模糊模块,用于通过所述第一子网络对所述初始模糊图像进行去模糊处理,得到第一输出结果;
第二去模糊模块,用于通过所述第二子网络对所述第一输出结果进行去模糊处理,得到目标图像。
可选地,所述第一去模糊模块包括:
图像下采样单元,用于将所述初始模糊图像进行下采样处理,得到3个不同比例的下采样图像,分别为第一图像B1、第二图像B2和第三图像B3,其中,所述第一图像B1分辨率低于所述第二图像B2,所述第二图像B2分辨率低于所述第三图像B3;
第一编码解码单元,用于将所述第一图像B1输入到第一网络层级,采用所述第一网络层级进行编码解码处理,得到第一处理图像;
第二编码解码单元,用于将所述第一处理图像和所述第二图像B2输入到第二网络层级,采用所述第二网络层级进行编码解码处理,得到第二处理图像;
第三编码解码单元,用于将所述第二处理图像和所述第二图像B2输入到第三网络层级,采用所述第三网络层级进行编码解码处理,得到第一输出结果。
可选地,所述基于人工智能的图像去模糊装置还包括:
模型训练模块,用于采用训练数据集对初始基于堆栈的多尺度循环网络模型进行训练,得到训练后的基于堆栈的多尺度循环网络模型;
模型测试模块,用于采用测试数据集中的模糊图像对所述训练后的基于堆栈的多尺度循环网络模型进行测试,得到测试图像,其中,所述测试数据集中包含不同角度的测试图像对,每个所述测试图像对包括一张模糊图像和模糊图像对应的原始清晰图像;
损失计算模块,用于采用均方方差损失函数,计算所述测试图像与所述测试图像对应的原始清晰图像之间的损失,得到损失评估值;
模型确定模块,用于若所述损失评估值小于预设阈值,则将得到的训练后的基于堆栈的多尺度循环网络模型,作为所述训练好的基于堆栈的多尺度循环网络模型。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于人工智能的图像去模糊方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于人工智能的图像去模糊方法的步骤。
上述基于人工智能的图像去模糊方法、装置、计算机设备及存储介质,获取初始模糊图像,并将初始模糊图像输入到训练好的基于堆栈的多尺度循环网络模型中,其中,训练好的去模糊网络模型包括第一子网络和第二子网络,第一子网络和第二子网络均为多尺度循环神经网络模型,再通过第一子网络对初始模糊图像进行去模糊处理,得到第一输出结果,通过第二子网络对第一输出结果进行去模糊处理,得到目标图像,通过在水平上来增加模型的深度,对子网络进行水平堆叠,来执行图像去模糊任务,减少模型训练复杂性的同时,提高得到的去模糊图像的质量。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于人工智能的图像去模糊方法的应用环境示意图;
图2是本发明实施例提供的基于人工智能的图像去模糊方法的实现流程图;
图3是本发明实施例提供的基于人工智能的图像去模糊装置的示意图;
图4是本发明实施例提供的计算机设备的示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture E界面显示perts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureE界面显示perts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于人工智能的图像去模糊方法由服务器执行,相应地,基于人工智能的图像去模糊装置设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本申请实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用系统。
请参阅图2,图2示出本发明实施例提供的一种基于人工智能的图像去模糊方法,以该方法应用在图1中的服务端为例进行说明,详述如下:
S201:获取初始模糊图像。
其中,初始模糊图像为需要进行去模糊处理的图像。
可选地,服务端在接收到初始模糊图像后,对初始模糊图像进行图像预处理,具体包括但不限于:大小统一化处理、图像分割、灰度变换等,以使在后续通过训练好的基于堆栈的多尺度循环网络模型对初始模糊图像进行去模糊时,提升图像识别与图像特征提取的效率。
S202:将初始模糊图像输入到训练好的基于堆栈的多尺度循环网络模型中,其中,训练好的去模糊网络模型包括第一子网络和第二子网络,第一子网络和第二子网络均为多尺度循环神经网络模型。
具体地,将获取到的初始模糊图像,输入到训练好的基于堆栈的多尺度循环网络模型中,该训练好的去模糊网络模型为服务器预先进行训练得到,包括第一子网络和第二子网络,第一子网络和第二子网络均为多尺度循环神经网络模型。
其中,多尺度循环神经网络模型(Scale Recurrent Neural Network,SRN)是将多尺度架构与循环神经网络相结合得到的模型架构,其包含多个网络层级的循环神经网络,在每一网络层级中,分别由输入模块、网络块和输出模块。
作为一种优选方式,本实施例中的网络块采用基于卷积的长短时记忆神经网络Conv LSTM结构,Conv LSTM结构应用在该本实施例的多尺度循环神经网络模型当中,具有更简单的网络结构且具有时序的记忆性,对解决模糊图像这一类复杂的非线性的问题具有更好的图像复原效果,有利于提高去模糊处理得到的图像质量。
需要说明的是,本实施例的多尺度循环神经网络模型中,包含的网络层级的个数,可根据实际需求进行设定,本实施例中,优选网络层级数量为3个。
其中,每个网络层级由加入了残差结构的编码器-解码器网络组成。残差结构(也称残差块,ResBlock)包含两个卷积层以及一个激活函数,每个编码器网络模块包含有一个卷积层,与该卷积层紧相连的是若干相连的残差模块,残差模块的具体数量可根据实际需求进行设定。与编码器网络模块相对应的是解码器网络模块,其包含有多个相连的残差模块,后跟一个反卷积层。每个编码器网络、解码器网络、和残差结构在所有卷积层中都包含有相同数量的卷积内核。除了将编码器网络模块中的卷积层的步幅大小和解码器网络模块中的反卷积层的步幅大小设置为2外,其它网络层步幅大小都被设置为1。所有网络层的激活函数均采用ReLU(Rectified Linear Unit)。
S203:通过第一子网络对初始模糊图像进行去模糊处理,得到第一输出结果。
具体地,通过第一子网络,对输入的初始模糊图像进行下采样,并结合下采样结果和不同尺度的循环神经网络中进行特征提取与识别,得到第一输出结果,具体可参考后续实施例的描述,为避免重复,此处不再赘述。
S204:通过第二子网络对第一输出结果进行去模糊处理,得到目标图像。
具体地,在第一子网络输出第一输出结果后,采用与第一子网络堆叠的第二子网络进行进一步去模糊处理,应理解,在本实施例中,第二子网络的对于图像分辨率的要求,高于第一子网络,通过这种在水平上来增加模型的深度,形成堆栈结构的网络模型,避免通常采用的深度模型带来的训练复杂和容易过拟合的缺陷,同时,进一步提高去模糊得到的图像质量。
需要说明的是,本实施例优选为两个子网络,实际也可以是更多,此处并不应该理解为对其的限制。
本实施例中,通过获取初始模糊图像,并将初始模糊图像输入到训练好的基于堆栈的多尺度循环网络模型中,再通过训练好的基于堆栈的多尺度循环网络模型中的第一子网络对初始模糊图像进行去模糊处理,得到第一输出结果,通过第二子网络对第一输出结果进行去模糊处理,得到目标图像,通过在水平上来增加模型的深度,对子网络进行水平堆叠,来执行图像去模糊任务,减少模型训练复杂性的同时,提高得到的去模糊图像的质量。
在本实施例的一些可选的实现方式中,步骤S203中,通过第一子网络对初始模糊图像进行去模糊处理,得到第一输出结果包括:
将初始模糊图像进行下采样处理,得到3个不同比例的下采样图像,分别为第一图像B1、第二图像B2和第三图像B3,其中,第一图像B1分辨率低于第二图像B2,第二图像B2分辨率低于第三图像B3;
将第一图像B1输入到第一网络层级,采用第一网络层级进行编码解码处理,得到第一处理图像;
将第一处理图像和第二图像B2输入到第二网络层级,采用第二网络层级进行编码解码处理,得到第二处理图像;
将第二处理图像和第二图像B2输入到第三网络层级,采用第三网络层级进行编码解码处理,得到第一输出结果。
具体地,本实施例将第一处理图像和第二图像B2输入到第二网络层级之前,还对第一处理图像进行上采样处理,进而将上采样后的图像与比第一图像B1分辨率更高的模糊图像B2连接起来作为网络第二层级的输入,使得每个网络层级得到的输出图像,都较上一个层级更为清晰,将第二处理图像和第三图像B3输入到第三网络层级之前,同样对第二处理图像进行上采样处理。
其中,下采样是指对信号的抽取。上采样和下采样都是对数字信号进行重采,重采的采样率与原来获得该数字信号(比如从模拟信号采样而来)的采样率比较,大于原信号的称为上采样,小于的则称为下采样。上采样的实质也就是内插或插值。
本实施例中,所使用的上采样以及下采样的方法均采用双线性插值法,因其具有简单性和充分性两种特性,有利于提高模型去模糊的效率和得到图像的质量。
需要说明的是,本实施例的三个网络层级为本实施例的一种优选方式,在实际应用中,也可以根据实际需要设置其他数量的网络层次,此处不应理解为对其进行限制。
本实施例中,通过采用多尺度的循环神经网络,对初始模糊图像进行去模糊处理,提高得到图像的质量。
在本实施例的一些可选的实现方式中,在将初始模糊图像输入到训练好的基于堆栈的多尺度循环网络模型中之前,基于人工智能的图像去模糊方法还包括:
采用训练数据集对初始基于堆栈的多尺度循环网络模型进行训练,得到训练后的基于堆栈的多尺度循环网络模型;
采用测试数据集中的模糊图像测试数据集中的模糊图像对训练后的基于堆栈的多尺度循环网络模型进行测试,得到测试图像,其中,测试数据集中包含不同角度的测试图像对,每个测试图像对包括一张模糊图像和模糊图像对应的原始清晰图像;
采用均方方差损失函数,计算测试图像与测试图像对应的原始清晰图像之间的损失,得到损失评估值;
若损失评估值小于预设阈值,则将得到的训练后的基于堆栈的多尺度循环网络模型,作为训练好的基于堆栈的多尺度循环网络模型。
具体地,采用训练数据集对初始基于堆栈的多尺度循环网络模型进行训练,是通过依次将训练数据集中的图像对中的模糊图像,输入到初始基于堆栈的多尺度循环网络模型中,并通过每次得到的输出结果与清晰图像对比,对初始基于堆栈的多尺度循环网络模型中的参数进行调整,并在达到预设训练次数停止,训练之后,通过将测试数据集中的模糊图像输入到训练后的基于堆栈的多尺度循环网络模型进行测试,得到测试图像,并通过均方方差损失函数,计算测试图像与测试图像对应的原始清晰图像之间的损失,得到损失评估值,进而确定训练后的基于堆栈的多尺度循环网络模型是否达到要求。
本实施例中,采用GOPRO数据集作为训练数据集,采用LFW人脸数据集作为测试数据集。
其中,预设训练次数、预设阈值可根据实际需求进行设定,此处不做限制。
需要说明的是,本实施例采用LFW人脸数据集,选取其中1521张分辨率为256*256的人脸图像,使用人脸图像进行模型测试,引入人脸识别的方法可以验证模型对于模糊的人脸图像是否具有良好的去模糊效果。本实施例从采用的测试数据集中,选取具有不同的图像像素位移方向、角度以及像素大小具有不同模糊程度的模糊人脸图像对,来作为测试数据,有利于提高对运动模糊图像的检测准确度。
本实施例中,通过在去模糊处理之前,预先对模型进行训练,节约图像去模糊的时间,提高图像去模糊的效率,同时,本实施例采用均方方差作为损失函数,可一次得出损失评估,提高模型训练的效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种基于人工智能的图像去模糊装置,该基于人工智能的图像去模糊装置与上述实施例中基于人工智能的图像去模糊方法一一对应。如图3所示,该基于人工智能的图像去模糊装置包括图像获取模块31、图像输入模块32、第一去模糊模块33和第二去模糊模块34。各功能模块详细说明如下:
图像获取模块31,用于获取初始模糊图像;
图像输入模块32,用于将初始模糊图像输入到训练好的基于堆栈的多尺度循环网络模型中,其中,训练好的去模糊网络模型包括第一子网络和第二子网络,第一子网络和第二子网络均为多尺度循环神经网络模型;
第一去模糊模块33,用于通过第一子网络对初始模糊图像进行去模糊处理,得到第一输出结果;
第二去模糊模块34,用于通过第二子网络对第一输出结果进行去模糊处理,得到目标图像。
可选地,第一去模糊模块31包括:
图像下采样单元,用于将初始模糊图像进行下采样处理,得到3个不同比例的下采样图像,分别为第一图像B1、第二图像B2和第三图像B3,其中,第一图像B1分辨率低于分辨率低于第二图像B2,第二图像B2分辨率低于分辨率低于第三图像B3;
第一编码解码单元,用于将第一图像B1输入到第一网络层级,采用第一网络层级进行编码解码处理,得到第一处理图像;
第二编码解码单元,用于将第一处理图像和第二图像B2输入到第二网络层级,采用第二网络层级进行编码解码处理,得到第二处理图像;
第三编码解码单元,用于将第二处理图像和第二图像B2输入到第三网络层级,采用第三网络层级进行编码解码处理,得到第一输出结果。
可选地,基于人工智能的图像去模糊装置还包括:
模型训练模块,用于采用训练数据集对初始基于堆栈的多尺度循环网络模型进行训练,得到训练后的基于堆栈的多尺度循环网络模型;
模型测试模块,用于采用测试数据集中的模糊图像对训练后的基于堆栈的多尺度循环网络模型进行测试,得到测试图像,其中,测试数据集中包含不同角度的测试图像对,每个测试图像对包括一张模糊图像和模糊图像对应的原始清晰图像;
损失计算模块,用于采用均方方差损失函数,计算测试图像与测试图像对应的原始清晰图像之间的损失,得到损失评估值;
模型确定模块,用于若损失评估值小于预设阈值,则将得到的训练后的基于堆栈的多尺度循环网络模型,作为训练好的基于堆栈的多尺度循环网络模型。
关于基于人工智能的图像去模糊装置的具体限定可以参见上文中对于基于人工智能的图像去模糊方法的限定,在此不再赘述。上述基于人工智能的图像去模糊装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件连接存储器41、处理器42、网络接口43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如电子文件的控制的程序代码等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据,例如运行电子文件的控制的程序代码。
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的缓存清理方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种基于人工智能的图像去模糊方法,其特征在于,包括:
获取初始模糊图像;
将所述初始模糊图像输入到训练好的基于堆栈的多尺度循环网络模型中,其中,所述训练好的去模糊网络模型包括第一子网络和第二子网络,所述第一子网络和所述第二子网络均为多尺度循环神经网络模型;
通过所述第一子网络对所述初始模糊图像进行去模糊处理,得到第一输出结果;
通过所述第二子网络对所述第一输出结果进行去模糊处理,得到目标图像。
2.如权利要求1所述的基于人工智能的图像去模糊方法,其特征在于,所述多尺度循环神经网络模型中的网络块采用基于卷积的长短时记忆神经网络Conv LSTM结构。
3.如权利要求1所述的基于人工智能的图像去模糊方法,其特征在于,所述多尺度循环神经网络模型包括3个网络层级,每个网络层级由加入了残差结构的编码器-解码器网络组成,所述残差结构包含两个卷积层以及一个激活函数。
4.如权利要求3所述的基于人工智能的图像去模糊方法,其特征在于,所述通过所述第一子网络对所述初始模糊图像进行去模糊处理,得到第一输出结果包括:
将所述初始模糊图像进行下采样处理,得到3个不同比例的下采样图像,分别为第一图像B1、第二图像B2和第三图像B3,其中,所述第一图像B1分辨率低于所述第二图像B2,所述第二图像B2分辨率低于所述第三图像B3;
将所述第一图像B1输入到第一网络层级,采用所述第一网络层级进行编码解码处理,得到第一处理图像;
将所述第一处理图像和所述第二图像B2输入到第二网络层级,采用所述第二网络层级进行编码解码处理,得到第二处理图像;
将所述第二处理图像和所述第二图像B2输入到第三网络层级,采用所述第三网络层级进行编码解码处理,得到第一输出结果。
5.如权利要求1至4任一项所述的基于人工智能的图像去模糊方法,其特征在于,在所述将所述初始模糊图像输入到训练好的基于堆栈的多尺度循环网络模型中之前,所述基于人工智能的图像去模糊方法还包括:
采用训练数据集对初始基于堆栈的多尺度循环网络模型进行训练,得到训练后的基于堆栈的多尺度循环网络模型;
采用测试数据集中的模糊图像对所述训练后的基于堆栈的多尺度循环网络模型进行测试,得到测试图像,其中,所述测试数据集中包含不同角度的测试图像对,每个所述测试图像对包括一张模糊图像和模糊图像对应的原始清晰图像;
采用均方方差损失函数,计算所述测试图像与所述测试图像对应的原始清晰图像之间的损失,得到损失评估值;
若所述损失评估值小于预设阈值,则将得到的训练后的基于堆栈的多尺度循环网络模型,作为所述训练好的基于堆栈的多尺度循环网络模型。
6.一种基于人工智能的图像去模糊装置,其特征在于,所述基于人工智能的图像去模糊装置包括:
图像获取模块,用于获取初始模糊图像;
图像输入模块,用于将所述初始模糊图像输入到训练好的基于堆栈的多尺度循环网络模型中,其中,所述训练好的去模糊网络模型包括第一子网络和第二子网络,所述第一子网络和所述第二子网络均为多尺度循环神经网络模型;
第一去模糊模块,用于通过所述第一子网络对所述初始模糊图像进行去模糊处理,得到第一输出结果;
第二去模糊模块,用于通过所述第二子网络对所述第一输出结果进行去模糊处理,得到目标图像。
7.如权利要求6所述的基于人工智能的图像去模糊装置,其特征在于,所述第一去模糊模块包括:
图像下采样单元,用于将所述初始模糊图像进行下采样处理,得到3个不同比例的下采样图像,分别为第一图像B1、第二图像B2和第三图像B3,其中,所述第一图像B1分辨率低于所述第二图像B2,所述第二图像B2分辨率低于所述第三图像B3;
第一编码解码单元,用于将所述第一图像B1输入到第一网络层级,采用所述第一网络层级进行编码解码处理,得到第一处理图像;
第二编码解码单元,用于将所述第一处理图像和所述第二图像B2输入到第二网络层级,采用所述第二网络层级进行编码解码处理,得到第二处理图像;
第三编码解码单元,用于将所述第二处理图像和所述第二图像B2输入到第三网络层级,采用所述第三网络层级进行编码解码处理,得到第一输出结果。
8.如权利要求6所述的基于人工智能的图像去模糊装置,其特征在于,所述基于人工智能的图像去模糊装置还包括:
模型训练模块,用于采用训练数据集对初始基于堆栈的多尺度循环网络模型进行训练,得到训练后的基于堆栈的多尺度循环网络模型;
模型测试模块,用于采用测试数据集中的模糊图像对所述训练后的基于堆栈的多尺度循环网络模型进行测试,得到测试图像,其中,所述测试数据集中包含不同角度的测试图像对,每个所述测试图像对包括一张模糊图像和模糊图像对应的原始清晰图像;
损失计算模块,用于采用均方方差损失函数,计算所述测试图像与所述测试图像对应的原始清晰图像之间的损失,得到损失评估值;
模型确定模块,用于若所述损失评估值小于预设阈值,则将得到的训练后的基于堆栈的多尺度循环网络模型,作为所述训练好的基于堆栈的多尺度循环网络模型。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述基于人工智能的图像去模糊方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于人工智能的图像去模糊方法的步骤。
CN202011529759.0A 2020-12-22 2020-12-22 基于人工智能的图像去模糊方法、装置、设备及存储介质 Pending CN112561826A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011529759.0A CN112561826A (zh) 2020-12-22 2020-12-22 基于人工智能的图像去模糊方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011529759.0A CN112561826A (zh) 2020-12-22 2020-12-22 基于人工智能的图像去模糊方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112561826A true CN112561826A (zh) 2021-03-26

Family

ID=75030824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011529759.0A Pending CN112561826A (zh) 2020-12-22 2020-12-22 基于人工智能的图像去模糊方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112561826A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114119428A (zh) * 2022-01-29 2022-03-01 深圳比特微电子科技有限公司 一种图像去模糊方法和装置
CN116205822A (zh) * 2023-04-27 2023-06-02 荣耀终端有限公司 一种图像处理的方法、电子设备和计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180231871A1 (en) * 2016-06-27 2018-08-16 Zhejiang Gongshang University Depth estimation method for monocular image based on multi-scale CNN and continuous CRF
US20180240219A1 (en) * 2017-02-22 2018-08-23 Siemens Healthcare Gmbh Denoising medical images by learning sparse image representations with a deep unfolding approach
CN110782399A (zh) * 2019-08-22 2020-02-11 天津大学 一种基于多任务cnn的图像去模糊方法
CN111753789A (zh) * 2020-07-01 2020-10-09 重庆邮电大学 基于堆栈式组合自编码器的机器人视觉slam闭环检测方法
US20200349680A1 (en) * 2018-04-04 2020-11-05 Tencent Technology (Shenzhen) Company Limited Image processing method and device, storage medium and electronic device
CN112102177A (zh) * 2020-07-27 2020-12-18 中山大学 基于压缩与激励机制神经网络的图像去模糊方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180231871A1 (en) * 2016-06-27 2018-08-16 Zhejiang Gongshang University Depth estimation method for monocular image based on multi-scale CNN and continuous CRF
US20180240219A1 (en) * 2017-02-22 2018-08-23 Siemens Healthcare Gmbh Denoising medical images by learning sparse image representations with a deep unfolding approach
US20200349680A1 (en) * 2018-04-04 2020-11-05 Tencent Technology (Shenzhen) Company Limited Image processing method and device, storage medium and electronic device
CN110782399A (zh) * 2019-08-22 2020-02-11 天津大学 一种基于多任务cnn的图像去模糊方法
CN111753789A (zh) * 2020-07-01 2020-10-09 重庆邮电大学 基于堆栈式组合自编码器的机器人视觉slam闭环检测方法
CN112102177A (zh) * 2020-07-27 2020-12-18 中山大学 基于压缩与激励机制神经网络的图像去模糊方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
HONGGUANG ZHANG等: "Deep Stacked Hierarchical Multi-Patch Network for Image Deblurring", 《2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》, 9 January 2020 (2020-01-09), pages 3 - 4 *
XIN TAO等: "Scale-Recurrent Network for Deep Image Deblurring", 《2018 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》, 16 December 2018 (2018-12-16), pages 3 - 4 *
翟方兵;陈杰;邵慧;: "基于多尺度残差的图像去模糊", 计算机与数字工程, no. 03, 20 March 2020 (2020-03-20) *
蔺素珍;韩泽;: "基于深度堆叠卷积神经网络的图像融合", 计算机学报, no. 11, 15 November 2017 (2017-11-15) *
郭业才;朱文军;: "基于深度卷积神经网络的运动模糊去除算法", 南京理工大学学报, no. 03, 30 June 2020 (2020-06-30) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114119428A (zh) * 2022-01-29 2022-03-01 深圳比特微电子科技有限公司 一种图像去模糊方法和装置
CN114119428B (zh) * 2022-01-29 2022-09-23 深圳比特微电子科技有限公司 一种图像去模糊方法和装置
CN116205822A (zh) * 2023-04-27 2023-06-02 荣耀终端有限公司 一种图像处理的方法、电子设备和计算机可读存储介质
CN116205822B (zh) * 2023-04-27 2023-10-03 荣耀终端有限公司 一种图像处理的方法、电子设备和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN113159143B (zh) 基于跳跃连接卷积层的红外与可见光图像融合方法和装置
CN111476719A (zh) 图像处理方法、装置、计算机设备及存储介质
CN113436100B (zh) 用于修复视频的方法、装置、设备、介质和产品
CN108876716B (zh) 超分辨率重建方法及装置
CN110992243B (zh) 椎间盘截面图像构建方法、装置、计算机设备及存储介质
CN112561826A (zh) 基于人工智能的图像去模糊方法、装置、设备及存储介质
CN112967196A (zh) 图像修复方法及装置、电子设备和介质
CN112967355A (zh) 图像填充方法及装置、电子设备和介质
CN112016502B (zh) 安全带检测方法、装置、计算机设备及存储介质
CN112613541A (zh) 目标检测方法及装置、存储介质及电子设备
CN114494815A (zh) 神经网络训练方法、目标检测方法、装置、设备和介质
CN110910326B (zh) 图像处理方法及装置、处理器、电子设备及存储介质
CN110782398B (zh) 图像处理方法、生成式对抗网络系统和电子设备
CN117746125A (zh) 图像处理模型的训练方法、装置及电子设备
CN111429388B (zh) 一种图像处理方法、装置和终端设备
CN115601235A (zh) 一种图像超分辨率网络训练方法、装置、设备及存储介质
CN111489289B (zh) 一种图像处理方法、图像处理装置及终端设备
CN114943995A (zh) 人脸识别模型的训练方法、人脸识别方法及装置
CN113362249A (zh) 文字图像合成方法、装置、计算机设备及存储介质
CN114078097A (zh) 图像去雾模型的获取方法、装置和电子设备
CN116309274B (zh) 图像中小目标检测方法、装置、计算机设备及存储介质
CN111612714A (zh) 图像修复方法、装置和电子设备
CN114565615A (zh) 息肉图像分割方法、装置、计算机设备及存储介质
CN114820686B (zh) 抠图的方法、装置、电子设备及存储介质
CN117636370A (zh) 检测图像内容的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination