CN114119377A - 一种图像处理方法及装置 - Google Patents
一种图像处理方法及装置 Download PDFInfo
- Publication number
- CN114119377A CN114119377A CN202010869230.7A CN202010869230A CN114119377A CN 114119377 A CN114119377 A CN 114119377A CN 202010869230 A CN202010869230 A CN 202010869230A CN 114119377 A CN114119377 A CN 114119377A
- Authority
- CN
- China
- Prior art keywords
- image
- target
- neural network
- network model
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 25
- 230000015556 catabolic process Effects 0.000 claims abstract description 116
- 238000006731 degradation reaction Methods 0.000 claims abstract description 116
- 238000003062 neural network model Methods 0.000 claims abstract description 103
- 238000012545 processing Methods 0.000 claims abstract description 58
- 238000000034 method Methods 0.000 claims abstract description 51
- 238000012549 training Methods 0.000 claims description 47
- 238000004590 computer program Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- WURBVZBTWMNKQT-UHFFFAOYSA-N 1-(4-chlorophenoxy)-3,3-dimethyl-1-(1,2,4-triazol-1-yl)butan-2-one Chemical compound C1=NC=NN1C(C(=O)C(C)(C)C)OC1=CC=C(Cl)C=C1 WURBVZBTWMNKQT-UHFFFAOYSA-N 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000593 degrading effect Effects 0.000 description 3
- 238000004880 explosion Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G06T5/70—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请适用于图像处理的技术领域,提供了一种图像处理方法及装置,所述方法包括:获取待处理图像,将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行处理,得到由所述预先训练的神经网络模型输出的目标图像。其中,所述预先训练的神经网络模型中包含根据若干所述降质因素各自对应的目标预设权重和目标权重系数得到的目标卷积层的多模态卷积核,所述多模态卷积核用于提取若干所述降质因素的特征。本申请根据目标预设权重和目标权重系数,得到多模态卷积核。进而调整目标卷积层的运算结果,以改善不同降质因素之间的复原强度,提高了针对若干降质因素的失真图像复原能力。
Description
技术领域
本申请属于图像处理的技术领域,尤其涉及一种图像处理方法、装置、终端设备以及计算机可读存储介质。
背景技术
图像复原是指针对质量降低或失真的图像,恢复其原始的内容或质量的过程。而失真图像往往包含若干类型的降质,比如噪声、模糊以及伪影共存且相互影响。以手机相机所拍摄的图像为例,它往往包含运动模糊、tensor噪声以及压缩伪影等若干降质因素(降质因素是指降低图像质量的因素),导致的画质低。
而传统的图像复原方法,对于包含若干降质因素的失真图像复原能力较差。
发明内容
有鉴于此,本申请实施例提供了一种图像处理方法、装置、终端设备以及计算机可读存储介质,可以解决传统的图像复原方法,对于包含若干降质因素的失真图像复原能力较差的技术问题。
本申请实施例的第一方面提供了一种图像处理方法,所述方法包括:
获取待处理图像,所述待处理图像包括具有若干降质因素的图像;
将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行处理,得到由所述预先训练的神经网络模型输出的目标图像;
其中,所述预先训练的神经网络模型中包含根据若干所述降质因素各自对应的目标预设权重和目标权重系数得到的目标卷积层的多模态卷积核,所述多模态卷积核用于提取若干所述降质因素的特征。
本申请实施例的第二方面提供了一种图像处理装置,所述系统包括:
第一获取单元,用于获取待处理图像,所述待处理图像包括具有若干降质因素的图像;
处理单元,用于将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行处理,得到由所述预先训练的神经网络模型输出的目标图像;
其中,所述预先训练的神经网络模型中包含根据若干所述降质因素各自对应的目标预设权重和目标权重系数得到的目标卷积层的多模态卷积核,所述多模态卷积核用于提取若干所述降质因素的特征。
本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:在本申请中,通过获取待处理图像,所述待处理图像包括具有若干降质因素的图像。将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行处理,得到由所述预先训练的神经网络模型输出的目标图像。其中,所述预先训练的神经网络模型中包含根据若干所述降质因素各自对应的目标预设权重和目标权重系数,得到的目标卷积层的多模态卷积核,所述多模态卷积核用于提取若干降质因素的特征。本申请根据目标预设权重和目标权重系数,得到多模态卷积核。进而调整目标卷积层的运算结果,以改善不同降质因素之间的复原强度,提高了针对若干降质因素的失真图像复原能力。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了本申请提供的一种图像处理方法的示意性流程图;
图2示出了本申请提供的一种图像处理方法中传统的EDSR网络架构示意图;
图3示出了本申请提供的一种图像处理方法中改进后的EDSR网络架构示意图;
图4示出了本申请提供的一种图像处理方法中步骤102的具体示意性流程图;
图5示出了本申请提供的一种图像处理方法中图3对应的残差模块结构示意图;
图6示出了本申请提供的另一种图像处理方法的示意性流程图;
图7示出了本申请提供的一种图像处理方法中步骤603的具体示意性流程图;
图8示出了本申请提供的一种图像处理方法中步骤6031的具体示意性流程图;
图9示出了本申请提供的一种图像处理装置的示意图;
图10示出了本申请一实施例提供的一种终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
图像复原是指针对质量降低或失真的图像,恢复其原始的内容或质量的过程。在本实施例中所述图像复原包括但不限于超分辨率技术、图像去噪技术以及图像模糊技术等图像处理技术。
而失真图像往往包含若干类型的降质,比如噪声、模糊以及伪影共存且相互影响。以手机相机所拍摄的图像为例,它往往包含运动模糊、tensor噪声以及压缩伪影等若干降质因素,导致的画质低。
而传统的图像复原方法,对于若干降质因素的失真图像复原能力较差。
有鉴于此,本申请实施例提供了一种图像处理方法、装置、终端设备以及计算机可读存储介质,可以解决传统的图像复原方法,对于若干降质因素的失真图像复原能力较差的技术问题。
请参见图1,图1示出了本申请提供的一种图像处理方法的示意性流程图。
如图1所示,该方法可以包括如下步骤:
步骤101,获取待处理图像,所述待处理图像包括具有若干降质因素的图像。
所述降质因素是指降低图像质量的因素,包括:运动模糊、tensor噪声以及压缩伪影等因素。待处理图像中包含若干降质因素。由于不同的降质因素共同影响了待处理图像的画质。故本实施例通过具备多模态卷积核的神经网络模型,对待处理图像进行修复处理,以修复待处理图像。
步骤102,将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行处理,得到由所述预先训练的神经网络模型输出的目标图像。其中,所述预先训练的神经网络模型中包含根据所述若干降质因素各自对应的目标预设权重和目标权重系数得到的目标卷积层的多模态卷积核,所述多模态卷积核用于提取若干所述降质因素的特征。
为了使模型具备若干降质因素对应的特征提取能力,故本申请根据若干降质因素各自对应的目标预设权重和目标权重系数,计算目标卷积层的多模态卷积核。
卷积核用于对待处理图像中一个小区域中像素进行加权平均,得到输出图像中的每个对应像素。其中,上述权值由一个函数定义,这个函数称为卷积核。而本申请中的多模态卷积核是由多个降质因素对应的目标预设权重和目标权重系数而来,即将目标预设权重和目标权重系数融合计算后,得到的最终权值。将最终权重作为多模态卷积核。
计算多模态卷积核的过程如下:分别将每种降质因素对应的目标预设权重和目标权重系数相乘,得到多个乘积。将多个所述乘积相加,得到最终权重。根据最终权重以及预设的卷积核大小,生成多模态卷积核。
多模态卷积核用于提取若干降质因素的特征,以根据若干降质因素的特征进行特征增强以及特征重建,进而得到目标图像。实现了对若干降质因素的复原能力。
所述神经网络模型的网络架构包括但不限于超分辨率卷积神经网络(Learning aDeep Convolutional Network for Image Super-Resolution,SRCNN)、加速超分辨率卷积神经网络(Accelerating the Super-Resolution Convolutional Neural Network,FSRCNN)网络架构、实时超分辨率像素卷积神经网络(Real-Time Single Image and VideoSuper-Resolution Using an Efficient Sub-Pixel Convolutional Neural,ESPCN)网络架构以及单幅图像超分辨率增强深层残差网络(Enhanced Deep Residual Networks forSingle Image Super-Resolution,EDSR)网络架构等一切用于图像处理的网络架构。
其中,由于在图像处理领域采用的神经网络模型的网络层往往较深,随着网络深度的增大,容易导致梯度弥散或梯度爆炸。而残差网络可以很好地解决梯度弥散或梯度爆炸的问题。残差网络是由一系列残差块组成,可以弥补网络较深时导致梯度弥散或梯度爆炸的问题。故本实施例选用EDSR网络架构作为本实施例的基础架构,在此架构上进行解释说明。EDSR中包括多个残差层(残差层用于特征增强)。EDSR与其他网络架构最大的差别在于:EDSR中不存在批归一化(Batch Normalization)计算,使得EDSR可堆叠更多的残差层,以提高图像处理效果。以下对EDSR架构,进行具体说明。需要强调的是,本申请也可以适应其他神经网络模型,对于EDSR网络架构仅仅是起实例作用,而非限定。请参见图2,图2示出了本申请提供的一种图像处理方法中传统的EDSR网络架构示意图。传统的EDSR网络架构如图2所示,EDSR网络架构包含特征提取模块、特征增强模块(它往往由全局残差连接和堆叠残差模块构成)以及重建模块。
由于在EDSR网络架构中包括多个卷积层,而本实施例中所述多模态卷积核可应用于特征提取模块和/或特征增强模块中的任意一个或多个目标卷积层中。对于卷积层的数量以及在网络架构中的位置,可根据实际应用场景或实验数据而定,在此不做任何限定。为了更好得说明本实施例的技术方案,本实施例选用残差模块中的卷积层作为示例,进行解释说明。其中,所述多模态卷积核是通过若干降质因素各自对应的目标预设权重和目标权重系数计算而得。
可以理解的是,不同的目标预设权重针对不同降质因素的特征提取能力不同。而本实施例通过融合若干降质因素各自对应的目标预设权重,使目标卷积层针对待处理图像,具有更优的特征提取能力。
请参见图3,图3示出了本申请提供的一种图像处理方法中改进后的EDSR网络架构示意图。如图3所示,改进后的EDSR网络架构依然包含特征提取模块(即Conv1)、特征增强模块(即ResBlock1以及ResBlock2)以及重建模块(即Conv2)。与传统的EDSR网络架构不同的是,改进后的EDSR网络架构,在残差模块中增加了复原强度调节分支Conditional。以通过用户在复原强度调节分支Conditional输入不同降质因素对应的第一权重系数,得到由多个第一权重系数组成的Alpha,即Alpha是用户输入的针对不同降质因素的第一权重系数集合,用于调整不同降质因素对应第一预设权重。例如,样本图像中的三种降质因素对应的比例分别为:噪声强度为最大噪声的40%,伪影为最严重伪影的80%,模糊程度为最模糊成都的60%,此时用户可以输入Alpha为[0.4,0.8,0.6]的预设权重系数,调节不同降质因素对应的复原强度。如图3所示,在本实施中分别将残差模块ResBlock 1以及残差模块ResBlock2中的目标卷积层赋予相同的Alpha,以调节不同降质因素对应的复原强度。在实际应用场景中,赋予Alpha的目标卷积层可以更多或更少。需要强调的是,图3仅仅起实例作用,对于赋予Alpha的残差模块的数量以及位置,不做任何限定。
具体地,步骤1021,具体包括以下步骤,请参见图4,图4示出了本申请提供的一种图像处理方法中步骤102的具体示意性流程图。
步骤1021,将所述待处理图像经过所述目标卷积层的前置网络层的逐层处理,得到所述目标卷积层的输入。
目标卷积层是指设置有目标预设权重的卷积层。请参见图5,图5示出了本申请提供的一种图像处理方法中图3对应的残差模块结构示意图。如图5所示,weight 1、weight 2以及weight 3表示目标预设权重,weight 4表示所述多模态卷积核。Alpha表示目标权重系数,Conv4表示目标卷积层。目标卷积层的前置网络层包括图3中的卷积层Conv1以及卷积层Conv3。待处理图像经过卷积层Conv1以及卷积层Conv3处理,得到目标卷积层目标卷积层的输入。
步骤1022,将每种降质因素各自对应的所述目标预设权重和所述目标权重系数相乘,得到多个乘积。
步骤1023,将多个所述乘积相加,得到多模态权重,将所述多模态权重作为所述目标卷积层的所述多模态卷积核。
将目标权重系数Alpha与对应的weight 1、weight 2以及weight 3相乘,得到多个乘积。再将多个所述乘积相加,得到weight 4,即多模态卷积核。
需要强调的是,图3中的Alpha与图5中的Alpha是同一个数据,图5是图3中Alpha的具体计算过程。
步骤1023的计算过程,如下所示:
其中A表示所述多模态卷积核,K表示降质因素的数量,k表示第k个降质因素,Wk表示第k个目标预设权重,αk表示第k个目标权重系数。其中,αk的约束条件为:0<=αk<=1。
步骤1024,通过所述目标卷积层中的多模态卷积核对所述目标卷积层的输入,进行卷积计算,得到后置网络层的输入,并经过所述后置网络层的逐层处理,得到所述目标图像。
目标卷积层Conv4的输入经过多模态卷积核进行卷积计算,得到后置网络层的输入,并经过所述后置网络层的逐层处理,得到所述目标图像。例如,目标卷积层Conv4的输入经过多模态卷积核进行卷积计算,得到,得到ResBlock2的输入。ResBlock2的输出结果经过全局残差连接,得到卷积层Conv2的输入。经过卷积层Conv2的处理,得到所述目标图像。
可以理解的是,本实施例通过获取待处理图像,所述待处理图像包括具有若干降质因素的图像。将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行处理,得到由所述预先训练的神经网络模型输出的目标图像。其中,所述预先训练的神经网络模型中包含根据若干所述降质因素各自对应的目标预设权重和目标权重系数得到的目标卷积层的多模态卷积核,所述多模态卷积核用于提取若干降质因素的特征。本申请根据目标预设权重和目标权重系数,得到多模态卷积核。进而调整目标卷积层的运算结果,以改善不同降质因素之间的复原强度,提高了针对若干降质因素的失真图像复原能力。
可选地,在上述图1所示实施例的基础上,在所述获取待处理图像之前,还包括如下步骤,请参见图6,图6示出了本申请提供的另一种图像处理方法的示意性流程图。本实施例中步骤604至步骤605,与图1所示实施例中步骤101至步骤102相同,具体请参阅图1所示实施例中步骤101至步骤102的相关描述,此处不赘述。
步骤601,获取用户输入的若干所述降质因素各自对应的第一权重系数。
由于根据实验数据发现,若直接采用用户输入的第一权重系数,对目标预设权重进行加权计算,得到的图像复原效果较差。故,本实施例通过对用户输入的第一权重系数进行训练,得到目标权重系数,以通过最佳的权重系数调整若干降质因素的目标预设权重。
步骤602,获取样本图像对,所述样本图像对包括原始图像以及经过复原处理后的原始图像。
本实施例通过在现有的数据库中获取原始图像,原始图像中具有若干降质因素。通过图像复原技术处理原始图像,得到经过复原处理后的原始图像。将原始图像以及经过复原处理后的原始图像作为样本图像对,对待训练的神经网络模型进行训练。
步骤603,根据所述样本图像对,训练待训练的神经网络模型,以调整若干所述降质因素各自对应的第一预设权重以及第一权重系数,得到所述预先训练的神经网络模型,所述预先训练的神经网络模型中包括所述第一预设权重对应的目标预设权重和所述第一权重系数对应的目标权重系数。
所述第一预设权重是指预设权重的初始化数值。本实施例通过对待训练的神经网络模型中的第一预设权重进行训练,得到若干所述降质因素各自对应的目标预设权重。
其中,第一预设权重以及第一权重系数可以分别单独训练,也可以共同训练。
具体地,所述根据所述样本图像对,训练若干所述降质因素各自对应的第一预设权重以及第一权重系数,得到所述预先训练的神经网络模型,包括以下步骤,请参见图7,图7示出了本申请提供的一种图像处理方法中步骤603的具体示意性流程图。
步骤6031,根据所述样本图像对,训练所述待训练的神经网络模型,以调整若干所述降质因素对应的多个所述第一预设权重,得到第一神经网络模型。
具体地,步骤6031,具体包括以下步骤,请参见图8,图8示出了本申请提供的一种图像处理方法中步骤6031的具体示意性流程图。
步骤6031a,将多个所述第一预设权重的其中一个第一预设权重,作为训练对象。
步骤6031b,将所述多个第一预设权重中所述训练对象对应的第一预设权重之外的其他第一预设权重设定为预设数值。
预设数值可以是任意数值。
步骤6031c,根据所述样本图像对,训练所述待训练的神经网络模型中的所述训练对象。
步骤6031d,重复执行所述将多个所述第一预设权重的其中一个第一预设权重,作为训练对象的步骤以及后续步骤,直至多个所述第一预设权重训练完成,得到所述第一神经网络。
重复执行步骤6031a至步骤6031d,以训练每一个第一预设权重,并得到每一个第一预设权重对应的目标预设权重,进而得到第一神经网络。
其中,每个第一预设权重的训练过程如下:将所述样本图像对中的原始图像输入待训练的神经网络模型中,由待训练的神经网络模型对原始图像进行修复处理,得到由待训练的神经网络模型输出的预测图像。计算预测图像与经过复原处理后的原始图像之间的误差(例如:根据损失函数计算预测图像与经过复原处理后的原始图像之间的误差)。当误差小于或等于阈值时,则停止训练,得到第二预设权重。当多个所述第一预设权重训练完成时,得到所述第一神经网络。
步骤6032,根据所述样本图像对,训练所述第一神经网络模型,以调整所述第一神经网络模型中所述第一权重系数以及第二预设权重,得到所述预先训练的神经网络模型,所述第二预设权重为所述第一预设权重经过训练后得到的权重。
当得到训练后的多个所述第一预设权重后,本实施例针对所述第一权重系数以及第二预设权重进行同时训练,得到所述预先训练的神经网络模型。
优先地,本实施例采用端到端的训练方式,共同训练所述第一权重系数以及训练后的多个所述第一预设权重。
示例性地,以三种降质因素:压缩降质因素、去噪降质因素以及去模糊降质因素为例。假设待处理图像中三种降质因素占比为:“去噪降质因素造成的噪声为最大噪声的40%,压缩降质因素造成的伪影程度为最严重伪影的80%,模糊降质因素造成的模糊程度为最模糊成都的60%”。假设用户在复原强度调节分支Conditional输入不同降质因素对应的第一权重系数Alpha[0.4,0.8,0.6]。训练的过程如下:在第一次训练时,将压缩降质因素的第一预设权重作为训练对象,将去噪降质因素的第一预设权重和去模糊降质因素的第一预设权重设为0。根据所述样本图像对,训练压缩降质因素的第一预设权重,得到压缩降质因素的第二预设权重。在第二次训练时,将去噪降质因素的第一预设权重作为训练对象,将压缩降质因素的第一预设权重和去模糊降质因素的第一预设权重设为0。根据所述样本图像对,训练去噪降质因素的第一预设权重,得到去噪降质因素的第二预设权重。在第三次训练时,将去模糊降质因素的第一预设权重作为训练对象,将压缩降质因素的第一预设权重和去噪降质因素的第一预设权重设为0。根据所述样本图像对,训练去模糊降质因素的第一预设权重,得到模糊降质因素的第二预设权重。此时,所有第一预设权重训练完成,得到所述第一神经网络。再采用端到端的方式训练所述第一神经网络模型中所述第一权重系数以及第二预设权重。端到端的训练过程如下:将所述样本图像对中的原始图像输入第一神经网络模型中,由第一神经网络模型对原始图像进行处理,得到由第一神经网络模型输出的预测图像。计算预测图像与经过复原处理后的原始图像之间的误差(例如:根据损失函数计算预测图像与经过复原处理后的原始图像之间的误差)。当误差小于或等于阈值时,则停止训练,得到所述预先训练的神经网络模型。当误差大于阈值时,对第一神经网络模型中的每一个网络层进行反向传播,使每一个网络层根据误差对第一权重系数以及第二预设权重进行调整。直至预测图像与经过复原处理后的原始图像之间的误差误差小于或等于阈值,得到预先训练的神经网络模型。需强调的是,上述示例仅仅起实例作用,对预设权重以及权重系数的数量以及数值,并不做任何限定。
步骤604,获取待处理图像,所述待处理图像包括具有若干降质因素的图像。
步骤605,将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行处理,得到由所述预先训练的神经网络模型输出的目标图像;其中,所述预先训练的神经网络模型中包含根据若干所述降质因素各自对应的目标预设权重和目标权重系数得到的目标卷积层的多模态卷积核,所述多模态卷积核用于提取若干所述降质因素的特征。
在本实施例中,通过获取用户输入的若干所述降质因素各自对应的第一权重系数。获取样本图像对,所述样本图像对包括原始图像以及经过复原处理后的原始图像。根据所述样本图像对,训练待训练的神经网络模型中的若干所述降质因素各自对应的第一预设权重以及第一权重系数,得到所述预先训练的神经网络模型。本申请通过训练待训练的神经网络模型中的第一预设权重以及第一权重系数,得到预先训练的神经网络模型。预先训练的神经网络模型中包含根据若干所述降质因素各自对应的目标预设权重和目标权重系数,得到的多模态卷积核。以改善不同降质因素之间的复原强度,提高了针对若干降质因素的失真图像复原能力。
如图9本申请提供了一种图像处理装置9,请参见图9,图9示出了本申请提供的一种图像处理装置的示意图,如图9所示一种图像处理装置包括:
第一获取单元91,用于获取待处理图像,所述待处理图像包括具有若干降质因素的图像;
处理单元92,用于将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行处理,得到由所述预先训练的神经网络模型输出的目标图像;
其中,所述预先训练的神经网络模型中包含根据若干所述降质因素各自对应的目标预设权重和目标权重系数得到的目标卷积层的多模态卷积核,所述多模态卷积核用于提取若干所述降质因素的特征。
所述神经网络模型包括多个由卷积层和激活函数构成的模块,所述模块包括特征提取模块、特征增强模块以及重建模块,其中,所述特征提取模块和/或所述特征增强模块中包括目标卷积层;
所述处理单元,具体用于将所述待处理图像经过所述目标卷积层的前置网络层的逐层处理,得到所述目标卷积层的输入;将每种降质因素各自对应的所述目标预设权重和所述目标权重系数相乘,得到多个乘积;将多个所述乘积相加,得到多模态权重,将所述多模态权重作为所述目标卷积层的所述多模态卷积核;通过所述目标卷积层中的多模态卷积核对所述目标卷积层的输入,进行卷积计算,得到后置网络层的输入,并经过所述后置网络层的逐层处理,得到所述目标图像。
所述装置,还包括:
第二获取单元,用于获取用户输入的若干所述降质因素各自对应的第一权重系数;
第三获取单元,用于获取样本图像对,所述样本图像对包括原始图像以及经过复原处理后的原始图像;
训练单元,用于根据所述样本图像对,训练待训练的神经网络模型,以调整若干所述降质因素各自对应的第一预设权重以及第一权重系数,得到所述预先训练的神经网络模型。
本申请提供的一种图像处理装置,通过获取待处理图像,所述待处理图像包括具有若干降质因素的图像。将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行修复处理,得到由所述预先训练的神经网络模型输出的目标图像。其中,所述预先训练的神经网络模型中包含根据若干所述降质因素各自对应的目标预设权重和目标权重系数,得到的多模态卷积核;所述多模态卷积核用于调整目标卷积层的运算结果。本申请根据目标预设权重和目标权重系数,得到多模态卷积核。进而调整卷积层的运算结果,以改善不同降质因素之间的复原强度,提高了针对若干降质因素的失真图像复原能力。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图10示出了本申请一实施例提供的一种终端设备的示意图。如图10所示,该实施例的一种终端设备100包括:处理器1000、存储器1001以及存储在所述存储器1001中并可在所述处理器1000上运行的计算机程序1002,例如一种图像处理程序。所述处理器1000执行所述计算机程序1002时实现上述各个一种图像处理方法实施例中的步骤,例如图1所示的步骤101至步骤102。或者,所述处理器1000执行所述计算机程序1002时实现上述各装置实施例中各单元的功能,例如图9所示单元91至92。
示例性的,所述计算机程序1002可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器1001中,并由所述处理器1000执行,以完成本申请。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序1002在所述一种终端设备100中的执行过程。例如,所述计算机程序1002可以被分割成获取单元和计算单元各单元具体功能如下:
第一获取单元,用于获取待处理图像,所述待处理图像包括具有若干降质因素的图像;
处理单元,用于将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行处理,得到由所述预先训练的神经网络模型输出的目标图像;
其中,所述预先训练的神经网络模型中包含根据若干所述降质因素各自对应的目标预设权重和目标权重系数得到的目标卷积层的多模态卷积核,所述多模态卷积核用于提取若干所述降质因素的特征。
所述一种终端设备100可以是移动终端、桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述一种终端设备可包括,但不仅限于,处理器1000、存储器1001。本领域技术人员可以理解,图10仅仅是一种终端设备100的示例,并不构成对一种终端设备100的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述一种终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器1000可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器1001可以是所述一种终端设备100的内部存储单元,例如一种终端设备100的硬盘或内存。所述存储器1001也可以是所述一种终端设备100的外部存储设备,例如所述一种终端设备100上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器1001还可以既包括所述一种终端设备100的内部存储单元也包括外部存储设备。所述存储器1001用于存储所述计算机程序以及所述一种终端设备所需的其他程序和数据。所述存储器1001还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的终端设备和方法,可以通过其它的方式实现。例如,以上所描述的终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random AccessMemory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之间。
Claims (10)
1.一种图像处理方法,其特征在于,所述方法包括:
获取待处理图像,所述待处理图像包括具有若干降质因素的图像;
将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行处理,得到由所述预先训练的神经网络模型输出的目标图像;
其中,所述预先训练的神经网络模型中包含根据若干所述降质因素各自对应的目标预设权重和目标权重系数得到的目标卷积层的多模态卷积核,所述多模态卷积核用于提取若干所述降质因素的特征。
2.如权利要求1所述的方法,其特征在于,所述神经网络模型包括多个由卷积层和激活函数构成的模块,所述模块包括特征提取模块、特征增强模块以及重建模块,其中,所述特征提取模块和/或所述特征增强模块中包括目标卷积层;
所述将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行处理,得到由所述预先训练的神经网络模型输出的目标图像,包括:
将所述待处理图像经过所述目标卷积层的前置网络层的逐层处理,得到所述目标卷积层的输入;
将每种降质因素各自对应的所述目标预设权重和所述目标权重系数相乘,得到多个乘积;
将多个所述乘积相加,得到多模态权重,将所述多模态权重作为所述目标卷积层的所述多模态卷积核;
通过所述目标卷积层中的多模态卷积核对所述目标卷积层的输入,进行卷积计算,得到后置网络层的输入,并经过所述后置网络层的逐层处理,得到所述目标图像。
3.如权利要求1所述的方法,其特征在于,在所述获取待处理图像之前,还包括:
获取用户输入的若干所述降质因素各自对应的第一权重系数;
获取样本图像对,所述样本图像对包括原始图像以及经过复原处理后的原始图像;
根据所述样本图像对,训练待训练的神经网络模型,以调整若干所述降质因素各自对应的第一预设权重以及第一权重系数,得到所述预先训练的神经网络模型,所述预先训练的神经网络模型中包括所述第一预设权重对应的目标预设权重和所述第一权重系数对应的目标权重系数。
4.如权利要求3所述的方法,其特征在于,所述根据所述样本图像对,训练待训练的神经网络模型,以调整若干所述降质因素各自对应的第一预设权重以及第一权重系数,得到所述预先训练的神经网络模型,包括:
根据所述样本图像对,训练所述待训练的神经网络模型,以调整若干所述降质因素对应的多个所述第一预设权重,得到第一神经网络模型;
根据所述样本图像对,训练所述第一神经网络模型,以调整所述第一神经网络模型中所述第一权重系数以及第二预设权重,得到所述预先训练的神经网络模型,所述第二预设权重为所述第一预设权重经过训练后得到的权重。
5.如权利要求4所述的方法,其特征在于,所述根据所述样本图像对,训练所述待训练的神经网络模型,以调整若干所述降质因素对应的多个所述第一预设权重,得到第一神经网络模型,包括:
将多个所述第一预设权重的其中一个第一预设权重,作为训练对象;
将所述多个第一预设权重中所述训练对象对应的第一预设权重之外的其他第一预设权重设定为预设数值;
根据所述样本图像对,训练所述待训练的神经网络模型中的所述训练对象;
重复执行所述将多个所述第一预设权重的其中一个第一预设权重,作为训练对象的步骤以及后续步骤,直至多个所述第一预设权重训练完成,得到所述第一神经网络。
6.一种图像处理装置,其特征在于,所述装置包括:
第一获取单元,用于获取待处理图像,所述待处理图像包括具有若干降质因素的图像;
处理单元,用于将所述待处理图像输入预先训练的神经网络模型中,由所述预先训练的神经网络模型对所述待处理图像进行处理,得到由所述预先训练的神经网络模型输出的目标图像;
其中,所述预先训练的神经网络模型中包含根据若干所述降质因素各自对应的目标预设权重和目标权重系数得到的目标卷积层的多模态卷积核,所述多模态卷积核用于提取若干所述降质因素的特征。
7.如权利要求6所述的装置,其特征在于,所述神经网络模型包括多个由卷积层和激活函数构成的模块,所述模块包括特征提取模块、特征增强模块以及重建模块,其中,所述特征提取模块和/或所述特征增强模块中包括目标卷积层;
所述处理单元,具体用于将所述待处理图像经过所述目标卷积层的前置网络层的逐层处理,得到所述目标卷积层的输入;将每种降质因素各自对应的所述目标预设权重和所述目标权重系数相乘,得到多个乘积;将多个所述乘积相加,得到多模态权重,将所述多模态权重作为所述目标卷积层的所述多模态卷积核;通过所述目标卷积层中的多模态卷积核对所述目标卷积层的输入,进行卷积计算,得到后置网络层的输入,并经过所述后置网络层的逐层处理,得到所述目标图像。
8.如权利要求6所述的装置,其特征在于,所述装置,还包括:
第二获取单元,用于获取用户输入的若干所述降质因素各自对应的第一权重系数;
第三获取单元,用于获取样本图像对,所述样本图像对包括原始图像以及经过复原处理后的原始图像;
训练单元,用于根据所述样本图像对,训练待训练的神经网络模型,以调整若干所述降质因素各自对应的第一预设权重以及第一权重系数,得到所述预先训练的神经网络模型。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010869230.7A CN114119377A (zh) | 2020-08-26 | 2020-08-26 | 一种图像处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010869230.7A CN114119377A (zh) | 2020-08-26 | 2020-08-26 | 一种图像处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114119377A true CN114119377A (zh) | 2022-03-01 |
Family
ID=80374154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010869230.7A Pending CN114119377A (zh) | 2020-08-26 | 2020-08-26 | 一种图像处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114119377A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2623140A (en) * | 2023-03-02 | 2024-04-10 | Imagination Tech Ltd | Methods and systems for performing a sparse submanifold convolution using an NNA |
-
2020
- 2020-08-26 CN CN202010869230.7A patent/CN114119377A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2623140A (en) * | 2023-03-02 | 2024-04-10 | Imagination Tech Ltd | Methods and systems for performing a sparse submanifold convolution using an NNA |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109064428B (zh) | 一种图像去噪处理方法、终端设备及计算机可读存储介质 | |
CN111275626B (zh) | 一种基于模糊度的视频去模糊方法、装置及设备 | |
CN107358586B (zh) | 一种图像增强方法、装置及设备 | |
CN110675336A (zh) | 一种低照度图像增强方法及装置 | |
CN112862681B (zh) | 一种超分辨率方法、装置、终端设备及存储介质 | |
US20170316552A1 (en) | Blind image deblurring via progressive removal of blur residual | |
CN110533607B (zh) | 一种基于深度学习的图像处理方法、装置及电子设备 | |
CN109325928A (zh) | 一种图像重建方法、装置及设备 | |
CN111784570A (zh) | 一种视频图像超分辨率重建方法及设备 | |
CN112602088B (zh) | 提高弱光图像的质量的方法、系统和计算机可读介质 | |
CN109785246B (zh) | 一种非局部均值滤波的降噪方法、装置及设备 | |
WO2014070273A1 (en) | Recursive conditional means image denoising | |
CN110830808A (zh) | 一种视频帧重构方法、装置及终端设备 | |
CN112508816B (zh) | 一种红外图像锐化方法、锐化处理系统及终端设备 | |
WO2021082819A1 (zh) | 一种图像生成方法、装置及电子设备 | |
CN111709879B (zh) | 图像处理方法、图像处理装置及终端设备 | |
Malik et al. | Llrnet: A multiscale subband learning approach for low light image restoration | |
Park et al. | Color filter array demosaicking using densely connected residual network | |
CN111882565A (zh) | 一种图像二值化方法、装置、设备及存储介质 | |
CN110717864A (zh) | 一种图像增强方法、装置、终端设备及计算机可读介质 | |
CN111429371A (zh) | 图像处理方法、装置及终端设备 | |
US11948278B2 (en) | Image quality improvement method and image processing apparatus using the same | |
CN111325671B (zh) | 网络训练方法、装置、图像处理方法及电子设备 | |
CN113298740A (zh) | 一种图像增强方法、装置、终端设备及存储介质 | |
CN111222446B (zh) | 人脸识别方法、人脸识别装置及移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |