CN113688832A - 一种模型训练及图像处理方法、装置 - Google Patents
一种模型训练及图像处理方法、装置 Download PDFInfo
- Publication number
- CN113688832A CN113688832A CN202110993903.4A CN202110993903A CN113688832A CN 113688832 A CN113688832 A CN 113688832A CN 202110993903 A CN202110993903 A CN 202110993903A CN 113688832 A CN113688832 A CN 113688832A
- Authority
- CN
- China
- Prior art keywords
- processed
- image
- model
- feature
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本说明书公开了一种模型训练及图像处理方法、装置。通过待训练的图像处理模型的第一模型中的对待处理图像进行处理并输出已处理图像,并且采用图像处理模型中的第二模型来预测已处理图像中各已处理区域与对应的标注图像的标注区之间的预测差异度,以根据预测差异度来为各已处理区域确定出区域权重,并通过以区域权重加权后的已处理图像和标注图像之间真实的标注差异度的最小为目标调整图像处理模型中的参数。使得在训练的过程中能够对预测差异度较大的区域投入更多的关注,从而避免待处理图像中需要进行处理的区域较小而导致模型训练得到较小的损失时所输出的已处理图像在需要处理的区域仍然难以得到较好的处理。
Description
技术领域
本说明书涉及计算机视觉领域,尤其涉及一种模型训练及图像处理方法、装置。
背景技术
随着图像处理技术的发展,机器学习被越来越广泛地应用于图像处理领域对图像进行修复和优化,例如,可以对图像中缺失/遮挡部分进行填补,可以去除图像中所包含的水印,再例如,可以对黑白图像进行上色,还可以将低分辨率图像修复为高分辨率图像等等。
在现有技术中,常见采用生成对抗网络(Generative adversarial network,GAN)中训练后的生成器作为图像处理模型。GAN包括生成器和判别器,在训练的过程中,生成器对图像进行处理,以上述去除图像水印的任务为例,生成器根据所输入的包含水印的图像进行水印去除,并输出处理之后的图像,而判别器则在生成器所输出的图像以及未包含水印的图像的集合中,对各图像进行打分以判断各图像是否为生成器所输出的水印去除的图像。
一方面,可以根据判别器对生成器的打分对GAN中的参数进行训练,而另一方面,则可以根据判别器对各图像的判别结果以及对应的图像的标注之间的差异,来对GAN中的参数进行训练。
但在实际中,对于图像处理任务中需要进行处理的区域可能较小,例如水印在图像中的面积占比较小,判别器难以察觉较小区域的差异,从而导致所训练出的生成器难以生成处理质量较优的图像。
发明内容
本说明书提供一种模型训练及图像处理方法、装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种模型训练方法,包括:
确定待训练的图像处理模型,所述图像处理模型包括第一模型和第二模型;
确定待处理的样本图像,并输入所述样本图像至所述图像处理模型;
通过所述第一模型,根据所述样本图像,得到第一模型输出的已处理图像;通过所述第二模型,针对已处理图像中所包括的每个已处理区域,为该已处理区域从标注图像中确定出所对应的标注区域,对该已处理区域与对应的标注区域之间的差异度进行预测,并根据得到的预测差异度为各已处理区域确定对应的区域权重;
针对每个已处理区域,确定该已处理区域与对应的标注区域之间的差异度,作为该已处理区域的标注差异度;
以该已处理区域对应的区域权重对该已处理区域的标注差异度进行加权;
以加权后的各已处理区域的标注差异度最小为目标,调整所述图像处理模型中的参数。
可选地,所述方法还包括:
以所述第二模型为各已处理区域预测出的预测差异度与各已处理区域的标注差异度之间的差异最小为目标,调整所述图像处理模型中的参数。
可选地,已处理区域由已处理图像中被处理的若干个像素构成;
确定该已处理区域与对应的标注区域之间的差异度,具体包括:
针对该已处理区域中所包括的每个像素点,确定该像素点所属的像素点对,所述像素点对中还包括与该已处理区域相对应的标注区域中,与该像素点相对应的像素点;
针对每个像素点对,确定该像素点对中两个像素点的像素值;
将各像素点对中两个像素点的像素值的差值的绝对值之和,作为已处理区域与对应的标注区域之间的差异度,和/或,将各像素点对两个像素点的像素值的梯度的差值的绝对值之和,作为已处理区域与对应的标注区域之间的差异度。
可选地,所述第一模型包括粗处理子网络和精处理子网络;
通过所述第一模型对所述样本图像进行处理,得到第一模型输出的已处理图像,具体包括:
通过第一模型中所包括的粗处理子网络,根据输入所述粗处理子网络的样本图像,得到粗处理子网络输出的粗处理图像;
将所述粗处理图像输入至第一模型的精处理子网络中,通过所述精处理子网络,得到精处理子网络输出的已处理图像。
可选地,所述粗处理子网包括第一编码端和第一解码端;
通过第一模型中所包括的粗处理子网络,根据输入所述粗处理子网络的样本图像,得到粗处理子网络输出的粗处理图像,具体包括:
根据输入粗处理子网的第一编码端中的样本图像,通过所述第一编码端中所包括的若干个顺次相连的特征提取层,得到所述第一编码端的最后一个特征提取层输出的第一编码特征;
确定所述由所述第一编码端中的第一指定提取层输出的第一指定特征,并将所述第一指定特征,以及所述第一编码特征输入所述第一解码端;
通过所述第一解码端,根据所述第一编码特征以及所述第一指定特征,确定出图像粗特征;
根据所述图像粗特征,通过所述第一解码端,得到粗处理图像。
可选地,所述精处理子网包括第二编码端和第二解码端;
将所述粗处理图像输入至第一模型的精处理子网络中,通过所述精处理子网络,得到精处理子网络输出的已处理图像,具体包括:
输入所述粗处理图像至所述精处理子网的第二编码端,通过所述第二编码端中所包括的若干个顺次相连的特征提取层,得到所述第一编码端的最后一个特征提取层输出的第二编码特征;
确定所述由所述第二编码端中的第二指定提取层输出的第二指定特征,并将所述第二指定特征,以及所述第二编码特征至所述第二解码端;
通过所述第二解码端,根据所述第二编码特征以及所述第二指定特征,确定出图像精特征;
根据所述图像精特征,通过所述第二解码端,得到已处理图像。
可选地,第一编码端和/或第二编码端的各特征提取层中包括至少一个残差块。
可选地,所述精处理子网中包括第一调整子网络;
通过所述第二解码端,根据所述第二编码特征以及所述第二指定特征,确定出图像精特征,具体包括:
将所述第二编码特征输入所述第一调整子网络,通过所述第一调整子网络中的池化层,根据所述第二编码特征,得到所述第二编码特征的全局特征;
以所述全局特征对所述第二编码特征进行粗调整,得到粗调整后的第二编码特征;
根据所述第一调整子网络所输出的粗调整后的第二编码特征,通过所述精处理子网对所述第二编码特征进行精调整,得到精调整后的第二编码特征;
通过所述第二解码端,根据精调整后的第二编码特征以及所述第二指定特征确定出图像精特征。
可选地,所述精处理子网包括第二调整子网络,所述第二调整子网络包括若干个顺次相连的特征提取层;
根据所述第一调整子网络所输出的粗调整后的第二编码特征,通过所述精处理子网对所述第二编码特征进行精调整,得到精调整后的第二编码特征,具体包括:
将所述第一调整子网络所输出的粗调整后的第二编码特征作为所述第二调整子网络中的第一个特征提取层的输入,通过所述第二调整子网络中顺次相连的各特征提取层,得到最后一个特征提取层输出的精调整后的第二编码特征。
可选地,第二调整子网络中所包括的特征提取层中至少包括一个密集块。
可选地,为该已处理区域从标注图像中确定出所对应的标注区域,并对该已处理区域与对应的标注区域之间的差异度进行预测,具体包括:
根据输入粗处理子网的第一编码端中的样本图像,通过所述第一编码端中所包括的若干个特征提取层,得到所述第一编码端输出的第一编码特征;
确定所述由所述第一编码端中的第一指定提取层输出的第一指定特征,并将所述第一指定特征,以及所述第一编码特征输入所述第二模型;
通过所述第二模型中所包含的特征融合层,得到根据所述第一编码特征以及所述第一指定特征融合出的差异特征;
根据所述差异特征,通过所述第二模型,得到所预测出的该已处理区域与对应的标注区域之间的差异度。
可选地,根据所述差异特征,通过所述第二模型,得到所预测出的该已处理区域与对应的标注区域之间的差异度,具体包括:
根据所述已处理图像中的各已处理区域,将所述差异特征划分为若干个差异子特征,其中,针对每个已处理区域,该已处理区域的差异子特征表征该已处理区域与该已处理区域所对应的标注区域之间的差异;
针对每个已处理区域,根据该已处理区域的差异子特征,通过所述第二模型的差异预测层,得到为该已处理区域所预测出的预测差异度;
根据各已处理区域的预测差异度,确定所述已处理图像的预测差异度。
可选地,根据各已处理区域的预测差异度,确定所述已处理图像的预测差异度,具体包括:
针对每个已处理区域,根据该已处理区域的预测差异度,以及预先指定的差异阈值,从预先指定的各待匹配参数中为该已处理区域选择出表征该已处理区域与对应的标注区域之间的差异度的匹配参数;
根据各已处理区域的匹配参数,为所述已处理图像确定匹配参数图,作为为该已处理图像所预测的预测差异度。
本说明书提供了一种图像处理方法,包括:
确定待处理图像,并将所述待处理图像输入图像处理模型所包括的第一模型中的粗处理子网,其中,所述图像处理模型是预先采用上述方法训练得到的;
通过所述粗处理子网,根据所述样本图像,得到粗处理图像,并输入所述粗处理图像至所述图像处理模型所包括的第一模型中的精处理子网,得到所述精处理子网输出的已处理图像。
可选地,所述方法还包括:
在假设存在所述待处理图像对应的标注图像的条件下,通过所述第二模型,针对已处理图像中所包括的每个已处理区域,为该已处理区域从标注图像中确定出所对应的标注区域,并对该已处理区域与对应的标注区域之间的差异度进行预测,得到该已处理区域的预测差异度;
根据每个已处理区域的预测差异度,确定已处理图像的图像质量;
根据已处理图像的图像质量判断是否将所述已处理图像重新作为待处理图像。
本说明书提供了一种模型训练装置,包括:
模型确定模块,用于确定待训练的图像处理模型,所述图像处理模型包括第一模型和第二模型;
图像输入模块,用于确定待处理的样本图像,并输入所述样本图像至所述图像处理模型;
图像处理模块,用于通过所述第一模型,根据所述样本图像,得到第一模型输出的已处理图像;通过所述第二模型,针对已处理图像中所包括的每个已处理区域,为该已处理区域从标注图像中确定出所对应的标注区域,并对该已处理区域与对应的标注区域之间的差异度进行预测,并根据得到的预测差异度为各已处理区域确定对应的区域权重;
差异确定模块,用于针对每个已处理区域,确定该已处理区域与对应的标注区域之间的差异度,作为该已处理区域的标注差异度;
差异加权模块,用于以该已处理区域对应的区域权重对该已处理区域的标注差异度进行加权;
参数调整模块,用于以加权后的各已处理区域的标注差异度最大为目标,调整所述图像处理模型中的参数。
本说明书提供了一种图像处理装置,包括:
特征输入模块,用于通过所述粗处理子网,根据所述样本图像,得到粗处理图像,并输入所述粗处理图像至所述图像处理模型所包括的第一模型中的精处理子网,得到所述精处理子网输出的已处理图像;
图像输出模块,用于通过所述粗处理子网,根据所述样本图像,得到粗处理图像,并输入所述粗处理图像至所述图像处理模型所包括的第一模型中的精处理子网,得到所述精处理子网输出的已处理图像。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练及图像处理方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练及图像处理方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书提供的模型训练及图像处理方法中,通过待训练的图像处理模型的第一模型中对待处理图像进行处理并输出已处理图像,并且采用图像处理模型中的第二模型来预测已处理图像中各已处理区域与对应的标注图像的标注区之间的预测差异度,以根据预测差异度来为各已处理区域确定出区域权重,并通过以区域权重加权后的已处理图像和标注图像之间真实的标注差异度的最小为目标调整图像处理模型中的参数。
使得在训练的过程中能够对预测差异度较大的区域投入更多的关注,从而避免待处理图像中需要进行处理的区域较小而导致模型训练得到较小的损失时所输出的已处理图像在需要处理的区域仍然难以得到较好的处理。
而在实际应用中,也能通过训练后的第一模型得到图像处理质量较优的已处理图像。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书提供的一种图像处理模型的示意图;
图2为本说明书提供的一种粗处理子网的示意图;
图3为本说明书提供的一种精处理子网示意图;
图4为本说明书提供的另一种精处理子网示意图;
图5为本说明书提供的一种第二模型的示意图;
图6为本说明书提供的一种模型训练方法的流程示意图;
图7为本说明书提供的一种图像处理方法的流程示意图;
图8为本说明书提供的一种模型训练装置的示意图;
图9为本说明书提供的一种图像处理装置的示意图;
图10为本说明书提供的电子设备的结构示意图。
具体实施方式
为了解决上述由于GAN中判别器的判断差异,而导致训练后生成器所进行的图像处理质量较差这一问题,本说明书实施例提出了一种图像处理模型,其中,除了包括用于进行图像处理的第一模型以外,还包括第二模型。
在训练阶段,第二模型对通过第一模型得到的输出处理后的图像与对应的标注图像之间的差异进行预测,并根据所预测出的预测差异度对处理后的图像与对应的标注图像之间实际的差异度进行加权,使得在第二模型中所预测的图像处理较差的区域的权重更高,即在训练过程中能够将上述面积小、优化效果差的区域以更高的权重体现在损失中,从而提高所训练出的图像处理模型对于图像的处理效果。
而在实际应用阶段,仅通过第一模型进行图像处理。
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
本说明书实施例提供的图像处理模型及图像处理方法可以应用于对图像进行修复或优化,例如,可以对图像中缺失/遮挡部分进行填补,再例如,可以对黑白图像进行上色,还可以将低分辨率图像修复为高分辨率图像,本说明书一实施例中,可以采用所述图像处理模型去除图像中所包含的水印。可以看出,本说明书实施例提供的图像处理方法包括多种图像处理用途,本说明在此不一一枚举,以下,本说明书实施例示例性地以去除图像中所包含的水印为例对本说明书实施例所提供的技术方案进行说明。
为便于描述,本说明书以下分为三个实施例对本说明书提供的图像处理模型及其训练和应用的方式进行介绍。
其中,实施例一用于介绍本说明书提供的图像处理模型,实施例二用于介绍对本说明书所提供的图像处理模型进行训练的训练方式,实施例三则介绍通过本说明书提供的图像处理模型进行图像处理的技术方案。
本说明书中对所述图像处理模型进行训练的执行主体和应用本说明书提供的图像处理模型进行图像处理的执行主体可以为同一执行主体,也可以为不同的执行主体,其中任一执行主体可以为终端设备或服务器。当执行主体为终端时,所述执行主体可以为任一现有形式的终端设备,例如可以为手机、平板电脑等,而当执行主体为服务器时,也可以为集群式服务器或分布式服务器等,本说明书对此不作限制。
实施例一:
图1为本说明书实施例提供的一种图像处理模型的示意图。
本说明书实施例提供的图像处理模型中包括第一模型和第二模型,所述图像处理模型中任一子网络可以为任一现有的机器学习模型。
在图1示出的图像处理模型中,输入样本图像(或实际应用阶段的待处理图像)至第一模型,经过第一模型中粗处理子网和精处理子网的处理,第一模型输出图像处理后的已处理图像,而第二模型则输出对已处理图像与标注图像之间的差异进行预测所得到的所述已处理图像的预测差异度。
其中,在训练阶段,输入粗处理子网的为对应有标注图像的样本图像,第二模型输出的则是所预测出的已处理图像和标注图像之间的预测差异度,由于标注图像即对待处理图像进行优化的优化目标,因此,在实际应用阶段,虽然并不存在“标注图像”这一实体图像,但仍然可以将第二模型的输出结果称为对已处理图像和假设中的标注图像这一优化目标之间进行预测,并得到的预测差异度。
因此,本领域技术人员可以理解的,所述第二模型输出的预测差异度能够表征已处理图像的图像处理质量。
本说明书一实施例中,待处理图像(或训练阶段的样本图像)、粗处理图像、已处理图像,以及标注图像之间会存在对应关系,针对上述任两图像,位于两图像中相同位置的由若干个像素点构成的图像区域可以视作相对应的图像区域。
本说明书实施例中,可以根据已处理区域中所包括的各像素点来确定已处理区域与对应的标注区域之间的差异度。
具体的,可以针对该已处理区域中所包括的每个像素点,确定该像素点所属的像素点对,所述像素点对中还包括与该已处理区域相对应的标注区域中,与该像素点相对应的像素点;针对每个像素点对,确定该像素点对中两个像素点的像素值;将各像素点对中两个像素点的像素值的差值的绝对值之和,作为已处理区域与对应的标注区域之间的差异度,和/或,将各像素点对两个像素点的像素值的梯度的差值的绝对值之和,作为已处理区域与对应的标注区域之间的差异度。
本说明书一实施例中,针对每个像素点对,该像素点对中的两个像素点在其所属的图像区域中的位置相同。
因此,在本说明书实施例一,仅示例性的以输入粗处理子网的为样本图像为例,对本说明书实施例提供的图像处理模型的模型结构进行说明。
如图1所示,所述粗处理子网包括第一编码端和第一解码端,其中,如图2中示出的,第一编码端可以包括由若干个顺次相连的特征提取层,将样本图像输入粗处理子网的第一编码端的第一个特征提取层,并通过所述第一编码端中的若干个特征提取层依次进行特征提取,得到第一编码端中的最后一个特征提取层所输出的编码特征。
本说明书实施例中所称的特征提取层可以为若干个同一类型的神经网络,也可以并不为同一种类型的神经网络,例如,其中任一特征提取层可以为池化层、卷积层、全连接层、任一现有的激活函数,或是用于构成的残差子网络(ResNet)的残差块(ResidualBuilding Block),以及用于构成DenseNet的密集块(DenseBlock)等等,本说明书对此不作限制。在本说明书实施例中,除特别说明以外,各特征提取层并不重复作为不同模型中所包括的特征提取层,即两两特征提取层之间,特征提取层中的参数可以并不相同。
可以预先指定所述第一编码端中各特征提取层中之一为第一指定提取层,并将所述第一指定提取层输出的特征作为第一指定特征,本说明书一实施例中,所述第一指定提取层可以为第一编码端中所包含的各特征提取层中的第一个特征提取层,即样本图像输入粗处理子网时所输入的特征提取层,更进一步的,本说明书实施例中所述第一指定提取层可以为卷积层。
然后,可以将第一指定特征和第一编码特征输入第一解码端。
本说明书一实施例中,所述第一解码端可以由若干个顺次相连的特征提取层构成,本说明书一实施例中,可以将所述第一编码特征输入所述第一解码端中所包含的第一个特征提取层,并将经过指定个数个特征提取层处理后的第一编码特征与输入第一解码端的第一指定特征相融合,再将融合得到的图像粗特征继续输入下一个特征提取层,直至最后一个特征提取层输出粗处理图像。当然,本说明书另一实施例中,还可以在将第一编码特征以及第一指定特征输入第一解码端时直接融合为图像粗特征,然后依次以各特征提取层对所述图像粗特征进行处理,以得到粗处理图像。
本说明书实施中,融合所述第一指定特征和第一编码特征的方式可以为将第一指定特征和第一编码特征采用诸如concat等函数进行拼接,并得到拼接后的图像粗特征。
本说明一实施例中,精处理子网可以由第二编码端和第二解码端构成,所述第二编码端的模型结构可以与第一编码端相同,所述第二解码端的模型结构也可以与第一解码端相同,也就是说,与第一编码端相类似的,第二编码端也可以包括有若干个顺次相连的特征提取层,然后,第一解码端输出的粗处理图像可以输入至第二编码端的第一个特征提取层,并在经过第一编码端的各特征提取层的处理之后,得到对所述粗处理图像进行编码的第二编码特征。
类似的,所述第二编码端中也可以包括由第二指定提取层,可以将所述第二指定提取层输出的特征作为第二指定特征,本说明书一实施例中,与粗处理子网中相类似的,所述第二指定提取层可以为第二编码端中所包含的各特征提取层中的第一个特征提取层,即粗处理图像输入粗处理子网时所输入的特征提取层,更进一步的,本说明书实施例中所述第二指定提取层可以为卷积层。
本说明书提供以下两种精处理子网的模型结构。
第一种,可以直接将所述第二编码特征以及第二指定特征输入至第二解码端,并通过上述与第一编码特征和第一指定特征融合时的任一方式,得到由第二编码特征以及第二指定特征融合出的图像精特征,以根据所述图像精特征,通过第二解码端中顺次相连的若干个特征提取层得到第二解码端中最后一个特征提取层输出的已处理图像。
而在第二种中,如图1、图3所示,所述精处理子网还可以包括有第一调整子网络和第二调整子网络,在得到第二编码端输出的第二编码特征之后,可以将所述第二编码特征输入至第一调整子网络,通过所述第一调整子网络对所述第二编码特征进行粗调整,然后,将所述第一调整子网络所输出的粗调整后的第二编码特征输入至所述第二调整子网络,通过所述第二调整子网络,得到精调整后的第二编码特征,最后,可以根据精调整后的第二编码特征以及所述第二指定特征确定出图像精特征,并通过第二解码端中的特征提取层,根据所述图像精特征得到输出的已处理图像。
示例性的,本说明书实施例以下以上述第二种为例进行说明。
如图4所示,第一调整子网络中可以包括用于提取全局特征的若干个收尾相连的特征提取层,其中至少包含一个池化层,示例性的,所述池化层可以是平均池化层,本说明书一实施例中,所述池化层的池化窗口可以与输入所述池化层的特征的规模相同,在此情形下,池化层输出的全局特征在各通道上为表征该通道上第二编码特征在全局上特征的数值,即为全局特征。仅示例性的,用于提取全局特征的各特征提取层中可以为全连接层,更进一步的,所述全连接层可以包括有激活函数,即将全连接层的输出输入对应的激活函数。
本说明书一实施例中,可以直接根据全局特征对所述第二编码特征进行粗调整,此时,所述全局特征的通道数与第二编码特征的通道数相同,即在第二编码特征的每一特征图上一所述全局特征进行加权。本说明书另一实施例中,还可以先以另一特征提取层对第二编码特征进行处理,例如可以以卷积层进行处理,以使特征提取层处理后的第二编码特征的通道数与全局特征的通道数相同,此时,可以针对每一通道数,以该通道数对应的全局特征对该通道数对应的经上述特征提取层处理后的第二编码特征进行加权,从而得到粗调整后的第二编码特征。
然后,将粗调整后的第二编码特征输入至包括有若干个顺次相连的特征提取层的第二调整子网络,通过各特征提取层,得到最后一个特征提取层输出的精调整后的第二编码特征。本说明书一实施例中,所述第二调整子网络中的各特征提取层中可以包括至少一个用于构成DenseNet的DenseBlock,其中,所述DenseBlock可以由至少两个顺次相连的卷积层构成,并且每一个对特征在先进行处理的卷积层会将所卷积出的特征输入至所有在后对特征进行处理的卷积层。
总之,在通过上述任一方式得到精调整的第二编码特征之后,如图3所示,可以将所述精处理后的第二编码特征输入第二解码端,可选地,可以通过第二解码端中的一特征提取层对精处理后的第二编码特征进行特征提取,接着,可以根据输入所述第二解码端中的第二指定特征,以及上述任一方式通过或不通过第二解码端中的特征提取层处理后的精处理后的第二编码特征,融合得到图像精特征。
本说明书实施中,融合所述第二指定特征和第二编码特征的方式可以为将第二指定特征和第二编码特征采用诸如concat等函数进行拼接,并得到拼接后的图像精特征。
接着,如图3所示,通过所述第二解码端中的特征提取层,可以根据所述图像精特征输出已处理图像,本说明书一实施例中,输出已处理图像的所述特征提取层可以为卷积层。
以上,为第一模型的模型结构。接着,本说明书以下部分对第二模型来进行说明,所述第二模型用于根据样本图像预测已处理图像的预测差异度。如图1所示,第二模型包括特征融合层和差异预测层。
粗处理子网根据样本图像,通过上述任一方式输出第一编码特征和第一指定特征之后,可以将所述第一编码特征和第一指定特征输入至第二模型,并通过第二模型中的特征融合层,融合所述第一编码特征以及所述第一指定特征并得差异特征。
可以理解的,在训练阶段,可以通过与样本图像相对应的标注图像来评估已处理图像的处理质量,具体的,可以通过确定已处理图像与对应的标注图像之间的差异来评估已处理图像的处理质量,以去除水印的图像处理任务为例,当标注图像为无水印图像时,已处理图像与标注图像之间的差异越小,则代表所述第一模型对水印去除的越干净,处理质量越高。
因此,所述图像处理模型中还提供了第二模型,对第一模型所输出的已处理图像的图像处理质量进行评估。在模型训练阶段,第二模型输出的是对已处理图像与标注图像之间差异的预测,即预测差异度;而在实际应用阶段,第二模型输出的则是对已处理图像的预测差异度的预测,可以理解的,预测差异度越高,则表征第一模型输出的已处理图像的处理质量越差。
由于第二模型的输出均为对已处理图像的图像处理质量的评估值,因此,在训练阶段和实际应用阶段第二模型的输出的区别仅在与是否具有标注图像作为对比,为便于描述,本说明书以下部分以训练阶段为例进行说明。
如图5所示,所述特征融合层中还可以包括有特征提取层,第一编码特征在输入至第二模型的特征融合层之后,可以通过特征提取层进行特征提取,本说明书一实施例中,所述特征融合层中所包括的特征提取层可以为卷积层。接着,可以采用诸如concat等函数对第一编码特征和第一指定特征进行拼接,并得到拼接后的差异特征。
可以理解的,所述差异特征可以反映已处理图像整体的图像处理质量,而本说明书一实施中,在得到差异特征之后,可以将差异特征划分为若干个差异子特征,其中,每个差异子特征对应已处理图像中的已处理区域。
然后,可以将各差异子特征输入差异预测层,本说明书一实施例中,所述差异预测层可以为现有的激活函数,诸如Sigmoid激活函数、双曲正切函数(Tanh)激活函数等等,本说明书对此不作限制,并得到所述差异预测层输出的对应于各已处理区域的预测差异度,本说明书一实施例中,针对每个已处理区域,该已处理区域的预测差异度越高,则该已处理区域的图像处理质量则越低,当然,在训练阶段,该已处理区域与该已处理区域对应的标注区域之间的差异度也就越大。
接着,可以根据各已处理区域的预测差异度确定已处理图像的预测差异度。
本说明书一实施例中,在差异预测层输出预测差异度之后,
针对每个已处理区域,根据该已处理区域的预测差异度,以及预先指定的差异阈值,从预先指定的各待匹配参数中为该已处理区域选择出表征该已处理区域与对应的标注区域之间的差异度的匹配参数;根据各已处理区域的匹配参数,为所述已处理图像确定匹配参数图,作为为该已处理图像所预测的预测差异度。
其中,所述指定的差异阈值可以采用本说明书所述任一方式确定,然后,可以通过确定出由若干个差异阈值构成的若干各差异区间,每个差异区间中对应有待匹配参数,根据所述差异区间以及各已处理区域的预测差异度,将已处理区域的预测差异度所落入的差异区间对应的待匹配参数作为该已处理区域的匹配参数。
实施例二:
在训练阶段,以下图6为对上述提供的任一图像处理模型进行训练的模型训练方法的流程示意图,包括:
S600:确定待训练的图像处理模型,所述图像处理模型包括粗处理子网、精处理子网以及第二模型。
S602:确定待处理的样本图像,并输入所述样本图像至所述图像处理模型。
与样本图像相对应的是标注图像,标注图像是预先设置的作为样本图像的优化目标的图像,例如,当所述图像处理模型的处理任务是去除图像中所包含的水印时,标注图像为不包含水印的图像,样本图像则是在对应的标注图像中添加水印并覆盖在图像之上后,得到的包含水印的图像。
S604:通过所述第一模型,根据所述样本图像,得到第一模型输出的已处理图像;通过所述第二模型,针对已处理图像中所包括的每个已处理区域,为该已处理区域从标注图像中确定出所对应的标注区域,并对该已处理区域与对应的标注区域之间的差异度进行预测,并根据得到的预测差异度为各已处理区域确定对应的区域权重。
本说明书一实施例中,第二模型通过预测已处理区域和对应的标注区域之间的差异度来为各已处理区域确定出区域权重。
可以理解的,标注区域即为所对应的待处理区域的优化目标的图像区域,因此,当所预测出的预测差异度越大时,可以为已处理区域确定出越大的区域权重,使得该已处理区域与标注区域的差异在训练时成为更被关注的区域差异。
本说明书另一实施例中,针对每个已处理区域,为该已处理区域所确定出的区域权重可以为0或1,根据预先指定的差异阈值,将预测差异度大于所述差异阈值的已处理区域的区域权重设置为1,并将预测差异度小于所述差异阈值的已处理区域的区域权重设置为0。所述差异阈值可以根据为各已处理区域所预测出的预测差异度设定,例如,可以为各已处理区域所预测出的预测差异度的平均值,也可以为各已处理区域所预测出的预测差异度中最大值的指定比例,例如10%等等,可以采用任何方式设置上述差异阈值,本说明书对此不作赘述。当然,在实际应用阶段,也可以采用该差异阈值的确定方式,来确定根据各指定区域的预测差异度确定指定阈值。
S606:针对每个已处理区域,确定该已处理区域与对应的标注区域之间的差异度,作为该已处理区域的标注差异度。
本说明书实施例中,可以采用以下两种方式,确定所述标注差异度,包括:
第一种,针对每个已处理区域,将该已处理区域与所对应的标注区域的像素值的差值作为该已处理区域的标注差异度;
第二种,针对每个已处理区域,将该已处理区域与所对应的标注区域的像素值的差值的一阶梯度,作为该已处理区域的标注差异度。
其中,以上述第一种方式训练所述图像处理模型的目的是训练所述图像处理模型输出的各像素的像素值更准确(即与标注图像的中对应像素的像素值接近),而采用第二种方式训练所述图像处理模型则能够使得所述图像处理模型输出的已处理图像中所包含的内容的轮廓与标注图像中的轮廓相似。
当然,除上述外,还可以通过其他方式确定所述标注差异度,本说明书对此不作限制。
S608:以该已处理区域对应的区域权重对该已处理区域的标注差异度进行加权。
S610:以加权后的各已处理区域的标注差异度最大为目标,调整所述图像处理模型中的参数。
本说明书一实施例中,当采用至少两种方式确定标注差异度时,可以以区域权重对各种标注差异度进行加权,也可以仅为其中部分方式所确定出的标注差异度加权,本说明书对此不作限制。
最后,可以在至少部分的标注差异度进行加权后,以各已处理区域的标注差异度最大为目标。
此外,本说明书实施例还提供一种参数调整方式,即以所述第二模型为各已处理区域预测出的预测差异度,以及各已处理区域的标注差异度之间的差异最小为目标,调整所述图像处理模型中的参数。
基于图6所示的模型训练方法,通过待训练的图像处理模型的第一模型对待处理图像进行处理并输出已处理图像,并且采用图像处理模型中的第二模型来预测已处理图像中各已处理区域与对应的标注图像的标注区之间的预测差异度,以根据预测差异度来为各已处理区域确定出区域权重,并通过以区域权重加权后的已处理图像和标注图像之间真实的标注差异度的最小为目标调整图像处理模型中的参数。
使得在训练的过程中能够对预测差异度较大的区域投入更多的关注,从而避免待处理图像中需要进行处理的区域较小而导致模型训练得到较小的损失时所输出的已处理图像在需要处理的区域仍然难以得到较好的处理。
实施例三:
在实际应用阶段,可以采用实施例二中训练出的图像处理模型,根据待处理图像得到所输出的已处理图像。本说明书实施例中的图像处理方法的流程图如图7所示。
S700:确定待处理图像,并将所述待处理图像输入图像处理模型所包括的第一模型中的粗处理子网,其中,所述图像处理模型是预先采用上述的方法训练得到的。
S702:通过所述粗处理子网,根据所述样本图像,得到粗处理图像,并输入所述粗处理图像至所述图像处理模型所包括的第一模型中的精处理子网,得到所述精处理子网输出的已处理图像。
本说明书一实施例中,实际应用阶段还会根据上述任一方式确定第二模型所输出的已处理图像的预测差异度,具体的,在假设存在所述待处理图像对应的标注图像的条件下,通过所述第二模型,针对已处理图像中所包括的每个已处理区域,为该已处理区域从标注图像中确定出所对应的标注区域,并对该已处理区域与对应的标注区域之间的差异度进行预测,得到该已处理区域的预测差异度;根据每个已处理区域的预测差异度,确定已处理图像的图像质量;根据已处理图像的图像质量判断是否将所述已处理图像重新作为待处理图像。
本说明书一实施例中,所述待处理图像对应的标注图像即为对待处理图像进行处理所欲得到的理想图像,承上例,当图像处理的任务为去除水印时,待处理图像对应的标注图像即为高还原度的无水印图像。
当已处理图像的预测差异度较高时,则表征该已处理图像的处理效果较差,本说明书一实施例中,可以根据已处理图像的预测差异度判断是否将已处理图像重新作为待处理图像,例如,可以预设有指定的再处理阈值,并将超过预测差异度超过所述在处理阈值的已处理图像重新作为待处理图像。
以上为本说明书的一个或多个实施例提供的模型训练方法,基于同样的思路,本说明书还提供了相应的模型训练装置,如图8所示。
图8为本说明书提供的一种模型训练装置示意图,该装置包括:
模型确定模块800,用于用于确定待训练的图像处理模型,所述图像处理模型包括第一模型和第二模型;
图像输入模块802,用于确定待处理的样本图像,并输入所述样本图像至所述图像处理模型;
图像处理模块804,用于于通过所述第一模型,根据所述样本图像,得到第一模型输出的已处理图像;通过所述第二模型,针对已处理图像中所包括的每个已处理区域,为该已处理区域从标注图像中确定出所对应的标注区域,并对该已处理区域与对应的标注区域之间的差异度进行预测,并根据得到的预测差异度为各已处理区域确定对应的区域权重;
差异确定模块806,用于针对每个已处理区域,确定该已处理区域与对应的标注区域之间的差异度,作为该已处理区域的标注差异度;
差异加权模块808,用于以该已处理区域对应的区域权重对该已处理区域的标注差异度进行加权;
参数调整模块810,用于以加权后的各已处理区域的标注差异度最大为目标,调整所述图像处理模型中的参数。
可选地,所述参数调整模块810还用于:以所述第二模型为各已处理区域预测出的预测差异度,以及各已处理区域的标注差异度之间的差异最小为目标,调整所述图像处理模型中的参数。
可选地,已处理区域由已处理图像中被处理的若干个像素构成;所述差异确定模块806具体用于,针对该已处理区域中所包括的每个像素点,确定该像素点所属的像素点对,所述像素点对中还包括与该已处理区域相对应的标注区域中,与该像素点相对应的像素点;针对每个像素点对,确定该像素点对中两个像素点的像素值;将各像素点对中两个像素点的像素值的差值的绝对值之和,作为已处理区域与对应的标注区域之间的差异,和/或,将各像素点对两个像素点的像素值的梯度的差值的绝对值之和,作为已处理区域与对应的标注区域之间的差异。
可选地,所述第一模型包括粗处理子网络和精处理子网络;所述图像处理模块804具体用于,通过第一模型中所包括的粗处理子网络,根据输入所述粗处理子网络的样本图像,得到粗处理子网络输出的粗处理图像;将所述粗处理图像输入至第一模型的精处理子网络中,通过所述精处理子网络,得到精处理子网络输出的已处理图像。
可选地,所述粗处理子网包括第一编码端和第一解码端;所述图像处理模块804具体用于,根据输入粗处理子网的第一编码端中的样本图像,通过所述第一编码端中所包括的若干个顺次相连的特征提取层,得到所述第一编码端的最后一个特征提取层输出的第一编码特征;确定所述由所述第一编码端中的第一指定提取层输出的第一指定特征,并将所述第一指定特征,以及所述第一编码特征输入所述第一解码端;通过所述第一解码端,根据所述第一编码特征以及所述第一指定特征,确定出图像粗特征;根据所述图像粗特征,通过所述第一解码端,得到粗处理图像。
可选地,所述精处理子网包括第二编码端和第二解码端;所述图像处理模块804具体用于,输入所述粗处理图像至所述精处理子网的第二编码端,通过所述第二编码端中所包括的若干个顺次相连的特征提取层,得到所述第一编码端的最后一个特征提取层输出的第二编码特征;确定所述由所述第二编码端中的第二指定提取层输出的第二指定特征,并将所述第二指定特征,以及所述第二编码特征至所述第二解码端;通过所述第二解码端,根据所述第二编码特征以及所述第二指定特征,确定出图像精特征;根据所述图像精特征,通过所述第二解码端,得到已处理图像。
可选地,第一编码端和/或第二编码端的各特征提取层中包括至少一个残差块。
可选地,所述精处理子网中包括第一调整子网络;所述图像处理模块804具体用于,将所述第二编码特征输入所述第一调整子网络,通过所述第一调整子网络中的池化层,根据所述第二编码特征,得到所述第二编码特征的全局特征;以所述全局特征对所述第二编码特征进行粗调整,得到粗调整后的第二编码特征;根据所述第一调整子网络所输出的粗调整后的第二编码特征,通过所述精处理子网对所述第二编码特征进行精调整,得到精调整后的第二编码特征;通过所述第二解码端,根据精调整后的第二编码特征以及所述第二指定特征确定出图像精特征。
可选地,所述精处理子网包括第二调整子网络,所述第二调整子网络包括若干个顺次相连的特征提取层;所述图像处理模块804具体用于,将所述第一调整子网络所输出的粗调整后的第二编码特征作为所述第二调整子网络中的第一个特征提取层的输入,通过所述第二调整子网络中顺次相连的各特征提取层,得到最后一个特征提取层输出的精调整后的第二编码特征。
可选地,第二调整子网络中所包括的特征提取层中至少包括一个密集块。
可选地,所述差异确定模块806具体用于,根据输入粗处理子网的第一编码端中的样本图像,通过所述第一编码端中所包括的若干个特征提取层,得到所述第一编码端输出的第一编码特征;确定所述由所述第一编码端中的第一指定提取层输出的第一指定特征,并将所述第一指定特征,以及所述第一编码特征输入所述第二模型;通过所述第二模型中所包含的特征融合层,得到根据所述第一编码特征以及所述第一指定特征融合出的差异特征;根据所述差异特征,通过所述第二模型,得到所预测出的该已处理区域与对应的标注区域之间的差异度。
可选地,所述差异确定模块806具体用于,根据所述已处理图像中的各已处理区域,将所述差异特征划分为若干个差异子特征,其中,针对每个已处理区域,该已处理区域的差异子特征表征该已处理区域与该已处理区域所对应的标注区域之间的差异;针对每个已处理区域,根据该已处理区域的差异子特征,通过所述第二模型的差异预测层,得到为该已处理区域所预测出的预测差异度;根据各已处理区域的预测差异度,确定所述已处理图像的预测差异度。
可选地,所述差异确定模块806具体用于,针对每个已处理区域,根据该已处理区域的预测差异度,以及预先指定的差异阈值,从预先指定的各待匹配参数中为该已处理区域选择出表征该已处理区域与对应的标注区域之间的差异度的匹配参数;根据各已处理区域的匹配参数,为所述已处理图像确定匹配参数图,作为为该已处理图像所预测的预测差异度。
以上为本说明书的一个或多个实施例提供的模型训练方法,基于同样的思路,本说明书还提供了相应的图像处理装置,如图9所示。
图9为本说明书提供的一种图像处理装置示意图,该装置包括:
特征输入模块900,用于确定待处理图像,并将所述待处理图像输入图像处理模型所包括的第一模型中的粗处理子网,其中,所述图像处理模型是预先采用上述方法训练得到的;
图像输出模块902,用于通过所述粗处理子网,根据所述样本图像,得到粗处理图像,并输入所述粗处理图像至所述图像处理模型所包括的第一模型中的精处理子网,得到所述精处理子网输出的已处理图像。
可选地,所述图像处理装置还包括预测模块904,所述预测模块904具体用于,根据所述待处理图像,通过所述图像处理模型中的第二模型,对精处理子网输出的已处理图像的图像质量进行预测,得到所预测出的预测差异度,其中,所述预测差异度与所预测的已处理图像的图像质量负相关;根据预测差异度判断是否将所述已处理图像重新作为待处理图像。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述模型训练及图像处理方法。
本说明书还提供了图10所示的电子设备的结构示意图。如图10所示,在硬件层面,该电子设备包括处理器、内部总线、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述模型训练及图像处理方法。
当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (19)
1.一种模型训练方法,其特征在于,包括:
确定待训练的图像处理模型,所述图像处理模型包括第一模型和第二模型;
确定待处理的样本图像,并输入所述样本图像至所述图像处理模型;
通过所述第一模型对所述样本图像进行处理,得到第一模型输出的已处理图像;通过所述第二模型,针对已处理图像中所包括的每个已处理区域,为该已处理区域从标注图像中确定出所对应的标注区域,对该已处理区域与对应的标注区域之间的差异度进行预测,并根据得到的预测差异度为各已处理区域确定对应的区域权重;
针对每个已处理区域,确定该已处理区域与对应的标注区域之间的差异度,作为该已处理区域的标注差异度;
以该已处理区域对应的区域权重对该已处理区域的标注差异度进行加权;
以加权后的各已处理区域的标注差异度最小为目标,调整所述图像处理模型中的参数。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
以所述第二模型为各已处理区域预测出的预测差异度与各已处理区域的标注差异度之间的差异最小为目标,调整所述图像处理模型中的参数。
3.如权利要求1所述的方法,其特征在于,已处理区域由已处理图像中被处理的若干个像素点构成;
确定该已处理区域与对应的标注区域之间的差异度,具体包括:
针对该已处理区域中所包括的每个像素点,确定该像素点所属的像素点对,所述像素点对中还包括与该已处理区域相对应的标注区域中,与该像素点相对应的像素点;
针对每个像素点对,确定该像素点对中两个像素点的像素值;
将各像素点对中两个像素点的像素值的差值的绝对值之和,作为已处理区域与对应的标注区域之间的差异度,和/或,将各像素点对两个像素点的像素值的梯度的差值的绝对值之和,作为已处理区域与对应的标注区域之间的差异度。
4.如权利要求1所述的方法,其特征在于,所述第一模型包括粗处理子网络和精处理子网络;
通过所述第一模型对所述样本图像进行处理,得到第一模型输出的已处理图像,具体包括:
通过第一模型中所包括的粗处理子网络,根据输入所述粗处理子网络的样本图像,得到粗处理子网络输出的粗处理图像;
将所述粗处理图像输入至第一模型的精处理子网络中,通过所述精处理子网络,得到精处理子网络输出的已处理图像。
5.如权利要求4所述的方法,其特征在于,所述粗处理子网包括第一编码端和第一解码端;
通过第一模型中所包括的粗处理子网络,根据输入所述粗处理子网络的样本图像,得到粗处理子网络输出的粗处理图像,具体包括:
根据输入粗处理子网的第一编码端中的样本图像,通过所述第一编码端中所包括的若干个顺次相连的特征提取层,得到所述第一编码端的最后一个特征提取层输出的第一编码特征;
确定所述由所述第一编码端中的第一指定提取层输出的第一指定特征,并将所述第一指定特征,以及所述第一编码特征输入所述第一解码端;
通过所述第一解码端,根据所述第一编码特征以及所述第一指定特征,确定出图像粗特征;
根据所述图像粗特征,通过所述第一解码端,得到粗处理图像。
6.如权利要求4所述的方法,其特征在于,所述精处理子网包括第二编码端和第二解码端;
将所述粗处理图像输入至第一模型的精处理子网络中,通过所述精处理子网络,得到精处理子网络输出的已处理图像,具体包括:
输入所述粗处理图像至所述精处理子网的第二编码端,通过所述第二编码端中所包括的若干个顺次相连的特征提取层,得到所述第二编码端的最后一个特征提取层输出的第二编码特征;
确定所述由所述第二编码端中的第二指定提取层输出的第二指定特征,通过所述第二解码端,根据所述第二编码特征以及所述第二指定特征,确定出图像精特征;
根据所述图像精特征,通过所述第二解码端,得到已处理图像。
7.如权利要求5或6任一所述的方法,其特征在于,第一编码端和/或第二编码端的各特征提取层中包括至少一个残差块。
8.如权利要求6所述的方法,其特征在于,所述精处理子网中包括第一调整子网络;
通过所述第二解码端,根据所述第二编码特征以及所述第二指定特征,确定出图像精特征,具体包括:
将所述第二编码特征输入所述第一调整子网络,通过所述第一调整子网络中的池化层,根据所述第二编码特征,得到所述第二编码特征的全局特征;
以所述全局特征对所述第二编码特征进行粗调整,得到粗调整后的第二编码特征;
根据所述第一调整子网络所输出的粗调整后的第二编码特征,通过所述精处理子网对所述第二编码特征进行精调整,得到精调整后的第二编码特征;
通过所述第二解码端,根据精调整后的第二编码特征以及所述第二指定特征确定出图像精特征。
9.如权利要求8所述的方法,其特征在于,所述精处理子网包括第二调整子网络,所述第二调整子网络包括若干个顺次相连的特征提取层;
根据所述第一调整子网络所输出的粗调整后的第二编码特征,通过所述精处理子网对所述第二编码特征进行精调整,得到精调整后的第二编码特征,具体包括:
将所述第一调整子网络所输出的粗调整后的第二编码特征作为所述第二调整子网络中的第一个特征提取层的输入,通过所述第二调整子网络中顺次相连的各特征提取层,得到最后一个特征提取层输出的精调整后的第二编码特征。
10.如权利要求9所述的方法,其特征在于,第二调整子网络中所包括的特征提取层中至少包括一个密集块。
11.如权利要求1所述的方法,其特征在于,为该已处理区域从标注图像中确定出所对应的标注区域,并对该已处理区域与对应的标注区域之间的差异度进行预测,具体包括:
根据输入粗处理子网的第一编码端中的样本图像,通过所述第一编码端中所包括的若干个特征提取层,得到所述第一编码端输出的第一编码特征;
确定所述由所述第一编码端中的第一指定提取层输出的第一指定特征,并将所述第一指定特征,以及所述第一编码特征输入所述第二模型;
通过所述第二模型中所包含的特征融合层,得到根据所述第一编码特征以及所述第一指定特征融合出的差异特征;
根据所述差异特征,通过所述第二模型,得到所预测出的该已处理区域与对应的标注区域之间的差异度。
12.如权利要求11所述的方法,其特征在于,根据所述差异特征,通过所述第二模型,得到所预测出的该已处理区域与对应的标注区域之间的差异度,具体包括:
根据所述已处理图像中的各已处理区域,将所述差异特征划分为若干个差异子特征,其中,针对每个已处理区域,该已处理区域的差异子特征表征该已处理区域与该已处理区域所对应的标注区域之间的差异;
针对每个已处理区域,根据该已处理区域的差异子特征,通过所述第二模型的差异预测层,得到为该已处理区域所预测出的预测差异度;
根据各已处理区域的预测差异度,确定所述已处理图像的预测差异度。
13.如权利要求12所述的方法,其特征在于,根据各已处理区域的预测差异度,确定所述已处理图像的预测差异度,具体包括:
针对每个已处理区域,根据该已处理区域的预测差异度,以及预先指定的差异阈值,从预先指定的各待匹配参数中为该已处理区域选择出表征该已处理区域与对应的标注区域之间的差异度的匹配参数;
根据各已处理区域的匹配参数,为所述已处理图像确定匹配参数图,作为为该已处理图像所预测的预测差异度。
14.一种图像处理方法,其特征在于,包括:
确定待处理图像;
将所述待处理图像输入图像处理模型所包括的第一模型,得到所述第一模型输出的已处理图像,其中,所述图像处理模型是预先采用如权利要求1~13任一所述的方法训练得到的。
15.如权利要求14所述的方法,其特征在于,所述方法还包括:
在假设存在所述待处理图像对应的标注图像的条件下,通过所述第二模型,针对已处理图像中所包括的每个已处理区域,为该已处理区域从标注图像中确定出所对应的标注区域,并对该已处理区域与对应的标注区域之间的差异度进行预测,得到该已处理区域的预测差异度;
根据每个已处理区域的预测差异度,确定已处理图像的图像质量;
根据已处理图像的图像质量判断是否将所述已处理图像重新作为待处理图像。
16.一种模型训练装置,其特征在于,包括:
模型确定模块,用于确定待训练的图像处理模型,所述图像处理模型包括第一模型和第二模型;
图像输入模块,用于确定待处理的样本图像,并输入所述样本图像至所述图像处理模型;
图像处理模块,用于通过所述第一模型,根据所述样本图像,得到第一模型输出的已处理图像;通过所述第二模型,针对已处理图像中所包括的每个已处理区域,为该已处理区域从标注图像中确定出所对应的标注区域,并对该已处理区域与对应的标注区域之间的差异度进行预测,并根据得到的预测差异度为各已处理区域确定对应的区域权重;
差异确定模块,用于针对每个已处理区域,确定该已处理区域与对应的标注区域之间的差异度,作为该已处理区域的标注差异度;
差异加权模块,用于以该已处理区域对应的区域权重对该已处理区域的标注差异度进行加权;
参数调整模块,用于以加权后的各已处理区域的标注差异度最大为目标,调整所述图像处理模型中的参数。
17.一种图像处理装置,其特征在于,包括:
特征输入模块,用于通过所述粗处理子网,根据所述样本图像,得到粗处理图像,并输入所述粗处理图像至所述图像处理模型所包括的第一模型中的精处理子网,得到所述精处理子网输出的已处理图像;
图像输出模块,用于通过所述粗处理子网,根据所述样本图像,得到粗处理图像,并输入所述粗处理图像至所述图像处理模型所包括的第一模型中的精处理子网,得到所述精处理子网输出的已处理图像。
18.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~15任一项所述的方法。
19.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~15任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110993903.4A CN113688832B (zh) | 2021-08-27 | 2021-08-27 | 一种模型训练及图像处理方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110993903.4A CN113688832B (zh) | 2021-08-27 | 2021-08-27 | 一种模型训练及图像处理方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113688832A true CN113688832A (zh) | 2021-11-23 |
CN113688832B CN113688832B (zh) | 2023-02-03 |
Family
ID=78583324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110993903.4A Active CN113688832B (zh) | 2021-08-27 | 2021-08-27 | 一种模型训练及图像处理方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113688832B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116663655A (zh) * | 2023-07-26 | 2023-08-29 | 浙江大华技术股份有限公司 | 一种对抗攻击的防御方法及电子设备 |
CN117058525A (zh) * | 2023-10-08 | 2023-11-14 | 之江实验室 | 一种模型的训练方法、装置、存储介质及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188760A (zh) * | 2019-04-01 | 2019-08-30 | 上海卫莎网络科技有限公司 | 一种图像处理模型训练方法、图像处理方法及电子设备 |
CN110689500A (zh) * | 2019-09-29 | 2020-01-14 | 北京达佳互联信息技术有限公司 | 一种人脸图像的处理方法、装置、电子设备及存储介质 |
CN111598174A (zh) * | 2020-05-19 | 2020-08-28 | 中国科学院空天信息创新研究院 | 图像地物要素分类模型的训练方法、图像分析方法及系统 |
CN111833359A (zh) * | 2020-07-13 | 2020-10-27 | 中国海洋大学 | 基于生成对抗网络的脑瘤分割数据增强方法 |
CN112381717A (zh) * | 2020-11-18 | 2021-02-19 | 北京字节跳动网络技术有限公司 | 图像处理方法、模型训练方法、装置、介质及设备 |
CN112419175A (zh) * | 2020-11-06 | 2021-02-26 | 深圳先进技术研究院 | 一种共享权重的双区域生成对抗网络及其图像生成方法 |
WO2021145849A1 (en) * | 2020-01-13 | 2021-07-22 | Google, Llc | Image watermarking |
-
2021
- 2021-08-27 CN CN202110993903.4A patent/CN113688832B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188760A (zh) * | 2019-04-01 | 2019-08-30 | 上海卫莎网络科技有限公司 | 一种图像处理模型训练方法、图像处理方法及电子设备 |
CN110689500A (zh) * | 2019-09-29 | 2020-01-14 | 北京达佳互联信息技术有限公司 | 一种人脸图像的处理方法、装置、电子设备及存储介质 |
WO2021145849A1 (en) * | 2020-01-13 | 2021-07-22 | Google, Llc | Image watermarking |
CN111598174A (zh) * | 2020-05-19 | 2020-08-28 | 中国科学院空天信息创新研究院 | 图像地物要素分类模型的训练方法、图像分析方法及系统 |
CN111833359A (zh) * | 2020-07-13 | 2020-10-27 | 中国海洋大学 | 基于生成对抗网络的脑瘤分割数据增强方法 |
CN112419175A (zh) * | 2020-11-06 | 2021-02-26 | 深圳先进技术研究院 | 一种共享权重的双区域生成对抗网络及其图像生成方法 |
CN112381717A (zh) * | 2020-11-18 | 2021-02-19 | 北京字节跳动网络技术有限公司 | 图像处理方法、模型训练方法、装置、介质及设备 |
Non-Patent Citations (3)
Title |
---|
JIE ZHANG等: "Exploring Structure Consistency for Deep ModelWatermarking", 《ARXIV:2018.02360V1》 * |
KANGLI HAO等: "Robust Image Watermarking Based on Generative Adversarial Network", 《CHINA COMMUNICATIONS》 * |
李悦等: "面向人脸识别的口罩区域修复算法", 《电信科学》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116663655A (zh) * | 2023-07-26 | 2023-08-29 | 浙江大华技术股份有限公司 | 一种对抗攻击的防御方法及电子设备 |
CN116663655B (zh) * | 2023-07-26 | 2023-10-13 | 浙江大华技术股份有限公司 | 一种对抗攻击的防御方法及电子设备 |
CN117058525A (zh) * | 2023-10-08 | 2023-11-14 | 之江实验室 | 一种模型的训练方法、装置、存储介质及电子设备 |
CN117058525B (zh) * | 2023-10-08 | 2024-02-06 | 之江实验室 | 一种模型的训练方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113688832B (zh) | 2023-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108805889B (zh) | 边缘引导的精细化显著性物体分割方法与系统、设备 | |
CN111583097A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN113688832B (zh) | 一种模型训练及图像处理方法、装置 | |
CN112598579A (zh) | 面向监控场景的图像超分辨率方法、装置及存储介质 | |
KR102628115B1 (ko) | 영상 처리 방법, 장치, 기록 매체 및 전자 장치 | |
CN113888415B (zh) | 一种模型训练以及图像修复方法及装置 | |
CN111353957A (zh) | 图像处理方法、装置、存储介质及电子设备 | |
CN117197781B (zh) | 一种交通标志识别的方法、装置、存储介质及电子设备 | |
CN110689061A (zh) | 一种基于对齐特征金字塔网络的图像处理方法、装置及系统 | |
CN112949642B (zh) | 一种文字生成方法、装置、存储介质及电子设备 | |
CN115600090A (zh) | 一种模型的所有权验证方法、装置、存储介质及电子设备 | |
CN115623221A (zh) | 一种视频编码方法、装置、存储介质及图像采集设备 | |
CN112203023B (zh) | 一种十亿像素视频生成方法及装置、设备、介质 | |
CN115984154A (zh) | 一种图像融合的方法、装置、存储介质及电子设备 | |
CN112560530B (zh) | 一种二维码处理方法、设备、介质及电子设备 | |
CN115240102A (zh) | 基于图像和文本的模型训练方法及装置 | |
CN114359935A (zh) | 一种模型训练以及表格识别方法及装置 | |
CN116740182B (zh) | 一种鬼影区域确定方法、装置、存储介质及电子设备 | |
CN117726907B (zh) | 一种建模模型的训练方法、三维人体建模的方法以及装置 | |
CN117808976B (zh) | 一种三维模型构建方法、装置、存储介质及电子设备 | |
CN117576522B (zh) | 一种基于拟态结构动态防御的模型训练方法及装置 | |
CN114240761B (zh) | 图像去雨模型训练方法、图像去雨方法及设备 | |
CN115953706B (zh) | 虚拟形象处理方法及装置 | |
CN111524190B (zh) | 视觉定位网络的训练、无人驾驶设备的控制方法及装置 | |
CN114648468B (zh) | 图像处理方法、装置、终端设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |