CN116206168A - 图像处理方法、装置、存储介质及电子设备 - Google Patents
图像处理方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN116206168A CN116206168A CN202111449664.2A CN202111449664A CN116206168A CN 116206168 A CN116206168 A CN 116206168A CN 202111449664 A CN202111449664 A CN 202111449664A CN 116206168 A CN116206168 A CN 116206168A
- Authority
- CN
- China
- Prior art keywords
- image processing
- processing model
- image
- processed
- encoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 320
- 239000013598 vector Substances 0.000 claims abstract description 280
- 238000012549 training Methods 0.000 claims abstract description 89
- 238000000034 method Methods 0.000 claims abstract description 38
- 230000006870 function Effects 0.000 claims description 76
- 238000004590 computer program Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000015556 catabolic process Effects 0.000 description 9
- 238000006731 degradation reaction Methods 0.000 description 9
- 238000013507 mapping Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000000116 mitigating effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本公开涉及一种图像处理方法、装置、存储介质及电子设备。该方法包括:获取待处理图像;将该待处理图像输入目标图像处理模型,得到该待处理图像对应的目标图像;其中,该目标图像处理模型为根据第一损失函数对预设图像处理模型训练得到的;该目标图像处理模型包括第一编码器和第一解码器,第一编码器的输出端与第一解码器的输入端耦合,预设图像处理模型包括所述第一编码器、所述第一解码器和第二编码器;第一编码器用于将输入的待处理样本图像编码为第一编码向量,第二编码器用于将输入的目标样本图像编码为第二编码向量,目标样本图像与所述待处理样本图像相对应,该第一损失函数用于计算所述第一编码向量和所述第二编码向量的第一损失值。
Description
技术领域
本公开涉及人工智能技术领域,具体地,涉及一种图像处理方法、装置、存储介质及电子设备。
背景技术
随着摄像技术的进步,人们对高清图像的需求也在不断升级。如何使得因年份久远、运动、失焦、压缩等问题导致的低质量模糊图像,恢复至高质量清晰图像,并且不丢失其中的关键信息,成为人们的普遍需求。在相关技术中,将低质量的模糊图像修复为高质量的清晰图像,需要经过复杂的逆映射和去除模糊退化等操作,使得图像修复过程非常复杂,用于修复图像的网络规模较大,效率较低。
发明内容
为克服相关技术中存在的上述问题,本公开提供一种图像处理方法、装置、存储介质及电子设备。
根据本公开实施例的第一方面,提供一种图像处理方法,所述方法包括:
获取待处理图像;
将所述待处理图像输入目标图像处理模型,得到所述待处理图像对应的目标图像;
其中,所述目标图像处理模型为根据第一损失函数对预设图像处理模型训练得到的;所述目标图像处理模型包括第一编码器和第一解码器,所述第一编码器的输出端与所述第一解码器的输入端耦合,所述预设图像处理模型包括所述第一编码器、所述第一解码器和第二编码器;所述第一编码器用于将输入的待处理样本图像编码为第一编码向量,所述第二编码器用于将输入的目标样本图像编码为第二编码向量,所述目标样本图像与所述待处理样本图像相对应,所述第一损失函数用于计算所述第一编码向量和所述第二编码向量的第一损失值。
可选地,所述将所述待处理图像输入目标图像处理模型,得到所述待处理图像对应的目标图像包括:
将所述待处理图像输入所述第一编码器;
通过所述第一编码器获取所述待处理图像对应的第一全局特征向量,并将所述第一全局特征向量输入所述第一解码器;
根据所述第一全局特征向量和所述第一解码器,获取所述待处理图像对应的目标图像。
可选地,所述目标图像处理模型还包括第二解码器,所述第二解码器的输入端分别与所述第一编码器的输出端和所述第一解码器的输出端耦合;所述方法还包括:
通过所述第一编码器获取所述待处理图像对应的多个第一尺度特征向量,并将所述多个第一尺度特征向量输入所述第二解码器;其中,不同的第一尺度特征向量对应的图像尺度不同;
所述根据所述第一全局特征向量和所述第一解码器,获取所述待处理图像对应的目标图像包括:
通过所述第一解码器对所述第一全局特征向量进行解码后,获取所述待处理图像对应的多个第二尺度特征向量,并将所述多个第二尺度特征向量输入所述第二解码器;
通过所述第二解码器,将每个尺度对应的所述第一尺度特征向量和所述第二尺度特征向量进行融合,获取该尺度对应的第三尺度特征向量;
据多个尺度对应的所述第三尺度特征向量,得到所述待处理图像对应的目标图像。
可选地,所述目标图像处理模型是通过以下方式训练得到的:
获取多个待处理样本图像以及每个待处理样本图像对应的目标样本图像;
循环执行第一训练步骤,直至根据所述第一损失函数确定训练后的预设图像处理模型满足第一预设停止迭代条件,根据训练后的预设图像处理模型确定所述目标图像处理模型;
所述第一训练步骤包括:
针对每个待处理样本图像,将该待处理样本图像输入所述预设图像处理模型的第一编码器,得到第一编码向量;并将该待处理样本图像对应的目标样本图像输入所述预设图像处理模型的第二编码器,得到第二编码向量;
通过所述第一损失函数计算得到所述第一编码向量与所述第二编码向量的第一损失值;其中,该第一损失值用于表征该第一编码向量和该第二编码向量的差异程度;
在根据所述第一损失值确定所述预设图像处理模型不满足所述第一预设停止迭代条件的情况下,根据所述第一损失值更新所述预设图像处理模型的参数,得到训练后的预设图像处理模型,并将该训练后的预设图像处理模型作为新的预设图像处理模型。
可选地,所述根据训练后的预设图像处理模型确定所述目标图像处理模型包括:
将训练后的预设图像处理模型中的第二编码器去除后,得到所述目标图像处理模型。
可选地,所述第一训练步骤还包括:
将所述第一编码向量输入所述第一解码器,得到所述待处理样本图像对应的第一预测图像;
通过第二损失函数计算得到所述第一预测图像与所述目标样本图像之间的第二损失值;
所述在根据所述第一损失值确定所述预设图像处理模型不满足所述第一预设停止迭代条件的情况下,根据所述第一损失值更新所述预设图像处理模型的参数,得到训练后的预设图像处理模型,并将该训练后的预设图像处理模型作为新的预设图像处理模型包括:
在根据所述第一损失值和所述第二损失值确定所述预设图像处理模型不满足所述第一预设停止迭代条件的情况下,根据所述第一损失值和所述第二损失值更新所述预设图像处理模型的参数,得到训练后的预设图像处理模型,并将该训练后的预设图像处理模型作为新的预设图像处理模型。
可选地,所述预设图像处理模型还包括第二解码器,所述第二解码器的输入端分别与所述第一编码器的输出端和所述第一解码器的输出端耦合;所述根据训练后的预设图像处理模型确定所述目标图像处理模型包括:
将训练后的预设图像处理模型作为候选图像处理模型;
循环执行对所述候选图像处理模型进行训练的第二训练步骤,直至根据第一损失函数和第三损失函数,确定训练后的候选图像处理模型满足第二预设停止迭代条件,根据训练后的候选图像处理模型确定所述目标图像处理模型;
所述第二训练步骤包括:
将所述待处理样本图像输入所述候选图像处理模型的第一编码器,得到所述待处理图像对应的第二全局特征向量和多个第四尺度特征向量;并将该待处理样本图像对应的目标样本图像输入所述候选图像处理模型的第二编码器,得到第三全局特征向量;
将所述第二全局特征向量输入所述第一解码器,得到所述待处理图像对应的多个第五尺度特征向量;
通过所述第二解码器,将每个尺度对应的所述第四尺度特征向量和所述第五尺度特征向量进行融合,得到该尺度对应的第六尺度特征向量;
根据多个尺度对应的所述第六尺度特征向量,得到所述待处理图像对应的第二预测图像;
通过第三损失函数计算得到所述第二预测图像与所述目标样本图像之间的第三损失值;
通过所述第一损失函数计算得到所述第二全局特征向量与所述第三全局特征向量的第四损失值;
在根据所述第三损失值和所述第四损失值,确定所述候选图像处理模型不满足所述第二预设停止迭代条件的情况下,根据所述第三损失值和所述第四损失值更新所述候选图像处理模型的参数,得到训练后的候选图像处理模型,并将该训练后的候选图像处理模型作为新的候选图像处理模型。
可选地,所述根据所述第三损失值和所述第四损失值更新所述候选图像处理模型的参数包括:
根据所述第三损失值和所述第四损失值,更新所述第二解码器的解码参数。
可选地,所述根据所述第三损失值和所述第四损失值更新所述候选图像处理模型的参数包括:
根据第一预设学习率、第二预设学习率、所述第三损失值和所述第四损失值,更新所述候选图像处理模型的参数;其中,所述第一预设学习率表征所述第一编码器和所述第二编码器的参数学习率,所述第二预设学习率表征所述第二解码器的参数学习率;所述第一预设学习率小于所述第二预设学习率。
根据本公开实施例的第二方面,提供一种图像处理装置,所述装置包括:
待处理图像获取模块,被配置为获取待处理图像;
目标图像生成模块,被配置为将所述待处理图像输入目标图像处理模型,得到所述待处理图像对应的目标图像;
其中,所述目标图像处理模型为根据第一损失函数对预设图像处理模型训练得到的;所述目标图像处理模型包括第一编码器和第一解码器,所述第一编码器的输出端与所述第一解码器的输入端耦合,所述预设图像处理模型包括所述第一编码器、所述第一解码器和第二编码器;所述第一编码器用于将输入的待处理样本图像编码为第一编码向量,所述第二编码器用于将输入的目标样本图像编码为第二编码向量,所述目标样本图像与所述待处理样本图像相对应,所述第一损失函数用于计算所述第一编码向量和所述第二编码向量的第一损失值。
可选地,所述目标图像生成模块,被配置为将所述待处理图像输入所述第一编码器;通过所述第一编码器获取所述待处理图像对应的第一全局特征向量,并将所述第一全局特征向量输入所述第一解码器;根据所述第一全局特征向量和所述第一解码器,获取所述待处理图像对应的目标图像。
可选地,所述目标图像处理模型还包括第二解码器,所述第二解码器的输入端分别与所述第一编码器的输出端和所述第一解码器的输出端耦合;所述目标图像生成模块,还被配置为通过所述第一编码器获取所述待处理图像对应的多个第一尺度特征向量,并将所述多个第一尺度特征向量输入所述第二解码器;其中,不同的第一尺度特征向量对应的图像尺度不同;通过所述第一解码器对所述第一全局特征向量进行解码后,获取所述待处理图像对应的多个第二尺度特征向量,并将所述多个第二尺度特征向量输入所述第二解码器;通过所述第二解码器,将每个尺度对应的所述第一尺度特征向量和所述第二尺度特征向量进行融合,获取该尺度对应的第三尺度特征向量;据多个尺度对应的所述第三尺度特征向量,得到所述待处理图像对应的目标图像。
可选地,所述装置还包括:
模型训练模块,被配置为通过以下方式训练得到所述目标图像处理模型:
获取多个待处理样本图像以及每个待处理样本图像对应的目标样本图像;
循环执行第一训练步骤,直至根据所述第一损失函数确定训练后的预设图像处理模型满足第一预设停止迭代条件,根据训练后的预设图像处理模型确定所述目标图像处理模型;
所述第一训练步骤包括:针对每个待处理样本图像,将该待处理样本图像输入所述预设图像处理模型的第一编码器,得到第一编码向量;并将该待处理样本图像对应的目标样本图像输入所述预设图像处理模型的第二编码器,得到第二编码向量;通过所述第一损失函数计算得到所述第一编码向量与所述第二编码向量的第一损失值;其中,该第一损失值用于表征该第一编码向量和该第二编码向量的差异程度;在根据所述第一损失值确定所述预设图像处理模型不满足所述第一预设停止迭代条件的情况下,根据所述第一损失值更新所述预设图像处理模型的参数,得到训练后的预设图像处理模型,并将该训练后的预设图像处理模型作为新的预设图像处理模型。
可选地,所述模型训练模块,被配置为将训练后的预设图像处理模型中的第二编码器去除后,得到所述目标图像处理模型。
可选地,所述模型训练模块,被配置为将所述第一编码向量输入所述第一解码器,得到所述待处理样本图像对应的第一预测图像;通过第二损失函数计算得到所述第一预测图像与所述目标样本图像之间的第二损失值;在根据所述第一损失值和所述第二损失值确定所述预设图像处理模型不满足所述第一预设停止迭代条件的情况下,根据所述第一损失值和所述第二损失值更新所述预设图像处理模型的参数,得到训练后的预设图像处理模型,并将该训练后的预设图像处理模型作为新的预设图像处理模型。
可选地,所述预设图像处理模型还包括第二解码器,所述第二解码器的输入端分别与所述第一编码器的输出端和所述第一解码器的输出端耦合;所述模型训练模块,被配置为将训练后的预设图像处理模型作为候选图像处理模型;循环执行对所述候选图像处理模型进行训练的第二训练步骤,直至根据第一损失函数和第三损失函数,确定训练后的候选图像处理模型满足第二预设停止迭代条件,根据训练后的候选图像处理模型确定所述目标图像处理模型;
所述第二训练步骤包括:将所述待处理样本图像输入所述候选图像处理模型的第一编码器,得到所述待处理图像对应的第二全局特征向量和多个第四尺度特征向量;并将该待处理样本图像对应的目标样本图像输入所述候选图像处理模型的第二编码器,得到第三全局特征向量;将所述第二全局特征向量输入所述第一解码器,得到所述待处理图像对应的多个第五尺度特征向量;通过所述第二解码器,将每个尺度对应的所述第四尺度特征向量和所述第五尺度特征向量进行融合,得到该尺度对应的第六尺度特征向量;根据多个尺度对应的所述第六尺度特征向量,得到所述待处理图像对应的第二预测图像;通过第三损失函数计算得到所述第二预测图像与所述目标样本图像之间的第三损失值;通过所述第一损失函数计算得到所述第二全局特征向量与所述第三全局特征向量的第四损失值;在根据所述第三损失值和所述第四损失值,确定所述候选图像处理模型不满足所述第二预设停止迭代条件的情况下,根据所述第三损失值和所述第四损失值更新所述候选图像处理模型的参数,得到训练后的候选图像处理模型,并将该训练后的候选图像处理模型作为新的候选图像处理模型。
可选地,所述模型训练模块,被配置为根据所述第三损失值和所述第四损失值,更新所述第二解码器的解码参数。
可选地,所述模型训练模块,被配置为根据第一预设学习率、第二预设学习率、所述第三损失值和所述第四损失值,更新所述候选图像处理模型的参数;其中,所述第一预设学习率表征所述第一编码器和所述第二编码器的参数学习率,所述第二预设学习率表征所述第二解码器的参数学习率;所述第一预设学习率小于所述第二预设学习率。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行本公开第一方面所提供的图像处理方法的步骤。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的图像处理方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:获取待处理图像;将该待处理图像输入目标图像处理模型,得到该待处理图像对应的目标图像;其中,该目标图像处理模型为根据第一损失函数对预设图像处理模型训练得到的;该目标图像处理模型包括第一编码器和第一解码器,第一编码器的输出端与第一解码器的输入端耦合,预设图像处理模型包括所述第一编码器、所述第一解码器和第二编码器;第一编码器用于将输入的待处理样本图像编码为第一编码向量,第二编码器用于将输入的目标样本图像编码为第二编码向量,目标样本图像与所述待处理样本图像相对应,该第一损失函数用于计算所述第一编码向量和所述第二编码向量的第一损失值,该第一损失值用于表征该第一编码向量和该第二编码向量的差异程度。这样,既可以在训练过程中通过第一损失函数和第二编码器的约束,使得训练得到的第一编码器具有图像逆映射和移除模糊退化的能力,又可以在模型应用过程中减少目标图像处理模型的复杂度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种图像处理方法的流程图。
图2a是根据一示例性实施例示出的一种目标图像处理模型的示意图。
图2b是根据一示例性实施例示出的一种预设图像处理模型的示意图。
图3是根据图1所示实施例示出的一种S102步骤的流程图。
图4是根据一示例性实施例示出的一种目标图像处理模型的训练方法的流程图。
图5是根据一示例性实施例示出的一种图像处理装置的框图。
图6是根据一示例性实施例示出的另一种图像处理装置的框图。
图7是根据一示例性实施例示出的电子设备的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
首先,对本公开的应用场景进行说明。本公开可以应用于图像处理场景,特别是对于低质量图像的修复处理。在相关技术中,将低质量的模糊图像修复为高质量的清晰图像,需要经过复杂的逆映射和去除模糊退化等操作,使得图像修复过程非常复杂,用于修复图像的网络规模较大,效率较低。示例地,用于人脸图像恢复的StyleGAN(A Style-BasedGenerator Architecture for Generative Adversarial Networks)网络,能够将低质量的模糊人脸图像修复高质量的清晰人脸图像,但是网络规模较大,导致难以在智能手机等移动终端侧部署。
为了解决上述问题,本公开提供了一种图像处理方法、装置、存储介质及电子设备,在对预设图像处理模型进行训练得到目标图像处理模型时,除了预设图像处理模型包括的第一编码器和第一解码器之前,还引入了第二编码器。其中,第一编码器用于将输入的待处理样本图像编码为第一编码向量,第二编码器用于将输入的目标样本图像编码为第二编码向量,该目标样本图像与所述待处理样本图像相对应,通过第一损失函数用于计算所述第一编码向量和所述第二编码向量的第一损失值,该第一损失值用于表征该第一编码向量和该第二编码向量的差异程度。这样,通过该第一损失函数和第二编码器,可以对第一编码器提供指导和约束,提高第一编码器输出的第一编码向量与目标样本图像编码后向量(也就是第二编码向量)的相似度,隐式地使得第一编码器无需复杂结构即可具有图像逆映射和移除模糊退化的能力。进一步地,该第二编码器可以仅在模型训练过程中使用,在生成的目标图像处理模型中可以直接删除或者不使用。这样,既可以在训练过程中通过第一损失函数和第二编码器的约束,使得训练得到的第一编码器具有图像逆映射和移除模糊退化的能力,又可以在模型应用过程中减少目标图像处理模型的复杂度。
下面结合具体实施例对本公开进行说明。
图1是根据一示例性实施例示出的一种图像处理方法的流程图,如图1所示,该方法可以包括:
S101、获取待处理图像。
其中,待处理图像可以是图片,也可以是视频,本公开对待处理图像的类型不作限定。
在本步骤中,可以实时采集该待处理图像,也可以获取预先存储的该待处理图像,还可以接收其它设备发送的该待处理图像,本公开对该待处理图像的获取方式不作限定。
S102、将该待处理图像输入目标图像处理模型,得到该待处理图像对应的目标图像。
其中,上述目标图像处理模型可以为根据第一损失函数对预设图像处理模型训练得到的,该目标图像处理模型包括第一编码器和第一解码器,该第一编码器的输出端与该第一解码器的输入端耦合,该预设图像处理模型包括该第一编码器、该第一解码器和第二编码器;该第一编码器用于将输入的待处理样本图像编码为第一编码向量,该第二编码器用于将输入的目标样本图像编码为第二编码向量,该目标样本图像与该待处理样本图像相对应,该第一损失函数用于计算该第一编码向量和该第二编码向量的第一损失值,该第一损失值可以表征该第一编码向量和该第二编码向量的差异程度。
该第一编码向量可以为该第一编码器对该待处理样本图像进行编码后得到的全局特征向量;同样地,该第二编码向量也可以为该第二编码器对该目标样本图像进行编码后得到的全局特征向量。
其中,该第一损失函数可以为L1损失函数或L2损失函数,以L2损失函数为例,该第一损失函数可以为以下公式(1):
其中,MSE表示该第一损失函数的第一损失值,表示第i个待处理样本图像对应的第一编码向量,yi表示第i个目标样本图像对应的第二编码向量,该第i个目标样本图像为与第i个待处理样本图像相对应的图像;n表示用于训练的待处理样本的数目。
需要说明的是,该第一损失函数为对编码向量的中间约束项,在训练过程中通过该第一损失函数和第二编码器的约束,使待处理图像对应的第一编码向量与目标图像对应的第二编码向量之间的差异程度满足预设条件,这样,通过该第一损失函数和第二编码器,可以对第一编码器提供指导和约束,提高训练后的第一编码器输出的第一编码向量与目标样本图像编码后向量(也就是第二编码向量)的相似度,隐式地使得第一编码器无需复杂结构即可具有图像逆映射和移除模糊退化的能力。进一步地,上述第二编码器可以只在模型训练过程中使用,在对预设图像处理模型进行训练完成后,可以将该预设图像处理模型中的第二编码器保留但不再使用,或者可以直接将该第二编码器删除,以得到目标图像处理模型。从而可以降低目标图像处理模型的复杂度。
示例地,在本步骤中,在获取待处理图像后,可以将该待处理图像输入目标图像处理模型的第一编码器;通过该第一编码器获取该待处理图像对应的第一全局特征向量,并将该第一全局特征向量输入第一解码器;根据第一全局特征向量和第一解码器,获取待处理图像对应的目标图像。其中,该待处理图像和目标图像可以是多种类型的图像,例如,该待处理图像可以是低质量的模糊图像(如模糊人脸图像、模糊运动图像等);该待处理图像对应的目标图像可以是通过目标图像处理模型将上述低质图像进行修复后得到的高质量的清晰图像(如高清人脸图像、高清运动图像等)。再例如,该待处理图像可以是普通图像(例如普通人脸图像),该待处理图像对应的目标图像可以是机械能图像风格迁移后的预设风格图像(例如漫画脸图像)。
采用上述方法,获取待处理图像;将该待处理图像输入目标图像处理模型,得到该待处理图像对应的目标图像;其中,该目标图像处理模型为根据第一损失函数对预设图像处理模型训练得到的;该目标图像处理模型包括第一编码器和第一解码器,第一编码器的输出端与第一解码器的输入端耦合,预设图像处理模型包括所述第一编码器、所述第一解码器和第二编码器;第一编码器用于将输入的待处理样本图像编码为第一编码向量,第二编码器用于将输入的目标样本图像编码为第二编码向量,目标样本图像与所述待处理样本图像相对应,该第一损失函数用于计算所述第一编码向量和所述第二编码向量的第一损失值,该第一损失值用于表征该第一编码向量和该第二编码向量的差异程度。这样,既可以在训练过程中通过第一损失函数和第二编码器的约束,使得训练得到的第一编码器具有图像逆映射和移除模糊退化的能力,又可以在模型应用过程中减少目标图像处理模型的复杂度。
图2a是根据一示例性实施例示出的一种目标图像处理模型的示意图,图2b是根据一示例性实施例示出的一种预设图像处理模型的示意图,如图2a所示,该目标图像处理模型可以包括第一编码器E1和第一解码器D1,第一编码器E1的输出端与第一解码器D1的输入端耦合。如图2b所示,该预设图像处理模型可以包括第一编码器E1、第二编码器E2和第一解码器D1,第一编码器E1的输出端分别与第二编码器E2的输出端和第一解码器D1的输入端耦合。
进一步地,如图2a所示,该目标图像处理模型可以还包括第二解码器D2,第二解码器D2的输入端分别与第一编码器E1的输出端和第一解码器D1的输出端耦合。同样地,如图2b所示,该预设图像处理模型也可以还包括第二解码器D2,第二解码器D2的输入端分别与第一编码器E1的输出端和第一解码器D1的输出端耦合。
其中,该第一编码器可以为空间编码器,示例地,该第一编码器可以为PSPNET(Pyramid Scene Parsing Network,金字塔场景解析网络),该第一编码器可以将输入的待处理样本图像x进行编码处理后得到该待处理图像对应的第一全局特征向量(x_latent)和/或多个第一尺度特征向量(x_feats)。其中,不同的第一尺度特征向量对应的图像尺度不同。示例地,该多个第一尺度特征向量可以包括32*32、16*16、8*8、4*4等多种尺度的特征向量。
进一步地,该第一编码器也可以采用小型化网络设计,示例地,可以在PSPNET基础上使用更少的编码模块,例如传统的PSPNET采用18个编码模块,本实施例中可以采用3个编码模块,并采用池化编码模块,以提高编码效率。
该第二编码器可以采用与该第一编码器相同的网络结构,也可以采用与该第一编码器不同的网络结构。第一编码器可以将输入的目标样本图像y进行编码处理后得到该待处理图像对应的第一全局特征向量(y_latent)和/或多个第一尺度特征向量(y_feats),其中,该目标样本图像可以为上述待处理样本图像对应的目标图像,例如,待处理样本图像为模糊人脸图像,目标样本图像可以为该模糊人脸图像对应的高清人脸图像;再例如,待处理样本图像为普通人脸图像,该目标样本图像可以为该普通人脸图像对应的漫画脸图像。该第二编码器可以只在训练时使用,在训练完成后的目标图像处理模型中可以直接删除该第二编码器,当然也可以保留但不使用该第二编码器。
该第一解码器可以用于将上述第一全局特征向量(x_latent)解码得到目标先验图像(x_prior)。该第一解码器还可以将上述第一全局特征向量(x_latent)解码,解码得到第二尺度特征向量(x_pfeats,也可以称为中间层先验特征向量)。该第一解码器可以是预先训练的StyleGAN模型、StyleGAN2模型或者Mobile StyleGAN模型。例如,可以是通过蒸馏方法对StyleGAN2网络进行压缩后得到的Mobile StyleGAN网络结构。相比于StyleGAN网络,压缩后的该Mobile StyleGAN网络结构的参数量可以减少71%,计算复杂度可以降低90%,并且图像处理的质量几乎没有下降。示例地,可以采用FFHQ(Flickr-Faces-High-Quality,高质量的人脸数据集),对Mobile StyleGAN网络进行训练后得到该第一解码器。
该第二解码器可以采用逐级的门控融合模块,将第一编码器输出的待处理图像的多个第一尺度特征向量(x_feats)和第一解码器输出的多个第二尺度特征向量(x_pfeats)进行融合,计算得到多个第三尺度特征向量,并根据多个第三尺度特征向量,得到待处理图像对应的目标图像。
图3是根据图1所示实施例示出的一种S102步骤的流程图,如图3所示,采用图2a所示的目标图像处理模型,上述S102步骤可以包括以下步骤:
S1021、将待处理图像输入第一编码器。
S1022、通过该第一编码器获取该待处理图像对应的第一全局特征向量,并将该第一全局特征向量输入该第一解码器。
S1023、通过该第一编码器获取该待处理图像对应的多个第一尺度特征向量,并将该多个第一尺度特征向量输入该第二解码器。
其中,不同的第一尺度特征向量对应的图像尺度不同。
示例地,该第一编码器可以为PSPNET(Pyramid Scene Parsing Network,金字塔场景解析网络),通过该第一编码器可以得到待处理图像对应的第一全局特征向量(x_latent)和/或多个第一尺度特征向量(x_feats)。其中,不同的第一尺度特征向量对应的图像尺度不同。示例地,该多个第一尺度特征向量可以包括32*32、16*16、8*8、4*4等多种尺度的特征向量。
S1024、通过第一解码器对该第一全局特征向量进行解码后,获取该待处理图像对应的多个第二尺度特征向量,并将该多个第二尺度特征向量输入该第二解码器。
示例地,通过该第一解码器可以将上述第一全局特征向量(x_latent)解码得到目标先验图像(x_prior)。该第一解码器还可以将上述第一全局特征向量(x_latent)解码,解码得到第二尺度特征向量(x_pfeats,也可以称为,中间层先验特征向量)。
其中,该第二尺度特征向量可以用于合成该待处理图像对应的先验图像,该第二尺度特征向量同样可以包括32*32、16*16、8*8和4*4等多个尺度的特征向量。
S1025、通过第二解码器,将每个尺度对应的该第一尺度特征向量和该第二尺度特征向量进行融合,获取该尺度对应的第三尺度特征向量。
该第二解码器可以包括逐级门控融合模块,将每个尺度对应的第一尺度特征向量(x_feats)和第二尺度特征向量(x_pfeats)进行融合。示例地,可以将尺度为32*32的第一尺度特征向量和第二尺度特征向量融合,得到尺度为32*32的第三尺度特征向量;将尺度为16*16的第一尺度特征向量和第二尺度特征向量融合,得到尺度为16*16的第三尺度特征向量;将尺度为8*8的第一尺度特征向量和第二尺度特征向量融合,得到尺度为8*8的第三尺度特征向量;将尺度为4*4的第一尺度特征向量和第二尺度特征向量融合,得到尺度为4*4的第三尺度特征向量。
S1026、根据多个尺度对应的该第三尺度特征向量,得到该待处理图像对应的目标图像。
这样,通过第二解码器进行每个尺度的特征融合,可以在不破坏第一解码器得到的先验图像特征的特征空间和图像生成空间的情况下,将待处理图像的特征(例如身份信息)融合到最终输出的目标图像中,充分利用先验图像和待处理图像的尺度特征向量,从而可以获得高质量的目标图像。
图4是根据一示例性实施例示出的一种目标图像处理模型的训练方法的流程图,如图4所示,该训练方法可以包括:
S401、获取多个待处理样本图像以及每个待处理样本图像对应的目标样本图像。
示例地,在人脸图像修复场景中,可以将多个模糊人脸图像作为待处理样本图像,将人工对每个模糊人脸图像进行修复后的高清图像作为目标样本图像。另外,可以通过FFHQ(Flickr-Faces-High-Quality,高质量的人脸数据集),获取多个高清人脸图像作为目标样本图像,将该高清人脸图像进行模糊化处理或加噪声处理后,作为待处理样本图像。这样,可以方便的获取大量用于训练的待处理样本图像和目标样本图像,并建立二者之间的关联关系。
S402、循环执行第一训练步骤,直至根据该第一损失函数确定训练后的预设图像处理模型满足第一预设停止迭代条件,根据训练后的预设图像处理模型确定该目标图像处理模型。
示例地,可以将训练后的预设图像处理模型中的第二编码器去除后,得到该目标图像处理模型;也可以直接将训练后的预设图像处理模型作为该目标图像处理模型,但是在使用该目标图像处理模型中可以不使用其中的第二编码器。
该第一训练步骤可以包括以下步骤:
S11、针对每个待处理样本图像,将该待处理样本图像输入该预设图像处理模型的第一编码器,得到第一编码向量;并将该待处理样本图像对应的目标样本图像输入该预设图像处理模型的第二编码器,得到第二编码向量。
S12、通过该第一损失函数计算得到该第一编码向量与该第二编码向量的第一损失值。
其中,该第一损失值用于表征该第一编码向量和该第二编码向量的差异程度。该第一损失函数可以为上述公式(1),也可以是现有技术中常用的损失函数,本公开对此不作限制。
S13、在根据该第一损失值确定该预设图像处理模型不满足第一预设停止迭代条件的情况下,则根据该第一损失值更新该预设图像处理模型的参数,得到训练后的预设图像处理模型,并将该训练后的预设图像处理模型作为新的预设图像处理模型。
该第一预设停止迭代条件可以包括该第一损失值小于或等于第一预设损失阈值,也可以是现有技术中常用的停止迭代的条件,本公开对此也不作限定。
另外,若根据该第一损失值确定该预设图像处理模型满足该第一预设停止迭代条件,则可以停止执行该第一训练步骤。
采用上述方法,将该待处理样本图像输入该预设图像处理模型的第一编码器,得到第一编码向量;并将该待处理样本图像对应的目标样本图像输入该预设图像处理模型的第二编码器,得到第二编码向量,根据第一损失函数对预设图像处理模型训练得到目标处理图像模型。这样,在该第一训练步骤中,同时使用了两个编码器(第一编码器和第二编码器),通过该第一损失函数和第二编码器的约束,可以对第一编码器进行约束指导,提高训练后的第一编码器输出的第一编码向量与目标样本图像编码后向量(也就是第二编码向量)的相似度,隐式地使得第一编码器无需复杂结构即可具有图像逆映射和移除模糊退化的能力,同时又可以减少目标图像处理模型的复杂度。
在本公开的另一实施例中,在上述S3步骤之前,该第一训练步骤还可以包括以下步骤:
S14、将上述第一编码向量输入该第一解码器,得到该待处理样本图像对应的第一预测图像;通过第二损失函数计算得到该第一预测图像与该目标样本图像之间的第二损失值。
需要说明的是,该第二损失函数可以为现有技术中常用的用于获取预测图像与目标图像之间损失值的函数。
这样,上述S3步骤可以为:在根据该第一损失值和该第二损失值确定该预设图像处理模型不满足该第一预设停止迭代条件的情况下,根据该第一损失值和该第二损失值更新该预设图像处理模型的参数,得到训练后的预设图像处理模型,并将该训练后的预设图像处理模型作为新的预设图像处理模型。
在本步骤中,该第一预设停止迭代条件可以包括第一损失值小于或等于第一预设损失阈值,且该第二损失值小于或等于第二预设损失阈值。
这样,通过第一损失函数和第二损失函数的共同约束,可以使得输出的第一预测图像与目标样本图像编码后向量(也就是第二编码向量)的相似度进一步提升,从而进一步提升了训练后的预设图像处理模型的图像处理能力。
需要说明的是,在S3步骤中,可以对第一编码器、第二编码器和第一解码器的参数均进行更新。进一步地,若上述第一解码器为预先训练好的解码器,则在更新该预设图像处理模型的参数时,可以更新第一编码器的第一编码参数和/或第二编码器的第二编码参数,而保持第一解码器的第一解码参数不变。这样,可以针对第一编码器和/或第二解码器进行针对性的训练,以提高训练效率。
在本公开的另一实施例中,该预设图像处理模型还包括第二解码器,该第二解码器的输入端分别与该第一编码器的输出端和该第一解码器的输出端耦合;
为了对第二解码器进行训练,可以在上述第一训练步骤之后,对该预设图像处理模型进行第二训练步骤。这样,上述S402步骤中,该根据训练后的预设图像处理模型确定该目标图像处理模型的方式可以包括:
首先,将训练后的预设图像处理模型作为候选图像处理模型。
其次,循环执行对该候选图像处理模型进行训练的第二训练步骤,直至根据第一损失函数和第三损失函数,确定训练后的候选图像处理模型满足第二预设停止迭代条件,根据训练后的候选图像处理模型确定该目标图像处理模型。
同样地,可以将训练后的候选图像处理模型中的第二编码器去除后,得到该目标图像处理模型;也可以直接将训练后的候选图像处理模型作为该目标图像处理模型,但是在使用该目标图像处理模型时可以不使用其中的第二编码器。
其中,该第二训练步骤包括:
S21、将该待处理样本图像输入该候选图像处理模型的第一编码器,得到该待处理图像对应的第二全局特征向量和多个第四尺度特征向量;并将该待处理样本图像对应的目标样本图像输入该候选图像处理模型的第二编码器,得到第三全局特征向量。
S22、将该第二全局特征向量输入该第一解码器,得到该待处理图像对应的多个第五尺度特征向量。
S23、通过该第二解码器,将每个尺度对应的该第四尺度特征向量和该第五尺度特征向量进行融合,得到该尺度对应的第六尺度特征向量。
S24、根据多个尺度对应的该第六尺度特征向量,得到该待处理图像对应的第二预测图像。
S25、通过第三损失函数计算得到该第二预测图像与该目标样本图像之间的第三损失值。
S26、通过上述第一损失函数计算得到该第二全局特征向量与该第三全局特征向量的第四损失值。
S27、在根据该第三损失值和该第四损失值,确定该候选图像处理模型不满足该第二预设停止迭代条件的情况下,根据该第三损失值和该第四损失值更新该候选图像处理模型的参数,得到训练后的候选图像处理模型,并将该训练后的候选图像处理模型作为新的候选图像处理模型。
其中,该第二预设停止迭代条件可以包括该第三损失值小于或等于第三预设损失阈值,且该第四损失值小于或等于第四预设损失阈值;也可以是现有技术中常用的停止迭代的条件,本公开对此也不作限定。
这样,在按照该第二训练步骤训练得到的候选图像处理模型中,通过第二解码器进行每个尺度的特征融合,可以在不破坏第一解码器得到的先验图像特征的特征空间和图像生成空间的情况下,将待处理样本图像的特征(例如身份信息)融合到最终输出的第二预测图像中,充分利用先验图像和待处理样本图像的尺度特征向量,既能够提高该第二预测图像与目标样本图像编码后向量(也就是第二编码向量)的相似度,又可以保留目标样本图像的身份信息等特征,从而可以获得高质量的第二预测图像。
在上述S27步骤中,根据该第三损失值和该第四损失值更新该候选图像处理模型的参数可以包括以下方式中的任意一种:
方式一、根据该第三损失值和该第四损失值,更新该第二解码器的解码参数。
需要说明的是,由于第一编码器的参数已经经过训练,而第二训练步骤的主要目的是对第二解码器进行训练,因此,在本方式中,可以只更新第二解码器的解码参数,以便提高训练效率。
方式二、根据第一预设学习率、第二预设学习率、该第三损失值和该第四损失值,更新该候选图像处理模型的参数。
其中,该第一预设学习率表征该第一编码器和该第二编码器的参数学习率,该第二预设学习率表征该第二解码器的参数学习率;该第一预设学习率小于该第二预设学习率。
需要说明的是,为了提高训练效果,上述第一预设学习率和第二预设学习率可以在训练中动态调整,例如,可以采用现有技术中常用的离散下降、指数减缓、或分数减缓的方式逐步下降,但由于第一编码器和第二编码器的参数已经在第一训练步骤中进行过一轮训练,因此,在本方式中,可以始终保持第一预设学习率小于第二预设学习率。
这样,通过第一编码器、第二编码器、第一解码器和第二解码器联合参与的第二训练步骤,可以进一步更新候选图像处理模型的参数,并根据训练后的候选图像处理模型确定该目标图像处理模型。
图5是根据一示例性实施例示出的一种图像处理装置500的框图,如图5所示,该装置500可以包括:
待处理图像获取模块501,被配置为获取待处理图像;
目标图像生成模块502,被配置为将该待处理图像输入目标图像处理模型,得到该待处理图像对应的目标图像;
其中,该目标图像处理模型为根据第一损失函数对预设图像处理模型训练得到的;该目标图像处理模型包括第一编码器和第一解码器,该第一编码器的输出端与该第一解码器的输入端耦合,该预设图像处理模型包括该第一编码器、该第一解码器和第二编码器;该第一编码器用于将输入的待处理样本图像编码为第一编码向量,该第二编码器用于将输入的目标样本图像编码为第二编码向量,该目标样本图像与该待处理样本图像相对应,该第一损失函数用于计算该第一编码向量和该第二编码向量的第一损失值。
可选地,该目标图像生成模块502,被配置为将该待处理图像输入该第一编码器;通过该第一编码器获取该待处理图像对应的第一全局特征向量,并将该第一全局特征向量输入该第一解码器;根据该第一全局特征向量和该第一解码器,获取该待处理图像对应的目标图像。
可选地,该目标图像处理模型还包括第二解码器,该第二解码器的输入端分别与该第一编码器的输出端和该第一解码器的输出端耦合;该目标图像生成模块502,还被配置为通过该第一编码器获取该待处理图像对应的多个第一尺度特征向量,并将该多个第一尺度特征向量输入该第二解码器;其中,不同的第一尺度特征向量对应的图像尺度不同;通过该第一解码器对该第一全局特征向量进行解码后,获取该待处理图像对应的多个第二尺度特征向量,并将该多个第二尺度特征向量输入该第二解码器;通过该第二解码器,将每个尺度对应的该第一尺度特征向量和该第二尺度特征向量进行融合,获取该尺度对应的第三尺度特征向量;据多个尺度对应的该第三尺度特征向量,得到该待处理图像对应的目标图像。
图6是根据一示例性实施例示出的另一种图像处理装置的框图,如图6所示,该装置还可以包括:
模型训练模块601,被配置为通过以下方式训练得到该目标图像处理模型:
获取多个待处理样本图像以及每个待处理样本图像对应的目标样本图像;
循环执行第一训练步骤,直至根据该第一损失函数确定训练后的预设图像处理模型满足第一预设停止迭代条件,根据训练后的预设图像处理模型确定该目标图像处理模型;
该第一训练步骤包括:针对每个待处理样本图像,将该待处理样本图像输入该预设图像处理模型的第一编码器,得到第一编码向量;并将该待处理样本图像对应的目标样本图像输入该预设图像处理模型的第二编码器,得到第二编码向量;通过该第一损失函数计算得到该第一编码向量与该第二编码向量的第一损失值;其中,该第一损失值用于表征该第一编码向量和该第二编码向量的差异程度;在根据该第一损失值确定该预设图像处理模型不满足该第一预设停止迭代条件的情况下,根据该第一损失值更新该预设图像处理模型的参数,得到训练后的预设图像处理模型,并将该训练后的预设图像处理模型作为新的预设图像处理模型。
可选地,该模型训练模块601,被配置为将训练后的预设图像处理模型中的第二编码器去除后,得到该目标图像处理模型。
可选地,该模型训练模块601,被配置为将该第一编码向量输入该第一解码器,得到该待处理样本图像对应的第一预测图像;通过第二损失函数计算得到该第一预测图像与该目标样本图像之间的第二损失值;在根据该第一损失值和该第二损失值确定该预设图像处理模型不满足该第一预设停止迭代条件的情况下,根据该第一损失值和该第二损失值更新该预设图像处理模型的参数,得到训练后的预设图像处理模型,并将该训练后的预设图像处理模型作为新的预设图像处理模型。
可选地,该预设图像处理模型还包括第二解码器,该第二解码器的输入端分别与该第一编码器的输出端和该第一解码器的输出端耦合;该模型训练模块601,被配置为将训练后的预设图像处理模型作为候选图像处理模型;循环执行对该候选图像处理模型进行训练的第二训练步骤,直至根据第一损失函数和第三损失函数,确定训练后的候选图像处理模型满足第二预设停止迭代条件,根据训练后的候选图像处理模型确定该目标图像处理模型;
该第二训练步骤包括:将该待处理样本图像输入该候选图像处理模型的第一编码器,得到该待处理图像对应的第二全局特征向量和多个第四尺度特征向量;并将该待处理样本图像对应的目标样本图像输入该候选图像处理模型的第二编码器,得到第三全局特征向量;将该第二全局特征向量输入该第一解码器,得到该待处理图像对应的多个第五尺度特征向量;通过该第二解码器,将每个尺度对应的该第四尺度特征向量和该第五尺度特征向量进行融合,得到该尺度对应的第六尺度特征向量;根据多个尺度对应的该第六尺度特征向量,得到该待处理图像对应的第二预测图像;通过第三损失函数计算得到该第二预测图像与该目标样本图像之间的第三损失值;通过该第一损失函数计算得到该第二全局特征向量与该第三全局特征向量的第四损失值;在根据该第三损失值和该第四损失值,确定该候选图像处理模型不满足该第二预设停止迭代条件的情况下,根据该第三损失值和该第四损失值更新该候选图像处理模型的参数,得到训练后的候选图像处理模型,并将该训练后的候选图像处理模型作为新的候选图像处理模型。
可选地,该模型训练模块601,被配置为根据该第三损失值和该第四损失值,更新该第二解码器的解码参数。
可选地,该模型训练模块601,被配置为根据第一预设学习率、第二预设学习率、该第三损失值和该第四损失值,更新该候选图像处理模型的参数;其中,该第一预设学习率表征该第一编码器和该第二编码器的参数学习率,该第二预设学习率表征该第二解码器的参数学习率;该第一预设学习率小于该第二预设学习率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
综上所述,采用本公开上述实施例中的装置,获取待处理图像;将该待处理图像输入目标图像处理模型,得到该待处理图像对应的目标图像;其中,该目标图像处理模型为根据第一损失函数对预设图像处理模型训练得到的;该目标图像处理模型包括第一编码器和第一解码器,第一编码器的输出端与第一解码器的输入端耦合,预设图像处理模型包括所述第一编码器、所述第一解码器和第二编码器;第一编码器用于将输入的待处理样本图像编码为第一编码向量,第二编码器用于将输入的目标样本图像编码为第二编码向量,目标样本图像与所述待处理样本图像相对应,该第一损失函数用于计算所述第一编码向量和所述第二编码向量的第一损失值,该第一损失值用于表征该第一编码向量和该第二编码向量的差异程度。这样,既可以在训练过程中通过第一损失函数和第二编码器的约束,使得训练得到的第一编码器具有图像逆映射和移除模糊退化的能力,又可以在模型应用过程中减少目标图像处理模型的复杂度。
图7是根据一示例性实施例示出的电子设备700的框图。例如,电子设备700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理、路由器等。
参照图7,电子设备700可以包括以下一个或多个组件:处理组件702,存储器704,电力组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。
处理组件702通常控制电子设备700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述图像处理方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在电子设备700的操作。这些数据的示例包括用于在电子设备700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件706为电子设备700的各种组件提供电力。电力组件706可以包括电源管理系统,一个或多个电源,及其他与为电子设备700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述电子设备700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当电子设备700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当电子设备700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为电子设备700提供各个方面的状态评估。例如,传感器组件714可以检测到电子设备700的打开/关闭状态,组件的相对定位,例如所述组件为电子设备700的显示器和小键盘,传感器组件714还可以检测电子设备700或电子设备700一个组件的位置改变,用户与电子设备700接触的存在或不存在,电子设备700方位或加速/减速和电子设备700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于电子设备700和其他设备之间有线或无线方式的通信。电子设备700可以接入基于通信标准的无线网络,例如Wi-Fi,2G、3G、4G、5G、NB-IOT、eMTC、或其他6G等,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图像处理方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由电子设备700的处理器720执行以完成上述图像处理方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述图像处理方法的代码部分。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (12)
1.一种图像处理方法,其特征在于,所述方法包括:
获取待处理图像;
将所述待处理图像输入目标图像处理模型,得到所述待处理图像对应的目标图像;
其中,所述目标图像处理模型为根据第一损失函数对预设图像处理模型训练得到的;所述目标图像处理模型包括第一编码器和第一解码器,所述第一编码器的输出端与所述第一解码器的输入端耦合,所述预设图像处理模型包括所述第一编码器、所述第一解码器和第二编码器;所述第一编码器用于将输入的待处理样本图像编码为第一编码向量,所述第二编码器用于将输入的目标样本图像编码为第二编码向量,所述目标样本图像与所述待处理样本图像相对应,所述第一损失函数用于计算所述第一编码向量和所述第二编码向量的第一损失值。
2.根据权利要求1所述的方法,其特征在于,所述将所述待处理图像输入目标图像处理模型,得到所述待处理图像对应的目标图像包括:
将所述待处理图像输入所述第一编码器;
通过所述第一编码器获取所述待处理图像对应的第一全局特征向量,并将所述第一全局特征向量输入所述第一解码器;
根据所述第一全局特征向量和所述第一解码器,获取所述待处理图像对应的目标图像。
3.根据权利要求2所述的方法,其特征在于,所述目标图像处理模型还包括第二解码器,所述第二解码器的输入端分别与所述第一编码器的输出端和所述第一解码器的输出端耦合;所述方法还包括:
通过所述第一编码器获取所述待处理图像对应的多个第一尺度特征向量,并将所述多个第一尺度特征向量输入所述第二解码器;其中,不同的第一尺度特征向量对应的图像尺度不同;
所述根据所述第一全局特征向量和所述第一解码器,获取所述待处理图像对应的目标图像包括:
通过所述第一解码器对所述第一全局特征向量进行解码后,获取所述待处理图像对应的多个第二尺度特征向量,并将所述多个第二尺度特征向量输入所述第二解码器;
通过所述第二解码器,将每个尺度对应的所述第一尺度特征向量和所述第二尺度特征向量进行融合,获取该尺度对应的第三尺度特征向量;
据多个尺度对应的所述第三尺度特征向量,得到所述待处理图像对应的目标图像。
4.根据权利要求1所述的方法,其特征在于,所述目标图像处理模型是通过以下方式训练得到的:
获取多个待处理样本图像以及每个待处理样本图像对应的目标样本图像;
循环执行第一训练步骤,直至根据所述第一损失函数确定训练后的预设图像处理模型满足第一预设停止迭代条件,根据训练后的预设图像处理模型确定所述目标图像处理模型;
所述第一训练步骤包括:
针对每个待处理样本图像,将该待处理样本图像输入所述预设图像处理模型的第一编码器,得到第一编码向量;并将该待处理样本图像对应的目标样本图像输入所述预设图像处理模型的第二编码器,得到第二编码向量;
通过所述第一损失函数计算得到所述第一编码向量与所述第二编码向量的第一损失值;其中,该第一损失值用于表征该第一编码向量和该第二编码向量的差异程度;
在根据所述第一损失值确定所述预设图像处理模型不满足所述第一预设停止迭代条件的情况下,根据所述第一损失值更新所述预设图像处理模型的参数,得到训练后的预设图像处理模型,并将该训练后的预设图像处理模型作为新的预设图像处理模型。
5.根据权利要求4所述的方法,其特征在于,所述根据训练后的预设图像处理模型确定所述目标图像处理模型包括:
将训练后的预设图像处理模型中的第二编码器去除后,得到所述目标图像处理模型。
6.根据权利要求4所述的方法,其特征在于,所述第一训练步骤还包括:
将所述第一编码向量输入所述第一解码器,得到所述待处理样本图像对应的第一预测图像;
通过第二损失函数计算得到所述第一预测图像与所述目标样本图像之间的第二损失值;
所述在根据所述第一损失值确定所述预设图像处理模型不满足所述第一预设停止迭代条件的情况下,根据所述第一损失值更新所述预设图像处理模型的参数,得到训练后的预设图像处理模型,并将该训练后的预设图像处理模型作为新的预设图像处理模型包括:
在根据所述第一损失值和所述第二损失值确定所述预设图像处理模型不满足所述第一预设停止迭代条件的情况下,根据所述第一损失值和所述第二损失值更新所述预设图像处理模型的参数,得到训练后的预设图像处理模型,并将该训练后的预设图像处理模型作为新的预设图像处理模型。
7.根据权利要求4所述的方法,其特征在于,所述预设图像处理模型还包括第二解码器,所述第二解码器的输入端分别与所述第一编码器的输出端和所述第一解码器的输出端耦合;所述根据训练后的预设图像处理模型确定所述目标图像处理模型包括:
将训练后的预设图像处理模型作为候选图像处理模型;
循环执行对所述候选图像处理模型进行训练的第二训练步骤,直至根据第一损失函数和第三损失函数,确定训练后的候选图像处理模型满足第二预设停止迭代条件,根据训练后的候选图像处理模型确定所述目标图像处理模型;
所述第二训练步骤包括:
将所述待处理样本图像输入所述候选图像处理模型的第一编码器,得到所述待处理图像对应的第二全局特征向量和多个第四尺度特征向量;并将该待处理样本图像对应的目标样本图像输入所述候选图像处理模型的第二编码器,得到第三全局特征向量;
将所述第二全局特征向量输入所述第一解码器,得到所述待处理图像对应的多个第五尺度特征向量;
通过所述第二解码器,将每个尺度对应的所述第四尺度特征向量和所述第五尺度特征向量进行融合,得到该尺度对应的第六尺度特征向量;
根据多个尺度对应的所述第六尺度特征向量,得到所述待处理图像对应的第二预测图像;
通过第三损失函数计算得到所述第二预测图像与所述目标样本图像之间的第三损失值;
通过所述第一损失函数计算得到所述第二全局特征向量与所述第三全局特征向量的第四损失值;
在根据所述第三损失值和所述第四损失值,确定所述候选图像处理模型不满足所述第二预设停止迭代条件的情况下,根据所述第三损失值和所述第四损失值更新所述候选图像处理模型的参数,得到训练后的候选图像处理模型,并将该训练后的候选图像处理模型作为新的候选图像处理模型。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第三损失值和所述第四损失值更新所述候选图像处理模型的参数包括:
根据所述第三损失值和所述第四损失值,更新所述第二解码器的解码参数。
9.根据权利要求7所述的方法,其特征在于,所述根据所述第三损失值和所述第四损失值更新所述候选图像处理模型的参数包括:
根据第一预设学习率、第二预设学习率、所述第三损失值和所述第四损失值,更新所述候选图像处理模型的参数;其中,所述第一预设学习率表征所述第一编码器和所述第二编码器的参数学习率,所述第二预设学习率表征所述第二解码器的参数学习率;所述第一预设学习率小于所述第二预设学习率。
10.一种图像处理装置,其特征在于,所述装置包括:
待处理图像获取模块,被配置为获取待处理图像;
目标图像生成模块,被配置为将所述待处理图像输入目标图像处理模型,得到所述待处理图像对应的目标图像;
其中,所述目标图像处理模型为根据第一损失函数对预设图像处理模型训练得到的;所述目标图像处理模型包括第一编码器和第一解码器,所述第一编码器的输出端与所述第一解码器的输入端耦合,所述预设图像处理模型包括所述第一编码器、所述第一解码器和第二编码器;所述第一编码器用于将输入的待处理样本图像编码为第一编码向量,所述第二编码器用于将输入的目标样本图像编码为第二编码向量,所述目标样本图像与所述待处理样本图像相对应,所述第一损失函数用于计算所述第一编码向量和所述第二编码向量的第一损失值。
11.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1至9中任一项所述方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1至9中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111449664.2A CN116206168A (zh) | 2021-11-30 | 2021-11-30 | 图像处理方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111449664.2A CN116206168A (zh) | 2021-11-30 | 2021-11-30 | 图像处理方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116206168A true CN116206168A (zh) | 2023-06-02 |
Family
ID=86517918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111449664.2A Pending CN116206168A (zh) | 2021-11-30 | 2021-11-30 | 图像处理方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116206168A (zh) |
-
2021
- 2021-11-30 CN CN202111449664.2A patent/CN116206168A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110287874B (zh) | 目标追踪方法及装置、电子设备和存储介质 | |
CN109257645B (zh) | 视频封面生成方法及装置 | |
CN107944409B (zh) | 能够区分关键动作的视频分析方法及装置 | |
CN110650370B (zh) | 一种视频编码参数确定方法、装置、电子设备及存储介质 | |
CN111553864B (zh) | 图像修复方法及装置、电子设备和存储介质 | |
CN111340731B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN108881952B (zh) | 视频生成方法及装置、电子设备和存储介质 | |
CN110536168B (zh) | 视频上传方法、装置、电子设备及存储介质 | |
CN107341509B (zh) | 卷积神经网络的训练方法、装置及可读存储介质 | |
CN109840917B (zh) | 图像处理方法及装置、网络训练方法及装置 | |
CN110708559A (zh) | 图像处理方法、装置及存储介质 | |
CN108171222B (zh) | 一种基于多流神经网络的实时视频分类方法及装置 | |
CN110909861A (zh) | 神经网络优化方法及装置、电子设备和存储介质 | |
CN109120929B (zh) | 一种视频编码、解码方法、装置、电子设备及系统 | |
CN115052150A (zh) | 视频编码方法、装置、电子设备和存储介质 | |
CN113613003B (zh) | 视频压缩、解压缩方法及装置、电子设备和存储介质 | |
CN111369482A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN110675355A (zh) | 图像重建方法及装置、电子设备和存储介质 | |
CN111953980B (zh) | 视频处理方法及装置 | |
CN110955800A (zh) | 视频检索方法及装置 | |
CN109068138B (zh) | 视频图像的处理方法及装置、电子设备和存储介质 | |
CN116206168A (zh) | 图像处理方法、装置、存储介质及电子设备 | |
CN113344131A (zh) | 网络训练方法及装置、电子设备和存储介质 | |
CN114240787A (zh) | 压缩图像修复方法及装置、电子设备和存储介质 | |
CN110019928B (zh) | 视频标题的优化方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |