CN115170455B - 图像处理方法及相关装置 - Google Patents
图像处理方法及相关装置 Download PDFInfo
- Publication number
- CN115170455B CN115170455B CN202210988037.4A CN202210988037A CN115170455B CN 115170455 B CN115170455 B CN 115170455B CN 202210988037 A CN202210988037 A CN 202210988037A CN 115170455 B CN115170455 B CN 115170455B
- Authority
- CN
- China
- Prior art keywords
- image processing
- image
- processing model
- model
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 677
- 238000000034 method Methods 0.000 claims abstract description 100
- 230000008569 process Effects 0.000 claims abstract description 65
- 230000000694 effects Effects 0.000 claims abstract description 21
- 238000012549 training Methods 0.000 claims description 216
- 230000007246 mechanism Effects 0.000 claims description 53
- 238000004590 computer program Methods 0.000 claims description 8
- 238000002347 injection Methods 0.000 claims 1
- 239000007924 injection Substances 0.000 claims 1
- 230000006870 function Effects 0.000 description 40
- 241000282414 Homo sapiens Species 0.000 description 22
- 238000010586 diagram Methods 0.000 description 17
- 238000013140 knowledge distillation Methods 0.000 description 13
- 238000013473 artificial intelligence Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000011478 gradient descent method Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 229920001621 AMOLED Polymers 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 210000004709 eyebrow Anatomy 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种图像处理方法及相关装置,可用于图像增强处理。该方法包括:获取待处理图像,待处理图像包括第一特征图像区域和第二特征图像区域;将待处理图像输入目标图像处理模型,对第一特征图像区域进行第一处理,对第二特征图像区域进行第二处理,得到目标图像处理模型输出的目标图像;目标图像包括第一特征图像区域对应的第一目标图像区域,和第二特征图像区域对应的第二目标图像区域;第一目标图像区域与第二目标图像区域的显示效果不同;第一处理不同于第二处理。实施本申请实施例,可以对待处理图像的不同特征图像区域分别进行处理,可以提高图像处理的灵活性和差异性,进而满足用户个性化的需求。
Description
技术领域
本申请涉及人工智能领域,具体涉及计算机视觉领域,尤其涉及一种图像处理方法及相关装置。
背景技术
随着终端技术的发展,智能手机、平板电脑等电子设备已经成为用户日常生活中不可或缺的一部分。拍摄功能作为电子设备配备的最重要的功能之一,用户使用的频率较高,用户经常利用拍摄功能进行拍照,得到拍摄的图像。
目前,在电子设备所处的拍摄环境较暗时,或者在电子设备受其他因素的影响时,拍摄到的图像质量不高。而为了提高图像的质量,用户可以对拍摄到的图像进行进一步的图像增强处理,例如电子设备拍摄到的图像清晰度较低,则用户可以通过电子设备对拍摄到的图像的亮度、对比度、饱和度、色调等参数进行调节,以增加拍摄到的图像的清晰度。但是采用这种处理方式,对图像的参数进行调节是针对图像进行整体调整,不够灵活且无法体现差异性。
因此,如何有效地对图像进行图像增强处理,是亟待解决的问题。
发明内容
本申请实施例提供一种图像处理方法及相关装置,可以提高图像处理的灵活性和差异性,进而满足用户个性化的需求。
第一方面,本申请实施例提供了一种图像处理方法,该方法可以由计算机设备执行,或由计算机设备中的模块执行,例如芯片或处理器等。该方法可包括:获取待处理图像,上述待处理图像包括第一特征图像区域和第二特征图像区域;将上述待处理图像输入目标图像处理模型,对上述第一特征图像区域进行第一处理,对上述第二特征图像区域进行第二处理,得到上述目标图像处理模型输出的目标图像;上述目标图像包括上述第一特征图像区域对应的第一目标图像区域,和上述第二特征图像区域对应的第二目标图像区域;上述第一目标图像区域与上述第二目标图像区域的显示效果不同;上述第一处理不同于上述第二处理;其中,上述目标图像处理模型是根据第一损失参数和第二损失参数对初始图像处理模型进行训练得到的;上述第一损失参数是根据第一处理结果和第二处理结果确定的,上述第一处理结果是将训练样本集输入参考图像处理模型,得到的上述参考图像处理模型输出的处理结果,上述第二处理结果是将上述训练样本集输入上述初始图像处理模型,得到的上述初始图像处理模型输出的处理结果;上述第二损失参数是根据上述第二处理结果与上述训练样本集的标签确定的;其中,上述训练样本集的标签用于标识上述第一处理的处理信息和上述第二处理的处理信息。
通过第一方面提供的方法,在对待处理图像进行处理的过程中,可以通过目标图像处理模型对待处理图像进行处理,得到目标图像处理模型输出的对待处理图像不同特征图像区域进行不同处理的目标图像,提高了图像处理的灵活性和差异性,特别是需要将待处理图像调整特定区域或者调整为特定风格,从而能更满足用户个性化的需求。并且,该目标图像处理模型是由训练样本集输入到参考图像处理模型和初始图像处理模型得到的多个损失参数进行训练得到的,通过将参考图像处理模型的图像处理能力知识蒸馏至目标图像处理模型,一方面,可以将更加轻量化的目标图像处理模型部署在算力较低的计算机设备中,提升图像处理的能力,也提高模型的部署能力;另一方面,在对待处理图像的不同特征图像区域进行图像处理的过程中,若是通过参考图像处理模型对待处理图像进行处理,不同特征图像区域的边界容易出现颜色跳变,而直接通过目标图像处理模型可对待处理图像处理可以解决不同特征图像区域的边界出现颜色跳变,以及颜色不一致的问题,从而使得处理得到的目标图像的不同特征图像区域的边界没有色差,提高图像处理的效果。
在一种可能的实现方式中,上述方法还包括:基于第一训练样本集对第一图像处理模型进行训练,得到第三损失参数;上述第一训练样本集的标签用于标识上述第二处理的处理信息;根据上述第三损失参数调整上述第一图像处理模型的模型参数,得到第二图像处理模型;基于上述第一训练样本集对上述第二图像处理模型进行训练,得到第四损失参数;在上述第四损失参数满足第一训练结束条件的情况下,将上述第二图像处理模型确定为初始参考图像处理模型。在本申请实施例中,参考图像处理模型作为知识蒸馏处理的老师模型,可以是针对不同的特征图像区域进行训练得到的,具体是通过将每一次训练得到的模型作为初始模型进行训练得到的。该参考图像处理模型的每一次训练可以针对某一个特征图像区域的显示效果,进而可以将参考图像处理模型的对不同特征图像区域进行处理的能力传给学生模型,即上述目标图像处理模型。
在一种可能的实现方式中,上述第二特征图像区域是上述待处理图像的部分区域;上述根据上述第三损失参数调整上述第一图像处理模型的模型参数,得到第二图像处理模型,包括:根据上述第三损失参数,调整上述第一图像处理模型中注意力机制模块的模型参数,得到第二图像处理模型。在本申请实施例中,在对参考图像处理模型进行训练的过程中,对图像的部分区域进行处理的能力是通过对参考图像处理模型的注意力机制模块进行训练得到的,相当于对图像的部分区域的颜色进行微调,通过这种方式训练得到的参考图像处理模型可以提高图像处理的灵活性和差异性,特别是需要将待处理图像调整特定区域或者调整为特定风格,从而能更满足用户个性化的需求。
在一种可能的实现方式中,基于第二训练样本集对初始参考图像处理模型进行训练,得到第五损失参数;上述第二训练样本集的标签用于标识上述第一处理的处理信息;根据上述第五损失参数调整上述初始参考图像处理模型中注意力机制模块的模型参数,得到第三图像处理模型;基于上述第二训练样本集对上述第三图像处理模型进行训练,得到第六损失参数;在上述第六损失参数满足第二训练结束条件的情况下,将上述第三图像处理模型确定为上述参考图像处理模型。在本申请实施例中,参考图像处理模型的训练可以第一次是对整个图像的调整进行训练,即训练一个得到对整个图像的颜色进行调整的图像处理模型,进而可以将第一次训练得到模型作为预训练模型进行第二次训练,第二次训练则是训练对图像的微调能力,则可以基于第二训练样本集更新初始参考图像处理模型中注意力机制模块的模型参数,从而得到对不同特征图像区域进行不同处理的参考图像处理模型。
在一种可能的实现方式中,上述第一特征图像区域是上述待处理图像的部分区域。在本申请实施例中,在第一特征图像区域为待处理图像的部分区域的情况下,第二图像区域也为该待处理图像的部分区域,例如,第一特征图像区域和第二特征图像区域可以为待处理图像中的两个部分区域,可以一个为局部区域,一个为占据较大面积的区域,待处理图像包括第一特征图像区域和除第一特征图像区域的第二特征图像区域。
在一种可能的实现方式中,上述方法还包括:在将训练样本集输入参考图像处理模型之后,在上述参考图像处理模型的处理过程中获取第一特征信息;在将训练样本集输入初始图像处理模型之后,在上述初始图像处理模型的处理过程中获取第二特征信息;根据上述第一特征信息和上述第二特征信息,确定第七损失参数。在本申请实施例中,在对目标图像处理模型进行训练的过程中,可以提取参考图像处理模型和初始图像处理模型在处理过程中的中间特征,从而有利于将老师模型的图像处理能力传给学生模型,从而得到具有老师模型的图像处理能力的图像处理模型,即目标图像处理模型。
在一种可能的实现方式中,上述目标图像处理模型是根据上述第一损失参数、上述第二损失参数和上述第七损失参数对初始图像处理模型进行训练得到的。在本申请实施例中,通过将参考图像处理模型中注意力机制模块处理后的特征与初始图像处理模型在处理过程中的中间特征计算损失参数,有利于将参考图像处理模型的注意力机制模块的图像处理能力传给初始图像处理模型,从而得到具有对特定区域进行不同处理的图像处理模型。
在一种可能的实现方式中,在上述参考图像处理模型的处理过程中获取第一特征信息,包括:在上述参考图像处理模型的处理过程中,根据上述参考图像处理模型中的注意力机制模块的输出参数获取第一特征信息。在本申请实施例中,最终得到的目标图像处理模型可以对待处理图像的至少一个部分区域的处理方式不同,得到的各个图像区域的显示效果不同,则在对目标图像处理模型训练时,选取的中间特征用于训练时,可以根据注意力机制模块输出参数选取特征,从而目标图像处理模型可以学习到注意力机制模块的处理能力。
第二方面,本申请实施例提供了一种计算机设备,该计算机设备包括:一个或多个处理器和存储器;该存储器与该一个或多个处理器耦合,该存储器用于存储计算机程序代码,该计算机程序代码包括计算机指令,该一个或多个处理器调用该计算机指令以使得该电子设备执行:获取待处理图像,上述待处理图像包括第一特征图像区域和第二特征图像区域;将上述待处理图像输入目标图像处理模型,对上述第一特征图像区域进行第一处理,对上述第二特征图像区域进行第二处理,得到上述目标图像处理模型输出的目标图像;上述目标图像包括上述第一特征图像区域对应的第一目标图像区域,和上述第二特征图像区域对应的第二目标图像区域;上述第一目标图像区域与上述第二目标图像区域的显示效果不同;上述第一处理不同于上述第二处理;其中,上述目标图像处理模型是根据第一损失参数和第二损失参数对初始图像处理模型进行训练得到的;上述第一损失参数是根据第一处理结果和第二处理结果确定的,上述第一处理结果是将训练样本集输入参考图像处理模型,得到的上述参考图像处理模型输出的处理结果,上述第二处理结果是将上述训练样本集输入上述初始图像处理模型,得到的上述初始图像处理模型输出的处理结果;上述第二损失参数是根据上述第二处理结果与上述训练样本集的标签确定的;其中,上述训练样本集的标签用于标识上述第一处理的处理信息和上述第二处理的处理信息。
在一种可能的实现方式中,该一个或多个处理器还用于调用该计算机指令以使得该计算机设备执行:基于第一训练样本集对第一图像处理模型进行训练,得到第三损失参数;上述第一训练样本集的标签用于标识上述第二处理的处理信息;根据上述第三损失参数调整上述第一图像处理模型的模型参数,得到第二图像处理模型;基于上述第一训练样本集对上述第二图像处理模型进行训练,得到第四损失参数;在上述第四损失参数满足第一训练结束条件的情况下,将上述第二图像处理模型确定为初始参考图像处理模型。
在一种可能的实现方式中,上述第二特征图像区域是上述待处理图像的部分区域;该一个或多个处理器还用于调用该计算机指令以使得该计算机设备执行:根据上述第三损失参数,调整上述第一图像处理模型中注意力机制模块的模型参数,得到第二图像处理模型。
在一种可能的实现方式中,该一个或多个处理器还用于调用该计算机指令以使得该计算机设备执行:基于第二训练样本集对初始参考图像处理模型进行训练,得到第五损失参数;上述第二训练样本集的标签用于标识上述第一处理的处理信息;根据上述第五损失参数调整上述初始参考图像处理模型中注意力机制模块的模型参数,得到第三图像处理模型;基于上述第二训练样本集对上述第三图像处理模型进行训练,得到第六损失参数;在上述第六损失参数满足第二训练结束条件的情况下,将上述第三图像处理模型确定为上述参考图像处理模型。
在一种可能的实现方式中,上述第一特征图像区域是上述待处理图像的部分区域。
在一种可能的实现方式中,该一个或多个处理器还用于调用该计算机指令以使得该计算机设备执行:在将训练样本集输入参考图像处理模型之后,在上述参考图像处理模型的处理过程中获取第一特征信息;在将训练样本集输入初始图像处理模型之后,在上述初始图像处理模型的处理过程中获取第二特征信息;根据上述第一特征信息和上述第二特征信息,确定第七损失参数。
在一种可能的实现方式中,上述目标图像处理模型是根据上述第一损失参数、上述第二损失参数和上述第七损失参数对初始图像处理模型进行训练得到的。
在一种可能的实现方式中,该一个或多个处理器还用于调用该计算机指令以使得该计算机设备执行:在上述参考图像处理模型的处理过程中,根据上述参考图像处理模型中的注意力机制模块的输出参数获取第一特征信息。
第三方面,本申请实施例提供一种计算机设备,该计算机设备中包括处理器,处理器被配置为支持该计算机设备实现第一方面提供的图像处理方法中相应的功能。该终端设备还可以包括存储器,存储器用于与处理器耦合,其保存该终端设备必要的程序指令和数据。该终端设备还可以包括通信接口,用于该计算机设备与其他设备或通信网络通信。
第四方面,本申请实施例提供一种计算机存储介质,用于储存为上述第二方面提供的一种图像处理装置所用的计算机软件指令,其包含用于执行上述方面所设计的程序。
第五方面,本申请实施例提供了一种包含指令的计算机程序产品,当该计算机程序产品在计算机设备上运行时,使得该计算机设备执行如第一方面或第一方面的任意一种可能实现的方式所述的方法。
第六方面,本申请提供了一种芯片系统,该芯片包括处理器,用于支持计算机设备实现上述第一方面中所涉及的功能,例如,获取待处理图像所涉及的信息。在一种可能的设计中,所述芯片系统还包括存储器,所述存储器,用于保存数据发送设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包含芯片和其他分立器件。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1是本申请实施例提供的一种图像处理系统构架示意图。
图2是本申请实施例提供的一种图像处理方法的流程示意图。
图3是本申请实施例提供的一种参考图像处理模型对图像处理的时序示意图。
图4是本申请实施例提供的一种参考图像处理模型对对图像处理的另一时序示意图。
图5是本申请实施例提供的一种参考图像处理模型中的注意力机制模块的时序示意图。
图6是本申请实施例提供的一种对参考图像处理模型训练的时序示意图。
图7是本申请实施例提供的一种对目标图像处理模型进行训练的时序示意图。
图8是本申请实施例提供的一种对目标图像处理模型进行训练的另一时序示意图。
图9是本申请实施例提供的一种计算机设备的硬件结构示意图。
图10是本申请实施例提供的一种图像处理装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例进行描述。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
在本说明书中使用的术语“部件”、“模块”、“系统”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。例如,部件可以是但不限于,在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序和/或计算机。通过图示,在计算设备上运行的应用和计算设备都可以是部件。一个或多个部件可驻留在进程和/或执行线程中,部件可位于一个计算机上和/或分布在2个或更多个计算机之间。此外,这些部件可从在上面存储有各种数据结构的各种计算机可读介质执行。部件可例如根据具有一个或多个数据分组(例如来自与本地系统、分布式系统和/或网络间的另一部件交互的二个部件的数据,例如通过信号与其它系统交互的互联网)的信号通过本地和/或远程进程来通信。
首先,在对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,以便于本领域技术人员理解。本申请实施例中涉及的名词和术语适用于如下的解释:
1、人工智能(artificial intelligence,AI)
人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
2、计算机视觉技术(computer vision,CV)
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
3、机器学习(machine learning,ML)
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
4、知识蒸馏(knowledge distillation)
知识蒸馏是一种模型压缩的方法,即知识蒸馏在繁琐的模型中提炼知识并将其压缩为单个模型的方法,以便可以将其部署到实际应用中。知识蒸馏是通过构建一个轻量化的小模型,利用性能更好的大模型的监督信息,来训练这个小模型,以期达到更好的性能和精度。一方面,通过知识蒸馏可以提高训练的学生模型的性能和精度,另一方面,可以减少图像处理的图像标签之间的标注量,例如,可以通过能分别识别物体A和物体B的两个老师模型同时蒸馏出一个可以识别物体A和物体B的学生模型。
其中,这里的大模型是指在大型的训练数据集上训练得到的大型神经网络模型,可以被称为老师模型(teacher network)。这里的小模型是指参数量更小的小型神经网络模型,可以被称为学生模型(student network)。该方法也可以视为一种知识迁移(knowledge transfer)的手段,将知识从老师模型通过训练迁移到学生模型上。
应用在本申请中,上述大模型可以是参考图像处理模型,参考图像处理模型可以是通过至少一次训练得到的大型神经网络模型。上述小模型可以是目标图像处理模型,目标图像处理模型是通过参考图像处理模型经过知识蒸馏得到的。
5、特征图像区域
特征图像区域可以指图像中包括某一个特征(例如,包括某个物体)的图像区域,也可以指图像中具有某一特征的图像区域,例如,该特征图像区域具有某种颜色特征、纹理特征等等。
应用在本申请中,特征图像区域可以是待处理图像(例如待处理图像)中包括某一特征,例如在包括人脸的待处理图像中,特征图像区域可以是嘴唇区域。在对待处理图像的处理过程中,可以针对特征图像区域进行处理。
6、注意力机制(Attention Mechanism)
注意力机制源于对人类视觉的研究。在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息。上述机制通常被称为注意力机制。人类视网膜不同的部位具有不同程度的信息处理能力,即敏锐度,只有视网膜中央凹部位具有最强的敏锐度。为了合理利用有限的视觉信息处理资源,人类需要选择视觉区域中的特定部分,然后集中关注它。例如,人们在阅读时,通常只有少量要被读取的词会被关注和处理。综上,注意力机制主要有两个方面:决定需要关注输入的哪部分;分配有限的信息处理资源给重要的部分。
注意力机制可以使得神经网络(模型)具备专注于其输入(或特征)子集的能力:选择特定的输入。注意力可以应用于任何类型的输入而不管其形状如何。在计算能力有限情况下,注意力机制是解决信息超载问题的主要手段的一种资源分配方案,将计算资源分配给更重要的任务。
应用在本申请中,参考图像处理模型中可以包括注意力机制模块,该注意力机制模块可以是像素级注意力机制(Pixel-wiseattention)模块,通过该注意力机制模块可以对待处理图像中特征图像区域进行关注和处理。
7、损失参数
损失参数是指预测值(估计值)与实际值(预期值、参考值、标签(ground truth))之间会存在差异, “损失”意味着模型因未能产生预期结果而受到的惩罚。其作用是将通过比较模型的预测输出和预期输出来确定模型的性能,进而寻找优化方向。如果二者之间的偏差非常大,则损失值会很大;如果偏差很小或值几乎相同,损失值会非常低。其中,损失参数可以包括损失函数(Loss Function)、代价函数(Cost Function)。
其中,对于不同的模型可以使用合适的损失函数,当模型在训练样本集上进行训练时,该损失函数可以适当地惩罚该模型。例如,针对回归问题的损失函数可以包括平均绝对误差(mean absolute error,MAE)损失函数、均方误差(mean square error,MSE)损失函数等等。再例如,针对分类问题的损失函数可以包括交叉熵损失(Cross Entropy Loss)等等。
8、卷积层(Convolutional layer)
卷积层可以是卷积神经网络(convolutional neural network,CNN)中的层级,可以由若干卷积单元组成,通过卷积层对图像进行卷积计算,可以得到较好的图像处理效果。其中,卷积计算是通过卷积核(也称为过滤器)来进行的,卷积核可以认为是一张图,图的尺寸为接收域的大小,可以将图像或者图像提取的特征作为一个矩阵,卷积核作为另一个矩阵,通过卷积核在图像或者图像提取的特征上滑动并进行点积运算,从而得到卷积计算的结果。卷积核中每个权重可以认为是一个像素值。假设权重只包含0和1,那么过滤器将忽略0对应的输入,仅保留1对应的输入。对于多个卷积层来说,后一个卷积层可以整合前一个卷积层的特征,形成相对复杂的特征。
在训练中,包括卷积层的模型会根据任务需求寻找最有效的卷积核,然后将这些卷积核组合为更复杂的模式。
为了便于理解本申请实施例,下面先对本申请实施例所基于的其中一种图像处理系统架构进行描述。
请参阅图1,图1是本申请实施例提供的一种图像处理系统架构示意图。如图1所示,图像处理系统包括终端设备101和服务器102。终端设备101和服务器102均可以是具有一定的计算、存储和通信资源的计算机设备。其中,终端设备101例如可以是平板电脑、台式计算机、智能车载终端、笔记本电脑、智能手机等。服务器102例如可以是独立的服务器(例如中心服务器),也可以是多个物理服务器组成的服务器集群或者分布式系统,还可以是部署在云环境上的服务器,以及部署在边缘环境中的边缘计算设备。
在一种可能的实现方式中,终端设备101可以部署有目标图像处理模型,终端设备101在获取待处理图像后,可以将待处理图像输入至目标图像处理模型中,得到目标图像处理图像输出的目标图像,从而完成对待处理图像的处理。该终端设备101还可以部署参考图像处理模型,终端设备101可以将目标图像处理模型作为学生模型,将参考图像处理模型作为老师模型进行知识蒸馏模型得到的。可选地,终端设备101还可以对参考图像处理模型进行训练,进而可以训练初始图像处理模型,得到目标图像处理模型。
在另一种可能的实现方式中,服务器102部署有目标图像处理模型,服务器102在获取待处理图像后,可以将获取到的待处理图像输入至目标图像处理模型中,得到目标图像处理图像输出的目标图像。该服务器102上还可以部署参考图像处理模型,服务器102可以根据参考图像处理模型对目标图像处理模型进行知识蒸馏。可选地,服务器102还可以训练参考图像处理模型,并进一步根据训练得到的参考图像处理模型对初始图像处理模型进行训练,得到目标图像处理模型。
在又一种可能的实现方式中,终端设备101部署有目标图像处理模型,服务器102部署有参考图像处理模型,服务器102可以获取初始图像处理模型,根据部署的参考图像处理模型对初始图像处理模型进行知识蒸馏,得到目标图像处理模型,并将训练得到的图像处理模型部署在终端设备101中。可选地,服务器102可以对参考图像处理模型进行训练,即服务器102可以获取第一图像处理模型,并对第一图像处理模型进行训练,得到上述参考图像处理模型。
可以理解的是,图1中的图像处理系统架构用于举例,并不构成对本申请实施例的限定。
需要说明的是,本申请涉及的计算机设备可以是终端设备101,也可以是终端设备101中的模块,例如芯片或处理器等。本申请涉及的计算机设备也可以是服务器102,也可以是终端设备101中的模块,例如芯片或处理器等。本申请涉及的计算机设备还可以包括终端设备101和服务器102,也可以包括终端设备101中的模块和服务器102中的模块,例如包括终端设备101中的芯片和服务器102中的芯片,或包括终端设备101中的处理器和服务器102中的处理器等。
本申请实施例提供的图像处理方法可以对待处理图像中至少两个特征图像区域分别进行不同的处理。本申请所描述的图像处理方法,可以应用于图像增强、视频增强等诸多领域,例如暗光环境下的图像增强、视频增强等,以实现特定功能。
示例性的,应用场景为图像增强场景。
图像增强场景是指:增强图像中的有用信息,它可以是一个失真的过程,其目的是要改善图像的视觉效果,针对给定图像的应用场合。具体的,图像增强场景可以是有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要的场景。例如可以获取待处理图像,该待处理图像可以是拍摄的照片或者其他图像,可以对该图像进行增强,以使待处理图像被调整为特定的风格,更符合用户的审美。然而,目前的图像增强的方式一种是对图像整体进行调整,调整不够灵活且不能差异化;另一种是仅对部分图像区域进行调整,而在对部分图像区域处理的时候,相邻的图像区域之间的边界处会出现颜色跳变的情况,处理效果不好。示例性的,待处理图像为包括人脸的图像,在对待处理图像中人脸的肤色进行调整过程中,想对唇色进行针对性调整时,除了唇部区域的颜色改变以外,可能会影响人脸的肤色发生变化,如产生“佛光问题”,即人脸图像的颜色从唇部区域向四周依次渐变,从而导致出现色差。
此时,计算机设备可以获取包括第一特征图像区域和第二特征图像区域的待处理图像,并将待处理图像输入至目标图像处理模型中,通过目标图像处理模型对第一特征图像区域进行第一处理,对第二特征图像区域进行第二处理,从而得到目标图像处理模型输出的目标图像。其中,在目标图像中,经过第一处理得到的第一目标图像区域和经过第二处理得到的第二目标图像区域的显示不同。该目标图像处理模型是基于参考图像处理模型知识蒸馏得到的,该参考图像处理模型可以是通过两次不同的训练得到的模型,两次不同的训练分别训练对第一特征图像区域进行第一处理的处理能力,以及对第二特征图像区域进行第二处理的处理能力。
示例性的,终端设备可以拍摄包括人脸的图像,进而对该图像的色调进行调整,并且在调整过程中想要人脸中的嘴唇区域的颜色保持不变,则第一特征图像区域为待处理图像中除嘴唇区域以外的区域,第二特征图像区域为待处理图像中的嘴唇区域。将待处理图像输入至目标图像处理模型中,通过目标图像处理模型对第一特征图像区域进行第一处理,例如进行色调调整,通过目标图像处理模型对第二特征图像区域进行第二处理,例如保持待处理图像中唇色不变,从而得到包括第一目标图像区域和第二目标图像区域的目标图像。一方面,提高了图像处理的灵活性和差异性,从而能够满足用户个性化的需求;另一方面,通过知识蒸馏到学生模型的方式可以提升图像处理的效果,解决颜色跳变,出现色差的问题,提高了图像处理的效果。
需要说明的是,上述所描述的应用场景用于举例,并不构成对本申请实施例的限定。
基于图1提供的图像处理系统的架构,结合本申请中提供的图像处理方法,对本申请中提出的技术问题进行具体分析和解决。请参阅附图2,图2是本申请实施例提供的一种图像处理方法的流程示意图。该方法可以包括以下步骤201-步骤202。
步骤201、计算机设备获取待处理图像。
在本申请实施例中,待处理图像为需要进行处理的图像。其中,该待处理图像包括第一特征图像区域和第二特征图像区域,所谓特征区域是指图像中包括某一特征的图像区域,例如包括图像中的视觉目标的图像区域。例如,待处理图像为包括人脸的图像,该视觉目标可以是人脸中的眼睛、鼻子、嘴唇等等。可选地,待处理图像可以包括两个特征图像区域,也可以包括两个以上特征图像区域,本申请对此不做限定,为了描述方便,以下以待处理图像包括两个特征图像区域为例进行讲解。
在一种可能的实现方式中,第一特征图像区域可以是待处理图像中的部分区域,第二特征图像区域也可以为待处理图像中的部分区域,第一特征图像区域和第二特征图像区域不重叠。可以理解的是,可以对待处理图像中两个局部区域分别进行不同的微调,即对第一特征图像区域进行微调(第一处理),对第二特征图像区域进行另一种微调(第二处理),从而得到特定风格的图像,也可以得到满足用户需求的图像。
在另一种可能的实现方式中,第一特征图像区域和第二特征图像区域组成待处理图像,即待处理图像中除第一特征图像区域以外的为第二特征图像区域,该第一特征图像区域和第二特征图像区域不重叠。可以理解的是,可以对图像整体区域进行处理,例如,对图像整体区域进行饱和度增强处理(第一处理),并对某一局部区域进行微调(第二处理),从而提高图像处理的灵活性和差异性,能够得到特定风格的图像,可以得到满足用户需求的图像。
步骤202、计算机设备将上述待处理图像输入目标图像处理模型,对第一特征图像区域进行第一处理,对第二特征图像区域进行第二处理,得到上述目标图像处理模型输出的目标图像。
在本申请实施例中,目标图像处理模型为对待处理图像处理的模型,该目标图像处理模型是根据第一损失参数和第二损失参数对初始图像处理模型进行训练得到的。其中,第一损失参数是根据第一处理结果和第二处理结果确定的,所谓第一处理结果是将训练样本集输入参考图像处理模型,得到的参考图像处理模型输出的处理结果,第二处理结果是将训练样本集输入初始图像处理模型,得到的初始图像处理模型输出的处理结果。可以理解的是,上述参考图像处理模型可以为能够对待处理图像包括的第一特征图像区域进行第一处理,并且可以对第二特征图像区域进行第二处理的模型。
在本申请实施例中,参考图像处理模型可以作为老师模型,将参考图像处理模型对图像进行第一处理和第二处理的处理能力知识蒸馏至作为学生模型的初始图像处理模型,从而对初始图像处理模型进行训练,得到目标图像处理模型。因此,在获取训练样本集后,可以通过将训练样本集分别输入参考图像处理模型(老师模型)和初始图像处理模型(学生模型),分别得到参考图像处理模型输出的第一处理结果和初始图像处理模型输出的第二处理结果确定第一损失参数。
其中,所谓第二损失参数是根据第二处理结果与训练样本集的标签确定的。即训练样本集携带标签,该训练样本集的标签用于标识第一处理的处理信息和第二处理的处理信息。可以理解的是,训练样本集中各个训练样本为初始的图像,训练样本集中各个训练样本对应的标签为处理后的图像,该处理后的图像可以包括对训练样本的第一特征图像区域进行第一处理的处理信息,以及对训练样本的第二特征图像区域进行第二处理的处理信息。
需要说明的是,第一处理不同于第二处理。第一处理和第二处理均可以是对图像进行颜色处理或其他处理,例如可以是亮度处理、饱和度处理等等,第一处理和第二处理也可以为对颜色保持不变处理,本申请对此不做限定。因此,在通过对初始图像处理模型进行训练得到目标图像处理模型后,目标图像处理模型可以对输入的待处理图像的第一特征图像区域进行第一处理,对第二特征图像区域进行第二处理,得到输出的目标图像。
其中,目标图像可以包括第一目标图像区域和第二目标图像区域,目标图像区域对应于特征图像区域,可以指处理后的图像中包括某一特征(例如某一物体)的图像区域,例如,上述包括人脸的待处理图像中特征图像区域可以为嘴唇区域,则得到的目标图像的目标图像区域也为包括的嘴唇的区域。具体的,目标图像中第一目标图像区域为对应的第一特征图像区域经过第一处理得到的,目标图像中第二目标图像区域为对应的第二特征图像区域为经过第二处理得到的。目标图像的第一目标图像区域和第二目标图像区域的显示效果不同。
在一种可能的实现方式中,第一特征图像区域和第二特征图像区域均为待处理图像中的部分区域,即两个局部区域。则目标图像处理模型可以分别对待处理图像的不同特征图像区域进行微调。示例性的,待处理图像为包括人脸的图像,第一特征图像区域可以是眉毛区域,第二特征图像区域可以是嘴唇区域,则可以对第一特征图像区域进行变暗处理(第一处理),对第二特征图像区域饱和度增强处理(第二处理)。
在另一种可能的实现方式中,第一特征图像区域和第二特征图像区域组成待处理图像,则可以一个特征区域为整体区域,一个特征区域为局部区域,整体调整方式和局部调整方式可以不同。示例性的,待处理图像为包括人脸的图像,第一特征图像区域可以是除嘴唇区域以外的其他区域,第二特征图像区域可以是嘴唇区域,则可以对第一特征图像区域进行饱和度增强处理(第一处理),对第二特征图像区域不改变颜色处理(第二处理)。
下面对参考图像处理模型的训练和应用进行详细介绍。
在一种可能的实现方式中,参考图像处理模型可以是具有至少一种图像处理能力(如上述第一处理和第二处理的处理能力)的模型。请一并参阅图3,图3是本申请实施例提供的一种参考图像处理模型对图像处理的时序示意图。如图3所示,可以将包括第一特征图像区域和第二特征图像区域的输入图像输入参考图像处理模型,通过参考图像处理模型对待处理图像进行处理,其中,该参考图像处理模型中包括注意力机制模块,该注意力机制模块可以对图像的局部区域进行关注和处理。例如,待处理图像为包括人脸的图像,则局部区域可以是眉毛、眼睛、鼻子、嘴唇区域。再例如,待处理图像为包括蓝天白云以及山水的风景图像,则局部区域可以是蓝天区域等等。
具体地,通过参考图像处理模型的注意力机制模块可以对待处理图像中的某一特征图像区域(例如第一特征图像区域)进行处理,在得到通过注意力机制模块处理后,得到的特征信息。可选地,该特征信息也可以包括用于进一步通过模型中其他模块的信息,即用于通过参考图像处理模型的其他模块可以根据该特征信息继续进行处理,最终得到第一处理的处理结果。并且,通过参考图像处理模型对第二特征图像特征区域进行第二处理,可以得到该参考图像处理模型输出的输出图像,该输出图像包括第一处理的处理结果和第二处理的处理结果。
需要说明的是,图3所示参考图像处理模型中的注意力机制模块指向的第一处理的处理结果并非仅通过参考图像处理模型的注意力机制模块直接输出该处理结果,图3中该第一处理的处理结果仅为该注意力机制模块的作用示例,实际上该注意力机制模块作为参考图像处理模型中的一部分,通过参考图像处理模型整体对待处理图像进行处理,得到输出图像。
请一并参阅图4,图4是本申请实施例提供的一种参考图像处理模型对对图像处理的另一时序示意图。如图4所示,在对包括人脸的图像进行图像处理的场景中,以输入图像为包括人脸的图像为例进行讲解,将输入图像输入参考图像处理模型后,通过参考图像中的注意力机制与输入图像进行点乘可以得到嘴唇区域的特征信息,图4以包括嘴唇区域的二值图像为特征信息进行示例。该二值图像可以表示对该嘴唇区域的图像进行重点关注,例如可以对嘴唇区域所包括的像素点的权重增加,不对其他区域的像素点的权重进行任何处理,即不改变其他区域的像素点的权重。其中,图4所示的嘴唇区域的二值图像还可以用于表示想要的处理效果是对嘴唇区域不做颜色上的改变。
具体的,参考图像处理模型可以提取输入图像的特征,进而对提取的特征进行处理。其中,在通过参考图像处理模型对输入图像进行处理的过程中,可以得到输入图像的特征,进一步处理得到中间特征,所谓中间特征可以理解为通过参考图像处理模型对输入图像的特征进行处理的过程中得到的特征,也可以理解为参考图像处理模型的中间层处理得到的特征,还可以理解在整个参考图像处理模型在处理的过程中,某一阶段处理得到的特征。
可选地,输入图像或者输入图像的特征在通过注意力机制模块得到特征信息后,可以与中间特征进行点乘,进而可以得到包括各个像素点的权重的中间特征,进一步地,通过参考图像处理模型对中间特征进行处理,得到后续的特征,还可以再次与注意力机制模块得到的特征信息进行点乘,最终,得到参考图像处理模型输出的处理结果,即输出图像。其中,通过两次点乘能够对局部区域的起到更好的监督作用,使得对局部区域的处理效果更好。参考图像处理模型输出的输出图像可以如图4所示,该除嘴唇区域以外的区域的颜色发生变化(即第一处理的处理结果)。嘴唇区域的颜色不发生改变(即第二处理的处理结果)。
在一种可能的实现方式中,上述参考图像处理模型中的注意力机制模块的其中一种实现方式可以参见图5,如图5所示,输入图像输入参考图像处理模型后,可以经过注意力机制模块的处理,例如可以经过第一卷积层的处理,该第一卷积层中包括的卷积核的尺寸为k*k(如图5所示的Conv.k*k),k为大于1的整数,例如k为3,则该卷积层的卷积核的尺寸为3*3,从而得到该卷积层处理的图像特征信息,该图像特征信息可以是C通道输出得到的,C为大于1的整数,例如C可以为64、128等等,本申请对此不做限定。进一步,再通过包括尺寸为1*1的卷积核(如图5中Conv.1*1)的第二卷积层进行处理,通过k*k通道分别输出输入图像的特征信息,在该k为3的时候,可以通过9个通道输出特征信息,该特征信息可以为像素点的权重。其中,某一个像素点的权重可以通过9个系数来表示,即该像素点的权重可以通过该像素点本身以及该像素点与周围8个像素点的关联关系来确定。可选地,该注意力机制模块还可以包括其他处理信息,本申请对此不做限定。
示例性的,输入图像的尺寸为100*100,通过上述注意力机制模块可以输出100*100*9个系数,其中,该输入图像的像素点的个数可以为100*100,9可以为每个像素点的9个系数,可以为9个通道分别输出的。通过每个像素点与其本身和周围8个像素点之间的关联关系分别得到一个系数组成的9个系数可以用于表示该像素点的权重,即像素点的9个系数可以代表该像素点的权重值。
可以理解的是,注意力机制模块可以理解为一个小的卷积神经网络,针对不同的输入图像可以输出针对该输入图像的像素点的权重,则可以被理解为针对不同的输入图像自适应权重,则该注意力机制模块也可以被理解为自适应注意力机制。
在一种可能的实现方式中,在通过参考图像处理模型对输入图像进行处理之前,可以对参考图像处理模型进行训练。其中,以待处理图像包括两个特征图像区域(第一特征图像区域和第二特征图像区域)为例,则参考图像处理模型可以是分为两次训练得到的。请一并参阅图6,图6是本申请实施例提供的一种对参考图像处理模型训练的时序示意图。如图6所示,第一次训练可以通过第一训练样本集对第一图像处理模型进行训练,得到初始参考图像处理模型,该初始参考图像处理模型可以具有第二处理的处理能力,第二次训练可以通过第二训练样本集对初始参考图像处理模型进行训练,得到参考图像处理模型,该参考图像处理模型可以具有第一处理和第二处理的处理能力。
具体的,第一次可以基于第一训练样本集对第一图像处理模型进行训练,该第一训练样本集的标签用于标识第二处理的处理信息,即用于训练第二处理的处理能力,进而,根据第三损失参数调整第一图像处理模型的模型参数,得到第二图像处理模型,并基于该第一训练样本集对第二图像处理模型再次进行训练,得到第四损失参数,在第四损失参数满足第一训练结束条件的情况下,将第二图像处理模型确定为初始参考图像处理模型。
可以理解的是,计算机设备通过将第一训练样本集输入至第一图像处理模型(即参考图像处理模型的初始模型)中,确定一次损失参数(第三损失参数),如损失函数的值,在根据该第三损失参数(如损失函数的值)确定不满足第一训练结束条件的情况下,计算机设备可以根据该第三损失参数对第一图像处理模型的参数进行调整,得到调整后的第二图像处理模型,并可以再次利用该第一训练样本集对该第二图像处理模型进行训练,再次得到一个损失参数(第四损失参数),如再次确定一次损失函数的值,再根据这次损失函数的值(第四损失参数)判断是否满足上述第一训练结束条件。在满足的情况下,将该第二图像处理模型确定为初始参考图像处理模型。在不满足的情况下,调整上述第二图像处理模型,并再次对调整后的第二图像处理模型进行训练,直至得到的损失参数满足第一训练结束条件,即损失函数的值满足第一训练结束条件,得到初始参考图像处理模型。
其中,第一训练结束条件可以是损失参数(如第四损失参数)中的损失函数的值在预设阈值范围内,如损失函数的值为最小值,第一训练结束条件也可以是连续N次迭代训练得到的损失函数的值中,相邻两次得到的损失函数的值的差值小于预设差值阈值的次数大于或等于预设次数阈值。本申请对此不做限定,具体可根据使用场景确定。则可以在根据损失参数(如第四损失参数)满足训练结束条件的情况下,将满足训练结束条件时的第二图像处理模型确定为初始参考图像处理模型。可选地,可以通过梯度下降法(gradientdescent)来对第一图像处理模型的模型参数进行调整。在使用梯度下降法更新模型参数时,计算损失函数的梯度,根据该梯度来对模型参数进行迭代更新,以将该第一图像处理模型进行逐渐收敛来提高模型的回归处理(预测图像)的准确率,这里的准确率可以为预测图像与标签的图像的相似度。
在一种可能的实现方式中,若第二特征图像区域处理是待处理图像的部分区域,即第二特征图像区域为局部区域,则在调整上述第一图像处理模型的模型参数时,可以根据第三损失参数调整第一图像处理模型中的注意力机制模块的模型参数,从而得到第二图像处理模型。同理,若第四损失参数不满足第一训练结束条件的情况下,可以根据第四损失参数调整第二图像处理模型中的注意力机制模块的模型参数。第一训练样本集可以是针对该第二处理能力的样本集,其标签可以用于标识局部区域的处理信息。
在一种可能的实现方式中,若第二特征图像区域处理是待处理图像的部分区域,但该第二特征图像区域是待处理图像中除局部区域(如第一特征图像区域)以外的区域,即占据待处理图像中较大面积的区域。则可以根据第三损失参数调整第一图像处理模型中的模型参数,即调整模型的整体模型参数,从而得到第二图像处理模型。同理,若第四损失参数不满足第一训练结束条件的情况下,可以根据第四损失参数调整第二图像处理模型的模型参数,同样的是调整模型的整体模型参数。第一训练样本集可以是针对该第一处理能力的样本集,其标签可以用于标识第二特征图像区域的处理信息,其标签还可以用于标识整个图像区域的处理信息。示例性的,其标签还可以用于标识整个图像区域的处理信息可以为对训练样本的整个图像的颜色改变,例如给整个图像增加一个滤镜。
进一步地,若上述第三损失参数和第四损失参数是针对整体模型参数进行调整,在得到初始参考图像处理模型后,可以基于第二训练样本集对初始参考图像处理模型进行训练,得到第五损失参数;根据第五损失参数调整初始参考图像处理模型中注意力机制模块的模型参数,得到第三图像处理模型;进而,计算机设备可以再次基于第二训练样本集对第三图像处理模型进行继续训练,得到第六损失参数;在第六损失参数满足第二训练结束条件的情况下,将第三图像处理模型确定为参考图像处理模型。可以理解的是,第二训练样本集的标签用于标识第一处理的处理信息,可以用于标识占据待处理图像中部分区域,即较小的面积的区域(第一特征图像区域)的处理信息,相当于局部区域的处理信息。
同样的,第二训练结束条件可以是损失参数(如第六损失参数)中的损失函数的值在预设阈值范围内,如损失函数的值为最小值,第二训练结束条件也可以是连续N次迭代训练得到的损失函数的值中,相邻两次得到的损失函数的值的差值小于预设差值阈值的次数大于或等于预设次数阈值。本申请对此不做限定,具体可根据使用场景确定。则可以在根据损失参数(如第六损失参数)满足训练结束条件的情况下,将满足训练结束条件时的第二图像处理模型确定为初始参考图像处理模型。可选地,可以通过梯度下降法(gradientdescent)来对第一图像处理模型的模型参数进行调整。在使用梯度下降法更新模型参数时,计算损失函数的梯度,根据该梯度来对模型参数进行迭代更新,以将该第一图像处理模型进行逐渐收敛来提高模型的回归处理(预测图像)的准确率,这里的准确率可以为预测图像与标签的图像的相似度。可选地,在该图像处理为回归处理的情况下,该第三损失参数和第四损失参数可以根据MSE损失函数确定的,即将该训练作为分类处理进行训练。其中,第三损失参数和第四损失参数可以被称为L2 LOSS。
其中,以上述输入图像为包括人脸的图像,在对人脸图像的颜色进行调整,且想要嘴唇区域的颜色不发生变化的情况下,第二训练样本集的标签可以是各个训练样本的图像的嘴唇区域的二值图像,即嘴唇区域的掩膜(mask)。可选地,在该图像处理为回归处理的情况下,该第三损失参数和第四损失参数可以根据MSE损失函数确定的,即将该训练作为分类处理进行训练。由于上述掩膜的二值图像中像素点的值非0即1,可以作为二分类的分类处理,则第五损失参数和第六损失参数可以是根据交叉熵损失函数确定的。
然而,由于通过掩膜这种方式对初始参考图像处理模型进行训练得到的图像处理模型过于生硬,容易破坏整图的一致性,则通过参考图像处理模型对待处理图像进行处理得到的输出图像容易造成嘴唇周围的人脸区域颜色突变、跳变或者颜色不一致的问题。因此,可以将该部分的处理能力通过知识蒸馏的方式传给目标图像处理模型后,可以通过目标图像处理模型对待处理图像进行处理,从而解决颜色发生突变或者跳变的问题,提高图像处理的效果,也能提高图像处理的灵活性和差异性,从而能更满足用户个性化的需求。
对参考图像处理模型训练完成后,可以利用该参考图像处理模型对初始图像处理模型进行训练,得到目标图像处理模型,下面将结合图7具体描述如何对初始图像处理模型进行训练的过程。
请一并参阅图7,图7是本申请实施例提供的一种对目标图像处理模型进行训练的时序示意图。如图7所示,参考图像处理模型作为老师模型,初始图像处理模型作为学生模型。其中,将训练样本集分别输入参考图像处理模型和初始图像处理模型,得到参考图像处理模型对训练样本集中的各个训练样本进行处理得到的处理结果,即第一处理结果,也得到初始图像处理模型对训练样本集中各个训练样本进行处理得到的处理结果,即第二处理结果。进而,根据第一处理结果和第二处理结果确定第一损失参数。并根据该初始图像处理模型处理得到的第二处理结果和训练样本集的标签确定第二损失参数。
在一种可能的实现方式中,可以在将训练样本集输入参考图像处理模型之后,在参考图像处理模型的处理过程中获取第一特征信息,在将训练样本集输入初始图像处理模型之后,在初始图像处理模型的处理过程中获取第二特征信息,根据第一特征信息和第二特征信息,确定第七损失参数。进而,根据第一损失参数、第二损失参数以及第七损失参数,对初始图像处理模型进行训练,从而得到目标图像处理模型。
具体的,以训练样本集中的某一个训练样本为例,该训练样本可以是初始图像,该训练样本携带的标签为实际图像,该实际图像为对初始图像的两个特征区域进行分别进行第一处理和第二处理得到的,具体显示效果可以根据实际任务需求确定。将该训练样本分别输入参考图像处理模型和初始图像处理模型中,得到该训练样本对应的第一处理结果和该训练样本对应的第二处理结果,则可以根据训练样本集中各个训练样本的第一处理结果和第二处理结果分别确定第一损失参数和第二损失参数,例如,第一损失参数可以是训练样本集中各个训练样本的第一处理结果与第二处理结果的均方误差之和。再例如,第二损失参数可以是训练样本集中各个训练样本的第二处理结果与实际图像的均方误差之和。
进一步地,可以在参考图像处理模型对训练样本集中各个训练样本的处理过程中获取第一特征信息,该第一特征信息为经过参考图像处理模型中注意力机制模块处理得到的特征信息,即可以是根据参考图像处理模型中的注意力机制模块的输出参数获取第一特征信息,可以携带各个像素点的权重,例如可以是如图4所示的中间特征的特征信息。同样的,在初始图像处理模型对训练样本集中各个训练样本的处理过程中获取第二特征信息,并根据第一特征信息和第二特征信息确定第七损失参数。该第七损失参数也可以是各个训练样本在参考图像处理模型处理过程中的第一特征信息与初始图像处理模型处理过程中的第二特征信息之间的均方误差之和确定的,该第七损失函数也可以被称为L2 LOSS。
请一并参阅图8,图8是本申请实施例提供的一种对目标图像处理模型进行训练的另一时序示意图。该图8以在对包括人脸的图像进行颜色调整,并且保持嘴唇区域的颜色不变的场景为例进行讲解。训练样本集中包括多个训练样本,每个训练样本为一张图像,且每个训练样本对应的标签也为一张图像,该标签的图像为对该包括人脸的图像进行颜色调整,对嘴唇区域的颜色保持不变。将训练样本集的各个训练样本分别输入参考图像处理模型和初始图像处理模型中,该参考图像处理模型为训练得到的老师模型,初始图像处理模型为预训练的学生模型。其中,参考图像处理模型中的处理方式可以参见上述图4的描述,在这里不再赘述,从而得到参考图像处理模型输出的第一处理结果,可以理解的是,训练样本集的标签可以作为一种“硬标签”,通过参考图像处理模型输出的第一处理结果可以作为一种“软标签”对初始图像处理模型进行训练。并且得到初始图像处理模型输出的第二处理结果,该第二处理结果为初始图像处理模型的预测图像。
进一步,可以根据第一处理结果与第二处理结果计算第一损失参数,并根据第二处理结果以及训练样本集的标签计算第二损失参数。可选地,该第一损失参数和第二损失参数均为L2 LOSS。并在训练样本集的各个训练样本分别输入参考图像处理模型和初始图像处理模型之后,可以在老师模型(即参考图像处理模型)和学生模型(即初始图像处理模型)的处理过程中分别获取第一特征信息和第二特征信息,该第一特征信息和第二特征信息可以为参考图像处理模型和初始图像处理模型的中间层处理得到的特征信息,也可以是中间阶段处理得到的特征信息。根据该第一特征信息和第二特征信息可以计算第七损失参数,该第七损失参数也为L2 LOSS。
进而,根据第一损失参数、第二损失参数以及第七损失参数来调整初始图像处理模型的模型参数。具体的,可以根据第一损失参数、第二损失参数以及第七损失参数之和来调整初始图像处理模型的参数。可选地,可以为第一损失参数、第二损失参数以及第七损失参数配置不同的权重,从而可以对第一损失参数、第二损失参数以及第七损失参数的加权求和的结果来调整初始图像处理模型的模型参数。进一步地,可以再通过训练样本集对调整参数后的初始图像处理模型,得到三个损失参数,进而根据新得到的三个损失参数之和确定是否满足训练结束条件,若满足则可以将该调整后的初始图像处理模型确定为目标图像处理模型,反之则继续进行训练,直至得到的三个损失参数确定满足初始图像处理模型的训练结束条件,从而得到目标图像处理模型。
其中,该初始图像处理模型的训练结束条件与上述第一训练结束条件和第二训练结束条件类似,具体可以参见上述第一训练结束条件以及第二训练结束条件的描述,在这里不再赘述。
在得到目标图像处理模型之后,计算机设备可以获取包括第一特征图像区域和第二特征图像区域的待处理图像,进而将该待处理图像输入目标图像处理模型中,通过目标图像处理模型对该待处理图像的第一特征图像区域进行第一处理,对该待处理图像的第二特征图像区域进行第二处理,得到包括第一目标图像区域和第二目标图像区域的目标图像。其中,该第一目标图像区域的显示效果是对第一特征图像区域进行第一处理得到的,第二目标图像区域的显示效果是对第二特征图像区域进行第二处理得到的。通过知识蒸馏的方式将参考图像处理模型的图像处理能力传给目标图像处理模型,可以提高图像处理的灵活性和差异性,从而能更满足用户的需求,并且可以解决图像处理后颜色发生跳变的问题,从而提高图像处理的效果。
上述详细阐述了本申请实施例的方法,下面对计算机设备100的结构进行介绍。请参阅图9,图9是本申请实施例提供的计算机设备100的硬件结构示意图。
计算机设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本发明实施例示意的结构并不构成对计算机设备100的具体限定。在本申请另一些实施例中,计算机设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是计算机设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
计算机设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,计算机设备100可以包括1个或N个显示屏194,N为大于1的正整数。显示屏194可以显示待处理图像也可以显示计算机设备100对待处理图像处理后得到的目标图像。
NPU为神经网络(neural-network ,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现计算机设备100的智能认知等应用,例如:图像处理,人脸识别,语音识别,文本理解等。
请一并参阅图10,图10是本申请实施例提供的一种图像处理装置的结构示意图。图10所示的图像处理装置1000可以包括:获取单元1001、输入单元1002、训练单元1003、调整单元1004、确定单元1005,其中,各个单元的详细描述如下:
获取单元1001,用于获取待处理图像,上述待处理图像包括第一特征图像区域和第二特征图像区域;
输入单元1002,用于将上述待处理图像输入目标图像处理模型,对上述第一特征图像区域进行第一处理,对上述第二特征图像区域进行第二处理,得到上述目标图像处理模型输出的目标图像;上述目标图像包括上述第一特征图像区域对应的第一目标图像区域,和上述第二特征图像区域对应的第二目标图像区域;上述第一目标图像区域与上述第二目标图像区域的显示效果不同;上述第一处理不同于上述第二处理;
其中,上述目标图像处理模型是根据第一损失参数和第二损失参数对初始图像处理模型进行训练得到的;上述第一损失参数是根据第一处理结果和第二处理结果确定的,上述第一处理结果是将训练样本集输入参考图像处理模型,得到的上述参考图像处理模型输出的处理结果,上述第二处理结果是将上述训练样本集输入上述初始图像处理模型,得到的上述初始图像处理模型输出的处理结果;上述第二损失参数是根据上述第二处理结果与上述训练样本集的标签确定的;其中,上述训练样本集的标签用于标识上述第一处理的处理信息和上述第二处理的处理信息。
在一种可能的实现方式中,上述图像处理装置1000还包括:
训练单元1003,用于基于第一训练样本集对第一图像处理模型进行训练,得到第三损失参数;上述第一训练样本集的标签用于标识上述第二处理的处理信息;
调整单元1004,用于根据上述第三损失参数调整上述第一图像处理模型的模型参数,得到第二图像处理模型;
上述训练单元1003,还用于基于上述第一训练样本集对上述第二图像处理模型进行训练,得到第四损失参数;
确定单元1005,用于在上述第四损失参数满足第一训练结束条件的情况下,将上述第二图像处理模型确定为初始参考图像处理模型。
在一种可能的实现方式中,上述第二特征图像区域是上述待处理图像的部分区域;上述调整单元1004,具体用于:
根据上述第三损失参数,调整上述第一图像处理模型中注意力机制模块的模型参数,得到第二图像处理模型。
在一种可能的实现方式中,上述图像处理装置1000还包括:
上述训练单元1003,还用于基于第二训练样本集对初始参考图像处理模型进行训练,得到第五损失参数;上述第二训练样本集的标签用于标识上述第一处理的处理信息;
上述调整单元1004,还用于根据上述第五损失参数调整上述初始参考图像处理模型中注意力机制模块的模型参数,得到第三图像处理模型;
上述训练单元1003,还用于基于上述第二训练样本集对上述第三图像处理模型进行训练,得到第六损失参数;
上述确定单元1005,还用于在上述第六损失参数满足第二训练结束条件的情况下,将上述第三图像处理模型确定为上述参考图像处理模型。
在一种可能的实现方式中,上述第一特征图像区域是上述待处理图像的部分区域。
在一种可能的实现方式中,上述获取单元1001,还用于在将训练样本集输入参考图像处理模型之后,在上述参考图像处理模型的处理过程中获取第一特征信息;
在将训练样本集输入初始图像处理模型之后,在上述初始图像处理模型的处理过程中获取第二特征信息;
上述确定单元1005,还用于根据上述第一特征信息和上述第二特征信息,确定第七损失参数。
在一种可能的实现方式中,上述目标图像处理模型是根据上述第一损失参数、上述第二损失参数和上述第七损失参数对初始图像处理模型进行训练得到的。
在一种可能的实现方式中,上述获取单元1001,还用于在上述参考图像处理模型的处理过程中获取第一特征信息,具体用于:
在上述参考图像处理模型的处理过程中,根据上述参考图像处理模型中的注意力机制模块的输出参数获取第一特征信息。
需要说明的是,本申请实施例中所描述的图像处理装置1000中各功能单元的功能可参见上述图2中上述的方法实施例中步骤201-步骤202的相关描述,此处不再赘述。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。上述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行上述计算机程序指令时,全部或部分地产生按照本申请上述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。上述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,上述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如, DVD)、或者半导体介质(例如固态硬盘 SolidState Disk)等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可能可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以为个人计算机、服务端或者网络设备等,具体可以是计算机设备中的处理器)执行本申请各个实施例上述方法的全部或部分步骤。其中,而前述的存储介质可包括:U盘、移动硬盘、磁碟、光盘、只读存储器(Read-Only Memory,缩写:ROM)或者随机存取存储器(Random Access Memory,缩写:RAM)等各种可以存储程序代码的介质。
以上上述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种图像处理方法,其特征在于,包括:
获取待处理图像,所述待处理图像包括第一特征图像区域和第二特征图像区域;
将所述待处理图像输入目标图像处理模型,对所述第一特征图像区域进行第一处理,对所述第二特征图像区域进行第二处理,得到所述目标图像处理模型输出的目标图像;所述目标图像包括所述第一特征图像区域对应的第一目标图像区域,和所述第二特征图像区域对应的第二目标图像区域;所述第一目标图像区域与所述第二目标图像区域的显示效果不同;所述第一处理不同于所述第二处理,所述目标图像处理模型中不包括注意力机制模块;
其中,所述目标图像处理模型是根据第一损失参数和第二损失参数对初始图像处理模型进行训练得到的;所述第一损失参数是根据第一处理结果和第二处理结果确定的,所述第一处理结果是将训练样本集输入参考图像处理模型,得到的所述参考图像处理模型输出的处理结果,所述第二处理结果是将所述训练样本集输入所述初始图像处理模型,得到的所述初始图像处理模型输出的处理结果;所述第二损失参数是根据所述第二处理结果与所述训练样本集的标签确定的;其中,所述训练样本集的标签用于标识所述第一处理的处理信息和所述第二处理的处理信息;所述参考图像处理模型中包括注意力机制模块,所述参考图像处理模型中的注意力机制模块用于针对不同特征图像区域进行不同处理。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于第一训练样本集对第一图像处理模型进行训练,得到第三损失参数;所述第一训练样本集的标签用于标识所述第二处理的处理信息;
根据所述第三损失参数调整所述第一图像处理模型的模型参数,得到第二图像处理模型;
基于所述第一训练样本集对所述第二图像处理模型进行训练,得到第四损失参数;
在所述第四损失参数满足第一训练结束条件的情况下,将所述第二图像处理模型确定为初始参考图像处理模型。
3.根据权利要求2所述的方法,其特征在于,所述第二特征图像区域是所述待处理图像的部分区域;所述根据所述第三损失参数调整所述第一图像处理模型的模型参数,得到第二图像处理模型,包括:
根据所述第三损失参数,调整所述第一图像处理模型中注意力机制模块的模型参数,得到第二图像处理模型。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
基于第二训练样本集对初始参考图像处理模型进行训练,得到第五损失参数;所述第二训练样本集的标签用于标识所述第一处理的处理信息;
根据所述第五损失参数调整所述初始参考图像处理模型中注意力机制模块的模型参数,得到第三图像处理模型;
基于所述第二训练样本集对所述第三图像处理模型进行训练,得到第六损失参数;
在所述第六损失参数满足第二训练结束条件的情况下,将所述第三图像处理模型确定为所述参考图像处理模型。
5.根据权利要求3所述的方法,其特征在于,所述第一特征图像区域是所述待处理图像的部分区域。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在将训练样本集输入参考图像处理模型之后,在所述参考图像处理模型的处理过程中获取第一特征信息;
在将训练样本集输入初始图像处理模型之后,在所述初始图像处理模型的处理过程中获取第二特征信息;
根据所述第一特征信息和所述第二特征信息,确定第七损失参数。
7.根据权利要求6所述的方法,其特征在于,所述目标图像处理模型是根据所述第一损失参数、所述第二损失参数和所述第七损失参数对初始图像处理模型进行训练得到的。
8.根据权利要求6所述的方法,其特征在于,在所述参考图像处理模型的处理过程中获取第一特征信息,包括:
在所述参考图像处理模型的处理过程中,根据所述参考图像处理模型中的注意力机制模块的输出参数获取第一特征信息。
9.一种计算机设备,其特征在于,包括处理器和存储器,所述处理器和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210988037.4A CN115170455B (zh) | 2022-08-17 | 2022-08-17 | 图像处理方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210988037.4A CN115170455B (zh) | 2022-08-17 | 2022-08-17 | 图像处理方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115170455A CN115170455A (zh) | 2022-10-11 |
CN115170455B true CN115170455B (zh) | 2023-02-07 |
Family
ID=83481601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210988037.4A Active CN115170455B (zh) | 2022-08-17 | 2022-08-17 | 图像处理方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115170455B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116740360A (zh) * | 2023-08-10 | 2023-09-12 | 荣耀终端有限公司 | 一种图像处理方法、装置、设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022105173A1 (zh) * | 2020-11-20 | 2022-05-27 | 平安科技(深圳)有限公司 | 模型蒸馏方法、装置、存储介质及设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111310616B (zh) * | 2020-02-03 | 2023-11-28 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111291755B (zh) * | 2020-02-13 | 2022-11-15 | 腾讯科技(深圳)有限公司 | 对象检测模型训练及对象检测方法、装置、计算机设备和存储介质 |
CN114627034A (zh) * | 2020-12-08 | 2022-06-14 | 华为技术有限公司 | 一种图像增强方法、图像增强模型的训练方法及相关设备 |
CN114372580A (zh) * | 2021-12-31 | 2022-04-19 | 北京旷视科技有限公司 | 模型训练方法、存储介质、电子设备和计算机程序产品 |
CN114627085A (zh) * | 2022-03-17 | 2022-06-14 | 腾讯科技(深圳)有限公司 | 目标图像的识别方法和装置、存储介质及电子设备 |
-
2022
- 2022-08-17 CN CN202210988037.4A patent/CN115170455B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022105173A1 (zh) * | 2020-11-20 | 2022-05-27 | 平安科技(深圳)有限公司 | 模型蒸馏方法、装置、存储介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN115170455A (zh) | 2022-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112232425B (zh) | 图像处理方法、装置、存储介质及电子设备 | |
JP7282810B2 (ja) | 視線追跡方法およびシステム | |
CN107430677B (zh) | 基于对二进制卷积神经网络特征进行提升的目标识别 | |
JP2022505775A (ja) | 画像分類モデルの訓練方法、画像処理方法及びその装置、並びにコンピュータプログラム | |
CN111241985B (zh) | 一种视频内容识别方法、装置、存储介质、以及电子设备 | |
CN111598168B (zh) | 图像分类方法、装置、计算机设备及介质 | |
CN111242273B (zh) | 一种神经网络模型训练方法及电子设备 | |
CN112419326B (zh) | 图像分割数据处理方法、装置、设备及存储介质 | |
CN115170455B (zh) | 图像处理方法及相关装置 | |
JP2020119508A (ja) | 画像検索装置、分類器学習方法及びプログラム | |
CN111553838A (zh) | 模型参数的更新方法、装置、设备及存储介质 | |
CN111612723B (zh) | 图像修复方法及装置 | |
CN116645917A (zh) | Led显示屏亮度调节系统及其方法 | |
US11495020B2 (en) | Systems and methods for stream recognition | |
CN112115900B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN116229188B (zh) | 图像处理显示方法、分类模型的生成方法及其设备 | |
CN115797948A (zh) | 一种文字识别方法、装置及设备 | |
CN112528760B (zh) | 图像处理方法、装置、计算机设备及介质 | |
CN115795355A (zh) | 一种分类模型训练方法、装置及设备 | |
KR20200094607A (ko) | 영상 시퀀스에 대한 캡션 정보를 생성하는 전자 장치 및 그 동작 방법 | |
WO2022143314A1 (zh) | 一种对象注册方法及装置 | |
US11423308B1 (en) | Classification for image creation | |
CN114549556A (zh) | 一种图像分割的方法、相关装置、设备以及存储介质 | |
CN114399622A (zh) | 图像处理方法和相关装置 | |
CN114005156A (zh) | 人脸替换方法、系统、终端设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |