CN110910322A - 图片处理方法、装置、电子设备及计算机可读存储介质 - Google Patents
图片处理方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110910322A CN110910322A CN201911071878.3A CN201911071878A CN110910322A CN 110910322 A CN110910322 A CN 110910322A CN 201911071878 A CN201911071878 A CN 201911071878A CN 110910322 A CN110910322 A CN 110910322A
- Authority
- CN
- China
- Prior art keywords
- picture
- image
- frame
- target area
- network model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000012217 deletion Methods 0.000 claims abstract description 9
- 230000037430 deletion Effects 0.000 claims abstract description 9
- 238000004891 communication Methods 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 230000003042 antagnostic effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 3
- 230000008439 repair process Effects 0.000 abstract description 4
- 230000009471 action Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 210000002105 tongue Anatomy 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 210000001508 eye Anatomy 0.000 description 5
- 238000013508 migration Methods 0.000 description 5
- 230000005012 migration Effects 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 3
- 239000011324 bead Substances 0.000 description 2
- 210000000744 eyelid Anatomy 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000005252 bulbus oculi Anatomy 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明实施例提供了一种图片处理方法及、装置、电子设备及计算机可读存储介质,所述方法包括获取第一图片;识别第一图片中的目标区域的轮廓信息,其中,所述目标区域为第一图片中的存在图像缺失的区域;将所述轮廓信息和第一图片输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对所述目标区域进行图像修复,以获得第二图片。本发明提供的一种图片处理方法及、装置、电子设备及计算机可读存储介质,可以实现对图像缺失区域的修复,从而提高了动态图片的生成质量。
Description
技术领域
本发明涉及图片处理领域,特别涉及一种图片处理方法、装置、电子设备及计算机可读存储介质。
背景技术
现有技术中存在一种采用算法制作动态图片的方法,该方法主要是通过向图像变形算法模型输入一张静态图片和一个模板视频,图像变形算法模型获取模板视频中的人物的动作,并根据所获取的人物的动作对静态图像的对应区域进行拉扯,以实现动作迁移。
然而,可能存在模板视频中的某些图像特征在静态图像中不存在的问题,从而导致,在完成动作迁移后,所生成的动态图像存在图像缺失的区域;例如,模板视频中的人物可能存在张嘴动作,而输入的静态图片是处于闭嘴状态,在这种情况下,当动作迁移后,所生成的动态图像仅对嘴唇进行了拉扯,而无法生成牙齿和舌头。对此,现有技术中通常是将预先准备好的图像粘贴于图像缺失的区域,如上述张嘴动作过程导致嘴部形成图像缺失区域时,通常是将预先准备好的嘴部图片直接粘贴于所生成的动态图像的嘴部区域。采用此种方式生成的动态图片,由于图像缺失区域是后期将预先准备好的图片粘贴于对应位置的,将导致动态图片的图像缺失区域与动态图片的其他区域不协调的问题,进而导致所生成的动态图片质量差。
发明内容
本发明实施例的目的在于提供一种图片处理方法及、装置、电子设备及计算机可读存储介质,以实现对图像缺失区域的修复,从而提高了动态图片的生成质量。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种图片处理方法,所述方法包括:
获取第一图片;
识别第一图片中的目标区域的轮廓信息,其中,所述目标区域为第一图片中的存在图像缺失的区域;
将所述轮廓信息和第一图片输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对所述目标区域进行图像修复,以获得第二图片。
在本发明实施的第二方面,还提供了一种图片处理装置,所述装置包括:
获取模块,用于获取第一图片;
识别模块,用于识别第一图片中的目标区域的轮廓信息,其中,所述目标区域为第一图片中的存在图像缺失的区域;
生成模块,用于将所述轮廓信息和第一图片输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对所述目标区域进行图像修复,以获得第二图片。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述所述的图片处理方法。
在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的图片处理方法。
本发明实施例中,通过确定第一图片中图像缺失的区域的轮廓信息,并利用预先训练得到的生成对抗网络模型对图像缺失的区域进行修复,以获得第二图片;由于本发明实施例中是在确定的区域内对所缺失的图像进行重新生成,因此,所生成的图像的轮廓形状与图像缺失的区域的轮廓形状相同,同时,生成对抗网络模型是经过预先训练得到的,所生成的图像与除缺失区域之外的其他区域的协调性更好,相对于现有技术中直接将预先准备好的图片粘贴于图像缺失区域而言,提高了所制作的动态图片的质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例中图片处理方法流程图;
图2为本发明另一实施例中图片处理方法的流程图;
图3为本发明实施例中识别第一图片中的目标区域的轮廓形状信息的流程图;
图4为本发明实施例中检测第一图片中需要修复的帧次的流程图;
图5为本发明实施例中又一实施例中图片处理方法的流程图;
图6为本发明实施例中所采集的某一帧次图像中脸部区域的关键点坐标示意图;
图7为本发明实施例中所生成的嘴部区域的轮廓示意图;
图8为本发明实施例中一种图片处理装置的结构示意图;
图9为本发明实施例中识别模块的结构示意图;
图10为本发明实施例中生成模块的结构示意图;
图11为本发明实施例中检测子模块的结构示意图;
图12为本发明实施例中电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
如图1所示,本发明实施例提供的一种图片处理方法,所述方法包括以下步骤:
步骤S101,获取第一图片;
其中,第一图片可以是静态图片,也可以是包括多帧画面的动态图片。当第一图片为动态图片时,第一图片可以是在利用图像变形算法模型制作人物动态图像过程中,完成动作迁移后得到的动态图片;具体地,图像变形算法模型完成动作迁移的过程可以为:获取一张静态图片和一个模板视频,将静态图片和模板视频的每一帧画面分别划分为若干个三角形区域,确定模板视频每一帧画面的三角形区域相对于上一帧画面的三角形区域的变形量,将所确定的变形量加载至静态图片上对应位置的三角形区域,从而完成动作迁移。
步骤S102,识别第一图片中的目标区域的轮廓信息,其中,所述目标区域为第一图片中的存在图像缺失的区域;
其中,所述轮廓信息可以包括目标区域的外周轮廓形状、目标区域的内部轮廓形状、目标区域的位置坐标、目标区域中某一点的位置坐标等信息中的至少一种。所述第一图片中可以包括人物或动物图像,所述第一图片中的图像缺失的区域,可以是指人物的脸部图像存在缺失的区域,或者动物的头部图像存在缺失的区域,例如,可以是人脸嘴部缺失牙齿或舌头,眼部缺失眼珠等,也可以是动物头部缺失舌头或眼珠等;还可以是指在利用算法制作动态图片的过程中所生成的动态图像存在图像缺失的区域,对此,不作限制。
步骤S103,将所述轮廓信息和第一图片输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对所述目标区域进行图像修复,以获得第二图片。
具体地,所述预先训练得到的生成对抗网络模型可以为:
Iresult=F(Imask,Iori)
上式中F表示生成对抗网络,网络训练过程的目标函数Loss为:
Loss=(Iresult-Itarget)2
其中,Iresult为所得到的结果图片,也即上述第二图片;Imask为所输入的存在图像缺失的区域的图片,也即上述第一图片;Iori图像缺失的区域的轮廓信息;Itarget为目标图像。
所述生成对抗网络模型可以为DCGAN模型(深度卷积对抗生成网络模型,DCGenerative Adversarial Network),所述预先训练得到的生成对抗网络模型的训练过程可以是:将一张正常的人物图像的某一部位挖空(将如眼部或嘴部挖空),得到缺失某一部位的人物图像(作为上述Imask)和所述某一部位的图像(作为上述Iori),并将所得到的缺失某一部位的人物图像和某一部位的图像输入上述生成对抗网络模型进行训练,从而完成对生成对抗网络模型的训练。在具体训练时,可以选取不同肤色、不同年龄阶段、不同性别的人物图像反复对上述生成对抗网络模型进行训练,以提高采用预先训练得到的生成对抗网络模型对目标区域修复的准确性。此外,可以是将正常视频的每一帧的某一部位挖空,将挖空后的视频和所挖出的图像输入上述生成对抗网络模型进行训练,从而完成对生成对抗网络模型的训练。
具体地,上述步骤通过确定第一图片中图像缺失的区域的轮廓信息,并利用预先训练得到的生成对抗网络模型对图像缺失的区域进行图像修复,以获得第二图片;由于本发明实施例中是在确定的区域内对所缺失的图像进行重新生成,因此,所生成的图像的轮廓形状与图像缺失的区域的轮廓形状相同,同时,生成对抗网络模型是经过预先训练得到的,所生成的图像与除缺失区域之外的其他区域的协调性更好,相对于现有技术中直接将预先准备好的图片粘贴于图像缺失区域而言,提高了所制作的动态图片的质量。
请参见图2,在本发明另一实施提供了一种图片处理方法,所述方法包括以下步骤:
步骤S201,获取第一图片;
步骤S202,识别第一图片中的目标区域的轮廓信息,其中,所述目标区域为第一图片中的存在图像缺失的区域;
步骤S203,将所述轮廓信息和第一图片输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对所述目标区域进行图像修复,以获得第二图片。
其中,所述第一图片可以为动态图片,且第一图片包括n帧图像,n>1。
所述步骤S202包括:提取所述第一图片中每一帧图像中的目标区域的轮廓信息。
步骤S202中可以是分别对第一图片的每一帧图像的目标区域的轮廓信息进行提取,得到与n帧图像对应的n个目标区域的轮廓信息,可以通过对n帧图像以及n个目标区域的轮廓信息分别进行编码,实现每一帧图像与该帧图像的目标区域的轮廓信息对应;应当理解的,所述目标区域为第一图片的每一帧图像的同一部位,例如,针对通过算法制作的人物动态图像中,所述目标区域可以是每一帧画面的嘴部区域。
所述步骤S203包括:将第一图片中每一帧图像及其目标区域的轮廓信息分别输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对n帧图像中的至少一帧图像的目标区域进行修复,以获得第二图片。
其中,在对某一帧图像进行修复时,可以是将其中一帧图像和该帧图像目标区域的轮廓信息输入预先训练得到的生成对抗网络模型对该帧图像进行修复,得到该帧图像修复后的图像。本步骤中,可以对n帧图像均进行修复,即执行n次上述对某一帧图像进行修复的过程,以得到n帧修复后的图像。也可以是先确定需要进行修复的图像的帧次,然后有选择的对对应帧次的图像进行修复。具体可以根据图像的内容而定,对此,不作限制。
可选地,请参见图3,以下以对人脸轮廓信息采集为例,对上述步骤S202进行进一步解释说明,所述步骤S202提取所述第一图片中每一帧图像中的目标区域的轮廓信息,包括以下步骤:
S301、采集每一帧图像中的关键点坐标,生成关键点坐标集合;其中,可以采用关键点检测算法库,比如Dlib库(图片人脸检测库)等,对每一帧图像中的关键点坐标进行检测,并将所检测到的关键点坐标记为:(LM1,LM2,LM3,…,LMn),n为视频帧数。其中,每一帧的关键点是一个二维坐标集合,比如第i帧的关键点LMi=((xp1,yp1),(xp2,yp2),…),LMi表示的可以是第i帧画面时,人物脸部所有关键点的坐标集合,LMi中所有关键点的坐标所合围形成的区域即为第i帧画面时的人脸轮廓。
S302、从所述关键点坐标集合中筛选出所述目标区域中的关键点坐标,以获得目标坐标集合;
其中,可以在关键点检测算法库中设置所要采集的关键点与人脸部位之间的对应关系,同时对所要采集的关键点进行编号,即任意一个关键点在人脸上对应的部位是确定的,例如,第j个关键点至第k个关键点(其中k>j)所形成的(k-j+1)个关键点为人物嘴部所有的关键点,因此,当目标区域为人物嘴部时,可以提取LMi中第j个关键点至第k个关键点作为目标坐标集合,即目标坐标集合可以记为((xpj,ypj),…,(xpk,ypk),),其中,((xpj,ypj),…,(xpk,ypk),)即为上述实施例中的Iori。
S303、对所述目标坐标集合中所有关键点所形成的区域进行填充,得到目标区域的轮廓形状信息,将所述目标坐标集合和所述目标区域的轮廓形状信息作为所述轮廓信息。
具体地,可以通过算法库,如OpenCV库(开源计算机视觉库,Open SourceComputer Vision Library),中的轮廓填充算法填充目标坐标集合所形成的区域,得到目标区域的轮廓形状信息,为通过OpenCV库所填充的嘴部轮廓。
可选地,上述步骤S203中包括仅对第一图片中的部分帧次进行修复的情形,请参见图4,为了实现仅对第一图片中的部分帧次进行修复,在对每一帧图片进行修复之前,需要对该帧图像进行判断,判断其是否需要被修复,因此,上述步骤S203中所述由所述生成对抗网络模型对n帧图像中的至少一帧图像的目标区域进行修复,可以包括以下步骤:
步骤S401、检测第一图片中需要进行修复的帧次;
步骤S402、对第一图片中需要进行修复的帧次的图像进行修复,以输出修复后的j帧图像,以及输出所述第一图片中不需要进行修复的帧次的k帧图像,其中,所述j与所述k之和等于所述n。
具体地,在检测第一图片中的某一帧图像是否需要进行修复时,可以以该帧图像中是否具备图像缺失的区域作为判断条件,若该帧图像存在图像缺失的区域,则确定该帧图像为需要进行修复的图像,反之,若该帧图像不存在图像缺失的区域,则该帧图像为不需要进行修复的图像。为了更加清楚的对本步骤进行说明,以下以对人物嘴部的牙齿和舌头进行修复为例进一步解释说明,在对人物嘴部的牙齿和舌头进行修复时,由于并不一定每一帧画面中的人物均处于张嘴状态,因此,通过筛选出需要进行修复的帧次的图像,并对其进行针对性的修复,而无需对每一帧画面均进行修复,从而提高了图像修复的效率。
可选地,为了筛选出第一图片中需要进行修复的帧次,上述步骤S401可以包括:
计算每一帧图像中指定两个关键点之间的距离;
若所述距离大于预设值,则确定该帧次的图像需要进行修复。
其中,通过对第一图片中的每一帧图像分别进行判断,从而可以筛选出第一图片中需要进行修复的帧次,为了更加清楚的对本步骤进行说明,以下进一步说明如何检测第一图片中某一帧图像是否需要进行修复:
具体地,上述指定两个关键点可以根据所要修复的具体图像而定,例如,需要对人物嘴部的牙齿和舌头进行修复时,所述指令两个关键点可以是位于上嘴唇中部的关键点和位于下嘴唇中部的关键点,又例如,在对人物眼部的眼珠进行修复时,所述指令两个关键点可以是位于上眼皮中部的关键点和位于下眼皮中部的关键点。以下以对人物嘴部的牙齿和舌头进行修复为例对本步骤进一步详细说明:如上述实施例所述,当判断出该帧图像中人物处于张嘴状态时,则确定该帧图像为需要进行修复的图像,为了判断该帧图像中人物是否处于张嘴状态,所述指定两个关键点可以是指位于上嘴唇中部的关键点和位于下嘴唇中部的关键点,通过判断该两个关键点的距离即可确定人物是否处于张嘴状态,通常正常闭嘴状态,该两个关键的距离为8个像素,因此,当计算出两个关键点之间的距离大于8个像素时,即可确定人物处于张嘴状态,也即可以确定该帧图像为需要进行修复的图像。
可选地,所述由所述生成对抗网络模型对所述目标区域进行修复,以获得第二图片包括:
按照所述第一图片中各帧次的播放顺序,将修复后的j帧图像和不需要进行修复的帧次的k帧图像重新进行编码并制作成动画,以作为所述第二图片。
其中,可以通过现有的任意一种动作制作软件将修复后的j帧图像和不需要进行修复的帧次的k帧图像重新进行编排并制作成动画,也可以采用计算机视觉库完成动画的制作。
请参见图5,以下一对人脸嘴部进行修复为例,对本发明说提供的图片处理方法进行进一步说明,一种图片处理方法,包括以下步骤:
步骤S501,获取一张缺失嘴部特征的动态图片作为第一图片;
步骤S502,分别采集第一图片的每一帧图像中脸部的关键点坐标,生成关键点坐标集合,请参见图6;
步骤S503,从所述关键点坐标集合中筛选出嘴部区域的关键点坐标,以获得目标坐标集合;
步骤S504,对目标坐标集合中所有关键点所形成的区域进行填充,得到嘴部区域的轮廓形状信息,将目标坐标集合和嘴部区域的轮廓形状信息作为轮廓信息,请参见图7;
步骤S505,将所述轮廓信息和第一图片输入预先训练得到的生成对抗网络模型;
步骤S506,检测第一图片中需要进行修复的帧次;
步骤S507,由生成对抗网络模型对第一图片中需要进行修复的帧次的图像进行修复,以输出修复后的j帧图像;
步骤S508,输出所述第一图片中不需要进行修复的帧次的k帧图像,其中k与j之和等于n;
步骤S509,按照所述第一图片中各帧次的播放顺序,将修复后的j帧图像和不需要进行修复的帧次的k帧图像重新进行编排编码并制作成动画,以获得作为所述第二图片。
其中,所述步骤S501-S509的具体实现方式可以参照上述实施例中的描述,为避免重复,此处不再赘述。
具体地,本发明实施例通过确定第一图片中图像缺失的区域的轮廓信息,并利用预先训练得到的生成对抗网络模型对图像缺失的区域进行修复,以获得第二图片;由于本发明实施例是在确定的区域内对所缺失的图像进行重新生成,因此,所生成的图像的轮廓形状与图像缺失的区域的轮廓形状相同,同时,生成对抗网络模型是经过预先训练得到的,所生成的图像与除缺失区域之外的其他区域的协调性更好,相对于现有技术中直接将预先准备好的图片粘贴于图像缺失区域而言,提高了所制作的动态图片的质量。
请参见图8,本发明实施例还提供了一种图片处理装置800,所述装置包括:
获取模块801,用于获取第一图片;
识别模块802,用于识别第一图片中的目标区域的轮廓信息,其中,所述目标区域为第一图片中的存在图像缺失的区域;
生成模块803,用于将所述轮廓信息和第一图片输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对所述目标区域进行图像修复,以获得第二图片。
本发明实施例通过确定第一图片中图像缺失的区域的轮廓信息,并利用预先训练得到的生成对抗网络模型对图像缺失的区域进行修复,以获得第二图片;由于本发明实施例中是在确定的区域内对所缺失的图像进行重新生成,因此,所生成的图像的轮廓形状与图像缺失的区域的轮廓形状相同,同时,生成对抗网络模型是经过预先训练得到的,所生成的图像与除缺失区域之外的其他区域的协调性更好,相对于现有技术中直接将预先准备好的图片粘贴于图像缺失区域而言,提高了所制作的动态图片的质量。
可选地,所述第一图片包括n帧图像,其中,n>1;
所述获取模块801,具体用于识别所述第一图片中每一帧图像中的目标区域的轮廓信息;
所述生成模块803,具体用于将第一图片中每一帧图像及其目标区域的轮廓信息分别输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对n帧图像中的j帧图像的目标区域进行图像修复,以获得第二图片,其中,所述生成对抗网络模型逐帧对所述j帧图像的目标区域进行图像修复,1≤j≤n。
可选地,请参见图9,所述识别模块802包括:
采集子模块,8021,用于采集每一帧图像中的关键点坐标,生成关键点坐标集合;
筛选子模块8022,用于从所述关键点坐标集合中筛选出所述目标区域中的关键点坐标,以获得目标坐标集合;
填充子模块8023,用于对所述目标坐标集合中所有关键点所形成的区域进行填充,得到目标区域的轮廓形状信息,将所述目标坐标集合和所述目标区域的轮廓形状信息作为所述轮廓信息。
可选地,请参见图10,所述生成模块803包括:
检测子模块8031,用于检测第一图片中需要进行修复的帧次;
修复子模块8032,用于对第一图片中需要进行修复的帧次的图像进行修复,以输出修复后的j帧图像,以及输出所述第一图片中不需要进行修复的帧次的k帧图像,所述j与所述k之和等于所述n。
可选地,请参见图11,所述检测子模块8031包括:
计算单元80311,用于计算每一帧图像中指定两个关键点之间的距离;
确定单元80312,用于若所述距离大于预设值,则确定该帧次的图像需要进行修复。
可选地,所述生成模块还包括:
生成子模块8033,按照所述第一图片中各帧次的播放顺序,将修复后的j帧图像和不需要进行修复的帧次的k帧图像重新进行编码并制作成动画,以作为所述第二图片。
需要说明的是,本发明实施例提供的图片处理装置是能够执行上述图片处理方法的装置,故上述图片处理方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
本发明实施例还提供了一种电子设备,如图12所示,包括处理器1201、通信接口1202、存储器1203和通信总线1204,其中,处理器1201,通信接口1202,存储器1203通过通信总线1204完成相互间的通信,
存储器1203,用于存放计算机程序;
处理器1201,用于执行存储器1203上所存放的程序时,实现如下步骤:
获取第一图片;
识别第一图片中的目标区域的轮廓信息,其中,所述目标区域为第一图片中的存在图像缺失的区域;
将所述轮廓信息和第一图片输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对所述目标区域进行修复,以获得第二图片。可选地,所述第一图片包括n帧图像,其中,n>1;
所述识别第一图片中的目标区域的轮廓信息,包括:
提取所述第一图片中每一帧图像中的目标区域的轮廓信息;
所述将所述轮廓信息和第一图片输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对所述目标区域进行修复,以获得第二图片,包括:
将第一图片中每一帧图像及其目标区域的轮廓信息分别输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对n帧图像中的至少一帧图像的目标区域进行修复,以获得第二图片。
可选地,所述提取所述第一图片中每一帧图像中的目标区域的轮廓信息,包括:
采集每一帧图像中的关键点坐标,生成关键点坐标集合;
从所述关键点坐标集合中筛选出所述目标区域中的关键点坐标,以获得目标坐标集合;
对所述目标坐标集合中所有关键点所形成的区域进行填充,得到目标区域的轮廓形状信息;
其中,所述轮廓信息包括所述目标子集合和所述轮廓形状。
可选地,由所述生成对抗网络模型对n帧图像中的至少一帧图像的目标区域进行修复,包括:
检测第一图片中需要进行修复的帧次;
对第一图片中需要进行修复的帧次的图像进行修复,以输出修复后的j帧图像,以及输出所述第一图片中不需要进行修复的帧次的k帧图像,其中,所述j+所述k等于所述n。
可选地,所述检测第一图片中需要进行修复的帧次,包括:
计算每一帧图像中指定两个关键点之间的距离;
若所述距离大于预设值,则确定该帧次的图像需要进行修复。
可选地,所述由所述生成对抗网络模型对所述目标区域进行修复,以获得第二图片包括:
将修复后的j帧图像和不需要进行修复的帧次的k帧图像重新进行编排并制作成动画,以获得所述第二图片。上述终端提到的通信总线可以是外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(ExtendedIndustry Standard Architecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的图像处理方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的图像处理方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (15)
1.一种图片处理方法,其特征在于,所述方法包括:
获取第一图片;
识别第一图片中的目标区域的轮廓信息,其中,所述目标区域为第一图片中的存在图像缺失的区域;
将所述轮廓信息和第一图片输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对所述目标区域进行图像修复,以获得第二图片。
2.根据权利要求1所述的方法,其特征在于,所述第一图片包括n帧图像,其中,n>1;
所述识别第一图片中的目标区域的轮廓信息,包括:
提取所述第一图片中每一帧图像中的目标区域的轮廓信息;
所述将所述轮廓信息和第一图片输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对所述目标区域进行图像修复,以获得第二图片,包括:
将第一图片中每一帧图像及其目标区域的轮廓信息分别输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对n帧图像中的j帧图像的目标区域进行图像修复,以获得第二图片,其中,所述生成对抗网络模型逐帧对所述j帧图像的目标区域进行图像修复,1≤j≤n。
3.根据权利要求2所述的方法,其特征在于,所述提取所述第一图片中每一帧图像中的目标区域的轮廓信息,包括:
采集每一帧图像中的关键点坐标,生成关键点坐标集合;
从所述关键点坐标集合中筛选出所述目标区域中的关键点坐标,以获得目标坐标集合;
对所述目标坐标集合中所有关键点所形成的区域进行填充,得到目标区域的轮廓形状信息,将所述目标坐标集合和所述目标区域的轮廓形状信息作为所述轮廓信息。
4.根据权利要求2所述的方法,其特征在于,由所述生成对抗网络模型对n帧图像中的至少一帧图像的目标区域进行图像修复,包括:
检测第一图片中需要进行修复的帧次;
对第一图片中需要进行修复的帧次的图像进行修复,以输出修复后的j帧图像,以及输出所述第一图片中不需要进行修复的帧次的k帧图像,其中,所述j与所述k之和等于所述n。
5.根据权利要求4所述的方法,其特征在于,所述检测第一图片中需要进行修复的帧次,包括:
计算每一帧图像中指定两个关键点之间的距离;
若所述距离大于预设值,则确定该帧次的图像需要进行修复。
6.根据权利要求4所述的方法,其特征在于,所述由所述生成对抗网络模型对所述目标区域进行图像修复,以获得第二图片包括:
按照所述第一图片中各帧次的播放顺序,将修复后的j帧图像和不需要进行修复的帧次的k帧图像重新进行编码并制作成动画,以作为所述第二图片。
7.根据权利要求1所述的方法,其特征在于,所述生成对抗网络模型的公式为:
Iresult=F(Imask,Iori)
所述生成对抗网络模型的目标函数为:
Loss=(Iresult-Itarget)2
其中,Iresult表示所述第二图片;F表示生成对抗网络;Imask表示所述第一图片;Iori表示目标区域的轮廓信息;Itarget表示目标图片。
8.一种图片处理装置,其特征在于,所述装置包括:
获取模块,用于获取第一图片;
识别模块,用于识别第一图片中的目标区域的轮廓信息,其中,所述目标区域为第一图片中的存在图像缺失的区域;
生成模块,用于将所述轮廓信息和第一图片输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对所述目标区域进行图像修复,以获得第二图片。
9.根据权利要求8所述的装置,其特征在于,所述第一图片包括n帧图像,其中,n>1;
所述获取模块,具体用于识别所述第一图片中每一帧图像中的目标区域的轮廓信息;
所述生成模块,具体用于将第一图片中每一帧图像及其目标区域的轮廓信息分别输入预先训练得到的生成对抗网络模型,由所述生成对抗网络模型对n帧图像中的j帧图像的目标区域进行图像修复,以获得第二图片,其中,所述生成对抗网络模型逐帧对所述j帧图像的目标区域进行图像修复,1≤j≤n。
10.根据权利要求9所述的装置,其特征在于,所述识别模块包括:
采集子模块,用于采集每一帧图像中的关键点坐标,生成关键点坐标集合;
筛选子模块,用于从所述关键点坐标集合中筛选出所述目标区域中的关键点坐标,以获得目标坐标集合;
填充子模块,用于对所述目标坐标集合中所有关键点所形成的区域进行填充,得到目标区域的轮廓形状信息,将所述目标坐标集合和所述目标区域的轮廓形状信息作为所述轮廓信息。
11.根据权利要求9所述的装置,其特征在于,所述生成模块包括:
检测子模块,用于检测第一图片中需要进行图像修复的帧次;
修复子模块,用于对第一图片中需要进行修复的帧次的图像进行修复,以输出修复后的j帧图像,以及输出所述第一图片中不需要进行修复的帧次的k帧图像,其中,所述j与所述k之和等于所述n。
12.根据权利要求11所述的装置,其特征在于,所述检测子模块包括:
计算单元,用于计算每一帧图像中指定两个关键点之间的距离;
确定单元,用于若所述距离大于预设值,则确定该帧次的图像需要进行修复。
13.根据权利要求11所述的装置,其特征在于,所述生成模块还包括:
生成子模块,按照所述第一图片中各帧次的播放顺序,将修复后的j帧图像和不需要进行修复的帧次的k帧图像重新进行编码并制作成动画,以作为所述第二图片。
14.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7中任一所述的方法步骤。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911071878.3A CN110910322B (zh) | 2019-11-05 | 2019-11-05 | 图片处理方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911071878.3A CN110910322B (zh) | 2019-11-05 | 2019-11-05 | 图片处理方法、装置、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110910322A true CN110910322A (zh) | 2020-03-24 |
CN110910322B CN110910322B (zh) | 2022-07-29 |
Family
ID=69814755
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911071878.3A Active CN110910322B (zh) | 2019-11-05 | 2019-11-05 | 图片处理方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110910322B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111476749A (zh) * | 2020-04-03 | 2020-07-31 | 陕西师范大学 | 基于人脸关键点引导式生成对抗网络的人脸修复方法 |
CN111768468A (zh) * | 2020-06-30 | 2020-10-13 | 北京百度网讯科技有限公司 | 图像填充方法、装置、设备及存储介质 |
CN113538644A (zh) * | 2021-07-19 | 2021-10-22 | 北京百度网讯科技有限公司 | 人物动态视频生成方法、装置、电子设备以及存储介质 |
CN113938603A (zh) * | 2021-09-09 | 2022-01-14 | 联想(北京)有限公司 | 一种图像处理方法、装置及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977932A (zh) * | 2017-12-28 | 2018-05-01 | 北京工业大学 | 一种基于可鉴别属性约束生成对抗网络的人脸图像超分辨率重建方法 |
CN108520503A (zh) * | 2018-04-13 | 2018-09-11 | 湘潭大学 | 一种基于自编码器和生成对抗网络修复人脸缺损图像的方法 |
-
2019
- 2019-11-05 CN CN201911071878.3A patent/CN110910322B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977932A (zh) * | 2017-12-28 | 2018-05-01 | 北京工业大学 | 一种基于可鉴别属性约束生成对抗网络的人脸图像超分辨率重建方法 |
CN108520503A (zh) * | 2018-04-13 | 2018-09-11 | 湘潭大学 | 一种基于自编码器和生成对抗网络修复人脸缺损图像的方法 |
Non-Patent Citations (4)
Title |
---|
JIAHUI YU等: "Free-Form Image Inpainting with Gated Convolution", 《ARXIV》 * |
SHUNXIN XU等: "Edge-Guided Generative Adversarial Network for Image Inpainting", 《IEEE》 * |
WEI XIONG等: "Foreground-aware Image Inpainting", 《ARXIV》 * |
曹志义等: "基于生成对抗网络的遮挡图像修复算法", 《北京邮电大学学报》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111476749A (zh) * | 2020-04-03 | 2020-07-31 | 陕西师范大学 | 基于人脸关键点引导式生成对抗网络的人脸修复方法 |
CN111476749B (zh) * | 2020-04-03 | 2023-02-28 | 陕西师范大学 | 基于人脸关键点引导式生成对抗网络的人脸修复方法 |
CN111768468A (zh) * | 2020-06-30 | 2020-10-13 | 北京百度网讯科技有限公司 | 图像填充方法、装置、设备及存储介质 |
CN111768468B (zh) * | 2020-06-30 | 2023-08-04 | 北京百度网讯科技有限公司 | 图像填充方法、装置、设备及存储介质 |
CN113538644A (zh) * | 2021-07-19 | 2021-10-22 | 北京百度网讯科技有限公司 | 人物动态视频生成方法、装置、电子设备以及存储介质 |
CN113538644B (zh) * | 2021-07-19 | 2023-08-29 | 北京百度网讯科技有限公司 | 人物动态视频生成方法、装置、电子设备以及存储介质 |
CN113938603A (zh) * | 2021-09-09 | 2022-01-14 | 联想(北京)有限公司 | 一种图像处理方法、装置及电子设备 |
CN113938603B (zh) * | 2021-09-09 | 2023-02-03 | 联想(北京)有限公司 | 一种图像处理方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110910322B (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110910322B (zh) | 图片处理方法、装置、电子设备及计算机可读存储介质 | |
CN107316020B (zh) | 人脸替换方法、装置及电子设备 | |
CN108764133B (zh) | 图像识别方法、装置及系统 | |
US20210082124A1 (en) | Foreground-aware image inpainting | |
JP5895703B2 (ja) | 画像処理装置及び画像処理方法、並びにコンピューター・プログラム | |
CN111325657A (zh) | 图像处理方法、装置、电子设备和计算机可读存储介质 | |
KR102559021B1 (ko) | 불량 이미지 생성 장치 및 방법 | |
CN110458791B (zh) | 质量缺陷检测方法和检测设备 | |
CN110136052B (zh) | 一种图像处理方法、装置和电子设备 | |
CN104735435A (zh) | 影像处理方法及电子装置 | |
CN107395594A (zh) | 一种拖拽验证码的自动识别方法 | |
US20230237777A1 (en) | Information processing apparatus, learning apparatus, image recognition apparatus, information processing method, learning method, image recognition method, and non-transitory-computer-readable storage medium | |
US10657703B2 (en) | Image processing apparatus and image processing method | |
CN112419132A (zh) | 视频水印检测方法、装置、电子设备及存储介质 | |
US10791321B2 (en) | Constructing a user's face model using particle filters | |
CN112270747A (zh) | 一种人脸识别方法、装置及电子设备 | |
CN110163851A (zh) | 图像上亮斑的识别方法、装置及计算机存储介质 | |
CN114298923A (zh) | 一种用于机器视觉测量系统的镜头评估及图像恢复方法 | |
CN111583159B (zh) | 一种图像补全方法、装置及电子设备 | |
JP2011048627A (ja) | マスク画像を抽出する方法及びプログラム並びにボクセルデータを構築する方法及びプログラム | |
CN116977195A (zh) | 复原模型的调整方法、装置、设备及存储介质 | |
WO2023206844A1 (zh) | 产品图像重构方法、产品重构模型训练方法、装置 | |
CN116228705A (zh) | 图像检测方法、装置、计算机设备和存储介质 | |
US20220157016A1 (en) | System and method for automatically reconstructing 3d model of an object using machine learning model | |
CN111860261B (zh) | 一种客流值的统计方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |