CN112488284A - 模型训练方法、人物图像补全方法、装置及电子设备 - Google Patents
模型训练方法、人物图像补全方法、装置及电子设备 Download PDFInfo
- Publication number
- CN112488284A CN112488284A CN201910860914.8A CN201910860914A CN112488284A CN 112488284 A CN112488284 A CN 112488284A CN 201910860914 A CN201910860914 A CN 201910860914A CN 112488284 A CN112488284 A CN 112488284A
- Authority
- CN
- China
- Prior art keywords
- image
- processed
- neural network
- preset
- edge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 93
- 238000012549 training Methods 0.000 title claims abstract description 89
- 238000013528 artificial neural network Methods 0.000 claims abstract description 112
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000007781 pre-processing Methods 0.000 claims abstract description 20
- 230000006870 function Effects 0.000 claims description 40
- 230000008569 process Effects 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 2
- 230000036544 posture Effects 0.000 abstract description 13
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 9
- 238000002372 labelling Methods 0.000 description 9
- 230000003042 antagnostic effect Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
本公开涉及图像处理技术领域,具体涉及一种模型训练方法、人物图像补全方法,模型训练装置、人物图像补全装置,介质及电子设备,所述模型训练方法包括:根据预设算法与预设随机模板和预设模型分别对人物样本图像预处理得到目标图片和具有像素损失区域的待处理图像;将预设随机模板和待处理图像输入生成神经网络生成补全人物图像和补全边缘图像;将补全人物图像、补全边缘图像和人物样本图像、目标图像输入判别神经网络生成判别结果;根据多张人物样本图像对应的判别结果对生成神经网络和判别神经网络进行多轮对抗训练。本公开实施例的技术方案能够根据不同人物的姿态补全对应的表面纹理,进而减小补全人物图像和人物样本图像之间的差距。
Description
技术领域
本公开涉及图像处理技术领域,具体而言,涉及一种模型训练方法、人物图像补全方法、模型训练装置、人物图像补全装置、计算机可读存储介质及电子设备。
背景技术
在对图像进行存储、转码和传输等处理的过程中,经常会发生图像出现像素损失区域的情况。为了保证图像的质量,开发者常常通过以下两种方式对图像进行补全:一是通过匹配和复制背景的区块来填补像素损失区域;二是通过对生成对抗网络的训练,使得其中的生成器可以生成与原缺失图像一致且完整的补全图像,以实现对原图像的补全。
然而,在遇到复杂的人物图像时,上述第一种方法会由于无法捕捉图像的高维特征,进而无法补全的问题;第二种方法虽然能够捕捉高维特征,但是难以补全不同人物的表面纹理,因此在对人物图像进行补全时,补全后的图像与缺失前的原图仍然有较大的差距。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种模型训练方法、人物图像补全方法、模型训练装置、人物图像补全装置、计算机可读存储介质及电子设备,进而至少在一定程度上克服对人物图像进行补全时,由于无法补全人物的表面纹理造成的补全后的图像与缺失前的原图差距较大的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供了一种模型训练方法,包括:
根据预设算法对人物样本图像进行预处理以得到目标图像,并根据预设随机模板和预设模型对人物样本图像进行预处理以得到具有像素损失区域的待处理图像;其中,所述待处理图像包括待处理人物图像和待处理密集坐标图像;
将所述预设随机模板和所述待处理图像输入生成神经网络,以生成补全人物图像和补全边缘图像;
将所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像输入判别神经网络,以生成判别结果;
根据多张所述人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练。
在本公开的一种示例性实施例中,基于前述方案,所述目标图像包括目标边缘图像;
所述根据预设算法对人物样本图像进行预处理以得到目标图像,包括:
根据预设算法提取所述人物样本图像中的边缘信息以得到目标边缘图像。
在本公开的一种示例性实施例中,基于前述方案,所述根据预设随机模板和预设模型对人物样本图像进行预处理以得到具有像素损失区域的待处理图像,包括:
根据预设随机模板对所述人物样本图像进行遮挡,得到具有像素损失区域的待处理人物图像;
根据预设模型对所述待处理人物图像进行姿态分析,以获取所述待处理密集坐标图像。
在本公开的一种示例性实施例中,基于前述方案,所述待处理图像还包括待处理边缘图像;
所述方法还包括:
根据所述预设算法在所述人物样本图像中提取边缘信息;
在所述边缘信息中提取被所述预设随机模板遮挡的边缘信息,以得到待处理边缘图像。
在本公开的一种示例性实施例中,基于前述方案,在所述边缘信息中提取被所述预设随机模板遮挡的边缘信息之后,所述方法还包括:
对被所述预设随机模板遮挡的边缘信息进行随机擦除。
在本公开的一种示例性实施例中,基于前述方案,在根据多张所述人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练之前,所述方法还包括:
基于所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像计算图像损失函数。
在本公开的一种示例性实施例中,基于前述方案,所述根据多张所述人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练,包括:
交替进行以下两个训练过程:
根据多张所述人物样本图像对应的所述图像损失函数和所述判别结果对所述生成神经网络进行训练;
根据多张所述人物样本图像对应的所述判别结果对所述判别神经网络进行训练。
在本公开的一种示例性实施例中,基于前述方案,所述图像损失函数包括重构损失函数、内容损失函数以及风格损失函数中至少一种或者多种的组合。
根据本公开的第二方面,提供了一种人物图像补全方法,包括:
获取具有像素损失区域的待处理人物图像,并根据预设模型对所述待处理人物图像进行姿态分析,以获取待处理密集坐标图像;
将预设标记信息、所述待处理人物图像和所述待处理密集坐标图像输入训练后的生成神经网络,以生成补全人物图像;
其中,所述预设标记信息包括对所述待处理人物图像上的具有像素损失的区域做的区域标记信息;所述训练后的生成神经网络是根据第一方面所述的模型训练方法训练后得到的。
在本公开的一种示例性实施例中,基于前述方案,所述预设标记信息包括对所述待处理人物图像中具有像素损失的区域做的边缘标记信息。
根据本公开的第三方面,提供了一种模型训练装置,包括:
第一处理模块,用于根据预设算法对人物样本图像进行预处理以得到目标图像,并根据预设随机模板和预设模型对人物样本图像进行预处理以得到具有像素损失区域的待处理图像;其中,所述待处理图像包括待处理人物图像和待处理密集坐标图像;
图像生成模块,用于将所述预设随机模板和所述待处理图像输入生成神经网络,以生成补全人物图像和补全边缘图像;
结果判别模块,用于将所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像输入判别神经网络,以生成判别结果;
模型训练模块,用于根据多张所述人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练。
根据本公开的第四方面,提供了一种人物图像补全装置,包括:
图像处理模块,用于获取具有像素损失区域的待处理人物图像,并根据预设模型对所述待处理人物图像进行姿态分析,以获取待处理密集坐标图像;
图像补全模块,用于将预设标记信息、所述待处理人物图像和所述待处理密集坐标图像输入训练后的生成神经网络,以生成补全人物图像;
其中,所述预设标记信息包括对所述待处理人物图像上的具有像素损失的区域做的区域标记信息;所述训练后的生成神经网络是根据第一方面所述的模型训练方法训练后得到的。
根据本公开的第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的模型训练方法或上述实施例中第二方面所述的人物图像补全方法。
根据本公开实施例的第六方面,提供了一种电子设备,包括:
处理器;以及
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的模型训练方法或上述实施例中第二方面所述的人物图像补全方法。
本公开实施例提供的技术方案可以包括以下有益效果:
本公开的一种实施例所提供的技术方案中,根据预设算法对人物样本图像进行预处理得到目标图像,并根据预设随机模板和预设模型对人物样本图像进行预处理以得到具有像素损失区域的待处理图像后,将预设随机模板、待处理人物图像和待处理密集坐标图像输入生成神经网络,以生成补全人物图像和补全边缘图像;随后判别神经网络根据人物样本图像、目标图像对生成的补全人物图像和补全边缘图像进行判别得到判别结果,最后根据多张人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练。由于在对生成神经网络和判别神经网络进行训练时引入了待处理密集坐标图像,生成神经网络是根据预设随机模板、待处理人物图像和待处理密集坐标图像生成补全图片的,因此能够根据不同人物的姿态补全对应的表面纹理,进而减小补全人物图像和人物样本图像之间的差距。
采用上述模型训练方法得到的生成神经网络补全具有缺失像素区域的待处理人物图像时,能够根据待处理密集坐标图像确定不同的人物姿态,因此能够根据不同的人物姿态补全待处理人物图像的表面纹理,减小了补全人物图像和缺失前的原图的差距,提升了人物图像的补全效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出本公开示例性实施例中一种模型训练方法的流程图;
图2示意性示出本公开示例性实施例中根据预设随机模板和预设模型对人物样本图像进行预处理以得到具有像素损失区域的待处理图像的方法的流程图;
图3示意性示出本公开示例性实施例中获取待处理边缘图像的方法的流程图;
图4示意性示出本公开示例性实施例中根据多张所述人物样本图像对应的判别结果对生成神经网络和判别神经网络进行多轮对抗训练的方法的流程图;
图5示意性示出本公开示例性实施例中一种人物图像补全方法的流程图;
图6示意性示出本公开示例性实施例中一种包括生成神经网络和判别神经网络的对抗神经网络的示意图;
图7示出本公开示例性实施例中一张具体的人物样本图像;
图8示出本公开示例性实施例中提取人物样本图像的边缘信息得到的目标边缘图像;
图9示出本公开示例性实施例中分析人物样本图像的人物姿态得到的密集坐标图像;
图10示意性示出本公开示例性实施例中在待处理人物图像中具有像素损失的区域做的区域标记信息的示意图;
图11示意性示出本公开示例性实施例中在待处理人物图像中具有像素损失的区域做的边缘标记信息的示意图;
图12示出本公开示例性实施例中根据区域标记信息和边缘标记信息生成的补全人物图像;
图13示意性示出本公开示例性实施例中在待处理人物图像的另一种具有像素损失的区域做的区域标记信息和边缘标记信息的示意图;
图14示出本公开示例性实施例中根据另一种区域标记信息和边缘标记信息生成的补全人物图像;
图15示意性示出本公开示例性实施例中一种模型训练装置的组成示意图;
图16示意性示出本公开示例性实施例中一种人物图像补全装置的组成示意图;
图17示意性示出了适于用来实现本公开示例性实施例的电子设备的计算机系统的结构示意图;
图18示意性示出了根据本公开的一些实施例的计算机可读存储介质的示意图。
具体实施方式
现在将参照附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本公开示例性实施方式的模型训练方法和/或人物图像补全方法可以由一服务器实现,也就是说,服务器可以执行下述的模型训练方法和/或人物图像补全方法的各个步骤。在这种情况下,模型训练方法和/或人物图像补全方法对应的装置、模块可以被配置为在该服务器中。另外,模型训练方法可以在一服务器上实现,人物图像补全方法可以在另一服务器上实现,也就是说,模型训练和模型应用(人物图像补全)可以是两个不同的服务器。然而,容易理解的是,模型训练和模型应用可以基于同一服务器来实现,本示例性实施方式中对此不做特殊限定。
此外,应当理解的是,终端设备(例如,手机、平板等)也可以实现下述方法的各个步骤,对应的装置、模块可以配置在终端设备中,在这种情况下,例如,可以通过终端设备来对具有像素损失区域的人物图像进行补全处理。
图1示意性示出本公开示例性实施例中一种模型训练方法的流程图。其中,所述模型是指包括生成神经网络和判别神经网络的对抗神经网络,具体地,可以是如图6所示的对抗神经网络,但也可以是其它对抗神经网络,本公开对此不做特殊限定。
参照图1所示,所述模型训练方法可以包括以下步骤:
在步骤S110中,根据预设算法对人物样本图像进行预处理以得到目标图像,并根据预设随机模板和预设模型对人物样本图像进行预处理以得到具有像素损失区域的待处理图像。
在本公开的一种示例实施例中,所述目标图像包括目标边缘图像,所述根据预设算法对人物样本图像进行预处理以得到目标图像,包括:根据预设算法提取所述人物样本图像中的边缘信息以得到目标边缘图像。其中,所述预设算法可以是canny算法、Sobel算法,Laplacian算法、Marr-Hildreth算法等可以用于提取图像的边缘的算法。通过上述算法能够将人物样本中的边缘信息提取出来,以得到目标边缘图像。例如,提取图7所示的人物图像的边缘信息可以得到如图8所示的目标边缘图像。
在本公开的一种示例实施例中,所述待处理图像包括待处理人物图像和待处理密集坐标图像,所述根据预设随机模板和预设模型对人物样本图像进行预处理以得到具有像素损失区域的待处理图像,参照图2所示,包括如下步骤S210至S220:
步骤S210,根据预设随机模板对所述人物样本图像进行遮挡,得到具有像素损失区域的待处理人物图像。
在本公开的一种示例实施例中,根据预设随机模板对人物样本图像进行遮挡,以模拟图像存储、转码和传输过程造成的图像出现像素损失区域的情况。其中,所述预设随机模板可以是根据用户设置的随机算法自动生成的,也可以是系统随机生成的,具有高度随机性的预设随机模板。通过设置预设随机模板对人物样本图像进行遮挡,能够模拟图像存储、转码和传输过程造成的出现不确定性的像素损失区域的情况,以增加训练样本的随机性提升训练效果。
步骤S220,根据预设模型对所述待处理人物图像进行姿态分析,以获取所述待处理密集坐标图像。
在本公开的一种示例实施例中,所述预设模型可以是DensePose模型、OpenPose模型、AlphaPose模型等可以用于分析人体姿态的模型。通过预设模型能够对人物图像进行处理,以提取人物图像对应的人物姿态得到待处理密集坐标图像。例如,分析图7所示的人物图像可以得到如图9所示的密集坐标图像。
在本公开的一种示例实施例中,在所述待处理图像还包括待处理边缘图像时,参照图3所示,所述方法还包括如下步骤S310至S320:
步骤S310,根据预设算法在所述人物样本图像中提取边缘信息;
步骤S320,在所述边缘信息中提取被所述预设随机模板遮挡的边缘信息,以得到待处理边缘图像。
在本公开的一种示例实施例中,为了使生成神经网络也可以基于边缘信息将待处理人物图像中的像素损失区域补全,在对模型进行训练时,可以将待处理人物图像对应的像素损失区域的边缘信息作为输入。为了得到待处理人物图像对应的像素损失区域的边缘信息,可以根据步骤S110提出的预设算法提取人物样本图像的边缘信息,随后在提取出的边缘信息中进一步根据预设随机模板提取被遮挡区域的边缘信息,得到被预设随机模板遮挡区域的边缘信息,进而得到待处理边缘图像。
进一步地,为了模拟实际对人物图像进行补全时不一定能够得到完整的人物图像对应的像素损失区域的边缘信息,因此在所述边缘信息中提取被所述预设随机模板遮挡的边缘信息之后,还可以对被所述预设随机模板遮挡的边缘信息进行随机擦除,进而得到待处理边缘图像。
步骤S120,将所述预设随机模板和所述待处理图像输入生成神经网络,以生成补全人物图像和补全边缘图像。
在本公开的一种示例实施例中,将预设随机模板和待处理图像输入生成神经网络后,生成神经网络可以根据预设随机模板确定待处理图像中具有像素损失的区域,进而基于待处理密集坐标图像对待处理人物图像中具有像素损失的区域进行补全,生成补全人物图像和补全边缘图像。由于生成神经网络的输入包括待处理密集坐标图像,生成神经网络在生成补全人物图像时,会考虑通过待处理密集坐标图像表现的人物姿态,因此,生成神经网络生成补全人物图像时会根据人物姿态补全人物的表面纹理,达到更好的补全效果。
在本公开的一种示例实施例中,对应于所述待处理图像还包括待处理边缘图像时,将预设随机模板和待处理图像输入生成神经网络后,生成神经网络可以根据随机模板确定待处理图像中具有像素损失的区域,进而基于待处理密集坐标图像和待处理边缘图像对对待处理人物图像中具有像素损失的区域进行补全,生成补全人物图像和补全边缘图像。通过将待处理边缘图像作为生成神经网络的输入,使得生成神经网络可以基于待处理边缘图像的指导生成补全人物图像和补全边缘图像,形成与待处理边缘图像对应的补全人物图像和补全边缘图像。
步骤S130,将所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像输入判别神经网络,以生成判别结果。
在本公开的一种示例实施例中,将生成神经网络生成的补全人物图像和补全边缘图像以及人物样本图像和目标图像输入判别神经网络,以使判别神经网络分别对补全人物图像和人物样本图像以及补全边缘图像和目标图像进行判别,得到判别结果。通过添加对补全边缘图像和目标图像进行判别的过程,能够根据对补全边缘图像和目标图像的判别结果对生成神经网络和判别神经网络进行训练,进而使得生成神经网络能够生成与目标边缘图像一致的补全边缘图像。
步骤S140,根据多张所述人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练。
在本公开的一种示例实施例中,在根据多张所述人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练之前,所述方法还包括:基于所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像计算图像损失函数。其中,所述图像损失函数是指补全人物图像和人物样本图像,以及补全边缘图像和目标图像中的目标边缘图像之间的图像损失函数。
在本公开的一种示例实施例中,所述图像损失函数包括重构损失函数、内容损失函数以及风格损失函数中至少一种或者多种的组合。其中,所述重构损失函数可以用于表示补全人物图像、补全边缘图像与人物样本图像、目标图像之间的差异;所述内容损失函数可以用于表示补全人物图像、补全边缘图像与人物样本图像、目标图像之间在内容上的差异;所述风格损失函数可以用于表示补全人物图像、补全边缘图像与人物样本图像、目标图像之间在风格上的差异。
举例而言,若用P表示人物样本图像或目标图像,P′对应地表示补全人物图像和补全边缘图像,所述重构损失函数可以根据如下公式进行计算:
LR(P,P′)=‖P-P′‖1 (1);
所述内容损失函数可以根据如下公式进行计算:
其中,Gi(x)是指每个特征层的格拉姆矩阵,w,h分别指某一特征层的水平和垂直方向尺度,指提取的不同尺度的特征,c,c′为某一特征层上的具体位置坐标,i是不同特征层的编号,n指提取特征的层数。需要说明的是,所述重构损失函数、内容损失函数和风格损失函数还可以根据其它计算公式进行计算,本公开对此不做特殊限制。
在本公开的一种示例实施例中,在基于所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像计算得到图像损失函数基础上,对生成神经网络和判别神经网络进行多轮对抗训练时,参照图4所示,可以交替进行两个训练程,具体的训练过程包括如下步骤S410至S420:
步骤S410,根据多张所述人物样本图像对应的所述图像损失函数和所述判别结果对所述生成神经网络进行训练。
步骤S420,根据多张所述人物样本图像对应的所述判别结果对所述判别神经网络进行训练。
在本公开的一种示例实施例中,在进行多轮对抗训练时可以交替的对生成神经网络和判别神经网络进行训练。需要说明的是,对生成神经网络进行训练时的依据是多张所述人物样本图像对应的图像损失函数和判别结果;而对判别神经网络进行训练时的依据是多张所述人物样本图像对应的判别结果。在现有的根据判别神经网络的判别结果对生成神经网络进行训练的基础上,添加基于所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像计算得到图像损失函数对生成神经网络进行训练,能够对生成神经网络生成的补全人物图像和补全边缘图像进行约束,提升生成神经网络的补全效果。
此外,在本公开的示例性实施方式中还提供了一种人物图像补全方法,参照图5所示,所述人物图像补全方法包括如下步骤S510至S520:
步骤S510,获取具有像素损失区域的待处理人物图像,并根据预设模型对所述待处理人物图像进行姿态分析,以获取待处理密集坐标图像。
在本公开的一种示例实施例中,当需要对具有像素损失区域的待处理人物图像进行补全时,首先需要根据预设模型对待处理人物图像进行姿态分析,以获取待处理密集坐标图像。
步骤S520,将预设标记信息、所述待处理人物图像和所述待处理密集坐标图像输入训练后的生成神经网络,以生成补全人物图像。
在本公开的一种示例实施例中,步骤S520中的生成神经网络是指通过上述模型训练方法训练得到的生成神经网络。在生成神经网络对待处理人物图像进行补全时,需要将预设标记信息、待处理人物图像和所述待处理密集坐标图像输入训练后的生成神经网络。其中,所述预设标记信息可以包括对所述待处理人物图像上的具有像素损失的区域做的区域标记信息,相当于在模型训练过程时向生成神经网络输入的预设随机模板。例如,在图7中所示的人物图像中进行标记,以确定人物图像中具有像素损失的区域,如图10所示。
在本公开的一种示例实施例中,所述预设标记信息还可以包括对所述待处理人物图像中具有像素损失的区域做的边缘标记信息,相当于在模型训练过程时向生成神经网络输入的待处理边缘图像。例如,在图10标记的具有像素损失的区域的基础上,边缘标记信息如图11所示,则可以输出如图12所示的补全人物图像;再如,区域标记信息和边缘标记信息如图13所示,则可以输出如图14所示的补全人物图像。通过向生成神经网络输入待处理人物图像上的边缘标记信息,使得生成神经网络可以根据边缘标记信息生成对应的补全人物图像。由于在用户输入的边缘标记信息不同时,生成的对应的补全人物图像也不同,因此用户可以根据输入不同的边缘标记信息改变生成的补全人物图像,实现了允许用户根据边缘标记信息恢复或者修改补全人物图像的功能。
需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
此外,在本公开的示例性实施方式中,还提供了一种模型训练装置。参照图15所示,所述模型训练装置1500包括:第一处理模块1510,图像生成模块1520,结果判别模块1530和模型训练模块1540。
其中,所述第一处理模块1510可以根据预设算法对人物样本图像进行预处理以得到目标图像,并根据预设随机模板和预设模型对人物样本图像进行预处理以得到具有像素损失区域的待处理图像;其中,所述待处理图像包括待处理人物图像和待处理密集坐标图像;
所述图像生成模块1520可以用于将所述预设随机模板和所述待处理图像输入生成神经网络,以生成补全人物图像和补全边缘图像;
所述结果判别模块1530可以用于将所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像输入判别神经网络,以生成判别结果;
所述模型训练模块1540可以用于根据多张所述人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练。
在本公开的一种示例性实施例中,基于前述方案,所述第一处理模块1510可以用于根据预设算法提取所述人物样本图像中的边缘信息以得到目标边缘图像。
在本公开的一种示例性实施例中,基于前述方案,所述第一处理模块1510可以用于根据预设随机模板对所述人物样本图像进行遮挡,得到具有像素损失区域的待处理人物图像;根据预设模型对所述待处理人物图像进行姿态分析,以获取所述待处理密集坐标图像。
在本公开的一种示例性实施例中,基于前述方案,所述第一处理模块1510可以用于根据所述预设算法在所述人物样本图像中提取边缘信息;在所述边缘信息中提取被所述预设随机模板遮挡的边缘信息,以得到待处理边缘图像。
在本公开的一种示例性实施例中,基于前述方案,所述第一处理模块1510可以用于对被所述预设随机模板遮挡的边缘信息进行随机擦除。
在本公开的一种示例性实施例中,基于前述方案,模型训练装置1500还包括损失计算模块1550,可以用于基于所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像计算图像损失函数。
在本公开的一种示例性实施例中,基于前述方案,所述图像损失函数包括重构损失函数、内容损失函数以及风格损失函数中至少一种或者多种的组合。
在本公开的一种示例性实施例中,基于前述方案,所述模型训练模块1540可以用于根据多张所述人物样本图像对应的所述图像损失函数和所述判别结果对所述生成神经网络进行训练;根据多张所述人物样本图像对应的所述判别结果对所述判别神经网络进行训练。
此外,在本公开的示例性实施方式中,还提供了一种人物图像补全装置,参照图16所示,所述人物图像补全装置1600包括:图像处理模块1610和图像补全模块1620。
其中,所述图像处理模块1610可以用于获取具有像素损失区域的待处理人物图像,并根据预设模型对所述待处理人物图像进行姿态分析,以获取待处理密集坐标图像;
所述图像补全模块1620可以用于将预设标记信息、所述待处理人物图像和所述待处理密集坐标图像输入训练后的生成神经网络,以生成补全人物图像;其中,所述预设标记信息包括对所述待处理人物图像上的具有像素损失的区域做的区域标记信息;所述训练后的生成神经网络是根据所述模型训练方法训练后得到的。
在本公开的一种示例性实施例中,基于前述方案,所述预设标记信息包括对所述待处理人物图像中具有像素损失的区域做的边缘标记信息。
由于本公开的示例实施例的模型训练装置和人物图像补全装置的各个功能模块与上述模型训练方法和人物图像补全方法的示例实施例的步骤对应,因此对于本公开装置实施例中未披露的细节,请参照本公开上述的模型训练方法和人物图像补全方法的实施例。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,在本公开的示例性实施例中,还提供了一种能够实现上述模型训练方法和人物图像补全方法的电子设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“系统”。
下面参照图17来描述根据本公开的这种实施例的电子设备1700。图17显示的电子设备1700仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图17所示,电子设备1700以通用计算设备的形式表现。电子设备1700的组件可以包括但不限于:上述至少一个处理单元1710、上述至少一个存储单元1720、连接不同系统组件(包括存储单元1720和处理单元1710)的总线1730、显示单元1740。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1710执行,使得所述处理单元1710执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。例如,所述处理单元1710可以执行如图1中所示的步骤S110:根据预设算法对人物样本图像进行预处理以得到目标图像,并根据预设随机模板和预设模型对人物样本图像进行预处理以得到具有像素损失区域的待处理图像;其中,所述待处理图像包括待处理人物图像和待处理密集坐标图像;S120:将所述预设随机模板和所述待处理图像输入生成神经网络,以生成补全人物图像和补全边缘图像;S130:将所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像输入判别神经网络,以生成判别结果;S140:根据多张所述人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练。
又如,所述的电子设备可以实现如图2至图5所示的各个步骤。
存储单元1720可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)1721和/或高速缓存存储单元1722,还可以进一步包括只读存储单元(ROM)1723。
存储单元1720还可以包括具有一组(至少一个)程序模块1725的程序/实用工具1724,这样的程序模块1725包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1730可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1700也可以与一个或多个外部设备1770(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1700交互的设备通信,和/或与使得该电子设备1700能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1750进行。并且,电子设备1700还可以通过网络适配器1760与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1760通过总线1730与电子设备1700的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。
参照图18,描述了根据本公开的实施例的用于实现上述方法的程序产品1800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
Claims (14)
1.一种模型训练方法,其特征在于,包括:
根据预设算法对人物样本图像进行预处理以得到目标图像,并根据预设随机模板和预设模型对人物样本图像进行预处理以得到具有像素损失区域的待处理图像;其中,所述待处理图像包括待处理人物图像和待处理密集坐标图像;
将所述预设随机模板和所述待处理图像输入生成神经网络,以生成补全人物图像和补全边缘图像;
将所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像输入判别神经网络,以生成判别结果;
根据多张所述人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练。
2.根据权利要求1所述的方法,其特征在于,所述目标图像包括目标边缘图像;
所述根据预设算法对人物样本图像进行预处理以得到目标图像,包括:
根据预设算法提取所述人物样本图像中的边缘信息以得到目标边缘图像。
3.根据权利要求1所述的方法,其特征在于,所述根据预设随机模板和预设模型对人物样本图像进行预处理以得到具有像素损失区域的待处理图像,包括:
根据预设随机模板对所述人物样本图像进行遮挡,得到具有像素损失区域的待处理人物图像;
根据预设模型对所述待处理人物图像进行姿态分析,以获取所述待处理密集坐标图像。
4.根据权利要求1所述的方法,其特征在于,所述待处理图像还包括待处理边缘图像;
所述方法还包括:
根据所述预设算法在所述人物样本图像中提取边缘信息;
在所述边缘信息中提取被所述预设随机模板遮挡的边缘信息,以得到待处理边缘图像。
5.根据权利要求4所述的方法,其特征在于,在所述边缘信息中提取被所述预设随机模板遮挡的边缘信息之后,所述方法还包括:
对被所述预设随机模板遮挡的边缘信息进行随机擦除。
6.根据权利要求1所述的方法,其特征在于,在根据多张所述人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练之前,所述方法还包括:
基于所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像计算图像损失函数。
7.根据权利要求6所述的方法,其特征在于,所述根据多张所述人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练,包括:
交替进行以下两个训练过程:
根据多张所述人物样本图像对应的所述图像损失函数和所述判别结果对所述生成神经网络进行训练;
根据多张所述人物样本图像对应的所述判别结果对所述判别神经网络进行训练。
8.根据权利要求6所述的方法,其特征在于,所述图像损失函数包括重构损失函数、内容损失函数以及风格损失函数中至少一种或者多种的组合。
9.一种人物图像补全方法,其特征在于,包括:
获取具有像素损失区域的待处理人物图像,并根据预设模型对所述待处理人物图像进行姿态分析,以获取待处理密集坐标图像;
将预设标记信息、所述待处理人物图像和所述待处理密集坐标图像输入训练后的生成神经网络,以生成补全人物图像;
其中,所述预设标记信息包括对所述待处理人物图像上的具有像素损失的区域做的区域标记信息;所述训练后的生成神经网络是根据权利要求1至8中任一项所述的模型训练方法训练后得到的。
10.根据权利要求9所述的方法,其特征在于,所述预设标记信息包括对所述待处理人物图像中具有像素损失的区域做的边缘标记信息。
11.一种模型训练装置,其特征在于,包括:
第一处理模块,用于根据预设算法对人物样本图像进行预处理以得到目标图像,并根据预设随机模板和预设模型对人物样本图像进行预处理以得到具有像素损失区域的待处理图像;其中,所述待处理图像包括待处理人物图像和待处理密集坐标图像;
图像生成模块,用于将所述预设随机模板和所述待处理图像输入生成神经网络,以生成补全人物图像和补全边缘图像;
结果判别模块,用于将所述补全人物图像、所述补全边缘图像和所述人物样本图像、所述目标图像输入判别神经网络,以生成判别结果;
模型训练模块,用于根据多张所述人物样本图像对应的判别结果对所述生成神经网络和所述判别神经网络进行多轮对抗训练。
12.一种人物图像补全装置,其特征在于,包括:
图像处理模块,用于获取具有像素损失区域的待处理人物图像,并根据预设模型对所述待处理人物图像进行姿态分析,以获取待处理密集坐标图像;
图像补全模块,用于将预设标记信息、所述待处理人物图像和所述待处理密集坐标图像输入训练后的生成神经网络,以生成补全人物图像;
其中,所述预设标记信息包括对所述待处理人物图像上的具有像素损失的区域做的区域标记信息;所述训练后的生成神经网络是根据权利要求1至8中任一项所述的模型训练方法训练后得到的。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至8中任一项所述的模型训练方法或权利要求9至10中任意一项所述的人物图像补全方法。
14.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至8中任一项所述的模型训练方法或权利要求9至10中任意一项所述的人物图像补全方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910860914.8A CN112488284A (zh) | 2019-09-11 | 2019-09-11 | 模型训练方法、人物图像补全方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910860914.8A CN112488284A (zh) | 2019-09-11 | 2019-09-11 | 模型训练方法、人物图像补全方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112488284A true CN112488284A (zh) | 2021-03-12 |
Family
ID=74920681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910860914.8A Pending CN112488284A (zh) | 2019-09-11 | 2019-09-11 | 模型训练方法、人物图像补全方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112488284A (zh) |
-
2019
- 2019-09-11 CN CN201910860914.8A patent/CN112488284A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3923248A1 (en) | Image processing method and apparatus, electronic device and computer-readable storage medium | |
US20210082124A1 (en) | Foreground-aware image inpainting | |
CN109712234B (zh) | 三维人体模型的生成方法、装置、设备和存储介质 | |
KR101379074B1 (ko) | 인간 기계 인터페이스를 위한 장치 시스템 및 방법 | |
CN110189336B (zh) | 图像生成方法、系统、服务器及存储介质 | |
CN110490959B (zh) | 三维图像处理方法及装置、虚拟形象生成方法以及电子设备 | |
JP2021108215A (ja) | 画像の認識方法、装置、電子デバイス、コンピュータ記憶媒体、及びプログラム | |
CN110910322B (zh) | 图片处理方法、装置、电子设备及计算机可读存储介质 | |
CN112766027A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN112562056A (zh) | 虚拟演播室中虚拟灯光的控制方法、装置、介质与设备 | |
JPWO2019167556A1 (ja) | ラベル収集装置、ラベル収集方法及びラベル収集プログラム | |
JP2023543964A (ja) | 画像処理方法、画像処理装置、電子機器、記憶媒体およびコンピュータプログラム | |
CN111815748B (zh) | 一种动画处理方法、装置、存储介质及电子设备 | |
CN112714337A (zh) | 视频处理方法、装置、电子设备和存储介质 | |
CN114627438A (zh) | 目标检测模型生成方法、目标检测方法、设备及介质 | |
CN115272575B (zh) | 图像生成方法及装置、存储介质和电子设备 | |
CN111310912A (zh) | 机器学习系统、域变换装置、及机器学习方法 | |
CN114092608B (zh) | 表情的处理方法及装置、计算机可读存储介质、电子设备 | |
CN112488284A (zh) | 模型训练方法、人物图像补全方法、装置及电子设备 | |
CN116012913A (zh) | 模型训练方法、人脸关键点检测方法、介质及装置 | |
CN112862840B (zh) | 图像分割方法、装置、设备及介质 | |
JP2023020402A (ja) | 電子小黒板生成装置及び電子小黒板生成方法 | |
CN114972500A (zh) | 查验方法、标注方法、系统、装置、终端、设备及介质 | |
CN113343951A (zh) | 人脸识别对抗样本生成方法及相关设备 | |
CN111985510B (zh) | 生成模型训练方法、图像生成方法及装置、介质、终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |