WO2021052375A1 - 目标图像生成方法、装置、服务器及存储介质 - Google Patents

目标图像生成方法、装置、服务器及存储介质 Download PDF

Info

Publication number
WO2021052375A1
WO2021052375A1 PCT/CN2020/115678 CN2020115678W WO2021052375A1 WO 2021052375 A1 WO2021052375 A1 WO 2021052375A1 CN 2020115678 W CN2020115678 W CN 2020115678W WO 2021052375 A1 WO2021052375 A1 WO 2021052375A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
posture
sample
transformation parameter
human body
Prior art date
Application number
PCT/CN2020/115678
Other languages
English (en)
French (fr)
Inventor
卢丽莹
刘枢
贾佳亚
Original Assignee
腾讯科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 腾讯科技(深圳)有限公司 filed Critical 腾讯科技(深圳)有限公司
Publication of WO2021052375A1 publication Critical patent/WO2021052375A1/zh
Priority to US17/534,370 priority Critical patent/US20220084163A1/en

Links

Images

Classifications

    • G06T3/18
    • G06T3/04
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • G06T7/344Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T3/14
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Abstract

本申请提供了一种目标图像生成方法、人体姿态变换方法、装置、服务器及存储介质,属于图像处理技术领域。在本申请实施例提供的方案,通过第一图像生成模型确定第一变换参数,基于该第一变换参数对第一解析图像进行调整,使得该第一解析图像和生成的目标解析图像之间姿态对齐。通过第二图像生成模型,根据第一图像生成模型得到的目标解析图像,来确定第二变换参数,基于该第二变换参数对组合后的待处理图像和第一解析图像进行调整,使得待处理图像和生成的目标图像之间像素对齐,具有更好的图像细节。由于变换前后解析图像保持姿态对齐,可以使变换前后的图像保持空间对齐,从而使得生成的目标图像既保证了空间对齐又保证了细节清晰。

Description

目标图像生成方法、装置、服务器及存储介质
本申请要求于2019年9月17日提交的申请号为201910875771.8、发明名称为“目标图像生成方法、装置、服务器及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及图像处理技术领域,特别涉及一种目标图像生成方法、人体姿态变换方法、装置、服务器及存储介质。
背景技术
在图像处理技术领域中,人体姿态迁移技术是一个非常热门的话题。人体姿态迁移简单来说,就是给定一幅含有人物的图片和一个目标姿态,将图片内人物转换成目标姿态的样子。当然,人体姿态迁移不仅可以改变图片中人物的姿态,还可以改变视频中人物的姿态。例如,给定一段专业舞者的视频作为目标视频和一段业余舞者的视频,通过人体姿态迁移可以使业余舞者的动作和专业舞者的动作一样。
相关技术中,在对图像中人物进行姿态迁移时,可以将包含人物的图像和目标姿态图像直接输入到GAN(Generative Adversarial Networks,生成式对抗网络,一种深度学习模型)网络中,由该GAN网络输出姿态迁移后的图像。然而,当转换前后人体姿态的变化幅度较大、部分图像的背景较为复杂,在使用上述GAN网络对人物进行大幅度的姿态迁移时,会出现迁移前后空间不对齐,且生成的图像的纹理信息缺少高频部分,导致图像细节不清晰等问题。
发明内容
本申请实施例提供了一种目标图像生成方法、人体姿态变换方法、装置、服务器及存储介质,用于提高生成图像的质量。所述技术方案如下:
一方面,提供了一种目标图像生成方法,包括:
基于待处理图像,获取第一解析图像和第一姿态图像,所述第一解析图像为标注有所述待处理图像中对象的各部位的图像,所述第一姿态图像用于表示所述对象在所述待处理图像中的姿态;
将所述第一解析图像、所述第一姿态图像和用于表示目标姿态的第二姿态图像输入第一图像生成模型,由所述第一图像生成模型确定第一变换参数,基于所述第一变换参数对所述第一解析图像进行调整,得到目标解析图像,所述目标解析图像中所述对象的姿态为所述目标姿态,所述第一变换参数为所述第一姿态图像变换到所述第二姿态图像的变换参数;
组合所述待处理图像和所述第一解析图像,得到第一组合图像;组合所述第二姿态图像和所述目标解析图像,得到第二组合图像;
将所述第一组合图像和所述第二组合图像输入第二图像生成模型,由所述第二图像生成模型确定第二变换参数,基于所述第二变换参数和所述第二组合图像对所述第一组合图像进 行调整,得到目标图像,所述目标图像中对象的姿态为所述目标姿态,所述第二变换参数为所述第一解析图像变换到所述目标解析图像的变换参数。
另一方面,提供了一种人体姿态变换方法,所述方法包括:
基于第一人体图像,获取第二解析图像和第三姿态图像,所述第二解析图像为标注有所述第一人体图像中人体的各部位的图像,所述第三姿态图像用于表示所述人体在所述第一人体图像中的姿态;
确定第三变换参数,基于所述第三变换参数对所述第二解析图像进行调整,得到第三解析图像,所述第三解析图像中所述人体的姿态为所述目标人体姿态,所述第三变换参数为所述第三姿态图像变换到用于表示目标人体姿态的第四姿态图像的变换参数;
组合所述第一人体图像和所述第二解析图像,得到第三组合图像;组合所述第四姿态图像和所述第三解析图像,得到第四组合图像;
确定第四变换参数,基于所述第四变换参数和所述第四组合图像对所述第三组合图像进行调整,得到第二人体图像,所述第二人体图像中的人体的姿态为所述目标人体姿态,所述第四变换参数为所述第二解析图像变换到所述第三解析图像的变换参数。
另一方面,提供了一种目标图像生成装置,包括:
第一图像获取模块,用于基于待处理图像,获取第一解析图像和第一姿态图像,所述第一解析图像为标注有所述待处理图像中对象的各部位的图像,所述第一姿态图像用于表示所述对象在所述待处理图像中的姿态;
第一图像变换模块,用于将所述第一解析图像、所述第一姿态图像和用于表示目标姿态的第二姿态图像输入第一图像生成模型,由所述第一图像生成模型确定第一变换参数,基于所述第一变换参数对所述第一解析图像进行调整,得到目标解析图像,所述目标解析图像中所述对象的姿态为所述目标姿态,所述第一变换参数为所述第一姿态图像变换到所述第二姿态图像的变换参数;
第一图像组合模块,用于组合所述待处理图像和所述第一解析图像,得到的第一组合图像;组合所述第二姿态图像和所述目标解析图像,得到的第二组合图像;
所述第一图像变换模块,还用于将所述第一组合图像和所述第二组合图像输入第二图像生成模型,由所述第二图像生成模型确定第二变换参数,基于所述第二变换参数和所述第二组合图像对所述第一组合图像进行调整,得到目标图像,所述目标图像中对象的姿态为所述目标姿态,所述第二变换参数为所述第一解析图像变换到所述目标解析图像的变换参数。
在另一种可选的实现方式中,所述第一图像变换模块,用于将所述第一解析图像和所述目标解析图像输入第二卷积神经网络,确定所述第二变换参数;由所述第二图像生成模型对所述第一组合图像进行编码,得到第五编码图像,对所述第二组合图像进行编码,得到第六编码图像;基于所述第二变换参数,将所述第五编码图像变换为第七编码图像;对所述第六编码图像和所述第七编码图像进行残差处理,得到第八编码图像;对所述第八编码图像进行解码。
在另一种可选的实现方式中,所述第一图像变换模块,用于基于所述第二变换参数,生成第二网格图,所述第二网格图中顶点的坐标用于指示所述顶点在所述第五编码图像中对应 的位置;根据所述第二网格图中顶点的坐标,将所述第五编码图像中的像素点变换到所述第二网格图中对应的顶点上,得到所述第七编码图像。
在另一种可选的实现方式中,所述装置还包括模型训练模块,用于基于第一样本图像,获取第一样本解析图像和第一样本姿态图像,所述第一样本图像为多个样本图像中的任一样本图像,所述第一样本解析图像为标注有所述第一样本图像中对象的各部位的图像,所述第一样本姿态图像用于表示所述对象在所述第一样本图像中的姿态;基于第二样本图像,获取第二样本解析图像和第二样本姿态图像,所述第二样本图像为与所述第一样本图像包括同一对象的目标图像,所述第二样本解析图像为标注有所述第二样本图像中对象的各部位的图像,所述第二样本姿态图像用于表示所述对象在所述第二样本图像中的姿态;将所述第一解析图像、所述第一样本姿态图像和所述第二样本姿态图像输入待训练的第一模型,由所述第一模型输出第三样本解析图像;对所述第二样本解析图像和所述第三样本解析图像进行一致性检测,根据检测结果调整所述第一模型的第一训练参数,直到得到所述第一图像生成模型。
在另一种可选的实现方式中,所述模型训练模块,还用于组合所述第一样本图像和所述第一样本解析图像,得到第一样本组合图像,组合所述第三样本解析图像和所述第二样本姿态图像,得到第二样本组合图像;将所述第一样本组合图像和所述第二样本组合图像输入待训练的第二模型,由所述第二模型输出训练结果图像;对所述训练结果图像和所述第二样本图像进行一致性检测,根据检测结果调整第二训练参数,直到得到所述第二图像生成模型。
在另一种可选的实现方式中,所述模型训练模块,还用于对所述训练结果图像的尺寸进行调整,得到多个尺寸的训练结果图像;将所述多个尺寸的训练结果图像分别与所述第二样本图像进行一致性检测。
另一方面,提供了一种人体姿态变换装置,所述装置包括:
第二图像获取模块,用于基于第一人体图像,获取第二解析图像和第三姿态图像,所述第二解析图像为标注有所述第一人体图像中人体的各部位的图像,所述第三姿态图像用于表示所述人体在所述第一人体图像中的姿态;
第二图像变换模块,用于确定第三变换参数,基于所述第三变换参数对所述第二解析图像进行调整,得到第三解析图像,所述第三解析图像中所述人体的姿态为所述目标人体姿态,所述第三变换参数为所述第三姿态图像变换到用于表示目标人体姿态的第四姿态图像的变换参数;
第二图像组合模块,用于组合所述第一人体图像和所述第二解析图像,得到第三组合图像;组合所述第四姿态图像和所述第三解析图像,得到第四组合图像;
所述第二图像变换模块,还用于确定第四变换参数,基于所述第四变换参数和所述第四组合图像对所述第三组合图像进行调整,得到第二人体图像,所述第二人体图像中人体的姿态为所述目标人体姿态,所述第四变换参数为所述第二解析图像变换到所述第三解析图像的变换参数。
另一方面,提供了一种服务器,所述服务器包括处理器和存储器,所述存储器用于存储程序代码,所述处理器用于运行所述存储器中的程序代码,执行如下步骤:
基于待处理图像,获取第一解析图像和第一姿态图像,所述第一解析图像为标注有所述 待处理图像中对象的各部位的图像,所述第一姿态图像用于表示所述对象在所述待处理图像中的姿态;
将所述第一解析图像、所述第一姿态图像和用于表示目标姿态的第二姿态图像输入第一图像生成模型,由所述第一图像生成模型确定第一变换参数,基于所述第一变换参数对所述第一解析图像进行调整,得到目标解析图像,所述目标解析图像中所述对象的姿态为所述目标姿态,所述第一变换参数为所述第一姿态图像变换到所述第二姿态图像的变换参数;
组合所述待处理图像和所述第一解析图像,得到第一组合图像;组合所述第二姿态图像和所述目标解析图像,得到第二组合图像;
将所述第一组合图像和所述第二组合图像输入第二图像生成模型,由所述第二图像生成模型确定第二变换参数,基于所述第二变换参数和所述第二组合图像,对所述第一组合图像进行调整,得到目标图像,所述目标图像中对象的姿态为所述目标姿态,所述第二变换参数为所述第一解析图像变换到所述目标解析图像的变换参数。
另一方面,提供了一种服务器,所述服务器包括处理器和存储器,所述存储器用于存储程序代码,所述处理器用于运行所述存储器中的程序代码,执行如下步骤:
基于第一人体图像,获取第二解析图像和第三姿态图像,所述第二解析图像为标注有所述第一人体图像中人体的各部位的图像,所述第三姿态图像用于表示所述人体在所述第一人体图像中的姿态;
确定第三变换参数,基于所述第三变换参数对所述第二解析图像进行调整,得到第三解析图像,所述第三解析图像中所述人体的姿态为所述目标人体姿态,所述第三变换参数为所述第三姿态图像变换到用于表示目标人体姿态的第四姿态图像的变换参数;
组合所述第一人体图像和所述第二解析图像,得到第三组合图像;组合所述第四姿态图像和所述第三解析图像,得到第四组合图像;
确定第四变换参数,基于所述第四变换参数和所述第四组合图像对所述第三组合图像进行调整,得到第二人体图像,所述第二人体图像中人体的姿态为所述目标人体姿态,所述第四变换参数为所述第二解析图像变换到所述第三解析图像的变换参数。
另一方面,提供了一种存储介质,所述存储介质中存储有程序代码,当所述程序代码由处理器运行时,使得所述处理器执行如下步骤:
基于待处理图像,获取第一解析图像和第一姿态图像,所述第一解析图像为标注有所述待处理图像中对象的各部位的图像,所述第一姿态图像用于表示所述对象在所述待处理图像中的姿态;
将所述第一解析图像、所述第一姿态图像和用于表示目标姿态的第二姿态图像输入第一图像生成模型,由所述第一图像生成模型确定第一变换参数,基于所述第一变换参数对所述第一解析图像进行调整,得到目标解析图像,所述目标解析图像中所述对象的姿态为所述目标姿态,所述第一变换参数为所述第一姿态图像变换到所述第二姿态图像的变换参数;
组合所述待处理图像和所述第一解析图像,得到第一组合图像;组合所述第二姿态图像和所述目标解析图像,得到第二组合图像;
将所述第一组合图像和所述第二组合图像输入第二图像生成模型,由所述第二图像生成 模型确定第二变换参数,基于所述第二变换参数和所述第二组合图像,对所述第一组合图像进行调整,得到目标图像,所述目标图像中对象的姿态为所述目标姿态,所述第二变换参数为所述第一解析图像变换到所述目标解析图像的变换参数。
另一方面,提供了一种存储介质,所述存储介质中存储有程序代码,当所述程序代码由处理器运行时,使得所述处理器执行如下步骤:
基于第一人体图像,获取第二解析图像和第三姿态图像,所述第二解析图像为标注有所述第一人体图像中人体的各部位的图像,所述第三姿态图像用于表示所述人体在所述第一人体图像中的姿态;
确定第三变换参数,基于所述第三变换参数对所述第二解析图像进行调整,得到第三解析图像,所述第三解析图像中所述人体的姿态为所述目标人体姿态,所述第三变换参数为所述第三姿态图像变换到用于表示目标人体姿态的第四姿态图像的变换参数;
组合所述第一人体图像和所述第二解析图像,得到第三组合图像;组合所述第四姿态图像和所述第三解析图像,得到第四组合图像;
确定第四变换参数,基于所述第四变换参数和所述第四组合图像对所述第三组合图像进行调整,得到第二人体图像,所述第二人体图像中人体的姿态为所述目标人体姿态,所述第四变换参数为所述第二解析图像变换到所述第三解析图像的变换参数。
本申请实施例提供的技术方案带来的有益效果是:
通过第一图像生成模型确定第一变换参数,基于该第一变换参数对第一解析图像进行调整,使得该第一解析图像和生成的目标解析图像之间姿态对齐。通过第二图像生成模型,根据第一图像生成模型得到的目标解析图像,来确定第二变换参数,基于该第二变换参数对组合后的待处理图像和第一解析图像进行调整,使得待处理图像和生成的目标图像之间像素对齐,具有更好的图像细节。由于变换前后解析图像保持姿态对齐,可以使变换前后的图像保持空间对齐,从而使得最终生成的目标图像既保证了空间对齐又保证了细节清晰。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种目标图像生成方法的实施环境的示意图;
图2是本申请实施例提供的一种第一图像生成模型训练方法的流程图;
图3是本申请实施例提供的一种第一几何形变模块的结构示意图;
图4是本申请实施例提供的一种第一模型的结构示意图;
图5是本申请实施例提供的一种第一判别器的结构示意图;
图6是本申请实施例提供的一种第二图像生成模型训练方法的流程图;
图7是本申请实施例提供的一种第二几何形变模块的结构示意图;
图8是本申请实施例提供的一种第二模型的结构示意图;
图9是本申请实施例提供的一种多尺度判别器的结构示意图;
图10是本申请实施例提供的一种目标图像生成方法的流程图;
图11是本申请实施例提供的一种人体解析图像的示意图;
图12是本申请实施例提供的一种姿态图像的示意图;
图13是本申请实施例示出的一种黑盒模型的示意图;
图14是本申请实施例提供的一种人体姿态变换方法的流程图;
图15是本申请实施例提供的一种目标图像生成装置的框图;
图16是本申请实施例提供的一种人体姿态变换装置的框图;
图17是本申请实施例提供的一种服务器的结构示意图;
图18是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
本申请实施例主要涉及目标图像生成的场景,举例来说,涉及的场景为:将给定的图像中的对象,由当前姿态变换为给定姿态,得到包括给定姿态的该对象的图像。可选地,该对象可以是人物、动物或者植物等。例如,给定一张人物A的侧身图,同时给定一张人物B的正身图,采用本申请提供的技术方案之后,基于人物B的正身图,能够将人物A由侧身姿势变换为正身姿势,从而生成一张人物A的正身图。
在本申请实施例中,能够通过给定包括目标姿态的图像,对待处理图像中的对象的姿态进行变换,生成包括目标姿态的对象的目标图像。可选地,生成目标图像的过程分为两个阶段,第一个阶段通过第一图像生成模型实现,也即是将标注有待处理图像中对象的各部位的第一解析图像、包括对象在待处理图像中的姿态的第一姿态图像和包括目标姿态的第二姿态图像输入第一图像生成模型,生成该对象的各部位的组合符合目标姿态的目标解析图像;第二个阶段通过第二图像生成模型实现,将待处理图像和第一解析图像进行组合,将第一姿态图像和目标解析图像进行组合,将组合后的图像输入第二图像生成模型,生成包括目标姿态的对象的目标图像。
本申请属于图像处理技术领域,在进行图像处理中,涉及了部分机器视觉的相关技术,下面简单介绍一下机器视觉技术,机器视觉(Computer Vision,CV)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼和大脑,实现对目标进行识别、跟踪和测量等功能,并通过电脑进一步做图形处理,将摄影机拍摄的图像处理成为更适合人眼观察或仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。机器视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、光学字符识别(Optical Character Recognition,OCR)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、三维图形(Three-Dimensional,3D)技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指 纹识别等生物特征识别技术。
图1是本申请实施例提供的一种目标图像生成方法的实施环境的示意图,参见图1,该实施环境中包括:终端110和服务器120。
可选地,终端110通过无线网络或有线网络与服务器120相连。终端110是智能手机、摄像机、台式计算机、平板电脑和膝上型便携计算机中的至少一种。终端110安装和运行有用于图像处理功能的应用程序。可选地,该应用程序是社交类应用程序、图像处理类应用程序或者视频处理类应用程序等。示意性的,终端110是用户使用的终端,终端110运行的应用程序内登录有该用户的账号。
服务器120包括一台服务器、多台服务器和云计算平台中的至少一种。服务器120用于提供目标图像生成的后台服务。可选地,服务器120承担主要的目标图像生成工作,终端110承担次要的目标图像生成工作;或者服务器120承担次要的目标图像生成工作,终端110承担主要的目标图像生成工作;或者,服务器120和终端110分别可以单独承担目标图像生成工作。
可选地,服务器120包括:接入服务器、图像生成服务器和数据库。接入服务器用于提供终端110的接入服务。图像生成服务器用于根据用户上传的待处理图像和目标姿态图像,生成包括目标姿态的对象的目标图像。可选地,图像生成服务器是一台或多台,当图像生成服务器是多台时,存在至少两台图像生成服务器用于提供不同的服务,和/或,存在至少两台图像生成服务器用于提供相同的服务,比如以负载均衡方式提供同一种服务或者以主服务器和镜像服务器的方式提供同一种服务,本申请实施例对此不加以限定。数据库用于存储用户上传的待处理图像、目标姿态图像以及生成的目标图像。数据库存储的信息为用户已授权使用的信息。
可选地,终端110泛指多个终端中的一个,本实施例仅以终端110来举例说明。本领域技术人员可以知晓,上述终端的数量可以更多或更少。比如上述终端110仅为一个,或者上述终端为几十个或几百个,或者更多数量,此时上述实施环境中还包括其他终端。本公开实施例对终端的数量和类型不加以限定。
在本申请实施例中,通过第一图像生成模型和第二图像生成模型来生成目标图像,为了更加清楚的对本申请提供的技术方案进行说明,首先对本申请提供的第一图像生成模型和第二图像生成模型的训练方法进行说明,参见图2,提供了一种第一图像生成模型的训练方法,方法包括:
201、服务器基于第一样本图像,获取第一样本解析图像和第一样本姿态图像,第一样本图像为服务器获取的多个样本图像中的任一样本图像,第一样本解析图像为标注有第一样本图像中对象的各部位的图像,第一样本姿态图像用于表示对象在第一样本图像中的姿态。例如,第一样本图像为一个男性的正身图像,该男性的双脚并拢,双臂向上伸直。
202、服务器基于第二样本图像,获取第二样本解析图像和第二样本姿态图像,第二样本图像为与第一样本图像包括同一对象的目标图像,第二样本解析图像为标注有第二样本图像中对象的各部位的图像,第二样本姿态图像用于表示对象在第二样本图像中的姿态。
若第二样本图像中的对象为上述第一样本图像中的男性,在该第二样本图像中,该男性双腿分开呈30°,双臂在身体两侧平伸,也即第一样本图像和第二样本图像的区别在于该男 性的姿态不同。可选地,用户通过服务器将第二样本图像表示的姿态为目标姿态,或者将第一样本表示的姿态作为目标姿态,本申请实施例对此不进行具体限制。若目标姿态为第二样本图像表示的姿态,那么对第一图像生成模型的训练过程也即是将第一样本图像中对象的姿态变化为第二样本图像中对象的姿态。若目标姿态为第一样本图像表示的姿态,那么对第一图像生成模型的训练过程也即是将第二样本图像中对象的姿态变化为第一样本图像中对象的姿态。在下述说明过程中,仅以目标姿态为第二样本图像表示的姿态为例进行说明。
203、服务器将第一样本解析图像、第一样本姿态图像和第二样本姿态图像输入待训练的第一模型,由第一模型输出第三样本解析图像。
在一种可选的实现方式中,该第一模型包括第一编码模块、第二编码模块、第一几何形变模块、第一组合模块、第一残差处理模块以及第一解码模块。
其中,第一编码模块与第一几何形变模块相连,第一编码模块用于对第一样本解析图像进行编码,生成第一样本编码图像。可选地,第一编码模块由卷积神经网络构建得到,第一编码模块为编码器。第一编码模块中卷积核的通道数与第一样本解析图像的通道数相同。例如,若第一样本解析图像的尺寸为32*32,通道数为3,其中,三个通道分别为R(red,红)、G(green,绿)以及B(blue,蓝),则第一编码模块中卷积核的通道数也为3。
第二编码模块与第一组合模块相连,第二编码模块用于对第一样本姿态图像进行编码,生成第二样本编码图像,可选地,第二编码模块与第一编码模块的结构相同。
第一几何形变模块与第一编码模块和第一组合模块相连,第一几何形变模块用于对第一样本编码图像中对象的各部位在图像中的位置进行变换,生成第三样本编码图像。图3是本申请实施例提供的一种第一几何形变模块的结构示意图,参见图3,图3中包括第一样本姿态图像P c、第二样本姿态图像P t、输入的第一样本编码图像F、第一变换参数预测模块、第一网格图生成模块、第一变换模块以及生成的第三样本编码图像GDM(F)。其中,第一变换参数生成模块用于根据卷积神经网络确定P c变换到P t的第一变换参数,第一网格图生成模块用于根据第一变换参数生成第一网格图,第一变换模块用于根据第一网格图对第一样本编码图像F进行变换。
第一组合模块与第一几何形变模块、第二编码模块、第一残差处理模块相连,第一组合模块用于将第三样本编码图像和第二样本编码图像组合为第一样本组合图像。可选地,组合的方式为在通道维度上将两张图像连接,得到的图像的通道数量为两张图像的通道数量之和。例如,第二样本编码图像的尺寸为32*32,通道数为2,第三样本编码图像的尺寸为32*32,通道数为3,将两张图像在通道维度上连接,得到一张尺寸为32*32,通道数为5的图像。
第一残差处理模块与第一组合模块和第一解码模块相连,第一残差处理模块用于对样本组合图像进行残差处理,以加速第一模型的收敛。
第一解码模块与第一残差处理模块相连,第一解码模块用于对残差处理得到的图像进行解码,得到第三样本解析图像。
为了使本步骤所描述第一模型的结构更清晰,参见图4,图4是本申请实施例提供的一种第一模型的结构示意图,图4中包括第一样本解析图像S c、第二样本姿态图像P t、第一编码模块E c1、第二编码模块E t1、第一几何形变模块GDM 1,第一组合模块C 1,第一残差处理模块ResNet 1、第一解码模块DE 1以及生成的第三样本解析图像
Figure PCTCN2020115678-appb-000001
通过本申请提供的第一模型,将第一样本解析图像S c以及第二样本姿态图像P t输入模型之后,能够得到姿 态变化之后的第三样本解析图像
Figure PCTCN2020115678-appb-000002
204、服务器对第二样本解析图像和第三样本解析图像进行一致性检测,根据检测结果调整第一模型的第一训练参数,直到得到第一图像生成模型。
在一种可选的实现方式中,服务器通过第一判别器对第二样本解析图像和第三样本解析图像进行一致性检测。举例来说,服务器将第二样本姿态图像P t和第二样本解析图像S t组合后输入第一判别器,将第二样本姿态图像P t和第三样本解析图像
Figure PCTCN2020115678-appb-000003
组合后输入第一判别器,由第一判别器输出第二样本解析图像和第三样本解析图像的相似度,相似度也就用于表示第二样本姿态图像P t和第三样本解析图像
Figure PCTCN2020115678-appb-000004
的一致性。
以一致性检测的结果为相似度为例,服务器能够根据第一判别器输出的相似度,来确定是否停止对第一模型的训练。在任一次迭代过程中,当第一判别器输出的相似度大于或等于第一相似度阈值时,也就表示第一模型生成的第三样本解析图像与第二样本解析图像足够相似,第一模型的第一训练参数已经收敛到合适的数值,第一模型能够生成以假乱真的图像,服务器停止对第一模型进行训练;当第一判别器输出的相似度小于第一相似度阈值时,也就表示第一模型生成的第三样本解析图像与第二样本解析图像不够相似,第一模型的第一训练参数还没有收敛到合适的数值,第一模型不能生成以假乱真的图像,需要继续对第一模型进行训练。服务器继续根据第一模型生成的第三样本解析图像和第二样本解析图像之间的相似度,继续调整第一训练参数,也即是服务器重复执行上述步骤201至步骤204,直到第一判别器输出的相似度大于或等于第一相似度阈值,此时的第一模型也就是第一图像生成模型。可选地,第一相似度阈值为80%、85%、90%或其他数值,本申请实施例对此不进行具体限制。
为了使步骤204中描述的第一判别器的结构更加清晰,参见图5,图5是本申请实施例提供的一种第一判别器的结构示意图,图5中包括第一样本姿态图像P t、第二样本解析图像S t、第三样本解析图像
Figure PCTCN2020115678-appb-000005
以及第一判别器D 1
可选地,上述步骤201至步骤204所描述的过程也能够采用公式(1)来表示:
Figure PCTCN2020115678-appb-000006
其中,
Figure PCTCN2020115678-appb-000007
表示第三样本解析图像,DE 1表示第一解码模块,GDM 1表示第一几何形变模块,E c1表示第一编码模块,S c表示第一样本解析图像,E t1表示第二编码模块,P t表示第一样本姿态图像。
需要说明的是,上述第一图像生成模型的训练过程中的总损失可以由
Figure PCTCN2020115678-appb-000008
来表示。
Figure PCTCN2020115678-appb-000009
包括交叉熵损失
Figure PCTCN2020115678-appb-000010
和对抗损失
Figure PCTCN2020115678-appb-000011
其中,交叉熵损失
Figure PCTCN2020115678-appb-000012
用于优化上述步骤203中生成第三样本解析图像的过程,对抗损失
Figure PCTCN2020115678-appb-000013
用于优化整个训练过程。在一种可选的实现方式中,上述第一图像生成模型被称为第一生成器G 1
相应的,交叉熵损失
Figure PCTCN2020115678-appb-000014
可以由公式(2)获得:
Figure PCTCN2020115678-appb-000015
其中,
Figure PCTCN2020115678-appb-000016
表示交叉熵损失,S t表示第二样本解析图像,
Figure PCTCN2020115678-appb-000017
表示元素相乘,
Figure PCTCN2020115678-appb-000018
表示第三样本解析图像,1表示1-范数。
第一判别器的对抗损失
Figure PCTCN2020115678-appb-000019
由公式(3)获得:
Figure PCTCN2020115678-appb-000020
其中,
Figure PCTCN2020115678-appb-000021
表示第一判别器的对抗损失,D 1表示第一判别器,P t表示第一样本姿态图像,S t表示第二样本解析图像,
Figure PCTCN2020115678-appb-000022
表示第三样本解析图像。
第一生成器的对抗损失
Figure PCTCN2020115678-appb-000023
由公式(4)获得:
Figure PCTCN2020115678-appb-000024
其中,
Figure PCTCN2020115678-appb-000025
表示第一生成器的对抗损失,D 1表示第一判别器,P t表示第一样本姿态图像,
Figure PCTCN2020115678-appb-000026
表示第三样本解析图像。
对抗损失
Figure PCTCN2020115678-appb-000027
由公式(5)获得:
Figure PCTCN2020115678-appb-000028
其中,
Figure PCTCN2020115678-appb-000029
表示对抗损失,
Figure PCTCN2020115678-appb-000030
表示第一判别器的对抗损失,
Figure PCTCN2020115678-appb-000031
表示第一生成器的对抗损失。
总损失
Figure PCTCN2020115678-appb-000032
由公式(6)获得:
Figure PCTCN2020115678-appb-000033
其中,
Figure PCTCN2020115678-appb-000034
表示总损失,
Figure PCTCN2020115678-appb-000035
表示对抗损失,
Figure PCTCN2020115678-appb-000036
表示交叉熵损失,λ表示交叉熵损失的加权系数。
参见图6,提供了一种第二图像生成模型的训练方法,方法包括:
601、服务器在待训练的第一模型输出第三样本解析图像后,组合第一样本图像和第一样本解析图像,得到第一样本组合图像,组合第三样本解析图像和第二样本姿态图像,得到第二样本组合图像。
可选地,组合的方式为将两种图像在通道维度上连接。
602、服务器将第一样本组合图像和第二样本组合图像输入待训练的第二模型,由第二模型输出训练结果图像。
在一种可选的实现方式中,第二模型包括第三编码模块、第四编码模块、第二几何形变模块、第二组合模块、第二残差处理模块以及第二解码模块。
其中,第三编码模块与第二几何形变模块相连,第三编码模块用于对第一样本组合图像进行编码,生成第四样本编码图像。可选地,第三编码模块由卷积神经网络构建得到,第三编码模块为编码器。第三编码模块中卷积核的通道数与第一样本组合图像的通道数相同。若第一组合图像的尺寸为32*32,通道数为6,则第三编码模块中卷积核的通道数也为6。
第四编码模块与第二组合模块相连,第四编码模块用于对第二样本组合图像进行编码,生成第五样本编码图像。可选地,第四编码模块与第三编码模块的结构相同。
第二几何形变模块与第三编码模块和第二组合模块相连,第二几何形变模块用于对第四样本编码图像中的对象的各部位的在图像中位置进行变换,生成第六样本编码图像。为了使第二几何形变模块的结构更清晰,参见图7,图7是本申请实施例提供的一种第二几何形变模块的结构示意图,图7中包括第一样本解析图像S c、第三样本解析图像
Figure PCTCN2020115678-appb-000037
输入的第四样本编码图像f、第二变换参数预测模块、第二网格图生成模块、第二变换模块以及生成的第 六样本编码图像GM(f)。其中,第二变换参数生成模块用于根据卷积神经网络确定S c变换到
Figure PCTCN2020115678-appb-000038
的第二变换参数,第二网格图生成模块用于根据第二变换参数生成第二网格图,第二变换模块用于根据第二网格图对第四样本编码图像f进行变换。
第二组合模块与第二几何形变模块、第四编码模块、第二残差处理模块相连,第二组合模块用于将第六样本编码图像和第五样本编码图像组合为第二样本组合图像。可选地,组合的方式为在通道维度上将两张图像连接,得到的图像的通道数量为两张图像的通道数量之和。
为了使本步骤所描述的第二模型的结构更清晰,参见图8,图8是本申请实施例提供的一种第二模型的结构示意图,图8中包括第一样本解析图像S c、第一样本图像I c、第二样本姿态图像P t、第三样本解析图像
Figure PCTCN2020115678-appb-000039
第三编码模块E c2、第四编码模块E t2、第二几何形变模块GDM 2,第二组合模块C 2,第二残差处理模块ResNet 2、第二解码模块DE 2以及生成的训练结果图像
Figure PCTCN2020115678-appb-000040
其中,第三编码模块的输入为第一样本解析图像S c和第一样本图像I c组合后得到的I 1,第四编码模块的输入为第二样本姿态图像P t和第三样本解析图像
Figure PCTCN2020115678-appb-000041
组合后得到的I 2。通过本申请提供的第二模型,将第一组合图像I 1以及第二组合图像I 2输入模型之后,能够得到姿态变化之后的训练结果图像
Figure PCTCN2020115678-appb-000042
603、服务器对训练结果图像和第二样本图像进行一致性检测,根据检测结果调整第二模型的第二训练参数,直到得到第二图像生成模型。
在一种可选的实现方式中,服务器通过第二判别器对训练结果图像和第二样本图像进行一致性检测。举例来说,服务器将第一样本图像I c、第一样本解析图像S c、第二样本姿态图像P t、第三样本解析图像
Figure PCTCN2020115678-appb-000043
和训练结果图像
Figure PCTCN2020115678-appb-000044
组合后输入第二判别器,第一样本图像I c、第一样本解析图像S c、第二样本姿态图像P t、第三样本解析图像
Figure PCTCN2020115678-appb-000045
和第二样本图像I t组合后输入第二判别器,由第二判别器输出训练结果图像
Figure PCTCN2020115678-appb-000046
和第二样本图像P t的相似度,相似度也就用于表示训练结果图像
Figure PCTCN2020115678-appb-000047
和第二样本姿态图像P t的一致性。
以一致性检测的结果为相似度为例,服务器能够根据第二判别器输出的相似度,来确定是否停止对第二模型的训练。当第二判别器输出的相似度大于或等于第二相似度阈值时,也就表示第二模型生成的训练结果图像与第二样本姿态图像足够相似,第二模型的第二训练参数已经收敛到合适的数值,第二模型能够生成以假乱真的图像,服务器停止对第二模型进行训练;当第二判别器输出的相似度小于第二相似度阈值时,也就表示第二模型生成的训练结果图像与第二样本姿态图像不够相似,第二模型的第二训练参数没有收敛到合适的数值,第二模型不能生成以假乱真的图像,服务器需要继续对第二模型进行训练。服务器根据训练结果图像与第二样本姿态图像之间的相似度,调整第二训练参数,也即是服务器重复执行上述步骤601至步骤603,直到第二判别器输出的相似度大于或等于第二相似度阈值,此时的第二模型也就是第二图像生成模型。可选地,第二相似度阈值为80%、85%、90%或其他数值,本申请实施例对此不进行具体限制。
在上述实施方式的基础上,服务器还能够通过多尺度判别器对训练结果图像和第二样本图像进行一致性检测。举例来说,服务器对训练结果图像的尺寸进行调整,得到多个尺寸的训练结果图像,服务器将多个尺寸的训练结果图像分别与第二样本图像进行一致性检测。
为了对上述多尺度判别器的结构进行更加清晰的说明,参见图9,图9是本申请实施例提供的一种多尺度判别器的结构示意图,图9包括第一样本图像I c、第一样本解析图像S c、第二样本姿态图像P t、第三样本解析图像
Figure PCTCN2020115678-appb-000048
训练结果图像
Figure PCTCN2020115678-appb-000049
组合得到真实图像对P r,还 包括第一样本图像I c、第一样本解析图像S c、第二样本姿态图像P t、第三样本解析图像
Figure PCTCN2020115678-appb-000050
和第二样本图像I t组合后得到虚假图像对P f,也即生成的图像,还包括多尺度判别器D f
相应的,上述步骤601至步骤603所描述的过程还能够采用以下公式(7)来表示:
Figure PCTCN2020115678-appb-000051
其中,
Figure PCTCN2020115678-appb-000052
表示训练结果图像,DE 2表示第二解码模块,GDM 2表示第二几何形变模块,E c2表示第三编码模块,I c表示第一样本图像,S c表示第一样本解析图像,E t2表示第四编码模块,P t表示第二样本姿态图像,
Figure PCTCN2020115678-appb-000053
表示第三样本解析图像。
需要说明的是,上述第二图像生成模型的训练过程中的总损失由
Figure PCTCN2020115678-appb-000054
来表示。
Figure PCTCN2020115678-appb-000055
包括对抗损失
Figure PCTCN2020115678-appb-000056
特征匹配损失L fm、L1范数损失L L1、感知损失L P和重建损失L recon。其中,L1范数损失中引入了背景掩码。在一种可选的实现方式中,上述第二图像生成模型被称为第二生成器G 2
对抗损失
Figure PCTCN2020115678-appb-000057
的值由下述公式(8)-(12)获得:
Figure PCTCN2020115678-appb-000058
Figure PCTCN2020115678-appb-000059
Figure PCTCN2020115678-appb-000060
Figure PCTCN2020115678-appb-000061
Figure PCTCN2020115678-appb-000062
其中,P r表示真实图像对,P f表示虚假图像对,I c表示第一样本图像,D c表示第一样本解析图像,P t表示第二样本姿态图像,
Figure PCTCN2020115678-appb-000063
表示第三样本解析图像,I t表示第二样本图像,
Figure PCTCN2020115678-appb-000064
表示训练结果图像,
Figure PCTCN2020115678-appb-000065
表示第二生成器的对抗损失,
Figure PCTCN2020115678-appb-000066
表示第二生成器的对抗损失,
Figure PCTCN2020115678-appb-000067
表示对抗损失。
特征匹配损失L fm由公式(13)获得:
Figure PCTCN2020115678-appb-000068
其中,L fm表示特征匹配损失,
Figure PCTCN2020115678-appb-000069
表示第k个多尺度判别器的第i层特征图,P r表示真实图像对,P f表示虚假图像对,1表示1-范数。
特征匹配损失L fm由公式(14)获得:
Figure PCTCN2020115678-appb-000070
其中,L L1表示L1范数损失,I t表示第二样本图像,I c表示第一样本图像,
Figure PCTCN2020115678-appb-000071
表示元素相乘,M表示背景掩码,1表示1-范数。
感知损失L P由公式(15)获得:
Figure PCTCN2020115678-appb-000072
其中,L P表示感知损失,I t表示第二样本图像,
Figure PCTCN2020115678-appb-000073
表示训练结果图像,Φ (υ)表示图像经过预训练的VGG19(一种卷积神经网络)网络后得到的第v层特征图,1表示1-范数。
重建损失L recon可以有公式(16)和公式(17)得到:
Figure PCTCN2020115678-appb-000074
Figure PCTCN2020115678-appb-000075
其中,
Figure PCTCN2020115678-appb-000076
表示训练结果图像,DE 2表示第二解码模块,I c表示第一样本图像,P t表示第二样本姿态图像,L recon表示重建损失,P c表示第一样本姿态图像,1表示1-范数。
总损失
Figure PCTCN2020115678-appb-000077
由公式(18)得到:
Figure PCTCN2020115678-appb-000078
其中,
Figure PCTCN2020115678-appb-000079
表示总损失,
Figure PCTCN2020115678-appb-000080
表示对抗损失,λ fm表示特征匹配损失加权系数,L fm表示特征匹配损失,λ L1表示L1范数损失加权系数,L L1表示L1范数损失,λ P表示感知损失加权系数,L P表示感知损失,λ recon表示重建损失加权系数,L recon表示重建损失。
图10是本申请实施例提供的一种目标图像生成方法的流程图,如图10所示。该方法包括以下步骤:
1001、服务器接收终端发送的待处理图像,基于待处理图像,获取第一解析图像和第一姿态图像,第一解析图像为标注待处理图像中对象的各部位的图像,第一姿态图像用于表示对象在待处理图像中的姿态。
在本申请实施例中,用户能够通过终端中的应用程序向服务器发送图像生成请求,该图像生成请求中携带上述待处理图像。服务器在接收到上述图像生成请求时,能够从该图像生成请求中获取该待处理图像。
可选地,本步骤通过以下子步骤来完成:
在步骤1001a中,服务器对该待处理图像进行解析,将待处理图像中的对象的各部位分别标注,得到第一解析图像。以该对象为人体为例,服务器通过不同颜色的区域来区分该人体的不同部位,如头部、脸部、躯干、手臂、腿部和脚等。为了更好的理解该第一解析图像,参见图11,图11是本申请实施例提供的一种人体解析图像的示意图,图11中包括一个人体,该人体的各个部位被划分为多个区域,每个区域采用不同的颜色来进行区分。
还是以对象为人体为例,服务器对该待处理图像进行图像分割,从待处理图像中得到人体图像。服务器对人体图像进行图像识别,得到人体的不同部位在人体图像中的区域。服务器采用不同的像素值来渲染人体图像中的不同区域,得到第一解析图像。
在步骤1001b中,服务器对待处理图像进行姿态提取,将待处理图像中的对象抽象为多个位置点,多个位置点能够表示对象的姿态。以对象为人体为例,服务器将人体的多个部位抽象为位置点,比如将关节部位、眼睛、嘴巴等部位抽象为位置点。
在一种可选的实现方式中,服务器获取第二姿态图像,该第二姿态图像为用于表示目标姿态的图像。可选地,该第二姿态图像为服务器从预设的至少一个姿态图像中确定的姿态图 像,或者为根据终端上传的图像得到的姿态图像,本申请实施例对此不做限定。
可选地,若第二姿态图像为服务器从预设的至少一个姿态图像中确定的图像,那么服务器对应维护有姿态图像库,该姿态图像库包括至少一个姿态图像,每个姿态图像中包括多个位置点,多个位置点构成一种抽象的姿态。用户通过终端中的应用程序来预览该姿态图像库中的至少一个姿态图像,当任一姿态图像被选择时,终端将该被选择的姿态图像的图像标识与待处理图像一起发送给服务器,服务器根据该图像标识来确定被用户选中的姿态图像,将该姿态图像作为第二姿态图像。
可选地,若第二姿态图像为根据终端上传的图像得到的姿态图像,那么服务器接收终端发送的图像,可选地,该图像与待处理图像包括不同的对象。例如,待处理图像是一个女性的侧身图,而该图像是一个男性的正身图。当用户希望将女性的姿态变换成该图像中男性的姿态时,用户通过终端同时向服务器上传该女性的侧身图和该男性的正身图。服务器在接收到该图像后,可以对该图像进行姿态提取,将提取到的包括多个位置点的图像作为第二姿态图像,该第二姿态图像包括目标姿态。
为了更好的理解位姿图像,参见图12,图12是本申请实施例提供的一种姿态图像的示意图,图12用于表示一个人体的姿态,该姿态由多个位置点构成一个抽象的人体进行表示。例如,最左侧的三个点分别代表右肩膀,右手手肘和右手手掌,对应的最右侧的三个点代表左肩膀,左手手肘和左手手掌。
1002、服务器将第一解析图像、第一姿态图像和用于表示目标姿态的第二姿态图像输入第一图像生成模型。
可选地,第一图像生成模型为通过第一样本图像和第二样本图像,基于生成式对抗网络(GAN,Generative Adversarial Networks)训练得到的模型,具有生成目标姿态的解析图像的能力,模型的训练过程参见上述步骤201-204,在此不再赘述。
1003、服务器通过第一图像生成模型确定第一变换参数,基于第一变换参数对第一解析图像进行调整,得到目标解析图像,目标解析图像中对象的姿态为目标姿态,第一变换参数为第一姿态图像变换到第二姿态图像的变换参数。
可选地,本步骤通过以下子步骤来实现:
在步骤1003a中,服务器将第一姿态图像和第二姿态图像输入第一图像生成模型的第一卷积神经网络中,由该第一卷积神经网络确定第一变换参数。
在步骤1003b中,服务器获取到第一变换参数后,通过第一图像生成模型对第一解析图像进行编码,得到第一编码图像,对第一姿态图像进行编码,得到第二编码图像。当然,服务器也能够在获取第一变换参数前编码得到上述第一编码图像和第二编码图像,本申请实施例对此不进行具体限制。可选地,上述编码过程由结构相同的编码模块来实现,比如由步骤203中描述的第一编码模块和第二编码模块来实现,实现过程与上述步骤203属于同一发明构思,在此不再赘述。
在步骤1003c中,服务器基于第一变换参数,将第一编码图像变换为第三编码图像。在一种可选的实现方式中,服务器基于第一变换参数,生成第一网格图,该第一网格图中顶点的坐标用于指示该顶点在第一编码图像中对应的位置。服务器根据第一网格图中顶点的坐标,将第一编码图像中各像素点变换到第一网格图中对应的顶点上,得到第三编码图像。可选地,上述变换过程由几何形变模块实现,比如通过步骤203中描述的第一几何形变模块来实现, 实现过程与上述步骤203属于同一发明构思,在此不再赘述。在一种可选的实现方式中,服务器根据第一网格图像中每个顶点的坐标,在第一编码图像的对应位置进行采样,将采样得到的像素值设置为该顶点的像素值,从而得到第三编码图像。
在步骤1003d中,服务器对第二编码图像和第三编码图像进行残差处理,得到第四编码图像。在一种可选的实现方式中,服务器可以将第二编码图像和第三编码图像组合后,将组合得到的图像输入ResNet(Residual NeuralNetwork,残差处理)网络,该ResNet网络包括多个残差块,服务器将每个残差块的输出与输入的差别以及组合得到的图像输入下一个残差块,最终得到第四编码图像。其中,组合的方式与步骤203中描述的在通道维度上将两张图像连接的方式属于同一发明构思,在此不再赘述。
在步骤1003e中,服务器将第四编码图像解码,得到目标解析图像。
1004、服务器组合待处理图像和第一解析图像,得到的第一组合图像,组合第二姿态图像和目标解析图像,得到的第二组合图像。
服务器在得到目标解析图像后,可以通过以下两种方式组合得到该第一组合图像和该第二组合图像。一种组合方式是将两种图像在通道维度上连接,另一种组合方式是在通道方向上连接。
在通道维度上组合的方式已在步骤203中描述,在此不再赘述。而在通道方向是组合的方式,是指将两张通道数相同的图片的尺寸相加,得到通道数不变,尺寸改变的图像,比如,待处理图像的尺寸为32*32,通道为R、G、B三个通道,第一解析图像的尺寸为32*32,通道为R、G、B三个通道,服务器将待处理图像和第一解析图像的R、G、B通道分别连接,得到尺寸为64*32,通道为R、G、B三个通道的第一组合图像。
1005、服务器将第一组合图像和第二组合图像输入第二图像生成模型。
可选地,第二图像生成模型的结构与第一图像生成模型相同,同样为通过生成式对抗网络(GAN,Generative Adversarial Networks)训练得到的模型,第二图像生成模型的训练方法参见上述601-603的描述,在此不再赘述。当然,第二图像生成模型的结构也可以与第一图像生成模型不相同,本申请实施例对比不进行具体限制。
1006、服务器根据第二图像生成模型确定第二变换参数,基于第二变换参数和第二组合图像对第一组合图像进行调整,得到目标图像,目标图像中对象的姿态为目标姿态,第二变换参数为第一解析图像变换到目标解析图像的变换参数。
可选地,本步骤通过以下子步骤来实现:
在步骤1006a中,服务器将第一解析图像和目标解析图像输入第二图像生成模型的第二卷积神经网络中,由第二卷积神经网络确定第一解析图像变换到目标解析图像的第二变换参数。
在步骤1006b中,服务器获取到第二变换参数后,通过第二图像生成模型对第一组合图像进行编码,得到第五编码图像,对第二组合图像进行编码,得到第六编码图像。当然,服务器也能够在获取第二变换参数前编码得到上述第五编码图像和第六编码图像,本申请实施例对此不进行具体限制。可选地,上述编码过程可以由结构相同的编码模块来实现,比如通过步骤602中描述的第三编码模块和第四编码模块来实现,实现过程与上述步骤602属于同一发明构思,在此不再赘述。
在步骤1006c中,服务器基于第二变换参数,将第五编码图像变换为第七编码图像。举 例来说,服务器基于第二变换参数,生成第二网格图,第二网格图中顶点的坐标用于指示该顶点在第五编码图像中对应的位置,服务器根据第二网格图中顶点的坐标,将第五编码图像中各像素点变换到第二网格图中对应的顶点上,得到第七编码图像。可选地,上述变换过程由几何形变模块实现,比如通过步骤602中描述的第二几何形变模块来实现,实现过程与上述步骤602属于同一发明构思,在此不再赘述。在一种可选的实现方式中,服务器根据第二网格图像中每个顶点的坐标,在第五编码图像的对应位置进行采样,将采样得到的像素值设置为该顶点的像素值,从而得到第七编码图像。
在步骤1006d中,服务器对第六编码图像和第七编码图像进行残差处理,得到第八编码图像。在一种可选的实现方式中,服务器可以将第六编码图像和第七编码图像组合后,将组合得到的图像输入ResNet(Residual NeuralNetwork,残差处理)网络,该ResNet网络包括多个残差块,服务器将每个残差块的输出与输入的差别以及组合得到的图像输入下一个残差块,最终得到第八编码图像。其中,组合的方式可以为在步骤203中描述的在通道维度上将两张图像连接的方式,在此不再赘述。
在步骤1006e中,服务器将第八编码图像解码,得到目标图像。
需要说明的是,上述步骤1001至步骤1006是示例性的,通过两阶段的两个图像生成模型来生成目标图像的过程,上述过程还可以由一个图像生成模型来实现,该图像生成模型可以为一个黑盒模型,输入待处理图像和包括目标姿态的图像即可输入目标图像。可以参见图13所示,图13是本申请实施例示出的一种黑盒模型的示意图,图中包括待处理图像X、包括目标姿态的图像Y,黑盒模型以及生成的目标图像Z。
在本申请实施例中,通过第一图像生成模型确定第一变换参数,基于该第一变换参数对第一解析图像进行调整,使得该第一解析图像和生成的目标解析图像之间姿态对齐。通过第二图像生成模型,根据第一图像生成模型得到的目标解析图像,来确定第二变换参数,基于该第二变换参数对组合后的待处理图像和第一解析图像进行调整,使得待处理图像和生成的目标图像之间像素对齐,具有更好的图像细节。由于变换前后解析图像保持姿态对齐,可以使变换前后的图像保持空间对齐,从而使得最终生成的目标图像既保证了空间对齐又保证了细节清晰。
图14是本申请实施例提供的一种人体姿态变换方法的流程图。如图14所示,方法包括以下步骤:
1401、服务器接收终端发送的第一人体图像,基于第一人体图像获取第二解析图像和第三姿态图像,第二解析图像为标注有第一人体图像中人体的各部位的图像,第三姿态图像用于表示人体在第一人体图像中的姿态。
本步骤与步骤1001属于同一发明构思,具体的实现方式可以参见步骤1001,在此不再赘述。
1402、服务器确定第三变换参数,基于第三变换参数对第二解析图像进行调整,得到第三解析图像,第三解析图像中人体的姿态为目标人体姿态,第三变换参数为第三姿态图像变换到包括目标人体姿态的第四姿态图像的变换参数。
在本步骤中,服务器能够直接通过卷积神经网络来确定第三姿态图像变换到包括目标人体姿态的第四姿态图像的第三变换参数,基于该第三变换参数通过残差处理网络对第二解析 图像进行调整,从而得到第三解析图像。
在一种可选的实现方式中,服务器还能够通过第一图像生成模型确定第三姿态图像变换到包括目标人体姿态的第四姿态图像的第三变换参数,基于第三变换参数对第二解析图像进行调整,得到第三解析图像。具体的实现方式可以参见步骤1003,在此不再赘述。
1403、服务器组合第一人体图像和第二解析图像,得到第三组合图像,组合第四姿态图像和第三解析图像,得到第四组合图像。
本步骤与步骤1004属于同一发明构思,具体的实现方式可以参见步骤1004,在此不再赘述。
1404、服务器确定第四变换参数,基于第四变换参数和第四组合图像对第三组合图像进行调整,得到第二人体图像,第二人体图像中的人体的姿态为目标人体姿态,第四变换参数为第二解析图像变换到第三解析图像的变换参数。
在本步骤中,服务器能够直接通过卷积神经网络来确定第二解析图像变换到第三解析图像的第四变换参数,基于第四变换参数和第四组合图像对第三组合图像进行调整,从而得到第二人体图像。
在一种可选的实现方式中,服务器还能够通过第二图像生成模型确定第二解析图像变换到第三解析图像的第四变换参数,基于第四变换参数和第四组合图像对第三组合图像进行调整,得到第二人体图像。具体的实现方式可以参见步骤1004,在此不再赘述。
在本申请实施例中,通过确定第三变换参数,基于该第三变换参数对第二解析图像进行调整,使得该第二解析图像和生成的第三解析图像之间姿态对齐。通过生成的第三解析图像,来确定第四变换参数,基于该第四变换参数对组合后的第一人体图像和第二解析图像进行调整,使得第一人体图像和生成的第二人体图像之间像素对齐,具有更好的图像细节。由于变换前后解析图像保持姿态对齐,可以使变换前后的图像保持空间对齐,从而使得最终生成的第二人体图像既保证了空间对齐又保证了细节清晰。
图15是本申请实施例提供的一种目标图像生成装置的框图,如图15所示,包括:第一图像获取模块1501,第一图像变换模块1502和第一图像组合模块1503。
第一图像获取模块1501,用于基于待处理图像,获取第一解析图像和第一姿态图像,第一解析图像为标注有待处理图像中对象的各部位的图像,第一姿态图像用于表示对象在待处理图像中的姿态。
第一图像变换模块1502,用于将第一解析图像、第一姿态图像和用于表示目标姿态的第二姿态图像输入第一图像生成模型,由第一图像生成模型确定第一变换参数,基于第一变换参数对第一解析图像进行调整,得到目标解析图像,目标解析图像中对象的姿态为目标姿态,第一变换参数为第一姿态图像变换到第二姿态图像的变换参数。
第一图像组合模块1503,用于组合待处理图像和第一解析图像,得到第一组合图像。组合第二姿态图像和目标解析图像,得到第二组合图像。
第一图像变换模块1502,用于将第一组合图像和第二组合图像输入第二图像生成模型,由第二图像生成模型确定第二变换参数,基于第二变换参数和第二组合图像对第一组合图像进行调整,得到目标图像,目标图像中对象的姿态为目标姿态,第二变换参数为第一解析图像变换到目标解析图像的变换参数。
在另一种可选的实现方式中,第一图像变换模块1502,用于将第一姿态图像和第二姿态图形输入第一卷积神经网络,确定第一变换参数。由第一图像生成模型对第一解析图像进行编码,得到第一编码图像,对第一姿态图像进行编码得到第二编码图像。基于第一变换参数,将第一编码图像变换为第三编码图像。对第二编码图像和第三编码图像进行残差处理,得到第四编码图像。对第四编码图像进行解码。
在另一种可选的实现方式中,第一图像变换模块1502,用于基于第一变换参数,生成第一网格图,第一网格图中顶点的坐标用于指示顶点在第一编码图像中对应的位置。根据第一网格图中顶点的坐标,将第一编码图像中的像素点变换到第一网格图中对应的顶点上,得到第三编码图像。
在另一种可选的实现方式中,第一图像变换模块1502,用于将第一解析图像和目标解析图像输入第二卷积神经网络,确定第二变换参数。由第二图像生成模型对第一组合图像进行编码,得到第五编码图像,对第二组合图像进行编码,得到第六编码图像。基于第二变换参数,将第五编码图像变换为第七编码图像。对第六编码图像和第七编码图像进行残差处理,得到第八编码图像。对第八编码图像进行解码。
在另一种可选的实现方式中,第一图像变换模块1502,用于基于第二变换参数,生成第二网格图,第二网格图中顶点的坐标用于指示顶点在第五编码图像中对应的位置。根据第二网格图中顶点的坐标,将第五编码图像中的像素点变换到第二网格图中对应的顶点上,得到第七编码图像。
在另一种可选的实现方式中,装置还包括模型训练模块,用于基于第一样本图像,获取第一样本解析图像和第一样本姿态图像,第一样本图像为多个样本图像中的任一样本图像,第一样本解析图像为标注有第一样本图像中对象的各部位的图像,第一样本姿态图像用于表示对象在第一样本图像中的姿态。基于第二样本图像,获取第二样本解析图像和第二样本姿态图像,第二样本图像为与第一样本图像包括同一对象的目标图像,第二样本解析图像为标注有第二样本图像中对象的各部位的图像,第二样本姿态图像用于表示对象在第二样本图像中的姿态。将第一解析图像、第一样本姿态图像和第二样本姿态图像输入待训练的第一模型,由第一模型输出第三样本解析图像。对第二样本解析图像和第三样本解析图像进行一致性检测,根据检测结果调整第一模型的第一训练参数,直到得到第一图像生成模型。
在另一种可选的实现方式中,模型训练模块,还用于组合第一样本图像和第一样本解析图像,得到第一样本组合图像。组合第三样本解析图像和第二样本姿态图像,得到第二样本组合图像。将第一样本组合图像和第二样本组合图像输入待训练的第二模型,由第二模型输出训练结果图像。对训练结果图像和第二样本图像进行一致性检测,根据检测结果调整第二模型的第二训练参数,直到得到第二图像生成模型。
在另一种可选的实现方式中,模型训练模块,还用于对训练结果图像的尺寸进行调整为,得到多个尺寸的训练结果图像。将多个尺寸的训练结果图像分别与第二样本图像进行一致性检测。
在本申请实施例中,通过第一图像生成模型确定第一变换参数,基于该第一变换参数对第一解析图像进行调整,使得该第一解析图像和生成的目标解析图像之间姿态对齐。通过第二图像生成模型,根据第一图像生成模型得到的目标解析图像,来确定第二变换参数,基于该第二变换参数对组合后的待处理图像和第一解析图像进行调整,使得待处理图像和生成的 目标图像之间像素对齐,具有更好的图像细节。由于变换前后解析图像保持姿态对齐,可以使变换前后的图像保持空间对齐,从而使得最终生成的目标图像既保证了空间对齐又保证了细节清晰。
图16是本申请实施例提供的一种人体姿态变换装置的框图,如图16所示,包括:第二图像获取模块1601,第二图像变换模块1602和第二图像组合模块1603。
第二图像获取模块1601,用于基于第一人体图像,获取第二解析图像和第三姿态图像,第二解析图像为标注有第一人体图像中人体的各部位的图像,第三姿态图像用于表示人体在第一人体图像中的姿态。
第二图像变换模块1602,用于确定第三变换参数,基于第三变换参数对第二解析图像进行调整,得到第三解析图像,第三解析图像中人体的各部位的姿态为目标人体姿态,第三变换参数为第三姿态图像变换到用于表示目标人体姿态的第四姿态图像的变换参数。
第二图像组合模块1603,用于组合第一人体图像和第二解析图像,得到第三组合图像。组合第四姿态图像和第三解析图像,得到第四组合图像。
第二图像变换模块1602,还用于确定第四变换参数,基于第四变换参数和第四组合图像对第三组合图像进行调整,得到第二人体图像,第二人体图像中的人体的姿态为目标人体姿态,第四变换参数为第二解析图像变换到第三解析图像的变换参数。
在本申请实施例中,通过确定第三变换参数,基于该第三变换参数对第二解析图像进行调整,使得该第二解析图像和生成的第三解析图像之间姿态对齐。通过生成的第三解析图像,来确定第四变换参数,基于该第四变换参数对组合后的第一人体图像和第二解析图像进行调整,使得第一人体图像和生成的第二人体图像之间像素对齐,具有更好的图像细节。由于变换前后解析图像保持姿态对齐,可以使变换前后的图像保持空间对齐,从而使得最终生成的第二人体图像既保证了空间对齐又保证了细节清晰。
图17是本申请实施例提供的一种服务器的结构示意图,该服务器1700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)1701和一个或一个以上的存储器1702,其中,存储器1702中存储有至少一条指令,至少一条指令由处理器1701加载以执行下述步骤。
基于待处理图像,获取第一解析图像和第一姿态图像,第一解析图像为标注有待处理图像中对象的各部位的图像,第一姿态图像用于表示对象在待处理图像中的姿态。
将第一解析图像、第一姿态图像和用于表示目标姿态的第二姿态图像输入第一图像生成模型,由第一图像生成模型确定第一变换参数,基于第一变换参数对第一解析图像进行调整,得到目标解析图像,目标解析图像中对象的姿态为目标姿态,第一变换参数为第一姿态图像变换到第二姿态图像的变换参数。
组合待处理图像和第一解析图像,得到第一组合图像。组合第二姿态图像和目标解析图像,得到第二组合图像。
将第一组合图像和第二组合图像输入第二图像生成模型,由第二图像生成模型确定第二变换参数,基于第二变换参数和第二组合图像,对第一组合图像进行调整,得到目标图像,目标图像中对象的姿态为目标姿态,第二变换参数为第一解析图像变换到目标解析图像的变 换参数。
在一种可选的实施方式中,处理器1701还能够执行下述步骤:
将第一姿态图像和第二姿态图形输入第一卷积神经网络,确定第一变换参数。
由第一图像生成模型对第一解析图像进行编码,得到第一编码图像,对第一姿态图像进行编码,得到第二编码图像。
基于第一变换参数,将第一编码图像变换为第三编码图像。
对第二编码图像和第三编码图像进行残差处理,得到第四编码图像。
对第四编码图像进行解码。
在一种可选的实施方式中,处理器1701还能够执行下述步骤:
基于第一变换参数,生成第一网格图,第一网格图中顶点的坐标用于指示顶点在第一编码图像中的位置。
根据第一网格图中顶点的坐标,将第一编码图像中的像素点变换到第一网格图中对应的顶点上,得到第三编码图像。
在一种可选的实施方式中,处理器1701还能够执行下述步骤:
将第一解析图像和目标解析图像输入第二卷积神经网络,确定第二变换参数。
由第二图像生成模型对第一组合图像进行编码,得到第五编码图像,对第二组合图像进行编码,得到第六编码图像。
基于第二变换参数,将第五编码图像变换为第七编码图像。
对第六编码图像和第七编码图像进行残差处理,得到第八编码图像。
对第八编码图像进行解码。
在一种可选的实施方式中,处理器1701还能够执行下述步骤:
基于第二变换参数,生成第二网格图,第二网格图中顶点的坐标用于指示顶点在第五编码图像中对应的位置。
根据第二网格图中顶点的坐标,将第五编码图像中的像素点变换到第二网格图中对应的顶点上,得到第七编码图像。
在一种可选的实施方式中,处理器1701还能够执行下述步骤:
基于第一样本图像,获取第一样本解析图像和第一样本姿态图像,第一样本图像为多个样本图像中的任一样本图像,第一样本解析图像为标注有第一样本图像中对象的各部位的图像,第一样本姿态图像用于表示对象在第一样本图像中的姿态。
基于第二样本图像,获取第二样本解析图像和第二样本姿态图像,第二样本图像为与第一样本图像包括同一对象的图像,第二样本解析图像为标注有第二样本图像中对象的各部位的图像,第二样本姿态图像用于表示对象在第二样本图像中的姿态。
将第一解析图像、第一样本姿态图像和第二样本姿态图像输入待训练的第一模型,由第一模型输出第三样本解析图像。
对第二样本解析图像和第三样本解析图像进行一致性检测,根据检测结果调整第一模型的第一训练参数,直到得到第一图像生成模型。
在一种可选的实施方式中,处理器1701还能够执行下述步骤:
组合第一样本图像和第一样本解析图像组合,第一样本组合图像。组合第三样本解析图像和第二样本姿态图像,得到第二样本组合图像。
将第一样本组合图像和第二样本组合图像输入待训练的第二模型,由第二模型输出训练结果图像。
对训练结果图像和第二样本图像进行一致性检测,根据检测结果调整第二模型的第二训练参数,直到得到第二图像生成模型。
在一种可选的实施方式中,处理器1701还能够执行下述步骤:
对训练结果图像的尺寸进行调整,得到多个尺寸的训练结果图像。
将多个尺寸的训练结果图像分别与第二样本图像进行一致性检测。
图18是本申请实施例提供的一种服务器的结构示意图,该服务器1800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)1801和一个或一个以上的存储器1802,其中,存储器1802中存储有至少一条指令,至少一条指令由处理器1801加载以执行下述步骤。
基于第一人体图像,获取第二解析图像和第三姿态图像,第二解析图像为标注有第一人体图像中人体的各部位的图像,第三姿态图像用于表示人体在第一人体图像中的姿态。
确定第三变换参数,基于第三变换参数对第二解析图像进行调整,得到第三解析图像,第三解析图像中人体的姿态为目标人体姿态,第三变换参数为第三姿态图像变换到用于表示目标人体姿态的第四姿态图像的变换参数。
组合第一人体图像和第二解析图像,得到第三组合图像。组合第四姿态图像和第三解析图像,得到第四组合图像。
确定第四变换参数,基于第四变换参数和第四组合图像对第三组合图像进行调整,得到第二人体图像,第二人体图像中人体的姿态为目标人体姿态,第四变换参数为第二解析图像变换到第三解析图像的变换参数。
当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本申请实施例还提供了一种存储介质,该存储介质应用于服务器,该存储介质中存储有程序代码,该程序代码由服务器的处理器运行时,能够执行以执行下述步骤。
基于待处理图像,获取第一解析图像和第一姿态图像,第一解析图像为标注有待处理图像中对象的各部位的图像,第一姿态图像用于表示对象在待处理图像中的姿态。
将第一解析图像、第一姿态图像和用于表示目标姿态的第二姿态图像输入第一图像生成模型,由第一图像生成模型确定第一变换参数,基于第一变换参数对第一解析图像进行调整,得到目标解析图像,目标解析图像中对象的姿态为目标姿态,第一变换参数为第一姿态图像变换到第二姿态图像的变换参数。
组合待处理图像和第一解析图像,得到第一组合图像。组合第二姿态图像和目标解析图像,得到第二组合图像。
将第一组合图像和第二组合图像输入第二图像生成模型,由第二图像生成模型确定第二变换参数,基于第二变换参数和第二组合图像,对第一组合图像进行调整,得到目标图像,目标图像中对象的姿态为目标姿态,第二变换参数为第一解析图像变换到目标解析图像的变换参数。
在一种可选的实施方式中,服务器的处理器还能够执行下述步骤:
将第一姿态图像和第二姿态图形输入第一卷积神经网络,确定第一变换参数。
由第一图像生成模型对第一解析图像进行编码,得到第一编码图像,对第一姿态图像进行编码,得到第二编码图像。
基于第一变换参数,将第一编码图像变换为第三编码图像。
对第二编码图像和第三编码图像进行残差处理,得到第四编码图像。
对第四编码图像进行解码。
在一种可选的实施方式中,服务器的处理器还能够执行下述步骤:
基于第一变换参数,生成第一网格图,第一网格图中顶点的坐标用于指示顶点在第一编码图像中的位置。
根据第一网格图中顶点的坐标,将第一编码图像中的像素点变换到第一网格图中对应的顶点上,得到第三编码图像。
在一种可选的实施方式中,服务器的处理器还能够执行下述步骤:
将第一解析图像和目标解析图像输入第二卷积神经网络,确定第二变换参数。
由第二图像生成模型对第一组合图像进行编码,得到第五编码图像,对第二组合图像进行编码,得到第六编码图像。
基于第二变换参数,将第五编码图像变换为第七编码图像。
对第六编码图像和第七编码图像进行残差处理,得到第八编码图像。
对第八编码图像进行解码。
在一种可选的实施方式中,服务器的处理器还能够执行下述步骤:
基于第二变换参数,生成第二网格图,第二网格图中顶点的坐标用于指示顶点在第五编码图像中对应的位置。
根据第二网格图中顶点的坐标,将第五编码图像中的像素点变换到第二网格图中对应的顶点上,得到第七编码图像。
在一种可选的实施方式中,服务器的处理器还能够执行下述步骤:
基于第一样本图像,获取第一样本解析图像和第一样本姿态图像,第一样本图像为多个样本图像中的任一样本图像,第一样本解析图像为标注有第一样本图像中对象的各部位的图像,第一样本姿态图像用于表示对象在第一样本图像中的姿态。
基于第二样本图像,获取第二样本解析图像和第二样本姿态图像,第二样本图像为与第一样本图像包括同一对象的图像,第二样本解析图像为标注有第二样本图像中对象的各部位的图像,第二样本姿态图像用于表示对象在第二样本图像中的姿态。
将第一解析图像、第一样本姿态图像和第二样本姿态图像输入待训练的第一模型,由第一模型输出第三样本解析图像。
对第二样本解析图像和第三样本解析图像进行一致性检测,根据检测结果调整第一模型的第一训练参数,直到得到第一图像生成模型。
在一种可选的实施方式中,服务器的处理器还能够执行下述步骤:
组合第一样本图像和第一样本解析图像组合,第一样本组合图像。组合第三样本解析图像和第二样本姿态图像,得到第二样本组合图像。
将第一样本组合图像和第二样本组合图像输入待训练的第二模型,由第二模型输出训练 结果图像。
对训练结果图像和第二样本图像进行一致性检测,根据检测结果调整第二模型的第二训练参数,直到得到第二图像生成模型。
在一种可选的实施方式中,服务器的处理器还能够执行下述步骤:
对训练结果图像的尺寸进行调整,得到多个尺寸的训练结果图像。
将多个尺寸的训练结果图像分别与第二样本图像进行一致性检测。
本申请实施例还提供了一种存储介质,该存储介质应用于服务器,该存储介质中存储有程序代码,该程序代码由服务器的处理器运行时,能够执行以执行下述步骤。
基于第一人体图像,获取第二解析图像和第三姿态图像,第二解析图像为标注有第一人体图像中人体的各部位的图像,第三姿态图像用于表示人体在第一人体图像中的姿态。
确定第三变换参数,基于第三变换参数对第二解析图像进行调整,得到第三解析图像,第三解析图像中人体的姿态为目标人体姿态,第三变换参数为第三姿态图像变换到用于表示目标人体姿态的第四姿态图像的变换参数。
组合第一人体图像和第二解析图像,得到第三组合图像。组合第四姿态图像和第三解析图像,得到第四组合图像。
确定第四变换参数,基于第四变换参数和第四组合图像对第三组合图像进行调整,得到第二人体图像,第二人体图像中人体的姿态为目标人体姿态,第四变换参数为第二解析图像变换到第三解析图像的变换参数。
当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (24)

  1. 一种目标图像生成方法,所述方法包括:
    基于待处理图像,获取第一解析图像和第一姿态图像,所述第一解析图像为标注有所述待处理图像中对象的各部位的图像,所述第一姿态图像用于表示所述对象在所述待处理图像中的姿态;
    将所述第一解析图像、所述第一姿态图像和用于表示目标姿态的第二姿态图像输入第一图像生成模型,由所述第一图像生成模型确定第一变换参数,基于所述第一变换参数对所述第一解析图像进行调整,得到目标解析图像,所述目标解析图像中所述对象的姿态为所述目标姿态,所述第一变换参数为所述第一姿态图像变换到所述第二姿态图像的变换参数;
    组合所述待处理图像和所述第一解析图像,得到第一组合图像;组合所述第二姿态图像和所述目标解析图像,得到第二组合图像;
    将所述第一组合图像和所述第二组合图像输入第二图像生成模型,由所述第二图像生成模型确定第二变换参数,基于所述第二变换参数和所述第二组合图像,对所述第一组合图像进行调整,得到目标图像,所述目标图像中对象的姿态为所述目标姿态,所述第二变换参数为所述第一解析图像变换到所述目标解析图像的变换参数。
  2. 根据权利要求1所述的方法,其中,所述由所述第一图像生成模型确定第一变换参数,基于所述第一变换参数对所述第一解析图像进行调整包括:
    将所述第一姿态图像和所述第二姿态图形输入第一卷积神经网络,确定所述第一变换参数;
    由所述第一图像生成模型对所述第一解析图像进行编码,得到第一编码图像,对所述第一姿态图像进行编码,得到第二编码图像;
    基于所述第一变换参数,将所述第一编码图像变换为第三编码图像;
    对所述第二编码图像和所述第三编码图像进行残差处理,得到第四编码图像;
    对所述第四编码图像进行解码。
  3. 根据权利要求2所述的方法,其中,所述基于所述第一变换参数,将所述第一编码图像变换为第三编码图像,包括:
    基于所述第一变换参数,生成第一网格图,所述第一网格图中顶点的坐标用于指示所述顶点在所述第一编码图像中的位置;
    根据所述第一网格图中顶点的坐标,将所述第一编码图像中的像素点变换到所述第一网格图中对应的顶点上,得到所述第三编码图像。
  4. 根据权利要求1所述的方法,其中,所述由所述第二图像生成模型确定第二变换参数,基于所述第二变换参数对所述第一组合图像进行调整包括:
    将所述第一解析图像和所述目标解析图像输入第二卷积神经网络,确定所述第二变换参数;
    由所述第二图像生成模型对所述第一组合图像进行编码,得到第五编码图像,对所述第 二组合图像进行编码,得到第六编码图像;
    基于所述第二变换参数,将所述第五编码图像变换为第七编码图像;
    对所述第六编码图像和所述第七编码图像进行残差处理,得到第八编码图像;
    对所述第八编码图像进行解码。
  5. 根据权利要求4所述的方法,其中,所述基于所述第二变换参数,将所述第五编码图像变换为第七编码图像,包括:
    基于所述第二变换参数,生成第二网格图,所述第二网格图中顶点的坐标用于指示所述顶点在所述第五编码图像中对应的位置;
    根据所述第二网格图中顶点的坐标,将所述第五编码图像中的像素点变换到所述第二网格图中对应的顶点上,得到所述第七编码图像。
  6. 根据权利要求1-5任一项权利要求所述的方法,其中,所述第一图像生成模型的训练过程包括:
    基于第一样本图像,获取第一样本解析图像和第一样本姿态图像,所述第一样本图像为多个样本图像中的任一样本图像,所述第一样本解析图像为标注有所述第一样本图像中对象的各部位的图像,所述第一样本姿态图像用于表示所述对象在所述第一样本图像中的姿态;
    基于第二样本图像,获取第二样本解析图像和第二样本姿态图像,所述第二样本图像为与所述第一样本图像包括同一对象的图像,所述第二样本解析图像为标注有所述第二样本图像中对象的各部位的图像,所述第二样本姿态图像用于表示所述对象在所述第二样本图像中的姿态;
    将所述第一解析图像、所述第一样本姿态图像和所述第二样本姿态图像输入待训练的第一模型,由所述第一模型输出第三样本解析图像;
    对所述第二样本解析图像和所述第三样本解析图像进行一致性检测,根据检测结果调整所述第一模型的第一训练参数,直到得到所述第一图像生成模型。
  7. 根据权利要求6所述的方法,其中,所述第二图像生成模型的训练过程包括:
    组合所述第一样本图像和所述第一样本解析图像,得到第一样本组合图像;组合所述第三样本解析图像和所述第二样本姿态图像,得到第二样本组合图像;
    将所述第一样本组合图像和所述第二样本组合图像输入待训练的第二模型,由所述第二模型输出训练结果图像;
    对所述训练结果图像和所述第二样本图像进行一致性检测,根据检测结果调整所述第二模型的第二训练参数,直到得到所述第二图像生成模型。
  8. 根据权利要求7所述的方法,其中,所述对所述训练结果图像和所述第二样本图像进行一致性检测,包括:
    对所述训练结果图像的尺寸进行调整,得到多个尺寸的训练结果图像;
    将所述多个尺寸的训练结果图像分别与所述第二样本图像进行一致性检测。
  9. 一种人体姿态变换方法,所述方法包括:
    基于第一人体图像,获取第二解析图像和第三姿态图像,所述第二解析图像为标注有所述第一人体图像中人体的各部位的图像,所述第三姿态图像用于表示所述人体在所述第一人体图像中的姿态;
    确定第三变换参数,基于所述第三变换参数对所述第二解析图像进行调整,得到第三解析图像,所述第三解析图像中所述人体的姿态为所述目标人体姿态,所述第三变换参数为所述第三姿态图像变换到用于表示目标人体姿态的第四姿态图像的变换参数;
    组合所述第一人体图像和所述第二解析图像,得到第三组合图像;组合所述第四姿态图像和所述第三解析图像,得到第四组合图像;
    确定第四变换参数,基于所述第四变换参数和所述第四组合图像对所述第三组合图像进行调整,得到第二人体图像,所述第二人体图像中人体的姿态为所述目标人体姿态,所述第四变换参数为所述第二解析图像变换到所述第三解析图像的变换参数。
  10. 一种目标图像生成装置,其中,所述装置包括:
    第一图像获取模块,用于基于待处理图像,获取第一解析图像和第一姿态图像,所述第一解析图像为标注有所述待处理图像中对象的各部位的图像,所述第一姿态图像用于表示所述对象在所述待处理图像中的姿态;
    第一图像变换模块,用于将所述第一解析图像、所述第一姿态图像和用于表示目标姿态的第二姿态图像输入第一图像生成模型,由所述第一图像生成模型确定第一变换参数,基于所述第一变换参数对所述第一解析图像进行调整,得到目标解析图像,所述目标解析图像中所述对象的姿态为所述目标姿态,所述第一变换参数为所述第一姿态图像变换到所述第二姿态图像的变换参数;
    第一图像组合模块,用于组合所述待处理图像和所述第一解析图像,得到第一组合图像;组合所述第二姿态图像和所述目标解析图像,得到第二组合图像;
    所述第一图像变换模块,还用于将所述第一组合图像和所述第二组合图像输入第二图像生成模型,由所述第二图像生成模型确定第二变换参数,基于所述第二变换参数和所述第二组合图像,对所述第一组合图像进行调整,得到目标图像,所述目标图像中对象的姿态为所述目标姿态,所述第二变换参数为所述第一解析图像变换到所述目标解析图像的变换参数。
  11. 根据权利要求10所述的装置,其中,所述第一图像变换模块,用于将所述第一姿态图像和所述第二姿态图形输入第一卷积神经网络,确定所述第一变换参数;由所述第一图像生成模型对所述第一解析图像进行编码,得到第一编码图像,对所述第一姿态图像进行编码得到第二编码图像;基于所述第一变换参数,将所述第一编码图像变换为第三编码图像;对所述第二编码图像和所述第三编码图像进行残差处理,得到第四编码图像;对所述第四编码图像进行解码。
  12. 根据权利要求11所述的装置,其中,所述第一图像变换模块,用于基于所述第一变换参数,生成第一网格图,所述第一网格图中每个顶点的坐标用于指示所述顶点在所述第一编码图像中对应的位置;根据所述第一网格图中顶点的坐标,将所述第一编码图像中的像素 点变换到所述第一网格图中对应的顶点上,得到所述第三编码图像。
  13. 一种人体姿态变换装置,所述装置包括:
    第二图像获取模块,用于基于第一人体图像,获取第二解析图像和第三姿态图像,所述第二解析图像为标注有所述第一人体图像中人体的各部位的图像,所述第三姿态图像用于表示所述人体在所述第一人体图像中的姿态;
    第二图像变换模块,用于确定第三变换参数,基于所述第三变换参数对所述第二解析图像进行调整,得到第三解析图像,所述第三解析图像中所述人体的姿态为所述目标人体姿态,所述第三变换参数为所述第三姿态图像变换到用于表示目标人体姿态的第四姿态图像的变换参数;
    第二图像组合模块,用于组合所述第一人体图像和所述第二解析图像,得到第三组合图像;组合所述第四姿态图像和所述第三解析图像,得到第四组合图像;
    所述第二图像变换模块,还用于确定第四变换参数,基于所述第四变换参数和所述第四组合图像对所述第三组合图像进行调整,得到第二人体图像,所述第二人体图像中人体的姿态为所述目标人体姿态,所述第四变换参数为所述第二解析图像变换到所述第三解析图像的变换参数。
  14. 一种服务器,所述服务器包括处理器和存储器,所述存储器用于存储程序代码,所述处理器用于运行所述存储器中的程序代码,执行如下步骤:
    基于待处理图像,获取第一解析图像和第一姿态图像,所述第一解析图像为标注有所述待处理图像中对象的各部位的图像,所述第一姿态图像用于表示所述对象在所述待处理图像中的姿态;
    将所述第一解析图像、所述第一姿态图像和用于表示目标姿态的第二姿态图像输入第一图像生成模型,由所述第一图像生成模型确定第一变换参数,基于所述第一变换参数对所述第一解析图像进行调整,得到目标解析图像,所述目标解析图像中所述对象的姿态为所述目标姿态,所述第一变换参数为所述第一姿态图像变换到所述第二姿态图像的变换参数;
    组合所述待处理图像和所述第一解析图像,得到第一组合图像;组合所述第二姿态图像和所述目标解析图像,得到第二组合图像;
    将所述第一组合图像和所述第二组合图像输入第二图像生成模型,由所述第二图像生成模型确定第二变换参数,基于所述第二变换参数和所述第二组合图像,对所述第一组合图像进行调整,得到目标图像,所述目标图像中对象的姿态为所述目标姿态,所述第二变换参数为所述第一解析图像变换到所述目标解析图像的变换参数。
  15. 根据权利要求14所述的服务器,其中,所述处理器用于执行以下步骤:
    将所述第一姿态图像和所述第二姿态图形输入第一卷积神经网络,确定所述第一变换参数;
    由所述第一图像生成模型对所述第一解析图像进行编码,得到第一编码图像,对所述第一姿态图像进行编码得到第二编码图像;
    基于所述第一变换参数,将所述第一编码图像变换为第三编码图像;
    对所述第二编码图像和所述第三编码图像进行残差处理,得到第四编码图像;
    对所述第四编码图像进行解码。
  16. 根据权利要求15所述的服务器,其中,所述处理器用于执行以下步骤:
    基于所述第一变换参数,生成第一网格图,所述第一网格图中顶点的坐标用于指示所述顶点在所述第一编码图像中的位置;
    根据所述第一网格图中顶点的坐标,将所述第一编码图像中的像素点变换到所述第一网格图中对应的顶点上,得到所述第三编码图像。
  17. 根据权利要求14所述的服务器,其中,所述处理器用于执行以下步骤:
    将所述第一解析图像和所述目标解析图像输入第二卷积神经网络,确定所述第二变换参数;
    由所述第二图像生成模型对所述第一组合图像进行编码,得到第五编码图像,对所述第二组合图像进行编码,得到第六编码图像;
    基于所述第二变换参数,将所述第五编码图像变换为第七编码图像;
    对所述第六编码图像和所述第七编码图像进行残差处理,得到第八编码图像;
    对所述第八编码图像进行解码。
  18. 根据权利要求17所述的服务器,其中,所述处理器用于执行以下步骤:
    基于所述第二变换参数,生成第二网格图,所述第二网格图中顶点的坐标用于指示所述顶点在所述第五编码图像中对应的位置;
    根据所述第二网格图中顶点的坐标,将所述第五编码图像中的像素点变换到所述第二网格图中对应的顶点上,得到所述第七编码图像。
  19. 根据权利要求14-18任一项权利要求所述的服务器,其中,所述处理器用于执行以下步骤:
    基于第一样本图像,获取第一样本解析图像和第一样本姿态图像,所述第一样本图像为多个样本图像中的任一样本图像,所述第一样本解析图像为标注有所述第一样本图像中对象的各部位的图像,所述第一样本姿态图像用于表示所述对象在所述第一样本图像中的姿态;
    基于第二样本图像,获取第二样本解析图像和第二样本姿态图像,所述第二样本图像为与所述第一样本图像包括同一对象的图像,所述第二样本解析图像为标注有所述第二样本图像中对象的各部位的图像,所述第二样本姿态图像用于表示所述对象在所述第二样本图像中的姿态;
    将所述第一解析图像、所述第一样本姿态图像和所述第二样本姿态图像输入待训练的第一模型,由所述第一模型输出第三样本解析图像;
    对所述第二样本解析图像和所述第三样本解析图像进行一致性检测,根据检测结果调整所述第一模型的第一训练参数,直到得到所述第一图像生成模型。
  20. 根据权利要求19所述的服务器,其中,所述处理器用于执行以下步骤:
    将所述第一样本图像和所述第一样本解析图像组合得到第一样本组合图像,将所述第三样本解析图像和所述第二样本姿态图像组合得到第二样本组合图像;
    将所述第一样本组合图像和所述第二样本组合图像输入待训练的第二模型,由所述第二模型输出训练结果图像;
    对所述训练结果图像和所述第二样本图像进行一致性检测,根据检测结果调整所述第二模型的第二训练参数,直到得到所述第二图像生成模型。
  21. 根据权利要求20所述的服务器,其中,所述处理器用于执行以下步骤:
    对所述训练结果图像的尺寸进行调整,得到多个尺寸的训练结果图像;
    将所述多个尺寸的训练结果图像分别与所述第二样本图像进行一致性检测。
  22. 一种服务器,所述服务器包括处理器和存储器,所述存储器用于存储程序代码,所述处理器用于运行所述存储器中的程序代码,执行如下步骤:
    基于第一人体图像,获取第二解析图像和第三姿态图像,所述第二解析图像为标注有所述第一人体图像中人体的各部位的图像,所述第三姿态图像用于表示所述人体在所述第一人体图像中的姿态;
    确定第三变换参数,基于所述第三变换参数对所述第二解析图像进行调整,得到第三解析图像,所述第三解析图像中所述人体的姿态为所述目标人体姿态,所述第三变换参数为所述第三姿态图像变换到用于表示目标人体姿态的第四姿态图像的变换参数;
    组合所述第一人体图像和所述第二解析图像,得到第三组合图像;组合所述第四姿态图像和所述第三解析图像,得到第四组合图像;
    确定第四变换参数,基于所述第四变换参数和所述第四组合图像对所述第三组合图像进行调整,得到第二人体图像,所述第二人体图像中人体的姿态为所述目标人体姿态,所述第四变换参数为所述第二解析图像变换到所述第三解析图像的变换参数。
  23. 一种存储介质,所述存储介质用于存储程序代码,所述程序代码被处理器加载时,使得所述处理器执行如下步骤:
    基于待处理图像,获取第一解析图像和第一姿态图像,所述第一解析图像为标注有所述待处理图像中对象的各部位的图像,所述第一姿态图像用于表示所述对象在所述待处理图像中的姿态;
    将所述第一解析图像、所述第一姿态图像和用于表示目标姿态的第二姿态图像输入第一图像生成模型,由所述第一图像生成模型确定第一变换参数,基于所述第一变换参数对所述第一解析图像进行调整,得到目标解析图像,所述目标解析图像中所述对象的姿态为所述目标姿态,所述第一变换参数为所述第一姿态图像变换到所述第二姿态图像的变换参数;
    组合所述待处理图像和所述第一解析图像,得到第一组合图像;组合所述第二姿态图像和所述目标解析图像,得到第二组合图像;
    将所述第一组合图像和所述第二组合图像输入第二图像生成模型,由所述第二图像生成模型确定第二变换参数,基于所述第二变换参数和所述第二组合图像,对所述第一组合图像进行调整,得到目标图像,所述目标图像中对象的姿态为所述目标姿态,所述第二变换参数 为所述第一解析图像变换到所述目标解析图像的变换参数。
  24. 一种存储介质,所述存储介质用于存储程序代码,所述程序代码被处理器加载时,使得所述处理器执行如下步骤:
    基于第一人体图像,获取第二解析图像和第三姿态图像,所述第二解析图像为标注有所述第一人体图像中人体的各部位的图像,所述第三姿态图像用于表示所述人体在所述第一人体图像中的姿态;
    确定第三变换参数,基于所述第三变换参数对所述第二解析图像进行调整,得到第三解析图像,所述第三解析图像中所述人体的姿态为所述目标人体姿态,所述第三变换参数为所述第三姿态图像变换到用于表示目标人体姿态的第四姿态图像的变换参数;
    组合所述第一人体图像和所述第二解析图像,得到第三组合图像;组合所述第四姿态图像和所述第三解析图像,得到第四组合图像;
    确定第四变换参数,基于所述第四变换参数和所述第四组合图像对所述第三组合图像进行调整,得到第二人体图像,所述第二人体图像中人体的姿态为所述目标人体姿态,所述第四变换参数为所述第二解析图像变换到所述第三解析图像的变换参数。
PCT/CN2020/115678 2019-09-17 2020-09-16 目标图像生成方法、装置、服务器及存储介质 WO2021052375A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/534,370 US20220084163A1 (en) 2019-09-17 2021-11-23 Target image generation method and apparatus, server, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910875771.8 2019-09-17
CN201910875771.8A CN110599395B (zh) 2019-09-17 2019-09-17 目标图像生成方法、装置、服务器及存储介质

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/534,370 Continuation US20220084163A1 (en) 2019-09-17 2021-11-23 Target image generation method and apparatus, server, and storage medium

Publications (1)

Publication Number Publication Date
WO2021052375A1 true WO2021052375A1 (zh) 2021-03-25

Family

ID=68860078

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2020/115678 WO2021052375A1 (zh) 2019-09-17 2020-09-16 目标图像生成方法、装置、服务器及存储介质

Country Status (3)

Country Link
US (1) US20220084163A1 (zh)
CN (1) CN110599395B (zh)
WO (1) WO2021052375A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113674140A (zh) * 2021-08-20 2021-11-19 燕山大学 一种物理对抗样本生成方法及系统
WO2022200678A1 (en) * 2021-03-26 2022-09-29 Nokia Technologies Oy A method, an apparatus and a computer program product for creating animated 3d models

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977847B (zh) * 2019-03-22 2021-07-16 北京市商汤科技开发有限公司 图像生成方法及装置、电子设备和存储介质
KR20210070029A (ko) * 2019-12-04 2021-06-14 삼성전자주식회사 반복적 생성을 통해 출력 콘텐트를 향상시키기 위한 디바이스, 방법, 및 프로그램
JP7446903B2 (ja) * 2020-04-23 2024-03-11 株式会社日立製作所 画像処理装置、画像処理方法及び画像処理システム
SG10202004550UA (en) * 2020-05-15 2021-12-30 Yitu Pte Ltd A method, a device and a computer-readable storage medium for face frontalization
CN111739115B (zh) * 2020-06-23 2021-03-16 中国科学院自动化研究所 基于循环一致性的无监督人体姿态迁移方法、系统及装置
CN112184542A (zh) * 2020-07-17 2021-01-05 湖南大学 姿势导引的风格保持人体图像生成方法
US11971953B2 (en) * 2021-02-02 2024-04-30 Inait Sa Machine annotation of photographic images
CN112634444B (zh) * 2021-03-10 2021-11-09 北京创新智源科技有限公司 一种基于三维信息的人体姿态迁移方法、装置、存储介质及终端
CN115239943A (zh) * 2022-09-23 2022-10-25 杭州医策科技有限公司 图像矫正模型的训练方法及切片图像的色彩矫正方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104700076A (zh) * 2015-02-13 2015-06-10 电子科技大学 人脸图像虚拟样本生成方法
CN108564119A (zh) * 2018-04-04 2018-09-21 华中科技大学 一种任意姿态行人图片生成方法
EP3493104A1 (en) * 2017-12-03 2019-06-05 Facebook, Inc. Optimizations for dynamic object instance detection, segmentation, and structure mapping
CN109951654A (zh) * 2019-03-06 2019-06-28 腾讯科技(深圳)有限公司 一种视频合成的方法、模型训练的方法以及相关装置
CN110189248A (zh) * 2019-05-16 2019-08-30 腾讯科技(深圳)有限公司 图像融合方法及装置、存储介质、电子设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10515429B2 (en) * 2016-07-01 2019-12-24 Digimarc Corporation Image-based pose determination
JP2018132855A (ja) * 2017-02-14 2018-08-23 国立大学法人電気通信大学 画像スタイル変換装置、画像スタイル変換方法および画像スタイル変換プログラム
US10380413B2 (en) * 2017-07-13 2019-08-13 Robert Bosch Gmbh System and method for pose-invariant face alignment
JP6856936B2 (ja) * 2017-12-04 2021-04-14 アセントロボティクス株式会社 学習方法、学習装置及び学習プログラム
CN108876814B (zh) * 2018-01-11 2021-05-28 南京大学 一种生成姿态流图像的方法
CN108319932B (zh) * 2018-03-12 2021-12-07 中山大学 一种基于生成式对抗网络的多图像人脸对齐的方法及装置
CN108776983A (zh) * 2018-05-31 2018-11-09 北京市商汤科技开发有限公司 基于重建网络的人脸重建方法和装置、设备、介质、产品
CN109191366B (zh) * 2018-07-12 2020-12-01 中国科学院自动化研究所 基于人体姿态的多视角人体图像合成方法及装置
CN109712068A (zh) * 2018-12-21 2019-05-03 云南大学 用于葫芦烙画的图像风格迁移与模拟方法
CN110163082A (zh) * 2019-04-02 2019-08-23 腾讯科技(深圳)有限公司 一种图像识别网络模型训练方法、图像识别方法及装置
CN110059602B (zh) * 2019-04-10 2022-03-15 武汉大学 一种基于正投影特征变换的俯视人脸矫正方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104700076A (zh) * 2015-02-13 2015-06-10 电子科技大学 人脸图像虚拟样本生成方法
EP3493104A1 (en) * 2017-12-03 2019-06-05 Facebook, Inc. Optimizations for dynamic object instance detection, segmentation, and structure mapping
CN108564119A (zh) * 2018-04-04 2018-09-21 华中科技大学 一种任意姿态行人图片生成方法
CN109951654A (zh) * 2019-03-06 2019-06-28 腾讯科技(深圳)有限公司 一种视频合成的方法、模型训练的方法以及相关装置
CN110189248A (zh) * 2019-05-16 2019-08-30 腾讯科技(深圳)有限公司 图像融合方法及装置、存储介质、电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LI YINING; HUANG CHEN; LOY CHEN CHANGE: "Dense Intrinsic Appearance Flow for Human Pose Transfer", 2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), IEEE, 15 June 2019 (2019-06-15), pages 3688 - 3697, XP033686921, DOI: 10.1109/CVPR.2019.00381 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022200678A1 (en) * 2021-03-26 2022-09-29 Nokia Technologies Oy A method, an apparatus and a computer program product for creating animated 3d models
CN113674140A (zh) * 2021-08-20 2021-11-19 燕山大学 一种物理对抗样本生成方法及系统
CN113674140B (zh) * 2021-08-20 2023-09-26 燕山大学 一种物理对抗样本生成方法及系统

Also Published As

Publication number Publication date
CN110599395A (zh) 2019-12-20
CN110599395B (zh) 2023-05-12
US20220084163A1 (en) 2022-03-17

Similar Documents

Publication Publication Date Title
WO2021052375A1 (zh) 目标图像生成方法、装置、服务器及存储介质
TWI779970B (zh) 圖像處理方法、處理器、電子設備與電腦可讀存儲介質
WO2021175050A1 (zh) 三维重建方法和三维重建装置
WO2020103700A1 (zh) 一种基于微表情的图像识别方法、装置以及相关设备
CN112037320B (zh) 一种图像处理方法、装置、设备以及计算机可读存储介质
CN106682632B (zh) 用于处理人脸图像的方法和装置
WO2020078119A1 (zh) 模拟用户穿戴服装饰品的方法、装置和系统
WO2023040679A1 (zh) 人脸图片的融合方法、装置、设备及存储介质
CN113688907B (zh) 模型训练、视频处理方法,装置,设备以及存储介质
JP2016085579A (ja) 対話装置のための画像処理装置及び方法、並びに対話装置
CN108388889B (zh) 用于分析人脸图像的方法和装置
CN113705290A (zh) 图像处理方法、装置、计算机设备和存储介质
CN112528902B (zh) 一种基于3d人脸模型的视频监控动态人脸识别方法及装置
CN115330947A (zh) 三维人脸重建方法及其装置、设备、介质、产品
CN114648613A (zh) 基于可变形神经辐射场的三维头部模型重建方法及装置
CN111754622B (zh) 脸部三维图像生成方法及相关设备
CN114187165A (zh) 图像处理方法和装置
Lan et al. The application of 3D morphable model (3DMM) for real-time visualization of acupoints on a smartphone
CN111862278A (zh) 一种动画获得方法、装置、电子设备及存储介质
Yang et al. S3Net: A single stream structure for depth guided image relighting
Potje et al. Extracting deformation-aware local features by learning to deform
Wang et al. Digital twin: Acquiring high-fidelity 3D avatar from a single image
CN116740261A (zh) 图像重建方法和装置、图像重建模型的训练方法和装置
CN110516598A (zh) 用于生成图像的方法和装置
CN111325252B (zh) 图像处理方法、装置、设备、介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20864825

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20864825

Country of ref document: EP

Kind code of ref document: A1