CN113496506A - 图像处理方法、装置、设备及存储介质 - Google Patents

图像处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113496506A
CN113496506A CN202010250999.0A CN202010250999A CN113496506A CN 113496506 A CN113496506 A CN 113496506A CN 202010250999 A CN202010250999 A CN 202010250999A CN 113496506 A CN113496506 A CN 113496506A
Authority
CN
China
Prior art keywords
face
image frame
motion
face image
parameter set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010250999.0A
Other languages
English (en)
Inventor
华路延
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Technology Co Ltd
Original Assignee
Guangzhou Huya Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Technology Co Ltd filed Critical Guangzhou Huya Technology Co Ltd
Priority to CN202010250999.0A priority Critical patent/CN113496506A/zh
Publication of CN113496506A publication Critical patent/CN113496506A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • G06T5/70
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture

Abstract

本发明实施例公开了一种图像处理方法、装置、设备及存储介质。该方法包括:根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集;将所述运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对所述运动纹理图像进行图像模糊处理;根据模糊后图像生成运动特征调整参数集,并根据所述运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧。本发明实施例的技术方案,实现了在被驱动人脸图像跟随驱动人脸图像进行相应的人脸表情调整时,可以避免调整后的被驱动人脸图像中的人脸扭曲变形。

Description

图像处理方法、装置、设备及存储介质
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及一种图像处理方法、装置、设备及存储介质。
背景技术
随着社会的发展,诸如手机、平板电脑等电子设备已经广泛应用在学习、娱乐、工作等方面,很多电子设备中都配置有摄像头,用于拍照、录像、直播等操作。在摄像头的图像数据包含人脸时,还可以使静态的虚拟人脸图像跟随人脸的表情变换实现各种动作效果。
目前,可以根据驱动人脸图像中的人脸关键点与虚拟人脸图像中的虚拟人脸关键点之间的位置对应关系,使得各虚拟人脸关键点跟随各人脸关键点进行相应的变化,实现虚拟人脸图像跟随驱动人脸图像进行相应的表情变换。
发明人在实现本发明的过程中,发现现有技术存在如下缺陷:在驱动人脸以及与驱动人脸对应的虚拟人脸中,如果有部分人脸关键点之间的位置比较接近,则当驱动人脸发生表情变化时,虚拟人脸图像中位置较近的虚拟人脸关键点在相应调整后会产生位置重叠,导致被驱动后的虚拟人脸图像中的人脸变形扭曲。
发明内容
本发明实施例提供一种图像处理方法、装置、设备及存储介质,实现了在被驱动人脸图像跟随驱动人脸图像进行相应的人脸表情调整时,可以避免调整后的被驱动人脸图像中的人脸扭曲变形。
第一方面,本发明实施例提供了一种图像处理方法,包括:
根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集;
将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对运动纹理图像进行图像模糊处理;
根据模糊后图像生成运动特征调整参数集,并根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧。
可选的,将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,包括:
获取历史驱动人脸图像帧中的各人脸关键点与纹理图像的片元着色器中像素点之间的位置对应关系;
根据位置对应关系,将与每个人脸关键点对应的运动特征参数,分别映射至纹理图像中,得到运动纹理图像。
可选的,与人脸关键点对应的运动特征参数包括:水平运动变化量和竖直运动变化量;
根据位置对应关系,将与每个人脸关键点对应的运动特征参数,分别映射至纹理图像中,包括:
获取与当前映射的目标人脸关键点对应的目标水平运动变化量和目标竖直运动变化量;
根据位置对应关系,在纹理图像中获取与目标人脸关键点匹配的目标像素点;
将目标像素点的R通道赋值为目标水平运动变化量,G通道赋值为目标竖直运动变化量,B通道赋值为0。
可选的,对运动纹理图像进行图像模糊处理,包括:
使用图像处理器(Graphics Processing Unit,GPU)对运动纹理图像进行高斯卷积操作,得到模糊后图像。
可选的,根据模糊后图像生成运动特征调整参数集,包括:
根据位置对应关系,在模糊后图像中确定与人脸关键点分别对应的各像素点;
根据各像素点R通道和G通道的通道值,生成与各人脸关键点分别对应的运动特征调整参数;
将各运动特征调整参数组合得到运动特征调整参数集。
可选的,在根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集之前,还包括:
确定与当前驱动人脸图像帧、历史驱动人脸图像帧以及历史被驱动人脸图像帧分别对应的目标定点;
根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集,包括:
根据当前驱动人脸图像帧中的各人脸关键点、历史驱动人脸图像帧中的各人脸关键点、与当前驱动人脸图像帧对应的目标定点,以及与历史驱动人脸图像帧对应的目标定点,生成运动特征参数集。
可选的,根据当前驱动人脸图像帧中的各人脸关键点、历史驱动人脸图像帧中的各人脸关键点、与当前驱动人脸图像帧对应的目标定点,以及与历史驱动人脸图像帧对应的目标定点,生成运动特征参数集,包括:
获取当前驱动人脸图像帧中的各人脸关键点与对应目标定点之间的第一位置向量,以及历史驱动人脸图像帧中的各人脸关键点与对应目标定点之间的第二位置向量;
计算各第二位置向量与对应第一位置向量之间的向量差值;
计算各向量差值和人脸缩放比例的乘积,得到与历史驱动人脸图像帧中的各人脸关键点匹配的人脸关键点加速度向量;
将各人脸关键点加速度向量沿着水平方向和竖直方向进行分解,得到各人脸关键点对应的水平运动变化量和竖直运动变化量,作为运动特征参数集。
可选的,根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧,包括:
建立与历史被驱动人脸图像帧匹配的空白图像;
根据运动特征调整参数集,确定历史被驱动人脸图像帧中各原始网格的网格变形方式;其中,历史被驱动人脸图像帧由其中的各人脸关键点划分出的多个原始网格构成;
根据网格变形方式,在空白图像中,划分出与原始网格对应的多个目的变形网格;
根据原始网格与目的变形网格之间的位置对应关系,将原始网格中的各像素点映射至对应的目的变形网格中,得到当前被驱动人脸图像帧。
第二方面,本发明实施例还提供了一种图像处理装置,包括:
运动特征参数集生成模块,用于根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集;
图像模糊处理模块,用于将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对运动纹理图像进行图像模糊处理;
人脸驱动模块,用于根据模糊后图像生成运动特征调整参数集,并根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧。
第三方面,本发明实施例还提供了一种设备,设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明任意实施例提供的图像处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例提供的图像处理方法。
本发明实施例中,根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集,通过将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对运动纹理图像进行图像模糊处理,然后根据模糊后图像生成运动特征调整参数集,并根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧,解决了现有技术中被驱动后的虚拟人脸图像中存在人脸变形扭曲的问题,实现了在被驱动人脸图像跟随驱动人脸图像进行相应的人脸表情调整时,可以避免调整后的被驱动人脸图像中的人脸扭曲变形。
附图说明
图1a是本发明实施例一中的一种图像处理方法的流程图;
图1b是本发明实施例一中的一种人脸关键点的示意图;
图1c是本发明实施例一中的一种人脸关键点的运动特征参数的示意图;
图2a是本发明实施例二中的一种图像处理方法的流程图;
图2b是本发明实施例二中的一种人脸图像中的原始网格的示意图;
图2c是本发明实施例二中的一种人脸图像的眼间距示意图;
图2d是本发明实施例二中的一种人脸定位矩形的示意图;
图3是本发明实施例三中的一种图像处理装置的结构示意图;
图4是本发明实施例四中的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1a是本发明实施例一中的一种图像处理方法的流程图,本实施例可适用于历史被驱动人脸跟随驱动人脸实时进行表情变换的情况,该方法可以由图像处理装置来执行,该装置可以由硬件和/或软件来实现,并一般可以集成在提供图像处理服务的设备中。如图1a所示,该方法包括:
步骤110、根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集。
本实施例中,当前驱动人脸图像帧和相邻的历史驱动人脸图像帧都是从直播视频中截取的视频画面,历史驱动人脸图像帧的截取时间较早,其包括的是表情变换前的主播人脸,例如,微笑的主播人脸,当前驱动人脸图像帧的截取时间较晚,其包括的是表情变换后的主播人脸,例如,大笑的主播人脸。其中,历史驱动人脸图像帧和当前驱动人脸图像帧中的人脸可以是正对摄像头的正脸,也可以是侧对摄像头的侧脸。
可选的,可以通过对驱动人脸图像帧进行人脸检测,识别出驱动人脸图像帧中的各人脸关键点,例如,眉毛、眼睛、鼻子、嘴巴、脸部轮廓等等,如图1b所示。其中,人脸关键点的数量,可以根据实际情况设置。
本实施例中,根据当前驱动人脸图像帧中的各人脸关键点的坐标,以及历史驱动人脸图像帧中的各人脸关键点的坐标,可以计算得到当前驱动人脸图像帧中的各人脸关键点相对于历史驱动人脸图像帧中的各人脸关键点的坐标变化量,进而可以确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集。
步骤120、将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对运动纹理图像进行图像模糊处理。
本实施例中,为了便于对各运动特征参数进行数据平滑,使得根据运动特征参数集进行表情调整的人脸图像帧能够实现模糊效果,可以在直播视频纹理渲染过程中,除了处理当前驱动人脸图像帧以及历史驱动人脸图像帧的纹理图像之外,同时绑定一个处理运动特征参数的纹理图像,在将各运动特征参数映射至该纹理图像中之后,通过对该纹理图像进行相应操作来实现各运动特征参数的数据平滑。其中,处理各运动特征参数的纹理图像可以理解为与历史驱动人脸图像帧有相同画面的图片。后文将处理运动特征参数的纹理图像简称为纹理图像。
可选的,将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,可以包括:获取历史驱动人脸图像帧中的各人脸关键点与纹理图像的片元着色器中像素点之间的位置对应关系;根据位置对应关系,将与每个人脸关键点对应的运动特征参数,分别映射至纹理图像中,得到运动纹理图像。
本实施例中,在直播视频纹理渲染过程中,顶点着色器用于处理纹理图像中每个顶点的旋转变换和平移变换等,片元着色器用于处理纹理图像中每个像素点的颜色计算和填充。与处理当前驱动人脸图像帧以及历史驱动人脸图像帧的纹理图像相比,处理运动特征参数的纹理图像的顶点着色器不变,片元着色器中各像素点与历史驱动人脸图像帧中的各人脸关键点之间建立位置对应关系,例如,历史驱动人脸图像帧中的鼻尖关键点与片元着色器中鼻尖位置的像素点相对应。根据位置对应关系,可以将与历史驱动人脸图像帧的每个人脸关键点对应的运动特征参数,分别映射至片元着色器中对应的像素点中,得到运动纹理图像。
可选的,与人脸关键点对应的运动特征参数包括:水平运动变化量和竖直运动变化量;根据位置对应关系,将与每个人脸关键点对应的运动特征参数,分别映射至纹理图像中,可以包括:获取与当前映射的目标人脸关键点对应的目标水平运动变化量和目标竖直运动变化量;根据位置对应关系,在纹理图像中获取与目标人脸关键点匹配的目标像素点;将目标像素点的R通道赋值为目标水平运动变化量,G通道赋值为目标竖直运动变化量,B通道赋值为0。
本实施例中,为了便于将人脸关键点对应的坐标变化量映射到片元着色器中对应的像素点的不同通道中,设置运动特征参数包括水平运动变化量和竖直运动变化量。示例性的,如图1c所示,图中的脸部轮廓关键点对应的水平运动变化量X为0.1,竖直运动变化量Y为0.1。
本实施例中,在将各运动特征参数分别映射至纹理图像时,先确定当前映射的目标人脸关键点,以及与目标人脸关键点对应的目标水平运动变化量和目标竖直运动变化量,例如0.2和0.15,然后根据各人脸关键点与片元着色器中像素点之间的位置对应关系,在纹理图像中找到与目标人脸关键点匹配的目标像素点,并将目标像素点的R通道赋值为目标水平运动变化量,例如0.2,G通道赋值为目标竖直运动变化量,例如0.15,B通道赋值为0,完成对当前目标人脸关键点对应的运动特征参数的映射。然后更新目标人脸关键点,并重复上述过程,对更新后的目标人脸关键点对应的运动特征参数进行映射,直至完成对所有人脸关键点对应的运动特征参数的映射,得到运动纹理图像。
可选的,对运动纹理图像进行图像模糊处理,可以包括:使用图像处理器GPU对运动纹理图像进行高斯卷积操作,得到模糊后图像。
本实施例中,为了可以对多种纹理图像并行处理,达到实时高速驱动历史被驱动人脸图像帧的效果,采用GPU对运动纹理图像进行图像模糊处理。模糊处理可以理解为每一个像素点都取其周边像素点的平均值。由于图像是连续的,越靠近的像素点关系越密切,越远离的像素点关系越疏远,因此,可以设置距离越近的像素点的权重越大,距离越远的像素点的权重越小,从而通过GPU对运动纹理图像进行高斯卷积操作时,可以得到一张根据距离权值模糊化的图像。通过模糊化达到消除侧脸扭曲变形,重新调整运动特征参数的目的。
步骤130、根据模糊后图像生成运动特征调整参数集,并根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧。
可选的,根据模糊后图像生成运动特征调整参数集,可以包括:根据位置对应关系,在模糊后图像中确定与人脸关键点分别对应的各像素点;根据各像素点R通道和G通道的通道值,生成与各人脸关键点分别对应的运动特征调整参数;将各运动特征调整参数组合得到运动特征调整参数集。
本实施例中,在通过GPU对运动纹理图像进行图像模糊处理之后,根据位置对应关系,从模糊后图像中找到与人脸关键点分别对应的各像素点,并将各像素点的R通道的通道值作为与该像素点对应的人脸关键点的调整后水平运动变化量,将G通道的通道值作为与该像素点对应的人脸关键点的调整后竖直运动变化量,从而得到与各人脸关键点分别对应的运动特征调整参数,通过将各运动特征调整参数组合得到运动特征调整参数集。
本实施例中,在生成运动特征调整参数集之后,将运动特征调整参数集中的各运动特征调整参数分别叠加于历史被驱动人脸图像帧中的对应人脸关键点上,得到跟随当前驱动人脸图像帧进行实时表情变换后的人脸关键点的坐标,生成当前被驱动人脸图像帧。
本发明实施例中,根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集,通过将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对运动纹理图像进行图像模糊处理,然后根据模糊后图像生成运动特征调整参数集,并根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧,解决了现有技术中被驱动后的虚拟人脸图像中存在人脸变形扭曲的问题,实现了在被驱动人脸图像跟随驱动人脸图像进行相应的人脸表情调整时,可以避免调整后的被驱动人脸图像中的人脸扭曲变形。
实施例二
图2a是本发明实施例二中的一种图像处理方法的流程图。本实施例可以与上述实施例中各个可选方案结合。具体的,参考图2a,该方法可以包括如下步骤:
步骤210、在当前驱动人脸图像帧、历史驱动人脸图像帧以及历史被驱动人脸图像帧中,分别获取与人脸区域匹配的人脸关键点。
本实施例中,为了使得历史被驱动人脸图像帧中的历史被驱动人脸可以跟随历史驱动人脸图像帧中的历史驱动人脸做出相应的动作效果,需要先在当前驱动人脸图像帧、历史驱动人脸图像帧以及历史被驱动人脸图像帧中,分别获取与人脸区域匹配的人脸关键点,进而确定历史驱动人脸图像帧与当前驱动人脸图像帧中的各人脸关键点的对应关系,以及历史驱动人脸图像帧与历史被驱动人脸图像帧中的各人脸关键点之间的对应关系,然后才能找到与驱动人脸表情变化相匹配的历史被驱动人脸图像帧中的各人脸关键点的坐标变化。
步骤220、根据历史被驱动人脸图像帧中的各人脸关键点,将历史被驱动人脸图像帧划分为多个原始网格。
本实施例中,以历史被驱动人脸图像帧中的人脸关键点作为网格的至少部分顶点,将历史被驱动人脸图像帧进行网格化,划分为两个及两个以上的网格,如图2b所示。
步骤230、确定与当前驱动人脸图像帧、历史驱动人脸图像帧以及历史被驱动人脸图像帧分别对应的目标定点。
可选的,确定与当前驱动人脸图像帧、历史驱动人脸图像帧以及历史被驱动人脸图像帧分别对应的目标定点,可以包括:在当前驱动人脸图像帧、历史驱动人脸图像帧以及历史被驱动人脸图像帧中,分别确定人脸定位矩形;各人脸定位矩形中,获取同一位置的角点作为目标定点。
可选的,在当前驱动人脸图像帧、历史驱动人脸图像帧以及历史被驱动人脸图像帧中,分别确定人脸定位矩形,可以包括:在当前驱动人脸图像帧、历史驱动人脸图像帧以及历史被驱动人脸图像帧中,分别获取各人脸的眼间距和鼻尖关键点;以眼间距与第一比例值的乘积为长,眼间距与第二比例值的乘积为宽,以鼻尖关键点为中心点,构造与当前驱动人脸图像帧、历史驱动人脸图像帧以及历史被驱动人脸图像帧中分别对应的人脸定位矩形;其中,眼间距以及鼻尖关键点通过对应的人脸图像帧中的人脸关键点确定。
示例性的,以当前驱动人脸图像帧为例,如图2c所示,通过在当前驱动人脸图像帧中的各人脸关键点中,获取双眼的人脸关键点坐标并做差值,即可得到当前驱动人脸图像帧的眼间距E。根据经验,可以将第一比例值设置为2,将第二比例值设置为2.5,从而得到长为2*E,宽为2.5*E,中心点为鼻尖关键点S的人脸定位矩形,如图2d所示,当然,第一比例值和第二比例值也可以设置为其他数值。
步骤240、根据当前驱动人脸图像帧中的各人脸关键点、历史驱动人脸图像帧中的各人脸关键点、与当前驱动人脸图像帧对应的目标定点,以及与历史驱动人脸图像帧对应的目标定点,生成运动特征参数集。
可选的,根据当前驱动人脸图像帧中的各人脸关键点、历史驱动人脸图像帧中的各人脸关键点、与当前驱动人脸图像帧对应的目标定点,以及与历史驱动人脸图像帧对应的目标定点,生成运动特征参数集,可以包括:获取当前驱动人脸图像帧中的各人脸关键点与对应目标定点之间的第一位置向量,以及历史驱动人脸图像帧中的各人脸关键点与对应目标定点之间的第二位置向量;计算各第二位置向量与对应第一位置向量之间的向量差值;计算各向量差值和人脸缩放比例的乘积,得到与历史驱动人脸图像帧中的各人脸关键点匹配的人脸关键点加速度向量;将各人脸关键点加速度向量沿着水平方向和竖直方向进行分解,得到各人脸关键点对应的水平运动变化量和竖直运动变化量,作为运动特征参数集。
示例性的,如图2d所示,假设当前驱动人脸图像帧和历史驱动人脸图像帧都是以人脸定位矩形的顶点A为目标定点,获取各当前驱动人脸关键点Xn与目标定点A之间的第一位置向量XnA,以及各历史驱动人脸关键点Xn’与目标定点A之间的第二位置向量Xn’A,通过计算XnA-Xn’A,得到从历史驱动人脸图像帧变化到当前驱动人脸图像帧时,历史驱动人脸对应的各人脸关键点的坐标变化量。考虑到历史驱动人脸与历史被驱动人脸的尺寸不一致,需要根据公式an=(XnA-Xn’A)*Q计算各人脸关键点加速度向量,使得计算得到的各人脸关键点的坐标变化量适合历史被驱动人脸的尺寸,其中,Q为人脸缩放比例。然后将各人脸关键点的加速度向量沿着x轴方向与y轴方向分别进行分解,得到各人脸关键点对应的水平运动变化量和竖直运动变化量,作为运动特征参数集。
可选的,在计算各向量差值和人脸缩放比例的乘积之前,还可以包括:将历史被驱动人脸图像帧的眼间距除以当前驱动人脸图像帧的眼间距得到的商值,作为人脸缩放比例。
本实施例中,由于历史被驱动人脸图像帧是静态图像,因此历史被驱动人脸的眼间距不会变化,当摄像头前的驱动人脸的尺寸发生变化时,为了保证计算出的各人脸关键点的坐标变化量符合历史被驱动人脸的尺寸,可以将历史被驱动人脸图像帧的眼间距与当前驱动人脸图像帧的眼间距的商值作为人脸缩放比例,来对各人脸关键点的坐标变化量进行缩放。
步骤250、将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对运动纹理图像进行图像模糊处理。
本实施例中,为了便于对各运动特征参数进行数据平滑,使得根据运动特征参数集进行表情调整的人脸图像帧能够实现模糊效果,可以在直播视频纹理渲染过程中,除了处理当前驱动人脸图像帧以及历史驱动人脸图像帧的纹理图像之外,同时绑定一个处理运动特征参数的纹理图像,并在将各运动特征参数映射至该纹理图像中之后,通过GPU对该纹理图像进行高斯卷积操作,实现各运动特征参数的数据平滑,达到消除侧脸扭曲变形,重新调整运动特征参数的目的。
步骤260、根据模糊后图像生成运动特征调整参数集,并根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧。
可选的,根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧,可以包括:建立与历史被驱动人脸图像帧匹配的空白图像;根据运动特征调整参数集,确定历史被驱动人脸图像帧中各原始网格的网格变形方式;其中,历史被驱动人脸图像帧由各人脸关键点划分出的多个原始网格构成;根据网格变形方式,在空白图像中,划分出与原始网格对应的多个目的变形网格;根据原始网格与目的变形网格之间的位置对应关系,将原始网格中的各像素点映射至对应的目的变形网格中,得到当前被驱动人脸图像帧。
本实施例中,可以在根据运动特征调整参数集确定调整后的历史被驱动人脸图像帧的各人脸关键点之后,建立与历史被驱动人脸图像帧尺寸大小一致的空白图像,以便于后续在空白图像中划分出与原始网格对应的目的变形网格,以及,在对历史被驱动人脸图像帧中的各原始网格进行变形调整后,在空白图像中显示调整后的历史被驱动人脸,得到当前被驱动人脸图像帧。
本实施例中,为了加快对历史被驱动人脸图像帧的处理速度,在划分出与原始网格对应的多个目的变形网格之后,直接根据原始网格与目的变形网格的映射关系,依次将各原始网格中的像素点映射到对应的目的变形网格中,以得到当前被驱动人脸图像帧,不需要将原始网格中的像素点重新渲染到目的变形网格中。
本发明实施例中,根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集,通过将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对运动纹理图像进行图像模糊处理,然后根据模糊后图像生成运动特征调整参数集,并根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧,解决了现有技术中被驱动后的虚拟人脸图像中存在人脸变形扭曲的问题,实现了在被驱动人脸图像跟随驱动人脸图像进行相应的人脸表情调整时,可以避免调整后的被驱动人脸图像中的人脸扭曲变形。
实施例三
图3是本发明实施例三中的一种图像处理装置的结构示意图,本实施例可适用于历史被驱动人脸跟随驱动人脸实时进行表情变换的情况。如图3所示,该图像处理装置包括:
运动特征参数集生成模块310,用于根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集;
图像模糊处理模块320,用于将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对运动纹理图像进行图像模糊处理;
人脸驱动模块330,用于根据模糊后图像生成运动特征调整参数集,并根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧。
本发明实施例中,根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集,通过将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对运动纹理图像进行图像模糊处理,然后根据模糊后图像生成运动特征调整参数集,并根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧,解决了现有技术中被驱动后的虚拟人脸图像中存在人脸变形扭曲的问题,实现了在被驱动人脸图像跟随驱动人脸图像进行相应的人脸表情调整时,可以避免调整后的被驱动人脸图像中的人脸扭曲变形。
可选的,图像模糊处理模块320,包括:位置对应关系获取单元,用于获取历史驱动人脸图像帧中的各人脸关键点与纹理图像的片元着色器中像素点之间的位置对应关系;映射单元,用于根据位置对应关系,将与每个人脸关键点对应的运动特征参数,分别映射至纹理图像中,得到运动纹理图像。
可选的,与人脸关键点对应的运动特征参数包括:水平运动变化量和竖直运动变化量;映射单元,具体用于:获取与当前映射的目标人脸关键点对应的目标水平运动变化量和目标竖直运动变化量;根据位置对应关系,在纹理图像中获取与目标人脸关键点匹配的目标像素点;将目标像素点的R通道赋值为目标水平运动变化量,G通道赋值为目标竖直运动变化量,B通道赋值为0。
可选的,图像模糊处理模块320,具体用于:使用图像处理器GPU对运动纹理图像进行高斯卷积操作,得到模糊后图像。
可选的,人脸驱动模块330,具体用于:根据位置对应关系,在模糊后图像中确定与人脸关键点分别对应的各像素点;根据各像素点R通道和G通道的通道值,生成与各人脸关键点分别对应的运动特征调整参数;将各运动特征调整参数组合得到运动特征调整参数集。
可选的,还包括,目标定点确定模块,用于:在根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集之前,确定与当前驱动人脸图像帧、历史驱动人脸图像帧以及历史被驱动人脸图像帧分别对应的目标定点;
运动特征参数集生成模块310,具体用于:根据当前驱动人脸图像帧中的各人脸关键点、历史驱动人脸图像帧中的各人脸关键点、与当前驱动人脸图像帧对应的目标定点,以及与历史驱动人脸图像帧对应的目标定点,生成运动特征参数集。
可选的,运动特征参数集生成模块310,具体用于:获取当前驱动人脸图像帧中的各人脸关键点与对应目标定点之间的第一位置向量,以及历史驱动人脸图像帧中的各人脸关键点与对应目标定点之间的第二位置向量;计算各第二位置向量与对应第一位置向量之间的向量差值;计算各向量差值和人脸缩放比例的乘积,得到与历史驱动人脸图像帧中的各人脸关键点匹配的人脸关键点加速度向量;将各人脸关键点加速度向量沿着水平方向和竖直方向进行分解,得到各人脸关键点对应的水平运动变化量和竖直运动变化量,作为运动特征参数集。
可选的,人脸驱动模块330,具体用于:建立与历史被驱动人脸图像帧匹配的空白图像;根据运动特征调整参数集,确定历史被驱动人脸图像帧中各原始网格的网格变形方式;其中,历史被驱动人脸图像帧由其中的各人脸关键点划分出的多个原始网格构成;根据网格变形方式,在空白图像中,划分出与原始网格对应的多个目的变形网格;根据原始网格与目的变形网格之间的位置对应关系,将原始网格中的各像素点映射至对应的目的变形网格中,得到当前被驱动人脸图像帧。
本发明实施例所提供的图像处理装置可执行本发明任意实施例所提供的图像处理方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4是本发明实施例四公开的一种设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性设备12的框图。图4显示的设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备12交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与设备12的其它模块通信。应当明白,尽管图中未示出,可以结合设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的图像处理方法。
也即:实现一种图像处理方法,包括:根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集;将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对运动纹理图像进行图像模糊处理;根据模糊后图像生成运动特征调整参数集,并根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧。
实施例五
本发明实施例五还公开了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现一种图像处理方法,包括:根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集;将运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对运动纹理图像进行图像模糊处理;根据模糊后图像生成运动特征调整参数集,并根据运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种图像处理方法,其特征在于,包括:
根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集;
将所述运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对所述运动纹理图像进行图像模糊处理;
根据模糊后图像生成运动特征调整参数集,并根据所述运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧。
2.根据权利要求1所述的方法,其特征在于,将所述运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,包括:
获取所述历史驱动人脸图像帧中的各人脸关键点与所述纹理图像的片元着色器中像素点之间的位置对应关系;
根据所述位置对应关系,将与每个人脸关键点对应的运动特征参数,分别映射至所述纹理图像中,得到所述运动纹理图像。
3.根据权利要求2所述的方法,其特征在于,与人脸关键点对应的运动特征参数包括:水平运动变化量和竖直运动变化量;
根据所述位置对应关系,将与每个人脸关键点对应的运动特征参数,分别映射至所述纹理图像中,包括:
获取与当前映射的目标人脸关键点对应的目标水平运动变化量和目标竖直运动变化量;
根据所述位置对应关系,在所述纹理图像中获取与所述目标人脸关键点匹配的目标像素点;
将所述目标像素点的R通道赋值为目标水平运动变化量,G通道赋值为目标竖直运动变化量,B通道赋值为0。
4.根据权利要求1所述的方法,其特征在于,对所述运动纹理图像进行图像模糊处理,包括:
使用图像处理器GPU对所述运动纹理图像进行高斯卷积操作,得到模糊后图像。
5.根据权利要求3所述的方法,其特征在于,根据模糊后图像生成运动特征调整参数集,包括:
根据所述位置对应关系,在所述模糊后图像中确定与人脸关键点分别对应的各像素点;
根据所述各像素点R通道和G通道的通道值,生成与各所述人脸关键点分别对应的运动特征调整参数;
将各所述运动特征调整参数组合得到所述运动特征调整参数集。
6.根据权利要求1所述的方法,其特征在于,在根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集之前,还包括:
确定与所述当前驱动人脸图像帧、所述历史驱动人脸图像帧以及所述历史被驱动人脸图像帧分别对应的目标定点;
根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集,包括:
根据所述当前驱动人脸图像帧中的各人脸关键点、所述历史驱动人脸图像帧中的各人脸关键点、与所述当前驱动人脸图像帧对应的目标定点,以及与所述历史驱动人脸图像帧对应的目标定点,生成运动特征参数集。
7.根据权利要求6所述的方法,其特征在于,根据所述当前驱动人脸图像帧中的各人脸关键点、所述历史驱动人脸图像帧中的各人脸关键点、与所述当前驱动人脸图像帧对应的目标定点,以及与所述历史驱动人脸图像帧对应的目标定点,生成运动特征参数集,包括:
获取所述当前驱动人脸图像帧中的各人脸关键点与对应目标定点之间的第一位置向量,以及所述历史驱动人脸图像帧中的各人脸关键点与对应目标定点之间的第二位置向量;
计算各所述第二位置向量与对应第一位置向量之间的向量差值;
计算各所述向量差值和人脸缩放比例的乘积,得到与所述历史驱动人脸图像帧中的各人脸关键点匹配的人脸关键点加速度向量;
将各人脸关键点加速度向量沿着水平方向和竖直方向进行分解,得到各人脸关键点对应的水平运动变化量和竖直运动变化量,作为所述运动特征参数集。
8.根据权利要求1-7任一项所述的方法,其特征在于,根据所述运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧,包括:
建立与所述历史被驱动人脸图像帧匹配的空白图像;
根据所述运动特征调整参数集,确定所述历史被驱动人脸图像帧中各原始网格的网格变形方式;其中,所述历史被驱动人脸图像帧由各人脸关键点划分出的多个原始网格构成;
根据所述网格变形方式,在所述空白图像中,划分出与所述原始网格对应的多个目的变形网格;
根据所述原始网格与所述目的变形网格之间的位置对应关系,将所述原始网格中的各像素点映射至对应的目的变形网格中,得到所述当前被驱动人脸图像帧。
9.一种图像处理装置,其特征在于,包括:
运动特征参数集生成模块,用于根据当前驱动人脸图像帧和相邻的历史驱动人脸图像帧,确定与历史驱动人脸中的各人脸关键点对应的运动特征参数集;
图像模糊处理模块,用于将所述运动特征参数集中的各运动特征参数映射至纹理图像中,得到运动纹理图像,并对所述运动纹理图像进行图像模糊处理;
人脸驱动模块,用于根据模糊后图像生成运动特征调整参数集,并根据所述运动特征调整参数集和历史被驱动人脸图像帧,生成当前被驱动人脸图像帧。
10.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的图像处理方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的图像处理方法。
CN202010250999.0A 2020-04-01 2020-04-01 图像处理方法、装置、设备及存储介质 Pending CN113496506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010250999.0A CN113496506A (zh) 2020-04-01 2020-04-01 图像处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010250999.0A CN113496506A (zh) 2020-04-01 2020-04-01 图像处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN113496506A true CN113496506A (zh) 2021-10-12

Family

ID=77994095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010250999.0A Pending CN113496506A (zh) 2020-04-01 2020-04-01 图像处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113496506A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114356084A (zh) * 2021-12-24 2022-04-15 阿里巴巴(中国)有限公司 图像处理方法、系统及电子设备
WO2023098617A1 (zh) * 2021-12-03 2023-06-08 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023098617A1 (zh) * 2021-12-03 2023-06-08 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备及存储介质
CN114356084A (zh) * 2021-12-24 2022-04-15 阿里巴巴(中国)有限公司 图像处理方法、系统及电子设备

Similar Documents

Publication Publication Date Title
CN109872379B (zh) 数据处理装置和方法
US8102428B2 (en) Content-aware video stabilization
US6717586B2 (en) Apparatus, method, program code, and storage medium for image processing
CN109191554B (zh) 一种超分辨图像重建方法、装置、终端和存储介质
US20140321771A1 (en) Techniques for real-time clearing and replacement of objects
CN112766027A (zh) 图像处理方法、装置、设备及存储介质
CN113643414B (zh) 一种三维图像生成方法、装置、电子设备及存储介质
CN111583381B (zh) 游戏资源图的渲染方法、装置及电子设备
CN113313832B (zh) 三维模型的语义生成方法、装置、存储介质与电子设备
US20210209839A1 (en) Three-dimensional (3d) shape modeling based on two-dimensional (2d) warping
CN113496506A (zh) 图像处理方法、装置、设备及存储介质
CN112055869A (zh) 对面部的透视畸变校正
US20220335684A1 (en) Finite aperture omni-directional stereo light transport
US11494961B2 (en) Sticker generating method and apparatus, and medium and electronic device
CN110619670A (zh) 人脸互换方法、装置、计算机设备及存储介质
CN107203961B (zh) 一种表情迁移的方法及电子设备
US20220375258A1 (en) Image processing method and apparatus, device and storage medium
CN111583329B (zh) 增强现实眼镜显示方法、装置、电子设备和存储介质
CN112714337A (zh) 视频处理方法、装置、电子设备和存储介质
CN112528707A (zh) 图像处理方法、装置、设备及存储介质
CN112721150A (zh) 一种光固化3d打印方法、装置、设备及存储介质
CN115272575B (zh) 图像生成方法及装置、存储介质和电子设备
CN111870953A (zh) 一种高度图生成方法、装置、设备及存储介质
CN116630523A (zh) 基于阴影映射算法的改进型实时阴影渲染方法
CN112465692A (zh) 图像处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination