CN116993576A

CN116993576A - 视频换脸方法、装置、存储介质及设备

Info

Publication number: CN116993576A
Application number: CN202310735505.1A
Authority: CN
Inventors: 严妍; 杨春宇; 任梦园; 白杨
Original assignee: Beijing Kaipuyun Information Technology Co ltd
Current assignee: Beijing Kaipuyun Information Technology Co ltd
Priority date: 2023-06-21
Filing date: 2023-06-21
Publication date: 2023-11-03
Anticipated expiration: 2043-06-21
Also published as: CN116993576B

Abstract

本申请公开了一种视频换脸方法、装置、存储介质及设备，属于图像处理技术领域。所述方法包括：获取源人脸的关键点和待换脸的目标视频；提取目标视频的视频帧序列中目标人脸的关键点，得到第一关键点序列；根据关键点和第一关键点序列计算第二关键点序列，第二关键点序列具有源人脸的面部五官轮廓和脸型的信息，且具有目标人脸在前后帧的面部五官轮廓和脸型的变换信息；根据第一关键点序列和第二关键点序列对视频帧序列中的目标人脸进行面部五官轮廓和脸型调整；利用SimSwap模型将源人脸的人脸特征映射到调整后的视频帧序列中的目标人脸上；将映射后的视频帧序列编码为换脸视频。本申请保证了换脸的相似度，达到了稳定且真实的换脸效果。

Description

视频换脸方法、装置、存储介质及设备

技术领域

本申请涉及图像处理技术领域，特别涉及一种视频换脸方法、装置、存储介质及设备。

背景技术

随着人工智能及计算机视觉技术的快速发展，换脸技术也越来越成熟。视频换脸是指将源图片中的人脸特征转移到目标图片中的目标人脸上，且需要保证目标人脸的其它属性信息(表情、光照、姿态等)不会发生改变。

基于SimSwap(An Efficient FrameWork For High Fidelity Face Swapping，一种高效的高保真人脸交换框架)的换脸模型能够很好地转移人脸特征，换脸效果相对稳定，且针对不同身份的人脸也具有一定的通用性，得到了比较广泛的应用。但是SimSwap模型在面部五官轮廓及脸型的相似度上表现较差，不能明显地改变目标人脸的面部五官轮廓及脸型。

发明内容

本申请提供了一种视频换脸方法、装置、存储介质及设备，用于解决SimSwap模型不能明显地改变目标人脸的面部五官轮廓及脸型的问题。所述技术方案如下：

一方面，提供了一种视频换脸方法，所述方法包括：

获取源人脸的关键点和待换脸的目标视频；

提取所述目标视频的视频帧序列中目标人脸的关键点，得到第一关键点序列；

根据所述关键点和所述第一关键点序列计算第二关键点序列，所述第二关键点序列具有所述源人脸的面部五官轮廓和脸型的信息，且具有所述目标人脸在前后帧的面部五官轮廓和脸型的变换信息；

根据所述第一关键点序列和所述第二关键点序列对所述视频帧序列中的目标人脸进行面部五官轮廓和脸型调整；

利用SimSwap模型将所述源人脸的人脸特征映射到调整后的视频帧序列中的目标人脸上；

将映射后的视频帧序列编码为换脸视频。

在一种可能的实现方式中，所述根据所述关键点和所述第一关键点序列计算第二关键点序列，包括：

将所述关键点与首个视频帧中的目标人脸进行人脸对齐；

根据所述第一关键点序列计算前后帧中目标人脸的关键点的偏移量；

以所述关键点为基础，根据所述偏移量计算第二关键点序列。

在一种可能的实现方式中，所述将所述关键点与首个视频帧中的目标人脸进行人脸对齐，包括：

计算所述源人脸与首个视频帧中的目标人脸的仿射变换矩阵；

基于所述仿射变换矩阵，将所述关键点与首个视频帧中的目标人脸进行人脸对齐。

在一种可能的实现方式中，所述根据所述第一关键点序列和所述第二关键点序列对所述视频帧序列中的目标人脸进行面部五官轮廓和脸型调整，包括：

利用所述第一关键点序列中第n个视频帧的关键点对所述目标人脸进行三角剖分，得到多个第一三角区域，n为正整数；

利用所述第二关键点序列中第n个视频帧的关键点对所述源人脸进行三角剖分，得到多个第二三角区域；

根据每个第二三角区域对对应的第一三角区域进行面部五官轮廓和脸型调整。

在一种可能的实现方式中，所述根据每个第二三角区域对对应的第一三角区域进行面部五官轮廓和脸型调整，包括：

对于每个第一三角区域，根据所述第一三角区域与对应的第二三角区域的位置差异，利用仿射变换对所述第一三角区域进行面部五官轮廓和脸型调整。

在一种可能的实现方式中，所述获取源人脸的关键点，包括：

获取包含源人脸的图像；

提取所述图像中源人脸的关键点。

一方面，提供了一种视频换脸装置，所述装置包括：

获取模块，用于获取源人脸的关键点和待换脸的目标视频；

提取模块，用于提取所述目标视频的视频帧序列中目标人脸的关键点，得到第一关键点序列；

计算模块，用于根据所述关键点和所述第一关键点序列计算第二关键点序列，所述第二关键点序列具有所述源人脸的面部五官轮廓和脸型的信息，且具有所述目标人脸在前后帧的面部五官轮廓和脸型的变换信息；

调整模块，用于根据所述第一关键点序列和所述第二关键点序列对所述视频帧序列中的目标人脸进行面部五官轮廓和脸型调整；

映射模块，用于利用SimSwap模型将所述源人脸的人脸特征映射到调整后的视频帧序列中的目标人脸上；

编码模块，用于将映射后的视频帧序列编码为换脸视频。

在一种可能的实现方式中，所述计算模块，还用于：

将所述关键点与首个视频帧中的目标人脸进行人脸对齐；

在一种可能的实现方式中，

一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现如上所述的视频换脸方法。

一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行以实现如上所述的视频换脸方法。

本申请提供的技术方案的有益效果至少包括：

通过源人脸的关键点和目标人脸的第一关键点序列计算第二关键点序列，由于第二关键点序列既具有源人脸的面部五官轮廓和脸型的信息，也具有目标人脸在前后帧的面部五官轮廓和脸型的变换信息，所以，可以根据第一关键点序列和第二关键点序列对视频帧序列中的目标人脸进行面部五官轮廓和脸型调整，然后利用SimSwap模型将源人脸的人脸特征映射到调整后的视频帧序列中的目标人脸上，最后将映射后的视频帧序列编码为换脸视频，保证了换脸的相似度，达到了稳定且真实的换脸效果。

通过对源人脸和目标人脸进行三角剖分，并根据源人脸的三角区域对目标人脸中对应的三角区域进行仿射变换，使得目标人脸的面部五官轮廓和脸型与源图片的人脸分布一致。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个实施例提供的视频换脸方法的方法流程图；

图2是本申请另一实施例提供的视频换脸方法的流程示意图；

图3是本申请另一实施例提供的视频换脸方法的方法流程图；

图4是本申请另一实施例提供的视频换脸方法的流程示意图；

图5是本申请再一实施例提供的视频换脸装置的结构框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

请参考图1，其示出了本申请一个实施例提供的视频换脸方法的方法流程图，该视频换脸方法可以应用于计算机设备中。该视频换脸方法，可以包括：

步骤101，获取源人脸的关键点和待换脸的目标视频。

目标视频是包含人脸的视频，可以是播报视频、演讲视频等。本实施例中将目标视频中的人脸称为目标人脸，将需要合成到目标视频中的人脸称为源人脸。比如，计算机设备已获取到主播A的目标视频和明星B的人脸，且需要将明星B的人脸替换主播A的人脸，则可以将主播A的人脸称为目标人脸，将明星B的人脸称为源人脸。

源人脸的关键点包括用于表示人脸轮廓、眼睛、眉毛、嘴唇以及鼻子轮廓等。

步骤102，提取目标视频的视频帧序列中目标人脸的关键点，得到第一关键点序列。

计算机设备可以对目标视频进行解码，得到视频帧序列；对于每个视频帧，对该视频帧进行人脸识别，再从识别出的目标人脸中提取关键点；将所有提取到的关键点组成第一关键点序列，本实施例中不对关键点的提取算法作限定。

步骤103，根据关键点和第一关键点序列计算第二关键点序列，第二关键点序列具有源人脸的面部五官轮廓和脸型的信息，且具有目标人脸在前后帧的面部五官轮廓和脸型的变换信息。

计算机设备可以采用预定算法对源人脸的关键点和目标人脸的第一关键点序列进行计算，得到源人脸的第二关键点序列。其中，预定算法包括人脸对齐和仿射变换。

步骤104，根据第一关键点序列和第二关键点序列对视频帧序列中的目标人脸进行面部五官轮廓和脸型调整。

由于第二关键点序列既具有源人脸的面部五官轮廓和脸型的信息，也具有目标人脸在前后帧的面部五官轮廓和脸型的变换信息，所以，计算机设备可以根据第一关键点序列和第二关键点序列对目标人脸进行面部五官轮廓和脸型调整。

步骤105，利用SimSwap模型将源人脸的人脸特征映射到调整后的视频帧序列中的目标人脸上。

计算机设备利用SimSwap模型，将源人脸的人脸特征逐一替换到调整后的视频帧序列中的目标人脸上。

步骤106，将映射后的视频帧序列编码为换脸视频。

计算机设备可以映射后的视频帧序列进行编码，最终得到的换脸视频中的目标人脸被替换为源人脸。

本实施例中，计算机设备先对目标视频进行视频解码，得到视频帧序列；然后，根据视频帧序列和源人脸的关键点生成面部五官轮廓和脸型调整后的视频帧序列；再利用SimSwap模型对调整后的视频帧进行人脸特征映射，得到面部五官轮廓和脸型调整+换脸后的视频帧序列；最后，对该视频帧序列进行视频编码，得到换脸视频，如图2所示。

综上所述，本申请实施例提供的视频换脸方法，通过源人脸的关键点和目标人脸的第一关键点序列计算第二关键点序列，由于第二关键点序列既具有源人脸的面部五官轮廓和脸型的信息，也具有目标人脸在前后帧的面部五官轮廓和脸型的变换信息，所以，可以根据第一关键点序列和第二关键点序列对视频帧序列中的目标人脸进行面部五官轮廓和脸型调整，然后利用SimSwap模型将源人脸的人脸特征映射到调整后的视频帧序列中的目标人脸上，最后将映射后的视频帧序列编码为换脸视频，保证了换脸的相似度，达到了稳定且真实的换脸效果。

请参考图3，其示出了本申请一个实施例提供的视频换脸方法的方法流程图，该视频换脸方法可以应用于计算机设备中。该视频换脸方法，可以包括：

步骤301，获取源人脸的关键点和待换脸的目标视频。

计算机设备可以直接获取到关键点，或者，计算机设备可以获取包含源人脸的图像，提取图像中源人脸的关键点，本实施例中不对关键点的提取算法作限定。

步骤302，提取目标视频的视频帧序列中目标人脸的关键点，得到第一关键点序列。

步骤303，将关键点与首个视频帧中的目标人脸进行人脸对齐。

具体的，将关键点与首个视频帧中的目标人脸进行人脸对齐，可以包括：计算源人脸与首个视频帧中的目标人脸的仿射变换矩阵；基于仿射变换矩阵，将关键点与首个视频帧中的目标人脸进行人脸对齐。

步骤304，根据第一关键点序列计算前后帧中目标人脸的关键点的偏移量。

计算机设备每次从视频帧序列中选择相邻的两个视频帧，根据这两个视频帧中的关键点计算偏移量。

步骤305，以关键点为基础，根据偏移量计算第二关键点序列。

计算机设备可以根据每个视频帧对应的偏移量，分别对人脸对齐后的源人脸的关键点进行偏移，得到第二关键点序列。其中，第二关键点序列具有源人脸的面部五官轮廓和脸型的信息，且具有目标人脸在前后帧的面部五官轮廓和脸型的变换信息。

步骤306，根据第一关键点序列和第二关键点序列对视频帧序列中的目标人脸进行面部五官轮廓和脸型调整。

具体的，计算机设备可以利用第一关键点序列中第n个视频帧的关键点对目标人脸进行三角剖分，得到多个第一三角区域，n为正整数；利用第二关键点序列中第n个视频帧的关键点对源人脸进行三角剖分，得到多个第二三角区域；根据每个第二三角区域对对应的第一三角区域进行面部五官轮廓和脸型调整。其中，对目标人脸的三角剖分方法与对源人脸的三角剖分方法相同，以使源人脸及目标人脸的三角区域一一对应。

其中，根据每个第二三角区域对对应的第一三角区域进行面部五官轮廓和脸型调整，可以包括：对于每个第一三角区域，计算机设备根据第一三角区域与对应的第二三角区域的位置差异，利用仿射变换对第一三角区域进行面部五官轮廓和脸型调整。

步骤307，利用SimSwap模型将源人脸的人脸特征映射到调整后的视频帧序列中的目标人脸上。

步骤308，将映射后的视频帧序列编码为换脸视频。

本实施例中，计算机设备对源图片进行关键点检测，得到源人脸的关键点；计算机设备还对目标视频进行视频解码，得到视频帧序列；然后，对视频帧序列进行关键点检测，得到第一关键点序列；再将源人脸与首帧的目标人脸进行人脸对齐，计算前后帧的目标人脸的偏移量，根据对齐结果和偏移量计算第二关键点序列；利用三角剖分和仿射变换对第一关键点序列和第二关键点序列进行计算，得到面部五官轮廓和脸型调整后的视频帧序列；再利用SimSwap模型对调整后的视频帧进行人脸特征映射，得到面部五官轮廓和脸型调整+换脸后的视频帧序列；最后，对该视频帧序列进行视频编码，得到换脸视频，如图4所示。

下面以利用明星A对主播B进行视频换脸为例，对换脸视频的生成流程进行说明。

(1)计算机设备获取用户输入的明星A的免冠正面照片以及主播B的单人新闻播报视频；

(2)计算机设备对单人新闻播报视频进行视频解码，得到视频帧序列；

(3)计算机设备使用面部关键点检测模型对视频帧序列进行关键点检测，得到主播B的第一关键点序列；

(4)计算机设备使用面部关键点检测模型对明星A的免冠正面照片进行关键点检测，得到明星A的人脸关键点；

(5)计算机设备将明星A的人脸关键点与主播B的首帧关键点进行人脸对齐，并将主播B前后帧的关键点的变化量结合明星A的人脸关键点，得到明星A的第二关键点序列；

(6)计算机设备将第二关键点序列与第一关键点序列进行三角剖分，根据对应帧中所有三角区域的位置差异，对主播B的所有三角区域进行仿射变换，得到主播B的面部五官轮廓和脸型调整之后的视频帧序列；

(7)计算机设备使用SimSwap模型，将明星A的人脸特征逐一替换到上述调整后的视频帧序列的人脸上；

(8)计算机设备将替换后的视频帧序列重新编码成换脸视频。

请参考图5，其示出了本申请一个实施例提供的视频换脸装置的结构框图，该视频换脸装置可以应用于计算机设备中。该视频换脸装置，可以包括：

获取模块510，用于获取源人脸的关键点和待换脸的目标视频；

提取模块520，用于提取目标视频的视频帧序列中目标人脸的关键点，得到第一关键点序列；

计算模块530，用于根据关键点和第一关键点序列计算第二关键点序列，第二关键点序列具有源人脸的面部五官轮廓和脸型的信息，且具有目标人脸在前后帧的面部五官轮廓和脸型的变换信息；

调整模块540，用于根据第一关键点序列和第二关键点序列对视频帧序列中的目标人脸进行面部五官轮廓和脸型调整；

映射模块550，用于利用SimSwap模型将源人脸的人脸特征映射到调整后的视频帧序列中的目标人脸上；

编码模块560，用于将映射后的视频帧序列编码为换脸视频。

在一个可选的实施例中，计算模块530，还用于：

将关键点与首个视频帧中的目标人脸进行人脸对齐；

根据第一关键点序列计算前后帧中目标人脸的关键点的偏移量；

以关键点为基础，根据偏移量计算第二关键点序列。

在一个可选的实施例中，计算模块530，还用于：

计算源人脸与首个视频帧中的目标人脸的仿射变换矩阵；

基于仿射变换矩阵，将关键点与首个视频帧中的目标人脸进行人脸对齐。

在一个可选的实施例中，调整模块540，还用于：

利用第一关键点序列中第n个视频帧的关键点对目标人脸进行三角剖分，得到多个第一三角区域，n为正整数；

利用第二关键点序列中第n个视频帧的关键点对源人脸进行三角剖分，得到多个第二三角区域；

在一个可选的实施例中，调整模块540，还用于：

对于每个第一三角区域，根据第一三角区域与对应的第二三角区域的位置差异，利用仿射变换对第一三角区域进行面部五官轮廓和脸型调整。

在一个可选的实施例中，获取模块510，还用于：

获取包含源人脸的图像；

提取图像中源人脸的关键点。

综上所述，本申请实施例提供的视频换脸装置，通过源人脸的关键点和目标人脸的第一关键点序列计算第二关键点序列，由于第二关键点序列既具有源人脸的面部五官轮廓和脸型的信息，也具有目标人脸在前后帧的面部五官轮廓和脸型的变换信息，所以，可以根据第一关键点序列和第二关键点序列对视频帧序列中的目标人脸进行面部五官轮廓和脸型调整，然后利用SimSwap模型将源人脸的人脸特征映射到调整后的视频帧序列中的目标人脸上，最后将映射后的视频帧序列编码为换脸视频，保证了换脸的相似度，达到了稳定且真实的换脸效果。

本申请一个实施例提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现如上所述的视频换脸方法。

本申请一个实施例提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行以实现如上所述的视频换脸方法。

需要说明的是：上述实施例提供的视频换脸装置在进行视频换脸时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将视频换脸装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的视频换脸装置与视频换脸方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述并不用以限制本申请实施例，凡在本申请实施例的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请实施例的保护范围之内。

Claims

1.一种视频换脸方法，其特征在于，所述方法包括：

获取源人脸的关键点和待换脸的目标视频；

将映射后的视频帧序列编码为换脸视频。

2.根据权利要求1所述的视频换脸方法，其特征在于，所述根据所述关键点和所述第一关键点序列计算第二关键点序列，包括：

将所述关键点与首个视频帧中的目标人脸进行人脸对齐；

3.根据权利要求2所述的视频换脸方法，其特征在于，所述将所述关键点与首个视频帧中的目标人脸进行人脸对齐，包括：

4.根据权利要求1所述的视频换脸方法，其特征在于，所述根据所述第一关键点序列和所述第二关键点序列对所述视频帧序列中的目标人脸进行面部五官轮廓和脸型调整，包括：

5.根据权利要求4所述的视频换脸方法，其特征在于，所述根据每个第二三角区域对对应的第一三角区域进行面部五官轮廓和脸型调整，包括：

6.根据权利要求1至5中任一所述的视频换脸方法，其特征在于，所述获取源人脸的关键点，包括：

获取包含源人脸的图像；

提取所述图像中源人脸的关键点。

7.一种视频换脸装置，其特征在于，所述装置包括：

获取模块，用于获取源人脸的关键点和待换脸的目标视频；

编码模块，用于将映射后的视频帧序列编码为换脸视频。

8.根据权利要求7所述的视频换脸装置，其特征在于，所述计算模块，还用于：

将所述关键点与首个视频帧中的目标人脸进行人脸对齐；

9.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现如权利要求1至7中任一所述的视频换脸方法。

10.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行以实现如权利要求1至7中任一所述的视频换脸方法。