CN109063658A

CN109063658A - 一种利用深度学习在多移动终端视频人物换脸的方法

Info

Publication number: CN109063658A
Application number: CN201810897882.4A
Authority: CN
Inventors: 吴培希
Original assignee: Individual
Current assignee: Individual
Priority date: 2018-08-08
Filing date: 2018-08-08
Publication date: 2018-12-21

Abstract

一种利用深度学习在多移动终端视频人物换脸的方法，本发明涉及一种互联网AI视频处理方法，本发明为了解决现有技术中更换视频中人物的脸部的操作复杂、CPU配置很高、手动确认视频的频率，手动删除错误的图片、不支持在移动终端进行训练，训练进度无法实时获得。它包括如下步骤：获取多人脸视频中不同人脸的图像子集、多个终端上传并生成想要替换的人脸图片集、训练生成模型并与基准视频A合成多人换脸视频，本发明用于互联网AI视频处理领域。

Description

一种利用深度学习在多移动终端视频人物换脸的方法

技术领域

本发明涉及一种互联网AI视频处理方法，具体涉及一种利用深度学习在多移动终端视频人物换脸的方法。

背景技术

目前视频换脸技术的应用非常广泛，顾名思义，也就是在图像或视频中把一张脸替换成另一张脸，只需要把上百张人物的样图输入至一个算法，就能完成人脸交换，制作出非常逼真的视频效果。事实上，之前电影视频中的人脸交换非常复杂，专业的视频剪辑师和CGI专家需要花费大量时间和精力才能完成视频中的人脸交换。从技术的角度而言，深度图像生成模型是很成功的应用，它无需安装Python和Tensorflow等编程语言和开源软件库但是它的操作非常复杂，需要高配置电脑，且不支持在移动终端进行训练。

发明内容

本发明是为解决现有的视频换脸技术存在操作复杂、配置需求高、不能在移动终端进行训练的问题，进而提供一种利用深度学习在多移动终端视频人物换脸的方法。

本发明为解决上述问题采取的技术方案是：

一种利用深度学习在多移动终端视频人物换脸的方法，它包括如下步骤：

步骤一、获取多人脸视频中不同人脸的图像子集：在移动终端M₁上获取含多人脸的基准视频A中不同人脸的图像子集；根据人脸不同将图像集分为{a₁、a₂…a_n}；

步骤二、在移动终端M₂、M₃…M_n+1上传并生成想要替换的人脸图像集：根据多个移动终端上传的视频或图片对应生成想要替换的人脸图像集{b₁、b₂…b_n}；

步骤三、训练生成模型并与基准视频A合成多人换脸视频：通过机器深度学习将a₁替换为b₁,a₂替换为b₂，…a_n替换为b_n，训练出模型；

利用生成的模型与含多人脸的基准视频A合成多人换脸视频。

本发明的有益效果是：一、通过移动终端使更换视频中人物的脸部的操作简便无需电脑；二、CPU配置一般或较低的电脑也可实现同样效果；三、全过程通过终端可以自动确认视频的频率，删除错误的图片；四、可在移动终端进行训练，训练进度实时获得。

附图说明

图1为获取多人脸视频中不同人脸的图像子集流程图；

图2为多个终端上传并生成想要替换的人脸图片集流程图；

图3为训练生成模型并与基准视频A合成多人换脸视频流程图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。

具体实施方式一：结合图1-3说明本实施方式，本实施方式中所述一种利用深度学习在多移动终端视频人物换脸的方法，它包括如下步骤：步骤一、获取多人脸视频中不同人脸的图像子集：在移动终端M₁上获取含多人脸的基准视频A中不同人脸的图像子集；根据人脸不同将图像集分为{a₁、a₂…a_n}；步骤二、在移动终端M₂、M₃…M_n+1上传并生成想要替换的人脸图像集：根据多个移动终端上传的视频或图片对应生成想要替换的人脸图像集{b₁、b₂…b_n}；步骤三、训练生成模型并与基准视频A合成多人换脸视频：通过机器深度学习将a₁替换为b₁,a₂替换为b₂，…a_n替换为b_n，训练出模型；利用生成的模型与含多人脸的基准视频A合成多人换脸视频。

具体实施方式二：结合图1说明本实施方式，本实施方式中所述获取多人脸视频中不同人脸的图像子集包含移动终端M₁，所述移动终端M₁通过“多人脸换脸应用”上传基准视频A，所述多人脸换脸应用自动获取视频A每秒传输帧数，截取出视频中所有的人脸图片集，并自动删选掉不清晰和错误的图片。其它步骤与具体实施方式一相同。

具体实施方式三：结合图2说明本实施方式，本实施方式中所述多个移动终端上传并生成想要替换的人脸图像集包含移动终端M₂、移动终端M₃，…移动终端M_n+1，所述移动终端M₂选定被替换的a₁人脸集并上传视频B1，自动获取所述视频B每秒传输帧数，生成人脸图片集b₁，所述移动终端M₃选定并上传被替换的a₂人脸集并上传单人脸图片集B2，生成人脸图片集b₂；所属移动终端M_n+1选定并上传被替换的a_n人脸集，生成单人脸图片集b_n。其它步骤与具体实施方式二相同。

具体实施方式四：结合图2说明本实施方式，本实施方式中所述生成替换人脸集包括截取视频方式和图片直接生成方式，所述截取视频方式是通过上传单人脸视频B1，获取每秒帧数，将视频处理成图片并生成人脸图片集b₁，所述图片直接生成方式是通过上传单脸图片集B2，截取出人脸图片集并生成人脸图片集。其它步骤与具体实施方式三相同。

具体实施方式五：结合图3说明本实施方式，本实施方式中所述训练生成模型并与基准视频A合成多人换脸视频的过程为：

步骤a.先设定训练损失值

步骤b.判断是否在本地训练，如果在本地训练则执行步骤c，否则执行步骤d；

步骤c.利用移动终端CPU或显卡训练；

步骤d.上传图片集{a₁、a₂…a_n}、{b₁、b₂…b_n}在服务端训练；

步骤e.判断训练是否超时，如果训练超时直接结束，否则执行步骤f；

步骤f.达到预设训练损失值；

步骤g.生成模型并通知用户；

步骤h.判断是否需要继续训练，如果是则调整预设训练损失值重复步骤e-h，如果不需要则利用生成的模型和基准视频A合成多人换脸视频。其它步骤与具体实施方式四相同。

本发明已以较佳实施案例揭示如上，然而并非用以限定本发明，任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内，当可以利用上述揭示的结构及技术内容做出些许的更动为等同变化的等效实施案例，但是凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施案例所做的任何简单修改、等同变化，均仍属本发明技术方案范围。

Claims

1.一种利用深度学习在多移动终端视频人物换脸的方法，其特征在于：它包括如下步骤：

利用生成的模型与含多人脸的基准视频A合成多人换脸视频。

2.根据权利要求1所述一种利用深度学习在多移动终端视频人物换脸的方法，其特征在于：在步骤一中，获得图像集{a₁、a₂…a_n}的过程为：

获取多人脸视频中不同人脸的图像子集包含移动终端M₁，所述移动终端M₁通过“多人脸换脸应用”上传基准视频A，所述多人脸换脸应用自动获取视频A每秒传输帧数，截取出视频中所有的人脸图片集，并自动删选掉不清晰和错误的图片。

3.根据权利要求1所述一种利用深度学习在多移动终端视频人物换脸的方法，其特征在于：在步骤二中，多个移动终端M₂、M₃，…M_n+1分别上传并对应生成想要替换的人脸图像集{b₁、b₂…b_n}是指：所述移动终端M₂选定被替换的a₁人脸集并上传单人脸视频B1，自动获取所述视频B每秒传输帧数，生成人脸图片集b₁；所述移动终端M₃选定并上传被替换的a₂人脸集并上传单人脸图片集B2，生成人脸图片集b₂；所属移动终端M_n+1选定并上传被替换的a_n人脸集，生成人脸图片集b_n。

4.根据权利要求3所述一种利用深度学习在多移动终端视频人物换脸的方法，其特征在于：生成替换人脸集包括截取视频方式和图片直接生成方式，所述截取视频方式是通过上传单人脸视频B1，获取每秒帧数，将视频处理成图片并生成人脸图片集b₁，所述图片直接生成方式是通过上传单脸图片集B2，截取出人脸图片集并生成人脸图片集。

5.根据权利要求1所述一种利用深度学习在多移动终端视频人物换脸的方法，其特征在于：在步骤三中，获得训练生成模型并与基准视频A合成多人换脸视频的过程为：

步骤a.先设定训练损失值；

步骤c.利用移动终端CPU或显卡训练；

步骤f.达到预设训练损失值；

步骤g.生成模型并通知用户；

步骤h.判断是否需要继续训练，如果是则调整预设训练损失值重复步骤e-h，如果不需要则利用生成的模型和基准视频A合成多人换脸视频。