CN105139438B

CN105139438B - 视频人脸卡通动画生成方法

Info

Publication number: CN105139438B
Application number: CN201510601029.XA
Authority: CN
Inventors: 李宏亮; 陈鸣; 曹梓远
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2014-09-19
Filing date: 2015-09-18
Publication date: 2018-01-12
Anticipated expiration: 2035-09-18
Also published as: CN105139438A

Abstract

本发明公开了一种视频人脸卡通动画生成方法，属于图像处理技术领域。本发明包括下列步骤，首先从输入视频中截取一帧正面中性表情图像，对中性表情图像进行卡通化处理，并记录中性表情图像的眉毛轮廓点、眼睛轮廓点、眼睛睁开状态的上下眼皮的最大高度差h；查找与中性表情图像相似的帧为初始变换帧，基于上一帧的特征点确定下一帧的特征点处理：包括眉毛、眼睛和嘴巴的对应变换处理，合成变换后的卡通图像，获取已合成卡通图像所对应图像帧的下一帧图像，重复上述步骤，输出多帧连续卡通图像，生成卡通动画。本发明用于卡通动画的生成，其生成速度较快，生成效果较好。

Description

视频人脸卡通动画生成方法

技术领域

本发明属于图像处理技术，具体涉及基于人脸视频生成卡通视频的生成方法。

背景技术

目前视频人脸卡通动画生成方法主要有关键帧插值方法，参数控制方法，肌肉模型方法，物理模型方法，行为驱动方法。

关键帧插值方法主要思想是先利用人脸头部运动或者人脸表情变化的检测，从大量视频图像帧里获取最具有代表性的关键帧，并对其进行相关的图像处理，将经过处理的关键帧形成人脸样本图像库，在关键帧之间进行插值，得到中间时刻的处理图像，由此可以得到处于两种表情之间的一种新的表情图像。该算法的适用性很局限，只能对一个人或是一种类型的人脸模型进行计算，而不能大范围的创建各种真实的人脸模型。

参数控制方法采用了参数化技术，客服了简单插值的一些限制，通过选取一组独立的参数值，经过少量的计算参数的组合就能构造出人脸表情。但参数化方法很容易产生不自然的表情，而且需要大量的手工调节去设置参数值。

肌肉模型方法的原理是，用多边形来表示人脸的形状，然后用肌肉向量通过不同的函数改变多边形的顶点位置和运动方向，这样就可以改变人脸不同区域的形状，从而实现人脸的动画效果。在向量肌肉模型中，如何按生理学的规律正确放置肌肉向量是一项非常困难的工作，不正确的肌肉向量定位，会出现不自然的表情动画,甚至出现不可能发生的表情动画，因此需要反复实验来得到比较好的效果。

基于物理模型的动画是将人脸视为一个可变型的弹性体，由弹性矢量单元将人脸的皮肤层、软组织、肌肉层和骨骼层的各个节点链接起来，将这些弹性矢量单以不同的方式组合在一起，就形成可以发生形变的曲线和可以发生形变的曲面，然后利用物理模型的方法模拟肌肉的的运动，通常是采用Newtonian运动方程来模拟人脸的肌肉运动。该方法使人脸表情动画更具有真实性，但是人脸模型很复杂，计算量相当的大，不适用于实时处理。

行为驱动方法是指通过运动捕捉设备，获取视频摄像头拍摄的人脸运动的数据，然后用这些运动数据控制计算机生成虚拟的人脸表情运动。为了更好的获取人脸表情变化的数据，可以在待跟踪的人脸上选取特征点，通过对特征点的跟踪来记录人脸的运动数据。根据数据的变化对卡通图像进行相应的处理形成卡通动画。现有的光流法对特征点的跟踪准确度不高，尤其当特征点附近的纹理复杂时容易产生漂移，使人脸表情变化的数据产生错误，从而导致卡通人脸的变化与真实人脸的表情变化不一致。

发明内容

本发明的目的是提供一种基于特征点定位的视频人脸卡通化方法，此方法生成的卡通动画视频较流畅，与输入人脸的相似性较高，表情模拟逼真，具有较高的实用价值。

本发明的视频人脸卡通动画生成方法，包括下列步骤：

步骤1：从输入视频选择一帧正面中性表情人脸图像作为参考帧，并截取参考帧的人脸图像，基于所述人脸图像的两眼距离对人脸图像进行尺寸归一化；

将该人脸图像转换为灰度图像，获取所述灰度图像的特征点并保存特征点位置，所述特征点包括具有标志性的面部轮廓特征点、眉毛轮廓特征点、眼睛轮廓特征点、鼻子轮廓特征点；根据获取的眉毛轮廓特征点、眼睛轮廓特征点、鼻子轮廓特征点对所述人脸图像中的眉毛、眼睛、鼻子分别进行重叠分块，且分块数大于或等于3；在人脸图像块库中为所有分块寻找最佳匹配块，各最佳匹配块对应在卡通图像块库的卡通块即为找到的卡通匹配块，将卡通匹配块合成为完整的器官块，得到参考帧的卡通眉毛、卡通眼睛、卡通鼻子并保存；

以眉毛轮廓特征点为中心，将灰度图像的眉毛分成M(眉毛轮廓特征点个数)个矩形块(矩形块的大小通常可设置为K1*K1的方块，K1的取值为7～11)作为初始眉毛模板；

基于眼睛轮廓特征点获取眼睛高度h，并将h分为N段，获取各段端点的灰度值，并保存各端端点的灰度值、位置，其中N大于或等于3，

卡通面部轮廓直接通过勾勒面部轮廓特征点合成并保存；

取得所述灰度图像中头发区域的掩膜，从而得到参考帧的卡通头发部分发并保存；

步骤2：查找参考帧的相似帧作为卡通动画的起始帧；

步骤3：对起始帧及其后续帧进行人脸卡通画生成：

将当前帧图像转换为灰度图像；

基于当前帧眉毛模板获取当前帧的眉毛轮廓特征点位置，将参考帧的卡通眉毛作为当前帧的卡通眉毛，并按照特征点位置将卡通眉毛放到当前帧图像的相应位置，所述当前帧眉毛模板为：以上一帧眉毛模板作为滑动窗，在当前帧的预设滑动范围(K2*K2的矩形范围，其中K2的取值为3～5)内查找与滑动窗的灰度值偏差最小的点，将该点作为新的中心点，并将滑动窗的中心点移至所属新的中心点得到当前帧眉毛模板，其中起始帧的上一帧眉毛模板为M个初始眉毛模板；

获取当前帧的鼻尖点的位置，并计算与参考帧的鼻尖点的位置变化值T，将参考帧的卡通鼻子作为当前帧的卡通鼻子，基于位置变化值T放到当前帧图像的相应位置；

将位置变化值T与参考帧的下眼皮特征点的位置相加，得到当前帧的下眼皮特征点的位置，基于参考帧的眼睛高度h和分段端点位置，在当前帧查找与N个端点的灰度值最接近的点，得到当前帧的眼睛高度h′，基于当前帧与参考帧的眼睛特征点的坐标映射，对参考帧的卡通眼睛进行仿射变换处理，得到当前帧的卡通眼睛，并放到当前帧图像的相应位置；

将参考帧的卡通面部轮廓、卡通头发部分作为当前帧的卡通面部轮廓、卡通头发部分，基于参考帧的各特征点的位置与位置变化值T，将其放到当前帧图像的相应位置；

获取当前帧具有标志性的嘴巴轮廓特征点，通过勾勒嘴巴轮廓特征点合成嘴巴轮廓线，得到当前帧的卡通嘴巴轮廓，并按照特征点位置将卡通嘴巴轮廓放到当前帧图像的相应位置；

对卡通化后的图像进行上色，生成当前帧的人脸卡通画。

综上所述，由于采用了上述技术方案，本发明的有益效果是：提供了一种视频人脸卡通化方法，此方法生成的卡通视频效果较好，速度快。

附图说明

本发明将通过例子并参照附图的方式说明，其中：

图1：本发明流程示意图。

图2：输入的测试视频的截取帧。

图3：步骤二人脸卡通生成方法合成后的卡通人脸效果图。

图4：人脸轮廓原特征点，粗调整后的特征点，细调整后的特征点。

图5：人脸上色后合成完整的卡通画效果图。

图6：不同表情的几帧图像。

图7：卡通化生成眉毛与变换后的眉毛。

图8：卡通化生成的眼睛与变换后的眼睛。

图9：嘴巴不同状态时对应的R-G二值图、R-G二值图的垂直方向投影图、Lab二值图、嘴巴主要特征点、对应的卡通嘴巴。

图10：与视频人脸表情对应的卡通图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面结合实施方式，对本发明作进一步地详细描述。

参见图1，本发明的视频人脸卡通化生成方法，包括下列步骤：

步骤一、视频标准人脸图像剪裁。在播放的视频或者摄像头获取的视频中截取一张正面中性表情的人脸图像(如图2所示，将该帧定义为参考帧)，获取截图上两眼瞳孔中心坐标作为归一化特征点，根据两眼距离将截图裁剪为与人脸照片库相同尺寸的人脸图像，用于后续卡通化处理。

步骤二、对参考帧的人脸图像进行常规卡通画处理并保存相应信息。

本具体实施方式中，对单张人脸图像的卡通化处理，包括以下分步骤：

第1步：卡通人脸的合成。

对于输入的人脸图像，首先利用AAM算法，即主动表观模型，得到对应的特征点并保存参考帧的对应特征点的位置。对当前人脸图像的主要器官进行重叠分块，其中分块的器官有眼睛、眉毛、鼻子，定位特征点选择具有标志性的点，比如眼睛眉毛的内角点、鼻子的鼻尖点。分块的方式可以是：

眉毛：横向分为M1(M1的取值为3～5)块，块大小为N1*N2，横向重叠N3个像素，其中N1的取值为20～25，N2的取值为30～40，N3的取值为20-30；

眼睛：横向分为M2(M2的取值为4～6)块，块大小为N4*N5，横向重叠N6个像素，其中N4的取值为20～25，N5的取值为20～25，N6的取值为15-20；

鼻子：横向分M3为(M3的取值为4-6)块，块大小为N7*N8，横向重叠N9个像素，其中N7的取值为30～40，N8的取值为30～40，N9的取值为20-30。

然后，在人脸图像块库中为所有分块寻找最佳匹配块，各最佳匹配块对应在卡通图像块库的卡通块即为找到的卡通匹配块，将卡通匹配块合成为完整的器官块，得到对应的卡通眉毛、卡通眼睛、卡通鼻子，如图3所示(保存参考帧的卡通眉毛、卡通眼睛、卡通鼻子用于后续帧的卡通变换处理)。一般的，还需要对于合成得到的完整器官块去除其灰色背景部分，采用统计直方图，用最大类间差法otsu算法选择使得类间方差最大的灰度值为阈值，从而得到只保留主要器官而背景为白色的器官块，最后按照定位的特征点的位置将这些器官块放到原图像相应的位置。

第2步：头发的提取。

先用训练得到的R、G、B三个通道的阈值对图像进行处理，将三个通道得到的掩膜进行与运算得到一个掩膜，再对该掩膜图像计算位置直方图，用对应的阈值对掩膜进行进一步约束，从而得到最终的头发区域的掩膜，从而可提取出头发部分，得到当前人脸图像的卡通头发部分，并将该头发部分放回到原图像上相应的位置。

第3步：生成卡通图像的上色。

可利用Grab cut算法对输入的人脸图像进行交互式分割，从而得到人脸肤色区域的掩膜，利用该掩膜对人脸肤色区域进行上色。对于眉毛、眼睛、鼻子部分，由于这些部分都接近黑色，所以可直接用卡通化过程中生成的灰度图像代替。将AAM算法检测到的嘴巴部分特征点用一种选定的颜色连接成一条封闭的曲线，从而形成外唇线。在闭合区域的内部填充一种接近嘴唇的颜色，为了体现嘴唇的轮廓，闭合区域内部颜色需要与外唇线的颜色有所区别，R颜色通道值的选取为，在保证小于等于255的基础上比外唇线颜色R颜色通道值大20-30。在中唇线部分用黑色线条进行上色，上色后合成的完整的卡通画可参考图5。

步骤三：面部轮廓的修正。由于AAM算法的局限性，使得搜索得到的特征点的位置不准确，尤其体现在描述面部轮廓的特征点。将AAM算法生成的特征点(如图4-3所示)分为三段，第一段为左边脸部轮廓、第二段为下巴轮廓、第三段为右边脸部轮廓，通常，设置的面部轮廓的特征点个数在40个左右，第一段和第三段的特征点个数为8～12个。将第一段、第三段的特征点在左右领域内整体移动，对第二段的特征点在上下领域内整体移动，将其调整至对应脸部轮廓上(将人脸图像进行二值化处理，可得到一条连续的面部轮廓线，则可将下巴轮廓调整至对应的边牧轮廓线上，左右一一对应)。

上述调整后，得到粗调整后的特征点，如图4-2所示。原本分布均匀的特征点经过粗调整后分布变得不均匀，不利于人脸轮廓的描绘，因此需要根据相邻特征点之间的分布规律进行细调整，调整后的各特征点可参考图4-3，其具体调整过程为：

首先，按照从左边脸部轮廓到右边轮廓的顺序，对各特征点进行顺序编号，除第一个和最后一个特征点外，依次对各特征点进行中值调整：即取当前特征点的前后两个特征点的竖直坐标中值作为当前特征点的竖直坐标值，即当前特征点i的竖直坐标

为了保证下巴最尖点在最下方，需要再对最中间的三个特征点进行调整：

提取编号为最中间的5个特征点的竖直坐标：y_t-2、y_t-1、y_t、y_t+1、y_t+2，以40个特征点为例，特征点的编号从0～39，则需要提取y₁₈、y₁₉、y₂₀、y₂₁和y₂₂的竖直坐标；

若y_t-1小于y_t-2，则基于增加步长y不断增加y_t-1的取值，即令y_t-1＝y_t-1+y，直到y_t-1大于y_t-2；同理，若y_t+1小于y_t+2，则令y_t+1＝y_t+1+y，直到y_t+1大于y_t+2；最后设置y_t的取值为y_t-1和y_t+1中的较大者加y，即y_t＝max(y_t-1,y_t+1)+y，其中增加步长y的取值为：0.5～1.5。

最后，基于曲线拟合的方法对调整后的面部轮廓特征点进行轮廓线的平滑。

步骤四：相似帧查找。为了保证生成的卡通图像能根据人脸的表情进行变换的准确性，需要将与参考帧很相似的一帧输入视频帧作为起始帧，以保证起始帧的特征点位置与参考帧的特征点位置更大程度上的对应。可将参考帧的所截取的人脸区域作为模板，在以后的视频帧中查找最相似的区域，并与模板的灰度图像做差，差值小于阈值(像素点数小于截图区域大小的10％)则判定为相似帧，即人脸卡通动画的起始帧。

步骤五：视频卡通生成，即对起始帧及其后续帧(待处理帧)进行人脸卡通画生成。

人脸的各种表情主要是由眉毛、眼睛、鼻子表现出来的，参见图6，在表示惊讶时嘴巴会张开、眼睛瞪大、眉毛高耸，表示开心时嘴角上扬、眼睛微弯。由于眼睛眨动，嘴巴张开闭合的动作幅度较大，光流法对这些部位的特征点跟踪很不准确，但是对于鼻尖点这种几乎没有型变，纹理也比较简单的部位跟踪效果较好，因此可以有效的利用鼻尖点的位置变化，根据不同器官的变化特点用不同的方法进行变换得到。

眉毛的特征点用AAM方法得到的位置比较准确，因此可基于特征点对眉毛区域进行分块处理得到当前帧的卡通眉毛：

第1步：根据参考帧的眉毛特征点(通常为10)，以特征点为中心点，将眉毛分成10个9*9的矩形块，用做后续跟踪处理的眉毛模板，起始帧所对应的眉毛模板也称初始眉毛模板。

第2步：在每一个眉毛模板中心点的3*3矩形范围内以眉毛矩形块作为滑动窗进行模板匹配，取3*3矩形范围中与眉毛模板误差最小的一点作为新的模板中心点，将模板平移至该中心点的位置，做为下一帧的初始位置进行模板匹配。即基于上一帧的所确定眉毛模板设置前帧眉毛模板，再基于当前帧眉毛模板获取当前帧的眉毛轮廓特征点位置，将参考帧的卡通眉毛作为当前帧的卡通眉毛，并按照特征点位置将卡通眉毛放到当前帧图像的相应位置。其中，当前帧眉毛模板为：以上一帧眉毛模板作为滑动窗，在当前帧的预设滑动范围内查找与滑动窗的灰度值偏差最小的点，将该点作为新的中心点，并将滑动窗的中心点移至所属新的中心点得到当前帧眉毛模板，其中起始帧的上一帧眉毛模板为初始眉毛模板。图7给出了基于上述步骤所变换得到的各帧(4帧)对应卡通眉毛。

眼睛闭合睁开的动作主要是上眼皮的位置变化，下眼皮的动作很小，为了减小计算量，本实施方式中设定下眼皮的特征点相对于鼻尖点的位置不变。

第1步：获取参考帧中两个瞳孔中心点的灰度值，根据眼睛轮廓特征点得到眼睛睁开时的高度h(参考帧中下眼皮最低点与上眼皮最高点在竖直方向的差值)，将眼睛闭合成程度量化，及用h′表示每一帧(待处理帧)中上眼皮最高点与下眼皮最低点的差值，闭眼标记为0(h′＝0)，完全睁开为3(h′＝h)，闭合与睁开的中间状态按照眼睛高度均匀量化为1(h′＝1/3h)和2(h′＝2/3h)，并得到每一帧中0到3位置的灰度值。

第2步：根据光流法得到每一帧鼻尖点的位置，将位置变化值T(各帧鼻尖点与参考帧鼻尖点的位置变化值)与参考帧的下眼皮的坐标值相加得到每一帧下眼皮特征点的位置，分别获取比各帧下眼皮最低点高1/3h，2/3h，h三点的灰度值，并与参考帧的0到3位置的灰度值进行比较，取灰度值最相近的位置(0～3)作为当前帧的眼睛闭合程度标定值。

第3步：根据眼睛的标定对卡通化的眼睛进行仿射变换处理。如某一帧的眼睛闭合程度被标定为1，则得到上眼皮最高点的竖直坐标值为下眼皮最低点值加上1/3h，剩余两点上眼皮特征点的竖直坐标值可在所获取的最高点基础上减1，以保证眼睛的椭圆形状。由参考帧的眼睛特征点与当前帧的眼睛特征点，可以得到每一帧的眼睛映射矩阵，基于参考帧的卡通眼睛，由此眼睛映射矩阵可以得到变换后的卡通眼睛。参见图8，图中给出了对4帧不同帧进行上述变换处理后得到的卡通眼睛。

在获取当前帧的卡通嘴巴轮廓时，可基于单幅图像的卡通化处理获取，即获取当前帧具有标志性的嘴巴轮廓特征点，通过勾勒嘴巴轮廓特征点合成嘴巴轮廓线，得到当前帧的卡通嘴巴轮廓，但该方式比较费时，同时也可以基于下述处理步骤生成：

嘴部是面部表情发生变化时形变最大的部位，而且不像眼睛变化基本只存在于竖直方向上，嘴的闭合张开是水平和竖直两个方向的变化，因此上述眼睛变换的方法不适用于嘴巴变换的估计。人脸的器官分布是不会发生变化的，嘴巴的形变再大也是在鼻子的下面，因此可以利用鼻尖点的位置来确定嘴巴的范围，即嘴巴图像块(具体大小可根据原视频的大小进行设置)，本具体实施方式中，以鼻尖点为参考确定一个(50～60)*(30～40)的矩形框为嘴巴图像块，以下的嘴巴形态生成都是对该嘴巴图像块进行处理。

第1步：因为肤色和唇色在RGB颜色空间分布有一定相似性，因此不能用单纯的颜色空间对肤色和唇色进行划分，可结合Lab颜色空间和RGB颜色空间一起对嘴巴图像块进行嘴唇区域的分割。

在RGB颜色空间中，绿色分量在唇色中所占的比重小于在肤色中所占的比重，虽然红色分量在肤色和唇色中的分布范围都比较大，但是在肤色中红色所占的分量更大一些，因此可利用唇色中红色和绿色的差异性比肤色中更大这一特征，用公式R/(R-G)区分肤色与唇色区域，并基于这个差值图像进行二值化处理得到R-G二值图以分割嘴唇，即对RGB颜色空间的嘴巴图像块，基于预设阈值Th1，若像素点的R/(R-G)大于Th1，则设置像素点的像素值为1；否则设置为0，其中R、G表示颜色分量，如图9所示。预设阈值Th1的取值为经验值，可利用直方图对大量测试图进行统计得出。

Lab颜色空间为均匀空间，L分量表示亮度，a分量表示红色到绿色的渐变过程，b分量表示黄色到蓝色的渐变过程，且Lab颜色空间色域范围比较广，不仅包含RGB颜色空间可以描述的颜色，还可描述其它色彩空间不能描述的颜色，因Lab颜色空间的亮度分量不包含任何颜色信息，因此可以保证在对嘴唇区域的分割过程中不受光照不均的影响。由于肤色和唇色的差异主要体现在红色和绿色分量中，因此本具体实施方式中，通过提取嘴巴图像块的a分量进行二值化处理得到Lab二值图(参考图9)以实现嘴唇区域分割，即若像素点的颜色分量a大于预设阈值Th2，则设置像素点的像素值为1；否则设置为0。预设阈值Th2的取值为经验值，可利用直方图对大量测试图进行统计得出。

第2步：为了保证嘴唇区域不受噪声影响，将两幅二值化图像进行形态学变换，得到只有一个或两个连通域的图像。对R-G二值图进行水平方向的投影，并提取最左特征点X_L和最右特征点X_R，基于公式X_mid＝(X_L+X_R)/2得到嘴唇垂直中线坐标X_mid。

如果Lab二值图存在两个连通域，则嘴巴为张开状态，如果只有一个连通域，则嘴巴为闭合状态。张开状态(如图9第4个嘴巴状态所示)需要提取4个嘴唇轮廓中心点，即将X_mid上像素变化的四个特征点分别作为上下唇内外轮廓中心点；闭合状态则需要提取3个嘴唇轮廓中心点，即将X_mid上像素变化的两个特征点分别作为上下唇内外轮廓中心点，再取该两个中心点的均值作为中唇线中心点。

第3步：连接得到的嘴巴特征点(最左特征点X_L和最右特征点X_R、嘴唇轮廓中心点)，得到嘴唇轮廓线，可可利用曲线拟合方法对嘴唇轮廓线进行平滑处理，得到当前帧的卡通嘴巴轮廓。本具体实施方式中的具体处理为：

基于最左特征点X_L和最右特征点X_R、嘴唇轮廓中心点对嘴部其余的特征点进行估算：

由X_L和X_R得到嘴巴的宽度w1，嘴唇轮廓中心点得到嘴巴宽度h1，在嘴唇的上、中、下轮廓线上各取P(取值为6～10，且P为偶数)个辅助点，这些辅助点的水平坐标在轮廓线的水平方向上均匀分布，间距取w1/(P+2)，辅助点的竖直坐标在轮廓线的竖直方向上均匀分布，间距取h1/(P-2)，为了有效保证嘴巴的弧线形状，还需要对辅助点的竖直坐标值进行调整，例如，对上唇外轮廓线上的辅助点进行的调整为，最接近上唇外轮廓中心点的辅助点的竖直坐标值减d1(d1的取值为0.5～1)，最接X_L和X_R的辅助点的竖直坐标值减d2(d2的取值为1.5～2)，其余的辅助点的竖直坐标值减d3(d3的取值范围为1～1.5)，对上唇内轮廓线上的辅助点进行上述同样的调整；对下唇外轮廓线上的辅助点进行的调整为：最接近下唇外轮廓中心点的辅助点的竖直坐标值减d4(d4的取值范围为0.3～0.6)，最接近X_L和X_R的辅助点的竖直坐标值加d5(d5的取值范围为1.5～2)，其余的辅助点的竖直坐标值加d6(d6的取值范围为1～1.5)，由此得到所有的辅助点，再将X_L、X_R、嘴唇轮廓中心点及所有辅助点连线即得到变形后的卡通嘴唇。

根据以上步骤，得到了各个器官在人脸表情变化时对应的卡通器官，再根据当前帧鼻尖点的位置，将各个器官放回当前帧图像的相应位置，得到每一帧表情对应的卡通图片；再将参考帧的卡通面部轮廓(经粗调整和细调整之后的)、卡通头发部分作为当前帧的卡通面部轮廓、卡通头发部分，基于参考帧的各特征点的位置与位置变化值T，将其放到当前帧图像的相应位置；最后对卡通化后的图像进行上色，生成当前帧的人脸卡通画，从而得到卡通视频，即卡通动画，处理的示例结果如图10所示，图10-1～10-4给出了对应于图6中不同表情的视频帧的人脸卡通画。

上述步骤为一个优选实施方式，本领域技术人员可以根据实际需求减少或调整某些步骤。

Claims

1.视频人脸卡通动画生成方法，其特征在于，包括下列步骤：

将所述人脸图像转换为灰度图像，获取所述灰度图像的特征点并保存特征点位置，所述特征点包括具有标志性的面部轮廓特征点、眉毛轮廓特征点、眼睛轮廓特征点、鼻子轮廓特征点；

根据获取的眉毛轮廓特征点、眼睛轮廓特征点、鼻子轮廓特征点对所述人脸图像中的眉毛、眼睛、鼻子分别进行重叠分块，且分块数大于或等于3；

在人脸图像块库中为所有分块寻找最佳匹配块，各最佳匹配块对应在卡通图像块库的卡通块即为找到的卡通匹配块，将卡通匹配块合成为完整的器官块，得到参考帧的卡通眉毛、卡通眼睛、卡通鼻子并保存；

以眉毛轮廓特征点为中心，将灰度图像的眉毛分成M个矩形块作为初始眉毛模板，其中M表示眉毛轮廓特征点个数；

基于眼睛轮廓特征点获取眼睛高度h，并将h分为N段，获取各段端点的灰度值，并保存各段端点的灰度值、位置，其中N大于或等于3，

卡通面部轮廓直接通过勾勒面部轮廓特征点合成并保存；

取得所述灰度图像中头发区域的掩膜，从而得到参考帧的卡通头发部分并保存；

步骤2：查找参考帧的相似帧作为卡通动画的起始帧；

步骤3：对起始帧及其后续帧进行人脸卡通画生成：

将当前帧图像转换为灰度图像；

基于当前帧眉毛模板获取当前帧的眉毛轮廓特征点位置，将参考帧的卡通眉毛作为当前帧的卡通眉毛，并按照特征点位置将卡通眉毛放到当前帧图像的相应位置，所述当前帧眉毛模板为：以上一帧眉毛模板作为滑动窗，在当前帧的预设滑动范围内查找与滑动窗的灰度值偏差最小的点，将该点作为新的中心点，并将滑动窗的中心点移至所述新的中心点得到当前帧眉毛模板，其中起始帧的上一帧眉毛模板为M个初始眉毛模板；

对卡通化后的图像进行上色，生成当前帧的人脸卡通画。

2.如权利要求1所述的方法，其特征在于，所述步骤3中，生成当前帧的卡通嘴巴轮廓为：

以当前帧的鼻尖点为参考在当前帧图像中确定嘴巴图像块，对所述嘴巴图像块进行下述步骤：

提取嘴巴图像块所在的当前帧的原图，并分别得到RGB颜色空间、Lab颜色空间的对应图像块，再对两个图像块进行二值化处理：对RGB颜色空间，若像素点的R/(R-G)大于预设阈值时，设置像素点的像素值为1；否则设置为0，其中R、G表示颜色分量；对Lab颜色空间，若像素点的颜色分量a大于预设阈值，则设置像素点的像素值为1；否则设置为0；分别对两副二值化图像进行形态学变换，得到存在一个或两个连通域的R-G二值图、Lab二值图；

对R-G二值图进行水平方向投影并提取最左特征点X_L和最右特征点X_R，将所述X_L和X_R的均值X_mid作为嘴唇垂直中线坐标，若Lab二值图存在两个连通域，则提取四个嘴唇轮廓中心点：所述嘴唇垂直中线坐标上像素变化的四个特征点分别作为上下唇内外轮廓中心点；若Lab二值图存在一个连通域，则提取三个嘴唇轮廓中心点：所述嘴唇垂直中线坐标上像素变化的两个特征点分别作为上下唇内外轮廓中心点，再取该两个中心点均值作为中唇线中心点；

连通最左特征点X_L、最右特征点X_R和嘴唇轮廓中心点合成嘴巴轮廓线，得到当前帧的卡通嘴巴轮廓。

3.如权利要求1或2所述的方法，其特征在于，在对卡通嘴巴轮廓上色时，设置闭合区域内部与外唇线的颜色的R颜色分量通道的差值为20-30，且外唇线的R颜色分量小于闭合区域内部。

4.如权利要求3所述的方法，其特征在于，若嘴巴轮廓线存在中唇线，则用黑色线条进行上色。

5.如权利要求1或2所述的方法，其特征在于，所述步骤1中，生成参考帧的卡通面部轮廓为：

将参考帧的面部轮廓特征点分为三段，第一段为左边脸部轮廓、第二段为下巴轮廓、第三段为右边脸部轮廓；将第一段、第三段的特征点在左右领域内整体移动，对第二段的特征点在上下领域内整体移动，将其调整至对应脸部轮廓上；

从左边脸部轮廓到右边轮廓的顺序，对各特征点进行顺序编号，除第一个和最后一个特征点外，依次对各特征点进行中值调整：即取当前特征点的前后两个特征点的竖直坐标中值作为当前特征点的竖直坐标值；基于曲线拟合的方法对调整后的面部轮廓特征点进行轮廓线的平滑。

6.如权利要求5所述的方法，其特征在于，还包括：定义越靠近参考帧的人脸图像的头顶方向的竖直坐标越小，提取编号为最中间的5个特征点的竖直坐标：y_t-2、y_t-1、y_t、y_t+1、y_t+2；

若y_t-1小于y_t-2，则令y_t-1＝y_t-1+y，直到y_t-1大于y_t-2；若y_t+1小于y_t+2，则令y_t+1＝y_t+1+y，直到y_t+1大于y_t+2；设置y_t＝max(y_t-1,y_t+1)+y，其中增加步长y的取值为：0.5～1.5。

7.如权利要求1所述的方法，其特征在于，所述步骤2中，参考帧的相似帧为：提取参考帧的后续帧的人脸图像，并与参考帧的人脸图像的灰度图像做差，取差值小于参考帧的人脸图像的10％的视频帧作为参考帧的相似帧。