CN105049911B

CN105049911B - 一种基于人脸识别的视频特效处理方法

Info

Publication number: CN105049911B
Application number: CN201510405426.XA
Authority: CN
Inventors: 胡涛; 王亚丹; 范彩霞; 冯玉娜
Original assignee: Xian University of Technology
Current assignee: Jiangsu Fanwang IoT Technology Co.,Ltd.
Priority date: 2015-07-10
Filing date: 2015-07-10
Publication date: 2017-12-29
Anticipated expiration: 2035-07-10
Also published as: CN105049911A

Abstract

本发明公开了一种基于人脸识别的视频特效处理方法，步骤包括：步骤1：对需要处理的视频节目镜头进行分割；步骤2：获取视频中待特效人脸的模板特征；步骤3：以镜头为单位，计算镜头里每一帧上所检测到的每个人脸区域的人脸特征并按人脸区域的位置对每个人进行分类；步骤4：确定待特效人脸的分类阈值；步骤5：根据分类阈值进行待特效人脸的识别及马赛克特效处理；步骤6：对所有视频帧处理的结果进行保存，通过视频文件写入软件，把保存的帧图像转换成视频，最后把视频部分和音频部分合成一个完整的视频，即成。本发明的方法，能够自动对访谈类视频节目中指定的待保护人员的脸部进行马赛克特效处理，准确率高。

Description

一种基于人脸识别的视频特效处理方法

技术领域

本发明属于视频技术领域，具体涉及一种基于人脸识别的视频特效处理方法。

背景技术

对视频中的指定人脸进行马赛克或模糊等特效处理是一种常用于媒体信息传播中的隐私保护手段，比如在电视访谈类节目中，为了保护被采访者，在电视节目播出时，对需要保护的被采访对象的面部进行马赛克处理。这种特效处理，通常都是借助Premiere、DirectShow、AE等视频处理软件手工操作来完成，如果指定的被采访对象待特效人脸在视频中交替出现，也就是镜头切换比较频繁时，用这些软件手工操作对待特效人脸进行马赛克特效处理，则显得费时费力。

发明内容

本发明的目的是提供一种基于人脸识别的视频特效处理方法，解决了现有技术中，采用手工操作对访谈类视频节目中待保护人脸进行特效处理，费时费力的问题。

本发明所采用的技术方案是，一种基于人脸识别的视频特效处理方法，按照以下步骤具体实施：

步骤1：对需要处理的视频节目镜头进行分割；

步骤2：获取视频中待特效人脸的模板特征；

步骤3：以镜头为单位，计算镜头里每一帧上所检测到的每个人脸区域的人脸特征并按人脸区域的位置对每个人进行分类；

步骤4：确定待特效人脸的分类阈值；

步骤5：根据分类阈值进行待特效人脸的识别及马赛克特效处理；

步骤6：对所有视频帧处理的结果进行保存，通过视频文件写入软件，把保存的帧图像转换成视频，最后把视频部分和音频部分合成一个完整的视频，即成。

本发明的有益效果是，对视频进行镜头分割，对指定的待特效人脸在视频中自动获取其模板特征，将视频每一帧中获取的人脸特征与待特效人脸的模板特征进行比较，确定能够分类出待特效人脸(需要保护面部特征的人员)和非特效人脸(无需保护面部特征的人员)的阈值，根据该分类阈值进行人脸识别，如果识别结果为待特效人脸，则对该人脸区域进行马赛克特效处理，否则不做处理。该方法能够自动对访谈类视频节目中指定的待保护人员的脸部进行马赛克特效处理，准确率高。

具体实施方式

下面结合具体实施方式对本发明进行详细说明。

本发明基于人脸识别的视频特效处理方法，按照以下步骤具体实施：

步骤1：对需要处理的视频节目镜头进行分割

将视频节目镜头中的视频部分与音频部分分开，记视频总帧数为NumFrame，将每帧图像由RGB彩色图像转为灰度图像，并计算每一级灰度值所包含的像素点个数，然后将0到255个灰度级等分成16份，每份包含16个灰度级，计算相邻两帧灰度图像直方图的差和，见下式(1)：

其中，t＝0,1,...,15，i＝2,3,...,NumFrame，j＝0,1,...,255，d_t是第i帧和第i-1帧灰度图像直方图的差和，H_i,j和H_(i-1),j分别是第i帧和第i-1帧灰度图像落入第j个灰度级内的像素数目；

计算第i帧和第i-1帧灰度图像直方图的差和的平均值Avg_d_i，见下式(2)：

判断Avg_d_i是否满足下式(3)的条件：

Avg_d_i＞5×Avg_d_i-1， (3)

满足式(3)，则第i-1帧图像是第k个镜头的结束帧，第i帧图像是第k+1个镜头的起始帧，k＝1,2,...,ShotNum，ShotNum为镜头数，镜头内的起始帧数为N_Bk、结束帧数为N_Ek；

不满足式(3)，则第i-1帧和第i帧图像都是第k个镜头的视频帧图像；

步骤2：获取视频中待特效人脸的模板特征

2.1)在指定帧上框选待特效的人脸区域，并在镜头内获取待特效人脸的模板图像帧，

播放视频，当视频中出现待特效人脸时，手动指定该帧，记该帧的帧数为N_t，N_t∈[1,2,...,NumFrame]，N_Bk＜N_t＜N_Ek，k∈[1,2,...,ShotNum]，在该帧上手动框选完整的待特效人脸区域,记该矩形框的左上角坐标为(x_L,y_L)，右下角坐标为(x_R,y_R)；

然后判断N_t、N_Bk、N_Ek是否满足下式(4)的条件：

同时满足条件①和②时，从指定帧N_t开始直接向后取连续8帧图像作为模板图像帧，记模板图像帧的个数为Num_f，此时Num_f＝8；

满足条件①，不满足条件②时，从指定帧N_t开始向后连续取到第N_Ek帧，向前再连续取8-(N_Ek-N_t)-1帧作为模板图像帧，即Num_f＝8；

不满足条件①和②时，把指定帧N_t所在镜头k内的所有帧图像作为模板图像帧，即Num_f＝N_Ek-N_Bk+1，此时Num_f＜8；

2.2)对步骤2.1)中得到的Num_f个模板图像帧进行人脸检测，并提取待特效人的完整人脸区域，Num_f为模板图像帧的个数；

2.2.1)人脸的初检测

采用Adaboost算法中的人脸检测分类器，对每一模板图像帧进行人脸检测，所检测到的矩形区域记为ROI_i1，其中，i1＝1,2,...,Num_ROI，Num_ROI为检测到的矩形区域个数，记该矩形区域ROI_i1的宽为WROI_i1、高为HROI_i1；

2.2.2)排除非人脸的矩形区域

将步骤2.2.1)得到的矩形区域ROI_i1从RGB空间转换到YCrCb空间，参照下式(5)：

其中的像素值Cb和Cr取值范围分别为：80＜Cb＜130，135＜Cr＜170，则该像素为肤色像素，统计矩形区域ROI_i1中肤色像素的个数，记为Num_pixl_i1，判断Num_pixl_i1是否满足下式(6)中的条件：

其中，WROI_i1×HROI_i1是矩形区域ROI_i1的像素总数；

满足式(6)时，则矩形区域ROI_i1是人脸区域，i1∈[1,2,...,Num_ROI]，记为FaceROI_m，记其左上角和右下角的坐标为(x_Lm,y_Lm)和(x_Rm,y_Rm)，其中m＝1，2，...，Num_FaceROI，Num_FaceROI为排除非人脸区域后的人脸区域个数，Num_FaceROI≤Num_ROI；

不满足式(6)时，则矩形区域ROI_i1是非人脸区域；

2.2.3)合并重复检测到的人脸区域

记步骤2.2.2)的人脸区域FaceROI_m的中心点坐标为：

计算任意两个人脸区域中心点的欧式距离Dis_t，参照下式(7)：

其中，m＝1,2,...,Num_FaceROI，n＝1,2,...,Num_FaceROI，m≠n，

判断Dis_t是否满足公式(8)中的条件：

Dis_t＜max((y_Rm-y_Lm),(y_Rn-y_Ln))， (8)

其中，max((y_Rm-y_Lm),(y_Rn-y_Ln))是y_Rm-y_Lm和y_Rn-y_Ln中的较大值，

y_Rm-y_Lm是第m个人脸区域FaceROI_m的高，

y_Rn-y_Ln是第n个人脸区域FaceROI_n的高；

合并满足式(8)中条件的人脸区域，合并后的人脸区域记为FaceROI′_m1，其左上角的坐标是所有被合并的人脸区域左上角坐标的最小值，记为(x′_Lm1，y′_Lm1)，其右下角的坐标是所有被合并的人脸区域右下角坐标的最大值，记为(x′_Rm1，y′_Rm1)，其中，m1＝1,2,...,Num_FaceROI′，Num_FaceROI′≤Num_FaceROI，Num_FaceROI′为合并重复人脸区域后人脸区域的个数；

2.2.4)确定待特效人脸区域

判断步骤2.2.3)中合并后的人脸区域FaceROI′_m1的左上角坐标(x′_Lm1，y′_Lm1)和右下角坐标(x′_Rm1，y′_Rm1)是否满足下式(9)：

其中，x_L和y_L为步骤2.1)中指定框的左上角的横、纵坐标，x_R和y_R为右下角的横、纵坐标；

满足式(9)条件的人脸区域FaceROI′_m1则为待特效人脸区域，m1∈[1,2,...,Num_FaceROI′]，记为FaceROI_M_f，f＝1,2,...,Num_f，Num_f为步骤2.1)中模板图像帧的个数，

不满足式(9)条件的人脸区域FaceROI′_m1为非特效人脸区域；

2.2.5)提取完整的待特效人脸区域

遍历步骤2.2.4)中确定的Num_f帧模板图像帧中待特效人脸区域FaceROI_M_f，记x_LMf和y_LMf分别为FaceROI_M_f区域左上角的横、纵坐标，x_RMf和y_RMf分别为右下角的横、纵坐标，并找出其中最大的待特效人脸区域，记其左上角的坐标为(x_Lmax,y_Lmax)，右下角的坐标为(x_Rmax,y_Rmax)，

判断FaceROI_M_f的面积是否满足下式(10)中的条件：

满足式(10)时，完整的待特效人脸区域FaceROI_MF_f的左上角坐标(x_LMf,y_LMf)和右下角坐标(x_RMf,y_RMF)由下式(11)计算得出：

否则，不满足式(10)时，FaceROI_M_f区域即为完整的待特效人脸区域FaceROI_MF_f，其左上角和右下角的横纵坐标保持不变；

2.2.6)提取待特效人脸的模板特征

把步骤2.2.5)中提取的完整的待特效人脸区域FaceROI_MF_f平均分成4×4个小块，对每一个小块进行LBP滤波得到每一个小块的特征值，把这16个小块的特征值串联起来作为完整的待特效人脸区域的特征，即为待特效人脸的模板特征；

步骤3：以镜头为单位，计算镜头里每一帧上所检测到的每个人脸区域的人脸特征并按人脸区域的位置对每个人进行分类

对视频镜头k中的每一帧图像用步骤2.2.1)中的方法进行人脸初检测，用步骤2.2.2)中的方法排除非人脸区域，用步骤2.2.3)中的方法合并重复检测到的人脸区域，用步骤2.2.6)中的方法提取每一帧上所检测到的每个人脸区域的人脸特征

(这一段重复前面步骤是因为，在步骤2中仅对Num_f≤8帧进行处理，目的是找到待特效人脸的模板特征，这里是对所有视频帧，帧数为步骤1)中的NumFrame进行所有人脸(待特效人脸及非特效人脸如主持人等)检测及人脸特征提取处理)，

计算镜头k中第N帧图像上提取的第j1个人脸区域的人脸特征与Num_f个待特效人脸模板特征的欧氏距离的平均值为Disavg_k,j1,N，参照下式(12)：

其中，dis_k,j1,N(f)为镜头k中第N帧图像上提取的第j1个人脸区域的人脸特征与第f个待特效人脸模板特征的欧氏距离，f＝1,2,...,Num_f，j1＝1,2,...,Num_FaceROI′_k，Num_FaceROI′_k为镜头k中每一帧图像上合并重复人脸区域后人脸区域的个数，k＝1,2,...,ShotNum，N＝N_Bk,N_Bk+1,...,N_Ek，

在镜头k的起始帧数N_Bk和结束帧数N_Ek中遍历，记镜头k中第N帧第j1个人脸区域的左上角的坐标为(X_k,j1,N,Y_k,j1,N)，人脸区域的宽度为W_k,j1,N，第N+1帧第j1′个人脸区域的左上角的坐标为(X_k,j1′,N+1,Y_k,j1′,N+1)，

判断X_k,j1,N和X_k,j1′,N+1是否满足下式(13)中的条件：

满足式(13)时，则第N帧中的第j1个人脸区域和第N+1帧中的第j1′个人脸区域表示的是镜头k中的同一个人，将j1的Disavg_k,j1,N和j1′的Disavg_k,j1′,N+1存放在数组Sort_k,j1中，即数组Sort_k,j1中存放的是镜头k中每一帧的同一个人的人脸特征与Num_f个待特效人脸模板特征的欧氏距离的平均值，

不满足式(13)时，则第N帧中的第j1个人脸区域和第N+1帧中的第j1′个人脸区域表示的不是镜头k中的同一个人，

其中，Disavg_k,j1,N为镜头k中第N帧图像上提取的第j1个人脸区域的人脸特征与Num_f个待特效人脸模板特征的欧氏距离的平均值，Disavg_k,j1′,N+1为镜头k中第N+1帧图像上提取的第j1′个人脸区域的人脸特征与Num_f个待特效人脸模板特征的欧氏距离的平均值；

步骤4：确定待特效人脸的分类阈值

4.1)镜头内的合并

判断镜头k中的Num_FaceROI′_k是否满足下式(14)中的条件：

Num_FaceROI′_k＞1， (14)

Num_FaceROI′_k为镜头k中每一帧图像上合并重复人脸区域后人脸区域的个数，

不满足式(14)时，则j1＝1，j1＝1,2,...,Num_FaceROI′_k，数组Sort_k,j1即为数组Sort_k,j1＝1,

在满足式(14)的镜头k中遍历数组Sort_k,j1，找出数组Sort_k,j1中的最大值SMax_k,j1和最小值SMin_k,j1，判断SMax_k,j1和SMax_k,j1+1是否满足下式(15)中的条件：

|SMax_k,j1-SMax_k,j1+1|＜T， (15)

其中，j1＝1,2,...,Num_FaceROI′_k，k＝1,2,...,ShotNum，T为SMax_k,j1和SMin_k,j1差值的最大值的三分之一，参照下式(16)：

满足式(15)时，将数组Sort_k,j1与数组Sort_k,j1+1添加到数组SortHe_k中，数组SortHe_k的初始状态为空；

不满足式(15)时，将SMax_k,j1与SMax_k,j1+1中的较大者所在的数组添加到数组SortHe_k中，数组SortHe_k的初始状态为空，将SMax_k,j1与SMax_k,j1+1中的较小者所在的数组添加到数组SortOwn_k中，数组SortOwn_k的初始状态为空；

4.2)镜头间的合并

如果镜头k中的Num_FaceROI′_k不满足式(14)时，将步骤4.1)中的数组Sort_k,j1＝1拷贝到数组SSort_k1中，找出数组SSort_k1中的最大值Max_k1和最小值Min_k1，将数组SortHe_k拷贝到数组SSortHe_k2中，找出数组SSortHe_k2的最大值MaxHe_k2和最小值MinHe_k2，将数组SortOwn_k拷贝到数组SSortOwn_k3中，其中，k1＝1,2,...,k1′，k2＝1,2,...,k2′，k3∈k2，k1′+k2′＝ShotNum，

判断数组SSort_k1中的最大值Max_k1和数组SSortHe_k2＝1中的最小值MinHe_k2＝1是否满足下式(17)中的条件：

|MinHe_k2＝1-Max_k1|＜T1， (17)

其中，T1为MaxHe_k2和MinHe_k2差值的最大值的二分之三，参照下式(18)：

满足式(17)时，将数组SSort_k1添加到数组SSortHe_k2＝1中，找出数组SSortHe_k2中的最大值为FMax_k2，最小值为FMin_k2，数组SSortOwn_k3保持不变，记数组SSortOwn_k3的最大值为TMax_k3，最小值为TMin_k3；

不满足式(17)时，将数组SSort_k1添加到数组SSortOwn_k3＝1中，找出数组SSortOwn_k3中的最大值为TMax_k3，最小值为TMin_k3，数组SSortHe_k2保持不变，记数组SSortHe_k2中的最大值为FMax_k2，最小值为FMin_k2；

把数组SSortHe_k2添加到数组SSortHe_k2＝1中，k2＝1,2,...,k2′，找出数组SSortHe_k2＝1中最大值为FMax，最小值为FMin，把数组SSortOwn_k3添加到数组SSortOwn_k3＝1中，k3∈k2，找出数组SSortOwn_k3＝1中的最大值为TMax，最小值为TMin；

如果镜头k中的Num_FaceROI′_k满足式(14)中的条件时，把数组SortHe_k添加到数组SortHe_k＝1中，找出数组SortHe_k＝1中的最大值为FMax，最小值为FMin，把数组SortOwn_k添加到数组SortOwn_k＝1中，找出SortOwn_k＝1中的最大值为TMax，最小值为TMin，k＝1,2,...,ShotNum；

4.3)获取待特效人脸的分类阈值

计算待特效人脸的分类阈值threshold，参照下式(19)：

步骤5：根据分类阈值进行待特效人脸的识别及马赛克特效处理

在镜头k的起始帧数N_Bk和结束帧数N_Ek中遍历，判断Disavg_k,j1,N是否满足下式(20)：

Disavg_k,j1,N＜threshold， (20)

其中，Disavg_k,j1,N为式(12)计算的镜头k中第N帧图像上提取的第j1个人脸区域的人脸特征与Num_f个待特效人脸模板特征的欧氏距离的平均值，j1＝1,2,...,Num_FaceROI′_k，Num_FaceROI′_k为镜头k中每一帧图像上合并重复人脸区域后人脸区域的个数，N＝N_Bk,N_Bk+1,...,N_Ek，k＝1,2,...,ShotNum，threshold为式(19)计算出的分类阈值；

满足式(20)时，镜头k中第N帧图像上提取的第j1个人脸区域被识别为待特效人脸，则对该人脸区域进行马赛克特效处理；

不满足式(20)时，镜头k中第N帧图像上提取的第j1个人脸区域不是待特效人脸，则对该人脸区域不作任何处理；

此后则可通过媒体播放渠道在大众场合进行播出，实现对特定人员的面部形象进行隐私保护。

Claims

1.一种基于人脸识别的视频特效处理方法，其特征在于，按照以下步骤具体实施：

步骤1、对需要处理的视频节目镜头进行分割，具体过程是，

判断Avg_d_i是否满足下式(3)的条件：

Avg_d_i>5×Avg_d_i-1， (3)

步骤2、获取视频中待特效人脸的模板特征，具体过程是，

播放视频，当视频中出现待特效人脸时，手动指定该帧，记该帧的帧数为N_t，N_t∈[1,2,...,NumFrame]，N_Bk<N_t<N_Ek，k∈[1,2,...,ShotNum]，在该帧上手动框选完整的待特效人脸区域，该手动框选的区域称为矩形框，记该矩形框的左上角坐标为(x_L,y_L)，右下角坐标为(x_R,y_R)；

然后判断N_t、N_Bk、N_Ek是否满足下式(4)的条件：

不满足条件①和②时，把指定帧N_t所在镜头k内的所有帧图像作为模板图像帧，即Num_f＝N_Ek-N_Bk+1，此时Num_f<8；

2.2.1)人脸的初检测

2.2.2)排除非人脸的矩形区域

其中的像素值Cb和Cr取值范围分别为：80<Cb<130，135<Cr<170，则该像素为肤色像素，统计矩形区域ROI_i1中肤色像素的个数，记为Num_pixl_i1，判断Num_pixl_i1是否满足下式(6)中的条件：

其中，WROI_i1×HROI_i1是矩形区域ROI_i1的像素总数；

满足式(6)时，则矩形区域ROI_i1是人脸区域，i1∈[1,2,...,Num_ROI]，记为FaceROI_m，记其左上角和右下角的坐标为(x_Lm,y_Lm)和(x_Rm,y_Rm)，其中m＝1,2,...,Num_FaceROI，Num_FaceROI为排除非人脸区域后的人脸区域个数，Num_FaceROI≤Num_ROI；

不满足式(6)时，则矩形区域ROI_i1是非人脸区域；

2.2.3)合并重复检测到的人脸区域

记步骤2.2.2)的人脸区域FaceROI_m的中心点坐标为：

其中，m＝1,2,...,Num_FaceROI，n＝1,2,...,Num_FaceROI，m≠n，

判断Dis_t是否满足公式(8)中的条件：

Dis_t<max((y_Rm-y_Lm),(y_Rn-y_Ln))， (8)

其中，max((y_Rm-y_Lm),(y_Rn-y_Ln))是y_Rm-y_Lm和y_Rn-y_Ln中的较大值，

y_Rm-y_Lm是第m个人脸区域FaceROI_m的高，

y_Rn-y_Ln是第n个人脸区域FaceROI_n的高；

合并满足式(8)中条件的人脸区域，合并后的人脸区域记为FaceROI′_m1，其左上角的坐标是所有被合并的人脸区域左上角坐标的最小值，记为(x'_Lm1,y'_Lm1)，其右下角的坐标是所有被合并的人脸区域右下角坐标的最大值，记为(x'_Rm1,y'_Rm1)，其中，m1＝1,2,...,Num_FaceROI'，Num_FaceROI'≤Num_FaceROI，Num_FaceROI'为合并重复人脸区域后人脸区域的个数；

2.2.4)确定待特效人脸区域

判断步骤2.2.3)中合并后的人脸区域FaceROI'_m1的左上角坐标(x'_Lm1,y'_Lm1)和右下角坐标(x'_Rm1,y'_Rm1)是否满足下式(9)：

不满足式(9)条件的人脸区域FaceROI′_m1为非特效人脸区域；

2.2.5)提取完整的待特效人脸区域

判断FaceROI_M_f的面积是否满足下式(10)中的条件：

2.2.6)提取待特效人脸的模板特征

步骤3、以镜头为单位，计算镜头里每一帧上所检测到的每个人脸区域的人脸特征并按人脸区域的位置对每个人进行分类；

步骤4、确定待特效人脸的分类阈值；

步骤5、根据分类阈值进行待特效人脸的识别及马赛克特效处理；

步骤6、对所有视频帧处理的结果进行保存，通过视频文件写入软件，把保存的帧图像转换成视频，最后把视频部分和音频部分合成一个完整的视频，即成。

2.根据权利要求1所述的基于人脸识别的视频特效处理方法，其特征在于：所述的步骤3中，具体过程是，

对视频镜头k中的每一帧图像用步骤2.2.1)中的方法进行人脸初检测，用步骤2.2.2)中的方法排除非人脸区域，用步骤2.2.3)中的方法合并重复检测到的人脸区域，用步骤2.2.6)中的方法提取每一帧上所检测到的每个人脸区域的人脸特征，

其中，dis_k,j1,N(f)为镜头k中第N帧图像上提取的第j1个人脸区域的人脸特征与第f个待特效人脸模板特征的欧氏距离，f＝1,2,...,Num_f，j1＝1,2,...,Num_FaceROI'_k，Num_FaceROI'_k为镜头k中每一帧图像上合并重复人脸区域后人脸区域的个数，k＝1,2,...,ShotNum，N＝N_Bk,N_Bk+1,...,N_Ek，

在镜头k的起始帧数N_Bk和结束帧数N_Ek中遍历，记镜头k中第N帧第j1个人脸区域的左上角的坐标为(X_k,j1,N,Y_k,j1,N)，人脸区域的宽度为W_k,j1,N，第N+1帧第j1'个人脸区域的左上角的坐标为(X_k,j1',N+1,Y_k,j1',N+1)，

判断X_k,j1,N和X_k,j1',N+1是否满足下式(13)中的条件：

满足式(13)时，则第N帧中的第j1个人脸区域和第N+1帧中的第j1'个人脸区域表示的是镜头k中的同一个人，将j1的Disavg_k,j1,N和j1'的Disavg_k,j1',N+1存放在数组Sort_k,j1中，即数组Sort_k,j1中存放的是镜头k中每一帧的同一个人的人脸特征与Num_f个待特效人脸模板特征的欧氏距离的平均值，

不满足式(13)时，则第N帧中的第j1个人脸区域和第N+1帧中的第j1'个人脸区域表示的不是镜头k中的同一个人，

其中，Disavg_k,j1,N为镜头k中第N帧图像上提取的第j1个人脸区域的人脸特征与Num_f个待特效人脸模板特征的欧氏距离的平均值，Disavg_k,j1',N+1为镜头k中第N+1帧图像上提取的第j1'个人脸区域的人脸特征与Num_f个待特效人脸模板特征的欧氏距离的平均值。

3.根据权利要求2所述的基于人脸识别的视频特效处理方法，其特征在于：所述的步骤4中，具体过程是，

4.1)镜头内的合并

判断镜头k中的Num_FaceROI'_k是否满足下式(14)中的条件：

Num_FaceROI′_k>1， (14)

Num_FaceROI'_k为镜头k中每一帧图像上合并重复人脸区域后人脸区域的个数，

|SMax_k,j1-SMax_k,j1+1|<T， (15)

4.2)镜头间的合并

如果镜头k中的Num_FaceROI'_k不满足式(14)时，将步骤4.1)中的数组Sort_k,j1＝1拷贝到数组SSort_k1中，找出数组SSort_k1中的最大值Max_k1和最小值Min_k1，将数组SortHe_k拷贝到数组SSortHe_k2中，找出数组SSortHe_k2的最大值MaxHe_k2和最小值MinHe_k2，将数组SortOwn_k拷贝到数组SSortOwn_k3中，其中，k1＝1,2,...,k1'，k2＝1,2,...,k2'，k3∈k2，k1'+k2'＝ShotNum，

|MinHe_k2＝1－Max_k1|<T1， (17)

把数组SSortHe_k2添加到数组SSortHe_k2＝1中，k2＝1,2,...,k2'，找出数组SSortHe_k2＝1中最大值为FMax，最小值为FMin，把数组SSortOwn_k3添加到数组SSortOwn_k3＝1中，k3∈k2，找出数组SSortOwn_k3＝1中的最大值为TMax，最小值为TMin；

如果镜头k中的Num_FaceROI'_k满足式(14)中的条件时，把数组SortHe_k添加到数组SortHe_k＝1中，找出数组SortHe_k＝1中的最大值为FMax，最小值为FMin，把数组SortOwn_k添加到数组SortOwn_k＝1中，找出SortOwn_k＝1中的最大值为TMax，最小值为TMin，k＝1,2,...,ShotNum；

4.3)获取待特效人脸的分类阈值

计算待特效人脸的分类阈值threshold，参照下式(19)：

4.根据权利要求3所述的基于人脸识别的视频特效处理方法，其特征在于：所述的步骤5中，具体过程是，

Disavg_k,j1,N<threshold， (20)

其中，Disavg_k,j1,N为式(12)计算的镜头k中第N帧图像上提取的第j1个人脸区域的人脸特征与Num_f个待特效人脸模板特征的欧氏距离的平均值，j1＝1,2,...,Num_FaceROI'_k，Num_FaceROI'_k为镜头k中每一帧图像上合并重复人脸区域后人脸区域的个数，N＝N_Bk,N_Bk+1,...,N_Ek，k＝1,2,...,ShotNum，threshold为式(19)计算出的分类阈值；

不满足式(20)时，镜头k中第N帧图像上提取的第j1个人脸区域不是待特效人脸，则对该人脸区域不作任何处理。