WO2017080196A1

WO2017080196A1 - 基于人脸图像的视频分类方法和装置

Info

Publication number: WO2017080196A1
Application number: PCT/CN2016/084620
Authority: WO
Inventors: 王甜甜
Original assignee: 深圳Tcl新技术有限公司
Priority date: 2015-11-10
Filing date: 2016-06-03
Publication date: 2017-05-18
Also published as: CN105426829A; CN105426829B

Abstract

一种基于人脸图像的视频分类方法和视频分类装置，包括步骤：依次提取视频中的所有关键帧，得到样本帧和待分类帧（S10）；通过预设算法提取样本帧和所述待分类帧中的人脸图像，对所述样本帧中的人脸图像进行标号（S20）；将所述待分类帧中的人脸图像与所述样本帧中包含的人脸图像进行比对，以判断所述待分类帧中的人脸图像所对应的标号（S30）；将具有相同标号的人脸图像的所述待分类帧划分为一类，并将同类的所述待分类帧进行重组以得到具有同一人脸图像的视频片段（S40）。该方法和装置将视频中所有关键帧基于人脸图像进行分类、重组，降低了查询视频中某个人脸图像是否存在时的计算量，缩短了计算时间、提高了查询效率。

Description

基于人脸图像的视频分类方法和装置

技术领域

本发明涉及多媒体领域，尤其涉及一种基于人脸图像的视频分类方法和装置。

背景技术

随着视频数据的大量增加，人们经常需要分析某个人脸图像是否存在于某一段视频中。当用户需要分析一段视频中，是否存在某个特定的人脸图像、以及该人脸图像具体存在于这段视频中的哪个位置时，需要从头到尾读取这段视频，提取视频中所有的人脸图像、然后依次判断各个人脸图像是否为用户需要查找的人脸图像，进而判断该人脸图像存在于视频中的哪个位置。

然而，用户每次执行“判断某个人脸图像是否存在于某一段视频中以及存在于该段视频的具体位置”的操作时，都需要重复提取视频中所有的人脸图像、然后依次与某个人脸图像进行比对分析。因此，操作过程计算量较大，计算时间长、效率较低。

发明内容

本发明的主要目的在于提供一种基于人脸图像的视频分类方法和装置，旨在解决现有技术中查询视频中某个人脸图像是否存在及存在位置时计算量大、计算时间长、效率低的技术问题。

为实现上述目的，本发明提供一种基于人脸图像的视频分类方法，所述方法包括步骤：

依次提取视频中的所有关键帧，将包括所述视频中所有人脸图像的所述关键帧作为样本帧，将所述样本帧以外的所述关键帧作为待分类帧；

通过预设算法提取所述样本帧和所述待分类帧中的人脸图像，并对所述样本帧中的人脸图像进行标号；

将所述待分类帧中的人脸图像与所述样本帧中包含的所述人脸图像进行比对，以判断所述待分类帧中的人脸图像所对应的标号；

将具有相同标号的人脸图像的所述待分类帧划分为一类，并将同类的所述待分类帧进行重组以得到具有同一人脸图像的视频片段；

其中，所述样本帧为所述视频中的第一个所述关键帧，第一个所述关键帧包括所述视频中所有的人脸图像；

所述预设算法为环形对称Gabor变换与局部二值模式相结合的人脸图像提取算法。

优选地，所述预设算法包括以下步骤：

提取所述关键帧中的人脸图像，所述关键帧为所述样本帧或所述待分类帧；

对所述人脸图像进行预处理；

对预处理后的所述人脸图像进行环形对称Gabor变换；

对环形对称Gabor变换后的所述人脸图像进行局部二值模式变换处理，并提取局部二值模式变换后的人脸图像直方图，每一所述人脸图像对应于一所述人脸图像直方图。

优选地，所述“将所述待分类帧中的人脸图像与所述样本帧中包含的所述人脸图像进行比对”具体为：

根据所述待分类帧对应的人脸图像直方图、所述样本帧对应的所有人脸图像直方图，通过欧式距离公式进行计算，以获取所述待分类帧中的人脸图像与所述样本帧包含的所有人脸图像之间的距离，其中距离最小时所述待分类帧中的人脸图像与所述样本帧中对应的人脸图像相同。

此外，为实现上述目的，本发明还提供一种基于人脸图像的视频分类方法，所述方法包括步骤：

将具有相同标号的人脸图像的所述待分类帧划分为一类，并将同类的所述待分类帧进行重组以得到具有同一人脸图像的视频片段。

优选地，所述样本帧为所述视频中的第一个所述关键帧，第一个所述关键帧包括所述视频中所有的人脸图像。

优选地，所述预设算法为环形对称Gabor变换与局部二值模式相结合的人脸图像提取算法。

优选地，所述预设算法包括以下步骤：

对所述人脸图像进行预处理；

对预处理后的所述人脸图像进行环形对称Gabor变换；

此外，为实现上述目的，本发明还提供一种基于人脸图像的视频分类装置，所述装置包括：

第一提取模块，用于依次提取视频中的所有关键帧，将包括所述视频中所有人脸图像的所述关键帧作为样本帧，将所述样本帧以外的所述关键帧作为待分类帧；

第二提取模块，用于通过预设算法提取所述样本帧和所述待分类帧中的人脸图像，并对所述样本帧中的人脸图像进行标号；

比对模块，用于将所述待分类帧中的人脸图像与所述样本帧中包含的所述人脸图像进行比对，以判断所述待分类帧中的人脸图像所对应的标号；

分类重组模块，用于将具有相同标号的人脸图像的所述待分类帧划分为一类，并将同类的所述待分类帧进行重组以得到具有同一人脸图像的视频片段。

优选地，所述第二提取模块包括：

第一提取单元，用于提取所述关键帧中的人脸图像，所述关键帧为所述样本帧或所述待分类帧；

预处理单元，用于对所述人脸图像进行预处理；

变换单元，用于对预处理后的所述人脸图像进行环形对称Gabor变换；

第二提取单元，用于对环形对称Gabor变换后的所述人脸图像进行局部二值模式变换处理，并提取局部二值模式变换后的人脸图像直方图，每一所述人脸图像对应于一所述人脸图像直方图。

优选地，所述比对模块具体为：

与现有技术相比，本发明通过以下步骤：提取视频中的所有关键帧，将包括视频中所有人脸图像的关键帧作为样本帧，将样本帧以外的关键帧作为待分类帧；通过预设算法提取样本帧和待分类帧中的人脸图像，并对样本帧中的人脸图像进行标号；将待分类帧中的人脸图像依次与样本帧中的人脸图像进行比对，将具有相同标号的待分类帧划分为一类并将同类的待分类帧进行重组以得到具有同一人脸图像的视频片段；实现了将视频中所有关键帧基于人脸图像进行分类、重组，进而当判断某个人脸图像是否存在于某一段视频中或存在于该段视频的哪一位置时，无需从头至尾提取视频中所包含的所有人脸图像、并将人脸图像依次比对分析，而只需查找具有相同人脸图像的视频片段即可，大大降低了计算量，缩短了计算时间、提高了效率。

附图说明

图1为本发明基于人脸图像的视频分类方法较佳实施例的流程示意图；

图2为本发明实施例中预设算法的流程示意图；

图3为本发明基于人脸图像的视频分类装置较佳实施例的功能模块示意图；

图4为本发明实施例中第二提取模块的一种功能模块示意图；

图5为本发明中样本帧中的人脸图像进行预处理后的人脸图像的示意图；

图6为本发明中某一人脸图像经环形对称Gabor变换后对应的幅值图像的示意图；

图7为本发明中人脸图像经过环形对称Gabor变换后的纹理图像的示意图；

图8为图7中其中一幅人脸纹理图像经过局部二值模式变换后提取的人脸图像直方图的示意图；

图9为图7中5幅人脸图像叠加到一起的人脸图像直方图的示意图；

图10为本发明中某个待分类帧中与样本帧中的人脸图像与样本帧中第五个人脸图像为同一个人脸图像的直方图匹配结果示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供一种基于人脸图像的视频分类方法。

参照图1，图1为本发明基于人脸图像的视频分类方法较佳实施例的流程示意图。

在本实施例中，所述基于人脸图像的视频分类方法包括：

步骤S10，依次提取视频中的所有关键帧，将包括所述视频中所有人脸图像的所述关键帧作为样本帧，将所述样本帧以外的所述关键帧作为待分类帧；

终端通过摄像头进行采集视频，所述视频包括了I帧、B帧和P帧，其中所述I帧为关键帧，最能体现和代表视频中的重要信息，因此在视频帧的分析过程中，只提取视频的I帧分析。所述终端依次提取所述视频中的所有关键帧，并将包括所述视频中所有人脸图像的关键帧作为样本帧，将所述视频中除所述样本帧以外的关键帧作为待分类帧。其中，所述终端为了能够从所述视频中提取出较为清晰的人脸图像，所述摄像头选择像素高的摄像头。

较优的，所述样本帧为所述视频中的第一个所述关键帧，第一个所述关键帧包括所述视频中所有的人脸图像。如所述终端依次获取所述视频中的每一I帧，并对每一I帧进行序数标号，如所述视频一共包括5个I帧，则将所述5个I帧按顺序标为1、2、3、4和5。其中，所述样本帧为所有I帧中的第一个I帧，所述第一个I帧中包括所述视频中所有的人脸图像，所述待分类帧为剩余的I帧，即剩余4个I帧为待分类帧。

步骤S20，通过预设算法提取所述样本帧和所述待分类帧中的人脸图像，并对所述样本帧中的人脸图像进行标号；

所述终端通过预设算法提取所述样本帧和所述待分类帧中的人脸图像，并对所述样本帧中的人脸图像进行标号。其中，所述预设算法包括但不限于环形对称Gabor变换与局部二值模式(LBP，Local Binary Pattern)相结合的人脸图像提取算法，所述预设算法还可以为基于模板匹配的方法、基于奇异值特征方法和子空间分析法等的人脸图像提取算法。其中，在本实施例中，所述预设算法为环形对称Gabor变换与局部二值模式(LBP)相结合的人脸图像提取算法。如所述终端通过环形对称Gabor变换与局部二值模式(LBP)相结合的算法从所述样本帧中提取到10个人脸图像，并对这10个人脸图像进行标号，依次标记为A、B、C、D、E、F、G、H、I和J，其中，A表示所述样本帧中的第一个人脸图像、B表示所述样本帧中的第二个人脸图像、C表示所述样本帧中的第三个人脸图像等。所述环形对称Gabor变换CSGT(Circularly Symmetric Gabor Transform，环形对称Gabor变换)是5个尺度多个方向的一种小波变换，它将一幅图像变换为5个尺度多个方向上的图像。在本实施例中，所述终端为了归一化所述样本帧中的人脸图像和所述待分类帧中的人脸图像，将所述样本帧中的人脸图像和所述待分类帧中的人脸图像设置为指定大小区域的图像，如设置的指定区域的大小为54*54。所述终端通过环形对称Gabor变换与局部二值模式LBP相结合的算法从所述待分类帧中提取人脸图像。

提取人脸图像的纹理信息的传统方法为GT(Gabor Transform，Gabor变换)和所述LBP相结合的算法，在利用所述GT进行人脸图像的纹理信息的滤波提取过程中，首先将所述人脸图像经过所述GT变换，得到滤波后的人脸图像，所述GT变换是针对5个尺度8个方向的变换，即生成40幅滤波图像，然后再对所述40幅滤波图像进行所述LBP变换，最后进行人脸图像的识别。该方法计算复杂度过高，且计算时间过长，导致视频的读取分析时间长，效率低。而本实施例是通过将所述CSGT和所述LBP相结合的算法提取人脸图像的纹理信息，所述人脸图像经过所述CSGT变换后生成5幅滤波图像进行叠加，重组成5幅滤波图像，然后对重组后的滤波图像进行能量提取，以提取出最能描述所述人脸图像的纹理信息的图像，再对所述纹理图像信息进行所述LBP变换。相对于采用所述GT和所述LBP相结合的人脸识别算法，只需要计算5幅滤波图像，相对比计算40幅滤波图像，降低了计算量，减少了计算时间。

步骤S30，将所述待分类帧中的人脸图像与所述样本帧中包含的所述人脸图像进行比对，以判断所述待分类帧中的人脸图像所对应的标号；

所述终端将所述待分类帧中的人脸图像与所述样本帧中包含的人脸图像进行比对，以判断所述待分类中的人脸图像在所述样本帧中所对应的标号。如将所述终端待分类帧(2、3、4和5I帧)中的人脸图像与所述样本帧中A、 B、C、D、E、F、G、H、I和J这10个人脸图像进行比对，得到所述第2I帧和第3I帧中的人脸图像与A人脸图像一致，即所述第2I帧和第3I帧中的人脸图像对应着A标号；或得到所述第2I帧、4I帧和第5I帧中的人脸图像与D人脸图像一致，即所述第2I帧、4I帧和第5I帧中的人脸图像对应着D标号。需要说明的是，待分类帧中可能不仅包括一个人脸图像，当包括两个以上人脸图像时，同一待分类帧可能属于不同的分类，进而可能存在于不同的视频片段中。

步骤40，将具有相同标号的人脸图像的所述待分类帧划分为一类，并将同类的所述待分类帧进行重组以得到具有同一人脸图像的视频片段。

所述终端将具有相同标号的人脸图像的所述待分类帧划分为一类，并将同类的所述待分类帧进行重组以得到具有同一人脸图像的视频片段。如所述终端将所述待分类帧中具有标号A的人脸图像的第2I帧和第3I帧划分为同一类帧，即将所述待分类帧中的第2I帧和第3I帧划分为包含A人脸图像的I帧，并将所述第2I帧和所述第3I帧进行重组，得到具有A人脸图像的视频片段；所述终端将所述待分类帧中具有标号D的人脸图像的第2I帧、4I帧和第5I帧划分为同一类帧，即将所述待分类帧中的第2I帧、4I帧和第5I帧划分为包含D人脸图像的I帧，并将所述第2I帧、所述4I帧和所述第5I帧进行重组，得到具有D人脸图像的视频片段。

本实施例通过提取视频中的所有关键帧，将包括视频中所有人脸图像的关键帧作为样本帧，将样本帧以外的关键帧作为待分类帧；通过预设算法提取样本帧和待分类帧中的人脸图像，并对样本帧中的人脸图像进行标号；将待分类帧中的人脸图像依次与样本帧中的人脸图像进行比对，将具有相同标号的待分类帧划分为一类并将同类的待分类帧进行重组以得到具有同一人脸图像的视频片段；实现了将视频中所有关键帧基于人脸图像进行分类、重组，进而当判断某个人脸图像是否存在于某一段视频中或存在于该段视频的哪一位置时，无需从头至尾提取视频中所包含的所有人脸图像、并将人脸图像依次比对分析，而只需查找具有相同人脸图像的视频片段即可，大大降低了计算量，缩短了计算时间、提高了效率。

参照图2，图2为本发明一实施例中预设算法的流程示意图。

在本实施例中，所述预设算法包括：

步骤S21，提取关键帧中的人脸图像，其中关键帧为样本帧或待分类帧；

步骤S22，对所述人脸图像进行预处理；

所述终端提取所述关键帧中的人脸图像，即提取所述样本帧中的人脸图像或提取所述待分类帧中的人脸图像，并对所述样本帧中提取的人脸图像和所述待分类帧中提取的人脸图像进行预处理，得到所述样本帧中预处理后的人脸图像和所述待分类帧中预处理后的人脸图像。所述预处理包括灰度变换、人脸图像直方图的均衡化、中值滤波和同态滤波等。其中，所述灰度变换、人脸图像直方图的均衡化、中值滤波和同态滤波等的执行先后顺序可以变换。如所述终端对所样本帧中的A、B、C、D、E、F、G、H、I和J这10个人脸图像进行灰度变换、人脸图像直方图的均衡化、中值滤波和同态滤波等操作，得到预处理后的A、B、C、D、E、F、G、H、I和J的人脸图像，并对所述待分类帧中的4个I帧中的人脸图像进行预处理，得到4个I帧中预处理后的人脸图像。具体地，参照图5，图5为本发明样本帧中的人脸图像进行预处理后的人脸图像的示意图。

进一步地，所述对人脸图像进行预处理包括：

对所述人脸图像进行灰度变换；

所述终端所述样本帧中的人脸图像和待分类帧中的人脸图像进行灰度变换，得到所述样本帧中和待分类帧中进行灰度变换后的人脸图像。所述灰度变换又称为灰度拉伸和对比度拉伸，它是最基本的一种点操作，根据原始图像中每个像素的灰度值，按照某种映射规则，将其变换为另一种灰度值，通过对原始图像中每个像素赋一个新的灰度值来达到增强图像的目的。

对所述灰度变换后的人脸图像进行人脸图像直方图的均衡化处理。

所述终端对所述灰度变换后的人脸图像进行人脸图像直方图的均衡化处理，得到所述样本帧中和待分类帧中进行直方图均衡化处理的人脸图像，即对应得到预处理后的人脸图像。所述人脸图像直方图的均衡化的步骤为：①统计所述灰度变换后的人脸图像直方图；②根据统计出的人脸图像直方图采用累积分布函数做变换，求得变换后的新灰度；③用所述新灰度代替旧灰度，这一步是近似的过程，应根据合理的目的尽量做到合理，同时把灰度值相等或近似的合并在一起。

进一步地，所述终端对所述样本帧中的人脸图像和待分类帧中的人脸图像进行中值滤波，所述中值滤波是把局部区域的像素按灰度等级进行排序，取该领域中灰度的中值作为当前像素的灰度值。所述中值滤波的步骤为：①将滤波模板在图像中漫游，并将模板中心与图中某个像素位置重合；②读取模板中各对应像素的灰度值；③将这些灰度值从小到大排列；④取这一列数据的中间数据赋给对应模板中心位置的像素。所述终端对所述样本帧中的人脸图像和待分类帧中的人脸图像进行同态滤波。所述同态滤波是将图像乘积形式的亮度模型(非可加性)变成可加形式，以便进行滤波增强处理。所述同态滤波的步骤为：①对亮度函数两边作对数变换，再取傅氏变换；②通过统一滤波器；③对滤波器的输出取傅氏反变换，再取指数变换。选取合适的滤波器，可以适当压缩照度分量的动态范围，同时适当提升反射度分量，可以改善图像对比度，突出物体轮廓。

步骤S23，对预处理后的所述人脸图像进行环形对称Gabor变换；

所述终端对所述样本帧中预处理后的人脸图像进行环形对称Gabor变换，得到所述样本帧中经过环形对称Gabor变换的人脸图像，即得到所述样本帧中经过CSGT变换的人脸图像；所述终端对所述待分类帧中预处理后的人脸图像进行环形对称Gabor变换，得到所述待分类帧中经过环形对称Gabor变换的人脸图像，即得到所述待分类帧中经过CSGT变换的人脸图像。具体地，参照图6和图7，图6为本发明中某一人脸图像经环形对称Gabor变换后对应的幅值图像的示意图，其中，所述图6是以所述样本帧中的A人脸图像为例，即所述图6表示所述A人脸图像经过环形对称Gabor变换后所对应的幅值图像；图7为本发明中人脸图像经过环形对称Gabor变换后的纹理图像的示意图，其中，所述图7是以所述样本帧中的A人脸图像为例，即图7表示所述A人脸图像经过环形对称Gabor变换后所对应的纹理图像。

步骤S24，对环形对称Gabor变换后的所述人脸图像进行局部二值模式变换处理，并提取局部二值模式变换后的人脸图像直方图，每一所述人脸图像对应于一所述人脸图像直方图。

所述终端对所述样本帧中环形对称Gabor变换后的人脸图像进行所述LBP变换，得到所述样本帧中经过所述LBP变换后的人脸图像，从所述LBP变换后的人脸图像中提取人脸图像直方图，每一所述人脸图像对应于一所述人脸图像直方图。如提取所述样本帧中A、B、C、D、E、F、G、H、I和J这10个人脸图像对应的人脸图像直方图；所述终端对所述待分类帧中环形对称Gabor变换后的人脸图像进行所述LBP变换，得到所述样本帧中LBP变换后的人脸图像，从所述LBP变换后的人脸图像中提取人脸图像直方图，每一所述人脸图像对应于一所述人脸图像直方图。如提取所述4个I帧中的人脸图像直方图。具体地，参照图8和图9，图8为图7中其中一幅人脸纹理图像经过局部二值模式变换后提取的人脸图像直方图的示意图，本实施例中图8表示所述A人脸图像经过环形对称Gabor变换后所得的五幅人脸纹理图像中，其中一幅人脸纹理图像经过所述局部二值模式(LBP)变换后所提取的人脸图像直方图，图9为图7中5幅人脸图像叠加到一起的人脸图像直方图的示意图，即图9表示将经过环形对称Gabor变换和所述局部二值模式(LBP)变换后所得的五幅A人脸图像直方图叠加到一起的示意图。若所述待分类帧中存在多个人脸图像，则会生成多个如图9所示的人脸图像直方图的示意图。

进一步地，所述“将所述待分类帧中的人脸图像与所述样本帧中包含的所述人脸图像进行比对”具体为：

所述终端根据所述待分类帧对应的人脸图像直方图、所述样本帧对应的所有人脸图像直方图，通过欧式距离公式进行计算，以获取所述待分类帧中的人脸图像与所述样本帧包含的所有人脸图像之间的距离，其中距离最小时所述待分类帧中的人脸图像与所述样本帧中对应的人脸图像相同。所述欧式距离公式为：

其中，(x_i，y_i)为对应的待分类帧中第i个人脸图像的位置坐标，(x_j，y_j)为样本帧的第j个人脸图像的位置坐标，D_i，j为所述待分类帧中第i个人脸图像与所述样本帧第j个样本人脸图像的距离。具体地，参照图10，图10为本发明中某个待分类帧中的人脸图像与样本帧中某个人脸图像为同一个人脸图像的直方图匹配结果示意图，例如：图10表示第2I帧中的人脸图像与样本帧中的第5个人脸图像(即人脸图像E)相同，即第2I帧对应的标号有E。

本发明进一步提供一种基于人脸图像的视频分类装置。

参照图3，图3为本发明基于人脸图像的视频分类装置较佳实施例的功能模块示意图。

在本实施例中，所述基于人脸图像的视频分类装置包括：

第一提取模块10，用于依次提取视频中的所有关键帧，将包括所述视频中所有人脸图像的所述关键帧作为样本帧，将所述样本帧以外的所述关键帧作为待分类帧；

第二提取模块20，用于通过预设算法提取所述样本帧和所述待分类帧中的人脸图像，并对所述样本帧中的人脸图像进行标号；

比对模块30，用于将所述待分类帧中的人脸图像与所述样本帧中包含的所述人脸图像进行比对，以判断所述待分类帧中的人脸图像所对应的标号；

所述终端将所述待分类帧中的人脸图像与所述样本帧中包含的人脸图像进行比对，以判断所述待分类中的人脸图像在所述样本帧中所对应的标号。如将所述终端待分类帧(2、3、4和5I帧)中的人脸图像与所述样本帧中A、B、C、D、E、F、G、H、I和J这10个人脸图像进行比对，得到所述第2I帧和第3I帧中的人脸图像与A人脸图像一致，即所述第2I帧和第3I帧中的人脸图像对应着A标号；或得到所述第2I帧、4I帧和第5I帧中的人脸图像与D人脸图像一致，即所述第2I帧、4I帧和第5I帧中的人脸图像对应着D标号。需要说明的是，待分类帧中可能不仅包括一个人脸图像，当包括两个以上人脸图像时，同一待分类帧可能属于不同的分类，进而可能存在于不同的视频片段中。

分类重组模块40，用于将具有相同标号的人脸图像的所述待分类帧划分为一类，并将同类的所述待分类帧进行重组以得到具有同一人脸图像的视频片段。

参照图4，图4为本发明实施例中第二提取模块的一种功能模块示意图。

在本实施例中，所述第二提取模块20包括：

第一提取单元21，用于提取关键帧中的人脸图像，其中关键帧为样本帧或待分类帧；

预处理单元22，用于对所述人脸图像进行预处理；

进一步地，所述对人脸图像进行预处理包括：

对所述人脸图像进行灰度变换；

变换单元23，用于对预处理后的所述人脸图像进行环形对称Gabor变换；

所述终端对所述样本帧中预处理后的人脸图像进行环形对称Gabor变换，得到所述样本帧中经过环形对称Gabor变换的人脸图像，即得到所述样本帧中经过CSGT变换的人脸图像；所述终端对所述待分类帧中预处理后的人脸图像进行环形对称Gabor变换，得到所述待分类帧中经过环形对称Gabor变换的人脸图像，即得到所述待分类帧中经过CSGT变换的人脸图像。具体地，参照图6和图7，图6为本发明中某一人脸图像经环形对称Gabor变换后对应的幅值图像的示意图，其中，所述图6是以所述样本帧中的A人脸图像为例，即所述图6表示所述A人脸图像经过环形对称Gabor变换后所对应的幅值图像；图7为本发明中人脸图像经过环形对称Gabor变换后的纹理图像的示意图，其中，所述图 7是以所述样本帧中的A人脸图像为例，即图7表示所述A人脸图像经过环形对称Gabor变换后所对应的纹理图像。

第二提取单元24，用于对环形对称Gabor变换后的所述人脸图像进行局部二值模式变换处理，并提取局部二值模式变换后的人脸图像直方图，每一所述人脸图像对应于一所述人脸图像直方图。

进一步地，所述比对模块30具体为：根据所述待分类帧对应的人脸图像直方图、所述样本帧对应的所有人脸图像直方图，通过欧式距离公式进行计算，以获取所述待分类帧中的人脸图像与所述样本帧包含的所有人脸图像之间的距离，其中距离最小时所述待分类帧中的人脸图像与所述样本帧中对应的人脸图像相同。

所述终端根据所述待分类帧对应的人脸图像直方图、所述样本帧中对应的所有人脸图像直方图，通过欧式距离公式进行计算，以获取所述待分类帧中的人脸图像与所述样本帧包含的所有人脸图像之间的距离，其中距离最小时所述待分类帧中的人脸图像与所述样本帧中对应的人脸图像相同。所述欧式距离公式为：

其中，(x_i，y_i)为对应的待分类帧中第i个人脸图像的位置坐标，(x_j，y_j)为样本帧的第j个人脸图像的位置坐标，D_i，j为所述待分类帧中第i个人脸图像与所述样本帧第j个样本人脸图像的距离。具体地，参照图10，图10为本发明中某个待分类帧中的人脸图像与样本帧中某个个人脸图像为同一个人脸图像的直方图匹配结果示意图，例如：图10表示第2I帧中的人脸图像与样本帧中的第5个人脸图像(即人脸图像E)相同，即第2I帧对应的标号有E。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

一种基于人脸图像的视频分类方法，其特征在于，所述基于人脸图像的视频分类方法包括以下步骤：

依次提取视频中的所有关键帧，将包括所述视频中所有人脸图像的所述关键帧作为样本帧，将所述样本帧以外的所述关键帧作为待分类帧；

通过预设算法提取所述样本帧和所述待分类帧中的人脸图像，并对所述样本帧中的人脸图像进行标号；

将所述待分类帧中的人脸图像与所述样本帧中包含的所述人脸图像进行比对，以判断所述待分类帧中的人脸图像所对应的标号；

将具有相同标号的人脸图像的所述待分类帧划分为一类，并将同类的所述待分类帧进行重组以得到具有同一人脸图像的视频片段；

其中，所述样本帧为所述视频中的第一个所述关键帧，第一个所述关键帧包括所述视频中所有的人脸图像；

所述预设算法为环形对称Gabor变换与局部二值模式相结合的人脸图像提取算法。
如权利要求1所述的基于人脸图像的视频分类方法，其特征在于，所述预设算法包括以下步骤：

提取所述关键帧中的人脸图像，所述关键帧为所述样本帧或所述待分类帧；

对所述人脸图像进行预处理；

对预处理后的所述人脸图像进行环形对称Gabor变换；

对环形对称Gabor变换后的所述人脸图像进行局部二值模式变换处理，并提取局部二值模式变换后的人脸图像直方图，每一所述人脸图像对应于一所述人脸图像直方图。
如权利要求2所述的基于人脸图像的视频分类方法，其特征在于，所述“将所述待分类帧中的人脸图像与所述样本帧中包含的所述人脸图像进行比对”具体为：

根据所述待分类帧对应的人脸图像直方图、所述样本帧对应的所有人脸图像直方图，通过欧式距离公式进行计算，以获取所述待分类帧中的人脸图像与所述样本帧包含的所有人脸图像之间的距离，其中距离最小时所述待分类帧中的人脸图像与所述样本帧中对应的人脸图像相同。
一种基于人脸图像的视频分类方法，其特征在于，所述基于人脸图像的视频分类方法包括以下步骤：

依次提取视频中的所有关键帧，将包括所述视频中所有人脸图像的所述关键帧作为样本帧，将所述样本帧以外的所述关键帧作为待分类帧；

通过预设算法提取所述样本帧和所述待分类帧中的人脸图像，并对所述样本帧中的人脸图像进行标号；

将所述待分类帧中的人脸图像与所述样本帧中包含的所述人脸图像进行比对，以判断所述待分类帧中的人脸图像所对应的标号；

将具有相同标号的人脸图像的所述待分类帧划分为一类，并将同类的所述待分类帧进行重组以得到具有同一人脸图像的视频片段。
如权利要求4所述的基于人脸图像的视频分类方法，其特征在于，所述样本帧为所述视频中的第一个所述关键帧，第一个所述关键帧包括所述视频中所有的人脸图像。
如权利要求4所述的基于人脸图像的视频分类方法，其特征在于，所述预设算法为环形对称Gabor变换与局部二值模式相结合的人脸图像提取算法。
如权利要求6所述的基于人脸图像的视频分类方法，其特征在于，所述预设算法包括以下步骤：

提取所述关键帧中的人脸图像，所述关键帧为所述样本帧或所述待分类帧；

对所述人脸图像进行预处理；

对预处理后的所述人脸图像进行环形对称Gabor变换；

对环形对称Gabor变换后的所述人脸图像进行局部二值模式变换处理，并提取局部二值模式变换后的人脸图像直方图，每一所述人脸图像对应于一所述人脸图像直方图。
如权利要求7所述的基于人脸图像的视频分类方法，其特征在于，所述“将所述待分类帧中的人脸图像与所述样本帧中包含的所述人脸图像进行比对”具体为：

根据所述待分类帧对应的人脸图像直方图、所述样本帧对应的所有人脸图像直方图，通过欧式距离公式进行计算，以获取所述待分类帧中的人脸图像与所述样本帧包含的所有人脸图像之间的距离，其中距离最小时所述待分类帧中的人脸图像与所述样本帧中对应的人脸图像相同。
一种基于人脸图像的视频分类装置，其特征在于，所述基于人脸图像的视频分类装置包括：

第一提取模块，用于依次提取视频中的所有关键帧，将包括所述视频中所有人脸图像的所述关键帧作为样本帧，将所述样本帧以外的所述关键帧作为待分类帧；

第二提取模块，用于通过预设算法提取所述样本帧和所述待分类帧中的人脸图像，并对所述样本帧中的人脸图像进行标号；

比对模块，用于将所述待分类帧中的人脸图像与所述样本帧中包含的所述人脸图像进行比对，以判断所述待分类帧中的人脸图像所对应的标号；

分类重组模块，用于将具有相同标号的人脸图像的所述待分类帧划分为一类，并将同类的所述待分类帧进行重组以得到具有同一人脸图像的视频片段。
如权利要求9所述的基于人脸图像的视频分类装置，其特征在于，所述样本帧为所述视频中的第一个所述关键帧，第一个所述关键帧包括所述视频中所有的人脸图像。
如权利要求9所述的基于人脸图像的视频分类装置，其特征在于，所述预设算法为环形对称Gabor变换与局部二值模式相结合的人脸图像提取算法。
如权利要求11所述的基于人脸图像的视频分类装置，其特征在于，所述第二提取模块包括：

第一提取单元，用于提取所述关键帧中的人脸图像，所述关键帧为所述样本帧或所述待分类帧；

预处理单元，用于对所述人脸图像进行预处理；

变换单元，用于对预处理后的所述人脸图像进行环形对称Gabor变换；

第二提取单元，用于对环形对称Gabor变换后的所述人脸图像进行局部二值模式变换处理，并提取局部二值模式变换后的人脸图像直方图，每一所述人脸图像对应于一所述人脸图像直方图。
如权利要求12所述的基于人脸图像的视频分类装置，其特征在于，所述比对模块具体为：

根据所述待分类帧对应的人脸图像直方图、所述样本帧对应的所有人脸图像直方图，通过欧式距离公式进行计算，以获取所述待分类帧中的人脸图像与所述样本帧包含的所有人脸图像之间的距离，其中距离最小时所述待分类帧中的人脸图像与所述样本帧中对应的人脸图像相同。