CN105046227B

CN105046227B - 一种针对人像视频系统的关键帧获取方法

Info

Publication number: CN105046227B
Application number: CN201510442187.5A
Authority: CN
Inventors: 陈远浩
Original assignee: Shanghai Is According To Figure Network Technology Co Ltd
Current assignee: Shanghai Yitu Information Technology Co., Ltd.
Priority date: 2015-07-24
Filing date: 2015-07-24
Publication date: 2018-07-31
Anticipated expiration: 2035-07-24
Also published as: WO2017016515A1; CN105046227A; PH12018500287A1; SG11201801050VA

Abstract

本发明涉及一种针对人像视频系统的关键帧获取方法，包括以下步骤：1)获取视频图像，对每帧图像均进行关键点检测；2)根据所检测的关键点对每帧图像进行属性分类，并计算各属性下的置信度；3)根据每帧图像在不同属性下的置信度选取P帧关键帧，作为人脸识别的基础。与现有技术相比，本发明对关键帧选取过程进行了改进，既保证了速度，又具有较高的识别性能。

Description

一种针对人像视频系统的关键帧获取方法

技术领域

本发明涉及视频处理技术领域，尤其是涉及一种针对人像视频系统的关键帧获取方法。

背景技术

人像视频系统中人脸识别是最核心的模块。在大部分人像系统中，对于经过人员，都会得到对应的轨迹。单个人员的轨迹可以表示为K帧图像上的矩形框的集合。人像视频系统中人脸识别模块输入的是一个人的轨迹，输出该人的身份。

相对于人像图像系统的识别模块，人像视频系统的主要区别是它需要挑选合适的帧上的人脸进行识别。最简单的方式是对K帧图像都进行识别，这会导致系统速度变慢，因为识别模块的时间开销是非常大的(1帧1秒时间，而一个人每秒中有24帧图像)。常见做法是选择最正脸的P帧(P约等于3)，这样保证速度，但是识别性能会受影响。

因此，需要开发一种既能保证处理效率，又影响识别性能的新方法。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种针对人像视频系统的关键帧获取方法，通过该方法选取关键帧后再进行人脸识别，既保证了速度，又具有较高的识别性能。

本发明的目的可以通过以下技术方案来实现：

一种针对人像视频系统的关键帧获取方法，包括以下步骤：

1)获取视频图像，对每帧图像均进行关键点检测；

2)根据所检测的关键点对每帧图像进行属性分类，并计算各属性下的置信度；

3)根据每帧图像在不同属性下的置信度选取P帧关键帧，作为人脸识别的基础。

所述步骤1)中，关键点检测具体为：

首先利用HoG与SVM结合方法进行第一轮关键点检测，每个关键点都保留K种选项；然后利用全局形状信息，在K^N种可能中找出最像人脸的形状，作为最终的关键点，N为关键点数目。

所述属性包括光照强烈、光照昏暗、光照不均、模糊分类、张嘴分类、闭眼分类、姿态估计和尺寸。

所述计算各属性下的置信度具体为：

a)光照强烈：基于LBP和Gray Grid特征向量，使用Boosting分类器得到光照强烈的置信度S1；

b)光照昏暗：基于LBP和Gray Grid特征向量，使用Boosting分类器得到光照昏暗的置信度S2；

c)光照不均：基于LBP和Gray Grid特征向量，使用Boosting分类器得到光照不均的置信度S3

d)模糊分类：基于LPSS、梯度直方图、色彩饱和度分布和局部自相关性特征向量，使用boosting分类器得到模糊的置信度S4；

e)张嘴分类：使用LBP与SVM结合方法进行张嘴分类，得到置信度S5；

f)闭眼分类：使用LBP与SVM结合方法进行闭眼分类，得到置信度S6；

g)姿态估计：使用POSIT方法估计X轴、Y轴和Z轴的旋转角度，通过LogisticFunction将各方向轴旋转角度转换成置信度S7、S8和S9；

h)尺寸：先将实际人脸尺寸除以标准尺寸，再转化成置信度S10。

所述标准尺寸取为150pixels×150pixels。

所述步骤3)中，选取P帧关键帧的具体过程为：

301)将每帧图像不同属性下的置信度组合，作为该帧图像的特征向量(S1k,S2k,…,S10k)，k表示第k帧；

302)将所述特征向量输入第一SVM分类器中，计算每帧图像在该第一SVM分类器中的得分Score，以Score最大的帧作为第一帧关键帧选出；

303)将未选出的帧和上一步骤中已选出的帧的特征向量组合作为该未选出的帧的新特征向量输入第二SVM分类器，计算各未选出的帧的在该第二SVM分类器中的得分Score，以Score最大的帧作为第二帧关键帧选出；

304)采用与步骤303)相同方法选出剩余P-2帧。

所述P取为3。

与现有技术相比，本发明具有以下优点：

(1)本发明在已知关键点的情况下，对图像进行了属性分类，获取各属性下的置信度，根据该置信度选取关键帧，提高了所选取的关键帧的精度；

(2)本发明在选取关键帧时不仅考虑各帧本身的特征向量，还对已选出的帧的特征向量进行综合考虑，参考了不同帧之间的协同合作信息，进一步提高了所选取关键帧的精度，保证了识别性能；

(3)本发明通过选取关键帧进行识别，保证了识别速度。

附图说明

图1为本发明的结构示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

如图1所示，本实施例提供一种针对人像视频系统的关键帧获取方法，该方法考虑了多张图像间因素的影响，也考虑到不同帧之间协同合作的信息，具体步骤如下：

步骤S1，获取视频图像，对每帧图像均进行关键点检测。关键点检测过程的输入是图像和人脸框的位置，输出是关键点位置。这里利用HoG+SVM做第一轮关键点检测，每个关键点都保留K种选项；然后利用全局形状信息，在K^N种可能中找出最像人脸的形状，获取关键点，N是关键点数目。

步骤S2，根据所检测的关键点对每帧图像进行属性分类，并计算各属性下的置信度，这里的属性包括光照强烈、光照昏暗、光照不均、模糊分类、张嘴分类、闭眼分类、姿态估计和尺寸，具体置信度的计算如下：

d)模糊分类：使用boosting分类器得到模糊的置信度S4，所采用的特征主要是：

d1)LPSS(Local Power Spectrum Slope)：模糊图像丢失了高频区域的信息，因此在低频区域占的能量比较高，因此可以将图像做傅立叶变换，得到不同频率的能量作为特征向量；

d2)梯度直方图：模糊图像中强边缘的点非常少，梯度强度一定程度上刻画了边缘强度，因此使用梯度直方图也是一种描述模糊的方式；

d3)色彩饱和度分布：清晰图像的色彩饱和度远远超过模糊图像；

d4)局部自相关性：在运动模糊中，物体和背景都会变模糊，除了和运动方向相同的边缘，该特点一是可以通过描述频谱形状特征描述，二是可以通过StructuralSIMilarity(SSIM)描述。

h)尺寸：先将实际人脸尺寸除以标准尺寸，标准尺寸取为150pixels×150pixels，再转化成置信度S10。

上述各置信度的取值范围均为(-1,1)。

步骤S3，根据每帧图像在不同属性下的置信度选取P帧关键帧，作为人脸识别的基础。

以P取为3为例，选取关键帖的具体过程为：

302)将所述特征向量输入第一SVM分类器中，计算每帧图像在该第一SVM分类器中的得分Score，以Score最大的帧作为第一帧关键帧选出，此时特征向量维度为10维；

303)将未选出的帧和上一步骤中已选出的帧的特征向量组合作为该未选出的帧的新特征向量输入第二SVM分类器，计算各未选出的帧的在该第二SVM分类器中的得分Score，以Score最大的帧作为第二帧关键帧选出，此时特征向量维度为20维；

304)采用与步骤303)相同方法选出第三帧关键帧，此时特征向量维度为30维。

该方法在保证最小计算量(在普通4核达到实时)的情况下，保证了性能最优。

Claims

1.一种针对人像视频系统的关键帧获取方法，其特征在于，包括以下步骤：

1)获取视频图像，对每帧图像均进行关键点检测；

3)根据每帧图像在不同属性下的置信度选取P帧关键帧，作为人脸识别的基础；

所述属性包括光照强烈、光照昏暗、光照不均、模糊分类、张嘴分类、闭眼分类、姿态估计和尺寸；

所述计算各属性下的置信度具体为：

c)光照不均：基于LBP和Gray Grid特征向量，使用Boosting分类器得到光照不均的置信度S3；

g)姿态估计：使用POSIT方法估计X轴、Y轴和Z轴的旋转角度，通过Logistic Function将各方向轴旋转角度转换成置信度S7、S8和S9；

h)尺寸：先将实际人脸尺寸除以标准尺寸，再转化成置信度S10，所述标准尺寸取为150pixels×150pixels。

2.根据权利要求1所述的针对人像视频系统的关键帧获取方法，其特征在于，所述步骤1)中，关键点检测具体为：

3.根据权利要求1所述的针对人像视频系统的关键帧获取方法，其特征在于，所述步骤3)中，选取P帧关键帧的具体过程为：

303)将未选出的帧和上一步骤中已选出的帧的特征向量组合作为该未选出的帧的新特征向量输入第二SVM分类器，计算各未选出的帧在该第二SVM分类器中的得分Score，以Score最大的帧作为第二帧关键帧选出；

304)采用与步骤303)相同方法选出剩余P-2帧。

4.根据权利要求3所述的针对人像视频系统的关键帧获取方法，其特征在于，所述P取为3。