CN114694233A

CN114694233A - 一种基于多特征的考场监控视频图像中人脸定位方法

Info

Publication number: CN114694233A
Application number: CN202210611129.0A
Authority: CN
Inventors: 刘说; 潘帆; 李翔; 赵启军; 黄珂; 杨玲; 杨智鹏
Original assignee: Chengdu University of Information Technology
Current assignee: Chengdu University of Information Technology
Priority date: 2022-06-01
Filing date: 2022-06-01
Publication date: 2022-07-01
Anticipated expiration: 2042-06-01
Also published as: CN114694233B

Abstract

本发明涉及一种基于多特征的考场监控视频图像中人脸定位方法，主要包括：首先基于SSD目标检测框架，建立针对考场监控视频图像数据中人的头发区域定位的目标检测深度学习模型，对考生头发区域定位，然后对考场监控视频图像数据在不同颜色空间进行基于阈值的像素点检测，并且引入多次索引图像更新方案，实现对皮肤区域的定位，最后将头发区域、皮肤区定位结果进行基于锚框翻转的融合，最终实现人脸的定位，该方法提高了对考场监控视频图像中人脸定位的准确性、可靠性及泛化能力。

Description

一种基于多特征的考场监控视频图像中人脸定位方法

技术领域

本发明属于图像处理、人工智能领域，具体涉及一种基于多特征的考场监控视频图像中人脸定位方法。

背景技术

在世界范围内，考试一直作为重要的检验、选拔手段广泛使用，这是由于其在一定程度上能确保公平、公正。然而为了顺利通过考试，存在各种各样作弊手段，为了保证考试的公平、公正原则，考试监控系统大量应用于各类考试中。然而，考场拥有了视频监控系统，却并不意味着能很好的解决作弊问题。

这是由于视频监控虽然能较为完整的记录考场信息，但是是否存在考试作弊行为，仍然需要相关部门投入大量的人力去对这些视频数据进行后期的处理和审查，其中很大比例的视频中是没有作弊行为的，但每一段视频都需要经过相关人员的仔细审查，由此产生了大量的工作量，由此产生了对考场监控视频中考生的行为进行自动识别的需求，而如何对考场监控视频中考生进行定位，则成为了一个必须解决的关键问题。

对于考场监控视频检测定位方法大致可以分为基于背景差分的方法、基于模板匹配的方法、基于图像特征的方法，这些方法存在检测范围有限，对于考场布局的依赖性较大等问题。

发明内容

本发明针对上述现有技术的不足，提出了一种考场监控视频图像中考生定位方法，包括以下步骤：

步骤1：基于SSD目标检测框架，建立针对考场监控视频图像数据中人的头发区域定位的目标检测深度学习模型；

步骤2：将考场监控视频初始图像数据输入到目标检测深度学习模型中，得到对考场监控视频图像数据中的人的头发区域的初步框选定位结果；

步骤3：对考场监控视频初始图像数据进行皮肤区域定位，首先将初始图像数据进行颜色空间变换，然后在不同颜色空间进行基于阈值的像素点检测，再对像素点检测结果进行形态学处理，最终得到考场监控视频图像数据中的皮肤区域定位结果；

步骤4：将步骤2所得的对考场监控视频图像数据中的人的头发区域的初步框选定位结果和步骤3所得的考场监控视频图像数据中的皮肤区域定位结果进行融合，得到对考场监控视频图像数据中的人脸定位结果。

进一步的，步骤3：对考场监控视频初始图像数据进行皮肤区域定位，将初始图像数据进行颜色空间变换，再对像素点检测结果进行形态学处理，最终得到考场监控视频图像数据中的皮肤区域定位结果，具体为：

步骤3.1：对考场监控视频图像数据进行颜色空间变换，具体为：将考场监控视频初始图像数据从RGB颜色空间分别转换到其他颜色空间；

步骤3.2：对考场监控视频初始图像数据在不同颜色空间进行基于阈值的像素点检测，得到最终皮肤索引图像

；

步骤3.3：将考场监控视频初始图像数据和最终皮肤索引图像

进行匹配，将考场监控视频初始图像数据中像素点坐标与最终皮肤索引图像

中像素值为0的像素点坐标相同的像素点的像素值设置为0，得到考场监控视频初始图像数据皮肤区域初始图像，再对该皮肤区域初始图像进行形态学处理，滤除图像中的孤立点，得到考场监控视频图像数据皮肤区域定位结果。

进一步的，步骤3.1：其他颜色空间为YCbCr颜色空间和HSV颜色空间。

进一步的，步骤3.2：对考场监控视频初始图像数据在不同颜色空间进行基于阈值的像素点检测，得到最终皮肤索引图像

，具体为：

步骤3.2.1：依据步骤2所得的初步框选定位结果，获取每个初步框选区域中的质心像素点，并以该质心像素点为中心，初步框选区域短边长度为扩展距离，按照垂直、水平方向对质心像素点进行扩展，根据质心像素点和扩展像素点生成扩展区域索引图像

，其中

像素值为255，其余像素点像素值为0，变量

，

分别为质心像素点和扩展像素点横坐标和纵坐标，根据公式

，

，当

，

，当

，

，变量

、

为皮肤搜索范围参数，将扩展区域索引图像

中的像素点

的像素值设置为255，像素点

的像素值设置为0，得到更新的索引图像

；

步骤3.2.2：在YCbCr颜色空间，进行基于阈值的像素点检测，得到二次更新的索引图像

；

步骤3.2.3：在HSV颜色空间，进行基于阈值的像素点检测，得到最终皮肤索引图像

。

进一步的，步骤3.2.2：在YCbCr颜色空间，进行基于阈值的像素点检测，具体为：在YCbCr颜色空间，设置YCbCr颜色空间肤色阈值范围

和

，其中，

为第一YCbCr颜色空间肤色阈值范围，

为第二YCbCr颜色空间肤色阈值范围，

、

、

、

均为YCbCr颜色空间肤色阈值，将更新的索引图像

中非0像素值像素点在图像中的坐标映射到相应YCbCr颜色空间的考场监控视频图像数据上，遍历所有映射的像素点，对其进行基于阈值的判断，得到二次更新的索引图像

。

进一步的，遍历所有映射的像素点，对其进行基于阈值的判断，具体为：首先判断其

值是否属于

范围内，如果不属于，将其像素点坐标对应的更新索引图像

中的像素点位置的像素值变为0，如果属于，判断其

值是否属于

范围内，如果不属于，将其像素点坐标对应的更新索引图像

中的像素点位置的像素值变为0，如果属于，跳过该像素点，遍历完所有映射的像素点后，得到二次更新的索引图像

。

进一步的，步骤3.2.3：在HSV颜色空间，进行基于阈值的像素点检测，具体为：在HSV颜色空间，设置HSV颜色空间肤色阈值范围

,将二次更新的索引图像

中非0像素值像素点在图像中的坐标映射到相应HSV颜色空间的考场监控视频初始图像数据上，遍历所有映射的像素点，判断其H值是否属于

范围内，如果不属于，将其像素点坐标对应的二次更新索引图像

中的像素点位置的像素值变为0，如果属于，跳过该像素点，遍历完所有映射的像素点后，得到最终皮肤索引图像

。

进一步的，步骤4：将步骤2所得的对考场监控视频图像数据中的人的头发区域的初步框选定位结果和步骤3所得的考场监控视频图像数据中的皮肤区域定位结果进行融合，具体为：

步骤4.1：将考场监控视频图像数据中的人的头发区域的初步框选定位结果图像数据中所有锚框的四个端点坐标映射到考场监控视频图像数据皮肤区域定位结果图像数据中，得到头发区域和皮肤区域融合的考场监控视频图像数据；

步骤4.2：遍历头发区域和皮肤区域融合的考场监控视频图像数据中的所有锚框，将第

个锚框

进行翻转，得到翻转锚框

；

步骤4.3：对头发区域和皮肤区域融合的考场监控视频图像数据中的所有翻转锚框进行遍历，判断每个翻转锚框与皮肤区域的重合情况：

步骤4.4：将更新的头发区域和皮肤区域融合的考场监控视频图像数据中所有保存的锚框

映射到原始考场监控视频图像数据中，得到考场监控视频图像数据中的人脸定位结果。

进一步的，步骤4.2：将第

个锚框

进行翻转，得到翻转锚框

具体为：

以第

个锚框

底部边线像素点在图像数据中的行数

为起始行，以

行像素点为中间行

，将该锚框

以中间行

为对称轴进行翻转，得到翻转锚框

，其中变量

为翻转间隔。

进一步的，步骤4.3：对头发区域和皮肤区域融合的考场监控视频图像数据中的所有翻转锚框进行遍历，判断每个翻转锚框与皮肤区域的重合情况，具体为：

如果翻转锚框

中皮肤区域像素点与非皮肤区域像素点比值

，则将该翻转锚框

对应的锚框

保存；如果翻转锚框

中皮肤区域像素点与非皮肤区域像素点比值

，则将该翻转锚框

对应的锚框

消除，最终得到更新的头发区域和皮肤区域融合的考场监控视频图像数据。

本发明解决了以下技术问题：

1、对考场监控视频图像数据中的头发区域进行基于SSD的深度学习目标检测，提高了对考场监控视频图像数据中人脸定位的准确性。

2、对考场监控视频图像数据在不同颜色空间进行基于阈值的像素点检测，并且引入多次索引图像更新方案，实现对皮肤区域的定位，提高了对考场监控视频图像数据中人脸定位的准确性和可靠性。

3、将考场监控视频图像数据中的考生头发区域定位结果和皮肤区域定位结果进行了基于锚框翻转的融合，提高了对考场监控视频图像数据中人脸定位的准确性和可靠性。

附图说明

图1为一种基于多特征的考场监控视频图像中人脸定位方法流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，方法流程图如图1所示，包括以下步骤：

；

步骤3.3：将考场监控视频初始图像数据和最终皮肤索引图像

中像素值为0的像素点坐标相同的像素点的像素值设置为0，得到考场监控视频初始图像数据皮肤区域初始图像，在对该图像进行形态学处理，滤除图像中的孤立点，得到考场监控视频图像数据皮肤区域定位结果。

，具体为：

，其中

像素值为255，其余像素点像素值为0，变量

，

分别为质心像素点和扩展像素点横坐标和纵坐标，根据公式

，

，当

，

，当

，

，变量

、

为皮肤搜索范围参数，将扩展区域索引图像

中的像素点

的像素值设置为255，像素点

的像素值设置为0，得到更新的索引图像

；

；

。

和

，其中，

为第一YCbCr颜色空间肤色阈值范围，

为第二YCbCr颜色空间肤色阈值范围，

、

、

、

均为YCbCr颜色空间肤色阈值，将更新的索引图像

。

值是否属于

范围内，如果不属于，将其像素点坐标对应的更新索引图像

中的像素点位置的像素值变为0，如果属于，判断其

值是否属于

范围内，如果不属于，将其像素点坐标对应的更新索引图像

。

,将二次更新的索引图像

。

个锚框

进行翻转，得到翻转锚框

；

进一步的，步骤4.2：将第

个锚框

进行翻转，得到翻转锚框

具体为：

以第

个锚框

底部边线像素点在图像数据中的行数

为起始行，以

行像素点为中间行

，将该锚框

以中间行

为对称轴进行翻转，得到翻转锚框

，其中变量

为翻转间隔。

如果翻转锚框

中皮肤区域像素点与非皮肤区域像素点比值

，则将该翻转锚框

对应的锚框

保存；如果翻转锚框

中皮肤区域像素点与非皮肤区域像素点比值

，则将该翻转锚框

对应的锚框

显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的其他实施例，都属于本发明保护的范围。

Claims

1.一种基于多特征的考场监控视频图像中人脸定位方法，主要包括以下步骤：

2.如权利要求1所述的一种基于多特征的考场监控视频图像中人脸定位方法，其特征在于步骤3：对考场监控视频初始图像数据进行皮肤区域定位，将初始图像数据进行颜色空间变换，再对像素点检测结果进行形态学处理，最终得到考场监控视频图像数据中的皮肤区域定位结果，具体为：

；

步骤3.3：将考场监控视频初始图像数据和最终皮肤索引图像

3.如权利要求2所述的一种基于多特征的考场监控视频图像中人脸定位方法，其特征在于步骤3.1：其他颜色空间为YCbCr颜色空间和HSV颜色空间。

4.如权利要求2所述的一种基于多特征的考场监控视频图像中人脸定位方法，其特征在于步骤3.2：对考场监控视频初始图像数据在不同颜色空间进行基于阈值的像素点检测，得到最终皮肤索引图像

，具体为：

，其中

像素值为255，其余像素点像素值为0，变量

，

分别为质心像素点和扩展像素点横坐标和纵坐标，根据公式

，

，当

，

，当

，

，变量

、

为皮肤搜索范围参数，将扩展区域索引图像

中的像素点

的像素值设置为255，像素点

的像素值设置为0，得到更新的索引图像

；

；

。

5.如权利要求4所述的一种基于多特征的考场监控视频图像中人脸定位方法，其特征在于步骤3.2.2：在YCbCr颜色空间，进行基于阈值的像素点检测，具体为：在YCbCr颜色空间，设置YCbCr颜色空间肤色阈值范围

和

，其中，

为第一YCbCr颜色空间肤色阈值范围，

为第二YCbCr颜色空间肤色阈值范围，

、

、

、

均为YCbCr颜色空间肤色阈值，将更新的索引图像

。

6.如权利要求5所述的一种基于多特征的考场监控视频图像中人脸定位方法，其特征在于遍历所有映射的像素点，对其进行基于阈值的判断，具体为：首先判断其

值是否属于

范围内，如果不属于，将其像素点坐标对应的更新索引图像

中的像素点位置的像素值变为0，如果属于，判断其

值是否属于

范围内，如果不属于，将其像素点坐标对应的更新索引图像

。

7.如权利要求4所述的一种基于多特征的考场监控视频图像中人脸定位方法，其特征在于步骤3.2.3：在HSV颜色空间，进行基于阈值的像素点检测，具体为：在HSV颜色空间，设置HSV颜色空间肤色阈值范围

,将二次更新的索引图像

。

8.如权利要求1所述的一种基于多特征的考场监控视频图像中人脸定位方法，其特征在于步骤4：将步骤2所得的对考场监控视频图像数据中的人的头发区域的初步框选定位结果和步骤3所得的考场监控视频图像数据中的皮肤区域定位结果进行融合，具体为：

个锚框

进行翻转，得到翻转锚框

；

9.如权利要求8所述的一种基于多特征的考场监控视频图像中人脸定位方法，其特征在于步骤4.2：将第

个锚框

进行翻转，得到翻转锚框

，具体为：

以第

个锚框

底部边线像素点在图像数据中的行数

为起始行，以

行像素点为中间行

，将该锚框

以中间行

为对称轴进行翻转，得到翻转锚框

，其中变量

为翻转间隔。

10.如权利要求8所述的一种基于多特征的考场监控视频图像中人脸定位方法，其特征在于步骤4.3：对头发区域和皮肤区域融合的考场监控视频图像数据中的所有翻转锚框进行遍历，判断每个翻转锚框与皮肤区域的重合情况，具体为：

如果翻转锚框

中皮肤区域像素点与非皮肤区域像素点比

值，则将该翻转锚框

对应的锚框

保存；如果翻转锚框

中皮肤区域像素点与非皮肤区域像素点比值

，则将该翻转锚框

对应的锚框