CN112070051A

CN112070051A - 基于剪枝压缩的疲劳驾驶快速检测方法

Info

Publication number: CN112070051A
Application number: CN202010973894.8A
Authority: CN
Inventors: 戴丽珍; 郭建钦; 杨刚; 杨辉; 陆荣秀; 李中奇; 徐芳萍
Original assignee: East China Jiaotong University
Current assignee: East China Jiaotong University
Priority date: 2020-09-16
Filing date: 2020-09-16
Publication date: 2020-12-11
Anticipated expiration: 2040-09-16
Also published as: CN112070051B

Abstract

本发明提供基于剪枝压缩的疲劳驾驶快速检测方法，包括以下步骤S1：采用基本回归树的人脸对比算法，获取各类人脸数据库中的人脸样本数据，构建人脸区域数据集，并将人脸样本数据中的人脸、眼和嘴部区域进行标注，删除复杂场景；S2：使用K‑means算法对标注的脸部和眼部目标框的大小进行聚类，采用YOLO V3模型通过DarkNet‑53网络结构进行回归训练；S3：在YOLO V3模型中引入BN层，对BN层中的缩放因子γ进行L1正则化处理，判别出不重要的卷积通道或神经元通道；稀疏化训练后根据剪枝率对模型进行剪枝压缩，之后再对剪枝后的模型进行微调；S4：采用检测到的闭眼图片数量和嘴部张开图片数量在单位时间内所检测图片数量的占比来进行眼部疲劳判定和嘴部哈欠判定。

Description

基于剪枝压缩的疲劳驾驶快速检测方法

技术领域

本发明涉及疲劳驾驶检测技术领域，具体涉及基于剪枝压缩的疲劳驾驶快速检测方法。

背景技术

驾驶疲劳是指驾驶员在连续行车时间过久后，导致心理和生理机能的失衡，而在客观上影响驾驶操作的现象，主要表现有瞌睡、哈欠等行为。尽管引起驾驶疲劳的因素有许多，但驾驶员一旦出现疲劳，很轻易就能导致重大交通事故。此外，在交通法律法规中，对疲劳驾驶的检测判断是间接的，主要通过连续驾驶时长来判定，具有很大的局限性。因此，很有必要对驾驶员的疲劳状态进行实时检测并给予及时的警示，对维护道路安全具有十分重要的意义。

由于深度学习在图片处理、语音识别等领域的突出性能，基于深度学习的疲劳检测已经成为了近年来最主要的研究途径。其中的很多方法是借鉴adaboost级联分类进行的，先对图片多级分类定位出人脸，再做之后脸部其他区域的检测。但由于在实际行车过程中，会有很多光照的变化和驾驶员脸部姿势的复杂变动，以及驾驶员背后的乘客人脸对检测的影响，因此上述方法在一定程度上浪费了前期对图片的特征提取，导致其检测的准确性、实时性和鲁棒性都有待提高。另一方面，复杂的网络结果对于硬件设备的要求较高。

因此，本发明提出了基于剪枝压缩的疲劳驾驶快速检测方法。

发明内容

为解决上述问题，本发明的目的在于提供基于剪枝压缩的疲劳驾驶快速检测方法，

为实现上述目的，本发明提供了如下的技术方案。

基于剪枝压缩的疲劳驾驶快速检测方法，包括以下步骤：

S1：采用基本回归树的人脸对比算法，获取各类人脸数据库中的人脸样本数据，构建人脸区域数据集，使用YawDD疲劳驾驶视频数据和CEW闭眼数据集对人脸区域数据集进行扩充；将人脸样本数据中的人脸、眼和嘴部区域进行标注，删除复杂场景；

S2：定义损失函数，使用K-means算法对标注的脸部和眼部目标框的大小进行聚类，获取若干个先验框；采用YOLO V3模型通过DarkNet-53网络结构对标注后的人脸样本数据进行回归训练，获取若干个预测框；求解预测框位置参数、类别置信度和类别信息；

S3：在YOLO V3模型中引入Batch Normalization层，对Batch Normalization层中的缩放因子γ进行L1正则化处理，判别出不重要的卷积通道或神经元通道；根据初始网络规模及实际问题复杂程度，设定阈值，当其重要性小于阈值时，将相关通道剪掉；稀疏化训练后根据剪枝率对模型进行剪枝压缩，之后再对剪枝后的模型进行微调；

S4：采集驾驶员的驾驶视频流，按帧提取视频图片并放入剪枝微调后的YOLO V3模型，采用检测到的闭眼图片数量在单位时间内所检测图片数量的占比来进行眼部疲劳判定；采用检测到的嘴部张开图片数量在单位时间内所检测图片数量的占比来进行嘴部哈欠判定，根据眼部疲劳判定和嘴部哈欠判定结果进行判断是否属于疲劳驾驶。

优选地，所述S2中每个预测框的目标置信度

如下：

其中，obj表示目标种类，一共5类，p(obj)表示网格是否存在该种类目标，存在时其值为1，不存在时其值为0；

表示预测框Box(pred)和真实值Box(truth)的交并比。

优选地，所述S2中还包括回归边框转换：

b_x＝σ(t_x)+c_x；

b_y＝σ(t_y)+c_y；

其中，t_x和t_y表示预测的坐标偏移值；p_w和p_h表示尺度缩放；b_x、b_y、b_w和b_h表示目标的框体坐标和大小；σ(t)表示Logistic回归函数；C_x和C_y表示单个预测网络的偏移量。

优选地，所述S2中损失函数loss定义如下：

loss＝-box_loss-con_loss-cla_loss；

其中，box_loss表示边框误差，con_loss表示置信度误差，cla_loss表示分类误差；

具体误差如下式所示：

其中，

用于协调不同框对误差的影响；

和

分别为网络预测及实际标记的矩形框中心坐标；

表示标记边框的宽高；

表示第i个网格第j个边框不负责该目标，即该框内不存在目标，需要减少置信度；

表示第i个网格第j个边框是负责这个类，含有标记框时真实标记框的

为1，否则为0；

当且仅当存在目标置信度时，计算置信度误差；当含有类别时类别概率

为1，否则为0；当且仅当第i个网格第j个边框负责某个真实值时，使用条件概率计算每种类别的概率误差；置信度C和类别概率p以及t_x和t_y均经过sigmoid函数变换，输出在0-1之间。

优选地，所述S3中Batch Normalization层的公式如下：

其中，m表示批处理规模的大小；μ_B表示均值；

表示方差；γ表示缩放因子；β表示偏置；y_i表示BN层的输出；x_i表示卷积层计算结果。

优选地，所述S3中稀疏训练目标函数L为：

其中，(x,y)表示训练数据和标签；W表示网络的可训练参数，g(.)是缩放因子上的乘法项，g(γ)＝|x|，即L1正则化；λ是稀疏度因子。

优选地，所述S4中的图片检测时，将原始图像尺寸缩小，使用YOLO V3模型定位出有人脸区域，并记录人脸的左上和右下的两个坐标位置；使用前一帧的人脸两个坐标位置信息对后一帧图像进行裁切，把人脸区域的图像信息输入到YOLO V3模型中。

本发明有益效果：

本发明提出了基于剪枝压缩的疲劳驾驶快速检测方法，首先，抛弃了以往使用人脸关键点检测方法对眼部进行定位，而是直接使用YOLO V3网络对检测图片的人脸和眼部进行精确定位，速度相比于其他模型更快。其次，使用剪枝方法对模型进行压缩，使模型能更好的检测小目标的同时，在保持可接受的精度略微下降的同时加快网络速度，完成了人眼和嘴部的多目标定位。最后根据PERCLOSE准则，实现了疲劳驾驶的检测判定。本发明提出的方法在计算精度和速度上有了更好的融合，具有更好的实时性，能够及时判断驾驶员的疲劳状态。同时，基于剪枝压缩的方法可以减少系统对硬件的要求，有利于应用推广。

以下结合附图及实施例对本发明作进一步的说明。

附图说明

图1是本发明实施例的基于剪枝压缩的疲劳驾驶快速检测方法的流程图；

图2是本发明实施例的基于剪枝压缩的疲劳驾驶快速检测方法的检测流程图；

图3是本发明实施例的基于剪枝压缩的疲劳驾驶快速检测方法的YOLO V3-pruning模型的测试图片；

图4是本发明实施例的基于剪枝压缩的疲劳驾驶快速检测方法的测试图片；

图5是本发明实施例的基于剪枝压缩的疲劳驾驶快速检测方法的眼部状态分析图；

图6是本发明实施例的基于剪枝压缩的疲劳驾驶快速检测方法的嘴部状态分析图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

实施例

基于剪枝压缩的疲劳驾驶快速检测方法，流程图如图1所示，包括以下步骤：

S1：采用基本回归树的人脸对比算法获取各类人脸数据库中的人脸样本数据构建人脸区域数据集，使用YawDD疲劳驾驶视频数据和CEW闭眼数据集对人脸区域数据集进行扩充；将人脸样本数据中的人脸、眼和嘴部区域进行标注，删除复杂场景；

S2：定义损失函数，使用K-means算法对标注的脸部和眼部目标框大小进行聚类，获取若干个先验框；采用YOLO V3模型通过DarkNet-53网络结构进行回归训练，获取若干个预测框；求解预测框位置参数、类别置信度和类别信息；

其中，YOLO模型是将图片多层卷积层提取图像特征后对图像分块，分块的大小影响检测的精度。然后对每个分块区域绘制出多个先验框和类别，再对目标位置进行回归，把分类任务变成了回归问题。由于YOLO采用了全局信息进行预测，背景预测错的概率很低，不容易出现误检，使其作为一个预警任务有更好的鲁棒性；

S4：采集驾驶员的驾驶视频流，按帧提取视频图片并放入剪枝微调后的YOLO V3模型，采用检测到的闭眼图片数量在单位时间内所检测图片数量的占比来进行眼部疲劳判定；采用检测到的嘴部张开图片数量在单位时间内所检测图片数量的占比来进行嘴部哈欠判定，具体检测流程如图2所示。

进一步的，所述S2中每个预测框的目标置信度

如下：

表示预测框Box(pred)和真实值Box(truth)的交并比。

较佳的，为了使每个网格的多个预测框更好索引，所述S2中还包括回归边框转换：

b_x＝σ(t_x)+c_x；

b_y＝σ(t_y)+c_y；

再进一步的，所述S2中损失函数loss定义如下：

loss＝-box_loss-con_loss-cla_loss；

具体误差如下式所示：

其中，

用于协调不同框对误差的影响；

和

分别为网络预测及实际标记的矩形框中心坐标；

表示标记边框的宽高；

为1，否则为0；

此外，所述S3中Batch Normalization层的公式如下：

其中，m表示批处理规模的大小，μ_B表示均值，

为方差，γ为缩放因子，β为偏置，y_i为BN层的输出，x_i为卷积层计算结果。

另外，所述S3中稀疏训练目标函数为：

其中，(x,y)代表训练数据和标签，W是网络的可训练参数g(.)是缩放因子上的乘法项，g(γ)＝|x|，即L1正则化；λ是稀疏度因子。

较佳的，所述S4中的图片检测时，将原始图像尺寸缩小，使用YOLO V3模型定位出有人脸区域，并记录人脸的左上和右下的两个坐标位置；使用前一帧的人脸两个坐标位置信息对后一帧图像进行裁切，只把是人脸区域的图像信息输入到YOLO V3模型中；

这样增大了检测人脸尺寸，并且在保持检测速度的前提下，提高眼、嘴部区域的检测和抗干扰能力。在使用人脸区域的时候通过设置最小人脸大小，当检测出的人脸小于设定值时，则判定为非司机抛弃，减少了背景乘客人脸的干扰。

本实施例中，

建立人脸区域数据集：采用的训练和测试框架为torch框架，通过人工筛选和制作标签数据集最终取得大小为5000张各种环境下的样本图片；

实验结果分析:对5000张被标注的图片进行训练，从中取500图片作为测试，训练次数设置为50个循环，初始学习率为1e-4，并且使用动量方法(Momentun)使网络更好的收敛，分别对YOLO V3和YOLO V3tiny模型进行训练，训练结果如下表1所示：

表1实验结果

通过上表两种网络模型的训练结果所示，可以明显的看出YOLO V3tiny模型的检测率更低，并且主要体现在小目标的检测上，像眼睛和嘴巴的检测效果就很低，所以最终的平均AP值即mAP值很低。并且查看两个模型的权重大小，YOLO V3模型有236MB，而YOLOV3tiny只有33.1MB，因此，进行稀疏化训练和剪枝方法对YOLO V3模型进行压缩。保持训练设置参数不变，设置稀疏度s为0.01对模型进行稀疏训练，之后使用剪枝算法对模型进行剪枝，最后对剪枝模型进行微调。模型最后结果如上表YOLO V3-pruning所示。

通过上表的结果明显看出YOLO V3模型经过剪枝后在保持准确率稍微下降的情况下，权重大小减少很大，图片的检测速度也有了很大的提高，而且相比YOLO V3tiny模型能更好的检测小目标的，如眼睛和嘴部位置，YOLO V3-pruning模型的测试图片如图3所示。

从测试图片中可以看出，检测本文的网络模型对于人脸的多姿态角度都能很好的检测出来，从图3图组中第一张图可以发现，由于眼部的睁眼和闭眼两个类别的类类差距不是很明显，所以对于眼部小目标这种类类差距不明显的检测还是有一定的误检的。

在实车环境下采集了3段视频，自制了包含了不同光照条件下的疲劳视频，其中都包含有频繁眨眼的瞌睡行为和少数哈欠行为。对3个视频进行检测的结果如表2所示：

表2眨眼瞌睡行为判定算法测试结果

由上表2实验结果可知，本发明提出的疲劳驾驶检测方法，在416*416大小的输入图片下，能保持平均18帧/s的处理图片能力，而且算法能很好的检测出眼部和嘴部。检测图片如图4所示。

通过图4所示的检测图片，可以看出在有遮挡和头部转动较大的情况下，本发明的模型都能很好的检测出来，但是在眼部眯眼状态，类类差距很小的情况下，模型不能精确的判断出类别。之后对其中一段视频中的部分片段眼部状态进行详细描绘。在检测的时候记录睁闭眼状况，0代表睁眼，1代表闭合状态，并统计每两秒内闭眼帧占总帧的比率，实验结果如图5和图6所示。

通过图5，可以看出，在坐标20、60、100三个地方检测出了眼睛闭合太久超出阈值，检测出了为频繁眨眼疲劳状态，与实际情况完全相同。并且也可以得出，在40秒的时候闭眼时间超过了2秒，这是很危险的。同上所述再对哈欠状态进行详细描绘，如图6所示，实验制作拍摄的三次哈欠都检测出来了，并且哈欠持续时间都很长，本发明的方法可以很好的检测出哈欠状态。

以上仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。