CN114241453B

CN114241453B - 一种利用关键点注意力的驾驶员分心驾驶监测方法

Info

Publication number: CN114241453B
Application number: CN202111561616.2A
Authority: CN
Inventors: 路小波; 陆明琦; 胡耀聪
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2021-12-20
Filing date: 2021-12-20
Publication date: 2024-03-12
Anticipated expiration: 2041-12-20
Also published as: CN114241453A

Abstract

本发明公开了一种利用关键点注意力的驾驶员分心驾驶监测方法。该方法利用驾驶员的判别性关键点特征以区分具有相似外观的分心驾驶行为。本发明提出通道‑空间变换卷积来改进特征变换过程，以增强卷积特征的表示能力。同时，使用Lightweight OpenPose生成关键点热图，作为全局特征的注意力图，并提出关键点投影策略来融合关键点信息和卷积特征，即将每个关键点的热力图与全局特征图进行点乘以生成局部细化特征。关键点信息到全局特征的投影提高了最终分类表示的区分度，可进一步提高驾驶员分心驾驶监测准确率。本发明在交通安全领域有重要的应用价值。

Description

一种利用关键点注意力的驾驶员分心驾驶监测方法

技术领域

本发明属于图像处理和模式识别领域，具体涉及一种利用关键点注意力的驾驶员分心驾驶监测方法。

背景技术

如今，越来越多的现代车辆配备了高级驾驶员辅助系统（ADAS）。开发这些系统是为了通过警告驾驶员可能出现的问题并在发生事故时使驾驶员和乘客能够以安全的技术来预防事故。但是，即使是当今最新的自动驾驶汽车也不是完全自动驾驶，需要驾驶员保持谨慎并准备在紧急情况下控制方向盘。自动驾驶分为5个级别，大多数自动驾驶汽车属于2级或3级类别，这意味着驾驶员必须在要求时随时准备干预，并且不能分心。属于第4级类别的正在开发的系统的示例是Waymo自动驾驶室服务。目前已发生了几起自动驾驶汽车死亡事故，例如特斯拉自动驾驶汽车在2016年5月与佛罗里达州威利斯顿的白色卡车挂车相撞，以及优步的自动驾驶汽车在紧急情况下在方向盘后撞，于2018年3月在亚利桑那州撞死一名行人。在这两例死亡中，驾驶员本可以避免发生事故，但是证据表明他分心了。这使得分心的驾驶员检测成为汽车的重要组成部分，并可能导致新的ADAS系统的开发。检测驾驶员注意力不集中对于其他预防措施极为重要。

发明内容

为解决上述问题，本发明公开了一种利用关键点注意力的驾驶员分心驾驶监测方法，发明中使用的通道-空间变换卷积和关键点投影方法可以有效提高驾驶员行为识别准确率。

为达到上述目的，本发明的技术方案如下：

一种利用关键点注意力的驾驶员分心驾驶监测方法，包括以下步骤：

步骤1：分心驾驶图像数据集选用现有的StateFarm数据集；

步骤2：构建基于关键点投影的注意力网络，采用与通道-空间转换块相结合的ResNet-50作为主干，提取全局特征，并输入到所有后续分支中；同时，使用LightweightOpenPose来生成包含丰富空间信息的关键点热力图；对于每个关键点（头部和手部），将热力图与全局特征相乘，再将乘积与全局特征逐元素相加以生成关键点增强特征，并将其串联起来进行最终分类；

步骤201：对于输入的驾驶图像，提出通道-空间转换卷积以提取全局特征，其明确地对特征通道之间的相互依赖性进行建模；其对全局特征进行选择性处理，即只有一半的输入通道通过通道-空间变换卷积进行处理；具体地说，具有 C 通道的输入特征被平均地划分为具有 C⁄2 通道的两组特征；第一组由通道-空间变换卷积处理，而第二组按原样传播；原始特征和处理后的特征最终通过通道混洗进行混合；这样的结构设计减少了计算负担，并进一步加强了跨卷积通道的信息流；

步骤202：基于ResNet的3×3残差瓶颈，本发明构造了通道-空间转换块，具体来说，在ResNet的残差瓶颈中加入了通道-空间变换卷积；此外，引入挤压-激励块以对通道特征进行自适应重校准，以增强通道注意力；通道-空间转换块将多个通道信息映射到空间，然后将空间信息重新映射回通道；与子像素卷积类似，通道-空间转换块通过像素混洗来缩放特征图，以加强通道信息流；通道空间变换操作不收集全局信息，只考虑空间中每个位置周围的上下文，从而避免来自图像无关区域的污染信息；

步骤203：在ResNet的 Conv4_x 和Conv5_x 中，使用通道-空间转换块代替传统的残差瓶颈，在通道-空间变换Conv5_x之上，添加了1×1卷积层以降低维度；

步骤204：通过姿态估计Lightweight OpenPose算法生成关键点热力图；热力图上的值表示人体关键点的分布概率，相当于空间注意力或掩膜；分别将每个关键点的热力图与全局特征相乘，再逐元素相加乘积和全局特征以生成关键点增强的全局表示；将关键点增强特征串联，生成分类特征；

步骤3：训练基于关键点投影的注意力网络；基于深度学习平台PyTorch，采用随机梯度下降算法优化参数；

步骤4：对基于关键点投影的注意力网络进行测试。

本发明的有益效果是：

（1）本发明提出通道-空间转换卷积，建立空间信息和通道信息之间的相互依赖关系以提取判别特征。

（2）本发明提出了关键点投影策略，通过关键点信息到全局特征的投影，引导模型聚焦于信息性关键点。

（3）本发明进一步提高驾驶员分心驾驶监测准确率，在交通安全领域有重要的应用价值。

附图说明

图1为本发明的流程图；

图2是本发明中不同驾驶行为的样例图片；

图3是本发明中基于关键点投影的注意力网络的结构示意图；

图4为本发明中通道-空间转换卷积的结构示意图；

图5为本发明中通道-空间转换块的结构示意图。

具体实施方式

下面结合附图和具体实施方式，进一步阐明本发明，应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。

本发明所述的一种利用关键点注意力的驾驶员分心驾驶监测方法，具体实施步骤如下：

步骤1：分心驾驶图像数据集选用现有的StateFarm数据集；

步骤2：构建基于关键点投影的注意力网络，图3是模型的结构示意图；采用与通道-空间转换块相结合的ResNet-50作为主干，提取全局特征，并输入到所有后续分支中；同时，使用Lightweight OpenPose来生成包含丰富空间信息的关键点热力图；对于每个关键点（头部和手部），将热力图与全局特征相乘，再将乘积与全局特征逐元素相加以生成关键点增强特征，并将其串联起来进行最终分类；

步骤201：对于输入的驾驶图像，提出通道-空间转换卷积以提取全局特征，其明确地对特征通道之间的相互依赖性进行建模；图4为通道-空间转换卷积的结构示意图，其对全局特征进行选择性处理，即只有一半的输入通道通过通道-空间变换卷积进行处理；具体地说，具有 C 通道的输入特征被平均地划分为具有 C⁄2 通道的两组特征；第一组由通道-空间变换卷积处理，而第二组按原样传播；原始特征和处理后的特征最终通过通道混洗进行混合；这样的结构设计减少了计算负担，并进一步加强了跨卷积通道的信息流；

步骤202：基于ResNet的3×3残差瓶颈，本发明构造了通道-空间转换块，图5为通道-空间转换块的结构示意图；具体来说，在ResNet的残差瓶颈中加入了通道-空间变换卷积；此外，引入挤压-激励块以对通道特征进行自适应重校准，以增强通道注意力；通道-空间转换块将多个通道信息映射到空间，然后将空间信息重新映射回通道；与子像素卷积类似，通道-空间转换块通过像素混洗来缩放特征图，以加强通道信息流；通道空间变换操作不收集全局信息，只考虑空间中每个位置周围的上下文，从而避免来自图像无关区域的污染信息；

步骤4：对基于关键点投影的注意力网络进行测试。

需要说明的是，以上内容仅仅说明了本发明的技术思想，不能以此限定本发明的保护范围，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰均落入本发明权利要求书的保护范围之内。

Claims

1.一种利用关键点注意力的驾驶员分心驾驶监测方法，其特征在于，包括以下步骤：

步骤1：分心驾驶图像数据集选用现有的StateFarm数据集；

步骤2：构建基于关键点投影的注意力网络；采用与通道-空间转换块相结合的ResNet-50作为主干，提取全局特征，并输入到所有后续分支中；同时，使用Lightweight OpenPose来生成包含丰富空间信息的关键点热力图；对于头部和手部关键点，将热力图与全局特征相乘，再将乘积与全局特征逐元素相加以生成关键点增强特征，并将其串联起来进行最终分类，具体如下；

步骤202：基于ResNet的3×3残差瓶颈，构造通道-空间转换块，具体来说，在ResNet的残差瓶颈中加入了通道-空间变换卷积；此外，引入挤压-激励块以对通道特征进行自适应重校准，以增强通道注意力；通道-空间转换块将多个通道信息映射到空间，然后将空间信息重新映射回通道；与子像素卷积类似，通道-空间转换块通过像素混洗来缩放特征图，以加强通道信息流；通道空间变换操作不收集全局信息，只考虑空间中每个位置周围的上下文，从而避免来自图像无关区域的污染信息；

步骤203：在ResNet的Conv4_x 和Conv5_x 中，使用通道-空间转换块代替传统的残差瓶颈，在通道-空间变换Conv5_x之上，添加了1×1卷积层以降低维度；

步骤4：对基于关键点投影的注意力网络进行测试。