CN113326740B

CN113326740B - 一种改进的双流交通事故检测方法

Info

Publication number: CN113326740B
Application number: CN202110498728.1A
Authority: CN
Inventors: 王晨; 周威; 夏井新; 陆振波; 许跃如
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2021-05-08
Filing date: 2021-05-08
Publication date: 2024-06-21
Anticipated expiration: 2041-05-08
Also published as: CN113326740A

Abstract

本发明公开了一种改进的双流交通事故检测方法。收集事故和非事故视频数据集，以及事故相关交通拥堵图片数据集和事故无关交通拥堵图片数据集，并将视频数据集划分为训练集和测试集；提取训练集和测试集中每个视频的关键帧和光流数据；搭建双分支的事故检测模型，包含以关键帧为输入的外观特征提取网络和以光流数据为输入的运动特征提取网络；构建包含三元组损失和交叉熵损失的联合损失函数以训练事故检测模型；利用测试集中的视频数据对训练完毕后的事故检测模型进行有效性评估。本发明降低了模型的误报率和漏检率，提高了模型事故检测精度。

Description

一种改进的双流交通事故检测方法

技术领域

本发明属于交通事故检测领域，特别涉及了一种双流交通事故检测方法。

背景技术

交通事故是目前交通领域一大颇具挑战的难点问题。交通事故可能导致财产损失和人员伤亡，给交通管理部门带来了极大的挑战。为了有效提高事故应急处置的响应速度，减少由于救援不及时导致的人员伤亡和交通拥堵，研究交通事故的快速检测技术具有重要的现实意义。

传统的事故检测技术主要依赖于交通流数据建模或人工视频检测。交通流数据建模依赖于检测器的数据质量，并且难以区分交通事故和交通拥堵，因而检测精度较低。人工视频检测可以保证检测精度，但消耗大量人力，成本过高。近年来，随着智慧交通系统的建设与发展，视频的覆盖率显著提升，基于视频的交通事故自动检测技术逐步得到了研究者的重视，其主要原理是通过识别监控视频中的重要特征来实现对交通事故的自动检测。目前研究表明，该技术能够取得较高的检测精度，有望显著降低人力成本。因而，基于视频的事故检测技术具有重要的研究价值。

基于视频的事故检测技术主要通过识别监控视频中的事故特征实现。事故特征主要包括外观特征和运动特征。事故外观特征来源于事故发生后的车辆形变、机动车侧翻，非机动车或者行人摔倒等区别于正常行驶状态下的特征。事故运动特征需要在一段时间内连续观测获得，主要包括轨迹的交叉滞留，周围行人的聚集等。

现有基于视频的事故检测技术可以分为两大类：(1)基于运动特征的事故检测技术；(2)基于特征融合的事故检测技术。基于运动特征的检测技术主要从视频中提取车辆运动信息加以建模，同时建立规则式或机器学习式的事故判别方法。该类技术丢失了重要的外观信息，因此检测精度有限。基于特征融合的检测技术引入了事故外观信息，通常采用神经网络同步提取事故外观特征和运动特征进行事故检测，因此具有较高的检测精度。但是现有的特征融合检测技术难以区分事故相关的交通拥堵和事故无关的交通拥堵，因此模型的误报率和漏检率均较高，事故检测精度受限。

发明内容

为了解决上述背景技术提到的技术问题，本发明提出了一种改进的双流交通事故检测方法，降低模型的误报率和漏检率，提高模型事故检测精度。

为了实现上述技术目的，本发明的技术方案为：

一种改进的双流交通事故检测方法，包括以下步骤：

(1)收集事故和非事故视频数据集，以及事故相关交通拥堵图片数据集和事故无关交通拥堵图片数据集，并将视频数据集划分为训练集和测试集；

(2)提取训练集和测试集中每个视频的关键帧和光流数据；

(3)搭建双分支的事故检测模型，包含以关键帧为输入的外观特征提取网络和以光流数据为输入的运动特征提取网络；

(4)构建包含三元组损失和交叉熵损失的联合损失函数以训练事故检测模型；

(5)利用测试集中的视频数据对训练完毕后的事故检测模型进行有效性评估。

进一步地，在步骤(2)中，提取关键帧的方法如下：

训练过程中，事故视频中随机选择后半段的某一帧作为事故的关键帧，非事故视频中随机选择某一帧作为非事故的关键帧；测试过程中，将每隔32帧被采样的视频画面作为关键帧。

进一步地，在步骤(2)中，提取光流数据的方法如下：

利用光流提取网络FlowNet2提取视频的光流；训练过程中，每次从提取的光流中等间隔采样32个光流数据作为运动特征提取网络的输入。

进一步地，步骤(3)的具体过程如下：

(301)选择轻量化的卷积神经网络MobileNetV3作为外观特征提取网络，将视觉注意力机制模块嵌入到MobileNetV3的第三个MaxPooling层之前；

(302)拓宽卷积神经网络MobileNetV3的第一层卷积层的输入维度至64，并将其作为运动特征提取网络；

(303)输入关键帧至外观特征提取网络中，提取视频的事故外观特征；

(304)输入光流数据至运动特征提取网络中，提取视频的事故运动特征；

(305)利用全连接层融合事故外观特征与事故运动特征。

进一步地，在步骤(4)中，采用交叉损失函数对事故与否进行分类：

上式中，loss_CE表示交叉损失函数；y为模型的输出值；为视频的真实标签，包括事故和非事故。

进一步地，在步骤(4)中，采用三元组损失函数训练外观特征提取网络：

上式中，loss_triplet表示三元组损失函数；y₁为外观特征提取网络的输出；函数d(x₁,x₂)定义为向量集合x₁与x₂之间的平均欧式距离，M为向量集合x₁的向量个数，N为向量集合x₂的向量个数，x₁ ⁽ⁱ⁾为向量集合x₁中的第i个向量，x₂ ^(j)为向量集合x₂的第j个向量；x_key为外观特征，x_ARTC为事故相关交通拥堵图片特征，x_AUTC为事故无关交通拥堵图片特征；λ为三元组损失中的超参数，用来调节事故相关交通拥堵图片与事故无关交通拥堵图片在浅层空间的区分程度。

采用上述技术方案带来的有益效果：

1、与现有技术相比，本发明提出的双分支事故检测网络检测精度更高，检测速度更快；

2、本发明采用了三元组损失函数来引导事故检测模型区分事故相关交通拥堵和事故无关交通拥堵，提升了双分支检测模型的精度，降低了事故的漏检率和非事故的误报率；

3、本发明采用了视觉注意力机制，使得模型能够在复杂的交通场景下迅速定位发生区域，进一步提升检测精度。

附图说明

图1是本发明方法流程图；

图2是本发明中双分支事故检测模型图；

图3是本发明中三元组网络图；

图4是仿真实例中ROC曲线图；

图5是仿真实例中外观特征向量在PCA空间分布图；

图6是仿真实例中热力图。

具体实施方式

以下将结合附图，对本发明的技术方案进行详细说明。

本发明设计了一种改进的双流交通事故检测方法，如图1所示，步骤如下：

步骤1：收集事故和非事故视频数据集，以及事故相关交通拥堵(ARTC)图片数据集和事故无关交通拥堵(AUTC)图片数据集，并将视频数据集划分为训练集和测试集；

步骤2：提取训练集和测试集中每个视频的关键帧和光流数据；

步骤3：搭建双分支的事故检测模型，包含以关键帧为输入的外观特征提取网络和以光流数据为输入的运动特征提取网络；

步骤4：构建包含三元组损失和交叉熵损失的联合损失函数以训练事故检测模型；

步骤5：利用测试集中的视频数据对训练完毕后的事故检测模型进行有效性评估。

优选地，在上述步骤2中，提取关键帧的方法如下：

优选地，在上述步骤2中，提取光流数据的方法如下：

优选地，如图2所示，上述步骤3的具体过程如下：

301、选择轻量化的卷积神经网络MobileNetV3作为外观特征提取网络，将视觉注意力机制模块嵌入到MobileNetV3的第三个MaxPooling层之前；

302、拓宽卷积神经网络MobileNetV3的第一层卷积层的输入维度至64，并将其作为运动特征提取网络；

303、输入关键帧至外观特征提取网络中，提取视频的事故外观特征；

304、输入光流数据至运动特征提取网络中，提取视频的事故运动特征；

305、利用全连接层融合事故外观特征与事故运动特征。

优选地，在上述步骤4中，采用交叉损失函数对事故与否进行分类：

优选地，在上述步骤4中，如图3所示，采用三元组损失函数训练外观特征提取网络：

仿真实例

如图4所示，基础模型与三个扩展模型的ROC曲线对比。基础模型中外观特征提取网络采用MobileNetV3，并未引入三元组损失和视觉注意力机制。扩展模型1-3分别为“基础模型+三元组损失”，“基础模型+视觉注意力机制”以及“基础模型+三元组损失+视觉注意力机制”。从ROC曲线对比图可以看出，基础模型和三个扩展模型均保持了较高的AUC值。其中，基础模型的AUC值最低(AUC＝0.93)，扩展模型3的AUC值最高(AUC＝0.97)。扩展模型1的AUC值略高于基础模型(AUC＝0.94)，但与扩展模型2仍有差距(AUC＝0.96)，这体现了三元组损失的引入较视觉注意力模块对模型事故精度提升作用更大。从基础模型到扩展模型1，以及扩展模型2到扩展模型3的AUC值提升可以看出，视觉注意模块的引入能够进一步提升现有模型的检测精度。

如图5所示，基础模型和扩展模型3的外观特征向量在PCA空间分布。从图5可以看出，未引入三元损失和视觉注意力之前，基础模型存在较多的误报(菱形)和漏检案例(方形)，且误报案例与漏检案例零散地分布在分类决策面周围。引入三元组损失和视觉注意力之后，误报案例与漏检案例数量明显减少，且分布更加集中，并更靠近分类决策区域。由此可见，三元组损失和视觉注意力的引入促使模型往区分AUTC和ARTC方向学习，有效降低了模型误报率和漏检率。

视觉任务通常可使用Grad-CAM算法可视化模型在分类过程中的注意力分布，并将这种注意力分布以热力图的形式展现。本发明对上述基础模型和扩展模型3中的模型注意力分布进行可视化，分析模型在复杂的拥堵环境下视觉感知的集中区域，进而验证提出模型的有效性。如图6所示，为模型在部分场景下的热力图可视化效果，图上的亮色区域代表模型的注意力区域。从注意力可视化的效果可以看出，基础对于这些典型的ARTC场景下区分效果并不好，主要体现在其注意力分布无法很好地定位事故发生区域。相较于基础模型，引入三元组损失和视觉注意力的扩展模型3能够准确地定位事故发生的大致区域，并根据该注意力区域增加事故判别的置信度，进而有效较低了模型的漏检率。

实施例仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明保护范围之内。

Claims

1.一种改进的双流交通事故检测方法，其特征在于，包括以下步骤：

(2)提取训练集和测试集中每个视频的关键帧和光流数据；

(5)利用测试集中的视频数据对训练完毕后的事故检测模型进行有效性评估；

步骤(3)的具体过程如下：

(301)选择轻量化的卷积神经网络MobileNetV3作为外观特征提取网络，将视觉注意力

机制模块嵌入到MobileNetV3的第三个MaxPooling层之前；

(305)利用全连接层融合事故外观特征与事故运动特征。

2.根据权利要求1所述改进的双流交通事故检测方法，其特征在于，在步骤(2)中，提取关键帧的方法如下：

3.根据权利要求1所述改进的双流交通事故检测方法，其特征在于，在步骤(2)中，提取光流数据的方法如下：

4.根据权利要求1所述改进的双流交通事故检测方法，其特征在于，在步骤(4)中，采用交叉损失函数对事故与否进行分类：

5.根据权利要求1所述改进的双流交通事故检测方法，其特征在于，在步骤(4)中，采用三元组损失函数训练外观特征提取网络：