CN115346363A

CN115346363A - 基于神经网络的驾驶员违规预测方法

Info

Publication number: CN115346363A
Application number: CN202210738974.4A
Authority: CN
Inventors: 王小兵; 朱星光; 李伟康; 段振华; 赵亮; 田聪; 张南
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2022-06-27
Filing date: 2022-06-27
Publication date: 2022-11-15

Abstract

本发明公开了一种基于神经网络的驾驶员违规预测方法，涉及违规预测技术领域，包括：获取原始数据；对原始数据进行处理，得到第一数据；采用第一数据对预设的第一模型进行训练，得到违规时间间隔预测模型，并对违规时间间隔预测模型进行评价；采用第一数据对预设的第二模型进行训练，对抗生成第二数据；将第一数据和第二数据进行综合，得到综合数据；采用综合数据对预设的第三模型进行训练，得到违规类型预测模型，并对违规类型预测模型进行评价；采用违规时间间隔预测模型和违规类型预测模型分别进行违规时间间隔和违规类型进行预测。本申请能够以较高的准确率对驾驶员违规进行预测。

Description

基于神经网络的驾驶员违规预测方法

技术领域

本发明属于违规预测技术领域，具体涉及一种基于神经网络的驾驶员违规预测方法。

背景技术

随着我国机动车的保有量的不断攀升，交通事故发生数量也在随之增长。据统计，大多数交通事故的主要原因是驾驶员违规驾驶行为，驾驶员违规一直是交通领域的研究热点，为了减少驾驶员的违规驾驶行为，保障驾驶员的交通安全；部分学者从驾驶员的个人因素、环境因素、天气因素等方面出发，分析驾驶员违规驾驶行为背后机理；除此之外，基于驾驶员违规相关因素，使用不同的机器学习方法对驾驶员的违规类型、严重程度、频率等方面展开预测，也成为当前预防驾驶员违规驾驶行为造成交通事故的重要手段之一。交通事故的频发迫切的需要对驾驶员违规行为进行精准预测，以达到保障人们安全出行的目的。

相关技术中，国内外学者在驾驶员违规预测方面已经取得了一定的成果，现有技术多是在提取特征之后再利用支持向量机、随机森林、高斯朴素贝叶斯、决策树等传统的机器学习方法进行训练。传统的机器学习方法，在某些特定情景有不错的表现，但不能有效的提取驾驶员违规驾驶行为的深层次特征信息，在复杂情况下表现较差，模型的预测值和真实值的偏差较大，模型准确性较低；小部分学者将卷积神经网络应用于驾驶员违规预测中，提取深层次特征信息的能力增加了，但普通神经网络的固有问题也凸显了出来，在普通的神经网络模型训练中，容易出现网络梯度消失的问题，且依赖于训练集的数据分布，如果分布不均匀，训练出来的模型容易过拟合，在实际应用中的效果很差。

因此，亟需改善上述应用中存在的问题。

发明内容

为了解决现有技术中存在的上述问题，本发明提供了一种基于神经网络的驾驶员违规预测方法。本发明要解决的技术问题通过以下技术方案实现：

第一方面，本申请提供一种基于神经网络的驾驶员违规预测方法，包括：

获取原始数据；

对原始数据进行处理，得到第一数据；

采用第一数据对预设的第一模型进行训练，得到违规时间间隔预测模型，并对违规时间间隔预测模型进行评价；

采用第一数据对预设的第二模型进行训练，对抗生成第二数据；

将第一数据和第二数据进行综合，得到综合数据；采用综合数据对预设的第三模型进行训练，得到违规类型预测模型，并对违规类型预测模型进行评价；

采用违规时间间隔预测模型和违规类型预测模型分别进行违规时间间隔和违规类型进行预测。

可选地，预设的第一模型的结构包括：

输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层；

其中，密集结构块依次包括FRN层、TLU激活函数、1*1卷积和3*3卷积；所述过渡层依次包括FRN层、TLU激活函数、1*1卷积和2*2平均池化。

可选地，FRN层的表达式为：

其中，N为批样本数，x_i为H*W*C的特征矩阵，H为特征矩阵的高，W为特征矩阵的宽，C为特征矩阵的通道数，V²为x的二次范数的平均值；

引入可学习参数γ和β对FRN层的特征进行缩放和平移变换，

其中，O_i为经处理后的特征，ε为避免除数为0时所使用的微小正数；

TLU激活函数的表达式为：

z＝max(y,τ)＝max(y-τ,0)+τ＝ReLU(y-τ)+τ；

其中，τ为可以学习的参数，y为输入，z为经TLU激活函数后的输出。

可选地，违规时间间隔预测模型的评价指标包括：MAE、RMSE和R²；

其中，n为样本数，i为样本的下标，yi为模型的输出。

可选地，预设的第二模型的结构包括：

生成模型和判别模型；

生成模型和所述判别模型达到纳什平衡的表达式为：

其中，D为生成模型，G为判别模型，G(z|y)和D(x|y)均为加入标签信息y之后得到的条件概率，P_data(x)为实际的样本数据，Pz(z)为生成的样本数据，E为数学期望。

可选地，预设的第三模型的结果包括：

其中，密集结构块包括BN层、ReLU函数、1*1卷积、3*3卷积和SEN层；

过渡层包括BN层、ReLU函数、1*1卷积和2*2平均池化。

可选地，SEN层包括挤压操作、激励操作和重新加权操作。

可选地，违规类型预测模型的评价指标包括：Accuracy，Precision，Recall，F1-Score；其中，

其中，n为样本数，i为样本的下标，N_ij为第i类样本预测成第j类的数量。

本发明的有益效果：

本发明提供的一种基于神经网络的驾驶员违规预测方法，能够消除对BatchSize的依赖，性能优越，解决了训练样本失衡与忽视通道重要程度两个问题，具有较好的预测效果，使得驾驶员违规预测方法具有较高的准确率。

以下将结合附图及实施例对本发明做进一步详细说明。

附图说明

图1是本发明实施例提供的基于神经网络的驾驶员违规预测方法的一种流程图；

图2是本发明实施例提供的违规时间间隔数据特征图；

图3是本发明实施例提供的违规类型数据特征图；

图4是本发明实施例提供的违规时间间隔预测模型图；

图5是本发明实施例提供的违规类型预测模型图；

图6是本发明实施例提供的违规类型预测准确率图。

具体实施方式

下面结合具体实施例对本发明做进一步详细的描述，但本发明的实施方式不限于此。

请参见图1，图1是本发明实施例提供的基于神经网络的驾驶员违规预测方法的一种流程图，本申请所提供的一种基于神经网络的驾驶员违规预测方法，包括：

S101、获取原始数据；

S102、对原始数据进行处理，得到第一数据；

S103、采用第一数据对预设的第一模型进行训练，得到违规时间间隔预测模型，并对违规时间间隔预测模型进行评价；

S104、采用第一数据对预设的第二模型进行训练，对抗生成第二数据；

S105、将第一数据和第二数据进行综合，得到综合数据；采用综合数据对预设的第三模型进行训练，得到违规类型预测模型，并对违规类型预测模型进行评价；

S106、采用违规时间间隔预测模型和违规类型预测模型分别进行违规时间间隔和违规类型进行预测。

具体而言，本实施例中提供的一种基于神经网络的驾驶员违规预测方法，能够克服梯度消失的问题，同时具有良好的特征提取能力，使得驾驶员违规预测的表现得到明显的提升；此外，还解决数据集分布不均匀的影响，能够使得模型的训练更加容易，且避免出现过拟合的情况，在实际应用中有良好的效果。

相关技术中，传统的机器学习方法在简单情况下能够有不错的效果，在复杂的情况下提取特征的能力欠佳，模型表现差。普通的卷积神经网络模型过分的依赖训练数据，无法在实际应用中达到训练时所能达到的效果，都不能在实际中发挥稳定作用。

有鉴于此，本实施例中提供的基于神经网络的驾驶员违规预测方法，包括：

获取原始数据；原始数据可以为某公交公司的原始数据。

对所述原始数据进行处理，得到第一数据；获取的原始数据需要处理后，再次使用；其中，原始数据处理的方法包括属性融合、特征构造、缺失值填充、特征编码和数据归一化。

采用所述第一数据对预设的第一模型进行训练，得到违规时间间隔预测模型，并对所述违规时间间隔预测模型进行评价；

采用所述第一数据对预设的第二模型进行训练，对抗生成第二数据；其中，第一数据具有不平衡的缺陷，需要对第一数据再次处理，即通过第二模型处理，生成第二数据。

将所述第一数据和所述第二数据进行综合，得到综合数据；采用所述综合数据对预设的第三模型进行训练，得到违规类型预测模型，并对所述违规类型预测模型进行评价。需要说明的是，第二数据不一定是平衡的，最后的综合数据是平衡的。

采用所述违规时间间隔预测模型和所述违规类型预测模型分别进行违规时间间隔和违规类型进行预测。

通过以上过程获取的驾驶员违规预测方法，能够消除对BatchSize的依赖，性能优越，解决了训练样本失衡与忽视通道重要程度两个问题，具有较好的预测效果，使得驾驶员违规预测方法具有较高的准确率。

在本申请的一种可选的实施例中，预设的第一模型的结构包括：

其中，密集结构块依次包括FRN层、TLU激活函数、1*1卷积和3*3卷积；所述过渡层依次包括FRN层、TLU激活函数、1*1卷积和2*2平均池化

具体而言，本实施例中的预设的第一模型为FRN与DenseNet结合的模型，现有的DenseNet模型中的密集结构块中包括BN层和ReLU函数，而本实施例中将BN层和ReLU函数替换为FRN+TLU激活函数，能够避免网络梯度消失的情况，消除了对BatchSize的依赖。

在本申请的一种可选的实施例中，FRN层的表达式为：

引入可学习参数γ和β对FRN层的特征进行缩放和平移变换，

TLU激活函数的表达式为：

z＝max(y,τ)＝max(y-τ,0)+τ＝ReLU(y-τ)+τ；

在本申请的一种可选的实施例中，违规时间间隔预测模型的评价指标包括：MAE、RMSE和R²；

其中，n为样本数，i为样本的下标，yi为模型的输出。

具体而言，本实施例中通过评价指标对违规时间间隔预测模型进行评价，能够判断违规时间间隔预测模型的准确度，保证模型的有效性。

在本申请的一种可选的实施例中，预设的第二模型的结构包括：

生成模型和判别模型；

生成模型和判别模型达到纳什平衡的表达式为：

其中，D为生成模型，G为判别模型，G(z|y)和D(x|y)均为加入标签信息y之后得到的条件概率，P_data(x)为实际的样本数据，Pz(z)为生成的样本数据，E数学期望。

具体而言，本实施例中采用第一数据对预设的第二模型进行训练，形成CGAN模型，即条件生成式对抗网络模型，利用该模型获取第二数据；可选的，CGAN模型选用BP神经网络作为生成模型和判别模型，二者不断地博弈，最终达到纳什平衡。

在本申请的一种可选的实施例中，预设的第三模型的结果包括：

过渡层包括BN层、ReLU函数、1*1卷积和2*2平均池化。

具体而言，本实施例中的预设的第三模型的结构中，在密集结构块中添加了SEN层，即在DenseNet模型中嵌入SEN层，能够感知到特征通道的重要程度，捕捉到特征通道间的空间相关性。

需要说明的是，DenseNet模型是参考了ResNet模型的核心思想跨层连接所提出的，通过这样的方式使得每层的输出均可以直达最后的误差信号，进而提升了梯度的反向传播；CGAN是GAN的一个扩展，能够通过原数据对抗生成有质量的新数据，能够重新平衡数据集。本实施例提出的SE-DenseNet是使用SEN对DenseNet改进后所得到的网络，能够感知到特征通道的重要程度，捕捉到特征通道间的空间相关性。本发明公开了一种基于FRN层与DenseNet结合的驾驶员违规时间间隔预测方法及一种基于CGAN与SE-DenseNet结合的驾驶员违规类型预测方法，能避免网络梯度消失的情况，消除了对BatchSize的依赖，解决了训练样失衡与忽视通道重要程度的问题，具有较好的预测效果。

在本申请的一种可选的实施例中，SEN函数包括挤压操作、激励操作和重新加权操作。

在本申请的一种可选的实施例中，违规类型预测模型的评价指标包括：Accuracy，Precision，Recall，F1-Score；其中，

其中，n为样本数，i为样本的下标，N_ij为将第i类样本预测成第j类的样本数量，如果i≠j，则说明这些数据是预测错了。

具体而言，本实施例中采用评价指标对违规类型预测模型进行评价，能够判断违规类型预测模型的准确度，保证模型的有效性。

请参见图2～图6所示，图2是本发明实施例提供的违规时间间隔数据特征图，图3是本发明实施例提供的违规类型数据特征图，图4是本发明实施例提供的违规时间间隔预测模型图，图5是本发明实施例提供的违规类型预测模型图，图6是本发明实施例提供的违规类型预测准确率图，在本申请的一种可选的实施例中，以某公交公司为例对本申请的技术方案作进一步的描述。

公交公司有基本的员工信息、违规信息、处罚信息、培训信息线路、车队、车辆等信息，将以上信息作为原数数据。

利用Python爬虫获取该公交公司所有线路、车辆信息、安全营运系统数据库中的数据，及公交公司所在地的天气信息。

综合上述数据，对获取的原始数据进行预处理。

将两个属性集合中相同属性定义为关联主键，然后根据关联主键进行属性集合之间的合并，最后完成属性融合过程；在属性融合后将所用数据按照属性划分为以下八个数据集合。

以个人信息与违规信息中员工编号为主键，执行merge操作，得到集合F1；以F1和天气信息中的日期为主键，执行merge操作，得到集合F2；以F2和处罚信息中违规编号为主键，执行merge操作，得到集合F3；以F3和培训信息中的违规编号为主键，执行merge操作，得到集合F4；以F4和线路信息中的线路编号为主键，执行merge操作，得到集合F5；以F5和车队信息中的车队编号为主键，执行merge操作，得到集合F6；以F6和车辆信息中的车号为主键，执行merge操作，得到集合F7；F7为与驾驶员违规相关的所有属性集合。

基于属性融合后获取到的所有驾驶员违规相关属性信息，从基础特征、趋势特征两个方面，构建驾驶员违规时间间隔预测与违规类型预测相关特征。

对于数值类型特征缺失，使用均值填充方式，例如{缺失值，7，8}填充为{7.5，7，8}；对于非数值类型缺失，使用众数填充的方式，例如{缺失值，小巴，中巴，小巴}填充为{小巴，小巴，中巴，小巴}。

在特征编码部分，对于存在顺序大小关系的，采用Label encoding编码，例如{小学，中学，技校，高中，大专，本科及以上}编码为{1，2，3，4，5，6}，对于不存在顺序大小关系的，采用one-hot encoding，例如{男，女}可表示为{[1，0]，[0，1]}。

对所有的数据采用z-score标准化方式进行数据归一化，归一化的公式如下：

其中，μ为所有样本数据的均值，σ为所有样本数据的标准差。

至此完成了数据的预处理，接下来构建违规时间间隔预测模型。

本实施例中第一预设模型的网络包括卷积层，密集结构块，过渡层，池化层，全连接层，输出层，其具体的信息如下表所示：

选用Adam优化器，初始学习率为0.001，过渡层中降维参数为0.5，特征图增长通道为10，损失函数为MES；进行迭代训练直至收敛。

此外，为了验证本实施例中构建的违规时间间隔预测模型的有效性，采用MAE，RMSE和R²对模型的性能进行评价，其结果如下表所示：

由结果显示，与原来的DenseNet模型相比，本实施例提供的模型在不同的指标上均有更好的表现。

为了进一步验证本实施例提供的模型的有效性，将与其他方法进行对比实验，选取一类神经网络相关算法，BP神经网络，长短期记忆网络(LSTM)，一类非神经网络算法，决策树(DT)，随机森林(RF)，对比结果如下表所示：

由结果显示，本实施例的方法明显优于其他的方法，且通过实验结果可以看出，预测值与真实值接近，误差值小，准确率高，模型性能良好。

至此，完成了违规时间间隔预测模型的训练，并对其进行了评价。接下来进行违规类型预测模型的训练和评价。

本实施例中提供的预设的第三模型可分为两部分，一部分为CGAN模型，一部分为SE-DenseNet模型，其中CGAN模型的参数设置如下表所示：

其中，CGAN模型的输入层参数和输出层参数根据具体的数据集修改成相应的维度，本实施例在此不作限定。

SE-DenseNet模型的具体设置如下表所示：

对原始数据处理后的数据可能是分布不均的，还需要进一步处理；首先使用处理后的数据训练CGAN模型。

优化器采用Adam，初始学习率为0.001，激活函数为LeakyReLU，BatchSize为64，损失函数为交叉熵损失函数；具体步骤为：

选用BP神经网络模型作为生成模型和判别模型。

得到符合分布的N维随机噪声z。

利用Embedding层将标签y转换成N维的稠密向量，与z相乘获得有标签的随机数，作为生成模型的输入。

生成模型将随机数变为样本数据G(z|y)，将真实样本x、标签y和生成样本数据一起放入判别模型D中。

训练生成模型和判别模型直至纳什平衡。

利用训练好的生成模型生成需要过采样的数据，重新平衡各类样本数据。

接下来将第一数据和第二数据综合，并构建SE-DenseNet模型，综合数据更具有平衡性。

其中，SEN(挤压激励网络)层分为挤压、激励和重新加权三步，具体如下：

(1)挤压

通过挤压操作对输入的特征矩阵做全局平均池化操作把H*W*C的矩阵变换为1*1*C的矩阵，所述挤压操作公式为：

其中，C为特征矩阵的通道数，u_c为第C个通道的特征矩阵，所述预设的第三模型的密集结构块输出的特征矩阵U＝[u1，u2，…，u_c]，W为特征矩阵的宽，H为特征矩阵的高，Fsq为全局平均池化函数，Z_c为输入特征矩阵从通道维度压缩的全局特征信息。

(2)激励

将通过挤压操作获取的矩阵先经过第一层全连接层将C个通道压缩成C/r个通道，r为压缩的比例；再经过ReLU激活函数，最后再经过第二层全连接层的C个通道输入到Sigmoid函数中，将其数值限制在[0，1]；通过这种方式，能够学习到各个通道的权重信息；激励操作计算公式如下：

S_c＝F_ex(Z_c,W)＝σ(g(Z_c,W))＝σ(W₂δ(W₁Z_c))；

其中，Z_c为输入特征矩阵从通道维度压缩的全局特征信息；W₁和W₂分别为第一全连接层和第二全连接层的权重参数，并且W₁∈RC/r×C，W₂∈RC×C/_r，r为压缩的比例，δ为ReLU激活函数，σ为Sigmoid激活函数。

(3)重新加权

将通道的权重与该通道对应的特征矩阵相乘，完成在通道维度上的对原始特征的重标定，具体的公式如下所示：

u'_c＝F_scale(u_c,s_c)＝u_c*s_c；

其中，s_c表示输入特征矩阵中的第C个通道经过激励操作获取到的该通道的权重信息，u_c表示第C个通道的特征矩阵。

为了验证本实施例的有效性，采用Accurary，F1-Scorei对模型的性能进行评价，表示结果如下：

其中，数据集A为初始数据集，数据集B为混合数据集；C1-C6为6种分类情况；在CGAN模型过采样后的混合数据集B上训练的预测模型准确度要高于原数据集A训练出来的预测模型；SE-DenseNet模型也比DenseNet模型的准确度更高。

为了进一步验证本实施例的有效性，将与其他方法进行对比实验，选取一类神经网络相关算法，BP神经网络，长短期记忆网络(LSTM)，一类非神经网络算法，决策树(DT)，随机森林(RF)，对比结果如下表所示:

结果显示，本发明所述方法明显优于其他的方法，模型性能良好。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于神经网络的驾驶员违规预测方法，其特征在于，包括：

获取原始数据；

对所述原始数据进行处理，得到第一数据；

采用所述第一数据对预设的第二模型进行训练，对抗生成第二数据；

将所述第一数据和所述第二数据进行综合，得到综合数据；采用所述综合数据对预设的第三模型进行训练，得到违规类型预测模型，并对所述违规类型预测模型进行评价；

2.根据权利要求1所述的基于神经网络的驾驶员违规预测方法，其特征在于，所述预设的第一模型的结构包括：

其中，所述密集结构块依次包括FRN层、TLU激活函数、1*1卷积和3*3卷积；所述过渡层依次包括FRN层、TLU激活函数、1*1卷积和2*2平均池化。

3.根据权利要求2所述的基于神经网络的驾驶员违规预测方法，其特征在于，所述FRN层的表达式为：

引入可学习参数γ和β对FRN层的特征进行缩放和平移变换，

TLU激活函数的表达式为：

z＝max(y,τ)＝max(y-τ,0)+τ＝ReLU(y-τ)+τ；

4.根据权利要求1所述的基于神经网络的驾驶员违规预测方法，其特征在于，所述违规时间间隔预测模型的评价指标包括：MAE、RMSE和R²；

其中，n为样本数，i为样本的下标，y_i为模型的输出。

5.根据权利要求1所述的基于神经网络的驾驶员违规预测方法，其特征在于，所述预设的第二模型的结构包括：

生成模型和判别模型；

所述生成模型和所述判别模型达到纳什平衡的表达式为：

其中，D为所述生成模型，G为所述判别模型，G(z|y)和D(x|y)均为加入标签信息y之后得到的条件概率，P_data(x)为实际的样本数据，Pz(z)为生成的样本数据，E为数学期望。

6.根据权利要求1所述的基于神经网络的驾驶员违规预测方法，其特征在于，所述预设的第三模型的结果包括：

其中，所述密集结构块包括BN层、ReLU函数、1*1卷积、3*3卷积和SEN层；

所述过渡层包括BN层、ReLU函数、1*1卷积和2*2平均池化。

7.根据权利要求6所述的基于神经网络的驾驶员违规预测方法，其特征在于，所述SEN层包括挤压操作、激励操作和重新加权操作。

8.根据权利要求1所述的基于神经网络的驾驶员违规预测方法，其特征在于，所述违规类型预测模型的评价指标包括：Accuracy，Precision，Recall，F1-Score；其中，