CN115346363A - 基于神经网络的驾驶员违规预测方法 - Google Patents

基于神经网络的驾驶员违规预测方法 Download PDF

Info

Publication number
CN115346363A
CN115346363A CN202210738974.4A CN202210738974A CN115346363A CN 115346363 A CN115346363 A CN 115346363A CN 202210738974 A CN202210738974 A CN 202210738974A CN 115346363 A CN115346363 A CN 115346363A
Authority
CN
China
Prior art keywords
model
data
violation
layer
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210738974.4A
Other languages
English (en)
Inventor
王小兵
朱星光
李伟康
段振华
赵亮
田聪
张南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202210738974.4A priority Critical patent/CN115346363A/zh
Publication of CN115346363A publication Critical patent/CN115346363A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q50/40
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications

Abstract

本发明公开了一种基于神经网络的驾驶员违规预测方法,涉及违规预测技术领域,包括:获取原始数据;对原始数据进行处理,得到第一数据;采用第一数据对预设的第一模型进行训练,得到违规时间间隔预测模型,并对违规时间间隔预测模型进行评价;采用第一数据对预设的第二模型进行训练,对抗生成第二数据;将第一数据和第二数据进行综合,得到综合数据;采用综合数据对预设的第三模型进行训练,得到违规类型预测模型,并对违规类型预测模型进行评价;采用违规时间间隔预测模型和违规类型预测模型分别进行违规时间间隔和违规类型进行预测。本申请能够以较高的准确率对驾驶员违规进行预测。

Description

基于神经网络的驾驶员违规预测方法
技术领域
本发明属于违规预测技术领域,具体涉及一种基于神经网络的驾驶员违规预测方法。
背景技术
随着我国机动车的保有量的不断攀升,交通事故发生数量也在随之增长。据统计,大多数交通事故的主要原因是驾驶员违规驾驶行为,驾驶员违规一直是交通领域的研究热点,为了减少驾驶员的违规驾驶行为,保障驾驶员的交通安全;部分学者从驾驶员的个人因素、环境因素、天气因素等方面出发,分析驾驶员违规驾驶行为背后机理;除此之外,基于驾驶员违规相关因素,使用不同的机器学习方法对驾驶员的违规类型、严重程度、频率等方面展开预测,也成为当前预防驾驶员违规驾驶行为造成交通事故的重要手段之一。交通事故的频发迫切的需要对驾驶员违规行为进行精准预测,以达到保障人们安全出行的目的。
相关技术中,国内外学者在驾驶员违规预测方面已经取得了一定的成果,现有技术多是在提取特征之后再利用支持向量机、随机森林、高斯朴素贝叶斯、决策树等传统的机器学习方法进行训练。传统的机器学习方法,在某些特定情景有不错的表现,但不能有效的提取驾驶员违规驾驶行为的深层次特征信息,在复杂情况下表现较差,模型的预测值和真实值的偏差较大,模型准确性较低;小部分学者将卷积神经网络应用于驾驶员违规预测中,提取深层次特征信息的能力增加了,但普通神经网络的固有问题也凸显了出来,在普通的神经网络模型训练中,容易出现网络梯度消失的问题,且依赖于训练集的数据分布,如果分布不均匀,训练出来的模型容易过拟合,在实际应用中的效果很差。
因此,亟需改善上述应用中存在的问题。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于神经网络的驾驶员违规预测方法。本发明要解决的技术问题通过以下技术方案实现:
第一方面,本申请提供一种基于神经网络的驾驶员违规预测方法,包括:
获取原始数据;
对原始数据进行处理,得到第一数据;
采用第一数据对预设的第一模型进行训练,得到违规时间间隔预测模型,并对违规时间间隔预测模型进行评价;
采用第一数据对预设的第二模型进行训练,对抗生成第二数据;
将第一数据和第二数据进行综合,得到综合数据;采用综合数据对预设的第三模型进行训练,得到违规类型预测模型,并对违规类型预测模型进行评价;
采用违规时间间隔预测模型和违规类型预测模型分别进行违规时间间隔和违规类型进行预测。
可选地,预设的第一模型的结构包括:
输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层;
其中,密集结构块依次包括FRN层、TLU激活函数、1*1卷积和3*3卷积;所述过渡层依次包括FRN层、TLU激活函数、1*1卷积和2*2平均池化。
可选地,FRN层的表达式为:
Figure BDA0003715971720000021
其中,N为批样本数,xi为H*W*C的特征矩阵,H为特征矩阵的高,W为特征矩阵的宽,C为特征矩阵的通道数,V2为x的二次范数的平均值;
引入可学习参数γ和β对FRN层的特征进行缩放和平移变换,
Figure BDA0003715971720000022
其中,Oi为经处理后的特征,ε为避免除数为0时所使用的微小正数;
TLU激活函数的表达式为:
z=max(y,τ)=max(y-τ,0)+τ=ReLU(y-τ)+τ;
其中,τ为可以学习的参数,y为输入,z为经TLU激活函数后的输出。
可选地,违规时间间隔预测模型的评价指标包括:MAE、RMSE和R2
Figure BDA0003715971720000031
Figure BDA0003715971720000032
Figure BDA0003715971720000033
其中,n为样本数,i为样本的下标,yi为模型的输出。
可选地,预设的第二模型的结构包括:
生成模型和判别模型;
生成模型和所述判别模型达到纳什平衡的表达式为:
Figure BDA0003715971720000034
其中,D为生成模型,G为判别模型,G(z|y)和D(x|y)均为加入标签信息y之后得到的条件概率,Pdata(x)为实际的样本数据,Pz(z)为生成的样本数据,E为数学期望。
可选地,预设的第三模型的结果包括:
输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层;
其中,密集结构块包括BN层、ReLU函数、1*1卷积、3*3卷积和SEN层;
过渡层包括BN层、ReLU函数、1*1卷积和2*2平均池化。
可选地,SEN层包括挤压操作、激励操作和重新加权操作。
可选地,违规类型预测模型的评价指标包括:Accuracy,Precision,Recall,F1-Score;其中,
Figure BDA0003715971720000035
Figure BDA0003715971720000041
Figure BDA0003715971720000042
Figure BDA0003715971720000043
其中,n为样本数,i为样本的下标,Nij为第i类样本预测成第j类的数量。
本发明的有益效果:
本发明提供的一种基于神经网络的驾驶员违规预测方法,能够消除对BatchSize的依赖,性能优越,解决了训练样本失衡与忽视通道重要程度两个问题,具有较好的预测效果,使得驾驶员违规预测方法具有较高的准确率。
以下将结合附图及实施例对本发明做进一步详细说明。
附图说明
图1是本发明实施例提供的基于神经网络的驾驶员违规预测方法的一种流程图;
图2是本发明实施例提供的违规时间间隔数据特征图;
图3是本发明实施例提供的违规类型数据特征图;
图4是本发明实施例提供的违规时间间隔预测模型图;
图5是本发明实施例提供的违规类型预测模型图;
图6是本发明实施例提供的违规类型预测准确率图。
具体实施方式
下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。
请参见图1,图1是本发明实施例提供的基于神经网络的驾驶员违规预测方法的一种流程图,本申请所提供的一种基于神经网络的驾驶员违规预测方法,包括:
S101、获取原始数据;
S102、对原始数据进行处理,得到第一数据;
S103、采用第一数据对预设的第一模型进行训练,得到违规时间间隔预测模型,并对违规时间间隔预测模型进行评价;
S104、采用第一数据对预设的第二模型进行训练,对抗生成第二数据;
S105、将第一数据和第二数据进行综合,得到综合数据;采用综合数据对预设的第三模型进行训练,得到违规类型预测模型,并对违规类型预测模型进行评价;
S106、采用违规时间间隔预测模型和违规类型预测模型分别进行违规时间间隔和违规类型进行预测。
具体而言,本实施例中提供的一种基于神经网络的驾驶员违规预测方法,能够克服梯度消失的问题,同时具有良好的特征提取能力,使得驾驶员违规预测的表现得到明显的提升;此外,还解决数据集分布不均匀的影响,能够使得模型的训练更加容易,且避免出现过拟合的情况,在实际应用中有良好的效果。
相关技术中,传统的机器学习方法在简单情况下能够有不错的效果,在复杂的情况下提取特征的能力欠佳,模型表现差。普通的卷积神经网络模型过分的依赖训练数据,无法在实际应用中达到训练时所能达到的效果,都不能在实际中发挥稳定作用。
有鉴于此,本实施例中提供的基于神经网络的驾驶员违规预测方法,包括:
获取原始数据;原始数据可以为某公交公司的原始数据。
对所述原始数据进行处理,得到第一数据;获取的原始数据需要处理后,再次使用;其中,原始数据处理的方法包括属性融合、特征构造、缺失值填充、特征编码和数据归一化。
采用所述第一数据对预设的第一模型进行训练,得到违规时间间隔预测模型,并对所述违规时间间隔预测模型进行评价;
采用所述第一数据对预设的第二模型进行训练,对抗生成第二数据;其中,第一数据具有不平衡的缺陷,需要对第一数据再次处理,即通过第二模型处理,生成第二数据。
将所述第一数据和所述第二数据进行综合,得到综合数据;采用所述综合数据对预设的第三模型进行训练,得到违规类型预测模型,并对所述违规类型预测模型进行评价。需要说明的是,第二数据不一定是平衡的,最后的综合数据是平衡的。
采用所述违规时间间隔预测模型和所述违规类型预测模型分别进行违规时间间隔和违规类型进行预测。
通过以上过程获取的驾驶员违规预测方法,能够消除对BatchSize的依赖,性能优越,解决了训练样本失衡与忽视通道重要程度两个问题,具有较好的预测效果,使得驾驶员违规预测方法具有较高的准确率。
在本申请的一种可选的实施例中,预设的第一模型的结构包括:
输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层;
其中,密集结构块依次包括FRN层、TLU激活函数、1*1卷积和3*3卷积;所述过渡层依次包括FRN层、TLU激活函数、1*1卷积和2*2平均池化
具体而言,本实施例中的预设的第一模型为FRN与DenseNet结合的模型,现有的DenseNet模型中的密集结构块中包括BN层和ReLU函数,而本实施例中将BN层和ReLU函数替换为FRN+TLU激活函数,能够避免网络梯度消失的情况,消除了对BatchSize的依赖。
在本申请的一种可选的实施例中,FRN层的表达式为:
Figure BDA0003715971720000061
其中,N为批样本数,xi为H*W*C的特征矩阵,H为特征矩阵的高,W为特征矩阵的宽,C为特征矩阵的通道数,V2为x的二次范数的平均值;
引入可学习参数γ和β对FRN层的特征进行缩放和平移变换,
Figure BDA0003715971720000062
其中,Oi为经处理后的特征,ε为避免除数为0时所使用的微小正数;
TLU激活函数的表达式为:
z=max(y,τ)=max(y-τ,0)+τ=ReLU(y-τ)+τ;
其中,τ为可以学习的参数,y为输入,z为经TLU激活函数后的输出。
在本申请的一种可选的实施例中,违规时间间隔预测模型的评价指标包括:MAE、RMSE和R2
Figure BDA0003715971720000071
Figure BDA0003715971720000072
Figure BDA0003715971720000073
其中,n为样本数,i为样本的下标,yi为模型的输出。
具体而言,本实施例中通过评价指标对违规时间间隔预测模型进行评价,能够判断违规时间间隔预测模型的准确度,保证模型的有效性。
在本申请的一种可选的实施例中,预设的第二模型的结构包括:
生成模型和判别模型;
生成模型和判别模型达到纳什平衡的表达式为:
Figure BDA0003715971720000074
其中,D为生成模型,G为判别模型,G(z|y)和D(x|y)均为加入标签信息y之后得到的条件概率,Pdata(x)为实际的样本数据,Pz(z)为生成的样本数据,E数学期望。
具体而言,本实施例中采用第一数据对预设的第二模型进行训练,形成CGAN模型,即条件生成式对抗网络模型,利用该模型获取第二数据;可选的,CGAN模型选用BP神经网络作为生成模型和判别模型,二者不断地博弈,最终达到纳什平衡。
在本申请的一种可选的实施例中,预设的第三模型的结果包括:
输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层;
其中,密集结构块包括BN层、ReLU函数、1*1卷积、3*3卷积和SEN层;
过渡层包括BN层、ReLU函数、1*1卷积和2*2平均池化。
具体而言,本实施例中的预设的第三模型的结构中,在密集结构块中添加了SEN层,即在DenseNet模型中嵌入SEN层,能够感知到特征通道的重要程度,捕捉到特征通道间的空间相关性。
需要说明的是,DenseNet模型是参考了ResNet模型的核心思想跨层连接所提出的,通过这样的方式使得每层的输出均可以直达最后的误差信号,进而提升了梯度的反向传播;CGAN是GAN的一个扩展,能够通过原数据对抗生成有质量的新数据,能够重新平衡数据集。本实施例提出的SE-DenseNet是使用SEN对DenseNet改进后所得到的网络,能够感知到特征通道的重要程度,捕捉到特征通道间的空间相关性。本发明公开了一种基于FRN层与DenseNet结合的驾驶员违规时间间隔预测方法及一种基于CGAN与SE-DenseNet结合的驾驶员违规类型预测方法,能避免网络梯度消失的情况,消除了对BatchSize的依赖,解决了训练样失衡与忽视通道重要程度的问题,具有较好的预测效果。
在本申请的一种可选的实施例中,SEN函数包括挤压操作、激励操作和重新加权操作。
在本申请的一种可选的实施例中,违规类型预测模型的评价指标包括:Accuracy,Precision,Recall,F1-Score;其中,
Figure BDA0003715971720000081
Figure BDA0003715971720000082
Figure BDA0003715971720000083
Figure BDA0003715971720000084
其中,n为样本数,i为样本的下标,Nij为将第i类样本预测成第j类的样本数量,如果i≠j,则说明这些数据是预测错了。
具体而言,本实施例中采用评价指标对违规类型预测模型进行评价,能够判断违规类型预测模型的准确度,保证模型的有效性。
请参见图2~图6所示,图2是本发明实施例提供的违规时间间隔数据特征图,图3是本发明实施例提供的违规类型数据特征图,图4是本发明实施例提供的违规时间间隔预测模型图,图5是本发明实施例提供的违规类型预测模型图,图6是本发明实施例提供的违规类型预测准确率图,在本申请的一种可选的实施例中,以某公交公司为例对本申请的技术方案作进一步的描述。
公交公司有基本的员工信息、违规信息、处罚信息、培训信息线路、车队、车辆等信息,将以上信息作为原数数据。
利用Python爬虫获取该公交公司所有线路、车辆信息、安全营运系统数据库中的数据,及公交公司所在地的天气信息。
综合上述数据,对获取的原始数据进行预处理。
将两个属性集合中相同属性定义为关联主键,然后根据关联主键进行属性集合之间的合并,最后完成属性融合过程;在属性融合后将所用数据按照属性划分为以下八个数据集合。
Figure BDA0003715971720000091
以个人信息与违规信息中员工编号为主键,执行merge操作,得到集合F1;以F1和天气信息中的日期为主键,执行merge操作,得到集合F2;以F2和处罚信息中违规编号为主键,执行merge操作,得到集合F3;以F3和培训信息中的违规编号为主键,执行merge操作,得到集合F4;以F4和线路信息中的线路编号为主键,执行merge操作,得到集合F5;以F5和车队信息中的车队编号为主键,执行merge操作,得到集合F6;以F6和车辆信息中的车号为主键,执行merge操作,得到集合F7;F7为与驾驶员违规相关的所有属性集合。
基于属性融合后获取到的所有驾驶员违规相关属性信息,从基础特征、趋势特征两个方面,构建驾驶员违规时间间隔预测与违规类型预测相关特征。
对于数值类型特征缺失,使用均值填充方式,例如{缺失值,7,8}填充为{7.5,7,8};对于非数值类型缺失,使用众数填充的方式,例如{缺失值,小巴,中巴,小巴}填充为{小巴,小巴,中巴,小巴}。
在特征编码部分,对于存在顺序大小关系的,采用Label encoding编码,例如{小学,中学,技校,高中,大专,本科及以上}编码为{1,2,3,4,5,6},对于不存在顺序大小关系的,采用one-hot encoding,例如{男,女}可表示为{[1,0],[0,1]}。
对所有的数据采用z-score标准化方式进行数据归一化,归一化的公式如下:
Figure BDA0003715971720000101
其中,μ为所有样本数据的均值,σ为所有样本数据的标准差。
至此完成了数据的预处理,接下来构建违规时间间隔预测模型。
本实施例中第一预设模型的网络包括卷积层,密集结构块,过渡层,池化层,全连接层,输出层,其具体的信息如下表所示:
Figure BDA0003715971720000111
选用Adam优化器,初始学习率为0.001,过渡层中降维参数为0.5,特征图增长通道为10,损失函数为MES;进行迭代训练直至收敛。
此外,为了验证本实施例中构建的违规时间间隔预测模型的有效性,采用MAE,RMSE和R2对模型的性能进行评价,其结果如下表所示:
Figure BDA0003715971720000112
由结果显示,与原来的DenseNet模型相比,本实施例提供的模型在不同的指标上均有更好的表现。
为了进一步验证本实施例提供的模型的有效性,将与其他方法进行对比实验,选取一类神经网络相关算法,BP神经网络,长短期记忆网络(LSTM),一类非神经网络算法,决策树(DT),随机森林(RF),对比结果如下表所示:
Figure BDA0003715971720000121
由结果显示,本实施例的方法明显优于其他的方法,且通过实验结果可以看出,预测值与真实值接近,误差值小,准确率高,模型性能良好。
至此,完成了违规时间间隔预测模型的训练,并对其进行了评价。接下来进行违规类型预测模型的训练和评价。
本实施例中提供的预设的第三模型可分为两部分,一部分为CGAN模型,一部分为SE-DenseNet模型,其中CGAN模型的参数设置如下表所示:
Figure BDA0003715971720000122
其中,CGAN模型的输入层参数和输出层参数根据具体的数据集修改成相应的维度,本实施例在此不作限定。
SE-DenseNet模型的具体设置如下表所示:
Figure BDA0003715971720000131
对原始数据处理后的数据可能是分布不均的,还需要进一步处理;首先使用处理后的数据训练CGAN模型。
优化器采用Adam,初始学习率为0.001,激活函数为LeakyReLU,BatchSize为64,损失函数为交叉熵损失函数;具体步骤为:
选用BP神经网络模型作为生成模型和判别模型。
得到符合分布的N维随机噪声z。
利用Embedding层将标签y转换成N维的稠密向量,与z相乘获得有标签的随机数,作为生成模型的输入。
生成模型将随机数变为样本数据G(z|y),将真实样本x、标签y和生成样本数据一起放入判别模型D中。
训练生成模型和判别模型直至纳什平衡。
利用训练好的生成模型生成需要过采样的数据,重新平衡各类样本数据。
接下来将第一数据和第二数据综合,并构建SE-DenseNet模型,综合数据更具有平衡性。
其中,SEN(挤压激励网络)层分为挤压、激励和重新加权三步,具体如下:
(1)挤压
通过挤压操作对输入的特征矩阵做全局平均池化操作把H*W*C的矩阵变换为1*1*C的矩阵,所述挤压操作公式为:
Figure BDA0003715971720000141
其中,C为特征矩阵的通道数,uc为第C个通道的特征矩阵,所述预设的第三模型的密集结构块输出的特征矩阵U=[u1,u2,…,uc],W为特征矩阵的宽,H为特征矩阵的高,Fsq为全局平均池化函数,Zc为输入特征矩阵从通道维度压缩的全局特征信息。
(2)激励
将通过挤压操作获取的矩阵先经过第一层全连接层将C个通道压缩成C/r个通道,r为压缩的比例;再经过ReLU激活函数,最后再经过第二层全连接层的C个通道输入到Sigmoid函数中,将其数值限制在[0,1];通过这种方式,能够学习到各个通道的权重信息;激励操作计算公式如下:
Sc=Fex(Zc,W)=σ(g(Zc,W))=σ(W2δ(W1Zc));
其中,Zc为输入特征矩阵从通道维度压缩的全局特征信息;W1和W2分别为第一全连接层和第二全连接层的权重参数,并且W1∈RC/r×C,W2∈RC×C/r,r为压缩的比例,δ为ReLU激活函数,σ为Sigmoid激活函数。
(3)重新加权
将通道的权重与该通道对应的特征矩阵相乘,完成在通道维度上的对原始特征的重标定,具体的公式如下所示:
u'c=Fscale(uc,sc)=uc*sc
其中,sc表示输入特征矩阵中的第C个通道经过激励操作获取到的该通道的权重信息,uc表示第C个通道的特征矩阵。
为了验证本实施例的有效性,采用Accurary,F1-Scorei对模型的性能进行评价,表示结果如下:
Figure BDA0003715971720000151
其中,数据集A为初始数据集,数据集B为混合数据集;C1-C6为6种分类情况;在CGAN模型过采样后的混合数据集B上训练的预测模型准确度要高于原数据集A训练出来的预测模型;SE-DenseNet模型也比DenseNet模型的准确度更高。
为了进一步验证本实施例的有效性,将与其他方法进行对比实验,选取一类神经网络相关算法,BP神经网络,长短期记忆网络(LSTM),一类非神经网络算法,决策树(DT),随机森林(RF),对比结果如下表所示:
Figure BDA0003715971720000152
结果显示,本发明所述方法明显优于其他的方法,模型性能良好。
本发明提供的一种基于神经网络的驾驶员违规预测方法,能够消除对BatchSize的依赖,性能优越,解决了训练样本失衡与忽视通道重要程度两个问题,具有较好的预测效果,使得驾驶员违规预测方法具有较高的准确率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (8)

1.一种基于神经网络的驾驶员违规预测方法,其特征在于,包括:
获取原始数据;
对所述原始数据进行处理,得到第一数据;
采用所述第一数据对预设的第一模型进行训练,得到违规时间间隔预测模型,并对所述违规时间间隔预测模型进行评价;
采用所述第一数据对预设的第二模型进行训练,对抗生成第二数据;
将所述第一数据和所述第二数据进行综合,得到综合数据;采用所述综合数据对预设的第三模型进行训练,得到违规类型预测模型,并对所述违规类型预测模型进行评价;
采用所述违规时间间隔预测模型和所述违规类型预测模型分别进行违规时间间隔和违规类型进行预测。
2.根据权利要求1所述的基于神经网络的驾驶员违规预测方法,其特征在于,所述预设的第一模型的结构包括:
输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层;
其中,所述密集结构块依次包括FRN层、TLU激活函数、1*1卷积和3*3卷积;所述过渡层依次包括FRN层、TLU激活函数、1*1卷积和2*2平均池化。
3.根据权利要求2所述的基于神经网络的驾驶员违规预测方法,其特征在于,所述FRN层的表达式为:
Figure FDA0003715971710000011
其中,N为批样本数,xi为H*W*C的特征矩阵,H为特征矩阵的高,W为特征矩阵的宽,C为特征矩阵的通道数,V2为x的二次范数的平均值;
引入可学习参数γ和β对FRN层的特征进行缩放和平移变换,
Figure FDA0003715971710000012
其中,Oi为经处理后的特征,ε为避免除数为0时所使用的微小正数;
TLU激活函数的表达式为:
z=max(y,τ)=max(y-τ,0)+τ=ReLU(y-τ)+τ;
其中,τ为可以学习的参数,y为输入,z为经TLU激活函数后的输出。
4.根据权利要求1所述的基于神经网络的驾驶员违规预测方法,其特征在于,所述违规时间间隔预测模型的评价指标包括:MAE、RMSE和R2
Figure FDA0003715971710000021
Figure FDA0003715971710000022
Figure FDA0003715971710000023
其中,n为样本数,i为样本的下标,yi为模型的输出。
5.根据权利要求1所述的基于神经网络的驾驶员违规预测方法,其特征在于,所述预设的第二模型的结构包括:
生成模型和判别模型;
所述生成模型和所述判别模型达到纳什平衡的表达式为:
Figure FDA0003715971710000024
其中,D为所述生成模型,G为所述判别模型,G(z|y)和D(x|y)均为加入标签信息y之后得到的条件概率,Pdata(x)为实际的样本数据,Pz(z)为生成的样本数据,E为数学期望。
6.根据权利要求1所述的基于神经网络的驾驶员违规预测方法,其特征在于,所述预设的第三模型的结果包括:
输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层;
其中,所述密集结构块包括BN层、ReLU函数、1*1卷积、3*3卷积和SEN层;
所述过渡层包括BN层、ReLU函数、1*1卷积和2*2平均池化。
7.根据权利要求6所述的基于神经网络的驾驶员违规预测方法,其特征在于,所述SEN层包括挤压操作、激励操作和重新加权操作。
8.根据权利要求1所述的基于神经网络的驾驶员违规预测方法,其特征在于,所述违规类型预测模型的评价指标包括:Accuracy,Precision,Recall,F1-Score;其中,
Figure FDA0003715971710000031
Figure FDA0003715971710000032
Figure FDA0003715971710000033
Figure FDA0003715971710000034
其中,n为样本数,i为样本的下标,Nij为第i类样本预测成第j类的数量。
CN202210738974.4A 2022-06-27 2022-06-27 基于神经网络的驾驶员违规预测方法 Pending CN115346363A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210738974.4A CN115346363A (zh) 2022-06-27 2022-06-27 基于神经网络的驾驶员违规预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210738974.4A CN115346363A (zh) 2022-06-27 2022-06-27 基于神经网络的驾驶员违规预测方法

Publications (1)

Publication Number Publication Date
CN115346363A true CN115346363A (zh) 2022-11-15

Family

ID=83948890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210738974.4A Pending CN115346363A (zh) 2022-06-27 2022-06-27 基于神经网络的驾驶员违规预测方法

Country Status (1)

Country Link
CN (1) CN115346363A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115725910A (zh) * 2022-11-24 2023-03-03 上海交通大学内蒙古研究院 铸造用不锈钢的调配方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107918764A (zh) * 2017-11-16 2018-04-17 百度在线网络技术(北京)有限公司 信息输出方法和装置
CN109998500A (zh) * 2019-04-30 2019-07-12 陕西师范大学 一种基于生成式对抗网络的脉搏信号生成方法及系统
CN111723602A (zh) * 2019-03-19 2020-09-29 杭州海康威视数字技术股份有限公司 驾驶员的行为识别方法、装置、设备及存储介质
CN112149511A (zh) * 2020-08-27 2020-12-29 深圳市点创科技有限公司 基于神经网络的驾驶员违规行为检测方法、终端、装置
CN112862070A (zh) * 2021-01-22 2021-05-28 重庆理工大学 一种利用图神经网络和胶囊网络的链路预测系统
CN112883936A (zh) * 2021-04-08 2021-06-01 桂林电子科技大学 一种对车辆违规行为的检测方法及其系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107918764A (zh) * 2017-11-16 2018-04-17 百度在线网络技术(北京)有限公司 信息输出方法和装置
CN111723602A (zh) * 2019-03-19 2020-09-29 杭州海康威视数字技术股份有限公司 驾驶员的行为识别方法、装置、设备及存储介质
CN109998500A (zh) * 2019-04-30 2019-07-12 陕西师范大学 一种基于生成式对抗网络的脉搏信号生成方法及系统
CN112149511A (zh) * 2020-08-27 2020-12-29 深圳市点创科技有限公司 基于神经网络的驾驶员违规行为检测方法、终端、装置
CN112862070A (zh) * 2021-01-22 2021-05-28 重庆理工大学 一种利用图神经网络和胶囊网络的链路预测系统
CN112883936A (zh) * 2021-04-08 2021-06-01 桂林电子科技大学 一种对车辆违规行为的检测方法及其系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
KUSKAPAN E ETAL.: "Speed violation analysis of heavy vehicles on highways using spatial analysis and machine learning algorithms", ACCIDENT ANALYSIS & PREVENTION *
SAURABH SINGH: "Filter Response Normalization Layer: Eliminating Batch Dependence in the Training of Deep Neural Networks", 2020 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), pages 11234 - 11243 *
尤扬: "基于卷积神经网络的股票预测模型研究", 中国优秀硕士论文全文数据库基础科学辑, no. 3 *
郁春兰;肖心远;李怀俊;: "基于神经网络技术的危险货物运输驾驶员安全评价系统研究", 南方职业教育学刊, no. 06 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115725910A (zh) * 2022-11-24 2023-03-03 上海交通大学内蒙古研究院 铸造用不锈钢的调配方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111340543B (zh) 一种基于注意力机制的细粒度打车需求预测方法
CN114493755B (zh) 一种融合时序信息的自注意力序列推荐方法
CN112598438A (zh) 一种基于大规模用户画像的户外广告推荐系统及方法
CN112015901A (zh) 文本分类方法及装置、警情分析系统
CN111626764A (zh) 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
CN111737416A (zh) 案件处理模型的训练方法、案件文本处理方法及相关装置
CN116051840A (zh) 一种基于生成对抗学习的半监督水下图像语义分割方法
CN117475038B (zh) 一种图像生成方法、装置、设备及计算机可读存储介质
CN114707754A (zh) 一种基于BiLSTM-CNN模型的智能电表故障预测方法及系统
CN115346363A (zh) 基于神经网络的驾驶员违规预测方法
CN112926627A (zh) 一种基于电容型设备缺陷数据的设备缺陷时间预测方法
CN115545350A (zh) 综合深度神经网络与强化学习的车辆路径问题求解方法
CN115146700A (zh) 一种基于Transformer序列到序列模型的径流预测方法
CN116977001A (zh) 地质灾害防治工程造价管理系统及其方法
CN114037139A (zh) 一种基于注意力机制的货运车辆仓库逗留时长预测方法
CN117150148A (zh) 一种基于预训练模型的社交网络舆情态势监控方法
CN116522232A (zh) 文档分类方法、装置、设备及存储介质
CN114818849A (zh) 基于大数据信息的卷积神经网络和遗传算法的反窃电方法
CN113988178A (zh) 一种低压配电网窃电用户检测方法和装置
CN114118630B (zh) 一种基于气象事件的需求量预测方法和系统
CN117437786B (zh) 一种基于人工智能的实时交通路网短时交通流预测方法
CN111158640B (zh) 一种基于深度学习的一对多需求分析识别方法
CN117217782A (zh) 一种多维度的停车场价格调整方法及装置
CN117252607A (zh) 车损事故管理系统及其方法
CN117610128A (zh) 知识图谱驱动的隧道洞门结构方案设计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination