CN115346363A - 基于神经网络的驾驶员违规预测方法 - Google Patents
基于神经网络的驾驶员违规预测方法 Download PDFInfo
- Publication number
- CN115346363A CN115346363A CN202210738974.4A CN202210738974A CN115346363A CN 115346363 A CN115346363 A CN 115346363A CN 202210738974 A CN202210738974 A CN 202210738974A CN 115346363 A CN115346363 A CN 115346363A
- Authority
- CN
- China
- Prior art keywords
- model
- data
- violation
- layer
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 30
- 239000011159 matrix material Substances 0.000 claims description 26
- 230000004913 activation Effects 0.000 claims description 17
- 238000011176 pooling Methods 0.000 claims description 15
- 230000007704 transition Effects 0.000 claims description 14
- 238000011156 evaluation Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 230000006399 behavior Effects 0.000 description 6
- 238000003066 decision tree Methods 0.000 description 5
- 230000005284 excitation Effects 0.000 description 5
- 238000007637 random forest analysis Methods 0.000 description 5
- 206010039203 Road traffic accident Diseases 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000001125 extrusion Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G06Q50/40—
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
Abstract
本发明公开了一种基于神经网络的驾驶员违规预测方法,涉及违规预测技术领域,包括:获取原始数据;对原始数据进行处理,得到第一数据;采用第一数据对预设的第一模型进行训练,得到违规时间间隔预测模型,并对违规时间间隔预测模型进行评价;采用第一数据对预设的第二模型进行训练,对抗生成第二数据;将第一数据和第二数据进行综合,得到综合数据;采用综合数据对预设的第三模型进行训练,得到违规类型预测模型,并对违规类型预测模型进行评价;采用违规时间间隔预测模型和违规类型预测模型分别进行违规时间间隔和违规类型进行预测。本申请能够以较高的准确率对驾驶员违规进行预测。
Description
技术领域
本发明属于违规预测技术领域,具体涉及一种基于神经网络的驾驶员违规预测方法。
背景技术
随着我国机动车的保有量的不断攀升,交通事故发生数量也在随之增长。据统计,大多数交通事故的主要原因是驾驶员违规驾驶行为,驾驶员违规一直是交通领域的研究热点,为了减少驾驶员的违规驾驶行为,保障驾驶员的交通安全;部分学者从驾驶员的个人因素、环境因素、天气因素等方面出发,分析驾驶员违规驾驶行为背后机理;除此之外,基于驾驶员违规相关因素,使用不同的机器学习方法对驾驶员的违规类型、严重程度、频率等方面展开预测,也成为当前预防驾驶员违规驾驶行为造成交通事故的重要手段之一。交通事故的频发迫切的需要对驾驶员违规行为进行精准预测,以达到保障人们安全出行的目的。
相关技术中,国内外学者在驾驶员违规预测方面已经取得了一定的成果,现有技术多是在提取特征之后再利用支持向量机、随机森林、高斯朴素贝叶斯、决策树等传统的机器学习方法进行训练。传统的机器学习方法,在某些特定情景有不错的表现,但不能有效的提取驾驶员违规驾驶行为的深层次特征信息,在复杂情况下表现较差,模型的预测值和真实值的偏差较大,模型准确性较低;小部分学者将卷积神经网络应用于驾驶员违规预测中,提取深层次特征信息的能力增加了,但普通神经网络的固有问题也凸显了出来,在普通的神经网络模型训练中,容易出现网络梯度消失的问题,且依赖于训练集的数据分布,如果分布不均匀,训练出来的模型容易过拟合,在实际应用中的效果很差。
因此,亟需改善上述应用中存在的问题。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于神经网络的驾驶员违规预测方法。本发明要解决的技术问题通过以下技术方案实现:
第一方面,本申请提供一种基于神经网络的驾驶员违规预测方法,包括:
获取原始数据;
对原始数据进行处理,得到第一数据;
采用第一数据对预设的第一模型进行训练,得到违规时间间隔预测模型,并对违规时间间隔预测模型进行评价;
采用第一数据对预设的第二模型进行训练,对抗生成第二数据;
将第一数据和第二数据进行综合,得到综合数据;采用综合数据对预设的第三模型进行训练,得到违规类型预测模型,并对违规类型预测模型进行评价;
采用违规时间间隔预测模型和违规类型预测模型分别进行违规时间间隔和违规类型进行预测。
可选地,预设的第一模型的结构包括:
输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层;
其中,密集结构块依次包括FRN层、TLU激活函数、1*1卷积和3*3卷积;所述过渡层依次包括FRN层、TLU激活函数、1*1卷积和2*2平均池化。
可选地,FRN层的表达式为:
其中,N为批样本数,xi为H*W*C的特征矩阵,H为特征矩阵的高,W为特征矩阵的宽,C为特征矩阵的通道数,V2为x的二次范数的平均值;
引入可学习参数γ和β对FRN层的特征进行缩放和平移变换,
TLU激活函数的表达式为:
z=max(y,τ)=max(y-τ,0)+τ=ReLU(y-τ)+τ;
其中,τ为可以学习的参数,y为输入,z为经TLU激活函数后的输出。
可选地,违规时间间隔预测模型的评价指标包括:MAE、RMSE和R2;
其中,n为样本数,i为样本的下标,yi为模型的输出。
可选地,预设的第二模型的结构包括:
生成模型和判别模型;
生成模型和所述判别模型达到纳什平衡的表达式为:
其中,D为生成模型,G为判别模型,G(z|y)和D(x|y)均为加入标签信息y之后得到的条件概率,Pdata(x)为实际的样本数据,Pz(z)为生成的样本数据,E为数学期望。
可选地,预设的第三模型的结果包括:
输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层;
其中,密集结构块包括BN层、ReLU函数、1*1卷积、3*3卷积和SEN层;
过渡层包括BN层、ReLU函数、1*1卷积和2*2平均池化。
可选地,SEN层包括挤压操作、激励操作和重新加权操作。
可选地,违规类型预测模型的评价指标包括:Accuracy,Precision,Recall,F1-Score;其中,
其中,n为样本数,i为样本的下标,Nij为第i类样本预测成第j类的数量。
本发明的有益效果:
本发明提供的一种基于神经网络的驾驶员违规预测方法,能够消除对BatchSize的依赖,性能优越,解决了训练样本失衡与忽视通道重要程度两个问题,具有较好的预测效果,使得驾驶员违规预测方法具有较高的准确率。
以下将结合附图及实施例对本发明做进一步详细说明。
附图说明
图1是本发明实施例提供的基于神经网络的驾驶员违规预测方法的一种流程图;
图2是本发明实施例提供的违规时间间隔数据特征图;
图3是本发明实施例提供的违规类型数据特征图;
图4是本发明实施例提供的违规时间间隔预测模型图;
图5是本发明实施例提供的违规类型预测模型图;
图6是本发明实施例提供的违规类型预测准确率图。
具体实施方式
下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。
请参见图1,图1是本发明实施例提供的基于神经网络的驾驶员违规预测方法的一种流程图,本申请所提供的一种基于神经网络的驾驶员违规预测方法,包括:
S101、获取原始数据;
S102、对原始数据进行处理,得到第一数据;
S103、采用第一数据对预设的第一模型进行训练,得到违规时间间隔预测模型,并对违规时间间隔预测模型进行评价;
S104、采用第一数据对预设的第二模型进行训练,对抗生成第二数据;
S105、将第一数据和第二数据进行综合,得到综合数据;采用综合数据对预设的第三模型进行训练,得到违规类型预测模型,并对违规类型预测模型进行评价;
S106、采用违规时间间隔预测模型和违规类型预测模型分别进行违规时间间隔和违规类型进行预测。
具体而言,本实施例中提供的一种基于神经网络的驾驶员违规预测方法,能够克服梯度消失的问题,同时具有良好的特征提取能力,使得驾驶员违规预测的表现得到明显的提升;此外,还解决数据集分布不均匀的影响,能够使得模型的训练更加容易,且避免出现过拟合的情况,在实际应用中有良好的效果。
相关技术中,传统的机器学习方法在简单情况下能够有不错的效果,在复杂的情况下提取特征的能力欠佳,模型表现差。普通的卷积神经网络模型过分的依赖训练数据,无法在实际应用中达到训练时所能达到的效果,都不能在实际中发挥稳定作用。
有鉴于此,本实施例中提供的基于神经网络的驾驶员违规预测方法,包括:
获取原始数据;原始数据可以为某公交公司的原始数据。
对所述原始数据进行处理,得到第一数据;获取的原始数据需要处理后,再次使用;其中,原始数据处理的方法包括属性融合、特征构造、缺失值填充、特征编码和数据归一化。
采用所述第一数据对预设的第一模型进行训练,得到违规时间间隔预测模型,并对所述违规时间间隔预测模型进行评价;
采用所述第一数据对预设的第二模型进行训练,对抗生成第二数据;其中,第一数据具有不平衡的缺陷,需要对第一数据再次处理,即通过第二模型处理,生成第二数据。
将所述第一数据和所述第二数据进行综合,得到综合数据;采用所述综合数据对预设的第三模型进行训练,得到违规类型预测模型,并对所述违规类型预测模型进行评价。需要说明的是,第二数据不一定是平衡的,最后的综合数据是平衡的。
采用所述违规时间间隔预测模型和所述违规类型预测模型分别进行违规时间间隔和违规类型进行预测。
通过以上过程获取的驾驶员违规预测方法,能够消除对BatchSize的依赖,性能优越,解决了训练样本失衡与忽视通道重要程度两个问题,具有较好的预测效果,使得驾驶员违规预测方法具有较高的准确率。
在本申请的一种可选的实施例中,预设的第一模型的结构包括:
输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层;
其中,密集结构块依次包括FRN层、TLU激活函数、1*1卷积和3*3卷积;所述过渡层依次包括FRN层、TLU激活函数、1*1卷积和2*2平均池化
具体而言,本实施例中的预设的第一模型为FRN与DenseNet结合的模型,现有的DenseNet模型中的密集结构块中包括BN层和ReLU函数,而本实施例中将BN层和ReLU函数替换为FRN+TLU激活函数,能够避免网络梯度消失的情况,消除了对BatchSize的依赖。
在本申请的一种可选的实施例中,FRN层的表达式为:
其中,N为批样本数,xi为H*W*C的特征矩阵,H为特征矩阵的高,W为特征矩阵的宽,C为特征矩阵的通道数,V2为x的二次范数的平均值;
引入可学习参数γ和β对FRN层的特征进行缩放和平移变换,
TLU激活函数的表达式为:
z=max(y,τ)=max(y-τ,0)+τ=ReLU(y-τ)+τ;
其中,τ为可以学习的参数,y为输入,z为经TLU激活函数后的输出。
在本申请的一种可选的实施例中,违规时间间隔预测模型的评价指标包括:MAE、RMSE和R2;
其中,n为样本数,i为样本的下标,yi为模型的输出。
具体而言,本实施例中通过评价指标对违规时间间隔预测模型进行评价,能够判断违规时间间隔预测模型的准确度,保证模型的有效性。
在本申请的一种可选的实施例中,预设的第二模型的结构包括:
生成模型和判别模型;
生成模型和判别模型达到纳什平衡的表达式为:
其中,D为生成模型,G为判别模型,G(z|y)和D(x|y)均为加入标签信息y之后得到的条件概率,Pdata(x)为实际的样本数据,Pz(z)为生成的样本数据,E数学期望。
具体而言,本实施例中采用第一数据对预设的第二模型进行训练,形成CGAN模型,即条件生成式对抗网络模型,利用该模型获取第二数据;可选的,CGAN模型选用BP神经网络作为生成模型和判别模型,二者不断地博弈,最终达到纳什平衡。
在本申请的一种可选的实施例中,预设的第三模型的结果包括:
输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层;
其中,密集结构块包括BN层、ReLU函数、1*1卷积、3*3卷积和SEN层;
过渡层包括BN层、ReLU函数、1*1卷积和2*2平均池化。
具体而言,本实施例中的预设的第三模型的结构中,在密集结构块中添加了SEN层,即在DenseNet模型中嵌入SEN层,能够感知到特征通道的重要程度,捕捉到特征通道间的空间相关性。
需要说明的是,DenseNet模型是参考了ResNet模型的核心思想跨层连接所提出的,通过这样的方式使得每层的输出均可以直达最后的误差信号,进而提升了梯度的反向传播;CGAN是GAN的一个扩展,能够通过原数据对抗生成有质量的新数据,能够重新平衡数据集。本实施例提出的SE-DenseNet是使用SEN对DenseNet改进后所得到的网络,能够感知到特征通道的重要程度,捕捉到特征通道间的空间相关性。本发明公开了一种基于FRN层与DenseNet结合的驾驶员违规时间间隔预测方法及一种基于CGAN与SE-DenseNet结合的驾驶员违规类型预测方法,能避免网络梯度消失的情况,消除了对BatchSize的依赖,解决了训练样失衡与忽视通道重要程度的问题,具有较好的预测效果。
在本申请的一种可选的实施例中,SEN函数包括挤压操作、激励操作和重新加权操作。
在本申请的一种可选的实施例中,违规类型预测模型的评价指标包括:Accuracy,Precision,Recall,F1-Score;其中,
其中,n为样本数,i为样本的下标,Nij为将第i类样本预测成第j类的样本数量,如果i≠j,则说明这些数据是预测错了。
具体而言,本实施例中采用评价指标对违规类型预测模型进行评价,能够判断违规类型预测模型的准确度,保证模型的有效性。
请参见图2~图6所示,图2是本发明实施例提供的违规时间间隔数据特征图,图3是本发明实施例提供的违规类型数据特征图,图4是本发明实施例提供的违规时间间隔预测模型图,图5是本发明实施例提供的违规类型预测模型图,图6是本发明实施例提供的违规类型预测准确率图,在本申请的一种可选的实施例中,以某公交公司为例对本申请的技术方案作进一步的描述。
公交公司有基本的员工信息、违规信息、处罚信息、培训信息线路、车队、车辆等信息,将以上信息作为原数数据。
利用Python爬虫获取该公交公司所有线路、车辆信息、安全营运系统数据库中的数据,及公交公司所在地的天气信息。
综合上述数据,对获取的原始数据进行预处理。
将两个属性集合中相同属性定义为关联主键,然后根据关联主键进行属性集合之间的合并,最后完成属性融合过程;在属性融合后将所用数据按照属性划分为以下八个数据集合。
以个人信息与违规信息中员工编号为主键,执行merge操作,得到集合F1;以F1和天气信息中的日期为主键,执行merge操作,得到集合F2;以F2和处罚信息中违规编号为主键,执行merge操作,得到集合F3;以F3和培训信息中的违规编号为主键,执行merge操作,得到集合F4;以F4和线路信息中的线路编号为主键,执行merge操作,得到集合F5;以F5和车队信息中的车队编号为主键,执行merge操作,得到集合F6;以F6和车辆信息中的车号为主键,执行merge操作,得到集合F7;F7为与驾驶员违规相关的所有属性集合。
基于属性融合后获取到的所有驾驶员违规相关属性信息,从基础特征、趋势特征两个方面,构建驾驶员违规时间间隔预测与违规类型预测相关特征。
对于数值类型特征缺失,使用均值填充方式,例如{缺失值,7,8}填充为{7.5,7,8};对于非数值类型缺失,使用众数填充的方式,例如{缺失值,小巴,中巴,小巴}填充为{小巴,小巴,中巴,小巴}。
在特征编码部分,对于存在顺序大小关系的,采用Label encoding编码,例如{小学,中学,技校,高中,大专,本科及以上}编码为{1,2,3,4,5,6},对于不存在顺序大小关系的,采用one-hot encoding,例如{男,女}可表示为{[1,0],[0,1]}。
对所有的数据采用z-score标准化方式进行数据归一化,归一化的公式如下:
其中,μ为所有样本数据的均值,σ为所有样本数据的标准差。
至此完成了数据的预处理,接下来构建违规时间间隔预测模型。
本实施例中第一预设模型的网络包括卷积层,密集结构块,过渡层,池化层,全连接层,输出层,其具体的信息如下表所示:
选用Adam优化器,初始学习率为0.001,过渡层中降维参数为0.5,特征图增长通道为10,损失函数为MES;进行迭代训练直至收敛。
此外,为了验证本实施例中构建的违规时间间隔预测模型的有效性,采用MAE,RMSE和R2对模型的性能进行评价,其结果如下表所示:
由结果显示,与原来的DenseNet模型相比,本实施例提供的模型在不同的指标上均有更好的表现。
为了进一步验证本实施例提供的模型的有效性,将与其他方法进行对比实验,选取一类神经网络相关算法,BP神经网络,长短期记忆网络(LSTM),一类非神经网络算法,决策树(DT),随机森林(RF),对比结果如下表所示:
由结果显示,本实施例的方法明显优于其他的方法,且通过实验结果可以看出,预测值与真实值接近,误差值小,准确率高,模型性能良好。
至此,完成了违规时间间隔预测模型的训练,并对其进行了评价。接下来进行违规类型预测模型的训练和评价。
本实施例中提供的预设的第三模型可分为两部分,一部分为CGAN模型,一部分为SE-DenseNet模型,其中CGAN模型的参数设置如下表所示:
其中,CGAN模型的输入层参数和输出层参数根据具体的数据集修改成相应的维度,本实施例在此不作限定。
SE-DenseNet模型的具体设置如下表所示:
对原始数据处理后的数据可能是分布不均的,还需要进一步处理;首先使用处理后的数据训练CGAN模型。
优化器采用Adam,初始学习率为0.001,激活函数为LeakyReLU,BatchSize为64,损失函数为交叉熵损失函数;具体步骤为:
选用BP神经网络模型作为生成模型和判别模型。
得到符合分布的N维随机噪声z。
利用Embedding层将标签y转换成N维的稠密向量,与z相乘获得有标签的随机数,作为生成模型的输入。
生成模型将随机数变为样本数据G(z|y),将真实样本x、标签y和生成样本数据一起放入判别模型D中。
训练生成模型和判别模型直至纳什平衡。
利用训练好的生成模型生成需要过采样的数据,重新平衡各类样本数据。
接下来将第一数据和第二数据综合,并构建SE-DenseNet模型,综合数据更具有平衡性。
其中,SEN(挤压激励网络)层分为挤压、激励和重新加权三步,具体如下:
(1)挤压
通过挤压操作对输入的特征矩阵做全局平均池化操作把H*W*C的矩阵变换为1*1*C的矩阵,所述挤压操作公式为:
其中,C为特征矩阵的通道数,uc为第C个通道的特征矩阵,所述预设的第三模型的密集结构块输出的特征矩阵U=[u1,u2,…,uc],W为特征矩阵的宽,H为特征矩阵的高,Fsq为全局平均池化函数,Zc为输入特征矩阵从通道维度压缩的全局特征信息。
(2)激励
将通过挤压操作获取的矩阵先经过第一层全连接层将C个通道压缩成C/r个通道,r为压缩的比例;再经过ReLU激活函数,最后再经过第二层全连接层的C个通道输入到Sigmoid函数中,将其数值限制在[0,1];通过这种方式,能够学习到各个通道的权重信息;激励操作计算公式如下:
Sc=Fex(Zc,W)=σ(g(Zc,W))=σ(W2δ(W1Zc));
其中,Zc为输入特征矩阵从通道维度压缩的全局特征信息;W1和W2分别为第一全连接层和第二全连接层的权重参数,并且W1∈RC/r×C,W2∈RC×C/r,r为压缩的比例,δ为ReLU激活函数,σ为Sigmoid激活函数。
(3)重新加权
将通道的权重与该通道对应的特征矩阵相乘,完成在通道维度上的对原始特征的重标定,具体的公式如下所示:
u'c=Fscale(uc,sc)=uc*sc;
其中,sc表示输入特征矩阵中的第C个通道经过激励操作获取到的该通道的权重信息,uc表示第C个通道的特征矩阵。
为了验证本实施例的有效性,采用Accurary,F1-Scorei对模型的性能进行评价,表示结果如下:
其中,数据集A为初始数据集,数据集B为混合数据集;C1-C6为6种分类情况;在CGAN模型过采样后的混合数据集B上训练的预测模型准确度要高于原数据集A训练出来的预测模型;SE-DenseNet模型也比DenseNet模型的准确度更高。
为了进一步验证本实施例的有效性,将与其他方法进行对比实验,选取一类神经网络相关算法,BP神经网络,长短期记忆网络(LSTM),一类非神经网络算法,决策树(DT),随机森林(RF),对比结果如下表所示:
结果显示,本发明所述方法明显优于其他的方法,模型性能良好。
本发明提供的一种基于神经网络的驾驶员违规预测方法,能够消除对BatchSize的依赖,性能优越,解决了训练样本失衡与忽视通道重要程度两个问题,具有较好的预测效果,使得驾驶员违规预测方法具有较高的准确率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (8)
1.一种基于神经网络的驾驶员违规预测方法,其特征在于,包括:
获取原始数据;
对所述原始数据进行处理,得到第一数据;
采用所述第一数据对预设的第一模型进行训练,得到违规时间间隔预测模型,并对所述违规时间间隔预测模型进行评价;
采用所述第一数据对预设的第二模型进行训练,对抗生成第二数据;
将所述第一数据和所述第二数据进行综合,得到综合数据;采用所述综合数据对预设的第三模型进行训练,得到违规类型预测模型,并对所述违规类型预测模型进行评价;
采用所述违规时间间隔预测模型和所述违规类型预测模型分别进行违规时间间隔和违规类型进行预测。
2.根据权利要求1所述的基于神经网络的驾驶员违规预测方法,其特征在于,所述预设的第一模型的结构包括:
输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层;
其中,所述密集结构块依次包括FRN层、TLU激活函数、1*1卷积和3*3卷积;所述过渡层依次包括FRN层、TLU激活函数、1*1卷积和2*2平均池化。
6.根据权利要求1所述的基于神经网络的驾驶员违规预测方法,其特征在于,所述预设的第三模型的结果包括:
输入层、卷积层、密集结构块、过渡层、池化层、全连接层和输出层;
其中,所述密集结构块包括BN层、ReLU函数、1*1卷积、3*3卷积和SEN层;
所述过渡层包括BN层、ReLU函数、1*1卷积和2*2平均池化。
7.根据权利要求6所述的基于神经网络的驾驶员违规预测方法,其特征在于,所述SEN层包括挤压操作、激励操作和重新加权操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210738974.4A CN115346363A (zh) | 2022-06-27 | 2022-06-27 | 基于神经网络的驾驶员违规预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210738974.4A CN115346363A (zh) | 2022-06-27 | 2022-06-27 | 基于神经网络的驾驶员违规预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115346363A true CN115346363A (zh) | 2022-11-15 |
Family
ID=83948890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210738974.4A Pending CN115346363A (zh) | 2022-06-27 | 2022-06-27 | 基于神经网络的驾驶员违规预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115346363A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115725910A (zh) * | 2022-11-24 | 2023-03-03 | 上海交通大学内蒙古研究院 | 铸造用不锈钢的调配方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107918764A (zh) * | 2017-11-16 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 信息输出方法和装置 |
CN109998500A (zh) * | 2019-04-30 | 2019-07-12 | 陕西师范大学 | 一种基于生成式对抗网络的脉搏信号生成方法及系统 |
CN111723602A (zh) * | 2019-03-19 | 2020-09-29 | 杭州海康威视数字技术股份有限公司 | 驾驶员的行为识别方法、装置、设备及存储介质 |
CN112149511A (zh) * | 2020-08-27 | 2020-12-29 | 深圳市点创科技有限公司 | 基于神经网络的驾驶员违规行为检测方法、终端、装置 |
CN112862070A (zh) * | 2021-01-22 | 2021-05-28 | 重庆理工大学 | 一种利用图神经网络和胶囊网络的链路预测系统 |
CN112883936A (zh) * | 2021-04-08 | 2021-06-01 | 桂林电子科技大学 | 一种对车辆违规行为的检测方法及其系统 |
-
2022
- 2022-06-27 CN CN202210738974.4A patent/CN115346363A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107918764A (zh) * | 2017-11-16 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 信息输出方法和装置 |
CN111723602A (zh) * | 2019-03-19 | 2020-09-29 | 杭州海康威视数字技术股份有限公司 | 驾驶员的行为识别方法、装置、设备及存储介质 |
CN109998500A (zh) * | 2019-04-30 | 2019-07-12 | 陕西师范大学 | 一种基于生成式对抗网络的脉搏信号生成方法及系统 |
CN112149511A (zh) * | 2020-08-27 | 2020-12-29 | 深圳市点创科技有限公司 | 基于神经网络的驾驶员违规行为检测方法、终端、装置 |
CN112862070A (zh) * | 2021-01-22 | 2021-05-28 | 重庆理工大学 | 一种利用图神经网络和胶囊网络的链路预测系统 |
CN112883936A (zh) * | 2021-04-08 | 2021-06-01 | 桂林电子科技大学 | 一种对车辆违规行为的检测方法及其系统 |
Non-Patent Citations (4)
Title |
---|
KUSKAPAN E ETAL.: "Speed violation analysis of heavy vehicles on highways using spatial analysis and machine learning algorithms", ACCIDENT ANALYSIS & PREVENTION * |
SAURABH SINGH: "Filter Response Normalization Layer: Eliminating Batch Dependence in the Training of Deep Neural Networks", 2020 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), pages 11234 - 11243 * |
尤扬: "基于卷积神经网络的股票预测模型研究", 中国优秀硕士论文全文数据库基础科学辑, no. 3 * |
郁春兰;肖心远;李怀俊;: "基于神经网络技术的危险货物运输驾驶员安全评价系统研究", 南方职业教育学刊, no. 06 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115725910A (zh) * | 2022-11-24 | 2023-03-03 | 上海交通大学内蒙古研究院 | 铸造用不锈钢的调配方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111340543B (zh) | 一种基于注意力机制的细粒度打车需求预测方法 | |
CN114493755B (zh) | 一种融合时序信息的自注意力序列推荐方法 | |
CN112598438A (zh) | 一种基于大规模用户画像的户外广告推荐系统及方法 | |
CN112015901A (zh) | 文本分类方法及装置、警情分析系统 | |
CN111626764A (zh) | 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置 | |
CN111737416A (zh) | 案件处理模型的训练方法、案件文本处理方法及相关装置 | |
CN116051840A (zh) | 一种基于生成对抗学习的半监督水下图像语义分割方法 | |
CN117475038B (zh) | 一种图像生成方法、装置、设备及计算机可读存储介质 | |
CN114707754A (zh) | 一种基于BiLSTM-CNN模型的智能电表故障预测方法及系统 | |
CN115346363A (zh) | 基于神经网络的驾驶员违规预测方法 | |
CN112926627A (zh) | 一种基于电容型设备缺陷数据的设备缺陷时间预测方法 | |
CN115545350A (zh) | 综合深度神经网络与强化学习的车辆路径问题求解方法 | |
CN115146700A (zh) | 一种基于Transformer序列到序列模型的径流预测方法 | |
CN116977001A (zh) | 地质灾害防治工程造价管理系统及其方法 | |
CN114037139A (zh) | 一种基于注意力机制的货运车辆仓库逗留时长预测方法 | |
CN117150148A (zh) | 一种基于预训练模型的社交网络舆情态势监控方法 | |
CN116522232A (zh) | 文档分类方法、装置、设备及存储介质 | |
CN114818849A (zh) | 基于大数据信息的卷积神经网络和遗传算法的反窃电方法 | |
CN113988178A (zh) | 一种低压配电网窃电用户检测方法和装置 | |
CN114118630B (zh) | 一种基于气象事件的需求量预测方法和系统 | |
CN117437786B (zh) | 一种基于人工智能的实时交通路网短时交通流预测方法 | |
CN111158640B (zh) | 一种基于深度学习的一对多需求分析识别方法 | |
CN117217782A (zh) | 一种多维度的停车场价格调整方法及装置 | |
CN117252607A (zh) | 车损事故管理系统及其方法 | |
CN117610128A (zh) | 知识图谱驱动的隧道洞门结构方案设计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |