CN115689040A - 基于卷积神经网络的交通事故严重程度预测方法及系统 - Google Patents

基于卷积神经网络的交通事故严重程度预测方法及系统 Download PDF

Info

Publication number
CN115689040A
CN115689040A CN202211411414.4A CN202211411414A CN115689040A CN 115689040 A CN115689040 A CN 115689040A CN 202211411414 A CN202211411414 A CN 202211411414A CN 115689040 A CN115689040 A CN 115689040A
Authority
CN
China
Prior art keywords
traffic accident
factors
accident
factor
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211411414.4A
Other languages
English (en)
Other versions
CN115689040B (zh
Inventor
杨松
姚佳娜
洪强
汪心渊
周跃琪
何亚强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Scientific Research Institute of Transport
Original Assignee
Zhejiang Scientific Research Institute of Transport
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Scientific Research Institute of Transport filed Critical Zhejiang Scientific Research Institute of Transport
Priority to CN202211411414.4A priority Critical patent/CN115689040B/zh
Publication of CN115689040A publication Critical patent/CN115689040A/zh
Application granted granted Critical
Publication of CN115689040B publication Critical patent/CN115689040B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本发明涉及一种基于卷积神经网络的交通事故严重程度预测方法及系统,方法包括:S1基于K均值聚类算法对各事故因素中的各连续变量子因素进行离散区间化赋值,以得到各事故因素对应的量化指标表;S2通过随机森林算法计算各事故因素中所有子因素的重要度;S3选取重要度排名前M的重要子因素,以得到处理后道路交通事故训练样本集;S4基于量化指标表、处理后道路交通事故训练样本集对卷积神经网络模型进行训练,以得到训练后卷积神经网络模型;S5将真实道路交通场景中多种重要子因素对应的量化数据,输入训练后的卷积神经网络模型,以输出交通事故严重程度的预测结果。本发明可有效对道路交通事故严重程度进行预测,提高公路道路运行的安全性。

Description

基于卷积神经网络的交通事故严重程度预测方法及系统
技术领域
本发明属于交通事故预测技术领域,具体涉及基于卷积神经网络的交通事故严重程度预测方法及系统。
背景技术
随着我国基础建设的快速发展,道路通车里程不断增加,不仅提高了我国基建服务水平,而且在交通运输架构上也有了质的飞跃。
目前越来越多人提出要针对交通路况复杂情况和恶劣的行车环境来研究交通事故预警预测系统与新型交通监控设备,以解决复杂交通场景下路况感知和行为智能识别,最终尝试构建事故的综合评估、提前预警、及时干预的技术体系。在此政策引领下,同时也随着人工智能的研究逐步深入,发展可保障交通安全、减少交通事故、缓解交通拥堵的智能化设施体系成为了目前交通系统研究的新方向,如何利用科技手段降低事故概率和减小后果是一个急需解决的难题。建立事故预测系统,对事故严重程度进行预测,研究引起事故发生的影响因素和各因素之间的关联性,在事故前采取相应管理措施,在事故发生后及时启动对应级别的应急措施,对降低交通事故发生数、人员伤亡和财产损失都有着重要意义。但当下我国针对复杂交通场景感知路况、对道路事故智能预测方面的技术还不够领先,暂时没有可以大范围应用的事故预测理论体系,对于事故严重程度的智能预测还在探寻传统模型以外的更优方法。
发明内容
针对现有技术中存在的上述问题,本发明提供基于卷积神经网络的交通事故严重程度预测方法及系统,可有效对道路交通事故严重程度进行预测,提高公路道路运行的安全性。
本发明采用以下技术方案:
基于卷积神经网络的交通事故严重程度预测方法,包括步骤:
S1、分别对影响道路交通事故严重程度的各事故因素中的各离散变量子因素进行赋值量化,基于道路交通事故训练样本集、K均值聚类算法对各事故因素中的各连续变量子因素进行离散区间化赋值,以得到各事故因素对应的量化指标表;
S2、基于道路交通事故训练样本集、各事故因素对应的量化指标表,通过随机森林算法计算各事故因素中所有子因素的重要度;
S3、基于各事故因素中所有子因素的重要度,选取重要度排名前M的重要子因素,并将其余子因素在道路交通事故训练样本集中进行删除,以得到处理后道路交通事故训练样本集;
S4、基于量化指标表、处理后道路交通事故训练样本集对卷积神经网络模型进行训练,以得到可预测道路交通事故严重程度的卷积神经网络模型;
S5、将真实道路交通场景中多种重要子因素对应的量化数据,输入训练后的卷积神经网络模型,以输出交通事故严重程度的预测结果。
作为优选方案,事故因素包括驾驶员驾驶因素、道路因素、交通因素、环境因素。
作为优选方案,步骤S1中,所述基于K均值聚类算法对连续变量子因素进行离散区间化赋值,具体包括以下步骤:
S1.1、提取道路交通事故训练样本集中所有样本中连续变量子因素Ei的值,并构造矩阵
Figure BDA0003938378740000031
其中,Ei表示道路交通事故训练样本集中的第i个连续变量子因素,n表示道路交通事故训练样本集中的样本数,xn表示道路交通事故训练样本集中第n个样本中连续变量子因素Ei的真实值;
S1.2、选取簇数划分值k∈int[2,10],将不同k值和步骤S1.1中构造的矩阵E′i分别带入至K均值聚类算法,计算不同k值获得的轮廓系数Sk
S1.3、选取最大的轮廓系数对应的簇数划分值作为最佳簇数划分值,并记为 K,即K均值聚类算法将矩阵E′i中的所有样本点划分成了K个不同分簇 C={C1,C2,...,CK};
S1.4、获取各分簇Ch的最大值和最小值,并作为连续变量子因素Ei的各离散区间的边界值,以将连续变量子因素Ei离散区间化,并进行相应赋值,其中 h∈int[1,K]。
作为优选方案,步骤S1.2中,所述轮廓系数Sk的计算公式如下:
Figure BDA0003938378740000032
Figure BDA0003938378740000033
其中,Sk表示簇数划分值为k时的轮廓系数;skj表示簇数划分值为k时,矩阵E′i中第j个样本点相应的子轮廓系数;akj表示簇数划分值为k时,矩阵E′i中第 j个样本点与该样本点所在簇内其他所有样本点的平均距离;bkj表示簇数划分值为k时,矩阵E′i中第j个样本点与距离该样本点所在簇最近的簇中的所有样本点的平均距离。
作为优选方案,步骤S1.4中,赋值公式为:
Figure BDA0003938378740000041
其中,
Figure BDA0003938378740000042
表示分簇CK的最小值,
Figure BDA0003938378740000043
表示分簇CK的最大值。
作为优选方案,步骤S2中,所述子因素的重要度计算步骤如下:
S2.1、有放回的对道路交通事故训练样本集进行抽样,以得到N个重抽样样本集;
S2.2、选取一个重抽样样本集,并在重抽样样本集中随机抽取预设个数样本,构建一个分类决策树,剩余的样本作为决策树的袋外数据;
S2.3、利用分类决策树,分类预测袋外数据中的样本,并统计其错误个数,计算得到该分类决策树的袋外数据误差,记为初始误差
Figure BDA0003938378740000044
S2.4、随机改变袋外数据中各样本的子因素变量Xi的量化值,再次计算分类决策树的袋外数据误差,记为二次误差
Figure BDA0003938378740000045
S2.5、重复步骤S2.2~步骤S2.4,直至所有重抽样样本集均被选取;
S2.6、子因素变量Xi的重要度Vi计算公式为:
Figure BDA0003938378740000051
其中,
Figure BDA0003938378740000052
表示第k'个重抽样样本集的二次误差,
Figure BDA0003938378740000053
表示第k'个重抽样样本集的初始误差。
作为优选方案,步骤S4中所述卷积神经网络模型为一维卷积神经网络模型。
作为优选方案,所述一维卷积神经网络模型包括依次连接的输入层、第一卷积层、第二卷积层、第三卷积层、第四卷积层、展平层、全连接层、输出层。
作为优选方案,第一卷积层的卷积核为5,深度为1,共有16个卷积核,步长为1;第二卷积层的卷积核为1,深度为1,共有16个卷积核,步长为1;第三卷积层的卷积核为2,深度为1,共有4个卷积核,步长为2;第四卷积层的卷积核为1,深度为1,共有64个卷积核,步长为1。
还提供基于卷积神经网络的交通事故严重程度预测系统,包括依次连接的变量赋值模块、因素筛选模块、模型训练模块、预测模块;
变量赋值模块,用于分别对影响道路交通事故严重程度的各事故因素中的各离散变量子因素进行赋值量化,基于道路交通事故训练样本集、K均值聚类算法对各事故因素中的各连续变量子因素进行离散区间化赋值,以得到各事故因素对应的量化指标表;
因素筛选模块,基于道路交通事故训练样本集、各事故因素对应的量化指标表,通过随机森林算法计算各事故因素中所有子因素的重要度,并基于各事故因素中所有子因素的重要度,选取重要度排名前M的重要子因素,并将其余子因素在道路交通事故训练样本集中进行删除,以得到处理后道路交通事故训练样本集;
模型训练模块,基于量化指标表、处理后道路交通事故训练样本集对卷积神经网络模型进行训练,以得到可预测道路交通事故严重程度的卷积神经网络模型;
预测模块,用于将真实道路交通场景中多种重要子因素对应的量化数据,输入训练后的卷积神经网络模型,以输出交通事故严重程度的预测结果。
本发明的有益效果是:
本发明可有效对道路交通事故严重程度进行预测,提高公路道路运行的安全性。
由于交通事故中包含连续变量和离散变量,且连续变量的值域均存在较大差异,有限的事故样本在连续空间的分布更为疏松,事故分析模型无法完成充分的学习训练,容易过度拟合复合少量训练数据的特征,极易发生过拟合问题。因此本发明不仅对影响道路交通事故严重程度的各事故因素中的各离散变量子因素进行赋值量化,还基于道路交通事故训练样本集、K均值聚类算法对各事故因素中的各连续变量子因素进行离散区间化赋值,以得到各事故因素对应的量化指标表。
本发明中采用随机森林算法计算各事故因素中所有子因素的重要度,并保留重要度排名靠前的子因素,随机森林算法具有很高的预测准确率,对异常值和噪声有很强的容忍度,能够处理高维数据,有效的分析非线性、具有共线性和交互作用的数据,并能够在分析数据的同时给出指标重要性评分(variable importance measures,VIM)。这些特点使得随机森林算法特别适用于筛选交通事故严重程度的重要性指标。采用随机森林算法识别影响交通事故严重程度的重要指标可以进一步降低检测模型的复杂度和提高检测模型的可用性。
一维卷积神经模型是具有深度结构的前馈神经网络,网络通过设置多级滤波器对输入信号执行反复卷积与池化运算,达到数据特征自动提取和降维的目的,得到具有旋转和平移不变性的分类特征。一维卷积神经中卷积层与相邻层之间同样采用局部连接和权值共享的方式进行运算,同时使用池化层大幅缩减输入维度,极大简化了模型训练和过程计算,提高网络简易程度,避免发生过拟合。并且一维CNN具有的表征学习能力,随网络层数加深不断增强,使网络训练可以得到更好的鲁棒特征。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明所述基于卷积神经网络的交通事故严重程度预测方法的流程图;
图2是随机森林算法模型的结构示意图;
图3是一维卷积神经网络模型的结构示意图;
图4是本发明所述基于卷积神经网络的交通事故严重程度预测系统的结构示意图。
具体实施方式
以下通过特定的具体实施例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
实施例一:
参照图1所示,本实施例提供一种基于卷积神经网络的交通事故严重程度预测方法,包括步骤:
S1、分别对影响道路交通事故严重程度的各事故因素中的各离散变量子因素进行赋值量化,基于道路交通事故训练样本集、K均值聚类算法对各事故因素中的各连续变量子因素进行离散区间化赋值,以得到各事故因素对应的量化指标表;
所述道路交通事故训练样本集中每个样本均包括各子因素的真实情况数据以及当量死亡人数,所述当量死亡人数的计算在后面进行具体说明。
S2、基于道路交通事故训练样本集、各事故因素对应的量化指标表,通过随机森林算法计算各事故因素中所有子因素的重要度;
S3、基于各事故因素中所有子因素的重要度,选取重要度排名前M的重要子因素,并将其余子因素在道路交通事故训练样本集中进行删除,以得到处理后道路交通事故训练样本集;
S4、基于量化指标表、处理后道路交通事故训练样本集对卷积神经网络模型进行训练,以得到可预测道路交通事故严重程度的卷积神经网络模型;
S5、将真实道路交通场景中多种重要子因素对应的量化数据,输入训练后的卷积神经网络模型,以输出交通事故严重程度的预测结果。
本申请中所述的交通事故严重程度即指当量死亡人数。
本发明可有效对道路交通事故严重程度进行预测,提高公路道路运行的安全性。
由于交通事故中包含连续变量和离散变量,且连续变量的值域均存在较大差异,有限的事故样本在连续空间的分布更为疏松,事故分析模型无法完成充分的学习训练,容易过度拟合复合少量训练数据的特征,极易发生过拟合问题。因此本发明不仅对影响道路交通事故严重程度的各事故因素中的各离散变量子因素进行赋值量化,还基于道路交通事故训练样本集、K均值聚类算法对各事故因素中的各连续变量子因素进行离散区间化赋值,以得到各事故因素对应的量化指标表。
本发明中采用随机森林算法计算各事故因素中所有子因素的重要度,并保留重要度排名靠前的子因素,随机森林算法具有很高的预测准确率,对异常值和噪声有很强的容忍度,能够处理高维数据,有效的分析非线性、具有共线性和交互作用的数据,并能够在分析数据的同时给出指标重要性评分(variable importance measures,VIM)。这些特点使得随机森林算法特别适用于筛选交通事故严重程度的重要性指标。采用随机森林算法识别影响交通事故严重程度的重要指标可以进一步降低检测模型的复杂度和提高检测模型的可用性。
一维卷积神经模型是具有深度结构的前馈神经网络,网络通过设置多级滤波器对输入信号执行反复卷积与池化运算,达到数据特征自动提取和降维的目的,得到具有旋转和平移不变性的分类特征。一维卷积神经中卷积层与相邻层之间同样采用局部连接和权值共享的方式进行运算,同时使用池化层大幅缩减输入维度,极大简化了模型训练和过程计算,提高网络简易程度,避免发生过拟合。并且一维CNN具有的表征学习能力,随网络层数加深不断增强,使网络训练可以得到更好的鲁棒特征。
具体地:
K均值聚类算法(K-means Clustering Algorithm)是一种迭代求解的聚类分析算法,它计算的步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各种聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给他们的对象就代表一个聚类。每当分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
因此,步骤S1中,所述基于K均值聚类算法对连续变量子因素进行离散区间化赋值,具体包括以下步骤:
S1.1、提取道路交通事故训练样本集中所有样本中连续变量子因素Ei的值,并构造矩阵
Figure BDA0003938378740000101
其中,Ei表示道路交通事故训练样本集中的第i个连续变量子因素,n表示道路交通事故训练样本集中的样本数,xn表示道路交通事故训练样本集中第n个样本中连续变量子因素Ei的真实值,比如真实坡度度数、真实温度度数等等;
S1.2、选取簇数划分值k∈int[2,10],将不同k值和步骤S1.1中构造的矩阵E′i分别带入至K均值聚类算法,计算不同k值获得的轮廓系数Sk
S1.3、轮廓系数越大表明聚类效果越好,选取最大的轮廓系数对应的簇数划分值作为最佳簇数划分值,并记为K,即K均值聚类算法将矩阵E′i中的所有样本点划分成了K个不同分簇C={C1,C2,...,CK};
S1.4、获取各分簇Ch的最大值和最小值,并作为连续变量子因素Ei的各离散区间的边界值,以将连续变量子因素Ei离散区间化,并进行相应赋值,其中 h∈int[1,K]。
步骤S1.2中,所述轮廓系数Sk的计算公式如下:
Figure BDA0003938378740000111
Figure BDA0003938378740000112
其中,Sk表示簇数划分值为k时的轮廓系数;skj表示簇数划分值为k时,矩阵E′i中第j个样本点相应的子轮廓系数;akj表示簇数划分值为k时,矩阵E′i中第 j个样本点与该样本点所在簇内其他所有样本点的平均距离(量化凝聚度);bkj表示簇数划分值为k时,矩阵E′i中第j个样本点与距离该样本点所在簇最近的簇中的所有样本点的平均距离(量化分离度)。
步骤S1.4中,赋值公式为:
Figure BDA0003938378740000113
其中,
Figure BDA0003938378740000114
表示分簇CK的最小值,
Figure BDA0003938378740000115
表示分簇CK的最大值。
事故因素包括驾驶员驾驶因素、道路因素、交通因素、环境因素。因此,所述各事故因素对应的量化指标表如下所示,其中表1为驾驶员驾驶因素的量化指标表,表2为道路因素的量化指标表,表3为交通因素的量化指标表,表4 为环境因素的量化指标表。
Figure BDA0003938378740000121
表1驾驶员驾驶因素的量化指标表
Figure BDA0003938378740000122
表2道路因素的量化指标表
Figure BDA0003938378740000123
Figure BDA0003938378740000131
表3交通因素的量化指标表
Figure BDA0003938378740000132
表4环境因素的量化指标表
表内的驾驶员性别E1、有无超速E13、季节E14即所述离散变量子因素,驾驶员年龄/岁E2、坡度/%E9、大型车比例/%E12、可见度/mi E21即所述连续变量子因素。
进一步的,随机森林(Random Forest,RF)算法最早由Breiman提出的一种集成学习算法。随机森林算法是Random Subspace算法和Bagging算法的组合应用,是由一系列随机产生的决策树组合构成。随机森林算法的原理是通过多个树结构分类器对未知样本的类别进行投票分类来提高算法总体分类的准确性,其原理可参照图2所示。
RF具有很高的预测准确率,对异常值和噪声有很强的容忍度,能够处理高维数据,有效的分析非线性、具有共线性和交互作用的数据,并能够在分析数据的同时给出指标重要性评分(variable importance measures,VIM)。这些特点使得 RF特别适用于筛选交通事故严重程度的重要性指标。采用RF识别影响交通事故严重程度的重要指标可以进一步降低检测模型的复杂度和提高检测模型的可用性。步骤S2中,基于随机森林的交通事故严重程度指标重要度评估的主要步骤如下:
S2.1、有放回的对道路交通事故训练样本集进行抽样,以得到N个重抽样样本集;
S2.2、选取一个重抽样样本集,并在重抽样样本集中随机抽取预设个数样本,构建一个分类决策树,剩余的样本作为决策树的袋外数据;
S2.3、利用分类决策树,分类预测袋外数据中的样本,并统计其错误个数,计算得到该分类决策树的袋外数据误差,记为初始误差
Figure BDA0003938378740000141
S2.4、随机改变袋外数据中各样本的子因素变量Xi的量化值(量化值为子因素变量真实值在量化指标表中对应的值),再次计算分类决策树的袋外数据误差,记为二次误差
Figure BDA0003938378740000151
S2.5、重复步骤S2.2~步骤S2.4,直至所有重抽样样本集均被选取;
S2.6、子因素变量Xi的重要度Vi计算公式为:
Figure BDA0003938378740000152
其中,
Figure BDA0003938378740000153
表示第k'个重抽样样本集的二次误差,
Figure BDA0003938378740000154
表示第k'个重抽样样本集的初始误差。
再进一步的,一维卷积神经模型是具有深度结构的前馈神经网络,网络通过设置多级滤波器对输入信号执行反复卷积与池化运算,达到数据特征自动提取和降维的目的,得到具有旋转和平移不变性的分类特征。一维卷积神经中卷积层与相邻层之间同样采用局部连接和权值共享的方式进行运算,同时使用池化层大幅缩减输入维度,极大简化了模型训练和过程计算,提高网络简易程度,避免发生过拟合。并且一维CNN具有的表征学习能力,随网络层数加深不断增强,使网络训练可以得到更好的鲁棒特征。
本发明在CNN的基础上,提出基于一维卷积神经网络的交通事故严重程度预测模型,具体模型结构参照图3所示。包括包括依次连接的输入层、第一卷积层、第二卷积层、第三卷积层、第四卷积层、展平层、全连接层、输出层。输入数据的矩阵大小为1*M,第一个卷积层:卷积核为5,深度为1,共有16 个卷积核,步长为1,卷积完后数据变为16*(M-5+1)*1;为增强一维卷积神经网络模型的非线性表达能力,第二个卷积层:卷积核为1,深度为1,共16个卷积核,步长为1,卷积完后数据仍为16*(M-5+1)*1;第三个卷积层:卷积核为2,深度为1,共有4个卷积核,步长为2,卷积完后数据变为
Figure BDA0003938378740000155
为增强一维卷积神经网络模型的非线性表达能力,第三个卷积层:卷积核为1,深度为1,共64个卷积核,步长为1,卷积完后数据仍为
Figure BDA0003938378740000161
最后将其展开,输入到全连接层,并用Softmax输出交通事故严重程度预测结果。
一维卷积神经网络各层参数设置和参照下表5所示:
Figure BDA0003938378740000162
表5一维卷积神经网络各层参数设置表
还需要说明的是:本实施例中按事故的死亡人数和受伤人数计算事故当量为划分道路交通事故严重程度等级的基础指标。事故当量是衡量事故造成各种后果的严重程度指标。当量死亡人数Dd的计算公式如下所示。
Dd=D1+a1D2+a2D3+a3D4
其中,D1、D2、D3、D4分别表示死亡人数、重伤人数、轻伤人数、轻微伤人数,a1、a2、a3分别表示重伤人数、轻伤人数、轻微伤人数的当量系数。按照当量死亡人数Dd对事故等级进行划分,划分标准如下表6所示:
当量死亡人数D<sub>d</sub> 事故等级
≤0.2 轻微事故
0.2-0.67 一般事故
0.67-3 重大事故
≥3 特大事故
表6道路交通事故严重等级划分表
步骤S4中对模型进行训练时,道路交通事故训练样本集中的当量死亡人数则按照上述计算方式进行。
实施例二:
参照图4所示,本实施例提供基于神经网络的道路交通事故严重程度预测系统,包括依次连接的变量赋值模块、因素筛选模块、模型训练模块、预测模块;
变量赋值模块,用于分别对影响道路交通事故严重程度的各事故因素中的各离散变量子因素进行赋值量化,基于道路交通事故训练样本集、K均值聚类算法对各事故因素中的各连续变量子因素进行离散区间化赋值,以得到各事故因素对应的量化指标表;
因素筛选模块,基于道路交通事故训练样本集、各事故因素对应的量化指标表,通过随机森林算法计算各事故因素中所有子因素的重要度,并基于各事故因素中所有子因素的重要度,选取重要度排名前M的重要子因素,并将其余子因素在道路交通事故训练样本集中进行删除,以得到处理后道路交通事故训练样本集;
模型训练模块,基于量化指标表、处理后道路交通事故训练样本集对卷积神经网络模型进行训练,以得到可预测道路交通事故严重程度的卷积神经网络模型;
预测模块,用于将真实道路交通场景中多种重要子因素对应的量化数据,输入训练后的卷积神经网络模型,以输出交通事故严重程度的预测结果。
需要说明的是,本实施例提供的基于神经网络的道路交通事故严重程度预测系统,与实施例一类似,在此不多做赘述。
以上所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明的保护范围内。

Claims (10)

1.基于卷积神经网络的交通事故严重程度预测方法,其特征在于,包括步骤:
S1、分别对影响道路交通事故严重程度的各事故因素中的各离散变量子因素进行赋值量化,基于道路交通事故训练样本集、K均值聚类算法对各事故因素中的各连续变量子因素进行离散区间化赋值,以得到各事故因素对应的量化指标表;
S2、基于道路交通事故训练样本集、各事故因素对应的量化指标表,通过随机森林算法计算各事故因素中所有子因素的重要度;
S3、基于各事故因素中所有子因素的重要度,选取重要度排名前M的重要子因素,并将其余子因素在道路交通事故训练样本集中进行删除,以得到处理后道路交通事故训练样本集;
S4、基于量化指标表、处理后道路交通事故训练样本集对卷积神经网络模型进行训练,以得到可预测道路交通事故严重程度的卷积神经网络模型;
S5、将真实道路交通场景中多种重要子因素对应的量化数据,输入训练后的卷积神经网络模型,以输出交通事故严重程度的预测结果。
2.根据权利要求1所述的基于卷积神经网络的交通事故严重程度预测方法,其特征在于,事故因素包括驾驶员驾驶因素、道路因素、交通因素、环境因素。
3.根据权利要求1所述的基于卷积神经网络的交通事故严重程度预测方法,其特征在于,步骤S1中,所述基于K均值聚类算法对连续变量子因素进行离散区间化赋值,具体包括以下步骤:
S1.1、提取道路交通事故训练样本集中所有样本中连续变量子因素Ei的值,并构造矩阵
Figure FDA0003938378730000021
其中,Ei表示道路交通事故训练样本集中的第i个连续变量子因素,n表示道路交通事故训练样本集中的样本数,xn表示道路交通事故训练样本集中第n个样本中连续变量子因素Ei的真实值;
S1.2、选取簇数划分值k∈int[2,10],将不同k值和步骤S1.1中构造的矩阵E’i分别带入至K均值聚类算法,计算不同k值获得的轮廓系数Sk
S1.3、选取最大的轮廓系数对应的簇数划分值作为最佳簇数划分值,并记为K,即K均值聚类算法将矩阵E’i中的所有样本点划分成了K个不同分簇C={C1,C2,...,CK};
S1.4、获取各分簇Ch的最大值和最小值,并作为连续变量子因素Ei的各离散区间的边界值,以将连续变量子因素Ei离散区间化,并进行相应赋值,其中h∈int[1,K]。
4.根据权利要求3所述的基于卷积神经网络的交通事故严重程度预测方法,其特征在于,步骤S1.2中,所述轮廓系数Sk的计算公式如下:
Figure FDA0003938378730000022
Figure FDA0003938378730000023
其中,Sk表示簇数划分值为k时的轮廓系数;skj表示簇数划分值为k时,矩阵E’i中第j个样本点相应的子轮廓系数;akj表示簇数划分值为k时,矩阵E’i中第j个样本点与该样本点所在簇内其他所有样本点的平均距离;bkj表示簇数划分值为k时,矩阵E’i中第j个样本点与距离该样本点所在簇最近的簇中的所有样本点的平均距离。
5.根据权利要求3所述的基于卷积神经网络的交通事故严重程度预测方法,其特征在于,步骤S1.4中,赋值公式为:
Figure FDA0003938378730000031
其中,
Figure FDA0003938378730000032
表示分簇CK的最小值,
Figure FDA0003938378730000033
表示分簇CK的最大值。
6.根据权利要求1所述的基于卷积神经网络的交通事故严重程度预测方法,其特征在于,步骤S2中,所述子因素的重要度计算步骤如下:
S2.1、有放回的对道路交通事故训练样本集进行抽样,以得到N个重抽样样本集;
S2.2、选取一个重抽样样本集,并在重抽样样本集中随机抽取预设个数样本,构建一个分类决策树,剩余的样本作为决策树的袋外数据;
S2.3、利用分类决策树,分类预测袋外数据中的样本,并统计其错误个数,计算得到该分类决策树的袋外数据误差,记为初始误差
Figure FDA0003938378730000034
S2.4、随机改变袋外数据中各样本的子因素变量Xi的量化值,再次计算分类决策树的袋外数据误差,记为二次误差
Figure FDA0003938378730000035
S2.5、重复步骤S2.2~步骤S2.4,直至所有重抽样样本集均被选取;
S2.6、子因素变量Xi的重要度Vi计算公式为:
Figure FDA0003938378730000041
其中,
Figure FDA0003938378730000042
表示第k'个重抽样样本集的二次误差,
Figure FDA0003938378730000043
表示第k'个重抽样样本集的初始误差。
7.根据权利要求1所述的基于卷积神经网络的交通事故严重程度预测方法,其特征在于,步骤S4中所述卷积神经网络模型为一维卷积神经网络模型。
8.根据权利要求7所述的基于卷积神经网络的交通事故严重程度预测方法,其特征在于,所述一维卷积神经网络模型包括依次连接的输入层、第一卷积层、第二卷积层、第三卷积层、第四卷积层、展平层、全连接层、输出层。
9.根据权利要求8所述的基于卷积神经网络的交通事故严重程度预测方法,其特征在于,第一卷积层的卷积核为5,深度为1,共有16个卷积核,步长为1;第二卷积层的卷积核为1,深度为1,共有16个卷积核,步长为1;第三卷积层的卷积核为2,深度为1,共有4个卷积核,步长为2;第四卷积层的卷积核为1,深度为1,共有64个卷积核,步长为1。
10.基于卷积神经网络的交通事故严重程度预测系统,其特征在于,包括依次连接的变量赋值模块、因素筛选模块、模型训练模块、预测模块;
变量赋值模块,用于分别对影响道路交通事故严重程度的各事故因素中的各离散变量子因素进行赋值量化,基于道路交通事故训练样本集、K均值聚类算法对各事故因素中的各连续变量子因素进行离散区间化赋值,以得到各事故因素对应的量化指标表;
因素筛选模块,基于道路交通事故训练样本集、各事故因素对应的量化指标表,通过随机森林算法计算各事故因素中所有子因素的重要度,并基于各事故因素中所有子因素的重要度,选取重要度排名前M的重要子因素,并将其余子因素在道路交通事故训练样本集中进行删除,以得到处理后道路交通事故训练样本集;
模型训练模块,基于量化指标表、处理后道路交通事故训练样本集对卷积神经网络模型进行训练,以得到可预测道路交通事故严重程度的卷积神经网络模型;
预测模块,用于将真实道路交通场景中多种重要子因素对应的量化数据,输入训练后的卷积神经网络模型,以输出交通事故严重程度的预测结果。
CN202211411414.4A 2022-11-11 2022-11-11 基于卷积神经网络的交通事故严重程度预测方法及系统 Active CN115689040B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211411414.4A CN115689040B (zh) 2022-11-11 2022-11-11 基于卷积神经网络的交通事故严重程度预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211411414.4A CN115689040B (zh) 2022-11-11 2022-11-11 基于卷积神经网络的交通事故严重程度预测方法及系统

Publications (2)

Publication Number Publication Date
CN115689040A true CN115689040A (zh) 2023-02-03
CN115689040B CN115689040B (zh) 2023-06-09

Family

ID=85052074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211411414.4A Active CN115689040B (zh) 2022-11-11 2022-11-11 基于卷积神经网络的交通事故严重程度预测方法及系统

Country Status (1)

Country Link
CN (1) CN115689040B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116738238A (zh) * 2023-08-14 2023-09-12 北京赛目科技股份有限公司 一种天气场景的搭建方法、装置及电子设备
CN117589951A (zh) * 2023-12-08 2024-02-23 山东工商学院 一种生鲜食品新鲜度检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665093A (zh) * 2018-04-19 2018-10-16 东南大学 基于深度学习的高速公路交通事故严重度预测方法
CN110276370A (zh) * 2019-05-05 2019-09-24 南京理工大学 一种基于随机森林的道路交通事故风险因素分析方法
CN112562320A (zh) * 2020-11-19 2021-03-26 东南大学 一种基于改进随机森林的自适应交通事件检测方法
CN114330541A (zh) * 2021-12-28 2022-04-12 于志青 道路交通事故风险预测深度学习算法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665093A (zh) * 2018-04-19 2018-10-16 东南大学 基于深度学习的高速公路交通事故严重度预测方法
CN110276370A (zh) * 2019-05-05 2019-09-24 南京理工大学 一种基于随机森林的道路交通事故风险因素分析方法
CN112562320A (zh) * 2020-11-19 2021-03-26 东南大学 一种基于改进随机森林的自适应交通事件检测方法
CN114330541A (zh) * 2021-12-28 2022-04-12 于志青 道路交通事故风险预测深度学习算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
唐阳山等: ""基于BP 神经网络的交通事故预测方法研究"" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116738238A (zh) * 2023-08-14 2023-09-12 北京赛目科技股份有限公司 一种天气场景的搭建方法、装置及电子设备
CN117589951A (zh) * 2023-12-08 2024-02-23 山东工商学院 一种生鲜食品新鲜度检测方法

Also Published As

Publication number Publication date
CN115689040B (zh) 2023-06-09

Similar Documents

Publication Publication Date Title
CN115689040B (zh) 基于卷积神经网络的交通事故严重程度预测方法及系统
CN109034264B (zh) 交通事故严重性预测csp-cnn模型及其建模方法
CN111242484B (zh) 基于转移概率的车辆风险综合评价方法
CN111161814A (zh) 一种基于卷积神经网络的DRGs自动分组方法
CN108665093B (zh) 基于深度学习的高速公路交通事故严重度预测方法
CN111968741B (zh) 基于深度学习与集成学习的糖尿病并发症高危预警系统
CN112687349A (zh) 一种降低辛烷值损失模型的构建方法
CN113657752B (zh) 基于驾驶行为指标的不同长度隧道行车风险量化评价方法
CN111126868B (zh) 一种道路交通事故发生风险确定方法及系统
CN111008726B (zh) 一种电力负荷预测中类图片转换方法
CN110837523A (zh) 一种基于级联神经网络的高置信改造质量和减假暂量化评估方法
CN110084534A (zh) 一种基于驾驶行为画像的驾驶风险因子量化方法
CN112932501A (zh) 一种基于一维卷积神经网络自动识别失眠方法
CN115795351A (zh) 一种基于残差网络和2d特征表示的电梯大数据风险预警方法
CN115455079A (zh) 一种基于事故数据和特征因素的事故多发点推荐方法
CN115092165A (zh) 一种基于聚类模型的不同循环工况下驾驶员风格辨识方法
CN116090819A (zh) 一种基于关联规则的配电网风险态势预测方法
CN114764682B (zh) 一种基于多机器学习算法融合的大米安全风险评估方法
CN113593708A (zh) 基于集成学习算法的脓毒症预后预测方法
CN113581188A (zh) 一种基于车联网数据的商用车驾驶员驾驶风格识别方法
CN112800928A (zh) 融合通道和频谱特征的全局自注意力残差网络的癫痫发作预测方法
CN113526282A (zh) 一种电梯中长期老化故障诊断方法、装置、介质和设备
CN109101568B (zh) 基于XgBoost算法的交通高危人员识别方法
CN112215044A (zh) 一种基于概率神经网络的驾驶倾向性辨识方法
CN113974655A (zh) 一种基于脑电信号的癫痫发作预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant