CN117787688A - 一种国省干线道路交通事故风险预测方法 - Google Patents
一种国省干线道路交通事故风险预测方法 Download PDFInfo
- Publication number
- CN117787688A CN117787688A CN202311650449.8A CN202311650449A CN117787688A CN 117787688 A CN117787688 A CN 117787688A CN 202311650449 A CN202311650449 A CN 202311650449A CN 117787688 A CN117787688 A CN 117787688A
- Authority
- CN
- China
- Prior art keywords
- accident
- traffic accident
- risk
- data
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010039203 Road traffic accident Diseases 0.000 title claims abstract description 156
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 230000007812 deficiency Effects 0.000 claims description 4
- 238000012797 qualification Methods 0.000 claims description 4
- 238000003912 environmental pollution Methods 0.000 claims description 3
- 230000003340 mental effect Effects 0.000 claims description 3
- 230000000295 complement effect Effects 0.000 claims description 2
- 238000005457 optimization Methods 0.000 abstract description 13
- 238000004364 calculation method Methods 0.000 abstract description 7
- 238000001514 detection method Methods 0.000 abstract description 3
- 239000000284 extract Substances 0.000 abstract description 3
- 238000013058 risk prediction model Methods 0.000 abstract description 3
- 238000012549 training Methods 0.000 abstract description 3
- 235000019580 granularity Nutrition 0.000 description 6
- 238000010276 construction Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Traffic Control Systems (AREA)
Abstract
本发明公开一种国省干线道路交通事故风险预测方法,属于计算、推算或计数的技术领域。该方法,首先,本发明在对数据进行预处理和时空划分的基础上,从人员、车辆、道路、环境四个角度提取交通事故风险特征;接着,构建经济指标划分交通事故类型,通过交通事故数量、事故发生率、事故危害性构建干线道路交通风险指标;然后,基于贝叶斯网络模型,通过结构学习算法初步获得交通风险预测模型结构,结合既有知识进行模型结构优化;最后,通过真实数据训练模型并对模型进行评价。该发明以交通管理部门易获取的数据作为数据源,应用可解释性强的贝叶斯网络模型,无需大量训练数据,实现了在检测设备不健全条件下的国省干线道路交通风险预测。
Description
技术领域
本发明涉及智能交通及交通安全,具体公开一种国省干线道路交通事故风险预测方法,属于计算、推算或计数的技术领域。
背景技术
国省干线道路是我国综合立体交通网中的重要组成部分,占我国公路网的60%,是连接城市与城市、城市与乡镇的重要通道,与高速公路相比,国省干线道路的收费极低,覆盖范围更广,在货物运输中发挥重要作用。但是与其他属性的道路相比,较高的货车比例也导致国省干线道路交通事故的发生频率更高,给社会造成的经济和社会损失极大。随着科技的进步和算力的提升,动态监测路网交通安全风险和主动交通安全管理可以有效识别安全风险区并阻止事故发生。然而既有交通事故预测相关研究主要集中在高速公路、城市道路等交通监控设施完善的路段,作为承担运输任务最重的国省干道,因其交通检测设施不健全,导致研究缺乏。因此如何确定国省干线道路事故风险区域,从而可以及时采取有效的措施防止交通事故的发生,是提高国省干线道路交通安全状况的迫切任务,也是提高我国公路运输安全性的重要内容。
国省干线道路上发生交通事故的原因多样,包括人的因素、车的因素、道路因素、环境因素,人的因素包括驾驶员违规驾驶,车的因素包括车辆发生故障,道路因素包括道路施工、道路设计不合理,环境因素包括恶劣天气等。由于受到数据的限制,既有研究对交通事故的影响因素考虑不全面、不充分。通过对国省干道历史事故数据进行研究,如何从“人、车、路、环”四个层面探索事故与影响因素特征之间的耦合关系,从而全面剖析国省干道事故发生机理,是实现国省干道交通事故风险预测的有效途径。
现有交通事故预测技术主要针对铁路交通、高速公路和城市快速路等场景,主要针对事故的预警、事故成因分析和事故影响因素等,对于事故风险缺乏预测方法且对造成交通事故的影响因素考虑并不全面。因此,现有交通事故预测技术并不适用于国省干道交通事故的预测。
综上,本发明旨在提出一种国省干线道路交通事故风险预测方法以克服上述缺陷。
发明内容
本发明的目的是为克服现有技术的不足,提供一种国省干线道路交通事故风险预测方法,通过对国省干道历史事故数据进行研究,从人、车、路、环四个层面探索事故与影响因素特征之间的耦合关系,全面剖析国省干道事故发生机理,实现预测国省干道交通事故风险的发明目的,解决既有交通事故预测相关研究不适用于国省干道的技术问题。
本发明为实现上述发明目的采用如下技术方案:
一种国省干线道路交通事故风险预测方法,包括如下步骤:
步骤S1,对交通事故数据集进行预处理,对预处理后的交通事故数据集进行时间和空间划分;
步骤S2,对经步骤S1时间和空间划分后的交通事故数据集,从人员、车辆、道路、环境四个角度提取交通事故风险特征,并对所提取的交通事故风险特征进行离散化处理;
步骤S3,根据交通事故的经济损失划分事故严重程度,计算每个空间段和时间段内的总事故数、百万车公里事故率、加权事故率,计算每个空间段和时间段的交通事故综合风险值;
步骤S4,以每个空间段和时间段的交通事故综合风险值为演绎推理目标,将步骤S2提取的交通事故风险特征分别作为贝叶斯网络的一个节点,构建贝叶斯网络模型;
步骤S5,将实时交通事故数据输入步骤S4构建的贝叶斯网络模型,获取国省干线道路交通事故风险预测值。
作为一种国省干线道路交通事故风险预测方法的进一步优化方案,步骤S1对交通事故数据集进行预处理的具体方法为:
步骤S1A,将缺失数据的占比大于或等于阈值的交通事故数据戳判定为无效数据,删除无效数据;
步骤S1B,对缺失数据的占比小于阈值的交通事故数据戳进行补全操作。
作为一种国省干线道路交通事故风险预测方法的再进一步优化方案,步骤S1B对缺失数据的占比小于阈值的交通事故数据戳进行补全操作的具体方法为:
缺失数据为性别时,根据交通事故数据集性别的比例关系进行随机补全,sm表示性别缺失数据中被补全为男性的数量,sw表示性别缺失数据中被补全为女性的数量,S表示完整数据戳的数量,SM表示完整数据戳中性别为男性的数量,SW表示完整数据戳中性别为女性的数量;
缺失数据为年龄时,根据交通事故数据集年龄的比例关系进行随机补全;
缺失数据为驾龄时,将驾龄字段标记为未知;
缺失数据为车辆类型时,将车辆类型字段标记为未知。
作为一种国省干线道路交通事故风险预测方法的再进一步优化方案,步骤S1对预处理后的交通事故数据集进行时间和空间划分的具体方法为:
步骤S1C,采用至少一种标段对经步骤S1B补全操作后的交通事故数据集进行空间划分;
步骤S1D,采用至少一个时间窗对经步骤S1C空间划分后的交通事故数据集进行时间划分。
作为一种国省干线道路交通事故风险预测方法的再进一步优化方案,步骤S1C采用至少一种标段对经步骤S1B补全操作后的交通事故数据集进行空间划分的具体方法为:
根据国道或省道的标段将交通事故数据集划分为Nk段空间单元时,遍历交通事故数据集,当前交通事故数据戳的经纬度坐标在标段Nk的坐标范围内时,赋值当前交通事故数据戳的空间单元标签为k,Nk=[L],L表示拟研究的国道或省道长度;
根据国道或省道的标段将交通事故数据集划分为Mk段空间单元时,遍历交通事故数据集,当前交通事故数据戳的经纬度坐标在标段Mk的坐标范围内时,赋值当前交通事故数据戳的空间单元标签为k,
作为一种国省干线道路交通事故风险预测方法的再进一步优化方案,步骤S1D采用至少一个时间窗对经步骤S1C空间划分后的交通事故数据集进行时间划分的具体方法为:采用包含但不限于1天、3天、7天、14天的时间窗进行时间划分,当交通事故数据集被划分为Tj段时,当前交通事故数据戳发生时间T∈[Tj,Tj+1],则赋值当前交通事故数据戳的时间单元标签为j。
作为一种国省干线道路交通事故风险预测方法的再进一步优化方案,为对步骤S1D时间划分后的交通事故数据匹配天气数据。
作为一种国省干线道路交通事故风险预测方法的再进一步优化方案,步骤S2从人员这个角度提取交通事故风险特征包含但不限于:遭遇事故人员类型、遭遇事故人员年龄、遭遇事故人员的驾驶资格、遭遇事故人员的驾龄以及遭遇事故人员的性别;从车辆这个角度提取交通事故风险特征包含但不限于:遭遇事故车辆类型、遭遇事故车辆所属地;从道路这个角度提取交通事故风险特征包括但不限于:发生事故的道路类型、事故发生地;从环境这个角度提取交通事故风险特征包含但不限于:事故发生的时刻、事故发生日期的性质、事故发生时的天气情况、事故发生时的气温情况、事故发生时的湿度情况、事故发生时风速、事故发生时能见度。
作为一种国省干线道路交通事故风险预测方法的再进一步优化方案,步骤S3具体包括如下步骤:
步骤S31,计算每个交通事故的经济损失Loss,当Loss≥10时,记为一级事故,当7≤Loss<10时,记为二级事故,当5≤Loss<7时,记为三级事故,当Loss<5时,记为四级事故,其中,
Loss=ln(αL1+βL2+γL3),L1=L11+L12+L13,L2=L21+L22+
L23+L24,L3=L31+L32+L33,L1为直接财产损失,L2为人员伤亡损失、L3为其他经济损失,L11为车辆损失,L12为交通设施损失,L13为货物损失,L21为医药费,L22为误工费和丧葬费,L23为劳动价值损失,L24为精神损失费,L31为社会服务损失费,L32为交通拥堵损失费,L33为环境污染损失费,α和γ取0.1,当人员受伤时β取0.3,当人员死亡时β取0.5;
步骤S32,计算第j个时间段、第k个空间段的总事故数Nj,k,Nj,k=Ⅰj,k+Ⅱj,k+Ⅲj,k+Ⅳj,k,Ⅰj,k表示第k个空间段在第j个时间段内发生的一级事故数量,Ⅱj,k表示第k个空间段在第j个时间段内发生的二级事故数量,Ⅲj,k表示第k个空间段在第j个时间段内发生的三级事故数量,Ⅳj,k表示第k个空间段在第j个时间段内发生的四级事故数量;
步骤S33,计算第j个时间段、第k个空间段的百万车公里事故率Kj,k,V表示干线道路平均日交通量,M表示干线道路长度,T表示第j个时间段的长度;
步骤S34,计算第j个时间段、第k个空间段的加权事故率fj,k,
步骤S35,计算第j个时间段、第k个空间段的总事故数25%的数值,第j个时间段、第k个空间段的百万车公里事故率50%的数值,第j个时间段、第k个空间段的加权事故率75%的数值,作为三个风险指标;
对于每一风险指标:当风险指标介于0与25%分位数之间时,其风险得分值为1;当风险指标介于25%与50%分位数之间时,其风险得分值为2;当风险指标介于50%与75%分位数之间时,其风险得分值为3;当风险指标大于75%分位数;其风险得分值为4;
计算第j个时间段、第k个空间段的综合风险值Pj,k, 表示第j个时间段、第k个空间段总事故数的风险得分值,/>表示第j个时间段、第k个空间段百万车公里事故率的风险得分值,/>表示第j个时间段、第k个空间段加权事故率的风险得分值。
作为一种国省干线道路交通事故风险预测方法的再进一步优化方案,步骤S4具体为:
将步骤S2离散化后的交通事故风险特征和步骤S3得到的事故严重程度输入K2算法进行学习,获取贝叶斯网络模型的图结构;
根据每个空间段和时间段的事故综合风险值与交通事故风险特征的关联系优化贝叶斯网络模型图结构;
根据不同时间划分和空间划分后的交通事故数据集对贝叶斯网络图结构中各变量进行参数学习,并检验模型预测精度。
本发明采用上述技术方案,具有以下有益效果:
(1)交通事故影响因素方面:本发明全面考虑了“人、车、路、环”各方面因素对交通事故风险的影响,提出了一种“人、车、路、环”输入数据时空匹配方法,构建了基于经济损失的国省干道交通事故综合评价指标,综合考虑了交通事故直接财产损失、人员伤亡情况、交通拥堵损失等因素,实现了对事故严重程度的量化。
(2)交通事故风险预测方面:提出了一种基于贝叶斯网络的国省干线交通事故风险预测方法,将道路交通事故风险定义为所有预测空间单元和预测时间单元相匹配的道路事故综合风险指数集合,在贝叶斯网络预测模型图结构构建过程中结合关联性分析方法,优化模型结构,提高模型结构的合理性,实现在不同空间和时间颗粒度大小的条件下对国省干道交通事故风险的预测。
附图说明
图1是本发明所提国省干线道路交通事故风险预测方法的流程图。
图2是本发明实施例中人员、车辆、环境和道路四方面特征变量的离散化结果。
图3是本发明实施例中事故严重程度等级的分布图。
图4是本发明实施例中17个变量之间的贝叶斯网络结构图。
图5是本发明实施例中对结构中的节点和有向边进行优化后的贝叶斯网络结构。
具体实施方式
下面结合附图和实施例对本发明的技术方案做进一步的详细说明。
本发明公开一种国省干线道路交通事故风险预测方法。首先,本发明在对数据进行预处理和时空划分的基础上,从人员、车辆、道路、环境四个角度提取交通事故风险特征。接着,构建经济指标划分交通事故类型,通过交通事故数量、事故发生率、事故危害性构建干线道路交通风险指标,为国省干线道路交通风险预测提供数据基础。然后,基于贝叶斯网络模型,通过结构学习算法初步获得交通风险预测模型结构,结合既有知识进行模型结构优化。最后,结合现实数据进行参数学习,完成模型的构建并对模型进行评价。该发明以交通管理部门易获取的交通事故数据和互联网信息数据作为数据源,应用可解释性强的贝叶斯网络模型,无需大量训练数据,实现了在检测设备不健全、不充分条件下的国省干线道路交通风险预测,提高了对当前研究较少的国省干线道路安全性及变化趋势的了解和掌握。
该国省干线道路交通事故风险预测方法如图1所示,具体包括S1~S5。
S1、进行数据预处理,删除无效数据,补全缺失数据,对数据集进行时间和空间划分,对天气数据进行匹配
S11、评价每条数据戳的数据质量,若某条数据戳中缺失数据的占比超过40%,则判定为无效数据,删除整条数据戳;
S12、若数据戳中缺失数据占比小于40%,则判定为有效数据,保留该数据戳,当缺失数据为性别时,根据数据集性别的比例关系进行随机补全,缺失数据中男/女性别占比计算公式如下;
式中:sm表示性别缺失数据中被补全为男性的数量,sw表示性别缺失数据中被补全为女性的数量,S表示完整数据戳的数量,SM表示完整数据戳中性别为男性的数量,SW表示完整数据戳中性别为女性的数量;
S13、当缺失数据为年龄时,根据常用的年龄划分结构,将年龄段划分为青少年、中青年、中老年、老年,其中,青少年为20岁及以下,中青年为21-40岁,中老年为41-60岁,老年为60岁以上,根据数据集中年龄的比例关系进行随机补全;
S14、当缺失数据为驾龄时,将该字段标记为未知;
S15、当缺失值为车辆类型时,将该字段标记为其它,当缺失值为遭遇事故车辆所属地时,将该字段标记为未知;
S16、在数据补全的基础上,根据国道/省道的标段对数据集进行空间划分,分别划分为Nk段和Mk段,当被划分Nk段时,遍历数据集,数据戳a的经纬度坐标在标段Nk的坐标范围内,则数据戳a在数据集被划分至Nk段时,其空间单元标签为k,Mk段的空间标签标记方法同理可得,Nk和Mk的计算公式如下;
Nk=[L]
式中:L表示拟研究的国道或省道长度;
S17、采用常用的时间窗对数据集进行时间划分,按1天、3天、7天、14天对数据集进行时间划分,当被划分为Tj段时,数据戳a的发生时间T∈[Tj,Tj+1],则数据戳a在数据集被划分为Tj段时,其时间单元标签为j;
S18、根据国道/省道交通事故数据发生的时刻和地点,从气象网站爬取当时的天气情况,将获取的天气数据和事故数据进行整合;天气数据的匹配也可以在补全缺失数据后进行。
S2、在S1数据预处理和时空划分的基础上,从人员、车辆、道路、环境四个角度提取交通事故风险特征,结合交通领域先验知识完成数据离散化
S21、从数据集中提取“人”的特征并离散化,提取遭遇事故人员类型、遭遇事故人员年龄、遭遇事故人员的驾驶资格、遭遇事故人员的驾龄以及遭遇事故人员的性别,将遭遇事故人员类型离散为三类:驾驶员、乘客和行人,将遭遇事故人员年龄离散为四类:18岁及以下、19-40岁、41-60岁和60岁以上,将遭遇事故人员的驾驶资格离散为四类:有B类及以上驾驶证、有C类机动车驾驶证、无机动车驾驶证和未知,将遭遇事故人员的驾龄离散为六类:驾龄小于1年、驾龄大于等于1年且小于5年、驾龄大于等于5年且小于10年、驾龄大于等于10年且小于15年,驾龄大于等于15年和未知,将遭遇事故人员的性别离散为两类:男性和女性;
S22、从数据集中提取“车”的特征并离散化,提取遭遇事故车辆类型、遭遇事故车辆所属地,将遭遇事故车辆类型离散为五类:小客车、货车、大客车、非机动车和其他,将遭遇事故车辆所属地离散为四类:本市、本省、其他和未知;
S23、从数据集中提取“路”的特征并离散化,提取发生事故的道路类型、事故发生地,将发生事故的道路类型离散为五类:一级公路、二级公路、三级公路、四级公路和等外公路,将事故发生地离散为两类:路口、非路口;
S24、从数据集中提取“环境”特征并离散化,提取事故发生的时刻、事故发生日期的性质、事故发生时的天气情况、事故发生时的气温情况、事故发生时的湿度情况、事故发生时风速、事故发生时能见度,将事故发生的时刻离散为七类:凌晨、早高峰、早平峰、午高峰、午平峰、晚高峰和晚平峰,将事故发生日期的性质离散为两类:工作日、休息日,将事故发生时的天气情况离散为四类:雨雪、雾/霾、阴、晴,将事故发生时的气温情况离散为五类:小于等于0度、大于0度且小于等于10度、大于10度且小于等于20度、大于20度且小于等于30度、大于30度,将事故发生时的湿度情况离散为四类:干燥、轻微潮湿、较湿润、特别湿润,将事故发生时风速离散为三类:小于4级、4-7级、大于7级,将事故发生时能见度离散为三类:小于3千米、3-10千米、大于10千米;交通事故风险特征离散后的结果如图2所示。
S3、计算交通事故危害性、事故数量和事故率,构建干线道路交通风险指标
S31、计算每个事故的经济损失Loss,Loss包括:直接财产损失L1、人员伤亡损失L2、其他经济损失L3,根据经济损失划分事故的严重程度,当Loss≥10时,记为一级事故,当7≤Loss<10时,记为二级事故,当5≤Loss<7时,记为三级事故,当Loss<5时,记为四级事故,公式如下;
L1=L11+L12+L13
L2=L21+L22+L23+L24
L3=L31+L32+L33
Loss=ln(αL1+βL2+γL3)
式中:L1指直接财产损失,L11指车辆损失,L12指交通设施损失,L13指货物损失,L21指医药费,L22指误工费和丧葬费,L23指劳动价值损失,L24指精神损失费,L31指社会服务损失费,L32指交通拥堵损失费,L33指环境污染损失费,α和γ取0.1,当人员受伤时β取0.3,当人员死亡时β取0.5;
S32、将各等级交通事故求和,计算出时空划分后每个空间段和时间段内的总事故数,其中,第j个时间段、第k个空间段的总事故数Nj,k的公式如下;
Nj,k=Ⅰj,k+Ⅱj,k+Ⅲj,k+Ⅳj,k
式中:Ⅰj,k表示第k个空间段在第j个时间段内发生的一级事故数量,Ⅱj,k表示第k个空间段在第j个时间段内发生的二级事故数量,Ⅲj,k表示第k个空间段在第j个时间段内发生的三级事故数量,Ⅳj,k表示第k个空间段在第j个时间段内发生的四级事故数量;
S33、根据总事故数,计算第j个时间段、第k个空间段的百万车公里事故率Kj,k,公式如下;
式中:V表示干线道路平均日交通量,M表示干线道路长度,T表示第j个时间段的长度;
S34、通过给不同等级的事故赋予不同的权重,获得第j个时间段、第k个空间段的加权事故率fj,k,公式如下;
S35、针对第j个时间段、第k个空间段的总事故数、百万车公里事故率、加权事故率,分别计算总事故数25%的数值、百万车公里事故率50%的数值、加权事故率75%的数值作为三个风险指标。对三个风险指标值中的每一个风险指标值,按照如下规则确定风险得分值:当风险指标介于0与25%分位数之间时,其风险得分值为1;当风险指标介于25%与50%分位数之间时,其风险得分值为2;当风险指标介于50%与75%分位数之间时,其风险得分值为3;当风险指标大于75%分位数,其风险得分值为4;通过此规则获得三个风险指标的综合风险值Pj,k,公式如下;
式中:表示第j个时间段、第k个空间段事故数的风险得分值,/>表示第j个时间段、第k个空间段百万车公里事故率的风险得分值,/>表示第j个时间段、第k个空间段加权事故率的风险得分值。
S4、通过K2算法初步构建面向交通风险预测的贝叶斯网络模型结构,结合既有知识优化模型结构,结合现实数据进行变量的参数学习,对模型预测精度进行评价
贝叶斯网络是一种基于概率论、统计学与图论的数学模型,具有高效性、灵活性和可解释性的优点,相比于神经网络、随机森林等方法,使用贝叶斯网络能够使计算过程更简单、直观和灵活。K2算法是一种贪婪的搜索算法,它可以自动学习贝叶斯网络的结构,减轻手动规范模型结构的负担,更便于应用,K2算法还考虑观察到的数据来指导网络结构的构建,使模型更加适应实际的交通运行状况。本发明构建用于预测国省干线交通事故风险预测的贝叶斯网络,并通过K2算法学习贝叶斯网络的图结构,具体过程如下:
S41、以每个空间段和时间段的交通事故综合风险值为演绎推理目标,将步骤2中提取到的“人、车、路、环”共16个特征分别作为贝叶斯网络的一个节点;
S42、通过K2算法构建贝叶斯网络图结构,把步骤2离散化后的特征数据和步骤3得到的事故严重程度特征输入K2算法进行学习,获得模型的图结构;
S43、分析每个空间段和时间段的事故综合风险值和其他16个特征的相关性,结合既有知识优化贝叶斯网络模型图结构,去除部分节点之间的有向边,即将网络结构中不符合常理及相关领域专业知识的部分去除;
S44、贝叶斯网络模型图结构形成后,针对不同时间划分和空间划分的交通事故数据集,分别将前三分之二的现实数据输入贝叶斯网络图结构中,对各个变量进行参数学习,得到条件概率分布表,完成基于贝叶斯网络的交通风险预测模型的构建;
S45、针对不同时间划分和空间划分的交通事故数据集,利用后三分之一的数据检验模型的预测精度,将综合风险值为小于等于2定义为低风险,将综合风险值大于2定义为高风险,采用准确率PAR对得到的八个预测模型进行评价,准确率计算公式如下;
式中:TN为低风险预测正确的数量,FP为低风险预测错误的数量,TP为高风险预测正确的数量,FN为高风险预测错误的数量。
步骤S5,将实时交通事故数据输入步骤S4构建的贝叶斯网络模型,获取国省干线道路交通事故风险预测值
下面结合一个具体实例对本发明的技术内容进行解释说明。
通过步骤S11至S13进行数据预处理,按3.95:1的男女比例对“性别”缺失数据补全,按5:165:65:7的比例对“年龄”缺失数据补全;通过步骤S16至S17对数据集按照不同时空颗粒度进行划分,空间上被划分为36段和6段,时间上被划分为1天、3天、7天、14天,划分后的数据量如表1所示。
表1不同时空颗粒度下风险预测样本数量
根据交通事故数据发生的时刻,从气象网站爬取当时的天气情况,获取天气特征,按照步骤S21至S24的方法对影响交通事故发生的“人、车、路、环”四个特征进行离散化,离散结果如图2所示。按照步骤S31的方法计算各事故的经济损失,划分事故的严重程度,划分结果如图3所示。按照步骤S41至S42的方法构建以事故严重程度为演绎推理目标的贝叶斯网络图结构,如图4所示,17个节点全部处于结构中,无孤立节点,有7个根节点、5个中间节点、4个叶节点,该网络结构中存在不符合常理及专业知识的部分,结合相关性分析,以及交通安全领域相关知识,去除部分节点之间的有向边,对贝叶斯网络结构进行优化,优化后的贝叶斯网络图结构如图5。
基于构建的贝叶斯网络,按照不同的时空颗粒度预测不同时空环境下的交通事故严重程度,根据步骤S32至步骤S35获得事故的风险值,按照本发明提出的事故风险划分规则,模型的预测精度较高,在预测是否为高风险路段的准确率在90%以上,可以给交通管理者提供决策意见。不同时空颗粒度下模型性能预测结果如表2所示。
表2不同时空颗粒度下模型预测性能
以上具体实施方式及实施例是对本发明提出的技术思想的具体支持,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在本发明技术方案基础上所做的任何等同变化或等效的改动,均仍属于本发明技术方案保护的范围。
Claims (10)
1.一种国省干线道路交通事故风险预测方法,其特征在于,包括如下步骤:
步骤S1,对交通事故数据集进行预处理,对预处理后的交通事故数据集进行时间和空间划分;
步骤S2,对经步骤S1时间和空间划分后的交通事故数据集,从人员、车辆、道路、环境四个角度提取交通事故风险特征,并对所提取的交通事故风险特征进行离散化处理;
步骤S3,根据交通事故的经济损失划分事故严重程度,计算每个空间段和时间段内的总事故数、百万车公里事故率、加权事故率,计算每个空间段和时间段的交通事故综合风险值;
步骤S4,以每个空间段和时间段的交通事故综合风险值为演绎推理目标,将步骤S2提取的交通事故风险特征分别作为贝叶斯网络的一个节点,构建贝叶斯网络模型;
步骤S5,将实时交通事故数据输入步骤S4构建的贝叶斯网络模型,获取国省干线道路交通事故风险预测值。
2.根据权利要求1所述一种国省干线道路交通事故风险预测方法,其特征在于,所述步骤S1对交通事故数据集进行预处理的具体方法为:
步骤S1A,将缺失数据的占比大于或等于阈值的交通事故数据戳判定为无效数据,删除无效数据;
步骤S1B,对缺失数据的占比小于阈值的交通事故数据戳进行补全操作。
3.根据权利要求2所述一种国省干线道路交通事故风险预测方法,其特征在于,所述步骤S1B对缺失数据的占比小于阈值的交通事故数据戳进行补全操作的具体方法为:
缺失数据为性别时,根据交通事故数据集性别的比例关系进行随机补全,sm表示性别缺失数据中被补全为男性的数量,sw表示性别缺失数据中被补全为女性的数量,S表示完整数据戳的数量,SM表示完整数据戳中性别为男性的数量,SW表示完整数据戳中性别为女性的数量;
缺失数据为年龄时,根据交通事故数据集年龄的比例关系进行随机补全;
缺失数据为驾龄时,将驾龄字段标记为未知;
缺失数据为车辆类型时,将车辆类型字段标记为未知。
4.根据权利要求3所述一种国省干线道路交通事故风险预测方法,其特征在于,所述步骤S1对预处理后的交通事故数据集进行时间和空间划分的具体方法为:
步骤S1C,采用至少一种标段对经步骤S1B补全操作后的交通事故数据集进行空间划分;
步骤S1D,采用至少一个时间窗对经步骤S1C空间划分后的交通事故数据集进行时间划分。
5.根据权利要求4所述一种国省干线道路交通事故风险预测方法,其特征在于,所述步骤S1C采用至少一种标段对经步骤S1B补全操作后的交通事故数据集进行空间划分的具体方法为:
根据国道或省道的标段将交通事故数据集划分为Nk段空间单元时,遍历交通事故数据集,当前交通事故数据戳的经纬度坐标在标段Nk的坐标范围内时,赋值当前交通事故数据戳的空间单元标签为k,Nk=[L],L表示拟研究的国道或省道长度;
根据国道或省道的标段将交通事故数据集划分为Mk段空间单元时,遍历交通事故数据集,当前交通事故数据戳的经纬度坐标在标段Mk的坐标范围内时,赋值当前交通事故数据戳的空间单元标签为k,
6.根据权利要求5所述一种国省干线道路交通事故风险预测方法,其特征在于,所述步骤S1D采用至少一个时间窗对经步骤S1C空间划分后的交通事故数据集进行时间划分的具体方法为:采用包含但不限于1天、3天、7天、14天的时间窗进行时间划分,当交通事故数据集被划分为Tj段时,当前交通事故数据戳发生时间T∈[Tj,Tj+1],则赋值当前交通事故数据戳的时间单元标签为j。
7.根据权利要求6所述一种国省干线道路交通事故风险预测方法,其特征在于,为对步骤S1D时间划分后的交通事故数据匹配天气数据。
8.根据权利要求7所述一种国省干线道路交通事故风险预测方法,其特征在于,所述步骤S2从人员这个角度提取交通事故风险特征包含但不限于:遭遇事故人员类型、遭遇事故人员年龄、遭遇事故人员的驾驶资格、遭遇事故人员的驾龄以及遭遇事故人员的性别;从车辆这个角度提取交通事故风险特征包含但不限于:遭遇事故车辆类型、遭遇事故车辆所属地;从道路这个角度提取交通事故风险特征包括但不限于:发生事故的道路类型、事故发生地;从环境这个角度提取交通事故风险特征包含但不限于:事故发生的时刻、事故发生日期的性质、事故发生时的天气情况、事故发生时的气温情况、事故发生时的湿度情况、事故发生时风速、事故发生时能见度。
9.根据权利要求8所述一种国省干线道路交通事故风险预测方法,其特征在于,所述步骤S3具体包括如下步骤:
步骤S31,计算每个交通事故的经济损失Loss,当Loss≥10时,记为一级事故,当7≤Loss<10时,记为二级事故,当5≤Loss<7时,记为三级事故,当Loss<5时,记为四级事故,其中,
Loss=ln(αL1+βL2+γL3),L1=L11+L12+L13,L2=L21+L22+L23+L24,L3=L31+L32+L33,L1为直接财产损失,L2为人员伤亡损失、L3为其他经济损失,L11为车辆损失,L12为交通设施损失,L13为货物损失,L21为医药费,L22为误工费和丧葬费,L23为劳动价值损失,L24为精神损失费,L31为社会服务损失费,L32为交通拥堵损失费,L33为环境污染损失费,α和γ取0.1,当人员受伤时β取0.3,当人员死亡时β取0.5;
步骤S32,计算第j个时间段、第k个空间段的总事故数Nj,k,Nj,k=Ij,k+IIj,k+IIIj,k+IVj,k,Ij,k表示第k个空间段在第j个时间段内发生的一级事故数量,IIj,k表示第k个空间段在第j个时间段内发生的二级事故数量,IIIj,k表示第k个空间段在第j个时间段内发生的三级事故数量,IVj,k表示第k个空间段在第j个时间段内发生的四级事故数量;
步骤S33,计算第j个时间段、第k个空间段的百万车公里事故率Kj,k,V表示干线道路平均日交通量,M表示干线道路长度,T表示第j个时间段的长度;
步骤S34,计算第j个时间段、第k个空间段的加权事故率fj,k,
步骤S35,计算第j个时间段、第k个空间段的总事故数25%的数值,第j个时间段、第k个空间段的百万车公里事故率50%的数值,第j个时间段、第k个空间段的加权事故率75%的数值,作为三个风险指标;
对于每一风险指标:当风险指标介于0与25%分位数之间时,其风险得分值为1;当风险指标介于25%与50%分位数之间时,其风险得分值为2;当风险指标介于50%与75%分位数之间时,其风险得分值为3;当风险指标大于75%分位数;其风险得分值为4;
计算第j个时间段、第k个空间段的综合风险值Pj,k, 表示第j个时间段、第k个空间段总事故数的风险得分值,/>表示第j个时间段、第k个空间段百万车公里事故率的风险得分值,/>表示第j个时间段、第k个空间段加权事故率的风险得分值。
10.根据权利要求9所述一种国省干线道路交通事故风险预测方法,其特征在于,所述步骤S4具体为:
将步骤S2离散化后的交通事故风险特征和步骤S3得到的事故严重程度输入K2算法进行学习,获取贝叶斯网络模型的图结构;
根据每个空间段和时间段的事故综合风险值与交通事故风险特征的关联系优化贝叶斯网络模型图结构;
根据不同时间划分和空间划分后的交通事故数据集对贝叶斯网络图结构中各变量进行参数学习,并检验模型预测精度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311650449.8A CN117787688A (zh) | 2023-12-04 | 2023-12-04 | 一种国省干线道路交通事故风险预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311650449.8A CN117787688A (zh) | 2023-12-04 | 2023-12-04 | 一种国省干线道路交通事故风险预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117787688A true CN117787688A (zh) | 2024-03-29 |
Family
ID=90398982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311650449.8A Pending CN117787688A (zh) | 2023-12-04 | 2023-12-04 | 一种国省干线道路交通事故风险预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117787688A (zh) |
-
2023
- 2023-12-04 CN CN202311650449.8A patent/CN117787688A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107239575B (zh) | 城市道路暴雨内涝风险分析与预警智联网服务系统及方法 | |
CN109145954B (zh) | 一种基于多源时空数据的网约车出行安全评价方法及系统 | |
CN104217297B (zh) | 一种轨道交通车站动态安全风险评价方法 | |
Qiao et al. | Utilization of accident databases and fuzzy sets to estimate frequency of HazMat transport accidents | |
CN110705850A (zh) | 一种基于层次分析法的道路风险评估方法 | |
CN113380033A (zh) | 基于人机混合增强智能的城市交通安全预警方法及系统 | |
Zhao et al. | Unsupervised anomaly detection based method of risk evaluation for road traffic accident | |
CN115423139A (zh) | 基于动态贝叶斯的公路改扩建安全态势分析方法及装置 | |
Zhao et al. | Factors affecting traffic risks on bridge sections of freeways based on partial dependence plots | |
Chai et al. | Safety evaluation of urban rail transit operation considering uncertainty and risk preference: A case study in China | |
CN114550445A (zh) | 一种城市区域交通安全状态评估方法和装置 | |
CN109409563B (zh) | 一种公交运营车辆实时人数的分析方法、系统和存储介质 | |
Awasthi et al. | A hybrid approach based on AHP and belief theory for evaluating sustainable transportation solutions | |
Wu et al. | Considering safety impacts of skid resistance in decision-making processes for pavement management | |
CN117787688A (zh) | 一种国省干线道路交通事故风险预测方法 | |
Khabiri et al. | Application of data mining algorithm to investigate the effect of intelligent transportation systems on road accidents reduction by decision tree | |
CN104637022A (zh) | 一种对铁路平交道口安全现状的评价方法 | |
Yang et al. | A methodology for evaluating evacuation capacity of urban underground road | |
Li et al. | Study on evaluation method of expressway operation safety risk based on grey incidence analysis and AHP | |
CN112418492A (zh) | 一种基于人工智能的客流数据采集分析系统 | |
Prasad et al. | Calibration of HDM-4 emission models for Indian conditions | |
Ma et al. | Construction and empirical study of comprehensive evaluation system of urban road traffic safety. | |
Yao et al. | Risk assessment research of urban road traffic safety based on Extension Matter Element Model | |
CN116739391B (zh) | 一种多制式轨道交通应急协同决策方法及装置 | |
CN116665342B (zh) | 新能源汽车驾驶行为分析方法、系统及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |