CN114580874B - 一种适用于高速公路风险评估的多维分布式数据分析系统 - Google Patents

一种适用于高速公路风险评估的多维分布式数据分析系统 Download PDF

Info

Publication number
CN114580874B
CN114580874B CN202210175723.XA CN202210175723A CN114580874B CN 114580874 B CN114580874 B CN 114580874B CN 202210175723 A CN202210175723 A CN 202210175723A CN 114580874 B CN114580874 B CN 114580874B
Authority
CN
China
Prior art keywords
traffic accident
probability
accident
data
traffic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210175723.XA
Other languages
English (en)
Other versions
CN114580874A (zh
Inventor
马艳丽
吴振超
张宿峰
周年发
栗萍
李旭雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Heilongjiang Highway Construction Center
Harbin Institute of Technology
Original Assignee
Heilongjiang Highway Construction Center
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Heilongjiang Highway Construction Center, Harbin Institute of Technology filed Critical Heilongjiang Highway Construction Center
Priority to CN202210175723.XA priority Critical patent/CN114580874B/zh
Publication of CN114580874A publication Critical patent/CN114580874A/zh
Application granted granted Critical
Publication of CN114580874B publication Critical patent/CN114580874B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Computer Security & Cryptography (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种适用于高速公路风险评估的多维分布式数据分析系统,涉及交通安全技术领域,针对现有技术中难以对高速公路的风险进行评估,进而导致高速公路交通安全性差的问题,包括:交通事故数据库子系统、交通事故成因分析子系统和交通事故风险评估子系统;所述交通事故数据库子系统用于对高速公路交通事故数据进行集成,并将集成后的数据通过维表和事实表的形式存入多维分布式数据库;所述交通事故成因分析子系统用于根据多维分布式数据库中的信息识别影响交通事故发生的要素;所述交通事故风险评估子系统用于根据影响交通事故发生的要素建立贝叶斯网络,并结合多维分布式数据库评估交通事故发生的风险。本申请提高了高速公路交通安全性。

Description

一种适用于高速公路风险评估的多维分布式数据分析系统
技术领域
本发明涉及交通安全技术领域,具体为一种适用于高速公路风险评估的多维分布式数据分析系统。
背景技术
高速公路上交通事故的发生受多维因素影响,因此,对高速公路交通事故数据进行深入分析,寻找出风险致因与事故之间的内在规律以针对性地进行事故预防管理,对保护人民生命财产安全具有重要意义。
专利CN 112308434 A公开了一种交通安全风险评估方法及系统,利用交通事故数据训练神经网络模型,然后将某一行程的交通运行数据输入神经网络,利用神经网络模型计算行程风险值。
专利CN 112562337 A公开了一种基于深度学习的高速公路交通事故风险评估方法,该方法将高速公路划分若干路段,根据采集的道路、气象和事故等信息训练深度学习模型,计算交通事故风险水平,评估高速公路交通事故风险。
现有高速公路风险评估方法多是根据数据库中的数据建立交通事故与安全影响因素的关系模型,但在这些影响因素中,哪些因素集合对交通事故造成的影响最大,哪些因素可以被忽略尚不明确,若能筛选出关键因素,从而建立精准的风险评估模型对于提升高速公路的行车安全性意义重大。
随着机器学习的发展,数据挖掘算法被应用于交通安全分析领域。数据挖掘算法能够发现事件中频繁发生的属性集,用于识别影响高速公路交通事故的要素集,进而有效地分析风险事件的成因和规律。
发明内容
本发明的目的是:针对现有技术中难以对高速公路的风险进行评估,进而导致高速公路交通安全性差的问题,提出一种适用于高速公路风险评估的多维分布式数据分析系统。
本发明为了解决上述技术问题采取的技术方案是:
一种适用于高速公路风险评估的多维分布式数据分析系统,包括:交通事故数据库子系统、交通事故成因分析子系统和交通事故风险评估子系统;
所述交通事故数据库子系统用于对高速公路交通事故数据进行集成,并将集成后的数据通过维表和事实表的形式存入多维分布式数据库;
所述交通事故成因分析子系统用于根据多维分布式数据库中的信息识别影响交通事故发生的要素;
所述交通事故风险评估子系统用于根据影响交通事故发生的要素建立贝叶斯网络,并结合多维分布式数据库评估交通事故发生的风险。
进一步的,所述高速公路交通事故数据包括:当事人数据、事故车辆数据、公路几何线形数据、事故环境数据、事故时间数据以及事故原因数据。
进一步的,所述交通事故数据库子系统具体执行如下步骤:
步骤一一:获取高速公路交通事故数据,然后将高速公路交通事故数据分别存入对应的局部数据库中,所述局部数据库包括道路信息数据库、交通流信息数据库、环境信息数据库以及交通事故数据库;
步骤一二:将局部数据库中的数据统一存入高速公路数据仓库中;
步骤一三:将高速公路数据仓库中数据的属性进行离散化处理;
步骤一四:根据离散化处理后的数据建立事实表和维表,然后连接事实表和维表,得到每次事故发生时影响因素的具体情况,最后将每次事故发生时影响因素的具体情况以及事实表和维表存入多维分布式数据库。
进一步的,所述步骤一三中离散化处理包括:
将时间按照年、月、日、时分层定义;
将道路按照路面情况、路表情况、道路线形分层定义。
进一步的,所述交通事故成因分析子系统具体执行如下步骤:
步骤二一:扫描多维分布式数据库中每一个影响交通安全的要素,并将所有影响交通安全的要素与事故发生要素集成到一个集合中,然后设定要素长度m为1,得到备选要素集合C1
步骤二二:基于备选要素集合C1,并结合多维分布式数据库中的事实表计算每个影响交通安全的要素发生的频率,然后将每个影响交通安全的要素发生的频率作为该要素的支持度,之后设置最小支持度,保留支持度大于最小支持度的影响交通安全的要素形成频繁要素集合L1
步骤二三:将频繁要素集合L1中的两个频繁要素子集进行连接形成要素长度m为2的备选要素集合C2,然后去除备选要素集合C2中不含事故发生要素的要素子集,之后,基于去除不含事故发生要素的要素子集的备选要素集合C2,并根据多维分布式数据库中的事实表计算每个影响交通安全的要素子集发生的频率,然后将每个影响交通安全的要素发生的频率作为该要素的支持度,最后设置最小支持度,保留支持度大于最小支持度的要素,形成频繁要素集合L2
步骤二四:基于步骤二三,令L1=L2、m=m+1进行迭代,直至频繁要素集合中只有一项要素子集,然后将此时的频繁要素集合作为最终频繁要素集合;
步骤二五:针对最终频繁要素集合,得到所有要素子集对事故发生的置信度,之后设置最小置信度,然后保留置信度不小于最小置信度的要素子集,最后从保留的要素子集中选取置信度最大的要素子集作为强关联规则子集,即影响交通事故发生的要素。
进一步的,所述步骤二二中支持度表示为:
Figure SMS_1
其中,Si表示备选要素集合中含有i个要素子集,P()表示出现的次数,allItems表示数据库中事故。
进一步的,所述步骤二五中置信度表示为:
Figure SMS_2
其中,f1,f2,…,fm表示最终频繁要素集合中要素子集中的风险致因,ACC表示事故发生结果。
进一步的,所述交通事故风险评估子系统具体执行如下步骤:
步骤三一:根据强关联规则子集构建三层贝叶斯网络,所述三层贝叶斯网络中先验概率、条件概率表和概率分布的确定步骤为:
步骤三一一:确定强关联规则子集中每个影响交通事故发生要素的概率,并将该概率作为先验概率;
步骤三一二:利用Best-Worst Method方法确定三层贝叶斯网络中非根节点的条件概率表;
步骤三一三:根据先验概率和非根节点的条件概率表,并利用全概率公式得到非根节点的概率分布;
步骤三二;利用构建好的三层贝叶斯网络进行风险评估。
进一步的,所述全概率公式表示为:
P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+...P(A|Bn)P(Bn)
其中,A表示非根节点,B1,B2,...Bn表示父节点各种状态组合。
进一步的,所述步骤三一二具体为:
对某种父节点状态组合,构建一个m×1的条件概率向量,m代表某非根节点的状态取值数量,确定向量AB=(aB1 aB2 ... aBn)T和AW=(a1W a2W ... anW)T,aBi表示该非根节点最大概率状态取值优于其他取值的程度,aiW表示该非根节点其他取值优于最小概率状态取值的程度;
根据aBi以及aiW构建如下数学规划问题,得到最优条件概率向量
Figure SMS_3
表示为:
minξ
s.t.
Figure SMS_4
Figure SMS_5
Figure SMS_6
pi≥0,for all i
对所有父节点状态组合,得到其对应的最优条件概率向量,然后将所有最优条件概率向量组合,即得到该非根节点的最优条件概率表
Figure SMS_7
其中,
Figure SMS_8
表示在某种父节点状态组合下,该非根节点各种状态取值的概率,ξ表示需极小化的变量,pB表示最优条件概率向量中概率值最大者,pW表示最优条件概率向量中概率值最小者,pi表示最优条件概率向量中第i个概率值,pmn *表示某种父节点状态组合下,非根节点各种状态取值的概率。
本发明的有益效果是:
本申请集成高速公路交通事故相关多源数据,揭示事故发生规律,基于贝叶斯网络进行高速公路风险评估,可以准确预测高速公路行车风险等级,可用于高速公路交通事故预防,提高高速公路交通安全性,极大地避免了高速公路事故的发生,对高速公路的行车安全性意义重大。
附图说明
图1为本申请的整体流程图;
图2为本申请多维分布式数据库系统形成示意图;
图3为本申请多维分布式数据库数据结构模型示意图;
图4为本申请高速公路交通事故影响因素挖掘流程图;
图5为高速公路车辆运行风险评估模型示意图;
图6为贝叶斯网络模型示意图1;
图7为贝叶斯网络模型示意图2。
具体实施方式
需要特别说明的是,在不冲突的情况下,本申请公开的各个实施方式之间可以相互组合。
具体实施方式一:参照图1具体说明本实施方式,本实施方式所述的一种适用于高速公路风险评估的多维分布式数据分析系统,包括:交通事故数据库子系统、交通事故成因分析子系统和交通事故风险评估子系统;
所述交通事故数据库子系统用于对高速公路交通事故数据进行集成,并将集成后的数据通过维表和事实表的形式存入多维分布式数据库;
所述交通事故成因分析子系统用于根据多维分布式数据库中的信息识别影响交通事故发生的要素;
所述交通事故风险评估子系统用于根据影响交通事故发生的要素建立贝叶斯网络,并结合多维分布式数据库评估交通事故发生的风险。
具体实施方式二:本实施方式是对具体实施方式一的进一步说明,本实施方式与具体实施方式一的区别是所述高速公路交通事故数据包括:当事人数据、事故车辆数据、公路几何线形数据、事故环境数据、事故时间数据以及事故原因数据。
具体实施方式三:本实施方式是对具体实施方式二的进一步说明,本实施方式与具体实施方式二的区别是所述交通事故数据库子系统具体执行如下步骤:
步骤一一:获取高速公路交通事故数据,然后将高速公路交通事故数据分别存入对应的局部数据库中,所述局部数据库包括道路信息数据库、交通流信息数据库、环境信息数据库以及交通事故数据库;
步骤一二:将局部数据库中的数据统一存入高速公路数据仓库中;
步骤一三:将高速公路数据仓库中数据的属性进行离散化处理;
步骤一四:根据离散化处理后的数据建立事实表和维表,然后连接事实表和维表,得到每次事故发生时影响因素的具体情况,最后将每次事故发生时影响因素的具体情况以及事实表和维表存入多维分布式数据库。
所述事实表中包括交通事故的离散化取值,所述维表中包括交通事故影响因素的离散化取值。
具体实施方式四:本实施方式是对具体实施方式三的进一步说明,本实施方式与具体实施方式三的区别是所述步骤一三中离散化处理包括:
将时间按照年、月、日、时分层定义;
将道路按照路面情况、路表情况、道路线形分层定义。
具体实施方式五:本实施方式是对具体实施方式四的进一步说明,本实施方式与具体实施方式四的区别是所述交通事故成因分析子系统具体执行如下步骤:
步骤二一:扫描多维分布式数据库中每一个影响交通安全的要素,并将所有影响交通安全的要素与事故发生要素集成到一个集合中,然后设定要素长度m为1,得到备选要素集合C1
步骤二二:基于备选要素集合C1,并结合多维分布式数据库中的事实表计算每个影响交通安全的要素发生的频率,然后将每个影响交通安全的要素发生的频率作为该要素的支持度,之后设置最小支持度,保留支持度大于最小支持度的影响交通安全的要素形成频繁要素集合L1
步骤二三:将频繁要素集合L1中的两个频繁要素子集进行连接形成要素长度m为2的备选要素集合C2,然后去除备选要素集合C2中不含事故发生要素的要素子集,之后,基于去除不含事故发生要素的要素子集的备选要素集合C2,并根据多维分布式数据库中的事实表计算每个影响交通安全的要素子集发生的频率,然后将每个影响交通安全的要素发生的频率作为该要素的支持度,最后设置最小支持度,保留支持度大于最小支持度的要素,形成频繁要素集合L2
步骤二四:基于步骤二三,令L1=L2、m=m+1进行迭代,直至频繁要素集合中只有一项要素子集,然后将此时的频繁要素集合作为最终频繁要素集合;
步骤二五:针对最终频繁要素集合,得到所有要素子集对事故发生的置信度,之后设置最小置信度,然后保留置信度不小于最小置信度的要素子集,最后从保留的要素子集中选取置信度最大的要素子集作为强关联规则子集,即影响交通事故发生的要素。
具体实施方式六:本实施方式是对具体实施方式五的进一步说明,本实施方式与具体实施方式五的区别是所述步骤二二中支持度表示为:
Figure SMS_9
/>
其中,Si表示备选要素集合中含有i个要素子集,P()表示出现的次数,n表示备选要素集合中要素子集个数;allItems表示数据库中事故,i=1-n。
具体实施方式七:本实施方式是对具体实施方式六的进一步说明,本实施方式与具体实施方式六的区别是所述步骤二五中置信度表示为:
Figure SMS_10
其中,f1,f2,…,fm表示最终频繁要素集合中要素子集中的风险致因,ACC表示事故发生结果。
具体实施方式八:本实施方式是对具体实施方式七的进一步说明,本实施方式与具体实施方式七的区别是所述交通事故风险评估子系统具体执行如下步骤:
步骤三一:根据强关联规则子集构建三层贝叶斯网络,所述三层贝叶斯网络中先验概率、条件概率表和概率分布的确定步骤为:
步骤三一一:确定强关联规则子集中每个影响交通事故发生要素的概率,并将该概率作为先验概率;
步骤三一二:利用Best-Worst Method方法确定三层贝叶斯网络中非根节点的条件概率表;
步骤三一三:根据先验概率和非根节点的条件概率表,并利用全概率公式得到非根节点的概率分布;
步骤三二;利用构建好的三层贝叶斯网络进行风险评估。
具体实施方式九:本实施方式是对具体实施方式八的进一步说明,本实施方式与具体实施方式八的区别是所述全概率公式表示为:
P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+...P(A|Bn)P(Bn)
其中,A表示非根节点,B1,B2,...Bn表示父节点各种状态组合。
具体实施方式十:本实施方式是对具体实施方式九的进一步说明,本实施方式与具体实施方式九的区别是所述步骤三一二具体为:
对某种父节点状态组合,构建一个m×1的条件概率向量,m代表某非根节点的状态取值数量,确定向量AB=(aB1 aB2 ... aBn)T和AW=(a1W a2W ... anW)T,aBi表示该非根节点最大概率状态取值优于其他取值的程度,aiW表示该非根节点其他取值优于最小概率状态取值的程度,均用于表示风险严重程度,i=1-n;
根据aBi以及aiW构建如下数学规划问题,得到最优条件概率向量
Figure SMS_11
表示为:
minξ
s.t.
Figure SMS_12
Figure SMS_13
/>
Figure SMS_14
pi≥0,for all i
对所有父节点状态组合,得到其对应的最优条件概率向量,然后将所有最优条件概率向量组合,即得到该非根节点的最优条件概率表
Figure SMS_15
其中,
Figure SMS_16
表示在某种父节点状态组合下,该非根节点各种状态取值的概率,ξ表示需极小化的变量,pB表示最优条件概率向量中概率值最大者,pW表示最优条件概率向量中概率值最小者,pi表示最优条件概率向量中第i个概率值,pmn *表示某种父节点状态组合下,非根节点各种状态取值的概率。
实施例:
高速公路的几何线形数据、交通量数据和交通事故数据等信息分别由高速公路管理部门、交警部门等政府部门管理,为便于对数据的处理和分析,将数据集成存储,包括如下步骤:
步骤一:通过数据抽取平台,将各部门所管理的数据分别存入道路信息数据库、交通流信息数据库、环境信息数据库、交通事故数据库等局部数据库中。
步骤二:通过数据归集平台,将步骤一中得到的各局部数据库的数据统一存入高速公路数据仓库中。
步骤三:将数据仓库中的数据的属性进行离散化处理,如时间按照[年]、[月]、[日]、[时]分层定义,道路按照[路面情况]、[路表情况]、[道路线形]分层定义。
步骤四:建立事实表和维表,事实表中包括交通事故的离散化取值,维表中包括交通事故影响因素的离散化取值,连接事实表和维表,即得到每次事故发生时各影响因素的具体情况。
与高速公路交通事故相关的数据包括当事人数据、事故车辆数据、公路几何线形数据、事故环境数据、事故时间数据、事故原因数据。将交通事故相关数据存入数据库之前将其进行分层定义并进行离散化处理,存入数据库时采用星型结构进行存储。对每次事故建立星型结构,星型模型结构需建立一个事实表和六个维表,事实表与维表之间用主键连接,事实表即为事故本身,各维表分别包含上述六种数据。交通事故成因分析子系统是根据数据库中的信息,采用改进Apriori算法,以设置的最小支持度和最小置信度指标,识别影响交通事故发生的要素。改进Apriori算法先扫描上述高速公路交通事故数据库,获得频繁项集,再根据频繁项集获得事故发生的强关联规则。第一次扫描高速公路交通事故数据库,产生长度为1的备选频繁要素集合,根据最小支持度阈值得到长度为1的频繁项集。以后每个频繁项集的获取都经过上级频繁项集和长度为1的频繁项集连接和剪枝两步,直至没有频繁项集输出或频繁项集只有一项。在获得的频繁项集中,计算其各非空子集对事故发生的置信度,以最小置信度阈值选择强关联规则,即交通事故成因。交通事故风险评估子系统是根据频繁项集中各风险致因建立贝叶斯网络,结合交通事故多维分布式数据库评估一般和特殊情况下交通事故发生的风险。各因素的先验概率由专家估计等方法确定,各非根节点的条件概率表由BWM方法确定;由各节点的先验概率和各非根节点的条件概率表计算各非根节点的边缘概率,以此表示风险大小;由事故发生概率进行分级,评估事故发生风险,分级判断原则为:
若事故发生概率为75%-100%,则判定为高风险;
若事故发生概率为50%-75%,则判定为较高风险;
若事故发生概率为25%-50%,则判定为一般风险;
若事故发生概率为0%-25%,则判定为低风险。
参照图4具体说明交通事故成因分析子系统,交通事故成因分析子系统是指用多维 Apriori算法得到与高速公路交通事故指标的强关联要素子集,包括如下步骤:
步骤一:扫描高速公路交通事故数据库中每一个影响交通安全的要素,将其与事故发生这一要素集成到一个集合中,作为要素长度为1的备选要素集合C1
步骤二:基于备选要素集合C1,根据数据库中的事故事实表计算每个要素发生的频率,将其作为此要素的支持度,考虑预先设置的最小支持度,支持度大于最小置信度的要素保留,支持度小于最小置信度的要素去除,形成一个新的要素集合频繁要素集合L1,支持度计算如下式:
Figure SMS_17
步骤三:频繁要素集合Lk中某一子集Lk-1若不含事故发生这一要素,则将之去除。将频繁要素集合Lk中的两个频繁要素子集进行连接形成长度为k+1的备选要素集合Ck+1,根据数据库中的事故事实表计算每个要素发生的频率,将其作为此要素的支持度,考虑预先设置的最小支持度,支持度大于最小支持度的要素保留,支持度小于最小支持度的要素去除,形成一个新的要素集合频繁要素集合Lk+1
步骤四:重复步骤三,不断产生新的频繁要素集合Lk,如果新的频繁要素集合Lk为空集,则Lk-1作为输出的频繁要素集合,如果新的频繁要素集合Lk中只有一项,则Lk作为输出的频繁要素集合。
步骤五:对输出的频繁要素集合,去掉事故发生这一要素,然后求出其所有的非空子集,计算所有非空子集对事故发生的置信度,考虑预先设置的最小置信度,所有置信度小于最小置信度的子集去除,所有置信度大于最小置信度的子集保留,从中选取置信度最大的要素子集作为强关联规则子集,置信度计算如下式:
Figure SMS_18
步骤六:对满足要求的强关联规则子集中的所有影响因素,计算其支持度,输出满足最小支持度的影响因素集合。
交通事故风险评估子系统通过建立车辆运行风险贝叶斯网络来评估事故风险,包括以下步骤:
步骤一:确定各风险致因的先验概率,如驾驶员疲劳,确定其发生和不发生各自的概率作为先验概率;
步骤二:使用Best-Worst Method(BWM)方法确定非根节点的条件概率表。
对一个m×n的条件概率矩阵,m代表该节点的状态取值数量,n代表该节点的父节点状态组合数,将最高概率元素与其他所有元素进行比较,利用9标度法进行打分,矩阵向量
Figure SMS_19
其中aBij代表最高概率元素CB与元素Cij相比的重要程度;同理,将其他所有元素与最低概率元素进行比较,利用9标度法进行打分,确定其他每个元素相较于最低概率元素的重要程度,矩阵向量/>
Figure SMS_20
其中aijW代表元素Cij与最低概率元素CW相比的重要程度。
构建如下数学规划问题,以得到最优条件概率矩阵:
minξ
s.t.
Figure SMS_21
Figure SMS_22
Figure SMS_23
pi≥0,for all i
求解该数学规划问题,可得最优条件概率表
Figure SMS_24
步骤三:由各风险致因的先验概率和非根节点的条件概率表,使用全概率公式计算非根节点的概率分布,全概率公式如下:
P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+...P(A|Bn)P(Bn)
步骤四;由事故发生的概率对事故发生风险进行风险评估,确定是否要采取管控措施。
采用以下实施例验证本发明的有益效果:
对某高速公路三年的交通事故数据进行该方法的应用效果展示,验证本发明的有益效果:
构建高速公路交通事故多维分布式数据库,在此基础上获得高速公路交通事故影响因素集合,其满足最小支持度和最小置信度阈值的关联规则及置信度如表1所示:
表1关联规则及置信度
Figure SMS_25
从关联规则看出,影响高速公路交通事故发生的关键致因有驾驶员、车辆、环境三方面的因素,各具体影响因素概率分布情况如表2所示:
表2影响因素的概率分布情况
Figure SMS_26
高速公路车辆运行风险评估模型如图5所示:
以车辆风险节点为例,求解数学规划问题,得到其最优条件概率矩阵为:
Figure SMS_27
其条件概率表如表3所示:
表3车辆风险节点条件概率表
Figure SMS_28
该节点发生概率为23.1%,以此概率代表该节点风险大小,同理,用上述方法计算所有非根节点的概率大小,得到图6所示贝叶斯网络模型:
在已知某些信息的情况下,可通过事故发生概率来评估风险水平,如已知驾驶员疲劳,驾龄为0-3年,不超速,车型为小汽车,车辆无故障,天气有雪,照明不良,则此时贝叶斯网络模型如图7所示:发生事故概率为61%,属于较高风险。
需要注意的是,具体实施方式仅仅是对本发明技术方案的解释和说明,不能以此限定权利保护范围。凡根据本发明权利要求书和说明书所做的仅仅是局部改变的,仍应落入本发明的保护范围内。

Claims (8)

1.一种适用于高速公路风险评估的多维分布式数据分析系统,其特征在于包括:交通事故数据库子系统、交通事故成因分析子系统和交通事故风险评估子系统;
所述交通事故数据库子系统用于对高速公路交通事故数据进行集成,并将集成后的数据通过维表和事实表的形式存入多维分布式数据库;
所述交通事故成因分析子系统用于根据多维分布式数据库中的信息识别影响交通事故发生的要素;
所述交通事故风险评估子系统用于根据影响交通事故发生的要素建立贝叶斯网络,并结合多维分布式数据库评估交通事故发生的风险;
所述交通事故成因分析子系统具体执行如下步骤:
步骤二一:扫描多维分布式数据库中每一个影响交通安全的要素,并将所有影响交通安全的要素与事故发生要素集成到一个集合中,然后设定要素长度m为1,得到备选要素集合C1
步骤二二:基于备选要素集合C1,并结合多维分布式数据库中的事实表计算每个影响交通安全的要素发生的频率,然后将每个影响交通安全的要素发生的频率作为该要素的支持度,之后设置最小支持度,保留支持度大于最小支持度的影响交通安全的要素形成频繁要素集合L1
步骤二三:将频繁要素集合L1中的两个频繁要素子集进行连接形成要素长度m为2的备选要素集合C2,然后去除备选要素集合C2中不含事故发生要素的要素子集,之后,基于去除不含事故发生要素的要素子集的备选要素集合C2,并根据多维分布式数据库中的事实表计算每个影响交通安全的要素子集发生的频率,然后将每个影响交通安全的要素发生的频率作为该要素的支持度,最后设置最小支持度,保留支持度大于最小支持度的要素,形成频繁要素集合L2
步骤二四:基于步骤二三,令L1=L2、m=m+1进行迭代,直至频繁要素集合中只有一项要素子集,然后将此时的频繁要素集合作为最终频繁要素集合;
步骤二五:针对最终频繁要素集合,得到所有要素子集对事故发生的置信度,之后设置最小置信度,然后保留置信度不小于最小置信度的要素子集,最后从保留的要素子集中选取置信度最大的要素子集作为强关联规则子集,即影响交通事故发生的要素;
所述交通事故风险评估子系统具体执行如下步骤:
步骤三一:根据强关联规则子集构建三层贝叶斯网络,所述三层贝叶斯网络中先验概率、条件概率表和概率分布的确定步骤为:
步骤三一一:确定强关联规则子集中每个影响交通事故发生要素的概率,并将该概率作为先验概率;
步骤三一二:利用Best-Worst Method方法确定三层贝叶斯网络中非根节点的条件概率表;
步骤三一三:根据先验概率和非根节点的条件概率表,并利用全概率公式得到非根节点的概率分布;
步骤三二;利用构建好的三层贝叶斯网络进行风险评估。
2.根据权利要求1所述的一种适用于高速公路风险评估的多维分布式数据分析系统,其特征在于所述高速公路交通事故数据包括:当事人数据、事故车辆数据、公路几何线形数据、事故环境数据、事故时间数据以及事故原因数据。
3.根据权利要求2所述的一种适用于高速公路风险评估的多维分布式数据分析系统,其特征在于所述交通事故数据库子系统具体执行如下步骤:
步骤一一:获取高速公路交通事故数据,然后将高速公路交通事故数据分别存入对应的局部数据库中,所述局部数据库包括道路信息数据库、交通流信息数据库、环境信息数据库以及交通事故数据库;
步骤一二:将局部数据库中的数据统一存入高速公路数据仓库中;
步骤一三:将高速公路数据仓库中数据的属性进行离散化处理;
步骤一四:根据离散化处理后的数据建立事实表和维表,然后连接事实表和维表,得到每次事故发生时影响因素的具体情况,最后将每次事故发生时影响因素的具体情况以及事实表和维表存入多维分布式数据库。
4.根据权利要求3所述的一种适用于高速公路风险评估的多维分布式数据分析系统,其特征在于所述步骤一三中离散化处理包括:
将时间按照年、月、日、时分层定义;
将道路按照路面情况、路表情况、道路线形分层定义。
5.根据权利要求1所述的一种适用于高速公路风险评估的多维分布式数据分析系统,其特征在于所述步骤二二中支持度表示为:
Figure FDA0004160630630000021
其中,Si表示备选要素集合中含有i个要素子集,P()表示出现的次数,allItems表示数据库中事故。
6.根据权利要求5所述的一种适用于高速公路风险评估的多维分布式数据分析系统,其特征在于所述步骤二五中置信度表示为:
Figure FDA0004160630630000031
其中,f1,f2,…,fm表示最终频繁要素集合中要素子集中的风险致因,ACC表示事故发生结果。
7.根据权利要求1所述的一种适用于高速公路风险评估的多维分布式数据分析系统,其特征在于所述全概率公式表示为:
P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+...P(A|Bn)P(Bn)
其中,A表示非根节点,B1,B2,...Bn表示父节点各种状态组合。
8.根据权利要求7所述的一种适用于高速公路风险评估的多维分布式数据分析系统,其特征在于所述步骤三一二具体为:
对某种父节点状态组合,构建一个m×1的条件概率向量,m代表某非根节点的状态取值数量,确定向量AB=(aB1 aB2 ... aBn)T和AW=(a1W a2W ... anW)T,aBi表示该非根节点最大概率状态取值优于其他取值的程度,aiW表示该非根节点其他取值优于最小概率状态取值的程度;
根据aBi以及aiW构建如下数学规划问题,得到最优条件概率向量
Figure FDA0004160630630000032
表示为:/>
minξ
s.t.
Figure FDA0004160630630000033
for all i
Figure FDA0004160630630000034
for all i
Figure FDA0004160630630000035
pi≥0,for all i
对所有父节点状态组合,得到其对应的最优条件概率向量,然后将所有最优条件概率向量组合,即得到该非根节点的最优条件概率表
Figure FDA0004160630630000041
其中,
Figure FDA0004160630630000042
表示在某种父节点状态组合下,该非根节点各种状态取值的概率,ξ表示需极小化的变量,pB表示最优条件概率向量中概率值最大者,pW表示最优条件概率向量中概率值最小者,pi表示最优条件概率向量中第i个概率值,pmn *表示某种父节点状态组合下,非根节点各种状态取值的概率。/>
CN202210175723.XA 2022-02-24 2022-02-24 一种适用于高速公路风险评估的多维分布式数据分析系统 Active CN114580874B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210175723.XA CN114580874B (zh) 2022-02-24 2022-02-24 一种适用于高速公路风险评估的多维分布式数据分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210175723.XA CN114580874B (zh) 2022-02-24 2022-02-24 一种适用于高速公路风险评估的多维分布式数据分析系统

Publications (2)

Publication Number Publication Date
CN114580874A CN114580874A (zh) 2022-06-03
CN114580874B true CN114580874B (zh) 2023-06-02

Family

ID=81770454

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210175723.XA Active CN114580874B (zh) 2022-02-24 2022-02-24 一种适用于高速公路风险评估的多维分布式数据分析系统

Country Status (1)

Country Link
CN (1) CN114580874B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115794801B (zh) * 2022-12-23 2023-08-15 东南大学 一种挖掘自动驾驶事故致因链式关系的数据分析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108510168A (zh) * 2018-03-16 2018-09-07 江苏智通交通科技有限公司 基于交通事故关联规则的营运车辆路径规划方法
CN109523786A (zh) * 2018-11-30 2019-03-26 哈尔滨工业大学 一种高速公路交通事故成因分析方法
CN109636125A (zh) * 2018-11-19 2019-04-16 北京交通大学 一种高速公路交通事故风险评估系统
CN112036473A (zh) * 2020-08-28 2020-12-04 长安大学 一种基于高风险交通行为数据库的交通事故风险评估方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045975A (zh) * 2015-06-30 2015-11-11 北京师范大学 基于贝叶斯网络模型的道路运输事故的风险评估方法
CN108417033B (zh) * 2018-03-23 2020-08-25 四川高路交通信息工程有限公司 基于多维因素的高速路交通事故分析预测方法
CN112069726A (zh) * 2020-08-19 2020-12-11 中国航天标准化研究所 一种基于贝叶斯网络的风险分析评估方法及装置
CN113191084B (zh) * 2021-05-07 2024-04-19 哈尔滨工业大学 基于贝叶斯网络理论的既有铁路桥梁可靠度综合评估方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108510168A (zh) * 2018-03-16 2018-09-07 江苏智通交通科技有限公司 基于交通事故关联规则的营运车辆路径规划方法
CN109636125A (zh) * 2018-11-19 2019-04-16 北京交通大学 一种高速公路交通事故风险评估系统
CN109523786A (zh) * 2018-11-30 2019-03-26 哈尔滨工业大学 一种高速公路交通事故成因分析方法
CN112036473A (zh) * 2020-08-28 2020-12-04 长安大学 一种基于高风险交通行为数据库的交通事故风险评估方法

Also Published As

Publication number Publication date
CN114580874A (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
Lin et al. Using machine learning to assist crime prevention
Wong et al. Rough set approach for accident chains exploration
CN111242484A (zh) 基于转移概率的车辆风险综合评价方法
CN109947898B (zh) 基于智能化的装备故障测试方法
CN116628455B (zh) 一种城市交通碳排放监测与决策支持方法及系统
Satu et al. Mining traffic accident data of N5 national highway in Bangladesh employing decision trees
CN114299742B (zh) 一种高速公路的限速信息动态识别与更新推荐方法
Shokohyar et al. The effect of drivers' demographic characteristics on road accidents in different seasons using data mining
CN114580874B (zh) 一种适用于高速公路风险评估的多维分布式数据分析系统
CN112862621A (zh) 车险风险评估方法、装置和计算机设备
Watanabe et al. Scenario mining for development of predictive safety functions
Alicioglu et al. Assessing accident risk using ordinal regression and multinomial logistic regression data generation
CN112651666A (zh) 一种基于驾驶模式转移特征的驾驶员风险评估方法
CN105205312A (zh) 道路事故热点成因分析和破坏度评估方法
CN110119891B (zh) 一种适于大数据的交通安全影响因素辨识方法
CN116703612A (zh) 一种汽车保险风险等级评估方法
CN116432864A (zh) 一种区域营运驾驶员群体安全态势的预测方法及系统
US20230260342A1 (en) Method and computer programmes for the management of vehicle fleets
Priyanka et al. A comparative study of classification algorithm using accident data
Habibzadeh et al. Presentation of machine learning approaches for predicting the severity of accidents to propose the safety solutions on rural roads
Sobhana et al. A Hybrid Machine Learning Approach for Performing Predictive Analytics on Road Accidents
Vijithasena et al. Data visualization and machine learning approach for analyzing severity of road accidents
Lazar et al. Road traffic accident prediction: a driving behavior approach
Kim et al. Mining traffic accident data by subgroup discovery using combinatorial targets
Kang Data and Algorithmic Modeling Approaches in Crash Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant