CN115482665B - 一种知识与数据协同驱动的多粒度交通事故预测方法及装置 - Google Patents
一种知识与数据协同驱动的多粒度交通事故预测方法及装置 Download PDFInfo
- Publication number
- CN115482665B CN115482665B CN202211109829.6A CN202211109829A CN115482665B CN 115482665 B CN115482665 B CN 115482665B CN 202211109829 A CN202211109829 A CN 202211109829A CN 115482665 B CN115482665 B CN 115482665B
- Authority
- CN
- China
- Prior art keywords
- module
- features
- data
- knowledge
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种知识与数据协同驱动的多粒度交通事故预测方法,属于交通事故预测领域,包括以下步骤:S1:对数据集进行统计和标注;S2:通过特征工程将数据集处理成可用于训练的微观数据特征和宏观知识特征;S3:输入所述微观数据特征和宏观知识特征到多粒度模型中进行训练,并保存表现最佳的模型;S4:向保存下来的模型中输入测试数据,得到未来城市交通事故的预测值。本发明提升了事故预测精度,尤其是节假日事故预测的精度。
Description
技术领域
本发明属于交通事故预测领域,涉及一种知识与数据协同驱动的多粒度交通事故预测方法及装置。
背景技术
随着现代技术发展,车流量不断增大的同时,交通事故数也呈现上升的趋势,这给公共安全和国家经济发展都造成了巨大的负面影响。如何准确的预测出未来城市的交通事故情况,帮助交管部门作出科学决策成为了交通领域的关键问题之一。
在人工智能迅速发展的时代,大量方法被运用到交通事故预测领域,这些方法可以分为三类:
1、基于传统机器学习的方法
基于传统机器学习方法的交通事故预测包括使用ARIMA模型、SVM模型对未来的事故作出预测,此类方法的优点在于能够快速作出预测而不需长时间的训练,但其存在不能拟合大量特征、精确度较低的缺点。
2、基于深度学习的方法
近年来,随着深度学习方法计算能力的不断发展,很多研究人员将其应用到交通事故预测领域,它包括使用RNN、CNN、GNN搭建深度模型并进行预测,它的优点在于能够拟合大量的特征,并能作出更为精确的预测,但解释性差及计算成本高是其难以克服的问题。
3、基于集成学习的方法
集成学习是指构建多个学习器来完成一个学习任务,被应用到事故预测领域的包括xgboost模型、GBDT模型,此类模型的优点包括简单、不需归一化,但也存在难以并行训练、不适合高维稀疏特征的缺陷。
上述的各种方法都存在一些问题:①模型都是单一的数据驱动而没有数据与知识协同驱动②提出的模型仅仅从历史信息这一个粒度来学习而没有综合考虑多个粒度的影响③节假日的事故情况和平常日期的事故情况是有很大不同的,因此除了学习预测目标以前日期的信息外,以往年份的同一节假日信息与预测目标事故情况也是有很大关联的,然而,因为以年为单位取某一天的数据会导致样本数极少,以至于以往的模型并没有考虑与预测目标同一节假日事故情况对预测目标的影响,而是将节假日标记成一个虚拟变量或者是不进行处理。这些问题都会导致预测的精度不理想,尤其是节假日的事故预测精度不理想。
发明内容
有鉴于此,本发明的目的在于提供一种知识与数据协同驱动的多粒度交通事故预测方法及装置。
为达到上述目的,本发明提供如下技术方案:
一方面,本发明提供一种知识与数据协同驱动的多粒度交通事故预测方法,包括以下步骤:
S1:对数据集进行统计和标注;
S2:通过特征工程将数据集处理成可用于训练的微观数据特征和宏观知识特征;
S3:输入所述微观数据特征和宏观知识特征到多粒度模型中进行训练,并保存表现最佳的模型;
S4:向保存下来的模型中输入测试数据,得到未来城市交通事故的预测值。
进一步,所述数据集包括事故信息、气候信息、道路利用率和领域知识;所述事故信息包括目标城市24小时内的所有事故发生地点、时间和具体情况;所述气候信息包括目标城市24小时内的天气状况、风向和温度信息;所述道路利用率为目标城市各个高速公路24小时内的道路利用率均值;所述领域知识包括当日的日历信息,当日目标城市车辆出行的限号信息、当日目标城市的购买率信息、当日目标城市的特殊事件信息;
所述对数据集标注为:对每一条数据以当日目标城市的交通事故数目作为标签。
进一步,所述微观数据特征和宏观知识特征中,数值型的数据直接作为输入,将非数值型的数据编码为数值型进行输入;所述微观数据特征包括事故特征、气候特征、道路利用率特征,其中事故特征和道路利用率特征为数值型的数据,气候特征为非数值型的数据;所述宏观知识特征包括领域知识,其中当日的日历信息,当日目标城市车辆出行的限号信息、当日目标城市的购买率信息是数值型,当日目标城市的特殊事件信息为非数值型。
进一步,所述多粒度模型包括HIM模块、CIM模块、AIM模块、SDM模块和输出层;
所述HIM模块用于根据宏观知识特征和微观数据特征学习此前按序的若干天信息对当前预测目标的影响;
所述CIM模块用于根据宏观知识特征和微观数据特征学习预测目标以前若干间隔k天的信息对预测目标的影响;
所述AIM模块用于根据宏观知识特征和微观数据特征学习预测目标的邻近日信息对当前预测目标的影响;
所述SDM模块用于根据宏观知识特征和微观数据特征学习以往年份与预测目标相同日期对预测目标的影响;
所述输出层用于将HIM模块、CIM模块、AIM模块和SDM模块的输出进行处理并输出最终结果。
进一步,所述HIM模块处理数据的具体步骤如下:
A1:输入特征先经过滑动窗口以步长为1进行处理后得到输入矩阵M∈RN×featureNum,N表示此前的天数,featureNum表示每一天的特征数;
A2:将M输入到CNN自适应地学习输入特征对预测目标的影响程度,并进行排序,将对预测目标产生更大影响的特征赋更大权重;
A3:将CNN的输出经relu激活函数进行激活:
f(x)=max(0,x)
A4:将激活后的特征输入到LSTM;
A5:设置LSTM的神经元单位为64,LSTM运算过后输出;
A6:将LSTM的输出再经过dropout处理后得到HIM模块的最终输出。
进一步,所述CIM模块处理数据的具体步骤如下:
B1:输入特征先经过滑动窗口以步长为k进行处理后得到输入矩阵M∈RN ’×featureNum,N’表示此前间隔为k的天数,featureNum表示每一天的特征数;
B2:将上述M输入到CNN自适应地学习输入特征对预测目标的影响程度,并进行排序,将对预测目标产生更大影响的特征赋更大权重;
B3:将CNN的输出经relu激活函数进行激活:
f(x)=max(0,x)
B4:将激活后的特征输入到改进的LSTM,所述改进的LSTM的门控机制处理的是t-k时间片的信息;
B5:设置LSTM的神经元单位为64,经过运算后进行输出;
B6:将改进的LSTM的输出再经过dropout处理后得到CIM模块的最终输出。
进一步,所述AIM模块处理数据的具体步骤如下:
C1:从输入特征中取出与预测目标邻近的a天得到矩阵M∈Ra×featureNum;
C2:将矩阵扁平化为一维向量V∈R1xa×featureNum;
C3:将所述一维向量输入到MLP并设最终输出维度为1,作为AIM模块的最终输出。
进一步,所述SDM模块处理数据的具体步骤如下:
D1:输入特征经过滑动窗口以步长365或者366进行处理获取到以往五年与预测目标相同日期的事故数;
D2:将处理得到的事故数序列输入到GM(1,1),通过GM(1,1)的运算,将维度为1的预测值作为该模块的输出。
进一步,所述输出层的处理步骤如下:
E1:将HIM模块和CIM模块的输出进行拼接;
E2:将拼接后的向量做全连接输出维度为1;
E3:将全连接的输出与AIM模块和SDM模块的输出再次拼接得到维度为1*3的向量;
E4:将E3得到的向量作全连接并设输出维度为1,即为最终输出。
另一方面,本发明提供一种知识与数据协同驱动的多粒度交通事故预测装置,包括数据集统计标注模块、特征工程模块、模型训练模块和交通事故预测模块;
所述数据集统计标注模块用于将原始的事故数据、气候数据、道路利用率数据、领域知识进行处理,得到目标城市按24小时为单位统计的数据,并以目标城市每日的交通事故数目作为每条数据的标签;
所述特征工程模块用于将处理过后的数据集编码成可用于学习的微观数据特征和宏观知识特征;
所述模型训练模块用于对输入的特征进行训练,设置验证loss为MSE,保存MSE最小的模型;
所述交通事故预测模块根据输入的测试数据,运行保存的最佳模型后预测出未来城市交通事故的数目。
本发明的有益效果在于:在交通事故预测任务中,将领域知识处理成特征来训练模型,用知识与数据协同驱动模型,不仅可以挖掘到数据之间的关联还能挖掘到外部知识对交通事故的影响;多粒度模型不仅学习了历史信息这一粒度,还从周期性粒度、邻近日粒度、历史节假日粒度进行全面综合的学习;尤其是在小样本条件下,以往的模型不能将历史节假日情况考虑进来,而是作为虚拟变量处理,本发明中引入的SDM模块可以在样本数很少的条件下充分的考虑到以往年份同一节假日的事故信息对预测目标的影响。通过知识与数据协同驱动的多粒度模型较以往的模型进行了更全面的学习和数据挖掘,在交通预测任务中呈现出了更精确的预测结果。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明的基本流程示意图;
图2为将数据处理成特征的流程示意图;
图3为本发明模型结构示意图;
图4为本发明的装置结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
请参阅图1~图4,为一种知识与数据协同驱动的多粒度交通事故预测方法及装置。
实施例:如图1所示,一种知识与数据协同驱动的多粒度交通事故预测方法,包括但不限于如下步骤:
步骤1、对数据集进行统计、标注。具体如下:
收集的数据集包括交通事故数据集、气候数据集、道路占用率数据集、领域知识数据集。
其中交通事故数据集中每一条指出了一次交通事故发生的时间地点信息,选定一个目标城市后,对该市每一天的事故记录条数作出统计,即可得到每一天这个城市发生的交通事故起数。
气候数据集是目标城市的气候监测站每隔六小时记录的数据,记录了当时该市的温度、气压、湿度、风向、风速、云量、天气状况、最低温度、最高温度、能见度以及露点温度,对于温度、气压、湿度、风速、云量、最低温度、最高温度、能见度以及露点温度这些数据取一天中每隔六小时记录数据的平均值作为该日的数据,而对于风向和天气状况,它们是非数值型的数据,求平均值的方式对它们不可取,因此我们使用一天中四次观测值的众数作为当天的数据。
道路占用率数据集包括了位于目标城市的207个检测器每隔五分钟记录一次的高速公路占用率数据,为将道路占用率情况聚焦到目标城市按日为单位的情况,先把每一个检测器一天中记录的288条数据求平均值,作为以日为单位该检测器检测到的道路占用率,而后在此基础上再对207个检测器取平均值作为目标城市以日为单位的道路占用率。
领域知识包括了日历信息、当日城市限号信息、当日城市购买率信息、当日城市特殊事件信息。其中日历信息指出了当日是一周中的第几天、一月中的第几天、一年中的第几天、一年中的第几个季度和一年中的第几个月;城市限号信息指出当日汽车出行限制的尾号;城市购买率信息指出了目标城市当日的市民购买率;对于特殊事件信息是指:当日目标城市是否发生了重大事件或活动;以上的几种信息属于外部知识,它们对事故的发生会起到间接的作用,因此挖掘出它们和事故之间的关系是有必要的。
最后对于每一条整理后的数据,取当天该市发生的事故起数作为其标签。
步骤2、通过特征工程将上述数据分别处理成可学习的宏观知识特征与微观数据特征。具体方法可参阅图2:
通过步骤1处理之后,微观数据及宏观知识已经聚焦到了目标城市以二十四小时为单位的信息,但微观数据中存在的风向和天气状况是字符型数据,必须将其处理成数值型,对于风向,使用0-15分别表示不同方向的风,对于天气使用0.1-0.5分别表示不同的天气状况。
另外,对于宏观知识中的特殊事件信息,使用一个虚拟变量来进行标记,若当天目标城市有特殊事件发生则将此条数据的特殊事件列标上1,否则标0。
步骤3、将处理后的特征输入到模型进行训练,模型的细节及具体实现参阅图3说明如下:
首先,模型分为四个模块,分别是针对历史粒度信息的HIM模块、针对周期粒度信息的CIM模块、针对邻近日粒度信息的AIM模块以及针对小样本条件下以往同一节假日信息的SDM模块。要预测未来某一天目标城市的交通事故,假设这一天是星期六,那么在该星期六以前若干天的历史情况都会对预测任务产生影响,HIM模块就负责学习这一粒度的信息;预测目标是星期六,那以往若干个星期六的信息对预测任务都有重要的参考意义,CIM负责学习这一粒度的信息;而与预测目标邻近的那几天可能与预测目标情况最为相似,故邻近日的信息对预测也能起到重要作用,AIM模块负责学习此邻近日对预测目标的影响;此外,若预测目标是节假日情况,那历史粒度信息、周期粒度信息以及邻近日粒度信息与其的关系可能就没有那么重大了,因为节假日的事故发生往往较平日都会突然变得更多,故不能仅学习以上三种粒度信息对目标的影响,还应该学习到以往年份的同一节假日信息对目标的影响,SDM模块即负责学习这一粒度对预测任务的影响。
其中,HIM模块由CNN和RNN组成,其基本算法流程如表1:
表1
首先是按序的历史日特征组成矩阵输入到TensorFlow的Input层,之后Inuput层的输出又作为TensorFlow中Conv1D模块的输入,设置其filter为48,步幅为1,激活函数为relu函数,此模块的输出作为64个神经单元LSTM的输入,通过LSTM运算得到64个神经单元的输出后,为防止过拟合再通过Dropout操作进行处理得到该模块的最终输出。
CIM模块的算法流程如表2:
表2
这个模块的具体实施方法与HIM模块大致相同,但是该模块学习的是预测目标以前k个间隔c天的信息对预测目标的影响,传统的LSTM学习的是t-1时刻的信息,但该模块学习的是t-cycle时刻的信息,其公式如下:
it=σ(Wiixt+bii+Whih(t-cycle)+bhi)
ft=σ(Wifxt+bif+Whfh(t-cycle)+bhf)
gt=tanh(Wigxt+big+Whgh(t-cycle)+bhg)
ot=σ(Wioxt+bio+Whoh(t-cycle)+bho)
ct=ft*c(t-cycle)+it*gt
ht=ot*tanh(ct)
此处的cycle通常设置成7,这样就能学习到此前若干周的当日对预测目标的影响。
AIM模块负责学习与预测目标邻近日期信息对预测目标的影响,其算法流程如表3:
表3
首先将输入的邻近日信息矩阵扁平化为一个向量,将向量输入到TensorFlow的Dense层,此处设置神经元单位为64,在此得到输出之后,再将其输入到神经元单位为1的Dense层,最终得到该模块的输出。
SDM模块的算法流程如表4:
表4
该模块的输入数据是以往五年同一节假日的同一天事故起数,因为以一年为单位数据量会很少,故不能使用深度学习的方式来学习这一信息,但使用GM(1,1)却可以在样本数极少的情况下作出预测。算法流程中c_ones是指往原先的矩阵中添加一列全为1的向量,np表示的是常用的数据分析工具numpy。
最后,在各个模块的共同作用下可以学习到不同粒度的信息,而整个模型的最终输出还需要将以上各个模块的输出进行整合。
首先是将HIM模块与CIM模块的输出进行拼接操作,得到一个维度为1*128的向量,将其输入到全连接层得到维度为1*1的输出。此后将上述结果与SDM模块、AIM模块的输出进行拼接操作得到1*3的向量,最后再将此向量通过全连接层得到维度是1*1的输出作为模型最终的预测值。
用损失函数MSE计算模型输出值与标签值之间的损失,并且使用Adam作为模型的优化器。最终,模型通过训练,记录并保存最佳模型参数。
步骤4、加载保存的参数并运行模型,输入相应历史数据后得到未来的城市交通事故预测值。
应用实施例:本发明选取了美国洛杉矶市作为目标城市后,按照上述具体实施例进行建模,测试结果表明了本发明的预测精度比以往的交通事故预测模型更好。本发明在该真实的实验条件下,MAPE值是7.9075,而以往的模型:LSTM模型的MAPE值是15.7245,ARIMA模型的MAPE值是14.9241,SVM模型的MAPE值是15.1861,xgboost模型的MAPE值是19.5313,CNN模型的MAPE值是17.6543,convLSTM模型的MAPE值是14.9419。
本发明实施例提供了一种交通事故预测装置,参见图4,包括以下模块:
数据集统计、标注模块:用于对原始的数据集按天进行统计,并为每一条数据按每一天的事故数目进行打标。
在一个优选实施例中,数据集统计、标注模块包括输入设备、计算设备以及存储器,其中输入设备用于将csv格式的原始数据集输入到处理器中,计算设备则是按照实施例中所述的规则对原始的数据集进行计算、统计、打标,存储器用于将计算设备处理后的数据集存储下来以备后续模块使用。
特征工程模块:用于将处理过后的数据集编码成可以用于训练与测试的宏观知识特征以及微观数据特征。
在一个优选实例中,特征工程模块包括处理器第一单元和处理器第二单元,两个处理单元并行,第一处理单元用于将数据集编码成对应的宏观知识特征,第二处理单元用于将数据集编码成对应的微观数据特征。
模型训练模块:将经过特征工程处理后的特征进行输入,调整好模型的学习率、批量大小后对模型进行训练,并保存下最佳表现的模型。
在一个优选实施例中,模型训练模块包括处理器第三处理单元、存储器以及可在处理单元上运行的计算机程序,所述处理器第三单元用于执行多粒度模型对应的计算机程序,所述存储器用于存储表现最佳的模型。
交通事故预测模块:输入事故信息的历史数据,运行存储器中的最优模型,预测出未来城市的交通事故情况。
在一个优选实施例中,交通事故预测模块包括输入设备、处理器第四单元以及输出设备,其中输入设备用于将历史信息输入到处理器第四单元,而处理器第四单元上拷贝了整套程序及最佳预测模型,输入通过处理器第四处理单元运算过后再通过输出设备得到未来城市交通事故的预测值。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (4)
1.一种知识与数据协同驱动的多粒度交通事故预测方法,其特征在于:包括以下步骤:
S1:对数据集进行统计和标注;
S2:通过特征工程将数据集处理成可用于训练的微观数据特征和宏观知识特征;所述微观数据特征包括事故特征、气候特征、道路利用率特征,其中事故特征和道路利用率特征为数值型的数据,气候特征为非数值型的数据;所述宏观知识特征包括领域知识,其中当日的日历信息,当日目标城市车辆出行的限号信息、当日目标城市的购买率信息是数值型,当日目标城市的特殊事件信息为非数值型;
S3:输入所述微观数据特征和宏观知识特征到多粒度模型中进行训练,并保存表现最佳的模型;
S4:向保存下来的模型中输入测试数据,得到未来城市交通事故的预测值;
所述多粒度模型包括HIM模块、CIM模块、AIM模块、SDM模块和输出层;
所述HIM模块用于根据宏观知识特征和微观数据特征学习此前按序的若干天信息对当前预测目标的影响;
所述CIM模块用于根据宏观知识特征和微观数据特征学习预测目标以前若干间隔k天的信息对预测目标的影响;
所述AIM模块用于根据宏观知识特征和微观数据特征学习预测目标的邻近日信息对当前预测目标的影响;
所述SDM模块用于根据宏观知识特征和微观数据特征学习以往年份与预测目标相同日期对预测目标的影响;
所述输出层用于将HIM模块、CIM模块、AIM模块和SDM模块的输出进行处理并输出最终结果;
所述HIM模块处理数据的具体步骤如下:
A1:输入特征先经过滑动窗口以步长为1进行处理后得到输入矩阵M∈RN×featureNum,N表示此前的天数,featureNum表示每一天的特征数;
A2:将M输入到CNN自适应地学习输入特征对预测目标的影响程度,并进行排序,将对预测目标产生更大影响的特征赋更大权重;
A3:将CNN的输出经relu激活函数进行激活:
f(x)=max(0,x)
A4:将激活后的特征输入到LSTM;
A5:设置LSTM的神经元单位为64,LSTM运算过后输出;
A6:将LSTM的输出再经过dropout处理后得到HIM模块的最终输出;
所述CIM模块处理数据的具体步骤如下:
B1:输入特征先经过滑动窗口以步长为k进行处理后得到输入矩阵M∈RN’×featureNum,N’表示此前间隔为k的天数,featureNum表示每一天的特征数;
B2:将上述M输入到CNN自适应地学习输入特征对预测目标的影响程度,并进行排序,将对预测目标产生更大影响的特征赋更大权重;
B3:将CNN的输出经relu激活函数进行激活:
f(x)=max(0,x)
B4:将激活后的特征输入到改进的LSTM,所述改进的LSTM的门控机制处理的是t-k时间片的信息;
B5:设置LSTM的神经元单位为64,经过运算后进行输出;
B6:将改进的LSTM的输出再经过dropout处理后得到CIM模块的最终输出;
所述AIM模块处理数据的具体步骤如下:
C1:从输入特征中取出与预测目标邻近的a天得到矩阵M∈Ra×featureNum;
C2:将矩阵扁平化为一维向量V∈R1xa×featureNum;
C3:将所述一维向量输入到MLP并设最终输出维度为1,作为AIM模块的最终输出;
所述SDM模块处理数据的具体步骤如下:
D1:输入特征经过滑动窗口以步长365或者366进行处理获取到以往五年与预测目标相同日期的事故数;
D2:将处理得到的事故数序列输入到GM(1,1),通过GM(1,1)的运算,将维度为1的预测值作为该模块的输出;
所述输出层的处理步骤如下:
E1:将HIM模块和CIM模块的输出进行拼接;
E2:将拼接后的向量做全连接输出维度为1;
E3:将全连接的输出与AIM模块和SDM模块的输出再次拼接得到维度为1*3的向量;
E4:将E3得到的向量作全连接并设输出维度为1,即为最终输出。
2.根据权利要求1所述的知识与数据协同驱动的多粒度交通事故预测方法,其特征在于:所述数据集包括事故信息、气候信息、道路利用率和领域知识;所述事故信息包括目标城市24小时内的所有事故发生地点、时间和具体情况;所述气候信息包括目标城市24小时内的天气状况、风向和温度信息;所述道路利用率为目标城市各个高速公路24小时内的道路利用率均值;所述领域知识包括当日的日历信息,当日目标城市车辆出行的限号信息、当日目标城市的购买率信息、当日目标城市的特殊事件信息;对数据集标注为:对每一条数据以当日目标城市的交通事故数目作为标签。
3.根据权利要求2所述的知识与数据协同驱动的多粒度交通事故预测方法,其特征在于:所述微观数据特征和宏观知识特征中,数值型的数据直接作为输入,将非数值型的数据编码为数值型进行输入。
4.一种知识与数据协同驱动的多粒度交通事故预测装置,其特征在于:包括数据集统计标注模块、特征工程模块、模型训练模块和交通事故预测模块;
所述数据集统计标注模块用于将原始的事故数据、气候数据、道路利用率数据、领域知识进行处理,得到目标城市按24小时为单位统计的数据,并以目标城市每日的交通事故数目作为每条数据的标签;
所述特征工程模块用于将处理过后的数据集编码成可用于学习的微观数据特征和宏观知识特征;所述微观数据特征包括事故特征、气候特征、道路利用率特征,其中事故特征和道路利用率特征为数值型的数据,气候特征为非数值型的数据;所述宏观知识特征包括领域知识,其中当日的日历信息,当日目标城市车辆出行的限号信息、当日目标城市的购买率信息是数值型,当日目标城市的特殊事件信息为非数值型;
所述模型训练模块用于输入所述微观数据特征和宏观知识特征到多粒度模型中进行训练,设置验证loss为MSE,保存MSE最小的模型;
所述交通事故预测模块根据输入的测试数据,运行保存的最佳模型后预测出未来城市交通事故的数目;
所述多粒度模型包括HIM模块、CIM模块、AIM模块、SDM模块和输出层;
所述HIM模块用于根据宏观知识特征和微观数据特征学习此前按序的若干天信息对当前预测目标的影响;
所述CIM模块用于根据宏观知识特征和微观数据特征学习预测目标以前若干间隔k天的信息对预测目标的影响;
所述AIM模块用于根据宏观知识特征和微观数据特征学习预测目标的邻近日信息对当前预测目标的影响;
所述SDM模块用于根据宏观知识特征和微观数据特征学习以往年份与预测目标相同日期对预测目标的影响;
所述输出层用于将HIM模块、CIM模块、AIM模块和SDM模块的输出进行处理并输出最终结果;
所述HIM模块处理数据的具体步骤如下:
A1:输入特征先经过滑动窗口以步长为1进行处理后得到输入矩阵M∈RN×featureNum,N表示此前的天数,featureNum表示每一天的特征数;
A2:将M输入到CNN自适应地学习输入特征对预测目标的影响程度,并进行排序,将对预测目标产生更大影响的特征赋更大权重;
A3:将CNN的输出经relu激活函数进行激活:
f(x)=max(0,x)
A4:将激活后的特征输入到LSTM;
A5:设置LSTM的神经元单位为64,LSTM运算过后输出;
A6:将LSTM的输出再经过dropout处理后得到HIM模块的最终输出;
所述CIM模块处理数据的具体步骤如下:
B1:输入特征先经过滑动窗口以步长为k进行处理后得到输入矩阵M∈RN’×featureNum,N’表示此前间隔为k的天数,featureNum表示每一天的特征数;
B2:将上述M输入到CNN自适应地学习输入特征对预测目标的影响程度,并进行排序,将对预测目标产生更大影响的特征赋更大权重;
B3:将CNN的输出经relu激活函数进行激活:
f(x)=max(0,x)
B4:将激活后的特征输入到改进的LSTM,所述改进的LSTM的门控机制处理的是t-k时间片的信息;
B5:设置LSTM的神经元单位为64,经过运算后进行输出;
B6:将改进的LSTM的输出再经过dropout处理后得到CIM模块的最终输出;
所述AIM模块处理数据的具体步骤如下:
C1:从输入特征中取出与预测目标邻近的a天得到矩阵M∈Ra×featureNum;
C2:将矩阵扁平化为一维向量V∈R1xa×featureNum;
C3:将所述一维向量输入到MLP并设最终输出维度为1,作为AIM模块的最终输出;
所述SDM模块处理数据的具体步骤如下:
D1:输入特征经过滑动窗口以步长365或者366进行处理获取到以往五年与预测目标相同日期的事故数;
D2:将处理得到的事故数序列输入到GM(1,1),通过GM(1,1)的运算,将维度为1的预测值作为该模块的输出;
所述输出层的处理步骤如下:
E1:将HIM模块和CIM模块的输出进行拼接;
E2:将拼接后的向量做全连接输出维度为1;
E3:将全连接的输出与AIM模块和SDM模块的输出再次拼接得到维度为1*3的向量;
E4:将E3得到的向量作全连接并设输出维度为1,即为最终输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211109829.6A CN115482665B (zh) | 2022-09-13 | 2022-09-13 | 一种知识与数据协同驱动的多粒度交通事故预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211109829.6A CN115482665B (zh) | 2022-09-13 | 2022-09-13 | 一种知识与数据协同驱动的多粒度交通事故预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115482665A CN115482665A (zh) | 2022-12-16 |
CN115482665B true CN115482665B (zh) | 2023-09-15 |
Family
ID=84393082
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211109829.6A Active CN115482665B (zh) | 2022-09-13 | 2022-09-13 | 一种知识与数据协同驱动的多粒度交通事故预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115482665B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227714B (zh) * | 2023-03-14 | 2023-10-27 | 西华大学 | 一种出行方式选择预测与分析方法和系统 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109117987A (zh) * | 2018-07-18 | 2019-01-01 | 厦门大学 | 基于深度学习的个性化交通事故风险预测推荐方法 |
CN109993970A (zh) * | 2019-03-15 | 2019-07-09 | 西南交通大学 | 一种城市区域交通事故风险预测方法 |
CN111488739A (zh) * | 2020-03-17 | 2020-08-04 | 天津大学 | 基于多粒度生成图像增强表示的隐式篇章关系识别方法 |
CN111626518A (zh) * | 2020-05-29 | 2020-09-04 | 上海交通大学 | 基于深度学习神经网络的城市天级需水量在线预测方法 |
CN111680446A (zh) * | 2020-01-11 | 2020-09-18 | 哈尔滨理工大学 | 一种基于改进多粒度级联森林的滚动轴承剩余寿命预测方法 |
CN112418696A (zh) * | 2020-11-27 | 2021-02-26 | 北京工业大学 | 城市交通动态知识图谱的构建方法及装置 |
CN113051811A (zh) * | 2021-03-16 | 2021-06-29 | 重庆邮电大学 | 一种基于gru网络的多模式短期交通拥堵预测方法 |
CN113222218A (zh) * | 2021-04-16 | 2021-08-06 | 浙江工业大学 | 基于卷积长短时记忆神经网络的交通事故风险预测方法 |
CN113312914A (zh) * | 2021-04-30 | 2021-08-27 | 西安理工大学 | 一种基于预训练模型的安全事件实体识别方法 |
CN113821875A (zh) * | 2021-09-26 | 2021-12-21 | 湖南大学 | 一个基于端云协同的智能车辆故障实时预测方法及系统 |
CN114118225A (zh) * | 2021-11-02 | 2022-03-01 | 苏州热工研究院有限公司 | 发电机剩余寿命预测方法、系统、电子设备和存储介质 |
CN114648217A (zh) * | 2022-03-17 | 2022-06-21 | 重庆邮电大学 | 一种基于增量式极限学习机的煤矿安全风险预警方法 |
CN114925856A (zh) * | 2022-05-27 | 2022-08-19 | 中国人民解放军国防科技大学 | 一种多粒度感知集成学习方法、装置、计算机设备和介质 |
CN115033670A (zh) * | 2022-06-02 | 2022-09-09 | 西安电子科技大学 | 多粒度特征融合的跨模态图文检索方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11151166B2 (en) * | 2019-07-03 | 2021-10-19 | Microsoft Technology Licensing, Llc | Context-based multi-granularity intent discovery |
-
2022
- 2022-09-13 CN CN202211109829.6A patent/CN115482665B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109117987A (zh) * | 2018-07-18 | 2019-01-01 | 厦门大学 | 基于深度学习的个性化交通事故风险预测推荐方法 |
CN109993970A (zh) * | 2019-03-15 | 2019-07-09 | 西南交通大学 | 一种城市区域交通事故风险预测方法 |
CN111680446A (zh) * | 2020-01-11 | 2020-09-18 | 哈尔滨理工大学 | 一种基于改进多粒度级联森林的滚动轴承剩余寿命预测方法 |
CN111488739A (zh) * | 2020-03-17 | 2020-08-04 | 天津大学 | 基于多粒度生成图像增强表示的隐式篇章关系识别方法 |
CN111626518A (zh) * | 2020-05-29 | 2020-09-04 | 上海交通大学 | 基于深度学习神经网络的城市天级需水量在线预测方法 |
CN112418696A (zh) * | 2020-11-27 | 2021-02-26 | 北京工业大学 | 城市交通动态知识图谱的构建方法及装置 |
CN113051811A (zh) * | 2021-03-16 | 2021-06-29 | 重庆邮电大学 | 一种基于gru网络的多模式短期交通拥堵预测方法 |
CN113222218A (zh) * | 2021-04-16 | 2021-08-06 | 浙江工业大学 | 基于卷积长短时记忆神经网络的交通事故风险预测方法 |
CN113312914A (zh) * | 2021-04-30 | 2021-08-27 | 西安理工大学 | 一种基于预训练模型的安全事件实体识别方法 |
CN113821875A (zh) * | 2021-09-26 | 2021-12-21 | 湖南大学 | 一个基于端云协同的智能车辆故障实时预测方法及系统 |
CN114118225A (zh) * | 2021-11-02 | 2022-03-01 | 苏州热工研究院有限公司 | 发电机剩余寿命预测方法、系统、电子设备和存储介质 |
CN114648217A (zh) * | 2022-03-17 | 2022-06-21 | 重庆邮电大学 | 一种基于增量式极限学习机的煤矿安全风险预警方法 |
CN114925856A (zh) * | 2022-05-27 | 2022-08-19 | 中国人民解放军国防科技大学 | 一种多粒度感知集成学习方法、装置、计算机设备和介质 |
CN115033670A (zh) * | 2022-06-02 | 2022-09-09 | 西安电子科技大学 | 多粒度特征融合的跨模态图文检索方法 |
Non-Patent Citations (4)
Title |
---|
S&I Reader: Multi-Granularity Gated Multi-Hop Skimming and Intensive Reading Model for Machine Reading Comprehension;Yong Wang等;《IEEE Access》;75778-75788 * |
基于云模型的煤矿安全大数据多粒度表示方法及应用;张磊;《中国优秀硕士学位论文全文数据库工程科技Ⅰ辑》(第3期);B021-551 * |
社交网络国民安全突发事件动态画像、演进规律发现与预测;陈剑南;《中国优秀硕士学位论文全文数据库 社会科学Ⅰ辑》(第5期);G113-6 * |
高速公路网交通流运行态势评估技术研究;李琳;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》(第1期);C034-611 * |
Also Published As
Publication number | Publication date |
---|---|
CN115482665A (zh) | 2022-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dong et al. | Characterizing driving styles with deep learning | |
Zheng et al. | Investigation of model ensemble for fine-grained air quality prediction | |
CN110276439A (zh) | 基于注意力机制的时间序列预测方法、装置及存储介质 | |
Li et al. | Graph CNNs for urban traffic passenger flows prediction | |
Lai et al. | Prediction stock price based on different index factors using LSTM | |
CN109920248B (zh) | 一种基于gru神经网络的公交到站时间预测方法 | |
CN110675632B (zh) | 针对多特征空间和数据稀疏的车辆短时轨迹预测控制方法 | |
CN115482665B (zh) | 一种知识与数据协同驱动的多粒度交通事故预测方法及装置 | |
CN108665093A (zh) | 基于深度学习的高速公路交通事故严重度预测方法 | |
Wei et al. | Driver Lane‐Changing Behavior Prediction Based on Deep Learning | |
Li et al. | Parking demand forecasting based on improved complete ensemble empirical mode decomposition and GRU model | |
Wu | Deep learning with improved metaheuristic optimization for traffic flow prediction | |
Liu et al. | Explanatory prediction of traffic congestion propagation mode: A self-attention based approach | |
Fu et al. | A hybrid neural network for driving behavior risk prediction based on distracted driving behavior data | |
CN114582128A (zh) | 基于图离散注意力网络的交通流预测方法、介质及设备 | |
CN116432810A (zh) | 交通流预测模型确定方法、设备、装置及可读存储介质 | |
CN116153125A (zh) | 一种基于ida-rnn模型的空间维度公交到达时间预测方法 | |
Lu et al. | Efficient deep learning based method for multi‐lane speed forecasting: a case study in Beijing | |
Al-Tameemi et al. | Predictive learning analytics in higher education: Factors, methods and challenges | |
Alhaek et al. | Learning spatial patterns and temporal dependencies for traffic accident severity prediction: A deep learning approach | |
Sadon et al. | Long short-term vs gated recurrent unit recurrent neural network for google stock price prediction | |
Zhang et al. | Comparative analysis of deep-learning-based models for hourly bus passenger flow forecasting | |
CN112651577B (zh) | 一种基于融合时空数据的隧道形变预测方法 | |
Lin et al. | Network-wide multi-step traffic volume prediction using graph convolutional gated recurrent neural network | |
Duval et al. | Telematics combined actuarial neural networks for cross-sectional and longitudinal claim count data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |