CN116778715A - 一种多因素的高速交通流量智能预测方法 - Google Patents

一种多因素的高速交通流量智能预测方法 Download PDF

Info

Publication number
CN116778715A
CN116778715A CN202310794033.7A CN202310794033A CN116778715A CN 116778715 A CN116778715 A CN 116778715A CN 202310794033 A CN202310794033 A CN 202310794033A CN 116778715 A CN116778715 A CN 116778715A
Authority
CN
China
Prior art keywords
data
portal
flow
traffic flow
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310794033.7A
Other languages
English (en)
Inventor
展恩宁
朱瑞新
李超凡
侯晓旭
张航
马天明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning Gaotong Smart Travel Co ltd
Original Assignee
Liaoning Gaotong Smart Travel Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Gaotong Smart Travel Co ltd filed Critical Liaoning Gaotong Smart Travel Co ltd
Priority to CN202310794033.7A priority Critical patent/CN116778715A/zh
Publication of CN116778715A publication Critical patent/CN116778715A/zh
Pending legal-status Critical Current

Links

Abstract

本发明提出了一种多因素的高速交通流量智能预测方法,属于机器学习领域。该方法以门架历史流量为基础,综合考虑影响高速交通流量的多种因素,包括天气、节假日、周围门架距离和流量。通过拟合以上因素历史记录数据提取流量变化规律,结合各因素的实时时序变化数据预测每个门架的未来流量。本发明将机器学习应用在高速交通流量预测问题中,非常具有实际应用价值,它改变了高速流量预测复杂、实时性、准确性差的劣势,为交通拥堵和调度提供了灵活、低成本的解决方案,具有很高的经济效益和社会效益。

Description

一种多因素的高速交通流量智能预测方法
技术领域
本发明属于机器学习领域,具体涉及一种多因素的高速交通流量智能预测方法。
背景技术
随着经济的发展和人民生活水平的提高,私家车的数量随之增加,高速交通流量也不断提高。在上下班及节假日等出行高峰时刻,交通拥堵情况屡见不鲜。交通拥堵增加了通勤时间、影响驾驶人情绪,同时汽车频繁启动停止也产生了燃料浪费和排气污染。交通拥堵的解决依赖于道路拓宽、发展公共交通等,但这些方法通常从计划到完成需要较长的时间且耗费大量财力物力。交通流量预测是交通拥堵的另一种快速、低成本的解决方式,通过灵活准确的交通流量预测,有利于分析道路通行和负载情况,合理地进行交通调度和拥堵预警,从而降低交通事故率和拥堵率,提升出行效率。但交通通行情况受多种因素影响,如天气、节假日、突发事故等,使得交通流量短时预测难度较大。因此,综合考虑多因素的高精度交通流量预测方法的研究势在必行。
发明内容
为了更好的预测交通流量,本发明提出一种多因素高速交通流量预测算法,该算法在时间维度上分析了预测目标门架的历史天气、节假日及流量信息,在空间维度上分析了该门架距相邻门架的距离及流量信息,结合以上信息对流量进行精准预测。
本发明为实现上述目的所采用的技术方案是:一种多因素的高速交通流量智能预测方法,时间维度上分析待测目标门架的影响因素及流量信息,空间维度上分析该门架的邻接门架及流量信息,对未来时间节点通过该门架的车流量进行精准预测;包括以下步骤:
步骤1、采集车流量数据、影响因素数据,建立邻接门架表;
步骤2、数据处理,拼接得到门架流量及其影响因素的综合数组;
步骤3、采用有监督网络初始化网络参数,以综合数组为输入、车流量预测值oi为输出,迭代训练网络、优化网络参数;并以均方误差收敛为截止条件得到最优网络结构用于预测;
步骤4、实际采集车流量数据,输入步骤3获取的最优网络结构,自动输出车流量预测值。
所述车流量数据为每个方向每个门架设定采样时间的车流量。
所述影响因素数据包括:
天气数据:为对应各坐标位置门架对应时间日期的天气属性:温度、风速、能见度、降雨量数据;
节假日数据:为对应时间日期的节假日类型:工作日、周末、寒暑假、短假、小长假。
所述建立邻接门架表包括:
选定待观测的高速公路区域,统计域内所有门架;计算任意两门架之间的直线距离S,选取距离当前门架最近的两个门架I、II作为其邻接门架;建立该区域内所有门架的邻接门架表,表内记录两个邻接门架的编号及距离。
所述两门架之间的直线距离S计算如下:
a=lat1-lat2,b=lng1-lng2
其中,lat1和lng1分别为门架I的经纬度,lat2和lng2分别为门架II的经纬度。
所述数据处理包括:
a.将温度数据与设定值做差值取绝对值;
b.将风速数据统一至相同单位;
c.将能见度、降雨量数据归一化。
所述综合数组为:门架k在t时刻行驶方向为d的门架流量及其影响因素;
{temperature,wind_speed,visibility,rainfall,holiday,distance_1,flow_1,distance_2,flow_2,flow};其中,十个属性分别为温度、风速、能见度、降雨量、节假日数据、与门架I的距离、门架I在t时刻d方向流量、与门架II的距离、门架II在t时刻d方向流量、门架k在t时刻d方向流量。
所述有监督网络为RNN网络;
所述初始化参数包括序列长度sequence_length,每一批训练样本数据batch_size,单条数据的维度input_size,隐藏层输出的隐藏状态的维度hidden_size;
所述迭代训练为:网络每次对时间上相邻的sequence_length条数据按照如下公式进行拟合,输出预测结果oi
ht=σ(Uxt+Wht-1+b)
oi=σ(Vhsequence_length+c)
其中,参数U、V、W、b、c都是随机初始化参数;
所述预测值oi与真实值yi之间的均方误差为:
所述车流量预测为:预先采集待测门架在k时刻之前的sequence_length条d方向历史流量和天气数据,执行步骤1和步骤2进行预处理后输入最优网络结构,输出预测门架在k时刻d方向的流量预测值。
本发明具有以下有益效果及优点:
1.本发明考虑了天气对高速公路交通流量的影响,增加对应各坐标位置门架对应时间日期的温度、风速、能见度、降雨量等天气属性数据,作为影响数据,结合车流量参与预测,提升流量预测准确性。
2.本发明考虑了时间维度上历史门架流量对当下门架流量的影响,增加对应时间日期的工作日、周末、寒暑假、短假、小长假等节假日类型数据,作为影响数据,结合车流量参与预测,提升流量预测准确性。
3.本发明考虑了空间维度上门架之间距离对门架流量的影响,选定待观测的高速公路区域,统计域内所有门架;计算该区域内所有门架的邻接门架表,结合车流量参与预测,提升流量预测准确性。
附图说明
图1为本发明方法流程图;
图2为本发明实施例中门架基础数据格式;
图3为本发明实施例中通行数据格式;
图4为本发明实施例中常规流量数据折线图;
图5为本发明实施例中门架不同天气下流量折线图;
图6为本发明实施例中节假日流量折线图;
图7为本发明实施例中相邻门架流量折线图;
图8为本发明实施例中输入数据格式;
图9为本发明实施例中预测结果展示。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方法做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但本发明能够以很多不同于在此描述的其他方式来实施,本领域技术人员可以在不违背发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
除非另有定义,本文所使用的所有技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本文提出一种多因素的高速交通流量智能预测方法。该方法首先考虑影响交通流量的天气信息,包括温度、风速、能见度、降雨量等因素,并将其加入到模型训练数据中。此外,该算法在时间角度考虑了门架历史流量信息,在空间角度考虑了周围门架的距离以及流量信息,将以上时空数据共同组成多因素的训练数据。在模型的选取上,算法选用了循环神经网络,该网络能够很好地分析时序数据,提取交通流量随时间的变化规律,准确预测短时交通流量。
步骤1、数据获取。
步骤1.1流量数据获取。根据已有的交通通行数据,以门架和行驶方向为单位对数据按十分钟粒度进行聚合,获取每个方向每个门架每十分钟的车流量。
select count(traffic_record_key)as volumes from traffic_record (1)
where gantry_id=example_id and direction=example_drection
and record_time>start_time and record_time<end_time
步骤1.2天气数据获取。温度、风速、能见度、降雨量四个因素都是影响出行的重要天气因素。通过选取合适的天气接口,上传门架的坐标及日期,可以得到包含该时刻门架以上属性值的json数组。
步骤1.3节假日数据获取。节假日可分为以下几种类型:工作日、周末、寒暑假、短假、小长假,分别对应数值1-5。通过历史时间对比日历可以得到各个时刻的节假日信息。
步骤1.4相邻门架数据获取。首先以路段为基础,筛选出路段内的所有门架,根据其经纬度及公式(3)计算出任意两个门架之间的直线距离,其中lat1和lng1分别为第一个门架的经纬度,lat2和lng2分别为第二个门架的经纬度。计算完成后,选取距离每个门架最近的两个门架作为其邻接门架并建立邻接门架表,表内记录两个邻接门架的编号及距离。
a=lat1-lat2,b=lng1-lng2
其中,lat1和lng1分别为门架I的经纬度,lat2和lng2分别为门架II的经纬度。
步骤2、数据预处理。
步骤2.1天气数据预处理。步骤1.2获取了门架在某个时刻的温度、风速、能见度、降雨量信息,为了统一四个因素对流量的相关性影响,做以下处理:温度和20做差值取绝对值。如18摄氏度时,|18-20|=2;风速转换为以m/s为单位直接取值;能见度、降雨量也根据其等级归一化到0至30的范围内。其中,值越大越不利于出行,交通流量可能越低。
步骤2.2数据拼接。定义门架k在t时刻行驶方向为d(d=0或1)的综合数据格式为{temperature,wind_speed,visibility,rainfall,holiday,distance_1,flow_1,distance_2,flow_2,flow}。这十个属性分别为温度、风速、能见度、降雨量、节假日数据、和门架1的距离、门架1在t时刻d方向流量、和门架2的距离、门架2在t时刻d方向流量、门架k在t时刻d方向流量。将步骤1和步骤2.1处理后的数据按时间维度进行拼接,即获得门架流量及其影响因素数据,并命名为data。并按比例(7:2:1)分为训练集、验证集和测试集。训练集数据用于迭代训练,验证集数据用于验证模型输出是否准确,测试集数据用于测试。
步骤3、网络构建与训练。
步骤3.1网络选取与初始化。由于交通数据为时间序列数据,因此选用RNN进行预测,并对以下几个参数进行初始化:(1)sequence_length即序列长度,序列长度决定了网络在预测t时刻流量数据时,需要分析前多少分钟的历史数据。(2)batch_size即每一批训练样本数据的数据。(3)input_size即单条数据的维度。(4)hidden_size即隐藏层输出的隐藏状态的维度。
步骤3.2网络训练。网络每次对时间上相邻的sequence_length条数据进行拟合。其中,前序数据xt的特征通过隐藏状态ht向后传递。如公式4所示,sequence_length条数据中第一个时刻的数据x1与初始隐藏状态h0分别乘以系数矩阵U和W后加上偏移量b,得到第一个数据的隐藏状态h1。第二个时刻的数据与h1分别乘以相同的系数矩阵U和W、加上偏移量b后得到第二个数据的隐藏状态h2。如此不断向后计算,前序数据的特征通过隐藏状态h被不断向后传递,最后一条数据的隐藏状态hsequence_length即提取到了该时间段内所有数据的特征,hsequence_length与系数矩阵V相乘、加上偏移量c后经过非线性变换可输出预测结果oi
ht=σ(Uxt+Wht-1+b) (4)
oi=σ(Vhsequence_length+c)
由于参数U、V、W、b、c都是随机初始化,预测值oi与真实值yi之间会存在误差。选用MSE(mean squared error,均方误差)函数计算二者之间的误差值,如公式(5)所示。误差计算完成后通过反向传播对各个参数进行更新。当误差下降到阈值以内时,最终即可确定模型的参数。
步骤4、流量预测。需要预测门架在k时刻d方向的流量数据,则需获取其在k时刻之前的sequence_length条d方向历史流量和天气数据,按照步骤1和2.1、2.2进行预处理后输入网络得到流量预测值。
本发明实例中初始数据格式如图1和图2所示,两个数据表中分别记录了初始的门架数据和通行数据。
具体实施步骤如下:
步骤1.1、聚合流量数据。为方便解释,本例以上午8点为对称轴,拟合了上午6点至10点40分的流量数据。数据按照一元二次函数y=-40*x2+640*x-1960进行拟合,并添加随机波动。拟合后的流量数据如图3所示,流量在约八点左右达到峰值。在峰值前后分别呈波动上升和下降态势。
步骤1.2、获取天气数据。本步中设置基础天气数据为:温度20℃、风速3m/s、能见度25公里、降雨量为0mm/h,且天气数据在短时间内保持不变。为分析不同天气因素的影响,设置四组对照数据:极寒(气温为-10℃)、突降暴雨(降雨量20mm/h)、大风(风速13m/s)、大雾(能见度1公里)。并在基础流量数据上分别增加不同程度的偏移和干扰,作为不同天气条件下的流量数据,如图4所示。
步骤1.3、获取节假日数据。本步中设置了天气数据为步2中的基础天气数据,并设定日期为小长假,在基础流量上增加偏移和干扰作为小长假流量数据,如图5所示。
步骤1.4、相邻门架数据获取。本步中设置两个不同距离的门架,其流量分别为在基础流量数据上增加不同程度的偏移和干扰量。其中近距离门架的流量相对于基础门架的偏移量小于远距离门架,如图6所示。
步骤2、数据处理。根据步骤1.1-1.4分别生成不同条件下的流量数据,并将能见度和降雨量数据归一化到1至30的范围内。之后对数据按照{temperature,wind_speed,visibility,rainfall,holiday,distance_1,flow_1,distance_2,flow_2,flow}格式根据时间列进行拼接。如图7所示。
步骤3、建立有监督网络并训练。
步骤3.1、建立模型。设置sequence_length即模型序列长度为12,即每次预测门架t时刻的数据时需要使用其前两小时的历史数据;设置batch_size即每一批训练样本数量为128;根据输入数据的格式,设置input_size即单条数据的维度为10;设置hidden_size即隐藏层输出的隐藏状态的维度为20。
步骤3.2、训练网络。随机初始化参数矩阵后,网络对序列长度为12的数据开始进行拟合。目标函数选择MSE(均方误差函数)并进行误差反向传播。期间通过调整sequence_length、batch_size、hidden_size等获得最佳的参数组合。当误差下降到阈值以下时即可确定最终的模型,保存模型参数。
步骤4、网络预测。网络训练结束后,使用测试组数据进行预测。预测方式为,取t时刻两小时的流量数据预测t时刻的数据,取t时刻前1小时50分钟的数据和t时刻的数据预测t+10分钟时刻的数据,取t时刻前1小时40分钟的数据和t、t+10时刻的数据预测t+20时刻的数据。如此重复直至预测出t+50时刻的数据。将预测数据与原始数据进行图像比对,发现其基本符合原始数据变化规律。如图8所示。
以上说明所描述的实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变换和改进。这些都属于本发明的保护范围。

Claims (9)

1.一种多因素的高速交通流量智能预测方法,其特征在于,时间维度上分析待测目标门架的影响因素及流量信息,空间维度上分析该门架的邻接门架及流量信息,对未来时间节点通过该门架的车流量进行精准预测;包括以下步骤:
步骤1、采集车流量数据、影响因素数据,建立邻接门架表;
步骤2、数据处理,拼接得到门架流量及其影响因素的综合数组;
步骤3、采用有监督网络初始化网络参数,以综合数组为输入、车流量预测值oi为输出,迭代训练网络、优化网络参数;并以均方误差收敛为截止条件得到最优网络结构用于预测;
步骤4、实际采集车流量数据,输入步骤3获取的最优网络结构,自动输出车流量预测值。
2.根据权利要求1所述的一种多因素的高速交通流量智能预测方法,其特征在于,所述车流量数据为每个方向每个门架设定采样时间的车流量。
3.根据权利要求1所述的一种多因素的高速交通流量智能预测方法,其特征在于,所述影响因素数据包括:
天气数据:为对应各坐标位置门架对应时间日期的天气属性:温度、风速、能见度、降雨量数据;
节假日数据:为对应时间日期的节假日类型:工作日、周末、寒暑假、短假、小长假。
4.根据权利要求1所述的一种多因素的高速交通流量智能预测方法,其特征在于,所述建立邻接门架表包括:
选定待观测的高速公路区域,统计域内所有门架;计算任意两门架之间的直线距离S,选取距离当前门架最近的两个门架I、II作为其邻接门架;建立该区域内所有门架的邻接门架表,表内记录两个邻接门架的编号及距离。
5.根据权利要求4所述的一种多因素的高速交通流量智能预测方法,其特征在于,所述两门架之间的直线距离S计算如下:
a=lat1-lat2,b=lng1-lng2
其中,lat1和lng1分别为门架I的经纬度,lat2和lng2分别为门架II的经纬度。
6.根据权利要求1所述的一种多因素的高速交通流量智能预测方法,其特征在于,所述数据处理包括:
a.将温度数据与设定值做差值取绝对值;
b.将风速数据统一至相同单位;
c.将能见度、降雨量数据归一化。
7.根据权利要求1所述的一种多因素的高速交通流量智能预测方法,其特征在于,所述综合数组为:门架k在t时刻行驶方向为d的门架流量及其影响因素;
{temperature,wind_speed,visibility,rainfall,holiday,distance_1,flow_1,distance_2,flow_2,flow};其中,十个属性分别为温度、风速、能见度、降雨量、节假日数据、与门架I的距离、门架I在t时刻d方向流量、与门架II的距离、门架II在t时刻d方向流量、门架k在t时刻d方向流量。
8.根据权利要求1所述的一种多因素的高速交通流量智能预测方法,其特征在于,所述有监督网络为RNN网络;
所述初始化参数包括序列长度sequence_length,每一批训练样本数据batch_size,单条数据的维度input_size,隐藏层输出的隐藏状态的维度hidden_size;
所述迭代训练为:网络每次对时间上相邻的sequence_length条数据按照如下公式进行拟合,输出预测结果oi
ht=σ(Uxt+Wht-1+b)
oi=σ(Vhsequence_lengtg+c)
其中,参数U、V、W、b、c都是随机初始化参数;
所述预测值oi与真实值yi之间的均方误差为:
9.根据权利要求1所述的一种多因素的高速交通流量智能预测方法,其特征在于,所述车流量预测为:预先采集待测门架在k时刻之前的sequence_length条d方向历史流量和天气数据,执行步骤1和步骤2进行预处理后输入最优网络结构,输出预测门架在k时刻d方向的流量预测值。
CN202310794033.7A 2023-06-30 2023-06-30 一种多因素的高速交通流量智能预测方法 Pending CN116778715A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310794033.7A CN116778715A (zh) 2023-06-30 2023-06-30 一种多因素的高速交通流量智能预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310794033.7A CN116778715A (zh) 2023-06-30 2023-06-30 一种多因素的高速交通流量智能预测方法

Publications (1)

Publication Number Publication Date
CN116778715A true CN116778715A (zh) 2023-09-19

Family

ID=88006121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310794033.7A Pending CN116778715A (zh) 2023-06-30 2023-06-30 一种多因素的高速交通流量智能预测方法

Country Status (1)

Country Link
CN (1) CN116778715A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117408393A (zh) * 2023-12-06 2024-01-16 华中科技大学 一种异常事件下综合客运枢纽交通流量的预测方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117408393A (zh) * 2023-12-06 2024-01-16 华中科技大学 一种异常事件下综合客运枢纽交通流量的预测方法及系统
CN117408393B (zh) * 2023-12-06 2024-03-19 华中科技大学 一种异常事件下综合客运枢纽交通流量的预测方法及系统

Similar Documents

Publication Publication Date Title
CN111832225B (zh) 一种构建汽车行驶工况的方法
CN111709549B (zh) 一种基于svd-pso-lstm的短时交通流预测的导航提醒方法
CN106951976B (zh) 一种基于模式分类的公交客流预测方法
CN111539454B (zh) 一种基于元学习的车辆轨迹聚类方法及系统
CN112949828B (zh) 一种基于图学习的图卷积神经网络交通预测方法及系统
US20220260380A1 (en) System and Method for Estimating and Predicting Vehicle Trip Energy Consumption
CN113591380A (zh) 基于图高斯过程的交通流预测方法、介质及设备
CN113435658B (zh) 一种基于时空融合相关性和注意力机制的交通流预测方法
CN116778715A (zh) 一种多因素的高速交通流量智能预测方法
Arjona et al. Improving parking availability information using deep learning techniques
CN110738855A (zh) 一种数据稀疏时间段的道路交通流状况预测方法
CN113051811B (zh) 一种基于gru网络的多模式短期交通拥堵预测方法
CN114187766B (zh) 一种基于饱和率的道路服务水平评价方法
CN114202120A (zh) 一种针对多源异构数据的城市交通行程时间预测方法
CN113674524A (zh) 基于lstm-gasvr的多尺度短时交通流预测建模、预测方法及系统
Li et al. A multi-categorical probabilistic approach for short-term bike sharing usage prediction
CN113821547B (zh) 快速高效的停车场占有率短时预测方法、系统及存储介质
CN112101132B (zh) 一种基于图嵌入模型和度量学习的交通状况预测方法
CN111985731B (zh) 城市公共交通站点人数的预测方法及系统
CN117436653A (zh) 一种网约车出行需求的预测模型构建方法和预测方法
Kim et al. Data-driven parking decisions: Proposal of parking availability prediction model
CN116206451A (zh) 一种智慧交通车流数据分析方法
Origlia et al. On-line filtering of on-street parking data to improve availability predictions
CN115936242B (zh) 空气质量与交通状况的溯源关系数据获取方法及装置
CN115796030A (zh) 一种基于图卷积的交通流量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination