CN118155423A - 基于时间序列模型的节假日长期交通态势预测方法及设备 - Google Patents

基于时间序列模型的节假日长期交通态势预测方法及设备 Download PDF

Info

Publication number
CN118155423A
CN118155423A CN202410560112.6A CN202410560112A CN118155423A CN 118155423 A CN118155423 A CN 118155423A CN 202410560112 A CN202410560112 A CN 202410560112A CN 118155423 A CN118155423 A CN 118155423A
Authority
CN
China
Prior art keywords
data
holiday
long
term
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410560112.6A
Other languages
English (en)
Inventor
李晓春
黄丹阳
易术
熊一洁
罗易智
罗超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Intelligent Transportation System Management Co ltd
Original Assignee
Sichuan Intelligent Transportation System Management Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Intelligent Transportation System Management Co ltd filed Critical Sichuan Intelligent Transportation System Management Co ltd
Priority to CN202410560112.6A priority Critical patent/CN118155423A/zh
Publication of CN118155423A publication Critical patent/CN118155423A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本发明涉及交通信息分析领域,特别是一种基于时间序列模型的节假日长期交通态势预测方法及设备。本发明考虑重大事件的发生对路网节假日交通流量的影响,建立了一种基于SARIMAX(具有外生变量的季节性自回归移动平滑)模型的节假日长期交通态势预测模型,引入了疫情影响因子和考虑趋势项权重的指数衰减函数因子,并考虑天气(降水量、能见度、天气状况)数据的影响,以提高交通流预测的准确性和可靠性。预测结果分为路网流量长期预测结果和路段流量长期预测结果,以便为道路管理者提供更便利更有效的决策支持。

Description

基于时间序列模型的节假日长期交通态势预测方法及设备
技术领域
本发明涉及交通信息分析领域,特别是一种基于时间序列模型的节假日长期交通态势预测方法及设备。
背景技术
随着科技发展,汽车交通运输愈加便利,现有人均汽车的占有量和出行量随着人们生活水平的不断提高而逐渐增加,最终导致道路上出现密集的交通流甚至导致交通拥堵等问题;因此,为了解决道路交通量过载而导致的交通资源分配问题,以及充分发挥智慧交通系统在道路调控上的积极作用,道路交通流的预测方法在交通领域是重要的研究方向。而节假日(包括国定节假日以及国定节假日的前后一天)的日交通流状况常常与非节假日的日交通流状况存在不小的差异,因此捕捉交通流参数与节假日之间的相关性具有显著意义,然而,近年来,大多数关于交通流预测的研究只是基于简单的时间序列方法,并不考虑交通流参数与节假日之间的关系,此外,节假日的日交通流状况与非节假日的日交通流状况也并非一定存在明显的差异,节假日的日交通流状况与非节假日的日交通流状况也有非常相似的可能,目前的研究也缺乏对这一点的考虑。
目前,节假日的交通流预测存在以下难点:
数据处理难度:由于交通流数据量大、维度高,如何高效地筛选、预处理和组织这些数据成为一个挑战。特别是在高流量的时间段,数据量会非常大,如何快速处理这些数据并提取关键信息是一个难题。
模型选择困境:在众多的时间序列预测模型中,如何选择最适合交通流数据的模型是一个难题。不同的模型可能适用于不同的数据特征和预测场景,因此需要进行深入研究和对比分析。
特征提取困难:在考虑影响交通流的各种因素时,如何准确地提取和选择与流量密切相关的特征是一个挑战。例如,天气因素对交通流的影响程度是不同的,如何确定哪些天气因素是关键的影响因素是一个难题。
预测精度提升困难:提高交通流的预测精度是技术方案的一个重要目标,但如何实现这一目标也是一个挑战。例如,如何确定最佳的预测窗口长度、如何处理异常数据等都是需要解决的问题。
总而言之,通过前期数据调研,进行节假日长期交通流预测的相关数据检测点位多、空间范围广,在算力有限情况下的实时预测需要借助空间降维技术。同时,部分数据可用性较差(如细分路段速度、事故事件记录),这要求预测模型能够不依赖相关信息给出可靠预测。对于节假日交通流长期预测,还面临可用历史数据稀缺的问题,这限制了预测模型的复杂性。
因此,如今需要一种能处理效率更高,可靠性更强的基于时间序列模型的节假日长期交通态势预测模型,以提高节假日道路通行能力和解决动态拥堵问题。
发明内容
本发明的目的在于克服现有技术中所存在的精度不足、输入数据要求高以及训练时间长的问题,提供一种基于时间序列模型的节假日长期交通态势预测方法及设备。
为了实现上述发明目的,本发明提供了以下技术方案:
一种基于时间序列模型的节假日长期交通态势预测方法,包括以下步骤:
a:获取待预测区域的检测数据;所述检测数据包括交通数据信息以及路网天气数据;
b:将所述检测数据输入到预构筑的节假日交通流长期预测模型;
c:输出所述待预测区域的长期交通态势预测结果;所述长期交通态势预测结果包括路网流量长期预测结果以及路段流量长期预测结果;
具体的,所述节假日交通流长期预测模型采用SARIMAX模型架构,其预构筑包括以下步骤:
S1:获取历史检测数据,对其进行预处理后生成训练样本集;
S2:构建节假日交通流长期预测模型,通过所述训练样本集对其进行模型训练,待模型收敛后输出所述节假日交通流长期预测模型。
作为本发明的优选方案,所述S1包括:
S11:获取历史检测数据;
S12:对所述历史检测数据进行数据筛选;所述数据筛选为筛除数据源初始年份少于预设值的数据源对应的数据信息;
S13:对数据筛选后的所述历史检测数据进行数据审核,并根据审核结果进行数据修复或删除;
S14:对数据审核后的所述历史检测数据进行数据组织,输出数据矩阵;所述数据组织为判断所述历史检测数据对应的节假日名称及年份,并将所述历史检测数据存为以节假日名称和年份为坐标的数据矩阵;
S15:对所述数据矩阵进行重采样,存储为预设时间间隔的数据矩阵;
S16:对重采样后的所述数据矩阵进行归一化处理,输出为归一化后的数据矩阵;
S17:根据归一化后的所述数据矩阵生成训练样本集;所述训练样本集包括训练集、测试集以及验证集,其数据比例为预设值。
作为本发明的优选方案,所述数据审核包括完整性审核、准确性审核以及数据检验;
所述完整性审核为审核历史检测数据是否存在缺失;
若存在缺失,则根据数据的缺失程度进行补充;
具体的,当缺失程度不超过预设时间长度时,对应缺失数据通过前后数据的平均值与历史平均值的均值进行填充;
当缺失程度超过预设时间长度时,对应缺失数据通过历史平均值进行填充;
所述准确性审核为审核历史检测数据的统计指标是否偏离预设的范围;所述统计指标包括平均值、标准差、最大值、最小值;
若偏离,则对应的历史检测数据存在准确性缺陷,根据偏离程度进行修复或删除数据;
所述数据检验为对历史检测数据进行白噪声检验、平稳性ADF检验以及差分处理;所述白噪声检验采用Ljung-Box算法,如果p-value小于阈值水平,则判定当前历史检测数据为非白噪声序列,有意义;否则判定当前历史检测数据为白噪声序列,无意义,并删除当前历史检测数据;所述平稳性ADF检验用于判断历史检测数据的平稳程度;所述差分处理根据历史检测数据的平稳程度进行差分和季节性差分。
作为本发明的优选方案,所述归一化处理采用最小—最大归一化方法,其表达式为:
其中,xstd为归一化后的数据,xi为所述数据矩阵第i个数据,xmin为序列中的最小值,xmax为序列中的最大值。
作为本发明的优选方案,所述历史检测数据中的路网天气数据还包括采用Pearson相关系数法进行相关性分析处理;所述Pearson相关系数法的表达式为:
其中,相关系数r满足|r|≤1,xi为天气数据,yi为流量数据,,/>分别表示均值。
作为本发明的优选方案,所述S2中所述训练样本集还包括包括以下处理步骤:
S21:为所述训练样本集内的训练样本设置考虑趋势性的距离权重数组;所述距离权重数组与训练样本距离当前时间的靠近程度成正比;
S22:将所述训练样本集中的路网天气数据与所述距离权重数组进行拼接,得到拼接后的训练样本集;
S23:对拼接后的所述训练样本集进行归一化处理;所述归一化处理采用最小—最大归一化方法。
作为本发明的优选方案,所述节假日交通流长期预测模型还包括影响因子修正,包括以下步骤:
获取受影响时间段的历史检测数据,将所述历史检测数据导入所述节假日交通流长期预测模型进行预测,得到预测值;
根据预测值与真实值,计算线性回归的斜率和截距,将其作为影响因子;
输入待预测的目标数据,将预测结果乘以影响因子中的斜率后加上截距,得到修正后的目标数据预测结果。
作为本发明的优选方案,所述节假日交通流长期预测模型的预构筑还包括S3;
S3:通过预设的评价函数对所述节假日交通流长期预测模型进行验证,当评价指标不满足阈值要求时返回S2进行模型训练,直至评价指标满足阈值要求。
作为本发明的优选方案,所述评价函数包括均方误差、均方根误差、平均绝对误差以及决定系数,其计算公式如下所示:
均方误差MSN的表达式为:
均方根误差RMSE的表达式为:
平均绝对误差MAE的表达式为:
决定系数R2的表达式为:
其中,m为数据量,yi为实际值,为预测值,/>为yi的均值。
一种基于时间序列模型的节假日长期交通态势预测设备,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一项所述的方法。
与现有技术相比,本发明的有益效果:
本发明通过优化数据处理流程,提高处理效率;通过选择SARIMAX模型,适应复杂交通状况;利用Pearson相关性分析方法进行特征选择,准确反映影响交通流的关键因素;结合一次整体预测和滚动预测方式,提高预测精度;同时,采用均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R2)等评价指标进行模型验证,确保预测结果的可靠性,为道路管理者提供更有效的决策支持。
附图说明
图1为本发明实施例1所述的一种基于时间序列模型的节假日长期交通态势预测方法的流程示意图;
图2为本发明实施例2所述的一种基于时间序列模型的节假日长期交通态势预测方法中节假日交通流长期预测模型的构筑流程示意图;
图3为本发明实施例3所述的一种基于时间序列模型的节假日长期交通态势预测方法中成都市路网流量预测结果;
图4为本发明实施例3所述的一种基于时间序列模型的节假日长期交通态势预测方法中乐山市路网流量预测结果;
图5为本发明实施例4所述的一种利用了实施例1所述的一种基于时间序列模型的节假日长期交通态势预测方法的一种基于时间序列模型的节假日长期交通态势预测设备的结构示意图。
具体实施方式
下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
实施例1
如图1所示,一种基于时间序列模型的节假日长期交通态势预测方法,包括以下步骤:
a:获取待预测区域的检测数据;所述检测数据包括交通数据信息以及路网天气数据。
b:将所述检测数据输入到预构筑的节假日交通流长期预测模型。
数据处理流程:采用预构筑的节假日交通流长期预测模型,考虑季节性因素、自回归因素、滞后因素以及外部天气影响因素,预测节假日流量的变化。
c:输出所述待预测区域的长期交通态势预测结果;所述长期交通态势预测结果包括路网流量长期预测结果以及路段流量长期预测结果。
路网流量长期预测结果:一、路网总流量、日流量、小时流量;二、路网地市州流;三、重点区域流量排名:景区收费站流量、常发拥堵收费站流量以及常发拥堵收费站流量;四、景区增长流量排名;五、景区节假日特征变化等几大部分。
路段流量长期预测结果:一、所有管辖路段总流量;二、段内收费站流量预测;三、路段断面交通流量分析-门架;四、路段拥堵概率分析等几大部分。
另外,所述长期交通态势预测结果还可以作为后期处理拥堵区域预测时的数据输入,便于得到拥堵预测信息。
由于时间序列模型具有建模简单、实用性强等优点,预测精度依赖样本质量。实际中交通状况复杂多变,我们无法保证采集到的交通流数据是平稳序列,时间序列模型中的SARIMAX 模型,相较于 AR 模型和 MA 模型能更好的处理非平稳序列,适应更多样的交通状况,相较于ARIMA模型能够考虑交通数据的周期性,和多种因素对交通流量的影响。且本研究中采用的交通流量数据质量良好、时间跨度较大(时间间隔为1h),因而本发明选用SARIMAX 模型进行分析。即所述节假日交通流长期预测模型采用SARIMAX模型架构,其预构筑包括以下步骤:
S1:获取历史检测数据,对其进行预处理后生成训练样本集。
S2:构建节假日交通流长期预测模型,通过所述训练样本集对其进行模型训练,待模型收敛后输出所述节假日交通流长期预测模型。
实施例2
本实施例为实施例1所述节假日交通流长期预测模型的一种具体构筑方式,如图2所示,包括以下步骤:
S1:获取历史检测数据,对其进行预处理后生成训练样本集。所述历史检测数据包括交通数据信息以及路网天气数据。
所述交通数据信息具体包括:某省份高速公路网收费站出入口、ETC门架的基础数据和历史节假日(元旦、春节、元宵节、清明节、劳动节、端午节、中秋节、国庆节)交通流量数据。
将采集到的1min时间间隔的交通流量数据根据输入需求集计为以1h为间隔的流量数据,路网天气数据(包括天气状况、能见度以及降水量)同样集计为以1h为间隔的的数据。
其中,部分数据的基本形式如下:
表1 门架数据组织形式
表2 收费站数据组织形式
时间戳(1h) 收费站名称 收费站代码 流量 桩号 经度 纬度 行政区划名称 行政区划代码
datetime string string int float float float string string
管辖路段名称 管辖路段代码 车道数量 出入网方向 出入网代码 降水量 能见度 天气状况
string string float string string float float string
数据预处理过程主要包含数据筛选、数据审核和数据组织三个流程。在使用数据前,需要对数据进行筛选工作,尽可能保证数据的真实性、完整性和有效性,若使用的数据与真实情况数据的误差较大、缺失的数据量过大都可能影响建立模型过程的可行性和所建立模型的有效性。而对于原始数据主要从完整性和准确性两个方面去审核。完整性审核主要是检查数据是否存在遗漏,所有的数据是否填写齐全,主要查看数据是否存在缺失和空值,若存在空值可以根据数据具体情况选择赋值或删除,若存在缺失值,需根据数据的缺失程度和对整体数据的影响程度选择补充或删除。准确性审核主要是包括两个方面:一是检查数据资料是否真实地反映了客观实际情况,内容是否符合实际;二是检查数据是否有错误,计算是否正确等,主要根据数据数值的平均值和最值等和数据的实际意义,检验数据是否存在异常情况,根据分析结果修复或删除数据。数据组织是将处理后的数据根据性质规律等特点组织为具有一定形式的矩阵,如按时间先后顺序或周期特点对特征数据和标签数据进行有目的的排列,其中特征数据是输入变量,其对输出变量具有一定的影响,如简单线性回归中的 x 变量。标签数据是要预测的数据,如简单线性回归中的 y 变量。
S11:获取历史检测数据。
其中,所述历史检测数据中的路网天气数据还包括采用Pearson相关系数法进行相关性分析处理;该步骤是为了进一步分析天气因素对交通流的影响程度,选取合适的天气参数进行研究,利用提供的雨、雪天气1h降水量、能见度、风速、温度、天气状况5种天气因素,基于Pearson相关系数法对交通流与天气参数进行相关性分析。所述Pearson相关系数法的表达式为:
其中,相关系数r满足|r|≤1,xi为天气数据,yi为流量数据,,/>分别表示均值。|r|越接近1,则表明x与y线性相关程度越高。若r=-1,表明x与y之间为完全负线性相关关系;若 r=+1,表明x与y之间为完全正线性相关关系;若r=0,表明两者不存在线性相关关系。根据p值(Pearson相关系数值)选择天气特征作为交通流长期预测模型的外生变量。
S12:对所述历史检测数据进行数据筛选;所述数据筛选为筛除数据源初始年份少于预设值的数据源对应的数据信息;本实施例对历史数据集少于2年的门架或收费站数据进行筛选。
S13:对数据筛选后的所述历史检测数据进行数据审核,并根据审核结果进行数据修复或删除。
所述数据审核包括完整性审核、准确性审核以及数据检验;
所述完整性审核为审核历史检测数据是否存在缺失和空值;
若存在缺失,则根据数据的缺失程度进行补充;
具体的,当缺失程度不超过预设时间长度(本实施例采用3小时)时,对应缺失数据通过前后数据的平均值与历史平均值的均值进行填充;
当缺失程度超过预设时间长度时,对应缺失数据通过历史平均值进行填充。
所述准确性审核为审核历史检测数据的统计指标是否偏离预设的范围;如果某个指标明显偏离正常范围,可能存在异常情况。所述统计指标包括平均值、标准差、最大值、最小值;
若偏离,则对应的历史检测数据存在准确性缺陷,根据偏离程度进行修复或删除数据;
所述数据检验为对历史检测数据进行白噪声检验、平稳性ADF检验以及差分处理;所述白噪声检验采用Ljung-Box算法,如果p-value小于阈值水平,则判定当前历史检测数据为非白噪声序列,有意义;否则判定当前历史检测数据为白噪声序列,无意义,并删除当前历史检测数据;所述平稳性ADF检验用于判断历史检测数据的平稳程度;所述差分处理根据历史检测数据的平稳程度进行差分和季节性差分。
S14:对数据审核后的所述历史检测数据进行数据组织,输出数据矩阵;所述数据组织为判断所述历史检测数据对应的节假日名称及年份,并将所述历史检测数据存为以节假日名称和年份为坐标的数据矩阵;即判断节假日的名称及年份,生成该节假日预测年份的一系列时间坐标。
S15:对所述数据矩阵进行重采样,存储为预设时间间隔的数据矩阵。
S16:对重采样后的所述数据矩阵进行归一化处理,输出为归一化后的数据矩阵。
考虑到数据归一化后的处理会提高模型精度,并增大模型训练速度,因此按列对数据进行归一化处理。采用“最小—最大归一化”方法,利用数据列中的最小值和最大值进行标准化处理,将数值区间变换至[0,1],可以消除量纲和数据取值范围的影响,且仍保留原来数据中存在的相对关系。其表达式为:
其中,xstd为归一化后的数据,xi为所述数据矩阵第i个数据,xmin为序列中的最小值,xmax为序列中的最大值。
S17:根据归一化后的所述数据矩阵生成训练样本集;所述训练样本集包括训练集、测试集以及验证集,其数据比例为预设值。
S2:构建节假日交通流长期预测模型,通过所述训练样本集对其进行模型训练,待模型收敛后输出所述节假日交通流长期预测模型。
其中,所述训练样本集还包括包括以下处理步骤:
S21:为所述训练样本集内的训练样本设置考虑趋势性的距离权重数组;所述距离权重数组与训练样本距离当前时间的靠近程度成正比。
考虑到历史数据的波动性尤其是重大事件(如疫情)对预测年份流量的影响,考虑采用流量趋势性权重,即对近期年份的流量赋予较大的权重,权重的确定使用指数衰减距离权重函数,以提高流量预测的准确性。
S22:将所述训练样本集中的路网天气数据与所述距离权重数组进行拼接,得到拼接后的训练样本集;
S23:对拼接后的所述训练样本集进行归一化处理;所述归一化处理采用最小—最大归一化方法。
在模型构建中,采用“多对一”的结构,将天气状况作为外生变量输入到SARIMAX模型中,预测时仍需要未来的天气状况作为输入得到未来交通流状态。
一次整体预测是对未来一段时间内的整体趋势进行预测,可使管理者提前几个月得知节假日流量的整体趋势。故本项目采用一次整体预测的预测方式。采用SARIMAX模型,考虑季节性因素、自回归因素、滞后因素以及外部天气影响因素,预测节假日流量的变化。针对历史数据集包含疫情期间交通流数据的情况,添加疫情影响因子,并修正夜间的预测值;同时考虑了流量趋势性权重影响,对近期年份的流量赋予较高权重,以优化模型,提高预测结果的准确性。
本发明所述的方法基于高速路网运行的ETC门架、收费站、细分路段基础数据,通过历史交通流量数据以及路网天气数据,采用SARIMAX模型,对法定节假日(元旦、春节、清明节、劳动节、端午节、中秋节、国庆节)分别进行交通流长期预测。采用Pearson相关性分析方法分析雨、雪天气1h降水量、能见度、风速、温度、天气状况与流量的相关性,选择相关性较强特征作为外生变量以提高SARIMAX模型预测精度,最终得到路网交通流点位周期性预测结果。
实施例4
本实施例与实施例2的区别在于,所述节假日交通流长期预测模型还包括影响因子修正,包括以下步骤:
获取受影响时间段的历史检测数据,将所述历史检测数据导入所述节假日交通流长期预测模型进行预测,得到预测值;
根据相同特征节假日的预测值与真实值,计算线性回归的斜率和截距,将其作为影响因子;
输入待预测的目标数据,将预测结果乘以影响因子中的斜率后加上截距,得到修正后的目标数据预测结果。
由于交通流受各种大事件影响较大(例如疫情以及自然灾害等),因此本实施例加入了影响因子的修正操作。如疫情影响因子:
由于历史数据集包含疫情期间的交通流数据,而疫情期间交通流数据对预测效果有着显著的影响。在疫情期间,人们的出行行为发生了很大改变,包括限制出行、封锁措施、社交距离等限制措施的实施,这导致了交通流量的明显下降。这使得传统的交通流模型难以准确预测交通流量。因此,需要针对交通流数据的变化对交通预测模型进行调整和优化,以提高预测结果的准确性。
模型添加了疫情影响因子,利用以往类似的其他节假日计算疫情因子,将其他节假日的直接预测流量和真实流量进行对比,采用最小二乘法得到疫情影响因子,再应用到需要预测的目标节假日数据上,最终完成基于线性回归的疫情因子修正。
由于疫情期间夜间的交通流量与疫情后差异性不大,疫情因子修正后可能导致预测结果的夜间流量偏高,因此,算法将预测结果与原始数据进行对比,对特定时间段(夜间)的数据不进行疫情因子修正,直接使用原始的目标数据预测结果。
实施例4
本实施例与上述实施例的区别在于,所述节假日交通流长期预测模型的预构筑还包括S3。
S3:通过预设的评价函数对所述节假日交通流长期预测模型进行验证,当评价指标低于阈值时返回S2进行模型训练,直至评价指标不低于阈值。
完成模型构建后,需要选择合适的模型评价指标对模型进行验证,对于预测问题,主要的评价指标有均方误差(Mean Squared Error,MSE)、均方根误差(RootMean SquaredError,RMSE)、平均绝对误差(Mean Absolute Error,MAE)、决定系数(R2)等,其计算公式如下所示:
均方误差MSN的表达式为:
均方根误差RMSE的表达式为:
平均绝对误差MAE的表达式为:
决定系数R2的表达式为:
其中,m为数据量,yi为实际值,为预测值,/>为yi的均值。四种性能评价指标均大于0,R2值范围为[0,1],R2值越接近于1模型预测效果越好,其他三种评价指标越小模型预测效果越好。评价指标是从一定程度上反映构建模型的有效性,并不具有绝对意义,一方面模型的输出结果会受到数据质量和数据组织形式的影响,另一方面对于实际应用问题只需达到任务预期目的,获取任务目标外的更高精度提升可能需要更多的资源损耗。通过输出模型评价指标的可视化结果,可以直观的判断模型的预测效果,通过对具体评价指标数值的分析可以判断模型的可靠性。
本实施例从四川省路网中选取了具有代表性的成都市和乐山市,通过本发明所述的一种基于时间序列模型的节假日长期交通态势预测方法对其进行预测,如图3和图4所示,从端午节中成都市和乐山市路网预测指标评价来看,两城市的R2值接近于1,模型拟合优度好,模型能够很好地拟合出城市节假日流量的变化趋势。预测结果的MAPE值为21.60%和26.94%,说明模型能够在路网流量较大且流量变化程度很大的情况下仍然保证较好的精度。
MAE RMSE MAPE R2
成都市 2636.6163 3446.6988 21.60% 0.9863
乐山市 402.8171 584.5747 26.94% 0.9580
实施例4
如图5所示,一种基于时间序列模型的节假日长期交通态势预测设备,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器,以及与所述至少一个处理器通讯连接的至少一个输入输出接口;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述实施例所述的一种基于时间序列模型的节假日长期交通态势预测方法。所述输入输出接口可以包括显示器、键盘、鼠标、以及USB接口,用于输入输出数据。
本领域技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
当本发明上述集成的单元以软件功能单元的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于时间序列模型的节假日长期交通态势预测方法,其特征在于,包括以下步骤:
a:获取待预测区域的检测数据;所述检测数据包括交通数据信息以及路网天气数据;
b:将所述检测数据输入到预构筑的节假日交通流长期预测模型;
c:输出所述待预测区域的长期交通态势预测结果;所述长期交通态势预测结果包括路网流量长期预测结果以及路段流量长期预测结果;
具体的,所述节假日交通流长期预测模型采用SARIMAX模型架构,其预构筑包括以下步骤:
S1:获取历史检测数据,对其进行预处理后生成训练样本集;
S2:构建节假日交通流长期预测模型,通过所述训练样本集对其进行模型训练,待模型收敛后输出所述节假日交通流长期预测模型。
2.根据权利要求1所述的一种基于时间序列模型的节假日长期交通态势预测方法,其特征在于,所述S1包括:
S11:获取历史检测数据;
S12:对所述历史检测数据进行数据筛选;所述数据筛选为筛除数据源初始年份少于预设值的数据源对应的数据信息;
S13:对数据筛选后的所述历史检测数据进行数据审核,并根据审核结果进行数据修复或删除;
S14:对数据审核后的所述历史检测数据进行数据组织,输出数据矩阵;所述数据组织为判断所述历史检测数据对应的节假日名称及年份,并将所述历史检测数据存为以节假日名称和年份为坐标的数据矩阵;
S15:对所述数据矩阵进行重采样,存储为预设时间间隔的数据矩阵;
S16:对重采样后的所述数据矩阵进行归一化处理,输出为归一化后的数据矩阵;
S17:根据归一化后的所述数据矩阵生成训练样本集;所述训练样本集包括训练集、测试集以及验证集,其数据比例为预设值。
3.根据权利要求2所述的一种基于时间序列模型的节假日长期交通态势预测方法,其特征在于,所述数据审核包括完整性审核、准确性审核以及数据检验;
所述完整性审核为审核历史检测数据是否存在缺失;
若存在缺失,则根据数据的缺失程度进行补充;
具体的,当缺失程度不超过预设时间长度时,对应缺失数据通过前后数据的平均值与历史平均值的均值进行填充;
当缺失程度超过预设时间长度时,对应缺失数据通过历史平均值进行填充;
所述准确性审核为审核历史检测数据的统计指标是否偏离预设的范围;所述统计指标包括平均值、标准差、最大值、最小值;
若偏离,则对应的历史检测数据存在准确性缺陷,根据偏离程度进行修复或删除数据;
所述数据检验为对历史检测数据进行白噪声检验、平稳性ADF检验以及差分处理;所述白噪声检验采用Ljung-Box算法,如果p-value小于阈值水平,则判定当前历史检测数据为非白噪声序列,有意义;否则判定当前历史检测数据为白噪声序列,无意义,并删除当前历史检测数据;所述平稳性ADF检验用于判断历史检测数据的平稳程度;所述差分处理根据历史检测数据的平稳程度进行差分和季节性差分。
4.根据权利要求2所述的一种基于时间序列模型的节假日长期交通态势预测方法,其特征在于,所述归一化处理采用最小—最大归一化方法,其表达式为:
其中,xstd为归一化后的数据,xi为所述数据矩阵第i个数据,xmin为序列中的最小值,xmax为序列中的最大值。
5.根据权利要求2所述的一种基于时间序列模型的节假日长期交通态势预测方法,其特征在于,所述历史检测数据中的路网天气数据还包括采用Pearson相关系数法进行相关性分析处理;所述Pearson相关系数法的表达式为:
其中,相关系数r满足|r|≤1,xi为天气数据,yi为流量数据,,/>分别表示均值。
6.根据权利要求1所述的一种基于时间序列模型的节假日长期交通态势预测方法,其特征在于,所述S2中所述训练样本集还包括包括以下处理步骤:
S21:为所述训练样本集内的训练样本设置考虑趋势性的距离权重数组;所述距离权重数组与训练样本距离当前时间的靠近程度成正比;
S22:将所述训练样本集中的路网天气数据与所述距离权重数组进行拼接,得到拼接后的训练样本集;
S23:对拼接后的所述训练样本集进行归一化处理;所述归一化处理采用最小—最大归一化方法。
7.根据权利要求1所述的一种基于时间序列模型的节假日长期交通态势预测方法,其特征在于,所述节假日交通流长期预测模型还包括影响因子修正,包括以下步骤:
获取受影响时间段的历史检测数据,将所述历史检测数据导入所述节假日交通流长期预测模型进行预测,得到预测值;
根据预测值与真实值,计算线性回归的斜率和截距,将其作为影响因子;
输入待预测的目标数据,将预测结果乘以影响因子中的斜率后加上截距,得到修正后的目标数据预测结果。
8.根据权利要求1所述的一种基于时间序列模型的节假日长期交通态势预测方法,其特征在于,所述节假日交通流长期预测模型的预构筑还包括S3;
S3:通过预设的评价函数对所述节假日交通流长期预测模型进行验证,当评价指标不满足阈值要求时返回S2进行模型训练,直至评价指标满足阈值要求。
9.根据权利要求8所述的一种基于时间序列模型的节假日长期交通态势预测方法,其特征在于,所述评价函数包括均方误差、均方根误差、平均绝对误差以及决定系数,其计算公式如下所示:
均方误差MSN的表达式为:
均方根误差RMSE的表达式为:
平均绝对误差MAE的表达式为:
决定系数R2的表达式为:
其中,m为数据量,yi为实际值,为预测值,/>为yi的均值。
10.一种基于时间序列模型的节假日长期交通态势预测设备,其特征在于,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至9中任一项所述的方法。
CN202410560112.6A 2024-05-08 2024-05-08 基于时间序列模型的节假日长期交通态势预测方法及设备 Pending CN118155423A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410560112.6A CN118155423A (zh) 2024-05-08 2024-05-08 基于时间序列模型的节假日长期交通态势预测方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410560112.6A CN118155423A (zh) 2024-05-08 2024-05-08 基于时间序列模型的节假日长期交通态势预测方法及设备

Publications (1)

Publication Number Publication Date
CN118155423A true CN118155423A (zh) 2024-06-07

Family

ID=91300830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410560112.6A Pending CN118155423A (zh) 2024-05-08 2024-05-08 基于时间序列模型的节假日长期交通态势预测方法及设备

Country Status (1)

Country Link
CN (1) CN118155423A (zh)

Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492043A (zh) * 2018-03-29 2018-09-04 南京财经大学 一种基于聚类算法的电力用户负荷测算方法
CN108536652A (zh) * 2018-03-15 2018-09-14 浙江大学 一种基于arma模型的短期车辆使用量预测方法
CN109191846A (zh) * 2018-10-12 2019-01-11 国网浙江省电力有限公司温州供电公司 一种交通出行流量预测方法
CN110414719A (zh) * 2019-07-05 2019-11-05 电子科技大学 一种基于多变量灰色模型时间序列的车流量预测方法
CN110517481A (zh) * 2019-07-26 2019-11-29 厦门卫星定位应用股份有限公司 车流量预测方法、介质、设备及装置
WO2020156389A1 (zh) * 2019-01-30 2020-08-06 北京字节跳动网络技术有限公司 信息推送方法和装置
CN111860992A (zh) * 2020-07-13 2020-10-30 上海云角信息技术有限公司 客流量预测方法、装置、设备及存储介质
CN112200377A (zh) * 2020-10-16 2021-01-08 国能日新科技股份有限公司 基于sarimax模型的光伏中长期发电量预报方法及装置
CN112257947A (zh) * 2020-10-30 2021-01-22 红云红河烟草(集团)有限责任公司 制烟环境温湿度预测方法、装置以及设备
WO2021136030A1 (zh) * 2019-12-31 2021-07-08 华为技术有限公司 医疗事件的预测方法及穿戴设备、计算机可读存储介质
CN113344301A (zh) * 2021-07-05 2021-09-03 江苏省气象台 一种基于竞争卷积神经网络的降水预报客观订正方法
CN113902011A (zh) * 2021-10-08 2022-01-07 南威软件股份有限公司 基于循环神经网络的城市轨道交通短时客流预测方法
CN114358362A (zh) * 2021-11-10 2022-04-15 贵州电网有限责任公司 一种数据缺乏下电动汽车负荷预测方法
CN114548505A (zh) * 2022-01-17 2022-05-27 上海威派格智慧水务股份有限公司 一种短期水量预测方法及系统
CN114664091A (zh) * 2022-04-26 2022-06-24 中远海运科技股份有限公司 一种基于节假日流量预测算法的预警方法及系统
CN114943380A (zh) * 2022-06-01 2022-08-26 湖南省交通科学研究院有限公司 一种节假日公路交通流量预测方法、系统和存储介质
CN115909748A (zh) * 2023-01-07 2023-04-04 深圳市城市交通规划设计研究中心股份有限公司 节假日公路交通量预测方法、电子设备及存储介质
CN116682261A (zh) * 2023-06-14 2023-09-01 招商新智科技有限公司 一种节假日道路流量数据预测分析方法及分析装置
CN116720600A (zh) * 2023-03-22 2023-09-08 上海东普信息科技有限公司 落货量预测方法、装置、设备及存储介质
CN116862743A (zh) * 2023-07-28 2023-10-10 中国铁道科学研究院集团有限公司电子计算技术研究所 一种旅客联程运输方案预测方法、系统及设备和介质
CN117173894A (zh) * 2023-11-02 2023-12-05 深圳市城市交通规划设计研究中心股份有限公司 基于天气因素影响的高速公路节假日出行交通量预测方法
CN117571945A (zh) * 2023-11-15 2024-02-20 北京工商大学 耦合时间序列预测模型与机理模型的地下水污染预测方法
CN117744916A (zh) * 2023-11-15 2024-03-22 国家电网有限公司华东分部 储能容量的预测方法、装置、计算机设备及可读存储介质

Patent Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536652A (zh) * 2018-03-15 2018-09-14 浙江大学 一种基于arma模型的短期车辆使用量预测方法
CN108492043A (zh) * 2018-03-29 2018-09-04 南京财经大学 一种基于聚类算法的电力用户负荷测算方法
CN109191846A (zh) * 2018-10-12 2019-01-11 国网浙江省电力有限公司温州供电公司 一种交通出行流量预测方法
WO2020156389A1 (zh) * 2019-01-30 2020-08-06 北京字节跳动网络技术有限公司 信息推送方法和装置
CN110414719A (zh) * 2019-07-05 2019-11-05 电子科技大学 一种基于多变量灰色模型时间序列的车流量预测方法
CN110517481A (zh) * 2019-07-26 2019-11-29 厦门卫星定位应用股份有限公司 车流量预测方法、介质、设备及装置
WO2021136030A1 (zh) * 2019-12-31 2021-07-08 华为技术有限公司 医疗事件的预测方法及穿戴设备、计算机可读存储介质
CN111860992A (zh) * 2020-07-13 2020-10-30 上海云角信息技术有限公司 客流量预测方法、装置、设备及存储介质
CN112200377A (zh) * 2020-10-16 2021-01-08 国能日新科技股份有限公司 基于sarimax模型的光伏中长期发电量预报方法及装置
CN112257947A (zh) * 2020-10-30 2021-01-22 红云红河烟草(集团)有限责任公司 制烟环境温湿度预测方法、装置以及设备
CN113344301A (zh) * 2021-07-05 2021-09-03 江苏省气象台 一种基于竞争卷积神经网络的降水预报客观订正方法
CN113902011A (zh) * 2021-10-08 2022-01-07 南威软件股份有限公司 基于循环神经网络的城市轨道交通短时客流预测方法
CN114358362A (zh) * 2021-11-10 2022-04-15 贵州电网有限责任公司 一种数据缺乏下电动汽车负荷预测方法
CN114548505A (zh) * 2022-01-17 2022-05-27 上海威派格智慧水务股份有限公司 一种短期水量预测方法及系统
CN114664091A (zh) * 2022-04-26 2022-06-24 中远海运科技股份有限公司 一种基于节假日流量预测算法的预警方法及系统
CN114943380A (zh) * 2022-06-01 2022-08-26 湖南省交通科学研究院有限公司 一种节假日公路交通流量预测方法、系统和存储介质
CN115909748A (zh) * 2023-01-07 2023-04-04 深圳市城市交通规划设计研究中心股份有限公司 节假日公路交通量预测方法、电子设备及存储介质
CN116720600A (zh) * 2023-03-22 2023-09-08 上海东普信息科技有限公司 落货量预测方法、装置、设备及存储介质
CN116682261A (zh) * 2023-06-14 2023-09-01 招商新智科技有限公司 一种节假日道路流量数据预测分析方法及分析装置
CN116862743A (zh) * 2023-07-28 2023-10-10 中国铁道科学研究院集团有限公司电子计算技术研究所 一种旅客联程运输方案预测方法、系统及设备和介质
CN117173894A (zh) * 2023-11-02 2023-12-05 深圳市城市交通规划设计研究中心股份有限公司 基于天气因素影响的高速公路节假日出行交通量预测方法
CN117571945A (zh) * 2023-11-15 2024-02-20 北京工商大学 耦合时间序列预测模型与机理模型的地下水污染预测方法
CN117744916A (zh) * 2023-11-15 2024-03-22 国家电网有限公司华东分部 储能容量的预测方法、装置、计算机设备及可读存储介质

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
孟成;彭明军;鄂栋臣;黄炜;: "一种可动态修正的建设用地预测方法", 武汉大学学报(信息科学版), no. 01, 5 January 2014 (2014-01-05), pages 95 - 99 *
张晓卉;姚婷婷;陈阳;张甜甜;马骏;: "基于Python语言的ARIMA模型在天津市结核病发病率预测中的应用", 中国感染控制杂志, no. 07, 21 July 2020 (2020-07-21), pages 634 - 642 *
成诚;杜豫川;刘新;: "考虑节假日效应的交通枢纽客流量预测模型", 交通运输系统工程与信息, no. 05, 15 October 2015 (2015-10-15), pages 202 - 207 *
李洁;彭其渊;杨宇翔;: "基于SARIMA模型的广珠城际铁路客流量预测", 西南交通大学学报, no. 01, 31 December 2019 (2019-12-31), pages 41 - 51 *
梁均;: "大数据集下休息日效应的客流量预测模型", 长江工程职业技术学院学报, no. 01, 20 March 2018 (2018-03-20), pages 4 - 7 *
焦卫东;杨东玲;朱丽;杨丽萍;: "一种改进的基于意图挖掘的航迹预测", 价值工程, no. 21, 28 July 2017 (2017-07-28), pages 92 - 97 *
种颖珊;韩晓明;: "基于随机森林与时空聚类的共享单车站点需求量预测", 科学技术与工程, no. 32, 18 November 2018 (2018-11-18), pages 89 - 94 *
钱超;代亮;林杉;李雪;: "基于随机重复爬山法的交通状态预测", 交通运输系统工程与信息, no. 01, 15 February 2016 (2016-02-15), pages 162 - 168 *
韩卫国, 王劲峰, 胡建军: "交通流量数据缺失值的插补方法", 交通与计算机, no. 01, 28 February 2005 (2005-02-28), pages 39 - 42 *

Similar Documents

Publication Publication Date Title
CN111301426B (zh) 基于gru网络模型预测未来行驶过程能耗的方法
CN110268454B (zh) 确定车辆的定制安全速度
CN101187943B (zh) 自动更新系统、自动更新方法及其程序
CN111160728B (zh) 一种路桥养护决策优化方法及装置
CN113496314B (zh) 一种神经网络模型预测道路交通流量的方法
CA3037941A1 (en) Method and system for generating and using vehicle pricing models
CN113918538B (zh) 一种基于人工神经网络的新建道路养护数据迁移系统
CN113313357A (zh) 一种基于高斯过程回归分析的交通道路安全评价方法
CN113674524A (zh) 基于lstm-gasvr的多尺度短时交通流预测建模、预测方法及系统
CN116933946A (zh) 一种基于客流去向结构的轨道交通od客流预测方法及系统
CN116739376A (zh) 一种基于数据挖掘的公路路面预防性养护决策方法
CN111626855A (zh) 债券信用利差预测方法及系统
CN111145535B (zh) 一种复杂场景下的行程时间可靠性分布预测方法
CN118155423A (zh) 基于时间序列模型的节假日长期交通态势预测方法及设备
KR101725684B1 (ko) 에너지 인센티브 정책을 위한 건축물 에너지 성능 평가 장치 및 방법
CN116778715A (zh) 一种多因素的高速交通流量智能预测方法
CN115170304B (zh) 风险特征描述的提取方法和装置
CN113689694B (zh) 一种车流量预测方法、装置、设备及可读存储介质
CN113849976B (zh) 规划用地的开发强度评估方法、装置及设备
CN114493093A (zh) 一种自动驾驶预测模块的评测方法及装置
Gong The road traffic safety risk projection based on improved random forest.
CN115578854B (zh) 收费站车辆排队长度预测方法、装置、设备及存储介质
CN117408394B (zh) 电力系统的碳排放因子预测方法、装置及电子设备
Spławińska The problem of imputation of the missing data from the continuous counts of road traffic
CN118116190A (zh) 一种基于记忆嵌套网络的交通拥堵预测方法

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination