CN116564102A - Prophet-DeepAR模型的交通量预测方法 - Google Patents
Prophet-DeepAR模型的交通量预测方法 Download PDFInfo
- Publication number
- CN116564102A CN116564102A CN202310533910.5A CN202310533910A CN116564102A CN 116564102 A CN116564102 A CN 116564102A CN 202310533910 A CN202310533910 A CN 202310533910A CN 116564102 A CN116564102 A CN 116564102A
- Authority
- CN
- China
- Prior art keywords
- traffic
- model
- deep
- prediction
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 47
- 230000008859 change Effects 0.000 claims description 24
- 230000000737 periodic effect Effects 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 9
- 229920006395 saturated elastomer Polymers 0.000 claims description 7
- 230000000903 blocking effect Effects 0.000 claims description 5
- 230000001186 cumulative effect Effects 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 4
- 238000012546 transfer Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 4
- 208000025721 COVID-19 Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001932 seasonal effect Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 208000000044 Amnesia Diseases 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 208000026139 Memory disease Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000006984 memory degeneration Effects 0.000 description 1
- 208000023060 memory loss Diseases 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/065—Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Strategic Management (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Molecular Biology (AREA)
- Tourism & Hospitality (AREA)
- Algebra (AREA)
- Analytical Chemistry (AREA)
- Operations Research (AREA)
- Chemical & Material Sciences (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Biology (AREA)
Abstract
本发明涉及Prophet‑DeepAR模型的交通量预测方法,包括:获取交通量数据集和协变量数据集;构建Prophet模型,将所述交通量数据集输入所述Prophet模型,分解所述交通量数据集,输出第一预测结果;构建DeepAR模型,基于分解后的所述交通量数据集和所述协变量数据集训练所述DeepAR模型,基于训练后的所述DeepAR模型,生成第二预测结果;结合所述第一预测结果和所述第二预测结果,获取交通量预测结果。本发明通过模型组合,与现有交通量预测模型相比,在突发事件条件下具有更好的预测性能。
Description
技术领域
本发明涉及交通工程技术领域,特别是涉及Prophet-DeepAR模型的交通量预测方法。
背景技术
近年来,全球范围内突发事件(如自然灾害、灾难性事故、公共卫生突发事件、公共安全事件等)发生的强度和频率都在逐年增加。突发事件和随之而来的应对措施会对交通量产生极大影响。例如,流行性疾病大流行期间,交通需求受交通封锁的影响,发生了重大且急剧的变化。提前预测突发事件期间交通量的改变,不仅可以为交通管理部门实施管控策略提供决策依据,达到极端恶劣条件下交通系统正常运行的目的,而且有利于防灾保障措施的实施,以确保出行者出行安全。因此,突发事件期间的交通量预测是政府管理部门和出行者所共同关注的问题。
目前许多交通流预测技术已经取得了良好的表现,现有技术提出了一种基于Prophet模型的地铁进站客运交通流预测方法,现有技术还构建了一种基于自适应广义PageRank的交通流预测方法等。然而,目前已存在的交通量预测技术往往以常规道路交通条件为背景,仅基于历史交通量数据考虑,而未将突发事件纳入交通量的影响因素。如果遇到突发事件,现有交通量预测模型要生成准确且稳定的预测结果仍面临着如下挑战:(1)大多数模型假设未来的交通条件与过往具有同质性,当突发事件发生时,无法根据实际情况纳入有用的假设。(2)突发事件下交通量的历史数据并不完备,无论对于统计方法还是智能算法而言,数据都无法满足模型要求。(3)时变的交通量具有非线性、自相关性和周期性等复杂特点,当大规模交通网络发生突发事件时,不同路段具有不同的交通状况,预测者需要凭借个人经验手动调整模型参数以适应交通量的复杂背景,这要求预测者具有大量交通领域的经验。
综上,面向突发事件下的交通量,提出高效、高精度的预测方法,具有重要的研究和实践意义
发明内容
本发明的目的是提供了Prophet-DeepAR模型的交通量预测方法,为了将现有预测技术应用于突发事件下的交通量,并提高突发事件期间交通量预测的精度,将Prophet模型框架和DeepAR算法相结合,Prophet模型被用作方法的主要框架,从交通量时间序列中提取出趋势、季节性波动、节假日影响成分并预测;通过DeepAR模型引入突发事件相关的外部变量,并以此来建模和预测隐藏在Prophet模型提取剩余残差中的突发事件影响信息。最终实现突发事件下交通量的精准预测。
为实现上述目的,本发明提供了如下方案:
Prophet-DeepAR模型的交通量预测方法,包括:
获取交通量数据集和协变量数据集;
构建Prophet模型,将所述交通量数据集输入所述Prophet模型,分解所述交通量数据集,输出第一预测结果;
构建DeepAR模型,基于分解后的所述交通量数据集和所述协变量数据集训练所述DeepAR模型,基于训练后的所述DeepAR模型,生成第二预测结果;
结合所述第一预测结果和所述第二预测结果,获取交通量预测结果。
可选地,所述交通量数据集包括时间戳和交通量;
所述协变量数据集包括降雨量、风速、气温、道路通行能力和是否有突发事件发生以及是否实施交通封锁措施。
可选地,所述Prophet模型为:
y(t)=g(t)+s(t)+h(t)+r(t)
其中,g(t)代表交通量时间序列分解得到的趋势项,s(t)是对交通量时间序列的周期性变化进行建模得到的周期项,该项的建模方式与指数平滑法采用的方法相同;h(t)表示节假日对交通量时间序列的随机影响,r(t)为误差项。
可选地,将所述交通量数据集输入所述Prophet模型,分解所述交通量数据集,输出第一预测结果包括:
将所述交通量数据集划分为交通量训练集和交通量测试集,将所述交通量训练集输入所述Prophet模型,将所述交通量训练集中的交通量时间序列分解为趋势项、周期项、假日项和残差项,并根据交通量测试集的时间戳生成所述趋势项、所述周期项、所述假日项的预测结果,及输出所述第一预测结果。
可选地,获取所述趋势项的方法为:
判断道路通行能力是否达到饱和,划分建模方式,当所述道路通行能力临近或已经饱和时,采用logistic增长模型拟合趋势项:
其中,C(t)为时变的道路通行能力,k为初始交通量增长速率,m为偏移参数,为交通量增长速率的变化量,t对应模型训练和预测时段的时间戳,exp()为以自然常数e为底的指数函数,/>为偏移量的变化值;
当道路通行能力未饱和时,采用分段线性增长模型拟合趋势项:
其中,k为初始交通量增长速率,m为偏移参数,为交通量增长速率的变化量,/>为偏移参数的变化量;
获取所述周期项的方法为:
其中,P为周期数,an和bn为傅里叶系数构成的向量,N为傅里叶级数中正弦分量和余弦分量的个数,π为圆周率,n为正整数,可取值从1至N,t对应模型训练时段和预测时段的时间戳,an为傅里叶系数,表示傅里叶级数中余弦分量的幅值,bn为傅里叶系数,表示傅里叶级数中正弦分量的幅值;
获取所述假日项的方法为:
其中,κ表示参数向量,Di表示第i个节假日的影响时段,ki为参数向量κ中第i个分量,代表第i个节假日的影响程度,t对应模型训练时段和预测时段的时间戳。
可选地,构建所述DeepAR模型包括:
采用长短时记忆神经网络,构建所述DeepAR模型。
可选地,所述DeepAR模型的条件概率分布为:
其中,t0为过去训练时段和未来预测时段的分界点,1:t0-1为训练时段,t0:T为预测时段,为交通量的预测值,/>为历史交通量真实值,x1:T为训练时段和预测时段都已知的协变量,zt为交通量在t时刻的值,ht为长短时记忆神经网络在t时刻的输出,Θ是模型参数,θ(·)是长短时记忆神经网络的传输函数,P(·|·)是预测者指定的概率似然函数,/>为求积符号,表示从t0到T的累项相乘,z1:t-1为从1至t-1时刻的交通量值。
可选地,基于分解后的所述交通量数据集和所述协变量数据集训练所述DeepAR模型包括:基于所述残差项和所述协变量数据集训练所述DeepAR模型。
可选地,该方法还包括:
根据所述趋势项、所述周期项、所述假日项、所述残差项的拟合结果,以及交通量预测结果的统计信息进行参数调整。
可选地,所述交通量预测结果的统计指标包括:平均绝对误差、均方根误差和决策系数。
本发明的有益效果为:
(1)本发明通过模型组合,与现有交通量预测模型相比,在突发事件条件下具有更好的预测性能。(2)本发明灵活性高,可以通过输入协变量和参数调整,适应道路交通条件的改变,更加适应突发事件背景。(3)本发明可以克服数据缺失和异常的问题。由于客观因素,很难获得长期稳定且真实的突发事件下交通量数据。然而Prophet模型和DeepAR模型都对数据具有鲁棒性。(4)交通量预测者可以根据本发明不同组成模块的统计信息调整参数,而不需要了解突发事件引起的路网变化机制,降低了预测工作对专业知识的要求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的Prophet-DeepAR模型的交通量预测方法流程图;
图2为本发明实施例的DeepAR模型基本架构示意图;
图3为本发明实施例的Prophet-DeepAR算法的交通量预测结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明公开了Prophet-DeepAR模型的交通量预测方法
步骤1:读取交通量及相关协变量数据,汇总成交通量数据集和协变量数据集。并根据预测需要,将交通量数据集划分为交通量训练集和交通量测试集。
步骤2:构建Prophet模型,将交通量训练集中的交通量时间序列分解为趋势项、周期项、假日项和剩余残差,并根据交通量测试集的时间戳生成趋势项、周期项、假日项的预测结果;
其中,Prophet模型类似于一个回归模型Y=A×X1+B×X2+C×X3+R,其中趋势项、周期项、假日项以及残差项类似于回归中的各项A×X1、B×X2、C×X3、R,但比回归中的各项组成部分更复杂,各项需要单独建模。Prophet模型需要训练,获取模型中各项的参数,例如偏移参数m、傅里叶系数an和bn、假日项中的参数ki等。在训练阶段,通过对每一个时间戳t对应的交通量分解拟合,来选择合适的参数值。在预测阶段,根据获取得到的参数,在对应时间戳t处生成预测值。
步骤3:构建DeepAR模型,使用Prophet模型分解得到的剩余残差数据和协变量数据训练DeepAR模型,并根据交通量测试集的时间戳生成残差的预测结果。
步骤4:将Prophet模型和DeepAR模型输出的各项结果相加,得到交通量的预测结果。
步骤5:根据趋势项、周期项、假日项、残差项拟合结果,以及交通量预测结果的统计信息进行参数调整。
Prophet模型对交通量的增长趋势、周期性波动、节假日影响进行了分别建模,因此,对于各项的参数可以分别进行调整。例如,趋势项中,选择logistic增长模型还是分段线性增长模型,趋势改变点数量、趋势改变点覆盖范围,趋势变化灵活度等参数;周期项中,决定是否包含年周期性、周周期性和日周期性,以及选择周期性波动灵活度;在假日项中,选择节假日及影响范围,节假日影响的灵活度。Prophet模型还可以输出各项的折线图以供使用者更直观的进行参数调整。
由于DeepAR模型由LSTM构建,因此,可以调整隐藏层神经元数量、隐藏层数量、步长等参数。
主要流程为:Prophet模型通过交通量训练集训练,调整Prophet模型参数以适应交通量的趋势变化、周期性波动以及节假日影响;而后将剩余残差数据集输入DeepAR模型,并输入协变量数据集,训练DeepAR模型,进行参数调整来拟合残差数据集;最终将Prophet模型和DeepAR模型结果相加,观察相加后结果与实际交通量的差值,重复上述参数调整步骤,直至交通量预测值与实际值的差值满足精度要求。
进一步地,步骤1交通量数据集必须包含时间戳和交通量两列。时间戳列以日期的形式存储,具体格式为“YYYY-MM-DD HH:MM:SS”;交通量列以数字的形式存储。
进一步地,步骤1协变量数据集包括但不限于降雨量、风速、气温、道路通行能力、是否有突发事件发生、是否实施交通封锁措施等道路交通条件相关变量。是否有突发事件发生和是否实施交通封锁措施以二元变量的形式存储;道路通行能力、风速、降雨量和气温以数字的形式存储。
进一步地,步骤2中Prophet模型,用以对交通量的整体趋势、周期性波动、节假日影响进行有效处理。输入交通量训练集,通过时间序列分解技术,得到交通量的趋势变点、周期性波动和短期跳跃特征,模型具体构成为:
y(t)=g(t)+s(t)+h(t)+r(t)
其中,g(t)代表交通量时间序列分解得到的趋势项;s(t)是对交通量时间序列的周期性变化进行建模得到的周期项,该项的建模方式与指数平滑法采用的方法相同;h(t)表示节假日对交通量时间序列的随机影响;r(t)为误差项。
进一步地,步骤2趋势项,根据道路通行能力是否达到饱和,可以分为两种建模方式。当道路通行能力临近或已经饱和时,采用logistic增长模型拟合趋势项:
其中,C(t)表示时变的道路通行能力;k表示初始交通量增长速率;m为偏移参数;表示交通量增长速率的变化量,t对应模型训练和预测时段的时间戳,exp()为以自然常数e为底的指数函数,/>为偏移量的变化值;/>aj(t)表示在第j个速率变化点tj,j=1,2,...,J处增长速率是否变化,可取值0或1,δj(t)在第j个速率变化点tj,j=1,2,...,J处增长速率的变化量,δj(t)的取值符合拉普拉斯变换,δj(t)~laplace(0,τ);如果增长速率发生改变,则偏移量也一定随之改变,用表示,J表示共J个速率变化点,不难计算推导出:
其中,∑l<jγl表示第j个速率变化点tj之前,偏移量的变化值之和,γl表示第l个速率变化点tl处偏移量的变化值,δl表示第j个速率变化点tj处增长速率的变化量,∑l≤j是求和符号,表示从l到j的累项相加;
当道路通行能力未饱和时,采用分段线性增长模型拟合趋势项:
其中,k为初始交通量增长速率,m为偏移参数,为交通量增长速率的变化量,为偏移参数的变化量;
进一步地,步骤2周期项,由于交通量受人们出行模式的影响,如日间交通量明显高于夜间时段,交通量会呈现明显的日周期性,因此采用傅里叶级数建模周期项。
其中,P表示周期数;,an和bn表示傅里叶系数构成的向量,β=[a1,b1,...,aN,bN]T,共2N个分量,随着N的增加,可以拟合变化更快的季节性。N为傅里叶级数中正弦分量和余弦分量的个数,π为圆周率,n为正整数,可取值从1至N,t对应模型训练时段和预测时段的时间戳,an为傅里叶系数,表示傅里叶级数中余弦分量的幅值,bn为傅里叶系数,表示傅里叶级数中正弦分量的幅值;
进一步地,步骤2假日项,由于多数路段的交通量会受节假日影响产生随机阶跃,因此假设待分析的交通量时间序列在过去时间和未来预测时间内一共有L个节假日,为每个节假日分配一个参数κi,假日项采用加权法拟合。
其中,κ表示参数向量,Di表示第i个节假日的影响时段,ki为参数向量κ中第i个分量,代表第i个节假日的影响程度,t对应模型训练时段和预测时段的时间戳,F(t)=[1(t∈D1),...,1(t∈DL)]。
进一步地,步骤3中DeepAR模型,用以捕捉受突发事件影响的交通量非常规变化。DeepAR模型采用长短时记忆神经网络(LSTM)的基本架构,其条件概率分布用如下似然函数的乘积形式表示。
t0是过去训练时段和未来预测时段的分界点;[1:t0-1]是过去用于训练的时间戳集合,[t0:T]是未来用于预测的时间戳集合;是交通量的预测值;/>是历史交通量真实值;x1:T是训练时段和预测时段都已知的协变量;zt是交通量在t时刻的值。ht是长短时记忆神经网络在t时刻的输出,ht=h(ht-1,zt-1,xt,Θ),Θ是模型参数,θ(·)是长短时记忆神经网络的传输函数,P(·|·)是预测者指定的概率似然函数,例如高斯似然和负二项式似然函数,/>为求积符号,表示从t0到T的累项相乘,z1:t-1为从1至t-1时刻的交通量值。
进一步地,步骤5中,交通量预测结果的统计指标包括:平均绝对误差、均方根误差和决策系数。平均绝对误差和均方根误差用以评价预测精度,决策系数用以衡量拟合效果。
其中,yn和分别为真实值和预测值,N为样本的个数。/>
进一步地,本发明Prophet-DeepAR算法的交通量预测具备以下特点:
(1)以Prophet模型为主要框架,通过时间序列分解技术将交通量时间序列分解为趋势项、季节项、假日项和残差项,对交通量的趋势变点、周期性波动、由节假日引起的短期跳跃进行单独拟合,获得较好的预测效果。此外,Prophet模型对输入数据的要求较低,它不需要有规律的连续数据,也不需要在输入前进行平滑处理。
(2)应用DeepAR模型对Prophet模型分解得到的残差项进行重新拟合并预测。突发事件发生后,增长趋势、周期性因素、节假日的影响都会被减弱,交通量变化极大受突发事件的影响,并且这些影响隐藏在残差项中。DeepAR模型通过自主学习和训练与交通量相关的多个协变量时间序列(如道路交通条件),向模型纳入有用的假设,使模型更适应于突发事件条件,可以进一步挖掘残差项中隐含的不确定性信息。并且,即使很少或没有没过往突发事件下交通量数据,DeepAR模型也可以使用冷启动功能来实现预测。
(3)本发明Prophet-DeepAR算法的交通量预测将现有预测技术高效组合。Prophet模型在处理变化趋势点、周期性波动等方面有很好的适应性,在处理时间序列的短期跳跃(如节假日)方面也有较好的表现。但是,Prophet模型没有验证残差项的拟合,在影响期长且强的突发事件首次发生时,模型会出现拟合不足,无法达到预期的预测精度。DeepAR模型可以解决先知模型的缺陷,高精度预测突发时间下的交通量非常规变化。但是,DeepAR模型没有注意机制,所以对于较长的时间序列可能存在记忆丢失问题,不能捕捉长期或季节性信息,而这正是先知模型所具有的能力。通过Prophet模型和DeepAR模型的有效融合,充分发挥各自的优势,互相弥补对方不足,最终实现突发事件下交通量的精准预测。
本发明中,以卢森堡公路网N12国道(Hamiville至Feitsch段)为例,收集整理了其2018年至2020年的小时交通量数据。由于新型冠状病毒COVID-19的爆发和随之而来的交通封锁政策的实施,卢森堡公路的交通量发生了长达两个月且大幅度的下降,因此以COVID-19交通封锁前一周至COVID-19交通封锁结束后一周为预测对象,即2020年3月14日至2020年06月13日,进行建模和预测实验。
本发明提供了Prophet-DeepAR算法的交通量预测,具体流程如图1所示,包括如下具体实施过程:
101.获取数据。本实施例使用的交通量数据来自卢森堡数据平台公开的公路网交通计数数据集,该数据集包含了检测点编号、公路名称、时间戳、行驶方向、车辆类别、小时交通计数、日交通计数、监测点位置及坐标等变量。本实施例使用的协变量数据来自ERA5欧洲天气预报中心及卢森堡政府相关公告,包括降雨量、气温、风速、道路通行能力、是否有突发事件发生、是否实施交通封锁措施等变量。
102.构建交通量数据集。通过数据库条件筛选,从原始公路网交通计数数据集中提取卢森堡公路网N12国道(Hamiville至Feitsch段)2018年至2021年标准车型的小时交通量数据和时间戳数据构成交通量数据集。此时交通量数据集包含时间戳和交通量两列,修改时间戳数据的格式为“YYYY-MM-DDHH:MM:SS”。
103.构建协变量数据集。将不同来源的协变量,以变量类别为连接索引,汇总成一个数据集,并定义协变量数据集的时间戳与交通量数据集的时间戳相对应。
104.划分交通量数据集。将时间戳位于2018年1月1日至2020年03月13日的交通量数据作为训练数据,构成交通量训练集;将时间戳位于2020年3月14日至2020年06月13日的交通量数据作为测试数据,构成交通量测试集。训练样本和测试样本共20398个,其中训练样本18263个,测试样本2135个。
201.本实施例采用fbprophet库调用DeepAR模型,输入交通量训练集,并设定Prophet模型基本构成。其中,趋势项选择Logistic模型;周期项选择相乘性模型,包括年周期性、周周期性和日周期性分量;假日项通过设定卢森堡假期集合(表1)实现,表1为卢森堡地区节假日信息表。
表1
202.Prophet模型基本框架设定好后,通过交叉验证的方式以平均绝对误差(MAE)为准则选取最优超参数。本发明设置趋势项灵活性参数Changepoint_prior_scale取值区间为(0,1];季节项灵活性参数seasonality_prior_scale和假日项灵活性参数holidays_prior_scale取值区间为(0,50]。
203.采用最优的参数组合建模。将交通量训练集数据分解成趋势项、季节项、假日项和残差,并得到各组成成分的预测结果。
301.提取Prophet模型分解得到的残差项,构成残差训练集,其时间戳与交通量训练集项相对应。
302.本实施例采用GluonTS库和Pytorch库建立DeepAR模型,输入残差训练集和协变量数据集,以2层LSTM作为基底建立DeepAR模型基本架构,如图2所示。
303.设置隐含层的神经元个数为32,context_length为24,time_freq为每小时,prediction_length为1,epochs为50,得到残差项的预测结果。
401.将Prophet模型和DeepAR模型输出的各项结果相加,得到交通量预测结果。
501.计算401中预测结果的统计指标,并根据计算得到的统计指标和Prophet模型输出的可视化图表调整参数,最终得到预测结果如附图3所示。
为验证本发明所提出的预测模型的有效性,将本发明所提出的模型与其它4种单模型和3种组合模型进行对比。各预测结果的评价指标如表2所示,表2为:评价结果的统计指标;
表2
从表2可以看出,Prophet-DeepAR的平均绝对误差(MAE)和均方根误差(RMSE)是8个模型中最小的,说明Prophet-DeepAR模型的预测性能最好。Prophet-DeepAR的决策系数(R2)也是8个模型中最大的,这说明Prophet模型能更有效地挖掘交通量数据的潜在信息,如图3所示。
综上,本发明所提出的方法能有效预测突发事件下的交通量。
以上所述的实施例仅是对本发明优选方式进行的描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (10)
1.Prophet-DeepAR模型的交通量预测方法,其特征在于,包括:
获取交通量数据集和协变量数据集;
构建Prophet模型,将所述交通量数据集输入所述Prophet模型,分解所述交通量数据集,输出第一预测结果;
构建DeepAR模型,基于分解后的所述交通量数据集和所述协变量数据集训练所述DeepAR模型,基于训练后的所述DeepAR模型,生成第二预测结果;
结合所述第一预测结果和所述第二预测结果,获取交通量预测结果。
2.根据权利要求1所述的Prophet-DeepAR模型的交通量预测方法,其特征在于,所述交通量数据集包括时间戳和交通量;
所述协变量数据集包括降雨量、风速、气温、道路通行能力和是否有突发事件发生以及是否实施交通封锁措施。
3.根据权利要求1所述的Prophet-DeepAR模型的交通量预测方法,其特征在于,所述Prophet模型为:
y(t)=g(t)+s(t)+h(t)+r(t)
其中,g(t)代表交通量时间序列分解得到的趋势项,s(t)是对交通量时间序列的周期性变化进行建模得到的周期项,该项的建模方式与指数平滑法采用的方法相同;h(t)表示节假日对交通量时间序列的随机影响,r(t)为误差项。
4.根据权利要求1所述的Prophet-DeepAR模型的交通量预测方法,其特征在于,将所述交通量数据集输入所述Prophet模型,分解所述交通量数据集,输出第一预测结果包括:
将所述交通量数据集划分为交通量训练集和交通量测试集,将所述交通量训练集输入所述Prophet模型,将所述交通量训练集中的交通量时间序列分解为趋势项、周期项、假日项和残差项,并根据交通量测试集的时间戳生成所述趋势项、所述周期项、所述假日项的预测结果,及输出所述第一预测结果。
5.根据权利要求3或4所述的Prophet-DeepAR模型的交通量预测方法,其特征在于,
获取所述趋势项的方法为:
判断道路通行能力是否达到饱和,划分建模方式,当所述道路通行能力临近或已经饱和时,采用logistic增长模型拟合趋势项:
其中,C(t)为时变的道路通行能力,k为初始交通量增长速率,m为偏移参数,为交通量增长速率的变化量,t对应模型训练和预测时段的时间戳,exp( )为以自然常数e为底的指数函数,/>为偏移量的变化值;
当道路通行能力未饱和时,采用分段线性增长模型拟合趋势项:
其中,k为初始交通量增长速率,m为偏移参数,为交通量增长速率的变化量,为偏移参数的变化量;
获取所述周期项的方法为:
其中,P为周期数,an和bn为傅里叶系数构成的向量,N为傅里叶级数中正弦分量和余弦分量的个数,π为圆周率,n为正整数,可取值从1至N,t对应模型训练时段和预测时段的时间戳,an为傅里叶系数,表示傅里叶级数中余弦分量的幅值,bn为傅里叶系数,表示傅里叶级数中正弦分量的幅值;
获取所述假日项的方法为:
其中,κ表示参数向量,Di表示第i个节假日的影响时段,ki为参数向量κ中第i个分量,代表第i个节假日的影响程度,t对应模型训练时段和预测时段的时间戳。
6.根据权利要求1所述的Prophet-DeepAR模型的交通量预测方法,其特征在于,构建所述DeepAR模型包括:
采用长短时记忆神经网络,构建所述DeepAR模型。
7.根据权利要求6所述的Prophet-DeepAR模型的交通量预测方法,其特征在于,所述DeepAR模型的条件概率分布为:
其中,t0为过去训练时段和未来预测时段的分界点,1:t0-1为训练时段,t0:T为预测时段,为交通量的预测值,/>为历史交通量真实值,x1:T为训练时段和预测时段都已知的协变量,zt为交通量在t时刻的值,ht为长短时记忆神经网络在t时刻的输出,Θ是模型参数,θ(·)是长短时记忆神经网络的传输函数,P(·|·)是预测者指定的概率似然函数,为求积符号,表示从t0到T的累项相乘,z1:t-1为从1至t-1时刻的交通量值。
8.根据权利要求4所述的Prophet-DeepAR模型的交通量预测方法,其特征在于,基于分解后的所述交通量数据集和所述协变量数据集训练所述DeepAR模型包括:基于所述残差项和所述协变量数据集训练所述DeepAR模型。
9.根据权利要求5所述的Prophet-DeepAR模型的交通量预测方法,其特征在于,该方法还包括:
根据所述趋势项、所述周期项、所述假日项、所述残差项的拟合结果,以及交通量预测结果的统计信息进行参数调整。
10.根据权利要求9所述的Prophet-DeepAR模型的交通量预测方法,其特征在于,所述交通量预测结果的统计指标包括:平均绝对误差、均方根误差和决策系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310533910.5A CN116564102A (zh) | 2023-05-12 | 2023-05-12 | Prophet-DeepAR模型的交通量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310533910.5A CN116564102A (zh) | 2023-05-12 | 2023-05-12 | Prophet-DeepAR模型的交通量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116564102A true CN116564102A (zh) | 2023-08-08 |
Family
ID=87499663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310533910.5A Pending CN116564102A (zh) | 2023-05-12 | 2023-05-12 | Prophet-DeepAR模型的交通量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116564102A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117370330A (zh) * | 2023-12-07 | 2024-01-09 | 浙江有数数智科技有限公司 | 一种基于Prophet-SVM模型的大数据采集系统的数据监控预警方法 |
-
2023
- 2023-05-12 CN CN202310533910.5A patent/CN116564102A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117370330A (zh) * | 2023-12-07 | 2024-01-09 | 浙江有数数智科技有限公司 | 一种基于Prophet-SVM模型的大数据采集系统的数据监控预警方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109658695B (zh) | 一种多因素的短时交通流预测方法 | |
CN109035761B (zh) | 基于辅助监督学习的行程时间估计方法 | |
Maier et al. | First‐order reliability method for estimating reliability, vulnerability, and resilience | |
Meng et al. | Forecasting tropical cyclones wave height using bidirectional gated recurrent unit | |
CN116013087B (zh) | 一种基于城市运动车辆检测的车流量统计方法 | |
CN107610464A (zh) | 一种基于高斯混合时间序列模型的轨迹预测方法 | |
WO2022077767A1 (zh) | 交通流量预测方法及装置、计算机设备及可读存储介质 | |
CN110009046B (zh) | 一种基于大数据的城市社区安全预测方法 | |
CN108417034A (zh) | 一种基于多变量灰色模型的高速公路节假日车流量预测方法 | |
CN112116149B (zh) | 一种考虑预报不确定性关联演化特征的多站中长期径流滚动概率预测方法 | |
Coles et al. | Extreme value modelling of hurricane wind speeds | |
CN116564102A (zh) | Prophet-DeepAR模型的交通量预测方法 | |
Zhu et al. | A hybrid decomposition and Machine learning model for forecasting Chlorophyll-a and total nitrogen concentration in coastal waters | |
Quiroga et al. | Modelling high speed railroad geometry ageing as a discrete-continuous process | |
Kim et al. | Hurricane scenario generation for uncertainty modeling of coastal and inland flooding | |
CN116311921A (zh) | 一种基于多空间尺度时空Transformer的交通速度预测方法 | |
CN112991688A (zh) | 一种基于pul算法的地质灾害时空联合预警方法及系统 | |
CN116452280A (zh) | 一种电动汽车充电桩订单异常的清分结算方法及装置 | |
McMillan et al. | Flow forecasting for leakage burst prediction in water distribution systems using long short-term memory neural networks and Kalman filtering | |
CN114239990A (zh) | 一种基于时间序列分解和lstm的时间序列数据预测方法 | |
CN111145535B (zh) | 一种复杂场景下的行程时间可靠性分布预测方法 | |
CN116739168A (zh) | 一种基于灰色理论与编解码器的径流量预测方法 | |
Ramadan et al. | New environmental prediction model using fuzzy logic and neural networks | |
Tao et al. | A combined model of wavelet and neural network for short term load forecasting | |
Adu-Gyamfi et al. | Traffic speed prediction for urban arterial roads using deep neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |