CN115481784A - 一种基于改进组合模型的交通流量预测方法及应用 - Google Patents

一种基于改进组合模型的交通流量预测方法及应用 Download PDF

Info

Publication number
CN115481784A
CN115481784A CN202211037519.8A CN202211037519A CN115481784A CN 115481784 A CN115481784 A CN 115481784A CN 202211037519 A CN202211037519 A CN 202211037519A CN 115481784 A CN115481784 A CN 115481784A
Authority
CN
China
Prior art keywords
traffic flow
network
bigru
prediction
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211037519.8A
Other languages
English (en)
Inventor
殷礼胜
刘攀
吴洋洋
施成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202211037519.8A priority Critical patent/CN115481784A/zh
Publication of CN115481784A publication Critical patent/CN115481784A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • G08G1/0145Measuring and analyzing of parameters relative to traffic conditions for specific applications for active traffic flow control

Abstract

本发明公开了一种基于改进组合模型的交通流量预测方法及应用,包括:1、提取预测路段的原始交通流量数据并处理为组合模型的交通流量输入;2、采用差分互补集合经验模态分解(CEEMD)算法,将交通流量序列分解为一系列交通模态分量(IMF)及残差分量,利用边界局部特征延拓改善分解过程中的端点飞翼问题;3、使用改进麻雀搜索算法对各双向门控循环单元(BiRGU)的权值参数择优,构建性能最佳的各BiGRU网络预测模型;4、以各IMF分量为输入,使用性能最佳的各BiGRU模型分别对其进行预测,并将各预测值叠加重构得到最终预测结果。本发明旨在提升交通流量预测的精度,从而辅助智能交通系统缓解路网交通压力。

Description

一种基于改进组合模型的交通流量预测方法及应用
技术领域
本发明属于智能交通预测领域,具体的说,是一种基于改进互补集合经验模态分解、改进麻雀搜索算法和双向门口循环单元网络的短时交通流组合模型智能预测方法及应用。
背景技术
近年来,随着城市化进程的加快,城市人口密度的不断增大,车辆的普及在给人民百姓带来便利的同时,也为交通安全的保障增加了困难,由于交通拥堵所带来的交通事故等问题屡见不鲜。这一背景下,对城市道路交通系统进行管理与控制的智能交通控制系统应运而生。短时交通流预测也称为交通流量预测,是实现智能交通系统有效诱导和控制的关键一步,其研究对于提升道路管控水平和缓解路网交通压力具有重要的意义。
为了提高交通流量预测精度,各专家提出了许多行之有效的预测模型及算法。目前,交通流量预测方法主要分为两类:一是基于传统数学理论的交通流量预测算法,如历史平均法、卡尔曼滤波算法、灰度模型法等,这些方法大都利用统计学知识进行线性分析,难以应对复杂路网系统对交通流量序列产生的非线性、非平稳性以及时序相关性等特性,因此预测精度较差,对缓解交通压力作用有限;二是基于非线性系统理论的交通流量预测算法,如非线性回归算法、小波算法、混沌理论模型、突变理论模型等,其利用非线性方程描述强非线性曲线,但无法有效挖掘短时交通流内部的时序相关性,并且计算效率偏低导致训练速度过慢,在实际道路管控应用中存在时效性局限。以上两类预测方法,均未全面、综合地考虑在现实复杂交通路网中交通流量的交通流量时间序列的非线性、非平稳性以及时序相关性特征,并且模型方法训练收敛速度较慢。
基于以上分析,交通流量具有复杂的非线性、非平稳性和时序相关性等特征,而单一的预测模型和方法都有预测精度以及训练收敛速度等方面的限制性,在利用交通流量预测时存在较大的误差,难以精准反映道路交通状况,并且较长的训练速度对其辅助智能交通系统管控道路时存在时效性差的问题。
发明内容
本发明是为了解决上述两类交通流量预测方法的不足,提出一种基于改进组合模型的交通流量预测方法及应用,以期能从非线性、非平稳性以及时序相关性三方面出发,提升智能交通模型的预测精度和预测速度,从而实时地为智能交通系统反映道路交通状况,辅助其提高道路管控水平,缓解路网交通压力。
为解决上述技术问题,本发明采用以下技术方案:
本发明一种基于改进组合模型的交通流量预测方法的特点在于,包括如下步骤:
步骤1:提取预测路段的原始交通流量数据并进行处理:
步骤1.1:利用交通流量传感器周期性采集预测路段处的交通流量数据,从而构建所述预测路段的历史交通流量数据库Xhis
步骤1.2:从所述历史交通流量数据库Xhis中获取采样天数为d、单日采集的交通流量数据量为m的交通流量训练集X=(x1,x2,...,xi,...,xn)T,其中,xi表示第i个采样时刻的交通流量数据;n表示交通流量训练集的采样点总数,且n=d×m;
步骤2:基于边界局部特征延拓优化的互补集合经验交通流量模态分解:
步骤2.1:以交通流量训练集X中第1个采样点的交通流量数据x1作为X的左边界,寻找最靠近左边界的两个邻近交通流量极大值
Figure BDA0003818224180000021
以及两个邻近交通流量极小值
Figure BDA0003818224180000022
利用式(1)对交通流量训练集X进行左边界相似性特征延拓,得到左边界处的延拓交通流量极大值
Figure BDA0003818224180000023
延拓交通流量极小值
Figure BDA0003818224180000024
以及最靠近左边界的第一个交通流量极大值
Figure BDA0003818224180000025
与延拓交通流量极大值
Figure BDA0003818224180000026
之间的时间间隔
Figure BDA0003818224180000027
最靠近左边界的第一个交通流量极小值
Figure BDA0003818224180000028
与延拓交通流量极小值
Figure BDA0003818224180000029
之间的时间间隔
Figure BDA00038182241800000210
延拓交通流量极大值
Figure BDA00038182241800000211
的时序位置
Figure BDA00038182241800000212
延拓交通流量极小值
Figure BDA00038182241800000213
的时序位置
Figure BDA00038182241800000214
Figure BDA00038182241800000215
式(1)中,
Figure BDA00038182241800000216
表示最靠近左边界的第一个交通流量极大值
Figure BDA00038182241800000217
的时序位置;
Figure BDA00038182241800000218
表示最靠近左边界的第二个交通流量极大值
Figure BDA00038182241800000219
的时序位置;
Figure BDA00038182241800000220
表示最靠近左边界的第一个交通流量极小值
Figure BDA00038182241800000221
的时序位置;
Figure BDA00038182241800000222
表示最靠近左边界的第二个交通流量极小值
Figure BDA00038182241800000223
的时序位置;
步骤2.2:以交通流量训练集X中第n个采样点的交通流量数据xn作为X的右边界,寻找最靠近右边界的两个邻近交通流量极大值
Figure BDA00038182241800000224
以及两个邻近交通流量极小值
Figure BDA00038182241800000225
利用式(2)对交通流量训练集序列X进行右边界相似性特征延拓,得到右边界的延拓交通流量极大值
Figure BDA0003818224180000031
延拓交通流量极小值
Figure BDA0003818224180000032
以及最靠近右边界的第一个交通流量极大值
Figure BDA0003818224180000033
与延拓交通流量极大值
Figure BDA0003818224180000034
之间的时间间隔
Figure BDA0003818224180000035
最靠近右边界的第一个交通流量极小值
Figure BDA0003818224180000036
与延拓交通流量极小值
Figure BDA0003818224180000037
之间的时间间隔
Figure BDA0003818224180000038
延拓交通流量极大值
Figure BDA0003818224180000039
的时序位置
Figure BDA00038182241800000310
延拓交通流量极小值
Figure BDA00038182241800000311
的时序位置
Figure BDA00038182241800000312
Figure BDA00038182241800000313
式(2)中,Nmax表示交通流量训练集X中极大值的总个数;Nmin表示交通流量训练集X中极小值的总个数;
Figure BDA00038182241800000314
表示第Nmax-1个交通流量极大值;
Figure BDA00038182241800000315
表示第Nmax-1个交通流量极小值;
Figure BDA00038182241800000316
表示交通流量极大值
Figure BDA00038182241800000317
的时序位置;
Figure BDA00038182241800000318
表示最靠近右边界的第一个交通流量极大值
Figure BDA00038182241800000319
的时序位置;
Figure BDA00038182241800000320
表示交通流量极小值
Figure BDA00038182241800000321
的时序位置;tmin表示最靠近右边界的第一个交通流量极小值
Figure BDA00038182241800000322
的时序位置;
利用式(3)得到延拓交通流量训练集F:
Figure BDA00038182241800000323
式(3)中,j表示当前采样时刻;
步骤2.3:向延拓交通流量训练集F中先后加入符号相反的交通流量高斯白噪声序列±Nu,从而利用式(4)得到第u次添加交通流量高斯白噪声序列得到的交通流量正噪声序列
Figure BDA00038182241800000324
和负噪声序列
Figure BDA00038182241800000325
Figure BDA00038182241800000326
式(4)中,Nu表示第u次添加的服从交通流量正态分布的高斯白噪声序列;u=1,2,...,o;o表示添加交通流量高斯白噪声序列的总次数;
步骤2.4:利用式(5)将交通流量的正噪声序列
Figure BDA0003818224180000041
和负噪声序列
Figure BDA0003818224180000042
分别进行经验模态分解,得到交通流量正噪声序列
Figure BDA0003818224180000043
的第v个正交通流量分量序列
Figure BDA0003818224180000044
交通流量负噪声序列
Figure BDA0003818224180000045
的第v个负交通流量分量序列
Figure BDA0003818224180000046
Figure BDA0003818224180000047
式(5)中,
Figure BDA0003818224180000048
表示第v次运算的模态分解函数;v=1,2,...,m;m表示IMF交通流量模态分量序列的总数;
利用式(6)得到交通流量正噪声序列
Figure BDA0003818224180000049
与正交通流量分量序列
Figure BDA00038182241800000410
交通流量负噪声序列
Figure BDA00038182241800000411
与负交通流量分量序列
Figure BDA00038182241800000412
的关系式:
Figure BDA00038182241800000413
式(6)中,
Figure BDA00038182241800000414
表示第u次添加交通流量高斯白噪声序列后的正噪声序列
Figure BDA00038182241800000415
分解后所得到的正交通流量残差分量序列;
Figure BDA00038182241800000416
表示第u次添加交通流量高斯白噪声序列后的负噪声序列
Figure BDA00038182241800000417
分解后所得到的负交通流量残差分量序列;
步骤2.5:利用式(7)得到第v个IMF交通流量模态分量序列IMFv以及延拓交通流量训练集F与m个IMF交通流量模态分量序列之间的关系式:
Figure BDA00038182241800000418
式(7)中,R表示延拓交通流量训练集F经过分解后所得的总交通流量残差分量;
步骤3:利用改进的麻雀搜索算法优化双向门控循环单元预测模型的网络权值参数:
步骤3.1:定义并初始化学习率lr、批样本数量b、最大迭代次数为MaxIter,当前BiGRU网络迭代次数q=1;
步骤3.2:构建由m个BiGRU预测子网络组成的双向门控循环单元预测模型,其中,任意第q个BiGRU预测子网由一组正、反向GRU网络构成;设置正、反向GRU网络中的门控循环单元个数均为NGRU,正、反向GRU网络中的神经元个数均为Nlayers,并在0-1范围内随机初始化第q个BiGRU预测子网络中待优化的权值参数集合
Figure BDA0003818224180000051
其中,ωq,r和uq,r表示第q个BiGRU预测子网络中重置门Rgq的权值系数;ωq,z和uq,z表示第q个BiGRU预测子网络中更新门Ugq的权值系数;ωq,xh和ωq,hh表示第q个BiGRU预测子网络中候选隐含状态
Figure BDA0003818224180000052
的网络权值系数;
Figure BDA0003818224180000053
表示第q个正向GRU网络中输出层的网络权值系数;
Figure BDA0003818224180000054
表示第q个负向GRU网络中输出层的网络权值系数;q=1,2,...,m;
步骤3.3:基于第q个IMF交通流量模态分量IMFq,利用改进的麻雀搜索算法对第q个BiGRU预测子网络中待优化的权值参数择优,从而得到第q个BiGRU预测子网络中的最优权值参数集合
Figure BDA0003818224180000055
其中,ωq,r *和uq,r *表示第q个BiGRU预测子网络中重置门Rgq的最佳权值系数;ωq,z *和uq,z *表示第q个BiGRU预测子网络中更新门Ugq的最佳权值系数;ωq,xh *和ωq,hh *表示第q个BiGRU预测子网络中候选隐含状态
Figure BDA0003818224180000056
的最佳网络权值系数;
Figure BDA0003818224180000057
表示第q个正向GRU网络中输出层的最佳网络权值系数;
Figure BDA0003818224180000058
表示第q个负向GRU网络中输出层的最佳网络权值系数;
步骤3.4:判断q<m是否成立,若成立,则将q+1赋值给q后,返回步骤3.3顺序执行;否则,输出总的最优参数集合
Figure BDA0003818224180000059
步骤4:利用改进麻雀搜索算法优化的双向门控循环单元网络对交通流量进行组合预测:
步骤4.1:定义待预测交通流量数据的总数为n*,初始化q=1;
步骤4.2:根据总的最优权值参数集合W*对m个BiGRU预测子网分别进行网络权值赋值,相应得到与各交通流量模态分量对应的m个性能最佳BiGRU交通流量预测模型;
步骤4.3:将第q个IMF交通流量模态分量IMFq输入第q个最佳性能BiGRU交通流量预测模型中进行交通流量模态分量预测,并得到第q个IMF交通流量模态分量IMFq的预测序列
Figure BDA00038182241800000510
其中,hz,q表示第q个IMF交通流量模态分量IMFq中第z个交通流量分量数据的预测值;
步骤4.4:若q<m,则将q+1赋值给q后返回步骤4.3顺序执行,否则,表示得到m个分量预测序列{H1,H2,...,Hq,...,Hm}并进行加权重构,得到交通流量最终预测序列
Figure BDA00038182241800000511
其中,yz表示第z个交通流量最终预测值,且
Figure BDA00038182241800000512
本发明所述的基于改进组合模型的交通流量预测方法的特点也在于,所述步骤3.3的改进麻雀搜索算法包括如下步骤:
步骤3.3.1:定义并初始化改进麻雀搜索算法的最大迭代次数iterMax、参与搜索麻雀的数量Np、预警值R2、权重调整参数ωbegin、ωend、发现者数量PD及警戒者数量SD;
初始化当前迭代次数为iter=1、当前权值参数的迭代次数h=1、当前参与搜索麻雀的迭代次数sp=1;
定义并初始化第q个BiGRU预测子网络中第h个权值参数的第sp只麻雀的历史最优适应度值
Figure BDA0003818224180000061
以及历史最优位置值
Figure BDA0003818224180000062
从而利用式(8)得到第q个BiGRU预测子网络中第h个权值参数的历史最优适应度向量
Figure BDA0003818224180000063
及历史最优位置向量
Figure BDA0003818224180000064
Figure BDA0003818224180000065
步骤3.3.2:随机初始化第iter次迭代时第sp只麻雀在训练第q个BiGRU中第h个网络权值参数时的位置
Figure BDA0003818224180000066
并为Np只麻雀随机赋予0-1之间的随机数;
步骤3.3.3:将第q个IMF交通流量模态分量IMFq输入第q个BiGRU预测子网络中利用式(9)计算第q个BiGRU预测子网络中第h个权值参数的平均绝对误差,作为第q个BiGRU预测子网络中第h个权值参数的第iter-1次迭代的历史最佳适应度函数
Figure BDA0003818224180000067
Figure BDA0003818224180000068
式(9)中,
Figure BDA0003818224180000069
表示第q个IMF交通流量模态分量序列IMFq中第iq个真实交通流量模态分量值,
Figure BDA00038182241800000610
表示第iter-1次迭代时将
Figure BDA00038182241800000611
输入第q个BiGRU预测子网络中训练第h个权值参数时输出的第iq个交通分量预测值;
步骤3.3.4:若
Figure BDA00038182241800000612
则将
Figure BDA00038182241800000613
赋值给第q个BiGRU网络中第h个权值参数的历史最优适应度值
Figure BDA00038182241800000614
否则,历史最优适应度值
Figure BDA00038182241800000615
不变;
步骤3.3.5:利用式(10)得到第iter次迭代的线性动态自适应权重ωiter
Figure BDA00038182241800000616
步骤3.3.6:利用式(11)得到第iter+1次迭代时训练第q个BiGRU中第h个网络权值参数时的第sp只发现者麻雀位置
Figure BDA00038182241800000617
Figure BDA0003818224180000071
式(11)中,exp(·)表示以自然常数e为底的指数函数;λ表示0-1之间的随机数;Q表示服从正态分布的随机数;L表示全元素为1的1×d矩阵;ST表示安全值;
步骤3.3.7:根据式(12)得到第iter+1次迭代时训练第q个BiGRU中第h个网络权值参数时的第sp只追随者麻雀位置
Figure BDA0003818224180000072
Figure BDA0003818224180000073
式(12)中,
Figure BDA0003818224180000074
表示第iter次迭代时第q个BiGRU网络中第h个网络权值参数时的全局最差位置;
Figure BDA0003818224180000075
表示第iter+1次迭代时第q个BiGRU网络中第h个网络权值参数时发现者所占据的最优适应度位置;A+表示取值为-1至1的d×1矩阵,且A+=AT(AAT)-1,其中,A表示元素为1或-1的1×d矩阵;
步骤3.3.8:根据式(13)得到第iter+1次迭代时训练第q个BiGRU中第h个网络权值参数时的第sp只警戒者麻雀位置
Figure BDA0003818224180000076
Figure BDA0003818224180000077
式(13)中,
Figure BDA0003818224180000078
表示第iter次迭代时第q个BiGRU网络中第h个网络权值参数的全局最优位置;β表示服从标准正态分布的随机数;K表示麻雀移动方向的步长控制;δ表示最小常数;
Figure BDA0003818224180000079
表示第iter次迭代时训练第q个BiGRU网络中第h个权值参数时第sp只麻雀的当前适应度值;
Figure BDA00038182241800000710
表示第q个BiGRU网络中第h个权值参数的历史最优适应度值;
Figure BDA00038182241800000711
表示第q个BiGRU网络中第h个权值参数的历史最差适应度值;
步骤3.3.9:将
Figure BDA00038182241800000712
赋值给第q个BiGRU网络中第h个权值参数的历史最优适应度值
Figure BDA00038182241800000713
Figure BDA00038182241800000714
历史最优位置
Figure BDA00038182241800000715
同时将全局最优位置所对应的麻雀所赋予的随机数作为第q个BiGRU网络中第h个权值参数的最优权值参数;
步骤3.3.10:将第q个IMF交通流量模态分量IMFq输入当前具备第h个最佳权值参数的第q个BiGRU预测子网络中进行预测,得到交通流量模态分量预测输出
Figure BDA0003818224180000081
其中,
Figure BDA0003818224180000082
表示第iter次迭代时将
Figure BDA0003818224180000083
输入第q个BiGRU预测子网络中训练第h个权值参数时输出的第iq个交通分量预测值;
步骤3.3.11:若iter<iterMax,则将iter+1赋值给iter后返回步骤3.3.3顺序执行;否则,输出第h个最佳权值参数的值,并执行步骤3.3.12;
步骤3.3.12:若h<8,则将h+1赋值给h后返回步骤3.3.3顺序执行;否则,输出第q个BiGRU预测子网络中的最优权值参数集合
Figure BDA0003818224180000084
本发明一种电子设备,包括存储器以及处理器,其特点在于,所述存储器用于存储支持处理器执行所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
本发明一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特点在于,所述计算机程序被处理器运行时执行所述方法的步骤。
本发明基于交通流量时间序列的复杂非线性、非平稳性以及时间依赖性三个方面的特点,与传统仅考虑其中一个或两个方面特点的预测方法相比,具备更好的交通流量预测精度以及速度,具体地说,本发明具有以下技术效果:
1、由于神经网络模型难以挖掘交通流量序列中的先验信息并加以利用,从而造成预测交通流量数据资源浪费,本发明通过改进互补集合经验模态分解算法将其分解为一系列体现趋势性、周期性及随机性信息的本征交通流量序列分量,提取了交通流量序列中的先验特征,有效细化了复杂路网系统中交通流量序列的非线性及非平稳性信息,从而提高了对先验历史交通流量数据集的利用率;
2、由于传统神经网络模型通常使用线性的梯度下降法进行参数训练,而梯度下降法在复杂路网系统中常常因交通流量序列中的非线性特性而发生梯度爆炸、梯度消失等问题,影响交通流量预测精度;而麻雀搜索算法摒弃梯度概念,采用元启发式思想进行参数寻优,有效避免了交通流量非线性带来的梯度问题,因此,本发明利用改进麻雀搜索算法替代BiGRU网络中梯度下降法对权值参数进行择优,并在标准SSA算法中引入线性动态自适应权重以提高全局搜索及局部开采能力,进一步提升了交通流量预测的精度以及训练速度。
3、路网交通系统对交通流量的预测精度及时效性均有着较为严格要求,考虑到传统预测模型因其线性计算结构,往往无法全面考虑到交通流量序列中的非线性及时序相关性,而神经网络结构因其非线性映射功能对非线性交通流量序列的预测具有较大优势;同时,BiGRU网络的结构在LSTM模型的基础上简化,实验效果相似但训练速度更快,因此,本发明利用改进麻雀搜索算法优化的双向门控循环单元网络深度挖掘交通流量序列中存在的非线性及时序相关性,有效提高交通组合预测模型的学习能力以及预测精度的同时,保证了智能交通系统在交通流量预测时效方面的要求。
附图说明
图1为本发明基于改进组合模型的交通流量预测方法结构图;
图2为本发明基于改进组合模型的交通流量预测方法流程图;
图3为本发明芜湖路与徽州大道交叉口东路采样点示意图;
图4为本发明改进CEEMD对交通流量序列模态分解后的结果图;
图5为本发明2018年6月20日6:00至18:00时段内时间间隔5min交通流量预测结果图。
具体实施方式
下面结合附图和实施例对本发明进行进一步详细说明。
本实施例中,基于交通流量时间序列的复杂非线性、非平稳性以及时序相关性三方面特性,以提高交通流量预测模型的预测精度及收敛速度为目标,提出了一种基于改进互补集合经验模态分解、改进麻雀搜索算法和双向门口循环单元网络的短时交通流组合模型智能预测方法。如图1所示,具体的说,一种基于改进组合模型的交通流量预测方法,包括如下步骤:
步骤1:提取预测路段的原始交通流量数据并进行处理:
步骤1.1:利用交通流量传感器周期性采集预测路段处的交通流量数据,从而构建预测路段的历史交通流量数据库Xhis
步骤1.2:从历史交通流量数据库Xhis中获取采样天数为d、单日采集的交通流量数据量为m的交通流量训练集X=(x1,x2,...,xi,...,xn)T,其中,xi表示第i个采样时刻的交通流量数据;n表示交通流量训练集的采样点总数,且n=d×m;
步骤2:基于边界局部特征延拓优化的互补集合经验交通流量模态分解:
步骤2.1:以交通流量训练集X中第1个采样点的交通流量数据x1作为X的左边界,寻找最靠近左边界的两个邻近交通流量极大值
Figure BDA0003818224180000091
以及两个邻近交通流量极小值
Figure BDA0003818224180000092
利用式(1)对交通流量训练集X进行左边界相似性特征延拓,得到左边界处的延拓交通流量极大值
Figure BDA0003818224180000093
延拓交通流量极小值
Figure BDA0003818224180000094
以及最靠近左边界的第一个交通流量极大值
Figure BDA0003818224180000095
与延拓交通流量极大值
Figure BDA0003818224180000096
之间的时间间隔
Figure BDA0003818224180000097
最靠近左边界的第一个交通流量极小值
Figure BDA0003818224180000098
与延拓交通流量极小值
Figure BDA0003818224180000101
之间的时间间隔
Figure BDA0003818224180000102
延拓交通流量极大值
Figure BDA0003818224180000103
的时序位置
Figure BDA0003818224180000104
延拓交通流量极小值
Figure BDA0003818224180000105
的时序位置
Figure BDA0003818224180000106
Figure BDA0003818224180000107
式(1)中,
Figure BDA0003818224180000108
表示最靠近左边界的第一个交通流量极大值
Figure BDA0003818224180000109
的时序位置;
Figure BDA00038182241800001010
表示最靠近左边界的第二个交通流量极大值
Figure BDA00038182241800001011
的时序位置;
Figure BDA00038182241800001012
表示最靠近左边界的第一个交通流量极小值
Figure BDA00038182241800001013
的时序位置;
Figure BDA00038182241800001014
表示最靠近左边界的第二个交通流量极小值
Figure BDA00038182241800001015
的时序位置;
步骤2.2:采用步骤2.1相同原理,以交通流量训练集X中第n个采样点的交通流量数据xn作为X的右边界,寻找最靠近右边界的两个邻近交通流量极大值
Figure BDA00038182241800001016
以及两个邻近交通流量极小值
Figure BDA00038182241800001017
利用式(2)对交通流量训练集序列X进行右边界相似性特征延拓,得到右边界的延拓交通流量极大值
Figure BDA00038182241800001018
延拓交通流量极小值
Figure BDA00038182241800001019
以及最靠近右边界的第一个交通流量极大值
Figure BDA00038182241800001020
与延拓交通流量极大值
Figure BDA00038182241800001021
之间的时间间隔
Figure BDA00038182241800001022
最靠近右边界的第一个交通流量极小值
Figure BDA00038182241800001023
与延拓交通流量极小值
Figure BDA00038182241800001024
之间的时间间隔
Figure BDA00038182241800001025
延拓交通流量极大值
Figure BDA00038182241800001026
的时序位置
Figure BDA00038182241800001027
延拓交通流量极小值
Figure BDA00038182241800001028
的时序位置
Figure BDA00038182241800001029
Figure BDA00038182241800001030
式(2)中,Nmax表示交通流量训练集X中极大值的总个数;Nmin表示交通流量训练集X中极小值的总个数;
Figure BDA00038182241800001031
表示第Nmax-1个交通流量极大值;
Figure BDA00038182241800001032
表示第Nmax-1个交通流量极小值;
Figure BDA00038182241800001033
表示交通流量极大值
Figure BDA00038182241800001034
的时序位置;
Figure BDA00038182241800001035
表示最靠近右边界的第一个交通流量极大值
Figure BDA00038182241800001036
的时序位置;
Figure BDA00038182241800001037
表示交通流量极小值
Figure BDA00038182241800001038
的时序位置;tmin表示最靠近右边界的第一个交通流量极小值
Figure BDA0003818224180000111
的时序位置;
利用式(3)得到延拓交通流量训练集F:
Figure BDA0003818224180000112
式(3)中,j表示当前采样时刻;
步骤2.3:向延拓交通流量训练集F中先后加入符号相反的交通流量高斯白噪声序列±Nu,从而利用式(4)得到第u次添加交通流量高斯白噪声序列得到的交通流量正噪声序列
Figure BDA0003818224180000113
和负噪声序列
Figure BDA0003818224180000114
Figure BDA0003818224180000115
式(4)中,Nu表示第u次添加的服从交通流量正态分布的高斯白噪声序列;u=1,2,...,o;o表示添加交通流量高斯白噪声序列的总次数;
步骤2.4:利用式(5)将交通流量的正噪声序列
Figure BDA0003818224180000116
和负噪声序列
Figure BDA0003818224180000117
分别进行经验模态分解,得到交通流量正噪声序列
Figure BDA0003818224180000118
的第v个正交通流量分量序列
Figure BDA0003818224180000119
交通流量负噪声序列
Figure BDA00038182241800001110
的第v个负交通流量分量序列
Figure BDA00038182241800001111
Figure BDA00038182241800001112
式(5)中,
Figure BDA00038182241800001113
表示第v次运算的模态分解函数;v=1,2,...,m;m表示IMF交通流量模态分量序列的总数;
利用式(6)得到交通流量正噪声序列
Figure BDA00038182241800001114
与正交通流量分量序列
Figure BDA00038182241800001115
交通流量负噪声序列
Figure BDA00038182241800001116
与负交通流量分量序列
Figure BDA00038182241800001117
的关系式:
Figure BDA00038182241800001118
式(6)中,
Figure BDA00038182241800001119
表示第u次添加交通流量高斯白噪声序列后的正噪声序列
Figure BDA00038182241800001120
分解后所得到的正交通流量残差分量序列;
Figure BDA0003818224180000121
表示第u次添加交通流量高斯白噪声序列后的负噪声序列
Figure BDA0003818224180000122
分解后所得到的负交通流量残差分量序列;
步骤2.5:利用式(7)对第u个正噪声序列
Figure BDA0003818224180000123
的第v个正交通流量分量序列
Figure BDA0003818224180000124
负噪声序列
Figure BDA0003818224180000125
的第v个负交通流量分量序列
Figure BDA0003818224180000126
进行去平均值操作,得到第v个IMF交通流量模态分量序列IMFv以及延拓交通流量训练集F与m个IMF交通流量模态分量序列之间的关系式:
Figure BDA0003818224180000127
式(7)中,R表示延拓交通流量训练集F经过分解后所得的总交通流量残差分量;
步骤3:利用改进的麻雀搜索算法优化双向门控循环单元预测模型的网络权值参数:
步骤3.1:定义并初始化学习率lr、批样本数量b、最大迭代次数为MaxIter,当前BiGRU网络迭代次数q=1;
步骤3.2:构建由m个BiGRU预测子网络组成的双向门控循环单元预测模型,其中,任意第q个BiGRU预测子网由一组正、反向GRU网络构成;设置正、反向GRU网络中的门控循环单元个数均为NGRU,正、反向GRU网络中的神经元个数均为Nlayers,并在0-1范围内随机初始化第q个BiGRU预测子网络中待优化的权值参数集合
Figure BDA0003818224180000128
其中,ωq,r和uq,r表示第q个BiGRU预测子网络中重置门Rgq的权值系数;ωq,z和uq,z表示第q个BiGRU预测子网络中更新门Ugq的权值系数;ωq,xh和ωq,hh表示第q个BiGRU预测子网络中候选隐含状态
Figure BDA0003818224180000129
的网络权值系数;
Figure BDA00038182241800001210
表示第q个正向GRU网络中输出层的网络权值系数;
Figure BDA00038182241800001211
表示第q个负向GRU网络中输出层的网络权值系数;q=1,2,...,m;
步骤3.3:基于第q个IMF交通流量模态分量IMFq,利用改进的麻雀搜索算法对第q个BiGRU预测子网络中待优化的权值参数择优,从而得到第q个BiGRU预测子网络中的最优权值参数集合
Figure BDA00038182241800001212
其中,ωq,r *和uq,r *表示第q个BiGRU预测子网络中重置门Rgq的最佳权值系数;ωq,z *和uq,z *表示第q个BiGRU预测子网络中更新门Ugq的最佳权值系数;ωq,xh *和ωq,hh *表示第q个BiGRU预测子网络中候选隐含状态
Figure BDA0003818224180000131
的最佳网络权值系数;
Figure BDA0003818224180000132
表示第q个正向GRU网络中输出层的最佳网络权值系数;
Figure BDA0003818224180000133
表示第q个负向GRU网络中输出层的最佳网络权值系数;
步骤3.3.1:根据交通流量数据规模,结合麻雀搜索算法的有效实验数据范围,定义并初始化改进麻雀搜索算法的最大迭代次数iterMax、参与搜索麻雀的数量Np、预警值R2、权重调整参数ωbegin、ωend、发现者数量PD及警戒者数量SD;
初始化当前迭代次数为iter=1、当前权值参数的迭代次数h=1、当前参与搜索麻雀的迭代次数sp=1;
定义并初始化第q个BiGRU预测子网络中第h个权值参数的第sp只麻雀的历史最优适应度值
Figure BDA0003818224180000134
以及历史最优位置值
Figure BDA0003818224180000135
从而利用式(8)得到第q个BiGRU预测子网络中第h个权值参数的历史最优适应度向量
Figure BDA0003818224180000136
及历史最优位置向量
Figure BDA0003818224180000137
Figure BDA0003818224180000138
步骤3.3.2:随机初始化第iter次迭代时第sp只麻雀在训练第q个BiGRU中第h个网络权值参数时的位置
Figure BDA0003818224180000139
并为Np只麻雀随机赋予0-1之间的随机数;
步骤3.3.3:将第q个IMF交通流量模态分量IMFq输入第q个BiGRU预测子网络中利用式(9)计算第q个BiGRU预测子网络中第h个权值参数的平均绝对误差,作为第q个BiGRU预测子网络中第h个权值参数的第iter-1次迭代的历史最佳适应度函数
Figure BDA00038182241800001310
Figure BDA00038182241800001311
式(9)中,
Figure BDA00038182241800001312
表示第q个IMF交通流量模态分量序列IMFq中第iq个真实交通流量模态分量值,
Figure BDA00038182241800001313
表示第iter-1次迭代将
Figure BDA00038182241800001314
输入第q个BiGRU预测子网络中训练第h个权值参数时输出的第iq个交通分量预测值;
步骤3.3.4:若
Figure BDA00038182241800001315
则将
Figure BDA00038182241800001316
赋值给第q个BiGRU网络中第h个权值参数的历史最优适应度值
Figure BDA00038182241800001317
否则,历史最优适应度值
Figure BDA00038182241800001318
不变;
步骤3.3.5:利用式(10)得到第iter次迭代的线性动态自适应权重ωiter
Figure BDA00038182241800001319
步骤3.3.6:利用式(11)得到第iter+1次迭代时训练第q个BiGRU中第h个网络权值参数时的第sp只发现者麻雀位置
Figure BDA0003818224180000141
Figure BDA0003818224180000142
式(11)中,exp(·)表示以自然常数e为底的指数函数;λ表示0-1之间的随机数;Q表示服从正态分布的随机数;L表示全元素为1的1×d矩阵;ST表示安全值;当R2<ST时,表示种群觅食环境内无捕食者,发现者可以在区域内进行广泛搜索;当R2>=ST时,表示警戒者发现了捕食者出现,种群迅速向安全区域转移;
步骤3.3.7:根据式(12)得到第iter+1次迭代时训练第q个BiGRU中第h个网络权值参数时的第sp只追随者麻雀位置
Figure BDA0003818224180000143
Figure BDA0003818224180000144
式(12)中,
Figure BDA0003818224180000145
表示第iter次迭代时第q个BiGRU网络中第h个网络权值参数时的全局最差位置;
Figure BDA0003818224180000146
表示第iter+1次迭代时第q个BiGRU网络中第h个网络权值参数时发现者所占据的最优适应度位置;A+表示取值为-1至1的d×1矩阵,且A+=AT(AAT)-1,其中,A表示元素为1或-1的1×d矩阵;当
Figure BDA0003818224180000147
时,表示追随者发现发现者自身能量水平过低,其第sp只追随者需要前往其他区域继续觅食;当
Figure BDA0003818224180000148
时,表示第sp只追随者跟随发现者觅食中心行动,随机在中心位置附近随机觅食;
步骤3.3.8:根据式(13)得到第iter+1次迭代时训练第q个BiGRU中第h个网络权值参数时的第sp只警戒者麻雀位置
Figure BDA0003818224180000149
Figure BDA00038182241800001410
式(13)中,
Figure BDA00038182241800001411
表示第iter次迭代时第q个BiGRU网络中第h个网络权值参数的全局最优位置;β表示服从标准正态分布的随机数;K表示麻雀移动方向的步长控制;δ表示最小常数;
Figure BDA00038182241800001412
表示训练第q个BiGRU网络中第h个权值参数时第sp只麻雀的当前适应度值;
Figure BDA0003818224180000151
表示第q个BiGRU网络中第h个权值参数的历史最优适应度值;
Figure BDA0003818224180000152
表示第q个BiGRU网络中第h个权值参数的历史最差适应度值;当
Figure BDA0003818224180000153
时,表示麻雀处于种群的边缘,易遭受捕食者攻击;当
Figure BDA0003818224180000154
时,表示麻雀位于种群中心,随机向其他麻雀靠拢;
步骤3.3.9:将
Figure BDA0003818224180000155
赋值给第q个BiGRU网络中第h个权值参数的历史最优适应度值
Figure BDA0003818224180000156
Figure BDA0003818224180000157
历史最优位置
Figure BDA0003818224180000158
同时将第sp只全局最优位置麻雀于步骤3.3.2所赋予的随机数作为第q个BiGRU网络中第h个权值参数的最优权值参数;
步骤3.3.10:将第q个IMF交通流量模态分量IMFq输入当前具备第h个最佳权值参数的第q个BiGRU预测子网络中进行预测,得到交通流量模态分量预测输出
Figure BDA0003818224180000159
其中,
Figure BDA00038182241800001510
表示第iter次迭代将
Figure BDA00038182241800001511
输入第q个BiGRU预测子网络中训练第h个权值参数时输出的第iq个交通分量预测值;
步骤3.3.11:若iter<iterMax,则将iter+1赋值给iter后返回步骤3.3.3顺序执行;否则,输出第h个最佳权值参数的值,并执行步骤3.3.12;
步骤3.3.12:若h<8,则将h+1赋值给h后返回步骤3.3.3顺序执行;否则,输出第q个BiGRU预测子网络中的最优权值参数集合
Figure BDA00038182241800001512
步骤3.4:判断q<m是否成立,若成立,则将q+1赋值给q后,返回步骤3.3顺序执行;否则,输出总的最优参数集合
Figure BDA00038182241800001513
步骤4:利用改进麻雀搜索算法优化的双向门控循环单元网络对交通流量进行组合预测:
步骤4.1:定义待预测交通流量数据的总数为n*,初始化q=1;
步骤4.2:根据总的最优权值参数集合W*对m个BiGRU预测子网分别进行网络权值赋值,相应得到与各交通流量模态分量对应的m个性能最佳BiGRU交通流量预测模型;
步骤4.3:将第q个IMF交通流量模态分量IMFq输入第q个最佳性能BiGRU交通流量预测模型中进行交通流量模态分量预测,并得到第q个IMF交通流量模态分量IMFq的预测序列
Figure BDA00038182241800001514
其中,hz,q表示第q个IMF交通流量模态分量IMFq中第z个交通流量分量数据的预测值;
步骤4.4:若q<m,则将q+1赋值给q后返回步骤4.3顺序执行,否则,表示得到m个分量预测序列{H1,H2,...,Hq,...,Hm}并进行加权重构,得到交通流量最终预测序列
Figure BDA0003818224180000161
其中,yz表示第z个交通流量最终预测值,且
Figure BDA0003818224180000162
本实施例中,一种电子设备,包括存储器以及处理器,该存储器用于存储支持处理器执行上述方法的程序,该处理器被配置为用于执行该存储器中存储的程序。
本实施例中,一种计算机可读存储介质,是在计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法的步骤。
应用实例
1)数据集选取和模型评价指标
本发明选取合肥市芜湖路与徽州大道交叉口东路如图2所示作为数据采样点,采用2018年6月1日至20日6:00至18:00时段内时间间隔5min的共2400个交通流量数据,其中,选取前1920个交通流量数据作为训练集,后480个交通流量数据作为测试集,取测试集中前92个数据点作为实验结果展示曲线。
为了评估本发明组合预测模型的预测效果,采用平均绝对误差(Mean AbsoluteError,MAE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)和均方根误差(Root Mean Squared Error,RMSE)作为预测模型最终的评价标准。其定义分别如下:
(1)平均绝对误差(Mean Absolute Error,MAE):绝对误差的平均值。
Figure BDA0003818224180000163
(2)平均绝对百分比误差(Mean Absolute Percentage Error,MAPE):预测误差占真实值的百分比。
Figure BDA0003818224180000164
(3)均方根误差(Root Mean Squared Error,RMSE):预测值与真实值的均方根差。
Figure BDA0003818224180000165
式(14)、(15)、(16)中,y′t表示为模型预测交通流量数值;yt表示为实际交通流量数值。
2)参数选取及仿真实验分析
首先利用改进CEEMD模态分解,将原始交通流量序列分解得到的IMF交通流量模态分量和残差分量。高斯白噪声的标准差设置一般为0.01~0.4,通常建议白噪声幅值为原信号标准差的0.2倍,因此本节设置其信噪比Nstd为0.2。噪声添加次数NE一般选取为50~1000,经过多次实验,当NE为500、最大迭代次数为MaxIter为2000时,此模态分解效果最优,交通流量分量IMF总数m=9,改进CEEMD分解后的IMF交通流量模态分量如图3所示。
分别将各交通流量模态分量输入ISSA优化的BiGRU预测模型进行训练,利用BiGRU网络对各路网交通流量模态分量进行时空相关性挖掘。通常固定学习率l为0.01或0.001,BiGRU隐含神经元个数在{32,64,128}中选取,一般SSA种群大小n在20~100,发现者数量与跟随者数量占比为20%和10%。根据前期研究经验及多次实验,本节由训练集规模设置学习率l=0.001,BiGRU隐含神经元个数为32,网络中批量处理BatchSize=32,权重调整参数ωbegin=0.9、ωend=0.4,SSA种群大小n=50,最大迭代次数iterM=100,安全值ST=0.8,上边界及下边界分别为-5和5时,各BiGRU网络模型预测效果最优。
最后,将各ISSA优化的BiGRU预测模型的预测结果加权重构,具体交通流量预测方法流程图如图4所示,得到改进组合模型的最终预测曲线结果如图5所示。图5为合肥市芜湖路与徽州大道交叉口东路2018年6月20日6:00至18:00时段内时间间隔5min交通流量预测结果。由图5可见,原始交通流量存在强烈的非线性,例如交通流量时序点0至时序点20段,同时存在明显的非平稳性,例如交通流量时序点35至时序点45段,而本发明的交通流量组合预测方法在类似过程中,均能够稳定且精准地跟踪其剧烈波动,在交通流量预测方面表现出优越的性能,能够有效反映该采样点道路交通状况,为智能交通诱导提供了良好的基础。

Claims (4)

1.一种基于改进组合模型的交通流量预测方法,其特征在于,包括如下步骤:
步骤1:提取预测路段的原始交通流量数据并进行处理:
步骤1.1:利用交通流量传感器周期性采集预测路段处的交通流量数据,从而构建所述预测路段的历史交通流量数据库Xhis
步骤1.2:从所述历史交通流量数据库Xhis中获取采样天数为d、单日采集的交通流量数据量为m的交通流量训练集X=(x1,x2,...,xi,...,xn)T,其中,xi表示第i个采样时刻的交通流量数据;n表示交通流量训练集的采样点总数,且n=d×m;
步骤2:基于边界局部特征延拓优化的互补集合经验交通流量模态分解:
步骤2.1:以交通流量训练集X中第1个采样点的交通流量数据x1作为X的左边界,寻找最靠近左边界的两个邻近交通流量极大值
Figure FDA0003818224170000011
以及两个邻近交通流量极小值
Figure FDA0003818224170000012
利用式(1)对交通流量训练集X进行左边界相似性特征延拓,得到左边界处的延拓交通流量极大值
Figure FDA0003818224170000013
延拓交通流量极小值
Figure FDA0003818224170000014
以及最靠近左边界的第一个交通流量极大值
Figure FDA0003818224170000015
与延拓交通流量极大值
Figure FDA0003818224170000016
之间的时间间隔
Figure FDA00038182241700000123
最靠近左边界的第一个交通流量极小值
Figure FDA0003818224170000017
与延拓交通流量极小值
Figure FDA0003818224170000018
之间的时间间隔
Figure FDA00038182241700000124
延拓交通流量极大值
Figure FDA0003818224170000019
的时序位置
Figure FDA00038182241700000125
延拓交通流量极小值
Figure FDA00038182241700000110
的时序位置
Figure FDA00038182241700000111
Figure FDA00038182241700000112
式(1)中,
Figure FDA00038182241700000113
表示最靠近左边界的第一个交通流量极大值
Figure FDA00038182241700000114
的时序位置;
Figure FDA00038182241700000115
表示最靠近左边界的第二个交通流量极大值
Figure FDA00038182241700000116
的时序位置;
Figure FDA00038182241700000117
表示最靠近左边界的第一个交通流量极小值
Figure FDA00038182241700000118
的时序位置;
Figure FDA00038182241700000119
表示最靠近左边界的第二个交通流量极小值
Figure FDA00038182241700000120
的时序位置;
步骤2.2:以交通流量训练集X中第n个采样点的交通流量数据xn作为X的右边界,寻找最靠近右边界的两个邻近交通流量极大值
Figure FDA00038182241700000121
以及两个邻近交通流量极小值
Figure FDA00038182241700000122
利用式(2)对交通流量训练集序列X进行右边界相似性特征延拓,得到右边界的延拓交通流量极大值
Figure FDA0003818224170000021
延拓交通流量极小值
Figure FDA0003818224170000022
以及最靠近右边界的第一个交通流量极大值
Figure FDA0003818224170000023
与延拓交通流量极大值
Figure FDA0003818224170000024
之间的时间间隔
Figure FDA0003818224170000025
最靠近右边界的第一个交通流量极小值
Figure FDA0003818224170000026
与延拓交通流量极小值
Figure FDA0003818224170000027
之间的时间间隔
Figure FDA0003818224170000028
延拓交通流量极大值
Figure FDA0003818224170000029
的时序位置
Figure FDA00038182241700000210
延拓交通流量极小值
Figure FDA00038182241700000211
的时序位置
Figure FDA00038182241700000212
Figure FDA00038182241700000213
式(2)中,Nmax表示交通流量训练集X中极大值的总个数;Nmin表示交通流量训练集X中极小值的总个数;
Figure FDA00038182241700000214
表示第Nmax-1个交通流量极大值;
Figure FDA00038182241700000215
表示第Nmax-1个交通流量极小值;
Figure FDA00038182241700000216
表示交通流量极大值
Figure FDA00038182241700000217
的时序位置;
Figure FDA00038182241700000218
表示最靠近右边界的第一个交通流量极大值
Figure FDA00038182241700000219
的时序位置;
Figure FDA00038182241700000220
表示交通流量极小值
Figure FDA00038182241700000221
的时序位置;tmin表示最靠近右边界的第一个交通流量极小值
Figure FDA00038182241700000222
的时序位置;
利用式(3)得到延拓交通流量训练集F:
Figure FDA00038182241700000223
式(3)中,j表示当前采样时刻;
步骤2.3:向延拓交通流量训练集F中先后加入符号相反的交通流量高斯白噪声序列±Nu,从而利用式(4)得到第u次添加交通流量高斯白噪声序列得到的交通流量正噪声序列
Figure FDA00038182241700000224
和负噪声序列
Figure FDA00038182241700000225
Figure FDA00038182241700000226
式(4)中,Nu表示第u次添加的服从交通流量正态分布的高斯白噪声序列;u=1,2,...,o;o表示添加交通流量高斯白噪声序列的总次数;
步骤2.4:利用式(5)将交通流量的正噪声序列
Figure FDA0003818224170000031
和负噪声序列
Figure FDA0003818224170000032
分别进行经验模态分解,得到交通流量正噪声序列
Figure FDA0003818224170000033
的第v个正交通流量分量序列
Figure FDA0003818224170000034
交通流量负噪声序列
Figure FDA00038182241700000317
的第v个负交通流量分量序列
Figure FDA0003818224170000035
Figure FDA0003818224170000036
式(5)中,
Figure FDA0003818224170000037
表示第v次运算的模态分解函数;v=1,2,...,m;m表示IMF交通流量模态分量序列的总数;
利用式(6)得到交通流量正噪声序列
Figure FDA0003818224170000038
与正交通流量分量序列
Figure FDA0003818224170000039
交通流量负噪声序列Hu-与负交通流量分量序列
Figure FDA00038182241700000310
的关系式:
Figure FDA00038182241700000311
式(6)中,
Figure FDA00038182241700000312
表示第u次添加交通流量高斯白噪声序列后的正噪声序列
Figure FDA00038182241700000313
分解后所得到的正交通流量残差分量序列;
Figure FDA00038182241700000314
表示第u次添加交通流量高斯白噪声序列后的负噪声序列
Figure FDA00038182241700000315
分解后所得到的负交通流量残差分量序列;
步骤2.5:利用式(7)得到第v个IMF交通流量模态分量序列IMFv以及延拓交通流量训练集F与m个IMF交通流量模态分量序列之间的关系式:
Figure FDA00038182241700000316
式(7)中,R表示延拓交通流量训练集F经过分解后所得的总交通流量残差分量;
步骤3:利用改进的麻雀搜索算法优化双向门控循环单元预测模型的网络权值参数:
步骤3.1:定义并初始化学习率lr、批样本数量b、最大迭代次数为MaxIter,当前BiGRU网络迭代次数q=1;
步骤3.2:构建由m个BiGRU预测子网络组成的双向门控循环单元预测模型,其中,任意第q个BiGRU预测子网由一组正、反向GRU网络构成;设置正、反向GRU网络中的门控循环单元个数均为NGRU,正、反向GRU网络中的神经元个数均为Nlayers,并在0-1范围内随机初始化第q个BiGRU预测子网络中待优化的权值参数集合
Figure FDA0003818224170000041
其中,ωq,r和uq,r表示第q个BiGRU预测子网络中重置门Rgq的权值系数;ωq,z和uq,z表示第q个BiGRU预测子网络中更新门Ugq的权值系数;ωq,xh和ωq,hh表示第q个BiGRU预测子网络中候选隐含状态
Figure FDA0003818224170000042
的网络权值系数;
Figure FDA0003818224170000043
表示第q个正向GRU网络中输出层的网络权值系数;
Figure FDA0003818224170000044
表示第q个负向GRU网络中输出层的网络权值系数;q=1,2,...,m;
步骤3.3:基于第q个IMF交通流量模态分量IMFq,利用改进的麻雀搜索算法对第q个BiGRU预测子网络中待优化的权值参数择优,从而得到第q个BiGRU预测子网络中的最优权值参数集合
Figure FDA0003818224170000045
其中,ωq,r *和uq,r *表示第q个BiGRU预测子网络中重置门Rgq的最佳权值系数;ωq,z *和uq,z *表示第q个BiGRU预测子网络中更新门Ugq的最佳权值系数;ωq,xh *和ωq,hh *表示第q个BiGRU预测子网络中候选隐含状态
Figure FDA0003818224170000046
的最佳网络权值系数;
Figure FDA00038182241700000411
表示第q个正向GRU网络中输出层的最佳网络权值系数;
Figure FDA0003818224170000047
表示第q个负向GRU网络中输出层的最佳网络权值系数;
步骤3.4:判断q<m是否成立,若成立,则将q+1赋值给q后,返回步骤3.3顺序执行;否则,输出总的最优参数集合
Figure FDA0003818224170000048
步骤4:利用改进麻雀搜索算法优化的双向门控循环单元网络对交通流量进行组合预测:
步骤4.1:定义待预测交通流量数据的总数为n*,初始化q=1;
步骤4.2:根据总的最优权值参数集合W*对m个BiGRU预测子网分别进行网络权值赋值,相应得到与各交通流量模态分量对应的m个性能最佳BiGRU交通流量预测模型;
步骤4.3:将第q个IMF交通流量模态分量IMFq输入第q个最佳性能BiGRU交通流量预测模型中进行交通流量模态分量预测,并得到第q个IMF交通流量模态分量IMFq的预测序列
Figure FDA00038182241700000412
其中,hz,q表示第q个IMF交通流量模态分量IMFq中第z个交通流量分量数据的预测值;
步骤4.4:若q<m,则将q+1赋值给q后返回步骤4.3顺序执行,否则,表示得到m个分量预测序列{H1,H2,...,Hq,...,Hm}并进行加权重构,得到交通流量最终预测序列
Figure FDA0003818224170000049
其中,yz表示第z个交通流量最终预测值,且
Figure FDA00038182241700000410
2.根据权利要求1所述的基于改进组合模型的交通流量预测方法,其特征在于,所述步骤3.3的改进麻雀搜索算法包括如下步骤:
步骤3.3.1:定义并初始化改进麻雀搜索算法的最大迭代次数iterMax、参与搜索麻雀的数量Np、预警值R2、权重调整参数ωbegin、ωend、发现者数量PD及警戒者数量SD;
初始化当前迭代次数为iter=1、当前权值参数的迭代次数h=1、当前参与搜索麻雀的迭代次数sp=1;
定义并初始化第q个BiGRU预测子网络中第h个权值参数的第sp只麻雀的历史最优适应度值
Figure FDA0003818224170000051
以及历史最优位置值
Figure FDA0003818224170000052
从而利用式(8)得到第q个BiGRU预测子网络中第h个权值参数的历史最优适应度向量
Figure FDA0003818224170000053
及历史最优位置向量
Figure FDA0003818224170000054
Figure FDA0003818224170000055
步骤3.3.2:随机初始化第iter次迭代时第sp只麻雀在训练第q个BiGRU中第h个网络权值参数时的位置
Figure FDA0003818224170000056
并为Np只麻雀随机赋予0-1之间的随机数;
步骤3.3.3:将第q个IMF交通流量模态分量IMFq输入第q个BiGRU预测子网络中利用式(9)计算第q个BiGRU预测子网络中第h个权值参数的平均绝对误差,作为第q个BiGRU预测子网络中第h个权值参数的第iter-1次迭代的历史最佳适应度函数
Figure FDA0003818224170000057
Figure FDA0003818224170000058
式(9)中,
Figure FDA0003818224170000059
表示第q个IMF交通流量模态分量序列IMFq中第iq个真实交通流量模态分量值,
Figure FDA00038182241700000510
表示第iter-1次迭代时将
Figure FDA00038182241700000511
输入第q个BiGRU预测子网络中训练第h个权值参数时输出的第iq个交通分量预测值;
步骤3.3.4:若
Figure FDA00038182241700000512
则将
Figure FDA00038182241700000513
赋值给第q个BiGRU网络中第h个权值参数的历史最优适应度值
Figure FDA00038182241700000514
否则,历史最优适应度值
Figure FDA00038182241700000515
不变;
步骤3.3.5:利用式(10)得到第iter次迭代的线性动态自适应权重ωiter
Figure FDA00038182241700000516
步骤3.3.6:利用式(11)得到第iter+1次迭代时训练第q个BiGRU中第h个网络权值参数时的第sp只发现者麻雀位置
Figure FDA00038182241700000517
Figure FDA0003818224170000061
式(11)中,exp(·)表示以自然常数e为底的指数函数;λ表示0-1之间的随机数;Q表示服从正态分布的随机数;L表示全元素为1的1×d矩阵;ST表示安全值;
步骤3.3.7:根据式(12)得到第iter+1次迭代时训练第q个BiGRU中第h个网络权值参数时的第sp只追随者麻雀位置
Figure FDA0003818224170000062
Figure FDA0003818224170000063
式(12)中,
Figure FDA0003818224170000064
表示第iter次迭代时第q个BiGRU网络中第h个网络权值参数时的全局最差位置;
Figure FDA0003818224170000065
表示第iter+1次迭代时第q个BiGRU网络中第h个网络权值参数时发现者所占据的最优适应度位置;A+表示取值为-1至1的d×1矩阵,且A+=AT(AAT)-1,其中,A表示元素为1或-1的1×d矩阵;
步骤3.3.8:根据式(13)得到第iter+1次迭代时训练第q个BiGRU中第h个网络权值参数时的第sp只警戒者麻雀位置
Figure FDA0003818224170000066
Figure FDA0003818224170000067
式(13)中,
Figure FDA0003818224170000068
表示第iter次迭代时第q个BiGRU网络中第h个网络权值参数的全局最优位置;β表示服从标准正态分布的随机数;K表示麻雀移动方向的步长控制;δ表示最小常数;
Figure FDA0003818224170000069
表示第iter次迭代时训练第q个BiGRU网络中第h个权值参数时第sp只麻雀的当前适应度值;
Figure FDA00038182241700000610
表示第q个BiGRU网络中第h个权值参数的历史最优适应度值;
Figure FDA00038182241700000611
表示第q个BiGRU网络中第h个权值参数的历史最差适应度值;
步骤3.3.9:将
Figure FDA00038182241700000612
赋值给第q个BiGRU网络中第h个权值参数的历史最优适应度值
Figure FDA00038182241700000613
Figure FDA00038182241700000614
历史最优位置
Figure FDA00038182241700000615
同时将全局最优位置所对应的麻雀所赋予的随机数作为第q个BiGRU网络中第h个权值参数的最优权值参数;
步骤3.3.10:将第q个IMF交通流量模态分量IMFq输入当前具备第h个最佳权值参数的第q个BiGRU预测子网络中进行预测,得到交通流量模态分量预测输出
Figure FDA0003818224170000071
其中,
Figure FDA0003818224170000072
表示第iter次迭代时将
Figure FDA0003818224170000073
输入第q个BiGRU预测子网络中训练第h个权值参数时输出的第iq个交通分量预测值;
步骤3.3.11:若iter<iterMax,则将iter+1赋值给iter后返回步骤3.3.3顺序执行;否则,输出第h个最佳权值参数的值,并执行步骤3.3.12;
步骤3.3.12:若h<8,则将h+1赋值给h后返回步骤3.3.3顺序执行;否则,输出第q个BiGRU预测子网络中的最优权值参数集合
Figure FDA0003818224170000074
3.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1或2所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
4.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1或2所述方法的步骤。
CN202211037519.8A 2022-08-26 2022-08-26 一种基于改进组合模型的交通流量预测方法及应用 Pending CN115481784A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211037519.8A CN115481784A (zh) 2022-08-26 2022-08-26 一种基于改进组合模型的交通流量预测方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211037519.8A CN115481784A (zh) 2022-08-26 2022-08-26 一种基于改进组合模型的交通流量预测方法及应用

Publications (1)

Publication Number Publication Date
CN115481784A true CN115481784A (zh) 2022-12-16

Family

ID=84420956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211037519.8A Pending CN115481784A (zh) 2022-08-26 2022-08-26 一种基于改进组合模型的交通流量预测方法及应用

Country Status (1)

Country Link
CN (1) CN115481784A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116647405A (zh) * 2023-06-15 2023-08-25 江西师范大学 一种多路径quic异常流量检测方法、系统及设备
CN117635245A (zh) * 2023-11-30 2024-03-01 广东电力交易中心有限责任公司 基于多层次频域分解和ibmh优化delm的电价预测方法和系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116647405A (zh) * 2023-06-15 2023-08-25 江西师范大学 一种多路径quic异常流量检测方法、系统及设备
CN116647405B (zh) * 2023-06-15 2024-04-05 江西师范大学 一种多路径quic异常流量检测方法、系统及设备
CN117635245A (zh) * 2023-11-30 2024-03-01 广东电力交易中心有限责任公司 基于多层次频域分解和ibmh优化delm的电价预测方法和系统

Similar Documents

Publication Publication Date Title
CN115481784A (zh) 一种基于改进组合模型的交通流量预测方法及应用
CN109816095B (zh) 基于改进门控循环神经网络的网络流量预测方法
Openshaw Neural network, genetic, and fuzzy logic models of spatial interaction
CN110458336B (zh) 一种基于深度学习的网约车供需预测方法
CN112201069A (zh) 基于深度强化学习的驾驶员纵向跟车行为模型构建方法
CN112907970B (zh) 一种基于车辆排队长度变化率的可变车道转向控制方法
CN111860787A (zh) 一种含有缺失数据的耦合有向图结构流量数据的短期预测方法及装置
CN113780665B (zh) 一种基于增强循环神经网络的私家车停留位置预测方法和系统
Sun et al. Urban traffic flow online prediction based on multi‐component attention mechanism
CN111907523B (zh) 一种基于模糊推理的车辆跟驰寻优控制方法
Zou et al. Short-term traffic flow prediction based on PCC-BiLSTM
CN114780739A (zh) 基于时间图卷积网络的时序知识图谱补全方法及系统
Cui et al. A novel framework of graph Bayesian optimization and its applications to real-world network analysis
CN115758125A (zh) 基于特征结构优化和深度学习的工业污水处理软测量方法
CN114461931A (zh) 一种基于多关系融合分析的用户轨迹预测方法和系统
Flet-Berliac et al. Merl: Multi-head reinforcement learning
Li et al. Cycle-based signal timing with traffic flow prediction for dynamic environment
CN114596726A (zh) 基于可解释时空注意力机制的停车泊位预测方法
CN113919593A (zh) 一种基于注意力机制的ME-MBiGRU短时交通流量预测方法
Xu et al. Robustness analysis of discrete state-based reinforcement learning models in traffic signal control
CN116911434A (zh) 一种机场运行态势预测方法、装置、系统以及存储介质
CN111860975A (zh) 一种基于生成对抗网络的临近降雨预测方法
CN115965163A (zh) 基于时空图生成对抗损失的轨道交通短时客流预测方法
CN116665483A (zh) 一种新的预测剩余停车位的方法
Kalakonas et al. Earthquake scenarios for building portfolios using artificial neural networks: part I—ground motion modelling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination