CN114241779B - 一种城市快速路交通流短时预测方法、计算机及存储介质 - Google Patents

一种城市快速路交通流短时预测方法、计算机及存储介质 Download PDF

Info

Publication number
CN114241779B
CN114241779B CN202210170381.2A CN202210170381A CN114241779B CN 114241779 B CN114241779 B CN 114241779B CN 202210170381 A CN202210170381 A CN 202210170381A CN 114241779 B CN114241779 B CN 114241779B
Authority
CN
China
Prior art keywords
traffic flow
prediction
variable
time
historical traffic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210170381.2A
Other languages
English (en)
Other versions
CN114241779A (zh
Inventor
林涛
奇兴族
吴超华
阚倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Urban Transport Planning Center Co Ltd
Original Assignee
Shenzhen Urban Transport Planning Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Urban Transport Planning Center Co Ltd filed Critical Shenzhen Urban Transport Planning Center Co Ltd
Priority to CN202210170381.2A priority Critical patent/CN114241779B/zh
Publication of CN114241779A publication Critical patent/CN114241779A/zh
Application granted granted Critical
Publication of CN114241779B publication Critical patent/CN114241779B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Human Resources & Organizations (AREA)
  • Computing Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提出一种城市快速路交通流短时预测方法、计算机及存储介质,属于交通流短时预测技术领域。首先,构建历史交通流量数据库;其次,对目标路段历史交通流数据进行分析与选择,构建数据库;筛选与目标路段交通流相关性符合预设标准的历史交通流数据,组建为互信息量数据库;再次,利用CEEMDAN模型对互信息量数据库进行分解,并对分量进行筛选,重新组成新的时间序列分量;再次,利用BP‑Adaboost模型对时间序列分量进行训练预测;最后,将各个维度的分量预测后的预测值及余波进行累加求和,最终得到短时交通流预测结果。解决了预测模型抗干扰能力较差、预测精度低的技术问题,提高交通流量不稳定状态时的预测精度。

Description

一种城市快速路交通流短时预测方法、计算机及存储介质
技术领域
本申请涉及一种预测方法,尤其涉及一种城市快速路交通流短时预测方法、计算机及存储介质,属于交通流短时预测技术领域。
背景技术
短时交通流预测是当前针对快速路状态判别的一个重要领域。目前,国内外关于短时交通流预测方面的研究成果较多,并建立了针对快速路交通流短时预测的大量模型。而快速路作为城市交通的快捷通道,受各类城市交通影响程度较小,通过准确把握快速路交通流变化特性,对提高城市快速路精细化管理、提高出行质量具有重要的理论研究价值和现实意义。早期的预测模型主要有:支持向量机模型(SVM)、极限学习机模型(ELM)、历史平均模型(HA)、经验模态分解(EEMD)等模型。随着交通状态预测方法不断发展,逐步出现了精度及准确度大幅提升的预测方法。当前外针对交通流短时预测的模型主要有以下几类:基于统计学预测模型、基于非线性理论预测模型、基于深度学习预测模型、基于多目标算法预测模型等。
交通流的时空不稳定性及预测模型的精度决定了快速路交通流的预测难以通过单一模型或方法解决。因此,交通流预测过程中的关键问题是考虑实际交通状态,建立最优预测模型。传统的统计学模型主要针对数据量较大,且线性关系较强的数据集,而对于非稳态的交通流数据,需要较多的参数标定,难以适应随机性较强、非稳定性较多的交通流特征;深度学习理论模型因其参数较多,模型训练时间较长,且所需的数据规模较大,在短时交通流预测中难以做到及时的预测结果反馈;小波分析中的经验模态分解(EEMD)的算法能够依据数据自身的时间尺度特征来进行信号分解,无须预先设定任何基函数,但该算法在分解时间序列的过程中会残留一定的白噪声,预测结果存在较多的干扰信息。
目前,针对城市快速路交通流短时预测模型的精确度均有提升。但是,仍然存在以下两点问题:(1)缺乏充分考虑交通流时空关联性。交通流的时空关联性决定了交通状态难以基于单一模型进行预测,而传统模型及神经网络等模型缺乏高维度非线性特征的提取能力,仅从交通流空间或时间单一维度进行研究分析,无法准确有效的识别交通流突变时刻,因此在预测过程中存在较大偏差。(2)非稳态交通流预测精度问题。在高峰时期及交通流非稳态时期,非线性模型、深度学习理论模型及小波分析等模型的预测精度不高,特别是当交通流波动幅度较大的状态下,模型的抗干扰能力较差。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于此,为解决现有技术中存在的预测模型抗干扰能力较差、预测精度低的技术问题,本发明提供一种城市快速路交通流短时预测方法、计算机及存储介质。
方案一:本发明提供了一种城市快速路交通流短时预测方法,包括以下步骤:
步骤一:获取目标路段历史交通流数据,构建目标路段历史交通流量数据库;
步骤二:对目标路段历史交通流数据进行分析与选择,并构建历史交通流数据库,所述历史交通流数据库中包含有历史交通流和目标路段交通流之间具有相关性的数据;筛选与目标路段交通流相关性符合预设标准的历史交通流数据,组建为互信息量数据库;
步骤三:利用CEEMDAN模型对互信息量数据库进行分解,并对分量进行筛选,重新组成新的时间序列分量;
步骤四:利用BP-Adaboost模型对步骤三所述的时间序列分量进行训练预测;
步骤五:将各个维度的分量预测后的预测值及余波进行累加求和,最终得到短时交通流预测结果。
优选的,步骤二所述对目标路段历史交通流数据进行分析与选择,并构建历史交通流数据库,所述历史交通流数据库中包含有历史交通流和目标路段交通流之间具有相关性的数据;筛选与目标路段交通流相关性符合预设标准的历史交通流数据,组建为互信息量数据库的具体方法是:
步骤二一、计算边缘概率密度函数,通过下述公式计算:
Figure 439236DEST_PATH_IMAGE001
其中,
Figure 193565DEST_PATH_IMAGE002
为目标路段交通流与历史交通流的边缘概率密度;
Figure 868260DEST_PATH_IMAGE003
为X和Y的联合概率密度函数,
Figure 391645DEST_PATH_IMAGE004
Figure 509905DEST_PATH_IMAGE005
分别是X和Y的边缘概率密度函数;
步骤二二、筛选与目标路段交通流具有相关性的历史交通流时间序列,通过下述公式筛选:
Figure 485951DEST_PATH_IMAGE006
其中,C为目标变量,
Figure 26654DEST_PATH_IMAGE007
为目标路段交通流所有变量的集合,
Figure 607808DEST_PATH_IMAGE008
为历史交通流所有变量的集合,
Figure 942975DEST_PATH_IMAGE009
为t时刻所选变量的子集;
Figure 858847DEST_PATH_IMAGE010
Figure 937661DEST_PATH_IMAGE011
分别为要添加到子集S的候选变量和在t时刻已选择的变量;
Figure 435639DEST_PATH_IMAGE012
为子集
Figure 879390DEST_PATH_IMAGE013
的基数,式中第一项
Figure 95607DEST_PATH_IMAGE014
为给定变量
Figure 978113DEST_PATH_IMAGE015
与目标变量C之间的相关性,第二项为候选变量与被选变量之间的冗余度,第三项描述了C中的候选变量与
Figure 36590DEST_PATH_IMAGE016
子集变量之间相互作用的程度;
步骤二三、在时刻t,从变量集合
Figure 979138DEST_PATH_IMAGE017
中选择第
Figure 354756DEST_PATH_IMAGE018
个变量
Figure 775373DEST_PATH_IMAGE019
,通过选择使得
Figure 434894DEST_PATH_IMAGE020
最大化的变量并将其加入到集合
Figure 282764DEST_PATH_IMAGE021
中,得到新的集合
Figure 207995DEST_PATH_IMAGE022
+1,选择出与目标变量相关性最大的变量子集,同时降低变量之间的冗余度,具体选择过程如下:
Figure 369986DEST_PATH_IMAGE023
优选的,步骤三所述构建MI-CEEMDAN-ADABOOST交通流预测模型的具体方法是:
步骤三一、利用CEEMDAN模型对步骤二中互信息量数据库进行分解,在分解过程中添加标准差为0.2的高斯白噪声 ;
步骤三二、选择排列熵计算各个分量的时间复杂度;
步骤三三、计算嵌入维数与延迟时间的有效值,代入排列熵中对分量进行筛选,选择分量中排列熵最大值的1/10作为阈值进行筛选,将筛选后的有效时间序列分量进行重构,得到重构后的时间序列。
优选的,步骤四所述利用BP-Adaboost模型对步骤三所述的时间序列分量进行训练预测的具体方法是:将BP神经网络作为弱分类器,反复训练BP神经网络预测样本,通过Adaboost得到多个BP神经网络弱分类器组成的强分类器,利用构建的强分类器对时间序列分量进行预测训练。
优选的,步骤五所述将各个维度的分量预测后的预测值进行叠加的具体方法是:预测值=∑IMFs+余波。
方案二:一种计算机,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现方案一所述一种城市快速路交通流短时预测方法的步骤。
方案三:一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现方案一所述一种城市快速路交通流短时预测方法。
本发明的有益效果如下:本发明通过应该互信息量(MI)对交通流的数据进行先验处理,提取历史数据库与目标路段交通流相关性最高的数据,并在自适应经验模态(CEEMDAN)中加入自适应高斯白噪声,进一步提取交通流高维度非线性特征,准确识别突变时刻,降低预测误差;通过CEEMDAN将非稳态的交通流分解出各个维度的特征值后,剔除数据中的干扰特征,并利用ADABOOST方法建立强分类器,依次对交通流各维度进行迭代预测,有效地提高模型的抗干扰能力。
在充分挖掘交通流各个维度时空关联的基础上,能够有效学习非稳态交通流的不同时间尺度,平均绝对百分比误差可降至1.4%,短时交通流预测精确度高达95%,可为城市快速路交通管理及控制提供扎实可靠的基础。
解决了现有技术中存在的预测模型抗干扰能力较差、预测精度低的技术问题,有效提高交通流量不稳定状态时的预测精度,具有更高的准确性和可靠性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明方法流程示意图。
具体实施方式
为了使本申请实施例中的技术方案及优点更加清楚明白,以下结合附图对本申请的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本申请的一部分实施例,而不是所有实施例的穷举。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例1、参照图1说明本实施方式,一种城市快速路交通流短时预测方法,包括以下步骤:
步骤一:获取目标路段历史交通流数据,构建目标路段历史交通流量数据库;
步骤二:对目标路段历史交通流数据进行分析与选择,并构建历史交通流数据库,所述历史交通流数据库中包含有历史交通流和目标路段交通流之间具有相关性的数据;筛选与目标路段交通流相关性符合预设标准的历史交通流数据,组建为互信息量数据库;
步骤三:利用CEEMDAN模型对互信息量数据库进行分解,并对分量进行筛选,重新组成新的时间序列分量;
步骤四:利用BP-Adaboost模型对步骤三所述的时间序列分量进行训练预测;
步骤五:将各个维度的分量预测后的预测值及余波进行累加求和,最终得到短时交通流预测结果。
步骤一所述的获取目标路段历史交通流数据的具体方法是,利用快速路卡口及检测器获取。
步骤二所述组建为互信息量数据库的具体方法是,
步骤二一、计算边缘概率密度函数,通过下述公式计算:
Figure 697062DEST_PATH_IMAGE024
其中,
Figure 669828DEST_PATH_IMAGE025
为目标路段交通流与历史交通流的边缘概率密度;
Figure 82355DEST_PATH_IMAGE003
为X和Y的联合概率密度函数,
Figure 844774DEST_PATH_IMAGE004
Figure 964040DEST_PATH_IMAGE005
分别是X和Y的边缘概率密度函数;
步骤二二、筛选与目标路段交通流具有相关性的历史交通流时间序列,通过下述公式筛选:
Figure 419292DEST_PATH_IMAGE026
其中,C为目标变量,
Figure 319115DEST_PATH_IMAGE027
为目标路段交通流所有变量的集合,
Figure 72176DEST_PATH_IMAGE028
为历史交通流所有变量的集合,
Figure 108266DEST_PATH_IMAGE029
为t时刻所选变量的子集;
Figure 672102DEST_PATH_IMAGE030
Figure 59221DEST_PATH_IMAGE031
分别为要添加到子集S的候选变量和在t时刻已选择的变量;
Figure 851859DEST_PATH_IMAGE032
为子集
Figure 8034DEST_PATH_IMAGE029
的基数,式中第一项
Figure 805088DEST_PATH_IMAGE033
为给定变量
Figure 351607DEST_PATH_IMAGE034
与目标变量C之间的相关性,第二项为候选变量与被选变量之间的冗余度,第三项描述了C中的候选变量与
Figure 525100DEST_PATH_IMAGE035
子集变量之间相互作用的程度;
步骤二三、选择出与目标变量相关性最大的变量子集;在时刻t,从变量集合
Figure 722732DEST_PATH_IMAGE036
中选择第
Figure 690688DEST_PATH_IMAGE037
个变量
Figure 786820DEST_PATH_IMAGE038
,通过选择使得
Figure 170528DEST_PATH_IMAGE039
最大化的变量并将其加入到集合
Figure 301295DEST_PATH_IMAGE029
中,得到新的集合
Figure 128568DEST_PATH_IMAGE040
+1,选择出与目标变量相关性最大的变量子集,同时降低变量之间的冗余度,具体选择过程如下:
Figure 711996DEST_PATH_IMAGE041
步骤三所述利用CEEMDAN模型对互信息量数据库进行分解,并对分量进行筛选,重新组成新的时间序列分量;
利用CEEMDAN模型对步骤二中互信息量数据库进行分解,在分解过程中添加标准差为0.2的高斯白噪声,避免分解过程中存在模态混叠现象。由于交通流具有一定的随机性和非平稳性,使得分解后的交通流分量较多,因此,为了减少相关性较小的分量的干扰,选择排列熵(PE)计算各个分量的时间复杂度,而排列熵的计算需要确定嵌入维数和延迟时间的有效值,通过C-C算法建立关联积分,并利用嵌入维数与延迟时间之间的关系式,计算得出嵌入维数与延迟时间的有效值,代入排列熵中对分量进行筛选,选择分量中排列熵最大值的1/10作为阈值进行筛选,重新组成为新的时间序列分量;
步骤四所述的BP-Adaboost模型具体包括CEEMDAN模型和ADABOOST模型。
其中,CEEMDAN模型构建时将目标路段的一维的交通流时间序列设为s(n)={si|i=1,2,…,I},则第i(1,2,…,I)次添加的标准正态分布的白噪声序列为vi(n),则经过i次经验模态分解后的交通流序列为si(n)=s(n)+vi(n)。根据嵌入延时理论,如果嵌入维数m和时间延迟τ选择适当,则进行重构后的相空间与原始相空间等价,具有相同的拓扑结构。则重构后的相空间表示为
Figure 961711DEST_PATH_IMAGE042
其中,M=N-(M-1)τ为相点数,在重构相位空间中,每个相点包含了m个元素,并且,每两个相邻的元素之间的间隔为τ。其中,嵌入维数和时间延迟的确定可以决定相空间重构与原信号的相似程度,嵌入维数m和时间延迟τ有着密切的关系,可以利用延迟时间窗τw=(m-1)τ建立两个未知参数之间的关系。通过C-C算法建立关联积分并构建统计量和时间延迟之间的关系求解τ和τw,从而计算得出嵌入维数,关联积分定义为:
Figure 884668DEST_PATH_IMAGE043
式中:M为相点数;r为邻域半径;dij为相空间中两点之间的欧氏距离;H(z)为Heaviside阶跃函数,可定义为:
Figure 194427DEST_PATH_IMAGE044
将交通流时间序列为s(n)={si|i=1,2,…,I}划分为n个不相交的子序列,对于每个不相交的子序列有:
Figure 452102DEST_PATH_IMAGE045
对所有的子序列s(m,N,r,t)取平均值,表示为:
Figure 505508DEST_PATH_IMAGE046
式中,M为嵌入维数,j为r的个数。
通过定义ΔS(m,t)为领域半径r的最大偏差,则有以下关系:
Figure 345288DEST_PATH_IMAGE047
当数据样本量小于1024时,嵌入维数m通常取值小于6,当数据样本量大于1024时,嵌入维数m取值范围在6附近可以获得稳定的排列熵。
本发明为了更加精确的求得嵌入维数和延迟时间,从而准确判断交通流的突变时刻,分别计算以下3种统计量:
Figure 763631DEST_PATH_IMAGE048
Figure 56072DEST_PATH_IMAGE049
Figure 595726DEST_PATH_IMAGE050
分别作出
Figure 290013DEST_PATH_IMAGE051
与t、
Figure 941574DEST_PATH_IMAGE052
和t的关系图,其中,
Figure 924573DEST_PATH_IMAGE053
关于t的折线图中第一个零点或
Figure 319782DEST_PATH_IMAGE054
的第一个极小值点所对应的时间t为最佳延迟时间,
Figure 55526DEST_PATH_IMAGE055
关于t的折线图中的最小值点所对应的时间t为延迟时间窗τw,则最佳嵌入维数可由关系式得出m=τw/τ+1。
其中,ADABOOST模型构建时从样本数据库中随机选择N组训练数据构建训练数据集T={(x1,y1),(x2,y2),…,(xN,yN)},初始化训练样本的权值分布:D1=(w1,1,w1,2,…,w1,i), w1,i =1/N, i=1,2,…,N,根据样本的输入输出维数确定神经网络结构,初始化BP神经网络权值和阈值;
其次,构建弱分类器,使用具有权值分布Dm的训练集进行学习,训练BP神经网络并预测训练输出,得到弱分类器Gm(x),计算Gm(x)在训练集上的分类误差率,训练集表示如下:
Figure 143568DEST_PATH_IMAGE056
计算Gm(x)在强分类器中所占的权重,表示如下:
Figure 348284DEST_PATH_IMAGE057
测试数据权重调整,根据预测序列的权重更新训练数据集的权重分布:
Figure 281605DEST_PATH_IMAGE058
最后,构建强分类器,通过进行了N轮的弱分类器训练,将各个分类器按照分类精度重新分配权值组合,构成一个强分类器进行分类:
Figure 950484DEST_PATH_IMAGE059
通过上述方法构建BP-Adaboost组合预测模型,并对CEEMDAN分解交通流数据后的有效分量IMF进行预测和重组。
具体的,利用BP-Adaboost模型对步骤三所述的时间序列分量进行训练预测的方法是,
训练过程为:
将快速路目标断面的非稳态交通流特征参数输入MI相关性分析模型中,将相关性高于阈值的历史交通流组建样本数据库。将训练集中的原始交通流数据进行CEEMDAN分解,并在分解时添加标准差为0.2的高斯白噪声,分解为不同维度的IMF分量。选用改进的C-C方法计算嵌入维数τ和延迟时间t,并分别作出
Figure 897843DEST_PATH_IMAGE060
与t、
Figure 386593DEST_PATH_IMAGE061
和t的关系图。通过
Figure 326867DEST_PATH_IMAGE062
关于t的关系图中确定CEEMDAN模型中的延迟时间,当
Figure 850252DEST_PATH_IMAGE063
取得第一个极小值,此时的延迟时间t为最佳延迟时间。通过
Figure 14517DEST_PATH_IMAGE064
与t的关系图中确定延迟时间窗的值,根据延迟时间与嵌入维数之间的关系式m=τw/τ+1求出当前模型中的嵌入维数。将计算得出的嵌入维数和延迟时间带入排列熵中,计算各个交通流数据分解后的IMF分量的排列熵值,选择其中最大值的1/10作为阈值筛选IMF分量。
预测过程为:
选用BP-Adaboost(神经网络-自适应增强)对交通流进行预测分析。将BP神经网络作为弱分类器,反复训练样本数据库,通过Adaboost得到多个BP神经网络弱分类器组成的强分类器,对分解筛选后的各个分量进行训练和预测,得到最终的预测结果。
在本实施例中,为验证MI-CEEMDAN-ADABOOST模型的有效性,选取KNN、SVM、ELM、ADABOOST、CEEMDAN-KNN、CEEMDAN-SVM、CEEMDAN-ELM作为对比模型,将本发明的预测性能指标及预测进行实验,结果如表1(不同模型的预测性能指标及预测结果)所示。
其中,设置预测结果的均方根误差(Root Mean Square Error)、平均绝对误差(Mean Absolute Error)及平均绝对百分比误差(Mean Absolute Percentage Error)作为准确率的评价指标。具体公式如下:
Figure 443093DEST_PATH_IMAGE065
Figure 983796DEST_PATH_IMAGE066
Figure 299371DEST_PATH_IMAGE067
其中,yi和
Figure 900117DEST_PATH_IMAGE068
分别为第i时刻的交通流观测值和预测值,n为交通流样本量,MAE、RMSE、MAPE越小,误差越小,预测效果越好。
表1 各模型的预测性能指标及预测结果
模型 RMSE MAE MAPE
KNN 103.16 109.32 1.95%
SVM 109.83 87.77 7.52%
ELM 298.55 253.64 31.53%
ADABOOST 105.46 87.77 2.59%
CEEMDAN-KNN 72.46 62.58 1.48%
CEEMDAN-SVM 95.32 86.64 2.53%
CEEMDAN-ELM 197.85 160.32 4.30%
本发明 66.88 50.57 1.40%
由表1可以看出,本发明的模型(MI-CEEMDAN-ADABOOST模型)均方根误差(RMSE)、平均均方误差(MAE)、平均绝对百分误差(MAPE)均低于其他模型,预测误差最小,预测精度最高,说明本模型对于快速路交通流在非稳态的状态下具有较强的学习能力,可为城市快速路的交通管理及控制方面提供更加准确的短时交通流量预测信息。
本发明的技术关键点:
通过CEEMDAN将非稳态的交通流分解出各个维度的特征值,加入自适应高斯白噪声,准确识别突变时刻,并利用ADABOOST方法建立强分类器,依次对交通流各维度进行迭代预测,有效地提高模型的抗干扰能力,适用于非稳态交通流的短时预测。
本发明的计算机装置可以是包括有处理器以及存储器等装置,例如包含中央处理器的单片机等。并且,处理器用于执行存储器中存储的计算机程序时实现上述的基于CREO软件的可修改由关系驱动的推荐数据的推荐方法的步骤。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
计算机可读存储介质实施例
本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质,包括但不限于非易失性存储器、易失性存储器、铁电存储器等,计算机可读存储介质上存储有计算机程序,当计算机装置的处理器读取并执行存储器中所存储的计算机程序时,可以实现上述的基于CREO软件的可修改由关系驱动的建模数据的建模方法的步骤。
所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (3)

1.一种城市快速路交通流短时预测方法,其特征在于,包括以下步骤:
步骤一:获取目标路段历史交通流数据,构建目标路段历史交通流量数据库;
步骤二:对目标路段历史交通流数据进行分析与选择,并构建历史交通流数据库,所述历史交通流数据库中包含有历史交通流和目标路段交通流之间具有相关性的数据;筛选与目标路段交通流相关性符合预设标准的历史交通流数据,组建为互信息量数据库,具体方法是:
步骤二一、计算边缘概率密度函数,通过下述公式计算:
Figure FDA0003588899760000011
其中,I(X;Y)为目标路段交通流与历史交通流的边缘概率密度;p(x,y)为X和Y的联合概率密度函数,p(x)和p(y)分别是X和Y的边缘概率密度函数;
步骤二二、筛选与目标路段交通流具有相关性的历史交通流时间序列,通过下述公式筛选:
Figure FDA0003588899760000012
其中,C为目标变量,X为目标路段交通流所有变量的集合,Y为历史交通流所有变量的集合,St为t时刻所选变量的子集;Xi和Xj分别为要添加到子集S的候选变量和在t时刻已选择的变量;|St|为子集St的基数,式中I(Xi;C)为给定变量Xi与目标变量C之间的相关性,
Figure FDA0003588899760000013
为候选变量与被选变量之间的冗余度,
Figure FDA0003588899760000014
描述了C中的候选变量与St子集变量之间相互作用的程度;
步骤二三、在时刻t,从变量集合X\St中选择第t+1个变量Xt+1,通过选择使得J(Xi)最大化的变量并将其加入到集合St中,得到新的集合St+1,选择出与目标变量相关性最大的变量子集,同时降低变量之间的冗余度,具体选择过程如下:
Figure FDA0003588899760000015
步骤三:利用CEEMDAN模型对互信息量数据库进行分解,并对分量进行筛选,重新组成新的时间序列分量,具体方法是:
步骤三一、利用CEEMDAN模型对步骤二中互信息量数据库进行分解,在分解过程中添加标准差为0.2的高斯白噪声;
步骤三二、选择排列熵计算各个分量的时间复杂度;
步骤三三、计算嵌入维数与延迟时间的有效值,代入排列熵中对分量进行筛选,选择分量中排列熵最大值的1/10作为阈值进行筛选,将筛选后的有效时间序列分量进行重构,得到重构后的时间序列;
步骤四:利用BP-Adaboost模型对步骤三所述的时间序列分量进行训练预测,具体方法是:将BP神经网络作为弱分类器,反复训练BP神经网络预测样本,通过Adaboost得到多个BP神经网络弱分类器组成的强分类器,利用构建的强分类器对时间序列分量进行预测训练;
步骤五:将各个维度的分量预测后的预测值及余波进行累加求和,最终得到短时交通流预测结果。
2.一种计算机,其特征在于,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现权利要求1所述的方法的步骤。
3.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1所述的方法。
CN202210170381.2A 2022-02-24 2022-02-24 一种城市快速路交通流短时预测方法、计算机及存储介质 Active CN114241779B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210170381.2A CN114241779B (zh) 2022-02-24 2022-02-24 一种城市快速路交通流短时预测方法、计算机及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210170381.2A CN114241779B (zh) 2022-02-24 2022-02-24 一种城市快速路交通流短时预测方法、计算机及存储介质

Publications (2)

Publication Number Publication Date
CN114241779A CN114241779A (zh) 2022-03-25
CN114241779B true CN114241779B (zh) 2022-07-29

Family

ID=80747983

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210170381.2A Active CN114241779B (zh) 2022-02-24 2022-02-24 一种城市快速路交通流短时预测方法、计算机及存储介质

Country Status (1)

Country Link
CN (1) CN114241779B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115907181B (zh) * 2022-12-01 2023-06-23 郑州铁路职业技术学院 一种城市轨道交通乘客流量预测方法及系统
CN115953904B (zh) * 2023-03-15 2023-08-01 深圳市城市交通规划设计研究中心股份有限公司 高速交通流速度稳定性分析方法、电子设备及其存储介质
CN116050673B (zh) * 2023-03-31 2023-08-01 深圳市城市交通规划设计研究中心股份有限公司 基于CNN-BiLSTM的城市公交客流短时预测方法
CN116959696B (zh) * 2023-09-20 2023-12-08 武汉光盾科技有限公司 一种基于激光治疗仪的数据处理方法和装置
CN117612379B (zh) * 2024-01-24 2024-03-29 山东华夏高科信息股份有限公司 一种智慧交通车流量预测方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236237A (ja) * 2005-02-28 2006-09-07 Mitsubishi Heavy Ind Ltd 交通量予測システム
CN103413046A (zh) * 2013-08-14 2013-11-27 深圳市智美达科技有限公司 车流量统计方法
CN109377752A (zh) * 2018-10-19 2019-02-22 桂林电子科技大学 短时交通流变化预测方法、装置、计算机设备及存储介质
CN109919364A (zh) * 2019-02-18 2019-06-21 华南理工大学 基于自适应降噪和集成lstm的多变量时间序列预测方法
CN111160650A (zh) * 2019-12-31 2020-05-15 杭州电子科技大学 一种基于Adaboost算法的交通流特性分析与预测方法
CN112417762A (zh) * 2020-11-25 2021-02-26 中国民航大学 一种基于分解集成方法论的扇区流量短期预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8942913B2 (en) * 2011-09-20 2015-01-27 Infosys Limited System and method for on-road traffic density analytics using video stream mining and statistical techniques

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236237A (ja) * 2005-02-28 2006-09-07 Mitsubishi Heavy Ind Ltd 交通量予測システム
CN103413046A (zh) * 2013-08-14 2013-11-27 深圳市智美达科技有限公司 车流量统计方法
CN109377752A (zh) * 2018-10-19 2019-02-22 桂林电子科技大学 短时交通流变化预测方法、装置、计算机设备及存储介质
CN109919364A (zh) * 2019-02-18 2019-06-21 华南理工大学 基于自适应降噪和集成lstm的多变量时间序列预测方法
CN111160650A (zh) * 2019-12-31 2020-05-15 杭州电子科技大学 一种基于Adaboost算法的交通流特性分析与预测方法
CN112417762A (zh) * 2020-11-25 2021-02-26 中国民航大学 一种基于分解集成方法论的扇区流量短期预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
城市轨道交通短时客流预测文献综述;曾诚 等;《铁道运输与经济》;20210831;第43卷(第8期);第105-111页 *

Also Published As

Publication number Publication date
CN114241779A (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
CN114241779B (zh) 一种城市快速路交通流短时预测方法、计算机及存储介质
CN110782658B (zh) 一种基于LightGBM算法的交通量预测方法
CN112910690A (zh) 基于神经网络模型的网络流量预测方法、装置及设备
CN110826618A (zh) 一种基于随机森林的个人信用风险评估方法
CN112560966B (zh) 基于散射图卷积网络的极化sar图像分类方法、介质及设备
WO2024036709A1 (zh) 一种异常数据检测方法及装置
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN113761805A (zh) 一种基于时域卷积网络的可控源电磁数据去噪方法、系统、终端及可读存储介质
CN115510981A (zh) 一种决策树模型特征重要性计算方法、装置及存储介质
CN114003900A (zh) 变电站二次系统网络入侵检测方法、装置及系统
CN112241475B (zh) 基于维度分析量化器哈希学习的数据检索方法
CN113705110A (zh) 一种基于双重随机森林回归方法的爆破振动速度预测方法
CN110837853A (zh) 一种快速分类模型构建方法
CN114861858A (zh) 一种路面异常数据检测方法、装置、设备及可读存储介质
CN104484418B (zh) 一种基于双分辨率的特征量化方法及系统
CN113656707A (zh) 一种理财产品推荐方法、系统、存储介质及设备
CN117390515B (zh) 基于深度学习和SimHash的数据分类方法及系统
CN1193308C (zh) 用于检索特征向量数据空间的方法
CN116188834B (zh) 基于自适应训练模型的全切片图像分类方法及装置
CN113205856B (zh) 一种微生物宏基因组分箱方法及系统
CN117437976B (zh) 基于基因检测的疾病风险筛查方法及系统
CN117556902A (zh) 一种网络目标隐藏属性推理方法及装置
CN117892227A (zh) 基于STL-SVR-AdaBoost模型的短期负荷预测方法及系统
CN115795470A (zh) 一种优化模型超参数的安全等级识别方法及装置
CN116882614A (zh) 一种碳排放预测模型构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant