CN110956807B - 基于多源数据与滑动窗口组合的高速公路流量预测方法 - Google Patents
基于多源数据与滑动窗口组合的高速公路流量预测方法 Download PDFInfo
- Publication number
- CN110956807B CN110956807B CN201911233275.9A CN201911233275A CN110956807B CN 110956807 B CN110956807 B CN 110956807B CN 201911233275 A CN201911233275 A CN 201911233275A CN 110956807 B CN110956807 B CN 110956807B
- Authority
- CN
- China
- Prior art keywords
- model
- data
- traffic flow
- models
- source data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000013528 artificial neural network Methods 0.000 claims abstract description 14
- 230000002068 genetic effect Effects 0.000 claims abstract description 14
- 230000015654 memory Effects 0.000 claims abstract description 5
- 238000011144 upstream manufacturing Methods 0.000 claims description 23
- 238000003062 neural network model Methods 0.000 claims description 10
- 238000005457 optimization Methods 0.000 claims description 10
- 101100004644 Arabidopsis thaliana BAT1 gene Proteins 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 5
- 238000009499 grossing Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 230000005856 abnormality Effects 0.000 claims description 3
- 230000007812 deficiency Effects 0.000 claims description 2
- 210000002569 neuron Anatomy 0.000 claims description 2
- 239000013589 supplement Substances 0.000 claims description 2
- 230000007787 long-term memory Effects 0.000 claims 2
- 230000006403 short-term memory Effects 0.000 claims 2
- 230000000694 effects Effects 0.000 abstract description 4
- 238000005259 measurement Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 239000000203 mixture Substances 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004313 glare Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
- G08G1/0145—Measuring and analyzing of parameters relative to traffic conditions for specific applications for active traffic flow control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Remote Sensing (AREA)
- Educational Administration (AREA)
- Analytical Chemistry (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Primary Health Care (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了基于多源数据与滑动窗口组合的高速公路流量预测方法,包括:步骤1,构建多源数据,综合考虑多维交通流量影响因子在时间和空间上的相关性;步骤2,分别采用支持向量回归、遗传算法优化的BP神经网络,以及长短期记忆网络LSTM在多源数据集构建回归模型;步骤3,通过组合上述三种模型构建混合模型进行预测,在滑动窗口机制下,通过第三方库实时优化三种模型在混合模型中占的权值;步骤4,采取增量训练的方式,在原有的数据基础上对模型再次进行训练,达到及时利用新数据和模型在线更新的效果。
Description
技术领域
本发明涉及基于多源数据与滑动窗口组合的高速公路流量预测方法。
背景技术
交通流量预测是指通过收集交通待测流量点的历史交通流量和相关属性来预测待测点的未来交通流量。作为智慧交通的一个重要环节,准确预测交通流量具有十分重要的实际意义。例如目前十字路口的信号灯,变换时间间隔一般都是预先设定的,无法动态调整,导致效率不高;如果能够准确预测交通流量,就能根据实时流量动态调整信号灯,进一步提高十字路口的通行效率。在交通流量预测中,历史交通流量存在时间和空间上的相关性,时间上的相关性指该点在过去一段时间内的数据对现在的流量有影响,例如,当前时间点的前30分钟,加上前一天的此时及其向前的15分钟数据(每隔5分钟一个数据)。而空间上的相关性指该点在高速公路的前后测量点的交通流量数据对其存在的影响。
目前常见的交通流量预测方法主要采用单一交通数据源,根据目标路段的历史数据进行预测,没有考虑突发事件等对短时交通流量的影响,预测精度有待提高。在预测模型方面主要分为统计分析、人工智能、非线性、交通模拟、组合预测等。对于统计分析、非线性方法,其主要关注点在交通流量数据本身,而忽视影响交通流量的其他非交通流量的数据,而交通模拟模型,需要模拟真实的环境,其代价和难度较大。
综上所述,目前用于交通流量预测的样本特征单一,缺乏对突发事件等交通流量影响因子的考量。在预测模型方面,主要采取单一方法或简单将每类方法组合,没有考虑同种模型中的不同变体之间的组合,且缺乏全局优化。
发明内容
本发明的目的是针对现有技术中存在的问题,提出基于多源数据与滑动窗口组合的高速公路流量预测方法,通过对多源数据进行交叉关联分析,提取基于MarkosPapageorgiou动态模型中的上下游交通流量数据、上下游收费站进出口收费信息数据、当前测量点前后高速公路前后区间段各车型占比、节假日时间段、测量点所连接城市热点事件、第三方服务统计的目标路段拥塞数据以及该区间内的天气等特征,综合考虑多维交通流量影响因子;在构建模型部分,则分别选择支持向量回归模型、BP神经网络模型,以及在时间序列上表现优越的循环神经网络LSTM模型;通过组合三个模型发挥每个模型的优点,在滑动窗口上优化三种模型的权值;最后采用增量训练,根据获取到的新数据进行模型的训练,动态增强对高速公路交通流量的适应度。
上述的目的通过以下技术方案实现:
基于多源数据和滑动窗口组合的高速公路交通流量预测方法,包括以下步骤:
步骤1,综合考虑多维交通流量影响因子在时间和空间上的相关性,采集多种数据构建多源数据集;
步骤2,在多源数据集上,提取上下游交通流量数据、上下游收费站进出口收费信息数据、当前测量点前后高速公路前后区间段各车型占比、节假日时间段、测量点所连接城市热点事件、第三方服务统计的目标路段拥塞数据以及该区间内的天气等特征,构建支持向量回归模型、基于遗传算法的BP神经网络模型以及长短期记忆网络模型;
步骤3,将步骤2构建的三个模型组成混合模型,设置三个模型在混合模型中的权重,对三个模型在混合模型中所占的权重进行优化,再使用优化后的混合模型对未来的交通流量进行预测;
步骤4,每当新采集到的数据达到一周时,采用增量训练方式,优化步骤2构建的三个模型的参数。
步骤1包括:采集多源数据,包括基于Markos Papageorgiou(参考文献:MARKOSPAPAGEORGIOU;JEANMARC BLOSSEVILLE;HABIB HAJSALEM Modelling and realtimecontrol of trafficflow on the southern part of boulevard peripherique inParis:part I:modelling 1990(05))宏观动态模型中的上下游测量点的交通流量以及上下游收费站收费信息、该段高速区域的天气情况(降雨量、能见度、风向、风等级)和当时时刻;测量点前一段时间的交通流量,测量点前一天前一段时间的交通流量;当时测量点该区间路段里面的各类车型的占比;当时测量点是否处于节假日;当时测量点的路况信息;测量点上下游城市的热点事件;将以上信息作为最终的多源数据特征。其中,上下游交通流量数据和上下游收费站进出口收费信息中除了包含单个车辆的瞬时速率外,还包含了车辆自身的信息,例如车型、车容量等。车容量的大小会直接影响路段的车密度、车间距等和交通流量直接相关的因素。例如大型车辆的侧翻对周围小车都会造成很大影响,因此小型车辆的司机遇到大型车辆时会选择适当扩大车距或更换车道等。因此车型的组成比例很对当时的交通流量有一定影响,统计同一时间各种车型的比重也有实际意义。节假日因素是指国家的法定节假日会造成额外的人口迁移,例如回家、旅游等。目标高速公路路段两端城市的热点事件(可通过对社交网络进行热点事件自动抓取和分析获得),例如演唱会、运动会、大型会议等吸引大量人员,也会对对短时间内的交通流量有较大影响。此外,还可参考第三方服务对目标路段拥塞情况的统计结果,例如高德地图、百度地图等。因为此类第三方服务除了从交管系统获得实时数据以外,还会对自身服务用户(即使用高德地图的用户本身的GPS定位信息会持续反馈到高德的服务器)的移动轨迹进行分析,实现对路段拥堵程度的实时统计。而拥塞状况对流量有直接影响,因此可以调用第三方导航服务开放的接口获得目标路段的实时路况信息辅助交通流量的预测。除了上述因素外,天气因素对交通流量也有很大影响。例如雨、雪、雾、强光等自然现象都会导致司机主观上改变行车速度和车距。可根据目标路段定位信息从气象网站上爬取对应的短时天气数据,包括能见度、道路干湿、风力大小等。当上述数据获取后再根据时间信息进行关联,若单点数据存在缺损和异常(特别高或者特别低),可采用历史平滑进行补充和修正。
步骤1中,先确定待测量点的地理位置,根据实际的高速公路路线,结合MarkosPapageorgiou动态模型,收集上下游测量点和上下游收费站的相关数据,如上下游测量点前a分钟的交通流量数据,收费站前b分钟的进出车量数据,以及测量点路段的气候(降雨量、风向、风力、能见度),以及当前测量点前30分钟(6个,每5分钟测量一次)和前一天的前15分钟(3个)数据(a,b的取值视上下游收费站与测量点的距离)。此外,还需调用高德地图API获取实时路况拥塞状态、查看日历获取法定节假日信息、收集收费站和磁感线线圈统计各车型数量计算车型占比。利用事件发现处理程序(通过在微博等社交网络进行数据爬取分析实现)获取目标路段附近城市一周内的突发热点活动及具体时间,并根据讨论量评估热度等级。在经过常规的数据预处理手段后,对缺失数据和异常数据采取历史平滑进行补充或替换,形成本方法需要的多源数据。
步骤1中,对多源数据中存在缺失和异常(该值相对前后时刻的数据,太大或太小)的情况采用历史平滑进行补充和修正:与通常的历史平滑不同的是考虑到周期性因素,本发明对流量相关的少量损失的数据利用前后时刻交通流量和一周前当时时刻进行加权平均,主要考虑到一周中每天工作可能不同导致。对于节假日和突发热点事件的交通流量可能需要减少一周前数据的权重并增加一个因子。根据如下公式计算当前缺失数据Xt:
Xt=a×Xt-1+b×Xt+1+c×Xt-288×7,
a+b+c=1,
其中,Xt-1为前一个数据,Xt+1为后一个数据,t-288*7为一周前的数据,a、b、c为各数据的权重。
步骤2包括以下步骤:
步骤2-1,构建支持向量回归模型(参考文献:晏雨婵,武奇生,白磷,席维.采用MPSO优化SVR的短时交通流预测方法[J/OL].计算机技术与发展,2019(04):1-6[2019-04-12].),将多源数据作为样本特征,预测未来5分钟的交通流量;
步骤2-2,构建基于遗传算法的BP神经网络模型(参考文献:凌智.基于BP神经网络的高速公路车流量预测研究[D].武汉理工大学,2014.),将多源数据样本作为样本特征,并采用遗传算法对神经网络初始权值进行优化,预测未来15分钟内的交通流量,模型构建方面采用23-32-16-3的层次结构,学习率为0.1,采用均方误差 作为代价函数,其中N为样本总数,yi为第i个样本的真实值,为第i个样本的测量值,采用随机梯度算法作为优化方法,训练次数1000次,设置停止训练条件为两次epoch的损失差小于0.01,一共1347个参数,故遗传算法个体大小1347,并设置种群大小为30,遗传代数为50,交叉概率为0.75,变异概率为0.05,神经网络的损失作为测量个体适应度的指标;
步骤2-3,构建长短期记忆网络模型(参考文献:http://colah.github.io/posts/2015-08-Understanding-LSTMs),使用上下游测量点交通流量数据、当天前30分钟、前一天15分钟交通流量数据作为样本特征,预测未来15分钟的交通流量,时间步长为24,即每五分钟一个测量点共120分钟,使用tensorflow框架中的基本LSTM模块,设置中间神经元为32,最后通过全连接预测未来15分钟的交通流量。
步骤2-1中,支持向量回归模型的核函数选择径向基函数(RBF),将其映射到高维空间进行处理,同时为了增加其泛化能力和鲁棒性,设定一定的容忍度C=1.0,松弛因子为0.5。
步骤3中,将步骤2构建的三个模型组成混合模型,进行交通流量预测,在滑动窗口中使用Google的Ceres-Solver库(参考:http://ceres-solver.org/)对三个模型在混合模型中所占的权重进行优化,并确定三个模型在混合模型中所占的权重。
步骤3中,在进行交通流量预测之前,选择一定的时间长度k,即滑动窗口大小为k,则有k个样本(特征x和标签y)。为了优化组合模型中个模型的权值,因此将k个样本代入混合模型有:
A*SVR(X1)+B*GABP(X1)+C*LSTM(X1)=Y1,
A*SVR(X2)+B*GABP(X2)+C*LSTM(X2)=Y2,
A*SVR(Xk)+B*GABP(Xk)+C*LSTM(Xk)=Yk,
其中SVR、GABP、LSTM分别代表支持向量回归模型、遗传算法优化的BP神经网络模型、长短期记忆神经网络模型。Xi表示输入的第i条记录的特征数据,Yi表示输入的第i条记录的交通流量。A+B+C=1其中A,B,C为为各模型在混合模型中所占权重,为了达到最好的效果,需要优化A、B、C使得每个表达式最后的误差之和最小。在这里使用谷歌的优化库Ceres-Solver进行优化,得到最优的A、B、C,为了减少实现优化带来的时延,滑动窗口的步长为滑动窗口的大小,且只有在移动一次新的情况下才进行优化。
步骤4中,在进行预测完之后,由于数据集得到补充,可以采取增量训练的方式进行训练以解决开始情况下神经网络的训练数据不足的情况。同时可以实时调整模型的参数应变高速公路的变化情况。每一次的在线学习步骤,都是将原始权值作为初始参数进行训练的。在此,选择几个滑动步长之后,对每一个模型,先加载原来的权值,用其初始化需要增量训练的神经网络的权值。再在收集到的数据集上训练。
有益效果:
使用多源数据作为输入特征,综合考虑多种影响交通流的特征因子,模型的预测准确率更高,能够捕获由突发事件造成的交通流量波动。采用有不同优点的模型,使其在不同的阶段(数据量的变化)都能很好的适应环境。预测模型的在线更新,数据特征在没有大的改变下,可以自适应调整模型参数使得模型适应新的环境。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1为本发明所借鉴的Markos Papageorgiou动态模型。
图2为本发明所述的整体流程图。
图3为本发明步骤II中的GA-BP神经网络的拓扑结构。
图4为本发明步骤II中的LSTM神经网络的拓扑结构。
具体实施方式
如图1、图2、图3、图4所示,本实施例中提供一种基于多源数据和滑动窗口组合的高速公路交通流量预测方法,可分为构建数据样本、SVR,遗传算法优化的BP神经网络和LSTM神经网络模型的构建、以及混合模型的组合和增量训练的构建。
所述基于多源数据与滑动窗口组合的高速公路流量预测方法包括以下步骤:
步骤一:根据测量点、Markos Papageorgiou动态模型以及高速公路的实际路况,找到上下游测量点、以及收费站的车辆进出数据、以及周边的气候。对于前面两种数据,需要相关部门配合,对于周边气候,本实例是直接去相关气候网站上爬取。上下游测量点选取3个,收费站的车量统计30分钟内的数据,将降雨量和风速数值化,选择测点前6个数据以及前一天此时的3个数据,共15个数据;实时路况信息,通过申请百度地图和高德地图开发者API,通过API查询目标路段实时路况,根据路况的信息对路况进行离散化;车辆占比则通过收集交通流量的磁线圈等进行统计;节假日直接根据当时日期进行查阅;测量点的热点事件,需要利用事件抽取,提取相应事件,再过滤无关事件,最后利用事件等级评定,离散化事件的强度。对于缺失过长的数据选择放弃(一天以上),对于短时的数据采用历史滑动方法进行处理。
步骤二:SVR使用9个测量点的历史数据和3个上下游测量点的数据,以及一个时间、一个降雨、风强、风向、能见度、大型车占比、中型车占比、小型车占比、节假日标志、附近城市热点事件等级、路况拥塞等级作为特征,测量点未来五分钟的数据作为真实值。BP神经网络,LSTM神经网络、SVR使用上述23个特征作为输入,前两者预测未来15分钟的交通流量,SVR预测未来5分钟的交通流量。
步骤三:在这个实例中,滑动窗口大小选择一个星期。每次将之前训练好的模型组合在一起,采用谷歌的优化库Ceres-Solver进行在滑动窗口上对各模型权值进行优化。得到A、B、C的最优解,代入该测量点的实时数据预测下一时刻的数据。同时将该数据保存在本地,当数据量达到4个窗口大小的时候,进行在线学习,加载原有的模型参数作为待训练模型的初始值,再在4个窗口大小的数据上进行训练。
本发明提供了基于多源数据与滑动窗口组合的高速公路流量预测方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (1)
1.基于多源数据与滑动窗口组合的高速公路流量预测方法,其特征在于,包括以下步骤:
步骤1,综合考虑多维交通流量影响因子在时间和空间上的相关性,采集多种数据构建多源数据集;
步骤2,在多源数据集上构建支持向量回归模型、构建基于遗传算法的BP神经网络模型、构建长短期记忆网络模型;
步骤3,将步骤2构建的三个模型组成混合模型,设置三个模型在混合模型中的权重,对三个模型在混合模型中所占的权重进行优化,再使用优化后的混合模型对未来的交通流量进行预测;
步骤4,每当新采集到的数据达到一周时,采用增量训练方式,优化步骤2构建的三个模型的参数;
步骤1包括:采集多源数据,包括基于Markos Papageorgiou宏观动态模型的上下游测量点的交通流量以及上下游收费站收费信息、上下游测量点之间的高速区域的天气情况和当时时刻;测量点前一段时间的交通流量,测量点前一天前一段时间的交通流量;当时上下游测量点之间的区间路段里面的各类车型的占比;当时测量点是否处于节假日;当时测量点的路况信息;测量点上下游城市的热点事件;将以上信息作为最终的多源数据特征;
步骤1中,对多源数据中存在缺失和异常的情况采用历史平滑进行补充和修正:根据如下公式计算当前缺失数据Xt:
Xt=a×Xt-1+b×Xt+1+c×Xt-288×7,
a+b+c=1,
其中,Xt-1为前一个数据,Xt+1为后一个数据,t-288*7为一周前的数据,a、b、c为各数据的权重;
步骤2包括以下步骤:
步骤2-1,构建支持向量回归模型,将多源数据作为样本特征,预测未来5分钟的交通流量;
步骤2-2,构建基于遗传算法的BP神经网络模型,将多源数据样本作为样本特征,并采用遗传算法对神经网络初始权值进行优化,预测未来15分钟内的交通流量,模型构建方面采用23-32-16-3的层次结构,学习率为0.1,采用均方误差作为代价函数,其中N为样本总数,yi为第i个样本的真实值,为第i个样本的测量值,采用随机梯度算法作为优化方法,训练次数1000次,设置停止训练条件为两次epoch的损失差小于0.01,一共1347个参数,故遗传算法个体大小1347,并设置种群大小为30,遗传代数为50,交叉概率为0.75,变异概率为0.05,神经网络的损失作为测量个体适应度的指标;
步骤2-3,构建长短期记忆网络模型,使用上下游测量点交通流量数据、当天前30分钟、前一天15分钟交通流量数据作为样本特征,预测未来15分钟的交通流量,时间步长为24,即每五分钟一个测量点共120分钟,使用tensorflow框架中的基本LSTM模块,设置中间神经元为32,最后通过全连接预测未来15分钟的交通流量;
步骤3中,将步骤2构建的三个模型组成混合模型,进行交通流量预测,在滑动窗口中使用Google的Ceres-Solver库对三个模型在混合模型中所占的权重进行优化,并确定三个模型在混合模型中所占的权重;在进行交通流量预测之前,需要选择一定的时间长度k,即滑动窗口大小为k,则有k个样本,将k个样本代入混合模型有:
其中SVR、GABP、LSTM分别代表支持向量回归模型、遗传算法优化的BP神经网络模型、长短期记忆神经网络模型;Xi表示输入的第i条记录的特征数据,Yi表示输入的第i条记录的交通流量;A、B、C为各模型在混合模型中所占权重;使用谷歌的优化库Ceres-Solver进行优化,得到最优的A、B、C,滑动窗口的步长为滑动窗口的大小,且只有在移动一次新的情况下才进行优化;
步骤4中,对于混合模型中的三个模型,在收集到一定数量的数据后,采用增量训练的方法,先加载训练好的模型的参数作为模型的初始值,在此基础上,用近段时间内收集的数据对每个模型进行训练,优化模型参数,实现混合模型增量更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911233275.9A CN110956807B (zh) | 2019-12-05 | 2019-12-05 | 基于多源数据与滑动窗口组合的高速公路流量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911233275.9A CN110956807B (zh) | 2019-12-05 | 2019-12-05 | 基于多源数据与滑动窗口组合的高速公路流量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110956807A CN110956807A (zh) | 2020-04-03 |
CN110956807B true CN110956807B (zh) | 2021-04-09 |
Family
ID=69980043
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911233275.9A Active CN110956807B (zh) | 2019-12-05 | 2019-12-05 | 基于多源数据与滑动窗口组合的高速公路流量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110956807B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111625994B (zh) * | 2020-05-25 | 2022-10-25 | 齐鲁工业大学 | 一种基于动态集成神经网络的多源信息融合火灾预测方法 |
CN112131951B (zh) * | 2020-08-26 | 2024-03-01 | 中通服咨询设计研究院有限公司 | 一种自动化识别施工中违规使用梯子行为的系统 |
CN112801400A (zh) * | 2021-02-09 | 2021-05-14 | 重庆大学 | 一种融合多尺度lstm与bp神经网络的收费站下道流量短时预测方法 |
CN113112791A (zh) * | 2021-03-26 | 2021-07-13 | 华南理工大学 | 一种基于滑动窗口长短时记忆网络的交通流量预测方法 |
CN113674524A (zh) * | 2021-07-28 | 2021-11-19 | 长安大学 | 基于lstm-gasvr的多尺度短时交通流预测建模、预测方法及系统 |
CN114706144B (zh) * | 2022-02-24 | 2024-10-18 | 南方海洋科学与工程广东省实验室(湛江) | 海洋环境预报方法、装置、系统及存储介质 |
CN116318761B (zh) * | 2022-09-09 | 2024-02-06 | 广州天懋信息系统股份有限公司 | 基于大数据分析多步实时控制链路检测方法及系统 |
CN117012042B (zh) * | 2023-10-07 | 2024-01-09 | 山东高速股份有限公司 | 一种基于动态复杂网络的交通流量预测方法及设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101593424B (zh) * | 2009-07-10 | 2010-09-29 | 浙江大学 | 一种短时交通流智能组合预测方法 |
CN102693633B (zh) * | 2012-06-07 | 2014-03-12 | 浙江大学 | 一种短时交通流加权组合预测方法 |
WO2017035663A1 (en) * | 2015-09-03 | 2017-03-09 | Miovision Technologies Incorporated | System and method for detecting and tracking objects |
CN105701571A (zh) * | 2016-01-13 | 2016-06-22 | 南京邮电大学 | 一种基于神经网络组合模型的短时交通流量预测方法 |
CN105761488B (zh) * | 2016-03-30 | 2018-11-23 | 湖南大学 | 基于融合的实时极限学习机短时交通流预测方法 |
CN106448151B (zh) * | 2016-07-07 | 2019-12-27 | 河南理工大学 | 一种短时交通流预测方法 |
CN106355879A (zh) * | 2016-09-30 | 2017-01-25 | 西安翔迅科技有限责任公司 | 一种基于时空关联的城市交通流量预测方法 |
CN109243172B (zh) * | 2018-07-25 | 2021-06-08 | 华南理工大学 | 基于遗传算法优化lstm神经网络的交通流预测方法 |
-
2019
- 2019-12-05 CN CN201911233275.9A patent/CN110956807B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110956807A (zh) | 2020-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110956807B (zh) | 基于多源数据与滑动窗口组合的高速公路流量预测方法 | |
CN109923575B (zh) | 测量车辆事故的绝对和/或相对风险可能性的装置和方法 | |
CN108564790B (zh) | 一种基于交通流时空相似性的城市短时交通流预测方法 | |
US7363144B2 (en) | Method and apparatus for predicting future travel times over a transportation network | |
US7236881B2 (en) | Method and apparatus for end-to-end travel time estimation using dynamic traffic data | |
CN109448361B (zh) | 居民交通出行流量预测系统及其预测方法 | |
Mazloumi et al. | An integrated framework to predict bus travel time and its variability using traffic flow data | |
US7894980B2 (en) | Method and apparatus for estimating real-time travel times over a transportation network based on limited real-time data | |
EP3035314A1 (en) | A traffic data fusion system and the related method for providing a traffic state for a network of roads | |
CN110390349A (zh) | 基于XGBoost模型的公交车客流量预测建模方法 | |
CN113962472B (zh) | 一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法 | |
Pflügler et al. | Predicting the availability of parking spaces with publicly available data | |
Schneider et al. | Development and application of the San Francisco pedestrian intersection volume model | |
WO2021115320A1 (zh) | 交通评估方法和系统 | |
Xiong et al. | An integrated and personalized traveler information and incentive scheme for energy efficient mobility systems | |
CN115759329A (zh) | 基于卷积神经网络的景区游客人数预测方法 | |
Ferdous et al. | Comparison of Four-Step Versus Tour-Based Models in Predicting Travel Behavior Before and After Transportation System Changes: Results Interpretation and Recommendations. | |
CN110309953B (zh) | 采用目标流动性分布预测的城市安防监控布局系统及方法 | |
Wang et al. | A vehicle routing model based on large-scale radio frequency identification data | |
CN114724414B (zh) | 城市空中交通分担率的确定方法、装置、电子设备及介质 | |
Li et al. | Driver Source‐Based Traffic Control Approach for Mitigating Congestion in Freeway Bottlenecks | |
CN115640756A (zh) | 一种基于多源数据的停车需求预测模型、方法及其应用 | |
CN114139984A (zh) | 基于流量与事故协同感知的城市交通事故风险预测方法 | |
CN114091772A (zh) | 基于编码器解码器的多角度融合道路交通流量预测方法 | |
CN114139773A (zh) | 一种基于时空图卷积网络的公共交通流量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |