CN113112076A - 一种客流集散模式发现及预测方法 - Google Patents
一种客流集散模式发现及预测方法 Download PDFInfo
- Publication number
- CN113112076A CN113112076A CN202110402707.5A CN202110402707A CN113112076A CN 113112076 A CN113112076 A CN 113112076A CN 202110402707 A CN202110402707 A CN 202110402707A CN 113112076 A CN113112076 A CN 113112076A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- activity
- event
- prediction
- hot spot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000000694 effects Effects 0.000 claims abstract description 126
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 239000000203 mixture Substances 0.000 claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 230000015654 memory Effects 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000013479 data entry Methods 0.000 claims description 2
- 238000013210 evaluation model Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000006403 short-term memory Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Biophysics (AREA)
- Marketing (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种客流集散模式发现及预测方法,包括:(1)采集赛事活动参与人次信息,将赛事活动分级和标记;采集客流数据;对客流数据进行出行链提取;(2)基于出行链提取结果和赛事活动分级和标记结果,计算多边形区域净客流量,得出热点区域及站点;(3)提取热点公交站点的客流集散特征;(4)将已构建的客流集散特征基于高斯混合模型进行聚类训练,得出聚类结果并分析;(5)对热点公交站点提取客流预测特征;(6)对客流预测特征中的离散特征进行独热编码和标准化;(7)基于LSTM方法,训练预测模型并保存;(8)将预测集输入保存的模型中得到赛事活动期间的热点公交站点客流预测结果,实现赛事活动期间热点公交站点客流预测。
Description
技术领域
本发明隶属于交通大数据和智能交通领域,一种客流集散模式发现及预测方法。
背景技术
赛事活动期间,客流在区域上,重点聚集在赛事场馆周边主要公交站点上,在时间上,赛事活动开场前(客流汇集)及散场后(客流消散)客流聚散变化明显,因此从空间和时间上,把握客流集散模式并对热点公交站点进行准确预测,可以为公交调度及交通规划提供参考。
Rakha等人利用统计学理论相关分析方法,研究了典型非事故情况下交通状况变化的空间和时间幅度,并且通过分析不同日期之间的交通指数数据,发现核心工作日(周二至周四)与星期一、星期五、星期六以及星期日的交通流特征的变化情况存在显著的差异;
Chung采用了聚类分析的方法,对不同日期的用户出行时间数据分上午和下午不同时段进行分类,结果发现,仅针对上午时段,日期可以分为工作日、星期六和节假日三类,而对于下午时段,分类结果无明显规律。
Hao Li等人以一卡通的公交刷卡数据为主要信息,结合天气数据使用随机森林进行公交客流预测,分析得出,公交客流存在以星期为单位的周期性变化规律,同时天气因素对客流存在较大的影响。
从相关研究中得知,不同场景客流变化模型存在差异,同时公交客流与天气和日期有关,目前针对赛事活动期间客流集散模式的研究较少,而且基于客流数据进行客流预测仅考虑客流轨迹,缺少对客流集散模式的挖掘。
发明内容
本发明解决的技术问题:本发明克服现有技术的不足,针对赛事活动期间的客流数据,提取出行链,发现热点公交站点客流集散模式,同时基于客流集散模式结合活动、客流、时刻、日期和天气数据有效构建特征,利用LSTM(长短期记忆人工神经网络)算法,对不同活动及模式下的热点公交站点客流进行准确预测,填补了赛事活动期间客流集散模式分析及预测方法的空白,同时为赛事活动期间公交合理调度和规划提供参考。
本发明的技术解决方案为:一种客流集散模式发现及预测方法,通过以下步骤实现:
(1)采集赛事活动参与人次信息,将赛事活动分级和标记;通过公交系统乘客刷卡信息,采集客流数据;对客流数据进行出行链提取,计算举办赛事活动时赛事地点周边地铁站在活动结束后一小时内的平均客流量,若大于10000人次标记为大型活动,若大于5000人次标记为中型活动;若大于2000人次标记为小型活动;
(2)基于步骤(1)出行链提取结果和赛事活动分级和标记结果,计算多边形区域净客流量,得出赛事活动期间热点区域及站点;所述多边形区域是指,将赛事活动所在城市例如北京,通过泰森多边形进行区域划分,分别计算每个多边形区域净流量,确定热点区域,例如森林公园,将热点区域中公交站点作为热点公交站点,提取到多个热点公交站点(例如72个);
(3)提取赛事活动期间热点公交站点的客流集散特征,对特征进行预处理及降维操作;热点公交站点净流量为正值,认为该热点公交站点客流正在汇集,标记为1,热点公交站点净流量为负值,认为该热点公交站点客流正在消散,标记为-1,将客流集散特征不明显的热点公交站点进行剔除,共得到剩余的有效热点公交站点;每个小时为一个时间片,根据预定的时间跨度生成时间序列矩阵;使用PCA方法对特征进行处理和降维;
(4)将已构建的客流集散特征基于高斯混合模型进行聚类训练,得出聚类结果并分析;使用“手肘法则”确定聚类簇,选择轮廓系数评估模型可用性,大型活动得到4个聚类簇,中型活动得到3个聚类簇,小型活动期间客流运行平稳,看作1个簇;
(5)对赛事活动期间的热点公交站点提取客流预测特征,包括:单位小时客流人次,活动特征,模式特征,日期特征和天气特征;
(6)对客流预测特征中的离散特征进行独热编码,使得每个特征都对应欧氏空间中的一个点,保证特征距离计算的合理性,对客流预测特征中的连续特征做标准化,统一特征数据变化幅度,加快模型训练过程中梯度下降的速度;
(7)进行客流预测模型训练,其中,四分之三的样本数据作为训练集,四分之一的样本数据作为预测集,将训练集和预测集的特征同时按照步骤(7)进行特征处理之后,基于长短期记忆人工神经网络LSTM方法,输入训练集,训练预测模型并保存;
(8)将预测集输入保存的模型中得到预测结果,实现各类赛事活动期间热点公交站点客流情况预测。
进一步的,所述步骤(1)计算赛事活动参与人次,将赛事活动分级和标记需要对客流数据进行出行链提取,提取要求为出行链合并及过滤换乘数据;其中出行链合并是指:去除冗余数据条目,对筛选后的数据做出行链合并,去除中间节点;过滤换乘数据是指:两次乘车时间间隔小于15min且两次乘车地点步行距离小于1.5km时,视为一次换乘,作为一条出行链中的一部分。
进一步的,所述步骤(1)中根据赛事活动附近地铁站乘车人数进行活动划分。
进一步的,所述步骤(2)中多边形区域净流量指每小时多边形区域净入流量与净出流量之差。
进一步的,所述步骤(3)中,预定时间跨度为10个小时,是指:在晚间19:00-22: 00举办赛事活动期间,经过统计,乘客最早于活动开场前4个小时开始汇集,最迟在活动结束后2个小时完成消散过程,因此时间跨度为15:00-24:00,共9个时间片。
进一步的,所述步骤(5)中,客流人次为每小时客流数值,活动类型做如下映射{“大型活动”:2,“中型活动”:1,小型活动:0}。
进一步的,所述步骤(5)中客流集散模式做如下映射:{“大型活动模式一”:7,“大型活动模式二”:6,“大型活动模式三”:5,“大型活动模式四”:4,“中型活动模式一”:3,“中型活动模式二”:2,“中型活动模式三”:1,“小型活动”:0}。
进一步的,所述步骤(5)中日期信息,分为工作日和节假日,做如下映射{“工作日”: 0,“节假日”:1}。
进一步的,所述步骤(5)中天气信息,包括天气、温度和风力,其中天气做如下映射: {“晴”:0,“多云”:1,“阴”:2,“小雨”:3,“小到中雨”:4,“中雨”:5,“中到大雨”:6,“大雨”:7,“大到暴雨”:8,“霾”:9,“阵雨”:10,“雷阵雨”:11};温度包含最高温度、最低温度和平均温度,为数值;风力做如下映射:{“无持续风向≤1级”:0,“无持续风向≤2级”:0,“无持续风向≤3级”:0,“西南风≤1级”:0,“西南风≤2级”:0,“西南风≤3级”:1,“西南风≤4级”:2,“东南风≤2级”:0,“西风≤1 级”:0,“南风≤1级”:0,“南风≤2级”:0}。
本发明与现有技术相比的优点在于:
(1)目前对于客流集散模式分析相关的研究较少,现有技术主要是针对交通拥堵展开的研究,因此本发明首次研究了赛事活动期间的客流集散模式,填补了该研究领域的空白。
(2)本发明通过计算区域净客流量的方式,挖掘热点区域,发现热点站点,通过分析热点站点净客流量,将赛事活动进行分级分类并提取客流集散特征,使用高斯混合模型进行聚类。本发明使用高斯混合模型的优点是,可以将数据分别投影到每个分布上,并计算由该分布生成的概率,并不是非0即1的,因此结果更加客观。
(3)本发明对公交客流进行预测,不局限于分析客流轨迹,加入了客流集散模式特征,结合赛事特征、时刻特征、日期特征和天气特征,构建客流预测特征,建立LSTM(长短期记忆人工神经网络)客流预测模型,实现了对热点公交站点较为准确的预测。
附图说明
图1是本发明一种客流集散模式发现及预测方法流程图;
图2是本发明中基于高斯混合算法的赛事活动期间客流集散模式聚类分析流程图;
图3是本发明中基于LSTM(长短期记忆人工神经网络)算法的赛事活动期间热点公交站点客流预测流程图。
具体实施方式
以下结合附图对本发明进行详细说明。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化、变型和优点都被包括在本发明中。
如图1、2、3所示,根据本发明的实施例,提出一种客流集散模式发现及预测方法,用于在赛事活动期间、或大型活动、聚会期间对客流进行预测分析,具体步骤如下:
(1)计算赛事活动参与人次,将赛事活动分级和标记。
a.首先遍历客流数据,去除数据冗余,具体内容是:对于每位乘客的单次出行,乘客出发地为S1站点,目的地为S2站点,数据集中往往存在若干条这样的刷卡记录: S1->P,P站为S1和S2之间的某个站点。对于这样的数据,筛选出乘客从S1->S2之间历时最长的刷卡记录,剔除中间刷卡记录。
b.将出行链进行合并,具体内容为:原始一卡通数据记录的为乘客单次出行的乘车记录,若乘客在出行过程中进行了换乘,原始数据中将会出现多条记录,对于这样的出行数据,通过设置两次乘车时间间隔不大于15min和两次乘车点距离不大于1.5km进行筛选,从而过滤记录,合并出行链。
c.赛事活动分级和标记,具体内容为:基于出行链提取结果,计算体育场晚间(19:00-22:00)举办赛事活动时公园地铁站在活动结束后一小时内(22:00-23;00)的平均客流量,若大于10000人次标记为大型活动,若大于5000人次标记为中型活动;若大于2000人次标记为小型活动。
(2)计算赛事活动期间的热点区域和热点公交站点,提取客流集散特征。
a.根据本发明的实施例,以北京为例,首先根据北京市地铁站信息可将北京市划分为241个多边形区域,基于出行链提取结果,计算体育场举办赛事活动期间每个多边形区域的净客流量,筛选出赛事活动期间的热点区域,将热点区域内的公交车站定义为热点公交站点。
b.假设在公园进行赛事活动,计算公园地铁站在各赛事活动期间的净客流量,将赛事活动标记为三类:大型活动、中型活动和小型活动。
c.针对每种活动类型计算热点公交站点24小时内的平均净客流量,通过与日常平均净客流量类比,筛选在赛事活动期间存在集散情况的时段为赛前5小时至赛后2小时,共10个时刻,分为9个时间片,得到72*9的时间序列矩阵。
d.对净客流量进行客流集散特征定义,若站点在某时刻较日常净客流量为正值,定义为客流汇集,标记为1,若站点在某时刻较日常净客流量为负值,定义为客流消散,标记为-1,若站点在某时刻净客流量较日常为0,定义为客流集散特征不明显,标记为0. 最后剔除掉在9个时间片内,客流集散特征都不明显的站点,得到58*9的客流集散特征矩阵。
(3)将得到的客流集散特征矩阵输入到高斯混合模型中进行聚类分析。
a.首先根据“手肘法则”定义簇的数量K,大型活动定义K=4,中型活动定义K=3,对于每一个分量k分别初始化πk,πk和∑k.其中πk和∑k分别为第k个单高斯分布的均值向量和协方差矩阵;η(x|μk,∑k)称为混合模型中的第k个分量,πk是每个分量的权重。
b.使用EM算法计算以下对数似然函数至收敛。
c.使用轮廓系数评估聚类模型效果,轮廓系数值属于(-1,1),值越大表明聚类效果越好。大型活动聚类簇数量为4,轮廓系数为0.3311,中型活动聚类簇数量为3,轮廓系数为0.2708,聚类效果较好。
(4)根据聚类结果,结合活动类型、日期类型和天气数据,构建赛事活动期间的客流预测特征。
a.对赛事活动类型做如下映射,{“大型活动”:2,“中型活动”:1,小型活动:0}。
b.对客流集散模式做如下映射,{“大型活动模式一”:0,“大型活动模式二”:1,“大型活动模式三”:2,“大型活动模式四”:3},{“中型活动模式一”:0,“中型活动模式二”:1,“中型活动模式三”:2},{“小型活动”:0}。
c.对日期类型做如下映射,{“工作日”:0,“节假日”:1}。
d.对天气数据做如下映射:{“晴”:0,“多云”:1,“阴”:2,“小雨”:3,“小到中雨”:4,“中雨”:5,“中到大雨”:6,“大雨”:7,“大到暴雨”:8,“霾”:9,“阵雨”:10,“雷阵雨”:11}。
e.温度数据包含三个特征值,最高温度、最低温度和平均温度。
f.对风力做如下映射:{“无持续风向≤1级”:0,“无持续风向≤2级”:0,“无持续风向≤3 级”:0,“西南风≤1级”:0,“西南风≤2级”:0,“西南风≤3级”:1,“西南风≤4级”:2,“东南风≤2 级”:0,“西风≤1级”:0,“南风≤1级”:0,“南风≤2级”:0}。
(5)对客流预测特征分别做独热编码和标准化。
a.对离散值做独热编码,使得每个特征对应欧式空间中的一个点。例如:为工作日表示为[1,0],为节假日表示为[0,1]。
b.对连续值做标准化,缩小特征之间数据幅度,加快梯度下降速度。
c.客流人次、时间序列、活动特征、集散特征、日期特征、天气特征及相关特征的均值,最值进行处理后,共组成46维客流预测特征。
(6)使用LSTM(长短期记忆人工神经网络)模型训练并保存预测模型,最终得到赛事活动期间的客流预测结果。
a.将原始数据集按照4:1的比例,分为训练集和测试集,按照(5)分别处理训练集特征和测试集特征。
b.LSTM(长短期记忆人工神经网络)模型神经元个数选择为50,处理的序列长度设置为10,激活函数选择为默认激活函数,损失函数选择MSE,优化器选择Adam,epoch 设置为50,batch_size设置为72。
c.训练完成后,保存预测模型,输入测试集,得到最终客流预测结果。
以下以2017年体育场举办的赛事活动为例,进一步说明本发明的赛事活动期间客流集散模式发现结果和预测效果。
1.体育场举办大型活动如明星演唱会期间,共有四种客流集散模式。
a.模式一代表车站为学院路桥东公交站、北沙滩桥东公交站。乘车客流特点:在赛事活动开场前4小时开始,公交站点乘车客流迅速增长,并在活动开场前1小时乘车客流达到高峰,在活动开始2小时候恢复平稳;下车客流特点:在活动开场前3小时开始,公交站点下车客流缓慢增长,并在活动开场前1小时达到高峰,在活动开始后1小时达到平稳状态。
b.模式二代表站点为公园地铁站和北京西站地铁站。乘车客流特点:在赛事活动开场前4小时开始,公交站点乘车客流迅速增长,并在活动开场前2小时达到高峰,约为日常客流4倍;在活动开始1小时后恢复平稳;下车客流特点:在赛事活动开场前2小时开始,公交站点乘车客流略有增长,该状态持续至活动结束;在活动结束后下车客流迅速增长,并在活动结束一小时达到高峰,约为日常客流10倍。
c.模式三代表站点为西土城地铁站和马甸桥南公交站。乘车客流特点:在赛事活动开场前3小时,公交站点乘车客流逐渐增长,并在活动开场前1小时乘车客流达到高峰;在活动开始1小时后恢复平稳;下车客流特点:在赛事活动开场前3小时,公交站点下车客流迅速增长,并在活动开场前1小时达到高峰;在活动开始1小时后恢复平稳。
d.模式四代表站点为双桥地铁站和南沟泥河公交站。乘车客流特点:赛事活动开场前3小时,公交站点乘车客流逐渐增长,并在活动开场时达到高峰;在活动开始2小时恢复平稳;下车客流特点:在赛事活动开场前3小时,公交站点下车客流迅速增长,并在一小时后下车客流达到高峰;在活动开始1小时后恢复平稳。
2.体育场举办中型活动如足球赛期间,共有三种集散模式。
a.模式一代表站点为北京西站地铁站和双桥地铁站。乘车客流特点:在赛事活动开场前3小时至开场,公交站点乘车客流略有增长,总体呈平稳状态;下车客流特点:在活动开场前2小时开始至活动结束后2小时,公交站点下车客流略有增长,总体呈平稳状态。
b.模式二代表站点为西土城地铁站和安立路地铁站。乘车客流特点:在赛事活动开场前4小时至开场后1小时,公交站点乘车客流略有增长,总体呈平稳状态;下车客流特点:在活动开场前4小时至活动开场前1小时,公交站点下车客流略有增长,在活动开场前2小时达到小高峰,之后客流呈平稳状态。
c.模式三代表站点为公园地铁站。乘车客流特点:在赛事活动开场前3小时,公交站点乘车客流迅速增长,并在开场前1小时达到高峰,之后乘车客流逐渐减少,在活动开场后1小时,乘车客流恢复平稳;下车客流特点:在活动开场前4小时至活动开场前 1小时,公交站点下车客流略有增长,在活动开场后,下车客流逐渐增加,并在活动结束时达到高峰,约为日常客流的4倍,之后下车客流逐渐减少,恢复平稳。
3.基于以上聚类结果,以大型活动期间公园地铁站为例,可提取到活动特征为2,模式特征为1,结合时序客流信息、日期信息及天气信息可得到公园地铁站在大型活动期间的客流预测特征向量。将四分之三的数据集作为训练集进行处理后,使用LSTM(长短期记忆人工神经网络)模型进行训练,并保存模型参数;将剩余四分之一的数据作为测试集进行同样的处理后,可以使用预测模型得到大型活动期间公园地铁站最终的客流预测结果。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,且应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (9)
1.一种客流集散模式发现及预测方法,其特征在于:通过以下步骤实现:
(1)采集赛事活动参与人次信息,将赛事活动分级和标记;通过公交系统乘客刷卡信息,采集客流数据;对客流数据进行出行链提取,计算举办赛事活动时赛事地点周边地铁站在活动结束后一小时内的平均客流量,若大于10000人次标记为大型活动,若大于5000人次标记为中型活动;若大于2000人次标记为小型活动;
(2)基于步骤(1)出行链提取结果和赛事活动分级和标记结果,计算多边形区域净客流量,得出赛事活动期间热点区域及站点;所述多边形区域是指,将赛事活动所在城市,通过泰森多边形进行区域划分,分别计算每个多边形区域净流量,确定热点区域,将热点区域中公交站点作为热点公交站点,提取到多个热点公交站点;
(3)提取赛事活动期间热点公交站点的客流集散特征,对特征进行预处理及降维操作;热点公交站点净流量为正值,认为该热点公交站点客流正在汇集,标记为1,热点公交站点净流量为负值,认为该热点公交站点客流正在消散,标记为-1,将客流集散特征不明显的热点公交站点进行剔除,共得到剩余的有效热点公交站点;每个小时为一个时间片,根据预定的时间跨度生成时间序列矩阵;使用PCA方法对特征进行处理和降维;
(4)将已构建的客流集散特征基于高斯混合模型进行聚类训练,得出聚类结果并分析;使用“手肘法则”确定聚类簇,选择轮廓系数评估模型可用性,大型活动得到4个聚类簇,中型活动得到3个聚类簇,小型活动期间客流运行平稳,看作1个簇;
(5)对赛事活动期间的热点公交站点提取客流预测特征,包括:单位小时客流人次,活动特征,模式特征,日期特征和天气特征;
(6)对客流预测特征中的离散特征进行独热编码,使得每个特征都对应欧氏空间中的一个点,保证特征距离计算的合理性,对客流预测特征中的连续特征做标准化,统一特征数据变化幅度,加快模型训练过程中梯度下降的速度;
(7)进行客流预测模型训练,其中,四分之三的样本数据作为训练集,四分之一的样本数据作为预测集,将训练集和预测集的特征同时按照步骤(7)进行特征处理之后,基于长短期记忆人工神经网络LSTM方法,输入训练集,训练预测模型并保存;
(8)将预测集输入保存的模型中得到预测结果,实现各类赛事活动期间热点公交站点客流情况预测。
2.根据权利要求1所述的一种客流集散模式发现及预测方法,其特征在于:所述步骤(1)计算赛事活动参与人次,将赛事活动分级和标记需要对客流数据进行出行链提取,提取要求为出行链合并及过滤换乘数据;其中出行链合并是指:去除冗余数据条目,对筛选后的数据做出行链合并,去除中间节点;过滤换乘数据是指:两次乘车时间间隔小于15min且两次乘车地点步行距离小于1.5km时,视为一次换乘,作为一条出行链中的一部分。
3.根据权利要求1所述的一种客流集散模式发现及预测方法,其特征在于:所述步骤(1)中根据赛事活动附近地铁站乘车人数进行活动划分。
4.根据权利要求1所述的一种客流集散模式发现及预测方法,其特征在于:所述步骤(2)中多边形区域净流量指每小时多边形区域净入流量与净出流量之差。
5.根据权利要求1所述的一种客流集散模式发现及预测方法,其特征在于:所述步骤(3)中,预定时间跨度为10个小时,是指:在晚间19:00-22:00举办赛事活动期间,经过统计,乘客最早于活动开场前4个小时开始汇集,最迟在活动结束后2个小时完成消散过程,因此时间跨度为15:00-24:00,共9个时间片。
6.根据权利要求1所述的一种客流集散模式发现及预测方法,其特征在于:所述步骤(5)中,客流人次为每小时客流数值,活动类型做如下映射{“大型活动”:2,“中型活动”:1,小型活动:0}。
7.根据权利要求1所述的一种客流集散模式发现及预测方法,其特征在于:所述步骤(5)中客流集散模式做如下映射:{“大型活动模式一”:7,“大型活动模式二”:6,“大型活动模式三”:5,“大型活动模式四”:4,“中型活动模式一”:3,“中型活动模式二”:2,“中型活动模式三”:1,“小型活动”:0}。
8.根据权利要求1所述的一种客流集散模式发现及预测方法,其特征在于:所述步骤(5)中日期信息,分为工作日和节假日,做如下映射{“工作日”:0,“节假日”:1}。
9.根据权利要求1所述的一种客流集散模式发现及预测方法,其特征在于:所述步骤(5)中天气信息,包括天气、温度和风力,其中天气做如下映射:{“晴”:0,“多云”:1,“阴”:2,“小雨”:3,“小到中雨”:4,“中雨”:5,“中到大雨”:6,“大雨”:7,“大到暴雨”:8,“霾”:9,“阵雨”:10,“雷阵雨”:11};温度包含最高温度、最低温度和平均温度,为数值;风力做如下映射:{“无持续风向≤1级”:0,“无持续风向≤2级”:0,“无持续风向≤3级”:0,“西南风≤1级”:0,“西南风≤2级”:0,“西南风≤3级”:1,“西南风≤4级”:2,“东南风≤2级”:0,“西风≤1级”:0,“南风≤1级”:0,“南风≤2级”:0}。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110402707.5A CN113112076B (zh) | 2021-04-14 | 2021-04-14 | 一种客流集散模式发现及预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110402707.5A CN113112076B (zh) | 2021-04-14 | 2021-04-14 | 一种客流集散模式发现及预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113112076A true CN113112076A (zh) | 2021-07-13 |
CN113112076B CN113112076B (zh) | 2022-06-03 |
Family
ID=76717343
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110402707.5A Expired - Fee Related CN113112076B (zh) | 2021-04-14 | 2021-04-14 | 一种客流集散模式发现及预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113112076B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113570004A (zh) * | 2021-09-24 | 2021-10-29 | 西南交通大学 | 一种乘车热点区域预测方法、装置、设备及可读存储介质 |
CN115086879A (zh) * | 2022-08-22 | 2022-09-20 | 广州市城市规划勘测设计研究院 | 轨道交通站客流特征及接驳方式的识别方法、装置及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583656A (zh) * | 2018-12-06 | 2019-04-05 | 重庆邮电大学 | 基于a-lstm的城市轨道交通客流量预测方法 |
CN110276474A (zh) * | 2019-05-22 | 2019-09-24 | 南京理工大学 | 一种城市轨道交通车站短时客流预测方法 |
CN110889092A (zh) * | 2019-11-20 | 2020-03-17 | 北京市交通运行监测调度中心 | 一种基于轨道交易数据的短时大型活动周边轨道站点客流量预测方法 |
US20200097815A1 (en) * | 2018-09-21 | 2020-03-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for predicting passenger flow |
CN111723991A (zh) * | 2020-06-19 | 2020-09-29 | 北京交通大学 | 大型活动散场客流对地铁车站冲击影响的预测评估方法 |
-
2021
- 2021-04-14 CN CN202110402707.5A patent/CN113112076B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200097815A1 (en) * | 2018-09-21 | 2020-03-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for predicting passenger flow |
CN109583656A (zh) * | 2018-12-06 | 2019-04-05 | 重庆邮电大学 | 基于a-lstm的城市轨道交通客流量预测方法 |
CN110276474A (zh) * | 2019-05-22 | 2019-09-24 | 南京理工大学 | 一种城市轨道交通车站短时客流预测方法 |
CN110889092A (zh) * | 2019-11-20 | 2020-03-17 | 北京市交通运行监测调度中心 | 一种基于轨道交易数据的短时大型活动周边轨道站点客流量预测方法 |
CN111723991A (zh) * | 2020-06-19 | 2020-09-29 | 北京交通大学 | 大型活动散场客流对地铁车站冲击影响的预测评估方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113570004A (zh) * | 2021-09-24 | 2021-10-29 | 西南交通大学 | 一种乘车热点区域预测方法、装置、设备及可读存储介质 |
CN115086879A (zh) * | 2022-08-22 | 2022-09-20 | 广州市城市规划勘测设计研究院 | 轨道交通站客流特征及接驳方式的识别方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113112076B (zh) | 2022-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107610469B (zh) | 一种考虑多因素影响的日维度区域交通指数预测方法 | |
WO2021212866A1 (zh) | 一种车辆出行量预测模型构建方法及预测方法和系统 | |
CN110782070B (zh) | 一种城市轨道交通突发事件客流时空分布预测方法 | |
Weijermars et al. | Analyzing highway flow patterns using cluster analysis | |
Zhang et al. | Understanding taxi service strategies from taxi GPS traces | |
CN109658695B (zh) | 一种多因素的短时交通流预测方法 | |
Tang et al. | Taxi trips distribution modeling based on Entropy-Maximizing theory: A case study in Harbin city—China | |
CN109034449A (zh) | 基于深度学习和乘客行为模式的短期公交客流预测方法 | |
CN110390349A (zh) | 基于XGBoost模型的公交车客流量预测建模方法 | |
CN113112076B (zh) | 一种客流集散模式发现及预测方法 | |
CN108648445B (zh) | 基于交通大数据的动态交通态势预测方法 | |
CN109872535A (zh) | 一种智慧交通通行预测方法、装置及服务器 | |
CN111861027A (zh) | 一种基于深度学习融合模型的城市交通流量预测方法 | |
Li et al. | The forecasting of passenger demand under hybrid ridesharing service modes: A combined model based on WT-FCBF-LSTM | |
CN108281033A (zh) | 一种停车诱导系统及方法 | |
CN111815098A (zh) | 基于极端天气的交通信息处理方法、装置、存储介质和电子设备 | |
CN114066503A (zh) | 一种基于构建虚拟服务片区进行出租车需求预测的方法 | |
Alecsandru et al. | Hybrid model-based and memory-based traffic prediction system | |
Kurte et al. | Regional-scale spatio-temporal analysis of impacts of weather on traffic speed in Chicago using probe data | |
Zhou et al. | Stack ResNet for short-term accident risk prediction leveraging cross-domain data | |
Husni et al. | Predicting traffic conditions using knowledge-growing Bayes classifier | |
CN116311892A (zh) | 一种基于拥堵传播的城市路段通行关键瓶颈识别方法 | |
CN114139984A (zh) | 基于流量与事故协同感知的城市交通事故风险预测方法 | |
Wei et al. | Applying data fusion techniques to traveler information services in highway network | |
CN110909765B (zh) | 一种面向轨迹大数据的行人行为模式分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220603 |
|
CF01 | Termination of patent right due to non-payment of annual fee |