CN116933946A - 一种基于客流去向结构的轨道交通od客流预测方法及系统 - Google Patents
一种基于客流去向结构的轨道交通od客流预测方法及系统 Download PDFInfo
- Publication number
- CN116933946A CN116933946A CN202310982617.7A CN202310982617A CN116933946A CN 116933946 A CN116933946 A CN 116933946A CN 202310982617 A CN202310982617 A CN 202310982617A CN 116933946 A CN116933946 A CN 116933946A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- data
- prediction
- period
- time period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 239000002245 particle Substances 0.000 claims abstract description 57
- 238000012937 correction Methods 0.000 claims abstract description 56
- 238000000547 structure data Methods 0.000 claims abstract description 42
- 238000012952 Resampling Methods 0.000 claims abstract description 13
- 230000006870 function Effects 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 238000007637 random forest analysis Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 8
- 230000007704 transition Effects 0.000 claims description 8
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 5
- 238000003066 decision tree Methods 0.000 claims description 4
- 238000009825 accumulation Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 4
- 238000011161 development Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Resources & Organizations (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于客流去向结构的轨道交通OD客流预测方法及系统,涉及城市轨道交通短时OD客流预测技术领域包括构建时段类别预测模型,输入历史客流数据构建数据集;预测分时客流去向结构,计算同时段下的历史时段客流去向结构的权重,权重加权得到客流去向结构数据的初步预测值;构建客流去向结构自适应修正模型,利用状态空间模型作为客流去向结构自适应修正模型;预测当前时段的客流去向结构数据作为粒子集合,对粒子集合重采样,计算客流去向结构的自适应修正数据。本发明在准确性、可靠性和稳定性方面都取得更加良好的效果。
Description
技术领域
本发明涉及城市轨道交通短时OD客流预测技术领域,具体为一种基于客流去向结构的轨道交通OD客流预测方法。
背景技术
随着轨道交通的迅速发展,很多城市轨道交通线路从单一化逐渐形成轨道交通网络,迅速扩大的轨道交通网络以及急剧增加的轨道交通客流给轨道交通组织和运营管理提出了新的要求。目前传统的轨道交通调度方法尚存在方法单一、效率低、局部供需不平衡等问题。随着大数据、机器学习、深度学习等新兴技术的发展为上述问题的解决提供了有效思路。在时代发展的推动下,城市轨道交通的运营管理也逐步呈现出智能化、数字化的发展趋势。在智能轨道交通的技术生态里可分为智能感知、智能建模、智慧管控等。其中,城市轨道交通短时客流预测是智能感知的研究方向之一,包括了城市轨道短时进站客流预测、短时OD客流区域以及短时断面客流预测等。在智能轨道交通的大数据应用领域,自动售检票系统中存储着海量历史客流数据,通过实时、准确的获取乘客的进出站刷卡数据,实现城市轨道交通短时客流预测。AFC系统中历史客流数据可以揭示客流的时序变化规律,在研究时空客流变化规律上提供重要价值。
可以看出,城市轨道交通短时客流预测在新技术和工具下迎来了发展,充分挖掘利用多源数据准确预测和掌握轨道交通运营网络的时空动态变化规律,对于实现轨道交通短时客流预测的高精度和高效率,助力城市轨道交通运营管理的数字化和精细化。
既有的轨道短时客流预测主要是针对每个站点的历史时间序列数据去观察数据的变化,并以此构建每个站点的短时客流预测模型。但是站点与站点之间会存在着相似的客流趋势。因此,如何充分捕捉这些站点的客流特征,将具有相似客流特征的站点统筹构建一个具有较强泛化能力预测模型对于预测应用而言更具有实际意义。因此,本发明设计了一种基于基于客流去向结构的OD客流实时预测方法。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述存在的问题,提出了本发明。
因此,本发明解决的技术问题是:现有的轨道交通调度方法存在方法单一,效率低,局部供需不平衡,以及如何提高客流OD预测精度的优化问题。
为解决上述技术问题,本发明提供如下技术方案:一种基于客流去向结构的轨道交通OD客流预测方法,包括构建时段类别预测模型,输入历史客流数据构建数据集;预测分时客流去向结构,计算同时段下的历史时段客流去向结构的权重,权重加权得到客流去向结构数据的初步预测值;构建客流去向结构自适应修正模型,利用状态空间模型作为客流去向结构自适应修正模型;预测当前时段的客流去向结构数据作为粒子集合,对粒子集合重采样,计算客流去向结构的自适应修正数据。
作为本发明所述的基于客流去向结构的轨道交通OD客流预测方法的一种优选方案,其中:所述构建时段类别预测模型包括构建训练数据集因变量,利用k-means++算法对历史客流时段客流量数据进行聚类,得到不同类别特征的时段数据,将类别标签作为因变量;所述k-means++算法包括输入需要的聚类数目n,在输入对象中抽取一个聚类中心作为初始聚类中心,计算对象和初始聚类中心的距离,距离远近为正比计算概率产生下一个聚类中心,重复计算获取n个聚类中心,被每个样本对象划分到与其最近的聚类中心,以此得到n个类别,对于每个不同的类别,重新计算样本均值并将得到结果作为新的聚类中心,重复计算样本均值不再有新的聚类中心产生;将各时间段的数据时段属性集合作为输入,类别标签作为输出,站点i的输入样本集Xi和输出样本集Yi,表示为:
其中,x1(L)为车站i时段L的输入样本,经过独热编码处理后的时段属性数据,labeli(l)为车站i时段L的客流去向结构对应的时段类别标签,weeki(l)为是否为工作日,houri(l)为是否为时段,hourtypei(l)为是否为时段类型。
作为本发明所述的基于客流去向结构的轨道交通OD客流预测方法的一种优选方案,其中:所述构建时段类别预测模型还包括随机森林算法和训练模型与预测时段类别;训练集T的大小为N,特征数目为M,随机森林的大小为K,随机森林的算法包括遍历随机森林的大小K次;从训练集T中有放回抽样的方式,取样N次形成一个新的训练集D;选择m个特征,其中m<M;使用新的训练集D和m个特征,通过决策树得到随机森林;将样本集合输入随机森林模型进行模型训练,根据训练好的模型,将需要预测的样本输入到模型中,输出预测数据中时段类别的概率。
作为本发明所述的基于客流去向结构的轨道交通OD客流预测方法的一种优选方案,其中:所述客流去向结构数据的初步预测值包括根据时段类别预测模型,预测得到输入数据时段类别,找出相同类别的历史时段客流数据,通过AFC刷卡数据得到客流去向结构数据,表示为:
Si={Bi(1),Bi(2),...,Bi(s)}
其中,Bi(s)为同时段类别下的客流去向结构数据;历史各时间区间内样本数据和预测时段类别的聚类中心之间的距离及当下时段类别对应的样本权重表示为:
w=w′·w"
其中,w为各个历史时段客流去向结构的权重,w'为预测时段类别对应的概率,w"表示客流样本与聚类中心的系数,dis(Bi(s),c(pre))为聚类中心与历史时段客流样本之间的样本距离,对各历史时段去向结构数据的权重归一化,得到最终权重w*,将权重对历史时段去向结构数据进行加权,得到客流去向结构数据的初步预测值表示为:
在初步预测值加入上一时段的客流去向结构数据,最终的预测模型表示为:
其中,θ为衡量可信度的权重系数。
作为本发明所述的基于客流去向结构的轨道交通OD客流预测方法的一种优选方案,其中:所述构建客流去向结构自适应修正模型还包括构建状态转移方程和构建观测方程;状态转移方程表示为:
xk=f(xk-1,wk-1)
观测方程表示为:
yk=h(xk,vk)
其中,xk-1和xk分别为时刻k-1和时刻k的系统状态变量,yk为时刻k的观测变量,wk-1和vk分别为过程噪音与观测噪音,f是状态变量的时间变化函数,h为状态值与观测值的函数关系,状态转移方程的建立基于上一个时段的客流去向数据得到当前时刻的客流去向结构数据,状态转移方程利用客流去向结构预测模型,表示为:
其中,α为衡量可信度的权重系数,Bi(t-1)为时段t-1的客流去向结构,w(t-1)为高斯白噪音,客流量之间存在约束关系,观测方程通过客流量的约束关系进行建立,实现对于去向结构预测值的自适应修正,客流量的守恒关系主要包括:
qij(t)=oi(t)·bij(t)
其中,qij(t)为t时间内从站点i去往站点j的OD客流,Qi(t)为分时进站客流,bij(t)为客流通过车站i进站并在车站j出站的客流占车站i所有进站客流量之和Oi(t)的比例;以车站i和j分别为起讫点的乘客,从车站i进站后,抵达车站j并出站,对不同时段的客流到达量数据进行统计,客流OD量,客流累计到达量与客流到达系数约束关系表示为:
其中,为客流到达率,rij(t)为客流OD量;轨道交通线网中OD间的乘客旅行时间所跨域的时段个数不超过M,客流OD量表示为:
M根据轨道交通网线的规模或预测时段的时间粒度赋值;观测方程表示为:
映射函数h表示为:
其中,V(t)为测量噪音。
作为本发明所述的基于客流去向结构的轨道交通OD客流预测方法的一种优选方案,其中:所述计算客流去向结构的自适应修正数据包括设置粒子的集合容量为R,并使用服从高斯分布的Box-Muller算法生成粒子噪音;通过AFC闸口刷卡数据,统计客流数据,进站客流量与客流达到率,收集历史AFC客流数据并统计车站历史数据的客流累计到达量Rt(t);根据预测得到的客流去向结构数据Bi(t),生成客流去向结构预测数据的粒子集合并初始化粒子权重为1/R;计算粒子集合中的粒子似然度,似然函数为高斯函数,更新每个粒子的权重wr,在高斯分布中,粒子x,观测值υ与子权重wr关系表示为:
μ=Ri(t)
其中,s为似然函数,g为高斯函数,x为通过粒子计算得到的客流累计到达量,μ为观测得到的客流累计到达量。
作为本发明所述的基于客流去向结构的轨道交通OD客流预测方法的一种优选方案,其中:所述计算客流去向结构的自适应修正数据还包括重采样;归一化粒子中的权重,让权重之和表示为:
算法中的采样空间平均分割成R个层次,每一层取值范围表示为:
在每个取值范围内抽取随机数ur,得到随机数组表示为:
其中,U[0,1]为均匀分布;粒子权重累计函数为对每个ur进行重采样,对位于[cdf(r),cdf(r+1)]中的粒子进行复制;通过对粒子集合进行重采样,得到更新后的粒子均值,通过构建状态空间模型,以AFC闸机刷卡数据建立观测方程,对当前时段的客流去向结构数据进行更新修正,并进行每个时段的迭代计算,随着时段的推进得到车站每一个时段的客流去向结构的自适应修正数据。
本发明的另外一个目的是提供一种基于客流去向结构的轨道交通OD客流预测系统,其能通过计算客流去向结构自适应修正数据模块,可以实现客流预测模型的动态适应和修正,解决了预测不同时段下的客流去向结构不准确的问题。
作为本发明所述的一种基于客流去向结构的轨道交通OD客流预测系统的一种优选方案,其中:包括时段类别预测模块、预测分时客流去向模块、客流去向修正模块、数据修正模块;所述时段类别预测模块用于构建一个预测模型,预测客流数据的时段类别,通过对历史数据进行分类预测建模,识别出不同的时段类别;所述预测分时客流去向模块根据时段类别预测模块的输出,确定当前时段所属的时段类别,计算客流的去向结构的权重,将权重与历史时段去向结构数据进行加权,得到当前时段的分时客流去向结构的初步预测值;所述客流去向修正模块用于构建一个自适应修正模型,对分时客流去向结构进行调整和修正;所述数据修正模块使用预测数据作为初始粒子集合,根据粒子集合重采样,构建状态空间模型,更新每个时段的客流去向结构自适应修正数据,得到车站每个时段的客流去向结构自适应修正数据。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序是实现一种基于客流去向结构的轨道交通OD客流预测方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现一种基于客流去向结构的轨道交通OD客流预测方法的步骤。
本发明的有益效果:本发明提供的一种基于客流去向结构的轨道交通OD客流预测方法通过构建时段类别预测模型和预测分时客流去向结构,该方法能够准确预测不同时间段的客流去向数据。聚类分析和权重计算考虑了历史数据和预测时段类别的概率,从而提高了预测的准确性。构建了客流去向结构自适应修正模型,利用状态空间模型表示客流去向结构的预测值,并通过观测方程进行修正。该模型可以根据历史数据和当前时段的数据进行自适应修正,提高了预测结果的可靠性和稳定性。平均WMAPE的平均值为12.21%,相较于传统模型提高了12%的精度,因此本发明的客流OD实时预测框架具有良好的模型性能。本发明在准确性、可靠性和稳定性方面都取得更加良好的效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一个实施例提供的一种基于客流去向结构的轨道交通OD客流预测方法的整体流程图。
图2为本发明第二个实施例提供的一种基于客流去向结构的轨道交通OD客流预测方法的未修正-修正后客流去向结构预测图。
图3为本发明第二个实施例提供的一种基于客流去向结构的轨道交通OD客流预测方法的客流OD预测图。
图4为本发明第二个实施例提供的一种基于客流去向结构的轨道交通OD客流预测方法的OD量预测结果评价指标对比图。
图5为本发明第三个实施例提供的一种基于客流去向结构的轨道交通OD客流预测系统的整体流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1,为本发明的一个实施例,提供了一种基于客流去向结构的轨道交通OD客流预测方法,包括:
S1:构建时段类别预测模型,输入历史客流数据构建数据集。
更进一步的,构建时段类别预测模型包括构建训练数据集,随机森林算法,训练模型与预测时段类别。
应说明的是,构建训练数据集因变量,利用k-means++算法对历史客流时段客流量数据进行聚类,得到不同类别特征的时段数据,将类别标签作为因变量;所述k-means++算法包括输入需要的聚类数目n,在输入对象中抽取一个聚类中心作为初始聚类中心,计算对象和初始聚类中心的距离,距离远近为正比计算概率产生下一个聚类中心,重复计算获取n个聚类中心,被每个样本对象划分到与其最近的聚类中心,以此得到n个类别,对于每个不同的类别,重新计算样本均值并将得到结果作为新的聚类中心,重复计算样本均值不再有新的聚类中心产生;将各时间段的数据时段属性集合作为输入,类别标签作为输出,站点i的输入样本集和输出样本集:Xi和Yi,表示为:
其中,x1(L)为车站i时段L的输入样本,经过独热编码处理后的时段属性数据,labeli(l)为车站i时段L的客流去向结构对应的时段类别标签,weeki(l)为是否为工作日,houri(l)为是否为时段,hourtypei(l)为是否为时段类型。
还应说明的是,训练集T的大小为N,特征数目为M,随机森林的大小为K,随机森林的算法包括遍历随机森林的大小K次;从训练集T中有放回抽样的方式,取样N次形成一个新的训练集D;选择m个特征,其中m<M;使用新的训练集D和m个特征,通过决策树得到随机森林;将样本集合输入随机森林模型进行模型训练,根据训练好的模型,将需要预测的样本输入到模型中,输出预测数据中时段类别的概率。
还应说明的是,当构建时段类别预测模型时,首先需要构建训练数据集,这个数据集的因变量是类别标签,表示不同的时段类别,为了得到这些类别标签,可以使用k-means++算法对历史客流时段客流量数据进行聚类,通过这个过程,可以得到不同类别特征的时段数据,并将类别标签作为因变量,此外,在训练时段类别预测模型时,需要将各个时间段的数据时段属性集合作为输入样本集,类别标签作为输出样本集,输入样本集表示车站时段的属性数据,经过独热编码处理后的时段属性数据,输出样本集表示车站时段的客流去向结构对应的时段类别标签以及是否为工作日、是否为时段、是否为时段类型的标识,将样本集合输入随机森林模型进行模型训练,训练好的模型可以接受需要预测的样本作为输入,并输出预测数据中时段类别的概率,这样就可以通过模型预测不同时段的类别。
S2:预测分时客流去向结构,计算同时段下的历史时段客流去向结构的权重,权重加权得到客流去向结构数据的初步预测值。
更进一步的,客流去向结构数据的初步预测值包括时段类别预测模型。
应说明的是,预测得到输入数据时段类别,找出相同类别的历史时段客流数据,通过AFC刷卡数据得到客流去向结构数据,表示为:
Si={Bi(1),Bi(2),...,Bi(s)}
其中,Bi(s)为同时段类别下的客流去向结构数据;历史各时间区间内样本数据和预测时段类别的聚类中心之间的距离及当下时段类别对应的样本权重表示为:
w=w′·w"
其中,w为各个历史时段客流去向结构的权重,w'为预测时段类别对应的概率,w"表示客流样本与聚类中心的系数,dis(Bi(s),c(pre))为聚类中心与历史时段客流样本之间的样本距离,对各历史时段去向结构数据的权重归一化,得到最终权重w*,将权重对历史时段去向结构数据进行加权,得到客流去向结构数据的初步预测值表示为:
在初步预测值加入上一时段的客流去向结构数据,最终的预测模型表示为:
其中,θ为衡量可信度的权重系数。
还应说明的是,使用预测模型得到输入数据的时段类别,根据预测模型的结果,找出历史数据中相同类别的时段,这些时段与预测时段类别相同,对于每个历史时段客流去向结构数据,可以计算它与预测时段类别的聚类中心之间的距离,这个距离可以衡量历史数据与预测时段类别的相似程度,同时,为了考虑每个历史时段数据的重要性,可以使用预测时段类别对应的概率作为权重,这个权重表示客流样本与聚类中心的系数,用来衡量历史数据的贡献度,将聚类中心与历史时段客流样本之间的距离与权重相乘,并对所有历史时段去向结构数据的权重进行归一化处理,这样可以得到最终权重,表示每个历史时段数据在预测中的重要性,将最终权重对历史时段去向结构数据进行加权求和,得到客流去向结构数据的初步预测值,这个初步预测值可以反映预测时段的客流去向趋势,将初步预测值与上一时段的客流去向结构数据进行加权融合,得到最终的预测模型,这个融合过程中,权重系数可以用来衡量上一时段数据在预测中的可信度。
S3:构建客流去向结构自适应修正模型,利用状态空间模型作为客流去向结构自适应修正模型。
更进一步的,构建客流去向结构自适应修正模型包括构建状态转移方程和构建观测方程。
应说明的是,状态转移方程表示为:
xk=f(xk-1,wk-1)
观测方程表示为:
yk=h(xk,vk)
其中,xk-1和xk分别为时刻k-1和时刻k的系统状态变量,yk为时刻k的观测变量,wk-1和vk分别为过程噪音与观测噪音,f是状态变量的时间变化函数,h为状态值与观测值的函数关系;状态转移方程的建立基于上一个时段的客流去向数据得到当前时刻的客流去向结构数据,状态转移方程利用客流去向结构预测模型,表示为:
其中,α为衡量可信度的权重系数,Bi(t-1)为时段t-1的客流去向结构,w(t-1)为高斯白噪音;客流量之间存在约束关系,观测方程通过客流量的约束关系进行建立,实现对于去向结构预测值的自适应修正;客流量的守恒关系主要包括:
qij(t)=oi(t)·bij(t)
其中,qij(t)为t时间内从站点i去往站点j的OD客流,Qi(t)为分时进站客流,bij(t)为客流通过车站i进站并在车站j出站的客流占车站i所有进站客流量之和Oi(t)的比例;以车站i和j分别为起讫点的乘客,从车站i进站后,抵达车站j并出站,对不同时段的客流到达量数据进行统计,客流OD量,客流累计到达量与客流到达系数约束关系表示为:
其中,为客流到达率,rij(t)为客流OD量;轨道交通线网中OD间的乘客旅行时间所跨域的时段个数不超过M,客流OD量表示为:
M根据轨道交通网线的规模或预测时段的时间粒度赋值;观测方程表示为:
映射函数h表示为:
其中,V(t)为测量噪音。
还应说明的是,状态转移方程描述了客流去向结构随时间的演变过程,它通过利用上一个时段的客流去向数据来预测当前时刻的客流去向结构,状态转移方程使用客流去向结构预测模型,并引入衡量可信度的权重系数,来表示当前时段的客流去向结构,该方程还考虑了高斯白噪音作为系统的不确定性,观测方程建立了客流量之间的约束关系,实现了对预测值的自适应修正,观测方程基于客流量的守恒关系进行建立,守恒关系包括从站点出发到达目的地的OD客流、分时进站客流以及客流通过车站进站并在车站出站的客流占车站所有进站客流量之和的比例等约束关系,通过对不同时段的客流到达量数据的统计,得到客流OD量、客流累计到达量和客流到达系数的约束关系。
S4:预测当前时段的客流去向结构数据作为粒子集合,对粒子集合重采样,计算客流去向结构的自适应修正数据。
更进一步的,计算客流去向结构的自适应修正数据包括设置粒子的集合容量R,使用服从高斯分布的Box-Muller算法生成粒子噪音和重采样。
应说明的是,通过AFC闸口刷卡数据,统计客流数据,进站客流量与客流达到率,收集历史AFC客流数据并统计车站历史数据的客流累计到达量Rt(t);根据预测得到的客流去向结构数据Bi(t),生成客流去向结构预测数据的粒子集合并初始化粒子权重为1/R;计算粒子集合中的粒子似然度,似然函数为高斯函数,更新每个粒子的权重wr,在高斯分布中,粒子x,观测值υ与子权重wr关系表示为:
μ=Ri(t)
其中,s为似然函数,g为高斯函数,x为通过粒子计算得到的客流累计到达量,μ为观测得到的客流累计到达量。
还应说明的是,归一化粒子中的权重,让权重之和表示为:
算法中的采样空间平均分割成R个层次,每一层取值范围表示为:
在每个取值范围内抽取随机数ur,得到随机数组表示为:
其中,U[0,1]为均匀分布;粒子权重累计函数为对每个ur进行重采样,对位于[cdf(r),cdf(r+1)]中的粒子进行复制;通过对粒子集合进行重采样,得到更新后的粒子均值,通过构建状态空间模型,以AFC闸机刷卡数据建立观测方程,对当前时段的客流去向结构数据进行更新修正,并进行每个时段的迭代计算,随着时段的推进得到车站每一个时段的客流去向结构的自适应修正数据。
实施例2
参照图2-4,为本发明的一个实施例,提供了一种基于客流去向结构的轨道交通OD客流预测方法,为了验证本发明的有益效果,通过经济效益计算和仿真实验进行科学论证。
从图2可以看出,经过修正后的客流去向结构数据更接近真实值,因此修正过程中利用了准实时客流数据,更贴近了实际客流状态,也验证了客流去向结构自适应修正模型的合理性与准确性。
从图3可以看出,将未修正的模型作为对比模型验证本发明所提出的OD修正模型的有效性,在高峰时段,所提出的OD修正模型具有更好的拟合效果,更能捕捉高峰时段客流的去向意图。并且整体上经过修正的客流去向预测值具有更好的效果,比未修正的客流去向预测值更接近真实值。
从图4可以看出,经过修正的预测模型其输出的指标数据均要小于未修正的预测模型。总体上两个OD五个预测日期的分时平均WMAPE的平均值为12.21%,相较于未考虑客流变化的预测模型精度提高了12%。
实施例3
参照图5,为本发明的一个实施例,提供了一种基于粒子群遗传算法的计算平台负载平衡系统,包括时段类别预测模块,预测分时客流去向模块,客流去向修正模块,数据修正模块。
其中时段类别预测模块用于构建一个预测模型,预测客流数据的时段类别,通过对历史数据进行分类预测建模,识别出不同的时段类别;预测分时客流去向模块根据时段类别预测模块的输出,确定当前时段所属的时段类别,计算客流的去向结构的权重,将权重与历史时段去向结构数据进行加权,得到当前时段的分时客流去向结构的初步预测值;客流去向修正模块用于构建一个自适应修正模型,对分时客流去向结构进行调整和修正;数据修正模块使用预测数据作为初始粒子集合,根据粒子集合重采样,构建状态空间模型,更新每个时段的客流去向结构自适应修正数据,得到车站每个时段的客流去向结构自适应修正数据。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置)、便携式计算机盘盒(磁装置)、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编辑只读存储器(EPROM或闪速存储器)、光纤装置以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (10)
1.一种基于客流去向结构的轨道交通OD客流预测方法,其特征在于,包括:
构建时段类别预测模型,输入历史客流数据构建数据集;
预测分时客流去向结构,计算同时段下的历史时段客流去向结构的权重,权重加权得到客流去向结构数据的初步预测值;
构建客流去向结构自适应修正模型,利用状态空间模型作为客流去向结构自适应修正模型;
预测当前时段的客流去向结构数据作为粒子集合,对粒子集合重采样,计算客流去向结构的自适应修正数据。
2.如权利要求1所述的基于客流去向结构的轨道交通OD客流预测方法,其特征在于:所述构建时段类别预测模型包括构建训练数据集因变量,利用k-means++算法对历史客流时段客流量数据进行聚类,得到不同类别特征的时段数据,将类别标签作为因变量;
所述k-means++算法包括输入需要的聚类数目n,在输入对象中抽取一个聚类中心作为初始聚类中心,计算对象和初始聚类中心的距离,距离远近为正比计算概率产生下一个聚类中心,重复计算获取n个聚类中心,被每个样本对象划分到与其最近的聚类中心,以此得到n个类别,对于每个不同的类别,重新计算样本均值并将得到结果作为新的聚类中心,重复计算样本均值不再有新的聚类中心产生;
将各时间段的数据时段属性集合作为输入,类别标签作为输出,站点i的输入样本集Xi和输出样本集Yi,表示为:
其中,x1(L)为车站i时段L的输入样本,经过独热编码处理后的时段属性数据,labeli(l)为车站i时段L的客流去向结构对应的时段类别标签,weeki(l)为是否为工作日,houri(l)为是否为时段,hourtypei(l)为是否为时段类型。
3.如权利要求2所述的基于客流去向结构的轨道交通OD客流预测方法,其特征在于:所述构建时段类别预测模型还包括随机森林算法和训练模型与预测时段类别;
训练集T的大小为N,特征数目为M,随机森林的大小为K,随机森林的算法包括遍历随机森林的大小K次,从训练集T中有放回抽样的方式,取样N次形成一个新的训练集D,选择m个特征,其中m<M,使用新的训练集D和m个特征,通过决策树得到随机森林,将样本集合输入随机森林模型进行模型训练,根据训练好的模型,将需要预测的样本输入到模型中,输出预测数据中时段类别的概率。
4.如权利要求1所述的基于客流去向结构的轨道交通OD客流预测方法,其特征在于:所述客流去向结构数据的初步预测值包括根据时段类别预测模型,预测得到输入数据时段类别,找出相同类别的历史时段客流数据,通过AFC刷卡数据得到客流去向结构数据,表示为:
Si={Bi(1),Bi(2),...,Bi(s)}
其中,Bi(s)为同时段类别下的客流去向结构数据;
历史各时间区间内样本数据和预测时段类别的聚类中心之间的距离及当下时段类别对应的样本权重表示为:
w=w′·w"
其中,w为各个历史时段客流去向结构的权重,w'为预测时段类别对应的概率,w"表示客流样本与聚类中心的系数,dis(Bi(s),c(pre))为聚类中心与历史时段客流样本之间的样本距离,对各历史时段去向结构数据的权重归一化,得到最终权重w*,将权重对历史时段去向结构数据进行加权,得到客流去向结构数据的初步预测值表示为:
在初步预测值加入上一时段的客流去向结构数据,最终的预测模型表示为:
其中,θ为衡量可信度的权重系数。
5.如权利要求4所述的基于客流去向结构的轨道交通OD客流预测方法,其特征在于:所述构建客流去向结构自适应修正模型包括构建状态转移方程和构建观测方程;
状态转移方程表示为:
xk=f(xk-1,wk-1)
观测方程表示为:
yk=h(xk,vk)
其中,xk-1和xk分别为时刻k-1和时刻k的系统状态变量,yk为时刻k的观测变量,wk-1和vk分别为过程噪音与观测噪音,f是状态变量的时间变化函数,h为状态值与观测值的函数关系;
状态转移方程的建立基于上一个时段的客流去向数据得到当前时刻的客流去向结构数据,状态转移方程利用客流去向结构预测模型,表示为:
其中,α为衡量可信度的权重系数,Bi(t-1)为时段t-1的客流去向结构,w(t-1)为高斯白噪音;
客流量之间存在约束关系,观测方程通过客流量的约束关系进行建立,实现对于去向结构预测值的自适应修正;
客流量的守恒关系包括:
qij(t)=oi(t)·bij(t)
其中,qij(t)为t时间内从站点i去往站点j的OD客流,Qi(t)为分时进站客流,bij(t)为客流通过车站i进站并在车站j出站的客流占车站i所有进站客流量之和Oi(t)的比例;
以车站i和j分别为起讫点的乘客,从车站i进站后,抵达车站j并出站,对不同时段的客流到达量数据进行统计,客流OD量,客流累计到达量与客流到达系数约束关系表示为:
其中,为客流到达率,rij(t)为客流OD量;轨道交通线网中OD间的乘客旅行时间所跨域的时段个数不超过M,客流OD量表示为:
M根据轨道交通网线的规模或预测时段的时间粒度赋值;
观测方程表示为:
映射函数h表示为:
其中,V(t)为测量噪音。
6.如权利要求1所述的基于客流去向结构的轨道交通OD客流预测方法,其特征在于:所述计算客流去向结构的自适应修正数据包括设置粒子的集合容量为R,并使用服从高斯分布的Box-Muller算法生成粒子噪音;
通过AFC闸口刷卡数据,统计客流数据,进站客流量与客流达到率,收集历史AFC客流数据并统计车站历史数据的客流累计到达量Rt(t);
根据预测得到的客流去向结构数据Bi(t),生成客流去向结构预测数据的粒子集合并初始化粒子权重为1/R;
计算粒子集合中的粒子似然度,似然函数为高斯函数,更新每个粒子的权重wr,在高斯分布中,粒子x,观测值υ与子权重wr关系表示为:
μ=Ri(t)
其中,s为似然函数,g为高斯函数,x为通过粒子计算得到的客流累计到达量,μ为观测得到的客流累计到达量。
7.如权利要求6所述的基于客流去向结构的轨道交通OD客流预测方法,其特征在于:所述计算客流去向结构的自适应修正数据还包括重采样;
归一化粒子中的权重,让权重之和表示为:
算法中的采样空间平均分割成R个层次,每一层取值范围表示为:
在每个取值范围内抽取随机数ur,得到随机数组表示为:
其中,U[0,1]为均匀分布;
粒子权重累计函数为对每个ur进行重采样,对位于[cdf(r),cdf(r+1)]中的粒子进行复制;
通过对粒子集合进行重采样,得到更新后的粒子均值,通过构建状态空间模型,以AFC闸机刷卡数据建立观测方程,对当前时段的客流去向结构数据进行更新修正,并进行每个时段的迭代计算,随着时段的推进得到车站每一个时段的客流去向结构的自适应修正数据。
8.一种采用如权利要求1~7任一所述的基于客流去向结构的轨道交通OD客流预测方法的系统,其特征在于:包括时段类别预测模块、预测分时客流去向模块、客流去向修正模块、数据修正模块;
所述时段类别预测模块用于构建一个预测模型,预测客流数据的时段类别,通过对历史数据进行分类预测建模,识别出不同的时段类别;
所述预测分时客流去向模块根据时段类别预测模块的输出,确定当前时段所属的时段类别,计算客流的去向结构的权重,将权重与历史时段去向结构数据进行加权,得到当前时段的分时客流去向结构的初步预测值;
所述客流去向修正模块用于构建一个自适应修正模型,对分时客流去向结构进行调整和修正;
所述数据修正模块使用预测数据作为初始粒子集合,根据粒子集合重采样,构建状态空间模型,更新每个时段的客流去向结构自适应修正数据,得到车站每个时段的客流去向结构自适应修正数据。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的基于客流去向结构的轨道交通OD客流预测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的基于客流去向结构的轨道交通OD客流预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310982617.7A CN116933946A (zh) | 2023-08-07 | 2023-08-07 | 一种基于客流去向结构的轨道交通od客流预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310982617.7A CN116933946A (zh) | 2023-08-07 | 2023-08-07 | 一种基于客流去向结构的轨道交通od客流预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116933946A true CN116933946A (zh) | 2023-10-24 |
Family
ID=88380723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310982617.7A Pending CN116933946A (zh) | 2023-08-07 | 2023-08-07 | 一种基于客流去向结构的轨道交通od客流预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116933946A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117275243A (zh) * | 2023-11-22 | 2023-12-22 | 上海随申行智慧交通科技有限公司 | 基于多源交通出行数据的区域流控预测预警方法及应用 |
CN117455553A (zh) * | 2023-12-08 | 2024-01-26 | 青岛理工大学 | 一种地铁站客流量预测的方法 |
-
2023
- 2023-08-07 CN CN202310982617.7A patent/CN116933946A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117275243A (zh) * | 2023-11-22 | 2023-12-22 | 上海随申行智慧交通科技有限公司 | 基于多源交通出行数据的区域流控预测预警方法及应用 |
CN117275243B (zh) * | 2023-11-22 | 2024-02-02 | 上海随申行智慧交通科技有限公司 | 基于多源交通出行数据的区域流控预测预警方法及应用 |
CN117455553A (zh) * | 2023-12-08 | 2024-01-26 | 青岛理工大学 | 一种地铁站客流量预测的方法 |
CN117455553B (zh) * | 2023-12-08 | 2024-04-30 | 青岛理工大学 | 一种地铁站客流量预测的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110070713B (zh) | 一种基于双向嵌套lstm神经网络的交通流预测方法 | |
CN112257341B (zh) | 一种基于异源数据差补融合的定制产品性能预测方法 | |
CN116933946A (zh) | 一种基于客流去向结构的轨道交通od客流预测方法及系统 | |
CN110648014B (zh) | 一种基于时空分位数回归的区域风电预测方法及系统 | |
CN110220725B (zh) | 一种基于深度学习与bp集成的地铁车轮健康状态预测方法 | |
CN109214581B (zh) | 一种考虑风向和置信区间的铁路沿线风速预测方法 | |
CN111127246A (zh) | 一种输电线路工程造价的智能预测方法 | |
CN111860989B (zh) | 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法 | |
CN111126868B (zh) | 一种道路交通事故发生风险确定方法及系统 | |
CN114781538A (zh) | 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 | |
CN110633859B (zh) | 一种两阶段分解集成的水文序列预测方法 | |
CN113780665B (zh) | 一种基于增强循环神经网络的私家车停留位置预测方法和系统 | |
Huang et al. | Research on urban modern architectural art based on artificial intelligence and GIS image recognition system | |
CN111985680B (zh) | 基于胶囊网络与时序的刑事多罪名预测方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN110837939A (zh) | 一种电网多目标项目筛选方法和系统 | |
CN110990718A (zh) | 一种公司形象提升系统的社会网络模型构建模块 | |
CN111141879B (zh) | 一种深度学习的空气质量监测方法以及装置、设备 | |
CN112668822A (zh) | 科技成果转化平台共享系统、方法、存储介质、手机app | |
CN111144721A (zh) | 电网项目需求评价模型的构建方法、装置和计算设备 | |
CN115496257A (zh) | 基于时空融合的短时车速预测 | |
CN110310199B (zh) | 借贷风险预测模型的构建方法、系统及借贷风险预测方法 | |
CN115221793A (zh) | 一种隧道围岩变形预测方法及装置 | |
CN117173883A (zh) | 一种城市交通流量预测方法及系统 | |
CN111738610A (zh) | 一种基于舆情数据的企业流失性风险预警系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |