CN107316096A - 一种轨道交通一票通乘客进站量预测方法 - Google Patents

一种轨道交通一票通乘客进站量预测方法 Download PDF

Info

Publication number
CN107316096A
CN107316096A CN201710311641.2A CN201710311641A CN107316096A CN 107316096 A CN107316096 A CN 107316096A CN 201710311641 A CN201710311641 A CN 201710311641A CN 107316096 A CN107316096 A CN 107316096A
Authority
CN
China
Prior art keywords
station
entering
amount
passenger
msub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710311641.2A
Other languages
English (en)
Inventor
汪波
黄建玲
杨洋
鲍枫
陈�峰
白云云
何志莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING TRAFFIC INFORMATION CENTER
Beijing Jiaotong University
Original Assignee
BEIJING TRAFFIC INFORMATION CENTER
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING TRAFFIC INFORMATION CENTER, Beijing Jiaotong University filed Critical BEIJING TRAFFIC INFORMATION CENTER
Priority to CN201710311641.2A priority Critical patent/CN107316096A/zh
Publication of CN107316096A publication Critical patent/CN107316096A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Computational Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Devices For Checking Fares Or Tickets At Control Points (AREA)

Abstract

本发明提供一种轨道交通一票通乘客进站量预测方法,能够预测一票通乘客进站量。所述方法包括:确定影响城市轨道交通节假日一票通乘客进站量的变量,基于确定的变量,建立城市轨道交通节假日一票通乘客进站量与变量之间的回归模型;根据回归模型对城市轨道交通节假日一票通乘客进站量进行预测,得到预测值,计算预测值与真实值之间的残差,对残差进行平稳性分析,建立残差的ARMA模型;根据构建的回归模型和ARMA模型,建立城市轨道交通节假日一票通乘客进站量组合预测模型,由建立的城市轨道交通节假日一票通乘客进站量组合预测模型预测节假日的一票通乘客进站量。本发明涉及轨道交通技术领域。

Description

一种轨道交通一票通乘客进站量预测方法
技术领域
本发明涉及轨道交通技术领域,特别是指一种轨道交通一票通乘客进站量 预测方法。
背景技术
近年来,随着城市化进程的逐步加快,城市人口急剧增加,产生大量的交 通需求。对于北京、上海一类的超大型城市,都面临着交通供给与交通需求之 间的矛盾,城市交通系统已越来越不堪重负,而其中城市轨道交通(以下简称 轨道交通)作为城市交通骨干运输方式更是首当其冲。随着我国城市轨道交通 网络的复杂化,轨道交通客流迅猛增长。以北京为例,轨道交通由2000年的 2条线路、运营里程54km、日均客运量不足100万人次,发展到2015年初的 18条线路、运营里程527km、日均客运量1020万人次。随着轨道交通网络化运营格局的形成,实时地对轨道交通客流进行预测和分析,对把握路网中客流 的动态趋势、提高轨道交通运营服务水平和确保安全运营具有重要意义。
现有技术中,王玉萍等提出了包含可信度分析、客流特性分析、风险性分 析和敏感性分析在内的城市轨道交通客流预测结果分析的结构体系;李春晓等 提出一种基于广义动态模糊神经网络的短时进站客流量预测方法,预测轨道交 通车站每日分时进站量;徐瑞华研究了城市轨道交通线路客流分布的实时预测 方法,但是,以上方法都没有对节假日期间的一票通乘客进站量进行研究。
发明内容
本发明要解决的技术问题是提供一种轨道交通一票通乘客进站量预测方 法,以解决现有技术所存在的不能预测节假日期间一票通乘客进站量的问题。
为解决上述技术问题,本发明实施例提供一种轨道交通一票通乘客进站量 预测方法,包括:
获取城市轨道交通节假日一票通乘客进站量历史数据,根据获取的城市轨 道交通节假日一票通乘客进站量历史数据,确定影响城市轨道交通节假日一票 通乘客进站量的变量,基于确定的变量,建立城市轨道交通节假日一票通乘客 进站量与变量之间的回归模型;
根据回归模型对城市轨道交通节假日一票通乘客进站量进行预测,得到预 测值计算预测值与真实值y之间的残差对残差ε进行平稳性 分析,建立残差的ARMA模型;
根据构建的回归模型和ARMA模型,建立城市轨道交通节假日一票通乘客 进站量组合预测模型,由建立的城市轨道交通节假日一票通乘客进站量组合预 测模型预测节假日的一票通乘客进站量。
进一步地,确定的影响城市轨道交通节假日一票通乘客进站量的变量包括: 连续变量和虚拟变量;
所述连续变量包括:全票种进站量、地面公交客运量、日平均气温、AQI;
所述虚拟变量包括:有序变量和无序变量;
所述有序变量包括:节假日时间长短、节假日回家和旅游特征、路网车站 数;
所述无序变量包括:天气情况、节假日分类。
进一步地,所述基于确定的变量,建立城市轨道交通节假日一票通乘客进 站量与变量之间的回归模型包括:
量化虚拟变量,对量化后的虚拟变量进行线性相关性的拟合,得到几类相 互独立的虚拟变量;
基于连续变量和得到的几类相互独立的虚拟变量,建立城市轨道交通节假 日一票通乘客进站量与全票种进量、地面公交客运量、日平均气温、AQI、独 立的虚拟变量之间的回归模型。
进一步地,所述回归模型表示为:
其中,y表示城市轨道交通节假日一票通乘客进站量;a0表示常数项;i 的取值为1、2、3、4、5、6、7、8、9;x1表示全票种进站量;x2表示地面公 交客运量;x3表示日平均气温;x4表示AQI;x5表示节假日时间长短;x6表示 节假日回家和旅游特征;x7路网车站数;x8表示天气情况;x9表示节假日分类; ai表示第i连续变量的系数;bi表示第i有序变量的系数;δi表示回归模型中 若包括相应的连续变量,则记为1,否则为0;xij表示第i无序变量的第j哑 变量;cij表示无序变量的哑变量的系数;δij表示回归模型中若包括相应无序 变量的哑变量,则记为1,否则为0;Q(i)表示第i无序变量取值种类数。
进一步地,所述ARMA模型表示为:
φp(B)εt=θq(B)ut
其中,P表示季节自回归阶数;q表示季节移动平均阶数;φp表示季节自 回归系数;θq表示季节移动平均系数;φp(B)表示季节自回归滞后多项式;θq(B) 表示季节移动平均滞后多项式;εt表示自回归序列;ut表示误差项;B表示滞 后算子。
进一步地,所述城市轨道交通节假日一票通乘客进站量组合预测模型表示 为:
进一步地,所述方法还包括:
获取城市轨道交通日一卡通乘客比例历史数据,利用自相关和偏自相关函 数对获取的城市轨道交通日一卡通乘客比例历史数据进行平稳性和周期性分 析,根据分析结果,建立城市轨道交通一卡通乘客比例季节ARIMA模型;
获取城市轨道交通全票种日进站量历史数据,利用自相关和偏自相关函数 对获取的城市轨道交通全票种日进站量历史数据进行平稳性和周期性分析,建 立城市轨道交通路网全票种进站量季节ARIMA模型;
根据建立的城市轨道交通一卡通乘客比例季节ARIMA模型和建立的城市 轨道交通路网全票种进站量季节ARIMA模型,建立城市轨道交通路网一票通进 站量ARIMA模型,由建立的建立城市轨道交通路网一票通进站量ARIMA模型预 测路网一票通乘客进站量。
进一步地,所述方法还包括:
获取轨道交通各车站一票通乘客进站量历史数据,对获取的轨道交通各车 站一票通乘客进站量历史数据进行分析,得到与车站客流特征相关的时间周期 变量;
对与车站客流特征相关的时间周期变量进行车站聚类分析,得到车站类别;
根据得到的车站类别,建立基于车站类别的一票通乘客进站量预测模型, 由建立的基于车站类别的一票通乘客进站量预测模型预测各车站一票通乘客 进站量。
进一步地,所述对与车站客流特征相关的时间周期变量进行车站聚类分析, 得到车站类别包括:
S1,使用聚类方法对车站按照一票通比例进行分类,在分类时,基于最短 距离法和类平均法,确定类别;
S2,针对S1得到每一类,再继续细分;具体包括:获取每一类中的n个 轨道交通车站的m天的每个轨道交通车站的一票通使用量进行分类,获得n× m的车站一票通使用量矩阵;重复S1的分类方法,得到轨道交通车站在该类 中的子分类。
进一步地,所述根据得到的车站类别,建立基于车站类别的一票通乘客进 站量预测模型包括:
根据得到的车站类别,利用指数平滑法,建立基于车站类别的一票通乘客 进站量预测模型。
本发明的上述技术方案的有益效果如下:
上述方案中,获取城市轨道交通节假日一票通乘客进站量历史数据,根据 获取的城市轨道交通节假日一票通乘客进站量历史数据,确定影响城市轨道交 通节假日一票通乘客进站量的变量,基于确定的变量,建立城市轨道交通节假 日一票通乘客进站量与变量之间的回归模型;根据回归模型对城市轨道交通节 假日一票通乘客进站量进行预测,得到预测值,计算预测值与真实值之间的残 差,对残差进行平稳性分析,建立残差的ARMA模型;根据构建的回归模型和 ARMA模型,建立城市轨道交通节假日一票通乘客进站量组合预测模型,由建 立的城市轨道交通节假日一票通乘客进站量组合预测模型预测节假日的一票通乘客进站量。
附图说明
图1为本发明实施例提供的轨道交通一票通乘客进站量预测方法的流程 示意图;
图2为对一卡通乘客比例数据进行一阶差分后得到的自相关函数图;
图3为对一卡通乘客比例数据进行一阶差分后的数据序列再进行一次季 节性差分得到的新序列图;
图4为新序列的自相关函数图;
图5为模型对原有序列的拟合和残差图;
图6为本发明实施例中的最短距离法的谱系聚类图和聚合系数变化图;
图7为本发明实施例中的类平均法的谱系聚类图和聚合系数变化图;
图8为第B类进行继续分类的示意图;
图9为第C类进行继续分类的示意图;
图10为不同平滑系数对应的预测值与真实值的示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附 图及具体实施例进行详细描述。
本发明针对现有的不能预测节假日期间一票通乘客进站量的问题,提供一 种轨道交通一票通乘客进站量预测方法。
如图1所示,本发明实施例提供的轨道交通一票通乘客进站量预测方法, 包括:
步骤101,获取城市轨道交通节假日一票通乘客进站量历史数据,根据获 取的城市轨道交通节假日一票通乘客进站量历史数据,确定影响城市轨道交通 节假日一票通乘客进站量的变量,基于确定的变量,建立城市轨道交通节假日 一票通乘客进站量与变量之间的回归模型;
步骤102,根据回归模型对城市轨道交通节假日一票通乘客进站量进行预 测,得到预测值计算预测值与真实值y之间的残差对残差ε进 行平稳性分析,建立残差的ARMA模型;
步骤103,根据构建的回归模型和ARMA模型,建立城市轨道交通节假日 一票通乘客进站量组合预测模型,由建立的城市轨道交通节假日一票通乘客进 站量组合预测模型预测节假日的一票通乘客进站量。
本发明实施例所述的轨道交通一票通乘客进站量预测方法,获取城市轨道 交通节假日一票通乘客进站量历史数据,根据获取的城市轨道交通节假日一票 通乘客进站量历史数据,确定影响城市轨道交通节假日一票通乘客进站量的变 量,基于确定的变量,建立城市轨道交通节假日一票通乘客进站量与变量之间 的回归模型;根据回归模型对城市轨道交通节假日一票通乘客进站量进行预测, 得到预测值,计算预测值与真实值之间的残差,对残差进行平稳性分析,建立 残差的ARMA模型;根据构建的回归模型和ARMA模型,建立城市轨道交通节 假日一票通乘客进站量组合预测模型,由建立的城市轨道交通节假日一票通乘 客进站量组合预测模型预测节假日的一票通乘客进站量。
本实施例中,轨道交通票制包含储值票和单程票。储值票为可重复充值使 用的车票,一般指固定乘坐轨道交通的乘客所使用的一卡通车票。单程票为仅 在一次进出站的乘行中有效的车票,一般指临时乘坐轨道交通的乘客所购买的 一票通车票。固定乘坐轨道交通的乘客的出行特征变化较小。变化大的是:出 行特征不固定的临时乘坐轨道交通的乘客,即一票通乘客。因此,当实现对一 票通乘客的进站客流预测时,也基本上实现了轨道交通的进站客流预测。
本文主要描述了三个方面:
一、预测城市轨道交通节假日一票通乘客进站量,所述节假日包括:清明 节、劳动节、端午节、国庆节等国家法定假日;
二、预测城市轨道交通正常日一票通乘客进站量,其中,所述正常日包括: 工作日和周末;
三、基于车站类别的一票通乘客进站量预测。
接着,对着三个方面分别进行详细说明。
一、预测城市轨道交通节假日一票通乘客进站量
获取城市轨道交通节假日一票通乘客进站量历史数据,根据获取的城市轨 道交通节假日一票通乘客进站量历史数据,确定影响城市轨道交通节假日一票 通乘客进站量的主要变量,根据这些变量的特点,可以把其分为连续变量和虚 拟变量;虚拟变量又可分为有序变量和无序变量。
本实施例中,首先量化虚拟变量,建立回归模型;然后根据残差序列的平 稳性特点,建立自回归移动平均过程(ARMA)模型;最后综合回归模型和ARMA 模型,提高节假日一票通乘客进站量预测精度。其具体步骤如下:
步骤1、变量确定:
变量分为连续变量和虚拟变量;其中,连续变量包括:全票种进站量(x1)、 地面公交客运量(x2)、日平均气温(x3)、空气质量指数(Air Quality Index, AQI)(x4);虚拟变量包括:节假日时间长短(x5)、节假日回家和旅游特征(x6)、 路网车站数(x7)、天气情况(x8)、节假日分类(x9)。
步骤2、量化虚拟变量
①节假日时间长短(x5):此虚拟变量为有序变量,所以取值用0和1来 表示:0表示长度为三天的节假日,例如元旦、清明、五一、端午、元宵节; 1表示长度为七天的节假日,例如春节、国庆节;
②节假日回家和旅游特征(x6):此虚拟变量为有序变量,特征取值为回 家、旅游;在我国节假日中,春节、清明的一般外地人回老家比较多,赋值为 x7=0;其他节假日旅游特征赋值为x7=1;
③路网车站数(x7):此虚拟变量为有序变量,北京轨道交通在2014年12 月28日到2015年12月26日之间的车站数为318,2015年12月26日之后车 站数为334,所以此变量的取值为:2014年12月28日之前,x7=0;2014年 12月28日到2015年12月26日之间,x7=1;2015年12月26日之后,x7=2;
④天气情况(x8):分为晴、雾霾、小雨或小雪、中大雨或中大雪四类, 此虚拟变量为无序变量,所以量化时需派生出三个哑变量,分别为x81、x82、 x83,取值及对应的天气特征类别见表1:
表1天气特征取值表
x81 x82 x83
0 0 0
雾霾 1 0 0
小雨(小雪) 0 1 0
中大雨 0 0 1
⑤节假日分类(x9):每年节假日有七种,分别为元旦、春节、清明、五 一、端午、元宵节、国庆节。但是有时会因为一些原因增加放假日期,例如 2015年9月3日至5日调休放假,形成3天小长假;因此本发明实施例中设 置节假日有八种,分别为元旦、春节、清明、五一、端午、中秋节、国庆节、 其他。节假日这一虚拟变量为无序变量,量化时需派生出七个哑变量,分别为 x91、x92、x93、x94、x95、x96、x97;取值及对应的节假日类别见表2:
表2节假日特征取值表
x91 x92 x93 x94 x95 x96 x97
元旦 0 0 0 0 0 0 0
春节 1 0 0 0 0 0 0
清明 0 1 0 0 0 0 0
五一 0 0 1 0 0 0 0
端午 0 0 0 1 0 0 0
中秋节 0 0 0 0 1 0 0
十一 0 0 0 0 0 1 0
其他 0 0 0 0 0 0 1
步骤3、对量化后的虚拟变量进行线性相关性的拟合,得到几类相互独立 的虚拟变量;
步骤4、基于连续变量和得到的几类相互独立的虚拟变量,建立城市轨道 交通节假日一票通乘客进站量与全票种进量、地面公交客运量、日平均气温、 AQI、独立的虚拟变量之间的回归方程;并根据预设的检验规则,选择最优回 归方程作为回归模型;通过验证变量之间的交互作用,提高回归方程的精度, 从而综合得到最优回归方程;
其中,本发明实施例中的最优回归方程表达式见公式(1):
其中,y为城市轨道交通节假日一票通乘客进站量;a0为常数项;
xi代表自变量,其中,i的取值为1、2、3、4、5、6、7、8、9;x1表示 全票种进站量;x2表示地面公交客运量;x3表示日平均气温;x4表示AQI;x5表示节假日时间长短;x6表示节假日回家和旅游特征;x7路网车站数;x8表示 天气情况;x9表示节假日分类;
ai表示第i连续变量的系数;bi表示第i个有序变量的系数;δi表示回归 模型中是否包括连续变量,如果是则δi为1,否则δi为0;
xij表示第i无序变量的第j个哑变量,其中:x8为无序变量,包括3个 哑变量:x81、x82、x83;x9为无序变量,包括7个哑变量:x91、x92、x93、x94、 x95、x96、x97
cij表示第i无序变量的第j个哑变量的系数;
δij表示回归模型中是否包括第i无序变量的第j哑变量,如果是则δij为 1,否则δij为0;
Q(i)表示第i无序变量的取值种类数,例如,x8取值种类有四种,则Q(8)=4; x9取值有八种,Q(9)=8;
利用公式(1)对城市轨道交通节假日一票通乘客进站量进行预测以获得 预测值计算预测值与真实值y之间的残差对残差ε进行平稳 性分析,建立残差的ARMA模型,见公式(2):
φp(B)εt=θq(B)ut (2)
其中,P表示季节自回归阶数;q表示季节移动平均阶数;φp表示季节自 回归系数;θq表示季节移动平均系数;φp(B)表示季节自回归滞后多项式;θq(B) 表示季节移动平均滞后多项式;εt表示自回归序列;ut表示误差项;B表示滞 后算子。
步骤5、根据公式(1)的回归模型和公式(2)的ARMA模型,建立如公 式(3)所示的城市轨道交通节假日一票通乘客进站量组合预测模型,由建立 的城市轨道交通节假日一票通乘客进站量组合预测模型预测节假日的一票通 乘客进站量,公式(3)表示为:
下面通过一个具体的实例来对本发明实施例的算法进行进一步说明。
首先对北京城市轨道交通2014年10月1日到2016年4月4日之间所有 节假日一票通乘客进站量数据进行整理。表3中,y为城市轨道交通节假日一 票通乘客进站量的历史真实值,x1为全票种进站量,x2为地面公交客运量,单 位为万人次;变量取值表如表3(部分节假日的数据)。
表3变量取值表
日期 y x1 …… x81 x82 x83 x91 x92 x93 x94 x95 x96 x97
2014-10-01 132.7977 415.9069 …… 0 1 0 0 0 0 0 0 1 0
2014-10-02 153.5153 443.8456 …… 1 0 0 0 0 0 0 0 1 0
2014-10-03 143.2467 401.4048 …… 0 1 0 0 0 0 0 0 1 0
2014-10-04 128.1227 371.3904 …… 0 0 0 0 0 0 0 0 1 0
2014-10-05 130.6002 407.815 …… 0 0 0 0 0 0 0 0 1 0
2014-10-06 109.7275 389.9869 …… 0 0 0 0 0 0 0 0 1 0
2014-10-07 89.2529 378.095 …… 0 0 0 0 0 0 0 0 1 0
2015-01-01 79.3931 341.6106 …… 0 0 0 0 0 0 0 0 0 0
2015-01-02 71.2255 321.0154 …… 1 0 0 0 0 0 0 0 0 0
2015-01-03 60.8919 312.8832 …… 1 0 0 0 0 0 0 0 0 0
(1)虚拟变量之间相关性的检验和回归模型的建立
对量化后的虚拟变量进行线性相关性的拟合,得到节假日回家和旅游特征 x6、路网车站数x7、节假日分类x9的七个哑变量x91、x92、x93、x94、x95、x96、 x97之间存在线性相关关系。在建立回归方程的时候,这三类虚拟变量不能同 时出现。从而根据不同的变量组合建立回归方程,根据预设的检验规则,从中 挑选出最优回归方程作为回归模型,检验规则结果见表4。
表4检验规则结果
通过比较可以看出,(y,x1,x2,x4,x5,x6,x7,x95,x96)组合的决定系数(R2) 最大,拟合程度最好,并且AIC也是最小,残差平方和也比较小。
为了验证虚拟变量之间相乘产生的乘积项对模型精度的影响,进一步对 (y,x1,x2,x4,x5,x6,x7,x95,x96)加入虚拟变量的乘积项,不同乘积项的组合的检 验规则结果见表5。
表5不同乘积项的组合的检验规则结果表
表5显示,变量组合从上到下的修正决定系数(R2)越来越大,表明拟合 程度越来越高,同时AIC、SC的值也是越来越小。但是,通过对每个加入乘积 项的组合进行节假日一票通乘客进站量预测,发现预测精度并没有明显提高, 还略微下降。所以,以(y,x1,x2,x4,x5,x6,x7,x95,x96)的组合建立的回归方程作
为最优回归方程,见公式(4):
Y=41.0421991044+0.498769085584×X1-0.119077118621×X2-0.0256308763621×X 30.8069416849×X5+6.42925848385×X7-21.9369842516×X6 -22.3811210373×X95-19.512552085×X96 (4)
利用公式(4)对北京轨道交通2016年4月30日至2016年5月2日(五 一劳动节)一票通乘客进站量进行预测,结果见表6。
表6回归模型预测结果
日期 实际值 预测值 误差
2016-04-30 114.3156 126.5090263 10.67%
2016-05-01 126.1749 116.7666872 -7.46%
2016-05-02 78.2977 86.017827 9.86%
(2)建立残差的ARMA模型
从表6可以看出,预测五一的一票通乘客进站量还存在10%左右的误差, 为了使误差进一步降低,现对建立的回归模型的残差(残差序列)进行分析, 建立ARMA模型。根据分析结果可知,残差值围绕其均值上下波动,但振幅变 化并不剧烈,自相关系数很快趋于0,即落入随机区间。对残差序列做单位跟 检验见表7。
表7残差序列做单位跟检验
单位根的t检验统计量值为-5.068075。在1%、5%和10%三个显著水平 下,单位根检验的临界值分别为-3.568308、-2.921175和-2.598551。显然, 上述t检验统计量值小于相应的DW临界值,这说明残差序列(ε)为平稳序 列,可直接建立ARMA模型。通过检验规则的对比,建立ARMA(1,5)模型,见 公式(5)。
该ARMA模型满足ARMA过程的平稳条件及可逆条件,相伴概率(p-Q)为 0.903,模型设定合理。
结合公式(4)和公式(5),可以建立城市轨道交通节假日一票通乘客进 站量组合预测模型,见公式(6)。
(2)预测及对比分析
利用公式(6)所确立的组合预测模型对轨道交通节假日一票通乘客进站 量进行预测,预测结果见表8。
表8组合模型预测误差
表6的平均误差是9.32%,表8的平均误差是8.17%,使用本发明实施例 构建的组合预测模型(公式6)使误差降低了12.33%,说明此组合预测模型是 有效的,修正了原有的回归模型。
二、预测城市轨道交通正常日一票通乘客进站量
本实施例中,预测城市轨道交通正常日一票通乘客进站量的步骤可以包括:
获取城市轨道交通日一卡通乘客比例历史数据,利用自相关和偏自相关函 数对获取的城市轨道交通日一卡通乘客比例历史数据进行平稳性和周期性分 析,根据分析结果,建立城市轨道交通一卡通乘客比例季节ARIMA模型;
获取城市轨道交通全票种日进站量历史数据,利用自相关和偏自相关函数 对获取的城市轨道交通全票种日进站量历史数据进行平稳性和周期性分析,建 立城市轨道交通路网全票种进站量季节ARIMA模型;
根据建立的城市轨道交通一卡通乘客比例季节ARIMA模型和建立的城市 轨道交通路网全票种进站量季节ARIMA模型,建立城市轨道交通路网一票通进 站量ARIMA模型,由建立的建立城市轨道交通路网一票通进站量ARIMA模型预 测路网一票通乘客进站量。
本实施例中,通过分析2015年3月2日到2016年3月27日之间56周的 北京轨道交通日一卡通乘客比例数据,建立城市轨道交通一卡通乘客比例季节 自回归积分滑动平均(ARIMA)模型,掌握一卡通乘客比例随日期变化的规律, 预测短期内一卡通乘客比例。同时利用2015年12月28日到2016年3月27 日之间13周的北京轨道交通全票种日进站量数据,建立城市轨道交通路网全 票种进站量季节ARIMA模型,结合这两个季节ARIMA模型的预测结果,得到北 京城市轨道交通一票通乘客进站量。本发明实施例在预测北京城市轨道交通票卡日进站量时,例如一票通日进站量,未使用该票卡的日进站量数据直接建模 进行预测,而使用随轨道交通路网结构变化相对较小的北京轨道交通日一卡通 乘客比例数据模型和路网全票种预测模型相结合的预测方式,从而得到一票通 日进站量,并以实例进行验证。同时本发明实施例根据城市轨道交通一卡通乘 客比例及路网全票种进站量数据的特点,通过自相关和偏自相关函数进行数据 的平稳性和周期性分析,消除趋势性和周期性特征影响,建立季节ARIMA模型, 并对模型预测精度进行分析。
步骤1、建立季节ARIMA模型;
季节ARIMA模型是指将受季节影响的非平稳时间序列通过消除季节影响 转化为平稳时间序列,然后将平稳时间序列建立ARMA模型。ARIMA模型根据 原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回 归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。
①季节ARIMA模型对于城市轨道交通一卡通占比分析的适用性
时间序列分析的主要任务是对时间序列的观测样本建立尽可能合适的统 计模型。大量时间序列的观测样本都表现出趋势性、季节性和随机性,或者只 表现出三者中的其二或其一。季节时间序列的特点是明显的季节性,例如旅游 景点的参观人数通常在公休日和旅游季节会增加,超市的销售额也会在每个周 末不同于普通工作日。季度时间序列一般表现为表9样式,“行”为一年的的 四个季度,“列”为连续的年份,其中的数据随着季节的变化有明显的周期s=4。
表9季度时间序列:某城市居民季度用煤消耗量
年份 1季度 2季度 3季度 4季度 年平均
1991 6878.4 5343.7 4847.9 6421.9 5873.0
1992 6815.4 5532.6 4745.6 6406.2 5875.0
1993 6634.4 5658.5 4674.8 6645.5 5853.3
1994 7130.2 5532.6 4989.6 6642.3 6073.7
1995 7413.5 5863.1 4997.4 6776.1 6262.6
1996 7476.5 5965.5 5202.1 6894.1 6384.5
季平均 7058.1 5649.3 4909.6 6597.7
城市轨道交通一卡通使用比例见表10,对比表9和表10,两张表在构成 上基本一致,表10的“行”为一周的七天,“列”为连续的周,其中的数据 随着星期的变化有明显的周期s=7。表10所展示的数据序列称为周度时间序 列,也可用季节ARIMA模型进行建模分析。
表10城市轨道交通一卡通使用比例
②构建季节ARIMA模型
(1)时间序列特征分析
获取2015年3月2日到2016年3月27日之间56周的北京城市轨道交通 一卡通乘客比例历史数据,根据获取的2015年3月2日到2016年3月27日 之间56周的北京城市轨道交通一卡通乘客比例历史数据,用自相关系数 (Autocorrelation,AC)做定量的分析说明。当AC的滞后阶数k大于3时, AC开始趋于0,即落入随机区间,但是不是从一开始就落入随机区间,所以可 判断一卡通乘客比例数据具体较弱的递增趋势性。另外在自相关函数的第7、14、21、28、35、42个周期上,其自相关函数显著不为零,例如第7个周期 上,自相关函数值为0.407。自相关系数与其7倍数的滞后期存在自回归关系。
结合对一卡通乘客比例数据本身的分析及对数据自相关系数的分析,得出 该一卡通乘客比例历史数据是非平稳序列,递增趋势较小,明显弱于季节性趋 势,需要应用一阶差分和季节性差分,消除其趋势性和季节性影响因素。
首先对一卡通乘客比例数据(yt)进行一阶差分,得到Dyt的自相关函数 图,见图2。从图2可看出,较弱的趋势性已消除,周期性比原来更明显,在 第7个周期上,自相关函数值高达0.628,明显高于原始数据第7个周期的自 相关函数值0.407。经过一次一阶差分之后,一卡通乘客比例数据的长度变为 391。
再对一阶差分之后的数据序列进行一阶季节性差分,得到新的序列△△ 7yt,新序列及其自相关函数图见图3、图4。经过一次一阶差分和一次季节性 差分之后,一卡通乘客比例数据的长度变为392-1-7=384。△△7yt序列的自 相关系数和偏自相关系数很快地落入随机区间,故序列的趋势已基本消除,但 在k=7时取值仍然较大,季节性依然比较明显。经试验,对序列进行二阶季节 差分,发现序列季节性并没有得到显著改善,故只做一阶季节差分。且该序列 平均数是7.552083333332745e-06,均值标准误为0.000785,序列均值与0 无显著差异,表明序列可直接建立ARMA模型。
另再对△△7yt序列进行单位根检验。单位根的t检验统计量值为 -16.23864,在1%、5%、10%三个显著水平下,单位根检验的临界值为-3.982201、 -3.421600、-3.133590,显然,上述t检验统计量值小于相应的DW临界值, 说明△△7yt序列为平稳序列,可直接建立ARMA模型。
(2)模型识别
一卡通乘客比例数据经过一阶差分,消除了较弱的趋势项,故d=1;经过 一阶季节差分,故D=1。因此选用ARIMA(p,d,q)(P,D,Q)s模型。P表示自回归 阶数,d表示季节差分前进行的逐期差分的阶数,q表示移动平均阶数;P表示 季节自回归阶数,D表示季节差分的阶数,Q表示季节移动平均阶数,s表示差 分间隔
观察△△7yt序列的自相关和偏自相关图,p的取值范围为1~5,q的取 值范围为1~5,且k=7时,△△7yt序列的自相关和偏自相关系数都显著不为 0,所以P=Q=1。可供选择的模型共有5*5=25种。
(3)模型建立及评价
根据确定的25种模型,以建立ARIMA(5,1,2)(1,1,1)7模型为例说明计算 过程,并对25种模型的结果进行评价。
ARIMA(5,1,2)(1,1,1)7模型需要识别的参数为:ar(1)ar(2)ar(3)ar(4) ar(5)ma(1)ma(2)sar(7)sma(7),sar(7)和sma(7)分别表示季节自回归部 分和季节移动平均部分的变量。对模型的残差序列进行白噪声检验,一般用Q 检验统计量进行检验,所述Q检验统计量表示为:
式中,n表示序列观测量;rk(e)表示残差序列自相关函数,e表示残差,m 是最大滞后期,k表示滞后期,若观测量较多,m取[n/10]或
△△7yt序列ARIMA(5,1,2)(1,1,1)7模型的残差序列样本量为384,滞后 期取38。K=38对应的检验统计量Q值为20.297,Prob列显示拒绝原假设所犯 第一类错误为0.883,表明残差序列相互独立即为白噪声的概率很大,通过检 验。
根据以上方法,对25种模型的检验结果进行对比分析,见表11。
表11(部分对比分析结果)
序号 (p,q) Adjusted R2 AIC SC p-Q
1,1 0.532307 -4.738419 -4.686978 0.047
1,2 0.585691 -4.840293 -4.778564 0.368
1,3 0.586859 -4.842801 -4.770785 0.383
…… …… …… …… ……
5,3 0.594407 -4.847457 -4.734288 0.827
5,4 0.59546 -4.845765 -4.722307 0.801
5,5 0.59589 -4.843876 -4.710131 0.876
经计算,这25个模型都满足ARMA过程的平稳条件及可逆条件,模型设 定合理。另外,一般要求残差序列具有较高的白噪声检验的相伴概率(p-Q), 如0.9或0.8,以保证“取伪”的概率足够小,所以首先挑出p-Q大于0.8的 模型,分别为(1,5),(2,3),(3,3),(4,3),(4,4),(5,2),(5,3), (5,4),(5,5)。在这些(p,q)组合中,(2,3)的AIC、SC值相对较小,(5,2)的Adjusted R2较大,这两个模型较理想,并且预测模型的选择应力求简 洁、有效,因而选择(p,q)的值为(2,3)的模型,即ARIMA(2,1,3)(1,1,1)7 的模型。此模型对应的参数为:
ar(1)=-0.161608,ar(2)=0.603308,
ma(1)=0.207918,ma(2)=-0.843010,ma(3)=-0.364908
sar(7)=0.034530,sma(7)=-0.977145。
模型展开式表示为:
(1-0.03453B7)(1+0.161608B-0.603308B2)(1-B)(1-B7)yt= (1+0.977145B7)(1-0.207918B+0.84301B2+0.364908B3)ut
模型对原有序列的拟合和残差图见图5,图5上半部分为预测值与实际值 得拟合效果,下半部分为残差值,可见模型较好的拟合的一卡通乘客占比序列。
获取2015年12月28日到2016年3月27日之间13周的北京轨道交通全 票种日进站量数据,利用上面的方法,对2015年12月28日到2016年3月 27日之间13周的北京轨道交通全票种日进站量数据进行分析,建立城市轨道 交通路网全票种日进站量季节ARIMA模型,即为即ARIMA(1,0,5)(1,1,1)7的 模型,模型展开式表示为:
(1-0.380425B7)(1-0.741819B)(1-B7)yt=(1+0.926810B7) (1-0.004862B-0.134792B2-0.302072B3-0.243125B4-0.041888B5)ut
利用上面的方法,根据建立的城市轨道交通一卡通乘客比例季节ARIMA 模型和建立的城市轨道交通路网全票种进站量季节ARIMA模型,建立城市轨道 交通路网一票通进站量ARIMA模型,即为即ARIMA(1,1,1)的模型,模型展开 式表示为:
(1-0.366049B)(1-B)yt=(1+0.809134B)ut
(4)预测及对比分析
利用ARIMA(2,1,3)(1,1,1)7和ARIMA(1,0,5)(1,1,1)7模型预测2016年3月28日到2016年4月3日的路网一票通乘客进站量(不包括2016年4月2 日-4日清明节假期),预测结果及误差见表12。
表12预测结果及误差
直接利用北京轨道交通一票通日进站量数据ARIMA(1,1,1)的模型预测预 测2016年3月28日到2016年4月3日的路网一票通乘客进站量(不包括2016 年4月2日-4日清明节假期),预测结果及误差见表13。
表13预测结果及误差
表13最后一列路网一票通乘客进站量误差绝对值平均值为6.99%,表5 最后一列路网一票通乘客进站量误差绝对值平均值为7.25%,说明利用北京轨 道交通日一卡通乘客比例季节ARIMA模型和路网全票种进站量季节ARIMA模型 相结合的方式预测路网一票通乘客进站量的精度要比直接利用路网一票通乘 客进站量预测模型的精度要高。
三、基于车站类别的一票通乘客进站量预测
随着轨道交通建设加快,线路及站点数也逐渐增加。例如北京轨道交通站 点数已达到334座,如果研究每个站点的票卡日使用量,则会耗时耗力。所以 本发明实施例可以研究轨道交通站点分类,对每类建立指数平滑法一票通乘客 进站量预测模型,研究不同类的车站站点的模型变量和预测值之间的关系,增 加预测操作的可行性,具体步骤包括:
获取轨道交通各车站一票通乘客进站量历史数据,对获取的轨道交通各车 站一票通乘客进站量历史数据进行分析,得到与车站客流特征相关的时间周期 变量;
对与车站客流特征相关的时间周期变量进行车站聚类分析,得到车站类别;
根据得到的车站类别,建立基于车站类别的一票通乘客进站量预测模型, 由建立的基于车站类别的一票通乘客进站量预测模型预测各车站一票通乘客 进站量。
随着城市的发展,轨道交通站点已被赋予更多、更新的内容。从已有的研 究成果来看,基于一卡通的轨道交通站点客流特征的数据积累和分析研究基础 较好,相比较而言,轨道交通站点一票通客流特征以及客流量预测的研究成果 较为匮乏。基于一票通交通站点客流特征、站点功能分类研究基础薄弱。
层次聚类分析是根据观察值或变量之间的亲疏程度,将最相似的对象结合 在一起,以逐次聚合的方式(Agglomerative Clustering),它将观察值分类, 直到最后所有样本都聚成一类。层次聚类分析有两种形式,一种是对样本(个 案)进行分类,称为Q型聚类,它使具有共同特点的样本聚齐在一起,以便对 不同类的样本进行分析;另一种是对研究对象的观察变量进行分类,称为R 型聚类。它使具有共同特征的变量聚在一起,以便从不同类中分别选出具有代 表性的变量作分析,从而减少分析变量的个数。
层次聚类分析中的Q型聚类,测量样本之间的亲疏程度是关键。聚类的时 候会涉及到两种类型亲疏程度的计算:一种是样本数据之间的亲疏程度,一种 是样本数据与小类、小类与小类之间的亲疏程度。样本数据之间的亲疏程度主 要通过样本之间的距离、样本间的相关系数来度量。
样本若有k个变量,则可以将样本看成是一个k维的空间的一个点,样本 和样本之间的距离就是k维空间点和点之间的距离,这反映了样本之间的亲疏 程度。聚类时,距离相近的样本属于一个类,距离远的样本属于不同类。
城市轨道交通车站是乘客乘降的场所,是城市交通网络的重要节点和集散 点。对车站进行聚类分析,首先要从刷卡数据中提取出反映车站客流特性的具 有代表性的相关因素作为初始变量。这些信息中包含了乘客出行的时空特性和 卡属性。在车站层次对客流的时空特性进行分析,获得了工作日和周末客流差 异等特性,为初始变量的选取提供了支撑。
本实施例中,所述对与车站客流特征相关的时间周期变量进行车站聚类分 析,得到车站类别包括:
第一步:1)假设有n个轨道交通车站,并且有m天的每个轨道交通车站 的一票通使用量比例,可以得到n×m的车站一票通比例矩阵;
2)使用聚类方法对车站按照一票通比例进行分类,确定类别。车站和车 站之间的距离使用欧式距离dij,i,j为任意两个轨道交通车站:
类和类之间的距离分别使用最短距离法和类平均法计算,并比较两种计算 方法的合理性,确定轨道交通车站分类的第一次分类结果,第一次分类结果中 的类可以用A、B、C….来表示。
第二步:
对第一步得到的每一类再进行细分,按照每类中n个轨道交通车站的m 天的每个轨道交通车站的一票通使用量进行分类,得到n×m的车站一票通使 用量矩阵。重复第一步的分类方法,得到轨道交通车站在该类中的子分类,以 1、2、3….来表示。
下面以一个具体的例子来进行说明:以北京市轨道交通276座车站一段时 间内的一票通乘客进站量数据为基础,按照前面的步骤对车站进行分类。
分类过程示例:
1)最短距离法的谱系聚类图和聚合系数变化图如图6。从图6出,车站 分类可以分为两类或者五类,但是分为两类或者五类距离的差别基本为一倍。
2)类平均法的谱系聚类图和聚合系数变化图见图7。从图7明显,分为 两类比分为三类的类间距离要大4-5倍,也就是说T2航站楼、T3航站楼和香 山的一票通比例明显比其他车站的比例要高,所以说这三个车站是一类。北京 西站至国展这个类、成寿寺至工这个类,虽然他们之间的距离和T2航站楼、 T3航站楼至香山之间的距离要小很多,但是还是有一定的差距。因此为了使 第二部分类结果更准确,把北京西站至国展这个类和成寿寺至化工这个类分别 作为两个类。
3)综合最短距离法和类平均法的结果分析,首先将轨道交通车站分为三 类,如表14所示。
表14车站分类结果
第A类站点为机场T2、T3航站楼站、香山。这三个站点为一票通比例超 高的对外交通枢纽站和旅游区,日一票通客流量占日全天客流量的85%左右, 较其他对外交通枢纽和旅游区表现出更明显的特性。
第B类站点为工作区、居住区及功能混合型车站,如天通苑站、生命科学 园站、苹果园、金台夕照站、国贸站、中关村站等。日出行客流多为通勤客流, 周末全天客流分布较平缓,属于特征显著的工作区和居住区站点。
第C类站点为交通枢纽类车站和旅游区车站,如北京西站、北京站、前门 站、植物园站。该类车站有大量临时客流,属于外地乘客聚集地,北京站和北 京西站是大型火车站,前门站、香山站、植物园站属于旅游景点类车站。
然后还需要对第二类、第三类再按照车站一票通的数量进行细分;其中第 B类进行分类。从图8可看出,可将第二类再分为五类。
对第C类进行分类:从图9明显看出第三类再按照车站一票通的数量分为 三类。
本实施例中,分类完成后,根据得到的车站类别,建立基于车站类别的一 票通乘客进站量预测模型,由建立的基于车站类别的一票通乘客进站量预测模 型预测各车站一票通乘客进站量。
在日常运营阶段,无特殊节假日、大型活动等特别事件影响的前提下,城 市轨道交通网络的客流变化具有较强的稳定性和规律性。选取某一阶段一票通 客流数据,采用时间序列预测模型,即可预测未来近期一票通客流情况。时间 序列预测法包括:简单序时平均数法、加权序时平均数法、移动平均法、加权 移动平均法、趋势预测法、指数平滑法、季节性趋势预测法、市场寿命周期预 测法等。
指数平滑法是一种特殊的加权移动平均法,其加权的特点是对离预测期近 的历史数据给予较大的权数,对离预测期远的历史数据给予较小的权数,权数 由近到远按指数规律递减,所以这种方法被称为指数平滑法。
(1)一次指数平滑的预测模型:
已知时间序列为X1,X2,X3,…,Xt,t为时间序列总期数,利用时间序列前t 期的观察值X1,X2,X3,…,Xt预测第t+1期的值Xt+1时,赋予第i期的权重为 ωt+1-i(i=1,2,…,t)ω12…ωt;则一次指数平滑的预测模型
由上述公式可以看出,由于需要数据太多,因此权重不容易确定。因此本 发明实施例中采用自动提取权重的方法,包括:自当前期向前,各期权重按指 数规律下降,即第t期,第t-1期,…第1期的权重依次为: α,αβ,αβ2…(α>0,0<β<1);其中α为平滑系数
其中,t→+∞;α+αβ+αβ2+…=1;
自当前期开始逐渐向前各期权重依次为α,α(1-α),α(1-α)2…;
第t+1、t期的预测值表示为:
St+1=αXt+α(1-α)Xt-1+α(1-α)2Xt-2+…;
St=αXt-1+α(1-α)Xt-2+α(1-α)2Xt-3+…;
St+1-(1-α)St=αXt
St+1=αXt+(1-α)St
由此可以看出,一次指数平滑的预测模型既不需要存储全部历史数据,也 不需要存储一组数据,从而可以大大减少数据存储问题,甚至有时只需一个最 新观察值、最新预测值和α值,就可以进行预测。一次指数平滑的预测模型提 供的预测值是前一期预测值加上前期预测值中产生的误差的修正值。
一次指数平滑法只适用于水平型历史数据的预测,而不适用于斜坡型线性 趋势历史数据的预测。因为对于明显呈斜坡型的历史数据,即使α数值很大(接 近于1)仍然会产生较大的系统误差,一次指数平滑法不适用于呈斜坡型线性 变动的历史数据,因此对一次指数平滑法加以改进,以适应斜坡型历史数据的 预测。
(2)二次指数平滑的预测模型
对于斜坡型的历史数据,历史数据和一次指数平滑值的差值与一次指数平 滑值和二次指数平滑值的差值基本相同。在大多数情况下,常用线性二次指数 平滑法作为预测方法。
二次指数平滑法是对一次指数平滑值作再一次指数平滑的方法。它不能单 独地进行预测,必须与一次指数平滑法配合,建立预测的数学模型,然后运用 数学模型确定预测值。所以,可以先求出一次指数平滑值和二次指数平滑值的 差值,然后将此差值加到一次指数平滑值上去,再加上趋势变动值就能得出近 似于实际的预测值。根据这一原理,可以建立二次指数平滑法的预测模型。
二次指数平滑法预测模型的一般表达为
Yt+T=at+bt·T
式中,Yt+T为t+T的预测值,T为t期到预测期的间隔期数,at,bt为模型 参数;
式中,分别为一次指数平滑和二次指数平滑值;在指数平滑法中, t+1期预测值为t期的一次指数平滑值,用表示,则有
将i=1,2,…,t的所有一次指数平滑值作为新的实践序列,再次进行指 数平滑,即可得到原时间序列的二次指数平滑值,如式所示。
指数平滑法初始值的确定应从时间序列的项数来考虑:若时间序列的观察 期t大于15时,初始值对预测结果的影响很小,可以方便地以第一期观测值 作为初始值;若观察期t小于15,初始值对预测结果影响较大,可以取最初 几期的观测值的平均数作为初始值,通常取前3个观测值的平均值作为初始值。
通过对与车站客流特征相关的时间周期变量进行车站聚类分析得到车站 类别,建立基于车站类别的一票通日使用量预测。
在本发明的一个实施例中,采用的样本数据为北京城市轨道交通2015年 12月26日至2016年8月28日间连续8个月各车站一票通使用量,每个月5 天至10天,分别对周一、周三、周五、周六、周日进行预测。以天通苑北站、 王府井站、国贸站3种车站类型为例,建立基于车站类型的一票通日使用量预 测模型。3个车站在周三一票通使用量如表15所示。
表15一票通使用量
日期 天通苑北 国贸 王府井
2015/12/30 4212 6810 9137
2016/1/20 4305 7326 10739
2016/2/17 3195 5985 13606
2016/3/16 4743 7461 11727
2016/4/13 5826 8808 14292
2016/5/18 5368 8445 14290
2016/6/1 5074 7686 12088
2016/6/15 5382 6615 13882
2016/7/13 5645 9429 20335
2016/8/24 5789 9297 21515
1、天通苑北站
天通苑北位于地铁5号线最北端,是典型的居住性车站,通勤人口居多。 为了出行方便,大部分乘客使用一卡通,而一票通比例相对较低。天通苑北一 票通计算步骤及结果如下:
(1)确定初始值
因为样本数量n=10<15,取时间序列的前三项数据(也就是表1中的前三 项数据)的平均值作为初始值;
(2)选择平滑系数α
采用二次指数平滑法,平滑系数α值分别取0.7、0.6、0.5、0.4、0.3, 预测下一周期的各车站一票通使用量情况。
(3)预测值计算
以平滑系数α=0.7为例,令计算各年二次指数平滑 值。
①根据前述公式取α=0.7,计算各 期的一次平滑值如下:
第一期2015/12/30
第二期2016/1/20
同理,可得各期的一次指数平滑值,见表2中列计算值。
②根据前述公式取α=0.7,计算各期 的二次平滑值如下:
第一期2015/12/30
第二期2016/1/20
同理,可得各期的二次指数平滑值,见表2中列计算值。
③根据计算各期参数at、bt
第一期2015/12/30
a1=4184.3
b1=150.9
第二期2016/1/20
a2=4307.7
b2=136.1
同理,可得各期的模型参数值见表2中at、bt列计算值。
④根据Yt+1=at+bt分别求各期的预测值:
Y2=a1+b1=4335.2
Y3=a2+b2=4443.8
以此类推,即可获得各期的趋势预测值,α=0.7时结果见表16。
表16天通苑北站一票通使用量及预测值
同理分别预测当α=0.6,0.5,0.4,0.3时下一期的一票通日使用量,预测 结果如表17所示。
表17不同平滑系数下的一票通预测值
图10可以看出不同平滑系数对应的预测值与真实值。
尽管2016年9月21日预测结果较好,但是数据时间跨度较长。实际上, 指数平滑法预测结果的准确性依赖于近期的客流量,与近期较远的预测期的预 测值很难保证其准确性。因此,对于天通苑北站客流期数进行研究,得出最优 预测期数。
(2)平滑系数α的选择
①当时间序列呈稳定的水平趋势时,α应取较小值,如0.1~0.3;
②当时间序列波动较大,长期趋势变化的幅度较大时,α应取中间值,如 0.3~0.5;
③当时间序列具有明显的上升或下降趋势时,α应取较大值,如0.6~0.8;
在实际运用中,可取若干个α值进行试算比较,选择预测误差最小的α值。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将 一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些 实体或操作之间存在任何这种实际的关系或者顺序。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技 术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰, 这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种轨道交通一票通乘客进站量预测方法,其特征在于,包括:
获取城市轨道交通节假日一票通乘客进站量历史数据,根据获取的城市轨道交通节假日一票通乘客进站量历史数据,确定影响城市轨道交通节假日一票通乘客进站量的变量,基于确定的变量,建立城市轨道交通节假日一票通乘客进站量与变量之间的回归模型;
根据回归模型对城市轨道交通节假日一票通乘客进站量进行预测,得到预测值计算预测值与真实值y之间的残差对残差ε进行平稳性分析,建立残差的ARMA模型;
根据构建的回归模型和ARMA模型,建立城市轨道交通节假日一票通乘客进站量组合预测模型,由建立的城市轨道交通节假日一票通乘客进站量组合预测模型预测节假日的一票通乘客进站量。
2.根据权利要求1所述的轨道交通一票通乘客进站量预测方法,其特征在于,确定的影响城市轨道交通节假日一票通乘客进站量的变量包括:连续变量和虚拟变量;
所述连续变量包括:全票种进站量、地面公交客运量、日平均气温、AQI;
所述虚拟变量包括:有序变量和无序变量;
所述有序变量包括:节假日时间长短、节假日回家和旅游特征、路网车站数;所述无序变量包括:天气情况、节假日分类。
3.根据权利要求2所述的轨道交通一票通乘客进站量预测方法,其特征在于,所述基于确定的变量,建立城市轨道交通节假日一票通乘客进站量与变量之间的回归模型包括:
量化虚拟变量,对量化后的虚拟变量进行线性相关性的拟合,得到几类相互独立的虚拟变量;
基于连续变量和得到的几类相互独立的虚拟变量,建立城市轨道交通节假日一票通乘客进站量与全票种进量、地面公交客运量、日平均气温、AQI、独立的虚拟变量之间的回归模型。
4.根据权利要求3所述的轨道交通一票通乘客进站量预测方法,其特征在于,所述回归模型表示为:
<mrow> <mi>y</mi> <mo>=</mo> <msub> <mi>a</mi> <mn>0</mn> </msub> <mo>+</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>4</mn> </munderover> <msub> <mi>&amp;delta;</mi> <mi>i</mi> </msub> <msub> <mi>a</mi> <mi>i</mi> </msub> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>+</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>5</mn> </mrow> <mn>7</mn> </munderover> <msub> <mi>&amp;delta;</mi> <mi>i</mi> </msub> <msub> <mi>b</mi> <mi>i</mi> </msub> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>+</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>8</mn> </mrow> <mn>9</mn> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>Q</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msub> <mi>&amp;delta;</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <msub> <mi>c</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mrow>
其中,y表示城市轨道交通节假日一票通乘客进站量;a0表示常数项;i的取值为1、2、3、4、5、6、7、8、9;x1表示全票种进站量;x2表示地面公交客运量;x3表示日平均气温;x4表示AQI;x5表示节假日时间长短;x6表示节假日回家和旅游特征;x7路网车站数;x8表示天气情况;x9表示节假日分类;ai表示第i连续变量的系数;bi表示第i有序变量的系数;δi表示回归模型中若包括相应的连续变量,则记为1,否则为0;xij表示第i无序变量的第j哑变量;cij表示无序变量的哑变量的系数;δij表示回归模型中若包括相应无序变量的哑变量,则记为1,否则为0;Q(i)表示第i无序变量取值种类数。
5.根据权利要求4所述的轨道交通一票通乘客进站量预测方法,其特征在于,所述ARMA模型表示为:
φp(B)εt=θq(B)ut
其中,P表示季节自回归阶数;q表示季节移动平均阶数;φp表示季节自回归系数;θq表示季节移动平均系数;φp(B)表示季节自回归滞后多项式;θq(B)表示季节移动平均滞后多项式;εt表示自回归序列;ut表示误差项;B表示滞后算子。
6.根据权利要求5所述的轨道交通一票通乘客进站量预测方法,其特征在于,所述城市轨道交通节假日一票通乘客进站量组合预测模型表示为:
<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>y</mi> <mo>=</mo> <msub> <mi>a</mi> <mn>0</mn> </msub> <mo>+</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>4</mn> </munderover> <msub> <mi>&amp;delta;</mi> <mi>i</mi> </msub> <msub> <mi>a</mi> <mi>i</mi> </msub> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>+</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>5</mn> </mrow> <mn>7</mn> </munderover> <msub> <mi>&amp;delta;</mi> <mi>i</mi> </msub> <msub> <mi>b</mi> <mi>i</mi> </msub> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>+</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>8</mn> </mrow> <mn>9</mn> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>Q</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msub> <mi>&amp;delta;</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <msub> <mi>c</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>+</mo> <mi>&amp;epsiv;</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>&amp;phi;</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <mi>B</mi> <mo>)</mo> </mrow> <msub> <mi>&amp;epsiv;</mi> <mi>t</mi> </msub> <mo>=</mo> <msub> <mi>&amp;theta;</mi> <mi>q</mi> </msub> <mrow> <mo>(</mo> <mi>B</mi> <mo>)</mo> </mrow> <msub> <mi>u</mi> <mi>t</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>.</mo> </mrow>
7.根据权利要求6所述的轨道交通一票通乘客进站量预测方法,其特征在于,所述方法还包括:
获取城市轨道交通日一卡通乘客比例历史数据,利用自相关和偏自相关函数对获取的城市轨道交通日一卡通乘客比例历史数据进行平稳性和周期性分析,根据分析结果,建立城市轨道交通一卡通乘客比例季节ARIMA模型;
获取城市轨道交通全票种日进站量历史数据,利用自相关和偏自相关函数对获取的城市轨道交通全票种日进站量历史数据进行平稳性和周期性分析,建立城市轨道交通路网全票种进站量季节ARIMA模型;
根据建立的城市轨道交通一卡通乘客比例季节ARIMA模型和建立的城市轨道交通路网全票种进站量季节ARIMA模型,建立城市轨道交通路网一票通进站量ARIMA模型,由建立的建立城市轨道交通路网一票通进站量ARIMA模型预测路网一票通乘客进站量。
8.根据权利要求1或7所述的轨道交通一票通乘客进站量预测方法,其特征在于,所述方法还包括:
获取轨道交通各车站一票通乘客进站量历史数据,对获取的轨道交通各车站一票通乘客进站量历史数据进行分析,得到与车站客流特征相关的时间周期变量;
对与车站客流特征相关的时间周期变量进行车站聚类分析,得到车站类别;
根据得到的车站类别,建立基于车站类别的一票通乘客进站量预测模型,由建立的基于车站类别的一票通乘客进站量预测模型预测各车站一票通乘客进站量。
9.据权利要求8述的轨道交通一票通乘客进站量预测方法,其特征在于,所述对与车站客流特征相关的时间周期变量进行车站聚类分析,得到车站类别包括:
S1,使用聚类方法对车站按照一票通比例进行分类,在分类时,基于最短距离法和类平均法,确定类别;
S2,针对S1得到每一类,再继续细分;具体包括:获取每一类中的n个轨道交通车站的m天的每个轨道交通车站的一票通使用量进行分类,获得n×m的车站一票通使用量矩阵;重复S1的分类方法,得到轨道交通车站在该类中的子分类。
10.权利要求8述的轨道交通一票通乘客进站量预测方法,其特征在于,所述根据得到的车站类别,建立基于车站类别的一票通乘客进站量预测模型包括:
根据得到的车站类别,利用指数平滑法,建立基于车站类别的一票通乘客进站量预测模型。
CN201710311641.2A 2017-05-05 2017-05-05 一种轨道交通一票通乘客进站量预测方法 Pending CN107316096A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710311641.2A CN107316096A (zh) 2017-05-05 2017-05-05 一种轨道交通一票通乘客进站量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710311641.2A CN107316096A (zh) 2017-05-05 2017-05-05 一种轨道交通一票通乘客进站量预测方法

Publications (1)

Publication Number Publication Date
CN107316096A true CN107316096A (zh) 2017-11-03

Family

ID=60185501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710311641.2A Pending CN107316096A (zh) 2017-05-05 2017-05-05 一种轨道交通一票通乘客进站量预测方法

Country Status (1)

Country Link
CN (1) CN107316096A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002944A (zh) * 2018-10-10 2018-12-14 红云红河烟草(集团)有限责任公司 一种卷包车间备件需求的预测方法
CN109657860A (zh) * 2018-12-19 2019-04-19 东南大学 基于轨道交通历史运营数据的轨道交通网络容量确定方法
CN113159408A (zh) * 2021-04-14 2021-07-23 交控科技股份有限公司 轨道交通站点客流预测方法及装置
CN113177657A (zh) * 2021-04-20 2021-07-27 上海大学 轨道交通客流预测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021430A (zh) * 2014-06-12 2014-09-03 东南大学 一种城市轨道交通站点客流不确定性分析方法
CN104217250A (zh) * 2014-08-07 2014-12-17 北京市交通信息中心 一种基于历史数据的城市轨道交通新线开通客流预测方法
CN106372722A (zh) * 2016-09-18 2017-02-01 中国科学院遥感与数字地球研究所 地铁短时流量预测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021430A (zh) * 2014-06-12 2014-09-03 东南大学 一种城市轨道交通站点客流不确定性分析方法
CN104217250A (zh) * 2014-08-07 2014-12-17 北京市交通信息中心 一种基于历史数据的城市轨道交通新线开通客流预测方法
CN106372722A (zh) * 2016-09-18 2017-02-01 中国科学院遥感与数字地球研究所 地铁短时流量预测方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
光志瑞: "城市轨道交通节假日客流预测研究", 《交通工程》 *
汪波,黄建玲 等: "城市轨道交通网络新线开通客流预测与评估", 《第十届中国智能交通年会优秀论文集》 *
王静,刘剑锋 等: "北京市轨道交通车站客流时空分布特征", 《城市交通》 *
鲍枫,汪波 等: "轨道交通线网常客比例分析", 《城市道桥与防洪》 *
鲍枫,汪波 等: "轨道交通节假日票卡进站量修正的虚拟变量回归模型构建", 《公路》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002944A (zh) * 2018-10-10 2018-12-14 红云红河烟草(集团)有限责任公司 一种卷包车间备件需求的预测方法
CN109657860A (zh) * 2018-12-19 2019-04-19 东南大学 基于轨道交通历史运营数据的轨道交通网络容量确定方法
CN113159408A (zh) * 2021-04-14 2021-07-23 交控科技股份有限公司 轨道交通站点客流预测方法及装置
CN113159408B (zh) * 2021-04-14 2023-11-21 交控科技股份有限公司 轨道交通站点客流预测方法及装置
CN113177657A (zh) * 2021-04-20 2021-07-27 上海大学 轨道交通客流预测方法及装置
CN113177657B (zh) * 2021-04-20 2022-08-30 上海大学 轨道交通客流预测方法及装置

Similar Documents

Publication Publication Date Title
CN110428096B (zh) 基于票务信息的城市轨道交通多交路运输组织优化方法
CN107895283A (zh) 一种基于时间序列分解的商家客流量大数据预测方法
CN110390349A (zh) 基于XGBoost模型的公交车客流量预测建模方法
CN111665575B (zh) 一种基于统计动力的中长期降雨分级耦合预报方法及系统
CN106485262A (zh) 一种母线负荷预测方法
CN109299438B (zh) 一种基于网约车数据的公共交通设施供给水平评价方法
CN110503104B (zh) 一种基于卷积神经网络的短时剩余车位数量预测方法
CN107316096A (zh) 一种轨道交通一票通乘客进站量预测方法
CN103632212A (zh) 一种时变用户均衡动态网络演化客流预测系统和方法
CN106503869A (zh) 一种基于站点短时需求预测的公共自行车动态调度方法
CN110555990A (zh) 一种基于lstm神经网络的有效停车时空资源预测方法
CN106910199A (zh) 面向城市空间信息采集的车联网众包方法
CN106951976A (zh) 一种基于模式分类的公交客流预测方法
CN106781489A (zh) 一种基于递归神经网络的路网状态预测方法
CN110348601A (zh) 一种基于双向长短期记忆网络的地铁短期客流量预测方法
CN104992244A (zh) 一种基于sarima和rbf神经网络集成组合模型的机场货运量预测分析方法
CN110047291A (zh) 一种考虑扩散过程的短时交通流预测方法
Rengaraju et al. Modeling for air travel demand
CN112232561B (zh) 基于约束并行lstm分位数回归的电力负荷概率预测方法
CN106845714A (zh) 一种基于季节指数的arima模型预测城市轨道交通月度客流方法
CN109637196A (zh) 航路扇区交通概率密度预测方法
CN110889092A (zh) 一种基于轨道交易数据的短时大型活动周边轨道站点客流量预测方法
CN114943356A (zh) 一种机场到港旅客乘坐出租车短时需求集成预测方法
CN115953186A (zh) 一种网约车需求模式识别与短时需求预测方法
CN111598333A (zh) 客流数据的预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171103

RJ01 Rejection of invention patent application after publication