CN112149902A - 一种基于客流特征分析的地铁短时进站客流预测方法 - Google Patents

一种基于客流特征分析的地铁短时进站客流预测方法 Download PDF

Info

Publication number
CN112149902A
CN112149902A CN202011008596.1A CN202011008596A CN112149902A CN 112149902 A CN112149902 A CN 112149902A CN 202011008596 A CN202011008596 A CN 202011008596A CN 112149902 A CN112149902 A CN 112149902A
Authority
CN
China
Prior art keywords
passenger flow
station
prediction
data
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011008596.1A
Other languages
English (en)
Other versions
CN112149902B (zh
Inventor
张翀宇
赵淑芝
刘华胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202011008596.1A priority Critical patent/CN112149902B/zh
Publication of CN112149902A publication Critical patent/CN112149902A/zh
Application granted granted Critical
Publication of CN112149902B publication Critical patent/CN112149902B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开的属于客流预测技术领域,具体为一种基于客流特征分析的地铁短时进站客流预测方法,以成都市地铁AFC数据为数据来源,选取5分钟为时间粒度,基于随机森林、支持向量机回归、神经网络等模型,对地铁进站客流进行了短期预测和模型对比分析。通过分析站点的客流特征,将轨道交通站点按客流特征分成住宅区型、商业区型、商务区型、枢纽型四类,并选取各类型站点在工作日和周末场景下进行三种模型的训练。以平均绝对百分误差(MAPE)与均方根误差(RMSE)为评价指标,对模型预测效果的准确性和稳定性进行评价。预测结果表明,BP神经网络预测结果综合表现最优,随机森林对于周期性较强的住宅区型站点预测精度较好。

Description

一种基于客流特征分析的地铁短时进站客流预测方法
技术领域
本发明涉及客流预测技术领域,具体为一种基于客流特征分析的地铁短时进站客流预测方法。
背景技术
随着城市轨道交通网络化进程的加快,准确掌握客流实时变化规律成为了有效保障运输秩序和提高运输服务质量的关键要素。高精度的短时进站客流预测可以帮助管理者针对客流波动作出快速反应,及时调整运输计划并缓解城市轨道交通线路客流不均衡的状况,提高运输服务质量。同时也为车站设施合理布局提供必要的决策支撑,保障轨道交通系统安全高效运行。
针对于短时客流预测,可以划分为两类:参数方法(如自回归积分滑动平均、卡尔曼滤波等)和非参数方法(如支持向量机、神经网络等)。参数方法的客流预测研究中,熊杰等基于卡尔曼滤波原理,构建了地铁换乘客流模型,得出工作日早高峰的客流预测更为精准;王奕等使用马尔科夫链对GM(1,1)灰色预测模型进行改进,并证明其对于波动性较大的客流预测具有较高精度;蔡昌俊等构建ARIMA进出站预测模型,验证得出模型具有良好预测精度。非参数方法的客流预测研究中,邹巍等建立以小波神经网络为基础的遗传算法修正预测模型,得出与遗传算法优化的BP神经网络及单一的小波神经网络相比其预测精度更高;Jiang X借助小波神经网络建立了一种非参数动态时间延迟递归小波神经网络预测模型,并证明其在短时预测和长期预测表现都比较优秀;董升伟基于BP神经网络模型,使用遗传算法进行改进,对轨道交通车站、断面、换乘客流进行短时预测,使得模型预测精度得到大幅提高;史文雯分别构建小波神经网络、模糊神经网络与支持向量机神经网络模型预测北京地铁客流量,结果表明小波神经网络可以比较精确地预测客流变化;Qicheng Tang等运用深度学习方法,将时空特性与长短期记忆模型(LSTM)相结合,运用于重庆轨道交通站点客流的预测中并证明了其更好的准确性和稳定性。还有部分学者将参数和非参数方法进行对比,如Castro-Neto M建立了OL-SVM模型对交通流进行预测,通过与高斯最大似然法、霍尔特指数平滑法等对比验证了OL-SVM的优势。
目前针对于交通流量预测的研究中,大多选取的时间粒度多数为15分钟或15分钟以上,由于采样时间跨度较大,样本数据数值型特征表现明显,因此对实时数据中的噪声因素考虑不足,其预测方法也难以适用于现实环境。另一方面,目前获得的数据存在着数据维度增高、数据质量偏低、数据随机性强等问题,而机器学习方法可以通过不断学习数据而完善自身性能,得到预测精度较高的模型。因此基于机器学习方法进行模型对比分析,从中找出鲁棒性强和准确性高的模型具有重要的实际意义。在机器学习方法中,SVM、神经网络等模型从之前的研究中就可以看出具有较强的拟合效果,而随机森林无论是在在分类还是回归问题上都具有较为出色的表现,因此本文选取这三种模型进行短期客流预测研究。除此之外,为了模型更加适用于现实场景,本文选取的进站客流统计数据时间粒度为5分钟,并且在基于站点客流特征分析的基础上,对不同类型站点的工作日和非工作日进站客流分别进行了预测,最终得出不同类型站点对应的最佳预测模型。
发明内容
本部分的目的在于概述本发明的实施方式的一些方面以及简要介绍一些较佳实施方式。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述和/或现有客流预测方法中存在的问题,提出了本发明。
因此,本发明的目的是提供一种基于客流特征分析的地铁短时进站客流预测方法,能够根据不同的站点和客流情况,选择不同的预测方法,提供更好的预测效果,结果更加精确。
为解决上述技术问题,根据本发明的一个方面,本发明提供了如下技术方案:
一种基于客流特征分析的地铁短时进站客流预测方法,其包括以下步骤:
S1:地铁进站客流特征分析:对地铁站的AFC数据进行了预处理,对AFC异常数据进行了筛选和剔除,同时还剔除了单次行程时间超过三个小时的数据,以确保进站数据的有效性和真实性,最后对进站客流原始数据进行5分钟时间粒度的统计;
S2:模型建立:
1数据集建立:由于进站客流具有较强的时间关联性,因此考虑在模型数据集中加入与当前时段临近的q个时间段的进站流量,通过历史数据自相关系数的计算,可以得到q的合理取值;
2模型构建:
随机森林:通过自助法从原始训练集中有放回的重复随机抽取m个样本和n个特征来生成新的训练集,根据新的训练集来产生k个决策树,根据这些决策树的训练结果进行投票并输出结果;
支持向量机:给定训练样本集(xi,yi)(i=1,2,3,…,n),对于该样本集而言,xi∈Rn为n维输入样本,xi=(xi1,xi2,…,xin),y1∈Rn为输出样本,在非线性回归中,通过映射:
Figure BDA0002696813250000031
Rn→H,H为特征空间,将训练样本由初始低维样本空间映射到高维特征空间,转化为特征空间中的线性回归问题,最终实现低维空间的非线性回归;
神经网络:选取BP神经网络进行模型的构建;
S3:结果对比分析:机器学习方法的不同模型具有不同的超参数,以均方误差最小为目标,采用交叉验证方法对各个模型的超参数进行了寻优搜索,为了更好的衡量模型的准确性和稳定性,选取站点的平均绝对百分误差(MAPE)、均方根误差(RMSE)为指标,进行不同模型的对比分析。
作为本发明所述的基于客流特征分析的地铁短时进站客流预测方法的一种优选方案,其中:所述步骤S2中,数据集建立的公式如下:
Figure BDA0002696813250000041
Figure BDA0002696813250000042
式中:
Figure BDA0002696813250000043
为站点i于x日滞后q个时段的自相关系数;
Figure BDA0002696813250000044
分别为站点i于x日时段n、n+q的进站量;
Figure BDA0002696813250000045
为站点i于x日分时进站量的均值;N为有效时段数;
若设预测时段进站客流为
Figure BDA0002696813250000046
则在工作日场景下,数据集中特征变量与因变量之间的映射关系如下方公式所示:
Figure BDA0002696813250000047
在周末场景下,同一站点的相邻日期客流分布偏差稍大,因此剔除相邻日期的客流序列,其映射关系如下方公式所示:
Figure BDA0002696813250000048
式中:
Figure BDA0002696813250000049
为各站点第i周第j天第k个时间段的进站流量,除此之外,针对于SVM和BP神经网络需要对训练集数据进行归一化处理。
作为本发明所述的基于客流特征分析的地铁短时进站客流预测方法的一种优选方案,其中:所述步骤S2中回归函数为:
f(x)=wTφ(x)+b (5)
在支持向量机回归算法中,定义误差函数为损失函数,对于ε型不敏感损失函数,ε为不敏感值,即容忍f(x)与y之间最多存在ε的偏差,若偏差绝对值不超过ε可不计损失,否则需计算损失。损失函数为:
Figure BDA0002696813250000051
因此对于回归问题其目标函数表达式为:
Figure BDA0002696813250000052
作为本发明所述的基于客流特征分析的地铁短时进站客流预测方法的一种优选方案,其中:所述步骤S2对于给定的训练集(xi,yi),对于每个独立的神经元的输出函数为:
Figure BDA0002696813250000053
式中:f为神经元的激活函数,选用Sigmoid函数作为激活函数;xi为神经元的输入信号;wi为神经元i的连接权重;θ为神经元的阈值;b为偏置值,BP神经网络的目标函数为:
Figure BDA0002696813250000054
式中:E为样本累计误差;
Figure BDA0002696813250000055
为训练例中第j个神经元训练输出;
Figure BDA0002696813250000056
为训练例k中第j个神经元实际输出,最终通过对权值θ和偏置值b求偏导,实现参数的更新。
作为本发明所述的基于客流特征分析的地铁短时进站客流预测方法的一种优选方案,其中:所述步骤S3中两种指标的计算公式为:
Figure BDA0002696813250000061
Figure BDA0002696813250000062
yi
Figure BDA0002696813250000063
分别代表站点i第个时间段进站流量的实际值和预测值,MAPE的值越趋近于0,则证明预测的准确性越好;RMSE的值越小,说明拟合结果的稳定性越强,BP神经网络相比较而言,针对于不同的预测情景,其预测误差最小,预测结果准确性最高;随机森林和支持向量机在枢纽型站点的预测效果偏差稍大,在其他情景下表现也较为出色。
与现有技术相比:综合准确性和稳定性来看,BP神经网络在三个模型中对于不同类型的站点预测整体表现最优;随机森林模型对于客流周期性较强的站点预测效果最好,最适用于住宅型站点的预测;BP神经网络对于商业区型和枢纽型站点预测效果较好,表明BP神经网络更加适用于客流波动较大的站点,通过对随机森林各影响因素重要度分析可以得出,在七个影响因素中,地铁站点上一周同时刻的客流序列对预测结果影响较大,验证了地铁进站客流具有较强的周期性,该基于客流特征分析的地铁短时进站客流预测方法,能够根据不同的站点和客流情况,选择不同的预测方法,提供更好的预测效果,结果更加精确。
附图说明
为了更清楚地说明本发明实施方式的技术方案,下面将结合附图和详细实施方式对本发明进行详细说明,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明的4月19日(工作日—星期四)各站点进站流量图;
图2为本发明的4月22日(周末—星期日)各站点进站流量图;
图3为本发明的天河路站分时(工作日)进站流量图;
图4为本发明的春熙路站分时(周末)进站流量图;
图5为本发明的不同情景下的MAPE分布图;
图6为本发明的不同情景下的RMSE分布图;
图7为本发明的随机森林特征重要度图;
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施方式的限制。
其次,本发明结合示意图进行详细描述,在详述本发明实施方式时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的实施方式作进一步地详细描述。
本发明提供一种基于客流特征分析的地铁短时进站客流预测方法,能够根据不同的站点和客流情况,选择不同的预测方法,提供更好的预测效果,结果更加精确,请参阅图5、图6和图7包括以下步骤:
S1:地铁进站客流特征分析:对地铁站的AFC数据进行了预处理,对AFC异常数据进行了筛选和剔除,同时还剔除了单次行程时间超过三个小时的数据,以确保进站数据的有效性和真实性,最后对进站客流原始数据进行5分钟时间粒度的统计;
S2:模型建立:
1数据集建立:由于进站客流具有较强的时间关联性,因此考虑在模型数据集中加入与当前时段临近的q个时间段的进站流量,通过历史数据自相关系数的计算,可以得到q的合理取值,数据集建立的公式如下:
Figure BDA0002696813250000081
Figure BDA0002696813250000082
式中:
Figure BDA0002696813250000083
为站点i于x日滞后q个时段的自相关系数;
Figure BDA0002696813250000084
分别为站点i于x日时段n、n+q的进站量;
Figure BDA0002696813250000085
为站点i于x日分时进站量的均值;N为有效时段数;
若设预测时段进站客流为
Figure BDA0002696813250000086
则在工作日场景下,数据集中特征变量与因变量之间的映射关系如下方公式所示:
Figure BDA0002696813250000087
在周末场景下,同一站点的相邻日期客流分布偏差稍大,因此剔除相邻日期的客流序列,其映射关系如下方公式所示:
Figure BDA0002696813250000088
式中:
Figure BDA0002696813250000089
为各站点第i周第j天第k个时间段的进站流量,除此之外,针对于SVM和BP神经网络需要对训练集数据进行归一化处理;
2模型构建:
随机森林:通过自助法从原始训练集中有放回的重复随机抽取m个样本和n个特征来生成新的训练集,根据新的训练集来产生k个决策树,根据这些决策树的训练结果进行投票并输出结果;
支持向量机:给定训练样本集(xi,yi)(i=1,2,3,…,n),对于该样本集而言,xi∈Rn为n维输入样本,xi=(xi1,xi2,…,xin),y1∈Rn为输出样本,在非线性回归中,通过映射:
Figure BDA0002696813250000091
Rn→H,H为特征空间,将训练样本由初始低维样本空间映射到高维特征空间,转化为特征空间中的线性回归问题,最终实现低维空间的非线性回归,回归函数为:
f(x)=wTφ(x)+b (5)
在支持向量机回归算法中,定义误差函数为损失函数,对于ε型不敏感损失函数,ε为不敏感值,即容忍f(x)与y之间最多存在ε的偏差,若偏差绝对值不超过ε可不计损失,否则需计算损失。损失函数为:
Figure BDA0002696813250000092
因此对于回归问题其目标函数表达式为:
Figure BDA0002696813250000093
神经网络:选取BP神经网络进行模型的构建,对于给定的训练集(xi,yi),对于每个独立的神经元的输出函数为:
Figure BDA0002696813250000094
式中:f为神经元的激活函数,选用Sigmoid函数作为激活函数;xi为神经元的输入信号;wi为神经元i的连接权重;θ为神经元的阈值;b为偏置值,BP神经网络的目标函数为:
Figure BDA0002696813250000101
式中:E为样本累计误差;
Figure BDA0002696813250000102
为训练例中第j个神经元训练输出;
Figure BDA0002696813250000103
为训练例k中第j个神经元实际输出,最终通过对权值θ和偏置值b求偏导,实现参数的更新;
S3:结果对比分析:机器学习方法的不同模型具有不同的超参数,以均方误差最小为目标,采用交叉验证方法对各个模型的超参数进行了寻优搜索,为了更好的衡量模型的准确性和稳定性,选取站点的平均绝对百分误差(MAPE)、均方根误差(RMSE)为指标,进行不同模型的对比分析,两种指标的计算公式为:
Figure BDA0002696813250000104
Figure BDA0002696813250000105
yi
Figure BDA0002696813250000106
分别代表站点i第个时间段进站流量的实际值和预测值,MAPE的值越趋近于0,则证明预测的准确性越好;RMSE的值越小,说明拟合结果的稳定性越强,BP神经网络相比较而言,针对于不同的预测情景,其预测误差最小,预测结果准确性最高;随机森林和支持向量机在枢纽型站点的预测效果偏差稍大,在其他情景下表现也较为出色。
实施例:
请参阅图1、图2、图3和图4,以成都市地铁2号线各站点5分钟时间粒度的进站数据为基础,并且针对于各个站点的客流时间分布特征,将站点分为住宅区型、商业区型、商务区型、枢纽型四类。不同类型的站点在同一时间序列内呈现出不同的客流特征。对于枢纽型和商业区型站点,无论是在工作日还是周末进站流量都比较大,并且客流波动也较为明显。住宅区型和商务区型站点在工作日期间进站客流呈现单峰且各自早高峰和晚高峰特点明显,在周末站点进站客流量一直处于较少状态且波动较小;
除此之外,同一站点的客流分布在工作日和周末也存在着相关性和周期性。在工作日天河路4月18号的客流分布与前一周、前一天的客流分布存在着较强的相关性,在周末春熙路4月22号客流分布与前一周、前一天的客流分布同样存在着较强的相关性,但是相比较而言在19点之后,4月15号与4月22号的客流分布相关性更强,4月21号客流趋势相近但偏差稍大。综合以上客流特征,针对不同类型站点,将预测情景划分为工作日和非工作日两类。
以2018年4月份成都地铁2号线每个站点每日192条进站客流数据作为一个序列样本,对于4月份的21个工作日和6个周末计算各自的自相关系数。一般情况认为当
Figure BDA0002696813250000111
大于0.5时,序列中相邻的q个时段相关性显著。结果如下表所示,若80%以上的样本总量满足大于0.5的条件,则认为邻近的前q个时段具有较强的相关性,因此可以确定工作日、周末对应的q值皆为4。
表1成都地铁2号线进站客流自相关性统计表
Figure BDA0002696813250000112
机器学习方法的不同模型具有不同的超参数,以均方误差最小为目标,采用交叉验证方法对各个模型的超参数进行了寻优搜索,模型参数标定结果,如下表所示:
表2模型参数标定结果
Figure BDA0002696813250000121
表3成都地铁2号线不同类型站点的MAPE(%)
Figure BDA0002696813250000122
Figure BDA0002696813250000131
表4成都地铁2号线不同类型站点的RMSE
Figure BDA0002696813250000132
Figure BDA0002696813250000141
虽然在上文中已经参考实施方式对本发明进行了描述,然而在不脱离本发明的范围的情况下,可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是,只要不存在结构冲突,本发明所披露的实施方式中的各项特征均可通过任意方式相互结合起来使用,在本说明书中未对这些组合的情况进行穷举性的描述仅仅是出于省略篇幅和节约资源的考虑。因此,本发明并不局限于文中公开的特定实施方式,而是包括落入权利要求的范围内的所有技术方案。

Claims (5)

1.一种基于客流特征分析的地铁短时进站客流预测方法,其特征在于,包括以下步骤:
S1:地铁进站客流特征分析:对地铁站的AFC数据进行了预处理,对AFC异常数据进行了筛选和剔除,同时还剔除了单次行程时间超过三个小时的数据,以确保进站数据的有效性和真实性,最后对进站客流原始数据进行5分钟时间粒度的统计;
S2:模型建立:
1数据集建立:由于进站客流具有较强的时间关联性,因此考虑在模型数据集中加入与当前时段临近的q个时间段的进站流量,通过历史数据自相关系数的计算,可以得到q的合理取值;
2模型构建:
随机森林:通过自助法从原始训练集中有放回的重复随机抽取m个样本和n个特征来生成新的训练集,根据新的训练集来产生k个决策树,根据这些决策树的训练结果进行投票并输出结果;
支持向量机:给定训练样本集(xi,yi)(i=1,2,3,…,n),对于该样本集而言,xi∈Rn为n维输入样本,xi=(xi1,xi2,…,xin),y1∈Rn为输出样本,在非线性回归中,通过映射:
Figure FDA0002696813240000011
Rn→H,H为特征空间,将训练样本由初始低维样本空间映射到高维特征空间,转化为特征空间中的线性回归问题,最终实现低维空间的非线性回归;
神经网络:选取BP神经网络进行模型的构建;
S3:结果对比分析:机器学习方法的不同模型具有不同的超参数,以均方误差最小为目标,采用交叉验证方法对各个模型的超参数进行了寻优搜索,为了更好的衡量模型的准确性和稳定性,选取站点的平均绝对百分误差(MAPE)、均方根误差(RMSE)为指标,进行不同模型的对比分析。
2.根据权利要求1所述的一种基于客流特征分析的地铁短时进站客流预测方法,其特征在于,所述步骤S2中,数据集建立的公式如下:
Figure FDA0002696813240000021
Figure FDA0002696813240000022
式中:
Figure FDA0002696813240000023
为站点i于x日滞后q个时段的自相关系数;
Figure FDA0002696813240000024
分别为站点i于x日时段n、n+q的进站量;
Figure FDA0002696813240000025
为站点i于x日分时进站量的均值;N为有效时段数;
若设预测时段进站客流为
Figure FDA0002696813240000026
则在工作日场景下,数据集中特征变量与因变量之间的映射关系如下方公式所示:
Figure FDA0002696813240000027
在周末场景下,同一站点的相邻日期客流分布偏差稍大,因此剔除相邻日期的客流序列,其映射关系如下方公式所示:
Figure FDA0002696813240000028
式中:
Figure FDA0002696813240000029
为各站点第i周第j天第k个时间段的进站流量,除此之外,针对于SVM和BP神经网络需要对训练集数据进行归一化处理。
3.根据权利要求1所述的一种基于客流特征分析的地铁短时进站客流预测方法,其特征在于,所述步骤S2中回归函数为:
f(x)=wTφ(x)+b (5)
在支持向量机回归算法中,定义误差函数为损失函数,对于ε型不敏感损失函数,ε为不敏感值,即容忍f(x)与y之间最多存在ε的偏差,若偏差绝对值不超过ε可不计损失,否则需计算损失。损失函数为:
Figure FDA0002696813240000031
因此对于回归问题其目标函数表达式为:
Figure FDA0002696813240000032
4.根据权利要求1所述的一种基于客流特征分析的地铁短时进站客流预测方法,其特征在于,所述步骤S2对于给定的训练集(xi,yi),对于每个独立的神经元的输出函数为:
Figure FDA0002696813240000033
式中:f为神经元的激活函数,选用Sigmoid函数作为激活函数;xi为神经元的输入信号;wi为神经元i的连接权重;θ为神经元的阈值;b为偏置值,BP神经网络的目标函数为:
Figure FDA0002696813240000034
式中:E为样本累计误差;
Figure FDA0002696813240000035
为训练例中第j个神经元训练输出;
Figure FDA0002696813240000036
为训练例k中第j个神经元实际输出,最终通过对权值θ和偏置值b求偏导,实现参数的更新。
5.根据权利要求1所述的一种基于客流特征分析的地铁短时进站客流预测方法,其特征在于,所述步骤S3中两种指标的计算公式为:
Figure FDA0002696813240000037
Figure FDA0002696813240000038
yi
Figure FDA0002696813240000039
分别代表站点i第个时间段进站流量的实际值和预测值,MAPE的值越趋近于0,则证明预测的准确性越好;RMSE的值越小,说明拟合结果的稳定性越强,BP神经网络相比较而言,针对于不同的预测情景,其预测误差最小,预测结果准确性最高;随机森林和支持向量机在枢纽型站点的预测效果偏差稍大,在其他情景下表现也较为出色。
CN202011008596.1A 2020-09-23 2020-09-23 一种基于客流特征分析的地铁短时进站客流预测方法 Active CN112149902B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011008596.1A CN112149902B (zh) 2020-09-23 2020-09-23 一种基于客流特征分析的地铁短时进站客流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011008596.1A CN112149902B (zh) 2020-09-23 2020-09-23 一种基于客流特征分析的地铁短时进站客流预测方法

Publications (2)

Publication Number Publication Date
CN112149902A true CN112149902A (zh) 2020-12-29
CN112149902B CN112149902B (zh) 2022-06-14

Family

ID=73897931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011008596.1A Active CN112149902B (zh) 2020-09-23 2020-09-23 一种基于客流特征分析的地铁短时进站客流预测方法

Country Status (1)

Country Link
CN (1) CN112149902B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723687A (zh) * 2021-08-30 2021-11-30 深圳大学 一种基于时空特征的地铁短时客流预测方法
CN117111540A (zh) * 2023-10-25 2023-11-24 南京德克威尔自动化有限公司 一种用于io远程控制总线模块的环境监测预警方法及系统
CN117591919A (zh) * 2024-01-17 2024-02-23 北京工业大学 客流预测方法、装置、电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004086471A (ja) * 2002-08-26 2004-03-18 Nec Soft Ltd 空席予測システム及びその方法
CN102136190A (zh) * 2011-05-03 2011-07-27 上海理工大学 城市公交客运事件应急响应调度管理系统及方法
CN104376624A (zh) * 2014-07-22 2015-02-25 西南交通大学 一种基于afc客票数据的城市轨道交通客流分析方法
CN105488751A (zh) * 2015-06-12 2016-04-13 青岛智能产业技术研究院 一种地铁站客流微观统计与调度方法
CN108133302A (zh) * 2016-12-01 2018-06-08 上海浦东建筑设计研究院有限公司 一种基于大数据的公共自行车潜在需求预测方法
CN110276474A (zh) * 2019-05-22 2019-09-24 南京理工大学 一种城市轨道交通车站短时客流预测方法
CN110348601A (zh) * 2019-06-06 2019-10-18 华南理工大学 一种基于双向长短期记忆网络的地铁短期客流量预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004086471A (ja) * 2002-08-26 2004-03-18 Nec Soft Ltd 空席予測システム及びその方法
CN102136190A (zh) * 2011-05-03 2011-07-27 上海理工大学 城市公交客运事件应急响应调度管理系统及方法
CN104376624A (zh) * 2014-07-22 2015-02-25 西南交通大学 一种基于afc客票数据的城市轨道交通客流分析方法
CN105488751A (zh) * 2015-06-12 2016-04-13 青岛智能产业技术研究院 一种地铁站客流微观统计与调度方法
CN108133302A (zh) * 2016-12-01 2018-06-08 上海浦东建筑设计研究院有限公司 一种基于大数据的公共自行车潜在需求预测方法
CN110276474A (zh) * 2019-05-22 2019-09-24 南京理工大学 一种城市轨道交通车站短时客流预测方法
CN110348601A (zh) * 2019-06-06 2019-10-18 华南理工大学 一种基于双向长短期记忆网络的地铁短期客流量预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
赵淑芝 等: ""基于库仑定律的公交站点OD矩阵生成研究"", 《华南理工大学学报》 *
赵淑芝 等: ""基于库仑定律的公交站点OD矩阵生成研究"", 《华南理工大学学报》, vol. 42, no. 2, 28 February 2014 (2014-02-28), pages 96 - 102 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723687A (zh) * 2021-08-30 2021-11-30 深圳大学 一种基于时空特征的地铁短时客流预测方法
CN113723687B (zh) * 2021-08-30 2024-02-06 深圳大学 一种基于时空特征的地铁短时客流预测方法
CN117111540A (zh) * 2023-10-25 2023-11-24 南京德克威尔自动化有限公司 一种用于io远程控制总线模块的环境监测预警方法及系统
CN117111540B (zh) * 2023-10-25 2023-12-29 南京德克威尔自动化有限公司 一种用于io远程控制总线模块的环境监测预警方法及系统
CN117591919A (zh) * 2024-01-17 2024-02-23 北京工业大学 客流预测方法、装置、电子设备和存储介质
CN117591919B (zh) * 2024-01-17 2024-03-26 北京工业大学 客流预测方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN112149902B (zh) 2022-06-14

Similar Documents

Publication Publication Date Title
CN112149902B (zh) 一种基于客流特征分析的地铁短时进站客流预测方法
CN106448151B (zh) 一种短时交通流预测方法
Sun et al. Traffic flow forecasting using a spatio-temporal bayesian network predictor
CN112286924A (zh) 一种数据异常动态识别与多模式自匹配的数据清洗技术
CN111723929A (zh) 一种基于神经网络的数值预报产品订正方法、装置和系统
CN103903452A (zh) 交通流短时预测方法
CN113496314B (zh) 一种神经网络模型预测道路交通流量的方法
CN101826090A (zh) 基于最优模型的web舆情趋势预测方法
CN114596700B (zh) 一种基于门架数据的高速公路路段实时流量估计方法
CN110348601A (zh) 一种基于双向长短期记忆网络的地铁短期客流量预测方法
CN111861013A (zh) 一种电力负荷预测方法及装置
CN117977568A (zh) 基于嵌套lstm和分位数计算的电力负荷预测方法
Shuvo et al. Traffic forecasting using time-series analysis
Zhang et al. Analysis and application of grey-Markov chain model in tax forecasting
CN108830405B (zh) 基于多指标动态匹配的实时电力负荷预测系统及其方法
Franta et al. Forecasting Czech GDP using mixed-frequency data models
CN105354644A (zh) 一种基于集成经验模态分解和1-范数支持向量机分位数回归的金融时间序列预测方法
CN111145535B (zh) 一种复杂场景下的行程时间可靠性分布预测方法
CN112884222A (zh) 一种面向时间段的lstm交通流密度预测方法
Chen et al. A novel price-pattern detection method based on time series to forecast stock market
CN114037138A (zh) 基于双层分解和深度学习的地铁短时进站客流预测系统及实施方法
Li Macroeconomic short-term high-precision combined forecasting algorithm based on grey model
Jiao et al. Multi-step traffic flow prediction method based on the Conv1D+ LSTM
He et al. Time Series
Zhao et al. Prediction of Metro Short-term Entry Flow Based on Passenger Flow Characteristic Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant