CN111598333A - 客流数据的预测方法及装置 - Google Patents

客流数据的预测方法及装置 Download PDF

Info

Publication number
CN111598333A
CN111598333A CN202010408560.6A CN202010408560A CN111598333A CN 111598333 A CN111598333 A CN 111598333A CN 202010408560 A CN202010408560 A CN 202010408560A CN 111598333 A CN111598333 A CN 111598333A
Authority
CN
China
Prior art keywords
data
passenger flow
time
station
date
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010408560.6A
Other languages
English (en)
Inventor
战明辉
孙方
梁材
孙琦
厉立
蒋熙
贾飞凡
周亚鹏
姚世严
李�泳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Rail Transport Roa Network Management Co ltd
Original Assignee
Beijing Rail Transport Roa Network Management Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Rail Transport Roa Network Management Co ltd filed Critical Beijing Rail Transport Roa Network Management Co ltd
Priority to CN202010408560.6A priority Critical patent/CN111598333A/zh
Publication of CN111598333A publication Critical patent/CN111598333A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06Q50/40

Abstract

本发明公开了一种客流数据的预测方法及装置。其中,该方法包括:获取交通网络的历史客流OD数据,其中,历史客流OD数据包括历史时间和历史时间的日期对应的分时段客流OD数据,历史时间包括日期和时段;对分时段客流OD数据进行聚类分析,确定分时段客流OD数据对应的多个类别;确定待预测时间对应的预测客流OD数据所属的类别;根据类别确定待预测时间的预测客流OD数据。本发明解决了相关技术中的客流量预测方法准确率低,效率低的技术问题。

Description

客流数据的预测方法及装置
技术领域
本发明涉及客流预测领域,具体而言,涉及一种客流数据的预测方法及装置。
背景技术
随着城市轨道交通路网规模的不断扩大、客流量增加,加之网络化运营模式的不断深入,激增的客流一方面严重影响了乘客的出行体验,另一方面也给运营者的日常运营管理带来极大的挑战。精确地对路网客流OD进行预测能够为城市轨道交通运营者在制定运输组织方案时提供依据和辅助决策支持。
目前现有的城轨客流预测方法大多使用时间序列模型,模型一般存在一定假设且模型复杂度较高,在应用到实际生产实践中还存在一定困难,而且存在准确率,效率低的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种客流数据的预测方法及装置,以至少解决相关技术中的客流量预测方法准确率低,效率低的技术问题。
根据本发明实施例的一个方面,提供了一种客流数据的预测方法包括:获取交通网络的历史客流OD数据,其中,所述历史客流OD数据包括历史时间和所述历史时间的日期对应的分时段客流OD数据,所述历史时间包括日期和时段;对所述分时段客流OD数据进行聚类分析,确定所述分时段客流OD数据对应的多个类别;确定待预测时间对应的预测客流OD数据所属的类别;根据所述类别确定所述待预测时间的所述预测客流OD数据。
可选的,获取交通网络的历史客流OD数据包括:利用城市轨道交通售检票系统获取乘客刷卡记录数据,构建第一矩阵,
Figure BDA0002492332720000011
其中,Qi(T)为车站i在日期T去往路网各个车站的客流OD数据;qij(k)为车站i在时段k内去往车站j的客流量;m为一天内时段个数;n为路网内车站个数;根据所述第一矩阵,确定所述历史客流OD数据,其中,所述历史客流OD数据包括以车站为单位统计所述车站在不同时段内去往交通网络各个车站的车站客流OD数据。
可选的,对所述分时段客流OD数据进行聚类分析,确定所述分时段客流OD数据对应的多个类别包括:根据不同时段的所述车站客流OD数据,确定所述车站去向的多个重点车站,其中,所述重点车站为所述车站去向的多个车站中去向贡献度超过贡献度临界值的车站;根据路网拓扑结构,将所述交通网络划分为不同区段;根据多个所述重点车站和所述区段的所述车站客流OD数据,确定聚类样本;通过AP聚类方法对所述聚类样本进行聚类,获得不同日期的样本数据对应的类别。
可选的,根据不同时段的所述车站客流OD数据,确定所述车站去向的多个重点车站包括:根据设定时间段内所述车站去往所述交通网络的多个其他车站的客流量,分别与进站的客流量的比例,确定所述交通网络的多个所述其他车站的去向贡献度;将所述去向贡献度根据多个数值划分为多个等级,分别统计所述去向贡献度超过多个所述数值的车站数目,将多个所述数值与对应的所述车站数目取对数后线性拟合,得到回归方程;在取对数后的车站数目中划定比例,获得重点车站贡献度临界值;将去向贡献度超过所述临界值的车站设定为重点车站。
可选的,根据多个所述重点车站和所述区段的所述车站客流OD数据,确定聚类样本包括:根据多个所述重点车站和所述区段的所述车站客流OD数据,建立第二矩阵:
Figure BDA0002492332720000021
其中,Si(T)为车站i在日期T的聚类样本;pij(k)为车站i在时段k内去往重点车站j的客流量;rij(k)为车站i在时段k内去往区段j的客流量,其中,在区段j内包含重点车站的情况下,扣除去往重点车站客流量;u为重点车站个数;v为区段个数;将所述第二矩阵作为聚类样本。
可选的,根据所述类别确定所述待预测时间的预测客流OD数据包括:确定所述历史客流OD数据中与所述待预测时间的日期类型相同的分时段客流OD数据,其中,所述分时段客流OD数据为在同一日期内不同时间段的客流OD数据,所述日期类型包括多个日期;根据多个所述日期的权重确定所述待预测时间的待预测日期的分时段客流OD数据,其中,所述待预测时间包括日期和时间。
可选的,根据多个所述日期的权重确定所述待预测时间的待预测日期的分时段客流OD数据之前,包括;确定多个所述日期的权重,所述权重的计算公式如下:
Figure BDA0002492332720000031
其中,ω(Ty)表示日期Ty的权重;θ表示参数;dpred-y表示待预测日期Tpred与日期Ty的日期特征距离,所述日期特征距离为:
Figure BDA0002492332720000032
其中,λz(y)表示日期Ty的日期特征的特征值,λz(pred)表示待预测日期Tpred的日期特征的特征值。
可选的,根据多个所述日期的权重确定所述待预测时间的待预测日期的分时段客流OD数据包括:
Figure BDA0002492332720000033
其中,Q′i(Tpred)表示车站i在待预测日期Tpred的分时段客流OD数据;ω(Ty)表示日期Ty的权重;Qi(Ty)表示车站i在日期Ty的分时段客流OD数据;Y表示与待预测日Tpred类别相同的日期个数。
根据本发明实施例的另一方面,还提供了一种客流数据的预测装置,包括:获取模块,用于获取交通网络的历史客流OD数据,其中,所述历史客流OD数据包括历史时间和所述历史时间的日期对应的分时段客流OD数据,所述历史时间包括日期和时段;分析模块,用于对所述分时段客流OD数据进行聚类分析,确定所述分时段客流OD数据对应的多个类别;确定模块,用于确定待预测时间对应的预测客流OD数据所属的类别;预测模块,用于根据所述类别确定所述待预测时间的所述预测客流OD数据。
可选的,所述分析模块包括:确定单元,用于根据不同时段的所述车站客流OD数据,确定所述车站去向的多个重点车站,其中,所述重点车站为所述车站去向的多个车站中去向贡献度超过贡献度临界值的车站,所述历史客流OD数据包括以车站为单位统计所述车站在不同时段内去往交通网络各个车站的车站客流OD数据;划分单元,用于根据路网拓扑结构,将所述交通网络划分为不同区段;确定单元,用于根据多个所述重点车站和所述区段的所述车站客流OD数据,确定聚类样本;聚类单元,用于通过AP聚类方法对所述聚类样本进行聚类,获得不同日期的样本数据对应的类别。
根据本发明实施例的另一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的客流起讫点预测方法。
根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项所述的客流起讫点预测方法。
在本发明实施例中,采用获取交通网络的历史客流OD数据,其中,历史客流OD数据包括历史时间和历史时间的日期对应的分时段客流OD数据,历史时间包括日期和时段;对分时段客流OD数据进行聚类分析,确定分时段客流OD数据对应的多个类别;确定待预测时间对应的预测客流OD数据所属的类别;根据类别确定待预测时间的预测客流OD数据的方式,通过历史客流OD数据进行聚类分析,对分时段客流OD数据进行有效分类,并通过确定待预测时间对应的预测客流OD数据的分类,确定该预测客流OD数据,达到了有效确定预测客流OD数据的目的,从而实现了提高了客流OD数据的预测效率和准确率的技术效果,进而解决了相关技术中的客流量预测方法准确率低,效率低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种客流数据的预测方法的流程图;
图2是根据本发明实施方式的客流OD数据预测方法的流程图;
图3是根据本发明实施方式的西二旗车站的客流OD数据预测效果的示意图;
图4是根据本发明实施例的一种客流数据的预测装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种客流预测方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种客流数据的预测方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取交通网络的历史客流OD数据,其中,历史客流OD数据包括历史时间和历史时间的日期对应的分时段客流OD数据,历史时间包括日期和时段;
上述OD数据即交通起止点数据,“O”为origin,指客流的交通出发点,“D”为destination,指客流的交通目的地或者终止点。
上述获取交通网络的历史客流OD数据可以是利用现有的交通网络获取客流OD数据,例如,利用城市轨道交通售检票系统获取乘客刷卡记录数据,构建第一矩阵,
Figure BDA0002492332720000051
其中,Qi(T)为车站i在日期T去往路网各个车站的客流OD数据;qij(k)为车站i在时段k内去往车站j的客流量;m为一天内时段个数;n为路网内车站个数;根据第一矩阵,确定历史客流OD数据,其中,历史客流OD数据包括以车站为单位统计车站在不同时段内去往交通网络各个车站的车站客流OD数据。
通过现有的交通网络获取历史客流OD数据,方便快捷,无需进行专门的额采集数据的行为。
上述历史客流OD数据包括时间和多个乘客的客流OD数据,也即是不同乘客的起点和终点,上述时间包括日期和在该日期内的时间段,例如,2018年9月1日,为日期,14:00-16:00为时间段。由于大部分乘客规律的生活和出行,在同类的日期中,不同时间段的客流OD变化类似,例如,在工作日中,早上和晚上都存在高峰期。
步骤S104,对分时段客流OD数据进行聚类分析,确定分时段客流OD数据对应的多个类别;
可选的,对分时段客流OD数据进行聚类分析,确定分时段客流OD数据对应的多个类别包括:根据不同时段的车站客流OD数据,确定车站去向的多个重点车站,其中,重点车站为车站去向的多个车站中去向贡献度超过贡献度临界值的车站;根据路网拓扑结构,将交通网络划分为不同区段;根据多个重点车站和区段的车站客流OD数据,确定聚类样本;通过AP聚类方法对聚类样本进行聚类,获得不同日期的样本数据对应的类别。
利用分时段的OD客流数据,识别车站的重点去向车站;根据路网拓扑结构,以换乘站和连续的非换乘站为单位将路网划分为不同区段;利用车站的OD客流数据,统计到各个重点车站和区段的分时客流数据,形成聚类样本;利用聚类样本数据,使用AP聚类方法对聚类样本进行聚类,获得不同日期的样本数据对应的类别。
可选的,根据不同时段的车站客流OD数据,确定车站去向的多个重点车站包括:根据设定时间段内车站去往交通网络的多个其他车站的客流量,分别与进站的客流量的比例,确定交通网络的多个其他车站的去向贡献度;将去向贡献度根据多个数值划分为多个等级,分别统计去向贡献度超过多个数值的车站数目,将多个数值与对应的车站数目取对数后线性拟合,得到回归方程;在取对数后的车站数目中划定比例,获得重点车站贡献度临界值;将去向贡献度超过临界值的车站设定为重点车站。
根据一定时段内车站去往路网其他车站的客流占该时段内车站进站量的比例得到路网其他车站的去向贡献度,数值在0到1之间;然后统计去向贡献度超过不同数值的车站数目,将不同数值与其对应的车站数目取对数后线性拟合,得到回归方程;接着在取对数后的车站数目中划定比例,获得重点车站贡献度临界值;最后将去向贡献超过临界值的车站设定为重点去向车站。
可选的,根据多个重点车站和区段的车站客流OD数据,确定聚类样本包括:根据多个重点车站和区段的车站客流OD数据,建立第二矩阵:
Figure BDA0002492332720000061
其中,Si(T)为车站i在日期T的聚类样本;pij(k)为车站i在时段k内去往重点车站j的客流量;rij(k)为车站i在时段k内去往区段j的客流量,其中,在区段j内包含重点车站的情况下,扣除去往重点车站客流量;u为重点车站个数;v为区段个数;将第二矩阵作为聚类样本。
步骤S106,确定待预测时间对应的预测客流OD数据所属的类别;
可选的,确定待预测时间的预测客流OD数据包括:确定历史客流OD数据中与待预测时间的日期类型相同的分时段客流OD数据,其中,分时段客流OD数据为在同一日期内不同时间段的客流OD数据,日期类型包括多个日期;根据多个日期的权重确定待预测时间的待预测日期的分时段客流OD数据,其中,待预测时间包括日期和时间。
提取历史日期在不同维度上的日期特征;利用历史日期的日期特征及其对应的类别,形成样本数据;通过对历史日期的特征与对应类别的归纳演绎,形成对应关系的规则体系。日期特征包括季度特征、月份特征、星期特征、节假日特征、天气特征、运营情况特征等。在样本中有对应不同特征的不同标签。
可选的,根据多个日期的权重确定待预测时间的待预测日期的分时段客流OD数据之前,包括;确定多个日期的权重,权重的计算公式如下:
Figure BDA0002492332720000071
其中,ω(Ty)表示日期Ty的权重;θ表示参数;dpred-y表示待预测日期Tpred与日期Ty的日期特征距离,日期特征距离为:
Figure BDA0002492332720000072
其中,λz(y)表示日期Ty的日期特征的特征值,λz(pred)表示待预测日期Tpred的日期特征的特征值。
可选的,根据多个日期的权重确定待预测时间的待预测日期的分时段客流OD数据包括:
Figure BDA0002492332720000073
其中,Q′i(Tpred)表示车站i在待预测日期Tpred的分时段客流OD数据;ω(Ty)表示日期Ty的权重;Qi(Ty)表示车站i在日期Ty的分时段客流OD数据;Y表示与待预测日Tpred的类别相同的日期个数。
步骤S108,根据类别确定待预测时间的预测客流OD数据。
上述根据类别确定待预测时间的预测客流OD数据包括:提取预测日期在不同维度上的日期特征;将预测日期的日期特征输入规则体系中,得到预测日期对应的类别;在聚类结果中找到与预测日期对应类别相同的日期,统计同类别日期的分时段的OD客流数据;通过对相同类别中的各日期与预测日期的日期特征的相似程度为各日期赋予权重,利用同类别日期的OD客流数据加权拟合得到预测日的分时OD客流。
通过上述步骤,采用获取交通网络的历史客流OD数据,其中,历史客流OD数据包括历史时间和历史时间的日期对应的分时段客流OD数据,历史时间包括日期和时段;对分时段客流OD数据进行聚类分析,确定分时段客流OD数据对应的多个类别;确定待预测时间对应的预测客流OD数据所属的类别;根据类别确定待预测时间的预测客流OD数据的方式,通过历史客流OD数据进行聚类分析,对分时段客流OD数据进行有效分类,并通过确定待预测时间对应的预测客流OD数据的分类,确定该预测客流OD数据,达到了有效确定预测客流OD数据的目的,从而实现了提高了客流OD数据的预测效率和准确率的技术效果,进而解决了相关技术中的客流量预测方法准确率低,效率低的技术问题。
需要说明的是,本申请实施例还提供了一种可选的实施方式,下面对该实施方式进行详细说明。
图2是根据本发明实施方式的客流OD数据预测方法的流程图,如图2所示,本发明所述的基于聚类分析的城市轨道交通路网客流OD预测方法,包括如下步骤:
步骤1,利用城市轨道交通路网的历史客流OD数据,进行AP聚类分析,形成历史客流OD的若干类别;
步骤2,利用聚类结果,统计形成不同日期特征与OD类别的对应关系;
步骤3,抽取与预测日的日期特征相对应的类别,将同类别日期的客流OD样本数据以日期特征相似性进行加权拟合,得到客流OD预测值。
进一步地,步骤1中,形成历史客流OD的若干类别的具体步骤为:
步骤1.1,利用城市轨道交通售检票系统(AFC系统)中的乘客刷卡记录数据,以车站为单位统计分时段去往路网各个车站的OD客流;
步骤1.2,利用分时段的OD客流数据,识别车站的重点去向车站;
步骤1.3,根据路网拓扑结构,以换乘站和连续的非换乘站为单位将路网划分为不同区段;
步骤1.4,利用车站的OD客流数据,统计到各个重点车站和区段的分时客流数据,形成聚类样本
步骤1.5,利用聚类样本数据,使用AP聚类方法对聚类样本进行聚类,获得不同日期的样本数据对应的类别。
进一步地,步骤1.1中,利用AFC数据构建的去往各个车站分时段OD客流如下:
Figure BDA0002492332720000091
其中,Qi(T)为车站i在日期T去往路网各个车站的OD客流;qij(k)为车站i在时段k内去往车站j的客流量;m为一天内时段个数;n为路网内车站个数。
进一步地,步骤1.2中,识别车站的重点去向车站方法如下:
首先根据一定时段内车站去往路网其他车站的客流占该时段内车站进站量的比例得到路网其他车站的去向贡献度(数值在0到1之间);然后统计去向贡献度超过不同数值的车站数目,将不同数值与其对应的车站数目取对数后线性拟合,得到回归方程;接着在取对数后的车站数目中划定比例,获得重点车站贡献度临界值;最后将去向贡献超过临界值的车站设定为重点去向车站。
进一步地,步骤1.4中,聚类样本的形式如下:
Figure BDA0002492332720000092
其中,Si(T)为车站i在日期T的聚类样本;pij(k)为车站i在时段k内去往重点车站j的客流量;rij(k)为车站i在时段k内去往区段j的客流量,若区段j内包含重点车站,则扣除去往重点车站客流量;u为重点车站个数;v为区段个数。
进一步地,步骤2中,形成不同日期特征与OD类别的对应关系的具体步骤为:
步骤2.1,提取历史日期在不同维度上的日期特征;
步骤2.2,利用历史日期的日期特征及其对应的类别,形成样本数据;
步骤2.3,通过对历史日期的特征与对应类别的归纳演绎,形成对应关系的规则体系。
进一步地,步骤2.1中,日期特征包括季度特征、月份特征、星期特征、节假日特征、天气特征、运营情况特征等。
进一步地,步骤2.2中,样本形式如下:
Figure BDA0002492332720000104
其中season表示季节标签;month表示月份标签;week表示星期标签;holiday表示节假日标签;weather表示天气标签;operationstate表示运营情况标签;label表示聚类结果标签。
进一步地,步骤3中,得到预测日期分时OD客流预测值的具体步骤为:
步骤3.1,提取预测日期在不同维度上的日期特征;
步骤3.2,将预测日期的日期特征输入规则体系中,得到预测日期对应的类别;
步骤3.3,在聚类结果中找到与预测日期对应类别相同的日期,统计同类别日期的分时段的OD客流数据;
步骤3.4,通过对相同类别中的各日期与预测日期的日期特征的相似程度为各日期赋予权重,利用同类别日期的OD客流数据加权拟合得到预测日的分时OD客流。
进一步地,步骤3.4中,同类别各日期权重的计算方法如下:
Figure BDA0002492332720000101
其中ω(Ty)表示日期Ty的权重;θ表示参数;dpred-y表示日期Tpred与预测日期Ty的日期特征距离,计算方法如下:
Figure BDA0002492332720000102
其中λz(y)表示日期Ti在第k个日期特征的特征值。
进一步地,步骤3.4中,预测日的分时OD客流计算方法如下:
Figure BDA0002492332720000103
其中,Q′i(Tpred)表示车站i在预测日期Tpred的分时OD客流;ω(Ty)表示日期Ty的权重;Qi(Ty)表示车站i在预测日期Ty的分时OD客流;Y表示与预测日Tpred同类别的日期个数。
下面以北京市城市轨道交通系统为例进行说明,北京市城市轨道交通系统共计317个运营车站,工作日日均客流量超过600万人次。以西二旗站为例,利用以下9月份一天的客流记录,对之后的12月份的客流进行预测,实施步骤如下:
步骤1,利用AFC系统中的乘客刷卡记录数据,统计西二旗站各日期分时段去往路网各个车站的OD客流,如表1所示:
表1西二旗历史各日期分时段OD客流
Figure BDA0002492332720000111
步骤2,根据路网拓扑结构,将路网划分为不同区段,如表2所示:
表2路网区段划分
区段编号 1 2 …… 157
区段
步骤3,计算西二旗站重点去向车站,结果如下:[沙河,五道口,生命科学园,霍营',回龙观,北京南站,北京西站,立水桥,昌平,西直门,知春路,北京站];
步骤4,构建聚类样本,形式如表3所示:
表3AP聚类样本
Figure BDA0002492332720000112
步骤5,使用聚类样本进行AP聚类,聚类结果如表4;
步骤6,提取各日期的日期特征,并构建日期特征与日期类别之间关系的样本数据,如表4所示:
表4对应关系样本数据
Figure BDA0002492332720000121
步骤7,使用样本数据对日期特征和日期类别之间的关系进行归纳演绎,得到规则体系;
步骤8,提取2018/12/12的日期特征,输入规则体系中,得到12月12日的所属类别;
步骤9,在聚类结果中寻找同类别日期;
步骤10,计算各日期权重,如表5所示:
表5各日期权重
日期
权重
步骤11,利用同类别日期分时客流数据和日期权重,拟合西二旗站12月12日的分时客流OD,如表6所示:
表6预测分时OD客流
Figure BDA0002492332720000122
步骤12,图3是根据本发明实施方式的西二旗车站的客流OD数据预测效果的示意图,如图3所示将预测数据拟合西二旗站分时进站量,与西二旗站实际分时进站量对比,。
如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上作出各种变化。
图4是根据本发明实施例的一种客流数据的预测装置的示意图,如图4所示,根据本发明实施例的另一方面,还提供了一种客流数据的预测装置,包括:获取模块42,分析模块44,确定模块46和预测模块48,下面对该装置进行详细说明。
获取模块42,用于获取交通网络的历史客流OD数据,其中,历史客流OD数据包括历史时间和历史时间的日期对应的分时段客流OD数据,历史时间包括日期和时段;分析模块44,与上述获取模块42相连,用于对分时段客流OD数据进行聚类分析,确定分时段客流OD数据对应的多个类别;确定模块46,与上述分析模块44相连,用于确定待预测时间对应的预测客流OD数据所属的类别;预测模块48,用于根据类别确定待预测时间的预测客流OD数据。
通过上述装置,采用获取模块42获取交通网络的历史客流OD数据,其中,历史客流OD数据包括历史时间和历史时间的日期对应的分时段客流OD数据,历史时间包括日期和时段;分析模块44对分时段客流OD数据进行聚类分析,确定分时段客流OD数据对应的多个类别;确定模块46确定待预测时间对应的预测客流OD数据所属的类别;预测模块48根据类别确定待预测时间的预测客流OD数据的方式,通过历史客流OD数据进行聚类分析,对分时段客流OD数据进行有效分类,并通过确定待预测时间对应的预测客流OD数据的分类,确定该预测客流OD数据,达到了有效确定预测客流OD数据的目的,从而实现了提高了客流OD数据的预测效率和准确率的技术效果,进而解决了相关技术中的客流量预测方法准确率低,效率低的技术问题。
可选的,上述分析模块44包括:确定单元,用于根据不同时段的车站客流OD数据,确定车站去向的多个重点车站,其中,重点车站为车站去向的多个车站中去向贡献度超过贡献度临界值的车站,历史客流OD数据包括以车站为单位统计车站在不同时段内去往交通网络各个车站的车站客流OD数据;划分单元,用于根据路网拓扑结构,将交通网络划分为不同区段;确定单元,用于根据多个重点车站和区段的车站客流OD数据,确定聚类样本;聚类单元,用于通过AP聚类方法对聚类样本进行聚类,获得不同日期的样本数据对应的类别。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述中任意一项的客流起讫点预测方法。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述中任意一项的客流起讫点预测方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (12)

1.一种客流数据的预测方法,其特征在于,包括:
获取交通网络的历史客流OD数据,其中,所述历史客流OD数据包括历史时间和所述历史时间的日期对应的分时段客流OD数据,所述历史时间包括日期和时段;
对所述分时段客流OD数据进行聚类分析,确定所述分时段客流OD数据对应的多个类别;
确定待预测时间对应的预测客流OD数据所属的类别;
根据所述类别确定所述待预测时间的所述预测客流OD数据。
2.根据权利要求1所述的方法,其特征在于,获取交通网络的历史客流OD数据包括:
利用城市轨道交通售检票系统获取乘客刷卡记录数据,构建第一矩阵,
Figure FDA0002492332710000011
其中,Qi(T)为车站i在日期T去往路网各个车站的客流OD数据;qij(k)为车站i在时段k内去往车站j的客流量;m为一天内时段个数;n为路网内车站个数;
根据所述第一矩阵,确定所述历史客流OD数据,其中,所述历史客流OD数据包括以车站为单位统计所述车站在不同时段内去往交通网络各个车站的车站客流OD数据。
3.根据权利要求2所述的方法,其特征在于,对所述分时段客流OD数据进行聚类分析,确定所述分时段客流OD数据对应的多个类别包括:
根据不同时段的所述车站客流OD数据,确定所述车站去向的多个重点车站,其中,所述重点车站为所述车站去向的多个车站中去向贡献度超过贡献度临界值的车站;
根据路网拓扑结构,将所述交通网络划分为不同区段;
根据多个所述重点车站和所述区段的所述车站客流OD数据,确定聚类样本;
通过AP聚类方法对所述聚类样本进行聚类,获得不同日期的样本数据对应的类别。
4.根据权利要求3所述的方法,其特征在于,根据不同时段的所述车站客流OD数据,确定所述车站去向的多个重点车站包括:
根据设定时间段内所述车站去往所述交通网络的多个其他车站的客流量,分别与进站的客流量的比例,确定所述交通网络的多个所述其他车站的去向贡献度;
将所述去向贡献度根据多个数值划分为多个等级,分别统计所述去向贡献度超过多个所述数值的车站数目,将多个所述数值与对应的所述车站数目取对数后线性拟合,得到回归方程;
在取对数后的车站数目中划定比例,获得重点车站贡献度临界值;
将去向贡献度超过所述临界值的车站设定为重点车站。
5.根据权利要求3所述的方法,其特征在于,根据多个所述重点车站和所述区段的所述车站客流OD数据,确定聚类样本包括:
根据多个所述重点车站和所述区段的所述车站客流OD数据,建立第二矩阵:
Figure FDA0002492332710000021
其中,Si(T)为车站i在日期T的聚类样本;pij(k)为车站i在时段k内去往重点车站j的客流量;rij(k)为车站i在时段k内去往区段j的客流量,其中,在区段j内包含重点车站的情况下,扣除去往重点车站客流量;u为重点车站个数;v为区段个数;
将所述第二矩阵作为聚类样本。
6.根据权利要求3所述的方法,其特征在于,根据所述类别确定所述待预测时间的预测客流OD数据包括:
确定所述历史客流OD数据中与所述待预测时间的日期类型相同的分时段客流OD数据,其中,所述分时段客流OD数据为在同一日期内不同时间段的客流OD数据,所述日期类型包括多个日期;
根据多个所述日期的权重确定所述待预测时间的待预测日期的分时段客流OD数据,其中,所述待预测时间包括日期和时间。
7.根据权利要求6所述的方法,其特征在于,根据多个所述日期的权重确定所述待预测时间的待预测日期的分时段客流OD数据之前,包括;确定多个所述日期的权重,所述权重的计算公式如下:
Figure FDA0002492332710000031
其中,ω(Ty)表示日期Ty的权重;θ表示参数;dpred-y表示待预测日期Tpred与日期Ty的日期特征距离,所述日期特征距离为:
Figure FDA0002492332710000032
其中,λz(y)表示日期Ty的日期特征的特征值,λz(pred)表示待预测日期Tpred的日期特征的特征值。
8.根据权利要求7所述的方法,其特征在于,根据多个所述日期的权重确定所述待预测时间的待预测日期的分时段客流OD数据包括:
Figure FDA0002492332710000033
其中,Q′i(Tpred)表示车站i在待预测日期Tpred的分时段客流OD数据;ω(Ty)表示日期Ty的权重;Qi(Ty)表示车站i在日期Ty的分时段客流OD数据;Y表示与待预测日Tpred的类别相同的日期个数。
9.一种客流数据的预测装置,其特征在于,包括:
获取模块,用于获取交通网络的历史客流OD数据,其中,所述历史客流OD数据包括历史时间和所述历史时间的日期对应的分时段客流OD数据,所述历史时间包括日期和时段;
分析模块,用于对所述分时段客流OD数据进行聚类分析,确定所述分时段客流OD数据对应的多个类别;
确定模块,用于确定待预测时间对应的预测客流OD数据所属的类别;
预测模块,用于根据所述类别确定所述待预测时间的所述预测客流OD数据。
10.根据权利要求9所述的装置,其特征在于,所述分析模块包括:
确定单元,用于根据不同时段的所述车站客流OD数据,确定所述车站去向的多个重点车站,其中,所述重点车站为所述车站去向的多个车站中去向贡献度超过贡献度临界值的车站,所述历史客流OD数据包括以车站为单位统计所述车站在不同时段内去往交通网络各个车站的车站客流OD数据;
划分单元,用于根据路网拓扑结构,将所述交通网络划分为不同区段;
确定单元,用于根据多个所述重点车站和所述区段的所述车站客流OD数据,确定聚类样本;
聚类单元,用于通过AP聚类方法对所述聚类样本进行聚类,获得不同日期的样本数据对应的类别。
11.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至8中任意一项所述的客流起讫点预测方法。
12.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至8中任意一项所述的客流起讫点预测方法。
CN202010408560.6A 2020-05-14 2020-05-14 客流数据的预测方法及装置 Pending CN111598333A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010408560.6A CN111598333A (zh) 2020-05-14 2020-05-14 客流数据的预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010408560.6A CN111598333A (zh) 2020-05-14 2020-05-14 客流数据的预测方法及装置

Publications (1)

Publication Number Publication Date
CN111598333A true CN111598333A (zh) 2020-08-28

Family

ID=72185588

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010408560.6A Pending CN111598333A (zh) 2020-05-14 2020-05-14 客流数据的预测方法及装置

Country Status (1)

Country Link
CN (1) CN111598333A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418518A (zh) * 2020-11-20 2021-02-26 佳都新太科技股份有限公司 基于时间特征权重和线网拓扑的客流预测方法及装置
CN112561188A (zh) * 2020-12-22 2021-03-26 广州杰赛科技股份有限公司 一种人流量预测方法和装置
CN113177657A (zh) * 2021-04-20 2021-07-27 上海大学 轨道交通客流预测方法及装置
CN117314504A (zh) * 2023-11-28 2023-12-29 智达信科技术股份有限公司 一种公共交通客流预测方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013251011A (ja) * 2013-09-17 2013-12-12 Hitachi Ltd 利用者行動分析装置
CN103984993A (zh) * 2014-05-13 2014-08-13 东南大学 一种轨道交通客流od分布实时推测方法
CN104217250A (zh) * 2014-08-07 2014-12-17 北京市交通信息中心 一种基于历史数据的城市轨道交通新线开通客流预测方法
CN106295868A (zh) * 2016-08-03 2017-01-04 重庆市索美智能交通通讯服务有限公司 交通出行数据处理方法及装置
CN108694464A (zh) * 2018-05-14 2018-10-23 重庆交通开投科技发展有限公司 客流疏散方法及装置
CN110348614A (zh) * 2019-06-24 2019-10-18 武汉烽火信息集成技术有限公司 一种获取乘客od的方法及公交客流的预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013251011A (ja) * 2013-09-17 2013-12-12 Hitachi Ltd 利用者行動分析装置
CN103984993A (zh) * 2014-05-13 2014-08-13 东南大学 一种轨道交通客流od分布实时推测方法
CN104217250A (zh) * 2014-08-07 2014-12-17 北京市交通信息中心 一种基于历史数据的城市轨道交通新线开通客流预测方法
CN106295868A (zh) * 2016-08-03 2017-01-04 重庆市索美智能交通通讯服务有限公司 交通出行数据处理方法及装置
CN108694464A (zh) * 2018-05-14 2018-10-23 重庆交通开投科技发展有限公司 客流疏散方法及装置
CN110348614A (zh) * 2019-06-24 2019-10-18 武汉烽火信息集成技术有限公司 一种获取乘客od的方法及公交客流的预测方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418518A (zh) * 2020-11-20 2021-02-26 佳都新太科技股份有限公司 基于时间特征权重和线网拓扑的客流预测方法及装置
CN112561188A (zh) * 2020-12-22 2021-03-26 广州杰赛科技股份有限公司 一种人流量预测方法和装置
CN113177657A (zh) * 2021-04-20 2021-07-27 上海大学 轨道交通客流预测方法及装置
CN113177657B (zh) * 2021-04-20 2022-08-30 上海大学 轨道交通客流预测方法及装置
CN117314504A (zh) * 2023-11-28 2023-12-29 智达信科技术股份有限公司 一种公共交通客流预测方法及系统
CN117314504B (zh) * 2023-11-28 2024-03-29 智达信科技术股份有限公司 一种公共交通客流预测方法及系统

Similar Documents

Publication Publication Date Title
CN110245981B (zh) 一种基于手机信令数据的人群类型识别方法
CN109871876B (zh) 一种基于浮动车数据的高速公路路况识别与预测方法
CN111598333A (zh) 客流数据的预测方法及装置
Yu et al. Prediction of bus travel time using random forests based on near neighbors
CN108346292B (zh) 基于卡口数据的城市快速路实时交通指数计算方法
CN110264709A (zh) 基于图卷积网络的道路的交通流量的预测方法
CN107633035B (zh) 一种基于K-Means&LightGBM模型的共享交通服务reorder预估方法
CN105513370B (zh) 基于稀疏车牌识别数据挖掘的交通小区划分方法
CN108960476B (zh) 基于ap-ti聚类的共享单车流量预测方法及装置
CN107292417B (zh) 基于重污染序列案例库的区域重污染判别预报方法及装置
CN107292418A (zh) 一种运单滞留预测方法
CN111291236A (zh) 一种高速路网用户画像信息获取与分析方法及系统
CN110889092A (zh) 一种基于轨道交易数据的短时大型活动周边轨道站点客流量预测方法
Xu et al. Dynamic bicycle scheduling problem based on short-term demand prediction
CN111414719B (zh) 地铁站周边特征提取、交通需求估计方法及装置
Ma et al. Public transportation big data mining and analysis
CN108256724B (zh) 一种基于动态行业系数的配电网可开放容量规划方法
CN106295868A (zh) 交通出行数据处理方法及装置
Chen et al. An analysis of movement patterns between zones using taxi GPS data
CN107274066B (zh) 一种基于lrfmd模型的共享交通客户价值分析方法
CN110490365B (zh) 一种基于多源数据融合预测网约车订单量的方法
Chen et al. RFM model and K-means clustering analysis of transit traveller profiles: A case study
CN115034429A (zh) 基于深度图神经网络的城市出租车接客点推荐方法
Nicoletta et al. Bayesian spatio-temporal modelling and prediction of areal demands for ambulance services
CN112699955A (zh) 一种用户分类方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination