CN110837903A - 一种轨道交通短期客流预测方法、系统及电子设备 - Google Patents

一种轨道交通短期客流预测方法、系统及电子设备 Download PDF

Info

Publication number
CN110837903A
CN110837903A CN201810931733.5A CN201810931733A CN110837903A CN 110837903 A CN110837903 A CN 110837903A CN 201810931733 A CN201810931733 A CN 201810931733A CN 110837903 A CN110837903 A CN 110837903A
Authority
CN
China
Prior art keywords
passenger flow
historical data
data set
data
rail transit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810931733.5A
Other languages
English (en)
Inventor
赵娟娟
须成忠
张帆
赵宝新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201810931733.5A priority Critical patent/CN110837903A/zh
Publication of CN110837903A publication Critical patent/CN110837903A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本申请涉及一种轨道交通短期客流预测方法、系统及电子设备。所述方法包括:步骤a:基于历史观测数据构建历史数据集;步骤b:基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据,得到相似样本集;步骤c:基于所述相似样本集构建高斯过程回归预测模型,通过所述高斯过程回归预测模型对轨道交通短期客流进行预测。相比现有技术,本申请在预测精度和效率上更能够满足实际需求,更适用于基于多源大数据下实时高精度的地铁客流预测场景。

Description

一种轨道交通短期客流预测方法、系统及电子设备
技术领域
本申请属于轨道交通服务技术领域,特别涉及一种轨道交通短期客流预测方法、系统及电子设备。
背景技术
轨道交通在城市公共交通流量大、道路拥堵等问题起着重要的作用,已日益成为市民出行的首选交通方式。随着城市轨道交通网络运营里程的不断增长及网络承载客流量的不断提高,各站点的出站客流量极易发生急剧变化,为了提高运营调度的效率,对轨道交通各站点出站客流做短期预测非常重要,例如列车调度、最后一公里接驳车调度等。
影响各站点出站客流的因素比较复杂,包括:(1)空间因素,某站点的出站客流与其他站点的进站客流有关,且各站点对此站点的贡献率不同。(2)时间因素,某站点的出站客流与前几个时段,以及相邻天的相同时段的客流相关。(3)其它外界因素,例如天气、大型活动等。传统的客流预测方法主要着重从单个因素和少量数据集建模预测轨道交通客流量,例如自回归移动平均(ARMA)、卡尔曼滤波、粒子滤波、神经网络等,其客流预测结果与实际值之间存在着较大的误差。然而从实际轨道交通运营数据来看,轨道交通客流量往往受多个因素的影响,随着目前可以收集到的数据量和相关数据集的增加,对居民出行规律的把握相比历史任何时间都更准确,本申请旨在基于多源长期大数据对轨道各站点短期客流进行实时预测。
发明内容
本申请提供了一种轨道交通短期客流预测方法、系统及电子设备,旨在至少在一定程度上解决现有技术中的上述技术问题之一。
为了解决上述问题,本申请提供了如下技术方案:
一种轨道交通短期客流预测方法,包括以下步骤:
步骤a:基于历史观测数据构建历史数据集;
步骤b:基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据,得到相似样本集;
步骤c:基于所述相似样本集构建高斯过程回归预测模型,通过所述高斯过程回归预测模型对轨道交通短期客流进行预测。
本申请实施例采取的技术方案还包括:在所述步骤a中,所述历史观测数据包括智能卡刷卡数据、天气数据、大型活动数据;
所述智能卡刷卡数据包括CardID、StationId、TrnsctTime、TrnsctyType;其中,CardID表示智能卡唯一标识,StationId表示轨道站点的标识,TrnsctTime表示交易时间,TrnsctyType表示交易类型;
所述天气数据包括StationID、Gps、Humidity、Tenmnrainfall;其中,StationID表示气象站点,Gps表示站点经纬度,Humidity表示湿度,Tenmnrainfall表示降雨量;
所述大型活动数据包括Type、Begintime、Endtime、LocationGps;其中,Type表示事件类型,Begintime表示开始时间,Endtime表示结束时间,LocationGps表示发生地点。
本申请实施例采取的技术方案还包括:在所述步骤a中,所述历史数据集中的每个数据样本由特征向量X和估测目标y组成,X代表当前条件,所述历史数据集包括出发客流量历史数据集和到达客流量历史数据集;
所述出发客流量历史数据集的构建方式为:
设定时间段离开设定站点的估测目标y所对应的特征向量X表示如下:
X=(weekday?,holidays?,big event?,time of day,depart flow,weatherfeatures);其中,weekday?是布尔类型值,用于表示此数据样本是否发生在工作日,Holidays表示是否为节假日,big event表示是否发生重大事件,time of day用于表示时间所发生的时段,depart flow用Fdp=[Dc-n,...Dc-2,Dc-1]表示,其中Dc-j表示第j个时段离开S站点的客流量,weather features包括与客流量有密切关系的温度和湿度两个特征;
所述到达客流量估计历史数据集的构建方式为:
设定时间段到达设定站点的估测目标y所对应的特征向量X表示如下:
X=(weekday?,holidays?,big event?,time of day,arrival flows,departflows,weather features);其中,arrival flows和depart flows分别表示前几个时段到达设定站点的客流量。
本申请实施例采取的技术方案还包括:在所述步骤b中,所述基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据具体包括:基于相似度量方法,在所述历史数据集中搜索与当前样本具有最高相似度的前k个近邻样本,对历史数据集的各个特征做归一化处理,对于每一个历史数据Xh和测试数据Xt,使用
Figure BDA0001766770940000041
计算两样本
Figure BDA0001766770940000042
Figure BDA0001766770940000043
之间的距离,其中M为向量X的维度,ξ1,ξ2…ξM分别为估测目标y与M个预测变量之间的相关系数。
本申请实施例采取的技术方案还包括:在所述步骤c中,所述通过高斯过程回归预测模型对轨道交通短期客流进行预测具体包括:给定前k个近邻样本,H≡{hi=(xi,yi):i=1,2,…,k},其中xi表示输入特征向量,yi表示与xi相关联的目标值,使用GPR高斯过程回归估算下一个时间段所对应的客流量;在核函数的选择上,采用平方指数核函数
Figure BDA0001766770940000044
给定当前特征向量xc,其对应的预测目标yc计算如下:
y*|x*,X,Y~GP(k(x*,X)[k(X,X)]-1Y,k(x*,x*)-k(x*,X)[k(X,X)]-1k(X,x*))
本申请实施例采取的另一技术方案为:一种轨道交通短期客流预测系统,包括:
历史数据集构建模块:用于基于历史观测数据构建历史数据集;
相似样本集构建模块:用于基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据,得到相似样本集;
预测模型构建模块:用于基于所述相似样本集构建高斯过程回归预测模型,通过所述高斯过程回归预测模型对轨道交通短期客流进行预测。
本申请实施例采取的技术方案还包括:所述历史观测数据包括智能卡刷卡数据、天气数据、大型活动数据;
所述智能卡刷卡数据包括CardID、StationId、TrnsctTime、TrnsctyType;其中,CardID表示智能卡唯一标识,StationId表示轨道站点的标识,TrnsctTime表示交易时间,TrnsctyType表示交易类型;
所述天气数据包括StationID、Gps、Humidity、Tenmnrainfall;其中,StationID表示气象站点,Gps表示站点经纬度,Humidity表示湿度,Tenmnrainfall表示降雨量;
所述大型活动数据包括Type、Begintime、Endtime、LocationGps;其中,Type表示事件类型,Begintime表示开始时间,Endtime表示结束时间,LocationGps表示发生地点。
本申请实施例采取的技术方案还包括:所述历史数据集中的每个数据样本由特征向量X和估测目标y组成,X代表当前条件,所述历史数据集包括:
第一历史数据集构建单元:用于构建出发客流量历史数据集;所述出发客流量历史数据集的构建方式为:
设定时间段离开设定站点的估测目标y所对应的特征向量X表示如下:
X=(weekday?,holidays?,big event?,time of day,depart flow,weatherfeatures);其中,weekday?是布尔类型值,用于表示此数据样本是否发生在工作日,Holidays表示是否为节假日,big event表示是否发生重大事件,time of day用于表示时间所发生的时段,depart flow用Fdp=[Dc-n,...Dc-2,Dc-1]表示,其中Dc-j表示第j个时段离开S站点的客流量,weather features包括与客流量有密切关系的温度和湿度两个特征;
第二历史数据集构建单元:用于构建到达客流量估计历史数据集;所述到达客流量估计历史数据集的构建方式为:
设定时间段到达设定站点的估测目标y所对应的特征向量X表示如下:
X=(weekday?,holidays?,big event?,time of day,arrival flows,departflows,weather features);其中,arrival flows和depart flows分别表示前几个时段到达设定站点的客流量。
本申请实施例采取的技术方案还包括:所述相似样本集构建模块基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据具体包括:基于相似度量方法,在所述历史数据集中搜索与当前样本具有最高相似度的前k个近邻样本,对历史数据集的各个特征做归一化处理,对于每一个历史数据Xh和测试数据Xt,使用计算两样本
Figure BDA0001766770940000063
Figure BDA0001766770940000064
之间的距离,其中M为向量X的维度,ξ1,ξ2…ξM分别为估测目标y与M个预测变量之间的相关系数。
本申请实施例采取的技术方案还包括:所述预测模型构建模块通过高斯过程回归预测模型对轨道交通短期客流进行预测具体包括:给定前k个近邻样本,H≡{hi=(xi,yi):i=1,2,…,k},其中xi表示输入特征向量,yi表示与xi相关联的目标值,使用GPR高斯过程回归估算下一个时间段所对应的客流量;在核函数的选择上,采用平方指数核函数给定当前特征向量xc,其对应的预测目标yc计算如下:
y*|x*,X,Y~GP(k(x*,X)[k(X,X)]-1Y,k(x*,x*)-k(x*,X)[k(X,X)]-1k(X,x*))
本申请实施例采取的又一技术方案为:一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的轨道交通短期客流预测方法的以下操作:
步骤a:基于历史观测数据构建历史数据集;
步骤b:基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据,得到相似样本集;
步骤c:基于所述相似样本集构建高斯过程回归预测模型,通过所述高斯过程回归预测模型对轨道交通短期客流进行预测。
相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的轨道交通短期客流预测方法、系统及电子设备使用与预测相关的所有可用历史数据,基于KNN和高斯过程回归对轨道交通各站点短期客流进行预测,其预测结果不仅包括预测值,而且包含预测值的置信水平,相比现有技术,本申请在预测精度和效率上更能够满足实际需求,更适用于基于多源大数据下实时高精度的地铁客流预测场景。
附图说明
图1是本申请实施例的轨道交通短期客流预测方法的流程图;
图2是本申请实施例的轨道交通短期客流预测系统的结构示意图;
图3是本申请实施例的轨道交通短期客流预测方法的硬件设备结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
请参阅图1,是本申请实施例的轨道交通短期客流预测方法的流程图。本申请实施例的轨道交通短期客流预测方法包括以下步骤:
步骤100:基于历史观测数据构建历史数据集;
步骤100中,历史观测数据包括智能卡刷卡数据、天气数据、大型活动数据。
智能卡刷卡数据主要包含四个字段,即:CardID、StationId、TrnsctTime、TrnsctyType;其中,CardID表示智能交通卡的唯一标识,StationId表示轨道站点的标识,TrnsctTime表示交易(刷卡)时间,TrnsctyType表示交易类型(进、出站)。
天气数据主要包括:StationID、Gps、Humidity、Tenmnrainfall;其中,StationID表示气象站点,Gps表示站点经纬度,Humidity表示湿度,Tenmnrainfall表示降雨量。
大型活动数据包括:Type、Begintime、Endtime、LocationGps;其中,Type表示事件类型,Begintime表示开始时间,Endtime表示结束时间,LocationGps表示发生地点。
历史数据集作为KNN算法的搜索空间。给定当前条件,KNN算法从历史数据集中找到最接近给定条件的前k个近邻样本。历史数据集中的每个数据样本由特征向量X和估测目标(客流量)y组成,X代表当前条件,包括内部影响因素和外部影响因素,需要估算未来各站点离开(出发站点)和到达(目的站点)的客流量。因此需要针对这两种情况分别构建出发客流量历史数据集和到达客流量历史数据集。具体构建方式如下:
(1)出发客流量历史数据集构建
某时间段离开某站点的客流量y所对应的特征向量X表示如下:
X=(weekday?,holidays?,big event?,time of day,depart flow,weatherfeatures)。其中,weekday?是布尔类型值,用于表示此数据样本是否发生在工作日,如果是工作日标记为1,否则为0。Holidays表示是否为节假日,big event表示是否发生重大事件,表示方法与weekday?相同。time of day用于表示时间所发生的时段,如果预测的粒度为半小时,那一天可以划分为48段,time of day属于1~48之间。depart flow用Fdp=[Dc-n,...Dc-2,Dc-1]表示,其中Dc-j表示第j个时段离开S站点的客流量。weather features包括与客流量有密切关系的两个特征:温度和湿度。
(2)到达客流量估计历史数据集构建
某时间段到达某站点的客流量y所对应的特征向量X表示如下:
X=(weekday?,holidays?,big event?,time of day,arrival flows,departflows,weather features)。向量形式与离开客流量向量类似,不同的是前几个时段客流量上包括arrival flows和depart flows两类,分别表示前几个时段到达此站点的客流量和离开其它站点的客流量(未来到达某站点的客流来自之前从别的站点出发的客流)。因为别的站点数量比较多,我们选择那些对所估算站点的到达客流贡献比较大的站点。
步骤200:基于KNN(k-NearestNeighbor)邻近算法从历史数据集中选择与当前特征(包含时间、空间、外界因素)最相近的样本数据,获取相似样本集;
步骤200中,基于KNN邻近算法的相似样本集获取中两样本使用基于权重的曼哈顿距离。KNN邻近算法基于预先定义的相似度量方法,在构建的历史数据集中搜索与当前样本具有最高相似度的前k个近邻样本。首先对历史数据集的各个特征做归一化处理,对于每一个历史数据Xh和测试数据Xt,使用
Figure BDA0001766770940000101
来计算两样本
Figure BDA0001766770940000102
Figure BDA0001766770940000103
之间的距离,其中M为向量X的维度,即X中特征的数量。ξ1,ξ2…ξM分别为估测目标y与M个预测变量之间的相关系数。
步骤300:基于相似样本集动态构建高斯过程回归预测模型,对轨道交通各站点短期客流进行预测;
步骤300中,基于高斯过程回归预测模型的轨道交通短期客流预测在核函数选择上采用平方指数核函数。给定前k个近邻样本,H≡{hi=(xi,yi):i=1,2,…,k},其中xi表示输入特征向量,yi表示与xi相关联的目标值,将使用GPR(Gaussian Process Regression,高斯过程回归)高斯过程回归估算下一个时间段所对应的客流量。GPR的目标是建立用来描述xi和yi之间关系的函数f,GPR的关键在于计算均值函数m(x)和协方差函数k(x,x′):f=GP(m(x),k(x,x′)),其中xi和x′表示两个输入特征向量。在核函数的选择上,采用平方指数核函数
Figure BDA0001766770940000104
给定当前特征向量xc,其对应的预测目标yc计算如下:
y*|x*,X,Y~GP(k(x*,X)[k(X,X)]-1Y,k(x*,x*)-k(x*,X)[k(X,X)]-1k(X,x*))
其预测结果不仅包括预测值,而且包含预测值的置信水平。
请参阅图2,是本申请实施例的轨道交通短期客流预测系统的结构示意图。本申请实施例的轨道交通短期客流预测系统包括历史数据集构建模块、相似样本集构建模块和预测模型构建模块。
历史数据集构建模块:用于基于历史观测数据构建历史数据集;本申请实施例中,历史观测数据包括智能卡刷卡数据、天气数据、大型活动数据。
智能卡刷卡数据主要包含四个字段,即:CardID、StationId、TrnsctTime、TrnsctyType;其中,CardID表示智能交通卡的唯一标识,StationId表示轨道站点的标识,TrnsctTime表示交易(刷卡)时间,TrnsctyType表示交易类型(进、出站)。
天气数据主要包括:StationID、Gps、Humidity、Tenmnrainfall;其中,StationID表示气象站点,Gps表示站点经纬度,Humidity表示湿度,Tenmnrainfall表示降雨量。
大型活动数据包括:Type、Begintime、Endtime、LocationGps;其中,Type表示事件类型,Begintime表示开始时间,Endtime表示结束时间,LocationGps表示发生地点。
历史数据集作为KNN算法的搜索空间。给定当前条件,KNN算法从历史数据集中找到最接近给定条件的前k个近邻样本。历史数据集中的每个数据样本由特征向量X和估测目标y组成,X代表当前条件,包括内部影响因素和外部影响因素,需要估算未来各站点离开(出发站点)和到达(目的站点)的客流量。
具体地,历史数据集构建模块包括出第一历史数据集构建单元和第二历史数据集构建单元;
第一历史数据集构建单元用于构建出发客流量历史数据集;某时间段离开某站点的客流量y所对应的特征向量X表示如下:
X=(weekday?,holidays?,big event?,time of day,depart flow,weatherfeatures)。其中,weekday?是布尔类型值,用于表示此数据样本是否发生在工作日,如果是工作日标记为1,否则为0。Holidays表示是否为节假日,big event表示是否发生重大事件,表示方法与weekday?相同。time of day用于表示时间所发生的时段,如果预测的粒度为半小时,那一天可以划分为48段,time of day属于1~48之间。depart flow用Fdp=[Dc-n,...Dc-2,Dc-1]表示,其中Dc-j表示第j个时段离开S站点的客流量。weather features包括与客流量有密切关系的两个特征:温度和湿度。
第二历史数据集构建单元用于构建到达客流量估计历史数据集;某时间段到达某站点的客流量y所对应的特征向量X表示如下:
X=(weekday?,holidays?,big event?,time of day,arrival flows,departflows,weather features)。向量形式与离开客流量向量类似,不同的是前几个时段客流量上包括arrival flows和depart flows两类,分别表示前几个时段到达此站点的客流量和离开其它站点的客流量(未来到达某站点的客流来自之前从别的站点出发的客流)。因为别的站点数量比较多,我们选择那些对所估算站点的到达客流贡献比较大的站点。
相似样本集构建模块:用于基于KNN邻近算法从历史数据集中选择与当前特征(包含时间、空间、外界因素)最相近的样本数据,获取相似样本集;本申请实施例中,基于KNN邻近算法的相似样本集获取中两样本使用基于权重的曼哈顿距离。KNN邻近算法基于预先定义的相似度量方法,在构建的历史数据集中搜索与当前样本具有最高相似度的前k个近邻样本。首先对历史数据集的各个特征做归一化处理,对于每一个历史数据Xh和测试数据Xt,使用
Figure BDA0001766770940000131
来计算两样本
Figure BDA0001766770940000132
Figure BDA0001766770940000133
之间的距离,其中M为向量X的维度,即X中特征的数量。ξ1,ξ2…ξM分别为估测目标y与M个预测变量之间的相关系数。
预测模型构建模块:用于基于相似样本集动态构建高斯过程回归预测模型,对轨道交通各站点短期客流进行预测;本申请实施例中,基于高斯过程回归预测模型的轨道交通短期客流预测在核函数选择上采用平方指数核函数。给定前k个近邻样本,H≡{hi=(xi,yi):i=1,2,…,k},其中xi表示输入特征向量,yi表示与xi相关联的目标值,将使用GPR(Gaussian Process Regression,高斯过程回归)高斯过程回归估算下一个时间段所对应的客流量。GPR的目标是建立用来描述xi和yi之间关系的函数f,GPR的关键在于计算均值函数m(x)和协方差函数k(x,x′):f=GP(m(x),k(x,x′)),其中xi和x′表示两个输入特征向量。在核函数的选择上,采用平方指数核函数
Figure BDA0001766770940000134
给定当前特征向量xc,其对应的预测目标yc计算如下:
y*|x*,X,Y~GP(k(x*,X)[k(X,X)]-1Y,k(x*,x*)-k(x*,X)[k(X,X)]-1k(X,x*))
其预测结果不仅包括预测值,而且包含预测值的置信水平。
图3是本申请实施例提供的轨道交通短期客流预测方法的硬件设备结构示意图。如图3所示,该设备包括一个或多个处理器以及存储器。以一个处理器为例,该设备还可以包括:输入系统和输出系统。
处理器、存储器、输入系统和输出系统可以通过总线或者其他方式连接,图3中以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例的处理方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入系统可接收输入的数字或字符信息,以及产生信号输入。输出系统可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器中,当被所述一个或者多个处理器执行时,执行上述任一方法实施例的以下操作:
步骤a:基于历史观测数据构建历史数据集;
步骤b:基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据,得到相似样本集;
步骤c:基于所述相似样本集构建高斯过程回归预测模型,通过所述高斯过程回归预测模型对轨道交通短期客流进行预测。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例提供的方法。
本申请实施例提供了一种非暂态(非易失性)计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行以下操作:
步骤a:基于历史观测数据构建历史数据集;
步骤b:基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据,得到相似样本集;
步骤c:基于所述相似样本集构建高斯过程回归预测模型,通过所述高斯过程回归预测模型对轨道交通短期客流进行预测。
本申请实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行以下操作:
步骤a:基于历史观测数据构建历史数据集;
步骤b:基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据,得到相似样本集;
步骤c:基于所述相似样本集构建高斯过程回归预测模型,通过所述高斯过程回归预测模型对轨道交通短期客流进行预测。
本申请实施例的轨道交通短期客流预测方法、系统及电子设备使用与预测相关的所有可用历史数据,基于KNN和高斯过程回归对轨道交通各站点短期客流进行预测,其预测结果不仅包括预测值,而且包含预测值的置信水平,相比现有技术,本申请在预测精度和效率上更能够满足实际需求,更适用于基于多源大数据下实时高精度的地铁客流预测场景。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本申请中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本申请所示的这些实施例,而是要符合与本申请所公开的原理和新颖特点相一致的最宽的范围。

Claims (11)

1.一种轨道交通短期客流预测方法,其特征在于,包括以下步骤:
步骤a:基于历史观测数据构建历史数据集;
步骤b:基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据,得到相似样本集;
步骤c:基于所述相似样本集构建高斯过程回归预测模型,通过所述高斯过程回归预测模型对轨道交通短期客流进行预测。
2.根据权利要求1所述的轨道交通短期客流预测方法,其特征在于,在所述步骤a中,所述历史观测数据包括智能卡刷卡数据、天气数据、大型活动数据;
所述智能卡刷卡数据包括CardID、StationId、TrnsctTime、TrnsctyType;其中,CardID表示智能卡唯一标识,StationId表示轨道站点的标识,TrnsctTime表示交易时间,TrnsctyType表示交易类型;
所述天气数据包括StationID、Gps、Humidity、Tenmnrainfall;其中,StationID表示气象站点,Gps表示站点经纬度,Humidity表示湿度,Tenmnrainfall表示降雨量;
所述大型活动数据包括Type、Begintime、Endtime、LocationGps;其中,Type表示事件类型,Begintime表示开始时间,Endtime表示结束时间,LocationGps表示发生地点。
3.根据权利要求1或2所述的轨道交通短期客流预测方法,其特征在于,在所述步骤a中,所述历史数据集中的每个数据样本由特征向量X和估测目标y组成,X代表当前条件,所述历史数据集包括出发客流量历史数据集和到达客流量历史数据集;
所述出发客流量历史数据集的构建方式为:
设定时间段离开设定站点的估测目标y所对应的特征向量X表示如下:
X=(weekday?,holidays?,big event?,time of day,depart flow,weatherfeatures);其中,weekday?是布尔类型值,用于表示此数据样本是否发生在工作日,Holidays表示是否为节假日,big event表示是否发生重大事件,time of day用于表示时间所发生的时段,depart flow用Fdp=[Dc-n,...Dc-2,Dc-1]表示,其中Dc-j表示第j个时段离开S站点的客流量,weather features包括与客流量有密切关系的温度和湿度两个特征;
所述到达客流量估计历史数据集的构建方式为:
设定时间段到达设定站点的估测目标y所对应的特征向量X表示如下:
X=(weekday?,holidays?,big event?,time of day,arrival flows,depart flows,weather features);其中,arrival flows和depart flows分别表示前几个时段到达设定站点的客流量。
4.根据权利要求3所述的轨道交通短期客流预测方法,其特征在于,在所述步骤b中,所述基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据具体包括:基于相似度量方法,在所述历史数据集中搜索与当前样本具有最高相似度的前k个近邻样本,对历史数据集的各个特征做归一化处理,对于每一个历史数据Xh和测试数据Xt,使用
Figure FDA0001766770930000021
计算两样本
Figure FDA0001766770930000022
Figure FDA0001766770930000023
之间的距离,其中M为向量X的维度,ξ1,ξ2…ξM分别为估测目标y与M个预测变量之间的相关系数。
5.根据权利要求4所述的轨道交通短期客流预测方法,其特征在于,在所述步骤c中,所述通过高斯过程回归预测模型对轨道交通短期客流进行预测具体包括:给定前k个近邻样本,H≡{hi=(xi,yi):i=1,2,…,k},其中xi表示输入特征向量,yi表示与xi相关联的目标值,使用GPR高斯过程回归估算下一个时间段所对应的客流量;在核函数的选择上,采用平方指数核函数
Figure FDA0001766770930000031
给定当前特征向量xc,其对应的预测目标yc计算如下:
y*|x*,X,Y~GP(k(x*,X)[k(X,X)]-1Y,k(x*,x*)
-k(x*,X)[k(X,X)]-1k(X,x*))。
6.一种轨道交通短期客流预测系统,其特征在于,包括:
历史数据集构建模块:用于基于历史观测数据构建历史数据集;
相似样本集构建模块:用于基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据,得到相似样本集;
预测模型构建模块:用于基于所述相似样本集构建高斯过程回归预测模型,通过所述高斯过程回归预测模型对轨道交通短期客流进行预测。
7.根据权利要求6所述的轨道交通短期客流预测系统,其特征在于,所述历史观测数据包括智能卡刷卡数据、天气数据、大型活动数据;
所述智能卡刷卡数据包括CardID、StationId、TrnsctTime、TrnsctyType;其中,CardID表示智能卡唯一标识,StationId表示轨道站点的标识,TrnsctTime表示交易时间,TrnsctyType表示交易类型;
所述天气数据包括StationID、Gps、Humidity、Tenmnrainfall;其中,StationID表示气象站点,Gps表示站点经纬度,Humidity表示湿度,Tenmnrainfall表示降雨量;
所述大型活动数据包括Type、Begintime、Endtime、LocationGps;其中,Type表示事件类型,Begintime表示开始时间,Endtime表示结束时间,LocationGps表示发生地点。
8.根据权利要求6或7所述的轨道交通短期客流预测系统,其特征在于,所述历史数据集中的每个数据样本由特征向量X和估测目标y组成,X代表当前条件,所述历史数据集包括:
第一历史数据集构建单元:用于构建出发客流量历史数据集;所述出发客流量历史数据集的构建方式为:
设定时间段离开设定站点的估测目标y所对应的特征向量X表示如下:
X=(weekday?,holidays?,big event?,time of day,depart flow,weatherfeatures);其中,weekday?是布尔类型值,用于表示此数据样本是否发生在工作日,Holidays表示是否为节假日,big event表示是否发生重大事件,time of day用于表示时间所发生的时段,depart flow用Fdp=[Dc-n,...Dc-2,Dc-1]表示,其中Dc-j表示第j个时段离开S站点的客流量,weather features包括与客流量有密切关系的温度和湿度两个特征;
第二历史数据集构建单元:用于构建到达客流量估计历史数据集;所述到达客流量估计历史数据集的构建方式为:
设定时间段到达设定站点的估测目标y所对应的特征向量X表示如下:
X=(weekday?,holidays?,big event?,time of day,arrival flows,depart flows,weather features);其中,arrival flows和depart flows分别表示前几个时段到达设定站点的客流量。
9.根据权利要求8所述的轨道交通短期客流预测系统,其特征在于,所述相似样本集构建模块基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据具体包括:基于相似度量方法,在所述历史数据集中搜索与当前样本具有最高相似度的前k个近邻样本,对历史数据集的各个特征做归一化处理,对于每一个历史数据Xh和测试数据Xt,使用
Figure FDA0001766770930000051
计算两样本
Figure FDA0001766770930000053
之间的距离,其中M为向量X的维度,ξ1,ξ2…ξM分别为估测目标y与M个预测变量之间的相关系数。
10.根据权利要求9所述的轨道交通短期客流预测系统,其特征在于,所述预测模型构建模块通过高斯过程回归预测模型对轨道交通短期客流进行预测具体包括:给定前k个近邻样本,H≡{hi=(xi,yi):i=1,2,...,k},其中xi表示输入特征向量,yi表示与xi相关联的目标值,使用GPR高斯过程回归估算下一个时间段所对应的客流量;在核函数的选择上,采用平方指数核函数
Figure FDA0001766770930000054
给定当前特征向量xc,其对应的预测目标yc计算如下:
y*|x*,X,Y~GP(k(x*,X)[k(X,X)]-1Y,k(x*,x*)
-k(x*,X)[k(X,X)]-1k(X,x*))。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述1至5任一项所述的轨道交通短期客流预测方法的以下操作:
步骤a:基于历史观测数据构建历史数据集;
步骤b:基于KNN邻近算法从所述历史数据集中选择与当前特征最相近的样本数据,得到相似样本集;
步骤c:基于所述相似样本集构建高斯过程回归预测模型,通过所述高斯过程回归预测模型对轨道交通短期客流进行预测。
CN201810931733.5A 2018-08-16 2018-08-16 一种轨道交通短期客流预测方法、系统及电子设备 Pending CN110837903A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810931733.5A CN110837903A (zh) 2018-08-16 2018-08-16 一种轨道交通短期客流预测方法、系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810931733.5A CN110837903A (zh) 2018-08-16 2018-08-16 一种轨道交通短期客流预测方法、系统及电子设备

Publications (1)

Publication Number Publication Date
CN110837903A true CN110837903A (zh) 2020-02-25

Family

ID=69574033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810931733.5A Pending CN110837903A (zh) 2018-08-16 2018-08-16 一种轨道交通短期客流预测方法、系统及电子设备

Country Status (1)

Country Link
CN (1) CN110837903A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860992A (zh) * 2020-07-13 2020-10-30 上海云角信息技术有限公司 客流量预测方法、装置、设备及存储介质
CN113792938A (zh) * 2021-09-29 2021-12-14 上海华力微电子有限公司 生产周期时间的预测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105513337A (zh) * 2015-11-12 2016-04-20 中国科学院深圳先进技术研究院 一种客流量的预测方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105513337A (zh) * 2015-11-12 2016-04-20 中国科学院深圳先进技术研究院 一种客流量的预测方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
赵娟娟: ""城市轨道交通乘客时空出行模式挖掘及动态客流分析"", 《中国优秀博硕士学位论文全文数据库(博士)工程科技Ⅱ辑》 *
雷少梅等: ""基于高斯核函数的短时交通流量预测"", 《中央民族大学学报(自然科学版)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860992A (zh) * 2020-07-13 2020-10-30 上海云角信息技术有限公司 客流量预测方法、装置、设备及存储介质
CN113792938A (zh) * 2021-09-29 2021-12-14 上海华力微电子有限公司 生产周期时间的预测方法

Similar Documents

Publication Publication Date Title
US9349150B2 (en) System and method for multi-task learning for prediction of demand on a system
CN109035761B (zh) 基于辅助监督学习的行程时间估计方法
Qiao et al. A nonparametric model for short-term travel time prediction using bluetooth data
Chen et al. Uncertainty in urban mobility: Predicting waiting times for shared bicycles and parking lots
CN109191845B (zh) 一种公交车辆到站时间预测方法
CN111582559B (zh) 一种到达时间的预估方法及装置
CN102324128A (zh) 基于ic卡记录的公交站间od客流预测方法及装置
CN110874668B (zh) 一种轨道交通od客流预测方法、系统及电子设备
CN104599002B (zh) 预测订单价值的方法及设备
Yang et al. How fast you will drive? predicting speed of customized paths by deep neural network
Chen et al. A multiscale-grid-based stacked bidirectional GRU neural network model for predicting traffic speeds of urban expressways
CN110796317B (zh) 一种基于需求预测的城市出租车调度方法
Ma et al. Estimation of the automatic vehicle identification based spatial travel time information collected in Stockholm
CN110837903A (zh) 一种轨道交通短期客流预测方法、系统及电子设备
CN117546218A (zh) 用于交通预测的分布式多任务机器学习
CN112669595B (zh) 一种基于深度学习的网约车流量预测方法
CN108053646B (zh) 基于时间敏感特征的交通特征获取方法、预测方法及系统
CN105913654A (zh) 一种智能交通管理系统
Sandim et al. Using GPS-based AVL data to calculate and predict traffic network performance metrics: A systematic review
Buroni et al. A tutorial on network-wide multi-horizon traffic forecasting with deep learning.
Origlia et al. On-line filtering of on-street parking data to improve availability predictions
Rodríguez-Rueda et al. Origin–Destination matrix estimation and prediction from socioeconomic variables using automatic feature selection procedure-based machine learning model
CN116523093A (zh) 基于随机源荷预测的能源系统的网格需求感知系统及方法
CN113284337B (zh) 基于车辆轨迹多维数据的od矩阵计算方法及装置
Mallek et al. Enhanced K-Nearest Neighbor model for multi-steps traffic flow forecast in urban roads

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200225