CN118153724A - 客流量预测方法、系统、计算设备集群、及存储介质 - Google Patents
客流量预测方法、系统、计算设备集群、及存储介质 Download PDFInfo
- Publication number
- CN118153724A CN118153724A CN202211490517.4A CN202211490517A CN118153724A CN 118153724 A CN118153724 A CN 118153724A CN 202211490517 A CN202211490517 A CN 202211490517A CN 118153724 A CN118153724 A CN 118153724A
- Authority
- CN
- China
- Prior art keywords
- traffic
- stations
- station
- time
- passenger flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000003068 static effect Effects 0.000 claims description 58
- 230000015654 memory Effects 0.000 claims description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 20
- 238000000605 extraction Methods 0.000 description 17
- 238000004364 calculation method Methods 0.000 description 15
- 238000007726 management method Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 239000012634 fragment Substances 0.000 description 11
- 230000002123 temporal effect Effects 0.000 description 10
- 238000010276 construction Methods 0.000 description 9
- 206010047289 Ventricular extrasystoles Diseases 0.000 description 8
- 230000002159 abnormal effect Effects 0.000 description 8
- 238000013480 data collection Methods 0.000 description 8
- 238000005129 volume perturbation calorimetry Methods 0.000 description 8
- 238000012216 screening Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000000586 desensitisation Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000029305 taxis Effects 0.000 description 2
- 238000002759 z-score normalization Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005339 levitation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000714 time series forecasting Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本申请公开了一种客流量预测方法、系统、计算设备集群、及存储介质,该方法包括:获取多个站点的历史客流数据和站点相关信息;根据上述多个站点的历史客流数据和站点相关信息生成多个邻接关系图,其中,多个邻接关系图分别用于表示上述多个站点之间不同的时空关系;根据上述多个站点的历史客流数据和多个邻接关系图预测得到第一站点在第一时段的第一客流量,其中,上述多个站点包括第一站点。本申请的技术方案从多个不同的视角提取站点间的时空相关性,能够提高客流预测的准确性。
Description
技术领域
本申请涉及交通技术领域,尤其涉及一种客流量预测方法、系统、计算设备集群、及存储介质。
背景技术
随着全球范围内城市化的急速发展,城市人口和交通体量在不断扩张,城市交通尤其是城市重点区域(例如交通枢纽附近)的道路拥挤问题愈发突出。为了解决交通拥堵问题,各国都在大力发展公共交通,如城轨(包含地铁、轻轨、有轨电车磁悬浮列车等)、公交车等。
城轨交通的容量是有限的,为了合理调度交通运力、及时缓解客流压力,客流预测已经成为了一种必要技术手段。对于一个城市的道路交通管理而言,通过客流预测可以预先发现城市中可能出现的城轨交通拥挤,提前部署和调整城市城轨交通管理方案,可以一定程度地缓解交通拥挤问题,同时避免人流密度过大可能带来的安全隐患。对于各种出行交通软件而言,通过客流预测掌握了路网城轨线路的流量状态后,可以更合理地规划平台的派单问题,帮助网约车和出租车司机使用更加节省时间和节省能源的方式在城轨站点附近接客送客。而对于普通公众而言,根据流量预测情况能够合理地安排自己的出行计划,以错开拥挤高峰、选择更加顺畅便捷的出行方式。
现有的客流量预测方法往往只是基于站点之间的拓扑连接关系来构建一个邻接关系图,对站点之间的空间特征提取较为单一,而未能建立车站之间更多的依赖关系。由于上述方法对站点之间的空间特征提取不够充足,导致客流预测的准确性不够高。
发明内容
本申请提供一种客流量预测方法、系统、计算设备集群、及存储介质,能够实现更准确的客流预测。
第一方面,本申请提供了一种客流量预测方法,该方法包括:获取多个站点的历史客流数据和站点相关信息;根据上述多个站点的历史客流数据和站点相关信息生成多个邻接关系图,其中,多个邻接关系图分别用于表示上述多个站点之间不同的时空关系;根据上述多个站点的历史客流数据和多个邻接关系图预测得到第一站点在第一时段的第一客流量,其中,上述多个站点包括第一站点。
在本方案中,通过获取多个站点的历史客流数据和站点数据,生成了多个邻接关系图以表示站点之间多种不同的时空关系,即从多个不同的视角提取了站点间的时空相关性,然后基于多个邻接关系图和上述多个站点的历史客流数据进行客流预测。
可以理解的是,相较于只根据站点间的简单连接关系来构造单一的邻接关系图的客流量预测方法,本方案从多个视角去挖掘站点间更丰富的时空相关性,构建了多个邻接关系图以分别表示站点间的不同时空关系,然后根据构建的多个邻接关系图进行客流预测,从而可以实现更准确的客流预测。
基于第一方面,在可能的实施方案中,上述多个站点的历史客流数据包括历史进站客流数据和历史出站客流数据中的一种或多种,上述第一客流量包括预测进站客流量和预测出站客流量中的一种或多种。
也就是说,可以基于历史进站客流数据和历史出站客流数据中的一种或多种进行客流预测,可以预测进站客流量,也可以预测出站客流量,也可以二者都进行预测。
基于第一方面,在可能的实施方案中,上述多个邻接关系图包括距离图、旅行时间图、和动态相似度图,其中,距离图用于表示上述多个站点两两之间的最短站点距离的大小关系,旅行时间图用于表示上述多个站点两两之间的最短旅行时间的大小关系,动态相似度图用于表示上述多个站点两两之间的对应的客流量时序片段的相似度,第二站点的客流量时序片段为根据第二站点的历史客流数据生成的第二站点对应的客流量时间序列中的时序片段,第二站点为上述多个站点中的任意一个。
在本方案中,不仅考虑了站点之间的连接关系,还额外考虑了站点间的旅行距离、旅行时间、相似性等维度的时空相关性,充分挖掘了不同视角下站点间潜在的时空相关性,从而能够实现更加精准的客流预测,进而为未来的城轨车辆调度提供可靠的指导。
基于第一方面,在可能的实施方案中,上述多个邻接关系图还包括起点-终点(origin-destination,OD)图和/或静态时间相似度图,其中,OD图用于表示上述多个站点两两之间的起点-终点客流量,静态相似度图用于表示在上述多个站点的历史客流数据对应的时间范围内上述多个站点两两之间在客流量变化趋势上的相似度。
在本方案中,还可以考虑站点间在OD客流量上的关系,其可以通过OD图进行表示。相似度图可以有两种不同的类型,分别是静态相似度图和动态相似度图,除了使用动态相似度图,还可以额外使用静态相似度图来表示站点间的时空关系。本方案通过增加多种不同视角下的站点间的时空关系,有助于提高后续客流量预测的准确性。
基于第一方面,在可能的实施方案中,上述OD图包括静态OD图和动态OD图中的一种或多种,其中,静态OD图用于表示在多个站点的历史客流数据对应的时间范围内多个站点两两之间的OD客流量,动态OD图用于表示在多个时间片中的每个时间片内多个站点两两之间的OD客流量,多个站点的历史客流数据对应的时间范围包括多个时间片。
在本方案中,OD图可以有两种不同的类型,一种是静态OD图,另一种是动态OD图。相较于静态OD图,动态OD图考虑了OD客流量在不同时间片上的差异性,能够在时间片的角度上更精准地体现站点间的OD客流量的相关性,能够进一步提升后续客流预测的准确性。
基于第一方面,在可能的实施方案中,该方法还包括:根据多个站点的历史客流数据和多个邻接关系图预测得到第三站点在第二时段的第二客流量,其中,多个站点包括第一站点和第三站点;根据第一客流量和第二客流量预测第一站点和第三站点之间的相似度。
在本方案中,可以提供未来站点相似度预测的功能,即预测未来一定时间内的站点之间在客流量变化趋势上的相似性,可作为城轨运力调度的重要参考,为城轨运营管理人员设计和调整城轨交通的运营组织方案提供数据支持。
基于第一方面,在可能的实施方案中,上述第一站点和第三站点之间的相似度是基于动态时间规整算法(dynamic time wrapping,DTW)、闵式距离、皮尔逊相关系数中的一种或多种确定的。
也就是说,可以基于DTW、闵式距离、皮尔逊相关系数中的一种或多种不同的方式来计算站点间的相似度。应理解,通过多种不同方式综合计算出的相似度会更加准确,能够从多个不同的角度体现站点之间的相似程度。
基于第一方面,在可能的实施方案中,该方法还包括:获取流量阈值;根据上述第一客流量和流量阈值确定是否发出预警。
在本方案中,可以提供异常流量预警的功能。如果某个/某些站点的客流量预测结果超过相应的流量阈值,则确定发出预警,以提醒运营管理人员等提前准备好相应的应对措施,进而制定合适的调度计划(如增加发车数量)以缓解未来可能出现的客流压力,尽可能地降低未来拥堵事件发生的概率。
第二方面,本申请实施例还提供一种客流预测系统,该系统包括:获取模块,用于获取多个站点的历史客流数据和站点相关信息;生成模块,用于根据所述多个站点的历史客流数据和所述站点相关信息生成多个邻接关系图,其中,所述多个邻接关系图分别用于表示所述多个站点之间不同的时空关系;预测模块,用于根据所述多个站点的历史客流数据和所述多个邻接关系图预测得到第一站点在第一时段的第一客流量,其中,所述多个站点包括所述第一站点。
基于第二方面,在可能的实施方案中,上述多个站点的历史客流数据包括历史进站客流数据和历史出站客流数据中的一种或多种,上述第一客流量包括预测进站客流量和预测出站客流量中的一种或多种。
基于第二方面,在可能的实施方案中,上述多个邻接关系图包括距离图、旅行时间图和动态相似度图,其中,所述距离图用于表示所述多个站点两两之间的最短站点距离的大小关系,所述旅行时间图用于表示所述多个站点两两之间的最短旅行时间的大小关系,所述动态相似度图用于表示所述多个站点两两之间的对应的客流量时序片段的相似度,第二站点的客流量时序片段为根据所述第二站点的历史客流数据生成的所述第二站点对应的客流量时间序列中的时序片段,所述第二站点为所述多个站点中的任意一个。
基于第二方面,在可能的实施方案中,多个邻接关系图还包括起点-终点图和/或静态时间相似度图,其中,所述起点-终点图用于表示所述多个站点两两之间的起点-终点客流量,所述静态相似度图用于表示在所述多个站点的历史客流数据对应的时间范围内所述多个站点两两之间在客流量变化趋势上的相似度。
基于第二方面,在可能的实施方案中,上述OD图包括静态OD图和动态OD图中的一种或多种,其中,静态OD图用于表示在多个站点的历史客流数据对应的时间范围内多个站点两两之间的OD客流量,动态OD图用于表示在多个时间片中的每个时间片内多个站点两两之间的OD客流量,多个站点的历史客流数据对应的时间范围包括多个时间片。
基于第二方面,在可能的实施方案中,上述相似度图包括静态相似度图和动态相似度图中的一种或多种,其中,静态相似度图用于表示在多个站点的历史客流数据对应的时间范围内多个站点两两之间在客流量变化趋势上的相似度,动态相似度图用于表示在多个时间片中的每个时间片内多个站点两两之间在客流量变化趋势上的相似度,多个站点的历史客流数据对应的时间范围包括多个时间片。
基于第二方面,在可能的实施方案中,上述预测模块还用于:根据前述多个站点的历史客流数据和多个邻接关系图预测得到第三站点在第二时段的第二客流量,其中,多个站点包括第一站点和第三站点;根据第一客流量和第二客流量预测第一站点和第三站点之间的相似度。
基于第二方面,在可能的实施方案中,上述第一站点和第三站点之间的相似度是基于动态时间规整算法、闵式距离、皮尔逊相关系数中的一种或多种确定的。
基于第二方面,在可能的实施方案中,该系统还包括预警模块;上述获取模块还用于获取流量阈值,预警模块用于根据前述第一客流量和流量阈值确定是否发出预警。
第三方面,本申请提供一种计算设备集群,包括至少一个计算设备,每个计算设备包括处理器和存储器;所述至少一个计算设备的处理器用于执行所述至少一个计算设备的存储器中存储的指令,以使得所述计算设备集群执行第一方面中任一项所述的方法。
第四方面,本申请提供一种计算机可读存储介质,包括计算机程序指令,当所述计算机程序指令由计算设备集群执行时,该计算设备集群执行如第一方面中任一项所述的方法。
第五方面,本申请提供一种包含指令的计算机程序产品,其特征在于,当所述指令被计算设备集群运行时,使得该计算设备集群执行如第一方面中任一项所述的方法。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1是本申请实施例提供的一种客流量预测系统的架构示意图;
图2是本申请实施例提供的一种数据收集与处理的流程示意图;
图3是本申请实施例提供的一种乘客进出站数据的示意图;
图4是本申请实施例提供的一幅城轨交通线路的示意图;
图5是本申请实施例提供的多种静态的邻接关系图的示例;
图6是本申请实施例提供的多种动态的邻接关系图的示例;
图7是本申请实施例提供的某个站点在某一天的客流量的波形示意图;
图8是本申请实施例提供的一种客流量预测方法的流程示意图;
图9是本申请实施例提供的又一种客流量预测系统的结构示意图;
图10是本申请实施例提供的一种计算设备的结构示意图;
图11是本申请实施例提供的一种计算设备集群的示意图;
图12是本申请实施例提供的两个计算设备通过网络进行通信的示意图。
具体实施方式
为了便于理解本申请实施例的技术方案,下面介绍本申请实施例涉及的一种系统架构。
请参见图1,图1是本申请实施例中提供的一种客流量预测系统100的系统架构示意图,包括数据收集与处理模块110、多图数据构建模块120和客流预测模块130,下面分别进行具体介绍。
1.数据收集与处理模块110
数据收集与处理模块110用于收集并处理乘客进出站数据进而得到历史客流数据。
下面具体介绍数据收集与处理模块110进行数据收集与处理的工作流程,请参见图2,图2为本申请实施例提供的一种数据收集与处理的流程示意图,包括如下步骤:
S201:采集乘客进出站数据。
其中,乘客进出站数据是指乘客进出交通站点的信息记录。对于城轨交通客流量预测场景,上述交通站点是指城轨交通线路上的站点,其中,城轨泛指城市轨道交通系统,包括但不限于各种主要以电力驱动的城市轨道交通系统,如地铁、轻轨、有轨电车、磁悬浮列车等。对于路面交通客流预测场景,上述交通站点是指路面交通线路上的站点,其中,路面交通可以包括公交车、汽车、大巴车、火车、动车、高铁、出租车等等,本申请对此不具体限定。若无特殊说明,后文主要以城轨交通客流量预测场景为例进行描述,但不代表只能应用于该场景,同样可以迁移到路面交通客流预测场景中使用。
需要注意的是,若无特殊说明,本申请实施例中出现的进出站可以指代进站和出站中的一种或多种,也就是说,步骤S201采集乘客进出站数据可以指采集乘客进站数据和乘客出站数据中的一种或多种;若无特殊说明,本申请实施例中出现的客流量(或客流数据)可以指进站客流量和出站客流量中的一种或多种。
在一具体实施例中,乘客进出站数据可以从自动售检票(automatic farecollection,AFC)系统获取。其中,AFC系统(或者称:城市轨道交通自动售检票系统、自动收费系统等),是一种由计算机集中控制的自动化网络系统,AFC系统基于计算、通信、网络、自动控制等技术,能够实现轨道交通自动售票、检票、计费、收费、统计、清分、管理等功能。如今大部分城市的城市轨道交通系统的进站和出站都需要同一张票或者同一账号,即包括但不限于二维码、卡片、近场通信(near field communication,NFC)手机、NFC手环等多种方式。AFC系统会收集乘客进站数据和乘客出站数据,并根据同一乘客的进站与出站的时间地点进行扣费。客流量预测系统100中的数据收集与处理模块110通过对接AFC系统,即可自动获取到AFC系统实时收集的乘客进出站数据,非常高效。
例如,图3示例性地给出了AFC系统提供的一条乘客进出站数据,包括身份标识(identity document,ID)、时间戳、站点号、进出状态等多个字段的信息。根据该乘客进出站数据,便可以确定乘客的身份、状态是进站(0表示进站)还是出站(1表示出站)、状态发生的时间以及具体的站点。
需要说明的是,为了保护乘客隐私,AFC系统可能会对乘客进出站数据执行脱敏操作,此时,数据收集与处理模块110从AFC系统中获取到的乘客进出站数据不包含乘客的身份ID,导致无法确定哪些乘客进出站数据是属于同一个乘客的。其中,数据脱敏是指在不影响数据分析结果的准确性的前提下,对原始数据中的敏感字段(例如身份ID)进行预处理,从而降低数据敏感度和减少个人隐私风险的技术措施。
S202:基于字段筛选与数据聚类得到历史客流数据。
应理解,从AFC系统收集到的乘客进出站数据,可能会包含一些不符合要求的数据,如城轨工作人员的进出站数据、城轨运营时间外的进出站数据等,本申请实施例不具体限定。为了后续能够统计得到准确的历史客流数据,此处需要把一些不符合要求的乘客进出站数据给筛选出去,可以通过字段筛选等方式实现。例如,对乘客进出站数据中的身份ID字段进行筛选,从而将城轨工作人员的进出站数据给筛选出去;对乘客进出站数据中的时间戳字段进行筛选,从而将处在城轨运营时间之外的乘客进出站数据给筛选出去。
通过上述字段筛选完成数据过滤之后,数据收集与处理模块110还需要进行数据聚类才可以得到各个站点的历史客流数据。
例如,可以按照预设的时间间隔/时间粒度(如5分钟、15分钟、30分钟等,可以根据实际应用需求进行调整)来统计每个时间间隔里面各个车站的进站人数与出站人数,即得到各个车站在每个时间间隔内的历史进站客流数据和历史出站客流数据。假设有N个站点,N为大于1的正整数,因为进站人数和出站人数是分开统计的,所以每个时间间隔下都有对应的2N个统计数据(包括在该时间间隔内N个站点各自的历史进站客流数据和历史出站客流数据)。为了便于描述,此处用表示第t个时间间隔对应的2N个统计数据,其中,i为站点序号(即表示第i个车站),Xt∈RN×2,/>表示第i个站点在第t个时间间隔的历史进站客流数据和历史出站客流数据。
S203:构建历史客流特征数据。
具体的,在步骤S202得到各个站点在不同时间间隔下的历史客流数据后,可以进一步对其进行预处理从而构建出历史客流特征数据,以便输入后续客流预测模型。例如,可以使用标准分数(standard score)(也叫Z分数、Z-score)对步骤S202统计得到的这些历史客流数据进行归一化操作,从而得到历史客流特征数据。关于对历史客流数据进行预处理的方式,本申请实施例不做具体限定,例如,还可以采用最大最小标准化、数据放缩和/或移动平均处理等常见的数据预处理方法,进而得到历史客流特征数据。
2.多图数据构建模块120
多图数据构建模块120用于构建多图数据,多图数据用于表示站点之间的多种时空关系。具体的,多图数据构建模块120基于数据收集与处理模块110统计得到的历史客流数据,结合一些站点相关信息(比如,站点基础信息、运行时间信息等),进而构建得到多图数据。
上述站点基础信息是指城市轨道交通中的各个交通站点的基础信息,包括站点的数量、名称、空间位置关系(连接关系)、相邻站点间的线路距离等基础信息;运行时间信息是指城轨交通的基础时间信息,可以包括城轨交通的运营时间(包括始发时间、运营结束时间)、站点间的行车时间、到站时刻表等等。可以理解的是,上述站点基础信息和运行时间信息可以由轨道交通建设部门、运营管理部门等来提供,本申请实施例不做具体限定。
上述多图数据中的多图是指多个邻接关系图,它们分别从不同的视角来体现站点之间的时空关系(时空相关性)。它们被用作站点之间的时空相关性图,将输入后续的客流预测模型中以提取更深层次的时间特征和空间特征。
可选的,上述多个邻接关系图可以包括距离图、旅行时间图、起点-终点(origin-destination,OD)图、相似度图中的至少三种,下面分别进行具体介绍。
1)距离图:用于表示多个站点两两之间的最短站点距离的大小关系。
应理解,图可以用邻接矩阵来表示,为了便于描述,本申请将距离图记为即一个N×N的邻接矩阵,N为站点数目,其中,上标S表示该图为静态图,后文相关表示均为此意。
在城轨客流量预测场景中,上述最短站点距离是指乘坐城轨交通从其中一个站点到达另一个站点所需的最少站点间隔数,其中,城轨交通线路上相邻两个站点之间作为一个间隔。应理解,任意两个站点之间可能存在一条或多条基于城轨交通的出行路径,每条出行路径上可能包含一个或多个间隔,于是可以将间隔数最少的出行路径所包含的间隔数作为上述两个站点之间的最短站点距离。
例如,如图4所示,图4是一幅城轨交通线路的示意图,假设有大致为纵横方向的两条地铁线路,横向的这条地铁线路(即一号线)上包含A、B、C站点,纵向的这条地铁线(即二号线)路上包含D、B、E站点。可以理解的是,从轨道交通建设部门、运营管理部门等可以获得图4的城轨交通线路图,通过对该图进行抽象可以生成图5中的(a)距离图。具体来说,以图4中的各个站点为节点,在两两节点间绘制一条连线作为边(实线代表是相邻站点、虚线代表非相邻站点),然后以两两站点之间的最短站点距离作为相应边的权值(边上的数值),便可以构建出图5中的(a)距离图。比如,站点A和站点B是一号线上的两个相邻站点,站点A、B之间的这条边上的权值1代表这两个站点之间的最短站点距离,即在它们之间乘坐地铁所需要经过的最少站点间隔数为1;站点A和站点D分别是一号线和二号线上的站点(站点A和站点D不相邻),站点A和站点D之间的最短站点距离为站点A、B之间的最短站点距离(权值为1)以及站点B、D之间的最短站点距离(权值1)之和,即在站点A和站点D之间乘坐地铁所需要经过的最少站点间隔数为2。
在路面交通客流预测场景中,上述最短站点距离是指采用路面交通方式从其中一个站点到达另一个站点所需的最少站点间隔数/最短行车距离,其中,路面交通方式可以包括公交车、汽车、大巴车、火车、动车、高铁、出租车等等,本申请不做具体限定。例如,对于公交车客流预测场景,任意两个公交站之间可能存在一条或多条基于公交车的出行路径,每条出行路径可能经过一条或多条公交线路,每条出行路径上可能包含一个或多个间隔(公交线路上的相邻两个公交站之间作为一个间隔),于是可以将间隔数最少的出行路径所包含的间隔数作为上述两个公交站之间的最短站点距离。再如,对于出租车客流预测场景,任意两个站点(分别为上车点和下车点)之间可能存在一条或多条可行的驾驶路径,于是可以将行车距离最短的驾驶路径的距离作为上述两个站点之间的最短站点距离。
需要说明的是,由于此处只需要反映两两站点间的最短站点距离的大小关系,因此,在距离图中除了直接记录两两站点间的最短站点距离的实际值,也可以是记录两两站点间的最短站点距离的相对值,本申请实施例不做具体限定。例如,对于出租车客流预测场景,假设有三个站点,它们两两之间的最短站点距离的实际值为1.2km、3.6km、4.8km,于是在距离图中,上述两两站点间的连线上的权值可以直接为上述实际值,即依次为1.2、3.6、4.8,上述两两站点间的连线上的权值也可以是相对值,即依次为1、3、4。
2)旅行时间图:用于表示多个站点两两之间的最短旅行时间的大小关系。
为了便于描述,本申请实施例将旅行时间图记为上标S表示该图为静态图,N为站点数目。应理解,对于城轨交通而言,两个站点之间所需要的通行时间(行车时间)基本上是固定的,因此,可以向城轨交通的运营管理部门获取行车时间信息,进而计算出任意两个站点之间旅行所需要的最短时间。还应理解,两个站点之间可能存在一条或多条的旅行路径,上述两个站点间的最短旅行时间为上述一条或多条的旅行路径中所需旅行时间最短的旅行路径对应的旅行时间。
可选的,除了直接以行车时间作为旅行时间,还可以在行车时间的基础上结合等待时间、步行时间等综合算出旅行时间,从而可以获得更加准确的站点间的最短旅行时间,有助于提升后续客流预测的精准度。其中,等待时间可以包括进站等待时间、出站等待时间、换乘等待时间中的一种或多种,步行时间可以包括进站步行时间、出站步行时间、换乘步行时间中的一种或多种。例如,站点A和站点D之间的旅行时间为站点A、B之间的行车时间、站点B、D之间的行车时间、在B站点的换乘步行时间和换乘等待时间(即从一号线换乘二号线)之和。应理解,上述等待时间和步行时间可以根据数据统计来获得,例如,可以由地铁工作人员多次统计某旅行路径所需要的换乘等待时间,以多次统计结果的平均值作这条旅行路径对应的换乘等待时间。
需要说明的是,由于此处只需要反映站点之间的最短旅行时间的大小关系,因此,除了直接使用实际旅行时间的数值来表示站点之间的最短旅行时间,也可以以实际旅行时间的相对大小关系来间接表示两两站点间的最短旅行时间。
承接1)距离图中的例子,在图4的城轨交通线路图的基础上结合站点间的行车时间,即可生成图5中的(b)旅行时间图。具体来说,以图4中的各个站点为节点,在两两节点间绘制一条连线作为边(实线代表是相邻站点、虚线代表非相邻站点),然后以两两站点之间的最短旅行时间作为相应边的权值(即边上的数字),便可以构建出图5中的(b)旅行时间图。比如,站点A和站点B是一号线上的两个相邻站点,站点A、B之间的这条边上的权值2.5代表这两个站点之间的最短旅行时间,站点A和站点D分别是一号线和二号线上的站点(站点A和站点D不相邻),站点A和站点D之间的最短旅行时间为站点A、B之间的最短旅行时间(权值为2.5)以及站点B、D之间的最短旅行时间(权值为2.5)之和,即为5。
3)OD图:用于表示多个站点两两之间的OD客流量。
可选的,OD图可以包括静态OD图和动态OD图中的一种或多种。
静态OD图用于表示在历史时间窗内上述多个站点两两之间的OD客流量,其中,历史时间窗是指上述多个站点的历史客流数据对应的时间范围,OD客流量的分布即乘客乘坐城轨交通出行的起始站点和目的地站点所组成的起点-终点对(简称OD对)的分布。为了便于描述,本申请实施例将静态OD图记为N为站点数目。
应理解,以相同乘客连续两次的进站数据和出站数据分别作为一次出行行为的起点和终点,经过简单处理便可以得到一条条的OD数据,每一条OD数据即对应一个OD对。其中,OD数据是交通、城市规划、地理信息系统等领域常见的一类数据,特点是每一条OD数据都记录了乘客的一次出行行为的起点与终点的位置、时间等信息,相当于一次简单的出行记录。将统计得到的一条条OD数据与站点对进行匹配,在历史时间窗内,如果某两个站点间匹配的OD数据越多,则表明这两个站点间的交通量出行量越多,即OD客流量越多;如果某两个站点间匹配的OD数据越少,则表明这两个站点间的交通量出行量越少,即OD客流量越少,确定在历史时间窗内两两站点间的OD客流量后,进而可以生成静态OD图。
可选的,客流量预测系统100中的数据收集与处理模块110可以从AFC系统获取原始的乘客进出站数据,然后自行分析得到一条条的OD数据,进而通过上述OD数据生成OD图。或者,数据收集与处理模块110不需要对乘客进出站数据(从AFC系统获取的)进行统计分析从而得到OD数据,可以直接从AFC系统获取到AFC系统分析处理好的一条条OD数据,进而通过上述OD数据生成OD图。例如,根据统计出来的一条条OD数据可以确定两两站点间的OD客流量,然后在图4的城轨交通线路的基础上结合两两站点间的OD客流量,即可生成图5中的(c)静态OD图,其中,两两站点间的连线(实线代表是相邻站点、虚线代表非相邻站点)上的权值表示相应的两个站点间的OD客流量的大小。
考虑到OD客流量在不同时间片上的差异性,因此在上述静态OD图的基础上提出了一个时间变化的变体图,即动态OD图,它能够在时间片的角度上更精确地体现站点间的OD客流量。
动态OD图用于表示在多个时间片中的每个时间片内上述多个站点两两之间的OD客流量。为了便于描述,此处将上述多个站点的历史客流数据对应的时间范围称为历史时间窗,历史时间窗内包括上述多个时间片(记为T1个时间片)。具体的,历史时间窗内可以划分时间片,每个时间片的长度为Δt(可以根据实际应用场景进行调整),于是可以得到T个时间片。其中,时间片的数量T=历史时间窗的长度/Δt,上述多个时间片T1可以是T个时间片中的部分或全部时间片。为了便于描述,此处用表示在第j个时间片内上述多个站点两两之间的OD客流量的大小关系,j∈j1,T1j,即第j个时间片对应的OD客流分布情况(第j个时间片对应的OD图的邻接矩阵)。综合T1个时间片对应的OD客流分布情况,即可得到动态OD图,记为/>其中,上标D表示该图为动态图。
例如,根据乘客进出站数据统计得到一条条OD数据后,再根据上述OD数据分别统计各个时间片下的OD客流分布情况,在某个时间片内,如果某两个站点间对应的OD数据越多,则表明这两个站点间的交通量出行量越多,即OD客流量越多,如果某两个站点间对应的OD数据越少,则表明这两个站点间的交通量出行量越少,即OD客流量越少,进而可以生成图6中的(a)动态OD图,包括多个时间片中的每个时间片所对应的OD图。其中,任意一个时间片对应的OD图上的两个站点间的连线(实线代表是相邻站点、虚线代表非相邻站点)上的权值,表示在该时间片内这两个站点间的OD客流量的大小。
需要说明的是,上述静态OD图和动态OD图均可以为有向图,任意两个站点间都存在两条相反方向的连线以表示相应的OD客流量,即对于OD图上的任意两个不同的站点(此处称作第一站点和第二站点),从第一站点指向第二站点的连线(第一站点和第二站点依次作为起点和终点)上的权值表示从第一站点到第二站点的OD客流量,而从第二站点指向第一站点的连线(第一站点和第二站点依次作为终点和起点)上的权值表示从第二站点到第一站点的OD客流量。只是为了附图的简洁和清晰,图5中的(c)静态OD图和图(6)中的(a)动态OD图内的两两节点间仅以一条连线表示。
还需要说明的是,在一些应用场景下,客流量预测系统100从AFC系统获取的乘客进出站数据是经过脱敏操作的,即乘客进出站数据不包含乘客的身份ID信息。由于无法根据上述乘客进出站数据处理得到OD数据,所以无法生成上述静态OD图与动态OD图,于是后续客流预测模型将不使用OD图。
4)相似度图:用于表示多个站点两两之间在客流量变化趋势上的相似度。
相似度图可以包括动态相似度图,还可以包括静态相似度图。
静态相似度图用于表示在历史时间窗内上述多个站点两两之间在客流量变化趋势上的相似性,其中,历史时间窗是指上述多个站点的历史客流数据对应的时间范围。为了便于描述,将静态相似度图记为其中,/>中的第i行第j列的元素表示在历史时间窗内第i个站点和第j个站点的相似度,即第i个站点在历史时间窗内对应的客流量时间序列与第j个站点在历史时间窗内对应的客流量时间序列的相似度,N为站点数目,i、j∈j1,Nj。应理解,某个站点在历史时间窗内对应的客流量时间序列是指在该历史时间窗内按照一定时间间隔收集该站点的历史客流数据而生成的时间序列,该时间序列的长度小于或等于历史时间窗的长度,时间间隔不做具体限定,为了便于描述,后文中可直接称为该站点对应的客流量时间序列。
可选的,相似度图(包括静态相似度图和动态相似度图)可以基于动态时间规整(dynamic time wrapping,DTW)算法、皮尔逊相关系数、闵可夫斯基距离(也称闵式距离)等方式中的一种或多种来计算站点之间的相似度,即可以从一个或多个角度进行相似度的计算。可选的,可以通过归一化以及对上述不同方式算出的相似度赋予不同的权重,最终求出一个站点之间的混合相似度,混合相似度可以用于生成相似度图。
以DTW算法为例,此处将通过DTW算法计算的站点间的相似度称为DTW相似度。具体的,对于每个站点对(即任意两个不同站点),可以用DTW算法计算出来的DTW距离来衡量它们之间的相似度,即两个站点各自对应的客流量时间序列之间的DTW相似度。例如,在历史时间窗内站点A和站点B之间的DTW相似度记为DTW(A,B),可以通过式(1)进行计算:
DTW(A,B)=dist(A,B) (1)
其中,dist(A,B)表示计算站点A对应的客流量时间序列与站点B对应的客流量时间序列之间的对应时间点的客流量的余弦相似度的平均值。其他站点间的DTW相似度计算方式同理,于是可以得到前述多个站点两两之间的DTW相似度,进而可以生成图5中的(d)静态相似度图。其中,任意两个站点间的连线(实线代表是相邻站点、虚线代表非相邻站点)上的权值表示历史时间窗内上述两个站点间在客流量变化趋势上的相似度。
考虑到站点间的相似度在不同时间片上的差异性,因此在上述静态相似度图的基础上提出了一个时间变化的变体图,即动态相似度图,它能够在时间片的角度上更精确地体现两两站点间的相似度。动态相似度图用于表示上述多个站点两两之间的对应的客流量时序片段的相似度,其中,第二站点的客流量时序片段为根据第二站点的历史客流数据生成的第二站点对应的客流量时间序列中的时序片段,第二站点为上述多个站点中的任意一个。
具体的,对于每一个站点,根据该站点的历史客流数据可以生成该站点对应的一个客流量时间序列(具体可参见前文介绍)。对于每一个站点对应的客流量时间序列,可以按照一定的时间间隔Δt将其划分为一个个的时序片段,其中,某站点对应的时序片段的数量=该站点对应的客流量时间序列/Δt,Δt可根据实际应用场景进行调整,本申请实施例不做具体限定。对于任意两个站点来说,它们各自对应的客流量时间序列均可以划分出多个客流量时序片段,它们各自的客流量时序片段间的对应关系可以根据需要进行设置。
以站点q和站点c为例,站点q和站点c分别为前述N个站点中的第q个站点和第c个站点,q、c∈j1,Nj。按照相同的时间间隔Δt,站点q和站点c各自对应的客流量时间序列均划分出了多个客流量时序片段。假设站点q有n个客流量时序片段,站点c有m个客流量时序片段,n、m均为正整数,n和m可能相等也可能不等,站点q的客流量时序片段与站点c的客流量时序片段可以遵循以下对应关系:站点q的第i个客流量时序片段与站点c的第j个客流量时序片段对应,其中,i∈j1,nj,j∈j1,mj,i-j=a。按照上述对应关系,每两个对应的客流量时序片段作为一个客流量时序片段对,则站点q和站点c之间可能存在T2个客流量时序片段对,T2≤min(n,m)。需要说明的是,上述a为整数,其可以根据需要进行设置。
例如,若设置a=0,则站点q和站点c的时间序列直接按照顺序进行对应,即站点q的第1至T2个客流量时序片段依次与站点c的第1至T2个客流量时序片段一一对应;若设置a大于0,则站点q的第a至T2+a-1个客流量时序片段依次与站点c的第1至T2个客流量时序片段一一对应;若设置a小于0,则站点q的第1至T2个客流量时序片段依次与站点c的第a至T2+a-1个客流量时序片段一一对应。
为了便于描述,将动态相似度图记为动态相似度图中包括T3个子相似度图,将第k个子相似度图记为/>其中,N为站点数目,k∈j1,T3j,T3<T2。/>中的第q行第c列的元素表示第q个站点和第c个站点之间的第k个客流量时序片段对的相似度。
继续以DTW算法计算站点间的相似度为例,将站点q的第i个客流量时序片段与站点c的第j个客流量时序片段之间的DTW相似度记为DTW(qi,cj),可以通过式(2)进行计算:
DTW(qi,cj)=diSt(qi,cj)+min[DTW(qi-1,cj-1),DTW(qi-1,cj),DTW(qi,cj-1)] (2)
其中,qi表示站点q的第i个客流量时序片段,cj表示站点c的第j个客流量时序片段,dist(qi,cj)表示计算qi和cj之间的对应时间点的客流量的余弦相似度的平均值。DTW(qi-1,cj-1)表示站点q的第i-1个客流量时序片段与站点c的第j-1个客流量时序片段之间的DTW相似度,DTW(qi-1,cj)表示站点q的第i-1个客流量时序片段与站点c的第j个客流量时序片段之间的DTW相似度,DTW(qi,cj-1)表示站点q的第i个客流量时序片段与站点c的第j-1个客流量时序片段之间的DTW相似度,minjj表示取前述三者中最小的一个。可以看出,DTW(qi,cj)考虑了之前时序片段的相似度计算结果,即时间片角度的站点间相似度需要进行迭代计算。
其他站点间的DTW相似度计算方式同理,于是可以得到前述多个站点两两之间的DTW相似度,进而可以生成图6中的(b)动态相似度图,记为该动态相似度图包括多个子相似度图。其中,每个子相似度图上的任意两个站点间的连线(实线代表是相邻站点、虚线代表非相邻站点)上的权值表示上述两个站点间的相应客流量时序片段对的相似度。
需要说明的是,上述多个邻接关系图可以是根据从AFC系统收集的乘客进出站数据而实时构建的。由前述内容可知,可以选择构建上述距离图、旅行时间图、静态OD图、动态OD图、静态相似度图、动态相似度图中部分或全部,以从多个不同的视角来构建站点间的时空相关性。对于N个站点来说,如果上述六种邻接关系图都进行构建,则总共可以有4个静态图和2个动态图,图的数量M=1+1+(1+T1)+(1+T3)=4+T1+T3。也就是说,总共有M张图来充分表达N个站点之间的多种时空关系,将上述图的邻接矩阵进行拼接,可以得到从而完成多图数据的构建。
3.客流预测模块130
客流预测模块130用于训练客流预测模型,并基于训练好的客流预测模型提供客流量预测、站点相似度预测、异常流量预警等功能。
应理解,客流预测模块130内部的单元可以有多种可能的划分方式,各个单元可以单独或者共同实现客流预测模块130的功能,本申请不做具体限定。图1是一种示例性的划分方式,客流预测模块130包括模型训练单元131和预测单元132,后文以此种划分方式为例介绍客流预测模块130的功能。其中,模型训练单元131用于基于历史客流数据训练客流预测模型,从而得到训练好的客流预测模型;预测单元132用于基于上述训练好的客流预测模型输出客流预测结果,进而基于输出的客流预测结果提供未来多步的进站/出站客流量预测、未来站点相似度预测、以及异常流量预警等功能。
上述客流预测模型包括空间特征提取层和时间特征提取层,它们分别可以包括一个或多个神经网络层。根据空间特征提取层和时间特征提取层,可以充分地从多图数据(多个邻接关系图)中提取时空特征,进而输出较为准确的客流预测结果。
关于客流预测模型的具体类型和结构,本申请实施例不做具体限定。例如,空间特征提取层可以是基于多图神经网络(multi-graph neural network,MGNN)实现的,时间特征提取层可以是基于门控卷积神经网络(gated convolutional neural network,GatedCNN)实现的,也可以是其他能实现时间特征提取的网络结构,如长短时记忆网络(long short-term memory,LSTM)。再如,客流预测模型可以基于图神经网络的多元时间序列预测(multivariate time series forecasting with graph neural networks,MTGNN)、时空图卷积神经网络(spatio-temporal graph convolutional networks,STGCN)或者GraphWaveNet等预测算法来实现。
为了便于描述,可以把客流量预测任务定形式化定义为:根据过去P个时间间隔的多个车站的历史客流数据,预测每个站点在未来Q个时间间隔的客流量。客流预测模型可以只预测进站客流量,也可以只预测出站客流量,还可以是进站客流量和出站客流量都进行预测。此处,将第t个时间间隔时N个车站的进出站客流表示为Xt∈RN×2,具体可以参见前述步骤S202中的相关介绍。也就是说,客流量预测任务可以描述为:jXt-P,...,Xt-1j→jXt,...,Xt+Qj。时间间隔的大小可以进行调节,即提供可配置的时间颗粒度下(例如5min、30min、1h)的客流量预测。需要说明的是,对于客流预测模型输出的客流预测结果,可以是一个或多个站点在一个或多个时间步的客流量预测结果,后文主要以客流预测模型输出的是所有站点在多个时间步的客流量预测结果为例进行描述。
具体的,首先将数据收集与处理模块110进行处理得到的历史客流特征数据以及多图数据构建模块120生成的多图数据,一起输入到上述客流预测模型中的空间特征提取层,充分挖掘不同视角下潜在的空间相关性,从而得到提取的空间特征。应理解,上述客流预测特征数据和多图数据均可以经过预处理之后再输入空间特征提取层,关于预处理的方式不做具体限定,例如,可以使用卷积神经网络(convolutional neural network,CNN)将客流量特征数据进行卷积计算,将特征映射到隐藏层,并且使用自定义的邻接矩阵标准化函数对多个邻接关系图的邻接矩阵进行标准化和稀疏化,然后再将预处理后的多种邻接关系图和上述隐藏层特征输入空间特征提取层。空间特征提取层提取得到空间特征后,将其输入时间特征提取层,由时间特征提取层来提取时间特征,提取得到的时间特征继续输入给堆叠的下一个空间特征提取层。也就是说,客流预测模型可以包括多个堆叠的空间特征提取层和时间特征提取层,通过多层堆叠使得客流预测模型能够提取到更深层次的时空特征、具有更强的学习能力。
需要说明的是,关于客流预测模型的训练和优化,本申请实施例不做具体限定。例如,在训练过程中,首先对模型进行初始化,设置好随机种子,输入预处理后的历史客流特征数据和多图数据,经由模型进行计算进而输出预测结果。使用L1范数损失函数(L1-loss)作为损失函数计算其性能损失,并使用自适应矩阵估计(adaptive moment estimation)Adam优化器和0.001学习率进行反向传播,迭代更新客流预测模型里的参数权重与梯度。在迭代过程中,使用权重延迟为0.1的动态学习率机制配合调节学习率,帮助更快更好的收敛到最佳模型。为了节省计算资源,可以设置最大200轮迭代和等待系数为10的早停机制。在迭代过程中根据性能迭代更新更优的模型,最后保存最佳的客流预测模型在客流量预测系统100中。在测试阶段可以调用本地保存的最佳的客流预测模型,输出客流预测结果,对其进行反转归一化,并通过计算输出评分报表以评估其预测效果。
在一种可能的实施例中,客流预测模型输出的客流预测结果为流量张量的形式,相较于向量,张量的维度可以更高。此处的流量张量是多个站点在多个时间步的预测客流量在二维向量空间下的表示方式,可以理解为【站点数目*时间步数目】这样的一个二维数组。其中,数组中的元素代表客流预测模型预测的相应站点在相应时间步的进站客流量/出站客流量,进而可以供给下游任务(如客流量预测、站点相似度预测、异常流量预警)使用。
下面分别对客流量预测、站点相似度预测和异常流量预警进行具体介绍:
1)客流量预测
应理解,由于客流预测模型的输入数据(多图数据和历史客流特征数据)是经过归一化的,所以此处需要对客流预测模型输出的流量张量进行反转归一化,即可以表达所有站点在未来多步的进站客流量和出站客流量的预测值。
在可能的实施例中,可以通过交互界面向用户展示所有站点在未来多个时间步的进站客流量和出站客流量的预测值,也可以根据用户的指定输出部分的预测结果。可选的,用户可以从站点、客流量类型(包括进站客流量和出站客流量)、时间步等多个维度去指定期望输出的预测结果,本申请实施例不具体限定。例如,用户指定要观察站点A在未来三个时间步的进站客流量的预测值,于是,客流预测模块130只会输出用户指定的上述内容。
2)站点相似度预测
基于上述训练好的客流预测模型输出的流量张量,可以提供未来站点相似度预测的功能。应理解,站点相似度预测旨在预测未来一定时间内的站点之间在客流量变化趋势上的相似性,可以作为城轨运力调度的重要参考,可帮助城轨运营管理人员设计和调整城轨交通的运营组织方案。
例如,对于多个不同的站点,如果预测出它们在未来同一个时间段内的客流量的相似度较高,则城轨运营管理人员可以针对相似性高的站点采用类似的管理方式,减轻城轨运营管理人员的管理策略指制定的难度和工作量。
再如,对于两个不同的站点,如果第一个站点在第一时间段内的客流量与第二个站点在第二个时间段内的客流量相似度较高(第二时段不同于第一时段),则城轨运营管理人员可以借鉴第一站点在第一时间段的运营管理方式来对第二时段的第二站点进行管理,可以减轻运营管理人员的管理策略设计及调整的工作量。
再如,如果城轨交通线路上有新加入的站点,且新加入的站点的历史客流数据还比较少,不方便通过客流量预测模型直接预测其未来的客流量(客流预测模型的输出不包括该新站点的预测客流量),则可以根据新加入的站点对应的少量历史客流数据计算其与旧站点的历史客流数据之间的相似度。若上述相似度的值满足设定条件(比如大于或等于预设值),则可以参考旧站点的未来客流预测结果作为新站点的未来客流预测结果。
可选的,用户可以指定需要比对的时间片段(可以包括一个或多个时间步),还可以指定目标站点(即待比对的站点,可以指定部分站点或全部站点)。此时,客流预测模块130可以从上述流量张量中取出该时间片段对应的时间步内目标站点的客流量预测结果,然后使用计算相似度的算法,如DTW算法、皮尔逊相关系数、闵式距离等方式中的一种或多种来计算目标站点之间的相似度,即可以从多个角度进行相似度的计算,还可以通过归一化以及对于不同类型的相似度赋予不同的权重的方式,最终求出目标站点之间的混合相似度。
上述皮尔逊相关系数是一种常用的线性相关系数,用于度量两个变量之间的相关性。请参见式(3),输入某两个不同站点各自对应的客流量时间序列,分别记为X和Y,X与Y的皮尔逊相关系数是指X和Y之间的协方差与X、Y的标准差的商,记为ρX,,其值介于-1与1之间,其绝对值越大表明X和Y的相关性越强。当ρX,Y>0时,表明X和Y正相关;当ρX,Y<0时,表明X和Y负相关;当ρX,y=0时,表明X和Y非线性相关。
上述闵式距离(即闵可夫斯基距离)是另一种常见的时空距离计算方式,其计算公式可以参见式(4),依据p值的不同拥有着不同的效果,通常可选的p值有1、2、∞等。例如,输入某两个站点各自对应的客流量时间序列,分别记为X和Y,假设p取2,X与Y的闵式距离可以通过式(4)进行计算,记为D(X,Y)。其中,X=(x1,x2,…,xn),Y=(y1,y2,…,yn),n表示时间序列X、Y的长度,xu表示X中的第u时刻的客流量值(预测值),yu表示Y中的第u时刻的客流量值(预测值),u∈j1,nj。
需要说明的是,由于通过上述DTW算法、皮尔逊相关系数、闵式距离等方式各自计算出的结果可能具有不同的数量级,因此,可以先对上述不同方式的计算结果进行归一化处理,以使得它们处于同一数量级,后续再进行加权求和,从而得到一个混合相似度。
例如,对于某两个站点,它们之间分别通过DTW算法、皮尔逊相关系数、闵式距离的方式所计算出的结果均可采用Z-score规范化方法进行归一化处理,计算公式可以参见式(5):
其中,μ、σ分别表示某指标R(可以是DTW算法、皮尔逊相关系数或闵式距离)的历史计算结果的均值和方差,Z(R)为上述两个站点之间计算出的指标R进行归一化后的结果。应理解,通过上述Z-score规范化方法能够将不同量级的数据转化为统一量度的Z-score值,以保证数据间的可比性,便于后续的加权求和。
在经过式(5)的归一化处理后,再通过式(6)的加权求和即可得到上述两个站点间的相似度(即混合相似度),记为SIM(X,Y):
SIM(X,Y)=w1Z(DTW(X,Y))+w2Z(ρ(X,Y))+w3Z(D(X,Y)) (6)
其中,DTW(X,Y)、ρ(X,Y)、D(X,Y)依次表示上述两个站点对应的客流量时间序列X和Y之间的DTW相似度、皮尔逊相关系数、闵式距离,Z(DTW(X,Y))、Z(ρ(X,Y))、Z(D(X,Y))依次表示上述三者通过Z-score方式进行归一化后的结果,w1、w2、w3依次为DTW相似度、皮尔逊相关系数、闵式距离对应的权重,上述权重可以根据实际应用场景进行调整,本申请实施例不具体限定。
在可能的实施例中,可以通过交互界面向乘客展示站点相似度预测的结果,还可以向城轨运营管理人员实时地展示站点相似度预测结果。例如,可以以分析报表的形式展示目标站点之间的相似度预测结果,其中,目标站点是用户指点的站点。
3)异常流量预警
基于客流预测模型预测的各站点的客流量,如果某个/某些站点的客流量预测结果超过计算规则所设定的流量阈值,则客流量预测系统100可以实时地向运营管理人员发出预警,从而提醒运营管理人员进行处理。
在一种可能的实施例中,对于任意一个站点,通过计算该站点在一个特定时间窗口内的各个时间步的历史客流量(历史进站客流量或者历史出站客流量)的平均值作为基准,并设置一个常数参数(可调整),将上述平均值乘上常数参数即可作为该站点对应的流量阈值。其中,上述特定时间窗口可以根据需要进行调整,比如,可以设置为工作日的早高峰时段、工作日的晚高峰时段或者周末的晚间时段等等,不具体限定。可选的,还可以根据各个站点新增的历史客流量数据,重新计算上述平均值,进而动态地更新各站点对应的流量阈值。对于上述特定时间窗内的某个时间步,如果客流预测模型输出的该站点在该时间步的客流量预测结果超过了该站点对应的流量阈值,则发出预警,以提醒用户该站点在未来的该时间步的客流量可能会出现异常。
例如,假设时间步的长度为10分钟,常数参数设置为2,工作日的早高峰为7:00-9:00,即早高峰时段包括12个时间步。对于任意一个站点,取它在过去十五个工作日(可调整)的早高峰的历史客流数据,计算在早高峰时段的各个时间步的历史客流量(即区分不同站点之间的差异,但不区分不同时间步)的平均值,再用上述平均值乘上常数参数从而确定该站点对应的流量阈值。若该站点在未来的工作日早高峰时段中的某个时间步的预测客流量会超过该站点对应的流量阈值,则可以提前发出预警,以提醒运营管理人员等提前准备好相应的应对措施,制定合适的调度计划(如增加发车数量)以缓解未来可能出现的客流压力,尽可能地降低未来拥堵事件发生的概率。
在另一种可能的实施例中,对于每个一个站点的不同时间步可以设置不同的流量阈值,也就是说,不仅考虑了站点之间的差异性,还考虑了同一站点的客流量在每日的不同时间步的差异性。对于任意一个站点,通过计算该站点在每一日中的某个时间步的历史客流量的平均值作为基准,用上述平均值乘上一个常数参数(可调整)即可作为该站点在该时间步的流量阈值。
例如,假设时间步的长度为10分钟,城轨运营时间为早上6:00-23:30,即每日城轨运营时间包括105个时间步,常数参数设置为1.5。对于任意一个站点的某个时间步,取它在过去十五个工作日(可调整)的历史客流数据,计算它在每日该时间步的历史客流量的平均值,然后用平均值乘上常数参数,从而确定该站点在该时间步所对应的流量阈值。该站点在其他时间步所对应的流量阈值的计算方式同理,这里不重复介绍。若该站点在未来的某个时间步的预测客流量会超过该站点在该时间步所对应的流量阈值,则发出预警,以提醒运营管理人员提前准备好相应的应对措施,制定合适的调度计划以缓解未来可能出现的客流压力。
可以理解的是,由于上述两种实施例中的常数参数(相当于是指定了发出预警的涨幅)是统一设置的,因此,对于历史客流量通常较少的站点和时间步,预测客流量相对于历史平均客流量的涨幅容易偏高,即较容易达到常数参数所对应的涨幅。但是即使达到了该涨幅,预测客流量的数值也可能不是很高,其实不需要进行预警,但此时却由于达到了规定涨幅导致发出了预警,导致给运营管理人员造成困扰。为了避免上述情况,在可能的实施例中,可以在前面两种实施例的基础上设置发出预警的客流量下限。如果某个站点在某个时间步的预测客流量超过了相应的流量阈值(即达到了常数参数规定的涨幅),却没有超过发出预警的客流量下限,则不需要对其发出预警,避免给运营管理人员造成干扰。只有上述预测客流量超过了相应的流量阈值且超过发出预警的客流量下限时,才需要发出预警。例如,假设发出预警的客流量下限设置为100人,只有站点的预测客流量超过相应的预警阈值且超过该客流量下限时,客流量预测系统100才会发出预警。
在另一种可能的实施例中,流量阈值可以是用户通过交互界面主动向客流量预测系统100设置的,或者是客流量预测系统100默认设置的,可以针对不同站点和/或不同时间步设置相应的流量阈值。
关于上述发出预警的方式,本申请实施例不具体限定。
例如,图7示例性地给出了某个站点在未来某一个工作日的客流量预测结果的波形图,根据前述告警规则,当日早高峰时段中的超出相应流量阈值的部分被框选出来,以作为告警。同理,当日晚高峰时段中的超出相应流量阈值的部分也被框选出来,以作为告警。根据前述告警规则,当日19:40-21:40时段的客流量预测结果与因为超过了相应的流量阈值被框选出来,以作为告警。
再如,基于客流预测模型输出的流量张量,根据前述告警规则判断是否有需要发出预警,输出相应的告警结果。告警结果记为W∈RN×Q,W是一个N×Q的二维数组,其中,t表示第t个时间步,W中的第i行第j列的元素W(i,j)表示第i个站点在第j个时间步的告警情况,若该元素的值为0则表示无告警,若该元素的值为1则表示告警。可以直接将上述告警结果W展示给用户,也可以在得到上述告警结果W后,针对值为1的元素对应的站点和时间步发出预警,以提示运营管理人员及时处理。
基于上述系统架构,下面介绍本申请提供的客流量预测方法的实施例。
请参见图8,图8是本申请实施例中提供的一种客流量预测方法的流程示意图,可以包括如下步骤:
S801:获取多个站点的历史客流数据和站点相关信息。
具体的,可以获取多个站点在某种时间粒度(或者说时间间隔)下的历史客流数据以及上述多个站点的站点相关信息。
其中,上述多个站点可以是某一地理区域内的交通站点,例如,可以是某一城市内的部分或所有地铁站点,还可以是某一个区内的部分或所有轻轨站点,等等。上述时间粒度可以根据需要进行调整,例如是5min、30min、1h等,本申请实施例不具体限定。上述历史客流数据可以包括历史进站客流数据和历史出站客流数据中的一种或多种,也不具体限定。
其中,站点相关信息是指站点相关的信息,可以包括站点基础信息、运行时间信息中的一种或多种,关于站点基础信息和运行时间信息请参见前文介绍,此处不赘述。
在可能的实施例中,数据收集与处理模块110可以从AFC系统采集到各个站点的乘客进出站数据并对其进行处理,从而得到各个站点的历史客流数据,具体请参见前文对于数据收集与处理模块110的相关介绍,此处不赘述。
S802:根据上述历史客流数据和站点相关信息生成多个邻接关系图,多个邻接关系图分别用于表示上述多个站点之间不同的时空关系。
在一种可能的实施例中,上述多个邻接关系图可以包括距离图、旅行时间图和动态相似度图。
上述距离图用于表示上述多个站点两两之间的最短站点距离的大小关系。
上述旅行时间图用于表示上述多个站点两两之间的最短旅行时间的大小关系。
上述动态相似度图用于表示上述多个站点两两之间的对应的客流量时序片段的相似度,第二站点的客流量时序片段为根据第二站点的历史客流数据生成的第二站点对应的客流量时间序列中的时序片段,第二站点为上述多个站点中的任意一个。应理解,相较于静态相似度图,动态相似度图考虑了站点间的相似度在不同时间片上的差异,能够在时间片的角度上更精确地体现上述多个站点之间的时空相关性。
在可能的实施例中,上述多个邻接关系图还可以包括OD图和/或静态时间相似度图。其中,OD图可以包括静态OD图和动态OD图中的一种或多种,相似度图可以包括静态相似度图和动态相似度图中的一种或多种。
上述静态OD图用于表示在上述多个站点的历史客流数据对应的时间范围内,上述多个站点两两之间的OD客流量。
上述动态OD图用于表示在多个时间片中的每个时间片内,上述多个站点两两之间的OD客流量,其中,历史时间窗是指上述多个站点的历史客流数据对应的时间范围,历史时间窗内可以划分时间片,时间片的大小可以根据需要进行调节,不具体限定,历史时间窗里面包括上述多个时间片。应理解,相较于静态OD图,动态OD图考虑了OD客流量在不同时间片上的差异性,能够在时间片的角度上更精确地体现上述多个站点之间的时空相关性。
上述静态相似度图用于表示在历史时间窗中上述多个站点两两之间在客流量变化趋势上的相似性,其中,历史时间窗是指上述多个站点的历史客流数据对应的时间范围。
关于上述距离图、旅行时间图、静态OD图、动态OD图、静态相似度图、动态相似度图的其他内容,请参加前文对于多图数据构建模块120的相关介绍,这里不过多重复。
S803:根据历史客流数据和多个邻接关系图预测得到第一站点在第一时段的第一客流量。
其中,第一站点为需要进行客流预测的站点,第一站点为前述多个站点中的站点,包括至少一个站点;第一时段为需要预测的时段,可以包括一个或多个时间步;第一客流量即预测的客流量,可以包括预测进站客流量和/或预测出站客流量中的一种或多种类型,也就是说,可以选择对进站客流量和/或出站客流量进行预测。
可选的,用户可以根据需要指定第一站点、第一时段、预测类型(选择预测进站客流量和/或出站客流量)中的一项或多项,于是客流量预测系统100可以根据用户的指定进行客流预测,从而输出第一站点在第一时段的预测客流量。或者,用户不需要主动指定,客流量预测系统100可以默认预测并输出第一站点在第一时段的第一客流量,其中,第一站点可以是部分站点或全部站点。
在可能的实施例中,根据历史客流数据和多个邻接关系图还可以预测得到第三站点在第二时段的第二客流量,其中,第三站点是上述多个站点中不同于第一站点的站点,第二时段与前述第一时段可以是相同或不同的时段,第二客流量是预测的客流量,与前述第一客流量是相同的类型;然后,根据第一客流量和第二客流量预测第一站点和第三站点之间的相似度,即预测第一站点在第一时段的第一客流量与第三站点在第二时段的第二客流量在变化趋势上的相似度。关于站点间相似度预测的具体内容,请参见前文对客流预测模块130的相关介绍,这里不赘述。
可选的,可以基于DTW、闵式距离、皮尔逊相关系数中的一种或多种不同的方式来计算第一站点和第三站点间的相似度。应理解,通过多种不同方式综合计算出的相似度会更加准确,能够从多个不同的角度体现站点之间的相似程度。
在可能的实施例中,可以获取流量阈值,然后根据流量阈值和第一客流量确定是否发出预警。例如,如果第一客流量超过流量阈值,则确定需要发出预警,可以通过交互界面向用户预警第一站点在第一时段的第一客流量;如果第一客流量不超过流量阈值,则确定不需要发出预警。关于发出预警所依据的具体规则以及流量阈值的设置,请参见前文对于异常流量预警的相关介绍,这里不赘述。
综上所述,在本申请实施例的客流量预测方法中,构建了多个邻接关系图以表示站点之间多种不同的时空关系,即从多个视角提取站点间更为丰富的时空相关性,然后基于多个邻接关系图进行客流预测,从而可以提升客流预测的精准度。可以理解的是,基于准确的客流量预测结果可以帮助解决许多实际问题,对于管理城市交通有着不可或缺的战略作用。例如,准确的客流预测能够为交通运营组织方案的设计和调整提供精准的数据支持、提供应急指挥建议、降低人力成本。运营管理人员可以按照预测出来的客流量协调线路运力、合理调度交通运输资源以满足乘客出行需求,从而避免高峰拥挤、平峰浪费等运营问题,实现综合节能。还可以避免客流量激增造成的旅客拥堵和滞留,从而提升乘客的出行体验。
需要说明的是,图8的客流量预测方法除了应用于城轨客流量预测场景,还可以应用于各种路面交通客流预测场景(路面交通也具有多个站点),如出租车出行需求预测、城市网格人流进出预测、城市路面断面流量预测等等,本申请实施例不做具体限定。
请参见图9,图9是本申请实施例提供的一种客流量预测系统100的结构示意图,包括获取模块901、生成模块902和预测模块903。
获取模块901用于获取多个站点的历史客流数据和站点相关信息。
生成模块902用于根据所述多个站点的历史客流数据和所述站点相关信息生成多个邻接关系图,其中,所述多个邻接关系图分别用于表示所述多个站点之间不同的时空关系。
预测模块903用于根据所述多个站点的历史客流数据和所述多个邻接关系图预测得到第一站点在第一时段的第一客流量,其中,所述多个站点包括所述第一站点。
可选的,上述多个站点的历史客流数据包括历史进站客流数据和历史出站客流数据中的一种或多种,上述第一客流量包括预测进站客流量和预测出站客流量中的一种或多种。
在可能实施例中,上述多个邻接关系图包括距离图、旅行时间图OD图和动态相似度图,其中,所述距离图用于表示所述多个站点两两之间的最短站点距离的大小关系,所述旅行时间图用于表示所述多个站点两两之间的最短旅行时间的大小关系,所述动态相似度图用于表示所述多个站点两两之间的对应的客流量时序片段的相似度,第二站点的客流量时序片段为根据所述第二站点的历史客流数据生成的所述第二站点对应的客流量时间序列中的时序片段,所述第二站点为所述多个站点中的任意一个。
在可能的实施例中,上述多个邻接关系图还包括起点-终点图和/或静态时间相似度图,其中,所述起点-终点图用于表示所述多个站点两两之间的起点-终点客流量,所述静态相似度图用于表示在所述多个站点的历史客流数据对应的时间范围内所述多个站点两两之间在客流量变化趋势上的相似度。
可选的,上述OD图包括静态OD图和动态OD图中的一种或多种,其中,静态OD图用于表示在多个站点的历史客流数据对应的时间范围内多个站点两两之间的OD客流量,动态OD图用于表示在多个时间片中的每个时间片内多个站点两两之间的OD客流量,多个站点的历史客流数据对应的时间范围包括多个时间片。
可选的,上述相似度图包括静态相似度图和动态相似度图中的一种或多种,其中,静态相似度图用于表示在多个站点的历史客流数据对应的时间范围内多个站点两两之间在客流量变化趋势上的相似度,动态相似度图用于表示在多个时间片中的每个时间片内多个站点两两之间在客流量变化趋势上的相似度,多个站点的历史客流数据对应的时间范围包括多个时间片。
可选的,上述预测模块903还用于:根据前述多个站点的历史客流数据和多个邻接关系图预测得到第三站点在第二时段的第二客流量,其中,上述多个站点包括第一站点和第三站点;根据第一客流量和第二客流量预测第一站点和第三站点之间的相似度。
可选的,在上述第一站点和第三站点之间的相似度是预测模块903基于动态时间规整算法、闵式距离、皮尔逊相关系数中的一种或多种确定的。
可选的,该系统还包括预警模块904;上述获取模块901还用于获取流量阈值,预警模块904用于根据前述第一客流量和流量阈值确定是否发出预警。
需要说明的是,上述获取模块901、生成模块902、预测模块903和预警模块904均可以通过软件实现,或者可以通过硬件实现。示例性的,接下来以生成模块902为例,介绍生成模块902的实现方式。类似的,上述其他模块的实现方式可以参考生成模块902的实现方式。
模块作为软件功能单元的一种举例,生成模块902可以包括运行在计算实例上的代码。其中,计算实例可以包括物理主机(计算设备)、虚拟机、容器中的至少一种。进一步地,上述计算实例可以是一台或者多台。例如,生成模块902可以包括运行在多个主机/虚拟机/容器上的代码。需要说明的是,用于运行该代码的多个主机/虚拟机/容器可以分布在相同的区域(region)中,也可以分布在不同的region中。进一步地,用于运行该代码的多个主机/虚拟机/容器可以分布在相同的可用区(availability zone,AZ)中,也可以分布在不同的AZ中,每个AZ包括一个数据中心或多个地理位置相近的数据中心。其中,通常一个region可以包括多个AZ。
同样,用于运行该代码的多个主机/虚拟机/容器可以分布在同一个虚拟私有云(virtual private cloud,VPC)中,也可以分布在多个VPC中。其中,通常一个VPC设置在一个region内,同一region内两个VPC之间,以及不同region的VPC之间跨区通信需在每个VPC内设置通信网关,经通信网关实现VPC之间的互连。
模块作为硬件功能单元的一种举例,生成模块902可以包括至少一个计算设备,如服务器等。或者,生成模块902也可以是利用专用集成电路(application-specificintegrated circuit,ASIC)实现、或可编程逻辑器件(programmable logic device,PLD)实现的设备等。其中,上述PLD可以是复杂程序逻辑器件(complex programmable logicaldevice,CPLD)、现场可编程门阵列(field-programmable gate array,FPGA)、通用阵列逻辑(generic array logic,GAL)或其任意组合实现。
生成模块902包括的多个计算设备可以分布在相同的region中,也可以分布在不同的region中。生成模块902包括的多个计算设备可以分布在相同的AZ中,也可以分布在不同的AZ中。同样,生成模块902包括的多个计算设备可以分布在同一个VPC中,也可以分布在多个VPC中。其中,所述多个计算设备可以是服务器、ASIC、PLD、CPLD、FPGA和GAL等计算设备的任意组合。
需要说明的是,在其他实施例中,上述获取模块901、生成模块902、预测模块903和预警模块904均可以用于执行图8的客流量预测方法中的任意步骤,上述这些模块各自负责实现的步骤可根据需要指定,通过它们分别实现图8的客流量预测方法中不同的步骤来实现客流量预测系统900的全部功能。
还要说明的是,上述客流量预测系统900可以对应与图1中的客流量预测系统100,具有客流量预测系统100的部分或全部功能/模块,用于实现图8的客流量预测方法的任一实施例,具体请参见上文描述,这里不赘述。例如,获取模块901可以对应与图1中的数据收集与处理模块110,生成模块902可以对应与图1中的多图数据构建模块120,预测模块903和预警模块904可以对应于图1中的客流预测模块130。客流量预测系统900仅是以上述各功能模块的划分进行举例说明,在实际的应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将客流量预测系统900的内部结构划分成其他不同的功能模块,以完成以上描述的全部或者部分功能。
请参见图10,本申请还提供一种计算设备1000,包括总线1002、处理器1004、存储器1006和通信接口1008。处理器1004、存储器1006和通信接口1008之间通过总线1002通信。计算设备1000可以是服务器、终端设备等。应理解,本申请不限定计算设备1000中的处理器、存储器的个数。
总线1002可以是外设部件互连标准(peripheral component interconnect,PCI)总线或扩展工业标准结构(extended industry standard architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一条线表示,但并不表示仅有一根总线或一种类型的总线。总线1002可包括在计算设备1000各个部件(例如,存储器1006、处理器1004、通信接口1008)之间传送信息的通路。
处理器1004可以包括中央处理器(central processing unit,CPU)、图形处理器(graphics processing unit,GPU)、微处理器(micro processor,MP)或者数字信号处理器(digital signal processor,DSP)等处理器中的任意一种或多种。
存储器1006可以包括易失性存储器(volatile memory),例如随机存取存储器(random access memory,RAM)。处理器1004还可以包括非易失性存储器(non-volatilememory),例如只读存储器(read-only memory,ROM),快闪存储器,机械硬盘(hard diskdrive,HDD)或固态硬盘(solid state drive,SSD)。
存储器1006中存储有可执行的程序代码。处理器1004执行该可执行的程序代码以分别实现图9中的获取模块901、生成模块902、预测模块903和预警模块904的功能,从而实现图8的客流量预测方法。或者,处理器1004执行该可执行的程序代码以分别实现图9中的获取模块901、生成模块902、预测模块903和预警模块904的功能,从而实现图8的客流量预测方法。也即,存储器1006上存有用于执行图8的客流量预测方法的指令。
通信接口1008使用例如但不限于网络接口卡、收发器一类的收发模块,来实现计算设备1000与其他设备或通信网络之间的通信。
本申请实施例还提供了一种计算设备集群。该计算设备集群包括至少一台计算设备。该计算设备可以是服务器,例如是中心服务器、边缘服务器,或者是本地数据中心中的本地服务器。在一些实施例中,计算设备也可以是台式机、笔记本电脑或者智能手机等终端设备。
如图11所示,所述计算设备集群包括至少一个计算设备1000。计算设备集群中的一个或多个计算设备1000中的存储器1006中可以存有相同的用于执行图8的客流量预测方法的指令。
在一些可能的实现方式中,该计算设备集群中的一个或多个计算设备1000的存储器1006中也可以分别存有用于执行图8的客流量预测方法的部分指令。换言之,一个或多个计算设备1000的组合可以共同执行用于实现图8的客流量预测方法的指令。
需要说明的是,计算设备集群中的不同的计算设备1000中的存储器1006可以存储不同的指令,分别用于执行图9的客流量预测系统900的部分功能。也即,不同的计算设备1000中的存储器1006存储的指令可以实现图9的客流量预测系统900中的一个或多个模块的功能。
在一些可能的实现方式中,计算设备集群中的一个或多个计算设备可以通过网络连接。其中,所述网络可以是广域网或局域网等等。图12示出了一种可能的实现方式,两个计算设备1000A和1000B之间通过网络进行连接。具体地,通过各个计算设备中的通信接口与所述网络进行连接。在这一类可能的实现方式中,计算设备1000A中的存储器1006中存有执行获取模块901和生成模块902的功能的指令。同时,计算设备1000B中的存储器1006中存有执行资源预测模块903的功能的指令。
应理解,图12中示出的计算设备1000A的功能也可以由多个计算设备1000共同完成。同样,计算设备1000B的功能也可以由多个计算设备1000共同完成。
本申请实施例还提供了另一种计算设备集群。该计算设备集群中各计算设备之间的连接关系可以类似的参考图12所述计算设备集群的连接方式。不同的是,该计算设备集群中的一个或多个计算设备1000中的存储器1006中可以存有相同的用于执行图8的客流量预测方法的指令。
在一些可能的实现方式中,该计算设备集群中的一个或多个计算设备1000的存储器1006中也可以分别存有用于执行图8的客流量预测方法的部分指令。换言之,一个或多个计算设备1000的组合可以共同执行用于执行图8的客流量预测方法的指令。
本申请实施例还提供了一种包含指令的计算机程序产品。所述计算机程序产品可以是包含指令的,能够运行在计算设备上或被储存在任何可用介质中的软件或程序产品。当所述计算机程序产品在至少一个计算设备上运行时,使得至少一个计算设备执行图8的客流量预测方法。
本申请实施例还提供了一种计算机可读存储介质。所述计算机可读存储介质可以是计算设备能够存储的任何可用介质或者是包含一个或多个可用介质的数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘)等。该计算机可读存储介质包括指令,所述指令指示计算设备执行图8的客流量预测方法。
需要说明的是,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的保护范围。
还需要说明的是,在本发明实施例中,“当/在…时”、“若”以及“如果”均指在某种客观情况下相应的装置、系统或设备做出相应的处理,并非是限定时间,且也不要求装置、系统或设备实现时一定要有判断的动作,也不意味着存在其它限定。
Claims (19)
1.一种客流量预测方法,其特征在于,所述方法包括:
获取多个站点的历史客流数据和站点相关信息;
根据所述多个站点的历史客流数据和所述站点相关信息生成多个邻接关系图,其中,所述多个邻接关系图分别用于表示所述多个站点之间不同的时空关系;
根据所述多个站点的历史客流数据和所述多个邻接关系图预测得到第一站点在第一时段的第一客流量,其中,所述多个站点包括所述第一站点。
2.根据权利要求1所述的方法,其特征在于,所述多个站点的历史客流数据包括历史进站客流数据和历史出站客流数据中的一种或多种,所述第一客流量包括预测进站客流量和预测出站客流量中的一种或多种。
3.根据权利要求1或2所述的方法,其特征在于,所述多个邻接关系图包括距离图、旅行时间图和动态相似度图,其中,所述距离图用于表示所述多个站点两两之间的最短站点距离的大小关系,所述旅行时间图用于表示所述多个站点两两之间的最短旅行时间的大小关系,所述动态相似度图用于表示所述多个站点两两之间的对应的客流量时序片段的相似度,第二站点的客流量时序片段为根据所述第二站点的历史客流数据生成的所述第二站点对应的客流量时间序列中的时序片段,所述第二站点为所述多个站点中的任意一个。
4.根据权利要求3所述的方法,其特征在于,所述多个邻接关系图还包括起点-终点图和/或静态时间相似度图,其中,所述起点-终点图用于表示所述多个站点两两之间的起点-终点客流量,所述静态相似度图用于表示在所述多个站点的历史客流数据对应的时间范围内所述多个站点两两之间在客流量变化趋势上的相似度。
5.根据权利要求4所述的方法,其特征在于,所述起点-终点图包括静态起点-终点图和动态起点-终点图中的一种或多种,其中,所述静态起点-终点图用于表示在所述多个站点的历史客流数据对应的时间范围内所述多个站点两两之间的起点-终点客流量,所述动态起点-终点图用于表示在多个时间片中的每个时间片内所述多个站点两两之间的起点-站点客流量,所述多个站点的历史客流数据对应的时间范围包括所述多个时间片。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
根据所述多个站点的历史客流数据和所述多个邻接关系图预测得到第三站点在第二时段的第二客流量,其中,所述多个站点包括所述第一站点和所述第三站点;
根据所述第一客流量和所述第二客流量预测所述第一站点和所述第三站点之间的相似度。
7.根据权利要求6所述的方法,其特征在于,所述第一站点和所述第三站点之间的相似度是基于动态时间规整算法、闵式距离、皮尔逊相关系数中的一种或多种确定的。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述方法还包括:
获取流量阈值;
根据所述第一客流量和所述流量阈值确定是否发出预警。
9.一种客流量预测系统,其特征在于,包括:
获取模块,用于获取多个站点的历史客流数据和站点相关信息;
生成模块,用于根据所述多个站点的历史客流数据和所述站点相关信息生成多个邻接关系图,其中,所述多个邻接关系图分别用于表示所述多个站点之间不同的时空关系;
预测模块,用于根据所述多个站点的历史客流数据和所述多个邻接关系图预测得到第一站点在第一时段的第一客流量,其中,所述多个站点包括所述第一站点。
10.根据权利要求9所述的系统,其特征在于,所述多个站点的历史客流数据包括历史进站客流数据和历史出站客流数据中的一种或多种,所述第一客流量包括预测进站客流量和预测出站客流量中的一种或多种。
11.根据权利要求9或10所述的系统,其特征在于,所述多个邻接关系图包括距离图、旅行时间图和动态相似度图,其中,所述距离图用于表示所述多个站点两两之间的最短站点距离的大小关系,所述旅行时间图用于表示所述多个站点两两之间的最短旅行时间的大小关系,所述动态相似度图用于表示所述多个站点两两之间的对应的客流量时序片段的相似度,第二站点的客流量时序片段为根据所述第二站点的历史客流数据生成的所述第二站点对应的客流量时间序列中的时序片段,所述第二站点为所述多个站点中的任意一个。
12.根据权利要求11所述的系统,其特征在于,所述多个邻接关系图还包括起点-终点图和/或静态时间相似度图,其中,所述起点-终点图用于表示所述多个站点两两之间的起点-终点客流量,所述静态相似度图用于表示在所述多个站点的历史客流数据对应的时间范围内所述多个站点两两之间在客流量变化趋势上的相似度。
13.根据权利要求12所述的系统,其特征在于,所述起点-终点图包括静态起点-终点图和动态起点-终点图中的一种或多种,其中,所述静态起点-终点图用于表示在所述多个站点的历史客流数据对应的时间范围内所述多个站点两两之间的起点-终点客流量,所述动态起点-终点图用于表示在多个时间片中的每个时间片内所述多个站点两两之间的起点-站点客流量,所述多个站点的历史客流数据对应的时间范围包括所述多个时间片。
14.根据权利要求9至13中任一项所述的系统,其特征在于,所述预测模块还用于:
根据所述多个站点的历史客流数据和所述多个邻接关系图预测得到第三站点在第二时段的第二客流量,其中,所述多个站点包括所述第一站点和所述第三站点;
根据所述第一客流量和所述第二客流量预测所述第一站点和所述第三站点之间的相似度。
15.根据权利要求14所述的系统,其特征在于,所述第一站点和所述第三站点之间的相似度是基于动态时间规整算法、闵式距离、皮尔逊相关系数中的一种或多种确定的。
16.根据权利要求9至15中任一项所述的系统,其特征在于,所述系统还包括预警模块;
所述获取模块还用于获取流量阈值,所述预警模块用于根据所述第一客流量和所述流量阈值确定是否发出预警。
17.一种计算设备集群,其特征在于,包括至少一个计算设备,每个计算设备包括处理器和存储器;
所述至少一个计算设备的处理器用于执行所述至少一个计算设备的存储器中存储的指令,以使得所述计算设备集群执行如权利要求1-8中任一项所述的方法。
18.一种计算机可读存储介质,其特征在于,包括计算机程序指令,当所述计算机程序指令由计算设备集群执行时,所述计算设备集群执行如权利要求1-8中任一项所述的方法。
19.一种包含指令的计算机程序产品,其特征在于,当所述指令被计算设备集群运行时,使得所述计算设备集群执行如权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211490517.4A CN118153724A (zh) | 2022-11-25 | 2022-11-25 | 客流量预测方法、系统、计算设备集群、及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211490517.4A CN118153724A (zh) | 2022-11-25 | 2022-11-25 | 客流量预测方法、系统、计算设备集群、及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118153724A true CN118153724A (zh) | 2024-06-07 |
Family
ID=91295296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211490517.4A Pending CN118153724A (zh) | 2022-11-25 | 2022-11-25 | 客流量预测方法、系统、计算设备集群、及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118153724A (zh) |
-
2022
- 2022-11-25 CN CN202211490517.4A patent/CN118153724A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhu et al. | A probabilistic passenger-to-train assignment model based on automated data | |
US11176812B2 (en) | Real-time service level monitor | |
WO2014061111A1 (ja) | 交通分析システム | |
Kato et al. | Comparative analysis of transit assignment: evidence from urban railway system in the Tokyo Metropolitan Area | |
Nagaraj et al. | Passenger flow prediction in bus transportation system using deep learning | |
JP6895325B2 (ja) | 交通需要予測装置、交通需要予測方法、及び交通需要予測プログラム | |
Pei et al. | PAC: partial area clustering for re-adjusting the layout of traffic stations in city’s public transport | |
CN111784049B (zh) | 一种旅客流失时间预测方法及装置 | |
CN106529711A (zh) | 用户行为预测方法及装置 | |
CN107610282A (zh) | 一种公交客流统计系统 | |
Yap et al. | Taking the path less travelled: Valuation of denied boarding in crowded public transport systems | |
Liu et al. | Forecast and early warning of regional bus passenger flow based on machine learning | |
Pettet et al. | Hierarchical planning for resource allocation in emergency response systems | |
Mohri et al. | Airline hub-and-spoke network design based on airport capacity envelope curve: A practical view | |
Chen et al. | Computation on bus delay at stops in Beijing through statistical analysis | |
CN110021161B (zh) | 一种交通流向的预测方法及系统 | |
CN114580751B (zh) | 空港到港旅客疏散时间预测方法、系统、存储介质及终端 | |
JP5214759B2 (ja) | 混雑度推定装置及び混雑度推定プログラム | |
Rashidi et al. | Estimating bus dwell time: A review of the literature | |
Su et al. | Data‐Driven Method for Passenger Path Choice Inference in Congested Subway Network | |
CN108230670B (zh) | 预测在给定时间段给定地点出现的移动体数的方法和装置 | |
CN118153724A (zh) | 客流量预测方法、系统、计算设备集群、及存储介质 | |
Ingvardson et al. | Analysing improvements to on-street public transport systems: a mesoscopic model approach | |
Nguyen et al. | Understanding Determinants of Making Airline Entry and Exit Decisions: Application of Logit Models | |
Paul et al. | Public Transportation Demand Analysis: A Case Study of Metropolitan Lagos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication |