CN117591919B - 客流预测方法、装置、电子设备和存储介质 - Google Patents
客流预测方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117591919B CN117591919B CN202410063382.6A CN202410063382A CN117591919B CN 117591919 B CN117591919 B CN 117591919B CN 202410063382 A CN202410063382 A CN 202410063382A CN 117591919 B CN117591919 B CN 117591919B
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- flow data
- numerical
- feature extraction
- input information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000012549 training Methods 0.000 claims abstract description 54
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims description 110
- 238000012545 processing Methods 0.000 claims description 18
- 230000004927 fusion Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 18
- 230000006870 function Effects 0.000 description 31
- 210000002569 neuron Anatomy 0.000 description 31
- 238000004422 calculation algorithm Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 13
- 230000006872 improvement Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 7
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 6
- 238000002790 cross-validation Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000002776 aggregation Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000002902 bimodal effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 238000002759 z-score normalization Methods 0.000 description 2
- 241000736199 Paeonia Species 0.000 description 1
- 235000006484 Paeonia officinalis Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Evolutionary Biology (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开涉及客流预测方法、装置、电子设备和存储介质。该客流预测方法包括:获取目标站点的样本客流数据;对样本客流数据进行预处理,获得待构建客流预测模型的分类型输入信息和数值型输入信息;将分类型输入信息和数值型输入信息输入至待构建客流预测模型中,获得预测客流数据;若基于预测客流数据和样本客流数据的标签客流数据确定的待构建客流预测模型的损失未满足收敛条件,基于预测客流数据和标签客流数据更新待构建客流预测模型;否则,确定待构建客流预测模型为目标站点的目标客流预测模型;利用目标客流预测模型预测目标站点的客流。本公开能够从多维度分析客流的影响因素,且在训练过程中避免出现特征丢失,从而提高模型预测准确度。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及客流预测方法、装置、电子设备和存储介质。
背景技术
近年来,轨道交通凭着运量大、污染小、准点率高、舒适度高的优势得到迅速发展,有效地缓解了中国大城市的交通拥堵问题。在当前轨道交通线网规模逐年扩大、客流管控需求不断凸显的背景下,短时客流预测的重要性正在逐步显现。
相关技术中,常见的客流预测方法对客流的影响因素的研究不够充分,在确定多维度的影响因素后,传统的预测模型在训练过程中荣誉出现特征丢失的情况,影响预测精度。
发明内容
有鉴于此,本公开实施例提供了一种客流预测方法、装置、电子设备和存储介质,以解决相关技术中存在的问题。
本公开实施例的第一方面,提供了一种客流预测方法,包括:
获取目标站点的样本客流数据;
对所述样本客流数据进行预处理,获得待构建客流预测模型的分类型输入信息和数值型输入信息;
将所述分类型输入信息和所述数值型输入信息输入至所述待构建客流预测模型中,获得预测客流数据;
若基于所述预测客流数据和所述样本客流数据的标签客流数据确定的所述待构建客流预测模型的损失未满足收敛条件,基于所述预测客流数据和所述标签客流数据更新所述待构建客流预测模型;否则,确定待构建客流预测模型为所述目标站点的目标客流预测模型;
利用所述目标客流预测模型预测所述目标站点的客流。
本公开实施例的第二方面,提供了一种客流预测装置,包括:
获取模块,用于获取目标站点的样本客流数据;
预处理模块,用于对所述样本客流数据进行预处理,获得待构建客流预测模型的分类型输入信息和数值型输入信息;
训练模块,用于将所述分类型输入信息和所述数值型输入信息输入至所述待构建客流预测模型中,获得预测客流数据;
训练模块还用于若基于所述预测客流数据和所述样本客流数据的标签客流数据确定的所述待构建客流预测模型的损失未满足收敛条件,基于所述预测客流数据和所述标签客流数据更新所述待构建客流预测模型;否则,确定待构建客流预测模型为所述目标站点的目标客流预测模型;
预测模块,用于利用所述目标客流预测模型预测所述目标站点的客流。
本公开实施例的第三方面,提供了一种电子设备,包括:
至少一个处理器;
用于存储至少一个处理器可执行指令的存储器;
其中,至少一个处理器用于执行指令,以实现上述方法的步骤。
本公开实施例的第四方面,提供了一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述方法的步骤。
本公开实施例采用的上述至少一个技术方案能够达到以下有益效果:通过获取目标站点的样本客流数据;对样本客流数据进行预处理,获得待构建客流预测模型的分类型输入信息和数值型输入信息;将分类型输入信息和数值型输入信息输入至待构建客流预测模型中,获得预测客流数据;若基于预测客流数据和样本客流数据的标签客流数据确定的待构建客流预测模型的损失未满足收敛条件,基于预测客流数据和标签客流数据更新待构建客流预测模型;否则,确定待构建客流预测模型为目标站点的目标客流预测模型;利用目标客流预测模型预测目标站点的客流,能够综合考虑分类型输入信息和数值型输入信息,从多维度分析客流的影响因素,并且在训练过程中可以避免出现特征丢失,从而提高最终获得的目标客流预测模型的预测准确度。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了本公开示例性实施例提供的客流预测方法的流程示意图;
图2示出了本公开示例性实施例提供的双通道特征提取层的神经元结构图;
图3A示出了本公开示例性实施例提供的国贸站的损失函数随迭代次数变化的曲线;
图3B示出了本公开示例性实施例提供的四惠东站的损失函数随迭代次数变化的曲线;
图4A示出了本公开示例性实施例提供的国贸站预测结果与真实结果的对比结果;
图4B示出了本公开示例性实施例提供的四惠东站预测结果与真实结果的对比结果;
图5示出了本公开示例性实施例提供的客流预测装置的结构示意图;
图6示出了本公开示例性实施例提供的电子设备的结构示意图;
图7示出了本公开示例性实施例提供的计算机系统的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
近来年,轨道交通凭着运量大、污染小、准点率高、舒适度高的优势得到迅速发展,有效地缓解了中国大城市的交通拥堵问题。伴随着城市轨道交通线网规模的快速扩张和客流量的急剧增加,客流分布不平衡问题愈加突出。同时,短时间内客流迅速增加导致楼梯、站台等区域频繁出现的高密度客流聚集现象,严重降低了乘客的舒适感和换乘效率,甚至形成安全隐患。为缓解高密度客流聚集的风险,越来越多的轨道运营部门开始采取加装护栏、分时段放行等限流措施。在当前轨道交通客流常态管控的背景下,现有的高密度客流管控多是依靠轨道运管人员的工作经验开展,缺乏科学的客流预测依据,主观随意性强,效果欠佳。
在当前轨道交通线网规模逐年扩大、客流管控需求不断凸显的背景下,短时客流预测的重要性正在逐步显现。短时客流预测通常指预测时间跨度小于60分钟的客流预测,是实现客流有序组织和轨道交通安全运行的关键。实时、精确的短时客流预测能够在帮助运营部门做好调度方面发挥重要作用,可成为缓解轨道交通线路客流超负荷运行的重要手段。
现有的研究仍存在三个问题,一是站点的聚类未能考虑短时客流的不均衡性,二是对作为输入的客流影响因素的研究不够充分,三是在多维度的特征后,模型在训练过程中会出现特征丢失,影响预测精度。因此,本公开示例性实施例从三个方面进行了优化,一是使用进出站不均衡系数对站点进行聚类,二是确定了时间因素、空间因素及天气因素三个层面的客流影响因素,三是针对两类特征输入建立了一个双通道的客流预测模型。
基于此,本公开实施例提供的客流预测方法,其可以由终端执行,也可以由应用于终端的芯片执行。
示例性的,上述终端可以包括手机、平板电脑、可穿戴设备、车载设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、掌上电脑(Personal Digital Assistant,PDA)、以及基于增强现实(augmented reality,AR)和/或虚拟现实(virtual reality,VR)技术的可穿戴设备等中的一种或多种,本公开示例性实施例对此不作具体限制。
图1示出了本公开示例性实施例提供的客流预测方法的流程示意图。如图1所示,该客流预测方法包括:
S101,获取目标站点的样本客流数据;
S102,对样本客流数据进行预处理,获得待构建客流预测模型的分类型输入信息和数值型输入信息;
S103,将分类型输入信息和数值型输入信息输入至待构建客流预测模型中,获得预测客流数据;
S104,若基于预测客流数据和样本客流数据的标签客流数据确定的待构建客流预测模型的损失未满足收敛条件,基于预测客流数据和标签客流数据更新待构建客流预测模型;否则,确定待构建客流预测模型为目标站点的目标客流预测模型;
S105,利用目标客流预测模型预测目标站点的客流。
具体地,本公开示例性实施例可以针对不同的目标站点构建各自的目标客流预测模型,用于预测对应目标站点的客流。
按照客流影响因素,可以将样本客流数据划分为分类型客流数据和数值型客流数据;分类型客流数据可以包括天气因素数据和特征日与特征时段数据,数值型客流数据可以包括时间维度客流数据和空间维度客流数据。
而待构建客流预测模型对于分类型客流数据和数值型客流数据进行特征提取的方式不同,因此,为了避免在训练过程中丢失特征,先对样本客流数据进行预处理,获得待构建客流预测模型的分类型输入信息和数值型输入信息,从多维度分析客流的影响因素。其中,分类型输入信息为分类型客流数据进行预处理后得到的数据,数据型输入信息为数据型客流数据进行预处理后得到的数据。
然后利用待构建客流预测模型分别对分类型输入信息和数值型输入信息进行特征提取,以进一步避免模型训练过程中的特征丢失,可以获得样本客流数据在训练过程中的预测客流数据。
基于预测客流数据和样本客流数据的标签客流数据确定待构建客流预测模型的损失。若待构建客流预测模型的损失未满足收敛条件,说明当前训练的待构建客流预测模型的客流预测准确性比较差,不能准确用于目标站点的客流,需要进一步训练才能满足客流预测准确度,此时,可以基于预测客流数据和标签客流数据更新待构建客流预测模型。
若待构建客流预测模型的损失满足收敛条件,说明当前训练的待构建客流预测模型的客流预测准确性比较高,可以准确用于目标站点的客流,此时,可以确定待构建客流预测模型为目标站点的目标客流预测模型。
上述收敛条件可以包括待构建客流预测模型的损失小于或等于预设阈值,也可以是指待构建客流预测模型的损失稳定,具体根据实际应用场景确定,本公开示例性实施例对此不作限定。
当目标客流预测模型训练完成后,可以在推理阶段利用目标客流预测模型预测目标站点的客流,以保证目标站点的客流的预测准确度。
根据本公开示例性实施例的技术方案,通过获取目标站点的样本客流数据;对样本客流数据进行预处理,获得待构建客流预测模型的分类型输入信息和数值型输入信息;将分类型输入信息和数值型输入信息输入至待构建客流预测模型中,获得预测客流数据;若基于预测客流数据和样本客流数据的标签客流数据确定的待构建客流预测模型的损失未满足收敛条件,基于预测客流数据和标签客流数据更新待构建客流预测模型;否则,确定待构建客流预测模型为目标站点的目标客流预测模型;利用目标客流预测模型预测目标站点的客流,能够综合考虑分类型输入信息和数值型输入信息,从多维度分析客流的影响因素,并且在训练过程中可以避免出现特征丢失,从而提高最终获得的目标客流预测模型的预测准确度。
在实际应用中,进站检票系统(AFC)会记录每一位进出站乘客的卡号、进站名称、进站时间、出站名称、出站时间、票价等信息,这些信息能用来分析站点客流。本公开示例性实施例选取地铁全路网连续30天的5:00~23:00的AFC数据作为研究对象,将客流分析及预测的时间间隔划定为30分钟,5:00~23:00的36个时间段的起始时刻分别用1~36表示,其中1代表5:00,36代表23:00。
天气的变化会通过影响乘客的出行选择影响地铁客流量。本公开示例性实施例考虑天气对客流的影响。天气数据及空气质量指数(Air Quality Index,AQI)数据均来自天气后报网站。天气数据主要包括天气状况、风力、空气质量。
天气因素数据可以包含天气状况、风力和空气质量等级三类数据。其中,天气状况包括晴、多云、扬沙、小雨四种情形;风力包括1-2级、3-4级、4-5级三个等级;质量等级包括优、良、轻度污染、重度污染四个等级。表1示出了本公开示例性实施例的影响轨道交通进站客流的天气因素数据。
表1 影响轨道交通进站客流的天气因素数据
本公开示例性实施例可以将前文划分的时间段进一步按照是否为工作日进行划分,可以得到特征日与特征时段数据。如工作日的时某个时间段、非工作日的时某个时间段。
示例性的,可以采用系统聚类法完成特征日与特征时段数据的确定工作。
系统聚类又称层次聚类,聚类原则为:首先将参与聚类的个案各视为一类,其次依据两个类别之间的距离或相似性逐步合并,直到所有个案合并为一个大类为止。本公开示例性实施例选取类平均法完成聚类。类平均法的类间距离定义为:两个类别中各数据点两两之间距离平方的平均数。类平均法常用的距离主要有欧氏距离、切比雪夫距离。本公开示例性实施例选取欧氏距离作为距离评判指标。不同的类别之间可能存在不同的特征。
当前时段的客流不仅与历史同时段客流量相近,同时也受目标站点在当前时段前若干时段的客流量的影响。因此,在预测目标站点当前时段的客流时,需要分析目标站点历史同时段客流、若干前序时段客流与基准客流的相关程度。因数据量有限,一般在历史同时段客流中选取前一周同时段客流、前两周同时段客流作为时间维度客流数据。
示例性的,可以通过相关系数确定时间维度客流数据。
在若干前序客流因素中选取预测点前n个时段客流作为输入特征,n的取值可以通过以下原则确定:若前第一个时段与基准客流呈现出强度正相关关系,则继续选取前第二个时段作为变量并分析与基准客流的相关性,以此类推,直到前第n+1个时段客流与基准客流的相关性程度不满足强正相关关系。
本公开示例性实施例引入相关系数描述基准客流与历史同时段客流、前序若干时段客流的相关程度。相关系数是介于[-1,1]之间的实数,当相关系数介于[-1,0)之间时,表示数据负相关;当相关系数介于(0,1]之间时,数据存在正相关关系。一般当相关系数的绝对值在区间[0.1,0.3]时,变量之间为弱相关关系;当相关系数的绝对值在区间(0.3,0.7)时,变量之间为中度相关关系;当相关系数的绝对值在区间[0.7,1]时,变量之间表现为强相关。
Pearson(皮尔逊相关系数)、Spearman(斯皮尔曼相关系数)、Kendall(肯德尔相关系数)为统计学三大相关系数。本公开示例性实施例采用Spearman相关系数。
运用python工具计算全线网所有站点的基准客流与前一周同时段客流、前两周同时段客流、预测点前第n个时段客流的Spearman相关系数值。
目标站点的客流在空间维度上和与该目标站点的客流特征相似的站点的客流相关,本公开示例性实施例可以将提取与目标站点的客流特征最相似的多个站点的客流作为空间维度客流数据。
示例性的,可以采用余弦相似度的方法确定与目标站点的客流特征最相似的多个站点。
余弦相似度是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异大小的度量。余弦值越接近于1表明两向量夹角越接近于0度,也就代表两个向量越相似。本公开示例性实施例分别计算各类站点内所有站点间的余弦相似度,并提取与目标站点的客流特征最相似的多个站点。
需要说明的是,本公开示例性实施例也可以按照客流影响因素将样本客流数据划分为天气因素数据、时间维度数据和空间维度数据,其中,时间维度数据包括特征日与特征时段数据和时间维度客流数据。
在一些实施例中,获取目标站点的样本客流数据,可以包括:
获取多个站点的样本客流数据;
对多个站点的样本客流数据进行聚类,得到多个站点类别;
将与目标站点属于同一站点类别的站点的样本客流数据,确定为目标站点的样本客流数据。
示例性的,对多个站点的样本客流数据进行聚类,得到多个站点类别,可以包括:
分别确定样本进站客流数据的进站不均衡系数和样本出站客流数据的出站不均衡系数;利用进站不均衡系数和出站不均衡系数,对多个站点的样本客流数据进行聚类,得到多个站点类别。
具体地,在对多个站点的样本客流数据进行聚类时,针对进站客流及出站客流分别引入进站不均衡系数与出站不均衡系数。其中,进站不均衡系数表示某个站点某时段的进站客流量与该站点全天的进站客流量的比值,出站不均衡系数表示某个站点某时段的出站客流量与该站点全天的出站客流量的比值。
为使聚类结果(站点类别)更细致,将时段设定为30分钟,第i个站点、第j个时段的进站不均衡系数、出站不均衡系数分别设为、/>,第i个站点、第j个时段的进站客流量、出站客流量分别用/>与/>表示。进出站不均衡系数的计算公式如下式所示:
。
本公开示例性实施例采用k-means算法,以进站不均匀系数和出站不均匀系数为指标,对多个站点的样本客流数据进行聚类,能够解决短时客流的不均衡性的问题。k-means算法因其收敛快且更适应于分析大数据,成为最主流的聚类算法之一。k-means算法通过预先设定的k值及每个类别的初始质心对多个站点的样本客流数据进行归并,通过不断迭代寻找最优值。主要步骤如下:
Step1:随机初始化聚类中心。首先计算多个站点的样本客流数据的数据长度,其次在长度区间上随机产生k个不同的值,并将其作为初始聚类中心。
Step2:按照每个站点的样本客流数据与聚类中心之间的欧式距离最短原则分配站点的样本客流数据,将所有站点的样本客流数据划分为k簇,并计算每一簇的平均误差。
Step3:更新聚类中心。计算每一簇中所有点的平均值,并将其作为聚类中心。
Step4:根据Step2再次进行分配并计算平均误差。
Step5:比较前后两次的平均误差是否相等,若不相等则转到Step3,否则算法结束。
K-means算法需要预先确定初始类别数k,但以往k值凭借经验确定,缺乏科学依据。因此,本公开示例性实施例采用肘部法则(Elbow Method)和轮廓系数(SilhouetteCoefficient)确定k值,并选择k-means++算法随机初始化聚类中心。
(1)肘部法则
误差平方和(Error Sum of Squares, SSE)随着类别k的增大而呈现下降趋势,此过程会出现一个拐点也即“肘”点,下降速率突然变缓时即认为是最佳的k值,此即为肘部法则。
(2)轮廓系数
某个样本点X i的轮廓系数S的计算公式如下式所示。其中,a是X i与同簇其它样本的平均距离,称为凝聚度;b是X i与最近簇中所有样本的平均距离,称为分离度。平均轮廓系数为所有样本的轮廓系数的平均值,平均轮廓系数越大,聚类效果越好。
。
基于此,在确定多个站点类别后,将与目标站点属于同一站点类别的站点的样本客流数据,确定为目标站点的样本客流数据,以用于目标客流预测模型的训练。
在一些实施例中,对样本客流数据进行预处理,获得待构建客流预测模型的分类型输入信息和数值型输入信息,可以包括:
按照客流影响因素将样本客流数据划分为分类型客流数据和数值型客流数据;分类型客流数据包括天气因素数据和特征日与特征时段数据,数值型客流数据包括时间维度客流数据和空间维度客流数据;
对分类型客流数据依次进行独热编码和降维操作,获得待构建客流预测模型的分类型输入信息;
对数值型客流数据依次进行归一化处理,获得待构建客流预测模型的数值型输入信息。
具体地,关于“按照客流影响因素将样本客流数据划分为分类型客流数据和数值型客流数据;分类型客流数据包括天气因素数据和特征日与特征时段数据,数值型客流数据包括时间维度客流数据和空间维度客流数据”的相关内容参见前文,此处不再赘述。
针对分类型客流数据,本公开示例性实施例可以对分类型客流数据依次进行独热编码和降维操作,获得待构建客流预测模型的分类型输入信息。
因为分类型客流数据不存在严格的大小关系,所以采用1、2、3这种量化方式并不合适。在机器学习中,对于分类型客流数据常采用独热编码(即one-hot编码)创建虚拟特征。one-hot编码是一种最常见的表示离散数据的方法。独热编码用N位状态寄存器编码N个状态,每个状态都有寄存器位且每个寄存器位中只能有一个状态。运用独热编码时,首先需要计算出需要表示的类别总数量N,用N-1个0和单个1组成的向量来表示各个变量。正因此种变量标定机制,在应用one-hot编码时存在以下两个缺点:①对于较多类别的变量,变换后的向量维数增多且过于稀疏,从而导致占用内存过大;②各类别之间的变量完全独立,所以无法表示不同类别之间的关系。针对上述缺点,本公开示例性实施例引入embedding层,将稀疏矩阵降维以减少模型的参数,进而起到减少占用内存、提高精度的效果。
针对数值型客流数据,本公开示例性实施例可以对数值型客流数据依次进行归一化处理,获得待构建客流预测模型的数值型输入信息。
不同时段的进出站客流差异值较大,如果直接将此数据集直接输入到待构建客流预测模型中,待构建客流预测模型会出现梯度爆炸现象。为了避免此类问题,在对到待构建客流预测模型进行训练之前,需对数值型客流数据进行归一化处理。
常见的归一化处理方式包括线性归一化、Z-Score标准化,线性归一化后得到的数据取值范围为[0,1],Z-Score标准化后的数据服从均值为0、标准差为1的正态分布。
在一些实施例中,待构建客流预测模型的网络架构可以包括输入层、双通道特征提取层、全连接层和输出层,双通道特征提取层包括分类型特征提取通道、数值型特征提取通道和特征融合模块;将分类型输入信息和数值型输入信息输入至待构建客流预测模型中,获得预测客流数据,包括:
利用输入层,将分类型输入信息和数值型输入信息输入至双通道特征提取层;
利用分类型特征提取通道从分类型输入信息提取分类型特征,利用数值型特征提取通道从数值型输入信息提取数值型特征,并利用特征融合模块对分类型特征和数值型特征进行融合,获得预测客流数据;
利用全连接层从双通道特征提取层提取预测客流数据,并将预测客流数据发送至输出层进行输出。
具体地,待构建客流预测模型的网络架构可以包括输入层、双通道特征提取层、全连接层和输出层,双通道特征提取层可以包括分类型特征提取通道、数值型特征提取通道和特征融合模块。
输入层用于将分类型输入信息和数值型输入信息输入至双通道特征提取层;分类型特征提取通道用于从分类型输入信息提取分类型特征,数值型特征提取通道用于从数值型输入信息提取数值型特征,并特征融合模块用于对分类型特征和数值型特征进行融合,获得预测客流数据;全连接层用于从双通道特征提取层提取预测客流数据,并将预测客流数据发送至输出层进行输出。
图2示出了本公开示例性实施例提供的双通道特征提取层的神经元结构图。如图2所示,虚线部分表示分类型特征提取通道,用于从分类型输入信息提取分类型特征;实线部分表示数值型特征提取通道,用于从数值型输入信息提取数值型特征/>;然后,利用特征融合模块对分类型特征和数值型特征进行融合,获得预测客流数据x t。
基于此,双通道特征提取层可以解决因输入特征类型不同而导致在训练过程中出现部分输入特征丢失的技术问题,从而提高模型预测精度。
全连接层可以捕获到前面所有的特征,经过运算就可以更加有效、完备的融合所有特征。本公开示例性实施例可以通过两层全连接神经网络进一步提取特征,两层全连接层均采用激活函数relu。
在实际应用中,分类型特征提取通道和数值型特征提取通道均可以为门控循环单元,可以解决RNN模型无法记忆长期依赖特征的问题,其具有结构更加简单、所需参数更少、训练速度更快的特点。
分类型特征提取通道和数值型特征提取通道均包括重置门和更新门;分类型特征和数值型特征的计算公式为:
,
其中,表示数值型特征提取通道的更新门,/>表示更新门的当前时刻输入信息的权重,/>表示数值型特征提取通道的当前时刻输入信息,/>表示更新门的上一时刻的隐藏状态的权重,/>表示数值型特征提取通道的上一时刻的隐藏状态,/>表示数值型特征提取通道的重置门,/>表示重置门的当前时刻输入信息的权重,/>表示重置门的上一时刻的隐藏状态的权重,/>表示数值型特征提取通道的候选隐藏状态,U表示候选隐藏状态的上一时刻的隐藏状态的权重,W表示候选隐藏状态的当前时刻输入信息的权重,/>表示数值型特征提取通道传递到下一时刻的隐藏状态,/>表示分类型特征提取通道的更新门,表示分类型特征提取通道的当前时刻输入信息,/>表示分类型特征提取通道的上一时刻的隐藏状态,/>表示分类型特征提取通道的重置门,/>表示分类型特征提取通道的候选隐藏状态,/>表示分类型特征提取通道传递到下一时刻的隐藏状态,“/>”表示哈达玛积;
预测客流数据的计算公式为:
,
其中,表示客流量的预测值,/>表示数值型特征的矩阵参数,/>表示分类型特征的矩阵参数。
在一些实施例中,待构建客流预测模型的损失可以包括第一损失和第二损失,第一损失与待构建客流预测模型的模型参数相关,第二损失与待构建客流预测模型的超参数相关。
具体地,待构建客流预测模型的损失可以由两部分组成,具体可以包括模型内部损失和模型外部损失,将模型内部损失作为第一损失,将模型外部损失作为第二损失,第一损失与待构建客流预测模型的模型参数相关,第二损失与待构建客流预测模型的超参数相关。
其中,待构建客流预测模型的模型参数可以包括权重和偏置;待构建客流预测模型的超参数可以包括学习率、时间步、批量大小、隐藏层层数及神经元个数、dropout约束和Adam优化器。
学习率:反映参数更新快慢的重要指标。学习率表征梯度下降的速度,如果学习率过大,待构建客流预测模型可能会越过局部最小值;如果学习率过小将会导致梯度下降速率较慢,从而导致搜索效率低甚至算法无法收敛,所以学习率的设置至关重要。本公开示例性实施例采用Adam优化器自适应调整学习率。
时间步(Time_step):指单个样本包含的时间序列长度。time_step取值既不能过大也不能过小,当数值较小时,虽然会加快迭代速度,但更容易陷入局部最优;time_step数值过大时,会因样本序列过长导致数据关联性降低,从而影响预测精度。
批量大小(Batch_size):代表1个batch包含的样本数量。当数据集较大时,需要引入batch_size参数,因为合理的batch_size会缩短模型的训练时间、提高模型的稳定性。
隐藏层层数及神经元个数:神经网络通常由输入层、隐藏层、输出层构成。对于一般的数据集,通常将隐藏层设定为1~2层,而时序序列数据通常采用多层隐藏层才能更好地完成预测,但神经网络模型隐藏层一般不超过10层。
输入层与输出层的神经元数量随着输入特征及具体问题的确定而确定,输入层的神经元数量为输入变量特征的维度,输出层的神经元数量为分类或预测的数目。隐藏层的神经元数量并非固定数值,隐藏层神经元数量越多结果越准确。与添加隐藏层层数相比,在每一层中添加神经元个数时,模型性能提升幅度较小且计算量增幅较大,所以隐藏层的神经元个数设置不宜过大,通常在100以内。另外,当隐藏层层数为多层时,通常将各层布设相同数量的神经元。根据上述分析,输入层神经元数量与输出层神经元数量为固定值,所以只需设置隐藏层的神经元数量。
dropout约束:根据模型的输入特征及其复杂度推断,在应用模型预测时会出现过拟合现象。过拟合是指模型在训练阶段表现良好,但在测试阶段表现欠佳。过拟合通常由参数太多,模型复杂度过高导致,因此可以考虑在模型中增加训练数据数量、使用L1或L2正则化、降低模型复杂度、使用dropout约束等方法避免过拟合现象。本公开示例性实施例选用dropout约束训练模型以防止此类问题的出现。dropout约束是指在每批次训练中,通过忽略一定数量的特征检测器从而使得一定数量的隐藏节点值为0。为防止模型出现过拟合现象,本公开示例性实施例引入超参数dropout,其值通常在0.2~0.4之间。
Adam优化器:Adam算法中默认参数设定为:α=0.001、β 1=0.9、β 2=0.999和=10E−8。其中,α表示学习率,β 1表示一阶矩估计的指数衰减率,β 2表示一阶矩估计的指数衰减率,/>是防止在实现中除以零的非常小的参数。实际应用中,很少调节该参数,本公开示例性实施例将采用默认的参数训练模型。
本公开示例性实施例选取网格搜索法寻找最优超参数。网格搜索法是一种通过遍历给定的参数组合来优化模型性能的方法,是一种最简单、应用最广泛的寻找超参数的方法。在应用网格搜索法时,首先需要设定超参数的范围,其次根据所有超参数列出来的数值进行组合生成网格,最后通过得分评估模型性能。网格搜索法通常与k-fold交叉验证一同使用。k-fold交叉验证通过对每个组合下的模型进行评分,最终取平均值作为该组合下模型的性能分数。以超参数组合1为例说明k-fold交叉验证方法的原理:
Step1:将训练集平均划分为c份,选择某种评价指标评估模型性能。
Step2:选取第1份作为验证集,剩余的c-1份作为训练集输入到待构建客流预测模型中。应用选择的评价指标得出分数y 1。
Step3:选取第2份作为验证集,剩余的c-1份作为训练集输入到待构建客流预测模型中。应用选择的评价指标得出分数y 2。
Step4:以此类推,直到选取第c份作为验证集。此时模型性分数为y c。
Step5:计算超参数组合1的评估分数y,计算公式如下式所示:
。
本公开示例性实施例的相关算法作如下总结:
(1)模型整体算法设计
本公开示例性实施例按照训练集:测试集=9:1的比例划分训练集、测试集。整体算法设计如下:
Step1:读取处理好的客流数据,将数据集按比例划分为训练集、测试集。
Step2:根据数据类型对数据集进行归一化处理或进行one-hot编码。
Step3:确定模型的输入特征及标签。
Step4:将训练集输入到待构建客流预测模型中执行训练过程,得出权重、偏置的最优值,保存目标客流预测模型。
Step5:将测试集输入到保存好的目标客流预测模型中,进行目标站点的客流预测。
(2)训练过程算法设计
本公开示例性实施例根据神经网络的设计过程,设计改进GRU客流预测模型的训练算法。具体步骤如下:
Step1:首先定义各超参数范围,设超参数组合数量为D,d代表第d种组合。判断d是否小于等于D,如果是执行Step2,否则执行Step8。
Step2:设k-fold交叉验证次数为E,e代表第e次。判断交叉次数e是否小于等于E,如果是执行Step3,否则返回Step1。
Step3:定义最大循环次数为max_epochs,其中初始迭代次数为0,f代表第f次迭代。判断迭代次数是否小于等于max_epochs,如果是执行Step4,否则返回step2。
Step4:读取批处理大小的数据。
Step5:模型进行预测并输出预测值。
Step6:根据损失函数,计算预测值与真实值的误差。
Step7:反向更新权值、偏置,并执行Step3。
Step8:根据评价指标,计算各超参数组合下的误差值。
与现有技术相比,本公开示例性实施例具有如下有益效果:
伴随着城市轨道交通线网规模的快速扩张和客流量的急剧增加,客流分布不平衡问题愈加突出。高峰或重大活动期间,短时客流的迅速增加易导致车站内出现高密度客流聚集现象,影响车站安全性与舒适性。实时、精确的短时客流预测在帮助运营部门做好客流管控、避免发生安全事故时发挥着重要作用。但现有的研究仍存在三个问题,一是站点的聚类未能考虑短时客流的不均衡性,二是对作为输入的客流影响因素的研究不够充分,三是在输入多维度的特征后,模型在训练过程中会出现特征丢失,影响客流预测的精度。针对以上问题,本公开示例性实施例利用AFC及天气数据,引入进出站不均衡系数将站点划分为五类,使用余弦相似度确定了站点间客流变化的相似性。同时,本公开示例性实施例从时间维度、空间维度、外部因素等层面全面分析了不同类别轨道交通站点客流的影响因素,确定了模型的输入。本公开示例性实施例提出了一个双通道GRU模型。根据输入特征类型建立数值型(Numeric Data)以及独热编码型(One-hot Data)双特征通道,实现GRU模型的神经元结构改进。利用北京市地铁的数据进行模型的训练与预测,将结果与原始GRU模型和SVR模型进行对比,改进后的GRU模型能够显著的提高模型的预测精度。
具体来说,本公开示例性实施例的有益效果主要分为以下三个方面:针对短时客流的不均匀性,以进出站客流不均匀系数为指标,实现了站点的聚类;从时间维度、空间维度和外部因素三个方面确定了改进GRU模型的输入,提升了预测的准确性;建立了一个双通道GRU模型,解决了多维特征在既有模型训练过程中丢失的问题,提升了地铁站客流预测的准确性。
为了使本公开示例性实施例的目的、发明内容及优点更加清楚明白,以下对本公开示例性实施例作进一步的详细说明。
本公开示例性实施例首先调查AFC数据和天气数据,利用AFC数据计算各站点的进出站不均匀系数,完成站点的聚类;其次,基于AFC数据和天气数据,从时间维度、空间维度和外部因素三个角度全面的分析轨道交通客流的影响因素,确定改进GRU模型的输入特征;再次,使用数据对模型进行训练并进行预测,给出预测后的地铁客流量,为运营管理方案的制定提供理论支撑。
以进行一次地铁站客流预测研究为例,具体实施步骤如下:
步骤1:数据调查、处理与站点的聚类
本公开示例性实施例选取北京市轨道交通2019年4月份时间段为5:00~23:00的客流数据作为研究对象。所采用的数据集共包括17条线路、260个站点的客流信息。17条线路分别为:1号线、2号线、5号线、6号线、7号线、8号线、8号线南段、9号线、10号线、13号线、15号线、S1线、昌平线、房山线、亦庄线、八通线、机场线。
本公开示例性实施例考虑天气对客流的影响。2019年4月份的天气数据及空气质量指数数据均来自天气后报网站。天气数据主要包括温度、天气状况、风力。
基于北京市轨道交通的AFC数据,以半小时为单位,计算各站进出站不均匀系数。
本公开示例性实施例使用SSE、平均轮廓系数来确定K值,当k为5时,SSE曲线趋于平缓,到达肘点。k为4时,平均轮廓系数为0.2664;k为5时,平均轮廓系数为0.2632,相差较小。综合来看,k取为5时算法聚类效果最优。
使用K-means聚类算法,以进出站不均匀系数为指标,将站点进行聚为5类,聚类结果如表2所示,站点特征主要分为三类:
(1)单峰型
类别0和类别3进、出站客流各只存在一个高峰时段,将其定义为单峰型。类别0早高峰出站客流较进站客流大,晚高峰进站客流较出站客流大,这类站点位于工作地附近,本公开示例性实施例将类别0称为工作密集型车站;同理,类别3为居住密集型车站。
(2)双峰型
类别1和类别4进出站客流存在两个高峰时段,将其定义为双峰型。分析该类站点的用地性质,该类站点周围分布相当的居住用地与工作用地,在该类站点乘车去往工作地与居住地的人数相近,所以将类别1和类别4定义为居住工作混合型车站。
(3)无峰型
类别2进出站客流没有明显的高峰时段,将其定义为无峰型。类别2所包含的车站多位于大型购物类、景点类、枢纽类用地附近。因此将类别2定义为商旅文娱型车站。表2示出了本公开示例性实施例的260个车站的分类结果。
表2 260个车站的分类结果
步骤2:输入特征(分类型输入信息和数值型输入信息)的标定
本公开示例性实施例选取国贸站与四惠东站进行模型的应用与验证分析,首先进行输入特征及模型参数的标定。
国贸站属于类别0,四惠东站属于类别4。类别0的工作日特征时段划分为{17:00-19:30}、其余时段,非工作日特征时段划分为{5:00-7:30,22:30-23:00}、{17:00-19:30}、{21:30-22:30}、其余时段;类别4的工作日特征时段划分为{7:00-9:30,18:30-19:30}、{17:00-18:30}、其余时段,非工作日特征时段划分为{5:00-7:00、21:30-23:00}、其余时段。
上述确定了两站点的特征日与特征时段,还需进一步确定两站点的空间类特征。根据余弦定理,与国贸站相似度最高的6个站点分别为大望路、雍和宫、知春路、呼家楼、大钟寺、五道口,与四惠东站相似度最高的6个站点分别为四惠、大屯路东、百子湾、林萃桥、牡丹园、上地。表3示出了本公开示例性实施例的国贸站与四惠东站的输入特征。
表3 国贸站与四惠东站输入特征
步骤3:基于双通道GRU模型的地铁站客流预测
根据模型输入特征选取规则,最终用于模型训练及预测的数据为2019/4/15~2019/4/30之间的客流。此数据集共包含16天的客流数据,因此每个站点共包含576(16×36)个时段的客流数据。在神经网络模型训练之前,需将样本数据集划分为训练集、测试集。本公开示例性实施例按照训练集:测试集=9:1的比例划分,即训练集包含518个时段数据,测试集包含58个时段数据。
1.超参数设定
超参数是需要人为设定的参数,主要包括神经网络层数、神经元个数、time_step、batch_size等。以下将分别介绍各超参数含义及取值原则。
(1)损失函数
神经网络模型的效果通过损失函数呈现。损失函数可量化预测值与实际值的差距,函数值越小代表预测模型性能越优。本公开示例性实施例选择均方误差(Mean SquareError,MSE)作为损失函数。
(2)学习率
学习率是反映参数更新快慢的重要指标。学习率表征梯度下降的速度,如果学习率过大模型可能会越过局部最小值;如果学习率过小将会导致梯度下降速率较慢,从而导致搜索效率低甚至算法无法收敛,所以学习率的设置至关重要。
本公开示例性实施例采用Adam优化器,自适应调整学习率。Adam优化器中各参数设置为α=0.001、β 1=0.9、β 1=0.999和=10E−8。
(3)time_step
Time_step指单个样本包含的时间序列长度。time_step取值既不能过大也不能过小,当数值较小时,虽然会加快迭代速度,但更容易陷入局部最优;time_step数值过大时,会因样本序列过长导致数据关联性降低,从而影响预测精度。基准客流与前第3个时段的相关性较弱,因此将time_step设置为2。
(4)batch_size
Batch_size代表1个batch包含的样本数量。当数据集较大时,需要引入batch_size参数,因为合理的batch_size会缩短模型的训练时间、提高模型的稳定性。batch_size通常设为2的n次幂,本公开示例性实施例将batch_size的范围设为{8,16,32,64,128}。
(5)隐藏层层数及神经元个数
神经网络通常由输入层、隐藏层、输出层构成。对于一般的数据集,通常将隐藏层设定为1~2层,而时序序列数据通常采用多层隐藏层才能更好地完成预测,但神经网络模型隐藏层一般不超过10层。基于上述分析,本公开示例性实施例将隐藏层层数的范围设定为{2,3,4,5,6,7,8,9,10}。
输入层与输出层的神经元数量随着输入特征及具体问题的确定而确定,输入层的神经元数量为输入变量特征的维度,输出层的神经元数量为分类或预测的数目。隐藏层的神经元数量并非固定数值,隐藏层神经元数量越多结果越准确。与添加隐藏层层数相比,在每一层中添加神经元个数时,模型性能提升幅度较小且计算量增幅较大,所以隐藏层的神经元个数设置不宜过大,通常在100以内。另外,当隐藏层层数为多层时,通常将各层布设相同数量的神经元。根据上述分析,输入层神经元数量与输出层神经元数量为固定值,所以只需设置隐藏层的神经元数量。综上,本公开示例性实施例将隐藏层神经元的范围设定为{80,90,100}。
(6)dropout约束
为防止模型出现过拟合现象,本公开示例性实施例引入超参数dropout,其值通常在0.2~0.4之间,因此将dropout范围设定为{0.2,0.3,0.4}。
2. 模型的训练
模型训练的过程即确定最优超参数的过程。本公开示例性实施例将运用k-fold交叉验证及python中scikit-learn包提供的网格搜索算法,应用改进后的GRU模型对目标站点进行训练,将模型的输出值反归一化后应用相应的评价指标确定最优超参数。本公开示例性实施例选取平均绝对误差、均方根误差、平均绝对百分比误差、拟合优度作为模型评价指标。
分别对国贸站与四惠东站进行训练,确定的最优超参数。表4示出了本公开示例性实施例的国贸站及四惠东站超参数最优值。
表4 国贸站及四惠东站超参数最优值
3.模型预测
将上述确定的最优超参数输入到模型中,分别对国贸站、四惠东站进行预测。图3A示出了本公开示例性实施例提供的国贸站的损失函数随迭代次数变化的曲线,图3B示出了本公开示例性实施例提供的四惠东站的损失函数随迭代次数变化的曲线。如图3A~图3B所示,曲线301为国贸站的训练集损失,曲线302为国贸站的验证集损失,曲线303为四惠东站的训练集损失,曲线304为四惠东站的验证集损失。从图3A~图3B可以看出,在迭代初期,损失值随着迭代次数的增加而下降,国贸站、四惠东站分别在迭代次数为75、50时趋于稳定,表明模型已经收敛。
图4A示出了本公开示例性实施例提供的国贸站预测结果与真实结果的对比结果,图4B示出了本公开示例性实施例提供的四惠东站预测结果与真实结果的对比结果。如图4A~图4B所示,曲线401为国贸站的真实值,曲线402为国贸站的预测值,曲线403为四惠东站的真实值,曲线404为四惠东站的预测值。从图4A~图4B中可以看出改进GRU模型对高峰期客流突变有较好的拟合性,对于随机性的突变拟合效果较差,但总体来说,模型预测性能表现稳定且精度较佳。
4 对比验证
为了验证基于改进GRU的短时客流预测模型的性能,选择原始GRU模型、支持向量回归(Support Vector Regression,SVR)模型作为参照模型。为保证实验合理性,原始GRU模型、SVR模型验证集个数也需设为58。同样采用网格搜索法与k-fold交叉验证的方法寻找原始GRU模型的最优超参数。
表5示出了本公开示例性实施例的国贸站与四惠东站的预测结果在GRU模型改进前后的对比结果,其中平均绝对误差(MAE)、均方根误差(RMSE)、平均绝对百分比误差(MAPE)数值越小,表明模型性能越好,拟合优度(R2)的数值越接近于1,代表模型性能越好。对于国贸站,改进后GRU模型预测值与真实值的MAE、RMSE、MAPE值分别为70.16、102.35、0.0097。与原始GRU模型相比,分别下降了29.84、79.93、0.0089,R2较改进前提高了0.01,改进后的GRU模型评价指标值下降较大,特别是MAPE值,下降幅度将近一倍;与SVR模型相比,MAE、RMSE、MAPE分别下降了55.2、108.5、0.0104,R2提升了0.02,RMSE与MAPE下降幅度均超过一倍。分析四惠东站客流预测结果发现,SVR模型的预测性能仍然不如原始GRU模型。改进后GRU模型的预测值与真实值的MAE、RMSE、MAPE较原始GRU模型分别下降了26.91、50.69、0.0088,其R2值与改进前相等,为0.95;与SVR模型相比,MAE、RMSE、MAPE分别下降了56.86、93.71、0.0154,R2提高了0.01。
由此可知,本公开示例性实施例所提出的改进GRU短时客流预测模型性能较改进前有所提升,这表明考虑时间维度、空间维度和天气因素作为模型输入属性、改进神经元结构等能够有效提高模型预测性能。
表5国贸站与四惠东站的预测结果在GRU模型改进前后的对比结果
上述主要对本公开实施例提供的方案进行了介绍。可以理解的是,为了实现上述功能,电子设备包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本公开能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
本公开实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本公开实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,本公开示例性实施例提供一种客流预测装置,该客流预测装置可以为电子设备或应用于电子设备的芯片。图5示出了本公开示例性实施例提供的客流预测装置的结构示意图。如图5所示,该装置500包括:
获取模块501,用于获取目标站点的样本客流数据;
预处理模块502,用于对所述样本客流数据进行预处理,获得待构建客流预测模型的分类型输入信息和数值型输入信息;
训练模块503,用于将所述分类型输入信息和所述数值型输入信息输入至所述待构建客流预测模型中,获得预测客流数据;
训练模块503还用于若基于所述预测客流数据和所述样本客流数据的标签客流数据确定的所述待构建客流预测模型的损失未满足收敛条件,基于所述预测客流数据和所述标签客流数据更新所述待构建客流预测模型;否则,确定待构建客流预测模型为所述目标站点的目标客流预测模型;
预测模块504,用于利用所述目标客流预测模型预测所述目标站点的客流。
在一些实施例中,获取模块501还用于获取多个站点的样本客流数据;
对所述多个站点的样本客流数据进行聚类,得到多个站点类别;
将与所述目标站点属于同一所述站点类别的站点的样本客流数据,确定为目标站点的样本客流数据。
在一些实施例中,所述样本客流数据包括样本进站客流数据和样本出站客流数据;
获取模块501还用于分别确定所述样本进站客流数据的进站不均衡系数和所述样本出站客流数据的出站不均衡系数;
利用所述进站不均衡系数和所述出站不均衡系数,对所述多个站点的样本客流数据进行聚类,得到多个站点类别。
在一些实施例中,预处理模块502还用于按照客流影响因素将所述样本客流数据划分为分类型客流数据和数值型客流数据;所述分类型客流数据包括天气因素数据和特征日与特征时段数据,所述数值型客流数据包括时间维度客流数据和空间维度客流数据;
对所述分类型客流数据依次进行独热编码和降维操作,获得待构建客流预测模型的分类型输入信息;
对所述数值型客流数据依次进行归一化处理,获得所述待构建客流预测模型的数值型输入信息。
在一些实施例中,所述待构建客流预测模型的网络架构包括输入层、双通道特征提取层、全连接层和输出层,所述双通道特征提取层包括分类型特征提取通道、数值型特征提取通道和特征融合模块;
训练模块503还用于利用所述输入层,将所述分类型输入信息和所述数值型输入信息输入至所述双通道特征提取层;
利用所述分类型特征提取通道从所述分类型输入信息提取分类型特征,利用所述数值型特征提取通道从所述数值型输入信息提取数值型特征,并利用所述特征融合模块对所述分类型特征和所述数值型特征进行融合,获得所述预测客流数据;
利用所述全连接层从所述双通道特征提取层提取所述预测客流数据,并将所述预测客流数据发送至所述输出层进行输出。
在一些实施例中,所述分类型特征提取通道和所述数值型特征提取通道均包括重置门和更新门;所述分类型特征和所述数值型特征的计算公式为:
,
其中,表示数值型特征提取通道的更新门,/>表示更新门的当前时刻输入信息的权重,/>表示数值型特征提取通道的当前时刻输入信息,/>表示更新门的上一时刻的隐藏状态的权重,/>表示数值型特征提取通道的上一时刻的隐藏状态,/>表示数值型特征提取通道的重置门,/>表示重置门的当前时刻输入信息的权重,/>表示重置门的上一时刻的隐藏状态的权重,/>表示数值型特征提取通道的候选隐藏状态,U表示候选隐藏状态的上一时刻的隐藏状态的权重,W表示候选隐藏状态的当前时刻输入信息的权重,/>表示数值型特征提取通道传递到下一时刻的隐藏状态,/>表示分类型特征提取通道的更新门,表示分类型特征提取通道的当前时刻输入信息,/>表示分类型特征提取通道的上一时刻的隐藏状态,/>表示分类型特征提取通道的重置门,/>表示分类型特征提取通道的候选隐藏状态,/>表示分类型特征提取通道传递到下一时刻的隐藏状态,“/>”表示哈达玛积;
所述预测客流数据的计算公式为:
,
其中,表示客流量的预测值,/>表示数值型特征的矩阵参数,/>表示分类型特征的矩阵参数。
在一些实施例中,所述待构建客流预测模型的损失包括第一损失和第二损失,所述第一损失与所述待构建客流预测模型的模型参数相关,所述第二损失与所述待构建客流预测模型的超参数相关。
本公开实施例还提供一种电子设备,包括:至少一个处理器;用于存储至少一个处理器可执行指令的存储器;其中,至少一个处理器用于执行指令,以实现本公开实施例公开的上述方法的步骤。
图6示出了本公开示例性实施例提供的电子设备的结构示意图。如图6所示,该电子设备600包括至少一个处理器601以及耦接至处理器601的存储器602,该处理器601可以执行本公开实施例公开的上述方法中的相应步骤。
上述处理器601还可以称为中央处理单元(Central Processing Unit,CPU),其可以是一种集成电路芯片,具有信号的处理能力。本公开实施例公开的上述方法中的各步骤可以通过处理器601中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器601可以是通用处理器、数字信号处理器(Digital Signal Processing,DSP)、ASIC、现成可编程门阵列(Field-programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本公开实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储器602中,例如随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质。处理器601读取存储器602中的信息,结合其硬件完成上述方法的步骤。
另外,根据本公开的各种操作/处理在通过软件和/或固件实现的情况下,可从存储介质或网络向具有专用硬件结构的计算机系统,例如,图7所示的计算机系统700安装构成该软件的程序,该计算机系统在安装有各种程序时,能够执行各种功能,包括诸如前文所述的功能等等。图7示出了本公开示例性实施例提供的计算机系统的结构示意图。
计算机系统700旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,计算机系统700包括计算单元701,该计算单元701可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机存取存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储计算机系统700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
计算机系统700中的多个部件连接至I/O接口705,包括:输入单元706、输出单元707、存储单元708以及通信单元709。输入单元706可以是能向计算机系统700输入信息的任何类型的设备,输入单元706可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元707可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元708可以包括但不限于磁盘、光盘。通信单元709允许计算机系统700通过网络诸如因特网的与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如,蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理。例如,在一些实施例中,本公开实施例公开的上述方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如,存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到电子设备上。在一些实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行本公开实施例公开的上述方法。
本公开实施例还提供一种计算机可读存储介质,其中,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得该电子设备能够执行本公开实施例公开的上述方法。
本公开实施例中的计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。上述计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。更具体的,上述计算机可读存储介质可以包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
本公开实施例还提供一种计算机程序产品,包括计算机程序,其中,该计算机程序被处理器执行时实现本公开实施例公开的上述方法。
在本公开的实施例中,可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络(包括局域网(LAN)或广域网(WAN))连接到用户计算机,或者,可以连接到外部计算机。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块、部件或单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块、部件或单元的名称在某种情况下并不构成对该模块、部件或单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示例性的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本公开的一些实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
虽然已经通过示例对本公开的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本公开的范围。本领域的技术人员应该理解,可在不脱离本公开的范围和精神的情况下,对以上实施例进行修改。本公开的范围由所附权利要求来限定。
Claims (7)
1.一种客流预测方法,其特征在于,包括:
获取目标站点的样本客流数据;
对所述样本客流数据进行预处理,获得待构建客流预测模型的分类型输入信息和数值型输入信息;
将所述分类型输入信息和所述数值型输入信息输入至所述待构建客流预测模型中,获得预测客流数据;
若基于所述预测客流数据和所述样本客流数据的标签客流数据确定的所述待构建客流预测模型的损失未满足收敛条件,基于所述预测客流数据和所述标签客流数据更新所述待构建客流预测模型;否则,确定待构建客流预测模型为所述目标站点的目标客流预测模型;
利用所述目标客流预测模型预测所述目标站点的客流;
其中,所述对所述样本客流数据进行预处理,获得待构建客流预测模型的分类型输入信息和数值型输入信息,包括:
按照客流影响因素将所述样本客流数据划分为分类型客流数据和数值型客流数据;所述分类型客流数据包括天气因素数据和特征日与特征时段数据,所述数值型客流数据包括时间维度客流数据和空间维度客流数据;
对所述分类型客流数据依次进行独热编码和降维操作,获得待构建客流预测模型的分类型输入信息;
对所述数值型客流数据依次进行归一化处理,获得所述待构建客流预测模型的数值型输入信息;
所述待构建客流预测模型的网络架构包括输入层、双通道特征提取层、全连接层和输出层,所述双通道特征提取层包括分类型特征提取通道、数值型特征提取通道和特征融合模块;所述将所述分类型输入信息和所述数值型输入信息输入至所述待构建客流预测模型中,获得预测客流数据,包括:
利用所述输入层,将所述分类型输入信息和所述数值型输入信息输入至所述双通道特征提取层;
利用所述分类型特征提取通道从所述分类型输入信息提取分类型特征,利用所述数值型特征提取通道从所述数值型输入信息提取数值型特征,并利用所述特征融合模块对所述分类型特征和所述数值型特征进行融合,获得所述预测客流数据;
利用所述全连接层从所述双通道特征提取层提取所述预测客流数据,并将所述预测客流数据发送至所述输出层进行输出;
所述分类型特征提取通道和所述数值型特征提取通道均包括重置门和更新门;所述分类型特征和所述数值型特征的计算公式为:
,
其中,表示数值型特征提取通道的更新门,/>表示更新门的当前时刻输入信息的权重,/>表示数值型特征提取通道的当前时刻输入信息,/>表示更新门的上一时刻的隐藏状态的权重,/>表示数值型特征提取通道的上一时刻的隐藏状态,/>表示数值型特征提取通道的重置门,/>表示重置门的当前时刻输入信息的权重,/>表示重置门的上一时刻的隐藏状态的权重,/>表示数值型特征提取通道的候选隐藏状态,U表示候选隐藏状态的上一时刻的隐藏状态的权重,W表示候选隐藏状态的当前时刻输入信息的权重,/>表示数值型特征提取通道传递到下一时刻的隐藏状态,/>表示分类型特征提取通道的更新门,/>表示分类型特征提取通道的当前时刻输入信息,/>表示分类型特征提取通道的上一时刻的隐藏状态,/>表示分类型特征提取通道的重置门,/>表示分类型特征提取通道的候选隐藏状态,/>表示分类型特征提取通道传递到下一时刻的隐藏状态,“/>”表示哈达玛积;
所述预测客流数据的计算公式为:
,
其中,表示客流量的预测值,/>表示数值型特征的矩阵参数,/>表示分类型特征的矩阵参数。
2.根据权利要求1所述的方法,其特征在于,所述获取目标站点的样本客流数据,包括:
获取多个站点的样本客流数据;
对所述多个站点的样本客流数据进行聚类,得到多个站点类别;
将与所述目标站点属于同一所述站点类别的站点的样本客流数据,确定为目标站点的样本客流数据。
3.根据权利要求2所述的方法,其特征在于,所述样本客流数据包括样本进站客流数据和样本出站客流数据;所述对所述多个站点的样本客流数据进行聚类,得到多个站点类别,包括:
分别确定所述样本进站客流数据的进站不均衡系数和所述样本出站客流数据的出站不均衡系数;
利用所述进站不均衡系数和所述出站不均衡系数,对所述多个站点的样本客流数据进行聚类,得到多个站点类别。
4.根据权利要求1~3中任一项所述的方法,其特征在于,所述待构建客流预测模型的损失包括第一损失和第二损失,所述第一损失与所述待构建客流预测模型的模型参数相关,所述第二损失与所述待构建客流预测模型的超参数相关。
5.一种客流预测装置,其特征在于,包括:
获取模块,用于获取目标站点的样本客流数据;
预处理模块,用于对所述样本客流数据进行预处理,获得待构建客流预测模型的分类型输入信息和数值型输入信息;
训练模块,用于将所述分类型输入信息和所述数值型输入信息输入至所述待构建客流预测模型中,获得预测客流数据;
训练模块还用于若基于所述预测客流数据和所述样本客流数据的标签客流数据确定的所述待构建客流预测模型的损失未满足收敛条件,基于所述预测客流数据和所述标签客流数据更新所述待构建客流预测模型;否则,确定待构建客流预测模型为所述目标站点的目标客流预测模型;
预测模块,用于利用所述目标客流预测模型预测所述目标站点的客流;
其中,所述预处理模块还用于按照客流影响因素将所述样本客流数据划分为分类型客流数据和数值型客流数据;所述分类型客流数据包括天气因素数据和特征日与特征时段数据,所述数值型客流数据包括时间维度客流数据和空间维度客流数据;对所述分类型客流数据依次进行独热编码和降维操作,获得待构建客流预测模型的分类型输入信息;对所述数值型客流数据依次进行归一化处理,获得所述待构建客流预测模型的数值型输入信息;
所述待构建客流预测模型的网络架构包括输入层、双通道特征提取层、全连接层和输出层,所述双通道特征提取层包括分类型特征提取通道、数值型特征提取通道和特征融合模块;
所述训练模块还用于利用所述输入层,将所述分类型输入信息和所述数值型输入信息输入至所述双通道特征提取层;利用所述分类型特征提取通道从所述分类型输入信息提取分类型特征,利用所述数值型特征提取通道从所述数值型输入信息提取数值型特征,并利用所述特征融合模块对所述分类型特征和所述数值型特征进行融合,获得所述预测客流数据;利用所述全连接层从所述双通道特征提取层提取所述预测客流数据,并将所述预测客流数据发送至所述输出层进行输出;
所述分类型特征提取通道和所述数值型特征提取通道均包括重置门和更新门;所述分类型特征和所述数值型特征的计算公式为:
,
其中,表示数值型特征提取通道的更新门,/>表示更新门的当前时刻输入信息的权重,/>表示数值型特征提取通道的当前时刻输入信息,/>表示更新门的上一时刻的隐藏状态的权重,/>表示数值型特征提取通道的上一时刻的隐藏状态,/>表示数值型特征提取通道的重置门,/>表示重置门的当前时刻输入信息的权重,/>表示重置门的上一时刻的隐藏状态的权重,/>表示数值型特征提取通道的候选隐藏状态,U表示候选隐藏状态的上一时刻的隐藏状态的权重,W表示候选隐藏状态的当前时刻输入信息的权重,/>表示数值型特征提取通道传递到下一时刻的隐藏状态,/>表示分类型特征提取通道的更新门,/>表示分类型特征提取通道的当前时刻输入信息,/>表示分类型特征提取通道的上一时刻的隐藏状态,/>表示分类型特征提取通道的重置门,/>表示分类型特征提取通道的候选隐藏状态,/>表示分类型特征提取通道传递到下一时刻的隐藏状态,“/>”表示哈达玛积;
所述预测客流数据的计算公式为:
,
其中,表示客流量的预测值,/>表示数值型特征的矩阵参数,/>表示分类型特征的矩阵参数。
6.一种电子设备,其特征在于,包括:
至少一个处理器;
用于存储所述至少一个处理器可执行指令的存储器;
其中,所述至少一个处理器用于执行所述指令,以实现如权利要求1~4中任一项所述的方法的步骤。
7.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1~4中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410063382.6A CN117591919B (zh) | 2024-01-17 | 2024-01-17 | 客流预测方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410063382.6A CN117591919B (zh) | 2024-01-17 | 2024-01-17 | 客流预测方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117591919A CN117591919A (zh) | 2024-02-23 |
CN117591919B true CN117591919B (zh) | 2024-03-26 |
Family
ID=89913600
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410063382.6A Active CN117591919B (zh) | 2024-01-17 | 2024-01-17 | 客流预测方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117591919B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779196A (zh) * | 2016-12-05 | 2017-05-31 | 中国航天系统工程有限公司 | 一种基于旅游大数据的游客流量预测及峰值调控方法 |
CN112149902A (zh) * | 2020-09-23 | 2020-12-29 | 吉林大学 | 一种基于客流特征分析的地铁短时进站客流预测方法 |
CN113298314A (zh) * | 2021-06-10 | 2021-08-24 | 重庆大学 | 一种考虑动态时空相关性的轨道交通客流预测方法 |
CN113962472A (zh) * | 2021-10-31 | 2022-01-21 | 东南大学 | 一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法 |
WO2022142413A1 (zh) * | 2020-12-31 | 2022-07-07 | 深圳云天励飞技术股份有限公司 | 一种商城客流量的预测方法、装置、电子设备及存储介质 |
CN115392554A (zh) * | 2022-08-17 | 2022-11-25 | 北京建筑大学 | 基于深度图神经网络和环境融合的轨道客流预测方法 |
CN115759322A (zh) * | 2022-09-16 | 2023-03-07 | 金陵科技学院 | 一种城市轨道交通客流预测和影响的分析方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113240179B (zh) * | 2021-05-18 | 2022-02-11 | 重庆邮电大学 | 融合时空信息的轨道人流量预测方法及系统 |
CN113902011A (zh) * | 2021-10-08 | 2022-01-07 | 南威软件股份有限公司 | 基于循环神经网络的城市轨道交通短时客流预测方法 |
CN116542391B (zh) * | 2023-05-24 | 2024-01-05 | 上海纳儿电子科技有限公司 | 一种基于大数据的城市区域客流量预测方法 |
-
2024
- 2024-01-17 CN CN202410063382.6A patent/CN117591919B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779196A (zh) * | 2016-12-05 | 2017-05-31 | 中国航天系统工程有限公司 | 一种基于旅游大数据的游客流量预测及峰值调控方法 |
CN112149902A (zh) * | 2020-09-23 | 2020-12-29 | 吉林大学 | 一种基于客流特征分析的地铁短时进站客流预测方法 |
WO2022142413A1 (zh) * | 2020-12-31 | 2022-07-07 | 深圳云天励飞技术股份有限公司 | 一种商城客流量的预测方法、装置、电子设备及存储介质 |
CN113298314A (zh) * | 2021-06-10 | 2021-08-24 | 重庆大学 | 一种考虑动态时空相关性的轨道交通客流预测方法 |
CN113962472A (zh) * | 2021-10-31 | 2022-01-21 | 东南大学 | 一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法 |
CN115392554A (zh) * | 2022-08-17 | 2022-11-25 | 北京建筑大学 | 基于深度图神经网络和环境融合的轨道客流预测方法 |
CN115759322A (zh) * | 2022-09-16 | 2023-03-07 | 金陵科技学院 | 一种城市轨道交通客流预测和影响的分析方法 |
Non-Patent Citations (2)
Title |
---|
北京地铁5号线运营对轨道交通客流预测的启示;安栓庄;王波;李晓霞;;都市快轨交通;20081218(第06期);全文 * |
基于数据融合与方法融合的城市轨道交通短时客流预测;欧雪雯;CNKI优秀硕士学位论文全文库;20230501;第11-40页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117591919A (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tekouabou et al. | Improving parking availability prediction in smart cities with IoT and ensemble-based model | |
CN113902011A (zh) | 基于循环神经网络的城市轨道交通短时客流预测方法 | |
EP3258430A1 (en) | Transport capacity scheduling method and system | |
CN110503245B (zh) | 一种机场航班大面积延误风险的预测方法 | |
CN108596727A (zh) | 一种共享单车的管理与决策方法 | |
CN111489008B (zh) | 一种交通事故影响因素空间效应分析方法及其应用 | |
CN113159364A (zh) | 一种大型交通场站的客流预测方法及系统 | |
CN114330868A (zh) | 基于自注意力的个性化增强图卷积网络的客流预测方法 | |
CN111582559B (zh) | 一种到达时间的预估方法及装置 | |
CN106970986B (zh) | 基于深度学习的城市内涝影响程度挖掘方法及系统 | |
Chen et al. | A multiscale-grid-based stacked bidirectional GRU neural network model for predicting traffic speeds of urban expressways | |
CN112418518A (zh) | 基于时间特征权重和线网拓扑的客流预测方法及装置 | |
CN112884222A (zh) | 一种面向时间段的lstm交通流密度预测方法 | |
CN116110234B (zh) | 基于人工智能的车流量预测方法、装置及其应用 | |
CN114943356A (zh) | 一种机场到港旅客乘坐出租车短时需求集成预测方法 | |
CN109816983A (zh) | 一种基于深度残差网络的短时交通流量预测方法 | |
CN116933946A (zh) | 一种基于客流去向结构的轨道交通od客流预测方法及系统 | |
US12026951B2 (en) | Methods and internet of things systems for place management and control of smart cities | |
CN117591919B (zh) | 客流预测方法、装置、电子设备和存储介质 | |
CN113298309A (zh) | 用于交通拥堵状态预测的方法、装置及终端 | |
CN116935643A (zh) | 交通管理方法、装置、设备及存储介质 | |
Faghih et al. | Predicting short-term Uber demand using spatio-temporal modeling: A New York City Case Study | |
CN114724414B (zh) | 城市空中交通分担率的确定方法、装置、电子设备及介质 | |
Mead | Hybrid CNN and LSTM Model (HCLM) for Short-Term Traffic Volume Prediction | |
WO2022252850A1 (zh) | 航班的季节性归类方法、装置及机器可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |