CN114066038A - 一种地铁客流的预测方法及系统 - Google Patents
一种地铁客流的预测方法及系统 Download PDFInfo
- Publication number
- CN114066038A CN114066038A CN202111329365.5A CN202111329365A CN114066038A CN 114066038 A CN114066038 A CN 114066038A CN 202111329365 A CN202111329365 A CN 202111329365A CN 114066038 A CN114066038 A CN 114066038A
- Authority
- CN
- China
- Prior art keywords
- data
- passenger flow
- time sequence
- time
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000007613 environmental effect Effects 0.000 claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 24
- 230000000875 corresponding effect Effects 0.000 claims description 51
- 230000002159 abnormal effect Effects 0.000 claims description 42
- 238000012937 correction Methods 0.000 claims description 13
- 238000013139 quantization Methods 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 238000012986 modification Methods 0.000 claims description 8
- 230000004048 modification Effects 0.000 claims description 8
- 230000005856 abnormality Effects 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 241000728173 Sarima Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Train Traffic Observation, Control, And Security (AREA)
Abstract
本发明提供一种地铁客流的预测方法及系统,涉及客流预测技术领域,包括:持续采集至少一待预测地铁站的在一预设时长内的实时客流量和至少一环境数据,以分别得到绑定有待预测地铁站的一身份编码的客流量时序数据和环境时序数据;根据各实时客流量和环境数据的采集时刻对身份编码对应的客流量时序数据和环境时序数据进行关联得到一多维时序数据;根据预设的至少一特征工程模型分别对多维时序数据进行特征工程得到对应的量化时序数据;将身份编码对应的量化时序数据输入预先训练得到的一多重时序预测模型中预测得到身份编码对应的待预测地铁站在未来一时间段的预测客流量。有益效果是大大节省算力开销的同时能够获取更为精准的预测客流量。
Description
技术领域
本发明涉及客流预测技术领域,尤其涉及一种地铁客流的预测方法及系统。
背景技术
目前,对城市轨道交通线路客流预测尚处于探索阶段。地铁因在绿色、环保和运量等方面领先于其他城市公共交通方式,成为各大城市优先发展的交通方式。随着新建成线路的投入运营,线网规模的日益扩大和运输组织形式的日益复杂,地铁客流的安全形势日益严峻,需要根据客流量的变化及时采取相应措施对地铁的客流进行有效疏通,这对运营组织提出了更高的要求。
国内外的研究人员已经提出了诸多理论和方法,以实现连续交通流状态的实时预测,主要包括基于历史平均、基于时间序列方法(例如SARIMA模型)、基于机器学习的神经网络方法、K-近邻方法、支持向量机方法等,其中每一类预测方法又包含若干种预测模型。
其中,采用时间序列预测时,存在以下技术问题:
1、数据的问题,例如无法完整收集所有影响因素的数据,影响因素在未来具有不确定性,有时只有很少甚至没有历史数据或者时序数据存在一定异常和干扰。数据往往是卡住大多数时序预测工作负载最大的问题。
2、传统的时间序列预测方法(ARIMA等)往往针对一维时间序列本身建模,难以利用额外特征,使预测结果更贴合实际业务场景,且现有技术是简单地输出一个预测值,不能得到预测值的概率分布。
3、冷启动问题对时间序列预测一直以来是个难题,即历史数据很少难以支撑模型进行未来的预测。
4、现有的时序预测模型大部分只是从数据分析的角度出发,未在实际大数据流式计算的生产场景下进行适应性研究,没有考虑到大规模站点的训练和预测的算力和时间的开销,且大部分时序预测算法,并未对异常时序数据进行异常检测预警。
发明内容
针对现有技术中存在的问题,本发明提供一种地铁客流的预测方法,包括:
步骤S1,持续采集至少一待预测地铁站的在一预设时长内的实时客流量和至少一环境数据,以分别得到绑定有所述待预测地铁站的一身份编码的客流量时序数据和环境时序数据;
步骤S2,根据各所述实时客流量和所述环境数据的采集时刻对所述身份编码对应的所述客流量时序数据和所述环境时序数据进行关联得到一多维时序数据;
步骤S3,根据预设的至少一特征工程模型分别对所述多维时序数据进行特征工程得到对应的量化时序数据;
步骤S4,将所述身份编码对应的所述量化时序数据输入预先训练得到的一多重时序预测模型中预测得到所述身份编码对应的所述待预测地铁站在未来一时间段的预测客流量。
优选的,所述环境数据包括所述待预测地铁站周围的一预设范围内的单车流量数据,和/或交通态势数据,和/或天气数据,和/或节假日数据。
优选的,所述步骤S2中,根据各所述实时客流量和所述环境数据的采集时刻,并采用一预设时间窗口对所述客流量时序数据和所述环境时序数据进行关联得到所述多维时序数据。
优选的,执行所述步骤S4之前,还包括一数据修正过程,包括:
步骤A1,对所述量化时序数据进行异常值识别得到所述量化时序数据中的异常数据;
步骤A2,针对每个所述异常数据,根据所述异常数据在所述量化时序数据中所在的时序位置,获取所述时序位置前后对应的数据时序变化趋势,并根据所述数据时序变化趋势对所述异常数据进行数据修正得到修正数据,使得所述修正数据满足所述数据时序变化趋势,以对所述量化时序数据进行更新;
则所述步骤S4中,将更新后的所述量化时序数据输入所述多重时序预测模型中得到所述身份编码对应的所述待预测地铁站在未来一时间段的所述预测客流量。
优选的,所述步骤A1中,采用孤立森林算法对所述量化时序数据进行异常值识别得到所述异常数据。
优选的,执行所述步骤S4之后,还包括一客流预警过程,包括:
步骤B1,针对每个所述待预测地铁站,将对应的所述预设时长内的所述客流量时序数据输入预先训练得到的一客流预测模型预测得到所述待预测地铁站在未来所述时间段的标准客流量;
步骤B2,判断所述预测客流量是否大于所述标准客流量:
若否,则退出;
若是,则转向步骤B3;
步骤B3,判断所述预测客流量与所述标准客流量之间的差值绝对值是否大于一阈值:
若否,则退出;
若是,则生成一预警提示信息,以提示所述待预测地铁站的工作人员预先部署疏散措施。
优选的,所述客流预测模型为自编码器模型。
优选的,所述多重时序预测模型为DeepAR模型。
本发明还提供一种地铁客流的预测系统,应用上述的地铁客流的预测方法,所述地铁客流的预测系统包括:
数据采集模块,用于持续采集至少一待预测地铁站的在一预设时长内的实时客流量和至少一环境数据,以分别得到绑定有所述待预测地铁站的一身份编码的客流量时序数据和环境时序数据;
数据关联模块,连接所述数据采集模块,用于根据各所述实时客流量和所述环境数据的采集时刻对所述身份编码对应的所述客流量时序数据和所述环境时序数据进行关联得到一多维时序数据;
数据量化模块,连接所述数据关联模块,用于根据预设的至少一特征工程模型分别对所述多维时序数据进行特征工程得到对应的量化时序数据;
客流预测模块,连接所述数据量化模块,用于将所述身份编码对应的所述量化时序数据输入预先训练得到的一多重时序预测模型中预测得到所述身份编码对应的所述待预测地铁站在未来一时间段的预测客流量。
优选的,还包括一数据修正模块,分别连接所述数据量化模块和所述客流预测模块,所述数据修正模块包括:
异常识别单元,用于对所述量化时序数据进行异常值识别得到所述量化时序数据中的异常数据;
异常修正单元,连接所述异常识别单元,用于针对每个所述异常数据,根据所述异常数据在所述量化时序数据中所在的时序位置,获取所述时序位置前后对应的数据时序变化趋势,并根据所述数据时序变化趋势对所述异常数据进行数据修正得到修正数据,使得所述修正数据满足所述数据时序变化趋势,以对所述量化时序数据进行更新;
则所述客流预测模块将更新后的所述量化时序数据输入所述多重时序预测模型中得到所述身份编码对应的所述待预测地铁站在未来一时间段的所述预测客流量。
上述技术方案具有如下优点或有益效果:
1)通过融合多种环境数据,对多地铁站点的多重时间序列进行单模型的训练,使得通过一个多重时序预测模型能够实现多个地铁站点的客流量预测,而无需针对每个地铁站点分别进行对应模型训练及预测,大大节省算力开销的同时,使得地铁客流量预测更贴合实际业务场景,进而能够获取更为精准的预测客流量;
2)采用多重时序预测模型进行客流量预测,实现新增地铁站点时,只要其客流量变化趋势以及环境数据与已采用该多重时序预测模型进行客流量预测的地铁站点相似,即可直接应用该多重时序预测模型进行新增地铁站点的客流量预测,有效解决冷启动问题;
3)采用多重时序预测模型进行客流量预测,实现新增地铁站点时,若其客流量变化趋势以及环境数据与已采用该多重时序预测模型进行客流量预测的地铁站点差异较大,则只需持续采集该新增地铁站点的实时客流量和对应的环境数据更新模型训练样本,进而对多重时序预测模型进行更新训练即可,方便业务拓展;
4)采用持久化的特征工程模型对多维时序数据进行特征工程,有效提升预测效率;
5)配置客流预警过程,实现在预测未来时间段出现超出标准的客流量的大流量场景时,能够自动预警,使得地铁工作人员能够预先部署疏散措施。
附图说明
图1为本发明的较佳的实施例中,一种地铁客流的预测方法的流程示意图;
图2为本发明的较佳的实施例中,数据修正过程的流程示意图;
图3为本发明的较佳的实施例中,客流预警过程的流程示意图;
图4为本发明的较佳的实施例中,一种地铁客流的预测系统的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本发明并不限定于该实施方式,只要符合本发明的主旨,则其他实施方式也可以属于本发明的范畴。
本发明的较佳的实施例中,基于现有技术中存在的上述问题,现提供一种地铁客流的预测方法,如图1所示,包括:
步骤S1,持续采集至少一待预测地铁站的在一预设时长内的实时客流量和至少一环境数据,以分别得到绑定有待预测地铁站的一身份编码的客流量时序数据和环境时序数据;
步骤S2,根据各实时客流量和环境数据的采集时刻对身份编码对应的客流量时序数据和环境时序数据进行关联得到一多维时序数据;
步骤S3,根据预设的至少一特征工程模型分别对多维时序数据进行特征工程得到对应的量化时序数据;
步骤S4,将身份编码对应的量化时序数据输入预先训练得到的一多重时序预测模型中预测得到身份编码对应的待预测地铁站在未来一时间段的预测客流量。
具体地,本技术方案着眼于解决多地铁站点时序预测预警的大数据场景下数据质量差,传统时序模型未能量化业务场景的关键外部因素,单模型只能预测单一时间序列算力消耗较大,且串行预测对于大规模地铁站点的实时预测来说时间开销过大的问题。
进一步具体地,上述实时客流量以及环境数据为实时流数据。优选的,本技术方案运行于spark大数据计算框架中,将多维时序数据推送至kafka消息中间件,实现分布式完成多维时序数据的特征工程以及量化时序数据的预测,有效提升预测效率。
本发明的较佳的实施例中,环境数据包括待预测地铁站周围的一预设范围内的单车流量数据,和/或交通态势数据,和/或天气数据,和/或节假日数据。
具体地,本实施例中,上述预测范围包括但不限于以待预测地铁站为圆心,以一预设值为半径圈定的圆形区域,具体可根据实际需求进行设定。其中,可以从城运中心获取地铁站每五分钟的进站和出站人数作为实时客流量;上述单车流量数据包括但不限于地铁站附近的共享单车每隔一定时间段的用车和还车数量;上述交通态势数据和天气数据可以通过爬取高德的天气数据以及公路道路情况数据获取。
本实施例中,以上述实时客流量为主,结合影响客流量的各环境数据进行客流量预测,能够有效贴合城市运行规律和业务场景,使得预测结果更为精准。
本发明的较佳的实施例中,步骤S2中,根据各实时客流量和环境数据的采集时刻,并采用一预设时间窗口对客流量时序数据和环境时序数据进行关联得到多维时序数据。
具体地,本实施例中,由于实时客流量以及不同环境数据的采集周期不尽相同,需要对客流量时序数据和环境时序数据进行关联得到多维时序数据。举例来说,在A1时刻、B1时刻、C1时刻、D1时刻分别采集得到对应的实时客流量,在A2时刻、B2时刻、C2时刻、D2时刻分别采集得到对应的单车流量数据,其中,上述各时刻均不相同,则可以采用预设时间窗口将零散的实时客流量和单车流量数据进行关联。如可以配置预设时间窗口的时间长度为10分钟,该预设时间窗口的起始时间可以根据时间调整,如起始时间为E时刻,该E时刻为上述各时刻之前,且A1时刻、B1时刻、A2时刻、B2时刻、C2时刻在E时刻和E+10时刻之间,则将A1时刻、B1时刻对应的实时客流量和A2时刻、B2时刻、C2时刻对应的单车流量数据进行关联,其对应于E时刻和E+10时刻之间。其他时刻的关联方式以此类推,此处不再赘述。以C1时刻、D1时刻的实时客流量与D2时刻的单车流量数据关联且对应于E+10时刻之后为例,则最终得到的多维时序数据形式如下:
[(A1时刻、B1时刻对应的实时客流量;A2时刻、B2时刻、C2时刻对应的单车流量数据);(C1时刻、D1时刻的实时客流量;D2时刻的单车流量数据);…]
进一步地,由于不同多维时序数据中的实时客流量和环境数据可能存在非量化值,如天气数据包括晴天、多云、小雨等,如晴天采用0表示,多云采用1表示,小雨采用2表示,需要对其进行量化,实现数据量化进而得到量化时序数据。其中,采用持久化的特征工程模型实现上述量化规则的定义,保证每次量化结果的一致性,避免出现第一次将晴天采用0表示,多云采用1表示,小雨采用2表示,第二次将晴天采用1表示,多云采用0表示,小雨采用2表示,导致数据的不一致。
在获取量化时序数据后,将该量化时序数据输入预先训练得到多重时序预测模型中预测得到身份编码对应的待预测地铁站在未来一时间段的预测客流量。
进一步地,可以提供一数据库,用于保存各身份编码对应的量化时序数据作为多重时序预测模型的训练样本,进而为多重时序预测模型的更新提供源数据。
按照客流量将各地铁站点粗略划分为小站点和枢纽站点为例,其中,小站点相对于枢纽站点来说,其周围环境情况以及客流量与枢纽站点均存在较大的差异。若已经训练得到的多重时序预测模型的原训练样本均为小站点的实时客流量和环境数据,则在新增地铁站点为小站点时,虽然并未采集过该新增地铁站点的实时客流量和环境数据进行训练,但可以直接采用该多重时序预测模型进行新增地铁站点的客流量预测,有效解决冷启动问题。若新增地铁站点为枢纽站点,则可以持续采集一段时间的实时客流量和环境数据,经数据关联和量化后处理得到对应的量化时序数据,进而将该量化时序数据保存至上述数据库中,对原有的小站点的训练样本进行更新,随后基于更新后的训练样本进行训练以更新多重时序预测模型,则更新后的多重时序预测模型即可以用于预测小站点的客流量,也可以预测枢纽站点的客流量,方便业务拓展。
本发明的较佳的实施例中,执行步骤S4之前,如图2所示,还包括一数据修正过程,包括:
步骤A1,对量化时序数据进行异常值识别得到量化时序数据中的异常数据;
步骤A2,针对每个异常数据,根据异常数据在量化时序数据中所在的时序位置,获取时序位置前后对应的数据时序变化趋势,并根据数据时序变化趋势对异常数据进行数据修正得到修正数据,使得修正数据满足数据时序变化趋势,以对量化时序数据进行更新;
则步骤S4中,将更新后的量化时序数据输入多重时序预测模型中得到身份编码对应的待预测地铁站在未来一时间段的预测客流量。
具体地,本实施例中,在进行预测之前,通过对量化时序数据进行异常值识别和修正,能够提升模型输入数据的数据质量,进而提升预测精准度。进一步地,在进行模型训练时,作为训练样本的量化时序数据经异常值识别和修正后,能够提升训练样本的数据质量,进而使得训练得到的模型具有较高的预测精准度。
本发明的较佳的实施例中,步骤A1中,采用孤立森林算法对量化时序数据进行异常值识别得到异常数据。
本发明的较佳的实施例中,执行步骤S4之后,如图3所示,还包括一客流预警过程,包括:
步骤B1,针对每个待预测地铁站,将对应的预设时长内的客流量时序数据输入预先训练得到的一客流预测模型预测得到待预测地铁站在未来时间段的标准客流量;
步骤B2,判断预测客流量是否大于标准客流量:
若否,则退出;
若是,则转向步骤B3;
步骤B3,判断预测客流量与标准客流量之间的差值绝对值是否大于一阈值:
若否,则退出;
若是,则生成一预警提示信息,以提示待预测地铁站的工作人员预先部署疏散措施。
具体地,本实施例中,客流预测模型为自编码器模型,该自编码模型仅基于实时客流量进行流量预测,使得预测得到的标准客流量能够表征该待预测地铁站常规的客流量变化趋势。若多重时序预测模型预测得到的预测客流量远超过该标准客流量,则表明未来时间段会出现很大的客流量,此时给出预警提示信息,能够提示待预测地铁站的工作人员预先部署疏散措施。
本发明的较佳的实施例中,多重时序预测模型为DeepAR模型。
本发明还提供一种地铁客流的预测系统,应用上述的地铁客流的预测方法,如图4所示,地铁客流的预测系统包括:
数据采集模块1,用于持续采集至少一待预测地铁站的在一预设时长内的实时客流量和至少一环境数据,以分别得到绑定有待预测地铁站的一身份编码的客流量时序数据和环境时序数据;
数据关联模块2,连接数据采集模块1,用于根据各实时客流量和环境数据的采集时刻对身份编码对应的客流量时序数据和环境时序数据进行关联得到一多维时序数据;
数据量化模块3,连接数据关联模块2,用于根据预设的至少一特征工程模型分别对多维时序数据进行特征工程得到对应的量化时序数据;
客流预测模块4,连接数据量化模块3,用于将身份编码对应的量化时序数据输入预先训练得到的一多重时序预测模型中预测得到身份编码对应的待预测地铁站在未来一时间段的预测客流量。
本发明的较佳的实施例中,还包括一数据修正模块5,分别连接数据量化模块3和客流预测模块4,数据修正模块5包括:
异常识别单元51,用于对量化时序数据进行异常值识别得到量化时序数据中的异常数据;
异常修正单元52,连接异常识别单元51,用于针对每个异常数据,根据异常数据在量化时序数据中所在的时序位置,获取时序位置前后对应的数据时序变化趋势,并根据数据时序变化趋势对异常数据进行数据修正得到修正数据,使得修正数据满足数据时序变化趋势,以对量化时序数据进行更新;
则客流预测模块4将更新后的量化时序数据输入多重时序预测模型中得到身份编码对应的待预测地铁站在未来一时间段的预测客流量。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
Claims (10)
1.一种地铁客流的预测方法,其特征在于,包括:
步骤S1,持续采集至少一待预测地铁站的在一预设时长内的实时客流量和至少一环境数据,以分别得到绑定有所述待预测地铁站的一身份编码的客流量时序数据和环境时序数据;
步骤S2,根据各所述实时客流量和所述环境数据的采集时刻对所述身份编码对应的所述客流量时序数据和所述环境时序数据进行关联得到一多维时序数据;
步骤S3,根据预设的至少一特征工程模型分别对所述多维时序数据进行特征工程得到对应的量化时序数据;
步骤S4,将所述身份编码对应的所述量化时序数据输入预先训练得到的一多重时序预测模型中预测得到所述身份编码对应的所述待预测地铁站在未来一时间段的预测客流量。
2.根据权利要求1所述的地铁客流的预测方法,其特征在于,所述环境数据包括所述待预测地铁站周围的一预设范围内的单车流量数据,和/或交通态势数据,和/或天气数据,和/或节假日数据。
3.根据权利要求1所述的地铁客流的预测方法,其特征在于,所述步骤S2中,根据各所述实时客流量和所述环境数据的采集时刻,并采用一预设时间窗口对所述客流量时序数据和所述环境时序数据进行关联得到所述多维时序数据。
4.根据权利要求1所述的地铁客流的预测方法,其特征在于,执行所述步骤S4之前,还包括一数据修正过程,包括:
步骤A1,对所述量化时序数据进行异常值识别得到所述量化时序数据中的异常数据;
步骤A2,针对每个所述异常数据,根据所述异常数据在所述量化时序数据中所在的时序位置,获取所述时序位置前后对应的数据时序变化趋势,并根据所述数据时序变化趋势对所述异常数据进行数据修正得到修正数据,使得所述修正数据满足所述数据时序变化趋势,以对所述量化时序数据进行更新;
则所述步骤S4中,将更新后的所述量化时序数据输入所述多重时序预测模型中得到所述身份编码对应的所述待预测地铁站在未来一时间段的所述预测客流量。
5.根据权利要求4所述的地铁客流的预测方法,其特征在于,所述步骤A1中,采用孤立森林算法对所述量化时序数据进行异常值识别得到所述异常数据。
6.根据权利要求1所述的地铁客流的预测方法,其特征在于,执行所述步骤S4之后,还包括一客流预警过程,包括:
步骤B1,针对每个所述待预测地铁站,将对应的所述预设时长内的所述客流量时序数据输入预先训练得到的一客流预测模型预测得到所述待预测地铁站在未来所述时间段的标准客流量;
步骤B2,判断所述预测客流量是否大于所述标准客流量:
若否,则退出;
若是,则转向步骤B3;
步骤B3,判断所述预测客流量与所述标准客流量之间的差值绝对值是否大于一阈值:
若否,则退出;
若是,则生成一预警提示信息,以提示所述待预测地铁站的工作人员预先部署疏散措施。
7.根据权利要求6所述的地铁客流的预测方法,其特征在于,所述客流预测模型为自编码器模型。
8.根据权利要求1所述的地铁客流的预测方法,其特征在于,所述多重时序预测模型为DeepAR模型。
9.一种地铁客流的预测系统,其特征在于,应用如权利要求1-8中任意一项所述的地铁客流的预测方法,所述地铁客流的预测系统包括:
数据采集模块,用于持续采集至少一待预测地铁站的在一预设时长内的实时客流量和至少一环境数据,以分别得到绑定有所述待预测地铁站的一身份编码的客流量时序数据和环境时序数据;
数据关联模块,连接所述数据采集模块,用于根据各所述实时客流量和所述环境数据的采集时刻对所述身份编码对应的所述客流量时序数据和所述环境时序数据进行关联得到一多维时序数据;
数据量化模块,连接所述数据关联模块,用于根据预设的至少一特征工程模型分别对所述多维时序数据进行特征工程得到对应的量化时序数据;
客流预测模块,连接所述数据量化模块,用于将所述身份编码对应的所述量化时序数据输入预先训练得到的一多重时序预测模型中预测得到所述身份编码对应的所述待预测地铁站在未来一时间段的预测客流量。
10.根据权利要求9所述的地铁客流的预测系统,其特征在于,还包括一数据修正模块,分别连接所述数据量化模块和所述客流预测模块,所述数据修正模块包括:
异常识别单元,用于对所述量化时序数据进行异常值识别得到所述量化时序数据中的异常数据;
异常修正单元,连接所述异常识别单元,用于针对每个所述异常数据,根据所述异常数据在所述量化时序数据中所在的时序位置,获取所述时序位置前后对应的数据时序变化趋势,并根据所述数据时序变化趋势对所述异常数据进行数据修正得到修正数据,使得所述修正数据满足所述数据时序变化趋势,以对所述量化时序数据进行更新;
则所述客流预测模块将更新后的所述量化时序数据输入所述多重时序预测模型中得到所述身份编码对应的所述待预测地铁站在未来一时间段的所述预测客流量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111329365.5A CN114066038B (zh) | 2021-11-10 | 2021-11-10 | 一种地铁客流的预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111329365.5A CN114066038B (zh) | 2021-11-10 | 2021-11-10 | 一种地铁客流的预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114066038A true CN114066038A (zh) | 2022-02-18 |
CN114066038B CN114066038B (zh) | 2024-07-09 |
Family
ID=80274802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111329365.5A Active CN114066038B (zh) | 2021-11-10 | 2021-11-10 | 一种地铁客流的预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114066038B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114580787A (zh) * | 2022-04-02 | 2022-06-03 | 佳都科技集团股份有限公司 | 一种基于公交地铁接驳站点的客流量预测方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537392A (zh) * | 2018-04-26 | 2018-09-14 | 重庆大学 | 一种基于时空特征预测轨道交通站点出站客流量的方法 |
CN109697207A (zh) * | 2018-12-25 | 2019-04-30 | 苏州思必驰信息科技有限公司 | 时序数据的异常监控方法及系统 |
CN110400462A (zh) * | 2019-07-26 | 2019-11-01 | 中国安全生产科学研究院 | 基于模糊理论的轨道交通客流监测预警方法及其系统 |
CN111178598A (zh) * | 2019-12-16 | 2020-05-19 | 中国铁道科学研究院集团有限公司 | 铁路客运站客流量预测方法、系统、电子设备及存储介质 |
CN111191710A (zh) * | 2019-12-26 | 2020-05-22 | 广州优策科技有限公司 | 一种基于大数据的异常航班识别方法 |
CN112070324A (zh) * | 2020-11-11 | 2020-12-11 | 江西鹭鹭行科技有限公司 | 站点客流量预测方法、装置、可读存储介质及计算机设备 |
CN113177657A (zh) * | 2021-04-20 | 2021-07-27 | 上海大学 | 轨道交通客流预测方法及装置 |
CN113568774A (zh) * | 2021-07-27 | 2021-10-29 | 东华大学 | 使用无监督深度神经网络的多维时序数据实时异常检测方法 |
-
2021
- 2021-11-10 CN CN202111329365.5A patent/CN114066038B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537392A (zh) * | 2018-04-26 | 2018-09-14 | 重庆大学 | 一种基于时空特征预测轨道交通站点出站客流量的方法 |
CN109697207A (zh) * | 2018-12-25 | 2019-04-30 | 苏州思必驰信息科技有限公司 | 时序数据的异常监控方法及系统 |
CN110400462A (zh) * | 2019-07-26 | 2019-11-01 | 中国安全生产科学研究院 | 基于模糊理论的轨道交通客流监测预警方法及其系统 |
CN111178598A (zh) * | 2019-12-16 | 2020-05-19 | 中国铁道科学研究院集团有限公司 | 铁路客运站客流量预测方法、系统、电子设备及存储介质 |
CN111191710A (zh) * | 2019-12-26 | 2020-05-22 | 广州优策科技有限公司 | 一种基于大数据的异常航班识别方法 |
CN112070324A (zh) * | 2020-11-11 | 2020-12-11 | 江西鹭鹭行科技有限公司 | 站点客流量预测方法、装置、可读存储介质及计算机设备 |
CN113177657A (zh) * | 2021-04-20 | 2021-07-27 | 上海大学 | 轨道交通客流预测方法及装置 |
CN113568774A (zh) * | 2021-07-27 | 2021-10-29 | 东华大学 | 使用无监督深度神经网络的多维时序数据实时异常检测方法 |
Non-Patent Citations (1)
Title |
---|
朱刚等: "基于深度学习模型的DeepAR的时间序列预测及应用实例", 《电子商务》, vol. 07, 31 December 2020 (2020-12-31), pages 83 - 86 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114580787A (zh) * | 2022-04-02 | 2022-06-03 | 佳都科技集团股份有限公司 | 一种基于公交地铁接驳站点的客流量预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114066038B (zh) | 2024-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107862864B (zh) | 基于驾驶习惯和交通路况的行驶工况智能预测估计方法 | |
CN109117987B (zh) | 一种基于深度学习的个性化交通事故风险预测推荐方法 | |
CN108417033B (zh) | 基于多维因素的高速路交通事故分析预测方法 | |
CN110361207B (zh) | 一种智能列车走行部在线状态预测系统及其方法 | |
CN110570678B (zh) | 一种公交车辆从起点到终点总行驶时间预测方法及装置 | |
CN104834977A (zh) | 基于距离度量学习的交通警情等级预测方法 | |
CN102765643A (zh) | 基于数据驱动的电梯故障诊断与预警方法 | |
CN111126868B (zh) | 一种道路交通事故发生风险确定方法及系统 | |
CN112258251B (zh) | 基于灰色关联的电动汽车换电需求的集成学习预测方法及系统 | |
CN110619419B (zh) | 城市轨道交通的客流预测方法 | |
CN111027673B (zh) | 一种地铁客流量预测方法 | |
CN109858681B (zh) | 一种基于ic卡的交通短时客流预测方法和相关装置 | |
CN112734094B (zh) | 一种智慧城市智轨车辆故障基因预测方法及系统 | |
CN114066038A (zh) | 一种地铁客流的预测方法及系统 | |
CN114418606A (zh) | 基于时空卷积网络的网约车订单需求预测方法 | |
CN115774942A (zh) | 基于车联网实车数据和svm的驾驶风格辨识模型建模与统计方法 | |
CN115169714A (zh) | 城市地铁进出站客流量预测方法 | |
CN110598747B (zh) | 基于自适应k均值聚类算法的道路分类方法 | |
CN114611764B (zh) | 一种特定区域内企业工业用水异常监测预警方法 | |
CN117574982B (zh) | 一种基于线性变换的预训练模型微调方法和装置 | |
CN112950926A (zh) | 一种基于大数据和深度学习的城市主干道路速度预测方法 | |
CN110097144A (zh) | 一种轮胎自动检测大数据与云计算系统及其应用研究 | |
CN117057568B (zh) | 一种基于深度学习枢纽网约车需求预测与调度一体化方法 | |
CN113420059A (zh) | 一种市民热线问题主动治理方法和装置 | |
CN110119891B (zh) | 一种适于大数据的交通安全影响因素辨识方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |