CN113221472B - 一种基于lstm的客流预测方法 - Google Patents

一种基于lstm的客流预测方法 Download PDF

Info

Publication number
CN113221472B
CN113221472B CN202110769808.6A CN202110769808A CN113221472B CN 113221472 B CN113221472 B CN 113221472B CN 202110769808 A CN202110769808 A CN 202110769808A CN 113221472 B CN113221472 B CN 113221472B
Authority
CN
China
Prior art keywords
airport
data
time
passenger flow
day
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110769808.6A
Other languages
English (en)
Other versions
CN113221472A (zh
Inventor
佟路
廖盛时
曹先彬
杜文博
朱熙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHECC Data Co Ltd
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202110769808.6A priority Critical patent/CN113221472B/zh
Publication of CN113221472A publication Critical patent/CN113221472A/zh
Application granted granted Critical
Publication of CN113221472B publication Critical patent/CN113221472B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/12Timing analysis or timing optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明属于交通客流预测技术领域,涉及一种基于LSTM的客流预测方法。本发明基于AFC数据、航班时刻表、天气、日期四种数据,通过对影响机场轨道交通客流的关键因素进行分析提取,其中,对于AFC数据,提取出各个时间片内的机场到市区方向的客流量和市区到机场方向的客流量;对于航班时刻表数据,提取出各个时间片内计划起飞的航班数以及计划降落的航班数;之后对每一个时间片标注其对应的日期、时段以及天气信息,以及对各项输入数据进行标准化处理;最后通过设计时间‑特征协同注意力机制,使得LSTM网络可以动态捕捉不同时序上多维特征对机场客流的影响程度,从而有效提高了机场轨道交通客流预测模型的预测精度。

Description

一种基于LSTM的客流预测方法
技术领域
本发明属于交通客流预测技术领域,涉及一种基于长短期记忆人工神经网络(LSTM)并结合时间-特征协同注意力机制的机场轨道交通客流预测方法。
背景技术
随着我国民航业的迅猛发展,机场客运量逐年增加,根据我国民航局数据统计,2019年全年完成运输总周转量1292.7亿吨公里、旅客运输量6.6亿人次,同比分别增长7.1%、7.9%。不断增长的客运量不仅对机场枢纽的运营管理带来压力,同时还给机场枢纽的集输运系统带来了很大的挑战。机场轨道交通凭借其运量大、速度快、准点性高的优势,成为了衔接机场与市区的重要交通方式,且未来承担的机场客流分担率还将进一步提高。统计数据显示,全球共有将近240个机场己经建设或规划了衔接机场的轨道交通,截至2018年底,我国大陆共有35个城市开通城市轨道交通运营线路185条,运营线路总长度5761.4公里。
虽然目前我国交通基础设施建设取得了长足的发展,但是枢纽机场与轨道交通之间衔接不畅问题仍然十分突出,机场轨道交通时常出现“客流-运力”不匹配问题,成为机场整体运转效率的瓶颈。因此,为了提高机场运转效率以及机场轨道交通运营组织水平,亟需实现机场轨道交通客流的精准预测,为提升枢纽运营水平提供关键支撑。
发明内容
为了弥补现有机场轨道交通客流预测方面研究的不足,本发明提出了一种基于LSTM并结合时间-特征协同注意力机制的机场轨道交通客流预测方法。本发明结合AFC数据、航班时刻表、天气、日期四种数据,通过对影响机场轨道交通客流的关键因素进行分析提取,以及对数据进行标准化处理,构建机场轨道交通短时客流预测模型,从而实现待测机场轨道交通客流的准确预测。
为实现上述目的,本发明提供了一种基于LSTM的客流预测方法,包括如下步骤:
S1: 获取待测机场轨道交通线路所在城市N天的AFC原始数据、与待测机场轨道交通线路连接的机场的航班时刻表原始数据、天气数据,
S2:对所述AFC原始数据和所述航班时刻表原始数据进行预处理,保留有效AFC数据和有效航班时刻表数据;
S3:对获取的有效AFC数据进行整理,提取出N天中各个时间片内的所述机场到市区方向的客流量、N天中各个时间片内的市区到所述机场方向的客流量;并对获取的有效航班时刻表数据进行整理,提取出N天中各个时间片内所述机场计划起飞航班数以及计划降落航班数;
S4: 对步骤S3中提取的数据进行标准化处理;
S5:对每个时间片内的数据标注其对应的日期信息、时段信息以及天气状况;
S6:基于标准化处理后的数据以及标注有对应的日期信息、时段信息以及天气状况的数据,构建数据集并分为训练集和测试集;
S7:基于 LSTM网络并结合时间-特征协同注意力机制,建立机场轨道交通客流预测模型,包括LSTM层、时间-特征协同注意力层和两个全连接层;利用训练集和测试集,对所建立的机场轨道交通客流预测模型进行训练和测试,得到最终的机场轨道交通客流预测模型并利用该机场轨道交通客流预测模型对机场轨道交通的实时客流进行预测。
进一步,步骤S2具体过程为:
1)对海量AFC原始数据进行数据清洗,筛选出所有刷卡类型为地铁的AFC数据;接着根据进站点和出站点对所有地铁的AFC数据进行进一步筛选,只保留进站点或者出站点为所述机场的AFC数据;
2)对航班时刻表原始数据进行数据清洗,对于起飞机场或降落机场字段有缺失的航班时刻表原始数据,根据经纬度信息匹配出对应的机场名,从而对缺失字段进行补全,当起飞机场或降落机场字段和经纬度字段均缺失时,则删除该条航班时刻表原始数据。
进一步,步骤S3中,将机场轨道每一天首班发车整点时刻
Figure 464494DEST_PATH_IMAGE001
到末班发车整点时刻
Figure 619531DEST_PATH_IMAGE002
Figure 764205DEST_PATH_IMAGE003
为时间间隔等分成cnt个时间片,
N天中cnt个时间片内的所述机场到市区方向的客流量记为
Figure 346496DEST_PATH_IMAGE004
,其中,
Figure 6147DEST_PATH_IMAGE005
表示第k天中第j个时间片内的所述机场到市区方向的客流量;
N天中cnt个时间片内的市区到所述机场方向的客流量记为
Figure 902559DEST_PATH_IMAGE006
,其中,
Figure 432898DEST_PATH_IMAGE007
表示第k天中第j个时间片内的市区到所述机场方向的客流量;
N天中cnt个时间片内所述机场计划起飞的航班数记为
Figure 451669DEST_PATH_IMAGE008
,其中,
Figure 333038DEST_PATH_IMAGE009
表示第k天中第j个时间片内的计划起飞的航班数;
N天中cnt个时间片内所述机场计划降落的航班数记为
Figure 826948DEST_PATH_IMAGE010
,其中,
Figure 680635DEST_PATH_IMAGE011
表示第k天中第j个时间片内的计划降落的航班数。
进一步,利用min-max标准化法对步骤S3中提取的数据进行标准化处理。
进一步,步骤S5具体过程如下:
统计N天中每一天的日期信息
Figure 339149DEST_PATH_IMAGE012
,其中,
Figure 973393DEST_PATH_IMAGE013
表示第k天的日期信息,将日期信息分为休息日和工作日两类,分别用0和1表示;
将首班发车时刻
Figure 211607DEST_PATH_IMAGE014
到末班发车时刻
Figure 982117DEST_PATH_IMAGE015
,以每一个小时划分为一个时段,获取一天中cnt个时间片的时段信息
Figure 811533DEST_PATH_IMAGE016
,其中,
Figure 933073DEST_PATH_IMAGE017
统计N天中每一天的天气状况
Figure 771716DEST_PATH_IMAGE018
,其中,
Figure 334415DEST_PATH_IMAGE019
表示第k天的天气状况,将天气状况分为晴、阴、雨、雪、其他五类,分别用1、2、3、4、5表示;
对步骤S3中提取的每个时间片内的数据标注其对应的日期信息、时段信息以及天气状况。
进一步,步骤S6中构建的机场轨道交通客流预测模型所需的数据集中每个时间片对应的数据向量为:
Figure 600312DEST_PATH_IMAGE020
Figure 943568DEST_PATH_IMAGE021
其中,
Figure 792094DEST_PATH_IMAGE022
表示第k天中第j个时间片内的所述机场到市区方向的客流量的标准化处理后数据,
Figure 271617DEST_PATH_IMAGE023
表示第k天中第j个时间片内的市区到所述机场方向的客流量的标准化处理后数据,
Figure 973994DEST_PATH_IMAGE024
表示第k天中第j个时间片内的所述机场计划起飞的航班数的标准化处理后数据,
Figure 538967DEST_PATH_IMAGE025
表示第k天中第j个时间片内的所述机场计划到达的航班数的标准化处理后数据,
Figure 719413DEST_PATH_IMAGE026
表示一天中第j个时间片的时段信息。
进一步,步骤S7中,利用训练集对机场轨道交通客流预测模型进行训练,具体过程为:每次向机场轨道交通客流预测模型的LSTM层输入由a个连续时间片对应的数据向量组成的机场轨道交通客流特征序列,得到LSTM层输出;将输出结果经过一个全连接层进行特征融合并将融合后的时间序列输入时间-特征协同注意力层,得到给每个时间片的特征加入注意力后的新时间序列,接着再次经过另一个全连接层进行特征融合,输出对第a+1个时间片内机场轨道交通客流量的预测结果,并将预测结果与实际客流量进行对比,并将误差反向传播,从而通过训练得到训练后的机场轨道交通客流预测模型;所述实际客流量为第a +1个时间片内的市区到所述机场方向的客流量与所述机场到市区方向的客流量之和。
本发明的有益效果:
1)本发明综合分析了可能影响机场轨道交通客流的因素,并结合AFC数据、航班时刻表、天气以及日期四种数据构建多因素条件下的机场轨道交通客流预测模型,相比于一般的仅考虑历史客流量的预测方法,本方法预测效果更为准确;
2)本发明对每一类影响机场轨道交通客流的因素从不同角度进行数据提取,从而有利于预测模型提取出更多的有效特征,此外对各项输入数据进行标准化处理,有效提高机场轨道交通客流预测模型的预测精度和收敛速度;
3)本发明针对机场轨道交通客流存在时序耦合,针对性采用LSTM对机场轨道交通客流存在的时序关联进行建模,从而提升客流预测准确度。
4)本发明针对多维特征在不同时序上影响机场轨道交通客流的程度不同,针对性设计出时间-特征协同注意力机制,实现了多维特征在不同时序上对机场轨道交通客流影响程度的精准捕捉,从而进一步提升客流预测准确度。
附图说明
图1是本发明实施例的基于LSTM结合时间-特征协同注意力机制的机场轨道交通客流预测方法流程图。
具体实施方式
下面结合附图和实施例进一步描述本发明,应该理解,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
如图1所示,本实施例的基于LSTM结合时间-特征协同注意力机制的机场轨道交通客流预测方法包括如下步骤:
步骤一、获取待测机场轨道交通线路所在城市N天的AFC原始数据、与待测轨道交通线路连接的机场的航班时刻表原始数据、天气数据,并对AFC原始数据和航班时刻表原始数据进行数据预处理。
本实施例中,AFC数据表中包括以下字段:卡号、刷卡类型、进站点、进站时间、出站点、出站时间。为提取机场轨道交通客流预测模型所需有效数据,首先对海量AFC原始数据进行数据清洗,AFC数据中刷卡类型包括地铁和公交两种,筛选出所有刷卡类型为地铁的AFC数据;接着根据进站点和出站点对所有地铁的AFC数据进行进一步筛选,只保留进站点或者出站点为待预测的机场轨道交通线路所连接的机场站点的数据,剔除其余AFC数据。
航班时刻表数据主要包括以下字段:航班号、起飞机场、起飞机场经纬度、降落机场、降落机场经纬度、计划起飞时间、计划到达时间。同样,对航班时刻表数据进行数据清洗,对于起飞机场或降落机场字段有缺失的数据,可以根据经纬度信息进行匹配出对应的机场名,从而对缺失字段进行补全。如果机场和经纬度字段均缺失,则删除该条数据。
步骤二、对步骤一中预处理过数据进行整理和提取。
首先将机场轨道每一天首班发车对应的整点时刻
Figure 256705DEST_PATH_IMAGE001
到末班发车对应的整点时刻
Figure 129983DEST_PATH_IMAGE002
Figure 182252DEST_PATH_IMAGE003
为间隔等分成cnt个时间片。本实施例中,
Figure 104072DEST_PATH_IMAGE027
Figure 558187DEST_PATH_IMAGE028
Figure 602367DEST_PATH_IMAGE029
,则
Figure 141932DEST_PATH_IMAGE030
对于AFC数据
1)筛选出所有进站点为机场站点的AFC数据,并统计每一个时间片内包含的进站点为机场站点的AFC数据条数,即每个时间片内所述机场到市区方向的客流量,记为
Figure 867443DEST_PATH_IMAGE031
,其中,
Figure 173135DEST_PATH_IMAGE032
表示第k天中第j个时间片内的所述机场到市区方向的客流量。
2)筛选所有出站点为机场站点的AFC数据,并统计每一个时间片内包含的出站点为机场站点的AFC数据条数,即每个时间片内市区到所述机场方向的客流量,记为
Figure 388215DEST_PATH_IMAGE033
,其中
Figure 149498DEST_PATH_IMAGE034
表示第k天中第j个时间片内的市区到所述机场方向的客流量。
对于航班时刻表数据
1)先筛选出所有起飞机场为与待测轨道交通线路连接的机场的数据,并根据每条数据中的计划起飞时间统计每一个时间片内包含的数据条数,记为
Figure 678699DEST_PATH_IMAGE035
,其中
Figure 841828DEST_PATH_IMAGE036
表示第k天中第j个时间片内的计划起飞的航班数。
2)筛选出所有降落机场为与待测轨道交通线路连接的机场的数据,并根据每条数据中的计划到达时间统计每一个时间片内包含的数据条数,记为
Figure 962230DEST_PATH_IMAGE037
,其中
Figure 741967DEST_PATH_IMAGE038
表示第k天中第j个时间片内的计划降落的航班数。
对每一个时间片标注对应的时段。将
Figure 809281DEST_PATH_IMAGE039
Figure 826915DEST_PATH_IMAGE040
,以每一个小时划分为一个时段,记为
Figure 649378DEST_PATH_IMAGE041
,其中
Figure 385253DEST_PATH_IMAGE042
对每一个时间片标注对应的日期信息。统计N天中每一天的日期信息,将每一天分为休息日(法定节假日、周末),用0表示;和工作日,用1表示,记为
Figure 256257DEST_PATH_IMAGE043
,其中
Figure 611888DEST_PATH_IMAGE044
表示第k天的日期信息。
对每一个时间片标注对应的天气状况。统计N天中每一天的天气状况,将天气状况分为晴、阴、雨、雪、其他五类,分别表示为1、2、3、4、5,将统计的结果记为
Figure 605251DEST_PATH_IMAGE045
,其中
Figure 828422DEST_PATH_IMAGE046
表示第k天的天气状况。
步骤三、数据标准化
上述步骤整理得到的机场轨道交通客流预测相关数据有着不同的量纲和数量级,这会对机场轨道交通客流预测模型的预测效果造成影响,为了避免不同数据之间的量纲和数量级的影响,需要对采集到的数据进行标准化处理。常用的标准化方法包括min-max标准化、log函数转换、z-score 标准化。本实施例利用min-max标准化法对步骤二中得到的AFC数据和航班时刻表数据进行标准化处理。具体处理方法如下:
1)对N天中68个时间片内机场到市区方向的客流量
Figure 237538DEST_PATH_IMAGE047
进行标准化处理,以
Figure 229765DEST_PATH_IMAGE048
为例,计算公式如下,
Figure 394030DEST_PATH_IMAGE049
Figure 42180DEST_PATH_IMAGE050
其中
Figure 51724DEST_PATH_IMAGE051
Figure 164037DEST_PATH_IMAGE052
中的最小值,
Figure 233624DEST_PATH_IMAGE053
Figure 634650DEST_PATH_IMAGE054
中的最大值,
Figure 447885DEST_PATH_IMAGE055
Figure 414704DEST_PATH_IMAGE056
标准化之后的结果。
Figure 386683DEST_PATH_IMAGE057
中每一项进行标准化处理,得到的结果记为
Figure 275005DEST_PATH_IMAGE058
接着对N天中68个时间片内市区到机场方向的客流量
Figure 626352DEST_PATH_IMAGE059
进行标准化处理,同理可以得到处理后的结果,记为
Figure 713257DEST_PATH_IMAGE060
3)对N天中68个时间片内的计划起飞的航班数
Figure 124646DEST_PATH_IMAGE061
进行标准化处理,以
Figure 234685DEST_PATH_IMAGE062
为例,计算公式如下,
Figure 124143DEST_PATH_IMAGE063
其中
Figure 331134DEST_PATH_IMAGE064
Figure 851108DEST_PATH_IMAGE065
中的最小值,
Figure 245180DEST_PATH_IMAGE066
Figure 203909DEST_PATH_IMAGE067
中的最大值,
Figure 999827DEST_PATH_IMAGE068
Figure 753019DEST_PATH_IMAGE069
标准化之后的结果。
Figure 840579DEST_PATH_IMAGE070
中每一项进行标准化处理,得到的结果记为
Figure 337420DEST_PATH_IMAGE071
同理对N天中68个时间片内计划到达的航班数
Figure 987844DEST_PATH_IMAGE072
进行标准化处理,可以得到处理后的结果
Figure 911938DEST_PATH_IMAGE073
步骤四、机场轨道交通客流预测模型构建
机场轨道交通客流预测模型选用LSTM网络结合时间-特征协同注意力机制进行设计,本实施例中,LSTM网络具体参数设计如下:输入层节点数设置为1,输出层节点数设置为1,时间步长设置为6,隐藏层层数设置为1,隐藏层节点数设置为20,epoch设置为120,激活函数选择sigmoid,优化函数选择Adam,损失函数选择MAE。时间-特征协同注意力机制对应的设计如下:设置6个独立的自注意力模块,每个自注意力模块的attention_width=6,激活函数选择sigmoid。
将各个时间片的特征向量构建LSTM网络的输入数据,以第k天第j个时间片为例,该时间片对应的输入向量为
Figure 483864DEST_PATH_IMAGE074
之后对机场轨道交通客流预测模型进行训练,本实施例中每次输入连续6个时间片对应的数据向量组成的机场轨道交通客流特征序列,得到LSTM隐含层输出。再将隐含层输出结果经过全连接层进行特征融合,再将特征融合后的时间序列输入时间-特征协同注意力层,得到给每个时间片的特征加入注意力后的新时间序列,接着再次经过另一个全连接层进行特征融合,输出对第7个时间片内机场轨道交通客流量的预测结果,并将预测结果与实际客流量进行对比,并将误差反向传播,从而通过训练得到训练后的机场轨道交通客流预测模型,所述实际客流量为第7个时间片内的乘坐机场轨道交通到达所述机场的客流量与离开所述机场的客流量之和。
对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以对本发明的实施例作出若干变型和改进,这些都属于本发明的保护范围。

Claims (6)

1.一种基于LSTM的客流预测方法,其特征在于,包括如下步骤:
S1:获取待测机场轨道交通线路所在城市N天的AFC原始数据、与待测机场轨道交通线路连接的机场的航班时刻表原始数据、天气数据;
S2:对所述AFC原始数据和所述航班时刻表原始数据进行预处理,保留有效AFC数据和有效航班时刻表数据;
S3:对获取的有效AFC数据进行整理,提取出N天中各个时间片内的所述机场到市区方向的客流量、N天中各个时间片内的市区到所述机场方向的客流量;并对获取的有效航班时刻表数据进行整理,提取出N天中各个时间片内所述机场计划起飞航班数以及计划降落航班数;
S4:对步骤S3中提取的数据进行标准化处理;
S5:对每个时间片内的数据标注其对应的日期信息、时段信息以及天气状况;
S6:基于标准化处理后的数据以及标注有对应的日期信息、时段信息以及天气状况的数据,构建数据集并分为训练集和测试集;
S7:基于 LSTM网络并结合时间-特征协同注意力机制,建立机场轨道交通客流预测模型,包括LSTM层、时间-特征协同注意力层和两个全连接层;利用训练集和测试集,对所建立的机场轨道交通客流预测模型进行训练和测试,得到最终的机场轨道交通客流预测模型并利用该机场轨道交通客流预测模型对机场轨道交通的实时客流进行预测;
步骤S3中,将机场轨道每一天首班发车整点时刻
Figure 273719DEST_PATH_IMAGE001
到末班发车整点时刻
Figure 584615DEST_PATH_IMAGE002
Figure 510983DEST_PATH_IMAGE003
为时间间隔等分成cnt个时间片,
N天中cnt个时间片内的所述机场到市区方向的客流量记为
Figure 122093DEST_PATH_IMAGE004
,其中,
Figure 475714DEST_PATH_IMAGE005
Figure 477168DEST_PATH_IMAGE006
表示第k天中第j个时间片内的所述机场到市区方向的客流量;
N天中cnt个时间片内的市区到所述机场方向的客流量记为
Figure 472806DEST_PATH_IMAGE007
,其中,
Figure 672843DEST_PATH_IMAGE008
表示第k天中第j个时间片内的市区到所述机场方向的客流量;
N天中cnt个时间片内所述机场计划起飞的航班数记为
Figure 400627DEST_PATH_IMAGE009
,其中,
Figure 691974DEST_PATH_IMAGE010
表示第k天中第j个时间片内的计划起飞的航班数;
N天中cnt个时间片内所述机场计划降落的航班数记为
Figure 225724DEST_PATH_IMAGE011
,其中,
Figure 280268DEST_PATH_IMAGE012
表示第k天中第j个时间片内的计划降落的航班数。
2.根据权利要求1所述的方法,其特征在于,步骤S2具体过程为:
1)对海量AFC原始数据进行数据清洗,筛选出所有刷卡类型为地铁的AFC数据;接着根据进站点和出站点对所有地铁的AFC数据进行进一步筛选,只保留进站点或者出站点为所述机场的AFC数据;
2)对航班时刻表原始数据进行数据清洗,对于起飞机场或降落机场字段有缺失的航班时刻表原始数据,根据经纬度信息匹配出对应的机场名,从而对缺失字段进行补全,当起飞机场或降落机场字段和经纬度字段均缺失时,则删除该条航班时刻表原始数据。
3.根据权利要求1所述的方法,其特征在于,步骤S4中,利用min-max标准化法对步骤S3中提取的数据进行标准化处理。
4.根据权利要求1所述的方法,其特征在于,步骤S5具体过程如下:
统计N天中每一天的日期信息
Figure 444533DEST_PATH_IMAGE013
,其中,
Figure 217317DEST_PATH_IMAGE014
表示第k天的日期信息,将日期信息分为休息日和工作日两类,分别用0和1表示;
将首班发车时刻
Figure 289178DEST_PATH_IMAGE015
到末班发车时刻
Figure 667070DEST_PATH_IMAGE016
,以每一个小时划分为一个时段,获取一天中cnt个时间片的时段信息
Figure 533394DEST_PATH_IMAGE017
,其中,
Figure 59054DEST_PATH_IMAGE018
统计N天中每一天的天气状况
Figure 669027DEST_PATH_IMAGE019
,其中,
Figure 901425DEST_PATH_IMAGE020
表示第k天的天气状况,将天气状况分为晴、阴、雨、雪、其他五类,分别用1、2、3、4、5表示;
对步骤S3中提取的每个时间片内的数据标注其对应的日期信息、时段信息以及天气状况。
5.根据权利要求4所述的方法,其特征在于,步骤S6中构建的机场轨道交通客流预测模型所需的数据集中每个时间片对应的数据向量为:
Figure 469809DEST_PATH_IMAGE021
Figure 951606DEST_PATH_IMAGE022
其中,
Figure 568532DEST_PATH_IMAGE023
表示第k天中第j个时间片内的所述机场到市区方向的客流量的标准化处理后数据,
Figure 717754DEST_PATH_IMAGE024
表示第k天中第j个时间片内的市区到所述机场方向的客流量的标准化处理后数据,
Figure 191461DEST_PATH_IMAGE025
表示第k天中第j个时间片内的所述机场计划起飞的航班数的标准化处理后数据,
Figure 363816DEST_PATH_IMAGE026
表示第k天中第j个时间片内的所述机场计划到达的航班数的标准化处理后数据,
Figure 581171DEST_PATH_IMAGE027
表示一天中第j个时间片的时段信息。
6.根据权利要求1-5之一所述的方法,其特征在于,步骤S7中,利用训练集对机场轨道交通客流预测模型进行训练,具体过程为:每次向机场轨道交通客流预测模型的LSTM层输入由a个连续时间片对应的数据向量组成的机场轨道交通客流特征序列,得到LSTM层输出;将输出结果经过一个全连接层进行特征融合并将融合后的时间序列输入时间-特征协同注意力层,得到给每个时间片的特征加入注意力后的新时间序列,接着再次经过另一个全连接层进行特征融合,输出对第a+1个时间片内机场轨道交通客流量的预测结果,并将预测结果与实际客流量进行对比,并将误差反向传播,从而通过训练得到训练后的机场轨道交通客流预测模型;所述实际客流量为第a+1个时间片内的市区到所述机场方向的客流量与所述机场到市区方向的客流量之和。
CN202110769808.6A 2021-07-08 2021-07-08 一种基于lstm的客流预测方法 Active CN113221472B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110769808.6A CN113221472B (zh) 2021-07-08 2021-07-08 一种基于lstm的客流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110769808.6A CN113221472B (zh) 2021-07-08 2021-07-08 一种基于lstm的客流预测方法

Publications (2)

Publication Number Publication Date
CN113221472A CN113221472A (zh) 2021-08-06
CN113221472B true CN113221472B (zh) 2021-10-01

Family

ID=77081178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110769808.6A Active CN113221472B (zh) 2021-07-08 2021-07-08 一种基于lstm的客流预测方法

Country Status (1)

Country Link
CN (1) CN113221472B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116432956B (zh) * 2023-04-10 2024-01-23 广东宏志信息技术有限公司 一种基于客流量的公交车调配方法、系统、设备及介质
CN117252311B (zh) * 2023-11-16 2024-03-15 华南理工大学 一种基于改进lstm网络的轨道交通客流预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6640098B1 (en) * 2000-02-14 2003-10-28 Action Engine Corporation System for obtaining service-related information for local interactive wireless devices
CN108665178B (zh) * 2018-05-17 2020-05-29 上海工程技术大学 一种基于afc的地铁站内楼扶梯客流量预测方法
CN111325380A (zh) * 2019-12-29 2020-06-23 航天信息股份有限公司 基于多粒度时间注意力机制确定航班客座率的方法和系统
CN113077090B (zh) * 2021-04-09 2023-05-23 上海大学 客流预测方法、系统及计算机可读存储介质

Also Published As

Publication number Publication date
CN113221472A (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
CN109117883B (zh) 基于长短时记忆网络的sar影像海冰分类方法及系统
CN113221472B (zh) 一种基于lstm的客流预测方法
Gaurav et al. Estimating train delays in a large rail network using a zero shot markov model
CN109034449A (zh) 基于深度学习和乘客行为模式的短期公交客流预测方法
Dhief et al. Predicting aircraft landing time in extended-TMA using machine learning methods
CN108415885A (zh) 基于近邻回归的实时公交客流预测方法
CN111178628A (zh) 一种行李到达时间预测方法及装置
CN110889092A (zh) 一种基于轨道交易数据的短时大型活动周边轨道站点客流量预测方法
CN113380043B (zh) 一种基于深度神经网络计算的公交到站时间预测方法
CN112785077A (zh) 基于时空数据的出行需求预测方法及系统
CN110796315A (zh) 基于时效信息和深度学习的离港航班延误预测方法
CN114399099A (zh) 一种城市轨道交通断面客流的预测方法及装置
CN111815098A (zh) 基于极端天气的交通信息处理方法、装置、存储介质和电子设备
Arshad et al. Train delay estimation in Indian railways by including weather factors through machine learning techniques
Liu et al. Data analytics approach for train timetable performance measures using automatic train supervision data
CN115345354A (zh) 基于超图深度网络的城市多方式交通超网络态势预测方法
CN116913088A (zh) 一种用于高速公路的智能流量预测方法
Xu et al. A taxi dispatch system based on prediction of demand and destination
CN111275482A (zh) 基于机器学习的轨道交通实时动态清分方法
Lee Freeway travel time forecast using artifical neural networks with cluster method
CN110796301B (zh) 一种基于ic卡数据的乘客流量预测方法及装置
CN116564551B (zh) 一种数据-知识驱动的城市轨道交通风险辨识方法
Gallo et al. Network-wide public transport occupancy prediction framework with multiple line interactions
CN117494864A (zh) 一种基于rsalgcn的城市轨道交通短时客流预测方法
CN117496695A (zh) 一种基于ic卡数据的乘客换乘站点识别及出行链重构方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211229

Address after: 908, block a, floor 8, No. 116, Zizhuyuan Road, Haidian District, Beijing 100089

Patentee after: ZHONGZI DATA CO.,LTD.

Address before: 100191 No. 37, Haidian District, Beijing, Xueyuan Road

Patentee before: BEIHANG University

TR01 Transfer of patent right