CN116384814A - 基于机器学习对多因素影响下机场跑道容量的评估方法 - Google Patents
基于机器学习对多因素影响下机场跑道容量的评估方法 Download PDFInfo
- Publication number
- CN116384814A CN116384814A CN202310293985.0A CN202310293985A CN116384814A CN 116384814 A CN116384814 A CN 116384814A CN 202310293985 A CN202310293985 A CN 202310293985A CN 116384814 A CN116384814 A CN 116384814A
- Authority
- CN
- China
- Prior art keywords
- airport
- data
- capacity
- output
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000010801 machine learning Methods 0.000 title claims abstract description 15
- 230000007246 mechanism Effects 0.000 claims abstract description 28
- 230000006870 function Effects 0.000 claims abstract description 22
- 238000011156 evaluation Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 18
- 238000013528 artificial neural network Methods 0.000 claims abstract description 13
- 238000010219 correlation analysis Methods 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 26
- 210000004027 cell Anatomy 0.000 claims description 15
- 230000004913 activation Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 12
- 210000002569 neuron Anatomy 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000007787 long-term memory Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000013459 approach Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000005315 distribution function Methods 0.000 claims description 6
- 230000015654 memory Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000001556 precipitation Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000014509 gene expression Effects 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 abstract 1
- 238000011161 development Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000010006 flight Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002360 prefrontal effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明针对预测精度和可靠性问题,应用循环神经网络方法,公开基于机器学习对多因素影响下机场跑道容量的评估方法。该方法通过最大互信息系数对可能的影响因素进行相关性分析,筛选出强特征变量作为模型输入,并对数据进行预处理;将LSTM与注意力机制结合,确定不同气象因素对机场容量预测的影响,定义了模型的损失函数和输出方式,构建了完整的LSTM‑Attention机场容量评估模型。该发明融合相关性分析,能够较全面地考虑机场容量影响因素,融合多源数据时空特征并将其对机场容量的影响进行量化;通过改进的算法降低模型训练复杂度并提升评估结果的稳定性与准确性,以达到对机场容量精准量化的目的,确保对机场运行的基础保障。
Description
技术领域
本发明属于民航机场容量评估领域,具体涉及基于机器学习的多因素影响下的机场容量评估方法。
背景技术
近年来,随着航空运输业迅速发展,航空运输需求与实际民航运力发展不平衡,机场拥堵以及航班延误的问题日益严峻,甚至引发旅客不满。扩大机场容量可以有效缓解机场拥堵,但由于机场改扩建周期长、投资大,短期内难以实现。容量评估的有效性与准确性是影响流量管理实施效果的关键,对机场运行容量的高估会导致机场拥挤和航班延误,对机场运行容量的低估则会导致稀缺机场资源的浪费,因此对机场容量的准确评估是有必要的,但也是非常复杂且具有挑战性的。
目前的机场容量评估方法主要有基于历史统计数据分析的评估方法;基于管制员工作负荷的评估方法;基于数学计算模型的评估方法以及基于计算机仿真的评估方法四种。现有方法多适用于离线机场容量评估,但由于跑道配置、天气条件以及需求等的不确定性,并非先验可知的,不适用于实时的机场容量预测。近年来,伴随这大量机场运行数据的生成与累积,利用人工智能以及数据驱动的方法出现,在大量数据基础上实现对隐藏信息的挖掘与快速分析。尽管已经有这方面的研究,但是如何精准、全面且高效的实时研究更为需要,深入挖掘大量历史数据的时空关联特性,进行相关性分析以筛选出强关联特征,而注意力机制的引入可以实现模型速度与精度优化,科学高效的机场容量评估对于减少流量管理的工作负荷、降低机场拥挤度以及预防航班延误等具有重要现实意义。
发明内容
发明目的:本发明针对现有机场容量评估滞后,无法实时评估且考虑因素不够全面的问题,在考虑气象条件的基础上,考虑跑道配置、主关联机场航班、前序航班延误情况等因素,通过最大互信息系数进行相关性分析以排除弱相关因素,结合注意力机制,提供基于改进的LSTM预测方法,旨在实现对机场容量精准全面实时评估的目的,从而为解决后续机场拥堵、航班延误等实际问题的研究提供基础。
技术方案:本发明提供基于机器学习的多因素影响下的机场容量评估方法,包括以下步骤:
S1、获取机场航班起降数据、机场运行数据以及气象数据,构建机场容量评估数据集;
S2、基于互信息系数对影响机场容量的数据进行相关性分析,过滤掉弱相关性数据;
S3、对过滤掉弱相关性数据的机场容量评估数据集进行数据预处理,并划分训练集与测试集;
S4、构建基于注意力机制的LSTM长短期记忆神经网络机场容量预测模型,利用所述训练集进行预测模型的训练,利用所述测试集进行预测模型的测试;
S5、获取包括机场航班起降数据、机场运行数据以及气象数据的机场容量数据,输入到训练好的预测模型,得到机场容量评估结果,并通过性能指标对预测模型的性能进行量化。
优选的,所述步骤S1中:
所述机场航班起降数据包括:日期、航班号、机型、计划到/离港时间、实际到/离港时间、单位时间内机场的实际进场架次、单位时间内机场的实际离场架次;主关联机场航班数据;前序单位时间段内航班延误情况数据;
所述机场运行数据包括:跑道构型数据;
所述气象数据包括:风向、风速、能见度、云底高、温度、湿度、海平面气压、降水量、阵风、暴雨暴雪。
优选的,所述步骤S1中,将日期、计划到/离港时间、实际到/离港时间、风速、温度、湿度、海平面气压定义为连续型变量;将航班号、机型、单位时间内机场的实际进场架次、单位时间内机场的实际离场架次、主关联机场航班数据、前序单位时间段内航班延误情况数据、跑道构型数据、风向、能见度、云底高、降水量、阵风、暴雨暴雪定义为离散型变量。
优选的,所述步骤S2包括以下步骤:
S2-1、通过互信息系数衡量离散型变量与机场容量之间的相关程度,互信息系数I(X;Y)定义为:
其中X为输入特征数据,Y为目标变量即机场容量数据,P(X,Y)是X和Y的联合概率分布函数,P(X)和P(Y)分别为X和Y的边缘概率分布函数;
通过最大互信息系数对连续型变量进行处理,当X和Y在散点图网格中表现出相近的概率密度分布时,将二者的互信息系数计算出来后进行正则化运算,来评估两者之间的相关性,过滤掉弱相关性离散型变量,最大互信息系数计算公式如下:
其中,a、b为二维坐标系中的网格分布参数,a和b的取值满足a*b<B(n),B(n)=n0.6表示搜索网格数的上界,n代表机场容量评估数据集的样本数量,I(X,Y)代表某一a、b取值下,X、Y的最大互信息值。
优选的,所述步骤S3包括以下步骤:
S3-1、对过滤掉弱相关性离散型变量的机场容量评估数据集进行异常值检验处理,将明显偏离机场容量评估数据集的数据视为异常值并剔除,并对于噪声数据做平滑处理;
S3-2、对剔除异常值后的机场容量评估数据集进行缺失值处理,采用拉格朗日插值法进行填补;
S3-3、采用最小-最大归一化方法对连续型变量进行转化处理,转化函数为:
其中,Xnorm是连续型变量的归一化向量,X是连续型变量的原始向量,Xmax和Xmin分别为连续型变量的最大和最小值;
S3-4、采用独热编码对离散型变量进行处理;
S3-5、针对机场航班起降数据、机场运行数据以及气象数据不同来源的数据采样间隔不一致导致时间维度上信息不统一的问题,规定以30min或1h为时间间隔;
S3-6、将机场容量评估数据集划分为训练集和测试集。
优选的,所述步骤S4中:
基于注意力机制的LSTM长短期记忆神经网络机场容量预测模型包括输入层、隐藏层、注意力机制层、Dropout层以及输出层。
优选的,所述步骤S4中:
所述输入层由归一化后的输入特征组成,输入节点个数为输入特征的维度;长短期记忆神经网络层数为2层,神经元个数分别为256个和32个;
所述隐藏层包括遗忘门ft,输入门it和输出门ot;其中,遗忘门和输出门使用的神经元的函数为Sigmoid激活函数,而在输入门将Sigmoid激活函数与双曲正切tanh函数相结合,各层神经元的输出表达式如下:
遗忘门:ft=σ(Wf[ht-1+xt]+bf)
输入门:it=σ(Wi[ht-1,xt]+bi)
输出门:ot=σ(Wo[ht-1,xt]+b0)
隐藏层状态值:ht=ot·tanh(ct)
其中,ft、it、ot分别为遗忘门、输入门和输出门,σ和tanh表示Sigmoid激活函数和双曲正切tanh激活函数,Wf、Wi和Wo分别为遗忘门、输入门和输出门的权重系数矩阵,bf、bi和bo分别为遗忘门、输入门和输出门的偏置项,xt为输入特征向量,ct和ct-1分别为t时刻和t-1时刻的LSTM单元状态,为单元的候选状态,ht为t时刻单元的输出隐藏状态向量;
所述注意力机制层:
st=tanh(Wtht+bt)
其中,st为t时刻输入特征向量的概率分布值,ht为t时刻单元的输出隐藏状态向量,Wt、bt分别为注意力机制层权重系数矩阵和偏置项,αt为注意力权重矩阵,V为注意力机制层输出;
每层输出经过所述Dropout层,防止过拟合;
所述输出层由全连接层构成,所述输出层节点个数为输出特征的维度,令输出特征维度为1,公式如下:
yt=LSTM(xt,ht-1,ct)。
其中,xt为输入特征向量,ht-1为t-1时刻单元的输出隐藏状态向量,ct为t时刻的LSTM单元状态。
优选的,所述步骤S5包括以下步骤:
S5-1、用前n个时刻的机场容量数据预测下一个时刻机场容量数据,即将{i-n,i-n+1,...,i-2,i-1,i}时刻的机场容量数据输入到训练好的结合注意力机制的长短期记忆模型中,预测出i+1时刻的数据作为机场容量预测值,对预测结果进行反归一化,完成解码;
S5-2、用均方根误差RMSE来评价基于注意力机制的LSTM长短期记忆神经网络机场容量预测模型的性能,其计算公式为:
有益效果:本发明在考虑气象条件基础上对现有机场容量影响因素进行补充,完善现有机场容量评估影响因素;其次,本发明引入最大互信息系数方法,更为精准地对影响机场容量的特征进行筛选,弥补了现有研究缺乏对于最初参数相关性分析,参数的选取主要依靠人为主观选择的不足;此外,本发明引入注意力机制对LSTM模型进行改进,既解决了传统循环神经网络存在的长期依赖问题,又改进了梯度爆炸与梯度消失的问题,有效提升了机场容量评估的准确性与稳定性,并且可以应用到不同的机场,从而提升模型的适用性。并且具有较强的实用性,有利于推进机场容量评估技术的发展。
附图说明
图1是基于机器学习的机场容量评估流程框图;
图2是本发明提供的方法图。
具体实施方式
下面结合附图对本发明做进一步详细说明。
本发明提供了基于机器学习的机场容量评估方法,包括所需机场容量和气象数据处理,数据集的构建,模型框架的构建以及机场容量评估模型训练。适用于对多因素影响下的机场容量进行评估,训练的模型有较好的适用性,可以更为精准地完成机场容量的评估。如图1所示,具体包括以下步骤:
步骤一、获取机场航班起降数据、机场运行数据以及相应的气象数据详细信息,构建机场容量评估数据集。
所述步骤一具体为:
所述机场航班起降数据包括:日期、航班号、机型、计划到/离港时间、实际到/离港时间、单位时间内机场的实际进场架次、单位时间内机场的实际离场架次;主关联机场航班数据;前序单位时间段内航班延误情况数据;
所述机场运行数据包括:跑道构型数据;
所述气象数据包括:风向、风速、能见度、云底高、温度、湿度、海平面气压、降水量、阵风、暴雨暴雪等特殊天气;
进一步地,所述步骤1具体属性为:将日期、计划到/离港时间、实际到/离港时间、风速、温度、湿度、海平面气压定义为连续型变量,将航班号、机型、单位时间内机场的实际进场架次、单位时间内机场的实际离场架次、主关联机场航班数据、前序单位时间段内航班延误情况数据、跑道构型数据、风向、能见度、云底高、降水量、阵风、暴风雨暴雪定义为离散型变量。此外,本发明定义主关联机场为在考虑航班频次、延误架次以及航班延误总时间等因素影响下,关联程度较大的机场,其对应的航班数据为主关联机场航班数据;
步骤二、基于最大互信息系数对可能影响机场容量的因素进行相关性分析,过滤掉弱影响指标,筛选出对机场容量影响较大的因素,完成特征选择。
所述步骤二具体为:
S2-1、通过互信息系数衡量各个特征因素与机场容量之间相关程度,互信息系数I(X;Y)定义公式:
其中,X、Y分别为随机变量,其中X为输入特征数据,Y为目标变量即机场容量数据,P(X,Y)是X和Y的联合概率分布函数,P(X)和P(Y)分别为X和Y的边缘概率分布函数;
当两个变量在散点图网格中表现出相近的概率密度分布时,将二者的互信息系数计算出来后进行正则化运算,来评估两者之间的相关性,最终确定关联性较强的特征向量作为机场容量评估模型的输入向量,计算公式如下:
其中,a、b为二维坐标系中的网格分布参数即将x、y划分为a列b行,a和b的取值需满足a*b<B(n),通常情况下,B(n)=n0.6表示搜索网格数的上界,n代表数据集的样本数量,I(x,y)代表某一a、b取值下,x、y的最大互信息值。
最大互信息系数取值范围含义,如表1所示:
表1 最大互信息系数MIC取值范围的含义
步骤三、对确定的强关联特征数据进行数据预处理,并划分训练集与测试集。
所述步骤三具体为:
S3-1、对步骤S2获取的数据进行异常值检验处理,将明显偏离机场容量评估数据集的数据视为异常值并剔除,并对于噪声数据做平滑处理;
S3-2、对剔除异常值后的机场容量评估数据集进行缺失值处理,采用拉格朗日插值法进行填补;
S3-3、采用最小-最大归一化方法对连续型变量进行转化处理,转化函数为:
其中,Xnorm是输入特征数据的归一化向量,X是输入特征数据的原始向量,Xmax和Xmin分别为输入特征数据的最大和最小值;
S3-4、采用独热编码对离散型变量进行处理;
S3-5、针对机场航班起降数据、机场运行数据以及气象数据不同来源的数据采样间隔不一致导致时间维度上信息不统一的问题,规定以30min或1h为时间间隔;
S3-6、将机场容量评估数据集划分为训练集和测试集。
步骤四、采用长短期记忆神经网络模型和深度学习中的注意力机制方法,构建基于注意力机制的LSTM机场容量预测模型,利用所述训练集完成模型训练和测试。
所述步骤四具体为:
S4-1、基于LSTM-Attention模型对训练集的机场容量进行评估训练;
S4-2、搭建具有输入层、隐藏层、注意力机制层、Dropout层以及输出层并结合注意力机制的LSTM长短期记忆神经网络机场容量预测模型,利用所构建模型找到数据属性的非线性关系,根据训练结果进行特征学习,如图2所示。
所述步骤S4-2具体为:
初始化长短期记忆神经网络模型参数,
输入层由归一化后的输入特征组成,输入节点个数为输入特征的维度;LSTM神经网络层数为2层,神经元个数分别为256个和32个,第一层设置较高的神经元以确保能够学习足够的信息;在第二层中,对数据进行压缩,以建立更少的神经元,减少冗余信息的干扰。隐藏层用于记忆数据中的有用信息,遗忘无用信息,进而完成对数据的筛选,包括遗忘门,输入门和输出门。其中,遗忘门和输出门使用的神经元的函数为Sigmoid激活函数,而在输入门将Sigmoid激活函数与双曲正切tanh函数相结合,各层神经元的输出表达式:
遗忘门:ft=σ(Wf[ht-1+xt]+bf)
输入门:it=σ(Wi[ht-1,xt]+bi)
输出门:ot=σ(Wo[ht-1,xt]+b0)
隐藏层状态值:ht=ot·tanh(ct)
其中,ft、it、ot分别为遗忘门、输入门和输出门,σ和tanh表示Sigmoid激活函数和双曲正切tanh激活函数,Wf、Wi和Wo分别为遗忘门、输入门和输出门的权重系数矩阵,bf、bi和bo分别为遗忘门、输入门和输出门的偏置项,xt为输入特征向量,ct和ct-1分别为t时刻和t-1时刻的LSTM单元状态,为单元的候选状态,ht为t时刻单元的输出隐藏状态向量;
当输入序列经过第二层LSTM输出后,可以得到每个时刻机场容量状态以及最后输出的隐藏状态与记忆值,由于不同时刻的信息对当前时刻的状态预测所产生的比重不同,一般时间相近的影响较大,因此,引入深度学习中的注意力机制对不同时刻产生的信息的重要性进行评估,根据不同时刻不同输入特征对输出结果的重要性,给神经网络隐藏层赋予不同的权值,实现对信息的输入和输出之间的相关性的重要度计算,最后确定相应时刻的关注程度占所有时刻的关注程度的比重,具体的计算公式如下:
st=tanh(Wtht+bt)
其中,st为t时刻特征向量的概率分布值,ht为t时刻单元的输出隐藏状态向量,Wt、bt分别为注意力机制层权重系数矩阵和偏置项,αt为注意力权重矩阵,V为特征表示即注意力机制层输出;
每层输出经过dropout层,防止过拟合;输出层由全连接层构成,输出层节点个数为输出特征的维度,本实例中输出特征维度为1,即为待预测时刻机场容量值,输出结果计算公式如下:
yt=LSTM(xt,ht-1,ct)
其中,xt为输入特征向量,ht-1为t-1时刻单元的输出隐藏状态向量,ct为t时刻的LSTM单元状态。
步骤五、将当前机场气象等信息数据输入到训练好的模型通过测试集进行预测,得到机场容量评估结果,并通过性能指标对预测性能进行量化。
所述步骤五具体为:
S5-1、用前n个时刻的机场容量数据预测下一个时刻机场容量评估值,即将{i-n,i-n+1,...,i-2,i-1,i}时刻的机场容量输入到训练好的结合注意力机制的长短期记忆模型中,预测出i+1时刻的数据作为机场容量预测值,对预测结果进行反归一化,完成解码;
S5-2、用训练模型的均方根误差RMSE来评价模型的预测精度,其计算公式为:
以上所揭露的仅为本发明较佳实施例而已,不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (8)
1.基于机器学习对多因素影响下机场跑道容量的评估方法,其特征在于,包括以下步骤:
S1、获取机场航班起降数据、机场运行数据以及气象数据,构建机场容量评估数据集;
S2、基于互信息系数对影响机场容量的数据进行相关性分析,过滤掉弱相关性数据;
S3、对过滤掉弱相关性数据的机场容量评估数据集进行数据预处理,并划分训练集与测试集;
S4、构建基于注意力机制的LSTM长短期记忆神经网络机场容量预测模型,利用所述训练集进行预测模型的训练,利用所述测试集进行预测模型的测试;
S5、获取包括机场航班起降数据、机场运行数据以及气象数据的机场容量数据,输入到训练好的预测模型,得到机场容量评估结果,并通过性能指标对预测模型的性能进行量化。
2.根据权利要求1所述的基于机器学习对多因素影响下机场跑道容量的评估方法,其特征在于,所述步骤S1中:
所述机场航班起降数据包括:日期、航班号、机型、计划到/离港时间、实际到/离港时间、单位时间内机场的实际进场架次、单位时间内机场的实际离场架次;主关联机场航班数据;前序单位时间段内航班延误情况数据;
所述机场运行数据包括:跑道构型数据;
所述气象数据包括:风向、风速、能见度、云底高、温度、湿度、海平面气压、降水量、阵风、暴雨暴雪。
3.根据权利要求2所述的基于机器学习对多因素影响下机场跑道容量的评估方法,其特征在于,所述步骤S1中,将日期、计划到/离港时间、实际到/离港时间、风速、温度、湿度、海平面气压定义为连续型变量;将航班号、机型、单位时间内机场的实际进场架次、单位时间内机场的实际离场架次、主关联机场航班数据、前序单位时间段内航班延误情况数据、跑道构型数据、风向、能见度、云底高、降水量、阵风、暴雨暴雪定义为离散型变量。
4.根据权利要求3所述的基于机器学习对多因素影响下机场跑道容量的评估方法,其特征在于,所述步骤S2包括以下步骤:
S2-1、通过互信息系数衡量离散型变量与机场容量之间的相关程度,互信息系数I(X;Y)定义为:
其中,X为输入特征数据,Y为目标变量即机场容量数据,P(X,Y)是X和Y的联合概率分布函数,P(X)和P(Y)分别为X和Y的边缘概率分布函数;
通过最大互信息系数对连续型变量进行处理,当X和Y在散点图网格中表现出相近的概率密度分布时,将二者的互信息系数计算出来后进行正则化运算,来评估两者之间的相关性,过滤掉弱相关性离散型变量,最大互信息系数计算公式如下:
其中,a、b为二维坐标系中的网格分布参数,a和b的取值满足a*b<B(n),B(n)=n0.6表示搜索网格数的上界,n代表机场容量评估数据集的样本数量,I(X,Y)代表某一a、b取值下,X、Y的最大互信息值。
5.根据权利要求4所述的基于机器学习对多因素影响下机场跑道容量的评估方法,其特征在于,所述步骤S3包括以下步骤:
S3-1、对过滤掉弱相关性离散型变量的机场容量评估数据集进行异常值检验处理,将明显偏离机场容量评估数据集的数据视为异常值并剔除,并对于噪声数据做平滑处理;
S3-2、对剔除异常值后的机场容量评估数据集进行缺失值处理,采用拉格朗日插值法进行填补;
S3-3、采用最小-最大归一化方法对连续型变量进行转化处理,转化函数为:
其中,Xnorm是连续型变量的归一化向量,X是连续型变量的原始向量,Xmax和Xmin分别为连续型变量的最大和最小值;
S3-4、采用独热编码对离散型变量进行处理;
S3-5、针对机场航班起降数据、机场运行数据以及气象数据不同来源的数据采样间隔不一致导致时间维度上信息不统一的问题,规定以30min或1h为时间间隔;
S3-6、将机场容量评估数据集划分为训练集和测试集。
6.根据权利要求5所述的基于机器学习对多因素影响下机场跑道容量的评估方法,其特征在于,所述步骤S4中:
基于注意力机制的LSTM长短期记忆神经网络机场容量预测模型包括输入层、隐藏层、注意力机制层、Dropout层以及输出层。
7.根据权利要求6所述的基于机器学习对多因素影响下机场跑道容量的评估方法,其特征在于,所述步骤S4中:
所述输入层由归一化后的输入特征组成,输入节点个数为输入特征的维度;长短期记忆神经网络层数为2层,神经元个数分别为256个和32个;
所述隐藏层包括遗忘门ft,输入门it和输出门ot;其中,遗忘门和输出门使用的神经元的函数为Sigmoid激活函数,而在输入门将Sigmoid激活函数与双曲正切tanh函数相结合,各层神经元的输出表达式如下:
遗忘门:ft=σ(Wf[ht-1+xt]+bf)
输入门:it=σ(Wi[ht-1,xt]+bi)
输出门:ot=σ(Wo[ht-1,xt]+b0)
隐藏层状态值:ht=ot·tanh(ct)
其中,ft、it、ot分别为遗忘门、输入门和输出门,σ和tanh表示Sigmoid激活函数和双曲正切tanh激活函数,Wf、Wi和Wo分别为遗忘门、输入门和输出门的权重系数矩阵,bf、bi和bo分别为遗忘门、输入门和输出门的偏置项,xt为输入特征向量,ct和ct-1分别为t时刻和t-1时刻的LSTM单元状态,为单元的候选状态,ht为t时刻单元的输出隐藏状态向量;
所述注意力机制层:
st=tanh(Wtht+bt)
其中,st为t时刻输入特征向量的概率分布值,ht为t时刻单元的输出隐藏状态向量,Wt、bt分别为注意力机制层权重系数矩阵和偏置项,αt为注意力权重矩阵,V为注意力机制层输出;
每层输出经过所述Dropout层,防止过拟合;
所述输出层由全连接层构成,所述输出层节点个数为输出特征的维度,令输出特征维度为1,公式如下:
yt=LSTM(xt,ht-1,ct)。
其中,xt为输入特征向量,ht-1为t-1时刻单元的输出隐藏状态向量,ct为t时刻的LSTM单元状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310293985.0A CN116384814A (zh) | 2023-03-24 | 2023-03-24 | 基于机器学习对多因素影响下机场跑道容量的评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310293985.0A CN116384814A (zh) | 2023-03-24 | 2023-03-24 | 基于机器学习对多因素影响下机场跑道容量的评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116384814A true CN116384814A (zh) | 2023-07-04 |
Family
ID=86964978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310293985.0A Pending CN116384814A (zh) | 2023-03-24 | 2023-03-24 | 基于机器学习对多因素影响下机场跑道容量的评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116384814A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117565727A (zh) * | 2024-01-15 | 2024-02-20 | 朗峰新材料启东有限公司 | 基于人工智能的无线充电自动控制方法及系统 |
-
2023
- 2023-03-24 CN CN202310293985.0A patent/CN116384814A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117565727A (zh) * | 2024-01-15 | 2024-02-20 | 朗峰新材料启东有限公司 | 基于人工智能的无线充电自动控制方法及系统 |
CN117565727B (zh) * | 2024-01-15 | 2024-04-02 | 朗峰新材料启东有限公司 | 基于人工智能的无线充电自动控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yu et al. | Prediction of highway tunnel pavement performance based on digital twin and multiple time series stacking | |
Guo et al. | Data mining algorithms for bridge health monitoring: Kohonen clustering and LSTM prediction approaches | |
Kankanala et al. | AdaBoost $^{+} $: An Ensemble Learning Approach for Estimating Weather-Related Outages in Distribution Systems | |
CN109766583A (zh) | 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法 | |
CN112686464A (zh) | 短期风电功率预测方法及装置 | |
CN112465199B (zh) | 空域态势评估系统 | |
CN113516304B (zh) | 基于时空图网络的区域污染物时空联合预测方法及装置 | |
Bai et al. | A forecasting method of forest pests based on the rough set and PSO-BP neural network | |
CN117556197B (zh) | 一种基于人工智能的台风涡旋初始化方法 | |
CN115564114A (zh) | 一种基于图神经网络的空域碳排放短期预测方法及系统 | |
CN116384814A (zh) | 基于机器学习对多因素影响下机场跑道容量的评估方法 | |
CN116468186A (zh) | 一种航班链延误时间预测方法、电子设备及存储介质 | |
CN114647985A (zh) | 锋面过境预测模型的训练方法及锋面过境的预测方法 | |
CN115862324A (zh) | 一种智慧交通的时空同步图卷积神经网络及交通预测方法 | |
Ali et al. | Application of naïve Bayes to predict the potential of rain in ternate city | |
CN117194926A (zh) | 陆上风电基地吊装窗口期预测方法及系统 | |
CN113076686A (zh) | 一种基于社会长短期记忆网络的航空器轨迹预测方法 | |
CN116760017A (zh) | 一种光伏发电的预测方法 | |
CN115056829A (zh) | 多车型连续学习的列车运动状态估计方法 | |
Zhang et al. | Runway visual range prediction based on ensemble learning | |
CN114118508A (zh) | 一种基于时空卷积网络的od市场航空客流量预测方法 | |
Faizin et al. | IMPLEMENTATION OF THE STEP FUNCTION INTERVENTION AND EXTREME LEARNING MACHINE FOR FORECASTING THE PASSENGER’S AIRPORT IN SORONG | |
CN113449920A (zh) | 一种风电功率预测方法、系统及计算机可读介质 | |
Cawley et al. | Statistical downscaling with artificial neural networks. | |
Zhang | Deep learning-based hybrid short-term solar forecast using sky images and meteorological data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |