CN117035060A - 一种基于cc-midnn的飞机到港时间预测方法 - Google Patents
一种基于cc-midnn的飞机到港时间预测方法 Download PDFInfo
- Publication number
- CN117035060A CN117035060A CN202310985709.0A CN202310985709A CN117035060A CN 117035060 A CN117035060 A CN 117035060A CN 202310985709 A CN202310985709 A CN 202310985709A CN 117035060 A CN117035060 A CN 117035060A
- Authority
- CN
- China
- Prior art keywords
- network
- sub
- cluster
- data
- arrival time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 230000010354 integration Effects 0.000 claims abstract description 50
- 238000012549 training Methods 0.000 claims abstract description 37
- 238000005457 optimization Methods 0.000 claims abstract description 16
- 238000007621 cluster analysis Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000013528 artificial neural network Methods 0.000 claims description 44
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000007667 floating Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 abstract description 24
- 238000011156 evaluation Methods 0.000 abstract description 7
- 230000008569 process Effects 0.000 abstract description 6
- 238000002474 experimental method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000007637 random forest analysis Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000010006 flight Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000003064 k means clustering Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 208000027137 acute motor axonal neuropathy Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/098—Distributed learning, e.g. federated learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft, e.g. air-traffic control [ATC]
- G08G5/003—Flight plan management
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft, e.g. air-traffic control [ATC]
- G08G5/0073—Surveillance aids
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Aviation & Aerospace Engineering (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于CC‑MIDNN的飞机到港时间的预测方法,涉及航班到达时间预测技术领域,包括:对航班数据进行预处理,利用K‑means算法对航班数据进行聚类分析,以轮廓系数作为聚类分析的评价指标,利用划分后的数据分别训练子网络,并使用贝叶斯优化算法优化网络超参数,从而自动确定网络结构,对每个子网络的输出结果进行集成;本发明引入模块化集成的思想,利用聚类集群的方式分解复杂的建模任务,然后利用基于贝叶斯优化的DNN分别构建子网络,用于学习不同的子任务,通过用不同的模块并行处理不同的子任务的方式,提高模型的效率和准确性。
Description
技术领域
本发明属于航班到达时间预测技术领域,具体涉及一种基于CC-MIDNN的飞机到港时间预测方法。
背景技术
航空运输业蓬勃发展,飞行流量大幅增加,如今正面临着日益严重的空中交通拥挤问题,航班延误率的逐年升高,给航空公司和旅客造成了极大的经济损失。欧美国家通过航班排序与跑道分配策略缓解延误,其中航班预计到达时间(ETA)的估计扮演重要角色,是协作决策(CDM)的一个关键组成部分。航班延误会造成航空公司的市场损失。准确的预计到达时间使航空公司更容易协调地面行动,减少时间和精力的浪费。还将有助于提高用于序列优化的决策支持工具(如到达管理器AMAN)的性能,并将为空中交通管制员提供有价值的态势感知。
飞机到港时间预测方法主要分为两种。传统预测方法严重依赖于飞机性能参数或物理轨迹,计算出飞行轨迹,然后预估完成预测轨迹所需的时间。另一种是利用历史数据和经验,综合考虑环境因素和机场情况,通过算法拟合多种特征与到达时间之间的关系,是一种典型的以数据为驱动的预测问题。近些年,机器学习算法常用于后者的研究当中,其可以从经验和真实数据中学习非常复杂的函数关系,从而实现多因素与到港时间之间关系的拟合。
在前人的研究中对于使用神经网络进行ETA预测,多数只停留在应用层面。近年来,人工神经网络(ANN)在非线性系统建模中得到了广泛的应用,并取得了巨大的成功。所以通过将深度学习算法引入到飞机到港时间的预测问题中,可以丰富解决问题的手段,同时也能扩展深度学习的应用领域。然而使用单个神经网络的模型可能会导致严重的遗忘问题,通过引入模块化集成思想可以得到解决,并提升总体性能。并且模块化集成神经网络相比于传统单一网络无论是在结构还是性能上都有一定优势。
发明内容
针对现有技术中单一神经网络在对复杂问题进行建模时,由于数据间关系复杂且数量巨大,难免造成学习效率低下,准确性不高的不足,本发明提供了一种基于聚类集群的模块集成深度神经网络,根据飞行任务、飞行环境等信息将航班数据细分化,从而分解复杂的建模任务。而后根据不同的数据情况分别构建与之对应的子网络,从而完成预测模型的训练。预测样本会经过每一个子网络,并生成相应的预测结果。CC-MIDNN会对预测结果进行集成,形成最终的输出结果,从而解决现有技术中存在单一神经网络在对复杂问题进行建模时,由于数据间关系复杂且数量巨大,难免造成学习效率低下,准确性不高的问题。
一种基于CC-MIDNN的飞机到港时间的预测方法,包括以下步骤:
获取飞机的航班数据;
对航班数据进行预处理,得到航班数据的向量矩阵;
基于聚类集群的模块化集成深度神经网络CC-MIDNN构建飞机到港时间的预测模型;
将航班数据的向量矩阵作为预测模型的输入,输出预测值;
根据预测值对飞机到港的时间进行预测;
其中,所述将航班数据的向量矩阵作为预测模型的输入,输出预测值,包括:
将航班数据的向量矩阵输入预测模型中;
利用聚类分析方法将输入的向量矩阵分解为多个子矩阵;
将每个子矩阵一一对应分配到CC-MIDNN的各个子网络中进行学习,所述子网络通过基于贝叶斯优化的DNN神经网络进行构建;
将各个子网络中每一个个体网络的输出结果进行集成,输出集成后的预测结果。
进一步地,所述航班数据包括浮点数型数据和编码类型数据,所述浮点数型数据包括起降时间和风速,所述编码类型数据包括飞机型号和云覆盖。
进一步地,所述对航班数据进行预处理通过对航班数据中的编码类型数据进一步编码,处理为浮点数类型数据。
进一步地,所述预测模型包括输入层、集群划分层、子网络层和集成层。
进一步地,所述集群划分层负责将复杂或庞大的任务细分化,并分配到相应的模块当中。
进一步地,所述子网络层由多个并行工作的个体网络组成,其子网络数量由聚类结果确定。
进一步地,所述利用聚类分析方法将输入的向量矩阵X分解为k个子矩阵,其步骤具体包括:
预设最大集群数量K,初始化聚类集群数量k=2;
随机选择出k个样本点作为聚类中心点;
计算每个样本点到各个聚类中心点的距离d,距离计算公式为:
其中xi为样本点,i=1,2,...,M-k;xj为聚类中心点,j=1,2,...,k。xi,xj二者均为p维的样本点;
找到距离样本最近的聚类中心点,并将其归为该聚类中心点代表的簇中;
重新计算每个簇的聚类中心点;
判断新的聚类中心点与之前的聚类中心点是否相同或相近,若相同或相近进行下一步,若否则重新计算每个样本点到各个聚类中心点的距离d;
计算当前k值情况下的集群轮廓系数,计算公式为:
其中s(i)为单一样i的轮廓系数,a(i)为i所属簇内其它样本的平均距离,b(i)为i与其它簇的样本平均距离的最小值,S为聚类总体的轮廓系数;
判断k是否等于K,若k=K则结束,如果k<K,则令k=k+1,并且重新随机选择出k+1个样本点作为聚类中心点。
进一步地,所述将各个子网络中每一个个体网络的输出结果进行集成,其集成方法包括预分类加权法和泛化网络定限集成法。
进一步地,采用所述预分类加权法将各个子网络中每一个个体网络的输出结果进行集成,包括以下步骤:
设置一个分类器;
利用聚类分析结果对分类器进行训练,进而对测试数据进行预分类;
根据预分类结果得到某一条数据属于哪一个个体网络或是偏向于哪几个个体网络;
将得到的结论作为权值设置依据,对几组个体网络的输出结果进行加权平均,得到最终结果。
进一步地,采用所述泛化网络定限集成法将各个子网络中每一个个体网络的输出结果进行集成,包括以下步骤:
利用所有的训练集数据训练出一个兼顾整体的泛化网络;
利用泛化网络估计预测值范围,选择出子网络预测结果与泛化网络结果最相近的两组数据进行平均;
将平均后的结果作为集成网络的最终输出。
本发明提供了一种基于CC-MIDNN的飞机到港时间的预测方法,具备以下
有益效果:
本发明中CC-MIDNN引入模块化集成的思想,通过用不同的模块并行处理不同的子任务的方式,提高模型的效率和准确性。CC-MIDNN利用聚类集群的方式分解复杂的建模任务,然后利用基于贝叶斯优化的DNN分别构建子网络,用于学习不同的子任务。最后提出新的集成思想,解决传统集成方法因依赖子模块训练精度而产生的过拟合问题,并将其应用于子网络输出的集成,得到最终的输出结果。
本发明提出一种基于聚类集群的模块化集成深度神经网络,并将其应用到飞机到港时间预测问题当中,证明了其在实际应用有效性和优越性。
本发明中CC-MIDNN以DNN为基础模型,使用贝叶斯优化算法确定网络超参数,整体网络结构能够自动确定,且由于泛化网络的存在,无需担心过拟合问题。
附图说明
图1为本发明实施例中DNN的结构示意图;
图2为本发明实施例中模块化集成网络结构示意图;
图3为本发明实施例中CC-MIDNN的结构图;
图4为本发明实施例中预分类加权法原理图;
图5为本发明实施例中泛化网络定限集成法原理图;
图6为本发明实施例中CC-MIDNN流程图;
图7为本发明实施例中LisbonAirport位置示意图;
图8为本发明实施例中数据特征类型图;
图9为本发明实施例中子网络超参数优化过程图;
图10为本发明实施例中使用泛化网络定限集成法的集成神经网络结果图;
图11为本发明实施例中使用熵加权法的集成神经网络结果图;
图12为本发明实施例中使用预分类加权法(DNN分类器)的集成神经网络结果图;
图13为本发明实施例中使用预分类加权法(随机森林分类器)的集成神经网络结果图;
图14为本发明实施例中随机森林算法结果图;
图15为本发明实施例中DNN实验结果图;
图16为本发明实施例中CNN实验结果图;
图17为本发明实施例中LSTM实验结果图;
图18为本发明实施例中使用泛化网络定限集成法的集成神经网络实验结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
深度神经网络(Deep Neural Networks,DNN)是深度学习的基础,其本质是模拟人脑的学习系统,通过增加网络的层数让机器从数据中学习高层关系。随着人工智能的发展,DNN在拟合高维非线性函数方面具有不可比拟的优势。图1为DNN的结构示意图。
神经网络的模块化与集成。随着机器学习领域中集成算法的出现,且表现出优异的性能(例如随机森林算法)。人们开始考虑将模块化集成的思想应用于深度学习领域。神经网络集成是由Hansen and Salamon在1990年正式引入的。Hansen and Salamon认为,通过训练多个神经网络并整合其输出,可以大大提高神经网络系统的泛化能力。Modularneural network(MNN)是由Jacobs等人在1991年提出,MNN将复杂的任务分解,并分别利用不同的子网络解决,从而形成模块化结构。提高了模型的效率和准确性。模块化集成网络结构如图2所示。
K-means聚类算法是一种典型的无监督学习算法,在1967年由Mac-Queen提出。K-means将数据点与原型之间的距离和作为最优目标函数,利用极值函数法得到迭代运算规则。K-means聚类算法采用欧氏距离作为相似性度量,拟得到某一初始聚类中心的最优分类。
本发明提出的基于聚类集群的模块化集成深度神经网络构建Clusterclustering-based modular integrated DNN(CC-MIDNN)引入了模块化集成的设计思想,拥有多网络并行的结构,该种结构已被证明在性能和结构上具有一定要优越性。CC-MIDNN使用聚类算法对任务进行划分,将相似的输入样本送入同一模块中,以此来训练出用于解决不同任务的子网络,提高了学习效率,降低了建模难度。之后针对传统加权平均法存在的过拟合问题提出新颖的集成方法,利用其对各个子网络的输出进行集成,得到最终的输出结果。
CC-MIDNN体系结构:CC-MIDNN由输入层、集群划分层、子网络层和集成层四部分组成(如图3所示)。CC-MIDNN中各部分的具体描述如下。
(1)输入层:将数据样本的向量矩阵输入到集成网络当中。输入矩阵X=[x1,x2,...,xN],其中xi=[xi1,xi2,...,xiM]T,(i=1,2,...,N)。N为输入矩阵的特征个数,M为输入矩阵的样本个数。
(2)集群划分层:集群划分层负责将复杂或庞大的任务细分化,并分配到相应的模块当中。CC-MIDNN利用聚类分析方法将输入矩阵X分解为k个小集群,表示为子矩阵Sn(j×N),(n=1,2,...,k)。然后将子矩阵分配到各个子网络当中。
(3)子网络层:CC-MIDNN的子网络层学习划分后的数据,由多个并行工作的个体网络组成,其数量由聚类结果确定。本发明采用DNN神经网络作为每个子网络的模型,采用贝叶斯优化算法确定子网络超参数,进而构造DNN网络结构。
(4)集成层:集成层负责将子网络层中每一个个体网络的输出结果进行集成或甄别,形成最终的输出结果。本发明分别采用了预分类加权法、泛化网络定限集成法和熵加权法三种方法作为网络的集成方法,通过实验寻找与CC-MIDNN最适配的网络集成方法。
聚类集群划分方法:本发明使用K-means聚类算法在CC-MIDNN中进行聚类集群划分任务。通过K-means将输入到网络中的样本进行划分。K-means以样本之间的欧氏距离为依据将样本进行聚类,细化为多个集群。使用轮廓系数作为评定聚类结果的指标,从而确定适合输入样本的最优聚类数。
聚类集群划分步骤如下:
Step 1:预设最大集群数量K,初始化聚类集群数量k=2。
Step 2:随机选择出k个样本点作为聚类中心点。
Step 3:计算每个样本点到各个聚类中心点的距离,距离计算公式如式(1)。
其中xi为样本点,i=1,2,...,M-k;xj为聚类中心点,j=1,2,...,k。两个二者均为p维的样本点。
找到距离样本最近的聚类中心点,并将其归为该聚类中心点代表的簇中。
Step 4:重新计算每个簇的聚类中心点。
Step 5:判断新的聚类中心点与之前的聚类中心点是否相同或相近。若相同或相近执行Step 6,否着跳转到Step 3。
Step 6:计算当前k值情况下的集群轮廓系数,计算公式如式(3)。
其中s(i)为单一样i的轮廓系数,a(i)为i所属簇内其它样本的平均距离,b(i)为i与其它簇的样本平均距离的最小值,S为聚类总体的轮廓系数。
Step 7:判断k=K?若k=K则过程结束。如果k<K,则令k=k+1,并且返回Step 2。
子网络集成方法:子网络集成作为MNN的重要环节,传统MNN所使用的集成方法大部分是基于加权平均的思想,以子网络的训练误差作为权值更新依据。这就会造成两点问题:(1)由于训练精度高的子网络权值占比高,使得模型整体出现过拟合现象。(2)权值分配根据子网络的训练误差,新的预测样本可能跟训练集数据分布并不相同。不能充分挖掘MNN的潜力。本发明提出了两种新的输出集成方法,一种是预分类加权法,其根据模块化网络的特点,设置一个分类器对新的预测样本进行预分类,根据分类概率更新权值。另一种方法是泛化网络定限集成法,其利用整体数据训练出一个泛化能力很强的DNN,此处称为泛化网络。通过该泛化网络可以预测出真实结果的大致范围。从而根据此范围筛选出最有可能的一个或几个预测结果。
本发明改进传统加权平均集成方法以模块训练精度为依据的权值更新策略,提出预分类加权法,预设分类器,根据分类结果更新权值。还提出一种泛化网络定限集成法,通过训练泛化网络估计预测值的范围,最终从各个模块的输出结果中筛选出最符合的结果,以此来避免加权平均时会出现的过拟合现象,进一步挖掘网络潜能。同时也对比了前人所提出的熵加权集成法。
预分类加权法,该集成方法的主要思想是,通过设置一个分类器,利用聚类分析结果对分类器进行训练,而后对测试数据进行预分类,从而得到某一条数据属于哪一个个体网络或是偏向于哪几个网络。以此作为权值设置依据,对几组个体网络的输出结果进行加权平均得到最终结果。
泛化网络定限集成法,集成模块化网络通过聚类分析将相似情况的数据聚为一类,从而训练出与其相适应的神经网络。当利用集成网络对新的数据进行预测时,新的数据可能只适合其中某几个子网络。该方法是利用所有的训练集数据训练出一个兼顾整体的泛化网络,利用泛化网络估计预测值范围,选择出子网络预测结果与泛化网络结果最相近的两组数据进行平均,以此作为集成网络的最终输出结果。
熵加权法,熵加权法根据子网络在训练过程中的相对误差(如公式(4)所示),进而推导出某一子网络的信息熵(如公式(6)所示)。
其中pit为第i个神经网络在时刻t的相对预测误差,yt为预测目标在时刻t的真实值,yit为第i个神经网络在时刻t的预测值。
其中k(>0)为常量。信息熵ei表示第i个神经网络的信息效用值。当信息完全混乱时wit=1/m,此时ei达到最大值,即ei=klnm,k=1/lnm。
信息熵用于衡量子网的信息效用。网络的信息效用越高,其训练效果越好,对整体的价值也越大。在此基础上更新综合网络中每个子网的权重。根据等式(8)来确定集成神经网络的输出值。
其中hi为信息效用,hi=i-ei。
CC-MIDNN的设计包括集群划分层、子网络层和集成层。集群划分层通过K-means聚类算法实现,将输入的样本细分化,能够减轻后续网络训练的压力,聚类集群数量由聚类结果确定。CC-MIDNN的子网络层中的子网络数量由聚类簇数量决定,即各个集群中的样本数据与子网络层中的个体网络一一对应。每子网络使用DNN神经网络和贝叶斯优化算法构建。每个子网络的输出结果使用网络集成方法进行集成。详细的设计流程如图6所示。
基于CC-MIDNN的飞机到港时间预测模型,模型的训练复杂度会随着数据量的增长而增长,传统方法在面对大规模数据集建模时,训练时间长、效率低下是最突出的问题。CC-MIDNN分解复杂的建模任务,利用多个独立并行的子网络进行求解,能够大大提高建模效率和预测精度。
基于CC-MIDNN的飞机到港时间预测模型的设计步骤如下:
Step 1:对航班数据进行预处理。统一整洁的数据格式对神经网络模型的训练来说是至关重要的。原始数据当中,不仅存在起降时间、风速等浮点数类型数据,还存在飞机型号、云覆盖等编码类型数据。所以需要对原始数据集中的编码类型数据进一步编码,处理成浮点数类型数据。这将有利于模型发掘数据之间的关系。
Step 2:利用K-means算法对航班数据进行聚类分析,以轮廓系数作为聚类分析的评价指标,其定义如式(3)所示。将航班数据细分化,为后续训练用于处理不同任务的子网络做准备。
Step 3:子网络构建。利用划分后的数据分别训练子网络。子网络基于DNN,并使用贝叶斯优化算法优化网络超参数,从而自动确定网络结构。
Step 4:子网络输出集成。由模块化网络的结构特点可知,对于一条数据,每一个子网络均会得到相应的输出。所以需要对每个子网络的输出结果进行集成,利用科学的方法结合或筛选子网络预测结果,从而得到最终输出。
Step 5:预测结果输出。
实验分析:本实验以欧洲航空LIS机场2017年的航班数据为实验对象,通过所提出的CC-MIDNN建立预测模型,预测航班的到港时间,进而测试网络性能。以MAE、MSE、RMSE作为评价指标,将结果与其他几种常见的预测模型作比较,分别是传统深度神经网络(DNN)、CNN、LSTM和随机森林。
实验数据集:里斯本机场(Lisbon Airport,LIS)是位于葡萄牙首都里斯本市的一座民用机场,是西欧规模最大、设备最完善的机场之一,图7为里斯本机场。本实验以欧洲航空LIS机场2017年的航班数据为实验对象,其中包含了飞机的航班号、始发机场、预计出发时间等航班信息,始发机场和目的机场的气温、云高、风速、风向等环境信息。总计16347架次航班数据。表1展示了航班数据的具体信息。
表1航班数据
原始数据中部分特征的数据类型如图8所示。飞机型号和起飞机场在原始数据当中以文字和编码的形式呈现,不存在一些递进或者承接关系。本发明将这两类特征进行随机编码,实现其向浮点数类型数据的转换。机场的云层覆盖为当时机场上空的云量,以英文缩写的形式表示。而飞机的飞行将会因机场上空云量的多少而受到不同程度的影响,所以原始数据中机场云层覆盖数据会根据云量的多少由小到大进行编码,从1到7分为七个层次[33]。原始数据当中的时间戳数据不适用于模型的训练,所以将时间戳数据转换为数字特征。即将原始数据中的“几点几分”转换成“当天的第几分钟”,如表2所示。
表2时间戳数据转换
评价指标,使用平均绝对误差MAE、均方误差MSE和均方根误差RMSE来对模型进行性能评估,其定义如式(9)-(11)所示。
其中,m为样本数量,yi为第i个样本的实际值,为第i个样本的预测值。
实验与结果分析:首先将航班数据按7:3随机划分为训练集和测试集。利用K-means算法对训练集进行聚类分析,以轮廓系数作为聚类分析的评价指标。由于轮廓系数本身的特性,在生成的簇越多时,该指标会有逐渐减小的趋势。所以本实验选取局部最大值作为下一步实验的依据,认为该种聚类情况优于前后两种情况,此处选择聚6类继续下一步实验。将聚类得到的6组数据分别送入到6个基于DNN的个体神经网络当中进行训练,最终训练得到6组个体网络。
参数设置:本实验使用贝叶斯优化算法对神经网络的超参数进行优化,以学习率、网络深度和每一层的网络节点个数作为优化对象,以寻找能够得到最低的平均绝对误差的参数组合作为优化目标。以优化后得到的超参数训练集成神经网络,并泛化网络定限集成法作为个体网络结果的集成方法建立飞机到港时间预测模型。图9展示了集成网络中6组个体网络的超参数优化过程。
子网络集成实验:集成网络的最终输出结果需要对6组子网络的输出进行集成整合而得到。本实验所使用的集成方法分为两类,一类是加权平均法,其中的具体方法包括预分类加权法、熵加权法。另一类是泛化网络定限集成法;图10-13展示了使用不同集成方法的集成神经网络对于飞机到港时间的预测结果。
实验对比:将基于优化CC-MIDNN建立的预测模型与基于传统深度神经网络(DNN)、CNN、LSTM以及随机森林算法建立的预测模型进行实验对比,预测结果如图14-18所示,实验结果见表3所示。
表3实验结果
MAE | MSE | RMSE |
23.57 | 6040.61 | 77.72 |
58.54 | 20255.90 | 142.32 |
295.10 | 129367.42 | 359.68 |
18.40 | 4459.60 | 66.78 |
24.16 | 4748.97 | 68.91 |
19.27 | 5065.67 | 71.17 |
78.67 | 33668.64 | 183.49 |
12.48 | 3551.76 | 59.60 |
在对比DNN与CNN、LSTM三种三种网络时发现,在实验前期DNN对于数据的质量要求不高,普适性较好,并且网络原理简单容易实现。CNN和LSTM则需要对数据进行一定的预处理工作。在实验过程中,对于相同的实验数据、实验设备以及采用相同的迭代次数时,DNN的训练时间最短。CNN和LSTM的训练时间均为DNN训练时间的4倍以上。而最终的实验结果来看,在相同的实验条件下,DNN的实验结果在三种评价指标下表现均优于另外两种网络。
由实验结果可以看出,优化集成深度神经网络与传统的单一深度神经网络相比,该方法预测结果与实际值之间最为接近,获得了较小的测试MAE、MSE和RMSE。以MAE为例,相比于传统方法,CC-MIDNN的预测值与实际值之间的误差降低了5.92分钟,并控制在15分钟以内。可以表明CC-MIDNN的泛化性能和预测精度优于单一的神经网络以及其他的机器学习算法。也说明该网络将数据进行划分,将任务细分化这一特点,相比于单一网络具有更好的效果。
泛化网络定限集成法在三个评价指标上均有较好的表现,相比于传统加权平均方法误差降低了9.14分钟,说明该方法能够作为一种新的集成方法得到应用,并有一定的优越性。本发明提出集成网络中的个体网络的训练数据并非是整体训练集,而以泛化网络预测结果作为目标,寻找与之最接近的结果,是分别针对每一条测试集数据在多个个体网络中寻找最有可能的预测结果,这也与集成网络将任务细分化的理念相契合,这也是其能与本网络相契合的原因。
本发明提出一种CC-MIDNN网络结构,并利用其建立飞机到港时间预测模型。CC-MIDNN引入模块化集成神经网络的思想,通过聚类将输入样本进行划分,将相似的样本送入到相应的子网络当中,以此降低后续子网络的训练复杂度。本发明还提出了两种集成算法,从实验结果来看,预分类加权法的效果较差,由于该方法中的预分类器是根据聚类结果训练得到的,簇与簇之间可能存在一定相关性,这就存在扩大误差的可能。而泛化网络定限集成法表现较为优异,验证了其能够进一步挖掘模块化集成神经网络的潜能,并起到了提高准确性的作用。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种基于CC-MIDNN的飞机到港时间预测方法,其特征在于,包括以下步骤:
获取飞机的航班数据;
对航班数据进行预处理,得到航班数据的向量矩阵;
基于聚类集群的模块化集成深度神经网络CC-MIDNN构建飞机到港时间的预测模型;
将航班数据的向量矩阵作为预测模型的输入,输出预测值;
根据预测值对飞机到港的时间进行预测;
其中,所述将航班数据的向量矩阵作为预测模型的输入,输出预测值,包括:
将航班数据的向量矩阵输入预测模型中;
利用聚类分析方法将输入的向量矩阵分解为多个子矩阵;
将每个子矩阵一一对应分配到CC-MIDNN的各个子网络中进行学习,所述子网络通过基于贝叶斯优化的DNN神经网络进行构建;
将各个子网络中每一个个体网络的输出结果进行集成,输出集成后的预测结果。
2.根据权利要求1所述的一种基于CC-MIDNN的飞机到港时间的预测方法,其特征在于,所述航班数据包括浮点数型数据和编码类型数据,所述浮点数型数据包括起降时间和风速,所述编码类型数据包括飞机型号和云覆盖。
3.根据权利要求2所述的一种基于CC-MIDNN的飞机到港时间的预测方法,其特征在于,所述对航班数据进行预处理通过对航班数据中的编码类型数据进一步编码,处理为浮点数类型数据。
4.根据权利要求1所述的一种基于CC-MIDNN的飞机到港时间的预测方法,其特征在于,所述预测模型包括输入层、集群划分层、子网络层和集成层。
5.根据权利要求4所述的一种基于CC-MIDNN的飞机到港时间的预测方法,其特征在于,所述集群划分层负责将复杂或庞大的任务细分化,并分配到相应的模块当中。
6.根据权利要求4所述的一种基于CC-MIDNN的飞机到港时间的预测方法,其特征在于,所述子网络层由多个并行工作的个体网络组成,其子网络数量由聚类结果确定。
7.根据权利要求1所述的一种基于CC-MIDNN的飞机到港时间的预测方法,其特征在于,所述利用聚类分析方法将输入的向量矩阵X分解为k个子矩阵,其步骤具体包括:
预设最大集群数量K,初始化聚类集群数量k=2;
随机选择出k个样本点作为聚类中心点;
计算每个样本点到各个聚类中心点的距离d,距离计算公式为:
其中xi为样本点,i=1,2,...,M-k;xj为聚类中心点,j=1,2,...,k。xi,xj二者均为p维的样本点;
找到距离样本最近的聚类中心点,并将其归为该聚类中心点代表的簇中;
重新计算每个簇的聚类中心点;
判断新的聚类中心点与之前的聚类中心点是否相同或相近,若相同或相近进行下一步,若否则重新计算每个样本点到各个聚类中心点的距离d;
计算当前k值情况下的集群轮廓系数,计算公式为:
其中s(i)为单一样i的轮廓系数,a(i)为i所属簇内其它样本的平均距离,b(i)为i与其它簇的样本平均距离的最小值,S为聚类总体的轮廓系数;
判断k是否等于K,若k=K则结束,如果k<K,则令k=k+1,并且重新随机选择出k+1个样本点作为聚类中心点。
8.根据权利要求1所述的一种基于CC-MIDNN的飞机到港时间的预测方法,其特征在于,所述将各个子网络中每一个个体网络的输出结果进行集成,其集成方法包括预分类加权法和泛化网络定限集成法。
9.根据权利要求8所述的一种基于CC-MIDNN的飞机到港时间的预测方法,其特征在于,采用所述预分类加权法将各个子网络中每一个个体网络的输出结果进行集成,包括以下步骤:
设置一个分类器;
利用聚类分析结果对分类器进行训练,进而对测试数据进行预分类;
根据预分类结果得到某一条数据属于哪一个个体网络或是偏向于哪几个个体网络;
将得到的结论作为权值设置依据,对几组个体网络的输出结果进行加权平均,得到最终结果。
10.根据权利要求8所述的一种基于CC-MIDNN的飞机到港时间的预测方法,其特征在于,采用所述泛化网络定限集成法将各个子网络中每一个个体网络的输出结果进行集成,包括以下步骤:
利用所有的训练集数据训练出一个兼顾整体的泛化网络;
利用泛化网络估计预测值范围,选择出子网络预测结果与泛化网络结果最相近的两组数据进行平均;
将平均后的结果作为集成网络的最终输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310985709.0A CN117035060A (zh) | 2023-08-07 | 2023-08-07 | 一种基于cc-midnn的飞机到港时间预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310985709.0A CN117035060A (zh) | 2023-08-07 | 2023-08-07 | 一种基于cc-midnn的飞机到港时间预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117035060A true CN117035060A (zh) | 2023-11-10 |
Family
ID=88629321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310985709.0A Pending CN117035060A (zh) | 2023-08-07 | 2023-08-07 | 一种基于cc-midnn的飞机到港时间预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117035060A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117610746A (zh) * | 2024-01-23 | 2024-02-27 | 中航信移动科技有限公司 | 一种预测模型监测方法、存储介质及电子设备 |
-
2023
- 2023-08-07 CN CN202310985709.0A patent/CN117035060A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117610746A (zh) * | 2024-01-23 | 2024-02-27 | 中航信移动科技有限公司 | 一种预测模型监测方法、存储介质及电子设备 |
CN117610746B (zh) * | 2024-01-23 | 2024-04-19 | 中航信移动科技有限公司 | 一种预测模型监测方法、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112613664B (zh) | 基于水上交通事故风险预测与评估的预警方法和系统 | |
CN111008669A (zh) | 一种基于深度学习的重着陆预测方法 | |
CN105160866A (zh) | 一种基于深度学习神经网络结构的交通流预测方法 | |
CN112862171B (zh) | 一种基于时空神经网络的航班到达时间预测方法 | |
CN110164129B (zh) | 基于gernn的单交叉口多车道交通流量预测方法 | |
CN113487855B (zh) | 一种基于emd-gan神经网络结构的交通流预测方法 | |
CN112230675B (zh) | 在协同搜救中考虑运行环境和性能的无人机任务分配方法 | |
CN116468186B (zh) | 一种航班链延误时间预测方法、电子设备及存储介质 | |
CN117035060A (zh) | 一种基于cc-midnn的飞机到港时间预测方法 | |
CN110443448B (zh) | 一种基于双向lstm的飞机机位分类预测方法和系统 | |
CN110163449B (zh) | 一种基于主动时空图卷积的机动车排污监测节点部署方法 | |
CN112732905B (zh) | 一种基于知识图谱的交通事故分析与防控方法及系统 | |
CN112270355A (zh) | 基于大数据技术与sae-gru的主动安全预测方法 | |
CN112327903A (zh) | 一种基于深度混合密度网络的航空器轨迹生成方法 | |
CN113657671B (zh) | 一种基于集成学习的航班延误预测方法 | |
Yang et al. | LSTM-based deep learning model for civil aircraft position and attitude prediction approach | |
CN114266406A (zh) | 一种基于联邦学习的大范围路网交通流状态预测方法 | |
Deng et al. | A flight arrival time prediction method based on cluster clustering-based modular with deep neural network | |
Han et al. | A Hybrid BPNN-GARF-SVR PredictionModel Based on EEMD for Ship Motion. | |
CN114037122A (zh) | 基于大数据挖掘处理分析的航班延误预测方法 | |
CN112183721B (zh) | 一种基于自适应差分进化的组合水文预测模型的构建方法 | |
Khan et al. | A novel parallel series data-driven model for IATA-coded flight delays prediction and features analysis | |
CN116434538A (zh) | 基于异构数据融合的城市交通流预测模型构建方法 | |
CN116205120A (zh) | 一种基于深度学习组合模型的航班运行网络延误预测方法 | |
CN114444763A (zh) | 基于afsa-gnn的风电功率预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |