CN111047182B - 一种基于深度无监督学习的空域复杂度评估方法 - Google Patents
一种基于深度无监督学习的空域复杂度评估方法 Download PDFInfo
- Publication number
- CN111047182B CN111047182B CN201911258728.3A CN201911258728A CN111047182B CN 111047182 B CN111047182 B CN 111047182B CN 201911258728 A CN201911258728 A CN 201911258728A CN 111047182 B CN111047182 B CN 111047182B
- Authority
- CN
- China
- Prior art keywords
- complexity
- airspace
- low
- training
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 59
- 238000013135 deep learning Methods 0.000 claims abstract description 38
- 230000006870 function Effects 0.000 claims abstract description 32
- 238000013210 evaluation model Methods 0.000 claims abstract description 19
- 238000011478 gradient descent method Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 49
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 11
- 238000003780 insertion Methods 0.000 claims description 10
- 230000037431 insertion Effects 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000005192 partition Methods 0.000 claims description 2
- 238000011084 recovery Methods 0.000 claims 1
- 238000005065 mining Methods 0.000 abstract description 5
- 239000000463 material Substances 0.000 abstract description 4
- 230000000694 effects Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 3
- 201000004569 Blindness Diseases 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000006911 nucleation Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G06Q50/40—
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft, e.g. air-traffic control [ATC]
- G08G5/0043—Traffic management of multiple aircrafts from the ground
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft, e.g. air-traffic control [ATC]
- G08G5/0095—Aspects of air-traffic control not provided for in the other subgroups of this main group
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft, e.g. air-traffic control [ATC]
- G08G5/0073—Surveillance aids
- G08G5/0082—Surveillance aids for monitoring traffic from a ground station
Abstract
本发明提出一种基于深度无监督学习的空域复杂度评估方法,用于空中交通管制。本发明包括:采用堆叠式自编码器模型的深度学习网络来建立空域复杂度评估模型,将输入的空域复杂度指标因子进行低维嵌入表示,利用得到的低维嵌入点获取空域复杂度的聚类质心;本发明利用低维嵌入点的软指派分布和真实指派分布来构建代价函数,对所建立的模型采用梯度下降法进行训练,获得训练好的空域复杂度评估模型以及三个空域复杂度的聚类质心,用于评估当前空域复杂。本发明不依赖空中交通管制员标定标签,使用无监督的方法对空域扇区数据进行复杂度分类,大大降低了人力物力成本,同时实现空域复杂度数据的准确挖掘,使得评估结果更加准确。
Description
技术领域
本发明属于空中交通管制的空域态势评估技术领域,具体涉及一种基于深度无监督学习的空域复杂度评估方法,以基于此进行交通管制。
背景技术
随着航空运输业的发展,空中交通流量急剧增大,空域环境越发复杂,给空中交通管制员带来的工作负荷不断加大。空域复杂度计算是指管制员所指挥的空域的复杂度,包括可见得飞机运行、不可见的程序运行等等。空域复杂度计算在空中交通管制领域是被广泛研究的问题之一。该问题的主要研究内容是:如何利用空域态势运行特征,通过一定的计算方式,给出空域运行态势的复杂度等级,包含高复杂度、中复杂度和低复杂度,进而指导空中交通管制员是否需要对空域进行交通管制。
空域复杂度计算本质上是个分类问题。传统方法依据管制员经验知识来进行空域复杂度评估,一般包含以下三个步骤:(1)依据原始数据提取空域态势运行特征,对空域态势信息进行向量化;(2)通过空域态势运行特征进行向量化计算,得到复杂度指标因子;(3)依据管制员的经验知识,参考计算后的复杂度指标因子进行复杂度标定。由此可见,在工程上实现空域复杂度的评估严重依赖于空中交通管制员经验知识,因此,传统计算方法依据管制员经验知识来进行空域态势复杂度评估,需要耗费大量的人力物力资源,并且无法做到实时性,即:给出一条空域运行态势数据,仍然需要通过一定时间的人工计算才能给出复杂度等级。
随着机器学习的兴起,有监督学习方法广泛用于模式识别、分类任务,并取得了令人瞩目的效果。利用传统有监督学习方法进行空域态势复杂度评估问题时,需要提供大量的人工标定样本数据,否则模型极易出现欠拟合。与之相反,使用先进的基于深度学习的有监督学习方法,人工标定的样本数据量如果不够大,模型有出现过拟合的风险。因此,利用有监督学习方法进行空域复杂度计算需要提供高质量和海量的人工标定样本,用于模型的学习。但是海量的人工标定数据样本的获取是一个耗时耗力的过程,并且过程中难以保证数据的质量性,因此利用有监督学习进行空域复杂度计算遇到了巨大瓶颈。
无监督学习一直广泛应用于数据挖掘、数据处理等科学领域,这类学习算法在挖掘原始数据信息、分析原始数据结构以及发掘数据潜在特征方面存在巨大优势。在空域复杂度方面,参考文件1(D.Gianazza,Airspace configuration using air trafficcomplexity metrics.In Proc.ATM,Barcelona,Spain,2007)中采用了无监督学习中主成分分析方法(PCA)对复杂度指标进行挖掘,遴选出6个能够充分代表扇区运行复杂性的关键指标,进而利用BP((back propagation))神经网络进行复杂度的等级分类,在一定程度上解决了复杂度样本维度较高、指标间存在冗余等问题。然而这种策略并不是最优的,PCA是一种线性降维方法,并不考虑指标间的非线性关联,无法对空域复杂度数据准确分类。因此,利用传统无监督学习在解决空域复杂度的分类任务时仍然面临着以下挑战:(1)高维数据在高维空间存在维度灾难,用于分类任务时,样本极易存在偏倚;(2)原始数据空间一般存在复杂的非线性,且难以预知,虽然诸如:谱方法、核化方法等非线性方法能够解决部分数据空间的非线性问题,但是这几类研究方法仍然存在着盲目性和尝试性。
发明内容
针对目前在交通管制的空域复杂度评估中,存在数据无法准确分类导致评估结果不准确,或者需要海量高质量的人工标定样本导致评估困难等问题,给管制员带来错误结论而出现误判等情况,本发明提供了一种基于深度无监督学习的空域复杂度评估方法。本发明方法不依赖管制员标定标签的数据集,同时利用深度学习的非线性映射挖掘数据样本的低维嵌入信息,从而改进数据分类准确性,使得评估结果更加准确。
本发明的基于深度无监督学习的空域复杂度评估方法,对从空域运行态势数据中提取的空域复杂度指标因子进行处理,实现步骤包括:
步骤1,建立基于深度学习网络的空域复杂度评估模型,并获取初始聚类质心;将空域运行态势的复杂度等级对应为三个聚类,对低维嵌入表示的训练样本集利用k-means均值聚类获得初始聚类质心;
步骤2,构建训练空域复杂度评估模型时的代价函数;设低维嵌入点存在一个实际的用于聚类任务的真实指派分布;利用t分布来描述低维嵌入点与聚类质心之间的相似度,称为软指派分布;空域复杂度评估模型训练时的目标是使软指派分布越来越接近真实指派分布,利用信息论中的相对熵—KL散度来衡量软指派分布与真实指派分布之间的差异,构造代价函数L;
步骤3,利用训练样本集x采用梯度下降法,以最小化步骤2的代价函数为目标,训练空域复杂度评估模型;空域运行态势的三个复杂度等级的聚类质心也随训练过程进行更新;
经过步骤3得到训练好的空域复杂度评估模型以及三个空域复杂度的聚类质心;
步骤4,利用训练好的空域复杂度评估模型实时进行空域复杂度评估;
管制员从当前空域运行态势数据中提取空域复杂度指标因子,输入训练好的空域复杂度评估模型,得到低维嵌入点,计算该低维嵌入点与三个空域复杂度的聚类质心的软指派分布,选取其中软指派分布值最大的空域复杂度,作为当前输入的空域复杂度指标因子所对应的空域复杂度。
所述的步骤1中,深度学习网络采用堆叠式自编码器模型,包括镜像对称结构的解码端与编码端;堆叠式自编码器的编码端将输入的空域复杂度指标样本进行低维嵌入表示,实现非线性降维,其中非线性映射函数利用训练样本集来对堆叠式自编码器模型训练得到,训练时的目标函数为‖y-x‖2,x为输入的训练样本集,是采集的历史空域复杂度指标集合;y是堆叠式自编码器的解码端输出的恢复数据集。
本发明与现有技术相比,具有以下优势和积极效果:
(1)本发明设计的基于深度无监督学习的空域复杂度计算方法,与现有的有监督学习方法相比,能够不依赖空中交通管制员标定标签,使用无监督的方法对空域扇区数据进行复杂度分类,大大降低了人力物力成本,减少了有监督方法中由于管制员误判所造成的模型学习不准确等问题。
(2)本发明设计的一种基于深度无监督学习的空域复杂度计算方法,与传统的无监督学习方法相比,考虑到了空域复杂度数据本身的特征:样本极易存在偏斜,原始数据空间存在复杂的非线性,使用一种深度无监督神经网络挖掘样本数据中蕴含的空域复杂度信息,进而实现空域复杂度数据的准确分类。
附图说明
图1是本发明的基于深度无监督学习的空域复杂度评估方法的整体流程图;
图2是本发明采用的堆叠式自编码器的结构示意图;
图3是本发明步骤1中模型初始化的流程图;
图4是本发明步骤2中构建模型训练时的代价函数的流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图对本发明作进一步的详细和深入描述。
随着深度学习的兴起,基于深度神经网络的无监督学习再次广受青睐,利用深度神经网络,理论上可以实现任意复杂的非线性映射,因此,能够基于数据样本学习数据空间的非线性特征,解决了传统无监督学习方法的盲目性。深度无监督学习中的自编码器模型,能够以黑箱模型给出原始数据的低维嵌入,虽然这种低维嵌入缺乏可解释性,但是通过大量的科学研究和实验验证,这种低维嵌入的表示往往准确描述了原始数据样本的特征,用于分类问题能取得更加优异的效果。本发明对获取的空域原始数据基于无监督学习进行空域复杂度计算,在无监督学习时,结合深度神经网络,来改进数据分类的准确性,并且在无监督学习模型训练过程中不需要引入管制员标定好的数据,省去了大量人工标定样本的人力物力开销。除此,深度无监督学习中的生成式模型,能够产生和原始数据同分布的新样本,可用于扩充样本集,进一步提高模型的训练效果,从而更准确地确定空域复杂度。
本发明的基于深度无监督学习的空域复杂度评估方法,如图1所示,分为下面四个步骤来说明。在空域复杂度计算中涉及的数据包含28种空域复杂度指标因子,这些指标因子由管制员通过空域运行态势数据进行计算并提取。具体来说,这些指标因子描述了影响空域运行复杂程度的动静态属性因素,其中有上升/下降航空器的数量、地速方差、平均密度、扇区容量、航空器水平/垂直接近度、航路交叉点平均距离、航路交叉点距离方差、最大航路最低安全高度等等,具体可参考文件2(Xi Zhu[1,2],Xianbin Cao[1,2],Kaiquan Cai[1,2].Measuring air traffic complexity based on small samples[J].中国航空学报:英文版,2017(30):1505.)。本发明以下步骤直接针对提取到的空域复杂度指标集进行操作。
步骤1,建立基于深度学习网络的空域复杂度评估模型,并进行参数初始化。
为了能够直接挖掘空域复杂度数据的低维嵌入信息,且消除维度灾难,以便于更有效进行空域复杂度聚类任务,需要对原始的复杂度因子指标集进行低维嵌入表示,本发明的深度学习网络采用堆叠式自编码器模型,对训练样本进行低维嵌入表示。样本xi的低维嵌入表示为:zi=fθ(xi),zi为xi的低维嵌入点,z是基于深度学习网络的低维嵌入,fθ是一个非线性映射,θ表示深度学习网络中变换的参数,本发明方法中,利用深度自编码器的编码端实现fθ,将在步骤1.2中说明。将本步骤分下面步骤1.1~1.3来说明。
步骤1.1,建立深度学习网络结构。
首先,建立堆叠式自编码器模型,用于挖掘原始空域复杂度因子指标集的低维嵌入信息。堆叠式自编码器模型分为编码端和解码端,是一种镜像对称的结构,如图2所示。编码端用于实现原始数据的低维嵌入,是一种非线性的降维方式。编码端的计算方法如下:
上面公式表示,对输入样本集x经过Dropout(·)处理后输出集合Dropout(·)是一种增强深度学习网络鲁棒性的方法,随机将中的一部分样本的某些特征因子设置为0。W1是基于深度学习网络的编码端权重,b1是基于深度学习网络的编码端偏置;g1是基于深度学习网络的编码端激活函数,本发明实施例中采用ReLu函数。
堆叠式自编码器的解码端用于从低维嵌入中恢复出原始数据,从而保证整个降维过程是合理而非任意指派的。解码段计算方法如下:
上面公式表示,对数据集z进行Dropout(·)处理后得到Dropout(·)是随机将中的一部分数据的某些特征因子随机设置为0。y表示堆叠式自编码器解码端恢复的数据集,W2是基于深度学习网络的解码端权重,b2是基于深度学习网络的解码端偏置;g2是基于深度学习网络的解码端激活函数,本发明实施例中采用ReLu函数。
本发明利用堆叠自编码器能够以黑箱模型给出原始数据的低维嵌入,虽然这种低维嵌入缺乏可解释性,但是通过大量的科学研究和实验验证,这种低维嵌入的表示往往准确描述了原始数据样本的特征,用于分类问题能取得更加优异的效果。
步骤1.2,对深度学习网络参数进行初始化。深度学习网络对数据方差、数据初始值极为敏感,为了提高深度学习网路的训练效果,需要对参数进行合理的初始化。
将θ=(W1,b1,W2,b2)作为深度学习网络参数,以‖y-x‖2作为目标函数,利用原始训练数据x进行深度学习网络梯度下降训练,即:
θ=argmin‖y-x‖2 (5)
步骤1.3,聚类质心点初始化。每个聚类代表一个空域运行态势的复杂度等级,本发明实施例中将包含3个聚类,分别代表空域的复杂度分别为高复杂度、中复杂度和低复杂度。
利用步骤1.2中训练所获得的堆叠式自编码器的编码端,作为低维嵌入映射方法,对原始的28维的空域复杂度指标数据进行低维嵌入表示。本发明的训练样本集通过训练获得的堆叠式自编码器的编码端,获取训练样本的低维嵌入表示本步骤对数据集z进行传统k-means均值聚类,指定聚类的簇数为k个,本发明中k=3,进行聚类的过程包括:
c、设定距离阈值d0,迭代步数N0;
g、对每个簇,将质心μj的值更新为δj,j=1,2,…k;
步骤2,对所建立的深度学习网络模型进行训练,构造训练时的代价函数,分为如下步骤2.1~2.3来说明。
步骤2.1,计算每个低维嵌入点zi与各聚类簇质心的软指派分布。
本发明利用t分布来描述低维嵌入点zi与质心点μj之间的相似度,称为软指派分布qij:
其中,qij∈[0,1],表示将第i个低维嵌入点zi指派给第j簇的概率,j=1,2,…k,概率值越大则代表该低维嵌入点更有可能被分到对应的簇中;α是一个可调节的常数,此处设置α=1。
步骤2.2,计算每个低维嵌入点的真实指派分布。
其中,pij表示低维嵌入点zi对于第j簇的真实指派分布,fj=∑iqij,fj代表了分类到第j个簇中的低维嵌入点的总的软指派分布概率之和。
步骤2.3,构建代价函数,使得;
深度学习网络的学习目标就是学得该实际存在的用于聚类任务的真实指派分布pij。虽然该实际存在的用于聚类任务的真实指派分布pij是客观存在的,但是本发明无法预先得知。但基于t分布来描述低维嵌入点zi与质心点μj之间的相似度的软指派分布qij是可以通过原始28维特征因子步骤1.2所提及的方式所获得的fθ(·),以及步骤1.3所提及的方式所获得的来进行实时计算的。
因此,深度学习网络的目标就是尽可能使得软指派分布qij越来越接近真实指派分布pij,利用信息论中KL散度的概念来衡量二者之间的差异性,即可构造代价函数:
其中,L≥0,当且仅当P、Q分布形式完全一样时,L=0;P代表真实指派分布,Q代表软指派分布。
因此,采用梯度下降法进行训练的目标即为:
即神经网络训练的目标是最小化代价函数L,通过步骤3中的随机梯度策略来完成对L的优化,不断更新深度学习网络的参数θ=(W1,b1,W2,b2)。
步骤3,在训练时,采用基于动量的随机梯度策略更新深度学习网络参数,如下:
将两梯度值传递给堆叠式自编码器编码端网络,用于更新神经网络的参数θ=(W1,b1,W2,b2),直至达到预先设定的循环迭代总次数时,训练完毕。所设置的循环迭代总次数需要在实验时进行调整,并非唯一确定的值。
在训练过程中,随着堆叠式自编码器的编码端参数的改变,也同时对空域运行态势的三个复杂度等级的聚类质心进行更新,更新质心的方法采用步骤1.3中的方法,即对数据集z进行传统k-means均值聚类。
步骤4,通过步骤2~3得到训练好的深度网络模型以及三个空域复杂度的聚类质心,利用训练好的模型来实时对采集的数据进行空域复杂度判定。这个判定空域复杂度的过程就是进行聚类指派。
训练好的深度网络模型是一个具有挖掘原始数据非线性特性,且可依据低维嵌入表示进行优质聚类的空域复杂度评估模型。设当前采集的空域数据,经处理后,表示为一个空域扇区特征的28维特征因子xi=(xi1,xi2,xi3,…,xi28),将其输入所获得的空域复杂度评估模型,输出具备良好聚类特性的低维嵌入点zi=(zi1,zi2,zi3,…,zir),r为低维嵌入空间的维数,r<28;将低维嵌入点zi=(zi1,zi2,zi3,…,zir)以及聚类质心μj带入公式(6),计算软指派分布qij,j=1,2,3。对于数据zi,选择qij最大的聚类j,assignment(i,j)=argmaxqij,即将该数据划入第j个簇中,表示数据xi属于第j个簇所对应的空域复杂度。重复这个过程,直至所有数据点都划分完毕,即完成了空域复杂度评估计算任务。
Claims (2)
1.一种基于深度无监督学习的空域复杂度评估方法,其特征在于,该方法用于处理从空域运行态势数据中提取的空域复杂度指标因子,包括如下步骤:
步骤1,建立基于深度学习网络的空域复杂度评估模型,并获取初始聚类质心;
步骤1.1:所述的深度学习网络采用堆叠式自编码器模型,包括镜像对称结构的解码端与编码端;堆叠式自编码器的编码端将输入的空域复杂度指标样本进行低维嵌入表示,实现非线性降维,其中非线性映射函数利用训练样本集来对堆叠式自编码器模型训练得到;设输入的训练样本集为x,是采集的历史空域复杂度指标集合,N代表训练样本数量,每个样本xi包含28种空域复杂度指标因子,样本xi的低维嵌入表示为zi=fθ(xi),训练样本集对应的低维嵌入点集合为z,fθ是非线性映射函数,θ为堆叠式自编码器模型的网络参数;将集合z输入堆叠式自编码器模型的解码端,堆叠式自编码器的解码端输出的恢复数据集为y;
所述堆叠式自编码器,在编码端的计算方法如下:
将训练样本集x先经过Dropout(·)处理后输出集合Dropout(x)是随机将x中的一部分样本的一些特征因子设置为0;W1是基于深度学习网络的编码端权重,b1是基于深度学习网络的编码端偏置;g1是基于深度学习网络的编码端激活函数,采用ReLu函数;
将训练样本集z先经过Dropout(·)处理后输出集合Dropout(z)是随机将z中的一部分样本的一些特征因子设置为0;y表示堆叠式自编码器解码端恢复的数据集,W2是基于深度学习网络的解码端权重,b2是基于深度学习网络的解码端偏置;g2是基于深度学习网络的解码端激活函数,采用ReLu函数;
步骤1.2:对网络参数θ进行初始化,包括:以‖y-x‖2为目标函数,利用x对堆叠式自编码器模型进行梯度下降训练,得到参数θ;当训练完毕后,丢弃堆叠式自编码器的解码端,只保留编码端;
步骤1.3:将空域运行态势的复杂度等级对应为三个聚类,利用步骤1.2中训练所获得的堆叠式自编码器的编码端,对训练样本进行低维嵌入表示,对低维嵌入表示的训练样本集利用k-means均值聚类获得初始聚类质心;
步骤2,构建训练空域复杂度评估模型时的代价函数;
设低维嵌入点存在一个实际的用于聚类任务的真实指派分布;利用t分布来描述低维嵌入点与聚类质心之间的相似度,称为软指派分布;空域复杂度评估模型训练时的目标是使软指派分布越来越接近真实指派分布,利用信息论中的相对熵—KL散度来衡量软指派分布与真实指派分布之间的差异,构造代价函数L;步骤3,利用训练样本集x采用梯度下降法,以最小化步骤2的代价函数为目标,训练空域复杂度评估模型;空域运行态势的三个复杂度等级的聚类质心也随训练过程进行更新;
经过步骤3得到训练好的空域复杂度评估模型以及三个空域复杂度的聚类质心;
采用梯度下降法进行训练的目标表示如下:
其中,α是常数;qij是zi与质心μj的软指派分布,pij是zi与质心μj的真实指派分布;
步骤4,利用训练好的空域复杂度评估模型实时进行空域复杂度评估;
管制员从当前空域运行态势数据中提取空域复杂度指标因子,输入训练好的空域复杂度评估模型,得到低维嵌入点,计算该低维嵌入点与三个空域复杂度的聚类质心的软指派分布,选取其中软指派分布值最大的空域复杂度,作为当前输入的空域复杂度指标因子所对应的空域复杂度。
2.根据权利要求1所述的方法,其特征在于,所述的步骤2包括:
步骤2.1,计算每个低维嵌入点zi与各聚类簇质心的软指派分布;
利用t分布来描述集合z中低维嵌入点zi与质心点μj之间的相似度,表示为软指派分布qij,如下:
其中,qij∈[0,1],也表示将zi指派给第j簇的概率,j=1,2,3;α是常数;
步骤2.2,计算每个低维嵌入点zi的真实指派分布;
设zi存在一个实际的用于聚类任务的真实指派分布,pij表示低维嵌入点zi对于第j簇的真实指派分布,利用分区归一法计算如下:
其中,fj=∑iqij,fj代表了分类到第j个簇中的低维嵌入点的总的软指派分布概率之和;
步骤2.3,利用KL散度的概念来构建代价函数;
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911258728.3A CN111047182B (zh) | 2019-12-10 | 2019-12-10 | 一种基于深度无监督学习的空域复杂度评估方法 |
US17/102,984 US20210174262A1 (en) | 2019-12-10 | 2020-11-24 | Deep unsupervised learning approach , device and storage medium for airspace complexity evaluation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911258728.3A CN111047182B (zh) | 2019-12-10 | 2019-12-10 | 一种基于深度无监督学习的空域复杂度评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111047182A CN111047182A (zh) | 2020-04-21 |
CN111047182B true CN111047182B (zh) | 2021-12-28 |
Family
ID=70235400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911258728.3A Active CN111047182B (zh) | 2019-12-10 | 2019-12-10 | 一种基于深度无监督学习的空域复杂度评估方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20210174262A1 (zh) |
CN (1) | CN111047182B (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
HRP20210018B1 (hr) * | 2020-05-25 | 2022-06-24 | Sveučilište u Zagrebu FAKULTET PROMETNIH ZNANOSTI | Postupak rada sustava za kontrolu zračnog prometa |
US20210374549A1 (en) * | 2020-05-29 | 2021-12-02 | Robert Bosch Gmbh | Meta-learned, evolution strategy black box optimization classifiers |
CN112465199B (zh) * | 2020-11-18 | 2024-03-12 | 南京航空航天大学 | 空域态势评估系统 |
CN112489497B (zh) * | 2020-11-18 | 2022-03-11 | 南京航空航天大学 | 基于深度卷积神经网络的空域运行复杂度评估方法 |
CN113313191A (zh) * | 2021-06-13 | 2021-08-27 | 西北工业大学 | 一种基于无监督学习的分布式孔径交互智能评估方法 |
CN113505477B (zh) * | 2021-06-29 | 2022-05-20 | 西北师范大学 | 基于svae-wgan的过程工业软测量数据补充方法 |
CN113435655B (zh) * | 2021-07-05 | 2022-04-12 | 南京航空航天大学 | 扇区动态管理决策方法、服务器及系统 |
CN113705869B (zh) * | 2021-08-17 | 2022-11-04 | 东南大学 | 无监督元学习网络的机电设备少样本退化趋势预测方法 |
CN113869404A (zh) * | 2021-09-27 | 2021-12-31 | 北京工业大学 | 面向论文网络数据的自适应图卷积聚类方法 |
CN116091900A (zh) * | 2021-10-29 | 2023-05-09 | 华为技术有限公司 | 图像处理方法、装置及存储介质 |
CN114023111A (zh) * | 2021-11-03 | 2022-02-08 | 中国民航大学 | 一种面向航空器自主运行的空中交通态势复杂性评价方法 |
CN114239083A (zh) * | 2021-11-30 | 2022-03-25 | 西安电子科技大学 | 一种基于图神经网络的高效状态寄存器识别方法 |
CN113886438B (zh) * | 2021-12-08 | 2022-03-15 | 济宁景泽信息科技有限公司 | 一种基于人工智能的成果转移转化数据筛选方法 |
CN114346761B (zh) * | 2022-01-06 | 2023-04-28 | 中国科学技术大学 | 一种基于改进条件生成对抗网络的刀具磨损状况检测方法 |
CN115222159B (zh) * | 2022-09-14 | 2023-01-31 | 中国电子科技集团公司第二十八研究所 | 一种基于空域关联度的热区识别方法 |
CN115203986B (zh) * | 2022-09-15 | 2023-01-17 | 中国人民解放军空军预警学院 | 不规则责任区空基探测平台空域配置方法 |
CN117010179B (zh) * | 2023-07-21 | 2024-01-23 | 南京航空航天大学 | 基于深度学习的无监督深度适应参数修正方法 |
CN117436500B (zh) * | 2023-12-19 | 2024-03-26 | 杭州宇谷科技股份有限公司 | 一种基于对比学习的电池数据处理模型的无监督训练方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2718796A1 (en) * | 2010-10-29 | 2011-01-11 | Ibm Canada Limited - Ibm Canada Limitee | Web browser-based business process management engine |
US8903748B2 (en) * | 2011-06-27 | 2014-12-02 | International Business Machines Corporation | Systems and methods for large-scale randomized optimization for problems with decomposable loss functions |
CN102855778B (zh) * | 2012-09-10 | 2014-12-10 | 南京航空航天大学 | 一种基于复杂度评估的空域扇区分类方法 |
CN103530704B (zh) * | 2013-10-16 | 2016-06-29 | 南京航空航天大学 | 一种终端空域空中交通动态容量预测系统及其方法 |
US10303811B2 (en) * | 2015-07-31 | 2019-05-28 | Autodesk, Inc. | Deep-learning based functional correlation of volumetric designs |
CN107025369B (zh) * | 2016-08-03 | 2020-03-10 | 北京推想科技有限公司 | 一种对医疗图像进行转换学习的方法和装置 |
US11205103B2 (en) * | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
CN109495920B (zh) * | 2017-09-13 | 2022-03-29 | 中国移动通信集团设计院有限公司 | 一种无线通信网络特征画像方法、设备和计算机程序产品 |
US10999247B2 (en) * | 2017-10-24 | 2021-05-04 | Nec Corporation | Density estimation network for unsupervised anomaly detection |
US10620631B1 (en) * | 2017-12-29 | 2020-04-14 | Apex Artificial Intelligence Industries, Inc. | Self-correcting controller systems and methods of limiting the operation of neural networks to be within one or more conditions |
EP3657472A1 (en) * | 2018-11-26 | 2020-05-27 | Honeywell International Inc. | Systems and methods for creating and using a contextual model applicable to predicting aircraft warning conditions and analyzing aircraft performance |
US10992764B1 (en) * | 2018-12-11 | 2021-04-27 | Amazon Technologies, Inc. | Automatic user profiling using video streaming history |
CN109740039A (zh) * | 2019-01-11 | 2019-05-10 | 西南大学 | 基于栈式自编码器的动态网络社团结构识别方法 |
CN109886352B (zh) * | 2019-03-04 | 2020-08-18 | 北京航空航天大学 | 一种空域复杂度无监督评估方法 |
CN109993225B (zh) * | 2019-03-29 | 2021-03-23 | 北京航空航天大学 | 一种基于无监督学习的空域复杂度分类方法及装置 |
FR3099282B1 (fr) * | 2019-07-25 | 2021-07-02 | Thales Sa | Analyse de trajectoires d'aeronefs |
US11675324B2 (en) * | 2019-09-19 | 2023-06-13 | Bao Tran | Air transportation systems and methods |
EP3910567A1 (en) * | 2020-05-13 | 2021-11-17 | The Boeing Company | Airport capacity prediction system |
EP4304095A1 (en) * | 2022-07-05 | 2024-01-10 | The Boeing Company | Compression and distribution of meteorological data using machine learning |
-
2019
- 2019-12-10 CN CN201911258728.3A patent/CN111047182B/zh active Active
-
2020
- 2020-11-24 US US17/102,984 patent/US20210174262A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN111047182A (zh) | 2020-04-21 |
US20210174262A1 (en) | 2021-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111047182B (zh) | 一种基于深度无监督学习的空域复杂度评估方法 | |
CN111814871B (zh) | 一种基于可靠权重最优传输的图像分类方法 | |
US10929649B2 (en) | Multi-pose face feature point detection method based on cascade regression | |
CN106599797B (zh) | 一种基于局部并行神经网络的红外人脸识别方法 | |
CN109142171B (zh) | 基于特征扩张的融合神经网络的城市pm10浓度预测方法 | |
CN107194336B (zh) | 基于半监督深度距离度量网络的极化sar图像分类方法 | |
Do et al. | A neuro-fuzzy approach in the classification of students' academic performance | |
CN110110802A (zh) | 基于高阶条件随机场的机载激光点云分类方法 | |
CN102930539B (zh) | 基于动态图匹配的目标跟踪方法 | |
CN112464004A (zh) | 一种多视角深度生成图像聚类方法 | |
CN105069478A (zh) | 基于超像素张量稀疏编码的高光谱遥感地物分类方法 | |
CN110287985B (zh) | 一种基于带变异粒子群算法的可变拓扑结构的深度神经网络图像识别方法 | |
CN110880369A (zh) | 基于径向基函数神经网络的气体标志物检测方法及应用 | |
CN104850867A (zh) | 一种基于直觉模糊c均值聚类的目标识别方法 | |
CN105976397A (zh) | 基于半非负优化集成学习的目标跟踪方法 | |
Zou et al. | Survey on clustering-based image segmentation techniques | |
CN111539444A (zh) | 一种修正式模式识别及统计建模的高斯混合模型方法 | |
Xu et al. | A novel Minkowski-distance-based consensus clustering algorithm | |
CN105160358A (zh) | 一种图像分类方法及系统 | |
CN114037931A (zh) | 一种自适应权重的多视图判别方法 | |
CN114997306A (zh) | 一种基于动态贝叶斯网络的目标意图识别方法 | |
CN115310491A (zh) | 一种基于深度学习的类不平衡磁共振全脑数据分类方法 | |
CN114692746A (zh) | 一种基于信息熵的模糊半监督支持向量机的分类方法 | |
Lee et al. | Online dependence clustering of multivariate streaming data using one‐class SVMs | |
CN112434983A (zh) | 一种基于聚类超矩形模型的产品质量快速判定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |