CN111626365B - 基于运行特征的区域扇区场景相似识别系统 - Google Patents

基于运行特征的区域扇区场景相似识别系统 Download PDF

Info

Publication number
CN111626365B
CN111626365B CN202010468535.7A CN202010468535A CN111626365B CN 111626365 B CN111626365 B CN 111626365B CN 202010468535 A CN202010468535 A CN 202010468535A CN 111626365 B CN111626365 B CN 111626365B
Authority
CN
China
Prior art keywords
principal component
sector
time
characteristic
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010468535.7A
Other languages
English (en)
Other versions
CN111626365A (zh
Inventor
袁立罡
毛继志
张旋
胡明华
李�杰
张颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202010468535.7A priority Critical patent/CN111626365B/zh
Publication of CN111626365A publication Critical patent/CN111626365A/zh
Application granted granted Critical
Publication of CN111626365B publication Critical patent/CN111626365B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Strategic Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明具体涉及一种基于运行特征的区域扇区场景相似识别系统,其包括:通过相关性获取模块根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性;通过主成分特征获取模块根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征;通过相似性度量模块根据欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量;通过识别模块根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别;以及通过验证模块根据平均轮廓系数和MDS方法对识别结果验证,实现了对区域扇区场景当前运行情况进行更全面的可视化描述,以及区域扇区场景相似性的精确识别。

Description

基于运行特征的区域扇区场景相似识别系统
技术领域
本发明属于区域扇区运行动态管理分析技术领域,具体涉及一种基于运行特征的区域扇区场景相似识别系统。
背景技术
近年来,由于航班量的增加导致的区域扇区动态管理问题日益突出。区域管制空域连接各进近管制空域,并承担着来自不同进近管制空域的航空器的航行任务,是管制空域的主要空间部分,是影响航班运行安全与效率的关键空域。对区域管制空域进行运行相似场景识别,可以有效总结历史运行情况,进一步对不同历史运行场景下的采用的历史策略进行分析,参考对历史运行策略的分析,利用对未来运行预测的结果,做出管制预案,有利于降低战术阶段策略制定的压力,进而提高管制运行的效率,提升空域利用率。
考虑到水平垂直两个维度的运行,对区域扇区制定指标体系,有利于对区域扇区运行情况进行描述,而通过对空域扇区的运行模式和运行变化趋势相似场景研究,有利于从具体扇区层面指导管制预案的制定,有利于提高管制效率,进而提升航班运行效率。
另一方面,由于机器学习在各领域取得的卓越成就,不少学者将机器学习运用到民航领域。通过将特征加入到机器学习模型中进行训练,可以分析当前运行特征以及信息冗余情况,进而降低信息冗余和特征维度。同时由于决策者无法直接获取与航班运行相关的特征,因此决策时无法做到面面俱到,存在一定的不足,而基于机器学习方法的相似场景识别方法,有利于对当前运行情况进行更全面的可视化描述。
因此,基于上述技术问题需要设计一种新的基于运行特征的区域扇区场景相似识别系统。
发明内容
本发明的目的是提供一种基于运行特征的区域扇区场景相似识别系统。
为了解决上述技术问题,本发明提供了一种基于运行特征的区域扇区场景相似识别系统,包括:
相关性获取模块、主成分特征获取模块、相似性度量模块、识别模块和验证模块;
所述相关性获取模块适于根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性;
所述主成分特征获取模块适于根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征;
所述相似性度量模块适于通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量;
所述识别模块适于根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别;以及
所述验证模块适于通过平均轮廓系数和MDS方法对识别结果验证。
进一步,所述相关性获取模块适于根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性,即
所述区域扇区运行特征体系包括:水平维度的运行指标和垂直维度的运行指标;
所述水平维度的运行指标包括:扇区流量、入扇航向方差、航行距离、航行时间和平均航行速度;
所述垂直维度的运行指标包括:爬升时间、下降时间、平飞时间、爬升次数、下降次数、平飞次数、混合态势爬升时间、混合态势下降时间、混合态势平飞时间、混合态势爬升次数、混合态势下降次数、混合态势平飞次数和运行混合系数;
根据区域扇区运行特征体系反应区域扇区运行情况,以获取区域扇区运行情况实测数据的相关性;
所述相关性包括:区域扇区运行的连续性和聚集性。
进一步,所述主成分特征获取模块适于根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征,即
根据区域扇区运行的连续性和聚集性,将计算出的特征值输入到PCA模型中,通过正交变换,将原随机向量转化为不相关的新随机向量,降低运行特征的信息冗余和维度,以获取主成分特征。
进一步,所述相似性度量模块适于通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量,即
通过信息权重对主成分特征进行加权处理:
fweight=ω·forigin
其中,fweight为加权后的主成分特征值;forigin为原始主成分特征值,ω为forigin特征所能解释的信息占比;
设定时序时间长度为len,将加权后的主成分特征的数据根据时间间隔处理成离散的数据和时序数据;
通过欧式距离和DTW,对离散数据和时序数据的距离进行度量:
Figure BDA0002513467110000031
其中,E(x,y)为样本x、y的欧式距离;m为主成分特征数量;xi为样本x中第i个主成分特征的特征值;yi为样本y中第i个主成分特征的特征值;
对于两个时间序列X={x1,x2,…,xm}和Y={y1,y2,…,yn},DTW距离公式为:
Figure BDA0002513467110000041
其中,DTW(i,j)为时间序列X中第i个样本与时间序列Y中第j个样本的DTW距离;
分别得到离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT
进一步,所述识别模块适于根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别,即
计算离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT中的各行之和,即根据
Figure BDA0002513467110000042
获取度矩阵D,其中wij=e-(DTW(i,j)orE(i,j)),即对样本i,j的DTW或欧式距离做相似度处理,
Figure BDA0002513467110000043
以得到两个度矩阵DD和DT
通过相似性度量矩阵和度矩阵,构建拉普拉斯矩阵LD=DD-WD和LT=DT-WT,其中LD,LT分别为离散数据和时序数据的拉普拉斯矩阵,并对拉普拉斯矩阵进行标准化,以获取
Figure BDA0002513467110000044
Figure BDA0002513467110000045
其中std.LD,std.LT分别为离散数据和时序数据的标准化拉普拉斯矩阵;
分别计算std.LD和std.LT最小的前kD、kT个特征值的特征向量,并组成8832×kD和1104×kT维的矩阵,然后按行标准化得到矩阵FD和FT
矩阵FD为含有kD维特征的样本,矩阵FT为含有kT维特征的样本,根据k-means++方法,分别进行聚类,以获取聚类标签;
根据聚类标签分别将离散数据样本和时序样本进行划分,以对相似运行模式和相似运行趋势进行识别。
进一步,所述验证模块适于通过平均轮廓系数和MDS方法对识别结果验证,即
根据轮廓系数获取平均轮廓系数:
Figure BDA0002513467110000051
其中,ai为点i与所在簇中其他所有点距离的平均值;bi为点i与其他不同簇中其他所有点距离的平均值的最小值;则平均轮廓系数即求取所有轮廓系数si的平均值;
根据平均轮廓系数获取最优聚类结果,并通过MDS方法对最优聚类结果下的场景识别效果进行验证,获取场景识别的合理性以及与当前运行的对比结果;
根据场景识别的合理性以及对比情况,选择是否接受当前的场景识别结果,如果不接受,则重新选择时间间隔,通过欧式距离和DTW方法对主成分特征组成的离散和时序数据重新进行相似性度量,再次进行相似场景识别,直到最终识别效果被接受。
本发明的有益效果是,本发明通过相关性获取模块,根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性;主成分特征获取模块,根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征;相似性度量模块,通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量;识别模块,根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别;以及验证模块,通过平均轮廓系数和MDS方法对识别结果验证,实现了对区域扇区场景当前运行情况进行更全面的可视化描述,以及区域扇区场景相似性的精确识别。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明所涉及的基于运行特征的区域扇区场景相似识别系统的原理框图;
图2是本发明所涉及的扇区航班水平垂直运行示例图;
图3是本发明所涉及的特征相关性分析热力图;
图4是本发明所涉及的利用加速度因子原则选择PCA主成分数量图;
图5是本发明所涉及的利用平均轮廓系数评价聚类效果图;
图6是本发明所涉及的相似运行模式场景不同高度层运行特征图;
图7是本发明所涉及的利用MDS方法对场景识别效果和实际运行的对比图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
图1是本发明所涉及的基于运行特征的区域扇区场景相似识别系统的原理框图。
如图1所示,本实施例1提供了一种基于一般运行特征的区域扇区场景相似识别方法,包括:相关性获取模块、主成分特征获取模块、相似性度量模块、识别模块和验证模块;所述相关性获取模块适于根据区域扇区运行特点(区域扇区运行特点包括不同高度层运行差别较大,高高度层运行平稳,紧邻终端区运行繁忙,速度差异较大等),建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性;所述主成分特征获取模块适于根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征;所述相似性度量模块适于通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量;所述识别模块适于根据相似性度量结果利用谱聚类方法对相似运行模式和相似运行趋势进行识别(将离散和时序的相似性度量距离数据按照高斯核函数进行处理,求出其拉普拉斯矩阵,并对拉普拉斯矩阵进行标准化,然后计算两个标准化后的拉普拉斯矩阵前k个特征值的特征向量,按行标准化后,采用一种传统聚类方法,得到相似场景识别标签);以及所述验证模块适于利用平均轮廓系数和MDS方法对识别结果验证,实现了对区域扇区场景当前运行情况进行更全面的可视化描述,以及区域扇区场景相似性的精确识别。
图2是本发明所涉及的扇区航班水平垂直运行示例图;
图3是本发明所涉及的特征相关性分析热力图。
在本实施例中,所述相关性获取模块适于根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性,即
由于区域管制空域有着明显的高度特征,如图2所示,在相同水平运行特征下,具有不同的垂直运行特征,因此从水平和垂直两个维度,建立区域扇区运行特征体系;
表一:区域扇区运行指标
Figure BDA0002513467110000081
所述区域扇区运行特征体系包括:水平维度的运行指标和垂直维度(垂直剖面)的运行指标;如表一所示,所述水平维度的运行指标包括:扇区流量、入扇航向方差、航行距离、航行时间和平均航行速度;所述垂直维度的运行指标包括:爬升时间、下降时间、平飞时间、爬升次数、下降次数、平飞次数、混合态势爬升时间、混合态势下降时间、混合态势平飞时间、混合态势爬升次数、混合态势下降次数、混合态势平飞次数和运行混合系数;运行状态为统计时段内,航班所表现出的爬升、平飞、下降状态;混合态势为统计时段内,同一航班同时出现两种及两种以上运行状态;爬升状态为航空器爬升率大于阈值,且持续时间大于30s的状态;下降状态为航空器下降率大于阈值,且持续时间大于30s的状态;
各运行指标的定义为:
扇区流量为统计时段内,指定扇区的内容纳的航空器数量;
入扇航向方差为统计时段内,进入扇区的所有航班航向的方差:
Figure BDA0002513467110000091
其中,VarH为入扇航向方差;N为统计时段内的航班量;Hi为航班i的航向;
Figure BDA0002513467110000092
为统计时段内所有航班的平均航向;h为判断变量,当
Figure BDA0002513467110000093
时,h=360°,否则h=0°;
航行距离为统计时段内,所有航班在扇区内的飞行距离之和:
Figure BDA0002513467110000094
其中,S为航行距离;N为统计时段内的航班量;si为航班i的航行距离;
航行时间为统计时段内,所有航班在扇区内的飞行时长之和:
Figure BDA0002513467110000095
其中,T为航行距离,N为统计时段内的航班量,ti为航班i的航行时长;
平均航行速度为统计时段内,平均每个航班的飞行速度:
Figure BDA0002513467110000101
其中,
Figure BDA0002513467110000102
为平均航行速度,S为航行距离,T为航行时间;
爬升时间为统计时段内,在高度层上,航班爬升所花费的时长:
Figure BDA0002513467110000103
其中,tilc为统计时段内,航班i在高度层l上下150m范围内的爬升时间;
下降时间为统计时段内,在高度层上,航班下降所花费的时长:
Figure BDA0002513467110000104
其中,tild为统计时段内,航班i在高度层l上下150m范围内的下降时间;
平飞时间为统计时段内,在高度层上,航班平飞所花费的时长:
Figure BDA0002513467110000105
其中,tilf为统计时段内,航班i在高度层l上下150m范围内的平飞时间;
爬升次数为统计时段内,在高度层上,航班进入爬升状态的次数:
Figure BDA0002513467110000106
其中,nilc为统计时段内,航班i在高度层l上下150m范围内的爬升次数;
下降次数为统计时段内,在高度层上,航班进入下降状态的次数:
Figure BDA0002513467110000107
其中,nild为统计时段内,航班i在高度层l上下150m范围内的下降次数;
平飞时间为统计时段内,在高度层上,航班进入平飞状态的次数:
Figure BDA0002513467110000111
其中,nilf为统计时段内,航班i在高度层l上下150m范围内的平飞次数;
混合系数为统计时段内,航空器运行状态的混合程度:
Figure BDA0002513467110000112
其中,Nlc,Nld,Nll为统计时段内,高度层l的的爬升、下降、平飞次数;
从水平和垂直两个维度,建立区域扇区运行特征体系有利于对区域扇区运行情况进行描述,而通过对空域扇区的运行模式和运行变化趋势相似场景研究,有利于从具体扇区层面指导管制预案的制定,有利于提高管制效率,进而提升航班运行效率;根据区域扇区运行特征体系反应区域扇区运行情况,以获取区域扇区运行情况实测数据的相关性;所述相关性包括:区域扇区运行的连续性和聚集性;所选取的特征(运行指标)能很好地反应区域扇区运行情况,观察实测数据的相关性,如图3所示的相关性热力图来看,区域扇区水平运行特征(水平维度的运行指标)和中低高度层运行特征相关性较高,可见此区域扇区的运行具有中低高度聚集性,同时能看到图3中在对角线两旁各高度层相同特征的相关性较高,表明了区域扇区运行的连续爬升、下降比例较大的特点。
图4是本发明所涉及的利用加速度因子原则选择PCA主成分数量图。
在本实施例中,所述主成分特征获取模块适于根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征,即
根据获取的区域扇区运行连续性、聚集性特点,需要采用数学方法来降低数据的信息冗余和维度;根据区域扇区运行的连续性和聚集性,将计算出的特征值(该特征值为利用运行特征体系所计算出来的特征值)输入到PCA模型中,利用正交变换,将原随机向量(原随机向量为原特征的矩阵在特征空间可以被看做随机向量)转化为不相关的新随机向量,降低运行特征的信息冗余和维度,以获取主成分特征。如图4所示,随着主成分数量的增长,主成分方差累积值愈趋近于1,即包含信息越多,且变化呈现出先快后慢的趋势,利用加速度因子原则,在方差累计值为0.85时,主成分包含信息量较多,且此时变化趋缓,根据方差累计值,可以确定出主成分数量,因此从382个主成分特征中选择出60个主成分特征,显著降低了数据的相关性和维度。
在本实施例中,所述相似性度量模块适于通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量,即
考虑到主成分特征包含信息量不同,通过信息权重对主成分特征进行加权处理:
fweight=ω·forigin
其中,fweight为加权后的主成分特征值;forigin为原始主成分特征值,ω为forigin特征所能解释的信息占比;
设定时序时间长度为len,将加权后的主成分特征的数据根据时间间隔处理成离散的数据和时序数据;
利用欧式距离和DTW,对离散数据和时序数据的距离进行度量:
Figure BDA0002513467110000121
其中,E(x,y)为样本x、y的欧式距离;m为主成分特征数量;xi为样本x中第i个主成分特征的特征值;yi为样本y中第i个主成分特征的特征值;
对于两个时间序列X={x1,x2,...,xm}和Y={y1,y2,…,yn},DTW距离公式为:
Figure BDA0002513467110000131
其中,DTW(i,j)为时间序列X中第i个样本与时间序列Y中第j个样本的DTW距离;分别得到离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT
在本实施例中,所述识别模块适于根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别,即
使用谱聚类方法,对区域扇区进行相似场景识别:由于已经利用欧式距离及DTW方法得到离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT,直接作为输入;
计算离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT中的各行之和,即根据
Figure BDA0002513467110000132
获取度矩阵D,其中wij=e-(DTW(i,j)orE(i,j)),即对样本i,j的DTW或欧式距离做相似度处理,
Figure BDA0002513467110000133
以得到两个度矩阵DD和DT;其中DD、DT分别为离散数据的度矩阵和时序数据的度矩阵;通过相似性度量矩阵和度矩阵,构建拉普拉斯矩阵LD=DD-WD和LT=DT-WT,其中LD,LT分别为离散数据和时序数据的拉普拉斯矩阵,并对拉普拉斯矩阵进行标准化,以获取
Figure BDA0002513467110000134
Figure BDA0002513467110000135
其中std.LD,std.LT分别为离散数据和时序数据的标准化拉普拉斯矩阵;分别计算std.LD和std.LT最小的前kD、kT个特征值的特征向量,并组成8832×kD和1104×kT维的矩阵,然后按行标准化得到矩阵FD和FT;矩阵FD为含有kD维特征的样本,矩阵FT为含有kT维特征的样本,根据k-means++方法,分别进行聚类,以获取聚类标签;根据聚类标签分别将离散数据样本和时序样本进行划分,以对相似运行模式和相似运行趋势进行识别。
图5是本发明所涉及的利用平均轮廓系数评价聚类效果图;
图6是本发明所涉及的相似运行模式场景不同高度层运行特征图;
图7是本发明所涉及的利用MDS方法对场景识别效果和实际运行的对比图。
在本实施例中,所述验证模块适于利用平均轮廓系数(Average SilhouetteCoefficient)和MDS(Multidimensional Scaling)方法对识别结果验证,即
根据轮廓系数获取平均轮廓系数;平均轮廓系数通过计算簇间相似性和不同簇间的不相似性来评估聚类效果,其中轮廓系数的计算公式如下:
Figure BDA0002513467110000141
其中,ai为点i与所在簇中其他所有点距离的平均值;bi为点i与其他不同簇中其他所有点距离的平均值的最小值;则平均轮廓系数即求取所有轮廓系数si的平均值;如图5、图6、图7所示,根据平均轮廓系数获取最优聚类结果,并通过MDS方法对最优聚类结果下的场景识别效果进行验证,获取场景识别的合理性以及与当前运行的对比结果;根据场景识别的合理性以及对比情况,选择是否接受当前的场景识别结果,如果不接受,则重新选择时间间隔,通过欧式距离和DTW方法对主成分特征组成的离散和时序数据重新进行相似性度量,再次进行相似场景识别,直到最终识别效果被接受。
综上所述,本发明通过相关性获取模块,根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性;主成分特征获取模块,根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征;相似性度量模块,通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量;识别模块,根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别;以及验证模块,通过平均轮廓系数和MDS方法对识别结果验证,实现了对区域扇区场景当前运行情况进行更全面的可视化描述,以及区域扇区场景相似性的精确识别。
在本申请所提供的实施例中,附图中的框图显示了根据本发明的多个实施例的方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

Claims (2)

1.一种基于运行特征的区域扇区场景相似识别系统,其特征在于,包括:
相关性获取模块、主成分特征获取模块、相似性度量模块、识别模块和验证模块;
所述相关性获取模块适于根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性;
所述主成分特征获取模块适于根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征;
所述相似性度量模块适于通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量;
所述识别模块适于根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别;以及
所述验证模块适于通过平均轮廓系数和MDS方法对识别结果验证;
所述相关性获取模块适于根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性,即
所述区域扇区运行特征体系包括:水平维度的运行指标和垂直维度的运行指标;
所述水平维度的运行指标包括:扇区流量、入扇航向方差、航行距离、航行时间和平均航行速度;
所述垂直维度的运行指标包括:爬升时间、下降时间、平飞时间、爬升次数、下降次数、平飞次数、混合态势爬升时间、混合态势下降时间、混合态势平飞时间、混合态势爬升次数、混合态势下降次数、混合态势平飞次数和运行混合系数;
根据区域扇区运行特征体系反应区域扇区运行情况,以获取区域扇区运行情况实测数据的相关性;
所述相关性包括:区域扇区运行的连续性和聚集性;
所述主成分特征获取模块适于根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征,即
根据区域扇区运行的连续性和聚集性,将计算出的特征值输入到PCA模型中,通过正交变换,将原随机向量转化为不相关的新随机向量,降低运行特征的信息冗余和维度,以获取主成分特征;
所述相似性度量模块适于通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量,即
通过信息权重对主成分特征进行加权处理:
fweight=ω·forigin
其中,fweight为加权后的主成分特征值;forigin为原始主成分特征值,ω为forigin特征所能解释的信息占比;
设定时序时间长度为len,将加权后的主成分特征的数据根据时间间隔处理成离散的数据和时序数据;
通过欧式距离和DTW,对离散数据和时序数据的距离进行度量:
Figure FDA0004054743910000021
其中,E(x,y)为样本x、y的欧式距离;m为主成分特征数量;xi为样本x中第i个主成分特征的特征值;yi为样本y中第i个主成分特征的特征值;
对于两个时间序列X={x1,x2,…,xm}和Y={y1,y2,…,yn},DTW距离公式为:
Figure FDA0004054743910000031
其中,DTW(i,j)为时间序列X中第i个样本与时间序列Y中第j个样本的DTW距离;
分别得到离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT
所述识别模块适于根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别,即
计算离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT中的各行之和,即根据
Figure FDA0004054743910000032
获取度矩阵D,其中wij=e-(DTW(i,j)orE(i,j)),即对样本i,j的DTW或欧式距离做相似度处理,
Figure FDA0004054743910000033
以得到两个度矩阵DD和DT
通过相似性度量矩阵和度矩阵,构建拉普拉斯矩阵LD=DD-WD和LT=DT-WT,其中LD,LT分别为离散数据和时序数据的拉普拉斯矩阵,并对拉普拉斯矩阵进行标准化,以获取
Figure FDA0004054743910000034
Figure FDA0004054743910000035
其中std.LD,std.LT分别为离散数据和时序数据的标准化拉普拉斯矩阵;
分别计算std.LD和std.LT最小的前kD、kT个特征值的特征向量,并组成8832×kD和1104×kT维的矩阵,然后按行标准化得到矩阵FD和FT
矩阵FD为含有kD维特征的样本,矩阵FT为含有kT维特征的样本,根据k-means++方法,分别进行聚类,以获取聚类标签;
根据聚类标签分别将离散数据样本和时序样本进行划分,以对相似运行模式和相似运行趋势进行识别。
2.如权利要求1所述的区域扇区场景相似识别系统,其特征在于,
所述验证模块适于通过平均轮廓系数和MDS方法对识别结果验证,即
根据轮廓系数获取平均轮廓系数:
Figure FDA0004054743910000041
其中,ai为点i与所在簇中其他所有点距离的平均值;bi为点i与其他不同簇中其他所有点距离的平均值的最小值;则平均轮廓系数即求取所有轮廓系数si的平均值;
根据平均轮廓系数获取最优聚类结果,并通过MDS方法对最优聚类结果下的场景识别效果进行验证,获取场景识别的合理性以及与当前运行的对比结果;
根据场景识别的合理性以及对比情况,选择是否接受当前的场景识别结果,如果不接受,则重新选择时间间隔,通过欧式距离和DTW方法对主成分特征组成的离散和时序数据重新进行相似性度量,再次进行相似场景识别,直到最终识别效果被接受。
CN202010468535.7A 2020-05-28 2020-05-28 基于运行特征的区域扇区场景相似识别系统 Active CN111626365B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010468535.7A CN111626365B (zh) 2020-05-28 2020-05-28 基于运行特征的区域扇区场景相似识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010468535.7A CN111626365B (zh) 2020-05-28 2020-05-28 基于运行特征的区域扇区场景相似识别系统

Publications (2)

Publication Number Publication Date
CN111626365A CN111626365A (zh) 2020-09-04
CN111626365B true CN111626365B (zh) 2023-04-07

Family

ID=72260077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010468535.7A Active CN111626365B (zh) 2020-05-28 2020-05-28 基于运行特征的区域扇区场景相似识别系统

Country Status (1)

Country Link
CN (1) CN111626365B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112785876B (zh) * 2021-01-28 2022-03-11 南京航空航天大学 终端区时序气象场景智能识别系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110866673A (zh) * 2019-10-11 2020-03-06 南京航空航天大学 区域管制扇区数量估算方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473469B (zh) * 2013-09-25 2016-06-22 南京航空航天大学 一种基于客观指标的扇区交通态势多层次模糊评价方法
CN105261240B (zh) * 2015-09-30 2018-01-30 中国民用航空总局第二研究所 一种基于聚类分析的扇区运行性能综合检测方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110866673A (zh) * 2019-10-11 2020-03-06 南京航空航天大学 区域管制扇区数量估算方法

Also Published As

Publication number Publication date
CN111626365A (zh) 2020-09-04

Similar Documents

Publication Publication Date Title
CN111626366B (zh) 基于运行特征的区域扇区场景相似识别方法
CN112381137B (zh) 新能源电力系统可靠性评估方法、装置、设备及存储介质
CN109508812A (zh) 一种基于深度记忆网络的航空器航迹预测方法
CN108805213B (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN110826618A (zh) 一种基于随机森林的个人信用风险评估方法
CN106203483A (zh) 一种基于语义相关多模态映射方法的零样本图像分类方法
CN113362604B (zh) 一种基于扇区动态交通特征的管制员工作负荷评估方法
CN111626365B (zh) 基于运行特征的区域扇区场景相似识别系统
US7206674B1 (en) Information display system for atypical flight phase
CN113989747A (zh) 终端区气象场景识别系统
CN114492540B (zh) 目标检测模型的训练方法、装置、计算机设备及存储介质
CN115204041A (zh) 一种大型航空器进场和进近阶段耗油量预测方法
CN117851863A (zh) 一种面向微服务异常检测的特征指标选取方法
Angelini et al. Identification of losses in turbomachinery with machine learning
CN109145738A (zh) 基于加权非凸正则化和迭代重约束低秩表示的动态视频分割方法
Shirinkam et al. Identifying the number of components in Gaussian mixture models using numerical algebraic geometry
Alliot et al. A statistical analysis of the influence of vertical and ground speed errors on conflict probe
CN109299684A (zh) 人脸或场景识别数据分类的竞争和协同表示方法及系统
CN112200320B (zh) 基于合作博弈法的模型解释方法、系统、设备及存储介质
CN114492830A (zh) 基于个体歧视实例对生成的深度学习模型去偏方法及其装置
CN113723533A (zh) 对流天气影响终端区的模式识别方法及高斯混合聚类模型
Zongqi Transmission line inspection image recognition technology based on YOLOv2 network
CN113222229B (zh) 一种基于机器学习的非合作无人机轨迹预测方法
CN112308097A (zh) 样本识别方法和装置
CN113554072B (zh) 一种飞行动作划分方法、计算机可读存储介质及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant