CN111626366B - 基于运行特征的区域扇区场景相似识别方法 - Google Patents

基于运行特征的区域扇区场景相似识别方法 Download PDF

Info

Publication number
CN111626366B
CN111626366B CN202010468551.6A CN202010468551A CN111626366B CN 111626366 B CN111626366 B CN 111626366B CN 202010468551 A CN202010468551 A CN 202010468551A CN 111626366 B CN111626366 B CN 111626366B
Authority
CN
China
Prior art keywords
sector
principal component
time
matrix
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010468551.6A
Other languages
English (en)
Other versions
CN111626366A (zh
Inventor
袁立罡
胡明华
谢华
张旋
陈海燕
王兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202010468551.6A priority Critical patent/CN111626366B/zh
Publication of CN111626366A publication Critical patent/CN111626366A/zh
Application granted granted Critical
Publication of CN111626366B publication Critical patent/CN111626366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Evolutionary Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于区域扇区运行动态管理分析技术领域,具体涉及一种基于运行特征的区域扇区场景相似识别方法,其包括:根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性;根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征;通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量;根据相似性度量结果利用谱聚类方法对相似运行模式和相似运行趋势进行识别;以及利用平均轮廓系数和MDS方法对识别结果验证,实现了对区域扇区场景当前运行情况进行更全面的可视化描述,以及区域扇区场景相似性的精确识别。

Description

基于运行特征的区域扇区场景相似识别方法
技术领域
本发明属于区域扇区运行动态管理分析技术领域,具体涉及一种基于运行特征的区域扇区场景相似识别方法。
背景技术
近年来,由于航班量的增加导致的区域扇区动态管理问题日益突出。区域管制空域连接各进近管制空域,并承担着来自不同进近管制空域的航空器的航行任务,是管制空域的主要空间部分,是影响航班运行安全与效率的关键空域。对区域管制空域进行运行相似场景识别,可以有效总结历史运行情况,进一步对不同历史运行场景下的采用的历史策略进行分析,参考对历史运行策略的分析,利用对未来运行预测的结果,做出管制预案,有利于降低战术阶段策略制定的压力,进而提高管制运行的效率,提升空域利用率。
运行相似场景识别,是通过提取空域内的运行特征,对特征所在的时间片或组成的时序进行相似性度量,进而识别出具有相似运行模式或运行变化趋势的场景。而目前国内外对于扇区运行动态管理的研究主要以优化方法为主,而对当前运行情况的管理分析则以统计分析为主,尚未形成有效的分析体系和方法。2012年,Tang J等人等利用多目标优化算法,给出了最大相似性、最小负荷偏差的空域划分结果;2013年,Chen Y等人利用改进的遗传算法,将动态扇区问题抽象为图分区问题,以扇区作业平衡为约束,给出了扇区规划结果。目前关于动态扇区管理的研究现状如下:
尚未形成有效的当前运行情况分析体系和方法;
尚未以运行场景作为研究对象,对当前运行情况进行分析。
因此对于区域扇区相似场景进行识别,可以弥补上述的空白区域,从而为管制员指定管制动态预案提供依据。当前相似场景识别以特征选择和相似性度量为主,2016年,Kuhn基于专家知识的方法选出了:机场到强降水预测中心距离、机场跑道侧风强度、预定到达航班数等特征,2012年,Asencio M基于欧式距离利用K-means方法对美国对流天气进行了聚类,选择出能反映美国对流天气影响模式的代表日。目前对相似场景的识别的研究现状如下:
一般以国家空域或机场为对象,尚未对扇区相似场景的进行识别;
运行特征选择以水平运行特征为主,垂直维度运行特征较少,对高低扇运行扇区运行指导价值较低;
相似性度量以离散相似性度量为主,尚未利用时序相似性度量结果进行相似场景识别。
因此,考虑到水平垂直两个维度的运行,对区域扇区制定指标体系,有利于对区域扇区运行情况进行描述,而通过对空域扇区的运行模式和运行变化趋势相似场景研究,有利于从具体扇区层面指导管制预案的制定,有利于提高管制效率,进而提升航班运行效率。
另一方面,由于机器学习在各领域取得的卓越成就,不少学者将机器学习运用到民航领域。通过将特征加入到机器学习模型中进行训练,可以分析当前运行特征以及信息冗余情况,进而降低信息冗余和特征维度。同时由于决策者无法直接获取与航班运行相关的特征,因此决策时无法做到面面俱到,存在一定的不足,而基于机器学习方法的相似场景识别方法,有利于对当前运行情况进行更全面的可视化描述。
因此,基于上述技术问题需要设计一种新的基于运行特征的区域扇区场景相似识别方法。
发明内容
本发明的目的是提供一种基于运行特征的区域扇区场景相似识别方法。
为了解决上述技术问题,本发明提供了一种基于运行特征的区域扇区场景相似识别方法,包括:
根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性;
根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征;
通过欧式距离和DTW方法分别对主成分特征组成的离散和时序数据进行相似性度量;
根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别;以及
通过平均轮廓系数和MDS方法对识别结果验证。
进一步,所述根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性的方法包括:
所述区域扇区运行特征体系包括:水平维度的运行指标和垂直维度的运行指标;
所述水平维度的运行指标包括:扇区流量、入扇航向方差、航行距离、航行时间和平均航行速度;
所述垂直维度的运行指标包括:爬升时间、下降时间、平飞时间、爬升次数、下降次数、平飞次数、混合态势爬升时间、混合态势下降时间、混合态势平飞时间、混合态势爬升次数、混合态势下降次数、混合态势平飞次数和运行混合系数;
根据区域扇区运行特征体系反应区域扇区运行情况,以获取区域扇区运行情况实测数据的相关性;
所述相关性包括:区域扇区运行的连续性和聚集性。
进一步,所述根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征的方法包括:
根据区域扇区运行的连续性和聚集性,将计算出的特征值输入到PCA模型中,通过正交变换,将原随机向量转化为不相关的新随机向量,降低运行特征的信息冗余和维度,以获取主成分特征。
进一步,所述通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量的方法包括:
通过信息权重对主成分特征进行加权处理:
Jweight=ω·forigin
其中,fweight为加权后的主成分特征值;forigin为原始主成分特征值,ω为forigin特征所能解释的信息占比;
设定时序时间长度为len,将加权后的主成分特征的数据根据时间间隔处理成离散的数据和时序数据;
通过欧式距离和DTW,对离散数据和时序数据的距离进行度量:
Figure BDA0002513471060000041
其中,E(x,y)为样本x、y的欧式距离;m为主成分特征数量;xi为样本x中第i个主成分特征的特征值;yi为样本y中第i个主成分特征的特征值;
对于两个时间序列X={x1,x2,…,xm}和Y={y1,y2,…,yn},DTW距离公式为:
Figure BDA0002513471060000051
其中,DTW(i,j)为时间序列X中第i个样本与时间序列Y中第j个样本的DTW距离;
分别得到离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT
进一步,所述根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别的方法包括:
计算离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT中的各行之和,即根据
Figure BDA0002513471060000052
获取度矩阵D,其中wij=e-(DTW(i,j)orE(i,j)),即对样本i,j的DTW或欧式距离做相似度处理,
Figure BDA0002513471060000053
以得到两个度矩阵DD和DT
通过相似性度量矩阵和度矩阵,构建拉普拉斯矩阵LD=DD-WD和LT=DT-WT,其中LD,LT分别代表了离散数据和时序数据的拉普拉斯矩阵,并对拉普拉斯矩阵进行标准化,以获取
Figure BDA0002513471060000054
Figure BDA0002513471060000055
其中std.LD,std.LT分别代表了离散数据和时序数据的标准化拉普拉斯矩阵;
分别计算std.LD和std.LT最小的前kD、kT个特征值的特征向量,并组成8832×kD和1104×kT维的矩阵,然后按行标准化得到矩阵FD和FT
矩阵FD为含有kD维特征的样本,矩阵FT为含有kT维特征的样本,根据k-means++方法,分别进行聚类,以获取聚类标签;
根据聚类标签分别将离散数据样本和时序样本进行划分,以对相似运行模式和相似运行趋势进行识别。
进一步,所述通过平均轮廓系数和MDS方法对识别结果验证的方法包括:
根据轮廓系数获取平均轮廓系数:
Figure BDA0002513471060000061
其中,ai为点i与所在簇中其他所有点距离的平均值;bi为点i与其他不同簇中其他所有点距离的平均值的最小值;则平均轮廓系数即求取所有轮廓系数si的平均值;
根据平均轮廓系数获取最优聚类结果,并通过MDS方法对最优聚类结果下的场景识别效果进行验证,获取场景识别的合理性以及与当前运行的对比结果;;
根据场景识别的合理性以及对比情况,选择是否接受当前的场景识别结果,如果不接受,则重新选择时间间隔,通过欧式距离和DTW方法对主成分特征组成的离散和时序数据重新进行相似性度量,再次进行相似场景识别,直到最终识别效果被接受。本发明的有益效果是,本发明通过根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性;根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征;通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量;根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别;以及通过平均轮廓系数和MDS方法对识别结果验证,实现了对区域扇区场景当前运行情况进行更全面的可视化描述,以及区域扇区场景相似性的精确识别。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明所涉及的基于运行特征的区域扇区场景相似识别方法的流程图;
图2是本发明所涉及的扇区航班水平垂直运行示例图;
图3是本发明所涉及的特征相关性分析热力图;
图4是本发明所涉及的利用加速度因子原则选择PCA主成分数量图;
图5是本发明所涉及的利用平均轮廓系数评价聚类效果图;
图6是本发明所涉及的相似运行模式场景不同高度层运行特征图;
图7是本发明所涉及的利用MDS方法对场景识别效果和实际运行的对比图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
图1是本发明所涉及的基于运行特征的区域扇区场景相似识别方法的流程图。
如图1所示,本实施例1提供了一种基于运行特征的区域扇区场景相似识别方法,包括:根据区域扇区运行特点(区域扇区运行特点包括不同高度层运行差别较大,高高度层运行平稳,紧邻终端区运行繁忙,速度差异较大等),建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性;根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征;通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量;根据相似性度量结果利用谱聚类方法对相似运行模式和相似运行趋势进行识别(将离散和时序的相似性度量距离数据按照高斯核函数进行处理,求出其拉普拉斯矩阵,并对拉普拉斯矩阵进行标准化,然后计算两个标准化后的拉普拉斯矩阵前k个特征值的特征向量,按行标准化后,采用一种传统聚类方法,得到相似场景识别标签);以及利用平均轮廓系数和MDS方法对识别结果验证,实现了对区域扇区场景当前运行情况进行更全面的可视化描述,以及区域扇区场景相似性的精确识别。
图2是本发明所涉及的扇区航班水平垂直运行示例图;
图3是本发明所涉及的特征相关性分析热力图。
在本实施例中,所述根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性的方法包括:由于区域管制空域有着明显的高度特征,如图2所示,在相同水平运行特征下,具有不同的垂直运行特征,因此从水平和垂直两个维度,建立区域扇区运行特征体系;
表一:区域扇区运行指标
Figure BDA0002513471060000091
所述区域扇区运行特征体系包括:水平维度的运行指标和垂直维度(垂直剖面)的运行指标;如表一所示,所述水平维度的运行指标包括:扇区流量、入扇航向方差、航行距离、航行时间和平均航行速度;所述垂直维度的运行指标包括:爬升时间、下降时间、平飞时间、爬升次数、下降次数、平飞次数、混合态势爬升时间、混合态势下降时间、混合态势平飞时间、混合态势爬升次数、混合态势下降次数、混合态势平飞次数和运行混合系数;运行状态为统计时段内,航班所表现出的爬升、平飞、下降状态;混合态势为统计时段内,同一航班同时出现两种及两种以上运行状态;爬升状态为航空器爬升率大于阈值,且持续时间大于30s的状态;下降状态为航空器下降率大于阈值,且持续时间大于30s的状态;
各运行指标的定义为:
扇区流量为统计时段内,指定扇区的内容纳的航空器数量;
入扇航向方差为统计时段内,进入扇区的所有航班航向的方差:
Figure BDA0002513471060000101
其中,VarH为入扇航向方差;N为统计时段内的航班量;Hi为航班i的航向;
Figure BDA0002513471060000102
为统计时段内所有航班的平均航向;h为判断变量,当
Figure BDA0002513471060000103
时,h=360°,否则h=0°;
航行距离为统计时段内,所有航班在扇区内的飞行距离之和:
Figure BDA0002513471060000104
其中,S为航行距离;N为统计时段内的航班量;si为航班i的航行距离;
航行时间为统计时段内,所有航班在扇区内的飞行时长之和:
Figure BDA0002513471060000105
其中,T为航行距离,N为统计时段内的航班量,ti为航班i的航行时长;
平均航行速度为统计时段内,平均每个航班的飞行速度:
Figure BDA0002513471060000106
其中,
Figure BDA0002513471060000107
为平均航行速度,S为航行距离,T为航行时间;
爬升时间为统计时段内,在高度层上,航班爬升所花费的时长:
Figure BDA0002513471060000108
其中,tilc为统计时段内,航班i在高度层l上下150m范围内的爬升时间;
下降时间为统计时段内,在高度层上,航班下降所花费的时长:
Figure BDA0002513471060000111
其中,tild为统计时段内,航班i在高度层l上下150m范围内的下降时间;
平飞时间为统计时段内,在高度层上,航班平飞所花费的时长:
Figure BDA0002513471060000112
其中,tilf为统计时段内,航班i在高度层l上下150m范围内的平飞时间;
爬升次数为统计时段内,在高度层上,航班进入爬升状态的次数:
Figure BDA0002513471060000113
其中,nilc为统计时段内,航班i在高度层l上下150m范围内的爬升次数;
下降次数为统计时段内,在高度层上,航班进入下降状态的次数:
Figure BDA0002513471060000114
其中,nild为统计时段内,航班i在高度层l上下150m范围内的下降次数;
平飞时间为统计时段内,在高度层上,航班进入平飞状态的次数:
Figure BDA0002513471060000115
其中,nilf为统计时段内,航班i在高度层l上下150m范围内的平飞次数;
混合系数为统计时段内,航空器运行状态的混合程度:
Figure BDA0002513471060000116
其中,Nlc,Nld,Nll为统计时段内,高度层l的的爬升、下降、平飞次数;
从水平和垂直两个维度,建立区域扇区运行特征体系有利于对区域扇区运行情况进行描述,而通过对空域扇区的运行模式和运行变化趋势相似场景研究,有利于从具体扇区层面指导管制预案的制定,有利于提高管制效率,进而提升航班运行效率;根据区域扇区运行特征体系反应区域扇区运行情况,以获取区域扇区运行情况实测数据的相关性;所述相关性包括:区域扇区运行的连续性和聚集性;所选取的特征(运行指标)能很好地反应区域扇区运行情况,观察实测数据的相关性,如图3所示的相关性热力图来看,区域扇区水平运行特征(水平维度的运行指标)和中低高度层运行特征相关性较高,可见此区域扇区的运行具有中低高度聚集性,同时能看到图3中在对角线两旁各高度层相同特征的相关性较高,表明了区域扇区运行的连续爬升、下降比例较大的特点。
图4是本发明所涉及的利用加速度因子原则选择PCA主成分数量图。
在本实施例中,所述根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征的方法包括:根据获取的区域扇区运行连续性、聚集性特点,需要采用数学方法来降低数据的信息冗余和维度;根据区域扇区运行的连续性和聚集性,将计算出的特征值(该特征值为利用运行特征体系所计算出来的特征值)输入到PCA模型中,利用正交变换,将原随机向量(原随机向量为原特征的矩阵在特征空间可以被看做随机向量)转化为不相关的新随机向量,降低运行特征的信息冗余和维度,以获取主成分特征。如图4所示,随着主成分数量的增长,主成分方差累积值愈趋近于1,即包含信息越多,且变化呈现出先快后慢的趋势,利用加速度因子原则,在方差累计值为0.85时,主成分包含信息量较多,且此时变化趋缓,根据方差累计值,可以确定出主成分数量,因此从382个主成分特征中选择出60个主成分特征,显著降低了数据的相关性和维度。
在本实施例中,所述利用欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量的方法包括:考虑到主成分特征包含信息量不同,通过信息权重对主成分特征进行加权处理:
fweight=ω·forigin
其中,fweight为加权后的主成分特征值;forigin为原始主成分特征值,ω为forigin特征所能解释的信息占比;
设定时序时间长度为len,将加权后的主成分特征的数据根据时间间隔处理成离散的数据和时序数据;
利用欧式距离和DTW,对离散数据和时序数据的距离进行度量:
Figure BDA0002513471060000131
其中,E(x,y)为样本x、y的欧式距离;m为主成分特征数量;xi为样本x中第i个主成分特征的特征值;yi为样本y中第i个主成分特征的特征值;
对于两个时间序列X={x1,x2,…,xm}和Y={y1,y2,…,yn},DTW距离公式为:
Figure BDA0002513471060000132
其中,DTW(i,j)为时间序列X中第i个样本与时间序列Y中第j个样本的DTW距离;分别得到离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT
在本实施例中,所述根据相似性度量结果利用谱聚类方法对相似运行模式和相似运行趋势进行识别的方法包括:使用谱聚类方法,对区域扇区进行相似场景识别:由于已经利用欧式距离及DTW方法得到离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT,直接作为输入;计算离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT中的各行之和,即根据
Figure BDA0002513471060000133
获取度矩阵D,其中wij=e-(DTW(i,j)orE(i,j)),即对样本i,j的DTW或欧式距离做相似度处理,
Figure BDA0002513471060000141
以得到两个度矩阵DD和DT,其中DD、DT分别为离散数据的度矩阵和时序数据的度矩阵;通过相似性度量矩阵和度矩阵,构建拉普拉斯矩阵LD=DD-WD和LT=DT-WT,其中LD,LT分别为离散数据和时序数据的拉普拉斯矩阵,并对拉普拉斯矩阵进行标准化,以获取
Figure BDA0002513471060000142
Figure BDA0002513471060000143
其中std.LD,std.LT分别为离散数据和时序数据的标准化拉普拉斯矩阵;分别计算std.LD和std.LT最小的前kD、kT个特征值的特征向量,并组成8832×kD和1104×kT维的矩阵,然后按行标准化得到矩阵FD和FT;矩阵FD为含有kD维特征的样本,矩阵FT为含有kT维特征的样本,根据k-means++方法,分别进行聚类,以获取聚类标签;根据聚类标签分别将离散数据样本和时序样本进行划分,以对相似运行模式和相似运行趋势进行识别。
图5是本发明所涉及的利用平均轮廓系数评价聚类效果图;
图6是本发明所涉及的相似运行模式场景不同高度层运行特征图;
图7是本发明所涉及的利用MDS方法对场景识别效果和实际运行的对比图。
在本实施例中,所述利用平均轮廓系数(Average Silhouette Coefficient)和MDS(Multidimensional Scaling)方法对识别结果验证的方法包括:根据轮廓系数获取平均轮廓系数;平均轮廓系数通过计算簇间相似性和不同簇间的不相似性来评估聚类效果,其中轮廓系数的计算公式如下:
Figure BDA0002513471060000144
其中,ai为点i与所在簇中其他所有点距离的平均值;bi为点i与其他不同簇中其他所有点距离的平均值的最小值;则平均轮廓系数即求取所有轮廓系数si的平均值;如图5、图6、图7所示,根据平均轮廓系数获取最优聚类结果,并通过MDS方法对最优聚类结果下的场景识别效果进行验证,获取场景识别的合理性以及与当前运行的对比结果;根据场景识别的合理性以及对比情况,选择是否接受当前的场景识别结果,如果不接受,则重新选择时间间隔,通过欧式距离和DTW方法对主成分特征组成的离散和时序数据重新进行相似性度量,再次进行相似场景识别,直到最终识别效果被接受。
综上所述,本发明通过根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性;根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征;通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量;根据相似性度量结果利用谱聚类方法对相似运行模式和相似运行趋势进行识别;以及利用平均轮廓系数和MDS方法对识别结果验证,实现了对区域扇区场景当前运行情况进行更全面的可视化描述,以及区域扇区场景相似性的精确识别。
在本申请所提供的几个实施例中,应该理解到,所揭露方法,也可以通过其它的方式实现。附图中的流程图和框图显示了根据本发明的多个实施例的方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

Claims (2)

1.一种基于运行特征的区域扇区场景相似识别方法,其特征在于,包括:
根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性;
根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征;
通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量;
根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别;以及
通过平均轮廓系数和MDS方法对识别结果验证;
所述根据区域扇区运行特点,建立区域扇区运行特征体系,以获取区域扇区运行情况实测数据的相关性的方法包括:
所述区域扇区运行特征体系包括:水平维度的运行指标和垂直维度的运行指标;
所述水平维度的运行指标包括:扇区流量、入扇航向方差、航行距离、航行时间和平均航行速度;
所述垂直维度的运行指标包括:爬升时间、下降时间、平飞时间、爬升次数、下降次数、平飞次数、混合态势爬升时间、混合态势下降时间、混合态势平飞时间、混合态势爬升次数、混合态势下降次数、混合态势平飞次数和运行混合系数;
根据区域扇区运行特征体系反应区域扇区运行情况,以获取区域扇区运行情况实测数据的相关性;
所述相关性包括:区域扇区运行的连续性和聚集性;
所述根据相关性通过主成分分析方法降低运行特征的信息冗余和维度,以获取主成分特征的方法包括:
根据区域扇区运行的连续性和聚集性,将计算出的特征值输入到PCA模型中,通过正交变换,将原随机向量转化为不相关的新随机向量,降低运行特征的信息冗余和维度,以获取主成分特征;
所述通过欧式距离和DTW方法对主成分特征组成的离散和时序数据进行相似性度量的方法包括:
通过信息权重对主成分特征进行加权处理:
fweight=ω·forigin
其中,fweight为加权后的主成分特征值;forigin为原始主成分特征值,ω为forigin特征所能解释的信息占比;
设定时序时间长度为len,将加权后的主成分特征的数据根据时间间隔处理成离散的数据和时序数据;
通过欧式距离和DTW,对离散数据和时序数据的距离进行度量:
Figure FDA0003579381190000021
其中,E(x,y)为样本x、y的欧式距离;m为主成分特征数量;xi为样本x中第i个主成分特征的特征值;yi为样本y中第i个主成分特征的特征值;
对于两个时间序列X={x1,x2,…,xm}和Y={y1,y2,…,yn},DTW距离公式为:
Figure FDA0003579381190000031
其中,DTW(i,j)为时间序列X中第i个样本与时间序列Y中第j个样本的DTW距离;
分别得到离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT
所述根据相似性度量结果通过谱聚类方法对相似运行模式和相似运行趋势进行识别的方法包括:
计算离散数据相似性度量矩阵WD和时序数据相似性度量矩阵WT中的各行之和,即根据
Figure FDA0003579381190000032
获取度矩阵D,其中wij=e-(DTW(i,j)orE(i,j)),即对样本i,j的DTW或欧式距离做相似度处理,
Figure FDA0003579381190000033
以得到两个度矩阵DD和DT
通过相似性度量矩阵和度矩阵,构建拉普拉斯矩阵LD=DD-WD和LT=DT-WT,其中LD,LT分别为离散数据和时序数据的拉普拉斯矩阵,并对拉普拉斯矩阵进行标准化,以获取
Figure FDA0003579381190000034
Figure FDA0003579381190000035
其中std.LD,std.LT分别为离散数据和时序数据的标准化拉普拉斯矩阵;
分别计算std.LD和std.LT最小的前kD、kT个特征值的特征向量,并组成8832×kD和1104×kT维的矩阵,然后按行标准化得到矩阵FD和FT
矩阵FD为含有kD维特征的样本,矩阵FT为含有kT维特征的样本,根据k-means++方法,分别进行聚类,以获取聚类标签;
根据聚类标签分别将离散数据样本和时序样本进行划分,以对相似运行模式和相似运行趋势进行识别。
2.如权利要求1所述的区域扇区场景相似识别方法,其特征在于,
所述通过平均轮廓系数和MDS方法对识别结果验证的方法包括:
根据轮廓系数获取平均轮廓系数:
Figure FDA0003579381190000041
其中,ai为点i与所在簇中其他所有点距离的平均值;bi为点i与其他不同簇中其他所有点距离的平均值的最小值;则平均轮廓系数即求取所有轮廓系数si的平均值;
根据平均轮廓系数获取最优聚类结果,并通过MDS方法对最优聚类结果下的场景识别效果进行验证,获取场景识别的合理性以及与当前运行的对比结果;
根据场景识别的合理性以及对比情况,选择是否接受当前的场景识别结果,如果不接受,则重新选择时间间隔,通过欧式距离和DTW方法对主成分特征组成的离散和时序数据重新进行相似性度量,再次进行相似场景识别,直到最终识别效果被接受。
CN202010468551.6A 2020-05-28 2020-05-28 基于运行特征的区域扇区场景相似识别方法 Active CN111626366B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010468551.6A CN111626366B (zh) 2020-05-28 2020-05-28 基于运行特征的区域扇区场景相似识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010468551.6A CN111626366B (zh) 2020-05-28 2020-05-28 基于运行特征的区域扇区场景相似识别方法

Publications (2)

Publication Number Publication Date
CN111626366A CN111626366A (zh) 2020-09-04
CN111626366B true CN111626366B (zh) 2022-05-17

Family

ID=72269975

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010468551.6A Active CN111626366B (zh) 2020-05-28 2020-05-28 基于运行特征的区域扇区场景相似识别方法

Country Status (1)

Country Link
CN (1) CN111626366B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112785876B (zh) * 2021-01-28 2022-03-11 南京航空航天大学 终端区时序气象场景智能识别系统
CN112819064B (zh) * 2021-01-28 2022-04-22 南京航空航天大学 基于谱聚类的终端区时序气象场景识别方法
CN113435655B (zh) * 2021-07-05 2022-04-12 南京航空航天大学 扇区动态管理决策方法、服务器及系统
CN113592341B (zh) * 2021-08-10 2024-07-02 南京航空航天大学 度量损失函数、扇区复杂度评估方法及系统
CN116110222B (zh) * 2022-11-29 2024-08-20 东风商用车有限公司 基于大数据的车辆应用场景分析方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105261240A (zh) * 2015-09-30 2016-01-20 中国民用航空总局第二研究所 一种基于聚类分析的扇区运行性能综合检测方法及系统
WO2017173416A1 (en) * 2016-03-31 2017-10-05 Netjets Inc. Aviation sector special departure procedure systems and methods
CN107610469A (zh) * 2017-10-13 2018-01-19 北京工业大学 一种考虑多因素影响的日维度区域交通指数预测方法
CN108934016A (zh) * 2018-07-04 2018-12-04 广东海格怡创科技有限公司 小区场景类别的划分方法、装置、计算机设备和存储介质
CN110488218A (zh) * 2019-08-26 2019-11-22 国网重庆市电力公司电力科学研究院 一种电能表运行状态评估方法和评估装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105261240A (zh) * 2015-09-30 2016-01-20 中国民用航空总局第二研究所 一种基于聚类分析的扇区运行性能综合检测方法及系统
WO2017173416A1 (en) * 2016-03-31 2017-10-05 Netjets Inc. Aviation sector special departure procedure systems and methods
CN107610469A (zh) * 2017-10-13 2018-01-19 北京工业大学 一种考虑多因素影响的日维度区域交通指数预测方法
CN108934016A (zh) * 2018-07-04 2018-12-04 广东海格怡创科技有限公司 小区场景类别的划分方法、装置、计算机设备和存储介质
CN110488218A (zh) * 2019-08-26 2019-11-22 国网重庆市电力公司电力科学研究院 一种电能表运行状态评估方法和评估装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
时间序列数据挖掘的相似性度量综述;陈海燕等;《控制与决策》;20170131;第32卷(第1期);正文第1-5页 *

Also Published As

Publication number Publication date
CN111626366A (zh) 2020-09-04

Similar Documents

Publication Publication Date Title
CN111626366B (zh) 基于运行特征的区域扇区场景相似识别方法
CN106600059B (zh) 基于改进rbf神经网络的智能电网短期负荷预测方法
CN109508812A (zh) 一种基于深度记忆网络的航空器航迹预测方法
Wang et al. Study on evolution characteristics of air traffic situation complexity based on complex network theory
CN111008504B (zh) 一种基于气象模式识别的风电功率预测误差建模方法
CN108805213B (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN112381137A (zh) 新能源电力系统可靠性评估方法、装置、设备及存储介质
CN113362604B (zh) 一种基于扇区动态交通特征的管制员工作负荷评估方法
CN109886352B (zh) 一种空域复杂度无监督评估方法
CN112819064B (zh) 基于谱聚类的终端区时序气象场景识别方法
CN113989747A (zh) 终端区气象场景识别系统
US7206674B1 (en) Information display system for atypical flight phase
CN111626365B (zh) 基于运行特征的区域扇区场景相似识别系统
CN114298183B (zh) 飞行动作智能识别方法
CN115204041A (zh) 一种大型航空器进场和进近阶段耗油量预测方法
CN114722098A (zh) 一种基于正态云模型和密度聚类算法的典型负荷曲线辨识方法
CN112785876B (zh) 终端区时序气象场景智能识别系统
CN106251004A (zh) 基于改进空间距离划分的目标分群方法
Alliot et al. A statistical analysis of the influence of vertical and ground speed errors on conflict probe
CN113222229B (zh) 一种基于机器学习的非合作无人机轨迹预测方法
CN110688287A (zh) 一种基于改进概率神经网络的工控网络态势评估方法
CN115759470A (zh) 一种基于机器学习的航班飞行全过程燃油消耗预测方法
CN113192172B (zh) 一种机载LiDAR地面点云简化方法
CN109299684A (zh) 人脸或场景识别数据分类的竞争和协同表示方法及系统
CN113723533A (zh) 对流天气影响终端区的模式识别方法及高斯混合聚类模型

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant