CN112819064B - 基于谱聚类的终端区时序气象场景识别方法 - Google Patents

基于谱聚类的终端区时序气象场景识别方法 Download PDF

Info

Publication number
CN112819064B
CN112819064B CN202110117463.6A CN202110117463A CN112819064B CN 112819064 B CN112819064 B CN 112819064B CN 202110117463 A CN202110117463 A CN 202110117463A CN 112819064 B CN112819064 B CN 112819064B
Authority
CN
China
Prior art keywords
data
rsi
time
time sequence
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110117463.6A
Other languages
English (en)
Other versions
CN112819064A (zh
Inventor
袁立罡
张旋
毛继志
朱永文
谢华
王兵
李�杰
张颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202110117463.6A priority Critical patent/CN112819064B/zh
Publication of CN112819064A publication Critical patent/CN112819064A/zh
Application granted granted Critical
Publication of CN112819064B publication Critical patent/CN112819064B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/88Radar or analogous systems specially adapted for specific applications
    • G01S13/95Radar or analogous systems specially adapted for specific applications for meteorological use
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G5/00Traffic control systems for aircraft, e.g. air-traffic control [ATC]
    • G08G5/0073Surveillance aids
    • G08G5/0091Surveillance aids for monitoring atmospheric conditions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明属于民航交通管制技术领域,具体涉及一种基于谱聚类的终端区时序气象场景识别方法,其包括:获取目标终端区计算范围内天气避让区数据以及机场本场能见度数据;定义并计算栅格化带权;形成时序RSI数据集与时序能见度数据集;构建气象场景相似度矩阵;以及训练用于识别气象场景的谱聚类模型,以获取最终时序气象场景识别结果,实现了终端区气象场景识别不仅可以作为历史航班运行分析的基础支持,也可以在对流天气等气象影响下为实施空中交通流量管理策略提供决策依据,终端区气象场景识别有助于提高航班运行的安全性、减少航班运行的不正常性。

Description

基于谱聚类的终端区时序气象场景识别方法
技术领域
本发明属于民航交通管制技术领域,具体涉及一种基于谱聚类的终端区时序气象场景识别方法。
背景技术
气象是航空器运行的环境特征,对空域和地面的航班运行会产生重大影响。恶劣对流天气影响了空域的容量、流量,航班会因空中交通管制部门发出的地面等待、过点限制等一系列交通管制策略而出现改航、延误、取消等现象。根据气象对终端区运行的影响可以将终端区识别为不同的运行场景,以表征终端区运行收到了气象带来的不同种类、不同程度的干扰与影响。终端区气象场景识别不仅可以作为历史航班运行分析的基础支持,也可以在对流天气等气象影响下为实施空中交通流量管理策略提供决策依据。终端区气象场景识别有助于提高航班运行的安全性、减少航班运行的不正常性。
终端区气象场景识别通常通过分析瞬间或静态的气象数据,基于多种聚类或分类技术实现。但这些技术没有考虑气象影响的时序变化,仅能给出瞬时的气象影响场景。而空中交通流量管理策略、管制员工作轮班以及历史航班运行分析都是以若干小时为时间单位进行的,现有的终端区气象场景识别方法无法完全满足民航交通管制领域的需要,实际参考价值较弱。并且以往的方法缺乏合理的降维或信息处理方案,难以完全利用超高维的雷达气象信息。
因此,基于上述技术问题需要设计一种新的基于谱聚类的终端区时序气象场景识别方法。
发明内容
本发明的目的是提供一种基于谱聚类的终端区时序气象场景识别方法。
为了解决上述技术问题,本发明提供了一种基于谱聚类的终端区时序气象场景识别方法,包括:
获取目标终端区计算范围内天气避让区数据以及机场本场能见度数据;
定义并计算栅格化带权;
形成时序RSI数据集与时序能见度数据集;
构建气象场景相似度矩阵;以及
训练用于识别气象场景的谱聚类模型,以获取最终时序气象场景识别结果。
进一步,所述获取目标终端区计算范围内天气避让区数据以及机场本场能见度数据的方法包括:
确定目标终端区的计算范围,并确定计算范围四个顶点的经纬度信息;
收集并解码目标终端区天气避让区数据,即
将目标终端区天气避让区数据解析为十进制数据,根据计算范围四个顶点的经纬度信息,从解析后的天气避让区数据中提取出目标终端区计算范围的天气避让区数据;
天气避让区数据为带有时间信息的尺寸为1250*1250矩阵,将矩阵中缺失的元素以值255予以填充,值不在取值范围内的元素以值0予以修正,最终形成天气避让区数据集;
从航空例行天气报告METAR中提取机场本场能见度数据,即
根据通用METAR报格式规定从每条METAR报中提取能见度以及对应的时间信息,删除格式不正确的METAR报信息,值不在取值范围内的能见度以值9999修正,最终形成能见度数据集。
进一步,所述定义并计算栅格化带权的方法包括:
计算范围栅格化,即
将计算范围以边平行的方向,均匀的划分为5×5的栅格,机场本场位于中心栅格的正中,以及将天气避让区数据集进行5×5的栅格化划分,每个栅格的尺寸为250*250;
为每一个栅格计算天气影响路线指数WIRI权重,即
从终端区进离场航路路线分布图中获取航路信息,将计算范围内每个栅格的航线数量与栅格航线数量最大值的比值作为栅格对应的WIRI权重;
WIRI权重wx,y为:
Figure BDA0002921256340000031
其中,dx,y为第x行第y列栅格的航线数量;di,j为栅格内航线的数量;
计算每个栅格的栅格化带权,即
栅格对应的天气避让区数据中值为2或3的元素占全体元素的比值,每一个栅格的尺寸为250*250,有62500个元素,则每个栅格的栅格化带权为:
WSIi,j=(d2+d3)/62500;
其中,d2为值2的元素个数;d3为值3的元素个数;
计算栅格化带权,即
对于一条天气避让区数据,其栅格化带权为所有栅格的WIRI权重与其对应的栅格化带权乘积的总和,则将一条天气避让区数据表示为一个栅格化带权的值RSI,以使天气避让区数据集转换为RSI数据集;
Figure BDA0002921256340000032
进一步,所述形成时序RSI数据集与时序能见度数据集的方法包括:
按时间划分数据集,即
统计能见度数据集与RSI数据集涉及的日期,将每日从零点开始以2h为单位划分为12个时间片,作为所需识别的气象场景时间段;
构建时序RSI数据集,即
将RSI数据集对应到划定的时间片,并按时间顺序排序,形成时序RSI数据集;
时序RSI数据集标准化,即
若存在RSI数据连续缺失超过40分钟,则丢弃该条时序RSI数据;反之,以值0补充到缺失的RSI数据处,使时序RSI数据集完整;
对于包含RSI数据多于12个的单条时序RSI数据,循环的检测相邻时间间隔最小的两个RSI数据,移除其中时间靠后的一方,直至此条时序RSI数据集包含的RSI数据降至12个;
构建时序能见度数据集,即
将能见度数据集对应到标准化的时序RSI数据集对应的时间片中。缺失值以值0补充,多余的值删除。
进一步,所述构建气象场景相似度矩阵的方法包括:
以改进的动态时间规整DTW时序度量算法对时序RSI数据集进行相似度度量,获取时序RSI相似度矩阵,搜索范围Ssearch是以点(1,1),(p,p),(p/3,2p/3),(2p/3,p/3)为顶点的平行四边形内的整数点集,对于两个时序RSI数据X={x1,x2,…,xM}、Y={y1,y2,…,yN},其改进DTW相似性度量距离为:
Figure BDA0002921256340000051
其中,p为时序RSI数据集单条数据包含的RSI数据数量;DTW(i,j)为平面直角坐标系中点(i,j)对应的值;
对于含有m个数据的时序RSI数据集,每两个数据间进行一次改进DTW相似性度量距离计算,第i个数据与第j个数据的度量结果为ai,j,最终形成时序RSI相似度矩阵A={aij}∈Rm×m;Rm×m为全体m阶实矩阵构成的集合;
以曼哈顿距离度量对时序能见度数据集进行相似度度量,获取时序能见度相似度矩阵,对于两个时序能见度数据X={x1,x2,x3,x4}、Y={y1,y2,y3,y4},其相似性度量距离为:
Figure BDA0002921256340000052
含有m个数据的时序能见度数据集,每两个数据间进行一次相似性度量距离计算,第i个数据与第j个数据的度量结果为bi,j,形成时序能见度相似性度量矩阵B={bij}∈Rm ×m
将时序RSI相似性度量矩阵以及时序能见度相似性度量矩阵以7:3的权重结合,形成最终气象场景相似度矩阵C:
C=0.7A+0.3B∈Rm×m
进一步,所述训练用于识别气象场景的谱聚类模型,以获取最终时序气象场景识别结果的方法包括:
将气象场景相似度矩阵作为谱聚类的输入,在相似度矩阵上执行谱聚类,分别以2到8之间的整数作为谱聚类的聚类簇数参数;
度矩阵
Figure BDA0002921256340000061
其中
Figure BDA0002921256340000062
cij为矩阵C第i行第j列的元素;
基于气象场景相似度矩阵C与度矩阵D构建拉普拉斯矩阵L,并对L进行标准化:
L=D-W;
Figure BDA0002921256340000063
计算前k个最小特征值的特征向量,并将其组成m×k的矩阵,再按行执行标准化操作得到矩阵F;
将矩阵F中的一行作为一个k维样本,共m个样本,选用聚类算法完成聚类;
采用平均轮廓系数作为谱聚类的聚类效果度量准则,取平均轮廓系数最大的谱聚类结果及模型作为终端区时序气象场景识别结果;
轮廓系数为:
Figure BDA0002921256340000064
其中,ai为该样本到同簇其他点距离的均值;bi为该样本到相邻最近一簇内点距离的均值;
平均轮廓系数为全体样本轮廓系数的均值。
本发明的有益效果是,本发明通过获取目标终端区计算范围内天气避让区数据以及机场本场能见度数据;定义并计算栅格化带权;形成时序RSI数据集与时序能见度数据集;构建气象场景相似度矩阵;以及训练用于识别气象场景的谱聚类模型,以获取最终时序气象场景识别结果,实现了终端区气象场景识别不仅可以作为历史航班运行分析的基础支持,也可以在对流天气等气象影响下为实施空中交通流量管理策略提供决策依据,终端区气象场景识别有助于提高航班运行的安全性、减少航班运行的不正常性。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明所涉及的基于谱聚类的终端区时序气象场景识别方法的流程图;
图2是本发明所涉及的目标终端区计算范围示意图;
图3是本发明所涉及的WAF数据集部分样本示例;
图4是本发明所涉及的计算范围栅格化示意图;
图5是本发明所涉及的某机场终端区进离场航线图;
图6是本发明所涉及的改进的DTW搜索范围示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明所涉及的基于谱聚类的终端区时序气象场景识别方法的流程图。
如图1所示,本实施例提供了一种基于谱聚类的终端区时序气象场景识别方法,包括:获取目标终端区计算范围内天气避让区数据以及机场本场能见度数据,首先从天气避让区(WAF)产品数据中提取并解码出目标终端区计算范围的数据并从航空例行天气报告METAR报文中提取本场能见度数据;然后通过预处理工作解决原始数据中存在的缺失、异常问题,提升数据质量;最终形成后续分析与建模过程中所需的WAF数据集与能见度数据集。定义并计算栅格化带权WSI(Weather Severity Index);首先将计算范围划分为5×5的栅格,并对WAF数据也作相应划分处理;然后根据终端区进离场航路航线分布图确定WIRI权重;最终分别计算每一个栅格的WSI,并结合WIRI权重计算栅格化带权WSI。形成时序RSI数据集与时序能见度数据集;将数据设计的日期划分为时长为2h的若干时间片,结合划分结果,使用所获取的能见度数据构建时序能见度数据集,使用处理获取的栅格化带权WSI数据构建时序能见度数据集。构建气象场景相似度矩阵;使用改进DTW方法计算运行场景相似度矩阵。分别在栅格化带权WSI时序数据集以及能见度时序数据集上执行相似度度量,并将相似性度量结果以固定权重比例结合形成最终的气象场景相似度矩阵。以及训练用于识别气象场景的谱聚类模型,以获取最终时序气象场景识别结果;将获取的气象场景相似度矩阵作为原始输入,执行谱聚类算法对划分好的终端区气象场景样本进行聚类,以获取最终时序气象场景识别结果。结合民航科研成果,联系民航运行实际,进行相应的设计。收集目标终端区WAF天气避让区(Weather Avoidance Field)数据以及能见度数据,提出栅格化WSI方法对高维的WAF天气避让区数据进行降维,以2小时为单位形成时序气象数据,并改进DTW方法作为时序数据相似性度量获取相似度矩阵,最终使用相似度矩阵训练谱聚类模型获取终端区时序气象场景识别结果;实现了终端区气象场景识别,不仅可以作为历史航班运行分析的基础支持,也可以在对流天气等气象影响下为实施空中交通流量管理策略提供决策依据,终端区气象场景识别有助于提高航班运行的安全性、减少航班运行的不正常性。
在本实施例中,所述获取目标终端区计算范围内天气避让区数据以及机场本场能见度数据的方法包括:确定目标终端区的计算范围,并确定计算范围四个顶点的经纬度信息;目标终端区计算范围简称计算范围,指整个流程中在进行数据收集、数值计算等工作时考虑的地理范围。以机场本场为中心,划定边长为250km的正方形为计算范围。正方形计算范围的一组对边与纬线平行。
收集并解码目标终端区天气避让区数据,即直接获取的WAF数据为二进制数据,首先需要解析为十进制数据,将目标终端区天气避让区数据解析为十进制数据,解析成的十进制数据中包含以下几种数据情况:0,1,2,3,255,其中0代表无气象情况,1,2,3分别代表气象的严重程度,255代表数据为空(超出雷达扫描范围),根据计算范围四个顶点的经纬度信息,从解析后的天气避让区数据中提取出目标终端区计算范围的天气避让区数据;
由于WAF分辨率方格的尺寸为200m×200m,故最终获取到的WAF数据格式为若干个带有时间信息的尺寸为1250*1250矩阵,矩阵中每个元素的取值范围是集合{0,1,2,3,255},将矩阵中缺失的元素以值255予以填充,值不在取值范围内的元素以值0予以修正,最终形成天气避让区数据集(WAF数据集);
从航空例行天气报告METAR报中提取机场本场能见度数据,即航空例行天气报告METAR的数据为格式化的文本字符串,包含了日期时间、风向风速、能见度、云底高等信息。根据通用METAR报格式规定从每条METAR报中提取能见度以及对应的时间信息。能见度的单位为米,其取值应当是小于10000的非负整数。删除格式不正确的METAR报信息,值不在取值范围内的能见度以值“9999”修正,最终形成能见度数据集。
在本实施例中,所述定义并计算栅格化带权的方法包括:
计算范围栅格化,即将计算范围以边平行的方向,均匀的划分为5×5的栅格,机场本场位于中心栅格的正中,以及将天气避让区数据集进行5×5的栅格化划分,每个栅格的尺寸为250*250;
为每一个栅格计算天气影响路线指数WIRI权重(天气影响路线指数
Weather Impacted Route Index),即从终端区进离场航路路线分布图中获取航路信息,将计算范围内每个栅格的航线数量与栅格航线数量最大值的比值作为栅格对应的WIRI权重;
WIRI权重wx,y为:
Figure BDA0002921256340000101
di,j为栅格内航线的数量;i、j的取值可以独立的自由从1到5;对于每一个栅格,这个公式分子是该栅格的航线数量,分母是所有栅格航线数量的最大值;
其中,dx,y为第x行第y列栅格的航线数量;
计算每个栅格的栅格化带权WSI,即WSI在本方法中指栅格对应的天气避让区数据中值为2或3的元素占全体元素的比值,每一个栅格的尺寸为250*250,有62500个元素,则每个栅格的栅格化带权为:
WSIi,j=(d2+d3)/62500;
其中,d2为值2的元素个数;d3为值3的元素个数;该式就是定义式,其中62500是250的平方,250是设计方法时,人为设定的一个控制单个栅格大小的恒定参数,i、j的取值范围都是1-5;
计算栅格化带权,即对于一条WAF数据,其栅格化带权WSI(记作RSI)被定义为所有栅格的WIRI权重与其对应的WSI乘积的总和。将一条WAF数据表示为一个栅格化带权WSI的值,即RSI,以使天气避让区数据集转换为RSI数据集;
Figure BDA0002921256340000111
在本实施例中,所述形成时序RSI数据集与时序能见度数据集的方法包括:按时间划分数据集,即统计能见度数据集与RSI数据集涉及的日期,将每日从零点开始以2h为单位划分为12个时间片,作为所需识别的气象场景时间段;
构建时序RSI数据集,即以所获RSI数据集为基础进行构建,每条时序RSI数据集应由12条间隔为10分钟的RSI数据组成。原始WAF产品是每隔10分钟一张图片,由于采样的失误会导致偶尔出现样本点过于密集或稀疏的状况(低于或高于10分钟就有一张对流天气图)。RSI数据集的时间分布情况原始WAF产品相同。将RSI数据集对应到划定的时间片,并按时间顺序排序,形成时序RSI数据集;
时序RSI数据集标准化,即时序RSI数据集的单位时间片长度为2h,应当由12个间隔为10分钟的RSI数据组成。对于包含RSI数据少于12个的单条时序RSI数据,分成两种情况进行处理:若存在RSI数据连续缺失超过40分钟,则丢弃该条时序RSI数据;反之,以值0补充到缺失的RSI数据处,使时序RSI数据集完整;
对于包含RSI数据多于12个的单条时序RSI数据,循环的检测相邻时间间隔最小的两个RSI数据,移除其中时间靠后的一方,直至此条时序RSI数据集包含的RSI数据降至12个;
构建时序能见度数据集,即以所获能见度数据集为基础进行构建,每条时序能见度由4条间隔为0.5h的能见度数据组成。将能见度数据集对应到标准化的时序RSI数据集对应的时间片中。缺失值以值0补充,多余的值删除。
在本实施例中,所述构建气象场景相似度矩阵的方法包括:以改进的动态时间规整DTW(Dynamic Time Warping动态时间规整)时序度量算法对时序RSI数据集进行相似度度量,获取时序RSI相似度矩阵,首先需要确定改进DTW搜索范围。DTW的目标是在平面直角坐标系中计算点(N,M)对应的值DTW(N,M),在本实施例中N与M皆等于(3.3)中所获时序RSI数据集单条数据包含的RSI数据数量,记为p;搜索范围Ssearch是以点(1,1),(p,p),(p/3,2p/3),(2p/3,p/3)为顶点的平行四边形内的整数点集,对于两个时序RSI数据X={x1,x2,…,xM}、Y={y1,y2,…,yN},其改进DTW相似性度量距离为:
Figure BDA0002921256340000121
其中,p为时序RSI数据集单条数据包含的RSI数据数量;DTW(i,j)为平面直角坐标系中点(i,j)对应的值;平面直角坐标系未xoy平面,本实施例中平面直角坐标系为普通平面直角坐标系,此处的坐标是一个为了描述算法搜索过程虚构的,本实施例中坐标系不包含Z轴,即不包含高度。
对于含有m个数据的时序RSI数据集,每两个数据间进行一次改进DTW相似性度量距离计算,第i个数据与第j个数据的度量结果为ai,j,最终形成时序RSI相似度矩阵A={aij}∈Rm×m;Rm×m为全体m阶实矩阵构成的集合,这里用p指代一条时序数据由p个数值组成,即一条时序RSI由p个RSI组成(p实际取得是12),然后用m指代整个完整的数据集有多少条时序数据;
以曼哈顿距离度量对时序能见度数据集进行相似度度量,获取时序能见度相似度矩阵,对于两个时序能见度数据X={x1,x2,x3,x4}、Y={y1,y2,y3,y4},其相似性度量距离为:
Figure BDA0002921256340000131
含有m个数据的时序能见度数据集,每两个数据间进行一次相似性度量距离计算,第i个数据与第j个数据的度量结果为bi,j,形成时序能见度相似性度量矩阵B={bij}∈Rm ×m
将时序RSI相似性度量矩阵以及时序能见度相似性度量矩阵以7:3的权重结合,形成最终气象场景相似度矩阵C:
C=0.7A+0.3B∈Rm×m
在本实施例中,所述训练用于识别气象场景的谱聚类模型,以获取最终时序气象场景识别结果的方法包括:
将气象场景相似度矩阵作为谱聚类的输入,在相似度矩阵上执行谱聚类,分别以2到8之间的整数作为谱聚类的聚类簇数参数;
度矩阵
Figure BDA0002921256340000141
其中
Figure BDA0002921256340000142
cij为矩阵C第i行第j列的元素;D为定义式,度矩阵D是一个对角矩阵,里面有m个数据分别是d1,d2,…,dm,di指代其中的任何一个;
基于气象场景相似度矩阵C与度矩阵D构建拉普拉斯矩阵L,并对L进行标准化:
L=D-W;
Figure BDA0002921256340000143
计算前k个最小特征值的特征向量,并将其组成m×k的矩阵,再按行执行标准化操作得到矩阵F;
将矩阵F中的一行作为一个k维样本,共m个样本,选用k-means聚类算法完成聚类;
采用平均轮廓系数作为谱聚类的聚类效果度量准则,取平均轮廓系数最大的谱聚类结果及模型作为该方法的最终结果,亦即终端区时序气象场景识别结果;
轮廓系数为:
Figure BDA0002921256340000144
其中,ai为该样本到同簇其他点距离的均值;bi为该样本到相邻最近一簇内点距离的均值;
平均轮廓系数为全体样本轮廓系数的均值。
图2是本发明所涉及的目标终端区计算范围示意图;
图3是本发明所涉及的WAF数据集部分样本示例;
图4是本发明所涉及的计算范围栅格化示意图;
图5是本发明所涉及的某机场终端区进离场航线图;
图6是本发明所涉及的改进的DTW搜索范围示意图。
在本实施例中,对于基于谱聚类的终端区时序气象场景识别方法进行具体的举例说明:
获取目标终端区计算范围内WAF数据以及机场本场能见度数据。
决定目标终端区计算范围。如图2所示,在选定某一机场终端区为研究对象后,我们划定了边长为250km的正方形作为计算范围。其中中心部分为机场本场轮廓。此正方形计算范围的内切圆半径为125km,表示气象雷达的大致扫描范围。
收集并解码目标终端区WAF数据。我们采用了某地区空中交通管理局提供的2019年全年天气避让区(WAF)产品数据,并从中提取并解码出计算范围的数据。该数据选择了多个系统性对流天气和热力性对流天气过程,包括大范围雷雨天气以及飑线等强对流天气,并且兼具了东西向和南北向的回波。该产品分为4个等级,0为极弱回波,1表示可通过区域,2为低概率避让区,3为建议规避区,其更新频率为10分钟,分辨率为200m×200m。
根据确定的计算范围信息,从解析后的WAF数据中提取出目标终端区计算范围的WAF数据。最终获取到若干带有时间信息的尺寸为1250*1250矩阵。经过缺失值以“255”填充、异常值以“0”修正之后,矩阵中每个元素的取值范围是集合。图3以图片的形式可视化了部分矩阵数据。
从METAR报中提取本场能见度数据。我们同样采用了某地区空中交通管理局提供的对应研究机场终端区的2019年全年METAR报信息。依据METAR报的格式,完成了能见度信息的提取。航空例行天气报告METAR的数据为格式化的文本字符串,包含了日期时间、风向风速、能见度、云底高等信息。收集到的METAR报的数据示例样本为:
METAR ZGGG 010000Z VRB01MPS 5000 BR NSC 13/09 Q1024 NOSIG=
METAR ZGGG 010030Z VRB01MPS 5000 HZ NSC 14/10 Q1024 NOSIG=
METAR ZGGG 010100Z 06002MPS 020V080 5000 HZ NSC 15/10 Q1024 NOSIG=
METAR ZGGG 010130Z VRB01MPS 5000 HZ NSC 16/10 Q1024 NOSIG=
定义并计算栅格化带权WSI(Weather Severity Index)。
计算范围栅格化。将计算范围,按照与边平行的方向,均匀的划分为5×5的栅格。机场本场位于中心栅格的正中,结果如图4所示。图4中中心部分为机场本场大致轮廓,右侧矩阵展示了单条WAF数据的格式,折线由该终端区各进离主要航路点连接而成,刻画了终端区大致轮廓。
计算WIRI权重。我们获取了终端区进离场航路路线分布图,并根据各栅格航线数量按公式计算了每个栅格的权重。图5是终端区进离场航线图。
计算每个栅格的WSI。按照公式计算了每个栅格对应的WAF数据中值为2或3的元素占全体元素的比值。
计算栅格化带权WSI。根据获取的WIRI以及获取的各栅格WSI,为每条WAF数据按公式计算了其栅格化带权WSI,即RSI。最终形成的RSI数据集约有数据五万条。
形成时序RSI数据集与时序能见度数据集。
按时间划分数据集。将2019年全年365天按2h为单位划分为4380个时间片,作为要识别的气象场景时间段。
构建时序RSI数据集。将所获RSI数据集对应到4380个时间片中,并按时间顺序排序,形成了大小为4380的时序RSI数据集。
时序RSI数据集标准化。观察到时序RSI数据集中,每条时序RSI由0-18的数量不等RSI数据组成。对于包含RSI数据少于12个的单条时序RSI数据,分成两种情况进行了处理:丢弃了连续缺失超过40分钟的时序RSI数据;反之,以值“0”补充到缺失的RSI数据处。对于包含RSI数据多于12个的单条时序RSI数据,循环的检测了相邻时间间隔最小的两个RSI数据,移除其中时间靠后的一方,直至时序RSI数据包含的RSI数据降至12个。最终约有10的时序RSI数据因为连续缺失过多被删除,形成了含有3966个样本的时序RSI数据集。
构建时序能见度数据集。将所获能见度数据集对应到标准化的时序RSI数据集对应的时间片中。以值“0”补充了缺失值。最终形成了于时序RSI数据集同样大小的时序能见度数据集。
获取气象场景相似度矩阵。首先确定了搜索范围,由于这里N=M=12,故搜索范围是以点(1,1),(12,12),(4,8),(8,4)为顶点的平行四边形内的整数点集。图6表示了某次搜索的搜索范围与搜索路径,其中Xa=4,Xb=8。然后对时序RSI数据集中的3966个样本每两个之间进行了一次改进DTW相似性度量,计算了二者的DTW距离。最终经过离差标准化后形成了时序RSI相似度矩阵A。
对时序能见度数据集中的3966个样本按公式每两个之间进行了一次相似性度量,计算了二者的曼哈顿距离。最终经过离差标准化后形成了时序能见度相似度矩阵B。
根据获取的时序RSI相似度矩阵A以及获取的时序能见度相似度矩阵B,以7:3的权重计算了最终气象场景相似度矩阵C。
训练用于识别气象场景的谱聚类模型。把得到的相似性度量矩阵C作为谱聚类的输入,在相似度矩阵上分别以2到8之间的整数作为谱聚类的聚类簇数参数,执行了谱聚类。其中参数p=12,而最小特征值特征向量的个数参数k被设置为8。使用平均轮廓系数作为谱聚类的聚类效果度量准则,计算了不同聚类簇数的谱聚类结果,保留两位有效数字后的结果如表1所示。
表1谱聚类结果平均轮廓系数
Figure BDA0002921256340000181
由表1可知当聚类簇数为5时对应谱聚类结果平均轮廓系数最小,故最终选取聚类簇数为5时的谱聚类模型与谱聚类结果作为最终终端区时序气象场景识别结果。
综上所述,本发明通过获取目标终端区计算范围内天气避让区数据以及机场本场能见度数据;定义并计算栅格化带权;形成时序RSI数据集与时序能见度数据集;构建气象场景相似度矩阵;以及训练用于识别气象场景的谱聚类模型,以获取最终时序气象场景识别结果,实现了终端区气象场景识别不仅可以作为历史航班运行分析的基础支持,也可以在对流天气等气象影响下为实施空中交通流量管理策略提供决策依据,终端区气象场景识别有助于提高航班运行的安全性、减少航班运行的不正常性。
在本申请所提供的几个实施例中,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

Claims (5)

1.一种基于谱聚类的终端区时序气象场景识别方法,其特征在于,包括:
获取机场本场能见度数据以及目标终端区计算范围内天气避让区数据;
定义并计算栅格化带权;即
计算范围栅格化;
为每一个栅格计算天气影响路线指数WIRI权重;
计算每个栅格的栅格化带权,计算栅格化带权,即
对于一条天气避让区数据,其栅格化带权为所有栅格的WIRI权重与其对应的栅格化带权乘积的总和,则将一条天气避让区数据表示为一个栅格化带权的值RSI,以使天气避让区数据集转换为RSI数据集;
形成时序RSI数据集与时序能见度数据集;
构建气象场景相似度矩阵;即
以改进的动态时间规整DTW时序度量算法对时序RSI数据集进行相似度度量,获取时序RSI相似度矩阵;
以曼哈顿距离度量对时序能见度数据集进行相似度度量,获取时序能见度相似度矩阵;训练用于识别气象场景的谱聚类模型,以获取最终时序气象场景识别结果;即
将气象场景相似度矩阵作为谱聚类的输入,在相似度矩阵上执行谱聚类,分别以2到8之间的整数作为谱聚类的聚类簇数参数;
所述形成时序RSI数据集与时序能见度数据集的方法包括:
按时间划分数据集,即
统计能见度数据集与RSI数据集涉及的日期,将每日从零点开始以2h为单位划分为12个时间片,作为所需识别的气象场景时间段;
构建时序RSI数据集,即
将RSI数据集对应到划定的时间片,并按时间顺序排序,形成时序RSI数据集;
时序RSI数据集标准化,即
若存在RSI数据连续缺失超过40分钟,则丢弃该条时序RSI数据;反之,以值0补充到缺失的RSI数据处,使时序RSI数据集完整;
对于包含RSI数据多于12个的单条时序RSI数据,循环的检测相邻时间间隔最小的两个RSI数据,移除其中时间靠后的一方,直至此条时序RSI数据集包含的RSI数据降至12个;
构建时序能见度数据集,即
将能见度数据集对应到标准化的时序RSI数据集对应的时间片中;缺失值以值0补充,多余的值删除。
2.如权利要求1所述的基于谱聚类的终端区时序气象场景识别方法,其特征在于,
所述获取机场本场能见度数据以及目标终端区计算范围内天气避让区数据 的方法包括:
确定目标终端区的计算范围,并确定计算范围四个顶点的经纬度信息;
收集并解码目标终端区天气避让区数据,即
将目标终端区天气避让区数据解析为十进制数据,根据计算范围四个顶点的经纬度信息,从解析后的天气避让区数据中提取出目标终端区计算范围的天气避让区数据;
天气避让区数据为带有时间信息的尺寸为1250*1250矩阵,将矩阵中缺失的元素以值255予以填充,值不在取值范围内的元素以值0予以修正,最终形成天气避让区数据集;
从航空例行天气报告METAR中提取机场本场能见度数据,即
根据通用METAR报格式规定从每条METAR报中提取能见度以及对应的时间信息,删除格式不正确的METAR报信息,值不在取值范围内的能见度以值9999修正,最终形成能见度数据集。
3.如权利要求2所述的基于谱聚类的终端区时序气象场景识别方法,其特征在于,
所述定义并计算栅格化带权的方法包括:
计算范围栅格化,即
将计算范围以边平行的方向,均匀的划分为5×5的栅格,机场本场位于中心栅格的正中,以及将天气避让区数据集进行5×5的栅格化划分,每个栅格的尺寸为250*250;
为每一个栅格计算天气影响路线指数WIRI权重,即
从终端区进离场航路路线分布图中获取航路信息,将计算范围内每个栅格的航线数量与栅格航线数量最大值的比值作为栅格对应的WIRI权重;
WIRI权重wx,y为:
Figure FDA0003551463320000031
其中,dx,y为第x行第y列栅格的航线数量;di,j为栅格内航线的数量;
计算每个栅格的栅格化带权,即
栅格对应的天气避让区数据中值为2或3的元素占全体元素的比值,每一个栅格的尺寸为250*250,有62500个元素,则每个栅格的栅格化带权为:
WSIi,j=(d2+d3)/62500;
其中,d2为值2的元素个数;d3为值3的元素个数;
计算栅格化带权,即
对于一条天气避让区数据,其栅格化带权为所有栅格的WIRI权重与其对应的栅格化带权乘积的总和,则将一条天气避让区数据表示为一个栅格化带权的值RSI,以使天气避让区数据集转换为RSI数据集;
Figure FDA0003551463320000041
4.如权利要求3所述的基于谱聚类的终端区时序气象场景识别方法,其特征在于,
所述构建气象场景相似度矩阵的方法包括:
以改进的动态时间规整DTW时序度量算法对时序RSI数据集进行相似度度量,获取时序RSI相似度矩阵,搜索范围Ssearch是以点(1,1),(p,p),(p/3,2p/3),(2p/3,p/3)为顶点的平行四边形内的整数点集,对于两个时序RSI数据X={x1,x2,…,xM}、Y={y1,y2,…,yN},其改进DTW相似性度量距离为:
Figure FDA0003551463320000042
其中,p为时序RSI数据集单条数据包含的RSI数据数量;DTW(i,j)为平面直角坐标系中点(i,j)对应的值;
对于含有m个数据的时序RSI数据集,每两个数据间进行一次改进DTW相似性度量距离计算,第i个数据与第j个数据的度量结果为ai,j,最终形成时序RSI相似度矩阵A={aij}∈Rm ×m;Rm×m为全体m阶实矩阵构成的集合;
以曼哈顿距离度量对时序能见度数据集进行相似度度量,获取时序能见度相似度矩阵,对于两个时序能见度数据X={x1,x2,x3,x4}、Y={y1,y2,y3,y4},其相似性度量距离为:
Figure FDA0003551463320000051
含有m个数据的时序能见度数据集,每两个数据间进行一次相似性度量距离计算,第i个数据与第j个数据的度量结果为bi,j,形成时序能见度相似性度量矩阵B={bij}∈Rm×m
将时序RSI相似性度量矩阵以及时序能见度相似性度量矩阵以7:3的权重结合,形成最终气象场景相似度矩阵C:
C=0.7A+0.3B∈Rm×m
5.如权利要求4所述的基于谱聚类的终端区时序气象场景识别方法,其特征在于,
所述训练用于识别气象场景的谱聚类模型,以获取最终时序气象场景识别结果的方法包括:
将气象场景相似度矩阵作为谱聚类的输入,在相似度矩阵上执行谱聚类,分别以2到8之间的整数作为谱聚类的聚类簇数参数;
度矩阵
Figure FDA0003551463320000052
其中
Figure FDA0003551463320000053
cij为矩阵C第i行第j列的元素;
基于气象场景相似度矩阵C与度矩阵D构建拉普拉斯矩阵L,并对L进行标准化:
L=D-W;
Figure FDA0003551463320000054
计算前k个最小特征值的特征向量,并将其组成m×k的矩阵,再按行执行标准化操作得到矩阵F;
将矩阵F中的一行作为一个k维样本,共m个样本,选用聚类算法完成聚类;
采用平均轮廓系数作为谱聚类的聚类效果度量准则,取平均轮廓系数最大的谱聚类结果及模型作为终端区时序气象场景识别结果;
轮廓系数为:
Figure FDA0003551463320000061
其中,ai为该样本到同簇其他点距离的均值;bi为该样本到相邻最近一簇内点距离的均值;
平均轮廓系数为全体样本轮廓系数的均值。
CN202110117463.6A 2021-01-28 2021-01-28 基于谱聚类的终端区时序气象场景识别方法 Active CN112819064B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110117463.6A CN112819064B (zh) 2021-01-28 2021-01-28 基于谱聚类的终端区时序气象场景识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110117463.6A CN112819064B (zh) 2021-01-28 2021-01-28 基于谱聚类的终端区时序气象场景识别方法

Publications (2)

Publication Number Publication Date
CN112819064A CN112819064A (zh) 2021-05-18
CN112819064B true CN112819064B (zh) 2022-04-22

Family

ID=75860090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110117463.6A Active CN112819064B (zh) 2021-01-28 2021-01-28 基于谱聚类的终端区时序气象场景识别方法

Country Status (1)

Country Link
CN (1) CN112819064B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113361948B (zh) * 2021-06-24 2023-06-16 中国电子科技集团公司第二十八研究所 一种基于矩阵运算的空域对流天气信息量化方法
CN113723532A (zh) * 2021-09-02 2021-11-30 南京航空航天大学 对流天气影响终端区模式识别系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7184590B2 (en) * 2002-07-17 2007-02-27 Lockheed Martin Corporation Algorithm selector
US9025817B2 (en) * 2012-09-05 2015-05-05 Critical Imaging, LLC System and method for leak detection
US9579700B2 (en) * 2014-05-30 2017-02-28 Iteris, Inc. Measurement and modeling of salinity contamination of soil and soil-water systems from oil and gas production activities
CN108020840B (zh) * 2017-11-20 2021-08-13 天津大学 一种基于多普勒天气雷达数据的冰雹云早期识别方法
CN109919062A (zh) * 2019-02-27 2019-06-21 上海浪潮云计算服务有限公司 一种基于特征量融合的道路场景天气识别方法
CN110348291A (zh) * 2019-05-28 2019-10-18 华为技术有限公司 一种场景识别方法、一种场景识别装置及一种电子设备
CN111626366B (zh) * 2020-05-28 2022-05-17 南京航空航天大学 基于运行特征的区域扇区场景相似识别方法

Also Published As

Publication number Publication date
CN112819064A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
Feloni et al. Flood vulnerability assessment using a GIS‐based multi‐criteria approach—The case of Attica region
Davis et al. The method for object-based diagnostic evaluation (MODE) applied to numerical forecasts from the 2005 NSSL/SPC Spring Program
US7069258B1 (en) Weather prediction method for forecasting selected events
CN112819064B (zh) 基于谱聚类的终端区时序气象场景识别方法
CN112785876B (zh) 终端区时序气象场景智能识别系统
KR101026071B1 (ko) 군집별 태풍 개수 예측 방법 및 여름철 태풍 진로 예측 방법
CN113642849B (zh) 考虑空间分布特征的地质灾害危险性综合评价方法及装置
CN107818382B (zh) 航班到达时间预测方法
Liu et al. Predicting aircraft trajectory choice–a nominal route approach
CN115292554B (zh) 一种航空气象四维数据集的构建方法及系统
Biard et al. Automated detection of weather fronts using a deep learning neural network
Dietz et al. Forecasting low-visibility procedure states with tree-based statistical methods
Schön et al. The error is the feature: How to forecast lightning using a model prediction error
CN114048944A (zh) 一种暴雨诱发地质灾害下应撤离人口及损毁房屋的预估方法
CN113284369B (zh) 一种基于ads-b实测航路数据的预测方法
CN112215416B (zh) 智能规划巡检航线系统及方法
CN111415039B (zh) 一种基于非负张量分解的航班延误模式分析方法
Bouchard et al. Comparison of different forecasting tools for short-range lightning strike risk assessment
CN108957594B (zh) 一种商遥卫星轨道总云量预报修正方法及修正系统
Verlinden et al. Using the second-generation GEFS reforecasts to predict ceiling, visibility, and aviation flight category
CN110533241B (zh) 终端区起降容量预测系统
Vetrova et al. Low clouds and their forecast at the airports of the European part of the former USSR
Saha et al. Forecast analysis of visibility for airport operations with deep learning techniques
CN113239815A (zh) 一种基于真实语义全网络学习的遥感影像分类方法、装置及设备
Yu High-precision traffic flow big data prediction based on deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant