发明内容
为解决背景技术中存在的技术问题,本发明提出了一种基于聚类的机场群终端区航迹分析方法,提供了一种科学的、程序化的、高效率的终端区航迹分析方法,为机场基于空间要素及时间要素解耦提供重要支持。
本发明提出一种基于聚类的机场群终端区航迹分析方法,包括:
S1:确定待评估机场群集合F及航迹点特征,获取机场群ADS-B航迹点数据集合D;
S2:根据终端区的切分规则并结合ADS-B航迹点数据集合D的粒度及对应机场坐标,通过自定义规则区分终端区实际航迹的起飞降落情况将所有航迹进行分类处理,得到处理后的终端区航迹数据集合G';
S3:根据待评估机场群集合F,结合终端区运行规则,构建机场群终端区标准航迹集合S和机场群共享资源点集合L;
S4:基于改进的K-means算法对终端区航迹数据集合G'进行聚类,依据聚类指标确定最佳聚类数目并获得聚类结果R;
S5:根据聚类结果R计算三维交叉区域,结合标准航迹集合S和机场群共享资源点集合L获得机场群终端区航迹分析结果。
优选地,所述步骤S1具体包括:
S101:确定待评估机场群集合F={f1,f2,...,fn},其中n为机场群内机场的数目;
S102:选取航迹点特征,所述航迹点特征包括:起飞机场、降落机场、飞行识别码、时间、经度、纬度、速度、高度;
S103:根据f
i(0<i<=n)从ADS-B数据中抽取符合预设条件的数据,构建机场群集合F对应的ADS-B数据集合
其中
E表示所选取航迹点特征的数量,t代表时间间隔;所述预设条件为航迹点时间间隔为10秒,时间跨度为一周。
优选地,所述步骤S2具体包括:
S201:针对每个机场群,根据预计统计时间段的开始日Tstart和结束日Tend,选择[Tstart,Tend],Tend=Tstart+Toneweek作为机场群终端区航迹分析的时间范围;
S202:针对机场群内每个机场,确定对应机场经纬度坐标,根据机场群内各机场终端区划分规则划分距离机场中心200km以内的航迹点作为航迹的构成基础;
S203:针对机场群内每个机场的每一个飞行识别码范围内的航迹点数据,基于终端区规定距离对应机场中心坐标200km筛选航迹点数据获得切割航迹点;
S204:将所述切割航迹点按照时间特征升序排序,按照各机场构建机场群内单条航迹点集合G:
S205:将航迹点特征飞行速度为0的点作为分割点,将航迹点集合G分割为对应机场的两个航迹点,即G={g0,g1};
S206:通过g0,g1中各自点的集合的首位点及末尾点与对应机场的距离比较,将g0,g1标记为对应机场起飞航迹点集合或降落到达航迹点集合;
S207:针对机场群的每一个机场,构建整个机场群的起飞航迹集合Gdep及降落到达航迹集合Garr,获得终端区航迹数据集合G’=Gdep+Garr。
优选地,所述步骤S3具体包括:
S301:根据对应机场规定的终端区标准航迹集,依据fi(0<i<=n)对应的机场四字码选取对应机场标准航迹;
S302:根据标准航迹中识别码获取对机场群内对应机场标准航迹集合S={s0,s1,...,sk},其中k为对应机场规定标准航迹的数目;
S303:根据机场群的现行终端区运行规则,确定机场群共享资源点集合L={li|1≤i≤p},其中p为机场群共享资源点数目;所述共享资源点包括机场群定位点和进离场走廊口点。
优选地,所述步骤S4具体包括:
S401:根据机场群内各机场切割好的航迹集合G'={g′o,g′1,...,g′m},定义聚类数目集合为C={c0,c1,...,c5},其中m为对应机场终端区航迹数目;
S402:从聚类数目集合C中取出一个聚类数目C={C∩ci},ci(0≤i≤5),从G'中随机抽取ci个航迹集合作为初始聚类中心集合Hini={hi|1≤i≤ci}。
S403:针对航迹集合G'中每一条航迹点集g′i,通过公式1计算与聚类中心集合Hini中最近的聚类中心点,并加入该聚类中心点代表的簇,并通过公式1将每个簇内各个向量与质心点集的距离得到当前簇集合间的均方误差vart;所述公式1为:
其中dis地表表示点g′im(g′imx,g′imy)到hi的直线地表距离;
S404:将对现有的聚类结果的每个簇集合求得的中位数航迹作为对应簇新的质心,根据公式1重新计算当前聚类结果的均方误差vart+1;
S405:重复步骤S403、S404,直至vart+1-vart<0.001;
S406:根据聚类评价指标计算轮廓系数矩阵SIL和CH分数矩阵CH;
所述轮廓系数矩阵计算如下:
其中,a(d(i))为数据样本d(i)与其所在簇内其他数据样本的平均距离,b(d(i))为数据样本d(i)与其他簇中数据样本的平均距离;
计算得到轮廓系数矩阵为SIL={sil1,sil2,...,silk};
所述CH分数矩阵计算如下:
对于ci个簇集,当前簇z(1≤z≤ci)的CH分数计算公式如下:
其中,Bz为簇内散度均值,Wz为簇间散度,计算公式分别为:
其中,Tr(Bz)为簇间离差矩阵的迹,Bk为簇间色散平均值,Tr(Wz)为簇内离差矩阵的迹,Wk为簇内色散之间;
S407:利用矩阵SIL和CH,确定最佳聚类数目Kbest;
S408:根据最佳聚类数目Kbest,执行步骤S405得到最终的聚类结果R和质心集合H;所述聚类结果
所述质心集合
其中n为步骤机场群集合内机场的个数。
优选地,所述步骤S403中,dis地表的计算方式具体包括:
S4031:通过经纬度坐标计算确定hi与g′im最近的点坐标为(pim,qim);
S4032:通过公式2计算点到g′im到hi的直线地表距离dis地表,所述公式2为:
dis地表=R*arcos[cos(g′imy)*cos(qim)*cos(g′imx-pim)+sin(g′imy)*sin(qim)]。
优选地,所述步骤S407具体包括:
S4071:对矩阵SIL和CH进行降序排序得到矩阵S'和CH';
S4072:令变量ak初始值为1,遍历矩阵SIL'和CH';
S4073:当top-ak(SIL',CH')为空时,则ak自加1,否则退出遍历,将ak的值赋值给Kbest,此时的Kbest即为最佳聚类数目。
优选地,所述步骤5中所述分析结果具体包括:是否发生拥堵情况、拥堵情况是否影响到机场群共享资源的使用、拥堵情况是否具有管制优化空间。
优选地,所述步骤5具体包括:
S501:根据步骤S3得到的标准航迹集合S,将质心集合H中的每条质心与标准航迹集合S按照公式1进行距离计算,求得每一簇质心对应的距离偏差最短的标准航迹及对应偏差距离;
S502:根据步骤S4得到的聚类结果R,计算机场群内每个机场中每一簇
的三维交叉区域,分析是否发生拥堵情况;
S503:当发生拥堵情况时,根据机场群共享资源点集L,分析拥堵情况是否影响到机场群共享资源的使用;
S504:当拥堵情况影响到机场群共享资源的使用时,根据产生三维交叉区域的对应航迹gi与对应标准航迹si的偏差距离分析是否具有管制优化空间。
优选地,所述步骤502具体包括:
S5021:根据所述公式1计算得出实际航迹点集(g
m,g
n)(1≤m,n≤N),其中N为
内航迹条数;
S5022:时间跨度一分钟内,若gm存在连续超过6个点距离gn的距离小于0.1km,且该6个点的高度差在0.1km之内,则判定为存在三维交叉区域;
S5023:若某簇航迹集
存在三维交叉区域,则判定该簇航迹发生拥堵情况,否则判定该簇航迹未发生拥堵情况。
优选地,所述步骤503具体包括:
S5031:将该6个点互相距离最远的两个点的坐标均值作为圆心,两点对应高度平均值为height,两点之间对应距离作为直径,对应高度为height,将此交叉区域标记为(O,height),产生O的对应航迹gn,最终得到所有的交叉区域集合O及对应产生三维交叉区域的区域-航迹-标准航迹-聚类中心-机场对照表X:X={(Oi,gi,si,hi,fi)|1≤i≤T},其中T为三维交叉区域的数目;
S5032:计算O内各元素与机场群共享资源点集L是否发生交集:若标准航迹点集或L中存在平面上处于O经纬度坐标内的点,并满足该点对应高度与height差值小于0.1km,则判定为发生交集;
S5033:若该簇航迹产生交叉区域O且与L有交集,则判定拥堵情况影响到机场群共享资源的使用;否则判定拥堵情况未影响到机场群共享资源的使用。
优选地,所述步骤504具体包括:
S5041:判断交叉区域集合O中是否存在元素Ok与Oj相交的情况,其中(1≤k,j≤T):若Ok与Oj发生圆面的交集且对应高度height相差小于0.1km,则判断Ok与Oj发生交集;
S5042:当判断Ok与Oj发生交集时,则通过X判断Ok与Oj是否隶属于同一机场;
S5043:若隶属于不同机场则判定为机场间终端区存在拥堵情况Situation1;若隶属于同一机场则判定为机场间终端区存在拥堵情况Situation0;
S5044::根据产生三维交叉区域O的对应航迹gi与对应标准航迹si的偏差距离进行机场终端区管制分析:若偏差距离大于10km,则针对Situation0或Situation1判定为具有管制优化空间,否则判定为没有管制优化空间。
本发明还提出一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行上述机场群终端区航迹分析方法。
与现有技术相比,本发明具有以下的优点:
(1)本发明提供了一种基于K-means聚类算法的机场群终端区航迹分析方法,有效地对终端区航迹进行聚类,并提供了一种自定义计算航迹间距离的方式,帮助更科学、程序化地对终端区航迹进行处理、分析。
(2)本发明使用实际的ADS-B数据,保证了所提出方法的客观性,并提供了一种区分机场群航迹终端区航迹点集的自定义规则,帮助更程序化地将ADS-B数据转化为可分析、处理数据。
(3)本发明首先基于K-means聚类结果提供了一种定义航迹三维交叉区域的快速计算方法,接着将航迹对应簇的最近标准航迹与之作对比分析,提高了机场群终端区航迹分析的效率及科学性。
本发明中基于改进的K-means聚类算法对机场群内各机场终端区航迹进行处理并与规定标准航迹进行评估,做到更程序化、科学地评估。另外,在对比标准航迹与对应机场的实际航迹地聚类中心航迹时,结合机场群中的竞争资源点的情况定量分析机场群内各机场的终端区航迹,便于决策者、管理者更好的分析与评估机场群主要资源点的拥堵情况。
具体实施方式
如图1所示,图1为本发明实施例一种基于聚类的机场群终端区航迹分析方法的流程示意图;
在本发明实施例中,将以基于上海机场群20XX年10月的实际ADS-B数据作为案例,对发明的技术方案做出进一步的描述。
参照图1,本发明实施例提出的一种基于聚类的机场群终端区航迹分析方法,包括:
S1:确定待评估机场群集合F及航迹点特征,获取机场群ADS-B航迹点数据集合D;
S2:根据终端区的切分规则并结合ADS-B航迹点数据集合D的粒度及对应机场坐标,通过自定义规则区分终端区实际航迹的起飞降落情况将所有航迹进行分类处理,得到处理后的终端区航迹数据集合G';
S3:根据待评估机场群集合F,结合终端区运行规则,构建机场群终端区标准航迹集合S和机场群共享资源点集合L;
S4:基于改进的K-means算法对终端区航迹数据集合G'进行聚类,依据聚类指标确定最佳聚类数目并获得聚类结果R;
S5:根据聚类结果R计算三维交叉区域,结合标准航迹集合S和机场群共享资源点集合L获得机场群终端区航迹分析结果。
在本发明实施例中,将以上海机场群20XX年10月的ADS-B数据作为基础,对发明的技术方案做出进一步的描述。
在步骤S1中,其具体包括:
S101:确定待评估机场群集合F={f1,f2,...,fn},其中n为机场群内机场的数目;
S102:选取航迹点特征,所述航迹点特征包括:起飞机场、降落机场、飞行识别码、时间、经度、纬度、速度、高度;
S103:根据f
i(0<i<=n)从ADS-B数据中抽取符合预设条件的数据,构建机场群集合F对应的ADS-B数据集合
其中
E表示所选取航迹点特征的数量,t代表时间间隔;所述预设条件为航迹点时间间隔为10秒,时间跨度为一周。
本发明实施例中,根据步骤是S101,通过多维指标考虑机场群终端区航迹情况,选取航迹点指标:起飞机场、降落机场、飞行识别码、时间、经度、纬度、速度、高度。并确定航迹点时间间隔为10秒,时间跨度为一周,接着确定机场群集合F={f1,f2,...,fn},其中n为机场群内机场的数目。根据fi(0<i<=n)从总ADS-B数据中抽取对应数据,从而构建得到机场群集合对应的ADS-B数据集。
如表1所示,表1为本实施例上海机场群的情况:
表1 机场群
在步骤S2中,其具体包括:
S201:针对每个机场群,根据预计统计时间段的开始日Tstart和结束日Tend,选择[Tstart,Tend],Tend=Tstart+Toneweek作为机场群终端区航迹分析的时间范围;
S202:针对机场群内每个机场,确定对应机场经纬度坐标,根据机场群内各机场终端区划分规则划分距离机场中心200km以内的航迹点作为航迹的构成基础;
S203:针对机场群内每个机场的每一个飞行识别码范围内的航迹点数据,基于终端区规定距离对应机场中心坐标200km筛选航迹点数据获得切割航迹点;
S204:将所述切割航迹点按照时间特征升序排序,按照各机场构建机场群内单条航迹点集合G;
S205:将航迹点特征飞行速度为0的点作为分割点,将航迹点集合G分割为对应机场的两个航迹点,即G={g0,g1};
S206:通过g0,g1中各自点的集合的首位点及末尾点与对应机场的距离比较,将g0,g1标记为对应机场起飞航迹点集合或降落到达航迹点集合;
S207:针对机场群的每一个机场,构建整个机场群的起飞航迹集合Gdep及降落到达航迹集合Garr,获得终端区航迹数据集合G’=Gdep+Garr。
本发明实施例中,根据步骤S201,针对每个机场,根据预计统计时间段的开始日(20XX年10月1日0点)和结束日(20XX年10月7日24点)作为机场终端区航迹分析的时间范围。
接着根据S202针对每个机场,确定机场经纬度坐标,根据机场终端区划分规则划分距离机场中心200KM以内地航迹点作为航迹的构成基础。然后根据步骤S203切割航迹点。
根据步骤S204针对每个机场的每一个飞行识别码范围内的航迹点数据,基于终端区规定距离对应机场中心坐标200KM筛选航迹点数据并将所切割航迹点按照时间特征升序排序。
再根据步骤(S205、S206、S207)针对每一条航迹数据点集,从而构建机场群内对应机场的起飞航迹集合及降落到达航迹集。
如表2所示,表2为上海机场群内虹桥机场某条起飞航迹。
表2 上海机场群内虹桥机场某条起飞航迹(部分)
在步骤S3中,其具体包括:
S301:根据对应机场规定的终端区标准航迹集,依据fi(0<i<=n)对应的机场四字码选取对应机场标准航迹;
S302:根据标准航迹中识别码获取对机场群内对应机场标准航迹集合S={s0,s1,...,sk},其中k为对应机场规定标准航迹的数目;
S303:根据机场群的现行终端区运行规则,确定机场群共享资源点集合L={li|1≤i≤p},其中p为机场群共享资源点数目;所述共享资源点包括机场群定位点和进离场走廊口点。
S4:基于改进的K-means算法对终端区航迹数据集合G'进行聚类,依据聚类指标确定最佳聚类数目并获得聚类结果R。
在步骤S4中,其具体包括:
S401:根据机场群内各机场切割好的航迹集合G'={g′o,g′1,...,g′m},定义聚类数目集合为C={c0,c1,...,c5},其中m为对应机场终端区航迹数目;
S402:从聚类数目集合C中取出一个聚类数目C={C∩ci},ci(0≤i≤5),从G'中随机抽取ci个航迹集合作为初始聚类中心集合Hini={hi|1≤i≤ci}。
S403:针对航迹集合G'中每一条航迹点集g′i,通过公式1计算与聚类中心集合Hini中最近的聚类中心点,并加入该聚类中心点代表的簇,并通过公式1将每个簇内各个向量与质心点集的距离得到当前簇集合间的均方误差vart;
其中公式1的具体示意图如图2所示,所述公式1为:
其中,dis地表表示点g′im(g′imx,g′imy)到hi的直线地表距离;其中,dis地表的计算方式具体包括:
S4031:通过经纬度坐标计算确定hi与g′im最近的点坐标为(pim,qim);
S4032:通过公式2计算点到g′im到hi的直线地表距离dis地表,所述公式2为:
dis地表=R*arcos[cos(g′imy)*cos(qim)*cos(g′imx-pim)+sin(g′imy)*sin(qim)]。
S404:将对现有的聚类结果的每个簇集合求得的中位数航迹作为对应簇新的质心,根据公式1重新计算当前聚类结果的均方误差vart+1;
S405:重复步骤S403、S404,直至vart+1-vart<0.001;
S406:根据聚类评价指标计算轮廓系数矩阵SIL和CH分数矩阵CH;
所述轮廓系数矩阵计算如下:
其中,a(d(i))为数据样本d(i)与其所在簇内其他数据样本的平均距离,b(d(i))为数据样本d(i)与其他簇中数据样本的平均距离;
计算得到轮廓系数矩阵为SIL={sil1,sil2,...,silk};
所述CH分数矩阵计算如下:
对于ci个簇集,当前簇z(1≤z≤ci)的CH分数计算公式如下:
其中,Bz为簇内散度均值,Wz为簇间散度,计算公式分别为:
其中,Tr(Bz)为簇间离差矩阵的迹,Bk为簇间色散平均值,Tr(Wz)为簇内离差矩阵的迹,Wk为簇内色散之间;
S407:利用矩阵SIL和CH,确定最佳聚类数目Kbest;
需要说明的是,步骤S407具体包括:
S4071:对矩阵SIL和CH进行降序排序得到矩阵S'和CH';
S4072:令变量ak初始值为1,遍历矩阵SIL'和CH';
S4073:当top-ak(SIL',CH')为空时,则ak自加1,否则退出遍历,将ak的值赋值给Kbest,此时的Kbest即为最佳聚类数目。
S408:根据最佳聚类数目Kbest,执行步骤S405得到最终的聚类结果R和质心集合H;所述聚类结果
所述质心集合
其中n为步骤机场群集合内机场的个数。
本发明实施例中,根据S301对应机场规定的终端区标准航迹集,依据表1对应的机场四字码选取对应机场标准航迹。然后根据S302将对应机场标准航迹识别码(以20XX年10月终端区实际管理规则为基准),得到机场群内对应机场标准航迹集;紧接着根据步骤S4计算出轮廓系数矩阵及CH值矩阵确定ZSSS起飞航迹的最佳聚类数目为3,得到虹桥机场起飞航迹的最终聚类结果,聚类结果及对应航迹点与聚类中心点对应偏差如表3所示,部分聚类中心结果如表4所示,聚类中心与对应最短标准航迹及其偏差结果如表5所示。
浦东机场的起飞航迹聚类结果同理可见表6-表8,其中,表6为浦东机场部分起飞航迹聚类结果;表7为浦东机场部分聚类中心点集;表8为浦东机场起飞航迹聚类中心对应部分最短标准航迹。降落航迹的分析同理。
表3 虹桥机场起飞航迹聚类结果(部分)
表4 虹桥机场聚类中心点集(部分)
表5 虹桥机场起飞航迹聚类中心对应最短标准航迹
表6 浦东机场起飞航迹聚类结果(部分)
表7 浦东机场聚类中心点集(部分)
表8 浦东机场起飞航迹聚类中心对应最短标准航迹(部分)
S5:根据聚类结果R计算三维交叉区域,结合标准航迹集合S和机场群共享资源点集合L获得机场群终端区航迹分析结果。
本发明实施例中,所述分析结果具体包括:是否发生拥堵情况、拥堵情况是否影响到机场群共享资源的使用、拥堵情况是否具有管制优化空间。
在步骤S2中,其具体包括:
S501:根据步骤S3得到的标准航迹集合S,将质心集合H中的每条质心与标准航迹集合S按照公式1进行距离计算,求得每一簇质心对应的距离偏差最短的标准航迹及对应偏差距离;
S502:根据步骤S4得到的聚类结果R,计算机场群内每个机场中每一簇
的三维交叉区域,分析是否发生拥堵情况;
所述步骤502具体包括:
S5021:根据所述公式1计算得出实际航迹点集(g
m,g
n)(1≤m,n≤N),其中N为
内航迹条数;
S5022:时间跨度一分钟内,若gm存在连续超过6个点距离gn的距离小于0.1km,且该6个点的高度差在0.1km之内,则判定为存在三维交叉区域;
S5023:若某簇航迹集
存在三维交叉区域,则判定该簇航迹发生拥堵情况,否则判定该簇航迹未发生拥堵情况。
S503:当发生拥堵情况时,根据机场群共享资源点集L,分析拥堵情况是否影响到机场群共享资源的使用;
所述步骤503具体包括:
S5031:将该6个点互相距离最远的两个点的坐标均值作为圆心,两点对应高度平均值为height,两点之间对应距离作为直径,对应高度为height,将此交叉区域标记为(O,height),产生O的对应航迹gn,最终得到所有的交叉区域集合O及对应产生三维交叉区域的区域-航迹-标准航迹-聚类中心-机场对照表X:X={(Oi,gi,si,hi,fi)|1≤i≤T},其中T为三维交叉区域的数目;
S5032:计算O内各元素与机场群共享资源点集L是否发生交集:若标准航迹点集或L中存在平面上处于O经纬度坐标内的点,并满足该点对应高度与height差值小于0.1km,则判定为发生交集;
S5033:若该簇航迹产生交叉区域O且与L有交集,则判定拥堵情况影响到机场群共享资源的使用;否则判定拥堵情况未影响到机场群共享资源的使用。
S504:当拥堵情况影响到机场群共享资源的使用时,根据产生三维交叉区域的对应航迹gi与对应标准航迹si的偏差距离分析是否具有管制优化空间。
所述步骤504具体包括:
S5041:判断交叉区域集合O中是否存在元素Ok与Oj相交的情况,其中(1≤k,j≤T):若Ok与Oj发生圆面的交集且对应高度height相差小于0.1km,则判断Ok与Oj发生交集;
S5042:当判断Ok与Oj发生交集时,则通过X判断Ok与Oj是否隶属于同一机场;
S5043:若隶属于不同机场则判定为机场间终端区存在拥堵情况Situation1;若隶属于同一机场则判定为机场间终端区存在拥堵情况Situation0;
S5044::根据产生三维交叉区域O的对应航迹gi与对应标准航迹si的偏差距离进行机场终端区管制分析:若偏差距离大于10km,则针对Situation0或Situation1判定为具有管制优化空间,否则判定为没有管制优化空间。
本发明实施例中,根据表2至表8所示浦东机场及虹桥机场对应的聚类簇根据步骤S502计算对应簇是否发生三维交叉区域情况,根据步骤S503计算三维交叉区域与机场群的共享资源集合L有交集。根据浦东机场及虹桥机场对应的聚类簇结果计算,其中虹桥机场的三维交叉区域与机场群共享资源点存在交集点(对应资源点坐标(121.1789,31.401394)),通过计算得出产生三维交叉区域的航迹(对应聚类簇0中第一条航迹)与对应标准航迹(对应第4条标准航迹)偏差为0.62km,小于10km,得出不能从管制的角度去优化该拥堵问题。
然后根据步骤S504判断浦东机场与虹桥机场的航迹簇之间的三维交叉区域是否发生交集。即机场群内机场终端区未发生交错拥堵。即针对上海机场群分析得出:1)针对机场竞争资源点发生拥堵;2)机场群内机场终端区的发生交错拥堵两种情况是否发生,若发生是否具有管制优化空间。
在本发明实施例中,通过采取上海机场群20XX年10月的ADS-B数据进行分析,保证了所提出方法的客观性,并提供了一种区分机场群航迹终端区航迹点集的自定义规则,帮助更程序化地将ADS-B数据转化为可分析、处理数据。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。