CN116307682A - 一种考虑多元指标的机场航线网络失稳状态综合评价方法 - Google Patents
一种考虑多元指标的机场航线网络失稳状态综合评价方法 Download PDFInfo
- Publication number
- CN116307682A CN116307682A CN202211724151.2A CN202211724151A CN116307682A CN 116307682 A CN116307682 A CN 116307682A CN 202211724151 A CN202211724151 A CN 202211724151A CN 116307682 A CN116307682 A CN 116307682A
- Authority
- CN
- China
- Prior art keywords
- airport
- clustering
- data set
- index
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 54
- 230000000694 effects Effects 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 8
- 230000010006 flight Effects 0.000 claims description 39
- 230000002159 abnormal effect Effects 0.000 claims description 32
- 238000003064 k means clustering Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000013459 approach Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000007547 defect Effects 0.000 abstract description 6
- 238000004422 calculation algorithm Methods 0.000 description 10
- 206010033799 Paralysis Diseases 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 230000001934 delay Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000013210 evaluation model Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000001687 destabilization Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft, e.g. air-traffic control [ATC]
- G08G5/003—Flight plan management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Aviation & Aerospace Engineering (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种考虑多元指标的机场航线网络失稳状态综合评价方法,该方法包括步骤1,构建机场航班数据集;步骤2,根据机场航班数据集计算机场多元指标,对机场多元指标数值进行处理,获得多元指标数据集;步骤3,将多元指标数据集中的数据进行聚类,根据聚类效果确定最终聚类分组数;步骤4,根据最终聚类分组数计算机场航线网络失稳状态评价阈值。该方法能够克服传统模型评价指标较为单一且无法对多元用户进行评价体系精细化分的缺陷。综上,本发明在综合评价航线网络失稳状态、针对多元用户场景评价航线网络失稳状态方面具有实际的工程运用价值。
Description
技术领域
本发明涉及一种用于评价机场航线网络稳定状态的综合评价方法,具体涉及一种考虑多元指标的机场航线网络失稳状态综合评价方法。
背景技术
随着世界民航业的快速发展、我国民航强国战略的提出和航空出行需求的不断增加,国内民用航空体系也逐渐成熟,民航旅客运输量逐年攀升,我国已成为第二大民用航空市场。2019年,全行业完成旅客运输量65993.42万人次,比上年增长7.9%。目前民航航班量持续高位运行,保障系统满负荷运转,运行风险累积叠加,航班正点率仍然难以提升。2019年飞常准发布的《境内民航机场发展报告》指出,2019年境内机场整体出港准点率仅为69.39%,出港平均延误时长达28.16分钟。航班延误是航空公司经营、机场运行、空管调度时三方关注的重点,但目前对于影响航班延误的前序后序流程和延误传播机理尚未剖析清楚,这已经成为制约民用航空业服务质量的主要瓶颈。因此,在民航业快速发展的大流中研究如何减少航班延误以获得更有质量的旅客服务率具有现实意义。
当下,研究人员针对航班延误问题进行了大量研究并提出了多种解决办法。从空中交通流量管理角度,通过地面等待策略、改航、终端区排序等方面来降低航班延误;从航班时刻优化角度,经过战略层面和预战术层面的优化,能够快速提高机场和空域稀缺资源的利用率,满足需求和容量之间的平衡关系,从源头上减少潜在的延误,并能够增加机场新的流量,满足需求日益增长的要求。
然而,在实现本发明过程中,发明人发现现有技术中至少存在如下问题:目前研究者所考虑的延误问题虽满足了航班基本的运行限制条件,也考虑了航空公司的利益及公平性,却没有考虑机场航线网络的延误失稳传播。机场网络是一个复杂的网络,机场之间通过航线连接,在资源上具有连接性,航班初始延误将可能引起目的地机场航班延误,并且延误将可能蔓延到其它关联机场,从而导致初始延误在整个机场网络中进行传播。考虑机场航线网络的延误失稳传播,不仅有助于减少机场的延误,还有助于减少优化机场的延误对其他机场的延误所造成的影响。而要对延误传播进行研究,首先需要判断航线网络的稳定状态。近年来,不少研究提出了航线网络失稳状态的评价方法,然而,这些评价方法多基于一项评价指标确定整个航线网络的失稳状态,评价维度较为单一,同时,这些评价方法未考虑不同地区、不同时间和不同用户间的差异,无法针对不同用户进行差异化评价。因此,寻求一种基于多元指标并面向多元用户的航线网络失稳状态综合评价方法,具有较高的理论意义、社会效益和实用价值。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提出一种考虑多元评价指标并面向多元用户场景的航线网络失稳状态综合评价方法。
为了解决上述技术问题,本发明公开了一种考虑多元指标的机场航线网络失稳状态综合评价方法,包括以下步骤:
步骤1,构建机场航班数据集;
步骤2,根据机场航班数据集计算机场多元指标,并对机场多元指标数值进行处理,获得多元指标数据集;
步骤3,将多元指标数据集中的数据进行聚类,根据聚类效果确定最终聚类分组数;
步骤4,根据最终聚类分组数计算机场航线网络失稳状态评价阈值。
进一步地,步骤1包括:采集某一地区原始的历史航班数据集,对历史航班数据集进行清洗,筛选出不含有空缺值和残缺值的数据;对筛选后的数据提取包括航班号、出发机场、到达机场、计划起飞时间、计划到达时间、实际起飞时间和实际到达时间在内的字段数据,从而获得机场航班数据集。针对不同地区、不同时间、不同用户等多使用场景采集不同的历史航班数据集能够获得不同的航线网络失稳状态评价阈值。
进一步地,步骤2中所述机场多元指标包括机场饱和度、起飞准点率和航班平均延误时间,步骤2包括:
步骤2.1,将机场航班数据集划分为相同的时间段,计算每个时间段的机场饱和度、起飞准点率和航班平均延误时间;
步骤2.2,对步骤2.1获得的每一种指标的数值进行异常值剔除;
步骤2.3,对剔除异常值后的每一种指标的数值进行标准化,获得多元指标数据集,所述多元指标数据集中的每条数据均为三维数据,包括同一时间段的机场饱和度、起飞准点率和航班平均延误时间三个维度。
进一步地,步骤2.2利用箱型图对每一种指标的数值进行异常值剔除,包括利用箱型图判断每一种指标的数值中的五个统计量,即最小值、第一四分位数、中位数、第三四分位数与最大值,超出箱型图最大值和最小值的指标数值即为异常值;同一个时间段三种指标的数值有一个以上的异常值,则该时间段三种指标的数值都被剔除。
箱型图是一种用作显示一组数据分散情况资料的统计图,常见于品质管理,快速识别异常值。最大的优点在于可以直观明了地识别数据批中的异常值,异常值不会影响箱形图的数据形状,箱型图识别异常值的结果比较客观。本步骤选取箱型图,可以快速稳定地描绘出航线网络状态的离散分布情况,准确剔除异常值。
进一步地,步骤2.3利用Min-Max标准化对剔除异常值后的每一种指标的数值进行标准化,数据标准化是指将数据按比例缩放,使之落入一个小的特定区间,以去除数据的单位限制,转化为量纲的纯数值,便于不同单位或数量级的指标能够进行比较和加权。记剔除异常值后的每一种指标的数值为序列x1,x2,…,xJ,J表示多元指标数据集中数据总条数,进行标准化后的序列对应为y1,y2,…,yJ,
对序列x1,x2,…,xJ进行如下公式的标准化变换:
则新序列y1,y2,…,yJ∈[0,1]且无量纲。
Min-Max标准化可以将数据按比例缩放,使之落入一个小的特定区间,去除数据的单位限制,转化为量纲的纯数值,便于不同单位或数量级的指标能够进行比较和加权。本步骤选取Min-Max标准化,可以使得饱和度、起飞准点率、航班平均延误时间三类不同维度之间的特征在数值上有一定比较性,大大提高聚类算法的准确性和运算效率。
进一步地,步骤3中将多元指标数据集中的数据进行聚类采用K-means聚类,包括:
步骤3.1,将多元指标数据集中的数据分为K组,即聚类数设置为K,K≥1,从多元指标数据集中随机选取K个对象作为初始的聚类中心;
步骤3.2,计算多元指标数据集中每个对象与各聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心;聚类中心以及分配给它们的对象就代表一个类,每分配一个对象,聚类的聚类中心会根据聚类中现有的对象被重新计算;
步骤3.3,重复执行步骤3.2,当聚类迭代满足终止条件时,样本对象将不再被重新分配给新的聚类,所述终止条件包括当聚类中心不再发生变化时。
K-Means聚类算法能克服少量样本聚类的不准确性,具有优化迭代功能,在已经求得的聚类上再次进行迭代修正剪枝确定部分样本的聚类,大大降低总的聚类时间复杂度。同时相较于其他聚类算法,K-Means聚类算法可以直观的输出聚类中心,为本申请所述考虑多元指标的机场航线网络失稳状态综合评价方法中获取航线网络失稳状态的阈值提供了判别依据。
进一步地,步骤3中根据聚类效果确定最终聚类分组数包括:采用轮廓系数对不同聚类数K下的聚类效果进行评价,轮廓系数是聚类效果好坏的一种评价方式,通过结合内聚度和分离度两种因素,轮廓系数可以评价不同算法或相同算法的不同运行方式对聚类结果产生的影响。计算在不同聚类数K下的轮廓系数值S,如下所示:
其中a(i)代表多元指标数据集中的第i条数据到所有它属于的簇中其它点的平均距离,b(i)代表第i条数据到其他簇内的所有点的平均距离;S的值趋近于1代表内聚度和分离度都相对较优,聚类效果好,对应的聚类数K即为最终聚类分组数。
轮廓系数优点在于对数据的分布没有具体假设,因此在很多数据集上都有良好的表现,在本申请中,可以为航线网络失稳状态的聚类效果评价提供较为鲁棒的结论。
进一步地,步骤4包括:根据最终聚类分组数和各机场民航局技术规范文件确定用于机场航线网络失稳状态评价的聚类,计算该聚类对应的聚类中心,根据所述聚类中心对应的机场饱和度、起飞准点率和航班平均延误时间确定机场航线网络失稳状态评价阈值。
聚类中心反映了较长一段历史时间内,航线网络状态的大致聚合程度和分布情况。通过比较各个聚类中心所对应的饱和度、起飞准点率以及航班平均延误时间,可以对航线网络状态水平进行划分。结合实际应用需求,选取失稳水平下的聚类中心即可表征航线网络失稳状态的判别阈值,该方法较为直观,实际操作方便易行。
进一步地,步骤2.1计算每个时间段的机场饱和度包括:时刻t的机场饱和度s(t)使用如下公式表示:
其中,Q(t)为时间段内的进港流量;C(t)为/>时间段内的机场容量/>为设置的时间区间;针对机场容量,根据国家民航空管局的技术规范文件对机场时刻容量评估技术的规定,采用基于历史统计数据的容量评估方式,通过对历史航班数据的评估与分析,确定各个机场的时刻容量C(t);同时,基于历史航班数据统计进离港航班数量,确定各个机场的时刻进港流量Q(t)。一旦饱和度大于等于1,就代表机场节点已经超负荷运行,机场有着很大的运行瘫痪风险,随之会导致它的负载分流到其他机场上,进而导致其他机场的负荷相应升高,从而出现网络节点级联失效瘫痪的问题。
进一步地,步骤2.1计算每个时间段的起飞准点率包括:时刻t的起飞准点率NRR(t)使用如下公式表示:
步骤2.1计算每个时间段的航班平均延误时间包括:时刻t的航班平均延误时间AFD(t)使用如下公式表示:
有益效果:本发明提出的考虑多评价指标并面向多元用户使用场景的航线网络失稳状态综合评价方法,不仅考虑了多重因素对航线网络失稳状态的影响,还采用K-means聚类方法,针对不同地区、不同时间、不同用户等多使用场景,提出适合于本场景的航线网络失稳状态评价阈值。本发明的优势在于综合考虑多元评价指标,如饱和度、正常放行率、平均延误时间等,克服传统评价模型仅考虑单一评价指标的不足,同时,针对不同用户的不同使用场景,本发明可以提出适合于本用户使用场景下的航线网络失稳状态评价方法,因而能够克服传统评价模型无法对多元用户进行评价体系精细化分的缺陷。综上,本发明在综合评价航线网络失稳状态、针对多元用户场景评价航线网络失稳状态方面具有实际的工程运用价值。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1为本申请实施例提出的一种考虑多元指标的机场航线网络失稳状态综合评价方法的航线网络失稳状态评价指标体系示意图;
图2为本申请实施例提出的一种考虑多元指标的机场航线网络失稳状态综合评价方法的流程图。
图3为本申请实施例提出的一种考虑多元指标的机场航线网络失稳状态综合评价方法中华东地区航线网络失稳评价指标聚类结果。
具体实施方式
下面将结合附图,对本发明的实施例进行描述。
如图2所示,本申请实施例公开了一种考虑多元指标的机场航线网络失稳状态综合评价方法,包括以下步骤:
步骤1,构建机场航班数据集,包括采集某一地区原始的历史航班数据集,首先对原始的历史航班数据集进行清洗,利用Python编程语言筛选出不含有空缺值和残缺值的数据。通过观察数据发现,原始的历史航班数据集中包含有大量与本实施例无关的字段,如机型、航空公司、航空器注册号等,这些无关字段可能会对后续计算产生不必要的干扰或降低计算机的运算效率,因此,仅提取适用于本实施例的部分字段显得尤为重要。本实施例所需要的数据字段包括航班号、出发机场、到达机场、计划起飞时间、计划到达时间、实际起飞时间、实际到达时间等,这些字段的数据组成机场航班数据集,在接下来将被用于航线网络失稳状态评价指标的计算。
步骤2,根据机场航班数据集计算机场多元指标,并对机场多元指标数值进行处理,获得多元指标数据集;如图1所示,所述机场多元指标包括机场饱和度、起飞准点率和航班平均延误时间,
机场饱和度(S,Saturation)能够描述网络节点机场的负载情况与运行的状态,在空间维度上侧重描述网络的运行安全。一旦饱和度大于等于1,就代表机场节点已经超负荷运行,机场有着很大的运行瘫痪风险,随之会导致它的负载分流到其他机场上,因而会导致其他机场的负荷相应升高,从而出现网络节点级联失效瘫痪的问题。因此,机场饱和度在一定程度上能够反应出机场运行的安全情况。
起飞准点率(NRR,Normal Release Rate)是指某个机场准点起飞的航班量与离场航班总量的比值,研究通常将实际起飞时间超过预计起飞时间15分钟的航班视作不正常航班。
航班平均延误时间(AFD,Average Flight Delay)表示某个机场中所有航班延误时长与进离场航班总量的比值。航班平均延误时间作为时间维度的局部因素,可以用来直接体现网络运行效率。
步骤2.1,将机场航班数据集划分为相同的时间段,计算每个时间段的机场饱和度、起飞准点率和航班平均延误时间;
计算每个时间段的饱和度包括:时刻t的机场饱和度s(t)如公式(1)所示:
其中,Q(t)为时间段内的进港流量;C(t)为/>时间段内的机场容量,/>为设置的时间区间,取决于流量统计的标准,例如流量统计设置为15分钟则/>设置为15分钟。针对机场容量,根据国家民航空管局的技术规范文件对机场时刻容量评估技术的规定,本实施例采用基于历史统计数据的容量评估方式,通过对历史航班数据的评估与分析,确定各个机场的时刻容量C(t)。同时,可基于历史航班数据统计进离港航班数量,确定各个机场的时刻进港流量Q(t)。一旦饱和度大于等于1,就代表机场节点已经超负荷运行,机场有着很大的运行瘫痪风险,随之会导致它的负载分流到其他机场上,进而导致其他机场的负荷相应升高,从而出现网络节点级联失效瘫痪的问题。
计算每个时间段的起飞准点率包括:时刻t的起飞准点率NRR(t)如公式(2)所示:
其中,N(t)为时间段内的离场航班数量,n(t)代表/>时间段内的不正常航班量,本实施例将实际起飞时间超过预计起飞时间15min的航班视作不正常航班,通过比较各个机场的起飞准点率,分析各机场的失稳状态。
计算每个时间段的航班平均延误时间包括:时刻t的航班平均延误时间AFD(t)如公式(3)所示:
步骤2.2,对步骤2.1获得的每一种指标的数值进行异常值剔除;在完成对某地区历史航班信息分别计算上述三个指标后,本实施例对计算后的指标进行异常值剔除。利用箱型图判断数据中的五个统计量,即最小值、第一四分位数、中位数、第三四分位数与最大值,超出箱型图上限最大值和下限最小值的指标即为异常值;同一个时间段三种指标的数值有一个以上的异常值,则该时间段三种指标的数值都被剔除。
步骤2.3,对剔除异常值后的每一种指标的数值进行标准化,获得多元指标数据集,所述多元指标数据集中的每条数据均为三维数据,包括同一时间段的机场饱和度、起飞准点率和航班平均延误时间三个维度。
数据标准化是指将数据按比例缩放,使之落入一个小的特定区间,以去除数据的单位限制,转化为量纲的纯数值,便于不同单位或数量级的指标能够进行比较和加权,本实施例采用Min-Max标准化对数据进行处理,记剔除异常值后的每一种指标的数值为序列x1,x2,…,xJ,J表示多元指标数据集中数据总条数,进行标准化后的序列对应为y1,y2,…,yJ,
对序列x1,x2,…,xJ进行如公式(4)所示的变换:
则新序列y1,y2,…,yJ∈[0,1]且无量纲。
步骤3,将多元指标数据集中的数据进行聚类,根据聚类效果确定最终聚类分组数;
聚类是在数据挖掘的过程中按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。K-均值聚类(K-Means聚类)算法通过不断迭代得到聚类中心和属于该类的样本。算法在迭代的过程中将数据集中在某些方面相似的数据进行分类组织,从而发现数据内在的结构联系。K-均值聚类的原理简单,可解释度较强,容易借助编程实现,并且操作原理简单易懂。
将多元指标数据集中的数据进行聚类采用K-means指标聚类:
步骤3.1,将多元指标数据集中数据分为K组,即聚类数设置为K,K≥1,从多元指标数据集中随机选取K个对象作为初始的聚类中心。
步骤3.2,计算多元指标数据集中每个对象与各聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。本实施例中每个对象与各聚类中心之间的距离采用欧几里得距离。聚类中心以及分配给它们的对象就代表一个类,每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算,根据聚类中的现有对象进行平均获得新的聚类中心。
步骤3.3,重复执行步骤3.2,当聚类迭代满足某个终止条件时,样本对象就将不再被重新分配给新的聚类,这个终止条件一般是当聚类中心不再发生变化时。
根据聚类效果确定最终聚类分组数包括:轮廓系数是聚类效果好坏的一种评价方式。通过结合内聚度和分离度两种因素,轮廓系数可以评价不同算法或相同算法的不同运行方式对聚类结果产生的影响。因此,本实施例采用轮廓系数对不同聚类数K下的聚类效果进行评价。通过公式(5):
计算在不同聚类数下的轮廓系数值S,其中a(i)代表多元指标数据集中的第i条数据到所有它属于的簇中其它点的平均距离,b(i)代表第i条数据到其他簇内的所有点的平均距离。S的值越趋近于1代表内聚度和分离度都相对较优,聚类效果好,对应的聚类数K即为最终聚类分组数。
步骤4,根据最终聚类分组数计算机场航线网络失稳状态评价阈值:根据最终聚类分组数和各机场民航局技术规范文件确定用于机场航线网络失稳状态评价的聚类,计算该聚类对应的聚类中心,依据聚类中心点所对应的饱和度、准点率和平均延误时间,作为航线网络失稳的状态判别阈值。
本实施例对华东地区2019年7月至9月所有航班数据进行采集,并进行以下操作:
步骤1,构建机场航班数据集:在对原始数据集进行数据清洗和特征值提取后,最终所构建的数据集共包含479805条数据,部分数据如表1所示:
表1构建数据集中的部分数据
其中,“Callsign”代表航班号,“Depaddr”代表出发机场,“Arraddr”代表到达机场,“Etd”和“Eta”代表计划起飞和到达时间,“Atd”和“Ata”代表实际起飞和到达时间。
步骤2.1,将机场航班数据集划分为相同的时间段,计算每个时间段的机场饱和度、起飞准点率和航班平均延误时间;
步骤2.2,对步骤2.1获得的每一种指标的数值进行异常值剔除;
步骤2.3,对剔除异常值后的每一种指标的数值进行标准化,获得多元指标数据集,所述多元指标数据集中的每条数据均为三维数据,包括同一时间段的机场饱和度、起飞准点率和航班平均延误时间三个维度。对计算后的指标进行异常值剔除和数据标准化,数据集中部分数据的处理结果如表2所示:
表2异常值剔除及标准化后的部分数据
其中,S表示饱和度,AFD表示航班平均延误时间,NRR表示起飞准点率。
步骤3,将多元指标数据集中的数据进行K-means特征聚类,基于欧几里得距离公式在三维空间中对多元指标数据集中的样本数据进行聚类。
轮廓系数评价聚类效果,根据聚类效果确定最终聚类分组数:采用轮廓系数对不同聚类数设置下的聚类效果进行评价,通过对比不同聚类数下的轮廓系数取值,最终确定将聚类数设置为5,如图3所示的5种不同颜色的聚类。
步骤4,根据最终聚类分组数计算机场航线网络失稳状态评价阈值:基于聚类的输出结果(图3所示),依据聚类中心点所对应的饱和度、准点率和平均延误时间,作为航线网络失稳的状态判别阈值。在本实施例中,选取聚类数的中间数即第三簇(蓝色簇)的聚类中心:饱和度大于0.8,正常放行率小于0.6,航班平均延误时间大于15分钟,作为该实例中航线网络的失稳判别指标。
本发明提出的考虑多评价指标并面向多元用户场景的航线网络失稳状态综合评价方法,不仅综合了多重因素对航线网络失稳状态的影响,还采用K-means聚类方法,针对不同用户场景提出航线网络失稳状态评价阈值。本发明综合多元评价指标体系,包括饱和度、起飞准点率、航班平均延误时间,以克服了传统评价模型仅考虑单一评价指标的不足,同时,本发明提出适合于多元用户使用场景的航线网络失稳状态评价方法,填补了传统评价模型无法对多元用户进行评价体系精细化分的不足。综上,本发明在综合评价航线网络失稳状态、针对多元用户场景评价航线网络失稳状态方面具有实际的工程运用价值。
具体实现中,本申请提供计算机存储介质以及对应的数据处理单元,其中,该计算机存储介质能够存储计算机程序,所述计算机程序通过数据处理单元执行时可运行本发明提供的一种考虑多元指标的机场航线网络失稳状态综合评价方法的发明内容以及各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,ROM)或随机存储记忆体(random access memory,RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术方案可借助计算机程序以及其对应的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机程序即软件产品的形式体现出来,该计算机程序软件产品可以存储在存储介质中,包括若干指令用以使得一台包含数据处理单元的设备(可以是个人计算机,服务器,单片机,MUU或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本发明提供了一种考虑多元指标的机场航线网络失稳状态综合评价方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (10)
1.一种考虑多元指标的机场航线网络失稳状态综合评价方法,其特征在于,包括以下步骤:
步骤1,构建机场航班数据集;
步骤2,根据机场航班数据集计算机场多元指标,并对机场多元指标数值进行处理,获得多元指标数据集;
步骤3,将多元指标数据集中的数据进行聚类,根据聚类效果确定最终聚类分组数;
步骤4,根据最终聚类分组数计算机场航线网络失稳状态评价阈值。
2.根据权利要求1所述的一种考虑多元指标的机场航线网络失稳状态综合评价方法,其特征在于,步骤1包括:采集某一地区原始的历史航班数据集,对历史航班数据集进行清洗,筛选出不含有空缺值和残缺值的数据;对筛选后的数据提取包括航班号、出发机场、到达机场、计划起飞时间、计划到达时间、实际起飞时间和实际到达时间在内的字段数据,从而获得机场航班数据集。
3.根据权利要求2所述的一种考虑多元指标的机场航线网络失稳状态综合评价方法,其特征在于,步骤2中所述机场多元指标包括机场饱和度、起飞准点率和航班平均延误时间,步骤2包括:
步骤2.1,将机场航班数据集划分为相同的时间段,计算每个时间段的机场饱和度、起飞准点率和航班平均延误时间;
步骤2.2,对步骤2.1获得的每一种指标的数值进行异常值剔除;
步骤2.3,对剔除异常值后的每一种指标的数值进行标准化,获得多元指标数据集,所述多元指标数据集中的每条数据均为三维数据,包括同一时间段的机场饱和度、起飞准点率和航班平均延误时间三个维度。
4.根据权利要求3所述的一种考虑多元指标的机场航线网络失稳状态综合评价方法,其特征在于,步骤2.2利用箱型图对每一种指标的数值进行异常值剔除,包括利用箱型图判断每一种指标的数值中的五个统计量,即最小值、第一四分位数、中位数、第三四分位数与最大值,超出箱型图最大值和最小值的指标数值即为异常值;同一个时间段三种指标的数值有一个以上的异常值,则该时间段三种指标的数值都被剔除。
6.根据权利要求5所述的一种考虑多元指标的机场航线网络失稳状态综合评价方法,其特征在于,步骤3中将多元指标数据集中的数据进行聚类采用K-means聚类,包括:
步骤3.1,将多元指标数据集中的数据分为K组,即聚类数设置为K,K≥1,从多元指标数据集中随机选取K个对象作为初始的聚类中心;
步骤3.2,计算多元指标数据集中每个对象与各聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心;聚类中心以及分配给它们的对象就代表一个类,每分配一个对象,聚类的聚类中心会根据聚类中现有的对象被重新计算;
步骤3.3,重复执行步骤3.2,当聚类迭代满足终止条件时,样本对象将不再被重新分配给新的聚类,所述终止条件包括当聚类中心不再发生变化时。
8.根据权利要求7所述的一种考虑多元指标的机场航线网络失稳状态综合评价方法,其特征在于,步骤4包括:根据最终聚类分组数和各机场民航局技术规范文件确定用于机场航线网络失稳状态评价的聚类,计算该聚类对应的聚类中心,根据所述聚类中心对应的机场饱和度、起飞准点率和航班平均延误时间确定机场航线网络失稳状态评价阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211724151.2A CN116307682A (zh) | 2022-12-30 | 2022-12-30 | 一种考虑多元指标的机场航线网络失稳状态综合评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211724151.2A CN116307682A (zh) | 2022-12-30 | 2022-12-30 | 一种考虑多元指标的机场航线网络失稳状态综合评价方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116307682A true CN116307682A (zh) | 2023-06-23 |
Family
ID=86791331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211724151.2A Pending CN116307682A (zh) | 2022-12-30 | 2022-12-30 | 一种考虑多元指标的机场航线网络失稳状态综合评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116307682A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562598A (zh) * | 2023-07-07 | 2023-08-08 | 成都花娃网络科技有限公司 | 一种分销调度方法、装置及存储介质 |
CN116776229A (zh) * | 2023-08-17 | 2023-09-19 | 深圳市城市交通规划设计研究中心股份有限公司 | 面向排放碳因子的汽车行驶典型工况划分方法 |
-
2022
- 2022-12-30 CN CN202211724151.2A patent/CN116307682A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562598A (zh) * | 2023-07-07 | 2023-08-08 | 成都花娃网络科技有限公司 | 一种分销调度方法、装置及存储介质 |
CN116562598B (zh) * | 2023-07-07 | 2023-09-19 | 成都花娃网络科技有限公司 | 一种分销调度方法、装置及存储介质 |
CN116776229A (zh) * | 2023-08-17 | 2023-09-19 | 深圳市城市交通规划设计研究中心股份有限公司 | 面向排放碳因子的汽车行驶典型工况划分方法 |
CN116776229B (zh) * | 2023-08-17 | 2023-12-26 | 深圳市城市交通规划设计研究中心股份有限公司 | 面向碳排放因子的汽车行驶典型工况划分方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116307682A (zh) | 一种考虑多元指标的机场航线网络失稳状态综合评价方法 | |
CN110503245B (zh) | 一种机场航班大面积延误风险的预测方法 | |
CN108345908A (zh) | 电网数据的分类方法、分类设备及存储介质 | |
CN112183605B (zh) | 一种基于运行特征的民航管制扇区分类方法 | |
CN111612053A (zh) | 一种线损率合理区间的计算方法 | |
CN114664119B (zh) | 一种航班跑道排序与优化调度方法 | |
CN111985685A (zh) | 基于大数据分析的航班计划优化方法、装置及电子设备 | |
CN113657671A (zh) | 一种基于集成学习的航班延误预测方法 | |
CN111626366A (zh) | 基于运行特征的区域扇区场景相似识别方法 | |
CN116956757A (zh) | 出港航班滑行时间预测方法、电子设备和存储介质 | |
CN112101779A (zh) | 基于主客观结合的结构熵权法机场场面运行综合评价系统 | |
CN112785156A (zh) | 一种基于聚类与综合评价的产业领袖识别方法 | |
CN104468276A (zh) | 基于随机抽样多分类器的网络流量识别方法 | |
CN115879800A (zh) | 基于数据智能的航班管理延误事后分析方法 | |
Wang et al. | Airport delay prediction method based on improved weather impacted traffic index | |
CN115310366A (zh) | 一种基于随机优化模型评估机场公布容量的方法 | |
CN108986554B (zh) | 一种基于模糊综合评判的空域扇区拥挤程度动态识别方法 | |
CN115345408A (zh) | 一种基于熵权法的终端区进场效率评估方法 | |
CN111090793B (zh) | 一种基于平均延误时间序列的机场日延误特征分类方法 | |
CN117892236A (zh) | 一种机场场面运行场景分类方法及系统 | |
Zhou et al. | Flight delay prediction based on characteristics of aviation network | |
CN109948723A (zh) | 一种手机用户中通勤人口的识别方法 | |
CN114757279A (zh) | 一种航空器场面滑行态势划分方法 | |
Zhao et al. | Evolutionary-computation based risk assessment of aircraft landing sequencing algorithms | |
CN109447490A (zh) | 一种基于用户地址的户变关系异常判别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |