CN110766314A - 一种因果关系分析方法及装置 - Google Patents

一种因果关系分析方法及装置 Download PDF

Info

Publication number
CN110766314A
CN110766314A CN201911000666.6A CN201911000666A CN110766314A CN 110766314 A CN110766314 A CN 110766314A CN 201911000666 A CN201911000666 A CN 201911000666A CN 110766314 A CN110766314 A CN 110766314A
Authority
CN
China
Prior art keywords
target
airport
time sequence
target time
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911000666.6A
Other languages
English (en)
Inventor
吴格
陈旭
傅之凤
李忠虎
杨程屹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Travelsky Technology Co Ltd
Original Assignee
China Travelsky Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Travelsky Technology Co Ltd filed Critical China Travelsky Technology Co Ltd
Priority to CN201911000666.6A priority Critical patent/CN110766314A/zh
Publication of CN110766314A publication Critical patent/CN110766314A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种因果关系分析方法及装置,通过服务器获取待确定是否存在航班延误因果关系的机场的航班运行状态数据,并基于所述航班运行状态数据计算得到所述机场的航班的到港延误时长,基于所述机场的航班的到港延误时长以及所述航班运行状态数据,构建所述机场的航班延误时间序列,基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵,根据所述传递熵,确定两个所述机场是否存在航班延误因果关系。即实现了通过服务器对两个航班之间是否存在延误因果关系进行了分析,使得服务器具有处理两个航班之间是否存在延误因果关系的数据的能力。

Description

一种因果关系分析方法及装置
技术领域
本发明涉及航班延误领域,更具体的说,涉及一种因果关系分析方法及装置。
背景技术
随着当今航空运输业的快速发展,航空公司运营的航班数量大幅增加,航班延误现象随之而来。航班延误导致的出行不确定性不仅给旅客带来极大的不便,同时给航空公司带来了巨大的经济损失,成为目前航空运输系统面临的重大挑战。由于上下游航班共用航空资源,比如飞行器、机组人员以及机场地面资源等,所以当上游航班出现到港延误时,下游航班也会以极大概率发生延误,这种现象称为延误传播。如果没有合理的方法控制延误传播,那么延误的波及范围将会持续扩大。由于当前航空运输业的发展,航空运营场景变得十分复杂,航班同时会受到不同来源因素的不同程度的影响而发生延误。因此,对两个航班之间是否存在延误因果关系的研究是十分必要而又非常具有挑战性的。
发明内容
有鉴于此,本发明提供一种因果关系分析方法及装置,以解决亟需对两个航班之间是否存在延误因果关系进行分析的问题。
为解决上述技术问题,本发明采用了如下技术方案:
一种因果关系分析方法,包括:
获取待确定是否存在航班延误因果关系的机场的航班运行状态数据,并基于所述航班运行状态数据计算得到所述机场的航班的到港延误时长;所述机场的数量为两个;
基于所述机场的航班的到港延误时长以及所述航班运行状态数据,构建所述机场的航班延误时间序列;所述航班延误时间序列表征所述航班在不同预设时间段内的航班延误时长的平均值的序列;
基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵;
根据所述传递熵,确定两个所述机场是否存在航班延误因果关系。
可选地,所述构建所述机场的航班延误时间序列之后,还包括:
对所述航班延误时间序列进行平稳化处理,得到目标时间序列。
可选地,基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵,包括:
对两个所述机场的目标时间序列执行基于滑动窗口的滑动操作,得到滑动向量集合;
确定出一个目标滑动向量,并将所述目标滑动向量嵌入到初始嵌入向量集合中;所述目标滑动向量存在于所述滑动向量集合中、且所述第一目标时间序列与所述目标滑动向量的互信息均大于所述滑动向量集合中除所述目标滑动向量之外的任一滑动向量与所述第一目标时间序列的互信息;两个所述机场中的一个所述机场称为目标机场,所述目标机场的目标时间序列为第一目标时间序列;另一个所述机场称为非目标机场;所述非目标机场的目标时间序列为第二目标时间序列;
确定第k步嵌入到所述初始嵌入向量集合的嵌入向量,得到最终的初始嵌入向量集合;其中,1<k≤dim(滑动向量集合);
基于所述初始嵌入向量集合、所述第一目标时间序列与所述第二目标时间序列,计算所述第一目标时间序列与所述第二目标时间序列之间的传递熵。
可选地,确定第k步嵌入到所述初始嵌入向量集合的嵌入向量,包括:
构建用于计算所述第一目标时间序列与所述第二目标时间序列之间的联合互信息的低维近似计算规则;
基于所述低维近似计算规则、所述滑动向量集合以及所述初始嵌入向量集合,确定所述初始嵌入向量集合的嵌入向量;所述低维近似计算规则为联合互信息I(X;Y)的计算公式:
Figure BDA0002241208830000031
其中,X为所述第一目标时间序列向量、Y为所述第二目标时间序列向量,Xi、Xj为所述第一目标时间序列向量的项,n为所述第一目标时间序列向量的长度。
可选地,所述根据传递熵,确定两个所述机场是否存在航班延误因果关系,包括:
获取与所述第二目标时间序列的统计特征和序列长度均相同的参考时间序列;
计算所述参考时间序列与所述第一目标时间序列之间的传递熵;
基于与所述第一目标时间序列之间的传递熵的秩递增排序方式,对所述第二目标时间序列和所述参考时间序列对应的传递熵排序;
基于所述第二目标时间序列对应的传递熵的排序结果,计算概率;所述概率表征所述目标机场与所述非目标机场之间是否存在航班延误因果关系的可能性;
若所述概率大于预设阈值,确定所述目标机场与所述非目标机场之间存在航班延误因果关系;
若所述概率不大于预设阈值,确定所述目标机场与所述非目标机场之间不存在航班延误因果关系。
一种因果关系分析装置,包括:
数据获取模块,用于获取待确定是否存在航班延误因果关系的机场的航班运行状态数据,并基于所述航班运行状态数据计算得到所述机场的航班的到港延误时长;所述机场的数量为两个;
序列构建模块,用于基于所述机场的航班的到港延误时长以及所述航班运行状态数据,构建所述机场的航班延误时间序列;所述航班延误时间序列表征所述航班在不同预设时间段内的航班延误时长的平均值的序列;
熵计算模块,用于基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵;
关系分析模块,用于根据所述传递熵,确定两个所述机场是否存在航班延误因果关系。
可选地,还包括:
数据处理模块,用于对所述航班延误时间序列进行平稳化处理,得到目标时间序列。
可选地,所述熵计算模块包括:
集合确定子模块,用于对两个所述机场的目标时间序列执行基于滑动窗口的滑动操作,得到滑动向量集合;
第一向量确定子模块,用于确定出一个目标滑动向量,并将所述目标滑动向量嵌入到初始嵌入向量集合中;所述目标滑动向量存在于所述滑动向量集合中、且所述第一目标时间序列与所述目标滑动向量的互信息均大于所述滑动向量集合中除所述目标滑动向量之外的任一滑动向量与所述第一目标时间序列的互信息;两个所述机场中的一个所述机场称为目标机场,所述目标机场的目标时间序列为第一目标时间序列;另一个所述机场称为非目标机场;所述非目标机场的目标时间序列为第二目标时间序列;
第二向量确定子模块,用于确定第k步嵌入到所述初始嵌入向量集合的嵌入向量,得到最终的初始嵌入向量集合;其中,1<k≤dim(滑动向量集合);
熵计算子模块,用于基于所述初始嵌入向量集合、所述第一目标时间序列与所述第二目标时间序列,计算所述第一目标时间序列与所述第二目标时间序列之间的传递熵。
可选地,所述第二向量确定子模块包括:
构建单元,用于构建用于计算所述第一目标时间序列与所述第二目标时间序列之间的联合互信息的低维近似计算规则;
向量确定单元,用于基于所述低维近似计算规则、所述滑动向量集合以及所述初始嵌入向量集合,确定所述初始嵌入向量集合的嵌入向量;所述低维近似计算规则为联合互信息I(X;Y)的计算公式:
Figure BDA0002241208830000041
其中,X为所述第一目标时间序列向量、Y为所述第二目标时间序列向量,Xi、Xj为所述第一目标时间序列向量的项,n为所述第一目标时间序列向量的长度。
可选地,所述关系分析模块包括:
序列获取子模块,用于获取与所述第二目标时间序列的统计特征和序列长度均相同的参考时间序列;
熵计算子模块,用于计算所述参考时间序列与所述第一目标时间序列之间的传递熵;
排序子模块,用于基于与所述第一目标时间序列之间的传递熵的秩递增排序方式,对所述第二目标时间序列和所述参考时间序列对应的传递熵排序;
概率计算子模块,用于基于所述第二目标时间序列对应的传递熵的排序结果,计算概率;所述概率表征所述目标机场与所述非目标机场之间是否存在航班延误因果关系的可能性;
关系分析子模块,用于若所述概率大于预设阈值,确定所述目标机场与所述非目标机场之间存在航班延误因果关系;若所述概率不大于预设阈值,确定所述目标机场与所述非目标机场之间不存在航班延误因果关系。
相较于现有技术,本发明具有以下有益效果:
本发明提供了一种因果关系分析方法及装置,通过服务器获取待确定是否存在航班延误因果关系的机场的航班运行状态数据,并基于所述航班运行状态数据计算得到所述机场的航班的到港延误时长,基于所述机场的航班的到港延误时长以及所述航班运行状态数据,构建所述机场的航班延误时间序列,基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵,根据所述传递熵,确定两个所述机场是否存在航班延误因果关系。即实现了通过服务器对两个航班之间是否存在延误因果关系进行了分析,使得服务器具有处理两个航班之间是否存在延误因果关系的数据的能力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种因果关系分析方法的方法流程图;
图2为本发明实施例提供的另一种因果关系分析方法的方法流程图;
图3为本发明实施例提供的再一种因果关系分析方法的方法流程图;
图4为本发明实施例提供的一种因果关系分析装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供给了一种因果关系分析方法,主要是涉及判断两个所述机场是否存在航班延误因果关系,参照图1,可以包括:
S11、获取待确定是否存在航班延误因果关系的机场的航班运行状态数据,并基于所述航班运行状态数据计算得到所述机场的航班的到港延误时长。
在实际应用中,一般是获取两个机场的航班运行状态数据,如采集一段时间内(一个月或半个月)的两个待测机场(机场A和机场B两个机场)的全部航班运行状态数据,一条数据记录对应一个航班,数据包含如下属性字段:航空公司IATA代码、航班号、飞行器注册号、计划离港时间、计划到港时间、实际离港时间、实际到港时间、离港机场IATA代码以及到港机场IATA代码,同时计算每个航班的到港延误时长。一个航班的到港延误时长是通过该航班的实际到港时间减去该航班的计划到港时间得到的,以分钟为单位。
S12、基于所述机场的航班的到港延误时长以及所述航班运行状态数据,构建所述机场的航班延误时间序列。
所述航班延误时间序列表征所述航班在不同预设时间段内的航班延误时长的平均值的序列。
具体的,将待测机场A和B的所有航班的到港延误时长进行小时级别的时间聚合,从而得到两个待测机场的到港延误时间序列,时间序列的非平稳性可能会为传递熵的计算带来误差,因此,再对两个待测机场的到港延误时间序列进行Z-Score标准化处理,也称为平稳化处理。
详细来说,将机场A对应的航班延误时间序列设为Xn,机场B对应的航班延误时间序列设为Yn,计算机场i第D天所有计划到达时间在第H小时内的所有航班的到港延误时长的平均,其中的到港延误时间为航班实际到港时间与计划到港时间的差值,以此作为到港延误时间序列中的一个点,计算得到一段时间内(如一个月)的所有值,从而得到每个机场对应的到港延误时间序列,每个时间序列的长度为D*H。
接着使用Z-Score标准化对到港延误时间序列进行处理,处理方法如下:
式中,S′i(D,H)表示机场i第D天所有计划到港时间在第H小时的标准化后的平均到港延误时间(也即目标时间序列),Si(D,H)表示机场i第D天所有计划到港时间在第H小时的原始平均到港延误时间,<Si(.,H)>表示机场i第H小时的所有样本点的平均值,σ(Di(.,H))表示机场i第H小时的所有样本点的标准差。其中,假设一段时间为一个月,则本实施例中的样本点为机场i每天的第H小时的到港延误时间的平均值。
S13、基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵。
S14、根据所述传递熵,确定两个所述机场是否存在航班延误因果关系。
传递熵是用于测量两个随机过程之间的有向(时间不对称)信息传递量。从一个过程X到另一个过程Y的传递熵是在已知过去Y的值的情况下,通过知道X的过去值来减少Y未来值的不确定性。
计算时间序列Xn对Yn的传递熵,若传递熵值等于零,则说明两机场的航班延误不具有因果关系;若传递熵值大于零,则说明两机场的航班延误时间序列存在因果关系,且传递熵值越大因果相关性越强,
本实施例中,通过服务器获取待确定是否存在航班延误因果关系的机场的航班运行状态数据,并基于所述航班运行状态数据计算得到所述机场的航班的到港延误时长,基于所述机场的航班的到港延误时长以及所述航班运行状态数据,构建所述机场的航班延误时间序列,基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵,根据所述传递熵,确定两个所述机场是否存在航班延误因果关系。即实现了通过服务器对两个航班之间是否存在延误因果关系进行了分析,使得服务器具有处理两个航班之间是否存在延误因果关系的数据的能力。
本发明的另一实现方式中,对步骤S13和步骤S14进行详细解释,几介绍如何计算得到传递熵,以及如何依据传递熵进行航班延误因果关系的分析。具体的,参照图2,步骤S13“基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵”,可以包括:
S21、对两个所述机场的目标时间序列执行基于滑动窗口的滑动操作,得到滑动向量集合。
为了后续描述方便,将两个所述机场中的一个所述机场称为目标机场(机场A),所述目标机场的目标时间序列为第一目标时间序列Xn;另一个所述机场称为非目标机场(机场B);所述非目标机场的目标时间序列为第二目标时间序列Yn。即将机场A对应的第一目标时间序列设为Xn,机场B对应的第二目标时间序列设为Yn
定义Xn与Yn从1到p阶的滑动向量集合的集合为:
Ω={X1:n-p-1,X2:n-p+2,X3:n-p+3,...,Xp:n,Y1:n-p+1,Y2:n-p+2,Y3:n-p+3,...,Ypn}。
S22、确定出一个目标滑动向量,并将所述目标滑动向量嵌入到初始嵌入向量中。
所述目标滑动向量存在于所述滑动向量集合中、且所述第一目标时间序列与所述目标滑动向量的互信息均大于所述滑动向量集合中除所述目标滑动向量之外的任一滑动向量与所述第一目标时间序列的互信息。
具体的,进行第1步嵌入。初始化嵌入向量集合
Figure BDA0002241208830000081
找出一个W1∈Ω满足Xn与W1的互信息最大,将满足条件的W1嵌入到集合V中。
S23、确定第k步嵌入到所述初始嵌入向量集合的嵌入向量,得到最终的初始嵌入向量集合。
其中,1<k≤dim(滑动向量集合)。
在实际应用中,步骤S23可以用下述两步实现:
1、构建用于计算所述第一目标时间序列与所述第二目标时间序列之间的联合互信息的低维近似计算规则。
在实际进行第k步嵌入(1<k≤dim(Ω))。由于随着输入数据维度的增加,联合互信息的估计会出现维度灾难问题,计算准确度会不断下降,同时计算负担也会显著增加,因此在计算两目标时间序列之间的传递熵时,使用联合互信息的低维近似来代替高维联合互信息的计算,接着根据传递熵的结果来判定两机场的航班延误时间序列是否存在因果关系。在保证结果有效性的同时,可以显著减少计算负担,低维近似具体实现方法如下:
假设X={X1,X2,...,Xn}是n维变量,根据链式法则对X和Y之间的联合互信息进行分解:
将等式两边同乘n!,得:
Figure BDA0002241208830000092
之后将等式两边同时除以n!,并省略高阶无穷小项得:
由于互信息、条件互信息和联合互信息之间有如下的关系:
I(Xi;Y|Xj)=I(Xi,Xj;Y)-I(Xj;Y)
因此,可以得到联合互信息的低维近似:
其中,X为所述第一目标时间序列向量、Y为所述第二目标时间序列向量,Xi、Xj为所述第一目标时间序列向量的项,n为所述第一目标时间序列向量的长度。
令集合W=Ω\Vk-1,Wk需要从集合W中选择,并与集合Vk-1组成集合Mk={Vk-1,Wk}。由推导所得联合互信息的低维近似表示如下:
Figure BDA0002241208830000095
本实施例第一个公式中,子项依次是2维,3维,...n+1维,所以表达式为n+1维度;降维后的公式(本实施例最后一个公式)中,子项维度与表达式维度均为稳定3维,相比初始公式降低了n-2维,达到降维效果。
2、基于所述低维近似计算规则、所述滑动向量集合以及所述初始嵌入向量集合,确定所述初始嵌入向量集合的嵌入向量。
我们使用联合互信息的低维近似代替高维估计:
Figure BDA0002241208830000101
如果(其中A≤1),则嵌入过程停止,嵌入向量集合V=Vk-1。否则,将Wk嵌入到集合V中,使得V=Mk,重复本步骤直至满足停止条件,之后计算传递熵,具体的:
计算时间序列Xn和Yn的传递熵,定量刻画两机场航班延误时间序列的因果关系:
Figure BDA0002241208830000103
其中的熵为Copula熵((Copula Entropy))。Copula熵的计算公式为其中的(ui,vi),i=1,...,N是由Copula密度函数c(u,v)生成的N个样本点。若计算得到的传递熵值为零,说明Yn和Xn两个目标时间序列之间不具有因果相关性,则得到机场A和机场B两者的航班延误不具有因果关系的结论,实验结束;否则,若传递熵值大于零,传递熵值越大,说明Yn和Xn两个时间序列之间的因果相关性越强,则两机场航班延误时间序列的因果关系越强,即可进行根据传递熵确定两个所述机场是否存在航班延误因果关系的步骤,具体的,参照图3,步骤S14可以包括:
S31、获取与所述第二目标时间序列的统计特征和序列长度均相同的参考时间序列。
对依据上述方法发现的因果关系进行假设检验并判断其因果相关性的显著关系,得到机场A和B两者航班延误是否具有因果关系的结论。具体如下:人为构造s条统计特性以及序列长度与序列Yn相同的时间序列,分别计算每条人为构造的时间序列与序列Xn的传递熵并与原始时间序列Yn与Xn的传递熵组成一个集合D,对集合D进行秩递增排序。估计I型错误概率为
Figure BDA0002241208830000111
其中i表示目标时间序列Yn与Xn传递熵数值在集合D中的索引位置。当P<α时,则确定Xn和Yn具有因果相关性的显著关系,其中α为显著性水平,那么输出机场A和机场B两者的航班延误具有显著的因果关系的结论并且输出因果关系量化结果P;当P≥α时,则确定Xn和Yn不具有因果相关性的显著关系,那么输出机场A和机场B两者的航班延误不具有因果关系的结论。
例如,人为构造50条统计特性以及序列长度与序列Yn相同的时间序列,即s=50。若α=0.05,i=50,则则可以确定Xn和Yn具有因果相关性的显著关系;若α=0.05,i=49,则
Figure BDA0002241208830000113
则可以确定Xn和Yn没有因果相关性的显著关系。如果原始时间序列Xn和Yn具有因果关系并且拥有因果相关性的显著关系,那么可以确定两个机场间存在真实的因果关系,否则可以确定两个机场间不存在因果关系。
本发明实施例的一种基于低维近似传递熵的航班延误因果关系发现方法,可以解决现有航班延误传播分析方法中存在的问题,能够从高度复杂的非线性时序数据中准确挖掘出航班延误因果关系。该方法利用低维近似的互信息估计克服了传统方法中维度灾难的问题,同时不依赖于既定模型并且可以定量化分析延误传播的关系。依据此方法得到的机场间的延误因果关系,可以使空中交通管理者准确找到延误传播的路径以及源头,从而可以由源头解决延误问题,同时依据得到的延误因果关系量化结果,空中交通管理者可以准确把握机场间的延误影响程度排序,优先解决影响程度较大的机场间存在的问题。此有助于改善当前严重的航班延误问题,减少由于航班延误传播带来的损失。
在上述因果关系分析方法的实施例的基础上,本发明的另一实施例提供了一种因果关系分析装置,参照图4,可以包括:
数据获取模块101,用于获取待确定是否存在航班延误因果关系的机场的航班运行状态数据,并基于所述航班运行状态数据计算得到所述机场的航班的到港延误时长;所述机场的数量为两个;
序列构建模块102,用于基于所述机场的航班的到港延误时长以及所述航班运行状态数据,构建所述机场的航班延误时间序列;所述航班延误时间序列表征所述航班在不同预设时间段内的航班延误时长的平均值的序列;
熵计算模块103,用于基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵;
关系分析模块104,用于根据所述传递熵,确定两个所述机场是否存在航班延误因果关系。
进一步,还包括:
数据处理模块,用于对所述航班延误时间序列进行平稳化处理,得到目标时间序列。
本实施例中,通过服务器获取待确定是否存在航班延误因果关系的机场的航班运行状态数据,并基于所述航班运行状态数据计算得到所述机场的航班的到港延误时长,基于所述机场的航班的到港延误时长以及所述航班运行状态数据,构建所述机场的航班延误时间序列,基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵,根据所述传递熵,确定两个所述机场是否存在航班延误因果关系。即实现了通过服务器对两个航班之间是否存在延误因果关系进行了分析,使得服务器具有处理两个航班之间是否存在延误因果关系的数据的能力。
需要说明的是,本实施例中的各个模块的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
可选的,在上述因果关系分析装置的实施例的基础上,所述熵计算模块包括:
集合确定子模块,用于对两个所述机场的目标时间序列执行基于滑动窗口的滑动操作,得到滑动向量集合;
第一向量确定子模块,用于确定出一个目标滑动向量,并将所述目标滑动向量嵌入到初始嵌入向量集合中;所述目标滑动向量存在于所述滑动向量集合中、且所述第一目标时间序列与所述目标滑动向量的互信息均大于所述滑动向量集合中除所述目标滑动向量之外的任一滑动向量与所述第一目标时间序列的互信息;两个所述机场中的一个所述机场称为目标机场,所述目标机场的目标时间序列为第一目标时间序列;另一个所述机场称为非目标机场;所述非目标机场的目标时间序列为第二目标时间序列;
第二向量确定子模块,用于确定第k步嵌入到所述初始嵌入向量集合的嵌入向量,得到最终的初始嵌入向量集合;其中,1<k≤dim(滑动向量集合);
熵计算子模块,用于基于所述初始嵌入向量集合、所述第一目标时间序列与所述第二目标时间序列,计算所述第一目标时间序列与所述第二目标时间序列之间的传递熵。
进一步,所述第二向量确定子模块包括:
构建单元,用于构建用于计算所述第一目标时间序列与所述第二目标时间序列之间的联合互信息的低维近似计算规则;
向量确定单元,用于基于所述低维近似计算规则、所述滑动向量集合以及所述初始嵌入向量集合,确定所述初始嵌入向量集合的嵌入向量;所述低维近似计算规则为联合互信息I(X;Y)的计算公式:
其中,X为所述第一目标时间序列向量、Y为所述第二目标时间序列向量,Xi、Xj为所述第一目标时间序列向量的项,n为所述第一目标时间序列向量的长度。
进一步,所述关系分析模块包括:
序列获取子模块,用于获取与所述第二目标时间序列的统计特征和序列长度均相同的参考时间序列;
熵计算子模块,用于计算所述参考时间序列与所述第一目标时间序列之间的传递熵;
排序子模块,用于基于与所述第一目标时间序列之间的传递熵的秩递增排序方式,对所述第二目标时间序列和所述参考时间序列对应的传递熵排序;
概率计算子模块,用于基于所述第二目标时间序列对应的传递熵的排序结果,计算概率;所述概率表征所述目标机场与所述非目标机场之间是否存在航班延误因果关系的可能性;
关系分析子模块,用于若所述概率大于预设阈值,确定所述目标机场与所述非目标机场之间存在航班延误因果关系;若所述概率不大于预设阈值,确定所述目标机场与所述非目标机场之间不存在航班延误因果关系。
本发明实施例的一种基于低维近似传递熵的航班延误因果关系发现方法,可以解决现有航班延误传播分析方法中存在的问题,能够从高度复杂的非线性时序数据中准确挖掘出航班延误因果关系。该方法利用低维近似的互信息估计克服了传统方法中维度灾难的问题,同时不依赖于既定模型并且可以定量化分析延误传播的关系。依据此方法得到的机场间的延误因果关系,可以使空中交通管理者准确找到延误传播的路径以及源头,从而可以由源头解决延误问题,同时依据得到的延误因果关系量化结果,空中交通管理者可以准确把握机场间的延误影响程度排序,优先解决影响程度较大的机场间存在的问题。此有助于改善当前严重的航班延误问题,减少由于航班延误传播带来的损失。
需要说明的是,本实施例中的各个模块、子模块和单元的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种因果关系分析方法,其特征在于,包括:
获取待确定是否存在航班延误因果关系的机场的航班运行状态数据,并基于所述航班运行状态数据计算得到所述机场的航班的到港延误时长;所述机场的数量为两个;
基于所述机场的航班的到港延误时长以及所述航班运行状态数据,构建所述机场的航班延误时间序列;所述航班延误时间序列表征所述航班在不同预设时间段内的航班延误时长的平均值的序列;
基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵;
根据所述传递熵,确定两个所述机场是否存在航班延误因果关系。
2.根据权利要求1所述的因果关系分析方法,其特征在于,所述构建所述机场的航班延误时间序列之后,还包括:
对所述航班延误时间序列进行平稳化处理,得到目标时间序列。
3.根据权利要求2所述的因果关系分析方法,其特征在于,基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵,包括:
对两个所述机场的目标时间序列执行基于滑动窗口的滑动操作,得到滑动向量集合;
确定出一个目标滑动向量,并将所述目标滑动向量嵌入到初始嵌入向量集合中;所述目标滑动向量存在于所述滑动向量集合中、且所述第一目标时间序列与所述目标滑动向量的互信息均大于所述滑动向量集合中除所述目标滑动向量之外的任一滑动向量与所述第一目标时间序列的互信息;两个所述机场中的一个所述机场称为目标机场,所述目标机场的目标时间序列为第一目标时间序列;另一个所述机场称为非目标机场;所述非目标机场的目标时间序列为第二目标时间序列;
确定第k步嵌入到所述初始嵌入向量集合的嵌入向量,得到最终的初始嵌入向量集合;其中,1<k≤dim(滑动向量集合);
基于所述初始嵌入向量集合、所述第一目标时间序列与所述第二目标时间序列,计算所述第一目标时间序列与所述第二目标时间序列之间的传递熵。
4.根据权利要求3所述的因果关系分析方法,其特征在于,确定第k步嵌入到所述初始嵌入向量集合的嵌入向量,包括:
构建用于计算所述第一目标时间序列与所述第二目标时间序列之间的联合互信息的低维近似计算规则;
基于所述低维近似计算规则、所述滑动向量集合以及所述初始嵌入向量集合,确定所述初始嵌入向量集合的嵌入向量;所述低维近似计算规则为联合互信息I(X;Y)的计算公式:
Figure FDA0002241208820000021
其中,X为所述第一目标时间序列向量、Y为所述第二目标时间序列向量,Xi、Xj为所述第一目标时间序列向量的项,n为所述第一目标时间序列向量的长度。
5.根据权利要求3所述的因果关系分析方法,其特征在于,所述根据传递熵,确定两个所述机场是否存在航班延误因果关系,包括:
获取与所述第二目标时间序列的统计特征和序列长度均相同的参考时间序列;
计算所述参考时间序列与所述第一目标时间序列之间的传递熵;
基于与所述第一目标时间序列之间的传递熵的秩递增排序方式,对所述第二目标时间序列和所述参考时间序列对应的传递熵排序;
基于所述第二目标时间序列对应的传递熵的排序结果,计算概率;所述概率表征所述目标机场与所述非目标机场之间是否存在航班延误因果关系的可能性;
若所述概率大于预设阈值,确定所述目标机场与所述非目标机场之间存在航班延误因果关系;
若所述概率不大于预设阈值,确定所述目标机场与所述非目标机场之间不存在航班延误因果关系。
6.一种因果关系分析装置,其特征在于,包括:
数据获取模块,用于获取待确定是否存在航班延误因果关系的机场的航班运行状态数据,并基于所述航班运行状态数据计算得到所述机场的航班的到港延误时长;所述机场的数量为两个;
序列构建模块,用于基于所述机场的航班的到港延误时长以及所述航班运行状态数据,构建所述机场的航班延误时间序列;所述航班延误时间序列表征所述航班在不同预设时间段内的航班延误时长的平均值的序列;
熵计算模块,用于基于所述机场的航班延误时间序列,计算两个所述机场之间的传递熵;
关系分析模块,用于根据所述传递熵,确定两个所述机场是否存在航班延误因果关系。
7.根据权利要求6所述的因果关系分析装置,其特征在于,还包括:
数据处理模块,用于对所述航班延误时间序列进行平稳化处理,得到目标时间序列。
8.根据权利要求7所述的因果关系分析装置,其特征在于,所述熵计算模块包括:
集合确定子模块,用于对两个所述机场的目标时间序列执行基于滑动窗口的滑动操作,得到滑动向量集合;
第一向量确定子模块,用于确定出一个目标滑动向量,并将所述目标滑动向量嵌入到初始嵌入向量集合中;所述目标滑动向量存在于所述滑动向量集合中、且所述第一目标时间序列与所述目标滑动向量的互信息均大于所述滑动向量集合中除所述目标滑动向量之外的任一滑动向量与所述第一目标时间序列的互信息;两个所述机场中的一个所述机场称为目标机场,所述目标机场的目标时间序列为第一目标时间序列;另一个所述机场称为非目标机场;所述非目标机场的目标时间序列为第二目标时间序列;
第二向量确定子模块,用于确定第k步嵌入到所述初始嵌入向量集合的嵌入向量,得到最终的初始嵌入向量集合;其中,1<k≤dim(滑动向量集合);
熵计算子模块,用于基于所述初始嵌入向量集合、所述第一目标时间序列与所述第二目标时间序列,计算所述第一目标时间序列与所述第二目标时间序列之间的传递熵。
9.根据权利要求8所述的因果关系分析装置,其特征在于,所述第二向量确定子模块包括:
构建单元,用于构建用于计算所述第一目标时间序列与所述第二目标时间序列之间的联合互信息的低维近似计算规则;
向量确定单元,用于基于所述低维近似计算规则、所述滑动向量集合以及所述初始嵌入向量集合,确定所述初始嵌入向量集合的嵌入向量;所述低维近似计算规则为联合互信息I(X;Y)的计算公式:
Figure FDA0002241208820000041
其中,X为所述第一目标时间序列向量、Y为所述第二目标时间序列向量,Xi、Xj为所述第一目标时间序列向量的项,n为所述第一目标时间序列向量的长度。
10.根据权利要求8所述的因果关系分析装置,其特征在于,所述关系分析模块包括:
序列获取子模块,用于获取与所述第二目标时间序列的统计特征和序列长度均相同的参考时间序列;
熵计算子模块,用于计算所述参考时间序列与所述第一目标时间序列之间的传递熵;
排序子模块,用于基于与所述第一目标时间序列之间的传递熵的秩递增排序方式,对所述第二目标时间序列和所述参考时间序列对应的传递熵排序;
概率计算子模块,用于基于所述第二目标时间序列对应的传递熵的排序结果,计算概率;所述概率表征所述目标机场与所述非目标机场之间是否存在航班延误因果关系的可能性;
关系分析子模块,用于若所述概率大于预设阈值,确定所述目标机场与所述非目标机场之间存在航班延误因果关系;若所述概率不大于预设阈值,确定所述目标机场与所述非目标机场之间不存在航班延误因果关系。
CN201911000666.6A 2019-10-21 2019-10-21 一种因果关系分析方法及装置 Pending CN110766314A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911000666.6A CN110766314A (zh) 2019-10-21 2019-10-21 一种因果关系分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911000666.6A CN110766314A (zh) 2019-10-21 2019-10-21 一种因果关系分析方法及装置

Publications (1)

Publication Number Publication Date
CN110766314A true CN110766314A (zh) 2020-02-07

Family

ID=69331527

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911000666.6A Pending CN110766314A (zh) 2019-10-21 2019-10-21 一种因果关系分析方法及装置

Country Status (1)

Country Link
CN (1) CN110766314A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537599A (zh) * 2021-07-19 2021-10-22 中国民用航空总局第二研究所 航班事件环节检测方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108519988A (zh) * 2018-02-27 2018-09-11 北京航空航天大学 基于格兰杰检验的航空延误因果关系网络构建方法
CN109119166A (zh) * 2018-06-13 2019-01-01 陕西智联脑控科技有限公司 一种基于矩阵传递熵的时间序列因果性分析方法及其计算机装置
CN109190700A (zh) * 2018-08-27 2019-01-11 北京航空航天大学 一种航空延误传播的定量分析方法
CN109558436A (zh) * 2018-11-03 2019-04-02 北京交通大学 基于转移熵的机场航班延误因果关系挖掘方法
CN113269336A (zh) * 2021-07-19 2021-08-17 中国民用航空总局第二研究所 航班事件因果检测方法、装置、电子设备及可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108519988A (zh) * 2018-02-27 2018-09-11 北京航空航天大学 基于格兰杰检验的航空延误因果关系网络构建方法
CN109119166A (zh) * 2018-06-13 2019-01-01 陕西智联脑控科技有限公司 一种基于矩阵传递熵的时间序列因果性分析方法及其计算机装置
CN109190700A (zh) * 2018-08-27 2019-01-11 北京航空航天大学 一种航空延误传播的定量分析方法
CN109558436A (zh) * 2018-11-03 2019-04-02 北京交通大学 基于转移熵的机场航班延误因果关系挖掘方法
CN113269336A (zh) * 2021-07-19 2021-08-17 中国民用航空总局第二研究所 航班事件因果检测方法、装置、电子设备及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘晓欣: "互信息多元时间序列相关分析与变量选择", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537599A (zh) * 2021-07-19 2021-10-22 中国民用航空总局第二研究所 航班事件环节检测方法、装置及电子设备
CN113537599B (zh) * 2021-07-19 2024-03-15 中国民用航空总局第二研究所 航班事件环节检测方法、装置及电子设备

Similar Documents

Publication Publication Date Title
Fletcher et al. Inference in deep networks in high dimensions
Xiao et al. Towards confidence in the truth: A bootstrapping based truth discovery approach
US20240112091A1 (en) Methods, apparatuses, and systems for multi-party collaborative model updating for privacy protection
Beck et al. Rare event simulation
CN109190700B (zh) 一种航空延误传播的定量分析方法
CN109558436B (zh) 基于转移熵的机场航班延误因果关系挖掘方法
CN109145984B (zh) 用于机器训练的方法和装置
Chen et al. Provably convergent Schrödinger bridge with applications to probabilistic time series imputation
Gao et al. Counting triangles in power-law uniform random graphs
Jin et al. Ergodicity and long-time behavior of the Random Batch Method for interacting particle systems
CN110766314A (zh) 一种因果关系分析方法及装置
Pradhan et al. Analyzing an infinite buffer batch arrival and batch service queue under batch-size-dependent service policy
CN113435632A (zh) 信息生成方法、装置、电子设备和计算机可读介质
Rahim et al. M (a, b)/1 Model Of Interdependent Queueing With Controllable Arrival Rates
Gassiat et al. Non parametric finite translation mixtures with dependent regime
Blanchet et al. Rare event simulation for a slotted time M/G/s model
Sankaranarayanan et al. Algorithmic and architectural design methodology for particle filters in hardware
Prokopova et al. VAF factor influence on the accuracy of the effort estimation provided by modified function points methods
Ferreira et al. In the search for the infinite servers queue with Poisson arrivals busy period distribution exponential behaviour
Maas et al. Uncertainty intervals for graph-based spatio-temporal traffic prediction
El-hady et al. On a functional equation arising from a network model
Nie et al. A compressive sensing‐based approach to end‐to‐end network traffic reconstruction utilising partial measured origin‐destination flows
Feng et al. Neural Approximate Mirror Maps for Constrained Diffusion Models
Chen et al. Importance sampling of heavy-tailed iterated random functions
CN114844889B (zh) 视频处理模型的更新方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200207

RJ01 Rejection of invention patent application after publication