CN111291098B - 一种航迹模式挖掘方法与装置 - Google Patents

一种航迹模式挖掘方法与装置 Download PDF

Info

Publication number
CN111291098B
CN111291098B CN202010394728.2A CN202010394728A CN111291098B CN 111291098 B CN111291098 B CN 111291098B CN 202010394728 A CN202010394728 A CN 202010394728A CN 111291098 B CN111291098 B CN 111291098B
Authority
CN
China
Prior art keywords
track
hausdorff distance
core
real
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010394728.2A
Other languages
English (en)
Other versions
CN111291098A (zh
Inventor
杜文博
陈薏充
曹先彬
朱熙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202010394728.2A priority Critical patent/CN111291098B/zh
Publication of CN111291098A publication Critical patent/CN111291098A/zh
Application granted granted Critical
Publication of CN111291098B publication Critical patent/CN111291098B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明公开了一种航迹模式挖掘方法与装置,首先对航班航迹信息进行提取,进行数据预处理后,根据航迹密度分布生成核心对象并滤除噪声,然后对核心对象进行加权,并进行模式挖掘,最后对挖掘出的航迹模式进行展示。本发明针对空中交通运行高密度、高复杂度的状况,实现了在多航班运行环境下的航迹模式挖掘;围绕着海量航班运行背景下的航迹模式精准快速挖掘,从提升空中交通系统安全性和高效性两方面出发,开展航迹模式挖掘方法研究,对于确保航班飞行安全、合理调配空域容量、检测异常飞行状况、预测航班未来飞行行为以及提高空中交通系统的运行效率具有重要的意义。

Description

一种航迹模式挖掘方法与装置
技术领域
本发明涉及航空航天技术领域,尤其涉及一种航迹模式挖掘方法与装置。
背景技术
在空域运行环境越来越复杂、民航航班运行体量越来越大、航班飞行方式难以分辨的场景下,实现航班航迹运动模式的精准挖掘是空中交通管理中的研究重点。一方面,有效挖掘航迹模式,可以得出航班的大致运行规律,为空管部门检测存在飞行行为异常的航班以及预测航班未来航迹做出参考,提升空域运行的安全性;另一方面,精准挖掘航迹模式,可以得出各扇区的运行状况,为空管部门调控空域流量、管理扇区开合提供数据支撑,提升空域运行的有效性。因此,一套行之有效且计算成本可控的航迹模式挖掘方法对于空管安全和效率来说至关重要。
现有的航迹模式挖掘方法较为多样,包括基于聚类、分布、距离、偏差等等,这些方法通过构建不同的计算模型对航迹运动模式进行挖掘。由于航班运行体量大,运动模式相互交织的情况比较严重,现有的分类或聚类算法难以对不同规模,尤其是规模较小的航迹模式进行有效区分,航迹模式挖掘的困难,会直接导致空管部门难以及时对空域中航班整体运行状况有总体的认识与了解,针对存在异常飞行情况的航班不能及时发出告警,空域扇区的有效调度也面临着挑战。因此,针对不同规模航迹模式的精准挖掘方法是十分必要的。
发明内容
有鉴于此,本发明提供了一种航迹模式挖掘方法与装置,用以在空域中从较为杂乱的航班运动里挖掘出不同规模的航迹运动模式并进行展示。
因此,本发明提供了一种基于自适应层次聚类的航迹模式挖掘方法,包括如下步骤:
S1:针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
S2:对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
S3:计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
S4:计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
S5:根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
S6:采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;
S7:计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;若否,则执行步骤S8;若是,则执行步骤S9;
S8:判断航迹聚类簇的个数是否大于3;若是,则返回步骤S5,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;若否,则执行步骤S9;
S9:将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式 挖掘方法中,步骤S1中,第
Figure 179772DEST_PATH_IMAGE001
个航迹序列为
Figure 334810DEST_PATH_IMAGE002
,代表航迹序列
Figure 338538DEST_PATH_IMAGE003
包含
Figure 796195DEST_PATH_IMAGE004
个航迹向量,
Figure 190268DEST_PATH_IMAGE005
Figure 273630DEST_PATH_IMAGE006
表示航迹序列的数量;其中航迹向量
Figure 69548DEST_PATH_IMAGE007
,其中,
Figure 898439DEST_PATH_IMAGE008
表示航迹向量
Figure 638862DEST_PATH_IMAGE009
的实时经 度,
Figure 479910DEST_PATH_IMAGE010
表示航迹向量
Figure 130334DEST_PATH_IMAGE009
的实时纬度,
Figure 647903DEST_PATH_IMAGE011
表示航迹向量
Figure 891934DEST_PATH_IMAGE009
的实时高度,
Figure 192465DEST_PATH_IMAGE012
表示航迹向量
Figure 25292DEST_PATH_IMAGE009
的实时飞行速度,
Figure 995653DEST_PATH_IMAGE013
表示航迹向量
Figure 851614DEST_PATH_IMAGE009
的实时航向角,
Figure 18153DEST_PATH_IMAGE014
表示航迹向量
Figure 521465DEST_PATH_IMAGE009
的实时时间 点。
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式 挖掘方法中,步骤S2中,对航迹序列
Figure 52941DEST_PATH_IMAGE003
进行去除异常值,具体包括:
提取每个航迹向量的实时飞行速度,若
Figure 255252DEST_PATH_IMAGE015
Figure 632007DEST_PATH_IMAGE016
,则将飞行速度
Figure 190158DEST_PATH_IMAGE012
对应的航迹向量
Figure 17169DEST_PATH_IMAGE009
去除;
提取每个航迹向量的实时航向角,若
Figure 582142DEST_PATH_IMAGE017
Figure 841216DEST_PATH_IMAGE018
, 则将航向角
Figure 565459DEST_PATH_IMAGE013
对应的航迹向量
Figure 173158DEST_PATH_IMAGE009
去除;其中,
Figure 100793DEST_PATH_IMAGE019
表示航迹向量
Figure 412826DEST_PATH_IMAGE020
的实时航向角,
Figure 132520DEST_PATH_IMAGE021
表示航迹向量
Figure 783557DEST_PATH_IMAGE022
的实时航向角,
Figure 385440DEST_PATH_IMAGE023
Figure 907688DEST_PATH_IMAGE024
提取每个航迹向量的实时经度、实时纬度和实时高度,若
Figure 91676DEST_PATH_IMAGE025
,则将经度
Figure 306756DEST_PATH_IMAGE008
、纬度
Figure 458252DEST_PATH_IMAGE010
和高度
Figure 518612DEST_PATH_IMAGE011
对应的航迹向量
Figure 25948DEST_PATH_IMAGE009
去除;其中,
Figure 270984DEST_PATH_IMAGE026
表示航迹 向量
Figure 785142DEST_PATH_IMAGE022
的实时经度,
Figure 727822DEST_PATH_IMAGE027
表示航迹向量
Figure 135669DEST_PATH_IMAGE022
的实时纬度,
Figure 426973DEST_PATH_IMAGE028
表示航迹向量
Figure 52863DEST_PATH_IMAGE022
的实时 高度,
Figure 986184DEST_PATH_IMAGE029
表示航迹向量
Figure 451800DEST_PATH_IMAGE020
的实时经度,
Figure 789372DEST_PATH_IMAGE030
表示航迹向量
Figure 278122DEST_PATH_IMAGE020
的实时纬度,
Figure 77451DEST_PATH_IMAGE031
表示航 迹向量
Figure 945044DEST_PATH_IMAGE020
的实时高度;
步骤S2中,对航迹序列
Figure 843729DEST_PATH_IMAGE003
进行去重,具体包括:
遍历航迹序列
Figure 678830DEST_PATH_IMAGE003
的所有航迹向变量,若存在
Figure 767003DEST_PATH_IMAGE032
,则 将重复的航迹向量
Figure 613736DEST_PATH_IMAGE033
去除;
步骤S2中,对航迹序列
Figure 883656DEST_PATH_IMAGE003
进行分段,具体包括:
获取航迹序列
Figure 815840DEST_PATH_IMAGE003
的所有经度和纬度,组成多个经纬度点,引接我国的空域情报区 划分数据,按照各经纬度点所属的情报区进行标号;
步骤S2中,对航迹序列
Figure 753709DEST_PATH_IMAGE003
进行重采样,具体包括:
针对航迹序列
Figure 533577DEST_PATH_IMAGE003
在同一个情报区内的数据段,计算航班航迹点数
Figure 774066DEST_PATH_IMAGE034
,选取重采样 点数为100,以航班航迹点数对重采样点数做整数除法得出重采样步长,余数的一半作为航 迹序列
Figure 583759DEST_PATH_IMAGE003
在该情报区内的数据段首尾需去除的点数,按照重采样步长对航迹序列
Figure 935106DEST_PATH_IMAGE003
在该 情报区内的数据段进行重采样,重采样计算公式如下:
Figure 835060DEST_PATH_IMAGE035
其中,
Figure 371083DEST_PATH_IMAGE036
表示重采样后的航迹序列,
Figure 277860DEST_PATH_IMAGE037
表示航迹
Figure 573843DEST_PATH_IMAGE003
的第
Figure 249675DEST_PATH_IMAGE038
个航迹 序列,
Figure 159862DEST_PATH_IMAGE039
表示重采样的起始位置,
Figure 432230DEST_PATH_IMAGE040
表示整数除法后确定的重采样步长,
Figure 390959DEST_PATH_IMAGE041
以1的步长从0取 到99,表示重采样所需的100个点。
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S3,计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象,具体包括:
利用如下公式计算航迹序列
Figure 311510DEST_PATH_IMAGE036
与航迹序列
Figure 877752DEST_PATH_IMAGE042
之间未加权过的双向Hausdorff距离
Figure 759120DEST_PATH_IMAGE043
Figure 646174DEST_PATH_IMAGE044
Figure 296598DEST_PATH_IMAGE045
Figure 96058DEST_PATH_IMAGE046
其中,表示航迹序列 到航迹序列 的单向Hausdorff距离,
Figure 568442DEST_PATH_IMAGE053
表示航迹向量
Figure 486719DEST_PATH_IMAGE054
的空间位置
Figure 463378DEST_PATH_IMAGE055
与航迹向量
Figure 416290DEST_PATH_IMAGE056
的空间位置
Figure 682186DEST_PATH_IMAGE057
的空间欧式距离,表示航迹序列 到航迹序列 的单向 Hausdorff距离,
Figure 6934DEST_PATH_IMAGE060
表示航迹向量
Figure 696541DEST_PATH_IMAGE061
的空间位置
Figure 876987DEST_PATH_IMAGE062
与航迹向量
Figure 280856DEST_PATH_IMAGE063
的 空间位置
Figure 278767DEST_PATH_IMAGE064
的空间欧式距离;
设置参数
Figure 144086DEST_PATH_IMAGE065
作为航迹序列间双向Hausdorff距离
Figure 269168DEST_PATH_IMAGE043
的阈值,设置参数
Figure 582338DEST_PATH_IMAGE066
作为生成航迹核心对象所需包含的最少“邻居”航迹序列数;选取一个航迹序列
Figure 626517DEST_PATH_IMAGE036
,计算
Figure 41449DEST_PATH_IMAGE036
与其他所有航迹序列间的双向Hausdorff距离
Figure 360435DEST_PATH_IMAGE067
;若对于某一个
Figure 541493DEST_PATH_IMAGE068
, 使
Figure 756574DEST_PATH_IMAGE069
,则进行一次计数;当遍历完所有的航迹序列后,若计数的值大于或等于
Figure 111332DEST_PATH_IMAGE066
,则将航迹序列
Figure 47058DEST_PATH_IMAGE036
定义为航迹核心对象;遍历所有航迹序列后,得到在参数
Figure 210186DEST_PATH_IMAGE065
Figure 986381DEST_PATH_IMAGE066
下的航迹核心对象集合。
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S4,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵,具体包括:
假设共生成
Figure 313588DEST_PATH_IMAGE070
个航迹核心对象,则Hausdorff距离矩阵为:
Figure 177639DEST_PATH_IMAGE071
其中,
Figure 54328DEST_PATH_IMAGE043
表示航迹核心对象
Figure 220999DEST_PATH_IMAGE072
与航迹核心对象
Figure 222453DEST_PATH_IMAGE042
间未加权过的双向 Hausdorff距离,满足:
Figure 14828DEST_PATH_IMAGE073
Figure 234107DEST_PATH_IMAGE074
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S5,根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权,具体包括:
S53:判断某一个航迹核心对象 是否与其他所有航迹核心对象中超过第一阈值
Figure 309696DEST_PATH_IMAGE075
的航迹核心对象间的双向Hausdorff距离小于
Figure 515549DEST_PATH_IMAGE076
Figure 586405DEST_PATH_IMAGE077
;若是,则执行步骤 S54;若否,则执行步骤S55;其中,
Figure 875304DEST_PATH_IMAGE078
表示航迹核心对象
Figure 585771DEST_PATH_IMAGE036
与其他航迹核心对象间的最远双 向Hausdorff距离;
S54:将航迹核心对象
Figure 408364DEST_PATH_IMAGE036
在Hausdorff距离矩阵的对应行的所有值均乘以加权系数
Figure 910890DEST_PATH_IMAGE079
Figure 714898DEST_PATH_IMAGE080
,同时记录
Figure 991289DEST_PATH_IMAGE081
;其中,
Figure 663579DEST_PATH_IMAGE082
表示航迹核心对象
Figure 237256DEST_PATH_IMAGE036
的加权系数;
S55:判断航迹核心对象
Figure 805640DEST_PATH_IMAGE083
与其他所有的航迹核心对象中超过第二阈值
Figure 225120DEST_PATH_IMAGE084
的 航迹核心对象间的双向Hausdorff距离大于
Figure 451833DEST_PATH_IMAGE085
Figure 538738DEST_PATH_IMAGE086
;若是,则执行步骤S56;若否,则执行 步骤S57;
S56:将航迹核心对象
Figure 278024DEST_PATH_IMAGE036
在Hausdorff距离矩阵的对应行的所有值均乘以加权系数
Figure 60166DEST_PATH_IMAGE087
Figure 215204DEST_PATH_IMAGE088
,同时记录
Figure 281249DEST_PATH_IMAGE089
S57:记录
Figure 863540DEST_PATH_IMAGE090
S58:遍历Hausdorff距离矩阵的所有行后,对得到的Hausdorff距离矩阵根据主对 角线进行翻转,得到加权后的Hausdorff距离矩阵
Figure 336241DEST_PATH_IMAGE091
以及各个航迹核心对象的加权情况
Figure 419603DEST_PATH_IMAGE092
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S6,采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵,具体包括:
在加权后的Hausdorff距离矩阵
Figure 949942DEST_PATH_IMAGE091
的主对角线的右侧选取
Figure 796411DEST_PATH_IMAGE091
中的最小值:
Figure 802413DEST_PATH_IMAGE093
其中,
Figure 564833DEST_PATH_IMAGE094
表示航迹核心对象
Figure 293886DEST_PATH_IMAGE036
和航迹核心对象
Figure 342613DEST_PATH_IMAGE042
间加权后的双向 Hausdorff距离;将航迹核心对象
Figure 711278DEST_PATH_IMAGE036
Figure 621596DEST_PATH_IMAGE042
合并,生成一个新的航迹核心对象
Figure 454423DEST_PATH_IMAGE095
,将加权后 的Hausdorff距离矩阵
Figure 362467DEST_PATH_IMAGE091
中与
Figure 608640DEST_PATH_IMAGE036
Figure 447284DEST_PATH_IMAGE042
相关的两行与两列剔除,将新生成的航迹核心对象
Figure 882420DEST_PATH_IMAGE095
置于加权后的Hausdorff距离矩阵
Figure 272950DEST_PATH_IMAGE091
中的第
Figure 616206DEST_PATH_IMAGE001
行第
Figure 133906DEST_PATH_IMAGE001
列,同时第j行后的航迹核心对象上 移一位,第j列后的航迹核心对象左移一位,补充原
Figure 941325DEST_PATH_IMAGE091
中被剔除的第j行与第j列;
计算第
Figure 378123DEST_PATH_IMAGE001
行的双向Hausdorff距离:
Figure 84042DEST_PATH_IMAGE096
计算第
Figure 264488DEST_PATH_IMAGE001
列的双向Hausdorff距离:
Figure 191992DEST_PATH_IMAGE097
其中,
Figure 675057DEST_PATH_IMAGE098
表示航迹核心对象
Figure 727327DEST_PATH_IMAGE099
与航迹核心对象
Figure 120918DEST_PATH_IMAGE036
间未加权过的双向 Hausdorff距离,
Figure 840612DEST_PATH_IMAGE100
Figure 947108DEST_PATH_IMAGE101
表示航迹核心对象
Figure 830882DEST_PATH_IMAGE099
与航迹核心 对象
Figure 743343DEST_PATH_IMAGE042
间未加权过的双向Hausdorff距离,
Figure 130593DEST_PATH_IMAGE102
Figure 345674DEST_PATH_IMAGE103
表示 航迹核心对象
Figure 231590DEST_PATH_IMAGE036
与航迹核心对象
Figure 636158DEST_PATH_IMAGE104
间未加权过的Hausdorff距离;
Figure 64865DEST_PATH_IMAGE105
表示 航迹核心对象
Figure 120021DEST_PATH_IMAGE042
与航迹核心对象
Figure 634179DEST_PATH_IMAGE104
间未加权过的双向Hausdorff距离;
Figure 622864DEST_PATH_IMAGE106
表示本次合 并之前的矩阵
Figure 719127DEST_PATH_IMAGE091
中第w行对应的加权系数;
Figure 276010DEST_PATH_IMAGE107
表示本次合并之前的矩阵
Figure 402098DEST_PATH_IMAGE091
中第j行对应的加 权系数;
按照如下公式更新Hausdorff距离矩阵主对角线右上方的值:
Figure 69840DEST_PATH_IMAGE108
其中,
Figure 20610DEST_PATH_IMAGE109
Figure 873028DEST_PATH_IMAGE110
表示Hausdorff距离矩阵的第
Figure 361778DEST_PATH_IMAGE110
列,
Figure 646260DEST_PATH_IMAGE111
表示Hausdorff距离矩阵的 第
Figure 231962DEST_PATH_IMAGE110
列对应的航迹核心对象;以主对角线为对称轴,将主对角线右上方的值赋给主对角线 左下方对应的值;
若需要合并的两个航迹核心对象
Figure 262804DEST_PATH_IMAGE112
Figure 707692DEST_PATH_IMAGE113
,航迹核心对象
Figure 45133DEST_PATH_IMAGE112
包含
Figure 298391DEST_PATH_IMAGE114
个原始的航迹核心对象,
Figure 102399DEST_PATH_IMAGE115
航迹核心对象
Figure 628058DEST_PATH_IMAGE116
Figure 51080DEST_PATH_IMAGE117
个原始 的航迹核心对象,
Figure 283478DEST_PATH_IMAGE118
则更新后的航迹核心对象
Figure 586284DEST_PATH_IMAGE112
与航迹核心对象
Figure 146709DEST_PATH_IMAGE113
之间加权后的双向Hausdorff距离为:
Figure 763635DEST_PATH_IMAGE119
其中,
Figure 709594DEST_PATH_IMAGE120
表示航迹核心对象
Figure 196683DEST_PATH_IMAGE112
与航迹核心对象
Figure 369038DEST_PATH_IMAGE113
间未加权过的双向Hausdorff距离;
Figure 383131DEST_PATH_IMAGE121
表示本次合并之前的矩阵
Figure 668750DEST_PATH_IMAGE091
中,
Figure 985462DEST_PATH_IMAGE122
Figure 707430DEST_PATH_IMAGE123
的最 小值对应的行的加权系数。
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式 挖掘方法中,步骤S7中,利用如下公式计算航迹聚类簇
Figure 275946DEST_PATH_IMAGE112
的类内距离平均值:
Figure 337443DEST_PATH_IMAGE124
利用如下公式计算航迹聚类簇
Figure 418531DEST_PATH_IMAGE112
与其他所有航迹聚类簇
Figure 175266DEST_PATH_IMAGE125
的类 间距离平均值:
Figure 672106DEST_PATH_IMAGE126
本发明还提供了一种基于自适应层次聚类的航迹模式挖掘装置,包括:信息获取模块、航迹预处理模块、航迹核心对象生成模块、距离矩阵生成模块、自适应权重调整模块、层次聚类模块以及航迹模式可视化模块;其中,
所述信息获取模块,用于针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
所述航迹预处理模块,用于对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
所述航迹核心对象生成模块,用于将预处理后的各航迹序列作为输入数据,计算每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
所述距离矩阵生成模块,用于将选取的各航迹核心对象作为的输入数据,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
所述自适应权重调整模块,用于根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
所述层次聚类模块,用于采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;在类内距离平均值与类间距离平均值的比值大于或等于阈值时,判断航迹聚类簇的个数是否大于3;在航迹聚类簇的个数大于3时,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;
所述航迹模式可视化模块,用于在类内距离平均值与类间距离平均值的比值小于阈值时,或者,在类内距离平均值与类间距离平均值的比值大于或等于阈值且航迹聚类簇的个数小于或等于3时,将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法及装置,通过信息获取模块得到民航航班的飞行轨迹数据,进行预处理后,基于数据密度分布对数据进行核心对象提取,使用基于航迹数据相关性的自适应层次聚类算法对航班的航迹运动模式进行挖掘并可视化。由于自适应层次聚类算法的使用需要获取航班的飞行轨迹数据,因此,飞行轨迹数据包括航班三维坐标位置、飞行速度、航向角度以及时间点。具体地,首先通过信息获取模块对航班航迹信息进行提取,并接入航迹预处理模块进行数据预处理得到规整的航迹序列,然后通过航迹核心对象生成模块根据航迹密度分布生成核心对象并滤除噪声,对核心对象通过自适应权重调整模块进行加权,再通过层次聚类模块进行模式挖掘,最终通过航迹模式可视化模块对挖掘出的航迹模式进行展示。本发明针对空中交通运行高密度、高复杂度的状况,实现了在多航班运行环境下的航迹模式挖掘,为航迹模式挖掘问题的解决提出了一个全新的方案;本发明围绕着海量航班运行背景下的航迹模式精准快速挖掘,从提升空中交通系统安全性和高效性两方面出发,开展航迹模式挖掘方法研究,对于确保航班飞行安全、合理调配空域容量、检测异常飞行状况、预测航班未来飞行行为以及提高空中交通系统的运行效率具有重要的意义;本发明针对现有技术在挖掘航迹模式时不同规模的航迹容易相互交织的难点问题,提出通过自适应加权的方式辅助合并操作的进行,通过加权有效控制合并的顺序,使应属于大规模航迹模式的航迹先于应属于小规模航迹模式的航迹,从而可以显著减少大模式吞并小模式的发生;本发明能够处理空域内各城市对间规模不一、相互交织的航迹模式挖掘问题,航迹模式识别精度高,对参数的依赖小,可以有效解决复杂环境下的航迹模式挖掘问题。
附图说明
图1为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法的流程示意图;
图2为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中航迹向量示意图;
图3为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中可能出现的航迹异常值示意图;
图4为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中航迹重采样示意图;
图5为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中航迹核心对象的选取示意图;
图6为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中航迹核心对象的合并示意图。
具体实施方式
下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整的描述,显然,所描述的实施方式仅仅是作为例示,并非用于限制本发明。
本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法,如图1所示,包括如下步骤:
S1:针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
具体地,每个航迹序列为六维向量序列,包含上述六种信息;
S2:对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
具体地经过上述四个步骤的预处理后,每个航迹序列平滑连接,各航迹序列长度统一,即各航迹序列包含的航迹向量数相同;
S3:计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
S4:计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
S5:根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
S6:采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;
S7:计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;若否,则执行步骤S8;若是,则执行步骤S9;
具体地,步骤S7是判断层次聚类的效果是否满足航迹数据的航迹模式识别需求;如果类内距离平均值与类间距离平均值的比值小于阈值,则认为层次聚类的效果较为理想,此时可执行步骤S9;如果类内距离平均值与类间距离平均值的比值大于或等于阈值,则认为层次聚类的效果不理想,此时需要执行步骤S8进一步判断;
S8:判断航迹聚类簇的个数是否大于3;若是,则返回步骤S5,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;若否,则执行步骤S9;
具体地,如果层次聚类的效果不理想,且航迹聚类簇的个数大于3,则需要返回步骤S5,继续进行下一层的层次聚类;如果层次聚类的效果不理想,且航迹聚类簇的个数小于或等于3,则可以执行步骤S9,针对此时的聚类结果进行可视化展示;
S9:将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法,在空域中,在各城市对之间运行的每架航班将自己的飞行轨迹进行上传汇总,通过去除异常值、去重、分段以及重采样整理成为规整的四维航迹序列,运用Hausdorff距离计算方法得出每两条航迹间的空间距离,随后运用基于密度的核心对象生成算法,从航迹中抽取高密度的航迹核心对象,再通过航迹核心对象间的空间距离构建航迹距离矩阵,将航迹距离矩阵输入至自适应权重调整模块,根据航迹核心对象间距的分布确定相应的权重值,对航迹距离矩阵进行加权,随后针对加权后的航迹距离矩阵,采用层次聚类算法对航迹核心对象进行聚类。如果层次聚类的效果满足航迹数据的航迹模式识别需求,即类内距离与类间距离的比值小于一定阈值,则将聚类结束的航迹簇转换为航迹运动模式进行可视化;如果聚类的结果不满足阈值要求,则根据当前的航迹簇分布调整权重,继续进行下一层的层次聚类;如果层次聚类在聚类簇数不足时依然不能满足阈值要求,则针对现有的航迹簇结果进行展示。本发明的最终目标是在空域中从较为杂乱的航班运动里挖掘出不同规模的航迹运动模式并进行展示。
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法 中,步骤S1中,针对某一时间段的某一城市对,例如2019年全年由北京至上海,接入该时间 段内的航班运行时刻表,如果一架飞机在该时间段内执行了该城市对的航班,则收集该航 班的ADS-B数据,并整理成为该航班的航迹序列
Figure 447164DEST_PATH_IMAGE003
,第
Figure 452816DEST_PATH_IMAGE001
个航迹序列
Figure 821480DEST_PATH_IMAGE002
,代表航迹序列
Figure 246645DEST_PATH_IMAGE003
包含
Figure 751576DEST_PATH_IMAGE004
个航迹向量,
Figure 925200DEST_PATH_IMAGE005
Figure 171373DEST_PATH_IMAGE006
表示航迹序列的数量;其中航迹向量
Figure 823066DEST_PATH_IMAGE007
,其中,
Figure 448082DEST_PATH_IMAGE008
表示航迹向量
Figure 838612DEST_PATH_IMAGE009
的实时经 度,
Figure 791656DEST_PATH_IMAGE010
表示航迹向量
Figure 572005DEST_PATH_IMAGE009
的实时纬度,
Figure 51528DEST_PATH_IMAGE011
表示航迹向量
Figure 629271DEST_PATH_IMAGE009
的实时高度,
Figure 584458DEST_PATH_IMAGE012
表示航迹向量
Figure 499324DEST_PATH_IMAGE009
的实时飞行速度,
Figure 974299DEST_PATH_IMAGE013
表示航迹向量
Figure 909894DEST_PATH_IMAGE009
的实时航向角,
Figure 227743DEST_PATH_IMAGE014
表示航迹向量
Figure 821666DEST_PATH_IMAGE009
的实时时间 点,如图2所示。
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法 中,针对步骤S1中的航迹序列
Figure 72519DEST_PATH_IMAGE003
,由于ADS-B基站设置、数据采样时间、飞机飞行动态等因 素的影响,每一个航迹序列中可能会包含少量的错误及重复数据,所包含的航迹向量的数 量往往也是不同的,并且,航班在飞过情报区的边界时,需更换联络的区调,航班的飞行方 式也会出现一系列的改变。针对以上的问题,在步骤S2中,对形成的各航迹序列进行预处 理,包括去除异常值、去重、分段和重采样;其中,
对航迹序列
Figure 819213DEST_PATH_IMAGE003
进行去除异常值,具体可以通过以下方式来实现:常见的航迹异常 值如图3所示,在由起飞机场A到降落机场B的途中,圆圈内的航迹发生偏离,为航迹异常值; 首先,提取每个航迹向量的实时飞行速度,若
Figure 358779DEST_PATH_IMAGE015
Figure 208923DEST_PATH_IMAGE016
,说明航班的运行速度数据项存在异常,则将飞行速度
Figure 392911DEST_PATH_IMAGE012
对应的航迹向量
Figure 607992DEST_PATH_IMAGE009
去除;然后, 提取每个航迹向量的实时航向角,若
Figure 697170DEST_PATH_IMAGE017
Figure 898476DEST_PATH_IMAGE018
,说明飞机 的航向角采集出现问题,则将航向角
Figure 327183DEST_PATH_IMAGE013
对应的航迹向量
Figure 572219DEST_PATH_IMAGE009
去除;其中,
Figure 165006DEST_PATH_IMAGE019
表示航迹向量
Figure 29057DEST_PATH_IMAGE020
的实时航向角,
Figure 436904DEST_PATH_IMAGE021
表示航迹向量
Figure 993788DEST_PATH_IMAGE022
的实时航向角,
Figure 805361DEST_PATH_IMAGE023
Figure 597737DEST_PATH_IMAGE024
;最 后,提取每个航迹向量的实时经度、实时纬度和实时高度,若
Figure 735457DEST_PATH_IMAGE025
说明在
Figure 541870DEST_PATH_IMAGE009
处,航班的位置点发生了跳变,则将经度
Figure 889675DEST_PATH_IMAGE008
、纬度
Figure 361108DEST_PATH_IMAGE010
和高度
Figure 431963DEST_PATH_IMAGE011
对应的 航迹向量
Figure 189703DEST_PATH_IMAGE009
去除;其中,
Figure 165750DEST_PATH_IMAGE026
表示航迹向量
Figure 847398DEST_PATH_IMAGE022
的实时经度,
Figure 694131DEST_PATH_IMAGE027
表示航迹向量
Figure 907593DEST_PATH_IMAGE022
的实 时纬度,
Figure 636515DEST_PATH_IMAGE028
表示航迹向量
Figure 590696DEST_PATH_IMAGE022
的实时高度,
Figure 885411DEST_PATH_IMAGE029
表示航迹向量
Figure 860320DEST_PATH_IMAGE020
的实时经度,
Figure 686325DEST_PATH_IMAGE030
表示 航迹向量
Figure 37672DEST_PATH_IMAGE020
的实时纬度,
Figure 186893DEST_PATH_IMAGE031
表示航迹向量
Figure 942491DEST_PATH_IMAGE020
的实时高度;
对航迹序列
Figure 973901DEST_PATH_IMAGE003
进行去重,具体可以通过以下方式来实现:遍历航迹序列
Figure 128938DEST_PATH_IMAGE003
的所有 航迹向变量,若存在
Figure 146048DEST_PATH_IMAGE032
,则将重复的航迹向量
Figure 852973DEST_PATH_IMAGE033
去除;
对航迹序列
Figure 325674DEST_PATH_IMAGE003
进行分段,具体可以通过以下方式来实现:首先,获取航迹序列
Figure 18824DEST_PATH_IMAGE003
的所有经度和纬度,组成多个经纬度点,然后,引接我国的空域情报区划分数据,按照各经 纬度点所属的情报区进行标号;
对航迹序列
Figure 204954DEST_PATH_IMAGE003
进行重采样,具体可以通过以下方式来实现:如图4所示,航迹
Figure 36775DEST_PATH_IMAGE127
的 点数为8,对由起飞机场A到降落机场B的航迹
Figure 652564DEST_PATH_IMAGE003
进行重采样,重采样点为C,采样后的航迹 序列为
Figure 274039DEST_PATH_IMAGE036
。针对航迹序列
Figure 190042DEST_PATH_IMAGE003
在同一个情报区内的数据段,选取重采样点数为100,以航班航 迹点数对重采样点数做整数除法得出重采样步长,余数的一半作为航迹序列
Figure 192764DEST_PATH_IMAGE003
在该情报 区内的数据段首尾需去除的点数,按照重采样步长对航迹序列
Figure 686062DEST_PATH_IMAGE003
在该情报区内的数据段 进行重采样,重采样计算公式如下:
Figure 721014DEST_PATH_IMAGE035
其中,
Figure 358102DEST_PATH_IMAGE036
表示重采样后的航迹序列,
Figure 453097DEST_PATH_IMAGE128
表示航迹
Figure 371374DEST_PATH_IMAGE003
的第
Figure 85383DEST_PATH_IMAGE038
个航迹序 列,
Figure 975979DEST_PATH_IMAGE039
表示重采样的起始位置,
Figure 366509DEST_PATH_IMAGE040
表示整数除法后确定的重采样步长,
Figure 522815DEST_PATH_IMAGE041
以1的步长从0取到 99,表示重采样所需的100个点。
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S3,计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象,具体可以通过以下方式来实现:
利用如下公式计算预处理后的航迹序列
Figure 165149DEST_PATH_IMAGE036
与预处理后的航迹序列
Figure 238147DEST_PATH_IMAGE042
之间未加权 过的双向Hausdorff距离
Figure 753573DEST_PATH_IMAGE043
Figure 443180DEST_PATH_IMAGE044
Figure 623626DEST_PATH_IMAGE045
Figure 361250DEST_PATH_IMAGE046
其中,表示航迹序列 到航迹序列 的单向Hausdorff距离,
Figure 990629DEST_PATH_IMAGE053
表示航迹向量
Figure 34808DEST_PATH_IMAGE054
的空间位置
Figure 387423DEST_PATH_IMAGE055
与航迹向量
Figure 299885DEST_PATH_IMAGE056
的空间位置
Figure 687135DEST_PATH_IMAGE057
的空间欧式距离,表示航迹序列 到航迹序列 的单向 Hausdorff距离,
Figure 624336DEST_PATH_IMAGE060
表示航迹向量
Figure 134952DEST_PATH_IMAGE061
的空间位置
Figure 383531DEST_PATH_IMAGE062
与航迹向量
Figure 326210DEST_PATH_IMAGE063
的 空间位置
Figure 734058DEST_PATH_IMAGE064
的空间欧式距离;
在核心对象生成算法开始前,需设置参数
Figure 290941DEST_PATH_IMAGE065
作为航迹序列间双向Hausdorff距离
Figure 902182DEST_PATH_IMAGE043
的阈值,设置参数
Figure 897820DEST_PATH_IMAGE066
作为生成航迹核心对象所需包含的最少“邻居”航迹 序列数;生成航迹核心对象的方法如下:选取一个航迹序列
Figure 301120DEST_PATH_IMAGE036
,计算
Figure 638691DEST_PATH_IMAGE036
与其他所有航迹序列 间的双向Hausdorff距离
Figure 189758DEST_PATH_IMAGE067
;若对于某一个
Figure 661191DEST_PATH_IMAGE068
,使
Figure 791433DEST_PATH_IMAGE069
,则进行一 次计数;当遍历完所有的航迹序列后,若计数的值大于或等于
Figure 424540DEST_PATH_IMAGE066
,则将航迹序列
Figure 462903DEST_PATH_IMAGE036
定 义为航迹核心对象;遍历所有航迹序列后,得到在参数
Figure 613393DEST_PATH_IMAGE065
Figure 788022DEST_PATH_IMAGE066
下的航迹核心对象集 合,航迹核心对象的选取如图5所示,在由起飞机场A到降落机场B的途中,椭圆圈出的航迹 为核心对象。
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S4,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵,具体可以通过以下方式来实现:
假设共生成
Figure 857609DEST_PATH_IMAGE070
个航迹核心对象,则Hausdorff距离矩阵为:
Figure 930739DEST_PATH_IMAGE071
其中,
Figure 743974DEST_PATH_IMAGE043
表示航迹核心对象
Figure 773110DEST_PATH_IMAGE072
与航迹核心对象
Figure 357806DEST_PATH_IMAGE042
间未加权过的双向 Hausdorff距离,满足:
Figure 167499DEST_PATH_IMAGE073
Figure 518846DEST_PATH_IMAGE129
在生成Hausdorff距离矩阵
Figure 433448DEST_PATH_IMAGE130
后,此时的聚类簇数
Figure 969472DEST_PATH_IMAGE131
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法 中,针对生成的Hausdorff距离矩阵
Figure 141827DEST_PATH_IMAGE130
,可以得知每一行,也就是每一个航迹核心对象与其 他所有核心对象的距离分布;由于在空域中,航迹模式交织情况较为严重,若直接对航迹核 心对象进行合并层次聚类,则极有可能在规模较大的聚类还未完全形成时,规模较小的模 式就已经与其他的模式合并,这样会导致航迹模式挖掘的准确性下降,因此,针对这一问 题,在步骤S5中,根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对 Hausdorff距离矩阵的每一行进行加权,具体地,步骤S5可以包括如下步骤:
S53:判断某一个航迹核心对象 是否与其他所有航迹核心对象中超过第一阈值
Figure 441539DEST_PATH_IMAGE075
的航迹核心对象间的双向Hausdorff距离小于
Figure 23830DEST_PATH_IMAGE076
Figure 293268DEST_PATH_IMAGE077
;若是,说明航迹核心 对象
Figure 314314DEST_PATH_IMAGE036
处于一个大规模航迹模式中,则执行步骤S54;若否,则执行步骤S55;其中,
Figure 375811DEST_PATH_IMAGE078
表示航 迹核心对象
Figure 738790DEST_PATH_IMAGE036
与其他航迹核心对象间的最远双向Hausdorff距离;
S54:将航迹核心对象在Hausdorff距离矩阵的对应行的所有值均乘以加权系数
Figure 948055DEST_PATH_IMAGE079
Figure 444895DEST_PATH_IMAGE080
,同时记录
Figure 233335DEST_PATH_IMAGE132
;其中,
Figure 485325DEST_PATH_IMAGE082
表示航迹核心对象
Figure 588410DEST_PATH_IMAGE036
的加权系数;
S55:判断航迹核心对象
Figure 498728DEST_PATH_IMAGE083
与其他所有的航迹核心对象中超过第二阈值
Figure 534817DEST_PATH_IMAGE084
的 航迹核心对象间的双向Hausdorff距离大于
Figure 754446DEST_PATH_IMAGE085
Figure 423456DEST_PATH_IMAGE086
;若是,说明航迹核心对象
Figure 527678DEST_PATH_IMAGE036
处于一 个小规模航迹模式中,则执行步骤S56;若否,则执行步骤S57;
S56:将航迹核心对象
Figure 277328DEST_PATH_IMAGE036
在Hausdorff距离矩阵的对应行的所有值均乘以加权系数
Figure 621853DEST_PATH_IMAGE087
Figure 699531DEST_PATH_IMAGE088
,同时记录
Figure 466498DEST_PATH_IMAGE089
S57:记录
Figure 946021DEST_PATH_IMAGE090
S58:遍历Hausdorff距离矩阵的所有行后,对得到的Hausdorff距离矩阵根据主对 角线进行翻转,即,将Hausdorff距离矩阵右上部分的值赋给其主对角线上对称的左下部分 位置,得到加权后的Hausdorff距离矩阵
Figure 464377DEST_PATH_IMAGE091
以及各个航迹核心对象的加权情况
Figure 419564DEST_PATH_IMAGE092
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S6,采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,合并的效果如图6所示,在由起飞机场A到降落机场B的途中,椭圆圈出的两条航迹进行合并,生成一个新的航迹核心对象。通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵,具体可以通过以下方式来实现:
由于加权得到的Hausdorff距离矩阵H是针对其主对角线对称的,因此,在加权后 的Hausdorff距离矩阵
Figure 600009DEST_PATH_IMAGE091
的主对角线的右侧选取
Figure 809405DEST_PATH_IMAGE091
中的最小值:
Figure 745000DEST_PATH_IMAGE133
其中,
Figure 62849DEST_PATH_IMAGE094
表示航迹核心对象
Figure 922351DEST_PATH_IMAGE036
和航迹核心对象
Figure 110887DEST_PATH_IMAGE042
间加权后的双向 Hausdorff距离;将航迹核心对象
Figure 217384DEST_PATH_IMAGE036
Figure 897895DEST_PATH_IMAGE042
合并,生成一个新的航迹核心对象
Figure 748039DEST_PATH_IMAGE095
,同时将加 权后的Hausdorff距离矩阵
Figure 56661DEST_PATH_IMAGE091
关于主对角线的右上侧部分进行更新,更新方法为将加权后 的Hausdorff距离矩阵
Figure 144178DEST_PATH_IMAGE091
中与
Figure 498936DEST_PATH_IMAGE036
Figure 559296DEST_PATH_IMAGE042
相关的两行与两列剔除,将新生成的航迹核心对象
Figure 863369DEST_PATH_IMAGE095
置于加权后的Hausdorff距离矩阵
Figure 577247DEST_PATH_IMAGE091
中的第
Figure 825826DEST_PATH_IMAGE001
行第
Figure 565243DEST_PATH_IMAGE001
列,同时第j行后的航迹核心对象上 移一位,第j列后的航迹核心对象左移一位,补充原
Figure 114036DEST_PATH_IMAGE091
中被剔除的第j行与第j列;其中,
Figure 733236DEST_PATH_IMAGE001
行的双向Hausdorff距离的计算方法为:
Figure 344477DEST_PATH_IMAGE096
Figure 12219DEST_PATH_IMAGE001
列的双向Hausdorff距离的计算方法为:
Figure 540152DEST_PATH_IMAGE134
其中,
Figure 72197DEST_PATH_IMAGE098
表示航迹核心对象
Figure 560947DEST_PATH_IMAGE099
与航迹核心对象
Figure 891434DEST_PATH_IMAGE036
间未加权过的双向 Hausdorff距离,
Figure 962290DEST_PATH_IMAGE100
Figure 860976DEST_PATH_IMAGE101
表示航迹核心对象
Figure 696076DEST_PATH_IMAGE099
与航迹核心 对象
Figure 705621DEST_PATH_IMAGE042
间未加权过的双向Hausdorff距离,
Figure 693299DEST_PATH_IMAGE102
Figure 825204DEST_PATH_IMAGE103
表示 航迹核心对象
Figure 288546DEST_PATH_IMAGE036
与航迹核心对象
Figure 711568DEST_PATH_IMAGE104
间未加权过的双向Hausdorff距离;
Figure 6283DEST_PATH_IMAGE105
表示航迹核心对象
Figure 246772DEST_PATH_IMAGE042
与航迹核心对象
Figure 804267DEST_PATH_IMAGE104
间未加权过的双向Hausdorff距离;
Figure 483510DEST_PATH_IMAGE106
表示本 次合并之前的矩阵
Figure 304836DEST_PATH_IMAGE091
中第w行对应的加权系数;
Figure 857171DEST_PATH_IMAGE107
表示本次合并之前的矩阵
Figure 91843DEST_PATH_IMAGE091
中第j行对应 的加权系数;
在新生成的这一行和一列生成后,将其置于矩阵H的第
Figure 981302DEST_PATH_IMAGE001
行与第
Figure 798079DEST_PATH_IMAGE001
列,新产生的航迹 核心对象在后续的合并操作中可以被再次加权。在更新完第
Figure 645950DEST_PATH_IMAGE001
行和第
Figure 164656DEST_PATH_IMAGE001
列后,在这一行和这 一列之后的各行、列元素依次排列在矩阵H中,即第j行和第j列之后的值向上或左位移一 位,按照如下公式更新Hausdorff距离矩阵主对角线右上方的值:
Figure 936434DEST_PATH_IMAGE108
其中,
Figure 466772DEST_PATH_IMAGE109
Figure 79019DEST_PATH_IMAGE110
表示Hausdorff距离矩阵的第
Figure 41946DEST_PATH_IMAGE110
列,
Figure 663420DEST_PATH_IMAGE111
表示Hausdorff距离矩阵的 第
Figure 579423DEST_PATH_IMAGE110
列对应的航迹核心对象;以主对角线为对称轴,将主对角线右上方的值赋给主对角线 左下方对应的值,以保证矩阵H对称于主对角线;
若在聚类后期,需要合并的两个航迹核心对象
Figure 113304DEST_PATH_IMAGE112
Figure 809865DEST_PATH_IMAGE113
,航迹 核心对象
Figure 844817DEST_PATH_IMAGE112
包含
Figure 756272DEST_PATH_IMAGE114
个原始的航迹核心对象,
Figure 585688DEST_PATH_IMAGE115
航迹核心对象
Figure 566282DEST_PATH_IMAGE113
Figure 483554DEST_PATH_IMAGE117
个原始的航迹核心对象,
Figure 842991DEST_PATH_IMAGE118
则更新后的航迹核心对象
Figure 499100DEST_PATH_IMAGE112
与航迹核心对 象
Figure 576778DEST_PATH_IMAGE113
之间加权后的双向Hausdorff距离为:
Figure 294810DEST_PATH_IMAGE135
其中,
Figure 898967DEST_PATH_IMAGE120
表示航迹核心对象
Figure 601344DEST_PATH_IMAGE112
与航迹核心对象
Figure 41683DEST_PATH_IMAGE113
间未加权过的双向Hausdorff距离;
Figure 550025DEST_PATH_IMAGE121
表示本次合并之前的矩阵
Figure 149634DEST_PATH_IMAGE091
中,
Figure 835961DEST_PATH_IMAGE122
Figure 12865DEST_PATH_IMAGE123
的最 小值对应的行的加权系数。在一步合并后,聚类簇的个数
Figure 731422DEST_PATH_IMAGE136
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法 中,步骤S7中,利用如下公式计算航迹聚类簇
Figure 326482DEST_PATH_IMAGE112
的类内距离平均值,即类内的未 加权的原始航迹核心对象两两距离的平均值:
Figure 105083DEST_PATH_IMAGE137
利用如下公式计算航迹聚类簇
Figure 972544DEST_PATH_IMAGE112
与其他所有航迹聚类簇
Figure 650387DEST_PATH_IMAGE125
的类 间距离平均值,即经过合并后生成的Harsdorff距离矩阵中与该类对应的一行的平均值:
Figure 959008DEST_PATH_IMAGE138
如果针对每一类航迹簇,类内距离平均值都小于类间距离平均值的比例阈值
Figure 236406DEST_PATH_IMAGE139
,即
Figure 873055DEST_PATH_IMAGE140
,则认为层次聚类的效果已经较为理想,此时可以执行步骤 S9;如果两种距离的关系不满足要求,且航迹聚类簇的个数
Figure 464573DEST_PATH_IMAGE141
,则返回步骤S5,针对现 有的数据分布,对现有Hausdorff距离矩阵中进行了合并操作的对象进行再次加权,之后进 行下一层合并层次聚类;如果两种距离的关系不满足要求,且航迹聚类簇的个数
Figure 955597DEST_PATH_IMAGE142
, 则可以执行步骤S9,对现有的结果进行可视化展示。
在复杂的空域环境下完成航迹模式的自适应挖掘后,可以使空管部门对于航班在空域中的运行方式有所了解,便于在航班出现不同于现有航迹模式时及时进行告警,在航班执行一定距离后预测后续的飞行轨迹,以及对空域流量、扇区开合做出优化调控,为空域安全性和高效性提供有力支撑,具有积极的意义。
基于同一发明构思,本发明还提供了一种基于自适应层次聚类的航迹模式挖掘装置,包括:信息获取模块、航迹预处理模块、航迹核心对象生成模块、距离矩阵生成模块、自适应权重调整模块、层次聚类模块以及航迹模式可视化模块;其中,
信息获取模块,用于针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
航迹预处理模块,用于对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
航迹核心对象生成模块,用于将预处理后的各航迹序列作为输入数据,计算每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
距离矩阵生成模块,用于将选取的各航迹核心对象作为的输入数据,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
自适应权重调整模块,用于根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
层次聚类模块,用于采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;在类内距离平均值与类间距离平均值的比值大于或等于阈值时,判断航迹聚类簇的个数是否大于3;在航迹聚类簇的个数大于3时,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;
航迹模式可视化模块,用于在类内距离平均值与类间距离平均值的比值小于阈值时,或者,在类内距离平均值与类间距离平均值的比值大于或等于阈值且航迹聚类簇的个数小于或等于3时,将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
本发明提供的上述基于自适应层次聚类的航迹模式挖掘装置的具体实施与本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法的实施类似,在此不做赘述。
本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法及装置,通过信息获取模块得到民航航班的飞行轨迹数据,进行预处理后,基于数据密度分布对数据进行核心对象提取,使用基于航迹数据相关性的自适应层次聚类算法对航班的航迹运动模式进行挖掘并可视化。由于自适应层次聚类算法的使用需要获取航班的飞行轨迹数据,因此,飞行轨迹数据包括航班三维坐标位置、飞行速度、航向角度以及时间点。具体地,首先通过信息获取模块对航班航迹信息进行提取,并接入航迹预处理模块进行数据预处理得到规整的航迹序列,然后通过航迹核心对象生成模块根据航迹密度分布生成核心对象并滤除噪声,对核心对象通过自适应权重调整模块进行加权,再通过层次聚类模块进行模式挖掘,最终通过航迹模式可视化模块对挖掘出的航迹模式进行展示。本发明针对空中交通运行高密度、高复杂度的状况,实现了在多航班运行环境下的航迹模式挖掘,为航迹模式挖掘问题的解决提出了一个全新的方案;本发明围绕着海量航班运行背景下的航迹模式精准快速挖掘,从提升空中交通系统安全性和高效性两方面出发,开展航迹模式挖掘方法研究,对于确保航班飞行安全、合理调配空域容量、检测异常飞行状况、预测航班未来飞行行为以及提高空中交通系统的运行效率具有重要的意义;本发明针对现有技术在挖掘航迹模式时不同规模的航迹容易相互交织的难点问题,提出通过自适应加权的方式辅助合并操作的进行,通过加权有效控制合并的顺序,使应属于大规模航迹模式的航迹先于应属于小规模航迹模式的航迹,从而可以显著减少大模式吞并小模式的发生;本发明能够处理空域内各城市对间规模不一、相互交织的航迹模式挖掘问题,航迹模式识别精度高,对参数的依赖小,可以有效解决复杂环境下的航迹模式挖掘问题。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (3)

1.一种基于自适应层次聚类的航迹模式挖掘方法,其特征在于,包括如下步骤:
S1:针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
S2:对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
S3:计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
S4:计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
S5:根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
S6:采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;
S7:计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;若否,则执行步骤S8;若是,则执行步骤S9;
S8:判断航迹聚类簇的个数是否大于3;若是,则返回步骤S5,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;若否,则执行步骤S9;
S9:将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示;
其中,步骤S1中,第
Figure 498898DEST_PATH_IMAGE001
个航迹序列为
Figure 416038DEST_PATH_IMAGE002
,代表航迹序列
Figure 399038DEST_PATH_IMAGE003
包含
Figure 794247DEST_PATH_IMAGE004
个航迹向量,
Figure 874198DEST_PATH_IMAGE005
Figure 696661DEST_PATH_IMAGE006
表示航迹序列的数量;其中航迹向量
Figure 963694DEST_PATH_IMAGE007
,其中,
Figure 365857DEST_PATH_IMAGE008
表示航迹向量
Figure 34735DEST_PATH_IMAGE009
的实时经度,
Figure 28099DEST_PATH_IMAGE010
表示航迹向量
Figure 48008DEST_PATH_IMAGE009
的实时纬度,
Figure 785020DEST_PATH_IMAGE011
表示航迹向量
Figure 308405DEST_PATH_IMAGE009
的实时高度,
Figure 190779DEST_PATH_IMAGE012
表示航迹向量
Figure 432405DEST_PATH_IMAGE009
的实时飞行速度,
Figure 707528DEST_PATH_IMAGE013
表示航迹向量
Figure 616578DEST_PATH_IMAGE009
的实时航向角,
Figure 951745DEST_PATH_IMAGE014
表示航迹向量
Figure 680666DEST_PATH_IMAGE009
的实时时间点;
步骤S2中,对航迹序列
Figure 962743DEST_PATH_IMAGE003
进行去除异常值,具体包括:
提取每个航迹向量的实时飞行速度,若
Figure 460720DEST_PATH_IMAGE015
节/小时或
Figure 497947DEST_PATH_IMAGE016
节/小时,则将飞行速度
Figure 448585DEST_PATH_IMAGE012
对应的航迹向量
Figure 331090DEST_PATH_IMAGE009
去除;
提取每个航迹向量的实时航向角,若
Figure 886837DEST_PATH_IMAGE017
Figure 829385DEST_PATH_IMAGE018
,则将航向角
Figure 267320DEST_PATH_IMAGE013
对应的航迹向量
Figure 953516DEST_PATH_IMAGE009
去除;其中,
Figure 426085DEST_PATH_IMAGE019
表示航迹向量
Figure 539535DEST_PATH_IMAGE020
的实时航向角,
Figure 668028DEST_PATH_IMAGE021
表示航迹向量
Figure 892336DEST_PATH_IMAGE022
的实时航向角,
Figure 219412DEST_PATH_IMAGE023
Figure 503763DEST_PATH_IMAGE024
提取每个航迹向量的实时经度、实时纬度和实时高度,若
Figure 916290DEST_PATH_IMAGE025
,则将经度
Figure 396818DEST_PATH_IMAGE008
、纬度
Figure 578401DEST_PATH_IMAGE010
和高度
Figure 768074DEST_PATH_IMAGE011
对应的航迹向量
Figure 933476DEST_PATH_IMAGE009
去除;其中,
Figure 499587DEST_PATH_IMAGE026
表示航迹向量
Figure 801255DEST_PATH_IMAGE027
的实时经度,
Figure 365091DEST_PATH_IMAGE028
表示航迹向量
Figure 752210DEST_PATH_IMAGE022
的实时纬度,
Figure 122012DEST_PATH_IMAGE029
表示航迹向量
Figure 278187DEST_PATH_IMAGE027
的实时高度,
Figure 75241DEST_PATH_IMAGE030
表示航迹向量
Figure 887340DEST_PATH_IMAGE020
的实时经度,
Figure 60832DEST_PATH_IMAGE031
表示航迹向量
Figure 71513DEST_PATH_IMAGE032
的实时纬度,
Figure 305049DEST_PATH_IMAGE033
表示航迹向量
Figure 401181DEST_PATH_IMAGE020
的实时高度;
步骤S2中,对航迹序列
Figure 316047DEST_PATH_IMAGE003
进行去重,具体包括:
遍历航迹序列
Figure 181235DEST_PATH_IMAGE003
的所有航迹向量,若存在
Figure 320092DEST_PATH_IMAGE034
,则将重复的航迹向量
Figure 169099DEST_PATH_IMAGE035
去除;
步骤S2中,对航迹序列
Figure 418815DEST_PATH_IMAGE003
进行分段,具体包括:
获取航迹序列
Figure 404089DEST_PATH_IMAGE003
的所有经度和纬度,组成多个经纬度点,引接空域情报区划分数据,按照各经纬度点所属的情报区进行标号;
步骤S2中,对航迹序列
Figure 713847DEST_PATH_IMAGE003
进行重采样,具体包括:
针对航迹序列
Figure 237101DEST_PATH_IMAGE003
在同一个情报区内的数据段,计算航班航迹点数
Figure 290508DEST_PATH_IMAGE036
,选取重采样点数为100,以航班航迹点数对重采样点数做整数除法得出重采样步长,余数的一半作为航迹序列
Figure 395867DEST_PATH_IMAGE003
在该情报区内的数据段首尾需去除的点数,按照重采样步长对航迹序列
Figure 876527DEST_PATH_IMAGE003
在该情报区内的数据段进行重采样,重采样计算公式如下:
Figure 168968DEST_PATH_IMAGE037
其中,
Figure 229328DEST_PATH_IMAGE038
表示重采样后的航迹序列,
Figure 923615DEST_PATH_IMAGE039
表示航迹
Figure 840755DEST_PATH_IMAGE003
的第
Figure 886072DEST_PATH_IMAGE040
个航迹序列,
Figure 281281DEST_PATH_IMAGE041
表示重采样的起始位置,
Figure 33336DEST_PATH_IMAGE043
表示整数除法后确定的重采样步长,
Figure 121378DEST_PATH_IMAGE044
以1的步长从0取到99,表示重采样所需的100个点;
步骤S3,计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象,具体包括:
利用如下公式计算航迹序列
Figure 388411DEST_PATH_IMAGE038
与航迹序列
Figure 852890DEST_PATH_IMAGE045
之间未加权过的双向Hausdorff距离
Figure 256190DEST_PATH_IMAGE046
Figure 515133DEST_PATH_IMAGE047
其中,
Figure 472725DEST_PATH_IMAGE048
表示航迹序列
Figure 209737DEST_PATH_IMAGE038
到航迹序列
Figure 733122DEST_PATH_IMAGE045
的单向Hausdorff距离,
Figure 428545DEST_PATH_IMAGE049
表示航迹向量
Figure 404592DEST_PATH_IMAGE050
的空间位置
Figure 945294DEST_PATH_IMAGE051
与航迹向量
Figure 41295DEST_PATH_IMAGE052
的空间位置
Figure 376462DEST_PATH_IMAGE053
的空间欧式距离,
Figure 370962DEST_PATH_IMAGE054
表示航迹序列
Figure 449777DEST_PATH_IMAGE045
到航迹序列
Figure 947754DEST_PATH_IMAGE038
的单向Hausdorff距离,
Figure 657084DEST_PATH_IMAGE055
表示航迹向量
Figure 873302DEST_PATH_IMAGE056
空间位置
Figure 755807DEST_PATH_IMAGE057
与航迹向量
Figure 373871DEST_PATH_IMAGE058
的空间位置
Figure 316419DEST_PATH_IMAGE059
的空间欧式距离;
设置参数
Figure 754353DEST_PATH_IMAGE060
作为航迹序列间双向Hausdorff距离
Figure 378233DEST_PATH_IMAGE061
的阈值,设置参数
Figure 850802DEST_PATH_IMAGE062
作为生成航迹核心对象所需包含的最少“邻居”航迹序列数;选取一个航迹序列
Figure 698673DEST_PATH_IMAGE038
,计算
Figure 889483DEST_PATH_IMAGE038
与其他所有航迹序列间的双向Hausdorff距离
Figure 113791DEST_PATH_IMAGE063
;若对于某一个
Figure 440867DEST_PATH_IMAGE065
,使
Figure 928480DEST_PATH_IMAGE066
,则进行一次计数;当遍历完所有的航迹序列后,若计数的值大于或等于
Figure 341007DEST_PATH_IMAGE062
,则将航迹序列
Figure 103426DEST_PATH_IMAGE038
定义为航迹核心对象;遍历所有航迹序列后,得到在参数
Figure 550588DEST_PATH_IMAGE060
Figure 5840DEST_PATH_IMAGE062
下的航迹核心对象集合;
步骤S4,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵,具体包括:
假设共生成
Figure 905663DEST_PATH_IMAGE067
个航迹核心对象,则Hausdorff距离矩阵为:
Figure 924304DEST_PATH_IMAGE068
其中,
Figure 960393DEST_PATH_IMAGE069
表示航迹核心对象
Figure 586546DEST_PATH_IMAGE038
与航迹核心对象
Figure 239244DEST_PATH_IMAGE070
间未加权过的双向Hausdorff距离,满足:
Figure 343467DEST_PATH_IMAGE071
步骤S5,根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权,具体包括:
S53:判断某一个航迹核心对象
Figure 702904DEST_PATH_IMAGE038
是否与其他所有航迹核心对象中超过第一阈值
Figure 499958DEST_PATH_IMAGE072
的航迹核心对象间的双向Hausdorff距离小于
Figure 108794DEST_PATH_IMAGE073
Figure 547866DEST_PATH_IMAGE074
;若是,则执行步骤S54;若否,则执行步骤S55;其中,
Figure 558547DEST_PATH_IMAGE075
表示航迹核心对象
Figure 526503DEST_PATH_IMAGE038
与其他航迹核心对象间的最远双向Hausdorff距离;
S54:将航迹核心对象
Figure 825898DEST_PATH_IMAGE038
在Hausdorff距离矩阵的对应行的所有值均乘以加权系数
Figure 271922DEST_PATH_IMAGE076
Figure 402689DEST_PATH_IMAGE077
,同时记录
Figure 541547DEST_PATH_IMAGE078
;其中,
Figure 390554DEST_PATH_IMAGE079
表示航迹核心对象
Figure 640270DEST_PATH_IMAGE038
的加权系数;
S55:判断航迹核心对象
Figure 828806DEST_PATH_IMAGE038
是否与其他所有的航迹核心对象中超过第二阈值
Figure 138564DEST_PATH_IMAGE081
的航迹核心对象间的双向Hausdorff距离大于
Figure 209288DEST_PATH_IMAGE082
Figure 528274DEST_PATH_IMAGE083
;若是,则执行步骤S56;若否,则执行步骤S57;
S56:将航迹核心对象
Figure 368054DEST_PATH_IMAGE038
在Hausdorff距离矩阵的对应行的所有值均乘以加权系数
Figure 848714DEST_PATH_IMAGE084
Figure 593685DEST_PATH_IMAGE085
,同时记录
Figure 450783DEST_PATH_IMAGE086
S57:记录
Figure 145069DEST_PATH_IMAGE087
S58:遍历Hausdorff距离矩阵的所有行后,对得到的Hausdorff距离矩阵根据主对角线进行翻转,得到加权后的Hausdorff距离矩阵
Figure 62210DEST_PATH_IMAGE088
以及各个航迹核心对象的加权情况;
步骤S6,采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵,具体包括:
在加权后的Hausdorff距离矩阵
Figure 107526DEST_PATH_IMAGE088
的主对角线的右侧选取
Figure 502735DEST_PATH_IMAGE088
中的最小值:
Figure 254791DEST_PATH_IMAGE089
其中,
Figure 342832DEST_PATH_IMAGE090
表示航迹核心对象
Figure 609866DEST_PATH_IMAGE038
和航迹核心对象
Figure 543187DEST_PATH_IMAGE045
间加权后的双向Hausdorff距离;将航迹核心对象
Figure 477645DEST_PATH_IMAGE038
Figure 736588DEST_PATH_IMAGE045
合并,生成一个新的航迹核心对象
Figure 428600DEST_PATH_IMAGE091
,将加权后的Hausdorff距离矩阵
Figure 431191DEST_PATH_IMAGE088
中与
Figure 954576DEST_PATH_IMAGE038
Figure 384421DEST_PATH_IMAGE045
相关的两行与两列剔除,将新生成的航迹核心对象
Figure 626046DEST_PATH_IMAGE091
置于加权后的Hausdorff距离矩阵
Figure 166749DEST_PATH_IMAGE088
中的第
Figure 747903DEST_PATH_IMAGE001
行第
Figure 348649DEST_PATH_IMAGE001
列,同时第
Figure 811991DEST_PATH_IMAGE065
行后的航迹核心对象上移一位,第
Figure 421964DEST_PATH_IMAGE065
列后的航迹核心对象左移一位,补充原
Figure 919941DEST_PATH_IMAGE088
中被剔除的第
Figure 426009DEST_PATH_IMAGE065
行与第
Figure 106475DEST_PATH_IMAGE065
列;
计算第
Figure 988981DEST_PATH_IMAGE093
行的双向Hausdorff距离:
Figure 341465DEST_PATH_IMAGE094
计算第
Figure 284013DEST_PATH_IMAGE093
列的双向Hausdorff距离:
Figure 721947DEST_PATH_IMAGE095
其中,
Figure 408144DEST_PATH_IMAGE096
表示航迹核心对象
Figure 818397DEST_PATH_IMAGE097
与航迹核心对象
Figure 931846DEST_PATH_IMAGE038
间未加权过的双向Hausdorff距离,
Figure 857077DEST_PATH_IMAGE098
Figure 346964DEST_PATH_IMAGE099
表示航迹核心对象
Figure 674040DEST_PATH_IMAGE097
与航迹核心对象
Figure 161653DEST_PATH_IMAGE070
间未加权过的双向Hausdorff距离,
Figure 308601DEST_PATH_IMAGE100
Figure 336600DEST_PATH_IMAGE101
表示航迹核心对象
Figure 783761DEST_PATH_IMAGE038
与航迹核心对象
Figure 239014DEST_PATH_IMAGE102
间未加权过的双向Hausdorff距离;
Figure 138836DEST_PATH_IMAGE103
表示航迹核心对象
Figure 908209DEST_PATH_IMAGE070
与航迹核心对象
Figure 944298DEST_PATH_IMAGE104
间未加权过的双向Hausdorff距离;
Figure 570452DEST_PATH_IMAGE105
表示本次合并之前的矩阵
Figure 957571DEST_PATH_IMAGE088
中第
Figure 327372DEST_PATH_IMAGE106
行对应的加权系数;
Figure 483547DEST_PATH_IMAGE107
表示本次合并之前的矩阵
Figure 733132DEST_PATH_IMAGE088
中第
Figure 341968DEST_PATH_IMAGE065
行对应的加权系数;
按照如下公式更新Hausdorff距离矩阵主对角线右上方的值:
Figure 249881DEST_PATH_IMAGE108
其中,
Figure 526141DEST_PATH_IMAGE109
Figure 494097DEST_PATH_IMAGE110
表示Hausdorff距离矩阵的第
Figure 590229DEST_PATH_IMAGE111
列,
Figure 505096DEST_PATH_IMAGE112
表示Hausdorff距离矩阵的第
Figure 635863DEST_PATH_IMAGE110
列对应的航迹核心对象;以主对角线为对称轴,将主对角线右上方的值赋给主对角线左下方对应的值;
若需要合并的两个航迹核心对象
Figure 774720DEST_PATH_IMAGE113
Figure 358148DEST_PATH_IMAGE114
,航迹核心对象
Figure 873443DEST_PATH_IMAGE113
包含
Figure 858717DEST_PATH_IMAGE115
个原始的航迹核心对象,
Figure 371738DEST_PATH_IMAGE116
,航迹核心对象
Figure 176883DEST_PATH_IMAGE114
Figure 230289DEST_PATH_IMAGE117
个原始的航迹核心对象,
Figure 335648DEST_PATH_IMAGE118
,则更新后的航迹核心对象
Figure 816308DEST_PATH_IMAGE113
与航迹核心对象
Figure 374329DEST_PATH_IMAGE114
之间加权后的双向Hausdorff距离为:
Figure 169109DEST_PATH_IMAGE119
其中,
Figure 128975DEST_PATH_IMAGE120
表示航迹核心对象
Figure 780536DEST_PATH_IMAGE113
与航迹核心对象
Figure 825853DEST_PATH_IMAGE121
间未加权过的双向Hausdorff距离;
Figure 221062DEST_PATH_IMAGE122
表示本次合并之前的矩阵
Figure 35434DEST_PATH_IMAGE088
中,
Figure 310427DEST_PATH_IMAGE123
Figure 577460DEST_PATH_IMAGE124
的最小值对应的行的加权系数。
2.如权利要求1所述的基于自适应层次聚类的航迹模式挖掘方法,其特征在于,步骤S7中,利用如下公式计算航迹聚类簇
Figure 776360DEST_PATH_IMAGE113
的类内距离平均值:
Figure 710818DEST_PATH_IMAGE125
利用如下公式计算航迹聚类簇
Figure 704182DEST_PATH_IMAGE113
与其他所有航迹聚类簇
Figure 458511DEST_PATH_IMAGE126
的类间距离平均值:
Figure 664365DEST_PATH_IMAGE127
3.一种应用如权利要求1所述的基于自适应层次聚类的航迹模式挖掘方法的装置,其特征在于,包括:信息获取模块、航迹预处理模块、航迹核心对象生成模块、距离矩阵生成模块、自适应权重调整模块、层次聚类模块以及航迹模式可视化模块;其中,
所述信息获取模块,用于针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
所述航迹预处理模块,用于对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
所述航迹核心对象生成模块,用于将预处理后的各航迹序列作为输入数据,计算每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
所述距离矩阵生成模块,用于将选取的各航迹核心对象作为的输入数据,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
所述自适应权重调整模块,用于根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
所述层次聚类模块,用于采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;在类内距离平均值与类间距离平均值的比值大于或等于阈值时,判断航迹聚类簇的个数是否大于3;在航迹聚类簇的个数大于3时,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;
所述航迹模式可视化模块,用于在类内距离平均值与类间距离平均值的比值小于阈值时,或者,在类内距离平均值与类间距离平均值的比值大于或等于阈值且航迹聚类簇的个数小于或等于3时,将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
CN202010394728.2A 2020-05-12 2020-05-12 一种航迹模式挖掘方法与装置 Active CN111291098B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010394728.2A CN111291098B (zh) 2020-05-12 2020-05-12 一种航迹模式挖掘方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010394728.2A CN111291098B (zh) 2020-05-12 2020-05-12 一种航迹模式挖掘方法与装置

Publications (2)

Publication Number Publication Date
CN111291098A CN111291098A (zh) 2020-06-16
CN111291098B true CN111291098B (zh) 2020-08-28

Family

ID=71024925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010394728.2A Active CN111291098B (zh) 2020-05-12 2020-05-12 一种航迹模式挖掘方法与装置

Country Status (1)

Country Link
CN (1) CN111291098B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112269844B (zh) * 2020-09-24 2021-08-06 桂林电子科技大学 基于大规模轨迹数据的通用伴随模式分布式挖掘方法
CN112231389B (zh) * 2020-10-16 2021-08-24 中国民用航空华东地区空中交通管理局 基于航迹的可视化冲突模型构建方法、装置、电子设备及存储介质
CN113157848A (zh) * 2021-05-06 2021-07-23 清华大学 航路确定方法及装置、电子设备和存储介质
CN114022790B (zh) * 2022-01-10 2022-04-26 成都国星宇航科技有限公司 遥感图像中云层检测及图像压缩方法、装置和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977546A (zh) * 2019-03-27 2019-07-05 北京航空航天大学 一种基于无监督学习的四维航迹在线异常检测方法
CN109993225A (zh) * 2019-03-29 2019-07-09 北京航空航天大学 一种基于无监督学习的空域复杂度分类方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104680187B (zh) * 2015-03-19 2017-12-29 南京大学 基于缓冲区相似性度量的舰船轨迹层次聚类分析方法
CN109000645A (zh) * 2018-04-26 2018-12-14 西南电子技术研究所(中国电子科技集团公司第十研究所) 复杂环境目标经典航迹提取方法
CN110188093A (zh) * 2019-05-21 2019-08-30 江苏锐天信息科技有限公司 一种基于大数据平台针对ais信息源的数据挖掘系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977546A (zh) * 2019-03-27 2019-07-05 北京航空航天大学 一种基于无监督学习的四维航迹在线异常检测方法
CN109993225A (zh) * 2019-03-29 2019-07-09 北京航空航天大学 一种基于无监督学习的空域复杂度分类方法及装置

Also Published As

Publication number Publication date
CN111291098A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
CN111291098B (zh) 一种航迹模式挖掘方法与装置
Wang et al. A hybrid machine learning model for short-term estimated time of arrival prediction in terminal manoeuvring area
CN109191922B (zh) 一种大规模四维航迹动态预测方法及装置
CN107766808B (zh) 道路网络空间中车辆对象移动轨迹聚类的方法及系统
Zeng et al. A deep learning approach for aircraft trajectory prediction in terminal airspace
CN109670277B (zh) 一种基于多模态数据融合与多模型集成的旅行时间预测方法
CN113378891B (zh) 基于轨迹分布表示的城市区域关系可视分析方法
Gallego et al. Discussion on density-based clustering methods applied for automated identification of airspace flows
Schimpf et al. Flight trajectory prediction based on hybrid-recurrent networks
Lin et al. Approach for 4-d trajectory management based on HMM and trajectory similarity
CN105893621A (zh) 基于多维航迹聚类的目标行为规律挖掘方法
Xuhao et al. Trajectory clustering for arrival aircraft via new trajectory representation
CN111310919B (zh) 基于场景切分和局部路径规划的驾驶控制策略训练方法
CN116543603B (zh) 一种考虑空域态势和局部优化的航迹补全预测方法及装置
CN117953731A (zh) 一种用于终端区交通仿真的进场航班流飞行计划预测方法
CN115482666B (zh) 基于数据融合的多图卷积神经网络交通预测方法
Zhou et al. TTMRN: A topological-geometric two-layer maritime route network modeling for ship intelligent navigation
CN115034005B (zh) 一种面向构件剩余使用寿命预测的模型分析可视化方法
CN115862385A (zh) 基于标准飞行程序的机场终端区航空器飞行模式挖掘方法
Shao et al. Onlineairtrajclus: An online aircraft trajectory clustering for tarmac situation awareness
CN114443763A (zh) 一种基于分布式网络的大数据同步方法
Park et al. Situational Anomaly Detection Using Multi-agent Trajectory Prediction for Terminal Airspace Operations
Xu Physics-guided Machine Learning in Air Traffic Flow Prediction and Optimization
Silva et al. Visual Analysis of Multivariate Urban Traffic Data Resorting to Local Principal Curves.
CN117874628B (zh) 一种基于多源传感信息融合的飞机超限识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant