CN111291098A - 一种航迹模式挖掘方法与装置 - Google Patents

一种航迹模式挖掘方法与装置 Download PDF

Info

Publication number
CN111291098A
CN111291098A CN202010394728.2A CN202010394728A CN111291098A CN 111291098 A CN111291098 A CN 111291098A CN 202010394728 A CN202010394728 A CN 202010394728A CN 111291098 A CN111291098 A CN 111291098A
Authority
CN
China
Prior art keywords
track
hausdorff distance
core
real
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010394728.2A
Other languages
English (en)
Other versions
CN111291098B (zh
Inventor
杜文博
陈薏充
曹先彬
朱熙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202010394728.2A priority Critical patent/CN111291098B/zh
Publication of CN111291098A publication Critical patent/CN111291098A/zh
Application granted granted Critical
Publication of CN111291098B publication Critical patent/CN111291098B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Abstract

本发明公开了一种航迹模式挖掘方法与装置,首先对航班航迹信息进行提取,进行数据预处理后,根据航迹密度分布生成核心对象并滤除噪声,然后对核心对象进行加权,并进行模式挖掘,最后对挖掘出的航迹模式进行展示。本发明针对空中交通运行高密度、高复杂度的状况,实现了在多航班运行环境下的航迹模式挖掘;围绕着海量航班运行背景下的航迹模式精准快速挖掘,从提升空中交通系统安全性和高效性两方面出发,开展航迹模式挖掘方法研究,对于确保航班飞行安全、合理调配空域容量、检测异常飞行状况、预测航班未来飞行行为以及提高空中交通系统的运行效率具有重要的意义。

Description

一种航迹模式挖掘方法与装置
技术领域
本发明涉及航空航天技术领域,尤其涉及一种航迹模式挖掘方法与装置。
背景技术
在空域运行环境越来越复杂、民航航班运行体量越来越大、航班飞行方式难以分辨的场景下,实现航班航迹运动模式的精准挖掘是空中交通管理中的研究重点。一方面,有效挖掘航迹模式,可以得出航班的大致运行规律,为空管部门检测存在飞行行为异常的航班以及预测航班未来航迹做出参考,提升空域运行的安全性;另一方面,精准挖掘航迹模式,可以得出各扇区的运行状况,为空管部门调控空域流量、管理扇区开合提供数据支撑,提升空域运行的有效性。因此,一套行之有效且计算成本可控的航迹模式挖掘方法对于空管安全和效率来说至关重要。
现有的航迹模式挖掘方法较为多样,包括基于聚类、分布、距离、偏差等等,这些方法通过构建不同的计算模型对航迹运动模式进行挖掘。由于航班运行体量大,运动模式相互交织的情况比较严重,现有的分类或聚类算法难以对不同规模,尤其是规模较小的航迹模式进行有效区分,航迹模式挖掘的困难,会直接导致空管部门难以及时对空域中航班整体运行状况有总体的认识与了解,针对存在异常飞行情况的航班不能及时发出告警,空域扇区的有效调度也面临着挑战。因此,针对不同规模航迹模式的精准挖掘方法是十分必要的。
发明内容
有鉴于此,本发明提供了一种航迹模式挖掘方法与装置,用以在空域中从较为杂乱的航班运动里挖掘出不同规模的航迹运动模式并进行展示。
因此,本发明提供了一种基于自适应层次聚类的航迹模式挖掘方法,包括如下步骤:
S1:针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
S2:对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
S3:计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
S4:计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
S5:根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
S6:采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;
S7:计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;若否,则执行步骤S8;若是,则执行步骤S9;
S8:判断航迹聚类簇的个数是否大于3;若是,则返回步骤S5,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;若否,则执行步骤S9;
S9:将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式 挖掘方法中,步骤S1中,第
Figure 179772DEST_PATH_IMAGE001
个航迹序列为
Figure 334810DEST_PATH_IMAGE002
,代表航迹序列
Figure 338538DEST_PATH_IMAGE003
包含
Figure 796195DEST_PATH_IMAGE004
个 航迹向量,
Figure 190268DEST_PATH_IMAGE005
Figure 273630DEST_PATH_IMAGE006
表示航迹序列的数量;其中航迹向量
Figure 69548DEST_PATH_IMAGE007
,其中,
Figure 898439DEST_PATH_IMAGE008
表示航迹向量
Figure 638862DEST_PATH_IMAGE009
的实时经度,
Figure 479910DEST_PATH_IMAGE010
表示航迹向量
Figure 130334DEST_PATH_IMAGE009
的实时纬度,
Figure 647903DEST_PATH_IMAGE011
表示航迹向量
Figure 891934DEST_PATH_IMAGE009
的实时高度,
Figure 192465DEST_PATH_IMAGE012
表示航迹向量
Figure 25292DEST_PATH_IMAGE009
的实时飞行速度,
Figure 995653DEST_PATH_IMAGE013
表示航迹向量
Figure 851614DEST_PATH_IMAGE009
的实时航向角,
Figure 18153DEST_PATH_IMAGE014
表示航迹向量
Figure 521465DEST_PATH_IMAGE009
的实时时间点。
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式 挖掘方法中,步骤S2中,对航迹序列
Figure 52941DEST_PATH_IMAGE003
进行去除异常值,具体包括:
提取每个航迹向量的实时飞行速度,若
Figure 255252DEST_PATH_IMAGE015
Figure 632007DEST_PATH_IMAGE016
,则 将飞行速度
Figure 190158DEST_PATH_IMAGE012
对应的航迹向量
Figure 17169DEST_PATH_IMAGE009
去除;
提取每个航迹向量的实时航向角,若
Figure 582142DEST_PATH_IMAGE017
Figure 841216DEST_PATH_IMAGE018
,则将航 向角
Figure 565459DEST_PATH_IMAGE013
对应的航迹向量
Figure 173158DEST_PATH_IMAGE009
去除;其中,
Figure 100793DEST_PATH_IMAGE019
表示航迹向量
Figure 412826DEST_PATH_IMAGE020
的实时航向角,
Figure 132520DEST_PATH_IMAGE021
表示航 迹向量
Figure 783557DEST_PATH_IMAGE022
的实时航向角,
Figure 385440DEST_PATH_IMAGE023
Figure 907688DEST_PATH_IMAGE024
提取每个航迹向量的实时经度、实时纬度和实时高度,若
Figure 91676DEST_PATH_IMAGE025
则将经度
Figure 306756DEST_PATH_IMAGE008
、纬度
Figure 458252DEST_PATH_IMAGE010
和高度
Figure 518612DEST_PATH_IMAGE011
对应的航迹向量
Figure 25948DEST_PATH_IMAGE009
去除;其中,
Figure 270984DEST_PATH_IMAGE026
表示航迹向量
Figure 785142DEST_PATH_IMAGE022
的实时经度,
Figure 727822DEST_PATH_IMAGE027
表示航迹向量
Figure 135669DEST_PATH_IMAGE022
的实时纬度,
Figure 426973DEST_PATH_IMAGE028
表示航迹向量
Figure 52863DEST_PATH_IMAGE022
的实时高度,
Figure 986184DEST_PATH_IMAGE029
表示航迹向量
Figure 451800DEST_PATH_IMAGE020
的实时经度,
Figure 789372DEST_PATH_IMAGE030
表示航迹向量
Figure 278122DEST_PATH_IMAGE020
的实时纬度,
Figure 77451DEST_PATH_IMAGE031
表示航迹向量
Figure 945044DEST_PATH_IMAGE020
的实时高度;
步骤S2中,对航迹序列
Figure 843729DEST_PATH_IMAGE003
进行去重,具体包括:
遍历航迹序列
Figure 678830DEST_PATH_IMAGE003
的所有航迹向变量,若存在
Figure 767003DEST_PATH_IMAGE032
,则将重 复的航迹向量
Figure 613736DEST_PATH_IMAGE033
去除;
步骤S2中,对航迹序列
Figure 883656DEST_PATH_IMAGE003
进行分段,具体包括:
获取航迹序列
Figure 815840DEST_PATH_IMAGE003
的所有经度和纬度,组成多个经纬度点,引接我国的空域情报区划分 数据,按照各经纬度点所属的情报区进行标号;
步骤S2中,对航迹序列
Figure 753709DEST_PATH_IMAGE003
进行重采样,具体包括:
针对航迹序列
Figure 533577DEST_PATH_IMAGE003
在同一个情报区内的数据段,计算航班航迹点数
Figure 774066DEST_PATH_IMAGE034
,选取重采样点数 为100,以航班航迹点数对重采样点数做整数除法得出重采样步长,余数的一半作为航迹序 列
Figure 583759DEST_PATH_IMAGE003
在该情报区内的数据段首尾需去除的点数,按照重采样步长对航迹序列
Figure 935106DEST_PATH_IMAGE003
在该情报 区内的数据段进行重采样,重采样计算公式如下:
Figure 835060DEST_PATH_IMAGE035
其中,
Figure 371083DEST_PATH_IMAGE036
表示重采样后的航迹序列,
Figure 277860DEST_PATH_IMAGE037
表示航迹
Figure 573843DEST_PATH_IMAGE003
的第
Figure 249675DEST_PATH_IMAGE038
个航迹序列,
Figure 159862DEST_PATH_IMAGE039
表示重采样的起始位置,
Figure 432230DEST_PATH_IMAGE040
表示整数除法后确定的重采样步长,
Figure 390959DEST_PATH_IMAGE041
以1的步长从0取到99, 表示重采样所需的100个点。
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S3,计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象,具体包括:
利用如下公式计算航迹序列
Figure 311510DEST_PATH_IMAGE036
与航迹序列
Figure 877752DEST_PATH_IMAGE042
之间未加权过的双向Hausdorff距离
Figure 759120DEST_PATH_IMAGE043
Figure 646174DEST_PATH_IMAGE044
Figure 296598DEST_PATH_IMAGE045
Figure 96058DEST_PATH_IMAGE046
其中,表示航迹序列 到航迹序列 的单向Hausdorff距离,
Figure 568442DEST_PATH_IMAGE053
表 示航迹向量
Figure 486719DEST_PATH_IMAGE054
的空间位置
Figure 463378DEST_PATH_IMAGE055
与航迹向量
Figure 416290DEST_PATH_IMAGE056
的空间位置
Figure 682186DEST_PATH_IMAGE057
的空间 欧式距离,表示航迹序列 到航迹序列 的单向Hausdorff距离,
Figure 6934DEST_PATH_IMAGE060
表 示航迹向量
Figure 696541DEST_PATH_IMAGE061
的空间位置
Figure 876987DEST_PATH_IMAGE062
与航迹向量
Figure 280856DEST_PATH_IMAGE063
的空间位置
Figure 278767DEST_PATH_IMAGE064
的空间 欧式距离;
设置参数
Figure 144086DEST_PATH_IMAGE065
作为航迹序列间双向Hausdorff距离
Figure 269168DEST_PATH_IMAGE043
的阈值,设置参数
Figure 582338DEST_PATH_IMAGE066
作为生成航迹核心对象所需包含的最少“邻居”航迹序列数;选取一个航迹序列
Figure 626517DEST_PATH_IMAGE036
,计算
Figure 41449DEST_PATH_IMAGE036
与其他所有航迹序列间的双向Hausdorff距离
Figure 360435DEST_PATH_IMAGE067
;若对于某一个
Figure 541493DEST_PATH_IMAGE068
,使
Figure 756574DEST_PATH_IMAGE069
,则进行一次计数;当遍历完所有的航迹序列后,若计数的值大于或等于
Figure 111332DEST_PATH_IMAGE066
,则将航迹序列
Figure 47058DEST_PATH_IMAGE036
定义为航迹核心对象;遍历所有航迹序列后,得到在参数
Figure 210186DEST_PATH_IMAGE065
Figure 986381DEST_PATH_IMAGE066
下的航迹核心对象集合。
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S4,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵,具体包括:
假设共生成
Figure 313588DEST_PATH_IMAGE070
个航迹核心对象,则Hausdorff距离矩阵为:
Figure 177639DEST_PATH_IMAGE071
其中,
Figure 54328DEST_PATH_IMAGE043
表示航迹核心对象
Figure 220999DEST_PATH_IMAGE072
与航迹核心对象
Figure 222453DEST_PATH_IMAGE042
间未加权过的双向 Hausdorff距离,满足:
Figure 14828DEST_PATH_IMAGE073
Figure 234107DEST_PATH_IMAGE074
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S5,根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权,具体包括:
S53:判断某一个航迹核心对象 是否与其他所有航迹核心对象中超过第一阈值
Figure 309696DEST_PATH_IMAGE075
的 航迹核心对象间的双向Hausdorff距离小于
Figure 515549DEST_PATH_IMAGE076
Figure 586405DEST_PATH_IMAGE077
;若是,则执行步骤S54;若 否,则执行步骤S55;其中,
Figure 875304DEST_PATH_IMAGE078
表示航迹核心对象
Figure 585771DEST_PATH_IMAGE036
与其他航迹核心对象间的最远双向 Hausdorff距离;
S54:将航迹核心对象
Figure 408364DEST_PATH_IMAGE036
在Hausdorff距离矩阵的对应行的所有值均乘以加权系数
Figure 910890DEST_PATH_IMAGE079
Figure 714898DEST_PATH_IMAGE080
,同时记录
Figure 991289DEST_PATH_IMAGE081
;其中,
Figure 663579DEST_PATH_IMAGE082
表示航迹核心对象
Figure 237256DEST_PATH_IMAGE036
的加权系数;
S55:判断航迹核心对象
Figure 805640DEST_PATH_IMAGE083
与其他所有的航迹核心对象中超过第二阈值
Figure 225120DEST_PATH_IMAGE084
的航迹 核心对象间的双向Hausdorff距离大于
Figure 451833DEST_PATH_IMAGE085
Figure 538738DEST_PATH_IMAGE086
;若是,则执行步骤S56;若否,则执行步 骤S57;
S56:将航迹核心对象
Figure 278024DEST_PATH_IMAGE036
在Hausdorff距离矩阵的对应行的所有值均乘以加权系数
Figure 60166DEST_PATH_IMAGE087
Figure 215204DEST_PATH_IMAGE088
,同时记录
Figure 281249DEST_PATH_IMAGE089
S57:记录
Figure 863540DEST_PATH_IMAGE090
S58:遍历Hausdorff距离矩阵的所有行后,对得到的Hausdorff距离矩阵根据主对角线 进行翻转,得到加权后的Hausdorff距离矩阵
Figure 336241DEST_PATH_IMAGE091
以及各个航迹核心对象的加权情况
Figure 419603DEST_PATH_IMAGE092
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S6,采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵,具体包括:
在加权后的Hausdorff距离矩阵
Figure 949942DEST_PATH_IMAGE091
的主对角线的右侧选取
Figure 796411DEST_PATH_IMAGE091
中的最小值:
Figure 802413DEST_PATH_IMAGE093
其中,
Figure 564833DEST_PATH_IMAGE094
表示航迹核心对象
Figure 293886DEST_PATH_IMAGE036
和航迹核心对象
Figure 342613DEST_PATH_IMAGE042
间加权后的双向Hausdorff距 离;将航迹核心对象
Figure 711278DEST_PATH_IMAGE036
Figure 621596DEST_PATH_IMAGE042
合并,生成一个新的航迹核心对象
Figure 454423DEST_PATH_IMAGE095
,将加权后的Hausdorff 距离矩阵
Figure 362467DEST_PATH_IMAGE091
中与
Figure 608640DEST_PATH_IMAGE036
Figure 447284DEST_PATH_IMAGE042
相关的两行与两列剔除,将新生成的航迹核心对象
Figure 882420DEST_PATH_IMAGE095
置于加权后 的Hausdorff距离矩阵
Figure 272950DEST_PATH_IMAGE091
中的第
Figure 616206DEST_PATH_IMAGE001
行第
Figure 133906DEST_PATH_IMAGE001
列,同时第j行后的航迹核心对象上移一位,第j列后 的航迹核心对象左移一位,补充原
Figure 941325DEST_PATH_IMAGE091
中被剔除的第j行与第j列;
计算第
Figure 378123DEST_PATH_IMAGE001
行的双向Hausdorff距离:
Figure 84042DEST_PATH_IMAGE096
计算第
Figure 264488DEST_PATH_IMAGE001
列的双向Hausdorff距离:
Figure 191992DEST_PATH_IMAGE097
其中,
Figure 675057DEST_PATH_IMAGE098
表示航迹核心对象
Figure 727327DEST_PATH_IMAGE099
与航迹核心对象
Figure 120918DEST_PATH_IMAGE036
间未加权过的双向 Hausdorff距离,
Figure 840612DEST_PATH_IMAGE100
Figure 947108DEST_PATH_IMAGE101
表示航迹核心对象
Figure 830882DEST_PATH_IMAGE099
与航迹核心对 象
Figure 743343DEST_PATH_IMAGE042
间未加权过的双向Hausdorff距离,
Figure 130593DEST_PATH_IMAGE102
Figure 345674DEST_PATH_IMAGE103
表示航迹 核心对象
Figure 231590DEST_PATH_IMAGE036
与航迹核心对象
Figure 636158DEST_PATH_IMAGE104
间未加权过的Hausdorff距离;
Figure 64865DEST_PATH_IMAGE105
表示航迹核 心对象
Figure 120021DEST_PATH_IMAGE042
与航迹核心对象
Figure 634179DEST_PATH_IMAGE104
间未加权过的双向Hausdorff距离;
Figure 622864DEST_PATH_IMAGE106
表示本次合并之前 的矩阵
Figure 719127DEST_PATH_IMAGE091
中第w行对应的加权系数;
Figure 276010DEST_PATH_IMAGE107
表示本次合并之前的矩阵
Figure 402098DEST_PATH_IMAGE091
中第j行对应的加权系 数;
按照如下公式更新Hausdorff距离矩阵主对角线右上方的值:
Figure 69840DEST_PATH_IMAGE108
其中,
Figure 20610DEST_PATH_IMAGE109
Figure 873028DEST_PATH_IMAGE110
表示Hausdorff距离矩阵的第
Figure 361778DEST_PATH_IMAGE110
列,
Figure 646260DEST_PATH_IMAGE111
表示Hausdorff距离矩阵的第
Figure 231962DEST_PATH_IMAGE110
列对应的航迹核心对象;以主对角线为对称轴,将主对角线右上方的值赋给主对角线左下 方对应的值;
若需要合并的两个航迹核心对象
Figure 262804DEST_PATH_IMAGE112
Figure 707692DEST_PATH_IMAGE113
,航迹核心对象
Figure 45133DEST_PATH_IMAGE112
包含
Figure 298391DEST_PATH_IMAGE114
个原始的航迹核心对象,
Figure 102399DEST_PATH_IMAGE115
航迹核心对象
Figure 628058DEST_PATH_IMAGE116
Figure 51080DEST_PATH_IMAGE117
个原始 的航迹核心对象,
Figure 283478DEST_PATH_IMAGE118
则更新后的航迹核心对象
Figure 586284DEST_PATH_IMAGE112
与航迹核心对象
Figure 146709DEST_PATH_IMAGE113
之间加权后的双向Hausdorff距离为:
Figure 763635DEST_PATH_IMAGE119
其中,
Figure 709594DEST_PATH_IMAGE120
表示航迹核心对象
Figure 196683DEST_PATH_IMAGE112
与航迹核心对象
Figure 369038DEST_PATH_IMAGE113
间未加 权过的双向Hausdorff距离;
Figure 383131DEST_PATH_IMAGE121
表示本次合并之前的矩阵
Figure 668750DEST_PATH_IMAGE091
中,
Figure 985462DEST_PATH_IMAGE122
Figure 707430DEST_PATH_IMAGE123
的最小值对 应的行的加权系数。
在一种可能的实现方式中,在本发明提供的上述基于自适应层次聚类的航迹模式 挖掘方法中,步骤S7中,利用如下公式计算航迹聚类簇
Figure 275946DEST_PATH_IMAGE112
的类内距离平均值:
Figure 337443DEST_PATH_IMAGE124
利用如下公式计算航迹聚类簇
Figure 418531DEST_PATH_IMAGE112
与其他所有航迹聚类簇
Figure 175266DEST_PATH_IMAGE125
的类间距 离平均值:
Figure 672106DEST_PATH_IMAGE126
本发明还提供了一种基于自适应层次聚类的航迹模式挖掘装置,包括:信息获取模块、航迹预处理模块、航迹核心对象生成模块、距离矩阵生成模块、自适应权重调整模块、层次聚类模块以及航迹模式可视化模块;其中,
所述信息获取模块,用于针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
所述航迹预处理模块,用于对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
所述航迹核心对象生成模块,用于将预处理后的各航迹序列作为输入数据,计算每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
所述距离矩阵生成模块,用于将选取的各航迹核心对象作为的输入数据,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
所述自适应权重调整模块,用于根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
所述层次聚类模块,用于采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;在类内距离平均值与类间距离平均值的比值大于或等于阈值时,判断航迹聚类簇的个数是否大于3;在航迹聚类簇的个数大于3时,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;
所述航迹模式可视化模块,用于在类内距离平均值与类间距离平均值的比值小于阈值时,或者,在类内距离平均值与类间距离平均值的比值大于或等于阈值且航迹聚类簇的个数小于或等于3时,将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法及装置,通过信息获取模块得到民航航班的飞行轨迹数据,进行预处理后,基于数据密度分布对数据进行核心对象提取,使用基于航迹数据相关性的自适应层次聚类算法对航班的航迹运动模式进行挖掘并可视化。由于自适应层次聚类算法的使用需要获取航班的飞行轨迹数据,因此,飞行轨迹数据包括航班三维坐标位置、飞行速度、航向角度以及时间点。具体地,首先通过信息获取模块对航班航迹信息进行提取,并接入航迹预处理模块进行数据预处理得到规整的航迹序列,然后通过航迹核心对象生成模块根据航迹密度分布生成核心对象并滤除噪声,对核心对象通过自适应权重调整模块进行加权,再通过层次聚类模块进行模式挖掘,最终通过航迹模式可视化模块对挖掘出的航迹模式进行展示。本发明针对空中交通运行高密度、高复杂度的状况,实现了在多航班运行环境下的航迹模式挖掘,为航迹模式挖掘问题的解决提出了一个全新的方案;本发明围绕着海量航班运行背景下的航迹模式精准快速挖掘,从提升空中交通系统安全性和高效性两方面出发,开展航迹模式挖掘方法研究,对于确保航班飞行安全、合理调配空域容量、检测异常飞行状况、预测航班未来飞行行为以及提高空中交通系统的运行效率具有重要的意义;本发明针对现有技术在挖掘航迹模式时不同规模的航迹容易相互交织的难点问题,提出通过自适应加权的方式辅助合并操作的进行,通过加权有效控制合并的顺序,使应属于大规模航迹模式的航迹先于应属于小规模航迹模式的航迹,从而可以显著减少大模式吞并小模式的发生;本发明能够处理空域内各城市对间规模不一、相互交织的航迹模式挖掘问题,航迹模式识别精度高,对参数的依赖小,可以有效解决复杂环境下的航迹模式挖掘问题。
附图说明
图1为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法的流程示意图;
图2为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中航迹向量示意图;
图3为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中可能出现的航迹异常值示意图;
图4为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中航迹重采样示意图;
图5为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中航迹核心对象的选取示意图;
图6为本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法中航迹核心对象的合并示意图。
具体实施方式
下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整的描述,显然,所描述的实施方式仅仅是作为例示,并非用于限制本发明。
本发明提供的一种基于自适应层次聚类的航迹模式挖掘方法,如图1所示,包括如下步骤:
S1:针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
具体地,每个航迹序列为六维向量序列,包含上述六种信息;
S2:对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
具体地经过上述四个步骤的预处理后,每个航迹序列平滑连接,各航迹序列长度统一,即各航迹序列包含的航迹向量数相同;
S3:计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
S4:计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
S5:根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
S6:采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;
S7:计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;若否,则执行步骤S8;若是,则执行步骤S9;
具体地,步骤S7是判断层次聚类的效果是否满足航迹数据的航迹模式识别需求;如果类内距离平均值与类间距离平均值的比值小于阈值,则认为层次聚类的效果较为理想,此时可执行步骤S9;如果类内距离平均值与类间距离平均值的比值大于或等于阈值,则认为层次聚类的效果不理想,此时需要执行步骤S8进一步判断;
S8:判断航迹聚类簇的个数是否大于3;若是,则返回步骤S5,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;若否,则执行步骤S9;
具体地,如果层次聚类的效果不理想,且航迹聚类簇的个数大于3,则需要返回步骤S5,继续进行下一层的层次聚类;如果层次聚类的效果不理想,且航迹聚类簇的个数小于或等于3,则可以执行步骤S9,针对此时的聚类结果进行可视化展示;
S9:将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法,在空域中,在各城市对之间运行的每架航班将自己的飞行轨迹进行上传汇总,通过去除异常值、去重、分段以及重采样整理成为规整的四维航迹序列,运用Hausdorff距离计算方法得出每两条航迹间的空间距离,随后运用基于密度的核心对象生成算法,从航迹中抽取高密度的航迹核心对象,再通过航迹核心对象间的空间距离构建航迹距离矩阵,将航迹距离矩阵输入至自适应权重调整模块,根据航迹核心对象间距的分布确定相应的权重值,对航迹距离矩阵进行加权,随后针对加权后的航迹距离矩阵,采用层次聚类算法对航迹核心对象进行聚类。如果层次聚类的效果满足航迹数据的航迹模式识别需求,即类内距离与类间距离的比值小于一定阈值,则将聚类结束的航迹簇转换为航迹运动模式进行可视化;如果聚类的结果不满足阈值要求,则根据当前的航迹簇分布调整权重,继续进行下一层的层次聚类;如果层次聚类在聚类簇数不足时依然不能满足阈值要求,则针对现有的航迹簇结果进行展示。本发明的最终目标是在空域中从较为杂乱的航班运动里挖掘出不同规模的航迹运动模式并进行展示。
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法 中,步骤S1中,针对某一时间段的某一城市对,例如2019年全年由北京至上海,接入该时间 段内的航班运行时刻表,如果一架飞机在该时间段内执行了该城市对的航班,则收集该航 班的ADS-B数据,并整理成为该航班的航迹序列
Figure 447164DEST_PATH_IMAGE003
,第
Figure 452816DEST_PATH_IMAGE001
个航迹序列
Figure 821480DEST_PATH_IMAGE002
, 代表航迹序列
Figure 246645DEST_PATH_IMAGE003
包含
Figure 751576DEST_PATH_IMAGE004
个航迹向量,
Figure 925200DEST_PATH_IMAGE005
Figure 171373DEST_PATH_IMAGE006
表示航迹序列的数量;其中航迹向量
Figure 823066DEST_PATH_IMAGE007
,其中,
Figure 448082DEST_PATH_IMAGE008
表示航迹向量
Figure 838612DEST_PATH_IMAGE009
的实时经度,
Figure 791656DEST_PATH_IMAGE010
表示航迹向量
Figure 572005DEST_PATH_IMAGE009
的实时纬度,
Figure 51528DEST_PATH_IMAGE011
表示航迹向量
Figure 629271DEST_PATH_IMAGE009
的实时高度,
Figure 584458DEST_PATH_IMAGE012
表示航迹向量
Figure 499324DEST_PATH_IMAGE009
的实时飞行速度,
Figure 974299DEST_PATH_IMAGE013
表示航迹向量
Figure 909894DEST_PATH_IMAGE009
的实时航向角,
Figure 227743DEST_PATH_IMAGE014
表示航迹向量
Figure 821666DEST_PATH_IMAGE009
的实时时间点, 如图2所示。
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法 中,针对步骤S1中的航迹序列
Figure 72519DEST_PATH_IMAGE003
,由于ADS-B基站设置、数据采样时间、飞机飞行动态等因 素的影响,每一个航迹序列中可能会包含少量的错误及重复数据,所包含的航迹向量的数 量往往也是不同的,并且,航班在飞过情报区的边界时,需更换联络的区调,航班的飞行方 式也会出现一系列的改变。针对以上的问题,在步骤S2中,对形成的各航迹序列进行预处 理,包括去除异常值、去重、分段和重采样;其中,
对航迹序列
Figure 819213DEST_PATH_IMAGE003
进行去除异常值,具体可以通过以下方式来实现:常见的航迹异常值如 图3所示,在由起飞机场A到降落机场B的途中,圆圈内的航迹发生偏离,为航迹异常值;首 先,提取每个航迹向量的实时飞行速度,若
Figure 358779DEST_PATH_IMAGE015
Figure 208923DEST_PATH_IMAGE016
,说 明航班的运行速度数据项存在异常,则将飞行速度
Figure 392911DEST_PATH_IMAGE012
对应的航迹向量
Figure 607992DEST_PATH_IMAGE009
去除;然后,提取 每个航迹向量的实时航向角,若
Figure 697170DEST_PATH_IMAGE017
Figure 898476DEST_PATH_IMAGE018
,说明飞机的航 向角采集出现问题,则将航向角
Figure 327183DEST_PATH_IMAGE013
对应的航迹向量
Figure 572219DEST_PATH_IMAGE009
去除;其中,
Figure 165006DEST_PATH_IMAGE019
表示航迹向量
Figure 29057DEST_PATH_IMAGE020
的实时航向角,
Figure 436904DEST_PATH_IMAGE021
表示航迹向量
Figure 993788DEST_PATH_IMAGE022
的实时航向角,
Figure 805361DEST_PATH_IMAGE023
Figure 597737DEST_PATH_IMAGE024
;最后,提 取每个航迹向量的实时经度、实时纬度和实时高度,若
Figure 735457DEST_PATH_IMAGE025
说明在
Figure 541870DEST_PATH_IMAGE009
处,航班的位置点发生了跳变,则将经度
Figure 889675DEST_PATH_IMAGE008
、纬度
Figure 361108DEST_PATH_IMAGE010
和高度
Figure 431963DEST_PATH_IMAGE011
对应的航 迹向量
Figure 189703DEST_PATH_IMAGE009
去除;其中,
Figure 165750DEST_PATH_IMAGE026
表示航迹向量
Figure 847398DEST_PATH_IMAGE022
的实时经度,
Figure 694131DEST_PATH_IMAGE027
表示航迹向量
Figure 907593DEST_PATH_IMAGE022
的实时 纬度,
Figure 636515DEST_PATH_IMAGE028
表示航迹向量
Figure 590696DEST_PATH_IMAGE022
的实时高度,
Figure 885411DEST_PATH_IMAGE029
表示航迹向量
Figure 860320DEST_PATH_IMAGE020
的实时经度,
Figure 686325DEST_PATH_IMAGE030
表示航 迹向量
Figure 37672DEST_PATH_IMAGE020
的实时纬度,
Figure 186893DEST_PATH_IMAGE031
表示航迹向量
Figure 942491DEST_PATH_IMAGE020
的实时高度;
对航迹序列
Figure 973901DEST_PATH_IMAGE003
进行去重,具体可以通过以下方式来实现:遍历航迹序列
Figure 128938DEST_PATH_IMAGE003
的所有航 迹向变量,若存在
Figure 146048DEST_PATH_IMAGE032
,则将重复的航迹向量
Figure 852973DEST_PATH_IMAGE033
去除;
对航迹序列
Figure 325674DEST_PATH_IMAGE003
进行分段,具体可以通过以下方式来实现:首先,获取航迹序列
Figure 18824DEST_PATH_IMAGE003
的所 有经度和纬度,组成多个经纬度点,然后,引接我国的空域情报区划分数据,按照各经纬度 点所属的情报区进行标号;
对航迹序列
Figure 204954DEST_PATH_IMAGE003
进行重采样,具体可以通过以下方式来实现:如图4所示,航迹
Figure 36775DEST_PATH_IMAGE127
的点 数为8,对由起飞机场A到降落机场B的航迹
Figure 652564DEST_PATH_IMAGE003
进行重采样,重采样点为C,采样后的航迹序 列为
Figure 274039DEST_PATH_IMAGE036
。针对航迹序列
Figure 190042DEST_PATH_IMAGE003
在同一个情报区内的数据段,选取重采样点数为100,以航班航迹 点数对重采样点数做整数除法得出重采样步长,余数的一半作为航迹序列
Figure 192764DEST_PATH_IMAGE003
在该情报区 内的数据段首尾需去除的点数,按照重采样步长对航迹序列
Figure 686062DEST_PATH_IMAGE003
在该情报区内的数据段进 行重采样,重采样计算公式如下:
Figure 721014DEST_PATH_IMAGE035
其中,
Figure 358102DEST_PATH_IMAGE036
表示重采样后的航迹序列,
Figure 453097DEST_PATH_IMAGE128
表示航迹
Figure 371374DEST_PATH_IMAGE003
的第
Figure 85383DEST_PATH_IMAGE038
个航迹序列,
Figure 975979DEST_PATH_IMAGE039
表示重采样的起始位置,
Figure 366509DEST_PATH_IMAGE040
表示整数除法后确定的重采样步长,
Figure 522815DEST_PATH_IMAGE041
以1的步长从0取到99, 表示重采样所需的100个点。
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S3,计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象,具体可以通过以下方式来实现:
利用如下公式计算预处理后的航迹序列
Figure 165149DEST_PATH_IMAGE036
与预处理后的航迹序列
Figure 238147DEST_PATH_IMAGE042
之间未加权过的 双向Hausdorff距离
Figure 753573DEST_PATH_IMAGE043
Figure 443180DEST_PATH_IMAGE044
Figure 623626DEST_PATH_IMAGE045
Figure 361250DEST_PATH_IMAGE046
其中,表示航迹序列 到航迹序列 的单向Hausdorff距离,
Figure 990629DEST_PATH_IMAGE053
表 示航迹向量
Figure 34808DEST_PATH_IMAGE054
的空间位置
Figure 387423DEST_PATH_IMAGE055
与航迹向量
Figure 299885DEST_PATH_IMAGE056
的空间位置
Figure 687135DEST_PATH_IMAGE057
的空间欧 式距离,表示航迹序列 到航迹序列 的单向Hausdorff距离,
Figure 624336DEST_PATH_IMAGE060
表示航 迹向量
Figure 134952DEST_PATH_IMAGE061
的空间位置
Figure 383531DEST_PATH_IMAGE062
与航迹向量
Figure 326210DEST_PATH_IMAGE063
的空间位置
Figure 734058DEST_PATH_IMAGE064
的空间欧式距 离;
在核心对象生成算法开始前,需设置参数
Figure 290941DEST_PATH_IMAGE065
作为航迹序列间双向Hausdorff距离
Figure 902182DEST_PATH_IMAGE043
的阈值,设置参数
Figure 897820DEST_PATH_IMAGE066
作为生成航迹核心对象所需包含的最少“邻居”航迹序 列数;生成航迹核心对象的方法如下:选取一个航迹序列
Figure 301120DEST_PATH_IMAGE036
,计算
Figure 638691DEST_PATH_IMAGE036
与其他所有航迹序列间 的双向Hausdorff距离
Figure 189758DEST_PATH_IMAGE067
;若对于某一个
Figure 661191DEST_PATH_IMAGE068
,使
Figure 791433DEST_PATH_IMAGE069
,则进行一次计 数;当遍历完所有的航迹序列后,若计数的值大于或等于
Figure 424540DEST_PATH_IMAGE066
,则将航迹序列
Figure 462903DEST_PATH_IMAGE036
定义为 航迹核心对象;遍历所有航迹序列后,得到在参数
Figure 613393DEST_PATH_IMAGE065
Figure 788022DEST_PATH_IMAGE066
下的航迹核心对象集合,航 迹核心对象的选取如图5所示,在由起飞机场A到降落机场B的途中,椭圆圈出的航迹为核心 对象。
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S4,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵,具体可以通过以下方式来实现:
假设共生成
Figure 857609DEST_PATH_IMAGE070
个航迹核心对象,则Hausdorff距离矩阵为:
Figure 930739DEST_PATH_IMAGE071
其中,
Figure 743974DEST_PATH_IMAGE043
表示航迹核心对象
Figure 773110DEST_PATH_IMAGE072
与航迹核心对象
Figure 357806DEST_PATH_IMAGE042
间未加权过的双向Hausdorff 距离,满足:
Figure 167499DEST_PATH_IMAGE073
Figure 518846DEST_PATH_IMAGE129
在生成Hausdorff距离矩阵
Figure 433448DEST_PATH_IMAGE130
后,此时的聚类簇数
Figure 969472DEST_PATH_IMAGE131
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法 中,针对生成的Hausdorff距离矩阵
Figure 141827DEST_PATH_IMAGE130
,可以得知每一行,也就是每一个航迹核心对象与其 他所有核心对象的距离分布;由于在空域中,航迹模式交织情况较为严重,若直接对航迹核 心对象进行合并层次聚类,则极有可能在规模较大的聚类还未完全形成时,规模较小的模 式就已经与其他的模式合并,这样会导致航迹模式挖掘的准确性下降,因此,针对这一问 题,在步骤S5中,根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对 Hausdorff距离矩阵的每一行进行加权,具体地,步骤S5可以包括如下步骤:
S53:判断某一个航迹核心对象 是否与其他所有航迹核心对象中超过第一阈值
Figure 441539DEST_PATH_IMAGE075
的 航迹核心对象间的双向Hausdorff距离小于
Figure 23830DEST_PATH_IMAGE076
Figure 293268DEST_PATH_IMAGE077
;若是,说明航迹核心对象
Figure 314314DEST_PATH_IMAGE036
处于一个大规模航迹模式中,则执行步骤S54;若否,则执行步骤S55;其中,
Figure 375811DEST_PATH_IMAGE078
表示航迹核 心对象
Figure 738790DEST_PATH_IMAGE036
与其他航迹核心对象间的最远双向Hausdorff距离;
S54:将航迹核心对象在Hausdorff距离矩阵的对应行的所有值均乘以加权系数
Figure 948055DEST_PATH_IMAGE079
Figure 444895DEST_PATH_IMAGE080
,同时记录
Figure 233335DEST_PATH_IMAGE132
;其中,
Figure 485325DEST_PATH_IMAGE082
表示航迹核心对象
Figure 588410DEST_PATH_IMAGE036
的加权系数;
S55:判断航迹核心对象
Figure 498728DEST_PATH_IMAGE083
与其他所有的航迹核心对象中超过第二阈值
Figure 534817DEST_PATH_IMAGE084
的航迹 核心对象间的双向Hausdorff距离大于
Figure 754446DEST_PATH_IMAGE085
Figure 423456DEST_PATH_IMAGE086
;若是,说明航迹核心对象
Figure 527678DEST_PATH_IMAGE036
处于一个小 规模航迹模式中,则执行步骤S56;若否,则执行步骤S57;
S56:将航迹核心对象
Figure 277328DEST_PATH_IMAGE036
在Hausdorff距离矩阵的对应行的所有值均乘以加权系数
Figure 621853DEST_PATH_IMAGE087
Figure 699531DEST_PATH_IMAGE088
,同时记录
Figure 466498DEST_PATH_IMAGE089
S57:记录
Figure 946021DEST_PATH_IMAGE090
S58:遍历Hausdorff距离矩阵的所有行后,对得到的Hausdorff距离矩阵根据主对角线 进行翻转,即,将Hausdorff距离矩阵右上部分的值赋给其主对角线上对称的左下部分位 置,得到加权后的Hausdorff距离矩阵
Figure 464377DEST_PATH_IMAGE091
以及各个航迹核心对象的加权情况
Figure 419564DEST_PATH_IMAGE092
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法中,步骤S6,采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,合并的效果如图6所示,在由起飞机场A到降落机场B的途中,椭圆圈出的两条航迹进行合并,生成一个新的航迹核心对象。通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵,具体可以通过以下方式来实现:
由于加权得到的Hausdorff距离矩阵H是针对其主对角线对称的,因此,在加权后的 Hausdorff距离矩阵
Figure 600009DEST_PATH_IMAGE091
的主对角线的右侧选取
Figure 809405DEST_PATH_IMAGE091
中的最小值:
Figure 745000DEST_PATH_IMAGE133
其中,
Figure 62849DEST_PATH_IMAGE094
表示航迹核心对象
Figure 922351DEST_PATH_IMAGE036
和航迹核心对象
Figure 110887DEST_PATH_IMAGE042
间加权后的双向Hausdorff距 离;将航迹核心对象
Figure 217384DEST_PATH_IMAGE036
Figure 897895DEST_PATH_IMAGE042
合并,生成一个新的航迹核心对象
Figure 748039DEST_PATH_IMAGE095
,同时将加权后的 Hausdorff距离矩阵
Figure 56661DEST_PATH_IMAGE091
关于主对角线的右上侧部分进行更新,更新方法为将加权后的 Hausdorff距离矩阵
Figure 144178DEST_PATH_IMAGE091
中与
Figure 498936DEST_PATH_IMAGE036
Figure 559296DEST_PATH_IMAGE042
相关的两行与两列剔除,将新生成的航迹核心对象
Figure 863369DEST_PATH_IMAGE095
置于加权后的Hausdorff距离矩阵
Figure 577247DEST_PATH_IMAGE091
中的第
Figure 825826DEST_PATH_IMAGE001
行第
Figure 565243DEST_PATH_IMAGE001
列,同时第j行后的航迹核心对象上移一 位,第j列后的航迹核心对象左移一位,补充原
Figure 114036DEST_PATH_IMAGE091
中被剔除的第j行与第j列;其中,
Figure 733236DEST_PATH_IMAGE001
行的双向Hausdorff距离的计算方法为:
Figure 344477DEST_PATH_IMAGE096
Figure 12219DEST_PATH_IMAGE001
列的双向Hausdorff距离的计算方法为:
Figure 540152DEST_PATH_IMAGE134
其中,
Figure 72197DEST_PATH_IMAGE098
表示航迹核心对象
Figure 560947DEST_PATH_IMAGE099
与航迹核心对象
Figure 891434DEST_PATH_IMAGE036
间未加权过的双向 Hausdorff距离,
Figure 962290DEST_PATH_IMAGE100
Figure 860976DEST_PATH_IMAGE101
表示航迹核心对象
Figure 696076DEST_PATH_IMAGE099
与航迹核心 对象
Figure 705621DEST_PATH_IMAGE042
间未加权过的双向Hausdorff距离,
Figure 693299DEST_PATH_IMAGE102
Figure 825204DEST_PATH_IMAGE103
表示航 迹核心对象
Figure 288546DEST_PATH_IMAGE036
与航迹核心对象
Figure 711568DEST_PATH_IMAGE104
间未加权过的双向Hausdorff距离;
Figure 6283DEST_PATH_IMAGE105
表示 航迹核心对象
Figure 246772DEST_PATH_IMAGE042
与航迹核心对象
Figure 804267DEST_PATH_IMAGE104
间未加权过的双向Hausdorff距离;
Figure 483510DEST_PATH_IMAGE106
表示本次合 并之前的矩阵
Figure 304836DEST_PATH_IMAGE091
中第w行对应的加权系数;
Figure 857171DEST_PATH_IMAGE107
表示本次合并之前的矩阵
Figure 91843DEST_PATH_IMAGE091
中第j行对应的加 权系数;
在新生成的这一行和一列生成后,将其置于矩阵H的第
Figure 981302DEST_PATH_IMAGE001
行与第
Figure 798079DEST_PATH_IMAGE001
列,新产生的航迹核心 对象在后续的合并操作中可以被再次加权。在更新完第
Figure 645950DEST_PATH_IMAGE001
行和第
Figure 164656DEST_PATH_IMAGE001
列后,在这一行和这一列 之后的各行、列元素依次排列在矩阵H中,即第j行和第j列之后的值向上或左位移一位,按 照如下公式更新Hausdorff距离矩阵主对角线右上方的值:
Figure 936434DEST_PATH_IMAGE108
其中,
Figure 466772DEST_PATH_IMAGE109
Figure 79019DEST_PATH_IMAGE110
表示Hausdorff距离矩阵的第
Figure 41946DEST_PATH_IMAGE110
列,
Figure 663420DEST_PATH_IMAGE111
表示Hausdorff距离矩阵的第
Figure 579423DEST_PATH_IMAGE110
列对应的航迹核心对象;以主对角线为对称轴,将主对角线右上方的值赋给主对角线左下 方对应的值,以保证矩阵H对称于主对角线;
若在聚类后期,需要合并的两个航迹核心对象
Figure 113304DEST_PATH_IMAGE112
Figure 809865DEST_PATH_IMAGE113
,航迹核心对 象
Figure 844817DEST_PATH_IMAGE112
包含
Figure 756272DEST_PATH_IMAGE114
个原始的航迹核心对象,
Figure 585688DEST_PATH_IMAGE115
航迹核心对象
Figure 566282DEST_PATH_IMAGE113
Figure 483554DEST_PATH_IMAGE117
个原 始的航迹核心对象,
Figure 842991DEST_PATH_IMAGE118
则更新后的航迹核心对象
Figure 499100DEST_PATH_IMAGE112
与航迹核心对象
Figure 576778DEST_PATH_IMAGE113
之间加权后的双向Hausdorff距离为:
Figure 294810DEST_PATH_IMAGE135
其中,
Figure 898967DEST_PATH_IMAGE120
表示航迹核心对象
Figure 601344DEST_PATH_IMAGE112
与航迹核心对象
Figure 41683DEST_PATH_IMAGE113
间未加 权过的双向Hausdorff距离;
Figure 550025DEST_PATH_IMAGE121
表示本次合并之前的矩阵
Figure 149634DEST_PATH_IMAGE091
中,
Figure 835961DEST_PATH_IMAGE122
Figure 12865DEST_PATH_IMAGE123
的最小值对 应的行的加权系数。在一步合并后,聚类簇的个数
Figure 731422DEST_PATH_IMAGE136
在具体实施时,在本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法 中,步骤S7中,利用如下公式计算航迹聚类簇
Figure 326482DEST_PATH_IMAGE112
的类内距离平均值,即类内的未 加权的原始航迹核心对象两两距离的平均值:
Figure 105083DEST_PATH_IMAGE137
利用如下公式计算航迹聚类簇
Figure 972544DEST_PATH_IMAGE112
与其他所有航迹聚类簇
Figure 650387DEST_PATH_IMAGE125
的类间距 离平均值,即经过合并后生成的Harsdorff距离矩阵中与该类对应的一行的平均值:
Figure 959008DEST_PATH_IMAGE138
如果针对每一类航迹簇,类内距离平均值都小于类间距离平均值的比例阈值
Figure 236406DEST_PATH_IMAGE139
,即
Figure 873055DEST_PATH_IMAGE140
,则认为层次聚类的效果已经较为理想,此时可以执行步骤 S9;如果两种距离的关系不满足要求,且航迹聚类簇的个数
Figure 464573DEST_PATH_IMAGE141
,则返回步骤S5,针对现 有的数据分布,对现有Hausdorff距离矩阵中进行了合并操作的对象进行再次加权,之后进 行下一层合并层次聚类;如果两种距离的关系不满足要求,且航迹聚类簇的个数
Figure 955597DEST_PATH_IMAGE142
, 则可以执行步骤S9,对现有的结果进行可视化展示。
在复杂的空域环境下完成航迹模式的自适应挖掘后,可以使空管部门对于航班在空域中的运行方式有所了解,便于在航班出现不同于现有航迹模式时及时进行告警,在航班执行一定距离后预测后续的飞行轨迹,以及对空域流量、扇区开合做出优化调控,为空域安全性和高效性提供有力支撑,具有积极的意义。
基于同一发明构思,本发明还提供了一种基于自适应层次聚类的航迹模式挖掘装置,包括:信息获取模块、航迹预处理模块、航迹核心对象生成模块、距离矩阵生成模块、自适应权重调整模块、层次聚类模块以及航迹模式可视化模块;其中,
信息获取模块,用于针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
航迹预处理模块,用于对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
航迹核心对象生成模块,用于将预处理后的各航迹序列作为输入数据,计算每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
距离矩阵生成模块,用于将选取的各航迹核心对象作为的输入数据,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
自适应权重调整模块,用于根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
层次聚类模块,用于采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;在类内距离平均值与类间距离平均值的比值大于或等于阈值时,判断航迹聚类簇的个数是否大于3;在航迹聚类簇的个数大于3时,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;
航迹模式可视化模块,用于在类内距离平均值与类间距离平均值的比值小于阈值时,或者,在类内距离平均值与类间距离平均值的比值大于或等于阈值且航迹聚类簇的个数小于或等于3时,将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
本发明提供的上述基于自适应层次聚类的航迹模式挖掘装置的具体实施与本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法的实施类似,在此不做赘述。
本发明提供的上述基于自适应层次聚类的航迹模式挖掘方法及装置,通过信息获取模块得到民航航班的飞行轨迹数据,进行预处理后,基于数据密度分布对数据进行核心对象提取,使用基于航迹数据相关性的自适应层次聚类算法对航班的航迹运动模式进行挖掘并可视化。由于自适应层次聚类算法的使用需要获取航班的飞行轨迹数据,因此,飞行轨迹数据包括航班三维坐标位置、飞行速度、航向角度以及时间点。具体地,首先通过信息获取模块对航班航迹信息进行提取,并接入航迹预处理模块进行数据预处理得到规整的航迹序列,然后通过航迹核心对象生成模块根据航迹密度分布生成核心对象并滤除噪声,对核心对象通过自适应权重调整模块进行加权,再通过层次聚类模块进行模式挖掘,最终通过航迹模式可视化模块对挖掘出的航迹模式进行展示。本发明针对空中交通运行高密度、高复杂度的状况,实现了在多航班运行环境下的航迹模式挖掘,为航迹模式挖掘问题的解决提出了一个全新的方案;本发明围绕着海量航班运行背景下的航迹模式精准快速挖掘,从提升空中交通系统安全性和高效性两方面出发,开展航迹模式挖掘方法研究,对于确保航班飞行安全、合理调配空域容量、检测异常飞行状况、预测航班未来飞行行为以及提高空中交通系统的运行效率具有重要的意义;本发明针对现有技术在挖掘航迹模式时不同规模的航迹容易相互交织的难点问题,提出通过自适应加权的方式辅助合并操作的进行,通过加权有效控制合并的顺序,使应属于大规模航迹模式的航迹先于应属于小规模航迹模式的航迹,从而可以显著减少大模式吞并小模式的发生;本发明能够处理空域内各城市对间规模不一、相互交织的航迹模式挖掘问题,航迹模式识别精度高,对参数的依赖小,可以有效解决复杂环境下的航迹模式挖掘问题。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种基于自适应层次聚类的航迹模式挖掘方法,其特征在于,包括如下步骤:
S1:针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
S2:对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
S3:计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
S4:计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
S5:根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
S6:采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;
S7:计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;若否,则执行步骤S8;若是,则执行步骤S9;
S8:判断航迹聚类簇的个数是否大于3;若是,则返回步骤S5,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;若否,则执行步骤S9;
S9:将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
2.如权利要求1所述的基于自适应层次聚类的航迹模式挖掘方法,其特征在于,步骤S1 中,第
Figure 424378DEST_PATH_IMAGE001
个航迹序列为
Figure 528163DEST_PATH_IMAGE002
,代表航迹序列
Figure 412943DEST_PATH_IMAGE003
包含
Figure 148818DEST_PATH_IMAGE004
个航迹向量,
Figure 206772DEST_PATH_IMAGE005
Figure 406810DEST_PATH_IMAGE006
表示航迹序列的数量;其中航迹向量 ,其中,
Figure 249443DEST_PATH_IMAGE008
表示航迹向量
Figure 783192DEST_PATH_IMAGE009
的实时经度,
Figure 40998DEST_PATH_IMAGE010
表示航迹向量
Figure 64318DEST_PATH_IMAGE009
的实时纬度,
Figure 837102DEST_PATH_IMAGE011
表示航迹向量
Figure 112226DEST_PATH_IMAGE009
的实时高度,
Figure 50969DEST_PATH_IMAGE012
表示航迹向量
Figure 245190DEST_PATH_IMAGE009
的实时飞行速度,
Figure 36429DEST_PATH_IMAGE013
表示航迹向量
Figure 911981DEST_PATH_IMAGE009
的实时航向角,
Figure 144379DEST_PATH_IMAGE014
表示航迹向量
Figure 745387DEST_PATH_IMAGE009
的实时时间点。
3.如权利要求2所述的基于自适应层次聚类的航迹模式挖掘方法,其特征在于,步骤S2 中,对航迹序列
Figure 758342DEST_PATH_IMAGE003
进行去除异常值,具体包括:
提取每个航迹向量的实时飞行速度,若
Figure 375268DEST_PATH_IMAGE015
Figure 321228DEST_PATH_IMAGE016
,则 将飞行速度
Figure 60514DEST_PATH_IMAGE012
对应的航迹向量
Figure 232869DEST_PATH_IMAGE009
去除;
提取每个航迹向量的实时航向角,若
Figure 954618DEST_PATH_IMAGE017
Figure 20663DEST_PATH_IMAGE018
,则将航向 角
Figure 602954DEST_PATH_IMAGE013
对应的航迹向量
Figure 324923DEST_PATH_IMAGE009
去除;其中,
Figure 142706DEST_PATH_IMAGE019
表示航迹向量
Figure 204203DEST_PATH_IMAGE020
的实时航向角,
Figure 786756DEST_PATH_IMAGE021
表示航迹 向量
Figure 58338DEST_PATH_IMAGE022
的实时航向角,
Figure 289599DEST_PATH_IMAGE023
Figure 267919DEST_PATH_IMAGE024
提取每个航迹向量的实时经度、实时纬度和实时高度,若
,则 将经度
Figure 777321DEST_PATH_IMAGE008
、纬度
Figure 77853DEST_PATH_IMAGE010
和高度
Figure 910680DEST_PATH_IMAGE011
对应的航迹向量
Figure 130308DEST_PATH_IMAGE009
去除;其中,
Figure 251848DEST_PATH_IMAGE026
表示航迹向量
Figure 152808DEST_PATH_IMAGE022
的实 时经度,
Figure 669502DEST_PATH_IMAGE027
表示航迹向量
Figure 935398DEST_PATH_IMAGE022
的实时纬度,
Figure 340972DEST_PATH_IMAGE028
表示航迹向量
Figure 373519DEST_PATH_IMAGE022
的实时高度,
Figure 180938DEST_PATH_IMAGE029
表示 航迹向量
Figure 617736DEST_PATH_IMAGE020
的实时经度,
Figure 89035DEST_PATH_IMAGE030
表示航迹向量
Figure 331798DEST_PATH_IMAGE020
的实时纬度,
Figure 931406DEST_PATH_IMAGE031
表示航迹向量
Figure 929318DEST_PATH_IMAGE020
的实 时高度;
步骤S2中,对航迹序列
Figure 309484DEST_PATH_IMAGE003
进行去重,具体包括:
遍历航迹序列
Figure 293621DEST_PATH_IMAGE003
的所有航迹向变量,若存在
Figure 577097DEST_PATH_IMAGE032
,则将重 复的航迹向量
Figure 480331DEST_PATH_IMAGE033
去除;
步骤S2中,对航迹序列
Figure 285476DEST_PATH_IMAGE003
进行分段,具体包括:
获取航迹序列
Figure 135620DEST_PATH_IMAGE003
的所有经度和纬度,组成多个经纬度点,引接我国的空域情报区划分 数据,按照各经纬度点所属的情报区进行标号;
步骤S2中,对航迹序列
Figure 834454DEST_PATH_IMAGE003
进行重采样,具体包括:
针对航迹序列
Figure 610387DEST_PATH_IMAGE003
在同一个情报区内的数据段,计算航班航迹点数
Figure 637249DEST_PATH_IMAGE034
,选取重采样点数 为100,以航班航迹点数对重采样点数做整数除法得出重采样步长,余数的一半作为航迹序 列
Figure 87822DEST_PATH_IMAGE003
在该情报区内的数据段首尾需去除的点数,按照重采样步长对航迹序列
Figure 578846DEST_PATH_IMAGE003
在该情报 区内的数据段进行重采样,重采样计算公式如下:
Figure 964828DEST_PATH_IMAGE035
其中,
Figure 806882DEST_PATH_IMAGE036
表示重采样后的航迹序列,
Figure 297032DEST_PATH_IMAGE037
表示航迹
Figure 580245DEST_PATH_IMAGE003
的第
Figure 465025DEST_PATH_IMAGE038
个航迹序列,
Figure 325533DEST_PATH_IMAGE039
表示重采样的起始位置,
Figure 993275DEST_PATH_IMAGE040
表示整数除法后确定的重采样步长,
Figure 255629DEST_PATH_IMAGE041
以1的步长从0取到99,表 示重采样所需的100个点。
4.如权利要求3所述的基于自适应层次聚类的航迹模式挖掘方法,其特征在于,步骤S3,计算预处理后的每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象,具体包括:
利用如下公式计算航迹序列
Figure 815704DEST_PATH_IMAGE036
与航迹序列
Figure 38875DEST_PATH_IMAGE042
之间未加权过的双向Hausdorff距离
Figure 838204DEST_PATH_IMAGE043
Figure 955065DEST_PATH_IMAGE044
Figure 853751DEST_PATH_IMAGE045
Figure 892114DEST_PATH_IMAGE046
其中, 表示航迹序列 到航迹序列 的单向Hausdorff距离,
Figure 359949DEST_PATH_IMAGE050
表 示航迹向量
Figure 173185DEST_PATH_IMAGE051
的空间位置
Figure 622227DEST_PATH_IMAGE052
与航迹向量
Figure 597136DEST_PATH_IMAGE053
的空间位置 的空间 欧式距离, 表示航迹序列 到航迹序列 的单向Hausdorff距离,
Figure 117242DEST_PATH_IMAGE057
表 示航迹向量
Figure 600176DEST_PATH_IMAGE058
的空间位置
Figure 666221DEST_PATH_IMAGE059
与航迹向量
Figure 576408DEST_PATH_IMAGE060
的空间位置
Figure 970480DEST_PATH_IMAGE061
的空间 欧式距离;
设置参数
Figure 546518DEST_PATH_IMAGE062
作为航迹序列间双向Hausdorff距离
Figure 670332DEST_PATH_IMAGE043
的阈值,设置参数
Figure 689104DEST_PATH_IMAGE063
作 为生成航迹核心对象所需包含的最少“邻居”航迹序列数;选取一个航迹序列
Figure 632789DEST_PATH_IMAGE036
,计算
Figure 254263DEST_PATH_IMAGE036
与 其他所有航迹序列间的双向Hausdorff距离
Figure 170267DEST_PATH_IMAGE064
;若对于某一个
Figure 923721DEST_PATH_IMAGE065
,使
Figure 417019DEST_PATH_IMAGE066
,则进行一次计数;当遍历完所有的航迹序列后,若计数的值大于或等于
Figure 717551DEST_PATH_IMAGE063
,则将航迹序列
Figure 550378DEST_PATH_IMAGE036
定义为航迹核心对象;遍历所有航迹序列后,得到在参数
Figure 770006DEST_PATH_IMAGE062
Figure 625967DEST_PATH_IMAGE063
下的航迹核心对象集合。
5.如权利要求4所述的基于自适应层次聚类的航迹模式挖掘方法,其特征在于,步骤S4,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵,具体包括:
假设共生成
Figure 291041DEST_PATH_IMAGE067
个航迹核心对象,则Hausdorff距离矩阵为:
Figure 306271DEST_PATH_IMAGE068
其中,
Figure 572167DEST_PATH_IMAGE043
表示航迹核心对象
Figure 977740DEST_PATH_IMAGE069
与航迹核心对象
Figure 744708DEST_PATH_IMAGE042
间未加权过的双向Hausdorff 距离,满足:
Figure 53592DEST_PATH_IMAGE070
Figure 490389DEST_PATH_IMAGE071
6.如权利要求5所述的基于自适应层次聚类的航迹模式挖掘方法,其特征在于,步骤S5,根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权,具体包括:
S53:判断某一个航迹核心对象 是否与其他所有航迹核心对象中超过第一阈值
Figure 953918DEST_PATH_IMAGE072
的 航迹核心对象间的双向Hausdorff距离小于
Figure 819106DEST_PATH_IMAGE073
Figure 551438DEST_PATH_IMAGE074
;若是,则执行步骤S54;若 否,则执行步骤S55;其中,
Figure 170419DEST_PATH_IMAGE075
表示航迹核心对象
Figure 420135DEST_PATH_IMAGE036
与其他航迹核心对象间的最远双向 Hausdorff距离;
S54:将航迹核心对象
Figure 998884DEST_PATH_IMAGE036
在Hausdorff距离矩阵的对应行的所有值均乘以加权系数
Figure 105380DEST_PATH_IMAGE076
Figure 379367DEST_PATH_IMAGE077
,同时记录
Figure 291828DEST_PATH_IMAGE078
;其中,
Figure 429810DEST_PATH_IMAGE079
表示航迹核心对象
Figure 379312DEST_PATH_IMAGE036
的加权系数;
S55:判断航迹核心对象 是否与其他所有的航迹核心对象中超过第二阈值 的航迹 核心对象间的双向Hausdorff距离大于
Figure 675667DEST_PATH_IMAGE081
Figure 684818DEST_PATH_IMAGE082
;若是,则执行步骤S56;若否,则执行步 骤S57;
S56:将航迹核心对象
Figure 933397DEST_PATH_IMAGE036
在Hausdorff距离矩阵的对应行的所有值均乘以加权系数
Figure 125344DEST_PATH_IMAGE083
Figure 329929DEST_PATH_IMAGE084
,同时记录
Figure 450594DEST_PATH_IMAGE085
S57:记录
Figure 576682DEST_PATH_IMAGE086
S58:遍历Hausdorff距离矩阵的所有行后,对得到的Hausdorff距离矩阵根据主对角线 进行翻转,得到加权后的Hausdorff距离矩阵
Figure 572320DEST_PATH_IMAGE087
以及各个航迹核心对象的加权情况。
7.如权利要求6所述的基于自适应层次聚类的航迹模式挖掘方法,其特征在于,步骤S6,采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵,具体包括:
在加权后的Hausdorff距离矩阵
Figure 710040DEST_PATH_IMAGE087
的主对角线的右侧选取
Figure 156651DEST_PATH_IMAGE087
中的最小值:
Figure 770035DEST_PATH_IMAGE088
其中,
Figure 241467DEST_PATH_IMAGE089
表示航迹核心对象
Figure 561590DEST_PATH_IMAGE036
和航迹核心对象
Figure 584910DEST_PATH_IMAGE042
间加权后的双向Hausdorff距 离;将航迹核心对象
Figure 124738DEST_PATH_IMAGE036
Figure 399861DEST_PATH_IMAGE042
合并,生成一个新的航迹核心对象
Figure 574491DEST_PATH_IMAGE090
,将加权后的Hausdorff 距离矩阵
Figure 34291DEST_PATH_IMAGE087
中与
Figure 294371DEST_PATH_IMAGE036
Figure 107606DEST_PATH_IMAGE042
相关的两行与两列剔除,将新生成的航迹核心对象
Figure 697594DEST_PATH_IMAGE090
置于加权后 的Hausdorff距离矩阵
Figure 265979DEST_PATH_IMAGE087
中的第
Figure 951038DEST_PATH_IMAGE001
行第
Figure 630281DEST_PATH_IMAGE001
列,同时第j行后的航迹核心对象上移一位,第j列后 的航迹核心对象左移一位,补充原
Figure 310661DEST_PATH_IMAGE087
中被剔除的第j行与第j列;
计算第
Figure 551412DEST_PATH_IMAGE001
行的双向Hausdorff距离:
Figure 582822DEST_PATH_IMAGE091
计算第i列的双向Hausdorff距离:
Figure 3439DEST_PATH_IMAGE092
其中,表示航迹核心对象
Figure 979671DEST_PATH_IMAGE094
与航迹核心对象
Figure 206034DEST_PATH_IMAGE036
间未加权过的双向 Hausdorff距离,
Figure 164762DEST_PATH_IMAGE095
Figure 288576DEST_PATH_IMAGE096
表示航迹核心对象
Figure 900823DEST_PATH_IMAGE094
与航迹核心对 象
Figure 47771DEST_PATH_IMAGE042
间未加权过的双向Hausdorff距离,
Figure 872507DEST_PATH_IMAGE097
Figure 414609DEST_PATH_IMAGE098
表示航迹 核心对象
Figure 666599DEST_PATH_IMAGE036
与航迹核心对象
Figure 35264DEST_PATH_IMAGE099
间未加权过的双向Hausdorff距离;
Figure 398112DEST_PATH_IMAGE100
表示航 迹核心对象
Figure 558835DEST_PATH_IMAGE042
与航迹核心对象
Figure 480261DEST_PATH_IMAGE099
间未加权过的双向Hausdorff距离;
Figure 336222DEST_PATH_IMAGE101
表示本次合并 之前的矩阵
Figure 502761DEST_PATH_IMAGE087
中第
Figure 517990DEST_PATH_IMAGE102
行对应的加权系数;
Figure 111782DEST_PATH_IMAGE103
表示本次合并之前的矩阵
Figure 455039DEST_PATH_IMAGE087
中第
Figure 661155DEST_PATH_IMAGE065
行对应的加 权系数;
按照如下公式更新Hausdorff距离矩阵主对角线右上方的值:
Figure 530891DEST_PATH_IMAGE104
其中,
Figure 295584DEST_PATH_IMAGE105
Figure 860558DEST_PATH_IMAGE106
表示Hausdorff距离矩阵的第
Figure 431216DEST_PATH_IMAGE106
列,
Figure 585818DEST_PATH_IMAGE107
表示Hausdorff距离矩阵的第
Figure 459096DEST_PATH_IMAGE106
列对应的航迹核心对象;以主对角线为对称轴,将主对角线右上方的值赋给主对角线左下 方对应的值;
若需要合并的两个航迹核心对象
Figure 839262DEST_PATH_IMAGE108
Figure 213611DEST_PATH_IMAGE109
,航迹核心对象
Figure 402147DEST_PATH_IMAGE108
包含
Figure 508643DEST_PATH_IMAGE110
个原始的航迹核心对象,
Figure 939887DEST_PATH_IMAGE111
航迹核心对象
Figure 790031DEST_PATH_IMAGE109
Figure 364232DEST_PATH_IMAGE112
个原始 的航迹核心对象,
Figure 641630DEST_PATH_IMAGE113
则更新后的航迹核心对象
Figure 58704DEST_PATH_IMAGE108
与航迹核心对象
Figure 119064DEST_PATH_IMAGE109
之间加权后的双向Hausdorff距离为:
Figure 374203DEST_PATH_IMAGE114
其中,
Figure 88081DEST_PATH_IMAGE115
表示航迹核心对象
Figure 461294DEST_PATH_IMAGE108
与航迹核心对象
Figure 590924DEST_PATH_IMAGE109
间未加 权过的双向Hausdorff距离;
Figure 202033DEST_PATH_IMAGE116
表示本次合并之前的矩阵
Figure 853857DEST_PATH_IMAGE087
中,
Figure 917628DEST_PATH_IMAGE117
Figure 975583DEST_PATH_IMAGE118
的最小值对 应的行的加权系数。
8.如权利要求7所述的基于自适应层次聚类的航迹模式挖掘方法,其特征在于,步骤S7 中,利用如下公式计算航迹聚类簇
Figure 441199DEST_PATH_IMAGE108
的类内距离平均值:
Figure 168984DEST_PATH_IMAGE119
利用如下公式计算航迹聚类簇
Figure 224445DEST_PATH_IMAGE108
与其他所有航迹聚类簇
Figure 554932DEST_PATH_IMAGE120
的类间距离 平均值:
Figure 812738DEST_PATH_IMAGE121
9.一种基于自适应层次聚类的航迹模式挖掘装置,其特征在于,包括:信息获取模块、航迹预处理模块、航迹核心对象生成模块、距离矩阵生成模块、自适应权重调整模块、层次聚类模块以及航迹模式可视化模块;其中,
所述信息获取模块,用于针对空域中的某一城市对,获取在某一时间段内的所有民航航班运行信息,从中提取航班的实时经度、实时纬度、实时高度、实时飞行速度、实时航向角以及实时时间点六种信息,形成多个航迹序列;
所述航迹预处理模块,用于对形成的各航迹序列进行预处理,包括去除异常值、去重、分段和重采样;
所述航迹核心对象生成模块,用于将预处理后的各航迹序列作为输入数据,计算每两个航迹序列之间的双向Hausdorff距离,采用基于航迹序列中的数据密度分布的核心对象生成算法进行航迹核心对象的选取,得到一组航迹核心对象;
所述距离矩阵生成模块,用于将选取的各航迹核心对象作为的输入数据,计算每两个航迹核心对象之间的双向Hausdorff距离,构建航迹核心对象之间的Hausdorff距离矩阵;
所述自适应权重调整模块,用于根据生成的Hausdorff距离矩阵,确定每个航迹核心对象对应的权重值,对Hausdorff距离矩阵的每一行进行加权;
所述层次聚类模块,用于采用合并层次聚类算法对航迹核心对象进行一次合并,将Hausdorff距离矩阵中距离最小的两个航迹核心对象进行合并,生成一个新的航迹核心对象,通过计算新生成的航迹核心对象与其他航迹核心对象之间的双向Hausdorff距离,更新Hausdorff距离矩阵;其中,更新后的Hausdorff距离矩阵中每一行对应的航迹核心对象为一个航迹聚类簇;计算各个航迹聚类簇的类内距离平均值和类间距离平均值,判断类内距离平均值与类间距离平均值的比值是否小于阈值;在类内距离平均值与类间距离平均值的比值大于或等于阈值时,判断航迹聚类簇的个数是否大于3;在航迹聚类簇的个数大于3时,重新对Hausdorff距离矩阵中新生成的航迹核心对象对应的一行数值进行加权后,进行下一次合并;
所述航迹模式可视化模块,用于在类内距离平均值与类间距离平均值的比值小于阈值时,或者,在类内距离平均值与类间距离平均值的比值大于或等于阈值且航迹聚类簇的个数小于或等于3时,将每一个航迹聚类簇进行扩充,扩充的内容为该航迹聚类簇中航迹核心对象在航迹序列间双向Hausdorff距离阈值内的其他航迹,形成该航迹聚类簇对应的航迹模式,将各个航迹聚类簇对应的航迹模式进行可视化展示。
CN202010394728.2A 2020-05-12 2020-05-12 一种航迹模式挖掘方法与装置 Active CN111291098B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010394728.2A CN111291098B (zh) 2020-05-12 2020-05-12 一种航迹模式挖掘方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010394728.2A CN111291098B (zh) 2020-05-12 2020-05-12 一种航迹模式挖掘方法与装置

Publications (2)

Publication Number Publication Date
CN111291098A true CN111291098A (zh) 2020-06-16
CN111291098B CN111291098B (zh) 2020-08-28

Family

ID=71024925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010394728.2A Active CN111291098B (zh) 2020-05-12 2020-05-12 一种航迹模式挖掘方法与装置

Country Status (1)

Country Link
CN (1) CN111291098B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112231389A (zh) * 2020-10-16 2021-01-15 中国民用航空华东地区空中交通管理局 基于航迹的可视化冲突模型构建方法、装置、电子设备及存储介质
CN112269844A (zh) * 2020-09-24 2021-01-26 桂林电子科技大学 基于大规模轨迹数据的通用伴随模式分布式挖掘方法
CN113157848A (zh) * 2021-05-06 2021-07-23 清华大学 航路确定方法及装置、电子设备和存储介质
CN114022790A (zh) * 2022-01-10 2022-02-08 成都国星宇航科技有限公司 遥感图像中云层检测及图像压缩方法、装置和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104680187A (zh) * 2015-03-19 2015-06-03 南京大学 基于缓冲区相似性度量的舰船轨迹层次聚类分析方法
CN109000645A (zh) * 2018-04-26 2018-12-14 西南电子技术研究所(中国电子科技集团公司第十研究所) 复杂环境目标经典航迹提取方法
CN109977546A (zh) * 2019-03-27 2019-07-05 北京航空航天大学 一种基于无监督学习的四维航迹在线异常检测方法
CN109993225A (zh) * 2019-03-29 2019-07-09 北京航空航天大学 一种基于无监督学习的空域复杂度分类方法及装置
CN110188093A (zh) * 2019-05-21 2019-08-30 江苏锐天信息科技有限公司 一种基于大数据平台针对ais信息源的数据挖掘系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104680187A (zh) * 2015-03-19 2015-06-03 南京大学 基于缓冲区相似性度量的舰船轨迹层次聚类分析方法
CN109000645A (zh) * 2018-04-26 2018-12-14 西南电子技术研究所(中国电子科技集团公司第十研究所) 复杂环境目标经典航迹提取方法
CN109977546A (zh) * 2019-03-27 2019-07-05 北京航空航天大学 一种基于无监督学习的四维航迹在线异常检测方法
CN109993225A (zh) * 2019-03-29 2019-07-09 北京航空航天大学 一种基于无监督学习的空域复杂度分类方法及装置
CN110188093A (zh) * 2019-05-21 2019-08-30 江苏锐天信息科技有限公司 一种基于大数据平台针对ais信息源的数据挖掘系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GUIYUN ZHOU 等: ""A spatial clustering algorithm for line objects based on extended Hausdorff distance"", 《2013 21ST INTERNATIONAL CONFERENCE ON GEOINFORMATICS》 *
唐四惠 等: ""基于Hausdorff距离的关系层次聚类算法"", 《复杂系统与复杂性科学》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112269844A (zh) * 2020-09-24 2021-01-26 桂林电子科技大学 基于大规模轨迹数据的通用伴随模式分布式挖掘方法
CN112231389A (zh) * 2020-10-16 2021-01-15 中国民用航空华东地区空中交通管理局 基于航迹的可视化冲突模型构建方法、装置、电子设备及存储介质
CN113157848A (zh) * 2021-05-06 2021-07-23 清华大学 航路确定方法及装置、电子设备和存储介质
CN114022790A (zh) * 2022-01-10 2022-02-08 成都国星宇航科技有限公司 遥感图像中云层检测及图像压缩方法、装置和存储介质
CN114022790B (zh) * 2022-01-10 2022-04-26 成都国星宇航科技有限公司 遥感图像中云层检测及图像压缩方法、装置和存储介质

Also Published As

Publication number Publication date
CN111291098B (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
CN111291098B (zh) 一种航迹模式挖掘方法与装置
CN107766808B (zh) 道路网络空间中车辆对象移动轨迹聚类的方法及系统
CN109191922B (zh) 一种大规模四维航迹动态预测方法及装置
Wang et al. A hybrid machine learning model for short-term estimated time of arrival prediction in terminal manoeuvring area
Liu et al. Predicting aircraft trajectories: A deep generative convolutional recurrent neural networks approach
Zeng et al. A deep learning approach for aircraft trajectory prediction in terminal airspace
CN110111608B (zh) 基于雷达轨迹构建机坪场面运动目标运行意图识别的方法
Yu et al. Prediction of highway tunnel pavement performance based on digital twin and multiple time series stacking
CN113378891B (zh) 基于轨迹分布表示的城市区域关系可视分析方法
CN110992733A (zh) 一种航班偏离正常航迹行为在线检测方法及装置
Gallego et al. Discussion on density-based clustering methods applied for automated identification of airspace flows
CN111582380A (zh) 一种基于时空特征的船舶轨迹密度聚类方法及装置
Zhao et al. Abnormal trajectory detection based on a sparse subgraph
CN105893621A (zh) 基于多维航迹聚类的目标行为规律挖掘方法
CN113869379A (zh) 一种基于数据驱动的航空器能量异常识别方法
Lin et al. Approach for 4-d trajectory management based on HMM and trajectory similarity
Schimpf et al. Flight trajectory prediction based on hybrid-recurrent networks
Xuhao et al. Trajectory clustering for arrival aircraft via new trajectory representation
Jiang et al. Research on method of trajectory prediction in aircraft flight based on aircraft performance and historical track data
Wu et al. Aircraft flight regime recognition with deep temporal segmentation neural network
CN111310919B (zh) 基于场景切分和局部路径规划的驾驶控制策略训练方法
CN116543603A (zh) 一种考虑空域态势和局部优化的航迹补全预测方法及装置
CN115862385A (zh) 基于标准飞行程序的机场终端区航空器飞行模式挖掘方法
Shao et al. Onlineairtrajclus: An online aircraft trajectory clustering for tarmac situation awareness
CN114443763A (zh) 一种基于分布式网络的大数据同步方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant