CN115222159A - 一种基于空域关联度的热区识别方法 - Google Patents

一种基于空域关联度的热区识别方法 Download PDF

Info

Publication number
CN115222159A
CN115222159A CN202211116903.7A CN202211116903A CN115222159A CN 115222159 A CN115222159 A CN 115222159A CN 202211116903 A CN202211116903 A CN 202211116903A CN 115222159 A CN115222159 A CN 115222159A
Authority
CN
China
Prior art keywords
sector
sectors
semantic representation
sequence
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211116903.7A
Other languages
English (en)
Other versions
CN115222159B (zh
Inventor
毛永庆
王煊
黄吉波
丁一波
丁辉
田靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 28 Research Institute
Original Assignee
CETC 28 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 28 Research Institute filed Critical CETC 28 Research Institute
Priority to CN202211116903.7A priority Critical patent/CN115222159B/zh
Publication of CN115222159A publication Critical patent/CN115222159A/zh
Application granted granted Critical
Publication of CN115222159B publication Critical patent/CN115222159B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q50/40

Abstract

本发明公开了一种基于空域关联度的热区识别方法,其目的为:构建基于Transformer的扇区语义表征模型,利用交通流特性对扇区序列化表征,建立涵盖扇区流量和容量特征的数据结构,设计扇区的时空位置编码和标识编码。然后,设计掩码自监督学习任务训练模型,挖掘不同扇区之间的时空依赖关系,生成扇区语义表征向量。最后计算扇区语义表征向量间的相似度作为空域关联度,选择与其它扇区关联度最高的扇区作为热区进行识别和调控,为精细化流量控制策略的制定提供态势支撑。

Description

一种基于空域关联度的热区识别方法
技术领域
本发明涉及空中交通流量管理方法,特别是一种基于空域关联度的热区识别方法。
背景技术
随着我国国民经济持续、稳步、快速地发展,军民航飞行活动逐年保持强劲的增长势头。我国民航的空中交通活动主要集中在东部经济发达地区,部分民航空域已经趋于饱和;同时军航穿越民航航路的飞行也在不断增加,导致部分地区的训练空域资源紧张,空域内飞行矛盾越来越大,军民航协调工作日益繁重。为解决空中交通拥挤问题,近几年相关部门对航路走向、管制方法等作了多次调整,但飞行流量的快速增长仍使部分区域内的总流量很快达到饱和甚至超负荷。为确保高峰时期飞行安全,目前各地区大多采用流量控制方式,即限制本地区飞机起飞和外管制区的飞机进入。流量控制由于缺乏广泛的协调、信息和技术支持,完全依赖管制员个人的工作经验,具有较大的随机性和不确定性,其不仅严重威胁了飞行安全,也容易导致空中交通拥塞的恶性循环和航班的大面积延误,给国民经济造成巨大的经济损失。
当前空中交通流量管理分战略、预战术和战术三个阶段。战术流量管理阶段主要通过预测空域容量和流量,优化航班时刻表、调整航空器的起飞时间、飞行航线等实现流量管理。由于当前的流量管理方案需要对目标空域内的不同扇区的流量和容量分别计算,且由于不同扇区间的关系无法确定,导致管制员需要根据每个扇区的容流比分别制定独立的流量控制策略,而非针对关键扇区制定流量控制策略,难以实现精细化调控。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于空域关联度的热区识别方法。
为了解决上述技术问题,本发明公开了一种基于空域关联度的热区识别方法。
本发明引入空域关联度的概念,构建并训练扇区语义表征模型,挖掘扇区之间的时空依赖关系,计算一个扇区序列中的不同扇区在不同时间段上语义表征之间的相似度,生成空域关联度。然后,基于空域关联度识别关键扇区作为热区,并针对热区提供流量控制策略,为精细化流量控制策略的制定提供依据。
一种基于空域关联度的热区识别方法,包括以下步骤:
步骤1,扇区数据序列化表征:将目标空域内的扇区按照二维序列结构进行表征,得到扇区序列;
步骤2,扇区序列特征处理:计算扇区序列中的流量和容量特征值;
步骤3,扇区编码设计:设计扇区序列中所有扇区的时空位置编码,以及扇区标识编码;
步骤4,扇区语义表征模型构建:以Transformer为基础模型,构建扇区语义表征模型,计算扇区序列的语义表征向量;
步骤5,扇区语义表征模型训练:设计基于掩码自监督学习的训练任务,采集历史数据构建训练数据集训练扇区语义表征模型;
步骤6,扇区语义表征计算:使用训练后的扇区语义表征模型对扇区序列进行表征处理,生成扇区的语义表征向量;
步骤7,空域关联度计算:计算不同时间及空间位置的扇区的语义表征向量间的相似度,作为扇区间的空域关联度,并基于关联度识别目标空域内的热区。
步骤1中所述得到扇区序列的方法包括:
从流量管理系统中提取并分析每架航班的飞行计划,获取航班所经过航路点、航线和航向信息,利用4D轨迹预测并生成不同时间段中的交通流;根据交通流对航路经过的扇区进行排列组合,在空间维度上生成一维扇区序列;在此基础上引入时间维度,将一维扇区序列扩展为二维序列,定义为
Figure 532901DEST_PATH_IMAGE001
,其中
Figure 623217DEST_PATH_IMAGE002
表示扇区序列,
Figure 617849DEST_PATH_IMAGE003
表示实数,
Figure 666576DEST_PATH_IMAGE004
表示扇区数量,
Figure 769661DEST_PATH_IMAGE005
表示时间间隔数量。
步骤2包括:
选择扇区流量和容量作为描述扇区的物理特征;从流量管理系统中获取扇区在未来一段时间内不同时间段上的预测流量值和预测容量值;预测流量值的定义为:设定时间段内进入扇区的航班数量,取值为
Figure 912936DEST_PATH_IMAGE006
之间的整数;预测容量值的定义为:设定时间段内扇区能提供服务的最大航班数量,取值为
Figure 542500DEST_PATH_IMAGE006
之间的整数;由于不同时间段中扇区预测流量和预测容量的数值分布较广泛,会影响神经网络模型训练的收敛性,需要对预测流量值和预测容量值进行归一化处理,映射到
Figure 371916DEST_PATH_IMAGE007
区间,计算过程如下所示:
Figure 837663DEST_PATH_IMAGE008
Figure 535361DEST_PATH_IMAGE009
表示预测流量或预测容量值;在步骤1中定义的扇区序列
Figure 160377DEST_PATH_IMAGE002
的基础上,引入扇区流量和容量特征,将扇区序列重新定义为三维张量
Figure 534596DEST_PATH_IMAGE010
步骤3中,在扇区序列之中,同一扇区在不同空间和时间上的流量值和容量值是时变的,很难通过固定的流量/容量值判断属于哪一个扇区,以及扇区所在的时空位置。为了解决以上问题,设计扇区编码,包括时空位置编码和扇区标识编码。扇区编码的设计方法包括:
步骤3.1,针对输入数据特征具有的时间和空间两个维度的特点,所设计的扇区时空位置编码包含两个维度,时空位置编码的公式如下所示:
Figure 471328DEST_PATH_IMAGE011
(1)
Figure 113662DEST_PATH_IMAGE012
(2)
Figure 202972DEST_PATH_IMAGE013
(3)
Figure 498824DEST_PATH_IMAGE014
(4)
式中,
Figure 63797DEST_PATH_IMAGE015
表示扇区的时空位置编码,
Figure 86986DEST_PATH_IMAGE016
Figure 545649DEST_PATH_IMAGE017
是从
Figure 887769DEST_PATH_IMAGE018
区间内的等分数列,
Figure 284246DEST_PATH_IMAGE016
表示空间维度的位置,同理
Figure 861858DEST_PATH_IMAGE017
表示时间维度的位置,
Figure 424295DEST_PATH_IMAGE016
Figure 61950DEST_PATH_IMAGE017
的长度定义为
Figure 335936DEST_PATH_IMAGE019
,即扇区语义表征模型的隐层维度,
Figure 467972DEST_PATH_IMAGE020
定义为一个非负常数;
Figure 901227DEST_PATH_IMAGE021
表示空间尺寸,
Figure 585149DEST_PATH_IMAGE022
表示时间尺寸,则时空位置编码
Figure 454754DEST_PATH_IMAGE015
满足
Figure 905327DEST_PATH_IMAGE023
步骤3.2,扇区标识编码用于辨别扇区;根据扇区数量对区间
Figure 802876DEST_PATH_IMAGE007
等比划分,用于表示不同的扇区,再将扇区序列中的标识编码扩展至
Figure 533065DEST_PATH_IMAGE024
维度,R表示实数;
步骤3.3,对输入序列
Figure 906278DEST_PATH_IMAGE002
进行表征处理,然后与扇区的时空位置编码以及标识编码相加,得到扇区语义表征模型的输入
Figure 770329DEST_PATH_IMAGE025
Figure 896285DEST_PATH_IMAGE026
(5)
式中,
Figure 312223DEST_PATH_IMAGE027
为输入扇区序列
Figure 657885DEST_PATH_IMAGE002
的表征结果(可以通过模型中的嵌入层生成),
Figure 794468DEST_PATH_IMAGE015
表示扇区的时空位置编码,
Figure 791243DEST_PATH_IMAGE028
表示步骤3.2中所述的扇区标识编码。
步骤4中所述扇区语义表征模型,包括:嵌入层、多头注意力层和前向传递网络(Feed-Forward Networks, FFN)层;
其中,嵌入层是线性神经网络,对输入扇区序列
Figure 627350DEST_PATH_IMAGE029
进行映射计算,转化为
Figure 443996DEST_PATH_IMAGE024
维度的数据,其数学表示为:
Figure 649850DEST_PATH_IMAGE030
(6)
其中,
Figure 251863DEST_PATH_IMAGE031
定义为权重矩阵,参数
Figure 9604DEST_PATH_IMAGE032
定义为偏置参数,输出
Figure 454492DEST_PATH_IMAGE033
Figure 572358DEST_PATH_IMAGE002
的表征结果,其中
Figure 543725DEST_PATH_IMAGE019
表示模型的隐层维度;然后将
Figure 347733DEST_PATH_IMAGE027
在时间维度上展平,得到:
Figure 889704DEST_PATH_IMAGE034
多头注意力层包括:线性映射、多头注意力计算、拼接与映射、随机丢弃、层标准化和残差连接,具体包括:首先,对输入
Figure 827573DEST_PATH_IMAGE027
进行线性映射,生成
Figure 528813DEST_PATH_IMAGE035
三个不同得序列,数学公式如下:
Figure 612044DEST_PATH_IMAGE036
(7)
Figure 421737DEST_PATH_IMAGE037
(8)
Figure 117292DEST_PATH_IMAGE038
(9)
式中,
Figure 938617DEST_PATH_IMAGE039
代表Query向量,
Figure 943483DEST_PATH_IMAGE040
代表Key向量,
Figure 850259DEST_PATH_IMAGE041
代表Value向量,
Figure 113619DEST_PATH_IMAGE042
Figure 648505DEST_PATH_IMAGE043
Figure 230796DEST_PATH_IMAGE044
分别为转换矩阵;序列中的每个扇区都受到其它空间和时间位置上扇区特征值的影响,扇区之间的注意力值大小表示相互影响的程度,计算公式如下所示:
Figure 234655DEST_PATH_IMAGE045
(10)
式中,
Figure 52439DEST_PATH_IMAGE046
是缩放因子,
Figure 582777DEST_PATH_IMAGE047
表示扇区序列的注意力值矩阵,矩阵的维度是
Figure 444292DEST_PATH_IMAGE048
Figure 184715DEST_PATH_IMAGE049
函数对注意力值矩阵进行归一化计算,输出结果表示经过扇区影响后所得目标扇区的语义表征向量;
Figure 415976DEST_PATH_IMAGE050
个注意力输出结果拼接和映射后,得到多头注意力值,计算如下所示:
Figure 676187DEST_PATH_IMAGE051
(11)
其中,
Figure 459335DEST_PATH_IMAGE052
表示第
Figure 828000DEST_PATH_IMAGE053
个注意力,且
Figure 971274DEST_PATH_IMAGE054
Figure 600838DEST_PATH_IMAGE055
表示对多个注意力头进行拼接计算,
Figure 430254DEST_PATH_IMAGE056
为转换矩阵,将多头注意力计算后输出
Figure 630422DEST_PATH_IMAGE057
;最后,使用随机丢弃和层归一化对
Figure 328120DEST_PATH_IMAGE058
进行处理后,与输入表征
Figure 61459DEST_PATH_IMAGE027
相加后生成输出
Figure 61776DEST_PATH_IMAGE059
Figure 264087DEST_PATH_IMAGE058
输入前向传递网络FFN层,包括:线性映射、非线性计算和线性映射,计算公式如下所示:
Figure 250628DEST_PATH_IMAGE060
(12)
其中,
Figure 464572DEST_PATH_IMAGE061
Figure 26003DEST_PATH_IMAGE062
是全连接层的转换矩阵,
Figure 699299DEST_PATH_IMAGE063
Figure 614166DEST_PATH_IMAGE064
是偏置参数,
Figure 72829DEST_PATH_IMAGE065
是非线性函数ReLU的计算过程;经过前向传递网络FFN层处理后输出扇区语义表征向量
Figure 555894DEST_PATH_IMAGE066
步骤5中所述设计基于掩码自监督学习的训练任务,包括:
设计自监督学习任务,参考BERT(参考:Devlin J, Chang M W, Lee K,Toutanova K. BERT: Pre-training of Deep Bidirectional Transformers forLanguage Understanding[C]. Proceedings of the North American Chapter of theAssociation for Computational Linguistics: Human Language Technologies, 2019:4171–4186.)的掩码语言模型(Masked Language Model, MLM)任务,在Transformer上拼接全连接层,实现线性空间映射,将扇区语义表征模型的输出
Figure 77005DEST_PATH_IMAGE067
Figure 654617DEST_PATH_IMAGE068
映射到
Figure 482633DEST_PATH_IMAGE069
维度;
从流量管理系统中采集历史数据构建训练数据集,以60%的概率对训练数据中的扇区随机遮掩,使用特殊标记MASK替换扇区的原始数值,生成输入数据,保留原始数据作为标签,生成训练数据集。
步骤5中所述设计基于掩码自监督学习的训练任务,包括:
在扇区语义表征模型的训练过程中,输入被遮掩的扇区序列数据,经过扇区语义表征模型的预测,得到被遮掩扇区的原始数值,通过计算预测值与标签间的误差,使用反向传播算法训练模型,使扇区语义表征模型学习时空依赖关系。
步骤6中所述扇区语义表征计算的方法包括:将扇区序列
Figure 120288DEST_PATH_IMAGE002
输入扇区语义表征模型,经过嵌入层、多层注意力层和FFN层的计算,生成扇区的深层语义表征
Figure 128695DEST_PATH_IMAGE070
,其中
Figure 526310DEST_PATH_IMAGE071
表示第
Figure 693986DEST_PATH_IMAGE072
个位置,第
Figure 377908DEST_PATH_IMAGE073
个时间间隔的扇区语义表征向量。
步骤7中所述空域关联度计算的方法包括:
使用扇区语义表征计算扇区间的空域关联度,公式如下所示:
Figure 536530DEST_PATH_IMAGE074
(13)
其中,
Figure 455944DEST_PATH_IMAGE075
表示两个不同扇区间的关联度;
Figure 494438DEST_PATH_IMAGE076
表示在第
Figure 614841DEST_PATH_IMAGE061
个空间位置,第
Figure 722474DEST_PATH_IMAGE077
个时间间隔上扇区的语义表征向量;
Figure 694847DEST_PATH_IMAGE078
表示在第
Figure 712482DEST_PATH_IMAGE062
个空间位置,第
Figure 128420DEST_PATH_IMAGE079
个时间间隔上扇区的语义表征向量。然后,选择与其它扇区关联度最高的扇区作为热区。
考虑语义表征模型的计算成本,步骤1中所述
Figure 474082DEST_PATH_IMAGE080
和时间间隔数量
Figure 141823DEST_PATH_IMAGE005
的取值满足以下条件:
Figure 138598DEST_PATH_IMAGE081
有益效果:
本发明所提出的方法可以从历史流量数据中学习一个扇区序列中不同扇区间的时空相关性,计算扇区语义表征和空域关联度。基于空域关联度可以识别关键的热点扇区,并对其进行精细化流量控制,辅助管制员提出高效实时的决策建议,减少航班的大面积延误,降低国民经济损失。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1为本发明总体流程图。
图2为基于Transformer的扇区语义表征模型结构图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
本发明的实现过程和步骤如下,其总体流程,如图1所示。
步骤1:扇区数据序列化表征。从流量管理系统中提取并分析每一架航班的飞行计划,获取航班所经过的航路点、航线和航向信息,利用4D轨迹预测并生成不同时间段中的交通流。根据交通流将
Figure 600803DEST_PATH_IMAGE004
个扇区以序列化的形式进行表征,同时将需要观测的目标时间段进行间隔化切片,以半小时为一个时间间隔,共计
Figure 932297DEST_PATH_IMAGE005
个时间间隔,形成
Figure 262784DEST_PATH_IMAGE082
的二维矩阵形式表示扇区序列。
步骤2:扇区序列特征处理。从流量管理系统中获取扇区在未来一段时间内不同时间段上的预测流量值和预测容量值,预测流量值定义为当前时间间隔内进入扇区的航班数量,取值为
Figure 864798DEST_PATH_IMAGE006
之间的整数;预测容量值定义为当前时间间隔内该扇区可提供的最大航班数量,取值为
Figure 232325DEST_PATH_IMAGE006
之间的整数。对预测流量值和预测容量值进行归一化处理,将数值映射到
Figure 67426DEST_PATH_IMAGE007
区间内,计算过程如下:
Figure 185292DEST_PATH_IMAGE008
Figure 766446DEST_PATH_IMAGE009
表示预测流量或预测容量值。
步骤3:扇区编码设计。扇区编码包括时空位置编码和标识编码。其中,时空位置编码采用公式(1) ~ (4)进行设计,得到
Figure 960667DEST_PATH_IMAGE023
的时空位置编码,同时参考步骤3.2设计扇区标识编码
Figure 502638DEST_PATH_IMAGE083
步骤4:扇区语义表征模型构建,如图2所示,模型包括嵌入层、多头注意力层和前向传递网络(Feed-Forward Networks, FFN)层,以及归一化处理。其中嵌入层对输入扇区序列
Figure 50294DEST_PATH_IMAGE002
进行表征处理,得到
Figure 610588DEST_PATH_IMAGE027
,参考公式(6),再和扇区的时空位置编码
Figure 959399DEST_PATH_IMAGE015
、标识编码
Figure 237934DEST_PATH_IMAGE028
相加,生成多头注意力层的输入
Figure 589281DEST_PATH_IMAGE027
,参考公式(5),然后将
Figure 285972DEST_PATH_IMAGE027
在时间维度上展平,转化成
Figure 431783DEST_PATH_IMAGE034
输入多头注意力层。多头注意力层中的具体过程参考公式(7) ~ (11),然后输出
Figure 197614DEST_PATH_IMAGE058
,经过归一化处理后,与输入
Figure 726553DEST_PATH_IMAGE027
相加,得到多头注意力层的输出。然后输入FFN层,使用公式(12)进行计算,再对FFN层的计算结果进行归一化处理,得到扇区的深层语义表征向量
Figure 136805DEST_PATH_IMAGE067
步骤5:扇区语义表征模型训练。从流量管理系统中采集历史数据,以60%的概率对输入序列进行随机遮掩,即使用特殊标志
Figure 578151DEST_PATH_IMAGE084
替换原始数值,生成训练样本。保留原始数据作为标签,生成训练数据集,计算正确数据与输出数据间的误差,并进行反向传播,实现模型自监督训练。
步骤6:扇区语义表征计算。使用扇区语义表征模型计算输入扇区序列的语义表征向量。
步骤7:空域关联度计算。根据公式(13)计算不同的时空位置上的扇区语义表征向量之间的相似度,作为扇区间的关联度,然后选择与其它扇区关联度最高的扇区作为热区。
实施例
首先给出航班飞行计划的例子:
航路点和航线:PIKAS, G330, PIMOL, A593, BTO, W82, DOGAR。
解释:在上述例子中,PIKAS、PIMOL、BTO和DOGAR表示航路点,G330、A593和W82表示两个航路点之间的航段,该飞行计划的航向是从PIKAS飞往DOGAR。使用4D轨迹预测可以算出一架航班在每个航路点上的过点时间。
步骤1:根据航路点和航线信息可以获得航路点所在扇区位置,根据4D轨迹预测航班进入到扇区的时间。其中,该航线经过的扇区序列长度为
Figure 582010DEST_PATH_IMAGE085
,以航路点之间的过点时间间隔进行时间段切片,则定义
Figure 134214DEST_PATH_IMAGE086
,输入的序列为
Figure 664553DEST_PATH_IMAGE087
,满足
Figure 260488DEST_PATH_IMAGE088
的限制条件。
步骤2:针对不同的扇区和时间间隔计算扇区的流量和容量特征,需要根据流量管理系统中的数据统计分析获得。例如:PIMOL航路点所在扇区进入航班60架,则其流量为60架;而该扇区可以提供的最大航班数量为70架。经过归一化后,该扇区的表征为
Figure 911DEST_PATH_IMAGE089
,即得到特征为
Figure 107538DEST_PATH_IMAGE090
,则输入序列为
Figure 757963DEST_PATH_IMAGE091
步骤3:设隐藏维度为
Figure 541111DEST_PATH_IMAGE092
,采用公式(2)~(5)设计时空位置编码,得到
Figure 752518DEST_PATH_IMAGE093
,设计扇区编码,以数字依次表示扇区。设北京所在扇区的编码是
Figure 521891DEST_PATH_IMAGE094
,则
Figure 417035DEST_PATH_IMAGE095
步骤4:构建扇区语义表征模型,该模型基于Transformer构建,包括嵌入层、多头注意力层和前向传递网络层。
步骤5:从流量管理系统中采集历史数据并构建训练数据集,设计掩码自监督学习任务训练模型。
步骤6:将输入扇区序列
Figure 121817DEST_PATH_IMAGE096
进行映射后,生成嵌入序列
Figure 305673DEST_PATH_IMAGE097
,再与时空位置编码和标识编码相加,得到特征向量输入多头注意力层,经过计算后生成输出向量,经过拼接,FFN层映射得到最终的扇区语义表征向量
Figure 144316DEST_PATH_IMAGE098
步骤7:计算不同空间和时间位置上的扇区语义表征间的相似度,假设扇区语义表征为
Figure 877655DEST_PATH_IMAGE099
,则相似度值为一个
Figure 2606DEST_PATH_IMAGE100
之间的概率,数值大小表示所选的两个扇区间的关联度,相似度值越高,表明两个扇区间的关联度越大。
构建扇区语义表征模型并使用历史数据进行训练,然后使用该模型对实施例中的扇区计算语义表征,得到
Figure 424491DEST_PATH_IMAGE101
四个扇区的语义表征,然后计算空域关联度。假如
Figure 801246DEST_PATH_IMAGE102
与其它三个扇区的关联度都最高,则选择
Figure 139823DEST_PATH_IMAGE102
作为扇区序列中的热区进行调控。
具体实现中,本申请提供计算机存储介质以及对应的数据处理单元,其中,该计算机存储介质能够存储计算机程序,所述计算机程序通过数据处理单元执行时可运行本发明提供的一种基于空域关联度的热区识别方法的发明内容以及各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(Random Access Memory, RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术方案可借助计算机程序以及其对应的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机程序即软件产品的形式体现出来,该计算机程序软件产品可以存储在存储介质中,包括若干指令用以使得一台包含数据处理单元的设备(可以是个人计算机,服务器,单片机或网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本发明提供了一种基于空域关联度的热区识别方法的思路及方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (10)

1.一种基于空域关联度的热区识别方法,其特征在于,包括以下步骤:
步骤1,扇区数据序列化表征:将目标空域内的扇区按照二维序列结构进行表征,得到扇区序列;
步骤2,扇区序列特征处理:计算扇区序列中的流量和容量特征值;
步骤3,扇区编码设计:设计扇区序列中所有扇区的时空位置编码,以及扇区标识编码;
步骤4,扇区语义表征模型构建:以Transformer为基础模型,构建扇区语义表征模型,计算扇区序列的语义表征向量;
步骤5,扇区语义表征模型训练:设计基于掩码自监督学习的训练任务,采集历史数据构建训练数据集训练扇区语义表征模型;
步骤6,扇区语义表征计算:使用训练后的扇区语义表征模型对扇区序列进行表征计算,得到扇区序列的语义表征向量;
步骤7,空域关联度计算:计算不同时间及空间位置上的扇区序列的语义表征向量间的相似度,作为扇区间的空域关联度,并基于关联度识别目标空域内的热区。
2.根据权利要求1所述的一种基于空域关联度的热区识别方法,其特征在于,步骤1中所述得到扇区序列的方法包括:
从流量管理系统中提取并分析每架航班的飞行计划,获取航班所经过航路点、航线和航向信息,利用4D轨迹预测并生成不同时间段中的交通流;根据交通流对航路经过的扇区进行排列组合,在空间维度上生成一维扇区序列;在此基础上,引入时间维度,将一维扇区序列扩展为二维序列,定义为
Figure 233608DEST_PATH_IMAGE001
,其中
Figure 213066DEST_PATH_IMAGE002
表示扇区序列,
Figure 805852DEST_PATH_IMAGE003
表示实数,
Figure 263378DEST_PATH_IMAGE004
表示扇区数量,
Figure 281013DEST_PATH_IMAGE005
表示时间间隔数量。
3.根据权利要求2所述的一种基于空域关联度的热区识别方法,其特征在于,步骤2包括:
选择扇区流量和容量作为描述扇区的物理特征;从流量管理系统中获取扇区在未来一段时间内不同时间段上的预测流量值和预测容量值;预测流量值的定义为:设定时间段内进入某一扇区的航班数量;预测容量值的定义为:设定时间段内某一扇区能提供服务的最大航班数量;对预测流量值和预测容量值进行归一化处理,映射到
Figure 415060DEST_PATH_IMAGE006
区间内;在步骤1中定义的扇区序列
Figure 9989DEST_PATH_IMAGE002
的基础上,引入扇区流量和容量特征,将扇区序列重新定义为
Figure 756360DEST_PATH_IMAGE007
4.根据权利要求3所述的一种基于空域关联度的热区识别方法,其特征在于,步骤3中,扇区编码设计的方法包括:
步骤3.1,空间和时间位置编码包含两个维度,公式如下:
Figure 18714DEST_PATH_IMAGE008
(1)
Figure 589241DEST_PATH_IMAGE009
(2)
Figure 812412DEST_PATH_IMAGE010
(3)
Figure 877320DEST_PATH_IMAGE011
(4)
式中,
Figure 479334DEST_PATH_IMAGE012
表示扇区的时空位置编码,
Figure 378020DEST_PATH_IMAGE013
Figure 947541DEST_PATH_IMAGE014
是从
Figure 691506DEST_PATH_IMAGE015
区间内的等分数列,
Figure 912141DEST_PATH_IMAGE013
表示空间维度的位置,同理
Figure 575204DEST_PATH_IMAGE014
表示时间维度的位置,
Figure 382754DEST_PATH_IMAGE013
Figure 930410DEST_PATH_IMAGE014
的长度定义为
Figure 756283DEST_PATH_IMAGE016
,即扇区语义表征模型的隐层维度,定义
Figure 996772DEST_PATH_IMAGE017
为一个非负常数;
Figure 258995DEST_PATH_IMAGE018
表示空间尺寸,
Figure 469396DEST_PATH_IMAGE019
表示时间尺寸,则时空位置编码满足
Figure 900509DEST_PATH_IMAGE020
步骤3.2,扇区标识编码用于辨别扇区;根据扇区数量对区间
Figure 311898DEST_PATH_IMAGE006
等比划分,用于表示不同的扇区,再将扇区序列中的标识编码扩展至
Figure 77729DEST_PATH_IMAGE021
维度,R表示实数;
步骤3.3,对输入扇区序列
Figure 75510DEST_PATH_IMAGE002
进行表征处理,然后与扇区的时空位置编码以及标识编码相加,得到扇区语义表征模型的输入
Figure 875976DEST_PATH_IMAGE022
Figure 458267DEST_PATH_IMAGE023
(5)
式中,
Figure 462126DEST_PATH_IMAGE024
为输入扇区序列
Figure 14330DEST_PATH_IMAGE002
的表征结果,
Figure 279089DEST_PATH_IMAGE012
表示扇区的时空位置编码,
Figure 406183DEST_PATH_IMAGE025
表示步骤3.2中所述的扇区标识编码。
5.根据权利要求4所述的一种基于空域关联度的热区识别方法,其特征在于,步骤4中所述扇区语义表征模型,包括:嵌入层、多头注意力层和前向传递网络层;
其中,嵌入层是线性神经网络,对输入扇区序列
Figure 146606DEST_PATH_IMAGE026
进行映射计算,转化为
Figure 377867DEST_PATH_IMAGE021
维度的数据,其数学表示为:
Figure 903657DEST_PATH_IMAGE027
(6)
其中,
Figure 421226DEST_PATH_IMAGE028
定义为权重矩阵,参数
Figure 524312DEST_PATH_IMAGE029
定义为偏置参数,输出
Figure 425444DEST_PATH_IMAGE030
Figure 55009DEST_PATH_IMAGE002
的表征结果,其中
Figure 494211DEST_PATH_IMAGE016
表示扇区语义表征模型的隐层维度;然后将
Figure 943647DEST_PATH_IMAGE024
在时间维度上展平,得到:
Figure 782290DEST_PATH_IMAGE031
多头注意力层包括:线性映射、多头注意力计算、拼接与映射、随机丢弃、层标准化和残差连接,具体包括:首先,对输入
Figure 250050DEST_PATH_IMAGE024
进行线性映射,生成
Figure 375000DEST_PATH_IMAGE032
三个不同得序列,数学公式如下:
Figure 62465DEST_PATH_IMAGE033
(7)
Figure 439219DEST_PATH_IMAGE034
(8)
Figure 43376DEST_PATH_IMAGE035
(9)
式中,
Figure 588496DEST_PATH_IMAGE036
代表Query向量,
Figure 887890DEST_PATH_IMAGE037
代表Key向量,
Figure 192970DEST_PATH_IMAGE038
代表Value向量,
Figure 136786DEST_PATH_IMAGE039
Figure 478906DEST_PATH_IMAGE040
Figure 390230DEST_PATH_IMAGE041
分别为转换矩阵;序列中的每个扇区都受到其它空间和时间位置上扇区特征值的影响,扇区之间的注意力值大小表示相互影响的程度,计算公式如下所示:
Figure 217109DEST_PATH_IMAGE042
(10)
式中,
Figure 530279DEST_PATH_IMAGE043
是缩放因子,
Figure 308879DEST_PATH_IMAGE044
表示扇区序列的注意力值矩阵,矩阵的维度是
Figure 458232DEST_PATH_IMAGE045
Figure 839535DEST_PATH_IMAGE046
函数对注意力值矩阵进行归一化计算,输出结果表示经过扇区影响后所得目标扇区的语义表征向量;
Figure 882577DEST_PATH_IMAGE047
个注意力输出结果拼接和映射后,得到多头注意力值,计算如下所示:
Figure 205980DEST_PATH_IMAGE048
(11)
其中,
Figure 826317DEST_PATH_IMAGE049
表示第
Figure 886677DEST_PATH_IMAGE050
个注意力,且
Figure 659592DEST_PATH_IMAGE051
Figure 904628DEST_PATH_IMAGE052
表示对多个注意力头进行拼接计算,
Figure 153207DEST_PATH_IMAGE053
为转换矩阵,将多头注意力计算后输出
Figure 125580DEST_PATH_IMAGE054
;最后,使用随机丢弃和层归一化对
Figure 267848DEST_PATH_IMAGE055
进行处理后,与输入表征
Figure 559152DEST_PATH_IMAGE024
相加后生成输出
Figure 170394DEST_PATH_IMAGE056
Figure 697190DEST_PATH_IMAGE055
输入前向传递网络FFN层,包括:线性映射、非线性计算和线性映射,计算公式如下所示:
Figure 303752DEST_PATH_IMAGE057
(12)
其中,
Figure 405438DEST_PATH_IMAGE058
Figure 487663DEST_PATH_IMAGE059
是全连接层的转换矩阵,
Figure 427937DEST_PATH_IMAGE060
Figure 29951DEST_PATH_IMAGE061
是偏置参数,
Figure 787691DEST_PATH_IMAGE062
是非线性函数ReLU的计算过程;经过前向传递网络FFN层处理后输出扇区语义表征向量
Figure 340901DEST_PATH_IMAGE063
6.根据权利要求5所述的一种基于空域关联度的热区识别方法,其特征在于,步骤5中所述设计基于掩码自监督学习的训练任务,包括:
设计自监督学习任务,参考BERT的掩码语言模型任务,在Transformer上拼接全连接层,实现线性空间映射,将扇区语义表征模型的输出
Figure 84867DEST_PATH_IMAGE064
Figure 790654DEST_PATH_IMAGE065
映射到
Figure 470029DEST_PATH_IMAGE066
维度;
从流量管理系统中采集历史数据构建训练数据集,以60%的概率对训练数据中的扇区随机遮掩,使用特殊标记MASK替换扇区的原始数值,生成输入数据,保留原始数据作为标签,生成训练数据集。
7.根据权利要求6所述的一种基于空域关联度的热区识别方法,其特征在于,步骤5中所述设计基于掩码自监督学习的训练任务,包括:
在扇区语义表征模型的训练过程中,输入被遮掩的扇区序列数据,经过扇区语义表征模型的预测,得到被遮掩扇区的原始数值,通过计算预测值与标签间的误差,使用反向传播算法训练模型,使扇区语义表征模型学习时空依赖关系。
8.根据权利要求7所述的一种基于空域关联度的热区识别方法,其特征在于,步骤6中所述扇区语义表征计算的方法包括:将扇区序列
Figure 526846DEST_PATH_IMAGE002
输入扇区语义表征模型,经过嵌入层、多层注意力层和FFN层的计算,生成扇区的深层语义表征
Figure 808923DEST_PATH_IMAGE067
,其中
Figure 149643DEST_PATH_IMAGE068
表示第
Figure 983607DEST_PATH_IMAGE069
个位置,第
Figure 403087DEST_PATH_IMAGE070
个时间间隔的扇区深层语义表征。
9.根据权利要求8所述的一种基于空域关联度的热区识别方法,其特征在于,步骤7中所述空域关联度计算的方法包括:
使用扇区语义表征计算扇区间的空域关联度,公式如下所示:
Figure 364221DEST_PATH_IMAGE071
(13)
其中,
Figure 310180DEST_PATH_IMAGE072
表示两个不同扇区间的关联度;
Figure 455991DEST_PATH_IMAGE073
表示在第
Figure 471089DEST_PATH_IMAGE058
个空间位置,第
Figure 219602DEST_PATH_IMAGE074
个时间间隔上扇区的语义表征;
Figure 770801DEST_PATH_IMAGE075
表示在第
Figure 87512DEST_PATH_IMAGE059
个空间位置,第
Figure 340639DEST_PATH_IMAGE076
个时间间隔上扇区的语义表征;然后,选择与其它扇区关联度最高的扇区作为热区。
10.根据权利要求9所述的一种基于空域关联度的热区识别方法,其特征在于,步骤1中所述
Figure 142111DEST_PATH_IMAGE077
和时间间隔数量
Figure 672449DEST_PATH_IMAGE005
的取值满足以下条件:
Figure 550275DEST_PATH_IMAGE078
CN202211116903.7A 2022-09-14 2022-09-14 一种基于空域关联度的热区识别方法 Active CN115222159B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211116903.7A CN115222159B (zh) 2022-09-14 2022-09-14 一种基于空域关联度的热区识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211116903.7A CN115222159B (zh) 2022-09-14 2022-09-14 一种基于空域关联度的热区识别方法

Publications (2)

Publication Number Publication Date
CN115222159A true CN115222159A (zh) 2022-10-21
CN115222159B CN115222159B (zh) 2023-01-31

Family

ID=83617188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211116903.7A Active CN115222159B (zh) 2022-09-14 2022-09-14 一种基于空域关联度的热区识别方法

Country Status (1)

Country Link
CN (1) CN115222159B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915930A (zh) * 2020-07-21 2020-11-10 北京航空航天大学 机载空管增强协处理系统及方法
US20210174262A1 (en) * 2019-12-10 2021-06-10 Beihang University Deep unsupervised learning approach , device and storage medium for airspace complexity evaluation
CN114493034A (zh) * 2022-02-14 2022-05-13 重庆大学 一种面向区域流量预测的时空全局语义表示学习方法
CN114548893A (zh) * 2021-12-28 2022-05-27 北京航空航天大学 一种基于深度强化学习的多机场协同放行方法
CN115049009A (zh) * 2022-06-21 2022-09-13 长三角信息智能创新研究院 基于语义融合表征的轨迹预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210174262A1 (en) * 2019-12-10 2021-06-10 Beihang University Deep unsupervised learning approach , device and storage medium for airspace complexity evaluation
CN111915930A (zh) * 2020-07-21 2020-11-10 北京航空航天大学 机载空管增强协处理系统及方法
CN114548893A (zh) * 2021-12-28 2022-05-27 北京航空航天大学 一种基于深度强化学习的多机场协同放行方法
CN114493034A (zh) * 2022-02-14 2022-05-13 重庆大学 一种面向区域流量预测的时空全局语义表示学习方法
CN115049009A (zh) * 2022-06-21 2022-09-13 长三角信息智能创新研究院 基于语义融合表征的轨迹预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
庄宁: "面向视觉行为理解的时空多粒度特征分析算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Also Published As

Publication number Publication date
CN115222159B (zh) 2023-01-31

Similar Documents

Publication Publication Date Title
CN103679611B (zh) 基于案例推理的城市综合应急智能仿真系统的运行方法
Qu et al. Flight delay prediction using deep convolutional neural network based on fusion of meteorological data
Yu et al. A special event-based K-nearest neighbor model for short-term traffic state prediction
Yan et al. Spatial-temporal chebyshev graph neural network for traffic flow prediction in iot-based its
Feng et al. Design and simulation of human resource allocation model based on double-cycle neural network
Jarry et al. On the use of generative adversarial networks for aircraft trajectory generation and atypical approach detection
Yu et al. Passenger flow prediction for new line using region dividing and fuzzy boundary processing
Shen et al. An attention-based digraph convolution network enabled framework for congestion recognition in three-dimensional road networks
Basturk et al. Prediction of aircraft estimated time of arrival using machine learning methods
CN103605493B (zh) 基于图形处理单元的并行排序学习方法及系统
CN115222159B (zh) 一种基于空域关联度的热区识别方法
Su et al. Short-time traffic state forecasting using adaptive neighborhood selection based on expansion strategy
Yao et al. Power function-based signal recovery transition optimization model of emergency traffic
CN107124761A (zh) 融合pso和ss‑elm的蜂窝网无线定位方法
Yu et al. Sports event model evaluation and prediction method using principal component analysis
CN116543603A (zh) 一种考虑空域态势和局部优化的航迹补全预测方法及装置
Wang et al. Dynamic traffic prediction based on traffic flow mining
Wei Discretized and continuous target fields for the reservoir release rules during floods
Song et al. Spatial-temporal transformer network for multi-year ENSO prediction
Zhang The application of PSO-SVM algorithm in the evaluation system of sports competition events
Shan et al. Predicting duration of traffic accidents based on ensemble learning
CN115600744A (zh) 一种基于手机数据的共享时空注意力卷积网络人口数量预测方法
CN114529063A (zh) 一种基于机器学习的金融领域数据预测方法、设备及介质
Song et al. TINet: multi-dimensional traffic data imputation via transformer network
Gu et al. Study on Discrete Dynamic Modeling of College Students' Innovative Employment Security Mechanism under the Environment of Internet of Things

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant