CN115222159B - 一种基于空域关联度的热区识别方法 - Google Patents

一种基于空域关联度的热区识别方法 Download PDF

Info

Publication number
CN115222159B
CN115222159B CN202211116903.7A CN202211116903A CN115222159B CN 115222159 B CN115222159 B CN 115222159B CN 202211116903 A CN202211116903 A CN 202211116903A CN 115222159 B CN115222159 B CN 115222159B
Authority
CN
China
Prior art keywords
sector
sectors
semantic representation
sequence
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211116903.7A
Other languages
English (en)
Other versions
CN115222159A (zh
Inventor
毛永庆
王煊
黄吉波
丁一波
丁辉
田靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 28 Research Institute
Original Assignee
CETC 28 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 28 Research Institute filed Critical CETC 28 Research Institute
Priority to CN202211116903.7A priority Critical patent/CN115222159B/zh
Publication of CN115222159A publication Critical patent/CN115222159A/zh
Application granted granted Critical
Publication of CN115222159B publication Critical patent/CN115222159B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于空域关联度的热区识别方法,其目的为:构建基于Transformer的扇区语义表征模型,利用交通流特性对扇区序列化表征,建立涵盖扇区流量和容量特征的数据结构,设计扇区的时空位置编码和标识编码。然后,设计掩码自监督学习任务训练模型,挖掘不同扇区之间的时空依赖关系,生成扇区语义表征向量。最后计算扇区语义表征向量间的相似度作为空域关联度,选择与其它扇区关联度最高的扇区作为热区进行识别和调控,为精细化流量控制策略的制定提供态势支撑。

Description

一种基于空域关联度的热区识别方法
技术领域
本发明涉及空中交通流量管理方法,特别是一种基于空域关联度的热区识别方法。
背景技术
随着我国国民经济持续、稳步、快速地发展,军民航飞行活动逐年保持强劲的增长势头。我国民航的空中交通活动主要集中在东部经济发达地区,部分民航空域已经趋于饱和;同时军航穿越民航航路的飞行也在不断增加,导致部分地区的训练空域资源紧张,空域内飞行矛盾越来越大,军民航协调工作日益繁重。为解决空中交通拥挤问题,近几年相关部门对航路走向、管制方法等作了多次调整,但飞行流量的快速增长仍使部分区域内的总流量很快达到饱和甚至超负荷。为确保高峰时期飞行安全,目前各地区大多采用流量控制方式,即限制本地区飞机起飞和外管制区的飞机进入。流量控制由于缺乏广泛的协调、信息和技术支持,完全依赖管制员个人的工作经验,具有较大的随机性和不确定性,其不仅严重威胁了飞行安全,也容易导致空中交通拥塞的恶性循环和航班的大面积延误,给国民经济造成巨大的经济损失。
当前空中交通流量管理分战略、预战术和战术三个阶段。战术流量管理阶段主要通过预测空域容量和流量,优化航班时刻表、调整航空器的起飞时间、飞行航线等实现流量管理。由于当前的流量管理方案需要对目标空域内的不同扇区的流量和容量分别计算,且由于不同扇区间的关系无法确定,导致管制员需要根据每个扇区的容流比分别制定独立的流量控制策略,而非针对关键扇区制定流量控制策略,难以实现精细化调控。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于空域关联度的热区识别方法。
为了解决上述技术问题,本发明公开了一种基于空域关联度的热区识别方法。
本发明引入空域关联度的概念,构建并训练扇区语义表征模型,挖掘扇区之间的时空依赖关系,计算一个扇区序列中的不同扇区在不同时间段上语义表征之间的相似度,生成空域关联度。然后,基于空域关联度识别关键扇区作为热区,并针对热区提供流量控制策略,为精细化流量控制策略的制定提供依据。
一种基于空域关联度的热区识别方法,包括以下步骤:
步骤1,扇区数据序列化表征:将目标空域内的扇区按照二维序列结构进行表征,得到扇区序列;
步骤2,扇区序列特征处理:计算扇区序列中的流量和容量特征值;
步骤3,扇区编码设计:设计扇区序列中所有扇区的时空位置编码,以及扇区标识编码;
步骤4,扇区语义表征模型构建:以Transformer为基础模型,构建扇区语义表征模型,计算扇区序列的语义表征向量;
步骤5,扇区语义表征模型训练:设计基于掩码自监督学习的训练任务,采集历史数据构建训练数据集训练扇区语义表征模型;
步骤6,扇区语义表征计算:使用训练后的扇区语义表征模型对扇区序列进行表征处理,生成扇区的语义表征向量;
步骤7,空域关联度计算:计算不同时间及空间位置的扇区的语义表征向量间的相似度,作为扇区间的空域关联度,并基于关联度识别目标空域内的热区。
步骤1中所述得到扇区序列的方法包括:
从流量管理系统中提取并分析每架航班的飞行计划,获取航班所经过航路点、航线和航向信息,利用4D轨迹预测并生成不同时间段中的交通流;根据交通流对航路经过的扇区进行排列组合,在空间维度上生成一维扇区序列;在此基础上引入时间维度,将一维扇区序列扩展为二维序列,定义为
Figure 532901DEST_PATH_IMAGE001
,其中
Figure 623217DEST_PATH_IMAGE002
表示扇区序列,
Figure 617849DEST_PATH_IMAGE003
表示实数,
Figure 666576DEST_PATH_IMAGE004
表示扇区数量,
Figure 769661DEST_PATH_IMAGE005
表示时间间隔数量。
步骤2包括:
选择扇区流量和容量作为描述扇区的物理特征;从流量管理系统中获取扇区在未来一段时间内不同时间段上的预测流量值和预测容量值;预测流量值的定义为:设定时间段内进入扇区的航班数量,取值为
Figure 912936DEST_PATH_IMAGE006
之间的整数;预测容量值的定义为:设定时间段内扇区能提供服务的最大航班数量,取值为
Figure 542500DEST_PATH_IMAGE006
之间的整数;由于不同时间段中扇区预测流量和预测容量的数值分布较广泛,会影响神经网络模型训练的收敛性,需要对预测流量值和预测容量值进行归一化处理,映射到
Figure 371916DEST_PATH_IMAGE007
区间,计算过程如下所示:
Figure 837663DEST_PATH_IMAGE008
Figure 535361DEST_PATH_IMAGE009
表示预测流量或预测容量值;在步骤1中定义的扇区序列
Figure 160377DEST_PATH_IMAGE002
的基础上,引入扇区流量和容量特征,将扇区序列重新定义为三维张量
Figure 534596DEST_PATH_IMAGE010
步骤3中,在扇区序列之中,同一扇区在不同空间和时间上的流量值和容量值是时变的,很难通过固定的流量/容量值判断属于哪一个扇区,以及扇区所在的时空位置。为了解决以上问题,设计扇区编码,包括时空位置编码和扇区标识编码。扇区编码的设计方法包括:
步骤3.1,针对输入数据特征具有的时间和空间两个维度的特点,所设计的扇区时空位置编码包含两个维度,时空位置编码的公式如下所示:
Figure 471328DEST_PATH_IMAGE011
(1)
Figure 113662DEST_PATH_IMAGE012
(2)
Figure 202972DEST_PATH_IMAGE013
(3)
Figure 498824DEST_PATH_IMAGE014
(4)
式中,
Figure 63797DEST_PATH_IMAGE015
表示扇区的时空位置编码,
Figure 86986DEST_PATH_IMAGE016
Figure 545649DEST_PATH_IMAGE017
是从
Figure 887769DEST_PATH_IMAGE018
区间内的等分数列,
Figure 284246DEST_PATH_IMAGE016
表示空间维度的位置,同理
Figure 861858DEST_PATH_IMAGE017
表示时间维度的位置,
Figure 424295DEST_PATH_IMAGE016
Figure 61950DEST_PATH_IMAGE017
的长度定义为
Figure 335936DEST_PATH_IMAGE019
,即扇区语义表征模型的隐层维度,
Figure 467972DEST_PATH_IMAGE020
定义为一个非负常数;
Figure 901227DEST_PATH_IMAGE021
表示空间尺寸,
Figure 585149DEST_PATH_IMAGE022
表示时间尺寸,则时空位置编码
Figure 454754DEST_PATH_IMAGE015
满足
Figure 905327DEST_PATH_IMAGE023
步骤3.2,扇区标识编码用于辨别扇区;根据扇区数量对区间
Figure 802876DEST_PATH_IMAGE007
等比划分,用于表示不同的扇区,再将扇区序列中的标识编码扩展至
Figure 533065DEST_PATH_IMAGE024
维度,R表示实数;
步骤3.3,对输入序列
Figure 906278DEST_PATH_IMAGE002
进行表征处理,然后与扇区的时空位置编码以及标识编码相加,得到扇区语义表征模型的输入
Figure 770329DEST_PATH_IMAGE025
Figure 896285DEST_PATH_IMAGE026
(5)
式中,
Figure 312223DEST_PATH_IMAGE027
为输入扇区序列
Figure 657885DEST_PATH_IMAGE002
的表征结果(可以通过模型中的嵌入层生成),
Figure 794468DEST_PATH_IMAGE015
表示扇区的时空位置编码,
Figure 791243DEST_PATH_IMAGE028
表示步骤3.2中所述的扇区标识编码。
步骤4中所述扇区语义表征模型,包括:嵌入层、多头注意力层和前向传递网络(Feed-Forward Networks, FFN)层;
其中,嵌入层是线性神经网络,对输入扇区序列
Figure 627350DEST_PATH_IMAGE029
进行映射计算,转化为
Figure 443996DEST_PATH_IMAGE024
维度的数据,其数学表示为:
Figure 649850DEST_PATH_IMAGE030
(6)
其中,
Figure 251863DEST_PATH_IMAGE031
定义为权重矩阵,参数
Figure 9604DEST_PATH_IMAGE032
定义为偏置参数,输出
Figure 454492DEST_PATH_IMAGE033
Figure 572358DEST_PATH_IMAGE002
的表征结果,其中
Figure 543725DEST_PATH_IMAGE019
表示模型的隐层维度;然后将
Figure 347733DEST_PATH_IMAGE027
在时间维度上展平,得到:
Figure 889704DEST_PATH_IMAGE034
多头注意力层包括:线性映射、多头注意力计算、拼接与映射、随机丢弃、层标准化和残差连接,具体包括:首先,对输入
Figure 827573DEST_PATH_IMAGE027
进行线性映射,生成
Figure 528813DEST_PATH_IMAGE035
三个不同得序列,数学公式如下:
Figure 612044DEST_PATH_IMAGE036
(7)
Figure 421737DEST_PATH_IMAGE037
(8)
Figure 117292DEST_PATH_IMAGE038
(9)
式中,
Figure 938617DEST_PATH_IMAGE039
代表Query向量,
Figure 943483DEST_PATH_IMAGE040
代表Key向量,
Figure 850259DEST_PATH_IMAGE041
代表Value向量,
Figure 113619DEST_PATH_IMAGE042
Figure 648505DEST_PATH_IMAGE043
Figure 230796DEST_PATH_IMAGE044
分别为转换矩阵;序列中的每个扇区都受到其它空间和时间位置上扇区特征值的影响,扇区之间的注意力值大小表示相互影响的程度,计算公式如下所示:
Figure 234655DEST_PATH_IMAGE045
(10)
式中,
Figure 52439DEST_PATH_IMAGE046
是缩放因子,
Figure 582777DEST_PATH_IMAGE047
表示扇区序列的注意力值矩阵,矩阵的维度是
Figure 444292DEST_PATH_IMAGE048
Figure 184715DEST_PATH_IMAGE049
函数对注意力值矩阵进行归一化计算,输出结果表示经过扇区影响后所得目标扇区的语义表征向量;
Figure 415976DEST_PATH_IMAGE050
个注意力输出结果拼接和映射后,得到多头注意力值,计算如下所示:
Figure 676187DEST_PATH_IMAGE051
(11)
其中,
Figure 459335DEST_PATH_IMAGE052
表示第
Figure 828000DEST_PATH_IMAGE053
个注意力,且
Figure 971274DEST_PATH_IMAGE054
Figure 600838DEST_PATH_IMAGE055
表示对多个注意力头进行拼接计算,
Figure 430254DEST_PATH_IMAGE056
为转换矩阵,将多头注意力计算后输出
Figure 630422DEST_PATH_IMAGE057
;最后,使用随机丢弃和层归一化对
Figure 328120DEST_PATH_IMAGE058
进行处理后,与输入表征
Figure 61459DEST_PATH_IMAGE027
相加后生成输出
Figure 61776DEST_PATH_IMAGE059
Figure 264087DEST_PATH_IMAGE058
输入前向传递网络FFN层,包括:线性映射、非线性计算和线性映射,计算公式如下所示:
Figure 250628DEST_PATH_IMAGE060
(12)
其中,
Figure 464572DEST_PATH_IMAGE061
Figure 26003DEST_PATH_IMAGE062
是全连接层的转换矩阵,
Figure 699299DEST_PATH_IMAGE063
Figure 614166DEST_PATH_IMAGE064
是偏置参数,
Figure 72829DEST_PATH_IMAGE065
是非线性函数ReLU的计算过程;经过前向传递网络FFN层处理后输出扇区语义表征向量
Figure 555894DEST_PATH_IMAGE066
步骤5中所述设计基于掩码自监督学习的训练任务,包括:
设计自监督学习任务,参考BERT(参考:Devlin J, Chang M W, Lee K,Toutanova K. BERT: Pre-training of Deep Bidirectional Transformers forLanguage Understanding[C]. Proceedings of the North American Chapter of theAssociation for Computational Linguistics: Human Language Technologies, 2019:4171–4186.)的掩码语言模型(Masked Language Model, MLM)任务,在Transformer上拼接全连接层,实现线性空间映射,将扇区语义表征模型的输出
Figure 77005DEST_PATH_IMAGE067
Figure 654617DEST_PATH_IMAGE068
映射到
Figure 482633DEST_PATH_IMAGE069
维度;
从流量管理系统中采集历史数据构建训练数据集,以60%的概率对训练数据中的扇区随机遮掩,使用特殊标记MASK替换扇区的原始数值,生成输入数据,保留原始数据作为标签,生成训练数据集。
步骤5中所述设计基于掩码自监督学习的训练任务,包括:
在扇区语义表征模型的训练过程中,输入被遮掩的扇区序列数据,经过扇区语义表征模型的预测,得到被遮掩扇区的原始数值,通过计算预测值与标签间的误差,使用反向传播算法训练模型,使扇区语义表征模型学习时空依赖关系。
步骤6中所述扇区语义表征计算的方法包括:将扇区序列
Figure 120288DEST_PATH_IMAGE002
输入扇区语义表征模型,经过嵌入层、多层注意力层和FFN层的计算,生成扇区的深层语义表征
Figure 128695DEST_PATH_IMAGE070
,其中
Figure 526310DEST_PATH_IMAGE071
表示第
Figure 693986DEST_PATH_IMAGE072
个位置,第
Figure 377908DEST_PATH_IMAGE073
个时间间隔的扇区语义表征向量。
步骤7中所述空域关联度计算的方法包括:
使用扇区语义表征计算扇区间的空域关联度,公式如下所示:
Figure 536530DEST_PATH_IMAGE074
(13)
其中,
Figure 455944DEST_PATH_IMAGE075
表示两个不同扇区间的关联度;
Figure 494438DEST_PATH_IMAGE076
表示在第
Figure 614841DEST_PATH_IMAGE061
个空间位置,第
Figure 722474DEST_PATH_IMAGE077
个时间间隔上扇区的语义表征向量;
Figure 694847DEST_PATH_IMAGE078
表示在第
Figure 712482DEST_PATH_IMAGE062
个空间位置,第
Figure 128420DEST_PATH_IMAGE079
个时间间隔上扇区的语义表征向量。然后,选择与其它扇区关联度最高的扇区作为热区。
考虑语义表征模型的计算成本,步骤1中所述
Figure 474082DEST_PATH_IMAGE080
和时间间隔数量
Figure 141823DEST_PATH_IMAGE005
的取值满足以下条件:
Figure 138598DEST_PATH_IMAGE081
有益效果:
本发明所提出的方法可以从历史流量数据中学习一个扇区序列中不同扇区间的时空相关性,计算扇区语义表征和空域关联度。基于空域关联度可以识别关键的热点扇区,并对其进行精细化流量控制,辅助管制员提出高效实时的决策建议,减少航班的大面积延误,降低国民经济损失。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1为本发明总体流程图。
图2为基于Transformer的扇区语义表征模型结构图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
本发明的实现过程和步骤如下,其总体流程,如图1所示。
步骤1:扇区数据序列化表征。从流量管理系统中提取并分析每一架航班的飞行计划,获取航班所经过的航路点、航线和航向信息,利用4D轨迹预测并生成不同时间段中的交通流。根据交通流将
Figure 600803DEST_PATH_IMAGE004
个扇区以序列化的形式进行表征,同时将需要观测的目标时间段进行间隔化切片,以半小时为一个时间间隔,共计
Figure 932297DEST_PATH_IMAGE005
个时间间隔,形成
Figure 262784DEST_PATH_IMAGE082
的二维矩阵形式表示扇区序列。
步骤2:扇区序列特征处理。从流量管理系统中获取扇区在未来一段时间内不同时间段上的预测流量值和预测容量值,预测流量值定义为当前时间间隔内进入扇区的航班数量,取值为
Figure 864798DEST_PATH_IMAGE006
之间的整数;预测容量值定义为当前时间间隔内该扇区可提供的最大航班数量,取值为
Figure 232325DEST_PATH_IMAGE006
之间的整数。对预测流量值和预测容量值进行归一化处理,将数值映射到
Figure 67426DEST_PATH_IMAGE007
区间内,计算过程如下:
Figure 185292DEST_PATH_IMAGE008
Figure 766446DEST_PATH_IMAGE009
表示预测流量或预测容量值。
步骤3:扇区编码设计。扇区编码包括时空位置编码和标识编码。其中,时空位置编码采用公式(1) ~ (4)进行设计,得到
Figure 960667DEST_PATH_IMAGE023
的时空位置编码,同时参考步骤3.2设计扇区标识编码
Figure 502638DEST_PATH_IMAGE083
步骤4:扇区语义表征模型构建,如图2所示,模型包括嵌入层、多头注意力层和前向传递网络(Feed-Forward Networks, FFN)层,以及归一化处理。其中嵌入层对输入扇区序列
Figure 50294DEST_PATH_IMAGE002
进行表征处理,得到
Figure 610588DEST_PATH_IMAGE027
,参考公式(6),再和扇区的时空位置编码
Figure 959399DEST_PATH_IMAGE015
、标识编码
Figure 237934DEST_PATH_IMAGE028
相加,生成多头注意力层的输入
Figure 589281DEST_PATH_IMAGE027
,参考公式(5),然后将
Figure 285972DEST_PATH_IMAGE027
在时间维度上展平,转化成
Figure 431783DEST_PATH_IMAGE034
输入多头注意力层。多头注意力层中的具体过程参考公式(7) ~ (11),然后输出
Figure 197614DEST_PATH_IMAGE058
,经过归一化处理后,与输入
Figure 726553DEST_PATH_IMAGE027
相加,得到多头注意力层的输出。然后输入FFN层,使用公式(12)进行计算,再对FFN层的计算结果进行归一化处理,得到扇区的深层语义表征向量
Figure 136805DEST_PATH_IMAGE067
步骤5:扇区语义表征模型训练。从流量管理系统中采集历史数据,以60%的概率对输入序列进行随机遮掩,即使用特殊标志
Figure 578151DEST_PATH_IMAGE084
替换原始数值,生成训练样本。保留原始数据作为标签,生成训练数据集,计算正确数据与输出数据间的误差,并进行反向传播,实现模型自监督训练。
步骤6:扇区语义表征计算。使用扇区语义表征模型计算输入扇区序列的语义表征向量。
步骤7:空域关联度计算。根据公式(13)计算不同的时空位置上的扇区语义表征向量之间的相似度,作为扇区间的关联度,然后选择与其它扇区关联度最高的扇区作为热区。
实施例
首先给出航班飞行计划的例子:
航路点和航线:PIKAS, G330, PIMOL, A593, BTO, W82, DOGAR。
解释:在上述例子中,PIKAS、PIMOL、BTO和DOGAR表示航路点,G330、A593和W82表示两个航路点之间的航段,该飞行计划的航向是从PIKAS飞往DOGAR。使用4D轨迹预测可以算出一架航班在每个航路点上的过点时间。
步骤1:根据航路点和航线信息可以获得航路点所在扇区位置,根据4D轨迹预测航班进入到扇区的时间。其中,该航线经过的扇区序列长度为
Figure 582010DEST_PATH_IMAGE085
,以航路点之间的过点时间间隔进行时间段切片,则定义
Figure 134214DEST_PATH_IMAGE086
,输入的序列为
Figure 664553DEST_PATH_IMAGE087
,满足
Figure 260488DEST_PATH_IMAGE088
的限制条件。
步骤2:针对不同的扇区和时间间隔计算扇区的流量和容量特征,需要根据流量管理系统中的数据统计分析获得。例如:PIMOL航路点所在扇区进入航班60架,则其流量为60架;而该扇区可以提供的最大航班数量为70架。经过归一化后,该扇区的表征为
Figure 911DEST_PATH_IMAGE089
,即得到特征为
Figure 107538DEST_PATH_IMAGE090
,则输入序列为
Figure 757963DEST_PATH_IMAGE091
步骤3:设隐藏维度为
Figure 541111DEST_PATH_IMAGE092
,采用公式(2)~(5)设计时空位置编码,得到
Figure 752518DEST_PATH_IMAGE093
,设计扇区编码,以数字依次表示扇区。设北京所在扇区的编码是
Figure 521891DEST_PATH_IMAGE094
,则
Figure 417035DEST_PATH_IMAGE095
步骤4:构建扇区语义表征模型,该模型基于Transformer构建,包括嵌入层、多头注意力层和前向传递网络层。
步骤5:从流量管理系统中采集历史数据并构建训练数据集,设计掩码自监督学习任务训练模型。
步骤6:将输入扇区序列
Figure 121817DEST_PATH_IMAGE096
进行映射后,生成嵌入序列
Figure 305673DEST_PATH_IMAGE097
,再与时空位置编码和标识编码相加,得到特征向量输入多头注意力层,经过计算后生成输出向量,经过拼接,FFN层映射得到最终的扇区语义表征向量
Figure 144316DEST_PATH_IMAGE098
步骤7:计算不同空间和时间位置上的扇区语义表征间的相似度,假设扇区语义表征为
Figure 877655DEST_PATH_IMAGE099
,则相似度值为一个
Figure 2606DEST_PATH_IMAGE100
之间的概率,数值大小表示所选的两个扇区间的关联度,相似度值越高,表明两个扇区间的关联度越大。
构建扇区语义表征模型并使用历史数据进行训练,然后使用该模型对实施例中的扇区计算语义表征,得到
Figure 424491DEST_PATH_IMAGE101
四个扇区的语义表征,然后计算空域关联度。假如
Figure 801246DEST_PATH_IMAGE102
与其它三个扇区的关联度都最高,则选择
Figure 139823DEST_PATH_IMAGE102
作为扇区序列中的热区进行调控。
具体实现中,本申请提供计算机存储介质以及对应的数据处理单元,其中,该计算机存储介质能够存储计算机程序,所述计算机程序通过数据处理单元执行时可运行本发明提供的一种基于空域关联度的热区识别方法的发明内容以及各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(Random Access Memory, RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术方案可借助计算机程序以及其对应的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机程序即软件产品的形式体现出来,该计算机程序软件产品可以存储在存储介质中,包括若干指令用以使得一台包含数据处理单元的设备(可以是个人计算机,服务器,单片机或网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本发明提供了一种基于空域关联度的热区识别方法的思路及方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (8)

1.一种基于空域关联度的热区识别方法,其特征在于,包括以下步骤:
步骤1,扇区数据序列化表征:将目标空域内的扇区按照二维序列结构进行表征,得到扇区序列;
步骤2,扇区序列特征处理:计算扇区序列中的流量和容量特征值;
步骤3,扇区编码设计:设计扇区序列中所有扇区的时空位置编码,以及扇区标识编码;
步骤4,扇区语义表征模型构建:以Transformer为基础模型,构建扇区语义表征模型,计算扇区序列的语义表征向量;
步骤5,扇区语义表征模型训练:设计基于掩码自监督学习的训练任务,采集历史数据构建训练数据集训练扇区语义表征模型;
步骤6,扇区语义表征计算:使用训练后的扇区语义表征模型对扇区序列进行表征计算,得到 扇区序列的语义表征向量;
步骤7,空域关联度计算:计算不同时间及空间位置上的扇区序列的语义表征向量间的相似度,作为扇区间的空域关联度,并基于关联度识别目标空域内的热区;
步骤1中所述得到扇区序列的方法包括:
从流量管理系统中提取并分析每架航班的飞行计划,获取航班所经过航路点、航线和航向信息,利用4D轨迹预测并生成不同时间段中的交通流;根据交通流对航路经过的扇区进行排列组合,在空间维度上生成一维扇区序列;在此基础上,引入时间维度,将一维扇区序列扩展为二维序列,定义为
Figure 691304DEST_PATH_IMAGE001
,其中
Figure 904111DEST_PATH_IMAGE002
表示扇区序列,表示实数,
Figure 409566DEST_PATH_IMAGE003
表示扇区数量,
Figure 462842DEST_PATH_IMAGE004
表示时间间隔数量;
步骤6中所述扇区语义表征计算的方法包括:将扇区序列
Figure 863867DEST_PATH_IMAGE002
输入扇区语义表征模型,经过嵌入层、多层注意力层和FFN层的计算,生成扇区的深层语义表征
Figure 129632DEST_PATH_IMAGE005
,其中
Figure 221085DEST_PATH_IMAGE006
表示第
Figure 664836DEST_PATH_IMAGE007
个位置,第
Figure 861812DEST_PATH_IMAGE008
个时间间隔的扇区深层语义表征。
2.根据权利要求1所述的一种基于空域关联度的热区识别方法,其特征在于,步骤2包括:
选择扇区流量和容量作为描述扇区的物理特征;从流量管理系统中获取扇区在未来一段时间内不同时间段上的预测流量值和预测容量值;预测流量值的定义为:设定时间段内进入某一扇区的航班数量;预测容量值的定义为:设定时间段内某一扇区能提供服务的最大航班数量;对预测流量值和预测容量值进行归一化处理,映射到
Figure 682001DEST_PATH_IMAGE009
区间内;在步骤1中定义的扇区序列
Figure 221435DEST_PATH_IMAGE002
的基础上,引入扇区流量和容量特征,将扇区序列重新定义为
Figure 836087DEST_PATH_IMAGE010
3.根据权利要求2所述的一种基于空域关联度的热区识别方法,其特征在于,步骤3中,扇区编码设计的方法包括:
步骤3.1,空间和时间位置编码包含两个维度,公式如下:
Figure 133076DEST_PATH_IMAGE011
(1)
Figure 740644DEST_PATH_IMAGE012
(2)
Figure 150897DEST_PATH_IMAGE013
(3)
Figure 923068DEST_PATH_IMAGE014
(4)
式中,
Figure 785982DEST_PATH_IMAGE015
表示扇区的时空位置编码,
Figure 197241DEST_PATH_IMAGE016
Figure 258738DEST_PATH_IMAGE017
是从
Figure 730039DEST_PATH_IMAGE018
区间内的等分数列,
Figure 80249DEST_PATH_IMAGE016
表示空间维度的位置,同理
Figure 29619DEST_PATH_IMAGE017
表示时间维度的位置,
Figure 352148DEST_PATH_IMAGE016
Figure 991421DEST_PATH_IMAGE017
的长度定义为
Figure 828927DEST_PATH_IMAGE019
,即扇区语义表征模型的隐层维度,定义
Figure 581988DEST_PATH_IMAGE020
为一个非负常数;
Figure 352498DEST_PATH_IMAGE021
表示空间尺寸,
Figure 368864DEST_PATH_IMAGE022
表示时间尺寸,则时空位置编码满足
Figure 490404DEST_PATH_IMAGE023
步骤3.2,扇区标识编码用于辨别扇区;根据扇区数量对区间
Figure 781577DEST_PATH_IMAGE009
等比划分,用于表示不同的扇区,再将扇区序列中的标识编码扩展至
Figure 78697DEST_PATH_IMAGE024
维度,R表示实数;
步骤3.3,对输入扇区序列
Figure 65632DEST_PATH_IMAGE002
进行表征处理,然后与扇区的时空位置编码以及标识编码相加,得到扇区语义表征模型的输入
Figure 408889DEST_PATH_IMAGE025
Figure 503753DEST_PATH_IMAGE026
(5)
式中,
Figure 452117DEST_PATH_IMAGE027
为输入扇区序列
Figure 279128DEST_PATH_IMAGE002
的表征结果,
Figure 562210DEST_PATH_IMAGE015
表示扇区的时空位置编码,
Figure 945918DEST_PATH_IMAGE028
表示步骤3.2中所述的扇区标识编码。
4.根据权利要求3所述的一种基于空域关联度的热区识别方法,其特征在于,步骤4中所述扇区语义表征模型,包括:嵌入层、多头注意力层和前向传递网络层;
其中,嵌入层是线性神经网络,对输入扇区序列
Figure 791865DEST_PATH_IMAGE029
进行映射计算,转化为
Figure 868405DEST_PATH_IMAGE024
维度的数据,其数学表示为:
Figure 638784DEST_PATH_IMAGE030
(6)
其中,
Figure 560604DEST_PATH_IMAGE031
定义为权重矩阵,参数
Figure 404932DEST_PATH_IMAGE032
定义为偏置参数,输出
Figure 901641DEST_PATH_IMAGE033
Figure 910048DEST_PATH_IMAGE002
的表征结果,其中
Figure 887756DEST_PATH_IMAGE019
表示扇区语义表征模型的隐层维度;然后将
Figure 665219DEST_PATH_IMAGE027
在时间维度上展平,得到:
Figure 598409DEST_PATH_IMAGE034
多头注意力层包括:线性映射、多头注意力计算、拼接与映射、随机丢弃、层标准化和残差连接,具体包括:首先,对输入
Figure 562954DEST_PATH_IMAGE027
进行线性映射,生成
Figure 607002DEST_PATH_IMAGE035
三个不同得序列,数学公式如下:
Figure 238972DEST_PATH_IMAGE036
(7)
Figure 77484DEST_PATH_IMAGE037
(8)
Figure 60483DEST_PATH_IMAGE038
(9)
式中,
Figure 663151DEST_PATH_IMAGE039
代表Query向量,
Figure 946365DEST_PATH_IMAGE040
代表Key向量,
Figure 955778DEST_PATH_IMAGE041
代表Value向量,
Figure 160494DEST_PATH_IMAGE042
Figure 952870DEST_PATH_IMAGE043
Figure 808699DEST_PATH_IMAGE044
分别为转换矩阵;序列中的每个扇区都受到其它空间和时间位置上扇区特征值的影响,扇区之间的注意力值大小表示相互影响的程度,计算公式如下所示:
Figure 5325DEST_PATH_IMAGE045
(10)
式中,
Figure 418377DEST_PATH_IMAGE046
是缩放因子,
Figure 358651DEST_PATH_IMAGE047
表示扇区序列的注意力值矩阵,矩阵的维度是
Figure 334566DEST_PATH_IMAGE048
Figure 170935DEST_PATH_IMAGE049
函数对注意力值矩阵进行归一化计算,输出结果表示经过扇区影响后所得目标扇区的语义表征向量;
Figure 599511DEST_PATH_IMAGE050
个注意力输出结果拼接和映射后,得到多头注意力值,计算如下所示:
Figure 77897DEST_PATH_IMAGE051
(11)
其中,
Figure 642739DEST_PATH_IMAGE052
表示第
Figure 446747DEST_PATH_IMAGE053
个注意力,且
Figure 828532DEST_PATH_IMAGE054
Figure 110608DEST_PATH_IMAGE055
表示对多个注意力头进行拼接计算,
Figure 795536DEST_PATH_IMAGE056
为转换矩阵,将多头注意力计算后输出
Figure 770446DEST_PATH_IMAGE057
;最后,使用随机丢弃和层归一化对
Figure 173614DEST_PATH_IMAGE058
进行处理后,与输入表征
Figure 915174DEST_PATH_IMAGE027
相加后生成输出
Figure 205341DEST_PATH_IMAGE059
Figure 806611DEST_PATH_IMAGE058
输入前向传递网络FFN层,包括:线性映射、非线性计算和线性映射,计算公式如下所示:
Figure 182229DEST_PATH_IMAGE060
(12)
其中,
Figure 320955DEST_PATH_IMAGE061
Figure 200049DEST_PATH_IMAGE062
是全连接层的转换矩阵,
Figure 766029DEST_PATH_IMAGE063
Figure 363363DEST_PATH_IMAGE064
是偏置参数,
Figure 774622DEST_PATH_IMAGE065
是非线性函数ReLU的计算过程;经过前向传递网络FFN层处理后输出扇区语义表征向量
Figure 836119DEST_PATH_IMAGE066
5.根据权利要求4所述的一种基于空域关联度的热区识别方法,其特征在于,步骤5中所述设计基于掩码自监督学习的训练任务,包括:
设计自监督学习任务,参考BERT的掩码语言模型任务,在Transformer上拼接全连接层,实现线性空间映射,将扇区语义表征模型的输出
Figure 38911DEST_PATH_IMAGE067
Figure 44914DEST_PATH_IMAGE068
映射到
Figure 10596DEST_PATH_IMAGE069
维度;
从流量管理系统中采集历史数据构建训练数据集,以60%的概率对训练数据中的扇区随机遮掩,使用特殊标记MASK替换扇区的原始数值,生成输入数据,保留原始数据作为标签,生成训练数据集。
6.根据权利要求5所述的一种基于空域关联度的热区识别方法,其特征在于,步骤5中所述设计基于掩码自监督学习的训练任务,包括:
在扇区语义表征模型的训练过程中,输入被遮掩的扇区序列数据,经过扇区语义表征模型的预测,得到被遮掩扇区的原始数值,通过计算预测值与标签间的误差,使用反向传播算法训练模型,使扇区语义表征模型学习时空依赖关系。
7.根据权利要求6所述的一种基于空域关联度的热区识别方法,其特征在于,步骤7中所述空域关联度计算的方法包括:
使用扇区语义表征计算扇区间的空域关联度,公式如下所示:
Figure 379129DEST_PATH_IMAGE070
(13)
其中,
Figure 506485DEST_PATH_IMAGE071
表示两个不同扇区间的关联度;
Figure 389996DEST_PATH_IMAGE072
表示在第
Figure 628211DEST_PATH_IMAGE061
个空间位置,第
Figure 854180DEST_PATH_IMAGE073
个时间间隔上扇区的语义表征;
Figure 418017DEST_PATH_IMAGE074
表示在第
Figure 398611DEST_PATH_IMAGE062
个空间位置,第
Figure 955363DEST_PATH_IMAGE075
个时间间隔上扇区的语义表征;然后,选择与其它扇区关联度最高的扇区作为热区。
8.根据权利要求7所述的一种基于空域关联度的热区识别方法,其特征在于,步骤1中所述
Figure 49221DEST_PATH_IMAGE076
和时间间隔数量
Figure 767647DEST_PATH_IMAGE004
的取值满足以下条件:
Figure 110904DEST_PATH_IMAGE077
CN202211116903.7A 2022-09-14 2022-09-14 一种基于空域关联度的热区识别方法 Active CN115222159B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211116903.7A CN115222159B (zh) 2022-09-14 2022-09-14 一种基于空域关联度的热区识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211116903.7A CN115222159B (zh) 2022-09-14 2022-09-14 一种基于空域关联度的热区识别方法

Publications (2)

Publication Number Publication Date
CN115222159A CN115222159A (zh) 2022-10-21
CN115222159B true CN115222159B (zh) 2023-01-31

Family

ID=83617188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211116903.7A Active CN115222159B (zh) 2022-09-14 2022-09-14 一种基于空域关联度的热区识别方法

Country Status (1)

Country Link
CN (1) CN115222159B (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111047182B (zh) * 2019-12-10 2021-12-28 北京航空航天大学 一种基于深度无监督学习的空域复杂度评估方法
CN111915930B (zh) * 2020-07-21 2022-04-12 北京航空航天大学 机载空管增强协处理系统及方法
CN114548893A (zh) * 2021-12-28 2022-05-27 北京航空航天大学 一种基于深度强化学习的多机场协同放行方法
CN115049009A (zh) * 2022-06-21 2022-09-13 长三角信息智能创新研究院 基于语义融合表征的轨迹预测方法

Also Published As

Publication number Publication date
CN115222159A (zh) 2022-10-21

Similar Documents

Publication Publication Date Title
Pang et al. Conditional generative adversarial networks (CGAN) for aircraft trajectory prediction considering weather effects
CN103679611B (zh) 基于案例推理的城市综合应急智能仿真系统的运行方法
CN111079602A (zh) 基于多尺度区域特征约束的车辆细粒度识别方法及装置
CN110245709A (zh) 基于深度学习和自注意力的3d点云数据语义分割方法
Keerthana et al. An ensemble algorithm for crop yield prediction
Yu et al. A special event-based K-nearest neighbor model for short-term traffic state prediction
CN112817312B (zh) 一种基于双重搜索优化算法的路径规划方法
WO2023201938A1 (zh) 缺失轨迹填补方法及系统
Jarry et al. On the use of generative adversarial networks for aircraft trajectory generation and atypical approach detection
Yu et al. Passenger flow prediction for new line using region dividing and fuzzy boundary processing
Basturk et al. Prediction of aircraft estimated time of arrival using machine learning methods
Kumar et al. Rainfall prediction using machine learning
CN103605493B (zh) 基于图形处理单元的并行排序学习方法及系统
CN115222159B (zh) 一种基于空域关联度的热区识别方法
CN110135451A (zh) 一种基于点到线段集距离的航迹聚类方法
CN113159371A (zh) 基于跨模态数据融合的未知目标特征建模与需求预测方法
CN107124761A (zh) 融合pso和ss‑elm的蜂窝网无线定位方法
CN116543603A (zh) 一种考虑空域态势和局部优化的航迹补全预测方法及装置
Song et al. Spatial-temporal transformer network for multi-year ENSO prediction
CN115600744A (zh) 一种基于手机数据的共享时空注意力卷积网络人口数量预测方法
Zhang The application of PSO-SVM algorithm in the evaluation system of sports competition events
Han A new intelligent method for travel path recommendation based on improved particle swarm optimisation
Kochenderfer et al. A Bayesian approach to aircraft encounter modeling
Wang et al. A Deep Spatiotemporal Trajectory Representation Learning Framework for Clustering
Jung et al. Inferring traffic models in terminal airspace from flight tracks and procedures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant