CN115222159A

CN115222159A - 一种基于空域关联度的热区识别方法

Info

Publication number: CN115222159A
Application number: CN202211116903.7A
Authority: CN
Inventors: 毛永庆; 王煊; 黄吉波; 丁一波; 丁辉; 田靖
Original assignee: CETC 28 Research Institute
Current assignee: CETC 28 Research Institute
Priority date: 2022-09-14
Filing date: 2022-09-14
Publication date: 2022-10-21
Anticipated expiration: 2042-09-14
Also published as: CN115222159B

Abstract

本发明公开了一种基于空域关联度的热区识别方法，其目的为：构建基于Transformer的扇区语义表征模型，利用交通流特性对扇区序列化表征，建立涵盖扇区流量和容量特征的数据结构，设计扇区的时空位置编码和标识编码。然后，设计掩码自监督学习任务训练模型，挖掘不同扇区之间的时空依赖关系，生成扇区语义表征向量。最后计算扇区语义表征向量间的相似度作为空域关联度，选择与其它扇区关联度最高的扇区作为热区进行识别和调控，为精细化流量控制策略的制定提供态势支撑。

Description

一种基于空域关联度的热区识别方法

技术领域

本发明涉及空中交通流量管理方法，特别是一种基于空域关联度的热区识别方法。

背景技术

随着我国国民经济持续、稳步、快速地发展，军民航飞行活动逐年保持强劲的增长势头。我国民航的空中交通活动主要集中在东部经济发达地区，部分民航空域已经趋于饱和；同时军航穿越民航航路的飞行也在不断增加，导致部分地区的训练空域资源紧张，空域内飞行矛盾越来越大，军民航协调工作日益繁重。为解决空中交通拥挤问题，近几年相关部门对航路走向、管制方法等作了多次调整，但飞行流量的快速增长仍使部分区域内的总流量很快达到饱和甚至超负荷。为确保高峰时期飞行安全，目前各地区大多采用流量控制方式，即限制本地区飞机起飞和外管制区的飞机进入。流量控制由于缺乏广泛的协调、信息和技术支持，完全依赖管制员个人的工作经验，具有较大的随机性和不确定性，其不仅严重威胁了飞行安全，也容易导致空中交通拥塞的恶性循环和航班的大面积延误，给国民经济造成巨大的经济损失。

当前空中交通流量管理分战略、预战术和战术三个阶段。战术流量管理阶段主要通过预测空域容量和流量，优化航班时刻表、调整航空器的起飞时间、飞行航线等实现流量管理。由于当前的流量管理方案需要对目标空域内的不同扇区的流量和容量分别计算，且由于不同扇区间的关系无法确定，导致管制员需要根据每个扇区的容流比分别制定独立的流量控制策略，而非针对关键扇区制定流量控制策略，难以实现精细化调控。

发明内容

发明目的：本发明所要解决的技术问题是针对现有技术的不足，提供一种基于空域关联度的热区识别方法。

为了解决上述技术问题，本发明公开了一种基于空域关联度的热区识别方法。

本发明引入空域关联度的概念，构建并训练扇区语义表征模型，挖掘扇区之间的时空依赖关系，计算一个扇区序列中的不同扇区在不同时间段上语义表征之间的相似度，生成空域关联度。然后，基于空域关联度识别关键扇区作为热区，并针对热区提供流量控制策略，为精细化流量控制策略的制定提供依据。

一种基于空域关联度的热区识别方法，包括以下步骤：

步骤1，扇区数据序列化表征：将目标空域内的扇区按照二维序列结构进行表征，得到扇区序列；

步骤2，扇区序列特征处理：计算扇区序列中的流量和容量特征值；

步骤3，扇区编码设计：设计扇区序列中所有扇区的时空位置编码，以及扇区标识编码；

步骤4，扇区语义表征模型构建：以Transformer为基础模型，构建扇区语义表征模型，计算扇区序列的语义表征向量；

步骤5，扇区语义表征模型训练：设计基于掩码自监督学习的训练任务，采集历史数据构建训练数据集训练扇区语义表征模型；

步骤6，扇区语义表征计算：使用训练后的扇区语义表征模型对扇区序列进行表征处理，生成扇区的语义表征向量；

步骤7，空域关联度计算：计算不同时间及空间位置的扇区的语义表征向量间的相似度，作为扇区间的空域关联度，并基于关联度识别目标空域内的热区。

步骤1中所述得到扇区序列的方法包括：

从流量管理系统中提取并分析每架航班的飞行计划，获取航班所经过航路点、航线和航向信息，利用4D轨迹预测并生成不同时间段中的交通流；根据交通流对航路经过的扇区进行排列组合，在空间维度上生成一维扇区序列；在此基础上引入时间维度，将一维扇区序列扩展为二维序列，定义为

，其中

表示扇区序列，

表示实数，

表示扇区数量，

表示时间间隔数量。

步骤2包括：

选择扇区流量和容量作为描述扇区的物理特征；从流量管理系统中获取扇区在未来一段时间内不同时间段上的预测流量值和预测容量值；预测流量值的定义为：设定时间段内进入扇区的航班数量，取值为

之间的整数；预测容量值的定义为：设定时间段内扇区能提供服务的最大航班数量，取值为

之间的整数；由于不同时间段中扇区预测流量和预测容量的数值分布较广泛，会影响神经网络模型训练的收敛性，需要对预测流量值和预测容量值进行归一化处理，映射到

区间，计算过程如下所示：

，

表示预测流量或预测容量值；在步骤1中定义的扇区序列

的基础上，引入扇区流量和容量特征，将扇区序列重新定义为三维张量

。

步骤3中，在扇区序列之中，同一扇区在不同空间和时间上的流量值和容量值是时变的，很难通过固定的流量/容量值判断属于哪一个扇区，以及扇区所在的时空位置。为了解决以上问题，设计扇区编码，包括时空位置编码和扇区标识编码。扇区编码的设计方法包括：

步骤3.1，针对输入数据特征具有的时间和空间两个维度的特点，所设计的扇区时空位置编码包含两个维度，时空位置编码的公式如下所示：

(1)

(2)

(3)

(4)

式中，

表示扇区的时空位置编码，

和

是从

区间内的等分数列，

表示空间维度的位置，同理

表示时间维度的位置，

和

的长度定义为

，即扇区语义表征模型的隐层维度，

定义为一个非负常数；

表示空间尺寸，

表示时间尺寸，则时空位置编码

满足

；

步骤3.2，扇区标识编码用于辨别扇区；根据扇区数量对区间

等比划分，用于表示不同的扇区，再将扇区序列中的标识编码扩展至

维度，R表示实数；

步骤3.3，对输入序列

进行表征处理，然后与扇区的时空位置编码以及标识编码相加，得到扇区语义表征模型的输入

：

(5)

式中，

为输入扇区序列

的表征结果（可以通过模型中的嵌入层生成），

表示扇区的时空位置编码，

表示步骤3.2中所述的扇区标识编码。

步骤4中所述扇区语义表征模型，包括：嵌入层、多头注意力层和前向传递网络(Feed-Forward Networks, FFN)层；

其中，嵌入层是线性神经网络，对输入扇区序列

进行映射计算，转化为

维度的数据，其数学表示为：

(6)

其中，

定义为权重矩阵，参数

定义为偏置参数，输出

为

的表征结果，其中

表示模型的隐层维度；然后将

在时间维度上展平，得到：

；

多头注意力层包括：线性映射、多头注意力计算、拼接与映射、随机丢弃、层标准化和残差连接，具体包括：首先，对输入

进行线性映射，生成

三个不同得序列，数学公式如下：

(7)

(8)

(9)

式中，

代表Query向量，

代表Key向量，

代表Value向量，

、

和

分别为转换矩阵；序列中的每个扇区都受到其它空间和时间位置上扇区特征值的影响，扇区之间的注意力值大小表示相互影响的程度，计算公式如下所示：

(10)

式中，

是缩放因子，

表示扇区序列的注意力值矩阵，矩阵的维度是

，

函数对注意力值矩阵进行归一化计算，输出结果表示经过扇区影响后所得目标扇区的语义表征向量；

将

个注意力输出结果拼接和映射后，得到多头注意力值，计算如下所示：

(11)

其中，

表示第

个注意力，且

，

表示对多个注意力头进行拼接计算，

为转换矩阵，将多头注意力计算后输出

；最后，使用随机丢弃和层归一化对

进行处理后，与输入表征

相加后生成输出

；

将

输入前向传递网络FFN层，包括：线性映射、非线性计算和线性映射，计算公式如下所示：

(12)

其中，

和

是全连接层的转换矩阵，

和

是偏置参数，

是非线性函数ReLU的计算过程；经过前向传递网络FFN层处理后输出扇区语义表征向量

。

步骤5中所述设计基于掩码自监督学习的训练任务，包括：

设计自监督学习任务，参考BERT（参考：Devlin J, Chang M W, Lee K,Toutanova K. BERT: Pre-training of Deep Bidirectional Transformers forLanguage Understanding[C]. Proceedings of the North American Chapter of theAssociation for Computational Linguistics: Human Language Technologies, 2019:4171–4186.）的掩码语言模型（Masked Language Model, MLM）任务，在Transformer上拼接全连接层，实现线性空间映射，将扇区语义表征模型的输出

从

映射到

维度；

从流量管理系统中采集历史数据构建训练数据集，以60%的概率对训练数据中的扇区随机遮掩，使用特殊标记MASK替换扇区的原始数值，生成输入数据，保留原始数据作为标签，生成训练数据集。

步骤5中所述设计基于掩码自监督学习的训练任务，包括：

在扇区语义表征模型的训练过程中，输入被遮掩的扇区序列数据，经过扇区语义表征模型的预测，得到被遮掩扇区的原始数值，通过计算预测值与标签间的误差，使用反向传播算法训练模型，使扇区语义表征模型学习时空依赖关系。

步骤6中所述扇区语义表征计算的方法包括：将扇区序列

输入扇区语义表征模型，经过嵌入层、多层注意力层和FFN层的计算，生成扇区的深层语义表征

，其中

表示第

个位置，第

个时间间隔的扇区语义表征向量。

步骤7中所述空域关联度计算的方法包括：

使用扇区语义表征计算扇区间的空域关联度，公式如下所示：

(13)

其中，

表示两个不同扇区间的关联度；

表示在第

个空间位置，第

个时间间隔上扇区的语义表征向量；

表示在第

个空间位置，第

个时间间隔上扇区的语义表征向量。然后，选择与其它扇区关联度最高的扇区作为热区。

考虑语义表征模型的计算成本，步骤1中所述

和时间间隔数量

的取值满足以下条件：

。

有益效果：

本发明所提出的方法可以从历史流量数据中学习一个扇区序列中不同扇区间的时空相关性，计算扇区语义表征和空域关联度。基于空域关联度可以识别关键的热点扇区，并对其进行精细化流量控制，辅助管制员提出高效实时的决策建议，减少航班的大面积延误，降低国民经济损失。

附图说明

下面结合附图和具体实施方式对本发明做更进一步的具体说明，本发明的上述和/或其他方面的优点将会变得更加清楚。

图1为本发明总体流程图。

图2为基于Transformer的扇区语义表征模型结构图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

本发明的实现过程和步骤如下，其总体流程，如图1所示。

步骤1：扇区数据序列化表征。从流量管理系统中提取并分析每一架航班的飞行计划，获取航班所经过的航路点、航线和航向信息，利用4D轨迹预测并生成不同时间段中的交通流。根据交通流将

个扇区以序列化的形式进行表征，同时将需要观测的目标时间段进行间隔化切片，以半小时为一个时间间隔，共计

个时间间隔，形成

的二维矩阵形式表示扇区序列。

步骤2：扇区序列特征处理。从流量管理系统中获取扇区在未来一段时间内不同时间段上的预测流量值和预测容量值，预测流量值定义为当前时间间隔内进入扇区的航班数量，取值为

之间的整数；预测容量值定义为当前时间间隔内该扇区可提供的最大航班数量，取值为

之间的整数。对预测流量值和预测容量值进行归一化处理，将数值映射到

区间内，计算过程如下：

，

表示预测流量或预测容量值。

步骤3：扇区编码设计。扇区编码包括时空位置编码和标识编码。其中，时空位置编码采用公式(1) ~ (4)进行设计，得到

的时空位置编码，同时参考步骤3.2设计扇区标识编码

。

步骤4：扇区语义表征模型构建，如图2所示，模型包括嵌入层、多头注意力层和前向传递网络(Feed-Forward Networks, FFN)层，以及归一化处理。其中嵌入层对输入扇区序列

进行表征处理，得到

，参考公式(6)，再和扇区的时空位置编码

、标识编码

相加，生成多头注意力层的输入

，参考公式(5)，然后将

在时间维度上展平，转化成

输入多头注意力层。多头注意力层中的具体过程参考公式(7) ~ (11)，然后输出

，经过归一化处理后，与输入

相加，得到多头注意力层的输出。然后输入FFN层，使用公式(12)进行计算，再对FFN层的计算结果进行归一化处理，得到扇区的深层语义表征向量

。

步骤5：扇区语义表征模型训练。从流量管理系统中采集历史数据，以60%的概率对输入序列进行随机遮掩，即使用特殊标志

替换原始数值，生成训练样本。保留原始数据作为标签，生成训练数据集，计算正确数据与输出数据间的误差，并进行反向传播，实现模型自监督训练。

步骤6：扇区语义表征计算。使用扇区语义表征模型计算输入扇区序列的语义表征向量。

步骤7：空域关联度计算。根据公式(13)计算不同的时空位置上的扇区语义表征向量之间的相似度，作为扇区间的关联度，然后选择与其它扇区关联度最高的扇区作为热区。

实施例

首先给出航班飞行计划的例子：

航路点和航线：PIKAS, G330, PIMOL, A593, BTO, W82, DOGAR。

解释：在上述例子中，PIKAS、PIMOL、BTO和DOGAR表示航路点，G330、A593和W82表示两个航路点之间的航段，该飞行计划的航向是从PIKAS飞往DOGAR。使用4D轨迹预测可以算出一架航班在每个航路点上的过点时间。

步骤1：根据航路点和航线信息可以获得航路点所在扇区位置，根据4D轨迹预测航班进入到扇区的时间。其中，该航线经过的扇区序列长度为

，以航路点之间的过点时间间隔进行时间段切片，则定义

，输入的序列为

，满足

的限制条件。

步骤2：针对不同的扇区和时间间隔计算扇区的流量和容量特征，需要根据流量管理系统中的数据统计分析获得。例如：PIMOL航路点所在扇区进入航班60架，则其流量为60架；而该扇区可以提供的最大航班数量为70架。经过归一化后，该扇区的表征为

，即得到特征为

，则输入序列为

。

步骤3：设隐藏维度为

，采用公式(2)~(5)设计时空位置编码，得到

，设计扇区编码，以数字依次表示扇区。设北京所在扇区的编码是

，则

。

步骤4：构建扇区语义表征模型，该模型基于Transformer构建，包括嵌入层、多头注意力层和前向传递网络层。

步骤5：从流量管理系统中采集历史数据并构建训练数据集，设计掩码自监督学习任务训练模型。

步骤6：将输入扇区序列

进行映射后，生成嵌入序列

，再与时空位置编码和标识编码相加，得到特征向量输入多头注意力层，经过计算后生成输出向量，经过拼接，FFN层映射得到最终的扇区语义表征向量

。

步骤7：计算不同空间和时间位置上的扇区语义表征间的相似度，假设扇区语义表征为

，则相似度值为一个

之间的概率，数值大小表示所选的两个扇区间的关联度，相似度值越高，表明两个扇区间的关联度越大。

构建扇区语义表征模型并使用历史数据进行训练，然后使用该模型对实施例中的扇区计算语义表征，得到

四个扇区的语义表征，然后计算空域关联度。假如

与其它三个扇区的关联度都最高，则选择

作为扇区序列中的热区进行调控。

具体实现中，本申请提供计算机存储介质以及对应的数据处理单元，其中，该计算机存储介质能够存储计算机程序，所述计算机程序通过数据处理单元执行时可运行本发明提供的一种基于空域关联度的热区识别方法的发明内容以及各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(Random Access Memory, RAM)等。

本领域的技术人员可以清楚地了解到本发明实施例中的技术方案可借助计算机程序以及其对应的通用硬件平台的方式来实现。基于这样的理解，本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机程序即软件产品的形式体现出来，该计算机程序软件产品可以存储在存储介质中，包括若干指令用以使得一台包含数据处理单元的设备（可以是个人计算机，服务器，单片机或网络设备等）执行本发明各个实施例或者实施例的某些部分所述的方法。

本发明提供了一种基于空域关联度的热区识别方法的思路及方法，具体实现该技术方案的方法和途径很多，以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。