CN118520249B

CN118520249B - 飞机轨迹的预测模型训练方法和飞机轨迹的预测方法

Info

Publication number: CN118520249B
Application number: CN202410970597.6A
Authority: CN
Inventors: 章路; 葛溢; 杨阳; 张文生
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2024-07-19
Filing date: 2024-07-19
Publication date: 2024-10-01
Anticipated expiration: 2044-07-19
Also published as: CN118520249A

Abstract

本发明提供了一种飞机轨迹的预测模型训练方法和预测方法，应用于人工智能技术领域和飞行器技术领域。该训练方法包括：获取多个轨迹序列样本，轨迹序列样本是基于时序关系排列的至少一个时刻点的轨迹属性数据集构成的，轨迹属性数据集包括至少一种轨迹属性数据；根据轨迹序列样本的轨迹属性类均值和轨迹属性类方差对多种轨迹属性数据进行归一化处理，得到多个归一化样本，轨迹属性类均值和轨迹属性类方差均是基于轨迹序列样本中多个轨迹属性数据集的同种类轨迹属性数据计算得到的；将多个归一化样本输入自注意力模块，得到表征多个轨迹属性数据之间相关性的多个轨迹注意力样本，预测模型包括自注意力模块；利用多个轨迹注意力样本训练预测模型。

Description

飞机轨迹的预测模型训练方法和飞机轨迹的预测方法

技术领域

本发明涉及人工智能技术领域和飞行器技术领域，更具体地涉及一种飞机轨迹的预测模型训练方法和飞机轨迹的预测方法。

背景技术

随着科学技术的飞速发展，可对飞机轨迹进行预测，以保障飞行器之间的间隔和安全距离，避免空中相撞和危险情况的发生，也为航空公司和飞行员优化航班路径和航线选择提供数据参考。

但用于飞机轨迹预测的模型通常是对整体样本数据进行全局归一化，使得数据压缩造成样本特征缺失，造成数据质量低、计算机运行性能降低、模型的预测准确性、可靠性不高。

发明内容

鉴于上述问题，本发明提供了一种飞机轨迹的预测模型训练方法和飞机轨迹的预测方法。

根据本发明的第一个方面，提供了一种飞机轨迹的预测模型训练方法，包括：

获取多个轨迹序列样本，轨迹序列样本是基于时序关系排列的至少一个时刻点的轨迹属性数据集构成的，轨迹属性数据集包括至少一种轨迹属性数据；根据轨迹序列样本的轨迹属性类均值和轨迹属性类方差对多种轨迹属性数据进行归一化处理，得到多个归一化样本，轨迹属性类均值和轨迹属性类方差均是基于轨迹序列样本中多个轨迹属性数据集的同种类轨迹属性数据计算得到的；将多个归一化样本输入自注意力模块，得到表征多个轨迹属性数据之间相关性的多个轨迹注意力样本，预测模型包括自注意力模块；利用多个轨迹注意力样本训练预测模型。

本发明的第二方面提供了一种飞机轨迹的预测方法，该方法包括：

将飞机的轨迹序列输入训练后的预测模型，得到预测轨迹序列，其中，训练后的预测模型是根据上述任意一项方法训练得到的。

根据本发明实施例，通过获取多个轨迹序列样本，轨迹序列样本是基于时序关系排列的至少一个时刻点的轨迹属性数据集构成的，轨迹属性数据集包括至少一种轨迹属性数据。由于轨迹属性类均值、轨迹属性类方差均是基于轨迹序列样本中多个轨迹属性数据集的同种类轨迹属性数据计算得到的，因此根据轨迹属性类均值和轨迹属性类方差对多种轨迹属性数据进行归一化处理，得到多个归一化样本，实现单个轨迹序列样本的归一化，以保留单个轨迹序列样本的时间阶段、区域等特征，提高数据质量，提升计算机运行性能。再将多个归一化样本输入预测模型的自注意力模块，得到能够表征多个轨迹属性数据之间相关性的多个轨迹注意力样本，使得预测结果更具有可解释性，提升预测模型的可靠性。进而使得利用多个轨迹注意力样本训练得到的预测模型的预测准确性更高。

附图说明

通过以下参照附图对本发明实施例的描述，本发明的上述内容以及其他目的、特征和优点将更为清楚，在附图中：

图1示出了根据本发明实施例的飞机轨迹的预测模型训练方法的应用场景图；

图2示出了根据本发明实施例的飞机轨迹的预测模型训练方法的流程图；

图3示出了根据本发明实施例的Inivformer网络模型的架构图；

图4示出了根据本发明实施例的飞机轨迹的预测方法的流程图；

图5示出了根据本发明实施例的预测飞机轨迹步骤的示意图；

图6示出了根据本发明实施例的适于实现飞机轨迹的预测模型训练方法的电子设备的方框图。

具体实施方式

以下，将参照附图来描述本发明的实施例。但是应该理解，这些描述只是示例性的，而并非要限制本发明的范围。在下面的详细描述中，为便于解释，阐述了许多具体的细节以提供对本发明实施例的全面理解。然而，明显地，一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。

在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本发明。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语（包括技术和科学术语）具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释（例如，“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等）。

用于飞机轨迹预测的模型通常是对整体样本数据进行全局归一化，未考虑单个样本数据的特性，使得数据压缩造成样本特征缺失，数据质量低、计算机运行性能降低、模型的预测准确性不高。

本发明的实施例提供了一种飞机轨迹的预测模型训练方法，包括：获取多个轨迹序列样本，轨迹序列样本是基于时序关系排列的至少一个时刻点的轨迹属性数据集构成的，轨迹属性数据集包括至少一种轨迹属性数据；根据轨迹序列样本的轨迹属性类均值和轨迹属性类方差对多种轨迹属性数据进行归一化处理，得到多个归一化样本，轨迹属性类均值和轨迹属性类方差均是基于轨迹序列样本中多个轨迹属性数据集的同种类轨迹属性数据计算得到的；利用多个归一化样本训练预测模型。

图1示意性示出了根据本发明实施例的飞机轨迹的预测模型训练方法的应用场景图。

如图1所示，根据该实施例的应用场景100可以包括飞机101、网络102和服务器103。网络102用以在飞机101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

飞机101通过网络102与服务器103交互，以接收或发送消息等。飞机101上可以安装传感器，以获得至少一个时刻点的轨迹属性数据集构成的，轨迹属性数据集包括至少一种轨迹属性数据。

飞机101可以是具有ADS-B（Automatic Dependent Surveillance-Broadcast，广播式自动相关监视）设备，以向服务器103发送飞机101飞行的轨迹属性数据，轨迹属性数据可以是位置、高度、速度、航向、识别号等信息。

服务器103可以是提供各种服务的服务器，例如利用飞机101的轨迹属性数据提供支持的后台管理服务器（仅为示例）。后台管理服务器可以对接收到的轨迹属性数据进行分析等处理，并将处理结果（例如根据轨迹属性数据预测飞行轨迹等）反馈给飞机101。同时，也可将处理结果发送至终端设备，以供用户参考。终端设备可以是具有电子显示屏的手机、电脑等电子设备。

需要说明的是，本发明实施例所提供的飞机轨迹的预测模型训练方法方法一般可以由服务器103执行。相应地，本发明实施例所提供的飞机轨迹的预测模型训练装置一般可以设置于服务器103中。本发明实施例所提供的飞机轨迹的预测模型训练方法也可以由不同于服务器103且能够与飞机101和/或服务器103通信的服务器或服务器集群执行。相应地，本发明实施例所提供的飞机轨迹的预测模型训练装置也可以设置于不同于服务器103且能够与飞机101和/或服务器103通信的服务器或服务器集群中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

图2示意性示出了根据本发明实施例的飞机轨迹的预测模型训练方法的流程图。

如图2所示，该实施例的飞机轨迹的预测模型训练方法包括操作S210~操作S240。

在操作S210，获取多个轨迹序列样本。

根据本发明的实施例，轨迹序列样本是基于时序关系排列的至少一个时刻点的轨迹属性数据集构成的，轨迹属性数据集包括至少一种轨迹属性数据。

根据本发明的实施例，时序关系可以表征时刻点之间的早晚关系。例如，轨迹序列样本可以是基于由时间早向时间晚的顺序排列，即可按照20s前、20s后顺序排列。

根据本发明的实施例，针对时刻点不做具体限制，时序关系也可以是采集数据的时刻点之间的早晚关系、也可以是数据产生的时刻点之间的早晚关系等。

根据本发明的实施例，轨迹属性数据可以是飞机向执行飞机轨迹的预测模型训练方法的服务器发送的时间戳信息、飞行地理信息、飞行位置信息、飞机机身运行信息、飞机属性信息等。

例如，飞行地理信息可以是飞行经度、纬度。飞行位置信息可以是飞行高度、航向角。飞机机身运行信息可以是气压高度、飞机器件温度、对地速度、垂直速度等。飞机属性信息可以是飞机唯一标识、飞机飞行的航班号等。

例如，轨迹序列样本可以是基于时序关系排列的5个时刻点的轨迹属性数据集构成的，5个时刻点可以分别是9时10分20秒、9时10分40秒、9时11分00秒、9时11分20秒和9时11分40秒。5个时刻点分别对应的轨迹属性数据集分别是A、B、C、D和E。时序关系可以由时间早向时间晚的顺序排列，轨迹序列样本可以是{A，B，C，D，E}。

在操作S220，根据轨迹序列样本的轨迹属性类均值和轨迹属性类方差对多种轨迹属性数据进行归一化处理，得到多个归一化样本。

根据本发明的实施例，轨迹属性类均值和轨迹属性类方差均是基于轨迹序列样本中多个轨迹属性数据集的同种类轨迹属性数据计算得到的。

例如，轨迹属性数据可以是对地速度，可将轨迹序列样本{A，B，C，D，E}中所有对地速度进行平均，得到对地速度均值，即轨迹属性类均值。

根据本发明的实施例，轨迹属性类方差可以是基于轨迹属性类均值计算得到的。

根据本发明的实施例，同种类的轨迹序列样本的轨迹属性类均值和轨迹属性类方差对同种类轨迹属性数据进行归一化处理。再将多种归一化处理后的轨迹属性数据确定为归一化样本中数据集的数据。

上述操作S220并不是简单的对轨迹序列样本进行全局归一化，而是针对轨迹序列样本中轨迹属性数据的统计特性进行归一化，可减少数据变化的压缩造成的特征丢失。

飞机在爬升阶段的轨迹序列样本与下降阶段的轨迹序列样本之间的轨迹属性数据存在明显差异，若简单的对轨迹序列样本进行全局归一化，轨迹属性数据的差异性变小，全局归一化后的样本训练得到的预测模型的预测精度低。

若将爬升阶段的轨迹序列样本或下降阶段的轨迹序列样本中同种类的轨迹属性类均值和轨迹属性类方差对同种类轨迹属性数据进行归一化处理，得到的归一化样本能够保留爬升阶段或下降阶段的特征。

上述并不限制于飞机在爬升阶段与下降阶段的轨迹序列样本存在明显差异，也可以是不同区域的轨迹序列样本等，上述操作S220均能保留单个样本的特征。

在操作S230，将多个归一化样本输入自注意力模块，得到表征多个轨迹属性数据之间相关性的多个轨迹注意力样本。

根据本发明的实施例，预测模型包括自注意力模块。自注意力模块可以是基于属性间的自注意力机制构建得到的。属性间的自注意力机制可以得到同一样本中不同种类的轨迹属性数据之间的相关性。

通常自注意力机制会是将同一化样本中每个时刻点与其他时刻点的关系生成权重，以得到时间步之间的相互影响。

而本发明实施例的自注意力模块可以挖掘样本中轨迹属性数据之间的关系，可将高度相关的轨迹属性数据赋予更大的权重，使得预测结果更具有可解释性。

在操作S240，利用多个轨迹注意力样本训练预测模型。

根据本发明的实施例，预测模型可以是神经网络模型。训练的方式可以是监督学习、无监督学习、半监督学习、端到端学习等。

根据本发明的实施例，通过获取多个轨迹序列样本，轨迹序列样本是基于时序关系排列的至少一个时刻点的轨迹属性数据集构成的，轨迹属性数据集包括至少一种轨迹属性数据。由于轨迹属性类均值、轨迹属性类方差均是基于轨迹序列样本中多个轨迹属性数据集的同种类轨迹属性数据计算得到的，因此根据轨迹属性类均值和轨迹属性类方差对多种轨迹属性数据进行归一化处理，得到多个归一化样本，实现单个轨迹序列样本的归一化，以保留单个轨迹序列样本的时间阶段、区域等特征，提高数据质量，提升计算机运行性能。再将多个归一化样本输入预测模型的自注意力模块，得到能够表征多个轨迹属性数据之间相关性的多个轨迹注意力样本，使得预测结果更具有可解释性，提升预测模型的可靠性。进而使得利用多个轨迹注意力样本训练得到的预测模型的预测准确性更高。

根据本发明的实施例，预测模型包括前馈神经网络模块和逆实例归一化模块；利用多个归一化样本训练预测模型包括：将多个轨迹注意力样本输入前馈神经网络模块，得到多个预测归一化样本；将多个预测归一化样本分别输入逆实例归一化模块，得到与多个轨迹序列样本对应的多个预测轨迹序列样本；基于损失函数处理多个预测轨迹序列样本，得到损失函数值；基于损失函数值训练预测模型。

根据本发明的实施例，前馈神经网络可以根据轨迹注意力样本进行飞行轨迹预测。预测归一化样本可以是与归一化样本具有同特征的样本，即同种轨迹属性数据的范围相同。

根据本发明的实施例，逆实例归一化模块可以将预测归一化样本中轨迹属性数据的范围映射至轨迹序列样本中轨迹属性数据的范围（原始样本数据范围）。

根据本发明的实施例，损失函数可以是均方误差、交叉熵损失函数、对数损失函数等。损失函数可以衡量预测轨迹序列样本与实际轨迹序列样本差异的函数。

根据本发明的实施例，通过自注意力模块对多个归一化样本进行处理，得到更具可解释性的多个轨迹注意力样本，轨迹注意力样本可以表征多个轨迹属性数据之间相关性。再将多个轨迹注意力样本输入前馈神经网络模块，得到多个预测归一化样本。通过逆实例归一化模块对个预测归一化样本还原至原始数据范围，从而逆实例归一化模块对不同阶段、不同区域的轨迹数据具有更强的适应性。

根据本发明的实施例，轨迹属性类均值的公式为：

（1）

轨迹属性类方差的公式为：

（2）

，，L为轨迹序列样本中时刻点的个数，N为轨迹属性数据的种类数，表示第l时刻点的轨迹属性数据集中第n轨迹属性数据，L、N均为大于或等于1的整数。

根据本发明的实施例，预测模型还包括实例归一化模块，实例归一化模块用于根据输入的轨迹序列样本生成归一化样本，实例归一化模块的归一化处理的公式为：

（3）

ε、、分别是预测模型的归一化训练参数，表示归一化样本中第l时刻点的第n轨迹属性归一化数据。统计量是轨迹属性类均值和轨迹属性类方差。

根据本发明的实施例，将多个归一化样本输入自注意力模块，得到表征多个轨迹属性数据之间相关性的多个轨迹注意力样本还包括：将多个归一化样本输入预测模型的嵌入模块，得到多个嵌入样本；对多个嵌入样本分别进行转置，得到多个转置样本，多个转置样本是基于多个轨迹属性数据的序列关系排列的时刻点构成的；将多个转置样本输入自注意力模块，得到表征多个轨迹属性数据之间相关性的多个轨迹注意力样本。

根据本发明的实施例，轨迹序列样本可以是将至少一个时刻点的轨迹属性数据集中的轨迹属性数据有序排列的数据序列。即归一化样本也是数据序列。

根据本发明的实施例，嵌入模块是将归一化样本嵌入词元。

（4）

Q表示嵌入样本，TL表示归一化样本，D为嵌入维度，Embedding(∙)嵌入是通过多层感知器实现的。

(5)

嵌入样本Q中e₀至e_N分别表示嵌入样本中N种轨迹属性数据集。

根据本发明的实施例，自注意力模块的分数A_i,j的表示为：

（6）

A_i,j表征第i轨迹属性数据与第j轨迹属性数据之间的相关性值，Q为嵌入样本，为转置样本，表示第i轨迹属性数据标记的查询，为第j轨迹属性数据标记的键，i、j均为大于或等于1的整数。

根据本发明的实施例，预测模型还包括至少一个层归一化模块，层归一化模块设置于自注意力模块和\或前馈神经网络模块的后面。

根据本发明的实施例，层归一化模块用于对单个轨迹注意力样本或预测归一化样本中同种轨迹属性数据进行归一化，解决非平稳题。

(7)

h_n表示自注意力模块或前馈神经网络模块的输出值，LayerNorm(H)为经过归一化的样本。

根据本发明的实施例，层归一化模块也可以设置于预测模型中任一模块的后面，实现对轨迹属性数据规范化，加快预测模型的学习速度、提高数值稳定性。

根据本发明的实施例，在将多个轨迹注意力样本输入前馈神经网络模块，得到多个预测归一化样本之后，上述方法还包括：将多个预测归一化样本输入预测模型的序列投影模块，得到预设维度的多个预测投影序列样本；将多个预测投影序列样本分别输入逆实例归一化模块，得到与多个轨迹序列样本对应的多个预测轨迹序列样本。

根据本发明的实施例，序列投影模块用于对预测归一化样本进行维度投影。

(8)

h_n表示预测归一化样本(前馈神经网络模块的输出值)，为预测投影序列样本，预测投影序列样本是具有预设维度的数据序列。

根据本发明的实施例，逆实例归一化模块的逆实例归一化公式为：

（9）

为预测投影序列样本，为预测轨迹序列样本。与公式(3)使用的相同归一化统计量，即归一化统计量也是轨迹属性类均值和轨迹属性类方差。

根据本发明的实施例，可将实例归一化模块、嵌入模块、自注意力模块、前馈神经网络模型、序列投影模块、逆实例归一化模块、多个层归一化模块进行组合构造，得到Inivformer网络模型（预测模型）。层归一化模块可以是transformer编码器。

图3示意性示出了根据本发明实施例的Inivformer网络模型的架构图。

如图3所示，该实施例的Inivformer网络模型300包括实例归一化模块310、嵌入模块320、自注意力模块330、多个层归一化模块340、前馈神经网络模型350、序列投影模块360、逆实例归一化模块370。其中，自注意力模块330、多个层归一化模块340、前馈神经网络模型350可按照现有顺序进行重复设置D次，即包括2D个层归一化模块340、D个自注意力模块330、D个前馈神经网络模型350，D为大于1的整数。将轨迹序列样本输入Inivformer网络模型300，输出得到预测轨迹序列样本。

图4示意性示出了根据本发明实施例的飞机轨迹的预测方法的流程图。

如图4所示，该实施例的飞机轨迹的预测方法包括操作S410。

在操作S410，将飞机的轨迹序列输入训练后的预测模型，得到预测轨迹序列，其中，训练后的预测模型是根据飞机轨迹的预测模型训练方法训练得到的。

根据本发明的实施例，对上述飞机轨迹的预测模型训练方法和飞机轨迹的预测方法进行详细举例描述。

示例性，对历史轨迹、未来轨迹、轨迹点数学表示进行定义。

在飞机轨迹预测中，给定轨迹点，x_n为轨迹点属性数据，包括经度，纬度，气压高度，对地速度，垂直速度，航向角。定轨迹点P为轨迹属性数据集。

给定历史轨迹，其中P_L是历史轨迹中第l时刻点的轨迹属性数据集，L是轨迹序列样本中时刻点的个数，N是轨迹属性数据的种类数。

给定预测轨迹，P_L+h是预测轨迹中第h个时刻点的轨迹属性数据集，H是预测未来的时间步长。

需要说明的是，在历史轨迹、未来轨迹中的时刻点均不作限制，时刻点之间可以是均匀时间步长分布，也可以是随机时间步长分布。

图5示意性示出了根据本发明实施例的预测飞机轨迹步骤的示意图。

如图5所示，该实施例的预测飞机轨迹步骤主要包括操作S510~S530。

在操作S510，对采集到的数据进行数据处理，得到多个轨迹序列样本。

在操作S520，利用多个轨迹序列样本训练Inivformer网络模型，得到训练后的Inivformer网络模型。

在操作S530，利用训练后的Inivformer网络模型对飞机的轨迹序列进行预测。

根据本发明的实施例，采集数据可以是通过飞行器上安装的ADS-B设备和接收设备获取的，原始数据以csv文件形式保存，具体形式如表1所示。

根据本发明的实施例，获取到原始轨迹数据csv文件后，按航班、时间戳进行多级排序，划分航班，对缺失值、异常值进行处理，分航班基于时间滑窗进行样本采样，对数据集进行划分。

根据本发明的实施例，为了获得某架航班的飞行轨迹数据方便后续数据处理，以飞机的航班号作为索引进行分组，生成以各自航班号命名的文本文件。

根据本发明的实施例，对存在大量空值的航班轨迹数据，剔除航班数据，对个别数值缺失的航班数据使用线性插值进行数据补全。

根据本发明的实施例，基于时间滑窗的样本采样，用(L+H)×N的滑动窗口在同一航班号内依次采样滑块，每次滑动步长为H,采样后得到输入样本集的维度为(Number，L+H，N)，Number为样本的个数。

根据本发明的实施例，划分数据集，按照6:2:2的比例分别划分为训练集、验证集和测试集，用于预测模型训练，验证调参和效果测试。总共(L+H)个时刻点，可将前L个时刻点对应的数据集确定为轨迹序列样本、将后H个时刻点对应的数据集确定为实际轨迹序列样本。基于预测轨迹序列样本与实际轨迹序列样本之间的损失函数值训练Inivformer网络模型。

根据本发明的实施例，构造Inivformer轨迹预测网络模型、并训练Inivformer轨迹预测网络模型。

采用了Transformer的纯编码器架构，包括实例归一化模块、逆归一化模块、嵌入模块、序列投影模块和层归一化模块。

针对飞机时序轨迹数据，实例归一化模块按轨迹属性数据进行归一化，嵌入模块对变量序列词嵌入，序列投影模块对嵌入变量序列还原，逆实例归一化模块可还原轨迹原始分布，输出预测轨迹。

根据本发明的实施例，构造实例归一化模块（公式（1）~（3）），对于每个轨迹序列样本，计算每个特征通道（每种轨迹属性数据）的轨迹属性类均值和轨迹属性类方差，并使用轨迹属性类均值和轨迹属性类方差这两种统计量对轨迹序列样本的每种轨迹属性数据进行归一化。

根据本发明的实施例，构造时间序列的嵌入模块（公式（4）），将整个归一化样本中的序列嵌入为词元。

根据本发明的实施例，构造属性间的自注意力模块（公式（5）~公式（6））。在飞机轨迹预测任务中，不再采用注意力机制来进行时间依赖建模，而是对多个嵌入样本分别进行转置，得到多个转置样本。将一个输入的轨迹属性数据的时刻点序列视为一个独立的过程，即多个转置样本是基于多个轨迹属性数据的序列关系排列的时刻点构成的。

由于每个标记先前在其轨迹属性数据的特征维度上已被归一化，将多个转置样本输入自注意力模块，得到表征多个轨迹属性数据之间相关性的多个轨迹注意力样本，在某种程度上可以揭示多种轨迹属性数据间的相关性，并且整个分数图A∈R^N×N展示了成对轨迹属性数据标记之间的多轨迹属性数据相关性。

根据本发明的实施例，构造层归一化模块（公式（7））。层归一化用于提高深度网络的收敛性和训练稳定性，在典型的基于Transformer的预测模型中，该模块对同一时间戳的多个轨迹属性数据进行归一化，逐渐将各轨迹属性数据相互融合。而本实施例是将归一化模块应用于单个轨迹属性数据的序列（轨迹注意力样本）表示，解决非平稳问题。

根据本发明的实施例，构造时间步间的前馈神经网络模块，Transformer采用前馈神经网络（FFN，feedforward neural network）作为编码标记表示的基本构建块，并对每个标记进行相同的应用，由于同一时间戳的多个轨迹属性数据组成的标记（即一个时刻点下对应的多种轨迹属性数据的序列）可能位置不当且过于局部化，无法揭示足够的信息以进行预测。

而本实施例FFN用于每个轨迹属性数据标记的序列表示（即一种轨迹属性数据下对应的多个时刻点的序列），提取复杂的表示来描述时间序列，通过反转块的堆叠，使用密集的非线性连接对观测到的时间序列进行编码，并解码未来序列的表示。

根据本发明的实施例，在前馈神经网络模块之后构造层归一化模块。

根据本发明的实施例，构造序列投影模块（公式（8）），可实现将多个预测归一化样本输入预测模型的序列投影模块，得到预设维度的多个预测投影序列样本。

根据本发明的实施例，构造逆实例归一化模块（公式（10）），逆实例归一化模块在输出层反转归一化，显式将从输入数据中删除的非平稳属性返回到模型输出。

根据本发明的实施例，组合构造Inivformer网络模型。组合属性间的自注意力模块、层归一化模块、时间步间的前馈神经网络模块，层归一化模块成为可重复的类transformer编码器模块，将实例归一化模块，嵌入模块，N个类transformer编码器模块，逆实归一化模块。

根据本发明的实施例，Inivformer网络模型训练。构造完整个Inivformer网络模型所有模块后，使用提前划分好的训练集训练模型，根据验证集调整超参数，训练得到最佳轨迹预测模型。

构建训练、测试功能函数，根据验证集结果调整超参数，表2为对模型预测性能影响较大超参数最终值。

根据本发明的实施例，利用训练后的Inivformer网络模型对飞机的轨迹序列进行预测。输入长度为L的飞机轨迹，模型实时预测未来H步飞机轨迹。

综上所述具体实施方式，能够实现多阶段，宽区域的飞机轨迹预测。

基于实例归一化模块改进不同阶段、不同区域的飞机轨迹预测。通过实例规范化分别对样本经度，纬度，高度和速度序列进行规范化取代划定数据区域的全局规范化，避免数据变化的压缩，特征的丢失。通过逆实例规范化还原数据原始分布，对不同阶段，不同区域的轨迹数据具有更强适应性。

基于属性间的自注意力模块改进轨迹属性数据间关系挖掘和预测可解释性。将单个轨迹属性数据的整个时间窗口序列作为一个输入，保留了完整的局部时间信息，避免了传统transformer模型时间序列位置编码对局部信息的丢失。利用自注意力机制充分利用轨迹属性数据之间的关系，采用线性投影来获得查询、键和值，查询和键矩阵相乘的整个分数图展示了成对变量标记之间的多轨迹属性数据相关性，与值的矩阵相乘中，高度相关的轨迹属性数据将被赋予更多权重，基于该机制被对飞机轨迹预测预测更具有可解释。利用前馈神经网络进行历史轨迹的全局表示，使用密集的非线性连接对观测到的时间序列进行编码，并解码未来轨迹的表示。

根据本发明的实施例，构建的预测模型可大幅增强爬升、下降等复杂飞行阶段轨迹预测能力；可以根据飞机地理范围变化进行高鲁棒性的预测，从而提高预测范围的灵活性；允许轨迹预测轨迹模型更具可解释性，更可靠。

图6示意性示出了根据本发明实施例的适于实现飞机轨迹的预测模型训练方法的电子设备的方框图。

如图6所示，根据本发明实施例的电子设备600包括处理器601，其可以根据存储在只读存储器（ROM）602中的程序或者从存储部分608加载到随机访问存储器（RAM）603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器（例如CPU）、指令集处理器和/或相关芯片组和/或专用微处理器（例如，专用集成电路（ASIC））等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本发明实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

在RAM 603中，存储有电子设备600操作所需的各种程序和数据。处理器 601、ROM602以及RAM 603通过总线604彼此相连。处理器601通过执行ROM 602和/或RAM 603中的程序来执行根据本发明实施例的方法流程的各种操作。需要注意，所述程序也可以存储在除ROM 602和RAM 603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本发明实施例的方法流程的各种操作。

根据本发明的实施例，电子设备600还可以包括输入/输出（I/O）接口605，输入/输出（I/O）接口605也连接至总线604。电子设备600还可以包括连接至输入/输出（I/O）接口605的以下部件中的一项或多项：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管（CRT）、液晶显示器（LCD）等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至输入/输出（I/O）接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

本发明还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的；也可以是单独存在，而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序，当上述一个或者多个程序被执行时，实现根据本发明实施例的方法。

根据本发明的实施例，计算机可读存储介质可以是非易失性的计算机可读存储介质，例如可以包括但不限于：便携式计算机磁盘、硬盘、随机访问存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、便携式紧凑磁盘只读存储器（CD-ROM）、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如，根据本发明的实施例，计算机可读存储介质可以包括上文描述的ROM 602和/或RAM 603和/或ROM 602和RAM 603以外的一个或多个存储器。

本发明的实施例还包括一种计算机程序产品，其包括计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时，该程序代码用于使计算机系统实现本发明实施例所提供的飞机轨迹的预测模型训练方法。

在该计算机程序被处理器601执行时执行本发明实施例的系统/装置中限定的上述功能。根据本发明的实施例，上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。

在一种实施例中，该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中，该计算机程序也可以在网络介质上以信号的形式进行传输、分发，并通过通信部分609被下载和安装，和/或从可拆卸介质611被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时，执行本发明实施例的系统中限定的上述功能。根据本发明的实施例，上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。

根据本发明的实施例，可以以一种或多种程序设计语言的任意组合来编写用于执行本发明实施例提供的计算机程序的程序代码，具体地，可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java，C++，python，“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网（LAN）或广域网（WAN），连接到用户计算设备，或者，可以连接到外部计算设备（例如利用因特网服务提供商来通过因特网连接）。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

本领域技术人员可以理解，本发明的各个实施例中记载的特征可以进行多种组合和/或结合，即使这样的组合或结合没有明确记载于本发明中。特别地，在不脱离本发明精神和教导的情况下，本发明的各个实施例中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本发明的范围。

以上对本发明的实施例进行了描述。但是，这些实施例仅仅是为了说明的目的，而并非为了限制本发明的范围。尽管在以上分别描述了各实施例，但是这并不意味着各个实施例中的措施不能有利地结合使用。不脱离本发明的范围，本领域技术人员可以做出多种替代和修改，这些替代和修改都应落在本发明的范围之内。

Claims

1.一种飞机轨迹的预测模型训练方法，其特征在于，所述方法包括：

获取多个轨迹序列样本，所述轨迹序列样本是基于时序关系排列的至少一个时刻点的轨迹属性数据集构成的，所述轨迹属性数据集包括至少一种轨迹属性数据；

根据所述轨迹序列样本的轨迹属性类均值和轨迹属性类方差对多种所述轨迹属性数据进行归一化处理，得到多个归一化样本，所述轨迹属性类均值和所述轨迹属性类方差均是基于所述轨迹序列样本中多个所述轨迹属性数据集的同种类轨迹属性数据计算得到的；

将所述多个归一化样本输入自注意力模块，得到表征多个所述轨迹属性数据之间相关性的多个轨迹注意力样本，预测模型包括所述自注意力模块；

利用所述多个轨迹注意力样本训练所述预测模型；

所述将所述多个归一化样本输入自注意力模块，得到表征多个所述轨迹属性数据之间相关性的多个轨迹注意力样本还包括：

将所述多个归一化样本输入所述预测模型的嵌入模块，得到多个嵌入样本；

对所述多个嵌入样本分别进行转置，得到多个转置样本，所述多个转置样本是基于多个所述轨迹属性数据的序列关系排列的时刻点构成的；

将所述多个转置样本输入所述自注意力模块，得到表征多个所述轨迹属性数据之间相关性的所述多个轨迹注意力样本。

2.根据权利要求1所述的方法，其特征在于，所述预测模型包括前馈神经网络模块和逆实例归一化模块；

所述利用所述多个轨迹注意力样本训练所述预测模型包括：

将所述多个轨迹注意力样本输入所述前馈神经网络模块，得到多个预测归一化样本；

将所述多个预测归一化样本分别输入所述逆实例归一化模块，得到与所述多个轨迹序列样本对应的多个预测轨迹序列样本；

基于损失函数处理所述多个预测轨迹序列样本，得到损失函数值；

基于所述损失函数值训练所述预测模型。

3.根据权利要求1所述的方法，其特征在于，所述自注意力模块的分数A_i,j的表示为：

（1）

A_i,j表征第i轨迹属性数据与第j轨迹属性数据之间的相关性值，Q为所述嵌入样本，为所述转置样本，表示第i轨迹属性数据标记的查询，为第j轨迹属性数据标记的键，i、j均为大于或等于1的整数。

4.根据权利要求2所述的方法，其特征在于，在所述将所述多个轨迹注意力样本输入所述前馈神经网络模块，得到多个预测归一化样本之后，所述方法还包括：

将多个预测归一化样本输入所述预测模型的序列投影模块，得到预设维度的多个预测投影序列样本；

将所述多个预测投影序列样本分别输入所述逆实例归一化模块，得到与所述多个轨迹序列样本对应的多个预测轨迹序列样本。

5.根据权利要求2所述的方法，其特征在于，所述预测模型还包括至少一个层归一化模块，所述层归一化模块设置于所述自注意力模块和\或所述前馈神经网络模块的后面。

6.根据权利要求4所述的方法，其特征在于，所述轨迹属性类均值的公式为：

（2）

所述轨迹属性类方差的公式为：

（3）

，，L为所述轨迹序列样本中所述时刻点的个数，N为所述轨迹属性数据的种类数，表示第l时刻点的所述轨迹属性数据集中第n轨迹属性数据，L、N均为大于或等于1的整数。

7.根据权利要求6所述的方法，其特征在于，所述预测模型还包括实例归一化模块，所述实例归一化模块用于根据输入的所述轨迹序列样本生成所述归一化样本，所述实例归一化模块的归一化处理的公式为：

（4）

、、分别是所述预测模型的归一化训练参数，表示所述归一化样本中所述第l时刻点的第n轨迹属性归一化数据。

8.根据权利要求7所述的方法，其特征在于，所述逆实例归一化模块的逆实例归一化公式为：

（5）

为所述预测投影序列样本，为所述预测轨迹序列样本。

9.一种飞机轨迹的预测方法，其特征在于，所述方法包括：

将飞机的轨迹序列输入训练后的预测模型，得到预测轨迹序列，其中，所述训练后的预测模型是根据权利要求1~8中任意一项方法训练得到的。