CN117114051A

CN117114051A - 基于lstm和自注意力机制的船舶轨迹预测方法

Info

Publication number: CN117114051A
Application number: CN202311213547.5A
Authority: CN
Inventors: 张毅; 周良
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2023-09-19
Filing date: 2023-09-19
Publication date: 2023-11-24

Abstract

本发明涉及一种基于LSTM和自注意力机制的船舶轨迹预测方法，具体包括：步骤一：采集代表船舶轨迹的AIS数据并进行预处理；步骤二：构建模型输入，具体使用三次样条插值对数据进行重采样，使用数据差分消除轨迹长期趋势，再利用滑动窗口和归一化构建模型输入；步骤三：构建基于LSTM和自注意力机制的预测模型；步骤四：训练模型，学习船舶运动潜在规律；步骤五：利用训练出的模型对船舶轨迹进行预测。本发明在对船舶轨迹数据进行预处理的前提下，使用所设计的基于LSTM和自注意力机制的预测模型进行建模，有效提升了船舶轨迹多步预测的准确率。

Description

基于LSTM和自注意力机制的船舶轨迹预测方法

技术领域

本发明属于船舶轨迹智能预测技术领域，特别是涉及一种基于LSTM和自注意力机制的船舶轨迹预测方法。

背景技术

当下航海事业蓬勃发展，作为最具有性价比的长途运输方式，据统计航海运输已经占据了全球所有贸易运输量的90％，但随之而来的则是船舶航行的管理难题。随着运输的船舶增多，热门港口或航道的压力不断增加，这不仅降低了运输的效率，还会提高船只之间碰撞的风险，所以需要对航行船只的轨迹进行预测，以实现对船舶的导航、调度和监管，提高安全性。AIS系统的快速发展使获得大量的船舶轨迹数据成为可能，这为船舶轨迹数据挖掘的研究，特别是船舶轨迹的预测提供了基本条件。AIS提供了大量的实时水上监控数据，包括水上移动通信业务标识码(MMSI)、船舶位置信息、船舶的对地航向和航速等。根据船舶当前的航行轨迹，充分挖掘历史数据中隐藏的重要信息，预测船舶航行轨迹，解决船舶航行的安全问题，了解国际贸易的变化和发展，具有重要的应用价值。

发明内容

发明目的：本发明的目的是构建基于LSTM和自注意力机制的船舶轨迹预测方法，实现船舶轨迹的多步预测，提高船舶轨迹预测准确率。

本发明解决其技术问题是采取以下技术方案实现的：

基于LSTM和自注意力机制的船舶轨迹预测方法，包括以下步骤：

步骤一：采集代表船舶轨迹的AIS数据并进行预处理；

步骤二：构建模型输入，具体使用三次样条插值对数据进行重采样，使用数据差分消除轨迹长期趋势，再利用滑动窗口和归一化构建模型输入；

步骤三：构建基于LSTM和自注意力机制的预测模型；

步骤四：对步骤三所构建的模型进行训练，学习船舶航行的潜在规律；

步骤五：使用步骤四所训练模型对船舶轨迹进行预测。

进一步的，步骤一对AIS数据清洗方法主要包括异常值处理，去除停留点并基于停留点进行轨迹分割。

进一步的，步骤二中所提及的模型输入构建方式如下：首先，从船舶轨迹中提取时间戳、船舶经纬度、航向和航速特征，利用三次样条插值使两连续轨迹点之间的时间间隔相同。接着，使用一阶差分移除轨迹长期趋势，即通过预测当前时刻轨迹点与下一时刻轨迹点特征差值的方式进行预测。然后，对数据进行归一化，消除奇异样本数据造成的不良影响。最后，设置模型输入轨迹长度和预测长度，使用滑动窗口产生模型输入。

进一步的，步骤三所涉及模型采用编码器和解码器的结构，以实现多步预测。

进一步的，步骤二所提出模型的编码器细节如下：首先将输入数据送入循环神经网络层，该层由一个双向循环神经网络BiLSTM构成，得到该层隐藏层输出/>然后将H_enc送入一个自注意力层进一步提取时序特征，接着由该层产生输出/>最后将H_enc与/>经过线性映射得到编码器输出的中间向量/>

进一步的，步骤二所提出模型的解码器细节如下：解码器的输入为将解码器输入X_dec送入一个循环神经网络层，该层为单层LSTM，得到输出/>然后将H_dec分别送入交叉注意力层和自注意力层，并将各自的输出/>和/>与H_dec送入各自对应的线性映射层，并进一步将两个输出送入一个统一的线性映射层，经由一个多层感知机得到最终输出。

进一步的，模型中所提及的自注意力层和交叉注意力层的计算方式相同，都是采用多头注意力机制，计算方式为：

其中，m_H是主意力头的个数，/> 是对应头部查询、键值的权重，/>则用来线性拼接所有的头部H_i。区别在于自注意力层的V、Q和K皆来自于对应的循环神经网络层的输出，而交叉注意力层的V和K来自于编码器输出的中间向量C，Q则来自与它所对应的循环神经网络层的输出。

进一步的，模型中所提及的线性映射计算方式如下：

Linear(H₁；H₂)＝ELU(W₁H₁+W₂H₂)

其中ELU(·)为激活函数。

本发明的有益效果为：

本发明构建的基于LSTM和自注意力机制的船舶轨迹预测方法能够实现直接多步预测，解决了迭代预测模型进行多步预测时容易产生误差累积的问题；在传统循环神经网络上进行改进，引入了自注意力机制，使得每个时刻的特征能够拥有更广阔的视野，获取各个时刻的特征信息，提高预测的能力；不对预测目标进行直接预测，而是使用数据差分处理原轨迹特征，使处理后的模型输入为平稳序列，利于目标结果的预测；本发明在所构建的深度学习模型的基础上，对原始规矩数据进行相应的预处理，提高了对于轨迹的拟合能力。

附图说明

图1为本发明流程图；

图2为本发明基于LSTM和自注意力机制的船舶轨迹预测模型；

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

步骤一：采集代表船舶轨迹的AIS数据进行清洗，获取轨迹预测数据集。

(1)异常值处理方式。常规检测，船舶经度在-180°到180°之间，纬度范围在-90°到90°之间，船舶航速范围在0到船舶速度上限之间，船舶航向在0°到360°之间，超出规定范围即为异常值，进行去除；离群点检测，对于连续三个时刻的轨迹点，如果中间时刻的轨迹点到前后两个时刻的轨迹点的距离超过相应时间间隔×船舶速度上限，则判定为异常值。

(2)去除船舶锚点。一段连续时间内船舶速度几乎为0，且行驶距离几乎没有增加的轨迹点集视为锚点，以停泊开始时间为子轨迹段结束点，以停泊结束时间开始为另一个子轨迹段起点，对原轨迹进行分段。

(3)最终获取属于同一船舶的多条子轨迹段，提取船舶的时间戳、经纬度信息(lat、lon)、船舶航速(sog)和船舶航向(cog)，用于轨迹预测的数据集。

步骤二：构建模型输入，使用三次样条插值对数据进行重采样，使用数据差分消除轨迹长期趋势，再利用滑动窗口和归一化构建模型输入。

(1)三次样条差值。船舶各连续轨迹点之间的时间间隔不一，使用三次样条差值对轨迹数据进行重采样，使相邻轨迹点之间的时间间隔相同。

(2)数据差分。以一条长度为N的船舶轨迹为例，该轨迹用S表示，表示方法具体为：S＝{s₁，s₂，...，s_N|s_i＝(lat_i，lon_i，sog_i，cog_i)}。经一阶差分后，可以获得一个新的时序序列其中/>

(3)滑动窗口。设置滑动窗口大小为I+O，获得长度为I的历史序列和对应的长度为O的标签序列。

(4)数据归一化。采用(Min-Max Normalization)最小最大归一化方法对数据进行归一化，计算方式如下：

最终获得若干条用于模型的输入序列和待预测的标签序列/>

步骤三：构建基于LSTM和自注意力机制的预测模型。

(1)首先将输入数据X_enc进入循环神经网络层，该层由一个双向循环神经网络BiLSTM构成，得到该层隐藏层输出H_enc。然后将H_enc送入一个自注意力层用于进一步提取时序特征，接着由该层产生输出最后将H_enc与/>经过线性映射得到编码器输出的中间向量C。

(2)解码器的输入为其中，对于任意时刻的输入/>为上一个时刻的预测值。将解码器输入X_dec送入一个循环神经网络层，该层为单层LSTM，得到输出H_dec。然后将H_dec分别送入交叉注意力层和自注意力层，并将各自的注意力输出/>和/>与H_dec送入各自对应的线性映射层，并进一步将两个输出送入一个统一的线性映射层，经由一个多层感知机得到最终输出。

步骤四：训练所搭建的模型。实验采用MSE作为损失函数，优化器采用Adam。对于模型参数，采用网格化搜索，其中所模型结构参数为模型隐藏节点数、多头注意力头数，多层感知机层数。模型训练参数为训练批量大小、学习率，历史轨迹长度和预测轨迹长度。

步骤五：获取模型预测结果。对于任意时刻t，模型的输出为当前时刻船舶位置(lat_t，lon_t)与下一时刻船舶位置(lat_t+1，lon_t+1)的差值需要对数据进行反差分操作以获得最终实现对于位置(lat_t+1，lon_t+1)的预测。

本发明构建的基于LSTM和自注意力机制的船舶轨迹预测方法能够实现直接多步预测，解决了迭代预测模型进行多步预测时容易产生误差累积的问题；在传统循环神经网络上进行改进，引入了自注意力机制，使得每个时刻的特征能够拥有更广阔的视野，可以获取各个时刻的特征信息，提高预测的能力；不对预测目标进行直接预测，而是使用数据差分处理原轨迹特征，使处理后的模型输入为平稳序列，利于目标结果的预测。

Claims

1.基于LSTM和自注意力机制的船舶轨迹预测方法，其特征在于，包括如下步骤：

步骤一：采集代表船舶轨迹的AIS数据并进行预处理；

步骤三：构建基于LSTM和自注意力机制的预测模型；

步骤五：使用步骤四所训练模型对船舶轨迹进行预测。

2.根据权利要求1中所述的基于LSTM和自注意力机制的船舶轨迹预测方法，其特征在于：所述步骤二，构建模型输入的方式如下：

首先，从船舶轨迹中提取时间戳、船舶经纬度、航向和航速特征，利用三次样条插值使两连续轨迹点之间的时间间隔相同。

接着，使用一阶差分移除轨迹长期趋势，即通过预测当前时刻轨迹点与下一时刻轨迹点特征差值的方式进行预测。

然后，对数据进行归一化，消除奇异样本数据造成的不良影响。

最后，设置模型输入轨迹长度和预测长度，使用滑动窗口构建模型输入。

3.根据权利要求1中所述的基于LSTM和自注意力机制的船舶轨迹预测方法，其特征在于：步骤三所涉及的基于LSTM和自注意力机制的预测模型的细节如下：

首先，模型采用编码器和解码器的结构，以实现序列到序列的多步预测。

对于编码器，首先将输入数据送入循环神经网络层，该层由一个双向循环神经网络BiLSTM构成，得到该层隐藏层输出/> 然后将H_enc送入一个自注意力层进一步提取时序特征，接着由该层产生输出/>最后将H_enc与/>经过线性映射得到编码器输出的中间向量

对于解码器，解码器的输入为将解码器输入X_dec送入一个循环神经网络层，该层为单层LSTM，得到输出/> 然后将H_dec分别送入交叉注意力层和自注意力层，并将各注意力层的输出/>和与H_dec送入各自对应的线性映射层，并进一步将两个输出送入一个统一的线性映射层，经由一个多层感知机得到最终输出。

4.根据权利要求3所述的基于LSTM和自注意力机制的船舶轨迹预测方法，其特征在于：模型中所提及的自注意力层和交叉注意力层的计算方式相同，都是采用多头注意力机制，计算方式为：

5.根据权利要求3所述的基于LSTM和自注意力机制的船舶轨迹预测方法，其特征在于：模型中所提及的线性映射计算方式如下：

Linear(H₁；H₂)＝ELU(W₁H₁+W₂H₂)

其中ELU(·)为激活函数。