CN117474168A

CN117474168A - 一种基于注意力机制的CNN-BiGRU的船舶轨迹预测方法及装置

Info

Publication number: CN117474168A
Application number: CN202311500966.7A
Authority: CN
Inventors: 冯姣; 王梓昊; 李鹏
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2023-11-13
Filing date: 2023-11-13
Publication date: 2024-01-30

Abstract

本发明介绍了一种基于注意力机制的CNN‑BiGRU的船舶轨迹预测方法及装置，属于船舶运动预测技术领域，方法包括：获取AIS原始数据，从中选取特定数据，对特定数据进行预处理；划分进行过预处理的特定数据为训练集和测试集；获取基于注意力机制的CNN‑BiGRU的船舶轨迹预测模型；将训练集输入船舶轨迹预测模型，通过卷积神经网络CNN和BiGRU网络分别对训练集进行特征提取；结合提取到的特征，输入注意力机制层提取进一步特征；将所述进一步特征输入全连接层，得到预测结果；通过LOSS函数计算预测结果和实际值的误差，使用反向传播算法优化船舶轨迹预测模型；将测试集输入优化模型，得到测试集的预测结果；计算预测结果，得到预测的船舶经纬度。本发明预测精度高，应用性强。

Description

一种基于注意力机制的CNN-BiGRU的船舶轨迹预测方法及装置

技术领域

本发明涉及一种基于注意力机制的CNN-BiGRU的船舶轨迹预测方法及装置，属于船舶运动预测技术领域。

背景技术

近年来，国内外水上贸易越发频繁，海上船流量日益递增、重要的水路交通日益繁忙，海上船舶碰撞等交通事故的风险日益增加。因此，为了降低水上交通事故风险，对船舶进行有效且即时的监测，预测船舶的轨迹越发重要。其中监测船舶的系统主要是船舶自动识别系统(Automatic Identification System，AIS)。AIS系统每时每刻都会接受大量船舶相关信息，信息主要涉及水上移动通讯服务标识码MMSI、经纬度、对地航向和对地航速等。有效利用AIS数据对船舶轨迹进行合理的预测，能达到有效监督和指导船舶的作用，降低水上交通事故风险。

船舶航行轨迹预测主要分为基于统计和船舶动力学方程的船舶轨迹预测和基于神经网络的船舶轨迹预测。传统船舶轨迹预测方法主要有高斯过程回归、卡尔曼滤波、灰色预测模型等。以上算法基于统计和船舶动力学方程，在质量很好的AIS数据上有不错的预测精度，适用在理想环境下。而实际的AIS数据都相对复杂由于噪音、缺值、非线性等原因，传统船舶轨迹算法的预测精度就会明显下降。基于神经网络的船舶轨迹预测又分为BP神经网络和卷积神经网络。BP神经网络的船舶轨迹聚类模型缺乏对船舶轨迹时序性的考虑，且模型参数数量过多且难以调整。而卷积神经网络CNN的船舶轨迹聚类模型参数数目可调，时间复杂大可调，且拥有不错的预测，成为现在主流轨迹预测模型。目前，单结构卷积神经网络模型虽然在时间复杂度取得优势，但是预测精度低，越发难以满足使用要求。

公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域普通技术人员所公知的现有技术。

发明内容

本发明的目的是提供一种基于注意力机制的CNN-BiGRU的船舶轨迹预测方法及装置，高精度预测船舶轨迹，减少预测时间，具备一定的泛化能力。

为达到上述目的，本发明是采用下述技术方案实现的。

一方面，本发明提供一种基于注意力机制的CNN-BiGRU的船舶轨迹预测方法，包括：

获取AIS原始数据，从所述AIS原始数据中选取特定数据，对所述特定数据进行预处理；

划分所述进行过预处理的特定数据为训练集和测试集；

获取基于注意力机制的CNN-BiGRU的船舶轨迹预测模型；

将训练集输入所述船舶轨迹预测模型，通过卷积神经网络CNN和BiGRU网络分别对所述训练集进行特征提取；

结合所述提取到的特征，输入注意力机制层提取进一步特征；

将所述进一步特征输入全连接层，得到预测结果；

通过LOSS函数计算所述预测结果和实际值的误差，使用反向传播算法优化船舶轨迹预测模型；

将所述测试集输入优化后的船舶轨迹预测模型，得到测试集的预测结果；

计算所述测试集的预测结果，得到预测的船舶经纬度。

在一种实施例中，所述特定数据包括时间、纬度、经度、对地航向和对地速度；

所述划分所述进行过预处理的特定数据的过程包括：按照轨迹序列号比例划分训练集和测试集；

所述预处理过程包括：对经纬度进行墨卡托转换，并最大最小归一化处理；最大最小归一化处理对地航向和对地速度；若所述特定数据中产生错误的数据，将其删除；若所述特定数据存在缺值，采用拉格朗日插值法进行修复。

在一种实施例中，所述通过卷积神经网络CNN对训练集进行特征提取的过程包括：

输入数据与卷积核相卷积，获得特征图；所述特征图通过非线性的激活函数激活，获得激活特征；所述激活特征通过池化层，采用最大池化获得最终特征。

在一种实施例中，所述BiGRU网络由两个方向相反的GRU构成，正向GRU的计算公式如下：

其中b_r，b_z，b_h为输入x_t和前一时刻状态的偏置向量，W_r，W_z，W_h，U_r，U_z和U_h为权重矩阵，σ为sigmoid函数,tanh为双曲正切函数；

所述BiGRU计算公式如下：

其中，为正向GRU的隐藏输出状态，/>为反向GRU的隐藏输出状态，ht为t时刻的整体隐藏输出状态。

在一种实施例中，结合所述提取到的特征的过程如下：

d_t＝concat(g_t,h_t)

其中，d_t为结合后的提取到的特征，g_t为CNN层的输出特征，h_t为BiGRU层的输出特征。

在一种实施例中，所述输入注意力机制层过程包括：对上一个输出的特征d_t进行分配权重求和计算，得到特征向量c，公式如下：

st＝tanh(wsTdt+bs)

其中a_t为注意力权重，k是指预测下一个所给定输入数据的个数，st是指特征dt的影响程度，为特征dt的权重矩阵，bs为其偏移矩阵。

在一种实施例中，所述LOSS函数为均方误差MSE，公式如下：

其中,i为输入数据的序列号,M为训练集的一组样本个数,y_i为第i个数据的真实值,为第i个数据的预测值。

在一种实施例中，所述计算预测结果和实际值的误差的过程中使用误差函数，所述误差函数是均方根误差RMSE和平均绝对误差MAE，具体计算公式如下：

其中,i为输入轨迹的序列号,N为数据的样本个数,y_i为第i个数据的经纬度真实值,为第i个的经纬度预测值。

在一种实施例中，所述计算所述测试集的预测结果，得到预测的船舶经纬度的过程包括：将所述预测结果通过反最大最小值归一化，通过墨卡托投影逆解算公式计算出预测的传播经纬度。

第二方面，本发明提供一种基于注意力机制的CNN-BiGRU的船舶轨迹预测装置，包括：

预处理模块，被配置用于：获取AIS原始数据，从所述AIS原始数据中选取特定数据，对所述特定数据进行预处理；

划分模块，被配置用于：划分所述进行过预处理的特定数据为训练集和测试集；

获取模型模块：获取基于注意力机制的CNN-BiGRU的船舶轨迹预测模型；

输入训练模块：将训练集输入所述船舶轨迹预测模型，通过卷积神经网络CNN和BiGRU网络分别对所述训练集进行特征提取；

将所述进一步特征输入全连接层，得到预测结果；

优化模块，被配置用于：通过LOSS函数计算所述预测结果和实际值的误差，使用反向传播算法优化船舶轨迹预测模型；

轨迹预测模块：将所述测试集输入优化后的船舶轨迹预测模型，得到测试集的预测结果；

计算所述测试集的预测结果，得到预测的船舶经纬度。

与现有技术相比，本发明所达到的有益效果：

1.通过CNN网络获得船舶轨迹的空间特征，通过BIGRU，获得了时序特征，不仅保留过去的信息，还保留未来的信息，并将两种信息结合，使得模型可以从时间序列中学习到更高级的特征；

2.通过注意力机制层进行特征权重的自动化分配，以提升重要特征在特征表达中的影响力，获得了整体特征；

3.通过空间特征、时序特征和整体特征结合，经过全连接层，得到预测结果，过程具有一定的泛化性；

4.通过LOSS函数计算预测结果和实际值的误差，使用反向传播算法优化整个预测模型，提高了预测的精准度。

附图说明

图1所示为本发明的流程示意图；

图2所示为本发明的正向GRU模型结构示意图；

图3所示为本发明的BiGRU模型结构示意图；

图4所示为本发明的注意力机制结构图；

图5所示为本发明的整个船舶轨迹预测模型结构示意图；

图6所示为本发明的整个船舶轨迹预测模型的训练集的LOSS图；

图7所示为本发明的整个船舶轨迹预测模型的测试集的RMSE和MAE图；

图8所示为本发明的RMSE对比示意图；

图9所示为本发明的MAE对比示意图；

图10所示为本发明的仿真结果对比图。

具体实施方式

需要说明的是：

下面通过附图以及具体实施例对本发明技术方案做详细地说明，应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明，而不是对本发明技术方案的限定，在不冲突的情况下，本发明实施例以及实施例中的技术特征可以相互组合。

术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，字符"/"，一般表示前后关联对象是一种“或”的关系。

实施例1

本实施例介绍一种基于注意力机制的CNN-BiGRU的船舶轨迹预测方法，包括：

划分所述进行过预处理的特定数据为训练集和测试集；

获取基于注意力机制的CNN-BiGRU的船舶轨迹预测模型；

将所述进一步特征输入全连接层，得到预测结果；

计算所述测试集的预测结果，得到预测的船舶经纬度。

实施例2

与实施例1基于相同的发明构思，本实施例还包括：

所述特定数据包括时间、纬度、经度、对地航向和对地速度；

其中，本实施例中，按照轨迹序列号以8:2比例划分为训练集和测试集。

其中，所述墨卡托转换是正轴等角圆柱投影，圆柱投影的一种，将球面上的经纬度坐标投影到二维平面坐标，有利于数值的计算。

其中，最大最小归一化处理，是将数据集中各元素的取值分布映射在在[0,1]内，表达式为：

x为原始数据；x*为归一化数据。

其中，所述产生错误的数据包括但不限于如下几类：

(1)水上移动通讯服务标识码MMSI不符合规范；

(2)船舶的经纬度、对地航向和对地速度不在合理范围内；

(3)船舶的经纬度、对地航向和对地速度的变化率不在合理范围内；

(4)船舶的采集时间间隔过长。

所述通过卷积神经网络CNN对训练集进行特征提取的过程包括：

其中，卷积的公式如下所示:

g(i)为特征图，a为输入数据，ω为卷积核的权重，b为卷积核的偏置，x、y、z为输入的维度，q为滤波器的个数。

本实施例中，所述非线性的激活函数为RELU激活函数，RELU激活函数定义如下：

y(i)＝f(g(i))＝max{0,g(i)},i＝1,2,...,q

其中，最大池化是将特征按照步幅长度展开特征，计算每行的最大值，转换为合适大小的输出特征。

所述BiGRU网络由两个方向相反的单向GRU构成，正向GRU从序列的首部开始向序列尾部移动，反向GRU从序列的尾部开始向序列首部移动。一个GRU单元由重置门r_t和更新门z_t组成，正向输出是由当前输入x_t和前一时刻的状态/>决定，反向输出/>是由当前输入x_t和前一时刻的状态/>决定。

正向GRU模型结构图如图2所示，正向GRU的计算公式如下：

正向GRU只能记录过去的信息，而BIGRU除了能够保留过去的信息，还能保留未来的信息，并将两种信息结合，使得模型可以从时间序列中学习到更高级的特征，BIGRU模型结构图如图3所示，所述BiGRU计算公式如下：

其中，为正向GRU的隐藏输出状态，/>为反向GRU的隐藏输出状态，h_t为t时刻的整体隐藏输出状态。

结合所述提取到的特征的过程如下：

d_t＝concat(g_t,h_t)

所述输入注意力机制层过程包括：对上一个输出的特征d_t进行分配权重求和计算，得到特征向量c，公式如下：

其中a_t为注意力权重，k是指预测下一个所给定输入数据的个数，s_t是指特征d_t的影响程度，为特征d_t的权重矩阵，b_s为其偏移矩阵。

所述LOSS函数为均方误差MSE，公式如下：

所述计算预测结果和实际值的误差的过程中使用误差函数，所述误差函数是均方根误差RMSE和平均绝对误差MAE，具体计算公式如下：

所述计算所述测试集的预测结果，得到预测的船舶经纬度的过程包括：将所述预测结果通过反最大最小值归一化，通过墨卡托投影逆解算公式计算出预测的传播经纬度。

实施例3

与其他实施例基于相同的发明构思，本实施例介绍一种基于注意力机制的CNN-BiGRU的船舶轨迹预测装置，包括：

将所述进一步特征输入全连接层，得到预测结果；

计算所述测试集的预测结果，得到预测的船舶经纬度。

实施例4

图6到图10均为本发明方法进行的仿真，设置船舶轨迹预测模型，实验模型参数设置如下：数据集迭代次数为60轮，训练集中一组样本个数为5。每次输入一组数据进行训练学习，每100次在验证集中的随机9组数据进行验证。为了模型更好的适用于验证集和测试集，将实验各模型中的dropout参数设置为0.5，抛弃部分的数据特征。采用基于梯度下降算法的自适应矩阵估计优化器Adam，并设置学习率为0.001来优化权重矩阵。

对比图8和图9，可以看出CNN-BiGRU-Attention模型的均方根误差RMSE和平均绝对误差MAE最低，即误差最低，测量精度最高。

如图10所示，五角星表示船舶实际经纬度，三角表示模型演算得到的预测经纬度，将预测的船舶经纬度与实际的船舶经纬度对比，发现两者之间的误差小，这说明基于注意力机制的CNN-BiGRU模型的预测效果较好，具有较高的可靠性。

在本次实施例中，使用基于注意力机制的CNN-BiGRU模型实现了对船舶轨迹的预测，验证了模型的准确性与可靠性。

综上实施例，本发明能有效提高船舶轨迹预测的精确度，且预测时间很短，具有一定的泛化能力。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本发明的保护之内。

Claims

1.一种基于注意力机制的CNN-BiGRU的船舶轨迹预测方法，其特征在于，包括：

划分所述进行过预处理的特定数据为训练集和测试集；

获取基于注意力机制的CNN-BiGRU的船舶轨迹预测模型；

将所述进一步特征输入全连接层，得到预测结果；

计算所述测试集的预测结果，得到预测的船舶经纬度。

2.根据权利要求1所述的基于注意力机制的CNN-BiGRU的船舶轨迹预测方法，其特征在于，所述特定数据包括时间、纬度、经度、对地航向和对地速度；

3.根据权利要求1所述的基于注意力机制的CNN-BiGRU的船舶轨迹预测方法，其特征在于，所述通过卷积神经网络CNN对训练集进行特征提取的过程包括：

4.根据权利要求1所述的基于注意力机制的CNN-BiGRU的船舶轨迹预测方法，其特征在于，所述BiGRU网络由两个方向相反的GRU构成，正向GRU的计算公式如下：

所述BiGRU计算公式如下：

5.根据权利要求1所述的基于注意力机制的CNN-BiGRU的船舶轨迹预测方法，其特征在于，结合所述提取到的特征的过程如下：

d_t＝concat(g_t,h_t)

6.根据权利要求1所述的基于注意力机制的CNN-BiGRU的船舶轨迹预测方法，其特征在于，所述输入注意力机制层过程包括：对上一个输出的特征d_t进行分配权重求和计算，得到特征向量c，公式如下：

7.根据权利要求1所述的基于注意力机制的CNN-BiGRU的船舶轨迹预测方法，其特征在于，所述LOSS函数为均方误差MSE，公式如下：

8.根据权利要求1所述的基于注意力机制的CNN-BiGRU的船舶轨迹预测方法，其特征在于，所述计算预测结果和实际值的误差的过程中使用误差函数，所述误差函数是均方根误差RMSE和平均绝对误差MAE，具体计算公式如下：

9.根据权利要求1所述的基于注意力机制的CNN-BiGRU的船舶轨迹预测方法，其特征在于，所述计算所述测试集的预测结果，得到预测的船舶经纬度的过程包括：将所述预测结果通过反最大最小值归一化，通过墨卡托投影逆解算公式计算出预测的传播经纬度。

10.一种基于注意力机制的CNN-BiGRU的船舶轨迹预测装置，其特征在于，包括：

将所述进一步特征输入全连接层，得到预测结果；

计算所述测试集的预测结果，得到预测的船舶经纬度。