CN117743487A - 一种rf和lstm组合的船舶轨迹预测模型 - Google Patents
一种rf和lstm组合的船舶轨迹预测模型 Download PDFInfo
- Publication number
- CN117743487A CN117743487A CN202311607743.0A CN202311607743A CN117743487A CN 117743487 A CN117743487 A CN 117743487A CN 202311607743 A CN202311607743 A CN 202311607743A CN 117743487 A CN117743487 A CN 117743487A
- Authority
- CN
- China
- Prior art keywords
- track
- ship
- point
- speed
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000007637 random forest analysis Methods 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 22
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000006399 behavior Effects 0.000 claims description 10
- 230000002457 bidirectional effect Effects 0.000 claims description 9
- 238000003066 decision tree Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 230000003068 static effect Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 6
- 230000007787 long-term memory Effects 0.000 claims description 5
- 230000006403 short-term memory Effects 0.000 claims description 5
- 238000003064 k means clustering Methods 0.000 claims description 4
- 230000015654 memory Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000007621 cluster analysis Methods 0.000 abstract description 2
- 238000000354 decomposition reaction Methods 0.000 abstract description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种RF和LSTM组合的船舶轨迹预测模型,首先通过选择并处理历史AIS数据,去除速度异常点、轨迹异常点,并通过速度分解和线性插值的方式填补缺失值,得到比较完整的轨迹。通过对每一条船舶的多段轨迹进行聚类分析,得到每条船舶常用的轨迹段,删除异常的轨迹段,作为对船舶行为的解析。在此基础上,以船舶的常用轨迹段构建了RF和LSTM相结合的轨迹预测模型,该模型能够实现中长期的船舶轨迹预测,为海上执法和交通安全提供技术支撑,为船舶轨迹预测提供参考。
Description
技术领域
本发明涉及船舶行为识别与轨迹预测领域,具体涉及一种RF和LSTM组合的船舶轨迹预测模型。
背景技术
在世界经济全球化的环境下,航运成为国际贸易最主要的运输形式之一,国际航运业承担着约90%的世界贸易量。随着世界经济的飞速发展,航运业呈现出巨大变化,船舶的数量、种类不断增长,新的航线不断涌现,应运产生了许多热点水域。船舶数量及航运线路的增多虽然使航运贸易越来越繁荣,但同样会使热点水域的航道拥挤,负载增大。相应由于船舶自身问题以及人为因素也会导致事故增多,严重威胁着船舶人员的生命和财产安全。同时,违法捕鱼、违法走私等行为也会给船舶监管带来一列困难。因此,通过历史船舶的航行轨迹数据来预测未来的船舶轨迹,成为确保水域内船舶安全航行的关键。
轨迹预测是指根据移动对象当前的轨迹预测出该对象未来的移动轨迹,船舶轨迹预测模型是对船舶在未来一段时间内可能出现的位置信息进行预测。船舶在航行中会受到风、浪、极端天气等外部环境的干扰,呈现出不确定性的无规律变化,难以用一个专业的数学模型去进行合理的解释。
随着AIS(Automatic Identification System)系统的推广与普及,大量船舶航行相关动、静态信息可获得性提高,可采集到的AIS数据更加丰富,为船舶轨迹预测提供了条件基础。大量的动静态数据为船舶的行为信息挖掘提供了可能,同时依据这些典型的与时间序列相关的数据可以从数据的角度出发实时对船舶轨迹进行预测。目前已有许多针对船舶轨迹的研究,产生了多样的轨迹预测方法,包括高斯混合模型、最小二乘法、灰色预测、神经网络、卡尔曼滤波、人工神经网络、循环神经网络、长短期记忆网络等。然而,目前对于船舶的行为识别与轨迹预测两种任务的研究都是独立进行的,这显然与实际生产情况不符。考虑到船舶的行为和轨迹是具有相关性的任务,因此需要一种方法来解决上述问题。
发明内容
本发明的目的是提出一种船舶轨迹预测模型,该模型能够先对船舶的行为进行识别,然后对船舶的未来轨迹进行实时预测,对船舶的水上交通安全提供决策依据和技术支撑。
本发明的一种RF和LSTM组合的船舶轨迹预测模型是采用如下技术方案实现的:
步骤一、选择并处理历史AIS数据;
步骤二、通过历史AIS数据将船舶轨迹划分为不同类别;
步骤三、建立随机森林(RF)和长短期记忆网络(LSTM)组合的船舶轨迹预测模型对轨迹进行实时预测。
优选的,所述步骤一具体包括以下流程:
(1)准备历史AIS数据:AIS数据包括船舶的动态信息和静态信息,静态信息包括船名、mmsi号、船长、船宽、船舶类型、最大吃水深度;动态信息包括经度、纬度、对地航速、对地航向;
(2)筛选相关的变量:选择的变量为mmsi号、经度、纬度、对地航向、对地航速;
(3)依据mmsi号和时间为标准,删除mmsi号和时间均相同的数据;
(4)删除速度为0的停泊点;
(5)对于每一个mmsi号,如果船舶处于航行状态且轨迹点连续,则认为是同一条轨迹;若船舶轨迹点数据少于十个,则去掉该条轨迹;若时间间隔一小时及以上,则认为是两段轨迹;
(6)对于每一段轨迹,删除速度异常点,具体方式如下:
(6.1)依据船舶所在海域,结合该海域内同种类型船舶的速度分布确定阈值,删除速度过高的点;
(6.2)通过相邻两点之间的经纬度计算两点之间的速度,若计算出来的速度与AIS对地航速差异在30%以上,则视为速度异常点并进行删除;
(6.3)如果删除速度异常点后某段轨迹点少于十个,则删除该段轨迹;
(7)删除轨迹异常点,是利用DBSCAN算法识别离群的噪声点并进行删除,DBSCAN算法删除轨迹异常点的具体方式如下:
(7.1)依次输入每一段轨迹点;
(7.2)设定邻域半径r和样本数阈值M;
(7.3)初始化轨迹点集合;
(7.4)迭代每一个样本,以r为半径画邻域,判断邻域内样本数是否大于M,如果是则为核心点,否则为异常点;
(7.5)删除所有异常点;
(8)缺失数据的处理:计算相邻两点之间的时间间隔和距离间隔,通过距离/时间计算出一个平均速度,将速度按经纬度方向分解为经向分速度Vlon和纬向分速度Vlat,通过线性插值的方式对缺失点进行修复;
(9)通过上述步骤将历史AIS数据处理为一段一段的轨迹数据。
优选的,所述步骤二具体包括以下流程:
(1)对于每一条船舶,以一段轨迹为最小单位,建立各个轨迹段的双向豪斯多夫距离矩阵,矩阵的具体建立过程如下:
(1.1)假设两组轨迹点集分别为A={a1,a2,a3,…an}和B={b1,b2,b3,…bn},其中a1代表轨迹点集A中的一个点位,a1={经度Lona1、纬度Lata1、对地航向COGa1和对地航速SOGa1};b1代表轨迹点集B中的一个点位,b1={经度Lonb1、纬度Latb1、对地航向COGb1和对地航速SOGb1};
两组轨迹点集则存在两个单向豪斯多夫距离,点集A到点集B的单向豪斯多夫距离h(A,B)为:
点集B到点集A的单向豪斯多夫距离h(B,A)为:
式中,以d(ai,bj)的值代表点集A中的点位ai和点集B中的点位bj之间的距离,d(ai,bj)的计算公式为:
以d(bi,aj)的值代表点集B中的点位bi和点集A中的点位aj之间的距离,d(bi,aj)的计算公式为:
其中w1、w2和w3代表不同的权重值,且w1+w2+w3=1;
则点集A和点集B的双向豪斯多夫距离H(A,B)为:
H(A,B)=max{h(A,B),h(B,A)}
(1.2)在建立双向豪斯多夫距离矩阵时,选取的变量为经度、纬度、对地航向和对地航速;将经度、纬度的权重设置为0.8;对地航向、对地航速的权重分别设置为0.1;
(2)对于每一段轨迹,依据豪斯多夫距离矩阵对不同的轨迹段进行k-means聚类,具体聚类过程如下:
(2.1)将步骤一处理好的轨迹数据作为样本集;
(2.2)从样本集中随机选择k个点作为初始中心点;
(2.3)迭代每一个样本,计算其与每个中心点的距离,距离为上述过程中的双向豪斯多夫距离;
(2.4)将样本分配到最近的中心点中作为簇;
(2.5)对于每个簇,计算簇中所有样本的中心点,并将该中心点作为新的聚类中心点;
(2.6)重复2.3~2.5步,直至中心点不再发生显著变化;
(3)结合聚类的结果和实际船舶的港口信息,确定常用的轨迹,删除异常轨迹,完成对船舶的行为分析。
优选的,所述步骤三具体包括以下流程:
(1)将步骤二处理好的数据划分为训练集、测试集和验证集,比例为8∶1∶1;
(2)将训练集进行归一化处理,归一化的公式为:式中x*代表归一化后的结果,x为真实值,xmax为真实值集合中的最大值,xmin为真实值集合中的最小值;
(3)利用训练集构建RF模型,模型的输入量分别为mmsi号、经度、纬度、对地航向和对地航速,模型的输出量为下一时刻点的经度、纬度;RF模型的算法流程如下:
(3.1)假设有N个样本,从中随机选择n(n<N)个样本作为一个训练集,放回并重复m次;
(3.2)在得到的m个训练集上均使用决策树算法进行训练,从所有输入量中随机选择c个(c小于输入量个数)特征子集,在每个子集上进行决策树节点的分割选择;
(3.3)最终得到m棵决策树,并通过投票策略集成得到最后结果;
(4)利用训练集构建LSTM模型,模型的输入量分别为mmsi号、经度、纬度、对地航向和对地航速,模型的输出量为下一时刻点的经度、纬度;
LSTM模型的算法流程如下:
(4.1)计算遗忘门ft:遗忘门ft是以上一时刻的输出ht-1和现在时刻的输入xt为输入,计算公式为ft=σ(Wf*(ht-1,xt)+bf),式中Wf是遗忘门的权重矩阵,(ht-1,xt)是把上一时刻的输出和现在时刻的输入进行连接,bf是遗忘门的偏执项,σ是sigmod函数;Wf为0-1之间的随机初始值,bf的初始值为0;
(4.2)计算输入门it:输入门it和一个tanh函数配合控制有哪些新信息加入,计算公式为it=σ(Wi*(ht-1,xt)+bi),式中Wi是输入门的权重矩阵,bi是输入门的偏执项;Wi为0-1之间的随机初始值,bi的初始值为0;
(4.3)计算输出门St:计算公式为St=σ(Ws*(ht-1,xt)+bs),式中Ws是输入门的权重矩阵,bs是输入门的偏执项;Ws为0-1之间的随机初始值,bs的初始值为0;
(5)将RF模型和LSTM模型的结果进行线性加权集成,得到集成后的结果;若L、F、X、T分别代表模型数量、预测值、真实值和样本数量,对于RF模型和LSTM模型来说,计算每一个样本的预测值与真实值的误差,将所有样本误差的平方和的倒数作为分子,所有模型的误差平方和的倒数的和作为分母,计算得到权重wi,具体公式为:
式中,Fit代表第i个模型的第t个预测值,Xit代表第i个模型的第t个真实值;
(6)将集成后的结果作为输入,得到下一个时刻的输出结果;重复上述步骤,得到多个时刻的点位;
(7)将得到的点位进行反归一化处理,得到实际的经纬度点,形成最终轨迹;反归一化公式为:x=x*(xmax-xmin)+xmin。
与现有技术相比,本发明的有益效果是:
本发明基于历史AIS数据,通过对AIS数据的预处理工作,去除速度异常点、轨迹异常点,并通过速度分解和线性插值的方式填补缺失值,得到比较完整的轨迹。通过对每一条船舶的多段轨迹进行聚类分析,得到每条船舶常用的轨迹段,删除异常的轨迹段,作为对船舶行为的解析。在此基础上,以船舶的常用轨迹段划分训练集、测试集和验证集构建了随机森林和长短期记忆网络相结合的轨迹预测模型,该模型能够实现中长期的船舶轨迹预测,为海上执法和交通安全提供技术支撑,为船舶轨迹预测提供参考。
附图说明
图1为本发明RF和LSTM组合的船舶轨迹预测模型的整体流程图;
图2为本发明RF和LSTM组合的船舶轨迹预测模型DBSCAN算法识别轨迹异常点的示意图;
图3为本发明RF和LSTM组合的船舶轨迹预测模型k-means聚类流程图。
具体实施方式
下面结合附图,对本发明的技术方案做进一步的详细说明。
图1是本发明一种RF和LSTM组合的船舶轨迹预测模型的整体流程图,具体步骤包括:
步骤一:选择并处理历史AIS数据,具体包括以下流程:
(1)准备历史AIS数据:AIS数据包括船舶的动态信息和静态信息,静态信息包括船名、mmsi号、船长、船宽、船舶类型、最大吃水深度;动态信息包括经度、纬度、对地航速、对地航向;
(2)筛选相关的变量:选择的变量为mmsi号、经度、纬度、对地航向、对地航速;
(3)依据mmsi号和时间为标准,删除mmsi号和时间均相同的数据;
(4)删除速度为0的停泊点;
(5)对于每一个mmsi号,如果船舶处于航行状态且轨迹点连续,则认为是同一条轨迹;若船舶轨迹点数据少于十个,则去掉该条轨迹;若时间间隔一小时及以上,则认为是两段轨迹;
(6)对于每一段轨迹,删除速度异常点,具体方式如下:
(6.1)依据船舶所在海域,结合该海域内同种类型船舶的速度分布确定阈值,删除速度过高的点;
(6.2)通过相邻两点之间的经纬度计算两点之间的速度,若计算出来的速度与AIS对地航速差异在30%以上,则视为速度异常点并进行删除;
(6.3)如果删除速度异常点后某段轨迹点少于十个,则删除该段轨迹;
(7)删除轨迹异常点,是利用DBSCAN算法识别离群的噪声点并进行删除,DBSCAN算法删除轨迹异常点的示意图如图2所示,具体方式如下:
(7.1)依次输入每一段轨迹点;
(7.2)设定邻域半径r和样本数阈值M;
(7.3)初始化轨迹点集合;
(7.4)迭代每一个样本,以r为半径画邻域,判断邻域内样本数是否大于M,如果是则为核心点,否则为异常点;
(7.5)删除所有异常点;
(8)缺失数据的处理:计算相邻两点之间的时间间隔和距离间隔,通过距离/时间计算出一个平均速度,将速度按经纬度方向分解为经向分速度Vlon和纬向分速度Vlat,通过线性插值的方式对缺失点进行修复;
(9)通过上述步骤将历史AIS数据处理为一段一段的轨迹数据。
步骤二:通过历史AIS数据将船舶轨迹划分为不同类别,具体包括以下流程:
(1)对于每一条船舶,以一段轨迹为最小单位,建立各个轨迹段的双向豪斯多夫距离矩阵,矩阵的具体建立过程如下:
(1.1)假设两组轨迹点集分别为A={a1,a2,a3,…an}和B={b1,b2,b3,…bn},其中a1代表轨迹点集A中的一个点位,a1={经度Lona1、纬度Lata1、对地航向COGa1和对地航速SOGa1};b1代表轨迹点集B中的一个点位,b1={经度Lonb1、纬度Latb1、对地航向COGb1和对地航速SOGb1};
两组轨迹点集则存在两个单向豪斯多夫距离,点集A到点集B的单向豪斯多夫距离h(A,B)为:
点集B到点集A的单向豪斯多夫距离h(B,A)为:
式中,以d(ai,bj)的值代表点集A中的点位ai和点集B中的点位bj之间的距离,d(ai,bj)的计算公式为:
以d(bi,aj)的值代表点集B中的点位bi和点集A中的点位aj之间的距离,d(bi,aj)的计算公式为:
其中wi、w2和w3代表不同的权重值,且w1+w2+w3=1;
则点集A和点集B的双向豪斯多夫距离H(A,B)为:
H(A,B)=max{h(A,B),h(B,A)}
(1.2)在建立双向豪斯多夫距离矩阵时,选取的变量为经度、纬度、对地航向和对地航速;将经度、纬度的权重设置为0.8;对地航向、对地航速的权重分别设置为0.1;
(2)对于每一段轨迹,依据豪斯多夫距离矩阵对不同的轨迹段进行k-means聚类,聚类如图3所示,具体聚类过程如下:
(2.1)将步骤一处理好的轨迹数据作为样本集;
(2.2)从样本集中随机选择k个点作为初始中心点;
(2.3)迭代每一个样本,计算其与每个中心点的距离,距离为上述过程中的双向豪斯多夫距离;
(2.4)将样本分配到最近的中心点中作为簇;
(2.5)对于每个簇,计算簇中所有样本的中心点,并将该中心点作为新的聚类中心点;
(2.6)重复2.3~2.5步,直至中心点不再发生显著变化;
(3)结合聚类的结果和实际船舶的港口信息,确定常用的轨迹,删除异常轨迹,完成对船舶的行为分析。
步骤三:建立随机森林(RF)和长短期记忆网络(LSTM)组合的船舶轨迹预测模型对轨迹进行实时预测,具体包括以下流程:
(1)将步骤二处理好的数据划分为训练集、测试集和验证集,比例为8∶1∶1;
(2)将训练集进行归一化处理,归一化的公式为:式中x*代表归一化后的结果,x为真实值,xmax为真实值集合中的最大值,xmin为真实值集合中的最小值;
(3)利用训练集构建RF模型,模型的输入量分别为mmsi号、经度、纬度、对地航向和对地航速,模型的输出量为下一时刻点的经度、纬度;RF模型的算法流程如下:
(3.1)假设有N个样本,从中随机选择n(n<N)个样本作为一个训练集,放回并重复m次;
(3.2)在得到的m个训练集上均使用决策树算法进行训练,从所有输入量中随机选择c个(c小于输入量个数)特征子集,在每个子集上进行决策树节点的分割选择;
(3.3)最终得到m棵决策树,并通过投票策略集成得到最后结果;
(4)利用训练集构建LSTM模型,模型的输入量分别为mmsi号、经度、纬度、对地航向和对地航速,模型的输出量为下一时刻点的经度、纬度;
LSTM模型的算法流程如下:
(4.1)计算遗忘门ft:遗忘门ft是以上一时刻的输出ht-1和现在时刻的输入xt为输入,计算公式为ft=σ(Wf*(ht-1,xt)+bf),式中Wf是遗忘门的权重矩阵,(ht-1,xt)是把上一时刻的输出和现在时刻的输入进行连接,bf是遗忘门的偏执项,σ是sigmod函数;Wf为0-1之间的随机初始值,bf的初始值为0;
(4.2)计算输入门it:输入门it和一个tanh函数配合控制有哪些新信息加入,计算公式为it=σ(Wi*(ht-1,xt)+bi),式中Wi是输入门的权重矩阵,bi是输入门的偏执项;Wi为0-1之间的随机初始值,bi的初始值为0;
(4.3)计算输出门St:计算公式为St=σ(Ws*(ht-1,xt)+bs),式中Ws是输入门的权重矩阵,bs是输入门的偏执项;Ws为0-1之间的随机初始值,bs的初始值为0;
(5)将RF模型和LSTM模型的结果进行线性加权集成,得到集成后的结果;若L、F、X、T分别代表模型数量、预测值、真实值和样本数量,对于RF模型和LSTM模型来说,计算每一个样本的预测值与真实值的误差,将所有样本误差的平方和的倒数作为分子,所有模型的误差平方和的倒数的和作为分母,计算得到权重wi,具体公式为:
式中,Fit代表第i个模型的第t个预测值,Xit代表第i个模型的第t个真实值;
(6)将集成后的结果作为输入,得到下一个时刻的输出结果;重复上述步骤,得到多个时刻的点位;
(7)将得到的点位进行反归一化处理,得到实际的经纬度点,形成最终轨迹;反归一化公式为:x=x*(xmax-xmin)+xmin。
选择绝对平均误差(MAE)和均方根误差(RMSE)作为评价指标,建立多模型对比。两个评价指标的数值越小,代表模型的误差越小,船舶轨迹预测的精度越高,结果如下:
MAE和RMSE的计算公式如下:
式中,M代表样本个数,yi为真实值,y′i为预测值。
以上所述仅是本发明的优选实施方式,并非是对本发明的限制。对于本技术领域的普通技术人员,在不脱离本发明技术原理的前提下,还可以对本发明做出若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (4)
1.一种RF和LSTM组合的船舶轨迹预测模型,其特征在于,包括以下步骤:
步骤一、选择并处理历史AIS数据;
步骤二、通过历史AIS数据将船舶轨迹划分为不同类别;
步骤三、建立随机森林和长短期记忆网络组合的船舶轨迹预测模型对轨迹进行实时预测。
2.如权利要求1所述的一种RF和LSTM组合的船舶轨迹预测模型,其特征在于,所述步骤一具体包括以下流程:
(1)准备历史AIS数据:AIS数据包括船舶的动态信息和静态信息,静态信息包括船名、mmsi号、船长、船宽、船舶类型、最大吃水深度;动态信息包括经度、纬度、对地航速、对地航向;
(2)筛选相关的变量:选择的变量为mmsi号、经度、纬度、对地航向、对地航速;
(3)依据mmsi号和时间为标准,删除mmsi号和时间均相同的数据;
(4)删除速度为0的停泊点;
(5)对于每一个mmsi号,如果船舶处于航行状态且轨迹点连续,则认为是同一条轨迹;若船舶轨迹点数据少于十个,则去掉该条轨迹;若时间间隔一小时及以上,则认为是两段轨迹;
(6)对于每一段轨迹,删除速度异常点,具体方式如下:
(6.1)依据船舶所在海域,结合该海域内同种类型船舶的速度分布确定阈值,删除速度过高的点;
(6.2)通过相邻两点之间的经纬度计算两点之间的速度,若计算出来的速度与AIS对地航速差异在30%以上,则视为速度异常点并进行删除;
(6.3)如果删除速度异常点后某段轨迹点少于十个,则删除该段轨迹;
(7)删除轨迹异常点,是利用DBSCAN算法识别离群的噪声点并进行删除,DBSCAN算法删除轨迹异常点的具体方式如下:
(7.1)依次输入每一段轨迹点;
(7.2)设定邻域半径r和样本数阈值M;
(7.3)初始化轨迹点集合;
(7.4)迭代每一个样本,以r为半径画邻域,判断邻域内样本数是否大于M,如果是则为核心点,否则为异常点;
(7.5)删除所有异常点;
(8)缺失数据的处理:计算相邻两点之间的时间间隔和距离间隔,通过距离/时间计算出一个平均速度,将速度按经纬度方向分解为经向分速度Vlon和纬向分速度Vlat,通过线性插值的方式对缺失点进行修复;
(9)通过上述步骤将历史AIS数据处理为一段一段的轨迹数据。
3.如权利要求1所述的一种RF和LSTM组合的船舶轨迹预测模型,其特征在于,所述步骤二具体包括以下流程:
(1)对于每一条船舶,以一段轨迹为最小单位,建立各个轨迹段的双向豪斯多夫距离矩阵,矩阵的具体建立过程如下:
(1.1)假设两组轨迹点集分别为A={a1,a2,a3,…an}和B={b1,b2,b3,…bn},其中a1代表轨迹点集A中的一个点位,a1={经度Lona1、纬度Lata1、对地航向COGa1和对地航速SOGa1};b1代表轨迹点集B中的一个点位,b1={经度Lonb1、纬度Latb1、对地航向COGb1和对地航速COGb1};
两组轨迹点集则存在两个单向豪斯多夫距离,点集A到点集B的单向豪斯多夫距离h(A,B)为:
点集B到点集A的单向豪斯多夫距离h(B,A)为:
其中,以d(ai,bj)的值代表点集A中的点位ai和点集B中的点位bj之间的距离,d(ai,bj)的计算公式为:
以d(bi,aj)的值代表点集B中的点位bi和点集A中的点位aj之间的距离,d(bi,aj)的计算公式为:
其中w1、w2和w3代表不同的权重值,且w1+w2+w3=1;
则点集A和点集B的双向豪斯多夫距离H(A,B)为:
H(A,B)=max{h(A,B),h(B,A)}
(1.2)在建立双向豪斯多夫距离矩阵时,选取的变量为经度、纬度、对地航向和对地航速;将经度、纬度的权重设置为0.8;对地航向、对地航速的权重分别设置为0.1;
(2)对于每一段轨迹,依据豪斯多夫距离矩阵对不同的轨迹段进行k-means聚类,具体聚类过程如下:
(2.1)将步骤一处理好的轨迹数据作为样本集;
(2.2)从样本集中随机选择k个点作为初始中心点;
(2.3)迭代每一个样本,计算其与每个中心点的距离,距离为上述过程中的双向豪斯多夫距离;
(2.4)将样本分配到最近的中心点中作为簇;
(2.5)对于每个簇,计算簇中所有样本的中心点,并将该中心点作为新的聚类中心点;
(2.6)重复2.3~2.5步,直至中心点不再发生显著变化;
(3)结合聚类的结果和实际船舶的港口信息,确定常用的轨迹,删除异常轨迹,完成对船舶的行为分析。
4.如权利要求1所述的一种RF和LSTM组合的船舶轨迹预测模型,其特征在于,所述步骤三具体包括以下流程:
(1)将步骤二处理好的数据划分为训练集、测试集和验证集,比例为8:1:1;
(2)将训练集进行归一化处理,归一化的公式为:式中x*代表归一化后的结果,x为真实值,xmax为真实值集合中的最大值,xmin为真实值集合中的最小值;
(3)利用训练集构建随机森林模型,模型的输入量分别为mmsi号、经度、纬度、对地航向和对地航速,模型的输出量为下一时刻点的经度、纬度;随机森林模型的算法流程如下:
(3.1)假设有N个样本,从中随机选择n(n<N)个样本作为一个训练集,放回并重复m次;
(3.2)在得到的m个训练集上均使用决策树算法进行训练,从所有输入量中随机选择c个(c小于输入量个数)特征子集,在每个子集上进行决策树节点的分割选择;
(3.3)最终得到m棵决策树,并通过投票策略集成得到最后结果;
(4)利用训练集构建长短期记忆网络模型,模型的输入量分别为mmsi号、经度、纬度、对地航向和对地航速,模型的输出量为下一时刻点的经度、纬度;长短期记忆网络模型的算法流程如下:
(4.1)计算遗忘门ft:遗忘门ft是以上一时刻的输出ht-1和现在时刻的输入xt为输入,计算公式为ft=σ(Wf*(ht-1,xt)+bf),式中Wf是遗忘门的权重矩阵,(ht-1,xt)是把上一时刻的输出和现在时刻的输入进行连接,bf是遗忘门的偏执项,σ是sigmod函数;Wf为0-1之间的随机初始值,bf的初始值为0;
(4.2)计算输入门it:输入门it和一个tanh函数配合控制有哪些新信息加入,计算公式为it=σ(Wi*(ht-1,xt)+bi),式中Wi是输入门的权重矩阵,bi是输入门的偏执项;Wi为0-1之间的随机初始值,bi的初始值为0;
(4.3)计算输出门St:计算公式为St=σ(Ws*(ht-1,xt)+bs),式中Ws是输入门的权重矩阵,bs是输入门的偏执项;Ws为0-1之间的随机初始值,bs的初始值为0;
(5)将随机森林模型和长短期记忆网络模型的结果进行线性加权集成,得到集成后的结果;若L、F、X、T分别代表模型数量、预测值、真实值和样本数量,对于随机森林模型和长短期记忆网络模型来说,计算每一个样本的预测值与真实值的误差,将所有样本误差的平方和的倒数作为分子,所有模型的误差平方和的倒数的和作为分母,计算得到权重wi,具体公式为:
式中,Fit代表第i个模型的第t个预测值,Xit代表第i个模型的第t个真实值;
(6)将集成后的结果作为输入,得到下一个时刻的输出结果;重复上述步骤,得到多个时刻的点位;
(7)将得到的点位进行反归一化处理,得到实际的经纬度点,形成最终轨迹;反归一化公式为:x=x*(xmax-xmin)+xmin。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311607743.0A CN117743487A (zh) | 2023-11-29 | 2023-11-29 | 一种rf和lstm组合的船舶轨迹预测模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311607743.0A CN117743487A (zh) | 2023-11-29 | 2023-11-29 | 一种rf和lstm组合的船舶轨迹预测模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117743487A true CN117743487A (zh) | 2024-03-22 |
Family
ID=90257032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311607743.0A Pending CN117743487A (zh) | 2023-11-29 | 2023-11-29 | 一种rf和lstm组合的船舶轨迹预测模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117743487A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118551288A (zh) * | 2024-07-24 | 2024-08-27 | 中国人民解放军国防科技大学 | 一种航迹识别模型构建方法及异常船舶轨迹匹配方法 |
-
2023
- 2023-11-29 CN CN202311607743.0A patent/CN117743487A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118551288A (zh) * | 2024-07-24 | 2024-08-27 | 中国人民解放军国防科技大学 | 一种航迹识别模型构建方法及异常船舶轨迹匹配方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110046743B (zh) | 基于ga-ann的公共建筑能耗预测方法和系统 | |
CN112819207B (zh) | 基于相似性度量的地质灾害空间预测方法、系统及存储介质 | |
CN111081016B (zh) | 一种基于复杂网络理论的城市交通异常识别方法 | |
US12067467B2 (en) | Explainable and automated decisions in computer-based reasoning systems | |
CN111882869B (zh) | 一种考虑不良天气的深度学习交通流预测方法 | |
CN117743487A (zh) | 一种rf和lstm组合的船舶轨迹预测模型 | |
CN115081592B (zh) | 基于遗传算法和前馈神经网络的公路低能见度预估方法 | |
CN110738355A (zh) | 一种基于神经网络的城市内涝预测方法 | |
CN111723523B (zh) | 一种基于级联神经网络的河口余水位预测方法 | |
CN110737267A (zh) | 一种无人船多目标优化方法及无人船智能综合管控系统 | |
CN113887789B (zh) | 一种基于循环神经网络的改进船舶轨迹预测方法及其装置 | |
CN113283653B (zh) | 一种基于机器学习和ais数据的船舶轨迹预测方法 | |
CN115050214B (zh) | 一种基于ais数据的船舶碰撞风险预测方法 | |
CN115512152B (zh) | 一种cnn和lstm神经网络组合的船舶轨迹分类方法及系统 | |
Safar et al. | Rain prediction using fuzzy rule based system in North-West Malaysia | |
Li et al. | Leveraging LSTM for rapid intensifications prediction of tropical cyclones | |
CN114331042B (zh) | 一种船舶碰撞风险分析方法 | |
CN112766308A (zh) | 一种远洋船舶分类方法 | |
CN115877483A (zh) | 一种基于随机森林和gru的台风路径预报方法 | |
Qin et al. | Trajectory prediction based on long short-term memory network and Kalman filter using hurricanes as an example | |
CN113128769A (zh) | 基于深度学习的智能航班延误预测方法 | |
CN117312891A (zh) | 一种基于船舶数据的轨迹预测方法 | |
CN110766140A (zh) | 一种基于XGBoost与LSTM的多传感器实时威胁等级分类方法 | |
CN114595770B (zh) | 一种船舶轨迹的长时序预测方法 | |
Iveta et al. | Prediction of traffic accidents severity based on machine learning and multiclass classification model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |