CN115512152A - 一种cnn和lstm神经网络组合的船舶轨迹分类方法及系统 - Google Patents

一种cnn和lstm神经网络组合的船舶轨迹分类方法及系统 Download PDF

Info

Publication number
CN115512152A
CN115512152A CN202211100665.0A CN202211100665A CN115512152A CN 115512152 A CN115512152 A CN 115512152A CN 202211100665 A CN202211100665 A CN 202211100665A CN 115512152 A CN115512152 A CN 115512152A
Authority
CN
China
Prior art keywords
track
motion
ship
cnn
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211100665.0A
Other languages
English (en)
Inventor
杨敏
张鹏鑫
李连营
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202211100665.0A priority Critical patent/CN115512152A/zh
Publication of CN115512152A publication Critical patent/CN115512152A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种CNN和LSTM神经网络组合的船舶轨迹分类方法及系统。首先,对原始轨迹数据进行清洗和预处理。其次,采用固定大小的滑动窗口沿轨迹序列依次计算船舶在每个轨迹点位置的运动属性,构建船舶的运动属性序列。最后,将船舶运动属性序列作为输入,利用CNN‑LSTM模型进行高层次运动行为特征提取与轨迹类型识别。本发明围绕船舶轨迹数据分类这一难点问题,针对CNN和LSTM两种不同类型神经网络分别在提取局部轨迹点高层次运动特征和不同时间段轨迹信息关联关系分析方面具有的优势,提出一种CNN‑LSTM组合的分类方法,从而挖掘时空轨迹数据中的船舶运动特征,实现提高船舶轨迹分类精度的目标。

Description

一种CNN和LSTM神经网络组合的船舶轨迹分类方法及系统
技术领域
本发明涉及地理信息技术领域,涉及一种时空轨迹数据的分类识别方法,尤其涉及一种AIS(Automatic Identification System)记录的船舶航行轨迹的分类识别方法。
背景技术
随着AIS(Automatic Identification System)相关设备在各类船舶不断普及应用,其记录的船舶轨迹信息成为重要的时空数据资源。这些轨迹数据蕴含丰富的船舶运动信息,相关的分析与挖掘工作对于海上交通管理、航行安全保护、海洋污染监测等具有重要意义。然而,这些分析挖掘工作需要相关的基础算法作为支撑。其中,轨迹数据的分类识别是基础算法之一。一个典型的场景是产生轨迹的船舶类型在原始收集的数据中可能缺失标记,这给利用轨迹数据开展船舶航行监管与异常行为发现带来困难。因此,需要研究专门的轨迹分类方法识别不同类型的船舶轨迹。
针对船舶轨迹的分类,目前采用的模型包括条件随机场、决策树、随机森林、K-近邻(KNN)、支持向量机等。然而,上述机器学习方法依赖人工定义特征作为模型的输入,分类结果容易受到主观因素的影响。同时,考虑到不同海域船舶航行规则与环境特点不同,往往需要不同的特征组合与参数设置,导致构建的分类模型在实际应用中难以推广。受深度学习技术在语音识别、文本翻译等领域取得巨大成功的启发,近些年来研究人员引入卷积神经网络(Convolutional Neural Network,CNN)、长短期记忆(Long Short-Term Memory,LSTM)神经网络等开展时空轨迹数据的研究。这些方法主要是用于轨迹位置预测,即利用船舶的历史的轨迹数据来预测船舶下一时刻的位置,属于回归问题。
因此,现在方法无法实现对船舶轨迹进行准确分类。
发明内容
本发明提供了一种CNN和LSTM神经网络组合的船舶轨迹分类方法及系统,用以解决或者至少部分解决现有技术中存在的船舶轨迹分类准确性不高的技术问题。
为了解决上述技术问题,本发明第一方面提供了一种CNN和LSTM神经网络组合的船舶轨迹分类方法,包括:
S1:对待分类原始轨迹数据进行数据清洗与预处理;
S2:将进行数据清洗与预处理后的轨迹数据用轨迹序列表示,并采用固定大小的滑动窗口沿轨迹序列依次计算每一轨迹点处船舶的运动属性,得到船舶沿轨迹线的运动属性子序列,其中,设置运动属性子序列为一个固定长度,运动属性包括运动速度、加速度和航向变化率;
S3:将得到的船舶沿轨迹线的运动属性子序列输入预先构建好的CNN-LSTM模型,CNN-LSTM模型包括运动特征提取模块、时序特征提取模块和轨迹类型预测模块,其中,运动特征提取模块通过多个不同的CNN分别对各个运动属性子序列进行运动特征的提取,时序特征提取模块采用LSTM模型,提取后的运动特征按时序输入LSTM模型,提取对应的时序特征,最后通过轨迹类型预测模块组合LSTM模型每一时刻的输出,得到轨迹预测类别结果。
在一种实施方式中,步骤S1包括:
S1.1:剔除待分类原始轨迹数据中缺失船舶经纬度坐标、时间信息的轨迹点;
S1.2:设定阈值Tseg,若相邻轨迹点时间间隔大于Tseg,则将轨迹序列在对应的轨迹点处进行分段处理;
S1.3:采用启发式的离群轨迹点的探测与剔除方法删除几何位置异常的轨迹点,具体包括:以当前轨迹点pa为圆心,作半径为Max_sp×Δt的圆形区域,其中,Max_sp表示船舶移动速度最大值,Δt表示pa和下一轨迹点pa+1的时间间隔,若轨迹点pa+1处于圆形区域外,则将pa+1识别为离群轨迹点并作剔除处理;
S1.4:采用分布密度和范围双重约束的停留点探测算法识别船舶停留轨迹点,具体包括:利用密度聚类算法将存在聚集现象的序列轨迹点聚类成簇,每一簇轨迹点作为停留点的潜在对象,然后计算每一簇轨迹点的几何中心与该簇时序起始轨迹点和终止轨迹点的距离,通过设置距离约束阈值R,排除由于低速行驶或者采样间隔过小而产生的点簇,最后,将保留的轨迹点簇标注为停留点,并在停留点区域对轨迹点序列进行分段处理。
在一种实施方式中,步骤S2采用固定大小的滑动窗口沿轨迹序列依次计算每一轨迹点处船舶的运动属性,包括:
计算每一轨迹点的速度和加速度:
Figure BDA0003838695020000021
Figure BDA0003838695020000022
其中,滑动窗口包含的轨迹点为pi+1,…,pi+m,m表示窗口大小,即包含的轨迹点数量,Dist(pi+1,pi+m)表示轨迹点pi+1和pi+m间的球面距离,Δti表示轨迹点pi+1和pi+m间的时间间隔,Δtu表示当前滑动窗口中心点pu和下一滑动窗口中心点pu+1间的时间间隔;
计算每一轨迹点的航向变化率:
Figure BDA0003838695020000031
其中,
Figure BDA0003838695020000032
Figure BDA0003838695020000033
分别为轨迹点pi+1和pi+m的经度和纬度坐标,Bearing(pu)为当前滑动窗口中心点pu的航向,即真北方向与向量
Figure BDA0003838695020000034
方向间的顺时针夹角,Bearing(pu+1)为pu+1的航向,tu为pu的时刻,tu+1为pu+1的时刻。
在一种实施方式中,运动特征提取模块的处理过程包括:
将运动属性子序列组织为多通道表达,每个通道表示一种运动属性,通道大小为1×Len/p,采用cout个大小为cinput×1×h的卷积核
Figure BDA0003838695020000035
对输入特征
Figure BDA0003838695020000036
进行卷积计算,使用零值填充和步幅为1来保持卷积运算后特征尺寸不变,并利用激活函数输出为新的特征,每个卷积核所产生的新特征yi的表达式为:
Figure BDA0003838695020000037
cout为卷积运算后输出的通道数,cinput为卷积输入的通道数,w1、w2
Figure BDA0003838695020000038
分别为第一个、第二个、第
Figure BDA0003838695020000039
个通道,h为卷积核的宽度,0≤i≤(Len/p),xi表示输入向量x第i位置上的值,f(·)表示非线性激活函数;b表示偏置向量;n表示当前通道数,通过一个卷积核计算后产生新的特征向量为Y={y1,y2,…,yLen/p};
利用池化运算获取粗粒度的主体特征,池化窗口内的特征Yk×s:k×s+l-1的最大值作为输出,表达式为:
Figure BDA00038386950200000310
其中,k表示池化窗口移动的次数,
Figure BDA00038386950200000311
floor(·)为向下取整函数;l和s分别表示窗口长度和移动步幅;
将池化运算提取的主体特征对应的向量展平为一维向量,并输入全连接层进行特征降维,降维后的特征向量作为后续时序特征提取模块的输入。
在一种实施方式中,时序特征提取模块的处理过程包括:
ft=σ(Wfggt+Wfhht-1+) (6)
it=σ(Wiggt+Wihht-1+bi) (7)
jt=tanh(Wiggt+Wjhht-1+bj) (8)
ct=ft⊙ct-1+it⊙jt (9)
ot=σ(Woggt+Wohht-1+bo) (10)
ht=ot⊙tanh(ct) (11)
其中,ft、it、jt、ot分别为t时刻遗忘门、输入门、更新门、输出门的输出值;gt为运动特征提取模块输出的t时刻的特征向量,ht-1为t-1时刻的隐藏状态,ct-1为t-1时刻的细胞状态,⊙表示点乘运算;Wfg、Wfh分别为遗忘门中与gt进行矩阵计算的权重矩阵、与ht-1进行矩阵计算的权重矩阵,bf为遗忘门的偏置向量,Wig、Wih分别为输入门中与gt进行矩阵计算的权重矩阵、与ht-1进行矩阵计算的权重矩阵,bi为输入门的偏置向量,Wjg、Wjh分别为更新门中与gt进行矩阵计算的权重矩阵、与ht-1进行矩阵计算的权重矩阵,bj为更新门的偏置向量,Wog、Woh分别为输出门中与gt进行矩阵计算的权重矩阵、与ht-1进行矩阵计算的权重矩阵,bo为输出门的偏置向量,σ和tanh分别表示Sigmoid激活函数和tanh激活函数,ht为t时刻的隐藏状态,即t时刻的输出。
在一种实施方式中,轨迹类型预测模块的处理过程包括:
将LSTM网络每个时间步输出的特征向量h1,h2,…,hp进行组合后输入多层感知机进行处理,输出长度为n′的一维数组,其中,n′等于船舶轨迹的类型数量,p为特征向量的总数;
对于每个输出值zi′使用Softmax函数进行激活处理,1≤i′≤n′,表达式为:
Figure BDA0003838695020000041
其中,Pi′为船舶轨迹属于第i’种类型的概率值,且
Figure BDA0003838695020000042
概率值最大的类型即为对应船舶轨迹的预测类别,b为从1到n′计数值。
基于同样的发明构思,本发明第二方面提供了一种CNN和LSTM神经网络组合的船舶轨迹分类系统,包括:
预处理模块,用于对待分类原始轨迹数据进行数据清洗与预处理;
子序列获取模块,用于将进行数据清洗与预处理后的轨迹数据用轨迹序列表示,并采用固定大小的滑动窗口沿轨迹序列依次计算每一轨迹点处船舶的运动属性,得到船舶沿轨迹线的运动属性子序列,其中,设置运动属性子序列为一个固定长度,运动属性包括运动速度、加速度和航向变化率;
轨迹分类模块,用于将得到的船舶沿轨迹线的运动属性子序列输入预先构建好的CNN-LSTM模型,CNN-LSTM模型包括运动特征提取模块、时序特征提取模块和轨迹类型预测模块,其中,运动特征提取模块通过多个不同的CNN分别对各个运动属性子序列进行运动特征的提取,时序特征提取模块采用LSTM模型,提取后的运动特征按时序输入LSTM模型,提取对应的时序特征,最后通过轨迹类型预测模块组合LSTM模型每一时刻的输出,得到轨迹预测类别结果。
本发明提供的一种CNN和LSTM神经网络组合的船舶轨迹分类方法,首先对待分类原始轨迹数据进行数据清洗与预处理,然后进行轨迹序列表示,并采用固定大小的滑动窗口沿轨迹序列依次计算每一轨迹点处船舶的运动属性,可以将轨迹序列按照不同的运动属性(运动速度、加速度和航向变化率)划分为不同的子序列,然后将各个子序列输入预先构建好的CNN-LSTM模型,运动特征提取模块通过多个不同的CNN分别对各个运动属性子序列进行运动特征的提取,提取后的运动特征按时序输入LSTM模型,提取对应的时序特征,最后通过轨迹类型预测模块组合LSTM模型每一时刻的输出,得到轨迹预测类别结果。CNN-LSTM模型分别利用CNN和LSTM神经网络在提取局部轨迹点高层次运动特征和不同时间段轨迹信息关联关系分析的优势,通过组合运用两种不同性质的神经网络实现分类精度的提升。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中船舶轨迹分类方法框架图;
图2是本发明实施例中离群轨迹点探测方法示意图;
图3是本发明实施例中基于密度特征和范围约束的停留轨迹点探测示意图;
图4是本发明实施例中用于船舶轨迹分类的CNN-LSTM模型结构图;
图5是本发明实施例中CNN网络结构图;
图6是本发明实施例中LSTM细胞单元内部结构图。
具体实施方式
本申请发明人通过大量的研究与实践发现:针对船舶轨迹的分类,需要综合考虑轨迹采样点的空间分布形态、不同时刻轨迹点隐含的运动特征(如速度、加速度、转向率等)、以及时间序列上运动行为的变化特点。受深度学习技术在语音识别、文本翻译等领域取得巨大成功的启发,近些年来研究人员引入卷积神经网络(Convolutional NeuralNetwork,CNN)、长短期记忆(Long Short-Term Memory,LSTM)神经网络等开展时空轨迹数据的研究。但是,目前的研究主要是用于轨迹位置的预测,没有关于轨迹数据分类的相关研究,基于此,本发明提出了一种CNN和LSTM神经网络组合的船舶轨迹分类方法。该方法与现有技术中的轨迹位置的预测方法的主要区别包括:
(1)任务目标不同。现有技术的方法为轨迹位置预测,属于回归问题;本发明为轨迹类型识别,属于分类问题。
(2)由于任务目标不同,对于特征的处理和损失的计算方式不同。预测轨迹位置的相关方法,是利用LSTM网络最后一个时刻的输出来进行轨迹预测,并计算MSE损失;本申请的任务是轨迹分类,会组合LSTM网络每一时刻的输出,并经过Softmax函数计算得到轨迹属于每一个轨迹类别的概率,并将概率值最大值所对应的类别作为最终的预测类别,同理会组合每一时刻输出计算交叉熵损失来对模型进行调整。
(3)CNN和LSTM组合方式不同。轨迹位置的预测方法是将整段轨迹输入CNN进行运动特征提取,再将CNN的输出向量输入LSTM;本申请是先将轨迹段按时间顺序和运动属性分为等长的子序列,分别输入不同卷积核的CNN模块提取各序列的运动特征,再将提取到的运动特征按时序输入LSTM。本发明的的神经网络组合方式,能更清晰明确地体现输入轨迹蕴含的时序信息,经训练后的模型能学习到更准确的轨迹时序特征。
(4)本申请的数据预处理方式做了改进,包括:离群点探测与处理、停留点探测与处理等。从而能够更好地将轨迹分割为富含语义信息的轨迹序列。
本发明的方法中,通过CNN模型能够有效提取邻近轨迹信息隐含的高层次特征,为移动目标局部区域运动行为的判别提供依据。而船舶时空轨迹作为一种典型的时间序列数据,LSTM模型能够较好地顾及不同时刻轨迹信息间的关联关系,在船舶移动行为特征变化探测方面具备优势。
综上所述,CNN和LSTM两种类型的深度学习技术在时空轨迹数据的特征分析与识别方面各具优势。当前,还没有相关研究将两种类型深度学习模型进行组合应用于船舶轨迹的分类识别。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例提供了一种CNN和LSTM神经网络组合的船舶轨迹分类方法,包括:
S1:对待分类原始轨迹数据进行数据清洗与预处理;
S2:将进行数据清洗与预处理后的轨迹数据用轨迹序列表示,并采用固定大小的滑动窗口沿轨迹序列依次计算每一轨迹点处船舶的运动属性,得到船舶沿轨迹线的运动属性子序列,其中,设置运动属性子序列为一个固定长度,运动属性包括运动速度、加速度和航向变化率;
S3:将得到的船舶沿轨迹线的运动属性子序列输入预先构建好的CNN-LSTM模型,CNN-LSTM模型包括运动特征提取模块、时序特征提取模块和轨迹类型预测模块,其中,运动特征提取模块通过多个不同的CNN分别对各个运动属性子序列进行运动特征的提取,时序特征提取模块采用LSTM模型,提取后的运动特征按时序输入LSTM模型,提取对应的时序特征,最后通过轨迹类型预测模块组合LSTM模型每一时刻的输出,得到轨迹预测类别结果。
请参见图1,是本发明实施例中船舶轨迹分类方法框架图。
对原始轨迹数据进行清洗和预处理。其次,采用固定大小的滑动窗口沿轨迹序列依次计算船舶在每个轨迹点位置的运动属性,构建船舶的运动属性序列。最后,将船舶运动属性序列作为输入,利用CNN和LSTM组合的模型(简称CNN-LSTM模型)进行高层次运动行为特征提取与轨迹类型识别。CNN-LSTM模型由三部分组成,分别是:(1)运动特征提取模块,利用CNN提取局部区域船舶运动属性的高层次特征;(2)时序特征提取模块,将CNN提取的高层次特征按时间次序输入LSTM网络,进一步获取船舶运动过程的行为特征变化;(3)轨迹类型预测模块,在LSTM网络输出结果基础上,进一步通过多层感知机和Softmax函数进行处理,最终输出轨迹类型预测结果。本发明围绕船舶轨迹数据分类这一难点问题,针对CNN和LSTM两种不同类型神经网络分别在提取局部轨迹点高层次运动特征和不同时间段轨迹信息关联关系分析方面具有的优势,提出一种CNN-LSTM组合的分类方法,从而挖掘时空轨迹数据中的船舶运动特征,实现提高船舶轨迹分类精度的目标。
具体来说,数据清洗与预处理包括轨迹点属性信息缺失处理、时空区域缺失处理、离群点探测与处理、停留点探测与处理等。
步骤S2主要是船舶运动属性描述与计算,具体来说,完成数据清洗工作后,将每条轨迹序列组织为T={pi;i=1,…,n}(n≥2),pi表示一个轨迹点。轨迹点
Figure BDA0003838695020000071
Figure BDA0003838695020000072
Figure BDA0003838695020000073
分别表示轨迹点pi的经度和纬度坐标,ti表示轨迹点pi的时间信息。进一步地,采用固定大小的滑动窗口沿轨迹序列依次计算每一轨迹点处船舶的运动属性(包括运动速度、加速度、转向率),得到船舶沿轨迹线的运动属性序列。考虑后续模型对输入数据的统一要求,设置阈值Len作为运动属性序列的固定长度。若实际得到的运动属性序列长度大于Len,则进行分割处理;否则,在序列尾部增加零值直至长度为Len。
通过步骤S2之后,划分后的运动属性子序列不仅包含运动属性信息同时也包含轨迹点的时间信息,从而可以为后续的数据处理做准备。
步骤S3是利用CNN-LSTM模型来进行轨迹类别的预测,轨迹段按时间顺序分为等长的子序列(运动属性子序列)之后,分别输入不同卷积核的CNN模块提取各序列的运动特征,然后将提取到的运动特征按时序输入LSTM来提取时序特征,能更清晰明确地体现输入轨迹蕴含的时序信息,最后组合LSTM每一个时刻输出,并经过多层感知机和Softmax函数处理,从而得到预测结果。
在一种实施方式中,步骤S1包括:
S1.1:剔除待分类原始轨迹数据中缺失船舶经纬度坐标、时间信息的轨迹点;
S1.2:设定阈值Tseg,若相邻轨迹点时间间隔大于Tseg,则将轨迹序列在对应的轨迹点处进行分段处理;
S1.3:采用启发式的离群轨迹点的探测与剔除方法删除几何位置异常的轨迹点,具体包括:以当前轨迹点pa为圆心,作半径为Max_sp×Δt的圆形区域,其中,Max_sp表示船舶移动速度最大值,Δt表示pa和下一轨迹点pa+1的时间间隔,若轨迹点pa+1处于圆形区域外,则将pa+1识别为离群轨迹点并作剔除处理;
S1.4:采用分布密度和范围双重约束的停留点探测算法识别船舶停留轨迹点,具体包括:利用密度聚类算法将存在聚集现象的序列轨迹点聚类成簇,每一簇轨迹点作为停留点的潜在对象,然后计算每一簇轨迹点的几何中心与该簇时序起始轨迹点和终止轨迹点的距离,通过设置距离约束阈值R,排除由于低速行驶或者采样间隔过小而产生的点簇,最后,将保留的轨迹点簇标注为停留点,并在停留点区域对轨迹点序列进行分段处理。
具体来说,本实施例采用由AIS记录的船舶轨迹数据,由一系列不同时刻的轨迹点构成,每一个轨迹点包括船舶位置的经纬度坐标和时间信息。由于原始轨迹数据中可能存在许多轨迹点属性信息缺失、几何位置异常、时空区域缺失等情况,为了摒弃无用数据以及方便后续数据特征提取,需先对原始轨迹数据进行数据清洗与预处理。
如图2所示,为本实施例采用启发式的离群轨迹点的探测与剔除方法的示意图。
传统基于序列轨迹点密度分析的方法可能导致停留轨迹点的误识别现象,包括船舶短时间内低速行驶产生的轨迹点以及局部采样间隔过小的轨迹点。针对该问题,本实施例提出了启发式的离群轨迹点的探测与剔除方法,具体如图3所示。
在一种实施方式中,步骤S2采用固定大小的滑动窗口沿轨迹序列依次计算每一轨迹点处船舶的运动属性,包括:
计算每一轨迹点的速度和加速度:
Figure BDA0003838695020000091
Figure BDA0003838695020000092
其中,滑动窗口包含的轨迹点为pi+1,…,pi+m,m表示窗口大小,即包含的轨迹点数量,Dist(pi+1,pi+m)表示轨迹点pi+1和pi+m间的球面距离,Δti表示轨迹点pi+1和pi+m间的时间间隔,Δtu表示当前滑动窗口中心点pu和下一滑动窗口中心点pu+1间的时间间隔;
计算每一轨迹点的航向变化率:
Figure BDA0003838695020000093
其中,
Figure BDA0003838695020000094
Figure BDA0003838695020000095
分别为轨迹点pi+1和pi+m的经度和纬度坐标,Bearing(pu)为当前滑动窗口中心点pu的航向,即真北方向与向量
Figure BDA0003838695020000096
方向间的顺时针夹角,Bearing(pu+1)为pu+1的航向,tu为pu的时刻,tu+1为pu+1的时刻。
具体来说,不同类型船舶航行时具备不同的动力学特征,具体体现为运动的速度和加速度的不同,航向变化的不同等。
定义航向变化率BR(pu)描述滑动窗口中心点pu的航向变化特征。其中,Bearing(pu)的计算方式如下:
Figure BDA0003838695020000097
采用滑动窗口计算不同位置船舶速度、加速度、航向变化率后,得到船舶沿轨迹的运动属性子序列。考虑到后续分类模型要求输入序列具有相同长度,设置阈值Len作为运动属性序列的固定长度。若某一序列长度大于Len,则进行分割处理;否则,在序列尾部增加零值直至长度为Len。
在一种实施方式中,运动特征提取模块的处理过程包括:
将运动属性子序列组织为多通道表达,每个通道表示一种运动属性,通道大小为1×Len/p,采用cout个大小为cinput×1×h的卷积核
Figure BDA0003838695020000098
对输入特征
Figure BDA0003838695020000101
进行卷积计算,使用零值填充和步幅为1来保持卷积运算后特征尺寸不变,并利用激活函数输出为新的特征,每个卷积核所产生的新特征yi的表达式为:
Figure BDA0003838695020000102
cout为卷积运算后输出的通道数,cinput为卷积输入的通道数,w1、w2
Figure BDA0003838695020000103
分别为第一个、第二个、第
Figure BDA0003838695020000104
个通道,h为卷积核的宽度,0≤i≤(Len/p),xi表示输入向量x第i位置上的值,f(·)表示非线性激活函数;b表示偏置向量;n表示当前通道数,通过一个卷积核计算后产生新的特征向量为Y={y1,y2,…,yLen/p},通过整个卷积模块后应得到cout个Y;Len为运动属性子序列的长度,p为运动属性子序列的数量;
利用池化运算获取粗粒度的主体特征,池化窗口内的特征Yk×s:k×s+l-1的最大值作为输出,表达式为:
Figure BDA0003838695020000105
其中,k表示池化窗口移动的次数,
Figure BDA0003838695020000106
floor(·)为向下取整函数;l和s分别表示窗口长度和移动步幅;j表示从1到l的任一值,用于指示池化窗口内特征值的位置;
将池化运算提取的主体特征对应的向量展平为一维向量,并输入全连接层进行特征降维,降维后的特征向量作为后续时序特征提取模块的输入。
具体来说,如图4所示,将船舶运动属性序列进行归一化处理并划分为p个子序列,表示为A1、A2、…、Ap。每个子序列分别输入CNN模型,通过卷积操作提取该子序列的高层次特征。
CNN模块主要包括卷积操作、池化计算和全连接层的降维操作。其中,卷积操作如图5所示。池化运算在卷积操作计算得到的特征的基础上,进一步获取粗粒度的主体特征(高层次特征),通过池化运算,可以减少参数的同时防止过拟合现象。通过若干卷积和池化运算获得输入向量的高层次特征后,将提取的特征展平为一维向量,并输入全连接层进行特征降维,以便后续作为LSTM网络的输入。
在一种实施方式中,时序特征提取模块的处理过程包括:
ft=σ(Wfggt+Wfhht-1+) (6)
it=σ(Wiggt+Wihht-1+bi) (7)
jt=tanh(Wjggt+Wjhht-1+bj) (8)
ct=ft⊙ct-1+it⊙jt (9)
ot=σ(Woggt+Wohht-1+bo) (10)
ht=ot⊙tanh(ct) (11)
其中,ft、it、jt、ot分别为t时刻遗忘门、输入门、更新门、输出门的输出值;gt为运动特征提取模块输出的t时刻的特征向量,ht-1为t-1时刻的隐藏状态,ct-1为t-1时刻的细胞状态,⊙表示点乘运算;Wfg、Wfh分别为遗忘门中与gt进行矩阵计算的权重矩阵、与ht-1进行矩阵计算的权重矩阵,bf为遗忘门的偏置向量,Wig、Wih分别为输入门中与gt进行矩阵计算的权重矩阵、与ht-1进行矩阵计算的权重矩阵,bi为输入门的偏置向量,Wjg、Wjh分别为更新门中与gt进行矩阵计算的权重矩阵、与ht-1进行矩阵计算的权重矩阵,bj为更新门的偏置向量,Wog、Woh分别为输出门中与gt进行矩阵计算的权重矩阵、与ht-1进行矩阵计算的权重矩阵,bo为输出门的偏置向量,σ和tanh分别表示Sigmoid激活函数和tanh激活函数,ht为t时刻的隐藏状态,即t时刻的输出。
具体来说,设运动属性子序列通过CNN模型提取的特征分别为g1,g2,…,gp,这些特征按时间次序输入到LSTM网络,进一步提取运动特征在时间序列上的变化特点。
如图6所示,向LSTM网络依次输入特征向量gt(t=1,2,…,p),LSTM单元在t时刻接收输入gt,以及前一时刻细胞单元输出的隐藏状态ht-1和细胞状态ct-1
①遗忘门读取前一时刻的隐藏状态ht-1和当前时刻输入gt,做一个Sigmoid非线性映射,输出一个向量ft。遗忘门决定了从细胞状态中丢弃什么信息。具体如公式6所示。
②输入门读取前一时刻的隐藏状态ht-1和当前时刻输入gt,先做一个Sigmoid非线性映射,输出向量it;然后做一个tanh非线性映射,输出向量jt。输入门决定什么样的新信息被存放在细胞状态中。具体如公式7和8所示。
③利用①和②计算出的向量ft、it和jt,将前一时刻的细胞状态ct-1更新为ct。具体如公式9所示。
④最后,输出门确定该单元的输出值,具体如公式10和11所示。
在一种实施方式中,轨迹类型预测模块的处理过程包括:
将LSTM网络每个时间步输出的特征向量h1,h2,…,hp进行组合后输入多层感知机进行处理,输出长度为n′的一维数组,其中,n′等于船舶轨迹的类型数量,p为特征向量的总数;
对于每个输出值zi′使用Softmax函数进行激活处理,1≤i′≤n′,表达式为:
Figure BDA0003838695020000121
其中,Pi′为船舶轨迹属于第i’种类型的概率值,且
Figure BDA0003838695020000122
概率值最大的类型即为对应船舶轨迹的预测类别,b为从1到n′计数值。
实施例二
基于同样的发明构思,本实施例提供了一种CNN和LSTM神经网络组合的船舶轨迹分类系统,包括:
预处理模块,用于对待分类原始轨迹数据进行数据清洗与预处理;
子序列获取模块,用于将进行数据清洗与预处理后的轨迹数据用轨迹序列表示,并采用固定大小的滑动窗口沿轨迹序列依次计算每一轨迹点处船舶的运动属性,得到船舶沿轨迹线的运动属性子序列,其中,设置运动属性子序列为一个固定长度,运动属性包括运动速度、加速度和航向变化率;
轨迹分类模块,用于将得到的船舶沿轨迹线的运动属性子序列输入预先构建好的CNN-LSTM模型,CNN-LSTM模型包括运动特征提取模块、时序特征提取模块和轨迹类型预测模块,其中,运动特征提取模块通过多个不同的CNN分别对各个运动属性子序列进行运动特征的提取,时序特征提取模块采用LSTM模型,提取后的运动特征按时序输入LSTM模型,提取对应的时序特征,最后通过轨迹类型预测模块组合LSTM模型每一时刻的输出,得到轨迹预测类别结果。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (7)

1.一种CNN和LSTM神经网络组合的船舶轨迹分类方法,其特征在于,包括:
S1:对待分类原始轨迹数据进行数据清洗与预处理;
S2:将进行数据清洗与预处理后的轨迹数据用轨迹序列表示,并采用固定大小的滑动窗口沿轨迹序列依次计算每一轨迹点处船舶的运动属性,得到船舶沿轨迹线的运动属性子序列,其中,设置运动属性子序列为一个固定长度,运动属性包括运动速度、加速度和航向变化率;
S3:将得到的船舶沿轨迹线的运动属性子序列输入预先构建好的CNN-LSTM模型,CNN-LSTM模型包括运动特征提取模块、时序特征提取模块和轨迹类型预测模块,其中,运动特征提取模块通过多个不同的CNN分别对各个运动属性子序列进行运动特征的提取,时序特征提取模块采用LSTM模型,提取后的运动特征按时序输入LSTM模型,提取对应的时序特征,最后通过轨迹类型预测模块组合LSTM模型每一时刻的输出,得到轨迹预测类别结果。
2.如权利要求1所述的CNN和LSTM神经网络组合的船舶轨迹分类方法,其特征在于,步骤S1包括:
S1.1:剔除待分类原始轨迹数据中缺失船舶经纬度坐标、时间信息的轨迹点;
S1.2:设定阈值Tseg,若相邻轨迹点时间间隔大于Tseg,则将轨迹序列在对应的轨迹点处进行分段处理;
S1.3:采用启发式的离群轨迹点的探测与剔除方法删除几何位置异常的轨迹点,具体包括:以当前轨迹点pa为圆心,作半径为Max_sp×Δt的圆形区域,其中,Max_sp表示船舶移动速度最大值,Δt表示pa和下一轨迹点pa+1的时间间隔,若轨迹点pa+1处于圆形区域外,则将pa+1识别为离群轨迹点并作剔除处理;
S1.4:采用分布密度和范围双重约束的停留点探测算法识别船舶停留轨迹点,具体包括:利用密度聚类算法将存在聚集现象的序列轨迹点聚类成簇,每一簇轨迹点作为停留点的潜在对象,然后计算每一簇轨迹点的几何中心与该簇时序起始轨迹点和终止轨迹点的距离,通过设置距离约束阈值R,排除由于低速行驶或者采样间隔过小而产生的点簇,最后,将保留的轨迹点簇标注为停留点,并在停留点区域对轨迹点序列进行分段处理。
3.如权利要求1所述的CNN和LSTM神经网络组合的船舶轨迹分类方法,其特征在于,步骤S2采用固定大小的滑动窗口沿轨迹序列依次计算每一轨迹点处船舶的运动属性,包括:
计算每一轨迹点的速度和加速度:
Figure FDA0003838695010000021
Figure FDA0003838695010000022
其中,滑动窗口包含的轨迹点为pi+1,…,pi+m,m表示窗口大小,即包含的轨迹点数量,Dist(pi+1,pi+m)表示轨迹点pi+1和pi+m间的球面距离,Δti表示轨迹点pi+1和pi+m间的时间间隔,Δtu表示当前滑动窗口中心点pu和下一滑动窗口中心点pu+1间的时间间隔;
计算每一轨迹点的航向变化率:
Figure FDA0003838695010000023
其中,
Figure FDA0003838695010000024
Figure FDA00038386950100000212
分别为轨迹点pi+1和pi+m的经度和纬度坐标,Bearing(pu)为当前滑动窗口中心点pu的航向,即真北方向与向量
Figure FDA0003838695010000025
方向间的顺时针夹角,Bearing(pu+1)为pu+1的航向,tu为pu的时刻,tu+1为pu+1的时刻。
4.如权利要求1所述的CNN和LSTM神经网络组合的船舶轨迹分类方法,其特征在于,运动特征提取模块的处理过程包括:
将运动属性子序列组织为多通道表达,每个通道表示一种运动属性,通道大小为1×Len/p,采用cout个大小为cinput×1×h的卷积核
Figure FDA0003838695010000026
对输入特征
Figure FDA0003838695010000027
进行卷积计算,使用零值填充和步幅为1来保持卷积运算后特征尺寸不变,并利用激活函数输出为新的特征,每个卷积核所产生的新特征yi的表达式为:
Figure FDA0003838695010000028
cout为卷积运算后输出的通道数,cinput为卷积输入的通道数,w1、w2
Figure FDA0003838695010000029
分别为第一个、第二个、第
Figure FDA00038386950100000210
个通道,h为卷积核的宽度,0≤i≤(Len/p),xi表示输入向量x第i位置上的值,f(·)表示非线性激活函数;b表示偏置向量;n表示当前通道数,通过一个卷积核计算后产生新的特征向量为Y={y1,y2,…,yLen/p};
利用池化运算获取粗粒度的主体特征,池化窗口内的特征Yk×s:k×s+l-1的最大值作为输出,表达式为:
Figure FDA00038386950100000211
其中,k表示池化窗口移动的次数,
Figure FDA0003838695010000031
floor(·)为向下取整函数;l和s分别表示窗口长度和移动步幅;
将池化运算提取的主体特征对应的向量展平为一维向量,并输入全连接层进行特征降维,降维后的特征向量作为后续时序特征提取模块的输入。
5.如权利要求1所述的CNN和LSTM神经网络组合的船舶轨迹分类方法,其特征在于,时序特征提取模块的处理过程包括:
ft=σ(Wfggt+Wfhht-1+) (6)
it=σ(Wiggt+Wihht-1+bi) (7)
jt=tanh(Wjggt+Wjhht-1+bj) (8)
ct=ft⊙ct-1+it⊙jt (9)
ot=σ(Woggt+Wohht-1+bo) (10)
ht=ot⊙tanh(ct) (11)
其中,ft、it、jt、ot分别为t时刻遗忘门、输入门、更新门、输出门的输出值;gt为运动特征提取模块输出的t时刻的特征向量,ht-1为t-1时刻的隐藏状态,ct-1为t-1时刻的细胞状态,⊙表示点乘运算;Wfg、Wfh分别为遗忘门中与gt进行矩阵计算的权重矩阵、与ht-1进行矩阵计算的权重矩阵,bf为遗忘门的偏置向量,Wig、Wih分别为输入门中与gt进行矩阵计算的权重矩阵、与ht-1进行矩阵计算的权重矩阵,bi为输入门的偏置向量,Wjg、Wjh分别为更新门中与gt进行矩阵计算的权重矩阵、与ht-1进行矩阵计算的权重矩阵,bj为更新门的偏置向量,Wog、Woh分别为输出门中与gt进行矩阵计算的权重矩阵、与ht-1进行矩阵计算的权重矩阵,bo为输出门的偏置向量,σ和tanh分别表示Sigmoid激活函数和tanh激活函数,ht为t时刻的隐藏状态,即t时刻的输出。
6.如权利要求1所述的CNN和LSTM神经网络组合的船舶轨迹分类方法,其特征在于,轨迹类型预测模块的处理过程包括:
将LSTM网络每个时间步输出的特征向量h1,h2,…,hp进行组合后输入多层感知机进行处理,输出长度为n′的一维数组,其中,n′等于船舶轨迹的类型数量,p为特征向量的总数;
对于每个输出值zi′使用Softmax函数进行激活处理,1≤i′≤n′,表达式为:
Figure FDA0003838695010000041
其中,Pi′为船舶轨迹属于第i’种类型的概率值,且
Figure FDA0003838695010000042
概率值最大的类型即为对应船舶轨迹的预测类别,b为从1到n′计数值。
7.一种CNN和LSTM神经网络组合的船舶轨迹分类系统,其特征在于,包括:
预处理模块,用于对待分类原始轨迹数据进行数据清洗与预处理;
子序列获取模块,用于将进行数据清洗与预处理后的轨迹数据用轨迹序列表示,并采用固定大小的滑动窗口沿轨迹序列依次计算每一轨迹点处船舶的运动属性,得到船舶沿轨迹线的运动属性子序列,其中,设置运动属性子序列为一个固定长度,运动属性包括运动速度、加速度和航向变化率;
轨迹分类模块,用于将得到的船舶沿轨迹线的运动属性子序列输入预先构建好的CNN-LSTM模型,CNN-LSTM模型包括运动特征提取模块、时序特征提取模块和轨迹类型预测模块,其中,运动特征提取模块通过多个不同的CNN分别对各个运动属性子序列进行运动特征的提取,时序特征提取模块采用LSTM模型,提取后的运动特征按时序输入LSTM模型,提取对应的时序特征,最后通过轨迹类型预测模块组合LSTM模型每一时刻的输出,得到轨迹预测类别结果。
CN202211100665.0A 2022-09-08 2022-09-08 一种cnn和lstm神经网络组合的船舶轨迹分类方法及系统 Pending CN115512152A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211100665.0A CN115512152A (zh) 2022-09-08 2022-09-08 一种cnn和lstm神经网络组合的船舶轨迹分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211100665.0A CN115512152A (zh) 2022-09-08 2022-09-08 一种cnn和lstm神经网络组合的船舶轨迹分类方法及系统

Publications (1)

Publication Number Publication Date
CN115512152A true CN115512152A (zh) 2022-12-23

Family

ID=84504090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211100665.0A Pending CN115512152A (zh) 2022-09-08 2022-09-08 一种cnn和lstm神经网络组合的船舶轨迹分类方法及系统

Country Status (1)

Country Link
CN (1) CN115512152A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116090938A (zh) * 2023-04-06 2023-05-09 江苏华溯大数据有限公司 一种后装车辆载重状态识别方法
CN117056708A (zh) * 2023-10-11 2023-11-14 成都大公博创信息技术有限公司 一种基于多尺度特征融合和cnn-lstm的ais信号识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116090938A (zh) * 2023-04-06 2023-05-09 江苏华溯大数据有限公司 一种后装车辆载重状态识别方法
CN117056708A (zh) * 2023-10-11 2023-11-14 成都大公博创信息技术有限公司 一种基于多尺度特征融合和cnn-lstm的ais信号识别方法

Similar Documents

Publication Publication Date Title
CN109146921B (zh) 一种基于深度学习的行人目标跟踪方法
CN109492581B (zh) 一种基于tp-stg框架的人体动作识别方法
CN112561148B (zh) 基于一维卷积神经网络和lstm的船舶轨迹预测方法及系统
CN115512152A (zh) 一种cnn和lstm神经网络组合的船舶轨迹分类方法及系统
CN110084836B (zh) 基于深度卷积特征分层响应融合的目标跟踪方法
CN111382686B (zh) 一种基于半监督生成对抗网络的车道线检测方法
CN111832225A (zh) 一种构建汽车行驶工况的方法
CN112906858A (zh) 一种船舶运动轨迹实时预测方法
CN109543615B (zh) 一种基于多级特征的双学习模型目标跟踪方法
CN110610165A (zh) 一种基于yolo模型的船舶行为分析方法
CN115063676A (zh) 一种基于ais数据的船舶目标分类方法
CN115730263B (zh) 一种船舶行为模式侦测方法及装置
CN115131760A (zh) 一种基于改进特征匹配策略的轻量级车辆追踪方法
CN111965639A (zh) 基于双向长短时记忆神经网络的雷达信号分析方法
CN113887789B (zh) 一种基于循环神经网络的改进船舶轨迹预测方法及其装置
CN114596726B (zh) 基于可解释时空注意力机制的停车泊位预测方法
CN106127798A (zh) 基于自适应模型的稠密时空上下文目标跟踪方法
CN116714437B (zh) 基于大数据的氢燃料电池汽车安全监控系统及监控方法
CN113129336A (zh) 一种端到端多车辆跟踪方法、系统及计算机可读介质
CN112927507A (zh) 一种基于LSTM-Attention的交通流量预测方法
CN108153519A (zh) 一种目标智能跟踪方法通用设计框架
CN110111358B (zh) 一种基于多层时序滤波的目标跟踪方法
CN112036291A (zh) 基于运动大数据和深度学习的运动学数据模型构建方法
CN112667763B (zh) 一种基于自适应时间戳与多尺度特征提取的轨迹预测方法
CN111652150B (zh) 一种红外抗干扰跟踪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination