CN111985529A - 一种船舶ais轨迹混合聚类方法及系统 - Google Patents

一种船舶ais轨迹混合聚类方法及系统 Download PDF

Info

Publication number
CN111985529A
CN111985529A CN202010644064.0A CN202010644064A CN111985529A CN 111985529 A CN111985529 A CN 111985529A CN 202010644064 A CN202010644064 A CN 202010644064A CN 111985529 A CN111985529 A CN 111985529A
Authority
CN
China
Prior art keywords
track
ship
clustering
sog
median
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010644064.0A
Other languages
English (en)
Inventor
张永
刘磊
赖佳
苏竹勋
陈静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202010644064.0A priority Critical patent/CN111985529A/zh
Publication of CN111985529A publication Critical patent/CN111985529A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种船舶AIS轨迹混合聚类方法及系统,具体步骤包括:S1.系统接收历史AIS数据,并对其进行数据处理后获得待分类轨迹D={x1,x2,...,xm};S2.对步骤S1中得到的待分类轨迹D={x1,x2,...,xm}进行K‑Means初步聚类得到轨迹C={c1,c2,...,cL};S3.对C={c1,c2,...,cL}中每一个子轨迹类cj采用不同的参数进行DBSCNA聚类,根据DBSCAN聚类结果ej={e1,e2,...,ep},结合聚类评估模型,计算各对参数下聚类结果的评估值,选择评估结果最优的DBSCAN聚类结果作为子轨迹类cj的最终轨迹类别。本发明借助船舶轨迹相异度计算模型的差异和各类聚类方法的优势,有效提高船舶规矩聚类的效率和效果,从而为船舶行为分析和海事船舶管理提供有效支撑。

Description

一种船舶AIS轨迹混合聚类方法及系统
技术领域
本发明是一种船舶AIS轨迹混合聚类方法及系统,属于海事船舶AIS数据分析和船舶轨 迹聚类领域。
背景技术
AIS系统为船舶行为分析和海事管理提供了数据基础,包括避碰研究、异常检测、行为 分析、知识提取以及跟踪预测多等个方面。基于AIS的船舶航行轨迹数据由同一艘船舶在一 段时间内多条且连续动态AIS点组成。通过对船舶轨迹的研究,可以实现对船舶航行轨迹进 行跟踪和预测,从而使用避碰规则来提高船舶航行安全;另一方面,通过对船舶轨迹研究有 助于船舶行为分析,同时实现对船舶行为的异常检测,提高海事监管能力。当前国外内船舶 轨迹聚类研究中,轨迹模式相对实际情景较为简单,且轨迹数量较少,聚类分析的结果缺少 验证,同时船舶轨迹聚类过程中未充分考虑船舶轨迹特征。
基于此,针对指定区域的轨迹聚类,根据船舶轨迹的起点和终点可以明确初步轨迹的类 型数目,同时轨迹起点和终点特征的经纬度值可以被平均,可结合K-Means聚类的特点,首 先对轨迹进行初步聚类;之后,经K-Means聚类获得各子类轨迹中包含不同类型的轨迹,包 括不同航线的轨迹和异常轨迹等,可结合DBSCAN算法对密度集中的数据聚类能力和异常数 据的识别能力,实现对子轨迹的进一步聚类和异常识别。
发明内容
发明目的:本发明提出一种船舶AIS轨迹混合聚类方法及系统,能够较好得完成对船舶 轨迹的聚类,以便进行后续船舶行为统计分析和异常检测。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:
一种船舶AIS轨迹混合聚类系统,该系统包括:船舶AIS数据重构模块、船舶轨迹初步 聚类模块、船舶子轨迹类二次聚类模块;
所述船舶AIS数据重构模块用于针对历史AIS数据,根据MMSI的差异识别不同船舶, 根据时间戳的间隔判断AIS数据连续性从而判断同一船舶不同轨迹段,通过数据排序和分割 的方法,获取历史船舶轨迹数据;
所述船舶轨迹初步聚类模块基于船舶轨迹起点和终点的差异,通过绘制船舶原始轨迹明 确所有船舶轨迹起点和终点分布,确定轨迹类别数目,结合K-Means算法对空间点集聚类的 优势,实现船舶轨迹初步聚类;
所述船舶子轨迹类二次聚类模块基于K-Means聚类获得子类轨迹,分析子类船舶轨迹之 间的特征差异,在对轨迹相异度计算模型进行筛选的基础上,构建综合相异度计算模型,通 过k个最近邻的距离特征确定DBSCAN算法中参数ε和MinLns的值,借助DBSCAN的算法 对密度集中的数据聚类能力和异常数据的识别能力,实现对子轨迹类的聚类。
用上述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,该方法包括如下步骤:
S1.系统接收历史AIS数据,并对其进行数据处理后获得待分类轨迹D={x1,x2,...,xm};
S2.对步骤S1中得到的待分类轨迹D={x1,x2,...,xm}进行K-Means初步聚类得到轨迹 C={c1,c2,...,cL};
S3.对C={c1,c2,...,cL}中每一个子轨迹类cj采用不同的参数对进行DBSCNA聚类,根据 DBSCAN聚类结果ej={e1,e2,...,ep},结合聚类评估模型,计算各对参数下聚类结果的评估值, 选择最优评估的DBSCAN聚类结果作为子轨迹类cj的轨迹划分。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S1的具体方法包括:
S11.系统接收历史AIS数据,首先对数据根据MMSI进行排序,根据前后行的MMSI差值是否为0判断是否为同一条船舶,从差值不为0处进行分割,获取不同船舶的数据;
S12、对不同船舶数据再根据时间戳进行排序,计算前后行数据的时间戳差值,并对差值 进行统计,以时间间隔值占比小于0.05的最大时间间隔确定同一船舶不同轨迹段的划分值, 完成所有不连续的轨迹划分,获得待分类轨迹D={x1,x2,...,xm}。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S2的具体方法包括:
S21.初始化K-Means聚类算法中轨迹类别K值:通过绘制全部轨迹,判断轨迹起点和终 点区域分布状况,记同时分布轨迹起点和终点的区域个数为z1,只包含轨迹终点或轨迹起点 的区域个数为z2,任取两个区域构成一类轨迹的数目为
Figure BDA0002571898780000021
则初始化K值为
Figure BDA0002571898780000022
S22.初始化K-Means聚类中心{μ12,...,μk}:
a.随机选取一条轨迹作为第一类轨迹的中心轨迹μ1,则该轨迹的起点和终点分别作为初 始轨迹的起点和终点特征;
b.选取与第一类轨迹的中心轨迹μ1起点和终点相异度最大的轨迹作为第二类轨迹的中心 轨迹μ2
c.选取与μ1和μ2起点和终点相异度之和最大的轨迹μ3作为第三类轨迹的中心轨迹......依 次下去,找到K类轨迹各自初始化中心轨迹{μ12,...,μK};
S23.K-Means初步聚类:输入待分类轨迹D={x1,x2,...,xm}、初始化的轨迹类别K以及迭代 次数N:
a.开始迭代,迭代次数从1开始,每次增加1;
b.对D={x1,x2,...,xm}所有轨迹进行循环;
c.计算待分类轨迹D={x1,x2,...,xm}中的第i条原始轨迹xi和K类轨迹各自初始化中心轨迹 uj的起点和终点相异度dij,根据最小的dij将xi划分到K-Means聚类中的第j类cj中,对 D={x1,x2,...,xm}所有轨迹进行了了划分得到聚类结果C={c1,c2,...,cK};
d.根据当前获取的聚类结果C={c1,c2,...,cK},计算各个类新的聚类中心{μ1',μ2',...,μK'};
e.判断新的聚类中心{μ1',μ2',...,μK'}与初始化中心轨迹{μ12,...,μK}是否一致,不一致同时也 未达到迭代次数N,迭代次数加1并将新的聚类中心{μ1',μ2',...,μK'}替代原始聚类中心 {μ12,...,μK},返回步骤b,前后两次聚类中心一致或者达到迭代次数N,执行步骤f;
f.返回分类K-Means聚类中最后K个分类结果C={c1,c2,...,cK}。
S24.K-Means聚类结果清洗:由于初始化K值时,按轨迹类至多情况下进行取值,而实 际轨迹中可能并不包含K类轨迹,即C={c1,c2,...,cK}中有部分轨迹类为空值,通过判断 C={c1,c2,...,cK}中每一个类是否为空,并删除空类,最后保留下L(L≤K)类轨迹C={c1,c2,...,cL}。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S23中所述的船舶 轨迹起点和终点相异度计算模型如下:
Tri=p1p2p3...pj...pn(1≤j≤n)轨迹中第一个点p1和最后一个点pn代表该条轨迹的起点 和终点,船舶轨迹的起点和终点主要差异在于经纬度的区别,即LON和LAT两个维度上, 船舶经纬度信息通过GPS数据进行定位,通过获取轨迹起点和终点的经纬度数据,构建轨迹 的起点和终点特征,如式(1)所示。
Tse={(lon1,lat1),(lonn,latn)} (1)
其中(lon1,lat1)表示轨迹起点的经纬度坐标,(lonn,latn)表示轨迹终点的经纬度坐标;
轨迹起点和终点特征相异度计算模型Dse通过分别计算轨迹Tri和Tri′的起点间距离和终 点间的距离,并计算两个距离之和,代表轨迹起点和终点的空间位置的差异,如式(2)所示:
Dse(Tri,Tri′)=dist(loni 1,lati 1,loni′ 1,lati′ 1)+dist(loni n,lati n,loni′ n,lati n) (2)
其中,
Figure BDA0002571898780000031
Figure BDA0002571898780000032
表示轨迹Tri起点经纬度,
Figure BDA0002571898780000033
Figure BDA0002571898780000034
表示轨迹Tri′起点经纬度,
Figure BDA0002571898780000035
表示轨迹Tri和Tri′起点间的经纬度距离;
Figure BDA0002571898780000036
Figure BDA0002571898780000037
表示轨迹Tri终点经纬度,
Figure BDA0002571898780000038
Figure BDA0002571898780000039
表示轨迹Tri′终点经纬度,
Figure BDA00025718987800000310
表示轨迹轨迹Tri和Tri′终点间的经纬 度距离。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S3的具体方法包括:
S31.动态相异度计算模型选取:船舶轨迹动态特征包括航速均值、航速中位数、航向均 值、航向中位数、航速极差、航速标准差、航向极差、航向标准差,采用机器学习中过滤式 方差方法,分别对cj中每条轨迹进行上述8个特征计算,再按照计算结果对cj中每个特征值 进行最大最小值归一化,最后分别对cj中各个特征值进行方差统计,并取方差较大前两个特 征对应的相异度计算模型作为动态相异度计算模型;
S32.综合相异度计算模型构建:在确定动态相异度计算模型之后,融入船舶轨迹起点和 终点相异度计算模型、船舶轨迹长度相异度计算模型、轨迹空间相异度计算模型,构建船舶 轨迹综合相异度计算模型;
S33.初始化邻域半径ε和邻域半径中核心对象包含的最小对象数目MinLns的取值:
定义k距离曲线,对于轨迹类中的每条轨迹,计算其与其他轨迹的综合相异度的第k个最 近邻值,称第k个最近邻值为该轨迹的k距离;将轨迹类中所有轨迹的k距离递增排序,绘制 得到曲线图,称为k距离曲线;基于k距离曲线进行DBSCAN中邻域半径ε和邻域半径中核 心对象包含的最小对象数目MinLns的设置,并基于此时邻域半径ε和邻域半径中核心对象包 含的最小对象数目MinLns,对cj轨迹进行DBSCAN聚类,依次将k取值为3至8进行循环;
S34.根据此时邻域半径ε和邻域半径中核心对象包含的最小对象数目MinLns,对cj轨迹进 行DBSCAN聚类;
a.将cj类中的轨迹集合
Figure BDA0002571898780000041
均标记为未处理;
b.依次对轨迹集合
Figure BDA0002571898780000042
中的所有轨迹进行循环;
c.若轨迹集合
Figure BDA0002571898780000043
中的某条轨迹
Figure BDA0002571898780000044
已标记,则将i+1返回步骤b;
d.若轨迹集合
Figure BDA0002571898780000045
中的某条轨迹
Figure BDA0002571898780000046
未标记,并对
Figure BDA0002571898780000047
进行标记;
e.检查轨迹集合
Figure BDA0002571898780000048
中的每条轨迹
Figure BDA0002571898780000049
的邻域内船舶轨迹数目
Figure BDA00025718987800000410
f.若
Figure BDA00025718987800000411
则将
Figure BDA00025718987800000412
标记为核心轨迹,并建立新簇e,将该条轨迹
Figure BDA00025718987800000413
的邻域内 的轨迹加入集合M,同时对集合M内所有轨迹{mh}进行循环:
1).若mh未被标记,则对mh进行标记,同时检查NEps(mh):若mh为核心轨迹,将mh加入簇 e且将其邻域内、未被标记的轨迹加入集合M;若mh不为核心轨迹,将mh加入e;
2).若mh已被标记,则继续对{mh}进行循环
g.若不为核心轨迹,则标记
Figure BDA00025718987800000414
为噪声轨迹;
h.判断
Figure BDA0002571898780000051
是否循环完,未结束则将i+1返回步骤b,否则继续;
i.返回最后分类结果ej={e1,e2,...,ep}。
S35.根据DBSCAN聚类结果ej={e1,e2,...,ep},结合聚类评估模型,计算当前聚类结果的评 估值;
S36.选择聚类评估结果最小时的聚类结果,作为DBSCAN最优聚类结果,即子轨迹类cj的详细轨迹划分;
S37.C={c1,c2,...,cL}是否迭代完成,未完成则将j+1,回到步骤S31继续,否则输出 C={c1,c2,...,cL}中每一个轨迹类cj的子类聚类结果ej={e1,e2,...,ep}。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S32中所述的船舶 轨迹长度相异度计算模型如下:
根据船舶轨迹的定义Tri=p1p2p3...pj...pn(1≤j≤n),对船舶轨迹长度定义如下:
Figure BDA0002571898780000052
其中,d(pj,pj+1)表示点pj和点pj+1之间的距离。
船舶轨迹前后点之间的距离可通过前后点的经纬度计算,如式(4)所示;
d(pj,pj+1)=dis(lonj,latj,lonj+1,latj+1) (4)
其中,lonj和latj表示点Pj的经纬度,lonj+1和latj+1表示点Pj+1的经纬度, dis(lonj,latj,lonj+1,latj+1)表示点Pj和Pj+1经纬度距离。
船舶轨迹长度相异度计算模型Dl通过分别计算轨迹Tri和Tri′的长度,之后计算两条轨迹 的长度差的绝对值,作为轨迹长度相异度计算结果,如式(5)所示。
Dl(Tri,Tri′)=|Ti length-Ti′ length| (5)
其中,Ti length表示轨迹Tri的长度特征,Ti′ length表示轨迹Tri′的长度特征。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S32中所述的船舶 轨迹航速相异度计算模型如下:
分别取船舶轨迹航速的平均值和中位数作为船舶轨迹航速基本特征,如式(6)所示。
Tsog={sogmean,sogmedian} (6)
其中,sogmean表示轨迹航速的平均值,sogmedian表示轨迹航速的中位数。
船舶轨迹航速相异度包含航速平均值相异度Dsog_mean和航速中位数相异度Dsog_median;通过 分别计算轨迹Tri和Tri′的航速特征值,之后计算各自平均值和中位数的差值,并将对应差值 的绝对值作为Dsog_mean和Dsog_median计算结果,如式(7)和式(8)所示。
Dsog_mean(Tri,Tri′)=|sogi mean-sogi′ mean| (7)
Dsog_median(Tri,Tri′)=|sogi median-sogi′ mdian| (8)
其中,sogi mean和sogi median表示轨迹Tri的对地航速平均值和中位数,sogi′ mean和sogi′ mdian表示 轨迹Tri′的航速平均值和中位数。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S32中所述的船舶 轨迹航向相异度计算模型如下:
分别取船舶轨迹航向的平均值和中位数作为船舶轨迹航向基本特征,如式(9)所示:
Tsog={cogmean,cogmedian} (9)
其中,cogmean表示轨迹航向的平均值,cogmedian表示轨迹航向的中位数。
船舶轨迹航向相异度包含航向平均值相异度Dcog_mean和航向中位数相异度Dcog_median。通过 分别计算轨迹Tri和Tri′的航向特征值,之后计算各自平均值和中位数的差值,并将对应差值 的绝对值作为Dcog_mean和Dcog_median计算结果,如式(10)和(11)所示。
Dcog_mean(Tri,Tri′)=|cogi mean-cogi′ mean| (10)
Dcog_median(Tri,Tri′)=|cogi median-cogi′ median| (11)
其中,cogi mean和cogi median表示轨迹Tri的对地航向平均值和中位数,cogi′ mean和cogi′ mdian表示 轨迹Tri′的对地航向平均值和中位数。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S32中所述的船舶 轨迹运动变化相异度计算模型如下:
取航向和航速的极差和标准差作为轨迹运动变化特征,如式(12)所示:
Tgv={sogrange,sogstd,cogrange,cogstd} (12)
其中,sogrange、sogstd、cogrange和cogstd分别代表轨迹航速的极差、标准差以及航向的极 差和标准差。
船舶轨迹运动变化相异度包括航速极差相异度Dsog_range、航速标准差相异度Dsog_std、航向 极差相异度Dcog_range以及航向标注差相异度Dcog_std。通过分别计算轨迹Tri和Tri′的运动变化特 征,计算对应运动变化特征的差值的绝对值,作为Dsog_range、Dsog_std、Dcog_range和Dcog_std的计 算结果,如式(13)至式(16)所示:
Dsog_range(Tri,Tri′)=|sogi range-sogi range| (13)
Figure BDA0002571898780000071
Figure BDA0002571898780000072
Figure BDA0002571898780000073
其中,sogi range
Figure BDA0002571898780000074
Figure BDA0002571898780000075
分别表示轨迹Tri的对地航速极差、对地航速标准 差、对地航向极差和对地航向标准差,平均值和中位数,sogi′ range
Figure BDA0002571898780000076
Figure BDA0002571898780000077
分 别表示轨迹Tri′的对地航速极差、对地航速标准差、对地航向极差和对地航向标准差,平均值 和中位数。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S32中所述的轨迹 空间相异度计算模型如下:
船舶轨迹空间距离是指不重合的轨迹线之间的空间距离,采用hausdorff距离计算轨迹空 间相异度。Hausdorff距离计算公式如式(17)所示。
Dh=max{h(Tri,Tri′),h(Tri′,Tri)} (17)
其中
Figure BDA0002571898780000078
d(pi,pi')表示点pi和 pi′的空间距离,h(Tri,Tri′)的具体计算过程:首先,循环计算轨迹Tri上点pi至轨迹Tri′上所有 点的距离,并选出点pi至轨迹Tri′所有距离的最短距离;之后,选出最短距离中的最大值,即 为h(Tri,Tri′)。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S32中所述的船舶 轨迹综合相异度计算模型如下:
在DBSCAN聚类中根据应用场景中轨迹之间的差别,对上述五类轨迹特征距离和各个空 间相异度进行选择和距离组合,构建船舶轨迹间综合距离,如式(18)所示。
Figure BDA0002571898780000079
其中,D代表船舶轨迹综合距离,ωi代表第i个的距离权重,Di′代表第i个的距离归一化 后的值,由于船舶特征距离的量纲不同,需要对特征距离进行归一化处理,以轨迹长度特征 距离为例,归一化公式如式(19)所示。
Figure BDA0002571898780000081
其中Dl为归一化前轨迹长度特征距离,Dl_max为该类距离最大值,Dl_min为该类距离最小 值。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S35中所述的聚类 结果评估模型如下:
Figure BDA0002571898780000082
其中Ci表示聚类后的第i类正常轨迹,|Ci|表示正常轨迹Ci中轨迹条数,dist(x,y)表示中 Ci轨迹x和轨迹y之间的距离,N表示异常轨迹,|N|表示异常轨迹条数,dist(w,z)表示异常 轨迹w和异常轨迹z之间的距离。
有益效果:
针对大量混合AIS船舶轨迹,难以通过一次性完成轨迹聚类的问题,通过结合船舶轨迹 相异度计算模型和聚类算法的适用性,采用分步聚类算法完成对船舶轨迹的聚类,以提高船 舶轨迹的聚类的效果和效率,从而为后续船舶航行行为分析和异常检测提供技术支持。
附图说明
图1为本发明实现流程;
图2为混合聚类模型示意图;
图3为船舶AIS轨迹示意图;
图4为船舶轨迹获取流程图;
图5为船舶轨迹K-Means聚类伪代码;
图6为船舶轨迹DBSCAN聚类伪代码;
图7为Hausdorff距离计算示意图。
具体实施方式
下面结合附图将对本发明中的技术方案进行清楚、完整地描述。基于本发明中的实施例, 本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明 保护的范围。
本发明提供的一种船舶AIS轨迹混合聚类系统,该系统包括:船舶AIS数据重构模块、 船舶轨迹初步聚类模块、船舶子轨迹类二次聚类模块;
所述船舶AIS数据重构模块用于针对历史AIS数据,根据MMSI(即水上移动通信业务 标识码)的差异识别不同船舶,根据时间戳的间隔判断AIS数据连续性从而判断同一船舶不 同模块,通过数据排序和分割的方法,获取历史船舶轨迹数据;
所述船舶轨迹初步聚类模块基于船舶轨迹起点和终点的差异,通过绘制船舶原始轨迹明 确所有船舶轨迹起点和终点分布,确定轨迹类别数目,结合K-Means算法对空间点集聚类的 优势,实现船舶轨迹初步聚类;
所述船舶子轨迹类二次聚类模块基于K-Means聚类获得子类轨迹,分析子类船舶轨迹之 间的特征差异,在对轨迹相异度计算模型进行筛选的基础上,构建综合相异度计算模型,通 过k个最近邻的距离特征确定DBSCAN算法中参数ε和MinLns的值,借助DBSCAN的算法 对密度集中的数据聚类能力和异常数据的识别能力,实现对子轨迹类的聚类。
用上述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,采用K-Means和DBSCAN 进行混合聚类,聚类模型如图2所示,该方法包括如下步骤:
S1.系统接收历史AIS数据,并对其进行数据处理后获得待分类轨迹D={x1,x2,...,xm};
S2.对步骤S1中得到的待分类轨迹D={x1,x2,...,xm}进行K-Means初步聚类得到轨迹 C={c1,c2,...,cL};
S3.对C={c1,c2,...,cL}中每一个子轨迹类cj采用不同的参数对进行DBSCNA聚类,根据 DBSCAN聚类结果ej={e1,e2,...,ep},结合聚类评估模型,计算各对参数下聚类结果的评估值, 选择最优评估的DBSCAN聚类结果作为子轨迹类cj的轨迹划分。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S1的具体方法包括:
S11.系统接收历史AIS数据如图3所示,首先对数据根据MMSI进行排序,根据前后行 的MMSI差值是否为0判断是否为同一条船舶,从差值不为0处进行分割,获取不同船舶的数据;
S12、对不同船舶数据再根据时间戳进行排序,计算前后行数据的时间戳差值,并对差值 进行统计,以时间间隔值占比小于0.05的最大时间间隔确定同一船舶不同轨迹段的划分值, 完成所有不连续的轨迹划分,获得待分类轨迹D={x1,x2,...,xm},如图4所示。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S2的具体方法包括:
S21.初始化K-Means聚类算法中轨迹类别K值:通过绘制全部轨迹,判断轨迹起点和终 点区域分布状况,记同时分布轨迹起点和终点的区域个数为z1,只包含轨迹终点或轨迹起点 的区域个数为z2,任取两个区域构成一类轨迹的数目为
Figure BDA0002571898780000091
则初始化K值为
Figure BDA0002571898780000092
S22.初始化K-Means聚类中心{μ12,...,μk}:
a.随机选取一条轨迹作为第一类轨迹的中心轨迹μ1,则该轨迹的起点和终点分别作为初 始轨迹的起点和终点特征;
b.选取与第一类轨迹的中心轨迹μ1起点和终点相异度最大的轨迹作为第二类轨迹的中心 轨迹μ2
c.选取与μ1和μ2起点和终点相异度之和最大的轨迹μ3作为第三类轨迹的中心轨迹......依 次下去,找到K类轨迹各自初始化中心轨迹{μ12,...,μK};
S23.K-Means初步聚类:输入待分类轨迹D={x1,x2,...,xm}、初始化的轨迹类别K以及迭代 次数N:如图5所示:
a.开始迭代,迭代次数从1开始,每次增加1;
b.对D={x1,x2,...,xm}所有轨迹进行循环;
c.计算待分类轨迹D={x1,x2,...,xm}中的第i条原始轨迹xi和K类轨迹各自初始化中心轨迹 uj的起点和终点相异度dij,根据最小的dij将xi划分到K-Means聚类中的第j类cj中,对 D={x1,x2,...,xm}所有轨迹进行了了划分得到聚类结果C={c1,c2,...,cK};
d.根据当前获取的聚类结果C={c1,c2,...,cK},计算各个类新的聚类中心{μ1',μ2',...,μK'};
e.判断新的聚类中心{μ1',μ2',...,μK'}与初始化中心轨迹{μ12,...,μK}是否一致,不一致同时也 未达到迭代次数N,迭代次数加1并将新的聚类中心{μ1',μ2',...,μK'}替代原始聚类中心 {μ12,...,μK},返回步骤b,前后两次聚类中心一致或者达到迭代次数N,执行步骤f;
f.返回分类K-Means聚类中最后K个分类结果C={c1,c2,...,cK}。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S23中所述的船舶 轨迹起点和终点相异度计算模型如下:
Tri=p1p2p3...pj...pn(1≤j≤n)轨迹中第一个点p1和最后一个点pn代表该条轨迹的起点 和终点,船舶轨迹的起点和终点主要差异在于经纬度的区别,即LON和LAT两个维度上, 船舶经纬度信息通过GPS数据进行定位,通过获取轨迹起点和终点的经纬度数据,构建轨迹 的起点和终点特征,如式(1)所示。
Tse={(lon1,lat1),(lonn,latn)} (1)
其中(lon1,lat1)表示轨迹起点的经纬度坐标,(lonn,latn)表示轨迹终点的经纬度坐标;
轨迹起点和终点特征相异度计算模型Dse通过分别计算轨迹Tri和Tri′的起点间距离和终 点间的距离,并计算两个距离之和,代表轨迹起点和终点的空间位置的差异,如式(2)所示:
Dse(Tri,Tri′)=dist(loni 1,lati 1,loni′ 1,lati′ 1)+dist(loni n,lati n,loni′ n,lati n) (2)
其中,
Figure BDA0002571898780000111
Figure BDA0002571898780000112
表示轨迹Tri起点经纬度,
Figure BDA0002571898780000113
Figure BDA0002571898780000114
表示轨迹Tri′起点经纬度,
Figure BDA0002571898780000115
表示轨迹Tri和Tri′起点间的经纬度距离;
Figure BDA0002571898780000116
Figure BDA0002571898780000117
表示轨迹Tri终点经纬度,
Figure BDA0002571898780000118
Figure BDA0002571898780000119
表示轨迹Tri′终点经纬度,
Figure BDA00025718987800001110
表示轨迹轨迹Tri和Tri′终点间的经纬 度距离。
S24.K-Means聚类结果清洗:由于初始化K值时,按轨迹类至多情况下进行取值,而实 际轨迹中可能并不包含K类轨迹,即C={c1,c2,...,cK}中有部分轨迹类为空值,通过判断 C={c1,c2,...,cK}中每一个类是否为空,并删除空类,最后保留下L(L≤K)类轨迹C={c1,c2,...,cL};
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S3的具体方法包括:
S31.动态相异度计算模型选取:船舶轨迹动态特征包括航速均值、航速中位数、航向均 值、航向中位数、航速极差、航速标准差、航向极差、航向标准差,采用机器学习中过滤式 方差方法,分别对cj中每条轨迹进行上述8个特征计算,再按照计算结果对cj中每个特征值 进行最大最小值归一化,最后分别对cj中各个特征值进行方差统计,并取方差较大前两个特 征对应的相异度计算模型作为动态相异度计算模型;
S32.综合相异度计算模型构建:在确定动态相异度计算模型之后,融入船舶轨迹起点和 终点相异度计算模型、长度相异度计算模型、轨迹空间相异度计算模型,构建船舶轨迹综合 相异度计算模型;
S33.初始化邻域半径ε和邻域半径中核心对象包含的最小对象数目MinLns的取值:
定义k距离曲线,对于轨迹类中的每条轨迹,计算其与其他轨迹的综合相异度的第k个最 近邻值,称第k个最近邻值为该轨迹的k距离;将轨迹类中所有轨迹的k距离递增排序,绘制 得到曲线图,称为k距离曲线;基于k距离曲线进行DBSCAN中邻域半径ε和邻域半径中核 心对象包含的最小对象数目MinLns的设置,并基于此时邻域半径ε和邻域半径中核心对象包 含的最小对象数目MinLns,对cj轨迹进行DBSCAN聚类,依次将k取值为3至8进行循环;
S34.根据此时邻域半径ε和邻域半径中核心对象包含的最小对象数目MinLns,对cj轨迹进 行DBSCAN聚类;
a.将cj类中的轨迹集合
Figure BDA00025718987800001111
均标记为未处理;
b.依次对轨迹集合
Figure BDA00025718987800001112
中的所有轨迹进行循环;
c.若轨迹集合
Figure BDA00025718987800001113
中的某条轨迹
Figure BDA00025718987800001114
已标记,则将i+1返回步骤b;
d.若轨迹集合
Figure BDA0002571898780000121
中的某条轨迹
Figure BDA0002571898780000122
未标记,并对
Figure BDA0002571898780000123
进行标记;
e.检查轨迹集合
Figure BDA0002571898780000124
中的每条轨迹
Figure BDA0002571898780000125
的邻域内船舶轨迹数目
Figure BDA0002571898780000126
f.若
Figure BDA0002571898780000127
则将
Figure BDA0002571898780000128
标记为核心轨迹,并建立新簇e,将该条轨迹
Figure BDA0002571898780000129
的邻域内 的轨迹加入集合M,同时对集合M内所有轨迹{mh}进行循环:
1).若mh未被标记,则对mh进行标记,同时检查NEps(mh):若mh为核心轨迹,将mh加入簇 e且将其邻域内、未被标记的轨迹加入集合M;若mh不为核心轨迹,将mh加入e;
2).若mh已被标记,则继续对{mh}进行循环
g.若不为核心轨迹,则标记
Figure BDA00025718987800001210
为噪声轨迹;
h.判断
Figure BDA00025718987800001211
是否循环完,未结束则将i+1返回步骤b,否则继续;
i.返回最后分类结果ej={e1,e2,...,ep}。
S35.根据DBSCAN聚类结果ej={e1,e2,...,ep},结合聚类评估模型,计算当前聚类结果的评 估值;
S36.选择聚类评估结果最小时的聚类结果,作为DBSCAN最优聚类结果,即子轨迹类cj的详细轨迹划分;
S37.C={c1,c2,...,cL}是否迭代完成,未完成则将j+1,回到步骤S31继续,否则输出 C={c1,c2,...,cL}中每一个轨迹类cj的子类聚类结果ej={e1,e2,...,ep}。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S32中所述的船舶 轨迹长度相异度计算模型如下:
根据船舶轨迹的定义Tri=p1p2p3...pj...pn(1≤j≤n),对船舶轨迹长度定义如下:
Figure BDA00025718987800001212
其中,d(pj,pj+1)表示点pj和点pj+1之间的距离。
船舶轨迹前后点之间的距离可通过前后点的经纬度计算,如式(4)所示;
d(pj,pj+1)=dis(lonj,latj,lonj+1,latj+1) (4)
其中,lonj和latj表示点Pj的经纬度,lonj+1和latj+1表示点Pj+1的经纬度, dis(lonj,latj,lonj+1,latj+1)表示点Pj和Pj+1经纬度距离。
船舶轨迹长度相异度计算模型Dl通过分别计算轨迹Tri和Tri′的长度,之后计算两条轨迹 的长度差的绝对值,作为轨迹长度相异度计算结果,如式(5)所示。
Dl(Tri,Tri′)=|Ti length-Ti′ length| (5)
其中,Ti length表示轨迹Tri的长度特征,Ti′ length表示轨迹Tri′的长度特征。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S32中所述的船舶 轨迹航速相异度计算模型如下:
分别取船舶轨迹航速的平均值和中位数作为船舶轨迹航速基本特征,如式(6)所示。
Tsog={sogmean,sogmedian} (6)
其中,sogmean表示轨迹航速的平均值,sogmedian表示轨迹航速的中位数。
船舶轨迹航速相异度包含航速平均值相异度Dsog_mean和航速中位数相异度Dsog_median;通过 分别计算轨迹Tri和Tri′的航速特征值,之后计算各自平均值和中位数的差值,并将对应差值 的绝对值作为Dsog_mean和Dsog_median计算结果,如式(7)和式(8)所示。
Dsog_mean(Tri,Tri′)=|sogi mean-sogi′ mean| (7)
Dsog_median(Tri,Tri′)=|sogi median-sogi′ mdian| (8)
其中,sogi mean和sogi median表示轨迹Tri的对地航速平均值和中位数,sogi′ mean和sogi′ mdian表示 轨迹Tri′的航速平均值和中位数。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S32中所述的船舶 轨迹航向相异度计算模型如下:
分别取船舶轨迹航向的平均值和中位数作为船舶轨迹航向基本特征,如式(9)所示:
Tsog={cogmean,cogmedian} (9)
其中,cogmean表示轨迹航向的平均值,cogmedian表示轨迹航向的中位数。
船舶轨迹航向相异度包含航向平均值相异度Dcog_mean和航向中位数相异度Dcog_median。通过 分别计算轨迹Tri和Tri′的航向特征值,之后计算各自平均值和中位数的差值,并将对应差值 的绝对值作为Dcog_mean和Dcog_median计算结果,如式(10)和(11)所示。
Dcog_mean(Tri,Tri′)=|cogi mean-cogi′ mean| (10)
Dcog_median(Tri,Tri′)=|cogi median-cogi′ median| (11)
其中,cogi mean和cogi median表示轨迹Tri的对地航向平均值和中位数,cogi′ mean和cogi′ mdian表示 轨迹Tri′的对地航向平均值和中位数。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S32中所述的船舶 轨迹运动变化相异度计算模型如下:
取航向和航速的极差和标准差作为轨迹运动变化特征,如式(12)所示:
Tgv={sogrange,sogstd,cogrange,cogstd} (12)
其中,sogrange、sogstd、cogrange和cogstd分别代表轨迹航速的极差、标准差以及航向的极 差和标准差。
船舶轨迹运动变化相异度包括航速极差相异度Dsog_range、航速标准差相异度Dsog_std、航向 极差相异度Dcog_range以及航向标注差相异度Dcog_std。通过分别计算轨迹Tri和Tri′的运动变化特 征,计算对应运动变化特征的差值的绝对值,作为Dsog_range、Dsog_std、Dcog_range和Dcog_std的计 算结果,如式(13)至式(16)所示:
Dsog_range(Tri,Tri′)=|sogi range-sogi′ range| (13)
Figure BDA0002571898780000141
Figure BDA0002571898780000142
Figure BDA0002571898780000143
其中,sogi range
Figure BDA0002571898780000144
Figure BDA0002571898780000145
分别表示轨迹Tri的对地航速极差、对地航速标准 差、对地航向极差和对地航向标准差,平均值和中位数,sogi′ range
Figure BDA0002571898780000146
Figure BDA0002571898780000147
分 别表示轨迹Tri′的对地航速极差、对地航速标准差、对地航向极差和对地航向标准差,平均值 和中位数。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S32中所述的轨迹 空间相异度计算模型如下:
船舶轨迹空间距离是指不重合的轨迹线之间的空间距离,采用hausdorff距离计算轨迹空 间相异度。Hausdorff距离计算公式如式(17)所示。
Dh=max{h(Tri,Tri′),h(Tri′,Tri)} (17)
其中
Figure RE-GDA0002709232550000146
d(pi,pi')表示点pi和 pi′的空间距离。h(Tri,Tri′)的具体计算过程如附图7所示:首先,循环计算轨迹Tri上点pi至轨 迹Tri′上所有点的距离,并选出点pi至轨迹Tri′所有距离的最短距离;之后,选出最短距离中的 最大值,即为h(Tri,Tri′)。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S32中所述的船舶 轨迹综合相异度计算模型如下:
在DBSCAN聚类中根据应用场景中轨迹之间的差别,对上述五类轨迹特征距离和各个空 间相异度进行选择和距离组合,构建船舶轨迹间综合距离,如式(18)所示。
Figure BDA0002571898780000151
其中,D代表船舶轨迹综合距离,ωi代表第i个的距离权重,Di′代表第i个的距离归一化 后的值,由于船舶特征距离的量纲不同,需要对特征距离进行归一化处理,以轨迹长度特征 距离为例,归一化公式如式(19)所示。
Figure BDA0002571898780000152
其中Dl为归一化前轨迹长度特征距离,Dl_max为该类距离最大值,Dl_min为该类距离最小 值。
所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,步骤S35中所述的聚类 结果评估模型如下:
Figure BDA0002571898780000153
其中Ci表示聚类后的第i类正常轨迹,|Ci|表示正常轨迹Ci中轨迹条数,dist(x,y)表示中 Ci轨迹x和轨迹y之间的距离,N表示异常轨迹,|N|表示异常轨迹条数,,dist(w,z)表示异 常轨迹w和异常轨迹z之间的距离。
本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上 技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员来说,在 不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的 保护范围。

Claims (13)

1.一种船舶AIS轨迹混合聚类系统,其特征在于,该系统包括:船舶AIS数据重构模块、船舶轨迹初步聚类模块、船舶子轨迹类二次聚类模块;
所述船舶AIS数据重构模块用于针对历史AIS数据,根据MMSI的差异识别不同船舶,根据时间戳的间隔判断AIS数据连续性从而判断同一船舶不同轨迹段,通过数据排序和分割的方法,获取历史船舶轨迹数据;
所述船舶轨迹初步聚类模块基于船舶轨迹起点和终点的差异,通过绘制船舶原始轨迹明确所有船舶轨迹起点和终点分布,确定轨迹类别数目,结合K-Means算法对空间点集聚类的优势,实现船舶轨迹初步聚类;
所述船舶子轨迹类二次聚类模块基于K-Means聚类获得子类轨迹,分析子类船舶轨迹之间的特征差异,在对轨迹相异度计算模型进行筛选的基础上,构建综合相异度计算模型,通过k个最近邻的距离特征确定DBSCAN算法中参数ε和MinLns的值,借助DBSCAN的算法对密度集中的数据聚类能力和异常数据的识别能力,实现对子轨迹类的聚类。
2.一种用上述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,其特征在于,该方法包括如下步骤:
S1.系统接收历史AIS数据,并对其进行数据处理后获得待分类轨迹D={x1,x2,...,xm};
S2.对步骤S1中得到的待分类轨迹D={x1,x2,...,xm}进行K-Means初步聚类得到轨迹C={c1,c2,...,cL};
S3.对C={c1,c2,...,cL}中每一个子轨迹类cj采用不同的参数对进行DBSCNA聚类,根据DBSCAN聚类结果ej={e1,e2,...,ep},结合聚类评估模型,计算各对参数下聚类结果的评估值,选择最优评估的DBSCAN聚类结果作为子轨迹类cj的轨迹划分。
3.根据权利要求2所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,其特征在于,步骤S1的具体方法包括:
S11.系统接收历史AIS数据,首先对数据根据MMSI进行排序,根据前后行的MMSI差值是否为0判断是否为同一条船舶,从差值不为0处进行分割,获取不同船舶的数据;
S12、对不同船舶数据再根据时间戳进行排序,计算前后行数据的时间戳差值,并对差值进行统计,以时间间隔值占比小于0.05的最大时间间隔确定同一船舶不同轨迹段的划分值,完成所有不连续的轨迹划分,获得待分类轨迹D={x1,x2,...,xm}。
4.根据权利要求2所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,其特征在于,步骤S2的具体方法包括:
S21.初始化K-Means聚类算法中轨迹类别K值:通过绘制全部轨迹,判断轨迹起点和终点区域分布状况,记同时分布轨迹起点和终点的区域个数为z1,只包含轨迹终点或轨迹起点的区域个数为z2,任取两个区域构成一类轨迹的数目为
Figure FDA0002571898770000021
则初始化K值为
Figure FDA0002571898770000022
S22.初始化K-Means聚类中心{μ12,...,μk}:
a.随机选取一条轨迹作为第一类轨迹的中心轨迹μ1,则该轨迹的起点和终点分别作为初始轨迹的起点和终点特征;
b.选取与第一类轨迹的中心轨迹μ1起点和终点相异度最大的轨迹作为第二类轨迹的中心轨迹μ2
c.选取与μ1和μ2起点和终点相异度之和最大的轨迹μ3作为第三类轨迹的中心轨迹......依次下去,找到K类轨迹各自初始化中心轨迹{μ12,...,μK};
S23.K-Means初步聚类:输入待分类轨迹D={x1,x2,...,xm}、初始化的轨迹类别K以及迭代次数N:
a.开始迭代,迭代次数从1开始,每次增加1;
b.对D={x1,x2,...,xm}所有轨迹进行循环;
c.计算待分类轨迹D={x1,x2,...,xm}中的第i条原始轨迹xi和K类轨迹各自初始化中心轨迹uj的起点和终点相异度dij,根据最小的dij将xi划分到K-Means聚类中的第j类cj中,对D={x1,x2,...,xm}所有轨迹进行了了划分得到聚类结果C={c1,c2,...,cK};
d.根据当前获取的聚类结果C={c1,c2,...,cK},计算各个类新的聚类中心{μ1',μ2',...,μK'};
e.判断新的聚类中心{μ1',μ2',...,μK'}与初始化中心轨迹{μ12,...,μK}是否一致,不一致同时也未达到迭代次数N,迭代次数加1并将新的聚类中心{μ1',μ2',...,μK'}替代原始聚类中心{μ12,...,μK},返回步骤b,前后两次聚类中心一致或者达到迭代次数N,执行步骤f;
f.返回分类K-Means聚类中最后K个分类结果C={c1,c2,...,cK};
S24.K-Means聚类结果清洗:由于初始化K值时,按轨迹类至多情况下进行取值,而实际轨迹中可能并不包含K类轨迹,即C={c1,c2,...,cK}中有部分轨迹类为空值,通过判断C={c1,c2,...,cK}中每一个类是否为空,并删除空类,最后保留下L(L≤K)类轨迹C={c1,c2,...,cL}。
5.根据权利要求4所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,其特征在于,步骤S22中所述的船舶轨迹起点和终点相异度计算模型如下:
Tri=p1p2p3...pj...pn(1≤j≤n)轨迹中第一个点p1和最后一个点pn代表该条轨迹的起点和终点,船舶轨迹的起点和终点主要差异在于经纬度的区别,即LON和LAT两个维度上,船舶经纬度信息通过GPS数据进行定位,通过获取轨迹起点和终点的经纬度数据,构建轨迹的起点和终点特征,如式(1)所示:
Tse={(lon1,lat1),(lonn,latn)} (1)
其中(lon1,lat1)表示轨迹起点的经纬度坐标,(lonn,latn)表示轨迹终点的经纬度坐标;
轨迹起点和终点特征相异度计算模型Dse通过分别计算轨迹Tri和Tri′的起点间距离和终点间的距离,并计算两个距离之和,代表轨迹起点和终点的空间位置的差异,如式(2)所示:
Dse(Tri,Tri′)=dist(loni 1,lati 1,loni′ 1,lati′ 1)+dist(loni n,lati n,loni′ n,lati′ n) (2)
其中,
Figure FDA0002571898770000031
Figure FDA0002571898770000032
表示轨迹Tri起点经纬度,
Figure FDA0002571898770000033
Figure FDA0002571898770000034
表示轨迹Tri′起点经纬度,
Figure FDA0002571898770000035
表示轨迹Tri和Tri′起点间的经纬度距离;
Figure FDA0002571898770000036
Figure FDA0002571898770000037
表示轨迹Tri终点经纬度,
Figure FDA0002571898770000038
Figure FDA0002571898770000039
表示轨迹Tri′终点经纬度,
Figure FDA00025718987700000310
表示轨迹轨迹Tri和Tri′终点间的经纬度距离。
6.根据权利要求2所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,其特征在于,步骤S3的具体方法包括:
S31.动态相异度计算模型选取:船舶轨迹动态特征包括航速均值、航速中位数、航向均值、航向中位数、航速极差、航速标准差、航向极差、航向标准差,采用机器学习中过滤式方差方法,分别对cj中每条轨迹进行上述8个特征计算,再按照计算结果对cj中每个特征值进行最大最小值归一化,最后分别对cj中各个特征值进行方差统计,并取方差较大前两个特征对应的相异度计算模型作为动态相异度计算模型;
S32.综合相异度计算模型构建:在确定动态相异度计算模型之后,融入船舶轨迹起点和终点相异度计算模型、船舶轨迹长度相异度计算模型、轨迹空间相异度计算模型,构建船舶轨迹综合相异度计算模型;
S33.初始化邻域半径ε和邻域半径中核心对象包含的最小对象数目MinLns的取值:
定义k距离曲线,对于轨迹类中的每条轨迹,计算其与其他轨迹的综合相异度的第k个最近邻值,称第k个最近邻值为该轨迹的k距离;将轨迹类中所有轨迹的k距离递增排序,绘制得到曲线图,称为k距离曲线;基于k距离曲线进行DBSCAN中邻域半径ε和邻域半径中核心对象包含的最小对象数目MinLns的设置,并基于此时邻域半径ε和邻域半径中核心对象包含的最小对象数目MinLns,对cj轨迹进行DBSCAN聚类,依次将k取值为3至8进行循环;
S34.根据此时邻域半径ε和邻域半径中核心对象包含的最小对象数目MinLns,对cj轨迹进行DBSCAN聚类;
a.将cj类中的轨迹集合
Figure FDA0002571898770000041
均标记为未处理;
b.依次对轨迹集合
Figure FDA0002571898770000042
中的所有轨迹进行循环;
c.若轨迹集合
Figure FDA0002571898770000043
中的某条轨迹
Figure FDA0002571898770000044
已标记,则将i+1返回步骤b;
d.若轨迹集合
Figure FDA0002571898770000045
中的某条轨迹
Figure FDA0002571898770000046
未标记,并对
Figure FDA0002571898770000047
进行标记;
e.检查轨迹集合
Figure FDA0002571898770000048
中的每条轨迹
Figure FDA0002571898770000049
的邻域内船舶轨迹数目
Figure FDA00025718987700000410
f.若
Figure FDA00025718987700000411
则将
Figure FDA00025718987700000412
标记为核心轨迹,并建立新簇e,将该条轨迹
Figure FDA00025718987700000413
的邻域内的轨迹加入集合M,同时对集合M内所有轨迹{mh}进行循环:
1).若mh未被标记,则对mh进行标记,同时检查NEps(mh):若mh为核心轨迹,将mh加入簇e且将其邻域内、未被标记的轨迹加入集合M;若mh不为核心轨迹,将mh加入e;
2).若mh已被标记,则继续对{mh}进行循环;
g.若不为核心轨迹,则标记
Figure FDA00025718987700000414
为噪声轨迹;
h.判断
Figure FDA00025718987700000415
是否循环完,未结束则将i+1返回步骤b,否则继续;
i.返回最后分类结果ej={e1,e2,...,ep};
S35.根据DBSCAN聚类结果ej={e1,e2,...,ep},结合聚类评估模型,计算当前聚类结果的评估值;
S36.选择聚类评估结果最小时的聚类结果,作为DBSCAN最优聚类结果,即子轨迹类cj的详细轨迹划分;
S37.C={c1,c2,...,cL}是否迭代完成,未完成则将j+1,回到步骤S31继续,否则输出C={c1,c2,...,cL}中每一个轨迹类cj的子类聚类结果ej={e1,e2,...,ep}。
7.根据权利要求6所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,其特征在于,步骤S32中所述的船舶轨迹长度相异度计算模型如下:
根据船舶轨迹的定义Tri=p1p2p3...pj...pn(1≤j≤n),对船舶轨迹长度定义如式(3)所示:
Figure FDA0002571898770000051
其中,d(pj,pj+1)表示点pj和点pj+1之间的距离;
船舶轨迹前后点之间的距离可通过前后点的经纬度计算,如式(4)所示;
d(pj,pj+1)=dis(lonj,latj,lonj+1,latj+1) (4)
其中,lonj和latj表示点Pj的经纬度,lonj+1和latj+1表示点Pj+1的经纬度,dis(lonj,latj,lonj+1,latj+1)表示点Pj和Pj+1经纬度距离;
船舶轨迹长度相异度计算模型Dl通过分别计算轨迹Tri和Tri′的长度,之后计算两条轨迹的长度差的绝对值,作为轨迹长度相异度计算结果,如式(5)所示:
Dl(Tri,Tri′)=|Ti length-Ti′ length| (5)
其中,Ti length表示轨迹Tri的长度特征,Ti′ length表示轨迹Tri′的长度特征。
8.根据权利要求6所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,其特征在于,步骤S32中所述的船舶轨迹航速相异度计算模型如下:
分别取船舶轨迹航速的平均值和中位数作为船舶轨迹航速基本特征,如式(6)所示。
Tsog={sogmean,sogmedian} (6)
其中,sogmean表示轨迹航速的平均值,sogmedian表示轨迹航速的中位数;
船舶轨迹航速相异度包含航速平均值相异度Dsog_mean和航速中位数相异度Dsog_median;通过分别计算轨迹Tri和Tri′的航速特征值,之后计算各自平均值和中位数的差值,并将对应差值的绝对值作为Dsog_mean和Dsog_median计算结果,如式(7)和式(8)所示:
Dsog_mean(Tri,Tri′)=|sogi mean-sogi′ mean| (7)
Dsog_median(Tri,Tri′)=|sogi median-sogi′ mdian| (8)
其中,sogi mean和sogi median表示轨迹Tri的对地航速平均值和中位数,sogi′ mean和sogi′ mdian表示轨迹Tri′的航速平均值和中位数。
9.根据权利要求6所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,其特征在于,步骤S32中所述的船舶轨迹航向相异度计算模型如下:
分别取船舶轨迹航向的平均值和中位数作为船舶轨迹航向基本特征,如式(9)所示:
Tsog={cogmean,cogmedian} (9)
其中,cogmean表示轨迹航向的平均值,cogmedian表示轨迹航向的中位数;
船舶轨迹航向相异度包含航向平均值相异度Dcog_mean和航向中位数相异度Dcog_median,通过分别计算轨迹Tri和Tri′的航向特征值,之后计算各自平均值和中位数的差值,并将对应差值的绝对值作为Dcog_mean和Dcog_median计算结果,如式(10)和(11)所示:
Dcog_mean(Tri,Tri′)=|cogi mean-cogi′ mean| (10)
Dcog_median(Tri,Tri′)=|cogi median-cogi′ median| (11)
其中,cogi mean和cogi median表示轨迹Tri的对地航向平均值和中位数,cogi′ mean和cogi′ mdian表示轨迹Tri′的对地航向平均值和中位数。
10.根据权利要求6所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,其特征在于,步骤S32中所述的船舶轨迹运动变化相异度计算模型如下:
取航向和航速的极差和标准差作为轨迹运动变化特征,如式(12)所示:
Tgv={sogrange,sogstd,cogrange,cogstd} (12)
其中,sogrange、sogstd、cogrange和cogstd分别代表轨迹航速的极差、标准差以及航向的极差和标准差;
船舶轨迹运动变化相异度包括航速极差相异度Dsog_range、航速标准差相异度Dsog_std、航向极差相异度Dcog_range以及航向标注差相异度Dcog_std,通过分别计算轨迹Tri和Tri′的运动变化特征,计算对应运动变化特征的差值的绝对值,作为Dsog_range、Dsog_std、Dcog_range和Dcog_std的计算结果,如式(13)至式(16)所示:
Dsog_range(Tri,Tri′)=|sogi range-sogi′ range| (13)
Figure FDA0002571898770000071
Figure FDA0002571898770000072
Figure FDA0002571898770000073
其中,sogi range
Figure FDA0002571898770000074
Figure FDA0002571898770000075
分别表示轨迹Tri的对地航速极差、对地航速标准差、对地航向极差和对地航向标准差,平均值和中位数,sogi′ range
Figure FDA0002571898770000076
Figure FDA0002571898770000077
分别表示轨迹Tri′的对地航速极差、对地航速标准差、对地航向极差和对地航向标准差,平均值和中位数。
11.根据权利要求6所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,其特征在于,步骤S32中所述的轨迹空间相异度计算模型如下:
船舶轨迹空间距离是指不重合的轨迹线之间的空间距离,采用hausdorff距离计算轨迹空间相异度,Hausdorff距离计算公式如式(17)所示:
Dh=max{h(Tri,Tri′),h(Tri′,Tri)} (17)
其中
Figure FDA0002571898770000078
d(pi,pi')表示点pi和pi′的空间距离,h(Tri,Tri′)的具体计算过程:首先,循环计算轨迹Tri上点pi至轨迹Tri′上所有点的距离,并选出点pi至轨迹Tri′所有距离的最短距离;之后,选出最短距离中的最大值,即为h(Tri,Tri′)。
12.根据权利要求6所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,其特征在于,步骤S32中所述的船舶轨迹综合相异度计算模型如下:
在DBSCAN聚类中根据应用场景中轨迹之间的差别,对上述五类轨迹特征距离和各个空间相异度进行选择和距离组合,构建船舶轨迹间综合距离,如式(18)所示:
Figure FDA0002571898770000079
其中,D代表船舶轨迹综合距离,ωi代表第i个的距离权重,Di′代表第i个的距离归一化后的值,由于船舶特征距离的量纲不同,需要对特征距离进行归一化处理,以轨迹长度特征距离为例,归一化公式如式(19)所示:
Figure FDA0002571898770000081
中Dl为归一化前轨迹长度特征距离,Dl_max为该类距离最大值,Dl_min为该类距离最小值。
13.根据权利要求6所述的船舶AIS轨迹混合聚类系统进行船舶轨迹混合聚类方法,其特征在于,步骤35中所述的聚类结果评估模型如式(20)所示:
Figure FDA0002571898770000082
其中,Ci表示聚类后的第i类正常轨迹,|Ci|表示正常轨迹Ci中轨迹条数,dist(x,y)表示中Ci轨迹x和轨迹y之间的距离,N表示异常轨迹,|N|表示异常轨迹条数,dist(w,z)表示异常轨迹w和异常轨迹z之间的距离。
CN202010644064.0A 2020-07-06 2020-07-06 一种船舶ais轨迹混合聚类方法及系统 Pending CN111985529A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010644064.0A CN111985529A (zh) 2020-07-06 2020-07-06 一种船舶ais轨迹混合聚类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010644064.0A CN111985529A (zh) 2020-07-06 2020-07-06 一种船舶ais轨迹混合聚类方法及系统

Publications (1)

Publication Number Publication Date
CN111985529A true CN111985529A (zh) 2020-11-24

Family

ID=73438392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010644064.0A Pending CN111985529A (zh) 2020-07-06 2020-07-06 一种船舶ais轨迹混合聚类方法及系统

Country Status (1)

Country Link
CN (1) CN111985529A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112650237A (zh) * 2020-12-21 2021-04-13 武汉理工大学 基于聚类处理和人工势场的船舶路径规划方法和装置
CN112906830A (zh) * 2021-04-14 2021-06-04 武汉理工大学 一种基于ais大数据的船舶最优航线自动生成方法
CN113312438A (zh) * 2021-03-09 2021-08-27 中南大学 融合航线提取与趋势判断的海上目标位置预测方法
CN113689739A (zh) * 2021-08-24 2021-11-23 重庆大学 一种基于历史数据的控制河段船舶上下水判定方法
CN114118243A (zh) * 2021-11-18 2022-03-01 中交疏浚技术装备国家工程研究中心有限公司 一种基于航迹数据的耙吸挖泥船施工轨迹识别方法
WO2022142384A1 (zh) * 2020-12-29 2022-07-07 武汉理工大学 一种船舶锚泊面积计算方法及装置
WO2022252398A1 (zh) * 2021-05-31 2022-12-08 武汉理工大学 基于船舶轨迹特征点提取的时空dp方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210352A (zh) * 2019-05-23 2019-09-06 中国人民解放军海军工程大学 基于航道模型的船舶轨迹异常检测方法
CN110309383A (zh) * 2019-06-17 2019-10-08 武汉科技大学 基于改进的dbscan算法的船舶轨迹聚类分析方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210352A (zh) * 2019-05-23 2019-09-06 中国人民解放军海军工程大学 基于航道模型的船舶轨迹异常检测方法
CN110309383A (zh) * 2019-06-17 2019-10-08 武汉科技大学 基于改进的dbscan算法的船舶轨迹聚类分析方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112650237A (zh) * 2020-12-21 2021-04-13 武汉理工大学 基于聚类处理和人工势场的船舶路径规划方法和装置
WO2022142384A1 (zh) * 2020-12-29 2022-07-07 武汉理工大学 一种船舶锚泊面积计算方法及装置
CN113312438A (zh) * 2021-03-09 2021-08-27 中南大学 融合航线提取与趋势判断的海上目标位置预测方法
CN113312438B (zh) * 2021-03-09 2023-09-15 中南大学 融合航线提取与趋势判断的海上目标位置预测方法
CN112906830A (zh) * 2021-04-14 2021-06-04 武汉理工大学 一种基于ais大数据的船舶最优航线自动生成方法
CN112906830B (zh) * 2021-04-14 2023-12-19 武汉理工大学 一种基于ais大数据的船舶最优航线自动生成方法
WO2022252398A1 (zh) * 2021-05-31 2022-12-08 武汉理工大学 基于船舶轨迹特征点提取的时空dp方法
CN113689739A (zh) * 2021-08-24 2021-11-23 重庆大学 一种基于历史数据的控制河段船舶上下水判定方法
CN114118243A (zh) * 2021-11-18 2022-03-01 中交疏浚技术装备国家工程研究中心有限公司 一种基于航迹数据的耙吸挖泥船施工轨迹识别方法
CN114118243B (zh) * 2021-11-18 2023-07-07 中交疏浚技术装备国家工程研究中心有限公司 一种基于航迹数据的耙吸挖泥船施工轨迹识别方法

Similar Documents

Publication Publication Date Title
CN111985529A (zh) 一种船舶ais轨迹混合聚类方法及系统
CN113780395B (zh) 海量高维ais轨迹数据聚类方法
CN111079602A (zh) 基于多尺度区域特征约束的车辆细粒度识别方法及装置
CN111310574A (zh) 一种车载视觉实时多目标多任务联合感知方法和装置
CN110609881A (zh) 车辆轨迹偏离检测方法、系统和存储介质
CN107992720B (zh) 基于共表达网络的癌症靶向标志物测绘方法
CN113591380B (zh) 基于图高斯过程的交通流预测方法、介质及设备
CN105629198A (zh) 基于密度的快速搜索聚类算法的室内多目标追踪方法
CN112149721A (zh) 一种基于主动学习降低标注需求的目标检测方法
CN110645988A (zh) 一种基于最优寿命的无人机路径规划方法
CN110443285A (zh) 相似轨迹的确定方法、装置及计算机存储介质
CN111476285A (zh) 一种图像分类模型的训练方法及图像分类方法、存储介质
CN114386466B (zh) 一种用于脉冲星搜寻中候选体信号挖掘的并行的混合聚类方法
Zhang et al. Comparison of Trajectory Clustering Methods based on K-means and DBSCAN
CN114969234A (zh) 一种面向全量城市路网的向量表征方法
CN113514072B (zh) 一种面向导航数据与大比例尺制图数据的道路匹配方法
CN114859368A (zh) 一种使用激光雷达对电力线锁线跟踪处理的方法和系统
CN113052206B (zh) 一种基于浮动车数据的路段旅行时间预测方法及装置
CN109190787B (zh) 水下潜航器的双重粒子群多监测点访问路径规划方法
CN108876144B (zh) 一种基于深度学习算法的变电站预选址方法
CN113903173A (zh) 一种基于有向图结构和lstm的车辆轨迹特征提取方法
CN108153519A (zh) 一种目标智能跟踪方法通用设计框架
CN113642682B (zh) 一种多车交互环境下的轨迹基元提取与分析方法和系统
Chen et al. Clustering network-constrained uncertain trajectories
Yang et al. Uncertainty Estimation for Monocular 3D Object Detectors in Autonomous Driving

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination