CN113988213A - 一种船舶在坞修理识别方法及系统 - Google Patents

一种船舶在坞修理识别方法及系统 Download PDF

Info

Publication number
CN113988213A
CN113988213A CN202111339271.6A CN202111339271A CN113988213A CN 113988213 A CN113988213 A CN 113988213A CN 202111339271 A CN202111339271 A CN 202111339271A CN 113988213 A CN113988213 A CN 113988213A
Authority
CN
China
Prior art keywords
ship
berth
data
berthing
longitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111339271.6A
Other languages
English (en)
Other versions
CN113988213B (zh
Inventor
段俊利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cosco Shipping Technology Co Ltd
Original Assignee
Cosco Shipping Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cosco Shipping Technology Co Ltd filed Critical Cosco Shipping Technology Co Ltd
Priority to CN202111339271.6A priority Critical patent/CN113988213B/zh
Publication of CN113988213A publication Critical patent/CN113988213A/zh
Application granted granted Critical
Publication of CN113988213B publication Critical patent/CN113988213B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提供了一种船舶在坞修理识别方法及系统,该方法先采集船舶AIS数据、港口数据和船厂数据,并根据船舶AIS数据计算得到航次动态数据,将船舶靠泊时长大于最大预设时间阈值的船舶及其靠泊点经纬度数据提取出来,然后对提取出的靠泊点经纬度数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并将船舶实际吃水数据接近船舶空载吃水数据的船舶所在泊位识别为修理泊位,最后计算船舶的靠泊点经纬度到靠泊港口的修理泊位或船厂的距离,进而识别出船舶在坞修理。本发明能够准确地定位泊位位置,并能够及时获取修建、废弃或者新建的泊位信息,并进行修改。

Description

一种船舶在坞修理识别方法及系统
技术领域
本发明涉及船舶修理技术领域,具体涉及一种船舶在坞修理识别方法及系统。
背景技术
近年来,航运的快速发展给世界修船业带来了巨大的供求关系变化,给中国修船业更是带来了前所未有的机遇。随着我国国民经济的持续稳定增长,国内的船舶修理产业发展逐渐占据全球核心地位。
船舶修理主要分为坞修和航修两种,坞修指船舶驶入船坞内也就是到船厂去修,航修是在靠泊港口期间或者是航行期间进行维修。目前识别船舶进坞修理大多都是通过船东和船厂计划才能获知识别,且在识别船舶进坞修理过程中存在着坞修位置定位不准确、坞修泊位信息缺乏等问题。
发明内容
为解决现有船舶在进坞修理过程中存在的坞修位置定位不准确、坞修泊位信息缺乏等问题,本发明提供了一种船舶在坞修理识别方法,基于机器学习中的DBSCAN密度聚类算法,使用AIS数据、港口数据及船厂数据,并结合业务逻辑,识别并标定港口的修理泊位及船厂,完成船舶在坞修理的识别,能够准确地定位泊位位置,并能够及时获取修建、废弃或者新建的泊位信息,并进行修改。本发明还涉及一种船舶在坞修理识别系统。
本发明的技术方案如下:
一种船舶在坞修理识别方法,其特征在于,包括以下步骤:
数据采集步骤:采集船舶AIS数据、港口数据和船厂数据,并根据船舶AIS数据计算得到航次动态数据,所述航次动态数据包括航行段数据、锚泊段数据和靠泊段数据;
船舶处理步骤:通过数据挖掘算法对采集的航次动态数据中的靠泊段数据进行数据挖掘,并通过船舶靠泊时长与设定的时间阈值进行比较对船舶进行处理,将船舶靠泊时长小于最小预设时间阈值的船舶剔除,将船舶靠泊时长大于最大预设时间阈值的船舶提取出来,并提取其靠泊点经纬度数据;
泊位聚类及识别步骤:对提取出的靠泊点经纬度数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并在泊位点集中将实际吃水数据接近船舶空载吃水数据的船舶所在泊位识别为修理泊位;
船舶在坞修理识别步骤:通过ST_Distance函数计算船舶的靠泊点到修理泊位的距离,并在距离小于最小预设距离阈值的泊位范围内,将距离所述船舶靠泊点最近的修理泊位作为该船舶的在坞修理泊位;在距离大于或等于最小预设距离阈值且小于最大预设距离阈值的泊位范围内,将满足靠泊时间大于预设时间阈值的泊位作为所述船舶的在坞修理泊位,进而识别出船舶在坞修理。
优选地,泊位聚类及识别步骤还包括泊位线段的形成:获取泊位点集中船艏向数据、最大经纬度坐标和最小经纬度坐标,根据最大经纬度坐标和最小经纬度坐标计算得到两者中心点的经纬度坐标,根据最大经纬度坐标、最小经纬度坐标和中心点的经纬度坐标形成泊位线段,并将出现次数最多的船艏向作为泊位线段的方向。
优选地,所述泊位聚类步骤还包括对船舶试航数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并将利用所述靠泊经纬度聚类得到的泊位点集与利用所述船舶试航数据聚类得到的泊位点集存在交集的泊位,判定为修理泊位。
优选地,所述泊位聚类步骤中,在获得若干泊位点集后,利用轮廓系数作为评价指标对泊位点集的聚类效果进行评估,并通过计算轮廓系数寻找最优的聚类参数。
优选地,所述AIS数据包括船舶移动业务识别码MMSI、经纬度位置信息、船舶状态、AIS获取时间、船艏向、对地航速和航迹向;
所述港口数据包括港口经纬度位置信息和港口代码;
所述船厂数据包括船厂经纬度位置信息、浮船坞数量和最大可停靠船舶相关属性;
所述航行段数据包括船舶移动业务识别码MMSI、起始港、起始时间、结束港、结束时间、吃水变化和航行距离;
所述锚泊段数据包括锚泊开始经纬度、锚泊结束经纬度、锚泊开始时间、锚泊结束时间、锚泊吃水、锚泊时长和锚泊港口信息;
所述靠泊段数据包括靠泊开始经纬度、靠泊结束经纬度、靠泊开始时间、靠泊结束时间、靠泊吃水、靠泊时长和靠泊港口信息。
一种船舶在坞修理识别系统,其特征在于,包括依次连接的数据采集模块、船舶处理模块、泊位聚类及识别模块以及船舶在坞修理识别模块,
所述数据采集模块,采集船舶AIS数据、港口数据和船厂数据,并根据船舶AIS数据计算得到航次动态数据,所述航次动态数据包括航行段数据、锚泊段数据和靠泊段数据;
所述船舶处理模块,通过数据挖掘算法对采集的航次动态数据中的靠泊段数据进行数据挖掘,并通过船舶靠泊时长与设定的时间阈值进行比较对船舶进行处理,将船舶靠泊时长小于最小预设时间阈值的船舶剔除,将船舶靠泊时长大于最大预设时间阈值的船舶提取出来,并提取其靠泊点经纬度数据;
所述泊位聚类及识别模块:对提取出的靠泊点经纬度数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并在泊位点集中将实际船舶吃水数据接近船舶空载吃水数据的船舶所在泊位识别为修理泊位;
所述船舶在坞修理识别模块:通过ST_Distance函数计算船舶的靠泊点到修理泊位的距离,并在距离小于最小预设距离阈值的泊位范围内,将距离所述船舶靠泊点最近的修理泊位作为该船舶的在坞修理泊位;在距离大于或等于最小预设距离阈值且小于最大预设距离阈值的泊位范围内,将满足靠泊时间大于预设时间阈值的泊位作为所述船舶的在坞修理泊位,进而识别出船舶在坞修理。
优选地,泊位聚类及识别模块还包括泊位线段的形成:获取泊位点集中船艏向数据、最大经纬度坐标和最小经纬度坐标,根据最大经纬度坐标和最小经纬度坐标计算得到两者中心点的经纬度坐标,根据最大经纬度坐标、最小经纬度坐标和中心点的经纬度坐标形成泊位线段,并将出现次数最多的船艏向作为泊位线段的方向。
优选地,所述泊位聚类模块还包括对船舶试航数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并将利用所述靠泊经纬度聚类得到的泊位点集与利用所述船舶试航数据聚类得到的泊位点集存在交集的泊位,判定为修理泊位。
优选地,所述泊位聚类模块中,在获得若干泊位点集后,利用轮廓系数作为评价指标对泊位点集的聚类效果进行评估,并通过计算轮廓系数寻找最优的聚类参数。
优选地,所述数据采集模块采集的AIS数据包括船舶移动业务识别码MMSI、经纬度位置信息、船舶状态、AIS获取时间、船艏向、对地航速和航迹向;
所述港口数据包括港口经纬度位置信息和港口代码;
所述船厂数据包括船厂经纬度位置信息、浮船坞数量和最大可停靠船舶相关属性;
所述航行段数据包括船舶移动业务识别码MMSI、起始港、起始时间、结束港、结束时间、吃水变化和航行距离;
所述锚泊段数据包括锚泊开始经纬度、锚泊结束经纬度、锚泊开始时间、锚泊结束时间、锚泊吃水、锚泊时长和锚泊港口信息;
所述靠泊段数据包括靠泊开始经纬度、靠泊结束经纬度、靠泊开始时间、靠泊结束时间、靠泊吃水、靠泊时长和靠泊港口信息。
本发明的有益效果为:
本发明提供的一种船舶在坞修理识别方法,依次设置数据采集步骤、船舶处理步骤、泊位聚类及识别步骤以及船舶在坞修理识别步骤,各步骤相互配合协同工作,首先采集船舶AIS数据、港口数据和船厂数据,并根据船舶AIS数据计算得到航次动态数据,再通过数据挖掘算法对采集的航次动态数据中的靠泊段数据进行数据挖掘,并通过船舶靠泊时长与设定的时间阈值进行比较对船舶进行处理,将船舶靠泊时长小于最小预设时间阈值的船舶剔除,将船舶靠泊时长大于最大预设时间阈值的船舶提取出来,并提取其靠泊点经纬度数据,然后基于机器学习中的DBSCAN密度聚类算法对提取出的靠泊点经纬度数据进行聚类,使用机器学习中非监督学习的DBSCAN密度聚类算法可以聚类任意形状的簇,并且不需要提前约定类的数量,最后结合相关业务逻辑,识别并标定港口的修理泊位,完成船舶在坞修理的识别,能够准确地定位泊位位置,并能够及时获取修建、废弃或者新建的泊位信息,并进行修改,方法简单,效果良好。
本发明还涉及一种船舶在坞修理识别系统,该系统与上述的船舶在坞修理识别方法相对应,可理解为是一种实现上述船舶在坞修理识别方法的系统,包括依次连接的数据采集模块、船舶处理模块、泊位聚类及识别模块以及船舶在坞修理识别模块,各模块相互协同工作,基于机器学习中的DBSCAN密度聚类算法,使用AIS数据、港口数据及船厂数据,并结合业务逻辑,识别并标定港口的修理泊位,完成船舶在坞修理的识别,能够准确地定位泊位位置,并能够及时获取修建、废弃或者新建的泊位信息,并进行修改。
附图说明
图1是本发明船舶在坞修理识别方法的流程图。
图2是本发明船舶在坞修理识别方法的优选流程图。
图3是本发明大连港修理泊位示意图。
具体实施方式
下面结合附图对本发明进行说明。
本发明涉及一种船舶在坞修理识别方法,该方法的流程图如图1所示,依次包括以下步骤:
数据采集步骤:或进一步称为数据采集和预处理步骤:采集AIS数据、港口数据和船厂数据,并优选进行预处理:具体地,如图2所示的优选流程图,先使用Python语言中的psycopg2(是Python语言的PostgreSQL数据库接口)连接PostgreSQL数据库,从PostgreSQL数据库中查询所有船舶的AIS数据,港口数据和船厂数据,在获得上述数据后,先对AIS数据进行预处理,根据AIS数据计算得到航次动态数据,具体地,是根据AIS数据status(状态)字段,港口位置以及泊位位置,计算得到的船舶的航次数据,其中,status(状态)字段为:1为锚泊,5为靠泊,0为航行,当status=5(即靠泊)时,获取该点的经纬度(lon,lat),查询以该经纬度点(lon,lat)为圆心,半径为20海里内的港口,获得港口列表(<port1,dist1>,<port2,dist2>,...,<portn,distn>),按照距离从小到大排序,将距离最近的港口作为靠泊港口,并计算该经纬度点到靠泊港口泊位的距离,将距离最小的泊位作为靠泊泊位;当status=1(即锚泊)时,查询以该点为要圆心半径20海里内的港口,将距离最近的港口作为锚泊港口,并判定为港口锚泊,若20海里内无港口,判定为中途锚泊,通过得到的锚泊段数据以及靠泊段数据,最后得到船舶的航次动态数据。优选地,船舶AIS数据包括船舶移动业务识别码MMSI、经纬度位置信息、船舶状态、AIS获取时间、船艏向、对地航速和航迹向,港口数据包括港口经纬度位置信息和港口代码,船厂数据包括船厂经纬度位置信息、浮船坞数量和最大可停靠船舶相关属性。
具体地,上述计算距离时,均使用经纬度求解两点P1、P2的球面距离,按照下式计算:
Figure BDA0003351847580000051
式中,R取地球半径6372.8km,
Figure BDA0003351847580000052
Figure BDA0003351847580000053
是经度,λ是纬度,Δλ是两点纬度差,
Figure BDA0003351847580000054
是两点经度差。
一个航次包含航行段、锚泊段和靠泊段,从上一次的靠泊结束到本次靠泊结束作为一个完整的航次。航次动态数据包括航行段数据、锚泊段数据和靠泊段数据,优选地,航行段数据包括船舶移动业务识别码MMSI、起始港、起始时间、结束港、结束时间、吃水变化和航行距离等,锚泊段数据包括锚泊开始经纬度、锚泊结束经纬度、锚泊开始时间、锚泊结束时间、锚泊吃水、锚泊时长和锚泊港口信息等,靠泊段数据包括靠泊开始经纬度、靠泊结束经纬度、靠泊开始时间、靠泊结束时间、靠泊吃水、靠泊时长和靠泊港口信息等。
需要说明的是,上述的锚泊时长和靠泊时长,均以锚、靠泊开始时间与结束时间之差作为锚、靠泊时长,并存储在数据库中,以便于后续机器学习算法的使用。
船舶处理步骤:通过数据挖掘算法对采集的航次动态数据中的大量靠泊段数据进行数据挖掘和资料查询,并通过船舶靠泊时长与设定的时间阈值进行比较来识别船舶类型,设定最小预设时间阈值为10小时,最大预设时间阈值为200小时,将船舶靠泊时长小于10小时的船舶识别为油船或拖轮,并将所述油船或拖轮剔除,将船舶靠泊时长大于200小时的船舶提取出来,并提取其靠泊点经纬度数据;
泊位聚类及识别步骤:对提取出的靠泊点经纬度数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并在泊位点集中将船舶吃水数据小于预设阈值的船舶所在泊位识别为修理泊位。
其中,DBSCAN密度聚类算法是机器学习非监督学习中的一种算法,其原理是由密度可达关系导出的最大密度相连的样本集合,即为我们最终聚类的一个类别,或者说一个簇,只需要关注邻域参数(∈,MinPts),在寻找最优参数时使用轮廓系数作为评价指标,就可以用来评估聚类效果的好坏,轮廓系数越接近于1,聚类效果越好,越接近于-1,说明样本i更应该分类到另外的簇。本方法使用机器学习中的DBSCAN密度聚类算法来挖掘修理泊位,与其他聚类算法相比,DBSCAN密度聚类算法可以聚类任意形状的簇,并且不需要提前约定类的数量,且本方法使用的距离度量为直接用经纬度数值进行计算,原因在于:①经纬度距离计算繁琐,大数据集计算时可能需要较长的时间;②经纬度距离和直接用经纬度数值的欧式距离在对修理泊位聚类时差异很小。出于计算方便考虑,最终使用十进制经纬度数值的欧式距离作为聚类的距离标准。
具体地,以大连港为例,查询大连港的航次靠泊数据,将船舶开始靠泊时的靠泊点经纬度数据作为DBSCAN密度聚类算法的数据,对靠泊点经纬度数据采用DBSCAN密度聚类算法进行聚类,删除噪声数据,获得若干泊位点集(或可称为泊位的簇),存储到数据库中,参考大部分的泊位长度,以及聚类的邻域参数,发现能够成为核心对象的泊位半径设置在0.01-0.02之间,邻域内最小点集数量设置在20-50之间,利用轮廓系数作为评价指标对泊位点集的聚类效果进行评估,并通过计算轮廓系数寻找最优以及最合适的邻域参数,通过不断尝试,最终选定最优的邻域参数为半径0.025,最小点集数量为30。
在获取大连港的泊位点集后,获取泊位点集中的船艏向数据、最大经纬度坐标和最小经纬度坐标,将最大经纬度坐标和最小经纬度坐标取平均得到两者中心点的经纬度坐标,根据最大经纬度坐标、最小经纬度坐标和中心点的经纬度坐标形成泊位线段,并将出现次数最多的船艏向(即船艏向的众数)作为泊位线段的方向。图3为大连港的泊位线段在谷歌地图上的展示。
泊位线段形成后,对于聚类得到的各个泊位点集,可能存在大型船舶装卸货的泊位,此类泊位中的装卸货船舶由于载重较大,靠泊时间也会较长,而船舶在修理泊位靠泊时,通常会比在装卸货泊位上停靠的时间长,可能长达十几天乃至几十天,故将修理泊位的靠泊时长定为200小时,结合相关业务可以知道,船舶在进入岸上的船坞之前,会将压载水排空,因此当泊位点集中靠泊船型多种多样时,将在泊位点集中靠泊时长大于200小时的船舶,且实际吃水数据略大于船舶空载吃水数据(即接近空载吃水数据)的船舶所在泊位识别为修理泊位。此外,鉴于很多情况下,船厂是修造一体的,因此选择加入试航数据(即试航出发点经纬度)进行聚类识别,新船造好后,会从船厂出发进行一段距离的试航,在船舶建成日期之前的AIS数据均为试航数据,对船舶试航数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并将利用靠泊经纬度聚类得到的泊位点集与上述利用船舶试航数据聚类得到的泊位点集存在交集的泊位,判定为修理泊位。
通过上述步骤得到修理泊位后,查询大连港的船厂数据,将识别出的多个修理泊位利用DBSCAN聚类算法计算得到各修理泊位的中心点经纬度,并利用PostGIS中的ST_Distance函数计算船厂到各修理泊位中心点的距离,将距离船厂最近的修理泊位与之相匹配,由此将船厂的经纬度点扩展至一个区域,修理泊位以船厂名称命名,并将船厂的浮船坞数量、最大可停靠船舶信息等集成到该修理泊位上,保存到数据库中,进而就可以获得该修理泊位可以修理的船型大小、载重吨等信息。此外,由业务可以了解到,有的船厂具备修理多船型船舶的条件,也有的船厂专门为指定的特殊船型服务,若修理泊位只靠泊过一种船型,则该泊位为特定船型的修理泊位。
船舶在坞修理识别步骤:在修理泊位和船厂匹配后,以孔雀座船舶为例,查询孔雀座的航次动态数据,对于靠泊在大连港的航次,使用PostGIS中的ST_Distance函数计算该船舶的靠泊点经纬度到靠泊港口的修理泊位或船厂的距离,并设定最小预设距离阈值为2海里,最大预设距离阈值为5海里,查询距离小于2海里的泊位,将距离该船舶靠泊点最近的修理泊位识别为该船舶的在坞修理泊位,若不满足距离小于2海里,但是靠泊时间大于240个小时,距离在5海里以内,则也识别为该船舶的在坞修理泊位,进而识别孔雀座在大连港在坞修理。
需要说明的是,上述最小预设距离阈值2海里是通过对所有船舶航次动态靠泊点到泊位的距离进行计算,计算出的距离均在2海里以内,故优选将距离阈值设为2海里,最大预设距离阈值为5海里是通过对所有船舶航次动态靠泊点到泊位的距离进行计算,计算出的距离均在5海里以内,故优选将距离阈值设为5海里,通过对大量船舶的靠泊时长进行数据挖掘,发现大部分船舶靠泊时长基本都小于240个小时,故该实施例选择靠泊时长超过240小时认为在修理。
本发明还涉及了一种船舶在坞修理识别系统,该系统与上述船舶在坞修理识别方法相对应,可理解为是实现上述方法的系统,该系统包括依次连接的数据采集模块、船舶处理模块、泊位聚类及识别模块以及船舶在坞修理识别模块,图2也可以理解为是系统工作原理图,具体地,
数据采集模块,采集船舶AIS数据、港口数据和船厂数据,并根据船舶AIS数据计算得到航次动态数据,所述航次动态数据包括航行段数据、锚泊段数据和靠泊段数据;
船舶处理模块,通过数据挖掘算法对采集的航次动态数据中的靠泊段数据进行数据挖掘,并通过船舶靠泊时长与设定的时间阈值进行比较来识别船舶类型,将船舶靠泊时长小于最小预设时间阈值的船舶识别为油船或拖轮,并将所述油船或拖轮剔除,将船舶靠泊时长大于最大预设时间阈值的船舶提取出来,并提取其靠泊点经纬度数据;
泊位聚类及识别模块:对提取出的靠泊点经纬度数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并在泊位点集中将实际船舶吃水数据略大于(或者说是接近于)船舶空载吃水数据的船舶所在泊位识别为修理泊位;
船舶在坞修理识别模块:通过ST_Distance函数计算船舶的靠泊点到修理泊位的距离,并在距离小于最小预设距离阈值的泊位范围内,将距离所述船舶靠泊点最近的修理泊位作为该船舶的在坞修理泊位;在距离大于或等于最小预设距离阈值且小于最大预设距离阈值的泊位范围内,将满足靠泊时间大于预设时间阈值的泊位作为所述船舶的在坞修理泊位,进而识别出船舶在坞修理。
优选地,泊位聚类及识别模块还包括泊位线段的形成:获取泊位点集中船艏向数据、最大经纬度坐标和最小经纬度坐标,根据最大经纬度坐标和最小经纬度坐标计算得到两者中心点的经纬度坐标,根据最大经纬度坐标、最小经纬度坐标和中心点的经纬度坐标形成泊位线段,并将出现次数最多的船艏向作为泊位线段的方向。
优选地,泊位聚类及识别模块还包括对船舶试航数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并将利用所述靠泊经纬度聚类得到的泊位点集与利用所述船舶试航数据聚类得到的泊位点集存在交集的泊位,判定为修理泊位。
优选地,泊位聚类及识别模块中,在获得若干泊位点集后,利用轮廓系数作为评价指标对泊位点集的聚类效果进行评估,并通过计算轮廓系数寻找最优的聚类参数。
优选地,AIS数据包括船舶移动业务识别码MMSI、经纬度位置信息、船舶状态、AIS获取时间、船艏向、对地航速和航迹向;
港口数据包括港口经纬度位置信息和港口代码;
船厂数据包括船厂经纬度位置信息、浮船坞数量和最大可停靠船舶相关属性;
航行段数据包括船舶移动业务识别码MMSI、起始港、起始时间、结束港、结束时间、吃水变化和航行距离;
锚泊段数据包括锚泊开始经纬度、锚泊结束经纬度、锚泊开始时间、锚泊结束时间、锚泊吃水、锚泊时长和锚泊港口信息;
靠泊段数据包括靠泊开始经纬度、靠泊结束经纬度、靠泊开始时间、靠泊结束时间、靠泊吃水、靠泊时长和靠泊港口信息。
本发明提供了客观、科学的船舶在坞修理识别方法及系统,基于机器学习中的DBSCAN密度聚类算法,使用AIS数据、港口数据及船厂数据,并结合业务逻辑,识别并标定港口的修理泊位及船厂,完成船舶在坞修理的识别,能够准确地定位泊位位置,并能够及时获取修建、废弃或者新建的泊位信息,并进行修改。
应当指出,以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明创造,但不以任何方式限制本发明创造。因此,尽管本说明书参照附图和实施例对本发明创造已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换,总之,一切不脱离本发明创造的精神和范围的技术方案及其改进,其均应涵盖在本发明创造专利的保护范围当中。

Claims (10)

1.一种船舶在坞修理识别方法,其特征在于,包括以下步骤:
数据采集步骤:采集船舶AIS数据、港口数据和船厂数据,并根据船舶AIS数据计算得到航次动态数据,所述航次动态数据包括航行段数据、锚泊段数据和靠泊段数据;
船舶处理步骤:通过数据挖掘算法对采集的航次动态数据中的靠泊段数据进行数据挖掘,并通过船舶靠泊时长与设定的时间阈值进行比较对船舶进行处理,将船舶靠泊时长小于最小预设时间阈值的船舶剔除,将船舶靠泊时长大于最大预设时间阈值的船舶提取出来,并提取其靠泊点经纬度数据;
泊位聚类及识别步骤:对提取出的靠泊点经纬度数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并在泊位点集中将实际吃水数据接近船舶空载吃水数据的船舶所在泊位识别为修理泊位;
船舶在坞修理识别步骤:通过ST_Distance函数计算船舶的靠泊点到修理泊位的距离,并在距离小于最小预设距离阈值的泊位范围内,将距离所述船舶靠泊点最近的修理泊位作为该船舶的在坞修理泊位;在距离大于或等于最小预设距离阈值且小于最大预设距离阈值的泊位范围内,将满足靠泊时间大于预设时间阈值的泊位作为所述船舶的在坞修理泊位,进而识别出船舶在坞修理。
2.根据权利要求1所述的船舶在坞修理识别方法,其特征在于,泊位聚类及识别步骤还包括泊位线段的形成:获取泊位点集中船艏向数据、最大经纬度坐标和最小经纬度坐标,根据最大经纬度坐标和最小经纬度坐标计算得到两者中心点的经纬度坐标,根据最大经纬度坐标、最小经纬度坐标和中心点的经纬度坐标形成泊位线段,并将出现次数最多的船艏向作为泊位线段的方向。
3.根据权利要求1所述的船舶在坞修理识别方法,其特征在于,所述泊位聚类步骤还包括对船舶试航数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并将利用所述靠泊经纬度聚类得到的泊位点集与利用所述船舶试航数据聚类得到的泊位点集存在交集的泊位,判定为修理泊位。
4.根据权利要求1或3所述的船舶在坞修理识别方法,其特征在于,所述泊位聚类步骤中,在获得若干泊位点集后,利用轮廓系数作为评价指标对泊位点集的聚类效果进行评估,并通过计算轮廓系数寻找最优的聚类参数。
5.根据权利要求1所述的船舶在坞修理识别方法,其特征在于,所述AIS数据包括船舶移动业务识别码MMSI、经纬度位置信息、船舶状态、AIS获取时间、船艏向、对地航速和航迹向;
所述港口数据包括港口经纬度位置信息和港口代码;
所述船厂数据包括船厂经纬度位置信息、浮船坞数量和最大可停靠船舶相关属性;
所述航行段数据包括船舶移动业务识别码MMSI、起始港、起始时间、结束港、结束时间、吃水变化和航行距离;
所述锚泊段数据包括锚泊开始经纬度、锚泊结束经纬度、锚泊开始时间、锚泊结束时间、锚泊吃水、锚泊时长和锚泊港口信息;
所述靠泊段数据包括靠泊开始经纬度、靠泊结束经纬度、靠泊开始时间、靠泊结束时间、靠泊吃水、靠泊时长和靠泊港口信息。
6.一种船舶在坞修理识别系统,其特征在于,包括依次连接的数据采集模块、船舶处理模块、泊位聚类及识别模块以及船舶在坞修理识别模块,
所述数据采集模块,采集船舶AIS数据、港口数据和船厂数据,并根据船舶AIS数据计算得到航次动态数据,所述航次动态数据包括航行段数据、锚泊段数据和靠泊段数据;
所述船舶处理模块,通过数据挖掘算法对采集的航次动态数据中的靠泊段数据进行数据挖掘,并通过船舶靠泊时长与设定的时间阈值进行比较对船舶进行处理,将船舶靠泊时长小于最小预设时间阈值的船舶剔除,将船舶靠泊时长大于最大预设时间阈值的船舶提取出来,并提取其靠泊点经纬度数据;
所述泊位聚类及识别模块:对提取出的靠泊点经纬度数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并在泊位点集中将实际船舶吃水数据接近船舶空载吃水数据的船舶所在泊位识别为修理泊位;
所述船舶在坞修理识别模块:通过ST_Distance函数计算船舶的靠泊点到修理泊位的距离,并在距离小于最小预设距离阈值的泊位范围内,将距离所述船舶靠泊点最近的修理泊位作为该船舶的在坞修理泊位;在距离大于或等于最小预设距离阈值且小于最大预设距离阈值的泊位范围内,将满足靠泊时间大于预设时间阈值的泊位作为所述船舶的在坞修理泊位,进而识别出船舶在坞修理。
7.根据权利要求6所述的船舶在坞修理识别系统,其特征在于,泊位聚类及识别模块还包括泊位线段的形成:获取泊位点集中船艏向数据、最大经纬度坐标和最小经纬度坐标,根据最大经纬度坐标和最小经纬度坐标计算得到两者中心点的经纬度坐标,根据最大经纬度坐标、最小经纬度坐标和中心点的经纬度坐标形成泊位线段,并将出现次数最多的船艏向作为泊位线段的方向。
8.根据权利要求6所述的船舶在坞修理识别系统,其特征在于,所述泊位聚类模块还包括对船舶试航数据采用DBSCAN聚类算法进行聚类,获得若干泊位点集,并将利用所述靠泊经纬度聚类得到的泊位点集与利用所述船舶试航数据聚类得到的泊位点集存在交集的泊位,判定为修理泊位。
9.根据权利要求6或8所述的船舶在坞修理识别系统,其特征在于,所述泊位聚类模块中,在获得若干泊位点集后,利用轮廓系数作为评价指标对泊位点集的聚类效果进行评估,并通过计算轮廓系数寻找最优的聚类参数。
10.根据权利要求6所述的船舶在坞修理识别系统,其特征在于,所述数据采集模块采集的AIS数据包括船舶移动业务识别码MMSI、经纬度位置信息、船舶状态、AIS获取时间、船艏向、对地航速和航迹向;
所述港口数据包括港口经纬度位置信息和港口代码;
所述船厂数据包括船厂经纬度位置信息、浮船坞数量和最大可停靠船舶相关属性;
所述航行段数据包括船舶移动业务识别码MMSI、起始港、起始时间、结束港、结束时间、吃水变化和航行距离;
所述锚泊段数据包括锚泊开始经纬度、锚泊结束经纬度、锚泊开始时间、锚泊结束时间、锚泊吃水、锚泊时长和锚泊港口信息;
所述靠泊段数据包括靠泊开始经纬度、靠泊结束经纬度、靠泊开始时间、靠泊结束时间、靠泊吃水、靠泊时长和靠泊港口信息。
CN202111339271.6A 2021-11-12 2021-11-12 一种船舶在坞修理识别方法及系统 Active CN113988213B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111339271.6A CN113988213B (zh) 2021-11-12 2021-11-12 一种船舶在坞修理识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111339271.6A CN113988213B (zh) 2021-11-12 2021-11-12 一种船舶在坞修理识别方法及系统

Publications (2)

Publication Number Publication Date
CN113988213A true CN113988213A (zh) 2022-01-28
CN113988213B CN113988213B (zh) 2024-03-19

Family

ID=79748172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111339271.6A Active CN113988213B (zh) 2021-11-12 2021-11-12 一种船舶在坞修理识别方法及系统

Country Status (1)

Country Link
CN (1) CN113988213B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115310533A (zh) * 2022-08-05 2022-11-08 中远海运科技股份有限公司 一种基于ais的海上风电场识别方法及系统
CN116049208A (zh) * 2023-01-19 2023-05-02 中远海运科技股份有限公司 一种船舶imo号与mmsi号自动更新匹配方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201319821D0 (en) * 2013-11-11 2013-12-25 Tradenet Commercial Networking Ltd A method and system of tracking vessels
GB201319825D0 (en) * 2013-11-11 2013-12-25 Tradenet Commercial Networking Ltd A method and system for tracking shipping cargo
CN109740494A (zh) * 2018-12-27 2019-05-10 中国船舶重工集团公司第七研究院 一种基于船舶轨迹大数据的港口识别方法
CN110750571A (zh) * 2018-07-23 2020-02-04 中电科海洋信息技术研究院有限公司 港口泊位数据挖掘方法、装置、设备和储存介质
CN111581314A (zh) * 2020-04-26 2020-08-25 亿海蓝(北京)数据技术股份公司 基于船舶轨迹的泊位识别方法及装置
CN112541591A (zh) * 2020-11-26 2021-03-23 中远海运科技股份有限公司 一种泊位识别方法、平台

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201319821D0 (en) * 2013-11-11 2013-12-25 Tradenet Commercial Networking Ltd A method and system of tracking vessels
GB201319825D0 (en) * 2013-11-11 2013-12-25 Tradenet Commercial Networking Ltd A method and system for tracking shipping cargo
CN110750571A (zh) * 2018-07-23 2020-02-04 中电科海洋信息技术研究院有限公司 港口泊位数据挖掘方法、装置、设备和储存介质
CN109740494A (zh) * 2018-12-27 2019-05-10 中国船舶重工集团公司第七研究院 一种基于船舶轨迹大数据的港口识别方法
CN111581314A (zh) * 2020-04-26 2020-08-25 亿海蓝(北京)数据技术股份公司 基于船舶轨迹的泊位识别方法及装置
CN112541591A (zh) * 2020-11-26 2021-03-23 中远海运科技股份有限公司 一种泊位识别方法、平台

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
叶仁道;姜玲;张瑜;: "大数据背景下全球船舶停泊点的数据挖掘分析", 杭州电子科技大学学报(社会科学版), no. 01, 15 February 2018 (2018-02-15) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115310533A (zh) * 2022-08-05 2022-11-08 中远海运科技股份有限公司 一种基于ais的海上风电场识别方法及系统
CN115310533B (zh) * 2022-08-05 2024-01-19 中远海运科技股份有限公司 一种基于ais的海上风电场识别方法及系统
CN116049208A (zh) * 2023-01-19 2023-05-02 中远海运科技股份有限公司 一种船舶imo号与mmsi号自动更新匹配方法及系统
CN116049208B (zh) * 2023-01-19 2023-10-31 中远海运科技股份有限公司 一种船舶imo号与mmsi号自动更新匹配方法及系统

Also Published As

Publication number Publication date
CN113988213B (zh) 2024-03-19

Similar Documents

Publication Publication Date Title
CN113988213A (zh) 一种船舶在坞修理识别方法及系统
CN112906830B (zh) 一种基于ais大数据的船舶最优航线自动生成方法
CN113450596B (zh) 基于船舶轨迹特征点提取的时空dp方法
CN113537386B (zh) 一种基于改进K-Medoids聚类的船舶典型运动轨迹自适应挖掘方法
CN114444315B (zh) 一种船舶避台航线模拟方法及系统
CN112446096A (zh) 一种基于航行大数据的船舶主机油耗动态预估方法
CN111581314B (zh) 基于船舶轨迹的泊位识别方法及装置
CN112541591A (zh) 一种泊位识别方法、平台
CN111291149A (zh) 基于航向偏差的船舶ais时空轨迹分段及模式提取方法
CN115060264A (zh) 一种基于ais数据的prm航线规划方法
CN113822630B (zh) 一种基于ais的lng船运力跟踪方法及系统
CN116049208B (zh) 一种船舶imo号与mmsi号自动更新匹配方法及系统
CN113962321B (zh) 一种船对船装卸货识别处理方法及系统
CN115456258A (zh) 竞争对手船舶运力预测方法、计算机可读介质
CN115587308A (zh) 航道的确定方法、装置、电子设备及存储介质
CN114003676A (zh) 一种拖轮引航识别处理方法及系统
WO2023035309A1 (zh) 一种船对船加油识别处理方法及系统
CN114331042A (zh) 一种船舶碰撞风险分析方法
CN114492571A (zh) 一种基于相似度距离的船舶轨迹分类方法
CN115294802B (zh) 一种基于ais数据的船舶航行状态智能识别方法及系统
CN116592894B (zh) 一种航线规划方法、装置及存储介质
CN111722252B (zh) 一种高精准的基于轨迹数据的作业面识别方法
CN114461937B (zh) 船舶事故应急资源搜索方法及系统
CN113505836B (zh) 基于大数据的船舶航线自动生成方法
KR102631383B1 (ko) 인공지능 기반 선박 운항 변수 예측 방법 및 상기 방법이 기록된 컴퓨터 판독 가능한 기록매체

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant