CN115186234A - 港口距离矩阵的计算方法、装置、电子设备及存储介质 - Google Patents

港口距离矩阵的计算方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115186234A
CN115186234A CN202211106993.1A CN202211106993A CN115186234A CN 115186234 A CN115186234 A CN 115186234A CN 202211106993 A CN202211106993 A CN 202211106993A CN 115186234 A CN115186234 A CN 115186234A
Authority
CN
China
Prior art keywords
port
ship
navigation
target
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211106993.1A
Other languages
English (en)
Other versions
CN115186234B (zh
Inventor
叶劲松
张凤
杨艳芳
刘家佳
徐瑞光
宋晓丽
李洪囤
王松涛
周雷
周梦婕
党欣媛
郭亚茹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Transportation Sciences
Original Assignee
China Academy of Transportation Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Transportation Sciences filed Critical China Academy of Transportation Sciences
Priority to CN202211106993.1A priority Critical patent/CN115186234B/zh
Publication of CN115186234A publication Critical patent/CN115186234A/zh
Application granted granted Critical
Publication of CN115186234B publication Critical patent/CN115186234B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Navigation (AREA)

Abstract

本申请实施例提供了一种港口距离矩阵的计算方法、装置、电子设备及存储介质,属于数据处理技术领域,为解决如何准确地计算港口距离矩阵的问题,提出如下方案:将进出港报告数据提取的MMSI与预处理后AIS数据中的MMSI进行关联,得到航行轨迹点;对航行轨迹点进行排列,根据航线轨迹点序列和航行速度确定起止航行轨迹;基于聚类算法对起止航行轨迹进行聚类,得到停留区,根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程;将停留区与第一对应关系进行匹配,得到目标港区;将目标港区与第二对应关系进行匹配,得到目标港口;计算目标港口与其他港口之间的港口距离,进而生成港口距离矩阵。这样,可以准确地计算港口距离矩阵。

Description

港口距离矩阵的计算方法、装置、电子设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种港口距离矩阵的计算方法、装置、电子设备及存储介质。
背景技术
现有船舶技术中,形成全国港口距离矩阵是进行全国周转量计算的基础。但是目前并没有形成全国统一的港口距离矩阵,只有依据航道整合的里程表。如何准确地计算港口距离矩阵成为亟需解决的问题。
发明内容
为了解决上述技术问题,本申请实施例提供了一种港口距离矩阵的计算方法、装置、电子设备及存储介质。
第一方面,本申请实施例提供了一种港口距离矩阵的计算方法,所述方法包括:
根据进出港报告数据提取各船舶的MMSI,将提取的MMSI与预处理后AIS数据中的MMSI进行关联,得到各船舶的航行轨迹点;
按照时间顺序对各船舶的航行轨迹点进行排列,得到各船舶的航线轨迹点序列,根据各船舶的航线轨迹点序列和航行速度确定起止航行轨迹;
基于聚类算法对各船舶的起止航行轨迹进行聚类,得到各船舶在港口的停留区,根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程;
将各船舶的停留区与第一对应关系进行匹配,得到目标港区,所述第一对应关系为港区与位置信息之间的对应关系;
将所述目标港区与第二对应关系进行匹配,得到所述目标港区对应的目标港口,所述第二对应关系为港区和港口之间的对应关系;
计算所述目标港口与其他港口之间的港口距离,根据多个所述港口距离生成港口距离矩阵。
在一实施方式中,所述基于聚类算法对各船舶的起止航行轨迹进行聚类,得到各船舶在港口的停留区,包括:
基于聚类算法对各船舶在预设时间内的航速小于预设速度的轨迹点进行聚类,得到聚类簇,根据所述聚类簇确定所述停留区。
在一实施方式中,所述基于聚类算法对各船舶在预设时间内的航速小于预设速度的轨迹点进行聚类,得到聚类簇,包括:
将各船舶在预设时间内的航行轨迹点按照时间顺序排列,得到轨迹点序列;
确定邻域半径及邻域内最少点个数;
遍历所述轨迹点序列中的轨迹点,确定核心点,所述核心点为在所述邻域半径内的所有点个数大于或等于所述邻域内最少点个数的轨迹点;
将所述核心点的邻域半径内的所有点归入停泊点集合中;
将所述停泊点集合确定为所述聚类簇。
在一实施方式中,所述根据各船舶的航线轨迹点序列和航行速度确定起止航行轨迹,包括:
遍历读取航线轨迹点序列中各轨迹点对应的航行速度,根据相邻航线轨迹点的速度大小关系确定航行起始时刻和航行结束时刻;
根据所述航行起始时刻和所述航行结束时刻从各船舶的航线轨迹点序列中确定所述起止航行轨迹。
在一实施方式中,所述根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程,包括:
按照时间顺序对两个停留区之间的航行轨迹点进行排列,得到起止轨迹点序列,所述起止轨迹点序列的各轨迹点包括经纬度信息;
根据各轨迹点的经纬度信息计算相邻两个轨迹点的距离;
将相邻两个轨迹点的距离累计相加,得到两个停留区之间的航行里程。
在一实施方式中,所述将各船舶的停留区与第一对应关系进行匹配,得到目标港区,包括:
获取所述停留区的核心点位置信息,从所述第一对应关系中确定与所述核心点位置信息之间的距离误差小于或等于预设偏移距离的目标位置信息;
将所述目标位置信息对应的港区确定为所述目标港区。
在一实施方式中,所述计算所述目标港口与其他港口之间的港口距离,包括:
若所述目标港口的目标港区与其他港口的各港区之间的距离处于同一距离范围内,则计算所述目标港口的所述目标港区与所述其他港口的各港区之间的距离的算术平均距离,将所述算术平均距离作为所述目标港口的目标港区与所述其他港口的各港区的平均距离;
若所述目标港口的目标港区与所述其他港口的各港区之间的距离不处于同一距离范围内,则基于所述预处理后AIS数据计算所述目标港口的目标港区到所述其他港口的各港区的船舶数量及船舶占比,将所述船舶占比确定为权重,基于所述目标港区与所述其他港口的各港区之间的距离和所述权重计算所述目标港口的目标港区与所述其他港口的各港区之间的平均距离。
第二方面,本申请实施例提供了一种港口距离矩阵的计算装置,所述装置包括:
提取模块,用于根据进出港报告数据提取各船舶的MMSI,将提取的MMSI与预处理后AIS数据中的MMSI进行关联,得到各船舶的航行轨迹点;
确定模块,用于按照时间顺序对各船舶的航行轨迹点进行排列,得到各船舶的航线轨迹点序列,根据各船舶的航线轨迹点序列和航行速度确定起止航行轨迹;
聚类模块,用于基于聚类算法对各船舶的起止航行轨迹进行聚类,得到各船舶在港口的停留区,根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程;
第一匹配模块,用于将各船舶的停留区与第一对应关系进行匹配,得到目标港区,所述第一对应关系为港区与位置信息之间的对应关系;
第二匹配模块,用于将所述目标港区与第二对应关系进行匹配,得到所述目标港区对应的目标港口,所述第二对应关系为港区和港口之间的对应关系;
计算模块,用于计算所述目标港口与其他港口之间的港口距离,根据多个所述港口距离生成港口距离矩阵。
第三方面,本申请实施例提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储计算机程序,所述计算机程序在所述处理器运行时执行第一方面提供的港口距离矩阵的计算方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序在处理器上运行时执行第一方面提供的港口距离矩阵的计算方法。
上述本申请提供的港口距离矩阵的计算方法、装置、电子设备及存储介质,根据进出港报告数据提取各船舶的MMSI,将提取的MMSI与预处理后AIS数据中的MMSI进行关联,得到各船舶的航行轨迹点;按照时间顺序对各船舶的航行轨迹点进行排列,得到各船舶的航线轨迹点序列,根据各船舶的航线轨迹点序列和航行速度确定起止航行轨迹;基于聚类算法对各船舶的起止航行轨迹进行聚类,得到各船舶在港口的停留区,根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程;将各船舶的停留区与第一对应关系进行匹配,得到目标港区;将所述目标港区与第二对应关系进行匹配,得到所述目标港区对应的目标港口;计算所述目标港口与其他港口之间的港口距离,根据多个所述港口距离生成港口距离矩阵。这样,基于进出港报告数据和预处理后AIS数据可以准确地计算港口距离矩阵,提高港口距离矩阵的计算效率,为计算船舶周转量提供准确的港口距离矩阵。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对本申请保护范围的限定。在各个附图中,类似的构成部分采用类似的编号。
图1示出了本申请实施例提供的港口距离矩阵的计算方法的一流程示意图;
图2示出了本申请实施例提供的港口和港区的位置关系的一示意图;
图3示出了本申请实施例提供的港口距离矩阵的计算装置的一结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。
通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在下文中,可在本申请的各种实施例中使用的术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。
此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本申请的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本申请的各种实施例中被清楚地限定。
实施例1
本公开实施例提供了一种港口距离矩阵的计算方法。
参见图1,港口距离矩阵的计算方法包括:
步骤S101,根据进出港报告数据提取各船舶的MMSI,将提取的MMSI与预处理后AIS数据中的MMSI进行关联,得到各船舶的航行轨迹点。
在本实施例中,船舶自动识别系统(Automatic Identification System,AIS)数据十分庞大,且字段少,没有明确的指向性,为避免过量计算,可以先利用进出港报告数据把某一统计期内到达各省的所有船舶的航行路线查找出来,并提取各船舶船的水上移动通信业务标识码(Maritime Mobile Service Identify,MMSI),将各船舶的MMSI与AIS数据进行关联,获取各船舶的实时经纬度轨迹。
在一实施方式中,步骤S101中的所述根据进出港报告数据提取各船舶的MMSI,包括:
从所述进出港报告数据中匹配得到相邻的出港报告记录和进港报告记录,得到出港与进港记录配对表;
根据所述出港与进港记录配对确定各港口的进港船舶数据;
对各港口的进港船舶数据去除重复数据,得到各港口的各船舶的MMSI。
示范性的,利用全国进出港报告数据提取各船舶的MMSI。以A行政区域为例,使用全国进出港报告数据,首先配对相邻的出港报告记录与进港报告记录,得到出港-进港记录配对表;然后基于出港-进港记录配对表,筛选出进港是A行政区域的船舶数据,剔除掉重复的数据,得到从各港口到该A行政区域的各船舶的MMSI。以此计算,得到到达各个行政区域的各船舶的MMSI。行政区域可以为省、市及县等,在此不做限制。
在一实施方式中,获取所述预处理后AIS数据,包括:
从AIS原始数据中确定MMSI错误的第一数据、船舶位置信息异常的第二数据和航速异常的第三数据;
从所述AIS原始数据中删除所述第一数据、第二数据和所述第三数据,得到所述预处理后AIS数据。
需要说明的是,AIS原始数据通常存在噪声和偏差的问题。为了保证后续轨迹特征点选取的精度和速度,需要对AIS原始数据进行预处理:删除MMSI码错误的数据;删除船舶位置的经纬度出现负值或经度大于180°、纬度大于90°的数据;删除航速为负值的数据;删除超过研究水域范围的数据等。
在一实施方式中,步骤S101中的所述预处理后AIS数据包括多个船舶瞬时运动特征,各船舶瞬时运动特征包括MMSI、船舶发出 AIS 信息时刻的时间戳、经纬度信息、航速和航向;
所述将提取的MMSI与预处理后AIS数据中的MMSI进行关联,得到各船舶的航行轨迹点,包括:
将提取的MMSI与对应船舶瞬时运动特征中的MMSI进行关联,得到各船舶的航行轨迹点。
示范性的,预处理后AIS数据包含各船舶的一系列动态运动特征,预处理后AIS 数据按照时间戳顺序排列,则各船舶的一系列轨迹表示为 Traj={A1, A2, A3, …, Ai, …,An},Ai 为其中一条AIS 数据,一条AIS 数据包含的信息为该船舶在当前时刻的瞬时运动特征,包括水上移动通信业务标识码(MMSI)、船舶发出 AIS 信息时的时间戳(Post Time)、经度(LON)、纬度(LAT)、航速(Speed)、对地航向(COG)等。将从进出港报告中提取的MMSI和预处理后AIS数据中的MMSI关联,得到船舶一系列的瞬时轨迹点,即能够得到各船舶的完整的航行轨迹,每个轨迹都用经纬度来标识。
步骤S102,按照时间顺序对各船舶的航行轨迹点进行排列,得到各船舶的航线轨迹点序列,根据各船舶的航线轨迹点序列和航行速度确定起止航行轨迹。
在一实施方式中,步骤S102中的根据各船舶的航线轨迹点序列和航行速度确定起止航行轨迹,包括:
遍历读取航线轨迹点序列中各轨迹点对应的航行速度,根据相邻航线轨迹点的速度大小关系确定航行起始时刻和航行结束时刻;
根据所述航行起始时刻和所述航行结束时刻从各船舶的航线轨迹点序列中确定所述起止航行轨迹。
需要说明的是,由于船舶无论在内河航道还是海上,都是沿着基本固定的航线航行,轨迹大致相同。无论客船还是货船,在船舶航行的过程中,极少出现船舶在航线中走走停停的情况,一般是以一定的速度到达下一港区或者停泊点。因此,船舶航速小于预设速度,即可认为该船到达了停泊区附近或者有停泊行为。举例来说,预设速度可以为0.5m/s、0.7m/s等,也可以根据实际船舶航行情况,确定预设速度的值,在此不做限制。
示范性的,确定航行起始时刻和航行结束时刻可以包括如下步骤:
(1)记录船舶在一段时间的轨迹点,并按照时间戳顺序排列,得到一组按照时间顺序排列的轨迹点序列G={P1, P2, P3, …, Pn},轨迹点序列G里面包含一系列的轨迹点,P1, P2, P3, …, Pn分别代表时间排序的不同轨迹点;
(2)利用预处理后AIS数据中的航速(Speed)字段,如果轨迹段G中前一刻航速 Vi-1
Figure SYM_220830115850001
0.5m/s ,且轨迹段G中当前时刻速度 Vi
Figure SYM_220830115850002
0.5m/s,则确定船舶已经开始航行,记录此时的时间t(i)。循环第(2) 步,一直比较船舶航行的瞬时速度,直至船舶前一刻速度 Vj-1
Figure SYM_220830115850003
0.5m/s ,且此时速度 Vj
Figure SYM_220830115850004
0.5m/s ,说明船舶在t(j)时刻已抵达停泊的区域,记录此时的时间t(j);
(3)计算本次船舶航行的时间T=t(j)-t(i),中间形成的轨迹点是G={Pi,…, Pj},表明船舶在两段最低速度之间形成了一系列的船舶航行轨迹点。
步骤S103,基于聚类算法对各船舶的起止航行轨迹进行聚类,得到各船舶在港口的停留区,根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程。
在本实施例中,可以利用DBSCAN聚类算法对各船舶的起止航行轨迹进行聚类,识别各船舶的停留、航行行为,得到停留区经纬度范围,并根据两个停留区之间的航行轨迹计算得到航行里程。
补充说明的是,聚类算法还可以为DENCLUE算法和OPTICS算法,其中,DENCLUE算法通过影响函数和密度函数可以进行基于密度的聚类,从而可以通过DENCLUE算法实现对各船舶的起止航行轨迹进行聚类,以达到识别各船舶的停留、航行行为的目的。OPTICS算法通过中心距离和可达距离也能进行基于密度的聚类,从而可以通过OPTICS算法实现对各船舶的起止航行轨迹进行聚类,以达到识别各船舶的停留、航行行为的目的。此外,其他可以聚类算法也可以用于对各船舶的起止航行轨迹进行聚类,在此不做限制。
在一实施方式中,步骤S103中的所述基于聚类算法对各船舶的起止航行轨迹进行聚类,得到各船舶在港口的停留区,包括:
基于聚类算法对各船舶在预设时间内的航速小于预设速度的轨迹点进行聚类,得到聚类簇,根据所述聚类簇确定所述停留区。
需要说明的是,在内河航道或者海上航行的船舶,一般会有固定的航行路线,在进行停靠作业的时候也会停靠在特定的泊区或者港口,位置比较固定,船舶停泊时的相对位移较小,而且船舶在停泊区域的轨迹点非常密集,因此可以选择基于密度(Density-BasedSpatial Clustering of Applications with Noise,DBSCAN)聚类算法对航行船舶预设时间内的航速小于预设速度的轨迹点进行聚类,预设时间可以为2小时,预设速度可以为0.5m/s,示范性的,可以采用DBSCAN 聚类算法对两小时内航速小于0.5m/s的轨迹点进行聚类,可将聚为一类的点视为停泊区域,则该船舶航行一段时间后就会出现两个聚类簇,两个聚类簇分别为出发和到达两个地点的位置范围。
在一实施方式中,所述基于聚类算法对各船舶在预设时间内的航速小于预设速度的轨迹点进行聚类,得到聚类簇,包括:
将各船舶在预设时间内的航行轨迹点按照时间顺序排列,得到轨迹点序列;
确定邻域半径及邻域内最少点个数;
遍历所述轨迹点序列中的轨迹点,确定核心点,所述核心点为在所述邻域半径内的所有点个数大于或等于所述邻域内最少点个数的轨迹点;
将所述核心点的邻域半径内的所有点归入停泊点集合中;
将所述停泊点集合确定为所述聚类簇。
示范性的,将各船舶在预设时间内的航速小于预设速度的轨迹点进行聚类,可以包括如下步骤:
(1)输入一艘船舶的一段预设时间的轨迹点序列G={P1, P2, P3, …, Pn},并按照时间戳顺序排列。
(2)输入参数,参数包括邻域半径
Figure SYM_220830115850001
和邻域内最少点个数 MinPts。
(3)选取轨迹段G中未访问过的一个点Pi,未访问点 Pi也就是噪音点或者是没有归为某一聚类簇的点,并将其标记为已访问。
(4)若点Pi在邻域半径
Figure SYM_220830115850001
范围内所有点的个数大于或等于邻域内最少点个数MinPts,则标记点Pi为核心点,将点Pi在邻域半径
Figure SYM_220830115850002
范围的所有点归入停泊点集合M。否则将该点Pi标记为噪音点,回到第(3)步。
(5)若停泊点集合 M中存在未访问点,选取停泊点集合 M中未访问点Pj,并标记为已访问;若停泊点集合 M全部点已访问,回到 第(3)步。
(6)若在邻域半径
Figure SYM_220830115850001
范围内的所有点个数大于或等于邻域内最少点个数MinPts,则标记为核心点,并将该点在邻域半径
Figure SYM_220830115850002
范围所有点归入集合M, 回到第(5)步。若不满足核心点要求,则点Pi标记为噪音点,回到第(4)步,直至所有停泊点集合 M中的点都标记为已访问, 然后返回到第(2)步。
此时能够得到船舶的轨迹聚类出的停泊点,用此算法一直聚类,能够得到一系列船舶的停泊区域范围,选出各停泊区域某一核心点的位置坐标,作为停泊区域的坐标进行后续分析,Q={q1(j1,w1),q2(j2,w2),…,qn(jn,wn)},Q表示核心点序列,qn(jn,wn)表示一核心点的位置坐标。
在一实施方式中,步骤S103中的所述根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程,包括:
按照时间顺序对两个停留区之间的航行轨迹点进行排列,得到起止轨迹点序列,所述起止轨迹点序列的各轨迹点包括经纬度信息;
根据各轨迹点的经纬度信息计算相邻两个轨迹点的距离;
将相邻两个轨迹点的距离累计相加,得到两个停留区之间的航行里程。
示范性的,可以从两个停留区中分别确定一个停泊点,根据两个停泊点之间的船舶轨迹点计算两个停留区之间的航行里程。
举例来说,根据两个停泊点之间的船舶轨迹点计算两个停留区之间的航行里程,可以包括以下步骤:
(1)任选两个停留区,分别找出两个停留区的起止点,将起止点之间船舶的航行轨迹按照时间戳的顺序进行排列,得到轨迹集合N={p1,p2,…pn},轨迹集合N中每一个轨迹点pn都包含了该船舶的经纬度信息,根据经纬度,计算两个相邻轨迹点之间的距离。距离计算公式为:
Figure P_220830115850767_767285001
其中纬度(latitude)可以简称为lat,经度(longitude)可以简称为lon,lat1是相邻两个轨迹点的前一个轨迹点的纬度值,lat2是相邻两个轨迹点的后一个轨迹点的纬度值,a=lat1 - lat2为两点纬度之差,lon1是相邻两个轨迹点的前一个轨迹点的经度值,lon2是相邻两个轨迹点的后一个轨迹点的经度值,b=lon1-lon2 为两点经度之差,R=6378.137(KM) 为地球半径。
(2)将任意两个停泊点之间的轨迹集合N内的所有相邻两个轨迹点的距离依次计算出来,然后累计相加,得到两个停泊点之间的航行里程。采用公式如下:
S=S1+S2+…+Si+…+Sn-1
其中,S表示任意两个停泊点之间的累计航行里程,n表示轨迹集合N中包含n个轨迹点,Si表示轨迹集合N中第i个轨迹点与第i+1个轨迹点之间的距离。
步骤S104,将各船舶的停留区与第一对应关系进行匹配,得到目标港区,所述第一对应关系为港区与位置信息之间的对应关系。
在本实施例中,可以预先构建港口、港区和位置信息之间的对应关系,示范性的,可以构建港口、工区、位置信息对应关系表。各个港区都有对应的经纬度范围,目前已经有部分港区的位置信息表格,对于未知经纬度的港区利用第三方地图工具,分别对不同港区的经纬度进行提取。提取不同港区的经纬度可以按照如下步骤进行:
向第三方地图工具平台注册认证,获取API key,即第三方地图工具平台的应用程序接口(API)的秘钥,使用逆地理编码,将结构化地址(省/市/区/街道/门牌号)解析为对应的位置信息。结构化地址越完整,地址内容越准确,解析的位置信息精度越高。
调用API接口,明确在进行调用时各参数的写入情况,输入需要的港区的名称,根据输入的港区名称返回对应的港区经纬度,梳理成表格,即生成得到港区与位置信息之间的对应关系,也就是说,生成第一对应关系。
在实际情况中,一个港口往往有多个港区,所以可以将港口和港区关联起来,得到港口与港区之间的对应关系,也就是说,生成第二对应关系。还可以将港口与港区-位置表关联起来,形成港口-港区-位置表。
在一实施方式中,步骤S104包括:
获取所述停留区的核心点位置信息,从所述第一对应关系中确定与所述核心点位置信息之间的距离误差小于或等于预设偏移距离的目标位置信息;
将所述目标位置信息对应的港区确定为所述目标港区。
示范性的,将得到的一系列的停留区的核心点位置坐标Q={q1(j,w),q2(j,w),…,qn(j,w)}排列出来,按照全国进出港报告中提取的不同省份的航行情况,关联港区-位置表,若第i个核心点位置坐标qi(ji,wi)与一港区gj(jj,wj)的经纬度距离不超过预设偏移距离,例如,预设偏移距离为5km;
即S(qi,gj)<5km,则认为第i个核心点位置坐标qi(ji,wi)对应的停留区属于港区gj(jj,wj),否则,若 S(qi,gj)≥5km,则认为该第i个核心点位置坐标qi(ji,wi)为无效点。
步骤S105,将所述目标港区与第二对应关系进行匹配,得到所述目标港区对应的目标港口,所述第二对应关系为港区和港口之间的对应关系。
在本实施例中,可以建立港口-港区字典,港口-港区字典中存储有港区和港口之间的对应关系。
步骤S106,计算所述目标港口与其他港口之间的港口距离,根据多个所述港口距离生成港口距离矩阵。
在一实施方式中,步骤S106中的所述计算所述目标港口与其他港口之间的港口距离,包括:
若所述目标港口的目标港区与其他港口的各港区之间的距离处于同一距离范围内,则计算所述目标港口的所述目标港区与所述其他港口的各港区之间的距离的算术平均距离,将所述算术平均距离作为所述目标港口的目标港区与所述其他港口的各港区的平均距离;
若所述目标港口的目标港区与所述其他港口的各港区之间的距离不处于同一距离范围内,则基于所述预处理后AIS数据计算所述目标港口的目标港区到所述其他港口的各港区的船舶数量及船舶占比,将所述船舶占比确定为权重,基于所述目标港区与所述其他港口的各港区之间的距离和所述权重计算所述目标港口的目标港区与所述其他港口的各港区之间的平均距离。
请参阅图2,B港口的y港区到A港口的x和y港区的距离相近,所以直接用B港口的y港区到A港口的x和y港区的两个距离的算数平均值作为B港口的y港区到A港口的平均距离。
A港口的X港区到B港口的三个港区距离相差比较大,到B港口x和y港区的距离比较近,到B港口的z港区的距离远,不能直接平均,所以利用加权法计算A港口的X港区到B港口的三个港区平均距离。
进一步补充说明的是,港口距离矩阵可以为全国港口距离矩阵,全国港口距离矩阵形成后,包含了港区到港区、港口到港口之间的距离,覆盖了全国的港口,在由于港口的建设、升级、停用等一系列原因会造成的港口港区的变化,所以要隔段时间更新港口-港区字典,根据字典更新港口距离矩阵。
本实施例,利用进出港报告数据和AIS数据计算得到全国港口距离矩阵,能够为计算船舶周转量奠定坚实的基础。充分利用了水运大数据的数据资源和价值,船舶行驶的实时轨迹和里程相结合,实现了港口距离计算的准确化和动态化,对于提升周转量计算的完整性、准确性,真实反映我国水路运输变化趋势提供了强有力支撑。将机器学习和水运大数据进行结合,实现全国港口动态更新机制,节省了人力物力,提高了数据的利用率和效率。
本实施例提供的港口距离矩阵的计算方法,根据进出港报告数据提取各船舶的MMSI,将提取的MMSI与预处理后AIS数据中的MMSI进行关联,得到各船舶的航行轨迹点;按照时间顺序对各船舶的航行轨迹点进行排列,得到各船舶的航线轨迹点序列,根据各船舶的航线轨迹点序列和航行速度确定起止航行轨迹;基于聚类算法对各船舶的起止航行轨迹进行聚类,得到各船舶在港口的停留区,根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程;将各船舶的停留区与第一对应关系进行匹配,得到目标港区;将所述目标港区与第二对应关系进行匹配,得到所述目标港区对应的目标港口;计算所述目标港口与其他港口之间的港口距离,根据多个所述港口距离生成港口距离矩阵。这样,基于进出港报告数据和预处理后AIS数据可以准确地计算港口距离矩阵,提高港口距离矩阵的计算效率,为计算船舶周转量提供准确的港口距离矩阵。
实施例2
此外,本公开实施例提供了一种港口距离矩阵的计算装置。
如图3所示,港口距离矩阵的计算装置300包括:
提取模块301,用于根据进出港报告数据提取各船舶的MMSI,将提取的MMSI与预处理后AIS数据中的MMSI进行关联,得到各船舶的航行轨迹点;
确定模块302,用于按照时间顺序对各船舶的航行轨迹点进行排列,得到各船舶的航线轨迹点序列,根据各船舶的航线轨迹点序列和航行速度确定起止航行轨迹;
聚类模块303,用于基于聚类算法对各船舶的起止航行轨迹进行聚类,得到各船舶在港口的停留区,根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程;
第一匹配模块304,用于将各船舶的停留区与第一对应关系进行匹配,得到目标港区,所述第一对应关系为港区与位置信息之间的对应关系;
第二匹配模块305,用于将所述目标港区与第二对应关系进行匹配,得到所述目标港区对应的目标港口,所述第二对应关系为港区和港口之间的对应关系;
计算模块306,用于计算所述目标港口与其他港口之间的港口距离,根据多个所述港口距离生成港口距离矩阵。
在一实施方式中,聚类模块303,还用于基于聚类算法对各船舶在预设时间内的航速小于预设速度的轨迹点进行聚类,得到聚类簇,根据所述聚类簇确定所述停留区。
在一实施方式中,聚类模块303,还用于将各船舶在预设时间内的航行轨迹点按照时间顺序排列,得到轨迹点序列;
确定邻域半径及邻域内最少点个数;
遍历所述轨迹点序列中的轨迹点,确定核心点,所述核心点为在所述邻域半径内的所有点个数大于或等于所述邻域内最少点个数的轨迹点;
将所述核心点的邻域半径内的所有点归入停泊点集合中;
将所述停泊点集合确定为所述聚类簇。
在一实施方式中,确定模块302,还用于遍历读取航线轨迹点序列中各轨迹点对应的航行速度,根据相邻航线轨迹点的速度大小关系确定航行起始时刻和航行结束时刻;
根据所述航行起始时刻和所述航行结束时刻从各船舶的航线轨迹点序列中确定所述起止航行轨迹。
在一实施方式中,聚类模块303,还用于按照时间顺序对两个停留区之间的航行轨迹点进行排列,得到起止轨迹点序列,所述起止轨迹点序列的各轨迹点包括经纬度信息;
根据各轨迹点的经纬度信息计算相邻两个轨迹点的距离;
将相邻两个轨迹点的距离累计相加,得到两个停留区之间的航行里程。
在一实施方式中,第一匹配模块304,用于获取所述停留区的核心点位置信息,从所述第一对应关系中确定与所述核心点位置信息之间的距离误差小于或等于预设偏移距离的目标位置信息;
将所述目标位置信息对应的港区确定为所述目标港区。
在一实施方式中,计算模块306,还用于若所述目标港口的目标港区与其他港口的各港区之间的距离处于同一距离范围内,则计算所述目标港口的所述目标港区与所述其他港口的各港区之间的距离的算术平均距离,将所述算术平均距离作为所述目标港口的目标港区与所述其他港口的各港区的平均距离;
若所述目标港口的目标港区与所述其他港口的各港区之间的距离不处于同一距离范围内,则基于所述预处理后AIS数据计算所述目标港口的目标港区到所述其他港口的各港区的船舶数量及船舶占比,将所述船舶占比确定为权重,基于所述目标港区与所述其他港口的各港区之间的距离和所述权重计算所述目标港口的目标港区与所述其他港口的各港区之间的平均距离。
本实施例提供的港口距离矩阵的计算装置300可以实现实施例1所提供的港口距离矩阵的计算方法,为避免重复,在此不再赘述。
本实施例提供的港口距离矩阵的计算装置,根据进出港报告数据提取各船舶的MMSI,将提取的MMSI与预处理后AIS数据中的MMSI进行关联,得到各船舶的航行轨迹点;按照时间顺序对各船舶的航行轨迹点进行排列,得到各船舶的航线轨迹点序列,根据各船舶的航线轨迹点序列和航行速度确定起止航行轨迹;基于聚类算法对各船舶的起止航行轨迹进行聚类,得到各船舶在港口的停留区,根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程;将各船舶的停留区与第一对应关系进行匹配,得到目标港区;将所述目标港区与第二对应关系进行匹配,得到所述目标港区对应的目标港口;计算所述目标港口与其他港口之间的港口距离,根据多个所述港口距离生成港口距离矩阵。这样,基于进出港报告数据和预处理后AIS数据可以准确地计算港口距离矩阵,提高港口距离矩阵的计算效率,为计算船舶周转量提供准确的港口距离矩阵。
实施例3
此外,本公开实施例提供了一种电子设备,包括存储器以及处理器,所述存储器存储有计算机程序,所述计算机程序在所述处理器上运行时执行实施例1所提供的港口距离矩阵的计算方法。
本实施例提供的电子设备可以实现实施例1所提供的港口距离矩阵的计算方法,为避免重复,在此不再赘述。
实施例4
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现实施例1所提供的港口距离矩阵的计算方法。
在本实施例中,计算机可读存储介质可以为只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本实施例提供的计算机可读存储介质可以实现实施例1所提供的港口距离矩阵的计算方法,为避免重复,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者终端中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (10)

1.一种港口距离矩阵的计算方法,其特征在于,所述方法包括:
根据进出港报告数据提取各船舶的MMSI,将提取的MMSI与预处理后AIS数据中的MMSI进行关联,得到各船舶的航行轨迹点;
按照时间顺序对各船舶的航行轨迹点进行排列,得到各船舶的航线轨迹点序列,根据各船舶的航线轨迹点序列和航行速度确定起止航行轨迹;
基于聚类算法对各船舶的起止航行轨迹进行聚类,得到各船舶在港口的停留区,根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程;
将各船舶的停留区与第一对应关系进行匹配,得到目标港区,所述第一对应关系为港区与位置信息之间的对应关系;
将所述目标港区与第二对应关系进行匹配,得到所述目标港区对应的目标港口,所述第二对应关系为港区和港口之间的对应关系;
计算所述目标港口与其他港口之间的港口距离,根据多个所述港口距离生成港口距离矩阵。
2.根据权利要求1所述的方法,其特征在于,所述基于聚类算法对各船舶的起止航行轨迹进行聚类,得到各船舶在港口的停留区,包括:
基于聚类算法对各船舶在预设时间内的航速小于预设速度的轨迹点进行聚类,得到聚类簇,根据所述聚类簇确定所述停留区。
3.根据权利要求2所述的方法,其特征在于,所述基于聚类算法对各船舶在预设时间内的航速小于预设速度的轨迹点进行聚类,得到聚类簇,包括:
将各船舶在预设时间内的航行轨迹点按照时间顺序排列,得到轨迹点序列;
确定邻域半径及邻域内最少点个数;
遍历所述轨迹点序列中的轨迹点,确定核心点,所述核心点为在所述邻域半径内的所有点个数大于或等于所述邻域内最少点个数的轨迹点;
将所述核心点的邻域半径内的所有点归入停泊点集合中;
将所述停泊点集合确定为所述聚类簇。
4.根据权利要求1所述的方法,其特征在于,所述根据各船舶的航线轨迹点序列和航行速度确定起止航行轨迹,包括:
遍历读取航线轨迹点序列中各轨迹点对应的航行速度,根据相邻航线轨迹点的速度大小关系确定航行起始时刻和航行结束时刻;
根据所述航行起始时刻和所述航行结束时刻从各船舶的航线轨迹点序列中确定所述起止航行轨迹。
5.根据权利要求1所述的方法,其特征在于,所述根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程,包括:
按照时间顺序对两个停留区之间的航行轨迹点进行排列,得到起止轨迹点序列,所述起止轨迹点序列的各轨迹点包括经纬度信息;
根据各轨迹点的经纬度信息计算相邻两个轨迹点的距离;
将相邻两个轨迹点的距离累计相加,得到两个停留区之间的航行里程。
6.根据权利要求1所述的方法,其特征在于,所述将各船舶的停留区与第一对应关系进行匹配,得到目标港区,包括:
获取所述停留区的核心点位置信息,从所述第一对应关系中确定与所述核心点位置信息之间的距离误差小于或等于预设偏移距离的目标位置信息;
将所述目标位置信息对应的港区确定为所述目标港区。
7.根据权利要求1所述的方法,其特征在于,所述计算所述目标港口与其他港口之间的港口距离,包括:
若所述目标港口的目标港区与其他港口的各港区之间的距离处于同一距离范围内,则计算所述目标港口的所述目标港区与所述其他港口的各港区之间的距离的算术平均距离,将所述算术平均距离作为所述目标港口的目标港区与所述其他港口的各港区的平均距离;
若所述目标港口的目标港区与所述其他港口的各港区之间的距离不处于同一距离范围内,则基于所述预处理后AIS数据计算所述目标港口的目标港区到所述其他港口的各港区的船舶数量及船舶占比,将所述船舶占比确定为权重,基于所述目标港区与所述其他港口的各港区之间的距离和所述权重计算所述目标港口的目标港区与所述其他港口的各港区之间的平均距离。
8.一种港口距离矩阵的计算装置,其特征在于,所述装置包括:
提取模块,用于根据进出港报告数据提取各船舶的MMSI,将提取的MMSI与预处理后AIS数据中的MMSI进行关联,得到各船舶的航行轨迹点;
确定模块,用于按照时间顺序对各船舶的航行轨迹点进行排列,得到各船舶的航线轨迹点序列,根据各船舶的航线轨迹点序列和航行速度确定起止航行轨迹;
聚类模块,用于基于聚类算法对各船舶的起止航行轨迹进行聚类,得到各船舶在港口的停留区,根据两个停留区之间的船舶轨迹点计算两个停留区之间的航行里程;
第一匹配模块,用于将各船舶的停留区与第一对应关系进行匹配,得到目标港区,所述第一对应关系为港区与位置信息之间的对应关系;
第二匹配模块,用于将所述目标港区与第二对应关系进行匹配,得到所述目标港区对应的目标港口,所述第二对应关系为港区和港口之间的对应关系;
计算模块,用于计算所述目标港口与其他港口之间的港口距离,根据多个所述港口距离生成港口距离矩阵。
9.一种电子设备,其特征在于,包括存储器以及处理器,所述存储器存储有计算机程序,所述计算机程序在所述处理器运行时执行权利要求1至7中任一项所述的港口距离矩阵的计算方法。
10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序在处理器上运行时执行权利要求1至7中任一项所述的港口距离矩阵的计算方法。
CN202211106993.1A 2022-09-13 2022-09-13 港口距离矩阵的计算方法、装置、电子设备及存储介质 Active CN115186234B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211106993.1A CN115186234B (zh) 2022-09-13 2022-09-13 港口距离矩阵的计算方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211106993.1A CN115186234B (zh) 2022-09-13 2022-09-13 港口距离矩阵的计算方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN115186234A true CN115186234A (zh) 2022-10-14
CN115186234B CN115186234B (zh) 2022-12-06

Family

ID=83524248

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211106993.1A Active CN115186234B (zh) 2022-09-13 2022-09-13 港口距离矩阵的计算方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115186234B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116993245A (zh) * 2023-09-26 2023-11-03 交通运输部科学研究院 区域水路运输量测算方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015059896A (ja) * 2013-09-20 2015-03-30 株式会社日立ソリューションズ 船舶位置推定システム及び方法
CN109740828A (zh) * 2019-02-28 2019-05-10 广州中国科学院沈阳自动化研究所分所 船舶航行路径规划方法、系统、介质和设备
CN115018368A (zh) * 2022-06-28 2022-09-06 交通运输部规划研究院 一种基于海量ais数据的港口泊位占用率计算方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015059896A (ja) * 2013-09-20 2015-03-30 株式会社日立ソリューションズ 船舶位置推定システム及び方法
CN109740828A (zh) * 2019-02-28 2019-05-10 广州中国科学院沈阳自动化研究所分所 船舶航行路径规划方法、系统、介质和设备
CN115018368A (zh) * 2022-06-28 2022-09-06 交通运输部规划研究院 一种基于海量ais数据的港口泊位占用率计算方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马文耀等: "基于单向距离的谱聚类船舶运动模式辨识", 《重庆交通大学学报(自然科学版)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116993245A (zh) * 2023-09-26 2023-11-03 交通运输部科学研究院 区域水路运输量测算方法、装置、电子设备及存储介质
CN116993245B (zh) * 2023-09-26 2023-12-15 交通运输部科学研究院 区域水路运输量测算方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN115186234B (zh) 2022-12-06

Similar Documents

Publication Publication Date Title
Jagadeesh et al. A map matching method for GPS based real-time vehicle location
US8024110B2 (en) Method of estimation of traffic information, device of estimation of traffic information and car navigation device
CN110188093A (zh) 一种基于大数据平台针对ais信息源的数据挖掘系统
Niehoefer et al. GPS community map generation for enhanced routing methods based on trace-collection by mobile phones
CN101271628B (zh) 堵车状况运算系统
CN112699315B (zh) 基于ais数据的船舶异常行为探测方法
CN112562415A (zh) 船舶航线推荐方法
CN115186234B (zh) 港口距离矩阵的计算方法、装置、电子设备及存储介质
CN110532546B (zh) 一种融合地理位置和文本相似性的警情自动下发方法
CN110598917B (zh) 一种基于路径轨迹的目的地预测方法、系统及存储介质
CN114363842B (zh) 基于手机信令数据的公交乘客下车站点预测方法及装置
CN102378898B (zh) 具有路线预测的导航系统与其操作方法
Yang et al. An enhanced weight-based topological map matching algorithm for intricate urban road network
CN115328903B (zh) 船舶停留状态识别方法和装置、电子设备和存储介质
CN109031372A (zh) 一种从卫星定位数据中自动提取行驶线路关键点的方法
CN106940929B (zh) 交通数据预测方法及装置
Li et al. An automatic extraction method of coach operation information from historical trajectory data
CN109937342A (zh) 用于定位移动物体的方法、装置和系统
CN111444286B (zh) 一种基于轨迹数据的远距离交通节点关联性挖掘方法
Xie et al. High-accuracy off-line map-matching of trajectory network division based on weight adaptation HMM
Shen et al. Route choice of the shortest travel time based on floating car data
Asborno et al. Inland waterway network mapping of AIS data for freight transportation planning
CN115587308A (zh) 航道的确定方法、装置、电子设备及存储介质
CN111382370A (zh) 线路推荐方法、装置、车载设备和存储介质
CN116828391B (zh) 一种检测ais异常开关的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant