CN113469627B - 船期相似性判断方法、装置、电子设备及存储介质 - Google Patents
船期相似性判断方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113469627B CN113469627B CN202110844047.6A CN202110844047A CN113469627B CN 113469627 B CN113469627 B CN 113469627B CN 202110844047 A CN202110844047 A CN 202110844047A CN 113469627 B CN113469627 B CN 113469627B
- Authority
- CN
- China
- Prior art keywords
- ship
- data set
- similarity
- port
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种船期相似性判断方法、装置、电子设备及存储介质,其中,该方法包括:基于船舶名称,获取目标船舶的相似船舶的集合;获取相似船舶的集合对应的港口挂靠数据集合和船期数据集合;基于相似船舶的集合对应的港口挂靠数据集合和船期数据集合,获取目标矩阵;基于目标矩阵,获取满足目标条件的船期;其中,目标矩阵用于表征港口挂靠数据集合中的元素与船期数据集合中的元素之间的编辑距离。本发明实施例提供的船期相似性判断方法、装置、电子设备及存储介质,通过对船期数据和历史港口挂靠数据进行相似性判断,利用挂靠船期相似度来判断船期和船舶是否一致,能提高船期相似性判断的准确性。
Description
技术领域
本发明涉及交通运输技术领域,尤其涉及一种船期相似性判断方法、装置、电子设备及存储介质。
背景技术
集装箱运输因为高质量、高效性、高密度、标准化,在海运行业占有越来越重要的地位。在集装箱航运中,集装箱航运公司会根据客户的订仓情况,发布船期数据,其中船期数据对货物的跟踪有着重要作用,尤其是航运物流跟踪系统的重要环节。集装箱货物是通过集装箱船舶进行海上运输的,其中存在共仓(即多家船舶公司共用一条船舶)的情况,所以就有同一条船舶有多家船舶公司发布船期的情况,并且各家发布的船期存在差异。集装箱航运公司发布的船期以船名为唯一标识。集装箱船舶在实际的运输中船期港口与实际到达港口的时间存在差异,差异有大有小,并且还存在加港、甩港或中转港等情况。
现有方法是通过识别相同的船名来进行船期相似性判断的。但现有方法存在准确性差的不足,从而难以实现航运物流数据的高效精准整合。
发明内容
本发明提供一种船期相似性判断方法、装置、电子设备及存储介质,用以解决现有技术中的船期相似性判断的准确性差的技术问题。
本发明提供一种船期相似性判断方法,包括:
基于船舶名称,获取目标船舶的相似船舶的集合;
获取所述相似船舶的集合对应的港口挂靠数据集合和船期数据集合;
基于所述相似船舶的集合对应的港口挂靠数据集合和船期数据集合,获取目标矩阵;
基于所述目标矩阵,获取满足目标条件的船期;
其中,所述目标矩阵用于表征所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的编辑距离。
根据本发明提供的一种船期相似性判断方法,所述基于船舶名称,获取目标船舶的相似船舶的集合,具体包括:
基于船期数据中所述目标船舶的船舶名称,与船舶档案和/或港口挂靠数据进行匹配,获取所述相似船舶的集合。
根据本发明提供的一种船期相似性判断方法,所述获取所述相似船舶的集合对应的港口挂靠数据集合和船期数据集合,具体包括:
获取所述相似船舶的集合中各船舶目标时间段的港口挂靠数据,并获取所述相似船舶的集合对应的各船舶公司所述目标时间段的船期数据;
基于所述相似船舶的集合中各船舶目标时间段的港口挂靠数据,获取所述港口挂靠数据集合,并基于所述各船舶公司所述目标时间段的船期数据,获取所述船期数据集合。
根据本发明提供的一种船期相似性判断方法,所述基于所述目标矩阵,获取满足目标条件的船期,具体包括:
基于所述目标矩阵,获取所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的相似度;
基于所述相似度,获取满足目标条件的船期。
根据本发明提供的一种船期相似性判断方法,所述基于所述目标矩阵,获取所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的相似度,具体包括:
基于所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的编辑距离、所述港口挂靠数据集合中的元素的长度和所述船期数据集合中的元素的长度,获取所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的相似度。
根据本发明提供的一种船期相似性判断方法,所述基于所述相似度,获取满足目标条件的船期,具体包括:
将所述相似度的最大值对应的船期,确定为所述满足目标条件的船期。
本发明还提供一种船期相似性判断装置,包括:
船舶筛选模块,用于基于船舶名称,获取目标船舶的相似船舶的集合;
集合构建模块,用于获取所述相似船舶的集合对应的港口挂靠数据集合和船期数据集合;
矩阵获取模块,用于基于所述相似船舶的集合对应的港口挂靠数据集合和船期数据集合,获取目标矩阵;
相似判断模块,用于基于所述目标矩阵,获取满足目标条件的船期;
其中,所述目标矩阵用于表征所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的编辑距离。
本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述船期相似性判断方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述船期相似性判断方法的步骤。
本发明提供的船期相似性判断方法、装置、电子设备及存储介质,通过对船期数据和历史港口挂靠数据进行相似性判断,利用挂靠船期相似度来判断船期和船舶是否一致,能解决不同船舶公司船期差异、船名重复、船舶实际到达港口时间与船期差异以及甩港、加港对船期使用的影响,能提高船期相似性判断的准确性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的船期相似性判断方法的流程示意图;
图2是本发明提供的船期相似性判断装置的结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明实施例和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明实施例的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性,且不涉及顺序。
在本发明实施例的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明实施例中的具体含义。
为了克服现有技术的上述问题,本发明提供一种船期相似性判断方法、装置、电子设备及存储介质,其发明构思是,通过对船期数据和历史港口挂靠数据进行相似性判断,然后利用挂靠船期相似度来判断船期和船舶是否一致,解决了不同船舶公司船期差异、船名重复、船舶实际到达港口时间与船期差异以及甩港、加港对船期使用的影响,来实现物流整合中船期和船舶的高效精准结合。
图1是本发明提供的一种船期相似性判断方法的流程示意图。下面结合图1描述本发明实施例的船期相似性判断方法。如图1所示,该方法包括:步骤101、基于船舶名称,获取目标船舶的相似船舶的集合。
具体地,通过查找与目标船舶的船舶名称相似的船舶,可以获取所述目标船舶的相似船舶,得到目标船舶的相似船舶的集合。
目标船舶的相似船舶的集合中的元素为目标船舶的各相似船舶。
此步骤会形成目标船舶的相似船舶的集合E相似{e1,e2,…,en},n≥0,用e相k表示集合E相似中第k个相似船舶。
步骤102、获取相似船舶的集合对应的港口挂靠数据集合和船期数据集合。
具体地,分别获取每一相似船舶的港口挂靠数据和船期数据。
各相似船舶的港口挂靠数据构成的集合为相似船舶的集合对应的港口挂靠数据集合。
各相似船舶的船期数据构成的集合为相似船舶的集合对应的船期数据集合。
港口挂靠数据是使用AIS(Automatic Identification System,船舶自动识别系统,简称AIS系统)数据与港口位置数据生成的靠港记录。
步骤103、基于相似船舶的集合对应的港口挂靠数据集合和船期数据集合,获取目标矩阵。
其中,目标矩阵用于表征港口挂靠数据集合中的元素与船期数据集合中的元素之间的编辑距离。
具体地,编辑距离又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少的编辑操作次数。编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。
使用e相k相似船的E挂靠和e期k构造矩阵。设E挂靠个数为n,e期k个数为m,即构造列数m+1,行数n+1的矩阵,挂靠和船期所要执行的最少操作次数为matrix[n][m]的值。
把挂靠数据按进港时间排序,作为矩阵的列,并做编号0到n,挂靠数据的数量既是矩阵列的个数。船期数据按到港时间排序,作为矩阵的行,并做编号0到m,船期数据数量既是矩阵的行数。
先判断船期和挂靠数据集合是否有空值,其中有空值时,计算距离为船期和挂靠的最大值。然后考虑一般情况,用一下动态规划的想法,要想得到将船期经过最少次数的增加,删除,或者替换操作就转变为挂靠,那么就必须在之前可以以最少次数的增加,删除,或者替换操作,使得现在船期和挂靠只需要再做一次操作或者不做就可以完成挂靠到船期的转换。根据之前的情况,分为下面三种情况:
1)可以在k个操作内将挂靠序列E挂靠{1..i}转换为船期序列e期k{1..j-1},这种情况,只需要在最后将e期j加上E挂靠{1..i}就完成了匹配,这样总共就需要k+1次操作。
2)同样在k个操作里面将挂靠序列E挂靠{1..i-1}转换为船期序列e期k{1..j},这种情况,只需要在最后将e挂i移除,然后再做这k个操作,所以总共需要k+1次操作。
3)在k个步骤里面将挂靠序列E挂靠{1..i-1}转换为船期序列e期k{1..j-1},只需要在最后将e挂i替换为e期j,使得满足E挂靠[1..i]==e期k[1..j],这样总共也需要k+1个操作。而如果在第3种情况下,e挂i刚好等于e期j,那就可以仅仅使用k次操作就完成这个过程。
最后,为了保证得到的操作次数总是最少的,可以从上面三种情况中选择消耗最少的一种作为将E挂靠[1..i]转换为e期k[1..j]所需要的最小操作次数。
最后根据上面3种情况,执行下面步骤:
1.初始化matrix第一行为0到n,第一列为0到m。matrix[0][j]表示第1行第j+1列值。如果E挂靠和e期k有空,需要转换的次数是max(n,m)。
2.检测每个从1到n的e挂k港口,检测每个1到m的e期k船期。
3.将挂靠序列和船期序列的每一个港口进行两两比较;如果相等,则令cost为0;如果不等,则令cost为1(cost后面会用到);
a、如果可以在k个操作里面将E挂靠{1..i-1}转换为e期k{1..j},那么就可以将e挂k移除,然后再做这k个操作,所以总共需要k+1个操作。
b、如果可以在k个操作内将E挂靠{1…i}转换为e期k{1…j-1},也就是说e挂i,j=k,那么就可以将e期k加上E挂靠{1…i},这样总共就需要k+1个操作。
c、如果可以在k个步骤里面将E挂靠{1…i-1}转换为e期k{1…j-1},那么就可以将e挂i转换为e期j,使得满足E挂靠{1..i]}==e期k{1..j},这样总共也需要k+1个操作。(这里加上cost,是因为如果e挂i刚好等于e期j,那么就不需要再做替换操作,即可满足,如果不等,则需要再做一次替换操作,那么就需要k+1次操作)
因为要取得最小操作的次数,所以最后还需要将这三种情况的操作次数进行比较,取最小值作为matrix[i,j]的值;
d、然后重复执行2,3,最后的结果就在matrix[n,m]中。
挂靠序列E挂靠和船期序列e期k均由港口构成。
步骤104、基于目标矩阵,获取满足目标条件的船期。
具体地,由于编辑距离可以表征字符的相似度,从而可以基于目标矩阵,获取满足目标条件的若干个船期。
目标条件,可以为相似度满足一定的条件,例如相似度最大的一个或几个,或者相似度大于预设的相似度阈值。
若干个指一个或多个
需要说明的是,可以参考贪心策略,对e期k执行上述步骤,即可得到所有船舶公司船期和挂靠的相似度。通过上面的步骤即可做到对船期和挂靠数据精准匹配数据,然后入库存储。
由于船舶运输存在以下现象:
1、船期有多家船舶公司发布并且存在差异;
2、船名重复问题;
3、船舶实际到达港口时间与船期存在或大或小差异;
4、船舶根据实际情况存在甩港现象;
5、船舶根据实际情况存在加港现象。
传统的用船期数据和船舶名称进行匹配实现船期数据和船舶对应关系继续船期相似性判断的方法,难以对上述现象进行有效处理,相似性判断的准确性较差。
本申请实施例提供的船期相似性判断方法,通过对船期和挂靠数据使用矩阵分析,对船期和挂靠数据转换成levenshtein判断相似性,基于动态规划思想做船期和挂靠数据匹配,可以实现区分重复船名船舶,使用动态规划思想去除实际挂靠港口和船期差别,提高不同船舶公司船期和挂靠数据匹配的准确性。
本发明实施例通过对船期数据和历史港口挂靠数据进行相似性判断,利用挂靠船期相似度来判断船期和船舶是否一致,能解决不同船舶公司船期差异、船名重复、船舶实际到达港口时间与船期差异以及甩港、加港对船期使用的影响,能提高船期相似性判断的准确性。
基于上述任一实施例的内容,获取目标船舶的相似船舶的集合,具体包括:基于船期数据中目标船舶的船舶名称,与船舶档案和港口挂靠数据中的至少一种进行匹配,获取相似船舶的集合。
具体地,可以通过船期中的船名进行初步筛选,获取目标船舶的相似船舶。
船舶筛选主要目的是去除同一周期运行同一航线船舶和优化效率,同时保证最优匹配的船舶在相似船集合里面。
可选地,分两步进行船舶筛选:1、先取船舶档案数据中船舶名称与船期中船舶名称进行包含匹配;2、取船舶ais数据中的船舶名称进行包含匹配。
通过上面两个步骤可以快速确定相似船舶集合。
本发明实施例通过获取相似船舶的集合,进行初步筛选,能提升计算效率。并且,集装箱船舶的船期数据具有一定的班轮特性,有运行周期,因此去除同一周期运行同一航线船舶有利于提升数据准确性。
基于上述任一实施例的内容,获取相似船舶的集合对应的港口挂靠数据集合和船期数据集合,具体包括:获取相似船舶的集合中各船舶目标时间段的港口挂靠数据,并获取相似船舶的集合对应的各船舶公司目标时间段的船期数据。
具体地,从数据库中取出N天船名对应的历史船期数据,一般为了保证船期数据样本量不会太少会选择船舶运行周期的1.5倍做为N,其中过少的数据样本量会严重影响匹配精准度,过多的数据样本量也会因船舶运行周期造成匹配精准度出现偏差。同样的历史挂靠数据要与船期数据取相同时间历史挂靠港口数据。保证挂靠数据和船期数据在相对时间上一致性,是因为集装箱船舶按航线运行的港口存在环形和航线变化问题,所以保证时间上相对一致,才能保证相似性的准确性。
基于相似船舶的集合中各船舶目标时间段的港口挂靠数据,获取港口挂靠数据集合,并基于各船舶公司目标时间段的船期数据,获取船期数据集合。
具体地,对查找出来E相似相似船舶,取N(N>30)天挂靠数据形成E挂靠{e1,e2,…,en},n≥0,用e挂k表示集合E挂靠中第k个挂靠船;设船舶公司的个数是m个,取N(N>30)天的船期数据E船期{e1,e2,…,en},n≥0,用e期k表示E船期中第k个船舶公司船期组合,用e期k表示e期k中第k个船期,即会产生m个E船期。
本发明实施例通过获取相似船舶的集合中各船舶目标时间段的港口挂靠数据,并获取相似船舶的集合对应的各船舶公司目标时间段的船期数据,获取相似船舶的集合对应的港口挂靠数据集合和船期数据集合,能提高船期相似性判断的准确率。
基于上述任一实施例的内容,基于目标矩阵,获取满足目标条件的船期,具体包括:基于目标矩阵,获取港口挂靠数据集合中的元素与船期数据集合中的元素之间的相似度。
具体地,由于编辑距离可以表征字符的相似度,因此,可以基于目标矩阵中的各元素,分别获取港口挂靠数据集合中的每个元素与船期数据集合中的每个元素之间的相似度。
基于相似度,获取满足目标条件的船期。
具体地,港口挂靠数据集合中的元素与船期数据集合中的元素之间的相似度越大,说明与目标船舶的船期越相似,因此,可以基于港口挂靠数据集合中的每个元素与船期数据集合中的每个元素之间的相似度,获取满足目标条件的船期。
基于上述任一实施例的内容,基于目标矩阵,获取港口挂靠数据集合中的元素与船期数据集合中的元素之间的相似度,具体包括:基于港口挂靠数据集合中的元素与船期数据集合中的元素之间的编辑距离、港口挂靠数据集合中的元素的长度和船期数据集合中的元素的长度,获取港口挂靠数据集合中的元素与船期数据集合中的元素之间的相似度。
具体地,使用如下公式即可计算出来船期和挂靠的相似性:
Similarity=(max(x,y)-Levenshtein)/max(x,y),
其中,x,y分别表示E挂靠和e期k的长度,即x表示E挂靠中挂靠港口的数量,y表示e期k中港口的数量;max表示取最大值;levenshtein表示编辑距离,Similarity表示港口挂靠数据集合中的元素与船期数据集合中的元素之间的相似度。
本发明实施例基于港口挂靠数据集合中的元素与船期数据集合中的元素之间的编辑距离、港口挂靠数据集合中的元素的长度和船期数据集合中的元素的长度,获取港口挂靠数据集合中的元素与船期数据集合中的元素之间的相似度,获取的相似度更准确,从而能提高船期相似性判断的准确性。
基于上述任一实施例的内容,基于相似度,获取满足目标条件的船期,具体包括:将相似度的最大值对应的船期,确定为满足目标条件的船期。
具体地,对相似船舶的每个相似船舶执行上述相似度的计算步骤,即可得到相似度集合。按照船舶公司,将相似度集合按大小进行倒序,取第一条数据作为船舶公司最精准的挂靠和船期作为最优匹配,并对挂靠和船期数据做唯一对应关联id。
相似船舶的集合E相似的相似度,对E相似的每个相似船执行上述相似度的计算步骤,即可得到相似度集合E相似度{e1,e2,…,en},n>0,其中取max(E相似度),即可得到相似度最大的船期和挂靠。
本发明实施例将相似度的最大值对应的船期,确定为满足目标条件的船期,能提高船期相似性判断的准确性。
下面对本发明提供的船期相似性判断装置进行描述,下文描述的船期相似性判断装置与上文描述的船期相似性判断方法可相互对应参照。
图2是根据本发明实施例提供的船期相似性判断装置的结构示意图。基于上述任一实施例的内容,如图2所示,该装置包括船舶筛选模块201、集合构建模块202、矩阵获取模块203和相似判断模块204,其中:
船舶筛选模块201,用于基于船舶名称,获取目标船舶的相似船舶的集合;
集合构建模块202,用于获取相似船舶的集合对应的港口挂靠数据集合和船期数据集合;
矩阵获取模块203,用于基于相似船舶的集合对应的港口挂靠数据集合和船期数据集合,获取目标矩阵;
相似判断模块204,用于基于目标矩阵,获取满足目标条件的船期;
其中,目标矩阵用于表征港口挂靠数据集合中的元素与船期数据集合中的元素之间的编辑距离。
具体地,船舶筛选模块201、集合构建模块202、矩阵获取模块203和相似判断模块204顺次电连接。
船舶筛选模块201通过查找与目标船舶的船舶名称相似的船舶,可以获取所述目标船舶的相似船舶,得到目标船舶的相似船舶的集合。
集合构建模块202分别获取每一相似船舶的港口挂靠数据和船期数据。
各相似船舶的港口挂靠数据构成的集合为相似船舶的集合对应的港口挂靠数据集合。
矩阵获取模块203通过分别计算港口挂靠数据集合中的每个元素与船期数据集合中的每个元素之间的Levenshtein距离,可以得到目标矩阵。
由于编辑距离可以表征字符的相似度,从而相似判断模块204以基于目标矩阵,获取满足目标条件的若干个船期。
可选地,船舶筛选模块201具体用于基于船期数据中所述目标船舶的船舶名称,与船舶档案和港口挂靠数据中的至少一种进行匹配,获取所述相似船舶的集合。
可选地,集合构建模块202具体用于:
获取所述相似船舶的集合中各船舶目标时间段的港口挂靠数据,并获取所述相似船舶的集合对应的各船舶公司所述目标时间段的船期数据;
基于所述相似船舶的集合中各船舶目标时间段的港口挂靠数据,获取所述港口挂靠数据集合,并基于所述各船舶公司所述目标时间段的船期数据,获取所述船期数据集合。
可选地,相似判断模块204可以包括:
相似度计算单元,用于基于所述目标矩阵,获取所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的相似度;
相似性判断单元,用于基于所述相似度,获取满足目标条件的船期。
可选地,相似度计算单元,具体用于基于所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的编辑距离、所述港口挂靠数据集合中的元素的长度和所述船期数据集合中的元素的长度,获取所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的相似度。
可选地,相似性判断单元,具体用于将所述相似度的最大值对应的船期,确定为所述满足目标条件的船期。
本发明实施例提供的船期相似性判断装置,用于执行本发明上述船期相似性判断方法,其实施方式与本发明提供的船期相似性判断方法的实施方式一致,且可以达到相同的有益效果,此处不再赘述。
该船期相似性判断装置用于前述各实施例的船期相似性判断方法。因此,在前述各实施例中的船期相似性判断方法中的描述和定义,可以用于本发明实施例中各执行模块的理解。
本发明实施例通过对船期数据和历史港口挂靠数据进行相似性判断,利用挂靠船期相似度来判断船期和船舶是否一致,能解决不同船舶公司船期差异、船名重复、船舶实际到达港口时间与船期差异以及甩港、加港对船期使用的影响,能提高船期相似性判断的准确性。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储在存储器330中并可在处理器310上运行的逻辑指令,以执行上述各方法实施例提供的船期相似性判断方法,该方法包括:基于船舶名称,获取目标船舶的相似船舶的集合;获取相似船舶的集合对应的港口挂靠数据集合和船期数据集合;基于相似船舶的集合对应的港口挂靠数据集合和船期数据集合,获取目标矩阵;基于目标矩阵,获取满足目标条件的船期;其中,目标矩阵用于表征港口挂靠数据集合中的元素与船期数据集合中的元素之间的编辑距离。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例提供的电子设备中的处理器310可以调用存储器330中的逻辑指令,其实施方式与本发明提供的船期相似性判断方法的实施方式一致,且可以达到相同的有益效果,此处不再赘述。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的船期相似性判断方法,该方法包括:基于船舶名称,获取目标船舶的相似船舶的集合;获取相似船舶的集合对应的港口挂靠数据集合和船期数据集合;基于相似船舶的集合对应的港口挂靠数据集合和船期数据集合,获取目标矩阵;基于目标矩阵,获取满足目标条件的船期;其中,目标矩阵用于表征港口挂靠数据集合中的元素与船期数据集合中的元素之间的编辑距离。
本发明实施例提供的计算机程序产品被执行时,实现上述船期相似性判断方法,其具体的实施方式与前述方法的实施例中记载的实施方式一致,且可以达到相同的有益效果,此处不再赘述。
又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的船期相似性判断方法,该方法包括:基于船舶名称,获取目标船舶的相似船舶的集合;获取相似船舶的集合对应的港口挂靠数据集合和船期数据集合;基于相似船舶的集合对应的港口挂靠数据集合和船期数据集合,获取目标矩阵;基于目标矩阵,获取满足目标条件的船期;其中,目标矩阵用于表征港口挂靠数据集合中的元素与船期数据集合中的元素之间的编辑距离。
本发明实施例提供的非暂态计算机可读存储介质上存储的计算机程序被执行时,实现上述船期相似性判断方法,其具体的实施方式与前述方法的实施例中记载的实施方式一致,且可以达到相同的有益效果,此处不再赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (6)
1.一种船期相似性判断方法,其特征在于,包括:
基于船舶名称,获取目标船舶的相似船舶的集合;
获取所述相似船舶的集合对应的港口挂靠数据集合和船期数据集合;
基于所述相似船舶的集合对应的港口挂靠数据集合和船期数据集合,获取目标矩阵;
基于所述目标矩阵,获取满足目标条件的船期;
其中,所述目标矩阵用于表征所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的编辑距离;
所述基于所述目标矩阵,获取满足目标条件的船期,具体包括:
基于所述目标矩阵,获取所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的相似度;
基于所述相似度,获取满足目标条件的船期;
所述基于所述目标矩阵,获取所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的相似度,具体包括:
基于所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的编辑距离、所述港口挂靠数据集合中的元素的长度和所述船期数据集合中的元素的长度,获取所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的相似度;
所述基于所述相似度,获取满足目标条件的船期,具体包括:
将所述相似度的最大值对应的船期,确定为所述满足目标条件的船期。
2.根据权利要求1所述的船期相似性判断方法,其特征在于,所述基于船舶名称,获取目标船舶的相似船舶的集合,具体包括:
基于船期数据中所述目标船舶的船舶名称,与船舶档案和/或港口挂靠数据进行匹配,获取所述相似船舶的集合。
3.根据权利要求1所述的船期相似性判断方法,其特征在于,所述获取所述相似船舶的集合对应的港口挂靠数据集合和船期数据集合,具体包括:
获取所述相似船舶的集合中各船舶目标时间段的港口挂靠数据,并获取所述相似船舶的集合对应的各船舶公司所述目标时间段的船期数据;
基于所述相似船舶的集合中各船舶目标时间段的港口挂靠数据,获取所述港口挂靠数据集合,并基于所述各船舶公司所述目标时间段的船期数据,获取所述船期数据集合。
4.一种船期相似性判断装置,其特征在于,包括:
船舶筛选模块,用于基于船舶名称,获取目标船舶的相似船舶的集合;
集合构建模块,用于获取所述相似船舶的集合对应的港口挂靠数据集合和船期数据集合;
矩阵获取模块,用于基于所述相似船舶的集合对应的港口挂靠数据集合和船期数据集合,获取目标矩阵;
相似判断模块,用于基于所述目标矩阵,获取满足目标条件的船期;
其中,所述目标矩阵用于表征所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的编辑距离;
所述相似判断模块具体用于:
基于所述目标矩阵,获取所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的相似度;
基于所述相似度,获取满足目标条件的船期;
所述相似判断模块还用于:
基于所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的编辑距离、所述港口挂靠数据集合中的元素的长度和所述船期数据集合中的元素的长度,获取所述港口挂靠数据集合中的元素与所述船期数据集合中的元素之间的相似度;
将所述相似度的最大值对应的船期,确定为所述满足目标条件的船期。
5.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3任一项所述的船期相似性判断方法的步骤。
6.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的船期相似性判断方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110844047.6A CN113469627B (zh) | 2021-07-26 | 2021-07-26 | 船期相似性判断方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110844047.6A CN113469627B (zh) | 2021-07-26 | 2021-07-26 | 船期相似性判断方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113469627A CN113469627A (zh) | 2021-10-01 |
CN113469627B true CN113469627B (zh) | 2023-07-18 |
Family
ID=77882411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110844047.6A Active CN113469627B (zh) | 2021-07-26 | 2021-07-26 | 船期相似性判断方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469627B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015059896A (ja) * | 2013-09-20 | 2015-03-30 | 株式会社日立ソリューションズ | 船舶位置推定システム及び方法 |
CN107146061A (zh) * | 2017-05-26 | 2017-09-08 | 亿海蓝(北京)数据技术股份公司 | 一种基于港口多层区域的船舶挂靠事件挖掘方法及系统 |
CN109118766A (zh) * | 2018-09-04 | 2019-01-01 | 华南师范大学 | 一种基于交通卡口的同行车辆判别方法及装置 |
CN110033022A (zh) * | 2019-03-08 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 文本的处理方法、装置和存储介质 |
CN112948423A (zh) * | 2021-03-15 | 2021-06-11 | 亿海蓝(北京)数据技术股份公司 | 船舶数据查询方法、装置及船舶公证系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7653621B2 (en) * | 2003-07-30 | 2010-01-26 | Oracle International Corporation | Method of determining the similarity of two strings |
US7921120B2 (en) * | 2006-11-30 | 2011-04-05 | D&S Consultants | Method and system for image recognition using a similarity inverse matrix |
WO2014203330A1 (ja) * | 2013-06-18 | 2014-12-24 | 日本郵船株式会社 | 解析装置、解析方法、プログラム及び記録媒体 |
-
2021
- 2021-07-26 CN CN202110844047.6A patent/CN113469627B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015059896A (ja) * | 2013-09-20 | 2015-03-30 | 株式会社日立ソリューションズ | 船舶位置推定システム及び方法 |
CN107146061A (zh) * | 2017-05-26 | 2017-09-08 | 亿海蓝(北京)数据技术股份公司 | 一种基于港口多层区域的船舶挂靠事件挖掘方法及系统 |
CN109118766A (zh) * | 2018-09-04 | 2019-01-01 | 华南师范大学 | 一种基于交通卡口的同行车辆判别方法及装置 |
CN110033022A (zh) * | 2019-03-08 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 文本的处理方法、装置和存储介质 |
CN112948423A (zh) * | 2021-03-15 | 2021-06-11 | 亿海蓝(北京)数据技术股份公司 | 船舶数据查询方法、装置及船舶公证系统 |
Non-Patent Citations (2)
Title |
---|
基于Internet的综合性船期数据采集与整理系统的设计与实现;廖卓;万方学位论文数据库;1-88 * |
海洋运输船舶轨迹分析研究进展;陈金海;陆锋;彭国均;;中国航海(03);56-60 * |
Also Published As
Publication number | Publication date |
---|---|
CN113469627A (zh) | 2021-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kim et al. | Estimation of ship operational efficiency from AIS data using big data technology | |
CN113822518B (zh) | 一种ais大数据驱动的集装箱港口装卸效率计算方法 | |
CN111046491A (zh) | 预估大型船舶柴油主机油耗的方法和装置 | |
CN112541591A (zh) | 一种泊位识别方法、平台 | |
CN115577868B (zh) | 在途船舶的目的港预测方法、装置、可读存储介质和船舶 | |
Veselkov et al. | Development of methods to identify risks to build up the automated diagnosis systems | |
CN110633892A (zh) | 一种ais数据提取延绳钓捕捞状态的方法 | |
CN113469627B (zh) | 船期相似性判断方法、装置、电子设备及存储介质 | |
CN113918619A (zh) | 一种船舶预抵港口识别方法及系统 | |
CN116778437B (zh) | 目标船只轨迹监测方法、装置、电子设备及可读存储介质 | |
CN108288022A (zh) | 基于图像识别的航线货运状况识别方法及装置 | |
CN116955937A (zh) | 海上可疑船舶监测方法、装置、电子设备及存储介质 | |
Müller et al. | Polar research and supply vessel capabilities–An exploratory study | |
CN112699144B (zh) | 一种运输船转载特征信息提取方法 | |
CN115456258A (zh) | 竞争对手船舶运力预测方法、计算机可读介质 | |
CN111028482B (zh) | 远洋航行的提醒方法、装置及系统 | |
Hansson et al. | Casks from Gribshunden (1495)–dendrochronology of Late Medieval shipboard victual containers | |
Ramadhani et al. | Stevedoring Time Estimation on Smart Port Services Using K-NN Algorithm | |
CN113298463A (zh) | 船舶航行准点率的计算方法、装置、电子设备及存储介质 | |
Halliday | Vessel traffic trends in the Arctic and overlap with important marine mammal areas | |
Söder et al. | Motion-based monitoring of racking stresses in ro-ro ships | |
CN116186907B (zh) | 基于船用子系统状态分析适航状态的方法、系统和介质 | |
CN118566917A (zh) | 一种星载sar海洋舰船目标联合检测识别方法及装置 | |
KR20170130046A (ko) | 최적 선박 결정 시스템 및 방법 | |
Fancello et al. | A Port Accessibility Index for Mediterranean container terminals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |