CN115730742B - 一种在航集装箱班轮航线预测方法及系统 - Google Patents
一种在航集装箱班轮航线预测方法及系统 Download PDFInfo
- Publication number
- CN115730742B CN115730742B CN202211531054.1A CN202211531054A CN115730742B CN 115730742 B CN115730742 B CN 115730742B CN 202211531054 A CN202211531054 A CN 202211531054A CN 115730742 B CN115730742 B CN 115730742B
- Authority
- CN
- China
- Prior art keywords
- container
- routes
- trade area
- area
- trade
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000013528 artificial neural network Methods 0.000 claims abstract description 15
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 15
- 238000004458 analytical method Methods 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 18
- 238000012544 monitoring process Methods 0.000 claims description 17
- 238000003062 neural network model Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 10
- 230000003068 static effect Effects 0.000 claims description 6
- 238000007670 refining Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 2
- 238000003058 natural language processing Methods 0.000 description 6
- 230000000306 recurrent effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种在航集装箱班轮航线预测方法及系统,该方法基于在航集装箱班轮的AIS历史航行数据和港口数据,将某个船公司相同船型的集装箱班轮AIS历史航行数据中的历史贸易区航线以主要贸易区为界进行分割得到多个环形贸易区航线,再将统计出的频率大于预设频率阈值的环形贸易区航线保留,并按照东西走向和南北走向进行分割,得到多个单程贸易区航线并作为航线字典进行保存和编码,采用动态规划算法识别出集装箱班轮贸易区航线,并根据港口数据找出已识别出的集装箱班轮贸易区航线对应的港口,得到集装箱班轮港口航线,最后基于循环神经网络预测出未来的在航集装箱班轮贸易区航线和港口航线,完成全球集装箱班轮在航航线的预测。
Description
技术领域
本发明涉及集装箱航运技术领域,具体涉及一种在航集装箱班轮航线预测方法及系统。
背景技术
随着经济全球化的快速发展,国际贸易往来日益密切,集装箱运输船舶凭借其运输能力强、装卸效率高、节约装卸劳动力、货损和货差小等优势成为国际货物运输的主要方式之一。从航运业务的角度出发,为了动态掌握全球集装箱贸易货物的流向,应对运力突变等不确定因素,寻找更加准时的航线和船舶,确保运输生产的稳定性,供经营决策作参考,航运企业需要通过确定集装箱船舶的运力流向,直观掌握全球贸易货物的流向。目前,绝大部分集装箱航线都以班轮形式经营。集装箱班轮航线是指至少在两个港口间通过集装箱船舶定期往返或环绕航行承运集装箱货物的航线,其特征是采用集装箱从事班轮运输。由于集装箱班轮航线是由各船公司自行定义的,没有一个统一的标准,为保证箱位的充分利用,航线上船舶往返可能挂靠不同的港口,这给航线运力的分类和识别造成了障碍,也很难统计航线运力变化。
发明内容
为解决全球在航集装箱班轮航线结构、航线运力统计及各航线运力的变化难以统计以及识别困难等问题等问题,本发明提供了一种在航集装箱班轮航线预测方法,利用自然语言处理中的动态规划算法和循环神经网络,并结合AIS数据特点、集装箱航运的区域特点和集装箱班轮的实际业务特征,完成全球在航集装箱班轮的贸易区航线和港口航线预测,能够获得实时世界经济贸易的流向,为基于大数据的运力规划提供支持,并给企业盈利提供指导和帮助。本发明还涉及一种在航集装箱班轮航线预测系统。
本发明的技术方案如下:
一种在航集装箱班轮航线预测方法,其特征在于,包括以下步骤:
数据采集步骤:采集在航集装箱班轮的AIS历史航行数据和港口数据;
航线识别步骤:将某个船公司相同船型的集装箱班轮AIS历史航行数据中的历史贸易区航线以主要贸易区为界进行分割,得到多个环形贸易区航线,并分别统计出各个环形贸易区航线在历史贸易区航线中出现的频率,将所述频率与预设频率阈值进行比较,将频率大于预设频率阈值的环形贸易区航线保留,并对保留的环形贸易区航线按照东西走向和南北走向进行分割,得到多个单程贸易区航线并作为航线字典进行保存和编码,再将航线字典中多个单程贸易区航线中的所有贸易区作为一个字符串,采用动态规划算法寻找已编码的航线字典中的最长公共子字符串,将最长公共子字符串对应的多个贸易区所构成的单程贸易区航线作为已识别出的集装箱班轮贸易区航线,并根据港口数据找出已识别出的集装箱班轮贸易区航线对应的港口,得到集装箱班轮港口航线;
航线预测步骤:将识别出的集装箱班轮贸易区航线和港口航线作为训练集样本,基于循环神经网络对训练集样本进行训练得到循环神经网络模型,将集装箱班轮近期经过的所有贸易区和港口作为测试集样本输入至循环神经网络模型中,预测未来的在航集装箱班轮贸易区航线和港口航线。
优选地,所述航线识别步骤中,所述主要贸易区包括一级贸易区和二级贸易区,所述一级贸易区包括亚太贸易区、欧洲贸易区、美洲贸易区和拉非贸易区,所述二级贸易区包括远东贸易区、西北欧贸易区、美西北贸易区和美西南贸易区。
优选地,在识别出集装箱班轮贸易区航线后,结合业务逻辑,对经过一级贸易区的集装箱班轮贸易区航线进行分类和编码,同时将经过相同二级贸易区的任意两条集装箱班轮贸易区航线认定为是同一条航线并进行编码。
优选地,在航线预测步骤之后还包括航线分类及运力监控分析步骤,用于根据编码完成的集装箱班轮贸易区航线对每艘集装箱班轮的历史航线轨迹进行识别和分类、根据集装箱船期表获取全球主要集装箱班轮航线对预测的集装箱班轮贸易区航线进行分类、对集装箱班轮进行运力监控、以及根据集装箱班轮运力进行全球航线运力动态变化分析。
优选地,所述航线识别步骤中,还将识别出的每个港口航线分别作为一个字符串,利用最小编辑距离计算出任意两个字符串之间的编辑距离,并将编辑距离与预设阈值进行比对,若编辑距离小于预设阈值,则认定这两个字符串所对应的两条航线为同一条航线。
优选地,所述数据采集步骤中,所述AIS历史航行数据包括静态数据和动态数据,所述静态数据包括船舶移动业务识别码、船舶类型、呼号、船名、船高、船长和船宽,所述动态数据包括船舶经纬度位置信息、时间戳、对地航向、对地航速和船艏向;所述港口数据包括每个航段的起始和结束时间及起终点港口、港口所属的国家和区域以及港口经纬度。
一种在航集装箱班轮航线预测系统,其特征在于,包括依次连接的数据采集模块、航线识别模块和航线预测模块,
数据采集模块,采集在航集装箱班轮的AIS历史航行数据和港口数据;
航线识别模块,将某个船公司相同船型的集装箱班轮AIS历史航行数据中的历史贸易区航线以主要贸易区为界进行分割,得到多个环形贸易区航线,并分别统计出各个环形贸易区航线在历史贸易区航线中出现的频率,将所述频率与预设频率阈值进行比较,将频率大于预设频率阈值的环形贸易区航线保留,并对保留的环形贸易区航线按照东西走向和南北走向进行分割,得到多个单程贸易区航线并作为航线字典进行保存和编码,再将航线字典中多个单程贸易区航线中的所有贸易区作为一个字符串,采用动态规划算法寻找已编码的航线字典中的最长公共子字符串,将最长公共子字符串对应的多个贸易区所构成的单程贸易区航线作为已识别出的集装箱班轮贸易区航线,并根据港口数据找出已识别出的集装箱班轮贸易区航线对应的港口,得到集装箱班轮港口航线;
航线预测模块,将识别出的集装箱班轮贸易区航线和港口航线作为训练集样本,基于循环神经网络对训练集样本进行训练得到循环神经网络模型,将集装箱班轮近期经过的所有贸易区和港口作为测试集样本输入至循环神经网络模型中,预测未来的在航集装箱班轮贸易区航线和港口航线。
优选地,所述主要贸易区包括一级贸易区和二级贸易区,所述一级贸易区包括亚太贸易区、欧洲贸易区、美洲贸易区和拉非贸易区,所述二级贸易区包括远东贸易区、西北欧贸易区、美西北贸易区和美西南贸易区。
优选地,在识别出集装箱班轮贸易区航线后,结合业务逻辑,对经过一级贸易区的集装箱班轮贸易区航线进行分类和编码,同时将经过相同二级贸易区的任意两条集装箱班轮贸易区航线认定为是同一条航线并进行编码。
优选地,还包括与航线预测模块相连的航线分类及运力监控分析模块,用于根据编码完成的集装箱班轮贸易区航线对每艘集装箱班轮的历史航线轨迹进行识别和分类、根据集装箱船期表获取全球主要集装箱班轮航线对预测的集装箱班轮贸易区航线进行分类、对集装箱班轮进行运力监控、以及根据集装箱班轮运力进行全球航线运力动态变化分析。
本发明的有益效果为:
本发明提供的一种在航集装箱班轮航线预测方法,首先通过对集装箱船的AIS历史航行数据以及港口数据进行采集,其采集的数据均为集装箱班轮历史上真实的航行数据,由此确保了识别出的航线的真实性和准确性;再将某个船公司相同船型的集装箱班轮AIS历史航行数据中的历史贸易区航线以主要贸易区为界进行分割,得到多个环形贸易区航线,并分别统计出各个环形贸易区航线在历史贸易区航线中出现的频率,将频率与预设频率阈值进行比较,将频率大于预设频率阈值的环形贸易区航线保留。同时,为了进一步细化运力流向,对保留的环形贸易区航线按照东西走向和南北走向进行分割,得到多个单程贸易区航线并作为航线字典进行保存和编码,以便于后续调用和分析。然后采用动态规划算法寻找已编码的航线字典中的最长公共子字符串,将最长公共子字符串对应的多个贸易区所构成的单程贸易区航线作为已识别出的集装箱班轮贸易区航线,并根据港口数据找出已识别出的集装箱班轮贸易区航线对应的港口,得到集装箱班轮港口航线,最后基于循环神经网络预测出未来在航集装箱班轮贸易区航线和集装箱班轮港口航线,并将预测出的集装箱班轮贸易区航线和集装箱班轮港口航线保存至数据库中,为未来航线运力统计和航线运力变化分析提供了支持。本发明为所有的集装箱班轮航线定义了一个统一的标准,同时通过业务逻辑,实现了对在航航线从贸易区到港口的预测,为基于大数据的运力规划提供了支持。
本发明还涉及一种在航集装箱班轮航线预测系统,该系统与上述的在航集装箱班轮航线预测方法相对应,可理解为是一种实现上述在航集装箱班轮航线预测方法的系统,包括依次连接的数据采集模块、航线识别模块、航线预测模块和进一步优化的航线分类及运力监控分析模块,各模块相互协同工作,利用自然语言处理中的动态规划算法,结合AIS数据特点、集装箱航运的区域特点和集装箱班轮的实际业务特征,完成全球集装箱班轮在航航线(包括贸易区航线和港口航线)的预测,进而对不同船公司的航线运力进行预测,为基于大数据的运力规划提供支持。
附图说明
图1是本发明在航集装箱班轮航线预测方法的流程图。
图2是本发明在航集装箱班轮航线预测方法的优选流程图。
具体实施方式
下面结合附图对本发明进行说明。
本发明涉及一种在航集装箱班轮航线预测方法,该方法的流程图如图1所示,依次包括以下步骤:
数据采集步骤,或进一步称为数据采集和预处理步骤:采集在航集装箱班轮的AIS历史航行数据和港口数据,并进行预处理;具体地,如图2所示的优选流程图,先使用Python语言中的psycopg2(是Python语言的PostgreSQL数据库接口)连接PostgreSQL数据库,从PostgreSQL数据库中取出移动业务识别码MMSI为215173000的集装箱船的AIS历史航行数据,以及港口数据,在获得上述数据后,对数据进行清洗,去除无用的干扰数据,先对AIS的数据进行预处理,去掉AIS中有问题的数据(如缺失过多),然后对港口数据进行预处理,去除修船的数据、起始港和终点港有缺失的数据、未知港口的数据以及起点港与终点港为相同港口的数据,并将起始港和终点港分别匹配到相应的国家和区域。优选地,AIS历史航行数据包括静态数据和动态数据,静态数据包括船舶移动业务识别码MMSI、船舶类型、呼号、船名、船高、船长和船宽等,动态数据包括船舶经纬度位置信息、时间戳、对地航向、对地航速和船艏向等。优选地,港口数据包括每个航段的起始和结束时间及起终点港口、港口所属的国家和区域以及港口经纬度等。
航线识别步骤:将某个船公司相同船型的集装箱班轮AIS历史航行数据中的历史贸易区航线以主要贸易区为界进行分割,得到多个环形贸易区航线,并分别统计出各个环形贸易区航线在历史贸易区航线中出现的频率,将频率与预设频率阈值进行比较,将频率大于预设频率阈值的环形贸易区航线保留,并对保留的环形贸易区航线按照东西走向和南北走向进行分割,得到多个单程贸易区航线并作为航线字典进行保存和编码,再将航线字典中多个单程贸易区航线中的所有贸易区作为一个字符串,采用动态规划算法寻找已编码的航线字典中的最长公共子字符串,将最长公共子字符串对应的多个贸易区所构成的单程贸易区航线作为已识别出的集装箱班轮贸易区航线,并根据港口数据找出已识别出的集装箱班轮贸易区航线对应的港口,得到集装箱班轮港口航线;
具体地,首先基于业务经验,考察以主要贸易区开始和结束的航线,例如:远东,美西,西北欧等。通过将某个船公司相同船型的集装箱班轮AIS历史航行数据中的历史贸易区航线以主要贸易区为界进行分割,得到多个环形贸易区航线,然后分别统计出各个环形贸易区航线在历史贸易区航线中出现的频率,并将在历史贸易区航线中出现频率次数大于2次的环形贸易区航线进行保留,并对这些保留下来的环形贸易区航线按照东西走向和南北走向进行分割,得到多个集装箱班轮单程贸易区航线并作为航线字典进行保存和编码,再将航线字典中多个集装箱班轮单程贸易区航线中的所有贸易区作为一个字符串,采用动态规划算法寻找已编码的航线字典中的最长公共子字符串,将最长公共子字符串对应的多个贸易区所构成的单程贸易区航线作为已识别出的集装箱班轮贸易区航线,并根据港口数据找出已识别出的集装箱班轮贸易区航线对应的港口,得到集装箱班轮港口航线;
需要说明的是,结合业务逻辑,上述的主要贸易区分为一级贸易区和二级贸易区,一级贸易区主要包括亚太、欧洲、美洲和拉非等贸易区,一级贸易区又分为远东、西北欧、美西北、美西南等18个二级贸易区。由于集装箱班轮航线与船型及船公司都有密切的关系,集装箱班轮贸易区航线呈现出同船型、同船公司的航线规律性更明显,而不同船型、不同船公司的航线规律性不够明显的特征,根据船型和船公司分类识别集装箱班轮航线,对历史贸易区航线识别后,标注每条航线的编码。此外,对经过一级贸易区的集装箱班轮贸易区航线进行分类和编码,将经过相同的二级贸易区的任意两条集装箱班轮贸易区航线认定为是同一条航线并进行编码,其中,编码通过字母和数字结合的方式,保证每条航线均有唯一的编码与之一一对应。
MMSI为215173000的集装箱班轮贸易区航线识别结果如表1所示。
表1:
上表中,teu为国际标准集装箱个数,operator_body为运营商,code_name为航线代码,route_name为贸易区航线中文名。
其中,在计算机科学中,最长公共子串问题是寻找两个或多个已知字符串最长的子串,其中子序列必须是连续的。最长公共子串问题可以被动态规划的算法解决,其最优解可以由子问题的最优解推导得到,可以先求子问题的最优解,再构造原问题的最优解。如果动态规划问题子问题有较多的重复出现,可以自底向上从最终子问题向原问题逐步求解。对于动态规划问题有些子问题被重复计算了很多次,通过保存已解决的子问题的答案可以避免大量的重复计算。
从港口层面来看,该航线每次经过的港口并不完全相同,将每个港口航线作为一个字符串,可以计算出字符串相似度大的两条航线,并将这两条航线作为相同的航线。在计算字符串相似度的时候,经常会用到最小编辑距离(min edit distance),也就是Levenshtein距离(Levenshtein Distance),它是指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括:1)任意位置插入一个字符;2)任意位置删除一个字符;3)任意位置修改一个字符。将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个字符串的相似度越大。这里规定编辑距离小于5的两个字符串为同一条字符串。
经计算表2中的第三条和第四条港口航线之间的编辑距离为4,被认为是同一条航线,取其众数作为标准推荐航线。
表2:
上表中,port_name_cn为港口航线中文名。
航线预测步骤:在识别出集装箱班轮贸易区航线和集装箱班轮港口航线后,将识别出的集装箱班轮贸易区航线和港口航线作为训练集样本,基于循环神经网络对训练集样本进行训练得到循环神经网络模型,将集装箱班轮近期经过的所有贸易区和港口作为测试集样本输入至循环神经网络模型中,预测未来的在航集装箱班轮贸易区航线和港口航线。
此外,根据集装箱班轮的航线相对来说较为固定和在港口间环绕航行的特点,参考自然语言处理中对语句的定义,可以将根据特定的船公司和特定的船型识别出的所有航线看成一个语料库,将识别出的集装箱班轮贸易区航线和港口航线看做语句,将集装箱班轮经过的所有贸易区和港口看作单词。由于集装箱班轮航线相对固定且会不断重复出现的特点,预测班轮航线的过程可以看作一个利用循环神经网络寻找下一个单词的过程,通过这种方法找出来的单词可以认为是一条固定的集装箱班轮的预测贸易区航线。值得注意的是,大型船舶的航行规律性强,预测比较容易,而小型船舶的航行规律弱,预测比较困难。
其中,循环神经网络是专门处理序列的神经网络。由于它们在处理文本方面的有效性,因此经常用于自然语言处理的任务。传统的神经网络,以及卷积神经网络,只适用于预先设定大小的问题。一般来说,就是采用固定的大小的输入并产生固定大小的输出。而循环神经网络专注于处理文本,其输入和输出的长度是可变的,包括一对一,一对多,多对一,多对多。循环神经网络的工作原理是迭代更新一个隐藏状态h,它是一个可以有任意维度的向量。而对于任意的一个ht:1、由对应的输入xt与上一个隐藏层ht-1来计算2、输出yt是由ht计算出的结果。由此前一次的输出结果,就会带到下一次的隐藏层中,跟着一起训练完成循环。
以MMSI为215173000的集装箱班轮为例,表3和表4分别展现了预测的部分贸易区航线和港口航线,正确率均在95%以上。结果充分说明了自然语言处理方法在集装箱航线预测中非常有效。
表3:
上表中,past为过去的贸易区航线,current为当前的贸易区,predict为未来的贸易区。
表4:
上表中,past为过去的港口航线,current为当前的港口,predict为未来的港口。
此外,还可以将上述贸易区航线细化到港口层面,并提取航线每个港口的抵离港时间、航行时长及航行里程、靠泊时长等信息。其中,航行里程单位为海里,航行时长单位为小时,靠泊时长单位为小时。
优选地,在航线预测步骤之后还包括航线分类及运力监控分析步骤,用于根据编码完成的集装箱班轮贸易区航线对每艘集装箱班轮的历史航线轨迹进行识别和分类、根据集装箱船期表获取全球主要集装箱班轮航线对预测的集装箱班轮贸易区航线进行分类、对集装箱班轮进行运力监控、以及根据集装箱班轮运力进行全球航线运力动态变化分析。
其中,航线分类及运力分析监控具体包括:
1)通过上述步骤中编码完成的集装箱班轮航线对每艘集装箱班轮的历史航线轨迹进行识别和分类。在识别过程中将集装箱班轮历史上经过的贸易区尽可能多的包括在识别出的航线中,对于未识别出的贸易区,可作为异常数据处理。
2)根据航线经过的二级贸易区信息,将贸易区航线细化到对应的国家和港口。由于集装箱班轮运力监控需要细化到港口层面,同一条航线从港口层面来看可能经过的港口非常相似但不完全相同,判断港口航线是否相似采用文本相似系数,该系数用于比较有限样本集之间的相似性与差异性。文本相似系数值越大,样本相似度越高。
3)找出航线的起始时间和终止时间,确定该航线运营的相关年份时间信息。
4)找出每条航线中各港口的到港时间、离港时间、航行时长、航行里程、靠泊时长等信息,同航线中时长和里程数据取中位数作为该航线的标准推荐值保存。
5)根据现有的集装箱船期表获取全球主要集装箱班轮航线对预测的集装箱班轮贸易区航线进行分类,包括跨太平洋航线、跨大西洋航线、欧洲、地中海-远东航线、远东区域内航线、远东-澳新航线、欧洲、地中海-西非、南非航线。
6)已知任意两港或任意两贸易区,可以找出经过这两港或两贸易区的集装箱班轮的历史航线和未来航线,根据集装箱班轮的运力进行全球航线运力动态变化分析。
本发明还涉及了一种在航集装箱班轮航线预测系统,该系统与上述在航集装箱班轮航线预测方法相对应,可理解为是实现上述方法的系统,该系统包括依次连接的数据采集模块、航线识别模块和航线预测模块,具体地,
数据采集模块,采集在航集装箱班轮的AIS历史航行数据和港口数据;
航线识别模块,将某个船公司相同船型的集装箱班轮AIS历史航行数据中的历史贸易区航线以主要贸易区为界进行分割,得到多个环形贸易区航线,并分别统计出各个环形贸易区航线在历史贸易区航线中出现的频率,将所述频率与预设频率阈值进行比较,将频率大于预设频率阈值的环形贸易区航线保留,并对保留的环形贸易区航线按照东西走向和南北走向进行分割,得到多个单程贸易区航线并作为航线字典进行保存和编码,再将航线字典中多个单程贸易区航线中的所有贸易区作为一个字符串,采用动态规划算法寻找已编码的航线字典中的最长公共子字符串,将最长公共子字符串对应的多个贸易区所构成的单程贸易区航线作为已识别出的集装箱班轮贸易区航线,并根据港口数据找出已识别出的集装箱班轮贸易区航线对应的港口,得到集装箱班轮港口航线;
航线预测模块,将识别出的集装箱班轮贸易区航线和港口航线作为训练集样本,基于循环神经网络对训练集样本进行训练得到循环神经网络模型,将集装箱班轮近期经过的所有贸易区和港口作为测试集样本输入至循环神经网络模型中,预测未来的在航集装箱班轮贸易区航线和港口航线。
优选地,主要贸易区包括一级贸易区和二级贸易区,所述一级贸易区包括亚太贸易区、欧洲贸易区、美洲贸易区和拉非贸易区,所述二级贸易区包括远东贸易区、西北欧贸易区、美西北贸易区和美西南贸易区。
优选地,在识别出集装箱班轮贸易区航线后,结合业务逻辑,对经过一级贸易区的集装箱班轮贸易区航线进行分类和编码,将经过相同的二级贸易区的任意两条集装箱班轮贸易区航线认定为是同一条航线并进行编码。
优选地,还包括与航线预测模块相连的航线分类及运力监控分析模块,用于根据编码完成的集装箱班轮贸易区航线对每艘集装箱班轮的历史航线轨迹进行识别和分类、根据集装箱船期表获取全球主要集装箱班轮航线对预测的集装箱班轮贸易区航线进行分类、对集装箱班轮进行运力监控、以及根据集装箱班轮运力进行全球航线运力动态变化分析。
本发明提供了客观、科学的集装箱班轮航线运力分析方法及系统,利用自然语言处理中的动态规划算法,结合AIS数据特点、集装箱航运的区域特点和集装箱班轮的实际业务特征,完成全球集装箱班轮在航航线的预测,进而对不同船公司的航线运力进行预测,为基于大数据的运力规划提供支持。
应当指出,以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明创造,但不以任何方式限制本发明创造。因此,尽管本说明书参照附图和实施例对本发明创造已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换,总之,一切不脱离本发明创造的精神和范围的技术方案及其改进,其均应涵盖在本发明创造专利的保护范围当中。
Claims (9)
1.一种在航集装箱班轮航线预测方法,其特征在于,包括以下步骤:
数据采集步骤:采集在航集装箱班轮的AIS历史航行数据和港口数据;
航线识别步骤:将某个船公司相同船型的集装箱班轮AIS历史航行数据中的历史贸易区航线以主要贸易区为界进行分割,得到多个环形贸易区航线,并分别统计出各个环形贸易区航线在历史贸易区航线中出现的频率,将所述频率与预设频率阈值进行比较,将频率大于预设频率阈值的环形贸易区航线保留,并对保留的环形贸易区航线按照东西走向和南北走向进行分割,细化运力流向,得到多个单程贸易区航线并作为航线字典进行保存和编码,再将航线字典中多个单程贸易区航线中的所有贸易区作为一个字符串,采用动态规划算法寻找已编码的航线字典中的最长公共子字符串,将最长公共子字符串对应的多个贸易区所构成的单程贸易区航线作为已识别出的集装箱班轮贸易区航线,并根据港口数据找出已识别出的集装箱班轮贸易区航线对应的港口,得到集装箱班轮港口航线,并将识别出的每个港口航线分别作为一个字符串,利用最小编辑距离计算出任意两个字符串之间的编辑距离,并将编辑距离与预设阈值进行比对,若编辑距离小于预设阈值,则认定这两个字符串所对应的两条航线为同一条航线;
航线预测步骤:将识别出的该船公司相同船型的集装箱班轮贸易区航线和港口航线作为训练集样本,基于循环神经网络对训练集样本进行训练得到循环神经网络模型,将集装箱班轮近期经过的所有贸易区和港口作为测试集样本输入至循环神经网络模型中,预测未来的在航集装箱班轮贸易区航线和港口航线。
2.根据权利要求1所述的在航集装箱班轮航线预测方法,其特征在于,所述航线识别步骤中,所述主要贸易区包括一级贸易区和二级贸易区,所述一级贸易区包括亚太贸易区、欧洲贸易区、美洲贸易区和拉非贸易区,所述二级贸易区包括远东贸易区、西北欧贸易区、美西北贸易区和美西南贸易区。
3.根据权利要求2所述的在航集装箱班轮航线预测方法,其特征在于,在识别出集装箱班轮贸易区航线后,结合业务逻辑,对经过一级贸易区的集装箱班轮贸易区航线进行分类和编码,同时将经过相同二级贸易区的任意两条集装箱班轮贸易区航线认定为是同一条航线并进行编码。
4.根据权利要求3所述的在航集装箱班轮航线预测方法,其特征在于,在航线预测步骤之后还包括航线分类及运力监控分析步骤,用于根据编码完成的集装箱班轮贸易区航线对每艘集装箱班轮的历史航线轨迹进行识别和分类、根据集装箱船期表获取全球主要集装箱班轮航线对预测的集装箱班轮贸易区航线进行分类、对集装箱班轮进行运力监控、以及根据集装箱班轮运力进行全球航线运力动态变化分析。
5.根据权利要求1所述的在航集装箱班轮航线预测方法,其特征在于,所述数据采集步骤中,所述AIS历史航行数据包括静态数据和动态数据,所述静态数据包括船舶移动业务识别码、船舶类型、呼号、船名、船高、船长和船宽,所述动态数据包括船舶经纬度位置信息、时间戳、对地航向、对地航速和船艏向;所述港口数据包括每个航段的起始和结束时间及起终点港口、港口所属的国家和区域以及港口经纬度。
6.一种在航集装箱班轮航线预测系统,其特征在于,包括依次连接的数据采集模块、航线识别模块和航线预测模块,
数据采集模块,采集在航集装箱班轮的AIS历史航行数据和港口数据;
航线识别模块,将某个船公司相同船型的集装箱班轮AIS历史航行数据中的历史贸易区航线以主要贸易区为界进行分割,得到多个环形贸易区航线,并分别统计出各个环形贸易区航线在历史贸易区航线中出现的频率,将所述频率与预设频率阈值进行比较,将频率大于预设频率阈值的环形贸易区航线保留,并对保留的环形贸易区航线按照东西走向和南北走向进行分割,细化运力流向,得到多个单程贸易区航线并作为航线字典进行保存和编码,再将航线字典中多个单程贸易区航线中的所有贸易区作为一个字符串,采用动态规划算法寻找已编码的航线字典中的最长公共子字符串,将最长公共子字符串对应的多个贸易区所构成的单程贸易区航线作为已识别出的集装箱班轮贸易区航线,并根据港口数据找出已识别出的集装箱班轮贸易区航线对应的港口,得到集装箱班轮港口航线,再将识别出的每个港口航线分别作为一个字符串,利用最小编辑距离计算出任意两个字符串之间的编辑距离,并将编辑距离与预设阈值进行比对,若编辑距离小于预设阈值,则认定这两个字符串所对应的两条航线为同一条航线;
航线预测模块,将识别出的该船公司相同船型的集装箱班轮贸易区航线和港口航线作为训练集样本,基于循环神经网络对训练集样本进行训练得到循环神经网络模型,将集装箱班轮近期经过的所有贸易区和港口作为测试集样本输入至循环神经网络模型中,预测未来的在航集装箱班轮贸易区航线和港口航线。
7.根据权利要求6所述的在航集装箱班轮航线预测系统,其特征在于,所述主要贸易区包括一级贸易区和二级贸易区,所述一级贸易区包括亚太贸易区、欧洲贸易区、美洲贸易区和拉非贸易区,所述二级贸易区包括远东贸易区、西北欧贸易区、美西北贸易区和美西南贸易区。
8.根据权利要求7所述的在航集装箱班轮航线预测系统,其特征在于,在识别出集装箱班轮贸易区航线后,结合业务逻辑,对经过一级贸易区的集装箱班轮贸易区航线进行分类和编码,同时将经过相同二级贸易区的任意两条集装箱班轮贸易区航线认定为是同一条航线并进行编码。
9.根据权利要求8所述的在航集装箱班轮航线预测系统,其特征在于,还包括与航线预测模块相连的航线分类及运力监控分析模块,用于根据编码完成的集装箱班轮贸易区航线对每艘集装箱班轮的历史航线轨迹进行识别和分类、根据集装箱船期表获取全球主要集装箱班轮航线对预测的集装箱班轮贸易区航线进行分类、对集装箱班轮进行运力监控、以及根据集装箱班轮运力进行全球航线运力动态变化分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211531054.1A CN115730742B (zh) | 2022-12-01 | 2022-12-01 | 一种在航集装箱班轮航线预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211531054.1A CN115730742B (zh) | 2022-12-01 | 2022-12-01 | 一种在航集装箱班轮航线预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115730742A CN115730742A (zh) | 2023-03-03 |
CN115730742B true CN115730742B (zh) | 2024-01-16 |
Family
ID=85300289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211531054.1A Active CN115730742B (zh) | 2022-12-01 | 2022-12-01 | 一种在航集装箱班轮航线预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115730742B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112132346A (zh) * | 2020-09-24 | 2020-12-25 | 中国科学院空天信息创新研究院 | 一种基于船舶类型的船舶航行轨迹预测方法 |
CN112487116A (zh) * | 2020-11-19 | 2021-03-12 | 江苏锐天信息科技有限公司 | 一种基于ais大数据的船舶航迹分析方法 |
CN113780395A (zh) * | 2021-08-31 | 2021-12-10 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 海量高维ais轨迹数据聚类方法 |
CN113780952A (zh) * | 2021-09-16 | 2021-12-10 | 上海船舶运输科学研究所 | 一种集装箱班轮航线运力分析方法及系统 |
CN114077926A (zh) * | 2021-11-18 | 2022-02-22 | 阿里云计算有限公司 | 航行轨迹预测方法、计算机存储介质及程序产品 |
-
2022
- 2022-12-01 CN CN202211531054.1A patent/CN115730742B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112132346A (zh) * | 2020-09-24 | 2020-12-25 | 中国科学院空天信息创新研究院 | 一种基于船舶类型的船舶航行轨迹预测方法 |
CN112487116A (zh) * | 2020-11-19 | 2021-03-12 | 江苏锐天信息科技有限公司 | 一种基于ais大数据的船舶航迹分析方法 |
CN113780395A (zh) * | 2021-08-31 | 2021-12-10 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 海量高维ais轨迹数据聚类方法 |
CN113780952A (zh) * | 2021-09-16 | 2021-12-10 | 上海船舶运输科学研究所 | 一种集装箱班轮航线运力分析方法及系统 |
CN114077926A (zh) * | 2021-11-18 | 2022-02-22 | 阿里云计算有限公司 | 航行轨迹预测方法、计算机存储介质及程序产品 |
Non-Patent Citations (2)
Title |
---|
Earth Mover’s Distance as a Similarity Measure for Linear Order Statistics and Fuzzy Integrals;Matthew Deardorff et al.;IEEE International Conference on Fuzzy Systems;第1-8页 * |
基于AIS信息的船舶轨迹聚类模型及应用;肖潇等;中国航海;第38卷(第02期);第82-86页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115730742A (zh) | 2023-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109686085B (zh) | 基于gps数据危险货物运输车辆停留节点活动类型识别方法 | |
CN101996247B (zh) | 地址数据库的建构方法及装置 | |
CN113780952B (zh) | 一种集装箱班轮航线运力分析方法及系统 | |
CN112765358A (zh) | 一种基于噪声标签学习的纳税人行业分类方法 | |
CN107577702B (zh) | 一种社交媒体中交通信息的辨别方法 | |
CN105069047A (zh) | 一种地理信息的检索方法及装置 | |
CN102024024A (zh) | 地址数据库的建构方法及装置 | |
CN111597420A (zh) | 基于深度学习的轨道交通规范关系抽取方法 | |
Zhu et al. | Inferring taxi status using gps trajectories | |
CN111931077B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN113268615A (zh) | 资源标签生成方法、装置、电子设备及存储介质 | |
CN112948603A (zh) | 一种基于迁移学习的运输投送知识问答方法 | |
Sun et al. | Road network metric learning for estimated time of arrival | |
Liu et al. | Data-driven framework for extracting global maritime shipping networks by machine learning | |
CN111625732A (zh) | 地址匹配方法及装置 | |
CN113627288B (zh) | 一种面向海量影像的智能化信息标签获取方法 | |
CN115730742B (zh) | 一种在航集装箱班轮航线预测方法及系统 | |
Vicentiy et al. | Automated extraction and visualization of spatial data obtained by analyzing texts about projects of arctic transport logistics development | |
Mei et al. | Port recommendation system for alternative container port destinations using a novel neural language-based algorithm | |
CN110530386A (zh) | 一种基于改进Dijkstra算法的动态最短路径规划方法 | |
CN115423841B (zh) | 一种面向大宗物流的运输终点校准方法及系统 | |
CN114359493B (zh) | 一种用于无人船生成三维语义地图的方法和系统 | |
CN115599910A (zh) | 一种企业三级行业多标签分类方法 | |
CN114896353A (zh) | 一种地理编码方法、存储介质及系统 | |
Abbass et al. | Car license plate segmentation and recognition system based on deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |