CN113326976B - 一种基于时空关联的港口货运量在线预测方法及系统 - Google Patents

一种基于时空关联的港口货运量在线预测方法及系统 Download PDF

Info

Publication number
CN113326976B
CN113326976B CN202110500422.5A CN202110500422A CN113326976B CN 113326976 B CN113326976 B CN 113326976B CN 202110500422 A CN202110500422 A CN 202110500422A CN 113326976 B CN113326976 B CN 113326976B
Authority
CN
China
Prior art keywords
port
freight volume
data
prediction
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110500422.5A
Other languages
English (en)
Other versions
CN113326976A (zh
Inventor
鲍香台
苏竹勋
刘磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202110500422.5A priority Critical patent/CN113326976B/zh
Publication of CN113326976A publication Critical patent/CN113326976A/zh
Application granted granted Critical
Publication of CN113326976B publication Critical patent/CN113326976B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Abstract

本发明还公开了一种基于时空关联的港口短期货运量在线预测方法,包含如下步骤:首先获取目标港口和其他港口的过去预设时间段内的货运量数据,并对数据进行均值处理;接着目标港口和其他港口的货运量数据进行灰度关联分析,计算各港口关联度,选取相关度高于关联度阈值的其他港口划分数据并构建货运量时空预测模型;然后将划分好的训练数据输入模型中进行模型训练,训练后的模型用于预测目标港口的短期货运量。所述方法考虑相关港口的时空相关性,可以提高短期货运量预测的准确性,同时采用的GBDT在预测模型中具有最高的预测精度。

Description

一种基于时空关联的港口货运量在线预测方法及系统
技术领域
本发明涉及港口货运量预测领域,具体涉及一种基于时空关联的港口货运量在线预 测方法及系统。
背景技术
港口货运量是指一定时期内港口实际运输的吨位,它是到达量和交付量的总和,是 揭示港口经济状况以及港口地区经济活力的重要指标。货运量的预测可以根据不同的标 准进行分类。按运输范围可分为全国货运需求预测,全国货运需求预测和各部门货运需求。关于预测内容,可以分为交货预测,到达预测和货运量预测。关于预测时间的长短, 可以分为长期预测,中期预测和短期预测。但是,长期预测和短期预测之间没有明显的 区别。通常,短期预测主要集中于每小时、每天、每周的货运量预测,可用于港口管理 以管理人力资源和物质资源。相比之下,长期预测主要集中在年度货运量的预测上,可 用于分析港口的长期目标以及港口基础设施的建设和规划。由于这两种预测的影响因素 不同,并且它们的数据源也不同,因此预测方法也有所不同。
港口货运量的预测方法主要分为两类:一类是考虑港口货运量影响因素的预测模型, 另一种是基于港口本身过去预设时间段内数据的时间序列预测。后者货运量预测方法可 进一步分为基于移动平均的自回归模型和基于机器学习的方法。经过对多元线性回归模 型、季节自回归移动平均模型(seasonal autoregressive integrated movingaverage, SARIMA)、人工神经网络(artificial neural network,ANN)和支持向量机(support vector machine,SVM)模型在货运量时间序列预测中的有效性进行对比研究,发现以SVM和 ANN表现最优,即机器学习的方法优于基于移动平均的方法。然而,目前预测方法中存 在的不足,体现在两个方面:一是机器学习预测中没有充分考虑增强学习算法的预测方 法;二是当前的方法主要还是依据时间序列的预测模型,没有考虑港口货运量空间上的 关联性。基于此,本发明提出了一种基于时空关联的港口货运量在线预测方法及系统。
发明内容
发明目的:考虑港口货运量是空间关联特征,通过线上采集多个港口的过去预设时 间段内的货运量数据,采用增强学习的方法来构建港口货运量预测模型,从而在提高港口货运量预测的准确性的基础上,实现对目标港口的下一阶段货运量的在线预测。
技术方案:为了实现上述目的,本发明采用如下技术方案:一种基于时空关联的港口货运量在线预测方法,该方法包括以下步骤:
步骤1,货运量数据准备,用于港口货运量时空关联分析及货运量预测的多个港口P=[P1,P2,…,Pn],过去预设时间段内的货运量数据
Figure BDA0003055941680000021
其中n为港 口标识总数Pn表示第n个港口,i=1,2,3,...,n,
Figure BDA0003055941680000022
表示第i个港口在k阶段的货运量, k=1,2,3,...,t,t表示获取货运量数据的时间段,目标港口P0的货运量数据用
Figure BDA0003055941680000023
表示,其中
Figure BDA0003055941680000024
表示目标港口在k阶段的货运量,k=1,2,3,...,t,首次选择其他港口可根据其他港口距离目标港口的距离以及其他港口的等级进行选择,之后在完成一次关联分析和预测结果分析之后,可根据关联分析和预测结果分析进行差异选取;
步骤2,根据目标港口和其他港口过去预设时间段内的货运量数据,对目标港口和其他港口的货运量数据进行灰度关联分析,计算出各港口与目标港口的关联度,并设置 关联度阈值δ,选取相关度高于关联度阈值的其他港口P′=[P1′,P2′,…,Pl′],其中l≤n, 表示从n个港口中筛选出的用于预测的l个港口,并结合目标港口自身货运量数据
Figure BDA0003055941680000025
用于构建货运量时空预测模型;
步骤3,划分其他港口P′=[P1′,P2′,…,Pl′]和目标港口P0的数据,得到的训练样本用 于训练模型;
步骤4,以GBDT模型构建货运量时空预测模型,并通过实验确定模型参数;
步骤5,训练模型,将划分好的训练数据输入模型中进行模型训练,完成相关港口与目标港口之间货运量关系的映射;
步骤6,以选取的其他港口P'和目标港口P0过去预设时间段内的货运量数据为输入 数据,输入训练完成的预测模型中,得到目标港口P0下一阶段的货运量预测值。
进一步的:所述步骤2中,灰度关联分析包括以下五个步骤:
步骤2.1,确定反映系统行为的参考序列和影响系统行为的比较序列,港口货运量预 测中,目标港口货运量时间序列数据
Figure BDA0003055941680000026
是参考序列,要分析的其他港口货运量时间序列数据
Figure BDA0003055941680000027
是比较序列;
步骤2.2,对于维度不同的各类系统数据,执行数据无量纲处理,即采用均值化方法 处理所有货运量数据;
步骤2.3,计算相关系数,假设Δi(t)=|y(t)-xi(t)|,其中,t表示时间,i表示港口序 列,则根据公式(1)计算港口Pi和目标港口P0相关系数:
Figure BDA0003055941680000031
式中,ρ是分辨率系数,ρ越小则分辨率越强,ρ被设定为0.5;
步骤2.4,根据计算出的港口相关度,对港口进行相关性排序。
进一步的:所述步骤2.4中,在计算出目标港口P0与其他港口P=[P1,P2,…,Pn]之间的相关度之后,设置相关联度阈值δ以选择关联度高于阈值的港口 P′=[P1′,P2′,…,Pl′]。关联度阈值可通过各个港口与目标港口的关联度分析结果获得, 通过改变δ分析最后预测结果的变换情况来确定,δ=0.85。
进一步的,所述步骤3中,对筛选过后的关联港口P′=[P′1,P′2,…,P′l]和目标港口 P′=[P′1,P′2,…,P′l]的过去预设时间段内货运量数据进行划分,确定模型时间维度
Figure RE-GDA00031411353900000317
并 据此将训练数据划分得到W个样本数据(xj,yj),
Figure RE-GDA0003141135390000032
j=1,2,...,W,其中,T表示
Figure RE-GDA0003141135390000033
中的数据长度,floor表示向下取整函数,(xj,yj)中xj表示 训练样本的输入数据,yj表示训练样本的输出数据,其中,
Figure RE-GDA0003141135390000034
Figure RE-GDA0003141135390000035
表示第j个样本中第z个用于预测的港口P' 时间维度
Figure RE-GDA0003141135390000036
内第
Figure RE-GDA0003141135390000037
阶段的货运量数据,
Figure RE-GDA0003141135390000038
表示第j个样本中第z个用于预测的 港口P'时间维度
Figure RE-GDA0003141135390000039
内第
Figure RE-GDA00031411353900000310
阶段的货运量数据,z=1,2,3...,l,l表示从n个港口中筛选出 的用于预测的l个港口;
Figure RE-GDA00031411353900000311
表示第j个样本中目标港口P0时间维度
Figure RE-GDA00031411353900000312
内第
Figure RE-GDA00031411353900000313
阶段的货运量数据,
Figure RE-GDA00031411353900000314
表示第j个样本中目标港口P0时间维度
Figure RE-GDA00031411353900000315
内第
Figure RE-GDA00031411353900000316
阶段的货运量 数据。
进一步的:所述步骤4中,具体地,假设货运量时空预测预测模型以函数F(x,P)表示,其中x表示模型输入数据,包含了模型输入的时空维度,P表示P′=[P1′,P2′,…,Pl′] 和目标港口P0的集合,用于表征输入到预测模型的港口,则目标港口P0的货运量y'预 测函数可表示为:
Figure BDA0003055941680000041
其中,
Figure BDA0003055941680000042
表示模型预测所确定的时间维度,
Figure BDA0003055941680000043
表示第z个用于预测的港口P'过去
Figure BDA0003055941680000044
时间内第
Figure BDA0003055941680000045
个阶段的货运量,
Figure BDA0003055941680000046
表示第z个用于预测的港口P'过去
Figure BDA0003055941680000047
时间内第t个阶 段的货运量,
Figure BDA0003055941680000048
表示目标港口P0过去
Figure BDA0003055941680000049
时间第
Figure BDA00030559416800000410
个阶段的货运量,
Figure BDA00030559416800000411
表示目标港口 P0过去
Figure BDA00030559416800000412
时间第t个阶段的货运量。
进一步的:所述步骤5中,选择相关度不小于关联度阈值的关联港口过去预设时间段内的货运量训练样本
Figure RE-GDA00031411353900000413
为输入,目标港口货运量训 练样本
Figure RE-GDA00031411353900000414
为预期输出进行GBDT预测模型训练,首先以公式(3)初 始化弱学习器:
Figure BDA00030559416800000415
其中,L表示损失函数,yj即为训练数据中目标港口货运量的值,γ表示拟合值,可通过对所有yj取均值的方式计算,作为初始学习器;
接着对m=1,2,...,M个分类器,对每个样本{xj,yj}W,j=1,2,...,W,以公式(4)计算负梯度,即残差rjm
Figure BDA0003055941680000051
将上步得到的残差rjm作为样本新的真实值,并将数据(xj,rjm),j=1,2,...,W作为下个 回归树的训练数据,得到一棵新的回归树fm(x),其对应的叶子结点区域Rkm,k=1,2,...,K, 其中,K为回归树的叶子节点的个数,对叶子区域k=1,2,...,K以公式(5)计算最佳拟 合值γkm
Figure BDA0003055941680000052
之后以公式(6)更新强学习器,式子中I表示单位矩阵:
Figure BDA0003055941680000053
最后得到最终学习器如公式(7)所示:
Figure BDA0003055941680000054
f(x)的值即为目标港口的货运量预测结果。
进一步的:所述步骤6中,具体地,以
Figure BDA0003055941680000055
表示用于预测的港口货运量数据集合,输入到货运量预测模型中,输出y′表示目标港口下一阶段的货运量预测结果。
本发明还提出一种基于时空关联的港口短期货运量在线预测系统,该系统包括数据 采集模块、数据分析与预测模块、货运量预测结果图形可视化模块:
数据采集模块:采集用于港口货运量时空关联分析及货运量预测的多个港口 P=[P1,P2,…,Pn]过去预设时间段内的货运量数据
Figure BDA0003055941680000056
其中,n为港 口标识,即Pn表示第n个港口,i=1,2,3,...,n,
Figure BDA0003055941680000057
表示第i个港口在k阶段的货运量, k=1,2,3,...,t,目标港口P0的货运量数据用
Figure BDA0003055941680000058
表示,其中,
Figure BDA0003055941680000059
表示目 标港口在k阶段的货运量,k=1,2,3,...,t;
数据分析与预测模块:对获得的各个港口原始货运量数据进行均值化处理,对处理 后的各个港口货运量数据与目标港口货运量数据进行灰度关联分析,确定其他港口货运 量与目标港口货运量之间的关联度,之后根据关联度阈值δ选择相关度高于关联度阈值的其他港口P′=[P1′,P2′,…,Pl′],并用P′中港口和目标港口的过去预设时间段内的货运量数据构建GBDT货运量时空预测模型,并根据港口对应的货运量数据对预测模型进行 训练,最后根据预测模型的时空维度、P′中港口和目标港口对目标港口下一阶段货运量 进行预测;
货运量预测结果图形可视化模块:通过图形结合数据展示货运量预测结果,同时展 示目标港口和其他港口关联度分析结果,并将与目标港口货运量的关联度较高的其他港 口反馈至数据采集模块,用于确定优先获取的港口货运量数据。
有益效果:相较于现有技术,本发明具有以下有益效果:
本发明提出的一种基于时空关联的港口货运量在线预测方法,利用目标港口和关联 港口的时空相关性构建时空关联预测模型对目标港口货运量进行预测,克服了现有方法 中对未能充分利用空间相关性的不足,有助于提高港口货运量预测的准确性。
附图说明
图1为本发明基于时空关联的港口短期货运量在线预测系统组成模块;
图2为本发明基于时空关联的港口短期货运量在线预测流程;
图3为本发明港口短期货运量预测模型示意;
图4为本发明GBDT预测模型训练过程;
图5为本发明实例中港口位置分布示意;
图6为本发明实例中重庆港和武汉港连续周货运量曲线;
图7为本发明实例中武汉港与其他港口的相关度曲线;
图8为本发明实例中GBDT模型参数的实验结果;
图9为本发明实例中四种模型预测结果的比较。
具体实施方式
下面结合附图将对本发明中的技术方案进行清楚、完整地描述。基于本发明中的实 施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于时空关联的港口货运量在线预测系统,包括数据采集模块、数据分析与预测模块、货运量预测结果图形可视化模块;具体地:
数据采集模块:采集用于港口货运量时空关联分析及货运量预测的多个港口 P=[P1,P2,…,Pn]过去预设时间段内的货运量数据
Figure BDA0003055941680000071
其中,n为港 口标识,即Pn表示第n个港口,i=1,2,3,...,n,
Figure BDA0003055941680000072
表示第i个港口在k阶段的货运量, k=1,2,3,...,t,目标港口P0的货运量数据用
Figure BDA0003055941680000073
表示,其中,
Figure BDA0003055941680000074
表示目 标港口在k阶段的货运量,k=1,2,3,...,t;
数据分析与预测模块:对获得的各个港口原始货运量数据进行均值化处理,对处理 后的各个港口货运量数据与目标港口货运量数据进行灰度关联分析,确定其他港口货运 量与目标港口货运量之间的关联度,之后根据关联度阈值δ选择相关度高于关联度阈值的其他港口P′=[P1′,P2′,…,Pl′],并用P′中港口和目标港口的过去预设时间段内的货运量数据构建GBDT货运量时空预测模型,并根据港口对应的货运量数据对预测模型进行 训练,最后根据预测模型的时空维度、P′中港口和目标港口对目标港口下一阶段货运量 进行预测;
货运量预测结果图形可视化模块:通过图形结合数据展示货运量预测结果,同时展 示目标港口和其他港口关联度分析结果,并将与目标港口货运量的关联度较高的其他港 口反馈至数据采集模块,用于确定优先获取的港口货运量数据。
根据图2所示的基于时空关联的港口短期货运量在线预测流程,通过数据采集获取 目标港口和相关港口的空间位置数据和过去预设时间段内的货运量数据,对数据均值处 理后进行时空关联分析,选择不小于关联度阈值的关联港口和目标港口构建GBDT预测模型,并选取货运量数据进行GBDT模型训练,最终利用训练后的GBDT模型对目标 港口进行货运量预测,并能够反馈预测和分析结果以优化原始数据的获取。由于本发明 重点在于基于时空关联的港口短期货运量在线预测方法,因此对该方法流程进行详述。
步骤1,货运量数据准备,用于港口货运量时空关联分析及货运量预测的多个港口P=[P1,P2,…,Pn],过去预设时间段内的货运量数据
Figure BDA0003055941680000075
其中n为港 口标识总数Pn表示第n个港口,i=1,2,3,...,n,
Figure BDA0003055941680000076
表示第i个港口在k阶段的货运量, k=1,2,3,...,t,t表示获取货运量数据的时间段,目标港口P0的货运量数据用
Figure BDA0003055941680000077
表示,其中
Figure BDA0003055941680000078
表示目标港口在k阶段的货运量,k=1,2,3,...,t,初次选择其他港口可根据其他港口距离目标港口的距离以及其他港口的等级进行选择,之后在完成一次关联分析和预测结果分析之后,可根据关联分析和预测结果分析进行差异选取;
步骤2:根据目标港口和其他港口过去预设时间段内的货运量数据,对目标港口和其他港口的货运量数据进行灰度关联分析,计算出各港口与目标港口的关联度,并设置 关联度阈值δ,选取相关度高于关联度阈值的其他港口P′=[P1′,P2′,…,Pl′],其中l≤n, 并结合目标港口自身货运量数据
Figure BDA0003055941680000081
用于构建货运量时空预测模型;
进行灰度关联分析是根据一定的规则建立随时间变化的主序列,将每个评估对象随 时间的变化作为子序列,从而得出各子序列与主序列之间的相关度。
首先确定反映系统行为的参考序列和影响系统行为的比较序列,港口货运量预测中, 目标港口货运量时间序列数据
Figure BDA0003055941680000082
是参考序列,要分析的其他港口货运 量时间序列数据
Figure BDA0003055941680000083
是比较序列;
进一步地,对于维度不同的各类系统数据,执行数据无量纲处理,即采用均值化方法处理所有货运量数据;
进一步地,计算相关系数,假设Δi(t)=|y(t)-xi(t)|,其中t表示时间,i表示港口序 列,则根据公式(1)计算港口Pi和目标港口P0相关系数:
Figure BDA0003055941680000084
式中,ρ是分辨率系数,ρ越小则分辨率越强,通常ρ被设定为0.5。
进一步地,根据计算出的港口相关度,对港口进行相关性排序。在计算出目标港口P0与其他港口P=[P1,P2,…,Pn]之间的相关度之后,设置相关联度阈值δ以选择关联度 高于阈值的港口P′=[P1′,P2′,…,Pl′]。关联度阈值可通过各个港口与目标港口的关联度 分析结果获得,通过改变δ分析最后预测结果的变换情况来确定,本方法中根据实验推 荐设定δ=0.85。
步骤3:对筛选过后的关联港口P′=[P′1,P′2,…,P′l]和目标港口P′=[P′1,P′2,…,P′l] 的过去预设时间段内货运量数据进行划分,确定模型预测的时间维度
Figure RE-GDA0003141135390000085
并据此将训练 数据划分得到W
Figure RE-GDA0003141135390000091
个样本数据(xj,yj),j=1,2,...,W,其中T表示
Figure RE-GDA0003141135390000092
中数据长度,floor表示向下取整函数,(xj,yj)中xj表示训练样本 的输入数据,yj表示训练样本的输出数据,其中,
Figure RE-GDA0003141135390000093
Figure RE-GDA0003141135390000094
表示第j个样本中第z个用于预测的港口P'时间维度
Figure RE-GDA0003141135390000095
内第
Figure RE-GDA0003141135390000096
阶段的货 运量数据,
Figure RE-GDA0003141135390000097
表示第j个样本中第z个用于预测的港口P'时间维度
Figure RE-GDA0003141135390000098
内第
Figure RE-GDA0003141135390000099
阶段的货 运量数据,z=1,2,3...,l,l表示从n个港口中筛选出的用于预测的l个港口;
Figure RE-GDA00031411353900000910
表 示第j个样本中目标港口P0时间维度
Figure RE-GDA00031411353900000911
内第
Figure RE-GDA00031411353900000912
阶段的货运量数据,
Figure RE-GDA00031411353900000913
表示第j 个样本中目标港口P0时间维度
Figure RE-GDA00031411353900000914
内第
Figure RE-GDA00031411353900000915
阶段的货运量数据。
步骤4:以GBDT模型构建货运量时空预测模型,预测模型示意图如图3所示,并 通过实验确定模型参数;具体地,设货运量时空预测预测模型以函数F(x,P)表示,其中 x表示输入数据,包含了模型输入的时空维度,P表示由P′=[P1′,P2′,…,Pl′]和目标港口 P0的集合,用于表征输入到预测模型的港口,则目标港口P0的货运量y'预测函数可表 示为:
Figure BDA00030559416800000916
其中
Figure BDA00030559416800000917
表示模型预测所确定的时间维度,
Figure BDA00030559416800000918
表示第z个用于预测的港口P'过去
Figure BDA00030559416800000919
时间内第
Figure BDA00030559416800000920
个阶段的货运量,
Figure BDA00030559416800000921
表示第z个用于预测的港口P'过去
Figure BDA00030559416800000922
时间内第t个阶 段的货运量,
Figure BDA00030559416800000923
表示目标港口P0过去
Figure BDA00030559416800000924
时间第
Figure BDA00030559416800000925
个阶段的货运量,
Figure BDA00030559416800000926
表示目标港口 P0过去
Figure BDA00030559416800000927
时间第t个阶段的货运量。
步骤5:训练模型,将划分好的训练数据输入模型中进行模型训练,完成相关港口与目标港口之间货运量关系的映射。具体地,选择相关度不小于关联度阈值的关联港口 过去预设时间段内的货运量训练样本
Figure RE-GDA0003141135390000101
为输入,目标 港口货运量训练样本
Figure RE-GDA0003141135390000102
为预期输出进行GBDT预测模型训练,首先 以公式(3)初始化弱学习器:
Figure BDA0003055941680000103
其中,L表示损失函数,yj即为训练数据中目标港口货运量的值,γ表示拟合值,可通过对所有yj取均值的方式计算,作为初始学习器。
接着对m=1,2,...,M个分类器,对每个样本{xj,yj}W,j=1,2,...,W,以公式(4)计算负梯度,即残差rjm
Figure BDA0003055941680000104
将上步得到的残差rjm作为样本新的真实值,并将数据(xj,rjm),j=1,2,...,W作为下个 回归树的训练数据,得到一棵新的回归树fm(x),其对应的叶子结点区域Rkm,k=1,2,...,K, 其中K为回归树的叶子节点的个数,对叶子区域k=1,2,...,K以公式(5)计算最佳拟合 值γkm
Figure BDA0003055941680000105
之后以公式(6)更新强学习器,式子中I表示单位矩阵:
Figure BDA0003055941680000106
最后得到最终学习器如公式(7)所示:
Figure BDA0003055941680000107
f(x)的值即为目标港口的货运量预测结果。
步骤6:以
Figure BDA0003055941680000111
表示用于预测的港口货运量数据集合,输入到得到的预测模型中,输出y′表示目标港口下一阶段的货运量预测结果。
为了让本领域技术人员进一步了解本发明所提出的一种基于时空关联的港口短期 货运量在线预测方法,下面结合具体实施例作详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程。
步骤1:基础数据准备。
获取原始数据。以武汉港为研究对象,根据武汉港上下游几个港口2012年1月至2014年11月的货运量数据,预测2014年12月至2015年1月的周货运量数据。港口位 置如图5所示。长江上游至下游分别为重庆港、宜昌港、沙石港、城陵矶港、武汉港、 黄石港、福池港、武穴港、九江港、湖口港、通龙港、芜湖港。原始数据包含2012年1 月至2015年1月的157组数据,每组包括本周各港口进港上传货物和装货离港数据, 将两种数据相加,得到各港口的周货运量数据。重庆港2014年1月20日至27日数据 见表1。
表1原始数据示例
Figure BDA0003055941680000112
步骤2:灰度关联分析。
1)数据特征分析。选择重庆港和武汉港连续周货运量数据,见图6。可见,两个港口之间货运量的变化具有较强的相似性。例如,武汉港货运量2014年1月至3月变化 时,重庆港货运量同时发生变化,变化趋势相同。因此,可以推断出两个港口之间可能 存在货运空间关联。
2)港口货运量相关性计算。选取武汉港货运量数据作为参考数据,其他港口货运量数据作为对比数据进行灰度相关计算,相关度结果如图7所示。结果表明,武汉港与 其他11个相关港口的相关系数均超过0.7,图7中大部分相关系数均在0.85以上,进一 步证明了港口货运量之间存在关联性。重庆港、铜陵港、湖口港和黄石港的相关度均大 于0.9,而相关度小于0.85的港口分别为武穴港、福池港和沙市港。结合图5中的港口 分布,可以推断出货运量与港口距离的关联度没有明显的关系。考虑到港口自身连续周 货运量的关系,根据以上相关结果,得到相关度为0.85以上的港口数据,包括城陵矶港、 重庆港、宜昌港、九江港、铜陵港、湖口港、黄石港、芜湖港,初步选取这些港口及武 汉港自身数据进行武汉港货运量预测模型构建。
步骤3:模型构建与训练。
GBDT模型的参数包括基本分类器的最大迭代次数、学习率和决策树的最大深度。通过实验确定了参数,将两个参数设置为固定,并更改另一个参数。将预测结果进行比 较,得到预测值。图8显示了实验结果。在此基础上,决策树的最大迭代次数为60,学 习率为0.3,最大深度为5。
进一步地,为评价GBDT模型预测精度,此处构建ARIMA模型、多元线性回归模 型和BP神经网络模型用于对比分析。首先设置模型评价指标,选择平均绝对百分比误 差(MAPE)、RMSE(根均方误差)和确定系数来评价不同模型的预测结果。评价参数 定义为公式(8),
Figure BDA0003055941680000121
xi,
Figure BDA0003055941680000122
分别为实测值的平均值、第i个实测值和第i个预测值。
Figure BDA0003055941680000123
接着分别构建ARIMA模型、多元线性回归模型和BP神经网络模型。
①ARIMA模型。ARIMA模型中的参数p,q是自回归项和移动平均项,需要确定。 基于BIC(Bayesian Information Criterion,贝叶斯信息准则)和实验得到p和q的值。 最后通过分析得出p和q值均为1。
②多元线性回归模型。在对武汉港货运量的预测中,有8个相关港口和武汉港本身。 因此,需要计算它们各自的参数和截距。通过对训练数据进行拟合,得到回归结果如公式(9)所示,其中y表示目标港口即武汉港的预测值,x1,x2,...,x8表示与武汉港相关的 其他8个港口的上一阶段货运量的实际值:
Figure BDA0003055941680000124
③BP神经网络模型。将8个相关性较强的港口与武汉港上周的货运量作为BP神经网络的输入,武汉港本周的货运量作为BP神经网络的输出。中间的隐藏节点数在
Figure BDA0003055941680000131
处确定,s和l分别是输入层和输出层的节点数。最后,将隐藏层模式的 数目设置为18。选择函数relu作为输入层到隐藏层的激活函数,选择函数sigmoid作为 隐藏层到输出层的激活函数。
步骤4:货运量预测。
训练集包括2012年1月至2014年12月的153组数据,测试数据包括2014年12 月至2015年1月的4组数据。采用这四种模型对武汉港货运量数据进行了预测,预测 结果见图9,预测结果评价指标见表2。可以看出,时间序列模型和多元线性回归的预 测精度较低,而BP神经网络和GBDT的预测效果较好,这表明这些港口之间的货运量 没有线性关系。在基于时空相关的货运量预测中,GBDT优于BP神经网络。
表2四个模型预测结果评价指标
Figure BDA0003055941680000132

Claims (8)

1.一种基于时空关联的港口货运量在线预测方法,其特征在于:该方法包括以下步骤:
步骤1,货运量数据准备,用于港口货运量时空关联分析及货运量预测的多个港口P=[P1,P2,…,Pn],过去预设时间段内的货运量数据
Figure RE-FDA0003141135380000011
其中n为港口标识总数Pn表示第n个港口,i=1,2,3,...,n,
Figure RE-FDA0003141135380000012
表示第i个港口在k阶段的货运量,k=1,2,3,...,t,t表示获取货运量数据的时间段,目标港口P0的货运量数据用
Figure RE-FDA0003141135380000013
表示,其中
Figure RE-FDA0003141135380000014
表示目标港口在k阶段的货运量,k=1,2,3,...,t,首次选择其他港口可根据其他港口距离目标港口的距离以及其他港口的等级进行选择,之后在完成一次关联分析和预测结果分析之后,可根据关联分析和预测结果分析进行差异选取;
步骤2,根据目标港口和其他港口过去预设时间段内的货运量数据,对目标港口和其他港口的货运量数据进行灰度关联分析,计算出各港口与目标港口的关联度,并设置关联度阈值δ,选取相关度高于关联度阈值的其他港口P′=[P1′,P2′,…,Pl′],其中l≤n,表示从n个港口中筛选出的用于预测的l个港口,并结合目标港口自身货运量数据
Figure RE-FDA0003141135380000015
用于构建货运量时空预测模型;
步骤3,划分其他港口P′=[P1′,P2′,…,Pl′]和目标港口P0的数据,得到的训练样本用于训练模型;
步骤4,以GBDT模型构建货运量时空预测模型,并通过实验确定模型参数;
步骤5,训练模型,将划分好的训练数据输入模型中进行模型训练,完成相关港口与目标港口之间货运量关系的映射;
步骤6,以选取的其他港口P'和目标港口P0过去预设时间段内的货运量数据为输入数据,输入训练完成的预测模型中,得到目标港口P0下一阶段的货运量预测值。
2.根据权利要求1所述的基于时空关联的港口短期货运量在线预测方法,其特征在于:所述步骤2中,灰度关联分析包括以下五个步骤:
步骤2.1,确定反映系统行为的参考序列和影响系统行为的比较序列,港口货运量预测中,目标港口货运量时间序列数据
Figure RE-FDA0003141135380000016
是参考序列,要分析的其他港口货运量时间序列数据
Figure RE-FDA0003141135380000017
是比较序列;
步骤2.2,对于维度不同的各类系统数据,执行数据无量纲处理,即采用均值化方法处理所有货运量数据;
步骤2.3,计算相关系数,假设Δi(t)=|y(t)-xi(t)|,其中,t表示时间,i表示港口序列,则根据公式(1)计算港口Pi和目标港口P0相关系数:
Figure RE-FDA0003141135380000021
式中,ρ是分辨率系数,ρ越小则分辨率越强,ρ被设定为0.5;
步骤2.4,根据计算出的港口相关度,对港口进行相关性排序。
3.根据权利要求2所述的一种基于时空关联的港口短期货运量在线预测方法,其特征在于:所述步骤2.4中,在计算出目标港口P0与其他港口P=[P1,P2,…,Pn]之间的相关度之后,设置相关联度阈值δ以选择关联度高于阈值的港口P′=[P1′,P2′,…,Pl′];关联度阈值可通过各个港口与目标港口的关联度分析结果获得,通过改变δ分析最后预测结果的变换情况来确定,δ=0.85。
4.根据权利要求3所述的一种基于时空关联的港口短期货运量在线预测方法,其特征在于,所述步骤3中,对筛选过后的关联港口P′=[P1′,P2′,…,Pl′]和目标港口P′=[P1′,P2′,…,Pl′]的过去预设时间段内货运量数据进行划分,确定模型时间维度
Figure RE-FDA0003141135380000026
并据此将训练数据划分得到W个样本数据(xj,yj),
Figure RE-FDA0003141135380000027
j=1,2,...,W,其中,T表示
Figure RE-FDA0003141135380000022
中的数据长度,floor表示向下取整函数,(xj,yj)中xj表示训练样本的输入数据,yj表示训练样本的输出数据,其中,
Figure RE-FDA0003141135380000023
Figure RE-FDA0003141135380000024
表示第j个样本中第z个用于预测的港口P'时间维度
Figure RE-FDA0003141135380000028
内第
Figure RE-FDA0003141135380000029
阶段的货运量数据,
Figure RE-FDA0003141135380000025
表示第j个样本中第z个用于预测的港口P'时间维度
Figure RE-FDA00031411353800000210
内第
Figure RE-FDA00031411353800000211
阶段的货运量数据,z=1,2,3...,l,l表示从n个港口中筛选出的用于预测的l个港口;
Figure RE-FDA0003141135380000031
表示第j个样本中目标港口P0时间维度
Figure RE-FDA00031411353800000311
内第
Figure RE-FDA00031411353800000312
阶段的货运量数据,
Figure RE-FDA0003141135380000032
表示第j个样本中目标港口P0时间维度
Figure RE-FDA00031411353800000313
内第
Figure RE-FDA00031411353800000314
阶段的货运量数据。
5.根据权利要求1所述的一种基于时空关联的港口短期货运量在线预测方法,其特征在于:所述步骤4中,具体地,假设货运量时空预测预测模型以函数F(x,P)表示,其中x表示模型输入数据,包含了模型输入的时空维度,P表示P′=[P1′,P2′,…,Pl′]和目标港口P0的集合,用于表征输入到预测模型的港口,则目标港口P0的货运量y'预测函数可表示为:
Figure RE-FDA0003141135380000033
其中,
Figure RE-FDA00031411353800000315
表示模型预测所确定的时间维度,
Figure RE-FDA0003141135380000034
表示第z个用于预测的港口P'过去
Figure RE-FDA00031411353800000316
时间内第
Figure RE-FDA00031411353800000317
个阶段的货运量,
Figure RE-FDA0003141135380000035
表示第z个用于预测的港口P'过去
Figure RE-FDA00031411353800000318
时间内第t个阶段的货运量,
Figure RE-FDA0003141135380000036
表示目标港口P0过去
Figure RE-FDA00031411353800000319
时间第
Figure RE-FDA00031411353800000320
个阶段的货运量,
Figure RE-FDA0003141135380000037
表示目标港口P0过去
Figure RE-FDA00031411353800000321
时间第t个阶段的货运量。
6.根据权利要求5所述的一种基于时空关联的港口短期货运量在线预测方法,其特征在于:所述步骤5中,选择相关度不小于关联度阈值的关联港口过去预设时间段内的货运量训练样本
Figure RE-FDA0003141135380000038
为输入,目标港口货运量训练样本
Figure RE-FDA0003141135380000039
为预期输出进行GBDT预测模型训练,首先以公式(3)初始化弱学习器:
Figure RE-FDA00031411353800000310
其中,L表示损失函数,yj即为训练数据中目标港口货运量的值,γ表示拟合值,可通过对所有yj取均值的方式计算,作为初始学习器;
接着对m=1,2,...,M个分类器,对每个样本{xj,yj}W,j=1,2,...,W,以公式(4)计算负梯度,即残差rjm
Figure RE-FDA0003141135380000041
将上步得到的残差rjm作为样本新的真实值,并将数据(xj,rjm),j=1,2,...,W作为下个回归树的训练数据,得到一棵新的回归树fm(x),其对应的叶子结点区域Rkm,k=1,2,...,K,其中,K为回归树的叶子节点的个数,对叶子区域k=1,2,...,K以公式(5)计算最佳拟合值γkm
Figure RE-FDA0003141135380000042
之后以公式(6)更新强学习器,式子中I表示单位矩阵:
Figure RE-FDA0003141135380000043
最后得到最终学习器如公式(7)所示:
Figure RE-FDA0003141135380000044
f(x)的值即为目标港口的货运量预测结果。
7.根据权利要求6所述的基于时空关联的港口短期货运量在线预测方法,其特征在于:所述步骤6中,具体地,以
Figure RE-FDA0003141135380000045
表示用于预测的港口货运量数据集合,输入到货运量预测模型中,输出y′表示目标港口下一阶段的货运量预测结果。
8.一种基于时空关联的港口短期货运量在线预测系统,其特征在于,该系统包括数据采集模块、数据分析与预测模块、货运量预测结果图形可视化模块:
数据采集模块:采集用于港口货运量时空关联分析及货运量预测的多个港口P=[P1,P2,…,Pn]过去预设时间段内的货运量数据
Figure RE-FDA0003141135380000046
其中,n为港口标识,即Pn表示第n个港口,i=1,2,3,...,n,
Figure RE-FDA0003141135380000051
表示第i个港口在k阶段的货运量,k=1,2,3,...,t,目标港口P0的货运量数据用
Figure RE-FDA0003141135380000052
表示,其中,
Figure RE-FDA0003141135380000053
表示目标港口在k阶段的货运量,k=1,2,3,...,t;
数据分析与预测模块:对获得的各个港口原始货运量数据进行均值化处理,对处理后的各个港口货运量数据与目标港口货运量数据进行灰度关联分析,确定其他港口货运量与目标港口货运量之间的关联度,之后根据关联度阈值δ选择相关度高于关联度阈值的其他港口P′=[P1′,P2′,…,Pl′],并用P′中港口和目标港口的过去预设时间段内的货运量数据构建GBDT货运量时空预测模型,并根据港口对应的货运量数据对预测模型进行训练,最后根据预测模型的时空维度、P′中港口和目标港口对目标港口下一阶段货运量进行预测;
货运量预测结果图形可视化模块:通过图形结合数据展示货运量预测结果,同时展示目标港口和其他港口关联度分析结果,并将与目标港口货运量的关联度较高的其他港口反馈至数据采集模块,用于确定优先获取的港口货运量数据。
CN202110500422.5A 2021-05-08 2021-05-08 一种基于时空关联的港口货运量在线预测方法及系统 Active CN113326976B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110500422.5A CN113326976B (zh) 2021-05-08 2021-05-08 一种基于时空关联的港口货运量在线预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110500422.5A CN113326976B (zh) 2021-05-08 2021-05-08 一种基于时空关联的港口货运量在线预测方法及系统

Publications (2)

Publication Number Publication Date
CN113326976A CN113326976A (zh) 2021-08-31
CN113326976B true CN113326976B (zh) 2022-11-15

Family

ID=77414292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110500422.5A Active CN113326976B (zh) 2021-05-08 2021-05-08 一种基于时空关联的港口货运量在线预测方法及系统

Country Status (1)

Country Link
CN (1) CN113326976B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116502963B (zh) * 2023-06-29 2023-09-15 苏州鸿安机械股份有限公司 一种基于人工智能的晶圆运输控制方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978270A (zh) * 2019-03-29 2019-07-05 大连海事大学 一种集装箱船航次装箱量预测方法
CN111563706A (zh) * 2020-03-05 2020-08-21 河海大学 一种基于lstm网络的多变量物流货运量预测方法
CN111915100A (zh) * 2020-08-17 2020-11-10 北京交通大学 一种高精度的货运预测方法和货运预测系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978270A (zh) * 2019-03-29 2019-07-05 大连海事大学 一种集装箱船航次装箱量预测方法
CN111563706A (zh) * 2020-03-05 2020-08-21 河海大学 一种基于lstm网络的多变量物流货运量预测方法
CN111915100A (zh) * 2020-08-17 2020-11-10 北京交通大学 一种高精度的货运预测方法和货运预测系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于时空因素的水路短期货运量预测;陈琛等;《上海交通大学学报》;20190528(第05期);全文 *
基于灰色模型的云浮港水运货运量预测;陈丽宁等;《广州航海学院学报》;20191230(第04期);全文 *

Also Published As

Publication number Publication date
CN113326976A (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
Wang et al. Optimal forecast combination based on neural networks for time series forecasting
Li et al. Prediction for tourism flow based on LSTM neural network
JP2022500769A (ja) 電力システム熱負荷の予測方法及び予測装置
Wang Predicting tourism demand using fuzzy time series and hybrid grey theory
CN109919356B (zh) 一种基于bp神经网络区间需水预测方法
CN106022549A (zh) 基于神经网络和思维演化搜索的短期负荷预测方法
CN108090788A (zh) 基于时间信息集成模型的广告转化率预估方法
CN115115389A (zh) 一种基于价值细分和集成预测的快递客户流失预测方法
CN111582538A (zh) 一种基于图神经网络的社群价值预测方法及系统
CN113326976B (zh) 一种基于时空关联的港口货运量在线预测方法及系统
CN115470862A (zh) 动态自适应负荷预测模型组合方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN116340726A (zh) 一种能源经济大数据清洗方法、系统、设备及存储介质
CN117196695B (zh) 一种目标产品的销量数据的预测方法及装置
Wu et al. A forecasting model based support vector machine and particle swarm optimization
JPH06337852A (ja) ニューラルネットワークによる時系列予測方法
Moon et al. Intelligent approach for effective management of governmental funds for small and medium enterprises
CN115936184A (zh) 一种适应多用户类型的负荷预测匹配方法
Gaffar Prediction of Regional Economic Growth in East Kalimantan using Genetic Algorithm
CN114579643A (zh) 快递业务量预测方法、装置及电子设备
Gunjal et al. Fusing clustering and machine learning techniques for Big-Mart sales predication
CN115115119A (zh) 一种基于灰色关联的oa-gru的短期电力负荷预测方法
CN115204482A (zh) 一种基于多变量lstm的铁路货运运价浮动预测方法
CN114819395A (zh) 一种基于长短期记忆神经网络和支持向量回归组合模型的行业中长期负荷预测方法
Cakar et al. Neurotic Fuzzy-Data-Envelopment Analysis to Forecast Efficiency of Bank Branches

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant