CN115204482A - 一种基于多变量lstm的铁路货运运价浮动预测方法 - Google Patents

一种基于多变量lstm的铁路货运运价浮动预测方法 Download PDF

Info

Publication number
CN115204482A
CN115204482A CN202210783351.9A CN202210783351A CN115204482A CN 115204482 A CN115204482 A CN 115204482A CN 202210783351 A CN202210783351 A CN 202210783351A CN 115204482 A CN115204482 A CN 115204482A
Authority
CN
China
Prior art keywords
rate
freight
model
floating
lstm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210783351.9A
Other languages
English (en)
Inventor
何娟
谢文颖
黄霖锦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN202210783351.9A priority Critical patent/CN115204482A/zh
Publication of CN115204482A publication Critical patent/CN115204482A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多变量LSTM的铁路货运运价浮动预测方法,包括如下步骤:步骤一、计算运价浮动率;步骤二、构建数据仓库多维特征数据集,确定特征变量;步骤三、对特征变量和运价浮动率进行预处理后进行训练集和测试集的划分;步骤四、构建基于多变量LSTM的铁路运价浮动预测模型,设置模型初始参数值,使用训练集对模型进行超参数优化,得到最优模型;将测试集应用于训练好的最优模型,将预测值进行反归一化处理,使其与真实值处于同一量级,输出预测结果并计算模型评估指标。与现有技术相比,本发明的积极效果是:能有效的提高某类运输货物铁路货运运价浮动周预测的精度。

Description

一种基于多变量LSTM的铁路货运运价浮动预测方法
技术领域
本发明涉及一种基于多变量LSTM的铁路货运运价浮动预测方法。
背景技术
运价关系着交通运输企业供需双方的运营效率、业务营收,以及更大范围经济社会运营效率和成本收益,是交通运输系统这个复杂生态系统运行的关键。设定一个合理的运价机制对提高运输企业营收和经济社会的运营效率至关重要,为了提高铁路货运市场占有率与经营效益,自2013年铁路实行基于公铁合理比价的运价浮动机制。然而目前有关铁路运价计算方法和相关研究中,将决定铁路运费的基价1和基价2分别进行计算和研究,难以反映整体现象。
另一方面,运价也是货主选择货物运输方式时考虑的重要因素之一,铁路的浮动运价机制阻碍货主提前计算成本预定运输方式。因此,探寻铁路运价浮动的影响因素并预测未来运价的浮动趋势是亟待解决的问题。目前国内研究运价影响因素的方法主要是从铁路运营成本和宏观经济方面着手,而国外研究主要关注铁路运价市场化运作,主要考虑市场竞争与市场需求。总的来说,目前铁路货运运价研究方法主要从运输成本、宏观环境以及市场竞争3个方面考虑,均未关注铁路货运运输货物自身市场价值与运输需求、运价之间的连锁反应。考虑到铁路运输货物多为大宗商品,大宗商品价格指数波动可反映该类商品实时动态的市场价值,可观察到其与运输需求、运价之间的关系。
目前货运运价研究方法尚未关注对短期运价率浮动特征的刻画和预测,因此本发明重点围绕铁路货运运价浮动机制平衡管制和市场的特质,统一计算包含基价1和基价2的运价浮动率,在考虑运输成本、宏观环境、市场竞争和运输货物因素对运价影响的基础上,构建数据仓库多维特征数据集,构建LSTM多维特征模型预测运输货物的周运价浮动率。利用历史数据计算综合整合基价1和基价2的运价浮动率,考虑铁路货运运输货物自身市场价值与运输需求、运价之间的连锁反应的外部市场数据,构建LSTM多维特征模型动态、精准地预测铁路运价波动趋势,为铁路、货主提供前置、科学的决策支持,是本发明的主要目标。
发明内容
为了克服现有技术的上述缺点,本发明提出了一种基于多变量LSTM的铁路货运运价浮动预测方法,在提出铁路货运运价浮动率计算模型的基础上,通过构建和训练多变量LSTM模型,精确捕捉多维影响因素数据和运价率浮动数据本体和之间的非线性特征。该方法所采用的模型得益于多维特征数据集的输入,构建内部非线性激活函数,使其既挖掘数据本体的时序特征,又能刻画多维特征数据集与预测对象数据的非线性关系,从而实现预测精度的提升。
本发明解决其技术问题所采用的技术方案是:一种基于多变量LSTM的铁路货运运价浮动预测方法,包括如下步骤:
步骤一、计算运价浮动率;
步骤二、构建数据仓库多维特征数据集,确定特征变量;
步骤三、对特征变量和运价浮动率进行预处理后进行训练集和测试集的划分;
步骤四、构建基于多变量LSTM的铁路货运运价浮动预测模型,设置模型初始参数值,使用训练集对模型进行超参数优化,得到最优模型;将测试集应用于训练好的最优模型,将预测值进行反归一化处理,使其与真实值处于同一量级,输出预测结果并评估模型质量。
与现有技术相比,本发明的积极效果是:
本发明提出的基于多变量LSTM的铁路货运运价浮动预测方法,统一计算包含基价1和基价2的运价率,提出了观察铁路货运整体运价率波动趋势的计算方法;在考虑运输成本、宏观环境、市场竞争和运输货物多维影响因素对运价率影响的基础上,采用LSTM多维特征模型实现了灵活、高精度的铁路货运运价浮动率预测。
从铁路公司的角度来说,本发明明确了影响铁路运价率浮动的具体因素,提出了预测铁路货运运价浮动率的方法。通过提出运价浮动率的计算方法,直观展现运价率波动情况,辅助管理者快速观察和接收运价浮动信息和关键影响因素信息,及时捕捉运输市场的变化,适时制定科学合理的运价调整方案、运输策略,进一步辅助货运营销的前置方案,从而增强铁路货运市场竞争力,提升铁路货运运营收益。
从货主及货代企业的角度来说,在使用铁路运输服务过程中,铁路的实际承运价格与铁路官方报价具有一定的浮动区间,了解未来铁路运价的变化趋势,有助于货主选择合适的时间、合适的运输方式进行货物运输,降低运输成本,提升整体交通运输网络、社会经济系统的运行效率。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1为基于多变量LSTM的铁路货运运价浮动预测方法的技术流程图;
图2为铁路货运运价影响因素数据仓库结构图;
图3为LSTM模型细胞结构图;
图4为多变量LSTM多特征输入预测框架图;
图5为多变量LSTM预测模型训练流程;
图6为多变量LSTM预测模型损失函数图;
图7为多变量LSTM预测模型的运价浮动预测仿真结果图。
具体实施方式
本发明首先给出铁路货运运价浮动率计算公式,计算某运输货物的铁路货运运价浮动率。接下来,从运输成本、宏观环境、市场竞争和运输货物四个方面,结合铁路货运的货票总金额数据,收集仓储价格指数、PMI、GDP、零售商品价格指数、公路运价指数、公路货运量、运输货物产量、运输货物价格指数9个关键影响因素构建数据仓库多维特征数据集。进一步,将计算得出的铁路货运运价浮动率和9个影响因素数据构成的数据集统一进行预处理,包括数据聚合和数据标准化,再将数据划分为训练集和测试集。最后,将训练集数据导入构建的多变量LSTM铁路货运运价预测模型中进行训练,得到最优模型,再将测试集数据导入最优模型中,对某运输货物的铁路货运运价浮动率进行周预测。
如图1所示,本发明方法包括如下步骤:
步骤一:根据铁路的运费结构与运价浮动机制,提出运价浮动率计算公式,基于订单数据与官方报价,计算运价浮动率;
步骤二:建立模型预测数据仓库;包括运输成本数据集、宏观环境数据集、市场竞争数据集与运输对象数据集,将自变量
Figure DEST_PATH_IMAGE001
作为数据集中影响因素的特征变量和因变量(运价浮动率)进行相关性分析,根据变量间的相关性程度筛选关键的影响因素作为模型输入;筛选后剩余n个特征变量,n<m;
步骤三:将选取的特征变量和因变量做数据预处理,主要包含数据降噪、数据聚合以及数据标准化;将数据划分为训练集和测试集;
步骤四:构建用于铁路运价浮动预测的LSTM模型框架,设置模型初始参数值,使用训练集对多变量LSTM预测模型进行超参数优化,得到最优模型;将测试集应用于训练好的预测模型,将预测值进行反归一化处理,使其与真实值处于同一量级,输出预测结果、输出预测误差曲线,以及真实值和预测值的拟合曲线图进行预测效果评估。
其中:
1、铁路运价浮动率计算
本发明将铁路运价预测转化为铁路运价浮动比率预测,该浮动比率即为实际承运价格与铁路95306货运官网价格进行比价得出。以货物种类代码为x的第i票货运数据为例,其运价浮动率表示为
Figure DEST_PATH_IMAGE002
,具体计算公式如下:
Figure DEST_PATH_IMAGE003
其中,P1为实际运价率;P2为理论运价率;
Figure DEST_PATH_IMAGE004
为货物x所适用的基价1;
Figure DEST_PATH_IMAGE005
为货物x所适用的基价2;
Figure DEST_PATH_IMAGE006
为该票货物的货票总金额;lxi为该票货物的运输总里程,其值大于0;wxi为该票货物的计费重量,其值大于0;Fxi为该票货物所需缴纳的所有附加费用;ft为第t类费用的系数,包括电气化费用系数、新路新价公摊费用系数、税费系数等,所有系数均大于0;Mxi为该票货物所需缴纳的所有杂费;mk为第k项杂费的系数,包括接、送站费系数、搬运费系数等,所有系数均大于0;
Figure DEST_PATH_IMAGE007
为该项杂费服务的距离,如货物的搬运距离;
Figure DEST_PATH_IMAGE008
为该票货物所有的加减成率;
Figure DEST_PATH_IMAGE009
为第j项加成率或减成率,该数据可为正数也可为负数,当存在两个以上负数时仅取其中最小一个,当存在两个以上正数时所有数值进行叠加运算。
2、构建数据仓库
本发明所构建的数据仓库由运输成本、宏观环境数据、竞争对手数据以及运输对象数据组成。其中运输成本数据来源于95306货票数据;宏观环境数据包括GDP月同比增长率、PMI月同比变化率、零售商品价格指数、仓储价格指数,其中前三者均来国家统计局,最后一项来自中国物流与采购联合会与中储发展股份有限公司报告数据库;竞争对手数据,主要是公路相关数据,包括公路运价指数和公路月货运量,两者分别来自中国公路物流运价指数网和交通运输部;运输对象数据,主要包含运输货物指数和运输货物产量两个因素,两者均来自Wind数据库,数据仓库结构如图2所示。
相关性分析主要是通过皮尔逊相关系数来计算变量间的相关性。相关系数的绝对值越大表明相关性越强,而正负显示两变量是正相关还是负相关。
Figure DEST_PATH_IMAGE010
其中,n为样本数;xi、yi为变量值;r的取值范围为[-1,1],当r>0时,表示两个变量之间呈正相关关系;r<0时,表示两个变量之间呈负相关关系;
Figure DEST_PATH_IMAGE011
表明变量间存在显著的线性相关性,而
Figure DEST_PATH_IMAGE012
则表明两变量间线性相关性较弱。
3、数据预处理
(1)数据聚合
本发明对各类运输货物运价浮动率进行周预测,因此将所有货票数据以各类运输货物品类代码为主键,在以周为单位进行加和再取均值处理。此外,外部影响因素往往具备不同的时间粒度,对于以日为单位的运输货物相关数据,按周内均值取值。而宏观环境数据往往数据粒度较大,最小也为月,则按照该周所处月份均取同一数值。公路运输数据粒度则本身为周。
(2)数据标准化
采取的数据标准化方式是归一化:对于每个属性A,将A的一个原始值xi通过min-max标准化映射成在区间[0,1]中的值xi',其公式为
Figure DEST_PATH_IMAGE013
其中,xmax为属性A中的最大值;xmin为属性A中的最小值;xi为原始值;xi'为原始值xi通过归一化映射成在区间[0,1]中的值。
(3)将所有数据按照时间先后排序,按照4:1比例划分训练集和测试集。
4、LSTM模型构建
标准的RNN模型存在梯度消失和爆炸的问题,因此阻碍了网络的优化学习。也是由于这个原因,RNN仅存在短期记忆,在需要记住完整序列特征的长序列预测中不能取得较好的效果。长短期记忆(Long-Short Term Memory ,LSTM)循环网络通过引入称为 ConstantError Carousel (CEC)的线性单元(如图3所示),克服了梯度消失问题,该单元可以为每个时间步添加信息。CEC 的错误流控制是使用“门”进行的。输入门控制添加到单元的信息,输出门调节信息流向网络的其余部分,而遗忘门衰减先前时间步的激活。
其具体计算过程是前一个隐藏单元的信息
Figure DEST_PATH_IMAGE014
和当前输入的信息
Figure DEST_PATH_IMAGE015
通过
Figure DEST_PATH_IMAGE016
sigmoid 激活函数计算所有门值,并通过 tanh 激活函数计算新信息
Figure DEST_PATH_IMAGE017
,这些信息将被用于更新。LSTM 一个细胞单元的计算公式是:
Figure DEST_PATH_IMAGE018
其中,
Figure DEST_PATH_IMAGE019
分别表示更新门、遗忘门、输出门的权重;
Figure DEST_PATH_IMAGE020
分别表示更新门、遗忘门、输出门的偏差;Wc为存储单元
Figure DEST_PATH_IMAGE021
的权重;bc为存储单元
Figure 666409DEST_PATH_IMAGE021
的偏差。
本发明的多变量LSTM预测模型是以运价浮动率为预测对象,输入数据为多维特征数据集及历史运价浮动率,包括:仓储价格指数、PMI、GDP、零售商品价格指数、公路运价指数、公路货运量、运输货物产量、运输货物价格指数9个影响因素以及历史运价浮动率。模型共包含4层,其中第一层为LSTM网络层,其余3层为全联接Dense层,最后一个dense层的神经元个数为输出值个数。每两个全连接层之间添加不同的Dropout层来防止网络过拟合,模型的具体框架如图4所示。
对于多变量LSTM预测模型来说,模型输入为
Figure DEST_PATH_IMAGE022
时刻的影响因素
Figure DEST_PATH_IMAGE023
和历史运价浮动率
Figure DEST_PATH_IMAGE024
,模型的输出为预测的t时刻的运价浮动率
Figure DEST_PATH_IMAGE025
。将归一化后的数据按照4:1进行划分为训练集和测试集,训练集用于模型训练,测试集用于检测模型预测效果。
Figure DEST_PATH_IMAGE026
为t=1,2,3,…周的实际运价浮动率,模型在训练过程中计算
Figure 957451DEST_PATH_IMAGE025
Figure 799505DEST_PATH_IMAGE026
的误差来自动更新参数,优化模型。通过参数的不断迭代优化,当误差达到设定的误差时结束训练。模型的训练过程如图5。在模型训练过程中,模型的损失误差使用MSE进行计算,使用Adam优化器自动调整权重梯度,选择tanh激活函数使模型快速收敛。
5、实施例
以国内某铁路公司货票数据为例,选择铁矿石整车运输运价数据为预测对象。计算铁矿石运价浮动率后,特别地从wind数据库中获取铁矿石价格指数和铁矿石产量两个数据,结合其他7个指标数据并进行数据预处理,以4:1比例划分训练集和测试集,随后输入训练集至多变量LSTM预测模型进行训练,得到最优模型后再导入测试集得到铁矿石运价浮动率周预测结果。
具体过程如下:
5.1铁路货运运价浮动率计算
基于95306历史货票数据,利用计费重量、总里程、货票总金额、杂费以及运输对象适用的运价号,计算理论运价P2与实际运价P1,通过计算两者的比率得出运价浮动率r。
5.2数据仓库构建
在本实例中,运输成本因素的特征变量包括计费重量(吨)X1、总里程(公里)X2、货票总金额(元)X3;宏观环境因素的特征变量包括GDP(%)X4、PMI(%)X5、零售商品价格指数(%)X6、仓储价格指数(%)X7;市场竞争因素的特征变量公路运价指数(%)X8和公路货运量(吨)X9;运输对象因素的特征变量铁矿石价格指数(%)X10、铁矿石期货结算价(元)X11以及铁矿石产量(吨)X12。本实施例利用前四年的输入数据预测第五年的铁路运价浮动率。
利用SPSS软件的皮尔逊相关性分析对因变量和影响因素的关联性进行分析。分析结果显示X1, X2与运价浮动率r的相关程度小于0.1,需舍弃。而X10, X11之间的相关性为0.98,两个变量之间存在严重的可替代性,故舍弃其中一项。最终选择X3,X4, X5, X6, X7,X8, X9,X11, X12作为自变量。
5.3数据预处理
5.3.1数据降噪
本例中主要存在的缺失值是计费重量缺失,由于铁路的计价规则内,计费重量主要是按载重量计算,不足一吨按一吨记,而载重量的单位为千克,因此对于缺失的该类数据,通过载重量数据的计算转化向上取整来获得。在器皿的回送订单会存在货票总金额为0的状况,这类订单数据一般采取删除处理。订单中也存在多车货物使用同一个订单计费,对于这类数据只能手动修改,根据运输车数与货票总金额计算单车运输费用。
5.3.2数据聚合
本例的预测对象是铁矿石运价浮动变化,预测的时间粒度为周。因此将运价浮动率和多维特征数据集以周为单位进行加和再取均值处理。
5.3.3训练集与测试集划分
经过预处理后的数据以r为标签数据为铁路运价浮动率,其余变量为影响因素。将归一化后的数据按照时序先后,以4:1划分为训练集和测试集,训练集用于训练最优模型,测试集用于得出模型预测结果。
5.4 构建LSTM铁路货运运价浮动率预测模型
5.4.1 LSTM预测网络结构设置
模型初始设置共包含4层,其中第一层为LSTM网络层,其余3层为全联接Dense层,最后一个dense层的神经元个数为输出值个数。每两个全连接层之间添加不同的Dropout层来防止网络过拟合。
5.4.2初始参数设置
(1)模型输入
对于多变量LSTM预测模型来说,模型输入为
Figure DEST_PATH_IMAGE027
时刻的影响因素
Figure 319348DEST_PATH_IMAGE023
和历史运价浮动率
Figure DEST_PATH_IMAGE028
,模型的输出为预测的t时刻的运价浮动率
Figure 473335DEST_PATH_IMAGE025
Figure DEST_PATH_IMAGE029
为t=1,2,3,…周的实际运价浮动率,模型在训练过程中计算
Figure 420431DEST_PATH_IMAGE025
Figure 749781DEST_PATH_IMAGE029
的误差来自动更新参数,优化模型。通过参数的不断迭代优化,当误差达到设定的误差时结束训练。
(2)超参数设置
设定1个LSTM层,神经元个数为256;添加3个dense层,神经元数量依次为512、1024、1;为了防止过拟合,设定dense层间的Dropout层舍弃率分别为0.23、0.29、0.31。
设定loss计算方法,选择均方误差MSE;
选择Adam作为LSTM模型的优化算法,学习率设定为默认值;
设计初始训练次数为200,批处理次数为64,训练步长为7。
5.5 LSTM模型优化训练
LSTM多维特征预测模型训练通过多次迭代计算
Figure 10998DEST_PATH_IMAGE025
Figure 742194DEST_PATH_IMAGE029
的均方根误差(RMSE),取最小RMSE值的模型为最优模型。该过程中关键涉及到超参数的优化,超参数的优化主要包括激活函数和优化器的选择。在本实例模型训练过程中,首先将训练集数据输入参数初始化后的LSTM模型,然后计算损失函数,然后更新参数梯度。根据模型是否符合设定误差或迭代次数达到最大值或损失误差5轮内没有减少,判断是否结束模型训练。通过对比分析,最终选择tanh作为激活函数,Adam优化器,如表1和表2所示。
表1不同优化器的训练误差
Figure DEST_PATH_IMAGE030
表2不同激活函数的训练误差
Figure DEST_PATH_IMAGE031
使用多特征输入的LSTM模型进行预测时,观察到损失函数图可知,图6中训练集的误差曲线在50轮左右完全收敛,测试集的曲线也快速收敛并在75轮达到平稳,证明了模型构建的合理性与适用性。
5.6模型评估指标
预测模型的性能主要从预测误差的大小来评估,当预测值与实际值越接近,则模型预测的准确度越高。假设实际值
Figure DEST_PATH_IMAGE032
,预测值
Figure DEST_PATH_IMAGE033
1.均方误差(Mean Square Error)
Figure DEST_PATH_IMAGE034
MSE表示每个预测值与实际值之间距离的平方,它的取值范围是
Figure DEST_PATH_IMAGE035
,当预测值与真实值完全吻合时为0,即完美模型,误差越大,该值越大。
2.均方根误差(Root Mean Square Error)
Figure DEST_PATH_IMAGE036
RMSE等于MSE取值开根号,相较于均方误差,它在数量级上更加直观,表示预测值相比真实值平均差值。在误差评估时可以将均方根误差和实际值之间去比较,就可以对预测准确度有个直观的理解。它的取值范围是
Figure 437355DEST_PATH_IMAGE035
3.平均绝对误差(Mean Absolute Error)
Figure DEST_PATH_IMAGE037
MAE就是把均方误差中对预测值与实际值之间的差值求平方改成了求绝对值。
4.平均绝对百分比误差(Mean Absolute Percentage Error)
Figure DEST_PATH_IMAGE038
MAPE对预测的准确度更加直观了,类似于增幅的概念。用预测值与实际值之间的差去与实际值相比来查看预测误差所占的真实值的比例。
5.7模型对比分析
将测试集代入最优的LSTM多维特征铁路货运运价浮动率预测模型进行周预测,并分别使用训练完成的ARIMA(2,1,1)模型、BP神经网络模型、LSTM单变量预测模型进行运价浮动率浮动周预测,采用MSE、RMSE、MAE、MAPE指标对预测结果进行评价,如表3所示。
表3周运价预测模型对比
Figure DEST_PATH_IMAGE039
从表3可知,LSTM多特征预测模型的准确率明显高于其他三类模型,且模型测试集上的误差明显小于训练集误差,充分验证了本发明的泛化能力以及对于预测精度的提升效果。从图7中可以得到基于多特征输入的LSTM模型的预测值与实际值趋势基本吻合。根据预测结果与真实数据的对比曲线图和预测误差评估指标对四个模型进行对比分析与评估,LSTM多维特征预测模型最适用于铁路货运运价浮动率的周预测,模型的预测准确率较其他模型有明显的优势。
本实施例的实验环境为 Linux操作系统,使用CPU进行计算,利用PyCharmCommunity Edition2020软件和Anaconda3搭建深度学习环境,使用Python3.7.1版本编写程序。基于TensorFlow开源的机器学习平台后端,利用Keras神经网络模块搭建LSTM模型,同时引入其他第三方库来辅助建模,使用pandas库读取源数据;使用numpy库计算向量值;使用math库计算预测误差;使用datetime记录模型训练时间。最后所有预测结果使用matplotlib绘制图像。

Claims (10)

1.一种基于多变量LSTM的铁路货运运价浮动预测方法,其特征在于:包括如下步骤:
步骤一、计算运价浮动率;
步骤二、构建数据仓库多维特征数据集,确定特征变量;
步骤三、对特征变量和运价浮动率进行预处理后进行训练集和测试集的划分;
步骤四、构建基于多变量LSTM的铁路货运运价浮动预测模型,设置模型初始参数值,使用训练集对模型进行超参数优化,得到最优模型;将测试集应用于训练好的最优模型,将预测值进行反归一化处理,使其与真实值处于同一量级,输出预测结果并评估模型质量。
2.根据权利要求1所述的一种基于多变量LSTM的铁路货运运价浮动预测方法,其特征在于:按如下公式计算运价浮动率
Figure 156368DEST_PATH_IMAGE001
Figure 505441DEST_PATH_IMAGE002
其中,
Figure 349900DEST_PATH_IMAGE003
表示货物种类代码为x的第i票货运数据的运价浮动率;P1为实际运价率;P2为理论运价率;
Figure 442621DEST_PATH_IMAGE004
为货物x所适用的基价1;
Figure 522048DEST_PATH_IMAGE005
为货物x所适用的基价2;
Figure 307601DEST_PATH_IMAGE006
为该票货物的货票总金额;lxi为该票货物的运输总里程;wxi为该票货物的计费重量;Fxi为该票货物所需缴纳的所有附加费用;ft为第t类费用的系数;Mxi为该票货物所需缴纳的所有杂费;mk为第k项杂费的系数;
Figure 639357DEST_PATH_IMAGE007
为该项杂费服务的距离;
Figure 473452DEST_PATH_IMAGE008
为该票货物所有的加减成率;
Figure 738211DEST_PATH_IMAGE009
为第j项加成率或减成率。
3.根据权利要求2所述的一种基于多变量LSTM的铁路货运运价浮动预测方法,其特征在于:各类费用的系数包括电气化费用系数、新路新价公摊费用系数、税费系数等;各项杂费的系数包括接、送站费系数、搬运费系数等。
4.根据权利要求2所述的一种基于多变量LSTM的铁路货运运价浮动预测方法,其特征在于:当第j项加成率或减成率
Figure 635278DEST_PATH_IMAGE010
存在两个以上负数时仅取其中最小一个,当存在两个以上正数时取所有数值的和。
5.根据权利要求1所述的一种基于多变量LSTM的铁路货运运价浮动预测方法,其特征在于:步骤二所述构建数据仓库多维特征数据集,确定特征变量的方法为:
(1)建立模型预测数据仓库:包括运输成本数据集、宏观环境数据集、市场竞争数据集与运输对象数据集;
(2)将自变量
Figure 454330DEST_PATH_IMAGE011
作为数据集中影响因素的特征变量和作为因变量的运价浮动率进行相关性计算,根据变量间的相关性程度确定n个特征变量作为模型输入。
6.根据权利要求1所述的一种基于多变量LSTM的铁路货运运价浮动预测方法,其特征在于:对特征变量和运价浮动率进行预处理的方法包括:
(1)数据聚合:
将所有货票数据以各类运输货物品类代码为主键,再以周为单位进行加和再取均值;对于以日为单位的运输货物相关数据,按周内均值取值;对于以月为单位的运输货物相关数据,则按照该周所处月份取值;
(2)数据归一化:
对于每个属性A,将A的一个原始值xi通过min-max标准化映射成在区间[0,1]中的值xi':
Figure 154433DEST_PATH_IMAGE012
其中,xmax为属性A中的最大值;xmin为属性A中的最小值;xi为原始值;xi'为原始值xi通过归一化映射成在区间[0,1]中的值;
(3)将归一化后所有数据按照时间先后排序。
7.根据权利要求1所述的一种基于多变量LSTM的铁路货运运价浮动预测方法,其特征在于:按照4:1的比例划分训练集和测试集。
8.根据权利要求1所述的一种基于多变量LSTM的铁路货运运价浮动预测方法,其特征在于:基于多变量LSTM的铁路货运运价浮动预测模型共包含4层,其中第一层为LSTM网络层,其余3层为全联接Dense层,最后一个dense层的神经元个数为输出值个数,每两个全连接层之间添加不同的Dropout层来防止网络过拟合。
9.根据权利要求1所述的一种基于多变量LSTM的铁路货运运价浮动预测方法,其特征在于:在模型训练过程中,模型的损失误差使用MSE进行计算,使用Adam优化器自动调整权重梯度,选择tanh激活函数使模型快速收敛。
10.根据权利要求1所述的一种基于多变量LSTM的铁路货运运价浮动预测方法,其特征在于:评估模型质量的指标包括均方误差MSE、均方根误差RMSE、平均绝对误差MAE、平均绝对百分比误差MAPE。
CN202210783351.9A 2022-07-05 2022-07-05 一种基于多变量lstm的铁路货运运价浮动预测方法 Pending CN115204482A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210783351.9A CN115204482A (zh) 2022-07-05 2022-07-05 一种基于多变量lstm的铁路货运运价浮动预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210783351.9A CN115204482A (zh) 2022-07-05 2022-07-05 一种基于多变量lstm的铁路货运运价浮动预测方法

Publications (1)

Publication Number Publication Date
CN115204482A true CN115204482A (zh) 2022-10-18

Family

ID=83577835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210783351.9A Pending CN115204482A (zh) 2022-07-05 2022-07-05 一种基于多变量lstm的铁路货运运价浮动预测方法

Country Status (1)

Country Link
CN (1) CN115204482A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115953102A (zh) * 2023-03-13 2023-04-11 北京全路通信信号研究设计院集团有限公司 一种铁路货运制票管理方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115953102A (zh) * 2023-03-13 2023-04-11 北京全路通信信号研究设计院集团有限公司 一种铁路货运制票管理方法及系统

Similar Documents

Publication Publication Date Title
Yang et al. Multi-objective biogeography-based optimization for supply chain network design under uncertainty
Budak et al. A forecasting approach for truckload spot market pricing
Fulzele et al. Performance measurement of sustainable freight transportation: a consensus model and FERA approach
Bhattacharya et al. A robust two layer green supply chain modelling under performance based fuzzy game theoretic approach
CN115145993A (zh) 基于自学习规则运算的铁路货运大数据可视化展示平台
Chen et al. Exploration and mining evaluation system and price prediction of uranium resources
CN115204482A (zh) 一种基于多变量lstm的铁路货运运价浮动预测方法
Liu et al. Joint optimization of lot-sizing and pricing with backlogging
Terrada et al. Demand forecasting model using deep learning methods for supply chain management 4.0
Jun et al. Evolutionary neural network for learning of scalable heuristics for pickup and delivery problems with time windows
Xiong et al. Supplier selection model based on D numbers and transformation function
CN115587865A (zh) 基于风险映射的土地价格评估方法、计算设备及存储介质
Kotenko et al. Supervised Machine Learning Models for Forecasting Fuel Consumption by Vehicles During the Grain Crops Delivery
CN114742257A (zh) 物料消耗预测方法、调拨方法、决策方法、决策系统、电子设备和存储介质
Chen et al. Simulation-based optimization of ship design for dry bulk vessels
Nazari-Shirkouhi et al. A robust-fuzzy multi-objective optimization approach for a supplier selection and order allocation problem: Improving sustainability under uncertainty
Kupalova et al. Information and Analytical Support for Organizing Commodity Flows on the Environmental and Economic Basis
Razghonov et al. BUILDING MODELS TO OPTIMIZE VEHICLE DOWNTIME IN MULTIMODAL TRANSPORTATION.
Mojoodi et al. Designing an algorithm for predicting plane ticket prices using feedforward neural network modeling
Al Moteri et al. Economic growth forecast model urban supply chain logistics distribution path decision using an improved genetic algorithm
Jeon A survey of the optimal time series modelling for newbuilding ship prices
WO2023082315A1 (zh) 电子固废回收全流程智能解析方法及系统
CN117455341B (zh) 一种智能化车货匹配灵活调优方法
Huang et al. Two-stage distributionally robust optimization model for warehousing-transportation problem under uncertain environment.
Han Research on the structure of corporate financial management objective system based on BRP method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination