CN116663742A - 基于多因素和模型融合的区域运力预测方法 - Google Patents
基于多因素和模型融合的区域运力预测方法 Download PDFInfo
- Publication number
- CN116663742A CN116663742A CN202310709817.5A CN202310709817A CN116663742A CN 116663742 A CN116663742 A CN 116663742A CN 202310709817 A CN202310709817 A CN 202310709817A CN 116663742 A CN116663742 A CN 116663742A
- Authority
- CN
- China
- Prior art keywords
- model
- capacity
- data
- factor
- weather
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 230000004927 fusion Effects 0.000 title claims abstract description 19
- 238000012937 correction Methods 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000011156 evaluation Methods 0.000 claims description 14
- 238000000556 factor analysis Methods 0.000 claims description 14
- 238000010276 construction Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 7
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000005484 gravity Effects 0.000 claims description 3
- 230000007935 neutral effect Effects 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 230000007306 turnover Effects 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 230000003203 everyday effect Effects 0.000 claims description 2
- 239000013604 expression vector Substances 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 11
- 238000013527 convolutional neural network Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 238000012706 support-vector machine Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000002679 ablation Methods 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 229910000831 Steel Inorganic materials 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000008635 plant growth Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000010959 steel Substances 0.000 description 2
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 1
- NLZUEZXRPGMBCV-UHFFFAOYSA-N Butylhydroxytoluene Chemical compound CC1=CC(C(C)(C)C)=C(O)C(C(C)(C)C)=C1 NLZUEZXRPGMBCV-UHFFFAOYSA-N 0.000 description 1
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012358 sourcing Methods 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0838—Historical data
Abstract
本发明公开了基于多因素和模型融合的区域运力预测方法,包括如下步骤:S1,GPS轨迹数据降采样;S2,运力值预处理,并利用熵权法计算区域运力值。本发明利用熵权法获取区域历史运力得分,采用基于BERT的政策因素提取模型提取政策文本输出对应的政策文本因素特征并生成对应的向量化特征表示。使用基于权值修正的天气因素生成方法,根据历史天气数据构建修正权值对天气预报数据进行修正,获取天气因素特征并生成对应的向量化特征表示。最后使用XGBoost和LSTM模型分别进行序列预测,并融合两个模型的预测结果作为区域运力的预测结果,其准确率高,取得了良好的效果。
Description
技术领域
本发明涉及物流企业运力预测领域,具体涉及基于多因素和模型融合的区域运力预测方法。
背景技术
近年来,随着物联网、5G、北斗/GPS导航、人工智能、云计算和大数据等先进技术的广泛应用,物流行业开启了数字化转型之路,其运营模式逐渐从外包型向综合型转变,全面迈进网络货运时代。在物流信息化平台中,运力库将所有车辆所在地按照行政区域划分为多个流向,对于各个流向承运货物的车辆统称为运力。运力库对区域所有运力资源进行统一管理,并提供基于运力资源库的数据分析功能,在网络货运业务的运营管理中扮演了关键角色。区域运力通常代表了某区域所有可供货运运输资源的能力,但其往往受制于政策、运价、天气等因素,波动范围较大。在现代大规模物流系统中,准确的区域运力预测不仅能够预防爆仓、订单延误等风险,还可以在日常的运营中减少运力浪费,提高运营效率。
当前,面向不同应用场景的运力预测已获得学术界广泛关注。《基于自注意力机制的钢铁物流运力预测》,华东师范大学学报(自然科学版),2022(05):165-183,提出了基于自注意力机制的钢铁物流运力预测方法,该方法基于物流企业的运单、车辆、轨迹以及运输终点等数据集,提取货车的停留行为特征、运输终点特征、环境特征等,并引入自注意力机制分别获取不同特征对两段行程耗时影响的权重。为准确预测世界石油船队总运力情况,《采用改进模拟植物生长算法的世界石油船队总运力预测》上海海事大学学报,2019,40(02):23--28,从总运力趋势波动和运力净增量波动两个方面建立时间序列模型来揭示世界石油船队总运力的变化规律,用改进的模拟植物生长算法进行求解。《Capturing theswarmintelligence in truckers:The foundation analysis for future swar'mrobotics in road freight,Swarm and Evolut ionary Computation》.Swarm andEvolutionaryComputation,2021,62(4):58-65,分析了货车出行运行距离、回转距离、访问城市数、移动模式等出行空间特征,货车移动范围扩散的时间特征、不同时间周期下的出行强度等出行时间特征,对货车出行的时空范围和时空规律性进行描述,刻画了中国公路运力的时空分布特征。针对整车运力调度平台存在的运力资源组织织不平衡的问题,《Vehicle-Cargo Matching Optimization Model for Vehicle Capacity SchedulingPlatform》.In 3rd Internat ional Conference on Advances in Management Scienceand Engineering(IC-AMSE 2020),2020,260-267,综合考虑了各方主体利益、货源紧急程度以及运力资源有效利用率这三个重要影响因素,建立了考虑货源时间窗约束的运力资源选择模型和求解方案。《A two-stage approach to modeling vacant taxi movements》.Transportat ion Research Procedia,2015(7):147-163,提出了两阶段的方法预测空闲出租车的行驶行为与出租车数量分布的变化,并提出了定制的深度残差神经网络模型来预测每个区域的网约车服务供需缺口,继而根据供需缺口进行运力调度。《Hexagon-basedconvolutional neural ne twork for supply-demand forecasting of ride-sourcingservices》.IEEE Transactions on Intelligent Transportation Systems,2019,20(11):4160-4173,对城市道路网络按照六边形网格进行划分,提出了基于六边形的卷积神经网络集成框架,实现网约车服务的供需缺口预测。在上述研究中,时间序列模型虽然能够从历史数据中提取出一些时间序列的特征,由于模型复杂度较为有限,所能表征的特征种类也比较单一,导致方法的预测结果准确性较低。此外,在大宗物流场景中货车司机对运输流向依赖性较强,基于交通流量的预测方法并不适用于物流运力预测。
发明内容
本发明为克服现有研究成果应用在区域车辆运力预测上的不足,提出了一种融合多因素的区域车辆运力预测方法。本发明在对车辆GPS轨迹数据降采样的基础上,根据熵权法计算得到车辆运力得分来计算整个区域运力得分来生成数据集。采用基于BERT的政策因素提取模型构建政策文本因素特征,使用基于权值修正的天气因素生成方法构建天气预报特征,并融合XGBoost和长短期记忆网络(LSTM,LongShort-Term Memory)模型的预测结果作为区域运力的预测结果。
本发明采用的技术方案是:基于多因素和模型融合的区域运力预测方法,包括如下步骤:S1,GPS轨迹数据降采样,通过计算车辆在30天内所有降采样后的GPS连续点之间的距离作为该车辆30天内的运营里程;根据车辆在30天内所有降采样后的GPS连续点之间的时间差累计值作为运营时长;S2,运力值预处理,通过对车辆的运营里程、运营天数、运营时长、运价和货运周转量5个因子来衡量区域运力,并利用熵权法计算区域运力值。
作为本发明的进一步改进,所述S2中,熵权法计算区域运力值包括对5个因子指标进行标准化处理,假设某区域拥有n0辆车,选取m个指标(m=5,分别代表30天内的运营里程、运营天数、运营时长、运价和货运周转量),剔除空值和异常值后随机选取n辆车作为熵权法的输入,假定第i个车辆的第j个指标数值表示为xij(i=1,2,...,n;j=1,2,...,m)将绝对值转化为相对值,如公式(1)所示:
x′ij(i=1,2,...,n;j=1,2,...,m)为第i个车辆的第j个指标数值,对第j个指标下第i个样本值占该指标的比重进行计算,如公式(2)所示:
第j项指标的熵值计算方法如公式(3)所示:
其中ln为自然对数,且满足ej>=0;
信息熵冗余度(即各指标的差异化系数)计算方式如公式(4)所示:
dj=1-ej,j=1,2,...,m (4)
根据信息熵冗余度计算运力评估指标体系中各项指标的权重,如公式(5)所示:
在获得各指标的权重后,各车辆的运力综合得分计算方法如公式(6)所示:
该区域所拥有的n0辆车的运力综合得分sall的计算方法如公式(7)和公式(8)所示:
sall=n0*smean (8)
作为本发明的进一步改进,还包括S3,以S2中计算出的区域运力值作为标签来构建该区域运力值数据集,并作为区域运力预测模型的训练数据。
作为本发明的进一步改进,其特征是还包括S4和S5;S4,构建政策因素分析模型,利用BERT模型处理相关政策来获取影响车辆运力的相关特征;S5,构建天气变化因素分析模型,基于时间衰减的天气因素提取算法来提取天气相关因素,天气因素提取包含训练阶段的天气数据嵌入和预测阶段的基于时间衰减的天气预报数据嵌入。
作为本发明的进一步改进,所述S4,构建政策因素分析模型包括数据集构建和模型构建;数据集构建阶段,选取某段时间与物流货运相关的政策文本进行人工标注,每篇政策文本对应于一个影响因素类别,类别种类为积极因素、消极因素和中立因素;模型构建阶段,政策因素分析模型使用BERT预训练语言构建特征提取层,并使用全连接网络结合softmax函数进行多分类。
作为本发明的进一步改进,所述S5,构建天气变化因素分析模型,在模型训练阶段,根据历史30天的降雨、气温、气压、风速的气象数据构建4个天气因素的特征向量,生成30m维向量,m为天气因素个数(m取值为4),30m维向量作为区域车辆运力预测模型训练时的天气因素输入特征。
作为本发明的更进一步改进,还包括S6,利用XGBoost和LSTM模型评估车辆在未来时间的运力得分;将政策和天气变化因素作为特征变量嵌入到预测模型中,得出针对区域所有车辆的运力得分集合D={{xi,yi}}(|D|=n,xi∈Rm,yi∈R),其中xi为车辆运力得分对应的计算指标,yi为对应的车辆运力得分(i∈N表示运力得分集合所覆盖的时间长度,以月为单位);通过熵权法计算得到区域所有车辆每30天的运力值后,使用大小为Sw步长为Ls的滑动窗口选取数据作为输入数据,滑动窗口的下一个位置为模型label;选取前1-6个30天的多因素特征ti作为模型的输入数据,以第7个30天运力得分yi为模型label,其中多因素特征ti为第i个30天的运力值数据和i个30天多因素向量融合得到的向量;使用窗口大小为6步长为l的滑动窗口沿时序方向进行滑动,得到一系列数据来构建数据集;将构建的数据集划分为训练集、验证集、测试集对模型进行训练和预测,并采用相应的评价指标进行模型评估;在完成训练集构建后,分别训练XGBoost模型和LSTM模型,并进行调参,选取最优的模型结果使用投票法进行加权融合,从而得到对区域所有车辆在未来一段时间内的运力趋势预测。
本发明具有的有益效果:为提升物流公司应对区域运力变化的预判能力,本发明利用熵权法获取区域历史运力得分,采用基于BERT的政策因素提取模型提取政策文本输出对应的政策文本因素特征并生成对应的向量化特征表示。使用基于权值修正的天气因素生成方法,根据历史天气数据构建修正权值对天气预报数据进行修正,获取天气因素特征并生成对应的向量化特征表示。最后使用XGBoost和LSTM模型分别进行序列预测,并融合两个模型的预测结果作为区域运力的预测结果,其准确率高,取得了良好的效果。
附图说明
图1为本发明的构建政策因素分析模型的模型构建阶段文本长度小于等于L的输出向量示意图。
图2为本发明的天气因素提取示意图。
图3为LSTM网络结构示意图。
图4为本发明的天气因素的数据分割处理示意图。
具体实施方式
以本公司2019年6月至2022年5月的某区域的数据为基础,对本发明做进一步说明。
基于多因素和模型融合的区域运力预测方法,包括如下步骤:
S1,GPS轨迹数据降采样,通过计算车辆在30天内所有降采样后的GPS连续点之间的距离作为该车辆30天内的运营里程;根据车辆在30天内所有降采样后的GPS连续点之间的时间差累计值作为运营时长;
S2,运力值预处理,通过对车辆的运营里程、运营天数、运营时长、运价和货运周转量5个因子来衡量区域运力,并利用熵权法计算区域运力值。
GPS轨迹数据是基于时间和空间对车辆的移动过程进行采用并记录获得的数据,包含了车辆移动的经纬度、时间、车速、方向等信息。GPS轨迹数据蕴含了丰富的运力特征,对这些特征进行分析提取,对后续区域运力预测具有重要作用。对于一些影响运力的因素(如运营里程、运营天数、运营时长),需要计算相邻经纬度之间的距离差,结合时间戳以统计驾驶员在指定范围内的驾驶情况和停车情况。由于GPS轨迹数据的量级非常庞大,并且存在冗余和异常,因此首先通过对GPS经纬度数据进行数据降采样,剔除GPS轨迹数据中的冗余数据,从原始数据中提炼出有价值的数据。在保证数据准确性的情况下,减少冗余数据对特征挖掘的影响,同时提高特征提取的效率。GPS轨迹数据降采样的主要过程是:首先,对选取的30天内的GPS数据进行处理,剔除GPS数据中的错误数据,同时对各数据字段进行数据整合,包括数据类型统一和数据格式的确定,从而为下一步的数据降采样提供可靠的GPS基础数据;其次,针对多来源GPS数据频率不一致的情况,使用按时间间隔等距抽样的方法降低高频率数据,实现不同来源数据的评率一致化;最后,选取最优的降采样参数,使用Douglas–Peucker算法对处理后的GPS基础数据进行降采样操作,进而实现在保证GPS数据准确性的情况下,提高数据降采样的精度。使用Douglas–Peucker算法实现GPS降采样的具体算法流程如下所示:
Step1:选取GPS轨迹数据的首尾两点A,B,并连接A,B两点得到直线AB;
Step2:计算GPS轨迹数据中距离直线AB最大的点C,计算C到AB的距离d;
Step3:比较距离d与预先给定的阈值threshold的大小,如果小于threshold,则该直线段作为曲线的近似,该段曲线处理完毕;
Step4:如果距离大于阈值threshold,则连接AC,BC将GPS轨迹数据分为两段,并分别对两段GPS轨迹数据进行1~3的处理;
Step5:当所有GPS轨迹数据都处理完毕时,依次连接各个分割点形成的折线,即可以作为输入GPS轨迹数据的近似;
在GPS数据降采样之后,可以通过计算车辆在30天内所有降采样后的GPS连续点之间的距离作为该车辆30天内的运营里程;可以根据车辆在30天内所有降采样后的GPS连续点之间的时间差累计值作为运营时长。
进一步地,熵权法充分考虑了系统中各指标的变化程度,根据各指标的差异程度来对其赋予不同的权重。通常来说,一个指标的信息熵越小,说明它在综合评价中所提供的信息量越多,相应的权重也就越高。熵权法计算区域运力值包括对5个因子指标进行标准化处理,假设某区域拥有n0辆车,选取m个指标(m=5,分别代表30天内的运营里程、运营天数、运营时长、运价和货运周转量),剔除空值和异常值后随机选取n辆车作为熵权法的输入,假定第i个车辆的第j个指标数值表示为xij(i=1,2,...,n;j=1,2,...,m)将绝对值转化为相对值,如公式(1)所示:
x′ij(i=1,2,...,n;j=1,2,...,m)为第i个车辆的第j个指标数值,对第j个指标下第i个样本值占该指标的比重进行计算,如公式(2)所示:
第j项指标的熵值计算方法如公式(3)所示:
其中ln为自然对数,且满足ej>=0;
信息熵冗余度(即各指标的差异化系数)计算方式如公式(4)所示:
dj=1-ej,j=1,2,...,m (4)
根据信息熵冗余度计算运力评估指标体系中各项指标的权重,如公式(5)所示:
在获得各指标的权重后,各车辆的运力综合得分计算方法如公式(6)所示:
该区域所拥有的n0辆车的运力综合得分sall的计算方法如公式(7)和公式(8)所示:
sall=n0*smean (8)
即可以计算出该区域30天的综合运力得分,也可以计算出该区域历史各个月份的综合运力得分。以该区域历史的综合运力得分作为标签来构建该区域运力得分数据集,并以此作为区域运力预测模型的训练数据。
进一步地,由于车辆运力受物流政策、车辆政策等因素的影响,因此政策因素需要纳入运力预测模型。天气因素(降雨、气温、气压、风速等)会影响车辆运输的时间、油耗等,从而影响运力值的变化,因此天气因素也需要纳入运力预测模型。由于车辆运力受物流政策、车辆政策等因素的影响,因此政策因素需要纳入运力预测模型。本发明基于BERT预训练语言模型来构建政策因素分析模型,利用BERT模型处理相关政策来获取影响车辆运力的相关特征。BERT是一种基于大量的语料库的预训练语言模型,模型结构采用TransformerEncoder block进行连接,是一个典型的双向编码模型,可以有效提取文本的上下文语义,具有良好的性能。此外,BERT可以实现端到端(end-to-end)训练,针对下游任务不需要调整网络结构,只需要在最后加上特定于下游任务的输出层。同时,BERT可以实现快速并行,也可以扩展到非常深的深度,能充分发掘深度神经网络模型的特性,提升模型准确率。
选取2019年6月-2022年5月期间与物流货运相关的103条政策文本进行人工标注,每篇政策文本对应于一个影响因素类别。类别种类为积极因素、消极因素和中立因素。在模型构建阶段,政策因素分析模型使用BERT预训练语言构建特征提取层,并使用全连接网络结合softmax函数进行多分类,具体算法流程如下:
Step1:对数据集中的政策文本进行预处理,如果文本长度大于L,则对输入文本进行分句处理,得到句子集合S,按顺序将S中的句子分割为多个子集合{si},使得si的长度小于L,且子集合中的每个si对应的标签均为政策文本对应的标签;如果文本长度小于等于L,则不处理;
Step2:对于文本长度小于等于L的政策文本,直接使用BERT处理,获取政策文本的表示向量,并使用全连接网络结合softmax函数进行分类,获取当前政策文本的分类类别概率;
Step3:对于长度大于L的政策文本构建的子集合{si},使用BERT模型提取每个si的文本特征,获取相应表示向量vi,并对每个子集合表示向量vi使用全连接网络结合softmax函数进行分类,得到政策文本的分类类别概率集合{pi};
Step4:对于文本长度小于等于L的政策文本,直接使用预测类别概率结果作为影响因素,输出对应向量;对于长度大于L的政策文本,则使用政策文本的分类类别概率集合{pi}中各类别概率的加权平均作输出向量。
预测未来一个月的运力趋势,因此在预测阶段仅考虑当前时间最新的Top-N个(本处N取值为10)相关政策作为车辆运力影响因素预测的入模参数。对于选取的N个输入政策文本,采用基于BERT的政策因素分析模型预测得到3N维的输出向量,作为后续区域运力预测模型的入模特征。
由于在模型训练阶段采用的是历史已知数据,故此可以直接应用天气数据进行训练。然而在预测阶段,由于未来天气是未知的,只能使用天气预报数据来进行预测,这会导致天气预报的准确性对运力预测模型的准确性产生影响。同时,天气预报的准确性也会随时间衰减,因此采用了基于时间衰减的天气因素提取算法来提取天气相关因素。天气因素提取包含训练阶段的天气数据嵌入和预测阶段的基于时间衰减的天气预报数据嵌入。
在模型训练阶段,根据历史30天的降雨、气温、气压、风速的气象数据构建4个天气因素的特征向量,生成30m维向量,m为天气因素个数(m取值为4)。这30m维向量作为区域车辆运力预测模型训练时的天气因素输入特征。在模型预测阶段,选取中国气象数据网对评估区域未来30天的天气预报数据(降雨、气温、气压、风速)作为初始数据,并采用时间衰减算法来修正天气预报数据以作为区域车辆运力预测模型的天气因素输入特征。具体算法流程如下:
Step1:选取历史连续s天的天气数据(降雨、气温、气压、风速)其中/>分别代表降雨、气温、气压、风速,并获取前(s-30)天每天一对未来30天的天气预报数据其中/>分别代表天气预报预测的降雨、气温、气压、风速,共计(s-30)*30*4条天气预测数据;
Step2:使用窗口大小为30步长为1的滑动窗口选取天气数据Wgt,获取(s-30)*30*4条天气数据
Step3:构建修正权值集合其中/>是的对于集合φ中的元素满足公式(9):
Step4:由于预测的是未来30天的数据,仅需要对30天天气预报数据进行修正,因此采用权值集合的平均数作为修正权值,如公式(10)所示:
Step5:对于模型预测时的未来30天天气预报数据
采用公式(10)计算的修正权值φ′={λ1,λ2,...,λ30}进行修正,具体计算过程如公式(11)所示:
根据公式(11)计算得到未来30天的天气预报修正结果W={wj},j=1,2,..,30,其中wj=[rj,tj,pj,sj]包含降雨、气温、气压、风速4个维度数据,共生产成30*4维的输出向量,作为后续区域运力预测模型的入模特征。
为了更好的预测区域未来的运力趋势,本发明利用XGBoost和LSTM模型评估车辆在未来时间的运力得分,同时为了进一步提升模型的预测准确率,本发明将政策和天气变化因素作为特征变量嵌入到预测模型中,得出针对区域所有车辆的运力得分集合D={{xi,yi}}(|D|=n,xi∈Rm,yi∈R),其中xi为车辆运力得分对应的计算指标,yi为对应的车辆运力得分(i∈N表示运力得分集合所覆盖的时间长度,以月为单位);通过熵权法计算得到区域所有车辆每30天的运力值后,使用大小为Sw步长为Ls的滑动窗口选取数据作为输入数据,滑动窗口的下一个位置为模型label;选取前1-6个30天的多因素特征ti作为模型的输入数据,以第7个30天运力得分yi为模型label,其中多因素特征ti为第i个30天的运力值数据和i个30天多因素向量融合得到的向量;使用窗口大小为6步长为1的滑动窗口沿时序方向进行滑动,得到一系列数据来构建数据集;将构建的数据集划分为训练集、验证集、测试集对模型进行训练和预测,并采用相应的评价指标进行模型评估;在完成训练集构建后,分别训练XGBoost模型和LSTM模型,并进行调参,选取最优的模型结果使用投票法进行加权融合,从而得到对区域所有车辆在未来一段时间内的运力趋势预测。
实施例1,使用基于CUDA 11.0的深度学习框架pytorch 1.7.1构建BERT和LSTM网络模型,使用scikit-learn工具包进行数据标准化等处理,使用xgboost工具包构建XGBoost模型,实验平台为内存64G,显存24G的Ubuntu18.04LTS系统。选取本公司铜陵区域2019年6月-2022年5月期间的货运车辆GPS数据、运价数据、天气数据构建了实验数据集。数据集描述如下面所示。
BERT模型、XGBoost模型和LSTM模型的超参数如下表所示
BERT超参数设置
XGBoost超参数设置
LSTM超参数设置
采用常用的回归模型评价指标:平均绝对误差(MAE)、平方根误差(RMSE)和平均绝对百分误差(MAPE)作为模型性能的评价指标。为验证本发明提出的区域运力预测模型方法的性能,与多种基线方法进行了对比:
(1)SVM(支持向量机):对于构建的数据集去除政策和天气因素,使用运力分和其他数据作为模型入模特征,使用SVM模型进行回归预测。
(2)XGBoost:对于构建的数据集去除政策和天气因素,使用运力分和其他数据作为模型入模特征,使用XGBoost模型进行回归预测。
(3)MLP(全连接神经网络):对于构建的数据集去除政策和天气因素,使用运力分和其他数据作为模型入模特征,使用三个全连接层和一个回归预测层构建MLP模型实现运力分预测。
(4)CNN(卷积神经网络):对于构建的数据集去除政策和天气因素,使用运力分和其他数据作为模型入模特征,使用CNN提取输入特征并结合全连接网络实现运力分预测。
(5)LSTM:对于构建的数据集去除政策和天气因素,使用运力分和其他数据作为模型入模特征,使用LSTM网络提取输入特征并结合全连接网络实现运力分预测。
对比实验结果下表所示。从下表可以看出本发明提出的预测模型在各项指标上均优于其他基线模型。由于SVM是线性模型,如果数据不是线性可分离的,SVM需要使用核函数来使数据达到可以分离的状态。而对于给定的数据集难以找到完美的核函数,因此SVM效果相较于其他模型性能较弱。对于深度学习模型中的MLP和CNN来说,其优势在于不依赖人工特征工程就可以取得相对较好的模型性能。但是由于本发明已经进行了人工特征工程,因此MLP和CNN效果不如使用的集成方法XGBoost模型。由于本发明是序列预测型任务,而LSTM模型对于序列预测型任务非常适配,因此取得了较好的效果。本发明在融合了XGBoost和LSTM模型效果的同时还加入了政策和天气因素,因此取得了最优的预测效果。
基线对比结果
为了证明本发明预测方法中各模块的有效性,分别对XGBoost、LSTM以及多因素特征进行了消融实验:
①XGBoost+多因素:去除LSTM模型,仅使用XGBoost和多因素特征进行预测,其他部分保持不变。
②LSTM+多因素:去除XGBoost模型,仅使用LSTM和多因素特征进行预测,其他部分保持不变。
③XGBoost+LSTM:去除多因素特征,仅使用LSTM和XGBoost融合模型进行预测,其他部分保持不变。
各模块消融实验结果如下表所示,本发明提出方法的各项评价指标均优于①、②和③。从下表可以看出,模型③效果最差,说明了额外的多因素特征可以有效提升预测效果。由模型②优于模型①,这是因为LSTM模型在序列预测效果上优于XGBoost模型,基线对比实验结果也说明了这个结论。基于上述实验分析,本发明提出的模型融合以及多因素特征均可以有效提升区域运力预测的准确性。
消融对比结果
为提升物流公司应对区域运力变化的预判能力,本发明利用熵权法获取区域历史运力得分,采用基于BERT的政策因素提取模型提取政策文本输出对应的政策文本因素特征并生成对应的向量化特征表示。使用基于权值修正的天气因素生成方法,根据历史天气数据构建修正权值对天气预报数据进行修正,获取天气因素特征并生成对应的向量化特征表示。最后使用XGBoost和LSTM模型分别进行序列预测,并融合两个模型的预测结果作为区域运力的预测结果,其准确率高,取得良好的效果。
本领域技术人员应当知晓,本发明的保护方案不仅限于上述的实施例,还可以在上述实施例的基础上进行各种排列组合与变换,在不违背本发明精神的前提下,对本发明进行的各种变换均落在本发明的保护范围内。
Claims (7)
1.基于多因素和模型融合的区域运力预测方法,包括如下步骤:
S1,GPS轨迹数据降采样,通过计算车辆在30天内所有降采样后的GPS连续点之间的距离作为该车辆30天内的运营里程;根据车辆在30天内所有降采样后的GPS连续点之间的时间差累计值作为运营时长;
S2,运力值预处理,通过对车辆的运营里程、运营天数、运营时长、运价和货运周转量5个因子来衡量区域运力,并利用熵权法计算区域运力值。
2.根据权利要求1所述的基于多因素和模型融合的区域运力预测方法,其特征是所述S2中,熵权法计算区域运力值包括对5个因子指标进行标准化处理,假设某区域拥有n0辆车,选取m个指标(m=5,分别代表30天内的运营里程、运营天数、运营时长、运价和货运周转量),剔除空值和异常值后随机选取n辆车作为熵权法的输入,假定第i个车辆的第j个指标数值表示为xij(i=1,2,...,n;j=1,2,...,m)将绝对值转化为相对值,如公式(1)所示:
x′ij(i=1,2,,n;j=1,2,,m)为第i个车辆的第j个指标数值,对第j个指标下第i个样本值占该指标的比重进行计算,如公式(2)所示:
第j项指标的熵值计算方法如公式(3)所示:
其中ln为自然对数,且满足ej>=0;
信息熵冗余度(即各指标的差异化系数)计算方式如公式(4)所示:
dj=1-ej,j=1,2,...,m (4)
根据信息熵冗余度计算运力评估指标体系中各项指标的权重,如公式(5)所示:
在获得各指标的权重后,各车辆的运力综合得分计算方法如公式(6)所示:
该区域所拥有的n0辆车的运力综合得分sall的计算方法如公式(7)和公式(8)所示:
sall=n0*smean (8)。
3.根据权利要求1所述的基于多因素和模型融合的区域运力预测方法,其特征是还包括S3,以S2中计算出的区域运力值作为标签来构建该区域运力值数据集,并作为区域运力预测模型的训练数据。
4.根据权利要求3所述的基于多因素和模型融合的区域运力预测方法,其特征是还包括S4和S5;
S4,构建政策因素分析模型,利用BERT模型处理相关政策来获取影响车辆运力的相关特征;
S5,构建天气变化因素分析模型,基于时间衰减的天气因素提取算法来提取天气相关因素,天气因素提取包含训练阶段的天气数据嵌入和预测阶段的基于时间衰减的天气预报数据嵌入。
5.根据权利要求4所述的基于多因素和模型融合的区域运力预测方法,其特征是所述S4,构建政策因素分析模型包括数据集构建和模型构建;数据集构建阶段,选取某段时间与物流货运相关的政策文本进行人工标注,每篇政策文本对应于一个影响因素类别,类别种类为积极因素、消极因素和中立因素;模型构建阶段,政策因素分析模型使用BERT预训练语言构建特征提取层,并使用全连接网络结合softmax函数进行多分类,具体算法流程如下:
Step1:对数据集中的政策文本进行预处理,如果文本长度大于L,则对输入文本进行分句处理,得到句子集合S,按顺序将S中的句子分割为多个子集合{si},使得si的长度小于L,且子集合中的每个si对应的标签均为政策文本对应的标签;如果文本长度小于等于L,则不处理;
Step2:对于文本长度小于等于L的政策文本,直接使用BERT处理,获取政策文本的表示向量,并使用全连接网络结合softmax函数进行分类,获取当前政策文本的分类类别概率;
Step3:对于长度大于L的政策文本构建的子集合{si},使用BERT模型提取每个si的文本特征,获取相应表示向量vi,并对每个子集合表示向量vi使用全连接网络结合softmax函数进行分类,得到政策文本的分类类别概率集合{pi};
Step4:对于文本长度小于等于L的政策文本,直接使用预测类别概率结果作为影响因素,输出对应向量;对于长度大于L的政策文本,则使用政策文本的分类类别概率集合{pi}中各类别概率的加权平均作输出向量。
6.根据权利要求4所述的基于多因素和模型融合的区域运力预测方法,其特征是所述S5,构建天气变化因素分析模型,在模型训练阶段,根据历史30天的降雨、气温、气压、风速的气象数据构建4个天气因素的特征向量,生成30m维向量,m为天气因素个数(m取值为4),30m维向量作为区域车辆运力预测模型训练时的天气因素输入特征;具体算法流程如下:
Step1:选取历史连续s天的天气数据(降雨、气温、气压、风速)其中/>分别代表降雨、气温、气压、风速,并获取前(s-30)天每天一对未来30天的天气预报数据其中/>分别代表天气预报预测的降雨、气温、气压、风速,共计(s-30)*30*4条天气预测数据;
Step2:使用窗口大小为30步长为1的滑动窗口选取天气数据Wgt,获取(s-30)*30*4条天气数据
Step3:构建修正权值集合其中/>是的对于集合φ中的元素满足公式(9):
Step4:由于预测的是未来30天的数据,仅需要对30天天气预报数据进行修正,因此采用权值集合的平均数作为修正权值,如公式(10)所示:
Step5:对于模型预测时的未来30天天气预报数据采用公式(10)计算的修正权值φ'={λ1,λ2,...,λ30}进行修正,具体计算过程如公式(11)所示:
根据公式(11)计算得到未来30天的天气预报修正结果W={wj},j=1,2,..,30,其中包含降雨、气温、气压、风速4个维度数据,共生产成30*4维的输出向量,作为后续区域运力预测模型的入模特征。
7.根据权利要求4所述的基于多因素和模型融合的区域运力预测方法,其特征是还包括S6,利用XGBoost和LSTM模型评估车辆在未来时间的运力得分;将政策和天气变化因素作为特征变量嵌入到预测模型中,得出针对区域所有车辆的运力得分集合D={{xi,yi}}(|D|=n,xi∈Rm,,yi∈R),其中xi为车辆运力得分对应的计算指标,yi为对应的车辆运力得分(i∈N表示运力得分集合所覆盖的时间长度,以月为单位);通过熵权法计算得到区域所有车辆每30天的运力值后,使用大小为Sw步长为Ls的滑动窗口选取数据作为输入数据,滑动窗口的下一个位置为模型label;选取前1-6个30天的多因素特征ti作为模型的输入数据,以第7个30天运力得分yi为模型label,其中多因素特征ti为第i个30天的运力值数据和i个30天多因素向量融合得到的向量;使用窗口大小为6步长为l的滑动窗口沿时序方向进行滑动,得到一系列数据来构建数据集;将构建的数据集划分为训练集、验证集、测试集对模型进行训练和预测,并采用相应的评价指标进行模型评估;在完成训练集构建后,分别训练XGBoost模型和LSTM模型,并进行调参,选取最优的模型结果使用投票法进行加权融合,从而得到对区域所有车辆在未来一段时间内的运力趋势预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310709817.5A CN116663742A (zh) | 2023-06-14 | 2023-06-14 | 基于多因素和模型融合的区域运力预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310709817.5A CN116663742A (zh) | 2023-06-14 | 2023-06-14 | 基于多因素和模型融合的区域运力预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116663742A true CN116663742A (zh) | 2023-08-29 |
Family
ID=87727805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310709817.5A Pending CN116663742A (zh) | 2023-06-14 | 2023-06-14 | 基于多因素和模型融合的区域运力预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116663742A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117334058A (zh) * | 2023-11-30 | 2024-01-02 | 交通运输部科学研究院 | 一种货车交通流量预测方法、装置、设备及存储介质 |
-
2023
- 2023-06-14 CN CN202310709817.5A patent/CN116663742A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117334058A (zh) * | 2023-11-30 | 2024-01-02 | 交通运输部科学研究院 | 一种货车交通流量预测方法、装置、设备及存储介质 |
CN117334058B (zh) * | 2023-11-30 | 2024-03-19 | 交通运输部科学研究院 | 一种货车交通流量预测方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bi et al. | Daily tourism volume forecasting for tourist attractions | |
Yu et al. | Prediction of highway tunnel pavement performance based on digital twin and multiple time series stacking | |
Zhang et al. | Network‐wide traffic speed forecasting: 3D convolutional neural network with ensemble empirical mode decomposition | |
CN113487066B (zh) | 基于多属性增强图卷积-Informer模型的长时序货运量预测方法 | |
CN111582559B (zh) | 一种到达时间的预估方法及装置 | |
Bao et al. | An improved deep belief network for traffic prediction considering weather factors | |
CN114330868A (zh) | 基于自注意力的个性化增强图卷积网络的客流预测方法 | |
Song et al. | A match‐then‐predict method for daily traffic flow forecasting based on group method of data handling | |
CN111242395B (zh) | 用于od数据的预测模型构建方法及装置 | |
CN111598325A (zh) | 基于层次聚类和分层注意力机制的交通速度预测方法 | |
CN115440032A (zh) | 一种长短期公共交通流量预测方法 | |
CN111860989A (zh) | 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法 | |
CN116663742A (zh) | 基于多因素和模型融合的区域运力预测方法 | |
Peng et al. | A forecast model of tourism demand driven by social network data | |
Wang et al. | Prediction and analysis of train passenger load factor of high-speed railway based on LightGBM algorithm | |
Fu et al. | A hybrid neural network for large-scale expressway network OD prediction based on toll data | |
Laifa et al. | Train delay prediction in Tunisian railway through LightGBM model | |
Brahimi et al. | Modelling on car-sharing serial prediction based on machine learning and deep learning | |
Rasaizadi et al. | Short-term prediction of traffic state for a rural road applying ensemble learning process | |
Schmid et al. | Modeling train route decisions during track works | |
Wang et al. | Segmented trajectory clustering-based destination prediction in IoVs | |
CN110796301B (zh) | 一种基于ic卡数据的乘客流量预测方法及装置 | |
Chen et al. | Short-term traffic flow prediction with recurrent mixture density network | |
Xia et al. | A distributed EMDN-GRU model on Spark for passenger waiting time forecasting | |
CN115565376B (zh) | 融合graph2vec、双层LSTM的车辆行程时间预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |