CN109920249A - 一种基于多模型融合的高速匝道行驶时间预测方法 - Google Patents
一种基于多模型融合的高速匝道行驶时间预测方法 Download PDFInfo
- Publication number
- CN109920249A CN109920249A CN201910185609.3A CN201910185609A CN109920249A CN 109920249 A CN109920249 A CN 109920249A CN 201910185609 A CN201910185609 A CN 201910185609A CN 109920249 A CN109920249 A CN 109920249A
- Authority
- CN
- China
- Prior art keywords
- model
- prediction
- swl
- learner
- weak
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于多模型融合的高速匝道行驶时间预测方法;S1、获取历史行驶时间数据,将历史行驶时间数据直接映射得到第一预测结果;S2、利用多个预先训练的弱学习器获取多个第二预测结果;S3、利用第一预测结果筛选多个第二预先结果获取预测集合;S4、利用预测集合中的MAPE值获取强学习器模型并更新预测集合和强学习器模型;S5、重复执行上述步骤S4;直至强学习器模型不再更新,利用最后一次更新的强学习器模型作为高速匝道行驶时间的预测模型;本发明方法能够对高速匝道的行驶时间进行预测,且得到的强学习器模型比任何单一模型的预测精度都高,得到的强学习器模型具有较佳的鲁棒性和泛化能力。
Description
技术领域
本发明涉及机器学习技术领域,尤其涉及一种基于多模型融合的高速匝道行驶时间预测方法。
背景技术
路段的行驶时间能够直观的反映道路拥挤程度。匝道行驶时间作为匝道控制策略优劣的重要评价指标,对其进行合理的预测,能够为匝道控制提供科学的数据支持。行驶时间的预测目前有很多种,比如参数模型有人工神经网络模型和卡尔曼滤波模型,他们都需要大量的标定参数。还有非参数模型,比如历史平均方法、KNN算法和非参数回归模型,这类算法应用就较为广泛,因为它们机制比较简单,且不需要设定大量参数。匝道的行驶时间属于短时行程,对于短时行程时间预测,已经有许多基于数据驱动的方法,其中KNN就比较常见,有许多人就在KNN的基础上进行一些改进来进行预测,比如Zhang L等人的一种改进的K近邻模型用于短期交通流预测,刘伟铭等人的基于PSO-LSSVM的高速公路短时行程时间预测。当然也有其他模型来进行短时行程时间的预测,比如基于SVM的城市快速路行程时间预测研究。
发明内容
(一)要解决的技术问题
针对现有单一预测模型参数设置复杂,且预测效果稳定性差和泛化能力不强的问题,本发明提供一种基于多模型融合的高速匝道行驶时间预测方法。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
S1、获取历史行驶时间数据,将所述历史行驶时间数据直接映射得到第一预测结果SWL0;
S2、利用多个预先训练的弱学习器获取多个第二预测结果SWLi;
S3、利用所述第一预测结果SWL0筛选所述多个第二预先结果SWLi获取包含多个弱学习器模型的预测集合SWLj;
S4、利用预测集合SWLj中平均绝对误差百分比误差最小的两个弱学习器模型获取强学习器模型SLM,将预测集合SWLj中所述选取的两个弱学习器模型剔除,并将强学习器模型SLM作为新的弱学习模型增加至预测集合SWL,更新强学习器模型和预测集合SWLj;
S5、重复执行上述步骤S4直至强学习器模型SLM不再更新,利用最后一次更新的强学习器模型SLM作为高速匝道行驶时间的预测模型。
可选地,在步骤S2和S3之间还包括:利用公式一计算所述第一预测结果的平均绝对百分比误差MAPE0和每一所述第二预测结果的平均绝对百分比误差MAPEi;
公式一:
其中,R表示测试数据的路线数量,T表示测试数据的时间段数量,drt表示r路线t时间段的平均行驶时间,prt表示表示r路线t时间段的平均行驶时间。
可选地,在S3中,包含多个弱学习器模型的预测集合SWLj中的每一个弱学习器模型的平均绝对百分比误差MAPEj均小于MAPE0。
可选地,在步骤S4还包括:利用公式二获取预测集合SWLj,并根据公式三更新预测集合SWLj;
公式二:WLj(i=1,2,...,J)=MAPEj;
公式三:SWLj=(j,WLj),j=1,2,...,J;
式中J表示模型中用到的机器学习模型数量,j表示对应的弱学习器,MAPEj表示第j个模型的平均绝对误差百分比误差。
可选地,在步骤S4中利用两个弱学习器模型构建强学习器模型SLM的方法包括:
A1、以预设迭代速率v调整每个弱学习器的权重比,得到多种权重比的强学习器模型;
A2、获取每一所述权重比的强学习器模型的平均绝对误差百分比误差,将平均绝对误差百分比误差最小时对应的强学习器模型作为最终的强学习器模型SLM。
可选地,所述多个预先训练的弱学习器模型包括XGBoost、LightGBM、SVM、线性回归和KNN中的至少两种。
可选地,步骤S1之前包括利用下述步骤获取多个预先训练的弱学习器:
B1、针对训练样本集利用自助采样法获取多个样本采样集;
B2、针对每一样本采样集进行数据处理获取适用于每一学习模型的训练样本;
B3、利用所述训练样本训练对应的学习模型并得到多个预先训练的弱学习器。
(三)有益效果
本发明的有益效果是:本发明方法为高速匝道的形式时间预测提供了一种新思路,且获得的强学习器模型泛化能力强,且针对不同类型的数据预测结果较为稳定,具有较佳的鲁棒性;此本方法通过多次调整和融合机器学习模型的权重比使得最终获取的模型具有更好的准确性,为实际高速匝道行驶时间的预测提供了准确的预测数据,具有较较佳的实用性。
附图说明
图1为本发明一实施例提供能的一种基于多模型融合的高速匝道行驶时间预测方法流程图;
图2为本发明一实施例提供能的融合策略示意图;
图3为本发明一实施例提供的模型选择时各模型效果图;
图4为本发明一实施例提供的进行融合时模型比例选择图;
图5为本发明一实施例提供的应用融合模型的测试效果图。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
实施例
如图1所示,本实施例提供了一种基于多模型融合的高速匝道行驶时间预测方法,具体包括:
如图2所示,利用下述步骤获取多个预先训练的弱学习器:
B1、针对训练样本集利用自助采样法获取多个样本采样集;
B2、针对每一样本采样集进行数据处理获取适用于每一学习模型的训练样本;
B3、利用所述训练样本训练对应的学习模型并得到多个预先训练的弱学习器。
举例来说,本实施例选取XGBoost(以下简称Xgb)、LightGBM、SVM、线性回归(Linear regression)和KNN作为多个预先训练的弱学习器模型包括。
S1、获取历史行驶时间数据,将所述历史行驶时间数据直接映射得到第一预测结果SWL0;
举例来说,直接映射(Direct mapping)是将历史数据直接作为预测数据,例如即直接用6点到8点的路口A到收费站1的评价旅行时间作为8点值10点钟路口A到收费站1的平均旅行时间。
S2、利用多个预先训练的弱学习器获取多个第二预测结果SWLi;优选地,在步骤S2和S3之间还包括:利用公式1计算所述第一预测结果的平均绝对百分比误差MAPE0和每一所述第二预测结果的平均绝对百分比误差MAPEi;
公式1:
其中,R表示测试数据的路线数量,T表示测试数据的时间段数量,drt表示r路线t时间段的平均行驶时间,prt表示表示r路线t时间段的平均行驶时间。S3、利用所述第一预测结果SWL0筛选所述多个第二预先结果SWLi获取包含多个弱学习器模型的预测集合SWLj;
具体地,举例来说,S3中,包含多个弱学习器模型的预测集合SWLj中的每一个弱学习器模型的平均绝对百分比误差MAPEj均小于MAPE0。
举例来说,将直接映射得到的预测结果作为比较基石,仅在弱学习器的测结果的MAPE值小于直接映射得到的预测结果的MAPE值时才保留该模型即当单一模型比这个结果好是时,再考虑是否将那个模型纳入模型融合;如图3所示,仅SVM学习器和XGBoost学习器的MAPE小于直接映射得到的预测结果的MAPE值。
S4、利用预测集合SWLj中平均绝对误差百分比误差最小的两个弱学习器模型获取强学习器模型SLM,将预测集合SWLj中所述选取的两个弱学习器模型剔除,并将强学习器模型SLM作为新的弱学习模型增加至预测集合SWL,更新强学习器模型和预测集合SWLj;
具体地举例来说,利用公式2获取预测集合SWLj,并根据公式3更新预测集合SWLj;
公式2:WLj(i=1,2,...,J)=MAPEj;
公式3:SWLj=(j,WLj),j=1,2,...,J;
式中J表示模型中用到的机器学习模型数量,j表示对应的弱学习器,MAPEj表示第j个模型的平均绝对误差百分比误差。
举例来说,在本实施例中首先以SVM学习器和XGBoost学习器预测强学习器模型,并在将该强学习器模型作为新的弱学习器器与剩余的弱学习中MAPE值最小的弱学习进行再次融合更新强学习器模型。
在步骤S4中利用两个弱学习器模型构建强学习器模型SLM的方法包括:
A1、以预设迭代速率v调整每个弱学习器的权重比,得到多种权重比的强学习器模型;
A2、获取每一所述权重比的强学习器模型的平均绝对误差百分比误差,将平均绝对误差百分比误差最小时对应的强学习器模型作为最终的强学习器模型。具体地,如图4在本实施例中,以0.1为迭代速率,调整了XGBoost模型和SVM模的权重比;
S5、重复执行上述步骤S4直至强学习器模型SLM不再更新,利用最后一次更新的强学习器模型SLM作为高速匝道行驶时间的预测模型。
举例来说,在本实施例中,XGboost和SVM对高速匝道行驶时间进行融合预测,并且XGBoost所占比为7,SVM所占比为3,既最后用XGBoost模型预测的结果乘以0.7加上SVM预测结果乘以0.3为最终预测结果;通过多次调整和融合机器学习模型的权重比使得最终获取的模型具有更好的准确性,为实际高速匝道行驶时间的预测提供了准确的预测数据,具有较较佳的实用性。
仿真实施例
如图5所示,在本实施例中选用上述实施例构建的强学习器模型和前述的多个弱学习器分别对测试数据进行预测,并得到了每种方法的预测结果,通过结果可以看出针对测试数据和训练数据,SVM学习器和XGBoost表现出的预测效果不同,在不同的数据情况下,单一模型最优的可能不是同一个,但是融合后的模型比单一模型效果要好,总结起来就是模型融合能够增强预测模型的泛化能力,也能一定程度上提升预测的精度。
最后应说明的是:以上所述的各实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或全部技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (7)
1.一种基于多模型融合的高速匝道行驶时间预测方法,其特征在于,包括:
S1、获取历史行驶时间数据,将所述历史行驶时间数据直接映射得到第一预测结果SWL0;
S2、利用多个预先训练的弱学习器获取多个第二预测结果SWLi;
S3、利用所述第一预测结果SWL0筛选所述多个第二预先结果SWLi获取包含多个弱学习器模型的预测集合SWLj;
S4、利用预测集合SWLj中平均绝对误差百分比误差最小的两个弱学习器模型获取强学习器模型SLM,将预测集合SWLj中所述选取的两个弱学习器模型剔除,并将强学习器模型SLM作为新的弱学习模型增加至预测集合SWL,更新强学习器模型和预测集合SWLj;
S5、重复执行上述步骤S4直至强学习器模型SLM不再更新,利用最后一次更新的强学习器模型SLM作为高速匝道行驶时间的预测模型。
2.如权利要求1所述的方法,其特征在于,在步骤S2和S3之间还包括:利用公式一计算所述第一预测结果的平均绝对百分比误差MAPE0和每一所述第二预测结果的平均绝对百分比误差MAPEi;
公式一:
其中,R表示测试数据的路线数量,T表示测试数据的时间段数量,drt表示r路线t时间段的平均行驶时间,prt表示表示r路线t时间段的平均行驶时间。
3.如权利要求2所述的方法,其特征在于,在S3中,包含多个弱学习器模型的预测集合SWLj中的每一个弱学习器模型的平均绝对百分比误差MAPEj均小于MAPE0。
4.如权利要求3所述的方法,其特征在于,在步骤S4还包括:利用公式二获取预测集合SWLj,并根据公式三更新预测集合SWLj;
公式二:WLj(i=1,2,...,J)=MAPEj;
公式三:SWLj=(j,WLj),j=1,2,...,J;
式中J表示模型中用到的机器学习模型数量,j表示对应的弱学习器,MAPEj表示第j个模型的平均绝对误差百分比误差。
5.如权利要求4所述的方法,其特征在于,在步骤S4中利用两个弱学习器模型构建强学习器模型SLM的方法包括:
A1、以预设迭代速率v调整每个弱学习器的权重比,得到多种权重比的强学习器模型;
A2、获取每一所述权重比的强学习器模型的平均绝对误差百分比误差,将平均绝对误差百分比误差最小时对应的强学习器模型作为最终的强学习器模型SLM。
6.如权利要求5所述的方法,其特征在于,
所述多个预先训练的弱学习器模型包括XGBoost、LightGBM、SVM、线性回归和KNN中的至少两种。
7.如权利要求1-6任一所述的方法,其特征在于,步骤S1之前包括利用下述步骤获取多个预先训练的弱学习器:
B1、针对训练样本集利用自助采样法获取多个样本采样集;
B2、针对每一样本采样集进行数据处理获取适用于每一学习模型的训练样本;
B3、利用所述训练样本训练对应的学习模型并得到多个预先训练的弱学习器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910185609.3A CN109920249B (zh) | 2019-03-12 | 2019-03-12 | 一种基于多模型融合的高速匝道行驶时间预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910185609.3A CN109920249B (zh) | 2019-03-12 | 2019-03-12 | 一种基于多模型融合的高速匝道行驶时间预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109920249A true CN109920249A (zh) | 2019-06-21 |
CN109920249B CN109920249B (zh) | 2021-09-10 |
Family
ID=66964375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910185609.3A Expired - Fee Related CN109920249B (zh) | 2019-03-12 | 2019-03-12 | 一种基于多模型融合的高速匝道行驶时间预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109920249B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110782658A (zh) * | 2019-08-16 | 2020-02-11 | 华南理工大学 | 一种基于LightGBM算法的交通量预测方法 |
CN111399021A (zh) * | 2020-03-26 | 2020-07-10 | 桂林电子科技大学 | 一种导航定位方法 |
CN113345220A (zh) * | 2021-05-11 | 2021-09-03 | 山西省交通科技研发有限公司 | 一种高速公路稽查车辆跟踪与预测分析系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080027887A1 (en) * | 2006-07-27 | 2008-01-31 | The Government Of The Us, As Represented By The Secretary Of The Navy | System and method for fusing data from different information sources |
US9037519B2 (en) * | 2012-10-18 | 2015-05-19 | Enjoyor Company Limited | Urban traffic state detection based on support vector machine and multilayer perceptron |
CN105260805A (zh) * | 2015-11-16 | 2016-01-20 | 中南大学 | 一种基于异构分类器选择性融合的锑矿品位软测量方法 |
CN106971536A (zh) * | 2017-04-17 | 2017-07-21 | 武汉云砥信息科技有限公司 | 一种融合浮动车与路侧视频的高速公路拥堵状态检测方法 |
CN108417029A (zh) * | 2018-02-11 | 2018-08-17 | 东南大学 | 基于自适应多任务深度学习的城市路网行程时间估计方法 |
-
2019
- 2019-03-12 CN CN201910185609.3A patent/CN109920249B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080027887A1 (en) * | 2006-07-27 | 2008-01-31 | The Government Of The Us, As Represented By The Secretary Of The Navy | System and method for fusing data from different information sources |
US9037519B2 (en) * | 2012-10-18 | 2015-05-19 | Enjoyor Company Limited | Urban traffic state detection based on support vector machine and multilayer perceptron |
CN105260805A (zh) * | 2015-11-16 | 2016-01-20 | 中南大学 | 一种基于异构分类器选择性融合的锑矿品位软测量方法 |
CN106971536A (zh) * | 2017-04-17 | 2017-07-21 | 武汉云砥信息科技有限公司 | 一种融合浮动车与路侧视频的高速公路拥堵状态检测方法 |
CN108417029A (zh) * | 2018-02-11 | 2018-08-17 | 东南大学 | 基于自适应多任务深度学习的城市路网行程时间估计方法 |
Non-Patent Citations (3)
Title |
---|
张扬: "《城市路网交通预测模型研究及应用》", 《中国博士学位论文全文数据库工程科技Ⅱ辑》 * |
张文生,于廷照: "《Boosting算法理论与应用研究》", 《中国科学技术大学学报》 * |
柴明锐,万成祥: "《数据挖掘技术及在石油地质中的应用》", 31 December 2017 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110782658A (zh) * | 2019-08-16 | 2020-02-11 | 华南理工大学 | 一种基于LightGBM算法的交通量预测方法 |
CN111399021A (zh) * | 2020-03-26 | 2020-07-10 | 桂林电子科技大学 | 一种导航定位方法 |
CN113345220A (zh) * | 2021-05-11 | 2021-09-03 | 山西省交通科技研发有限公司 | 一种高速公路稽查车辆跟踪与预测分析系统 |
CN113345220B (zh) * | 2021-05-11 | 2022-08-16 | 山西省交通科技研发有限公司 | 一种高速公路稽查车辆跟踪与预测分析系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109920249B (zh) | 2021-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109947098A (zh) | 一种基于机器学习策略的距离优先最佳路径选择方法 | |
CN109920249A (zh) | 一种基于多模型融合的高速匝道行驶时间预测方法 | |
Reddy et al. | Solar resource estimation using artificial neural networks and comparison with other correlation models | |
CN106781489B (zh) | 一种基于递归神经网络的路网状态预测方法 | |
CN103150609B (zh) | 一种短时交通流量预测模型的建模方法 | |
CN109919370A (zh) | 一种电力负荷预测方法及预测装置 | |
CN110414719A (zh) | 一种基于多变量灰色模型时间序列的车流量预测方法 | |
CN108345958A (zh) | 一种订单出餐时间预测模型构建、预测方法、模型和装置 | |
CN110517485A (zh) | 一种基于时段划分的短时交通流预测方法 | |
CN108563837A (zh) | 一种冲积河流水沙模型的模型参数实时校正方法和系统 | |
CN114970377B (zh) | 基于新安江与深度学习耦合模型的场次洪水预报方法和系统 | |
CN107945534A (zh) | 一种基于gmdh神经网络的交通车流量预测方法 | |
CN109978284A (zh) | 一种基于混合神经网络模型的光伏发电功率分时预测方法 | |
ChikkaKrishna et al. | Short-term traffic prediction using fb-prophet and neural-prophet | |
Giudici et al. | Descriptive or normative: How does reservoir operations modeling influence hydrological simulations under climate change? | |
CN110501020A (zh) | 一种多目标三维路径规划方法 | |
Chu et al. | Optimization of the alinea ramp-metering control using genetic algorithm with micro-simulation | |
CN104993966B (zh) | 一种电力综合业务网流量预测方法 | |
CN109598052A (zh) | 基于相关系数分析的智能电表寿命周期预测方法及装置 | |
CN114969263A (zh) | 一种城市交通知识图谱的构建方法、构建装置及应用 | |
CN109190797A (zh) | 一种基于改进k最近邻的大规模路网状态短时预测方法 | |
CN109543911A (zh) | 一种日照辐射预测方法及系统 | |
CN110459050A (zh) | 一种基于混合决策树的短期公交客流预测方法 | |
Toledo et al. | Network model calibration studies | |
CN112098869A (zh) | 一种基于大数据的自适应电动汽车soc估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210910 |