CN109920249B - 一种基于多模型融合的高速匝道行驶时间预测方法 - Google Patents
一种基于多模型融合的高速匝道行驶时间预测方法 Download PDFInfo
- Publication number
- CN109920249B CN109920249B CN201910185609.3A CN201910185609A CN109920249B CN 109920249 B CN109920249 B CN 109920249B CN 201910185609 A CN201910185609 A CN 201910185609A CN 109920249 B CN109920249 B CN 109920249B
- Authority
- CN
- China
- Prior art keywords
- model
- prediction
- swl
- learner
- weak
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000004927 fusion Effects 0.000 title claims abstract description 16
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims abstract description 16
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims abstract description 16
- 238000013507 mapping Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 claims description 6
- 238000012417 linear regression Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于多模型融合的高速匝道行驶时间预测方法;S1、获取历史行驶时间数据,将历史行驶时间数据直接映射得到第一预测结果;S2、利用多个预先训练的弱学习器获取多个第二预测结果;S3、利用第一预测结果筛选多个第二预先结果获取预测集合;S4、利用预测集合中的MAPE值获取强学习器模型并更新预测集合和强学习器模型;S5、重复执行上述步骤S4;直至强学习器模型不再更新,利用最后一次更新的强学习器模型作为高速匝道行驶时间的预测模型;本发明方法能够对高速匝道的行驶时间进行预测,且得到的强学习器模型比任何单一模型的预测精度都高,得到的强学习器模型具有较佳的鲁棒性和泛化能力。
Description
技术领域
本发明涉及机器学习技术领域,尤其涉及一种基于多模型融合的高速匝道行驶时间预测方法。
背景技术
路段的行驶时间能够直观的反映道路拥挤程度。匝道行驶时间作为匝道控制策略优劣的重要评价指标,对其进行合理的预测,能够为匝道控制提供科学的数据支持。行驶时间的预测目前有很多种,比如参数模型有人工神经网络模型和卡尔曼滤波模型,他们都需要大量的标定参数。还有非参数模型,比如历史平均方法、KNN算法和非参数回归模型,这类算法应用就较为广泛,因为它们机制比较简单,且不需要设定大量参数。匝道的行驶时间属于短时行程,对于短时行程时间预测,已经有许多基于数据驱动的方法,其中KNN就比较常见,有许多人就在KNN的基础上进行一些改进来进行预测,比如Zhang L等人的一种改进的K近邻模型用于短期交通流预测,刘伟铭等人的基于PSO-LSSVM的高速公路短时行程时间预测。当然也有其他模型来进行短时行程时间的预测,比如基于SVM的城市快速路行程时间预测研究。
发明内容
(一)要解决的技术问题
针对现有单一预测模型参数设置复杂,且预测效果稳定性差和泛化能力不强的问题,本发明提供一种基于多模型融合的高速匝道行驶时间预测方法。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
S1、获取历史行驶时间数据,将所述历史行驶时间数据直接映射得到第一预测结果SWL0;
S2、利用多个预先训练的弱学习器获取多个第二预测结果SWLi;
S3、利用所述第一预测结果SWL0筛选所述多个第二预先结果SWLi获取包含多个弱学习器模型的预测集合SWLj;
S4、利用预测集合SWLj中平均绝对误差百分比误差最小的两个弱学习器模型获取强学习器模型SLM,将预测集合SWLj中所述选取的两个弱学习器模型剔除,并将强学习器模型SLM作为新的弱学习模型增加至预测集合SWL,更新强学习器模型和预测集合SWLj;
S5、重复执行上述步骤S4直至强学习器模型SLM不再更新,利用最后一次更新的强学习器模型SLM作为高速匝道行驶时间的预测模型。
可选地,在步骤S2和S3之间还包括:利用公式一计算所述第一预测结果的平均绝对百分比误差MAPE0和每一所述第二预测结果的平均绝对百分比误差MAPEi;
其中,R表示测试数据的路线数量,T表示测试数据的时间段数量,drt表示r路线t时间段的平均行驶时间,prt表示表示r路线t时间段的预测行驶时间。
可选地,在S3中,包含多个弱学习器模型的预测集合SWLj中的每一个弱学习器模型的平均绝对百分比误差MAPEj均小于MAPE0。
可选地,在步骤S4还包括:利用公式二获取预测集合SWLj,并根据公式三更新预测集合SWLj;
公式二:WLj(i=1,2,...,J)=MAPEj;
公式三:SWLj=(j,WLj),j=1,2,...,J;
式中J表示模型中用到的机器学习模型数量,j表示对应的弱学习器,MAPEj表示第j个模型的平均绝对误差百分比误差。
可选地,在步骤S4中利用两个弱学习器模型构建强学习器模型SLM的方法包括:
A1、以预设迭代速率v调整每个弱学习器的权重比,得到多种权重比的强学习器模型;
A2、获取每一所述权重比的强学习器模型的平均绝对误差百分比误差,将平均绝对误差百分比误差最小时对应的强学习器模型作为最终的强学习器模型SLM。
可选地,所述多个预先训练的弱学习器模型包括XGBoost、LightGBM、SVM、线性回归和KNN中的至少两种。
可选地,步骤S1之前包括利用下述步骤获取多个预先训练的弱学习器:
B1、针对训练样本集利用自助采样法获取多个样本采样集;
B2、针对每一样本采样集进行数据处理获取适用于每一学习模型的训练样本;
B3、利用所述训练样本训练对应的学习模型并得到多个预先训练的弱学习器。
(三)有益效果
本发明的有益效果是:本发明方法为高速匝道的形式时间预测提供了一种新思路,且获得的强学习器模型泛化能力强,且针对不同类型的数据预测结果较为稳定,具有较佳的鲁棒性;此本方法通过多次调整和融合机器学习模型的权重比使得最终获取的模型具有更好的准确性,为实际高速匝道行驶时间的预测提供了准确的预测数据,具有较较佳的实用性。
附图说明
图1为本发明一实施例提供能的一种基于多模型融合的高速匝道行驶时间预测方法流程图;
图2为本发明一实施例提供能的融合策略示意图;
图3为本发明一实施例提供的模型选择时各模型效果图;
图4为本发明一实施例提供的进行融合时模型比例选择图;
图5为本发明一实施例提供的应用融合模型的测试效果图。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
实施例
如图1所示,本实施例提供了一种基于多模型融合的高速匝道行驶时间预测方法,具体包括:
如图2所示,利用下述步骤获取多个预先训练的弱学习器:
B1、针对训练样本集利用自助采样法获取多个样本采样集;
B2、针对每一样本采样集进行数据处理获取适用于每一学习模型的训练样本;
B3、利用所述训练样本训练对应的学习模型并得到多个预先训练的弱学习器。
举例来说,本实施例选取XGBoost(以下简称Xgb)、LightGBM、SVM、线性回归(Linear regression)和KNN作为多个预先训练的弱学习器模型包括。
S1、获取历史行驶时间数据,将所述历史行驶时间数据直接映射得到第一预测结果SWL0;
举例来说,直接映射(Direct mapping)是将历史数据直接作为预测数据,例如即直接用6点到8点的路口A到收费站1的平均旅行时间作为8点值10点钟路口A到收费站1的平均旅行时间。
S2、利用多个预先训练的弱学习器获取多个第二预测结果SWLi;优选地,在步骤S2和S3之间还包括:利用公式1计算所述第一预测结果的平均绝对百分比误差MAPE0和每一所述第二预测结果的平均绝对百分比误差MAPEi;
其中,R表示测试数据的路线数量,T表示测试数据的时间段数量,drt表示r路线t时间段的平均行驶时间,prt表示表示r路线t时间段的预测行驶时间。S3、利用所述第一预测结果SWL0筛选所述多个第二预先结果SWLi获取包含多个弱学习器模型的预测集合SWLj;
具体地,举例来说,S3中,包含多个弱学习器模型的预测集合SWLj中的每一个弱学习器模型的平均绝对百分比误差MAPEj均小于MAPE0。
举例来说,将直接映射得到的预测结果作为比较基石,仅在弱学习器的测结果的MAPE值小于直接映射得到的预测结果的MAPE值时才保留该模型即当单一模型比这个结果好是时,再考虑是否将那个模型纳入模型融合;如图3所示,仅SVM学习器和XGBoost学习器的MAPE小于直接映射得到的预测结果的MAPE值。
S4、利用预测集合SWLj中平均绝对误差百分比误差最小的两个弱学习器模型获取强学习器模型SLM,将预测集合SWLj中所述选取的两个弱学习器模型剔除,并将强学习器模型SLM作为新的弱学习模型增加至预测集合SWL,更新强学习器模型和预测集合SWLj;
具体地举例来说,利用公式2获取预测集合SWLj,并根据公式3更新预测集合SWLj;
公式2:WLj(i=1,2,...,J)=MAPEj;
公式3:SWLj=(j,WLj),j=1,2,...,J;
式中J表示模型中用到的机器学习模型数量,j表示对应的弱学习器,MAPEj表示第j个模型的平均绝对误差百分比误差。
举例来说,在本实施例中首先以SVM学习器和XGBoost学习器预测强学习器模型,并在将该强学习器模型作为新的弱学习器器与剩余的弱学习中MAPE值最小的弱学习进行再次融合更新强学习器模型。
在步骤S4中利用两个弱学习器模型构建强学习器模型SLM的方法包括:
A1、以预设迭代速率v调整每个弱学习器的权重比,得到多种权重比的强学习器模型;
A2、获取每一所述权重比的强学习器模型的平均绝对误差百分比误差,将平均绝对误差百分比误差最小时对应的强学习器模型作为最终的强学习器模型。具体地,如图4在本实施例中,以0.1为迭代速率,调整了XGBoost模型和SVM模的权重比;
S5、重复执行上述步骤S4直至强学习器模型SLM不再更新,利用最后一次更新的强学习器模型SLM作为高速匝道行驶时间的预测模型。
举例来说,在本实施例中,XGboost和SVM对高速匝道行驶时间进行融合预测,并且XGBoost所占比为7,SVM所占比为3,既最后用XGBoost模型预测的结果乘以0.7加上SVM预测结果乘以0.3为最终预测结果;通过多次调整和融合机器学习模型的权重比使得最终获取的模型具有更好的准确性,为实际高速匝道行驶时间的预测提供了准确的预测数据,具有较较佳的实用性。
仿真实施例
如图5所示,在本实施例中选用上述实施例构建的强学习器模型和前述的多个弱学习器分别对测试数据进行预测,并得到了每种方法的预测结果,通过结果可以看出针对测试数据和训练数据,SVM学习器和XGBoost表现出的预测效果不同,在不同的数据情况下,单一模型最优的可能不是同一个,但是融合后的模型比单一模型效果要好,总结起来就是模型融合能够增强预测模型的泛化能力,也能一定程度上提升预测的精度。
最后应说明的是:以上所述的各实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或全部技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (7)
1.一种基于多模型融合的高速匝道行驶时间预测方法,其特征在于,包括:
S1、获取历史行驶时间数据,将所述历史行驶时间数据直接映射得到第一预测结果SWL0;
S2、利用多个预先训练的弱学习器获取多个第二预测结果SWLi;
S3、利用所述第一预测结果SWL0筛选所述多个第二预测结果SWLi获取包含多个弱学习器模型的预测集合SWLj;
S4、利用预测集合SWLj中平均绝对误差百分比误差最小的两个弱学习器模型获取强学习器模型SLM,将预测集合SWLj中所述选取的两个弱学习器模型剔除,并将强学习器模型SLM作为新的弱学习模型增加至预测集合SWLj,更新强学习器模型和预测集合SWLj;
S5、重复执行上述步骤S4直至强学习器模型SLM不再更新,利用最后一次更新的强学习器模型SLM作为高速匝道行驶时间的预测模型。
3.如权利要求2所述的方法,其特征在于,在S3中,包含多个弱学习器模型的预测集合SWLj中的每一个弱学习器模型的平均绝对百分比误差MAPEj均小于MAPE0。
4.如权利要求3所述的方法,其特征在于,在步骤S4还包括:利用公式二获取预测集合SWLj,并根据公式三更新预测集合SWLj;
公式二:WLj=MAPEj,j=1,2,...,J;
公式三:SWLj=(j,WLj),j=1,2,...,J;
式中J表示模型中用到的机器学习模型数量,j表示对应的弱学习器,MAPEj表示第j个模型的平均绝对误差百分比误差。
5.如权利要求4所述的方法,其特征在于,在步骤S4中利用两个弱学习器模型构建强学习器模型SLM的方法包括:
A1、以预设迭代速率v调整每个弱学习器的权重比,得到多种权重比的强学习器模型;
A2、获取每一所述权重比的强学习器模型的平均绝对误差百分比误差,将平均绝对误差百分比误差最小时对应的强学习器模型作为最终的强学习器模型SLM。
6.如权利要求5所述的方法,其特征在于,
所述多个预先训练的弱学习器模型包括XGBoost、LightGBM、SVM、线性回归和KNN中的至少两种。
7.如权利要求1-6任一所述的方法,其特征在于,步骤S1之前包括利用下述步骤获取多个预先训练的弱学习器:
B1、针对训练样本集利用自助采样法获取多个样本采样集;
B2、针对每一样本采样集进行数据处理获取适用于每一学习模型的训练样本;
B3、利用所述训练样本训练对应的学习模型并得到多个预先训练的弱学习器。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910185609.3A CN109920249B (zh) | 2019-03-12 | 2019-03-12 | 一种基于多模型融合的高速匝道行驶时间预测方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910185609.3A CN109920249B (zh) | 2019-03-12 | 2019-03-12 | 一种基于多模型融合的高速匝道行驶时间预测方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN109920249A CN109920249A (zh) | 2019-06-21 |
| CN109920249B true CN109920249B (zh) | 2021-09-10 |
Family
ID=66964375
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201910185609.3A Expired - Fee Related CN109920249B (zh) | 2019-03-12 | 2019-03-12 | 一种基于多模型融合的高速匝道行驶时间预测方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN109920249B (zh) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110782658B (zh) * | 2019-08-16 | 2022-03-29 | 华南理工大学 | 一种基于LightGBM算法的交通量预测方法 |
| CN111399021A (zh) * | 2020-03-26 | 2020-07-10 | 桂林电子科技大学 | 一种导航定位方法 |
| CN115188444A (zh) * | 2021-04-01 | 2022-10-14 | 北京顺源开华科技有限公司 | 目标运动项目完赛成绩的预测方法和装置 |
| CN113345220B (zh) * | 2021-05-11 | 2022-08-16 | 山西省交通科技研发有限公司 | 一种高速公路稽查车辆跟踪与预测分析系统 |
| CN114022021B (zh) * | 2021-11-16 | 2025-07-18 | 西安热工研究院有限公司 | 一种基于集成学习的在线机组负荷预测方法 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7668790B2 (en) * | 2006-07-27 | 2010-02-23 | The United States Of America As Represented By The Secretary Of The Navy | System and method for fusing data from different information sources with shared-sampling distribution based boosting |
| US9037519B2 (en) * | 2012-10-18 | 2015-05-19 | Enjoyor Company Limited | Urban traffic state detection based on support vector machine and multilayer perceptron |
| CN105260805B (zh) * | 2015-11-16 | 2018-10-23 | 中南大学 | 一种基于异构分类器选择性融合的锑矿品位软测量方法 |
| CN106971536A (zh) * | 2017-04-17 | 2017-07-21 | 武汉云砥信息科技有限公司 | 一种融合浮动车与路侧视频的高速公路拥堵状态检测方法 |
| CN108417029B (zh) * | 2018-02-11 | 2020-11-06 | 东南大学 | 基于自适应多任务深度学习的城市路网行程时间估计方法 |
-
2019
- 2019-03-12 CN CN201910185609.3A patent/CN109920249B/zh not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| CN109920249A (zh) | 2019-06-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN109920249B (zh) | 一种基于多模型融合的高速匝道行驶时间预测方法 | |
| EP3035314B1 (en) | A traffic data fusion system and the related method for providing a traffic state for a network of roads | |
| CN106781489B (zh) | 一种基于递归神经网络的路网状态预测方法 | |
| CN110164128A (zh) | 一种城市级智能交通仿真系统 | |
| CN110517492A (zh) | 基于平行集成学习的交通路径推荐方法、系统、装置 | |
| CN112365724A (zh) | 一种基于深度强化学习的连续交叉口信号协同控制方法 | |
| CN111553527B (zh) | 基于pso与神经网络串联优化的道路通行时间预测方法 | |
| CN112733996A (zh) | 基于GA-PSO优化XGBoost的水文时间序列预测方法 | |
| CN114970815A (zh) | 一种基于改进pso算法优化lstm的交通流预测方法及装置 | |
| CN114937366B (zh) | 一种基于多尺度交通需求与供给转化的交通流推算方法 | |
| CN110321361A (zh) | 基于改进的lstm神经网络模型的试题推荐判定方法 | |
| CN111126687B (zh) | 一种交通信号的单点离线优化系统及方法 | |
| CN111985619A (zh) | 一种基于短时交通流预测的城市单交叉口控制方法 | |
| CN110570672A (zh) | 一种基于图神经网络的区域交通信号灯控制方法 | |
| Zhu et al. | Integrating mesoscopic dynamic traffic assignment with agent-based travel behavior models for cumulative land development impact analysis | |
| CN103745602B (zh) | 一种基于滑窗平均的交通流量预测方法 | |
| CN112115754A (zh) | 基于烟花差分进化混合算法-极限学习机的短时交通流预测模型 | |
| CN116895158A (zh) | 一种基于多智能体Actor-Critic和GRU的城市大路网交通信号控制方法 | |
| CN108877224B (zh) | 一种可进行置信区间估计的短时交通流预测方法 | |
| Li et al. | A cooperative compliance control framework for socially optimal mixed traffic routing | |
| Jacob et al. | Integrated traffic corridor control using machine learning | |
| Treboux et al. | A predictive data-driven model for traffic-jams forecasting in smart santader city-scale testbed | |
| CN112797994A (zh) | 用于确定路线的预计到达时间的方法及相关装置和服务器 | |
| CN115293427A (zh) | 一种针对城市早高峰最优出行路线的规划方法及系统 | |
| CN114139836A (zh) | 基于重力学多层三维残差网络的城市od人流预测方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant | ||
| CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210910 |
|
| CF01 | Termination of patent right due to non-payment of annual fee |


