CN116524712A - 融合时空关联数据的高速公路拥堵预测方法、系统及装置 - Google Patents
融合时空关联数据的高速公路拥堵预测方法、系统及装置 Download PDFInfo
- Publication number
- CN116524712A CN116524712A CN202310305710.4A CN202310305710A CN116524712A CN 116524712 A CN116524712 A CN 116524712A CN 202310305710 A CN202310305710 A CN 202310305710A CN 116524712 A CN116524712 A CN 116524712A
- Authority
- CN
- China
- Prior art keywords
- traffic
- data
- traffic state
- flow
- road section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 53
- 239000011159 matrix material Substances 0.000 claims abstract description 14
- 230000000694 effects Effects 0.000 claims abstract description 13
- 230000003595 spectral effect Effects 0.000 claims abstract description 11
- 238000011156 evaluation Methods 0.000 claims abstract description 10
- 238000010801 machine learning Methods 0.000 claims abstract description 8
- 230000007246 mechanism Effects 0.000 claims abstract description 6
- 238000012360 testing method Methods 0.000 claims description 14
- 238000007637 random forest analysis Methods 0.000 claims description 12
- 238000012706 support-vector machine Methods 0.000 claims description 12
- 238000007621 cluster analysis Methods 0.000 claims description 11
- 238000005259 measurement Methods 0.000 claims description 9
- 238000012358 sourcing Methods 0.000 claims description 8
- 238000011160 research Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 7
- 238000007635 classification algorithm Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 4
- 230000008439 repair process Effects 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 4
- 238000011161 development Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 2
- 230000004927 fusion Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000005457 optimization Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 3
- 210000004258 portal system Anatomy 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 9
- 238000007726 management method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 235000017715 Thymus pulegioides Nutrition 0.000 description 1
- 244000238515 Thymus pulegioides Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2323—Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/259—Fusion by voting
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0133—Traffic data processing for classifying traffic situation
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/052—Detecting movement of traffic to be counted or controlled with provision for determining speed or overspeed
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/065—Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Chemical & Material Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Discrete Mathematics (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种融合时空关联数据的高速公路拥堵预测方法。本发明利用高速公路门架系统数据和收费流水数据,计算交通流量、速度、q/C比等交通流特征参数,借助谱聚类算法对输入数据进行聚类分析,利用机器学习算法对聚类结果进行交通状态判别,并基于软投票机制对各算法进行融合,构建基于群智算法的交通状态分类决策模型,引入混淆矩阵获得评价指标对模型的判别效果进行定量评价,输入预测的未来交通流特征参数即可得到较高精度的路段未来的交通状态预测结果,进一步预判路段是否有发生拥堵的可能。本发明极大提高了高速公路运营与管理的效率,可广泛应用于解决高速公路交通拥堵问题。
Description
技术领域
本发明涉及高速公路运营和管理、人工智能-智能交通领域,尤其涉及融合时空关联数据的高速公路拥堵预测方法、系统及装置。
背景技术
高速公路推动我国经济发展发挥了极其重要的作用。近年来,交通出行需求迅猛增长,单纯依靠扩大路网建设规模不能有效解决交通供需不平衡、交通拥堵日益严重等问题,所以,如何在现有道路条件下实现高速公路高效运营和管理就成为一个亟待解决的问题。准确掌握高速公路交通状态是对其进行科学管理和决策的关键前提,也是进行路网诱导和交通控制的基本条件。
高速公路交通状态预测是高速公路的运营和管理的重要依据,是构建智能高速公路系统的重要环节。通过提供准确的交通状态信息和预测信息,可为管理部门制定交通管控措施(如事前预防措施、事后疏散策略等)提供科学决策依据,使其能合理、有效地诱导车辆通行,进而实现高速公路网的交通均衡分配,最大限度发挥现有道路的通行能力。通过发布实时、准确的交通状态及其未来趋势信息,交通出行者能够制定更加合理的出行决策方案,动态调整出行时间、出行路径和出行方式,提高出行稳定性和出行质量。
现有技术主要着眼于交通状态指标变量的短时预测方法研究,但现有交通流预测方法往往是以单个交通流参数为基础,且只考虑使用预测时段前几个时段的参数值作为特征,而忽略了多种交通流参数之间的内在相关性以及如天气、节假日等外部特征的影响。因此,在进行交通流参数预测时有必要综合考虑不同交通流参数间的内在关联性,引入更多特征因素,以进一步提高模型预测精度、稳定性和适用性。
现有技术更多将重点放在算法创新与改进上,但实际上,现有机器学习算法已经相对成熟,即使不对其进行创新与改进也能取得很好的判别效果,其最大问题是单一算法判别结果的稳定性无法保证,因为交通流具有不确定性,在针对不同时空条件下的交通流数据,分类算法的判别精度也存在动态变化。因此,有必要通过集成学习综合不同分类算法的优点,降低单一算法的随机误差,以进一步提高交通状态判别结果的稳定性(一种基于深度学习的高速公路交通拥堵预测方法(CN202211039892.7))。
发明内容
为至少一定程度上解决现有技术中存在的技术问题之一,本发明的目的在于提供一种融合时空关联数据的高速公路拥堵预测方法,利用高速公路门架系统数据和收费流水数据,计算交通流量、速度、q/C比等交通流特征参数,借助谱聚类算法对输入数据进行聚类分析,利用机器学习算法对聚类结果进行交通状态判别,并基于软投票机制对各算法进行融合,构建基于群智算法的交通状态分类决策模型,引入混淆矩阵获得评价指标对模型的判别效果进行定量评价,输入预测的未来交通流特征参数即可得到较高精度的路段未来的交通状态预测结果,进一步预判路段是否有发生拥堵的可能。
本发明的目的至少通过如下技术方案之一实现。
一种融合时空关联数据的高速公路拥堵预测方法,包括以下步骤:
S1、基于高速公路ETC龙门架采集的历史高速公路门架通行数据,获取路段交通流的基本特征参数数据,包括车流量、车辆平均行程速度、流量与通行能力的比值即q/C比
S2、为提高高速公路交通流运行数据状态标记可靠性,针对流量数据缺失问题,采用生成式对抗网络进行数据修补,针对车辆平均行程速度数据缺失问题,采用拉格朗日线性插值法进行数据修补;
S3、利用谱聚类算法对历史高速公路交通流的基本特征参数数据进行聚类分析,确定畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵五种交通状态的相对划分标准,最终得到由五个聚类簇组成的交通状态数据集;
S4、将聚类得到的交通状态数据集作为输入,利用随机森林(RF)、K最近邻(KNN)、支持向量机(SVM)、极致梯度提升(XGBoost)4种常用的机器学习算法对交通状态进行分类决策,并采用软投票机制对各算法进行融合,构建基于群智算法的高速公路交通状态分类决策模型;
S5、利用混淆矩阵对步骤S4中构建的分类决策模型的分类效果进行定量评价,若分类效果不满足用户要求,则重新调整模型参数、优化算法,直至分类效果满足判别需求为止,得到、训练好的分类决策模型;
S6、从高速公路门架实时通行数据中统计出流量数据,包括研究路段流量和上游路段流量,和时间特征数据(星期、时段、节假日等)作为输入,利用基于多特征XGBoost算法的路段流量预测模型得到路段未来时段的流量预测值,并计算出路段未来时段的q/C比;
S7、从高速公路门架实时通行数据中统计出目标路段的速度数据和步骤S6得到的路段流量预测值作为输入,利用基于TS-SVR算法的行程速度预测模型得到速度预测值;
S8、将路段流量预测值、行程速度预测值、q/C比预测值作为输入,依托步骤S5中的训练好的分类决策模型输出得到未来时段的交通状态所属类别,进而实现高速公路交通状态的有效预测,以判断路段是否有发生拥堵的可能。
进一步地,步骤S1中,对基于门架通行数据的车辆平均行程速度计算方法,包括:
其中,车辆先后经过门架A和门架B,表示门架A到门架B之间的车辆平均行程速度,N代表观测时间内通过的车辆数,ti,A表示车辆通过门架A的时刻,ti,B表示车辆通过门架B的时刻,d表示门架A和门架B之间的距离,可根据高速公路GIS路段信息,以及门架A和门架B的经纬度坐标计算得到。
进一步地,步骤S2中,使用最大最小标准化对高速公路流量数据进行归一化处理,具体如下:
其中,x为预处理后的流量数据;xreal表示原始流量数据;xmin为原始流量数据中的最小值;xmax为原始流量数据中的最大值。
进一步地,步骤S3中,选取流量、车辆平均行程速度、q/C比作为交通状态指标变量来划分不同交通状态,包括:
使用相对度量标准,不使用固定的指标值来划分交通状态等级,而是在充分考虑各影响因素后,利用路段实测交通流数据,动态描述特定时空下的路段交通状态,其基本思路是直接根据国际或者国内规定的服务等级数进行划分,或者合并现有标准的服务水平,用较少的等级来描述路段交通状态;为与国家技术标准规范保持一致,参考《城市交通状态评价规范》规定的服务等级数,将高速公路基本路段的交通状态划分为畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵五个等级,再利用聚类分析算法对不同时空条件下的历史交通流数据进行聚类分析,根据聚类结果确定不同交通状态的相对划分标准;
在交通状态判别中,交通流参数是最常用的度量指标,但应用时需要综合考虑各参数之间的内在关联性,不能使用单一的参数作为判别标准;
高德地图、百度地图等被广泛使用的应用软件对道路交通状态进行划分时,只考虑了速度指标,而忽略了如流量、占有率等其他指标,这显然是不全面的,因为同一速度值可能对应两种不同的交通状态,车辆同样是高速运行,但在“高速度+小流量”状态和“高速度+大流量”状态下行驶会让出行者心理感觉产生明显差异;而美国《道路通行能力手册》综合考虑了流量、速度、饱和度以及负荷系数多个指标来进行交通状态的划分,其中流量和速度指标直接反映了反映交通的需求量、出行者行驶的舒适度和灵活性,饱和度和负荷系数则有效反映了道路服务水平;与单一参数相比,利用多指标来度量交通状态显然更加全面;
综上,从实用角度考虑数据获取便利性的要求,选取流量、车辆平均行程速度、q/C比三参数综合表征高速公路交通状态。
进一步地,步骤S4中,基于群智算法构建新交通三参数的交通状态分类决策模型,包括:
参考前人研究并利用现有数据开展实验测试,选用随机森林(RF)、支持向量机(SVR)、K最近邻(KNN)、极端梯度提升算法(XGBoost)4种经典机器学习分类算法对交通流数据进行交通状态判别,并遵循软投票机制对各算法进行融合,构建一种基于群智算法的交通状态分类决策模型。通过有机结合聚类分析和分类决策的结果,提出一种基于谱聚类和群智算法的交通状态判别方法,该方法以目标路段的流量、车辆平均行程速度、q/C比作为输入,以交通状态所属类别作为输出。
进一步地,步骤S5中,所述由五个聚类簇组成的交通状态数据集包括指标变量和状态标签。
进一步地,步骤S5中,所述基于混淆矩阵的分类决策模型性能评价,包括:
为定量评价高速公路交通状态分类决策效果,引入混淆矩阵对分类决策模型准确性进行定量分析,交通状态混淆矩阵能直观反映实际交通状态与交通状态分类决策结果的分布情况,体现了分类决策模型的交通状态分类准确性;
混淆矩阵的每一列代表分类决策交通状态,每一列的总数表示预测为该交通状态的数据的数目;每一行代表实际交通状态,每一行的数据总数表示该交通状态的数据实例的数目。交通状态分为畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵五个标准;
在混淆矩阵中引入准确率、精确度、召回率和F度量4个评价指标从不同的角度对分类准确性进行刻画,其中njj表示实际交通状态与分类交通状态均为j={1,2,3,4,5}时的分类结果数量;
描述交通状态分类决策模型总体判别准确率Acc的公式为:其中P为测试集样本总数;
描述交通状态分类决策模型分类结果中分类正确的百分比精确度Prec的公式为:其中Pj为分类交通状态为j的测试集样本数;
描述每一类交通状态的判别正确率召回率Rec的公式为:其中Pj是指实际交通状态为j的测试集样本数;
描述分类决策模型的稳定性F度量的公式为:认为精确度和召回率的重要程度相同,二者权重均为1,其中Fj是指交通状态为j的实际交通状态的测试集样本数和分类交通状态为j的测试集样本数的调和均值。
进一步地,步骤S5中,所述调整模型参数、优化算法,包括:
采用随机抽样方法从所述交通状态数据集中抽取70%的数据作为训练集,30%作为测试集,将训练集输入到所构建的交通状态分类决策模型,即基于RF、KNN、SVM、XGBoost算法分别构建的4个基分类器,对模型进行训练学习、参数调优的过程中,KNN模型采用交叉验证法确定K值,RF、SVM、XGBoost模型均采用网格搜索法确定模型参数。
一种融合时空关联数据的高速公路拥堵预测系统,包括:
数据处理模块,用于对高速公路门架通行数据进行清洗处理,计算交通流基本特征参数数据,包括流量、速度、q/C比,并对数据进行预处理;
交通状态分类模块,用于确定畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵五种交通状态的相对划分标准,利用谱聚类算法对所述输入数据进行聚类分析,对交通状态进行分类决策,得到由五个聚类簇组成的包含指标变量和状态标签的交通状态数据集;
交通预测模块,用于将实时采集的高速公路交通流数据中提取出的路段流量、速度等指标变量值输入到训练好的路段流量预测模型和行程速度短时预测模型中,得到各路段未来的流量、速度、q/C比预测数据。
交通状态判别模块,基于群智算法的高速公路交通状态分类决策模型,将交通预测模块所得到的路段未来的流量、速度、q/C比预测数据作为输入,从而输出得到路段未来的交通状态预测情况以判断路段是否有发生拥堵的可能。
一种融合时空关联数据的高速公路拥堵预测装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现一种融合时空关联数据的高速公路拥堵预测方法。
本发明的有益效果是:
本发明利用谱聚类对交通状态确定相对划分标准,再利用分类决策模型实现高速公路交通状态的实时判别,基于谱聚类和群智算法的交通状态判别方法有效降低了单一分类算法的判别误差,进一步提高了分类决策模型的鲁棒性和泛化能力,能很好地对高速公路基本路段的交通状态进行判别。
本发明以海量的高速公路收费数据为研究对象,数据的准确性、可靠性为本发明的实施奠定了坚实的基础;
基于高速公路门架系统数据对影响路段流量的因素进行了分析,挖掘出上游路段流量、星期、时段、节假日四个新特征,在XGBoost算法的基础上引入新特征,进而建立了基于多特征XGBoost算法的路段流量短时预测模型;
针对行程速度预测问题,考虑到速度与流量的强相关性,特将流量预测与速度预测相结合,构建了基于TS-SVR算法的行程速度短时预测模型;
基于上述流量、速度预测模型,以流量、速度、q/C比新交通三参数为指标变量构建起一种全新的融合时空关联数据的高速公路拥堵预测方法;
本发明通过集成学习综合不同分类算法的优点,降低单一算法的随机误差,以进一步提高交通状态判别结果的稳定性,在进行交通流参数预测时应综合考虑不同交通流参数间的内在关联性,引入更多特征因素,相较于现有方法模型预测结果具有更高的预测精度、稳定性和适用性。
附图说明
为了更清楚地说明本发明实施例或者现有技术中的技术方案,下面对本发明实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员而言,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
图1是本发明实施例中一种融合时空关联数据的高速公路拥堵预测方法的实施流程图;
图2为本发明实施例中平均行程速度计算示意图;
图3为本发明实施例中交通状态预测效果评价指标示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
实施例:
如图1所示,本实施例提供一种融合时空关联数据的高速公路拥堵预测方法,包括以下步骤:
S1、选定大有园互通与莞深高速立交连接处-松山湖为研究路段,时间为2021年5月30日至6月5日,利用该路段预处理后的历史交通流数据,构建由路段流量、车辆平均行程速度、q/C比三参数组成的样本集;
在一个实施例中,对基于门架通行数据的车辆平均行程速度计算方法,如图2所示,包括:
其中,车辆先后经过门架A和门架B,表示门架A到门架B之间的车辆平均行程速度,N代表观测时间内通过的车辆数,ti,A表示车辆通过门架A的时刻,ti,B表示车辆通过门架B的时刻,d表示门架A和门架B之间的距离,可根据高速公路GIS路段信息,以及门架A和门架B的经纬度坐标计算得到。
S2、通过谱聚类算法对样本集数据进行聚类分析,确定高速公路五种交通状态的相对度量标准后,利用聚类得到的交通状态数据集训练分类决策模型并保存,在一个实施例中,聚类得到的交通状态数据样本量如表1所示;
表1各交通状态的样本量(大有园互通与莞深高速立交连接处-松山湖)
S3、将步骤S1清洗后的预测时段前10个星期的流量数据(研究路段流量和上游路段流量)和时间特征数据(星期、时段、节假日等)作为输入,基于多特征XGBoost模型预测路段流量并计算q/C比;
S4、将步骤S1清洗后的预测时段前10个星期的速度数据和步骤S3得到的路段流量预测值作为输入,利用TS-SVR模型预测速度;
S5、将路段流量预测值、车辆平均行程速度预测值、q/C比预测值作为输入,依托步骤S2中训练好的群智模型输出得到未来时段的交通状态所属类别,进而实现交通状态的有效预测。
在一个实施例中,分析表2和图3可知,本发明提出的一种融合时空关联数据的高速公路拥堵预测方法的整体预测精度高达92.86%。在不同交通状态下的该方法的预测精度均在80%以上,对于严重拥堵状态更是达到100%的预测精度,表明利用本方法来解决交通状态预测问题是可行的,且具有良好、稳定的预测效果。
表2多分类决策模型的性能评价指标聚类得到的交通状态数据集
本实施例的一种融合时空关联数据的高速公路拥堵预测系统,可执行本发明方法实施例所提供的一种融合时空关联数据的高速公路拥堵预测方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.一种融合时空关联数据的高速公路拥堵预测方法,其特征在于,包括以下步骤:
S1、基于高速公路ETC龙门架采集的历史高速公路门架通行数据,获取路段交通流的基本特征参数数据,包括车流量、车辆平均行程速度、流量与通行能力的比值即q/C比
S2、为提高高速公路交通流运行数据状态标记可靠性,针对流量数据缺失问题,采用生成式对抗网络进行数据修补,针对车辆平均行程速度数据缺失问题,采用拉格朗日线性插值法进行数据修补;
S3、利用谱聚类算法对历史高速公路交通流的基本特征参数数据进行聚类分析,确定畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵五种交通状态的相对划分标准,最终得到由五个聚类簇组成的交通状态数据集;
S4、将聚类得到的交通状态数据集作为输入,利用随机森林(RF)、K最近邻(KNN)、支持向量机(SVM)、极致梯度提升(XGBoost)4种机器学习算法对交通状态进行分类决策,并采用软投票机制对各算法进行融合,构建基于群智算法的高速公路交通状态分类决策模型;
S5、利用混淆矩阵对步骤S4中构建的分类决策模型的分类效果进行定量评价,若分类效果不满足用户要求,则重新调整模型参数、优化算法,直至分类效果满足判别需求为止,得到、训练好的分类决策模型;
S6、从高速公路门架实时通行数据中统计出流量数据,包括研究路段流量和上游路段流量,和时间特征数据作为输入,利用基于多特征XGBoost算法的路段流量预测模型得到路段未来时段的流量预测值,并计算出路段未来时段的q/C比;
S7、从高速公路门架实时通行数据中统计出目标路段的速度数据和步骤S6得到的路段流量预测值作为输入,利用基于TS-SVR算法的行程速度预测模型得到速度预测值;
S8、将路段流量预测值、行程速度预测值、q/C比预测值作为输入,依托步骤S5中的训练好的分类决策模型输出得到未来时段的交通状态所属类别,进而实现高速公路交通状态的有效预测,以判断路段是否有发生拥堵的可能。
2.根据权利要求1所述的一种融合时空关联数据的高速公路拥堵预测方法,其特征在于,步骤S1中,对基于门架通行数据的车辆平均行程速度计算方法,包括:
其中,车辆先后经过门架A和门架B,表示门架A到门架B之间的车辆平均行程速度,N代表观测时间内通过的车辆数,ti,A表示车辆通过门架A的时刻,ti,B表示车辆通过门架B的时刻,d表示门架A和门架B之间的距离,可根据高速公路GIS路段信息,以及门架A和门架B的经纬度坐标计算得到。
3.根据权利要求1所述的一种融合时空关联数据的高速公路拥堵预测方法,其特征在于,步骤S2中,使用最大最小标准化对高速公路流量数据进行归一化处理,具体如下:
其中,x为预处理后的流量数据;xreal表示原始流量数据;xmin为原始流量数据中的最小值;xmax为原始流量数据中的最大值。
4.根据权利要求1所述的一种融合时空关联数据的高速公路拥堵预测方法,其特征在于,步骤S3中,选取流量、车辆平均行程速度、q/C比作为交通状态指标变量来划分不同交通状态,包括:
使用相对度量标准,不使用固定的指标值来划分交通状态等级,而是在充分考虑各影响因素后,利用路段实测交通流数据,动态描述特定时空下的路段交通状态,其基本思路是直接根据国际或者国内规定的服务等级数进行划分,或者合并现有标准的服务水平,用较少的等级来描述路段交通状态;为与国家技术标准规范保持一致,参考《城市交通状态评价规范》规定的服务等级数,将高速公路基本路段的交通状态划分为畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵五个等级,再利用聚类分析算法对不同时空条件下的历史交通流数据进行聚类分析,根据聚类结果确定不同交通状态的相对划分标准;
在交通状态判别中,交通流参数是最常用的度量指标,但应用时需要综合考虑各参数之间的内在关联性,不能使用单一的参数作为判别标准;
高德地图、百度地图等被广泛使用的应用软件对道路交通状态进行划分时,只考虑了速度指标,而忽略了如流量、占有率等其他指标,这显然是不全面的,因为同一速度值可能对应两种不同的交通状态,车辆同样是高速运行,但在“高速度+小流量”状态和“高速度+大流量”状态下行驶会让出行者心理感觉产生明显差异;而美国《道路通行能力手册》综合考虑了流量、速度、饱和度以及负荷系数多个指标来进行交通状态的划分,其中流量和速度指标直接反映了反映交通的需求量、出行者行驶的舒适度和灵活性,饱和度和负荷系数则有效反映了道路服务水平;与单一参数相比,利用多指标来度量交通状态显然更加全面;
综上,从实用角度考虑数据获取便利性的要求,选取流量、车辆平均行程速度、q/C比三参数综合表征高速公路交通状态。
5.根据权利要求1所述的一种融合时空关联数据的高速公路拥堵预测方法,其特征在于,步骤S4中,基于群智算法构建新交通三参数的交通状态分类决策模型,包括:
参考前人研究并利用现有数据开展实验测试,选用随机森林(RF)、支持向量机(SVR)、K最近邻(KNN)、极端梯度提升算法(XGBoost)4种经典机器学习分类算法对交通流数据进行交通状态判别,并遵循软投票机制对各算法进行融合,构建一种基于群智算法的交通状态分类决策模型。通过有机结合聚类分析和分类决策的结果,提出一种基于谱聚类和群智算法的交通状态判别方法,该方法以目标路段的流量、车辆平均行程速度、q/C比作为输入,以交通状态所属类别作为输出。
6.根据权利要求1所述的一种融合时空关联数据的高速公路拥堵预测方法,其特征在于,步骤S5中,所述由五个聚类簇组成的交通状态数据集包括指标变量和状态标签。
7.根据权利要求1所述的一种融合时空关联数据的高速公路拥堵预测方法,其特征在于,步骤S5中,所述基于混淆矩阵的分类决策模型性能评价,包括:
为定量评价高速公路交通状态分类决策效果,引入混淆矩阵对分类决策模型准确性进行定量分析,交通状态混淆矩阵能直观反映实际交通状态与交通状态分类决策结果的分布情况,体现了分类决策模型的交通状态分类准确性;
混淆矩阵的每一列代表分类决策交通状态,每一列的总数表示预测为该交通状态的数据的数目;每一行代表实际交通状态,每一行的数据总数表示该交通状态的数据实例的数目。交通状态分为畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵五个标准;
在混淆矩阵中引入准确率、精确度、召回率和F度量4个评价指标从不同的角度对分类准确性进行刻画,其中njj表示实际交通状态与分类交通状态均为j={1,2,3,4,5}时的分类结果数量;
描述交通状态分类决策模型总体判别准确率Acc的公式为:其中P为测试集样本总数;
描述交通状态分类决策模型分类结果中分类正确的百分比精确度Prec的公式为:其中Pj为分类交通状态为j的测试集样本数;
描述每一类交通状态的判别正确率召回率Rec的公式为:其中Pj是指实际交通状态为j的测试集样本数;
描述分类决策模型的稳定性F度量的公式为:认为精确度和召回率的重要程度相同,二者权重均为1,其中Fj是指交通状态为j的实际交通状态的测试集样本数和分类交通状态为j的测试集样本数的调和均值。
8.根据权利要求1所述的一种融合时空关联数据的高速公路拥堵预测方法,其特征在于,步骤S5中,所述调整模型参数、优化算法,包括:
采用随机抽样方法从所述交通状态数据集中抽取70%的数据作为训练集,30%作为测试集,将训练集输入到所构建的交通状态分类决策模型,即基于RF、KNN、SVM、XGBoost算法分别构建的4个基分类器,对模型进行训练学习、参数调优的过程中,KNN模型采用交叉验证法确定K值,RF、SVM、XGBoost模型均采用网格搜索法确定模型参数。
9.一种融合时空关联数据的高速公路拥堵预测系统,其特征在于,包括:
数据处理模块,用于对高速公路门架通行数据进行清洗处理,计算交通流基本特征参数数据,包括流量、速度、q/C比,并对数据进行预处理;
交通状态分类模块,用于确定畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵五种交通状态的相对划分标准,利用谱聚类算法对所述输入数据进行聚类分析,对交通状态进行分类决策,得到由五个聚类簇组成的包含指标变量和状态标签的交通状态数据集;
交通预测模块,用于将实时采集的高速公路交通流数据中提取出的路段流量、速度等指标变量值输入到训练好的路段流量预测模型和行程速度短时预测模型中,得到各路段未来的流量、速度、q/C比预测数据。
交通状态判别模块,基于群智算法的高速公路交通状态分类决策模型,将交通预测模块所得到的路段未来的流量、速度、q/C比预测数据作为输入,从而输出得到路段未来的交通状态预测情况以判断路段是否有发生拥堵的可能。
10.一种融合时空关联数据的高速公路拥堵预测装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现权利要求1-8任一项所述的一种融合时空关联数据的高速公路拥堵预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310305710.4A CN116524712A (zh) | 2023-03-24 | 2023-03-24 | 融合时空关联数据的高速公路拥堵预测方法、系统及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310305710.4A CN116524712A (zh) | 2023-03-24 | 2023-03-24 | 融合时空关联数据的高速公路拥堵预测方法、系统及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116524712A true CN116524712A (zh) | 2023-08-01 |
Family
ID=87394823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310305710.4A Pending CN116524712A (zh) | 2023-03-24 | 2023-03-24 | 融合时空关联数据的高速公路拥堵预测方法、系统及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116524712A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116824860A (zh) * | 2023-08-22 | 2023-09-29 | 成都智达万应科技有限公司 | 一种城市智能交通的可视化显示方法、装置、设备及介质 |
CN117152973A (zh) * | 2023-10-27 | 2023-12-01 | 贵州宏信达高新科技有限责任公司 | 基于etc门架数据的高速公路实时流量监测方法及系统 |
CN117475240A (zh) * | 2023-12-26 | 2024-01-30 | 创思(广州)电子科技有限公司 | 基于图像识别的蔬菜核对方法及系统 |
CN117877273A (zh) * | 2024-03-12 | 2024-04-12 | 山东高速股份有限公司 | 基于空地信息融合的智慧高速交通状态判别方法及系统 |
CN118262509A (zh) * | 2024-02-26 | 2024-06-28 | 广东智视云控科技有限公司 | 城区非主干道路交通路线预测方法、系统及介质 |
-
2023
- 2023-03-24 CN CN202310305710.4A patent/CN116524712A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116824860A (zh) * | 2023-08-22 | 2023-09-29 | 成都智达万应科技有限公司 | 一种城市智能交通的可视化显示方法、装置、设备及介质 |
CN117152973A (zh) * | 2023-10-27 | 2023-12-01 | 贵州宏信达高新科技有限责任公司 | 基于etc门架数据的高速公路实时流量监测方法及系统 |
CN117152973B (zh) * | 2023-10-27 | 2024-01-05 | 贵州宏信达高新科技有限责任公司 | 基于etc门架数据的高速公路实时流量监测方法及系统 |
CN117475240A (zh) * | 2023-12-26 | 2024-01-30 | 创思(广州)电子科技有限公司 | 基于图像识别的蔬菜核对方法及系统 |
CN118262509A (zh) * | 2024-02-26 | 2024-06-28 | 广东智视云控科技有限公司 | 城区非主干道路交通路线预测方法、系统及介质 |
CN117877273A (zh) * | 2024-03-12 | 2024-04-12 | 山东高速股份有限公司 | 基于空地信息融合的智慧高速交通状态判别方法及系统 |
CN117877273B (zh) * | 2024-03-12 | 2024-05-10 | 山东高速股份有限公司 | 基于空地信息融合的智慧高速交通状态判别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116524712A (zh) | 融合时空关联数据的高速公路拥堵预测方法、系统及装置 | |
CN108109382B (zh) | 基于复合网络的拥堵点、拥堵线、拥堵区域的发现方法 | |
CN109376935B (zh) | 一种基于神经网络的公交客流分时段组合预测方法 | |
CN108364467A (zh) | 一种基于改进型决策树算法的路况信息预测方法 | |
CN105374209B (zh) | 一种城市区域路网运行状态特征信息提取方法 | |
CN116504076A (zh) | 基于etc门架数据的高速公路车流量预测方法 | |
CN101794507A (zh) | 基于浮动车数据的宏观路网交通状态评价方法 | |
Meng et al. | A two-stage short-term traffic flow prediction method based on AVL and AKNN techniques | |
CN101706996A (zh) | 一种基于信息融合的高速公路交通状态识别方法 | |
Lana et al. | Understanding daily mobility patterns in urban road networks using traffic flow analytics | |
CN107945510B (zh) | 一种考虑交通需求和道路网络运行效率的路段检测方法 | |
CN116681176B (zh) | 一种基于聚类和异构图神经网络的交通流预测方法 | |
CN106157624B (zh) | 基于交通定位数据的多粒度道路分流可视分析方法 | |
CN115691120A (zh) | 一种基于高速公路流水数据的拥堵识别方法及系统 | |
Gu et al. | [Retracted] Application of Fuzzy Decision Tree Algorithm Based on Mobile Computing in Sports Fitness Member Management | |
CN112149922A (zh) | 高速公路隧道下行线出入口区域事故严重程度预测方法 | |
CN115907822A (zh) | 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 | |
CN110674887A (zh) | 一种基于视频分类的端到端道路拥堵检测算法 | |
CN111260927B (zh) | 一种公路路网流量预测方法 | |
CN116739376A (zh) | 一种基于数据挖掘的公路路面预防性养护决策方法 | |
CN117542195A (zh) | 一种交通运行状态识别方法、装置、设备及介质 | |
CN116798223A (zh) | 基于宏观基本图/fcm聚类的子区划分及状态识别方法 | |
CN117475624A (zh) | 一种监测高速公路基本路段交通状态的里程桩布设方法 | |
CN110264725B (zh) | 路段流量的确定方法及装置 | |
CN110120154B (zh) | 大规模路网下利用检测器数据的交通路况预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |