CN115578861A - 一种基于嵌入式特征选择策略的高速公路交通流预测方法 - Google Patents

一种基于嵌入式特征选择策略的高速公路交通流预测方法 Download PDF

Info

Publication number
CN115578861A
CN115578861A CN202211259399.6A CN202211259399A CN115578861A CN 115578861 A CN115578861 A CN 115578861A CN 202211259399 A CN202211259399 A CN 202211259399A CN 115578861 A CN115578861 A CN 115578861A
Authority
CN
China
Prior art keywords
target
time
feature
characteristic
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211259399.6A
Other languages
English (en)
Other versions
CN115578861B (zh
Inventor
张健
王博
熊壮
张海燕
钱品政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202211259399.6A priority Critical patent/CN115578861B/zh
Publication of CN115578861A publication Critical patent/CN115578861A/zh
Application granted granted Critical
Publication of CN115578861B publication Critical patent/CN115578861B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于嵌入式特征选择策略的高速公路交通流预测方法。该方法首先结合外部影响因素对数据集进行剔除与分割,生成初始时间特征集合;基于斯皮尔曼关联性系数法,过滤初始时间特征集合的冗余信息,结合嵌入式时间特征选择策略,获得近似最优时间特征子集;融合目标高速路网形成有效时间、车型等,基于最优时间特征子集,利用嵌入式空间特征选择策略,获得最优时空特征子集;进而结合神经网络构建高速公路目标场景最佳交通流预测模型。本发明能够进行精准的时空特征选择和高速公路路网交通流精准预测,对所选时空特征具有良好的可解释性和可读性,可以为高速公路营运管理工作提供数据支撑。

Description

一种基于嵌入式特征选择策略的高速公路交通流预测方法
技术领域
本发明属于特征工程技术领域,具体涉及一种基于嵌入式特征选择策略的高速公路交通流预测方法。
背景技术
在高速公路智能交通运营管理系统中,高速公路关键节点的交通流预测被认为是缓解交通堵塞和减少交通事故的不可替代的基础。利用交通预测信息提高高速公路的服务水平,对高速公路交通管理部门具有不可估量的价值。例如,高路公路交通管理部门可以利用交通流预测信息,动态调整出入口车辆通行以及车辆区域路线方案,为驾驶员提供最优路径规划策略。交通拥堵会导致交通延误且会增加额外的污染排放,准确的高路公路交通预测信息是大幅减少碳排放,发展低碳经济,构建高速公路智能交通管理系统的关键,可以有效避免城市交通拥堵。
既有的高速公路预测模型缺乏对模型输入集合质量提高开展实质性研究,输入集合数据质量参差不齐和体量过多,会增加高速公路交通流预测模型结构和参数的复杂性,导致整个高速公路交通流预测过程会过度消耗计算力和依赖于设备性能。既有的高速公路交通流预测模型无法在数据体量受到限制的条件下,将当前性能发挥到极致。另外,既有的高速公路预测模型缺乏对预测模型的可解释性,导致既有预测模型难以获取目标预测点和周边点位在时空维度上的关联性信息,无法对实际高速公路运营管理提供数据支撑。
发明内容
为解决上述技术问题,本发明提出一种基于嵌入式特征选择策略的高速公路交通流预测方法,能够进行精准的时空特征选择和高速公路路网交通流精准预测,对所选时空特征具有良好的可解释性和可读性,可以为高速公路营运管理工作提供数据支撑。
本发明采用以下技术方案:
一种基于嵌入式特征选择策略的高速公路交通流预测方法,针对目标高速公路区域,执行以下步骤,构建目标场景最佳车流量预测模型,由目标场景最佳车流量预测模型用于预测目标场景下目标高速公路区域上目标观测点在目标日期的目标时间段内各时间粒度的车流量:
步骤A:针对目标高速公路上预设各观测点在预设历史时长段内基于预设时间粒度采集的原始车流量数据,基于目标场景进行初步筛选更新,进而按照预设周期内各日期类型对预设历史时长段内的原始车流量数据进行划分,获得预设各观测点在各日期类型下分别对应的目标场景车流量数据集;
步骤B:针对预设各观测点在各日期类型下分别对应的目标场景车流量数据集,基于目标日期对应的目标日期类型、目标时间段、以及目标观测点,获取目标观测点在目标日期类型下对应的初始时间特征车流量数据集,进而利用嵌入式时间特征搜索策略获得最优时间特征子集;
步骤C:基于预设各观测点在各日期类型下分别对应的目标场景车流量数据集,结合最优时间特征子集,利用嵌入式空间特征搜索策略获得最优空间特征子集;
步骤D:基于最优时间特征子集与最优空间特征子集构成的最优时空特征子集,利用综合权重损失函数,构建并训练获得以目标观测点在目标日期的目标时间段内各时间粒度分别对应的最优时空特征子集为输入、目标观测点在目标日期的目标时间段内各时间粒度的车流量为输出的目标场景最佳车流量预测模型。
作为本发明的一种优选技术方案,所述步骤B中,利用具体步骤如下所述的嵌入式时间特征搜索策略,获得最优时间特征子集:
步骤B1:针对目标观测点在目标日期类型下对应的初始时间特征车流量数据集,以初始时间特征车流量数据集内每个日期为起点、预设个数连续日期为跨度进行分割,获得各初始时间特征集合单元,进而生成初始时间特征集合X:
X=[X1,X2,X3,…,Xu…,XU]T
Figure BDA0003890567820000021
式中,Xu表示第u个初始时间特征集合单元;U表示初始时间特征集合单元总数;d表示初始时间特征车流量数据集中的日期编号,d-1表示日期编号为d的前一日期编号;初始时间特征集合单元中最后一列为目标向量,其余每列均为关联向量,每列关联向量即对应一个候选时间特征;T表示转置标识符;t1至tw表示目标时间段下包含的各时间粒度;Sj表示目标观测点对应的观测点编号,e表示行车方向,
Figure BDA0003890567820000022
表示日期编号为d时在时间粒度tw下行车方向为e时目标观测点sj的实测车流量;
步骤B2:针对初始时间特征集合内各列关联向量,利用斯皮尔曼关联性系数法对各列关联向量进行剔除,进而基于关联系数从小到大的原则对各列关联向量进行第一次特征排序,即对各候选时间特征进行第一次排序,执行步骤B3;
步骤B3:针对初始时间特征集合内各列关联向量,利用K-medoids聚类方法获得各列关联向量到目标向量的聚类距离,按照聚类距离从大到小的原则,对各列关联向量进行第二次特征排序,即对各候选时间特征进行第二次排序,执行步骤B4;
步骤B4:基于第一次特征排序结合第二次特征排序,结合重排序准则对各候选时间特征进行重排序,获得强相关区间对应的各候选时间特征、中度相关区间对应的各候选时间特征、弱相关区间对应的各候选时间特征,执行步骤B5;
步骤B5:基于重排序后的各候选时间特征,结合目标神经网络对各候选时间特征进行筛选,筛选获得的各候选时间特征作为最优时间特征子集。
作为本发明的一种优选技术方案,所述步骤B2中,利用斯皮尔曼关联性系数法计算各列关联向量与目标向量的关联系数,并将关联系数小于0.3的关联向量剔除。
作为本发明的一种优选技术方案,所述步骤B4中,按照如下重排序准则,获得强相关区间对应的各候选时间特征、中度相关区间对应的各候选时间特征、弱相关区间对应的各候选时间特征:
(I)当时间特征对应的关联向量满足关联系数≥0.8并且聚类距离排序在前三分之一,则该时间特征属于强相关区间;
(II)当时间特征对应的关联向量满足关联系数≥0.3且<0.5并且聚类距离排序在后三分之一,则该时间特征属于弱相关区间;
(III)除强相关区间对应的各候选时间特征以及弱相关区间对应的各候选时间特征,剩余各候选时间特征属于中度相关区间。
作为本发明的一种优选技术方案,所述步骤B5中,基于重排序后的各候选时间特征,具体执行以下步骤,获得最优时间特征子集:
步骤B5.1:针对强相关区间对应的各候选时间特征,基于强相关区间内各候选时间特征排序从大到小,依次将每个候选时间特征迭代加入特征子集,在每次迭代中以特征子集为输入,特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值,直到强相关区间内各候选时间特征迭代完,迭代结束,将LSTM神经网络目标函数值最小时对应的特征子集作为第一阶段最优特征子集;
步骤B5.2:基于第一阶段最优特征子集,针对中相关区间对应的各候选时间特征,基于中度相关区间内各候选时间特征排序从大到小,依次将每个候选时间特征迭代加入第一阶段最优特征子集,在每次迭代中以第一阶段最优特征子集为输入,第一阶段最优特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值,直到中度相关区间内各候选时间特征迭代完或目标函数值大于预设阈值时,迭代结束,将LSTM神经网络目标函数值最小对应的第一阶段最优特征子集作为第二阶段最优特征子集;当目标函数值大于预设阈值时,不执行步骤B5.3,第二阶段最优特征子集作为最优时间特征子集;
步骤B5.3:基于第二阶段最优特征子集,针对弱相关区间对应的各候选时间特征,基于弱相关区间内各候选时间特征排序从大到小,依次将每个候选时间特征迭代加入第二阶段最优特征子集,在每次迭代中以第二阶段最优特征子集为输入,第二阶段最优特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值,直到弱相关区间内各列关联向量迭代完或目标函数值大于预设阈值时,迭代结束,将LSTM神经网络目标函数值最小对应的第二阶段最优特征子集作为最优时间特征子集。
作为本发明的一种优选技术方案,所述强相关区间内各候选时间特征、中度相关区间内各候选时间特征、以及弱相关区间内各候选时间特征的排序序号为时间特征在第一次特征排序中的序号与第二次特征排序中的序号的平均值。
作为本发明的一种优选技术方案,所述步骤C中,基于预设各观测点在各日期类型下分别对应的目标场景车流量数据集,结合最优时间特征子集,利用具体步骤如下所述的嵌入式空间特征搜索策略,获得最优空间特征子集:
步骤C1:针对预设各观测点在各日期类型下分别对应的目标场景车流量数据集,基于目标日期对应的日期类型、以及目标时间段,结合目标观测点,获取目标观测点对应的初始空间特征车流量数据集;针对目标观测点对应的初始空间特征车流量数据集,获得初始时间特征集合中各目标向量对应的各初始空间特征集合单元,进而生成各初始空间特征集合BX:
BX=[BX1,BX2,…,BXu,…,BXU]T
Figure BDA0003890567820000041
其中,
Figure BDA0003890567820000042
式中,U表示初始空间特征集合单元总数,与初始时间特征集合单元数量相同;BXu表示第u个初始空间特征集合单元,即初始时间特征集合中第u个初始时间特征集合单元目标向量对应的初始空间特征集合单元;初始空间特征集合单元中最后一列为标准化目标向量,其余每列均为空间关联向量,每列空间关联向量即对应一个候选空间特征;b表示空间排序等级,根据目标观测点所在主道路上基于行车方向在目标观测点之前各高速匝道出入口汇入车流量从大到小排序;
Figure BDA0003890567820000051
表示在时间粒度t下行车方向为e时空间排序等级为b的观测点编号为si的高速匝道出入口标准化车流量;
Figure BDA0003890567820000052
表示在时间段t下行车方向为e时空间排序等级为b的观测点编号为si的高速匝道出入口的实测车流量;
Figure BDA0003890567820000053
表示目标日期编号为d时在时间粒度tw下行车方向为e时在观测点sj的标准化车流量;L表示观测点编号为si的高速匝道出入口汇入目标观测点所在主道路上行车方向车道数,Cmax表示目标高速公路区域观测点编号为si的高速匝道出入口在行车方向的通行能力最大值,
Figure BDA0003890567820000054
表示目标高速公路区域观测点编号为si的高速匝道出入口在行车方向为e时原实际通行能力;tse表示起始观测点到目标观测点的有效行程时间,si表示起始观测点编号,即目标观测点所在主道路上各高速匝道的出入口对应的观测点编号;sj表示目标观测点编号;v表示车辆类型,V表示预设车辆类型总数;t-th表示预设时间粒度;pt表示时间段类型;
Figure BDA0003890567820000055
表示车辆类型为v的车辆在到达目标观测点时刻所对应的时间段类型pt下从起始观测点si到目标观测点sj所用时长;Q1表示基于车辆类型和时间段类型从起始观测点到目标观测点的预设时间数据集从小到大预设位置的数据信息,Q3表示基于车辆类型和时间段类型从起始观测点到目标观测点的预设时间数据集从小到大预设位置的数据信息;f(Q3-Q1)表示Q1到Q3之间时间数据的数量;
步骤C2:针对初始空间特征集合中的各候选空间特征,基于预设步长值对各候选空间特征分割,基于空间排序从小到大,将分割后第一个候选空间特征子集加入最优时间特征子集构成初步特征子集;以该初步特征子集为输入,该初步特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值,若满足目标函数值小于最优时间特征子集对应的目标函数值,则将当前初步特征子集中的空间特征子集作为最优空间特征子集,若不满足执行步骤C3;
步骤C3:基于剩余的各候选空间特征,迭代执行以下步骤,直到LSTM神经网络的目标函数值满足目标函数值要求或各候选空间特征迭代完,获得最优空间特征子集:
步骤C3.1:针对剩余的各候选空间特征,根据动态搜索规则对步长进行调整获得当前步长,基于当前步长对各初始空间特征集合单元中剩余的各候选空间特征进行分割,基于空间排序从小到大,将分割后各第一个候选空间特征子集加入初步特征子集,以该初步特征子集为输入,该初步特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值;
步骤C3.2:基于当前LSTM神经网络的目标函数值,若满足目标函数值小于最优时间特征子集对应的目标函数值,则将当前初步特征子集中的空间特征子集作为最优空间特征子集,若不满足返回步骤C3.1。
作为本发明的一种优选技术方案,所述步骤C2中,所述预设步长值So通过以下公式获得:
Figure BDA0003890567820000061
Figure BDA0003890567820000062
其中,Q表示初始空间向量总数,ρmax表示初始空间特征集合中各列空间关联向量与标准化目标向量斯皮尔曼关联系数的最大值;ρmin表示初始空间特征集合中各列空间关联向量与标准化目标向量斯皮尔曼关联系数的最小值;f(J)表示在关联性跨度下的候选空间特征数量,U表示平均关联性跨度。
作为本发明的一种优选技术方案,所述步骤C3.1中,所述动态搜索规则对步长进行调整获得当前步长,过程如下:
当前迭代前两相邻目标函数值之差为正时,步长保持不变;当前迭代前两相邻目标函数值之差为负时,步长调整为Umin;当前迭代前两相邻目标函数值之差为负且最后一个目标函数值小于最优时间特征子集对应的目标函数值时,步长调整为Umax
其中,Umin表示1至U的关联性跨度下候选空间特征数量的最小值,Umax表示1至U的关联性跨度下候选空间特征数量的最大值。
作为本发明的一种优选技术方案,所述步骤D中,所述综合权重损失函数如下:
Figure BDA0003890567820000063
其中,P表示样本数量,
Figure BDA0003890567820000064
表示目标高速公路区域内的目标观测点实际车流量观测值,
Figure BDA0003890567820000065
表示目标高速公路区域内的目标观测点预测值。
本发明的有益效果是:本发明提供了一种基于嵌入式特征选择策略的高速公路交通流预测方法,采用本发明可以为高速公路管理部门实现全天候、全方位的营运管理及发展上层应用业务提供精准的区域范围关键节点的车流量预测数据。利用基于嵌入式特征选择策略,可以有效的将模型训练环节与特征选择进行深度绑定,快速对冗余信息进行筛选,为目标模型提供高质量的数据输入集合。同时,利用模型的特征选择结果可以更好地有效挖掘路网不同时段车流量的时空关系耦合关系。在基于嵌入式时间特征选择策略的高速公路交通流预测方法中,可以有效弥补端到端学习模型解释性差的问题,且可以在数据样本集受到限制的情况下,将高速公路车流量预测精度变得更加准确和稳定。
附图说明
图1为本发明基于嵌入式特征选择策略的高速公路交通流预测整体框架图;
图2为本发明嵌入式时间特征选择策略流程图;
图3为本发明嵌入式空间特征选择策略流程图;
图4为本发明LSTM神经网络单元结构示意图。
具体实施方式
下面结合附图对本发明进行进一步说明。下面的实施例可使本专业技术人员更全面地理解本发明,但不以任何方式限制本发明。
本发明设计了一种基于嵌入式特征选择策略的高速公路交通流预测方法,该方法可以在数据样本集有限的情况下,结合高速公路流量预测外部影响因素,可以对包含台风、暴雨、节假日等干扰因素日期的数据进行剔除,即基于目标场景进行数据剔除,并对剩余所需目标场景日期的数据集进行分割,生成初始时间特征子集。基于斯皮尔曼关联性系数法,过滤初始时间特征子集的冗余信息,结合多阶段嵌入式时间特征选择策略,获得最优时间特征子集。融合目标高速路网形成有效时间、车型和出入口通行能力等干扰性因素,以选择的得到的最优时间特征子集作为空集,利用多阶段嵌入式空间特征选择策略,获得最优时空特征子集作为长短时循环神经网路(LSTM)的输入,结合考虑权重的绝对误差损失函数的输出结果,动态优化训练模型的结构和参数,得到高速公路目标场景最佳交通流预测模型。本发明提出一种基于嵌入式特征选择策略的高速公路交通流预测方法,能够进行精准的时空特征选择和高速公路路网交通流精准预测,对所选时空特征具有良好的可解释性和可读性,可以为高速公路营运管理工作提供数据支撑。
本实施例具体实施过程如下:一种基于嵌入式特征选择策略的高速公路交通流预测方法,针对目标高速公路区域,执行以下步骤,如图1所示,构建目标场景最佳车流量预测模型,由目标场景最佳车流量预测模型用于预测目标场景下目标高速公路区域上目标观测点在目标日期的目标时间段内各时间粒度的车流量:
步骤A:针对目标高速公路上预设各观测点在预设历史时长段内基于预设时间粒度采集的原始车流量数据,基于目标场景进行初步筛选更新,进而按照预设周期内各日期类型对预设历史时长段内的原始车流量数据进行划分,获得预设各观测点在各日期类型下分别对应的目标场景车流量数据集;本实施例中目标场景选用晴天的外部环境,排除包含台风、暴雨、节假日等干扰因素日期的数据;将预设周期设为一周即一个星期,则各日期类型为一个星期内的每一天为一个日期类型,预设时间粒度为15分钟。车流量数据可以通过高速公路ETC和MTC等感知设备采集。
步骤B:针对预设各观测点在各日期类型下分别对应的目标场景车流量数据集,基于目标日期对应的目标日期类型、目标时间段、以及目标观测点,获取目标观测点在目标日期类型下对应的初始时间特征车流量数据集,进而利用嵌入式时间特征搜索策略获得最优时间特征子集。
如图2所示,所述步骤B中,利用具体步骤如下所述的嵌入式时间特征搜索策略,获得最优时间特征子集:
步骤B1:针对目标观测点的初始时间特征车流量数据集,以初始时间特征车流量数据集内每个目标日期为起点、预设个数连续目标日期为跨度进行分割,获得各初始时间特征集合单元,进而生成初始时间特征集合X:
X=[X1,X2,X3,…,Xu…,XU]T
Figure BDA0003890567820000081
式中,Xu表示第u个初始时间特征集合单元,为各时间段车流量组成的时间特征矩阵;U表示初始时间特征集合单元总数;d表示初始时间特征车流量数据集中的日期编号,d-1表示日期编号为d的前一日期编号;初始时间特征集合单元中最后一列为目标向量,其余每列均为关联向量,每列关联向量即对应一个候选时间特征;T表示转置标识符;t1至tw表示目标时间段下包含的各时间粒度,即目时间段下每隔15分钟对应的时间粒度;t1-1表示时间粒度t1的前一时间粒度;Sj表示目标观测点对应的观测点编号,e表示行车方向,本方案中的车流量为单方向车流量,
Figure BDA0003890567820000082
表示日期编号为d时在时间粒度tw下行车方向为e时目标观测点sj的实测车流量。
步骤B2:针对初始时间特征集合内各列关联向量,利用斯皮尔曼关联性系数法对各列关联向量进行剔除,进而基于关联系数从小到大的原则对各列关联向量进行第一次特征排序,即对各候选时间特征进行第一次排序,执行步骤B3;
本实施例中利用斯皮尔曼关联性系数法计算各列关联向量与目标向量的关联系数,将关联系数小于0.3的关联向量剔除。利用斯皮尔曼关联性系数法(SCC)对所有初始时间特征集合单元中的候选时间特征进行冗余信息快速筛选处理;进而按照关联系数从小到大的原则,对关联系数0.3以上的所有相关时间特征向量进行特征排序。
步骤B3:针对初始时间特征集合内各列关联向量,利用K-medoids聚类方法获得各列关联向量到目标向量的聚类距离,按照聚类距离从大到小的原则,对各列关联向量进行第二次特征排序,即对各候选时间特征进行第二次排序,执行步骤B4。
步骤B4:基于第一次特征排序结合第二次特征排序,结合重排序准则对各候选时间特征进行重排序,获得强相关区间对应的各候选时间特征、中度相关区间对应的各候选时间特征、弱相关区间对应的各候选时间特征,执行步骤B5;
本实施例中,按照如下重排序准则,获得强相关区间对应的各候选时间特征、中度相关区间对应的各候选时间特征、弱相关区间对应的各候选时间特征:
(I)当时间特征对应的关联向量满足关联系数≥0.8并且聚类距离排序在前三分之一,则该时间特征属于强相关区间;
(II)当时间特征对应的关联向量满足关联系数≥0.3且<0.5并且聚类距离排序在后三分之一,则该时间特征属于弱相关区间;
(III)除强相关区间对应的各候选时间特征以及弱相关区间对应的各候选时间特征,剩余各候选时间特征属于中度相关区间。
所述强相关区间内各候选时间特征、中度相关区间内各候选时间特征、以及弱相关区间内各候选时间特征的排序序号为时间特征在第一次特征排序中的序号与第二次特征排序中的序号的平均值,默认其平均值对应的序号均不重复。
步骤B5:基于重排序后的各候选时间特征,结合目标神经网络对各候选时间特征进行筛选,筛选获得的各候选时间特征作为最优时间特征子集。
所述步骤B5中,基于重排序后的各候选时间特征,具体执行以下步骤,获得最优时间特征子集:
步骤B5.1:针对强相关区间对应的各候选时间特征,基于强相关区间内各候选时间特征排序从大到小,即基于关联性从大到小,依次将每个候选时间特征迭代加入特征子集,即每次迭代加入一个候选时间特征,初始特征子集为空集,在每次迭代中以特征子集为输入,特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值,直到强相关区间内各候选时间特征迭代完,迭代结束,将LSTM神经网络目标函数值最小时对应的特征子集作为第一阶段最优特征子集;
步骤B5.2:基于第一阶段最优特征子集,针对中相关区间对应的各候选时间特征,基于中度相关区间内各候选时间特征排序从大到小,依次将每个候选时间特征迭代加入第一阶段最优特征子集,在每次迭代中以第一阶段最优特征子集为输入,第一阶段最优特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值,直到中度相关区间内各候选时间特征迭代完或目标函数值大于预设阈值时,迭代结束,将LSTM神经网络目标函数值最小对应的第一阶段最优特征子集作为第二阶段最优特征子集;当目标函数值大于预设阈值时,不执行步骤B5.3,第二阶段最优特征子集作为最优时间特征子集;本实施例中预设阈值阈值为0.2;
步骤B5.3:基于第二阶段最优特征子集,针对弱相关区间对应的各候选时间特征,基于弱相关区间内各候选时间特征排序从大到小,依次将每个候选时间特征迭代加入第二阶段最优特征子集,在每次迭代中以第二阶段最优特征子集为输入,第二阶段最优特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值,直到弱相关区间内各列关联向量迭代完或目标函数值大于预设阈值时,迭代结束,将LSTM神经网络目标函数值最小对应的第二阶段最优特征子集作为最优时间特征子集;本实施例中预设阈值阈值为0.2。
在本实施例中,LSTM神经网络目标函数值通过以下公式计算:
Figure BDA0003890567820000101
其中,P表示样本数量,
Figure BDA0003890567820000102
表示目标高速公路区域内的目标观测点实际车流量观测值,
Figure BDA0003890567820000103
表示目标高速公路区域内的目标观测点预测值。
如图3所示,步骤C:基于预设各观测点在各日期类型下分别对应的目标场景车流量数据集,结合最优时间特征子集,利用嵌入式空间特征搜索策略获得最优空间特征子集;
所述步骤C中,基于预设各观测点在各日期类型下分别对应的目标场景车流量数据集,结合最优时间特征子集,利用具体步骤如下所述的嵌入式空间特征搜索策略,获得最优空间特征子集:
步骤C1:针对预设各观测点在各日期类型下分别对应的目标场景车流量数据集,基于目标日期对应的日期类型、以及目标时间段,结合目标观测点,融合目标高速路网形成有效时间、车型和出入口通行能力等干扰性因素,获取目标观测点对应的初始空间特征车流量数据集;针对目标观测点对应的初始空间特征车流量数据集,获得初始时间特征集合中各目标向量对应的各初始空间特征集合单元,进而生成各初始空间特征集合BX:
BX=[BX1,BX2,…,BXu,…,BXU]T
Figure BDA0003890567820000104
其中,根据牌识数据计算不同高速区间各类车辆有效行程时间,有效时间计算公式如下:
Figure BDA0003890567820000105
基于标准化通行能力对高速公路区域内的出入口车流量进行标准化,标准化计算公式如下:
Figure BDA0003890567820000111
式中,U表示初始空间特征集合单元总数,与初始时间特征集合单元数量相同;BXu表示第u个初始空间特征集合单元,即初始时间特征集合中第u个初始时间特征集合单元目标向量对应的初始空间特征集合单元;初始空间特征集合单元中最后一列为标准化目标向量,其计算过程与
Figure BDA0003890567820000112
相同,即
Figure BDA0003890567820000113
其余每列均为空间关联向量,每列空间关联向量即对应一个候选空间特征;b表示空间排序等级,根据目标观测点所在主道路上基于行车方向在目标观测点之前各高速匝道出入口汇入车流量从大到小排序;
Figure BDA0003890567820000114
表示在时间粒度t下行车方向为e时空间排序等级为b的观测点编号为si的高速匝道出入口标准化车流量;
Figure BDA0003890567820000115
表示在时间段t下行车方向为e时空间排序等级为b的观测点编号为si的高速匝道出入口的实测车流量;
Figure BDA0003890567820000116
表示日期编号为d时在时间粒度tw下行车方向为e时在观测点sj的实测车流量;
Figure BDA0003890567820000117
表示日期编号为d时在时间粒度tw下行车方向为e时在观测点sj的标准化车流量;L表示观测点编号为si的高速匝道出入口汇入目标观测点所在主道路上行车方向车道数;Cmax表示目标高速公路区域观测点编号为si的高速匝道出入口在行车方向的通行能力最大值,
Figure BDA0003890567820000118
表示目标高速公路区域观测点编号为si的高速匝道出入口在行车方向为e时原实际通行能力;tse表示起始观测点到目标观测点的有效行程时间,会基于不同起始观测点、以及预测的时间所在的时间段类型的不同而对应不同的有效行程时间,由上述公式中可以显而易见得出;si表示起始观测点编号,即目标观测点所在主道路上各高速匝道的出入口对应的观测点编号,本方案中各初始空间特征集合单元中每行的si是不同的观测点,是目标观测点所在主道路上基于行车方向在目标观测点之前各高速匝道出入口分别对应的各观测点,作为起始观测点,每行是对这些起始观测点进行空间排序;si表示目标观测点编号;v表示车辆类型,V表示预设车辆类型总数;t-th表示预设时间粒度;pt表示时间段类型,时间段类型为预测目标时间段所在时间为类型判断依据;
Figure BDA0003890567820000119
表示车辆类型为v的车辆在到达目标观测点时刻所对应的时间段类型pt下从起始观测点si到目标观测点sj所用时长;Q1表示基于车辆类型和时间段类型从起始观测点到目标观测点的预设时间数据集从小到大预设位置的数据信息,Q3表示基于车辆类型和时间段类型从起始观测点到目标观测点的预设时间数据集从小到大预设位置的数据信息,预设时间数据集是在该目标日期类型下历史时间段内各日期下的数据,不同车辆类型针对不同起始观测点分别有其对应的时间数据集;f(Q3-Q1)表示Q1到Q3之间时间数据的数量,预设时间数据集大小基于自定义采集的数据量。
本实施例中,初始空间特征集合单元中每行为针对需要预测的目标时间所在的时间类型,获得目标时间对应的车辆有效行程时间,进而基于目标时间往前推有效行程时间获得当时各高速匝道入口的车流量,进而基于该车流量从大到小进行排序,即获得空间排序等级;车辆类型包括三种小型车辆、中型车辆、大型车辆;pt表示时间段类型,即高峰:7:00am-9:00am和5:00pm-7:00pm以及其他时间段所构成的平峰;Q1预设位置为从小到大第25%位置,Q3预设位置为从小到大第75%位置,即剔除行车时间相对异常数据。
步骤C2:针对初始空间特征集合中的各候选空间特征,基于预设步长值对各候选空间特征分割,基于空间排序从小到大,将分割后第一个候选空间特征子集加入最优时间特征子集构成初步特征子集;以该初步特征子集为输入,该初步特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值,若满足目标函数值小于最优时间特征子集对应的目标函数值,则将当前初步特征子集中的空间特征子集作为最优空间特征子集,若不满足执行步骤C3;
所述步骤C2中,所述预设步长值So通过以下公式获得:
Figure BDA0003890567820000121
Figure BDA0003890567820000122
其中,Q表示初始空间向量总数,ρmax表示初始空间特征集合中各列空间关联向量与标准化目标向量斯皮尔曼关联系数的最大值;ρmin表示初始空间特征集合中各列空间关联向量与标准化目标向量斯皮尔曼关联系数的最小值;f(J)表示在关联性跨度下的候选空间特征数量,U表示平均关联性跨度。
步骤C3:基于剩余的各候选空间特征,迭代执行以下步骤,直到LSTM神经网络的目标函数值满足目标函数值要求或各候选空间特征迭代完,获得最优空间特征子集:
步骤C3.1:针对剩余的各候选空间特征,根据动态搜索规则对步长进行调整获得当前步长,基于当前步长对各初始空间特征集合单元中剩余的各候选空间特征进行分割,基于空间排序从小到大,将分割后各第一个候选空间特征子集加入初步特征子集,以该初步特征子集为输入,该初步特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值;
所述步骤C3.1中,所述动态搜索规则对步长进行调整获得当前步长,过程如下:
即为当前迭代前两相邻目标函数值之差为正时,步长保持不变;当前迭代前两相邻目标函数值之差为负时,步长调整为Umin;当前迭代前两相邻目标函数值之差为负且最后一个目标函数值小于最优时间特征子集对应的目标函数值时,步长调整为Umax;最优时间特征子集对应的目标函数值为初始目标函数值;
如在第一次迭代前,所对应的前两相邻目标函数值分别为步骤C3.1中获得的目标函数值和最优时间特征子集对应的目标函数值;在第二次迭代前所对应的前两相邻目标函数值分别为步骤C3.1中获得的目标函数值和第一次迭代获得的目标函数值;在第三次次迭代前所对应的前两相邻目标函数值分别为第两次迭代获得的两目标函数值,以此类推;
其中,Umin表示1至U的关联性跨度下候选空间特征数量的最小值,Umax表示1至U的关联性跨度下候选空间特征数量的最大值。
步骤C3.2:基于当前LSTM神经网络的目标函数值,若满足目标函数值小于最优时间特征子集对应的目标函数值,则将当前初步特征子集中的空间特征子集作为最优空间特征子集,若不满足返回步骤C3.1。
步骤D:基于最优时间特征子集与最优空间特征子集利用矩阵顺接拼接技术获得的最优时空特征子集,利用综合权重损失函数,构建并训练获得以目标观测点在目标日期的目标时间段内各时间粒度分别对应的最优时空特征子集为输入,目标观测点在目标日期的目标时间段内各时间粒度的车流量为输出的目标场景最佳车流量预测模型,进而由目标场景最佳车流量预测模型用于预测目标场景下目标高速公路区域上目标观测点在目标日期的目标时间段内各时间粒度的车流量。
如图4所示,采用LSTM模型对目标场景高速公路目标实验点的数据进行预测,其中Sigmoid表示S型函数,Tanh表示双曲正切激活函数,Xt为输入的信息,rt为遗忘信息,zt表示更新信息,
Figure BDA0003890567820000131
表示当前阶段保留的信息,St-1表示长期记忆的信息,St表示当前时刻输出的信息,所述步骤D中,利用综合权重损失函数来协同评估LSTM神经网络获得的嵌入式特征选择结果的优劣和模型预测值和实际值不一致性,所述综合权重损失函数如下:
Figure BDA0003890567820000132
其中,P表示样本数量,
Figure BDA0003890567820000133
表示目标高速公路区域内的目标观测点实际车流量观测值,
Figure BDA0003890567820000134
表示目标高速公路区域内的目标观测点预测值。WMAE值越小表示模型预测性能效果越好;结合预设迭代最大次数,将WMAE值最小对应的模型作为目标场景最佳车流量预测模型。
针对获得的以目标观测点在目标日期的目标时间段内各时间粒度分别对应的最优时空特征子集为输入,目标观测点在目标日期的目标时间段内各时间粒度的车流量为输出的目标场景最佳车流量预测模型,在应用时即基于本方案获得的最优时空特征子集,获得相应的模型输入数据,即可对目标观测点在目标日期的目标时间段内各时间粒度的车流量进行预测。
CAVs装备了雷达、摄像头等传感设备,这些可以帮助车辆探测、收集道路的状态信息。智能联网车辆可以通过车路之间的通信将交通状态信息转换为交通信号,从而减少用于建造传统传感设备方面的支出。在浅层深度学习中,特征选择是数据与模型之间的桥梁,是机器学习和浅层深度学习模型的关键环节之一,正确的特征可以减轻构建模型的难度,从而帮助浅层深度学习模型输出最佳的结果。合适的嵌入式特征选择策略,可以有效的将模型训练环节与特征选择进行深度绑定,快速对冗余信息进行筛选,为目标模型提供高质量的数据输入集合。同时,利用模型的特征选择结果可以更好地有效挖掘路网不同时段车流量的时空关系耦合关系。在基于嵌入式时间特征选择策略的高速公路交通流预测方法中,可以有效弥补端到端学习模型解释性差的问题,且可以在数据样本集受到限制的情况下,将高速公路车流量预测精度变得更加准确和稳定。本发明设计了一种基于嵌入式特征选择策略的高速公路交通流预测方法,采用本发明可以为高速公路管理部门实现全天候、全方位的营运管理及发展上层应用业务提供精准的区域范围关键节点的车流量预测数据。利用基于嵌入式特征选择策略,可以有效的将模型训练环节与特征选择进行深度绑定,快速对冗余信息进行筛选,为目标模型提供高质量的数据输入集合。同时,利用模型的特征选择结果可以更好地有效挖掘路网不同时段车流量的时空关系耦合关系。在基于嵌入式时间特征选择策略的高速公路交通流预测方法中,可以有效弥补端到端学习模型解释性差的问题,且可以在数据样本集受到限制的情况下,将高速公路车流量预测精度变得更加准确和稳定。
以上仅为本发明的较佳实施例,但并不限制本发明的专利范围,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本发明说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本发明专利保护范围之内。

Claims (10)

1.一种基于嵌入式特征选择策略的高速公路交通流预测方法,其特征在于,针对目标高速公路区域,执行以下步骤,构建目标场景最佳车流量预测模型,由目标场景最佳车流量预测模型用于预测目标场景下目标高速公路区域上目标观测点在目标日期的目标时间段内各时间粒度的车流量:
步骤A:针对目标高速公路上预设各观测点在预设历史时长段内基于预设时间粒度采集的原始车流量数据,基于目标场景进行初步筛选更新,进而按照预设周期内各日期类型对预设历史时长段内的原始车流量数据进行划分,获得预设各观测点在各日期类型下分别对应的目标场景车流量数据集;
步骤B:针对预设各观测点在各日期类型下分别对应的目标场景车流量数据集,基于目标日期对应的目标日期类型、目标时间段、以及目标观测点,获取目标观测点在目标日期类型下对应的初始时间特征车流量数据集,进而利用嵌入式时间特征搜索策略获得最优时间特征子集;
步骤C:基于预设各观测点在各日期类型下分别对应的目标场景车流量数据集,结合最优时间特征子集,利用嵌入式空间特征搜索策略获得最优空间特征子集;
步骤D:基于最优时间特征子集与最优空间特征子集构成的最优时空特征子集,利用综合权重损失函数,构建并训练获得以目标观测点在目标日期的目标时间段内各时间粒度分别对应的最优时空特征子集为输入、目标观测点在目标日期的目标时间段内各时间粒度的车流量为输出的目标场景最佳车流量预测模型。
2.根据权利要求1所述一种基于嵌入式特征选择策略的高速公路交通流预测方法,其特征在于,所述步骤B中,利用具体步骤如下所述的嵌入式时间特征搜索策略,获得最优时间特征子集:
步骤B1:针对目标观测点在目标日期类型下对应的初始时间特征车流量数据集,以初始时间特征车流量数据集内每个日期为起点、预设个数连续日期为跨度进行分割,获得各初始时间特征集合单元,进而生成初始时间特征集合X:
X=[X1,X2,X3,...,Xu...,XU]T
Figure FDA0003890567810000011
式中,Xu表示第u个初始时间特征集合单元;U表示初始时间特征集合单元总数;d表示初始时间特征车流量数据集中的日期编号,d-1表示日期编号为d的前一日期编号;初始时间特征集合单元中最后一列为目标向量,其余每列均为关联向量,每列关联向量即对应一个候选时间特征;T表示转置标识符;t1至tw表示目标时间段下包含的各时间粒度;Sj表示目标观测点对应的观测点编号,e表示行车方向,
Figure FDA0003890567810000021
表示日期编号为d时在时间粒度tw下行车方向为e时目标观测点sj的实测车流量;
步骤B2:针对初始时间特征集合内各列关联向量,利用斯皮尔曼关联性系数法对各列关联向量进行剔除,进而基于关联系数从小到大的原则对各列关联向量进行第一次特征排序,即对各候选时间特征进行第一次排序,执行步骤B3;
步骤B3:针对初始时间特征集合内各列关联向量,利用K-medoids聚类方法获得各列关联向量到目标向量的聚类距离,按照聚类距离从大到小的原则,对各列关联向量进行第二次特征排序,即对各候选时间特征进行第二次排序,执行步骤B4;
步骤B4:基于第一次特征排序结合第二次特征排序,结合重排序准则对各候选时间特征进行重排序,获得强相关区间对应的各候选时间特征、中度相关区间对应的各候选时间特征、弱相关区间对应的各候选时间特征,执行步骤B5;
步骤B5:基于重排序后的各候选时间特征,结合目标神经网络对各候选时间特征进行筛选,筛选获得的各候选时间特征作为最优时间特征子集。
3.根据权利要求2所述一种基于嵌入式特征选择策略的高速公路交通流预测方法,其特征在于,所述步骤B2中,利用斯皮尔曼关联性系数法计算各列关联向量与目标向量的关联系数,并将关联系数小于0.3的关联向量剔除。
4.根据权利要求2所述一种基于嵌入式特征选择策略的高速公路交通流预测方法,其特征在于,所述步骤B4中,按照如下重排序准则,获得强相关区间对应的各候选时间特征、中度相关区间对应的各候选时间特征、弱相关区间对应的各候选时间特征:
(I)当时间特征对应的关联向量满足关联系数≥0.8并且聚类距离排序在前三分之一,则该时间特征属于强相关区间;
(II)当时间特征对应的关联向量满足关联系数≥0.3且<0.5并且聚类距离排序在后三分之一,则该时间特征属于弱相关区间;
(III)除强相关区间对应的各候选时间特征以及弱相关区间对应的各候选时间特征,剩余各候选时间特征属于中度相关区间。
5.根据权利要求2所述一种基于嵌入式特征选择策略的高速公路交通流预测方法,其特征在于,所述步骤B5中,基于重排序后的各候选时间特征,具体执行以下步骤,获得最优时间特征子集:
步骤B5.1:针对强相关区间对应的各候选时间特征,基于强相关区间内各候选时间特征排序从大到小,依次将每个候选时间特征迭代加入特征子集,在每次迭代中以特征子集为输入,特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值,直到强相关区间内各候选时间特征迭代完,迭代结束,将LSTM神经网络目标函数值最小时对应的特征子集作为第一阶段最优特征子集;
步骤B5.2:基于第一阶段最优特征子集,针对中相关区间对应的各候选时间特征,基于中度相关区间内各候选时间特征排序从大到小,依次将每个候选时间特征迭代加入第一阶段最优特征子集,在每次迭代中以第一阶段最优特征子集为输入,第一阶段最优特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值,直到中度相关区间内各候选时间特征迭代完或目标函数值大于预设阈值时,迭代结束,将LSTM神经网络目标函数值最小对应的第一阶段最优特征子集作为第二阶段最优特征子集;当目标函数值大于预设阈值时,不执行步骤B5.3,第二阶段最优特征子集作为最优时间特征子集;
步骤B5.3:基于第二阶段最优特征子集,针对弱相关区间对应的各候选时间特征,基于弱相关区间内各候选时间特征排序从大到小,依次将每个候选时间特征迭代加入第二阶段最优特征子集,在每次迭代中以第二阶段最优特征子集为输入,第二阶段最优特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值,直到弱相关区间内各列关联向量迭代完或目标函数值大于预设阈值时,迭代结束,将LSTM神经网络目标函数值最小对应的第二阶段最优特征子集作为最优时间特征子集。
6.根据权利要求5所述一种基于嵌入式特征选择策略的高速公路交通流预测方法,其特征在于,所述强相关区间内各候选时间特征、中度相关区间内各候选时间特征、以及弱相关区间内各候选时间特征的排序序号为时间特征在第一次特征排序中的序号与第二次特征排序中的序号的平均值。
7.根据权利要求2所述一种基于嵌入式特征选择策略的高速公路交通流预测方法,其特征在于,所述步骤C中,基于预设各观测点在各日期类型下分别对应的目标场景车流量数据集,结合最优时间特征子集,利用具体步骤如下所述的嵌入式空间特征搜索策略,获得最优空间特征子集:
步骤C1:针对预设各观测点在各日期类型下分别对应的目标场景车流量数据集,基于目标日期对应的日期类型、以及目标时间段,结合目标观测点,获取目标观测点对应的初始空间特征车流量数据集;针对目标观测点对应的初始空间特征车流量数据集,获得初始时间特征集合中各目标向量对应的各初始空间特征集合单元,进而生成各初始空间特征集合BX:
BX=[BX1,BX2,...,BXu,...,BXU]T
Figure FDA0003890567810000041
其中,
Figure FDA0003890567810000042
式中,U表示初始空间特征集合单元总数,与初始时间特征集合单元数量相同;BXu表示第u个初始空间特征集合单元,即初始时间特征集合中第u个初始时间特征集合单元目标向量对应的初始空间特征集合单元;初始空间特征集合单元中最后一列为标准化目标向量,其余每列均为空间关联向量,每列空间关联向量即对应一个候选空间特征;b表示空间排序等级,根据目标观测点所在主道路上基于行车方向在目标观测点之前各高速匝道出入口汇入车流量从大到小排序;
Figure FDA0003890567810000043
表示在时间粒度t下行车方向为e时空间排序等级为b的观测点编号为si的高速匝道出入口标准化车流量;
Figure FDA0003890567810000044
表示在时间段t下行车方向为e时空间排序等级为b的观测点编号为si的高速匝道出入口的实测车流量;
Figure FDA0003890567810000045
表示目标日期编号为d时在时间粒度tw下行车方向为e时在观测点sj的标准化车流量;L表示观测点编号为si的高速匝道出入口汇入目标观测点所在主道路上行车方向车道数,Cmax表示目标高速公路区域观测点编号为si的高速匝道出入口在行车方向的通行能力最大值,
Figure FDA0003890567810000047
表示目标高速公路区域观测点编号为si的高速匝道出入口在行车方向为e时原实际通行能力;tse表示起始观测点到目标观测点的有效行程时间,si表示起始观测点编号,即目标观测点所在主道路上各高速匝道的出入口对应的观测点编号;sj表示目标观测点编号;v表示车辆类型,V表示预设车辆类型总数;t-th表示预设时间粒度;pt表示时间段类型;
Figure FDA0003890567810000046
表示车辆类型为v的车辆在到达目标观测点时刻所对应的时间段类型pt下从起始观测点si到目标观测点sj所用时长;Q1表示基于车辆类型和时间段类型从起始观测点到目标观测点的预设时间数据集从小到大预设位置的数据信息,Q3表示基于车辆类型和时间段类型从起始观测点到目标观测点的预设时间数据集从小到大预设位置的数据信息;f(Q3-Q1)表示Q1到Q3之间时间数据的数量;
步骤C2:针对初始空间特征集合中的各候选空间特征,基于预设步长值对各候选空间特征分割,基于空间排序从小到大,将分割后第一个候选空间特征子集加入最优时间特征子集构成初步特征子集;以该初步特征子集为输入,该初步特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值,若满足目标函数值小于最优时间特征子集对应的目标函数值,则将当前初步特征子集中的空间特征子集作为最优空间特征子集,若不满足执行步骤C3;
步骤C3:基于剩余的各候选空间特征,迭代执行以下步骤,直到LSTM神经网络的目标函数值满足目标函数值要求或各候选空间特征迭代完,获得最优空间特征子集:
步骤C3.1:针对剩余的各候选空间特征,根据动态搜索规则对步长进行调整获得当前步长,基于当前步长对各初始空间特征集合单元中剩余的各候选空间特征进行分割,基于空间排序从小到大,将分割后各第一个候选空间特征子集加入初步特征子集,以该初步特征子集为输入,该初步特征子集中关联向量对应的目标向量为输出,训练LSTM神经网络,获得LSTM神经网络的目标函数值;
步骤C3.2:基于当前LSTM神经网络的目标函数值,若满足目标函数值小于最优时间特征子集对应的目标函数值,则将当前初步特征子集中的空间特征子集作为最优空间特征子集,若不满足返回步骤C3.1。
8.根据权利要求7所述一种基于嵌入式特征选择策略的高速公路交通流预测方法,其特征在于,所述步骤C2中,所述预设步长值So通过以下公式获得:
Figure FDA0003890567810000051
Figure FDA0003890567810000052
其中,Q表示初始空间向量总数,ρmax表示初始空间特征集合中各列空间关联向量与标准化目标向量斯皮尔曼关联系数的最大值;ρmin表示初始空间特征集合中各列空间关联向量与标准化目标向量斯皮尔曼关联系数的最小值;f(J)表示在关联性跨度下的候选空间特征数量,U表示平均关联性跨度。
9.根据权利要求7所述一种基于嵌入式特征选择策略的高速公路交通流预测方法,其特征在于,所述步骤C3.1中,所述动态搜索规则对步长进行调整获得当前步长,过程如下:
当前迭代前两相邻目标函数值之差为正时,步长保持不变;当前迭代前两相邻目标函数值之差为负时,步长调整为Umin;当前迭代前两相邻目标函数值之差为负且最后一个目标函数值小于最优时间特征子集对应的目标函数值时,步长调整为Umax
其中,Umin表示1至U的关联性跨度下候选空间特征数量的最小值,Umax表示1至U的关联性跨度下候选空间特征数量的最大值。
10.根据权利要求1所述一种基于嵌入式特征选择策略的高速公路交通流预测方法,其特征在于,所述步骤D中,所述综合权重损失函数如下:
Figure FDA0003890567810000061
其中,P表示样本数量,
Figure FDA0003890567810000062
表示目标高速公路区域内的目标观测点实际车流量观测值,
Figure FDA0003890567810000063
表示目标高速公路区域内的目标观测点预测值。
CN202211259399.6A 2022-10-14 2022-10-14 一种基于嵌入式特征选择策略的高速公路交通流预测方法 Active CN115578861B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211259399.6A CN115578861B (zh) 2022-10-14 2022-10-14 一种基于嵌入式特征选择策略的高速公路交通流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211259399.6A CN115578861B (zh) 2022-10-14 2022-10-14 一种基于嵌入式特征选择策略的高速公路交通流预测方法

Publications (2)

Publication Number Publication Date
CN115578861A true CN115578861A (zh) 2023-01-06
CN115578861B CN115578861B (zh) 2023-10-10

Family

ID=84585516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211259399.6A Active CN115578861B (zh) 2022-10-14 2022-10-14 一种基于嵌入式特征选择策略的高速公路交通流预测方法

Country Status (1)

Country Link
CN (1) CN115578861B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160379486A1 (en) * 2015-03-24 2016-12-29 Donald Warren Taylor Apparatus and system to manage monitored vehicular flow rate
CN111540196A (zh) * 2020-03-25 2020-08-14 武汉纵横智慧城市股份有限公司 基于高点视频的车流量预警方法、设备、存储介质及装置
CN111695722A (zh) * 2020-05-13 2020-09-22 南京理工大学 一种城市轨道交通车站节假日短时客流预测方法
CN112418482A (zh) * 2020-10-26 2021-02-26 南京邮电大学 一种基于时间序列聚类的云计算能耗预测方法
CN113762595A (zh) * 2021-07-26 2021-12-07 清华大学 通行时间预测模型训练方法、通行时间预测方法及设备
EP3937079A1 (en) * 2020-07-09 2022-01-12 Beijing Tusen Weilai Technology Co., Ltd. Trajectory prediction method and device
CN114141028A (zh) * 2021-11-19 2022-03-04 哈尔滨工业大学(深圳) 智能红绿灯车流调控系统
CN114169649A (zh) * 2021-09-14 2022-03-11 浙江财经大学 一种基于时空数据嵌入的交通流量预测方法
CN114973678A (zh) * 2022-06-08 2022-08-30 广州航海学院 一种基于图注意力神经网络和时空大数据的交通预测方法
CN114999182A (zh) * 2022-05-25 2022-09-02 中国人民解放军国防科技大学 基于lstm回馈机制的车流量预测方法、装置及设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160379486A1 (en) * 2015-03-24 2016-12-29 Donald Warren Taylor Apparatus and system to manage monitored vehicular flow rate
CN111540196A (zh) * 2020-03-25 2020-08-14 武汉纵横智慧城市股份有限公司 基于高点视频的车流量预警方法、设备、存储介质及装置
CN111695722A (zh) * 2020-05-13 2020-09-22 南京理工大学 一种城市轨道交通车站节假日短时客流预测方法
EP3937079A1 (en) * 2020-07-09 2022-01-12 Beijing Tusen Weilai Technology Co., Ltd. Trajectory prediction method and device
CN112418482A (zh) * 2020-10-26 2021-02-26 南京邮电大学 一种基于时间序列聚类的云计算能耗预测方法
CN113762595A (zh) * 2021-07-26 2021-12-07 清华大学 通行时间预测模型训练方法、通行时间预测方法及设备
CN114169649A (zh) * 2021-09-14 2022-03-11 浙江财经大学 一种基于时空数据嵌入的交通流量预测方法
CN114141028A (zh) * 2021-11-19 2022-03-04 哈尔滨工业大学(深圳) 智能红绿灯车流调控系统
CN114999182A (zh) * 2022-05-25 2022-09-02 中国人民解放军国防科技大学 基于lstm回馈机制的车流量预测方法、装置及设备
CN114973678A (zh) * 2022-06-08 2022-08-30 广州航海学院 一种基于图注意力神经网络和时空大数据的交通预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邓向林;: "基于动态控制策略的交通控制系统的架构研究", 企业技术开发, no. 23 *

Also Published As

Publication number Publication date
CN115578861B (zh) 2023-10-10

Similar Documents

Publication Publication Date Title
CN110570651B (zh) 一种基于深度学习的路网交通态势预测方法及系统
CN109285346B (zh) 一种基于关键路段的城市路网交通状态预测方法
CN109658695B (zh) 一种多因素的短时交通流预测方法
CN109670277B (zh) 一种基于多模态数据融合与多模型集成的旅行时间预测方法
CN112863182B (zh) 基于迁移学习的跨模态数据预测方法
CN110390349A (zh) 基于XGBoost模型的公交车客流量预测建模方法
CN115409256B (zh) 基于行程时间预测的拥堵区避让的路径推荐方法
CN111489549B (zh) 一种基于历史行为画像的出行车辆路径选择方法
Wismans et al. Real time traffic models, decision support for traffic management
CN112766597A (zh) 公交客流预测方法及系统
CN115206092A (zh) 一种基于注意力机制的BiLSTM和LightGBM模型的交通预测方法
CN116913088A (zh) 一种用于高速公路的智能流量预测方法
CN110490365B (zh) 一种基于多源数据融合预测网约车订单量的方法
Li et al. Ridesplitting demand prediction via spatiotemporal multi-graph convolutional network
CN116542391B (zh) 一种基于大数据的城市区域客流量预测方法
CN116993391A (zh) 一种站点式共享单车系统使用需求预测方法
Provoost et al. Short term prediction of parking area states using real time data and machine learning techniques
CN115578861B (zh) 一种基于嵌入式特征选择策略的高速公路交通流预测方法
CN117275215A (zh) 一种基于图过程神经网络的城市道路拥堵时空预测方法
CN116386020A (zh) 多源数据融合的高速公路收费站出口流量预测方法及系统
CN112508225B (zh) 基于谱聚类算法的多细节交通小区划分方法及系统
CN115796030A (zh) 一种基于图卷积的交通流量预测方法
CN115565376A (zh) 融合graph2vec、双层LSTM的车辆行程时间预测方法及系统
CN116386317A (zh) 一种交通路口的车流量预测方法及装置
Waury et al. Assessing the accuracy benefits of on-the-fly trajectory selection in fine-grained travel-time estimation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant