CN115578861A

CN115578861A - 一种基于嵌入式特征选择策略的高速公路交通流预测方法

Info

Publication number: CN115578861A
Application number: CN202211259399.6A
Authority: CN
Inventors: 张健; 王博; 熊壮; 张海燕; 钱品政
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2022-10-14
Filing date: 2022-10-14
Publication date: 2023-01-06
Anticipated expiration: 2042-10-14
Also published as: CN115578861B

Abstract

本发明公开了一种基于嵌入式特征选择策略的高速公路交通流预测方法。该方法首先结合外部影响因素对数据集进行剔除与分割，生成初始时间特征集合；基于斯皮尔曼关联性系数法，过滤初始时间特征集合的冗余信息，结合嵌入式时间特征选择策略，获得近似最优时间特征子集；融合目标高速路网形成有效时间、车型等，基于最优时间特征子集，利用嵌入式空间特征选择策略，获得最优时空特征子集；进而结合神经网络构建高速公路目标场景最佳交通流预测模型。本发明能够进行精准的时空特征选择和高速公路路网交通流精准预测，对所选时空特征具有良好的可解释性和可读性，可以为高速公路营运管理工作提供数据支撑。

Description

一种基于嵌入式特征选择策略的高速公路交通流预测方法

技术领域

本发明属于特征工程技术领域，具体涉及一种基于嵌入式特征选择策略的高速公路交通流预测方法。

背景技术

在高速公路智能交通运营管理系统中，高速公路关键节点的交通流预测被认为是缓解交通堵塞和减少交通事故的不可替代的基础。利用交通预测信息提高高速公路的服务水平，对高速公路交通管理部门具有不可估量的价值。例如，高路公路交通管理部门可以利用交通流预测信息，动态调整出入口车辆通行以及车辆区域路线方案，为驾驶员提供最优路径规划策略。交通拥堵会导致交通延误且会增加额外的污染排放，准确的高路公路交通预测信息是大幅减少碳排放，发展低碳经济，构建高速公路智能交通管理系统的关键，可以有效避免城市交通拥堵。

既有的高速公路预测模型缺乏对模型输入集合质量提高开展实质性研究，输入集合数据质量参差不齐和体量过多，会增加高速公路交通流预测模型结构和参数的复杂性，导致整个高速公路交通流预测过程会过度消耗计算力和依赖于设备性能。既有的高速公路交通流预测模型无法在数据体量受到限制的条件下，将当前性能发挥到极致。另外，既有的高速公路预测模型缺乏对预测模型的可解释性，导致既有预测模型难以获取目标预测点和周边点位在时空维度上的关联性信息，无法对实际高速公路运营管理提供数据支撑。

发明内容

为解决上述技术问题，本发明提出一种基于嵌入式特征选择策略的高速公路交通流预测方法，能够进行精准的时空特征选择和高速公路路网交通流精准预测，对所选时空特征具有良好的可解释性和可读性，可以为高速公路营运管理工作提供数据支撑。

本发明采用以下技术方案：

一种基于嵌入式特征选择策略的高速公路交通流预测方法，针对目标高速公路区域，执行以下步骤，构建目标场景最佳车流量预测模型，由目标场景最佳车流量预测模型用于预测目标场景下目标高速公路区域上目标观测点在目标日期的目标时间段内各时间粒度的车流量：

步骤A：针对目标高速公路上预设各观测点在预设历史时长段内基于预设时间粒度采集的原始车流量数据，基于目标场景进行初步筛选更新，进而按照预设周期内各日期类型对预设历史时长段内的原始车流量数据进行划分，获得预设各观测点在各日期类型下分别对应的目标场景车流量数据集；

步骤B：针对预设各观测点在各日期类型下分别对应的目标场景车流量数据集，基于目标日期对应的目标日期类型、目标时间段、以及目标观测点，获取目标观测点在目标日期类型下对应的初始时间特征车流量数据集，进而利用嵌入式时间特征搜索策略获得最优时间特征子集；

步骤C：基于预设各观测点在各日期类型下分别对应的目标场景车流量数据集，结合最优时间特征子集，利用嵌入式空间特征搜索策略获得最优空间特征子集；

步骤D：基于最优时间特征子集与最优空间特征子集构成的最优时空特征子集，利用综合权重损失函数，构建并训练获得以目标观测点在目标日期的目标时间段内各时间粒度分别对应的最优时空特征子集为输入、目标观测点在目标日期的目标时间段内各时间粒度的车流量为输出的目标场景最佳车流量预测模型。

作为本发明的一种优选技术方案，所述步骤B中，利用具体步骤如下所述的嵌入式时间特征搜索策略，获得最优时间特征子集：

步骤B1：针对目标观测点在目标日期类型下对应的初始时间特征车流量数据集，以初始时间特征车流量数据集内每个日期为起点、预设个数连续日期为跨度进行分割，获得各初始时间特征集合单元，进而生成初始时间特征集合X：

X＝[X₁，X₂，X₃，…，X_u…，X_U]^T

式中，X_u表示第u个初始时间特征集合单元；U表示初始时间特征集合单元总数；d表示初始时间特征车流量数据集中的日期编号，d-1表示日期编号为d的前一日期编号；初始时间特征集合单元中最后一列为目标向量，其余每列均为关联向量，每列关联向量即对应一个候选时间特征；T表示转置标识符；t₁至t_w表示目标时间段下包含的各时间粒度；S_j表示目标观测点对应的观测点编号，e表示行车方向，

表示日期编号为d时在时间粒度t_w下行车方向为e时目标观测点s_j的实测车流量；

步骤B2：针对初始时间特征集合内各列关联向量，利用斯皮尔曼关联性系数法对各列关联向量进行剔除，进而基于关联系数从小到大的原则对各列关联向量进行第一次特征排序，即对各候选时间特征进行第一次排序，执行步骤B3；

步骤B3：针对初始时间特征集合内各列关联向量，利用K-medoids聚类方法获得各列关联向量到目标向量的聚类距离，按照聚类距离从大到小的原则，对各列关联向量进行第二次特征排序，即对各候选时间特征进行第二次排序，执行步骤B4；

步骤B4：基于第一次特征排序结合第二次特征排序，结合重排序准则对各候选时间特征进行重排序，获得强相关区间对应的各候选时间特征、中度相关区间对应的各候选时间特征、弱相关区间对应的各候选时间特征，执行步骤B5；

步骤B5：基于重排序后的各候选时间特征，结合目标神经网络对各候选时间特征进行筛选，筛选获得的各候选时间特征作为最优时间特征子集。

作为本发明的一种优选技术方案，所述步骤B2中，利用斯皮尔曼关联性系数法计算各列关联向量与目标向量的关联系数，并将关联系数小于0.3的关联向量剔除。

作为本发明的一种优选技术方案，所述步骤B4中，按照如下重排序准则，获得强相关区间对应的各候选时间特征、中度相关区间对应的各候选时间特征、弱相关区间对应的各候选时间特征：

(I)当时间特征对应的关联向量满足关联系数≥0.8并且聚类距离排序在前三分之一，则该时间特征属于强相关区间；

(II)当时间特征对应的关联向量满足关联系数≥0.3且＜0.5并且聚类距离排序在后三分之一，则该时间特征属于弱相关区间；

(III)除强相关区间对应的各候选时间特征以及弱相关区间对应的各候选时间特征，剩余各候选时间特征属于中度相关区间。

作为本发明的一种优选技术方案，所述步骤B5中，基于重排序后的各候选时间特征，具体执行以下步骤，获得最优时间特征子集：

步骤B5.1：针对强相关区间对应的各候选时间特征，基于强相关区间内各候选时间特征排序从大到小，依次将每个候选时间特征迭代加入特征子集，在每次迭代中以特征子集为输入，特征子集中关联向量对应的目标向量为输出，训练LSTM神经网络，获得LSTM神经网络的目标函数值，直到强相关区间内各候选时间特征迭代完，迭代结束，将LSTM神经网络目标函数值最小时对应的特征子集作为第一阶段最优特征子集；

步骤B5.2：基于第一阶段最优特征子集，针对中相关区间对应的各候选时间特征，基于中度相关区间内各候选时间特征排序从大到小，依次将每个候选时间特征迭代加入第一阶段最优特征子集，在每次迭代中以第一阶段最优特征子集为输入，第一阶段最优特征子集中关联向量对应的目标向量为输出，训练LSTM神经网络，获得LSTM神经网络的目标函数值，直到中度相关区间内各候选时间特征迭代完或目标函数值大于预设阈值时，迭代结束，将LSTM神经网络目标函数值最小对应的第一阶段最优特征子集作为第二阶段最优特征子集；当目标函数值大于预设阈值时，不执行步骤B5.3，第二阶段最优特征子集作为最优时间特征子集；

步骤B5.3：基于第二阶段最优特征子集，针对弱相关区间对应的各候选时间特征，基于弱相关区间内各候选时间特征排序从大到小，依次将每个候选时间特征迭代加入第二阶段最优特征子集，在每次迭代中以第二阶段最优特征子集为输入，第二阶段最优特征子集中关联向量对应的目标向量为输出，训练LSTM神经网络，获得LSTM神经网络的目标函数值，直到弱相关区间内各列关联向量迭代完或目标函数值大于预设阈值时，迭代结束，将LSTM神经网络目标函数值最小对应的第二阶段最优特征子集作为最优时间特征子集。

作为本发明的一种优选技术方案，所述强相关区间内各候选时间特征、中度相关区间内各候选时间特征、以及弱相关区间内各候选时间特征的排序序号为时间特征在第一次特征排序中的序号与第二次特征排序中的序号的平均值。

作为本发明的一种优选技术方案，所述步骤C中，基于预设各观测点在各日期类型下分别对应的目标场景车流量数据集，结合最优时间特征子集，利用具体步骤如下所述的嵌入式空间特征搜索策略，获得最优空间特征子集：

步骤C1：针对预设各观测点在各日期类型下分别对应的目标场景车流量数据集，基于目标日期对应的日期类型、以及目标时间段，结合目标观测点，获取目标观测点对应的初始空间特征车流量数据集；针对目标观测点对应的初始空间特征车流量数据集，获得初始时间特征集合中各目标向量对应的各初始空间特征集合单元，进而生成各初始空间特征集合BX：

BX＝[BX₁，BX₂，…，BX_u，…，BX_U]^T

其中，

式中，U表示初始空间特征集合单元总数，与初始时间特征集合单元数量相同；BX_u表示第u个初始空间特征集合单元，即初始时间特征集合中第u个初始时间特征集合单元目标向量对应的初始空间特征集合单元；初始空间特征集合单元中最后一列为标准化目标向量，其余每列均为空间关联向量，每列空间关联向量即对应一个候选空间特征；b表示空间排序等级，根据目标观测点所在主道路上基于行车方向在目标观测点之前各高速匝道出入口汇入车流量从大到小排序；

表示在时间粒度t下行车方向为e时空间排序等级为b的观测点编号为s_i的高速匝道出入口标准化车流量；

表示在时间段t下行车方向为e时空间排序等级为b的观测点编号为s_i的高速匝道出入口的实测车流量；

表示目标日期编号为d时在时间粒度t_w下行车方向为e时在观测点s_j的标准化车流量；L表示观测点编号为s_i的高速匝道出入口汇入目标观测点所在主道路上行车方向车道数，C_max表示目标高速公路区域观测点编号为s_i的高速匝道出入口在行车方向的通行能力最大值，

表示目标高速公路区域观测点编号为s_i的高速匝道出入口在行车方向为e时原实际通行能力；t_se表示起始观测点到目标观测点的有效行程时间，s_i表示起始观测点编号，即目标观测点所在主道路上各高速匝道的出入口对应的观测点编号；s_j表示目标观测点编号；v表示车辆类型，V表示预设车辆类型总数；t-th表示预设时间粒度；pt表示时间段类型；

表示车辆类型为v的车辆在到达目标观测点时刻所对应的时间段类型pt下从起始观测点s_i到目标观测点s_j所用时长；Q₁表示基于车辆类型和时间段类型从起始观测点到目标观测点的预设时间数据集从小到大预设位置的数据信息，Q₃表示基于车辆类型和时间段类型从起始观测点到目标观测点的预设时间数据集从小到大预设位置的数据信息；f(Q₃-Q₁)表示Q₁到Q₃之间时间数据的数量；

步骤C2：针对初始空间特征集合中的各候选空间特征，基于预设步长值对各候选空间特征分割，基于空间排序从小到大，将分割后第一个候选空间特征子集加入最优时间特征子集构成初步特征子集；以该初步特征子集为输入，该初步特征子集中关联向量对应的目标向量为输出，训练LSTM神经网络，获得LSTM神经网络的目标函数值，若满足目标函数值小于最优时间特征子集对应的目标函数值，则将当前初步特征子集中的空间特征子集作为最优空间特征子集，若不满足执行步骤C3；

步骤C3：基于剩余的各候选空间特征，迭代执行以下步骤，直到LSTM神经网络的目标函数值满足目标函数值要求或各候选空间特征迭代完，获得最优空间特征子集：

步骤C3.1：针对剩余的各候选空间特征，根据动态搜索规则对步长进行调整获得当前步长，基于当前步长对各初始空间特征集合单元中剩余的各候选空间特征进行分割，基于空间排序从小到大，将分割后各第一个候选空间特征子集加入初步特征子集，以该初步特征子集为输入，该初步特征子集中关联向量对应的目标向量为输出，训练LSTM神经网络，获得LSTM神经网络的目标函数值；

步骤C3.2：基于当前LSTM神经网络的目标函数值，若满足目标函数值小于最优时间特征子集对应的目标函数值，则将当前初步特征子集中的空间特征子集作为最优空间特征子集，若不满足返回步骤C3.1。

作为本发明的一种优选技术方案，所述步骤C2中，所述预设步长值S_o通过以下公式获得：

其中，Q表示初始空间向量总数，ρ_max表示初始空间特征集合中各列空间关联向量与标准化目标向量斯皮尔曼关联系数的最大值；ρ_min表示初始空间特征集合中各列空间关联向量与标准化目标向量斯皮尔曼关联系数的最小值；f(J)表示在关联性跨度下的候选空间特征数量，U表示平均关联性跨度。

作为本发明的一种优选技术方案，所述步骤C3.1中，所述动态搜索规则对步长进行调整获得当前步长，过程如下：

当前迭代前两相邻目标函数值之差为正时，步长保持不变；当前迭代前两相邻目标函数值之差为负时，步长调整为U_min；当前迭代前两相邻目标函数值之差为负且最后一个目标函数值小于最优时间特征子集对应的目标函数值时，步长调整为U_max；

其中，U_min表示1至U的关联性跨度下候选空间特征数量的最小值，U_max表示1至U的关联性跨度下候选空间特征数量的最大值。

作为本发明的一种优选技术方案，所述步骤D中，所述综合权重损失函数如下：

其中，P表示样本数量，

表示目标高速公路区域内的目标观测点实际车流量观测值，

表示目标高速公路区域内的目标观测点预测值。

本发明的有益效果是：本发明提供了一种基于嵌入式特征选择策略的高速公路交通流预测方法，采用本发明可以为高速公路管理部门实现全天候、全方位的营运管理及发展上层应用业务提供精准的区域范围关键节点的车流量预测数据。利用基于嵌入式特征选择策略，可以有效的将模型训练环节与特征选择进行深度绑定，快速对冗余信息进行筛选，为目标模型提供高质量的数据输入集合。同时，利用模型的特征选择结果可以更好地有效挖掘路网不同时段车流量的时空关系耦合关系。在基于嵌入式时间特征选择策略的高速公路交通流预测方法中，可以有效弥补端到端学习模型解释性差的问题，且可以在数据样本集受到限制的情况下，将高速公路车流量预测精度变得更加准确和稳定。

附图说明

图1为本发明基于嵌入式特征选择策略的高速公路交通流预测整体框架图；

图2为本发明嵌入式时间特征选择策略流程图；

图3为本发明嵌入式空间特征选择策略流程图；

图4为本发明LSTM神经网络单元结构示意图。

具体实施方式

下面结合附图对本发明进行进一步说明。下面的实施例可使本专业技术人员更全面地理解本发明，但不以任何方式限制本发明。

本发明设计了一种基于嵌入式特征选择策略的高速公路交通流预测方法，该方法可以在数据样本集有限的情况下，结合高速公路流量预测外部影响因素，可以对包含台风、暴雨、节假日等干扰因素日期的数据进行剔除，即基于目标场景进行数据剔除，并对剩余所需目标场景日期的数据集进行分割，生成初始时间特征子集。基于斯皮尔曼关联性系数法，过滤初始时间特征子集的冗余信息，结合多阶段嵌入式时间特征选择策略，获得最优时间特征子集。融合目标高速路网形成有效时间、车型和出入口通行能力等干扰性因素，以选择的得到的最优时间特征子集作为空集，利用多阶段嵌入式空间特征选择策略，获得最优时空特征子集作为长短时循环神经网路(LSTM)的输入，结合考虑权重的绝对误差损失函数的输出结果，动态优化训练模型的结构和参数，得到高速公路目标场景最佳交通流预测模型。本发明提出一种基于嵌入式特征选择策略的高速公路交通流预测方法，能够进行精准的时空特征选择和高速公路路网交通流精准预测，对所选时空特征具有良好的可解释性和可读性，可以为高速公路营运管理工作提供数据支撑。

本实施例具体实施过程如下：一种基于嵌入式特征选择策略的高速公路交通流预测方法，针对目标高速公路区域，执行以下步骤，如图1所示，构建目标场景最佳车流量预测模型，由目标场景最佳车流量预测模型用于预测目标场景下目标高速公路区域上目标观测点在目标日期的目标时间段内各时间粒度的车流量：

步骤A：针对目标高速公路上预设各观测点在预设历史时长段内基于预设时间粒度采集的原始车流量数据，基于目标场景进行初步筛选更新，进而按照预设周期内各日期类型对预设历史时长段内的原始车流量数据进行划分，获得预设各观测点在各日期类型下分别对应的目标场景车流量数据集；本实施例中目标场景选用晴天的外部环境，排除包含台风、暴雨、节假日等干扰因素日期的数据；将预设周期设为一周即一个星期，则各日期类型为一个星期内的每一天为一个日期类型，预设时间粒度为15分钟。车流量数据可以通过高速公路ETC和MTC等感知设备采集。

步骤B：针对预设各观测点在各日期类型下分别对应的目标场景车流量数据集，基于目标日期对应的目标日期类型、目标时间段、以及目标观测点，获取目标观测点在目标日期类型下对应的初始时间特征车流量数据集，进而利用嵌入式时间特征搜索策略获得最优时间特征子集。

如图2所示，所述步骤B中，利用具体步骤如下所述的嵌入式时间特征搜索策略，获得最优时间特征子集：

步骤B1：针对目标观测点的初始时间特征车流量数据集，以初始时间特征车流量数据集内每个目标日期为起点、预设个数连续目标日期为跨度进行分割，获得各初始时间特征集合单元，进而生成初始时间特征集合X：

X＝[X₁，X₂，X₃，…，X_u…，X_U]^T

式中，X_u表示第u个初始时间特征集合单元，为各时间段车流量组成的时间特征矩阵；U表示初始时间特征集合单元总数；d表示初始时间特征车流量数据集中的日期编号，d-1表示日期编号为d的前一日期编号；初始时间特征集合单元中最后一列为目标向量，其余每列均为关联向量，每列关联向量即对应一个候选时间特征；T表示转置标识符；t₁至t_w表示目标时间段下包含的各时间粒度，即目时间段下每隔15分钟对应的时间粒度；t₁-1表示时间粒度t₁的前一时间粒度；S_j表示目标观测点对应的观测点编号，e表示行车方向，本方案中的车流量为单方向车流量，

表示日期编号为d时在时间粒度t_w下行车方向为e时目标观测点s_j的实测车流量。

本实施例中利用斯皮尔曼关联性系数法计算各列关联向量与目标向量的关联系数，将关联系数小于0.3的关联向量剔除。利用斯皮尔曼关联性系数法(SCC)对所有初始时间特征集合单元中的候选时间特征进行冗余信息快速筛选处理；进而按照关联系数从小到大的原则，对关联系数0.3以上的所有相关时间特征向量进行特征排序。

步骤B3：针对初始时间特征集合内各列关联向量，利用K-medoids聚类方法获得各列关联向量到目标向量的聚类距离，按照聚类距离从大到小的原则，对各列关联向量进行第二次特征排序，即对各候选时间特征进行第二次排序，执行步骤B4。

本实施例中，按照如下重排序准则，获得强相关区间对应的各候选时间特征、中度相关区间对应的各候选时间特征、弱相关区间对应的各候选时间特征：

所述强相关区间内各候选时间特征、中度相关区间内各候选时间特征、以及弱相关区间内各候选时间特征的排序序号为时间特征在第一次特征排序中的序号与第二次特征排序中的序号的平均值，默认其平均值对应的序号均不重复。

所述步骤B5中，基于重排序后的各候选时间特征，具体执行以下步骤，获得最优时间特征子集：

步骤B5.1：针对强相关区间对应的各候选时间特征，基于强相关区间内各候选时间特征排序从大到小，即基于关联性从大到小，依次将每个候选时间特征迭代加入特征子集，即每次迭代加入一个候选时间特征，初始特征子集为空集，在每次迭代中以特征子集为输入，特征子集中关联向量对应的目标向量为输出，训练LSTM神经网络，获得LSTM神经网络的目标函数值，直到强相关区间内各候选时间特征迭代完，迭代结束，将LSTM神经网络目标函数值最小时对应的特征子集作为第一阶段最优特征子集；

步骤B5.2：基于第一阶段最优特征子集，针对中相关区间对应的各候选时间特征，基于中度相关区间内各候选时间特征排序从大到小，依次将每个候选时间特征迭代加入第一阶段最优特征子集，在每次迭代中以第一阶段最优特征子集为输入，第一阶段最优特征子集中关联向量对应的目标向量为输出，训练LSTM神经网络，获得LSTM神经网络的目标函数值，直到中度相关区间内各候选时间特征迭代完或目标函数值大于预设阈值时，迭代结束，将LSTM神经网络目标函数值最小对应的第一阶段最优特征子集作为第二阶段最优特征子集；当目标函数值大于预设阈值时，不执行步骤B5.3，第二阶段最优特征子集作为最优时间特征子集；本实施例中预设阈值阈值为0.2；

步骤B5.3：基于第二阶段最优特征子集，针对弱相关区间对应的各候选时间特征，基于弱相关区间内各候选时间特征排序从大到小，依次将每个候选时间特征迭代加入第二阶段最优特征子集，在每次迭代中以第二阶段最优特征子集为输入，第二阶段最优特征子集中关联向量对应的目标向量为输出，训练LSTM神经网络，获得LSTM神经网络的目标函数值，直到弱相关区间内各列关联向量迭代完或目标函数值大于预设阈值时，迭代结束，将LSTM神经网络目标函数值最小对应的第二阶段最优特征子集作为最优时间特征子集；本实施例中预设阈值阈值为0.2。

在本实施例中，LSTM神经网络目标函数值通过以下公式计算：

其中，P表示样本数量，

表示目标高速公路区域内的目标观测点实际车流量观测值，

表示目标高速公路区域内的目标观测点预测值。

如图3所示，步骤C：基于预设各观测点在各日期类型下分别对应的目标场景车流量数据集，结合最优时间特征子集，利用嵌入式空间特征搜索策略获得最优空间特征子集；

所述步骤C中，基于预设各观测点在各日期类型下分别对应的目标场景车流量数据集，结合最优时间特征子集，利用具体步骤如下所述的嵌入式空间特征搜索策略，获得最优空间特征子集：

步骤C1：针对预设各观测点在各日期类型下分别对应的目标场景车流量数据集，基于目标日期对应的日期类型、以及目标时间段，结合目标观测点，融合目标高速路网形成有效时间、车型和出入口通行能力等干扰性因素，获取目标观测点对应的初始空间特征车流量数据集；针对目标观测点对应的初始空间特征车流量数据集，获得初始时间特征集合中各目标向量对应的各初始空间特征集合单元，进而生成各初始空间特征集合BX：

BX＝[BX₁，BX₂，…，BX_u，…，BX_U]^T

其中，根据牌识数据计算不同高速区间各类车辆有效行程时间，有效时间计算公式如下：

基于标准化通行能力对高速公路区域内的出入口车流量进行标准化，标准化计算公式如下：

式中，U表示初始空间特征集合单元总数，与初始时间特征集合单元数量相同；BX_u表示第u个初始空间特征集合单元，即初始时间特征集合中第u个初始时间特征集合单元目标向量对应的初始空间特征集合单元；初始空间特征集合单元中最后一列为标准化目标向量，其计算过程与

相同，即

其余每列均为空间关联向量，每列空间关联向量即对应一个候选空间特征；b表示空间排序等级，根据目标观测点所在主道路上基于行车方向在目标观测点之前各高速匝道出入口汇入车流量从大到小排序；

表示日期编号为d时在时间粒度t_w下行车方向为e时在观测点s_j的实测车流量；

表示日期编号为d时在时间粒度t_w下行车方向为e时在观测点s_j的标准化车流量；L表示观测点编号为s_i的高速匝道出入口汇入目标观测点所在主道路上行车方向车道数；C_max表示目标高速公路区域观测点编号为s_i的高速匝道出入口在行车方向的通行能力最大值，

表示目标高速公路区域观测点编号为s_i的高速匝道出入口在行车方向为e时原实际通行能力；t_se表示起始观测点到目标观测点的有效行程时间，会基于不同起始观测点、以及预测的时间所在的时间段类型的不同而对应不同的有效行程时间，由上述公式中可以显而易见得出；s_i表示起始观测点编号，即目标观测点所在主道路上各高速匝道的出入口对应的观测点编号，本方案中各初始空间特征集合单元中每行的s_i是不同的观测点，是目标观测点所在主道路上基于行车方向在目标观测点之前各高速匝道出入口分别对应的各观测点，作为起始观测点，每行是对这些起始观测点进行空间排序；s_i表示目标观测点编号；v表示车辆类型，V表示预设车辆类型总数；t-th表示预设时间粒度；pt表示时间段类型，时间段类型为预测目标时间段所在时间为类型判断依据；

表示车辆类型为v的车辆在到达目标观测点时刻所对应的时间段类型pt下从起始观测点s_i到目标观测点s_j所用时长；Q₁表示基于车辆类型和时间段类型从起始观测点到目标观测点的预设时间数据集从小到大预设位置的数据信息，Q₃表示基于车辆类型和时间段类型从起始观测点到目标观测点的预设时间数据集从小到大预设位置的数据信息，预设时间数据集是在该目标日期类型下历史时间段内各日期下的数据，不同车辆类型针对不同起始观测点分别有其对应的时间数据集；f(Q₃-Q₁)表示Q₁到Q₃之间时间数据的数量，预设时间数据集大小基于自定义采集的数据量。

本实施例中，初始空间特征集合单元中每行为针对需要预测的目标时间所在的时间类型，获得目标时间对应的车辆有效行程时间，进而基于目标时间往前推有效行程时间获得当时各高速匝道入口的车流量，进而基于该车流量从大到小进行排序，即获得空间排序等级；车辆类型包括三种小型车辆、中型车辆、大型车辆；pt表示时间段类型，即高峰：7：00am-9：00am和5：00pm-7：00pm以及其他时间段所构成的平峰；Q₁预设位置为从小到大第25％位置，Q₃预设位置为从小到大第75％位置，即剔除行车时间相对异常数据。

所述步骤C2中，所述预设步长值S_o通过以下公式获得：

所述步骤C3.1中，所述动态搜索规则对步长进行调整获得当前步长，过程如下：

即为当前迭代前两相邻目标函数值之差为正时，步长保持不变；当前迭代前两相邻目标函数值之差为负时，步长调整为U_min；当前迭代前两相邻目标函数值之差为负且最后一个目标函数值小于最优时间特征子集对应的目标函数值时，步长调整为U_max；最优时间特征子集对应的目标函数值为初始目标函数值；

如在第一次迭代前，所对应的前两相邻目标函数值分别为步骤C3.1中获得的目标函数值和最优时间特征子集对应的目标函数值；在第二次迭代前所对应的前两相邻目标函数值分别为步骤C3.1中获得的目标函数值和第一次迭代获得的目标函数值；在第三次次迭代前所对应的前两相邻目标函数值分别为第两次迭代获得的两目标函数值，以此类推；

步骤D：基于最优时间特征子集与最优空间特征子集利用矩阵顺接拼接技术获得的最优时空特征子集，利用综合权重损失函数，构建并训练获得以目标观测点在目标日期的目标时间段内各时间粒度分别对应的最优时空特征子集为输入，目标观测点在目标日期的目标时间段内各时间粒度的车流量为输出的目标场景最佳车流量预测模型，进而由目标场景最佳车流量预测模型用于预测目标场景下目标高速公路区域上目标观测点在目标日期的目标时间段内各时间粒度的车流量。

如图4所示，采用LSTM模型对目标场景高速公路目标实验点的数据进行预测，其中Sigmoid表示S型函数，Tanh表示双曲正切激活函数，X_t为输入的信息，r_t为遗忘信息，z_t表示更新信息，

表示当前阶段保留的信息，S_t-1表示长期记忆的信息，S_t表示当前时刻输出的信息，所述步骤D中，利用综合权重损失函数来协同评估LSTM神经网络获得的嵌入式特征选择结果的优劣和模型预测值和实际值不一致性，所述综合权重损失函数如下：

其中，P表示样本数量，

表示目标高速公路区域内的目标观测点实际车流量观测值，

表示目标高速公路区域内的目标观测点预测值。WMAE值越小表示模型预测性能效果越好；结合预设迭代最大次数，将WMAE值最小对应的模型作为目标场景最佳车流量预测模型。

针对获得的以目标观测点在目标日期的目标时间段内各时间粒度分别对应的最优时空特征子集为输入，目标观测点在目标日期的目标时间段内各时间粒度的车流量为输出的目标场景最佳车流量预测模型，在应用时即基于本方案获得的最优时空特征子集，获得相应的模型输入数据，即可对目标观测点在目标日期的目标时间段内各时间粒度的车流量进行预测。

CAVs装备了雷达、摄像头等传感设备，这些可以帮助车辆探测、收集道路的状态信息。智能联网车辆可以通过车路之间的通信将交通状态信息转换为交通信号，从而减少用于建造传统传感设备方面的支出。在浅层深度学习中，特征选择是数据与模型之间的桥梁，是机器学习和浅层深度学习模型的关键环节之一，正确的特征可以减轻构建模型的难度，从而帮助浅层深度学习模型输出最佳的结果。合适的嵌入式特征选择策略，可以有效的将模型训练环节与特征选择进行深度绑定，快速对冗余信息进行筛选，为目标模型提供高质量的数据输入集合。同时，利用模型的特征选择结果可以更好地有效挖掘路网不同时段车流量的时空关系耦合关系。在基于嵌入式时间特征选择策略的高速公路交通流预测方法中，可以有效弥补端到端学习模型解释性差的问题，且可以在数据样本集受到限制的情况下，将高速公路车流量预测精度变得更加准确和稳定。本发明设计了一种基于嵌入式特征选择策略的高速公路交通流预测方法，采用本发明可以为高速公路管理部门实现全天候、全方位的营运管理及发展上层应用业务提供精准的区域范围关键节点的车流量预测数据。利用基于嵌入式特征选择策略，可以有效的将模型训练环节与特征选择进行深度绑定，快速对冗余信息进行筛选，为目标模型提供高质量的数据输入集合。同时，利用模型的特征选择结果可以更好地有效挖掘路网不同时段车流量的时空关系耦合关系。在基于嵌入式时间特征选择策略的高速公路交通流预测方法中，可以有效弥补端到端学习模型解释性差的问题，且可以在数据样本集受到限制的情况下，将高速公路车流量预测精度变得更加准确和稳定。

以上仅为本发明的较佳实施例，但并不限制本发明的专利范围，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本发明说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本发明专利保护范围之内。

Claims

1.一种基于嵌入式特征选择策略的高速公路交通流预测方法，其特征在于，针对目标高速公路区域，执行以下步骤，构建目标场景最佳车流量预测模型，由目标场景最佳车流量预测模型用于预测目标场景下目标高速公路区域上目标观测点在目标日期的目标时间段内各时间粒度的车流量：

2.根据权利要求1所述一种基于嵌入式特征选择策略的高速公路交通流预测方法，其特征在于，所述步骤B中，利用具体步骤如下所述的嵌入式时间特征搜索策略，获得最优时间特征子集：

X＝[X₁，X₂，X₃，...，X_u...，X_U]^T

3.根据权利要求2所述一种基于嵌入式特征选择策略的高速公路交通流预测方法，其特征在于，所述步骤B2中，利用斯皮尔曼关联性系数法计算各列关联向量与目标向量的关联系数，并将关联系数小于0.3的关联向量剔除。

4.根据权利要求2所述一种基于嵌入式特征选择策略的高速公路交通流预测方法，其特征在于，所述步骤B4中，按照如下重排序准则，获得强相关区间对应的各候选时间特征、中度相关区间对应的各候选时间特征、弱相关区间对应的各候选时间特征：

5.根据权利要求2所述一种基于嵌入式特征选择策略的高速公路交通流预测方法，其特征在于，所述步骤B5中，基于重排序后的各候选时间特征，具体执行以下步骤，获得最优时间特征子集：

6.根据权利要求5所述一种基于嵌入式特征选择策略的高速公路交通流预测方法，其特征在于，所述强相关区间内各候选时间特征、中度相关区间内各候选时间特征、以及弱相关区间内各候选时间特征的排序序号为时间特征在第一次特征排序中的序号与第二次特征排序中的序号的平均值。

7.根据权利要求2所述一种基于嵌入式特征选择策略的高速公路交通流预测方法，其特征在于，所述步骤C中，基于预设各观测点在各日期类型下分别对应的目标场景车流量数据集，结合最优时间特征子集，利用具体步骤如下所述的嵌入式空间特征搜索策略，获得最优空间特征子集：

BX＝［BX₁，BX₂，...，BX_u，...，BX_U]^T

其中，

8.根据权利要求7所述一种基于嵌入式特征选择策略的高速公路交通流预测方法，其特征在于，所述步骤C2中，所述预设步长值S_o通过以下公式获得：

9.根据权利要求7所述一种基于嵌入式特征选择策略的高速公路交通流预测方法，其特征在于，所述步骤C3.1中，所述动态搜索规则对步长进行调整获得当前步长，过程如下：

10.根据权利要求1所述一种基于嵌入式特征选择策略的高速公路交通流预测方法，其特征在于，所述步骤D中，所述综合权重损失函数如下：

其中，P表示样本数量，

表示目标高速公路区域内的目标观测点实际车流量观测值，

表示目标高速公路区域内的目标观测点预测值。