CN116502142B

CN116502142B - 一种基于输入特征参数选择的驾驶风格识别方法

Info

Publication number: CN116502142B
Application number: CN202310796448.8A
Authority: CN
Inventors: 刘艳芳; 李炳贤; 赵俊玮; 刘学武; 徐向阳; 董鹏; 王书翰
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2023-07-03
Filing date: 2023-07-03
Publication date: 2023-08-25
Anticipated expiration: 2043-07-03
Also published as: CN116502142A

Abstract

本发明涉及一种基于输入特征参数选择的驾驶风格识别方法，属于驾驶风格识别技术领域，解决了现有技术中难以有效减少输入特征参数导致模型识别效果不佳、模型做出单次预测所需消耗的算力资源大、算时长以及模型超参数的调节不便的问题。本发明以具有嵌入式特征选择功能的LassoNet作为核心，基于改进遗传算法构建了包裹式LassoNet特征选择器，该选择器能够有效降低驾驶风格识别模型的输入特征参数数量，进而减少模型训练所需消耗的时间，对模型超参数的调节带来便利；减少模型做出单次预测所需消耗的算时和计算资源；有效减少输入特征参数，使得最终构建的驾驶风格识别模型具有优良的识别效果。

Description

一种基于输入特征参数选择的驾驶风格识别方法

技术领域

本发明涉及驾驶风格识别技术领域，具体涉及一种基于输入特征参数选择的驾驶风格识别方法。

背景技术

准确识别人类驾驶员的驾驶风格不仅能够有效地提升智能网联汽车的安全性与经济性，还能够有效地提高消费者对于智能网联汽车产品的满意程度。因此近年来，驾驶风格识别技术得到了学术界与产业界广泛的关注。现有大量关于驾驶风格识别方法的研究，比如中国专利：CN113232669B_一种基于机器学习的驾驶风格辨识方法、CN112046489B_一种基于因子分析和机器学习的驾驶风格辨识算法和CN115366891A_一种驾驶风格识别方法、系统及存储介质。在交通系统智能化、网联化程度不断加深的大背景下，数据驱动的学习型驾驶风格识别逐渐成为了研究热点。根据学习过程中训练标签的有无，可将学习型的驾驶风格识别划分为两种类型：基于无监督学习的驾驶风格识别；基于有监督学习的驾驶风格识别。其中，前者的代表为基于聚类算法的驾驶风格识别。在输入特征参数之间的共线性较强时，此类方法的输出结果可能会存在着较大的偏差。后者的代表为基于分类算法的驾驶风格识别。在输入特征参数的数量过多时，模型训练的难度往往会上升，并且模型过拟合的风险也会提高。因此，使用恰当的特征选择方法以保留有关特征、减少冗余特征、排除无关特征对于学习型的驾驶风格识别具有重要意义。

当前，车辆智能化、网联化、电动化的进程不断加快，使得车辆可以获取到的信息类别与数量越来越多，这为驾驶风格识别模型的构建带来了新的挑战：（1）维数灾难：车辆可获取的信息类别与数量越多，可从数据中提取得到的候选特征参数也越多。对于基于有监督学习的驾驶风格识别模型而言，输入特征参数的数量过多，有时反而会导致模型识别效果的下降；（2）算力不足：对于基于有监督学习的驾驶风格识别模型而言，输入特征参数的数量越多，模型做出单次预测所需消耗的算力资源越大，这将阻碍相应模型的实车应用；（3）调参不便：对于基于有监督学习的驾驶风格识别模型而言，输入特征参数的数量越多，训练一次模型所需消耗的时间越长，这对模型超参数的调节带来了极大的不便。

综上，现有技术中存在难以有效减少输入特征参数导致模型识别效果不佳、模型做出单次预测所需消耗的算力资源大、算时长以及模型超参数的调节不便等问题。

发明内容

鉴于上述问题，本发明提供了一种基于输入特征参数选择的驾驶风格识别方法，解决了现有技术中存在的难以有效减少输入特征参数导致模型识别效果不佳、模型做出单次预测所需消耗的算力资源大以及模型超参数的调节不便的问题。

本发明提供了一种驾驶风格识别模型输入特征参数选择方法，包括如下步骤：

步骤S1.获取名驾驶员的历史车辆驾驶数据片段和驾驶风格类别标签；其中，历史车辆驾驶数据片段包括驾驶员驾驶操作数据、车辆运动状态数据以及车辆动力系统运行状态数据；驾驶风格类别标签包括激进型、适中型和保守型；

步骤S2.从历史车辆驾驶数据片段中提取驾驶风格特征参数，构建得到驾驶风格特征向量；由名驾驶员的驾驶风格特征向量构成原始驾驶风格特征向量集，利用驾驶风格类别标签进行类别标注，获得第一驾驶风格特征向量集；其中，驾驶风格特征参数包括高速公路场景下的驾驶风格特征参数、市郊道路场景下的驾驶风格特征参数和城市道路场景下的驾驶风格特征参数；对于驾驶员在每个道路场景下的历史车辆驾驶数据片段，提取该数据片段中驾驶员驾驶操作数据、车辆运动状态数据以及车辆动力系统运行状态数据的最大值、最小值、平均值以及标准差作为该道路场景下该名驾驶员的驾驶风格特征参数；

步骤S3.基于无监督过滤式特征参数选择，对第一驾驶风格特征向量集中的驾驶风格特征参数进行筛选，降维得到第二驾驶风格特征向量集；

步骤S4.基于有监督过滤式特征参数选择，对第二驾驶风格特征向量集中的驾驶风格特征参数进行筛选，降维得到第三驾驶风格特征向量集；

步骤S5.基于包裹式和嵌入式融合的特征选择方法，对第三驾驶风格特征向量集进行处理，得到优选输入驾驶风格特征参数子集，用于对第三驾驶风格特征向量集中的驾驶风格特征参数进行筛选，降维得到第四驾驶风格特征向量集；

步骤S6.以第四驾驶风格特征向量集作为输入，构建并训练第一LassoNet分类器，得到驾驶风格识别模型；

步骤S7.将驾驶风格识别模型应用于驾驶员的驾驶风格识别。

进一步的，所述步骤S3包括：

基于k-means算法，对第一驾驶风格特征向量集中的驾驶风格特征参数进行方差特征筛选，基于驾驶风格特征参数方差的大小将第一驾驶风格特征向量集中的驾驶风格特征参数划分为高方差、中方差以及低方差三种类别，舍去低方差类的驾驶风格特征参数，保留中方差以及高方差类的驾驶风格特征参数，得到第一驾驶风格特征参数子集；

对第一驾驶风格特征参数子集中的驾驶风格特征参数两两进行线性相关性分析，在满足强线性相关性判定条件的一对驾驶风格特征参数中舍去方差较小的，获得第二驾驶风格特征参数子集；

对于第一驾驶风格特征向量集中的每一个驾驶风格特征向量，保留其中与第二驾驶风格特征参数子集所对应的驾驶风格特征参数，并舍去其余所有驾驶风格特征参数，得到第一次降维后的驾驶风格特征向量，集合所有第一次降维后的驾驶风格特征向量，得到第二驾驶风格特征向量集。

进一步的，所述对第一驾驶风格特征参数子集中的驾驶风格特征参数两两进行线性相关性分析，在满足强线性相关性判定条件的一对驾驶风格特征参数中舍去方差较小的一个驾驶风格特征参数，获得第二驾驶风格特征参数子集，包括：

根据驾驶风格特征参数方差的大小对第一驾驶风格特征参数子集中的驾驶风格特征参数进行降序排序；

两两计算不同驾驶风格特征参数之间的皮尔逊相关系数以及线性相关性的显著性指标/>，并规定一对驾驶风格特征参数具有强线性相关性的判定条件为：

且/>；其中，/>为两个驾驶风格特征参数具有强线性相关性的皮尔逊系数判断阈值；/>为两个驾驶风格特征参数具有强线性相关性的显著性判断阈值；

选出第一驾驶风格特征参数子集中经过降序排序后排名第一的驾驶风格特征参数，然后按照降序排序后的次序，逐一比较第一驾驶风格特征参数子集中剩余的驾驶风格特征参数与/>的皮尔逊相关系数/>以及线性相关性的显著性指标/>是否满足强线性相关性的判定条件，舍去满足强线性相关判定条件的所有驾驶风格特征参数，完成针对/>的筛选；再按照针对/>的筛选方式，依次完成针对排名第二的驾驶风格特征参数/>至排名最后的驾驶风格特征参数的筛选，得到第二驾驶风格特征参数子集。

进一步的，所述步骤S4包括：

采用有监督过滤式特征参数选择方法对第二驾驶风格特征向量集进行驾驶风格特征筛选，得到第三驾驶风格特征参数子集；

对于第二驾驶风格特征向量集中的每一个驾驶风格特征向量，保留其中与第三驾驶风格特征参数子集所对应的驾驶风格特征参数，并舍去其余所有驾驶风格特征参数，得到第二次降维后的驾驶风格特征向量，集合所有第二次降维后的驾驶风格特征向量，得到第三驾驶风格特征向量集。

进一步的，所述采用有监督过滤式特征驾驶风格选择方法对第二驾驶风格特征向量集进行驾驶风格特征筛选，得到第三驾驶风格特征参数子集，包括：

将第二驾驶风格特征向量集中的每一个驾驶风格特征向量包含的驾驶风格特征参数的个数记作；

采用ReliefF算法计算得到第二驾驶风格特征向量集中每一个驾驶风格特征参数的重要性分数；

根据重要性分数的大小对第二驾驶风格特征向量集中的驾驶风格特征参数进行降序排序；将驾驶风格特征参数，/>根据重要性分数排序后所对应的序号记为/>，/>；

预设为驾驶风格特征参数的取舍阈值，若满足：/>，则保留驾驶风格特征参数/>；反之，则舍去驾驶风格特征参数/>；

舍去超过取舍阈值的驾驶风格特征参数，得到第三驾驶风格特征参数子集。

进一步的，所述步骤S5包括：

步骤S501.基于第三驾驶风格特征向量集，构建得到候选驾驶风格特征参数子集和对应的个体，进而构建得到种群；

步骤S502.计算得到种群中的每个个体的适应度；

步骤S503.分别利用基于个体适应度的轮盘赌法和完全随机法，选择亲代个体；

步骤S504.基于亲代个体，交叉生成子代个体；且在产生子代个体的过程中，子代个体以预设概率发生单点变异；

步骤S505.用步骤S504生成的子代个体替换种群中原有的所有个体，并进入下一轮迭代；

步骤S506.重复迭代步骤S501-S505，直到达到预先设定的算法最大迭代轮数为止；此时，子代个体的适应度达到最大值，适应度最大的子代个体所对应的候选驾驶风格特征参数子集为优选输入驾驶风格特征参数子集；

步骤S507.对于第三驾驶风格特征向量集中的每一个驾驶风格特征向量，保留其中与优选输入驾驶风格特征参数子集所对应的驾驶风格特征参数，并舍去其余所有驾驶风格特征参数，得到第三次降维后的驾驶风格特征向量，集合所有第三次降维后的驾驶风格特征向量，得到第四驾驶风格特征向量集。

进一步的，所述步骤S501包括：

将第三驾驶风格特征向量集中的每个驾驶风格特征向量包含的驾驶风格特征参数的个数记作；

基于第三驾驶风格特征向量集构建若干候选驾驶风格特征参数子集，并将每个候选驾驶风格特征参数子集编码为一个长度为的二进制向量，一个向量为一个个体；其中，

若某个体的第个位置上的数值为1，其余位置上的数值均为0，则该个体所代表的候选驾驶风格特征参数子集为：仅选择第三驾驶风格特征向量集中每一个驾驶风格特征向量的第/>个驾驶风格特征参数，构建该候选驾驶风格特征参数子集，而其余的驾驶风格特征参数均不选择；

生成一个大小为的随机矩阵，随机矩阵的每一行代表一个候选驾驶风格特征参数子集，即一个个体；每一列代表一项候选驾驶风格特征参数被选择的状态；其中，1表示该驾驶风格特征参数被该个体选择，0表示该驾驶风格特征参数未被该个体选择；该随机矩阵为一个种群，种群中的个体数量为/>。

进一步的，所述步骤S502包括：

步骤S502-1.对于种群中的任意一个个体，首先根据编码情况确定其所代表的候选驾驶风格特征参数子集，对于第三驾驶风格特征向量集中的每一个驾驶风格特征向量，保留该候选驾驶风格特征参数子集所对应的驾驶风格特征参数，并舍去其余所有驾驶风格特征参数，得到基于该候选驾驶风格特征参数子集降维后的驾驶风格特征向量；集合所有基于该候选驾驶风格特征参数子集降维后的驾驶风格特征向量，得到该候选驾驶风格特征参数子集所对应的驾驶风格特征向量集；

步骤S502-2.从步骤S502-1生成的该候选驾驶风格特征参数子集所对应的驾驶风格特征向量集中，随机抽取出20%的样本作为验证集，其余样本均作为训练集；

步骤S502-3.使用步骤S502-2生成的训练集，构建并训练第二LassoNet分类器；

步骤S502-4.利用步骤S502-3中训练完成的第二LassoNet分类器，对步骤S502-2中生成的验证集中的样本进行分类；将第二LassoNet分类器在验证集上的误分类率记作；且第二LassoNet分类器在训练完成后所选择的驾驶风格特征参数的个数为/>，则个体/>的适应度/>为：

其中，指的是利用个体/>所对应的驾驶风格特征参数，训练的第二LassoNet分类器在验证集上的误分类率；/>指的是个体/>所选择的驾驶风格特征参数的个数；/>为权重系数，用于调节适应度计算公式中两个不同分量的比重；

步骤S502-5.对种群中的每一个个体，执行步骤S502-1至S502-4，计算得到每一个个体的适应度。

进一步的，所述步骤S503包括：

基于步骤S502中计算得到的每个个体的适应度确定每个个体被选择的概率：

其中表示个体/>被选择的概率；

基于每个个体被选择的概率，利用轮盘赌法从种群中选择出对个体作为优选亲代个体，加入亲代池；其中，在选择优选亲代个体时，适应度越大的个体被选中的可能性越高；

利用完全随机抽取法从种群中选择出对个体作为随机亲代个体，加入亲代池；其中，在选择随机亲代个体时，所有个体被选中的概率均相同。

进一步的，所述步骤S504包括：

对在步骤S503中被选中加入亲代池的每一对亲代个体，都基于单点交叉法生成个子代个体：

其中，为种群的个体数量；/>为优选亲代个体的对数；/>为随机亲代个体的对数；

在产生子代个体的过程中，子代个体发生单点变异的预设概率的取值范围为0.03-0.05。

与现有技术相比，本发明至少具有如下有益效果：

（1）针对驾驶风格识别模型构建过程中所面临的优选输入特征参数难确定的问题，本发明的基于输入特征参数选择的驾驶风格识别方法，以具有嵌入式特征选择功能的LassoNet作为核心，基于改进遗传算法构建了包裹式LassoNet特征选择器，该选择器能够有效降低驾驶风格识别模型的驾驶风格输入特征参数数量，进而减少模型训练所需消耗的时间，对模型超参数的调节带来便利；减少模型做出单次预测所需消耗的算时和计算资源。

（2）针对ReliefF算法对输入特征参数共线性较为敏感的问题，本发明的基于输入特征参数选择的驾驶风格识别方法，在采用ReliefF算法之前，首先采用了方差选择与线性相关性分析对驾驶风格特征参数进行了初步筛选，避免了ReliefF算法在基于欧式距离搜索每个驾驶风格特征向量的近邻样本时产生过大的偏差。

（3）针对具有嵌入式特征选择功能的LassoNet难以给出近似全局最优解的问题，本发明的基于输入特征参数选择的驾驶风格识别方法，构建了包裹式LassoNet特征选择器，扩展了LassoNet的优选输入驾驶风格特征参数子集搜索范围，提高了LassoNet给出近似全局最优解的可能性。

（4）针对包裹式LassoNet特征选择器所存在的计算开销较大，特征选择过程效率较低的问题，本发明的基于输入特征参数选择的驾驶风格识别方法，在进行包裹式特征选择前，采用有监督与无监督两类过滤式特征选择算法初步减少了输入驾驶风格特征参数的数量，降低了包裹式LassoNet特征选择器的计算开销。

（5）针对基于遗传算法的包裹式特征选择器可能存在的算法过早陷入局部最优问题，本发明的基于输入特征参数选择的驾驶风格识别方法，在进行个体选择时不仅基于轮盘赌法选择适应度较高的亲代个体，还基于随机抽取法选择质量未知的亲代个体，该做法提高了种群泛化多样性，能够避免算法过早陷入局部最优。

（6）针对基于遗传算法的包裹式特征选择器收敛速度较慢的问题，本发明的基于输入特征参数选择的驾驶风格识别方法，在进行种群更新时生成了数量充足的子代个体，将种群中原有的个体完全替换，提高了算法收敛的速度。

（7）针对难以有效减少输入特征参数导致模型识别效果不佳的问题，本发明的基于输入特征参数选择的驾驶风格识别方法，基于与上述有益效果（1）至（6）所对应的技术手段，有效减少输入驾驶风格特征参数，使得最终构建的驾驶风格识别模型具有优良的识别效果。

附图说明

附图仅用于示出具体实施例的目的，而并不认为是对本发明的限制。

图1为本发明实施例1公开的基于输入特征参数选择的驾驶风格识别方法的流程示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本发明的实施例及实施例中的特征可以相互组合。另外，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

实施例1

本发明的一个具体实施例，如图1所示，公开了一种基于输入特征参数选择的驾驶风格识别方法，包括如下步骤：

步骤S1.获取名驾驶员的历史车辆驾驶数据片段和驾驶风格类别标签；其中，历史车辆驾驶数据片段包括驾驶员驾驶操作数据、车辆运动状态数据以及车辆动力系统运行状态数据；驾驶风格类别标签包括激进型、适中型和保守型。

步骤S2.从历史车辆驾驶数据片段中提取驾驶风格特征参数，构建得到驾驶风格特征向量；由名驾驶员的驾驶风格特征向量构成原始驾驶风格特征向量集，利用驾驶风格类别标签进行类别标注，获得第一驾驶风格特征向量集；其中，驾驶风格特征参数包括高速公路场景下的驾驶风格特征参数、市郊道路场景下的驾驶风格特征参数和城市道路场景下的驾驶风格特征参数；对于驾驶员在每个道路场景下的历史车辆驾驶数据片段，提取该数据片段中驾驶员驾驶操作数据、车辆运动状态数据以及车辆动力系统运行状态数据的最大值、最小值、平均值以及标准差作为该道路场景下该名驾驶员的驾驶风格特征参数。

步骤S3.基于无监督过滤式特征参数选择，对第一驾驶风格特征向量集中的驾驶风格特征参数进行筛选，降维得到第二驾驶风格特征向量集。

步骤S4.基于有监督过滤式特征参数选择，对第二驾驶风格特征向量集中的驾驶风格特征参数进行筛选，降维得到第三驾驶风格特征向量集。

步骤S5.基于包裹式和嵌入式融合的特征选择方法，对第三驾驶风格特征向量集进行处理，得到优选输入驾驶风格特征参数子集，用于对第三驾驶风格特征向量集中的驾驶风格特征参数进行筛选，降维得到第四驾驶风格特征向量集。

步骤S6.以第四驾驶风格特征向量集作为输入，构建并训练第一LassoNet分类器，得到驾驶风格识别模型。

步骤S7.将驾驶风格识别模型应用于驾驶员的驾驶风格识别。

与现有技术相比，针对驾驶风格识别模型构建过程中所面临的优选输入特征参数难确定的问题，本发明实施例以具有嵌入式特征选择功能的LassoNet作为核心，基于改进遗传算法构建了包裹式LassoNet特征选择器，该选择器能够有效降低驾驶风格识别模型的输入特征参数数量，进而减少模型训练所需消耗的时间，对模型超参数的调节带来便利；减少模型做出单次预测所需消耗的算时和计算资源。

需要说明的是，输入特征维数降低，模型复杂度下降，则模型进行预测所消耗的计算成本即算时和计算资源将下降，并且模型训练所需消耗的时间将减少，对模型超参数的调节带来便利，这一结论是本领域所公知，因此理论上不需要用对比例来体现本方案的有益效果。

实施例2

在实施例1的基础上进行优化，步骤S1可进一步细化为如下子步骤：

步骤S101.从用户驾驶数据云平台中获取一名驾驶员的历史车辆驾驶数据片段和该名驾驶员的驾驶风格类别标签；其中，

历史车辆驾驶数据片段包括驾驶员驾驶操作数据、车辆运动状态数据以及车辆动力系统运行状态数据。

驾驶风格类别标签包括激进型、适中型和保守型。

需要说明的是，用户驾驶数据云平台中储存了大量的历史车辆驾驶数据片段，这些历史车辆驾驶数据片段均由驾驶员驾驶某型号的混动汽车在自由出行的过程中产生并授权上传至用户驾驶数据云平台。在驾驶员第一次上传历史车辆驾驶数据片段时，用户驾驶数据云平台会请求驾驶员对其自身所属的驾驶风格类别做出选择，选择结果会作为驾驶风格类别标签与历史车辆驾驶数据片段一起被上传至用户驾驶数据云平台保存；其中，驾驶风格类别的选择结果为激进型、适中型和保守型中的一种。

值得注意的是，在用户驾驶数据云平台中，所有的历史车辆驾驶数据片段均已根据自车在出行过程中所处的道路场景进行了分类储存，所储存的类别共有三种：高速公路场景下的历史车辆驾驶数据片段、市郊道路场景下的历史车辆驾驶数据片段和城市道路场景下的历史车辆驾驶数据片段；其中，任意一个数据片段均已匹配了一个与之相对应的场景下的道路限速值。

具体来说，获取一名驾驶员的历史车辆驾驶数据片段的方法为：对于该名驾驶员，分别获取其高速公路场景下的历史车辆驾驶数据片段1个、市郊道路场景下的历史车辆驾驶数据片段1个以及城市道路场景下的历史车辆驾驶数据片段1个，均作为该名驾驶员的历史车辆驾驶数据片段。

示例性的，获取一名驾驶员的高速公路场景下的历史车辆驾驶数据片段，包括：

若该名驾驶员的某个高速公路场景下的历史车辆驾驶数据片段满足以下条件，则选取该数据片段作为该名驾驶员在高速公路场景下的历史车辆驾驶数据片段：

其中，为该高速公路场景下的历史车辆驾驶数据片段的总时长，单位为min；为所选高速公路场景下的历史车辆驾驶数据片段时长的最小值，优选地，/>的取值范围为40-50 min；/>为所选高速公路场景下的历史车辆驾驶数据片段时长的最大值，优选地，/>的取值范围为60-80 min；/>为该段高速公路场景下的历史车辆驾驶数据片段中自车的平均车速，单位为km/h；/>为该高速公路场景下的历史车辆驾驶数据片段所对应的道路限速值。

若该名驾驶员有多个高速公路场景下的数据片段均满足上述条件，则从中随机抽取出一个数据片段作为该名驾驶员在高速公路场景下的历史车辆驾驶数据片段。

需要说明的是，获取市郊道路场景下的历史车辆驾驶数据片段和城市道路场景下的历史车辆驾驶数据片段的方法，与上述获取高速公路场景下的历史车辆驾驶数据片段的方法一致，具体而言，三者的条件的表达式一致，只是道路限速值不同，故不再赘述。

不难理解的是，高速公路场景下的历史车辆驾驶数据片段、市郊道路场景下的历史车辆驾驶数据片段和城市道路场景下的历史车辆驾驶数据片段中，均包括三种时间序列原始数据，即驾驶员驾驶操作数据、车辆运动状态数据以及车辆动力系统运行状态数据；其中，

驾驶员驾驶操作数据包括：油门踏板开度数据、制动踏板开度数据、方向盘转角数据。

车辆运动状态数据包括：自车车速数据、自车横纵向加速度数据、自车正负向冲击度数据、自车横摆角速度数据。

车辆动力系统运行状态数据包括：自车发动机转速数据、自车驱动电机转速数据、自车电池SOC（荷电状态，State of Charge）数据。

步骤S102.按照步骤S101的方法，从用户驾驶数据云平台中获取包括步骤S101中的驾驶员在内的名驾驶员的历史车辆驾驶数据片段。

具体来说，获取名驾驶员的历史车辆驾驶数据片段的方法为：对于每一名驾驶员，都获取高速公路场景下的历史车辆驾驶数据片段1个、市郊道路场景下的历史车辆驾驶数据片段1个以及城市道路场景下的历史车辆驾驶数据片段1个，均作为该名驾驶员的历史车辆驾驶数据片段，如此则获取到的历史车辆驾驶数据片段总数为/>。

以上名驾驶员的历史车辆驾驶数据片段均为驾驶风格识别模型训练所需的时间序列原始数据。

优选地，。

步骤S2可进一步细化为如下子步骤：

步骤S201.从名驾驶员中的某一名驾驶员的历史车辆驾驶数据片段中，提取驾驶风格特征参数，包括高速公路场景下的驾驶风格特征参数、市郊道路场景下的驾驶风格特征参数和城市道路场景下的驾驶风格特征参数。

具体来说，对于该名驾驶员在每个道路场景下的历史车辆驾驶数据片段，提取该数据片段中所有时间序列原始数据的最大值、最小值、平均值以及标准差作为该道路场景下该名驾驶员的驾驶风格特征参数。

示例性的，对于该名驾驶员在高速公路场景下的历史车辆驾驶数据片段，提取该数据片段中所有时间序列原始数据的最大值、最小值、平均值以及标准差作为高速公路场景下该名驾驶员的驾驶风格特征参数。

步骤S202.基于步骤S201得到的该名驾驶员在高速公路场景下的驾驶风格特征参数、市郊道路场景下的驾驶风格特征参数和城市道路场景下的驾驶风格特征参数，构建得到该名驾驶员的驾驶风格特征向量。

步骤S203.按照步骤S201-S202的方法，构建得到名驾驶员的驾驶风格特征向量；基于/>名驾驶员的驾驶风格特征向量，构建得到原始驾驶风格特征向量集。

优选地，对原始驾驶风格特征向量集中的每一个特征参数进行z-score标准化处理，使所有驾驶风格特征参数的量纲统一。

值得注意的是，原始驾驶风格特征向量集不具有样本类别标签。

步骤S204.利用步骤S101得到的驾驶风格类别标签，对原始驾驶风格特征向量集进行类别标注，获得第一驾驶风格特征向量集。

具体来说，利用步骤S101得到的某名驾驶员的驾驶风格类别标签直接作为该名驾驶员的驾驶风格特征向量的类别标签，并按照这一方式对所有名驾驶员的驾驶风格特征向量进行类别标签的标注，得到第一驾驶风格特征向量集。

值得注意的是，第一驾驶风格特征向量集具有样本类别标签，且尚未进行任何特征选择操作。

步骤S3基于k-means算法，对第一驾驶风格特征向量集中的驾驶风格特征参数进行的方差特征筛选，基于驾驶风格特征参数方差的大小将第一驾驶风格特征向量集中的驾驶风格特征参数划分为高方差、中方差以及低方差三种类别，此处舍去低方差类的驾驶风格特征参数，保留中方差以及高方差类的驾驶风格特征参数，得到第一驾驶风格特征参数子集；对第一驾驶风格特征参数子集中的驾驶风格特征参数两两进行线性相关性分析，在满足强线性相关性判定条件的一对驾驶风格特征参数中舍去方差较小的，获得第二驾驶风格特征参数子集；基于第二驾驶风格特征参数子集，对第一驾驶风格特征向量集降维得到第二驾驶风格特征向量集，可进一步细化为如下子步骤：

步骤S301.将第一驾驶风格特征向量集中的每一个驾驶风格特征向量包含的驾驶风格特征参数的个数记作，计算第一驾驶风格特征向量集中每一个驾驶风格特征参数的方差/>，获得驾驶风格特征参数方差集合/>。

步骤S302.采用k-means算法将驾驶风格特征参数方差集合聚类为三簇，其中每一簇为一个驾驶风格特征参数方差子集。为保证聚类结果的可靠性，优选地，k-means算法的最大迭代次数取值范围为150-200；簇质心的初始化方法采用k-means ++方法。

步骤S303.对于k-means算法输出的三个驾驶风格特征参数方差子集，计算每个子集中驾驶风格特征参数方差的平均值。将k-means算法输出的三个驾驶风格特征参数方差子集中，驾驶风格特征参数方差的平均值最小的子集记为；驾驶风格特征参数方差的平均值适中的子集记为/>；驾驶风格特征参数方差的平均值最大的子集记为。舍去子集/>所对应的驾驶风格特征参数，保留子集/>与/>所对应的驾驶风格特征参数，得到第一驾驶风格特征参数子集。

值得注意的是，第一驾驶风格特征参数子集经过了方差特征筛选。

步骤S304.根据方差值的大小对第一驾驶风格特征参数子集中的驾驶风格特征参数进行降序排序。

步骤S305.两两计算不同驾驶风格特征参数之间的皮尔逊相关系数以及线性相关性的显著性指标/>，并规定一对驾驶风格特征参数具有强线性相关性的判定条件为：且/>；其中，/>为两个驾驶风格特征参数具有强线性相关性的皮尔逊系数判断阈值；/>为两个驾驶风格特征参数具有强线性相关性的显著性判断阈值。

优选地，的取值范围为0.85-0.90，/>的取值范围为0.01-0.05。/>

步骤S306.选出第一驾驶风格特征参数子集中经过降序排序后排名第一的驾驶风格特征参数，然后按照降序排序后的次序，逐一比较第一驾驶风格特征参数子集中剩余的驾驶风格特征参数与/>的皮尔逊相关系数/>以及线性相关性的显著性指标/>是否满足强线性相关性的判定条件，舍去满足强线性相关判定条件的所有驾驶风格特征参数，完成针对/>的筛选。

示例性的，如某驾驶风格特征参数的方差值为/>，某驾驶风格特征参数/>的方差值为/>，且/>。若/>与/>的皮尔逊相关系数/>与线性相关性显著性指标/>满足具有强线性相关性的判定条件，则舍去特征参数/>。在执行上述驾驶风格特征选择操作时，首先考虑第一驾驶风格特征参数子集中方差大小降序排名第1的驾驶风格特征参数/>，舍去满足强线性相关判定条件且对应方差值小于驾驶风格特征参数/>方差值的所有驾驶风格特征参数。

步骤S307.按照针对的筛选方式，依次完成针对排名第二的驾驶风格特征参数至排名最后的驾驶风格特征参数的筛选，得到第二驾驶风格特征参数子集。

示例性的，考虑方差大小降序排名第2的驾驶风格特征参数。若该驾驶风格特征参数已被筛去，则直接考虑排名其次的下一个驾驶风格特征参数/>，以此类推，最终得到第二驾驶风格特征参数子集。

值得注意的是，第二驾驶风格特征参数子集经过了方差特征筛选与特征线性相关性分析。

步骤S308.对于第一驾驶风格特征向量集中的每一个特征向量，保留其中与第二驾驶风格特征参数子集所对应的驾驶风格特征参数，并舍去其余所有驾驶风格特征参数，得到第一次降维后的驾驶风格特征向量，集合所有第一次降维后的驾驶风格特征向量，得到第二驾驶风格特征向量集。

值得注意的是，第二驾驶风格特征向量集经过了方差特征筛选与特征线性相关性分析。

步骤S4可进一步细化为如下子步骤：

步骤S401.采用有监督过滤式特征选择方法对第二驾驶风格特征向量集进行进一步的特征筛选，得到第三驾驶风格特征参数子集。

具体来说，将第二驾驶风格特征向量集中的每一个驾驶风格特征向量包含的驾驶风格特征参数的个数记作。

采用ReliefF算法计算得到第二驾驶风格特征向量集中每一个驾驶风格特征参数的重要性分数。

根据重要性分数的大小对第二驾驶风格特征向量集中的驾驶风格特征参数进行降序排序。

将驾驶风格特征参数，/>根据重要性分数排序后所对应的序号记为，/>。

预设为驾驶风格特征参数的取舍阈值，若满足：/>，则保留驾驶风格特征参数/>；反之，则舍去驾驶风格特征参数/>。

优选地，的取值为/>，若/>不为整数，则向下取整。

舍去超过取舍阈值的特征参数后，得到的驾驶风格特征参数子集为第三驾驶风格特征参数子集。

值得注意的是，第三驾驶风格特征参数子集经过了无监督与有监督两种类型的过滤式特征选择。

步骤S402.对于第二驾驶风格特征向量集中的每一个驾驶风格特征向量，保留其中与第三驾驶风格特征参数子集所对应的驾驶风格特征参数，并舍去其余所有驾驶风格特征参数，得到第二次降维后的驾驶风格特征向量，集合所有第二次降维后的驾驶风格特征向量，得到第三驾驶风格特征向量集。

值得注意的是，第三驾驶风格特征向量集经过了有监督与无监督两种类型的过滤式特征选择。

步骤S5以第三驾驶风格特征向量集作为输入，构建并训练基于改进遗传算法的包裹式LassoNet特征选择器，输出得到的优选输入驾驶风格特征参数子集，用于在后续步骤中输入驾驶风格识别模型，对驾驶风格进行识别；基于优选输入驾驶风格特征参数子集对第三驾驶风格特征向量集中的驾驶风格特征参数进行筛选，降维得到第四驾驶风格特征向量集，可进一步细化为如下子步骤：

步骤S501.基于第三驾驶风格特征向量集，构建得到候选驾驶风格特征参数子集和对应的个体，进而构建得到种群。

具体来说，将第三驾驶风格特征向量集中的每个驾驶风格特征向量包含的驾驶风格特征参数的个数记作。

基于第三驾驶风格特征向量集构建若干候选驾驶风格特征参数子集，并将每个候选驾驶风格特征参数子集其编码为一个长度为的二进制向量，一个向量为一个个体；其中，

若某个体的第个位置上的数值为1，其余位置上的数值均为0，则该个体所代表的候选驾驶风格特征参数子集为：仅选择第三驾驶风格特征向量集中每一个驾驶风格特征向量的第/>个驾驶风格特征参数，构建该候选驾驶风格特征参数子集，而其余的驾驶风格特征参数均不选择。

以上述编码规则作为基础，生成一个大小为的随机矩阵，随机矩阵的每一行代表一个候选驾驶风格特征参数子集，即一个个体；每一列代表一项候选驾驶风格特征参数被选择的状态；其中，1表示该驾驶风格特征参数被该个体选择，0表示该驾驶风格特征参数未被该个体选择；该随机矩阵被称为一个种群，种群中的个体数量为/>。

优选地，。

步骤S502.计算得到种群中的每个个体的适应度。

具体来说，在步骤S501生成的种群中，每个个体都代表了一个候选驾驶风格特征参数子集。此处构建一个评价函数来表示适应度，用于评价任意一个候选驾驶风格特征参数子集即个体的优劣。适应度的计算方法如下所示：

步骤S502-1.对于种群中的任意一个个体，首先根据其编码情况确定其所代表的候选驾驶风格特征参数子集，对于第三驾驶风格特征向量集中的每一个驾驶风格特征向量，保留该候选驾驶风格特征参数子集所对应的特征参数，并舍去其余所有驾驶风格特征参数，得到基于该候选驾驶风格特征参数子集降维后的驾驶风格特征向量，集合所有基于该候选驾驶风格特征参数子集降维后的驾驶风格特征向量，得到该候选驾驶风格特征参数子集所对应的驾驶风格特征向量集。

步骤S502-2.从步骤S502-1生成的该候选驾驶风格特征参数子集所对应的驾驶风格特征向量集中，随机抽取出20%的样本作为验证集，其余样本均作为训练集；其中，后续步骤中个体的适应度在验证集上计算。

步骤S502-3.使用步骤S502-2生成的训练集，构建并训练第二LassoNet分类器；该分类器的神经网络输入层与输出层之间存在残差连接；该连接使得该分类器能够在更新参数的同时，自动地选择输入特征，该特征选择模式即为嵌入式。

步骤S502-4.利用步骤S502-3中训练完成的第二LassoNet分类器，对步骤S502-2中生成的验证集中的样本进行分类。将第二LassoNet分类器在验证集上的误分类率记作；其中，若第二LassoNet分类器将一个激进型样本分类为了一个保守型样本，则可认为第二LassoNet分类器发生了一次误分类；且第二LassoNet分类器在训练完成后所选择的特征参数的个数为/>，则个体/>的适应度/>为：

其中，指的是利用个体/>所对应的特征参数，训练的第二LassoNet分类器在验证集上的误分类率，例如假设验证集共有1000个含有类别标签的样本，若基于第二LassoNet分类器能正确识别出950个样本的类别，则模型的误分类率为5%；/>指的是个体所选择的特征参数的个数，例如个体001001的/>就为2（共有6个特征，已选2个，未选4个）；/>为权重系数，用于调节适应度计算公式中两个不同分量的比重，优选地，/>取值范围为100-150。

步骤S503.分别利用基于个体适应度的轮盘赌法和完全随机法，选择亲代个体。

具体来说，基于步骤S502中计算得到的每个个体的适应度确定每个个体被选择的概率/>：

其中表示个体/>被选择的概率；基于每个个体被选择的概率，利用轮盘赌法从种群中选择出/>对个体作为优选亲代个体，加入亲代池；其中，优选地，/>的取值范围为10-20，且在选择优选亲代个体时，适应度越大的个体被选中的可能性越高。

此外，再利用完全随机抽取法从种群中选择出对个体作为随机亲代个体，加入亲代池；其中，优选地，/>的取值范围为1-3，在选择随机亲代个体时，所有个体被选中的概率均相同。

步骤S504.基于亲代个体，交叉生成子代个体；且在产生子代个体的过程中，子代个体以预设概率发生单点变异。

具体来说，对在步骤S503中被选中加入亲代池的每一对亲代个体，都基于单点交叉法生成个子代个体：

其中，为种群的个体数量；/>为优选亲代个体的对数；/>为随机亲代个体的对数。

优选地，在产生子代个体的过程中，子代个体发生单点变异的预设概率的取值范围为0.03-0.05。

步骤S505.用步骤S504生成的子代个体替换种群中原有的所有个体，并进入下一轮迭代。

需要说明的是，步骤S501-S505是基于包裹式的特征选择方式，执行步骤S501-S505的第二LassoNet分类器，即为包裹式LassoNet特征选择器。

步骤S506.重复迭代步骤S501-S505，直到达到预先设定的算法最大迭代轮数为止；优选地，/>的取值范围为10-15。

当包裹式LassoNet特征选择器的迭代次数达到算法预设的最大迭代轮数时，子代个体的适应度也将达到最大值。适应度最大的子代个体所对应的候选驾驶风格特征参数子集即为驾驶风格识别模型的优选输入驾驶风格特征参数子集。

值得注意的是，优选输入驾驶风格特征参数子集完成了所有的特征选择操作。

与实施例1相比，针对ReliefF算法对输入特征参数共线性较为敏感的问题，本发明实施例在采用ReliefF算法之前，首先采用了方差选择与线性相关性分析对特征参数进行了初步筛选，避免了ReliefF算法在基于欧式距离搜索每个特征向量的近邻样本时产生过大的偏差；针对具有嵌入式特征选择功能的LassoNet难以给出近似全局最优解的问题，本发明实施例构建了包裹式LassoNet特征选择器，扩展了LassoNet的优选特征参数子集搜索范围，提高了LassoNet给出近似全局最优解的可能性；针对包裹式LassoNet特征选择器所存在的计算开销较大，特征选择过程效率较低的问题，本发明实施例在进行包裹式特征选择前，采用有监督与无监督两类过滤式特征选择算法初步减少了输入特征参数的数量，降低了包裹式LassoNet特征选择器的计算开销；针对基于遗传算法的包裹式特征选择器可能存在的算法过早陷入局部最优问题，本发明实施例在进行个体选择时不仅基于轮盘赌法选择适应度较高的亲代个体，还基于随机抽取法选择质量未知的亲代个体，该做法提高了种群泛化多样性，能够避免算法过早陷入局部最优；针对基于遗传算法的包裹式特征选择器收敛速度较慢的问题，本发明实施例在进行种群更新时生成了数量充足的子代个体，将种群中原有的个体完全替换，提高了算法收敛的速度；针对难以有效减少输入特征参数导致模型识别效果不佳的问题，本发明实施例基于与上述有益效果所对应的技术手段，有效减少输入特征参数，使得最终构建的驾驶风格识别模型具有优良的识别效果。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于输入特征参数选择的驾驶风格识别方法，其特征在于，包括如下步骤：

步骤S7.将驾驶风格识别模型应用于驾驶员的驾驶风格识别。

2.根据权利要求1所述的基于输入特征参数选择的驾驶风格识别方法，其特征在于，所述步骤S3包括：

3.根据权利要求2所述的基于输入特征参数选择的驾驶风格识别方法，其特征在于，所述对第一驾驶风格特征参数子集中的驾驶风格特征参数两两进行线性相关性分析，在满足强线性相关性判定条件的一对驾驶风格特征参数中舍去方差较小的一个驾驶风格特征参数，获得第二驾驶风格特征参数子集，包括：

4.根据权利要求3所述的基于输入特征参数选择的驾驶风格识别方法，其特征在于，所述步骤S4包括：

5.根据权利要求4所述的基于输入特征参数选择的驾驶风格识别方法，其特征在于，所述采用有监督过滤式特征驾驶风格选择方法对第二驾驶风格特征向量集进行驾驶风格特征筛选，得到第三驾驶风格特征参数子集，包括：

根据重要性分数的大小对第二驾驶风格特征向量集中的驾驶风格特征参数进行降序排序；将驾驶风格特征参数，/>根据重要性分数排序后所对应的序号记为，/>；

6.根据权利要求5所述的基于输入特征参数选择的驾驶风格识别方法，其特征在于，所述步骤S5包括：

步骤S502.计算得到种群中的每个个体的适应度；

7.根据权利要求6所述的基于输入特征参数选择的驾驶风格识别方法，其特征在于，所述步骤S501包括：

8.根据权利要求7所述的基于输入特征参数选择的驾驶风格识别方法，其特征在于，所述步骤S502包括：

9.根据权利要求8所述的基于输入特征参数选择的驾驶风格识别方法，其特征在于，所述步骤S503包括：

其中表示个体/>被选择的概率；

10.根据权利要求9所述的基于输入特征参数选择的驾驶风格识别方法，其特征在于，所述步骤S504包括：