CN110633729A

CN110633729A - 一种面向智能网联车辆群组测试的驾驶风险分级聚类方法

Info

Publication number: CN110633729A
Application number: CN201910721648.0A
Authority: CN
Inventors: 孙川; 马育林; 郑四发; 王龙; 田欢; 李茹; 徐阳; 王煜祺
Original assignee: Suzhou Automotive Research Institute of Tsinghua University
Current assignee: Suzhou Automotive Research Institute of Tsinghua University
Priority date: 2019-08-06
Filing date: 2019-08-06
Publication date: 2019-12-31

Abstract

本发明公开了一种面向智能网联车辆群组测试的驾驶风险分级聚类方法，包括：（1）车辆驾驶行为特征参数提取；（2）车辆驾驶行为参数主成成分分析；（3）车辆驾驶行为参数因子分析；（4）基于系统聚类的车辆驾驶风险分级。该驾驶风险分级聚类方法基于已有智能网联测试示范区采集的各类典型车辆驾驶数据，以道路安全最为关心的车辆驾驶风险作为切入点，对车辆群组的驾驶风险进行分级聚类，准确捕捉具有较高驾驶风险的车辆，构建一种能够有效串联车辆驾驶行为数据、车辆驾驶行为、车辆驾驶安全三者之间互相关联的理论方法，研究结果可以在智能网联车辆群组测试时有针对性地对重点测试车辆进行监控，以期保证智能网联车辆群组测试的准确性。

Description

一种面向智能网联车辆群组测试的驾驶风险分级聚类方法

技术领域

本发明属于智能汽车测试分析技术领域，具体涉及一种面向智能网联车辆群组测试的驾驶风险分级聚类方法。

背景技术

智能网联车辆在道路上行驶时，其驾驶行为与安全驾驶息息相关，直接影响着道路交通安全，而我国道路交通环境复杂，驾驶行为对道路安全影响更甚。参照我国公安部定期发布的事故年报表明，2018年因为各类高风险驾驶从而导致了数量庞大的交通事故。随着车联网技术的发展，智能车联网已成为可能，智能网联车辆为配备最新的车载传感器、控制器、执行器等装置，并以先进的网络通信技术为基础，完成车与X(人、车、路、后台等)智能信息交互共享，具备复杂的环境感知、智能决策、协同控制和执行等功能，可实现安全、舒适、节能、高效行驶，并最终实现真正无人驾驶的新一代车辆。智能网联车辆的研究成为交通领域研究的热点之一。

从技术与政策法规上，对智能网联车辆群组的全时监控在智能网联汽车测试示范区能够全面实现。在智能网联汽车的监控测试阶段，获取了类型丰富、体量庞大的车载监控数据、行车记录视频或图片(车内外)，然而这些数据大多被长期存放于数据库中成为了历史数据，尚未得到有效且充分地挖掘利用，主要是对车辆的基本运行情况实现了监控测试，例如轨迹路线、油耗监控，货物装载等，造成了测试数据源的无形浪费。目前大数据时代(Big Data)已然到来，云平台、云计算、数据仓库等热门技术应运而生。因此，通过数据挖掘技术充分利用、整合各类车载测试数据，发明一种车辆驾驶数据、车辆驾驶行为、车辆驾驶安全三者进行关联的方法变为可能。

发明内容

本发明的目的是针对现有技术中的问题，提供一种改进的面向智能网联车辆群组测试的驾驶风险分级聚类方法。

为达到上述目的，本发明采用的技术方案是：

一种面向智能网联车辆群组测试的驾驶风险分级聚类方法，所述方法包括：

(1)车辆驾驶行为特征参数提取；

(2)车辆驾驶行为参数主成成分分析；

(3)车辆驾驶行为参数因子分析；

(4)基于系统聚类的车辆驾驶风险分级。

优选地，步骤(2)中，主成成分分析模型为：

式中：n为车辆样本数，m为步骤(1)中提取的车辆驾驶行为特征参数指标，X1，X2，…，Xm为原来的变量指标；F1，F2，…，Fp为提取的主成成分，p＜m，a_ij为矩阵系数。

进一步地，主成成分分析模型满足以下条件：

(1)每个主成成分系数平方和为1；

(2)主成成分之间互不相关；

(3)主成成分方差依次递减。

进一步地，步骤(2)包括如下步骤：

①对步骤(1)提取的m个指标进行标准化处理；

②根据标准化后的数据矩阵求出协方差或相关阵；

③求出协方差矩阵的特征根和特征向量；

④确定主成成分；

⑤计算相应主成成分得分以及综合主成成分得分。

优选地，步骤(3)中，因子分析模型为：

式中，n为车辆样本数，m为步骤(1)中提取的车辆驾驶行为特征参数指标，X＝(X1,X2,…,Xm)T为车辆驾驶行为参数随机变量，F＝F1,F2,…,Fp为公因子，b_ij为因子载荷，即公因子Fi和变量Xj的相关系数，ε为特殊因子，代表公因子以外的影响因素。

进一步地，步骤(3)包括如下步骤：

①对步骤(1)提取的m个指标进行标准化处理；

②计算标准化处理后数据的相关系数阵，求出相关系数矩阵的特征值和特征向量；

③进行正交变换；

④确定因子个数，计算相应因子得分及综合得分。

更进一步地，使用方差最大法进行正交变换。

优选地，步骤(4)包括如下步骤：

①将通过步骤(2)或步骤(3)获得的各条数据各自作为一类，按照设定的距离计算各数据点之间的距离，形成一个距离阵；

②将距离最近的两条数据并为一个类别，计算新产生的类别与其他各个类别之间的距离或者相似度，形成新的距离阵；

③按照第②步的原则，再将距离最接近的两个类别合并，这时如果类的个数仍然大于1，则继续重复这一步骤，直到所有的数据都被合并成为一个类别为止。

优选地，当通过步骤(2)获取的数据具有实际意义时，步骤(4)中选取步骤(2)或步骤(3))获取的数据进行聚类分析，当通过步骤(2)获取的数据不具有实际意义时，步骤(4)中选取步骤(3)获取的数据进行聚类分析。

优选地，步骤(1)中提取的车辆驾驶行为特征参数包括车速超过限速80％的时间比例、车速平均值、车速标准差、加速度标准差、正加速度平均值、正加速度标准差、负加速度/减速度平均值和负加速度标准差。

由于上述技术方案的运用，本发明与现有技术相比具有下列优点：本发明的面向智能网联车辆群组测试的驾驶风险分级聚类方法基于已有智能网联测试示范区采集的各类典型车辆驾驶数据，以道路安全最为关心的车辆驾驶风险作为切入点，将数据挖掘里的聚类思想应用至智能交通领域，以期对车辆群组的驾驶风险进行分级聚类，准确捕捉具有较高驾驶风险的车辆，构建一种能够有效串联车辆驾驶行为数据、车辆驾驶行为、车辆驾驶安全三者之间互相关联的理论方法，研究结果可以在智能网联车辆群组测试时有针对性地对重点测试车辆进行监控，以期保证智能网联车辆群组测试的准确性。

附图说明

图1为本发明的面向智能网联车辆群组测试的驾驶风险分级聚类方法的流程图；

图2系统聚类结果示意图-树状图；

图3样本车辆驾驶行为五级风险聚类结果图(PC1，变速行为)；

图4样本车辆驾驶行为五级风险聚类结果图(RC1，超速倾向)；

图5样本车辆驾驶行为五级风险聚类结果图(RC2，加速行为)；

图6样本车辆驾驶行为五级风险聚类结果图(RC3，减速行为)；

图7样本车辆驾驶行为五级风险聚类结果图(综合得分，综合评价)。

具体实施方式

下面结合附图来对本发明的技术方案作进一步的阐述。

本发明的面向智能网联车辆群组测试的驾驶风险分级聚类方法的流程图见图1所示，主要包括如下步骤，

1、车辆驾驶行为特征参数提取

车辆行驶时会表现出高低不同的驾驶风险，通过车辆动力学模型分析是判断车辆驾驶风险高低的一种方法。但是驾驶测试数据的不断积累已经成为分析车辆驾驶风险的一个数据仓库，另一方面，时空挖掘技术的不断成熟也为此提供了扎实的理论基础，因此建立一种车辆驾驶风险分级聚类的理论方法成为现实。该方法包括以下步骤：

(1)车辆驾驶行为参数参考

车辆驾驶行为形式多样，从驾驶操作的过程和意图可区分为各种驾驶模式，如跟驰，换道、直行、转弯等，通过这个角度来评价车辆驾驶行为则需要对于每种驾驶模式进行分类或者组合，这样就显得过于复杂。但是无论何种驾驶模式，归根结底均是驾驶数据的输出，尤其当我们只需重点关注驾驶风险时，那么就可以从驾驶数据入手，提取与驾驶行为密切相关，尤其是涉及车辆驾驶风险的特征参数，找出驾驶数据与车辆驾驶行为关联的纽带，这样就免除了需要对每种驾驶模式进行分析的必要。如表1所示为可供选取参考的车辆驾驶行为主要特征参数，共计20个特征参数。

表1拟参考车辆驾驶行为主要特征参数

(2)指标参数的提取

结合驾驶数据属性以及影响车辆驾驶风险的主要因素，从表1中选取以下参数作为车辆驾驶风险分级聚类的特征指标。

①车速超过限速80％的时间比例ηspeed

车速往往是影响车辆行驶安全的重要因素。过高车速会降低驾驶人通过曲线道路及突破障碍物的能力并增大制动距离，大幅减少驾驶人对危险状况的反应时间，例如，澳大利亚和美国的研究表明，当车速大于60km/h时，车速每增加5km/h，事故率约为原来的2倍，事故的严重程度也将呈指数形式增长，因此不同道路环境会设定相应的最高安全行驶速度。根据国内外有关车辆运行速度与道路限速的相关研究，这里设定车速超过道路限速80％时，认为驾驶人会有潜在行车速度过高的驾驶倾向。车速超过限速80％的时间比例为：

式中：T代表车辆在该道路上总行驶时间；Tl80％代表车辆速度超过该道路规定限速值80％以上的累积时间；η代表车辆速度超过该道路规定限速值80％以上的时间比例。

②车速平均值

车速标准差σ_v

车速平均值与道路交通事故关系密切，其值越高，发生事故风险的概率也越大，且在较高行驶速度情况下，车速的微小提升会明显提高事故发生概率，这会对行车安全带来显著影响；车速标准差表现为车辆速度分布的离散程度，其与事故发生率呈正相关。因而，车速平均值、车速标准差是反映驾驶行为特征的重要参数指标，如式：

式中：vm为驾驶数据中车辆第m个速度值；n为驾驶数据中车辆速度值总样本量；为车辆在该道路上的整体速度平均值；σv为车辆在该道路上的整体速度标准差。

③加速度标准差σa、正加速度平均值

正加速度标准差σa+

驾驶人对于加速踏板、制动踏板等装置的操控能够通过加速度值体现。有关其标准差的特征规律也与速度标准差相仿，体现了其离散分布的程度。正加速度值将驾驶人操纵加速踏板的行为在一定程度上进行了数值化处理，该行为直接影响车辆的启停、加减速以及平顺性，与交通环境及驾驶行为特征密切相关，如冒进驾驶人通常表现出油门开合度较大、急加减速等特性。因而，加速度标准差、正加速度平均值、正加速度标准差是反映驾驶行为特征的重要参数指标，如式：

式中：am为驾驶数据中车辆第m个加速度值；

为车辆在该道路上的整体加速度平均值；σa为车辆在该道路上的整体加速度标准差；为驾驶数据中车辆第m个正加速度值；

车辆在该道路上的整体正加速度平均值；σa+为车辆在该道路上的整体正加速度标准差。

④负加速度/减速度平均值负加速度标准差σa-

同上，驾驶人操控制动踏板或释放加速踏板等装置会引起车载指标参数负加速度/制动减速度的变化，其反映了驾驶人释放加速踏板或使用制动踏板的轻重程度。通常制动减速度大小体现了车辆制动的紧急程度，这会对行车安全造成极大安全隐患，如无法有效避碰前车、后车追尾本车等，对于货物车辆还会对货物的安全运输带来较大影响，磨损涉及车辆制动的装置(如制动轮毂、轮胎等)，严重时发生热衰退失效。因而，负加速度平均值、负加速度标准差是反映驾驶行为特征的重要参数指标，如式：

式中：

为驾驶数据中车辆第m个负加速度值；

为车辆在该道路上的整体负加速度平均值；σa-为车辆在该道路上的整体负加速度标准差。

综上所述，即为选取用以对车辆驾驶风险进行分级聚类的指标参数，共计8个。对于未选取的指标参数，通过分析解释如下：一类指标与车辆驾驶风险本身没有密切关系，主要与能源油耗有关，如动能W、怠速时间比ηidel、巡航时间比ηdrive等参数；另一类指标虽然与车辆驾驶风险密切相关，但是其主要特征已经包含在上述选取的指标内，即具有较强的相关关系，可以互相替代，如速度、加速度的平方和(ss)及方差(var)等，重复选取虽然对分析结果没有影响，但是会影响分析效率；还有一类指标信息量显得过于单薄且偶然性较大，支撑力度不够，如最大车速vmax、最大加速度a+max、最大减速度a-max等；最后一类指标由于参数本身特点(正负值叠加)并不具备太强的解读性，如加速度(矢量)均值

等。值得说明的是，虽然本发明并未选取这类指标进行研究，但是在研究分析车辆其他内容时依然有着重要作用，例如基于聚类算法对车辆行驶工况进行构建时，动能W、怠速时间比ηidel、巡航时间比ηdrive等参数就显得十分重要。

2、车辆驾驶行为参数主成成分分析

为了对车辆驾驶风险进行分级聚类，首先采用步骤1的方法，从驾驶数据中提取车辆驾驶行为参数变量，即从20个选取出8个，但这些变量仍然存在着较强相关关系，即某些信息重复，直接使用它们分析车辆驾驶风险，不但模型复杂，还会因为变量间存在的多重共线性而引起误差。为了充分而有效利用这些车辆驾驶行为参数，需要用更少的新指标替换先前的旧指标，同时替换后的新指标应尽量能够保留并体现先前旧指标的主体信息，尤其是能够解读出涉及车辆驾驶风险的信息。主成成分分析和因子分析正是解决此问题最有效的时空数据挖掘方法，它们能够提取信息，使变量简化降维，从而使得问题简单化、直观化。

主成成分分析是设法将原来众多具有一定相关性的指标(本发明中8个指标)，重新组合成一组新的互相无关的综合指标来代替原来的指标。本发明将通过主成成分分析的方法，根据各指标与提取的新特征指标之间的关系矩阵和贡献因子，确定最终用于聚类车辆驾驶风险的指标。车辆驾驶行为参数指标之间的关联性，通常数学上的处理就是将原来m个指标作线性组合，作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合，即第一个综合指标)的方差来表达，即Var(F1)越大，表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的，故称F1为第一主成成分。如果第一主成成分不足以代表原来m个指标的信息，再考虑选取F2即选第二个线性组合，为了有效地反映原来信息，F1已有的信息就不需要再出现再F2中，用数学语言表达就是要求Cov(F1,F2)＝0，则称F2为第二主成成分，依此类推可以构造出第三，第四，…，第p个主成成分。

设有n个车辆样本，m个车辆驾驶行为参数指标，主成成分模型为：

式中：X1，X2，…，Xm为原来的变量指标；F1，F2，…，Fp为提取的主成成分(p＜m)；(aij)p×m是系数矩阵。

满足以下条件：

(1)每个主成成分系数平方和为1，即

(2)主成成分之间互不相关，即Cov(F_i,F_j)＝0；

(3)主成成分方差依次递减，即Var(F₁)≥Var(F₂)≥…≥Var(F_p)。

总结为以下步骤：

①对步骤1第(2)步中提取的m个指标(即m＝8个)进行标准化处理，以消除变量在数量极或量纲上的影响；

②根据标准化处理后的数据矩阵求出协方差或相关阵；

③求出协方差矩阵的特征根和特征向量；

④确定主成成分(PCp)，一般推荐p＝2～4，即将m个指标提取出p个主成成分，结合车辆驾驶风险方面的背景给各主成成分所蕴含的信息给予适当的解释，例如变速行为、超速倾向、加速行为、减速行为以及无明显含义等。

⑤计算相应主成成分得分以及综合主成成分得分，公式如下：

式中：e_i1，e_i2，…，e_im为主成成分系数向量；ZXm为Xm标准化的数据；λp为主成成分方差贡献值。

主成成分分析虽然可以有效提取车辆驾驶行为参数的主要成分，但是其主成成分的实际意义即涉及驾驶行为特征方面的信息有时并不是十分明确，需要辅以后续手段对其进行进一步处理即因子分析。值得说明的是，主成成分分析的这一不足并不影响其作为中间环节的价值，反而能为后续的研究起到一个很好的对比铺垫作用。

3、车辆驾驶行为参数因子分析

因子分析在一定程度上是主成成分分析的推广与扩展，以期弥补其在解读车辆驾驶行为参数主成成分在实际意义上的不足。因子分析与主成成分分析思想上类似，是将具有错综复杂关系的变量综合为数量较少的几个因子，以再现原始变量与因子之间的相互关系，探讨多个能够直接测量，并且具有一定相关性的实测指标是如何受少数几个内在的独立因子所支配的，同时根据不同因子还可以对变量进行分类。因子分析的目的就是减少变量的数目，用少数因子代替所有变量去分析整个问题。

同样设有n个车辆样本，m个车辆驾驶行为参数指标，X＝(X1,X2,…,Xm)T为车辆驾驶行为参数随机变量，要寻找公因子F＝F1,F2,…,Fp，则因子模型为：

矩阵A＝(b_ij)m×p称为因子载荷矩阵，b_ij为因子载荷，其实质就是公因子Fi和变量Xj的相关系数。ε为特殊因子，代表公因子以外的影响因素，实际分析时忽略不计。

总结为以下步骤：

①将步骤1第(2)步中提取的m个指标(即m＝8个)进行标准化处理，目的在于消除不同变量的量纲的影响，而且标准化转化不会改变变量的相关系数；

③进行正交变换，使用方差最大法，因子旋转后能得到更加合理的解释，例如变速行为、超速倾向、加速行为、减速行为等；

④确定因子(RC)个数p，一般推荐p＝2～4，计算相应因子得分及综合得分，进行后续聚类分析，因子得分是客观评价样本的重要依据，公式如下：

式中：fi1，fi2，…，fim为因子得分系数向量；ZXm为Xm标准化的数据；λp为因子方差贡献值。

因子分析是一个客观计算同主观思维相结合的过程，车辆驾驶行为参数因子分析弥补了主成成分分析的不足，解析出了理想的因子解，后续需要衔接其他数据挖掘手段(系统聚类)，利用解析出来的车辆驾驶行为参数因子解及各个样本(即车辆)的因子得分来求得驾驶风险聚类结果。

4、基于系统聚类的车辆驾驶风险分级

以车辆驾驶风险作为切入点，需要对车辆群组按照一定运行工况进行划分，找出风险程度类似车辆，以期实现对其合理化的管理，以及有针对性地设计并调整安全辅助驾驶系统的参数。

聚类分析是处理这一问题的有效方法，其通过直接比较各事物之间的性质，并将性质相近者归为一类，将性质差别较大者归入不同的类。聚类分析的基本思想是：将未知类别的样本或变量，依据相应的定义把它们分为若干类，分类过程是一个逐步减少类别的过程，在每一个聚类层次，必须满足“类内差异小，类间差异大”原则，直至归为一类。评价聚类效果的指标一般是方差，距离小的样本所组成的类方差较小。

采用系统聚类法，该方法已经有效的运用至各个领域，如气象、金融、交通等。其原理为：距离较近的样本先聚成类，距离较远的后聚成类，这个过程一直进行下去，最终每个样本总能聚到合适的类中。本发明中，聚类过程可以分为以下几个步骤：

①将各条数据各自作为一类，按照设定的距离计算各数据点之间的距离，形成一个距离阵；

本发明中，各条数据为通过步骤2获取的n台车辆相应主成成分得分以及综合主成成分得分，或者为通过步骤3获取的n台车辆因子得分以及综合得分。当通过步骤2获取的数据具有实际意义时，此时该步骤中，各条数据可选取通过步骤2获取的n台车辆相应主成成分得分以及综合主成成分得分，也可选取通过步骤3获取的n台车辆因子得分以及综合得分；当通过步骤2获取的数据不具有实际意义时，此时该步骤中，各条数据仅可选取过步骤3获取的n台车辆因子得分以及综合得分。

②将距离最近的两条数据并为一个类别，从而成为了n-1个类别，计算新产生的类别与其他各个类别之间的距离或者相似度，形成新的距离阵；

③按照和第②步是相同的原则，再将距离最接近的两个类别合并，这时如果类的个数仍然大于1，则继续重复这一步骤，直到所有的数据都被合并成为一个类别为止。

为了直观地反映以上的系统聚类过程，可以把整个分类系统画成一张谱系图，由于最终形成的谱系图形似大树，也被称之为树状图，如图2所示。

至此，完成了车辆驾驶风险分级方法的构建，总的来说，该方法首先通过主成成分分析把多个车辆驾驶行为特征参数作线性组合化为少数几个综合变量，即主成成分(PC)，以期反映原来多个指标代表的大部分涉及车辆驾驶风险特征的信息。为了得到更加合理明显的解释，可通过因子旋转得到旋转因子(RC)，旋转因子常比主因子蕴含更为明确的驾驶行为信息。这样每类因子就赋予了相应驾驶行为含义，采用系统聚类法以选取的测试阶段的车辆群组相应因子的得分作为聚类指标，按照相应因子解读的工况(例如变速行为、超速倾向、加速行为、减速行为以及综合驾驶行为等)实现对各个工况下车辆驾驶风险的分级聚类，分级聚类最终聚类级别的结果一般可为3～5个级别。

下面通过具体案例对本发明的面向智能网联车辆群组测试的驾驶风险分级聚类方法进行说明。

主要包括如下步骤：

(1)车辆驾驶行为特征参数提取

选定的智能网联车辆测试群组为30台样车，行驶与某高速公路测试示范区域，该段测试区域限速为120km/h。按照上述的步骤1提取8个涉及驾驶风险的行为特征参数，对选定测试工况的各个车辆驾驶数据进行分类制表，经处理后结果如表2所示。

表2车辆驾驶行为特征参数数据汇总(测试工况)

通过表2可以明显看出，样本车辆群组的驾驶行为参数直观上具有不同程度的差异，但是如果深入分析，捕捉其中的细节甚至按照驾驶风险这个标准对样本车辆群组进行区分就显得较有难度。

(2)驾驶行为参数主成成分分析与因子分析

采用SPSS 19.0统计软件对车辆驾驶行为参数数据矩阵进行因子分析，因子提取方法采用主成成分分析法，旋转方法采用方差最大正交旋转(Vatimax)法。SPSS(Statistical Product and Service Solutions)是一款用于统计学分析运算、数据挖掘、预测分析和决策支持任务的商业软件，其功能性在国内外的相应研究领域得到了广泛认可。

首先通过相关性分析，得出各变量KMO(Kaiser-Meyer-Olkin检验统计量)测度值为0.731，KMO统计量在0.7以上表明各指标之间有较强的相关性，分子分析比较好；样本数据球形假设检验的结果显著性水平为0.000，拒绝零假设，即各变量的独立性假设不成立。因此，因子分析的适用性检验通过。车辆驾驶行为参数因子分析结果如表3、表4所示。

表3特征值及方差贡献率

由表3可知，在累积方差为92.358％(>90％)的前提下，分析得到3个主成成分(PC1、PC2、PC3)，可见3个主成成分提供了源资料92.358％的信息量，满足因子分析的原则，并且旋转前后总的累计贡献率未改变，即总的信息量没有损失。进行因子旋转后，3个旋转因子(RC1、RC2、RC3)方差贡献率均为30％左右，可知RC1、RC2、RC3对驾驶行为特性影响显著，对驾驶行为特征贡献最大。

表4因子载荷矩阵

附：标明*的为因子载荷较大的数据，变量与某一个因子的载荷(绝对值)越大，则该因子与变量关系越近。

因子载荷是某个变量在其对应因子上的载荷，实际上就是变量与公因子的相关系数，表示变量依赖该因子的程度，反映了这个变量对于其相应公因子的重要性。由表4可知，PC1与所有涉及加速度的参数

关联度很大；PC2只与涉及速度的参数

关联度很大；而PC3仅与部分涉及加速度的参数

有关联。由上分析可得，PC1可以理解为一种与车辆变速行为(加速-减速)密切相关的因子；PC2可以理解为一种与车辆超速倾向密切相关的因子；而PC3并不能解读出明显的含义。

然而，另一方面PC1、PC2并不能从车辆加速或减速上来表征其关联性，对研究车辆驾驶风险还显不够丰富，为此对因子继续做旋转分析。旋转后，显然旋转因子RC1与涉及速度的参数关联度很大，这与PC2表征的意义一致；RC2只与涉及正加速度的参数

关联度大；RC3只与涉及减速度的参数关联度大。由上分析可得，RC1与PC2表征意义一致；RC2可以理解为一种与车辆加速行为密切相关的因子；RC3可以理解为一种与车辆减速行为密切相关的因子。

至此完成了车辆驾驶行为参数的因子分析，将8个具有较强相关性的车辆驾驶行为参数(物理变量)剥离成具有明确车辆驾驶行为信息的4个因子(具体含义)。

(3)车辆驾驶风险分级聚类结果

根据上述分析主因子(PC1)、旋转因子(RC1、RC2、RC3)表征的驾驶行为意义，按照相应驾驶行为(变速行为、超速倾向、加速行为、减速行为)可实现对样本车辆群组驾驶行为特征的聚类，分级聚类的结果即反映了不同聚类车辆相应驾驶行为风险水平的高低，聚类的指标为样本车辆相应因子的得分。因子得分的数学模型可使用回归估计方法得出，即用各公因子表示成参数变量的线性形式，然后进一步计算出因子得分，直至样本的综合得分。因子得分(含综合得分)是对样本车辆进行评价(含综合评价)的重要依据，是反映车辆驾驶行为风险水平的定量化排序。按照相应因子的得分对样本车辆进行系统聚类，结果如图3至图7，表5至表9所示。

①样本车辆变速驾驶行为五级风险聚类结果

由图3及表5可知，样本车辆驾驶风险水平按照主成成分PC1的特征(变速驾驶行为)可聚为五级。结果表明，其风险水平分布类似接近正态分布，中度及以下总占70％，高度风险仅占6.7％。因此样本车辆的驾驶人总体能较好的控制车辆的加速与制动，其中3号、20号车辆变速行为的风险程度最高。

表5样本车辆驾驶行为五级风险聚类结果(PC1，变速行为)

风险级别	因子得分	车辆变速驾驶行为	风险程度	分布比重
					I	(-5,-3]	10,14,17,29	低	13.3％
II	(-3,-1]	6,8,27	较低	10％
					III	(-1,1]	1,2,5,7,11,12,13,15,16,18,21,26,28,30	中	46.7％
IV	(1,3]	4,9,19,22,23,24,25	较高	23.3％
					V	(3,6]	3,20	高	6.7％

②样本车辆超速倾向驾驶行为五级风险聚类结果

由图4及表6可知，样本车辆驾驶风险水平按照因子RC1的特征(超速倾向驾驶行为)可聚为五级。结果表明，其较低风险与中度风险分布基本一致，约为30％；较高风险与高度风险分布基本一致，约为15％。1号车辆超速倾向的风险程度最低，而注意到具有高度变速行为驾驶风险的3号、20号车辆同时也具备高度超速倾向风险。

表6样本车辆驾驶行为五级风险聚类结果(RC1，超速倾向)

风险级别	因子得分	车辆超速倾向驾驶行为	风险程度	分布比重
					I	(-3,-1.5]	1	低	3.3％
II	(-1.5,-0.5]	6,10,12,14,16,17,19,24,28,30	较低	33.3％
					III	(-0.5,0.5]	5,7,8,9,13,15,18,22,26,27	中	33.3％
IV	(0.5,1.5]	2,11,23,25,29	较高	16.7％
					V	(1.5,3]	3,4,20,21	高	13.3％

③样本车辆加速驾驶行为五级风险聚类结果

由图5及表7可知，样本车辆驾驶风险水平按照因子RC2的特征(加速驾驶行为)可聚为五级。结果表明，其风险水平分布类似接近正态分布，较低及以下、中、较高及以上的风险程度分布基本一致，约为30％，其中3号、30号车辆加速行为的风险程度最高。

表7样本车辆驾驶行为五级风险聚类结果(RC2，加速行为)

风险级别	因子得分	车辆加速驾驶行为	风险程度	分布比重
					I	(-4,-2]	10,29	低	6.7％
II	(-2,0]	2,4,8,14,17,18,26,27	较低	26.7％
					III	(0,0.5]	1,5,6,7,9,13,19,21,23,24,25	中	36.7％
IV	(0.5,1]	11,12,15,16,20,22,28	较高	23.3％
					V	(1,2]	3,30	高	6.7％

④样本车辆减速驾驶行为五级风险聚类结果

由图6及表8可知，样本车辆驾驶风险水平按照因子RC3的特征(减速驾驶行为)可聚为五级。结果表明，其风险水平分布与加速驾驶行为有所不同，其中低度与高度风险的减速驾驶行为均比加速驾驶行为对应风险程度的分布比例高，可见驾驶人对于减速驾驶行为的判断与操作相比加速驾驶行为差异更大，实际中，车辆减速也常与危险事件联系更紧密。

表8样本车辆驾驶行为五级风险聚类结果(RC3，减速行为)

风险级别	因子得分	车辆减速驾驶行为	风险程度	分布比重
					I	(-2,-1]	8,11,14,15,17,21,27	低	23.3％
II	(-1,0]	2,5,6,7,12,13,16,29,30	较低	30％
					III	(0,0.5]	18,22,23,25,26,28	中	20％
IV	(0.5,1]	4,9,10	较高	10％
					V	(1,2]	1,3,19,20,24	高	20％

⑤样本车辆综合驾驶行为五级风险聚类结果

由图7及表9可知，样本车辆驾驶风险水平按照综合得分可聚为五级，即综合驾驶行为，其表明了样本车辆整体的驾驶行为特征。结果表明，较高及以上程度驾驶风险的样本车辆仍然占有一定比例，为43.4％，低程度驾驶风险的样本车辆比例仅为16.7％，其中，3号、20号车辆综合驾驶行为风险程度最高。

表9样本车辆驾驶行为五级风险聚类结果(综合得分，综合评价)

风险级别	因子得分	车辆驾驶行为(综合)	风险程度	分布比重
					I	(-1.5,-0.2]	1,10,14,17,29	低	16.7％
II	(-0.2,0]	6,8,19,27	较低	13.4％
					III	(0,0.3]	7,9,12,16,18,24,26,28	中	26.7％
IV	(0.3,1]	2,4,5,11,13,15,21,22,23,25,30	较高	36.7％
					V	(1,1.5]	3,20	高	6.7％

可以看出上述5种风险聚类结果之间具有一定耦合关系，例如3号、20号车辆在5种风险聚类里均表现出高程度的风险水平，而1号车辆在变速驾驶行为上表现出中等程度驾驶风险，而在超速倾向驾驶行为上表现出低程度驾驶风险。

研究结果应用可如下，例如对于3号、20号车辆需要全程进行重点监控测试，而4号、21号这类高度超速倾向的车辆也需有针对性进行测试分析让其合理控制车速，1号、19号、24号这类在减速驾驶行为上具有高风险的车辆，也需要重点测试分析。

综上，利用本发明完成了车辆驾驶风险分级聚类，其结果一方面可以根据需要研究的典型驾驶行为(变速行为、超速倾向、加速行为、减速行为)从四个角度来捕捉样本车辆群组测试阶段的高驾驶风险车辆；另一方面可以通过综合驾驶行为来整体捕捉具有高驾驶风险的样本车辆，从整体上反映车辆群组驾驶行为的风险情况；再者通过驾驶风险的分布比重可以有侧重地监控某一类别驾驶行为在具体某一驾驶风险程度上的样本车辆。研究结果可以在智能网联车辆群组测试时针对性地对重点测试车辆进行监控，以期保证智能网联车辆群组测试的准确性。

本发明解决现阶段驾驶数据难以与样本车辆群组在驾驶风险方面进行关联匹配的问题，本发明以驾驶数据为基础，首先从20个常用车辆驾驶行为参数中提取出了8个涉及驾驶风险的参数，并利用主成成分分析与因子分析相结合的方法，从8个参数中进一步剥离出了4个与车辆典型驾驶行为(含综合驾驶行为)直接相关的因子；然后利用系统聚类法按照相应车辆驾驶行为的因子得分(含综合驾驶行为)对测试工况的样本车辆群组进行聚类；最后对相应车辆驾驶行为的聚类结果进行了合理地分析解读。研究表明，所提出的车辆驾驶行为分级风险聚类方法可以有效地实现车辆典型驾驶行为的分级聚类，为驾驶测试数据与样本车辆群组之间建立了一种驾驶风险分析的途径。研究结果可以在智能网联车辆群组测试时有针对性地对重点测试车辆进行监控，以期保证智能网联车辆群组测试的准确性。

上述实施例只为说明本发明的技术构思及特点，其目的在于让熟悉此项技术的人士能够了解本发明的内容并加以实施，并不能以此限制本发明的保护范围，凡根据本发明精神实质所作的等效变化或修饰，都应涵盖在本发明的保护范围内。

Claims

1.一种面向智能网联车辆群组测试的驾驶风险分级聚类方法，其特征在于：所述方法包括：

(1)车辆驾驶行为特征参数提取；

(2)车辆驾驶行为参数主成成分分析；

(3)车辆驾驶行为参数因子分析；

(4)基于系统聚类的车辆驾驶风险分级。

2.根据权利要求1所述的面向智能网联车辆群组测试的驾驶风险分级聚类方法，其特征在于：步骤(2)中，主成成分分析模型为：

3.根据权利要求2所述的面向智能网联车辆群组测试的驾驶风险分级聚类方法，其特征在于：主成成分分析模型满足以下条件：

(1)每个主成成分系数平方和为1；

(2)主成成分之间互不相关；

(3)主成成分方差依次递减。

4.根据权利要求2所述的面向智能网联车辆群组测试的驾驶风险分级聚类方法，其特征在于：步骤(2)包括如下步骤：

①对步骤(1)提取的m个指标进行标准化处理；

②根据标准化后的数据矩阵求出协方差或相关阵；

③求出协方差矩阵的特征根和特征向量；

④确定主成成分；

⑤计算相应主成成分得分以及综合主成成分得分。

5.根据权利要求1所述的面向智能网联车辆群组测试的驾驶风险分级聚类方法，其特征在于：步骤(3)中，因子分析模型为：

6.根据权利要求5所述的面向智能网联车辆群组测试的驾驶风险分级聚类方法，其特征在于：步骤(3)包括如下步骤：

①对步骤(1)提取的m个指标进行标准化处理；

③进行正交变换；

④确定因子个数，计算相应因子得分及综合得分。

7.根据权利要求6所述的面向智能网联车辆群组测试的驾驶风险分级聚类方法，其特征在于：使用方差最大法进行正交变换。

8.根据权利要求1所述的面向智能网联车辆群组测试的驾驶风险分级聚类方法，其特征在于：步骤(4)包括如下步骤：

9.根据权利要求1或8所述的面向智能网联车辆群组测试的驾驶风险分级聚类方法，其特征在于：当通过步骤(2)获取的数据具有实际意义时，步骤(4)中选取步骤(2)或步骤(3))获取的数据进行聚类分析，当通过步骤(2)获取的数据不具有实际意义时，步骤(4)中选取步骤(3)获取的数据进行聚类分析。

10.根据权利要求1所述的面向智能网联车辆群组测试的驾驶风险分级聚类方法，其特征在于：步骤(1)中提取的车辆驾驶行为特征参数包括车速超过限速80％的时间比例、车速平均值、车速标准差、加速度标准差、正加速度平均值、正加速度标准差、负加速度/减速度平均值和负加速度标准差。