CN113591780A - 一种驾驶员行车风险鉴定方法及系统 - Google Patents

一种驾驶员行车风险鉴定方法及系统 Download PDF

Info

Publication number
CN113591780A
CN113591780A CN202110920670.5A CN202110920670A CN113591780A CN 113591780 A CN113591780 A CN 113591780A CN 202110920670 A CN202110920670 A CN 202110920670A CN 113591780 A CN113591780 A CN 113591780A
Authority
CN
China
Prior art keywords
driving
behavior
driver
risk
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110920670.5A
Other languages
English (en)
Inventor
王旭
马菲
廖小棱
张伟
于迪
常玉涛
陈西广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong High Speed Information Group Co Ltd
Shandong University
Original Assignee
Shandong High Speed Information Group Co Ltd
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong High Speed Information Group Co Ltd, Shandong University filed Critical Shandong High Speed Information Group Co Ltd
Priority to CN202110920670.5A priority Critical patent/CN113591780A/zh
Publication of CN113591780A publication Critical patent/CN113591780A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明属于驾驶行为数据处理领域,提供了一种驾驶员行车风险鉴定方法及系统。其中,该方法包括获取驾驶数据,从驾驶数据中提取驾驶行为特征指标;基于驾驶行为特征指标及行为分类模型,识别出驾驶行为,且当驾驶行为属于激进型时,输出风险预警信息;其中,驾驶行为包括激进、一般与平静三种驾驶风格。

Description

一种驾驶员行车风险鉴定方法及系统
技术领域
本发明属于驾驶行为数据处理领域,尤其涉及一种驾驶员行车风险鉴定方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
道路交通安全问题是近年来全球交通领域关注的热点问题。据统计,大量道路交通事故致因分析表明,超过80%的事故与驾驶员行为操作有关,其中驾驶风格与事故发生率之间存在较强的相关性,美国国家公路交通安全管理局(NHTSA)发现,攻击性驾驶行为约占所有致命交通事故的三分之二。驾驶员驾驶风格的激进程度越高,在驾驶过程中越容易出现急变速、频繁换道、超速行驶等不良驾驶行。这些不良驾驶行为频繁造成恶性交通事故的发生,促使研究者们开始重视驾驶风格对交通安全的影响。
驾驶风格是指驾驶员操纵车辆所表现出的相对稳定的行为特性,是一种具有个体性、差异性的倾向性行为。目前,国内外众多学者在分析驾驶风格影响因素的基础上,提取表征驾驶风格的特征参数,对驾驶风格进行分类。最早对驾驶风格的研究以问卷调查的形式从文化、性别、地域等角度出发,设计驾驶行为问卷(DBQ)以及多维度驾驶风格量表(MDSI)。问卷调查方法虽简便可行,但受驾驶员的主观情绪影响,调查结果的准确性、可靠性难以保证。
车联网以及大数据技术的发展促使许多学者逐渐开始利用自然驾驶实验数据中的客观参数建立驾驶风格分类体系,如Bellem等将加速度、速度或踏板位置等自然驾驶实验数据的平均值、标准差或极值作为特征参数,再利用主成分分析(PCA)算法对上述特征进行降维处理并利用K-means聚类划分驾驶风格。总体来说,当前利用自然驾驶实验数据识别驾驶风格方面的研究主要分为两类:1)利用无监督学习算法从上述驾驶特征参数中直接识别驾驶员的驾驶风格。如Bender等利用结合序列分割算法的贝叶斯多元线性模型,通过自然驾驶数据推断驾驶行为;Koh等利用高斯混合模型(GMM)直接对驾驶风格进行梯度分类。然而这类识别需要对样本数据进行大量处理分析,才能得到可靠的分类结果。2)先使用聚类算法对驾驶员风格样本打上类别标签,再建立驾驶风格识别模型并优化其识别精度。
K-means方法是一种简单易理解的聚类算法,常常被研究者们用于驾驶风格样本划分,但研究表明,K-means方法具有一定的局限性,算法中聚类数K值以及初始聚类中心的随机选定均会对聚类效果产生一定影响。而K-means++算法则可以在优化K-means聚类中心选取问题的同时,保证K值的选取。因此,本研究同时选用K-means与K-means++进行驾驶风格样本划分,并选取聚类效果较优的作为下一步识别模型的输入。此外,发明人发现,现有的驾驶风格评价指标种类繁多,选取过多的指标在增大数据采集及处理难度、识别系统通信带宽要求的同时,也会降低驾驶风格识别结果的精度,无法及时给予驾驶员正确的预警提醒,降低识别系统的可靠性。同时,过多数据指标的要求也会对系统用户的隐私造成威胁。但是,现有驾驶风格分类及识别研究较少关注如何选取合理数量和类型的指标集以精准地反映驾驶风格,进行危险驾驶行为预警。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种驾驶员行车风险鉴定方法及系统。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种驾驶员行车风险鉴定方法。
一种驾驶员行车风险鉴定方法,其包括:
获取驾驶数据,从驾驶数据中提取驾驶行为特征指标;
基于驾驶行为特征指标及行为分类模型,识别出驾驶行为,且当驾驶行为属于激进型时,输出风险预警信息;其中,驾驶行为包括激进、一般与平静三种驾驶风格。
进一步地,从驾驶数据中提取驾驶行为特征指标的过程包括:
从驾驶数据集中提取不同驾驶员的驾驶行程事件,计算驾驶特征参数并建立驾驶风格指标体系;
将主成分分析得到的驾驶综合评价得分作为输入变量,实现驾驶风格分类;
通过对比至少两种设定筛选方法的最佳特征筛选结果,得到与驾驶行为最密切相关的特征指标。
进一步地,所述设定筛选方法包括支持向量机-递归特征消除算法与随机森林-递归特征消除算法。
进一步地,支持向量机-递归特征消除算法的最佳特征筛选结果包括平均纵向加速度、垂向加速度平均值、速度标准差、最小纵向加速度、最小垂向加速度和最大速度。
进一步地,随机森林-递归特征消除算法的最佳特征筛选结果包括最大速度、最小纵向加速度、最小垂向加速度、速度标准差、距离和平均速度。
进一步地,与驾驶行为最密切相关的特征指标为最小纵向加速度、最小垂向加速度和最大速度中的任一者或是任意组合。
进一步地,所述行为分类模型为K-means++聚类模型。
本发明的第二个方面提供一种驾驶员行车风险鉴定系统。
一种驾驶员行车风险鉴定系统,其包括:
行为特征指标提取模块,其用于获取驾驶数据,从驾驶数据中提取驾驶行为特征指标;
驾驶行为识别预警模块,其用于基于驾驶行为特征指标及行为分类模型,识别出驾驶行为,且当驾驶行为属于激进型时,输出风险预警信息;其中,驾驶行为包括激进、一般与平静三种驾驶风格。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的驾驶员行车风险鉴定方法中的步骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的驾驶员行车风险鉴定方法中的步骤。
与现有技术相比,本发明的有益效果是:
本发明通过从驾驶数据中提取驾驶行为特征指标,基于驾驶行为特征指标及行为分类模型,识别出驾驶行为,且当驾驶行为属于激进型时,输出风险预警信息;其中,驾驶行为包括激进、一般与平静三种驾驶风格,提高了驾驶风格识别的准确性。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明实施例的驾驶员行车风险鉴定方法流程图;
图2是本发明实施例的主成分贡献率图;
图3是本发明实施例的特征个数与交叉验证正确分类分值图示;
图4是本发明实施例的最大速度分布图;
图5是本发明实施例的平均速度分布图;
图6是本发明实施例的神经网络模型图;
图7是本发明实施例的测试样本测试结果图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本实施例使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
如图1所示,本实施例的驾驶员行车风险鉴定方法,具体包括如下步骤:
步骤S101:行为特征指标提取模块,其用于获取驾驶数据,从驾驶数据中提取驾驶行为特征指标。
在具体实施中,从驾驶数据中提取驾驶行为特征指标的过程包括:
从驾驶数据集中提取不同驾驶员的驾驶行程事件,计算驾驶特征参数并建立驾驶风格指标体系;
将主成分分析得到的驾驶综合评价得分作为输入变量,实现驾驶风格分类;
通过对比至少两种设定筛选方法的最佳特征筛选结果,得到与驾驶行为最密切相关的特征指标。
其中,这里的驾驶行程事件就是不同驾驶员的行程(即每位驾驶员行驶多少里程,行驶过程中的速度、加速减速度等等)。
例如,所述设定筛选方法包括支持向量机-递归特征消除算法与随机森林-递归特征消除算法。其中,支持向量机-递归特征消除算法的最佳特征筛选结果包括平均纵向加速度、垂向加速度平均值、速度标准差、最小纵向加速度、最小垂向加速度和最大速度。随机森林-递归特征消除算法的最佳特征筛选结果包括最大速度、最小纵向加速度、最小垂向加速度、速度标准差、距离和平均速度。
与驾驶行为最密切相关的特征指标为最小纵向加速度、最小垂向加速度和最大速度中的任一者或是任意组合。
作为一种优选的方案,与驾驶行为最密切相关的特征指标选择最大速度。
本实施例依托美国安全试验模型部署计划(Safety Pilot Model Deployment,SPMD)数据集中的基本安全信息(Basic Safety Message)子数据集,首先从自然驾驶数据中提取出不同驾驶员的驾驶行程事件,计算驾驶特征参数并建立驾驶风格指标体系,然后将主成分分析得到的驾驶综合评价得分作为输入变量,利用K-means与K-means++实现驾驶风格分类,最后通过对比支持向量机-递归特征消除算法(Support VectorClassification-recursive feature elimination,SVC-RFE)与随机森林-递归特征消除算法(Random Forest-recursive feature elimination,RF-RFE)的最佳特征筛选结果,得到与驾驶行为最密切相关的特征指标,利用神经网络驾驶风格识别模型验证指标的有效性,并探究不同风格的驾驶员在所选特征指标间的差异。
本实施例选择美国安全试验模型部署计划(SPMD)里的主数据集—基本安全信息(BSM)来观察研究驾驶员微观驾驶行为。SPMD(https://www.its.dot.gov/data/)在密歇根州安娜堡市对近3000辆配备车-车通信设备(V2V)的联网车辆进行了多模式的交通测试,全面地收集了各车辆的驾驶状态数据,是目前规模最大的车联网车辆数据实地采集项目之一。
BSMs数据集主要包含关于车辆运动状态(即速度、加速度和偏航率)和位置的数据,具体来说,本研究使用的是BSMs主文件“BsmP1”中2013年4月的数据。由于BsmP1数据是一组以10Hz频率测量的高分辨率微观交通数据,虽然其个别时间点观测数据包含了关于速度、加速度和偏航率的信息,但对于描述车辆驾驶行为以及研究驾驶风格而言,它却缺乏整个驾驶事件的背景信息。因此,在这项研究中,首先要确保数据格式适用于驾驶风格聚类。同时,为了更直观、可靠地分析驾驶员的驾驶风格,本研究应用MATLAB软件,按照连续的行程以及车辆ID分割每辆车的数据,合并同一驾驶员的不同行程,并将速度、加速度、偏航率的时间点数据进行统计学处理,生成平均值、标准差、最大值和最小值以及行程距离等驾驶风格量化指标,进而得到242名驾驶员的驾驶风格量化数据集。此外,考虑到驾驶员对加速的快速变化比加速本身更敏感,本研究还引入加速度冲击度即加速度变化率(jerk)作为驾驶风格评价指标。本实施例所选择的指标具体如表1所示。
表1驾驶风格量化指标集
Figure BDA0003207286340000081
主成分分析(Principal Component Analysis,PCA)是统计学中指标降维较常用的方法,考虑到上述18个驾驶风格指标的相关性以及后续驾驶风格聚类所需的工作量,本实施例采用主成分分析方法实现驾驶风格指标集的降维处理。其主要思想是将m维特征利用正交变化映射到p维(p<m)上,这p维则是包含原来m维信息的彼此相互独立的主成分。针对本实施例选取的驾驶风格评价指标,在Python中导入242×18维数据集,首先对原始数据进行标准化处理,计算其相关系数矩阵与特征值、特征向量,然后按以下公式得到各主成分的信息贡献率与累计贡献率。
①计算特征值λi(j=1,2,…,m)的信息贡献率和累积贡献率。
Figure BDA0003207286340000082
其中,bj为主成分yi的信息贡献率。
Figure BDA0003207286340000091
其中,αP为主成分y1,y2,…,yP的累积贡献率。当αP接近于1时,则选择前p个指标变量y1,y2,…,yP作为p个主成分,代替原来m个指标变量,从而可对p个主成分进行综合分析。
图2为18个主成分的累积贡献率,横坐标是18个主成分变量,柱状图的纵坐标是各主成分的信息贡献率,其值越大,包含的数据信息越多,折线图的纵坐标是各主成分的累积贡献率。如图2与表2所示,前6个主成分的累积贡献率达到85%,可用其代表原有18个评价指标,计算242名驾驶员的主成分得分。
表2各主成分的信息贡献率与累积贡献率
Figure BDA0003207286340000092
②算综合得分。
Figure BDA0003207286340000093
式中,Z为各驾驶样本的主成分得分,根据Z值可进行评价。
表3驾驶员主成分得分
Figure BDA0003207286340000094
表3为242名驾驶员前6个主成分的得分,主成分的得分作为之后K-means与K-means++聚类模型的输入。此外,为了评价各指标在所选前六个主成分中的重要性,本实施例继续计算了各指标的因子载荷量,也称为主成分Yj与指标Qi的相关系数,其绝对值的大小反映了指标Qi与主成分Yj关系的密切程度。由表2和表4可以看出,第一主成分Y1包含的最大信息量为24.2%,且与Q10最小横向加速度、Q8平均横向加速度这两个指标关系最密切,其相关系数绝对值分别为0.710和0.705,可见第一主成分极大程度上反映了驾驶员的横向加速度信息,第二主成分Y2包含的信息量次之,为21.9%,且与Q4速度标准差、Q9最大横向加速度关系最为密切,其相关系数绝对值分别为0.676、0.646,可见第二主成分综合反映了驾驶员的运动状态信息,第三主成分Y3包含的最大信息量为15%,且与Q16纵向冲击度平均值、Q17垂向冲击度平均值关系最为密切,其相关系数绝对值分别为0.841、0.832,因而第三主成分可被看作是加速变化的代表。总的来说,虽然每个主成分都包含了各个指标信息,但具体到某个主成分,其主要侧重于反映某一个或某几个指标信息
③算因子载荷量
Figure BDA0003207286340000101
式中,var(Qi)为指标Qi的方差,cij为各个主成分的系数,
Figure BDA0003207286340000102
表4各指标的因子载荷量
Figure BDA0003207286340000111
步骤S102:驾驶行为识别预警模块,其用于基于驾驶行为特征指标及行为分类模型,识别出驾驶行为,且当驾驶行为属于激进型时,输出风险预警信息;其中,驾驶行为包括激进、一般与平静三种驾驶风格。
具体地,将驾驶员的驾驶行为特征指标作为K-means与K-means++聚类算法的输入变量,根据样本之间的联系将驾驶员聚类为激进、一般与平静三种驾驶风格,并利用轮廓系数法比较两种聚类方法的好坏,选取聚类效果较优的K-means++作为最终驾驶行为分类结果。
优选地,所述行为分类模型为K-means++聚类模型。
K-means算法是一种基于划分的无监督动态聚类算法,以欧式距离作为样本相似性度量准则,距离越小,样本相似性越高,从而将相似度较高的对象划分到同一聚类的簇内,不同聚类的簇内对象相似度较小。K-means算法首先从样本数据集中随机选取K个样本作为聚类中心,计算每个样本与聚类中心的距离,并将其划分到与样本相似性最高的聚类中心所属的簇内,迭代更新K个聚类中心的位置,当误差平方和最小时,算法收敛。
K-means算法的具体聚类过程如下:
Step 1:确定聚类数目k,从样本数据集中随机选取k个样本作为初始聚类中心Ci,其中i=1,2,3..,k。
Step 2:提取数据集中其余样本Xi,分别计算与k个聚类中心Ci的距离D(Xi,Ci),并将其划分到距离最小的聚类中心所对应的簇中;
Figure BDA0003207286340000121
其中,p为样本数据的维度;Xij和Cij为Xi和Ci的第j维属性。
Step 3:针对每个簇,重新计算聚类中心;
Figure BDA0003207286340000122
Step 4:重复Step2和Step3,直到类内误差平方和SSE达到最小,聚类中心不再改变,算法收敛;
Figure BDA0003207286340000123
Step 5:输出K-means算法聚类结果。
算法易收敛于局部最优解。因此,相关研究[28]提出K-means++算法,对初始聚类中心的选择进行改进。随机选择样本数据集中某一样本作为第一个聚类中心,计算每个样本与当前已知聚类中心的距离,距离最远的样本点有更大的可能性被选择成为新的聚类中心,重复以上步骤直到K个初始聚类中心全部确定,应用这K个初始聚类中心进行聚类操作。
K-means++算法的聚类过程如下:
Step 1:从样本数据集中随机选择一个样本作为第一个聚类中心C1
Step 2:对于数据集中每个点Xi,计算它与已知聚类中心的距离D(x),其被选为新的聚类中心的概率为
Figure BDA0003207286340000131
按照轮盘法选出新的聚类中心;
Step 3:重复Step2,直到k个初始聚类中心全部确定;
Step 4:提取数据集中其余样本Xj,分别计算与k个聚类中心的距离,并将其划分到距离最小的聚类中心所对应的簇中;
Step 5:针对每个簇,重新计算聚类中心;
Step 6:重复Step2和Step3,直到类内误差平方和达到最小,聚类中心不再改变,算法收敛;
Step 7:输出K-means算法聚类结果。
为了客观地评价两种方法的聚类效果,本实施例选取轮廓系数法(SilhouetteCoefficient)进行比较,对于无监督学习聚类驾驶风格样本而言,轮廓系数法从a(i)内聚度、b(i)分离度两个角度评价了聚类结果的集中程度。轮廓系数的值介于[-1,1]之间,越趋近于1越代表内聚度和分离度都相对较优,聚类效果好。对于第i个驾驶样本而言,其Silhouette值Si计算如下:
Figure BDA0003207286340000132
其中,a(i)为簇内不相似度,表示驾驶样本i到同簇内其他样本不相似程度的平均值;b(i)为簇间不相似度,表示驾驶样本i到其他簇的平均不相似程度的最小值。
根据驾驶风格的一般分类,将驾驶风格分为3类,即平静型、一般型和激进型。K-means与K-means++的聚类评价结果如下:
表5 K-means与K-means++聚类效果评价
Figure BDA0003207286340000141
对比K-means与K-means++的聚类结果,发现两者迭代次数相同的情况下,K-means++的轮廓系数值大于K-means,这说明K-means++的聚类效果更优,故本实施例选择K-means++的聚类结果作为下一步递归特征消元算法(Recursive Feature Elimination)的输入,完成驾驶风格样本标记工作。
构建简洁明了的驾驶风格评价体系、寻找能最大程度表征驾驶风格的特征指标,对驾驶行为研究或是未来驾驶辅助系统的升级优化都显得尤为重要。过往研究在如何选取驾驶指标以及选取多少个指标上并未给出统一的说法。过多地选取指标或许能更全面的反应驾驶行为,但这可能在增加工作量的同时降低了分类的精度。同时,通过分析前面六大主成分与指标间的相关系数可知,即使选取大量的指标进行降维处理,但最终确定的主成分对于每个指标的反映也是有所侧重的,这种侧重可能会削弱某些重要因素从而影响到后续的驾驶行为分析。因此,本实施例选取支持向量机(Support Vector Classification,SVC)与随机森林(Random Forest)为底层迭代模型,构建SVC-RFE与RF-RFE模型进行驾驶风格指标筛选,筛选最能表征驾驶风格的特征参数。
递归特征消元(Recursive Feature Elimination,RFE)是一种性能良好的后向搜索特征筛选方法,本实施例选择的第一种方法为支持向量机-递归特征消除算法SVC-RFE(Support Vector Classification-recursive feature elimination,SVC-RFE),其中SVC是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,在N维样本空间里找到一个分类超平面,将空间上的训练样本进行分类。第二种方法为随机森林-递归特征消元算法(Random Forest-recursive feature elimination,RF-RFE),随机森林是一种利用多棵树训练样本的分类器,可以随机选择决策树节点划分特征,在训练样本特征维度很高时,仍能高效地训练模型,是boosting算法的一种。SVC-RFE与RF-RFE能够通过SVC与RF进行指标重要性排序,进一步利用RFE筛选重要指标。
本实施例使用三折交叉验证确定重要指标个数,两种集成算法的最佳特征个数与交叉验证正确分类分值如图3所示。在n=6时,两种方法的分类正确率均在85%以上;进一步计算前6个特征的重要度发现,两种方法的筛选结果均包括最大速度、速度标准差、最小垂向加速度、最小纵向加速度,重合率66.7%。不同的是,如表6所示,在SVC-RFE中,排名最高的是平均纵向加速度,分值为4.979,在RF-RFE中,排名最高的是最大速度,分值为0.0867,结合图2,纵坐标是两种方法的交叉验证正确分类分值,RF-RFE的曲线在上,它的正确分类分值更高。本实施例选择排序正确分值较高的RF-RFE作为最终结果。
表6 SVC-RFE与RF-RFE排名前6的特征及重要性分值
Figure BDA0003207286340000151
本实施例选取RF-RFE排名最高的最大速度和排名最低的平均速度,进一步验证不同驾驶风格驾驶员在选取指标方面的差异。图4横坐标为驾驶员的驾驶风格,纵坐标是驾驶员的最大速度值,由图4可知,58名激进型驾驶员的最大速度平均水平可达29.40m·s-1,与平静型、一般型驾驶员的速度差值可达10m·s-1;图5横坐标为驾驶员的驾驶风格,纵坐标是驾驶员的平均速度,由图5可知,58名激进驾驶员的平均速度约16.82m·s-1,与平静、一般型驾驶风格的驾驶员相差间隔较小。结合表6和图3的观察结果,本实施例使用最大速度作为下一步神经网络驾驶风格识别模型的输入变量。同时,将主成分分析得到的表2、表4与图3、表6对比分析可知,作为驾驶样本划分输入的六大主成分主要侧重反映了加速度等指标,而忽视了最大速度,这或许会对无监督学习算法的驾驶样本划分结果造成一定影响。
本实施例选择利用神经网络搭建驾驶风格识别模型验证所选指标的合理性。神经网络识别具有客观性强,处理大数据大样本能力强、可自学习的特点,被广泛用于驾驶风格识别。随机选取242个驾驶样本中的170个样本进行神经网络训练,剩余72个样本用来验证该模型的识别精度。将242个样本的最大速度作为神经网络的输入,以242个样本的分类结果Y(平静型为矩阵[1,0,0],一般型为[0,1,0],激进型为[0,0,1])作为神经网络模型的输出,隐含层的层数设置为10,训练函数为trainscg函数,如图5所示。该模型的权重为W,偏移量为b,隐含层传递函数为sigmoid函数,输出层传递函数为softmax函数。图6为72组测试样本的分类结果,给出了3种驾驶风格样本,平静样本25个,一般型样本30个,激进型样本7个。如图7所示,测试结果表明,仅使用最大速度这一个变量作为驾驶风格识别模型的输入,模型识别精度可达86.1%。因此,本实施例建议在驾驶风格识别工作中优先考虑驾驶员的最大速度指标。
实施例二
本实施例提供了一种驾驶员行车风险鉴定系统,其具体包括:
行为特征指标提取模块,其用于获取驾驶数据,从驾驶数据中提取驾驶行为特征指标;
驾驶行为识别预警模块,其用于基于驾驶行为特征指标及行为分类模型,识别出驾驶行为,且当驾驶行为属于激进型时,输出风险预警信息;其中,驾驶行为包括激进、一般与平静三种驾驶风格。
此处需要说明的是,本实施例的驾驶员行车风险鉴定系统中的各个模块,与实施例一中的驾驶员行车风险鉴定方法中的各个步骤一一对应,其具体实施过程相同,此处不再累述。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的驾驶员行车风险鉴定方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的驾驶员行车风险鉴定方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种驾驶员行车风险鉴定方法,其特征在于,包括:
获取驾驶数据,从驾驶数据中提取驾驶行为特征指标;
基于驾驶行为特征指标及行为分类模型,识别出驾驶行为,且当驾驶行为属于激进型时,输出风险预警信息;其中,驾驶行为包括激进、一般与平静三种驾驶风格。
2.如权利要求1所述的驾驶员行车风险鉴定方法,其特征在于,从驾驶数据中提取驾驶行为特征指标的过程包括:
从驾驶数据集中提取不同驾驶员的驾驶行程事件,计算驾驶特征参数并建立驾驶风格指标体系;
将主成分分析得到的驾驶综合评价得分作为输入变量,实现驾驶风格分类;
通过对比至少两种设定筛选方法的最佳特征筛选结果,得到与驾驶行为最密切相关的特征指标。
3.如权利要求2所述的驾驶员行车风险鉴定方法,其特征在于,所述设定筛选方法包括支持向量机-递归特征消除算法与随机森林-递归特征消除算法。
4.如权利要求3所述的驾驶员行车风险鉴定方法,其特征在于,支持向量机-递归特征消除算法的最佳特征筛选结果包括平均纵向加速度、垂向加速度平均值、速度标准差、最小纵向加速度、最小垂向加速度和最大速度。
5.如权利要求4所述的驾驶员行车风险鉴定方法,其特征在于,随机森林-递归特征消除算法的最佳特征筛选结果包括最大速度、最小纵向加速度、最小垂向加速度、速度标准差、距离和平均速度。
6.如权利要求5所述的驾驶员行车风险鉴定方法,其特征在于,与驾驶行为最密切相关的特征指标为最小纵向加速度、最小垂向加速度和最大速度中的任一者或是任意组合。
7.如权利要求1所述的驾驶员行车风险鉴定方法,其特征在于,所述行为分类模型为K-means++聚类模型。
8.一种驾驶员行车风险鉴定系统,其特征在于,包括:
行为特征指标提取模块,其用于获取驾驶数据,从驾驶数据中提取驾驶行为特征指标;
驾驶行为识别预警模块,其用于基于驾驶行为特征指标及行为分类模型,识别出驾驶行为,且当驾驶行为属于激进型时,输出风险预警信息;其中,驾驶行为包括激进、一般与平静三种驾驶风格。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的驾驶员行车风险鉴定方法中的步骤。
10.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的驾驶员行车风险鉴定方法中的步骤。
CN202110920670.5A 2021-08-11 2021-08-11 一种驾驶员行车风险鉴定方法及系统 Pending CN113591780A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110920670.5A CN113591780A (zh) 2021-08-11 2021-08-11 一种驾驶员行车风险鉴定方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110920670.5A CN113591780A (zh) 2021-08-11 2021-08-11 一种驾驶员行车风险鉴定方法及系统

Publications (1)

Publication Number Publication Date
CN113591780A true CN113591780A (zh) 2021-11-02

Family

ID=78257249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110920670.5A Pending CN113591780A (zh) 2021-08-11 2021-08-11 一种驾驶员行车风险鉴定方法及系统

Country Status (1)

Country Link
CN (1) CN113591780A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114043989A (zh) * 2021-11-29 2022-02-15 江苏大学 一种基于递归图和卷积神经网络的驾驶风格识别模型、换道决策模型及决策方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109597342A (zh) * 2019-01-16 2019-04-09 郑州轻工业学院 一种动态组网智能辨识的采砂船监测装置及方法
CN110321954A (zh) * 2019-07-03 2019-10-11 中汽研(天津)汽车工程研究院有限公司 适合国内人群的驾驶风格分类和识别方法及系统
CN112651666A (zh) * 2021-01-16 2021-04-13 北京工业大学 一种基于驾驶模式转移特征的驾驶员风险评估方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109597342A (zh) * 2019-01-16 2019-04-09 郑州轻工业学院 一种动态组网智能辨识的采砂船监测装置及方法
CN110321954A (zh) * 2019-07-03 2019-10-11 中汽研(天津)汽车工程研究院有限公司 适合国内人群的驾驶风格分类和识别方法及系统
CN112651666A (zh) * 2021-01-16 2021-04-13 北京工业大学 一种基于驾驶模式转移特征的驾驶员风险评估方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MOTONORI ISHIBASHI 等: "Indices for Characterizing Driving Style and their Relevance to Car Following Behavior", 《SICE ANNUAL CONFERENCE 2007》, pages 1132 - 1137 *
吴振昕 等: "基于大数据的驾驶风格识别算法研究", 《汽车技术》, pages 10 - 15 *
孙剑 等: "基于自然驾驶数据的分心驾驶行为识别方法", 《中国公路学报》, vol. 33, no. 9, pages 225 - 235 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114043989A (zh) * 2021-11-29 2022-02-15 江苏大学 一种基于递归图和卷积神经网络的驾驶风格识别模型、换道决策模型及决策方法
CN114043989B (zh) * 2021-11-29 2024-06-07 江苏大学 一种基于递归图和卷积神经网络的驾驶风格识别模型、换道决策模型及决策方法

Similar Documents

Publication Publication Date Title
Ma et al. Driving style recognition and comparisons among driving tasks based on driver behavior in the online car-hailing industry
Qi et al. Recognizing driving styles based on topic models
Chen et al. Driving safety risk prediction using cost-sensitive with nonnegativity-constrained autoencoders based on imbalanced naturalistic driving data
CN110120218A (zh) 基于gmm-hmm的高速公路大型车辆识别方法
CN113232669B (zh) 一种基于机器学习的驾驶风格辨识方法
CN108681742B (zh) 用于分析司机驾驶行为对车辆能耗敏感性的分析方法
Yang et al. Classification and evaluation of driving behavior safety levels: A driving simulation study
CN111563555A (zh) 一种司机驾驶行为分析方法及系统
CN110858312A (zh) 基于模糊c均值聚类算法的驾驶员驾驶风格分类方法
CN113581188A (zh) 一种基于车联网数据的商用车驾驶员驾驶风格识别方法
CN114971156A (zh) 一种基于大数据危险场景的驾驶风格分析方法
CN115092165A (zh) 一种基于聚类模型的不同循环工况下驾驶员风格辨识方法
CN116028884A (zh) 一种小样本下基于原型网络的车辆换道风险评估方法
CN113297795A (zh) 一种纯电动汽车行驶工况构建方法
Halim et al. Deep neural network-based identification of driving risk utilizing driver dependent vehicle driving features: A scheme for critical infrastructure protection
Yang et al. Driving behavior safety levels: Classification and evaluation
CN113761715B (zh) 一种基于高斯混合和隐马尔可夫的个性化车辆跟驰模型的建立方法
CN112308136B (zh) 一种基于SVM-Adaboost的驾驶分心检测方法
CN114611604A (zh) 一种基于电驱总成载荷特征融合与聚类的用户筛选方法
CN113591780A (zh) 一种驾驶员行车风险鉴定方法及系统
CN114722918A (zh) 一种基于dna甲基化的肿瘤分类方法
CN112396118A (zh) 一种基于gm-hmm的驾驶员加速意图建模方法
CN115774942A (zh) 基于车联网实车数据和svm的驾驶风格辨识模型建模与统计方法
CN116127360A (zh) 一种基于图像识别与topsis综合评价的驾驶风格分类方法
Wang et al. A data-driven estimation of driving style using deep clustering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination