CN112948965A - 一种基于机器学习和统计验证的汽车行驶工况的构建方法 - Google Patents

一种基于机器学习和统计验证的汽车行驶工况的构建方法 Download PDF

Info

Publication number
CN112948965A
CN112948965A CN202110143004.5A CN202110143004A CN112948965A CN 112948965 A CN112948965 A CN 112948965A CN 202110143004 A CN202110143004 A CN 202110143004A CN 112948965 A CN112948965 A CN 112948965A
Authority
CN
China
Prior art keywords
short
automobile
data
condition
acceleration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110143004.5A
Other languages
English (en)
Inventor
丁家满
李凌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN202110143004.5A priority Critical patent/CN112948965A/zh
Publication of CN112948965A publication Critical patent/CN112948965A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/08Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
    • G07C5/0808Diagnosing performance data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Geometry (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Automation & Control Theory (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

本发明公开了一种基于机器学习和统计验证的汽车行驶工况的构建方法,针对各个城市的汽车行驶工况特征存在明显的不同,基于城市自身的汽车行驶数据进行城市汽车行驶工况的构建,该方法的创建采用了主成分分析法选取了若干特征参数,又运用动态聚类法将短行程进行聚类,从每个类别中运用累计频率法选取短行程,最后运用卡方检验的方式来选取最优的行驶工况。本发明提供的方法具有坚实可靠的统计学基础,模型中运用到的统计学理论和机器学习算法已经证明是构建汽车行驶工况图的最好方法。本发明方法简单易行,且适用于国内大多数城市与地区的汽车行驶工况图的绘制。

Description

一种基于机器学习和统计验证的汽车行驶工况的构建方法
技术领域
本发明涉及一种基于机器学习和统计验证的汽车行驶工况的构建方法,属于轨迹数据处理领域。
背景技术
汽车行驶工况(DrivingCycle)又称车辆测试循环,是描述汽车行驶的速度/时间曲线,体现汽车道路行驶的运动学特征,是汽车行业的一项重要的、共性基础技术,是车辆能耗/排放测试方法和限值标准的基础,也是汽车各项性能指标标定优化时的主要基准。目前,欧、美、日等汽车发达国家,均采用适应于各自的汽车行驶工况标准进行车辆性能标定优化和能耗/排放认证。
本世纪初,我国直接采用欧洲的NEDC行驶工况对汽车产品能耗/排放的认证,有效促进了汽车节能减排和技术的发展。近年来,随着汽车保有量的快速增长,我国道路交通状况发生很大变化,政府、企业和民众日渐发现以NEDC工况为基准所优化标定的汽车,实际油耗与法规认证结果偏差越来越大,影响了政府的公信力(譬如对某型号汽车,该车标注的工信部油耗6.5升/100公里,用户体验实际油耗可能是8.5-10升/100公里)。另外,欧洲在多年的实践中也发现NEDC工况的诸多不足,转而采用世界轻型车测试循环(WLTC)。但该工况怠速时间比和平均速度这两个最主要的工况特征,与我国实际汽车行驶工况的差异更大。作为车辆开发、评价的最为基础的依据,开展深入研究,制定反映我国实际道路行驶状况的测试工况,显得越来越重要。
另一方面,我国地域辽广,各个城市的发展程度、气候条件及交通状况的不同,使得各个城市的汽车行驶工况特征存在明显的不同。因此,基于城市自身的汽车行驶数据进行城市汽车行驶工况的构建研究也越来越迫切,希望所构建的汽车行驶工况与该市汽车的行驶情况尽量吻合,理想情况下是完全代表该市汽车的行驶情况。
发明内容
本发明提供一种基于机器学习和统计验证的汽车行驶工况的构建方法,针对各个城市的汽车行驶工况特征存在明显的不同,根据提供的城市轻型汽车实际道路行驶采集的数据,构建一条能体现参与数据采集汽车行驶特征的汽车行驶工况曲线。
本发明的技术方案如下:一种基于机器学习和统计验证的汽车行驶工况的构建方法,包括以下步骤:
步骤一数据预处理:由汽车行驶数据的采集设备直接记录的原始采集数据往往会包含一些不良数据值,设计合理的方法将上述不良数据进行预处理,并给出各文件数据经处理后的记录数;
步骤二运动学片段提取:运动学片段是指汽车从怠速状态开始至下一个怠速状态开始之间的车速区间,设计合理的方法,将上述经处理后的数据划分为多个运动学片段,并给出各数据文件最终得到的运动学片段数量;
步骤三汽车行驶工况构建:根据处理后的数据,构建一条1200-1300秒间能体现参与数据采集汽车行驶特征的汽车行驶工况曲线;
步骤四汽车行驶工况合理性检验:构建合理的汽车运动特征评估体系,检验并说明所构建的汽车行驶工况的合理性。
作为对上述技术方案的进一步描述:步骤一数据预处理具体过程如下:
针对汽车加、减速度异常的问题,设定当加速段加速度大于3.97m/s2时,或减速段加速度大于8m/s2时,汽车加、减速度数据异常;通过GPS车速计算各时间下的汽车加速度,按照假定的标准,将异常加速度数据采取smooth函数进行平滑处理后,对异常数据进行替换;
针对长期停车的问题,根据发动机转速判断是否处于熄火状态,将转速为0处于熄火状态的数据剔除,将处于停车不熄火等人或停车熄火了但采集设备仍在运转等状态按怠速情况处理;
针对长时间堵车、断断续续低速行驶情况,即最高车速小于10km/h,通常按怠速情况处理;
针对怠速情况,一般认为怠速时间超过180秒为异常情况,故将怠速时长大于180秒的按 180秒处理。
作为对上述技术方案的进一步描述:步骤二具体要求如下:
(1)怠速起点时刻应满足vt=0且vt-1>0,怠速终点时刻应满足vt=0且vt+1>0;
(2)至少包含一个加速片段,即包含一个汽车加速度Aa>0.1m/s2且速度vt≠0的连续过程;
(3)至少包含一个减速片段,即包含一个汽车减速度Ad>0.1m/s2且速度vt≠0的连续过程。
作为对上述技术方案的进一步描述:步骤三具体操作如下:
计算各运动学片段的特征值,根据主成分分析法和动态聚类法,获得最具代表性的特征数据;
其次,根据各类运动学片段的综合特征值,在对应的某一类短行程中,计算单个运动学片段的特征值与此类运动学片段综合特征值平均相对误差绝对值;
然后,选出n个平均相对误差绝对值≤10%的短行程拟合成时间长度为1200-1300秒的汽车行驶工况;
最后,计算选取的n个短行程综合特征值,并与这一类的短行程综合特征值进行比较,求出两者间的平均相对误差绝对值;如果误差在5%以内,则表明该拟合工况是有效的,能够反映某一类道路上汽车行驶特征,进而合成各类行驶工况获得一条能够体显各类行驶特征的汽车行驶工况曲线;反之,重新选择n个短行程进行拟合,直到误差满足条件为止。
作为对上述技术方案的进一步描述:根据主成分分析和聚类分析构建主城区高峰时段、主城区低峰时段和非主城区道路数据分别进行构建工况曲线,然后选取误差最小、最能代表该状态的短片段工况,合成汽车行驶工况曲线,具体步骤如下:
Step1:确定每个短行程库构建行驶工况的持续时间Tp,公式如下:
Figure BDA0002929840690000031
其中,ti为短行程库中单个短行程持续的的时间,nk为对应短行程库的ti短行程库的总数, M为聚类得到的m个短片段类别,T为预构建行驶工况的持续时间;
Step2:确定每个短行程库内预选短行程的数量Np,公式如下:
Figure BDA0002929840690000032
式中,Np取大于计算结果的最小整数,np为当前短线段库的短线段总数,ti为第i个短线段持续时间,
Figure BDA0002929840690000033
为当前短线段库的平均持续时长;
Step3:以每个短行程库为基础,计算出短行程持续时间的累积频率,并作出累积频率图,然后将累积频率平均分成Np段,取每个段中点频率对应的持续时间作为备选短行程的持续时间STi
Step4:根据Step3中确定的短行程持续时间STi,挑选出对应的短行程;由于相同时间可以有多个不同的短行程,所以从每一个STi对应的多个短行程中选择一个依次组成备选行驶工况;
Step5:卡方检验属于拟合优度检验,就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合;利用卡方检验和短行程库的速度—加速度联合分布来选取最优的行驶工况;构建备选行驶工况中的卡方统计量χ2,选择卡方统计量中最小的备选行驶工况作为最优行驶工况,公式如下:
Figure BDA0002929840690000041
式中,χ2为构建备选行驶工况中的卡方统计量,pij为短行程库中的速度—加速度联合分布概率,qij为备选行驶工况对应在联合分布中的非零概率的区域的点数,q为qij的总和。
作为对上述技术方案的进一步描述:步骤四对汽车行驶工况曲线合理性进行检验,一方面,采用统计学方法,利用原始数据和行驶工况的特征参数间的误差值来进行检验;另一方面,采用数学物理方法,利用原始数据域行驶工况的速度-加速度联合分布的差异进行检验。
与现有技术相比,本发明具有以下有益效果:
(1)本发明发明建立了合理,科学的汽车行驶工况图的构建模型,该模型的创建采用了主成分分析法选取了若干特征参数,又运用动态聚类法将短行程进行聚类。从每个类别中运用累i计频率法选取短行程,最后运用卡方检验的方式来选取最优的行驶工况。
(2)该模型具有坚实可靠的统计学基础,模型中运用到的统计学理论和机器学习算法已经证明是构建汽车行驶工况图的最好方法。
(3)该模型的方法简单易行,且适用于国内大多数城市与地区的汽车行驶工况图的绘制。
附图说明
图1为本发明的流程示意图;
图2为部分运动学片段图;
图3为第5段运动学片段;
图4为第28段运动学片段;
图5为主成分分析流程示意图;
图6为动态聚类流程示意图;
图7为主城区高峰时期分类结果;
图8为主城区低峰时段分类结果;
图9为非主城区道路分类结果;
图10为主城区高峰时期行驶工况图;
图11为主城区低峰时段行驶工况图;
图12为非主城区道路行驶工况图;
图13为汽车行驶工况曲线图;
图14为行驶工况的速度-加速度联合概率分布图;
图15为试验数据的速度-加速度联合概率分布图;
图16为行驶工况与试验数据的速度-加速度联合概率绝对误差图。
具体实施方式
为了便于理解,下面结合附图和实施例对本发明的技术方案做进一步详细说明。
实施例1
根据某城市轻型汽车实际道路行驶采集的数据(采样频率1Hz),构建一条能体现参与数据采集汽车行驶特征的汽车行驶工况曲线。本实施例包括以下步骤:
步骤一数据预处理。由汽车行驶数据的采集设备直接记录的原始采集数据往往会包含一些不良数据值,设计合理的方法将上述不良数据进行预处理,并给出各文件数据经处理后的记录数。
步骤二运动学片段提取。运动学片段是指汽车从怠速状态开始至下一个怠速状态开始之间的车速区间。设计合理的方法,将上述经处理后的数据划分为多个运动学片段,并给出各数据文件最终得到的运动学片段数量。
步骤三汽车行驶工况构建。根据处理后的数据,构建一条1200-1300秒间能体现参与数据采集汽车行驶特征的汽车行驶工况曲线。
步骤四汽车行驶工况合理性检验。构建合理的汽车运动特征评估体系,检验并说明所构建的汽车行驶工况的合理性,流程图如图1所示。
步骤一数据预处理
问题分析
原始采集数据中包含的不良数据主要包括五个类型:(1)由于GPS信号丢失导致的数据时间不连续。(2)汽车加、减速度异常数据。(3)长期停车所采集的异常数据。(4) 长时间堵车、断断续续低俗行驶,即最高车速小于10km/h,通常可按怠速情况处理。(5) 怠速时长超过180秒为异常情况,怠速最长时间可按180秒处理。可将该五类不良数据进行下述处理。
针对GPS信号丢失导致的时间不连续,本实施例首先根据汽车进入时间丢失状态前,车速和发动机转速是否为零判断车辆丢失时间应处于的状态,进而对缺失数据进行插值填补或按怠速状态处理。
针对汽车加、减速度异常的数据,考虑通常情况下,0-100km/h的加速度时间大于7秒,且紧急刹车最大减速度在7.5—8m/s2,因此,假定最大加速度应小于3.97m/s2,最大减速度应小于8m/s2。通过GPS车速计算各时间下的汽车加速度,按照假定的标准,将异常加速度数据通过smooth函数进行平滑处理。
针对长期停车情况,根据发动机转速判断是否处于熄火状态,将转速为0处于熄火状态的数据剔除,将处于不熄火状态的按怠速情况处理。针对长时间堵车或断断续续低速行驶(最高车速小于10)的情况,按怠速处理。怠速最长时间按180秒处理。
问题求解
针对GPS信号丢失造成的数据时间不连续问题,首先识别文件中各车辆行驶的时间间断点。由于间断时间长短不一,且该时段内汽车所处状态未知,故本实施例根据汽车进入时间丢失状态前,车速和发动机转速是否为零判断车辆丢失时间应处于的状态,进而将时间不连续数据丢失异常分为三类:
(1)汽车进入时间丢失状态前,车速、发动机转速为0。则判断为车辆是正常熄火关停,仪器不工作导致信号中断,这个过程一般持续时间较长,可以将这个时间段按怠速处理,即在这个时间段内的油门和车速置0,后续处理怠速数
据时会将此数据长度减小为180s。
(2)汽车进入时间丢失状态前,车速、发动机转速不为0,但进入时间丢失的这段时间内,平均车速<10km/h。则判断为由于隧道内堵车或车辆在高楼见停车所致,按后续针对断断续续低速行驶情况的处理方法,可以将这部分也按怠速处理。
(3)汽车进入时间丢失状态前,车速、发动机转速不为0,且进入时间丢失的这段时间内,平均车速>10km/h,则判断为正常行驶中信号中断,可以在这段数据内补充一段匀加速、匀减速数据,油门踏板等数据也可以用线性插值补。
针对汽车加、减速度异常的问题,由于普通轿车一般情况下,0—100km/h的加速度时间大于7秒,紧急刹车最大减速度在7.5—8m/s2,故本实施例设定当加速段加速度大于3.97 m/s2时,或减速段加速度大于8m/s2时,汽车加、减速度数据异常。通过GPS车速计算各时间下的汽车加速度,按照假定的标准,将异常加速度数据采取smooth函数进行平滑处理后,对异常数据进行替换。
针对长期停车的问题,根据发动机转速判断是否处于熄火状态,将转速为0处于熄火状态的数据剔除,将处于停车不熄火等人或停车熄火了但采集设备仍在运转等状态按怠速情况处理。
针对长时间堵车、断断续续低速行驶情况,即最高车速小于10km/h,通常按怠速情况处理。
针对怠速情况,一般认为怠速时间超过180秒为异常情况,故将怠速时长大于180秒的按 180秒处理。
步骤二运动学片段提取
问题分析
运动学片段的划分和提取是构建汽车行驶工况曲线的首要步骤,运动学片段代表的短行程,可以通过运动学的特征参数反映汽车行驶工况。因此,从运动学的角度,本实施例设定汽车从怠速状态开始至下一个怠速状态开始之前的车速区间为一个运动学片段,该片段描述车辆的一次启停。即要求所提取的运动学片段中应该最少包含一个怠速、一个加速和一个减速状态。
问题求解
汽车行驶状态大致可分为怠速、加速、匀速和减速四个状态。按照对运动学片段的定义,从运动学的角度考虑,划分提取的运动学片段要能反映车辆的一次启停过程,应包括一个怠速段和一个运行段,且这个运动段最少包含一个加速和一个减速状态。
因此,本实施例对运动学片段的划分和提取做以下限制要求:
(1)怠速起点时刻应满足vt=0且vt-1>0,怠速终点时刻应满足vt=0且vt+1>0
(2)至少包含一个加速片段,即包含一个汽车加速度Aa>0.1m/s2且速度vt≠0的连续过程;
(3)至少包含一个减速片段,即包含一个汽车减速度Ad>0.1m/s2且速度vt≠0的连续过程。
根据上述要求,将整个汽车运动行驶状况划分提取成多个运动学片段,部分运动学片段如图2所示。
随机选取提取的第5个和第288个运动学片段,可看出,提取的每一个运动学片段中,均包含起码一个怠速段、一个加速段和一个减速段,如图3和图4所示。
步骤三汽车行驶工况构建
问题分析
根据上述处理后的数据,构建一条能体现参与数据采集汽车行驶特征的汽车行驶工况曲线(1200-1300秒)。通过经上述处理后的数据,可以看出,文件数据均为车辆在福州市主城区及周边地区行驶数据。汽车在主城区行驶时,状态多处于中低速行驶;在周边非主城区地段行驶时,状态多处于中高速行驶。同时,由于汽车在实际生活的用途并不相同,有些车大部分时间只是在上下班时间行驶,有些车则会一天中任何时间行驶。因此,汽车在高峰时段行驶时,可能存在断断续续低速行驶的状态;而在低峰时段行驶时,相对是正常的匀速行驶状态。
综合考虑主城区非主城区行驶状况和高低峰时间行驶状况,本实施例首先建立汽车行驶工况特征评估体系,计算获得各短片段的特征值。然后采用主成分分析和动态聚类的方法,获得最具代表性的特征数据,经过误差检验满足要求后,将不同类型的候选工况组合达到规定长度,且满足误差最小,即代表性行驶工况构建完成。
汽车行驶工况构建方法
根据实验数据特点和结合汽车行驶实际需求,本实施例对汽车行驶工况构建步骤如下:
首先,计算各运动学片段的特征值,根据主成分分析法和动态聚类法,获得最具代表性的特征数据。其次,根据各类运动学片段的综合特征值,在对应的某一类短行程中,计算单个运动学片段的特征值与此类运动学片段综合特征值平均相对误差绝对值。然后,选出个平均相对误差较小(平均相对误差绝对值≤10%)的短行程拟合成时间长度为1200-1300秒的汽车行驶工况。最后,计算选取的n个短行程综合特征值,并与这一类的短行程综合特征值进行比较,求出两者间的平均相对误差绝对值。如果误差在5%以内,则表明该拟合工况是有效的,能够反映某一类道路上汽车行驶特征,进而合成各类行驶工况获得一条能够体显各类行驶特征的汽车行驶工况曲线。反之,重新选择n个短行程进行拟合,直到误差满足条件为止。
汽车行驶工况特征评估体系构建
为了选取合适候选短行程拟合代表性行驶工况,需要选择一些特征参数来描述行驶工况,这些特征参数还可以对代表性行驶工况与试验工况进行评价。一般从运动学片段持续时刻 (It)、运动学片段时间(Ti)、运动学片段平均速度(Va)、运动学片段平均行驶速度(Va2)、运动学片段怠速时间比(Pid)、运动学片段平均加速度(aa)、运动学片段平均减速度(ad)、运动学片段最高车速(Vmax)、加速时间比(Paa)、减速时间比(Pbb)、速度标准差(Stdv)、加速度标准差(Stda)、最大加速度(Am)、最大减速度(Dm)等14个特征参数中,选取若干个主成分特征参数作为平均相对误差计算的参数通过计算结果选择与试验数据平均相对误差较小的短行程为候选短行程进行行驶工况的拟合。
汽车行驶工况构建
数据分类
经过问题一二处理后的数据,可以看出,文件数据均为车辆在某城市主城区及周边地区行驶数据。汽车在主城区行驶时,状态多处于中低速行驶;在周边非主城区地段行驶时,状态多处于中高速行驶。同时,由于汽车在实际生活的用途并不相同,有些车大部分时间只是在上下班时间行驶,有些车则会一天中任何时间行驶。因此,汽车在高峰时段行驶时,可能存在断断续续低速行驶的状态;而在低峰时段行驶时,相对是正常的匀速行驶状态。结合数据和实际情况可以看出,汽车在非主城区道路行驶时,由于其道路相对不拥挤且红灯较少,故不单独考虑非主城区道路高低峰时期行驶差异。
因此,本文将实验数据分为主城区低峰时段行驶、主城区高峰时段行驶和非主城区行驶三类。设定上午7点到9点、下午5点到8点为高峰时段,其余时间为低峰时段。经纬度范围在福州市三环内的区域为主城区道路,其余周边地区均为非主城区道路。
求取主城区高峰时段的速度-加速度联合分布概率表,占比最大的依次是速度 20<v≤40km/h、0<v≤20km/h和40<v≤60km/h,这三个区间内的速度占比超过了90%,说明在福州市主城区高峰时段内交通情况拥挤。加速度-2≤a<2km/h/s占比超过70%,说明主城区高峰时段内汽车加速和减速频繁。
求取非主城区的速度-加速度联合分布概率表,占比最大的是速度20<v≤40km/h和40<v ≤60km/h,这两个区间内的速度占比超过了80%,说明相较主城区道路的拥挤情况,非主城区道路拥堵情况不明显。加速度-4≤a<4km/h/s占比超过80%,说明非主城区道路内汽车加速和减速相对平缓。
主成分分析
(1)相关原理
主成分分析是一种处理高维数据的方法,它通过投影的方法,将高维数据以尽可能少的投影到低维的空间,使数据降维达到简化数据结构的目的。它也是将多个相关变量以尽可能少的信息损失为原则进行综合化为少数几个不相关变量的方法,模型算法如图5所示。
Step1:指标参数标准化,各个指标的量纲不同使得存在不可公度性问题,因此需要对各个指标进行无量纲化处理,通过数值变换消除指标量纲的影响。Z-Score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性;
对原始数据矩阵X采用Z-Score法对指标进行标准化处理:
Figure BDA0002929840690000101
式中,
Figure BDA0002929840690000102
为第j 个对象均值,sj为第j个对象标准差。
Step2:确定指标间的相关系数矩阵R=[rjk]m×m,rij=1,
Figure BDA00029298406900001010
Step3:确定矩阵R的特征根,|λgIm-R|=0式中,λg(g=1,2,...,m)为特征根,表明分量的重要性。
Step4:确定矩阵R的特征向量,方程组求特征向量[λgIm-R]Lg=0式中,L是m维的向量。
Step5:确定矩阵R的贡献率,
Figure BDA0002929840690000104
Step6:确定主分量个数K,将各分量按照贡献率大小排序,如果原始个数较多,则取前 K个代表所有分量。
Figure BDA0002929840690000105
根据α(K)≥85%确定主分量个数,可以将m个相关指标约简为k个不相关主分量fi1-fik
Figure BDA0002929840690000106
Step7:计算主成分载荷矩阵,
Figure BDA0002929840690000107
(i=1,2,…,m)。
Step8:计算主成分得分分值,主成分的表达式如下所示:
Figure BDA0002929840690000108
其中,z1,z2,…,zm是原始变量经过标准变化后的变量。将
Figure BDA0002929840690000109
中的每行数据代入式中,即可得到主成分得分矩阵:
Figure BDA0002929840690000111
(2)主成分分析求解
根据主成分分析法求解的各主成分贡献率及累计贡献率,如表1示。由于前五个主成分累计贡献率超过了85%,其中前四项对应的特征值大于1,但第五项对应的特征值小于1,因此,舍弃第五项,本实施例选取前四个主成分来代表运动学片段的14个特征参数。
表1各主成分贡献率及累计贡献率表
Figure BDA0002929840690000112
F1-F14:运动学片段持续时刻(It)、运动学片段时间(Ti)、运动学片段平均速度(Va)、运动学片段平均行驶速度(Va2)、运动学片段怠速时间比(Pid)、运动学片段平均加速度(aa)、运动学片段平均减速度(ad)、运动学片段最高车速(Vmax)、加速时间比(Paa)、减速时间比(Pbb)、速度标准差(Stdv)、加速度标准差(Stda)、最大加速度(Am)、最大减速度(Dm)。
表2为前四个主成分与特征参数对应的载荷矩阵,特征参数在某个主成分上的载荷系数的绝对值越大,则说明该特征参数与这个主成分的相关系数越高,此主成分的代表性越高。
表2前四个主成分与特征参数对应的载荷矩阵
Figure BDA0002929840690000121
表3为主成分表达式系数矩阵,由此矩阵可以写出主成分与标准化特征参数的具体表达式,将标准数据矩阵与此系数矩阵相乘即可得到运动学片段的主成分得分矩阵。
表3主成分表达式系数矩阵
Figure BDA0002929840690000122
Figure BDA0002929840690000131
动态聚类
相关原理
动态聚类的思想是先将运动学片段粗略的分类,然后按照某种原则进行修正,直至分类比较合理为止。动态聚类的过程如图6所示:
具体步骤如下:
Step1:确定聚类因子,即选择能够反映交通特征的特征参数作为聚类因子。
Step2:确定聚点。设将n个片段分成m类,先选择所有运动学片段中相距最远的2个运动学片段,
Figure BDA0002929840690000132
为前2个聚点,即选择
Figure BDA0002929840690000133
Figure BDA0002929840690000134
使
Figure BDA0002929840690000135
然后,选择第3个聚点
Figure BDA0002929840690000136
使
Figure BDA0002929840690000137
与前2个聚点的距离最小者等于所有其余的与
Figure BDA0002929840690000138
的较小距离中最大的,然后按照相同的原则选取
Figure BDA0002929840690000139
依次下去,直至选定l个聚点
Figure BDA00029298406900001310
计算步骤:聚类分析中常用的距离有欧氏距离,曼哈顿距离,切比雪夫等距离,本实施例采用的是欧氏距离。
动态聚类求解
通过动态聚类,将三种状况中特征值相近、交通特征相似度高的短行程划分到同一类中,使该类短行程能反映同一种道路类型的交通状况。如图7-图9所示。从不同状态下的分类结果可以看出,聚类后的数据分类很明显。以前三个主成分作为坐标轴进行分类后,将数据分成了三类,第一类代表拥挤的交通情况,第二类代表相对拥挤的交通情况,第三类代表相对顺畅的交通情况。
行驶工况合成
(1)行驶工况合成原理及步骤
结合已知数据实际情况,本实施例首先将前面章节中分类分析的主城区高峰时段、主城区低峰时段和非主城区道路数据分别进行工况曲线的构建。然后,选取误差最小、最能代表该状态的短片段工况,合成汽车行驶工况曲线。具体步骤如下:
Step1:确定每个短行程库构建行驶工况的持续时间Tp,公式如下:
Figure BDA0002929840690000141
其中,ti为短行程库中单个短行程持续的的时间,nk为对应短行程库的ti短行程库的总数。
Step2:确定每个短行程库内预选短行程的数量Np,公式如下:
Figure BDA0002929840690000142
其中,Np取大于计算结果的最小整数,
Figure BDA0002929840690000143
为当前短线段库的平均持续时长。
Step3:以每个短行程库为基础,计算出短行程持续时间的累积频率,并作出累积频率图,然后将累积频率平均分成Np段,取每个段中点频率对应的持续时间作为备选短行程的持续时间STi
Step4:根据Step3中确定的短行程持续时间STi,挑选出对应的短行程。由于相同时间可以有多个不同的短行程,所以从每一个STi对应的多个短行程中选择一个依次组成备选行驶工况。
Step5:卡方检验属于拟合优度检验,就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。利用卡方检验和短行程库的速度—加速度联合分布来选取最优的行驶工况。构建备选行驶工况中的卡方统计量χ2,选择卡方统计量中最小的备选行驶工况作为最优行驶工况,公式如下:
Figure BDA0002929840690000144
其中,χ2为构建备选行驶工况中的卡方统计量,pij为短行程库中的速度—加速度联合分布概率,qij为备选行驶工况对应在联合分布中的非零概率的区域的点数,q为qij的总和。
行驶工况合成求解
依照上述行驶工况合成原理及步骤,将主城区高峰时期、主城区低峰时期和非主城区道路的行驶工况持续时间都预计为1200-1300秒。按照行驶工况合成步骤计算,得到不同状态下行驶工况曲线如图10-图12所示。
主城区高峰时期行驶工况持续时间为1241秒,由8个短行程构成,最大速度值47.8km/h,平均速度27.5km/h,平均运行速度31.7km/h。主城区低峰时期行驶工况持续时间为1297秒,由 5个短行程构成,最大速度值67.3km/h,平均速度32.8km/h,平均运行速度36.9km/h。非主城区道路行驶工况持续时间为1205秒,由4个短行程构成,最大速度值86.3km/h,平均速度39.4kn/h,平均运行速度44.7km/h。可见,非主城区道路的行驶工况平均速度和平均运行速度比主城区无论高低峰时期的行驶工况都要高,说明非主城区道路相对不拥挤。同时,高峰时段的行驶工况平均速度和平均运行速度都略低于其他二者,说明福州市高峰时期城市交通拥挤情况相较其他时段和地区更为明显。
从构成的主城区高峰期行驶工况、主城区低峰期行驶工况和非主城区道路行驶工况选取误差最小、最具代表性的短行程合成一条综合的汽车行驶工况曲线,经过多次迭代选取误差最小的汽车行驶工况曲线,如图13示。
综合汽车行驶工况曲线持续时间为1249秒,其中非主城区道路状态包含529秒,主城区道路状态包含720秒,主城区道路状态又分高峰时期状态包含393秒,低峰时期状态包含327秒。整个综合汽车行驶工况曲线由7个短行程构成,平均速度为31.62km/h,与综合工况试验数据的平均速度31.22km/h接近。
步骤四汽车行驶工况曲线合理性检验
对汽车行驶工况曲线合理性进行检验,一方面,可以采用统计学方法,利用原始数据和行驶工况的特征参数间的误差值来进行检验;另一方面,可以采用数学物理方法,利用原始数据域行驶工况的速度-加速度联合分布的差异进行检验。
(1)利用特征参数间的误差值进行检验。
行驶工况的特征参数的绝对误差和相对误差的计算公式如下。
绝对误差=|行驶工况特征参数-试验数据特征参数|
Figure BDA0002929840690000161
综合汽车行驶工况的试验数据与行驶工况的特征参数及误差统计,本实施例所构建的综合行驶工况的特征参数的相对误差均不大于10%,尤其减速段时间比的相对误差为0.2%,可知综合汽车行驶工况构建精度很高,可以代表试验数据。因此,从特征参数的检验结果来看,本实施例构建的综合汽车行驶工况曲线很合理。
(2)利用速度-加速度联合分布的差异进行检验。
根据综合行驶工况曲线和试验原始数据,计算其对应的速度和加速度,并生成速度-加速度联合分布图,如图14和图15所示。
根据图14和15可以看出,综合汽车行驶工况与试验数据的图像大致的走势很相似。进而通过综合行驶工况与试验数据的速度-加速度联合概率绝对误差图可以看出,如图16所示,二者间的概率绝对误差虽然部分区间存在一定的起伏差异,但整体差异不大,概率绝对误差没有超过3%。因此,可认为在速度-加速度联合分布上,综合汽车行驶工况可以代表试验数据。即验证了综合汽车行驶工况曲线的合理性。
综上所述,结合统计学检验方法和数学物理方法检验得,本文构建的综合汽车行驶工况曲线与试验数据间存在的误差很小,该工况曲线具有合理性。
以上所述,仅为本发明较佳的具体实施方式,但发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种基于机器学习和统计验证的汽车行驶工况的构建方法,其特征在于,包括以下步骤:
步骤一 数据预处理:由汽车行驶数据的采集设备直接记录的原始采集数据往往会包含一些不良数据值,将上述不良数据进行预处理,并给出各文件数据经处理后的记录数;
步骤二 运动学片段提取:运动学片段是指汽车从怠速状态开始至下一个怠速状态开始之间的车速区间,将步骤一处理后的数据划分为多个运动学片段,并给出各数据文件最终得到的运动学片段数量;
步骤三 汽车行驶工况构建:根据处理后的数据,构建一条1200-1300秒间能体现参与数据采集汽车行驶特征的汽车行驶工况曲线;
步骤四 汽车行驶工况合理性检验:构建汽车运动特征评估体系,检验所构建的汽车行驶工况的合理性。
2.根据权利要求1所述的基于机器学习和统计验证的汽车行驶工况的构建方法,其特征在于,步骤一数据预处理具体过程如下:
针对汽车加、减速度异常的问题,设定当加速段加速度大于3.97m/s2时,或减速段加速度大于8m/s2时,汽车加、减速度数据异常;通过GPS车速计算各时间下的汽车加速度,按照假定的标准,将异常加速度数据采取smooth函数进行平滑处理后,对异常数据进行替换;
针对长期停车的问题,根据发动机转速判断是否处于熄火状态,将转速为0处于熄火状态的数据剔除,将处于停车不熄火等人或停车熄火了但采集设备仍在运转等状态按怠速情况处理;
针对长时间堵车、断断续续低速行驶情况,即最高车速小于10km/h,按怠速情况处理;
针对怠速情况,怠速时间超过180秒为异常情况,故将怠速时长大于180秒的按180秒处理。
3.根据权利要求1所述的基于机器学习和统计验证的汽车行驶工况的构建方法,其特征在于,步骤二具体要求如下:
(1)怠速起点时刻应满足vt=0且vt-1>0,怠速终点时刻应满足vt=0且vt+1>0;
(2)至少包含一个加速片段,即包含一个汽车加速度Aa>0.1m/s2且速度vt≠0的连续过程;
(3)至少包含一个减速片段,即包含一个汽车减速度Ad>0.1m/s2且速度vt≠0的连续过程。
4.根据权利要求1所述的基于机器学习和统计验证的汽车行驶工况的构建方法,其特征在于,步骤三具体操作如下:
计算各运动学片段的特征值,根据主成分分析法和动态聚类法,获得最具代表性的特征数据;
其次,根据各类运动学片段的综合特征值,在对应的某一类短行程中,计算单个运动学片段的特征值与此类运动学片段综合特征值平均相对误差绝对值;
然后,选出n个平均相对误差绝对值≤10%的短行程拟合成时间长度为1200-1300秒的汽车行驶工况;
最后,计算选取的n个短行程综合特征值,并与这一类的短行程综合特征值进行比较,求出两者间的平均相对误差绝对值;如果误差在5%以内,则表明该拟合工况是有效的,能够反映某一类道路上汽车行驶特征,进而合成各类行驶工况获得一条能够体显各类行驶特征的汽车行驶工况曲线;反之,重新选择n个短行程进行拟合,直到误差满足条件为止。
5.根据权利要求4所述的基于机器学习和统计验证的汽车行驶工况的构建方法,其特征在于,根据主成分分析和聚类分析构建主城区高峰时段、主城区低峰时段和非主城区道路数据分别进行构建工况曲线,然后选取误差最小、最能代表该状态的短片段工况,合成汽车行驶工况曲线,具体步骤如下:
Step1:确定每个短行程库构建行驶工况的持续时间Tp,公式如下:
Figure FDA0002929840680000021
式中,ti为短行程库中单个短行程持续的的时间,nk为对应短行程库的ti短行程库的总数,M为聚类得到的m个短片段类别,T为预构建行驶工况的持续时间;
Step2:确定每个短行程库内预选短行程的数量Np,公式如下:
Figure FDA0002929840680000022
式中,Np取大于计算结果的最小整数,np为当前短线段库的短线段总数,ti为第i个短线段持续时间;
Step3:以每个短行程库为基础,计算出短行程持续时间的累积频率,并作出累积频率图,然后将累积频率平均分成Np段,取每个段中点频率对应的持续时间作为备选短行程的持续时间STi
Step4:根据Step3中确定的短行程持续时间STi,挑选出对应的短行程;由于相同时间可以有多个不同的短行程,所以从每一个STi对应的多个短行程中选择一个依次组成备选行驶工况;
Step5:卡方检验属于拟合优度检验,就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合;利用卡方检验和短行程库的速度—加速度联合分布来选取最优的行驶工况;构建备选行驶工况中的卡方统计量χ2,选择卡方统计量中最小的备选行驶工况作为最优行驶工况,公式如下:
Figure FDA0002929840680000031
式中,χ2为构建备选行驶工况中的卡方统计量,pij为短行程库中的速度—加速度联合分布概率,qij为备选行驶工况对应在联合分布中的非零概率的区域的点数,q为qij的总和。
6.根据权利要求1所述的基于机器学习和统计验证的汽车行驶工况的构建方法,其特征在于,步骤四对汽车行驶工况曲线合理性进行检验,一方面采用统计学方法,利用原始数据和行驶工况的特征参数间的误差值来进行检验;另一方面采用数学物理方法,利用原始数据域行驶工况的速度-加速度联合分布的差异进行检验。
CN202110143004.5A 2021-02-02 2021-02-02 一种基于机器学习和统计验证的汽车行驶工况的构建方法 Pending CN112948965A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110143004.5A CN112948965A (zh) 2021-02-02 2021-02-02 一种基于机器学习和统计验证的汽车行驶工况的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110143004.5A CN112948965A (zh) 2021-02-02 2021-02-02 一种基于机器学习和统计验证的汽车行驶工况的构建方法

Publications (1)

Publication Number Publication Date
CN112948965A true CN112948965A (zh) 2021-06-11

Family

ID=76241548

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110143004.5A Pending CN112948965A (zh) 2021-02-02 2021-02-02 一种基于机器学习和统计验证的汽车行驶工况的构建方法

Country Status (1)

Country Link
CN (1) CN112948965A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113920737A (zh) * 2021-10-25 2022-01-11 苏州智慧车芯科技有限公司 一种rde工况随机生成器
CN114136390A (zh) * 2021-11-25 2022-03-04 中汽研汽车检验中心(天津)有限公司 一种包含道路坡度的汽车行驶工况开发装置及开发方法
CN114298184A (zh) * 2021-12-20 2022-04-08 北京理工大学 一种基于机器学习和优化算法的新能源公交工况构建方法
CN115828687A (zh) * 2022-11-30 2023-03-21 电子科技大学长三角研究院(湖州) 一种基于数据挖掘技术的吸能结构设计方法
CN119052747A (zh) * 2024-08-29 2024-11-29 广西玉柴机器股份有限公司 基于相似工况的车联网系列应用方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110717147A (zh) * 2019-10-10 2020-01-21 辽宁工程技术大学 一种构建汽车行驶工况的方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110717147A (zh) * 2019-10-10 2020-01-21 辽宁工程技术大学 一种构建汽车行驶工况的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
石敏: "轻型汽车行驶工况构建的研究", 《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113920737A (zh) * 2021-10-25 2022-01-11 苏州智慧车芯科技有限公司 一种rde工况随机生成器
CN114136390A (zh) * 2021-11-25 2022-03-04 中汽研汽车检验中心(天津)有限公司 一种包含道路坡度的汽车行驶工况开发装置及开发方法
CN114298184A (zh) * 2021-12-20 2022-04-08 北京理工大学 一种基于机器学习和优化算法的新能源公交工况构建方法
CN115828687A (zh) * 2022-11-30 2023-03-21 电子科技大学长三角研究院(湖州) 一种基于数据挖掘技术的吸能结构设计方法
CN119052747A (zh) * 2024-08-29 2024-11-29 广西玉柴机器股份有限公司 基于相似工况的车联网系列应用方法及系统

Similar Documents

Publication Publication Date Title
CN112948965A (zh) 一种基于机器学习和统计验证的汽车行驶工况的构建方法
CN111832225B (zh) 一种构建汽车行驶工况的方法
CN111873804B (zh) 一种电动汽车工况数据生成方法和能耗评价工况生成方法
CN107067722B (zh) 一种车辆行驶工况构建方法
CN113222385B (zh) 一种电动汽车行驶工况构建与评价方法
CN113419942B (zh) 一种基于自然驾驶数据的自动驾驶安全性评价方法
CN113297795A (zh) 一种纯电动汽车行驶工况构建方法
CN111008505A (zh) 城市坡道行驶工况构建方法及应用
CN109840612A (zh) 用户驾驶行为分析方法及系统
CN113689594A (zh) 一种新的汽车行驶工况构造方法
CN111310280A (zh) 汽车运动学片段提取及工况图合成方法
CN114091182A (zh) 一种包含道路坡度信息的重型载货汽车行驶工况构建方法
CN111062093B (zh) 一种基于图像处理和机器学习的汽车轮胎寿命预测方法
CN105527110B (zh) 汽车燃油经济性的评估方法和装置
CN113052196A (zh) 一种基于贪心算法的汽车工况构建方法
CN113918890B (zh) 一种基于移动窗口库的低负荷工况构建方法
Vámosi et al. Development of bus driving cycle for Debrecen on the basis of real-traffic data
CN112729863B (zh) 一种车辆实测道路选择方法
CN116859352A (zh) 一种路侧毫米波雷达设备运行状态评估方法及系统
CN112035536A (zh) 一种考虑动态路网交通流的电动汽车能耗预测方法
CN115311858A (zh) 基于交通流韧性的城市路段分级管制方法
CN114332825A (zh) 基于深度学习的道路地形分布识别方法、设备和存储介质
CN119443879A (zh) 一种驾驶行为分析评价方法及系统
Yugendar et al. Driving cycle estimation and validation for Ludhiana City, India
CN115718886A (zh) 纯电动汽车行驶工况的构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210611

WD01 Invention patent application deemed withdrawn after publication