CN115984992A - 一种车辆运行数据的检测方法、装置及设备 - Google Patents

一种车辆运行数据的检测方法、装置及设备 Download PDF

Info

Publication number
CN115984992A
CN115984992A CN202211658544.8A CN202211658544A CN115984992A CN 115984992 A CN115984992 A CN 115984992A CN 202211658544 A CN202211658544 A CN 202211658544A CN 115984992 A CN115984992 A CN 115984992A
Authority
CN
China
Prior art keywords
operation data
vehicle operation
vehicle
normal
isolated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211658544.8A
Other languages
English (en)
Inventor
姜瑞
闫学亮
王卓
杨春城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunkong Zhihang Shanghai Automotive Technology Co ltd
Original Assignee
Yunkong Zhihang Shanghai Automotive Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunkong Zhihang Shanghai Automotive Technology Co ltd filed Critical Yunkong Zhihang Shanghai Automotive Technology Co ltd
Priority to CN202211658544.8A priority Critical patent/CN115984992A/zh
Publication of CN115984992A publication Critical patent/CN115984992A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本说明书实施例中公开了一种车辆运行数据的检测方法、装置及设备。包括:获取针对目标车辆采集到的车辆运行数据集合,车辆运行数据集合包括目标车辆各个预设位置处的车载设备采集到的车辆运行数据,将各个车辆运行数据输入至包含有预设数量的孤立树模型,得到各个车辆运行数据的异常评分,孤立树模型均是分别基于任意正常车辆运行数据集经二叉树的分叉原理得到的,将异常评分小于预设值的车辆运行数据确定为正常车辆运行数据。该方案利用孤立森林模型中的多个正常车辆运行数据为参照,来对待检测车辆运行数据进行检测,且可以利用孤立森林模型同时对多个待检测车辆运行数据进行检测,从而可以提升针对车辆运行数据进行检测的准确性和速率。

Description

一种车辆运行数据的检测方法、装置及设备
技术领域
本申请涉及自动驾驶技术领域,尤其涉及一种车辆运行数据的检测方法、装置及设备。
背景技术
传统检测车辆运行数据的模型是根据连续两个输入的正常车辆运行数据,预测出下一个车辆运行数据,然后将实际收到的下一个车辆运行数据与预测出的车辆运行数据进行比对,得出二者的偏差,若该偏差大于预设阀值,则将该接收到的车辆运行数据判定为异常车辆运行数据。因此,传统检测车辆运行数据的模型是以连续两个正常车辆运行数据为参照物来评价被检测车辆运行数据,其结果受所选择的正常车辆运行数据的影响较大,局限性比较高,因此会导致被检测车辆运行数据的判定结果的误差较大。
并且目前车辆运行数据采集设备对车辆运行数据的采集方式已由原来的将整车作为一个刚性实体进行车辆运行数据的采集,变更为针对车辆的四个车轮分别进行车辆运行数据的采集,即由原来的一个数据采集设备每次采集一个车辆运行数据,变更为现在的四个数据采集设备每次同时采集四个车辆运行数据。由于现有的检测车辆运行数据的模型每次只能检测一个车辆运行数据,因此针对现在每次同时上报的四个车辆运行数据需要经过四次检测才能检测完成,待检测出这四个车辆运行数据全部为正常车辆数据后,再根据这四个车辆运行数据对车辆的自动驾驶进行规划。由于现有技术中需要经过四个检测周期才能将每次上报的四个车辆运行数据检测完成,自动驾驶规划平台在接收完四个车辆运行数据的检测结果后,才能完成对车辆运行状态的分析,因此现有技术中自动驾驶规划平台需要等待较长时间才能完成针对车辆的自动驾驶规划分析,从而必然造成自动驾驶规划平台与车辆之间数据交互的延时较大,车辆不能实时接收到自动驾驶规划平台的指令,就会对车辆的自动驾驶的安全带来很大的隐患。
基于此,如何提升针对车辆运行数据进行检测的准确性和速率成为了亟待解决的技术问题。
发明内容
本说明书实施例提供的一种车辆运行数据的检测方法、装置及设备,将车辆运行数据集合中各个车辆运行数据同时输入至包含预设数量孤立树模型的孤立森林模型中,每一棵孤立树模型都是基于一个任意正常车辆运行数据集经二叉树的分叉原理得到的,即利用孤立森林模型中的多个正常车辆运行数据为参照,来对待检测车辆运行数据进行检测,且可以利用孤立森林模型同时对多个待检测车辆运行数据进行检测,从而可以提升针对车辆运行数据进行检测的准确性和速率。
为解决上述技术问题,本说明书实施例是这样实现的:
一种车辆运行数据的检测方法,包括,
获取针对目标车辆采集到的车辆运行数据集合;所述车辆运行数据集合中包括设置于所述目标车辆的各个预设位置处的车载设备在预设时间内采集到的车辆运行数据。
将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分;其中,所述孤立森林模型包括预设数量的孤立树模型,所述孤立树模型为对训练样本集进行二叉树的分叉处理后生成的模型。
将所述异常评分小于预设值的所述车辆运行数据确定为正常车辆运行数据。
一种车辆运行数据的检测装置,包括,
获取模块,用于获取针对目标车辆采集到的车辆运行数据集合;所述车辆运行数据集合中包括设置于所述目标车辆的各个预设位置处的车载设备在预设时间内采集到的车辆运行数据。
输入模块,用于将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分;其中,所述孤立森林模型包括预设数量的孤立树模型,所述孤立树模型为对训练样本集进行二叉树的分叉处理后生成的模型。
确定模块,用于将所述异常评分小于预设值的所述车辆运行数据确定为正常车辆运行数据。
一种车辆运行数据的检测设备,包括,
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取针对目标车辆采集到的车辆运行数据集合;所述车辆运行数据集合中包括设置于所述目标车辆的各个预设位置处的车载设备在预设时间内采集到的车辆运行数据。
将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分;其中,所述孤立森林模型包括预设数量的孤立树模型,所述孤立树模型为对训练样本集进行二叉树的分叉处理后生成的模型。
将所述异常评分小于预设值的所述车辆运行数据确定为正常车辆运行数据。
本说明书中提供的至少一个实施例能够实现以下有益效果:
每一棵孤立树模型都是基于一个任意正常车辆运行数据集经二叉树的分叉原理得到的,且孤立森林模型中包含有预设数量的孤立树模型,因此将车辆运行数据输入至孤立森林模型中进行检测,即相当于以孤立森林模型中的多个正常车辆运行数据为参照,来评测车辆运行数据,从而可以提升针对车辆运行数据进行检测的准确性;另外,可以将车辆运行数据集合中的各个车辆运行数据输入至孤立森林模型中同时进行检测,从而可以提升针对车辆运行数据进行检测的速率。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例提供的一种车辆运行数据的检测方法的流程示意图;
图2为本说明书实施例提供的任意一个孤立树模型生成过程示意图;
图3为本说明书实施例提供的对应于图1的一种车辆运行数据的检测装置的结构示意图;
图4为本说明书实施例提供的对应于图1的一种车辆运行数据的检测设备的结构示意图。
具体实施方式
为使本说明书一个或多个实施例的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书一个或多个实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书一个或多个实施例保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本说明书实施例提供的一种车辆运行数据的检测方法的流程示意图。从程序角度而言,该流程的执行主体可以为异常车辆数据检测设备,或者,异常车辆数据检测设备处搭载的应用程序。如图1所示,该流程可以包括以下步骤:
步骤102:获取针对目标车辆采集到的车辆运行数据集合;所述车辆运行数据集合中包括设置于所述目标车辆的各个预设位置处的车载设备在预设时间内采集到的车辆运行数据。
本说明书实施例中,数据采集设备可以为安装于目标车辆的各个预设位置处的各个车载设备(onboardunit,OBU),各个预设位置可以标记为位置1、位置2、位置3、位置4等等,各个车载设备可以标记为车载设备1、车载设备2、车载设备3、车载设备4等等,车辆运行数据集合中的车辆运行数据是在预设时刻通过各个车载设备采集得到的,在预设时间内各个车载设备所采集的车辆运行数据的数量可以相同。车辆运行数据中可以包括在采集时刻目标车辆的航向角、目标车辆的行驶速度、目标车辆的定位信息、采集数据的时间戳、车载设备的安装位置、车载设备的ID等数据信息。
步骤104:将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分;其中,所述孤立森林模型包括预设数量的孤立树模型,所述孤立树模型为对训练样本集进行二叉树的分叉处理后生成的模型。
本说明书实施例中,二叉树(binary tree)是一棵空树,或者是一棵由一个根节点和两棵互不相交的,分别称作根的左子树和右子树组成的非空树,左子树和右子树又同样都是二叉树。二叉树的分叉原理为添加一个节点,如果这是一棵空树,则将该节点作为根节点,否则按照从左到右、先左子树后右子树的顺序逐个添加节点,直至得到分叉后的孤立树模型。孤立森林模型是由预设数量的孤立树模型组成的,孤立森林模型中孤立树模型的数量越多,则孤立森林模型对数据进行检测时的准确性就越高,反之,孤立森林模型中孤立树模型的数量越少,则孤立森林模型对数据进行检测时的准确性就越低。每一棵孤立树都是基于一定数量的正常训练样本数据经分叉处理而得到的孤立树模型,因此,孤立森林模型中包含了多种正常车辆运行数据的场景。当将待检测的车辆运行数据集合输入至孤立森林模型中后,可以通过各个待检测车辆运行数据在各个孤立树模型中被孤立时所处的叶子节点的位置来评测各个待检测车辆运行数据的异常评分。比如:若待检测车辆运行数据a在各个孤立树模型中被孤立时均处于距离根节点较近的叶子节点处,表明待检测车辆运行数据a很快就被孤立出来了,即待检测车辆运行数据a与大多数待检测车辆运行数据不一致,则待检测车辆运行数据a属于异常车辆运行数据的可能性就较大,其异常评分将会较大。若待检测车辆运行数据b在各个孤立树模型中被孤立时均处于距离根节点较远的叶子节点处,表明待检测车辆运行数据b不容易被孤立出来,即待检测车辆运行数据b与大多数待检测车辆运行数据一致,则待检测车辆运行数据b属于正常车辆运行数据的可能性就较大,其异常评分将会较小。
步骤106:将所述异常评分小于预设值的所述车辆运行数据确定为正常车辆运行数据。
本说明书实施例中,将待检测车辆运行数据集合中的各个车辆运行数据输入至孤立森林模型后,得到各个待检测车辆运行数据的异常评分。将异常评分小于预设值的被检测车辆运行数据确定为正常车辆运行数据。根据需求,合理选择预设值的大小,其预设值越小,则判定出的正常车辆运行数据的准确度越高,其预设值越大,则判定出的正常车辆运行数据的准确度越低。
本说明书实施例中,每一棵孤立树模型都是基于一个任意正常车辆运行数据集经二叉树的分叉原理得到的,且孤立森林模型中包含有预设数量的孤立树模型,因此将车辆运行数据输入至孤立森林模型中进行检测,即相当于以孤立森林模型中的多个正常车辆运行数据为参照,来评测车辆运行数据,从而可以提升针对车辆运行数据进行检测的准确性;另外,可以将车辆运行数据集合中的各个车辆运行数据输入至孤立森林模型中同时进行检测,从而可以提升针对车辆运行数据进行检测的速率。
基于图1中的方法,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
目标车辆在行驶过程中,四个车轮处的车轮转速及航向角均具有一定的差别,为了得到目标车辆的整体行驶状态,可以基于四个车轮的行驶状态得出目标车辆的行驶状态。基于此,所述各个预设位置处的车载设备为分别设置于所述目标车辆的四个车轮处的四个车载设备。
本说明书实施例中,在目标车辆前左轮、前右轮、后左轮、后右轮的四个轮毂处分别安装一个车载设备,各个车载设备的命名可以为前左车载设备、前右车载设备、后左车载设备、后右车载设备。四个车载设备可以在同一采集时刻对各自对应的车轮进行一次车辆运行数据采集,在预设的时间内各个车载设备可以针对各自对应的车轮采集到相同数量的车辆运行数据。在预设的车辆运行数据发送时间,每一个车载设备都可以向车辆运行数据需求设备发送相同数量的车辆运行数据。
利用孤立森林模型对待检测车辆运行数据进行检测是利用孤立森林模型的预设数量的孤立树模型进行检测,因此,在对待检测车辆运行数据检测之前,还需构建多个孤立树模型。基于此,则步骤104:所述将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分之前,还可以包括:
获取初始训练样本集合,所述初始训练样本集合中包含第一预设数量的正常车辆运行数据样本。
对所述初始训练样本集合进行有放回抽样处理,得到第二预设数量的目标训练样本集合;每个所述目标训练样本集合中包含第三预设数量的所述正常车辆运行数据样本。
对各个所述目标训练样本集合按预设维度进行二叉树分叉处理,得到第四预设数量的所述孤立树模型;所述孤立森林模型包括所述第四预设数量的所述孤立树模型。
本说明书实施例中,初始训练样本集合是一个包含有第一预设数量的正常车辆运行数据集合。第一预设数量越大,则针对待检测车辆运行数据进行检测的准确度越高,第一预设数量越小,则针对待检测车辆运行数据进行检测的准确度越低,第一预设数量根据实际场景进行设定。
本说明书实施例中,对初始训练样本集合进行有放回抽样处理是指,每次从初始训练样本集合中抽取第三预设数量的正常训练样本,得到一个目标训练样本集合,每次抽取完后,再将所抽取的正常训练样本放回到初始训练样本集合中,待下一次抽取目标训练样本集合时,初始训练样本集合总是为初始的状态。第三预设数量可以为1,也可以为第一预设数量,或者也可以为1至第一预设数量之间的任意数值。按着上述有放回抽样的处理方法从初始训练样本集合中抽取第二预设数量次,得到第二预设数量的目标训练样本集合。第二预设数量取值越大,则得到的孤立树模型越多,针对待检测车辆运行数据进行检测的准确度越高,第二预设数量取值越小,则得到的孤立树模型越少,针对待检测车辆运行数据进行检测的准确度越低。
本说明书实施例中,对第二预设数量的目标训练样本集合中的任意一个目标训练样本集合均按着任意一个维度进行二叉树分叉处理,得到第四预设数量的孤立树模型。第四预设数量可以和第二预设数量相同,也可以与第二预设数量不同。每一棵孤立树模型的生成过程如图2所示:假设数据A代表的异常评分为0.95,数据B代表的异常评分为0.5,数据C代表的异常评分为0.55,数据D代表的异常评分为0.35,数据E代表的异常评分为0.21,数据F代表的异常评分为0.15。假设第一次分叉的处理方式为按着将异常评分大于0.6的数据放到左侧节点,小于等于0.6的数据放到右侧节点;第二次分叉的处理方式为按着将异常评分大于0.5的数据放到左侧节点,小于等于0.5的数据放到右侧节点;第三次分叉的处理方式为若节点中仅有两个数据,则将节点分解为左右两个单独数据的节点,若节点包含有三个及三个以上的数据,则将异常评分大于0.3的数据放到左侧节点,小于等于0.3的数据放到右侧节点;第四次分叉的处理方式为按着将异常评分大于0.2的数据放到左侧节点,小于等于0.2的数据放到右侧节点。直至所有的节点内都只包含1个数据,从而得到一个孤立树模型。根据同样的方式,最终得到第四预设数量的孤立树模型,从而可以得到包含第四预设数量的孤立树模型的孤立森林模型。从而利用包含有多个孤立树模型的孤立森林模型对待检测车辆运行数据进行检测,可以提升针对待检测车辆运行数据进行检测的准确性。
步骤104:所述将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分,具体可以包括:
将目标车辆运行数据依次遍历所述孤立森林模型的各个所述孤立树模型,得到所述目标车辆运行数据在各个所述孤立树模型中的各个第一平均高度。所述目标车辆运行数据为所述车辆运行数据集合中的任意一个车辆运行数据;
计算各个所述第一平均高度的平均值,得到所述目标车辆运行数据的第二平均高度。
根据所述第二平均高度与第三平均高度的比值,生成所述目标车辆运行数据的异常评分;所述第三平均高度是通过将所述孤立森林模型输入至深度学习模型进行训练,得到针对目标孤立树模型进行分叉处理后的平均高度,所述目标孤立树模型为根据任意数量的训练样本得到的孤立树模型。
本说明书实施例中,从待检测车辆运行数据集合中选取出任意一个待检测车辆运行数据c,假设孤立森林模型中包含有t棵孤立树模型,将待检测车辆运行数据c依次遍历t棵孤立树模型,得到待检测车辆运行数据c在各个孤立树模型的各个第一平均高度,第一平均高度表示待检测车辆运行数据c在任意一个孤立树模型中被孤立时所经历的分叉路径,第一平均高度越大,则证明待检测车辆运行数据c与相应孤立树模型中所包含的大部分训练样本越相似,第一平均高度越小,则证明待检测车辆运行数据c与相应孤立树模型中所包含的大部分训练样本越不相似。
本说明书实施例中,将待检测车辆运行数据c依次遍历孤立森林模型中的t棵孤立树模型后,将会得到t个第一平均高度,计算t个第一平均高度的平均值,得到待检测车辆运行数据c在孤立森林模型中的第二平均高度,第二平均高度表示待检测车辆运行数据c在t棵孤立树模型中被孤立出的平均分叉路径,第二平均高度越大,则证明待检测车辆运行数据c与孤立森林模型所包含的大部分训练样本越相似,待检测车辆运行数据c属于正常车辆运行数据的可能性就越大,第二平均高度越小,则证明待检测车辆运行数据c与孤立森林模型中所包含的大部分训练样本越不相似,待检测车辆运行数据c属于正常车辆运行数据的可能性就越小。
本说明书实施例中,将孤立森林模型所包含的所有孤立树模型均输入至深度学习模型,深度学习模型基于孤立森林模型中的各个孤立树模型进行自学习,经过自学习后的深度学习模型可以输出一个针对任意一个训练样本集合进行分叉处理的平均分叉路径高度,即得到第三平均高度。第三平均高度可以表示任意一个车辆运行数据集合的经分叉处理后的分叉路径高度。根据各个待检测车辆运行数据的第二平均高度与该待检测车辆运行数据所在的待检测车辆运行数据集合的第三平均高度的比值情况,就可以得出该待检测车辆运行数据的异常评分。当上述第二平均高度与第三平均高度越接近,则表明该待检测车辆运行数据被分裂出来的路径高度与待检测车辆运行数据集合形成的孤立树模型的高度越接近,该待检测车辆运行数据被孤立出来的时间越晚,即待检测车辆运行数据与待检测车辆运行数据集合中的大多数数据越相似,其异常评分就会越低;当上述第二平均高度越小于第三平均高度时,则表明该待检测车辆运行数据被分裂出来的路径高度越小于待检测车辆运行数据集合形成的孤立树模型的高度,该待检测车辆运行数据被孤立出来的时间就会越早,即待检测车辆运行数据与待检测车辆运行数据集合中的大多数数据越不相似,其异常评分就会越高。
本说明书实施例中,通过多个正常车辆运行数据所形成的多个孤立树模型来评测待检测车辆运行数据,以多个正常车辆运行数据为参照,来判定待检测车辆运行数据是否为异常车辆运行数据,从而可以提升对待检测车辆运行数据进行检测的准确度。
为了提升对车辆运行数据进行检测的准确性,深度学习模型可以为Scikit-Learn深度学习模型,Scikit-Learn深度学习模型经自学习后得到的第三平均高度可以按照公式(1)计算得到的:
Figure BDA0004012692190000111
Figure BDA0004012692190000112
其中:C(n)表示第三平均高度,n表示训练样本的数量,H(n-1)是调和数,,H(n-1)是根据ln(n-1)+0.5772156649(欧拉常数)来估算生成的。
本说明书实施例中,Scikit-Learn深度学习库提供了多种机器学习模型,可以执行有监督或者无监督的机器学习,通常被称为估算器。Scikit-Learn深度学习模型在基于预设数量的孤立树模型自学习后,能够得到针对包含有n个训练样本的训练样本集合进行分叉处理后的分叉路径高度的计算公式(1)。
在得到第三平均高度的计算公式(1)后,可以基于计算公式(1)得出计算待检测车辆运行数据的异常评分的计算公式(2)。基于此,所述根据所述第二平均高度与第三平均高度的比值,生成所述目标车辆运行数据的异常评分,具体可以包括:
根据所述第二平均高度与第三平均高度的比值,按照公式(2)计算得到所述目标车辆运行数据的异常评分;
Figure BDA0004012692190000121
其中,S(x,φ)表示包含φ个所述车辆运行数据的所述车辆运行数据集合中所述目标车辆运行数据的异常评分,E(h(x))表示所述第二平均高度,c(φ)表示包含φ个所述车辆运行数据的所述车辆运行数据集合的所述第三平均高度。
本说明书实施例中,首先将孤立森林模型输入至深度学习模型中,对深度学习模型进行自学习训练,然后将包含有φ个车辆运行数据的待检测车辆运行数据集合输入至深度学习模型中,各个待检测车辆运行数据的异常评分的过程如下:
1、根据公式(1)得出该待检测车辆运行数据集合的第三平均高度c(φ);
2、将各个待检测车辆运行数据依次遍历孤立森林模型的各个孤立树模型,得出各个待检测车辆运行数据的第二平均高度E(h(x));
3、根据公式(2)计算出各个待检测车辆运行数据的异常评分。
需要说明的是,上述过程1和过程2的执行顺序不做具体限定。
本说明书实施例中,根据各个车辆运行数据的实际情况,E(h(x))的可以包含四种情况,第一种情况可以为E(h(x))较小的场景,即待检测车辆运行数据很快就被孤立出来,第二种情况可以为E(h(x))无线大的场景,即待检测车辆运行数据不容易被孤立出来,第三种情况可以为E(h(x))与c(φ)接近的场景,即待检测车辆运行数据与其他待检测车辆运行数据比较相似,第四种情况可以为除上述三种情况之外的场景。当E(h(x))为第一种场景时,S(x,φ)的结果趋近于1,当E(h(x))为第二种场景时,S(x,φ)的结果趋近于0,当E(h(x))为第三种场景时,S(x,φ)的结果趋近于0.5。因此,待检测车辆运行数据越容易被孤立时,其异常评分越大,待检测车辆运行数据越不容易被孤立时,其异常评分越小。可以当异常评分大于等于0,且小于等于0.5时所对应的待检测车辆运行数据确定为正常车辆运行数据。当异常评分大于0.5,且小于等于1时所对应的待检测车辆运行数据确定为异常车辆运行数据。
本说明书实施例中,可以将待检测车辆运行数据集合中的各个车辆运行数据输入至深度学习模型中同时进行检测,将检测结果中异常评分符合预设要求的车辆运行数据确定为正常车辆运行数据。从而可以提升针对待检测车辆运行数据进行检测的速率。
由于待检测车辆运行数据集中包含有来自四个车载设备所采集的车辆运行数据,因此经深度学习模型进行检测后得到的正常车辆运行数据中也分别为来自各个车载设备的车辆运行数据。为了向正常车辆运行数据需求设备发送所需的车辆数据,还需对来自不同车载设备的正常车辆运行数据进行处理。基于此,所述将所述异常评分小于预设值的所述车辆运行数据确定为正常车辆运行数据之后,还可以包括:
获取各个所述正常车辆运行数据的数据采集时间戳。
根据所述数据采集时间戳对各个所述正常车辆运行数据进行分组处理,得的各个正常车辆运行数据组,任意一个所述正常车辆运行数据组中的各个所述正常车辆运行数据的所述数据采集时间戳均一致。
对符合预设规则的所述正常车辆运行数据组中的所述正常车辆运行数据进行归一化处理,得到处理后的正常车辆运行数据。
本说明书实施例中,针对从车辆运行数据集合中检测出的正常车辆运行数据,获取到各个正常车辆运行数据的数据采集时间戳,将数据采集时间戳相同的正常车辆运行时数据划分为一组,从而根据数据采集时间戳可以得到多个正常车辆运行数据组。得到的正常车辆运行数据组大致可以分为以下几种场景,场景一、正常车辆运行数据组中仅包含一个车辆运行数据,这种情况表示在相应的数据采集时刻,四个车载设备分别采集到的四个车辆运行数据中只有一个车辆运行数据为正常车辆运行数据;场景二、正常车辆运行数据组中包含两个车辆运行数据,这种情况表示在相应的数据采集时刻,四个车载设备分别采集到的四个车辆运行数据中有两个车辆运行数据为正常车辆运行数据;场景三、正常车辆运行数据组中包含三个车辆运行数据,这种情况表示在相应的数据采集时刻,四个车载设备分别采集到的四个车辆运行数据中有三个车辆运行数据为正常车辆运行数据;场景四、正常车辆运行数据组中包含四个车辆运行数据,这种情况表示在相应的数据采集时刻,四个车载设备分别采集到的四个车辆运行数据中全部为正常车辆运行数据。需要说明的是,由于在某一采集时刻,每一个车载设备仅能采集一个车辆运行数据,所以根据数据采集时间戳对正常车辆运行数据进行分组后,各个正常车辆数据组中不会出现包含大于四个车辆运行数据的场景。
本说明书实施例中,根据实际的需求,可以选择上述四种场景中的任意一种场景下的正常车辆运行数据组进行处理,将经过处理后得到的正常车辆运行数据作为发送至数据需求设备的正常车辆运行数据。本方案对根据哪一中场景中的正常车辆运行数据组进行处理不做具体限定,对正常车辆运行数据进行处理时的正常车辆运行数据越多,则得到的处理后的正常车辆运行数据就越能表征车辆的真实行驶状态。
为了检验各组正常车辆运行数据是否来自不同的车载设备,在对正常车辆运行数据组中的数据进行处理之前,还需判断各个正常车辆运行数据所属的车载设备。基于此,所述对符合预设规则的所述正常车辆运行数据组中的所述正常车辆运行数据进行归一化处理,得到处理后的正常车辆运行数据,具体可以包括:
针对任意一个所述正常车辆运行数据组,获取采集所述正常车辆运行数据组中各个所述正常车辆运行数据的所述车载设备的设备ID。
判断所述正常车辆运行数据组中各个所述正常车辆运行数据是否是通过不同的所述设备ID所对应的所述车载设备采集得到的,得到判断结果。
若所述判断结果表示所述正常车辆运行数据组中各个所述正常车辆运行数据是通过不同的所述设备ID所对应的所述车载设备采集得到的,则计算所述正常车辆运行数据组中各个正常车辆运行数据的平均值,将所述各个正常车辆运行数据的平均值作为处理后的正常车辆运行数据。
本说明书实施例中,选择任意一个正常车辆运行数据组,获取该组内各个正常车辆运行数据在被采集时的所对应的采集设备的设备ID,分析得到的各个设备ID是否均分别属于不同车载设备的设备ID,当所选择的正常车辆运行数据组中各个正常车辆运行数据分别是通过不同的设备ID所对应的车载设备采集得到的,则对该正常车辆运行数据中的各个正常车辆运行数据进行平均值计算,将计算得到的平均正常车辆运行数据作为处理后的正常车辆运行数据。从而可以提升向数据需求设备所提供的正常车辆运行数据的准确性,以使数据需求设备根据正常车辆运行数据做出相对准确的分析规划。
基于同样的思路,本说明书实施例还提供了上述方法对应的装置。图3为本说明书实施例提供的对应于图1的一种车辆运行数据的检测装置的结构示意图。如图3所示,该装置可以包括:
获取模块302,用于获取针对目标车辆采集到的车辆运行数据集合;所述车辆运行数据集合中包括设置于所述目标车辆的各个预设位置处的车载设备在预设时间内采集到的车辆运行数据。
输入模块304,用于将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分;其中,所述孤立森林模型包括预设数量的孤立树模型,所述孤立树模型为对训练样本集进行二叉树的分叉处理后生成的模型。
确定模块306,用于将所述异常评分小于预设值的所述车辆运行数据确定为正常车辆运行数据。
可选的,所述各个预设位置处的车载设备为分别设置于所述目标车辆的四个车轮处的四个车载设备。
可选的,所述输入模块304之前,还可以包括:
第二获取模块,用于获取初始训练样本集合,所述初始训练样本集合中包含第一预设数量的正常车辆运行数据样本。
抽样模块,用于对所述初始训练样本集合进行有放回抽样处理,得到第二预设数量的目标训练样本集合;每个所述目标训练样本集合中包含第三预设数量的所述正常车辆运行数据样本。
第一处理模块,用于对各个所述目标训练样本集合按预设维度进行二叉树分叉处理,得到第四预设数量的所述孤立树模型;所述孤立森林模型包括所述第四预设数量的所述孤立树模型。
可选的,所述输入模块304,具体可以包括:
遍历单元,用于将目标车辆运行数据依次遍历所述孤立森林模型的各个所述孤立树模型,得到所述目标车辆运行数据在各个所述孤立树模型中的各个第一平均高度;所述目标车辆运行数据为所述车辆运行数据集合中的任意一个车辆运行数据。
第一计算单元,用于计算各个所述第一平均高度的平均值,得到所述目标车辆运行数据的第二平均高度。
生成单元,用于根据所述第二平均高度与第三平均高度的比值,生成所述目标车辆运行数据的异常评分;所述第三平均高度是通过将所述孤立森林模型输入至深度学习模型进行训练,得到针对目标孤立树模型进行分叉处理后的平均高度,所述目标孤立树模型为根据任意数量的训练样本得到的孤立树模型。
可选的,所述深度学习模型为Scikit-Learn深度学习模型,所述第三平均高度是按照公式(1)计算得到的。
Figure BDA0004012692190000171
Figure BDA0004012692190000172
其中:C(n)表示第三平均高度,n表示训练样本的数量,H(n-1)是调和数,,H(n-1)是根据ln(n-1)+0.5772156649(欧拉常数)来估算生成的。
可选的,生成单元,具体可以包括:
根据所述第二平均高度与第三平均高度的比值,按照公式(2)计算得到所述目标车辆运行数据的异常评分;
Figure BDA0004012692190000173
其中,S(x,φ)表示包含φ个所述车辆运行数据的所述车辆运行数据集合中所述目标车辆运行数据的异常评分,E(h(x))表示所述第二平均高度,c(φ)表示包含φ个所述车辆运行数据的所述车辆运行数据集合的所述第三平均高度。
可选的,所述确定模块306之后,还可以包括:
第三获取模块,用于获取各个所述正常车辆运行数据的数据采集时间戳。
分组模块,用于根据所述数据采集时间戳对各个所述正常车辆运行数据进行分组处理,得的各个正常车辆运行数据组,任意一个所述正常车辆运行数据组中的各个所述正常车辆运行数据的所述数据采集时间戳均一致。
第二处理模块,用于对符合预设规则的所述正常车辆运行数据组中的所述正常车辆运行数据进行归一化处理,得到处理后的正常车辆运行数据。
可选的,所述第二处理模块,具体可以包括:
获取单元,用于针对任意一个所述正常车辆运行数据组,获取采集所述正常车辆运行数据组中各个所述正常车辆运行数据的所述车载设备的设备ID。
判断单元,用于判断所述正常车辆运行数据组中各个所述正常车辆运行数据是否是通过不同的所述设备ID所对应的所述车载设备采集得到的,得到判断结果。
第二计算单元,用于若所述判断结果表示所述正常车辆运行数据组中各个所述正常车辆运行数据是通过不同的所述设备ID所对应的所述车载设备采集得到的,则计算所述正常车辆运行数据组中各个正常车辆运行数据的平均值,将所述各个正常车辆运行数据的平均值作为处理后的正常车辆运行数据。
基于同样的思路,本说明书实施例还提供了上述方法对应的设备。
图4为本说明书实施例提供的对应于图1的一种车辆运行数据的检测设备的结构示意图。如图4所示,设备400可以包括:
至少一个处理器410;以及,
与所述至少一个处理器通信连接的存储器430;其中,
所述存储器430存储有可被所述至少一个处理器410执行的指令420,所述指令被所述至少一个处理器410执行,以使所述至少一个处理器410能够:
获取针对目标车辆采集到的车辆运行数据集合;所述车辆运行数据集合中包括设置于所述目标车辆的各个预设位置处的车载设备在预设时间内采集到的车辆运行数据。
将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分;其中,所述孤立森林模型包括预设数量的孤立树模型,所述孤立树模型为对训练样本集进行二叉树的分叉处理后生成的模型。
将所述异常评分小于预设值的所述车辆运行数据确定为正常车辆运行数据。
应当理解,本说明书一个或多个实施例所述的方法中,部分步骤的顺序可以根据实际需要调整,或者可以省略部分步骤。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于图4所示的设备而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种车辆运行数据的检测方法,其特征在于,包括:
获取针对目标车辆采集到的车辆运行数据集合;所述车辆运行数据集合中包括设置于所述目标车辆的各个预设位置处的车载设备在预设时间内采集到的车辆运行数据;
将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分;其中,所述孤立森林模型包括预设数量的孤立树模型,所述孤立树模型为对训练样本集进行二叉树的分叉处理后生成的模型;
将所述异常评分小于预设值的所述车辆运行数据确定为正常车辆运行数据。
2.如权利要求1所述的方法,其特征在于,所述各个预设位置处的车载设备为分别设置于所述目标车辆的四个车轮处的四个车载设备。
3.如权利要求1所述的方法,其特征在于,所述将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分之前,还包括:
获取初始训练样本集合,所述初始训练样本集合中包含第一预设数量的正常车辆运行数据样本;
对所述初始训练样本集合进行有放回抽样处理,得到第二预设数量的目标训练样本集合;每个所述目标训练样本集合中包含第三预设数量的所述正常车辆运行数据样本;
对各个所述目标训练样本集合按预设维度进行二叉树分叉处理,得到第四预设数量的所述孤立树模型;所述孤立森林模型包括所述第四预设数量的所述孤立树模型。
4.如权利要求3所述的方法,其特征在于,所述将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分,具体包括:
将目标车辆运行数据依次遍历所述孤立森林模型的各个所述孤立树模型,得到所述目标车辆运行数据在各个所述孤立树模型中的各个第一平均高度;所述目标车辆运行数据为所述车辆运行数据集合中的任意一个车辆运行数据;
计算各个所述第一平均高度的平均值,得到所述目标车辆运行数据的第二平均高度;
根据所述第二平均高度与第三平均高度的比值,生成所述目标车辆运行数据的异常评分;所述第三平均高度是通过将所述孤立森林模型输入至深度学习模型进行训练,得到针对目标孤立树模型进行分叉处理后的平均高度,所述目标孤立树模型为根据任意数量的训练样本得到的孤立树模型。
5.如权利要求4所述的方法,其特征在于,所述深度学习模型为Scikit-Learn深度学习模型,所述第三平均高度是按照公式(1)计算得到的;
Figure FDA0004012692180000021
其中:C(n)表示第三平均高度,n表示训练样本的数量,H(n-1)是调和数,,H(n-1)是根据ln(n-1)+0.5772156649(欧拉常数)来估算生成的。
6.如权利要求5所述的方法,其特征在于,所述根据所述第二平均高度与第三平均高度的比值,生成所述目标车辆运行数据的异常评分,具体包括:
根据所述第二平均高度与第三平均高度的比值,按照公式(2)计算得到所述目标车辆运行数据的异常评分;
Figure FDA0004012692180000022
其中,S(x,φ)表示包含φ个所述车辆运行数据的所述车辆运行数据集合中所述目标车辆运行数据的异常评分,E(h(x))表示所述第二平均高度,c(φ)表示包含φ个所述车辆运行数据的所述车辆运行数据集合的所述第三平均高度。
7.如权利要求2所述的方法,其特征在于,所述将所述异常评分小于预设值的所述车辆运行数据确定为正常车辆运行数据之后,还包括:
获取各个所述正常车辆运行数据的数据采集时间戳;
根据所述数据采集时间戳对各个所述正常车辆运行数据进行分组处理,得的各个正常车辆运行数据组,任意一个所述正常车辆运行数据组中的各个所述正常车辆运行数据的所述数据采集时间戳均一致;
对符合预设规则的所述正常车辆运行数据组中的所述正常车辆运行数据进行归一化处理,得到处理后的正常车辆运行数据。
8.如权利要求7所述的方法,其特征在于,所述对符合预设规则的所述正常车辆运行数据组中的所述正常车辆运行数据进行归一化处理,得到处理后的正常车辆运行数据,具体包括:
针对任意一个所述正常车辆运行数据组,获取采集所述正常车辆运行数据组中各个所述正常车辆运行数据的所述车载设备的设备ID;
判断所述正常车辆运行数据组中各个所述正常车辆运行数据是否是通过不同的所述设备ID所对应的所述车载设备采集得到的,得到判断结果;
若所述判断结果表示所述正常车辆运行数据组中各个所述正常车辆运行数据是通过不同的所述设备ID所对应的所述车载设备采集得到的,则计算所述正常车辆运行数据组中各个正常车辆运行数据的平均值,将所述各个正常车辆运行数据的平均值作为处理后的正常车辆运行数据。
9.一种车辆运行数据的检测装置,其特征在于,包括:
获取模块,用于获取针对目标车辆采集到的车辆运行数据集合;所述车辆运行数据集合中包括设置于所述目标车辆的各个预设位置处的车载设备在预设时间内采集到的车辆运行数据;
输入模块,用于将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分;其中,所述孤立森林模型包括预设数量的孤立树模型,所述孤立树模型为对训练样本集进行二叉树的分叉处理后生成的模型;
确定模块,用于将所述异常评分小于预设值的所述车辆运行数据确定为正常车辆运行数据。
10.一种车辆运行数据的检测设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取针对目标车辆采集到的车辆运行数据集合;所述车辆运行数据集合中包括设置于所述目标车辆的各个预设位置处的车载设备在预设时间内采集到的车辆运行数据;
将所述车辆运行数据集合中的各个所述车辆运行数据输入至孤立森林模型,得到各个所述车辆运行数据的异常评分;其中,所述孤立森林模型包括预设数量的孤立树模型,所述孤立树模型为对训练样本集进行二叉树的分叉处理后生成的模型;
将所述异常评分小于预设值的所述车辆运行数据确定为正常车辆运行数据。
CN202211658544.8A 2022-12-22 2022-12-22 一种车辆运行数据的检测方法、装置及设备 Pending CN115984992A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211658544.8A CN115984992A (zh) 2022-12-22 2022-12-22 一种车辆运行数据的检测方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211658544.8A CN115984992A (zh) 2022-12-22 2022-12-22 一种车辆运行数据的检测方法、装置及设备

Publications (1)

Publication Number Publication Date
CN115984992A true CN115984992A (zh) 2023-04-18

Family

ID=85962105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211658544.8A Pending CN115984992A (zh) 2022-12-22 2022-12-22 一种车辆运行数据的检测方法、装置及设备

Country Status (1)

Country Link
CN (1) CN115984992A (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109785595A (zh) * 2019-02-26 2019-05-21 成都古河云科技有限公司 一种基于机器学习的车辆异常轨迹实时识别方法
US20190173902A1 (en) * 2016-12-06 2019-06-06 Panasonic Intellectual Property Corporation Of America Information processing device, information processing method, and recording medium storing program
CN109948728A (zh) * 2019-03-28 2019-06-28 第四范式(北京)技术有限公司 异常交易检测模型的训练以及异常交易检测的方法和装置
CN109948669A (zh) * 2019-03-04 2019-06-28 腾讯科技(深圳)有限公司 一种异常数据检测方法及装置
CN110149258A (zh) * 2019-04-12 2019-08-20 北京航空航天大学 一种基于孤立森林的汽车can总线网络数据异常检测方法
CN110243599A (zh) * 2019-07-02 2019-09-17 西南交通大学 多维离群列车动车组轴箱轴承温度异常状态监测方法
CN111710373A (zh) * 2020-07-20 2020-09-25 中科三清科技有限公司 挥发性有机物观测数据的检测方法、装置、设备及介质
CN112046492A (zh) * 2020-08-05 2020-12-08 华人运通(江苏)技术有限公司 一种带有方向的车辆车速计算方法、装置、设备及介质
CN112287602A (zh) * 2020-10-28 2021-01-29 北京国信会视科技有限公司 一种基于机器学习和孤立森林的动车轴温故障预警方法
CN113537642A (zh) * 2021-08-20 2021-10-22 日月光半导体制造股份有限公司 产品品质预测方法、装置、电子设备及存储介质
CN113762350A (zh) * 2021-08-12 2021-12-07 南京星云数字技术有限公司 异常数据检测方法、装置、计算机设备和存储介质
CN113792782A (zh) * 2021-09-13 2021-12-14 一汽出行科技有限公司 运营车辆的轨迹监测方法、装置、存储介质及计算机设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190173902A1 (en) * 2016-12-06 2019-06-06 Panasonic Intellectual Property Corporation Of America Information processing device, information processing method, and recording medium storing program
CN109785595A (zh) * 2019-02-26 2019-05-21 成都古河云科技有限公司 一种基于机器学习的车辆异常轨迹实时识别方法
CN109948669A (zh) * 2019-03-04 2019-06-28 腾讯科技(深圳)有限公司 一种异常数据检测方法及装置
CN109948728A (zh) * 2019-03-28 2019-06-28 第四范式(北京)技术有限公司 异常交易检测模型的训练以及异常交易检测的方法和装置
CN110149258A (zh) * 2019-04-12 2019-08-20 北京航空航天大学 一种基于孤立森林的汽车can总线网络数据异常检测方法
CN110243599A (zh) * 2019-07-02 2019-09-17 西南交通大学 多维离群列车动车组轴箱轴承温度异常状态监测方法
CN111710373A (zh) * 2020-07-20 2020-09-25 中科三清科技有限公司 挥发性有机物观测数据的检测方法、装置、设备及介质
CN112046492A (zh) * 2020-08-05 2020-12-08 华人运通(江苏)技术有限公司 一种带有方向的车辆车速计算方法、装置、设备及介质
CN112287602A (zh) * 2020-10-28 2021-01-29 北京国信会视科技有限公司 一种基于机器学习和孤立森林的动车轴温故障预警方法
CN113762350A (zh) * 2021-08-12 2021-12-07 南京星云数字技术有限公司 异常数据检测方法、装置、计算机设备和存储介质
CN113537642A (zh) * 2021-08-20 2021-10-22 日月光半导体制造股份有限公司 产品品质预测方法、装置、电子设备及存储介质
CN113792782A (zh) * 2021-09-13 2021-12-14 一汽出行科技有限公司 运营车辆的轨迹监测方法、装置、存储介质及计算机设备

Similar Documents

Publication Publication Date Title
CN111861627B (zh) 一种共享车辆的寻找方法、装置、电子设备及存储介质
CN108229567B (zh) 驾驶员身份识别方法及装置
CN107403480A (zh) 一种车辆故障预警方法、系统及车辆
CN111177887A (zh) 一种基于真实驾驶场景构造仿真轨迹数据的方法和装置
CN111523577A (zh) 一种基于改进的lcss算法的海量轨迹相似度计算方法
CN110727706A (zh) 一种面向智能网联汽车测试的风险驾驶场景快速提取与分级方法
CN112269827B (zh) 数据处理方法、装置、计算机设备及计算机可读存储介质
CN116011225A (zh) 场景库的生成方法、测试方法、电子设备及存储介质
CN115984992A (zh) 一种车辆运行数据的检测方法、装置及设备
CN117493834B (zh) 定位性能评价方法、装置和电子设备
CN111209158B (zh) 服务器集群的挖矿监控方法及集群监控系统
CN110782117B (zh) 驾驶风险检测方法及装置、存储介质、电子设备
CN112069037A (zh) 一种云平台无阈值检测的方法和装置
CN110968690B (zh) 词语的聚类划分方法和装置、设备以及存储介质
CN117290407A (zh) 基于日志的列车制动能力影响分析方法、系统及介质
Gallo et al. An explainable approach for car driver identification
CN114465875A (zh) 故障处理方法及装置
CN113436255B (zh) 基于列车定位和视觉信息的轨道异常物体识别方法及系统
CN112434649A (zh) 一种建筑物安全检测方法及系统
CN113343448B (zh) 控制效果评估方法、装置、电子设备及存储介质
CN115293301B (zh) 车辆的变道方向的预估方法、装置及存储介质
CN117493820B (zh) 一种数据要素处理方法和装置
CN114500101B (zh) 一种基于云计算的云游戏漏洞分析方法及服务器
CN117633519B (zh) 变道检测方法、装置、电子设备及存储介质
CN118035939B (zh) 感知目标的置信度获取方法及自动驾驶规划控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination