CN115809435A - 基于模拟器的汽车运行故障识别方法 - Google Patents

基于模拟器的汽车运行故障识别方法 Download PDF

Info

Publication number
CN115809435A
CN115809435A CN202310063443.4A CN202310063443A CN115809435A CN 115809435 A CN115809435 A CN 115809435A CN 202310063443 A CN202310063443 A CN 202310063443A CN 115809435 A CN115809435 A CN 115809435A
Authority
CN
China
Prior art keywords
dimension
data
point
outlier
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310063443.4A
Other languages
English (en)
Other versions
CN115809435B (zh
Inventor
王一
王继
张宪科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Xingke Intelligent Technology Co ltd
Original Assignee
Shandong Xingke Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Xingke Intelligent Technology Co ltd filed Critical Shandong Xingke Intelligent Technology Co ltd
Priority to CN202310063443.4A priority Critical patent/CN115809435B/zh
Publication of CN115809435A publication Critical patent/CN115809435A/zh
Application granted granted Critical
Publication of CN115809435B publication Critical patent/CN115809435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electric Propulsion And Braking For Vehicles (AREA)
  • Vehicle Cleaning, Maintenance, Repair, Refitting, And Outriggers (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及数据处理技术领域,具体涉及基于模拟器的汽车运行故障识别方法。该方法包括采集不同时刻的汽车数据得到多个原始样本点,依据各维度中数据点的离群程度获取数据关联显著性,根据各维度中数据点间的距离与数据关联显著性获取离群贡献度,获取每个原始样本点在各维度中对应数据点的原始离群因子和可达距离,依据每个原始样本点在各维度中对应的数据点与可达距离内各数据点间的距离、离群贡献度与原始离群因子获取合成离群因子,进而获取原始样本点的累加离群因子,累加离群因子包含多维度的汽车数据,能够综合表征汽车的异常数据信息,基于累加离群因子确定汽车故障情况,提高了对汽车运行故障识别的准确性。

Description

基于模拟器的汽车运行故障识别方法
技术领域
本发明涉及数据处理技术领域,具体涉及基于模拟器的汽车运行故障识别方法。
背景技术
从汽车结构来看,汽车由多个零件组成部件,由多个部件组成总成件或者系统,各系统按照设计的功能运行和配合,达到汽车的整体运行要求。在汽车行驶过程中车辆的零件、部件、以及总成件会不断的磨损,导致汽车故障不断发生,严重的汽车故障极大可能会造成交通事故,出现人员伤亡和财产损失的情况。为了减少汽车故障的发生,确保汽车的行驶安全,使用模拟器对汽车的运行情况进行模拟,确定汽车在运行过程中可能出现的故障,根据模拟器得到的故障对汽车进行维修,减少由汽车故障而导致交通事故的概率。在模拟器模拟汽车运行场景中,当车辆运行的监测数据出现异常时,则需要准确判断异常数据点,并根据异常数据点对车辆参数进行调控,保障车身整体稳定性,进而保护乘员人身安全。
现有技术采集车辆正常运行的样本数据,对样本数据进行预处理和自动标签得到参数训练样本集,构建分类模型对参数训练样本集进行训练,并在参数训练样本集中划分运行状态对应的数据类,对具有相同运行状态的数据类通过映射构建样本多维数据空间,并确定多维数据空间中每类正常运行状态的数据类对应的中心或质心,通过待检数据点与中心或质心的距离对车辆的故障情况进行警报。该方法判断车辆故障的参数较为单一,没有对各待检数据点在每个维度的特征进行详细分析,导致待检数据点与中心之间的距离不能准确反映汽车运行的故障情况,进而使汽车运行故障的识别出现偏差。
发明内容
为了解决待测数据点反映车辆信息不精确,导致汽车运行故障识别出现偏差的技术问题,本发明的目的在于提供一种基于模拟器的汽车运行故障识别方法,所采用的技术方案具体如下:
本发明提出了基于模拟器的汽车运行故障识别方法,该方法包括:
采集至少两个时刻的汽车数据,将每个时刻下的所述汽车数据作为原始样本点,所述原始样本点包含不同维度的汽车数据;
获取所述原始样本点在每个维度对应的样本空间中的数据点;
依据每个维度的所述样本空间中各数据点的离群程度获取对应维度的数据关联显著性;
根据每个维度的所述样本空间中数据点之间的距离与对应维度的所述数据关联显著性获取对应维度的离群贡献度;
获取每个所述原始样本点在各维度的所述样本空间中对应数据点的原始离群因子和可达距离;依据每个所述原始样本点在各维度的所述样本空间中对应的数据点与所述可达距离内各数据点之间的距离、所述离群贡献度与所述原始离群因子获取每个原始样本点在对应维度中数据点的合成离群因子;
依据每个所述原始样本点的各维度中对应数据点的合成离群因子获取对应原始样本点的累加离群因子;由模拟器根据所述累加离群因子对汽车故障进行识别。
进一步地,所述离群程度的获取方法,包括:
通过聚类算法对每个维度对应的所述样本空间中所有数据点进行聚类,每个维度均得到一个聚类簇,将每个聚类簇的聚类中心点作为聚类簇对应维度的簇类中心点;以每个维度的所述样本空间中各数据点与对应所述簇类中心点的距离作为所述离群程度。
进一步地,所述数据关联显著性的获取方法,包括:
将数据点的所述离群程度的平方作为分子,数据点所属维度的样本空间中所有数据点的方差与预设常数的乘积作为分母得到的比值作为对应数据点的初始变化值,将所述初始变化值进行负相关映射得到对应数据点的变化值,计算每个维度的样本空间中所有数据点的变化值的均值作为对应维度的数据关联显著性。
进一步地,所述离群贡献度的获取方法,包括:
将每个维度的样本空间中任意两个数据点之间的距离作为数据点差值,计算每个维度中全部所述数据点差值的平方的均值得到对应维度的样本均值,将每个维度的数据关联显著性与样本均值的乘积的开方作为对应维度的初始离群贡献度,将所述初始离群贡献度进行归一化得到对应维度的离群贡献度。
进一步地,所述合成离群因子的获取方法,包括:
根据合成离群因子公式获得所述合成离群因子,所述合成离群因子的计算公式为:
Figure SMS_1
式中,
Figure SMS_2
为原始样本点t在维度i中对应数据点的合成离群因子,
Figure SMS_6
为原始样本点t在维度i的样本空间中对应数据点的原始离群因子,
Figure SMS_8
为原始样本点t在维度i的样本空间中对应的数据点,
Figure SMS_3
为原始样本点t在维度i的样本空间中对应的数据点的可达距离内第f个数据点,
Figure SMS_5
为原始样本点t在维度i中对应数据点的可达距离内数据点的数量,
Figure SMS_7
为维度i的离群贡献度;
Figure SMS_9
为归一化函数,
Figure SMS_4
为距离获取函数。
进一步地,所述累加离群因子的获取方法,包括:
将每个原始样本点在各维度中对应数据点的合成离群因子相加得到对应原始样本点的累加离群因子。
进一步地,所述获取每个所述原始样本点在各维度的所述样本空间中对应数据点的原始离群因子和可达距离的方法,包括:
通过LOF算法得到每个原始样本点在各维度的样本空间中对应数据点的原始离群因子和可达距离。
本发明具有如下有益效果:
本发明实施例中,为了保证汽车运行故障结果识别的准确性,采集多个时刻下的汽车数据,将每个时刻下的汽车数据作为原始样本点,对多个原始样本点的汽车数据进行分析使得获取判断汽车故障的参数更加精确,由于原始样本点包含不同维度的汽车数据,各维度之间汽车数据的聚簇特征不相同,因此需要分别对各维度的汽车数据进行分析,获取原始样本点在每个维度对应的样本空间中的数据点;不同维度数据对于不同汽车故障产生原因有不同的数据变化程度,为确定不同维度的数据点之间的相互关联程度,依据每个维度的样本空间中各数据点的离群程度获取对应维度的数据关联显著性,当维度中数据点呈稀疏分布,导致不能精确识别维度内数据点的微小数据变化,因此需要根据每个维度的样本空间中数据点之间的距离与对应维度的所述数据关联显著性获取对应维度的离群贡献度,根据离群贡献度表征当前维度内数据点的变化;为得到与原始样本点在维度中对应数据点的相关性较大的数据点,获取每个原始样本点在各维度的样本空间中对应数据点的原始离群因子和可达距离,并依据每个原始样本点在各维度的样本空间中对应的数据点与可达距离内各数据点之间的距离、离群贡献度与原始离群因子获取每个原始样本点在对应维度中数据点的合成离群因子,合成离群因子为原始离群因子进行加权后的结果,加权后使数据点的离群程度与其他数据点的原始离群因子评价差距更大,提升了在对应维度样本空间中数据点的检测精度;汽车整体由各个部件组成,各部件在汽车运行中相互联系,对汽车进行故障识别需要将各部件对应维度的数据进行综合分析,所以依据每个原始样本点的各维度中对应数据点的合成离群因子获取对应原始样本点的累加离群因子,避免了多个维度的数据点发生变化而对应维度的合成离群因子未发生变化的缺陷,降低了原始样本点的累加离群因子表征汽车数据出现偏差的概率,进而提高对汽车运行进行故障识别的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种基于模拟器的汽车运行故障识别方法的步骤流程图;
图2为本发明一个实施例所提供的汽车信息采集示意图;
图3为本发明一个实施例所提供的不同维度数据点的聚簇特征示意图;
图4为本发明一个实施例所提供的维度的簇类中心点示意图;
图5为本发明一个实施例所提供的离群程度示意图;
图6为本发明一个实施例所提供的离群贡献度示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于模拟器的汽车运行故障识别方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
本发明所针对的具体场景:在使用模拟器模拟汽车运行过程中,当汽车出现故障时,利用LOF算法进行异常检测仅通过样本的数值关系进行判断,由于汽车中各系统相互配合才能达到汽车的整体运行要求,所以忽略了样本点本身数据对象的多个维度之间的关联特征。
下面结合附图具体的说明本发明所提供的一种基于模拟器的汽车运行故障识别方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于模拟器的汽车运行故障识别方法的步骤流程图,该方法包括:
步骤S1:采集至少两个时刻的汽车数据,将每个时刻下的所述汽车数据作为原始样本点,所述原始样本点包含不同维度的汽车数据。
在汽车行驶过程中车辆的零件、部件、以及总成件会不断的磨损,导致汽车故障不断发生,使用模拟器对汽车的运行情况进行模拟,确定汽车可能在运行过程中出现的故障。
分别采集n个时刻的汽车数据,图2为本发明一个实施例所提供的汽车信息采集示意图,如图2所示,采集的汽车数据包括:发动机转速、车轮转速、变速箱齿轮比、加速踏板开度和制动系统压力。将每个时刻的汽车数据分别记为
Figure SMS_10
,其中,
Figure SMS_11
为第1个时刻的汽车数据,
Figure SMS_12
为第2个时刻的汽车数据,
Figure SMS_13
为第n个时刻的汽车数据,每个时刻的汽车数据为一个原始样本点,且原始样本点中包含不同维度的汽车数据,即原始样本点包含对应时刻的发动机转速、车轮转速、变速箱齿轮比、加速踏板开度和制动系统压力。每种类型的汽车数据对应一个维度,即原始样本点有5个不同维度的汽车数据。将n个时刻的汽车数据
Figure SMS_14
为原始样本数据,原始样本数据中有n个原始样本点,由这n个原始样本点建立原始样本空间。
步骤S2:获取所述原始样本点在每个维度对应的样本空间中的数据点。
原始样本点包含不同维度的汽车数据,各维度中汽车数据的聚簇特征不相同,有的维度中汽车数据聚簇较为紧密,而有的维度中汽车数据聚簇较为松散,因此需要将各个维度的汽车数据分离进行逐维度分析。
图3为本发明一个实施例所提供的不同维度数据点的聚簇特征示意图,如图3所示,图3上方的坐标系呈现原始样本数据中各原始样本点的聚簇分布,图3下方的3个坐标系分别呈现原始样本数据中的所有原始样本点在不同维度中对应的各数据点的聚簇分布,其中每个坐标系中的横轴表示时刻a,纵轴表示原始样本点,也即是汽车数据t。从图3可以看出,不同维度中原始样本数据中各原始样本点对应的数据点的聚簇分布差异较大,因此,需要对原始样本数据中各原始样本点在不同维度对应的数据点分别进行分析。需要说明的是,图3仅为示意图,列举出了三个维度中的数据点分布情况,在实际情况中汽车数据的维度大于三,在此不再一一举例。
分别获取n个原始样本点的发动机转速,基于所有原始样本点的发动机转速建立发动机转速维度对应的样本空间,即发动机转速维度对应的样本空间中有n个数据点。使用相同的方法分别建立车轮转速维度、变速箱齿轮比维度、加速踏板开度维度和制动系统压力的维度的样本空间,即原始样本点的每个维度均有对应的样本空间;获取每个原始样本点在每个维度的样本空间中对应的数据点。
步骤S3:依据每个维度的所述样本空间中各数据点的离群程度获取对应维度的数据关联显著性。
每个维度对应的样本空间中的数据点为离散点,这些离散点会因为对应维度下的数据大小呈现不同的聚集程度,而故障数据往往与正常数据呈现较大差别,即相对于正常数据而言,故障数据点为离群点,因此需要对每个维度下样本空间中各个数据点的离群程度进行分析,进而获得对应维度下的数据关联显著性。
首先,根据样本空间中数据点构成的簇类的大小,获取对应簇类的簇类中心点,并将其作为样本空间中各数据点的变化程度的判断标准。获取簇类中心点的方法为:通过聚类算法对每个维度对应的所述样本空间中所有数据点进行聚类,每个维度均得到一个聚类簇,将每个聚类簇的聚类中心点作为聚类簇对应维度的簇类中心点。
作为一个示例,图4为本发明一个实施例所提供的维度的簇类中心点示意图,如图4所示,用圆圈出的数据点为对应维度的簇类中心点,对维度i的样本空间中的数据点使用k-means算法进行聚类,其中k=1,即每个维度均有一个聚类簇,获取维度i的样本空间中对应聚类簇的聚类中心点,将该聚类中心点作为维度i的簇类中心点
Figure SMS_15
其次,各维度的样本空间中数据点之间的距离越大,表示当前维度中各数据点之间相互影响的程度越低,进而反映出对应维度中数据点的密度较低,则对应维度中数据点发生一定数据变化对当前维度中汽车数据产生的数据关联显著性越不明显,易导致汽车运行故障识别出现偏差。因此,获取每个维度的样本空间中数据点之间的离群程度作为判断当前维度的数据关联显著性的重要依据,离群程度的获取方法为:以每个维度的所述样本空间中各数据点与对应所述簇类中心点的距离作为离群程度。
图5为本发明一个实施例所提供的离群程度示意图,如图5所示,
Figure SMS_16
为维度i的样本空间中第n个数据点
Figure SMS_17
与维度i的样本空间中的簇类中心点
Figure SMS_18
之间的离群程度。
最后,人为操控与机械故障会导致汽车部件监测汽车数据发生不同幅度的数据波动,不同维度的汽车数据对于不同的产生原因有不同的离群程度,根据各维数据的样本空间中数据点之间的离群程度计算对应维度的数据关联显著性。
优选地,将数据点的所述离群程度的平方作为分子,数据点所属维度的样本空间中所有数据点的方差与预设常数的乘积作为分母得到的比值作为对应数据点的初始变化值,将所述初始变化值进行负相关映射得到对应数据点的变化值,计算每个维度的样本空间中所有数据点的变化值的均值作为对应维度的数据关联显著性。
维度i的数据关联显著性
Figure SMS_19
的计算公式如下:
Figure SMS_20
式中,
Figure SMS_21
为维度i的样本空间中第n个数据点,
Figure SMS_22
为维度i的样本空间中的簇类中心点,
Figure SMS_23
为维度i的样本空间中数据点的数量,
Figure SMS_24
为维度i的样本空间中所有数据点的方差;
Figure SMS_25
为以自然常数e为底数的指数函数,
Figure SMS_26
为距离获取函数。
需要说明的是,当
Figure SMS_30
的值越大,表示维度i的样本空间中第n个数据点的离群程度越大,即维度i的样本空间中第n个数据点
Figure SMS_32
与簇类中心点
Figure SMS_36
之间的距离越远,当
Figure SMS_29
越小,表明维度i的样本空间中各数据点之间分布较为聚集,维度i的样本空间中各数据点与簇类中心点之间的距离越小,则数据点
Figure SMS_33
的初始变化值
Figure SMS_37
越大,说明数据点
Figure SMS_40
反映维度i的特征效果越差;
Figure SMS_27
反映维度i的样本空间中各数据点之间相互关联的程度,当维度i中数据点
Figure SMS_31
的初始变化值越大,表明维度i的样本空间中第n个数据点
Figure SMS_35
与簇类中心点
Figure SMS_39
之间的距离越远,且当前维度i的样本空间中各数据点分布较为分散,则数据点
Figure SMS_28
的变化值
Figure SMS_34
越小,由于维度i的数据关联显著性
Figure SMS_38
为样本空间中所有数据点的变化值的均值,维度i的样本空间中各数据点之间相互关联的程度越小,维度i的数据关联显著性
Figure SMS_41
越小。
维度的数据关联显著性越大,说明当前维度的样本空间中各数据点之间互相关联的程度越高,分别获取维度i和维度r的数据关联显著性,依次得到数据关联显著性
Figure SMS_42
与数据关联显著性
Figure SMS_43
若维度i的数据关联显著性大于维度r的数据关联显著性,即
Figure SMS_44
,当维度i与维度r同时判断相同的离群程度时,则维度i更容易判断出汽车运行故障。
步骤S4:根据每个维度的所述样本空间中数据点之间的距离与对应维度的所述数据关联显著性获取对应维度的离群贡献度。
不同维度代表汽车不同部件的汽车数据,在传统离群因子直接累积进行判断时,会存在多维汽车数据发生变化,但最终形成的离群因子相同,无法体现各个低维特征之间的差异。通过低维度中数据本身的簇类特征计算当前维度的离群贡献度,在多维数据综合判断过程中引入单维数据的簇类影响特征,降低由于多维数据相互变化引起的离群因子正常但实际某单维数据已经发生异常的情况。不同维度间的聚簇特征不同,因此每个维度中各数据点的离群影响也不同,通过单维数据对原始样本点在每个维度的数据点之间的离群影响进行判断,获得单个维度对原始样本离群的贡献度。
在获取不同维度的数据关联显著性后,需要根据每个维度的样本空间中各数据点之间的距离进行下一步分析。当维度的样本空间中各数据点之间的平均距离越大,说明当前维度的样本空间中各数据点之间的联系强度越低,对于数据的变化越不明显,即维度的样本空间中数据点分布较为稀疏,可能导致不能够精确识别当前维度中微小数据变化,因此需要获取每个维度的离群贡献度。
将每个维度的样本空间中任意两个数据点之间的距离作为数据点差值,计算每个维度中全部所述数据点差值的平方的均值得到对应维度的样本均值,将每个维度的数据关联显著性与样本均值的乘积的开方作为对应维度的初始离群贡献度,将所述初始离群贡献度进行归一化得到对应维度的离群贡献度。
图6为本发明一个实施例所提供的离群贡献度示意图,如图6所示,图中列举了维度i的样本空间中第n个数据点
Figure SMS_45
与簇类中心点
Figure SMS_46
之间的距离
Figure SMS_47
、第p个数据点
Figure SMS_48
与第q个数据点
Figure SMS_49
之间的距离
Figure SMS_50
。基于维度i的样本空间中两两数据点之间的距离,以及维度i对应的数据关联显著性获取维度i的离群贡献度
Figure SMS_51
维度i的离群贡献度
Figure SMS_52
的计算公式如下:
Figure SMS_53
式中,
Figure SMS_54
为维度i的样本空间中第k个两数据点中数据点p,
Figure SMS_55
维度i的样本空间中第k个两数据点中数据点q,
Figure SMS_56
为维度i的样本空间中数据点的数量,
Figure SMS_57
为维度i的数据关联显著性;
Figure SMS_58
为归一化函数,
Figure SMS_59
为距离获取函数。
需要说明的是,离群贡献度
Figure SMS_61
是依据维度i的样本空间中各数据点之间的离群程度与维度i的数据关联显著性
Figure SMS_63
获取的,当维度i的样本空间中任意两个数据点之间数据点差值
Figure SMS_66
越大,即维度i的样本空间中任意两个数据点之间的离群程度越大,由于维度i的样本均值为维度i的样本空间中两两数据点之间距离平方的平均数,则
Figure SMS_62
越大;
Figure SMS_65
反映维度i的样本空间中各数据点之间相互关联的程度,当维度i的数据关联显著性
Figure SMS_68
越大,说明维度i的样本空间中各数据点分布较为聚集,若存在数据点分布较为离散,则该数据点对维度i的离群程度贡献越大,进而使得维度i的离群贡献度
Figure SMS_69
越大;
Figure SMS_60
函数将维度i的初始离群贡献度进行归一化,使得归一化后得到的离群贡献度
Figure SMS_64
的取值范围在[0,1]区间,便于后续根据离群贡献度
Figure SMS_67
对可达距离进行加权。
步骤S5:获取每个所述原始样本点在各维度的所述样本空间中对应数据点的原始离群因子和可达距离;依据每个所述原始样本点在各维度的所述样本空间中对应的数据点与所述可达距离内各数据点之间的距离、所述离群贡献度与所述原始离群因子获取每个原始样本点在对应维度中数据点的合成离群因子。
将数据特征从单维度扩充至多维度,避免仅通过获取各原始样本点的单维度的汽车数据进行合成离群因子判断,进而忽略了汽车数据的各个数据维度之间的关联影响。
LOF算法被称为局部异常因子算法,是一种基于距离的异常检测算法,通过比较每个点和该点的邻域点的密度来判断该点是否为异常点,如果该点的密度越低,则该点越可能被认定是异常点。其中,密度是通过点和点之间的距离来计算的,点和点之间的距离越远,则密度越低;距离越近,则密度越高。
根据步骤S2获取的所有原始样本点在每个维度的样本空间,通过LOF算法得到每个原始样本点在各维度的样本空间中对应数据点的原始离群因子和可达距离,基于维度的样本空间中数据点的原始离群因子判断该数据点对应的原始样本点是否为异常的原始样本点。
需要说明的是,本发明实施例通过LOF算法获取原始离群因子和可达距离,具体方法在此不做介绍,为本领域技术人员熟知的技术手段。
当维度的样本空间中各数据点分布较为稀疏时,则不能对各数据点发生微小数据变化进行精确的识别,因此需要增加对应维度的离群贡献度。之后,对每个原始样本点在各维度的样本空间中对应数据点的原始离群因子进行加权,综合采集的汽车数据的多维特征进行判断,经过计算后使离群点的合成离群因子与其他原始样本点的合成离群因子之间评价的差距更大,提升了在原始样本空间中的离群点检测精度。
结合每个原始样本点在各维度的样本空间中对应的数据点与可达距离内各数据点之间的距离、离群贡献度与原始离群因子获取每个原始样本点在对应维度中数据点的合成离群因子。根据合成离群因子公式获得所述合成离群因子,所述合成离群因子的计算公式为:
Figure SMS_70
式中,
Figure SMS_73
为原始样本点t在维度i中对应数据点的合成离群因子,
Figure SMS_75
为原始样本点t在维度i的样本空间中对应数据点的原始离群因子,
Figure SMS_77
为原始样本点t在维度i的样本空间中对应的数据点,
Figure SMS_72
为原始样本点t在维度i的样本空间中对应的数据点的可达距离内第f个数据点,
Figure SMS_74
为原始样本点t在维度i中对应数据点的可达距离内数据点的数量,
Figure SMS_76
为维度i的离群贡献度;
Figure SMS_78
为归一化函数,
Figure SMS_71
为距离获取函数。
需要说明的是,当维度的样本空间中各数据点分布稀疏,为提高判断各数据点发生微小数据变化的准确性,对相应维度的离群贡献度进行加权,加权值为
Figure SMS_79
,当原始样本点t在维度i的样本空间中对应的数据点与该数据点的可达距离内的任意一个数据点之间的距离越大,表明原始样本点t在维度i的样本空间中对应的数据点为离群点的可能性较大,由于加权对应维度的离群贡献度,所以
Figure SMS_80
越大;
Figure SMS_81
函数将加权后的离群贡献度进行归一化,使得归一化后得到的
Figure SMS_82
的取值范围在[0,1]区间,便于将多个维度对原始样本空间之内的离群影响特征进行判断;为提升在原始样本空间中的离群点检测精度,将原始样本点t在维度i的样本空间中对应数据点的原始离群因子进行加权,加权值为
Figure SMS_83
,当该加权值越大,表明原始样本点t为异常的原始样本点的可能越大,则原始样本点t在维度i中对应数据点的合成离群因子越大。
至此,每个原始样本点在各维度的样本空间中对应的数据点均有合成离群因子。
步骤S6:依据每个所述原始样本点的各维度中对应数据点的合成离群因子获取对应原始样本点的累加离群因子;由模拟器根据所述累加离群因子对汽车故障进行识别。
原始样本点t在每个维度中对应数据点的合成离群因子对原始样本点t包含的多维的汽车数据信息进行了准确描述,使得原始样本点t的累加离群因子
Figure SMS_84
避免了多维度汽车数据发生变化而获得的合成离群因子未发生变化的缺陷。累加离群因子的获取方法为:将每个原始样本点在各维度中对应数据点的合成离群因子相加得到对应原始样本点的累加离群因子。
对于一个时刻采集的汽车中多种部件传感器的数据,判断当前t时刻汽车是否存在异常,汽车各部件是一个整体,当某个部件的传感器监测数据异常时,则可能导致其他部件同样产生异常,最终令汽车整体在对应t时刻产生异常。
行车电脑OBD根据每个原始样本点的累加离群因子判断出异常的原始样本点,即某时刻汽车运行出现故障问题,行车电脑OBD通过异常的原始样本点的累加离群因子对汽车数据进行控制,保证乘员安全。
综上所述,本发明实施例中,采集不同时刻的汽车数据得到多个原始样本点,获取原始样本点在每个维度对应的样本空间中的数据点,依据各维度中数据点的离群程度获取对应维度的数据关联显著性,根据各维度中数据点间的距离与数据关联显著性获取对应维度的离群贡献度,根据每个维度的样本空间中数据点之间的距离与对应维度的数据关联显著性获取对应维度的离群贡献度,依据每个原始样本点在各维度中对应的数据点与可达距离内各数据点间的距离、离群贡献度与原始离群因子获取合成离群因子,进而获取原始样本点的累加离群因子,累加离群因子包含多维度的汽车数据,能够综合表征汽车的异常数据信息,基于累加离群因子确定汽车故障情况,提高了对汽车运行故障识别的准确性。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.基于模拟器的汽车运行故障识别方法,其特征在于,该方法包括:
采集至少两个时刻的汽车数据,将每个时刻下的所述汽车数据作为原始样本点,所述原始样本点包含不同维度的汽车数据;
获取所述原始样本点在每个维度对应的样本空间中的数据点;
依据每个维度的所述样本空间中各数据点的离群程度获取对应维度的数据关联显著性;
根据每个维度的所述样本空间中数据点之间的距离与对应维度的所述数据关联显著性获取对应维度的离群贡献度;
获取每个所述原始样本点在各维度的所述样本空间中对应数据点的原始离群因子和可达距离;依据每个所述原始样本点在各维度的所述样本空间中对应的数据点与所述可达距离内各数据点之间的距离、所述离群贡献度与所述原始离群因子获取每个原始样本点在对应维度中数据点的合成离群因子;
依据每个所述原始样本点的各维度中对应数据点的合成离群因子获取对应原始样本点的累加离群因子;由模拟器根据所述累加离群因子对汽车故障进行识别。
2.根据权利要求1所述的基于模拟器的汽车运行故障识别方法,其特征在于,所述离群程度的获取方法,包括:
通过聚类算法对每个维度对应的所述样本空间中所有数据点进行聚类,每个维度均得到一个聚类簇,将每个聚类簇的聚类中心点作为聚类簇对应维度的簇类中心点;以每个维度的所述样本空间中各数据点与对应所述簇类中心点的距离作为所述离群程度。
3.根据权利要求1或2所述的基于模拟器的汽车运行故障识别方法,其特征在于,所述数据关联显著性的获取方法,包括:
将数据点的所述离群程度的平方作为分子,数据点所属维度的样本空间中所有数据点的方差与预设常数的乘积作为分母得到的比值作为对应数据点的初始变化值,将所述初始变化值进行负相关映射得到对应数据点的变化值,计算每个维度的样本空间中所有数据点的变化值的均值作为对应维度的数据关联显著性。
4.根据权利要求1所述的基于模拟器的汽车运行故障识别方法,其特征在于,所述离群贡献度的获取方法,包括:
将每个维度的样本空间中任意两个数据点之间的距离作为数据点差值,计算每个维度中全部所述数据点差值的平方的均值得到对应维度的样本均值,将每个维度的数据关联显著性与样本均值的乘积的开方作为对应维度的初始离群贡献度,将所述初始离群贡献度进行归一化得到对应维度的离群贡献度。
5.根据权利要求1所述的基于模拟器的汽车运行故障识别方法,其特征在于,所述合成离群因子的获取方法,包括:
根据合成离群因子公式获得所述合成离群因子,所述合成离群因子的计算公式为:
Figure QLYQS_1
式中,
Figure QLYQS_3
为原始样本点t在维度i中对应数据点的合成离群因子,
Figure QLYQS_6
为原始样本点t在维度i的样本空间中对应数据点的原始离群因子,
Figure QLYQS_8
为原始样本点t在维度i的样本空间中对应的数据点,
Figure QLYQS_4
为原始样本点t在维度i的样本空间中对应的数据点的可达距离内第f个数据点,
Figure QLYQS_5
为原始样本点t在维度i中对应数据点的可达距离内数据点的数量,
Figure QLYQS_7
为维度i的离群贡献度;
Figure QLYQS_9
为归一化函数,
Figure QLYQS_2
为距离获取函数。
6.根据权利要求1所述的基于模拟器的汽车运行故障识别方法,其特征在于,所述累加离群因子的获取方法,包括:
将每个原始样本点在各维度中对应数据点的合成离群因子相加得到对应原始样本点的累加离群因子。
7.根据权利要求1所述的基于模拟器的汽车运行故障识别方法,其特征在于,所述获取每个所述原始样本点在各维度的所述样本空间中对应数据点的原始离群因子和可达距离的方法,包括:
通过LOF算法得到每个原始样本点在各维度的样本空间中对应数据点的原始离群因子和可达距离。
CN202310063443.4A 2023-02-06 2023-02-06 基于模拟器的汽车运行故障识别方法 Active CN115809435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310063443.4A CN115809435B (zh) 2023-02-06 2023-02-06 基于模拟器的汽车运行故障识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310063443.4A CN115809435B (zh) 2023-02-06 2023-02-06 基于模拟器的汽车运行故障识别方法

Publications (2)

Publication Number Publication Date
CN115809435A true CN115809435A (zh) 2023-03-17
CN115809435B CN115809435B (zh) 2023-05-12

Family

ID=85487777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310063443.4A Active CN115809435B (zh) 2023-02-06 2023-02-06 基于模拟器的汽车运行故障识别方法

Country Status (1)

Country Link
CN (1) CN115809435B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116503025A (zh) * 2023-06-25 2023-07-28 深圳高新区信息网有限公司 一种基于工作流引擎的业务工单流程处理方法
CN116879662A (zh) * 2023-09-06 2023-10-13 山东华尚电气有限公司 基于数据分析的变压器故障检测方法
CN117649059A (zh) * 2024-01-30 2024-03-05 河北省农林科学院农业信息与经济研究所 一种用于数字化育种流程的成果评价优化方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004349846A (ja) * 2003-05-20 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 外れ値検出方法
US20050209767A1 (en) * 2004-03-16 2005-09-22 Honeywell International Inc. Method for fault diagnosis of a turbine engine
CN102867421A (zh) * 2012-09-24 2013-01-09 东南大学 一种识别有效停车泊位占有率中离群数据的方法
JP2014204155A (ja) * 2013-04-01 2014-10-27 株式会社Nttドコモ 外れ値原因判定装置及び外れ値原因判定方法
JP2015026252A (ja) * 2013-07-26 2015-02-05 株式会社豊田中央研究所 異常検知装置及びプログラム
CN107315647A (zh) * 2017-06-26 2017-11-03 广州视源电子科技股份有限公司 离群点检测方法和系统
CN110659686A (zh) * 2019-09-23 2020-01-07 西南交通大学 一种用于混合属性数据的模糊粗糙粒离群点检测方法
CN110865260A (zh) * 2019-11-29 2020-03-06 南京信息工程大学 一种基于离群检测对mov实际状态监测评估的方法
CN111539374A (zh) * 2020-05-07 2020-08-14 上海工程技术大学 基于多维数据空间的轨道列车轴承故障诊断系统及方法
CN113706964A (zh) * 2021-07-30 2021-11-26 山东星科智能科技股份有限公司 一种智能驾驶教学实训系统及自动驾驶车辆控制方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004349846A (ja) * 2003-05-20 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 外れ値検出方法
US20050209767A1 (en) * 2004-03-16 2005-09-22 Honeywell International Inc. Method for fault diagnosis of a turbine engine
CN102867421A (zh) * 2012-09-24 2013-01-09 东南大学 一种识别有效停车泊位占有率中离群数据的方法
JP2014204155A (ja) * 2013-04-01 2014-10-27 株式会社Nttドコモ 外れ値原因判定装置及び外れ値原因判定方法
JP2015026252A (ja) * 2013-07-26 2015-02-05 株式会社豊田中央研究所 異常検知装置及びプログラム
CN107315647A (zh) * 2017-06-26 2017-11-03 广州视源电子科技股份有限公司 离群点检测方法和系统
CN110659686A (zh) * 2019-09-23 2020-01-07 西南交通大学 一种用于混合属性数据的模糊粗糙粒离群点检测方法
CN110865260A (zh) * 2019-11-29 2020-03-06 南京信息工程大学 一种基于离群检测对mov实际状态监测评估的方法
CN111539374A (zh) * 2020-05-07 2020-08-14 上海工程技术大学 基于多维数据空间的轨道列车轴承故障诊断系统及方法
CN113706964A (zh) * 2021-07-30 2021-11-26 山东星科智能科技股份有限公司 一种智能驾驶教学实训系统及自动驾驶车辆控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YOUCEF DJENOURI ETAL.: "Outlier Detection in Urban Traffic Data" *
曾静等: "基于 LNS 和主成分分析的局部离群因子故障检测" *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116503025A (zh) * 2023-06-25 2023-07-28 深圳高新区信息网有限公司 一种基于工作流引擎的业务工单流程处理方法
CN116503025B (zh) * 2023-06-25 2023-09-19 深圳高新区信息网有限公司 一种基于工作流引擎的业务工单流程处理方法
CN116879662A (zh) * 2023-09-06 2023-10-13 山东华尚电气有限公司 基于数据分析的变压器故障检测方法
CN116879662B (zh) * 2023-09-06 2023-12-08 山东华尚电气有限公司 基于数据分析的变压器故障检测方法
CN117649059A (zh) * 2024-01-30 2024-03-05 河北省农林科学院农业信息与经济研究所 一种用于数字化育种流程的成果评价优化方法
CN117649059B (zh) * 2024-01-30 2024-05-17 河北省农林科学院农业信息与经济研究所 一种用于数字化育种流程的成果评价优化方法

Also Published As

Publication number Publication date
CN115809435B (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
CN115809435A (zh) 基于模拟器的汽车运行故障识别方法
US20210255059A1 (en) Fault diagnosis method of reciprocating machinery based on keyphasor-free complete-cycle signal
US20060210141A1 (en) Inspection method and inspection apparatus
CN111539374B (zh) 基于多维数据空间的轨道列车轴承故障诊断方法
CN110633729A (zh) 一种面向智能网联车辆群组测试的驾驶风险分级聚类方法
CN111062093B (zh) 一种基于图像处理和机器学习的汽车轮胎寿命预测方法
CN113581188A (zh) 一种基于车联网数据的商用车驾驶员驾驶风格识别方法
CN113188807B (zh) 一种abs结果自动判定算法
CN108769104B (zh) 一种基于车载诊断系统数据的路况分析预警方法
CN110084534A (zh) 一种基于驾驶行为画像的驾驶风险因子量化方法
CN118013323B (zh) 一种大口径电动半球阀的驱动电机状态分析方法及系统
CN117171604B (zh) 基于传感器的保温板生产线异常监测系统
CN112948965A (zh) 一种基于机器学习和统计验证的汽车行驶工况的构建方法
CN114372489A (zh) 一种柴油机工况识别与异常诊断方法
CN118312924B (zh) 基于多维传感器的空气质量大数据评估系统
CN110562261A (zh) 一种基于马尔可夫模型检测驾驶员风险等级的方法
CN113657432A (zh) 一种基于车联网数据的商用车驾驶行为风险等级辨识方法
CN113052196A (zh) 一种基于贪心算法的汽车工况构建方法
CN115186594A (zh) 一种人-车-路耦合影响下的节能速度优化方法
CN114595753A (zh) 面向数据稀缺场景的综合供能服务站油气回收系统故障检测方法
CN114611604A (zh) 一种基于电驱总成载荷特征融合与聚类的用户筛选方法
CN113807431A (zh) 一种基于多源信息融合的智能主轴状态评估方法和系统
CN111348029B (zh) 一种考虑工况的混合动力汽车标定参数最优值确定方法
CN116859352A (zh) 一种路侧毫米波雷达设备运行状态评估方法及系统
CN117150337A (zh) 基于分诊制的化工过程故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant