CN105955233B - 一种基于数据挖掘的车辆故障诊断方法及系统 - Google Patents
一种基于数据挖掘的车辆故障诊断方法及系统 Download PDFInfo
- Publication number
- CN105955233B CN105955233B CN201610279367.0A CN201610279367A CN105955233B CN 105955233 B CN105955233 B CN 105955233B CN 201610279367 A CN201610279367 A CN 201610279367A CN 105955233 B CN105955233 B CN 105955233B
- Authority
- CN
- China
- Prior art keywords
- data
- fault diagnosis
- vehicle
- vehicle trouble
- diagnosis model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0243—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Abstract
本发明涉及一种基于数据挖掘的车辆故障诊断方法及系统,属于车辆故障诊断技术领域。本发明从获取的大量车辆故障数据中,挖掘出各个数据参数值之间及参数属性值与故障类之间的隐藏关系,能够及时并有效地确定车辆发生故障的零部件,确定故障类型及故障原因,防止故障恶化而产生重大事故。同时,本发明采用组合分类的方法对车辆故障数据进行诊断,通过构建k个故障诊断模型对车辆故障进行诊断,与使用单个故障诊断模型相比,显著提高了故障诊断准确率。
Description
技术领域
本发明涉及一种基于数据挖掘的车辆故障诊断方法及系统,属于车辆故障诊断技术领域。
背景技术
随着新能源客车上增加的电子设备越来越多,新能源客车出现的故障类型也随之增多。新能源客车的故障主要有发电机故障、动力电池故障、转向故障、空压机故障等。另外,发电机故障又包括电机过压、电机欠压、电机过温等,动力电池故障又包括电池过压故障、电池过温故障、绝缘电阻过低等故障。可见,新能源客车故障种类繁多,又由于其复杂的非线性性,故障发生时,难以判断发生故障的部位及确定故障的原因。然而现有的监控系统,不论是集中式还是基于云计算框架的,都仅仅通过人工定义的统计条件去分析故障产生的规律和原因,为新能源客车系统的改进和故障的预测只能提供有限的信息。一些隐藏在海量数据之中有价值的信息不能被挖掘出来,这些信息可能是有着意想不到的制约关系或规律,会对新能源客车系统的改进提供非常大的帮助。所以,提出一种基于数据挖掘的新能源汽车故障诊断方法尤为重要。
发明内容
本发明的目的是提供一种基于数据挖掘的车辆故障诊断方法及系统,以提高对车辆故障诊断的准确性。
本发明为解决上述技术问题而提供一种基于数据挖掘的车辆故障诊断方法,该诊断方法包括以下步骤:
步骤1.采集车辆故障数据,包括车辆发生故障时各零部件的相关参数数据,得到具有故障类标记的车辆故障数据集D,D中包含n个车辆故障数据样本{s1,s2,s3,…sn};
步骤2.构建故障诊断模型:
2.1.初始化每个数据样本的权重为1/n;
2.2.根据数据样本的权重从D中有放回抽样,得到包含n个车辆故障数据样本的车辆故障数据集Di;
2.3.在每个车辆故障数据集Di上构建一个车辆故障诊断模型Mi(i=1,2,…,k),并计算Mi的错误率error(Mi)
其中,err(sj)是数据样本sj的误分类误差,如果sj被误分类,则err(sj)为1,否则它为0,wi为数据样本sj在第i次迭代的权重;
2.4.当error(Mi)大于设定值时,则转到步骤2.2重新构建车辆故障诊断模型;
2.5.当error(Mi)小于设定值,则对Di中每个被正确分类的车辆故障数据样本的权重乘以error(Mi)/(1-error(Mi));
2.6.将步骤2.2-2.5重复k次,以得到k个车辆故障诊断模型Mi(i=1,2,…,k);
步骤3.利用所构建的k个故障诊断模型对实时采集到的车辆故障数据采用组合投票的方法进行故障诊断。
所述步骤2.3采用决策树算法在每个车辆故障数据集Di上构建一个车辆故障诊断模型Mi(i=1,2,…,k),过程如下:
A.创建节点S;
B.如果Di(i=1,2,…,k)中所有数据样本都属于同一车辆故障类A,则返回S作为叶节点,并标记为故障类型A;
C.否则,选择所有参数中具有最大增益率的参数t,将参数t做为节点S的测试参数;
D.对测试参数t的每个区间划分创建一个分支,并据此划分样本;
E.在每一个划分样本上,重复步骤A-D,递归地构建车辆故障诊断模型,直至给定节点的所有数据样本属于同一故障类型,或者没有剩余车辆零部件参数可以用来进一步划分样本,或者给定的分支没有数据样本。
所述步骤C中最大增益率参数t指的是对故障数据样本{s1,s2,s3,…sn}具有增大增益率的参数,参数t的增益率为:
GainRate(t)=Gain(t)/SpliInfot(Di)
其中GainRate(t)为参数t的增益率,Gain(t)为参数t的信息增益,SpliInfot(Di)为参数t的分裂信息。
对于构建好的车辆故障诊断模型还需采用后剪枝方法进行处理,以消除数据中的噪声和孤立点带来的训练异常。
所述步骤3中组合投票故障诊断包括以下步骤:
a.将每个车辆故障诊断模型Mi的权重初始化为0;
b.计算每个车辆故障诊断模型Mi的权重Wi,
Wi=log(error(Mi)/(1-error(Mi)));
c.如果车辆故障诊断模型Mi对车辆故障数据样本si诊断为故障类型Ci,车辆故障数据样本si属于故障类型Ci的权重就为Wi;
d.k个车辆故障诊断模型Mi都对车辆故障数据样本si进行故障诊断,即组合投票,最后返回具有最大权重和的故障类。
步骤1还包括对采集到的车辆故障数据进行预处理的过程,包括使用数据清理方法消除故障数据噪声和处理空缺值;使用数据归约方法对车辆故障数据进行维归约,以减少随机变量和属性的个数。
本发明还提供了一种基于数据挖掘的车辆故障诊断系统,该故障诊断系统包括数据采集处理模块、故障诊断模型构建模块和评估预测模块,
所述数据采集处理模块用于采集车辆故障数据,包括车辆发生故障时各零部件的相关参数数据,以得到具有故障类标记的车辆故障数据集D,D中包含n个车辆故障数据样本{s1,s2,s3,…sn};
所述故障诊断模型构建模块用于构建故障诊断模型,其构建过程如下:
A).初始化每个数据样本的权重为1/n;
B).根据数据样本的权重从D中有放回抽样,得到包含n个车辆故障数据样本的车辆故障数据集Di;
C).在每个车辆故障数据集Di上构建一个车辆故障诊断模型Mi(i=1,2,…,k),并计算Mi的错误率error(Mi)
其中,err(sj)是数据样本sj的误分类误差:如果sj被误分类,则err(sj)为1;否则它为0;wi为数据样本sj在第i次迭代的权重;
D).当error(Mi)大于设定值时,则转到B)重新构建车辆故障诊断模型;
E).当error(Mi)小于设定值,则对Di中每个被正确分类的车辆故障数据样本的权重乘以error(Mi)/(1-error(Mi));
F).将步骤A)-E)重复k次,以得到k个车辆故障诊断模型Mi(i=1,2,…,k);
所述的评估预测模块用于根据所构建的k个故障诊断模型对实时采集到的车辆故障数据采用组合投票的方法进行故障诊断。
所述的故障诊断模型构建模块采用决策树算法在每个车辆故障数据集Di上构建一个车辆故障诊断模型Mi(i=1,2,…,k),过程如下:
A.创建节点S;
B.如果Di(i=1,2,…,k)中所有数据样本都属于同一车辆故障类A,则返回S作为叶节点,并标记为故障类型A;
C.否则,选择所有参数中具有最大增益率的参数t,参数t成为节点S的“测试”参数;
D.对测试参数t的每个区间划分创建一个分支,并据此划分样本;
E.在每一个划分样本上,重复步骤A-D,递归地构建车辆故障诊断模型,直至给定节点的所有数据样本属于同一故障类型,或者没有剩余车辆零部件参数可以用来进一步划分样本,或者给定的分支没有数据样本。
所述评估检测模块采用组合投票进行故障诊断的过程如下:
a.将每个车辆故障诊断模型Mi的权重初始化为0;
b.计算每个每个车辆故障诊断模型Mi的权重Wi,
Wi=log(error(Mi)/(1-error(Mi)));
c.如果车辆故障诊断模型Mi对车辆故障数据样本si诊断为故障类型Ci,那么车辆故障数据样本si属于故障类型Ci的权重就为Wi;
d.k个车辆故障诊断模型Mi都对车辆故障数据样本si进行故障诊断,即组合投票,最后返回具有最大权重和的故障类。
所述采集处理模块还用于对采集到的车辆故障数据进行预处理,包括使用数据清理方法消除故障数据噪声和处理空缺值;使用数据归约方法对车辆故障数据进行维归约,以减少随机变量和属性的个数。
本发明的有益效果是:本发明从获取的大量车辆故障数据中,挖掘出各个数据参数值之间及参数属性值与故障类之间的隐藏关系,能够及时并有效地确定车辆发生故障的零部件,确定故障类型及故障原因,防止故障恶化而产生重大事故。同时,本发明采用组合分类的方法对车辆故障数据进行诊断,通过构建k个故障诊断模型对车辆故障进行诊断,与使用单个故障诊断模型相比,显著提高了故障诊断准确率。
附图说明
图1是本发明车辆故障诊断的流程图;
图2是本发明所采用的组合分类方法示意图;
图3-a是车辆故障数据样本为离散值的故障诊断数示意图;
图3-b是车辆故障数据样本为连续值的故障诊断树示意图;
图4是车辆信息采集终端结构示意图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步的说明。
本发明的一种基于数据挖掘的车辆故障诊断方法的实施例
针对现有的车辆故障诊断系统不能较好地完成汽车上各个零部件故障诊断的任务,本发明采用数据挖掘的方法,对汽车的实时监测数据进行数据分析,判断汽车是否处于安全运行状态,对发生故障的汽车定位故障发生的部位,给出故障原因并报警,防止故障恶化。该方法的流程如图1所示,该方法的具体实施过程如下:
步骤1.采集新能源车辆故障数据,对采集到的新能源车辆故障数据进行数据预处理,得到具有故障类标记的车辆故障数据集D,D中包含n个车辆故障数据样本{s1,s2,s3,…sn}。
车辆故障数据包括车辆发生故障时各零部件的相关参数数据。如当发生动力电池过温故障时,动力电池、发动机、发电机、转向器等所有零部件的相关参数的数据集合。本实施例中的采集到的车辆故障数据来源于车辆信息采集终端,如图4所示,本实施例的车辆信息采集终端包括远程升级模块、信息处理模块以及分别与该信息处理模块相连的CAN总线通信模块、供电模块、信息显示模块、数据存储模块、USB模块;信息处理模块还连接有无线通信模块和模拟信号处理模块和GPS模块;CAN总线通讯模块通过CAN总线分别用于与发动机ECU、主电机控制器、ISG控制器、超级电容管理系统、电池管理系统、DC-DC管理系统、转向控制器、整车控制器、变速箱控制器、空调管理系统、ABS管理模块和仪表模块相连。该终端通过CAN总线与其他设备相连,遵循SAEJ1939CAN总线协议,实时采集CAN总线上传输的数据。SAEJ1939标准是美国汽车工程师协会发布的以CAN总线为核心的车辆网络串行通讯和控制协议,SAEJ1939协议以CAN2.0协议为基础,通讯速率最高可达250Kb/s。它对汽车内部ECU的地址配置。命名、通讯方式及报文发送优先级都给出明确规定,并且详细说明了汽车内部各个供体的ECU通讯。
为了使所购建的故障诊断模型更加准确,本发明还对采集到的车辆故障数据进行预处理,包括使用数据清理方法消除数据噪声和处理空缺值;使用数据归约方法中的小波变换、主成分分析PCA技术对原始数据进行维归约,以减少随机变量和属性的个数,从而达到以较少的变量个数获得较多的信息量的目的。
步骤2.对经过数据预处理的车辆故障数据采用数据挖掘技术中的组合分类方法构建故障诊断模型。
2.1.初始化每个数据样本的权重为1/n;
2.2.根据数据样本的权重从D中有放回抽样,得到包含n个车辆故障数据样本的车辆故障数据集Di;
2.3.在每个车辆故障数据集Di上构建一个车辆故障诊断模型Mi(i=1,2,…,k),并计算Mi的错误率error(Mi);
2.4.如果error(Mi)>0.5(注:0.5为最佳值,非必选),转步骤2重新构建车辆故障诊断模型;
2.5.否则,对Di中每个被正确分类的车辆故障数据样本的权重乘以error(Mi)/(1-error(Mi));
2.6.重复2.2、2.3、2.4、2.5,k次,得到k个车辆故障诊断模型Mi(i=1,2,…,k)。
其中,err(sj)是数据样本sj的误分类误差:如果sj被误分类,则err(sj)为1;否则它为0;wi为数据样本sj在第i次迭代的权重。
步骤2.3中车辆故障诊断模型的构建可采用决策树算法、贝叶斯算法来实现,本实施例采用决策时算法来构建,具体的构建过程如下:
1、创建节点S;
2、如果Di(i=1,2,…,k)中所有数据样本都属于同一车辆故障类A,则返回S作为叶节点,并标记为故障类型A;
3、否则,选择所有参数中具有最大增益率的参数t,参数t成为节点S的测试参数;
4、对测试参数t的每个区间划分创建一个分支,并据此划分样本;
5、在每一个划分样本上,重复1,2,3,4,递归地构建车辆故障诊断模型;
6、递归构建车辆故障诊断模型仅当下列条件之一成立时停止:a给定节点的所有数据样本属于同一故障类型;b没有剩余车辆零部件参数可以用来进一步划分样本;c给定的分支没有数据样本。
7、对于创建好的车辆故障诊断模型,采用后剪枝方法以消除数据中的噪声和孤立点带来的训练异常。
其中决策树算法中选择所有参数中具有最大增益率的参数t方法如下:
设数据样本集合共有n个,分别为{s1,s2,s3,…sn},故障类型共m种,分别为C1,C2,C3,…Cm,属于不同故障类型的样本数据分别为q1,q2,q3,…qm,且满足∑qi=n。
其中,自助样本Di是训练元组和它相应类标号的集合,即(s1,C1),(s2,C2),(s3,C3)……(sm,Cm)。
假定,对于数据样本集合中的任一参数R的信息增益用Gain(R)表示;增益率用GainRate(R)表示;自助样本Di上,参数R的分裂信息用SpliInfoR(Di)表示,则参数R的增益率:
GainRate(R)=Gain(R)/SpliInfoR(Di);
其中,Gain(R)=Info(Di)-InfoR(Di);
Info(Di)=-∑pilog2(pi)=-∑(qi/n)log2(qi/n);
对数据样本集合{s1,s2,s3,…sn}的参数R,当R是离散值:设R包含v个不同值,R将Di划分成v个子集{Di1,Di2,Di3,…Div}。
分别统计属于{Di1,Di2,Di3,…Div}样本中各故障类型的总数,分别记为r11,r12,r13,…,r1m;r21,r22,r23,…,r2m;r31,r32,r33,…,r3m;……rv1,rv2,rv3,…,rvm;
分别统计属于{Di1,Di2,Di3,…Div}样本中对应的数据样本的总数,分别记为x1,x2,x3,…,xv;
对R的划分计算子集的期望信息:
InfoR(Di)=∑((xi/n)*(-∑(r1j/xi)*log2(r1j/xi)));
对R的划分计算子集的分裂信息:
SpliInfoR(Di)=-∑(xi/n)*log2(xi/n);
遍历所有参数,获得对集合{s1,s2,s3,…sn}具有最大增益率的参数t。
对数据样本集合{s1,s2,s3,…sn}的参数R,当R是连续值:构造集合R:{r1,r2,r3,…,rl},其中l≦n;
用r*=(ri+ri+1)/2对集合作一个划分:R1={r1,r2,r3,…ri},R2={ri+1,ri+2,ri+3,…,rl},使R1中的元素均小于r*,R2中的元素大于等于r*;
分别统计属于R1、R2的样本中各故障类型的总数,分别记为r11,r12,r13,…,r1m;r21,r22,r23,…,r2m;
分别统计属于R1、R2的样本中对应的数据样本的总数,分别记为x11,x12,x13,…,x1i;x21,x22,x23,…,x2l;
对r*的划分计算子集的期望信息:
其中r01=∑r1i,r02=∑r2i,x01=∑x1i,x02=∑x2i;
对r*的划分计算子集的分裂信息:
其中x01=∑x1i,x02=∑x2i;
遍历r*=(ri+ri+1)/2,i=1,2,3,…,l-1.记使划分子集GainRate(r)最大的r*为r*0,此时,对用参数R的r*0对集合{s1,s2,s3,…ss}进行划分,具有最大的增益率;
遍历所有参数,获得对集合{s1,s2,s3,…ss}具有最大增益率的参数t和划分点t*0。
为了更清晰地说明车辆故障诊断模型的构建过程,现结合附图3-a和图3-b做进一步解释:
假设车辆故障数据样本中D包含参数A、B、C、E……;
如果参数的属性值是离散值,请参阅附图3-a,首先计算出各个参数的增益率,选择具有最大增益率的参数作为决策树的根结点。假定参数A的增益率最大,那么A作为决策树的根结点开始划分,设A有v个属性值{a1,a2,a3,…av},对A的每个已知值aj创建一个分支,在每一个分支上,由aj标记的所有的车辆故障数据样本Dj都具有相同的A值,所以在下一步划分中不需要考虑参数A,只需在Dj上继续计算除参数A外其他参数的增益率,再从中选择具有最大增益率的参数B作为下一个划分结点,依次按照同样的方法继续划分,直至Dj中所有车辆故障数据样本都属于同一故障类时停止。
如果参数的属性值是连续值,如图3-b所示,首先遍历所有参数,获得对车辆故障数据样本集合D具有最大增益率的参数t和划分点t*。假定所有参数中,参数A在划分点a*的增益率最大,那么A为决策树的根结点,A≤a*和A﹥a*为参数A的两个分支,两个分支分别对应的车辆故障数据样本为D1和D2。再在D1和D2中按照同样的方法依次划分,直至D1和D2中所有车辆故障数据样本都属于同一故障类时停止。
步骤3:评估预测
对实时采集到的新能源汽车车辆故障数据,重复步骤1,对处理后的数据利用步骤2创建的k个车辆故障模型Mi,使用组合投票的方法进行故障诊断:
1、初始化每个车辆故障诊断模型Mi的权重为0;
2、计算每个车辆故障诊断模型Mi的权重为Wi=log(error(Mi)/(1-error(Mi)));
3、如果车辆故障诊断模型Mi对车辆故障数据样本si诊断为故障类型Ci,那么车辆故障数据样本si属于故障类型Ci的权重就为Wi;
4、k个车辆故障诊断模型Mi都对车辆故障数据样本si进行故障诊断,即组合投票,最后返回具有最大权重和的故障类。
最后通过人机交互界面将采集到的某条车辆故障数据及其对应的故障类显示出现,技术人员根据这些数据可以判定哪台车哪个零部件已经发生故障或者即将发生故障,对于已经发生故障的车辆可以帮助售后人员定位故障位置;对于即将发生故障的车辆可以及时通知售后人员尽早处理,防止故障恶化而产生重大事故。从而保证了车辆的安全运营。例如,当采集到一条车辆故障数据,经过处理中心处理后,在人机交互界面上显示其被预测为电池过温故障,这时现场售后人员就可以及时检查下电池接线是否有问题,冷却系统是否有问题,避免了因问题未被及时发现而电池又持续过温工作导致电池着火、甚至车辆着火等安全事故的发生。
本发明的一种基于数据挖掘的车辆故障诊断系统的实施例
本实施例中故障诊断系统包括数据采集处理模块、故障诊断模型构建模块和评估预测模块,数据采集处理模块用于采集车辆故障数据,包括车辆发生故障时各零部件的相关参数数据,以得到具有故障类标记的车辆故障数据集D,D中包含n个车辆故障数据样本{s1,s2,s3,…sn};故障诊断模型构建模块用于构建故障诊断模型;评估预测模块用于根据所构建的k个故障诊断模型对实时采集到的车辆故障数据采用组合投票的方法进行故障诊断。其中故障诊断模型构建模块的构建过程如下:
A).初始化每个数据样本的权重为1/n;
B).根据数据样本的权重从D中有放回抽样,得到包含n个车辆故障数据样本的车辆故障数据集Di;
C).在每个车辆故障数据集Di上构建一个车辆故障诊断模型Mi(i=1,2,…,k),并计算Mi的错误率error(Mi)
其中,err(sj)是数据样本sj的误分类误差:如果sj被误分类,则err(sj)为1;否则它为0;wi为数据样本sj在第i次迭代的权重;
D).当error(Mi)大于设定值时,则转到B)重新构建车辆故障诊断模型;
E).当error(Mi)小于设定值,则对Di中每个被正确分类的车辆故障数据样本的权重乘以error(Mi)/(1-error(Mi));
F).将步骤A)-E)重复k次,以得到k个车辆故障诊断模型Mi(i=1,2,…,k);
上述各模块的具体实施方式已在方法的实施例中进行了详细说明,这里不再赘述。
Claims (10)
1.一种基于数据挖掘的车辆故障诊断方法,其特征在于,该诊断方法包括以下步骤:
步骤1.采集车辆故障数据,包括车辆发生故障时各零部件的相关参数数据,得到具有故障类标记的车辆故障数据集D,D中包含n个车辆故障数据样本{s1,s2,s3,…sn};
步骤2.构建故障诊断模型:
2.1.初始化每个车辆故障数据样本的权重为1/n;
2.2.根据数据样本的权重从D中有放回抽样,得到包含n个车辆故障数据样本的车辆故障数据集Di;
2.3.在每个车辆故障数据集Di上构建一个车辆故障诊断模型Mi(i=1,2,…,k),并计算Mi的错误率error(Mi)
其中,err(sj)是数据样本sj的误分类误差,如果sj被误分类,则err(sj)为1,否则它为0,wi为数据样本sj在第i次迭代的权重;
2.4.当error(Mi)大于设定值时,则转到步骤2.2重新构建车辆故障诊断模型;
2.5.当error(Mi)小于设定值,则对Di中每个被正确分类的车辆故障数据样本的权重乘以error(Mi)/(1-error(Mi));
2.6.将步骤2.2-2.5重复k次,以得到k个车辆故障诊断模型Mi(i=1,2,…,k);
步骤3.利用所构建的k个故障诊断模型对实时采集到的车辆故障数据采用组合投票的方法进行故障诊断。
2.根据权利要求1所述的基于数据挖掘的车辆故障诊断方法,其特征在于,所述步骤2.3采用决策树算法在每个车辆故障数据集Di上构建一个车辆故障诊断模型Mi(i=1,2,…,k),过程如下:
A.创建节点S;
B.如果Di(i=1,2,…,k)中所有数据样本都属于同一车辆故障类A,则返回S作为叶节点,并标记为故障类型A;
C.否则,选择所有参数中具有最大增益率的参数t,将参数t做为节点S的测试参数;
D.对测试参数t的每个区间划分创建一个分支,并据此划分样本;
E.在每一个划分样本上,重复步骤A-D,递归地构建车辆故障诊断模型,直至给定节点的所有数据样本属于同一故障类型,或者没有剩余车辆零部件参数可以用来进一步划分样本,或者给定的分支没有数据样本。
3.根据权利要求2所述的基于数据挖掘的车辆故障诊断方法,其特征在于,所述步骤C中最大增益率参数t指的是对故障数据样本{s1,s2,s3,…sn}具有增大增益率的参数,参数t的增益率为:
GainRate(t)=Gain(t)/SpliInfot(Di)
其中GainRate(t)为参数t的增益率,Gain(t)为参数t的信息增益,SpliInfot(Di)为参数t的分裂信息。
4.根据权利要求3所述的基于数据挖掘的车辆故障诊断方法,其特征在于,对于构建好的车辆故障诊断模型还需采用后剪枝方法进行处理,以消除数据中的噪声和孤立点带来的训练异常。
5.根据权利要求1所述的基于数据挖掘的车辆故障诊断方法,其特征在于,所述步骤3中组合投票故障诊断包括以下步骤:
a.将每个车辆故障诊断模型Mi的权重初始化为0;
b.计算每个车辆故障诊断模型Mi的权重Wi,
Wi=log(error(Mi)/(1-error(Mi)));
c.如果车辆故障诊断模型Mi对车辆故障数据样本si诊断为故障类型Ci,车辆故障数据样本si属于故障类型Ci的权重就为Wi;
d.k个车辆故障诊断模型Mi都对车辆故障数据样本si进行故障诊断,即组合投票,最后返回具有最大权重和的故障类。
6.根据权利要求1所述的基于数据挖掘的车辆故障诊断方法,其特征在于,步骤1还包括对采集到的车辆故障数据进行预处理的过程,包括使用数据清理方法消除故障数据噪声和处理空缺值;使用数据归约方法对车辆故障数据进行维归约,以减少随机变量和属性的个数。
7.一种基于数据挖掘的车辆故障诊断系统,其特征在于,该故障诊断系统包括数据采集处理模块、故障诊断模型构建模块和评估预测模块,
所述数据采集处理模块用于采集车辆故障数据,包括车辆发生故障时各零部件的相关参数数据,以得到具有故障类标记的车辆故障数据集D,D中包含n个车辆故障数据样本{s1,s2,s3,…sn};
所述故障诊断模型构建模块用于构建故障诊断模型,其构建过程如下:
A).初始化每个数据样本的权重为1/n;
B).根据数据样本的权重从D中有放回抽样,得到包含n个车辆故障数据样本的车辆故障数据集Di;
C).在每个车辆故障数据集Di上构建一个车辆故障诊断模型Mi(i=1,2,…,k),并计算Mi的错误率error(Mi)
其中,err(sj)是数据样本sj的误分类误差,如果sj被误分类,则err(sj)为1;否则它为0,wi为数据样本sj在第i次迭代的权重;
D).当error(Mi)大于设定值时,则转到B)重新构建车辆故障诊断模型;
E).当error(Mi)小于设定值,则对Di中每个被正确分类的车辆故障数据样本的权重乘以error(Mi)/(1-error(Mi));
F).将步骤A)-E)重复k次,以得到k个车辆故障诊断模型Mi(i=1,2,…,k);
所述的评估预测模块用于根据所构建的k个故障诊断模型对实时采集到的车辆故障数据采用组合投票的方法进行故障诊断。
8.根据权利要求7所述的基于数据挖掘的车辆故障诊断系统,其特征在于,所述的故障诊断模型构建模块采用决策树算法在每个车辆故障数据集Di上构建一个车辆故障诊断模型Mi(i=1,2,…,k),过程如下:
A.创建节点S;
B.如果Di(i=1,2,…,k)中所有数据样本都属于同一车辆故障类A,则返回S作为叶节点,并标记为故障类型A;
C.否则,选择所有参数中具有最大增益率的参数t,参数t成为节点S的“测试”参数;
D.对测试参数t的每个区间划分创建一个分支,并据此划分样本;
E.在每一个划分样本上,重复步骤A-D,递归地构建车辆故障诊断模型,直至给定节点的所有数据样本属于同一故障类型,或者没有剩余车辆零部件参数可以用来进一步划分样本,或者给定的分支没有数据样本。
9.根据权利要求7所述的基于数据挖掘的车辆故障诊断系统,其特征在于,所述评估检测模块采用组合投票进行故障诊断的过程如下:
a.将每个车辆故障诊断模型Mi的权重初始化为0;
b.计算每个每个车辆故障诊断模型Mi的权重Wi,
Wi=log(error(Mi)/(1-error(Mi)));
c.如果车辆故障诊断模型Mi对车辆故障数据样本si诊断为故障类型Ci,那么车辆故障数据样本si属于故障类型Ci的权重就为Wi;
d.k个车辆故障诊断模型Mi都对车辆故障数据样本si进行故障诊断,即组合投票,最后返回具有最大权重和的故障类。
10.根据权利要求7所述的基于数据挖掘的车辆故障诊断系统,其特征在于,所述采集处理模块还用于对采集到的车辆故障数据进行预处理,包括使用数据清理方法消除故障数据噪声和处理空缺值;使用数据归约方法对车辆故障数据进行维归约,以减少随机变量和属性的个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610279367.0A CN105955233B (zh) | 2016-04-28 | 2016-04-28 | 一种基于数据挖掘的车辆故障诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610279367.0A CN105955233B (zh) | 2016-04-28 | 2016-04-28 | 一种基于数据挖掘的车辆故障诊断方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105955233A CN105955233A (zh) | 2016-09-21 |
CN105955233B true CN105955233B (zh) | 2018-09-25 |
Family
ID=56916690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610279367.0A Active CN105955233B (zh) | 2016-04-28 | 2016-04-28 | 一种基于数据挖掘的车辆故障诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105955233B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683351A (zh) * | 2016-12-28 | 2017-05-17 | 湖南坤宇网络科技有限公司 | 一种基于决策树系统的锅炉烟气脱硫设备故障预警方法 |
CN108008332B (zh) * | 2017-11-29 | 2020-02-14 | 国网山东省电力公司电力科学研究院 | 一种基于数据挖掘的新能源远程测试设备故障诊断方法 |
CN110458204A (zh) * | 2019-07-23 | 2019-11-15 | 上海交通大学 | 基于信息增益和LightGBM模型的汽车故障预测方法 |
CN110887671B (zh) * | 2019-10-18 | 2022-04-12 | 北京百度网讯科技有限公司 | 自动驾驶中定位车辆故障的根本原因的方法和装置 |
CN111597708A (zh) * | 2020-05-14 | 2020-08-28 | 北京赛宝工业技术研究院有限公司 | 压缩机质量预警服务的方法、系统、可读介质和电子设备 |
CN111572350A (zh) * | 2020-05-29 | 2020-08-25 | 北京经纬恒润科技有限公司 | 电动汽车起火预警方法及装置 |
CN115359301A (zh) * | 2022-09-06 | 2022-11-18 | 上海寻序人工智能科技有限公司 | 一种基于云端平台的数据挖掘方法 |
CN116125298A (zh) * | 2022-11-28 | 2023-05-16 | 伏瓦科技(苏州)有限公司 | 电池故障检测方法及装置 |
CN117590837B (zh) * | 2024-01-18 | 2024-03-29 | 深圳市伟创高科电子有限公司 | 基于树型结构的电动车控制器故障诊断方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521613A (zh) * | 2011-12-17 | 2012-06-27 | 山东省科学院自动化研究所 | 一种汽车电子系统的故障诊断方法 |
JP2012247308A (ja) * | 2011-05-27 | 2012-12-13 | Denso Corp | 充電装置、及びサーバ |
CN104021238A (zh) * | 2014-03-25 | 2014-09-03 | 重庆邮电大学 | 一种铅酸动力电池系统故障诊断方法 |
JP2015219029A (ja) * | 2014-05-14 | 2015-12-07 | 株式会社デンソー | 診断データ抽出装置、車両診断装置 |
-
2016
- 2016-04-28 CN CN201610279367.0A patent/CN105955233B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012247308A (ja) * | 2011-05-27 | 2012-12-13 | Denso Corp | 充電装置、及びサーバ |
CN102521613A (zh) * | 2011-12-17 | 2012-06-27 | 山东省科学院自动化研究所 | 一种汽车电子系统的故障诊断方法 |
CN104021238A (zh) * | 2014-03-25 | 2014-09-03 | 重庆邮电大学 | 一种铅酸动力电池系统故障诊断方法 |
JP2015219029A (ja) * | 2014-05-14 | 2015-12-07 | 株式会社デンソー | 診断データ抽出装置、車両診断装置 |
Non-Patent Citations (1)
Title |
---|
袁静.面向设备故障诊断的数据挖掘关键技术研究与实现.《中国优秀硕士学位论文全文数据库 信息科技辑》.2013,(第3期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN105955233A (zh) | 2016-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105955233B (zh) | 一种基于数据挖掘的车辆故障诊断方法及系统 | |
CN106662072B (zh) | 风力发电机状态监控方法与系统 | |
KR102263337B1 (ko) | 클라우드 기반 차량 고장 진단 방법, 장치 및 시스템 | |
CN108051211B (zh) | 一种风电机组主轴承温度预警诊断方法 | |
CN103838229B (zh) | 电动汽车诊断方法和诊断装置 | |
CN106338406A (zh) | 列车牵引电传动系统的在线监测与故障预警系统及方法 | |
CN113064939B (zh) | 一种新能源车辆三电系统安全特征数据库构建方法 | |
CN104021238A (zh) | 一种铅酸动力电池系统故障诊断方法 | |
CN103901882A (zh) | 一种列车动力系统在线监控故障诊断的系统及其方法 | |
CN204113701U (zh) | 一种矿井风机在线监测与故障诊断系统 | |
KR102215107B1 (ko) | 주행 데이터 기반 차량 상태 예측 시스템 및 방법 | |
CN108667927A (zh) | 工程机械故障的远程管理方法、装置、系统及存储介质 | |
JP2017077055A (ja) | 状態診断装置及びプログラム | |
CN112116262A (zh) | 一种风力发电机组设备健康度的评价方法 | |
CN112327807A (zh) | 一种基于ivi主机的汽车故障诊断和监测系统及方法 | |
CN104318485A (zh) | 一种基于神经网络和模糊逻辑的输电线路故障判别方法 | |
CN103674538A (zh) | 一种直升机自动倾斜器多故障模式识别方法及装置 | |
CN109101010A (zh) | 一种汽车故障诊断方法及相关设备 | |
CN109960237A (zh) | 一种车辆故障诊断和数据分析系统及车辆 | |
CN113752843B (zh) | 一种基于赛博物理系统的动力电池热失控预警装置及方法 | |
CN206023812U (zh) | 集成数据采集传输装置的门控器 | |
CN108275094A (zh) | 用于隔离dc电源的低充电状态的根本原因的方法和设备 | |
CN114036647A (zh) | 一种基于实车数据的动力电池安全风险评估方法 | |
CN206187050U (zh) | 轨道车辆系统故障的检测装置 | |
CN114320773B (zh) | 一种基于功率曲线分析与神经网络的风电机组故障预警方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 450061 Yudao Road, Guancheng District, Zhengzhou City, Henan Province Patentee after: Yutong Bus Co.,Ltd. Address before: 450016 Yutong Industrial Zone, eighteen Li River, Henan, Zhengzhou Patentee before: ZHENGZHOU YUTONG BUS Co.,Ltd. |