CN106056221A - 基于FP‑Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法 - Google Patents

基于FP‑Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法 Download PDF

Info

Publication number
CN106056221A
CN106056221A CN201610363507.2A CN201610363507A CN106056221A CN 106056221 A CN106056221 A CN 106056221A CN 201610363507 A CN201610363507 A CN 201610363507A CN 106056221 A CN106056221 A CN 106056221A
Authority
CN
China
Prior art keywords
spare part
dtc
tree
item
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610363507.2A
Other languages
English (en)
Other versions
CN106056221B (zh
Inventor
田雨农
刘亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Roiland Technology Co Ltd
Original Assignee
Dalian Roiland Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Roiland Technology Co Ltd filed Critical Dalian Roiland Technology Co Ltd
Priority to CN201610363507.2A priority Critical patent/CN106056221B/zh
Publication of CN106056221A publication Critical patent/CN106056221A/zh
Application granted granted Critical
Publication of CN106056221B publication Critical patent/CN106056221B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Abstract

基于FP‑Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,属于信息检索领域,技术要点是:对故障码识别和分类;根据事务数据库,通过FP‑Tree算法创建故障码和更换备件对应关系的频繁项集;利用备件位置和故障所在的ECU位置之间的拓扑关系,进行拓扑搜索,遴选频繁项集;构建备件与维修工项的对应关系,形成故障码对应工项的诊断数据库;将诊断数据库与诊断知识库关联,并建立主键;效果是:可在获取故障码后,快速找到常见故障的解决方案和对应备件、工项。

Description

基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与 备件检索的方法
技术领域
本发明属于信息检索领域,涉及一种用于车辆远程诊断与备件检索的方法
背景技术
目前我国汽车维修行业已经从完全依靠检查者的感觉和实践经验进行诊断的阶段,发展到了利用专门设备进行综合检测诊断阶段,但是在传统汽车维修行业中普遍存在着很多问题,比如维修工人技术老化,经常无法快速、经济地利用各方面的技术力量解决故障;随着汽车保有量的日益增多,汽车后市场各项服务如雨后春笋般大量涌现。那么从车主角度,如何才能更好更全面的了解车况,发生故障时,如何快速获取爱车待解决方案及所需工时及备件相关信息,精准的汽车可穿戴设备对满足车主实时需求是完全必要的。一般的OBD车载设备,只能读取到相关车辆故障信息,不能对故障做出详细解决方案及相关维修人工费、备件费,从而造成车主盲目进店,盲目消费。
发明内容
为了解决车主车辆出现故障时,能够准确和快速匹配该故障码所对应的工项与备件,本发明提出如下技术方案:一种基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,包括
步骤一.采集车辆信息数据;
步骤二.对故障码识别和分类;
步骤三.解析车辆VIN码得到变量,所述变量包括由VIN码解析得到的发动机排量、车身类型、发动机变速箱类型;
步骤四.对变量所对应的备件代码做决策树分析,完成变量数据归类形成备件信息,并建立索引,形成诊断知识库;
步骤五.根据事务数据库,通过FP-Tree算法创建故障码和更换备件对应关系的频繁项集;利用备件位置和故障所在的ECU位置之间的拓扑关系,进行拓扑搜索,遴选频繁项集;构建备件与维修工项的对应关系,形成故障码对应工项的诊断数据库;
步骤六.将诊断数据库与诊断知识库关联,并建立主键;
步骤七.对车辆故障生成的故障码识别,并通过关键字解析车辆VIN码得到的变量以进行分类检索,得到工项及备件信息。
有意效果:本发明可以在获取故障码后,快速找到常见故障的解决方案和对应备件、工项。有效解决技师和备件员的经验局限性问题,从大数据出发,获得故障的解决方案。本发明其具有对故障码识别和分类的步骤,可以在不同车型间的故障码出现差异时,判断其一致性;且,本发明通过频繁项集算法FP-Tree和序列模式挖掘寻找对应关系。采用两算法融合使用,提供了能基于大数据,获知准确度高的故障码和更换备件的对应关系,适用于除了单一故障还有多故障并行解决的可能性,远程估算车辆的故障码判断需要维修的备件和工项,提供完整解决方案,为车辆的维修提供参考和借鉴。
附图说明
图1为本发明用于车辆远程诊断与备件检索的方法的流程图;
图2为底盘号为LFV5A14B8Y3000001的车辆的VIN号码翻译示意图;
图3为本发明实施例插入第一条故障码和备件对应关系的FP-Tree结构示意图;
图4为本发明实施例插入第二条故障码和备件对应关系的FP-Tree结构示意图;
图5为本发明实施例插入第三条故障码和备件对应关系的FP-Tree结构示意图;
图6为本发明实施例生成的故障码和备件对应关系的FP-Tree结构示意图;
图7为本发明备件位置和车辆故障所在的ECU位置之间的拓扑关系图。
具体实施方式
实施例1:一种基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,包括
步骤一.采集车辆信息数据;
步骤二.对故障码识别和分类;
步骤三.解析车辆VIN码得到变量,所述变量包括由VIN码解析得到的发动机排量、车身类型、发动机变速箱类型;
步骤四.对变量所对应的备件代码做决策树分析,完成变量数据归类形成备件信息,并建立索引,形成诊断知识库;
步骤五.根据事务数据库,通过FP-Tree算法创建故障码和更换备件对应关系的频繁项集;利用备件位置和故障所在的ECU位置之间的拓扑关系,进行拓扑搜索,遴选频繁项集;构建备件与维修工项的对应关系,形成故障码对应工项的诊断数据库;
步骤六.将诊断数据库与诊断知识库关联,并建立主键;
步骤七.对车辆故障生成的故障码识别,并通过关键字解析车辆VIN码得到的变量以进行分类检索,得到工项及备件信息。
实施例2:具有与实施例1相同的技术方案,更为具体的,对于实施例1的步骤四来说,
所述步骤四中以维修备件表的历史记录为数据基础,通过决策树模型对备件做分类,维修备件表样例如表一所示:
表一
VIN123 VIN4 VIN6 VIN78 BJDM
LFV 5 1 4B 06J 115 403 J
LFV 3 2 8K LN 052 167 A21
LFV 4 2 4F LN 052 167 A24
决策树模型的基本原理如下:
首先:确定每一维度备件不同分类的熵,以VIN4为例,熵定义为
E=sum(-p(I)*log(p(I)))
其中I=1:N(N类结果,如本例1种,即该备件属于此车型,故概率P(I)=1)
则E(5)=-(1/1)Log2(1/1)-(0/1)Log2(0/1)=0+0=0
E(3)=-(1/1)Log2(1/1)-(0/1)Log2(0/1)=0+0=0
E(4)=-(1/1)Log2(1/1)-(0/1)Log2(0/1)=0+0=0
如果熵为0,则表明区分度越高;熵为1,则表明没有区分度;
故这三个不同的备件代码可以通过VIN4做区分。
确定完每个维度如何分类后,不同维度之间的优先级别通过信息增益区分
Gain(Sample,Action)=E(sample)-sum(|Sample(v)|/Sample*E(Sample(v)))
则Gain(VIN4)=E(S)-(1/3)*E(5)-(1/3)*E(3)-(1/3)*E(4)=1-0=1
Gain(VIN6)=E(S)-(1/3)*E(1)-(2/3)*E(2)=1-0-2/3=1/3
Gain(VIN78)=E(S)-(1/3)*E(4B)-(1/3)*E(8K)-(1/3)*E(4F)=1-0=1
如果信息增益越大,则表明分类优先级越高;反之,优先级越低。
所以,底盘号第4位(VIN4)和底盘号78位(VIN78)的分类优先级相同,其次是底盘号第6位(VIN6)。
通过以上关键步骤,可将备件代码按照底盘号第4位(VIN4)、底盘号第6位(VIN6)和底盘号78位(VIN78)区分。
综上所述,备件检索方法的基本步骤是:
将维修备件表同一维度按信息熵做区分;
将维修备件表不同维度按信息增益划分优先级;
按照1、2步划分的优先级和区分程度画出决策树;
输入一个规则的底盘号,系统根据VIN123、VIN4、VIN6、VIN78以及得出的决策树输出该车型下的备件代码。
该备件代码通过关联备件价格表,得到备件的中文名称、价格和现在使用状态以及备件的适用车型信息。
上述技术方案的获得,是在将不同车型、不同排量、不同发动机变速箱类型所对应的备件代码逐一归类进行分析对比后,发现在相同主组号前提下,车型排量等信息不同,所对应的备件代码也不尽相同,为了找寻其中规律,使用了上述方法,以形成较完备且全面的理论知识信息库。
实施例3:具有与实施例1或2相同的技术方案,更为具体的,对于实施例1的步骤五来说,
所述步骤五中,根据事务数据库,通过FP-Tree算法创建故障码和更换备件对应关系的频繁项集的步骤,包含
S1.1输入事务数据库和最小支持度阈值minσ,扫描事务数据库,删除频数小于最小支持度的项目,得到全部频繁项集F1,对F1中的频繁项按其支持度降序排列得到L;
S1.2创建FP-Tree的根节点,以“null”标记,再次扫描事务数据库,把事务数据库中的每一条记录按照L中的顺序排列,生成FP-Tree;
S1.3从FP-Tree中找到所有的频繁模式。
所述步骤五中,利用备件位置和故障所在的ECU位置之间的拓扑关系,进行拓扑搜索,遴选频繁项集的步骤包括:
S2.1根据备件码的构造规则将备件进行分类;
S2.2对备件和故障所在的ECU位置构建拓扑关系,并将所述拓扑关系进行标识,得到备件和ECU位置的对应关系。
所述步骤五中,构建备件与维修工项的对应关系,形成故障码对应工项的诊断数据库的步骤包括:
S3.1扫描备件与维修工项的数据库,获得备件与维修工项的频繁项集F2;对F2中的频繁项按其支持度降序排列得到L’;
S3.2创建FP-Tree的根节点,以“null”标记,再次数据库,把数据库中的每一条记录按照L’中的顺序排列,生成FP-Tree;
S3.3从FP-Tree中找到所有的频繁模式,构建备件与维修工项的对应关系。
按照S1.1或S3.1排序后的频繁项表为[p|P],其中p是第一个频繁项,而P是剩余的频繁项的列表。调用insert_tree([p|P],T),insert_tree([p|P],T)过程执行情况如下:如果T有子节点N使N.item_name=p.item_name,则N的计数增加1;否则创建一个新节点N,将其计数设置为1,链接到它的父节点T,并且通过node_link将其链接到具有相同名称item_name的节点;如果P非空,递归调用insert_tree(P,N)。8、对于FP-Tree是单枝的情况,直接输出整条路径上所有节点的组合+postModel。
所述的备件分别按照附件、娱乐信息,发动机,燃油、排气、空调,变速箱,前轴、转向装置,后轴,车轮、制动器,踏板机构,车身,电子设备进行0~9分类。
实施例4:具有与实施例1或2或3相同的技术方案,更为具体的,对于实施例1的步骤二来说,
所述对故障码识别和分类的方法,包括:
首先利用训练数据集构建朴素贝叶斯分类器,具体步骤为:
S1:对训练集中的故障码进行人工分类,人工分类后的类别集为c:
c={c1,c2,…,ci,…,cn};
S2:将每个类别中的故障码进行分词并计算每个词的TF-IDF权重值;
TF i = w i Σ j w j
TFi为特征词i的词频;wi为特征词i在所有故障码中出现的次数,∑jwj表示故障码中所有特征词的出现次数总和;
IDF i = ln ( E 1 + { k : w i ∈ e k } )
IDFi为特征词i的逆向文件频率;E为语料库中故障码的总数,{k:wi∈ek}表示包含特征词i的故障码数;
TF-IDF权重值为:TF-IDF=TF×IDF,也就是是词频与逆向文件频率的乘积;
S3:根据TF-IDF权重值筛选出特征词并建立特征词库,将故障码e定义成若干个特征词的集合:
e={w1,w2,…,wn}
S4:分别计算每个类别中特征词在该类别条件下的条件概率,依据贝叶斯定理计算出某个故障码e属于ci类故障的概率,具体公式如下:
P(ci|e)=[P(e|ci)P(ci)]/P(e)
其中,P(e)为从故障码空间中随机抽取一个故障码e的概率;P(ci)为一个故障码类别ci在故障码空间所占比率;P(e|ci)为对于给定的故障码类别ci中故障码e的出现概率;
对于每个故障码类别而言,从故障码空间中随机抽取一个故障码的概率都是一样的,因此P(e)可以忽略不予计算,这样公式(1)就可以写成如下形式:
P(ci|e)∝P(e|ci)P(ci)
计算某个故障码在每个分类中概率,取拥有最大概率值的类别为该故障码的分类结果,具体为:
G(e)≡argmax{P(e|ci)P(ci)}。
S5:构建朴素贝叶斯分类器。
然后对新故障码进行具体分类,具体为:
更具体的,对新故障码进行具体分类,设在类别i中的故障码为ei,同时还有个待匹配的故障码enew,它们的分词情况如下:
ei={w1,w2,w3,w4}
enew={w2,w3,w5}
步骤1:由这两组的特征词集合构成一个向量空间:
W = w 1 w 2 w 3 w 4 w 5
步骤2:结合向量空间,分别得到两个故障码的词向量值:
e i = 1 1 1 1 0
e n e w = 0 1 1 0 1
步骤3:利用余弦相似度计算两个故障码近似情况,具体公式如下:
S = e i e n e w | | e i | | · | | e n e w | |
步骤4:如果所计算的相似度值大于80%,则可以判断这两个故障码是相同的;如果所计算的相似度值小于阈值,则继续与已知故障码库中的其他类别故障码进行余弦相似度计算。
采用以上技术方法,能够取得如下的技术效果:准确地自动分类不同车型的故障码,将数以亿级的故障码进行收敛,实现不同车厂车型间故障问题、解决方案的探索。能节省大量的劳动力,缩短工作周期,降低成本。
实施例5:具有与实施例3相同的技术方案,作为实施例3的补充,还具有如下技术方案:
一、FP-Tree算法
利用FP-Tree,紧缩的数据结构来存储查找频繁项集,挖掘关联规则,根据置信度、支持度等提取出故障和备件的可能项集。
输入:事务数据库D(故障码和更换备件的连接关系)和最小支持度阈值minσ;
输出:事务数据库D所对应的FP-tree。
FP-tree是按以下步骤构造的:
1、扫描事务数据库D,获得事务数据库D中所包含的全部频繁项集F1,及它们各自的支持度。对F1中的频繁项按其支持度降序排序得到L。
2、创建FP-tree的根节点T,以“null”标记,再次扫描事务数据库D,对于事务数据库D中每个事务,将其中的频繁项选出并按L中的次序排序。设排序后的频繁项表为[p|P],其中p是第一个频繁项,而P是剩余的频繁项。调用insert_tree([p|P],T)。insert_tree([p|P],T)过程执行情况如下:如果T有子节点N使N.item_name=p.item_name,则N的计数增加1;否则创建一个新节点N,将其计数设置为1,链接到它的父节点T,并且通过node_link将其链接到具有相同item_name的节点。如果P非空,递归地调用insert_tree(P,N)。FP-tree是一个高度压缩的结构,它存储了用于挖掘频繁项集的全部信息。
对于FP-Tree已经是单枝的情况,就没有必要再递归调用FPGrowth了,直接输出整条路径上所有节点的各种组合+postModel就可了。
事务数据库如下,每一行代表一次故障码和更换备件的可能关系:
故障A,故障B,备件C,备件D
故障B,故障E,备件D,备件F
故障B,备件C,备件D
故障A,故障B,备件C,故障E,备件D,备件F
故障A,备件C,备件F
故障B,备件C,备件F
故障A,备件C,备件D
故障A,故障B,备件C,备件G,备件D
故障A,故障B,备件F
故障A,故障B,备件G,备件D
目的:找出一种总是相伴出现的组合,比如故障B和备件D总一起出现,则[故障B,备件D]是一条频繁模式。通过FP-Tree得到一部分粗略的关系,然后通过拓扑搜索细化,剔除不满足拓扑关系的组合。
(1)扫描数据库,每项按频数递减排序,并删除频数小于最小支持度MinSup的项目。
故障A:7
故障B:8
备件C:7
备件D:7
备件F:5
*本次扫描{Minsup=3}
则故障B、备件C、备件D、故障A、备件F为频繁1项集,计为F1。
(2)对于每一条故障码和更换备件的可能关系,按照F1中的顺序重新排序。
故障B,备件D,备件C,故障A
故障B,备件D,备件F
故障B,备件D,备件C
故障B,备件D,备件C,故障A,备件F
备件C,故障A,备件F
故障B,故障A,备件F
故障B,备件C,备件F
备件D,备件C,故障A
故障B,备件D,备件C,故障A
故障B,备件D,故障A
(3)把第(2)步骤中得到的各条记录插入到FP-Tree中。初始后缀模式为空,最终生成FP-Tree如图1~4所示。
图4中最左边的一侧叫做表头项,树中相同名称的节点要链接起来,链表的第一个元素就是表头项里的元素。如果FP-Tree为空(只含一个虚的root节点),则FP-Growth函数返回。此时输出表头项的每一项+postModel,支持度为表头项中对应项的计数。
(4)表头项中的每一项(我们拿“故障A:7”为例),对于各项都执行以下①到⑤的操作:
①从FP-Tree中找到所有的“故障A”节点,向上遍历它的祖先节点,得到4条路径:
备件D:6,故障B:8,故障A:1
备件D:6,故障B:8,备件C:4,故障A:3
故障B:8,故障A:1
备件C:2,故障A:2
②对于每一条路径上的节点,其count都设置为故障A的count
备件D:1,故障B:1,故障A:1
备件D:3,故障B:3,备件C:3,故障A:3
故障B:1,故障A:1
备件C:2,故障A:2
③因为每一项末尾都是故障A,可以把故障A去掉,得到条件模式基(ConditionalPattern Base,CPB),此时的后缀模式是:(故障A)。
备件D:1,故障B:1
备件D:3,故障B:3,备件C:3
故障B:1
备件C:2
④把上面的结果当作原始的事务数据库,返回到第3步,递归迭代运行。
⑤最终得到的频繁项集为(去除只有备件或者只有故障的关系集)
二、拓扑搜索
对关联算法得出的故障和备件(项目)的可能项集进行进一步收缩,利用车辆构造,限制备件位置和车辆故障所在的ECU位置之间的拓扑关系,在有限范围内遴选频繁项集。
根据备件码的构造规则,进行备件分类,具体如下:
1(发动机):发动机总成、缸体、缸盖、活塞、连杆、连接部件、发动机托架、支架急紧固件,燃油喷射如进气管、空气流量计等;
2(燃油、排气、空调冷却):燃油箱、排气管、空调制冷系统等;
3(变速箱):变速箱总成及内部部件;
4(前轴、转向装置):前轮驱动差速器、转向系统(转向机)、前减震器等;
5(后轴):后轴、后轮驱动差速器,后减震器,如后桥、后轮轴承等;
6(车轮、制动器):车轮、车轮装饰盖、刹车系统;
7(踏板机构):手脚制动系统;
8(车身):车身及装饰件,空调壳体,前后保险杠,如车身总成、空调通风系统等;
9(电子设备):电器,如发动机、起动机、控制器、灯具、线束等;
0(附件、信息娱乐):附件(千斤顶,天线,收音机,发动机底护板)及油漆材料等。
采用FP-Free频繁项集算法构建备件与维修项目(工项)之间的对应关系,从而获得故障码对应备件和工项的完整解决方案。
2、备件号码分类对应车辆ECU名称拓扑关系
3、备件号码分类对应工项代码拓扑关系
通过上述方法结合找到故障与备件的对应关系,获得故障码对应备件和工项的完整解决方案。
以上所述,仅为本发明创造较佳的具体实施方式,但本发明创造的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之内。

Claims (10)

1.一种基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,其特征在于,包括
步骤一.采集车辆信息数据;
步骤二.对故障码识别和分类;
步骤三.解析车辆VIN码得到变量,所述变量包括由VIN码解析得到的发动机排量、车身类型、发动机变速箱类型;
步骤四.对变量所对应的备件代码做决策树分析,完成变量数据归类形成备件信息,并建立索引,形成诊断知识库;
步骤五.根据事务数据库,通过FP-Tree算法创建故障码和更换备件对应关系的频繁项集;利用备件位置和故障所在的ECU位置之间的拓扑关系,进行拓扑搜索,遴选频繁项集;构建备件与维修工项的对应关系,形成故障码对应工项的诊断数据库;
步骤六.将诊断数据库与诊断知识库关联,并建立主键;
步骤七.对车辆故障生成的故障码识别,并通过关键字解析车辆VIN码得到的变量以进行分类检索,得到工项及备件信息。
2.如权利要求1所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,其特征在于,所述步骤四中以维修备件表的历史记录为数据基础,通过决策树模型对备件做分类;
备件检索方法的步骤是:
(1)将维修备件表同一维度按信息熵做区分;
(2)将维修备件表不同维度按信息增益划分优先级;
(3)按照步骤(1)、(2)划分的优先级和区分程度画出决策树;
(4)输入一个规则的VIN码,根据VIN码以及得出的决策树输出该车型下的备件代码。
3.如权利要求2所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,其特征在于,所述备件代码关联备件的价格表,所述备件信息包括备件的中文名称、价格和现在使用状态以及备件的适用车型信息。
4.如权利要求1所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,其特征在于,所述步骤五中,根据事务数据库,通过FP-Tree算法创建故障码和更换备件对应关系的频繁项集的步骤,包含
S1.1输入事务数据库和最小支持度阈值minσ,扫描事务数据库,删除频数小于最小支持度的项目,得到全部频繁项集F1,对F1中的频繁项按其支持度降序排列得到L;
S1.2创建FP-Tree的根节点,以“null”标记,再次扫描事务数据库,把事务数据库中的每一条记录按照L中的顺序排列,生成FP-Tree;
S1.3从FP-Tree中找到所有的频繁模式。
5.如权利要求1所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,其特征在于,所述步骤五中,利用备件位置和故障所在的ECU位置之间的拓扑关系,进行拓扑搜索,遴选频繁项集的步骤包括:
S2.1根据备件码的构造规则将备件进行分类;
S2.2对备件和故障所在的ECU位置构建拓扑关系,并将所述拓扑关系进行标识,得到备件和ECU位置的对应关系。
6.如权利要求1所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,其特征在于,所述步骤五中,构建备件与维修工项的对应关系,形成故障码对应工项的诊断数据库的步骤包括:
S3.1扫描备件与维修工项的数据库,获得备件与维修工项的频繁项集F2;对F2中的频繁项按其支持度降序排列得到L’;
S3.2创建FP-Tree的根节点,以“null”标记,再次数据库,把数据库中的每一条记录按照L’中的顺序排列,生成FP-Tree;
S3.3从FP-Tree中找到所有的频繁模式,构建备件与维修工项的对应关系。
7.如权利要求4或5或6所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,其特征在于,按照S1.1或S3.1排序后的频繁项表为[p|P],其中p是第一个频繁项,而P是剩余的频繁项的列表,调用insert_tree([p|P],T),insert_tree([p|P],T)过程执行情况如下:如果T有子节点N使N.item_name=p.item_name,则N的计数增加1;否则创建一个新节点N,将其计数设置为1,链接到它的父节点T,并且通过node_link将其链接到具有相同名称item_name的节点;如果P非空,递归调用insert_tree(P,N)。
8.如权利要求1所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,其特征在于,所述对故障码识别和分类的方法,包括:
首先利用训练数据集构建朴素贝叶斯分类器;
然后对新故障码进行具体分类;
构建朴素贝叶斯分类器的步骤为:
S1:对训练集中的故障码进行人工分类;
S2:将每个类别中的故障码进行分词并计算每个词的TF-IDF权重值;
S3:根据TF-IDF权重值筛选出特征词并建立特征词库;
S4:分别计算每个类别中特征词在该类别条件下的条件概率;
S5:构建朴素贝叶斯分类器。
9.如权利要求8所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,其特征在于,步骤S2中的TFi为特征词i的词频;wi为特征词i在所有故障码中出现的次数,∑jwj表示故障码中所有特征词的出现次数总和;
步骤S2中的IDFi为特征词i的逆向文件频率;E为语料库中故障码的总数,{k:wi∈ek}表示包含特征词i的故障码数;
步骤S2中的TF-IDF权重值为:
TF-IDF=TF×IDF
TF-IDF权重值是词频与逆向文件频率的乘积。
10.如权利要求8所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,其特征在于,对新故障码进行具体分类,设在类别i中的故障码为ei,同时还有个待匹配的故障码enew
步骤1:由这两组的特征词集合构成一个向量空间:
步骤2:结合向量空间,分别得到两个故障码的词向量值:
步骤3:利用余弦相似度计算两个故障码近似情况;
步骤4:如果所计算的相似度值大于阈值,则可以判断这两个故障码是相同的;如果所计算的相似度值小于阈值,则继续与已知故障码库中的其他类别故障码进行余弦相似度计算;步骤S3中判断两个故障码近似情况,具体公式如下:
S = e i e n e w | | e i | | · | | e n e w | | .
CN201610363507.2A 2016-05-27 2016-05-27 基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法 Active CN106056221B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610363507.2A CN106056221B (zh) 2016-05-27 2016-05-27 基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610363507.2A CN106056221B (zh) 2016-05-27 2016-05-27 基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法

Publications (2)

Publication Number Publication Date
CN106056221A true CN106056221A (zh) 2016-10-26
CN106056221B CN106056221B (zh) 2019-10-29

Family

ID=57174836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610363507.2A Active CN106056221B (zh) 2016-05-27 2016-05-27 基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法

Country Status (1)

Country Link
CN (1) CN106056221B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108573198A (zh) * 2017-03-14 2018-09-25 优信互联(北京)信息技术有限公司 一种根据车架号识别车型信息的方法及装置
CN108846083A (zh) * 2018-06-11 2018-11-20 北京神州泰岳软件股份有限公司 频繁模式挖掘方法及装置
CN108956111A (zh) * 2018-06-11 2018-12-07 北京天泽智云科技有限公司 一种机械部件的异常状态检测方法及检测系统
CN108985465A (zh) * 2018-05-21 2018-12-11 许继电气股份有限公司 一种换流站故障分类方法及系统
CN109228861A (zh) * 2018-09-26 2019-01-18 合肥澎湃能源技术有限公司 用于诊断和处理加速踏板的故障的方法及系统
CN109409668A (zh) * 2018-09-21 2019-03-01 华中科技大学 基于数据挖掘的抽水蓄能机组故障关联关系分析方法
CN109697210A (zh) * 2018-12-26 2019-04-30 天津瑞源电气有限公司 一种风电机组关联故障在线诊断方法
CN109814526A (zh) * 2018-12-29 2019-05-28 卡斯柯信号有限公司 面向轨旁安全信号系统的维护诊断方法
CN109934957A (zh) * 2019-03-20 2019-06-25 深圳市道通科技股份有限公司 显示车辆ecu系统分布及状态的方法、装置及移动终端
CN110632439A (zh) * 2019-09-29 2019-12-31 国网河南省电力公司电力科学研究院 基于同步波形与关联规则的配电网单相接地故障诊断技术
CN110866048A (zh) * 2019-11-15 2020-03-06 杭州数梦工场科技有限公司 证件信息的关联规则获取方法及装置
CN110967629A (zh) * 2018-09-28 2020-04-07 Abb瑞士股份有限公司 用于电驱动装置的故障诊断系统和方法
CN111782705A (zh) * 2020-05-28 2020-10-16 平安医疗健康管理股份有限公司 频繁数据的挖掘方法、装置、设备及计算机可读存储介质
CN112884179A (zh) * 2021-03-30 2021-06-01 北京交通大学 基于机器故障和文本主题分析的城轨折返故障诊断方法
CN114091625A (zh) * 2022-01-18 2022-02-25 岚图汽车科技有限公司 一种基于故障代码序列的车辆零件失效预测方法及系统
CN114265384A (zh) * 2021-11-22 2022-04-01 阿尔特汽车技术股份有限公司 一种车辆故障信息处理方法以及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090222389A1 (en) * 2008-02-29 2009-09-03 International Business Machines Corporation Change analysis system, method and program
US20110304448A1 (en) * 2010-06-11 2011-12-15 Denso Corporation Electronic control unit and information management system
CN102457893A (zh) * 2010-10-26 2012-05-16 中国移动通信集团公司 一种数据处理方法和设备
CN105224616A (zh) * 2015-09-18 2016-01-06 浪潮软件股份有限公司 一种基于时间序列的apriori算法改进方法
CN105354638A (zh) * 2015-11-03 2016-02-24 仲晓东 一种汽车维修保养费用预测方法及系统
CN105590146A (zh) * 2016-02-29 2016-05-18 上海带来科技有限公司 一种基于大数据的电厂设备智能预测检修方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090222389A1 (en) * 2008-02-29 2009-09-03 International Business Machines Corporation Change analysis system, method and program
US20110304448A1 (en) * 2010-06-11 2011-12-15 Denso Corporation Electronic control unit and information management system
CN102457893A (zh) * 2010-10-26 2012-05-16 中国移动通信集团公司 一种数据处理方法和设备
CN105224616A (zh) * 2015-09-18 2016-01-06 浪潮软件股份有限公司 一种基于时间序列的apriori算法改进方法
CN105354638A (zh) * 2015-11-03 2016-02-24 仲晓东 一种汽车维修保养费用预测方法及系统
CN105590146A (zh) * 2016-02-29 2016-05-18 上海带来科技有限公司 一种基于大数据的电厂设备智能预测检修方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
常明 等: "基于决策树的车辆大修辅助决策系统研究", 《军事交通学院学报》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108573198A (zh) * 2017-03-14 2018-09-25 优信互联(北京)信息技术有限公司 一种根据车架号识别车型信息的方法及装置
CN108985465A (zh) * 2018-05-21 2018-12-11 许继电气股份有限公司 一种换流站故障分类方法及系统
CN108846083A (zh) * 2018-06-11 2018-11-20 北京神州泰岳软件股份有限公司 频繁模式挖掘方法及装置
CN108956111A (zh) * 2018-06-11 2018-12-07 北京天泽智云科技有限公司 一种机械部件的异常状态检测方法及检测系统
CN109409668A (zh) * 2018-09-21 2019-03-01 华中科技大学 基于数据挖掘的抽水蓄能机组故障关联关系分析方法
CN109409668B (zh) * 2018-09-21 2022-02-15 华中科技大学 基于数据挖掘的抽水蓄能机组故障关联关系分析方法
CN109228861A (zh) * 2018-09-26 2019-01-18 合肥澎湃能源技术有限公司 用于诊断和处理加速踏板的故障的方法及系统
CN109228861B (zh) * 2018-09-26 2021-10-15 合肥澎湃能源技术有限公司 用于诊断和处理加速踏板的故障的方法及系统
CN110967629A (zh) * 2018-09-28 2020-04-07 Abb瑞士股份有限公司 用于电驱动装置的故障诊断系统和方法
CN109697210A (zh) * 2018-12-26 2019-04-30 天津瑞源电气有限公司 一种风电机组关联故障在线诊断方法
CN109697210B (zh) * 2018-12-26 2023-09-05 天津瑞源电气有限公司 一种风电机组关联故障在线诊断方法
CN109814526B (zh) * 2018-12-29 2021-06-08 卡斯柯信号有限公司 面向轨旁安全信号系统的维护诊断方法
CN109814526A (zh) * 2018-12-29 2019-05-28 卡斯柯信号有限公司 面向轨旁安全信号系统的维护诊断方法
WO2020187315A1 (zh) * 2019-03-20 2020-09-24 深圳市道通科技股份有限公司 显示车辆ecu系统分布及状态的方法、装置及移动终端
CN109934957A (zh) * 2019-03-20 2019-06-25 深圳市道通科技股份有限公司 显示车辆ecu系统分布及状态的方法、装置及移动终端
CN110632439A (zh) * 2019-09-29 2019-12-31 国网河南省电力公司电力科学研究院 基于同步波形与关联规则的配电网单相接地故障诊断技术
CN110866048A (zh) * 2019-11-15 2020-03-06 杭州数梦工场科技有限公司 证件信息的关联规则获取方法及装置
CN111782705A (zh) * 2020-05-28 2020-10-16 平安医疗健康管理股份有限公司 频繁数据的挖掘方法、装置、设备及计算机可读存储介质
CN112884179A (zh) * 2021-03-30 2021-06-01 北京交通大学 基于机器故障和文本主题分析的城轨折返故障诊断方法
CN112884179B (zh) * 2021-03-30 2024-02-09 北京交通大学 基于机器故障和文本主题分析的城轨折返故障诊断方法
CN114265384A (zh) * 2021-11-22 2022-04-01 阿尔特汽车技术股份有限公司 一种车辆故障信息处理方法以及系统
CN114091625A (zh) * 2022-01-18 2022-02-25 岚图汽车科技有限公司 一种基于故障代码序列的车辆零件失效预测方法及系统

Also Published As

Publication number Publication date
CN106056221B (zh) 2019-10-29

Similar Documents

Publication Publication Date Title
CN106056221B (zh) 基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法
CN106066642B (zh) 基于FP-Tree序列模式挖掘的故障码诊断车辆工项与备件检索方法
CN106056222B (zh) 基于FP-Tree序列模式挖掘的故障诊断与估价的方法
CN111078868A (zh) 基于知识图谱分析的装备试验体系规划决策的方法及系统
CN106021545A (zh) 用于车辆远程诊断与备件检索的方法
CN105389718A (zh) 一种汽车后服务推荐方法和系统
CN109240258A (zh) 基于词向量的汽车故障智能辅助诊断方法和系统
CN103049569A (zh) 基于向量空间模型的文本相似性匹配方法
CN101128825A (zh) 树的检索、合计、排序方法、信息处理装置以及树的检索、合计、排序程序
CN105045807A (zh) 互联网交易信息的数据清洗算法
CN112884179B (zh) 基于机器故障和文本主题分析的城轨折返故障诊断方法
CN110570655B (zh) 基于层次聚类和决策树的车辆特征评估方法
CN106056154A (zh) 故障码识别和分类的方法
CN109934362A (zh) 一种车辆检测的方法、装置及终端设备
CN106096736B (zh) 基于FP-Tree序列模式挖掘的故障诊断与估价的平台
CN106095785B (zh) 基于决策树分类的故障码诊断车辆工项与备件检索方法
WO2020201247A1 (de) Automatisiertes maschinelles lernen auf basis gespeicherten daten
CN109902173B (zh) 一种中文文本分类方法
CN105337842A (zh) 一种与内容无关的垃圾邮件过滤方法
CN106056223A (zh) 用于车辆远程诊断与备件检索的平台
CN101334793B (zh) 一种自动识别需求依赖关系的方法
CN109961091A (zh) 一种自学习的事故文字标签与摘要生成系统及其方法
Sucahyo et al. Building a more accurate classifier based on strong frequent patterns
Kang et al. K-means Algorithm Description and the Application of Cluster Analysis in Heavy Truck Vehicle Fault
CN112182212A (zh) 一种网络车辆碰撞数据的处理方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant