CN106055439B - 基于维修决策树/词向量的故障远程诊断系统和方法 - Google Patents

基于维修决策树/词向量的故障远程诊断系统和方法 Download PDF

Info

Publication number
CN106055439B
CN106055439B CN201610364254.0A CN201610364254A CN106055439B CN 106055439 B CN106055439 B CN 106055439B CN 201610364254 A CN201610364254 A CN 201610364254A CN 106055439 B CN106055439 B CN 106055439B
Authority
CN
China
Prior art keywords
cell
word
cell word
failure
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610364254.0A
Other languages
English (en)
Other versions
CN106055439A (zh
Inventor
田雨农
张祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Roiland Technology Co Ltd
Original Assignee
Dalian Roiland Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Roiland Technology Co Ltd filed Critical Dalian Roiland Technology Co Ltd
Priority to CN201610364254.0A priority Critical patent/CN106055439B/zh
Publication of CN106055439A publication Critical patent/CN106055439A/zh
Application granted granted Critical
Publication of CN106055439B publication Critical patent/CN106055439B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2294Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by remote test
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2252Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using fault dictionaries

Abstract

本发明涉及故障远程诊断技术领域,尤其涉及基于维修决策树/词向量的故障远程诊断系统和方法。本发明的一种故障远程诊断方法,包括:创建语言模型,建立细胞词库;在所述细胞词库中切词检索细胞词,并排列所述细胞词;利用决策树模型的决策分类,给出维修解决方案。本发明的有益效果为:可以远程并快速地识别设备的故障,准确的给出有效维修解决方案。检测标准统一,避免由于人工判断带来的误差。并且节省了大量人力物力。

Description

基于维修决策树/词向量的故障远程诊断系统和方法
技术领域
本发明涉及故障远程诊断技术领域,尤其涉及基于维修决策树/词向量的故障远程诊断系统和方法。
背景技术
传统的设备维修行业的故障诊断使用的是“望、闻、问、切”的经验方式。
通常的诊断流程是:
1.设备故障灯亮起或用户感觉到设备有问题,比如有异响、有异味、抖动等,即“发现问题进店”。
2.在维修点通过专业的故障诊断仪检测出故障码和故障描述,即“检测问题”。
3.维修技师通过看故障码和故障描述,结合多年的维修经验,进行现场诊断并提出解决方案,即“解决方案判断”。
4.备件人员开单给出具体备件号、备件名称和备件价格,即“备件开单”。
5.服务顾问开单给出工项号、工项名称、工时和工时费,即“工项开单”。
在现有技术下,用户要针对设备故障进行诊断很多时候需要凭借自身经验发现问题。在确认确实存在需要通过维修解决的问题后,用户需要将设备运送到维修点去检测故障,费时费力。故障检测时,维修技师结合自身经验得出维修方案,并且给出备件号、备件名称和备件价格,这个过程主观性很强,缺乏统一标准。然后再由被检人员和服务顾问分别给出不同单据,费时费力。
发明内容
本发明的目的在于克服现有技术的不足,提供一种故障诊断方法,构建一个从故障描述到词向量分解,建立维修细胞词库;通过故障描述在细胞词库的切词检索,依据细胞词权重建立的句法规则,实现从决策过程到决策建议再到维修解决方案的维修决策树,最终实现故障远程诊断,并对工时费和备件费进行估价。
本发明解决其技术问题是采取以下技术方案实现的:
一种故障远程诊断方法,包括:S1.创建语言模型,建立细胞词库;S2.在所述细胞词库中切词检索细胞词,并排列所述细胞词;S3.利用决策树模型的决策分类,给出维修解决方案。
优选方式下,所述S1包含步骤:S1.1采集专业故障描述语言;S1.2对所述专业故障描述语言进行词向量分解。所述语言模型的创建基于第n个所述细胞词的出现只与前面n-1个所述细胞词相关的假设;所述一故障描述语句T出现权重的计算公式为:
P(T)=P(w1,w2,w3,…,wn)
=P(w1)×P(w2|w1)×P(w3|w1,w2)×…×P(wn|w1,w2,…,wn-1)
≈P(w1)×P(w2|w1)×P(w3|w2)…P(wn|wn-1);
其中,P(T)为所述故障描述语句T的权重,P(wn|w1,w2,…,wn-1)为第n个词向量的权重。
进一步地,所述S2包含步骤:S2.1针对所述一故障描述语句T在所述细胞词库中进行切词检索;S2.2若检索到所述细胞词,计算所述细胞词的权重;S2.3按照所述细胞词权重的大小排列所述细胞词。所述步骤S3包含:S3.1结合元器件测量值给出维修解决方案。
更进一步地,所述S2包含步骤:S2.4若没有检索到所述细胞词,则将此次未检索到的所述细胞词存入新增细胞词库。
更进一步地,所述S2.2步骤中所述细胞词权重的计算方法为:S2.2.1计算每个所述细胞词的卡方统计量;S2.2.2取所述卡方统计量分值最高的第i个细胞词,计算所述第i个细胞词在第j个故障描述中出现的次数。所述S2.2.1步骤所述卡方统计量分值的计算方法为:
weight=round(10×(1+lg(tfij))/(1+lg(lj)));
其中tfij为第i个细胞词在第j个故障描述中出现的次数,lj为第j个故障描述的长度。
本发明还保护一种用于如权利要求1-8中任一权利要求所述的方法的故障远程诊断系统,包括:故障信息接收单元,用于接收所述一故障描述语句T;故障信息分析单元,用于在所述细胞词库中切词检索所述细胞词,并排列所述细胞词;故障信息解决单元,用于通过决策树模型的决策分类,给出维修解决方案。
进一步地,所述故障信息分析单元包含故障描述语句分解单元,检索单元,计算单元以及排列单元;
所述语句分解单元用于对所述一故障描述语句T在所述细胞词库中进行切词;
所述检索单元用于在所述细胞词库中检索;
所述计算单元用于计算每个所述细胞词的权重;
所述排列单元用于按所述句法规则排列所述细胞词。
本发明的优点和积极效果是:可以远程并快速地识别设备的故障,准确的给出有效维修解决方案。检测标准统一,避免由于人工判断带来的误差。并且节省了大量人力物力。
附图说明
图1为本发明的构建句法规则图;
图2为决策树分析法分类模型1;
图3为决策树分析法分类模型2。
具体实施方式
下面结合附图、通过具体实施例对本发明作进一步详述。以下实施例只是描述性的,不是限定性的,不能以此限定本发明的保护范围。
本发明通过将自然语言数字化达成将自然语言理解的问题转化为机器自学习的问题。
(1)构建基础语料库
创建基础语料库的方法为给定一个字符串,它的自然语言的概率是P(w1,w2,w3,…,wn),w1到wn依次是这句话的各个细胞词。
模型基于这样一种假设,第n个词的出现只与前面n-1个词相关,而与其它任何词都不相关,整句的概率就是各个分词出现概率的乘积。
对于一个故障描述T,它的概率计算公式为:
P(T)=P(w1,w2,w3,…,wn)
=P(w1)×P(w2|w1)×P(w3|w1,w2)×…×P(wn|w1,w2,…,wn-1)
≈P(w1)×P(w2|w1)×P(w3|w2)…P(wn|wn-1)
(2)词向量分解:词向量为切分成若干个细胞词后的语句。每个故障描述T都可表示成n维的词向量,T=(w1,w2,...,wn),其中w1到wn为各个词向量中包含的各个细胞词。
以汽车故障为例:
故障描述为:
以词向量表示上述故障描述语句,上述故障描述语句可以用词向量(w1,w2,w3,…,wn)。其中,w1为凸轮轴,w2为位置,w3为气缸,w4为正时,w5为过度。选取各个细胞词作为特征项,其中wi表示第i个特征项。
算出各个细胞词的卡方统计量,然后在训练集中取分值最高的第i个细胞词作为代表词,从而找出与词向量(w1,w2,w3,…,wn)相关性最小的细胞词。
wi的权重的计算公式为:
weight=round((10×(1+lg(tfij))/(1+lg(lj))),3);
其中tfij为第i个词向量在第j个故障描述中出现的次数,lj为第j个故障描述的长度。Round函数四舍五入到指定的小数位,在上式中为小数点后第三位。
计算权重之后的故障描述词向量的特征表述为:
向量分词 权重
凸轮轴 0.286
位置 0.191
气缸 0.048
正时 0.048
过度 0.048
实施例1
(1)检索排列细胞词:
如图1所示,当用户输入故障描述T后,首先对故障描述T进行词向量分解将完整语句切分成多个细胞词的组合。然后针对各个细胞词,在细胞词库中进行切词检索。如果检索到了,则计算该细胞词的权重;如果没有检索到,则将此次未检索到的细胞词存入新增行业细胞词库,再针对剩余细胞词进行检索,计算其概率。
根据在细胞词库中检索到的各个细胞词并计算权重,按照权重从大到小排列细胞词。
(2)分析结果:
以汽车故障为例:
故障描述为:
在细胞词库中检索到的各个细胞词并计算权重,按照权重从大到小排列细胞词:
特征项 权重
凸轮轴 0.286
位置 0.191
促动器 0.095
传感器 0.048
转换 0.048
响应 0.048
过度 0.048
电路 0.048
气缸 0.048
调节 0.048
排气 0.048
正时 0.048
使用判别分析法:
故障描述T的词向量序列为T=(w1,w2,w3,...,wn),故障描述T中每个细胞词计算权重后的序列为S=(s1,s2,s3,...,sn)。词向量分类匹配最大概率的计算公式为:W=argmaxP(S|T)。
按照词向量分类匹配最大概率从高到低排列的句法规则进行分级:
分类 规则
一级 凸轮轴
二级 位置
三级 正时
(4)决策树分析
根据上述句法规则针对细胞词分级的结果建立决策树。
分类模型1
如图2所示,凸轮轴为一级,位置、转换、调节为二级,传感器、促动器、响应、正时、排气为三级。相对应的解决方案分别是:传感器对应凸轮轴位置传感器、发动机线束和发动机控制单元,促动器对应发动机线束、发动机控制单元和凸轮轴调节器,正时对应发动机线束、发动机控制单元、凸轮轴调节器、凸轮轴张紧器和正时链条,以此类推。粗箭头指向的解决方案表示需要更换此配件的概率远大于更换其他细箭头指向的配件的概率,此概率为根据大量维修数据而预先设定入决策树模型中的。因此,通过对故障描述“凸轮轴位置(气缸列2)-正时过度超前”进行词向量分解并在细胞词库中进行检索,得到凸轮轴、位置和正时三个细胞词,经计算细胞词权重并根据句法规则对细胞词进行排列得出凸轮轴位于一级,位置位于二级,正时位于三级。经过决策树模型的决策分类,得出最有可能的维修解决方案为更换或维修凸轮轴张紧器。
分类模型2
如图3所示,对故障描述语句“凸轮轴位置传感器=>传感器不可信信号”进行词向量分解并在细胞词库中检索,得到凸轮轴、位置、传感器三个细胞词。针对三个细胞词计算细胞词权重并根据句法规则对细胞词进行排列得出凸轮轴位于一级,位置位于二级,传感器位于三级。再结合元器件测量值,判断需要更换的配件。首先检查电线插头有无接触不良,针头弯曲。如果是,则需要更换电线插头。如果否,则进入下一级决策树,检查凸轮轴传感器电压供应是否在4.5-5.5V之间。如果是则检查发动机控制单元的信号电压,是否在4.5-5.5V之间。如果否则需要更换发动机线束。以此类推,经过决策树模型的决策分类结合元器件测量值,给出维修解决方案。

Claims (7)

1.一种故障远程诊断方法,其特征在于,包括:
S1.创建语言模型,建立细胞词库;
S2.在所述细胞词库中切词检索细胞词,并排列所述细胞词;
S3.利用决策树模型的决策分类,给出维修解决方案;
所述S1包含步骤:
S1.1采集专业故障描述语言;
S1.2对所述专业故障描述语言进行词向量分解;
所述语言模型的创建基于第n个所述细胞词的出现只与前面n-1个所述细胞词相关的假设;一故障描述语句T出现权重的计算公式为:
P(T)=P(w1,w2,w3,…,wn)=P(w1)×P(w2|w1)×P(w3|w1,w2)×…×P(wn|w1,w2,…,wn-1)≈P(w1)×P(w2|w1)×P(w3|w2)…P(wn|wn-1);
其中,P(T)为所述故障描述语句T的权重,P(wn|w1,w2,…,wn-1)为第n个所述细胞词的权重;故障描述T中每个细胞词计算权重后的序列为S=(s1,s2,s3,...,sn);词向量分类匹配最大概率的计算公式为:
W=argmaxP(S|T);S为故障描述T中每个细胞词计算权重后的序列,W为词向量分类匹配最大概率;
所述S2包含步骤:
S2.1针对一故障描述语句T在所述细胞词库中进行切词检索;
S2.2若检索到所述细胞词,计算所述细胞词的权重;
S2.3按照所述细胞词权重的大小排列所述细胞词;
所述S3决策树模型包括分类模型1和分类模型2;
所述分类模型1为:设有凸轮轴为一级,位置、转换、调节为二级,传感器、促动器、响应、正时、排气为三级;对应的解决方案为:传感器对应凸轮轴位置传感器、发动机线束和发动机控制单元,促动器对应发动机线束、发动机控制单元和凸轮轴调节器,正时对应发动机线束、发动机控制单元、凸轮轴调节器、凸轮轴张紧器和正时链条;通过对故障描述“凸轮轴位置-正时过度超前”进行词向量分解并在细胞词库中进行检索,得到凸轮轴、位置和正时三个细胞词,经计算细胞词权重并根据句法规则对细胞词进行排列得出凸轮轴位于一级,位置位于二级,正时位于三级;经过决策树模型的决策分类,得出维修解决方案为更换或维修凸轮轴张紧器;
所述分类模型2为:对故障描述语句“凸轮轴位置传感器=>传感器不可信信号”进行词向量分解并在细胞词库中检索,得到凸轮轴、位置、传感器三个细胞词;针对三个细胞词计算细胞词权重并根据句法规则对细胞词进行排列得出凸轮轴位于一级,位置位于二级,传感器位于三级;结合元器件测量值,判断需要更换的配件;首先检查电线插头有无接触不良,针头弯曲;如果是,则更换电线插头;如果否,则进入下一级决策树,检查凸轮轴传感器电压供应是否在4.5-5.5V之间;如果是则检查发动机控制单元的信号电压,是否在4.5-5.5V之间;如果否则更换发动机线束。
2.根据权利要求1所述的一种故障远程诊断方法,其特征在于,所述S2包含步骤:
S2.4若没有检索到所述细胞词,则将此次未检索到的所述细胞词存入新增细胞词库。
3.根据权利要求1所述的一种故障远程诊断方法,其特征在于,所述S2.2步骤中所述细胞词权重的计算方法为:
S2.2.1计算每个所述细胞词的卡方统计量;
S2.2.2取所述卡方统计量分值最高的第i个细胞词,计算所述第i个细胞词在第j个故障描述中出现的次数。
4.根据权利要求3所述的一种故障远程诊断方法,其特征在于,所述S2.2.1步骤所述卡方统计量分值的计算方法为:
weight=round((10×(1+lg(tfij))/(1+lg(lj))),n);
其中tfij为第i个细胞词在第j个故障描述中出现的次数,lj为第j个故障描述的长度,weight为权重,n为3-6的整数。
5.根据权利要求1所述的一种故障远程诊断方法,其特征在于,所述步骤S3包含:
S3.1结合元器件测量值给出维修解决方案。
6.一种用于如权利要求1-5中任一权利要求所述的方法的故障远程诊断系统,其特征在于,包括:
故障信息接收单元,用于接收所述一故障描述语句T;
故障信息分析单元,用于在所述细胞词库中切词检索所述细胞词,并排列所述细胞词;
故障信息解决单元,用于通过决策树模型的决策分类,给出维修解决方案。
7.根据权利要求6所述的一种故障远程诊断系统,其特征在于:所述故障信息分析单元包含故障描述语句分解单元,检索单元,计算单元以及排列单元;
所述语句分解单元用于对所述一故障描述语句T在所述细胞词库中进行切词;
所述检索单元用于在所述细胞词库中检索;
所述计算单元用于计算每个所述细胞词的权重;
所述排列单元用于按所述句法规则排列所述细胞词。
CN201610364254.0A 2016-05-27 2016-05-27 基于维修决策树/词向量的故障远程诊断系统和方法 Active CN106055439B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610364254.0A CN106055439B (zh) 2016-05-27 2016-05-27 基于维修决策树/词向量的故障远程诊断系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610364254.0A CN106055439B (zh) 2016-05-27 2016-05-27 基于维修决策树/词向量的故障远程诊断系统和方法

Publications (2)

Publication Number Publication Date
CN106055439A CN106055439A (zh) 2016-10-26
CN106055439B true CN106055439B (zh) 2019-09-27

Family

ID=57175615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610364254.0A Active CN106055439B (zh) 2016-05-27 2016-05-27 基于维修决策树/词向量的故障远程诊断系统和方法

Country Status (1)

Country Link
CN (1) CN106055439B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109240258A (zh) * 2018-07-09 2019-01-18 上海万行信息科技有限公司 基于词向量的汽车故障智能辅助诊断方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102200487A (zh) * 2010-03-24 2011-09-28 通用汽车环球科技运作有限责任公司 用于机动车系统的事件驱动故障诊断架构
CN103106275A (zh) * 2013-02-08 2013-05-15 西北工业大学 基于特征分布信息的文本分类特征筛选方法
CN104408095A (zh) * 2014-11-15 2015-03-11 北京广利核系统工程有限公司 一种基于改进的knn文本分类方法
CN105045256A (zh) * 2015-07-08 2015-11-11 北京泰乐德信息技术有限公司 基于数据对比分析的轨道交通实时故障诊断方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8676432B2 (en) * 2010-01-13 2014-03-18 GM Global Technology Operations LLC Fault prediction framework using temporal data mining

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102200487A (zh) * 2010-03-24 2011-09-28 通用汽车环球科技运作有限责任公司 用于机动车系统的事件驱动故障诊断架构
CN103106275A (zh) * 2013-02-08 2013-05-15 西北工业大学 基于特征分布信息的文本分类特征筛选方法
CN104408095A (zh) * 2014-11-15 2015-03-11 北京广利核系统工程有限公司 一种基于改进的knn文本分类方法
CN105045256A (zh) * 2015-07-08 2015-11-11 北京泰乐德信息技术有限公司 基于数据对比分析的轨道交通实时故障诊断方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于文本分类和SVM 的雷达侦察装备故障诊断研究;仝奇;《电光与控制》;20160228;第23卷(第2期);第94-98页 *

Also Published As

Publication number Publication date
CN106055439A (zh) 2016-10-26

Similar Documents

Publication Publication Date Title
CN106054858B (zh) 基于决策树分类和故障码分类的车辆远程诊断与备件检索的方法
US11593763B2 (en) Automated electronic mail assistant
Muir et al. Alternative partitioning of the genotype-by-environment interaction
Zhu et al. Analysis of cytoplasmic and maternal effects I. A genetic model for diploid plant seeds and animals
CN111427775B (zh) 一种基于Bert模型的方法层次缺陷定位方法
CN110175324B (zh) 一种基于数据挖掘的电网运行操作指令校验方法及系统
CN108304567A (zh) 高压变压器工况模式识别与数据分类方法及系统
CN109389418A (zh) 基于lda模型的供电服务客户诉求识别方法
CN109672406A (zh) 一种基于稀疏表示和svm的光伏发电阵列故障诊断与分类的方法
KR20210075511A (ko) 재난대응 추천방법 및 그 장치
CN106095785A (zh) 基于决策树分类的故障码诊断车辆工项与备件检索方法
CN106054857A (zh) 基于维修决策树/词向量的故障远程诊断平台
CN112199496A (zh) 基于多头注意力机制与rcnn网络的电网设备缺陷文本分类方法
CN106055439B (zh) 基于维修决策树/词向量的故障远程诊断系统和方法
CN113434688A (zh) 用于舆情分类模型训练的数据处理方法和装置
CN111737035A (zh) 一种基于服务器日志的故障诊断方法与系统
CN105894747A (zh) 一种基于监控专家知识库的告警信号处置决策建议方法
CN107679159B (zh) 故障诊断类问题答复的生成方法、装置、服务器及存储介质
CN111330871B (zh) 一种品质分类方法及装置
CN113064976A (zh) 基于深度学习算法的事故车判定方法
CN107392506A (zh) 一种融合移动互联网技术的自学线路状态评价系统及评价方法
CN116068305A (zh) 一种电弧铣削机床电气系统故障诊断装置
EP3451101A1 (de) Verfahren zum bestimmen einer fehlerursache eines fehlers in einer fahrzeugkomponente
Garcia et al. Evaluation of longevity modeling censored records in Nellore
Pan et al. UMUTeam at PoliticIT-EVALITA2023: Evaluating Transformer Model for Detecting Political Ideology in Italian Texts

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant