CN105117771A - 一种基于关联规则有向无环图的农机故障识别方法 - Google Patents

一种基于关联规则有向无环图的农机故障识别方法 Download PDF

Info

Publication number
CN105117771A
CN105117771A CN201510449582.6A CN201510449582A CN105117771A CN 105117771 A CN105117771 A CN 105117771A CN 201510449582 A CN201510449582 A CN 201510449582A CN 105117771 A CN105117771 A CN 105117771A
Authority
CN
China
Prior art keywords
territory
fault
data
directed acyclic
acyclic graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510449582.6A
Other languages
English (en)
Other versions
CN105117771B (zh
Inventor
胡耀光
郭政杰
闻敬谦
刘宇佶
肖沙沙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201510449582.6A priority Critical patent/CN105117771B/zh
Publication of CN105117771A publication Critical patent/CN105117771A/zh
Application granted granted Critical
Publication of CN105117771B publication Critical patent/CN105117771B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种基于关联规则有向无环图的农机故障识别方法,能够提高农机故障数据的分类准确率,具有快速匹配,能够自增长的特点。首先从历史故障维修数据中提取故障环境信息、故障类型信息以及故障处理信息,每一故障数据用一条事务来表示,得到故障维修数据集对应的事务集,针对每一条事务建立其对应的一条或多条关联规则,得到该条事务的关联规则集;然后再利用有向无环图结构,将所述关联规则集组合成为由故障环境信息、故障类型信息和故障处理信息的一种有向无环图;最后在有新的故障信息进入系统后,采用有向无环图的搜索方式,通过输入故障环境信息,最终得到能够知道维修的故障处理信息。

Description

一种基于关联规则有向无环图的农机故障识别方法
技术领域
本发明涉及一种农机故障识别方法,尤其是针对利用历史故障数据和实时工况数据进行数据挖掘的农机装备故障识别方法。
背景技术
随着现代化农业的不断发展,用于农业生产的农机数量在不断增加,而且农机作业区域也越来越广。对于农机来说,其作业具有跨地区,远距离,野外作业等特点。在农机使用过程中发生农机故障时,通常是人工联系维修服务中心,由服务中心安排服务网点派出维修技术人员到农机故障现场进行技术服务。由于技术人员通常无法事先得知农机故障的准确原因,技术人员到达农机故障现场进行技术服务时往往并不能一次性带齐检测故障或维修所使用的工具或者配件,这样导致技术人员在故障现场准确得知农机故障的原因后,可能需要重新折回维修服务网点,甚至需要多个回合才能解决故障,使得工作量大,效率低下。特别是,在人工联系的维修服务网点与农机故障现场距离较远时,效率低下的特征就表现得尤为明显;并且还可能会因为农机故障不能及时排除,使得小故障造成大损失,耗时耗钱且影响农业生产活动(如抢收抢种)。
在过往的维修历史中,会保存有大量的维修历史记录,在该历史记录中会有与故障相关的很多信息。这些故障相关信息的背后蕴含着大量可以用来进行故障匹配以及故障处理相关的指导意见。关联分析用于发现隐藏在大型数据集中具有利用价值的联系,所发现的模式通常用关联规则的形式表示。关联规则是形如X->Y的蕴含表达式,其中X和Y是不相交的项集。关联规则挖掘的经典应用是购物篮分析,目的是发现客户在商品选购之间的联系,在这个领域关联分析有很好的效果。农机发生故障的影响因素有很多,同时这些影响因素对故障造成的影响很难一目了然地找到,因此就需要使用关联分析用于找出这些影响故障发生的因素。
目前在实际应用中,由于大量数据挖掘得出的关联规则相对复杂,并且这些规则之间的关系在规则结构上难以直接体现,所以在基于关联规则进行故障匹配就会非常繁琐,当数据量很大的情况下,粗暴地逐条匹配的时间复杂度会非常高,这导致规则的应用效率低下。
出于以上的目的,就需要构建一种关联规则的应用模型,使得规则可以高效得使用。通过构建故障关联规则库模型,为后续的规则匹配进行基础准备,规则匹配的功能是通过对规则库模型的搜索来完成的。在本技术中,故障关联规则库模型是由故障环境信息、故障类型信息以及故障处理信息等信息构成的一种图状结构,系统通过对该图状结构的搜索,来找到相应故障环境信息所对应的故障处理方法,从而完成从故障现象到故障处理的推理过程。
发明内容
为了快速匹配农机故障的类型以及得出相应的解决方案,提高农机运维的效率,本发明提出了一种基于关联规则有向无环图的农机故障识别方法,能够提高农机故障数据的分类准确率,具有快速匹配,能够自增长的特点。
为了实现上述目的,本发明提出的一种基于关联规则有向无环图的农机故障识别方法,首先从历史故障维修数据中提取故障环境信息、故障类型信息以及故障处理信息,每一故障数据用一条事务来表示,得到故障维修数据集对应的事务集,针对每一条事务建立其对应的一条或多条关联规则,得到该条事务的关联规则集;然后再利用有向无环图结构,将所述关联规则集组合成为由故障环境信息、故障类型信息和故障处理信息的一种有向无环图;最后在有新的故障信息进入系统后,采用有向无环图的搜索方式,通过输入故障环境信息,最终得到能够知道维修的故障处理信息。
本发明的有益效果:可以实现利用历史数据和实时状态数据进行规则挖掘,得到能够有益于指导维修的关联规则,并且有新的故障需求后,通过搜索已经构建好的关联规则有向无环图,最终得到该故障对应的故障处理方法。整个过程能够减少运维过程中大量的资源浪费,得到有针对性的维修策略。
附图说明
图1为本发明基于关联规则有向无环图的农机故障识别方法流程图;
图2为本发明中对每一个结点进行存储的形式示意图;
图3为本发明中作为单链表的邻接点来存储的示意图;
图4为本发明中故障规则有向无环图构建流程图;
图5为本发明中故障规则有向无环图匹配流程图。
具体实施方式
步骤1:关联规则挖掘过程
本发明中,主要采用关联规则挖掘的方法,利用目前已知的历史维修数据,来寻找故障情况与机械工作环境、工作状态、时间、地域等特征之间的关系。得到这些关联规则之后,希望建立一种规则应用模式,有效地通过输入机械的各种信息来对农机进行故障诊断并给出农机维修方式、维修时机等决策支持。总体过程如图1所示。
1)数据准备。在本发明中,知识的初始来源是农机索赔单的记录,而在这些记录中,存在大量不同种类的字段,这些字段存在大量的噪声以及不完整等情况,我们需要在规则发现之前对数据进行预处理,提高数据质量,使之符合算法的规范和要求。另外,我们需要对原始数据进行初步的操作,将其中表达同一内容的字段分类、整合,并将其中的长段中文信息,利用中文分词进行处理,并且生成自定义词典以达到更好的分词效果。
2)挖掘实施。本研究中,对目前主流的Apriori算法进行,利用这种关联规则挖掘算法对已经处理好的原始数据进行数据挖掘。挖掘实施涉及两个过程:频繁项集生成以及强关联规则生成。在这两个过程中,前者是影响整个算法执行效率最大的过程。
通过构建故障规则库,为后续的规则匹配进行基础准备,规则匹配的功能是通过对规则库的搜索来完成的。在该研究中,故障规则库是由故障环境信息、故障类型信息以及故障处理信息等构成的图状结构,系统通过对该图状结构的搜索,来找到相应故障环境信息对应的故障处理方法,从而完成从故障现象到故障处理的推理过程。
步骤2:故障规则有向无环图基本结构
其中,故障环境信息包括但不限于以下类型:产品基本信息(车型,车辆购买时间,地理位置等)、用户基本信息(联系人,电话,地址等)、故障现场描述等信息。故障类型信息包括但不限于以下类型:故障零部件、故障现象名称等信息。故障处理信息包括但不限于以下类型:处理意见或措施等信息。
在该规则库构建过程中所采用的关联规则主要分为两种:1、形式为{故障环境信息}→{故障类型信息};2、形式为{故障类型信息}→{故障处理信息}。故障环境信息:a1,a2,a3,故障类型信息:b1,b2,故障处理信息:c1,c2,c3。我们通过关联规则挖掘得到的规则有:{1、a1,a2,a4b1,2、a2b2,3、a3b3,4、b1c1,5、b2c3,6、b3c2}
步骤3:故障规则有向无环图存储结构
关于该故障规则图的存储结构采用邻接表的形式,对每一个结点进行存储。其存储形式如图2所示。
其中,左侧部分为一个一维数组,该数组存储所有图中顶点,其中的c类结点也就是故障处理信息结点是整个故障匹配的所要得出的结果,所以c类结点不存在后续结点,所以在该一维数组中就不存放该类结点。右侧部分每个顶点与其所有的邻接点构成一个线性表,由于邻接点个数不定,所以使用单链表来进行存储,同时存储结构体现了该图的有向性。
对于每一个顶点来说,它是由data域和firstedge域组成,data域是数据域,用于存储顶点的信息,firstedge域是指针域,用于指向单链表的第一个结点,也就是其第一个邻接点。单链表结点由data域,sup域,conf域和next域组成。data域是数据域,存储该邻接点的信息,sup域是支持度域,存储{顶点→邻接点}规则的支持度,conf域为置信度域,存储{顶点→邻接点}规则的置信度,next则存储指向单链表中指向下一个邻接点的指针。
在该存储结构中,存在两种可用的存储结构:1、邻接表,2、逆邻接表。之前描述的是邻接表的存储形式。逆邻接表的存储与邻接表的存储方式正好相反,它是把结点的初始点(initialnode)作为单链表的邻接点来存储,其存储形式如图3所示;
逆邻接表与邻接表的区别是,逆邻接表的每个单链表存储了每个结点的入度以及其初始点(initialnode)集合,例如,在上面的例子中,我们可以发现b1的初始点集合为{a1,a2,a4}。而邻接表的每一个单链表存储了该结点的出度以及其终端点(terminalnode)集合,例如,在上面的例子中,a1的终端点集合为{b1},a2的终端点集合为{b1,b2}。
关于两种存储结构的比较,主要是在有向无环图匹配中体现出差异,这部分内容,我们将在故障规则有向无环图匹配部分着重分析。
步骤4:故障规则有向无环图构建
输入:关联规则
输出:故障规则库
流程逻辑:
流程描述:
1、开始:接收添加规则A→B的任务。
2、在故障规则有向无环图中的顶点集中查找data域等于A的结点。如果不存在data域等于A的结点,那么在顶点集中添加该结点,并将其firstedge域指向B构成的邻接点,该邻接点的data域为B,sup域和conf域为规则A→B的支持度和置信度,next域设为null。
3、如果存在data域等于A的顶点,那么遍历其后继的单链表,在其中寻找data域等于B的邻接点。如果该邻接点不存在,则将该单链表的最后一个邻接点的next域由null改为指向一个邻接点,该邻接点的data域为B,sup域和conf域为规则A→B的支持度和置信度,next域设为null。
4、如果存在data域等于B的邻接点,那么将该邻接点的sup域和conf域更新为规则A→B的支持度和置信度,整个流程结束。
步骤5:故障规则有向无环图匹配
在规则库的应用中,需要根据故障需求信息对故障现象进行提取,并判断故障现象是否为知识库中标准的故障现象,如果是,则进行故障现象输入,否则现将故障现象标准化,即将现象描述转换成规则库中识别的故障现象,再进行故障现象输入。
输入故障现象,在链表中进行“故障现象→故障原因”检索,将搜索到的故障现象与故障原因进行遍历,判断是否存在不同的故障现象导出的同样的故障原因,若存在,则在链表中进行“故障原因→故障处理”检索,最后输出“故障现象→故障原因→故障处理”的结果,否则根据概率公式计算不同故障现象导出相同故障原因的概率。
输入:故障现象
输出:匹配规则(故障现象→故障原因→故障处理)
逻辑流程:按照故障维修任务单标准化故障现象a1a2……an,进行故障现象输入。在故障规则有向无环图中的顶点集中查找data域等于an的结点,并保存每个an和其后继点bn和其sup域的置信度。比较每个an是否有相同的后继点。如果有相同后继点,则在故障规则有向无环图中的顶点集中查找data域等于bn的结点,并保存其后继点cn;如果没有相同后继点,则计算bn同时出现在每个an后继点的概率,并根据计算出的概率进行排列,选取概率较大的前三个bn在故障规则有向无环图中的顶点集中遍历查找data域为每个bn的结点,并保存其后继点cn。输出最后的搜索结果:“an→bn→cn”。

Claims (5)

1.一种基于关联规则有向无环图的农机故障识别方法,其特征在于:首先从历史故障维修数据中提取故障环境信息、故障类型信息以及故障处理信息,每一故障数据用一条事务来表示,得到故障维修数据集对应的事务集,针对每一条事务建立其对应的一条或多条关联规则,得到该条事务的关联规则集;然后再利用有向无环图结构,将所述关联规则集组合成为由故障环境信息、故障类型信息和故障处理信息的一种有向无环图;最后在有新的故障信息进入系统后,采用有向无环图的搜索方式,通过输入故障环境信息,最终得到能够知道维修的故障处理信息。
2.如权利要求1所述的一种基于关联规则有向无环图的农机故障识别方法,其特征在于:从历史故障维修数据中提取信息前进行初步数据处理操作,将其中表达同一内容的字段分类、整合,并将其中的长段中文信息,利用中文分词进行处理,并且生成自定义词典以达到更好的分词效果。
3.如权利要求1或2所述的一种基于关联规则有向无环图的农机故障识别方法,其特征在于:所述的有向无环图存储结构采用邻接表的形式,对每一个结点进行存储。
4.如权利要求3所述的一种基于关联规则有向无环图的农机故障识别方法,其特征在于:对于每一个顶点来说,由data域和firstedge域组成,data域是数据域,用于存储顶点的信息,firstedge域是指针域,用于指向单链表的第一个结点,也就是其第一个邻接点;单链表结点由data域,sup域,conf域和next域组成;data域是数据域,存储该邻接点的信息,sup域是支持度域,存储{顶点→邻接点}规则的支持度,conf域为置信度域,存储{顶点→邻接点}规则的置信度,next则存储指向单链表中指向下一个邻接点的指针。
5.如权利要求4所述的一种基于关联规则有向无环图的农机故障识别方法,其特征在于:构建有向无环图采用以下方法:
(1)开始:接收添加规则A→B的任务;
(2)在故障规则有向无环图中的顶点集中查找data域等于A的结点,如果不存在data域等于A的结点,那么在顶点集中添加该结点,并将其firstedge域指向B构成的邻接点,该邻接点的data域为B,sup域和conf域为规则A→B的支持度和置信度,next域设为null;
(3)如果存在data域等于A的顶点,那么遍历其后继的单链表,在其中寻找data域等于B的邻接点,如果该邻接点不存在,则将该单链表的最后一个邻接点的next域由null改为指向一个邻接点,该邻接点的data域为B,sup域和conf域为规则A→B的支持度和置信度,next域设为null;
(4)如果存在data域等于B的邻接点,那么将该邻接点的sup域和conf域更新为规则A→B的支持度和置信度,整个流程结束。
CN201510449582.6A 2015-07-28 2015-07-28 一种基于关联规则有向无环图的农机故障识别方法 Expired - Fee Related CN105117771B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510449582.6A CN105117771B (zh) 2015-07-28 2015-07-28 一种基于关联规则有向无环图的农机故障识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510449582.6A CN105117771B (zh) 2015-07-28 2015-07-28 一种基于关联规则有向无环图的农机故障识别方法

Publications (2)

Publication Number Publication Date
CN105117771A true CN105117771A (zh) 2015-12-02
CN105117771B CN105117771B (zh) 2017-10-20

Family

ID=54665754

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510449582.6A Expired - Fee Related CN105117771B (zh) 2015-07-28 2015-07-28 一种基于关联规则有向无环图的农机故障识别方法

Country Status (1)

Country Link
CN (1) CN105117771B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056222A (zh) * 2016-05-27 2016-10-26 大连楼兰科技股份有限公司 基于FP‑Tree序列模式挖掘的故障诊断与估价的方法
CN106096736A (zh) * 2016-05-27 2016-11-09 大连楼兰科技股份有限公司 基于FP‑Tree序列模式挖掘的故障诊断与估价的平台
CN109245910A (zh) * 2017-07-10 2019-01-18 中兴通讯股份有限公司 识别故障类型的方法及装置
CN109272285A (zh) * 2018-08-23 2019-01-25 合肥好多帮信息科技有限公司 一种基于远程通信的智能报修方法
CN109426610A (zh) * 2017-08-30 2019-03-05 中车株洲电力机车研究所有限公司 一种vxWorks系统下的故障诊断方法
CN111552843A (zh) * 2020-04-23 2020-08-18 中国电子科技集团公司第五十四研究所 一种基于加权因果依赖图的故障预测方法
CN116612552A (zh) * 2023-07-17 2023-08-18 北京经纬物联科技有限公司 基于物联网的农业机械生产用智能监测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009301447A (ja) * 2008-06-17 2009-12-24 Nec Corp 情報処理装置
WO2013035680A1 (ja) * 2011-09-05 2013-03-14 日本電気株式会社 データ処理装置、条件付関数従属性ルール統合方法及びプログラム
CN103077447A (zh) * 2013-01-24 2013-05-01 华中科技大学 一种基于贝叶斯网络的地铁施工安全管理决策方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009301447A (ja) * 2008-06-17 2009-12-24 Nec Corp 情報処理装置
WO2013035680A1 (ja) * 2011-09-05 2013-03-14 日本電気株式会社 データ処理装置、条件付関数従属性ルール統合方法及びプログラム
CN103077447A (zh) * 2013-01-24 2013-05-01 华中科技大学 一种基于贝叶斯网络的地铁施工安全管理决策方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
康建东等: ""基于数据挖掘的电网故障诊断研究"", 《测试工具与解决方案》 *
徐翔斌: ""基于本体自主学习的农机故障诊断专家系统开发"", 《机床与液压》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056222A (zh) * 2016-05-27 2016-10-26 大连楼兰科技股份有限公司 基于FP‑Tree序列模式挖掘的故障诊断与估价的方法
CN106096736A (zh) * 2016-05-27 2016-11-09 大连楼兰科技股份有限公司 基于FP‑Tree序列模式挖掘的故障诊断与估价的平台
CN106056222B (zh) * 2016-05-27 2020-03-24 大连楼兰科技股份有限公司 基于FP-Tree序列模式挖掘的故障诊断与估价的方法
CN106096736B (zh) * 2016-05-27 2020-03-24 大连楼兰科技股份有限公司 基于FP-Tree序列模式挖掘的故障诊断与估价的平台
CN109245910A (zh) * 2017-07-10 2019-01-18 中兴通讯股份有限公司 识别故障类型的方法及装置
CN109426610A (zh) * 2017-08-30 2019-03-05 中车株洲电力机车研究所有限公司 一种vxWorks系统下的故障诊断方法
CN109272285A (zh) * 2018-08-23 2019-01-25 合肥好多帮信息科技有限公司 一种基于远程通信的智能报修方法
CN111552843A (zh) * 2020-04-23 2020-08-18 中国电子科技集团公司第五十四研究所 一种基于加权因果依赖图的故障预测方法
CN111552843B (zh) * 2020-04-23 2023-03-31 中国电子科技集团公司第五十四研究所 一种基于加权因果依赖图的故障预测方法
CN116612552A (zh) * 2023-07-17 2023-08-18 北京经纬物联科技有限公司 基于物联网的农业机械生产用智能监测方法及系统
CN116612552B (zh) * 2023-07-17 2023-09-29 北京经纬物联科技有限公司 基于物联网的农业机械生产用智能监测方法及系统

Also Published As

Publication number Publication date
CN105117771B (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
CN105117771A (zh) 一种基于关联规则有向无环图的农机故障识别方法
CN103020302B (zh) 基于复杂网络的学术核心作者挖掘及相关信息抽取方法和系统
US20190331484A1 (en) Movement line information generation system, movement line information generation method and movement line information generation program
CN102236663B (zh) 一种基于垂直搜索的查询方法、系统和装置
CN105306475B (zh) 一种基于关联规则分类的网络入侵检测方法
Yang et al. A system architecture for manufacturing process analysis based on big data and process mining techniques
CN109815952A (zh) 品牌名称识别方法、计算机装置及计算机可读存储介质
CN105760443B (zh) 项目推荐系统、项目推荐装置以及项目推荐方法
CN107844565A (zh) 商品搜索方法和装置
CN107111610A (zh) 用于神经语言行为识别系统的映射器组件
CN104731953A (zh) 一种基于r的数据预处理系统的构建方法
CN105574541A (zh) 一种基于紧密度排序的网络社区发现方法
CN104598766A (zh) 面向油气储层综合评价的空间案例推理方法
CN109559156A (zh) 基于客户属性及营销数据的客户意向有监督预测方法
CN109710599A (zh) 一种基于知识图谱的群体划分方法及装置
Maisikeli et al. Aspect mining using self-organizing maps with method level dynamic software metrics as input vectors
CN113254517A (zh) 一种基于互联网大数据的服务提供方法
Zhong et al. A big data cleansing approach for n-dimensional RFID-Cuboids
Anand et al. When worlds collide: Combining ordnance survey and open street map data
CN104794234B (zh) 用于同业对标的数据处理方法和装置
CN117972111A (zh) 一种基于在线图处理技术面向知识图谱的知识推理方法
CN105069003A (zh) 一种基于转发链相似度的用户关注对象推荐计算方法
Bashir et al. Matlab-based graphical user interface for IOT sensor measurements subject to outlier
Aung et al. Interactive traceability links visualization using hierarchical trace map
Speranza et al. A cluster-based approach to support the delineation of management zones in precision agriculture

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171020