CN111103157A - 一种基于生物启发频繁项集挖掘的工业设备状态监测方法 - Google Patents

一种基于生物启发频繁项集挖掘的工业设备状态监测方法 Download PDF

Info

Publication number
CN111103157A
CN111103157A CN201911174340.5A CN201911174340A CN111103157A CN 111103157 A CN111103157 A CN 111103157A CN 201911174340 A CN201911174340 A CN 201911174340A CN 111103157 A CN111103157 A CN 111103157A
Authority
CN
China
Prior art keywords
frequent item
frequent
current population
individuals
population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911174340.5A
Other languages
English (en)
Inventor
赵学健
蔡文杰
陈斌
朱坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongding Interconnection Information Co Ltd
Original Assignee
Tongding Interconnection Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongding Interconnection Information Co Ltd filed Critical Tongding Interconnection Information Co Ltd
Priority to CN201911174340.5A priority Critical patent/CN111103157A/zh
Publication of CN111103157A publication Critical patent/CN111103157A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M99/00Subject matter not provided for in other groups of this subclass
    • G01M99/005Testing of complete machines, e.g. washing-machines or mobile phones

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于生物启发频繁项集挖掘的工业设备状态监测方法,包括数据采集及预处理,初始化包括定义种群规模,生成当前种群,并进行编码,从当前种群中选择两个个体作为父辈个体,进行交叉操作,生成下一代子辈个体,若当前种群中存在非频繁项集,进行变异操作,直到当前种群中所有非频繁项集转变成频繁项集为止,从当前种群中选出适应度最好的频繁项集为下一轮交叉、变异操作构建初始种群并得到频繁项集,判断当前种群是否为空,生成所有频繁项集,生成强关联规则,判断设备是否故障并预警。本发明的优点在于能够提高候选频繁项集的质量,加快频繁项集的挖掘速度,提高关联规则分析的效率,提高设备故障预测及预警实时性。

Description

一种基于生物启发频繁项集挖掘的工业设备状态监测方法
技术领域
本发明涉及计算机数据挖掘及信息处理技术领域,特别涉及一种基于生物启发频繁项集挖掘的工业设备状态监测方法。
背景技术
工业设备的状态监测及故障预警是智能制造领域的研究热点之一,频繁项集挖掘作为关联规则分析的核心步骤,在数据挖掘领域受到广泛关注。频繁项集挖掘可以发现事务数据集中频繁出现的,具有高度关联性的项目集。目前,研究人员已经提出了众多频繁项集挖掘算法,其中大多为精确频繁项集挖掘算法。精确频繁项集挖掘算法可以发现数据集中的所有频繁项目集,但是时间效率普遍较低,难以满足实时性要求较高的工业设备状态监测的应用需求。
近年来,人们提出了基于生物启发的频繁项集挖掘算法,比如基于遗传算法或者基于群体智能算法的频繁项集挖掘算法等。基于生物启发的频繁项集挖掘算法通常可以在规定的时限内完成,但是通常它们不能找出数据集中包含的所有频繁项集。基于生物启发的频繁项集挖掘算法所得到的结果的好坏主要取决于算法随机搜索项集空间所采用的搜索方式。然而,当前的生物启发算法并没有将现有的精确频繁项集挖掘算法所具有的优势融合进来,比如说Apriori算法的向下闭包特性。因此,如何使基于生物启发的频繁项集挖掘算法在规定的时限内挖掘出尽可能接近精确算法所挖掘出的频繁项集是一个巨大的、持续性的挑战。
发明内容
本发明针对制造企业存在的工业设备故障引发的工业设备维修难、周期长、经济损失大及威胁工作人员生命安全等痛点问题,提供了一种基于生物启发频繁项集挖掘的工业设备状态监测方法。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种基于生物启发频繁项集挖掘的工业设备状态监测方法,其特征在于,包括如下步骤:
步骤1、通过安装在制造设备上的各种类型传感器采集设备的状态数据,并且进行预处理,构建设备状态数据集D;
步骤2、设置频繁项集集合FIM为空集,扫描设备状态数据集D,生成频繁1项集FIM1
步骤3、设置种群规模PSize大小为K,并在频繁1项集集合FIM1中选择期望支持度最大的K个频繁项集构成当前种群,并对当前种群中的个体进行编码;
步骤4、从当前种群中选择两个频繁k-1项集个体作为父辈个体,构成一个二元组,该二元组进行交叉操作,从而生成下一代子辈个体即候选频繁k项集;
步骤5、交叉操作后若当前种群中存在非频繁项集,则需要将非频繁项集进行变异操作,直到当前种群中所有非频繁项集转变成频繁项集为止;
步骤6、从经过交叉、变异操作的当前种群中选出适应度最好的λ×PSize个频繁项集,作为下一轮交叉、变异操作的新初始种群,并生成频繁k项集,选择操作中,适应度即为频繁项集的期望支持度,λ的取值可根据数据集的特点进行设置,范围为(0,1);
步骤7、若新初始种群不为空,重新执行步骤4-6,否则执行步骤8;
步骤8、生成频繁项集集合FIM=FIM1∪FIM2∪...∪FIMk,并产生强关联规则,判断是否存在设备故障隐患,当存在设备故障隐患时及时预警。
优选的,步骤3包括构建当前种群,并对当前种群中的个体进行编码,编码方法遵循以下规则:
规则1:若待挖掘数据集D中包含m个项目,则种群中每个个体(频繁项集)由m个二进制位组成;
规则2:个体中若包含某个项目,则该项目所对应的二进制位为1,否则为0。
优选的,步骤4包括对父辈个体进行交叉操作生成子辈个体,交叉操作遵循以下规则:
规则1:若当前种群中存在两个个体indiv1和indiv2的前m-1位相同,则indiv1和indiv2优先构成一个二元组进行交叉操作,indiv1中最后一个项目对应的1所在位记为m1,indiv2中最后一个项目对应的1所在位记为m2,m=min{m1,m2};
规则2:二元组中的两个个体indiv1和indiv2作为父辈个体parent1和parent2进行交叉操作时,将parent1中为0而parent2中为1的任意一位设置为1,生成子辈个体child1;同样的,将parent2中为0而parent1中为1的任意一位设置为1,生成子辈个体child2
优选的,步骤5中交叉操作后若当前种群中存在非频繁项集,则需要将非频繁项集进行变异操作,直到当前种群中所有非频繁项集转变成频繁项集为止,变异操作遵循以下规则:
规则:在非频繁项集中任意选择两个项目,其中项目e1对应的二进制位为m1,项目e2对应的二进制位为m2,且m1≠m2,然后将两个项目对应的二进制位进行翻转。
综上所述,本发明的有益效果为:本发明针对制造企业存在的工业设备故障引发的工业设备维修难、周期长、经济损失大及威胁工作人员生命安全等痛点问题,提出一种基于生物启发频繁项集挖掘的工业设备状态监测方法,可以实时监测工业设备运行状态,实现故障预测,并实时预警;此外,该发明将遗传算法的交叉、变异、选择操作与关联规则分析算法的向下闭包特性融合,应用于频繁项集的迭代挖掘过程中,以提高所候选频繁项集的质量,从而加快频繁项集的挖掘速度,可提高关联规则分析的效率,提高设备故障预测及预警的实时性。
附图说明
图1是本发明的流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明,本实施例不构成对本发明的限制。
一种基于生物启发频繁项集挖掘的工业设备状态监测方法包括如下步骤:
步骤1、通过安装在制造设备上的各种类型传感器采集设备的状态数据,并且进行预处理,构建设备状态数据集D。
步骤2、设置频繁项集集合FIM为空集,扫描设备状态数据集D,生成频繁1项集FIM1
步骤3、设置种群规模PSize大小为K,并在频繁1项集集合FIM1中选择期望支持度最大的K个频繁项集构成当前种群,并对当前种群中的个体进行编码,编码方法遵循以下规则:
规则1:若待挖掘数据集D中包含m个项目,则种群中每个个体(频繁项集)由m个二进制位组成。
规则2:个体中若包含某个项目,则该项目所对应的二进制位为1,否则为0。比如数据集
Figure DEST_PATH_IMAGE001
中若包含5个项目{a,b,c,d,e},则频繁项集{a,c}对应的编码为{1,0,1,0,0}。
步骤4、从当前种群中选择两个个体(频繁k-1项集)作为父辈个体,构成一个二元组,该二元组进行交叉操作,从而生成下一代子辈个体(候选频繁k项集),所述交叉操作遵循以下规则:
规则1:若当前种群中存在两个个体indiv1和indiv2的前m-1位相同,则indiv1和indiv2优先构成一个二元组进行交叉操作,indiv1中最后一个项目对应的1所在位记为m1,indiv2中最后一个项目对应的1所在位记为m2,m=min{m1,m2}。比如当前种群中存在三个个体分别为{1,0,1,1,0},{1,1,1,0,0}和{1,0,1,0,1},{1,0,1,1,0}和{1,0,1,0,1}优先进行配对构成一个二元组。
规则2:二元组中的两个个体indiv1和indiv2作为父辈个体parent1和parent2进行交叉操作时,将parent1中为0而parent2中为1的任意一位设置为1,生成子辈个体child1;同样的,将parent2中为0而parent1中为1的任意一位设置为1,生成子辈个体child2。比如当二元组中两个父辈个体parent1和parent2分别为{1,1,1,0,0}和{0,0,1,1,1}时,可以生成子辈个体child1和child2分别为{1,1,1,1,0}和{1,0,1,1,1}。
步骤5、交叉操作后若当前种群中存在非频繁项集,则需要将非频繁项集进行变异操作,直到当前种群中所有非频繁项集转变成频繁项集为止,所述变异操作遵循以下规则:
规则:在非频繁项集中任意选择两个项目,其中项目e1对应的二进制位为m1,项目e2对应的二进制位为m2,且m1≠m2,然后将两个项目对应的二进制位进行翻转。比如当前种群中存在个体{1,0,1,1,0}为非频繁项集,代表项集acd,项目a对应的二进制位为1,项目b对应的二进制位为0,将项目a对应的二进制位与项目b对应的二进制位进行翻转,得到变异后的个体为{0,1,1,1,0}。
步骤6、从经过交叉、变异操作的当前种群中选出适应度最好的λ×PSize个频繁项集,作为下一轮交叉、变异操作的新初始种群,并生成频繁k项集,选择操作中,适应度即为频繁项集的期望支持度,λ的取值可根据数据集的特点进行设置,范围为(0,1)。
步骤7、若新初始种群不为空,重新执行步骤4-6,否则执行步骤8。
步骤8、生成频繁项集集合FIM=FIM1∪FIM2∪...∪FIMk,并产生强关联规则,判断是否存在设备故障隐患,当存在设备故障隐患时及时预警。
以上所述,仅是本发明的较佳实施例而已,不用于限制本发明,本领域技术人员可以在本发明的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明技术方案的保护范围内。

Claims (4)

1.一种基于生物启发频繁项集挖掘的工业设备状态监测方法,其特征在于,包括如下步骤:
步骤1、通过安装在制造设备上的各种类型传感器采集设备的状态数据,并且进行预处理,构建设备状态数据集D;
步骤2、设置频繁项集集合FIM为空集,扫描设备状态数据集D,生成频繁1项集FIM1
步骤3、设置种群规模PSize大小为K,并在频繁1项集集合FIM1中选择期望支持度最大的K个频繁项集构成当前种群,并对当前种群中的个体进行编码;
步骤4、从当前种群中选择两个频繁k-1项集个体作为父辈个体,构成一个二元组,该二元组进行交叉操作,从而生成下一代子辈个体(候选频繁k项集);
步骤5、交叉操作后若当前种群中存在非频繁项集,则需要将非频繁项集进行变异操作,直到当前种群中所有非频繁项集转变成频繁项集为止;
步骤6、从经过交叉、变异操作的当前种群中选出适应度最好的λ×PSize个频繁项集,作为下一轮交叉、变异操作的新初始种群,并生成频繁k项集,选择操作中,适应度即为频繁项集的期望支持度,λ的取值可根据数据集的特点进行设置,范围为(0,1);
步骤7、若新初始种群不为空,重新执行步骤4-6,否则执行步骤8;
步骤8、生成频繁项集集合FIM=FIM1∪FIM2∪...∪FIMk,并产生强关联规则,判断是否存在设备故障隐患,当存在设备故障隐患时及时预警。
2.根据权利要求1所述的基于生物启发频繁项集挖掘的工业设备状态监测方法,其特征在于,步骤3包括构建当前种群,并对当前种群中的个体进行编码,编码方法遵循以下规则:
规则1:若待挖掘数据集D中包含m个项目,则种群中每个个体(频繁项集)由m个二进制位组成;
规则2:个体中若包含某个项目,则该项目所对应的二进制位为1,否则为0。
3.根据权利要求1所述的基于生物启发频繁项集挖掘的工业设备状态监测方法,其特征在于,步骤4包括对父辈个体进行交叉操作生成子辈个体,交叉操作遵循以下规则:
规则1:若当前种群中存在两个个体indiv1和indiv2的前m-1位相同,则indiv1和indiv2优先构成一个二元组进行交叉操作,indiv1中最后一个项目对应的1所在位记为m1,indiv2中最后一个项目对应的1所在位记为m2,m=min{m1,m2};
规则2:二元组中的两个个体indiv1和indiv2作为父辈个体parent1和parent2进行交叉操作时,将parent1中为0而parent2中为1的任意一位设置为1,生成子辈个体child1;同样的,将parent2中为0而parent1中为1的任意一位设置为1,生成子辈个体child2
4.根据权利要求1所述的基于生物启发频繁项集挖掘的工业设备状态监测方法,其特征在于,步骤5中交叉操作后若当前种群中存在非频繁项集,则需要将非频繁项集进行变异操作,直到当前种群中所有非频繁项集转变成频繁项集为止,变异操作遵循以下规则:
规则:在非频繁项集中任意选择两个项目,其中项目e1对应的二进制位为m1,项目e2对应的二进制位为m2,且m1≠m2,然后将两个项目对应的二进制位进行翻转。
CN201911174340.5A 2019-11-26 2019-11-26 一种基于生物启发频繁项集挖掘的工业设备状态监测方法 Pending CN111103157A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911174340.5A CN111103157A (zh) 2019-11-26 2019-11-26 一种基于生物启发频繁项集挖掘的工业设备状态监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911174340.5A CN111103157A (zh) 2019-11-26 2019-11-26 一种基于生物启发频繁项集挖掘的工业设备状态监测方法

Publications (1)

Publication Number Publication Date
CN111103157A true CN111103157A (zh) 2020-05-05

Family

ID=70421447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911174340.5A Pending CN111103157A (zh) 2019-11-26 2019-11-26 一种基于生物启发频繁项集挖掘的工业设备状态监测方法

Country Status (1)

Country Link
CN (1) CN111103157A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100332430A1 (en) * 2009-06-30 2010-12-30 Dow Agrosciences Llc Application of machine learning methods for mining association rules in plant and animal data sets containing molecular genetic markers, followed by classification or prediction utilizing features created from these association rules
CN109918418A (zh) * 2019-03-06 2019-06-21 桂林理工大学 一种基于遗传算法的关联规则的改进挖掘方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100332430A1 (en) * 2009-06-30 2010-12-30 Dow Agrosciences Llc Application of machine learning methods for mining association rules in plant and animal data sets containing molecular genetic markers, followed by classification or prediction utilizing features created from these association rules
CN109918418A (zh) * 2019-03-06 2019-06-21 桂林理工大学 一种基于遗传算法的关联规则的改进挖掘方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
YOUCEF DJENOURI: "An Improved Evolutionary Approach for Association Rules Mining", 《SPRINGER》 *
文武: "结合遗传算法的Apriori算法改进", 《计算机工程与设计》 *
李远生: "关联规则挖掘算法在汽轮机监测中的应用", 《吉林电力》 *
王倩: "一种基于改进遗传算法的关联规则挖掘及应用研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *
赵学健: "不确定数据频繁项集挖掘算法研究", 《计算机技术与发展》 *

Similar Documents

Publication Publication Date Title
Zhu et al. DNA sequence compression using adaptive particle swarm optimization-based memetic algorithm
US7613572B2 (en) Stochastic modeling of spatial distributed sequences
CN109086805B (zh) 一种基于深度神经网络和成对约束的聚类方法
CN109522926A (zh) 基于信息熵聚类的异常检测方法
CN107832830A (zh) 基于改进型灰狼优化算法的入侵检测系统特征选择方法
CN109905269A (zh) 确定网络故障的方法和装置
Hawkins et al. The applicability of recurrent neural networks for biological sequence analysis
WO2019076177A1 (zh) 基因测序数据压缩预处理、压缩、解压方法、系统及计算机可读介质
Jiang et al. DEPP: deep learning enables extending species trees using single genes
CN103544208B (zh) 海量特征串集合的匹配方法及系统
Padillo et al. An evolutionary algorithm for mining rare association rules: a big data approach
Seol et al. Reduction of association rules for big data sets in socially-aware computing
CN115860582B (zh) 一种基于自适应提升算法的冲击危险性智能预警方法
CN111103157A (zh) 一种基于生物启发频繁项集挖掘的工业设备状态监测方法
CN116340936A (zh) 融合强化学习和特征选择优化的ics入侵检测系统及方法
CN111491300A (zh) 风险检测方法、装置、设备及存储介质
Ahmed et al. Efficient mining of weighted frequent patterns over data streams
CN113743453A (zh) 一种基于随机森林的人口数量预测方法
Heikinheimo et al. Low-entropy set selection
CN112465838B (zh) 陶瓷晶粒图像分割方法、系统、储存介质及计算机设备
CN115472305A (zh) 一种预测微生物-药物关联作用的方法及系统
Murthy Genetic Algorithms: Basic principles and applications
Huang et al. A GA-based approach to rough data model
CN115088038A (zh) 基于新上下文的经比对的测序数据中的改进质量值压缩框架
Gustafsson et al. Clustering genomic signatures A new distance measure for variable length Markov chains

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200505

RJ01 Rejection of invention patent application after publication