CN109657945A - 一种基于数据驱动的工业生产过程故障诊断方法 - Google Patents

一种基于数据驱动的工业生产过程故障诊断方法 Download PDF

Info

Publication number
CN109657945A
CN109657945A CN201811487380.0A CN201811487380A CN109657945A CN 109657945 A CN109657945 A CN 109657945A CN 201811487380 A CN201811487380 A CN 201811487380A CN 109657945 A CN109657945 A CN 109657945A
Authority
CN
China
Prior art keywords
particle
random forest
industrial processes
input sample
sample collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811487380.0A
Other languages
English (en)
Other versions
CN109657945B (zh
Inventor
彭刚
成栋梁
武登泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201811487380.0A priority Critical patent/CN109657945B/zh
Publication of CN109657945A publication Critical patent/CN109657945A/zh
Application granted granted Critical
Publication of CN109657945B publication Critical patent/CN109657945B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于数据驱动的工业生产过程故障诊断方法,包括:计算平均偏差和方差,对工业生产过程中的多维数据进行特征提取,得到特征数据,构建原始输入样本集;利用原始输入样本集,使用训练好的随机森林模型,对待诊断工业生产过程进行故障诊断,得到诊断结果;根据诊断结果是否有故障,以及故障类型,对待诊断工业生产过程故障产生的原因进行分析和解决。本发明采用粒子群算法,同时优化随机森林模型的2个关键参数,为随机森林参数的优化提供了一种可行、高效的方法,并提高了利用随机森林算法进行工业生产过程故障诊断的准确性。

Description

一种基于数据驱动的工业生产过程故障诊断方法
技术领域
本发明属于工业生产过程诊断领域,更具体地,涉及一种基于数据驱动的工业生产过程故障诊断方法。
背景技术
工业生产过程系统越来越复杂,各个流程工序相互关联、相互影响,一旦其中任何一个过程出现故障,会导致系统功能失效,影响正常生产,造成企业重大经济损失,严重时还会造成人员安全事故,给国家和人民带来损失。因此,从安全生产和企业经济效益的角度来说,通过对工业生产过程数据的分析进行故障诊断是十分必要的。
现有的故障诊断方法可以分为基于机理模型的方法、基于知识的方法、基于信号处理的方法和基于人工智能的方法。基于机理模型的方法具有良好诊断效果的前提是建立精确的模型,随着生产制造系统的集成化与复杂化,构建这些系统的精确机理模型是很困难的,基于机理模型的方法在实际应用中很难起到良好的诊断效果。基于知识的方法是将故障诊断相关的专家经验知识进行处理,模拟人的决策方式,实现复杂系统的智能化诊断。这种方法构建的模型大部分不具有自我学习能力,不能满足需求。基于信号处理的方法是对信号进行处理和特征提取来进行故障诊断,但是没有固定的特征提取方案,不同类型数据的特征提取方式不近相同。近年来,基于人工智能的方法逐渐兴起,提高了诊断效率和识别率。但在使用人工智能方法对工业生产过程数据进行故障诊断时,人工智能算法的模型和模型参数往往需要优化,如果优化效果不好,则会降低故障诊断的准确率,诊断结果与实际偏差较大。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于数据驱动的工业生产过程故障诊断方法,由此解决现有的故障诊断方法诊断结果偏差大,以及诊断算法的参数优化效率低的技术问题。
为实现上述目的,本发明提供了一种基于数据驱动的工业生产过程故障诊断方法,包括:
(1)计算工业生产过程中的多维数据的平均偏差和方差,以对工业生产过程中的多维数据进行特征提取,得到特征数据,由所述特征数据构建原始输入样本集;
(2)利用原始输入样本集,使用训练好的随机森林模型,对待诊断工业生产过程进行故障诊断,得到诊断结果;
(3)根据诊断结果是否有故障,以及故障类型,对待诊断工业生产过程故障产生的原因进行分析和解决。
优选地,步骤(1)包括:
选取工业生产过程中的变量Ak从t时刻开始的连续h个值,计算这h个值与该变量Ak的偏差,然后将这些偏差的平均值作为特征值et,k,另外再计算这h个值与该变量Ak的方差,并将这些方差的平均值作为另一个特征值由此,对于工业生产过程中的r个变量,能够构造出包含2*r个特征值的特征向量:将所述特征向量经归一化处理后,得到特征数据,构建原始输入样本集S。
优选地,所述步骤(2)的训练好的随机森林RF模型,训练过程包括:
(2.1)计算经过标记的工业生产过程中的多维数据的平均偏差和方差,以对工业生产过程中的多维数据进行特征提取,得到特征数据,由所述特征数据构建原始输入样本集;
(2.2)采用粒子群算法优化所述随机森林模型的参数,将利用所述原始输入样本集得到的分类正确率最高的随机森林模型参数作为所述随机森林模型的最优参数组合,得到训练好的随机森林模型,以通过训练好的RF模型对待诊断工业生产过程进行故障诊断,其中,所述随机森林模型中的参数包括决策树棵数n和特征子集大小κ。
优选地,标记的工业生产过程中的多维数据是指已知生产过程状态是正常状态的数据还是故障状态的数据,以及是属于哪一种故障状态。
优选地,步骤(2.2)包括:
(2.2.1)初始化参数,随机为粒子种群中的每个粒子指定初始位置和速度参数,预设最大迭代次数、粒子位置的限定范围、粒子速度的限定范围及粒子种群规模,其中,以空间向量(n,κ)作为所述粒子种群中的粒子,空间向量(n,κ)是由RF的2个关键参数:决策树棵树n和特征集大小κ组成,粒子i的位置为(xi,n,xi,κ),xi,n代表随机森林决策树棵树,xi,κ代表随机森林特征子集大小,粒子i的速度为(vi,n,vi,κ);
(2.2.2)利用Bootstrap抽样方法,对步骤(2.1)所述原始输入样本集进行m次有放回的抽取操作,得到与原始输入样本集具有相同样本数m的训练输入样本集,重复xi,n次Bootstrap抽取操作,得到xi,n个训练输入样本集,用得到的xi,n个训练输入样本集依次训练xi,n个决策树,并在决策树节点分裂时,随机从特征集M中选择大小为xi,κ的特征子集,根据计算的xi,κ种分裂情况下的信息增益、信息增益率或者Gini指标,选择最佳分裂特征对应的随机森林结构,得到当前粒子(xi,n,xi,κ)对应的临时随机森林模型,其中,特征集M表示原始输入样本集中的样本属性的集合,属性是指2*r个平均偏差和方差所代表的含义;
(2.2.3)利用原始输入样本集,使用当前粒子(xi,n,xi,κ)对应的临时随机森林模型,进行工业生产过程故障分类,与经过标记的工业生产过程中的多维数据对应的故障类别对比,计算粒子对于经过标记的数据样本的分类正确率,以分类正确率作为当前粒子的适应度值;
(2.2.4)更新各粒子的速度和位置,若粒子位置及速度超出了各自的限定范围,则取边界值,限制粒子速度和位置,对于更新后的每个粒子,若该粒子当前位置对应的适应度高于其历史最佳位置对应的适应度,则将当前位置作为该粒子的最佳位置;
(2.2.5)更新种群位置,将每个粒子的当前最佳位置对应的适应度与种群历史最佳位置对应的适应度进行比较,若某个粒子当前最佳位置对应的适应度值更高,则将该粒子当前最佳位置作为种群最佳位置;
(2.2.6)若迭代次数小于预设最大迭代次数,且种群的最佳适应度值小于预设阈值,则返回步骤(2.2.2)继续迭代,否则结束迭代,将得到的种群最佳位置作为随机森林模型的决策树棵树和特征子集大小的最优组合。
进一步地,步骤(3):
工业生产过程状态包括生产过程运行正常状态和生产过程处于异常故障状态,如果生产过程处于异常故障状态,根据诊断结果的异常故障类型,进行异常故障产生的原因分析,进行有针对性地解决。当某类异常故障发生次数较多时,及时反映给工业生产部门,杜绝或减少这类异常故障的发生,提高工业生产的稳定性和产品生产的质量,减少生产经营损失。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
(1)本发明可以实现基于数据驱动的工业生产过程数据的故障诊断,采用粒子群优化(Particle Swarm Optimization,PSO)算法优化随机森林(Random Forest,RF)模型关键参数,利用随机森林模型,根据工业生产过程数据,进行工业生产过程故障诊断,提高了诊断准确率。
(2)影响随机森林算法性能的关键参数有决策树棵树n和特征子集大小κ,这两个参数具体的影响随着数据的不同而有差异,为了让随机森林算法进行故障诊断时对不同的数据能自动调节参数,本发明采用了基于粒子群优化随机森林模型参数的方法,达到了在不同数据情况下,随机森林模型能自动匹配出最佳的训练参数的目的,提高了随机森林诊断算法的适应性。
(3)本发明使用粒子群算法对随机森林模型的2个关键参数:决策树棵树n和特征集大小κ进行优化,同时得到最优的2个关键参数,而不是逐个参数进行优化,提高了优化效率。
附图说明
图1是本发明实施例提供的一种基于数据驱动的工业生产过程故障诊断方法的流程示意图;
图2是本发明实施例1提供的动态平均偏差与方差处理流程示意图;
图3是本发明实施例1提供的随机森林模型的决策树示意图;
图4是本发明实施例1提供的基于粒子群算法进行随机森林模型参数的优化流程示意图;
图5是本发明实施例1提供的一种基于数据驱动的工业生产过程故障诊断方法结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,一种基于数据驱动的工业生产过程故障诊断方法,包括:
(1)计算工业生产过程中的多维数据的平均偏差和方差,以对工业生产过程中的多维数据进行特征提取,得到特征数据,由特征数据构建原始输入样本集;
(2)利用原始输入样本集,使用训练好的随机森林模型,对待诊断工业生产过程进行故障诊断,得到诊断结果;
(3)根据诊断结果是否有故障,以及故障类型,对待诊断工业生产过程故障产生的原因进行分析和解决。
实施例1
本发明实施例1的数据集来自流程工业的某化工公司工业生产过程数据,经过以下步骤,进行工业生产过程故障诊断:
步骤(1)计算平均偏差和方差,对工业生产过程中的多维数据进行特征提取,得到特征数据,构建原始输入样本集。图2给出了动态平均偏差与方差方法的处理流程图。具体包括以下步骤:
(1.1)首先计算正常状态时的样本均值与方差,计算公式如下所示:
其中,Mk和Sk分别代表工业生产过程中的第k个变量的均值和方差,vi,k代表第i个样本的第k个变量值,N代表样本总数,经过计算得到正常状态时的样本均值与方差Fnormal=(M1,M2,...,S1,S2,...)。
(1.2)假设t时刻样本的数据为dt=(vt,1,vt,2,...,vt,52),窗口为n时的连续样本依次是dt-1,dt-2,...,dt-n,计算这些数据与正常状态时的平均偏差和方差,计算公式如下所示:
其中,et,k代表变量Ak从t时刻开始的连续n个样本值与正常状态时的变量Ak均值的平均偏差,分别代表变量Ak从t时刻开始的连续n个样本值的均值和方差,vt-i,k表示t时刻第i个样本的第k个变量值。
进一步地,对于变量Ak,经过上述处理后得到2个特征值:et,k这样,对于工业生产过程中的r个变量,可以构造出包含2*r的特征向量:
(1.3)为了将不同量纲的变量归一化,将(1.2)中得到的Ft与(1.1)中正常状态时的样本特征Fnormal进行比值处理,最终得到处理后t时刻的特征量:
将特征向量FFt作为原始输入样本集PS。
步骤(2)是使用训练好的随机森林模型对工业生产过程进行故障诊断,训练过程包括:
(2.1)计算经过标记的工业生产过程中的多维数据的平均偏差和方差,以对工业生产过程中的多维数据进行特征提取,得到特征数据,由特征数据构建原始输入样本集;
(2.2)采用粒子群算法优化所述随机森林模型的参数,将利用原始输入样本集得到的分类正确率最高的随机森林模型参数作为随机森林模型的最优参数组合,得到训练好的随机森林模型,以通过训练好的RF模型对待诊断工业生产过程进行故障诊断,其中,随机森林模型中的参数包括决策树棵数n和特征子集大小κ。
进一步地,标记的工业生产过程中的多维数据是指已知生产过程状态是正常状态的数据还是故障状态的数据,以及是属于哪一种故障状态。
进一步地,用粒子群算法对随机森林RF模型的关键参数进行优化的流程如图4所示,具体步骤如下:
S1:初始化参数,设定最大迭代次数Gmax,粒子位置、速度的限定范围分别为[Xmin,n,Xmax,n][Xmin,κ,Xmax,κ]和[-Vmax,n,Vmax,n][-Vmax,κ,Vmax,κ],粒子种群规模N,随机为粒子种群中的每个粒子指定初始位置和速度参数,其中,以空间向量(n,κ)作为所述粒子种群中的粒子,空间向量(n,κ)是由RF的2个关键参数:决策树棵树n和特征集大小κ组成,粒子i的位置为(xi,n,xi,κ),其中xi,n代表随机森林决策树棵树,xi,κ代表随机森林特征子集大小,粒子i的速度为(vi,n,vi,κ),vi,n表示粒子i的决策树棵树n分量的飞行速度矢量,vi,κ粒子i的特征子集大小κ分量的飞行速度矢量;
S2:利用Bootstrap抽样方法,对步骤(2.1)原始输入样本集进行m次有放回的抽取操作,得到与原始输入样本集具有相同样本数m的训练输入样本集,重复xi,n次Bootstrap抽取操作,得到xi,n个训练输入样本集,用得到的xi,n个训练输入样本集依次训练xi,n个决策树,并在决策树节点分裂时,随机从特征集M中选择大小为xi,κ的特征子集,根据计算的xi,κ种分裂情况下的信息增益、信息增益率或者Gini指标,选择最佳分裂特征对应的随机森林结构,得到当前粒子(xi,n,xi,κ)对应的临时随机森林模型,其中,特征集M表示原始输入样本集中的样本属性的集合,属性是指2*r个平均偏差和方差所代表的含义。
本发明实施例中,采用Gini指标。
具体地,属性是指工业生产过程第1个变量平均偏差的名称,…,第r个变量平均偏差的名称,第1个变量方差的名称,…,第r个变量方差的名称。
S3:利用原始输入样本集,使用当前粒子(xi,n,xi,κ)对应的临时随机森林模型,进行工业生产过程故障分类,与经过标记的工业生产过程中的多维数据对应的故障类别对比,计算粒子对于经过标记的数据样本的分类正确率,以分类正确率作为当前粒子的适应度值;
S4:更新各粒子的速度和位置,若粒子位置及速度超出了各自的限定范围,则取边界值,限制粒子速度和位置,对于更新后的每个粒子,若该粒子当前位置对应的适应度高于其历史最佳位置对应的适应度,则将当前位置作为该粒子的最佳位置;
具体地,粒子i的最佳位置pbesti=(pi,n,pi,κ),pbesti用于记录粒子i的适应度值最高的位置信息;
使用如下公式更新粒子的速度和位置:vi与xi,假如粒子位置、速度超出了设定区间,则取边界值,限制粒子速度和位置;
其中,表示第k次迭代中,粒子i的决策树棵树n分量的飞行速度矢量;w表示惯性权重(本实施例中,优选取值为0.5);表示第k-1次迭代中,粒子i的决策树棵树n分量的飞行速度矢量;c1和c2表示加速度常数(本实施例中,优选取值为1.5),用于调整更新步长;r1和r2是范围在0到1的随机数,用以增强搜索随机性;pi,n表示粒子i个体经过的最佳位置pbesti=(pi,n,pi,κ)中的决策树棵树n分量的最佳位置;表示第k-1次迭代中,粒子i的决策树棵树n分量的位置矢量;gn表示种群经过的最佳位置gbest=(gn,gκ)中的决策树棵树n分量的最佳位置;
表示第k次迭代中,粒子i的特征子集大小κ分量的飞行速度矢量;表示第k-1次迭代中,粒子i的特征子集大小κ分量的飞行速度矢量;pi,κ表示粒子i个体经过的最佳位置pbesti=(pi,n,pi,κ)中的特征子集大小κ分量的最佳位置;表示第k-1次迭代中,粒子i的特征子集大小κ分量的位置矢量;gκ表示种群经过的最佳位置gbest=(gn,gκ)中的特征子集大小κ分量的最佳位置;
表示第k次迭代中,粒子i的决策树棵树n分量的位置矢量;
表示第k次迭代中,粒子i的特征子集大小κ分量的位置矢量。
S5:更新种群位置,将每个粒子的当前最佳位置对应的适应度与种群历史最佳位置对应的适应度进行比较,若某个粒子当前最佳位置对应的适应度值更高,则将该粒子当前最佳位置作为种群最佳位置;
具体地,种群的最佳位置gbest=(gn,gκ),gbest用于记录群体所有粒子在迭代过程中的最高适应度值的位置信息;
S6:若迭代次数k小于预设最大迭代次数Gmax,即k<Gmax,且最佳适应度值小于给定阈值,则返回步骤S2继续迭代,否则结束迭代,将得到的种群最佳位置作为随机森林模型的决策树棵树和特征子集大小的最优组合。
训练完成后,数据集分类正确率最高的种群最佳位置即是所述RF模型的最优参数解,包含决策树棵树n和特征子集大小κ最优组合。本实施例中,训练完成后的最优参数:决策树棵树n=20,特征子集大小κ=14。
进一步地,Bootstrap抽样方法是以原始数据为基础,分析数据的统计分布特征,适用于难以用常规方法导出对参数的区间估计、假设检验等问题。基本思想是:在原始数据的范围内作有放回的再抽样,样本容量与原始数据容量相同,原始数据中每个观察单位每次被抽到的概率相等,所得样本称为Bootstrap样本。
步骤(3):工业生产过程状态包括生产过程运行正常状态和生产过程处于异常故障状态,如果生产过程处于异常故障状态,根据诊断结果的异常故障类型,进行异常故障产生的原因分析,进行有针对性地解决。当某类异常故障发生次数较多时,及时反映给工业生产部门,杜绝或减少这类异常故障的发生,提高工业生产的稳定性和产品生产的质量,减少生产经营损失。
图5是本发明所述一种基于数据驱动的工业生产过程故障诊断方法的结构图,实现基于数据驱动的工业生产过程故障诊断。首先对工业生产过程数据进行动态平均偏差与方差处理,构建成原始输入样本集,然后利用原始输入样本集,运用训练好的随机森林模型进行工业生产过程故障诊断。
利用PSO算法,同时优化随机森林模型的2个关键参数,得到训练好的随机森林模型,为随机森林参数的优化提供了一种可行、高效的方法,提高了利用随机森林算法进行工业生产过程故障诊断的准确性。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于数据驱动的工业生产过程故障诊断方法,其特征在于,包括:
(1)计算工业生产过程中的多维数据的平均偏差和方差,以对工业生产过程中的多维数据进行特征提取,得到特征数据,由所述特征数据构建原始输入样本集;
(2)利用原始输入样本集,使用训练好的随机森林模型,对待诊断工业生产过程进行故障诊断,得到诊断结果;
(3)根据诊断结果是否有故障,以及故障类型,对待诊断工业生产过程故障产生的原因进行分析和解决。
2.根据权利要求1所述的方法,其特征在于,步骤(1)包括:
选取工业生产过程中的变量Ak从t时刻开始的连续h个值,计算这h个值与该变量Ak的偏差,然后将这些偏差的平均值作为特征值et,k,另外再计算这h个值与该变量Ak的方差,并将这些方差的平均值作为另一个特征值由此,对于工业生产过程中的r个变量,能够构造出包含2*r个特征值的特征向量:将所述特征向量经归一化处理后,得到特征数据,构建原始输入样本集S。
3.根据权利要求1所述的方法,其特征在于,所述步骤(2)的训练好的随机森林RF模型,训练过程包括:
(2.1)计算经过标记的工业生产过程中的多维数据的平均偏差和方差,以对工业生产过程中的多维数据进行特征提取,得到特征数据,由所述特征数据构建原始输入样本集;
(2.2)采用粒子群算法优化所述随机森林模型的参数,将利用所述原始输入样本集得到的分类正确率最高的随机森林模型参数作为所述随机森林模型的最优参数组合,得到训练好的随机森林模型,以通过训练好的RF模型对待诊断工业生产过程进行故障诊断,其中,所述随机森林模型中的参数包括决策树棵数n和特征子集大小κ。
4.根据权利要求3所述的方法,其特征在于,标记的工业生产过程中的多维数据是指已知生产过程状态是正常状态的数据还是故障状态的数据,以及是属于哪一种故障状态。
5.根据权利要求3所述的方法,其特征在于,步骤(2.2)包括:
(2.2.1)初始化参数,随机为粒子种群中的每个粒子指定初始位置和速度参数,预设最大迭代次数、粒子位置的限定范围、粒子速度的限定范围及粒子种群规模,其中,以空间向量(n,κ)作为所述粒子种群中的粒子,空间向量(n,κ)是由RF的2个关键参数:决策树棵树n和特征集大小κ组成,粒子i的位置为(xi,n,xi,κ),xi,n代表随机森林决策树棵树,xi,κ代表随机森林特征子集大小,粒子i的速度为(vi,n,vi,κ);
(2.2.2)利用Bootstrap抽样方法,对步骤(2.1)所述原始输入样本集进行m次有放回的抽取操作,得到与原始输入样本集具有相同样本数m的训练输入样本集,重复xi,n次Bootstrap抽取操作,得到xi,n个训练输入样本集,用得到的xi,n个训练输入样本集依次训练xi,n个决策树,并在决策树节点分裂时,随机从特征集M中选择大小为xi,κ的特征子集,根据计算的xi,κ种分裂情况下的信息增益、信息增益率或者Gini指标,选择最佳分裂特征对应的随机森林结构,得到当前粒子(xi,n,xi,κ)对应的临时随机森林模型,其中,特征集M表示原始输入样本集中的样本属性的集合,属性是指2*r个平均偏差和方差所代表的含义;
(2.2.3)利用原始输入样本集,使用当前粒子(xi,n,xi,κ)对应的临时随机森林模型,进行工业生产过程故障分类,与经过标记的工业生产过程中的多维数据对应的故障类别对比,计算粒子对于经过标记的数据样本的分类正确率,以分类正确率作为当前粒子的适应度值;
(2.2.4)更新各粒子的速度和位置,若粒子位置及速度超出了各自的限定范围,则取边界值,限制粒子速度和位置,对于更新后的每个粒子,若该粒子当前位置对应的适应度高于其历史最佳位置对应的适应度,则将当前位置作为该粒子的最佳位置;
(2.2.5)更新种群位置,将每个粒子的当前最佳位置对应的适应度与种群历史最佳位置对应的适应度进行比较,若某个粒子当前最佳位置对应的适应度值更高,则将该粒子当前最佳位置作为种群最佳位置;
(2.2.6)若迭代次数小于预设最大迭代次数,且种群的最佳适应度值小于预设阈值,则返回步骤(2.2.2)继续迭代,否则结束迭代,将得到的种群最佳位置作为随机森林模型的决策树棵树和特征子集大小的最优组合。
CN201811487380.0A 2018-12-06 2018-12-06 一种基于数据驱动的工业生产过程故障诊断方法 Active CN109657945B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811487380.0A CN109657945B (zh) 2018-12-06 2018-12-06 一种基于数据驱动的工业生产过程故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811487380.0A CN109657945B (zh) 2018-12-06 2018-12-06 一种基于数据驱动的工业生产过程故障诊断方法

Publications (2)

Publication Number Publication Date
CN109657945A true CN109657945A (zh) 2019-04-19
CN109657945B CN109657945B (zh) 2021-01-05

Family

ID=66111919

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811487380.0A Active CN109657945B (zh) 2018-12-06 2018-12-06 一种基于数据驱动的工业生产过程故障诊断方法

Country Status (1)

Country Link
CN (1) CN109657945B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659719A (zh) * 2019-09-19 2020-01-07 江南大学 一种铝型材瑕疵检测方法
CN110991472A (zh) * 2019-08-01 2020-04-10 南京航空航天大学 一种高速列车牵引系统微小故障诊断方法
CN111126808A (zh) * 2019-12-11 2020-05-08 天津泰凡科技有限公司 一种数据预警方法、装置及计算机存储介质
CN111260201A (zh) * 2020-01-13 2020-06-09 北京科技大学 一种基于分层随机森林的变量重要性分析方法
CN111290371A (zh) * 2020-03-05 2020-06-16 深圳知路科技有限公司 物联网设备远程诊断的方法及装置、电子设备
CN111305899A (zh) * 2020-02-25 2020-06-19 大连海事大学 用于地铁车站拱盖法施工临时支撑拆除长度确定的方法
CN111506998A (zh) * 2020-04-15 2020-08-07 哈尔滨工业大学 一种构建机电产品制造过程参数漂移故障特征样本库的方法
CN112116058A (zh) * 2020-09-16 2020-12-22 昆明理工大学 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法
CN112579847A (zh) * 2019-09-30 2021-03-30 北京国双科技有限公司 生产数据的处理方法和装置、存储介质及电子设备
CN112950352A (zh) * 2021-02-08 2021-06-11 北京淇瑀信息科技有限公司 用户筛选策略生成方法、装置及电子设备
CN113610350A (zh) * 2021-07-08 2021-11-05 中南民族大学 复杂工况故障诊断方法、设备、存储介质及装置
WO2021258564A1 (zh) * 2020-06-24 2021-12-30 广州明珞装备股份有限公司 一种工艺节拍处理方法、系统、装置及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120317058A1 (en) * 2011-06-13 2012-12-13 Abhulimen Kingsley E Design of computer based risk and safety management system of complex production and multifunctional process facilities-application to fpso's
CN103278326A (zh) * 2013-06-14 2013-09-04 上海电机学院 风力发电机组齿轮箱的故障诊断方法
US20160209031A1 (en) * 2015-01-20 2016-07-21 Alstom Technology Ltd Model-based controls for a furnace and method for controlling the furnace
CN107579707A (zh) * 2017-10-13 2018-01-12 江苏大学 一种基于参数辨识的光伏阵列故障诊断方法
KR20180039205A (ko) * 2016-10-07 2018-04-18 고려대학교 산학협력단 개선된 RTC(Real-time contrasts) 기법을 이용한 지능형 이상 진단 방법 및 장치
CN108734197A (zh) * 2018-04-17 2018-11-02 东北大学 一种湿法冶金浓密洗涤过程的故障监测与诊断方法
CN108804850A (zh) * 2018-06-27 2018-11-13 大连理工大学 一种基于空间重构的航空发动机过渡态加速过程关键性能参数预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120317058A1 (en) * 2011-06-13 2012-12-13 Abhulimen Kingsley E Design of computer based risk and safety management system of complex production and multifunctional process facilities-application to fpso's
CN103278326A (zh) * 2013-06-14 2013-09-04 上海电机学院 风力发电机组齿轮箱的故障诊断方法
US20160209031A1 (en) * 2015-01-20 2016-07-21 Alstom Technology Ltd Model-based controls for a furnace and method for controlling the furnace
KR20180039205A (ko) * 2016-10-07 2018-04-18 고려대학교 산학협력단 개선된 RTC(Real-time contrasts) 기법을 이용한 지능형 이상 진단 방법 및 장치
CN107579707A (zh) * 2017-10-13 2018-01-12 江苏大学 一种基于参数辨识的光伏阵列故障诊断方法
CN108734197A (zh) * 2018-04-17 2018-11-02 东北大学 一种湿法冶金浓密洗涤过程的故障监测与诊断方法
CN108804850A (zh) * 2018-06-27 2018-11-13 大连理工大学 一种基于空间重构的航空发动机过渡态加速过程关键性能参数预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
鄢仁武: "基于小波分析与随机森林算法的电力电子电路故障诊断", 《电力科学与技术学报》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991472A (zh) * 2019-08-01 2020-04-10 南京航空航天大学 一种高速列车牵引系统微小故障诊断方法
CN110991472B (zh) * 2019-08-01 2023-10-03 南京航空航天大学 一种高速列车牵引系统微小故障诊断方法
CN110659719B (zh) * 2019-09-19 2022-02-08 江南大学 一种铝型材瑕疵检测方法
CN110659719A (zh) * 2019-09-19 2020-01-07 江南大学 一种铝型材瑕疵检测方法
CN112579847A (zh) * 2019-09-30 2021-03-30 北京国双科技有限公司 生产数据的处理方法和装置、存储介质及电子设备
CN111126808A (zh) * 2019-12-11 2020-05-08 天津泰凡科技有限公司 一种数据预警方法、装置及计算机存储介质
CN111260201A (zh) * 2020-01-13 2020-06-09 北京科技大学 一种基于分层随机森林的变量重要性分析方法
CN111260201B (zh) * 2020-01-13 2023-04-28 北京科技大学 一种基于分层随机森林的变量重要性分析方法
CN111305899A (zh) * 2020-02-25 2020-06-19 大连海事大学 用于地铁车站拱盖法施工临时支撑拆除长度确定的方法
CN111290371A (zh) * 2020-03-05 2020-06-16 深圳知路科技有限公司 物联网设备远程诊断的方法及装置、电子设备
CN111290371B (zh) * 2020-03-05 2021-08-10 深圳知路科技有限公司 物联网设备远程诊断的方法及装置、电子设备
CN111506998B (zh) * 2020-04-15 2022-02-08 哈尔滨工业大学 一种构建机电产品制造过程参数漂移故障特征样本库的方法
CN111506998A (zh) * 2020-04-15 2020-08-07 哈尔滨工业大学 一种构建机电产品制造过程参数漂移故障特征样本库的方法
WO2021258564A1 (zh) * 2020-06-24 2021-12-30 广州明珞装备股份有限公司 一种工艺节拍处理方法、系统、装置及存储介质
CN112116058B (zh) * 2020-09-16 2022-05-31 昆明理工大学 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法
CN112116058A (zh) * 2020-09-16 2020-12-22 昆明理工大学 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法
CN112950352A (zh) * 2021-02-08 2021-06-11 北京淇瑀信息科技有限公司 用户筛选策略生成方法、装置及电子设备
CN113610350A (zh) * 2021-07-08 2021-11-05 中南民族大学 复杂工况故障诊断方法、设备、存储介质及装置
CN113610350B (zh) * 2021-07-08 2024-04-23 中南民族大学 复杂工况故障诊断方法、设备、存储介质及装置

Also Published As

Publication number Publication date
CN109657945B (zh) 2021-01-05

Similar Documents

Publication Publication Date Title
CN109657945A (zh) 一种基于数据驱动的工业生产过程故障诊断方法
CN106714220B (zh) 一种基于mea-bp神经网络wsn异常检测方法
CN109597401A (zh) 一种基于数据驱动的设备故障诊断方法
CN109800875A (zh) 基于粒子群优化和降噪稀疏编码机的化工故障检测方法
Yin et al. Wasserstein Generative Adversarial Network and Convolutional Neural Network (WG‐CNN) for Bearing Fault Diagnosis
CN109297689B (zh) 一种引入权重因子的大型水力机械智能诊断方法
CN110460605B (zh) 一种基于自动编码的异常网络流量检测方法
CN109657847A (zh) 基于粒子群优化支持向量回归的工业生产中故障预测方法
CN110750655B (zh) 一种智能ietm故障维修辅助系统的知识库优化方法
CN111598179B (zh) 电力监控系统用户异常行为分析方法、存储介质和设备
CN108958217A (zh) 一种基于深度学习的can总线报文异常检测方法
CN109873779A (zh) 一种基于lstm的分级式无线信号调制类型识别方法
CN111488946A (zh) 基于信息融合的雷达伺服系统故障诊断方法
CN111401785A (zh) 一种基于模糊关联规则的电力系统设备故障预警方法
CN106874963A (zh) 一种基于大数据技术的配电网故障诊断方法及系统
CN110442143A (zh) 一种基于组合多目标鸽群优化的无人机态势数据聚类方法
CN111931601A (zh) 齿轮箱错误类别标签修正系统及方法
CN105204438A (zh) 一种面向缸盖零件的加工质量控制方法
CN114626435A (zh) 一种高准确率的滚动轴承智能故障特征选择方法
CN113204914A (zh) 一种基于多架次飞行数据表征建模的飞行数据异常判读方法
CN114091334A (zh) 基于改进蝙蝠算法和支持向量机的局部放电故障诊断方法
CN111091141B (zh) 一种基于分层Softmax的光伏背板故障诊断方法
CN116400168A (zh) 一种基于深度特征聚类的电网故障诊断方法及系统
CN115906959A (zh) 基于de-bp算法的神经网络模型的参数训练方法
CN114143210B (zh) 一种基于深度学习的指挥控制网络关键节点识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant