CN112231971A - 基于相对整体趋势扩散故障样本生成的高炉故障诊断方法 - Google Patents

基于相对整体趋势扩散故障样本生成的高炉故障诊断方法 Download PDF

Info

Publication number
CN112231971A
CN112231971A CN202011029591.7A CN202011029591A CN112231971A CN 112231971 A CN112231971 A CN 112231971A CN 202011029591 A CN202011029591 A CN 202011029591A CN 112231971 A CN112231971 A CN 112231971A
Authority
CN
China
Prior art keywords
fault
feature
sample
data
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011029591.7A
Other languages
English (en)
Other versions
CN112231971B (zh
Inventor
谢澍家
杨春节
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202011029591.7A priority Critical patent/CN112231971B/zh
Publication of CN112231971A publication Critical patent/CN112231971A/zh
Application granted granted Critical
Publication of CN112231971B publication Critical patent/CN112231971B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法,属于工业过程监测领域。本发明首先根据高炉参数的分析以及通过对不同故障训练数据的统计分析,选择不同故障各自的主特征以及辅特征;然后通过整体趋势扩散算法整体扩散技术推估故障小样本主特征的相对属性可接受范围;最后通过转化生成规则将高炉运行数据转化成故障数据,用于多分类器的训练来获得故障分类器。本发明根据对各种先验故障的具体分析将正常数据转化生成合理的高炉故障数据,从而有效的解决了因为样本量稀少及高炉运行工况多变引起的高炉小样本故障分类难题,并实现了较高的准确率。

Description

基于相对整体趋势扩散故障样本生成的高炉故障诊断方法
技术领域
本发明属于高炉故障诊断技术领域,具体涉及一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法。
背景技术
钢铁工业是国民经济的重要基础产业,是国家生存和发展的物质保障。作为钢铁制造流程的前端关键工序,炼铁生产线是能耗最大、排放最多的环节,约占钢铁工业总能耗的70%。炼铁生产线的生产质量和效率决定着整个钢铁制造流程的钢材质量和生产效率。高炉炼铁生产线操作安全性要求高,一旦出现事故,不仅会造成资源和设备的重大损失,而且甚至会造成重大人员伤亡。所以研究高炉炉况的智能故障诊断技术,及时并准确的对故障进行诊断有着重大的意义。
目前,钢铁工业常见的数据驱动故障诊断方法主要分为两类,一类是基于多元统计分析的方法,其中应用比较广泛的是PCA算法及其变种算法;另一类是人工智能方法,主要是基于神经网络和支持向量机。然而大部分的故障诊断算法只能做到定性判断,即判别是否故障,无法准确的判别故障的种类以及故障发生的位置,进一步的细分和定位往往需要高炉操作人员人工判断。
在高炉故障的诊断任务中,往往需要各种异常炉况下的训练样本,而高炉的生产运行缺少对此类数据的记录,使得异常炉况的样本数量极度不平衡,而且高炉生产过程运行工况动态多变,原燃料品质不确定,历史稀少且过时的故障数据无法动态的描述某一种具体的故障类型。由于上述的问题,导致诊断算法的准确性会随着高炉工况的变化而显著降低。
由于故障样本的难以获得,目前应用比较广泛的是对训练样本数依赖较小的是基于支持向量机及其变种算法,但是算法上的改进无法在根本上解决故障样本稀少和高炉工况变化的难题。
发明内容
针对现有技术的不足,本发明提出一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法,根据对先验故障的具体分析可以将大量正常数据转化生成合理的高炉故障数据,从而解决因为样本量稀少引起及高炉运行工况多变的高炉故障诊断难题。
一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法,包括以下步骤:
步骤一:采集高炉生产状况历史信息和设备运行状态的历史故障信息和类型,对于不同类型具体的高炉故障,根据高炉操作日志,确定发生故障的精确时刻,截取多种不同故障发生前3个小时的正常数据以及故障发生直至结束的故障数据,作为多组不同故障训练数据。
步骤二:根据热风压力的一阶差分的变化,识别各组故障历史数据中热风炉切换的时段,并去除每组历史数据中热风炉切换时段的样本。
具体步骤如下:
步骤2.1.针对每个数据样本Xi,计算该样本和前一个样本中热风压力HP的一阶差分os。
步骤2.2.判断当前的样本是否处于热风炉切换的开始阶段,需要同时满足以下两个条件:a.HPi<HPth。b.os<osth1
步骤2.3.判断当前的样本是否热风炉切换的持续阶段,需要满足以下三个条件:a. HPi<HPth;b.os>osth2;c,前一个样本被判断为热风炉切换开始或者热风炉切换的持续阶段。
步骤2.4.判断当前的样本是否热风炉切换的结束阶段,需要满足以下两个条件:a. os<osth2 and os>0;b,前一个样本被判断为热风炉切换的中间阶段。
步骤2.5.去除样本中热风炉切换开始、持续和结束阶段的数据。
其中,HPth,osth1,osth2为阈值,根据高炉现场运行数据的测试,分别令HPth=0.38,osth1=-0.005,osth2=0.0002.
步骤三:对去除热风炉扰动的各组故障历史数据进行进一步去噪平滑处理,获得各类故障的训练样本集。
具体步骤如下:
步骤3.1.对各组故障训练数据分别进行去噪,计算各个特征的四分位数,剔除特征高于上限和低于下限的样本,上下限的计算公式为:
thU=x[Q3]+1.5×(x[Q3]-x[Q1])
thL=x[Q1]-1.5×(x[Q3]-x[Q1])
其中,x[·]代表表示顺序统计量,Q1为第一四分位数,等于该特征中所有数值由小到大排列后第25%的数字。Q3为第三四分位数,等于该特征中所有数值由小到大排列后第75%的数字。thU表示该特征的上限,thL表示该特征的下限。
步骤3.2.采用一维高斯核平滑算法对各组故障训练数据的各个特征分别进行平滑处理
步骤四:根据高炉参数的分析以及通过对不同故障训练数据的统计分析,相似性的评价分析以及使用原始二分类分类器进行正常和故障的分类,发现故障发生后各特征变化规律,选择不同故障各自的主特征,其余特征设为辅特征。
具体步骤如下:
步骤4.1.去除特征集合中由其他特征计算得到的间接特征,直接将其设为辅特征,例如透气性指数,富氧率。
步骤4.2.选取大量的训练样本,运用皮尔森相关系数和互信息系数对特征集合进行分组。具体的分组规则为:将所有特征两两计算皮尔森相关系数pcc和互信息系数mic,如果pcc∈[0.6,1]或者mic∈[0.5,1],则将这两个特征分到同一特征组。最后得到特征组。
所述的皮尔森相关系数公式如下:
Figure BDA0002702811720000021
其中x,y是两个特征的值,E(·)为期望计算。
所示的互信息系数公式如下:
Figure BDA0002702811720000031
Figure BDA0002702811720000032
其中,B(n)=n0.6,n为特征的数量,nx,ny为对x,y构成的散点图进行i列j行网格化后分别的坐标值。
步骤4.3.针对k种故障训练集,将故障未发生期的数据标定为正样本,将故障发生期的样本标定为负样本。分别作为训练数据输入GBDT分类模型中,进行二分类训练。根据训练好的各种故障分类模型,对影响不同模型的特征进行特征重要性排序。得到k个故障特征重要性排序序列。
步骤4.4.针对步骤4.2得到的特征组,每组选取一个特征作为主特征。选取的依据为步骤 4.3得到的特征特征重要性排序序列,即每组中特征重要性最高的选为主特征,其余的选为辅特征。最后得到每种故障各自的主特征组和辅特征组。
步骤五:针对不同的故障,将步骤4中得到的所有主特征作为输入,分别将所有辅特征作为输出,训练得到辅特征个数的svr回归模型集合{svr11,svr12,...,svrij},i代表故障种类,j 代表辅特征种类。
步骤六:针对步骤一到步骤三得到的不同故障训练数据,依次根据步骤四得到的不同故障各自的主特征集合,分别采用相对整体趋势扩散算法推估故障样本主特征的相对属性可接受范围。
利用每组训练数据故障发生期和故障未发生期的数据,应用相对整体扩散技术推估小样本主特征的相对属性可接受范围,得到主特征变化的范围。
所述的相对整体趋势扩散算法如下:
针对故障各自的主特征,利用正常集合Xno={x1,x2,x3,...,xn}故障集合Xab={x1,x2,x3,...,xn},由下式给出X转化的相对可接受范围下界L和上界U。
Figure BDA0002702811720000033
Figure BDA0002702811720000034
其中,
CL=(max+min)/2
Figure BDA0002702811720000035
Figure BDA0002702811720000036
Figure BDA0002702811720000037
式中,n表示故障特征集大小,CL表示故障特征集数据中心,NL表示故障特征集中样本值小于CL的个数,NU表示故障特征集中样本值大于CL的个数,
Figure BDA0002702811720000044
表示故障特征集的方差,SkewL表示描述数据非对称扩散特征的左偏度,SkewU表示描述数据非对称扩散特征的右偏度, mean表示正常特征集的平均值。
步骤7:采集高炉现场的正常运行数据,分别将正常样本的主特征通过步骤6得到的故障样本生成规则转化成不同类型的不同程度的故障主特征,再通过步骤5所训练的svr回归模型生成不同故障的辅特征信息。获得合理的不同程度、类型的故障样本。
具体步骤如下:
步骤7.1.根据先验故障信息将故障等级分成微小、小、中、大、很大五级,因此首先对高炉故障后各主特征的偏离程度进行定义,根据先验知识分成五个等级。等级划分如下所示:
Figure 71514DEST_PATH_BDA0002702811720000104
其中,
Figure BDA0002702811720000042
Ri为主特征i偏离的程度,Ui为步骤四中得到的主特征i相对属性可接受范围的上界,Li为步骤四中得到的主特征i相对属性可接受范围的下界,nvl、nl、nn、nh为从先验知识中得到此主特征的阈值,Xdev i为此主变量的偏离值;
步骤7.2.生成不同程度故障的样本的主特征偏移量。为了将正常样本转化生成不同程度的故障,首先根据程度随机生成各主特征的偏移量。例如生成正常程度的故障样本,依次随机生成各主特征的偏移量,主特征的偏移量Xdev i需要满足步骤7.1中Ri=normal的范围,最后得到一组正常程度的主特征偏移量。
步骤7.3.重复步骤7.2,生成大量不同程度的主特征偏移量。选取较近的征程运行历史数据,采用一对一的原则,将正常样本的主特征量加上主特征偏移量,初步形成故障样本的主特征量。再结合正常样本的辅特征量以及步骤五中训练的svr模型的预测量,最终形成故障样本的辅特征量。则最终形成的故障样本为主特征和辅特征的并集。具体的计算公式如下:
XG i=Xi+Xdev i
XG j=λXj+(1-λ)svrkj(XG 1,XG 2,...,XG i)
λ=max(dev(Xdev 1),dev(Xdev 2),...,dev(Xdev i))
其中,
Figure BDA0002702811720000043
XG i为最终转化形成的主特征量,XG j为最终转化形成的辅特征量,Xi为转化前正常样本的主特征量,Xj为转化前正常样本的辅特征量,svrkj为svr模型的输出值,k代表故障种类, j代表辅特征种类。dev为主特征的偏离程度,Ui为步骤四中得到的主特征i相对属性可接受范围的上界,Li为步骤四中得到的主特征i相对属性可接受范围的下界。
步骤8:针对不同类型的故障,重复执行步骤7,得到不同种类故障的生成样本,再将得到的故障样本和转化前的正常数据作为训练集,采用多分类朴素贝叶斯分类方法,完成故障诊断模型的建立。根据故障诊断模型对高炉进行故障诊断。
所述的故障为高炉冶炼过程中的故障。
本发明的有益效果:
1.本发明首次提出了一种基于相对整体趋势扩散故障样本生成方法,本发明根据对历史先验故障的具体分析提取特定故障对特征的影响,从而可以在线将较新的正常数据转化生成特定合理的高炉故障数据,这些故障数据结合了当前的工况信息,比历史的真实的故障数据更符合当前训练模型的需要,即提出一种能够生成大量合理的故障样本的数据扩展技术方案,这些故障样本能够代表具体的故障,并且包含高炉运行的工况信息。这些合理的故障数据可以从根本上解决因为样本量稀少引起的高炉故障诊断难题。
2.本发明首次利用生成的当前故障样本和正常运行的样本对多分类器进行训练,使诊断准确率提高,可应用于样本量稀少及高炉运行工况多变引起的高炉故障。
附图说明
图1为本发明一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法流程图。
图2为本发明的一种实施例的热风炉切换检测示意图。
图3为本发明的一种实施例的皮尔森相关系数示意图。
图4为本发明的一种实施例的互信息系数示意图。
具体实施方式
本发明的目的在于提供一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法,流程框图如图1所示,下面利用某钢铁厂2号高炉采集的高炉数据来验证本发明方法的有效性。本发明实施例中所述的生产过程中采集到的数据特征包括透气性指数、冷风流量、热风流量、顶压、冷风压力、热风压力等32个参数,如表一所示。本发明实施例中所述的设备运行的历史故障类型包括:难行、悬料、管道、崩料、炉热、炉凉。
接下来结合该具体过程对本发明的实施步骤进行详细阐述:
步骤一:采集高炉生产状况历史信息和设备运行状态的历史故障信息和类型。对于不同类型具体的高炉故障,根据高炉操作日志以及高炉操作工的确认,确定发生故障的精确时刻,截取故障发生前3个小时的正常数据以及故障发生直至结束的故障数据,作为一组训练数据。从中选取不同故障的具有代表性的样本组。
本发明实施例中,所述的历史数据得到样本训练集:T={T1,T2,...,Tk},其中 Ti={(X1,Y1),(X2,Y2),...,(Xn,Yn)}∈(X×Y)N,Xi∈X=Rn表示第i个训练样本的数据向量,Rn表示样本空间,n表示样本的特征维数,本实例取值为32,Yi∈Y={0,1},0表示正常期,1表示故障期。
表一特征变量列表
Figure BDA0002702811720000061
本发明实例中,多分类为四类:正常,向凉,管道,难行。
步骤2:根据热风压力的一阶差分的变化,识别各组故障历史数据中热风炉切换的时段,并去除每组训练数据中热风炉切换时段的样本:
针对每个数据样本Xi,计算该样本和前一个样本中热风压力HP的一阶差分os。判断当前的样本处于热风炉切换的开始、持续还是结束阶段。开始阶段需要同时满足以下两个条件:1) HPi<HPth。2)os<osth1。持续阶段需要满足以下三个条件:1)HPi<HPth。2)os>osth2。3) 前一个样本被判断为热风炉切换开始或者热风炉切换的持续阶段。结束阶段需要满足以下两个条件:1)os<osth2 and os>0。2)前一个样本被判断为热风炉切换的中间阶段。
最后去除样本中热风炉切换开始、持续和结束阶段的数据。
其中,HPth,osth1,osth2为阈值,根据高炉现场运行数据的测试,分别令HPth=0.38,osth1=-0.005,osth2=0.0002.其中检测结果如图2所示。
步骤三:对去除热风炉扰动的各组故障历史数据进行进一步去噪平滑以及归一化处理,获得各类故障的训练样本集。具体步骤如下:
对各组故障训练数据分别进行去噪,计算各个特征的四分位数,剔除特征高于上限和低于下限的样本,上下限的计算公式为:
thU=x[Q3]+1.5×(x[Q3]-x[Q1])
thL=x[Q1]-1.5×(x[Q3]-x[Q1])
其中,x[·]代表表示顺序统计量,Q1为第一四分位数,等于该特征中所有数值由小到大排列后第25%的数字。Q3为第三四分位数,等于该特征中所有数值由小到大排列后第75%的数字。thU表示该特征的上限,thL表示该特征的下限。
然后采用一维高斯核平滑算法对各组故障训练数据的各个特征分别进行平滑处理。
步骤四:根据高炉参数的分析以及通过对不同故障训练数据的统计分析,相似性的评价分析以及使用原始二分类分类器进行正常和故障的分类,发现故障发生后各特征变化规律,选择不同故障各自的主特征,其余特征设为辅特征。
具体步骤如下:
a.去除特征集合中由其他特征计算得到的间接特征,直接将其设为辅特征,例如透气性指数,富氧率。
b.选取大量的训练样本,运用皮尔森相关系数和互信息系数对特征集合进行分组。具体的分组规则为:将所有特征两两计算皮尔森相关系数pcc和互信息系数mic,如果pcc∈[0.6,1] 或者mic∈[0.5,1],则将这两个特征分到同一特征组。最后得到特征组。高炉特征的皮尔森相关系数和互信息系数如图3,4所示。
所述的皮尔森相关系数公式如下:
Figure BDA0002702811720000071
其中x,y是两个特征的值,E(·)为期望计算。
所示的互信息系数公式如下:
Figure BDA0002702811720000072
Figure BDA0002702811720000073
其中,B(n)=n0.6,n为特征的数量,nx,ny为对x,y构成的散点图进行i列j行网格化后分别的坐标值。
高炉特征相关性分组如表二所示。
表二高炉特征相关性分组
Figure BDA0002702811720000074
c.针对k种故障训练集,将故障未发生期的数据标定为正样本,将故障发生期的样本标定为负样本。分别作为训练数据输入GBDT分类模型中,进行二分类训练。根据训练好的各种故障分类模型,对影响不同模型的特征进行特征重要性排序。得到k个故障特征重要性排序序列。
管道故障的原始二分类器特征重要性排序如表三所示。
表三管道故障原始二分类器特征重要性排序
Figure BDA0002702811720000081
d.针对得到的特征组,每组选取一个特征作为主特征。选取的依据为得到的特征特征重要性排序序列,即每组中特征重要性最高的选为主特征,其余的选为辅特征。最后得到每种故障各自的主特征组和辅特征组。
管道故障的主特征和辅特征分组如表四所示,其中,序号加粗的表示管道故障的主特征,不加粗的为辅特征。
表四管道故障主特征组和辅特征分组列表
Figure BDA0002702811720000091
步骤五:针对不同的故障,将步骤4中得到的所有主特征作为输入,分别将所有辅特征作为输出,训练得到辅特征个数的svr回归模型集合{svr11,svr12,...,svrij},i代表故障种类,j 代表辅特征种类。
步骤六:针对步骤一到步骤三得到的不同故障训练数据,依次根据步骤四得到的不同故障各自的主特征集合,分别采用相对整体趋势扩散算法推估故障样本主特征的相对属性可接受范围。
利用每组训练数据故障发生期和故障未发生期的数据,应用相对整体扩散技术推估小样本主特征的相对属性可接受范围,得到主特征变化的范围。
所述的相对整体趋势扩散算法如下:
针对故障各自的主特征,利用正常集合Xno={x1,x2,x3,...,xn}故障集合Xab={x1,x2,x3,...,xn},由下式给出X转化的相对可接受范围下界L和上界U。
Figure BDA0002702811720000092
Figure BDA0002702811720000093
其中,
CL=(max+min)/2
Figure BDA0002702811720000094
Figure BDA0002702811720000101
Figure BDA0002702811720000102
式中,n表示故障特征集大小,CL表示故障特征集数据中心,NL表示故障特征集中样本值小于CL的个数,NU表示故障特征集中样本值大于CL的个数,
Figure BDA0002702811720000103
表示故障特征集的方差, SkewL表示描述数据非对称扩散特征的左偏度,SkewU表示描述数据非对称扩散特征的右偏度, mean表示正常特征集的平均值。
步骤7:采集高炉现场的正常运行数据,分别将正常样本的主特征通过步骤6得到的故障样本生成规则转化成不同类型的不同程度的故障主特征,再通过步骤5所训练的svr回归模型生成不同故障的辅特征信息。获得合理的不同程度、类型的故障样本。
具体步骤如下:
a.根据先验故障信息将故障等级分成微小、小、中、大、很大五级,因此首先对高炉故障后各主特征的偏离程度进行定义,根据先验知识分成五个等级。等级划分如下所示:
Figure BDA0002702811720000104
其中,
Figure BDA0002702811720000105
Ri为主特征i偏离的程度,Ui为步骤四中得到的主特征i相对属性可接受范围的上界,Li为步骤四中得到的主特征i相对属性可接受范围的下界,nvl、nl、nn、nh为从先验知识中得到此主特征的阈值,Xdev i为此主变量的偏离值,在此实例中设定nvl=0.1、nl=0.3、nn=0.5、 nh=0.8。
b.生成不同程度故障的样本的主特征偏移量。为了将正常样本转化生成不同程度的故障,首先根据程度随机生成各主特征的偏移量。例如生成正常程度的故障样本,依次随机生成各主特征的偏移量,主特征的偏移量Xdev i需要满足步骤7.1中Ri=normal的范围,最后得到一组正常程度的主特征偏移量。
c.重复步骤7.2,生成大量不同程度的主特征偏移量。选取较近的征程运行历史数据,采用一对一的原则,将正常样本的主特征量加上主特征偏移量,初步形成故障样本的主特征量。再结合正常样本的辅特征量以及步骤五中训练的svr模型的预测量,最终形成故障样本的辅特征量。则最终形成的故障样本为主特征和辅特征的并集。具体的计算公式如下:
XG i=Xi+Xdev i
XG j=λXj+(1-λ)svrkj(XG 1,XG 2,...,XG i)
λ=max(dev(Xdev 1),dev(Xdev 2),...,dev(Xdev i))
其中,
Figure BDA0002702811720000111
XG i为最终转化形成的主特征量,XG j为最终转化形成的辅特征量,Xi为转化前正常样本的主特征量,Xj为转化前正常样本的辅特征量,svrkj为svr模型的输出值,k代表故障种类, j代表辅特征种类。dev为主特征的偏离程度,Ui为步骤四中得到的主特征i相对属性可接受范围的上界,Li为步骤四中得到的主特征i相对属性可接受范围的下界。
步骤8:针对不同类型的故障,重复执行步骤7,得到不同种类故障的生成样本,再将得到的故障样本和转化前的正常数据作为训练集,采用多分类朴素贝叶斯分类方法,完成故障诊断模型的建立。根据故障诊断模型对高炉进行故障诊断。
本发明方法根据对历史先验故障的具体分析提取特定故障对各特征的影响,在线将较新的正常数据转化生成特定合理的高炉故障数据,这些故障数据结合了当前的工况信息,比历史的真实的故障数据更符合当前训练模型的需要。因此本发明相比于其他已有的高炉故障分类方法有着更高的准确率。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法,
其特征在于,包括以下步骤:
步骤一:采集高炉生产状况历史信息和设备运行状态的历史故障信息和类型,对于不同类型具体的高炉故障,根据高炉操作日志,确定发生故障的时刻,截取多种不同故障发生前3个小时的正常数据以及故障发生直至结束的故障数据,作为多组不同故障训练数据;
步骤二:根据热风压力的一阶差分的变化,识别各组故障历史数据中热风炉切换的时段,并去除每组历史数据中热风炉切换时段的样本;
步骤三:对去除热风炉扰动的各组故障历史数据进行进一步去噪平滑处理,获得各类故障的训练样本集;
步骤四:根据高炉参数的分析以及通过对不同故障训练数据的统计分析,相似性的评价分析以及使用原始二分类分类器进行正常和故障的分类,发现故障发生后各特征变化规律,选择不同故障各自的主特征,其余特征设为辅特征;
步骤五:针对不同的故障,将步骤四中得到的所有主特征作为输入,分别将所有辅特征作为输出,训练得到辅特征个数的svr回归模型集合{svr11,svr12,...,svrkj},k代表故障种类,j代表辅特征种类;
步骤六:针对步骤一到三得到的不同故障训练数据,依次根据步骤四得到的不同故障各自的主特征集合,分别采用相对整体趋势扩散算法整体扩散技术推估故障样本主特征的相对属性可接受范围;
步骤七:采集高炉现场时间较近的正常运行数据,分别将正常样本的主特征通过步骤六得到的故障样本生成规则转化成不同类型的不同程度的故障主特征,再通过步骤五所训练的svr回归模型生成不同故障的辅特征信息,获得合理的不同程度、类型的故障样本;
步骤八:将步骤六中得到的故障样本和正常数据一起作为输入,采用多分类朴素贝叶斯分类方法,完成故障诊断模型的建立,根据故障诊断模型对高炉进行故障诊断。
2.根据权利要求1所述的方法,其特征在于,所述的步骤二中的步骤如下:
步骤2.1.针对每个数据样本Xi,计算该样本和前一个样本中热风压力HP的一阶差分os;
步骤2.2.判断当前的样本是否处于热风炉切换的开始阶段,需要同时满足以下两个条件:a.HPi<HPth;b.os<osth1
步骤2.3.判断当前的样本是否热风炉切换的持续阶段,需要满足以下三个条件:a.HPi<HPth;b.os>osth2;c,前一个样本被判断为热风炉切换开始或者热风炉切换的持续阶段;
步骤2.4.判断当前的样本是否热风炉切换的结束阶段,需要满足以下两个条件:a.os<osth2 and os>0;b,前一个样本被判断为热风炉切换的持续阶段;
步骤2.5.去除样本中热风炉切换开始、持续和结束阶段的数据;
其中,HPth,osth1,osth2为阈值,根据高炉现场运行数据的测试,分别令HPth=0.38,osth1=-0.005,osth2=0.0002。
3.根据权利要求1所述的方法,其特征在于,所述的步骤四中选取各种故障的主特征以及辅特征的具体步骤如下:
步骤4.1.去除特征集合中由其他特征计算得到的间接特征,直接将其设为辅特征,包括透气性指数,富氧率;
步骤4.2.选取大量的训练样本,运用皮尔森相关系数和互信息系数对特征集合进行分组,分组规则为:将所有特征两两计算皮尔森相关系数pcc和互信息系数mic,如果pcc∈[0.6,1]或者mic∈[0.5,1],则将这两个特征分到同一特征组,最后得到特征组;
所述的皮尔森相关系数公式如下:
Figure FDA0002702811710000021
其中x,y是两个特征的值,E(·)为期望计算;
所示的互信息系数公式如下:
Figure FDA0002702811710000022
Figure FDA0002702811710000023
其中,B(n)=n0.6,n为特征的数量,nx,ny为对x,y构成的散点图进行i列j行网格化后分别的坐标值;
步骤4.3.针对k种故障训练集,将故障未发生期的数据标定为正样本,将故障发生期的样本标定为负样本,分别作为训练数据输入GBDT分类模型中,进行二分类训练,根据训练好的各种故障分类模型,对影响不同模型的特征进行特征重要性排序,得到k个故障特征重要性排序序列;
步骤4.4.针对步骤4.2得到的特征组,每组选取一个特征作为主特征,选取的依据为步骤4.3得到的特征特征重要性排序序列,即每组中特征重要性最高的选为主特征,其余的选为辅特征,最后得到每种故障各自的主特征组和辅特征组。
4.根据权利要求1所述的方法,其特征在于,所述的步骤六中相对属性可接受范围的计算方式如下所示:
利用每组训练数据故障发生期和故障未发生器的数据,应用相对整体扩散技术推估小样本主特征的相对属性可接受范围,得到主特征变化的范围;
所述的相对整体趋势扩散算法如下:
针对故障某主特征,利用正常集合Xno={x1,x2,x3,...,xn}故障集合Xab={x1,x2,x3,...,xn},由下式给出X转化的相对可接受范围下界L和上界U;
Figure FDA0002702811710000024
Figure FDA0002702811710000025
其中,
CL=(max+min)/2
Figure FDA0002702811710000026
Figure FDA0002702811710000027
Figure FDA0002702811710000028
式中,n表示故障特征集大小,CL表示故障特征集数据中心,NL表示故障特征集中样本值小于CL的个数,NU表示故障特征集中样本值大于CL的个数,
Figure FDA0002702811710000031
表示故障特征集的方差,SkewL表示描述数据非对称扩散特征的左偏度,SkewU表示描述数据非对称扩散特征的右偏度,mean表示正常特征集的平均值。
5.根据权利要求1所述的方法,其特征在于,所述的步骤七中对于正常样本转化不同故障样本的具体步骤如下:
步骤7.1.根据先验故障信息将故障等级分成微小、小、中、大、很大五级,因此首先对高炉故障后各主特征的偏离程度进行定义,根据先验知识分成五个等级,等级划分如下所示:
Figure DEST_PATH_BDA0002702811720000104
其中,
Figure FDA0002702811710000033
Ri为主特征i偏离的程度,Ui为步骤四中得到的主特征i相对属性可接受范围的上界,Li为步骤四中得到的主特征i相对属性可接受范围的下界,nvl、nl、nn、nh为从先验知识中得到此主特征的阈值,Xdev i为此主变量的偏离值;
步骤7.2.生成不同程度故障的样本的主特征偏移量,为了将正常样本转化生成不同程度的故障,首先根据程度随机生成各主特征的偏移量,生成正常程度的故障样本,依次随机生成各主特征的偏移量,主特征的偏移量Xdev i需要满足步骤7.1中Ri=normal的范围,最后得到一组正常程度的主特征偏移量;
步骤7.3.重复步骤7.2,生成大量不同程度的主特征偏移量,选取较近的征程运行历史数据,采用一对一的原则,将正常样本的主特征量加上主特征偏移量,初步形成故障样本的主特征量,再结合正常样本的辅特征量以及步骤五中训练的svr模型的预测量,最终形成故障样本的辅特征量,则最终形成的故障样本为主特征和辅特征的并集,具体的计算公式如下:
XG i=Xi+Xdev i
XG j=λXj+(1-λ)svrkj(XG 1,XG 2,...,XG i)
λ=max(dev(Xdev 1),dev(Xdev 2),...,dev(Xdev i))
其中,
Figure FDA0002702811710000034
XG i为最终转化形成的主特征量,XG j为最终转化形成的辅特征量,Xi为转化前正常样本的主特征量,Xj为转化前正常样本的辅特征量,svrkj为svr模型的输出值,k代表故障种类,j代表辅特征种类,dev为主特征的偏离程度,Ui为步骤四中得到的主特征i相对属性可接受范围的上界,Li为步骤四中得到的主特征i相对属性可接受范围的下界。
CN202011029591.7A 2020-09-26 2020-09-26 基于相对整体趋势扩散故障样本生成的高炉故障诊断方法 Active CN112231971B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011029591.7A CN112231971B (zh) 2020-09-26 2020-09-26 基于相对整体趋势扩散故障样本生成的高炉故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011029591.7A CN112231971B (zh) 2020-09-26 2020-09-26 基于相对整体趋势扩散故障样本生成的高炉故障诊断方法

Publications (2)

Publication Number Publication Date
CN112231971A true CN112231971A (zh) 2021-01-15
CN112231971B CN112231971B (zh) 2022-07-05

Family

ID=74107164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011029591.7A Active CN112231971B (zh) 2020-09-26 2020-09-26 基于相对整体趋势扩散故障样本生成的高炉故障诊断方法

Country Status (1)

Country Link
CN (1) CN112231971B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077020A (zh) * 2021-06-07 2021-07-06 广东电网有限责任公司湛江供电局 一种变压器集群管理方法及系统
CN113537288A (zh) * 2021-06-16 2021-10-22 华北电力大学 基于样本信号的修改对目标模型进行训练的方法及系统
CN113537289A (zh) * 2021-06-16 2021-10-22 华北电力大学 通过样本掺杂来训练目标设备的设备模型的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100107775A1 (en) * 2008-11-06 2010-05-06 Northeastern University System, Method, And Device For Measuring Parameters Of A Two-Phase Flow
CN106295685A (zh) * 2016-08-01 2017-01-04 浙江大学 改进的直推式支持向量机的大型高炉故障分类算法及应用
CN107505133A (zh) * 2017-08-10 2017-12-22 滁州学院 基于自适应mrvm的滚动轴承故障概率性智能诊断方法
CN111651931A (zh) * 2020-05-19 2020-09-11 浙江大学 基于深度神经网络的高炉故障诊断规则导出方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100107775A1 (en) * 2008-11-06 2010-05-06 Northeastern University System, Method, And Device For Measuring Parameters Of A Two-Phase Flow
CN106295685A (zh) * 2016-08-01 2017-01-04 浙江大学 改进的直推式支持向量机的大型高炉故障分类算法及应用
CN107505133A (zh) * 2017-08-10 2017-12-22 滁州学院 基于自适应mrvm的滚动轴承故障概率性智能诊断方法
CN111651931A (zh) * 2020-05-19 2020-09-11 浙江大学 基于深度神经网络的高炉故障诊断规则导出方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YIJUN PAN 等: "Fault detection with improved principal component pursuit method", 《CHEMOMETRICS AND INTELLIGENT LABORATORY SYSTEMS》 *
安汝峤 等: "基于加权图方法的高炉过程故障检测", 《高校化学工程学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077020A (zh) * 2021-06-07 2021-07-06 广东电网有限责任公司湛江供电局 一种变压器集群管理方法及系统
CN113537288A (zh) * 2021-06-16 2021-10-22 华北电力大学 基于样本信号的修改对目标模型进行训练的方法及系统
CN113537289A (zh) * 2021-06-16 2021-10-22 华北电力大学 通过样本掺杂来训练目标设备的设备模型的方法及系统
WO2022262072A1 (zh) * 2021-06-16 2022-12-22 华北电力大学 基于样本信号的修改对目标模型进行训练的方法及系统
WO2022262073A1 (zh) * 2021-06-16 2022-12-22 华北电力大学 通过样本掺杂来训练目标设备的设备模型的方法及系统
CN113537288B (zh) * 2021-06-16 2024-04-05 华北电力大学 基于样本信号的修改对目标模型进行训练的方法及系统
CN113537289B (zh) * 2021-06-16 2024-05-28 华北电力大学 通过样本掺杂来训练目标设备的设备模型的方法及系统

Also Published As

Publication number Publication date
CN112231971B (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
CN112231971B (zh) 基于相对整体趋势扩散故障样本生成的高炉故障诊断方法
CN103914064B (zh) 基于多分类器和d-s证据融合的工业过程故障诊断方法
CN109781411B (zh) 一种结合改进稀疏滤波器与kelm的轴承故障诊断方法
CN111337768A (zh) 变压器油中溶解气体的深度并行故障诊断方法及系统
CN104793606B (zh) 基于改进的kpca和隐马尔科夫模型的工业故障诊断方法
CN111539152B (zh) 一种基于两级孪生卷积神经网络的滚动轴承故障自学习方法
CN107273924B (zh) 基于模糊聚类分析的多数据融合的电厂故障诊断方法
CN105678332A (zh) 火焰图像cnn识别建模的转炉炼钢终点判断方法及系统
CN102498445A (zh) 用于机器状态监测的、使用规则生成的样本的监督故障学习
CN112304614B (zh) 采用多注意力机制的端到端滚动轴承智能故障诊断方法
CN110636066B (zh) 基于无监督生成推理的网络安全威胁态势评估方法
CN108802041B (zh) 一种屏幕检测的小样本集快速换型的方法
CN113221441B (zh) 一种电厂设备健康评估的方法及装置
CN111860775B (zh) 基于cnn和rnn融合的船舶故障实时诊断方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN110647911A (zh) 一种基于主成分分析和深度信念网络的轴承故障诊断方法
CN108830006B (zh) 基于线性评价因子的线性-非线性工业过程故障检测方法
CN111639850A (zh) 多源异构数据的质量评估方法与系统
CN111402236A (zh) 一种基于图像灰度值的热轧带钢表面缺陷分级方法
CN112001511A (zh) 基于数据挖掘的设备可靠性及动态风险评价方法、系统和设备
CN114429152A (zh) 基于动态指数对抗性自适应的滚动轴承故障诊断方法
CN115795380A (zh) 一种基于孤立森林和加权随机森林的烟气制酸数据清洗及优化方法
CN114565314B (zh) 一种基于数字孪生的热轧钢卷端面质量管控系统及方法
CN114266297A (zh) 火电装备语义知识库、构建方法及零样本故障诊断方法
CN108508319B (zh) 基于故障特征气体间关联特征的变压器故障类型识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant