CN105550426A - 一种基于样本分割的多尺度二叉树高炉故障诊断方法 - Google Patents

一种基于样本分割的多尺度二叉树高炉故障诊断方法 Download PDF

Info

Publication number
CN105550426A
CN105550426A CN201510902744.7A CN201510902744A CN105550426A CN 105550426 A CN105550426 A CN 105550426A CN 201510902744 A CN201510902744 A CN 201510902744A CN 105550426 A CN105550426 A CN 105550426A
Authority
CN
China
Prior art keywords
fault
blast furnace
class
omega
binary tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510902744.7A
Other languages
English (en)
Other versions
CN105550426B (zh
Inventor
王安娜
沙漠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201510902744.7A priority Critical patent/CN105550426B/zh
Publication of CN105550426A publication Critical patent/CN105550426A/zh
Application granted granted Critical
Publication of CN105550426B publication Critical patent/CN105550426B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/13Architectural design, e.g. computer-aided architectural design [CAAD] related to design of buildings, bridges, landscapes, production plants or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/04Ageing analysis or optimisation against ageing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Geometry (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Architecture (AREA)
  • Mathematical Analysis (AREA)
  • Structural Engineering (AREA)
  • Pure & Applied Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Civil Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明一种基于样本分割的多尺度二叉树高炉故障诊断方法,属于高炉故障诊断技术领域,首先采集高炉生产状况和设备运行状态数据,对数据进行检测并对提取的数据采用均值-方差标准化方法进行归一化处理;将高炉故障诊断问题转化成二分类问题进行多分类器设计;利用改进的广义特征值支持向量机寻找到一条分割面,转化为两个二分类问题,并分别去寻找适应每一类故障数据自己的具有局部特性的距离测度矩阵,借助支持向量机设计出两条基于不同尺度的分类超平面;本发明适合高维非线性故障数据的识别,通过对样本数据的分割与多尺度标准衡量样本间的相似度,兼顾被识别数据的全局与局部逻辑结构,降低被识别故障问题复杂度,提升故障诊断的精度。

Description

一种基于样本分割的多尺度二叉树高炉故障诊断方法
技术领域
本发明属于高炉故障诊断技术领域,具体涉及一种基于样本分割的多尺度二叉树高炉故障诊断方法。
背景技术
高炉是钢铁企业的咽喉,在整个钢铁企业中高炉生产能耗约占60%,一旦设备运行的异常情况发展成为生产上的故障,就会对企业带来巨大的经济损失,因此它的有效操作是至关重要的;研究高炉炉况的智能故障诊断技术,及时准确地进行炉况故障诊断与监控,对于提高企业经济效益,降低生产成本,减少生产能耗,有着重要的意义。
高炉冶炼是把生铁矿石还原成铁,它是一个连续且工艺复杂的生产过程;为防止异常情况出现,需要生产过程中的大量参数进行监测:热风风温、热风风量、热风风压、炉顶压力、全压差、上部压力、下部压力、富氧量、透气性指数、十字测温、料速、物理热、含[Si]量等;因此故障状态的特征也不是单一的特征表现,而是高维度多特征的信号的综合体现;例如高炉故障中的“管道行程”就同“顶温”“风压”“风量”“料速”“含[Si]量”等多特征的波动息息相关;因此传统的高炉故障诊断方法难以适应当今我们对复杂性,实时,以及高精度的高炉故障诊断的要求。
因此,人工智能被广泛应用到各种系统的故障诊断中;目前,流程工业故障诊断的人工智能方法主要是基于神经网络和支持向量机。但是,前者需要大量训练样本和训练时间,其解可能陷于局部最小值;在统计学习理论基础上发展起来的机器学习方法——支持向量机(SupportVectorMachine,SVM)已表现出很多优于其它方法的性能。支持向量机具有很好的学习能力,尤其是泛化能力;支持向量机将学习问题归结为一个凸二次规划问题;解决了在神经网络方法中无法避免的局部极值问题;在高炉故障诊断过程中,有些故障样本是很难获得的,而支持向量机在解决小样本模式识别问题上的出色表现使其获得广泛的应用;将支持向量机应用到高炉故障诊断中,可以极大提高目前故障诊断系统的性能,为故障诊断技术向智能化发展提供了新的途径。
在高炉故障诊断中,由于故障样本难以获得,训练集中不同类别之间的故障样本数量很难达到一致,存在大量不平衡数据;使用不平衡数据的支持向量机(SVM)预测过程具有倾斜性,因而产生误差;应对不平衡数据分类方法大致可分为两类:基于算法层面的方法和基于数据层面的方法,或者将二者结合考虑;前一种对算法的改进需要引入惩罚因子或代价函数增加了分类器的复杂度且参数设定困难;后一种重构数据集方法易于产生过学习或删除有意义样本问题。
基于支持向量机的(SVM)的故障诊断算法大多是采用欧式距离作为可分离测度标准的,即假设通过核矩阵映射后的样本点都分布在同一个超球体上;而由于各类不同故障的样本点具有自己本身的局部特性,同类样本点更倾向于映射到基于样本本身特性的马氏距离作为可分离测度标准的超椭园球体上;即每一类故障样本点都具有一个更适合自己的测度:缩小了类内距离同事扩大了类间距离。
针对以上提出的问题,我们急需提出新的智能高炉故障诊断技术,能够迅速降低故障识别问题的复杂度,快速提取出各个故障的测度矩阵,进一步提高故障诊断的速度与精度。
发明内容
针对现有技术的不足,本发明提出一种基于样本分割的多尺度二叉树高炉故障诊断方法,以达到兼顾样本空间的整体与局部特性,提高故障诊断精度的目的。
一种基于样本分割的多尺度二叉树高炉故障诊断方法,包括以下步骤;
步骤1、采集高炉生产状况历史数据和设备运行状态的历史故障类型;
步骤2、对采集的历史数据进行归一化处理,获得训练样本集;
步骤3、采用极大似然估计法获得各类故障样本的均值和类内散度;
步骤4、构建二叉树分类器,从二叉树分类器中的根结点开始,采用改进广义特征值支持向量机方法,获得二叉树分类器各节点的一条距离正类训练样本最近且距离负类训练样本最远的分割面,再进一步获得分割后两部分各自的分类超平面,完成故障诊断模型的建立;
步骤5、采集高炉生产状况实际数据,对采集的实际数据进行归一化处理;
步骤6、将归一化处理后的实际数据导入建立的故障诊断模型中,获得高炉实际所属故障类型,完成高炉故障诊断。
步骤1所述的生产状况历史数据包括:风量、风压、顶压、压差、透气性、顶温、十字测温、料速、硅和物理热;所述的设备运行状态的历史故障类型包括:向凉、向热、管道行程、悬料、崩料、低料线以及边缘气流过分发展、低料线以及边缘气流发展不足。
步骤4所述的二叉树分类器中的根结点,其正类为类内散度最大的样本所对应的故障类型;其负类为训练样本集中除类内散度最大的样本以外的其余样本所对应的故障类型。
步骤4所述的获得二叉树分类器各节点的一条距离正类训练样本最近且距离负类训练样本最远的分割面,所述的分割面包括超平面和曲面;
(1)所述的超平面确定方式如下:
超平面法向量与参数的优化公式如下;
m i n ( ω i , b i ) ≠ 0 | | A i ω i + eb i | | 2 + δ | | ω i b i | | 2 | | B i ω i + eb i | | 2 - - - ( 1 )
其中,Ai表示第i类故障的正类训练样本集合;Bi表示表示第i类故障的负类训练样本集合;ωi表示超平面法向量;e表示分量全为1的列向量;bi∈R,R表示实数;δ>0,表示正则化因子,||·||表示L2范数;
令G=[Aie]T[Aie]+δI,H=[Bie]T[Bie],I表示单位矩阵, z = ω i b i , 则公式(1)转换为:
m i n z ≠ 0 z T G z z T H z - - - ( 2 )
求取Gz=λHz,z≠0的最小特征值λ对应的特征向量z,获得 ω i b i 最优解,即获得超平面 ω i T x + b i = 0 ;
(2)所述的曲面K(x,Cii+bi=0确定方式如下:
曲面法向量与参数的优化公式如下;
m i n ( ω i , b i ) ≠ 0 | | K ( A i , C i ) ω i + eb i | | 2 + δ | | ω i b i | | 2 | | K ( B i , C i ) ω i + eb i | | 2 - - - ( 3 )
其中, C i = A i B i 表示训练样本,核函数选取径向高斯核函数σ为函数的宽度参数,距离d(xi,xj)=(xi-xj)T(xi-xj);
令G=[K(Ai,Ci)e]T[K(Ai,Ci)e]+δI,H=[K(Bi,Ci)e]T[K(Bi,Ci)e], z = ω i b i , 则公式(3)转换为公式(2):
求取Gz=λHz,z≠0的最小特征值λ对应的特征向量z,获得 ω i b i 最优解,即获得曲面K(x,Cii+bi=0。
步骤4所述的再进一步获得分割后两部分各自的分类超平面,具体方法如下:
步骤a、将正类训练样本集合和负类训练样本集合分别代入至分割面函数中,获得分割后的二分类集合;
步骤b、采用信息熵度量学习算法获取二分类样本集合的各自距离测度矩阵;
步骤c、根据所获得二分类样本集合及距离测度矩阵,采用二分类支持向量机算法进一步获得分割后两部分各自的分类超平面函数。
步骤6所述的归一化处理后的实际数据导入建立的故障诊断模型中,获得高炉实际所属故障类型,具体如下:
步骤6-1、将实际数据代入二叉树分类器根结点中的分割面函数中;
步骤6-2、判断分割面函数值是否大于0,若是,则将数据代入到分割后其中一部分的分类超平面函数中,并执行步骤6-3;否则,将数据代入到分割后其中另一部分的分类超平面函数中,并执行步骤6-4;
步骤6-3、判断分类超平面函数值是否大于0,若是,则属于该类故障,否则,为非该类故障,并执行步骤6-5;
步骤6-4、判断分类超平面函数值是否大于0,若是,则属于该类故障,否则,为非该类故障,并执行步骤6-5;
步骤6-5、将非该类故障数据代入二叉树分类器下一节点的分割面函数中,返回执行步骤6-2。
步骤c所述的采用二分类支持向量机算法进一步获得分割后两部分各自的分类超平面函数,具体如下:
(1)分割后一部分的分类超平面函数确定方式如下:
min α 1 2 Σ i = 1 l i 1 Σ j = 1 l i 1 y i y j α i α j K ( x i · x j ) - Σ j = 1 l i 1 α j s . t . α i ≥ 0 , i = 2 , 3 , ... , l i 1 Σ i = 1 l i 1 y i α i = 0 - - - ( 4 )
其中,li1表示分割后子样本集的样本总数, 表示分割后子样本集中的正类,表示分割后子样本集中的负类;yi,yj∈Y={+1,-1},i,j=1,…,li1;αi、αj表示支持向量;核函数 K ( x i , x j ) = exp - ( d M 2 ( x i , x j ) ) 2 σ 2 , d M 2 ( x i , x j ) = ( x i - x j ) T M i 1 ( x i - x j ) , Mi1表示分割后其中一部分的距离度量矩阵;
获得分割后一部分的分类超平面函数fi1(x):
f i 1 ( x ) = sgn [ Σ i = 1 l i 1 α i y i K ( x i , x ) + b i 1 ] - - - ( 5 )
其中,bi1为常数;
(2)分割后另一部分的分类超平面函数确定方式如下:
min α 1 2 Σ i = 1 l i 2 Σ j = 1 l i 2 y i y j α i α j K ( x i · x j ) - Σ j = 1 l i 2 α j s . t . α i ≥ 0 , i = 2 , 3 , ... , l i 2 Σ i = 1 l i 2 y i α i = 0 - - - ( 6 )
其中,li2表示分割后子样本集的样本总数, 表示分割后子样本集中的正类,表示分割后子样本集中的负类;其中核函数
d M 2 ( x i , x j ) = ( x i - x j ) T M i 2 ( x i - x j ) , Mi2表示分割后其中另一部分的距离度量矩阵;
获得分割后另一部分的分类超平面函数fi2(x):
f i 2 ( x ) = sgn [ Σ i = 1 l i 2 α i y i K ( x i , x ) + b i 2 ] - - - ( 7 )
其中,bi2为常数。
本发明优点:
本发明提出一种基于样本分割的多尺度二叉树高炉故障诊断方法,本发明利用Gepsvm(改进广义特征值支持向量机)算法,在未对故障识别前预先对样本集分割,降低了问题的复杂程度,简化了模型,提高了运行效率;在树形结构的子节点中采用不同的距离测度矩阵,具体问题具体分析,提高了运行的精度;分割样本集与决策树结构调整相结合,优化了多分类故障识别算法的结构。
附图说明
图1为本发明一种实施例的基于样本分割的多尺度二叉树高炉故障诊断方法流程图;
图2为本发明一种实施例的二叉树分类器结构示意图;
图3为本发明一种实施例的向凉、向热、悬料、崩料四类故障数据图;
图4为本发明一种实施例的向凉、向热、悬料、崩料四类故障数据的样本划分图;
图5为本发明一种实施例的样本空间划分后的两个子分类面示意图。
具体实施方式
下面结合附图对本发明一种实施例做进一步说明。
本发明实施例中,基于样本分割的多尺度二叉树高炉故障诊断方法,方法流程图如图1所示,包括以下步骤;
步骤1、采集高炉生产状况历史数据和设备运行状态的历史故障类型;
本发明实施例中,所述的生产状况历史数据包括:风量(m3/min)、风压(Pa)、顶压(MPa)、压差、透气性、顶温(包含四点温度)、十字测温(包含中心和边缘)(℃)、料速(批/小时)、[Si]、物理热(℃);所述的设备运行状态的历史故障类型包括:向凉、向热、管道行程(中心管道和边缘管道)、悬料、崩料、低料线以及边缘气流过分发展、低料线以及边缘气流发展不足;
步骤2、对采集的历史数据进行归一化处理,获得训练样本集;
本发明实施例中,采用均值-方差标准化方法将数据进行归一化处理,并人工标记样本,得到训练样本集T={(x1,y1),(x2,y2),...,(xN,yN)}∈(X×Y)N,其中xi∈X=Rn表示第i个训练样本的数据向量,Rn表示样本空间,n表示样本的特征维数,本实施例中取值为14,yi∈Y={1,2….,k}表示第i个训练样本的故障类别,取值为整数;k表示故障种类。
Di表示第i类样本的子集, D 1 = { x i | y i = 1 } i = 1 l 1 , D 2 = { x i | y i = 2 } i = 2 l 2 ... D k = { x i | y i = k } i = k l k , Σ i k l i = N ;
本发明实施例中,如图3所示,共四类故障,分别是向凉、向热、悬料、崩料;其中,
向凉类故障共计800个训练样本,由高斯分布N(μ1,c1)生成,其中,期望 μ 1 = 0 0 ; 协方差矩阵 c 1 = 0.25 0.45 0.45 3 ;
向热类故障共计1000个训练样本,其中500个由高斯分布N(μ21,c21)生成,其中,期望 μ 21 = 5 5 , 协方差矩阵 c 21 = 0.3 - 0.5 - 0.5 2 , 其余由N(μ22c22)生成,其中,期望 μ 22 = - 4 - 2 , 协方差矩阵 c 22 = 0.2 0 0 2 ;
悬料类故障共计500个训练样本,由高斯分布N(μ3,c3)生成,其中,期望 μ 3 = 3.5 - 3.7 , 协方差矩阵 c 3 = 1 0.5 0.5 1 ;
崩料类故障共计400个训练样本,由高斯分布N(μ4,c4)生成,其中,期望 μ 4 = 3.5 - 3.7 , 协方差矩阵 c 4 = 1 0.5 0.5 1 ;
步骤3、采用极大似然估计法获得各类故障样本的均值和类内散度
s ^ i = Σ x i ∈ D i ( x i - u i ) T ( x i - u i ) ;
步骤4、构建二叉树分类器,从二叉树分类器中的根结点开始,采用改进广义特征值支持向量机方法,获得二叉树分类器各节点的一条距离正类训练样本最近且距离负类训练样本最远的分割面,再进一步获得分割后两部分各自的分类超平面,完成故障诊断模型的建立;
本发明实施例中,如图2所示,构建二叉树分类器,选取类内散度最大的类Di作为二叉树分类器中的根结点中的+1类,构成代表正类的训练样本集A1表示全部正类训练样本集合,m1表示根节点中的正类训练样本个数,从训练样本集T中剔除前述选取的正类样本集作为根节点中的-1类,构成代表负类的训练样本集B1表示全部负类训练样本集合,m2表示根节点中的负类训练样本个数;
本发明实施例中,为了降低对故障数据识别的复杂度,需要对节点中正类与负类的样本进行样本空间的划分,将其转化为两个二分类问题。对样本空间的划分所采用的方法是改进广义特征值支持向量机(简称Gepsvm),这里的改进是对原有的Gepsvm算法仅仅应用半幅:即仅寻找一个正类超平面,使得正类样本尽量接近此超平面时对负类样本尽量远离;算法对应线性与非线性两种情况考虑:
所述的超平面确定方式如下:
超平面法向量与参数的优化公式如下;
m i n ( ω i , b i ) ≠ 0 | | A i ω i + eb i | | 2 + δ | | ω i b i | | 2 | | B i ω i + eb i | | 2 - - - ( 1 )
其中,Ai表示第i类故障的正类训练样本集合;Bi表示表示第i类故障的负类训练样本集合;ωi表示超平面法向量;e表示分量全为1的列向量;bi∈R,R表示实数;δ>0,表示正则化因子,||·||表示L2范数;
令G=[Aie]T[Aie]+δI,H=[Bie]T[Bie],I表示单位矩阵, z = ω i b i , 则公式(1)转换为:
m i n z ≠ 0 z T G z z T H z - - - ( 2 )
求取Gz=λHz,z≠0的最小特征值λ对应的特征向量z,获得 ω i b i 最优解,即获得超平面 ω i T x + b i = 0 ;
(2)所述的曲面K(x,Cii+bi=0确定方式如下:
曲面法向量与参数的优化公式如下;
m i n ( ω i , b i ) ≠ 0 | | K ( A i , C i ) ω i + eb i | | 2 + δ | | ω i b i | | 2 | | K ( B i , C i ) ω i + eb i | | 2 - - - ( 3 )
其中, C i = A i B i 表示训练样本,核函数选取径向高斯核函数 K ( x i , x j ) = exp - ( d 2 ( x i , x j ) ) 2 σ 2 , σ为函数的宽度参数,距离d(xi,xj)=(xi-xj)T(xj-xj);
令G=[K(Ai,Ci)e]T[K(Ai,Ci)e]+δI,H=[K(Bi,Ci)e]T[K(Bi,Ci)e], z = ω i b i , 则公式(3)转换为公式(2):
求取Gz=λHz,z≠0的最小特征值λ对应的特征向量z,获得 ω i b i 最优解,即获得曲面K(x,Cii+bi=0。
本发明实施例中对向凉、向热、悬料、崩料这四类故障样本分别试行Gepsvm方法进行的样本空间划分如图4所示;所述的再进一步获得分割后两部分各自的分类超平面,具体方法如下:
步骤a、将正类训练样本集合和负类训练样本集合分别代入至分割面函数中,获得分割后的二分类集合;
本发明实施例中,将中的每一个样本带入超平面中得到两个分割后的二分类集合 T i 1 = { A i 1 + , B i 1 - } , f ( x ) = ω i T x + b i > 0 Y i 2 = { A i 2 + , A i 2 - } , f ( x ) = ω i T x + b i ≤ 0 , 其中,表示分割后的第一个子分类问题位于原样本空间的左侧,样本集分别表示子分类问题中的正类与负类;表示分割后的第二个子分类问题位于原样本空间的右侧,样本集分别表示子分类问题中的正类与负类;训练集分割法能减少支持向量机的训练和测试时间,同时降低问题复杂度,并能够有效解决涉及样本交叉问题;
步骤b、采用信息熵度量学习算法获取二分类样本集合的各自距离测度矩阵;
本发明实施例中,样本集Ti 1与Ti 2拥有各自的分布特性,因此针对它们的不同特点学习,利用度量学习中的信息熵度量学习算法(Information-TheoreticMetricLearning),学习不同距离测度矩阵Mi1和Mi2,具体如下:
ITML基于信息论的距离度量学习理论,利用信息论中的相对熵来学习度量矩阵,求解如下优化问题:
m i n M ≥ D l d ( M , M 0 ) s . t . t r ( M ( x i - x j ) ( x i - x j ) T ) ≤ u , ( ( x i , x j ) ∈ S ) t r ( M ( x i - x j ) ( x i - x j ) T ) ≥ l , ( ( x i , x j ) ∈ D ) - - - ( 8 )
其中,S表示同类样本集,D不是同类样本集;u和l为常数,表示阀值;本发明实施例中,u选取同类距离最远,而l的取值为两类距离最近为标准进行设定。
Dld(.)表示布雷格曼散度,tr(.)表示矩阵的迹,logdet(.)表示行列式对数,M0通常选取样本的协方差矩阵或欧氏距离来进行参数化,M为需找到的马氏矩阵;
算法在满足要求同类样本间的距离要小于等于常数u,而不同类的距离至少要大于等于常数l的情况下,以M0为输入在目标函数中选取正定的距离测度矩阵M;本发明实施例中,M0矩阵分别选取的协方差矩阵为输入,从而获取二叉树节点中的距离测度矩阵Mi1和Mi2
本发明实施例中, M 11 = 4.8 - 0.5 - 0.5 5 M 12 = 4 0.48 0.48 3.1 ;
步骤c、根据所获得二分类样本集合及距离测度矩阵,采用二分类支持向量机算法进一步获得分割后两部分各自的分类超平面函数;具体如下:
(1)分割后一部分的分类超平面函数确定方式如下:
min α 1 2 Σ i = 1 l i 1 Σ j = 1 l i 1 y i y j α i α j K ( x i · x j ) - Σ j = 1 l i 1 α j s . t . α i ≥ 0 , i = 2 , 3 , ... , l i 1 Σ i = 1 l i 1 y i α i = 0 - - - ( 4 )
其中,li1表示分割后子样本集的样本总数, 表示分割后子样本集中的正类,表示分割后子样本集中的负类;yi,yj∈Y={+1,-1},i,j=1,…,li1;αi、αj表示支持向量;核函数 K ( x i , x j ) = exp - ( d M 2 ( x i , x j ) ) 2 σ 2 , d M 2 ( x i , x j ) = ( x i - x j ) T M i 1 ( x i - x j ) , Mi1表示分割后其中一部分的距离度量矩阵;
获得分割后一部分的分类超平面函数fi1(x):
f i 1 ( x ) = sgn [ Σ i = 1 l i 1 α i y i K ( x i , x ) + b i 1 ] - - - ( 5 )
其中,bi1为常数;
(2)分割后另一部分的分类超平面函数确定方式如下:
min α 1 2 Σ i = 1 l i 2 Σ j = 1 l i 2 y i y j α i α j K ( x i · x j ) - Σ j = 1 l i 2 α j s . t . α i ≥ 0 , i = 2 , 3 , ... , l i 2 Σ i = 1 l i 2 y i α i = 0 - - - ( 6 )
其中,li2表示分割后子样本集的样本总数, 表示分割后子样本集中的正类,表示分割后子样本集中的负类;其中核函数
Mi2表示分割后其中另一部分的距离度量矩阵;
获得分割后另一部分的分类超平面函数fi2(x):
f i 2 ( x ) = sgn [ Σ i = 1 l i 2 α i y i K ( x i , x ) + b i 2 ] - - - ( 7 )
其中,bi2为常数。
本发明实施例中对向凉故障类样本选取为正类,将向热、悬料、崩料这三类看成负类,利用Gepsvm方法对样本空间划分,如图5中所示。图中直线将样本空间划分为两个二分类问题,图中左半部分曲线为所获取的分类超平面fi1(x),图中右半部分曲线为所获取的分类超平面fi2(x)。
步骤5、采集高炉生产状况实际数据,对采集的实际数据进行归一化处理;
步骤6、将归一化处理后的实际数据导入建立的故障诊断模型中,获得高炉实际所属故障类型,完成高炉故障诊断;具体如下:
步骤6-1、将实际数据代入二叉树分类器根结点中的分割面函数中;
步骤6-2、判断分割面函数值是否大于0,若是,则将数据代入到分割后其中一部分的分类超平面函数中,并执行步骤6-3;否则,将数据代入到分割后其中另一部分的分类超平面函数中,并执行步骤6-4;
步骤6-3、判断分类超平面函数值是否大于0,若是,则属于该类故障,否则,为非该类故障,并执行步骤6-5;
步骤6-4、判断分类超平面函数值是否大于0,若是,则属于该类故障,否则,为非该类故障,并执行步骤6-5;
步骤6-5、将非该类故障数据代入二叉树分类器下一节点的分割面函数中,返回执行步骤6-2。

Claims (7)

1.一种基于样本分割的多尺度二叉树高炉故障诊断方法,其特征在于,包括以下步骤;
步骤1、采集高炉生产状况历史数据和设备运行状态的历史故障类型;
步骤2、对采集的历史数据进行归一化处理,获得训练样本集;
步骤3、采用极大似然估计法获得各类故障样本的均值和类内散度;
步骤4、构建二叉树分类器,从二叉树分类器中的根结点开始,采用改进广义特征值支持向量机方法,获得二叉树分类器各节点的一条距离正类训练样本最近且距离负类训练样本最远的分割面,再进一步获得分割后两部分各自的分类超平面,完成故障诊断模型的建立;
步骤5、采集高炉生产状况实际数据,对采集的实际数据进行归一化处理;
步骤6、将归一化处理后的实际数据导入建立的故障诊断模型中,获得高炉实际所属故障类型,完成高炉故障诊断。
2.根据权利要求1所述的基于样本分割的多尺度二叉树高炉故障诊断方法,其特征在于,步骤1所述的生产状况历史数据包括:风量、风压、顶压、压差、透气性、顶温、十字测温、料速、硅和物理热;所述的设备运行状态的历史故障类型包括:向凉、向热、管道行程、悬料、崩料、低料线以及边缘气流过分发展、低料线以及边缘气流发展不足。
3.根据权利要求1所述的基于样本分割的多尺度二叉树高炉故障诊断方法,其特征在于,
步骤4所述的二叉树分类器中的根结点,其正类为类内散度最大的样本所对应的故障类型;其负类为训练样本集中除类内散度最大的样本以外的其余样本所对应的故障类型。
4.根据权利要求1所述的基于样本分割的多尺度二叉树高炉故障诊断方法,其特征在于,步骤4所述的获得二叉树分类器各节点的一条距离正类训练样本最近且距离负类训练样本最远的分割面,所述的分割面包括超平面和曲面;
(1)所述的超平面确定方式如下:
超平面法向量与参数的优化公式如下;
m i n ( ω i , b i ) ≠ 0 | | A i ω i + eb i | | 2 + δ | | ω i b i | | 2 | | B i ω i + eb i | | 2 - - - ( 1 )
其中,Ai表示第i类故障的正类训练样本集合;Bi表示表示第i类故障的负类训练样本集合;ωi表示超平面法向量;e表示分量全为1的列向量;bi∈R,R表示实数;δ>0,表示正则化因子,||·||表示L2范数;
令G=[Aie]T[Aie]+δI,H=[Bie]T[Bie],I表示单位矩阵, z = ω i b i , 则公式(1)转换为:
m i n z ≠ 0 z T G z z T H z - - - ( 2 )
求取Gz=λHz,z≠0的最小特征值λ对应的特征向量z,获得 ω i b i 最优解,即获得超平面 ω i T x + b i = 0 ;
(2)所述的曲面K(x,Cii+bi=0确定方式如下:
曲面法向量与参数的优化公式如下;
m i n ( ω i , b i ) ≠ 0 | | K ( A i , C i ) ω i + eb i | | 2 + δ | | ω i b i | | 2 | | K ( B i , C i ) ω i + eb i | | 2 - - - ( 3 )
其中, C i = A i B i 表示训练样本,核函数选取径向高斯核函数σ为函数的宽度参数,距离d(xi,xj)=(xi-xj)T(xi-xj);
令G=[K(Ai,Ci)e]T[K(Ai,Ci)e]+δI,H=[K(Bi,Ci)e]T[K(Bi,Ci)e], z = ω i b i , 则公式(3)转换为公式(2):
求取Gz=λHz,z≠0的最小特征值λ对应的特征向量z,获得 ω i b i 最优解,即获得曲面K(x,Cii+bi=0。
5.根据权利要求1所述的基于样本分割的多尺度二叉树高炉故障诊断方法,其特征在于,步骤4所述的再进一步获得分割后两部分各自的分类超平面,具体方法如下:
步骤a、将正类训练样本集合和负类训练样本集合分别代入至分割面函数中,获得分割后的二分类集合;
步骤b、采用信息熵度量学习算法获取二分类样本集合的各自距离测度矩阵;
步骤c、根据所获得二分类样本集合及距离测度矩阵,采用二分类支持向量机算法进一步获得分割后两部分各自的分类超平面函数。
6.根据权利要求1所述的基于样本分割的多尺度二叉树高炉故障诊断方法,其特征在于,步骤6所述的归一化处理后的实际数据导入建立的故障诊断模型中,获得高炉实际所属故障类型,具体如下:
步骤6-1、将实际数据代入二叉树分类器根结点中的分割面函数中;
步骤6-2、判断分割面函数值是否大于0,若是,则将数据代入到分割后其中一部分的分类超平面函数中,并执行步骤6-3;否则,将数据代入到分割后其中另一部分的分类超平面函数中,并执行步骤6-4;
步骤6-3、判断分类超平面函数值是否大于0,若是,则属于该类故障,否则,为非该类故障,并执行步骤6-5;
步骤6-4、判断分类超平面函数值是否大于0,若是,则属于该类故障,否则,为非该类故障,并执行步骤6-5;
步骤6-5、将非该类故障数据代入二叉树分类器下一节点的分割面函数中,返回执行步骤6-2。
7.根据权利要求5所述的基于样本分割的多尺度二叉树高炉故障诊断方法,其特征在于,步骤c所述的采用二分类支持向量机算法进一步获得分割后两部分各自的分类超平面函数,具体如下:
(1)分割后一部分的分类超平面函数确定方式如下:
min α 1 2 Σ i = 1 l i 1 Σ j = 1 l i 1 y i y j α i α j K ( x i · x j ) - Σ j = 1 l i 1 α j s . t . α i ≥ 0 , i = 1 , 2 , ... , l i 1 Σ i = 1 l i 1 y i α i = 0 - - - ( 4 )
其中,li1表示分割后子样本集Ti 1的样本总数, 表示分割后子样本集Ti 1中的正类,表示分割后子样本集Ti 1中的负类;yi,yj∈Y={+1,-1},i,j=1,…,li1;αi、αj表示支持向量;核函数 K ( x i , x j ) = exp - ( d M 2 ( x i , x j ) ) 2 σ 2 , d M 2 ( x i , x j ) = ( x i - x j ) T M i 1 ( x i - x j ) , Mi1表示分割后其中一部分的距离度量矩阵;
获得分割后一部分的分类超平面函数fi1(x):
f i 1 ( x ) = sgn [ Σ i = 1 l i 1 α i y i K ( x i , x ) + b i 1 ] - - - ( 5 )
其中,bi1为常数;
(2)分割后另一部分的分类超平面函数确定方式如下:
min α 1 2 Σ i = 1 l i 2 Σ j = 1 l i 2 y i y j α i α j K ( x i · x j ) - Σ j = 1 l i 2 α j s . t . α i ≥ 0 , i = 1 , 2 , ... , l i 2 Σ i = 1 l i 2 y i α i = 0 - - - ( 6 )
其中,li2表示分割后子样本集Ti 2的样本总数, 表示分割后子样本集Ti 2中的正类,表示分割后子样本集Ti 2中的负类;其中核函数 Mi2表示分割后其中另一部分的距离度量矩阵;
获得分割后另一部分的分类超平面函数fi2(x):
f i 2 ( x ) = sgn [ Σ i = 1 l i 2 α i y i K ( x i , x ) + b i 2 ] - - - ( 7 )
其中,bi2为常数。
CN201510902744.7A 2015-12-08 2015-12-08 一种基于样本分割的多尺度二叉树高炉故障诊断方法 Expired - Fee Related CN105550426B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510902744.7A CN105550426B (zh) 2015-12-08 2015-12-08 一种基于样本分割的多尺度二叉树高炉故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510902744.7A CN105550426B (zh) 2015-12-08 2015-12-08 一种基于样本分割的多尺度二叉树高炉故障诊断方法

Publications (2)

Publication Number Publication Date
CN105550426A true CN105550426A (zh) 2016-05-04
CN105550426B CN105550426B (zh) 2018-08-28

Family

ID=55829615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510902744.7A Expired - Fee Related CN105550426B (zh) 2015-12-08 2015-12-08 一种基于样本分割的多尺度二叉树高炉故障诊断方法

Country Status (1)

Country Link
CN (1) CN105550426B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563451A (zh) * 2017-09-18 2018-01-09 河海大学 一种泵站稳态工况下运行状态识别方法
CN107911762A (zh) * 2017-11-15 2018-04-13 国网安徽省电力公司宿州供电公司 一种基于决策树的onu故障诊断方法
CN107992886A (zh) * 2017-11-28 2018-05-04 中国大唐集团科学技术研究院有限公司华东分公司 一种燃机压气机设备故障趋势预测方法
CN108952699A (zh) * 2018-07-30 2018-12-07 中国地质大学(武汉) 一种复杂地质钻进过程地层岩性智能识别方法
CN109840413A (zh) * 2017-11-28 2019-06-04 中国移动通信集团浙江有限公司 一种钓鱼网站检测方法及装置
CN111639679A (zh) * 2020-05-09 2020-09-08 西北工业大学 一种基于多尺度度量学习的小样本学习方法
CN111651931A (zh) * 2020-05-19 2020-09-11 浙江大学 基于深度神经网络的高炉故障诊断规则导出方法
CN112345240A (zh) * 2019-08-08 2021-02-09 上海三菱电梯有限公司 机械零部件故障诊断系统
CN113255541A (zh) * 2021-06-01 2021-08-13 东北大学 一种基于本征模态函数重组信号相对熵的自适应流程工业过程的工艺参数去噪方法
CN116904673A (zh) * 2023-06-16 2023-10-20 北京科技大学 一种基于平稳特征提取的高炉异常炉况检测方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492705A (zh) * 2018-11-20 2019-03-19 南京航空航天大学 一种基于马氏距离(md)面积度量的故障诊断方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699432A (zh) * 2009-11-13 2010-04-28 黑龙江工程学院 基于排序策略的信息过滤系统
CN203309926U (zh) * 2013-05-31 2013-11-27 天津鹰麟节能科技发展有限公司 锅炉温度检测系统
CN104462846A (zh) * 2014-12-22 2015-03-25 山东鲁能软件技术有限公司 一种基于支持向量机的设备故障智能诊断方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699432A (zh) * 2009-11-13 2010-04-28 黑龙江工程学院 基于排序策略的信息过滤系统
CN203309926U (zh) * 2013-05-31 2013-11-27 天津鹰麟节能科技发展有限公司 锅炉温度检测系统
CN104462846A (zh) * 2014-12-22 2015-03-25 山东鲁能软件技术有限公司 一种基于支持向量机的设备故障智能诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WANG ANNA: "A New Process Industry Fault Diagnosis Algorithm Based on Ensemble Improved Binary-Tree SVM", 《CHINESE JOURNAL OF ELECTRONICS》 *
刘丽梅: "基于支持向量机新算法的流程工业过程故障诊断方法研究", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563451A (zh) * 2017-09-18 2018-01-09 河海大学 一种泵站稳态工况下运行状态识别方法
CN107911762A (zh) * 2017-11-15 2018-04-13 国网安徽省电力公司宿州供电公司 一种基于决策树的onu故障诊断方法
CN107992886A (zh) * 2017-11-28 2018-05-04 中国大唐集团科学技术研究院有限公司华东分公司 一种燃机压气机设备故障趋势预测方法
CN109840413A (zh) * 2017-11-28 2019-06-04 中国移动通信集团浙江有限公司 一种钓鱼网站检测方法及装置
CN109840413B (zh) * 2017-11-28 2020-12-22 中国移动通信集团浙江有限公司 一种钓鱼网站检测方法及装置
CN108952699A (zh) * 2018-07-30 2018-12-07 中国地质大学(武汉) 一种复杂地质钻进过程地层岩性智能识别方法
CN112345240A (zh) * 2019-08-08 2021-02-09 上海三菱电梯有限公司 机械零部件故障诊断系统
CN111639679B (zh) * 2020-05-09 2022-03-04 西北工业大学 一种基于多尺度度量学习的小样本学习方法
CN111639679A (zh) * 2020-05-09 2020-09-08 西北工业大学 一种基于多尺度度量学习的小样本学习方法
CN111651931A (zh) * 2020-05-19 2020-09-11 浙江大学 基于深度神经网络的高炉故障诊断规则导出方法
CN111651931B (zh) * 2020-05-19 2022-05-17 浙江大学 基于深度神经网络的高炉故障诊断规则导出方法
CN113255541A (zh) * 2021-06-01 2021-08-13 东北大学 一种基于本征模态函数重组信号相对熵的自适应流程工业过程的工艺参数去噪方法
CN113255541B (zh) * 2021-06-01 2023-08-29 东北大学 一种基于本征模态函数重组信号相对熵的自适应流程工业过程的工艺参数去噪方法
CN116904673A (zh) * 2023-06-16 2023-10-20 北京科技大学 一种基于平稳特征提取的高炉异常炉况检测方法
CN116904673B (zh) * 2023-06-16 2024-02-13 北京科技大学 一种基于平稳特征提取的高炉异常炉况检测方法

Also Published As

Publication number Publication date
CN105550426B (zh) 2018-08-28

Similar Documents

Publication Publication Date Title
CN105550426B (zh) 一种基于样本分割的多尺度二叉树高炉故障诊断方法
Bai et al. A comparison of dimension reduction techniques for support vector machine modeling of multi-parameter manufacturing quality prediction
Li et al. Data-driven bearing fault identification using improved hidden Markov model and self-organizing map
CN114240892B (zh) 一种基于知识蒸馏的无监督工业图像异常检测方法及系统
CN104793606B (zh) 基于改进的kpca和隐马尔科夫模型的工业故障诊断方法
CN107943856A (zh) 一种基于扩充标记样本的文本分类方法及系统
CN102831269A (zh) 一种流程工业过程工艺参数的确定方法
CN106156805A (zh) 一种样本标签缺失数据的分类器训练方法
CN106843195A (zh) 基于自适应集成半监督费舍尔判别的故障分类方法
CN108875933A (zh) 一种无监督稀疏参数学习的超限学习机分类方法及系统
CN102842043B (zh) 基于自动聚类的粒子群优化分类方法
JP2019067299A (ja) ラベル推定装置及びラベル推定プログラム
CN105843212B (zh) 一种高炉故障诊断系统及方法
Zeng et al. Steel sheet defect detection based on deep learning method
CN112231971A (zh) 基于相对整体趋势扩散故障样本生成的高炉故障诊断方法
Zhang et al. Feature-aligned stacked autoencoder: a novel Semisupervised deep learning model for pattern classification of industrial faults
CN117289736A (zh) 用于高温防腐储藏罐的温度控制方法及系统
CN111414943A (zh) 一种基于混合隐朴素贝叶斯模型的异常检测方法
CN117076871B (zh) 一种基于不平衡半监督对抗训练框架的电池故障分类方法
CN117349786B (zh) 基于数据均衡的证据融合变压器故障诊断方法
Liu et al. Unbalanced classification method using least squares support vector machine with sparse strategy for steel surface defects with label noise
CN111950652A (zh) 一种基于相似度的半监督学习数据分类算法
Li et al. An interpretable graph convolutional neural network based fault diagnosis method for building energy systems
CN116150687A (zh) 一种基于多分类g-wlstsvm模型的流体管道泄漏识别方法
CN111428510B (zh) 一种基于口碑的p2p平台风险分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180828

Termination date: 20211208

CF01 Termination of patent right due to non-payment of annual fee