CN112231971A

CN112231971A - 基于相对整体趋势扩散故障样本生成的高炉故障诊断方法

Info

Publication number: CN112231971A
Application number: CN202011029591.7A
Authority: CN
Inventors: 谢澍家; 杨春节
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2020-09-26
Filing date: 2020-09-26
Publication date: 2021-01-15
Anticipated expiration: 2040-09-26
Also published as: CN112231971B

Abstract

本发明公开了一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法，属于工业过程监测领域。本发明首先根据高炉参数的分析以及通过对不同故障训练数据的统计分析，选择不同故障各自的主特征以及辅特征；然后通过整体趋势扩散算法整体扩散技术推估故障小样本主特征的相对属性可接受范围；最后通过转化生成规则将高炉运行数据转化成故障数据，用于多分类器的训练来获得故障分类器。本发明根据对各种先验故障的具体分析将正常数据转化生成合理的高炉故障数据，从而有效的解决了因为样本量稀少及高炉运行工况多变引起的高炉小样本故障分类难题，并实现了较高的准确率。

Description

基于相对整体趋势扩散故障样本生成的高炉故障诊断方法

技术领域

本发明属于高炉故障诊断技术领域，具体涉及一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法。

背景技术

钢铁工业是国民经济的重要基础产业，是国家生存和发展的物质保障。作为钢铁制造流程的前端关键工序，炼铁生产线是能耗最大、排放最多的环节，约占钢铁工业总能耗的70％。炼铁生产线的生产质量和效率决定着整个钢铁制造流程的钢材质量和生产效率。高炉炼铁生产线操作安全性要求高，一旦出现事故，不仅会造成资源和设备的重大损失，而且甚至会造成重大人员伤亡。所以研究高炉炉况的智能故障诊断技术，及时并准确的对故障进行诊断有着重大的意义。

目前，钢铁工业常见的数据驱动故障诊断方法主要分为两类，一类是基于多元统计分析的方法，其中应用比较广泛的是PCA算法及其变种算法；另一类是人工智能方法，主要是基于神经网络和支持向量机。然而大部分的故障诊断算法只能做到定性判断，即判别是否故障，无法准确的判别故障的种类以及故障发生的位置，进一步的细分和定位往往需要高炉操作人员人工判断。

在高炉故障的诊断任务中，往往需要各种异常炉况下的训练样本，而高炉的生产运行缺少对此类数据的记录，使得异常炉况的样本数量极度不平衡，而且高炉生产过程运行工况动态多变，原燃料品质不确定，历史稀少且过时的故障数据无法动态的描述某一种具体的故障类型。由于上述的问题，导致诊断算法的准确性会随着高炉工况的变化而显著降低。

由于故障样本的难以获得，目前应用比较广泛的是对训练样本数依赖较小的是基于支持向量机及其变种算法，但是算法上的改进无法在根本上解决故障样本稀少和高炉工况变化的难题。

发明内容

针对现有技术的不足，本发明提出一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法，根据对先验故障的具体分析可以将大量正常数据转化生成合理的高炉故障数据，从而解决因为样本量稀少引起及高炉运行工况多变的高炉故障诊断难题。

一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法，包括以下步骤：

步骤一：采集高炉生产状况历史信息和设备运行状态的历史故障信息和类型，对于不同类型具体的高炉故障，根据高炉操作日志，确定发生故障的精确时刻，截取多种不同故障发生前3个小时的正常数据以及故障发生直至结束的故障数据，作为多组不同故障训练数据。

步骤二：根据热风压力的一阶差分的变化，识别各组故障历史数据中热风炉切换的时段，并去除每组历史数据中热风炉切换时段的样本。

具体步骤如下：

步骤2.1.针对每个数据样本X_i，计算该样本和前一个样本中热风压力HP的一阶差分os。

步骤2.2.判断当前的样本是否处于热风炉切换的开始阶段，需要同时满足以下两个条件：a.HP_i＜HP_th。b.os＜os_th1。

步骤2.3.判断当前的样本是否热风炉切换的持续阶段，需要满足以下三个条件：a. HP_i＜HP_th；b.os＞os_th2；c，前一个样本被判断为热风炉切换开始或者热风炉切换的持续阶段。

步骤2.4.判断当前的样本是否热风炉切换的结束阶段，需要满足以下两个条件：a. os＜os_th2 and os＞0；b，前一个样本被判断为热风炉切换的中间阶段。

步骤2.5.去除样本中热风炉切换开始、持续和结束阶段的数据。

其中，HP_th，os_th1，os_th2为阈值，根据高炉现场运行数据的测试，分别令HP_th＝0.38，os_th1＝-0.005，os_th2＝0.0002.

步骤三：对去除热风炉扰动的各组故障历史数据进行进一步去噪平滑处理，获得各类故障的训练样本集。

具体步骤如下：

步骤3.1.对各组故障训练数据分别进行去噪，计算各个特征的四分位数，剔除特征高于上限和低于下限的样本，上下限的计算公式为：

th_U＝x[Q₃]+1.5×(x[Q₃]-x[Q₁])

th_L＝x[Q₁]-1.5×(x[Q₃]-x[Q₁])

其中，x[·]代表表示顺序统计量，Q₁为第一四分位数，等于该特征中所有数值由小到大排列后第25％的数字。Q₃为第三四分位数，等于该特征中所有数值由小到大排列后第75％的数字。th_U表示该特征的上限，th_L表示该特征的下限。

步骤3.2.采用一维高斯核平滑算法对各组故障训练数据的各个特征分别进行平滑处理

步骤四：根据高炉参数的分析以及通过对不同故障训练数据的统计分析，相似性的评价分析以及使用原始二分类分类器进行正常和故障的分类，发现故障发生后各特征变化规律，选择不同故障各自的主特征，其余特征设为辅特征。

具体步骤如下：

步骤4.1.去除特征集合中由其他特征计算得到的间接特征，直接将其设为辅特征，例如透气性指数，富氧率。

步骤4.2.选取大量的训练样本，运用皮尔森相关系数和互信息系数对特征集合进行分组。具体的分组规则为：将所有特征两两计算皮尔森相关系数pcc和互信息系数mic，如果pcc∈[0.6，1]或者mic∈[0.5，1]，则将这两个特征分到同一特征组。最后得到特征组。

所述的皮尔森相关系数公式如下：

其中x，y是两个特征的值，E(·)为期望计算。

所示的互信息系数公式如下：

其中，B(n)＝n^0.6，n为特征的数量，n_x，n_y为对x，y构成的散点图进行i列j行网格化后分别的坐标值。

步骤4.3.针对k种故障训练集，将故障未发生期的数据标定为正样本，将故障发生期的样本标定为负样本。分别作为训练数据输入GBDT分类模型中，进行二分类训练。根据训练好的各种故障分类模型，对影响不同模型的特征进行特征重要性排序。得到k个故障特征重要性排序序列。

步骤4.4.针对步骤4.2得到的特征组，每组选取一个特征作为主特征。选取的依据为步骤 4.3得到的特征特征重要性排序序列，即每组中特征重要性最高的选为主特征，其余的选为辅特征。最后得到每种故障各自的主特征组和辅特征组。

步骤五：针对不同的故障，将步骤4中得到的所有主特征作为输入，分别将所有辅特征作为输出，训练得到辅特征个数的svr回归模型集合{svr₁₁，svr₁₂，...，svr_ij}，i代表故障种类，j 代表辅特征种类。

步骤六：针对步骤一到步骤三得到的不同故障训练数据，依次根据步骤四得到的不同故障各自的主特征集合，分别采用相对整体趋势扩散算法推估故障样本主特征的相对属性可接受范围。

利用每组训练数据故障发生期和故障未发生期的数据，应用相对整体扩散技术推估小样本主特征的相对属性可接受范围，得到主特征变化的范围。

所述的相对整体趋势扩散算法如下：

针对故障各自的主特征，利用正常集合X_no＝{x₁，x₂，x₃，...，x_n}故障集合X_ab＝{x₁，x₂，x₃，...，x_n}，由下式给出X转化的相对可接受范围下界L和上界U。

其中，

CL＝(max+min)/2

式中，n表示故障特征集大小，CL表示故障特征集数据中心，N_L表示故障特征集中样本值小于CL的个数，N_U表示故障特征集中样本值大于CL的个数，

表示故障特征集的方差，Skew_L表示描述数据非对称扩散特征的左偏度，Skew_U表示描述数据非对称扩散特征的右偏度， mean表示正常特征集的平均值。

步骤7：采集高炉现场的正常运行数据，分别将正常样本的主特征通过步骤6得到的故障样本生成规则转化成不同类型的不同程度的故障主特征，再通过步骤5所训练的svr回归模型生成不同故障的辅特征信息。获得合理的不同程度、类型的故障样本。

具体步骤如下：

步骤7.1.根据先验故障信息将故障等级分成微小、小、中、大、很大五级，因此首先对高炉故障后各主特征的偏离程度进行定义，根据先验知识分成五个等级。等级划分如下所示：

Figure 71514DEST_PATH_BDA0002702811720000104

其中，

R_i为主特征i偏离的程度，U_i为步骤四中得到的主特征i相对属性可接受范围的上界，L_i为步骤四中得到的主特征i相对属性可接受范围的下界，n_vl、n_l、n_n、n_h为从先验知识中得到此主特征的阈值，X_dev ⁱ为此主变量的偏离值；

步骤7.2.生成不同程度故障的样本的主特征偏移量。为了将正常样本转化生成不同程度的故障，首先根据程度随机生成各主特征的偏移量。例如生成正常程度的故障样本，依次随机生成各主特征的偏移量，主特征的偏移量X_dev ⁱ需要满足步骤7.1中R_i＝normal的范围，最后得到一组正常程度的主特征偏移量。

步骤7.3.重复步骤7.2，生成大量不同程度的主特征偏移量。选取较近的征程运行历史数据，采用一对一的原则，将正常样本的主特征量加上主特征偏移量，初步形成故障样本的主特征量。再结合正常样本的辅特征量以及步骤五中训练的svr模型的预测量，最终形成故障样本的辅特征量。则最终形成的故障样本为主特征和辅特征的并集。具体的计算公式如下：

X_G ⁱ＝Xⁱ+X_dev ⁱ

X_G ^j＝λX^j+(1-λ)svr_kj(X_G ¹，X_G ²，...，X_G ⁱ)

λ＝max(dev(X_dev ¹)，dev(X_dev ²)，...，dev(X_dev ⁱ))

其中，

X_G ⁱ为最终转化形成的主特征量，X_G ^j为最终转化形成的辅特征量，Xⁱ为转化前正常样本的主特征量，X^j为转化前正常样本的辅特征量，svr_kj为svr模型的输出值，k代表故障种类， j代表辅特征种类。dev为主特征的偏离程度，U_i为步骤四中得到的主特征i相对属性可接受范围的上界，L_i为步骤四中得到的主特征i相对属性可接受范围的下界。

步骤8：针对不同类型的故障，重复执行步骤7，得到不同种类故障的生成样本，再将得到的故障样本和转化前的正常数据作为训练集，采用多分类朴素贝叶斯分类方法，完成故障诊断模型的建立。根据故障诊断模型对高炉进行故障诊断。

所述的故障为高炉冶炼过程中的故障。

本发明的有益效果：

1.本发明首次提出了一种基于相对整体趋势扩散故障样本生成方法，本发明根据对历史先验故障的具体分析提取特定故障对特征的影响，从而可以在线将较新的正常数据转化生成特定合理的高炉故障数据，这些故障数据结合了当前的工况信息，比历史的真实的故障数据更符合当前训练模型的需要，即提出一种能够生成大量合理的故障样本的数据扩展技术方案，这些故障样本能够代表具体的故障，并且包含高炉运行的工况信息。这些合理的故障数据可以从根本上解决因为样本量稀少引起的高炉故障诊断难题。

2.本发明首次利用生成的当前故障样本和正常运行的样本对多分类器进行训练，使诊断准确率提高，可应用于样本量稀少及高炉运行工况多变引起的高炉故障。

附图说明

图1为本发明一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法流程图。

图2为本发明的一种实施例的热风炉切换检测示意图。

图3为本发明的一种实施例的皮尔森相关系数示意图。

图4为本发明的一种实施例的互信息系数示意图。

具体实施方式

本发明的目的在于提供一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法，流程框图如图1所示，下面利用某钢铁厂2号高炉采集的高炉数据来验证本发明方法的有效性。本发明实施例中所述的生产过程中采集到的数据特征包括透气性指数、冷风流量、热风流量、顶压、冷风压力、热风压力等32个参数，如表一所示。本发明实施例中所述的设备运行的历史故障类型包括：难行、悬料、管道、崩料、炉热、炉凉。

接下来结合该具体过程对本发明的实施步骤进行详细阐述：

步骤一：采集高炉生产状况历史信息和设备运行状态的历史故障信息和类型。对于不同类型具体的高炉故障，根据高炉操作日志以及高炉操作工的确认，确定发生故障的精确时刻，截取故障发生前3个小时的正常数据以及故障发生直至结束的故障数据，作为一组训练数据。从中选取不同故障的具有代表性的样本组。

本发明实施例中，所述的历史数据得到样本训练集：T＝{T₁，T₂，...，T_k}，其中 T_i＝{(X₁，Y₁)，(X₂，Y₂)，...，(X_n，Y_n)}∈(X×Y)^N，X_i∈X＝Rⁿ表示第i个训练样本的数据向量，Rⁿ表示样本空间，n表示样本的特征维数，本实例取值为32，Y_i∈Y＝{0，1}，0表示正常期，1表示故障期。

表一特征变量列表

本发明实例中，多分类为四类：正常，向凉，管道，难行。

步骤2：根据热风压力的一阶差分的变化，识别各组故障历史数据中热风炉切换的时段，并去除每组训练数据中热风炉切换时段的样本：

针对每个数据样本X_i，计算该样本和前一个样本中热风压力HP的一阶差分os。判断当前的样本处于热风炉切换的开始、持续还是结束阶段。开始阶段需要同时满足以下两个条件：1) HP_i＜HP_th。2)os＜os_th1。持续阶段需要满足以下三个条件：1)HP_i＜HP_th。2)os＞os_th2。3) 前一个样本被判断为热风炉切换开始或者热风炉切换的持续阶段。结束阶段需要满足以下两个条件：1)os＜os_th2 and os＞0。2)前一个样本被判断为热风炉切换的中间阶段。

最后去除样本中热风炉切换开始、持续和结束阶段的数据。

其中，HP_th，os_th1，os_th2为阈值，根据高炉现场运行数据的测试，分别令HP_th＝0.38，os_th1＝-0.005，os_th2＝0.0002.其中检测结果如图2所示。

步骤三：对去除热风炉扰动的各组故障历史数据进行进一步去噪平滑以及归一化处理，获得各类故障的训练样本集。具体步骤如下：

对各组故障训练数据分别进行去噪，计算各个特征的四分位数，剔除特征高于上限和低于下限的样本，上下限的计算公式为：

th_U＝x[Q₃]+1.5×(x[Q₃]-x[Q₁])

th_L＝x[Q₁]-1.5×(x[Q₃]-x[Q₁])

然后采用一维高斯核平滑算法对各组故障训练数据的各个特征分别进行平滑处理。

具体步骤如下：

a.去除特征集合中由其他特征计算得到的间接特征，直接将其设为辅特征，例如透气性指数，富氧率。

b.选取大量的训练样本，运用皮尔森相关系数和互信息系数对特征集合进行分组。具体的分组规则为：将所有特征两两计算皮尔森相关系数pcc和互信息系数mic，如果pcc∈[0.6，1] 或者mic∈[0.5，1]，则将这两个特征分到同一特征组。最后得到特征组。高炉特征的皮尔森相关系数和互信息系数如图3，4所示。

所述的皮尔森相关系数公式如下：

其中x，y是两个特征的值，E(·)为期望计算。

所示的互信息系数公式如下：

高炉特征相关性分组如表二所示。

表二高炉特征相关性分组

c.针对k种故障训练集，将故障未发生期的数据标定为正样本，将故障发生期的样本标定为负样本。分别作为训练数据输入GBDT分类模型中，进行二分类训练。根据训练好的各种故障分类模型，对影响不同模型的特征进行特征重要性排序。得到k个故障特征重要性排序序列。

管道故障的原始二分类器特征重要性排序如表三所示。

表三管道故障原始二分类器特征重要性排序

d.针对得到的特征组，每组选取一个特征作为主特征。选取的依据为得到的特征特征重要性排序序列，即每组中特征重要性最高的选为主特征，其余的选为辅特征。最后得到每种故障各自的主特征组和辅特征组。

管道故障的主特征和辅特征分组如表四所示，其中，序号加粗的表示管道故障的主特征，不加粗的为辅特征。

表四管道故障主特征组和辅特征分组列表

所述的相对整体趋势扩散算法如下：

其中，

CL＝(max+min)/2

表示故障特征集的方差， Skew_L表示描述数据非对称扩散特征的左偏度，Skew_U表示描述数据非对称扩散特征的右偏度， mean表示正常特征集的平均值。

具体步骤如下：

a.根据先验故障信息将故障等级分成微小、小、中、大、很大五级，因此首先对高炉故障后各主特征的偏离程度进行定义，根据先验知识分成五个等级。等级划分如下所示：

其中，

R_i为主特征i偏离的程度，U_i为步骤四中得到的主特征i相对属性可接受范围的上界，L_i为步骤四中得到的主特征i相对属性可接受范围的下界，n_vl、n_l、n_n、n_h为从先验知识中得到此主特征的阈值，X_dev ⁱ为此主变量的偏离值，在此实例中设定n_vl＝0.1、n_l＝0.3、n_n＝0.5、 n_h＝0.8。

b.生成不同程度故障的样本的主特征偏移量。为了将正常样本转化生成不同程度的故障，首先根据程度随机生成各主特征的偏移量。例如生成正常程度的故障样本，依次随机生成各主特征的偏移量，主特征的偏移量X_dev ⁱ需要满足步骤7.1中R_i＝normal的范围，最后得到一组正常程度的主特征偏移量。

c.重复步骤7.2，生成大量不同程度的主特征偏移量。选取较近的征程运行历史数据，采用一对一的原则，将正常样本的主特征量加上主特征偏移量，初步形成故障样本的主特征量。再结合正常样本的辅特征量以及步骤五中训练的svr模型的预测量，最终形成故障样本的辅特征量。则最终形成的故障样本为主特征和辅特征的并集。具体的计算公式如下：

X_G ⁱ＝Xⁱ+X_dev ⁱ

X_G ^j＝λX^j+(1-λ)svr_kj(X_G ¹，X_G ²，...，X_G ⁱ)

λ＝max(dev(X_dev ¹)，dev(X_dev ²)，...，dev(X_dev ⁱ))

其中，

本发明方法根据对历史先验故障的具体分析提取特定故障对各特征的影响，在线将较新的正常数据转化生成特定合理的高炉故障数据，这些故障数据结合了当前的工况信息，比历史的真实的故障数据更符合当前训练模型的需要。因此本发明相比于其他已有的高炉故障分类方法有着更高的准确率。

以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明，应理解的是以上所述仅为本发明的实施例，并不用于限制本发明，凡在本发明的原则范围内所做的任何修改、补充和等同替换等，均应包含在本发明的保护范围之内。

Claims

1.一种基于相对整体趋势扩散故障样本生成的高炉故障诊断方法，

其特征在于，包括以下步骤：

步骤一：采集高炉生产状况历史信息和设备运行状态的历史故障信息和类型，对于不同类型具体的高炉故障，根据高炉操作日志，确定发生故障的时刻，截取多种不同故障发生前3个小时的正常数据以及故障发生直至结束的故障数据，作为多组不同故障训练数据；

步骤二：根据热风压力的一阶差分的变化，识别各组故障历史数据中热风炉切换的时段，并去除每组历史数据中热风炉切换时段的样本；

步骤三：对去除热风炉扰动的各组故障历史数据进行进一步去噪平滑处理，获得各类故障的训练样本集；

步骤四：根据高炉参数的分析以及通过对不同故障训练数据的统计分析，相似性的评价分析以及使用原始二分类分类器进行正常和故障的分类，发现故障发生后各特征变化规律，选择不同故障各自的主特征，其余特征设为辅特征；

步骤五：针对不同的故障，将步骤四中得到的所有主特征作为输入，分别将所有辅特征作为输出，训练得到辅特征个数的svr回归模型集合{svr₁₁，svr₁₂，...，svr_kj}，k代表故障种类，j代表辅特征种类；

步骤六：针对步骤一到三得到的不同故障训练数据，依次根据步骤四得到的不同故障各自的主特征集合，分别采用相对整体趋势扩散算法整体扩散技术推估故障样本主特征的相对属性可接受范围；

步骤七：采集高炉现场时间较近的正常运行数据，分别将正常样本的主特征通过步骤六得到的故障样本生成规则转化成不同类型的不同程度的故障主特征，再通过步骤五所训练的svr回归模型生成不同故障的辅特征信息，获得合理的不同程度、类型的故障样本；

步骤八：将步骤六中得到的故障样本和正常数据一起作为输入，采用多分类朴素贝叶斯分类方法，完成故障诊断模型的建立，根据故障诊断模型对高炉进行故障诊断。

2.根据权利要求1所述的方法，其特征在于，所述的步骤二中的步骤如下：

步骤2.1.针对每个数据样本X_i，计算该样本和前一个样本中热风压力HP的一阶差分os；

步骤2.2.判断当前的样本是否处于热风炉切换的开始阶段，需要同时满足以下两个条件：a.HP_i＜HP_th；b.os＜os_th1；

步骤2.3.判断当前的样本是否热风炉切换的持续阶段，需要满足以下三个条件：a.HP_i＜HP_th；b.os＞os_th2；c，前一个样本被判断为热风炉切换开始或者热风炉切换的持续阶段；

步骤2.4.判断当前的样本是否热风炉切换的结束阶段，需要满足以下两个条件：a.os＜os_th2 and os＞0；b，前一个样本被判断为热风炉切换的持续阶段；

步骤2.5.去除样本中热风炉切换开始、持续和结束阶段的数据；

其中，HP_th，os_th1，os_th2为阈值，根据高炉现场运行数据的测试，分别令HP_th＝0.38，os_th1＝-0.005，os_th2＝0.0002。

3.根据权利要求1所述的方法，其特征在于，所述的步骤四中选取各种故障的主特征以及辅特征的具体步骤如下：

步骤4.1.去除特征集合中由其他特征计算得到的间接特征，直接将其设为辅特征，包括透气性指数，富氧率；

步骤4.2.选取大量的训练样本，运用皮尔森相关系数和互信息系数对特征集合进行分组，分组规则为：将所有特征两两计算皮尔森相关系数pcc和互信息系数mic，如果pcc∈[0.6，1]或者mic∈[0.5，1]，则将这两个特征分到同一特征组，最后得到特征组；

所述的皮尔森相关系数公式如下：

其中x，y是两个特征的值，E(·)为期望计算；

所示的互信息系数公式如下：

其中，B(n)＝n^0.6，n为特征的数量，n_x，n_y为对x，y构成的散点图进行i列j行网格化后分别的坐标值；

步骤4.3.针对k种故障训练集，将故障未发生期的数据标定为正样本，将故障发生期的样本标定为负样本，分别作为训练数据输入GBDT分类模型中，进行二分类训练，根据训练好的各种故障分类模型，对影响不同模型的特征进行特征重要性排序，得到k个故障特征重要性排序序列；

步骤4.4.针对步骤4.2得到的特征组，每组选取一个特征作为主特征，选取的依据为步骤4.3得到的特征特征重要性排序序列，即每组中特征重要性最高的选为主特征，其余的选为辅特征，最后得到每种故障各自的主特征组和辅特征组。

4.根据权利要求1所述的方法，其特征在于，所述的步骤六中相对属性可接受范围的计算方式如下所示：

利用每组训练数据故障发生期和故障未发生器的数据，应用相对整体扩散技术推估小样本主特征的相对属性可接受范围，得到主特征变化的范围；

所述的相对整体趋势扩散算法如下：

针对故障某主特征，利用正常集合X_no＝{x₁，x₂，x₃，...，x_n}故障集合X_ab＝{x₁，x₂，x₃，...，x_n}，由下式给出X转化的相对可接受范围下界L和上界U；

其中，

CL＝(max+min)/2

表示故障特征集的方差，Skew_L表示描述数据非对称扩散特征的左偏度，Skew_U表示描述数据非对称扩散特征的右偏度，mean表示正常特征集的平均值。

5.根据权利要求1所述的方法，其特征在于，所述的步骤七中对于正常样本转化不同故障样本的具体步骤如下：

步骤7.1.根据先验故障信息将故障等级分成微小、小、中、大、很大五级，因此首先对高炉故障后各主特征的偏离程度进行定义，根据先验知识分成五个等级，等级划分如下所示：

其中，

步骤7.2.生成不同程度故障的样本的主特征偏移量，为了将正常样本转化生成不同程度的故障，首先根据程度随机生成各主特征的偏移量，生成正常程度的故障样本，依次随机生成各主特征的偏移量，主特征的偏移量X_dev ⁱ需要满足步骤7.1中R_i＝normal的范围，最后得到一组正常程度的主特征偏移量；

步骤7.3.重复步骤7.2，生成大量不同程度的主特征偏移量，选取较近的征程运行历史数据，采用一对一的原则，将正常样本的主特征量加上主特征偏移量，初步形成故障样本的主特征量，再结合正常样本的辅特征量以及步骤五中训练的svr模型的预测量，最终形成故障样本的辅特征量，则最终形成的故障样本为主特征和辅特征的并集，具体的计算公式如下：

X_G ⁱ＝Xⁱ+X_dev ⁱ

X_G ^j＝λX^j+(1-λ)svr_kj(X_G ¹，X_G ²，...，X_G ⁱ)

λ＝max(dev(X_dev ¹)，dev(X_dev ²)，...，dev(X_dev ⁱ))

其中，

X_G ⁱ为最终转化形成的主特征量，X_G ^j为最终转化形成的辅特征量，Xⁱ为转化前正常样本的主特征量，X^j为转化前正常样本的辅特征量，svr_kj为svr模型的输出值，k代表故障种类，j代表辅特征种类，dev为主特征的偏离程度，U_i为步骤四中得到的主特征i相对属性可接受范围的上界，L_i为步骤四中得到的主特征i相对属性可接受范围的下界。