CN116842402A

CN116842402A - 基于孪生神经网络提取平稳特征的高炉异常炉况检测方法

Info

Publication number: CN116842402A
Application number: CN202311119324.2A
Authority: CN
Inventors: 张瀚文; 樊薇薇; 董洁; 彭开香
Original assignee: University of Science and Technology Beijing USTB
Current assignee: University of Science and Technology Beijing USTB
Priority date: 2023-09-01
Filing date: 2023-09-01
Publication date: 2023-10-03
Anticipated expiration: 2043-09-01
Also published as: CN116842402B

Abstract

本发明提供一种基于孪生神经网络提取平稳特征的高炉异常炉况检测方法，属于自动检测技术领域。所述方法包括：建立基于孪生神经网络的平稳特征提取模型以及损失函数；离线训练，根据损失函数对构建的平稳特征提取模型进行训练，计算训练集的平稳分量，建立平稳分量的凸包；在线检测，根据训练后的平稳特征提取模型，计算出测试集的平稳分量，进行凸包检测，当样本位于凸包的外侧，认为炉况异常。与传统的基于高斯混合分布的平稳子空间分析方法相比，本发明方法考虑了高炉数据的非线性，减少了误报率，提前了故障检测时间，更符合高炉数据特征且更为高效。

Description

基于孪生神经网络提取平稳特征的高炉异常炉况检测方法

技术领域

本发明涉及自动检测技术领域，尤其涉及一种基于孪生神经网络提取平稳特征的高炉异常炉况检测方法。

背景技术

钢铁工业是现代工业和国民经济的重要支柱产业，而高炉炼铁是整个钢铁工业的核心环节，它的能耗占钢铁生产总能耗的比例高达70%。实现高炉炼铁工艺的稳定运行对钢铁工业的节能减排至关重要。在高炉炼铁过程中，由于人员误操作、设备故障等，高炉炉况时常发生异常情况。高炉炉况一旦发生故障，不仅会导致原材料消耗增加、炼铁质量下降、设备故障频发等问题，甚至有可能造成人员伤亡。因此，保持高炉的安全、连续、稳定运行至关重要。如果能够尽早地发现高炉故障并对其进行控制调整，就能有效避免由故障带来的损失。高炉异常炉况的监测对于高炉的安全和稳定进行十分重要。

近年来，随着数字化转型时代的到来，数据测量和存储技术的不断发展，积累了丰富的高炉炼铁过程数据，数据驱动的过程监测方法引起了人们的广泛关注。然而，高炉具有复杂的非平稳、非线性和非高斯特性，再加上高炉内未知的物理和化学反应。因此，研究人员很难准确完整地描述高炉炼铁过程的工作原理。而一些传统提取平稳特征的方法，如平稳子空间分析法（SSA）和动态平稳子空间分析法（DSSA）等是通过线性变换来实现平稳子空间和非平稳子空间的分离，因此假定观测变量是平稳和非平稳分量的线性组合。但这一假设在实际工业过程中可能难以满足，因此上述算法并不适用于实际的工业数据。

发明内容

针对上述问题，本发明的目的在于提供一种基于孪生神经网络提取平稳特征的高炉异常炉况检测方法，采用孪生神经网络来拟合数据的非线性，提取平稳特征，能够提高异常炉况检测的效率和准确性。

为解决上述技术问题，本发明提供如下技术方案：

一种基于孪生神经网络提取平稳特征的高炉异常炉况检测方法，包括以下步骤：

步骤1：建立基于孪生神经网络的平稳特征提取模型以及损失函数；

步骤2：离线训练，根据损失函数对构建的平稳特征提取模型进行训练，计算训练集的平稳分量，建立平稳分量的凸包；

步骤3：在线检测，根据训练后的平稳特征提取模型，计算出测试集的平稳分量，进行凸包检测，当样本位于凸包的外侧，认为炉况异常。

优选地，所述孪生神经网络用于比较两个输入样本并确定它们的相似程度；所述孪生神经网络包括两个相同的子网络，两个子网络的网络结构以及权重都共享；所述孪生神经网络由三个部分组成：输入层、子网络和输出层；其中，输入层接收两个输入样本，两个子网络分别提取两个输入样本的隐藏特征，输出层计算两个输入样本之间的相似性。

优选地，步骤1中损失函数的构建过程如下：

步骤1.1：获取不同时段数据提取的隐藏特征之间分布的差异，具体内容如下：

损失函数的第一项是不同时段数据提取的隐藏特征之间分布的差异，这种差异通过瓦瑟斯坦距离，即WD来测量；WD衡量把数据从分布p移动成分布q时所需要移动的平均距离的最小值；假设和/>是来自范数向量空间/>的d维随机向量，其中/>是基本范数，和/>是两个概率度量，/>，/>；

和/>之间的p-Wasserstein 距离定义如下：

（1）

这里，/>是/>上的概率度量/>的集合，其边际分布分别是/>和/>；在实际应用中，基本范数/>设为欧几里得范数；此外，令/>，/>变成欧氏距离；

步骤1.2：保留原始数据的局部信息，具体内容如下：

引入t-SNE来构建一个可以衡量原始信息保留程度的损失项；

t-SNE 将高维数据转换到低维空间，同时保留原始数据中的相似性和结构；t-SNE算法使用概率分布来衡量高维空间和低维空间中数据点之间的相似性；给定一个高维空间的数据集，其中N是样本数，t-SNE 的目标是将高维数据转换为低维映射/>，其中/>；这样，如果高维空间中的点/>和/>很接近，那么它们对应的低维空间中的点/>和/>也很接近；

t-SNE算法首先计算所有数据对的联合概率分布，由一个对称矩阵表示，其中/>，/>，且/>;

（2）

/> （3）

其中，是距离度量，/>是调整参数，根据困惑度量和二分搜索策略来确定；

同理，通过一个对称矩阵来定义所有数据对/>的联合概率分布，其中/>，/>，且/>;

（4）

和/>是两个概率分布矩阵，用于描述数据点在高维空间和低维空间中的相似性；t-SNE算法能找到一个低维映射/>，使/>和/>之间的KL散度最小，

（5）

步骤1.3：消除特征之间的相关性，具体内容如下：

为了确保提取的特征相互独立，去除掉冗余特征，这里添加一个项来使提取特征的协方差矩阵为单位阵，以得到具有去相关性平稳特征；

以上三项构成了最终的损失函数，表述为：

（6）

其中 α > 0 和 β > 0 是权重超参数，代表第i段训练数据的隐藏特征，WD代表计算两个时段隐藏特征之间分布的WD，/>代表第i个时段的训练数据，/>和/>分别代表第i个时段训练数据和其隐藏特征的概率分布矩阵，/>代表计算协方差矩阵，/>代表F范数的平方。

优选地，步骤2中离线训练具体包括以下步骤：

步骤2.1：收集非平稳被监控对象正常的历史过程数据作为训练集；

步骤2.2：构建长度为w的滑动时间窗口，采用单步滑动构成增广矩阵，并做标准化处理；

（7）

其中N是样本数，m为样本维数，是第i个样本；

令，增广矩阵的均值向量为/>，协方差矩阵为/>，然后将增广矩阵进行标准化处理，可得标准化之后的增广矩阵为：

（8）

步骤2.3：用Johansen协整检验确定平稳源数目d；

步骤2.4：将标准化的增广矩阵划分为n个时段，；

划分的时段数n应满足：

（9）

步骤2.5：基于训练后的平稳特征提取模型得到训练数据的平稳分量；

步骤2.6：利用MATLAB中的convhull函数构造的凸包。

优选地，步骤3中在线检测具体包括以下步骤：

步骤3.1：加载的凸包；

步骤3.2：对于在线监测样本，构造/>，并做标准化处理：

步骤3.3：将输入到训练后的平稳特征提取模型中，得到/>的平稳分量/>；

步骤3.4：根据凸包检测原理，计算监测统计量，如果/>则认为该样本异常；

凸包表示包含一个有限样本集的最小凸集合，给定一个样本集Z，它的凸包表示为C(Z)，即在所有包围样本集的凸集合中，C(Z)的体积是最小的；因此凸包的描述形式适合用于对高炉数据的故障检测；

（10）

如果一测试样本的平稳分量位于凸包内部，则该测试样本正常，反之，如果测试样本的平稳分量位于凸包外部，则/>该样本异常。

与现有技术相比，本发明提供的技术方案具有以下有益效果：

首先，与传统的动态平稳子空间分析方法相比，本发明提出的方法采用孪生神经网络提取平稳特征，能够很好地拟合数据的非线性；采用WD衡量不同分布之间的差异性，不需要高斯分布的假设，更符合高炉过程数据的数据特征，可以自动判断由于热风炉切换造成的扰动，从而降低误报率；其次，与传统的平稳特征提取方法相比，本发明提出的方法能够更早地检测出异常炉况。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的基于孪生神经网络提取平稳特征的高炉异常炉况检测方法的流程图；

图2是根据本发明一种实施例的孪生神经网络的结构示意图；

图3（a）-图3（e）分别是根据本发明一个正常高炉过程数据的误报检测图、基于高斯混合模型的动态平稳子空间分析法（DSSA-GMM）的误报检测图、移动窗口主成分分析方法的霍特林T²（MWPCA-T²）统计量的误报检测图、协整分析法（Cointegration analysis）的误报检测图、核平稳子空间分析法（KSSA）的误报检测图；

图4（a）-图4（e）分别是利用本发明方法进行炉况异常检测的过程监控图、利用基于高斯混合模型的动态平稳子空间分析法（DSSA-GMM）进行炉况异常检测的过程监控图、利用移动窗口主成分分析方法的霍特林T²（MWPCA-T²）统计量进行炉况异常检测的过程监控图、利用协整分析法（Cointegration analysis）进行炉况异常检测的过程监控图、利用核平稳子空间分析法（KSSA）进行炉况异常检测的过程监控图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例的附图，对本发明实施例的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于所描述的本发明的实施例，本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的实施例提供了一种基于孪生神经网络提取平稳特征的高炉异常炉况检测方法，如图1所示，所述方法包括以下步骤：

步骤1：建立基于孪生神经网络的平稳特征提取模型以及损失函数。

孪生神经网络（siamese neural network（SNN））是一种特殊的神经网络架构，用于比较两个输入样本并确定它们的相似程度。孪生神经网络包括两个相同的子网络，两个子网络的网络结构以及权重都共享；孪生神经网络由三个部分组成：输入层、子网络和输出层；其中，输入层接收两个输入样本，两个子网络分别提取两个输入样本的隐藏特征，输出层计算两个输入样本之间的相似性。

如图2所示，是根据本发明一种实施例的孪生神经网络的结构示意图。对于具有时序性的高炉炼铁过程，使用长短期记忆（LSTM）网络来作为孪生神经网络的子网络。时间序列矩阵被划分为n个不重叠的时段，/>，其中，q和mw分别为划分时间窗口后训练数据的每个历元的样本数和数据维度。/>代表/>的第一个样本，/>代表/>的隐藏特征。将n段训练数据输入到具有n个相同子网络的孪生神经网络中，提取隐藏特征/>，其中 d 是平稳源数目。

步骤1中损失函数的构建过程如下：

和/>之间的p-Wasserstein 距离定义如下：

（1）

步骤1.2：保留原始数据的局部信息，具体内容如下：

如果只优化隐藏特征的平稳性，就有可能得到恒等于0的特征，从而丢失原始数据中包含的局部信息。因此，有必要构建一个可以衡量原始信息保留程度的损失项。可以通过确保每个时段内样本之间关系的一致性来保留原始信息。这里引入了t-SNE（t-distributed stochastic neighbor embedding）来实现这种损失项。

引入t-SNE来构建一个可以衡量原始信息保留程度的损失项；

（2）

/> （3）

（4）

（5）

步骤1.3：消除特征之间的相关性，具体内容如下：

以上三项构成了最终的损失函数，表述为：

（6）

步骤2：离线训练；根据损失函数对构建的平稳特征提取模型进行训练，计算训练集的平稳分量，建立平稳分量的凸包。

步骤2中离线训练具体包括以下步骤：

（7）

其中N是样本数，m为样本维数，是第i个样本；

令，增广矩阵的均值向量为，协方差矩阵为/>，然后将增广矩阵进行标准化处理，可得标准化之后的增广矩阵为：

（8）

步骤2.3：用Johansen协整检验确定平稳源数目d；

步骤2.4：将标准化的增广矩阵划分为n个时段，；

如果n太小，就会存在虚假平稳源，其分布在整个时间序列上似乎是平稳的，实际上包含了非平稳源，那么真正的平稳源就不能被识别，划分的时段数n应满足：

（9）

步骤2.6：利用MATLAB中的convhull函数构造的凸包。

步骤3：在线检测；根据训练后的平稳特征提取模型，计算出测试集的平稳分量，进行凸包检测，当样本位于凸包的外侧，认为炉况异常。

步骤3中在线检测具体包括以下步骤：

步骤3.1：加载的凸包；

步骤3.2：对于在线监测样本，构造/>，并做标准化处理：

凸包表示包含一个有限样本集的最小凸集合，给定一个样本集Z，它的凸包表示为C(Z)，即在所有包围样本集的凸集合中，C(Z)的体积是最小的；因此凸包的描述形式更为准确和保守，适合用于对高炉数据的故障检测；

（10）

将正常的高炉数据作为测试集计算误报率，如图3（a）-图3（e）所示。其中，图3（a）是采用本发明方法的误报检测图，图3（b）是基于高斯混合模型的动态平稳子空间分析法（DSSA-GMM）的误报检测图，图3（c）是移动窗口主成分分析方法的霍特林T²（MWPCA-T²）统计量的误报检测图，图3（d）是协整分析法（Cointegration analysis）的误报检测图，图3（e）核平稳子空间分析法（KSSA）的误报检测图。可以看出，本发明方法的误报率在五种方法中是最低的，证明了本方法能够提取平稳特征，避免了由热风炉切换导致的频繁的误报。

将故障检测时刻与手动记录的故障时刻比较，记录提前检测时间。五种方法进行异常炉况检测的过程监控如图4（a）-图4（e）所示。其中，图4（a）是利用本发明方法进行炉况异常检测的过程监控图，图4（b）是利用基于高斯混合模型的动态平稳子空间分析法（DSSA-GMM）进行炉况异常检测的过程监控图，图4（c）是利用移动窗口主成分分析方法的霍特林T²（MWPCA-T²）统计量进行炉况异常检测的过程监控图。图4（d）是利用协整分析法（Cointegration analysis）进行炉况异常检测的过程监控图，图4（e）是利用核平稳子空间分析法（KSSA）进行炉况异常检测的过程监控图。

与手动记录的故障时刻相比，本发明方法将检测时间提前了230s，没有发生误报；DSSA-GMM将检测时间提前了60s，发生了一次误报；MWPCA将检测时间提前了60s，但是每次热风炉切换时均会发生大量误报；Cointegration analysis的监测效果很差，这在实际中时不适用的；KSSA将检测时间提前了40s，发生了大量的误报。因此验证了本发明方法的有效性。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

在说明书中提到“一个实施例”、“实施例”、“示例性实施例”、“一些实施例”等指示所述的实施例可以包括特定特征、结构或特性，但未必每个实施例都包括该特定特征、结构或特性。另外，在结合实施例描述特定特征、结构或特性时，结合其它实施例（无论是否明确描述）实现这种特征、结构或特性应在相关领域技术人员的知识范围内。

本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为了使公众对本发明有彻底的了解，在以下本发明优选实施例中详细说明了具体的细节，而对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。另外，为了避免对本发明的实质造成不必要的混淆，并没有详细说明众所周知的方法、过程、流程、元件和电路等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于计算机可读取存储介质中，如：ROM/RAM、磁碟、光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于孪生神经网络提取平稳特征的高炉异常炉况检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的高炉异常炉况检测方法，其特征在于，所述孪生神经网络用于比较两个输入样本并确定它们的相似程度；所述孪生神经网络包括两个相同的子网络，两个子网络的网络结构以及权重都共享；所述孪生神经网络由三个部分组成：输入层、子网络和输出层；其中，输入层接收两个输入样本，两个子网络分别提取两个输入样本的隐藏特征，输出层计算两个输入样本之间的相似性。

3.根据权利要求1所述的高炉异常炉况检测方法，其特征在于，步骤1中损失函数的构建过程如下：

损失函数的第一项是不同时段数据提取的隐藏特征之间分布的差异，这种差异通过瓦瑟斯坦距离，即WD来测量；WD衡量把数据从分布p移动成分布q时所需要移动的平均距离的最小值；假设和/>是来自范数向量空间/>的d维随机向量，其中/>是基本范数，/>和是两个概率度量，/>，/>；

和/>之间的p-Wasserstein 距离定义如下：

（1）

步骤1.2：保留原始数据的局部信息，具体内容如下：

引入t-SNE来构建一个可以衡量原始信息保留程度的损失项；

t-SNE 将高维数据转换到低维空间，同时保留原始数据中的相似性和结构；t-SNE 算法使用概率分布来衡量高维空间和低维空间中数据点之间的相似性；给定一个高维空间的数据集，其中N是样本数，t-SNE 的目标是将高维数据转换为低维映射/>，其中/>；这样，如果高维空间中的点/>和/>很接近，那么它们对应的低维空间中的点/>和/>也很接近；

(2)

（3）

（4）

(5)

步骤1.3：消除特征之间的相关性，具体内容如下：

以上三项构成了最终的损失函数，表述为：

（6）

4.根据权利要求1所述的高炉异常炉况检测方法，其特征在于，步骤2中离线训练具体包括以下步骤：

(7)

其中N是样本数，m为样本维数，是第i个样本；

(8)

步骤2.3：用Johansen协整检验确定平稳源数目d；

步骤2.4：将标准化的增广矩阵划分为n个时段，/>；

划分的时段数n应满足：

(9)

步骤2.6：利用MATLAB中的convhull函数构造的凸包。

5.根据权利要求1所述的高炉异常炉况检测方法，其特征在于，步骤3中在线检测具体包括以下步骤：

步骤3.1：加载的凸包；

步骤3.2：对于在线监测样本，构造/>，并做标准化处理：

(10)