CN116842402A - 基于孪生神经网络提取平稳特征的高炉异常炉况检测方法 - Google Patents

基于孪生神经网络提取平稳特征的高炉异常炉况检测方法 Download PDF

Info

Publication number
CN116842402A
CN116842402A CN202311119324.2A CN202311119324A CN116842402A CN 116842402 A CN116842402 A CN 116842402A CN 202311119324 A CN202311119324 A CN 202311119324A CN 116842402 A CN116842402 A CN 116842402A
Authority
CN
China
Prior art keywords
data
stable
blast furnace
convex hull
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311119324.2A
Other languages
English (en)
Other versions
CN116842402B (zh
Inventor
张瀚文
樊薇薇
董洁
彭开香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN202311119324.2A priority Critical patent/CN116842402B/zh
Publication of CN116842402A publication Critical patent/CN116842402A/zh
Application granted granted Critical
Publication of CN116842402B publication Critical patent/CN116842402B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Manufacture Of Iron (AREA)

Abstract

本发明提供一种基于孪生神经网络提取平稳特征的高炉异常炉况检测方法,属于自动检测技术领域。所述方法包括:建立基于孪生神经网络的平稳特征提取模型以及损失函数;离线训练,根据损失函数对构建的平稳特征提取模型进行训练,计算训练集的平稳分量,建立平稳分量的凸包;在线检测,根据训练后的平稳特征提取模型,计算出测试集的平稳分量,进行凸包检测,当样本位于凸包的外侧,认为炉况异常。与传统的基于高斯混合分布的平稳子空间分析方法相比,本发明方法考虑了高炉数据的非线性,减少了误报率,提前了故障检测时间,更符合高炉数据特征且更为高效。

Description

基于孪生神经网络提取平稳特征的高炉异常炉况检测方法
技术领域
本发明涉及自动检测技术领域,尤其涉及一种基于孪生神经网络提取平稳特征的高炉异常炉况检测方法。
背景技术
钢铁工业是现代工业和国民经济的重要支柱产业,而高炉炼铁是整个钢铁工业的核心环节,它的能耗占钢铁生产总能耗的比例高达70%。实现高炉炼铁工艺的稳定运行对钢铁工业的节能减排至关重要。在高炉炼铁过程中,由于人员误操作、设备故障等,高炉炉况时常发生异常情况。高炉炉况一旦发生故障,不仅会导致原材料消耗增加、炼铁质量下降、设备故障频发等问题,甚至有可能造成人员伤亡。因此,保持高炉的安全、连续、稳定运行至关重要。如果能够尽早地发现高炉故障并对其进行控制调整,就能有效避免由故障带来的损失。高炉异常炉况的监测对于高炉的安全和稳定进行十分重要。
近年来,随着数字化转型时代的到来,数据测量和存储技术的不断发展,积累了丰富的高炉炼铁过程数据,数据驱动的过程监测方法引起了人们的广泛关注。然而,高炉具有复杂的非平稳、非线性和非高斯特性,再加上高炉内未知的物理和化学反应。因此,研究人员很难准确完整地描述高炉炼铁过程的工作原理。而一些传统提取平稳特征的方法,如平稳子空间分析法(SSA)和动态平稳子空间分析法(DSSA)等是通过线性变换来实现平稳子空间和非平稳子空间的分离,因此假定观测变量是平稳和非平稳分量的线性组合。但这一假设在实际工业过程中可能难以满足,因此上述算法并不适用于实际的工业数据。
发明内容
针对上述问题,本发明的目的在于提供一种基于孪生神经网络提取平稳特征的高炉异常炉况检测方法,采用孪生神经网络来拟合数据的非线性,提取平稳特征,能够提高异常炉况检测的效率和准确性。
为解决上述技术问题,本发明提供如下技术方案:
一种基于孪生神经网络提取平稳特征的高炉异常炉况检测方法,包括以下步骤:
步骤1:建立基于孪生神经网络的平稳特征提取模型以及损失函数;
步骤2:离线训练,根据损失函数对构建的平稳特征提取模型进行训练,计算训练集的平稳分量,建立平稳分量的凸包;
步骤3:在线检测,根据训练后的平稳特征提取模型,计算出测试集的平稳分量,进行凸包检测,当样本位于凸包的外侧,认为炉况异常。
优选地,所述孪生神经网络用于比较两个输入样本并确定它们的相似程度;所述孪生神经网络包括两个相同的子网络,两个子网络的网络结构以及权重都共享;所述孪生神经网络由三个部分组成:输入层、子网络和输出层;其中,输入层接收两个输入样本,两个子网络分别提取两个输入样本的隐藏特征,输出层计算两个输入样本之间的相似性。
优选地,步骤1中损失函数的构建过程如下:
步骤1.1:获取不同时段数据提取的隐藏特征之间分布的差异,具体内容如下:
损失函数的第一项是不同时段数据提取的隐藏特征之间分布的差异,这种差异通过瓦瑟斯坦距离,即WD来测量;WD衡量把数据从分布p移动成分布q时所需要移动的平均距离的最小值;假设和/>是来自范数向量空间/>的d维随机向量,其中/>是基本范数,和/>是两个概率度量,/>,/>
和/>之间的p-Wasserstein 距离定义如下:
(1)
这里,/>是/>上的概率度量/>的集合,其边际分布分别是/>和/>;在实际应用中,基本范数/>设为欧几里得范数;此外,令/>,/>变成欧氏距离;
步骤1.2:保留原始数据的局部信息,具体内容如下:
引入t-SNE来构建一个可以衡量原始信息保留程度的损失项;
t-SNE 将高维数据转换到低维空间,同时保留原始数据中的相似性和结构;t-SNE算法使用概率分布来衡量高维空间和低维空间中数据点之间的相似性;给定一个高维空间的数据集,其中N是样本数,t-SNE 的目标是将高维数据转换为低维映射/>,其中/>;这样,如果高维空间中的点/>和/>很接近,那么它们对应的低维空间中的点/>和/>也很接近;
t-SNE算法首先计算所有数据对的联合概率分布,由一个对称矩阵表示,其中/>,/>,且/>;
(2)
/> (3)
其中,是距离度量,/>是调整参数,根据困惑度量和二分搜索策略来确定;
同理,通过一个对称矩阵来定义所有数据对/>的联合概率分布,其中/>,/>,且/>;
(4)
和/>是两个概率分布矩阵,用于描述数据点在高维空间和低维空间中的相似性;t-SNE算法能找到一个低维映射/>,使/>和/>之间的KL散度最小,
(5)
步骤1.3:消除特征之间的相关性,具体内容如下:
为了确保提取的特征相互独立,去除掉冗余特征,这里添加一个项来使提取特征的协方差矩阵为单位阵,以得到具有去相关性平稳特征;
以上三项构成了最终的损失函数,表述为:
(6)
其中 α > 0 和 β > 0 是权重超参数,代表第i段训练数据的隐藏特征,WD代表计算两个时段隐藏特征之间分布的WD,/>代表第i个时段的训练数据,/>和/>分别代表第i个时段训练数据和其隐藏特征的概率分布矩阵,/>代表计算协方差矩阵,/>代表F范数的平方。
优选地,步骤2中离线训练具体包括以下步骤:
步骤2.1:收集非平稳被监控对象正常的历史过程数据作为训练集;
步骤2.2:构建长度为w的滑动时间窗口,采用单步滑动构成增广矩阵,并做标准化处理;
(7)
其中N是样本数,m为样本维数,是第i个样本;
,增广矩阵的均值向量为/>,协方差矩阵为/>,然后将增广矩阵进行标准化处理,可得标准化之后的增广矩阵为:
(8)
步骤2.3:用Johansen协整检验确定平稳源数目d;
步骤2.4:将标准化的增广矩阵划分为n个时段
划分的时段数n应满足:
(9)
步骤2.5:基于训练后的平稳特征提取模型得到训练数据的平稳分量
步骤2.6:利用MATLAB中的convhull函数构造的凸包。
优选地,步骤3中在线检测具体包括以下步骤:
步骤3.1:加载的凸包;
步骤3.2:对于在线监测样本,构造/>,并做标准化处理:
步骤3.3:将输入到训练后的平稳特征提取模型中,得到/>的平稳分量/>
步骤3.4:根据凸包检测原理,计算监测统计量,如果/>则认为该样本异常;
凸包表示包含一个有限样本集的最小凸集合,给定一个样本集Z,它的凸包表示为C(Z),即在所有包围样本集的凸集合中,C(Z)的体积是最小的;因此凸包的描述形式适合用于对高炉数据的故障检测;
(10)
如果一测试样本的平稳分量位于凸包内部,则该测试样本正常,反之,如果测试样本的平稳分量位于凸包外部,则/>该样本异常。
与现有技术相比,本发明提供的技术方案具有以下有益效果:
首先,与传统的动态平稳子空间分析方法相比,本发明提出的方法采用孪生神经网络提取平稳特征,能够很好地拟合数据的非线性;采用WD衡量不同分布之间的差异性,不需要高斯分布的假设,更符合高炉过程数据的数据特征,可以自动判断由于热风炉切换造成的扰动,从而降低误报率;其次,与传统的平稳特征提取方法相比,本发明提出的方法能够更早地检测出异常炉况。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的基于孪生神经网络提取平稳特征的高炉异常炉况检测方法的流程图;
图2是根据本发明一种实施例的孪生神经网络的结构示意图;
图3(a)-图3(e)分别是根据本发明一个正常高炉过程数据的误报检测图、基于高斯混合模型的动态平稳子空间分析法(DSSA-GMM)的误报检测图、移动窗口主成分分析方法的霍特林T2(MWPCA-T2)统计量的误报检测图、协整分析法(Cointegration analysis)的误报检测图、核平稳子空间分析法(KSSA)的误报检测图;
图4(a)-图4(e)分别是利用本发明方法进行炉况异常检测的过程监控图、利用基于高斯混合模型的动态平稳子空间分析法(DSSA-GMM)进行炉况异常检测的过程监控图、利用移动窗口主成分分析方法的霍特林T2(MWPCA-T2)统计量进行炉况异常检测的过程监控图、利用协整分析法(Cointegration analysis)进行炉况异常检测的过程监控图、利用核平稳子空间分析法(KSSA)进行炉况异常检测的过程监控图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的实施例提供了一种基于孪生神经网络提取平稳特征的高炉异常炉况检测方法,如图1所示,所述方法包括以下步骤:
步骤1:建立基于孪生神经网络的平稳特征提取模型以及损失函数。
孪生神经网络(siamese neural network(SNN))是一种特殊的神经网络架构,用于比较两个输入样本并确定它们的相似程度。孪生神经网络包括两个相同的子网络,两个子网络的网络结构以及权重都共享;孪生神经网络由三个部分组成:输入层、子网络和输出层;其中,输入层接收两个输入样本,两个子网络分别提取两个输入样本的隐藏特征,输出层计算两个输入样本之间的相似性。
如图2所示,是根据本发明一种实施例的孪生神经网络的结构示意图。对于具有时序性的高炉炼铁过程,使用长短期记忆(LSTM)网络来作为孪生神经网络的子网络。时间序列矩阵被划分为n个不重叠的时段,/>,其中,q和mw分别为划分时间窗口后训练数据的每个历元的样本数和数据维度。/>代表/>的第一个样本,/>代表/>的隐藏特征。将n段训练数据输入到具有n个相同子网络的孪生神经网络中,提取隐藏特征/>,其中 d 是平稳源数目。
步骤1中损失函数的构建过程如下:
步骤1.1:获取不同时段数据提取的隐藏特征之间分布的差异,具体内容如下:
损失函数的第一项是不同时段数据提取的隐藏特征之间分布的差异,这种差异通过瓦瑟斯坦距离,即WD来测量;WD衡量把数据从分布p移动成分布q时所需要移动的平均距离的最小值;假设和/>是来自范数向量空间/>的d维随机向量,其中/>是基本范数,和/>是两个概率度量,/>,/>
和/>之间的p-Wasserstein 距离定义如下:
(1)
这里,/>是/>上的概率度量/>的集合,其边际分布分别是/>和/>;在实际应用中,基本范数/>设为欧几里得范数;此外,令/>,/>变成欧氏距离;
步骤1.2:保留原始数据的局部信息,具体内容如下:
如果只优化隐藏特征的平稳性,就有可能得到恒等于0的特征,从而丢失原始数据中包含的局部信息。因此,有必要构建一个可以衡量原始信息保留程度的损失项。可以通过确保每个时段内样本之间关系的一致性来保留原始信息。这里引入了t-SNE(t-distributed stochastic neighbor embedding)来实现这种损失项。
引入t-SNE来构建一个可以衡量原始信息保留程度的损失项;
t-SNE 将高维数据转换到低维空间,同时保留原始数据中的相似性和结构;t-SNE算法使用概率分布来衡量高维空间和低维空间中数据点之间的相似性;给定一个高维空间的数据集,其中N是样本数,t-SNE 的目标是将高维数据转换为低维映射/>,其中/>;这样,如果高维空间中的点/>和/>很接近,那么它们对应的低维空间中的点/>和/>也很接近;
t-SNE算法首先计算所有数据对的联合概率分布,由一个对称矩阵表示,其中/>,/>,且/>;
(2)
/> (3)
其中,是距离度量,/>是调整参数,根据困惑度量和二分搜索策略来确定;
同理,通过一个对称矩阵来定义所有数据对/>的联合概率分布,其中/>,/>,且/>;
(4)
和/>是两个概率分布矩阵,用于描述数据点在高维空间和低维空间中的相似性;t-SNE算法能找到一个低维映射/>,使/>和/>之间的KL散度最小,
(5)
步骤1.3:消除特征之间的相关性,具体内容如下:
为了确保提取的特征相互独立,去除掉冗余特征,这里添加一个项来使提取特征的协方差矩阵为单位阵,以得到具有去相关性平稳特征;
以上三项构成了最终的损失函数,表述为:
(6)
其中 α > 0 和 β > 0 是权重超参数,代表第i段训练数据的隐藏特征,WD代表计算两个时段隐藏特征之间分布的WD,/>代表第i个时段的训练数据,/>和/>分别代表第i个时段训练数据和其隐藏特征的概率分布矩阵,/>代表计算协方差矩阵,/>代表F范数的平方。
步骤2:离线训练;根据损失函数对构建的平稳特征提取模型进行训练,计算训练集的平稳分量,建立平稳分量的凸包。
步骤2中离线训练具体包括以下步骤:
步骤2.1:收集非平稳被监控对象正常的历史过程数据作为训练集;
步骤2.2:构建长度为w的滑动时间窗口,采用单步滑动构成增广矩阵,并做标准化处理;
(7)
其中N是样本数,m为样本维数,是第i个样本;
,增广矩阵的均值向量为,协方差矩阵为/>,然后将增广矩阵进行标准化处理,可得标准化之后的增广矩阵为:
(8)
步骤2.3:用Johansen协整检验确定平稳源数目d;
步骤2.4:将标准化的增广矩阵划分为n个时段
如果n太小,就会存在虚假平稳源,其分布在整个时间序列上似乎是平稳的,实际上包含了非平稳源,那么真正的平稳源就不能被识别,划分的时段数n应满足:
(9)
步骤2.5:基于训练后的平稳特征提取模型得到训练数据的平稳分量
步骤2.6:利用MATLAB中的convhull函数构造的凸包。
步骤3:在线检测;根据训练后的平稳特征提取模型,计算出测试集的平稳分量,进行凸包检测,当样本位于凸包的外侧,认为炉况异常。
步骤3中在线检测具体包括以下步骤:
步骤3.1:加载的凸包;
步骤3.2:对于在线监测样本,构造/>,并做标准化处理:
步骤3.3:将输入到训练后的平稳特征提取模型中,得到/>的平稳分量/>
步骤3.4:根据凸包检测原理,计算监测统计量,如果/>则认为该样本异常;
凸包表示包含一个有限样本集的最小凸集合,给定一个样本集Z,它的凸包表示为C(Z),即在所有包围样本集的凸集合中,C(Z)的体积是最小的;因此凸包的描述形式更为准确和保守,适合用于对高炉数据的故障检测;
(10)
如果一测试样本的平稳分量位于凸包内部,则该测试样本正常,反之,如果测试样本的平稳分量位于凸包外部,则/>该样本异常。
将正常的高炉数据作为测试集计算误报率,如图3(a)-图3(e)所示。其中,图3(a)是采用本发明方法的误报检测图,图3(b)是基于高斯混合模型的动态平稳子空间分析法(DSSA-GMM)的误报检测图,图3(c)是移动窗口主成分分析方法的霍特林T2(MWPCA-T2)统计量的误报检测图,图3(d)是协整分析法(Cointegration analysis)的误报检测图,图3(e)核平稳子空间分析法(KSSA)的误报检测图。可以看出,本发明方法的误报率在五种方法中是最低的,证明了本方法能够提取平稳特征,避免了由热风炉切换导致的频繁的误报。
将故障检测时刻与手动记录的故障时刻比较,记录提前检测时间。五种方法进行异常炉况检测的过程监控如图4(a)-图4(e)所示。其中,图4(a)是利用本发明方法进行炉况异常检测的过程监控图,图4(b)是利用基于高斯混合模型的动态平稳子空间分析法(DSSA-GMM)进行炉况异常检测的过程监控图,图4(c)是利用移动窗口主成分分析方法的霍特林T2(MWPCA-T2)统计量进行炉况异常检测的过程监控图。图4(d)是利用协整分析法(Cointegration analysis)进行炉况异常检测的过程监控图,图4(e)是利用核平稳子空间分析法(KSSA)进行炉况异常检测的过程监控图。
与手动记录的故障时刻相比,本发明方法将检测时间提前了230s,没有发生误报;DSSA-GMM将检测时间提前了60s,发生了一次误报;MWPCA将检测时间提前了60s,但是每次热风炉切换时均会发生大量误报;Cointegration analysis的监测效果很差,这在实际中时不适用的;KSSA将检测时间提前了40s,发生了大量的误报。因此验证了本发明方法的有效性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
在说明书中提到“一个实施例”、“实施例”、“示例性实施例”、“一些实施例”等指示所述的实施例可以包括特定特征、结构或特性,但未必每个实施例都包括该特定特征、结构或特性。另外,在结合实施例描述特定特征、结构或特性时,结合其它实施例(无论是否明确描述)实现这种特征、结构或特性应在相关领域技术人员的知识范围内。
本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为了使公众对本发明有彻底的了解,在以下本发明优选实施例中详细说明了具体的细节,而对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。另外,为了避免对本发明的实质造成不必要的混淆,并没有详细说明众所周知的方法、过程、流程、元件和电路等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读取存储介质中,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于孪生神经网络提取平稳特征的高炉异常炉况检测方法,其特征在于,包括以下步骤:
步骤1:建立基于孪生神经网络的平稳特征提取模型以及损失函数;
步骤2:离线训练,根据损失函数对构建的平稳特征提取模型进行训练,计算训练集的平稳分量,建立平稳分量的凸包;
步骤3:在线检测,根据训练后的平稳特征提取模型,计算出测试集的平稳分量,进行凸包检测,当样本位于凸包的外侧,认为炉况异常。
2.根据权利要求1所述的高炉异常炉况检测方法,其特征在于,所述孪生神经网络用于比较两个输入样本并确定它们的相似程度;所述孪生神经网络包括两个相同的子网络,两个子网络的网络结构以及权重都共享;所述孪生神经网络由三个部分组成:输入层、子网络和输出层;其中,输入层接收两个输入样本,两个子网络分别提取两个输入样本的隐藏特征,输出层计算两个输入样本之间的相似性。
3.根据权利要求1所述的高炉异常炉况检测方法,其特征在于,步骤1中损失函数的构建过程如下:
步骤1.1:获取不同时段数据提取的隐藏特征之间分布的差异,具体内容如下:
损失函数的第一项是不同时段数据提取的隐藏特征之间分布的差异,这种差异通过瓦瑟斯坦距离,即WD来测量;WD衡量把数据从分布p移动成分布q时所需要移动的平均距离的最小值;假设和/>是来自范数向量空间/>的d维随机向量,其中/>是基本范数,/>是两个概率度量,/>,/>
和/>之间的p-Wasserstein 距离定义如下:
(1)
这里,/>是/>上的概率度量/>的集合,其边际分布分别是/>和/>;在实际应用中,基本范数/>设为欧几里得范数;此外,令/>,/>变成欧氏距离;
步骤1.2:保留原始数据的局部信息,具体内容如下:
引入t-SNE来构建一个可以衡量原始信息保留程度的损失项;
t-SNE 将高维数据转换到低维空间,同时保留原始数据中的相似性和结构;t-SNE 算法使用概率分布来衡量高维空间和低维空间中数据点之间的相似性;给定一个高维空间的数据集,其中N是样本数,t-SNE 的目标是将高维数据转换为低维映射/>,其中/>;这样,如果高维空间中的点/>和/>很接近,那么它们对应的低维空间中的点/>和/>也很接近;
t-SNE算法首先计算所有数据对的联合概率分布,由一个对称矩阵表示,其中/>,/>,且/>;
(2)
(3)
其中,是距离度量,/>是调整参数,根据困惑度量和二分搜索策略来确定;
同理,通过一个对称矩阵来定义所有数据对/>的联合概率分布,其中/>,/>,且/>;
(4)
和/>是两个概率分布矩阵,用于描述数据点在高维空间和低维空间中的相似性;t-SNE算法能找到一个低维映射/>,使/>和/>之间的KL散度最小,
(5)
步骤1.3:消除特征之间的相关性,具体内容如下:
为了确保提取的特征相互独立,去除掉冗余特征,这里添加一个项来使提取特征的协方差矩阵为单位阵,以得到具有去相关性平稳特征;
以上三项构成了最终的损失函数,表述为:
(6)
其中 α > 0 和 β > 0 是权重超参数,代表第i段训练数据的隐藏特征,WD代表计算两个时段隐藏特征之间分布的WD,/>代表第i个时段的训练数据,/>和/>分别代表第i个时段训练数据和其隐藏特征的概率分布矩阵,/>代表计算协方差矩阵,/>代表F范数的平方。
4.根据权利要求1所述的高炉异常炉况检测方法,其特征在于,步骤2中离线训练具体包括以下步骤:
步骤2.1:收集非平稳被监控对象正常的历史过程数据作为训练集;
步骤2.2:构建长度为w的滑动时间窗口,采用单步滑动构成增广矩阵,并做标准化处理;
(7)
其中N是样本数,m为样本维数,是第i个样本;
,增广矩阵的均值向量为/>,协方差矩阵为/>,然后将增广矩阵进行标准化处理,可得标准化之后的增广矩阵为:
(8)
步骤2.3:用Johansen协整检验确定平稳源数目d;
步骤2.4:将标准化的增广矩阵划分为n个时段,/>
划分的时段数n应满足:
(9)
步骤2.5:基于训练后的平稳特征提取模型得到训练数据的平稳分量
步骤2.6:利用MATLAB中的convhull函数构造的凸包。
5.根据权利要求1所述的高炉异常炉况检测方法,其特征在于,步骤3中在线检测具体包括以下步骤:
步骤3.1:加载的凸包;
步骤3.2:对于在线监测样本,构造/>,并做标准化处理:
步骤3.3:将输入到训练后的平稳特征提取模型中,得到/>的平稳分量/>
步骤3.4:根据凸包检测原理,计算监测统计量,如果/>则认为该样本异常;
凸包表示包含一个有限样本集的最小凸集合,给定一个样本集Z,它的凸包表示为C(Z),即在所有包围样本集的凸集合中,C(Z)的体积是最小的;因此凸包的描述形式适合用于对高炉数据的故障检测;
(10)
如果一测试样本的平稳分量位于凸包内部,则该测试样本正常,反之,如果测试样本的平稳分量位于凸包外部,则/>该样本异常。
CN202311119324.2A 2023-09-01 2023-09-01 基于孪生神经网络提取平稳特征的高炉异常炉况检测方法 Active CN116842402B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311119324.2A CN116842402B (zh) 2023-09-01 2023-09-01 基于孪生神经网络提取平稳特征的高炉异常炉况检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311119324.2A CN116842402B (zh) 2023-09-01 2023-09-01 基于孪生神经网络提取平稳特征的高炉异常炉况检测方法

Publications (2)

Publication Number Publication Date
CN116842402A true CN116842402A (zh) 2023-10-03
CN116842402B CN116842402B (zh) 2024-02-13

Family

ID=88167485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311119324.2A Active CN116842402B (zh) 2023-09-01 2023-09-01 基于孪生神经网络提取平稳特征的高炉异常炉况检测方法

Country Status (1)

Country Link
CN (1) CN116842402B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117540663A (zh) * 2024-01-09 2024-02-09 北京科技大学 基于神经网络的高炉炉缸高温熔体粘度预测方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109035488A (zh) * 2018-08-07 2018-12-18 哈尔滨工业大学(威海) 基于cnn特征提取的航空发动机时间序列异常检测方法
US20210110262A1 (en) * 2019-10-14 2021-04-15 Honda Research Institute Europe Gmbh Method and system for semi-supervised deep anomaly detection for large-scale industrial monitoring systems based on time-series data utilizing digital twin simulation data
CN113612733A (zh) * 2021-07-07 2021-11-05 浙江工业大学 一种基于孪生网络的少样本虚假数据注入攻击检测方法
CN114091553A (zh) * 2020-08-06 2022-02-25 长沙理工大学 一种滚动轴承故障的诊断方法
CN114565785A (zh) * 2022-01-20 2022-05-31 宁波大学 一种基于三分支孪生网络的无监督视频异常检测方法
WO2022160902A1 (zh) * 2021-01-28 2022-08-04 广西大学 面向云环境下大规模多元时间序列数据异常检测方法
CN115204279A (zh) * 2022-06-28 2022-10-18 南京信息职业技术学院 一种基于vae和cod-snn的异常网络流量识别方法
CN115905974A (zh) * 2022-11-04 2023-04-04 北京科技大学 一种高炉异常炉况检测方法
CN116644304A (zh) * 2023-05-26 2023-08-25 重庆长征重工有限责任公司 基于相似性的货车轴承异常特征提取与分类方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109035488A (zh) * 2018-08-07 2018-12-18 哈尔滨工业大学(威海) 基于cnn特征提取的航空发动机时间序列异常检测方法
US20210110262A1 (en) * 2019-10-14 2021-04-15 Honda Research Institute Europe Gmbh Method and system for semi-supervised deep anomaly detection for large-scale industrial monitoring systems based on time-series data utilizing digital twin simulation data
CN114091553A (zh) * 2020-08-06 2022-02-25 长沙理工大学 一种滚动轴承故障的诊断方法
WO2022160902A1 (zh) * 2021-01-28 2022-08-04 广西大学 面向云环境下大规模多元时间序列数据异常检测方法
CN113612733A (zh) * 2021-07-07 2021-11-05 浙江工业大学 一种基于孪生网络的少样本虚假数据注入攻击检测方法
CN114565785A (zh) * 2022-01-20 2022-05-31 宁波大学 一种基于三分支孪生网络的无监督视频异常检测方法
CN115204279A (zh) * 2022-06-28 2022-10-18 南京信息职业技术学院 一种基于vae和cod-snn的异常网络流量识别方法
CN115905974A (zh) * 2022-11-04 2023-04-04 北京科技大学 一种高炉异常炉况检测方法
CN116644304A (zh) * 2023-05-26 2023-08-25 重庆长征重工有限责任公司 基于相似性的货车轴承异常特征提取与分类方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117540663A (zh) * 2024-01-09 2024-02-09 北京科技大学 基于神经网络的高炉炉缸高温熔体粘度预测方法及系统
CN117540663B (zh) * 2024-01-09 2024-04-23 北京科技大学 基于神经网络的高炉炉缸高温熔体粘度预测方法及系统

Also Published As

Publication number Publication date
CN116842402B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
CN116842402B (zh) 基于孪生神经网络提取平稳特征的高炉异常炉况检测方法
Zhang et al. Fault detection strategy based on weighted distance of $ k $ nearest neighbors for semiconductor manufacturing processes
CN113076975A (zh) 一种基于无监督学习的大坝安全监测数据异常检测方法
CN109977916B (zh) 一种基于嵌入式平台的变压器油中溶解气体在线监测系统
Ma et al. A novel hierarchical detection and isolation framework for quality-related multiple faults in large-scale processes
CN115905974B (zh) 一种高炉异常炉况检测方法
CN116739829B (zh) 一种基于大数据的电力数据分析方法、系统及介质
CN113627735A (zh) 工程建设项目安全风险的预警方法及系统
Kumar et al. Performance evaluation for tool wear prediction based on Bi-directional, Encoder–Decoder and Hybrid Long Short-Term Memory models
CN110956331A (zh) 数字工厂运营状态预测方法、系统、装置
Ma et al. A novel three-stage quality oriented data-driven nonlinear industrial process monitoring strategy
CN111192163B (zh) 基于风电机组运行数据的发电机可靠度中短期预测方法
CN117312972A (zh) 一种刮板输送机减速器健康状态识别方法
CN112418522A (zh) 一种基于三支集成预测模型的工业加热炉钢温预测方法
CN112101673A (zh) 一种基于隐马尔可夫模型的电网发展趋势预测方法及系统
CN116627116A (zh) 一种流程工业故障定位方法、系统及电子设备
CN116893293A (zh) 基于空间注意力校正神经网络的暂态电压稳定评估方法
CN116011982A (zh) 一种磨煤机磨辊断裂在线监测方法及系统
CN113885371B (zh) 一种基于健康状态数据的混合变量过程监测方法
Lv et al. Mechanical Equipment Performance Degradation Assessment Method Based on Improved Degradation Feature Extraction and Sample Completeness.
Huang et al. Condition monitoring of wind turbine based on copula function and autoregressive neural network
CN117556202B (zh) 基于概率相关慢特征分析的工业过程微小故障检测方法
CN118090078B (zh) 一种闭式循环水冷系统渗漏在线监测方法
Yang et al. Running State Assessment for Induced Draft Fans Using Auto Encoder Model Combined With Fuzzy Synthetic
Qiu et al. Remaining Useful Life Prediction of the Aviation Engine Based on the Long-Short-Term-Memory Network with a Feature Selection Mechanism

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant