CN105278526B - 一种基于正则化架构的工业过程故障分离方法 - Google Patents

一种基于正则化架构的工业过程故障分离方法 Download PDF

Info

Publication number
CN105278526B
CN105278526B CN201510816035.7A CN201510816035A CN105278526B CN 105278526 B CN105278526 B CN 105278526B CN 201510816035 A CN201510816035 A CN 201510816035A CN 105278526 B CN105278526 B CN 105278526B
Authority
CN
China
Prior art keywords
mrow
msub
msup
formula
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510816035.7A
Other languages
English (en)
Other versions
CN105278526A (zh
Inventor
张颖伟
杜文友
樊云鹏
贾启龙
刘施涛
杨旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201510816035.7A priority Critical patent/CN105278526B/zh
Publication of CN105278526A publication Critical patent/CN105278526A/zh
Priority to US15/009,241 priority patent/US20170146433A1/en
Application granted granted Critical
Publication of CN105278526B publication Critical patent/CN105278526B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0275Fault isolation and identification, e.g. classify fault; estimate cause or root of failure
    • G05B23/0281Quantitative, e.g. mathematical distance; Clustering; Neural networks; Statistical analysis
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0221Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0275Fault isolation and identification, e.g. classify fault; estimate cause or root of failure
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24033Failure, fault detection and isolation

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Algebra (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Complex Calculations (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开一种基于正则化架构的工业过程故障分离方法,属于工业过程监测技术领域。该方法包括:采集工业过程样本数据并进行滤波处理后得到包含标记样本的可用样本数据集;建立具有局部正则项和全局正则项的工业过程故障分离目标函数;利用含有标记样本的可用样本数据集,求解工业过程故障分离目标函数的最优解;根据最优解,得到预测类标签矩阵,从而确定过程的故障信息;该方法利用局部正则项可以使最优解性质理想的特点,利用全局检测正则项来加以修正局部正则项可能导致故障分离精度不高的问题。实验表明该方法不仅是可行的,并且其故障分离精度很高,且可以挖掘标记样本数据的潜在信息,提高故障分离模型的泛化能力、综合性能和精确性。

Description

一种基于正则化架构的工业过程故障分离方法
技术领域
本发明属于工业过程监测技术领域,特别涉及一种基于正则化架构的工业过程故障分离方法。
背景技术
所谓故障,是指系统中有一个或多个特征或变量很大程度上偏离正常状态。广义说,故障可解释为使系统出现所不期待的特征的所有异常现象。一旦系统出现故障,会降低系统的性能,使其低于正常水平,难以达到系统预期的结果和功能,不能及时排除和解决时,就会导致生产事故的发生。
工业过程监测技术是一个以故障分离和诊断技术为基础的学科,它针对提高产品质量、系统可靠性及设备可维护性等问题进行研究,对确保复杂工业过程安全运行具有重大意义。
工业过程产生的样本数据主要分为标记样本数据和未标记样本数据。标记样本数据通常较难获取,因为它主要受实际工作现场的生产条件限制,并且往往需要相关领域专家或者有经验的工人进行标注,非常耗时,代价昂贵。所以工业过程中的数据中标记样本数据很少,大多是没有标记的样本数据,如何能合理利用两者,减少人力标记样本数据的成本,成为近年来基于数据驱动的故障诊断方法研究的热点。但是标记样本数据目前还没有得到充分的信息挖掘,所以如何在少量不够准确的标记样本数据下尽量提高分类器的泛化能力,如何充分利用大量廉价的非标记样本,提高故障分离的精确度已经成为故障诊断领域研究的热点。
发明内容
针对现有技术存在的不足,本发明提供一种基于正则化架构的工业过程故障分离方法。
本发明的技术方案:
一种基于正则化架构的工业过程故障分离方法,包括以下步骤:
步骤1:采集工业过程样本数据;
步骤2:对采集的样本数据进行滤波处理,滤除奇异样本数据,保留可用样本数据;所述可用样本数据包括标记样本数据和未标记样本数据;所述标记样本数据指的是通过有经验的专家或者工人对所采集的数据进行特征区分,分别标记为正常样本数据、故障样本数据及其对应的故障状态类别,使得这些样本数据具有类标签;所述未标记数据指的是直接采集的未经过任何标记处理而不具有类标签的数据;
可用样本数据集表示为:
T={(x1,y1),...(xl,yl)}∪{xl+1,...xn};xj∈Rd,j=1,…,n (1)
其中d为变量个数;n为样本个数;是标记数据,是未标记数据;yi∈{1,2,...,c},i=1,...,l,其中c是故障状态类别,l为标记样本个数;
步骤3:建立具有局部正则项和全局正则项的工业过程故障分离目标函数;
其中J(F)为工业过程故障分离目标函数;F为预测类标签矩阵;tr是矩阵的迹符号;D是一个对角矩阵,其中对角元素Dii=Dl>0,i=1,...,l,Dii=Du≥0,i=l+1,...,n;(F-Y)TD(F-Y)为经验损失,用来度量预测类标签和初始类标签的差值;γ是调节参数;FTGF为全局正则项,G为全局正则矩阵;FTMF为局部正则项,M是局部正则矩阵;Y∈Rn×c为初始类标签矩阵,Y的元素定义如下:
步骤4:利用可用样本数据集,求解式(2)所示的工业过程故障分离目标函数的最优解F*
步骤5:根据最优解F*,通过式(4)可以得到预测类标签矩阵,从而可以确定过程的故障信息;
其中fi为样本点xi的预测类标签。
根据所述的基于正则化架构的工业过程故障分离方法,所述的步骤4包括如下步骤:
步骤4.1:根据改进的相似度度量算法和KNN分类算法,求取全局正则矩阵G;
G可以通过式(5)计算:
G=S-W∈Rn×n (5)
采用正则化的拉普拉斯矩阵,对式(5)做进一步改进,得到式(6):
其中I是一个k×k的单位矩阵;S是一个对角矩阵,其对角元素是W=[Wij]∈Rn×n,为相似度矩阵;W与样本点构成一个无向加权图,该图的顶点对应样本点,该图的边Wij对应样本点的相似度;W的计算方法决定着最终故障分类的精确度,利用样本点xi的近邻点,通过局部重构的方法求取W,重构误差方程为:
其中求式(7)的最小值,便可以求得W,进而可以通过式(5)求得G;求取W的具体步骤如下:
步骤4.1.1:利用改进的距离公式(8)求解xi与其k个近邻点的距离度量,从而计算出样本点之间的距离,即样本相似度度量;
M(i),M(j)分别表示样本点xi到它的k个近邻之间的距离的平均值和样本点xj到它的k个近邻之间的距离的平均值;
步骤4.1.2:通过核映射,将式(8)转换为式(9);
其中,Kij=Φ(xi)TΦ(xj),Kii=Φ(xi)TΦ(xi),Kjj=Φ(xj)TΦ(xj),K为Mercer核;式(9)分子是通过式(8)的分子||xi-xj||经过核映射推导得到的,即式(9)分母中的
其中 为xi的第p个近邻点;为xj的第q个近邻点;
步骤4.1.3:利用式(9),并根据采集的数据中标记数据与非标记数据的情况,定义样本相似度度量,即样本间距离度量,由式(11)表示:
其中β是控制参数,它依赖于采集的样本数据点的分布密度;α是调节参数;
步骤4.1.4:用式(10)定义的距离度量求取样本xi的k个近邻,得到xi的近邻域Ni
步骤4.1.5:利用样本xi的k个近邻点重构xi,求取xi重构误差的最小值,即得到最优的相似度矩阵W:
其中,通过对样本点进行核映射后,式(7)转换为式(11);||.||是欧式范数;Wij有两个约束条件:及当时,Wij=0;
步骤4.2:求取局部正则矩阵M;
步骤4.3:通过对工业过程故障分离目标函数J(F)偏导为0,得到目标函数的最优解F*
根据所述的基于正则化架构的工业过程故障分离方法,所述步骤4.2包括如下步骤:
步骤4.2.1:通过欧氏距离确定样本点xi的k个近邻点,并定义这k个近邻点集为其中xij表示样本点xi的第j个近邻点;
步骤4.2.2:建立由式(13)表示的损失函数,使得样本类标签分布光滑;
式中第一项是所有样本的预测类标签与实际类标签的误差总和;λ是调节参数;第二项S(gi)是惩罚函数;函数其能够使每个样本点通过该映射到达一个类标签:
其中为样本点xi的第j个近邻点的类标签;m是x的维数,s是半范数的偏导阶数;构成了一个阶数不小于s的多项式空间,2s>m;φi,j(x)是格林函数;βi,j和φi,j为格林函数的两个系数;
步骤4.2.3:通过求取步骤4.2.2中建立的损失函数的最小值,求取样本点xi的近邻点集Ni的类标签估计损失;
对于k个分散样本数据点,损失函数J(gi(x))的最小值可由式(15)估计:
其中Hi是一个k×k的对称矩阵,它的(r,z)元素:αi=[αi,1i,2,...,αi,k]∈Rk,βi=[βi,1i,2,...,βi,d-1]T∈Rk
对于一个较小的λ,损失函数J(gi(x))的最小值则可以用标签矩阵估计,得到样本点xi的近邻点集Ni的类标签估计损失:
J(gi)≈λFi TMiFi (16)
其中,对应Ni中k个数据的类标签;Mi是系数矩阵的逆矩阵的左上k×k子块矩阵,由式(17)求取:
αi T(Hi+λI)αi=Fi TMiFi (17)
步骤4.2.4:将n个样本点的近邻域的类标签估计损失集中到一起得到总的类标签估计损失,求取总损失E(f)的最小值即得到样本数据的类标签,进而求得局部正则矩阵M;所述总的类标签估计损失由式(18)表示:
其中f=[f1,f2,...,fn]T∈Rn是类标签向量;
忽略式(18)中的系数λ,那么式(18)变为式(19):
又根据存在着行选择矩阵Si∈Rk×n,使得Fi=Sif;其中Si的第u行和第v列元素Si(u,v)能由式(20)定义:
将Fi=Sif代入式(20)中,得到E(f)∝fTMf,其中
本发明的有益效果:在少量标记数据样本的基础上,利用大量廉价的未标记数据样本训练,可以有效提高故障分离的正确率。为了充分利用已知的标记样本数据,本发明的方法利用局部正则项使得最优解具有理想的性质,利用全局正则项来弥补局部正则项因邻域内样本较少可能导致的故障分离精度不高问题。这种故障分离方法利用少量标记数据样本训练系统的故障分离模型、同时充分利用大量的未标记数据样本的统计分布等信息,来提高故障分离模型的泛化能力、综合性能和精确性。实验表明,本发明的方法不仅是可行的,并且其故障分离精度很高。通过实验我们也可以知道,实验的故障分离效果很大程度上取决于已标记样本数据所占比例和模型参数。
附图说明
图1为本发明一种实施方式的基于正则化架构的工业过程故障分离方法流程图;
图2为本发明一种实施方式的热镀锌酸洗废液过程结构示意图;
图3为图1所示的热镀锌酸洗废液过程流程图;
图4(a)为本发明一种实施方式采用含有5%的标记样本建模后对700个采样的含故障1的测试数据进行仿真的结果图;
图4(b)为本发明一种实施方式采用含有10%的标记样本建模后对700个采样的含故障1的测试数据进行仿真的结果图;
图4(c)为本发明一种实施方式采用含有15%的标记样本建模后对700个采样的含故障1的测试数据进行仿真的结果图;
图5(a)为本发明一种实施方式采用含有5%的标记样本建模后对700个采样的含故障2的测试数据进行仿真的结果图;
图5(b)为本发明一种实施方式采用含有10%的标记样本建模后对700个采样的含故障2的测试数据进行仿真的结果图;
图5(c)为本发明一种实施方式采用含有15%的标记样本建模后对700个采样的含故障2的测试数据进行仿真的结果图;
图6(a)为本发明一种实施方式测试调节参数γ=10-1对故障分离性能影响的监控结果图;
图6(b)为本发明一种实施方式测试调节参数γ=101对故障分离性能影响的监控结果图;
图6(c)为本发明一种实施方式测试调节参数γ=102对故障分离性能影响的监控结果图;
图6(d)为本发明一种实施方式测试调节参数γ=103对故障分离性能影响的监控结果图;
图6(e)为本发明一种实施方式测试调节参数γ=104对故障分离性能影响的监控结果图;
图6(f)为本发明一种实施方式测试调节参数γ=105对故障分离性能影响的监控结果图。
具体实施方式
下面结合附图对本发明的具体实施方式作详细说明。
本实施方式的基于正则化架构的工业过程故障分离方法,如图1所示,包括以下步骤:
步骤1:采集工业过程样本数据;
步骤2:对采集的样本数据进行滤波处理,滤除奇异样本数据,保留可用样本数据;所述可用样本数据包括标记样本数据和未标记样本数据;所述标记样本数据指的是通过有经验的专家或者工人对所采集的数据进行特征区分,分别标记为正常样本数据、故障样本数据及其对应的故障状态类别,使得这些样本数据具有类标签;所述未标记数据指的是直接采集的未经过任何标记处理的数据,属于待预测类标签的样本数据;
可用样本数据集表示为:
T={(x1,y1),...(xl,yl)}∪{xl+1,...xn};xj∈Rd,j=1,…,n
其中d为变量个数;n为样本个数;是标记样本数据,是未标记样本数据;yi∈{1,2,...,c},i=1,...,l,其中c是故障状态类别,l为标记样本个数;
步骤3:建立工业过程故障分离目标函数;
其中F为预测类标签矩阵;tr是矩阵的迹符号;D是一个对角矩阵,其中对角元素Dii=Dl>0,i=1,...,l,Dii=Du≥0,i=l+1,...,n,Dl和Du的具体值是由人为根据经验选取;(F-Y)TD(F-Y)为经验损失,用来度量预测类标签和初始类标签的差值;γ是调节参数,需通过试验确定;FTGF为全局正则项,G为全局正则矩阵;FTMF为局部正则项,M是局部正则矩阵;Y∈Rn×c为初始类标签矩阵,Y的元素定义如下:
步骤4:利用可用样本数据集,求解工业过程故障分离目标函数的最优解;
步骤4.1:根据改进的相似度度量算法和KNN(k-Nearest Neighbor,K最近邻)分类算法,求取全局正则矩阵G;
在故障分离过程中有标记样本数据仅占少数,通过最小化标准架构的无约束最优化问题无法保证充分故障分离精度,因此需要一些标记样本数据指导F的求解,全局正则项反映了p(x)的内在几何分布信息。p(x)为样本的分布概率,p(y|x)为已知样本x的条件下类标号为y的条件概率,分布较为集中的样本最可能具有相似的类标签,即x1和x2相邻,则p(y|x1)≈p(y|x2),x1和x2的类标签相似。也就是说p(y|x)应当在p(x)内在几何性质下非常光滑。为黎曼积分,形式如下:
其中:f是实值函数;M代表低维数据流形,是f对M的梯度,反映了f的光滑性。可以进一步近似表示为:
G可以通过式(5)计算:
G=S-W∈Rn×n (5)
采用正则化的拉普拉斯矩阵,对式(5)做进一步改进,得到式(6):
其中I是一个k×k的单位矩阵;S是一个对角矩阵,其对角元素是W=[Wij]∈Rn×n,为相似度矩阵;W与样本点构成一个无向加权图,该图的顶点对应样本点,该图的边Wij对应样本点的相似度;W的计算方法决定着最终故障分类的精确度,利用样本点xi的近邻点,通过局部重构的方法求取W,重构误差方程为:
其中求式(7)的最小值,便可以求得W,进而可以通过式(5)求得G;求取W的具体步骤如下:
步骤4.1.1:利用改进的距离公式(8)求解xi与其k个近邻点的距离度量,从而计算出样本点之间的距离,即样本相似度度量;
M(i),M(j)分别表示样本点xi到它的k个近邻之间的距离的平均值和样本点xj到它的k个近邻之间的距离的平均值;
步骤4.1.2:通过核映射,将式(8)转换为式(9);
其中,Kij=Φ(xi)TΦ(xj),Kii=Φ(xi)TΦ(xi),Kjj=Φ(xj)TΦ(xj),K为Mercer核;式(9)分子是通过式(8)的分子||xi-xj||经过核映射推导得到的,即式(9)分母中的是由式(8)的分母经过核映射推导得到的,具体推导过程如下:设则可得到式(10);
其中 为xi的第p个近邻点;为xj的第q个近邻点;
步骤4.1.3:利用式(9),并根据采集的数据中标记数据与非标记数据的情况,定义样本相似度度量,即样本间距离度量,由式(11)表示:
其中β是控制参数,它依赖于采集的样本数据点的分布密度;α是调节参数;
步骤4.1.4:用式(11)定义的距离度量求取样本xi的k个近邻,得到xi的近邻域Ni
步骤4.1.5:利用样本xi的k个近邻点重构xi,求取xi重构误差的最小值,即得到最优的相似度矩阵W:
其中,通过对样本点进行核映射后,式(7)转换为式(12);||.||是欧式范数;Wij有两个约束条件:及当时,Wij=0;
步骤4.2:求取局部正则矩阵M;
步骤4.2.1:通过欧氏距离确定样本点xi的k个近邻点,并定义这k个近邻点集,即xi的近邻域为其中表示样本点xi的第j个近邻点;
步骤4.2.2:建立由式(13)表示的损失函数,使得样本类标签分布光滑;
式中第一项是所有样本的预测类标签与实际类标签的误差总和;λ是调节参数;第二项S(gi)是惩罚函数;函数其能够使每个样本点通过该映射到达一个类标签:
其中为样本点xi的第j个近邻点的类标签;m是x的维数,s是半范数的偏导阶数;构成了一个阶数不小于s的多项式空间,2s>m;φi,j(x)是格林函数;βi,j和φi,j为格林函数的两个系数;
步骤4.2.3:通过求取步骤4.2.2中建立的损失函数的最小值,求取样本点xi的近邻点集Ni的类标签估计损失;
对于k个分散样本数据点,损失函数J(gi(x))的最小值可由式(15)估计:
其中Hi是一个k×k的对称矩阵,它的(r,z)元素:αi=[αi,1i,2,...,αi,k]∈Rk,βi=[βi,1i,2,...,βi,d-1]T∈Rk
对于一个较小的λ(例如λ取0.0001),损失函数J(gi(x))的最小值则可以用类标签矩阵估计,得到样本点xi的近邻点集Ni的类标签估计损失:
J(gi)≈λFi TMiFi (16)
其中,对应Ni中k个数据的类标签;Mi是系数矩阵的逆矩阵的左上k×k子块矩阵,由式(17)求取:
αi T(Hi+λI)αi=Fi TMiFi (17)
步骤4.2.4:将n个样本点的近邻域的类标签估计损失集中到一起得到总的类标签估计损失,由式(18)表示,求取总损失E(f)的最小值即得到样本数据的类标签,进而求得局部正则矩阵M;所述总的类标签估计损失由式(18)表示:
其中f=[f1,f2,...,fn]T∈Rn是类标签向量;
忽略式(18)中的系数λ,那么式(18)变为式(19):
又根据存在着行选择矩阵Si∈Rk×n,使得Fi=Sif;其中Si的第u行和第v列元素Si(u,v)能由式(20)定义:
将式Fi=Sif代入式(20)中,得到E(f)∝fTMf,其中
步骤4.3:通过对工业过程故障分离目标函数J(F)偏导为0,得到目标函数的最优解F*
步骤5:根据最优解F*,通过式(22)可以得到预测类标签矩阵,从而可以确定过程的故障信息;
其中fi为样本点xi的预测类标签。
为验证本实施方式所提出的基于正则化架构的工业过程故障分离方法在存在多种故障类型的工业过程中分离故障的有效性,利用图2所示的实验平台进行仿真实验。
图2所示的实验平台为热镀锌酸洗废液过程。热镀锌生产过程中,在钢铁工件首先进行完碱液脱脂后,常用盐酸来进行浸蚀,以除去铁件表面上的锈和氧化膜。
钢铁与盐酸反应,可生成下列铁盐:
FeO+2HCl→FeCl2+H2O Fe2O3+6HCl→2FeCl3+3H2O
FeO+8HCl→2FeCl3+FeCl2+4H2O Fe+2HCl→FeCl2+H2
由上述反应可知,钢铁在盐酸中酸洗时产生两种铁盐:一种是三氯化铁,一种是氯化亚铁。酸洗件一般严重生锈的很少,因此产生的多是氯化亚铁。随着铁盐的增多,盐酸浓度也会淡起来,也就是我们习惯说的失效。通常的方法是将已近失效的盐酸倒掉,这一做法现在因为环保的意识增强和控制,以及回收技术的发展,已不釆用。其实即使这些废酸有时浓度还是很高的,倒掉的酸溶液可能会比平时在酸洗后清洗时带出的酸还要多。因此这是一个重要的污染源,也是一种资源的浪费。最好的办法是将酸溶液回收利用。
本实施方式的热镀锌生产过程中,酸洗废酸的工艺流程如图3所示,为:将热镀锌厂酸洗时产生的废酸输入带有搅拌装置的废液箱中,加入过量铁粉将其中的三价铁置换为二价铁,然后将置换后溶液通过固液分离进一步净化,得到了主要成分为氯化亚铁的废酸溶液,取适量氯化亚铁溶液输入到反应釜,调节一定的温度、pH值、浓度、空气输入量以及搅拌速度,控制时间制备铁红(或铁黄)晶种。晶种即为凝结核,并输送氯化亚铁废酸溶液,通过调节温度、pH值、浓度、空气输入量、搅拌速度和控制时间,氧化生成铁红(或铁黄)。生成的铁红(或铁黄)溶液经过固液分离,固体粉末经过干燥、包装成为产品,液体中的氯化铵母液经过蒸发结晶可制备氯化铵副产品,蒸发冷凝水返回系统使用。
根据前面的介绍以及对化学物理变化的研究,本实验平台主要由废液箱,反应釜(综合反应系统),压滤设备,管道阀门,泵,控制系统,配电箱,电控柜,动力柜和空气压缩机等主要部分组成。全系统的变量包括:反应釜内温度、反应釜内压力、反应釜内液位、进入反应釜内的流量、转运泵1的电流、转运泵2的电流、计量泵1转速、计量泵1电流、计量泵2转速、计量泵2电流、计量泵3转速、计量泵3电流、计量泵4转速、计量泵4电流、反应釜中搅拌器电流、反应釜中搅拌器电压和反应釜中搅拌器速度。本实验平台所示的热镀锌酸洗废液过程存在的故障及其所属故障类型,如表1所示。
表1热镀锌酸洗废液过程的故障描述即特点
故障名称 故障类型
故障1:运转泵1出现故障突然停转 阶跃
故障2:管道控制阀失效 阶跃
在实际工业过程中获得具有标记的数据是极其困难的,因此本是实施方式选择少量这样的数据作为训练数据,本实施方式的训练数据包括三种状态:正常,故障1和故障2。
本实施方式先对第一组700个含故障1的采样数据进行仿真,该组测试样本主要包含正常的数据和故障1的数据,具体体现在前300个样本点工作正常,之后引入故障1。为了确定不同数目的标记数据样本对监控结果的影响,本实施方式分别选用含有5%的标记样本,10%的标记样本和15%的标记样本用于建模,然后观测其过程监测结果。如图4(a)、图4(b)和图4(c)三个图所示,可以发现模型可以从前300个数据提取出正常特征,然后从后300个数据提取出故障1的特征,所以可以确定该测试样本中的故障发生在第300个样本点。在建模过程中,不同数目的标记数据样本和其相应的不同的监控结果依次展示在图4(a),图4(b)和图4(c)。
从图4(a)可以看出,在正常情况下最大类别差距约等于0.6,虽然类别区分度不太高,但是三类特征都可以分别提取出来,几乎没有重叠。在发生故障时类别差异约为1,虽然类别区分度很高,可以将故障1单独分离开,但是正常数据特征和故障2的特征区分度却很低,有很大重叠部分。整体来看这组实验是可以精确的找到发生故障的样本点的。
从图4(b)可以看出,在正常情况下最大类别差距约等于0.7,类别区分度不太高,但是只能将正常特征提取出来,故障1和故障2存在严重重叠。在发生故障时类别差异约为0.9,虽然类别区分度很高,可以将故障1单独分离开,但是正常数据特征和故障2的特征区分度却很低,有很大重叠部分。整体来看这组实验我们是可以精确的找到发生故障的样本点的。
从图4(c)可以看出,在正常情况下最大类别差距约等于0.7,类别区分度不太高,但是只能将正常特征提取出来,故障1和故障2存在严重重叠。在发生故障时类别差异约为0.9,虽然类别区分度很高,可以将故障1单独分离开,但是正常数据特征和故障2的特征区分度却很低,有很大重叠部分。整体来看这组实验我们是可以精确的找到发生故障的样本点的。
从图4(a),4(b)和4(c),可以发现该模型是可以从测试样本前300个数据提取出正常特征,然后从后400个数据提取出故障1的特征,所以我们可以确定该测试样本中的故障发生在第300个样本点。但是随着训练数据中标记样本数据个数的增加,由于指导信息增多,这样就有利于未标记数据的类别判定,类别区分度在逐渐增大,也就是该故障分离效果较好,受干扰影响会较小。从图4(b)和图4(c)显示的结果基本一致,可以发现训练数据中有两个标记样本时,故障分离性能已经基本趋于饱和。这说明当标记样本达到一定数量时,类别区分度增大变缓甚至趋于稳定。
本实施方式再对第二组700个含故障2的采样数据进行仿真,该组测试样本主要包含正常的数据和故障2的数据,具体体现在前350个样本点工作正常,之后引入故障2。为了确定不同数目的标记数据样本对监控结果的影响,本实施方式分别选用含有5%的标记样本,10%的标记样本和15%的标记样本的训练数据用于建模,然后观测其过程监测结果,如图5(a)、图5(b)和图5(c)的三个图所示。可以发现模型可以从测试样本前350个数据提取出正常特征,然后从后350个数据提取出故障2的特征,所以可以确定该测试样本中的故障发生在第350个样本点。在建模过程中,不同数目的标记数据样本和其相应的不同的监控结果依次展示在图5(a)、5(b)和5(c)。
从图5(a)可以看出,在正常情况下最大类别差距约等于0.5,虽然类别区分度不太高,但是三类特征都可以分别提取出来,几乎没有重叠。在发生故障时最大类别差异约为0.8,虽然类别区分度很高,可以将故障2单独分离开,但是正常数据特征和故障1的特征区分度却很低,有很大重叠部分。并且在发生故障时的这些特征曲线波动较大,容易受到干扰的影响,但是在350样本点转折时,转折斜率较大,整体来看,这组实验是可以精确的找到发生故障的样本点的。
从图5(b)可以看出,在正常情况下最大类别差距约等于0.8,类别区分度不太高,但是只能将正常特征提取出来,故障1和故障2存在严重重叠。在发生故障时最大类别差异约为0.8,类别区分度也不高,可以将故障2单独分离开,但是正常数据特征和故障1的特征区分度却很低,有很大重叠部分。并且在发生故障时的这些特征曲线波动较大,容易受到干扰的影响,但是在350样本点转折时,转折斜率较大。整体来看,这组实验是可以精确的找到发生故障的样本点的。
从图5(c)可以看出,期诊断效果与5(b)基本一致,在正常情况下最大类别差距约等于0.8,类别区分度不太高,但是只能将正常特征提取出来,故障1和故障2存在严重重叠。在发生故障时最大类别差异约为0.8,类别区分度也不高,可以将故障2单独分离开,但是正常数据特征和故障1的特征区分度却很低,有很大重叠部分。
从图5(a)、5(b)和5c),可以发现该模型是可以从测试样本前350个数据提取出正常特征,然后从后350个数据提取出故障2的特征,所以可以确定该测试样本中的故障发生在第350个样本点。但是随着训练数据中标记样本个数的增加,由于指导信息增多,这样就有利于未标记数据的类别判定,类别区分度在逐渐增大,也就是该故障分离效果较好,受干扰影响会较小。从图5(b)和图5(c)显示的结果基本一致,可以发现训练数据中有两个标记样本时,故障分离性能已经基本趋于饱和。这说明当标记样本达到一定数量时,类别区分度增大变缓甚至趋于稳定。
从上述实验可以看出,采用含有10%标记样本的训练数据建模,就可以获得较好的故障监测效果,正好符合现实中较难提前获得很多标记样本的特征。现实中因为故障的危害性较大所以获取故障信息不容易,加之标记的成本较高,所以现实中获得的已知标记数据就会很少。本实施方式的基于正则化架构的工业过程故障分离方法刚好可以利用最少的标记样本获得较优的故障监测结果。因此,本实施方式的基于正则化架构的工业过程故障分离方法对于过程监测和故障诊断是有效的。
本实施方式再对第一组含故障1的具有10%的标记样本的测试数据进行仿真,用于观测调节参数γ对故障监测性能的影响,从而确定最优的调节参数γ。该组测试样本主要包含正常的数据和故障1的数据,依旧是在前300个样本点工作正常,之后引入故障1。观测调节参数γ对故障监测性能的影响的监控结果依次展示在图6(a)~6(f)。
当γ=10-1时,从图6(a)可以看出,在正常情况下最大类别差距约等于0.9,在发生故障时最大类别差异约为1。虽然类别区分度很高,但是其震荡很剧烈,容易受到干扰的影响。可以将故障1监测出来,但是正常数据特征和故障2的特征区分度却很低,有很大重叠部分,整体来看这时候的性能并不太佳。
当γ=101和γ=102时,从图6(b)和图6(c)可以看出,在正常情况下最大类别差距约等于0.9,类别区分度很高,震荡也相对较小。在发生故障时最大类别差异约为1,类别区分度很高,既可以将故障1监测出来,并且这些特征曲线波动较小,不易受到干扰的影响,整体来看这时候的性能最佳。
当γ=103和γ=104时,从图6(d)和6(e)可以看出,在正常情况下最大类别差距约等于0.07,类别区分度很低,不利于提取特征。在发生故障时最大类别差异约为0.07,类别区分度很低,不利于提取特征,虽然可以将故障特征提取,但是容易受到干扰的影响,整体来看这时候的性能很差。
当γ=105时,从图6(f)可以看出,在第300个样本点发生的故障1根本无法监测出来,它很可能由于类别差距太小引起的,所以让故障特征无法提取出来,这时候系统根本无法应用。
总结:当101<γ<102时,可以得到较好效果的结果。但是当γ<10-1,即γ太小时曲线虽然效果不错,但是其震荡很剧烈,容易受到干扰的影响。当103<γ<104,即γ适当大时,类别差异较小,并且伴有少量的震荡。当γ>105,即γ太大时,类别判别不出来。
本实施方式的基于正则化架构的工业过程故障分离方法,利用局部正则项使得最优解具有理想的性质,利用全局正则项来弥补局部正则项因邻域内样本较少可能导致的故障分离精度不高的问题,从而平滑类标签。实验表明,本实施方式的基于正则化架构的工业过程故障分离方法不仅是可行的,并且其故障分离精度很高。另外,通过实验我可以推知,该方法的故障分离效果很大程度上取决于已标记样本所占比例和模型参数。

Claims (3)

1.一种基于正则化架构的工业过程故障分离方法,其特征在于:包括以下步骤:
步骤1:采集工业过程样本数据;
步骤2:对采集的样本数据进行滤波处理,滤除奇异样本数据,保留可用样本数据;所述可用样本数据包括标记样本数据和未标记样本数据;所述标记样本数据指的是通过有经验的专家或者工人对所采集的数据进行特征区分,分别标记为正常样本数据、故障样本数据及其对应的故障状态类别,使得这些样本数据具有类标签;所述未标记数据指的是直接采集的未经过任何标记处理而不具有类标签的数据;
可用样本数据集表示为:
T={(x1,y1),...(xl,yl)}∪{xl+1,...xn};xj∈Rd,j=1,…,n (1)
其中d为变量个数;n为样本个数;是标记数据,是未标记数据;yi∈{1,2,...,c},i=1,...,l,其中c是故障状态类别,l为标记样本个数;
步骤3:建立具有局部正则项和全局正则项的工业过程故障分离目标函数;
<mrow> <mi>J</mi> <mrow> <mo>(</mo> <mi>F</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mrow> <mi>F</mi> <mo>&amp;Element;</mo> <msup> <mi>R</mi> <mrow> <mi>n</mi> <mo>&amp;times;</mo> <mi>c</mi> </mrow> </msup> </mrow> </munder> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mrow> <mo>(</mo> <mrow> <mi>F</mi> <mo>-</mo> <mi>Y</mi> </mrow> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mi>D</mi> <mo>(</mo> <mrow> <mi>F</mi> <mo>-</mo> <mi>Y</mi> </mrow> <mo>)</mo> <mo>+</mo> <mfrac> <mi>&amp;gamma;</mi> <msup> <mi>n</mi> <mn>2</mn> </msup> </mfrac> <msup> <mi>F</mi> <mi>T</mi> </msup> <mi>G</mi> <mi>F</mi> <mo>+</mo> <msup> <mi>F</mi> <mi>T</mi> </msup> <mi>M</mi> <mi>F</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
其中J(F)为工业过程故障分离目标函数;F为预测类标签矩阵;tr是矩阵的迹符号;D是一个对角矩阵,其中对角元素Dii=Dl>0,i=1,...,l,Dii=Du≥0,i=l+1,...,n;(F-Y)TD(F-Y)为经验损失,用来度量预测类标签和初始类标签的差值;γ是调节参数;为全局正则项,G为全局正则矩阵;FTMF为局部正则项,M是局部正则矩阵;Y∈Rn×c为初始类标签矩阵,Y的元素定义如下:
步骤4:利用可用样本数据集,求解式(2)所示的工业过程故障分离目标函数的最优解F*
步骤5:根据最优解F*,通过式(4)可以得到预测类标签矩阵,从而可以确定过程的故障信息;
<mrow> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>=</mo> <munder> <mrow> <mi>arg</mi> <mi> </mi> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <mrow> <mn>1</mn> <mo>&amp;le;</mo> <mi>j</mi> <mo>&amp;le;</mo> <mi>c</mi> </mrow> </munder> <msubsup> <mi>F</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mo>*</mo> </msubsup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>
其中fi为样本点xi的预测类标签。
2.根据权利要求1所述的基于正则化架构的工业过程故障分离方法,其特征在于:所述的步骤4包括如下步骤:
步骤4.1:根据改进的相似度度量算法和KNN分类算法,求取全局正则矩阵G;
G可以通过式(5)计算:
G=S-W∈Rn×n (5)
采用正则化的拉普拉斯矩阵,对式(5)做进一步改进,得到式(6):
<mrow> <mi>G</mi> <mo>=</mo> <mi>I</mi> <mo>-</mo> <msup> <mi>S</mi> <mrow> <mo>-</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> </mrow> </msup> <msup> <mi>WS</mi> <mrow> <mo>-</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> </mrow> </msup> <mo>&amp;Element;</mo> <msup> <mi>R</mi> <mrow> <mi>n</mi> <mo>&amp;times;</mo> <mi>n</mi> </mrow> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow> 1
其中I是一个k×k的单位矩阵;S是一个对角矩阵,其对角元素是i=1,2,...,n;W=[Wij]∈Rn×n,为相似度矩阵;W与样本点构成一个无向加权图,该图的顶点对应样本点,该图的边Wij对应样本点的相似度;W的计算方法决定着最终故障分类的精确度,利用样本点xi的近邻点,通过局部重构的方法求取W,重构误差方程为:
<mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msup> <mrow> <mo>||</mo> <mrow> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>-</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <msub> <mi>W</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mrow> <mo>||</mo> </mrow> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>
其中求式(7)的最小值,便可以求得W,进而可以通过式(5)求得G;求取W的具体步骤如下:
步骤4.1.1:利用改进的距离公式(8)求解xi与其k个近邻点的距离度量,从而计算出样本点之间的距离,即样本相似度度量;
<mrow> <msub> <mi>W</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mi>d</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mo>||</mo> <mrow> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> </mrow> <mo>||</mo> </mrow> <msqrt> <mrow> <mi>M</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mi>M</mi> <mrow> <mo>(</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> </msqrt> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>
M(i),M(j)分别表示样本点xi到它的k个近邻之间的距离的平均值和样本点xj到它的k个近邻之间的距离的平均值;
步骤4.1.2:通过核映射,将式(8)转换为式(9);
<mrow> <mi>d</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <msqrt> <mrow> <msub> <mi>K</mi> <mrow> <mi>i</mi> <mi>i</mi> </mrow> </msub> <mo>-</mo> <mn>2</mn> <msub> <mi>K</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>K</mi> <mrow> <mi>j</mi> <mi>j</mi> </mrow> </msub> </mrow> </msqrt> <msqrt> <mi>&amp;Delta;</mi> </msqrt> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>
其中,Kij=Φ(xi)TΦ(xj),Kii=Φ(xi)TΦ(xi),Kjj=Φ(xj)TΦ(xj),K为Mercer核;式 (9)分子是通过式(8)的分子||xi-xj||经过核映射推导得到的,即 <mrow> <mo>||</mo> <mi>&amp;Phi;</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>&amp;Phi;</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>||</mo> <mo>=</mo> <msqrt> <msup> <mrow> <mo>||</mo> <mi>&amp;Phi;</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>&amp;Phi;</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>||</mo> </mrow> <mn>2</mn> </msup> </msqrt> <mo>=</mo> <msqrt> <mrow> <msub> <mi>K</mi> <mrow> <mi>i</mi> <mi>i</mi> </mrow> </msub> <mo>-</mo> <mn>2</mn> <msub> <mi>K</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>K</mi> <mrow> <mi>j</mi> <mi>j</mi> </mrow> </msub> </mrow> </msqrt> <mo>;</mo> </mrow> 式(9)分母中的 <mrow> <mi>&amp;Delta;</mi> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>p</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>K</mi> <mrow> <mi>i</mi> <mi>i</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>K</mi> <mrow> <msup> <mi>ii</mi> <mi>p</mi> </msup> </mrow> </msub> <mo>-</mo> <msub> <mi>K</mi> <mrow> <msup> <mi>i</mi> <mi>p</mi> </msup> <mi>i</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>K</mi> <mrow> <msup> <mi>i</mi> <mi>p</mi> </msup> <msup> <mi>i</mi> <mi>p</mi> </msup> </mrow> </msub> <mo>)</mo> </mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>q</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>K</mi> <mrow> <mi>j</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>K</mi> <mrow> <msup> <mi>jj</mi> <mi>p</mi> </msup> </mrow> </msub> <mo>-</mo> <msub> <mi>K</mi> <mrow> <msup> <mi>j</mi> <mi>p</mi> </msup> <mi>j</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>K</mi> <mrow> <msup> <mi>j</mi> <mi>p</mi> </msup> <msup> <mi>j</mi> <mi>p</mi> </msup> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <msup> <mi>k</mi> <mn>2</mn> </msup> </mfrac> </mrow>
其中 <mrow> <msub> <mi>K</mi> <mrow> <msup> <mi>ii</mi> <mi>p</mi> </msup> </mrow> </msub> <mo>=</mo> <mi>&amp;Phi;</mi> <msup> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mi>&amp;Phi;</mi> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>i</mi> <mi>p</mi> </msubsup> <mo>)</mo> </mrow> <mo>;</mo> <msub> <mi>K</mi> <mrow> <msup> <mi>i</mi> <mi>p</mi> </msup> <mi>i</mi> </mrow> </msub> <mo>=</mo> <mi>&amp;Phi;</mi> <msup> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>i</mi> <mi>p</mi> </msubsup> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mi>&amp;Phi;</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>;</mo> <msub> <mi>K</mi> <mrow> <msup> <mi>i</mi> <mi>p</mi> </msup> <msup> <mi>i</mi> <mi>p</mi> </msup> </mrow> </msub> <mo>=</mo> <mi>&amp;Phi;</mi> <msup> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>i</mi> <mi>p</mi> </msubsup> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mi>&amp;Phi;</mi> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>i</mi> <mi>p</mi> </msubsup> <mo>)</mo> </mrow> <mo>;</mo> <msub> <mi>K</mi> <mrow> <msup> <mi>jj</mi> <mi>q</mi> </msup> </mrow> </msub> <mo>=</mo> <mi>&amp;Phi;</mi> <msup> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mi>&amp;Phi;</mi> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mi>q</mi> </msubsup> <mo>)</mo> </mrow> <mo>;</mo> </mrow> <mrow> <msub> <mi>K</mi> <mrow> <msup> <mi>j</mi> <mi>q</mi> </msup> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mi>&amp;Phi;</mi> <msup> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mi>q</mi> </msubsup> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mi>&amp;Phi;</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>;</mo> <msub> <mi>K</mi> <mrow> <msup> <mi>j</mi> <mi>q</mi> </msup> <msup> <mi>j</mi> <mi>q</mi> </msup> </mrow> </msub> <mo>=</mo> <mi>&amp;Phi;</mi> <msup> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mi>q</mi> </msubsup> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mi>&amp;Phi;</mi> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mi>q</mi> </msubsup> <mo>)</mo> </mrow> <mo>;</mo> <msubsup> <mi>x</mi> <mi>p</mi> <mi>i</mi> </msubsup> <mrow> <mo>(</mo> <mi>p</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>...</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> 为xi的第p个近邻点;为xj的第q个近邻点;
步骤4.1.3:利用式(9),并根据采集的数据中标记数据与非标记数据的情况,定义样本相似度度量,即样本间距离度量,由式(11)表示:
其中β是控制参数,它依赖于采集的样本数据点的分布密度;α是调节参数;
步骤4.1.4:用式(10)定义的距离度量求取样本xi的k个近邻,得到xi的近邻域Ni
步骤4.1.5:利用样本xi的k个近邻点重构xi,求取xi重构误差的最小值,即得到最优的相似度矩阵W:
<mrow> <mi>arg</mi> <mi> </mi> <mi>m</mi> <mi>i</mi> <mi>n</mi> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msup> <mrow> <mo>||</mo> <mi>&amp;Phi;</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>&amp;Element;</mo> <msub> <mi>N</mi> <mi>i</mi> </msub> </mrow> </munder> <msub> <mi>W</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>&amp;Phi;</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>||</mo> </mrow> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>11</mn> <mo>)</mo> </mrow> </mrow>
其中,通过对样本点进行核映射后,式(7)转换为式(11);||.||是欧式范数;Wij有两个 约束条件: <mrow> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>&amp;Element;</mo> <msub> <mi>N</mi> <mi>i</mi> </msub> </mrow> </munder> <msub> <mi>W</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mn>1</mn> </mrow> 及当 <mrow> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>&amp;NotElement;</mo> <msub> <mi>N</mi> <mi>i</mi> </msub> </mrow> 时,Wij=0;
步骤4.2:求取局部正则矩阵M;
步骤4.3:通过对工业过程故障分离目标函数J(F)偏导为0,得到目标函数的最优解F*
<mrow> <mtable> <mtr> <mtd> <mrow> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>J</mi> </mrow> <mrow> <mo>&amp;part;</mo> <mi>G</mi> </mrow> </mfrac> <msub> <mo>|</mo> <mrow> <mi>F</mi> <mo>=</mo> <msup> <mi>F</mi> <mo>*</mo> </msup> </mrow> </msub> <mo>=</mo> <mn>2</mn> <mi>D</mi> <mrow> <mo>(</mo> <msup> <mi>F</mi> <mo>*</mo> </msup> <mo>-</mo> <mi>Y</mi> <mo>)</mo> </mrow> <mo>+</mo> <mn>2</mn> <mfrac> <mi>&amp;gamma;</mi> <msup> <mi>n</mi> <mn>2</mn> </msup> </mfrac> <msup> <mi>GF</mi> <mo>*</mo> </msup> <mo>+</mo> <mn>2</mn> <mi>M</mi> <mi>F</mi> <mo>=</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>&amp;DoubleRightArrow;</mo> <mrow> <mo>(</mo> <mi>D</mi> <mo>+</mo> <mfrac> <mi>&amp;gamma;</mi> <msup> <mi>n</mi> <mn>2</mn> </msup> </mfrac> <mi>G</mi> <mo>+</mo> <mi>M</mi> <mo>)</mo> </mrow> <msup> <mi>F</mi> <mo>*</mo> </msup> <mo>=</mo> <mi>D</mi> <mi>Y</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>&amp;DoubleRightArrow;</mo> <msup> <mi>F</mi> <mo>*</mo> </msup> <mo>=</mo> <msup> <mrow> <mo>(</mo> <mi>D</mi> <mo>+</mo> <mfrac> <mi>&amp;gamma;</mi> <msup> <mi>n</mi> <mn>2</mn> </msup> </mfrac> <mi>G</mi> <mo>+</mo> <mi>M</mi> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mi>D</mi> <mi>Y</mi> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>12</mn> <mo>)</mo> </mrow> <mo>.</mo> </mrow>
3.根据权利要求2所述的基于正则化架构的工业过程故障分离方法,其特征在于:所述步骤4.2包括如下步骤:
步骤4.2.1:通过欧氏距离确定样本点xi的k个近邻点,并定义这k个近邻点集为其中表示样本点的第j个近邻点;
步骤4.2.2:建立由式(13)表示的损失函数,使得样本类标签分布光滑;
<mrow> <mi>J</mi> <mrow> <mo>(</mo> <msub> <mi>g</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <msub> <mi>i</mi> <mi>j</mi> </msub> </msub> <mo>-</mo> <msub> <mi>g</mi> <mi>i</mi> </msub> <mo>(</mo> <msub> <mi>x</mi> <msub> <mi>i</mi> <mi>j</mi> </msub> </msub> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <mi>&amp;lambda;</mi> <mi>S</mi> <mrow> <mo>(</mo> <msub> <mi>g</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>13</mn> <mo>)</mo> </mrow> </mrow>
式中第一项是所有样本的预测类标签与实际类标签的误差总和;λ是调节参数;第二项S(gi)是惩罚函数;函数gi:Rm→R,其能够使每个样本点通过该映射到达一个类标签:
<mrow> <msub> <mi>f</mi> <msub> <mi>i</mi> <mi>j</mi> </msub> </msub> <mo>=</mo> <msub> <mi>g</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <msub> <mi>i</mi> <mi>j</mi> </msub> </msub> <mo>)</mo> </mrow> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>k</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>14</mn> <mo>)</mo> </mrow> </mrow>
其中为样本点xi的第j个近邻点的类标签;m是x的维数,s是半范数的偏导阶数;构成了一个阶数不小于s的多项式空间,2s>m;φi,j(x)是格林函数;βi,j和φi,j为格林函数的两个系数;
步骤4.2.3:通过求取步骤4.2.2中建立的损失函数的最小值,求取样本点xi的近邻点集Ni的类标签估计损失;
对于k个分散样本数据点,损失函数J(gi(x))的最小值可由式(15)估计:
<mrow> <mi>J</mi> <mrow> <mo>(</mo> <msub> <mi>g</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>&amp;ap;</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <msub> <mi>i</mi> <mi>j</mi> </msub> </msub> <mo>-</mo> <msub> <mi>g</mi> <mi>i</mi> </msub> <mo>(</mo> <msub> <mi>x</mi> <msub> <mi>i</mi> <mi>j</mi> </msub> </msub> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <msub> <mi>&amp;lambda;&amp;alpha;</mi> <mi>i</mi> </msub> <mi>T</mi> </msup> <msub> <mi>H</mi> <mi>i</mi> </msub> <msub> <mi>&amp;alpha;</mi> <mi>i</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>15</mn> <mo>)</mo> </mrow> </mrow>
其中Hi是一个k×k的对称矩阵,它的(r,z)元素: <mrow> <msub> <mi>H</mi> <mrow> <mi>r</mi> <mo>,</mo> <mi>z</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>&amp;phi;</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>z</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <msub> <mi>i</mi> <mi>r</mi> </msub> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow> αi=[αi,1,αi,2,..., αi,k]∈Rk,βi=[βi,1,βi,2,...,βi,d-1]T∈Rk;
对于一个较小的λ,损失函数J(gi(x))的最小值则可以用标签矩阵估计,得到样本点xi的近邻点集Ni的类标签估计损失:
<mrow> <mi>J</mi> <mrow> <mo>(</mo> <msub> <mi>g</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>&amp;ap;</mo> <msup> <msub> <mi>&amp;lambda;F</mi> <mi>i</mi> </msub> <mi>T</mi> </msup> <msub> <mi>M</mi> <mi>i</mi> </msub> <msub> <mi>F</mi> <mi>i</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>16</mn> <mo>)</mo> </mrow> </mrow>
其中,对应Ni中k个数据的类标签;Mi是系数矩阵的逆矩阵的左上k×k子块矩阵,由式(17)求取:
<mrow> <msup> <msub> <mi>&amp;alpha;</mi> <mi>i</mi> </msub> <mi>T</mi> </msup> <mrow> <mo>(</mo> <msub> <mi>H</mi> <mi>i</mi> </msub> <mo>+</mo> <mi>&amp;lambda;</mi> <mi>I</mi> <mo>)</mo> </mrow> <msub> <mi>&amp;alpha;</mi> <mi>i</mi> </msub> <mo>=</mo> <msup> <msub> <mi>F</mi> <mi>i</mi> </msub> <mi>T</mi> </msup> <msub> <mi>M</mi> <mi>i</mi> </msub> <msub> <mi>F</mi> <mi>i</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>17</mn> <mo>)</mo> </mrow> </mrow>
步骤4.2.4:将n个样本点的近邻域的类标签估计损失集中到一起得到总的类标签估计损失,求取总损失E(f)的最小值即得到样本数据的类标签,进而求得局部正则矩阵M;所述总的类标签估计损失由式(18)表示:
<mrow> <mi>E</mi> <mrow> <mo>(</mo> <mi>f</mi> <mo>)</mo> </mrow> <mo>&amp;ap;</mo> <mi>&amp;lambda;</mi> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msup> <msub> <mi>F</mi> <mi>i</mi> </msub> <mi>T</mi> </msup> <msub> <mi>M</mi> <mi>i</mi> </msub> <msub> <mi>F</mi> <mi>i</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>18</mn> <mo>)</mo> </mrow> </mrow>
其中f=[f1,f2,...,fn]T∈Rn是类标签向量;
忽略式(18)中的系数λ,那么式(18)变为式(19):
<mrow> <mi>E</mi> <mrow> <mo>(</mo> <mi>f</mi> <mo>)</mo> </mrow> <mo>&amp;Proportional;</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msup> <msub> <mi>F</mi> <mi>i</mi> </msub> <mi>T</mi> </msup> <msub> <mi>M</mi> <mi>i</mi> </msub> <msub> <mi>F</mi> <mi>i</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>19</mn> <mo>)</mo> </mrow> </mrow>
又根据存在着行选择矩阵Si∈Rk×n,使得Fi=Sif;其中Si的第u行和第v列元素Si(u,v)能由式(20)定义:
将Fi=Sif代入式(20)中,得到E(f)∝fTMf,其中
CN201510816035.7A 2015-11-19 2015-11-19 一种基于正则化架构的工业过程故障分离方法 Active CN105278526B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510816035.7A CN105278526B (zh) 2015-11-19 2015-11-19 一种基于正则化架构的工业过程故障分离方法
US15/009,241 US20170146433A1 (en) 2015-11-19 2016-01-28 Fault isolation method of industrial process based on regularization framework

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510816035.7A CN105278526B (zh) 2015-11-19 2015-11-19 一种基于正则化架构的工业过程故障分离方法

Publications (2)

Publication Number Publication Date
CN105278526A CN105278526A (zh) 2016-01-27
CN105278526B true CN105278526B (zh) 2017-12-01

Family

ID=55147706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510816035.7A Active CN105278526B (zh) 2015-11-19 2015-11-19 一种基于正则化架构的工业过程故障分离方法

Country Status (2)

Country Link
US (1) US20170146433A1 (zh)
CN (1) CN105278526B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6523815B2 (ja) * 2015-06-22 2019-06-05 株式会社日立製作所 プラント診断装置及びプラント診断方法
CN107133642A (zh) * 2017-04-25 2017-09-05 东北大学 一种基于田纳西伊斯曼过程的先验知识故障诊断方法
CN108225750A (zh) * 2017-12-12 2018-06-29 南京航空航天大学 一种基于故障特征多相关性的旋转机械故障诊断方法
CN109685005B (zh) * 2018-12-24 2023-05-26 中国航空工业集团公司西安飞机设计研究所 飞行控制系统试验数据处理方法
CN109886334B (zh) * 2019-02-20 2023-09-22 安徽师范大学 一种隐私保护的共享近邻密度峰聚类方法
CN109949437B (zh) * 2019-03-13 2021-06-15 东北大学 基于稀疏化的异构数据协同工业故障诊断方法
CN110362103B (zh) * 2019-08-19 2023-02-10 西北工业大学 分布式自主水下航行器姿态协同优化控制方法
CN111460966B (zh) * 2020-03-27 2024-02-02 中国地质大学(武汉) 基于度量学习和近邻增强的高光谱遥感图像分类方法
CN111651913B (zh) * 2020-05-13 2023-03-24 上海交通大学 一种汽车发动机性能预测及辅助标定方法及系统
CN111833012A (zh) * 2020-06-19 2020-10-27 联想(北京)有限公司 一种工业数据处理方法和装置
CN111859773B (zh) * 2020-08-05 2023-07-18 哈尔滨工程大学 基于正则化粒子滤波的电动闸阀故障确定方法及系统
CN112184034B (zh) * 2020-09-30 2024-04-09 江南大学 基于互信息的多块k近邻故障监测方法及系统
CN113741394B (zh) * 2021-09-06 2023-08-15 河海大学 一种基于半监督式增量学习的工业设备故障诊断系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577589A (zh) * 2013-11-11 2014-02-12 浙江工业大学 一种基于支持张量数据描述的离群数据检测方法
CN103942749A (zh) * 2014-02-24 2014-07-23 西安电子科技大学 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法
CN104008197A (zh) * 2014-06-13 2014-08-27 南京信息工程大学 一种特征加权的模糊紧致散布聚类方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070088550A1 (en) * 2005-10-13 2007-04-19 Dimitar Filev Method for predictive maintenance of a machine
US8918288B2 (en) * 2011-10-14 2014-12-23 Precision Energy Services, Inc. Clustering process for analyzing pressure gradient data
US20120266209A1 (en) * 2012-06-11 2012-10-18 David Jeffrey Gooding Method of Secure Electric Power Grid Operations Using Common Cyber Security Services
EP2954580B1 (en) * 2012-12-18 2019-11-20 Audi AG Limit based threshold estimation for prognostics and health management
US20150219530A1 (en) * 2013-12-23 2015-08-06 Exxonmobil Research And Engineering Company Systems and methods for event detection and diagnosis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577589A (zh) * 2013-11-11 2014-02-12 浙江工业大学 一种基于支持张量数据描述的离群数据检测方法
CN103942749A (zh) * 2014-02-24 2014-07-23 西安电子科技大学 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法
CN104008197A (zh) * 2014-06-13 2014-08-27 南京信息工程大学 一种特征加权的模糊紧致散布聚类方法

Also Published As

Publication number Publication date
US20170146433A1 (en) 2017-05-25
CN105278526A (zh) 2016-01-27

Similar Documents

Publication Publication Date Title
CN105278526B (zh) 一种基于正则化架构的工业过程故障分离方法
CN104777830B (zh) 一种基于kpca混合模型的多工况过程监控方法
CN104731083B (zh) 一种基于自适应特征提取的工业故障诊断方法及应用
CN105259895B (zh) 一种工业过程微小故障的检测和分离方法及其监测系统
CN104330471B (zh) 航空结构损伤的Lamb波时变概率模型监测方法
Do Coutto Filho et al. Enhanced bad data processing by phasor-aided state estimation
CN109270907B (zh) 一种基于分层概率密度分解的过程监测和故障诊断方法
CN108345284A (zh) 一种基于两变量块的质量相关故障检测方法
CN107644148B (zh) 一种基于多参数关联的在轨卫星异常状态监测方法及系统
CN112817291B (zh) 基于混合特性评价和子空间分解的层次故障监测方法
CN104008294A (zh) 轴承异常检测系统及其方法
CN109871000A (zh) 一种数据驱动的闭环工业过程传感器故障诊断方法
CN112766301B (zh) 一种采油机示功图相似性判断方法
CN111290277A (zh) 一种分布式多智能体协同故障检测方法、存储介质及设备
CN107453484A (zh) 一种基于wams信息的scada数据校准方法
CN112966630A (zh) 一种超/特高压gis开关设备运行状态评估方法、系统及设备
CN109359662B (zh) 面向百万千瓦超超临界机组的非平稳分析与因果诊断方法
CN107122611A (zh) 青霉素发酵过程质量相关故障检测方法
CN114326486B (zh) 一种基于概率慢特征分析和弹性权重巩固的过程监控方法
CN104615123B (zh) 基于k近邻的传感器故障隔离方法
CN106406257A (zh) 一种基于案例推理的铁矿浮选精矿品位软测量方法及系统
CN116661410A (zh) 基于加权有向图的大规模工业过程故障检测及诊断方法
CN107272648A (zh) 一种工业过程微小故障的分离方法
CN115909535A (zh) 一种基于rbncva的高炉炼铁过程监测方法
Jiang et al. Improved fault detection in nonlinear chemical processes using WKPCA-SVDD

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant