CN115982579A - 一种基于层级波动窗口的多模态工业过程识别与监控方法 - Google Patents

一种基于层级波动窗口的多模态工业过程识别与监控方法 Download PDF

Info

Publication number
CN115982579A
CN115982579A CN202211728024.XA CN202211728024A CN115982579A CN 115982579 A CN115982579 A CN 115982579A CN 202211728024 A CN202211728024 A CN 202211728024A CN 115982579 A CN115982579 A CN 115982579A
Authority
CN
China
Prior art keywords
window
monitoring
fluctuation
mode
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211728024.XA
Other languages
English (en)
Inventor
郭青秀
刘建昌
谭树彬
王洪海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN202211728024.XA priority Critical patent/CN115982579A/zh
Publication of CN115982579A publication Critical patent/CN115982579A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Abstract

本发明提供一种基于层级波动窗口的多模态工业过程识别与监控方法,涉及过程监控技术领域。首先利用高斯混合模型来粗略识别模态信息;然后,层级波动窗口策略被用来精准判别稳定模态和过渡模态,在层级波动窗口中,包含初始层级和终端层级两个部分;在初始层级中,样本领域特征被滑动窗口分割,并选择出重点窗口输送到终端层级,接下来变量波动概念被引入并被滑动窗口分割去精准划分过渡模态的起点与终点。再然后,稳定模态利用基于马氏距离的GMM模型监控;最后,建立了一个新的邻域偏移模型去监控过渡模态。该方法能够同时从样本和变量角度精准划分模态,分别针对稳定模态和过渡模态建立合适的监控模型,减少监控复杂度并提高了过程的故障检测率。

Description

一种基于层级波动窗口的多模态工业过程识别与监控方法
技术领域
本发明涉及过程监控技术领域,尤其涉及一种基于层级波动窗口的多模态工业过程识别与监控方法。
背景技术
近年来,随着工业市场需求、生产计划这些因素的变化,越来越多的工业生产过程呈现出多模态特征。标准多元统计算法如主元分析(PCA)在多模态过程中表现不佳,因为它们假定过程应在稳定单一模态下运行。
尽管多模态过程被大家广泛关注,但是大部分研究仍然是基于稳定模态,而没有考虑到模态与模态间的过渡。监控过渡模态是有困难的,因为数据具有非线性,动态性,非平稳性的特征。近年来,一些学者开始了对过渡模态的研究。Zhang等提出了基于高斯混合模型(Gaussian mixture model,GMM)的多模型策略。首先应用k-Means粗聚类,然后将数据按时间排列并对其进行细聚类。最后,对每一个稳定模态建立一个单高斯模型,对每一个过渡模态建立一个GMM模型完成监控。然而,模型多太复杂,不利于实际应用。Gao等则是应用了局部峰值聚类识别稳定模态和过渡模态,并对每一个稳定模态建立了堆叠降噪自编码器模型进行监控,但是并没有提及过渡模态的监控模型。Ha等提出了基于KNN的集成多模态PCA。该方法利用KNN对多模态过程进行识别,再对识别后的每一个模态建立PCA监控模型。然而,KNN识别多模态过程的准确度需要提高,且过渡模态具有非线性,非平稳性等特征,使得PCA在监控过渡模态时受到影响。Lu等提出了基于阶段的子PCA模型去完成具有过渡过程的多模态数据,然而硬阶段划分算法忽略了模态间的过渡特性。
综上所述,具有过渡模态的多模态过程监控面临着模型数量多且复杂,窗口参数难以设定等问题,并且过渡模态的动态性和非平稳性对监测模型也有一定的要求。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于层级波动窗口的多模态工业过程识别与监控方法。
为解决上述技术问题,本发明所采取的方法是:
步骤1数据预处理;
采集正常工况下的多模态过程数据X:
X=[x1,x2,…,xm]T∈Rm×n
其中m为样本数,n为变量数,我们将包含n个变量的第i个样本记为xi,n(i=1,2,…,m)。
对X进行数据预处理,具体步骤如下:
步骤1.1计算所有变量的均值,其中,X中第j个变量xi,j(j=1,2,…,n)的均值计算公式为:
Figure BDA0004026554240000021
步骤1.2计算所有变量的标准差,其中,X中第j个变量xi,j(j=1,2,…,n)的标准差计算公式为:
Figure BDA0004026554240000022
步骤1.3对多模态历史数据X进行标准化,其中第i个样本的第j个变量的标准化计算公式为:
Figure BDA0004026554240000023
步骤2基于高斯混合模型的模态粗识别;
经过步骤1中的数据标准化,我们得到了标准化后的数据X;将X输入到高斯混合模型中进行聚类,通过EM算法求解高斯混合模型的参数,获取过程数据信息。
将高斯混合模型的聚类结果记为X={S1,T1,S2,…,Su,Tb,…,Sc-1,Tc-1,Sc}(u=1,2,…,c)(b=1,2,…,c-1),其中Su和Tb分别表示第u个稳定模态和b个过渡模态;
步骤3基于初始层级窗口的模态细识别;
步骤4基于终端层级窗口的模态细识别;
步骤5基于局部保持投影的数据降维;在步骤3和4中确定了稳定模态和过渡模态的边界后,就需要对X构建监控模型,并利用局部保持投影对过程数据X降维。
步骤5.1局部保持投影通过寻找投影矩阵A将数据Xm×n投影到低维特征空间Ym×l(l<n),其中yi=xiA(i=1,2,…,m),m为样本数,n为原始数据变量数,l为特征空间维数。
局部保持投影通过优化下式目标函数求解投影矩阵A:
Figure BDA0004026554240000024
其中Wij为权重系数,它会对投影后距离变远的原始近邻点进行惩罚,以达到保持投影前后样本近邻关系的目的;Wij的计算采取热核法,即
Figure BDA0004026554240000031
其中t为热核参数。
步骤5.2步骤5.1中的目标函数可转化为下式,
min aTXTPXa
其中,P=D-W为拉普拉斯矩阵,D是对角矩阵且Dii=∑jWij,a为投影向量。
步骤5.3加入约束条件aTXTDXa=1可使得投影向量的解唯一,通过拉格朗日函数法可将最优化求解问题转化为广义特征值问题,如下式:
XTPXa=λXTDXa
求解出的前r个最小的特征值所对应的特征向量构成的矩阵即为投影矩阵A,即A=(a1,a2,…,ar)。
步骤5.4多模态过程数据X通过投影矩阵A降维,得到低维空间数据Y,如下式:
Y=XA
步骤6构建稳定模态监控模型;
对于稳定模态的监控,一个结合马氏距离的新全局监控指标被应用:
Figure BDA0004026554240000032
其中,D为高斯主元的个数,p(θd|x)为样本x属于第d个高斯主元的概率,θd={μdd}且μd与∑d分别为第d个高斯主元的均值和协方差矩阵;λd为马氏距离,如下式:
Figure BDA0004026554240000033
G的控制限GUCL可以由F分布得到,如下式:
Figure BDA0004026554240000034
其中,m,n分别是过程数据的样本数和变量数,Fn,m-n,α是自由度为n和m-n的F分布,α为置信度。
步骤7构建过渡模态监控模型。
其中,步骤3具体方法如下:
步骤3.1对于X中的某一个样本x,其邻域特征Dx定义如下:
Figure BDA0004026554240000035
其中,k为x的近邻个数,di为样本x与第i个近邻的距离,exp为指数函数。
邻域特征从距离的方面阐述了各个模态的特征。通常,同模态的邻域特征是相似的,当出现模态转换的情况时,相邻的模态特征会出现较大的波动。将X中所有样本的邻域距离记为D。
步骤3.2利用窗宽为W的定窗口H对D进行分割,即D被分割为m/W个初始层级窗口。
步骤3.3以初始层级窗口为单位,计算第i个初始层级窗口的平均邻域特征,计算公式为:
Figure BDA0004026554240000041
其中,Hi表示第i个初始窗口,μi代表初始层级窗口内数据的平均邻域特征,在不同模态中,初始层级窗口的平均邻域特征会有较大的差异。
步骤3.4绝对差值是判断稳定模态和过渡模态的分割点,计算公式为:
Figure BDA0004026554240000042
其中μi和μi+1分别为第i个及第i+1个初始层级窗口的平均邻域特征;γi代表了相邻初始层级窗口的平均邻域特征差异,如果某个初始层级窗口包含过渡模态的起点或终点,则该窗口与相邻窗口的绝对差值会大于其余模态窗口的绝对差值。
步骤3.5根据高斯混合模型粗识别得到的模态信息,即X包含c-1个过渡模态,将γi从大到小排列得到γ*并选出前2(c-1)个最大的γi值。
步骤3.6按照初始层级窗口的排列顺序,在原始数据X中提取所有2(c-1)个γi值所对应的窗口作为重点窗口H*,如下式所示:
Figure BDA0004026554240000043
其中,
Figure BDA0004026554240000044
Figure BDA0004026554240000045
分别表示包含第j个过渡模态的起点和终点窗口。
其中,步骤4具体方法如下:
步骤4.1在步骤3.6中得到的
Figure BDA0004026554240000046
Figure BDA0004026554240000047
基础上,对其进行扩充,如下式:
Figure BDA0004026554240000048
其中,Hj和Ho分别为在X中
Figure BDA0004026554240000049
Figure BDA00040265542400000410
的相邻窗口,相邻窗口的数量g可以根据多模态过程数据X的情况进行调整,此时,
Figure BDA00040265542400000411
Figure BDA00040265542400000412
中的样本数为(g+1)W。
步骤4.2计算变量波动率
s为
Figure BDA00040265542400000413
Figure BDA00040265542400000414
中的某一个变量,第f个时刻tf对应变量值sf,如下式:
s={(s1,t1),…,(sf,tf),…,(s(g+1)w,t(g+1)W)}
步骤4.3引入窗宽为L的定窗口h对s进行分割,即s被分割为(g+1)W/L个终端层级窗口。
步骤4.4相邻终端层级窗口的变量波动率vi如下式:
Figure BDA0004026554240000051
其中,si(j)表示第i个终端层级窗口中的第j个变量值,vi衡量了相邻窗口的差异,vi越大,则相邻窗口差异越大,当vi=0时,代表两个窗口完全相同。
步骤4.5通过确定变量s中最大的vi,来确定该变量发生模态转化的时间ta,如下式:
ta(s)=max(vi)(s=1,2,…,n)
其中,max为最大值函数。
步骤4.6遍历
Figure BDA0004026554240000052
中的变量并统计每一个ta出现的次数,从而确定模态转换开始的位置ttrans,如下:
ttrans=max(count(ta(s)))(s=1,2,…,n)
其中,count为计数函数。
其中,步骤7具体方法如下:
步骤7.1对于降维后的过渡过程数据T中的样本τ,首先,在T中寻找τ的k个近邻样本τ12,…,τk
步骤7.2计算k个近邻样本的均值向量ξ,如下式:
Figure BDA0004026554240000053
其中,τi为样本τ的第i个近邻样本,k为近邻个数。
步骤7.3低维空间中的样本τ的偏移向量记为η=τ-ξ,并将过渡过程数据T的偏移矩阵记为B。
步骤7.4在主元子空间和残差子空间,分别建立两个监控统计量,如下式:
Figure BDA0004026554240000054
qno=e(ΞE)-1eT
其中,ΞB为均值B的协方差矩阵;其中e为残差向量且e=xh-ξAT,xh为τ在高维空间所对应的样本,A为局部保持投影的投影矩阵;ΞE为由e组成的残差矩阵的协方差矩阵;为了方便,
Figure BDA0004026554240000055
和qno的控制限
Figure BDA0004026554240000056
和qno-UCL应用核密度方法进行确定。
本发明的有益效果:
本发明提供了一种基于层级波动窗口的多模态工业过程识别与监控方法,该方法的有益效果概括如下:(1)从样本和变量的角度提出了新的层级波动窗口(HFWS)去精准识别模态信息,提高了具有过渡模态的多模态过程的识别准确率,便于后续监控模型的建立;(2)对过渡模态建立一个邻域偏移模型,减少监控复杂度的同时提高了过渡模态的故障检测率;(3)对稳定模态利用基于马氏距离的GMM模型进行监控,极大的减少了模型数量;(4)应用一个新的基准TE过程,该过程为后续同类工作的比较提供了公共平台,并且本发明的模态识别和监控能力在该过程得到了有效的验证。
附图说明
图1为本发明实施例提供的方法流程图;
图2为本发明实施例提供的Tennessee-Eastman过程工艺流程图;
图3为本发明实施例提供的邻域特征波动图;
图4为本发明实施例提供的波动窗口占比示意图;
图5为本发明实施例提供的故障10中变量19在四种幅度下的散点图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本实施例的方法如下所述:
本发明被用于一个新的基准田纳西-伊斯曼过程(Tennessee-Eastman,TE)用以说明监控效果。Reinartz等人在2021年提出了一个新的TE数据集,这为今后的研究提供了一个合适且统一的基准,其工艺流程图如图2所示。新的数据集包含6种运行模式,每个模态采样频率为3分钟且运行100小时,过程故障更新为28个,如表1所示:
表1TE过程故障列表
Figure BDA0004026554240000061
Figure BDA0004026554240000071
过程在第30小时开始引入故障,除了提供全幅值的故障以外,Reinartz等人还模拟了25%,50%和75%幅值下的所有故障,其中,100%幅值的故障被模拟200次,25%,50%和75%幅值的故障被模拟100次。我们利用网站下载的模态1与模态2的数据进行实验。训练数据共有2000个样本,其中前600个样本属于模态1,601-1000个样本属于过渡模态,1001-2000属于模态2。故障数据同样包含2000个样本,从601个样本开始引入故障。
实施例实现过程如图1所示,具体如下:
步骤1数据预处理;
采集正常工况下的多模态过程数据X:
X=[x1,x2,…,xm]T∈Rm×n
其中,m=2000为样本数,n=50为变量数,我们将包含n个变量的第i个样本记为
xi,n(i=1,2,…,2000)。对X进行数据预处理,具体步骤如下:
步骤1.1计算所有变量的均值,其中,X中第j个变量xi,j(j=1,2,…,50)的均值计算公式为:
Figure BDA0004026554240000072
步骤1.2计算所有变量的标准差,其中,X中第j个变量xi,j(j=1,2,…,50)的标准差计算公式为:
Figure BDA0004026554240000081
步骤1.3对多模态历史数据X进行标准化,其中第i个样本的第j个变量的标准化计算公式为:
Figure BDA0004026554240000082
步骤2基于高斯混合模型的模态粗识别;
经过步骤1中的数据标准化,我们得到了标准化后的数据X;将X输入到高斯混合模型中进行聚类,通过EM算法求解高斯混合模型的参数,获取过程数据信息;
将高斯混合模型的聚类结果记为X={S1,T1,S2,};
步骤3基于初始层级窗口的模态细识别;
步骤3.1对于X中的某一个样本x,其邻域特征Dx定义如下:
Figure BDA0004026554240000083
其中,k为x的近邻个数且选定为100,di为样本x与第i个近邻的距离,exp为指数函数。
邻域特征从距离的方面阐述了各个模态的特征。通常,同模态的邻域特征是相似的,当出现模态转换的情况时,相邻的模态特征会出现较大的波动。将X中所有样本的邻域距离记为D。
步骤3.2利用窗宽为W=100的定窗口H对D进行分割,即D被分割为20个初始层级窗口。
步骤3.3以初始层级窗口为单位,计算第i个初始层级窗口的平均邻域特征,计算公式为:
Figure BDA0004026554240000084
其中,Hi表示第i个初始窗口,μi代表初始层级窗口内数据的平均邻域特征,在不同模态中,初始层级窗口的平均邻域特征会有较大的差异。
步骤3.4绝对差值是判断稳定模态和过渡模态的分割点,计算公式为:
γi=|μi+1i|(i=1,2,…,20)
其中μi和μi+1分别为第i个及第i+1个初始层级窗口的平均邻域特征;γi代表了相邻初始层级窗口的平均邻域特征差异,如果某个初始层级窗口包含过渡模态的起点或终点,则该窗口与相邻窗口的绝对差值会大于其余模态窗口的绝对差值。
步骤3.5根据高斯混合模型粗识别得到的模态信息,即X包含1个过渡模态,将γi从大到小排列得到γ*并选出前2个最大的γi值。
步骤3.6按照初始层级窗口的排列顺序,在原始数据X中提取所有前2个最大γi值所对应的窗口作为重点窗口H*,如下式所示:
Figure BDA0004026554240000091
其中,
Figure BDA0004026554240000092
Figure BDA0004026554240000093
分别表示包含过渡模态的起点和终点窗口。
步骤4基于终端层级窗口的模态细识别;
步骤4.1在步骤3.6中得到的
Figure BDA0004026554240000094
Figure BDA0004026554240000095
基础上,对其进行扩充,如下式:
Figure BDA0004026554240000096
其中,Hj和Ho分别为在X中
Figure BDA0004026554240000097
Figure BDA0004026554240000098
的相邻窗口,相邻窗口的数量g选定为1,此时,
Figure BDA0004026554240000099
Figure BDA00040265542400000910
中的样本数为200。以过渡模态的起始点为例,初始层级挑选出样本501-700输送到终端层级,其邻域特征波动图如图3所示。
步骤4.2计算变量波动率
s为
Figure BDA00040265542400000911
Figure BDA00040265542400000912
中的某一个变量,第f个时刻tf对应变量值sf,如下式:
s={(s1,t1),…,(sf,tf),…,(s200,t200)}
步骤4.3引入窗宽为L=20的定窗口h对s进行分割,即s被分割为10个终端层级窗口。
步骤4.4相邻终端层级窗口的变量波动率vi如下式:
Figure BDA00040265542400000913
其中,si(j)表示第i个终端层级窗口中的第j个变量值,vi衡量了相邻窗口的差异,vi越大,则相邻窗口差异越大,当vi=0时,代表两个窗口完全相同。
步骤4.5通过确定变量s中最大的vi,来确定该变量发生模态转化的时间ta,如下式:
ta(s)=max(vi)(s=1,2,…,50)
其中,max为最大值函数。
步骤4.6遍历
Figure BDA00040265542400000914
中的变量并统计每一个ta出现的次数,从而确定模态转换开始的位置ttrans,如下:
ttrans=max(count(ta(s)))(s=1,2,…,n)
其中,count为计数函数。
本实施例中过程变量从621时刻开始发生明显变化,如图4所示。我们判定,在第621个样本开始进入过渡过程,这与真实的过渡开始时间相比,延迟了1个小时,即20个样本。这是可以接受的,因为过渡的开始是缓慢发生的。当过渡开始时,大多数变量还停留在上一个稳定模态,未能及时响应过程变化。同理,过渡模态的结束时间被确定为第51个小时。
步骤5基于局部保持投影的数据降维;在步骤3和4中确定了稳定模态和过渡模态的边界后,就需要对X构建监控模型,并利用局部保持投影对过程数据X降维。
步骤5.1局部保持投影通过寻找投影矩阵A将数据Xm×n投影到低维特征空间Ym×l(l<n),其中yi=xiA(i=1,2,…,m),m=2000为样本数,n=50为原始数据变量数,l为特征空间维数,待求解。
局部保持投影通过优化下式目标函数求解投影矩阵A:
Figure BDA0004026554240000101
其中Wij为权重系数,它会对投影后距离变远的原始近邻点进行惩罚,以达到保持投影前后样本近邻关系的目的;Wij的计算采取热核法,即
Figure BDA0004026554240000102
其中t为热核参数,选定为10。
步骤5.2步骤5.1中的目标函数可转化为下式,
min aTXTPXa
其中,P=D-W为拉普拉斯矩阵,D是对角矩阵且Dii=∑jWij,a为投影向量。
步骤5.3加入约束条件aTXTDXa=1可使得投影向量的解唯一,通过拉格朗日函数法可将最优化求解问题转化为广义特征值问题,如下式:
XTPXa=λXTDXa
求解出的前34个最小的特征值所对应的特征向量构成的矩阵即为投影矩阵A,即A=(a1,a2,…,a34)。
步骤5.4多模态过程数据X通过投影矩阵A降维,得到低维空间数据Y,如下式:
Y=XA
步骤6构建稳定模态监控模型;
对于稳定模态的监控,一个结合马氏距离的新全局监控指标被应用:
Figure BDA0004026554240000103
其中,D为高斯主元的个数,p(θd|x)为样本x属于第d个高斯主元的概率,θd={μd,∑d}且μd与∑d分别为第d个高斯主元的均值和协方差矩阵;λd为马氏距离,如下式:
Figure BDA0004026554240000104
G的控制限GUCL可以由F分布得到,如下式:
Figure BDA0004026554240000111
其中,m,n分别是过程数据的样本数和变量数,Fn,m-n,α是自由度为n和m-n的F分布,α为置信度。
步骤7构建过渡模态监控模型。
步骤7.1
对于降维后的过渡过程数据T中的样本τ,首先,在T中寻找τ的k个近邻样本τ12,…,τk,其中k选定为5。
步骤7.2计算k个近邻样本的均值向量ξ,如下式:
Figure BDA0004026554240000112
其中,τi为样本τ的第i个近邻样本,k为近邻个数。
步骤7.3低维空间中的样本τ的偏移向量记为η=τ-ξ,并将过渡过程数据T的偏移矩阵记为B。
步骤7.4在主元子空间和残差子空间,分别建立两个监控统计量,如下式:
Figure BDA0004026554240000113
qno=e(ΞE)-1eT
其中,ΞB为均值B的协方差矩阵;其中e为残差向量且e=xh-ξAT,xh为τ在高维空间所对应的样本,A为局部保持投影的投影矩阵;ΞE为由e组成的残差矩阵的协方差矩阵;为了方便,
Figure BDA0004026554240000114
和qno的控制限
Figure BDA0004026554240000115
和qno-UCL应用核密度方法进行确定。
在获得稳定模态和过渡模态的信息后,我们选用故障幅25%和故障幅100%对本发明算法进行测试,故障检测率如表2所示。以故障10为例,故障10为TE过程中的C进料温度发生了随机变化。图5给出了故障10下变量19的四种故障幅度的散点图。当系统在第30个小时引入故障10后,汽提塔温度和汽提塔液体流量对故障响应较快。这是因为C进料会直接输送到汽提塔。由表1中HFWS对于25%和100%幅值的检测结果可知,大部分25%幅值的故障检测率低于100%幅值的故障检测率,然而有些25%幅值的故障检测率与100%幅值故障的检测率相差不大,这也进一步说明HFWS对于一些微小故障也有效。
此外,我们还应用了多路主元分析(MPCA),多路局部保持投影(MLPP),K近邻算法(KNN)对模态1和模态2进行监控,如表2所示,其中加粗表示该故障的最高检测率。经过比较,本发明提出的层级波动窗口识别与监控策略具有最优的检测效果。
表2TE过程故障检测
Figure BDA0004026554240000121
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (10)

1.一种基于层级波动窗口的多模态工业过程识别与监控方法,其特征在于,包括以下步骤:
步骤1数据预处理;
步骤2基于高斯混合模型的模态粗识别;
经过步骤1中的数据标准化,我们得到了标准化后的数据X;将X输入到高斯混合模型中进行聚类,通过EM算法求解高斯混合模型的参数,获取过程数据信息;
将高斯混合模型的聚类结果记为X={S1,T1,S2,…,Su,Tb,…,Sc-1,Tc-1,Sc}(u=1,2,…,c)(b=1,2,…,c-1),其中Su和Tb分别表示第u个稳定模态和b个过渡模态;
步骤3基于初始层级窗口的模态细识别;
步骤4基于终端层级窗口的模态细识别;
步骤5基于局部保持投影的数据降维;在步骤3和4中确定了稳定模态和过渡模态的边界后,就需要对X构建监控模型,并利用局部保持投影对过程数据X降维;
步骤6构建稳定模态监控模型;
步骤7构建过渡模态监控模型。
2.根据权利要求1所述的一种基于层级波动窗口的多模态工业过程识别与监控方法,其特征在于,所述步骤1具体包括以下步骤:
采集正常工况下的多模态过程数据X:
X=[x1,x2,…,xm]T∈Rm×n
其中m为样本数,n为变量数,我们将包含n个变量的第i个样本记为xi,n(i=1,2,…,m);
对X进行数据预处理,具体步骤如下:
步骤1.1计算所有变量的均值,其中,X中第j个变量xi,j(j=1,2,…,n)的均值计算公式为:
Figure FDA0004026554230000011
步骤1.2计算所有变量的标准差,其中,X中第j个变量xi,j(j=1,2,…,n)的标准差计算公式为:
Figure FDA0004026554230000021
步骤1.3对多模态历史数据X进行标准化,其中第i个样本的第j个变量的标准化计算公式为:
Figure FDA0004026554230000022
3.根据权利要求1所述的一种基于层级波动窗口的多模态工业过程识别与监控方法,其特征在于,所述步骤3具体包括以下步骤:
步骤3.1对于X中的某一个样本x,其邻域特征Dx定义如下:
Figure FDA0004026554230000023
其中,k为x的近邻个数,di为样本x与第i个近邻的距离,exp为指数函数;
邻域特征从距离的方面阐述了各个模态的特征;同模态的邻域特征是相似的,当出现模态转换的情况时,相邻的模态特征会出现较大的波动;将X中所有样本的邻域距离记为D;
步骤3.2利用窗宽为W的定窗口H对D进行分割,即D被分割为m/W个初始层级窗口;
步骤3.3以初始层级窗口为单位,计算第i个初始层级窗口的平均邻域特征,计算公式为:
Figure FDA0004026554230000024
其中,Hi表示第i个初始窗口,μi代表初始层级窗口内数据的平均邻域特征,在不同模态中,初始层级窗口的平均邻域特征会有较大的差异;
步骤3.4绝对差值是判断稳定模态和过渡模态的分割点,计算公式为:
Figure FDA0004026554230000025
其中μi和μi+1分别为第i个及第i+1个初始层级窗口的平均邻域特征;γi代表了相邻初始层级窗口的平均邻域特征差异,如果某个初始层级窗口包含过渡模态的起点或终点,则该窗口与相邻窗口的绝对差值会大于其余模态窗口的绝对差值;
步骤3.5根据高斯混合模型粗识别得到的模态信息,即X包含c-1个过渡模态,将γi从大到小排列得到γ*并选出前2(c-1)个最大的γi值;
步骤3.6按照初始层级窗口的排列顺序,在原始数据X中提取所有2(c-1)个γi值所对应的窗口作为重点窗口H*,如下式所示:
Figure FDA0004026554230000031
其中,
Figure FDA0004026554230000032
Figure FDA0004026554230000033
分别表示包含第j个过渡模态的起点和终点窗口。
4.根据权利要求1所述的一种基于层级波动窗口的多模态工业过程识别与监控方法,其特征在于,所述步骤4具体包括以下步骤:
步骤4.1在步骤3.6中得到的
Figure FDA0004026554230000034
Figure FDA0004026554230000035
基础上,对其进行扩充,如下式:
Figure FDA0004026554230000036
其中,Hj和Ho分别为在X中
Figure FDA0004026554230000037
Figure FDA0004026554230000038
的相邻窗口,相邻窗口的数量g可以根据多模态过程数据X的情况进行调整,此时,
Figure FDA0004026554230000039
Figure FDA00040265542300000310
中的样本数为(g+1)W;
步骤4.2计算变量波动率
s为
Figure FDA00040265542300000311
Figure FDA00040265542300000312
中的某一个变量,第f个时刻tf对应变量值sf,如下式:
s=((s1,t1),…,(sf,tf),…,(s(g+1)W,t(g+1)W)}
步骤4.3引入窗宽为L的定窗口h对s进行分割,即s被分割为(g+1)W/L个终端层级窗口;
步骤4.4相邻终端层级窗口的变量波动率vi如下式:
Figure FDA00040265542300000313
其中,si(j)表示第i个终端层级窗口中的第j个变量值,vi衡量了相邻窗口的差异,vi越大,则相邻窗口差异越大,当vi=0时,代表两个窗口完全相同;
步骤4.5通过确定变量s中最大的vi,来确定该变量发生模态转化的时间ta,如下式:
ta(s)=max(vi)(s=1,2,…,n)
其中,max为最大值函数;
步骤4.6遍历
Figure FDA0004026554230000041
中的变量并统计每一个ta出现的次数,从而确定模态转换开始的位置ttrans,如下:
ttrans=max(count(ta(s)))(s=1,2,…,n)
其中,count为计数函数。
5.根据权利要求1所述的一种基于层级波动窗口的多模态工业过程识别与监控方法,其特征在于,所述步骤5具体包括以下步骤:
步骤5.1局部保持投影通过寻找投影矩阵A将数据Xm×n投影到低维特征空间Ym×l(l<n),其中yi=xiA(i=1,2,…,m),m为样本数,n为原始数据变量数,l为特征空间维数;
局部保持投影通过优化下式目标函数求解投影矩阵A:
Figure FDA0004026554230000042
其中Wij为权重系数,它会对投影后距离变远的原始近邻点进行惩罚,以达到保持投影前后样本近邻关系的目的;Wij的计算采取热核法,即
Figure FDA0004026554230000043
其中t为热核参数;;
步骤5.2步骤5.1中的目标函数可转化为下式,
minaTXTPXa
其中,P=D-W为拉普拉斯矩阵,D是对角矩阵且Dii=∑jWij,a为投影向量;
步骤5.3加入约束条件aTXTDXa=1可使得投影向量的解唯一,通过拉格朗日函数法可将最优化求解问题转化为广义特征值问题,如下式:
XTPXa=λXTDXa
求解出的前r个最小的特征值所对应的特征向量构成的矩阵即为投影矩阵A,即A=(a1,a2,…,ar);
步骤5.4多模态过程数据X通过投影矩阵A降维,得到低维空间数据Y,如下式:
Y=XA。
6.根据权利要求1所述的一种基于层级波动窗口的多模态工业过程识别与监控方法,其特征在于,所述步骤6具体包括以下步骤:
对于稳定模态的监控,一个结合马氏距离的新全局监控指标被应用:
Figure FDA0004026554230000051
其中,D为高斯主元的个数,p(θd|x)为样本x属于第d个高斯主元的概率,θd={μd,∑d}且μd与∑d分别为第d个高斯主元的均值和协方差矩阵;λd为马氏距离,如下式:
Figure FDA0004026554230000052
G的控制限GUCL可以由F分布得到,如下式:
Figure FDA0004026554230000053
其中,m,n分别是过程数据的样本数和变量数,Fn,m-n,α是自由度为n和m-n的F分布,α为置信度。
7.根据权利要求1所述的一种基于层级波动窗口的多模态工业过程识别与监控方法,其特征在于,所述步骤7具体包括以下步骤:
步骤7.1对于降维后的过渡过程数据T中的样本τ,首先,在T中寻找τ的k个近邻样本τ1,τ2,…,τk
步骤7.2计算近邻样本的均值向量;
步骤7.3计算样本的偏移向量;
步骤7.4构建两个监控统计量。
8.根据权利要求4所述的一种基于层级波动窗口的多模态工业过程识别与监控方法,其特征在于,所述步骤7.2具体包括以下步骤:
计算k个近邻样本的均值向量ξ,如下式:
Figure FDA0004026554230000054
其中,τi为样本τ的第i个近邻样本,k为近邻个数。
9.根据权利要求4所述的一种基于层级波动窗口的多模态工业过程识别与监控方法,其特征在于,所述步骤7.3具体包括以下步骤:
计算样本τ的偏移向量η,如下式:
η=τ-ξ
其中,τ为低维空间样本,ξ为τ的近邻样本均值向量,并将过渡过程数据T的偏移矩阵记为B。
10.根据权利要求4所述的一种基于层级波动窗口的多模态工业过程识别与监控方法,其特征在于,所述步骤7.4具体包括以下步骤:
在主元子空间和残差子空间,分别建立两个监控统计量,如下式:
Figure FDA0004026554230000061
qno=e(ΞE)-1eT
其中,ΞB为均值B的协方差矩阵;其中e为残差向量且e=xh-ξAT,xh为τ在高维空间所对应的样本,A为局部保持投影的投影矩阵;ΞE为由e组成的残差矩阵的协方差矩阵;为了方便,
Figure FDA0004026554230000062
和qno的控制限
Figure FDA0004026554230000063
和qno-UCL应用核密度方法进行确定。
CN202211728024.XA 2022-12-29 2022-12-29 一种基于层级波动窗口的多模态工业过程识别与监控方法 Pending CN115982579A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211728024.XA CN115982579A (zh) 2022-12-29 2022-12-29 一种基于层级波动窗口的多模态工业过程识别与监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211728024.XA CN115982579A (zh) 2022-12-29 2022-12-29 一种基于层级波动窗口的多模态工业过程识别与监控方法

Publications (1)

Publication Number Publication Date
CN115982579A true CN115982579A (zh) 2023-04-18

Family

ID=85959303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211728024.XA Pending CN115982579A (zh) 2022-12-29 2022-12-29 一种基于层级波动窗口的多模态工业过程识别与监控方法

Country Status (1)

Country Link
CN (1) CN115982579A (zh)

Similar Documents

Publication Publication Date Title
CN110263846B (zh) 基于故障数据深度挖掘及学习的故障诊断方法
CN112527788A (zh) 变压器监测数据异常值检测与清洗的方法及装置
CN109917777B (zh) 基于混合多采样率概率主成分分析模型的故障检测方法
CN110708318A (zh) 基于改进的径向基神经网络算法的网络异常流量预测方法
Xiang et al. Multimode process monitoring based on fuzzy C-means in locality preserving projection subspace
CN111339297A (zh) 网络资产异常检测方法、系统、介质和设备
CN113570200A (zh) 一种基于多维信息的电网运行状态监测方法及系统
CN111638707A (zh) 基于som聚类和mpca的间歇过程故障监测方法
CN115858794B (zh) 用于网络运行安全监测的异常日志数据识别方法
CN111914889A (zh) 一种基于简略核主元分析的精馏塔异常状态识别方法
CN110032799A (zh) 一种微生物制药过程的角相似度阶段划分及监测方法
CN106845825B (zh) 一种基于改进pca的带钢冷轧质量问题溯源及控制方法
CN112904810A (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN112580693A (zh) 基于自助法重采样邻域保持嵌入的石化过程故障诊断方法
CN115496108A (zh) 一种基于流形学习和大数据分析的故障监测方法及系统
CN114879628A (zh) 基于对抗局部最大均值差异的多模态工业过程故障诊断方法
CN111062848A (zh) 一种消防工程异常状态监测的智能监控方法
Huang et al. Static and dynamic joint analysis for operation condition division of industrial process with incremental learning
CN115982579A (zh) 一种基于层级波动窗口的多模态工业过程识别与监控方法
CN116383747A (zh) 基于多时间尺度深度卷积生成对抗网络的异常检测方法
Yang et al. A novel decentralized weighted ReliefF-PCA method for fault detection
CN113156908B (zh) 一种机理与数据联融合的多工况工业过程监测方法和系统
CN113033683B (zh) 一种基于静态与动态联合分析的工业系统工况监测方法和系统
Peng et al. Phase partition and fault diagnosis of batch process based on keca angular similarity
CN109657943A (zh) 风电场机组运行状态的动态评估方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination