CN112651178A - 一种基于无规则缺失数据融合模型的丁烷含量预测方法 - Google Patents

一种基于无规则缺失数据融合模型的丁烷含量预测方法 Download PDF

Info

Publication number
CN112651178A
CN112651178A CN202011600278.4A CN202011600278A CN112651178A CN 112651178 A CN112651178 A CN 112651178A CN 202011600278 A CN202011600278 A CN 202011600278A CN 112651178 A CN112651178 A CN 112651178A
Authority
CN
China
Prior art keywords
model
variables
data
missing
missing data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011600278.4A
Other languages
English (en)
Inventor
应泽
何雨辰
王云
方靖云
朱俊江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Jiliang University
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN202011600278.4A priority Critical patent/CN112651178A/zh
Publication of CN112651178A publication Critical patent/CN112651178A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/10Noise analysis or noise optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于无规则缺失数据融合模型的丁烷含量预测方法,它解决了化工领域在数据无规则缺失条件下的关键变量预测难题。该方法收集脱丁烷塔在正常工况下含缺失变量的数据作为关键变量预测的训练集样本,并构建符合缺失数据特点的概率动态模型(KF‑DMF)。通过改进Karman前向滤波算法将测量变量之间的互相关性信息最大限度地保留在潜在特征空间与潜在动态预测信息相融合,实现缺失数据最大利用率。由EM算法将每次融合结果反馈到参数学习过程直至模型训练完成。在线收集脱丁烷塔中过程变量,利用已建模型对丁烷含量进行预测。由于KF‑DMF模型能在不丢弃任何样本数据的前提下充分提取变量之间的互相关性和样本之间的自相关性,在关键变量预测的精度和应用范围上实现了提升。

Description

一种基于无规则缺失数据融合模型的丁烷含量预测方法
技术领域
本发明属于化工过程监控领域,特别涉及一种脱丁烷塔丁烷含量在数据缺失条件下的关键变量预测方法。
背景技术
工业过程中使用的传统硬件传感器经常面临老化故障、精度下降、采样延迟、维护成本高等问题。作为一种理想可靠的经济替补方案,数据驱动的关键变量预测技术能够建立易测变量与难以测量变量之间的回归模型,它通过捕获变量之间的互相关性特征来实现对过程质量效益的有效监控和即时预报。
然而现有的基于多元统计过程的关键变量预测工作大多建立在完整数据集上,其性能很大程度上取决于底层测量数据的先决条件。但事实上,由于测量设备、数据传输、和存储的异常,数据缺失不可避免,现阶段用于缺失数据过程建模的方法主要有填补方法、移除方法、概率方法、卡尔曼滤波方法。其中填补和移除方法涉及过多的人为操作,单纯的添加和舍去数据无疑是对原有过程信息的扭曲。如中国专利申请号为 201910040260.4的专利公开了一种基于缺失数据集的交通流量预测方法,该方法首先采用概率推理主成分分析模型对缺失数据进行补全和特征提取,之后再将处理后的数据用于长短时记忆网络预测模型进行流量预测。该方法不仅限制了数据本身对过程状态的表征性,还严重影响了传统数据驱动建模方法的统计解释能力。概率方法和卡尔曼滤波方法是值得推荐的两类方法,通过概率推理下的极大似然估计方法和状态空间识别方法对缺失变量进行合理的推理和补偿,如中国专利申请号为 201811469726.4的专利公开了一种基于动态隐变量模型的多采样率软测量方法,该方法通过设定潜在变量之间的一阶马尔可夫关系来提取过程数据的动态特性,并利用迭代优化策略EM算法实现缺失数据内在条件下的参数求解。不幸的是,该模型对数据的缺失模式均有先验假设,只适用于特定的缺失场景,对一些无规律和随机性的变量缺失并不适用。
本专利通过改进传统线性动态系统(LDS)模型使其参数具有时变特性,并提出了一种基于卡尔曼滤波的缺失数据融合模型(KF-MDF), KF-MDF可以在不丢弃任何样本或者一部分变量的前提下重构过程数据的本质特征及其潜在趋势,避免过多的人为干涉引起数据结构扭曲和模型性能衰退。由此,所提模型可应用于脱丁烷塔底部丁烷含量的预测。
发明内容
本发明主要目的是针对现有技术存在的上述问题,提出了一种基于无规则缺失数据融合模型的丁烷含量预测方法,其所要解决的技术问题是:如何在无规则缺失数据条件下构建稳健的概率动态模型,以最大限度的提取工业过程数据的内在统计特征及其动态趋势,进而实现化工过程脱丁烷塔丁烷含量的在线预测。
本发明通过下列技术方案来实现:一种基于无规则缺失数据融合模型的丁烷含量预测方法,步骤如下所示:
A、获取脱丁烷塔在正常工况下含有缺失值的过程变量和质量关键变量,组成训练样本集,并对训练样本集进行预处理,使其各测量维度服从零均值和单位方差的高斯分布;
B、在概率框架下构建符合无规则缺失数据特点的数据融合模型 (KF-MDF),并根据训练样本集数据的缺失机制调整模型参数的设定,同时利用模型潜在特征变量之间的一阶马尔可夫关系来提取过程数据的动态特性,即样本的自相关特征;
C、导出KF-MDF模型在缺失数据下的全局对数似然函数,并结合期望最大化(EM)算法以及改进的Karman前向滤波算法实现模型参数的学习和潜在特征变量的估计;
D、在相同的运行条件下收集脱丁烷塔的过程变量,经预处理后作为模型的输入变量,最后通过KF-MDF模型及其训练完成的模型参数对丁烷含量进行预测;
作为已有工作的改进,本发明收集脱丁烷塔在正常工作状态下含缺失变量的过程数据作为关键变量预测模型的训练集样本,随后在概率框架下构建实现无规则缺失数据信息融合的动态模型KF-DMF,该模型会根据测量样本在每一时刻的缺失情况调整当前模型参数以建立潜在特征变量与每一个测量变量之间的概率传递关系,并利用潜在变量之间的一阶马尔可夫关系描述过程的动态性。接着通过改进的Karman前向滤波算法及其反向平滑算法将不规律缺失数据映射至同一维度的潜在特征空间并与潜在一阶马尔可夫动态预测信息相融合。然后结合迭代优化策略 EM算法将每一次融合结果反馈到参数学习过程直至模型收敛,实现潜在特征变量和模型参数的精确计算。最后,在线收集脱丁烷塔过程变量,通过已构建的模型对丁烷含量进行预测。本发明实现丁烷含量预测的详细流程图如附图1所示,下面对每一步骤进行解释说明:
在上述的丁烷含量预测方法中,所述步骤A,获取脱丁烷塔在正常运行过程中含缺失变量的过程数据,记作G,经z-score标准化后得到参照训练样本集G*,操作如下:
Figure BDA0002870819480000031
Figure BDA0002870819480000032
Figure BDA0002870819480000033
预处理的目的是使不同量纲的测量变量处于同一数值量级,减少个别离群变量对模型训练的影响,使模型参数求解和似然函数收敛速度加快,其中
Figure BDA0002870819480000034
表示单位采样时刻所有测量变量组成的测量样本,x(n=1:N),t表示采样率较高的过程变量,y(m=1:M),t表示采样率较低的质量变量,N,M为变量的个数,jt表示每一个采样时刻下变量的缺失个数,为了定性描述变量的缺失水平以及缺失变量的具体位置,引入了与G*相同矩阵形状的状态指示器
Figure BDA0002870819480000035
Figure BDA0002870819480000036
表示第r行c列的变量发生缺失,
Figure BDA0002870819480000037
表示该变量存在,从而可以任意描述数据的缺失模式,附图2给出了缺失数据的其中一种示意图。
在上述的丁烷含量预测方法中,所述步骤B,构建如下符合无规则缺失数据特点的概率动态模型:
Figure BDA0002870819480000041
式中
Figure BDA0002870819480000042
表示潜在特征变量,其中
Figure BDA0002870819480000043
i为潜在变量维数;
Figure BDA0002870819480000044
Γt分别表示潜在变量的状态转移矩阵和噪声项,其中
Figure BDA0002870819480000045
Figure BDA0002870819480000046
Figure BDA0002870819480000047
分别表示x(n=1:N),t和y(m=1:M),t的载荷,并组成联合观测矩阵
Figure BDA0002870819480000048
Figure BDA0002870819480000049
表示测量噪声的协方差矩阵,δn=1:Nm=1:M分别为测量噪声ε(n=1:N),t和ξ(m=1:M),t的方差;在KF-MDF模型构建中一旦某些变量xn,t或者ym,t在采样t时刻缺失,与之相应的参数项{αnnmm}也会从W和R中移除,这意味着W和R的设定与时间相关,又称时变参数,分别记作
Figure BDA00028708194800000410
Figure BDA00028708194800000411
在上述的丁烷含量预测方法中,所谓的特征潜在变量为原始数据的低维表述,用于表征过程及其数据的一般趋势和内在统计信息,包括变量之间的互相关性和样本之间的自相关性特征的一种待求未知潜在变量, 而能否有效提取变量之间的互相关性,特别是过程变量与质量变量之间的约束关系是实现预测建模的关键,KF-MDF模型利用时变参数的设定可以将实际测量变量之间的相关信息最大限度的保留在潜在特征空间。
在上述的丁烷含量预测方法中,所述步骤C中,数据融合模型 KF-MDF涉及到的所有变量均服从线性高斯假设,其模型公式的概率转换表述为:
Figure BDA00028708194800000412
由此,构建其全局对数似然函数为:
Figure BDA0002870819480000051
模型参数可由EM算法最大化上式求出。
在上述的丁烷含量预测方法中,所述步骤B中,在EM算法由E步和M步两个迭代步骤组成。
E步:利用当前已有的(旧)模型参数求解模型潜在变量在不规律缺失数据条件下的后验概率分布
Figure BDA0002870819480000052
这部分工作由改进的 Karman前向滤波算法完成:
Figure BDA0002870819480000053
Figure BDA0002870819480000054
Figure BDA0002870819480000055
特别的,初始时刻潜在特征变量的后验分布为:
Figure BDA0002870819480000056
V1=Σπ-K1W1 *Σπ
Figure BDA0002870819480000059
Karman反向平滑算法是前向算法的逆求解过程,可以用来优化潜在变量的估计,特别对缺失数据处理具有良好的优化效果:
Figure BDA0002870819480000057
Figure BDA0002870819480000058
Figure BDA0002870819480000061
最后得到潜在变量的期望表达式:
Figure BDA0002870819480000062
Figure BDA0002870819480000063
Figure BDA0002870819480000064
M步:令模型参数对似然函数关于潜在变量的期望求偏导并设置0,求解模型参数更新表达式:
Figure BDA0002870819480000065
Figure BDA0002870819480000066
Figure BDA0002870819480000067
Figure BDA0002870819480000068
Figure BDA0002870819480000069
Figure BDA00028708194800000610
Figure BDA00028708194800000611
Figure BDA00028708194800000612
“New”表示最近一次迭代更新的新模型参数,E步和M步的轮流迭代直至似然函数收敛,即KF-MDF训练完成。
在上述的丁烷含量预测方法中,所述步骤D中,再次采集脱丁烷塔正常工况下的过程数据,经预处理后作为模型的测试样本,即预测模型的输入,利用已训练完成的模型以及参数求解测试样本对应的潜在特征变量:
Figure BDA0002870819480000071
Figure BDA0002870819480000072
Figure BDA0002870819480000073
进而实现对质量变量丁烷含量的预测:
Figure BDA0002870819480000074
在上述的丁烷含量预测方法中,当完成丁烷含量的预测后引入均方误差(MSE)和拟合优度(R2)作为回归评价指标,其中MSE越小和R2越大表示模型预测精度越高,由下式计算得出:
Figure BDA0002870819480000075
Figure BDA0002870819480000076
与现有技术相比,本发明具有以下优点:
1.本发明将概率静态模型扩展为动态模型,静态过程监测方法如概率主成分分析模型假设样本之间相互独立,未能考虑数据之间的动态关系。因此,对于普遍采用闭环控制策略的现代流程工业而言,静态模型往往无法达到预期的监测效果。KF-MDF在特征潜在空间中引入潜在变量之间的一阶马尔可夫链来提取数据样本之间的自相关性,当某采样时刻的观测变量严重缺失导致无法有效提取数据特征时,KF-MDF模型的潜在空间仍然会根据历史数据的动态趋势为之后的潜在变量分布
Figure BDA0002870819480000081
进行预测,实现对缺失数据的补偿。
2.本发明建立了潜在特征变量与每一个测量变量之间的概率传递关系,并根据测量样本在每一时刻的缺失情况来调整当前模型参数用于 Karman前向滤波算法的改进。通过将不规律缺失数据及其包含的过程信息映射至同一维度的潜在特征空间并与潜在空间中一阶马尔可夫动态预测信息相融合,实现缺失数据的最大利用率。综上,所提模型可以在不丢弃任何样本或者一部分变量的前提下充分提取变量之间的互相关关系以及样本之间的自相关关系,从而在预测性能和应用范围上实现了提升。
附图说明
图1是本发明关键变量预测的流程示意图;
图2是本发明对无规则缺失数据的举例示意图;
图3是本发明实施例对丁烷含量在不同变量缺失率下的预测曲线;
图4是本发明实施例中所提关键变量预测方法在不同变量缺失率下对丁烷含量预测指标的记录;
图5是本发明实施例对丁烷含量在较高变量缺失率下的预测效果;
具体实施方式
以下是本发明的具体实施例,并结合附图对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
如附图1所示,一种基于无规则缺失数据融合模型的丁烷含量预测方法,包括:
步骤A:获取脱丁烷塔在正常运行过程中含缺失变量的过程数据,并组成建模用的训练样本集,这里采集到的过程变量包括但不限于,塔顶压力、塔顶温度、塔低温度、塔底压力、塔釜温度、再沸器温度、6 号塔板温度,过程下流量等,质量变量为脱丁烷塔底部的丁烷含量,由于数据采集、传输、储存过程中的异常,这些变量在每单位采样时刻下均会发生随机缺失,接着对该训练样本集进行预处理得到参照训练样本集G*,详细流程如下:从脱丁烷塔正常工序中采集到含缺失变量的2000 组样本数据,用于建模和模型参数训练,经过预处理操作后,使2000 组训练样本中的变量满足零均值单位协方差:
Figure BDA0002870819480000091
Figure BDA0002870819480000092
Figure BDA0002870819480000093
步骤B:本实施例中根据参照训练样本集构建符合脱丁烷塔无规则缺失数据特点的概率动态模型KF-MDF,KF-MDF模型的主要思想是建立测量样本gt中的每一个变量[x1,t,…,xn,t,…,xN,t,y1,t…,ym,t,…,yM,t]与潜在变量
Figure BDA0002870819480000094
之间的概率转换关系,并利用潜在变量之间的一阶马尔可夫链描述过程的动态性。KF-MDF模型公式表示如下:
Figure BDA0002870819480000095
式中
Figure BDA0002870819480000096
表示潜在特征变量,其中
Figure BDA0002870819480000097
i为潜在变量维数;
Figure BDA0002870819480000098
Γt分别表示潜在变量的状态转移矩阵和噪声项,其中
Figure BDA0002870819480000099
Figure BDA00028708194800000910
Figure BDA00028708194800000911
分别表示x(n=1:N),t和y(m=1:M),t的载荷,并组成联合观测矩阵
Figure BDA00028708194800000912
Figure BDA00028708194800000913
表示测量噪声的协方差矩阵,δn=1:Nm=1:M分别为测量噪声ε(n=1:N),t和ξ(m=1:M),t的方差;在 KF-MDF模型构建中一旦某些变量xn,t或者ym,t在采样t时刻缺失,与之相应的参数项{αnnmm}也会从W和R中移除,这意味着W和R的设定与时间相关,又称时变参数,分别记作Wt *
Figure BDA00028708194800000914
通过时变参数的设定能够将不规则缺失数据与统一维度的潜在特征变量之间联系在一起。
步骤C:在概率框架下,导出KF-MDF的全局对数似然函数,并利用EM算法和改进的Karman前向滤波和反向平滑算法计算模型参数及其潜在特征变量的概率期望,其似然函数表示为:
Figure BDA0002870819480000101
E步计算潜在变量的期望:
Figure BDA00028708194800001010
Vt=(Ι-KtWt *)(ΛVt-1ΛT+Q)
Figure BDA00028708194800001011
特别的,初始时刻潜在特征变量的后验分布为:
Figure BDA00028708194800001012
V1=Σπ-K1W1 *Σπ
Figure BDA0002870819480000102
完成Karman前向滤波算法后经反向平滑算法优化:
Figure BDA0002870819480000103
Figure BDA0002870819480000104
Figure BDA0002870819480000109
最后得到潜在变量的期望表达式:
Figure BDA0002870819480000105
Figure BDA0002870819480000106
Figure BDA0002870819480000107
M步:令模型参数对似然函数关于潜在变量的期望求偏导为0,得到模型参数更新表达式:
Figure BDA0002870819480000108
Figure BDA0002870819480000111
Figure BDA0002870819480000112
Figure BDA0002870819480000113
Figure BDA0002870819480000114
Figure BDA0002870819480000115
Figure BDA0002870819480000116
Figure BDA0002870819480000117
E步和M步交替迭代直至似然函数收敛,此时模型已经训练完毕。
步骤D:在线采集脱丁烷塔正常工况下的数据作为模型的测试集样本,测试样本和训练样本的采集到的过程变量个数保持一致,使用训练完成的KF-MDF模型及其模型参数计算测试样本对应的潜在特征变量分布:
Figure BDA0002870819480000118
Figure BDA0002870819480000119
Figure BDA00028708194800001110
最后实现对质量变量丁烷含量的预测:
Figure BDA0002870819480000121
为评估模型的预测性能,引入均方误差(MSE)和拟合优度(R2)作为回归评价指标,其中均方误差越小拟合优度越大表示模型预测精度越高:
Figure BDA0002870819480000122
Figure BDA0002870819480000123
本实施例对变量缺失率为1%-20%的脱丁烷塔过程数据进行逐一建模,实现不同变量缺失条件下的丁烷含量预测,并记录了每一种缺失率下的模型预测性能指标如图表4所示,其中指标的值均为100次实验结果的平均值,而且随机重置每次实验中变量的缺失位置。同时,对模型在变量较高缺失下的容错率进行稳定性评估,实验结果发现KF-MDF模型受缺失数据的影响较小,可以为缺失数据处理提供更加稳健的关键变量预测技术,如附图5所示。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (7)

1.一种基于无规则缺失数据融合模型的丁烷含量预测方法,其特征在于,包括以下步骤:
A、获取脱丁烷塔在正常工况下含有缺失值的过程变量和质量关键变量,组成训练样本集,并对训练样本集进行预处理,使得各测量维度服从零均值和单位方差的高斯分布;
B、在概率框架下构建符合无规则缺失数据特点的动态模型(KF-MDF),并根据训练样本集数据的缺失机制调整模型参数的设定,同时利用模型潜在特征变量之间的一阶马尔可夫关系来提取过程数据的动态特性,即样本的自相关特征;
C、导出KF-MDF模型在缺失数据下的全局对数似然函数,并结合期望最大化(EM)算法以及改进的Karman前向滤波算法实现模型参数的学习和潜在特征变量的估计;
D、在相同工况下收集脱丁烷塔的过程变量,经预处理后作为模型的输入变量,最后通过KF-MDF模型及其训练完成的模型参数对丁烷含量进行预测。
2.根据权利要求1所述的基于无规则缺失数据融合模型的丁烷含量预测方法,其特征在于,所述步骤A中,获取脱丁烷塔在正常运行过程中的数据是一种无规则缺失数据,数据的不同采样率之间非整数倍数关系,以及同一个采样率数据内部变量的随机缺失,原始数据记作G,经预处理后G*满足各测量变量服从零均值单位方差的参照训练样本集:
Figure FDA0002870819470000011
Figure FDA0002870819470000012
上式
Figure FDA0002870819470000013
表示单位采样时刻所有测量变量组成的测量样本,x(n=1:N),t表示采样频率较高的过程变量,y(m=1:M),t表示采样频率较低的质量变量,N,M为变量的个数,jt表示每一个采样时刻下变量的缺失个数。
3.根据权利要求2所述的基于无规则缺失数据融合模型的丁烷含量预测方法,其特征在于,所述步骤B中,构建符合无规则缺失数据特点的概率动态模型(KF-MDF):
Figure FDA0002870819470000021
式中
Figure FDA0002870819470000022
表示潜在特征变量,其中
Figure FDA0002870819470000023
i为潜在变量维数;
Figure FDA0002870819470000024
Γt分别表示潜在变量的状态转移矩阵和噪声项,其中
Figure FDA0002870819470000025
Figure FDA0002870819470000026
Figure FDA0002870819470000027
分别表示x(n=1:N),t和y(m=1:M),t的载荷,并组成联合观测矩阵
Figure FDA0002870819470000028
Figure FDA0002870819470000029
表示测量噪声的协方差矩阵,δn=1:Nm=1:M分别为测量噪声ε(n=1:N),t和ξ(m=1:M),t的方差。
4.根据权利要求3所述的基于无规则缺失数据融合模型的丁烷含量预测方法,在构建的KF-MDF模型中一旦某些变量xn,t或者ym,t在采样t时刻缺失,与之相应的参数项{αnnmm}也会从W和R中移除,这意味着W和R的设定与时间相关,又称时变参数,分别记作Wt *
Figure FDA00028708194700000210
5.根据权利要求3所述的基于无规则缺失数据融合模型的丁烷含量预测方法,其特征在于,所述步骤C中KF-MDF模型的全局对数似然函数表示为:
Figure FDA00028708194700000211
利用EM算法最大化上述似然函数可求出KF-MDF模型参数的最优解:
E步:主要利用现有模型参数求解模型潜在变量在不规律缺失数据条件下的后验概率分布
Figure FDA00028708194700000212
由改进的Karman前向滤波算法完成:
Figure FDA00028708194700000213
Vt=(Ι-KtWt *)(ΛVt-1ΛT+Q)
Figure FDA0002870819470000031
特别的,初始时刻潜在特征变量的后验分布为:
Figure FDA0002870819470000032
V1=Σπ-K1W1 *Σπ
Figure FDA0002870819470000033
潜在变量的期望表达式:
Figure FDA0002870819470000034
Figure FDA00028708194700000312
Figure FDA0002870819470000035
在M步中模型参数对似然函数关于潜在变量的期望求偏导,得到导数为0时的模型参数更新式;
E步和M步的轮流迭代直至似然函数收敛,即KF-MDF训练完成。
6.根据权利要求5所述的基于无规则缺失数据融合模型的丁烷含量预测方法,其特征在于M步中模型参数一次更新表达式为:
Figure FDA0002870819470000036
Figure FDA0002870819470000037
Figure FDA0002870819470000038
Figure FDA0002870819470000039
Figure FDA00028708194700000310
Figure FDA00028708194700000311
Figure FDA0002870819470000041
Figure FDA0002870819470000042
其中带有“new”上标的参数为当前最新一次迭代更新结果。
7.根据权利要求1所述的基于无规则缺失数据融合模型的丁烷含量预测方法,其特征在于,所述步骤D中,再次采集脱丁烷塔正常工况下的过程数据,经预处理后作为模型的测试样本,即模型的输入,利用已训练完成的模型以及参数求解测试样本对应的潜在特征变量:
Figure FDA0002870819470000043
Figure FDA0002870819470000044
Figure FDA0002870819470000045
进而实现对质量变量丁烷含量的预测:
Figure FDA0002870819470000046
CN202011600278.4A 2020-12-30 2020-12-30 一种基于无规则缺失数据融合模型的丁烷含量预测方法 Pending CN112651178A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011600278.4A CN112651178A (zh) 2020-12-30 2020-12-30 一种基于无规则缺失数据融合模型的丁烷含量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011600278.4A CN112651178A (zh) 2020-12-30 2020-12-30 一种基于无规则缺失数据融合模型的丁烷含量预测方法

Publications (1)

Publication Number Publication Date
CN112651178A true CN112651178A (zh) 2021-04-13

Family

ID=75364353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011600278.4A Pending CN112651178A (zh) 2020-12-30 2020-12-30 一种基于无规则缺失数据融合模型的丁烷含量预测方法

Country Status (1)

Country Link
CN (1) CN112651178A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723285A (zh) * 2022-04-07 2022-07-08 广州汉光电气股份有限公司 一种电网设备安全性评估预测方法
CN116227952A (zh) * 2023-05-09 2023-06-06 中国人民解放军海军潜艇学院 一种关键信息缺失下的来袭目标防御策略选择方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723285A (zh) * 2022-04-07 2022-07-08 广州汉光电气股份有限公司 一种电网设备安全性评估预测方法
CN114723285B (zh) * 2022-04-07 2022-11-04 广州汉光电气股份有限公司 一种电网设备安全性评估预测方法
CN116227952A (zh) * 2023-05-09 2023-06-06 中国人民解放军海军潜艇学院 一种关键信息缺失下的来袭目标防御策略选择方法及装置

Similar Documents

Publication Publication Date Title
CN110794093B (zh) 一种蒸发过程出料苛性碱浓度测量装置精度补偿方法
CN112651178A (zh) 一种基于无规则缺失数据融合模型的丁烷含量预测方法
CN110889085A (zh) 基于复杂网络多元在线回归的废水智能监控方法及系统
CN112884089A (zh) 一种基于数据挖掘的电力变压器故障预警系统
CN106600037B (zh) 一种基于主成分分析的多参量辅助负荷预测方法
CN101673096B (zh) 一种丹参注射液生产浓缩过程密度的软测量方法
CN115495991A (zh) 一种基于时间卷积网络的降水区间预测方法
CN114970688A (zh) 基于LSTMAD算法和Hermite插值法的滑坡监测数据预处理方法
CN111859249A (zh) 一种基于解析四维集合变分的海洋数值预报方法
CN114117919B (zh) 基于样本协同表示的即时学习的软测量建模方法
CN113780420B (zh) 基于gru-gcn的变压器油中溶解气体浓度预测方法
CN107808209B (zh) 基于加权kNN距离的风电场异常数据辨识方法
CN113359435A (zh) 用于火电机组动态工况数据的修正方法
CN111142488B (zh) 基于工况比对驱动的流程工业优化方法
CN111367255A (zh) 一种多变量控制系统性能评价测试系统及方法
CN108665090B (zh) 基于主成分分析与Verhulst模型的城市电网饱和负荷预测方法
CN107633271B (zh) 电力系统稳态可用度非精确概率计算方法
CN108960332A (zh) 一种基于多向主元素分析法的在线监测方法
CN113468720B (zh) 一种数模联动的随机退化设备寿命预测方法
CN114580151A (zh) 一种基于灰色线性回归-马尔科夫链模型的需水预测方法
CN115203905A (zh) 一种融合专家经验及智能算法的设备健康评估方法
CN114118633A (zh) 一种基于先行关系的指标自优化预测方法及装置
CN114019909A (zh) 一种主轴热误差建模方法、预测方法和建模系统
CN113312587A (zh) 基于arima预测和回归预测的传感器采集数据缺失值处理方法
CN117708625B (zh) 一种乏数据背景下大坝监测历史数据填补方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210413