CN108734213B - 一种基于贝叶斯统计分析的间歇过程模态识别方法 - Google Patents
一种基于贝叶斯统计分析的间歇过程模态识别方法 Download PDFInfo
- Publication number
- CN108734213B CN108734213B CN201810476326.XA CN201810476326A CN108734213B CN 108734213 B CN108734213 B CN 108734213B CN 201810476326 A CN201810476326 A CN 201810476326A CN 108734213 B CN108734213 B CN 108734213B
- Authority
- CN
- China
- Prior art keywords
- mode
- modal
- data
- formula
- sample point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于贝叶斯统计分析的间歇过程模态识别方法,属于间歇过程监测技术领域。本方法首先将间歇过程的三维历史过程数据沿批次方法展开为二维数据并对展开后的数据进行数据标准化;其次利用模糊C均值聚类算法对标准化后的过程数据进行聚类分析,设定模态粗划分隶属规则,获得模态粗划分结果;最后利用贝叶斯网络分类器对模态粗划分结果进行分析,并引入时序约束的模态推断系数,根据模态推断最小风险准则,判断模态最终归属,实现间歇过程的模态识别。本方法充分考虑了间歇过程数据的时序约束,利用贝叶斯统计分析实现了间歇过程稳定模态与过渡模态的有效划分,具有较高的模态识别准确性。
Description
技术领域
本发明涉及一种间歇过程模态识别方法,属于间歇过程监测技术领域,尤其涉及一种基于贝叶斯统计分析的间歇过程模态识别方法。
背景技术
间歇过程作为工业生产中的一种重要生产方式,存在多个运行状态,具有多模态特性,使得间歇过程在不同模态下的过程特性存在差异,变量相关性也显著不同。若将不同模态的过程数据用同一模型进行整体建模,会导致有较大的建模误差,限制了所建整体模型在间歇过程中的应用。因此,需要对间歇过程中差异明显的多个模态进行准确识别,为间歇过程的监测和控制优化提供基础。
现有的间歇过程模态识别方法主要有基于机理的间歇过程模态识别方法、基于过程特征分析的间歇过程模态识别方法和基于数据驱动的间歇过程模态识别方法。基于机理的间歇过程模态识别方法利用过程先验知识对间歇过程的模态进行识别;基于过程特征分析的间歇过程模态识别方法则利用指示变量判断模态,或将新的过程与已知模态的过程进行比较实现模态识别。然而,由于间歇过程信息往往难以直接获取,制约着这两种方法在间歇过程模态识别中的应用。基于数据驱动的间歇过程模态识别方法能够直接通过对间歇过程数据集的数据挖掘获得模态信息,进而实现间歇过程模态识别。基于数据驱动的聚类分析方法在间歇过程模态识别中的应用较为广泛,例如K-means聚类方法、模糊C均值聚类方法、仿射传播聚类方法等,但这些方法在处理间歇过程模态识别时,模态识别结果受到过程数据中离群点的影响较大,迭代过程有较大的时间复杂度,且忽略了间歇过程数据的时序约束,参数选取较为困难。因此,为了获得更准确的间歇过程模态识别结果,需要对聚类结果进行进一步分析。基于数据驱动的贝叶斯统计分析方法将先验知识与现有统计数据相结合,用概率的形式来表示事件发生的可能性,尤其以贝叶斯网络分类器为代表的数据集分类方法,使用联合概率的最优压缩展开式降低了计算复杂度;同时,过程数据中的离群点对其分类结果影响较小,因此,将贝叶斯统计分析引入间歇过程模态识别,利用贝叶斯网络分类器实现间歇过程模态识别,能有效提高间歇过程模态识别的准确性。
发明内容
本发明的目的在于提高间歇过程模态识别准确性,首先将间歇过程的三维历史过程数据沿批次方法展开为二维数据并对展开后的数据进行数据标准化,其次利用模糊C均值聚类算法对标准化后的数据进行聚类分析,设定模态粗划分隶属规则,获得模态粗划分结果;最后利用贝叶斯网络分类器对模态粗划分结果进行分析,并引入时序约束的模态推断系数,根据模态推断最小风险准则,判断模态最终归属,实现间歇过程模态的准确识别。
本发明采用的技术方案为一种基于贝叶斯统计分析的间歇过程模态识别方法,该方法具体包括以下步骤:
步骤一:将间歇过程的三维历史过程数据沿批次方法展开为二维数据,并对展开后的二维数据进行变量方向上的标准化,并记录历史数据的均值与标准差,实现间歇过程三维历史过程数据预处理,得到预处理后的数据;
步骤二:利用模糊C均值聚类算法对步骤一所得预处理后的数据进行聚类分析,设定模态粗划分隶属规则,并通过过程数据划分效果复合指标,确定最优模态个数,实现间歇过程模态粗划分;
步骤三:利用贝叶斯网络分类器,对步骤二的模态粗划分结果进行分析,同时引入时序约束的模态推断系数,根据模态推断最小风险准则,判断模态最终归属,实现间歇过程模态识别。
具体而言,步骤一包括如下步骤:
步骤二包括如下步骤:
定义数据划分复合指标PPCIc为
式中,γ∈(0,1)。
利用式(5)计算PPCIc,选择PPCIc指标值最小时对应的模态个数为最优效果的模态个数c0。
式中,l为稳定模态,l∈(1,2,…,c0)。
式中,l* (l,l+1)为l与l+1相邻稳定模态之间的过渡模态,l∈(1,2,…,c0)。
步骤三包括如下步骤:
S3.2由已构建的数据集Xtr,训练贝叶斯网络分类器GB,并获得过程变量的概率分布为p(·)。
式中,n为过程变量个数;πc为模态变量父结点的配置。
式中,l为稳定模态。
式中,l* (l,l+1)为l与l+1相邻稳定模态之间的过渡模态,满足Rl(k)+Rl+1(k)=1。
本发明具有如下优点:通过引入时序约束的模态推断系数,能够充分考虑间歇过程的时序特性,并根据模态推断最小风险准则,判断模态最终归属,实现间歇过程的模态识别,提高了间歇过程模态识别的准确性。
附图说明
图1是本发明所述的一种基于贝叶斯统计分析的间歇过程模态识别方法的流程图。
图2是实施方式所述基于模糊C均值聚类算法的间歇过程模态粗划分结果图。
图3是实施方式所述基于贝叶斯统计分析的间歇过程模态识别结果图。
图4是实施方式所述间歇过程模态识别贝叶斯网络分类器模型结构图。
具体实施方式
下面结合实例及附图对本发明作进一步的描述,需要说明的是,实施例并不限定本发明要求保护的范围。
实施例
青霉素发酵是典型的间歇过程,利用Pensim v2.0仿真青霉素发酵过程,选取底物流加速度(L·h-1)、底物浓度(g·L-1)、溶氧浓度(g·L-1)、生物量浓度(g·L-1)、青霉素浓度(g·L-1)、产热量(kcal·h-1)6个过程变量进行数据采集,如表1所示。采样周期选择为1h,采集20个批次数据,每批含有400个数据点。随机取其中15个批次作为训练批次,剩余5个批次作为测试批次。
表1间歇过程变量
将本发明方法应用到上述青霉素发酵过程模态识别中,具体按照以下步骤实施:
步骤一:将20个批次青霉素发酵过程的三维过程数据沿批次方法展开为二维数据Xi(6×400),其中i为批次编号,Xi为第i个批次的过程变量数据矩阵,并利用式(1)对各批次数据进行标准化,得标准化后的数据集
步骤二:间歇过程模态粗划分:
步骤三:间歇过程模态识别:
(1)利用式(10)构建训练数据集Xtr;
(2)利用已构建的数据集Xtr,训练贝叶斯网络分类器GB,并获得过程变量的概率分布p(·);
上述步骤即为本发明方法在青霉素发酵过程模态识别的具体应用。为了验证本方法的有效性,对5个测试批次数据分别进行了模态识别实验。图2、图3分别为上述步骤中测试批次3的基于模糊C均值聚类算法的模态粗划分结果和基于贝叶斯统计分析的模态识别结果,图4为所述步骤三中所建立的贝叶斯网络分类器模型结构图。对比图2、图3不难发现,模糊C均值聚类方法对间歇过程的模态识别结果中出现时间上不连续的样本点被划分为同一模态,这与实际过程相违背;而本发明方法用于间歇过程模态识别时,充分考虑了间歇过程数据的时序约束,能有效避免这一现象,具有更准确的模态识别结果。
为了进一步表现本发明模态识别结果的准确性,将DBI(Davies-Bouldin Index)指标作为间歇过程模态识别划分准确性的评价指标,该指标用内类样本点到其数据中心的距离估计类内的紧致性,用数据中心之间的距离表示类间的分离性,其值由式(19)确定,值越小表示模态识别结果越准确。
表2、表3分别本发明方法与模糊C均值聚类算法对为5个测试批次数据模态识别结果的DBI指标值。
表2本发明方法模态识别DBI
表3模糊C均值聚类模态识别DBI
结合上述分析并由表2、表3对比可得,本发明方法充分考虑了间歇过程数据的时序约束,利用贝叶斯分析实现了间歇过程稳定模态与过渡模态的有效划分,具有较高的间歇过程模态识别准确性。
Claims (1)
1.一种基于贝叶斯统计分析的间歇过程模态识别方法,其特征在于:该方法具体包括以下步骤:
步骤二:利用模糊C均值聚类算法对步骤一所得预处理后的数据进行聚类分析,设定模态粗划分隶属规则,并通过过程数据划分效果复合指标,确定最优模态个数,实现间歇过程模态粗划分,包括如下步骤:
定义数据划分复合指标PPCIc为
式中,γ∈(0,1);
利用式(5)计算PPCIc,选择PPCIc指标值最小时对应的模态个数为最优效果的模态个数c0;
式中,l为稳定模态,l∈(1,2,···,c0);
式中,l* (l,l+1)为l与l+1相邻稳定模态之间的过渡模态,l∈(1,2,···,c0);
步骤三:利用贝叶斯网络分类器,对步骤二的模态粗划分结果进行分析,同时引入时序约束的模态推断系数,根据模态推断最小风险准则,判断模态最终归属,实现间歇过程模态识别,包括如下步骤:
S3.2由已构建的数据集Xtr,训练贝叶斯网络分类器GB,并获得过程变量的概率分布为p(·);
式中,n为过程变量个数;πc为模态变量父结点的配置;
式中,l为稳定模态;
式中,l* (l,l+1)为l与l+1相邻稳定模态之间的过渡模态,满足Rl(k)+Rl+1(k)=1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810476326.XA CN108734213B (zh) | 2018-05-17 | 2018-05-17 | 一种基于贝叶斯统计分析的间歇过程模态识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810476326.XA CN108734213B (zh) | 2018-05-17 | 2018-05-17 | 一种基于贝叶斯统计分析的间歇过程模态识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108734213A CN108734213A (zh) | 2018-11-02 |
CN108734213B true CN108734213B (zh) | 2021-10-01 |
Family
ID=63938616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810476326.XA Active CN108734213B (zh) | 2018-05-17 | 2018-05-17 | 一种基于贝叶斯统计分析的间歇过程模态识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108734213B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109754010B (zh) * | 2018-12-29 | 2021-04-02 | 北京化工大学 | 一种时序约束模糊聚类的间歇过程多模态划分方法 |
CN110245850B (zh) * | 2019-05-31 | 2021-07-13 | 中国地质大学(武汉) | 一种考虑时序的烧结过程工况识别方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7006900B2 (en) * | 2002-11-14 | 2006-02-28 | Asm International N.V. | Hybrid cascade model-based predictive control system |
CN1956007A (zh) * | 2005-10-24 | 2007-05-02 | 中国科学院自动化研究所 | 基于局部和全局区域不相似性度量的变分分割方法 |
CN103310095A (zh) * | 2013-05-10 | 2013-09-18 | 广州市香港科大霍英东研究院 | 间歇过程质量指标软测量方法 |
CN105929812A (zh) * | 2016-04-18 | 2016-09-07 | 北京科技大学 | 带钢热连轧质量的故障诊断方法及装置 |
-
2018
- 2018-05-17 CN CN201810476326.XA patent/CN108734213B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108734213A (zh) | 2018-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111814871A (zh) | 一种基于可靠权重最优传输的图像分类方法 | |
CN109472088B (zh) | 一种页岩气调产井生产压力动态预测方法 | |
CN108537818B (zh) | 基于集群压力lstm的人群轨迹预测方法 | |
CN111564183B (zh) | 融合基因本体和神经网络的单细胞测序数据降维方法 | |
Hassan et al. | A hybrid of multiobjective Evolutionary Algorithm and HMM-Fuzzy model for time series prediction | |
US20040002930A1 (en) | Maximizing mutual information between observations and hidden states to minimize classification errors | |
CN108733976B (zh) | 基于融合生物与拓扑特征的关键蛋白质识别方法 | |
CN104951764B (zh) | 基于二次谱聚类和hmm-rf混合模型的高速车辆行为识别方法 | |
CN110097088A (zh) | 一种基于迁移学习与特殊点策略的动态多目标进化方法 | |
CN110097060B (zh) | 一种面向树干图像的开集识别方法 | |
CN111917785B (zh) | 一种基于de-gwo-svr的工业互联网安全态势预测方法 | |
CN108732931B (zh) | 一种基于jit-rvm的多模态间歇过程建模方法 | |
CN113127705B (zh) | 一种异构双向生成对抗网络模型及时间序列异常检测方法 | |
CN112270355A (zh) | 基于大数据技术与sae-gru的主动安全预测方法 | |
CN110619540A (zh) | 一种神经网络的点击流预估方法 | |
CN111079856B (zh) | 一种基于csjitl-rvm的多时段间歇过程软测量建模方法 | |
CN111539444A (zh) | 一种修正式模式识别及统计建模的高斯混合模型方法 | |
CN108734213B (zh) | 一种基于贝叶斯统计分析的间歇过程模态识别方法 | |
Li et al. | Gaussian mixture learning via adaptive hierarchical clustering | |
US20220284261A1 (en) | Training-support-based machine learning classification and regression augmentation | |
CN114417975A (zh) | 基于深度pu学习与类别先验估计的数据分类方法及系统 | |
Piccardi et al. | Hidden markov models with kernel density estimation of emission probabilities and their use in activity recognition | |
CN112528554A (zh) | 一种适于多发多源火箭试验数据的数据融合方法及系统 | |
CN115273645B (zh) | 一种室内面要素自动聚类的地图制图方法 | |
CN116279471A (zh) | 一种跟驰场景下考虑驾驶行为特征的车辆加速度预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |