CN109754010B - 一种时序约束模糊聚类的间歇过程多模态划分方法 - Google Patents

一种时序约束模糊聚类的间歇过程多模态划分方法 Download PDF

Info

Publication number
CN109754010B
CN109754010B CN201811633128.6A CN201811633128A CN109754010B CN 109754010 B CN109754010 B CN 109754010B CN 201811633128 A CN201811633128 A CN 201811633128A CN 109754010 B CN109754010 B CN 109754010B
Authority
CN
China
Prior art keywords
sample
membership
data
intermittent
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811633128.6A
Other languages
English (en)
Other versions
CN109754010A (zh
Inventor
王建林
韩锐
邱科鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Chemical Technology
Original Assignee
Beijing University of Chemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Chemical Technology filed Critical Beijing University of Chemical Technology
Priority to CN201811633128.6A priority Critical patent/CN109754010B/zh
Publication of CN109754010A publication Critical patent/CN109754010A/zh
Application granted granted Critical
Publication of CN109754010B publication Critical patent/CN109754010B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Feedback Control In General (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种时序约束模糊聚类的间歇过程多模态划分方法,属于间歇过程监测技术领域。该方法首先对间歇过程的多批次过程数据按照采样时间方向展开为二维数据矩阵并进行标准化,构建标准化后的过程数据样本集;然后将间歇过程的所有过程数据样本均划分为同一类,通过模糊聚类算法计算各个样本的初始隶属度;最后从最初采样时刻开始,逐个添加过程数据样本作为新的时序样本集,迭代计算新添加样本的隶属度,通过比较新添加样本的隶属度和对应时刻初始隶属度的大小,进而划分间歇过程的模态。本方法不需要间歇过程先验知识和统计模型,不需要设定模态个数,根据间歇过程的时序隶属度变化自动划分不同模态,提高了模态划分的准确性。

Description

一种时序约束模糊聚类的间歇过程多模态划分方法
技术领域
本发明属于间歇过程监测技术领域,尤其涉及一种时序约束模糊聚类的间歇过程多模态划分方法。
背景技术
间歇过程已广泛应用于精细化工、制药、半导体器件等工业生产中。在间歇生产过程中,由于生产过程固有特性、生产策略变动,都会导致生产过程存在多个运行模态,多模态特性是间歇过程的重要特征之一,对间歇过程进行多模态划分能够提高过程批次数据多模态建模的精度及过程监测性能。
针对间歇过程的多模态划分,模糊聚类方法无需先验知识,能够很好地实现非时变数据集合的划分,然而,由于间歇过程具有多模态特性和时变特性,现有的模糊聚类分析方法存在以下两个问题:第一,均需要确定模态个数和初始模态的中心,模态划分结果容易受到初始聚类中心的影响导致陷入局部最优,得到不合理的模态划分结果;第二,仅考虑目标函数的最优值,不能保证每个模态内的所有样本按照实际的时序排列。因此,模糊聚类方法难以获得准确的间歇过程多模态划分结果。在模糊聚类方法的基础上,多尺度时变聚类中心变化的划分方法引入分类尺度辅助因子,通过迭代对比时变聚类中心与全局中心的差异程度来获取模态划分点,虽然能保证每个模态内的所有样本按照实际的时序排列,但是时变聚类中心对噪声和异常值较敏感,影响模态划分点的准确性。
发明内容
本发明以提高间歇过程的多模态划分准确性为目的,提出一种时序约束模糊聚类的间歇过程多模态划分方法,包括以下步骤:
步骤一:采集间歇过程的多批次过程数据,按照采样时间方向展开为二维数据矩阵并进行标准化,去除量纲的影响;
步骤二:通过模糊聚类算法计算单分类设定下各个间歇过程数据样本的初始隶属度;
步骤三:从最初采样时刻开始,逐个添加过程数据样本作为新的时序样本集,迭代计算新添加样本的隶属度,通过多次比较新添加样本的隶属度和对应初始隶属度的大小,进而划分间歇过程的模态;
步骤四:计算综合评价指标(partition performance combination index,PPCI),确定最佳的间歇过程模态个数和模态划分结果。
所述步骤一,具体包括:
采集I个间歇过程批次的过程数据X i(J×K),其中,i(1≤i≤I)为批次的序号,J为测量变量的个数,K为采样点个数。按照采样时间方向展开为二维数据矩阵
Figure GDA0002903427870000021
对数据矩阵
Figure GDA0002903427870000022
的每列减去其均值再除以其标准差,得到标准化的批次过程数据X(K×IJ)。
所述步骤二,具体包括:
针对间歇过程标准化后的多批次数据X(K×IJ),假设所有数据隶属于同一类,模糊聚类的目标函数为
Figure GDA0002903427870000023
其中,xi为数据集X的第i个样本,ui表示样本xi隶属于该一类的程度,s表示模糊加权指数,一般取值为2,di=||xi-m||表示样本xi和聚类中心m的欧氏距离。通过拉格朗日乘数法求解式(1)的约束优化问题,定义新函数
Figure GDA0002903427870000024
最小化Jo时的必要条件为对式(2)的一阶导数满足
Figure GDA0002903427870000025
通过式(3)可以得到:
Figure GDA0002903427870000026
代入式(3)可以得到:
Figure GDA0002903427870000031
因此
Figure GDA0002903427870000032
代入式(4)可以得到ui的求解式为
Figure GDA0002903427870000033
同理,对式(2)中的m求导:
Figure GDA0002903427870000034
可以得到m的求解式为
Figure GDA0002903427870000035
通过不断地迭代式(7)和式(9),直至|ΔJo|<ε,ε为设定的收敛精度,获取最终的聚类中心m和隶属度矩阵U={u1,u2,…,uK}。
所述步骤三,具体包括:
在隶属度矩阵U的基础上,对样本集X进行模态划分,具体包括如下流程:
(1)从间歇过程数据集X的最初采样时刻开始,按照时序依次构建新时序样本集Yk={x1,x2,…,xk},通过步骤二所述方法迭代计算新添加样本的隶属度
Figure GDA0002903427870000036
k代表当前过程运行时间;
(2)比较新添加样本的初始隶属度uk和更新后的隶属度
Figure GDA0002903427870000041
的大小。如果连续三次呈现
Figure GDA0002903427870000042
说明新加入的样本与当前数据集的隶属度较低,即为当前样本点时刻之前的所有样本隶属于同一个类;τ是动态调节因子;
(3)根据流程(2)获取聚类结果的边界点,移除该聚类结果,将剩下的样本作为新的时序样本集初始点,重复进行流程(1)~流程(2),直至获取所有的模态划分结果。
所述步骤四,具体包括:
模态个数为i的PPCI计算如式(10)所示。
Figure GDA0002903427870000043
其中
Figure GDA0002903427870000044
Figure GDA0002903427870000045
Figure GDA0002903427870000046
式中,mean(·)和std(·)分别代表计算集合元素的均值和标准差。最佳模态个数对应的PPCI最小。
本发明的优点:针对实际间歇过程的多批次过程数据集,不需要设定模态个数和初始模态中心,根据间歇过程的时序性样本的隶属度变化自动划分不同模态,结合动态调节因子τ和PPCI指标,在保证间歇过程多模态划分结果的准确性上选取最佳模态划分结果。
附图说明
图1是本发明所述的一种时序约束模糊聚类的间歇过程多模态划分方法的流程图;
图2是不同模态个数的PPCI结果图;
图3是本发明所述方法得到的模态划分结果。
具体实施方式
下面结合实例及附图对本发明作进一步的描述,需要说明的是,实施例并不限定本发明要求保护的范围。
实施例
青霉素是一种具有广泛临床医用价值的抗生素,其生产过程是一个典型的非线性、动态和多模态的间歇生产过程。利用青霉素发酵过程仿真平台(PenSim v2.0)生成不同初始值的20个批次的过程数据,每批次持续时间K=400小时,采样周期为1小时。利用基质浓度(g/L)、溶氧量浓度(g/L)、生物质浓度(g/L)、青霉素浓度(g/L)、反应热(kcal)等5个模态敏感变量的过程数据样本构建青霉素发酵过程的模态划分样本集。
将本发明应用到青霉素发酵过程的具体步骤如下:
步骤一:采集20个青霉素发酵过程模态敏感变量的批次过程数据
Figure GDA0002903427870000051
展开得到模态划分数据样本集
Figure GDA0002903427870000052
标准化后的模态划分数据样本集为X(400×100)。
步骤二:通过模糊聚类算法计算单分类设定下模态划分数据样本集X(400×100)的初始隶属度矩阵U={u1,u2,…,u400};
步骤三:从模态划分数据样本集X的最初采样时刻开始,按照时序依次构建新时序数据样本集,并通过步骤二所述的方法更新新添加样本的隶属度
Figure GDA0002903427870000053
k为当前过程运行时间,设置动态调节因子τ的范围为2×10-5~3×10-5,并多次比较新添加样本的隶属度
Figure GDA0002903427870000054
和对应时刻初始隶属度uk的大小,得到多种模态划分结果。
步骤四:利用式(10)~式(13)计算不同模态的PPCI,如图2所示,模态个数为3的时候PPCI的值最小,因此,最佳模态个数设置为3。
具体的模态划分结果如图3所示,第1模态为1~48小时,第2模态为49~177小时,第3模态为178~400小时。
本发明能针对实际间歇过程的多批次过程数据集,不需要设定模态个数和初始模态中心,根据间歇过程的时序性样本的隶属度变化自动划分不同模态,结合动态调节因子τ和PPCI指标,在保证间歇过程多模态划分结果的准确性上选取最佳模态划分结果。

Claims (2)

1.一种时序约束模糊聚类的间歇过程多模态划分方法,其特征在于:该方法包括以下步骤:
步骤一:采集I个间歇过程批次的过程数据Xi(J×K),其中,i为批次的序号,J为测量变量的个数,K为采样点个数,1≤i≤I;按照采样时间方向展开为二维数据矩阵
Figure FDA0002931462460000011
对数据矩阵
Figure FDA0002931462460000012
的每列减去其均值再除以其标准差,得到标准化的批次过程数据X(K×IJ);
步骤二:通过模糊聚类算法计算单分类设定下的各个过程数据样本的初始隶属度;
步骤三:从最初采样时刻开始,逐个添加过程数据样本作为新的时序样本集,迭代计算新添加样本的隶属度,通过多次比较新添加样本的隶属度和对应初始隶属度的大小,进而划分间歇过程的模态;
步骤四:计算不同模态个数的综合评价指标PPCI;当模态个数为j时,对应的PPCI计算为
Figure FDA0002931462460000013
其中
Figure FDA0002931462460000014
Figure FDA0002931462460000015
Figure FDA0002931462460000016
式中,mean(·)和std(·)分别代表计算集合元素的均值和标准差;选择使PPCI最小的模态个数作为确定最佳的模态个数,对应的模态划分结果为最佳的模态划分结果;在隶属度矩阵U的基础上,对样本集X进行模态划分,具体包括如下流程:
流程(1)从间歇过程数据集X的最初采样时刻开始,按照时序依次构建新时序样本集Yk={x1,x2,…,xk},通过步骤二所述方法迭代计算新添加样本的隶属度
Figure FDA0002931462460000017
k代表当前过程运行时间;
流程(2)比较新添加样本的初始隶属度uk和更新后的隶属度
Figure FDA0002931462460000018
的大小,如果连续三次呈现
Figure FDA0002931462460000019
说明新加入的样本与当前数据集的隶属度较低,即为当前样本点时刻之前的所有样本隶属于同一个类;τ是动态调节因子;
流程(3)根据流程(2)获取聚类结果的边界点,移除该聚类结果,将剩下的样本作为新的数据集初始点,重复进行流程(1)~流程(2),直至获取所有的模态划分结果。
2.根据权利要求1所述的一种时序约束模糊聚类的间歇过程多模态划分方法,其特征在于:针对间歇过程标准化后的多批次数据X(K×IJ),假设所有数据隶属于同一类,模糊聚类的目标函数为
Figure FDA0002931462460000021
其中xi为数据集X的第i个样本,ui表示样本xi隶属于该一类的程度,s表示模糊加权指数,取值为2,di=||xi-m||表示样本xi和聚类中心m的欧氏距离;通过拉格朗日乘数法求解式(5)的约束优化问题,定义新函数
Figure FDA0002931462460000022
最小化Jo时的必要条件为对式(6)的一阶导数满足
Figure FDA0002931462460000023
通过式(7)可以得到:
Figure FDA0002931462460000024
代入式(7)可以得到:
Figure FDA0002931462460000025
因此
Figure FDA0002931462460000026
代入式(8)得到ui的求解式为
Figure FDA0002931462460000031
同理,对式(6)中的m求导:
Figure FDA0002931462460000032
得到m的求解式为
Figure FDA0002931462460000033
通过不断地迭代式(11)和式(13),直至|△Jo|<ε,ε为设定的收敛精度,获取最终的聚类中心m和隶属度矩阵U={u1,u2,…,uK}。
CN201811633128.6A 2018-12-29 2018-12-29 一种时序约束模糊聚类的间歇过程多模态划分方法 Active CN109754010B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811633128.6A CN109754010B (zh) 2018-12-29 2018-12-29 一种时序约束模糊聚类的间歇过程多模态划分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811633128.6A CN109754010B (zh) 2018-12-29 2018-12-29 一种时序约束模糊聚类的间歇过程多模态划分方法

Publications (2)

Publication Number Publication Date
CN109754010A CN109754010A (zh) 2019-05-14
CN109754010B true CN109754010B (zh) 2021-04-02

Family

ID=66403268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811633128.6A Active CN109754010B (zh) 2018-12-29 2018-12-29 一种时序约束模糊聚类的间歇过程多模态划分方法

Country Status (1)

Country Link
CN (1) CN109754010B (zh)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6931350B2 (en) * 2003-08-28 2005-08-16 Hewlett-Packard Development Company, L.P. Regression-clustering for complex real-world data
US8311973B1 (en) * 2011-09-24 2012-11-13 Zadeh Lotfi A Methods and systems for applications for Z-numbers
US20140180811A1 (en) * 2012-12-22 2014-06-26 Coupons.Com Incorporated Automatic recommendation of electronic offers to an offer provider based on historical transaction data and offer data
CN103279123B (zh) * 2013-05-21 2015-12-23 沈阳化工大学 对间歇控制系统进行分段故障监视的方法
CN104462850A (zh) * 2014-12-25 2015-03-25 江南大学 基于模糊高斯混合模型的多阶段间歇过程软测量方法
CN105404892B (zh) * 2015-10-23 2019-10-29 浙江工业大学 基于有序模糊c均值聚类的青霉素发酵过程阶段划分方法
CN106547899B (zh) * 2016-11-07 2020-05-19 北京化工大学 一种基于多尺度时变聚类中心变化的间歇过程时段划分的方法
CN107203785A (zh) * 2017-06-02 2017-09-26 常州工学院 多路径高斯核模糊c均值聚类算法
CN107272655B (zh) * 2017-07-21 2019-08-06 江南大学 基于多阶段ica-svdd的间歇过程故障监测方法
CN108732931B (zh) * 2018-05-17 2021-03-26 北京化工大学 一种基于jit-rvm的多模态间歇过程建模方法
CN108734213B (zh) * 2018-05-17 2021-10-01 北京化工大学 一种基于贝叶斯统计分析的间歇过程模态识别方法
CN108898170B (zh) * 2018-06-19 2022-02-01 江苏中盈高科智能信息股份有限公司 一种基于模糊聚类分析的智能组卷方法

Also Published As

Publication number Publication date
CN109754010A (zh) 2019-05-14

Similar Documents

Publication Publication Date Title
CN109994200B (zh) 一种基于相似度融合的多组学癌症数据整合分析方法
Zuber et al. High-dimensional regression and variable selection using CAR scores
CN105279397B (zh) 一种识别蛋白质相互作用网络中关键蛋白质的方法
JP6253644B2 (ja) 統合バイアス補正およびクラス予測を用いてバイオマーカシグネチャを生成するためのシステムおよび方法
CN104914723B (zh) 基于协同训练偏最小二乘模型的工业过程软测量建模方法
CN111638707B (zh) 基于som聚类和mpca的间歇过程故障监测方法
JP2015527635A (ja) 統合デュアルアンサンブルおよび一般化シミュレーテッドアニーリング技法を用いてバイオマーカシグネチャを生成するためのシステムおよび方法
CN111079856B (zh) 一种基于csjitl-rvm的多时段间歇过程软测量建模方法
CN106547899B (zh) 一种基于多尺度时变聚类中心变化的间歇过程时段划分的方法
CN115691722B (zh) 医疗数据检测的质控方法、装置、设备、介质及程序产品
CN106354889B (zh) 一种基于lwpt-dtw的间歇过程不等长时段同步化的方法
CN116414095A (zh) 数据驱动的中医药制造过程工艺参数优化方法
CN116564409A (zh) 基于机器学习的转移性乳腺癌转录组测序数据识别方法
CN111223528A (zh) 一种多组学数据聚类方法及装置
CN109754010B (zh) 一种时序约束模糊聚类的间歇过程多模态划分方法
CN116631496A (zh) 一种基于多层异构图的miRNA靶标预测方法及系统和应用
CN105373831A (zh) 一种基于群体阶段性样本训练的k-近邻预测全局优化方法
CN113035363B (zh) 一种概率密度加权的遗传代谢病筛查数据混合采样方法
CN112508320B (zh) 一种批生产的自动过程阶段划分工作流
CN110221931B (zh) 基于切比雪夫的系统级测试性设计多目标优化方法
Mythili et al. CTCHABC-hybrid online sequential fuzzy Extreme Kernel learning method for detection of Breast Cancer with hierarchical Artificial Bee
Baucum et al. Hidden Markov models as recurrent neural networks: An application to Alzheimer's disease
CN118114125B (zh) 基于增量学习的miRNA及其异构体家族信息识别方法
CN117454205A (zh) 一种基于双边界svdd的间歇过程在线模态识别方法
Li et al. Density peaks clustering based on multiple distance measures for manufacturing process

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant