具体实施方式
如图1,将用于测量生物发酵易测变量的现场智能仪表连接于生物发酵设备,用于测量操作变量的控制器连接在生物发酵设备和数据预处理模块之间,存放数据的DCS(Distributed Control System,集成控制系统)数据库模块连接在现场智能仪表和数据预处理模块之间。数据预处理模块的输出依次连接数据分类模块、BP神经网络模型模块、多模型NN神经网络软测量模型和生物量浓度软测量值显示仪。本发明通过数据预处理模块用归一化和主元分析方法对输入的变量数据进行预处理,然后通过数据预处理模块对预处理后的主元变量集作聚类划分,再通过BP神经网络模型模块对不同的类分别建立子神经网络,最后建立多模型神经网络软测量模型,通过多模型神经网络软测量模型在线测试发酵过程中的生物量浓度,将测量的数值通过生物量浓度软测量值显示仪显示出来,具体实现步骤如下:
1、数据预处理模块
这一模块用于将从DCS数据库模块输入的模型输入变量进行预处理,利用主元分析方法(PCA)有效地去除模型变量间的冗余信息,减小相关性,降低模型的复杂度。
2、数据分类模块
数据分类模块使用的方法是聚类分析方法,聚类分析是多元统计分析的一种,也是非监督模式识别的一个重要分支,它把一个没有类别标记的样本集按照某种准则分为若干个子类,使相似的样本尽可能的归为一类,而将不相似的样本尽可能划分到不同的类中。这一部分需要注意的问题是:1)聚类分析的分类数目,即建立子神经网络的数目;2)聚类算法的选择,一种好的聚类算法能有效地减少模型间的相关性,从而提高生物发酵过程软测量模型的精度。
3、BP神经网络模型模块
基于神经网络的建模属于黑箱建模,输入变量和输出变量之间的映射关系是由神经网络来完成的,生物发酵过程中的在线可测变量X、发酵对象的控制输入量U作为软测量仪表的输入变量,被估计的发酵产物量作为软测量仪表的输出变量。BP神经网络模型模块采用BP神经网络作为各个子模型的训练方法,设BP神经网络的输出层第k个神经元的实际输出为yk,输入为netk,与此层相邻的隐含层中任一神经元j的输出为yj,则有:
yk=f(netk) (2)
式中,wkj是神经元k与神经元j之间的连接权,为神经元的输出函数,通常取为S型(sigmoid)函数,表示为:
式中,hk为神经元k的阈值,θ0为陡度参数,用以调节S型函数的陡度;
令训练样本为k,对于任一输入模式Xp,若相应有输出层中第k个神经元的期望输出Opk,则输出层的输出方差表示为:
式中,Opk代表期望输出,ypk代表实际输出;反向误差传播学习的目的是修改连接权w值,使E达到的最小值;要求连接权wkj,wji应沿Ep的负梯度方向学习;所以wkj的修正量为:
4、多模型神经网络软测量模型
多模型建模方法的优劣很大程度上取决于模型个数的设定和子模型网络的选取。多模型神经网络软测量模型建模时,主要三个问题:1)子神经网络的数目,即根据发酵的机理知识选择合适的数目;2)子神经网络的训练算法的选择,Levenberg-Marquardt(拉凡格氏)BP算法由于具备快速收敛性和有效的记忆功能,被选作训练子神经网络;3)软测量模型的输出,即可由各个子神经网络的输出和与之相对应的隶属度的加权和计算出来。
如图2,上述数据分类模块采用基于粒子群优化算法的核模糊C均值聚类算法(PSKFCM)对数据集作聚类划分。先设定粒子群算法中的各个参数,从中随机选择初始粒子集作为聚类中心和定义适应度函数,根据公式计算核矩阵和隶属度矩阵,再计算每个粒子的适应度值,根据适应度值和粒子群优化算法更新公式修正个体极值和全局极值,最后判断是否满足条件,若满足条件便执行FCM聚类算法实现数据分类,若不满足条件再重新计算矩阵。具体实现步骤如下:
1)给定聚类数目C,允许误差ε,t=1;
2)设定群体规模N,惯性权重,学习因子c1,c2,指数权重m;
3)初始化粒子群l1,l2,…,lC,其中lj为一个任意产生的聚类中心的集合,从样本集X={x1,x2,…,xN}中任取C个向量来初始化lj;
4)计算核矩阵K(xi,lj);
K(x,y)=exp[-(x-y)2/σ2] (6)
式中,vi为第i个聚类中心,xij为第i类的第j个样本数据,l为第i个聚类所包含的样本数目。
5)针对每个样本根据式(8)计算隶属度矩阵;
6)由式(9)计算出f(xi),根据式(10)、(11)修正粒子速度和位置,根据适应度的值修改Pid(t)(个体极值)和Pgd(t)(全局极值),以便产生下一代粒子;
Vid(t+1)=ω·Vid(t)+c1·r1(Pid(t)-Xid(t))
(10)
+c2·r2(Pgd(t)-Xid(t))
Xid(t+1)=Xid(t)+Vid(t+1),(i=1,2,…,N) (11)
7)若当前迭代次数达到预先设定的最大次数,则停止迭代。在最后一代找到最优解,输出取得Pgd的粒子,即聚类中心的集合,否则转到步骤4),t=t+1;
8)根据式(8)更新粒子群体的隶属度;
9)根据式(12)更新群体的聚类中心。计算相邻两代隶属度矩阵之差E,若E<ε,停止;否则转到8)。
上述多模型神经网络的生物发酵过程软测量建模方法如图3所示,具体实现步骤如下:
1)对生物发酵过程对象,根据工艺分析和操作分析,选择控制输入变量和在线可测变量作为模型的输入,离线测量的发酵数据作为模型的输出,即确定图3中的实验数据;
2)对输入的样本数据进行辅助变量的选择;
3)确定聚类数目C,允许误差ε,t=1,群体规模N,惯性权重,学习因子c1,c2,指数权重m;利用基于粒子群优化算法的核模糊C均值聚类算法对输入变量做聚类分析;
4)根据聚类后的n个数据类,建立n个神经网络子模型;
5)多模型神经网络软测量输出为各子NN模型输出的加权和,权值为隶属度ui(i=1,2,...,C),要满足下式:
式中,C为聚类数目,N为样本数,U=[μij]C×N是模糊C划分矩阵,μij为样本xi对应于第j个聚类的隶属度值,V=[vj]为C个聚类中心组成的集合,m是影响隶属度矩阵模糊化程度的指数权重。权值做如下的处理:
则整个模型的输出可由下式计算出来:
式中fi为第i个子NN的输出值。
根据以上步骤所得到的多模型神经网络模型即定为该生物发酵对象的软测量仪表。
下面提供1个实施例来说明本发明,但不是对本发明进行限制,只要在本发明保护范围内对本发明做出的修改和改变,都落入本发明的保护范围。
实施例1
参照图1,主要包括生物发酵设备、用于测量易测变量的现场智能仪表、用于测量操作变量的控制器、存放数据的DCS数据库模块、生物量浓度软测量值显示仪、所述现场智能仪表、控制器与生物发酵设备和DCS数据库模块连接。
如图2,核模糊C均值聚类的具体实施步骤是:
步骤1.给定聚类数目C,允许误差ε,t=1;
步骤2.设定群体规模N,惯性权重w,学习因子c1,c2,指数权重m;
步骤3.初始化粒子群l1,l2,…,lC,其中lj为一个任意产生的聚类中心的集合,从样本集X={x1,x2,…,xN}中任取C个向量来初始化lj;
步骤4.计算核矩阵K(xi,lj);
K(x,y)=exp[-(x-y)2/σ2] (6)
式中,vi为第i个聚类中心,xij为第i类的第j个样本数据,l为第i个聚类所包含的样本数目。
步骤5.针对每个样本根据式(8)计算隶属度矩阵;
步骤6.由式(9)计算出f(xi),根据式(10)、(11)修正粒子速度和位置,根据适应度的值修改Pid(t)(个体极值)和Pgd(t)(全局极值),以便产生下一代粒子;
Vid(t+1)=ω·Vid(t)+c1·r1(Pid(t)-Xid(t))
(10)
+c2·r2(Pgd(t)-Xid(t))
Xid(t+1)=Xid(t)+Vid(t+1),(i=1,2,…,N) (11)
步骤7.若当前迭代次数达到预先设定的最大次数,则停止迭代。在最后一代找到最优解,输出取得Pgd的粒子,即聚类中心的集合,否则转到步骤4,t=t+1;
步骤8.根据式(8)更新粒子群体的隶属度;
步骤9.根据式(12)更新群体的聚类中心。计算相邻两代隶属度矩阵之差E,若E<ε,停止;否则转到8)。
见图4的软测量模型的结构示意图,首先通过主元分析法对输入变量进行预处理,利用基于粒子群优化算法的核模糊C均值聚类算法对主元变量集作聚类划分,根据分类数据建立多模型神经网络软测量模型。方法的具体实施步骤如下:
步骤1.针对发酵罐中的微生物发酵生产过程收集发酵数据存放入DCS数据库,并将数据分为训练样本和预测样本;
步骤2.对所有的历史发酵数据进行数据归一化预处理操作,将所有变量值限制在[0,1]区间内;
步骤3.对归一化后的数据进行主元分析;
步骤4.确定聚类数目C,允许误差ε,t=1,群体规模N,惯性权重w,学习因子c1,c2,指数权重m;
步骤5.利用基于粒子群优化算法的核模糊C均值聚类算法对输入变量做聚类分析;
步骤6.根据聚类后的输入输出样本数据,建立子神经网络子模型;
步骤7.多模型神经网络软测量输出为各子NN模型输出的加权和,权值为隶属度ui(i=1,2,...,C),要满足下式:
式中,C为聚类个数,N为样本数,U=[μij]C×N是模糊C划分矩阵,μij为样本xi对应于第j个聚类的隶属度值,V=[vj]为C个聚类中心组成的集合,m是影响隶属度矩阵模糊化程度的指数权重。
权值做如下的处理:
则整个模型的输出可由下式计算出来:
式中fi为第i个子NN的输出值。
步骤8.导入工业现场测量的可测变量数据X和控制发酵对象的输入量的数据U,根据模型的要求选择以上变量,然后再对选中的变量进行数据预处理和数据分类处理;
步骤9.将以上处理完毕的数据用多模型神经网络软测量模型估计出发酵过程中的生物量浓度。
以下以红霉素生产发酵过程对本发明技术方案做进一步描述:
红霉素是医学中重要的药物之一,其生产发酵过程中的生物量浓度很难利用一般传感器实时准确地测量出来。将基于本发明的软测量方法应用于红霉素发酵过程中估计其生物量浓度。
根据对红霉素发酵机理以及流程工艺的分析,考虑到这一发酵生产过程中对生物量浓度具有影响的各种因素,取实际生产过程中常用的15个操作变量和易测变量,有:时间、溶解氧、pH值、糊精流量、豆油流量、丙醇流量、水流量、糊精体积、豆油体积、丙醇体积、水体积、温度、相对气压、转速、空气流量。将这些状态变量通过数据预处理模块,利用主元分析算法对状态变量处理之后,获得的温度、pH、相对压力、转速、溶解氧作为软测量模型的输入变量,生物量浓度作为软测量模型的输出变量。根据对微生物发酵过程生长速率曲线的分析,确定聚类数目为4。本发明中子NN选用三层前馈网络,输入层节点为6,隐含层节点为10,输出层节点为1。隐含层和输出层函数分别选用S型函数和线性函数。
图5基于本发明的软测量仪表估计某一批发酵过程的生物量浓度的实验结果,图中星号表示通过传感器等手段离线采集到的生物量浓度,实线表示利用基于多模型神经网络软测量模型预测到的生物量浓度,由图5可知,本发明可高精度在线测量发酵过程中参数变量。
下表1为利用基于多模型神经网络软测量建模方法对红霉素发酵生产过程中3批发酵数据的估计生物量浓度,用最大相对误差(MRE)和均方误差(MSE)二个预测性能的评价指标评价该软测量仪表的估计精度。
表1