CN116793991B - 一种基于近红外光谱和混合损失的谷氨酸浓度测量方法 - Google Patents
一种基于近红外光谱和混合损失的谷氨酸浓度测量方法 Download PDFInfo
- Publication number
- CN116793991B CN116793991B CN202311054937.2A CN202311054937A CN116793991B CN 116793991 B CN116793991 B CN 116793991B CN 202311054937 A CN202311054937 A CN 202311054937A CN 116793991 B CN116793991 B CN 116793991B
- Authority
- CN
- China
- Prior art keywords
- near infrared
- glutamic acid
- infrared spectrum
- acid concentration
- true
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 130
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 title claims abstract description 116
- 235000013922 glutamic acid Nutrition 0.000 title claims abstract description 116
- 239000004220 glutamic acid Substances 0.000 title claims abstract description 116
- 238000002156 mixing Methods 0.000 title claims abstract description 21
- 238000000691 measurement method Methods 0.000 title abstract description 8
- 238000000034 method Methods 0.000 claims abstract description 52
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 10
- 230000002159 abnormal effect Effects 0.000 claims abstract description 8
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 124
- 238000000855 fermentation Methods 0.000 claims description 25
- 230000004151 fermentation Effects 0.000 claims description 25
- 229930195712 glutamate Natural products 0.000 claims description 13
- 238000002790 cross-validation Methods 0.000 claims description 8
- 238000012795 verification Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 14
- 238000005259 measurement Methods 0.000 description 12
- 229940049906 glutamate Drugs 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000012773 Laboratory assay Methods 0.000 description 2
- 238000004497 NIR spectroscopy Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 241000533950 Leucojum Species 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- PXEDJBXQKAGXNJ-QTNFYWBSSA-L disodium L-glutamate Chemical compound [Na+].[Na+].[O-]C(=O)[C@@H](N)CCC([O-])=O PXEDJBXQKAGXNJ-QTNFYWBSSA-L 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000013923 monosodium glutamate Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 229940073490 sodium glutamate Drugs 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明属于计算机化学技术领域,公开了一种基于近红外光谱和混合损失的谷氨酸浓度测量方法,收集近红外光谱和相应的谷氨酸浓度,获得建模训练集;采用LSSVM模型和留一交叉验证方法其进行拟合,然后去除异常样本;采用移动平均法处理干净的近红外光谱X c ,得到移动平均处理后的近红外光谱X a ;最后基于一维搜索和混合损失建立基于移动平均法处理的LSSVM模型,并确定最佳谷氨酸浓度预测模型,将实时获得的新近红外光谱输入到预测模型中,即可实现谷氨酸浓度的实时在线预测,准确性高。
Description
技术领域
本发明属于计算机化学技术领域,特别涉及一种基于近红外光谱和混合损失的谷氨酸浓度测量方法。
背景技术
谷氨酸发酵是生物发酵的重要组成部分,它是生产谷氨酸钠的关键因素。为了获得高质量的谷氨酸产品,在操作工业谷氨酸发酵过程中,有必要建立一个准确的谷氨酸浓度实时测量方法。传统测量方法是通过长间隔取样的方式进行离线测量,导致获得产品质量信息存在明显时间滞后,并且人工测量误差较大。近红外(Near Infrared,NIR)光谱法由于具有无损测量和无需样品制备的重要优势,已经越来越多地被用于生物发酵过程产品质量的在线测量。
近红外光谱具有测量微生物发酵过程中产物浓度的潜力。然而,许多应用集中在在线快速测量上,即从反应器中提取样品,在近红外光谱仪上进行测量。这种方法是对传统离线分析的改进,因为它可以在几分钟内迅速给出结果。然而,这种测量模式仍然需要将样品从工艺中取出并处理,并在反应器中设置一个旁路,用近红外光谱仪对旁路进行测量。这种方法是对在线分析的一种改进,然而这种测量模式仍然需要在工艺中添加额外的设备,并不是真正反映过程的实际情况。因此,理想的方法是将近红外探头直接放入反应器中进行测量。
在实际应用中,建立工业级近红外光谱标定模型存在以下问题:(1)实际工业过程环境复杂,得到的近红外光谱变量与谷氨酸浓度存在大量异常值。(2)实际工业过程环境复杂,近红外光谱变量与谷氨酸浓度有非线性关系。(3) 工业中的实验室与生产装置往往相隔甚远,这就导致了测量近红外光谱与离线分析值出现不匹配问题。
如何在真实复杂的工业环境中为近红外光谱建立一个准确的标定模型,以确保发酵过程中产品浓度测量的准确性,是一个有待解决的问题。到目前为止,很少有学者关注在大规模工业环境中通过定量模型测量发酵过程产物浓度。由于工业环境中的高噪声干扰和近红外光谱标签不匹配,传统有效的近红外光谱建模方法,如最小二乘支持向量机(Leastsquares support vector machine,LSSVM),最小绝对收缩和选择算子(Minimum absoluteshrinkage and selection operator ,Lasso),甚至高度鲁棒的偏最小二乘(Partialleast squares, PLS)方法,在面对现实复杂的工业环境时,谷氨酸浓度预测准确度较差。
发明内容
针对现有技术存在的不足,本发明提供一种基于近红外光谱和混合损失的谷氨酸浓度测量方法,是一种基于移动平均法、自定义混合损失、一维搜索和LSSVM的工业谷氨酸近红外光谱建模方法。对于工业过程由于采集的近红外光谱与实验室测得的谷氨酸浓度不匹配问题,采用移动平均法处理近红外光谱,缓解不匹配现象。另外通过移动平均处理后的近红外光谱和原始干净近红外光谱建立LSSVM模型获得的预测值与真实谷氨酸浓度的均方根误差共同构建混合损失,利用留一交叉验证,通过一维搜索以混合损失最小确定最佳移动窗口数,由此确定最佳谷氨酸浓度预测模型。最后将实时获得的新近红外光谱输入到预测模型中便可实现谷氨酸浓的在线实时测量。
为了解决上述技术问题,本发明采用的技术方案是:
一种基于近红外光谱和混合损失的谷氨酸浓度测量方法,包括以下步骤:
步骤1:收集近红外光谱和相应的谷氨酸浓度,获得建模训练集,用于建立近红外光谱标定模型;
其中用表示工业谷氨酸发酵过程实时测量的近红外光谱,对于每一条近红外光谱用/>表示,其中N和M表示测量近红外光谱的数目和近红外光谱维度,x1,x2,...,xN分别是第1,2,...,N条近红外光谱,xi1,xi2,...,xiM分别是第i条近红外光谱的第1,2,...,M个近红外光谱变量,T表示转置;用表示离线生物传感分析仪获得的与近红外光谱对应的真实谷氨酸浓度,其中y1,y2,...,yN分别是第1,2,...,N条近红外光谱对应的真实谷氨酸浓度;
步骤2:采用LSSVM和留一交叉验证方法对步骤1收集的近红外光谱和相应的谷氨酸浓度进行建模,得到预测模型的模型参数及对应的预测值/>;
步骤3:根据相对误差采用准则去除异常样本,获得干净的近红外光谱Xc与对应的真实谷氨酸浓度yc;具体是:
首先根据步骤2获得的预测值与真实值y,进而计算二者的相对误差/>;然后根据/>准则,将不符合准则的样本确定为异常样本,移出训练集,选取符合/>准则的近红外光谱样本和对应的真实谷氨酸浓度作为最终的建模集,即干净的近红外光谱Xc和对应的真实谷氨酸浓度yc,其中/>表示根据/>准则获得的干净的近红外光谱,/>是与干净的近红外光谱对应的真实谷氨酸浓度,/>准则如公式所示:
,/> (3);
其中, 为/>的平均值,/>为/>的标准偏差,/>为预测的谷氨酸浓度与真实谷氨酸浓度的相对误差,/>为第i个原始收集近红外光谱对应的真实谷氨酸浓度与预测值的相对误差;
步骤4:采用移动平均法处理干净的近红外光谱Xc,得到移动平均处理后的近红外光谱Xa;
其中移动平均法是根据时间序列信息,计算移动窗口内数据的平均值,具体是:针对批次谷氨酸发酵过程,确定每一批的样本,然后对每一批样本独立进行移动窗口处理,得到一个由均值组成的数组,其中每个均值是根据要处理样本的相邻元素结合移动窗口计算;
当窗口大小为奇数时,窗口以当前位置的元素为中心;当窗口大小为偶数时,窗口以当前元素和其之前的元素为中心;当滑动到数据末端,剩余元素小于窗口时,窗口会自动在端点处被截断;
步骤5:基于一维搜索和混合损失建立基于移动平均法处理的LSSVM模型,并确定最佳谷氨酸浓度预测模型;
具体是:将移动平均处理后的近红外光谱Xa与对应的真实谷氨酸浓度yc,干净的近红外光谱Xc与对应的真实谷氨酸浓度yc共同输入到新的LSSVM模型,进行建模,得到谷氨酸浓度预测模型,
其中混合损失是采用干净的近红外光谱Xc和移动平均处理后的近红外光谱Xa获得的谷氨酸浓度预测值与真实谷氨酸浓度的均方根误差共同构建;
步骤6:谷氨酸浓度的实时在线预测:
将实时获得的新近红外光谱xnew输入到步骤1-5确定的预测模型中,即可实现谷氨酸浓度的实时在线预测,即获得预测值/>。
进一步的,步骤2中,利用留一交叉验证方法,根据损失函数均方根误差最小的原则,得到预测模型的模型参数及对应的预测值/>,其表示为如下:
(2);
其中,为预测模型/>的高斯核函数,/>是预测模型/>的拉格朗日乘数,/>为预测模型/>的常值偏差。
进一步的,步骤5中,谷氨酸浓度预测模型,表示如下
(4);
其中,为预测模型/>的高斯核函数,/>是预测模型/>的拉格朗日乘数,/>为预测模型/>的常值偏差。
进一步的,步骤5中,混合损失的定义如下:
混合损失=hRMSECo+(1-h)RMSECm (5);
其中RMSECo是采用干净的近红外光谱Xc获得的谷氨酸浓度预测值和对应的真实谷氨酸浓度yc获得的均方根误差,RMSECm是采用移动平均处理后的近红外光谱Xa获得的谷氨酸浓度预测值和对应的真实谷氨酸浓度yc获得的均方根误差,h是RMSECo和RMSECm的平衡权重;
利用留一交叉验证,通过一维搜索以训练数据集的混合损失最小确定窗口大小,由此确定谷氨酸浓度预测模型。
与现有技术相比,本发明优点在于:
对于工业过程由于采集的近红外光谱与实验室测得的谷氨酸浓度不匹配问题,本发明采用移动平均法处理近红外光谱,缓解不匹配现象;通过移动平均处理后的近红外光谱与对应的谷氨酸浓度和原始干净近红外光谱与对应的谷氨酸浓度建立LSSVM模型,并将二者的均方根误差共同构建混合损失,然后使用一维搜索以混合损失最小确定最佳移动窗口数,由此确定最佳预测模型(近红外标定模型),本发明可实现工业谷氨酸浓度实时预测,准确性高。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的方法流程图;
图2为本发明的移动平均处理原理图;
图3为本发明的实施例中谷氨酸发酵过程的谷氨酸浓度在线测量结果。
具体实施方式
下面结合附图及具体实施例对本发明作进一步的说明。
结合图1所示的基于近红外光谱和混合损失的工业谷氨酸发酵过程产品浓度测量方法,本实施例设计了一种基于近红外光谱和混合损失的谷氨酸浓度测量方法,包括以下步骤:
步骤1:收集近红外光谱和相应的谷氨酸浓度,获得建模训练集,用于建立基于近红外光谱的谷氨酸浓度预测模型;
为了建立近红外光谱标定模型,用表示工业谷氨酸发酵过程实时测量的近红外光谱,对于每一条近红外光谱用/>表示,其中N和M表示测量近红外光谱的数目和近红外光谱维度,x1,x2,...,xN分别是第1,2,...,N条近红外光谱,xi1,xi2,...,xiM分别是第i条近红外光谱的第1,2,...,M个近红外光谱变量,T表示转置;用/>表示离线生物传感分析仪获得的与近红外光谱对应的真实谷氨酸浓度(即与近红外光谱对应的离线检测参考数据),其中y1,y2,...,yN分别是第1,2,...,N条近红外光谱对应的真实谷氨酸浓度。
步骤2:采用LSSVM和留一交叉验证方法对步骤1收集的近红外光谱和相应的谷氨酸浓度进行建模。
利用留一交叉验证方法,根据损失函数均方根误差RMSEC的原则,得到预测模型的模型参数及对应的预测值/>,其表示为如下
(2);
其中,为预测模型/>的高斯核函数,/>是预测模型/>的拉格朗日乘数,/>为预测模型/>的常值偏差,/>是测量近红外光谱的数目。
步骤3:根据相对误差采用准则去除异常样本,获得干净的近红外光谱样本Xc与对应的真实谷氨酸浓度yc。
首先根据步骤2获得的预测值与真实值y,进而计算二者的相对误差/>;然后根据/>准则,将不符合准则的样本确定为异常样本,移出训练集,选取符合/>准则的近红外光谱样本和对应的真实谷氨酸浓度作为最终的建模集,即干净的近红外光谱Xc和对应的真实谷氨酸浓度yc,其中/>表示根据/>准则获得的干净的近红外光谱,/>为与干净的近红外光谱对应的真实谷氨酸浓度,/>准则如公式所示:
,/> (3);
其中, 为/>的平均值,/>为/>的标准偏差,/>为预测的谷氨酸浓度与真实谷氨酸浓度的相对误差,/>为第i个原始收集近红外光谱对应的真实谷氨酸浓度与预测值的相对误差。
步骤4:采用移动平均法处理干净的近红外光谱Xc,得到移动平均处理后的近红外光谱Xa。
移动平均法是根据时间序列信息,计算移动窗口内数据的平均值,以反映长期趋势。因此,由于离线实验室分析在采样后需要较长的时间来获得谷氨酸浓度,移动平均法可以减少这种影响。
具体是:针对批次谷氨酸发酵过程,需要确定每一批的样本,然后对每一批独立进行移动窗口处理。其主要思路是通过移动平均过程,得到一个由均值组成的数组,其中每个均值是根据要处理样本的相邻元素结合移动窗口计算。当窗口大小为奇数时,窗口以当前位置的元素为中心。当窗口大小为偶数时,窗口以当前元素和其之前的元素为中心。当滑动到数据末端,剩余元素小于窗口时,窗口会自动在端点处被截断。
图2以5个样本点和窗口大小2为例来说明移动平均的处理策略,[xc1, xc2, xc3, xc4, xc5]表示干净的近红外光谱,[xa1, xa2,xa3, xa4, xa5]表示移动平均处理后的近红外光谱,表示对应的真实谷氨酸浓度。经过这样的处理后,可以得到一个与原始近红外光谱相同尺寸相同的新近红外光谱。
步骤5:基于一维搜索和混合损失建立基于移动平均法处理的LSSVM模型,并确定最佳谷氨酸浓度预测模型。
将移动平均处理后的近红外光谱Xa与对应的真实谷氨酸浓度yc,干净的近红外光谱Xc与对应的真实谷氨酸浓度yc共同输入到新的LSSVM模型,进行建模,得到谷氨酸浓度预测模型,表示如下
(4);
其中,为预测模型/>的高斯核函数,/>是预测模型/>的拉格朗日乘数,/>为预测模型/>的常值偏差。
移动平均法中最重要的参数是窗口大小,它决定了整个方法的好坏。一维搜索可以简单有效的确定最佳的窗口大小。虽然采用移动平均滑动窗口可以解决测量近红外光谱与离线化验值的失配问题,但是在实时检测过程中,光谱标定模型是基于原始采集近红外光谱进行预测。因此,这里提出采用干净的近红外光谱和移动平均处理后的近红外光谱获得的谷氨酸浓度预测值与真实谷氨酸浓度的均方根误差共同构建混合损失。
通过一维搜索,给定适当窗口大小,通过留一交叉验证以训练数据集的混合损失最小化为原则,确定最佳窗口大小和最佳预测模型。其中混合损失的定义如下:
混合损失=hRMSECo+(1-h)RMSECm (5);
其中RMSECo是采用干净的近红外光谱Xc获得的谷氨酸浓度预测值和对应的真实谷氨酸浓度yc获得的均方根误差,RMSECm是采用移动平均处理后的近红外光谱Xa获得的谷氨酸浓度预测值和对应的真实谷氨酸浓度yc获得的均方根误差,h是RMSECo和RMSECm的平衡权重。
步骤6:谷氨酸浓度的实时在线预测:
将实时获得的新近红外光谱xnew输入到步骤1-5确定的预测模型中,即可实现谷氨酸浓度的实时在线预测,即获得预测值/>。
为了验证本发明的有效性,采集了工业谷氨酸发酵过程数据进行验证。本例的发酵罐容量为500吨,罐中的温度、pH值、搅拌桨转速等由发酵控制设备控制,其中Pt100用于测量发酵罐中温度,pH计用于实时检测发酵过程pH值。
实验中采用ABB公司制造的TALYS-AS531傅里叶近红外光谱分析仪以及配套的浸入式漫反射探头采集近红外光谱。发酵罐、近红外光谱仪的浸入式透射探头和温度计在实验前进行了高压灭菌。近红外光谱采集波数范围为4000 cm-1-12000 cm-1,近红外光谱仪分辨率为16 cm-1,近红外光谱扫描次数为64次,采集的近红外光谱以蒸馏水为参考背景。原材料为葡萄糖,初始浓度约为3.5 g/L,经过约6小时的发酵后稳定在0.2 g/L,通过发酵过程转化为产品谷氨酸,整个发酵过程的持续时间约为30小时。在发酵过程中,利用近红外光谱仪来实时监测谷氨酸发酵反应过程。同时,每隔1小时从发酵罐中取50毫升的溶液,用生物传感分析仪(型号是SBA-40D,山东省科学院生产)在实验室化验分析获得谷氨酸浓度,以获得参考数据用作对比分析。
利用上述实验平台采集了7个批次发酵过程数据用于构建基于近红外光谱的工业谷氨酸浓度预测模型的训练集。7个批次一共采集了202个样本用于建模。从表中可以看出,每个批次用于建模的样本数都很小,不足40个,属于小样本建模问题。
为了评估基于近红外光谱谷氨酸浓度预测模型对谷氨酸浓度的预测性能,这里采用预测集均方根误差RMSEP (root mean square error of prediction)、相关系数R2(coefficient of determination) 评价指标,其计算公式分别为:
(6);
(7)
其中为测试集中第i个样本真实测量值,/>为测试集的第i个样本的预测值,是预测样本的均值,/>为样本数。
为了验证模型的预测性能,通过一个独立批次的谷氨酸发酵实验对上述谷氨酸浓度预测模型进行验证,并与PLS,Lasso和LSSVM预测结果进行了对比,其结果见表1。
表1 不同方法的R2和RMSEP结果的比较
从表1中可以看到本文提出方法的R2最大,RMSEP最小说明本文提出的建模方法有着最佳的预测效果。
图3展示了本文提出的方法的预测结果,圆圈散点为基于近红外光谱和提出的预测模型实时预测的结果(即预测值),雪花散点数据为实验室化验分析获得真实谷氨酸浓度(即真实值)。
从图3可以看出,本发明提出的模型的实时预测结果同离线检测参考值比较贴近,基本可以反映发酵过程谷氨酸浓度的变化趋势。由此进一步验证了本专利提出的预测模型具有良好的预测准确性。
当然,上述说明并非是对本发明的限制,本发明也并不限于上述举例,本技术领域的普通技术人员,在本发明的实质范围内,做出的变化、改型、添加或替换,都应属于本发明的保护范围。
Claims (3)
1.一种基于近红外光谱和混合损失的谷氨酸浓度测量方法,其特征在于,包括以下步骤:
步骤1:收集近红外光谱和相应的谷氨酸浓度,获得建模训练集;
其中用表示工业谷氨酸发酵过程实时测量的近红外光谱,对于每一条近红外光谱用/>表示,其中N和M表示测量近红外光谱的数目和近红外光谱维度,x1,x2,...,xN分别是第1,2,...,N条近红外光谱,xi1,xi2,...,xiM分别是第i条近红外光谱的第1,2,...,M个近红外光谱变量,T表示转置;用表示离线生物传感分析仪获得的与近红外光谱对应的真实谷氨酸浓度,其中y1,y2,...,yN分别是第1,2,...,N条近红外光谱对应的真实谷氨酸浓度;
步骤2:采用LSSVM和留一交叉验证方法对步骤1收集的近红外光谱和相应的谷氨酸浓度进行建模,得到预测模型的模型参数及对应的预测值/>;
步骤3:根据相对误差采用准则去除异常样本,获得干净的近红外光谱Xc与对应的真实谷氨酸浓度yc;具体是:
首先根据步骤2获得的预测值与真实值y,进而计算二者的相对误差/>;然后根据准则,将不符合准则的样本确定为异常样本,移出训练集,选取符合/>准则的近红外光谱样本和对应的真实谷氨酸浓度作为最终的建模集,即干净的近红外光谱Xc和对应的真实谷氨酸浓度yc,其中/>表示根据/>准则获得的干净的近红外光谱,是与干净的近红外光谱对应的真实谷氨酸浓度,/>准则如公式所示:
,/> (3);
其中, 为/>的平均值,/>为/>的标准偏差,/>为预测的谷氨酸浓度与真实谷氨酸浓度的相对误差,/>为第i个原始收集近红外光谱对应的真实谷氨酸浓度与预测值的相对误差;
步骤4:采用移动平均法处理干净的近红外光谱Xc,得到移动平均处理后的近红外光谱Xa;
其中移动平均法是根据时间序列信息,计算移动窗口内数据的平均值,具体是:针对批次谷氨酸发酵过程,确定每一批的样本,然后对每一批样本独立进行移动窗口处理,得到一个由均值组成的数组,其中每个均值是根据要处理样本的相邻元素结合移动窗口计算;
当窗口大小为奇数时,窗口以当前位置的元素为中心;当窗口大小为偶数时,窗口以当前元素和其之前的元素为中心;当滑动到数据末端,剩余元素小于窗口时,窗口会自动在端点处被截断;
步骤5:基于一维搜索和混合损失建立基于移动平均法处理的LSSVM模型,并确定最佳谷氨酸浓度预测模型;
具体是:将移动平均处理后的近红外光谱Xa与对应的真实谷氨酸浓度yc,干净的近红外光谱Xc与对应的真实谷氨酸浓度yc共同输入到新的LSSVM模型,进行建模,得到谷氨酸浓度预测模型,
其中混合损失是采用干净的近红外光谱Xc和移动平均处理后的近红外光谱Xa获得的谷氨酸浓度预测值与真实谷氨酸浓度的均方根误差共同构建;混合损失的定义如下:
混合损失=hRMSECo+(1-h)RMSECm (5);
其中RMSECo是采用干净的近红外光谱Xc获得的谷氨酸浓度预测值和对应的真实谷氨酸浓度yc获得的均方根误差,RMSECm是采用移动平均处理后的近红外光谱Xa获得的谷氨酸浓度预测值和对应的真实谷氨酸浓度yc获得的均方根误差,h是RMSECo和RMSECm的平衡权重;
利用留一交叉验证,通过一维搜索以训练数据集的混合损失最小确定窗口大小,由此确定谷氨酸浓度预测模型;
步骤6:谷氨酸浓度的实时在线预测:
将实时获得的新近红外光谱xnew输入到步骤1-5确定的预测模型中,即可实现谷氨酸浓度的实时在线预测,即获得预测值/>。
2.根据权利要求1所述的一种基于近红外光谱和混合损失的谷氨酸浓度测量方法,其特征在于,步骤2中,利用留一交叉验证方法,根据损失函数均方根误差最小的原则,得到预测模型的模型参数及对应的预测值/>,其表示为如下:/>(2);
其中,为预测模型/>的高斯核函数,/>是预测模型/>的拉格朗日乘数,/>为预测模型/>的常值偏差。
3.根据权利要求1所述的一种基于近红外光谱和混合损失的谷氨酸浓度测量方法,其特征在于,步骤5中,谷氨酸浓度预测模型,表示如下
(4);
其中,为预测模型/>的高斯核函数,/>是预测模型/>的拉格朗日乘数,/>为预测模型/>的常值偏差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311054937.2A CN116793991B (zh) | 2023-08-22 | 2023-08-22 | 一种基于近红外光谱和混合损失的谷氨酸浓度测量方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311054937.2A CN116793991B (zh) | 2023-08-22 | 2023-08-22 | 一种基于近红外光谱和混合损失的谷氨酸浓度测量方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116793991A CN116793991A (zh) | 2023-09-22 |
CN116793991B true CN116793991B (zh) | 2023-11-10 |
Family
ID=88044079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311054937.2A Active CN116793991B (zh) | 2023-08-22 | 2023-08-22 | 一种基于近红外光谱和混合损失的谷氨酸浓度测量方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116793991B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102313714A (zh) * | 2011-09-21 | 2012-01-11 | 浙江大学 | 一种红花提取液测定方法 |
KR20130021905A (ko) * | 2011-08-24 | 2013-03-06 | 강원대학교산학협력단 | 근적외 분광분석법을 이용한 녹차 데아닌, 가바 및 글루탐산의 개별 함량 동시 측정방법 |
CN106018335A (zh) * | 2016-08-04 | 2016-10-12 | 浙江大学 | 基于近红外光谱的整粒棉籽中植酸含量的无损测定方法 |
KR20170053360A (ko) * | 2015-11-06 | 2017-05-16 | 최종수 | 근적외선 분광분석기를 이용한 아미노산 발효공정의 실시간관리방법 |
CN109520965A (zh) * | 2018-11-20 | 2019-03-26 | 中国农业科学院农业质量标准与检测技术研究所 | 一种基于近红外光谱特征数据提取技术检测赖氨酸含量的方法 |
CN109668858A (zh) * | 2019-02-14 | 2019-04-23 | 大连理工大学 | 基于近红外光谱检测发酵过程生物量和组分浓度的方法 |
CN109799207A (zh) * | 2019-01-15 | 2019-05-24 | 上海交通大学 | 基于近红外光谱分析的白芷中掺滑石粉的定量检测方法 |
CN110308111A (zh) * | 2019-06-14 | 2019-10-08 | 湖北省农业科学院果树茶叶研究所 | 一种应用近红外光谱技术快速预测远安黄茶闷黄时间的方法 |
CN113160286A (zh) * | 2021-01-06 | 2021-07-23 | 中国地质大学(武汉) | 一种基于卷积神经网络的近红外和可见光图像融合方法 |
CN114112978A (zh) * | 2021-12-13 | 2022-03-01 | 大连理工大学 | 原位红外光谱检测结晶过程溶液浓度的小波函数标定建模方法 |
-
2023
- 2023-08-22 CN CN202311054937.2A patent/CN116793991B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130021905A (ko) * | 2011-08-24 | 2013-03-06 | 강원대학교산학협력단 | 근적외 분광분석법을 이용한 녹차 데아닌, 가바 및 글루탐산의 개별 함량 동시 측정방법 |
CN102313714A (zh) * | 2011-09-21 | 2012-01-11 | 浙江大学 | 一种红花提取液测定方法 |
KR20170053360A (ko) * | 2015-11-06 | 2017-05-16 | 최종수 | 근적외선 분광분석기를 이용한 아미노산 발효공정의 실시간관리방법 |
CN106018335A (zh) * | 2016-08-04 | 2016-10-12 | 浙江大学 | 基于近红外光谱的整粒棉籽中植酸含量的无损测定方法 |
CN109520965A (zh) * | 2018-11-20 | 2019-03-26 | 中国农业科学院农业质量标准与检测技术研究所 | 一种基于近红外光谱特征数据提取技术检测赖氨酸含量的方法 |
CN109799207A (zh) * | 2019-01-15 | 2019-05-24 | 上海交通大学 | 基于近红外光谱分析的白芷中掺滑石粉的定量检测方法 |
CN109668858A (zh) * | 2019-02-14 | 2019-04-23 | 大连理工大学 | 基于近红外光谱检测发酵过程生物量和组分浓度的方法 |
CN110308111A (zh) * | 2019-06-14 | 2019-10-08 | 湖北省农业科学院果树茶叶研究所 | 一种应用近红外光谱技术快速预测远安黄茶闷黄时间的方法 |
CN113160286A (zh) * | 2021-01-06 | 2021-07-23 | 中国地质大学(武汉) | 一种基于卷积神经网络的近红外和可见光图像融合方法 |
CN114112978A (zh) * | 2021-12-13 | 2022-03-01 | 大连理工大学 | 原位红外光谱检测结晶过程溶液浓度的小波函数标定建模方法 |
Non-Patent Citations (2)
Title |
---|
LS-SVM结合近红外光谱快速检测 香梨可溶性糖;盛晓慧等;食品科技;第44卷(第05期);第307-312页 * |
谷氨酸棒杆菌发酵过程中亮氨酸浓度近红外模型的建立;马雷等;生物技术通讯;第27卷(第04期);第501-506页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116793991A (zh) | 2023-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109668858A (zh) | 基于近红外光谱检测发酵过程生物量和组分浓度的方法 | |
CN107703097B (zh) | 利用近红外光谱仪构建快速预测原油性质的模型的方法 | |
CN109324014B (zh) | 一种自适应的原油性质近红外快速预测方法 | |
CN105486655A (zh) | 基于红外光谱智能鉴定模型的土壤有机质快速检测方法 | |
CN110879212A (zh) | 一种基于近红外光谱监测流化床干燥过程状态的方法 | |
CN102876816A (zh) | 基于多传感器信息融合的发酵过程状态监测与控制方法 | |
CN102841069B (zh) | 一种由中红外光谱识别原油种类的方法 | |
CN110908361B (zh) | 一种基于在线孪生支持向量回归机的发酵过程软测量方法 | |
CN116559110A (zh) | 一种基于相关性和高斯曲线拟合的自适应近红外光谱变换方法 | |
CN114112978A (zh) | 原位红外光谱检测结晶过程溶液浓度的小波函数标定建模方法 | |
CN105954228A (zh) | 基于近红外光谱的油砂中金属钠含量的测量方法 | |
CN116793991B (zh) | 一种基于近红外光谱和混合损失的谷氨酸浓度测量方法 | |
CN111896497B (zh) | 一种基于预测值的光谱数据修正方法 | |
WO2024061126A1 (zh) | 聚羟基脂肪酸酯含量的检测方法、装置、系统、设备 | |
CN106529680B (zh) | 一种基于经验模态分解的多尺度极限学习机集成建模方法 | |
CN1979131A (zh) | 用近红外光谱测定加氢尾油链烷烃族组成的方法 | |
CN108375561A (zh) | 一种基于三维荧光光谱技术对掺假蜂蜜进行快速识别和定量分析的方法 | |
CN116952896A (zh) | 一种啤酒厂糖化麦汁中总氮的近红外快速检测方法 | |
CN102841071A (zh) | 由二维相关红外异步光谱识别原油种类的方法 | |
CN113049526B (zh) | 一种基于太赫兹衰减全反射的玉米种子水分含量测定方法 | |
CN111474134A (zh) | 一种利用在线近红外进行丁酸发酵控制的方法 | |
CN109060684B (zh) | 一种基于计算机程序微生物发酵过程的智能测量方法 | |
CN116754517A (zh) | 一种基于近红外光谱实时测量水煤浆生产和传输过程浓度的方法 | |
CN117871458A (zh) | 一种在线检测发酵过程多组分含量的半监督近红外光谱数据扩增建模方法 | |
CN116952897A (zh) | 基于近红外光谱技术定量检测啤酒厂糖化麦汁浓度的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |