CN110672578A - 针对煎炸油极性组分检测的模型通用性及稳定性验证方法 - Google Patents
针对煎炸油极性组分检测的模型通用性及稳定性验证方法 Download PDFInfo
- Publication number
- CN110672578A CN110672578A CN201910912531.0A CN201910912531A CN110672578A CN 110672578 A CN110672578 A CN 110672578A CN 201910912531 A CN201910912531 A CN 201910912531A CN 110672578 A CN110672578 A CN 110672578A
- Authority
- CN
- China
- Prior art keywords
- oil
- model
- samples
- modeling
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biochemistry (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明涉及一种针对煎炸油极性组分检测的模型通用性及稳定性验证方法,包括样本采集、建立样本集、获取样本集内样本的拉曼光谱、随机选取建模集和预测集,然后通过多种算法对拉曼光谱进行分析建模;根据对建模结果与建模集和预测集对应的数据进行比对,根据相关系数和误差判断建立的模型稳定性和通用性优先级队列,完成验证。本发明给出了一种针对煎炸油极性组分检测的模型通用性及稳定性的验证方法,并通过具体的实验数据给出了本验证方法在检测模型稳定性和通用性时的准确性和可行性,并最终通过本验证方法给出了一种最优的建模方法,通过此建模方法建立的模型在进行极性组分检测时的准确性更高,能更准确的评价煎炸油的品质。
Description
技术领域
本发明涉及食品安全检测技术领域,尤其涉及一种针对煎炸油极性组分检测的模型通用性及稳定性验证方法。
背景技术
在煎炸过程中,由于油品在高温环境和水分作用下连续反复使用,将发生氧化、聚合、裂解和水解等反应,生成羰基、羧基、酮基、醛基等化合物,因这些物质比甘油三酯分子极性大,被称为极性组分(Polar Compound,PC)。极性组分会对煎炸油本身的品质、油炸食品的风味和营养价值产生不良影响,甚至危害人体健康,具有遗传毒性及致突变性,而极性组分的变化是检验煎炸油品质裂变的较为灵敏的方法。因此,在食用煎炸油产品的研发过程中,极性组分也被作为评价煎炸油深度煎炸寿命的主要标准。我国在2018.12.21废止了GB7102.1-2003食用植物油煎炸过程中的卫生标准,绝大多数国家对极性化合物的含量都有明确规定,分布在25%~27%之间,其中大部分国家都规定极性化合物不超过25%,只有极少数的欧洲国家如奥地利等国家规定极性化合物不超过27%。
现阶段常用的极性组分的检测方法为国标GB 5009.202-2016的柱层析法,该方法虽然检测结果精度较高,但是存在分析速度慢、耗时较多,仪器设备要求高,成本较高,费时费力等不足,同时无法实现快速、无损、无污染的检测。因此,国内外对油脂中极性组分的快速检测进行了较多的研究,主要包括介电常数法和光谱法等。介电常数法是根据食用油在煎炸过程中极性化合物含量增加,其导电性随之增强的原理,通过建立导电性和极性组分之间的关联实现对煎炸油中的极性物质含量的检测。该方法由于原理简单,容易实现,目前已有许多基于相关技术的极性组分快速检测仪产品面世,用于食用油品质的分析。但需要注意的是,电导法对极性组分的快速测量结果容易受到温度、离子强度及水分含量的影响使测量数值产生偏差。因此,需要通过对国标检测方法与电导法测量的极性组分数据进行对比分析,从而评价电导法的快速检测仪器的测量数据的准确性。
光谱检测方法如近红外光谱分析、中红外光谱分析、拉曼光谱分析等也逐渐应用到了食用油品质检测研究中,并取得了一定的研究成果,使得光谱技术在食用油品质检测领域的应用得到了肯定和发展。由于煎炸油羟基类、醛类和酮类等极性成分在各类光谱中都具有特征吸收峰,因此,包括红外光谱、拉曼光谱和太赫兹光谱在内的光谱检测技术都需要识别待检物质的特征吸收峰,通过建立食用油极性物质成分的大数据模型,从而实现对油脂极性组分的分析测定。该类方法由于可以实现取材少、快速、无损、在线和多组分同时检测,可以实现大数据共享,目前已快速发展成为一种应用于食品分析领域的新方法。但上述方法目前仍处于研究探索阶段,光谱法对极性组分的分析需要基于对单品种煎炸用油测定的极性组分数值进行建模和分析,而相关研究仍不完善,模型的通用性及稳定性未知,无法确认建立的模型是否能实现对油脂极性组分的准确分析测定。
发明内容
针对现有技术存在的不足,本发明的目的是提供一种针对煎炸油极性组分检测的模型通用性及稳定性验证方法。
为实现上述目的,本发明提供了如下技术方案:
一种针对煎炸油极性组分检测的模型通用性及稳定性验证方法,包括如下步骤:
S1,采用多种油样以相同的煎炸条件对相同的煎炸对象进行煎炸,以相同的采样条件进行样本采集;
S2.1,通过国标GB 5009.202-2016的柱层析法对步骤S1中的所有油样进行极性组分检测,获得检测结果,建立样本集;
S2.2,采用拉曼光谱技术获取步骤S1中所有采集到的样本的拉曼光谱;
S3,随机选取样本集中2/3~3/4份的样本作为建模集,剩余样本作为预测集;
S4,基于步骤S2.2中的拉曼光谱对样品极性组分采用多种算法进行定量分析,建立模型;
S5,将步骤S4中建立的模型与步骤S3中的建模集和预测集进行数据比对,根据相关系数和误差判断步骤S4中建立的所有模型稳定性和通用性优先级队列,完成验证。
优选地,还包括在对样品极性组分进行定量分析之前的预处理步骤:通过多种光谱预处理算法对步骤S2.2中的拉曼光谱进行预处理。
优选地,进行定量分析时采用的算法包括经典最小二乘回归法、偏最小二乘回归法、主成分回归分析法、逐步多元线性回归法、人工神经网络算法和支持向量机法中的多种算法。
优选地,所述拉曼光谱预处理算法包括多元散射校正、标准正态变换、卷积平滑和导数中的多种算法。
优选地,所述相同的煎炸条件为将油样加热到相同的油温后,以相同的煎炸频次以及相同的单次煎炸时长进行煎炸。
优选地,所述相同的采样条件为以相同的时间间隔获取油样,并当油样冷却至相同的温度时进行样本的采集,然后将所有的样本放入到相同的冷藏环境进行冷藏储存。
优选地,通过建模集样本建立校正模型,通过预测集样本对校正模型质量进行评估,通过如下公式评估模型质量:
其中,R2为相关系数;RMSEC为校正标准偏差;RMSEP为预测误差;yi,a为第i样本参考方法的测定值;为校正集所有样本参考方法测定值的平均值;yi,p预测过程中第i样本的预测值;n为校正集的样本数;m为验证集的样本数。
优选地,采用的油样包括大豆油、棉籽油、菜籽油以及棉籽油、大豆油、菜籽油和棕榈油调和而成的调和油。
优选地,所述调和油的配方重量份数为:棉籽油10份、大豆油5份、菜籽油3份、棕榈油2份。
优选地,所述油样样本的拉曼光谱采用激光共焦显微拉曼光谱仪,所述激光共焦显微拉曼光谱仪参数设置为:激光波长780nm、激光能量20Ev、光栅400lines/mm、光阑mm、分辨率47~87cm-1、扫描4次、采集曝光时间为5s。
综上所述,本发明的有益技术效果为:
本发明给出了一种针对煎炸油极性组分检测的模型通用性及稳定性验证方法,并通过具体的实验数据给出了本验证方法在检测模型稳定性和通用性时的准确性和可行性,并最终通过本验证方法给出了一种最优的建模方法,通过此建模方法建立的模型在进行极性组分检测时的准确性更高,能更准确的评价煎炸油的品质。
附图说明
图1是采用经典最小二乘回归法建模时无预处理情况下的极性组分计算值与标准值的关系图。
图2是采用经典最小二乘回归法建模时SNV预处理情况下的极性组分计算值与标准值的关系图。
图3是采用经典最小二乘回归法建模时MSC预处理情况下的极性组分计算值与标准值的关系图。
图4是采用经典最小二乘回归法建模时SG预处理情况下的极性组分计算值与标准值的关系图。
图5是采用经典最小二乘回归法建模时SG+SNV预处理情况下的极性组分计算值与标准值的关系图。
图6是采用经典最小二乘回归法建模时SG+一阶导数预处理情况下的极性组分计算值与标准值的关系图。
图7是采用经典最小二乘回归法建模时SG+SNV+一阶导数预处理情况下的极性组分计算值与标准值的关系图。
图8是采用经典最小二乘回归法建模时SG+MSC+一阶导数预处理情况下的极性组分计算值与标准值的关系图。
图9是采用经典最小二乘回归法建模时SG+二阶导数预处理情况下的极性组分计算值与标准值的关系图。
图10是采用经典最小二乘回归法建模时SG+SNV+二阶导数预处理情况下的极性组分计算值与标准值的关系图。
图11是采用经典最小二乘回归法建模时SG+MSC+二阶导数预处理情况下的极性组分计算值与标准值的关系图。
图12是采用偏最小二乘回归法建模时无预处理情况下的极性组分计算值与标准值的关系图。
图13是采用偏最小二乘回归法建模时SNV预处理情况下的极性组分计算值与标准值的关系图。
图14是采用偏最小二乘回归法建模时MSC预处理情况下的极性组分计算值与标准值的关系图。
图15是采用偏最小二乘回归法建模时SG预处理情况下的极性组分计算值与标准值的关系图。
图16是采用偏最小二乘回归法建模时SG+SNV预处理情况下的极性组分计算值与标准值的关系图。
图17是采用偏最小二乘回归法建模时SG+一阶导数预处理情况下的极性组分计算值与标准值的关系图。
图18是采用偏最小二乘回归法建模时SG+SNV+一阶导数预处理情况下的极性组分计算值与标准值的关系图。
图19是采用偏最小二乘回归法建模时SG+MSC+一阶导数预处理情况下的极性组分计算值与标准值的关系图。
图20是采用偏最小二乘回归法建模时SG+二阶导数预处理情况下的极性组分计算值与标准值的关系图。
图21是采用偏最小二乘回归法建模时SG+SNV+二阶导数预处理情况下的极性组分计算值与标准值的关系图。
图22是采用偏最小二乘回归法建模时SG+MSC+二阶导数预处理情况下的极性组分计算值与标准值的关系图。
图23是采用主成分回归法建模时无预处理情况下的极性组分计算值与标准值的关系图。
图24是采用主成分回归法建模时SNV预处理情况下的极性组分计算值与标准值的关系图。
图25是采用主成分回归法建模时MSC预处理情况下的极性组分计算值与标准值的关系图。
图26是采用主成分回归法建模时SG预处理情况下的极性组分计算值与标准值的关系图。
图27是采用主成分回归法建模时SG+SNV预处理情况下的极性组分计算值与标准值的关系图。
图28是采用主成分回归法建模时SG+一阶导数预处理情况下的极性组分计算值与标准值的关系图。
图29是采用主成分回归法建模时SG+SNV+一阶导数预处理情况下的极性组分计算值与标准值的关系图。
图30是采用主成分回归法建模时SG+MSC+一阶导数预处理情况下的极性组分计算值与标准值的关系图。
图31是采用主成分回归法建模时SG+二阶导数预处理情况下的极性组分计算值与标准值的关系图。
图32是采用主成分回归法建模时SG+SNV+二阶导数预处理情况下的极性组分计算值与标准值的关系图。
图33是采用主成分回归法建模时SG+MSC+二阶导数预处理情况下的极性组分计算值与标准值的关系图。
图34是采用多元线性回归法建模时无预处理情况下的极性组分计算值与标准值的关系图。
图35是采用多元线性回归法建模时SNV预处理情况下的极性组分计算值与标准值的关系图。
图36是采用多元线性回归法建模时MSC预处理情况下的极性组分计算值与标准值的关系图。
图37是采用多元线性回归法建模时SG预处理情况下的极性组分计算值与标准值的关系图。
图38是采用多元线性回归法建模时SG+SNV预处理情况下的极性组分计算值与标准值的关系图。
图39是采用多元线性回归法建模时SG+一阶导数预处理情况下的极性组分计算值与标准值的关系图。
图40是采用多元线性回归法建模时SG+SNV+一阶导数预处理情况下的极性组分计算值与标准值的关系图。
图41是采用多元线性回归法建模时SG+MSC+一阶导数预处理情况下的极性组分计算值与标准值的关系图。
图42是采用多元线性回归法建模时SG+二阶导数预处理情况下的极性组分计算值与标准值的关系图。
图43是采用多元线性回归法建模时SG+SNV+二阶导数预处理情况下的极性组分计算值与标准值的关系图。
图44是采用多元线性回归法建模时SG+MSC+二阶导数预处理情况下的极性组分计算值与标准值的关系图。
图45是本实施例中针对煎炸油极性组分检测的模型通用性及稳定性验证方法的流程图。
图中,纵坐标为模型的预测值(calculated)、横坐标为实测值(actual)、Calibration为建模集、validation为预测集、RMSEC表示均方根误差、RMSEP表示预测均方根误差、Corr.coreff.表示相关系数。
具体实施方式
以下结合附图对本发明作进一步详细说明。
参照图45所示,为本发明公开的一种针对煎炸油极性组分检测的模型通用性及稳定性验证方法,包括如下步骤:
首先调配83种油样以相同的煎炸条件对相同的煎炸对象进行煎炸,以相同的采样条件进行样本采集;其中:
83种油样均以棉籽油、大豆油、菜籽油和棕榈油作为原料制备的煎炸油,选用不同的油种搭配以及配比形成。
煎炸对象为速冻薯条。
相同的煎炸条件为将油样加热到相同的油温后,以相同的煎炸频次(如4次/小时)以及相同的单次煎炸时长(如4min)进行煎炸。
相同的采样条件为以相同的时间(如1小时或2小时)间隔获取油样,并当油样冷却至相同的温度(如室温或26℃)时进行样本的采集,然后将所有的样本放入到相同的冷藏环境下(如同样冷藏温度的冰柜)进行冷藏储存。
当样本采集完毕后,需要根据上述采集的所有样本建立样本集,建立样本集之后随机将其中的70份样本作为建模集,剩余的13份样本作为预测集。具体的:
1.通过国标GB 5009.202-2016的柱层析法对步骤S1中的所有油样进行极性组分检测,获得检测结果,建立样本集。
2.采用拉曼光谱技术获取样本集中所有采集到的样本的拉曼光谱。油样样本的拉曼光谱采用激光共焦显微拉曼光谱仪,激光共焦显微拉曼光谱仪参数设置为:激光波长780nm、激光能量20Ev、光栅400lines/mm、光阑mm、分辨率47~87cm-1、扫描4次、采集曝光时间为5s。
基于上述准备,通过获取的拉曼光谱对样品极性组分采用多种算法进行定量分析,建立模型。
将建立的模型与建模集和预测集进行数据比对,根据相关系数和误差对建立的所有模型稳定性和通用性优先级排队,最终完成验证。
为了节省验证的过程,在进行建模之前还可以通过多种光谱预处理算法对拉曼光谱进行预处理。
在本实施例中,进行定量分析时采用的算法包括经典最小二乘回归法、偏最小二乘回归法、主成分回归分析法、逐步多元线性回归法、人工神经网络算法和支持向量机法中的多种算法。在进行拉曼光谱预处理时采用了包括多元散射校正、标准正态变换、卷积平滑和导数中的多种算法。
通过建模集样本建立校正模型,通过预测集样本对校正模型质量进行评估,通过如下公式评估模型质量:
其中,R2为相关系数;RMSEC为校正标准偏差;RMSEP为预测误差;yi,a为第i样本参考方法的测定值;为校正集所有样本参考方法测定值的平均值;yi,p预测过程中第i样本的预测值;n为校正集的样本数;m为验证集的样本数。
在本实施例中给出了四种油样的实验数据,分别为以大豆油作为煎炸油进行煎炸试验获得的数据、以棉籽油作为煎炸油进行煎炸试验获得的数据、以菜籽油进行煎炸试验获得的数据、以棉籽油、大豆油、菜籽油和棕榈油调和而成的调和油进行煎炸试验获得的数据。其中调和油的配方重量份数为:棉籽油10份、大豆油5份、菜籽油3份、棕榈油2份。具体的相关样品煎炸时间及极性组分数据如表1所示(需要说明的是由于菜籽油煎炸后期会出现数据波动,准确的数据只能取到20%左右,考虑数据的准确性会影响建模,故极性组分的数据采集仅采集到20.33%,未继续进行后续采集):
表1
一、基于经典最小二乘法建立模型
实验建立了煎炸油中极性组分拉曼全谱经典最小二乘回归(CLS)法定量分析模型,选用卷积平滑(SG)平滑7个点、标准正态变换(SNV)、多元散射校正(MSC)、导数(包括:一阶导数、二阶导数)五种光谱预处理方法,组成了11种组合,对煎炸油光谱进行优化处理。
(1)无预处理
对拉曼光谱不进行预处理,均方根误差(RMSEC)为4.86,预测均方根误差(RMSEP)为4.74,建模集和预测集相关系数分别为0.1481和0.2642。误差较大,相关系数较小,无预处理时极性组分计算值与标准值的关系如图1所示,可以看到模型拟合结果较差,剔除了16个异常值,很多样本的真实值偏离了预测值,模型性能指标较差。
(2)标准正态变换(SNV)
对拉曼光谱进行标准正态变换(SNV)方法预处理,均方根误差(RMSEC)为3.15,预测均方根误差(RMSEP)为3.07,建模集和预测集相关系数分别为0.2154和0.1583。经过标准正态变换处理后,减少表面散射以及光程变化对漫反射光谱的影响,误差稍有减小,相关系数增大,SNV预处理时极性组分计算值与标准值的关系如图2所示,模型拟合结果较差,剔除了24个异常值,仍有很多样本的真实值偏离了预测值,模型性能指标较差。
(3)多元散射校正(MSC)
对拉曼光谱进行多元散射校正(MSC)方法预处理,均方根误差(RMSEC)为2.99,预测均方根误差(RMSEP)为2.38,建模集和预测集相关系数分别为0.8246和0.8404。经过多元散射校正处理后,有效地减少散射的影响,误差稍有减小,相关系数增大,MSC预处理时极性组分计算值与标准值的关系如图3所示,模型拟合结果较差,剔除了21个异常值,仍有很多样本的真实值偏离了预测值,模型性能指标较差。
(4)卷积平滑SG
对拉曼光谱进行卷积平滑(SG)法预处理,均方根误差(RMSEC)为4.83,预测均方根误差(RMSEP)为4.38,建模集和预测集相关系数分别为0.1689和0.2318。在实验中,卷积平滑可以起到滤除噪音信号的作用。但在经典最小二乘法建模时,平滑效果不明显,误差和相关系数变化不大,SG预处理时极性组分计算值与标准值的关系如图4所示,模型拟合结果较差,剔除了19个异常值,仍有很多样本的真实值偏离了预测值,模型性能指标较差。
(5)卷积平滑SG+标准正态变换(SNV)
对拉曼光谱进行卷积平滑(SG)法结合标准正态变换(SNV)法预处理,均方根误差(RMSEC)为3.71,预测均方根误差(RMSEP)为3.80,建模集和预测集相关系数分别为0.2329和0.1306。在实验中,该预处理方法减少了噪音信号的作用以及表面散射以及光程变化对漫反射光谱的影响。两种预处理方法相结合,平滑效果较好,误差减小,相关系数稍有增大,SG+SNV预处理时极性组分计算值与标准值的关系如图5所示,剔除了17个异常值,模型拟合结果较差,模型性能指标较差但稍有提升。
(6)卷积平滑SG+一阶导数
对拉曼光谱进行卷积平滑(SG)法结合一阶导数法预处理,均方根误差(RMSEC)为4.39,预测均方根误差(RMSEP)为4.61,建模集和预测集相关系数分别为0.1410和0.4567。在实验中,该预处理方法减少了噪音信号的作用,基线与其他背景的干扰,有效提高灵敏度和分辨率,但在经典最小二乘法建模时,效果不明显。两种预处理方法相结合,平滑效果较差,误差和相关系数无明显变化,SG+一阶导数预处理时极性组分计算值与标准值的关系如图6所示,模型拟合结果较差,在剔除了22个异常值后,仍有很多样本的真实值偏离了预测值,模型性能指标较差。
(7)卷积平滑SG+标准正态变换(SNV)+一阶导数
对拉曼光谱进行卷积平滑(SG)法结合标准正态变换(SNV)法以及一阶导数法预处理,均方根误差(RMSEC)为3.45,预测均方根误差(RMSEP)为3.73,建模集和预测集相关系数分别为0.3645和0.1776。在实验中,该预处理方法下,光谱的平滑性有所增加,降低噪音的干扰,表面散射以及光程变化对漫反射光谱的影响减少,基线与其他背景的干扰有所降低,有效提高灵敏度和分辨率。三种预处理方法相结合,平滑效果有多提升,误差减少,相关系数稍有增加,SG+SNV+一阶导数预处理时极性组分计算值与标准值的关系如图7所示,可以看到模型拟合结果较差,在剔除了18个异常值后,仍有很多样本的真实值偏离了预测值,模型性能指标较差。
(8)卷积平滑SG+多元散射校正(MSC)+一阶导数
对拉曼光谱进行卷积平滑(SG)法结合多元散射校正(MSC)法以及一阶导数法预处理,均方根误差(RMSEC)为2.36,预测均方根误差(RMSEP)为2.85,建模集和预测集相关系数分别为0.8955和0.6011。在实验中,该预处理方法下,很好地提高了光谱的平滑性,有效降低了噪音的干扰,表面散射以及光程变化对漫反射光谱的影响明显减少,消除基线与其他背景的干扰,有效提高灵敏度和分辨率。三种预处理方法相结合,平滑效果多有提升,误差减少,相关系数明显增加,SG+MSC+一阶导数预处理时极性组分计算值与标准值的关系如图8所示,可以看到模型拟合结果相对较好,在剔除了10个异常值后,样本的真实值与预测值较吻合,模型性能指标相对较好。
(9)卷积平滑SG+二阶导数
对拉曼光谱进行卷积平滑(SG)法结合二阶导数法预处理,均方根误差(RMSEC)为4.79,预测均方根误差(RMSEP)为5.51,建模集和预测集相关系数分别为0.2009和0.6553。在实验中,该预处理方法下,光谱的平滑性增加效果不明显,噪音的干扰没有明显降低,表面散射以及光程变化对漫反射光谱的影响无明显减少,没有消除基线与其他背景的干扰,有效提高灵敏度和分辨率。两种预处理方法相结合,误差减少和相关系数没有明显变化,SG+二阶导数预处理时极性组分计算值与标准值的关系如图9所示,可以看到模型拟合结果较差,剔除了15个异常值,仍有很多样本的真实值偏离了预测值,模型性能指标相对较差。
(10)卷积平滑SG+标准正态变换(SNV)+二阶导数
对拉曼光谱进行卷积平滑(SG)法结合标准正态变换(SNV)以及二阶导数法预处理,均方根误差(RMSEC)为3.87,预测均方根误差(RMSEP)为3.95,建模集和预测集相关系数分别为0.4318和0.4465。在实验中,该预处理方法下,和前一种预处理方法相比,光谱的平滑性有所提高,噪音受到的干扰有所降低,表面散射以及光程变化对漫反射光谱的影响也稍有减少,减少了基线与其他背景的干扰。两种预处理方法相结合,误差减少,相关系数有所提升,但是仍在50%以下,SG+二阶导数预处理时极性组分计算值与标准值的关系如图10所示,可以看到模型拟合结果有所提高,剔除了12个异常值,仍有很多样本的真实值偏离了预测值,模型性能指标较差。
(11)卷积平滑SG+多元散射校正(MSC)+二阶导数
对拉曼光谱进行卷积平滑(SG)法结合多元散射校正(MSC)以及二阶导数法预处理,均方根误差(RMSEC)为2.38,预测均方根误差(RMSEP)为3.04,建模集和预测集相关系数分别为0.8942和0.5859。在实验中,该预处理方法下,光谱的平滑性有所提高,噪音受到的干扰有所降低,表面散射以及光程变化对漫反射光谱的影响也有明显减少,减少了基线与其他背景的干扰,有效提高了灵敏度和分辨率。两种预处理方法相结合,误差减少,相关系数有所提升,SG+MSC+二阶导数预处理时极性组分计算值与标准值的关系如图11所示,可以看到模型拟合较好,在剔除了10个异常值后,少量样本的真实值偏离了预测值,模型性能指标相对较好。
上述11种建模结果见表2。
表2
从建模结果可以看出,光谱预处理结合经典最小二乘回归法对煎炸油的拉曼光谱进行处理后,模型各参数有了不同程度的变化,其中卷积平滑SG法结合多元散射校正(MSC)以及一阶导数的预处理和卷积平滑SG法结合多元散射校正(MSC)以及二阶导数的预处理方法处理后,建模效果最佳,两种方法均剔除了10个异常值。其中SG+MSC+一阶导数法预处理后,方均根误差(RMSEC)为2.36,预测方均根误差(RMSEP)为2.85,建模集相关系数为0.8955,预测集相关系数为0.6011;SG+MSC+二阶导数法预处理后,方均根误差(RMSEC)为2.38,预测方均根误差(RMSEP)为3.04,建模集相关系数为0.8942,预测集相关系数为0.5859。这是由于样品间的散射现象对基线的便宜影响得到了有效减弱,进而提高了原吸光度光谱的信噪比,使得模型性能指标参数有所提高。
二、基于偏最小二乘回归法建立模型
实验建立了煎炸油中极性组分拉曼全谱偏最小二乘回归(PLS)法定量分析模型,选用卷积平滑(SG)平滑7个点、标准正态变换(SNV)、多元散射校正(MSC)、导数(包括:一阶导数、二阶导数)五种光谱预处理方法,组成了11种组合,对煎炸油光谱进行处理。
(1)无预处理:
对拉曼光谱不进行预处理,均方根误差(RMSEC)为1.76,预测均方根误差(RMSEP)为2.02,建模集和预测集相关系数分别为0.9154和0.8449,均在80%以上,相关度较高。无预处理时极性组分计算值与标准值的关系如图12所示,在剔除了6个异常值后,部分样本的真实值偏离了预测值。
(2)标准正态变换(SNV):
对拉曼光谱进行标准正态变换(SNV)方法预处理,均方根误差(RMSEC)为1.54,预测均方根误差(RMSEP)为1.79,建模集和预测集相关系数分别为0.9350和0.8728。经过标准正态变换处理后,减少了表面散射以及光程变化对漫反射光谱的影响,误差稍有减小,相关系数略有增大,SNV预处理时极性组分计算值与标准值的关系如图13所示,模型拟合结果相对无预处理时较好,剔除了8个异常值,只有部分样本的真实值偏离预测值,模型性能指标较好。
(3)多元散射校正(MSC):
对拉曼光谱进行多元散射校正(MSC)方法预处理,均方根误差(RMSEC)为1.45,预测均方根误差(RMSEP)为1.91,建模集和预测集相关系数分别为0.9415和0.8674经过多元散射校正处理后,相比预处理,误差增大,相关系数稍有减少,该方法不适于该模型的优化,MSC预处理时极性组分计算值与标准值的关系如图14所示,模型拟合结果相对无预处理时较差,在剔除了6个异常值后,部分样本的真实值偏离预测值,模型性能指标相对无预处理时较差。
(4)卷积平滑SG:
对拉曼光谱进行卷积平滑(SG)法预处理,均方根误差(RMSEC)为1.57,预测均方根误差(RMSEP)为2.13,建模集和预测集相关系数分别为0.9308和0.8344。在实验中,卷积平滑可以起到滤除噪音信号的作用。平滑效果不明显,误差和相关系数变化不大,SG预处理时极性组分计算值与标准值的关系如图15所示,模型拟合结果较差,在剔除了7个异常值后,部分样本的真实值偏离预测值,模型性能指标相对无预处理时无明显变化。
(5)卷积平滑SG+标准正态变换(SNV):
对拉曼光谱进行卷积平滑(SG)法结合标准正态变换(SNV)法预处理,均方根误差(RMSEC)为0.673,预测均方根误差(RMSEP)为1.49,建模集和预测集相关系数分别为0.9894和0.9323。在实验中,该预处理方法减少了噪音信号的作用以及表面散射以及光程变化对漫反射光谱的影响。两种预处理方法相结合,平滑效果较好,误差减小,相关系数稍有增大,SG+SNV预处理时极性组分计算值与标准值的关系如图16所示,只剔除了6个异常值,模型拟合结果较好。
(6)卷积平滑SG+一阶导数:
对拉曼光谱进行卷积平滑(SG)法结合一阶导数法预处理,均方根误差(RMSEC)为0.169,预测均方根误差(RMSEP)为2.75,建模集和预测集相关系数分别为0.9993和0.3704。在实验中,该预处理方法减少了噪音信号的作用,基线与其他背景的干扰,有效提高灵敏度和分辨率,但在偏最小二乘法建模时,预测集误差增大,相关系数减少,SG+一阶导数预处理时极性组分计算值与标准值的关系如图17所示,模型拟合结果较差,在剔除了少量异常值后,仍有很多样本的真实值偏离了预测值,虽然建模集相关指标有所提升,但时预测集相关指标较差,在剔除了8个异常值后,此时模型性能指标较差。
(7)卷积平滑SG+标准正态变换(SNV)+一阶导数:
对拉曼光谱进行卷积平滑(SG)法结合标准正态变换(SNV)法以及一阶导数法预处理,均方根误差(RMSEC)为0.535,预测均方根误差(RMSEP)为2.82,建模集和预测集相关系数分别为0.9949和0.4290。在实验中,该预处理方法下,光谱的平滑性有所增加,降低噪音的干扰,表面散射以及光程变化对漫反射光谱的影响减少,基线与其他背景的干扰有所降低,有效提高灵敏度和分辨率。三种预处理方法相结合,平滑效果有多提升,误差减少,相关系数稍有增加,SG+SNV+一阶导数预处理时极性组分计算值与标准值的关系如图18所示,可以看到模型拟合结果较差,在剔除了6个异常值后,仍有很多样本的真实值偏离了预测值,模型性能指标较差。
(8)卷积平滑SG+多元散射校正(MSC)+一阶导数:
对拉曼光谱进行卷积平滑(SG)法结合多元散射校正(MSC)法以及一阶导数法预处理,均方根误差(RMSEC)为1.20,预测均方根误差(RMSEP)为2.87,建模集和预测集相关系数分别为0.9669和0.4488。在实验中,结合偏最小二乘回归法建立模型,在该预处理方法下,误差增加,相关系数明显降低,SG+MSC+一阶导数预处理时极性组分计算值与标准值的关系如图19所示,可以看到模型拟合结果相对较差,在剔除了10个异常值,样本的真实值与预测值有一定偏差,模型性能指标相对较差。
(9)卷积平滑SG+二阶导数:
对拉曼光谱进行卷积平滑(SG)法结合二阶导数法预处理,均方根误差(RMSEC)为0.678,预测均方根误差(RMSEP)为0.9910,建模集和预测集相关系数分别为3.00和0.5599。在实验中,该预处理方法下,预测均方根误差明显增大,预测集的相关系数减小至60%以下,SG+二阶导数预处理时极性组分计算值与标准值的关系如图20所示,可以看到模型拟合结果较好,在剔除了9个异常值后,仍部分样本的真实值偏离了预测值,但由于预测集偏差较大,模型性能指标相对较差。
(10)卷积平滑SG+标准正态变换(SNV)+二阶导数:
对拉曼光谱进行卷积平滑(SG)法结合标准正态变换(SNV)以及二阶导数法预处理,均方根误差(RMSEC)为0.515,预测均方根误差(RMSEP)为2.79,建模集和预测集相关系数分别为0.9953和0.4951。在实验中,该预处理方法下,均方根误差减少,建模集相关系数有所提升,预测均方根误差增加,预测集相关系数减少至50%以下,SG+SNV+二阶导数预处理时极性组分计算值与标准值的关系如图21所示,可以看到模型建模集拟合结果较好,预测集拟合结果偏差较大,在剔除了6个异常值后,仍有很多预测集样本的极性组分偏离较大,模型性能指标较差。
(11)卷积平滑SG+多元散射校正(MSC)+二阶导数:
对拉曼光谱进行卷积平滑(SG)法结合多元散射校正(MSC)以及二阶导数法预处理,均方根误差(RMSEC)为0.526,预测均方根误差(RMSEP)为2.76,建模集和预测集相关系数分别为0.9951和0.5035。在实验中,该预处理方法下,均方根误差减少,建模集相关系数有所提升,但预测均方根误差增大,且预测集相关系数减小,SG+MSC+二阶导数预处理时极性组分计算值与标准值的关系如图22所示,可以看到模型拟合较好,在剔除了6个异常值后,仍有部分建模集样本的真实值偏离了预测值,因此模型性能指标相对较差。
上述建模结果见表3。
表3
从建模结果可以看出,光谱预处理结合偏最小二乘回归法对煎炸油的拉曼光谱进行处理后,模型各参数有了不同程度的变化,其中无预处理和标准正态变换(SNV)法对光谱进行优化的效果最佳。无预处理时方均根误差为0.836,建模集相关系数为0.9875,预计均方根误差为1.33,预测集相关系数为0.9582,忽略了6个异常值,建模效果较好,实验中测得光谱较准确,受外界因素干扰不大;标准正态变换(SNV)法预处理时,方均根误差为0.919,建模集相关系数为0.9801,预计均方根误差为1.18,预测集相关系数为0.9404,忽略了6个异常值,此时减少了表面散射以及光程变化对漫反射光谱的影响,模型的性能指标参数稍有改善。以上两种预处理方法误差较小,相关系数达90%以上,剔除的异常点数低于样品总数的10%,预处理方法配合建模方法是可行的。
三、基于主成分回归法建立模型
(1)无预处理:
对拉曼光谱不进行预处理,均方根误差(RMSEC)为1.76,预测均方根误差(RMSEP)为2.02,建模集和预测集相关系数分别为0.9154和0.8449。误差较大,相关系数较高,剔除了8个异常值,无预处理时极性组分计算值与标准值的关系如图23所示,可以看到模型拟合结果较差,很多样本的真实值偏离了预测值。
(2)标准正态变换(SNV):
对拉曼光谱进行标准正态变换(SNV)方法预处理,均方根误差(RMSEC)为1.54,预测均方根误差(RMSEP)为1.79,建模集和预测集相关系数分别为0.9350和0.8728。经过标准正态变换处理后,减少表面散射以及光程变化对漫反射光谱的影响,误差稍有减小,相关系数增大,SNV预处理时极性组分计算值与标准值的关系如图24所示,在剔除了11个异常值后,模型拟合结果相对无预处理时较好,模型性能指标有所提升。
(3)多元散射校正(MSC):
对拉曼光谱进行多元散射校正(MSC)方法预处理,均方根误差(RMSEC)为1.45,预测均方根误差(RMSEP)为1.91,建模集和预测集相关系数分别为0.9415和0.8674。经过多元散射校正处理后,有效地减少散射的影响,误差稍有减小,相关系数增大,MSC预处理时极性组分计算值与标准值的关系如图25所示,在剔除了11个异常值后,模型拟合结果相对无预处理时较好,模型性能指标有所提升。
(4)卷积平滑SG:
对拉曼光谱进行卷积平滑(SG)法预处理,均方根误差(RMSEC)为1.57,预测均方根误差(RMSEP)为2.13,建模集和预测集相关系数分别为0.9308和0.8344。在实验中,卷积平滑可以起到滤除噪音信号的作用。但在主成分回归法建模时,预测集误差增大,相关系数减小,SG预处理时极性组分计算值与标准值的关系如图26所示,模型拟合结果较差,在剔除了10个异常值后,仍有很多样本的真实值偏离了预测值,模型性能指标下降。
(5)卷积平滑SG+标准正态变换(SNV):
对拉曼光谱进行卷积平滑(SG)法结合标准正态变换(SNV)法预处理,均方根误差(RMSEC)为1.42,预测均方根误差(RMSEP)为1.84,建模集和预测集相关系数分别为0.9438和0.8699。在实验中,该预处理方法减少了噪音信号的作用以及表面散射以及光程变化对漫反射光谱的影响。两种预处理方法相结合,误差减小,相关系数稍有增大,SG+SNV预处理时极性组分计算值与标准值的关系如图27所示,剔除了11个异常值,模型拟合结果稍有提升。
(6)卷积平滑SG+一阶导数:
对拉曼光谱进行卷积平滑(SG)法结合一阶导数法预处理,均方根误差(RMSEC)为2.68,预测均方根误差(RMSEP)为3.39,建模集和预测集相关系数分别为0.7637和0.2856。在实验中,两种预处理方法相结合,平滑效果较差,误差和相关系数无明显改善,SG+一阶导数预处理时极性组分计算值与标准值的关系如图28所示,模型拟合结果很差,在剔除了17个异常值后,仍有很多样本的真实值偏离了预测值,模型性能指标降低。
(7)卷积平滑SG+标准正态变换(SNV)+一阶导数:
对拉曼光谱进行卷积平滑(SG)法结合标准正态变换(SNV)法以及一阶导数法预处理,均方根误差(RMSEC)为2.75,预测均方根误差(RMSEP)为3.38,建模集和预测集相关系数分别为0.7680和0.2838。在实验中,三种预处理方法相结合,误差和相关系数无明显改善,SG+SNV+一阶导数预处理时极性组分计算值与标准值的关系如图29所示,可以看到模型拟合结果很差,在剔除了16个异常值后,仍有很多样本的真实值偏离了预测值,模型性能指标降低。
(8)卷积平滑SG+多元散射校正(MSC)+一阶导数:
对拉曼光谱进行卷积平滑(SG)法结合多元散射校正(MSC)法以及一阶导数法预处理,均方根误差(RMSEC)为2.70,预测均方根误差(RMSEP)为2.62,建模集和预测集相关系数分别为0.8408和0.1008。在实验中,该预处理方法下,误差增大,预测集相关系数明显减少,SG+MSC+一阶导数预处理时极性组分计算值与标准值的关系如图30所示,可以看到模型拟合结果相对较差,在剔除了18个异常值后,仍有很多样本的真实值与预测值有较大偏差,模型性能指标降低。
(9)卷积平滑SG+二阶导数:
对拉曼光谱进行卷积平滑(SG)法结合二阶导数法预处理,均方根误差(RMSEC)为2.80,预测均方根误差(RMSEP)为3.04,建模集和预测集相关系数分别为0.7505和0.4193。两种预处理方法相结合,误差和相关系数没有明显变化,SG+二阶导数预处理时极性组分计算值与标准值的关系如图31所示,可以看到模型拟合结果较差,在剔除了17个异常值后,仍有很多样本的真实值明显偏离了预测值,模型性能指标下降。
(10)卷积平滑SG+标准正态变换(SNV)+二阶导数:
对拉曼光谱进行卷积平滑(SG)法结合标准正态变换(SNV)以及二阶导数法预处理,均方根误差(RMSEC)为2.66,预测均方根误差(RMSEP)为3.39,建模集和预测集相关系数分别为0.7858和0.2946。该预处理方法下,误差增大,相关系数降低,SG+二阶导数预处理时极性组分计算值与标准值的关系如图32所示,可以看到模型拟合结果较差,在剔除了16个异常值后,仍有很多样本的真实值偏离了预测值,模型性能指标相对降低。
(11)卷积平滑SG+多元散射校正(MSC)+二阶导数:
对拉曼光谱进行卷积平滑(SG)法结合多元散射校正(MSC)以及二阶导数法预处理,均方根误差(RMSEC)为2.78,预测均方根误差(RMSEP)为2.89,建模集和预测集相关系数分别为0.7330和0.2041。三种预处理方法相结合,预测集相关系数明显下降至20%,SG+MSC+二阶导数预处理时极性组分计算值与标准值的关系如图33所示,可以看到模型拟合很差,在剔除了18个异常值后,仍有很多样本的真实值偏离了预测值,模型性能指标明显降低。
上述建模结果见表4。
表4
从建模结果可以看出,光谱预处理结合主成分回归法对煎炸油的拉曼光谱进行处理后,模型各参数有了不同程度的变化,其中标准正态变换(SNV)和多元散射校正(MSC)两种方法预处理后建模效果最好。标准正态变换(SNV)预处理后,方均根误差(RMSEC)为1.54,预测方均根误差(RMSEP)为1.79,建模集相关系数为0.935,预测集相关系数为0.8728;多元散射校正(MSC)预处理后,方均根误差(RMSEC)为1.45,预测方均根误差(RMSEP)为1.91,建模集相关系数为0.9415,预测集相关系数为0.8674。这是由于样品间的散射现象对基线的偏移影响得到了有效减弱,进而提高了原吸光度光谱的信噪比,使得模型性能指标参数有所提高。此时,误差较大,大于1,剔除的异常值较多,模型的准确率较低,此方法建模效果较差。
四、基于多元线性回归法建立模型
(1)无预处理:
对拉曼光谱不进行预处理,均方根误差(RMSEC)为2.93,预测均方根误差(RMSEP)为2.58,建模集和预测集相关系数分别为0.8052和0.8127。误差较大,相关系数较高,无预处理时极性组分计算值与标准值的关系如图34所示,剔除了17个异常值,可以看到模型拟合结果较差,很多样本的真实值偏离了预测值。
(2)标准正态变换(SNV):
对拉曼光谱进行标准正态变换(SNV)方法预处理,均方根误差(RMSEC)为2.50,预测均方根误差(RMSEP)为2.74,建模集和预测集相关系数分别为0.8296和0.7913。经过标准正态变换处理后,SNV预处理时极性组分计算值与标准值的关系如图35所示,可以看到在剔除了14个异常值后,模型拟合结果相对无预处理时无明显改善,模型性能指标无明显提升。
(3)多元散射校正(MSC):
对拉曼光谱进行多元散射校正(MSC)方法预处理,均方根误差(RMSEC)为2.30,预测均方根误差(RMSEP)为1.98,建模集和预测集相关系数分别为0.8294和0.8557。经过多元散射校正处理后,有效地减少散射的影响,误差稍有减小,相关系数增大,MSC预处理时极性组分计算值与标准值的关系如图36所示,在剔除了12个异常值后,模型拟合结果相对无预处理时较好,模型性能指标有所提升。
(4)卷积平滑SG:
对拉曼光谱进行卷积平滑(SG)法预处理,均方根误差(RMSEC)为2.99,预测均方根误差(RMSEP)为2.58,建模集和预测集相关系数分别为0.8069和0.7745。SG预处理时极性组分计算值与标准值的关系如图37所示,模型拟合结果较差,在剔除了18个异常值后,仍有很多样本的真实值偏离了预测值,模型性能指标下降。
(5)卷积平滑SG+标准正态变换(SNV):
对拉曼光谱进行卷积平滑(SG)法结合标准正态变换(SNV)法预处理,均方根误差(RMSEC)为2.50,预测均方根误差(RMSEP)为3.12,建模集和预测集相关系数分别为0.8225和0.7459。两种预处理方法相结合,预测集误差增大,SG+SNV预处理时极性组分计算值与标准值的关系如图38所示,实验中剔除了15个异常值,模型拟合结果下降。
(6)卷积平滑SG+一阶导数:
对拉曼光谱进行卷积平滑(SG)法结合一阶导数法预处理,均方根误差(RMSEC)为3.82,预测均方根误差(RMSEP)为4.33,建模集和预测集相关系数分别为0.6386和0.1677。两种预处理方法相结合,误差增大,相关系数明显减少,SG+一阶导数预处理时极性组分计算值与标准值的关系如图39所示,在剔除了20个异常值后,仍有很多样本的真实值明显偏离预测值,模型性能指标降低。
(7)卷积平滑SG+标准正态变换(SNV)+一阶导数:
对拉曼光谱进行卷积平滑(SG)法结合标准正态变换(SNV)法以及一阶导数法预处理,均方根误差(RMSEC)为3.06,预测均方根误差(RMSEP)为3.22,建模集和预测集相关系数分别为0.8017和0.7107。三种预处理方法相结合,SG+SNV+一阶导数预处理时极性组分计算值与标准值的关系如图40所示,可以看到模型拟合结果很差,在剔除了15个异常值后,仍有很多样本的真实值严重偏离了预测值,此时模型性能指标降低。
(8)卷积平滑SG+多元散射校正(MSC)+一阶导数:
对拉曼光谱进行卷积平滑(SG)法结合多元散射校正(MSC)法以及一阶导数法预处理,均方根误差(RMSEC)为2.75,预测均方根误差(RMSEP)为1.95,建模集和预测集相关系数分别为0.7677和0.8203。该预处理方法下,建模集误差增大,相关系数减少,SG+MSC+一阶导数预处理时极性组分计算值与标准值的关系如图41所示,可以看到模型拟合结果相对较差,在剔除了15个异常值后,仍有很多样本的真实值与预测值有较大偏差,模型性能指标降低。
(9)卷积平滑SG+二阶导数:
对拉曼光谱进行卷积平滑(SG)法结合二阶导数法预处理,均方根误差(RMSEC)为3.91,预测均方根误差(RMSEP)为3.95,建模集和预测集相关系数分别为0.5877和0.3119。两种预处理方法相结合,误差显著增加,相关系数降低至50%以下,SG+二阶导数预处理时极性组分计算值与标准值的关系如图42所示,可以看到模型拟合结果较差,在剔除了20个异常值后,仍有很多样本的真实值明显偏离了预测值,模型性能指标下降。
(10)卷积平滑SG+标准正态变换(SNV)+二阶导数:
对拉曼光谱进行卷积平滑(SG)法结合标准正态变换(SNV)以及二阶导数法预处理,均方根误差(RMSEC)为3.50,预测均方根误差(RMSEP)为3.54,建模集和预测集相关系数分别为0.4456和0.1010。该预处理方法下,预测集相关系数过低,SG+二阶导数预处理时极性组分计算值与标准值的关系如图43所示,可以看到模型拟合结果很差,在剔除了18个异常值后,仍有很多样本的真实值偏离了预测值,模型性能指标偏低。
(11)卷积平滑SG+多元散射校正(MSC)+二阶导数:
对拉曼光谱进行卷积平滑(SG)法结合多元散射校正(MSC)以及二阶导数法预处理,均方根误差(RMSEC)为2.61,预测均方根误差(RMSEP)为2.70,建模集和预测集相关系数分别为0.7834和0.6264。三种预处理方法相结合,相关系数稍有下降,SG+MSC+二阶导数预处理时极性组分计算值与标准值的关系如图44所示,可以看到模型拟合较差,在剔除了16个异常值后,仍有很多样本的真实值偏离了预测值,模型性能指标明显降低。
上述建模结果见表5。
表5
从建模结果可以看出,光谱预处理结合逐步多元线性回归法对煎炸油的拉曼光谱进行处理后,模型各参数有了不同程度的变化,其中多元散射校正(MSC)预处理后,建模效果最佳,剔除了12个异常值,方均根误差(RMSEC)为2.3,预测方均根误差(RMSEP)为1.98,建模集相关系数为0.8294,预测集相关系数为0.8557。这是由于使用多元散射校正的预处理方法在数据处理时,有效的消除了散射现象的影响,修正了光谱间的基线漂移和偏移现象,进而加强了光谱的接收信息,使得模型性能指标参数有所提高。
最后,从本实施例中通过拉曼光谱技术对煎炸油的极性组分的定量分析建模中选出了几种建模效果相对较好的结果,参见表6。
表6
可以看出,在数据处理中使用多种光谱预处理方法组合,对光谱进行优化,其中多元散射校正(MSC)和标准正态变换(SNV)预处理方法都能够有效改善模型的参数以及建模的效果,减小误差,增大相关系数,由于煎炸油在煎炸过程中产生了少量颗粒杂质和沉淀,在采集光谱时需要摇匀,产生了少量气泡,在测量过程中受到了外界因素影响以及气泡干扰,经过预处理,有效消除了光谱受外界影响产生的噪声。因此在进行分析时,选择适当的光谱预处理方法对建模结果影响极大。在建模过程中需不断进行反复调试,通过相关系数和误差展现出来的结果选择正确的预处理方法对模型进行优化,直到模型通用性以及稳定性为最佳,从而完成验证。
在建立模型时,应用经典最小二乘回归(CLS)、偏最小二乘回归(PLS)、主成分回归(PCR)和多元线性回归(SMLR)四种算法,对比后发现,偏最小二乘回归法的建模效果更好,其它三种算法建立模型的建模集和预测集误差较大,相关系数不稳定,且剔除的异常点数均超过样品总数的10%,模型不稳定。虽然可以通过提剔除样本提高模型的相关系数和稳定性,且此时模型看起来误差减小,但是由于剔除了大量样本,模型失真,因此在模型优化过程中要适度。
通过多种预处理方法对煎炸油的拉曼光谱进行降噪,并且对结果进行对比,虽然预处理能够起到降噪、平滑、改善信噪比等作用,但是有些预处理方法会对建模效果产生不好的影响。应用CLS、PLS、PCR和SMLR方法都能对煎炸油的极性组分进行分析建模,但是效果也有好坏之分。因此模型精度与预处理方法和建模算法的选择有关,要想将建立的模型投入到实际应用中,就务必保证在模型不失真的条件下找到最合适的方法优化模型,直至达到最佳效果,这样就能利用采集好的拉曼光谱直接进行模型分析,量测出极性组分的含量,从而分析煎炸油的品质。
本实施例给出了一种模型验证方法,并通过具体的实验数据给出了本验证方法在检测模型稳定性和通用性时的准确性和可行性,并最终通过本验证方法给出了一种最优的建模方法,通过此建模方法建立的模型在进行极性组分检测时的准确性更高,能更准确的评价煎炸油的品质。
本具体实施方式的实施例均为本发明的较佳实施例,并非依此限制本发明的保护范围,故:凡依本发明的结构、形状、原理所做的等效变化,均应涵盖于本发明的保护范围之内。
Claims (10)
1.一种针对煎炸油极性组分检测的模型通用性及稳定性验证方法,其特征在于,包括如下步骤:
S1,采用多种油样以相同的煎炸条件对相同的煎炸对象进行煎炸,以相同的采样条件进行样本采集;
S2.1,通过国标GB 5009.202-2016的柱层析法对步骤S1中的所有油样进行极性组分检测,获得检测结果,建立样本集;
S2.2,采用拉曼光谱技术获取步骤S1中所有采集到的样本的拉曼光谱;
S3,随机选取样本集中2/3~3/4份的样本作为建模集,剩余样本作为预测集;
S4,基于步骤S2.2中的拉曼光谱对样品极性组分采用多种算法进行定量分析,建立模型;
S5,将步骤S4中建立的模型与步骤S3中的建模集和预测集进行数据比对,根据相关系数和误差判断步骤S4中建立的所有模型稳定性和通用性优先级队列,完成验证。
2.根据权利要求1所述的针对煎炸油极性组分检测的模型通用性及稳定性验证方法,其特征在于,还包括在对样品极性组分进行定量分析之前的预处理步骤:通过多种光谱预处理算法对步骤S2.2中的拉曼光谱进行预处理。
3.根据权利要求1或2所述的针对煎炸油极性组分检测的模型通用性及稳定性验证方法,其特征在于,进行定量分析时采用的算法包括经典最小二乘回归法、偏最小二乘回归法、主成分回归分析法、逐步多元线性回归法、人工神经网络算法和支持向量机法中的多种算法。
4.根据权利要求2所述的针对煎炸油极性组分检测的模型通用性及稳定性验证方法,其特征在于,所述拉曼光谱预处理算法包括多元散射校正、标准正态变换、卷积平滑和导数中的多种算法。
5.根据权利要求1或2所述的针对煎炸油极性组分检测的模型通用性及稳定性验证方法,所述相同的煎炸条件为将油样加热到相同的油温后,以相同的煎炸频次以及相同的单次煎炸时长进行煎炸。
6.根据权利要求1或2所述的针对煎炸油极性组分检测的模型通用性及稳定性验证方法,其特征在于,所述相同的采样条件为以相同的时间间隔获取油样,并当油样冷却至相同的温度时进行样本的采集,然后将所有的样本放入到相同的冷藏环境进行冷藏储存。
8.根据权利要求1或2所述的针对煎炸油极性组分检测的模型通用性及稳定性验证方法,其特征在于,采用的油样包括大豆油、棉籽油、菜籽油以及棉籽油、大豆油、菜籽油和棕榈油调和而成的调和油。
9.根据权利要求8所述的针对煎炸油极性组分检测的模型通用性及稳定性验证方法,其特征在于,所述调和油的配方重量份数为:棉籽油10份、大豆油5份、菜籽油3份、棕榈油2份。
10.根据权利要求1或2所述的针对煎炸油极性组分检测的模型通用性及稳定性验证方法,其特征在于,所述油样样本的拉曼光谱采用激光共焦显微拉曼光谱仪,所述激光共焦显微拉曼光谱仪参数设置为:激光波长780nm、激光能量20Ev、光栅400lines/mm、光阑mm、分辨率47~87cm-1、扫描4次、采集曝光时间为5s。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910912531.0A CN110672578A (zh) | 2019-09-25 | 2019-09-25 | 针对煎炸油极性组分检测的模型通用性及稳定性验证方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910912531.0A CN110672578A (zh) | 2019-09-25 | 2019-09-25 | 针对煎炸油极性组分检测的模型通用性及稳定性验证方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110672578A true CN110672578A (zh) | 2020-01-10 |
Family
ID=69078972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910912531.0A Pending CN110672578A (zh) | 2019-09-25 | 2019-09-25 | 针对煎炸油极性组分检测的模型通用性及稳定性验证方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110672578A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111103259A (zh) * | 2020-02-13 | 2020-05-05 | 北京工商大学 | 基于光谱技术的煎炸油品质快速检测方法 |
CN111141723A (zh) * | 2020-03-03 | 2020-05-12 | 江南大学 | 一种基于拉曼光谱结合人工神经网络预测油脂中单环氧脂肪酸含量的方法 |
CN111208241A (zh) * | 2020-03-03 | 2020-05-29 | 江南大学 | 一种基于电子鼻结合人工神经网络预测煎炸油品质的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103217411A (zh) * | 2013-04-15 | 2013-07-24 | 浙江大学 | 基于拉曼光谱的食用植物油中油酸、亚油酸和饱和脂肪酸含量检测方法 |
CN104730058A (zh) * | 2015-03-09 | 2015-06-24 | 深圳市疾病预防控制中心 | 一种基于拉曼光谱鉴别地沟油的判别分析方法 |
CN106338503A (zh) * | 2016-08-30 | 2017-01-18 | 广西科技大学 | 植物油的过氧化值快速检测方法 |
CN108845045A (zh) * | 2018-05-03 | 2018-11-20 | 北京工商大学 | 一种气相指纹图谱结合主成分分析方法判别炸油质量的方法 |
CN109557227A (zh) * | 2018-12-04 | 2019-04-02 | 北京工商大学 | 一种基于多项式拟合结合理化指标预测煎炸油质量的方法 |
-
2019
- 2019-09-25 CN CN201910912531.0A patent/CN110672578A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103217411A (zh) * | 2013-04-15 | 2013-07-24 | 浙江大学 | 基于拉曼光谱的食用植物油中油酸、亚油酸和饱和脂肪酸含量检测方法 |
CN104730058A (zh) * | 2015-03-09 | 2015-06-24 | 深圳市疾病预防控制中心 | 一种基于拉曼光谱鉴别地沟油的判别分析方法 |
CN106338503A (zh) * | 2016-08-30 | 2017-01-18 | 广西科技大学 | 植物油的过氧化值快速检测方法 |
CN108845045A (zh) * | 2018-05-03 | 2018-11-20 | 北京工商大学 | 一种气相指纹图谱结合主成分分析方法判别炸油质量的方法 |
CN109557227A (zh) * | 2018-12-04 | 2019-04-02 | 北京工商大学 | 一种基于多项式拟合结合理化指标预测煎炸油质量的方法 |
Non-Patent Citations (1)
Title |
---|
刘翠玲: "新型专用煎炸油极性组分的光谱分析技术研究", 《食品科技》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111103259A (zh) * | 2020-02-13 | 2020-05-05 | 北京工商大学 | 基于光谱技术的煎炸油品质快速检测方法 |
CN111141723A (zh) * | 2020-03-03 | 2020-05-12 | 江南大学 | 一种基于拉曼光谱结合人工神经网络预测油脂中单环氧脂肪酸含量的方法 |
CN111208241A (zh) * | 2020-03-03 | 2020-05-29 | 江南大学 | 一种基于电子鼻结合人工神经网络预测煎炸油品质的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
McGlone et al. | Vis/NIR estimation at harvest of pre-and post-storage quality indices for ‘Royal Gala’apple | |
Flores et al. | Feasibility in NIRS instruments for predicting internal quality in intact tomato | |
Sun et al. | Detection of internal qualities of hami melons using hyperspectral imaging technology based on variable selection algorithms | |
CN104990895B (zh) | 一种基于局部区域的近红外光谱信号标准正态校正方法 | |
Xu et al. | Factors influencing near infrared spectroscopy analysis of agro-products: a review | |
CN110672578A (zh) | 针对煎炸油极性组分检测的模型通用性及稳定性验证方法 | |
Beghi et al. | Rapid monitoring of grape withering using visible near‐infrared spectroscopy | |
Qing et al. | Wavelength selection for predicting physicochemical properties of apple fruit based on near‐infrared spectroscopy | |
CN109211829A (zh) | 一种基于SiPLS的近红外光谱法测定大米中水分含量的方法 | |
CN110749565A (zh) | 一种快速鉴别普洱茶存储年份的方法 | |
CN105548070A (zh) | 一种苹果可溶性固形物近红外检测部位补偿方法及系统 | |
CN106018331B (zh) | 多通道光谱系统的稳定性评价方法及预处理优化方法 | |
Xu et al. | Nondestructive detection of internal flavor in ‘Shatian’pomelo fruit based on visible/near infrared spectroscopy | |
Tian et al. | Measurement of soluble solids content in watermelon by Vis/NIR diffuse transmittance technique | |
Wang et al. | Development of near‐infrared online grading device for long jujube | |
CN110231302A (zh) | 一种快速测定奇亚籽粗脂肪含量的方法 | |
CN109946246A (zh) | 一种苹果可溶性固形物的检测方法及装置 | |
CN110887809A (zh) | 一种基于近红外光谱技术测定烟丝中梗含量的方法 | |
CN114018865A (zh) | 一种构建不同种皮颜色花生蔗糖含量近红外模型的方法 | |
CN106501212A (zh) | 基于原料肉近红外光谱信息预测烧烤牛肉熟后品质的方法 | |
Liu et al. | Prediction of valid acidity in intact apples with Fourier transform near infrared spectroscopy | |
CN110646373A (zh) | 一种烟用香精香料糖分含量测定方法 | |
CN110646371A (zh) | 一种烟用香精香料含水量的测定方法 | |
Barreiro et al. | Comparison of robust modeling techniques on NIR spectra used to estimate grape quality | |
Tarighi et al. | Evaluation ability of the NIR-Spectroscopy for detecting the ripening time of walnuts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200110 |