发明内容
本发明的目的在于克服现有技术的不足,提供一种基于同步-异步二维近红外相关谱检测牛奶掺尿素的方法,该检测方法既利用了同步谱随外扰变化待测体系“相似性”变化信息,又利用了异步谱随外扰变化待测体系“差异性”变化信息,同时也克服了直接采用同步谱或异步谱建模数据存在冗余问题,该方法简易、科学、分析效率和判别正确率高。
本发明是通过以下技术方案实现的:
一种基于同步-异步二维近红外相关谱检测牛奶掺尿素的方法,其步骤为:
⑴、准备实验用纯牛奶以及用实验用纯牛奶掺杂不同浓度尿素的掺杂尿素牛奶;
⑵、分别扫描实验用纯牛奶的近红外光谱、掺杂尿素牛奶的近红外光谱,分别得到实验用纯牛奶一维近红外光谱数据、掺杂尿素牛奶一维近红外光谱数据,并通过计算得到实验用纯牛奶一维近红外平均谱数据;
⑶、将实验用纯牛奶一维近红外平均谱数据与实验用纯牛奶一维近红外光谱数据按行排列组成的光谱矩阵,根据Noda理论,进行二维相关计算得到实验用纯牛奶同步二维近红外相关谱以及实验用纯牛奶异步二维近红外相关谱;将实验用纯牛奶一维近红外平均谱数据与掺杂尿素牛奶一维近红外光谱数据按行排列组成的光谱矩阵,根据Noda理论,进行二维相关计算得到实验用掺杂尿素牛奶同步二维近红外相关谱以及实验用掺杂尿素牛奶异步二维近红外相关谱;
⑷、将步骤⑶中得到的实验用纯牛奶同步二维近红外相关谱、实验用纯牛奶异步二维近红外相关谱、实验用掺杂尿素牛奶同步二维近红外相关谱以及实验用掺杂尿素牛奶异步二维近红外相关谱分别进行归一化处理得到对应的实验用纯牛奶归一化同步二维近红外相关谱矩阵、实验用纯牛奶归一化异步二维近红外相关谱矩阵、实验用掺杂尿素牛奶归一化同步二维近红外相关谱矩阵以及实验用掺杂尿素牛奶归一化异步二维近红外相关谱矩阵;
⑸、提取实验用纯牛奶归一化同步二维近红外相关谱矩阵主对角线及其上半部分数据得到第一矩阵,提取实验用纯牛奶归一化异步二维近红外相关谱矩阵主对角线及其下半部分数据,并将其主对角线的数据赋为0,得到第二矩阵,将第一矩阵和第二矩阵求和得到实验用纯牛奶同步-异步二维近红外相关谱矩阵;
⑹、提取实验用掺杂尿素牛奶归一化同步二维近红外相关谱矩阵主对角线及其上半部分数据得到第三矩阵,提取实验用掺杂尿素牛奶归一化异步二维近红外相关谱矩阵主对角线及其下半部分数据,并将其主对角线的数据赋为0,得到第四矩阵,将第三矩阵和第四矩阵求和得到实验用掺杂尿素牛奶同步-异步二维近红外相关谱矩阵;
⑺、将实验用纯牛奶同步-异步二维近红外相关谱矩阵以及实验用掺杂尿素牛奶同步-异步二维近红外相关谱矩阵与类别变量矩阵采用多维偏最小二乘法建立判别模型;
⑻、将未知样品奶进行近红外光谱扫描得到未知样品奶一维近红外光谱数据,将实验用纯牛奶一维近红外平均谱数据与未知样品奶一维近红外光谱数据按行排列组成的光谱矩阵,根据Noda理论,计算得未知样品奶同步二维近红外相关谱以及未知样品奶异步二维近红外相关谱,然后分别进行归一化处理得到对应的未知样品奶归一化同步二维近红外相关谱矩阵以及未知样品奶归一化异步二维近红外相关谱矩阵,提取未知样品奶归一化同步二维近红外相关谱矩阵主对角线及其上半部分数据得到第五矩阵,提取未知样品奶归一化异步二维近红外相关谱矩阵主对角线及其下半部分数据,并将其主对角线的数据赋为0,得到第六矩阵,将第五矩阵和第六矩阵求和得到未知样品奶同步-异步二维近红外相关谱矩阵,将未知样品奶同步-异步二维近红外相关谱矩阵代入步骤⑺中的判别模型,得到未知样品奶是否掺杂尿素。
而且,所述的近红外光谱采用波段是4000-10000cm-1。
而且,所述的近红外光谱优选波段范围是:4200-4800cm-1。
本发明的优点及有益效果是:
1、本发明与传统的一维光谱相比,二维相关谱具有高的光谱分辨率、高的选择性和高的图谱解析能力,可有效提取被牛奶固有组分淹没或覆盖的掺杂物微弱信息。
2、本发明提取了同步二维近红外相关谱主对角线上半部分和异步谱主对角线下半部分,并将异步谱主对角线上元素赋为0。将所提取的同步谱上半矩阵和异步谱下半矩阵组成一个新的矩阵,即:同步-异步二维近红外相关谱矩阵,用于建模分析。该新的矩阵中既包括了同步谱随外扰变化待测体系“相似性”变化信息,又包括了异步谱随外扰变化待测体系“差异性”变化信息。
3、本发明将同步-异步二维近红外相关谱矩阵与多维偏最小二乘法相结合实现掺杂尿素牛奶与纯牛奶的定性判别,既全面提取了牛奶中掺杂微量的掺杂物信息,也克服了直接采用同步谱或异步谱建模数据存在冗余问题。该方法简易、科学、分析效率和判别正确率高。
4、本发明牛奶中掺尿素的同步-异步二维近红外相关谱矩阵判别方法相对同步二维近红外相关谱或异步二维近红外相关谱,对未知样本的预测更为准确,可广泛应用于食品掺伪检测中。
具体实施方式
本发明通过以下实施例进一步详述。需要说明的是:下述实施例是说明性的,不是限定性的,不能以下述实施例来限定本发明的保护范围。
一种基于同步-异步二维近红外相关谱检测牛奶掺尿素的方法,其步骤为:
⑴、准备实验用纯牛奶以及用实验用纯牛奶掺杂不同浓度尿素的掺杂尿素牛奶;
⑵、分别扫描实验用纯牛奶的近红外光谱、掺杂尿素牛奶的近红外光谱,分别得到实验用纯牛奶一维近红外光谱数据、掺杂尿素牛奶一维近红外光谱数据,并通过计算得到实验用纯牛奶一维近红外平均谱数据;近红外光谱采用波段是4000-10000cm-1,近红外光谱优选波段范围是:4200-4800cm-1。
⑶、将实验用纯牛奶一维近红外平均谱数据与实验用纯牛奶一维近红外光谱数据按行排列组成的光谱矩阵,根据Noda理论,进行二维相关计算得到实验用纯牛奶同步二维近红外相关谱以及实验用纯牛奶异步二维近红外相关谱;将实验用纯牛奶一维近红外平均谱数据与掺杂尿素牛奶一维近红外光谱数据按行排列组成的光谱矩阵,根据Noda理论,进行二维相关计算得到实验用掺杂尿素牛奶同步二维近红外相关谱以及实验用掺杂尿素牛奶异步二维近红外相关谱;
⑷、将步骤⑶中得到的实验用纯牛奶同步二维近红外相关谱、实验用纯牛奶异步二维近红外相关谱、实验用掺杂尿素牛奶同步二维近红外相关谱以及实验用掺杂尿素牛奶异步二维近红外相关谱分别进行归一化处理得到对应的实验用纯牛奶归一化同步二维近红外相关谱矩阵、实验用纯牛奶归一化异步二维近红外相关谱矩阵、实验用掺杂尿素牛奶归一化同步二维近红外相关谱矩阵以及实验用掺杂尿素牛奶归一化异步二维近红外相关谱矩阵;
⑸、提取实验用纯牛奶归一化同步二维近红外相关谱矩阵主对角线及其上半部分数据得到第一矩阵,提取实验用纯牛奶归一化异步二维近红外相关谱矩阵主对角线及其下半部分数据,并将其主对角线的数据赋为0,得到第二矩阵,将第一矩阵和第二矩阵求和得到实验用纯牛奶同步-异步二维近红外相关谱矩阵;
⑹、提取实验用掺杂尿素牛奶归一化同步二维近红外相关谱矩阵主对角线及其上半部分数据得到第三矩阵,提取实验用掺杂尿素牛奶归一化异步二维近红外相关谱矩阵主对角线及其下半部分数据,并将其主对角线的数据赋为0,得到第四矩阵,将第三矩阵和第四矩阵求和得到实验用掺杂尿素牛奶同步-异步二维近红外相关谱矩阵;
⑺、将实验用纯牛奶同步-异步二维近红外相关谱矩阵以及实验用掺杂尿素牛奶同步-异步二维近红外相关谱矩阵与类别变量矩阵采用多维偏最小二乘法建立判别模型;类别变量矩阵中纯牛奶可以用“0”表示,掺杂尿素牛奶可以用“1”表示;
⑻、将未知样品奶进行近红外光谱扫描得到未知样品奶一维近红外光谱数据,将实验用纯牛奶一维近红外平均谱数据与未知样品奶一维近红外光谱数据按行排列组成的光谱矩阵,根据Noda理论,计算得未知样品奶同步二维近红外相关谱以及未知样品奶异步二维近红外相关谱,然后分别进行归一化处理得到对应的未知样品奶归一化同步二维近红外相关谱矩阵以及未知样品奶归一化异步二维近红外相关谱矩阵,提取未知样品奶归一化同步二维近红外相关谱矩阵主对角线及其上半部分数据得到第五矩阵,提取未知样品奶归一化异步二维近红外相关谱矩阵主对角线及其下半部分数据,并将其主对角线的数据赋为0,得到第六矩阵,将第五矩阵和第六矩阵求和得到未知样品奶同步-异步二维近红外相关谱矩阵,将未知样品奶同步-异步二维近红外相关谱矩阵代入步骤⑺中的判别模型,得到未知样品奶类别变量的预测值。当未知样品奶类别变量的预测值大于0.5时,判定该样品属于掺杂尿素牛奶类;当未知样品奶类别变量的预测值小于0.5时,判定该样品属于纯牛奶类。即能得到未知样品奶是否掺杂尿素。
本实施例中尿素为天津市赢达稀贵化学试剂厂提供;实验采用伊利全脂灭菌纯牛奶,随机选取上述纯牛奶为母样本,分别配置纯牛奶样品40个和掺杂尿素牛奶样品40个,其浓度范围为0.1g/L-3g/L。
本发明中光谱采集采用美国PerkinElmer公司的Spectrum GX傅立叶变换红外光谱仪。近红外光谱扫描范围为4000-10000cm-1;仪器参数如下:分辨率为4cm-1,扫描间隔为8cm-1,扫描次数16。实验前,对所配置的掺杂尿素牛奶进行均质处理。为了消除仪器漂移的影响,在测量每个样品后再采集蒸馏水的光谱作为背景,用样品光谱扣除相邻背景光谱后作为待分析的光谱数据。
计算同步-异步二维近红外相关谱矩阵
同步二维近红外相关谱和异步二维近红外相关谱的计算主要基于下述原理:假设原始常规一维近红外光谱A(m×n)包含m个光谱,根据二维相关Noda理论,则同步二维近红外相关谱Φ(ν1,ν2)可表示为:
异步二维近红外相关谱Ψ(ν1,ν2)可表示为:
式中,N为m阶方阵(m是光谱数),称为Hilbert-Noda矩阵,其矩阵元为:
T表示转置,n表示在近红外波段分别采集的波长数。在本发明中,A和B中都包括两个光谱(m=2),A的第一行为纯牛奶一维近红外平均谱,当A的第二行为第i个掺杂尿素牛奶或纯牛奶常规一维近红外谱时,根据式(1)、(2)就可分别得到第i个掺杂尿素牛奶或纯牛奶所对应的同步二维近红外相关谱和异步二维近红外相关谱。
选择随牛奶中掺杂尿素浓度变化敏感的特征光谱信息区4200-4800cm-1来进行各样品的同步二维近红外相关谱和异步二维近红外相关谱计算。分别采用式(4)和式(5)对同步二维近红外相关谱和异步二维近红外相关谱进行归一化,图1、2分别是纯牛奶的归一化同步二维近红外相关谱和异步二维近红外相关谱,图3、4分别是掺杂尿素牛奶(浓度为0.1g/L)的归一化同步二维近红外相关谱和异步二维近红外相关谱。
采用实施方式中步骤(5)和(6)方法得到各样品的同步-异步二维近红外相关谱。图5是纯牛奶的同步-异步二维近红外相关谱,图6是浓度为0.1g/L掺杂尿素牛奶的同步-异步二维近红外相关谱。
建立掺杂尿素牛奶判别模型:
采用浓度梯度法从40个掺杂尿素牛奶和40个纯牛奶样品中选出54个(掺杂尿素牛奶和纯牛奶各27个)作为校正集,余下26个样品作为独立的预测集。在校正集和预测集中,纯牛奶和掺杂尿素牛奶分别用“0”,“1”来表示其类别属性。将同步-异步二维近红外相关谱矩阵(54×76×76)作为自变量,类别变量矩阵作为因变量,依据交叉验证均方根误差(RMSECV)来选择最佳建模主成分,建立掺杂尿素牛奶与纯牛奶的多维偏最小二乘判别模型。图7是模型对校正集样品交叉验证的预测结果。仅有2个掺杂尿素牛奶被误判,所建模型对校正集内部样品的判别正确率为96.3%。
对未知样品的判别:
通过测定未知样品的一维近红外光谱,采用校正模型中所用纯牛奶样品的一维近红外平均谱,依据式(1)和式(2)计算其同步二维近红外相关谱和异步二维近红外相关谱矩阵,得到其同步-异步二维近红外相关谱矩阵,并利用上述建立的多维偏最小二乘判别模型对预测集样品进行外部预测,计算未知样本同步-异步二维近红外相关谱矩阵对应的类别变量预测值。所建模型对预测集未知样品的预测结果见图8。显然,仅有1个掺杂尿素牛奶样品被误判,其判别正确率为96.2%。为了验证我们所提出的方法对未知样品具有高的预测能力,对于同样的校正集和预测集样品,分别建立了基于同步二维近红外相关谱和异步二维近红外相关谱的多维偏最小二乘判别模型,采用这些模型对所有的样品进行预测,并与基于同步-异步二维近红外相关谱的多维偏最小二乘判别模型的预测结果作比较,如表1所示。
表1 基于同步-异步二维近红外相关谱、同步二维近红外相关谱和异步二维近红外相关谱多维偏最小二乘模型预测结果比较
表1的结果表明:基于同步-异步二维近红外相关谱的NPLS-DA模型对未知样品的判别正确率优于同步二维近红外相关谱和异步二维近红外相关谱的NPLS-DA模型,且对未知样品的判别正确率高达96.2%。这是由于同步-异步二维近红外相关谱既包括了同步谱随外扰变化待测体系“相似性”变化信息,又包括了异步谱随外扰变化待测体系“差异性”变化信息,同时也剔除了基于同步二维近红外相关谱或异步谱存在的冗余信息。因此基于同步-异步二维近红外相关谱和多维偏最小二乘法可对掺杂尿素牛奶与纯牛奶样品进行较好判别。
上述参照实施例对掺杂尿素牛奶同步-异步二维近红外相关谱判别方法的详细描述,是说明性的而不是限定性的,因此在不脱离本发明总体构思下的变化和修改,应属于本发明的保护范围之内。