CN107478599B - 一种饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法 - Google Patents

一种饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法 Download PDF

Info

Publication number
CN107478599B
CN107478599B CN201710957053.6A CN201710957053A CN107478599B CN 107478599 B CN107478599 B CN 107478599B CN 201710957053 A CN201710957053 A CN 201710957053A CN 107478599 B CN107478599 B CN 107478599B
Authority
CN
China
Prior art keywords
sample
weight
samples
formaldehyde resin
melamine formaldehyde
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710957053.6A
Other languages
English (en)
Other versions
CN107478599A (zh
Inventor
李庆波
郝灿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Aeronautics and Astronautics
Original Assignee
Beijing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Aeronautics and Astronautics filed Critical Beijing University of Aeronautics and Astronautics
Priority to CN201710957053.6A priority Critical patent/CN107478599B/zh
Publication of CN107478599A publication Critical patent/CN107478599A/zh
Application granted granted Critical
Publication of CN107478599B publication Critical patent/CN107478599B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法,通过利用近红外光谱仪采集饲料原料的光谱,对光谱进行预处理获取训练样本,并采用对类别敏感的iVISSA方法进行波段选择,该方法可以有效地选择三聚氰胺甲醛树脂与其他成分差异性大的特征峰,提高检测效率和准确性。然后选取一定数量的训练样本进行建模,建立模型的方法为信息熵权重局部超平面(Entropy Weight local‑Hyperplane k‑nearest‑neighbor,EWHK)方法作对照实验,实现对掺假样本检测。本发明可以有效提高检测精度,具有检测快速、稳定性强的优点。

Description

一种饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法
技术领域
本发明涉及一种饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法,属于农业中饲料安全分析技术领域。
背景技术
随着饲料行业快速发展进程,更为丰富的蛋白、生物添加剂等的使用为其质量安全带来新的安全隐患。我国作为世界上最大的畜禽养殖生产国之一,畜禽食品安全现状较为严峻,食品安全事件层出不穷。不法商贩将非法添加物或低价类似原料掺入饲料中以次充好,降低成本,谋取高额利益。这些非法添加物不仅对动物自身造成不可挽回的伤害,而且严重威胁着人类的健康。
三聚氰胺甲醛树脂(MF)是三聚氰胺与甲醛反应所得到的聚合物。又称蜜胺甲醛树脂、蜜胺树脂。该树脂具有耐水、耐化学腐蚀、绝缘性能好、光泽度和机械强度好等优点,与其他原料混配,还可以生产抗水剂、橡胶粘合剂、高效水泥减水剂、钢材氮化剂等,广泛应用于木材、塑料、涂料、造纸、纺织、皮革、电气、医药等行业。由于三聚氰胺分子中含有大量氮元素,而常规的“凯式定氮法”测饲料或食品中蛋白质含量时不能识别这类“伪蛋白质”,因而一些不法商贩为降低成本,在饲料、奶粉中添加这种非食品性化工原料,以提高其产品的蛋白质含量。因此我国政府严禁在饲料中添加三聚氰胺,但是不法分子为了谋取暴利正在试图添加三聚氰胺的衍生物或聚合物。因此快速检测潜在高氮物三聚氰胺甲醛树脂的掺假与否,值得研究。根据国家要求,没有允许使用的物质就是禁用物质,MF没有列入现有的国家食品包装容器原料目录和食品添加剂目录,说明MF禁止用作食品添加剂。三聚氰胺甲醛树脂可引起头痛、嗜睡、周身无力、呼吸道粘膜刺激症状、喘息性支气管炎和皮肤病等一系列的健康问题,因此将其掺入饲料或食品中的潜在危害是显而易见的。虽然目前国内外对潜在高氮物三聚氰胺甲醛树脂的掺假没有报道,但其作为一种检测饲料掺假指标值得被研究。
传统的分析方法是重量法和电位滴定法,主要针对的是纯物质,由于饲料原料组成成分通常比较复杂,导致利用常规分析方法很难准确地提取出纯净的添加物,并且分离提取工作繁杂且技术要求严格,操作过程中可能会引起样品的某些组成成分发生未知的物理或化学变化,影响检测分析结果的真实性,降低产品质量检验的准确率。国内较常用的检测饲料掺假的方法为高效液相色谱法、离子色谱法和液相色谱/质谱联用分析法,适合饲料这种复杂基质中掺假情况的检测,但是均需要对样本进行一定的前处理(水溶、离心、沉淀等等)甚至还需要提取一些物质或者添加一些物质,操作较为复杂。
光谱分析方法是利用物质在不同辐射波长下的光学信息强度进行分析检测的。不同结构的物质根据自身的辐射特性存在不同的特征光谱。这些光谱可通过建立数学模型的方式来分析测定对应物质的化学结构及成分,从而对物质表面特征及内部品质定性检测,具有快速准确、无损和实时检测的特点。操作快捷,无需对样本进行复杂处理。因此,对三聚氰胺甲醛树脂检测采用的近红外光谱法。虽然近红外光谱法具有快速、准确、无损、实时的特点,但该方法获得的光谱数据存在高频噪声和基线干扰,而且实际非法添加物中,三聚氰胺甲醛树脂的添加浓度较低,在饲料样本中的分布不均匀,饲料成分复杂,很难精确地提取出掺假饲料中三聚氰胺甲醛树脂的光谱等因素,导致仅仅利用普通近红外光谱技术很难实现高精度的三聚氰胺甲醛树脂检测。
目前国内一些学者研究了采用近红外光谱鉴别奶牛饲料中三聚氰胺甲醛树脂的可行性,通过主成分分析进行光谱数据的预处理,之后建立BP神经网络模型,从而进行预测分析。采用主成分分析算法能实现一定程度上的降维与去噪,但存在一定的主观性,选择不同的主成分数,结果会有很大差距。而本专利中的预处理方法为自适应迭代权重-偏最小二乘方法,通过自适应,消除主观性。
综上所述,近红外检测技术,有技术要求高的问题;同时,其数据存在高频噪声、基线干扰、维数高、冗余信息多、检测速度低的缺陷;再者,饲料的成分多样,检测背景信息复杂,低浓度光谱特征较弱且三聚氰胺甲醛树脂与多种可添加成分光谱在部分波段存在重叠的情况极大的提高了检测难度。
发明内容
本发明技术解决问题:克服现有技术的不足,提供一种简单、快速、高效的饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法,以解决现有技术中操作复杂、重复性差、光谱数据相关性高的问题。
本发明提供的饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法利用近红外光谱仪采集饲料样本的光谱数据,再通过波长变量选择方法降低数据冗余并建立具有代表性的光谱库,最后应用信息熵权重局部超平面(Entropy Weight local-Hyperplane k-nearest-neighbor,EWHK)实现对这类非法添加物样本的检测。
为达到上述目的,本发明的技术方案是这样实现的:
步骤101,采集饲料样本的近红外光谱数据,所述饲料样本包括添加不同浓度的三聚氰胺甲醛树脂掺假样本、无添加的饲料空白样本和添加物三聚氰胺甲醛树脂纯物质样本;
步骤102,对采集到的近红外光谱数据进行预处理,以去除噪声、基线的干扰;
步骤103,对步骤102预处理后得到的数据,选取其中部分三聚氰胺甲醛树脂掺假样本和空白样本作为训练样本,所述空白样本包含无添加的饲料样本和添加物的纯物质样本,并对训练样本的近红外光谱数据进行波段选择,选择出有用波段,选择结果应用于所有数据;
步骤104,对训练样本进行EWHK分类模型训练,建立分类模型;
步骤105,近红外光谱仪采集待测饲料的近红外光谱数据;
步骤106,对待测样本的近红外光谱数据进行预处理,以去除噪声、基线的干扰;
步骤107,将训练样本的波段选择结果应用于预处理之后的待测样本数据;
步骤108,将波段选择之后的光谱数据代入已建立的分类模型,检测该待测样本是否含有三聚氰胺甲醛树脂,从而实现对非法添加三聚氰胺甲醛树脂样本的检测。
其中,所述述步骤102中对采集到的近红外光谱数据进行预处理,具体方法为自适应迭代权重-偏最小二乘方法。
其中,所述步骤103中对训练样本的近红外光谱数据进行波段选择方法选用对类别敏感的间隔变量迭代空间收缩法(interval variable iterative space shrinkageapproach,iVISSA),具体算法及其训练样本的选择如下:
iVISSA方法的核心思想为从全局分析和局部分析两个方向对有用波段进行搜索,其中全局分析利用变量的权重优化了有用波段的间隔位置,局部分析通过相邻变量的权重优化了每个间隔的宽度。设有光谱数据X(n×p),n为样本个数,p为波长长度;类别数据Y(n×1),
全局分析如下:
Step1:采用权重二进制矩阵采样法(Weighted Binary Matrix Sampling,WBMS)将光谱数据X(n×p)随机组合为m个二进制子数据集x(k×p),其中k表示采样个数,p为波长变量个数且0<k<n,n为样本个数。选择合适的每列权重初始值l使得所有波长变量在初始时具有相同的可能性,且x(k×p)中变量1的个数为lk;
Step2:将每一个二进制子数据集x(k×p)作为一个子模型进行回归分析,此处的回归方法可采用最小二乘回归(PLSR)、主成分回归(principal component regression,PCR)、支持向量回归(support vector machine regression,SVR)等,本发明中采用PLSR方法;
Step3:分析比较m个二进制子数据集的均方根误差Rmse和预测误差R,取其中前k个均方根误差Rmse和预测误差R均较小的子模型,子模型个数为kbest,并且求得每个变量在这kbest个子模型中出现的次数fi,从而重新定义所述变量的权重为重复Step2和Step3不断更新变量的权重值,若所有子模型的均方根误差与预测误差不再改变即所有变量的权重都为常数时,权重为1的变量构成了光谱数据的有用波段,此时结束。
局部分析如下:
iVISSA中全局分析与局部分析交替进行,若全局分析中存在变量i的权重为1时,取该变量相邻的变量j放入子模型中进行回归分析,当模型误差降低时,变量j的权重设置为1,否则权重不变,权重赋值结束后,将权重赋值之后的变量跳转至全局分析继续执行,直至所有变量的权重保持不变。
训练样本的选取如下:
Step1:尽可能广泛的选取不同浓度三聚氰胺甲醛树脂掺假样本作为训练样本;
Step2:将纯饲料原料样本和纯三聚氰胺甲醛树脂样本作为空白样本添加到训练样本中;
Step3:再加入各类训练样本的平均光谱。
其中,所述步骤104中,本发明采用一种信息熵权重局部超平面(Entropy Weightlocal-Hyperplane k-nearest-neighbor,EWHK)方法,实现对掺假样本的检测。该方法是在自适应权重局部超平面(adaptive weight k-local hyperplane,AWKH)的基础上发展而来的。EWHK在计算中引入不同变量的比重综合得到预测样本与超平面的欧式距离,该特征权重值是由样本信息熵权决定的,因此能够客观的反映了数据信息在分类中的贡献。
第一步,挑选K个最近邻样本。本发明选用自适应最近邻算法,是因为该方法选择最近邻时不仅通过欧式距离评定,还引入了特征变量权重加以分析,这样选择的最近邻更能够代表样品整体特性。
第二步,计算样品与该平面的权重欧式距离对样本完成定性鉴别。其具体算法过程如下:设包含m个样本,L个类别的训练集且每个样本包含n个特征,xi表示第i个光谱样本,记为:xi=(xi1,…,xin)T,对应类别为yi=c,其中i=1,…,m且c=1,…,L,待测样本q,设q=(q1,…,qn)T
Step1:计算训练样本的特征权重wj
其中标准化数据zij;调节参数β;Hj为样本中第j个特征的信息熵;xij为光谱数据的第i个样本的第j个特征;n表示特征个数,m表示样本个数,wj为训练样本第j个特征的权重值;
Step2:计算待测样本q与训练样本的权重欧氏距离D(xi,q):
其中D(xi,q)为预测样本与所给定的每个类别的样本之间的权重欧式距离;xij为训练样本第j个特征值;qj为预测样本的像元的光谱向量q=(q1,…,qn)T的第j个特征值;wj为训练样本第j个特征的权重值,n表示特征个数。
Step3:根据D(xi,q),得到类c样本中与q最邻近的k个训练样本pc,并构造超平面LHC(q):
V.i=pci-mc
α=(α1,…,αk)T
其中LHc(q)为所构造的超平面的集合;s为超平面;mc为预测样本pc的k个近邻的平均值;pci为预测样本属于类别c的近邻;V·i为近邻与近邻平均值之间的特征差值;α为构造超平面时所选用的拉普拉斯算子向量;ai为a的分量;k为人为选择,k≥2,并且k不能超过训练样本个数。
Step4:计算q到类c超平面的最小距离:
W=diag(w1,…,wn)
其中,Jc(q)为拉格朗日最小距离算子;wj为训练样本第j个特征的权重值;V为近邻与近邻平均值之间的特征差值的第j个特征值;mcj为mc的第j个特征值;qj为预测样本的第j个特征值;α为构造超平面时所选用的拉普拉斯算子向量;V所有的近邻与近邻平均值之间的特征差值组成的向量;W为所有训练样本的特征权重组成的对角向量;s为超平面;q为预测样本;w1,...,wn为特征权重;λ是一个用于控制α值可能过大的参数,取值为0-10之间。
计算得α值使得待测样品与超平面距离最小:(UTV+λIk)α=UT(q-m),其中UT=VTW,w1为第一个特征的权重值,wn为第n个特征的权重值,U为酉矩阵,Ik为单位阵。
Step5:分类判别:根据待测样本q与超平面距离最小值分类label(q),即:
label(q)=argmincJc(q)
其中label(q)为预测样本所属类别;Jc(q)为拉格朗日最小距离算子;argmincJc(q)代表使Jc(q)的值最小的超平面所属于的类别。
找到与待测样本的近红外光谱最近的超平面,该类别即为待测样本的类别,即为判断待测样本是否含有三聚氰胺甲醛树脂信息的依据,最终实现对非法添加三聚氰胺甲醛树脂样本的检测。
本发明与现有技术相比的优点在于:本发明所提供的饲料原料中三聚氰胺甲醛树脂非法添加物的检测方法对样本无需复杂的前处理过程;预处理过程采用自适应迭代权重-偏最小二乘方法,通过自适应迭代过程进行预处理,不需要人为输入主成分数,消除了主观性;波段选择技术极大的减弱了不同类别物质近红外光谱重叠部分的影响,增强光谱的特异性,减少数据冗余,提高检测效率和分类能力;再者,近红外光谱仪需要样品量少、扫描间隔小、不产生化学污染物、能够实现快速无损检测,近红外光谱对极性基团如N-C等具有丰富的近红外光谱带,有利于三聚氰胺甲醛树脂的检测;最后,信息熵权重局部超平面(Entropy Weight local-Hyperplane k-nearest-neighbor,EWHK)通过样本信息熵计算出引入的不同变量的比重,该比重作为特征权重值参与预测样本与超平面的欧式距离的计算,然后建立模型,因此能够提高特征变量在建模过程中的权重,从而提高识别率,实现样本的高精度检测。
附图说明
图1为本发明饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法的流程图;
图2为本发明实施例的实验仪器,瑞典波通公司的DA7200近红外光谱仪;
图3为本发明实施例的样本近红外光谱曲线图及预处理结果图,其中:(a)为原始近红外光谱;(b)为经过air_PLS预处理后的近红外光谱曲线;
图4为本发明实施例的iVISSA波段优选结果,瑞典波通公司的DA7200采集的近红外光谱优选结果。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下举实施例并参照附图,对本发明进一步详细说明。
本发明提供的饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法利用近红外光谱仪采集饲料样本的光谱数据,再通过波长变量选择方法降低数据冗余并建立具有代表性的光谱库,最后应用信息熵权重局部超平面(Entropy Weight local-Hyperplane k-nearest-neighbor,EWHK)实现对这类非法添加物样本的检测。本发明具有检测效率高、稳定性强的优点。
如图1所示,本发明具体步骤实现如下:
步骤101,制备实验样本,用近红外光谱仪采集饲料样本的近红外光谱数据,所述饲料样本包括添加不同浓度的三聚氰胺甲醛树脂掺假样本、无添加的饲料空白样本和添加物三聚氰胺甲醛树脂纯物质样本。
本发明实施例选取中国农业科学院提供的饲用饲料豆粕、纯度为99%的三聚氰胺甲醛树脂。配制纯豆粕样本、纯非法添加物和不同浓度掺假样本。实验中含有非法添加物的豆粕样本混合比例为5%-0.00025%,每个混合样本取恒定质量经过压片机以15帕的压力制作成直径为14mm、厚度为1.0mm的圆形片样本,并在分析前密封储存在塑料袋中。本实施例中样本总数为131个。训练样本集为68个,预测样本集为63个,其中纯豆粕样本5个,掺杂三聚氰胺甲醛树脂的样本120个,纯三聚氰胺甲醛树脂样本6个。
如图2所示,本发明采用瑞典波通公司的DA7200近红外光谱仪对豆粕中非法添加物三聚氰胺甲醛树脂掺假样本进行扫描。实验首先预热仪器半小时,以保证仪器稳定运行;其次,设置实验参数为:反射模式下光谱采集间隔为2nm、扫描波段为950-1650nm、扫描速度为100次/s,同时采用仪器标准参考板采集背景光谱,所有实验均采取完全一致的扫描方法,并且在统一的实验参数下进行。每个浓度梯度样本测量4组数据,并将每组数据的平均光谱放入光谱数据中,共得到训练样本的近红外光谱数据340条。
步骤102,对采集到的近红外光谱数据进行预处理,以去除噪声、基线的干扰。
本发明所用的预处理方法是自适应迭代权重-偏最小二乘(air-PLS)方法,该方法通过迭代改变拟合基线与原始信号之间的总体方差权重实现,权重是由当前拟合基线和原始信号之间的差异得到,因此它是个不断拟合和逼近的过程。air-PLS方法主要是采用惩罚最小二乘算法将信号平滑的原理应用到基线拟合,然后自适应迭代将惩罚过程转化为一个基线逼近的过程。该方法无需任何先验信息,便于实际检测中将多种物质光谱校正在同一基线上。
惩罚最小二乘(penalized least squares)算法原理为:
假设a是待分析的光谱信号,b是平滑后信号,它们的长度均为c,v=1,2,…,c,b对于a的保真度用二者间的误差平方和表示为:
F'
b的粗糙度用其差分平方和表示为:
保真度和粗糙度之间的平衡可以用准确度加上惩罚的粗糙度,δ为惩罚系数,式子表示为:
Q=F'+δR=||a-b||2+δ||Db||2
对其求偏导数且令其为零,可得一个易解的线性方程为:
(I+δD′D)b=a
其中I为单位矩阵;D为差分矩阵;D′为D的转置。
要实现最小二乘算法进行基线校正,引入保真度的权重向量w,并将其在有峰的位置设置为零,其中d为a与b的长度,v=1,2,…,d,则b对a的保真度变为:
自适应迭代重加权原理:
自适应迭代重加权方法与加权最小二乘法以及迭代惩罚最小二乘法相似,不同的是采用了不同的方法计算权重,并增加了一个惩罚项来控制拟合基线的平滑度,优化目标函数定义为:
其中v=1,2,…,d;g=2,3,…,d;to为迭代次数;δ为惩罚系数。
迭代的过程如下:设置初始权重采用下式进行迭代:
其中向量sto包含了原始光谱(a)与迭代过程中的拟合矢量差值为负的所有元素。在前to-1次的迭代中,拟合矢量是由背景估计的一个候选值。如果当前计算大于此背景估计值,则被视为峰附近且其权重重置为零。在air-PLS算法过程中,迭代和重加权不断的自动执行,就可自动地、逐渐地消除处于峰附近的数据点,将背景数据保留下来。预处理后不同添加物样本的近红外光谱曲线图如图3中(b)所示,可看出所有光谱曲线均调整在同一基线上,有效的减弱基线的干扰,便于多种物质光谱特征的比较和后续匹配实验的分析。
步骤103,对步骤102预处理后得到的数据,选取其中部分三聚氰胺甲醛树脂掺假样本和空白样本作为训练样本,所述空白样本包含无添加的饲料样本和添加物的纯物质样本,并对训练样本的近红外光谱数据进行波段选择,选择出有用波段,选择结果应用于所有数据。
本发明采用间隔变量迭代空间收缩法(iVISSA)对原始光谱进行波段优选。实验样本的近红外光谱的波段范围为950-1650nm,包含351个波长变量,将纯三聚氰胺甲醛树脂、纯豆粕与不同浓度掺假样本的光谱数据(每个浓度随机抽取三个样本)进行类别标号,其中纯豆粕样本对应的类别为“1”,其余样本的类别为“0”,经过间隔变量迭代空间收缩法(iVISSA)进行波段优选后,各条光谱的波长变量优选数为97个(如图4所示)。
步骤104,对训练样本进行信息熵权重局部超平面,即EWHK分类模型训练,建立分类模型;
本发明采用一种信息熵权重局部超平面(Entropy Weight local-Hyperplane k-nearest-neighbor,EWHK)方法建立分类模型。该方法在计算中引入不同变量的比重综合得到预测样本与超平面的欧式距离,该特征权重值是由样本信息熵权决定的,因此能够客观的反映了数据信息在分类中的贡献。
第一步,挑选K个最近邻样本。本文选用自适应最近邻算法,是因为该方法选择最近邻时不仅通过欧式距离评定,还引入了特征变量权重加以分析,这样选择的最近邻更能够代表样品整体特性。
第二步,计算样品与该平面的权重欧式距离对样本完成定性鉴别。
步骤105,近红外光谱仪采集待测饲料的近红外光谱数据。
本发明采用步骤101中的仪器与方法采集63个预测样本集的近红外光谱数据。每个浓度梯度样本测量4组数据,并将每组数据的平均光谱放入光谱数据中,共得到预测样本的近红外光谱数据315条。
步骤106,对待测样本的近红外光谱数据进行预处理,以去除噪声、基线的干扰,得到待测数据;
本发明所用的预处理方法是自适应迭代权重-偏最小二乘(air-PLS)方法,原理及步骤同步骤102一致。
步骤107,将训练样本的波段选择结果应用于步骤106预处理之后的待测样本数据;
本发明采用间隔变量迭代空间收缩法(iVISSA)对光谱进行波段优选。将步骤103波段选择的结果应用于预处理之后的预测数据。步骤103中,经过间隔变量迭代空间收缩法(iVISSA)进行波段优选后,各条光谱的波长变量优选数为97个(如图4所示)。
步骤108,将波段选择之后的光谱数据代入步骤104中已建立的分类模型,检测该待测样本是否含有三聚氰胺甲醛树脂,从而实现对非法添加三聚氰胺甲醛树脂样本的检测。
本发明采用信息熵权重局部超平面(Entropy Weight local-Hyperplane k-nearest-neighbor,EWHK)方法建立分类模型。并将经过上述预处理之后的待测样本的光谱数据带入分类模型中,进行定性分析,检测该饲料样本中是否含有三聚氰胺甲醛树脂。
由图3不难看出,三聚氰胺甲醛树脂作为饲料原料中富含氮类营养物质的替代品,其近红外光谱与豆粕的光谱存在某些相似的特征峰。如下图3中的(a)所示,近红外光谱仪采集的原始光谱均会受环境温度、湿度及光谱相似性等客观因素的影响,致使原始光谱可能产生不同程度的偏移。尤其是近红外光谱950-1200nm波段部分偏移较为明显。
基线校正后,非法添加物、掺假样本与豆粕的光谱谱线如图3中的(b)所示三聚氰胺甲醛树脂近红外光谱曲线在1014、1108、1490nm附近存在明显特征峰。这是因为三聚氰胺甲醛树脂含有丰富的极性结构N-C从而产生一系列由极性化合键振动引起的特征峰。可看出经过预处理后,突出了三聚氰胺甲醛树脂与豆粕的光谱曲线特点,为准确鉴别提供了依据。
表1基于不同分类方法分组验证的分类判别准确率
表2基于不同分类方法交互验证的分类判别准确率
如表1和表2所示,本发明选择分组验证和交互验证两种方式验证两段不同波段下实验样本的近红外光谱在上述提及的检测方法下的准确率。
本发明提出的EWHK方法显现出更好的检测准确率,在950-1650nm可以高达98.41%。如上图4可以看出,瑞典波通公司的DA7200采集的近红外光谱的光谱吸光度最高可达将近0.25,最后,本发明的EWHK相比于AWKH和KNN来说,显示出了更高的准确率,验证了该发明的可行性。
总之,本发明可以有效提高检测精度,具有检测快速、稳定性强的优点。
上述具体实施方式只是用来解释说明本发明,而非对本发明的限制。在本发明的精神和权利要求保护范围之内,对本发明做出的任何等同替换和改变,均属于本发明的保护范畴。

Claims (5)

1.一种饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法,其特征在于实现步骤如下:
步骤101,采用近红外光谱仪采集空白样本以及添加不同浓度三聚氰胺甲醛树脂的掺假样本的近红外光谱数据,所述空白样本包含无添加的饲料样本和添加物三聚氰胺甲醛树脂的纯物质样本;
步骤102,对采集到的近红外光谱数据进行预处理,以去除噪声、基线的干扰;
步骤103,对步骤102预处理后得到的数据,选取其中部分三聚氰胺甲醛树脂掺假样本和空白样本作为训练样本,所述空白样本包含无添加的饲料样本和添加物的纯物质样本,并对训练样本的近红外光谱数据进行波段选择,选择出有用波段,选择结果应用于所有数据;
步骤104,对训练样本进行信息熵权重局部超平面,即EWHK分类模型训练,建立分类模型;
步骤105,近红外光谱仪采集待测饲料的近红外光谱数据;
步骤106,对待测样本的近红外光谱数据进行预处理,以去除噪声、基线的干扰,得到待测数据;
步骤107,将训练样本的波段选择结果应用于步骤106预处理之后的待测样本数据;
步骤108,将波段选择之后的光谱数据代入步骤104中已建立的分类模型,检测待测样本是否含有三聚氰胺甲醛树脂,实现对非法添加三聚氰胺甲醛树脂样本的检测;
所述步骤104中,信息熵权重局部超平面方法在计算中引入不同变量的比重综合得到预测样本与超平面的欧式距离,特征权重值是由样本信息熵权决定的,因此能够客观的反映数据信息在分类中的贡献,首先,挑选K个最近邻样本,选用自适应最近邻算法,选择最近邻时不仅通过欧式距离评定,还引入了特征变量权重加以分析,这样选择的最近邻更能够代表样品整体特性;然后,计算样品与该平面的权重欧式距离对样本完成定性鉴别,具体步骤如下:
设包含m个样本,L个类别的训练集且每个样本包含n个特征,xi表示第i个光谱样本,记为:xi=(xi1,…,xin)T,对应类别为yi=c,其中i=1,…,m且c=1,…,L,待测样本q,设q=(q1,…,qn)T
Step1:计算训练样本的特征权重wj
其中zij为标准化数据;β为调节参数;Hj为样本中第j个特征的信息熵;xij为光谱数据的第i个样本的第j个特征;n表示特征个数,m表示样本个数,wj为训练样本第j个特征的权重值;
Step2:计算待测样本q与训练样本的权重欧氏距离D(xi,q):
其中D(xi,q)为待测样本与所给定的每个类别的样本之间的权重欧式距离;xij为第i个训练样本第j个特征值;qj为待测样本的像元的光谱向量q=(q1,…,qn)T的第j个特征值;wj为训练样本第j个特征的权重值,n表示特征个数;
Step3:根据D(xi,q),得到类c样本中与q最邻近的k个训练样本pc,并构造超平面集合LHc(q):
V.i=pci-mc
α=(α1,…,αk)T
其中LHc(q)为所构造的超平面的集合;s为超平面;pci为训练样本中属于类别c的近邻;mc为k个近邻pci的平均值;V.i为近邻与近邻平均值之间的特征差值;α为构造超平面时所选用的拉普拉斯算子向量;αi为α的分量;k为人为选择,k≥2,并且k不能超过训练样本个数;
Step4:计算q到类c超平面的最小距离:
W=diag(w1,…,wn)
其中,Jc(q)为拉格朗日最小距离算子;wj为训练样本第j个特征的权重值;V为近邻与近邻平均值之间的特征差值的第j个特征值;mcj为mc的第j个特征值;qj为待测样本的第j个特征值;α为构造超平面时所选用的拉普拉斯算子向量;V为所有的近邻与近邻平均值之间的特征差值组成的向量;W为所有训练样本的特征权重组成的对角向量;s为超平面;q为待测样本;w1,...,wn为特征权重;λ是一个用于控制α值避免其过大的参数,取值为0-10之间;
计算得α值使得待测样品与超平面距离最小:(UTV+λIk)α=UT(q-mc),其中UT=VTW,w1为第一个特征的权重值,wn为第n个特征的权重值,U为酉矩阵,Ik为单位阵;
Step5:分类判别:根据待测样本q与超平面距离最小值分类label(q),即:
label(q)=argmincJc(q)
其中label(q)为待测样本所属类别;Jc(q)为拉格朗日最小距离算子;argmincJc(q)代表使Jc(q)的值最小的超平面所属于的类别;
找到与待测样本的近红外光谱最近的超平面,该超平面的类别即为待测样本的类别,即为判断待测样本是否含有三聚氰胺甲醛树脂信息的依据,最终实现对非法添加三聚氰胺甲醛树脂样本的检测。
2.根据权利要求1所述的饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法,其特征在于:所述步骤102,采用自适应迭代权重-偏最小二乘方法对近红外光谱数据进行预处理。
3.根据权利要求1所述的饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法,其特征在于:所述步骤103中,对训练样本的近红外光谱数据进行波段选择的方法:选用对类别敏感的间隔变量迭代空间收缩法,间隔变量迭代空间收缩法包括全局分析和局部分析两个方向对有用波段进行搜索,其中全局分析利用变量的权重优化了有用波段的间隔位置,局部分析通过相邻变量的权重优化了每个间隔的宽度。
4.根据权利要求3所述的饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法,其特征在于:所述全局分析和局部分析实现如下:
所述全局分析如下:
Step1:采用权重二进制矩阵采样法将训练样本的近红外光谱数据X随机组合为m个二进制子数据集x(k×p),k表示采样个数,p为波长变量个数,其中0<k<n,n为训练样本个数,选择每列权重初始值l使得所有波长变量在初始时具有相同的可能性,且x(k×p)中变量1的个数为lk;
Step2:将每一个二进制子数据集x(k×p)作为一个子模型进行回归分析;
Step3:分析比较m个二进制子数据集的均方根误差Rmse和预测误差R,取其中前k个均方根误差Rmse和预测误差R均较小的子模型,子模型个数为kbest,并且求得每个变量在这kbest个子模型中出现的次数fi,从而重新定义所述变量的权重为重复Step2和Step3不断更新变量的权重值,若所有子模型的均方根误差与预测误差不再改变即所有变量的权重都为常数时,权重为1的变量构成了光谱数据的有用波段,此时结束;
所述局部分析如下:
全局分析与局部分析交替进行,若全局分析中存在变量i的权重为1时,取该变量相邻的变量j放入子模型中进行回归分析,当模型误差降低时,变量j的权重设置为1,否则权重不变,权重赋值结束后,将权重赋值之后的变量跳转至全局分析继续执行,直至所有变量的权重保持不变。
5.根据权利要求1所述的饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法,其特征在于:所述步骤103中,训练样本的选取如下:
Step1:尽可能广泛的选取不同浓度三聚氰胺甲醛树脂掺假样本作为训练样本;
Step2:将纯饲料原料样本和纯三聚氰胺甲醛树脂样本作为空白样本添加到训练样本中;
Step3:再加入各类训练样本的平均光谱。
CN201710957053.6A 2017-10-16 2017-10-16 一种饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法 Active CN107478599B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710957053.6A CN107478599B (zh) 2017-10-16 2017-10-16 一种饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710957053.6A CN107478599B (zh) 2017-10-16 2017-10-16 一种饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法

Publications (2)

Publication Number Publication Date
CN107478599A CN107478599A (zh) 2017-12-15
CN107478599B true CN107478599B (zh) 2019-12-06

Family

ID=60606313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710957053.6A Active CN107478599B (zh) 2017-10-16 2017-10-16 一种饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法

Country Status (1)

Country Link
CN (1) CN107478599B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109632680B (zh) * 2019-01-29 2021-07-20 吉林大学 一种基于排列熵的水体中磷的检测方法
CN110059679B (zh) * 2019-04-22 2020-11-24 中国农业大学 一种基于近红外图像的饲料原料中污染物非目标检测方法
CN110376157B (zh) * 2019-07-19 2022-04-05 应急管理部天津消防研究所 一种判定泡沫塑料种类及其阻燃性能的检测分析方法
CN111079283B (zh) * 2019-12-13 2023-06-09 四川新网银行股份有限公司 对信息饱和度不均衡数据的处理方法
CN111307751B (zh) * 2020-03-18 2021-09-03 安徽大学 茶叶近红外光谱分析中谱图基线校正方法、系统、检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101520431A (zh) * 2009-03-25 2009-09-02 扬州大学 高灵敏的检测奶粉中三聚氰胺的方法
CN105115938A (zh) * 2015-07-29 2015-12-02 北京航空航天大学 一种饲料原料中三聚氰胺掺假定量检测方法
CN105954252A (zh) * 2016-04-21 2016-09-21 北京航空航天大学 一种饲料原料中非法添加物苏丹红的定性检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101520431A (zh) * 2009-03-25 2009-09-02 扬州大学 高灵敏的检测奶粉中三聚氰胺的方法
CN105115938A (zh) * 2015-07-29 2015-12-02 北京航空航天大学 一种饲料原料中三聚氰胺掺假定量检测方法
CN105954252A (zh) * 2016-04-21 2016-09-21 北京航空航天大学 一种饲料原料中非法添加物苏丹红的定性检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KNN, Kernels, Margins;Grzegorz Chrupala et al.;《http://grzegorz.chrupala.me/papers/ml4nlp/knn,kernels,margin.pdf》;20101031;8-10 *
基于光谱信息的空间目标模式识别算法研究;李庆波 等;《光谱学与光谱分析》;20161231;第36卷(第12期);4067-4068 *

Also Published As

Publication number Publication date
CN107478599A (zh) 2017-12-15

Similar Documents

Publication Publication Date Title
CN107478599B (zh) 一种饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法
CN108663339B (zh) 基于光谱和图像信息融合的霉变玉米在线检测方法
He et al. Study on lossless discrimination of varieties of yogurt using the Visible/NIR-spectroscopy
CN104374738B (zh) 一种基于近红外提高鉴别结果的定性分析方法
CN102590129B (zh) 近红外检测花生中氨基酸含量的方法
WO2020232959A1 (zh) 基于函数性主元分析的近红外光谱特征提取方法和系统
CN109668859A (zh) 基于svm算法的花椒产地和品种的近红外光谱识别方法
CN108169165B (zh) 基于太赫兹光谱和图像信息融合的麦芽糖混合物定量分析方法
CN104376325A (zh) 一种近红外定性分析模型的建立方法
CN102841069B (zh) 一种由中红外光谱识别原油种类的方法
CN110749565A (zh) 一种快速鉴别普洱茶存储年份的方法
Yin et al. Non-destructive detection of foreign contaminants in toast bread with near infrared spectroscopy and computer vision techniques
CN114112983B (zh) 一种基于Python数据融合的藏药全缘叶绿绒蒿产地判别方法
CN112730312A (zh) 一种基于近红外光谱技术的掺杂牛初乳定性识别方法
CN109520965A (zh) 一种基于近红外光谱特征数据提取技术检测赖氨酸含量的方法
CN106338488A (zh) 一种转基因豆奶粉的快速无损鉴别方法
CN112485238B (zh) 一种基于拉曼光谱技术鉴别姜黄精油产地的方法
Hao et al. Combined hyperspectral imaging technology with 2D convolutional neural network for near geographical origins identification of wolfberry
CN110378374B (zh) 一种模糊鉴别信息提取的茶叶近红外光谱分类方法
Cao et al. Potential of near-infrared spectroscopy to detect defects on the surface of solid wood boards
CN108398400B (zh) 利用太赫兹成像无损检测小麦中脂肪酸含量的方法
CN114331474A (zh) 一种模糊线性判别分析的牛奶产地溯源方法
CN113049526B (zh) 一种基于太赫兹衰减全反射的玉米种子水分含量测定方法
CN112229816B (zh) 基于opls-spa-mix-pls的木材弹性模量预测方法
Jia et al. An Identification of the Growing Area of Longjing Tea Based on the Fisher's Discriminant Analysis with the Combination of Principal Components Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant