CN112730312A - 一种基于近红外光谱技术的掺杂牛初乳定性识别方法 - Google Patents
一种基于近红外光谱技术的掺杂牛初乳定性识别方法 Download PDFInfo
- Publication number
- CN112730312A CN112730312A CN202110146821.6A CN202110146821A CN112730312A CN 112730312 A CN112730312 A CN 112730312A CN 202110146821 A CN202110146821 A CN 202110146821A CN 112730312 A CN112730312 A CN 112730312A
- Authority
- CN
- China
- Prior art keywords
- colostrum
- doped
- sample
- spectrum
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000021277 colostrum Nutrition 0.000 title claims abstract description 151
- 210000003022 colostrum Anatomy 0.000 title claims abstract description 151
- 241000283690 Bos taurus Species 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 28
- 238000005516 engineering process Methods 0.000 title claims abstract description 17
- 238000001228 spectrum Methods 0.000 claims abstract description 65
- 238000012937 correction Methods 0.000 claims abstract description 35
- 238000007781 pre-processing Methods 0.000 claims abstract description 19
- 238000012360 testing method Methods 0.000 claims abstract description 19
- 238000004458 analytical method Methods 0.000 claims abstract description 13
- 230000000694 effects Effects 0.000 claims abstract description 11
- 235000013336 milk Nutrition 0.000 claims description 47
- 239000008267 milk Substances 0.000 claims description 47
- 210000004080 milk Anatomy 0.000 claims description 47
- 230000003595 spectral effect Effects 0.000 claims description 17
- 239000000839 emulsion Substances 0.000 claims description 16
- 238000009499 grossing Methods 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 14
- 235000013365 dairy product Nutrition 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 6
- 238000012706 support-vector machine Methods 0.000 claims description 6
- 238000003064 k means clustering Methods 0.000 claims description 4
- 230000006651 lactation Effects 0.000 claims description 4
- 238000000513 principal component analysis Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 241001494479 Pecora Species 0.000 claims description 3
- 230000032696 parturition Effects 0.000 claims description 3
- 239000004575 stone Substances 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 13
- 235000013305 food Nutrition 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 47
- 239000002245 particle Substances 0.000 description 9
- 238000010239 partial least squares discriminant analysis Methods 0.000 description 8
- 239000000126 substance Substances 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 4
- 235000018102 proteins Nutrition 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 238000002203 pretreatment Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 235000020247 cow milk Nutrition 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 238000004497 NIR spectroscopy Methods 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- 102000007544 Whey Proteins Human genes 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000000149 argon plasma sintering Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 238000009614 chemical analysis method Methods 0.000 description 1
- 239000012468 concentrated sample Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 235000013861 fat-free Nutrition 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940088592 immunologic factor Drugs 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000002075 main ingredient Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 238000012567 pattern recognition method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000985 reflectance spectrum Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3577—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N2021/3595—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using FTIR
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于近红外光谱技术的掺杂牛初乳定性识别方法,属于食品快速检测领域。该方法采用傅里叶近红外光谱仪采集一批牛初乳及掺杂初乳的近红外漫反射光谱。为了提高识别准确率,首先进行光谱预处理以消除牛初乳的散射效应及噪声干扰,其中多元散射校正方法为最优预处理方法。进而采用3种无监督模型和3种有监督模型分别对样品识别准确率进行综合比较,其中基于全谱建立的偏最小二乘判别分析为最优模型,其测试集识别准确率为94.74%。将未知牛初乳样品经预处理后的光谱数据代入最佳模型即可对其定性识别。本发明基于近红外光谱技术定性识别掺杂牛初乳,具有快速、准确和可在线检测等优点。
Description
技术领域
本发明属于食品快速检测领域,特别是涉及一种基于近红外光谱技术的掺杂牛初乳定性识别方法。
背景技术
牛初乳中富含蛋白质、脂肪等营养成分以及免疫因子、生长因子等生物活性物质,被称为“乳黄金”。因此,牛初乳广受消费者青睐,其消费需求在逐渐增加。然而,初乳产量尚不足牛常乳产量的2%,其价格数倍于常乳。这驱使一些商家在初乳中添加一定量的常乳以获取较高的利润。这种不法行为不仅严重降低了初乳制品的质量,而且侵犯了消费者的合法权益。因此,检测初乳中常乳掺杂具有重要意义。
生产中通常根据初乳的颜色、密度、粘度及pH值等物理特性评判初乳的品质,但精度较差。中国专利号CN94112165.8所述的一种牛初乳的检测方法,通过检测细胞活力指标区别牛初乳与常乳,其特征在于所述细胞检测包括:细胞定量检测、巨噬细胞的定量检测以及巨噬细胞内酶的化学方法测定。其不足之处在于该方法需要对细胞进行培养筛选及细胞染色等,费时费力,且对操作者技术要求高。一些研究人员提出了放射免疫扩散法、高效液相色谱法和免疫透射比浊法等化学分析方法,通过测量初乳中主要营养成分免疫球蛋白含量作为衡量初乳是否掺假以及初乳品质的主要指标。但这些方法等均存在检测费时,成本高及操作复杂等问题,难以实现初乳品质的快速检测。
近红外光谱能够获得物质丰富的组成和结构信息,具有分析速度快、效率高、成本低等优点。近红外光谱技术已被用于预测牛常乳中的蛋白质、脂肪、乳糖含量及体细胞数等,而现有研究均未涉及牛初乳掺杂常乳的定性识别方面。牛初乳中脂肪和蛋白质浓度高,且样本之间化学成分和粒度差异较大,散射效应会加剧其光谱与低比例掺杂初乳的光谱重叠程度。为此,有必要开发一种基于近红外光谱技术定性识别掺杂牛初乳的方法,重点是选择预处理方法以消除样品对光谱散射效应及噪声干扰,以保障牛初乳及其乳制品品质,为牛初乳掺杂常乳提供一种快速、准确和可在线检测的定性识别技术。
发明内容
针对现有技术中的缺陷与不足,本发明的目的在于提供一种基于近红外光谱技术的掺杂牛初乳定性识别方法。通过傅里叶近红外光谱仪采集一批牛初乳及掺杂初乳的近红外漫反射光谱,根据牛初乳非均质的特点,采用光谱预处理方法消除散射效应及噪声干扰,进而建立定性识别掺杂牛初乳的无监督或有监督模型,对比分析模型识别准确率,确定最佳模型。将未知牛初乳样品经预处理后的光谱数据代入最佳模型即可对其定性识别。本发明的方法也可以用于羊初乳掺杂的定性识别。
一种基于近红外光谱技术的掺杂牛初乳定性识别方法,包括如下步骤:
步骤一:收集一批来源于不同地区,不同季节,不同饲养条件的不同个体牛乳样本;采集奶牛分娩3天内的乳为初乳样品,正常泌乳期奶牛的鲜乳为常乳样品;室温下保存初乳及常乳样品,按照初乳掺杂常乳质量分数为10%、20%、30%、40%及50%的比例配置掺杂初乳样品;将每个初乳样品和配制的掺杂初乳样品分为3份备用;
步骤二:预热近红外光谱测量仪器,设置光谱仪采集参数,主要包括扫描范围、扫描次数、分辨率;使用振荡器将样品混合均匀,在25℃下测量样品的近红外光谱,每个样品3次重复,测量结果平均值为最终光谱数据;
步骤三:根据牛初乳非均质的特点,选择Savitzky-Golay平滑、标准正态变换、多元散射校正及其组合方法进行光谱预处理,以消除牛初乳样品对光谱的散射效应及噪声干扰;利用Kennard-Stone划分方法将样本按照2:1或者3:1的比例划分为校正集和测试集,初乳及不同比例掺杂初乳样品在校正集和测试集中的比例相同;
步骤四:基于不同光谱预处理及样本划分比例,对比偏最小二乘判别分析模型识别初乳及掺杂初乳的准确率,优选出多元散射校正光谱预处理及3:1样本划分比例;
步骤五:以优选的多元散射校正预处理方法处理原始光谱数据,结合牛初乳及掺杂初乳光谱特点,选择主成分分析、K-means聚类及层次聚类三种无监督模型,根据初乳及掺杂初乳样本光谱相似性进行聚类;选择偏最小二乘判别分析、支持向量机和极限学习机三种有监督模型,通过训练集样本的学习对测试集样本进行分类。基于无监督模型及有监督模型的识别准确率,对比确定最优模型为基于全谱的偏最小二乘判别分析模型;
步骤六:对于未知的牛初乳样品,按照步骤二完成近红外漫反射光谱的采集,将采集的未知牛初乳样品光谱数据经步骤四确定的多元散射校正预处理后,代入步骤五确定的最佳定性识别模型中,对该样品快速准确识别。
该方法同样适用于羊初乳掺杂的定性识别。
其中,步骤三中所述的组合方法是指Savitzky-Golay平滑分别与标准正态变换、多元散射校正组合构成的光谱预处理方法。
本发明可以取得的有益技术效果:
(1)测量快速高效,便于实现在线检测。由于本发明提供的方法只需要测量未知牛初乳样品的近红外漫反射光谱,对光谱进行预处理即可通过相应模型对其进行识别。测量时间短,且对操作者技术要求不高。基于本发明提供的方法便于开发专用的检测仪器,实现掺杂牛初乳的在线检测。
(2)识别准确率高。本发明中经过光谱预处理,建立的初乳和掺杂初乳定性识别模型测试集中准确率达到94.74%,因此基于本发明的掺杂初乳定性识别方法可以获得较高的识别精度,可以在生产中应用。
附图说明
图1是本发明一种基于近红外光谱技术的掺杂牛初乳定性识别方法的流程图;
图2是试验所用牛初乳及常乳平均近红外光谱曲线;
图3是不同方法进行预处理的光谱图;
图4是原始光谱预处理前后最佳模型对初乳和掺杂初乳样品识别结果图。
具体实施方式
本发明对各品种乳牛的初乳掺杂常乳定性识别具有良好的通用性;由于奶牛品种较多,本发明以‘荷斯坦’奶牛分娩3天内所产的牛初乳及正常泌乳期奶牛所产的常乳样品为实施例,其他乳牛初乳掺杂常乳定性识别均可以参照该实施例的方法进行。具体根据所测初乳样品,选择光谱预处理方法,建立相应的判别模型,即可对初乳样品快速准确判别。
下面结合发明人给出的说明书附图和实施例对本发明一种基于近红外光谱技术的掺杂牛初乳定性识别方法做进一步说明。
依据本发明实施例的方法包括以下步骤:
步骤一:收集一批来源于不同地区,不同季节,不同饲养条件的不同个体牛乳样本,采集奶牛分娩3天内的乳为初乳样品,正常泌乳期奶牛的鲜乳为常乳样品。本实施例中的初乳及常乳采自陕西省杨凌科元克隆股份有限公司及其周边2个奶场饲养的‘荷斯坦’奶牛。为了探究初乳及常乳样品对近红外光谱的散射影响,对初乳及常乳主要成分指标及粒度分布进行了分析。
初乳及常乳主要成分指标(平均值±标准偏差)见表1。牛乳样品主要成分有较大的变化范围,表明样品具有良好的代表性。
表1 试验牛初乳及常乳样品主要成分指标,%
样品 | 脂肪 | 蛋白质 | 乳清蛋白 | 非脂乳固体 | 乳糖 | 含水率 |
初乳 | 4.27±0.72 | 10.99±1.26 | 3.11±0.98 | 15.96±3.18 | 3.34±0.50 | 80.35±1.39 |
常乳 | 4.03±1.23 | 3.70±0.34 | 0.79±0.13 | 9.15±0.22 | 4.67±0.12 | 86.70±0.95 |
初乳与常乳中粒度分布情况如表2所示,初乳的d(0.5)与D[3,2]平均值分别为2.413、1.713μm,与常乳相差不大;而d(0.9)与D(4,3)的平均值分别为7.387、3.203μm,高于常乳。初乳样品不同粒度分布参数标准偏差值较大,这意味着牛初乳的非均质特性高于正常牛乳,对光谱的散射影响更大。
表2 初乳及常乳的粒度分布
粒度分布参数(μm) | d(0.5) | d(0.9) | D[4,3] | D[3,2] |
初乳 | 2.413±0.214 | 7.387±1.123 | 3.203±0.434 | 1.713±0.089 |
正常乳 | 2.413±0.051 | 5.465±0.173 | 2.684±0.162 | 1.709±0.033 |
表中符号说明:d(0.5)和d(0.9)分别表示样品的累计粒度分布百分数达到50%和90%时所对应的粒径;D[4,3]、D[3,2]分别表示粒子体积矩和表面体积平均直径。
通过分析初乳与常乳的主要成分和粒度分布(表1和表2)可知,初乳中蛋白质、脂肪、非脂乳固体等成分含量较高,含水率较低,特别是各成分(除脂肪外)含量的标准差远大于正常乳;另一方面,初乳中脂肪球粒度分布d(0.9)和D[4,3]远大于正常乳,这也意味着散射效应对近红外光谱稳定性的影响更大。
图2分析了试验所用牛初乳及常乳样品平均近红外光谱曲线,由于初乳与常乳成分含量的差异,任一波长下,常乳的平均吸光度大于初乳。
本实施例中由不同的牛初乳和常乳样本按照掺杂质量分数为10%、20%、30%、40%和50%配置掺杂牛初乳样本,最终共得到牛初乳样本49份,不同比例下掺杂初乳样本各21份;室温下保存初乳及常乳样品,并在5h内完成样品配置和近红外光谱采集;将每个初乳样品和配制的掺杂初乳样品分为3份备用。
步骤二:本实施例中采用德国Bruker公司的MPA型傅里叶近红外光谱仪采集样品的近红外漫反射光谱。试验前预热近红外光谱测量仪器20min以上,该光谱仪的光谱扫描范围为833~2500 nm,采集波长数2074个,扫描次数32次,光谱分辨率8 cm-1,光谱采样技术为积分球漫反射技术。使用振荡器将样品混合均匀,在25℃下测量样品的近红外光谱,每个样品3次重复,测量结果平均值为最终光谱数据。
步骤三:预处理原始近红外光谱曲线。为了消除牛初乳样品对近红外光谱的散射效应和及其他无关因素对建模效果的影响,结合牛初乳非均质的特点,分别采用Savitzky-Golay平滑、标准正态变换、多元散射校正及其组合预处理方法对光谱进行预处理。
Savitzky-Golay平滑通过多项式来对移动窗口内的数据进行最小二乘拟合,能有效地提高牛乳样品光谱的平滑性,降低噪声的干扰;标准正态变换对每条光谱进行标准化处理,以消除量纲影响和变量自身变异大小及数值大小的影响,用于消除样本中脂肪球散射等影响;多元散射校正能够分离散射介质光谱中光散射信息和化学光吸收信息,并对不同光谱之间的散射信息差异进行消除,即把不同样品光谱中的散射信息校正到同一水平。考虑到样本的复杂性,将Savitzky-Golay平滑分别与标准正态变换和多元散射校正组合,与三种单一预处理方法进行综合比较,以寻找更合适的光谱预处理方法。图3为不同方法预处理光谱图,原始光谱比较分散,绝对强度差异较大,标准正态变换、多元散射校正处理后的光谱离散程度均明显降低,光谱重复性提高,减弱了散射对原始光谱的影响。
图3中符号说明:
S-G表示Savitzky-Golay平滑;SNV表示标准正态变换;MSC表示多元散射校正;S-G+ SNV表示Savitzky-Golay平滑与标准正态变换组合;S-G +MSC表示Savitzky-Golay平滑与多元散射校正组合。
利用Kennard-Stone样本划分方法将样本按照2:1或者3:1的比例划分为校正集和测试集,初乳及不同比例掺杂初乳样品在校正集和测试集的比例相同。
步骤四:以经典的定性识别算法—偏最小二乘判别分析优选光谱预处理方法。表3给出了光谱未经预处理以及经Savitzky-Golay平滑、标准正态变换、多元散射校正、Savitzky-Golay平滑结合标准正态变换、Savitzky-Golay平滑结合多元散射校正预处理后偏最小二乘判别分析模型的识别结果,同时对不同样本划分比例效果进行比较。由表3可知,当样本划分比例为3:1、预处理方法为多元散射校正时偏最小二乘判别分析模型测试集准确率达到最高,为94.74%。因此优选多元散射校正预处理及3:1样本划分比例。
表3 不同处理方法下偏最小二乘判别分析模型的准确率
表中符号说明:
Untreated表示光谱未经预处理;S-G表示Savitzky-Golay平滑;SNV表示标准正态变换;MSC表示多元散射校正;S-G + SNV表示Savitzky-Golay平滑与标准正态变换组合;S-G +MSC表示Savitzky-Golay平滑与多元散射校正组合。
步骤五:以优选的MSC光谱预处理方法处理光谱数据,结合牛初乳及掺杂初乳光谱特点,建立无监督聚类及有监督判别两类机器学习领域常用方法,以确定定性识别初乳和掺杂初乳的最佳模型。
以灵敏度、特异性和准确率综合评价无监督和有监督模型的识别性能。灵敏度指初乳样品被正确判别为初乳样品的比例,%;特异性指掺杂初乳样品被正确判别为掺杂初乳样品的比例,%;准确率为初乳和掺杂初乳样品被正确判别的比例,%。
经多元散射校正预处理后,建立主成分分析、K-means聚类及层次聚类三种无监督模型,根据初乳及掺杂初乳光谱相似性进行聚类。主成分分析通过将高维特征映射到低维特征空间上,选择可以反映原始变量信息的主成分,进而根据变量之间相似性进行分类;K-means聚类将最靠近聚类中心的对象归为一类,通过迭代的方式逐次更新聚类中心的值,直到得到最好的聚类结果;层次聚类法将距离最近的样本不断进行合并,通过对给定的样本进行层次分解直到满足条件为止。三种无监督模式识别方法的分类结果如表4所示。
表4 三种无监督模型的分类结果
经MSC预处理后,建立偏最小二乘判别分析、支持向量机和极限学习机三种有监督模型,对初乳及掺杂初乳进行分类识别。偏最小二乘判别分析将不同类别的样品与光谱数据进行回归分析,根据样品预测值及标准值的差异进行分类;支持向量机通过在高维空间建立最优决策边界实现不同类之间的最大化间隔,从而对样本进行分类;极限学习机通过输入单隐层神经网络权重和偏置得到相应的输出权重,进而对待测样本进行分类识别。
建立有监督模型时,将所有初乳和掺杂初乳样本按照3:1的比例分为校正集和测试集,最后校正集中样本数为116,包括36个初乳,80个掺杂初乳;测试集样本数为38,包括13个初乳,25个掺杂初乳。采用连续投影算法和无信息变量消除法分别从全谱中提取出12、551个表达初乳及掺杂初乳特征的波长,以校正集中样品的全谱和经连续投影算法和无信息变量消除法提取的特征波长作为偏最小二乘判别分析、支持向量机和极限学习机网络的输入变量,建立掺杂初乳定性判别模型,并用测试集样本对模型进行验证。三种有监督模型对初乳及掺杂初乳识别结果如表5所示。
表5 有监督模型掺杂初乳定性判别结果
表中符号说明:PLS-DA、SVM及ELM分别表示偏最小二乘判别分析、支持向量机和极限学习机模型;FS表示全谱,SPA表示经连续投影算法从全谱中提取特征波长,UVE表示经无信息变量消除法从全谱中提取特征波长。
通过计算并比较无监督与有监督两类模型的识别准确率(表4和表5),可以发现,与无监督模式分类方法相比,基于类别的有监督方法具有更强的鉴别能力,3种有监督识别模型的准确率均达到80%以上。其中,基于全谱建立的偏最小二乘判别分析模型的测试集中灵敏度、特异性和准确率均达到了最高,分别为84.62%、100%和94.74%。因此,针对本实施例,定性识别掺杂牛初乳的最佳模型为基于全谱的偏最小二乘判别分析模型。
为了进一步明确光谱预处理对本发明一种基于近红外光谱技术识别掺杂牛初乳模型精度的影响,对原始光谱进行建模分析,模型建立方法同上(表4和表5)。表6列出了本实施例中原始光谱无预处理及多元散射校正预处理下对初乳及掺杂初乳的最佳识别效果。结果表明经过多元散射校正光谱预处理,最优识别模型测试集的准确率提高了5.27%。图4显示了预处理前后偏最小二乘判别分析模型模型对初乳和掺杂初乳样品识别结果。结果表明,合理选择光谱预处理方法对提高本发明一种基于近红外光谱技术识别掺杂牛初乳模型精度具有重要意义。
表6 原始光谱预处理前后最佳模型识别结果对比
表中符号说明:
FS-PLS-DA表示基于全谱建立的偏最小二乘判别分析模型。
步骤六:对于未知的牛初乳样品,按照步骤二完成近红外漫反射光谱的采集,将采集的未知牛初乳样品光谱数据经步骤四确定的多元散射校正预处理后,代入步骤五确定的最佳定性识别模型中,对该样品快速准确识别。
由以上实施例可以看出,本发明利用近红外光谱技术可以快速、准确的对掺杂牛初乳进行定性识别。
要说明的是,以上内容仅用以说明本发明的一种技术方案,而非对本发明保护范围的限制,本领域的技术人员对本发明的技术方案进行的简单修改或者等同替换均不超过本发明所述的范围。
Claims (3)
1.一种基于近红外光谱技术的掺杂牛初乳定性识别方法,其特征在于,包括以下步骤:
步骤一:收集一批来源于不同地区,不同季节,不同饲养条件的不同个体牛乳样本;采集奶牛分娩3天内的乳为初乳样品,正常泌乳期奶牛的鲜乳为常乳样品;室温下保存初乳及常乳样品,按照初乳掺杂常乳质量分数为10%、20%、30%、40%及50%的比例配置掺杂初乳样品;将每个初乳样品和配制的掺杂初乳样品分为3份备用;
步骤二:预热近红外光谱测量仪器,设置光谱仪采集参数,主要包括扫描范围、扫描次数、分辨率;使用振荡器将样品混合均匀,在25℃下测量样品的近红外光谱,每个样品3次重复,测量结果平均值为最终光谱数据;
步骤三:根据牛初乳非均质的特点,选择Savitzky-Golay平滑、标准正态变换、多元散射校正及其组合方法进行光谱预处理,以消除牛初乳样品对光谱的散射效应及噪声干扰;利用Kennard-Stone划分方法将样本按照2:1或者3:1的比例划分为校正集和测试集,初乳及不同比例掺杂初乳样品在校正集和测试集中的比例相同;
步骤四:基于不同光谱预处理及样本划分比例,对比偏最小二乘判别分析模型识别初乳及掺杂初乳的准确率,优选出多元散射校正光谱预处理及3:1样本划分比例;
步骤五:以优选的多元散射校正预处理方法处理原始光谱数据,结合牛初乳及掺杂初乳光谱特点,选择主成分分析、K-means聚类及层次聚类三种无监督模型,根据初乳及掺杂初乳样本光谱相似性进行聚类;选择偏最小二乘判别分析、支持向量机和极限学习机三种有监督模型,通过训练集样本的学习对测试集样本进行分类;基于无监督模型及有监督模型的识别准确率,对比确定最优模型为基于全谱的偏最小二乘判别分析模型;
步骤六:对于未知的牛初乳样品,按照步骤二完成近红外漫反射光谱的采集,将采集的未知牛初乳样品光谱数据经步骤四确定的多元散射校正预处理后,代入步骤五确定的最佳定性识别模型中,对该样品快速准确识别。
2.根据权利要求1所述的一种基于近红外光谱技术的掺杂牛初乳定性识别方法,其特征在于,该方法同样适用于羊初乳掺杂常乳的定性识别。
3.根据权利要求1所述的一种基于近红外光谱技术的掺杂牛初乳定性识别方法,其特征在于,步骤三中所述的组合方法是指Savitzky-Golay平滑分别与标准正态变换、多元散射校正组合构成的光谱预处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110146821.6A CN112730312A (zh) | 2021-02-03 | 2021-02-03 | 一种基于近红外光谱技术的掺杂牛初乳定性识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110146821.6A CN112730312A (zh) | 2021-02-03 | 2021-02-03 | 一种基于近红外光谱技术的掺杂牛初乳定性识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112730312A true CN112730312A (zh) | 2021-04-30 |
Family
ID=75596572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110146821.6A Pending CN112730312A (zh) | 2021-02-03 | 2021-02-03 | 一种基于近红外光谱技术的掺杂牛初乳定性识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112730312A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113740394A (zh) * | 2021-10-18 | 2021-12-03 | 西北农林科技大学 | 一种基于介电谱技术的掺杂牛初乳定性识别方法 |
CN114184725A (zh) * | 2021-11-18 | 2022-03-15 | 上海应用技术大学 | 一种检测生鲜乳中棕榈油含量的方法及装置 |
CN114863286A (zh) * | 2022-06-02 | 2022-08-05 | 青岛科技大学 | 一种基于多算法协同选优的混合废塑料分类方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1804582A (zh) * | 2006-01-18 | 2006-07-19 | 中国农业大学 | 一种利用近红外光谱鉴别生鲜乳和商品乳中的还原乳的方法 |
CN102590128A (zh) * | 2012-01-10 | 2012-07-18 | 上海市兽药饲料检测所 | 利用近红外光谱进行生鲜乳掺假识别的方法 |
CN108593592A (zh) * | 2018-04-19 | 2018-09-28 | 广东药科大学 | 一种基于近红外光谱技术的半夏掺伪鉴别方法 |
-
2021
- 2021-02-03 CN CN202110146821.6A patent/CN112730312A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1804582A (zh) * | 2006-01-18 | 2006-07-19 | 中国农业大学 | 一种利用近红外光谱鉴别生鲜乳和商品乳中的还原乳的方法 |
CN102590128A (zh) * | 2012-01-10 | 2012-07-18 | 上海市兽药饲料检测所 | 利用近红外光谱进行生鲜乳掺假识别的方法 |
CN108593592A (zh) * | 2018-04-19 | 2018-09-28 | 广东药科大学 | 一种基于近红外光谱技术的半夏掺伪鉴别方法 |
Non-Patent Citations (4)
Title |
---|
JELENA MUNCAN ET AL.: "Near infrared aquaphotomics study on common dietary fatty acids in cows liquid,thawed milk", 《FOOD CONTROL》 * |
张鑫等: "基于近红外光谱技术的掺假生鲜乳识别平台的研发", 《中国奶牛》 * |
荣菡等: "基于PLS-模式识别近红外光谱技术快速检测鲜乳和掺假乳", 《食品科学》 * |
陆畅: "基于介电谱和近红外光谱的牛初乳中掺常乳识别研究", 《中国优秀博硕士学位论文全文数据库(硕士) 工程科技Ⅰ辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113740394A (zh) * | 2021-10-18 | 2021-12-03 | 西北农林科技大学 | 一种基于介电谱技术的掺杂牛初乳定性识别方法 |
CN113740394B (zh) * | 2021-10-18 | 2024-03-01 | 西北农林科技大学 | 一种基于介电谱技术的掺杂牛初乳定性识别方法 |
CN114184725A (zh) * | 2021-11-18 | 2022-03-15 | 上海应用技术大学 | 一种检测生鲜乳中棕榈油含量的方法及装置 |
CN114863286A (zh) * | 2022-06-02 | 2022-08-05 | 青岛科技大学 | 一种基于多算法协同选优的混合废塑料分类方法 |
CN114863286B (zh) * | 2022-06-02 | 2024-03-08 | 青岛科技大学 | 一种基于多算法协同选优的混合废塑料分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112730312A (zh) | 一种基于近红外光谱技术的掺杂牛初乳定性识别方法 | |
Balan et al. | Application of Attenuated Total Reflectance-Fourier Transform Infrared (ATR-FTIR) spectroscopy coupled with chemometrics for detection and quantification of formalin in cow milk | |
Wu et al. | Classification of apple varieties using near infrared reflectance spectroscopy and fuzzy discriminant c‐means clustering model | |
Zaukuu et al. | Authentication of Tokaj wine (Hungaricum) with the electronic tongue and near infrared spectroscopy | |
WO2020232959A1 (zh) | 基于函数性主元分析的近红外光谱特征提取方法和系统 | |
An et al. | Effect of spectral pretreatment on qualitative identification of adulterated bovine colostrum by near-infrared spectroscopy | |
Balan et al. | Rapid detection and quantification of sucrose adulteration in cow milk using Attenuated total reflectance-Fourier transform infrared spectroscopy coupled with multivariate analysis | |
CN107478599B (zh) | 一种饲料原料中非法添加物三聚氰胺甲醛树脂的检测方法 | |
Fadock et al. | Visible-near infrared reflectance spectroscopy for nondestructive analysis of red wine grapes | |
CN105044024A (zh) | 一种基于近红外光谱技术对葡萄果实进行无损检测的方法 | |
CN113310936A (zh) | 四种高温灭菌商品牛奶的快速鉴定方法 | |
CN111272668A (zh) | 小麦品种鉴别模型的构建方法 | |
CN113310930A (zh) | 高温灭菌奶、巴氏杀菌奶和掺加高温灭菌奶的巴氏杀菌奶的光谱鉴定方法 | |
CN113310934A (zh) | 骆驼奶中掺加奶牛奶及其掺加比例的快速鉴定方法 | |
CN106338488A (zh) | 一种转基因豆奶粉的快速无损鉴别方法 | |
CN105675538A (zh) | 一种胡麻饼养分的检测方法 | |
CN113324940A (zh) | 特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的光谱分级方法 | |
CN113324943A (zh) | 牦牛奶及其掺加奶牛奶的快速鉴别模型 | |
CN113310937A (zh) | 高温灭菌牛奶、巴氏杀菌奶牛鲜奶及奶粉复原牛奶的快速鉴定方法 | |
CN109358022A (zh) | 一种快速判别烟用爆珠类型的方法 | |
Shen et al. | Discrimination of blended Chinese rice wine ages based on near-infrared spectroscopy | |
CN113310929A (zh) | 高温灭菌奶中掺加豆粉及其掺加比例的光谱鉴定方法 | |
CN112945901A (zh) | 一种基于近红外光谱的青贮大豆品质检测方法 | |
CN113310938A (zh) | 一种巴氏杀菌的水牛鲜奶和奶牛鲜奶的快速鉴定方法 | |
CN115586159A (zh) | 基于中红外光谱检测技术的白酒陈化缔合程度评定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210430 |