CN114166779B - 牛奶中β-酪蛋白的中红外快速批量检测方法 - Google Patents
牛奶中β-酪蛋白的中红外快速批量检测方法 Download PDFInfo
- Publication number
- CN114166779B CN114166779B CN202111356105.7A CN202111356105A CN114166779B CN 114166779 B CN114166779 B CN 114166779B CN 202111356105 A CN202111356105 A CN 202111356105A CN 114166779 B CN114166779 B CN 114166779B
- Authority
- CN
- China
- Prior art keywords
- milk
- casein
- beta
- model
- mid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000013336 milk Nutrition 0.000 title claims abstract description 56
- 210000004080 milk Anatomy 0.000 title claims abstract description 56
- 239000008267 milk Substances 0.000 title claims abstract description 55
- 102000011632 Caseins Human genes 0.000 title claims abstract description 49
- 108010076119 Caseins Proteins 0.000 title claims abstract description 49
- 235000021247 β-casein Nutrition 0.000 title claims abstract description 42
- 238000001514 detection method Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000005259 measurement Methods 0.000 claims abstract description 14
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 11
- 238000010238 partial least squares regression Methods 0.000 claims description 9
- 238000001228 spectrum Methods 0.000 abstract description 16
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 abstract description 15
- 235000013365 dairy product Nutrition 0.000 abstract description 10
- 238000010521 absorption reaction Methods 0.000 abstract description 9
- 238000007781 pre-processing Methods 0.000 abstract description 3
- 235000020185 raw untreated milk Nutrition 0.000 abstract description 3
- 239000000523 sample Substances 0.000 description 24
- 238000004476 mid-IR spectroscopy Methods 0.000 description 19
- 241000283690 Bos taurus Species 0.000 description 14
- 230000000694 effects Effects 0.000 description 8
- 238000012216 screening Methods 0.000 description 7
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 239000005018 casein Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 5
- 235000021240 caseins Nutrition 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 238000002203 pretreatment Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 206010002198 Anaphylactic reaction Diseases 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 208000003455 anaphylaxis Diseases 0.000 description 2
- 235000013351 cheese Nutrition 0.000 description 2
- 235000020247 cow milk Nutrition 0.000 description 2
- 239000008367 deionised water Substances 0.000 description 2
- 229910021641 deionized water Inorganic materials 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 229960000789 guanidine hydrochloride Drugs 0.000 description 2
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 235000018102 proteins Nutrition 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 238000004007 reversed phase HPLC Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 235000021246 κ-casein Nutrition 0.000 description 2
- XFHNDVPKJVCYBJ-UHFFFAOYSA-N 1-bromo-1-nitropropane-1,2-diol Chemical compound CC(O)C(O)(Br)[N+]([O-])=O XFHNDVPKJVCYBJ-UHFFFAOYSA-N 0.000 description 1
- 108050000244 Alpha-s1 casein Proteins 0.000 description 1
- 102000009366 Alpha-s1 casein Human genes 0.000 description 1
- 108090000746 Chymosin Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 102000004407 Lactalbumin Human genes 0.000 description 1
- 108090000942 Lactalbumin Proteins 0.000 description 1
- 102000014171 Milk Proteins Human genes 0.000 description 1
- 108010011756 Milk Proteins Proteins 0.000 description 1
- 108010001441 Phosphopeptides Proteins 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- 238000003287 bathing Methods 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 229940080701 chymosin Drugs 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000249 desinfective effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005485 electric heating Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000012214 genetic breeding Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 235000021239 milk protein Nutrition 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- WROMPOXWARCANT-UHFFFAOYSA-N tfa trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F.OC(=O)C(F)(F)F WROMPOXWARCANT-UHFFFAOYSA-N 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
- 235000021119 whey protein Nutrition 0.000 description 1
- 235000021241 α-lactalbumin Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3577—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明属于奶牛性能测定和牛奶品质检测领域,公开了牛奶中β‑酪蛋白的中红外光谱快速批量检测方法。申请人在特征波段的选择时使用人工手动选择+多次遍历的方法,最终选取用于建模的特征波段,特别是筛选出了包含部分水的吸收区域,并证明了增加部分水吸收波段可以提升模型的准确性,同时选用了同一个牛奶样本第二次测定的光谱MIR进行建模,提升了第一次光谱测定数据建模的模型精准性。最终筛选出了数据预处理方法与模型算法的最优组合,并确定了最优参数,提高了模型的准确性。本发明的方法实现了原料奶中β‑酪蛋白含量的快速、准确、低成本的检测,将可广泛应用于奶牛性能测定和牛奶质量品质检测。
Description
技术领域:
本发明属于奶牛性能测定和牛奶质量品质检测领域,具体涉及牛奶中β-酪蛋白的中红外快速批量检测方法。
背景技术
牛奶一直被认为是自然界中天然形成的最完美的食物之一,乳中营养物质含量丰富且种类多样,尤其是牛奶中蛋白质,如酪蛋白、乳清蛋白等对人体健康有重要的影响,目前已成为国人最重要的营养来源之一。
β-酪蛋白含量占总酪蛋白比例比大约占比30%左右,据研究显示有13种亚型,其中A1与A2亚型最为常见,A2亚型是自然界种原本存在的基因型,但由于基因突变导致目前奶牛A1亚型在牛群中占大多数。有A1亚型的奶牛生产的牛奶容易引起过敏反应,A2A2基因型的奶牛生产的A2牛奶目前被认为是高品质牛奶,更容易被吸收消化而且不易产生过敏反应[1]。而研究高产A2牛奶有很大的研究必要和市场潜力。
大多数研究表明β-酪蛋白的含量并不会对奶酪的品质产生积极的影响。β-酪蛋白的相对含量较低时,牛奶形成的凝乳更硬[2]。较高的κ酪蛋白:β-酪蛋白比值对凝乳的硬度有积极影响[2]。但也有研究表明,β-酪蛋白的含量和比例与RCT(凝乳酶)呈负相关,低β-酪蛋白含量会产生弱凝乳状态[3],同时β-酪蛋白与αS1酪蛋白和κ酪蛋白均呈负相关(Amalfitano,et al.7),所以因选择β-酪蛋白含量较低的奶源进行奶酪制作。
关于β-酪蛋白的测定方法目前暂无国家标准,但常见的方法有高效液相色谱法[5-6]、酶联免疫吸附测定法[7]等,但都存在成本高和效率低等问题,很难在生产实践中快速批量化使用。中红外光谱MIR(Mid-Infrared Spectroscopy)技术是一种非常经济高效的检测工具,通过中红外光对分子中特定化学键吸收所在的频率和对应的波峰的不同,来预测所研究物质和性状的性质或含量,从而可以得知生物的生理状态等信息。在畜牧行业中,通过MIR来检测奶牛的营养、生理等指标在国内已经逐渐兴起,现已经可以对蛋白总量和脂肪总量等指标进行检测,但目前暂无精度很高的β-酪蛋白含量的快速批量检测模型。
目前国外开始了基于中红外检测牛奶中物质成份的研究,但都存在精度不高,特征波段不够准确等问题[8-9],国内还没有相关报道。与其它国家相比,中国奶牛因受到国内气候、地理环境和饲养条件等影响,与国外奶牛存在较大差异,牛奶品质也有其特点,国外检测模型并不一定适合于中国奶牛,故需要尽快建立具有我国自主产权的适合于中国奶牛牛奶的β-酪蛋白含量检测方法,不仅可用于快速、高效、准确和无创测定奶牛泌乳性状中重要性能指标β-酪蛋白含量,为奶牛遗传育种提供表型数据及理论依据,而且可检测分析原料牛奶及奶制品中总酪蛋白含量,为乳业加工业和消费者提供参考。本发明的目的即为解决目前存在的问题,建立β-酪蛋白的快速检测技术,为中国奶业的发展提供技术保障。
发明内容
本发明的目的在于提供了牛奶中β-酪蛋白的中红外快速批量检测方法,方法简单,快速,与真实值相比,准确率高。
为了达到上述目的,本发明采取以下技术措施:
牛奶中β-酪蛋白的中红外快速批量检测方法,包括下述步骤:
1.采集牛奶样本中的红外光谱中特征波段为:979.93cm-1-1361.87cm-1、1712.95cm-1-1793.97cm-1、2391.96cm-1-3113.41cm-1、3584.08cm-1-3730.69cm-1中的MIR数据;
2.将测定所得到的MIR数据代入none(无预处理)+PLS-DA(n_component=33)模型中,即可输出β-酪蛋白含量的预测结果。
以上所述的方法中,优选的,步骤1中每一段前后允许有两个波点的差距。
本发明的保护范围还包括:上述检测方法用于检测牛奶中β-酪蛋白的含量。
与现有技术相比,本发明优点在于:
1.在特征波段的选择方面,打破了常用的使用算法筛选特征,而是使用人工手动选择+多次遍历的方法。最终选取用于建模的特征波段,特别是筛选出了包含部分水的吸收区域,并证明了增加部分水吸收波段可以提升模型的准确性。
2.选用了同一个牛奶样本测定两次的平均光谱MIR进行建模,提升了单次光谱测定数据建模的模型精准性。
3.选取了β-酪蛋白模型建立的最优预处理与算法组合,确定了无预处理效果最佳,同时确定了最优参数,提高了模型的准确性。
4.实现了原料奶中β-酪蛋白含量的快速、准确、低成本的检测,实现了快速批量检测,每一个样本的测定时间仅需10-15秒,提高了检测效率,具有较强的实用性,将可广泛应用于奶牛性能测定和牛奶质量品质检测。
附图说明
图1为未经处理的牛奶样品中红外光谱图(a)与平均光谱图(b)。
图2为选取的四个特征波段光谱总图。
图3为每个特征波段放大图。
图4为模型牛奶数据真实值与预测值相关性与拟合直线图。
具体实施方式
本发明所述技术方案,如未特别说明,均为本领域的常规方案;所述试剂或材料,如未特别说明,均来源于商业渠道。
1.实验材料
试验材料来源于中国四个地区9个奶牛场的277头中国荷斯坦牛,每头牛采集一份奶样,奶样采集利用自动挤奶装置完成,先用消毒后的毛巾擦拭牛奶房,然后用碘甘油混合溶液对乳房消毒,挤掉前三把乳汁后,对挤奶全过程奶样进行采集,每份奶样采集40ml,分装到直径3.5cm,高9cm的圆柱形全新采样瓶里,依次编号,并向每个采样瓶里立即加入溴硝丙二醇防腐剂,缓慢摇晃使其充分溶解,运回途中在奶样周围放置冰袋(2-4℃)防止变质,样本到达实验室后立即进行光谱采集。所有牛奶样品均采集了两次光谱数据。
样本信息统计表
2.中红外光谱测定与采集
将样品倒入直径3.5cm,高9cm的圆柱形样品管中,在42℃水浴锅中水浴15-20min,使用FOSS公司的MilkoScanTM7RM乳成分检测仪,将固体光纤探头伸到液体中,对样品进行混匀后扫描。
3.牛奶中β-酪蛋白的真实(参考)值检测方法
3.1仪器、设备和试剂
电热恒温水浴锅(武汉一恒苏净科学仪器有限公司);Waters液相色谱仪,包括自动进样器、柱温箱、进样瓶、涡漩振荡器、针管过滤器、0.22μm尼龙滤膜、RP-HPLC色谱柱:ZORBAX 300SB-C18(250mm×4.6mm,5μm,孔径:300A)。
β-酪蛋白(lot C-6905,纯度≥90%)等牛奶蛋白标准品购自Sigma公司;乙腈(色谱级,纯度≥99.8%)、盐酸胍和三氟乙酸(TFA)购自上海生工公司;其他试剂均为国产分析纯。
3.2实验方法
3.2.1中红外光谱的采集
利用MilkoScanTM FT+进行光谱采集,具体采集步骤为:将奶样分批放入45℃电热恒温水浴锅内预热5min,预热好的奶样放在检测架上上下摇晃数次使牛奶胶状溶液混合均匀,将检测架放在检测履带上,打开瓶盖,依次进行检测,采集完光谱后的奶样置于-20℃冷冻保存,用于后续β-酪蛋白的含量测定。
3.2.2β-酪蛋白含量的高效液相色谱技术测定
(1)标准样品的处理
先用去离子水将混合标样充分溶解,直到β-酪蛋白的浓度在10g/L左右,然后往1600μl处理液(6mol/L盐酸胍溶液)中加入400μl配好的混合标样溶液,充分混匀后于室温下孵育90min,上机前用0.22μm尼龙滤膜过滤。
(2)奶样的处理
取80μl牛奶加入到320μl处理液中,室温孵育90min,设置离心机转速为14000r/min,离心5min后取上清液。上机前用0.22μm尼龙滤膜过滤。
(3)RP-HPLC的色谱条件
色谱柱:ZORBAX 300SB-C18;进样量:50μl;柱温:40℃;流速:1ml/min;洗脱时间:42min;检测波长:214nm;A相:纯水;B相;纯乙腈。
流动相梯度洗脱条件和流速
最后立刻以初始梯度平衡色谱柱1min,预备下一个样品的检测,平均每批次检测样品20-30个。同一批次检测结束后会用10%甲醇+90%去离子水与100%甲醇清洗色谱柱进行维护,以保证下一批次样品的正常检测。
4.有效样本的选择
277个样本中,剔除掉样本变质、损耗、中红外光谱测定异常、样本参考值测定异常等操作导致的无效数据,共剔除掉了44个异常样本,选择了233个样本进行模型的建立与优化。
实施例1:
β-酪蛋白的预测模型算法的选择:
本申请目的为建立β-酪蛋白的定量测定模型,所以使用建模算法为回归算法。回归算法种类很多,本实施例主要使用了岭回归(Ridge)与偏最小二乘回归(PLSR)[9]算法进行模型建立与对比,理由如下:
岭回归是线性回归的一种。只是在算法建立回归方程时候,岭回归加入了正则化的限制,从而达到解决过拟合的效果。正则化有两种,分别为l1正则化l2正则化,l2正则化相比于l1正则化的优势在于:(1)可以进行交叉验证(2)实现了随机梯度下降。岭回归就是加入了l2正则化后的线性回归模型,保留了线性回归的优点,符合模型建立的要求,而且结果较为稳定,是较常使用的基础算法之一,因此本实施例选择了此算法为待选算法。
偏最小二乘回归算法是多特征样本中非常有效的算法之一。中红外光谱数据中,每一个样本对应1060个波点,是多特征样本的代表。同时偏最小二乘回归算法很少出现过拟合情况,所以很多中红外光谱的研究者们会选择使用偏最小二乘回归算法进行模型的建立,因此本实施例选择了此算法为待选算法。
实施例2:
中红外光谱测定次数及其使用方式的筛选:
本申请使用的所有样本均进行了连续两次的光谱采集,目的是通过比较同一样本不同测定次数和所得到三种MIR数据(第一次、第二次、二次平均)对建模准确性的影响,筛选出最有效的MIR数据进行建模。因有研究者认为两次测定的平均光谱MIR可能提升建模准确性,所以本实施例将第一次、第二次、二次平均光谱MIR去掉水吸收以及波数大于4000cm-1的波段分别建模,比较分析模型的准确度,结果如下表:
Ridge算法比较结果:
PLSR算法比较结果:
经过两种算法比较结果综合考虑,最终选择两次平均光谱MIR进行建模。
实施例3:
中红外光谱检测牛奶中β-酪蛋白含量的方法的建立:
1.建模数据集的划分
本实施例中的建模数据集划分中,80%为训练集,20%为测试集。训练集与测试集的比例为4:1,同时训练集又叫做交叉验证集,在训练模型的过程中进行10折交叉验证。
2.建模MIR数据预处理方法的筛选
有效特征筛选是对光谱数据进行处理的基本操作,目的是为了消噪,并为提取特征打好基础。有效特征筛选主要有特征抽取、特征预处理与特征降维三种。本实施例主要采用SG(卷积平滑)、MSC(多元散射校正)、SNV(标准正态变量变换)、diff1(一阶差分)和diff2(二阶差分)等五种处理方法对光谱数据进行特征预处理。
3.建模特征波段的手动选择过程及确定
选取特征波段的方法有很多,主要包括算法选取特征与手动选取特征两种,算法选取特征的原理主要来源于各波点与参考值之间的相关性,优点在于速度快、效率高,但缺点在于忽略了相邻波点之间的协同作用,思路较为单一;手动选取特征的优点在于选择的过程中可以强化波段(即相邻波点)的作用,同时可以在提升模型的过程中更多得保留光谱的原始信息状态,包容性与泛化能力更强,选取波段准确,缺点在于选择速度慢,效率低。
本实施例选取特征波段采用手动选取的方法,选取步骤如下:
(1)确定基本算法,由实施例2可知偏最小二乘回归算法的效果整体较好,所以最终选择偏最小二乘回归算法作为β-酪蛋白预测算法。
(2)确定最佳预处理组合。将样本中红外光谱去掉部分水吸收以及波数大于4000cm-1的波段进行实施例3中的预处理并进行比较,最终选择无预处理(结果如下表)
在确定MIR数据是无预处理的基础上,建模特征波段的手动选择过程如下:
(1)将剩下的区域分为六段,小于1593.35cm-1的区域为第一段,大于3641.95cm-1为最后一段,1709.1cm-1与3059.39cm-1中间的波段平均分为四段。
(2)以50个波点为一组,使用偏最小二乘回归算法,首先将第一段波段临界处两端波点增加或减少一组波点,寻找最优效果,并以此为基础对第二段波段进行类似操作,最终将六个波段全部完成一轮操作后算第一次遍历完成。
(3)在第一次遍历完成后进行第二次、第三次或更多次的手动遍历,直到所有的波点不再变化为止,即为最优特征波段。
最终经过九轮筛选,得到最优结果,如表所示:
最终选取的特征波段结果为:979.93cm-1-1361.87cm-1、1712.95cm-1-1793.97cm-1、2391.96cm-1-3113.41cm-1、3584.08cm-1-3730.69cm-1(图2、图3),每一段前后允许有两个波点的差距。结果发现模型中添加部分第二段水吸收区域后,模型可以达到最优效果,说明β-酪蛋白的特征波段包含部分水吸收区域。
4.模型参数的筛选确定
模型参数包括预处理方法的参数以及算法的参数,本模型中无预处理方法,所以无参数;主要参数为偏最小二乘回归算法的参数:主成分(n_component),参数选择结果对比如下(部分):
根据对比结果,最终选择主成分(n_component)为33。
经过比较分析,β-酪蛋白的最佳回归模型为:none(无预处理)+PLS-DA(n_component=33)模型。训练集和测试集相关系数分别为0.8541和2.1321;训练集和测试集均方根误差分别为0.8888和2.2215。
实施例4:
牛奶中β-酪蛋白的中红外光谱MIR的快速批量检测方法的应用:
利用建立的α-乳白蛋白最佳回归模型(none(无预处理)+PLS-DA(n_component=33))对随机选取的5个牛奶样本(非233份实验材料之一)进行预测,并将预测结果与真实值比较。
模型使用方法:
1.采集牛奶样本中的红外光谱中特征波段为:979.93cm-1-1361.87cm-1、1712.95cm-1-1793.97cm-1、2391.96cm-1-3113.41cm-1、3584.08cm-1-3730.69cm-1中的MIR数据;
同时利用液相色谱法检测同批次牛奶中的总酪蛋白真实值。
2、将测定所得到的MIR数据代入实施例3构建的none(无预处理)+PLS-DA(n_component=33)模型中,即可输出β-酪蛋白含量的预测结果。
从下表可以看出该模型预测的β-酪蛋白含量与真实含量非常接近(图4),故该模型的准确性较高,可用于牛奶的β-酪蛋白含量预测。
参考文献
[1]周鹏,张玉梅,刘彪,石羽杰,李婧,汪之顼.乳类食物中β-酪蛋白的结构及营养功能[J].中国食物与营养,2020,26(04):52-56.
[2] et al.The effect of milk protein contents on the rennetcoagulation properties of milk from individual dairy cows[J].InternationalDairy Journal,2008,18(9):964-967.
[3]V.Bonfatti et al.Genetic analysis of detailed milk proteincomposition and coagulation properties in Simmental cattle[J].Journal ofDairy Science,2011,94(10):5183-5193.
[4]Amalfitano Nicolòet al.Quantitative and qualitative detailed milkprotein profiles of 6cattle breeds:Sources of variation and contribution ofprotein genetic variants[J].Journal of Dairy Science,2020,103(12):11190-11208
[5]王浩,张志国,常彦忠,段相林,赵述强,张楠,石振华.RP-HPLC法对乳制品中主要牛奶蛋白的分离及定量测定[J].食品科学,2009,30(24):376-380.
[6]曾凤泽,姚宇泽.HPLC法测定乳粉及乳制品中酪蛋白磷酸肽含量[J].食品工业,2020,41(10):295-298.
[7]艾正文.酶联免疫法检测牛乳中A1β-酪蛋白研究[J].食品工业,2021,42(08):263-266.
[8]McDermott A et al.Cow and environmental factors associated withprotein fractions and free amino acids predicted using mid-infraredspectroscopy in bovine milk.[J].Journal of dairy science,2017,100(8):6272-6284.
[9]Frizzarin M.et al.Predicting cow milk quality traits fromroutinely available milk spectra using statistical machine learning methods[J].Journal of Dairy Science,2021,104(7):7438-7447.
Claims (3)
1.牛奶中β-酪蛋白的中红外快速批量检测方法,包括下述步骤:
1).采集牛奶样本中的红外光谱中特征波段为:979.93 cm-1-1361.87 cm-1 、1712.95cm-1-1793.97 cm-1 、2391.96 cm-1-3113.41 cm-1 、3584.08 cm-1-3730.69 cm-1中的MIR数据;
2).将测定所得到的MIR数据代入none+偏最小二乘回归分析PLS-DA模型中,即可输出β-酪蛋白含量的预测结果;其中,所述none指的是无预处理;偏最小二乘回归分析PLS-DA的主成分为33。
2.根据权利要求1所述的方法,其特征在于:步骤1)中每一段前后允许有两个波点的差距。
3.权利要求1所述的方法在检测牛奶中β-酪蛋白的含量中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111356105.7A CN114166779B (zh) | 2021-11-16 | 2021-11-16 | 牛奶中β-酪蛋白的中红外快速批量检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111356105.7A CN114166779B (zh) | 2021-11-16 | 2021-11-16 | 牛奶中β-酪蛋白的中红外快速批量检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114166779A CN114166779A (zh) | 2022-03-11 |
CN114166779B true CN114166779B (zh) | 2024-02-20 |
Family
ID=80479254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111356105.7A Active CN114166779B (zh) | 2021-11-16 | 2021-11-16 | 牛奶中β-酪蛋白的中红外快速批量检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114166779B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117390402B (zh) * | 2023-12-11 | 2024-03-08 | 青岛可颂食品有限公司 | 一种混合奶油生产管理系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107155349A (zh) * | 2014-08-18 | 2017-09-12 | 福斯分析仪器公司 | 多成分样品的成分相关特性的确定 |
CN110579452A (zh) * | 2018-06-08 | 2019-12-17 | 光谱创新公司 | 测定生乳制品或低巴氏乳制品中酪蛋白和血清蛋白的方法 |
-
2021
- 2021-11-16 CN CN202111356105.7A patent/CN114166779B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107155349A (zh) * | 2014-08-18 | 2017-09-12 | 福斯分析仪器公司 | 多成分样品的成分相关特性的确定 |
CN110579452A (zh) * | 2018-06-08 | 2019-12-17 | 光谱创新公司 | 测定生乳制品或低巴氏乳制品中酪蛋白和血清蛋白的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114166779A (zh) | 2022-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cozzolino et al. | Feasibility study on the use of visible and near-infrared spectroscopy together with chemometrics to discriminate between commercial white wines of different varietal origins | |
McQueen et al. | Comparison of two infrared spectroscopic methods for cheese analysis | |
Ferrand et al. | Determination of fatty acid profile in cow's milk using mid-infrared spectrometry: Interest of applying a variable selection by genetic algorithms before a PLS regression | |
US20090305423A1 (en) | Methods for Monitoring Composition and Flavor Quality of Cheese Using a Rapid Spectroscopic Method | |
CN114166779B (zh) | 牛奶中β-酪蛋白的中红外快速批量检测方法 | |
Rolle et al. | Color and anthocyanin evaluation of red winegrapes by CIE L*, a*, b* parameters | |
Pan et al. | Quantification of glycated hemoglobin indicator HbA1c through near-infrared spectroscopy | |
De Marchi et al. | Prediction of protein composition of individual cow milk using mid-infrared spectroscopy | |
CN113324940A (zh) | 特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的光谱分级方法 | |
CN114184571B (zh) | 牛奶中总酪蛋白含量的中红外快速批量检测方法 | |
CN114184573B (zh) | 牛奶中κ-酪蛋白的中红外快速批量检测方法 | |
CN114184572B (zh) | 牛奶中α-乳白蛋白的中红外快速批量检测方法 | |
CN114544540B (zh) | 牛奶中A2型β酪蛋白含量的快速批量检测方法 | |
CN114166782B (zh) | 牛奶中游离的缬氨酸含量的中红外快速批量检测方法 | |
CN114166790B (zh) | 牛奶中游离的蛋氨酸含量的中红外快速批量检测方法 | |
CN114166788B (zh) | 牛奶中游离氨基酸总含量的中红外快速批量检测方法 | |
CN114166789B (zh) | 牛奶中游离必需氨基酸总含量的中红外快速批量检测方法 | |
CN116136494A (zh) | 牛奶中乳铁蛋白含量的mir快速批量检测方法 | |
CN114166781B (zh) | 牛奶中游离的牛磺酸含量的中红外快速批量检测方法 | |
CN112964690B (zh) | 一种基于拉曼光谱实时监测中药配方颗粒提取过程的方法 | |
CN113916824A (zh) | 牛奶中αs1-酪蛋白的中红外快速批量检测方法 | |
CN114166780B (zh) | 牛奶中游离的赖氨酸含量的中红外快速批量检测方法 | |
CN114166783B (zh) | 牛奶中游离的异亮氨酸含量的中红外快速批量检测方法 | |
CN113189045A (zh) | 一种利用近红外光谱技术快速测定梨粉中总酚含量的方法 | |
CN114166786B (zh) | 水牛奶中总固形物含量的中红外光谱快速批量检测方法及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |