CN114544540B - 牛奶中A2型β酪蛋白含量的快速批量检测方法 - Google Patents
牛奶中A2型β酪蛋白含量的快速批量检测方法 Download PDFInfo
- Publication number
- CN114544540B CN114544540B CN202210188322.8A CN202210188322A CN114544540B CN 114544540 B CN114544540 B CN 114544540B CN 202210188322 A CN202210188322 A CN 202210188322A CN 114544540 B CN114544540 B CN 114544540B
- Authority
- CN
- China
- Prior art keywords
- milk
- beta casein
- model
- type beta
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000013336 milk Nutrition 0.000 title claims abstract description 50
- 239000008267 milk Substances 0.000 title claims abstract description 50
- 210000004080 milk Anatomy 0.000 title claims abstract description 50
- 102000011632 Caseins Human genes 0.000 title claims abstract description 49
- 108010076119 Caseins Proteins 0.000 title claims abstract description 49
- 235000021247 β-casein Nutrition 0.000 title claims abstract description 45
- 238000001514 detection method Methods 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 13
- 238000010238 partial least squares regression Methods 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 8
- 235000020246 buffalo milk Nutrition 0.000 claims description 3
- 238000012216 screening Methods 0.000 abstract description 8
- 235000020185 raw untreated milk Nutrition 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 24
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 11
- 241000283690 Bos taurus Species 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 238000004476 mid-IR spectroscopy Methods 0.000 description 5
- 238000010521 absorption reaction Methods 0.000 description 4
- 239000005018 casein Substances 0.000 description 4
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 4
- 235000021240 caseins Nutrition 0.000 description 4
- 235000018102 proteins Nutrition 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 102000014171 Milk Proteins Human genes 0.000 description 3
- 108010011756 Milk Proteins Proteins 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 235000013365 dairy product Nutrition 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 235000021239 milk protein Nutrition 0.000 description 3
- 238000004007 reversed phase HPLC Methods 0.000 description 3
- 239000004677 Nylon Substances 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 108010065875 beta-casomorphins Proteins 0.000 description 2
- 239000008367 deionised water Substances 0.000 description 2
- 229910021641 deionized water Inorganic materials 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 229960000789 guanidine hydrochloride Drugs 0.000 description 2
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 238000002203 pretreatment Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- RLAZTXNIPNVKRK-UHFFFAOYSA-N 1-bromopropane-1,2-diol Chemical compound CC(O)C(O)Br RLAZTXNIPNVKRK-UHFFFAOYSA-N 0.000 description 1
- 238000013051 Liquid chromatography–high-resolution mass spectrometry Methods 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- YADZBEISHVCBSJ-UHFFFAOYSA-N [I].OCC(O)CO Chemical compound [I].OCC(O)CO YADZBEISHVCBSJ-UHFFFAOYSA-N 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000003287 bathing Methods 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 238000005515 capillary zone electrophoresis Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000249 desinfective effect Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005485 electric heating Methods 0.000 description 1
- 230000005686 electrostatic field Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000013350 formula milk Nutrition 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000004896 high resolution mass spectrometry Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005173 quadrupole mass spectroscopy Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- WROMPOXWARCANT-UHFFFAOYSA-N tfa trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F.OC(=O)C(F)(F)F WROMPOXWARCANT-UHFFFAOYSA-N 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000001195 ultra high performance liquid chromatography Methods 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3577—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明属于奶牛性能测定和牛奶品质检测领域,具体涉及牛奶中A2型β酪蛋白的中红外光谱快速批量检测方法。在特征波段的选择方面,打破了常用的使用算法筛选特征,而是使用人工手动选择+多次遍历的方法。最终选取用于建模的特征波段。选取了A2型β酪蛋白模型建立的最优预处理与算法组合,确定了最优参数,提高了模型的准确性,实现了原料奶中A2型β酪蛋白含量的快速、准确、低成本的检测。
Description
技术领域
本发明属于奶牛性能测定和牛奶品质检测领域,具体涉及牛奶中A2型β酪蛋白的中红外光谱快速批量检测方法。
背景技术
牛奶中富含乳蛋白,酶消化后的牛奶蛋白是人体必需氨基酸和生物活性肽的来源。酪蛋白约占牛奶中蛋白质含量的80%[1],β-酪蛋白约占牛奶总酪蛋白总量的30%。目前共在奶牛中发现了15种β酪蛋白变异体,A1和A2型出现的概率最高。A2型β酪蛋白是野生型蛋白,其氨基酸序列中第67位氨基酸由脯氨酸突变为组氨酸,则突变为A1型β酪蛋白[2]。A1型β酪蛋白在消化过程中可以产生β酪啡肽(BCM-7),该物质可能干扰人体正常代谢,增加部分婴儿患I型糖尿病的风险,还可能会造成免疫反应、消化和呼吸的功能性障碍[3]。检测牛奶中的A2型β酪蛋白含量对组建A2型β酪蛋白高产牛群、生产A2型β酪蛋白牛奶具有重要贡献,建立牛奶中A2型-β酪蛋白的快速测定方法很有必要。
高效液相色谱是鉴定和定量乳蛋白最常用的技术之一,具有操作简便、耗时短、回收率高、可以检测出沉默变异体等优点。Bonfatti等对RP-HPLC法的分离和定量能力进行了验证,在整个浓度范围内观察到蛋白质浓度和峰面积之间的良好线性关系(R2>0.99),检测限为0.5μg,在重复性中获得的保留时间和峰面积的相对标准偏差值(RSD)分别为0.29%和1.73%,重现性分析的RSD值分别为0.91%和2.12%,具有良好的精密度[4]。Fuerer等(2020)通过超高效液相色谱-高分辨率质谱(LC-HRMS/MS)法实现了对β-CN遗传变体进行蛋白质指纹识别和定量,该方法灵敏度允许检测基于A2β-CN的婴儿配方奶粉中的A1β-CN,检测限为2%(每100g总β-CN的A1β-CN克数),重复性范围为2%-3%,中等再现性范围为5%-9%[5]。Chen等(2021)使用采用超高效液相色谱静电场轨道阱高分辨率质谱和三重四极杆质谱定量分析牦牛和奶牛及其杂交后代的A1型和A2型β-酪蛋白含量,该方法的线性相关系数>0.99,重复性试验的相对标准偏差为0.2-3.6%。恢复率范围为93.3至114.4%[6]。以上现有的分析方法虽技术成熟的、准确率高,但具有分析时间长,成本高等缺点。
中红外光谱(MIRS)是物质的在中红外区的吸收光谱,一般将2.5-25μm的红外波段划为中红外区。中红外光谱主要是由于分子振动能级的跃迁和转动能级跃迁而产生的。中红外光谱被认为是预测牛奶表型(包括总蛋白质和酪蛋白含量)的可靠、快速和经济的工具[7]。
发明内容
本发明的目的在于提供了牛奶中A2型β酪蛋白含量的快速批量检测方法,该方法具有简单、快速和批量等优势。
本发明的另一个目的在于提供了牛奶中A2型β酪蛋白含量的快速批量检测方法的应用。
为了达到上述目的,本发明采取以下技术措施:
牛奶中A2型β酪蛋白含量的快速批量检测方法,包括下述步骤:
1.采集水牛奶样本中的红外光谱中特征波段为937.49cm-1-1118.82cm-1、1601.07cm-1-1624.22cm-1、1716.81cm-1-1817.12cm-1、2222.21cm-1-2349.52cm-1、2380.39cm-1-2777.76cm-1、2854.92cm-1-3194.42cm-1、3437.49cm-1-3557.08cm-1、3645.81cm-1-3776.98cm-1、3904.30cm-1-4295.23cm-1、4378.83cm-1-5011.54.cm-1中的MIR数据;,2.将测定所得到的MIR数据代入diff1+PLSR(n_component=6)模型中,即可输出牛奶中A2型β酪蛋白含量的预测结果。
所述的diff1为一阶差分。
以上所述的方法中,优选的,步骤1中每一段波段前后允许有两个波点的差距。
本发明的保护内容还包括:上述检测方法用于检测牛奶中A2型β酪蛋白含量。
与现有技术相比,本发明优点在于:
1.在特征波段的选择方面,打破了常用的使用算法筛选特征,而是使用人工手动选择+多次遍历的方法。最终选取用于建模的特征波段,特别是筛选出了包含部分水的吸收区域,并证明了增加部分水吸收波段可以提升模型的准确性。
2.选取了A2型β酪蛋白模型建立的最优预处理与算法组合,确定了最优参数,提高了模型的准确性。
4.实现了原料奶中A2型β酪蛋白含量的快速、准确、低成本的检测,实现了快速批量检测,每一个样本的测定时间仅需10-15秒,提高了检测效率,具有较强的实用性,将可广泛应用于奶牛性能测定和牛奶质量品质检测。
附图说明
图1为未经处理的牛奶样品中红外光谱图(a)与平均光谱图(b)。
图2为diff1预处理后的牛奶样品中红外光谱图。
图3为选取的十个特征波段光谱总图(a)以及每个特征波段放大图(b)。
图4为模型牛奶数据真实值与预测值相关性与拟合直线图。
具体实施方式
本发明所述技术方案,如未特别说明,均为本领域的常规方案;所述试剂或材料,如未特别说明,均来源于商业渠道。
1.实验材料
牛奶样本来自奶牛场的107头β酪蛋白A2A2基因型中国荷斯坦牛,每头牛采集一份奶样,奶样采集利用自动挤奶装置完成,先用消毒后的毛巾擦拭牛奶房,然后用碘甘油混合溶液对乳房消毒,挤掉前三把乳汁后,对挤奶全过程奶样进行采集,每份奶样采集40ml,分装到直径3.5cm,高9cm的圆柱形全新采样瓶里,依次编号,并向每个采样瓶里立即加入溴硝丙二醇防腐剂,缓慢摇晃使其充分溶解,运回途中在奶样周围放置冰袋(2-4℃)防止变质,样本到达实验室后立即进行光谱采集。
2.中红外光谱测定与采集
将样品倒入直径3.5cm,高9cm的圆柱形样品管中,在42℃水浴锅中水浴15-20min,使用FOSS公司的MilkoScanTM7RM乳成分检测仪,将固体光纤探头伸到液体中,对样品进行混匀后扫描。
3.牛奶中A2型β酪蛋白的真实(参考)值检测方法
3.1仪器、设备和试剂
电热恒温水浴锅(武汉一恒苏净科学仪器有限公司);Waters液相色谱仪,包括自动进样器、柱温箱、进样瓶、涡漩振荡器、针管过滤器、0.22μm尼龙滤膜、RP-HPLC色谱柱:ZORBAX 300SB-C18(250mm×4.6mm,5μm,孔径:300A)。
β酪蛋白(lot C-6905,纯度≥90%)标准品购自Sigma公司;乙腈(色谱级,纯度≥99.8%)、盐酸胍和三氟乙酸(TFA)购自上海生工公司;其他试剂均为国产分析纯。因目前并没有A2型β酪蛋白的标准品,所以使用混合型β酪蛋白标准品代替。
3.2实验方法
3.2.1中红外光谱的采集
利用MilkoScanTM FT+进行光谱采集,具体采集步骤为:将奶样分批放入45℃电热恒温水浴锅内预热5min,预热好的奶样放在检测架上上下摇晃数次使牛奶胶状溶液混合均匀,将检测架放在检测履带上,打开瓶盖,依次进行检测,采集完光谱后的奶样置于-20℃冷冻保存,用于后续A2型β酪蛋白的含量测定。
3.2.2A2型β酪蛋白含量的高效液相色谱技术测定
(1)标准样品的处理
先用去离子水将混合标样充分溶解,直到和β酪蛋白的浓度在10g/L左右,然后往1600μl处理液(6mol/L盐酸胍溶液)中加入400μl配好的混合标样溶液,充分混匀后于室温下孵育90min,上机前用0.22μm尼龙滤膜过滤。
(2)奶样的处理
取80μl牛奶加入到320μl处理液中,室温孵育90min,设置离心机转速为14000r/min,离心5min后取上清液。上机前用0.22μm尼龙滤膜过滤。
(3)RP-HPLC的色谱条件
色谱柱:ZORBAX 300SB-C18;进样量:50μl;柱温:40℃;流速:1ml/min;洗脱时间:42min;检测波长:214nm;A相:纯水;B相;纯乙腈。
流动相梯度洗脱条件和流速
最后立刻以初始梯度平衡色谱柱1min,预备下一个样品的检测,平均每批次检测样品10个。同一批次检测结束后会用10%甲醇+90%去离子水与100%甲醇清洗色谱柱进行维护,以保证下一批次样品的正常检测。
4.有效样本的选择
107个样本中,剔除掉样本变质、损耗、中红外光谱测定异常、样本参考值测定异常等操作导致的无效数据,共剔除掉了32个异常样本,选择了75个样本进行模型的建立与优化。
实施例1:
A2型β酪蛋白的预测模型算法的选择:
本申请目的为建立牛奶中A2型β酪蛋白的定量测定模型,所以使用建模算法为回归算法。回归算法种类很多,本实施例主要使用了岭回归(Ridge)与偏最小二乘回归(PLSR)[9]算法进行模型建立与对比,理由如下:
岭回归是线性回归的一种。只是在算法建立回归方程时候,岭回归加入了正则化的限制,从而达到解决过拟合的效果。正则化有两种,分别为l1正则化l2正则化,l2正则化相比于l1正则化的优势在于:(1)可以进行交叉验证(2)实现了随机梯度下降。岭回归就是加入了l2正则化后的线性回归模型,保留了线性回归的优点,符合模型建立的要求,而且结果较为稳定,是较常使用的基础算法之一,因此本实施例选择了此算法。
偏最小二乘回归算法是多特征样本中非常有效的算法之一。中红外光谱数据中,每一个样本对应1060个波点,是多特征样本的代表。同时偏最小二乘回归算法很少出现过拟合情况,所以很多中红外光谱的研究者们会选择使用偏最小二乘回归算法进行模型的建立,因此本实施例选择了此算法。
实施例2:
中红外光谱测定次数及其使用方式的筛选:
本实施例每个样本对应一条MIR光谱数据。将全光谱波段代入进行建模,比较分析模型的准确度,并使用diff1(一阶差分)进行预处理,以确定算法的准确度,结果如下表:
算法比较结果:
经过两种算法比较结果,PLSR在测试集上效果更好,而且相比于Ridge算法过拟合情况较弱,所以最终选择PLSR算法进行建模。
实施例3:
中红外光谱检测牛奶中A2型β酪蛋白含量的方法的建立:
1.建模数据集的划分
本实施例中的建模数据集划分中,70%为训练集,30%为测试集。训练集与测试集的比例为7:3,同时训练集又叫做交叉验证集,在训练模型的过程中进行10折交叉验证。
2.建模MIR数据预处理方法的筛选
有效特征筛选是对光谱数据进行处理的基本操作,目的是为了消噪,并为提取特征打好基础。有效特征筛选主要有特征抽取、特征预处理与特征降维三种。本实施例主要采用SG(卷积平滑)、MSC(多元散射校正)、SNV(标准正态变量变换)、diff1(一阶差分)和diff2(二阶差分)等五种处理方法对光谱数据进行特征预处理。
3.建模特征波段的手动选择过程及确定
选取特征波段的方法有很多,主要包括算法选取特征与手动选取特征两种,算法选取特征的原理主要来源于各波点与参考值之间的相关性,优点在于速度快、效率高,但缺点在于忽略了相邻波点之间的协同作用,思路较为单一;手动选取特征的优点在于选择的过程中可以强化波段(即相邻波点)的作用,同时可以在提升模型的过程中更多得保留光谱的原始信息状态,包容性与泛化能力更强,选取波段准确,缺点在于选择速度慢,效率低。
本实施例选取特征波段采用手动选取的方法,选取步骤如下:
(1)确定基本算法,由实施例2可知偏最小二乘回归算法的效果整体较好,所以最终选择偏最小二乘回归算法作为A2型β酪蛋白预测算法。
(2)确定最佳预处理组合。将样本全波段进行实施例3中的预处理并进行比较,发现差分对模型的效果有明显提升,所以选择diff1与diff2作为预处理方法分别建模(结果如下表)。
建模特征波段的手动选择过程如下:
(1)将全波段以100个波点为一段进行分段,最终分为11段.
(2)以50个波点为一组,使用偏最小二乘回归算法,首先将第一段波段临界处两端波点增加或减少一组波点,寻找最优效果,并以此为基础对第二段波段进行类似操作,最终将11个波段全部完成一轮操作后算第一次遍历完成。
(3)在第一次遍历完成后进行第二次、第三次或更多次的手动遍历,直到所有的波点不再变化为止,即为最优特征波段。
最终经过十三轮筛选,得到diff1与diff2的结果,如表所示:
根据两种预处理最终建模效果比较发现,使用diff2有较为明显的过拟合情况,且测试集结果不如diff1,所以最终选择最佳预处理为diff1的模型。最终选取的特征波段结果为:937.49cm-1-1118.82cm-1、1601.07cm-1-1624.22cm-1、1716.81cm-1-1817.12cm-1、2222.21cm-1-2349.52cm-1、2380.39cm-1-2777.76cm-1、2854.92cm-1-3194.42cm-1、3437.49cm-1-3557.08cm-1、3645.81cm-1-3776.98cm-1、3904.30cm-1-4295.23cm-1、4378.83cm-1-5011.54.cm-1,每一段前后允许有两个波点的差距。结果发现模型中添加部分水吸收区域后,模型可以达到最优效果,说明A2型β酪蛋白的特征波段包含部分水吸收区域,这也是本申请的重点发现与创新之处。
4.模型参数的筛选确定
模型参数包括预处理方法的参数以及算法的参数,本模型中diff1预处理方法无参数;主要参数为偏最小二乘回归算法的参数:主成分(n_component),参数选择结果对比如下(部分):
根据对比结果,最终选择主成分(n_component)为6。
经过比较分析,A2型β酪蛋白的最佳回归模型为:diff1(一阶差分)+PLSR(n_component=6)模型。训练集和测试集相关系数分别为0.9564和0.9263;训练集和测试集均方根误差分别为0.8171和1.0452。
实施例4:
牛奶中A2型β酪蛋白的中红外光谱MIR的快速批量检测方法的应用:
利用建立的A2型β酪蛋白最佳回归模型(diff1(一阶差分)+PLSR(n_component=6))对随机选取的5个外部A2A2基因型奶牛的牛奶样本进行预测,并将预测结果与真实值比较。
模型使用方法:
1.采集水牛奶样本中的红外光谱中特征波段为937.49cm-1-1118.82cm-1、1601.07cm-1-1624.22cm-1、1716.81cm-1-1817.12cm-1、2222.21cm-1-2349.52cm-1、2380.39cm-1-2777.76cm-1、2854.92cm-1-3194.42cm-1、3437.49cm-1-3557.08cm-1、3645.81cm-1-3776.98cm-1、3904.30cm-1-4295.23cm-1、4378.83cm-1-5011.54.cm-1中的MIR数据;,
2.将测定所得到的MIR数据代入diff1+PLSR(n_component=6)模型中,即可输出牛奶中A2型β酪蛋白含量的预测结果。
以具体实施方式中的高效液相色谱技术测定方法测定的结果作为实际值。
该模型预测的结果与真实结果非常接近(如下表),故该模型的准确性较高,可用于牛奶的A2型β酪蛋白含量预测。
参考文献
[1]Nguyen D D,Solah V A,Busetti F,et al.Application of ultra-highperformance liquid chromatography coupled to high-resolution massspectrometry(Orbitrap)for the determination of beta-casein phenotypes in cowmilk[J].Food Chemistry,2019,307:125532.
[2]冯慿,丁晓静,高铁,杜茹芸,陈泓序.毛细管区带电泳测定液态奶及奶粉中的A2β-酪蛋白及总β-酪蛋白[J].色谱,2020,38(06):722-729.
[3]常硕.牛奶中A1和A2β-酪蛋白的检测与分析[J].中国奶牛,2018(03):48-50.
[4]Bonfatti V,Grigoletto L,Cecchinato A,et al.Validation of a newreversed-phase high-performance liquid chromatography method for separationand quantification of bovine milk protein genetic variants[J].Journal ofChromatography A,2008,1195(1-2):101-106.
[5]Fuerer C,Jenni R,Cardinaux L,et al.Protein fingerprinting andquantification ofβ-casein variants by ultra-performance liquidchromatography–high-resolution mass spectrometry[J].Journal of dairy science,2020,103(2):1193-1207.
[6]Chen Y,Ren Y,Wang L,et al.Analysis of A1-type and A2-typeβ-caseinin Maiwa Yak and Pien-niu milk by HPLC-high-resolution MS and tandem MS[J].Journal of Separation Science,2021,44(9):1913-1922.
[7]Botaro,B.G,Cortinhas,C.S,Mestieri,L,et al.Prediction of bovinemilk true protein content by mid-infrared spectroscopy[J].Ciência Rural,2011,41(8):1472-1474.
Claims (3)
1.牛奶中A2型β酪蛋白含量的快速批量检测方法,包括下述步骤:
1). 采集水牛奶样本中的红外光谱中特征波段为937.49 cm-1-1118.82 cm-1 、1601.07cm-1-1624.22 cm-1 、1716.81 cm-1-1817.12 cm-1 、2222.21cm-1-2349.52 cm-1、2380.39 cm-1-2777.76 cm-1 、2854.92 cm-1-3194.42 cm-1 、3437.49cm-1-3557.08 cm-1、3645.81 cm-1-3776.98 cm-1 、3904.30 cm-1-4295.23 cm-1 、4378.83cm-1-5011.54. cm-1中的MIR数据;
2).将测定所得到的MIR数据代入一阶差分diff1+偏最小二乘回归PLSR模型中,即可输出牛奶中A2型β酪蛋白含量的预测结果,所述的偏最小二乘回归算法的主成份n_component=6;
所述模型的训练集和测试集相关系数分别为0.9564和0.9263;训练集和测试集均方根误差分别为0.8171和1.0452。
2.根据权利要求1所述的方法,其特征在于:步骤1)中每一段波段前后允许有两个波点的差距。
3.权利要求1所述的方法在检测牛奶中A2型β酪蛋白含量中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210188322.8A CN114544540B (zh) | 2022-02-28 | 2022-02-28 | 牛奶中A2型β酪蛋白含量的快速批量检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210188322.8A CN114544540B (zh) | 2022-02-28 | 2022-02-28 | 牛奶中A2型β酪蛋白含量的快速批量检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114544540A CN114544540A (zh) | 2022-05-27 |
CN114544540B true CN114544540B (zh) | 2022-11-29 |
Family
ID=81679326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210188322.8A Active CN114544540B (zh) | 2022-02-28 | 2022-02-28 | 牛奶中A2型β酪蛋白含量的快速批量检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114544540B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113310936A (zh) * | 2021-05-10 | 2021-08-27 | 华中农业大学 | 四种高温灭菌商品牛奶的快速鉴定方法 |
CN113916824A (zh) * | 2021-11-01 | 2022-01-11 | 华中农业大学 | 牛奶中αs1-酪蛋白的中红外快速批量检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60330840D1 (de) * | 2002-02-11 | 2010-02-25 | Foss Analytical As | Verfahren zur bestimmung von casein in milch |
-
2022
- 2022-02-28 CN CN202210188322.8A patent/CN114544540B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113310936A (zh) * | 2021-05-10 | 2021-08-27 | 华中农业大学 | 四种高温灭菌商品牛奶的快速鉴定方法 |
CN113916824A (zh) * | 2021-11-01 | 2022-01-11 | 华中农业大学 | 牛奶中αs1-酪蛋白的中红外快速批量检测方法 |
Non-Patent Citations (3)
Title |
---|
中红外光谱预测牛奶及奶产品成分含量的回归模型及其特点;阮健等;《中国奶牛》;20190515(第2019年05期);第4-7页 * |
应用MIR测定牛奶中各种蛋白质含量的研究进展;陈焱森等;《中国奶牛》;20181015(第2018年10期);第66-70页 * |
用红外线分析快速测定牛奶酪蛋白含量的方法;D.M.Barbano等;《草食家畜》;19881231(第1988年06期);第54-56页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114544540A (zh) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103543123A (zh) | 一种掺假牛奶的红外光谱识别方法 | |
CN1403822A (zh) | 中药生产工艺中产品质量指标在线检测 | |
Pan et al. | Quantification of glycated hemoglobin indicator HbA1c through near-infrared spectroscopy | |
CN114544540B (zh) | 牛奶中A2型β酪蛋白含量的快速批量检测方法 | |
US20230089466A1 (en) | Establishment of Identification and Screening Method of Cows with A2 Beta-Casein Genotype of Producing A2 Milk and Applications Thereof | |
CN114166779B (zh) | 牛奶中β-酪蛋白的中红外快速批量检测方法 | |
CN114184571B (zh) | 牛奶中总酪蛋白含量的中红外快速批量检测方法 | |
CN113324940A (zh) | 特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的光谱分级方法 | |
CN116136494A (zh) | 牛奶中乳铁蛋白含量的mir快速批量检测方法 | |
CN114184572B (zh) | 牛奶中α-乳白蛋白的中红外快速批量检测方法 | |
CN113916824B (zh) | 牛奶中αs1-酪蛋白的中红外快速批量检测方法 | |
CN114166780A (zh) | 牛奶中游离的赖氨酸含量的中红外快速批量检测方法 | |
CN115541526A (zh) | 一种基于近红外检测普洱熟茶中咖啡因和儿茶素类含量的方法 | |
CN114184573B (zh) | 牛奶中κ-酪蛋白的中红外快速批量检测方法 | |
CN112964690B (zh) | 一种基于拉曼光谱实时监测中药配方颗粒提取过程的方法 | |
CN114166782B (zh) | 牛奶中游离的缬氨酸含量的中红外快速批量检测方法 | |
CN114166790B (zh) | 牛奶中游离的蛋氨酸含量的中红外快速批量检测方法 | |
CN114166781B (zh) | 牛奶中游离的牛磺酸含量的中红外快速批量检测方法 | |
CN114166788B (zh) | 牛奶中游离氨基酸总含量的中红外快速批量检测方法 | |
CN114166789B (zh) | 牛奶中游离必需氨基酸总含量的中红外快速批量检测方法 | |
CN114166784B (zh) | 乳制品中糠氨酸含量的中红外光谱检测方法 | |
CN114166783B (zh) | 牛奶中游离的异亮氨酸含量的中红外快速批量检测方法 | |
CN118566164A (zh) | 骆驼奶中乳蛋白含量的中红外光谱检测方法 | |
CN118566165A (zh) | 牛奶中总必需氨基酸含量的快速批量检测方法 | |
CN114166785A (zh) | 水牛奶中脂肪含量的中红外快速批量检测方法及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |