CN106018321A - 玉米单粒种子蛋白质检测模型的构建方法及其应用 - Google Patents
玉米单粒种子蛋白质检测模型的构建方法及其应用 Download PDFInfo
- Publication number
- CN106018321A CN106018321A CN201610308187.0A CN201610308187A CN106018321A CN 106018321 A CN106018321 A CN 106018321A CN 201610308187 A CN201610308187 A CN 201610308187A CN 106018321 A CN106018321 A CN 106018321A
- Authority
- CN
- China
- Prior art keywords
- sample
- model
- spectrum
- single grain
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000002331 protein detection Methods 0.000 title claims abstract description 6
- 240000008042 Zea mays Species 0.000 title abstract description 10
- 235000002017 Zea mays subsp mays Nutrition 0.000 title abstract description 10
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 title abstract description 9
- 235000005822 corn Nutrition 0.000 title abstract description 9
- 238000001228 spectrum Methods 0.000 claims abstract description 44
- 238000001514 detection method Methods 0.000 claims abstract description 27
- 238000004445 quantitative analysis Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 6
- 238000000605 extraction Methods 0.000 claims abstract description 5
- 238000009499 grossing Methods 0.000 claims abstract description 5
- 230000009467 reduction Effects 0.000 claims abstract description 3
- 239000000463 material Substances 0.000 claims description 11
- 238000002474 experimental method Methods 0.000 claims description 9
- 108090000623 proteins and genes Proteins 0.000 claims description 8
- 102000004169 proteins and genes Human genes 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 5
- 238000000985 reflectance spectrum Methods 0.000 claims description 4
- 238000010561 standard procedure Methods 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 238000012706 support-vector machine Methods 0.000 abstract description 2
- 230000004069 differentiation Effects 0.000 abstract 1
- 238000007781 pre-processing Methods 0.000 abstract 1
- 235000013339 cereals Nutrition 0.000 description 33
- 210000000582 semen Anatomy 0.000 description 16
- 239000000126 substance Substances 0.000 description 14
- 235000019624 protein content Nutrition 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 9
- 238000011160 research Methods 0.000 description 8
- 238000009395 breeding Methods 0.000 description 7
- 230000001488 breeding effect Effects 0.000 description 7
- 238000002372 labelling Methods 0.000 description 6
- 235000016709 nutrition Nutrition 0.000 description 6
- 235000015097 nutrients Nutrition 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- PNEYBMLMFCGWSK-UHFFFAOYSA-N Alumina Chemical compound [O-2].[O-2].[O-2].[Al+3].[Al+3] PNEYBMLMFCGWSK-UHFFFAOYSA-N 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000010183 spectrum analysis Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 241000201976 Polycarpon Species 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 101150061025 rseP gene Proteins 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000004611 spectroscopical analysis Methods 0.000 description 2
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 108010073032 Grain Proteins Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241000269799 Perca fluviatilis Species 0.000 description 1
- 108010016634 Seed Storage Proteins Proteins 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 101000954509 Trichosurus vulpecula Very early lactation protein Proteins 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000012271 agricultural production Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 238000009841 combustion method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 235000014103 egg white Nutrition 0.000 description 1
- 210000000969 egg white Anatomy 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000012041 food component Nutrition 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 238000001310 location test Methods 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 238000009659 non-destructive testing Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 230000007226 seed germination Effects 0.000 description 1
- 238000007655 standard test method Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- 125000003831 tetrazolyl group Chemical group 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N31/00—Investigating or analysing non-biological materials by the use of the chemical methods specified in the subgroup; Apparatus specially adapted for such methods
- G01N31/002—Determining nitrogen by transformation into ammonia, e.g. KJELDAHL method
Abstract
本发明涉及作物单粒种子的蛋白质含量检测,具体公开了玉米单粒种子蛋白质检测模型的构建方法,构建方法具体为采集样品的漫反射光谱,选择有效波长,依次进行平滑(9点窗)→一阶差分→标准化处理,并利用偏最小二乘法(PLS)降维,PLS、支持向量机法(SVR)分别建模,由未知样品在同样条件下获得的近红外光谱数据,并对该数据进行同样的预处理和特征提取,最后利用所建立的定量分析模型检测该样品的蛋白质含量。
Description
技术领域
本发明涉及作物单籽粒种子鉴别,具体地说,涉及玉米单粒种子蛋白质含量检测模型的构建方法。
背景技术
种子是农业的灵魂。我国是农业大国,种子是农业生产的基本生产资料,中国作为世界上人口最多的国家,种业发展关系到国计民生,是我国农业领域支柱产业,也是保证我国粮食安全,抢占资源战略至高点的关键。在作物育种领域,育种材料的营养成分准确鉴定对加快育种进程具有重要作用。目前作物育种材料的任何成分检测与鉴定都是依赖于化学成分分析,杂交种子纯度鉴定依赖于分子标记指纹图谱。活力检测使用“四唑”法,发芽实验检测压滤,上述检测分析工作都存在耗时长,附带中间产物污染环境的问题,而且检测成分单一,无法实现单粒样品和无损检测的需要。近红外光谱分析技术快速、简便、环保、无损分析的特点使其在育种材料检测具有独特的优点。虽然近红外光谱分析技术经在农产品的营养成分检测应用方面已经非常成熟,但目前国内外对利用近红外技术建立检测玉米单籽粒营养成分含量的模型的研究还很少。国内现已有的检测玉米营养成分的近红外模型,其光谱是由多个籽粒混合在一起采集得到的,而它的参考化学值,也是由许多籽粒混合磨成粉末,然后利用化学方法得到的。由于即使是同一品种,不同大小的种子其营养成分含量也会有所不同,故由混合群体种子所建立的近红外定量分析模型,只适合用来检测群体种子的营养成分,而不能有效的检测玉米单籽粒的营养成分含量。国外对建立近红外单籽粒玉米检测模型的研究较早。如Orman(1992)便开始研究近红外检测玉米单籽粒的含油量。建模所用的单籽粒含油量化学参考值也是由NMR检测得到。Baye(2006)在研究单籽粒近红外光谱检测玉米的营养成分中,单籽粒的蛋白、淀粉等的化学参考值也是在多籽粒混合研磨测化学值的基础上得到的。Tallada(2009)在研究利用单籽粒近红外技术检测玉米特性(氨基酸、蛋白、可溶性糖、油)的研究中,他在每个样本中选取30粒玉米籽粒分别采集光谱,然后以这30个光谱的平均值作为这个样本的光谱;再用这30粒玉米籽粒混合磨成粉末,然后用化学分析法检测各个营养成分的参考化学值,以次作为该样本的参考化学值。由此可见,国外也未能解决如何建立真正意义上的单籽粒近红外检测模型的难题。建立由单籽粒的光谱和参比值数据发展而来的近红外定量分析模型是个难题,这主要是因为近红外技术是一种间接检测目标含量的分析手段。因为种子很小,所检测的目的物质含量很小,很难用现有的化学方法准确测出一颗种子的参比化学值。没有准确的参比化学值,就不能建立准确的近红外校正模型,这是因为参比化学值的误差会加入模型预测的误差里,如果参比化学值的误差较大,必然会导致模型预测效果的误差增大。Dowell(2002)认为近红外光谱所能检测的化合物的最低限为0.1%(质量分数)。Patrick观察到牧草种子的含油量小于5mg时便不能被近红外模型准确预测。Agelet(2014)指出近红外检测的最低限可能会高于0.1%,因为这与种子的大小以及所要检测的物质的特性有关。比如水分的检测限相对于其他化合物而言就比较低,这主要是因为水在近红外处有较强的吸收。单籽粒近红外检测的瓶颈就在于如何准确获取单籽粒中目标物质的含量,只要检测营养成分的实验标准差能小于样本之间营养成分含量的差异,就有可能成功建立真正意义上的单籽粒近红外模型,可以利用差异显著性分析来判断建模的可行性。就目前而言,玉米单籽粒的含油量可以用NMR准确测定,水分可以用烘箱烘干法测定,蛋白可以用燃烧法测定,其他的化学成分还没有找到更好的方法。目前国内外对利用近红外技术建立检测玉米单籽粒营养成分含量的研究还很少,本研究致力于探索如何建立适用于检测玉米单籽粒营养成分的近红外定量分析技术。
发明内容
为了解决现有技术中存在的问题,本发明的目的是提供一种玉米单籽粒种子蛋白质含量检测的方法。
为了实现本发明目的,本发明技术方案如下:
第一方面,本发明提供了玉米单籽粒种子蛋白质检测模型的构建方法,包括如下步骤:
S1.采集单籽粒的漫反射光谱;
S2.采用微量凯氏定氮法(GB 5009.5-2010)获得单籽粒的蛋白质含量参比值,并依据该国标法获取实验员的实验标准差;
S3.光谱预处理:选择有效波长,增大信噪比,消除干扰;
S4.光谱特征提取:利用PLS对数据降维;
S5.采用PLS方法和SVR法分别建立定量分析模型。
进一步地,采集样品漫反射光谱后,剔除异常光谱,获得样品的原始光谱。
采集漫反射光谱时仪器为美国生产的MircroNIR-1700微型近红外光谱仪JDSUniphase[JDSU]Corporation,Milpitas,编号S1-00239)。仪器的分辨率:12.5nm,扫描谱区范围:900nm~1650nm。数据分析软件为Matlab 2011b。
为了扩大样本的代表性,所述样品为不同时间收获、不同遗传物质、含水量在8.8~13.8%的成熟种子。当样本满足上述条件时,能提高模型的包容性。采集样本图谱时,1粒种子为1个样本,每粒种子重复扫描光谱3次,以平均光谱近似作为该样本光谱。
进一步地,所述S1为采集205个样本以上的样品,进行至少3次的重复。能够更好的使构建的鉴别模型具有更高的容变性,稳定性,适用于更广泛的样品以及更复杂的样品蛋白质含量检测。
进一步地,所述有效波长为900nm~1650nm。所剔除的一些波段的噪声信息已经大于有用信息。本方法所选取的有效波长是后期模型达到最优预测能力和高稳定性的必要前提。
进一步地,选择有效波长后,依次进行移动窗口平均(平滑)、一阶差分导数、标准化处理。用平滑处理降低噪声及随机误差,有效的获取有用信息,增大信噪比,用一阶差分导数处理以消除基线的平移和其他干扰,用标准化处理以消除光谱的绝对吸收值,突出样品间的差异。该处理方式和处理顺序下,可以消除仪器因素、光谱扫描背景、进样或是样品性质(温度等)、测量的误差、光的散射等因素的影响,可以有效提取玉米种子的有效信息,能增强后期建模效果,作为优选,移动窗口平均处理中,平滑窗口设为9;一阶差分导数处理中,差分宽度设为1。进一步地,利用PLS将数据降到15维,
采用微量凯氏定氮法(GB 5009.5-2010)获得单籽粒的蛋白质含量参比值。单籽粒经简单破碎后,完全进入消化炉进行消化,然后利用全自动微量凯氏定氮仪(VELP,UDK142)进行蛋白含量检测,获得单籽粒的蛋白含量参比值。进一步地,实验员需要依据该国标法,对同一样品进行平行实验至少7次,以获取实验标准差。
第二方面,本发明提供了一种作物单籽粒种子蛋白含量的检测方法,包括如下步骤:
步骤1、利用前述方法对特定样品建立定量分析模型;
步骤2、由未知样品在同样条件下获得的近红外光谱数据,并对该数据进行同样的预处理和特征提取,最后利用所建立的定量分析模型检测该样品的蛋白质含量。
选择线性相关的PLS法和非线性相关的SVR法分别建立模型,用建立好的模型预测未知样本,以评价模型的预测效果。
对所建定量模型的评价指标主要有以下几种:决定系数(Coefficient ofDetermination,R2),校正标准误差(Standard Error of Calibration,SEC),预测标准误差(Standard Error of Prediction,SEP),相对预测标准误差(Relative Standard Errorof Prediction,RSEP),范围误差(Relative Performance Determinant,RPD),SEP/SEC。
详细算法如下面公式所示:
(1)决定系数R2(Coefficient of Determination)
式中,yi,actual:第i样品的参比值;
yi,predicted:第i样品的近红外模型预测值;
yactual:所有样品参比值的平均值;
n:样品数;
R2被用来评价由建模集建立的模型拟合效果。在浓度范围相同的前提下,R2越接近1,表示预测值越接近参比值,即准确性越高;若R2等于1,则表示完全拟合;若R2为负值,则表示模型拟合效果极差。另外,R2的大小与待测量的分布范围关系极大,对于分布范围很广的待测量,有可能出现R2接近1,但其准确性较差的情况。
(2)校正标准误差(Standard Error of Calibration,SEC)
式中,yi,actual:校正集中第i样品的参比值;
yi,predicted:校正集中第i样品的模型预测值;
n:校正集的样品数;
R:维数
SEC越小,表明模型对建模集的样本预测效果越好。
(3)预测标准误差(Standard Error of Prediction,SEP)
式中,yi,actual:预测集中第i样品的参比值;
yi,predicted:预测集中第i样品的模型预测值;
m:预测集的样品数;
SEP值越小,表明所建模型的预测能力越强、预测结果越准确。
(5)范围误差比RPD(Relative Performance Determinant)
RPD=SD/SEP
式中,SD:建模数据分布标准差
RPD表示近红外分析模型对SD范围内的样品加以分级的数目,它代表了模型的分辨能力。RPD越大表明分级数越多、模型的分辨能力越大。一般RPD≥2.5时,模型即可应用于品种育种的筛选。
(6)SEP/SEC
SEP/SEC用来评价模型的稳健性。模型的稳健性是模型应对待测样品光谱变动的性质,它表示模型容许光谱变动的范围。SEP/SEC值越小,表明模型的稳健性越好,应对样品光谱变动的能力越强。ICC在近红外分析标准中规定在正常的容变性范围内,SEP/SEC应小于1.2。
本发明的有益效果在于:
本发明提供了作物单籽粒种子蛋白质近红外定量分析模型的构建方法,目的是提供一种检测作物单籽粒种子营养成分含量的方法。
本发明运用近红外光谱技术对不同蛋白含量、不同遗传亲缘关系的玉米单籽粒建立近红外定量分析模型。利用PLS和SVR所建模型效果基本相同,两个模型的R2分别为0.9870、0.9871,SEC分别为0.32%、0.32%,SEP分别为0.46%、0.46%,RSEP分别为4.61%、4.60%,RPD分别为6.11、6.11,SEP/SEC分别为1.43、1.44。
附图说明
图1为本发明实施例1中微型近红外光谱仪JDSU实物图。
图2为本发明实施例1中玉米胚朝上光谱采集方式示意图。
图3为本发明实施例1中漫反射光谱采集装置示意图。
图4为本发明实施例1中原始光谱。
图5为本发明实施例1中预处理后的光谱。
图6为本发明实施例1中累积贡献率随主成分数增加的变化趋势。
图7为本发明实施例1中平均标准误差随主成分数增加的变化趋势。
图8为本发明实施例1中PLS模型的校正集的预测值与参比值散点图。
图9为本发明实施例1中PLS模型的预测集的预测值与参比值散点图。
图10为本发明实施例1中SVR模型的校正集的预测值与参比值散点图。
图11为本发明实施例1中SVR模型的预测集的预测值与参比值散点图。
具体实施方式
下面将结合实施例对本发明进行详细说明。需要理解的是以下实施例的给出仅是为了起到说明的目的,并不是用于对本发明的范围进行限制。本领域的技术人员在不背离本发明的宗旨和精神的情况下,可以对本发明进行各种修改和替换。
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1近红外光谱分析技术检测玉米单籽粒蛋白质含量的研究
(一)、材料
实验材料为321粒代表不同时间、不同地点、不同品种的玉米种子,品种包含有农大86、玉源5号、陇玉3号、农大4967、B-36、RILF2、豫87-1、齐319、昌7-2、良玉88♀、迪卡517♂等,共计约300多个品种。实验材料包含杂交种、测交种、自交系、重组自交系等,也包含晚熟品种和早熟品种,以及不同年限(2013、2014、2015收获)、不同地点(海南、中国农大上庄实验站)的种子。所有玉米种子均为自然干燥,水分含量介于8.8%和13.8%之间。
仪器设备:实验采用的近红外光谱仪为美国生产的MircroNIR-1700微型近红外光谱仪(JDS Uniphase[JDSU]Corporation,Milpitas,编号S1-00239),见图1。
(二)、方法
1.光谱采集
1.1光谱仪器参数设置
近红外仪器JDSU设置参数为:积分时间10000μs/次,积分次数400次,故扫描一粒种子得到一条光谱需用4s。
1.2仪器设备的预热
仪器与计算机通过数据线进行连接,在仪器进行光谱采集前,仪器需要预热使其内部达到稳定的温度,以致仪器不会在实验过程当中温度的变化造成系统偏差,影响光谱采集的质量及数据分析结果。
1.3光谱采集方式
光谱采集方式为漫反射,玉米摆放方式为种胚朝上,见图2。用JDSU扫描321粒代表不同时间收获、不同种植地点、不同品种的种子。在这里一粒种子为一个样本,每粒种子扫描1次获得一条光谱,共获取321份光谱。
在进行光谱采集时,对JDSU微型光谱仪添加了外置的氧化铝材质遮光盖扣在仪器上方,防止外界光的干扰,见图3。每扫10粒种子,进行一次白板校正。
2.蛋白参比值测定
蛋白质测定原理按方法《食品安全国家标准食品中蛋白质的测定》(GB 5009.5-2010),采用意大利VELP-DK8半自动消化炉和VELP-UDK142全自动凯氏定氮仪两个仪器。单粒种子用德国IKA-A11分析研磨机(小型)轻度粉碎后全部进入消化炉进行高温消化,然后利用全自动凯氏定氮仪蒸馏,最后用10ml微量滴定管滴定馏出液。
为了了解用于蛋白检测的标准化学方法的标准差,实验采用38号品种9粒大小一致的玉米种子,用标准方法检测其蛋白含量,具体参数见表1。校正集(建模集)和预测集的蛋白含量统计参数分别见表2和表3。
表1.蛋白质标准参考方法的标准差
表2.校正集蛋白相对含量的统计描述
表3.预测集蛋白相对含量的统计描述
3.光谱数据处理
选择900nm~1650nm的有效波长,对原始光谱依次采用如下预处理:平滑(9点窗)→一阶差分(差分宽度为1)→标准化。原始光谱及预处理后的光谱分别见图4和图5。
4.模型的建立
本实验分别采用偏最小二乘法(PLS)和支持向量机法(SVR)分别建立模型。利用PLS法建立模型时,将数据的维数降到15维,具体累积贡献率和平均标准误差随主成分数增加的变化趋势分别见图6和图7。
(三)结果与分析
1.模型预测效果
由建模集建立模型后,再用该模型分析预测集中样本(单籽粒)的蛋白质含量,以检验模型的预测效果,预测效果见表4。
表4.蛋白质近红外模型对未知样本的预测结果(%)
PLS模型的校正集的预测值与参比值散点图、预测集的预测值与参比值散点图见图8和图9。SVR模型的校正集的预测值与参比值散点图、预测集的预测值与参比值散点图见图10和图11。具体模型评价参数见表5。
表5.蛋白质模型评价参数一览表
2.结果分析
(1)由图8到图11以及表5可以看出,PLSR和SVR法所建立的模型效果基本相同,R2均达到0.98以上,拟合效果比较理想;SEP均为0.46,虽比参比实验方法的标准差稍微大一些,但对未知样本蛋白质含量的预测值基本接近参比值,处在可以接受的范围;RPD均大于5,模型既可以用于育种筛选,也可以用于质量控制。SEP/SEC的值略大于1.2,说明模型应对样品光谱变动的能力较弱,模型的稳定性还有待提高。总体来说,由评价参数可以看出由玉米单籽粒的光谱数据和参比值数据所建立的蛋白质近红外定量分析模型是可行的。
(2)两个模型的SEP值(0.46、0.46)均大于标准实验方法的实验标准差(0.34),主要是因为SEP除了包含实验标准差外,还包含其他误差,如环境的变化、光谱采集的随机误差以及其他非确定信息的影响。另外采集光谱时,每粒种子只扫描一次,随机误差较大。若每粒种子多扫描几条光谱,然后以平均光谱作为该粒种子的光谱,便可以大大减小随机误差。模型的进一步改善,还有赖于实验方法的改进以及提高光谱质量。
Claims (9)
1.作物单籽粒种子蛋白质检测模型的构建方法,其特征在于,包括如下步骤:
S1.采集单籽粒的漫反射光谱;
S2.采用微量凯氏定氮法获得单籽粒的蛋白质含量参比值,并依据该国标法获取实验员的实验标准差;
S3.光谱预处理:选择有效波长,增大信噪比,消除干扰;
S4.光谱特征提取:利用PLS对数据降维;
S5.采用PLS方法和SVR法分别建立定量分析模型。
2.根据权利要求1所述的方法,其特征在于,所述样品为不同时间收获、不同遗传物质、含水量在8.8~13.8%的成熟种子。
3.根据权利要求1所述的方法,其特征在于,所述S1为采集205个样本以上的光谱,进行至少3次的重复。
4.根据权利要求1所述的方法,其特征在于,所述S2为将作物单籽粒经简单破碎后,进入消化炉进行消化,进行蛋白含量检测。
5.根据权利要求1所述的方法,其特征在于,S3中所述有效波长为900nm~1650nm。
6.根据权利要求5所述的方法,其特征在于,选择有效波长后,依次进行平滑、一阶差分、标准化处理,增大信噪比,消除干扰。
7.根据权利要求6所述的方法,其特征在于,光谱平滑处理中,平滑窗口设为9;一阶差分导数处理中,差分宽度设为1。
8.根据权利要求5~7任一项所述的方法,其特征在于,所述S4具体为利用PLS将数据降到15维。
9.一种作物单籽粒种子蛋白含量的检测方法,其特征在于,包括如下步骤:
步骤1、利用权利要求1~8任一项所述的方法对特定样品建立定量分析模型;
步骤2、由未知样品在同样条件下获得的近红外光谱数据,并对该数据进行同样的预处理和特征提取,最后利用所建立的定量分析模型检测该样品的蛋白质含量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610308187.0A CN106018321A (zh) | 2016-05-11 | 2016-05-11 | 玉米单粒种子蛋白质检测模型的构建方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610308187.0A CN106018321A (zh) | 2016-05-11 | 2016-05-11 | 玉米单粒种子蛋白质检测模型的构建方法及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106018321A true CN106018321A (zh) | 2016-10-12 |
Family
ID=57099098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610308187.0A Pending CN106018321A (zh) | 2016-05-11 | 2016-05-11 | 玉米单粒种子蛋白质检测模型的构建方法及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106018321A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107094397A (zh) * | 2017-04-28 | 2017-08-29 | 山东农业大学 | 一种快速无损检测作物种子活力的方法 |
CN107764767A (zh) * | 2017-09-20 | 2018-03-06 | 农业部南京农业机械化研究所 | 实时检测联合收割机的谷物蛋白质和水分含量的方法 |
CN110231306A (zh) * | 2019-06-10 | 2019-09-13 | 江南大学 | 一种无损、快速测定奇亚籽蛋白质含量的方法 |
CN110609011A (zh) * | 2019-09-18 | 2019-12-24 | 北京农业智能装备技术研究中心 | 单籽粒玉米种子淀粉含量近红外高光谱检测方法及系统 |
CN110702636A (zh) * | 2019-10-17 | 2020-01-17 | 四川省农业科学院生物技术核技术研究所 | 藜麦种子粗蛋白含量标准曲线及其建立方法和使用方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1484761A (zh) * | 2000-10-30 | 2004-03-24 | ������ɽ���� | 分析农产品的方法和装置 |
CN1900695A (zh) * | 2005-07-21 | 2007-01-24 | 李少昆 | 基于高光谱的小麦氮素含量与籽粒蛋白品质田间快速监测方法 |
CN102072883A (zh) * | 2010-07-07 | 2011-05-25 | 北京农业智能装备技术研究中心 | 农作物种子综合品质检测装置及方法 |
CN102179375A (zh) * | 2011-03-09 | 2011-09-14 | 中国科学院合肥物质科学研究院 | 一种基于近红外作物单籽粒成分无损检测筛选方法 |
CN102279168A (zh) * | 2011-07-20 | 2011-12-14 | 浙江大学 | 基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法 |
US20120092663A1 (en) * | 2010-10-14 | 2012-04-19 | Kull Linda S | Transmission raman spectroscopy analysis of seed composition |
CN102435553A (zh) * | 2010-09-29 | 2012-05-02 | 李少昆 | 利用光谱指数监测小麦籽粒蛋白质含量的方法 |
CN104111234A (zh) * | 2014-07-29 | 2014-10-22 | 中国农业大学 | 基于近红外光谱技术的生物质基础特性在线检测方法及装置 |
-
2016
- 2016-05-11 CN CN201610308187.0A patent/CN106018321A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1484761A (zh) * | 2000-10-30 | 2004-03-24 | ������ɽ���� | 分析农产品的方法和装置 |
CN1900695A (zh) * | 2005-07-21 | 2007-01-24 | 李少昆 | 基于高光谱的小麦氮素含量与籽粒蛋白品质田间快速监测方法 |
CN102072883A (zh) * | 2010-07-07 | 2011-05-25 | 北京农业智能装备技术研究中心 | 农作物种子综合品质检测装置及方法 |
CN102435553A (zh) * | 2010-09-29 | 2012-05-02 | 李少昆 | 利用光谱指数监测小麦籽粒蛋白质含量的方法 |
US20120092663A1 (en) * | 2010-10-14 | 2012-04-19 | Kull Linda S | Transmission raman spectroscopy analysis of seed composition |
CN102179375A (zh) * | 2011-03-09 | 2011-09-14 | 中国科学院合肥物质科学研究院 | 一种基于近红外作物单籽粒成分无损检测筛选方法 |
CN102279168A (zh) * | 2011-07-20 | 2011-12-14 | 浙江大学 | 基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法 |
CN104111234A (zh) * | 2014-07-29 | 2014-10-22 | 中国农业大学 | 基于近红外光谱技术的生物质基础特性在线检测方法及装置 |
Non-Patent Citations (1)
Title |
---|
方彦 等: "近红外光谱法在玉米粗蛋白含量测定研究中的应用", 《甘肃农业大学学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107094397A (zh) * | 2017-04-28 | 2017-08-29 | 山东农业大学 | 一种快速无损检测作物种子活力的方法 |
CN107764767A (zh) * | 2017-09-20 | 2018-03-06 | 农业部南京农业机械化研究所 | 实时检测联合收割机的谷物蛋白质和水分含量的方法 |
CN110231306A (zh) * | 2019-06-10 | 2019-09-13 | 江南大学 | 一种无损、快速测定奇亚籽蛋白质含量的方法 |
CN110609011A (zh) * | 2019-09-18 | 2019-12-24 | 北京农业智能装备技术研究中心 | 单籽粒玉米种子淀粉含量近红外高光谱检测方法及系统 |
CN110702636A (zh) * | 2019-10-17 | 2020-01-17 | 四川省农业科学院生物技术核技术研究所 | 藜麦种子粗蛋白含量标准曲线及其建立方法和使用方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Near infrared reflectance spectroscopy for determination of the geographical origin of wheat | |
Chen et al. | Classification of Chinese honeys according to their floral origin by near infrared spectroscopy | |
Williams et al. | Maize kernel hardness classification by near infrared (NIR) hyperspectral imaging and multivariate data analysis | |
CN106018321A (zh) | 玉米单粒种子蛋白质检测模型的构建方法及其应用 | |
CN107515203A (zh) | 近红外技术定量分析水稻单籽粒直链淀粉含量的研究 | |
CN104062257B (zh) | 一种基于近红外光谱测定溶液中总黄酮含量的方法 | |
CN106706553A (zh) | 一种快速无损测定玉米单籽粒直链淀粉含量的方法 | |
Shenderey et al. | NIRS detection of moldy core in apples | |
CN106918572B (zh) | 马铃薯复配主食中马铃薯含量的测定方法 | |
CN108680515A (zh) | 一种单粒水稻直链淀粉定量分析模型构建及其检测方法 | |
Arazuri et al. | Rheological parameters determination using Near Infrared technology in whole wheat grain | |
KR101206295B1 (ko) | 근적외 다변량 분석법을 이용한 곡물 시료의 원산지 판별방법 | |
CN104062258A (zh) | 一种采用近红外光谱快速测定复方阿胶浆中可溶性固形物的方法 | |
CN108613943A (zh) | 一种基于光谱形态转移的近红外单籽粒作物成分检测方法 | |
Vermeulen et al. | Authentication and traceability of agricultural and food products using vibrational spectroscopy | |
CN111398198A (zh) | 一种小麦籽粒微量元素快速无损检测方法 | |
Tsagkaris et al. | Spelt authenticity assessment using a rapid and simple Fourier transform infrared spectroscopy (FTIR) method combined to advanced chemometrics | |
CN109406447A (zh) | 一种高粱中单宁的近红外检测方法 | |
CN106338488A (zh) | 一种转基因豆奶粉的快速无损鉴别方法 | |
CN105866043A (zh) | 一种利用高光谱技术检测苹果酸味的方法 | |
CN106706554A (zh) | 一种快速无损测定玉米单穗籽粒直链淀粉含量的方法 | |
CN111398199A (zh) | 一种基于高光谱成像的小麦面粉微量元素快速检测方法 | |
Du et al. | Quantitative detection of azodicarbonamide in wheat flour by near-infrared spectroscopy based on two-step feature selection | |
CN104568811B (zh) | 煤炭样品中发热量的新型快速检测方法 | |
CN109540837A (zh) | 近红外快速检测苎麻叶片木质纤维素含量的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161012 |
|
RJ01 | Rejection of invention patent application after publication |