CN114018864B - 灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法 - Google Patents
灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法 Download PDFInfo
- Publication number
- CN114018864B CN114018864B CN202111322966.3A CN202111322966A CN114018864B CN 114018864 B CN114018864 B CN 114018864B CN 202111322966 A CN202111322966 A CN 202111322966A CN 114018864 B CN114018864 B CN 114018864B
- Authority
- CN
- China
- Prior art keywords
- corn
- characteristic
- wavelength
- characteristic wavelength
- powder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 240000008042 Zea mays Species 0.000 title claims abstract description 125
- 235000002017 Zea mays subsp mays Nutrition 0.000 title claims abstract description 125
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 title claims abstract description 121
- 235000005822 corn Nutrition 0.000 title claims abstract description 121
- 238000000034 method Methods 0.000 title claims abstract description 45
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 35
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 35
- 238000001514 detection method Methods 0.000 claims abstract description 33
- 238000007637 random forest analysis Methods 0.000 claims abstract description 32
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 14
- 108060006613 prolamin Proteins 0.000 claims abstract description 14
- 238000001228 spectrum Methods 0.000 claims description 39
- 239000000843 powder Substances 0.000 claims description 38
- 230000003595 spectral effect Effects 0.000 claims description 34
- 235000013339 cereals Nutrition 0.000 claims description 25
- 238000012216 screening Methods 0.000 claims description 25
- 238000002329 infrared spectrum Methods 0.000 claims description 16
- 238000005070 sampling Methods 0.000 claims description 15
- 238000007781 pre-processing Methods 0.000 claims description 8
- 239000000126 substance Substances 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 210000005069 ears Anatomy 0.000 claims description 5
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 4
- 235000009973 maize Nutrition 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 claims description 4
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000010238 partial least squares regression Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000000227 grinding Methods 0.000 claims description 2
- 239000011440 grout Substances 0.000 claims description 2
- 230000000717 retained effect Effects 0.000 claims description 2
- 238000010561 standard procedure Methods 0.000 claims description 2
- 238000009395 breeding Methods 0.000 abstract description 12
- 230000001488 breeding effect Effects 0.000 abstract description 12
- 238000005516 engineering process Methods 0.000 abstract description 2
- 235000019441 ethanol Nutrition 0.000 description 17
- 238000003066 decision tree Methods 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 4
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 229960004756 ethanol Drugs 0.000 description 3
- 238000003306 harvesting Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000002331 protein detection Methods 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 241001057636 Dracaena deremensis Species 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 239000004327 boric acid Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 229910000365 copper sulfate Inorganic materials 0.000 description 1
- ARUVKPQLZAKDPS-UHFFFAOYSA-L copper(II) sulfate Chemical compound [Cu+2].[O-][S+2]([O-])([O-])[O-] ARUVKPQLZAKDPS-UHFFFAOYSA-L 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- OTYBMLCTZGSZBG-UHFFFAOYSA-L potassium sulfate Chemical compound [K+].[K+].[O-]S([O-])(=O)=O OTYBMLCTZGSZBG-UHFFFAOYSA-L 0.000 description 1
- 229910052939 potassium sulfate Inorganic materials 0.000 description 1
- 235000011151 potassium sulphates Nutrition 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
- 229940093612 zein Drugs 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N2021/3595—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using FTIR
Abstract
本发明的灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法,基于随机森林特征重要性和区间偏最小二乘法相结合的算法进行玉米籽粒醇溶蛋白的特征波长筛选先根据随机森林特征重要性进行特征波长的初步筛选,然后使用区间偏最小二乘法对特征波长子集进行波长二次筛选,进一步剔除因随机森林的随机性问题造成的相关性较弱的波长点,同时能够将离散的特征波长点联合起来,提升预测精度。该方法具有检测速度快、精度高的特点,能够解决检测中普遍存在速度慢、损害种子、需要大量的样品集等问题,实现了玉米灌浆期间籽粒醇溶蛋白的快速检测,有效解决了玉米育种过程中检测醇溶蛋白技术耗时长、工作强度大的问题。
Description
技术领域
本发明属于玉米考种技术领域,主要涉及一种玉米灌浆期的醇溶蛋白质含量变化的近红外光谱快速检测方法。
背景技术
我国玉米种植现在及未来将面向规范化、机械化和自动化种植方向发展。玉米籽粒的硬度是否适合机械粒收的判定将是推动玉米种植机械化发展的方向之一,也是在玉米加工、管理、储藏等环节使用的重要指标。适宜密植和机械化作业的玉米品种的最直接的特征是机收籽粒的破碎率在8%以下,损失率在5%以下,杂质率在1.5%以下,符合我国目前的机械收获的损失率标准,而籽粒破碎率与玉米籽粒的醇溶蛋白呈显著相关。所以在玉米育种中,培育适宜密植和机械化作业的新品种的关键之一是对玉米灌浆期籽粒的蛋白质含量中的醇溶蛋白进行准确快速的测量。
另一方面,玉米种子的质量会直接影响到玉米的播种质量和产量,玉米生物育种是保证优质玉米种子的重要环节,玉米品质也是保证玉米机械化收获的重要保障。每年的玉米生物育种量可达几万甚至几十万份,全自动的玉米考种生产线是必要的,蛋白质的检测是生产线上非常重要且需要精密处理的环节。种子及其亲本,尤其是自交粒每穗籽粒数量较少,有时会少至几十甚至十几粒,非常珍贵。传统的蛋白质含量的测定需要大量的玉米考种样本、设备及人工操作时间。而在玉米育种时,由于受繁育新品种的种植面积,每平方米可以种植的玉米植株数目,有效试验穗数量等客观条件的制约,灌浆期玉米籽粒含水率测量时样本的取样数量、取样成本等受到一定限制。
发明内容
本发明旨在于克服现有技术的不足,针对现有玉米灌浆期间籽粒醇溶蛋白检测中普遍存在速度慢、损害种子、需要大量的样品集等问题,结合适宜机收玉米育种考种过程中醇溶蛋白的快速检测需求,本发明提出一种灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法,不仅能够改善近红外光谱的定量分析模型的建模速率,扩展近红外光谱分析方法应用领域;减少在玉米育种过程中的采样数量,节约玉米育种中的亲本,为玉米育种、品种改良等方面提供醇溶蛋白检测技术支持;有助于提高玉米种子育种的大规模自动化的快速发展,促进玉米机械化进程的推进。
本发明的灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法,是通过下列步骤实现的:
1)样品采集与制备
采集不同产地适宜种植的玉米品种,从玉米进入灌浆期开始,每7天进行一次采样,采集5~7次,每次每个品种采样不少于50穗,按照3:2的比例进行分配,其中3份用来收集光谱数据和进行蛋白质的测定,2份作为保留样本放在阴凉干燥处;
2)近红外光谱采集
采用布鲁克傅立叶变换Tango-R型近红外光谱仪采集光谱数据,光谱采集波长范围1104~2495nm,分辨率为16 cm-1;光谱采集时分为两次采集,第一次对玉米籽粒进行光谱采集,获得不少于120份样本的玉米籽粒平均光谱;第二次将上述玉米籽粒研磨成化学测定所需要的粉末,装进相同的样本池,并同时完成玉米粉末光谱的采集;
3)样本醇溶蛋白化学值的测定
对步骤2得到的玉米粉末,采用国标方法进行蛋白质测试;
4)样品集划分及光谱数据预处理
将步骤2)得到的玉米籽粒光谱样本和玉米粉末的光谱样本按照70%建模集和30%预测集的比例进行随机划分,并利用标准归一化处理方法对原始光谱数据进行预处理;
5)基于随机森林特征重要性和区间偏最小二乘法相结合的算法进行玉米籽粒和粉末的醇溶蛋白的近红外光谱特征波长的筛选
第一步:对经步骤4)处理的建模集玉米籽粒和玉米粉末平均光谱分别进行随机森林特征重要性计算并降序排序,设置特征重要性阈值,若特征变量重要性大于此阈值,则提取这部分变量,并将特征变量按照特征重要性结果从大到小依次排列,构成特征波长子集;后面的处理均对玉米籽粒光谱数据和玉米粉末光谱数据分别进行处理;
第二步:采用区间偏最小二乘法对特征波长子集进行特征波长二次筛选,区间偏最小二乘法将特征波长子集划分为等宽的n个子区间,比较各个区间PLS模型中的建模集和预测集均方根误差,将最小的均方根误差对应区间的波长作为最优特征波长子集,建立偏最小二乘回归模型,能够得到较高的回归模型性能;
第三步:通过蒙特卡洛方法对特征波长子集进行特征波长样本随机采样,验证随机森林特征重要性结合区间偏最小二乘算法筛选醇溶蛋白特征波长,根据随机森林特征重要性得到的特征波长子集经过蒙特卡洛500次样本随机采样后,结合区间偏最小二乘法进行特征波长二次筛选,设置子区间的个数与第二步相同,选定建模集均方根误差最小时所对应的特征波长点,与随机森林特征重要性结合区间偏最小二乘法筛选的最优特征波长子集中的波长点做对比,确认最后建模的特征波长集合;
6)检测模型建立与评价
分别将玉米籽粒建模集光谱数据和玉米粉末建模集光谱数据按随机森林特征重要性和区间偏最小二乘法相结合的方法,筛选出灌浆期玉米籽粒和玉米粉末的醇溶蛋白的特征波长并建立偏最小二乘回归模型,并分别使用玉米籽粒和玉米粉末预测集对上述籽粒和粉末的回归模型的精度进行评测。若预测集的评测结果不满足实际检测精度要求,重新执行步骤5,进行特征波长筛选和回归模型建立;当建立的偏最小二乘回归模型检测精度满足需求时,对照玉米籽粒光谱和玉米粉末光谱的预测结果,得到籽粒预测模型和粉末预测模型的醇溶蛋白质含量预测偏差,并将偏差作为调整系数添加到玉米籽粒预测模型中,输出相应模型,完成玉米籽粒醇溶蛋白近红外光谱快速检测模型的构建;
7)玉米籽粒醇溶蛋白质的检测
对需要检测灌浆期间籽粒醇溶蛋白的玉米籽粒进行近红外光谱扫描获得玉米籽粒光谱,对光谱数据进行预处理后再按优选的特征波长输入检测模型,既可完成灌浆期玉米籽粒醇溶蛋白质含量的快速检测。
本发明的灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法,基于随机森林特征重要性和区间偏最小二乘法相结合的算法进行玉米籽粒醇溶蛋白的特征波长筛选先根据随机森林特征重要性进行特征波长的初步筛选,既解决了近红外光谱全谱中存在波长冗余的问题,又能够从全谱中筛选出特征波长点并对其进行排序,构成特征子集。然后使用区间偏最小二乘法对特征波长子集进行波长二次筛选,进一步剔除因随机森林的随机性问题造成的相关性较弱的波长点,同时能够将离散的特征波长点联合起来,提升预测精度。基于该波长筛选方法建立的玉米籽粒醇溶蛋白偏最小二乘回归模型具有检测速度快、精度高的特点,能够解决检测中普遍存在速度慢、损害种子、需要大量的样品集等问题,实现了玉米灌浆期间籽粒醇溶蛋白的快速检测,有效解决了玉米育种过程中检测醇溶蛋白技术耗时长、工作强度大的问题。
附图说明
图1基于随机森林特征重要性和区间偏最小二乘法相结合的算法进行玉米籽粒醇溶蛋白的特征波长筛选流程示意图。
具体实施方式
本发明的灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法,是通过下列步骤实现的:
1)样品采集与制备
采集实验用选取2-3个北方垦区适宜种植的玉米品种,从玉米进入灌浆期开始,一般从8月末开始,每一个灌浆周期(7天)进行一次采样,采集7次,每次每个品种采样50穗,其中30穗用来收集玉米籽粒、玉米粉末光谱数据和进行蛋白质的测定,20穗作为保留样本放在阴凉干燥处。光谱采集,取每穗中间200粒共6000粒,作为光谱采集和化学值测定的实验样本。
2)近红外光谱采集
光谱采用布鲁克傅立叶变换Tango-R型近红外光谱仪采集光谱数据,光谱采集波长范围1104~2495nm,分辨率为16 cm-1。光谱采集时分为两次采集,第一次为玉米籽粒的光谱采集,每次采集将规格为50mm的样品池每次装样50粒,采用旋转台方式扫描32次取平均值,获得120份样本的平均光谱。第二次采集为玉米粉末光谱的采集,将相同的样本研磨成化学测定所需要的粉末,装进相同的样本池,完成光谱的采集,并进行一一对应记录;采样过程中保持实验室内温度在25℃左右,湿度在50%RH左右,每60分钟扫描一次背景。
3)样本醇溶蛋白化学值的测定
采用自动凯氏定氮仪对7个灌浆期的共计采集与制备的840个样品进行蛋白质测试实验。每个样本取1.500g,每次将12个样本置于消化管中,按照蛋白质测定的国家标准(GB 5009.5-2016)加入硫酸铜、硫酸钾和0.0500mol/L硫酸标准滴定溶液,加入剂量分别为0.4g、6g和20mL。将消化管置于消化炉上恒定温度达到420℃保持1小时,带消化管中呈现绿色透明状液体,完成消化过程。冷却后加入50mL纯水,完成自动凯氏定氮仪的样本制备。在定氮仪中准备好10mol/L NaOH溶液、0.0500mol/L硫酸标准滴定溶液、甲基红和亚甲基蓝的2:1的95%乙醇溶液、0.3226mol/L硼酸溶液的分析溶液。用KjelFlexK-360凯氏定氮仪测定蛋白质含量,其中,氮与蛋白质的转换系数取值6.25。
4)样品集划分及光谱数据预处理
将步骤2)得到的玉米籽粒840个样本和玉米粉末的光谱样本840个样本按照70%建模集和30%预测集的比例进行随机划分,两种光谱样本的建模集均包含588个样本,预测集均包含252个样本。蛋白质近红外光谱存在明显的基线漂移和噪声干扰引起的不平滑等问题。为了在全光谱区域内校正光谱基线、消除相关噪声的干扰,减少光谱数据在一定程度上的线性相关,利用标准归一化处理方法对上述原始光谱数据进行预处理。
5)基于随机森林特征重要性和区间偏最小二乘法相结合的算法进行玉米籽粒和粉末醇溶蛋白的近红外光谱特征波长的筛选
第一步:基于随机森林特征重要性的近红外光谱特征波长初步筛选。随机森林作为一种集成算法,可计算特征重要性进行特征筛选。由于随机森林因具有随机抽样和随机特征选取的双重随机特性,仅使用特征属性在随机森林决策树中的出现频率来体现特征重要性并不可取,因此,为了更准确地反映出光谱特征的重要性,选择基于袋外数据的平均精度下降方法计算均方误差作为特征的重要性。假设随机森林中有T棵决策树,对于每棵决策树t m (m=1,…T),输入袋外数据的矩阵X OOB ,计算预测值Y p 与真实值Y的均方误差 00Bm,袋外数据的其他特征变量保持不变,只打乱X OOB 中第i列特征变量顺序重新排列,即X OOB i ,利用决策树t m 对打乱顺序重新排列后的样本进行预测,计算预测值Y p i 与真实值Y的均方误差 i 00Bm,,特征变量X OOB i 对决策树t m 预测的均方误差为 ,遍历整个随机森林,特征变量X OOB i 的重要性结果为 。对经步骤4)处理的建模集光谱集合进行随机森林特征重要性计算并降序排序,设置特征重要性阈值,若特征变量重要性大于此阈值,则提取这部分变量,并将特征变量按照特征重要性结果从大到小依次排列,构成特征波长子集;
第二步:基于区间偏最小二乘法的近红外光谱特征波长的二次筛选。针对基于随机森林特征重要性筛选的特征波长存在随机性现象,可能存在无效变量,且无法保证筛选出一个规模较小的优化特征波长子集,因此采用区间偏最小二乘法对特征波长子集进行特征波长二次筛选。区间偏最小二乘法将特征波长子集划分为等宽的n个子区间,比较各个区间PLS模型中的建模集和预测集均方根误差,将最小的均方根误差对应区间的波长作为最优特征波长子集,建立偏最小二乘回归模型,能够得到较高的回归模型性能;
第三步:通过蒙特卡洛方法对特征波长子集进行特征波长样本随机采样,验证随机森林特征重要性结合区间偏最小二乘算法筛选醇溶蛋白特征波长。根据随机森林特征重要性得到的特征波长子集经过蒙特卡洛500次样本随机采样后,结合区间偏最小二乘法进行特征波长二次筛选,设置子区间的个数与第二步相同,选定建模集均方根误差最小时所对应的特征波长点,与随机森林特征重要性结合区间偏最小二乘法筛选的最优特征波长子集中的波长点做对比,确认最后建模的特征波长集合。
6)检测模型建立与评价
分别将玉米籽粒建模集光谱数据和玉米粉末建模集光谱数据按随机森林特征重要性和区间偏最小二乘法相结合的方法,筛选出灌浆期玉米籽粒和玉米粉末的醇溶蛋白的特征波长并建立偏最小二乘回归模型,并分别使用玉米籽粒和玉米粉末预测集对上述籽粒和粉末的回归模型的精度进行评测。若预测集的评测结果不满足实际检测精度要求,重新执行步骤5,进行特征波长筛选和回归模型建立;当建立的偏最小二乘回归模型检测精度满足需求时,对照玉米籽粒光谱和玉米粉末光谱的预测结果,得到籽粒预测模型和粉末预测模型的醇溶蛋白质含量预测偏差,并将偏差作为调整系数添加到玉米籽粒预测模型中,输出相应模型,完成玉米籽粒醇溶蛋白近红外光谱快速检测模型的构建。
7)玉米籽粒醇溶蛋白质的检测
对需要检测灌浆期间籽粒醇溶蛋白的玉米籽粒进行近红外光谱扫描获得玉米籽粒光谱,对光谱数据进行预处理后再按优选的特征波长输入检测模型,既可完成灌浆期玉米籽粒醇溶蛋白质含量的快速检测。
Claims (1)
1.灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法,是通过下列步骤实现的:
1)样品采集与制备
采集不同产地适宜种植的玉米品种,从玉米进入灌浆期开始,每7天进行一次采样,采集5~7次,每次每个品种采样不少于50穗,按照3:2的比例进行分配,其中3份用来收集光谱数据和进行蛋白质的测定,2份作为保留样本放在阴凉干燥处;
2)近红外光谱采集
采用布鲁克傅立叶变换Tango-R型近红外光谱仪采集光谱数据,光谱采集波长范围1104~2495nm,分辨率为16 cm-1;光谱采集时分为两次采集,第一次对玉米籽粒进行光谱采集,每个灌浆期获得不少于120份样本的玉米籽粒平均光谱;第二次将上述玉米籽粒研磨成化学测定所需要的粉末,装进相同的样本池,并同时完成玉米粉末光谱的采集;
3)样本醇溶蛋白化学值的测定
对步骤2)得到的玉米粉末,采用国标方法进行蛋白质测试;
4)样品集划分及光谱数据预处理
将步骤2)得到的玉米籽粒光谱样本和玉米粉末的光谱样本分别按照70%建模集和30%预测集的比例进行随机划分,并利用标准归一化处理方法对原始光谱数据进行预处理;
5)基于随机森林特征重要性和区间偏最小二乘法相结合的算法进行玉米籽粒和粉末醇溶蛋白的近红外光谱特征波长的筛选
第一步:对经步骤4)处理的建模集玉米籽粒和玉米粉末平均光谱分别进行随机森林特征重要性计算并降序排序,设置特征重要性阈值,若特征变量重要性大于此阈值,则提取这部分变量,并将特征变量按照特征重要性结果从大到小依次排列,构成特征波长子集;后面的处理均对玉米籽粒光谱数据和玉米粉末光谱数据分别进行处理;
第二步:采用区间偏最小二乘法对特征波长子集进行特征波长二次筛选,区间偏最小二乘法将特征波长子集划分为等宽的n个子区间,比较各个区间PLS模型中的建模集和预测集均方根误差,将最小的均方根误差对应区间的波长作为最优特征波长子集,建立偏最小二乘回归模型,能够得到较高的回归模型性能;
第三步:通过蒙特卡洛方法对特征波长子集进行特征波长样本随机采样,验证随机森林特征重要性结合区间偏最小二乘算法筛选醇溶蛋白特征波长,根据随机森林特征重要性得到的特征波长子集经过蒙特卡洛500次样本随机采样后,结合区间偏最小二乘法进行特征波长二次筛选,设置子区间的个数与第二步相同,选定建模集均方根误差最小时所对应的特征波长点,与随机森林特征重要性结合区间偏最小二乘法筛选的最优特征波长子集中的波长点做对比,确认最后建模的特征波长集合;
6)检测模型建立与评价
分别将玉米籽粒建模集光谱数据和玉米粉末建模集光谱数据按随机森林特征重要性和区间偏最小二乘法相结合的方法,筛选出灌浆期玉米籽粒和玉米粉末的醇溶蛋白的特征波长并建立偏最小二乘回归模型,并分别使用玉米籽粒和玉米粉末预测集对上述籽粒和粉末的回归模型的精度进行评测;若预测集的评测结果不满足实际检测精度要求,重新执行步骤5,进行特征波长筛选和回归模型建立;当建立的偏最小二乘回归模型检测精度满足需求时,对照玉米籽粒光谱和玉米粉末光谱的预测结果,得到籽粒预测模型和粉末预测模型的醇溶蛋白质含量预测偏差,并将偏差作为调整系数添加到玉米籽粒预测模型中,输出相应模型,完成玉米籽粒醇溶蛋白近红外光谱快速检测模型的构建;
7)玉米籽粒醇溶蛋白质的检测
对需要检测灌浆期间籽粒醇溶蛋白的玉米籽粒进行近红外光谱扫描获得玉米籽粒光谱,对光谱数据进行预处理后再按优选的特征波长输入检测模型,既可完成灌浆期玉米籽粒醇溶蛋白质含量的快速检测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111322966.3A CN114018864B (zh) | 2021-11-10 | 2021-11-10 | 灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111322966.3A CN114018864B (zh) | 2021-11-10 | 2021-11-10 | 灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114018864A CN114018864A (zh) | 2022-02-08 |
CN114018864B true CN114018864B (zh) | 2022-09-16 |
Family
ID=80062676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111322966.3A Active CN114018864B (zh) | 2021-11-10 | 2021-11-10 | 灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114018864B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103344600A (zh) * | 2013-06-28 | 2013-10-09 | 中国农业大学 | 一种蚁群优化算法的近红外光谱特征波长选择方法 |
CN103913432A (zh) * | 2014-03-25 | 2014-07-09 | 西安交通大学 | 基于粒子群算法的近红外光谱波长选择方法 |
CN106815643A (zh) * | 2017-01-18 | 2017-06-09 | 中北大学 | 基于随机森林迁移学习的红外光谱模型传递方法 |
CN108519339A (zh) * | 2018-03-26 | 2018-09-11 | 江苏大学 | 一种基于WT-LSSVR的叶片镉含量Vis-NIR光谱特征建模方法 |
CN108776118A (zh) * | 2018-03-16 | 2018-11-09 | 北京市畜牧总站 | 一种基于近红外光谱的鸡蛋营养物质快速检测方法 |
CN111968080A (zh) * | 2020-07-21 | 2020-11-20 | 山东农业大学 | 一种基于高光谱和深度学习的肥城桃内外品质检测方法 |
-
2021
- 2021-11-10 CN CN202111322966.3A patent/CN114018864B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103344600A (zh) * | 2013-06-28 | 2013-10-09 | 中国农业大学 | 一种蚁群优化算法的近红外光谱特征波长选择方法 |
CN103913432A (zh) * | 2014-03-25 | 2014-07-09 | 西安交通大学 | 基于粒子群算法的近红外光谱波长选择方法 |
CN106815643A (zh) * | 2017-01-18 | 2017-06-09 | 中北大学 | 基于随机森林迁移学习的红外光谱模型传递方法 |
CN108776118A (zh) * | 2018-03-16 | 2018-11-09 | 北京市畜牧总站 | 一种基于近红外光谱的鸡蛋营养物质快速检测方法 |
CN108519339A (zh) * | 2018-03-26 | 2018-09-11 | 江苏大学 | 一种基于WT-LSSVR的叶片镉含量Vis-NIR光谱特征建模方法 |
CN111968080A (zh) * | 2020-07-21 | 2020-11-20 | 山东农业大学 | 一种基于高光谱和深度学习的肥城桃内外品质检测方法 |
Non-Patent Citations (6)
Title |
---|
Nondestructive prediction model of internal hardness attribute of fig fruit using NIR spectroscopy and RF;Rui Sun 等;《Multimedia Tools and Applications》;20210317;第21579–21594页 * |
基于可见/近红外光谱和变量选择的脐橙可溶性固形物含量在线检测;江水泉等;《食品与机械》;20200215(第02期);第95-99页 * |
基于无人机高光谱融合连续投影算法估算棉花地上部生物量;易翔 等;《棉花学报》;20210331;第224―234页 * |
基于特征波长选择和建模的高光谱土壤总氮含量估测方法研究;王文才等;《浙江农业学报》;20180925(第09期);第137-145页 * |
奇异数据筛选法在玉米籽粒蛋白质近红外光谱检测中的应用;梁秀英等;《激光生物学报》;20150215(第01期);第44-51页 * |
近红外光谱技术应用于玉米单籽粒蛋白质含量检测分析的初步研究;张新玉等;《中国农业大学学报》;20170515(第05期);第30-36页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114018864A (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109187441B (zh) | 基于冠层光谱信息的夏玉米含氮量监测模型的构建方法 | |
CN110082300B (zh) | 基于光谱参量的冬小麦冠层含水率监测模型建立方法 | |
CN110567892B (zh) | 一种基于临界氮浓度的夏玉米氮素高光谱预测方法 | |
CN110189793B (zh) | 基于高光谱的小麦氮肥生理利用率估测模型构建及不同氮效率小麦品种分类 | |
CN106770019A (zh) | 一种多花黑麦草可溶性糖含量的测定方法 | |
CN104255118B (zh) | 基于近红外光谱技术的水稻种子发芽率快速无损测试方法 | |
CN107202784B (zh) | 一种水稻浸种催芽过程中工艺节点的检测方法 | |
CN112129709A (zh) | 一种苹果树冠层尺度氮含量诊断方法 | |
CN113670913B (zh) | 水稻氮素含量反演高光谱植被指数构建方法 | |
CN114018864B (zh) | 灌浆期玉米籽粒醇溶蛋白质含量变化快速检测方法 | |
CN113552096A (zh) | 一种基于光谱的菠萝叶片氮含量估算方法 | |
Wang et al. | Monitoring model for predicting maize grain moisture at the filling stage using NIRS and a small sample size | |
CN111426645A (zh) | 一种快速测定植株不同器官氮含量的方法 | |
CN107796779A (zh) | 橡胶树叶片氮素含量的近红外光谱诊断方法 | |
Peternelli et al. | Selection of sugarcane clones via multivariate models using near-infrared (NIR) spectroscopy data | |
CN113267458A (zh) | 甘薯可溶性蛋白质含量定量预测模型的建立方法 | |
CN112700174A (zh) | 白芍种芽质量评价指标的筛选方法及质量评价方法 | |
ZhengYang et al. | A study on hyperspectral estimating models of tobacco leaf area index | |
Kuai et al. | Prediction Model of the Key Components for Lodging Resistance in Rapeseed Stalk Using Near-Infrared Reflectance Spectroscopy (NIRS) | |
CN113640230B (zh) | 一种田间小麦水分利用率快速检测方法及系统 | |
CN106442365A (zh) | 一种梨树精准施氮技术 | |
CN117172385B (zh) | 一种甘蔗高糖度收获期预测方法及系统 | |
CN113504186B (zh) | 一种遥感估算小麦氮肥利用率的方法 | |
CN116500231A (zh) | 一种青稞籽粒硒含量的快速预测模型构建与应用 | |
CN112749837B (zh) | 一种基于花后ndvi积累值估测谷类作物产量的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |