CN108613943B - 一种基于光谱形态转移的近红外单籽粒作物成分检测方法 - Google Patents

一种基于光谱形态转移的近红外单籽粒作物成分检测方法 Download PDF

Info

Publication number
CN108613943B
CN108613943B CN201810436495.0A CN201810436495A CN108613943B CN 108613943 B CN108613943 B CN 108613943B CN 201810436495 A CN201810436495 A CN 201810436495A CN 108613943 B CN108613943 B CN 108613943B
Authority
CN
China
Prior art keywords
spectrum
matrix
grain
sample
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810436495.0A
Other languages
English (en)
Other versions
CN108613943A (zh
Inventor
吴跃进
徐琢频
范爽
王�琦
刘斌美
刘晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Institutes of Physical Science of CAS
Original Assignee
Hefei Institutes of Physical Science of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Institutes of Physical Science of CAS filed Critical Hefei Institutes of Physical Science of CAS
Priority to CN201810436495.0A priority Critical patent/CN108613943B/zh
Publication of CN108613943A publication Critical patent/CN108613943A/zh
Application granted granted Critical
Publication of CN108613943B publication Critical patent/CN108613943B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种基于光谱形态转换的近红外单籽粒作物成分检测方法,所述检测方法具体为采集粗加工后的单籽粒作物(或作物粉末)的近红外光谱,以常规化学法为参比,建立光谱与参比值之间的模型。预测时采集待测单籽粒作物光谱,通过标准光谱以及光谱空间转换算法,将待测单籽粒作物光谱转移成粗加工后的单籽粒作物(或作物粉末)的光谱形态,继而使用模型预测其组分。该方法优点在于,建模分析对象为粗加工后的单籽粒作物(或作物粉末),而不是品种来源复杂、颖壳及颗粒形态干扰大的单籽粒作物,所建模型更加准确、稳健;建模对参比法精度要求低,分析过程经济节约。检测时,单籽粒作物不需预处理,检测结果无损、准确、快速。

Description

一种基于光谱形态转移的近红外单籽粒作物成分检测方法
技术领域
本发明涉及一种单籽粒作物成分含量的检测方法,具体涉及一种基于光谱形态转移的近红外单籽粒作物成分检测方法。
背景技术
近红外光谱是指波长在780nm~2526nm范围内(波数为12820cm-1~3959cm-1)的电磁波,近红外光谱可以反映有机化合物以及混合物中含氢基团(C-H、N-H、O-H)振动的合频和各级倍频的吸收,通过样品光谱扫描,可以得到样品中有机分子含氢基团的化学键信息。近红外光谱技术近年来广泛用于农业、化工、食品、生命科学、环境保护和质量监督等领域,它的优点是快速、高效、准确、不损伤样品、可同时分析多个组分。
单籽粒近红外光谱分析技术,是指采用近红外光谱分析技术分析单籽粒作物。该技术的发展对育种行业、粮食行业有着重大的意义。对作物育种而言,培育符合需要的特定性状的新品种是育种行业不断追求的目标。为了缩短育种进程、提高育种效率,育种家希望能够在早代对单籽粒种子的某些特定品质性状进行鉴定和筛选,因而要求一种技术能够快速、无损地检测单籽粒种子的特定组分含量,采用单籽粒近红外光谱技术,有望满足育种家对单籽粒种子成分含量快速无损检测的需求。对于粮食行业,随着人们对粮食品质的要求不断细化,根据粮食的品质高低按质论价是未来趋势。过去色选、重力分选等相关技术和设备的发展,只能用于分选单籽粒作物的外观品质或者一些简单特征如重量、大小等,但单籽粒近红外光谱技术可以检测单籽粒作物的内在有机组分的含量,因而该技术的发展有望推进粮食作物内在品质的检测甚至是分选。
传统单籽粒检测方法分析单籽粒作物成分的流程如图1所示,测量时,先收集单籽粒作物自然状态样品,作为校正集,进行光谱采集、光谱预处理以及化学值检测,建立单籽粒作物自然状态成分分析模型,预测时以其他的待测该作物单籽粒自然状态样品作为测试集,根据建立的单籽粒作物自然状态成分分析模型实现测试集中单籽粒作物的成分预测。
然而,单籽粒近红外光谱分析技术存在着如下两方面瓶颈:一方面,各种干扰因素影响了单籽粒作物的光谱表现。相比粗加工后的籽粒,单籽粒作物存在较大颖壳吸收,这些吸收往往是与待测成分无关的噪声;而相比磨粉后的籽粒,单籽粒作物还存在大小不一的颗粒形态、成分分布不一的内部结构的干扰,导致近红外分析的结果往往是单籽粒作物不如其粗加工后的作物,粗加工后的作物不如其粉末样品。另一方面,单籽粒作物由于太小,而大部分常规的参比方法是为大量样品设计的,例如国标中用于检测直链淀粉的碘比色法、用于检测脂肪的索氏提取法等等,其称样量大大高于单籽粒作物的质量,因而难以精确测定其参比值,即使少数微量检测方法可以检测,但其配套仪器往往价格不菲、检测费用昂贵,相比适用于群体样品分析的常规参比方法成本较高。
模型转移是一种模型通用化的数学处理,常用用于校正检测条件改变或仪器自身条件发生变化时出现的光谱差异或预测结果偏差,Pereira L.S.A等的研究表明,模型转移也可用于传递同一样品不同物理形态的光谱。光谱空间转换(SST)算法是一种简单、有效、准确的模型转移算法。使用该算法,有望校正单籽粒作物、粗加工后的单籽粒作物、作物粉末之间的光谱差异,使之光谱形态互相转换,因此单籽粒作物近红外检测时遇到的上述两方面不足,即可通过转移成粗加工后的单籽粒作物(或作物粉末)的光谱形态来克服。
当将待测单籽粒作物光谱转换成粗加工后的单籽粒作物(或作物粉末)的光谱形态后,则可采用粗加工后的单籽粒作物(或作物粉末)进行建模分析。使用粗加工后的单籽粒作物建模有望规避单籽粒作物分析时遇到的颖壳吸收的干扰;而使用作物粉末建模有望规避单籽粒作物分析时遇到的颖壳、颗粒形态以及内在分布不均的干扰,此外,使用作物粉末建模时,采用的样品不仅可以来源于单籽粒作物的粉末,更可来源于大量该作物混合后加工的粉末,因而称样量较大,是可采用常规方法(而不是微量方法)做参比的,有望规避单籽粒作物微量检测不易实现的问题,同时节约分析成本。有望有效推进单籽粒近红外分析技术的发展和应用。
发明内容
本发明所要解决的技术问题在于提出了一种新的近红外单籽粒作物成分检测方法,以克服常规近红外单籽粒作物成分分析时受颖壳、颗粒形态以及内在分布不均的影响导致光谱干扰以及常规适用于大量样品的参比方法对单籽粒成分含量检测不够精确,而微量参比方法检测成本高昂的问题。
本发明是通过以下技术方案解决上述技术问题的:
一种基于光谱形态转移的近红外单籽粒作物成分检测方法,包括以下步骤:
A:作物粗加工状态和/或粉末状态下近红外成分分析模型的构建:
(1)、校正集样品收集、光谱采集:收集若干份待测成分含量有差异的单籽粒作物粗加工状态下的样品,采集样品的近红外光谱;收集单籽粒作物粉末状态下样品或多个单籽粒作物粉末状态下的样品,采集相应样品的近红外光谱,以单籽粒作物粗加工状态样品的光谱、单籽粒作物粉末状态样品的光谱以及多个单籽粒作物混合加工后的粉末状态样品的光谱中的一种样品状态的光谱或一种样品状态以上的光谱集合作为校正集;
(2)、校正集光谱预处理:对校正集光谱进行预处理,增大信噪比,消除干扰,获得预处理后的校正集光谱矩阵,所述校正集光谱矩阵中的每行代表一个样品光谱,不同的行代表不同样品的光谱;
(3)、校正集样品待测成分参比值的获取:使用参比方法测定建立校正集光谱所对应的各样品中待测成分含量,即参比值,建立参比值矩阵;
(4)、构建作物成分的近红外定量分析模型:将校正集光谱矩阵的信息与参比值矩阵的信息通过化学计量学方法进行回归关联分析,构建作物粗加工状态和/或粉末状态成分的近红外定量分析模型;
B:标准样品的选择和光谱处理:
(1)、标准集样品收集、光谱采集:选择若干份与A中相同品种的单籽粒作物自然状态下的样品,采集样品的光谱,记为标准集自然状态样品光谱,之后将自然状态下的样品处理为粗加工状态或粉末状态,再次采集光谱,采集的光谱相应的记为标准集粗加工状态样品光谱或标准集粉末状态样品光谱;
(2)、标准集的光谱预处理:将上述获得的标准集光谱进行预处理,获得预处理后的标准集自然状态样品光谱矩阵和预处理后的标准集粗加工状态样品光谱矩阵或标准集粉末状态样品光谱矩阵,其中,标准集自然状态样品光谱矩阵记为X2,标准集粗加工状态样品光谱矩阵或标准集粉末状态样品光谱矩阵记为X1
C:待测单籽粒作物成分的预测:
(1)、测试集的光谱采集:当对待测的单籽粒作物自然状态下的样品进行预测时,采集这些样品的近红外光谱,并将这些样品的近红外光谱集合作为测试集;
(2)、测试集光谱预处理:对测试集的光谱进行预处理,获得测试集光谱矩阵,记为Xtest
(3)、测试集光谱的光谱形态转移:采用光谱空间转换算法,以光谱矩阵X1、光谱矩阵X2为标准,将光谱矩阵Xtest转移为和其粗加工状态或粉末状态一致的光谱形态,转移后的矩阵记为Xtrans
(4)、预测:使用步骤A建立的成分分析模型,对转移后的测试集光谱矩阵Xtrans中的光谱进行预测,所预测的结果即为单籽粒作物成分的待测值。
进一步地,所述步骤C的(3)中采用的光谱空间转换算法公式如下:
Figure GDA0002493779530000051
其中,X2为预处理后的标准集自然状态样品光谱矩阵,X1为预处理后的标准集粗加工状态样品或粉末状态样品光谱矩阵,[X1,X2]为两者联立的增广矩阵,上标T表示矩阵的转置,下标s和n表示光谱信息和噪声对应的因子,Ts=Us*∑s,Ps=Vs,Ps T=[P1 T,P2 T],E=UnnVn T,P1、P2分别为X1、X2经过奇异值分解的载荷矩阵,E为残差矩阵,经过奇异值分解,当忽略残差时,最终可以将光谱矩阵[X1,X2]表示成得分Ts与矩阵[P1 T,P2 T]的乘积,在预测时,采用如下公式计算转移后的光谱矩阵:
Figure GDA0002493779530000052
其中,Xtest代表预处理后的测试集光谱矩阵,Xtrans为转移后的测试集光谱矩阵。上标+代表矩阵的广义逆。
进一步地,各所述光谱矩阵中每行代表一个样品光谱,不同的行代表不同样品的光谱。
进一步地,所述参比值矩阵的列数为1,行数为校正集样品个数,每行代表一个样品的化学参比值,不同的行代表不同样品的化学参比值。
进一步地,所述校正集和标准集中相同状态的样品均是通过相同的预处理方法得到的。
进一步地,所述标准集、校正集和待测集中相同状态的样品的光谱采集条件以及光谱预处理方法一致,所述标准集、校正集和待测集中不同状态的样品的光谱采集条件不完全一致。
进一步地,所述标准集和待测集中自然状态下样品的光谱采集条件与校正集中粗加工状态下样品的光谱采集条件一致,所述标准集和校正集中粉末状态下样品的光谱采集条件与校正集中粗加工状态下样品的光谱采集条件不一致。
进一步地,所述单籽粒作物为水稻、小麦、玉米或大豆等颗粒状作物。
进一步地,所述待测成分包括蛋白质含量、直链淀粉含量、水分含量等近红外光谱可检测的有机组分。
进一步地,各所述校正集、标准集以及测试集中的近红外光谱均为近红外漫透射光谱。
本发明所指的自然状态是指从作物植株上收获的、未经加工的状态,如带有颖壳的作物如完整的带壳的水稻、带壳花生等,或不带颖壳的作物如完整的小麦、大豆、玉米的颖果等;粗加工状态是指作物经过粗加工后的仍保留颗粒形态的状态,如水稻、花生等带颖壳作物去壳后的糙米、精米、花生仁等;粉末状态是指作物粗加工后粉碎的粉末,如小麦粉、玉米粉、糙米粉、精米粉等等。
本发明所建立的模型必须使用已测定成分参比值的单籽粒作物进行外部验证,确保模型给出的预测结果与所测参比值的相关性和误差达到实验要求后,可在之后的应用中采用该模型。
在建模时,对所建定量模型的评价指标主要有如下几种:决定系数(Coefficientof Determination,R2),交叉验证均方根误差(Root Mean Standard Error of CrossValidation,RMSECV);在外部验证时,对预测结果的评价指标有如下几种:预测相关系数(coefficient of correlation,R),预测均方根误差(Root Mean Standard Error ofPrediction,RMSEP)。
详细算法如下面公式所示:
(1)决定系数(R2)
Figure GDA0002493779530000071
式中,yi,actual为第i个校正集样品的参比值;yi,predicted为第i个校正集样品的近红外模型预测值;yi,actual为所有校正集样品参比值的平均值;n为校正集样品数,R2被用来评价由校正建立的模型拟合效果。在浓度范围相同的前提下,R2越接近1,表示预测值越接近参比值,即准确性越高;若R2等于1,则表示完全拟合;若R2为负值,则表示模型拟合效果极差。另外,R2的大小与待测量的分布范围关系极大,对于分布范围很广的待测量,有可能出现R2接近1,但其准确性较差的情况。
(2)交叉验证均方根误差(RMSECV)
Figure GDA0002493779530000072
式中,yi,actual为校正集中第i个样品的参比值;yi,predicted为校正集交叉验证过程中第i个样品的模型预测值;n为校正集的样品数;RMSECV越小,表明模型对校正集的样本预测效果越好。
(3)预测相关系数(R)
Figure GDA0002493779530000073
式中,yi,actual为第i个验证集样品的参比值;yi,predicted为第i个验证集样品的近红外模型预测值;yi,actual为所有验证集样品参比值的平均值;m为验证集样品数。预测相关系数R越接近1,表示预测值越接近参比值,即准确性越高。
(4)预测均方根误差(RMSECP)
Figure GDA0002493779530000081
式中,yi,actual为验证集中第i个样品的参比值;yi,predicted为验证集中第i个样品的模型预测值;m为验证集的样品数;RMSEP值越小,表明所建模型的预测能力越强、预测结果越准确。
根据本发明方法,可以设计、建立一套近红外无损检测自动分选装置,根据所检测组分的差异分选待测单籽粒作物。
本发明相比现有技术具有以下优点:
相比常规的单籽粒作物近红外光谱分析方法,该方法增加了将单籽粒作物光谱转移成和其粗加工状态或粉末状态的光谱形态的一致的光谱的步骤,并采用对应的粗加工状态或粉末状态样品的构建的近红外模型进行预测。其优点在于:
一方面,被分析的对象由单籽粒作物变成了单籽粒粗加工后的颗粒样品或作物粉末,后者对作物的品种来源、颖壳、颗粒形态以及不均匀的内在分布等干扰的包容性更好,构建的校正模型往往比前者更加准确、稳健;
另一方面,常规的参比方法往往不易精确测定单籽粒作物的参比值,因为这些方法是为群体样品而设计的,即使少数微量检测方法可以进行单籽粒成分的参比值测定,也往往有仪器昂贵、检测成本高的局限,然而本方法由于可以采用粉末,尤其是大量粉末建模,因此建模时就可以采用常规方法做参比,使得一些过去单籽粒检测实现不了的指标也可以检测,同时分析过程更加经济、节约成本,该发明方法有望有效推进单籽粒近红外分析技术的发展和应用。
附图说明
图1为采用传统单籽粒检测方法分析单籽粒作物成分的流程图;
图2为本发明实施例分析单籽粒作物成分的流程图;
图3为校正集的单籽粒糙米近红外漫透射原始光谱;
图4为校正集的米粉近红外漫透射原始光谱;
图5为近红外单籽粒糙米蛋白定量分析模型内部交叉验证的预测值与化学参比值的散点图;
图6为近红外米粉蛋白定量分析模型内部交叉验证的预测值与化学参比值的散点图;
图7为两份测试集单籽粒水稻样品光谱、单籽粒水稻转移成单籽粒糙米光谱形态后的光谱以及单籽粒糙米光谱的散点图;
图8为两份测试集样品的单籽粒水稻光谱、单籽粒水稻转移成米粉光谱形态后的光谱以及米粉光谱的散点图;
图9为单籽粒糙米蛋白含量近红外模型对测试集单籽粒水稻转移成单籽粒糙米形态光谱的预测值与化学参比值的散点图;
图10为米粉蛋白含量近红外模型对测试集单籽粒水稻转移成米粉形态光谱的预测值与化学参比值的散点图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例一种基于光谱形态转移的近红外单籽粒水稻种子蛋白质含量检测方法
本实施例以单籽粒水稻作为对象,采用近红外光谱法预测其蛋白质含量。以水稻作为对象进行介绍,是考虑到相比其他一些无颖壳作物如玉米、小麦等,水稻是具有颖壳的;同时相比一些较为规则的作物如大豆(大多为椭球形)等,单籽粒水稻间颗粒形态变异较大(如长短不一、大小不一、厚度不一),其分析难度要大于相当一部分作物品种的;另一方面,以蛋白质这一指标进行介绍,是考虑到蛋白质是水稻甚至各类作物较为常见且重要的一个指标,蛋白质含量的高低往往显著影响作物的产量、质量,综合上述两方面原因考虑,本实施例所述方法在单籽粒水稻蛋白质含量检测上的成功应用是较为典型的,是可以推广至其他相当一部分作物上的。
本实施例中,由于研究的作物为水稻,因此其对应的单籽粒自然状态样品为单籽粒水稻,单籽粒粗加工状态样品为单籽粒糙米,粉末状态样品为米粉。
本实施例中,分别采用了两种状态(粗加工状态、粉末状态)的水稻样品(单籽粒糙米、米粉)进行建模,并进行对应的光谱形态转移及预测,旨在证明所述方法对于这两种状态的样品均具备可行性。在实际应用中,可根据具体作物的品种及理化特性决定选择哪一种状态的样品进行分析。
本实施例的检测流程如图2所示,具体检测步骤如下:
A、单籽粒糙米和米粉的近红外蛋白模型的构建
(1)、校正集样品收集、光谱采集:校正集样品从本实验室构建的品种“9311”受重离子辐照后的突变体库中进行筛选,在该突变体库中,选取成熟、形态完整的自然状态下收获的、未经加工的单籽粒水稻种子73粒。对这73粒水稻进行手工脱壳、磨粉过100目筛处理,将单籽粒水稻种子加工为单籽粒糙米,然后进行光谱采集,获得单籽粒糙米校正集光谱,随后将着73份单籽粒糙米加工成米粉,进行光谱采集,获得单籽粒米粉校正集光谱。
其中,单籽粒糙米校正集光谱的采集方法为:检测窗口固定一直径30mm中间有直径2mm小孔的铝片,使用样品杯漫透射扫描参数,光谱扫描范围为5793-12489cm-1,分辨率16cm-1,对该检测窗口进行扫描,扫描次数64次,作为背景光谱,背景扫描后,将单籽粒糙米样品放在铝片上,正反两面各采集1条光谱后取平均值,作为单籽粒糙米的校正集光谱,所采集的原始光谱如图3所示。
米粉校正集光谱的采集方法为:采集时,放一直径6mm玻璃杯于检测窗口正中,使用样品杯漫透射扫描参数,光谱扫描范围为5793-12489cm-1,分辨率16cm-1,对该检测窗口进行扫描,扫描次数64次,作为背景光谱。背景扫描后,将米粉样品装入玻璃杯,将玻璃杯放于窗口正中,采集1条光谱,作为米粉校正集光谱,所采集的原始光谱如图4所示。
光谱采集使用的仪器为德国Bruker公司MPA型傅立叶变换近红外光谱仪采集校正集漫透射光谱,配有积分球、PbS检测器和OPUS 7.0数据处理与分析软件。
(2)、校正集光谱预处理:对于单籽粒糙米校正集光谱和米粉校正集光谱使用OPUS软件优化筛选最优预处理方法和光谱范围的组合,经过比较,本实施例选择采用对光谱先进行标准正态变量变换,再截取光谱范围9403.7-7498.3cm-1,获得预处理后的光谱矩阵。
(3)、校正集样品待测成分参比值的获取:采用杜马斯燃烧法检测蛋白质。在0.001mg天平下称重4.0±0.2mg的上述的米粉样品,装入锡箔中包裹成球状,以6组5mg左右的分析纯苯磺酸作为标准样品,采用德国Elementar大进样元素分析仪进行检测,根据仪器输出的氮含量计算蛋白质含量,蛋白质含量(%)=N%*5.95。
(4)、建立单籽粒糙米和米粉的近红外蛋白含量定量分析模型
单籽粒糙米近红外蛋白含量定量分析模型的构建:
将单籽粒糙米校正集光谱矩阵的信息与参比值矩阵的信息通过化学计量学方法进行关联,采用偏最小二乘法构建回归模型,主成分设为9,所构建的单籽粒糙米模型内部交叉验证的预测值与化学参比值的散点图如图5所示,其交叉验证R2为0.8630,RMSECV为0.4303,交叉验证表明该模型具有较好的建模表现;
米粉近红外蛋白含量定量分析模型的构建:
将米粉校正集光谱矩阵的信息与参比值矩阵的信息通过化学计量学方法进行关联,采用偏最小二乘法构建回归模型,主成分设为9,所构建的米粉模型内部交叉验证的预测值与化学参比值的散点图如图6所示,其交叉验证R2为0.9054,RMSECV为0.3575,交叉验证表明该模型具有较好的建模表现。
B:标准样品的选择和光谱处理:
(1)、标准集的样品收集、光谱采集:从步骤A(1)中所述的突变体库中选择9份单籽粒水稻样品,采集光谱,其采集方式同步骤A(1)单籽粒糙米校正集光谱的采集方式一致;随后将9份单籽粒水稻样品进行粗加工,获得单籽粒糙米样品,随后采集光谱,其采集方式同步骤A(1)单籽粒糙米校正集光谱的采集方式一致,采集结束后将9份单籽粒糙米磨粉处理,获得米粉样品,采集米粉光谱,其采集方式分别同步骤A(1)中米粉校正集光谱的采集方式一致,所采集的光谱分别记为单籽粒水稻标准集光谱、单籽粒糙米标准集光谱以及米粉标准集光谱;
(2)、标准集的光谱预处理:将上述获得的单籽粒水稻标准集光谱、单籽粒糙米标准集光谱以及米粉标准集光谱进行预处理,预处理方法与A(2)中相同,获得预处理后的单籽粒水稻标准集光谱矩阵、单籽粒糙米标准集光谱矩阵、以及米粉标准集光谱矩阵,其矩阵分别记为X2,X1单籽粒糙米和X1米粉
C:待测单籽粒作物成分的预测:
(1)、测试集的光谱采集:从步骤A(1)中所述的突变体库中再次选择50份单籽粒水稻样品,采集样品的近红外光谱,其采集方式同步骤A(1)单籽粒糙米校正集光谱的采集方式一致,获得的光谱记为测试集光谱;
(2)、测试集光谱预处理:对测试集光谱进行预处理,获得单籽粒水稻的测试集光谱矩阵,记为Xtest
(3)、测试集光谱的光谱形态转移:
光谱形态转移在matlab 2015b软件(The Mathworks,Natick,MA,USA)上实现。
测试集的单籽粒水稻光谱转移成单籽粒糙米形态光谱:采用“SST”算法,以光谱矩阵X1单籽粒糙米、光谱矩阵X2为标准,将光谱矩阵Xtest转移为和单籽粒糙米一致的光谱形态,,转移因子(奇异值分解的因子数)设为1,转移后的矩阵记为Xtrans单籽粒水稻-单籽粒糙米
测试集的单籽粒水稻光谱转移成米粉形态光谱:采用光谱空间转换(SST)算法,以光谱矩阵X1米粉、光谱矩阵X2为标准,将光谱矩阵Xtest转移为和米粉一致的光谱形态,转移因子(奇异值分解的因子数)设为9,转移后的矩阵记为Xtrans单籽粒水稻-米粉
SST算法公式如下:
Figure GDA0002493779530000131
其中,X2为预处理后的主形态水稻标准光谱矩阵,X1为预处理后的从形态水稻标准光谱矩阵。本实施例中,X2特指预处理后的单籽粒水稻光谱矩阵,X1特指单籽粒糙米或米粉光谱矩阵,即X1单籽粒糙米或X1米粉(当将单籽粒水稻光谱转移成单籽粒糙米光谱形态时为前者,转移成米粉光谱形态时为后者)。[X1,X2]为两者联立的增广矩阵。上标T表示转置,下标s和n表示光谱信息和噪声对应的因子。Ts=Us*∑s,Ps=Vs,PsT=[P1 T,P2 T],E=UnnVn T。P1、P2分别为X1、X2经过奇异值分解的载荷,E为残差矩阵。经过奇异值分解,当忽略残差时,最终可以将光谱矩阵[X1,X2]表示成得分Ts与矩阵[P1 T,P2 T]的乘积。在预测时,采用如下公式计算转移后的光谱矩阵:
Figure GDA0002493779530000141
其中,Xtest代表预处理后的待测水稻光谱矩阵,Xtrans为转移后的待测水稻样品光谱。上标+代表矩阵的广义逆。本实施例中,Xtest特指预处理后的测试集单籽粒水稻光谱矩阵,Xtrans特指预处理后的测试集单籽粒水稻光谱转移成单籽粒糙米形态或米粉形态的光谱矩阵,即Xtrans单籽粒水稻-单籽粒糙米或Xtrans单籽粒水稻-米粉(当将单籽粒水稻光谱转移成单籽粒糙米光谱形态时为前者,转移成米粉光谱形态时为后者)。
SST算法需要优化的参数仅有一项,为转移因子数(奇异值分解保留的因子数),转移因子数一般不大于标准样品个数,最优转移因子个数可根据对转移后的光谱与真实光谱进行比较(如比较不同转移因子下,单籽粒水稻转移成单籽粒糙米后的光谱,与真实的单籽粒糙米光谱之间的差异)而筛选。
图7为两份测试集样品(第24号、第47号,参比值分别为11.2931%和7.3899%)的单籽粒水稻光谱、单籽粒水稻光谱形态转移成单籽粒糙米形态后的光谱以及单籽粒糙米光谱,由图可见,经过光谱形态转移,单籽粒水稻转移后的光谱和其糙米形态光谱十分接近,说明转移效果良好。
图8为两份测试集样品(第24号、第47号,参比值分别为11.2931%和7.3899%)的单籽粒水稻光谱、单籽粒水稻光谱形态转移成米粉形态后的光谱以及米粉光谱,由图可见,经过光谱形态转移,单籽粒水稻转移后的光谱和其米粉形态光谱十分接近,说明转移效果良好。
(4)、预测:
结果预测通过The unscrambler软件(CAMO公司,挪威)实现。
使用单籽粒糙米的近红外蛋白含量定量分析模型,对转移后的测试集光谱矩阵Xtrans单籽粒水稻-单籽粒糙米进行预测。
单籽粒糙米近红外模型预测待测单籽粒水稻的蛋白含量的结果:
测试集单籽粒水稻光谱转移成糙米形态光谱后,使用单籽粒糙米近红外校正模型对转移后的光谱矩阵Xtrans单籽粒水稻-单籽粒糙米中的光谱进行预测,预测值即为待测的单籽粒水稻的蛋白质含量。图9为单籽粒糙米蛋白含量近红外模型对测试集单籽粒水稻转移成单籽粒糙米形态光谱的预测值与化学参比值的散点图,预测值与化学值的相关系数R为0.9360,预测均方根误差RMSEP为0.4583,说明光谱结果和化学方法检测的结果十分接近,对蛋白质含量有较准确的预测效果。
米粉近红外模型预测待测单籽粒水稻的蛋白含量的结果:
测试集单籽粒水稻光谱转移成米粉形态光谱后,使用米粉近红外校正模型对转移后的光谱矩阵Xtrans单籽粒水稻-米粉中的光谱进行预测,预测值即为待测的单籽粒水稻的蛋白质含量。图10为米粉蛋白含量近红外模型对测试集单籽粒水稻转移成米粉形态光谱的预测值与化学参比值的散点图,预测值与化学值的相关系数R为0.9078,预测均方根误差RMSEP为0.5731,说明光谱结果和化学方法检测的结果十分接近,对蛋白质含量有较准确的预测效果。
结果表明,使用该方法可实现对未知待测单籽粒水稻种子蛋白质含量的快速无损检测。分析时,既可以采用单籽粒糙米进行建模,也可以采用米粉进行建模。其预测结果和参比值无显著差异,具有很高的相关系数(R>0.9)以及较低的预测均方根误差,可以较好地实现单籽粒水稻蛋白质含量的检测。由此可见,根据本实施例方法提供的单籽粒作物成分近红外检测方法,可以实现单籽粒水稻蛋白质含量的快速无损检测。
需要特别指出的是,本发明的检测方法不限于上述实施例所述的应用场景,进一步地,可以扩展至其他单籽粒作物的其他成分的快速无损检测,进一步地,还可以设计、建立一套不同成分的单籽粒作物的近红外自动分选装置,装置中的软件可整合该方法设计近红外模型、并对待测单籽粒作物光谱采集、光谱形态转换和预测,以满足育种和粮食行业中对单籽粒作物的快速无损检测和分选需要。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于光谱形态转移的近红外单籽粒作物成分检测方法,其特征在于,包括以下步骤:
A:作物粗加工状态和/或粉末状态下近红外成分分析模型的构建:
(1)、校正集样品收集、光谱采集:收集若干份待测成分含量有差异的单籽粒作物粗加工状态下的样品,采集样品的近红外光谱;收集单籽粒作物粉末状态下样品或多个单籽粒作物粉末状态下的样品,采集相应样品的近红外光谱,以单籽粒作物粗加工状态样品的光谱、单籽粒作物粉末状态样品的光谱以及多个单籽粒作物混合加工后的粉末状态样品的光谱中的一种样品状态的光谱或一种样品状态以上的光谱集合作为校正集;
(2)、校正集光谱预处理:对校正集光谱进行预处理,增大信噪比,消除干扰,获得预处理后的校正集光谱矩阵,所述校正集光谱矩阵中的每行代表一个样品光谱,不同的行代表不同样品的光谱;
(3)、校正集样品待测成分参比值的获取:使用参比方法测定建立校正集光谱所对应的各样品中待测成分含量,即参比值,建立参比值矩阵;
(4)、构建作物成分的近红外定量分析模型:将校正集光谱矩阵的信息与参比值矩阵的信息通过化学计量学方法进行回归关联分析,构建作物粗加工状态和/或粉末状态成分的近红外定量分析模型;
B:标准样品的选择和光谱处理:
(1)、标准集样品收集、光谱采集:选择若干份与A中相同品种的单籽粒作物自然状态下的样品,采集样品的光谱,记为标准集自然状态样品光谱,之后将自然状态下的样品处理为粗加工状态或粉末状态,再次采集光谱,采集的光谱相应的记为标准集粗加工状态样品光谱或标准集粉末状态样品光谱;
(2)、标准集的光谱预处理:将上述获得的标准集光谱进行预处理,获得预处理后的标准集自然状态样品光谱矩阵和预处理后的标准集粗加工状态样品光谱矩阵或标准集粉末状态样品光谱矩阵,其中,标准集自然状态样品光谱矩阵记为X2,标准集粗加工状态样品光谱矩阵或标准集粉末状态样品光谱矩阵记为X1
C:待测单籽粒作物成分的预测:
(1)、测试集的光谱采集:当对待测的单籽粒作物自然状态下的样品进行预测时,采集这些样品的近红外光谱,并将这些样品的近红外光谱集合作为测试集;
(2)、测试集光谱预处理:对测试集的光谱进行预处理,获得测试集光谱矩阵,记为Xtest
(3)、测试集光谱的光谱形态转移:采用光谱空间转换算法,以光谱矩阵X1、光谱矩阵X2为标准,将光谱矩阵Xtest转移为和其粗加工状态或粉末状态一致的光谱形态,转移后的矩阵记为Xtrans
(4)、预测:使用步骤A建立的成分分析模型,对转移后的测试集光谱矩阵Xtrans中的光谱进行预测,所预测的结果即为单籽粒作物成分的待测值。
2.根据权利要求1所述的一种基于光谱形态转移的近红外单籽粒作物成分检测方法,其特征在于,所述步骤C的(3)中采用的光谱空间转换算法公式如下:
Figure FDA0002510675570000021
其中,X2为预处理后的标准集自然状态样品光谱矩阵,X1为预处理后的标准集粗加工状态样品或粉末状态样品光谱矩阵,[X1,X2]为两者联立的增广矩阵,上标T表示矩阵的转置,下标s和n表示光谱信息和噪声对应的因子,Ts=Us*∑s,Ps=Vs,Ps T=[P1 T,P2 T],E=UnnVn T,P1、P2分别为X1、X2经过奇异值分解的载荷矩阵,E为残差矩阵,经过奇异值分解,当忽略残差时,最终可以将光谱矩阵[X1,X2]表示成得分Ts与矩阵[P1 T,P2 T]的乘积,在预测时,采用如下公式计算转移后的光谱矩阵:
Figure FDA0002510675570000031
其中,Xtest代表预处理后的测试集光谱矩阵,Xtrans为转移后的测试集光谱矩阵,上标+代表矩阵的广义逆。
3.根据权利要求1或2所述的一种基于光谱形态转移的近红外单籽粒作物成分检测方法,其特征在于,各所述光谱矩阵中每行代表一个样品光谱,不同的行代表不同样品的光谱。
4.根据权利要求1所述的一种基于光谱形态转移的近红外单籽粒作物成分检测方法,其特征在于,所述参比值矩阵的列数为1,行数为校正集样品个数,每行代表一个样品的化学参比值,不同的行代表不同样品的化学参比值。
5.根据权利要求1所述的一种基于光谱形态转移的近红外单籽粒作物成分检测方法,其特征在于,所述校正集和标准集中相同状态的样品均是通过相同的预处理方法得到的。
6.根据权利要求1所述的一种基于光谱形态转移的近红外单籽粒作物成分检测方法,其特征在于,所述标准集、校正集和待测集中相同状态的样品的光谱采集条件以及光谱预处理方法一致,所述标准集、校正集和待测集中不同状态的样品的光谱采集条件不完全一致。
7.根据权利要求6所述的一种基于光谱形态转移的近红外单籽粒作物成分检测方法,其特征在于,所述标准集和待测集中自然状态下样品的光谱采集条件与校正集中粗加工状态下样品的光谱采集条件一致,所述标准集和校正集中粉末状态下样品的光谱采集条件与校正集中粗加工状态下样品的光谱采集条件不一致。
8.根据权利要求1所述的一种基于光谱形态转移的近红外单籽粒作物成分检测方法,其特征在于,所述单籽粒作物为水稻、小麦、玉米或大豆。
9.根据权利要求1所述的一种基于光谱形态转移的近红外单籽粒作物成分检测方法,其特征在于,所述待测成分包括蛋白质含量、直链淀粉含量、水分含量中的一种或两种以上。
10.根据权利要求1所述的一种基于光谱形态转移的近红外单籽粒作物成分检测方法,其特征在于,各所述校正集、标准集以及测试集中的近红外光谱均为近红外漫透射光谱。
CN201810436495.0A 2018-05-09 2018-05-09 一种基于光谱形态转移的近红外单籽粒作物成分检测方法 Active CN108613943B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810436495.0A CN108613943B (zh) 2018-05-09 2018-05-09 一种基于光谱形态转移的近红外单籽粒作物成分检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810436495.0A CN108613943B (zh) 2018-05-09 2018-05-09 一种基于光谱形态转移的近红外单籽粒作物成分检测方法

Publications (2)

Publication Number Publication Date
CN108613943A CN108613943A (zh) 2018-10-02
CN108613943B true CN108613943B (zh) 2020-07-14

Family

ID=63662400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810436495.0A Active CN108613943B (zh) 2018-05-09 2018-05-09 一种基于光谱形态转移的近红外单籽粒作物成分检测方法

Country Status (1)

Country Link
CN (1) CN108613943B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109323911A (zh) * 2018-12-14 2019-02-12 扬州大学 一种快速筛选淀粉组分改变的水稻粉质籽粒突变体的淀粉碘吸收光谱方法
CN111896497B (zh) * 2020-09-15 2022-04-08 四川长虹电器股份有限公司 一种基于预测值的光谱数据修正方法
CN113484270A (zh) * 2021-06-04 2021-10-08 中国科学院合肥物质科学研究院 一种单粒水稻脂肪含量定量分析模型的构建及检测方法
CN117093841B (zh) * 2023-10-18 2024-02-09 中国科学院合肥物质科学研究院 小麦透射光谱的异常光谱筛选模型确定方法、装置及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7829339B2 (en) * 2002-02-11 2010-11-09 Foss Analytical A/S Method for casein determination in milk
CN107515203A (zh) * 2017-07-19 2017-12-26 中国农业大学 近红外技术定量分析水稻单籽粒直链淀粉含量的研究

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7829339B2 (en) * 2002-02-11 2010-11-09 Foss Analytical A/S Method for casein determination in milk
CN107515203A (zh) * 2017-07-19 2017-12-26 中国农业大学 近红外技术定量分析水稻单籽粒直链淀粉含量的研究

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Establishment and application of NIR models for online cut tobacco quality monitoring in primary processing;Jinzhi, W et al;《Tobacco Science and Technology》;20171127;第69-73页 *
Maintaining the predictive abilities of multivariate calibration models by spectral space transformation;Wen Du, et al;《Analytica Chimica Acta》;20111212;第64-70页 *

Also Published As

Publication number Publication date
CN108613943A (zh) 2018-10-02

Similar Documents

Publication Publication Date Title
CN113192117B (zh) 一种基于Sentinel-2卫星影像红边波段改进小麦生长早期叶面积指数估算的方法
CN108613943B (zh) 一种基于光谱形态转移的近红外单籽粒作物成分检测方法
Ambrose et al. Comparative nondestructive measurement of corn seed viability using Fourier transform near-infrared (FT-NIR) and Raman spectroscopy
Wang et al. Application of long-wave near infrared hyperspectral imaging for determination of moisture content of single maize seed
CN108680515B (zh) 一种单粒水稻直链淀粉定量分析模型构建及其检测方法
CN109470648B (zh) 一种单籽粒作物不完善粒快速无损判定方法
CN107515203A (zh) 近红外技术定量分析水稻单籽粒直链淀粉含量的研究
Xu et al. A calibration transfer optimized single kernel near-infrared spectroscopic method
Wang et al. Rapid detection of protein content in rice based on Raman and near-infrared spectroscopy fusion strategy combined with characteristic wavelength selection
Chen et al. Prediction of milled rice grades using Fourier transform near-infrared spectroscopy and artificial neural networks
Cui et al. Screening of maize haploid kernels based on near infrared spectroscopy quantitative analysis
WO2020248961A1 (zh) 一种无参考值的光谱波数选择方法
CN102313712A (zh) 一种纤维类物料不同分光方式近红外光谱差异的校正方法
KR100433263B1 (ko) 근적외선 흡수스펙트럼을 이용한 곡물 1립 비파괴 분석방법
CN108169168A (zh) 检测分析水稻籽粒蛋白质含量数学模型及构建方法和应用
John et al. Germplasm variability-assisted near infrared reflectance spectroscopy chemometrics to develop multi-trait robust prediction models in rice
CN115201148A (zh) 一种基于近红外光谱快速检测稻谷脂肪酸含量的方法
CN114527082A (zh) 甜玉米种子萌发预测方法及装置
CN110231302A (zh) 一种快速测定奇亚籽粗脂肪含量的方法
CN109540837A (zh) 近红外快速检测苎麻叶片木质纤维素含量的方法
CN116642841B (zh) 基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法
CN113655027A (zh) 一种近红外快速检测植物中单宁含量的方法
Hong et al. Nondestructive prediction of rice seed viability using spectral and spatial information modeling of visible–near infrared hyperspectral images
CN117269106A (zh) 快速预测辣椒蛋白质含量的高光谱模型
CN110231306A (zh) 一种无损、快速测定奇亚籽蛋白质含量的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant