CN106778074A - 转基因玉米检测方法及装置 - Google Patents

转基因玉米检测方法及装置 Download PDF

Info

Publication number
CN106778074A
CN106778074A CN201710062751.XA CN201710062751A CN106778074A CN 106778074 A CN106778074 A CN 106778074A CN 201710062751 A CN201710062751 A CN 201710062751A CN 106778074 A CN106778074 A CN 106778074A
Authority
CN
China
Prior art keywords
data
sample
denoising
detected
discrimination model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710062751.XA
Other languages
English (en)
Inventor
彭城
徐俊锋
徐晓丽
陈笑芸
汪小福
魏巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Academy of Agricultural Sciences
Original Assignee
Zhejiang Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Academy of Agricultural Sciences filed Critical Zhejiang Academy of Agricultural Sciences
Priority to CN201710062751.XA priority Critical patent/CN106778074A/zh
Publication of CN106778074A publication Critical patent/CN106778074A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • G01N2021/8466Investigation of vegetal material, e.g. leaves, plants, fruits

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明提供了一种转基因玉米检测方法及装置,涉及转基因植物检测的技术领域,该方法包括:采集待检测样本的第一红外光谱数据,所述待检测样本包括玉米植株的任一部分;对所述第一红外光谱数据进行去噪处理;根据去噪处理后的所述第一红外光谱数据和预先建立的判别模型,确定所述待检测样本是否为转基因玉米。本发明提供的转基因玉米检测方法及装置,可以解决现有的转基因玉米检测方法会损坏待检测玉米的原有表观性状,使得待检测玉米难以进一步用于育种研究的技术问题。

Description

转基因玉米检测方法及装置
技术领域
本发明涉及转基因植物检测技术领域,尤其是涉及一种转基因玉米检测方法及装置。
背景技术
转基因技术利用DNA(deoxyribonucleic acid,脱氧核糖核酸)重组技术,将外源基因转移到受体生物中,从而可以获得具有稳定的表现特定的遗传性状的个体。定向改造玉米植物遗传性状、避免不良性状的连锁表达、育种周期短等优点使转基因技术在玉米育种中得到迅猛发展。
在转基因玉米的玉米育种研究中,传统的转基因玉米检测方法主要是PCR(Polymerase Chain Reaction,聚合酶链式反应)法。转基因玉米的基因含有外源CaMV35S启动子和/或NOS终止子等公共基因元件,PCR法通过检测该公共基因元件是否存在,来确定待检测玉米是否为转基因玉米,其中待检测玉米为玉米植株的任一部分。PCR法的具体检测过程如下:提取待检测玉米的DNA,将提取的DNA加入引物、酶等构成反应液进行PCR扩增反应,通过反应结果可以确定该DNA中是否含有该公共基因元件,从而确定该待检测玉米是否为转基因玉米。
传统的转基因玉米检测方法,主要是基于公共基因元件检测的PCR法。由于PCR法在检测过程中需要提取待检测玉米的DNA,而提取DNA时会破坏待检测玉米的蛋白质或基因片段,因此现有的转基因玉米检测方法会损坏待检测玉米的原有表观性状,使得待检测玉米难以进一步用于育种研究。
发明内容
有鉴于此,本发明的目的在于提供一种转基因玉米检测方法及装置,以解决现有的转基因玉米检测方法会损坏待检测玉米的原有表观性状,使得待检测玉米难以进一步用于育种研究的技术问题。
第一方面,本发明实施例提供了一种转基因玉米检测方法,包括:采集待检测样本的第一红外光谱数据,所述待检测样本包括玉米植株的任一部分;对所述第一红外光谱数据进行去噪处理;根据去噪处理后的所述第一红外光谱数据和预先建立的判别模型,确定所述待检测样本是否为转基因玉米。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,通过以下公式对所述第一红外光谱数据进行去噪处理:
其中,k表示所述第一红外光谱数据中各个波长的序号,i的取值为-w至+w之间的整数,w为正整数,xk,smooth表示序号为k的波长对应的去噪处理后的强度值,xk+i表示序号为k+i的波长对应的去噪处理前的强度值,H表示归一化因子,hi表示平滑系数。
结合第一方面或者第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,根据去噪处理后的所述第一红外光谱数据和预先建立的判别模型,确定所述待检测样本是否为转基因玉米,包括:通过所述判别模型检测去噪处理后的所述第一红外光谱数据,得到所述待检测样本是否为所述转基因玉米的检测结果;或者,提取去噪处理后的所述第一红外光谱数据的多个第一特征波长,通过所述判别模型检测提取出的多个所述第一特征波长,得到所述待检测样本是否为所述转基因玉米的检测结果。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述判别模型通过以下方法建立:选取训练样本,所述训练样本包括多个转基因玉米样本和多个非转基因玉米样本;采集所述训练样本的第二红外光谱数据,对所述第二红外光谱数据进行去噪处理;根据去噪处理后的所述第二红外光谱数据建立所述判别模型,或者,提取去噪处理后的所述第二红外光谱数据的多个第二特征波长,根据提取出的多个所述第二特征波长建立所述判别模型。
结合第一方面的第三种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,在建立所述判别模型之前,所述方法还包括:对所述第二红外光谱数据进行主成分分析,根据主成分分析的结果确定所述多个转基因玉米样本的红外光谱数据的主成分与所述多个非转基因玉米样本的红外光谱数据的主成分之间的相对分布情况;根据所述相对分布情况,确定是否建立所述判别模型。
第二方面,本发明实施例还提供一种转基因玉米检测装置,包括:采集模块,用于采集待检测样本的第一红外光谱数据,所述待检测样本包括玉米植株的任一部分;处理模块,用于对所述第一红外光谱数据进行去噪处理;确定模块,用于根据去噪处理后的所述第一红外光谱数据和预先建立的判别模型,确定所述待检测样本是否为转基因玉米。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,所述处理模块具体用于:通过以下公式对所述第一红外光谱数据进行去噪处理:
其中,k表示所述第一红外光谱数据中各个波长的序号,i的取值为-w至+w之间的整数,w为正整数,xk,smooth表示序号为k的波长对应的去噪处理后的强度值,xk+i表示序号为k+i的波长对应的去噪处理前的强度值,H表示归一化因子,hi表示平滑系数。
结合第二方面或者第二方面的第一种可能的实施方式,本发明实施例提供了第二方面的第二种可能的实施方式,其中,所述确定模块包括:第一确定单元,用于通过所述判别模型检测去噪处理后的所述第一红外光谱数据,得到所述待检测样本是否为所述转基因玉米的检测结果;或者,第二确定单元,用于提取去噪处理后的所述第一红外光谱数据的多个第一特征波长,通过所述判别模型检测提取出的多个所述第一特征波长,得到所述待检测样本是否为所述转基因玉米的检测结果。
结合第二方面的第二种可能的实施方式,本发明实施例提供了第二方面的第三种可能的实施方式,其中,所述装置还包括模型建立模块,所述模型建立模块包括:样本选取单元,用于选取训练样本,所述训练样本包括多个转基因玉米样本和多个非转基因玉米样本;数据采集处理单元,用于采集所述训练样本的第二红外光谱数据,对所述第二红外光谱数据进行去噪处理;模型建立单元,用于根据去噪处理后的所述第二红外光谱数据建立所述判别模型,或者,提取去噪处理后的所述第二红外光谱数据的多个第二特征波长,根据提取出的多个所述第二特征波长建立所述判别模型。
结合第二方面的第三种可能的实施方式,本发明实施例提供了第二方面的第四种可能的实施方式,其中,所述模型建立模块还包括分析单元,所述分析单元包括:分布确定子单元,用于对所述第二红外光谱数据进行主成分分析,根据主成分分析的结果确定所述多个转基因玉米样本的红外光谱数据的主成分与所述多个非转基因玉米样本的红外光谱数据的主成分之间的相对分布情况;建立确定子单元,用于根据所述相对分布情况,确定是否建立所述判别模型。
本发明实施例带来了以下有益效果:
本发明实施例中,采集待检测样本的第一红外光谱数据,该待检测样本包括玉米植株的任一部分,对第一红外光谱数据进行去噪处理,根据去噪处理后的第一红外光谱数据和预先建立的判别模型,确定该待检测样本是否为转基因玉米。本发明实施例是通过红外光谱对待检测样本进行检测,由于采集待检测样本的红外光谱时不会破化待检测样本的蛋白质及基因,因此应用本发明实施例提供的转基因玉米检测方法及装置对待检测样本进行检测,不会损坏待检测样本的原有表观性状,检测后的待检测样本可以进一步用于育种研究。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明第一实施例提供的转基因玉米检测方法的基本流程示意图;
图2为本发明第一实施例提供的转基因玉米检测方法中建立判别模型的流程示意图;
图3为本发明第二实施例提供的转基因玉米检测装置的基本模块组成示意图;
图4为本发明第二实施例提供的转基因玉米检测装置中模型建立模块的单元组成示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前传统的转基因玉米检测方法,主要是基于公共基因元件检测的PCR法。PCR法在检测过程中需要提取待检测玉米的DNA,因而会破坏待检测玉米的蛋白质或基因片段,损坏待检测玉米的原有表观性状,使得待检测玉米难以进一步用于育种研究。本发明实施例提供的一种转基因玉米检测方法及装置,可以解决现有的转基因玉米检测方法会损坏待检测玉米的原有表观性状,使得待检测玉米难以进一步用于育种研究的技术问题。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种转基因玉米检测方法进行详细介绍。
实施例一:
导入转基因玉米的外源基因表达出的蛋白质与非转基因玉米的基因表达出的蛋白质不同,由于组成蛋白质分子的各种基团都有自己特定的红外吸收峰,例如蛋白质分子中含有大量的含氢基团,红外光谱能够反映该含氢基团的能量吸收信息,因此红外光谱可以捕捉到与外源基因相关的蛋白质分子的吸收光谱信息,也即能够通过红外光谱判别转基因玉米与非转基因玉米。本发明实施例是针对转基因玉米双抗SK12-5(外源基因为:cry1Ab/cry2Aj-G10evo)的检测判别,本发明实施例提供的方法也适用于其他的转基因玉米品种。
图1为本发明第一实施例提供的转基因玉米检测方法的基本流程示意图,如图1所示,该方法包括以下步骤:
步骤S110,采集待检测样本的第一红外光谱数据,该待检测样本包括玉米植株的任一部分。
具体地,采用红外光谱仪对待检测样本进行扫描,采集待检测样本的第一红外光谱数据。由于采集红外光谱数据时无需复杂的样本预处理,因此本发明实施例提供的方法具有快速、无损和精度高等优点。优选地,待检测样本为玉米种子或玉米叶片。本发明实施例采用便携式近红外光谱仪NIRez对待检测玉米叶片进行扫描,获得波长范围在900nm至1700nm之间的待检测样本的近红外吸收光谱,该光谱的带宽为10nm,共有100个波段。
步骤S120,对第一红外光谱数据进行去噪处理。
具体地,步骤S110采集的第一红外光谱数据的前端和后端均容易受到噪声的影响,为了获得较好的检测效果,将第一红外光谱数据的前端和后端中有明显噪声的部分去掉,保留波长范围在940nm至1670nm之间的第一红外光谱数据。
进一步地,对第一红外光谱数据进行平滑去噪处理,可以采用算数滑动平均法、重心法、指数平滑法、离散函数褶积滑动变换法、傅里叶变换法和小波变换法等。优选地,采用SG(Savitzky-Golay)滤波器对第一红外光谱数据进行去噪处理。基于SG滤波器的平滑滤波法是一种有效去除光谱数据中的噪声、提高信噪比的方法。具体通过以下公式(1)和(2)对第一红外光谱数据进行去噪处理:
其中,k表示第一红外光谱数据中各个波长的序号,i的取值为-w至+w之间的整数,w为正整数,xk,smooth表示序号为k的波长对应的去噪处理后的强度值,xk+i表示序号为k+i的波长对应的去噪处理前的强度值,H表示归一化因子,hi表示平滑系数。
公式(1)中,多项式的次数和平滑点数对平滑效果具有决定性的影响,其中平滑点数为i取值的数量。本发明实施例中SG平滑滤波法采用2次多项式7点平滑,即w取值为3,i取值的数量为7。
步骤S130,根据去噪处理后的第一红外光谱数据和预先建立的判别模型,确定待检测样本是否为转基因玉米。
本发明实施例提供两种检测方式,分别是:通过预先建立的判别模型检测去噪处理后的第一红外光谱数据,得到待检测样本是否为转基因玉米的检测结果;或者,提取去噪处理后的第一红外光谱数据的多个第一特征波长,通过预先建立的判别模型检测提取出的多个第一特征波长,得到待检测样本是否为转基因玉米的检测结果。
具体地,前一种检测方式包括:将步骤S120去噪处理后的第一红外光谱数据作为输入数据,输入预先建立的判别模型中进行检测,该判别模型输出待检测样本是否为转基因玉米的检测结果。
后一种检测方式包括:采用加权回归系数法(Weighted regressioncoefficient,Bw)提取去噪处理后的第一红外光谱数据的多个第一特征波长,将提取出的多个第一特征波长作为输入数据,输入预先建立的判别模型中进行检测,该判别模型输出待检测样本是否为转基因玉米的检测结果。
其中,采用加权回归系数法提取去噪处理后的第一红外光谱数据的多个第一特征波长,具体包括:对该第一红外光谱数据进行PLS(partial least-squares regression,偏最小二乘回归)建模,获得各个波长对应的Bw值,该Bw值代表与其对应的各个波长对判别模型预测效果影响力的大小,若Bw值越大,则影响力越大。根据预设Bw阈值选取第一特征波长,具体为:比较该第一红外光谱中各个峰谷处对应的Bw值与预设Bw阈值,选取Bw值大于等于预设Bw阈值的波长为第一特征波长。例如预设Bw阈值为0.6,若波长为953.79nm对应的Bw值为0.6,波长为1041.79nm对应的Bw值为0.3,波长为1413.97nm对应的Bw值为0.7,则选取953.79nm和1413.97nm作为第一特征波长。
上述两种检测方式中的判别模型均包括:ELM(extreme learning machine,极限学习机)判别模型或SVM(support vector machine,支持向量机)判别模型。
本发明实施例中,采集待检测样本的第一红外光谱数据,该待检测样本包括玉米植株的任一部分,对第一红外光谱数据进行去噪处理,根据去噪处理后的第一红外光谱数据和预先建立的判别模型,确定该待检测样本是否为转基因玉米。本发明实施例是通过红外光谱对待检测样本进行检测,由于采集待检测样本的红外光谱时不会破化待检测样本的蛋白质及基因,因此应用本发明实施例提供的转基因玉米检测方法对待检测样本进行检测,不会损坏待检测样本的原有表观性状,检测后的待检测样本可以进一步用于育种研究。
图2为本发明第一实施例提供的转基因玉米检测方法中建立判别模型的流程示意图,如图2所示,上述判别模型通过以下三个步骤建立:
步骤S210,选取训练样本,该训练样本包括多个转基因玉米样本和多个非转基因玉米样本。
具体地,选取的训练样本可以为玉米植株的任一部分,优选地,该训练样本为玉米种子或者玉米叶片。该训练样本包括多个转基因玉米样本和多个非转基因玉米样本,优选地,转基因玉米样本的个数与非转基因玉米样本的个数相同。本发明实施例选取了180个转基因玉米叶片和180个非转基因玉米叶片。
将上述训练样本划分为建模样本和测试样本两部分,其中,建模样本用于建立判别模型,测试样本用于检测建立的判别模型的判别正确率。具体地,可以采用Kennard-Stone算法,按照2:1的比例分别将转基因玉米样本和非转基因玉米样本划分为建模样本和测试样本。例如,将180个转基因玉米样本和180个非转基因玉米样本划分为:120个转基因玉米样本和120个非转基因玉米样本作为建模样本,60个转基因玉米样本和60个非转基因玉米样本作为测试样本。
步骤S220,采集上述训练样本的第二红外光谱数据,对该第二红外光谱数据进行去噪处理。
在步骤S220中,采集上述训练样本的第二红外光谱数据的具体过程与步骤S110相同,对该第二红外光谱数据进行去噪处理的具体过程与步骤S120相同,这里不再赘述。
步骤S230,根据去噪处理后的第二红外光谱数据建立判别模型,或者,提取去噪处理后的第二红外光谱数据的多个第二特征波长,根据提取出的多个第二特征波长建立判别模型。
下面基于建模样本的两种输入数据建立判别模型,第一种是将去噪处理后的第二红外光谱数据作为输入数据建立判别模型,第二种是提取去噪处理后的第二红外光谱数据的多个第二特征波长,将提取出的多个第二特征波长作为为输入数据建立判别模型,其中,提取去噪处理后的第二红外光谱数据的多个第二特征波长的具体过程与步骤S130中提取去噪处理后的第一红外光谱数据的多个第一特征波长的具体过程相同,这里不再赘述。需要说明的是,上述步骤S130中的前一种检测方式对应于此处的第一种基于去噪处理后的第二红外光谱数据的判别模型,步骤S130中的后一种检测方式对应于此处的第二种基于第二特征波长的判别模型。
上述判别模型可以但不限于为ELM判别模型或SVM判别模型,这两种判别分析模型基于不同的原理、从不同的角度对输入数据进行判别分析。ELM判别模型采用前馈神经网络学习算法(single-hidden layer feedforward neural networks,SLFNs),原理是:可以在隐层节参数中随机初始化输入权重和偏置并得到相应的输出权重。前馈神经网络学习算法执行过程中不需要调整学习参数,因而具有学习速度快、泛化性能好的特点。SVM判别模型,是使用公式:y=sign(f(x))来推断任一输入x所对应的类别,输出值只允许取类别值,比如包括两个类别,对应的代码分别为1、2,则输出值为1或2。本发明实施例在SVM建模中,采用径向基函数(Radial basis function,RBF)作为核函数,参数惩罚系数c的寻优范围为2-8到28
步骤S230建立判别模型之后,将建模样本和测试样本的数据分别输入建立的判别模型中进行检测,分别检测建模样本和测试样本的判别正确率。具体的检测方法与步骤S110至步骤S130相同,其中,步骤S130中的前一种检测方式对应于步骤S230中的第一种基于去噪处理后的第二红外光谱数据的判别模型,步骤S130中的后一种检测方式对应于步骤S230中的第二种基于第二特征波长的判别模型。
本发明实施例的实验结果如下:
基于去噪处理后的第二红外光谱数据的判别模型中,ELM判别模型的检测效果优于SVM判别模型的检测效果。ELM判别模型中建模样本和测试样本对应的正确率分别达到了100%和95.23%。
基于第二特征波长的判别模型中,对于转基因玉米双抗SK12-5,本发明实施例中共提取了9个第二特征波长,分别为:953.79nm、992.6nm、1125.6nm、1167.55nm、1309.37nm、1413.97nm、1444.34nm、1520.78nm和1644nm。ELM判别模型和SVM判别模型的正确率如表1所示,其中,ELM判别模型中隐含层节点数为102,SVM判别模型中参数惩罚系数c为256,参数gamma为3.0314。
表1
判别模型 建模样本对应的正确率 测试样本对应的正确率
ELM 90.83% 86.90%
SVM 80.00% 82.14%
由表1可知,基于第二特征波长的判别模型中,ELM判别模型和SVM判别模型的检测效果都较好,其中ELM判别模型的检测效果优于SVM判别模型的检测效果。ELM判别模型对转基因玉米双抗SK12-5的判别正确率,建模集和预测集分别达到了90.83%和86.90%。
上述实验结果说明应用本发明实施例的转基因玉米检测方法能够快速有效的识别转基因玉米双抗SK12-5,该方法具有良好的应用前景和可观的市场价值。
考虑到与某些外源基因相关的蛋白质的红外光谱可能与非转基因对应的红外光谱差别不大,不适宜应用上述方法,因此在步骤S230建立上述判别模型之前,本发明实施例提供的方法还包括以下步骤:
1.对上述第二红外光谱数据进行主成分分析,根据主成分分析的结果确定多个转基因玉米样本的红外光谱数据的主成分与多个非转基因玉米样本的红外光谱数据的主成分之间的相对分布情况。
2.根据该相对分布情况,确定是否建立判别模型。
具体地,主成分分析是通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量为主成分。本发明实施例中对训练样本中的所有转基因样本和非转基因样本均选取6个主成分,分别记为:pc1、pc2、pc3、pc4、pc5、pc6,经过主成分分析,获得各个训练样本中各个主成分对应的得分。表2和表3分别示出了训练样本中的10个转基因样本和10个非转基因样本对应的主成分及得分。在表2和表3中,可以根据样品编号查找到各个训练样本的主成分对应的得分。
表2
表3
根据上述主成分分析的结果,绘制多个转基因玉米样本的红外光谱数据的主成分与多个非转基因玉米样本的红外光谱数据的主成分之间的相对分布情况图。可以选取上述6个主成分中任意两个主成分的得分作为横纵坐标,根据同一个训练样本的两个主成分的得分确定该训练样本在图中的坐标点,由各个坐标点组成相对分布情况图。例如选取pc5的得分作为横坐标和pc6的得分作为纵坐标,则编号为1-1的转基因样本的坐标为(-0.00302,0.005946),编号为2-1的非转基因样本的坐标为(-0.00313,0.006264)等,由这些坐标点可以组成相对分布情况图。6个主成分一共可以绘制出30张相对分布情况图。由于同样的两个主成分根据横纵坐标的不同,可以绘制出2张相似的相对分布情况图,因此只需要考虑15张不相似的相对分布情况图。
根据上述相对分布情况图中的相对分布情况,确定是否建立判别模型。具体地,可以根据该相对分布图中非重叠区域的占比大小是否大于等于预设的占比阈值,确定是否建立判别模型。例如,预设的占比阈值为30%,由pc5和pc6绘制的相对分布情况图中非重叠区域的占比为40%,则确定建立判别模型。若上述15张不相似的相对分布情况图中任意一张相对分布情况图的相对分布情况满足预设的占比阈值要求,则确定建立判别模型,否则确定不适合建立判别模型。
本发明实施例中通过对上述第二红外光谱数据进行主成分分析,再根据转基因玉米样本的红外光谱数据的主成分与非转基因玉米样本的红外光谱数据的主成分之间的相对分布情况,可以确定本发明实施例提供的转基因玉米检测方法是否适用于某一特定的转基因玉米的检测,避免了盲目使用该方法检测各个转基因玉米品种,却无法获得预想的效果。
综上可知,本发明实施例应用红外光谱技术结合化学计量学方法对转基因玉米进行检测,识别的精度高,可以为高效的转基因育种筛查提供切实有效的检测手段。本发明实施例将生物技术和信息技术有机的结合起来,采用红外光谱技术进行转双价基因(cry1Ab/cry2Aj-G10evo)玉米双抗SK12-5的育种筛选鉴定,以缩短育种进程,节约人力和物力,提高育种效率,指导育种向高质量、功能化和专业化方向发展。在不同光谱技术数据分析中进行方法创新,建立转基因玉米植株快速无损的判别模型,为转基因玉米及其他转基因作物的快速无损鉴别研究提供理论依据和技术支持。
实施例二:
图3为本发明第二实施例提供的转基因玉米检测装置的基本模块组成示意图,如图3所示,该装置包括:采集模块11,用于采集待检测样本的第一红外光谱数据,该待检测样本包括玉米植株的任一部分;处理模块12,用于对该第一红外光谱数据进行去噪处理;确定模块13,用于根据去噪处理后的第一红外光谱数据和预先建立的判别模型,确定该待检测样本是否为转基因玉米。
其中,上述处理模块12具体用于:通过以下公式对第一红外光谱数据进行去噪处理:
其中,k表示第一红外光谱数据中各个波长的序号,i的取值为-w至+w之间的整数,w为正整数,xk,smooth表示序号为k的波长对应的去噪处理后的强度值,xk+i表示序号为k+i的波长对应的去噪处理前的强度值,H表示归一化因子,hi表示平滑系数。
上述确定模块13包括:第一确定单元,用于通过判别模型检测去噪处理后的第一红外光谱数据,得到待检测样本是否为转基因玉米的检测结果;或者,第二确定单元,用于提取去噪处理后的第一红外光谱数据的多个第一特征波长,通过判别模型检测提取出的多个第一特征波长,得到待检测样本是否为转基因玉米的检测结果。
本发明实施例中,采集模块11采集待检测样本的第一红外光谱数据,该待检测样本包括玉米植株的任一部分,处理模块12对第一红外光谱数据进行去噪处理,确定模块13根据去噪处理后的第一红外光谱数据和预先建立的判别模型,确定该待检测样本是否为转基因玉米。本发明实施例是通过红外光谱对待检测样本进行检测,由于采集待检测样本的红外光谱时不会破化待检测样本的蛋白质及基因,因此应用本发明实施例提供的转基因玉米检测装置对待检测样本进行检测,不会损坏待检测样本的原有表观性状,检测后的待检测样本可以进一步用于育种研究。
图4为本发明第二实施例提供的转基因玉米检测装置中模型建立模块的单元组成示意图,如图4所示,该装置还包括模型建立模块,该模型建立模块包括:样本选取单元21,用于选取训练样本,该训练样本包括多个转基因玉米样本和多个非转基因玉米样本;数据采集处理单元22,用于采集训练样本的第二红外光谱数据,对该第二红外光谱数据进行去噪处理;模型建立单元23,用于根据去噪处理后的第二红外光谱数据建立判别模型,或者,提取去噪处理后的第二红外光谱数据的多个第二特征波长,根据提取出的多个第二特征波长建立判别模型。
考虑到与某些外源基因相关的蛋白质的红外光谱可能与非转基因对应的红外光谱差别不大,不适宜应用上述方法,上述模型建立模块还包括分析单元,该分析单元包括:分布确定子单元,用于对第二红外光谱数据进行主成分分析,根据主成分分析的结果确定多个转基因玉米样本的红外光谱数据的主成分与多个非转基因玉米样本的红外光谱数据的主成分之间的相对分布情况;建立确定子单元,用于根据该相对分布情况,确定是否建立判别模型。
本发明实施例提供的转基因玉米检测装置,与上述实施例提供的转基因玉米检测方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
本发明实施例所提供的转基因玉米检测方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种转基因玉米检测方法,其特征在于,包括:
采集待检测样本的第一红外光谱数据,所述待检测样本包括玉米植株的任一部分;
对所述第一红外光谱数据进行去噪处理;
根据去噪处理后的所述第一红外光谱数据和预先建立的判别模型,确定所述待检测样本是否为转基因玉米。
2.根据权利要求1所述的方法,其特征在于,通过以下公式对所述第一红外光谱数据进行去噪处理:
x k , s m o o t h = 1 H Σ i = - w + w x k + i h i ,
H = Σ i = - w + w h i ,
其中,k表示所述第一红外光谱数据中各个波长的序号,i的取值为-w至+w之间的整数,w为正整数,xk,smooth表示序号为k的波长对应的去噪处理后的强度值,xk+i表示序号为k+i的波长对应的去噪处理前的强度值,H表示归一化因子,hi表示平滑系数。
3.根据权利要求1或2所述的方法,其特征在于,根据去噪处理后的所述第一红外光谱数据和预先建立的判别模型,确定所述待检测样本是否为转基因玉米,包括:
通过所述判别模型检测去噪处理后的所述第一红外光谱数据,得到所述待检测样本是否为所述转基因玉米的检测结果;或者,
提取去噪处理后的所述第一红外光谱数据的多个第一特征波长,通过所述判别模型检测提取出的多个所述第一特征波长,得到所述待检测样本是否为所述转基因玉米的检测结果。
4.根据权利要求3所述的方法,其特征在于,所述判别模型通过以下方法建立:
选取训练样本,所述训练样本包括多个转基因玉米样本和多个非转基因玉米样本;
采集所述训练样本的第二红外光谱数据,对所述第二红外光谱数据进行去噪处理;
根据去噪处理后的所述第二红外光谱数据建立所述判别模型,或者,提取去噪处理后的所述第二红外光谱数据的多个第二特征波长,根据提取出的多个所述第二特征波长建立所述判别模型。
5.根据权利要求4所述的方法,其特征在于,在建立所述判别模型之前,所述方法还包括:
对所述第二红外光谱数据进行主成分分析,根据主成分分析的结果确定所述多个转基因玉米样本的红外光谱数据的主成分与所述多个非转基因玉米样本的红外光谱数据的主成分之间的相对分布情况;
根据所述相对分布情况,确定是否建立所述判别模型。
6.一种转基因玉米检测装置,其特征在于,包括:
采集模块,用于采集待检测样本的第一红外光谱数据,所述待检测样本包括玉米植株的任一部分;
处理模块,用于对所述第一红外光谱数据进行去噪处理;
确定模块,用于根据去噪处理后的所述第一红外光谱数据和预先建立的判别模型,确定所述待检测样本是否为转基因玉米。
7.根据权利要求6所述的装置,其特征在于,所述处理模块具体用于:
通过以下公式对所述第一红外光谱数据进行去噪处理:
x k , s m o o t h = 1 H Σ i = - w + w x k + i h i ,
H = Σ i = - w + w h i ,
其中,k表示所述第一红外光谱数据中各个波长的序号,i的取值为-w至+w之间的整数,w为正整数,xk,smooth表示序号为k的波长对应的去噪处理后的强度值,xk+i表示序号为k+i的波长对应的去噪处理前的强度值,H表示归一化因子,hi表示平滑系数。
8.根据权利要求6或7所述的装置,其特征在于,所述确定模块包括:
第一确定单元,用于通过所述判别模型检测去噪处理后的所述第一红外光谱数据,得到所述待检测样本是否为所述转基因玉米的检测结果;
或者,第二确定单元,用于提取去噪处理后的所述第一红外光谱数据的多个第一特征波长,通过所述判别模型检测提取出的多个所述第一特征波长,得到所述待检测样本是否为所述转基因玉米的检测结果。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括模型建立模块,所述模型建立模块包括:
样本选取单元,用于选取训练样本,所述训练样本包括多个转基因玉米样本和多个非转基因玉米样本;
数据采集处理单元,用于采集所述训练样本的第二红外光谱数据,对所述第二红外光谱数据进行去噪处理;
模型建立单元,用于根据去噪处理后的所述第二红外光谱数据建立所述判别模型,或者,提取去噪处理后的所述第二红外光谱数据的多个第二特征波长,根据提取出的多个所述第二特征波长建立所述判别模型。
10.根据权利要求9所述的装置,其特征在于,所述模型建立模块还包括分析单元,所述分析单元包括:
分布确定子单元,用于对所述第二红外光谱数据进行主成分分析,根据主成分分析的结果确定所述多个转基因玉米样本的红外光谱数据的主成分与所述多个非转基因玉米样本的红外光谱数据的主成分之间的相对分布情况;
建立确定子单元,用于根据所述相对分布情况,确定是否建立所述判别模型。
CN201710062751.XA 2017-01-24 2017-01-24 转基因玉米检测方法及装置 Pending CN106778074A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710062751.XA CN106778074A (zh) 2017-01-24 2017-01-24 转基因玉米检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710062751.XA CN106778074A (zh) 2017-01-24 2017-01-24 转基因玉米检测方法及装置

Publications (1)

Publication Number Publication Date
CN106778074A true CN106778074A (zh) 2017-05-31

Family

ID=58955144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710062751.XA Pending CN106778074A (zh) 2017-01-24 2017-01-24 转基因玉米检测方法及装置

Country Status (1)

Country Link
CN (1) CN106778074A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108872133A (zh) * 2018-08-31 2018-11-23 浙江大学 一种基于中红外光谱的转基因玉米鉴别方法
CN111310571A (zh) * 2020-01-17 2020-06-19 中国科学院长春光学精密机械与物理研究所 一种基于空谱维滤波的高光谱图像分类方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106124445A (zh) * 2016-06-16 2016-11-16 福州大学 一种快速、无损鉴别转基因大豆方法
CN106338488A (zh) * 2016-10-31 2017-01-18 浙江大学 一种转基因豆奶粉的快速无损鉴别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106124445A (zh) * 2016-06-16 2016-11-16 福州大学 一种快速、无损鉴别转基因大豆方法
CN106338488A (zh) * 2016-10-31 2017-01-18 浙江大学 一种转基因豆奶粉的快速无损鉴别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
沙希迪 主编: "《贝雷油脂化学与工艺学:第6版. 第三卷,食用油脂产品:特种油脂与油脂产品》", 30 September 2016, 中国轻工业出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108872133A (zh) * 2018-08-31 2018-11-23 浙江大学 一种基于中红外光谱的转基因玉米鉴别方法
CN111310571A (zh) * 2020-01-17 2020-06-19 中国科学院长春光学精密机械与物理研究所 一种基于空谱维滤波的高光谱图像分类方法及装置

Similar Documents

Publication Publication Date Title
Singh et al. A review of imaging techniques for plant disease detection
Gu et al. Early detection of tomato spotted wilt virus infection in tobacco using the hyperspectral imaging technique and machine learning algorithms
Sonobe et al. Using spectral reflectance to estimate leaf chlorophyll content of tea with shading treatments
CN105352895B (zh) 高光谱遥感数据植被信息提取方法
Chan et al. Evaluation of Random Forest and Adaboost tree-based ensemble classification and spectral band selection for ecotope mapping using airborne hyperspectral imagery
CN109493287A (zh) 一种基于深度学习的定量光谱数据分析处理方法
CN108875913B (zh) 一种基于卷积神经网络的松茸快速无损检测系统及方法
Mishra et al. A Deep Learning-Based Novel Approach for Weed Growth Estimation.
CN113049530B (zh) 一种基于近红外高光谱的单粒玉米种子水分含量检测方法
CN101738373A (zh) 一种鉴别作物种子品种的方法
CN108051395A (zh) 一种基于THz-ATR光谱技术的玉米品种鉴别方法
ElManawy et al. HSI-PP: A flexible open-source software for hyperspectral imaging-based plant phenotyping
CN105372202B (zh) 转基因棉花品种识别方法
Chen et al. Discrimination of Fresh Tobacco Leaves with Different Maturity Levels by Near‐Infrared (NIR) Spectroscopy and Deep Learning
CN106778074A (zh) 转基因玉米检测方法及装置
Zhu et al. Early detection and classification of tobacco leaves inoculated with tobacco mosaic virus based on hyperspectral imaging technique
CN116992259B (zh) 适用于生物品质检测的光谱特征提取方法、检测方法
CN109765196A (zh) 一种大西洋鲑鱼与虹鳟鱼的快速鉴别方法
Kumar et al. Apple Sweetness Measurement and Fruit Disease Prediction Using Image Processing Techniques Based on Human‐Computer Interaction for Industry 4.0
Cao et al. Applying spectral fractal dimension index to predict the SPAD value of rice leaves under bacterial blight disease stress
CN103743705A (zh) 一种假高粱及其近似物种的快速检测方法
Wang et al. Intelligent detection of hard seeds of snap bean based on hyperspectral imaging
Pan et al. Identification of softwood species using convolutional neural networks and raw near-infrared spectroscopy
CN103487380B (zh) 一种梨树叶片上梨锈病斑的识别方法
Guo et al. Predicting Fv/Fm and evaluating cotton drought tolerance using hyperspectral and 1D-CNN

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication