CN101788475A - 对玉米品种种子近红外漫反射光谱数据进行预处理的方法 - Google Patents

对玉米品种种子近红外漫反射光谱数据进行预处理的方法 Download PDF

Info

Publication number
CN101788475A
CN101788475A CN201010132102A CN201010132102A CN101788475A CN 101788475 A CN101788475 A CN 101788475A CN 201010132102 A CN201010132102 A CN 201010132102A CN 201010132102 A CN201010132102 A CN 201010132102A CN 101788475 A CN101788475 A CN 101788475A
Authority
CN
China
Prior art keywords
data
diffuse reflection
reflection spectrum
infrared diffuse
spectrum data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201010132102A
Other languages
English (en)
Inventor
李阳鹏
李卫军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Semiconductors of CAS
Original Assignee
Institute of Semiconductors of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Semiconductors of CAS filed Critical Institute of Semiconductors of CAS
Priority to CN201010132102A priority Critical patent/CN101788475A/zh
Publication of CN101788475A publication Critical patent/CN101788475A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种对玉米品种种子近红外漫反射光谱数据进行预处理的方法,该方法包括:从玉米品种种子的近红外漫反射光谱数据中选取一定范围的近红外漫反射光谱数据;对选取的近红外漫反射光谱数据进行离散傅里叶变换,得到变换结果数据;从变换结果数据中选取数据的幅值部分作为预处理结果。本发明利用4000到7085cm-1波段的DFT数据作为特征数据,相对于原始数据数据特征点(即Qm值大的点)更为集中,易于提取特征数据点。此外,由于DFT变换数据关于数据中轴对称,相应计算得出的Qm数据也关于数据中轴对称,故处理时提取前半部分数据即可。这样不但能够提高处理速度,同时还可以节省数据存储空间。

Description

对玉米品种种子近红外漫反射光谱数据进行预处理的方法
技术领域
本发明涉及信号处理技术领域,特别是一种对玉米品种种子近红外漫反射光谱数据进行预处理的方法。
背景技术
玉米是一种重要的农作物,玉米种子品种鉴别是目前农业生产、作物育种和种子检验的重要问题之一。现有的种子品种鉴别常用方法有形态学方法、荧光扫描鉴定法、化学鉴定法和电泳鉴定法等。形态学方法所需鉴别时间长,且精度不高;荧光扫描鉴定法、化学鉴定法和电泳鉴定法鉴别精度高,但所需时间长,且鉴别过程烦琐,不适宜对种子品种进行批量、快速鉴别。
近红外光谱区的波长范围为780nm至2500nm,通过近红外光谱,可以得到检测样品中所有有机分子含氢基团的特征信息。目前近红外光谱在农产品检测中的应用已经相当成熟,在玉米中的应用也有很多报道。如芮玉奎等(2005)报道了近红外光谱在转基因玉米检测识别中的应用;李伟等(2008)报道了近红外光谱在4个玉米品种鉴别中的应用;A.Mark Settles等(2006)报道了近红外光谱在玉米种子成分检测中的应用等。但现有报道中鉴定的品种种类较少,绝大多数在10个品种以内,大规模的品种鉴定还未见报道,因此探索怎样利用近红外光谱数据进行大规模的品种鉴定具有重要的理论和现实意义。
在利用近红外光谱数据进行大规模的品种鉴定时,现有方法数据处理量和存储量均过大,特征数据点难以有效提取。
发明内容
(一)要解决的技术问题
有鉴于此,本发明的主要目的是为了克服现有方法数据处理量过大,特征数据点难以有效提取的不足,提供了一种对玉米品种种子近红外漫反射光谱数据进行预处理的方法。
(二)技术方案
为达到上述目的,本发明提供了一种对玉米品种种子近红外漫反射光谱数据进行预处理的方法,该方法包括:
从玉米品种种子的近红外漫反射光谱数据中选取一定范围的近红外漫反射光谱数据;
对选取的近红外漫反射光谱数据进行离散傅里叶变换,得到变换结果数据;
从变换结果数据中选取数据的幅值部分作为预处理结果。
上述方案中,所述从玉米品种种子的近红外漫反射光谱数据中选取一定范围的近红外漫反射光谱数据包括:从波长范围为4000到12000cm-1的玉米品种种子的近红外漫反射光谱数据中选取波长为4000到7085cm-1的近红外漫反射光谱数据。
上述方案中,所述从变换结果数据中选取数据的幅值部分作为预处理结果,忽略变换结果数据的相角部分。
上述方案中,该方法进一步包括:对得到的预处理结果进行评价,以验证预处理结果的有效性。
上述方案中,所述对得到的预处理结果进行评价包括:定义一种类间、类内差异度Qm的计算方法,对得到的预处理结果进行评价,当Qm值越大时,种间差异度越大,种内差异度越小;当Qm值越小时,种间差异度越小,种内差异度越大。
上述方案中,采用所述Qm的计算方法,对得到的预处理结果进行评价,变换后数据相对于原始数据,Qm曲线均值、峰值均被提高,有利于提取玉米品种特征。
(三)有益效果
从上述技术方案可以看出,本发明具有以下有益效果:
本发明提供的这种对玉米品种种子近红外漫反射光谱数据进行预处理的方法,仅截取前面1/3左右数据作为有效数据,对选取的有效数据做DFT变换,并选取变换后数据的幅值部分,忽略相角部分数据,采用本发明可以有效的减少数据处理、存储量,并且特征数据点相对原始数据较为集中,差异度更大,有利于进行后续玉米种子的分类识别等工作。
另外,本发明DFT处理后数据的Qm曲线均值、峰值都明显大于原始数据,DFT处理后差异度大的点较原始数据集中。由于DFT变换后数据幅值关于数据中轴对称,相应的Qm的曲线也关于数据中轴对称,故处理起来只需要考虑前一半数据即可,减少了近一半的数据运算量和存储量。
附图说明
图1是本发明提供的对玉米品种种子近红外漫反射光谱数据进行预处理的方法流程图;
图2是本发明截取不同有效数据段做DFT变化后Qm的对比曲线;其中:
图3是本发明选取4000到7085cm-1波段数据做DFT变换后与原始数据Qm的对比曲线。
其中,图2中原始数据是A段曲线组,前600数据是B段曲线组,前800数据是C段曲线组,前1000数据是D段曲线组,后1000数据是E段曲线组,后400数据是F段曲线组;
图3中,(a)是前800点数据DFT处理后的Qm曲线,(b)是原始数据的Qm曲线。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
如图1所示,图1是本发明提供的对玉米品种种子近红外漫反射光谱数据进行预处理的方法流程图,该方法包括:
步骤1:从玉米品种种子的近红外漫反射光谱数据中选取一定范围的近红外漫反射光谱数据;
步骤2:对选取的近红外漫反射光谱数据进行离散傅里叶变换,得到变换结果数据;
步骤3:从变换结果数据中选取数据的幅值部分作为预处理结果。
步骤1中所述从玉米品种种子的近红外漫反射光谱数据中选取一定范围的近红外漫反射光谱数据包括:从波长范围为4000到12000cm-1的玉米品种种子的近红外漫反射光谱数据中选取波长为4000到7085cm-1的近红外漫反射光谱数据。
步骤3中所述从变换结果数据中选取数据的幅值部分作为预处理结果,忽略变换结果数据的相角部分。
上述方法进一步包括:对得到的预处理结果进行评价,以验证预处理结果的有效性。
所述对得到的预处理结果进行评价包括:定义一种类间、类内差异度Qm的计算方法,对得到的预处理结果进行评价,当Qm值越大时,种间差异度越大,种内差异度越小;当Qm值越小时,种间差异度越小,种内差异度越大。采用所述Qm的计算方法,对得到的预处理结果进行评价,变换后数据相对于原始数据,Qm曲线均值、峰值均被提高,有利于提取玉米品种特征。
下面结合具体实施例对本发明提供的对玉米品种种子近红外漫反射光谱数据进行预处理的方法进行详细说明。
在本实施例中,实验数据为37个玉米品种种子的近红外漫反射光谱数据,波段范围为4000到12000cm-1。通过对原始数据进行分析,发现扫描频率较高的部分噪声也比较大,随着扫描频率的升高,数据噪声也随之增大。故尽量截取前面部分数据作为特征数据。
本实施例截取4000到7085cm-1波段的原始数据做DFT变换,并仅选取DFT变化后数据的幅值部分,而忽略相角部分数据。
本发明定义了一种类间、类内差异度Qm的计算方法,以度量特征选择的有效性,当Qm值越大时种间差异度越大,种内差异度越小;当Qm值越小时种间差异度越小,种内差异度越大。具体Qm计算公为:
Qm i k = Σ j = 1 37 ( ave i k - ave j k ) 2 Σ l = 1 25 ( data il k - ave i k ) 2 × 25 36 - - - ( 1 )
ave i k = Σ j = 1 25 data ij k 25 - - - ( 25 )
其中,Qmi k为37种玉米品种中的第i种中的第k个点的Qm值;avei k为第i种玉米第k个点25个样本的均值;dataij k为第i种玉米第j次采样样本第k点的数值。
对比计算DFT处理后和原始数据的的Qm曲线均值、峰值。
如图2,为依照本实施例寻找最佳的有效数据段,对比不同数据段的Qm曲线。结果发现选取4000到7085cm-1波段数据作为特征数据,数据量适中,在体现原始数据特征的前提下,尽可能多的减轻了数据量过大所引发的数据处理负担。由于原始数据一共有37种种子,而每一种种子又有25组数据,每一组数据有2075个double型数据,拿全部原始数据来处理运算压力很大,选取前800点数据较直接用原始数据处理可节省进2/3的运算量;并且Qm曲线数值从统计意义上来说最好,Qm曲线整体均值最大,峰值最大值、最小值较大,有利于数据特征点的提取。
如图3,从图3可以看出,对比DFT变化后数据和原始数据Qm曲线可以发现,(a)图曲线两侧的点数值比较大,而曲线中间部分的点相对数值较小(个别曲线中间和两边数值都大)。可以直接提取前部分某些点作为特征点,而忽略中间差异度不大的点,有利于后续特征点提取。而(b)图曲线差异度大的点分布几乎毫无规律,不利于特征点的提取。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种对玉米品种种子近红外漫反射光谱数据进行预处理的方法,其特征在于,该方法包括:
从玉米品种种子的近红外漫反射光谱数据中选取一定范围的近红外漫反射光谱数据;
对选取的近红外漫反射光谱数据进行离散傅里叶变换,得到变换结果数据;
从变换结果数据中选取数据的幅值部分作为预处理结果。
2.根据权利要求1所述的对玉米品种种子近红外漫反射光谱数据进行预处理的方法,其特征在于,所述从玉米品种种子的近红外漫反射光谱数据中选取一定范围的近红外漫反射光谱数据包括:
从波长范围为4000到12000cm-1的玉米品种种子的近红外漫反射光谱数据中选取波长为4000到7085cm-1的近红外漫反射光谱数据。
3.根据权利要求1所述的对玉米品种种子近红外漫反射光谱数据进行预处理的方法,其特征在于,所述从变换结果数据中选取数据的幅值部分作为预处理结果,忽略变换结果数据的相角部分。
4.根据权利要求1所述的对玉米品种种子近红外漫反射光谱数据进行预处理的方法,其特征在于,该方法进一步包括:
对得到的预处理结果进行评价,以验证预处理结果的有效性。
5.根据权利要求4所述的对玉米品种种子近红外漫反射光谱数据进行预处理的方法,其特征在于,所述对得到的预处理结果进行评价包括:
定义一种类间、类内差异度Qm的计算方法,对得到的预处理结果进行评价,当Qm值越大时,种间差异度越大,种内差异度越小;当Qm值越小时,种间差异度越小,种内差异度越大。
6.根据权利要求5所述的对玉米品种种子近红外漫反射光谱数据进行预处理的方法,其特征在于,采用所述Qm的计算方法,对得到的预处理结果进行评价,变换后数据相对于原始数据,Qm曲线均值、峰值均被提高,有利于提取玉米品种特征。
CN201010132102A 2010-03-24 2010-03-24 对玉米品种种子近红外漫反射光谱数据进行预处理的方法 Pending CN101788475A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010132102A CN101788475A (zh) 2010-03-24 2010-03-24 对玉米品种种子近红外漫反射光谱数据进行预处理的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010132102A CN101788475A (zh) 2010-03-24 2010-03-24 对玉米品种种子近红外漫反射光谱数据进行预处理的方法

Publications (1)

Publication Number Publication Date
CN101788475A true CN101788475A (zh) 2010-07-28

Family

ID=42531770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010132102A Pending CN101788475A (zh) 2010-03-24 2010-03-24 对玉米品种种子近红外漫反射光谱数据进行预处理的方法

Country Status (1)

Country Link
CN (1) CN101788475A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104374739A (zh) * 2014-10-30 2015-02-25 中国科学院半导体研究所 一种基于近红外定性分析的种子品种真实性鉴别方法
CN105043998A (zh) * 2015-05-29 2015-11-11 中国农业大学 一种鉴别玉米单倍体的方法
CN106170692A (zh) * 2013-11-14 2016-11-30 格兰森斯股份公司 光学分析器、光学分析方法以及样品制备装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106170692A (zh) * 2013-11-14 2016-11-30 格兰森斯股份公司 光学分析器、光学分析方法以及样品制备装置
CN106170692B (zh) * 2013-11-14 2019-06-07 格兰森斯股份公司 光学分析器、光学分析方法以及样品制备装置
CN104374739A (zh) * 2014-10-30 2015-02-25 中国科学院半导体研究所 一种基于近红外定性分析的种子品种真实性鉴别方法
CN105043998A (zh) * 2015-05-29 2015-11-11 中国农业大学 一种鉴别玉米单倍体的方法
CN105043998B (zh) * 2015-05-29 2018-01-02 中国农业大学 一种鉴别玉米单倍体的方法

Similar Documents

Publication Publication Date Title
CN103150498B (zh) 基于单分类支持向量机的硬件木马识别方法
CN102959354B (zh) 用于利用LiDAR数据来分析树冠层的方法和装置
CN109492593B (zh) 基于主成分分析网络和空间坐标的高光谱图像分类方法
CN102706813B (zh) 基于高光谱图像的草地早熟禾品种识别方法
CN104132896A (zh) 一种快速鉴别掺假肉的方法
CN102324047A (zh) 基于稀疏核编码skr的高光谱图像地物识别方法
CN103714341B (zh) 基于全局敏感度分析的高光谱反射率数据光谱特征提取方法
CN104374739A (zh) 一种基于近红外定性分析的种子品种真实性鉴别方法
CN109961096B (zh) 一种多模高光谱图像迁移分类方法
CN101738373A (zh) 一种鉴别作物种子品种的方法
CN106383088A (zh) 一种基于多光谱成像技术的种子纯度快速无损检测方法
CN101762569A (zh) 一种畜禽粪便工厂化堆肥发酵过程的无损监测方法
CN105181650A (zh) 一种使用近红外光谱技术快速鉴别茶叶品种的方法
CN102830072A (zh) 一种基于近红外光谱鉴别重金属污染水稻叶片的方法
CN103278467A (zh) 一种植物叶片氮素丰缺快速无损高准确率的鉴别方法
CN104408472A (zh) 基于Wishart和SVM的极化SAR图像分类方法
CN110751035A (zh) 一种制种玉米的识别方法及装置
CN107145831A (zh) 基于矢量概率扩散和马尔科夫随机场高光谱影像分类方法
CN101788475A (zh) 对玉米品种种子近红外漫反射光谱数据进行预处理的方法
CN104156628A (zh) 一种基于多核学习判别分析的舰船辐射信号识别方法
CN107192686B (zh) 一种模糊协方差矩阵的可能模糊聚类茶叶品种鉴别方法
Cai et al. Machine learning algorithms improve the power of phytolith analysis: A case study of the tribe Oryzeae (Poaceae)
CN111523587A (zh) 一种基于机器学习的木本植物物种光谱识别方法
CN108846360A (zh) 草原盐渍化的遥感识别方法、装置及计算机可读储存介质
CN110376153B (zh) 一种atr-ftir结合rbf神经网络对市售西红花产地溯源的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20100728