CN111523587A - 一种基于机器学习的木本植物物种光谱识别方法 - Google Patents
一种基于机器学习的木本植物物种光谱识别方法 Download PDFInfo
- Publication number
- CN111523587A CN111523587A CN202010304468.5A CN202010304468A CN111523587A CN 111523587 A CN111523587 A CN 111523587A CN 202010304468 A CN202010304468 A CN 202010304468A CN 111523587 A CN111523587 A CN 111523587A
- Authority
- CN
- China
- Prior art keywords
- spectral
- plant species
- data set
- machine learning
- woody plant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 241000196324 Embryophyta Species 0.000 title claims abstract description 78
- 238000001228 spectrum Methods 0.000 title claims abstract description 69
- 238000010801 machine learning Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 38
- 241000894007 species Species 0.000 claims abstract description 20
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 230000009466 transformation Effects 0.000 claims abstract description 7
- 230000003595 spectral effect Effects 0.000 claims description 120
- 238000011156 evaluation Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 13
- 238000005259 measurement Methods 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 7
- 238000007637 random forest analysis Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000009499 grossing Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000000985 reflectance spectrum Methods 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及一种基于机器学习的木本植物物种光谱识别方法,其特征在于包括以下步骤:S1、构建木本植物物种光谱数据库;S2、对木本植物物种光谱数据库中的光谱数据进行预处理,得到小波变换数据集和光谱特征指数优选数据集;S3、基于得到的连续小波变换数据集和光谱特征指数优选数据集,利用机器学习算法开展木本植物物种识别,得到物种识别精度。本发明提供了一种快速高精度的木本植物物种光谱识别方法,在降低时间成本的同时保持了较高精度,为傻瓜式物种鉴定提供了新的技术手段,可以广泛应用于木本植物物种光谱分类领域。
Description
技术领域
本发明涉及一种基于机器学习的木本植物物种光谱识别方法,属于光谱分类技术领域。
背景技术
生物多样性是自然生态系统功能和服务的基础和源泉。强烈的人类活动干扰以前所未有的速度和广度改变着我们赖以生存的生态系统,导致全球范围内生物多样性丧失。及时掌握生物多样性的现状、格局、变化趋势和受威胁程度,可以为制定生物多样性保护政策与措施提供强大的科技支撑。
物种识别与分类是陆地生态系统生物多样性监测的基础。然而,传统的物种识别以地面调查为主,该方法费时费力,且区域空间代表性和时间连续性差。近年来遥感技术凭借其探测范围广、获取数据周期性短、动态性强等优势,被广泛应用于物种识别领域。尤其是高光谱遥感,其具有图谱合一的优点,为机器学习方法提供了大数据基础,极大提高了物种识别能力。
Prospere等(Plant species discrimination in a tropical wetland usingin situ hyperspectral data[J].Remote sensing,Prospere K,et al.,2014,6(9):8494-8523.)基于高光谱数据选取了47个特征参数,然后利用机器学习方法对热带湿地46个植物开展物种识别;Guzmán等(Discrimination of liana and tree leaves from aNeotropical Dry Forest using visible-near infrared and longwave infraredreflectance spectra,Guzmán Q,et al.,Remote Sensing of Environment,2018,219:135-144.)基于可见光和中红外反射光谱数据,使用随机森林、支持向量机、K-均值聚类等分类方法对35种森林植被和物种进行分类,并分析了中红外反射光谱在植被分类中的价值;Xu Li等(Continuous wavelet analysis of leaf reflectance improvesclassification accuracy of mangrove species,Xu Y,et al.,Remote Sensing,2019,11(3):254)探讨了利用连续小波变换对可见光和近红外反射光谱进行预处理可以提高物种的分类精度。上述方法均使用了适当的算法对各自的光谱数据进行分类,并取得了较好的结果。然而,由于随着物种数增多,会增加“同物异谱”和“异物同谱”,进而增加物种识别难度,导致其结论中算法的有效性和分类精度的可信性均有待商榷。
发明内容
针对上述问题,本发明基于115个木本植物物种的叶片光谱数据,共2298个样本进行研究。通过比较分析不同的机器学习方法,综合考虑分类精度和速度,提供了一种基于机器学习的木本植物物种光谱识别方法,该方法的核心技术是使用机器学习算法,基于光谱特征指数优选数据集对木本植物进行物种分类,包括特征指数选择和使用随机森林算法优选两个关键步骤,有效降低了时间成本,同时保持了较高识别精度。
为实现上述目的,本发明采取以下技术方案:一种基于机器学习的木本植物物种光谱识别方法,其包括以下步骤:
S1、构建木本植物物种光谱数据库;
S2、对木本植物物种光谱数据库中的光谱数据进行预处理,得到小波变换数据集和光谱特征指数优选数据集;
S3、基于得到的连续小波变换数据集和光谱特征指数优选数据集以及实际分类需求,利用机器学习算法开展木本植物物种识别,得到物种识别结果。
进一步的,所述步骤S1中,构建木本植物物种光谱数据库的方法,包括以下步骤:
S1.1、叶片采集,在实验区内对采样地点进行随机选择,并获取待采样木本植物物种的新鲜叶片;
S1.2、对采集的叶片样本进行光谱测量,获得同株植物的不同分区叶片以及单个叶片的不同位置的光谱测量结果,整理所有木本植物的叶片光谱测量数据并构建木本植物物种光谱数据库。
进一步的,所述步骤S1.1中,对叶片进行采集的方法为:
首先,在实验区随机选择采样地点,在采样地点内确定需要进行采样的各木本植物物种;
然后,将待采样木本植物植株进行分区,分为上、中、下三层和阴、阳两面,并在各分区内分别采集新鲜叶片;
最后,将采集的新鲜叶片样本置于有冰袋的样本箱中,采集完毕后送入实验室进行叶片光谱数据的采集。
进一步的,所述步骤S2中,对木本植物物种光谱数据库中的光谱数据进行预处理,得到小波变换数据集和光谱特征指数优选数据集的方法,包括以下步骤:
S2.1:根据每条光谱的光谱范围,去掉每条光谱中位于边缘的光谱反射值;
S2.2:采用Savitzky-Golay平滑滤波器对步骤S2.1中的光谱进行滤波去噪;
S2.3:分别采用连续小波变换和计算光谱特征指数的方法,对去噪后的光谱数据进行光谱特征增强,得到连续小波变换数据集和光谱特征指数优选数据集。
进一步的,所述步骤S2.3中,采用连续小波变换方法对滤波后光谱数据进行光谱特征增强时,选择高斯的二阶导数作为母小波函数,尺度参数设为16。
进一步的,所述步骤S2.3中,采用计算光谱特征指数的方法对滤波后光谱数据进行光谱特征增强时,方法为:
首先,确定能够反映木本植物光谱特征的光谱特征指数;
其次,将确定的所有光谱特征指数导入随机森林分类算法,并根据feature_importances参数获得所有光谱特征指数的重要程度,选择大于重要程度平均值的指数集合作为光谱特征指数优选数据集。
进一步的,所述步骤S3中,基于得到的连续小波变换数据集和光谱特征指数优选数据集,使用机器学习算法进行物种分类时,包括以下步骤:
S3.1、根据实际分类需求,选择相应的数据集;
S3.2、将连续小波变换数据集或光谱特征指数优选数据集按照预设比例分为训练集和验证集,同时保证在每一类别的数据中占比也相同;
S3.3、使用多种机器学习算法对步骤S3.1中的训练集进行分类;
S3.4、根据预先确定的评估参数对各机器学习算法的分类结果进行精度评估,得出分类效果最好的机器学习算法作为最优机器学习算法;
S3.5、采用确定的最优机器学习算法对验证集进行分类,得到分类结果。
进一步的,所述步骤S3.1中,根据实际分类需求,选择相应的数据集时:
若需要对植物种类进行精确识别,则选择连续小波变换数据集进行分类操作;
若需要对植物种类进行快速识别,则选择光谱特征指数优选数据集进行分类操作。
进一步的,所述步骤S3.2中所述预设比例为7:3。
进一步的,所述S3.4中,根据预先确定的评估参数对各机器学习算法的分类结果进行精度评估时,所述评估参数为:Accuracy、Recall、Precison、F1-score、Kappa系数。
本发明由于采取以上技术方案,其具有以下优点:1.本发明使用连续小波变换进行光谱特征增强,使得采用LDA对基于小波变换的全光谱数据集进行分类时的分类精度高达98.84%,表明本发明有效可靠;2.本发明为降低全光谱数据冗余,研究了基于光谱特征指数的特征增强方法,使分类时间成本下降明显而精度依旧保持在高位,具有较好的推广应用价值。3.本发明为应对多物种多样本的海量植被光谱数据,提供了一种快速高精度的木本植物物种分类方案,通过对植物样本数据的光谱特征增强,并对各种机器学习算法进行对比评估得到最优算法,实现了对于多物种多样本海量植被光谱数据的快速和精确分类。因此,本发明可以广泛应用于植物物种分类领域。
附图说明
图1是本发明基于机器学习的木本植物物种光谱识别方法流程图。
具体实施方式
为了使本领域技术人员更好的理解本发明的技术方向,通过具体实施例对本发明进行详细的描绘。然而应当理解,具体实施方式的提供仅为了更好地理解本发明,它们不应该理解成对本发明的限制。在本发明的描述中,需要理解的是,所用到的术语仅仅是用于描述的目的,而不能理解为指示或暗示相对重要性。
如图1所示,本发明提供的一种基于机器学习的木本植物物种光谱识别方法,包括以下步骤:
S1、构建木本植物物种光谱数据库;
S2、对木本植物物种光谱数据库中的光谱数据进行预处理,得到小波变换数据集和光谱特征指数优选数据集;
S3、基于得到的连续小波变换数据集和光谱特征指数优选数据集以及实际分类需求,利用机器学习算法开展木本植物物种识别,得到物种识别结果。
进一步的,上述步骤S1中,构建木本植物物种光谱数据库的方法,包括以下步骤:
S1.1、叶片采集,在实验区内对采样地点进行随机选择,并获取待采样木本植物物种的新鲜叶片;
具体方法为:首先,在实验区随机选择采样地点,在采样地点内确定需要进行采样的各木本植物物种;然后,将待采样木本植物植株进行分区,分为上、中、下三层和阴、阳两面,并在各分区内分别采集新鲜叶片;最后,将采集的新鲜叶片样本置于有冰袋的样本箱中,采集完毕后送入实验室进行叶片光谱数据的采集。
S1.2、对采集的叶片样本进行光谱测量,获得同株植物的不同分区叶片以及单个叶片的不同位置的光谱测量结果,整理所有植物的叶片光谱测量数据并构建木本植物物种光谱数据库。
进一步,上述步骤S2中,对木本植物物种光谱数据库中的光谱数据进行预处理,得到小波变换数据集和光谱特征指数优选数据集的方法,包括以下步骤:
S2.1:减小系统误差:根据每条光谱的光谱范围,去掉每条光谱中位于边缘的光谱反射值,以减小系统误差;
S2.2:数据去噪:采用Savitzky-Golay平滑滤波器对步骤S2.1中的光谱进行滤波去噪;
S2.3:数据特征增强:分别采用小波变换和计算光谱特征指数的方法,对去噪后的光谱数据进行光谱特征增强,得到小波变换数据集和光谱特征指数优选数据集。
进一步,上述步骤S2.3中,由于连续小波变换可以生成反映植物吸收特征的信息,增强了光谱信息的特征表达,有利于后续算法分类。因此,本发明采用小波变换的方法,进行光谱特征增强。由于连续小波变换需要设定两个参数,即母小波函数和尺度参数,本发明中选择高斯的二阶导数作为母小波函数,尺度参数设为16。
进一步的,上述步骤S2.3中,由于光谱特征指数可以较好地反映光谱特征,通过多个光谱反射值组合计算获得少量特征指数,显著降低了全光谱数据信息的冗余。具体的方法为:
首先,确定能够反映木本植物光谱特征的光谱特征指数;
其次,将确定的所有光谱特征指数导入随机森林分类算法,并根据feature_importances参数获得所有光谱特征指数的重要程度,选择大于重要程度平均值的指数集合作为光谱特征指数优选数据集进行后续的分类。
进一步,上述步骤S3中,基于得到的连续小波变换数据集和光谱特征指数优选数据集,使用机器学习算法进行物种分类时,包括以下步骤:
S3.1、根据实际分类需求,选择相应的数据集:
若需要对植物种类进行精确识别,则选择连续小波变换数据集进行分类操作;
若需要对植物种类进行快速识别,则选择光谱特征指数优选数据集进行分类操作;
S3.2、将连续小波变换数据集或光谱特征指数优选数据集按照预设比例分为训练集和验证集,并保证在每一类别的数据中占比也相同;
S3.3、使用多种机器学习算法对步骤S3.2中的训练集进行分类;
S3.4、根据预先确定的评估参数对各机器学习算法的分类结果进行精度评估,得出分类效果最好的机器学习算法作为最优机器学习算法;
S3.5、采用确定的最优机器学习算法对验证集进行分类,得到分类结果。
实施例一
本实施例中以中国科学院北京植物园中的木本植物的物种识别为例进行了介绍,具体的包括以下步骤:
S1、构建光谱数据库;
S2、光谱数据预处理,得到连续小波变换数据集和光谱特征指数优选数据集;
S3、基于连续小波变换数据集和光谱特征指数优选数据集,利用机器学习算法开展木本植物物种识别。
步骤S1中,光谱数据库构建,包括叶片采集和光谱测量两个步骤。
叶片采集:采样地点随机分布于实验区内,本实施例中,于2019年5月在中国科学院北京植物园对115种木本植物物种,分上、中、下三层和阴、阳两面分别采集新鲜叶片,将新鲜叶片样本置于有冰袋的样本箱中,采集完毕后送入实验室进行叶片光谱数据的采集;
光谱测量:使用ASD FieldSpec4地物光谱仪对采集的植物叶片测量光谱。为确保光谱数据多样性,对同株植物的不同叶片采集叶片和单个叶片的不同位置均进行测量,且不允许重复测量。为确保测量精度,每测定5个样本校正标准白板,而每个样本采集10个连续光谱数据,取其均值作为该样本的光谱反射率值。经整理统计所得光谱数据为2298条。
步骤S2中,光谱数据预处理,包括减小系统误差,数据去噪和数据特征增强三个步骤。具体方法为:减少系统误差:每条光谱数据的光谱范围为350nm-2500nm,为减少系统误差的影响,删除350-399nm和2451-2500nm的光谱反射值;数据去噪:选用Savitzky-Golay平滑滤波器,其去噪效果好且能较好保留初始光谱的特征信息,参数设定窗口大小为7,多项式阶数为2;光谱特征增强,包括使用连续小波变换和使用光谱特征指数两种方法,具体介绍如下:
去噪后进行连续小波变换:
小波变换是将原始信号分解为多个振幅和尺度的一种变换方法,具体有离散小波变换和连续小波变换,其中连续小波变化生成的直接对应于原始光谱的信号可反映植物吸收特征的信息,这增强了光谱信息的特征表达,因此本发明使用连续小波变化增强光谱特征。具体参数设定有两个:母小波函数和尺度参数。因叶片反射光谱的形状类似于高斯或准高斯函数,或几个高斯函数的组合,则在参数选择中,使用高斯的二阶导数作为母小波函数,同时在本实施例中尺度参数设为16时效果最好。
去噪后计算光谱特征指数:
在每一条光谱数据中,光谱范围为400nm-2450nm的光谱共有2051个反射值,过多的反射值冗余导致在计算时消耗大量内存又增加了时间成本。为此本发明除使用全部光谱外,研究了一种基于光谱特征指数的方法,用于快速执行物种分类。其中,使用的特征指数共101个,具体如表格1所示。
表1光谱特征指数
为进一步减少光谱数据冗余度,提高计算效率,本发明将植被指数数据集导入随机森林分类算法,根据feature_importances参数获得所有指数的重要程度,选择大于重要程度平均值的指数集合作为优选数据集进行后续的分类。在本实施例中,选择了高于重要程度平均值(0.0099)的39个特征(重要程度和为0.6029),按重要程度从大到小排序如表格2所示。
表2光谱特征指数及其重要程度
步骤S3,使用机器学习算法对基于连续小波变换数据集和光谱特征指数优选数据集进行植被物种分类时,包括:
S3.1、根据实际分类需求,选择相应的数据集;
S3.2、使用StratifiedShuffleSplit()函数按照7:3的比例将经过连续小波变换数据集和光谱特征指数优选数据集分为训练集和验证集,同时该函数能保证在每一类别的数据中占比也为7:3;
S3.3、为评估算法性能选出最优的分类方法,本实施例选取了10大类共21种基于Python语言的机器学习方法进行分类计算(具体方法和参数设置见表格3);
S3.4、对分类结果进行评估,得出最优的分类算法为线性判别分析方法(LDA);
S3.5、使用LDA对连续小波变换数据集和光谱特征指数优选数据集中的验证集进行物种分类。
表3机器学习方法及其参数设置
步骤S3.4中,评估方法选用了5种评估参数,具体为①Accuracy②Recall③Precison④F1-score⑤Kappa系数。对采用各机器学习方法对连续小波变换数据集的分类结果进行比较(参考表格4),得出LinearDiscriminantAnalysis()函数代表的线性判别分析方法(LDA)分类精度最高,accuracy高达98.84%,所用时间为5.231s。
采用各机器学习方法对光谱特征指数优选数据集进行分类结果进行比较,结果如表5所示,评估结果LDA最优,accuracy为92.46%,较98.84%略低,但是使用的单条光谱数据量由原来的2051个降低到39个,在低数据量下分类精度仅下降约6%,而速度由原来的5.231s降为1.653s,降幅超过300%,可见本发明在保持较高精度的情况下时间成本下降明显,是可行且有效的一种方法。
表4采用各机器学习方法对连续小波变换数据集进行分类结果比较
表5采用各机器学习方法对光谱特征参数优选数据集进行分类结果比较
步骤S3.5中,使用LDA进行验证集的物种分类。LDA是一种常用的识别植被类型或识别树木种类的分类器,其使用汇总的类内协方差矩阵和训练样本中的频谱预测变量来建立每个类的判别函数。因LDA将原始冗余数据投影到沿轴定向的新正交空间,可以使训练样本之间的类间差异与类内差异的比率最大化,则可以取得较好的分类效果。
以上给出一种具体的实施方式,但本发明不局限于所描述的实施方式。本发明的基本思路在于上述方案,对本领域普通技术人员而言,根据本发明的教导,设计出各种变形的模型、公式、参数并不需要花费创造性劳动。在不脱离本发明的原理和精神的情况下对实施方式进行的变化、修改、替换和变形仍落入本发明的保护范围内。
Claims (10)
1.一种基于机器学习的木本植物物种光谱识别方法,其特征在于包括以下步骤:
S1、构建木本植物物种光谱数据库;
S2、对木本植物物种光谱数据库中的光谱数据进行预处理,得到小波变换数据集和光谱特征指数优选数据集;
S3、基于得到的连续小波变换数据集和光谱特征指数优选数据集以及实际分类需求,利用机器学习算法开展木本植物物种识别,得到物种识别结果。
2.如权利要求1所述的一种基于机器学习的木本植物物种光谱识别方法,其特征在于:所述步骤S1中,构建木本植物物种光谱数据库的方法,包括以下步骤:
S1.1、叶片采集,在实验区内对采样地点进行随机选择,并获取待采样木本植物物种的新鲜叶片;
S1.2、对采集的叶片样本进行光谱测量,获得同株植物的不同分区叶片以及单个叶片的不同位置的光谱测量结果,整理所有木本植物的叶片光谱测量数据并构建木本植物物种光谱数据库。
3.如权利要求2所述的一种基于机器学习的木本植物物种光谱识别方法,其特征在于:所述步骤S1.1中,对叶片进行采集的方法为:
首先,在实验区随机选择采样地点,在采样地点内确定需要进行采样的各木本植物物种;
然后,将待采样木本植物植株进行分区,分为上、中、下三层和阴、阳两面,并在各分区内分别采集新鲜叶片;
最后,将采集的新鲜叶片样本置于有冰袋的样本箱中,采集完毕后送入实验室进行叶片光谱数据的采集。
4.如权利要求1所述的一种基于机器学习的木本植物物种光谱识别方法,其特征在于:所述步骤S2中,对木本植物物种光谱数据库中的光谱数据进行预处理,得到小波变换数据集和光谱特征指数优选数据集的方法,包括以下步骤:
S2.1:根据每条光谱的光谱范围,去掉每条光谱中位于边缘的光谱反射值;
S2.2:采用Savitzky-Golay平滑滤波器对步骤S2.1中的光谱进行滤波去噪;
S2.3:分别采用连续小波变换和计算光谱特征指数的方法,对去噪后的光谱数据进行光谱特征增强,得到连续小波变换数据集和光谱特征指数优选数据集。
5.如权利要求4所述的一种基于机器学习的木本植物物种光谱识别方法,其特征在于:所述步骤S2.3中,采用连续小波变换方法对滤波后光谱数据进行光谱特征增强时,选择高斯的二阶导数作为母小波函数,尺度参数设为16。
6.如权利要求4所述的一种基于机器学习的木本植物物种光谱识别方法,其特征在于:所述步骤S2.3中,采用计算光谱特征指数的方法对滤波后光谱数据进行光谱特征增强时,方法为:
首先,确定能够反映木本植物光谱特征的光谱特征指数;
其次,将确定的所有光谱特征指数导入随机森林分类算法,并根据feature_importances参数获得所有光谱特征指数的重要程度,选择大于重要程度平均值的指数集合作为光谱特征指数优选数据集。
7.如权利要求1所述的一种基于机器学习的木本植物物种光谱识别方法,其特征在于:所述步骤S3中,基于得到的连续小波变换数据集和光谱特征指数优选数据集,使用机器学习算法进行物种分类时,包括以下步骤:
S3.1、根据实际分类需求,选择相应的数据集;
S3.2、将连续小波变换数据集或光谱特征指数优选数据集按照预设比例分为训练集和验证集,同时保证在每一类别的数据中占比也相同;
S3.3、使用多种机器学习算法对步骤S3.1中的训练集进行分类;
S3.4、根据预先确定的评估参数对各机器学习算法的分类结果进行精度评估,得出分类效果最好的机器学习算法作为最优机器学习算法;
S3.5、采用确定的最优机器学习算法对验证集进行分类,得到分类结果。
8.如权利要求7所述的一种基于机器学习的木本植物物种光谱识别方法,其特征在于:所述步骤S3.1中,根据实际分类需求,选择相应的数据集时:
若需要对植物种类进行精确识别,则选择连续小波变换数据集进行分类操作;
若需要对植物种类进行快速识别,则选择光谱特征指数优选数据集进行分类操作。
9.如权利要求7所述的一种基于机器学习的木本植物物种光谱识别方法,其特征在于:所述步骤S3.2中所述预设比例为7:3。
10.如权利要求7所述的一种基于机器学习的木本植物物种光谱识别方法,其特征在于:所述S3.4中,根据预先确定的评估参数对各机器学习算法的分类结果进行精度评估时,所述评估参数为:Accuracy、Recall、Precison、F1-score、Kappa系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010304468.5A CN111523587B (zh) | 2020-04-17 | 2020-04-17 | 一种基于机器学习的木本植物物种光谱识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010304468.5A CN111523587B (zh) | 2020-04-17 | 2020-04-17 | 一种基于机器学习的木本植物物种光谱识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111523587A true CN111523587A (zh) | 2020-08-11 |
CN111523587B CN111523587B (zh) | 2024-02-20 |
Family
ID=71902192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010304468.5A Active CN111523587B (zh) | 2020-04-17 | 2020-04-17 | 一种基于机器学习的木本植物物种光谱识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111523587B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111982855A (zh) * | 2020-08-12 | 2020-11-24 | 广东工业大学 | 一种通过光谱信号进行物质识别的方法及其应用 |
CN112329829A (zh) * | 2020-10-27 | 2021-02-05 | 宁波大学 | 一种基于高光谱数据的红树林提取方法 |
CN113536890A (zh) * | 2021-04-26 | 2021-10-22 | 中国科学院植物研究所 | 基于地物光谱库的内蒙古草原植物物种分类 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102058413A (zh) * | 2010-12-03 | 2011-05-18 | 上海交通大学 | 基于连续小波变换的脑电信号警觉度检测方法 |
US20110125477A1 (en) * | 2009-05-14 | 2011-05-26 | Lightner Jonathan E | Inverse Modeling for Characteristic Prediction from Multi-Spectral and Hyper-Spectral Remote Sensed Datasets |
US20140093138A1 (en) * | 2011-06-29 | 2014-04-03 | Fujitsu Limited | Plant species identification apparatus and method |
CN105005978A (zh) * | 2015-07-15 | 2015-10-28 | 天津大学 | 一种基于Savitzky-Golay滤波器参数优化的光谱实时滤波方法 |
US20190339242A1 (en) * | 2018-05-06 | 2019-11-07 | Beijing Normal University | Method and system for identifying plant species based on hyperspectral data |
CN110889420A (zh) * | 2018-09-07 | 2020-03-17 | 华南农业大学 | 植物类别识别方法及系统 |
-
2020
- 2020-04-17 CN CN202010304468.5A patent/CN111523587B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110125477A1 (en) * | 2009-05-14 | 2011-05-26 | Lightner Jonathan E | Inverse Modeling for Characteristic Prediction from Multi-Spectral and Hyper-Spectral Remote Sensed Datasets |
CN102058413A (zh) * | 2010-12-03 | 2011-05-18 | 上海交通大学 | 基于连续小波变换的脑电信号警觉度检测方法 |
US20140093138A1 (en) * | 2011-06-29 | 2014-04-03 | Fujitsu Limited | Plant species identification apparatus and method |
CN105005978A (zh) * | 2015-07-15 | 2015-10-28 | 天津大学 | 一种基于Savitzky-Golay滤波器参数优化的光谱实时滤波方法 |
US20190339242A1 (en) * | 2018-05-06 | 2019-11-07 | Beijing Normal University | Method and system for identifying plant species based on hyperspectral data |
CN110889420A (zh) * | 2018-09-07 | 2020-03-17 | 华南农业大学 | 植物类别识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
李婵 等: "基于叶片光谱特征的农业区域植物分类" * |
李辉 等: "基于连续小波变换的地下天然气微泄漏点识别模型" * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111982855A (zh) * | 2020-08-12 | 2020-11-24 | 广东工业大学 | 一种通过光谱信号进行物质识别的方法及其应用 |
CN112329829A (zh) * | 2020-10-27 | 2021-02-05 | 宁波大学 | 一种基于高光谱数据的红树林提取方法 |
CN113536890A (zh) * | 2021-04-26 | 2021-10-22 | 中国科学院植物研究所 | 基于地物光谱库的内蒙古草原植物物种分类 |
Also Published As
Publication number | Publication date |
---|---|
CN111523587B (zh) | 2024-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ghiyamat et al. | A review on hyperspectral remote sensing for homogeneous and heterogeneous forest biodiversity assessment | |
CN111523587A (zh) | 一种基于机器学习的木本植物物种光谱识别方法 | |
Ullah et al. | An accurate retrieval of leaf water content from mid to thermal infrared spectra using continuous wavelet analysis | |
CN101498661B (zh) | 高精度分辨中药材品种、产地及生长方式的红外光谱特征提取方法 | |
CN110346312B (zh) | 基于费氏线性判别和支持向量机技术的冬小麦穗赤霉病识别方法 | |
CN109858477A (zh) | 用深度森林在复杂环境中识别目标物的拉曼光谱分析方法 | |
CN107871132B (zh) | 一种空间特征自适应寻优的高光谱图像分类方法 | |
CN107679569A (zh) | 基于自适应超图算法的拉曼光谱物质自动识别方法 | |
CN110376153B (zh) | 一种atr-ftir结合rbf神经网络对市售西红花产地溯源的方法 | |
CN110779875B (zh) | 一种基于高光谱技术检测冬小麦麦穗水分含量的方法 | |
CN109472287A (zh) | 基于二维Gabor小波的三维荧光光谱特征提取方法 | |
CN104020128A (zh) | 一种快速鉴别蜂胶胶源的方法 | |
CN104374739A (zh) | 一种基于近红外定性分析的种子品种真实性鉴别方法 | |
CN118225711B (zh) | 一种基于光谱分析的土壤水势智能化检测方法 | |
CN106568730B (zh) | 一种基于近地面高光谱影像的水稻阴阳叶穗识别方法 | |
CN109146003B (zh) | 一种基于高光谱成像的分类识别方法、装置及系统 | |
Ghiyamat et al. | Airborne hyperspectral discrimination of tree species with different ages using discrete wavelet transform | |
CN113640244B (zh) | 一种基于可见近红外光谱的果树品种鉴别方法 | |
CN111881738B (zh) | 一种核模糊正交鉴别分析的茶叶近红外光谱分类方法 | |
CN114280000A (zh) | 一种原油产地的溯源方法和系统 | |
CN113191618A (zh) | 一种基于中红外光谱技术及特征提取的小米产地溯源方法 | |
CN113203701A (zh) | 一种原油产地溯源方法和装置 | |
CN111693484A (zh) | 一种基于太赫兹时域光谱的芝麻油品种识别方法 | |
CN113537029B (zh) | 基于近红外光谱的模型转移方法及终端设备 | |
Zhao et al. | A Hyperspectral Inversion Model of Forest Soil Organic Carbon in Subtropical Red Soil Area Based on Orthogonal Partial Least Square |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |