CN110363119A - 基于小波变换-随机森林算法的烟叶霉变快速识别方法 - Google Patents

基于小波变换-随机森林算法的烟叶霉变快速识别方法 Download PDF

Info

Publication number
CN110363119A
CN110363119A CN201910579464.5A CN201910579464A CN110363119A CN 110363119 A CN110363119 A CN 110363119A CN 201910579464 A CN201910579464 A CN 201910579464A CN 110363119 A CN110363119 A CN 110363119A
Authority
CN
China
Prior art keywords
tobacco
sample
wavelet
mildew
random forests
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910579464.5A
Other languages
English (en)
Inventor
赖燕华
陶红
林云
王予
周瑢
欧阳路斯
林宝敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Tobacco Guangdong Industrial Co Ltd
Original Assignee
China Tobacco Guangdong Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Tobacco Guangdong Industrial Co Ltd filed Critical China Tobacco Guangdong Industrial Co Ltd
Priority to CN201910579464.5A priority Critical patent/CN110363119A/zh
Publication of CN110363119A publication Critical patent/CN110363119A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明提供的一种基于小波变换‑随机森林算法的烟叶霉变快速识别方法,包括以下步骤:采集烟叶样本;分别采集各个烟叶样本的近红外光谱,作为各烟叶样本的光谱信息;利用离散小波变换对光谱信息进行预处理,求解得到小波系数;利用随机森林算法从小波系数中识别出烟叶的霉变程度,完成烟叶霉变的识别。本发明提供的基于小波变换‑随机森林算法的烟叶霉变快速识别方法,通过用近红外光谱法建立了不同霉变程度烟叶样品的快速识别方法,为烟叶霉变的预警提供依据;采用小波变换处理光谱数据,确定光谱变量建立随机森林识别模型,识别率和预报率高,实现了对烟叶样品霉变程度的有效识别及准确预测。

Description

基于小波变换-随机森林算法的烟叶霉变快速识别方法
技术领域
本发明涉及烟草霉变识别技术领域,更具体的,涉及一种基于小波变换-随机森林算法的烟叶霉变快速识别方法。
背景技术
烟叶作为一种特殊的叶用植物,烟草仓储是极为重要的一个环节。田间生长的烟叶经过采收、烘烤、收购、运输、打叶复烤、醇化等环节,才能进入卷烟工厂制丝车间,卷制成卷烟。从烟叶采收到卷烟,至少需要1到2年时间。霉菌是自然界中分布最为广泛的真菌类微生物,只要碰到适宜它生长繁殖的温湿度条件,就会快速生长繁殖,造成烟叶霉变,导致烟叶的腐坏变质。因此,烟草防霉变的研究具有重要的经济价值和应用意义。导致烟草霉变的因素有很多,其中主要的影响因素是其存储环境的温度、湿度以及烟草的自身含水量[1-2]。但是由于在不同的地域、不同的烟草种类、所含菌类别及数量的不同等等,造成了烟草霉变过程的非线性和不确定性。目前,对烟草霉变监测的研究主要集中在霉菌种类的鉴定、霉菌毒素的检测以及通过几丁质、麦角甾醇的测定来评估霉菌生物量[3,4],对烟叶霉变的早期预测还缺少系统研究。
近红外光谱技术是近些年来发展较快的分析方法之一,它依据化学成分对近红外光谱的吸收特性而进行测定。近红外光谱分析技术无需复杂的样品前处理,具有快速、简便、高准确率、成本低、可用于无损检测等优点,已被国内外学者广泛应用于各种农产品品质的监测研究[5-9]。烟草行业在应用近红外光谱技术定性检测烟草霉变方面也取得了一些经验。周继月[10]等基于烟叶麦角甾醇含量变化,采用近红外光谱分析结合化学计量学方法建立了烟叶霉变过程的模式识别模型,该研究针对单个烟叶样品采用过程模式识别监测初烤烟叶霉变过程中麦角甾醇含量变化,能较好排除烟叶地区、部位和等级差异对模型的影响,但也正因为如此,模型的转移和应用势必存在局限性,对于不同产地、部位和等级的烟叶霉变预警,需要重新建立模型。杨蕾[11]运用近红外光谱仪在780nm~2500nm范围内对烟叶的近红外光谱进行采集,并建立了最小二乘-判别分析模型,将该模型应用于霉变烟叶的预测,但该模型仅对霉变烟叶样品和正常烟叶样品进行判定,未考虑临近霉变的烟叶预判。
发明内容
本发明为克服现有的烟叶霉变检测模型仅对霉变烟叶样品和正常烟叶样品进行判定,未能对临近霉变的烟叶进行识别预判,提供一种基于小波变换-随机森林算法的烟叶霉变快速识别方法。
为解决上述技术问题,本发明的技术方案如下:
基于小波变换-随机森林算法的烟叶霉变快速识别方法,包括以下步骤:
S1:采集烟叶样本;
S2:分别采集各个烟叶样本的近红外光谱,作为各烟叶样本的光谱信息;
S3:利用离散小波变换对光谱信息进行预处理,求解得到小波系数;
S4:利用随机森林算法从小波系数中识别出烟叶的霉变程度,完成烟叶霉变的识别。
其中,所述步骤S2具体为:
S21:将采集到的烟叶样本分别装入样本杯中,分别采集各个烟叶样本的红外光谱数据,作为各烟叶样本的基础光谱信息;
S22:每个样本分别重复装样测定两次,计算其两次基础光谱信息的平均结果,作为该样本的光谱信息。
其中,所述步骤S3具体包括以下步骤:
S31:母小波的选择:分别考察Daubechies系列小波、Symlets系列小波以及Coiflets系列小波对霉变烟叶识别的正确率,选择正确率最高者作为母小波;
S32:确认母小波的分解水平:母小波对光谱信息进行一次水平分解后,得到一个细节系数向量和一个近似系数向量;近似系数向量继续分解得到下一级的细节系数向量和近似系数向量;通过确定母小波的分解水平,得到对应水平的近似系数以及所有分解水平的细节系数;
S33:将得到的近似系数以及所有分解水平的细节系数作为小波系数。
其中,在所述步骤S4所述的随机森林算法包括分类树数量k和分割节点的随机变量的数量m:其中,包含了k个分类树的算法建模具体为:
当实际分类树i从1变到k时,建立一个包含样本集X中三分之二数据量的自助法子集Xi;基于自助法子集Xi,在每个节点上随机选择m个预测变量,选择最优的随机变量进行节点分割分类;最后通过k个分类树反馈的信息进行信息的预测。
其中,通过10折交叉验证法验证m个预测变量所得到的识别正确率,选择识别正确率最高的作为最优的随机变量进行节点分割分类。
其中,所述的信息预测包括分类和回归,若为分类则利用k个分类树组合中的多数选票;否则计算平均值。
其中,样本集X中三分之一的数据量作为测试集,用于对识别算法的验证。
上述方案中,小波变换的实质是把信号分解为不同尺度和频率的小波子空间;根据波形或长度选择各种母小波使小波变换比其他信号预处理方法能够有效灵活地提取信号中的特征;通过小波变换,把信号分解成低频信号和高频信号,即近似系数和细节系数。
上述方案中,随机森林算法是一个包含许多决策树和投票策略的融合分类算法,其实通过自助法随机选择向量生长成为分类数,并且在生成树的时候,每个节点的变量都仅仅在随机选出的少数几个变量中产生;即变量和样本的使用都进行随机化,通过这种随机方式生成的大量的数被用于分类和回归分析。最终的决策树是通过潜在的随机向量树进行投票表决产生,即选择具有最多投票的“类”为对应样本的类别。
与现有技术相比,本发明技术方案的有益效果是:
本发明提供的基于小波变换-随机森林算法的烟叶霉变快速识别方法,通过用近红外光谱法建立了不同霉变程度烟叶样品的快速识别方法,为烟叶霉变的预警提供依据;采用小波变换处理光谱数据,确定光谱变量建立随机森林识别模型,识别率和预报率高,实现了对烟叶样品霉变程度的有效识别及准确预测。
附图说明
图1为本方法的流程示意图;
图2为复烤烟叶霉变过程中的原始近红外光谱图;
图3为原始近红外光谱图的离散小波变换示意图;
图4为小波系数的重构光谱示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,基于小波变换-随机森林算法的烟叶霉变快速识别方法,包括以下步骤:
S1:采集烟叶样本;
S2:分别采集各个烟叶样本的近红外光谱,作为各烟叶样本的光谱信息;
S3:利用离散小波变换对光谱信息进行预处理,求解得到小波系数;
S4:利用随机森林算法从小波系数中识别出烟叶的霉变程度,完成烟叶霉变的识别。
更具体的,所述步骤S2具体为:
S21:将采集到的烟叶样本分别装入样本杯中,分别采集各个烟叶样本的红外光谱数据,作为各烟叶样本的基础光谱信息;
S22:每个样本分别重复装样测定两次,计算其两次基础光谱信息的平均结果,作为该样本的光谱信息。
更具体的,所述步骤S3具体包括以下步骤:
S31:母小波的选择:分别考察Daubechies系列小波、Symlets系列小波以及Coiflets系列小波对霉变烟叶识别的正确率,选择正确率最高者作为母小波;
S32:确认母小波的分解水平:母小波对光谱信息进行一次水平分解后,得到一个细节系数向量和一个近似系数向量;近似系数向量继续分解得到下一级的细节系数向量和近似系数向量;通过确定母小波的分解水平,得到对应水平的近似系数以及所有分解水平的细节系数;
S33:将得到的近似系数以及所有分解水平的细节系数作为小波系数。
更具体的,在所述步骤S4所述的随机森林算法包括分类树数量k和分割节点的随机变量的数量m:其中,包含了k个分类树的算法建模具体为:
当实际分类树i从1变到k时,建立一个包含样本集X中三分之二数据量的自助法子集Xi;基于自助法子集Xi,在每个节点上随机选择m个预测变量,选择最优的随机变量进行节点分割分类;最后通过k个分类树反馈的信息进行信息的预测。
更具体的,通过10折交叉验证法验证m个预测变量所得到的识别正确率,选择识别正确率最高的作为最优的随机变量进行节点分割分类。
更具体的,所述的信息预测包括分类和回归,若为分类则利用k个分类树组合中的多数选票;否则计算平均值。
更具体的,样本集X中三分之一的数据量作为测试集,用于对识别算法的验证。
在具体实施过程中,小波变换的实质是把信号分解为不同尺度和频率的小波子空间;根据波形或长度选择各种母小波使小波变换比其他信号预处理方法能够有效灵活地提取信号中的特征;通过小波变换,把信号分解成低频信号和高频信号,即近似系数和细节系数。
在具体实施过程中,随机森林算法是一个包含许多决策树和投票策略的融合分类算法,其实通过自助法随机选择向量生长成为分类数,并且在生成树的时候,每个节点的变量都仅仅在随机选出的少数几个变量中产生;即变量和样本的使用都进行随机化,通过这种随机方式生成的大量的数被用于分类和回归分析。最终的决策树是通过潜在的随机向量树进行投票表决产生,即选择具有最多投票的“类”为对应样本的类别。
在具体实施过程中,通过用近红外光谱法建立了不同霉变程度烟叶样品的快速识别方法,为烟叶霉变的预警提供依据;采用小波变换处理光谱数据,确定光谱变量建立随机森林识别模型,识别率和预报率高,实现了对烟叶样品霉变程度的有效识别及准确预测。
实施例2
更具体的,在实施例1的基础上,对烟叶霉变样品进行制备。将复烤烟叶样品置于温度22±2℃,湿度60±5%环境下平衡48h,将平衡后的样品放入恒温恒湿箱,调节温、湿度分别为25℃和85%条件下进行烟叶霉变实验,以40天为周期,按照以下方式进行取样:第0天,即放入25℃和85%湿度条件的恒温恒湿箱之前,进行第1次采样;第3~9天,以3天为间隔,分别进行第2~4次采样;第11~25天,以2天为间隔,分别进行第5~12次采样。
在具体实施过程中,将116种单料烟分别在不同阶段进行了10次采样,获得了不同霉变程度的1160份烟叶样本;将1160份烟叶样本按照霉变程度分为三类,分别为未霉变样品,即霉菌计数<2×103CFU/g;临近霉变样品,即2×103 CFU/g≤霉菌计数<104CFU/g;霉变样品,即霉菌计数≥104CFU/g;其中,当霉菌数达到一定量,104CFU/g左右时,会开始快速增长。为了能够对烟叶霉变提前预警,需要对临近霉变的样品进行预判,因此以104CFU/g为临界点,判定“临近霉变”样品。
在具体实施过程中,霉变实验获得的三类样本情况具体为:第一类未霉变的正常样品548个;第二类临近霉变样品102个,眼观和鼻嗅无法辨出其与正常样品的区别;第三类霉变样品510个,具体如表1所示。
表1烟叶样品霉变程度分类
更具体的,如图2所示,采集1160份不同霉变程度的复烤烟叶样品的原始近红外光谱图。根据近红外光谱的原理,样品在近红外光谱吸收带是有机分子中含氢基团在中红外光谱区基频吸收的倍频、合频和差频吸收带叠加而成的。当烟草发生霉变时,样品内部的C源、N源等有机物质因被霉菌分解代谢而发生变化,同时会产生一些麦角甾醇、几丁质等与霉菌细胞壁组成有关的化学成分。因此,不同霉变程度的烟叶,其近红外光谱吸收带会随着样品内部化学成分的变化而产生变化。然而,一方面由于近红外光谱的严重重叠性,另一方面烟草霉变是一个复杂的过程,化学成分的变化也极其复杂,烟叶近红外光谱中的与霉变程度相关的信息很难直接提取出来并给予合理的光谱解析。从图2可以看到,烟叶样品的近红外光谱中与霉变相关的吸收带很难从图谱上直观判断。
因此,在具体实施过程中,采用离散小波变换DWT对霉变过程中的复烤烟叶原始近红外光谱进行分解。运用DWT处理近红外光谱时,有两个因素需要考察:母小波的选择和分解水平的确定,研究考察了15种母小波:5个Daubechies 系列小波,分别为db2,db4,db6,db8,db10;5个Symlets系列小波,分别为sym2, sym4,sym6,sym8,sym10以及5个Coiflets系列小波,分别为coif1,coif2,coif3, coif4,coif5对霉变烟叶识别正确率的影响。
在具体实施过程中,Daubechies系列小波得到的结果基本一样,但总体上要比其他两个类型的小波得到的预报结果更好,最终确定db6为母小波。在确定分解水平时,通常应考虑输入数据的维数N,一般不超过log2(N)。本方法中,近红外光谱有2074个数据点,因此选择11作为小波变换的分解水平,分解过程如图3所示。图中x为原始近红外光谱,包括2074个数据点,经每一水平的分解之后,会得到一个细节系数向量和一个近似系数向量;近似系数继续分解得到细节系数和近似系数,直到第11分解水平。最后用小波变换处理得到的向量包括每个样品的光谱信号在最后一个分解水平的近似系数ca和在所有分解水平的细节系数cd,如图3所示,得到ca11,cd11,cd10,...,cd1共12组小波系数。
更具体的,如图4所示,12组小波系数ca11,cd11,cd10,...,cd1的重构光谱 a11,d11,d10,...,d1。从图4可以看出,a11、d11等高阶信号主要反映了近红外光谱的低频基线信息,即光谱的骨架信息;d1、d2等低阶信号主要反映了近红外光谱的细节噪声信息。将不同霉变程度的烟叶样品近红外光谱一一分解为包含不同光谱信息的12组小波系数,为建立烟叶霉变程度识别模型时减少系统噪音、去除背景干扰提供了方向。分别以各个频率区的小波系数作为输入变量,建立烟叶霉变程度鉴别模型,将其中给出最高预报正确率的小波系数,作为最后的输入变量。
在具体实施过程中,为了比较不同模型的识别效果,将1160份样本分成训练集和测试集,约2/3样本作为训练集,1/3样本作为测试集。最终随机选择773 个样本作为训练集,其中包括365个未霉变的正常样品、68个临近霉变样品和 340个霉变样品;剩余的387个样品作为测试集。本文将未霉变的正常样品、临近霉变样品和霉变样品分别记为“1”类、“2”类和“3”类。对训练集和测试集的识别正确率分别以识别率和预报率表示。
在具体实施过程中,采用随机森林算法从烟叶近红外光谱的小波系数中识别烟叶的霉变程度。基于构建的训练集,对识别模型进行了构建。在该算法中,设置森林中决策树的数目为200、每一个节点随机选择特征的数目为默认值。采用 10折交叉验证方法考察模型的识别正确率,结果如表2所示。
表2基于不同小波系数的随机森林模型训练结果
在具体实施过程中,从表2可以看出,从cd1~cd11,ca11,变量数从1051~29 依次减少,其中具有较少变量数92的小波系数cd4构建的随机森林模型得到了最高的识别率:总识别率90.04%、未霉变样品的识别正确率90.68%、临近霉变样品的识别正确率80.88%、霉变样品的识别正确率93.24%,均高于其他小波系数的辨别能力。处于高频的系数,如cd1,cd2和cd3,变量数较多,识别率也较低,这是由于高频区的细节系数包含了大量的噪声信息。而处于低频的系数,包括高水平的细节系数和最后一个水平的近似系数,由于背景干扰或基线漂移比较严重,导致cd5,cd6,cd7,cd8,cd9和ca9构建的模型具有相对较低的识别率 (59.51~84.22%)。此外还考察了不同系数组合构建识别模型的效果,结果发现以[cd4,cd5]为输入变量构建的随机森林模型识别率最高:总识别率93.40%、未霉变样品的识别正确率93.42%、临近霉变样品的识别正确率91.17%、霉变样品的识别正确率93.82%.相比之下,以原始光谱为输入变量构建的识别模型,识别率最差:总识别率69.73%、未霉变样品的识别正确率73.15%、临近霉变样品的识别正确率30.88%、霉变样品的识别正确率73.82%.
因此,以[cd4,cd5]小波系数组合作为光谱变量建立的随机森林模型,对不同霉变程度烟叶的识别准确率高,说明中间频率系数[cd4,cd5]中包含了绝大部分与烟草霉变相关的信息,同时随机森林算法有效地利用了烟草发生霉变时小波系数[cd4,cd5]中蕴含的变化,在霉变程度与小波系数间建立了有效关联。与原始光谱相比,基于[cd4,cd5]小波系数的随机森林模型变量数目少,运行速度最快,无需进一步去噪或平滑等优点,能够同时解决近红外光谱分析中背景干扰强,光谱数据维数高,运行速度慢等问题。因此,最终选择具有较少背景和噪音干扰的中间频率系数,[cd4,cd5]组合,作为输入变量,构建烟叶霉变程度识别模型。
更具体的,将[cd4,cd5]作为光谱变量的随机森林模型用来对测试集样品的归属进行预报,预报率为预报结果如表3所示。
表3基于[cd4,cd5]的随机森林模型对测试集的预测结果
在具体实施过程中,从表3可以看到:183个未霉变样品中,175个被正确预报,正确率95.63%;34个临近霉变样品中,31个被正确预报,正确率91.18%; 170个未霉变样品中,161个被正确预报,正确率94.71%;测试集总预报正确率 94.84%。因此,本发明所述方案建立的模型可以有效识别不同霉变程度的烟叶样品。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
[1]孔凡玉,林建胜,张成省,等.储烟霉变机理与防霉技术研究进展[J].中国烟草学报,2009,15(5):78-81.
[2]张成省,王海滨,李更新,等.仓储片烟霉变的影响因素分析[J].中国烟草科学,2011,32(3):80-83.
[3]YCT 472—2013烟草及烟草制品霉菌计数微生物学检验法[S].
[4]戚大伟,林华清,沙云菲,等.气相色谱-质谱联用法测定烟草及烟草制品中的麦角甾醇[J].烟草科技,2013,49(5):56-65.
[5]Singh C B,Jayas,D S,Paliwal J,et al.Fungal damage detection inwheat using short-wave near-infrared hyperspectral and digital colour imaging[J]. International Journal of Food Properties,2012,15(1-2):11-24.
[6]Yao H B,Hruska Z,Kincaid R,et al.Detecting maize inoculated withtoxigenic and atoxigenic fungal strains with fluorescence hyperspectralimagery[J]. Biosystems Engineering.2013,115(2):125-135.
[7]黄星奕,丁然,史嘉辰.霉变出芽花生的近红外光谱无损检测研究.中国农业科技导报[J].2015,17(5):27-32.
[8]袁莹,王伟,褚璇,等.光谱特征波长的SPA选取和基于SVM的玉米颗粒霉变程度定性判别[J].光谱学与光谱分析,2016,36(1):226-230.
[9]马晓晨.近红外光谱无损检测霉变板栗的研究.硕士学位论文,北京林业大学,2016.
[10]周继月,杨盼盼,刘磊,等.基于近红外光谱分析技术结合化学计量学方法的初烤烟叶霉变预测研究.中国烟草学报,2018,24(1):6-13.
[11]杨蕾.环境对烟叶品质的影响分析及霉变预测方法研究,昆明理工大学,博士学位论文。

Claims (7)

1.基于小波变换-随机森林算法的烟叶霉变快速识别方法,其特征在于,包括以下步骤:
S1:采集烟叶样本;
S2:分别采集各个烟叶样本的近红外光谱,作为各烟叶样本的光谱信息;
S3:利用离散小波变换对光谱信息进行预处理,求解得到小波系数;
S4:利用随机森林算法从小波系数中识别出烟叶的霉变程度,完成烟叶霉变的识别。
2.根据权利要求1所述的基于小波变换-随机森林算法的烟叶霉变快速识别方法,其特征在于,所述步骤S2具体为:
S21:将采集到的烟叶样本分别装入样本杯中,分别采集各个烟叶样本的红外光谱数据,作为各烟叶样本的基础光谱信息;
S22:每个样本分别重复装样测定两次,计算其两次基础光谱信息的平均结果,作为该样本的光谱信息。
3.根据权利要求2所述的基于小波变换-随机森林算法的烟叶霉变快速识别方法,其特征在于,所述步骤S3具体包括以下步骤:
S31:母小波的选择:分别考察Daubechies系列小波、Symlets系列小波以及Coiflets系列小波对霉变烟叶识别的正确率,选择正确率最高者作为母小波;
S32:确认母小波的分解水平:母小波对光谱信息进行一次水平分解后,得到一个细节系数向量和一个近似系数向量;近似系数向量继续分解得到下一级的细节系数向量和近似系数向量;通过确定母小波的分解水平,得到对应水平的近似系数以及所有分解水平的细节系数;
S33:将得到的近似系数以及所有分解水平的细节系数作为小波系数。
4.根据权利要求3所述的基于小波变换-随机森林算法的烟叶霉变快速识别方法,其特征在于,在所述步骤S4所述的随机森林算法包括分类树数量k和分割节点的随机变量的数量m:其中,包含了k个分类树的算法建模具体为:
当实际分类树i从1变到k时,建立一个包含样本集X中三分之二数据量的自助法子集Xi;基于自助法子集Xi,在每个节点上随机选择m个预测变量,选择最优的随机变量进行节点分割分类;最后通过k个分类树反馈的信息进行信息的预测。
5.根据权利要求4所述的基于小波变换-随机森林算法的烟叶霉变快速识别方法,其特征在于,通过10折交叉验证法验证m个预测变量所得到的识别正确率,选择识别正确率最高的作为最优的随机变量进行节点分割分类。
6.根据权利要求4所述的基于小波变换-随机森林算法的烟叶霉变快速识别方法,其特征在于,所述的信息预测包括分类和回归,若为分类则利用k个分类树组合中的多数选票;否则计算平均值。
7.根据权利要求4所述的基于小波变换-随机森林算法的烟叶霉变快速识别方法,其特征在于:样本集X中三分之一的数据量作为测试集,用于对识别算法的验证。
CN201910579464.5A 2019-06-28 2019-06-28 基于小波变换-随机森林算法的烟叶霉变快速识别方法 Pending CN110363119A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910579464.5A CN110363119A (zh) 2019-06-28 2019-06-28 基于小波变换-随机森林算法的烟叶霉变快速识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910579464.5A CN110363119A (zh) 2019-06-28 2019-06-28 基于小波变换-随机森林算法的烟叶霉变快速识别方法

Publications (1)

Publication Number Publication Date
CN110363119A true CN110363119A (zh) 2019-10-22

Family

ID=68215993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910579464.5A Pending CN110363119A (zh) 2019-06-28 2019-06-28 基于小波变换-随机森林算法的烟叶霉变快速识别方法

Country Status (1)

Country Link
CN (1) CN110363119A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111562235A (zh) * 2020-05-18 2020-08-21 迟衡 基于近红外光谱快速鉴别烟叶黑暴病害及感染程度的方法
CN111982855A (zh) * 2020-08-12 2020-11-24 广东工业大学 一种通过光谱信号进行物质识别的方法及其应用
CN113447457A (zh) * 2021-01-22 2021-09-28 广东中烟工业有限责任公司 一种快速鉴别霉变烟草最优势霉菌种类的方法
CN115810125A (zh) * 2022-12-09 2023-03-17 北京远舢智能科技有限公司 一种基于彩色光谱的烟叶检测方法、装置、设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103674884A (zh) * 2012-09-17 2014-03-26 福建中烟工业有限责任公司 基于近红外光谱信息的烟叶风格特征的随机森林分类方法
CN106770194A (zh) * 2017-01-20 2017-05-31 华中科技大学 基于小波变换激光诱导击穿光谱的谷类作物产地鉴别方法
CN107330892A (zh) * 2017-07-24 2017-11-07 内蒙古工业大学 一种基于随机森林法的向日葵病害识别方法
CN108154065A (zh) * 2016-12-02 2018-06-12 光子瑞利科技(北京)有限公司 一种周界预警光纤振动信号采集与去噪的方法
US10140553B1 (en) * 2018-03-08 2018-11-27 Capital One Services, Llc Machine learning artificial intelligence system for identifying vehicles
CN109085282A (zh) * 2018-06-22 2018-12-25 东南大学 一种基于小波变换和随机森林模型的色谱重叠峰解析方法
CN109214365A (zh) * 2018-10-24 2019-01-15 李云涛 一种遍历随机森林空间目标分类识别方法
CN109870421A (zh) * 2019-03-27 2019-06-11 东北林业大学 一种基于可见光/近红外光谱分析的递增式木材树种分类识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103674884A (zh) * 2012-09-17 2014-03-26 福建中烟工业有限责任公司 基于近红外光谱信息的烟叶风格特征的随机森林分类方法
CN108154065A (zh) * 2016-12-02 2018-06-12 光子瑞利科技(北京)有限公司 一种周界预警光纤振动信号采集与去噪的方法
CN106770194A (zh) * 2017-01-20 2017-05-31 华中科技大学 基于小波变换激光诱导击穿光谱的谷类作物产地鉴别方法
CN107330892A (zh) * 2017-07-24 2017-11-07 内蒙古工业大学 一种基于随机森林法的向日葵病害识别方法
US10140553B1 (en) * 2018-03-08 2018-11-27 Capital One Services, Llc Machine learning artificial intelligence system for identifying vehicles
CN109085282A (zh) * 2018-06-22 2018-12-25 东南大学 一种基于小波变换和随机森林模型的色谱重叠峰解析方法
CN109214365A (zh) * 2018-10-24 2019-01-15 李云涛 一种遍历随机森林空间目标分类识别方法
CN109870421A (zh) * 2019-03-27 2019-06-11 东北林业大学 一种基于可见光/近红外光谱分析的递增式木材树种分类识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
蒋大鹏: "运用近红外光谱技术对松子霉变的快速检测", 《东北林业大学学报》 *
郑树泉 等: "《数字图像处理与分析第4版》", 31 January 2019, 北京航空航天大学出版社 *
阮敬: "《python数据分析基础 第2版》", 31 August 2018, 中国统计出版社 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111562235A (zh) * 2020-05-18 2020-08-21 迟衡 基于近红外光谱快速鉴别烟叶黑暴病害及感染程度的方法
CN111982855A (zh) * 2020-08-12 2020-11-24 广东工业大学 一种通过光谱信号进行物质识别的方法及其应用
CN113447457A (zh) * 2021-01-22 2021-09-28 广东中烟工业有限责任公司 一种快速鉴别霉变烟草最优势霉菌种类的方法
CN115810125A (zh) * 2022-12-09 2023-03-17 北京远舢智能科技有限公司 一种基于彩色光谱的烟叶检测方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN110363119A (zh) 基于小波变换-随机森林算法的烟叶霉变快速识别方法
Zhang et al. Rapid determination of leaf water content using VIS/NIR spectroscopy analysis with wavelength selection
CN101881726B (zh) 植物幼苗综合性状活体无损检测方法
Ramoelo et al. Water-removed spectra increase the retrieval accuracy when estimating savanna grass nitrogen and phosphorus concentrations
Wang et al. Wavelet-based coupling of leaf and canopy reflectance spectra to improve the estimation accuracy of foliar nitrogen concentration
CN101915744A (zh) 物质成分含量的近红外光谱无损检测方法及装置
Martín-Tornero et al. Comparative quantification of chlorophyll and polyphenol levels in grapevine leaves sampled from different geographical locations
CN105486655A (zh) 基于红外光谱智能鉴定模型的土壤有机质快速检测方法
Huang et al. Assimilating remotely sensed information with the wheatgrow model based on the ensemble square root filter for improving regional wheat yield forecasts
CN106033052A (zh) 一种基于高光谱数据敏感波段的植被信息提取方法
Wen et al. Estimation of the vertically integrated leaf nitrogen content in maize using canopy hyperspectral red edge parameters
Tigabu et al. Rapid and non-destructive evaluation of seed quality of Chinese fir by near infrared spectroscopy and multivariate discriminant analysis
CN102937575B (zh) 一种基于二次光谱重组的西瓜糖度快速建模方法
CN106950186A (zh) 基于光纤光谱的土鸡蛋或洋鸡蛋品种检测装置及其方法
CN115479902A (zh) 基于波长的叶绿素含量测定模型构建方法及其系统
CN103822899A (zh) 基于太赫兹时域光谱检测小麦粉中害虫碎片的方法
CN104255118A (zh) 基于近红外光谱技术的水稻种子发芽率快速无损测试方法
CN112926625B (zh) 一种卫星辐射数据的偏差影响因子分析方法
CN107247033B (zh) 基于快速衰减式淘汰算法和plsda鉴别黄花梨成熟度的方法
Liu et al. Estimation of chlorophyll content in maize canopy using wavelet denoising and SVR method
CN108007917B (zh) 希尔伯特法建立稻株中氮素含量拉曼光谱测量模型方法
Li et al. Spectrometric prediction of nitrogen content in different tissues of slash pine trees
Wang et al. Monitoring model for predicting maize grain moisture at the filling stage using NIRS and a small sample size
CN111650130A (zh) 一种荔枝叶片镁含量的预测方法及预测系统
CN107169161A (zh) 分段直接矫正及斜率和截距修正的土壤养分模型转移方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Lai Yanhua

Inventor after: Tao Hong

Inventor after: Lin Yun

Inventor after: Wang Yu

Inventor after: Zhou Rong

Inventor after: OuYang Lusi

Inventor after: Lin Baomin

Inventor before: Lai Yanhua

Inventor before: Tao Hong

Inventor before: Lin Yun

Inventor before: Wang Yu

Inventor before: Zhou Rong

Inventor before: OuYang Lusi

Inventor before: Lin Baomin

CB03 Change of inventor or designer information
RJ01 Rejection of invention patent application after publication

Application publication date: 20191022

RJ01 Rejection of invention patent application after publication