CN116662751A - 一种基于主成分分析与杠杆值法剔除异常样本的烟叶含水率检测方法 - Google Patents
一种基于主成分分析与杠杆值法剔除异常样本的烟叶含水率检测方法 Download PDFInfo
- Publication number
- CN116662751A CN116662751A CN202310538027.5A CN202310538027A CN116662751A CN 116662751 A CN116662751 A CN 116662751A CN 202310538027 A CN202310538027 A CN 202310538027A CN 116662751 A CN116662751 A CN 116662751A
- Authority
- CN
- China
- Prior art keywords
- moisture content
- model
- tobacco
- data
- principal component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 160
- 235000002637 Nicotiana tabacum Nutrition 0.000 title claims abstract description 101
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 46
- 238000000513 principal component analysis Methods 0.000 title claims abstract description 37
- 238000001514 detection method Methods 0.000 title claims abstract description 21
- 244000061176 Nicotiana tabacum Species 0.000 title description 2
- 241000208125 Nicotiana Species 0.000 claims abstract description 99
- 238000002203 pretreatment Methods 0.000 claims abstract description 45
- 230000008569 process Effects 0.000 claims abstract description 22
- 238000005516 engineering process Methods 0.000 claims abstract description 13
- 230000003595 spectral effect Effects 0.000 claims abstract description 13
- 238000000701 chemical imaging Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000001228 spectrum Methods 0.000 claims description 24
- 238000009499 grossing Methods 0.000 claims description 22
- 238000012937 correction Methods 0.000 claims description 20
- 238000004458 analytical method Methods 0.000 claims description 14
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000010238 partial least squares regression Methods 0.000 claims description 7
- 238000000611 regression analysis Methods 0.000 claims description 5
- 238000012847 principal component analysis method Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 230000008030 elimination Effects 0.000 claims 1
- 238000003379 elimination reaction Methods 0.000 claims 1
- 239000012535 impurity Substances 0.000 claims 1
- 238000009659 non-destructive testing Methods 0.000 claims 1
- 238000005259 measurement Methods 0.000 abstract 1
- 230000003750 conditioning effect Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 8
- 235000019504 cigarettes Nutrition 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- SNICXCGAKADSCV-JTQLQIEISA-N (-)-Nicotine Chemical compound CN1CCC[C@H]1C1=CC=CN=C1 SNICXCGAKADSCV-JTQLQIEISA-N 0.000 description 1
- 238000003109 Karl Fischer titration Methods 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000002932 luster Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229960002715 nicotine Drugs 0.000 description 1
- SNICXCGAKADSCV-UHFFFAOYSA-N nicotine Natural products CN1CCCC1C1=CC=CN=C1 SNICXCGAKADSCV-UHFFFAOYSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3554—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for determining moisture content
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Manufacture Of Tobacco Products (AREA)
Abstract
本发明提供一种基于主成分分析与杠杆值法剔除异常样本的烟叶含水率检测方法,其方法包括:使用高光谱成像技术采集不同工序中的烟叶样本图像,获取关于不同工序的烟叶含水率的光谱数据,然后根据7种组合式的预处理方法对采集的烟叶光谱数据进行处理,与现场红外测量得到的烟叶含水率数据进行预测模型的拟合,根据预处理所建立的预测模型,选出三种最佳预处理方法建立的模型,对三种预处理建立的模型基于主成分分析与杠杆值法剔除数据中的异常样本,将剔除异常样本后的数据建立新的烟叶含水率预测模型,可以分析相关系数得到模型精度变高。故主成分分析与杠杆值法剔除异常样本可以在检测过程中提高模型精度,使得检测烟叶含水率更加精准。
Description
技术领域
本申请设计一种基于主成分分析与杠杆值法剔除异常样本的烟叶含水率检测方法。
背景技术
烟厂制丝加工工序的烟叶含水率检测是重要工艺指标,其过程稳定性对后续各工序工艺指标有着直接的影响。目前,在烟草制丝加工中,不同工序中烟叶含水率波动将会影响烟叶的颜色、光泽以及柔韧性,进而影响后续卷包机械能否顺利进行,烟叶含水率的变化也影响成品卷烟的燃吸品质、卷烟烟气和烟碱含量。因此对于精准控制加工过程中烟叶含水率对后续加工也是至关重要的。
烟草行业初步实现了工业现场的高度自动化,但距离实现智慧化工厂建设要求,还存在诸多薄弱环节和亟待解决的瓶颈问题。目前国内外对烟叶含水率检测多为近红外水分仪、烘箱法、卡尔费休滴定法等离线检测方法,卷烟生产过程的工序和制丝环节等检测烟叶含水率也常用以上方法检测。但是这些方法在检测过程中,要破坏烟叶样本,时间长,效率低,应用红外水分仪也只是检测到烟叶表层的水分含量,不均匀,以上均不能实现在线无损检测,因此不能得到实时样本水分信息,无法实现智能调控。
高光谱成像技术是通过采集样本图像,分析图谱数据,得出被测样本外部物理结构和内部化学成分的差别,是一种快速、无损的检测方法。与传统的含水率检测方法比较,高光谱成像技术检测含水率是将样本的图像与光谱相结合的三维信息获取含水率的综合检测方法,其操作更加便利并且能精准无损的分析数据。近年来,国内外对高光谱成像技术在农产品、植物作物的各种成分以及对肉品品质的无损检测领域发展已成为热门技术。目前对于烟叶含水率的检测,使用高光谱成像技术的相关研究未见报到。以各工序中烟叶为研究对象,应用高光谱成像技术对烟叶图像进行采集,得到原始光谱数据,进行一下主要技术步骤:
1.在采集样本的图谱数据时,会存在环境、仪器、人工操作及样本自身等影响产生的大量噪声和干扰信息,导致光谱曲线会出现散射、高频随机噪声和漂移等。对采集的各工序中的原始光谱数据使用7种组合的预处理方法对原始光谱数据进行分析,对采集的光谱数据进行噪声和干扰信息的处理。
2.主成分分析结合杠杆值法对异常样本进行剔除可以使得模型精度变高。主成分分析法就是将样本数据降维成新的主成分,用以消除众多信息中的重叠信息,每一个主成分都是由原始收据的线性组合。杠杆值法是高杠杆点样本异常最常见的存在方式之一,显著影响回归分析的结果。因此根据主成分分析法的烟叶得分图,计算烟叶样本的高杠杆值界限,然后将其与杠杆值进行比较,并剔除异常样本,提高模型精度。
3.偏最小二乘回归分析法建立的烟叶含水率预测模型。是经过7种组合预处理之后,基于主成分分析与杠杆值法剔除异常值后新的PLSR预测模型。PLSR偏最小二乘回归分析是一种多元统计数据分析方法。在PLSR模型中,对模型的效果有明显影响的是主因子数,因此选择最适合的主因子数使模型达到效果最优。在分析光谱时,一般选择交互验证法,通过建立各工序中烟叶含水率的PLSR预测模型,根据模型的评价系数来判断模型的精度。
发明内容
鉴于上述,本发明旨在提供一种基于主成分分析与杠杆值法剔除异常样本烟叶含水率检测方法,已解决前述提出的技术问题。
本发明采用的技术方案如下:
本发明提供了一种基于主成分分析与杠杆值法剔除异常样本烟叶含水率检测方法,其中包括:
使用高光谱成像技术对不同工序中的烟叶进行图谱采集;
高光谱的光谱数据采集范围:400-1000nm,光谱分辨率:2.8nm;
采集现场不同工序中的烟叶,并获得现场红外测量烟叶含水率的数据;
对采集到的不同工序中的烟叶图谱数据进行处理分析;
利用3种预处理方法对所述烟叶图谱相关变量进行处理;
3种预处理方法分别为:卷积平滑法、去趋势、多元散射校正;
卷积平滑法,消除数据噪声的方法,通过多项式来对移动窗口内的数据进行多项式最小二乘拟合,从而达到平滑的目的;
去趋势法,适用于消除漫反射光谱的基线漂移;
多元散射校正,用于消除固体颗粒大小,表面散射及光程变化所带来的光谱误差;
根据3种预处理方法及组合形成共7种组合预处理方法:
7种组合预处理方法:卷积平滑法、去趋势、多元散射校正、卷积平滑法+去趋势、卷积平滑法+多元散射校正、去趋势+多元散射校正、卷积平滑法+去趋势+多元散射校正;
将使用7种组合预处理方法分析之后的图谱数据作为原始数据;
使用偏最小二乘回归分析法建立7种组合预处理方法的烟叶含水率预测模型;
根据建立的7个不同预处理方法烟叶含水率模型,通过比较相关系数,选择3种最佳预处理方法或组合预处理方法;
利用主成分分析结合杠杆值法对3种最佳预处理方法得到的数据进行异常样本的剔除;
根据主成分分析法得到主成分的不同,会产生不同的得分矩阵数据,经过计算不同的主成分得分,可以对得分值的大小设定阈值,根据阈值判断样本是否为异常;
杠杆值法是计算帽子点的帽子统计量,当帽子统计量是均值的2或3倍时,通常被确定为高杠杆值点。高杠杆值点也就是异常样本点。
使用偏最小二乘回归分析法建模方法对已经剔除异常样本的数据进行新的烟叶含水率预测模型的建立;
基于上述建立的三种最优预处理方法并剔除异常样本的预测模型,根据比较相关系数得出最优模型;
最优模型组合是:去趋势法经过主成分分析与杠杆值法剔除异常值建立的模型;
根据最优模型,得到PLSR对所述的烟叶含水率的预测模型;
在其中至少一种可能实现的方法中,所述采集现场数据包括获取实际测量的烟叶含水率和采集的预测值;
在其中至少一种可能实现的方法中,所述根据主成分分析与杠杆值法剔除烟叶含水率模型中的异常样本,并建立新的烟叶含水率预测模型,实现对烟叶含水率的检测利用快速无损的分析方法。
综上所述,本发明的主要设计构思在于,基于主成分分析与杠杆值法剔除异常样本烟叶含水率检测方法,对于采集的大量图谱数据使用主成分分析进行降维处理,便于从错综复杂的数据信息中找到烟叶含水率的关键要素,从而能够更加有效地利用大量统计数据进行定量分析,并可以更好地进行回归或可视化等后续处理。具体地,通过使用高光谱成像技术采集的预测烟叶含水率的图谱相关变量与实际红外检测的烟叶含水率进行预测模型的建立,经过不同的预处理方法对光谱数据进行分析,结合PCA算法对光谱相关变量进行处理得到主要成分,根据主要成分的得分图,设定阈值,结合杠杆值法确定光谱数据中的异常样本并剔除,再利用偏最小二乘回归分析法构建各工序的烟叶含水率预测模型,利用所述烟叶含水率预测模型与实时含水率进行拟合,可以得到最佳烟叶含水率的预测模型。本发明在使用高光谱成像仪下采集到的现场数据集更易使用、有效,并且使用几种预处理方法去除数据噪声、暗电流噪声,使得烟叶在过程中的含水率得到了精准的实时预测,有效保障了烟叶的生产合格率,减少原料浪费,节约企业成本。为开发实时监测装备和智慧化工厂建设提供理论和数据支撑。
附图说明
为使本发明的目的、技术检测方法和优势更加突出,下面将结合附图对本发明作进一步描述,其中:
图1为本发明实施例提供的基于主成分分析与杠杆值法剔除异常样本烟叶含水率检测方法流程图;
图2为加料回潮工序中烟叶原始数据图;
具体实施方式
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本发明提出了一种基于主成分分析与杠杆值法剔除异常样本烟叶含水率检测方法在加料回潮工序中对烟叶的含水率进行预测模型的建立实施例,具体来说,如图1所示,其中包括:
步骤S1、使用高光谱成像仪现场采集加料回潮工序中烟叶的图谱数据,并且收集利用红外水分仪测得烟叶含水率的实时数据;
取样,随机选取生产过程中的加料回潮工序的烟叶,每批次选取5次,每次采集间隔10min;
对在加料回潮工序中所取的样本使用高光谱成像仪连续进行图谱采集,采集150份图谱;
高光谱成像仪的光谱数据采集范围:400-1000nm,光谱分辨率为:2.8nm;
在使用相机采集过程中,会产生暗电流,属于相机内部的电子噪声,会影响光谱数据;
为消除暗电流带来的影响,使用黑白背景进行校准;
对采集的高光谱图像数据进行镜头校准和反射率的校准,使用背景和白板进行校准;
对于上述图像进行校准的公式为:
其中,R为校准后光谱图像文件,R0为原始光谱图像文件,RD为盖上镜头得到的黑板图像,RW为光源完全不受遮挡进入镜头得到的白板图像;
高光谱成像仪采集得到的加料回潮工序种烟叶的图像经过ENVI图像处理软件中处理,得到均值光谱数据作为烟叶含水率预测的原始数据;
步骤S2,预处理方法的使用
对于采集的加料回潮工序的烟叶样本图谱数据,存在环境、人工操作不当等对光谱产生噪声等影响;
光谱曲线会出现散射和基线漂移等现象,需要使用预处理方法解决这些影响;
为消除以上影响,使用三种不同的预处理方法及组合预处理方法,可以对加料回潮工序中烟叶高光谱数据进行平滑、降噪等;
3种预处理方法分别为:卷积平滑法、去趋势法、多元散射校正法;
4种组合的预处理方法为:卷积平滑法+去趋势法、卷积平滑法+多元散射校正法、去趋势法+多元散射校正法、卷积平滑法+去趋势法+多元散射校正法;
基于上述的7种预处理方法对原始数据进行处理后,建立PLSR模型,根据模型的相关系数,选择最优的三种预处理方法;
不同预处理方法的加料回潮工序烟叶含水率PLSR模型,结果见表1:
基于表1所示结果:几种预处理方法中,根据相关系数R2的相关数值,可以选择三种相对较好的预处理方法;
决定系数R2值越大,越靠近1,均方根误差RMSE越小,模型准确性越高;
根据表1结果显示三种较好的预处理方法为:去趋势法、卷积平滑法+多元散射校正法、卷积平滑法+去趋势法+多元散射校正法;
步骤S3,利用主成分分析与杠杆值法对3种最佳预处理方法建立的烟叶含水率预测模型进行异常样本的剔除;
主成分分析法,将样本集光谱数据压缩成少数几个新的变量,而每一个主成分都是原变量的线性组合。
杠杆值法,高杠杆点样本是异常样本最常见的存在方式之一,强烈影响回归分析的结果。
H=Xsp(XspTXsp)-1XspT;
Xsp是光谱特征;hii是第i个主对角元素;
利用hii>2p/n计算各样本的高杠杆值点;
p是自变量个数,n是样本个数;
高杠杆值点被认为是异常样本会进行剔除;
根据主成分分析法得到的主成分得分值,根据得分值的大小设定阈值,杠杆值法可以根据高于均值的2或3倍的杠杆点视为高杠杆值点,通过主成分分析与杠杆值法对异常样本进行确定,剔除异常样本;
使用主成分分析与杠杆值法对3种最佳预处理方法进行异常样本的剔除,并对剔除异常样本后的数据再次进行偏最小二乘回归分析的模型建立;
3种最佳预处理方法经过主成分分析与杠杆值法剔除异常样本后PLSR模型,结果见表2:
基于表2可得,3种最佳预处理方法经过使用主成分分析与杠杆值法剔除异常样本后,加料回潮工序烟叶含水率的模型精度都会升高;
去趋势法经过主成分分析与杠杆值法剔除1个异常值,R2从0.973增加到0.992,模型精度提高;
卷积平滑法+多元散射校正法经过主成分分析与杠杆值法剔除5个异常值,R2从0.985增加到0.991,模型精度提高;
卷积平滑法+多元散射校正法+去趋势法经过主成分分析与杠杆值法没有剔除异常值,说明这种组合式的预处理方法建模之后,加料回潮工序烟叶含水率模型效果已经达到最优;
综上所述,对于3种最佳预处理方法经过主成分分析与杠杆值法剔除异常样本后建立的模型,根据相关系数R2比较得到使用去趋势这种预处理方法得到的加料回潮工序烟叶含水率预测模型最优;
最优预处理方法建立的PLSR模型是:去趋势法经过主成分分析与杠杆值法剔除异常样本建立的加料回潮工序烟叶含水率模型;
进一步地,根据最优模型可以得到结果:实际红外测量烟叶含水率与高光谱成像技术采集的加料回潮工序中烟叶图像,根据采集到的烟叶光谱数据与实际测量烟叶含水率数据拟合建立模型;
进一步地,根据建立的加料回潮工序中烟叶含水率模型,对模型精度需要提高,使用主成分分析与杠杆值法通过剔除异常样本进行;
进一步地,加料回潮工序中烟叶含水率模型精度高说明两种方法测量的烟叶含水率比较相近,一般情况烟厂使用红外检测烟叶含水率较为常见;
进一步地,对于使用高光谱成像仪对烟叶含水率检测最为一种新型检测烟叶含水率的方法,根据所建立的加料回潮工序中烟叶含水率模型精度的分析,高光谱成像仪也可以作为检测烟叶含水率的方法;
以上依据图式所示的实施例详细说明了本发明的构造、特征及作用效果,但以上仅为本发明的较佳实施例,需要言明的是,上述实施例及其优选方式所涉及的技术特征,本领域技术人员可以在不脱离、不改变本发明的设计思路以及技术效果的前提下,合理地组合搭配成多种等效方案;因此,本发明不以图面所示限定实施范围,凡是依照本发明的构想所做的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本发明的保护范围内。
Claims (8)
1.一种基于主成分分析与杠杆值法剔除异常样本的烟叶含水率检测方法,其特征在于,包括:对采集的高光谱数据进行预处理建模,利用主成分分析与杠杆值法剔除对模型有影响的异常样本,获得更加准确的烟叶含水率预测模型。
S1.采用高光谱成像技术对不同工序中的烟叶进行现场采样,获得烟叶样本的高光谱数据;
S2.采用3种预处理方法对所述含水率相关变量进行处理,将预处理之后的光谱数据作为原始数据;
S2.1.基于3种预处理方法以及通过组合形成4种组合预处理方法,共7种组合预处理方法;
S2.2. 7种组合预处理方法:卷积平滑法、去趋势、多元散射校正、卷积平滑法+去趋势、卷积平滑法+多元散射校正、去趋势+多元散射校正、卷积平滑法+去趋势+多元散射校正;
S3.烟厂使用的烟叶含水率检测方法是红外检测仪,并且实时获取各个工序上烟叶含水率的数据;
S3.采用偏最小二乘回归分析法对7种组合预处理方法得到的原始数据与现场红外测量的烟叶含水率数据集进行模型建立,并根据模型相关系数选择最优的3种预处理方法;
S4.利用主成分分析结合杠杆值法对最优的3种预处理方法的数据进行异常样本剔除;
S5.使用偏最小二乘回归分析法对已剔除异常样本后的3种预处理方法数据进行烟叶含水率新模型的建立;
S6.基于上述建立的3种剔除异常样本后的烟叶含水率预测新模型,根据模型的相关系数分析得出最优PLSR预测模型;
S7.根据最优PLSR预测模型可对烟叶含水率进行准确预测,并进一步地说明使用主成分分析与杠杆值法剔除异常样本可使模型精度更加准确。
2.根据权利要求1所述的基于高光谱成像技术的烟叶含水率的无损检测方法,其特征在于,所述高光谱的光谱数据采集范围:400-1000nm,光谱分辨率:2.8nm。
3.根据权利要求1所述的基于高光谱数据,使用3种不同预处理方法对高光谱数据进行处理分析,其特征在于,所述3种预处理方法可以对采集的高光谱数据进行平滑、降噪等处理。
4.根据权利要求1所述的使用主成分分析法结合杠杆值法对光谱数据中存在的影响模型精度的异常样本进行剔除。
5.根据权利要求1所述在基于使用最优预处理方法后和主成分分析与杠杆值法剔除异常样本后,使用偏最小二乘回归分析法建立烟叶含水率光谱的预测模型,其特征在于,3种组合预处理方法得到的全波段光谱,是经过除杂、去噪等的光谱数据,使用主成分分析与杠杆值法对预测模型中存在的异常样本进行剔除,使用偏最小二乘回归分析法建立模型,分析相关系数可以得出使用以上方法会使模型精度更好。
6.根据权利要求5所述的使用偏最小二乘回归分析法建立烟叶含水率模型,得到3种预处理方法的最优组合,并建立烟叶含水率的模型,根据模型相关系数对比,其特征在于,选择3种最优预处理方法是:去趋势法、卷积平滑法+多元散射校正法、卷积平滑法+去趋势法+多元散射校正法。
7.根据权利要求5所述基于最优预处理方法建立的烟叶含水率PLSR模型,具体为:经过去趋势预处理方法在基于使用主成分分析与杠杆值法剔除检测烟叶含水率工序中的异常值并建立模型。
8.根据权利要求1-7任一项所述的基于主成分分析与杠杆值剔除异常值的检测方法,其特征在于,所述的关于使用高光谱成像技术对烟叶样本进行含水率预测,使用主成分分析与杠杆值法剔除异常样本,可以使得烟叶含水率模型精度提高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310538027.5A CN116662751A (zh) | 2023-05-12 | 2023-05-12 | 一种基于主成分分析与杠杆值法剔除异常样本的烟叶含水率检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310538027.5A CN116662751A (zh) | 2023-05-12 | 2023-05-12 | 一种基于主成分分析与杠杆值法剔除异常样本的烟叶含水率检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116662751A true CN116662751A (zh) | 2023-08-29 |
Family
ID=87727123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310538027.5A Pending CN116662751A (zh) | 2023-05-12 | 2023-05-12 | 一种基于主成分分析与杠杆值法剔除异常样本的烟叶含水率检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116662751A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117093841A (zh) * | 2023-10-18 | 2023-11-21 | 中国科学院合肥物质科学研究院 | 小麦透射光谱的异常光谱筛选模型确定方法、装置及介质 |
-
2023
- 2023-05-12 CN CN202310538027.5A patent/CN116662751A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117093841A (zh) * | 2023-10-18 | 2023-11-21 | 中国科学院合肥物质科学研究院 | 小麦透射光谱的异常光谱筛选模型确定方法、装置及介质 |
CN117093841B (zh) * | 2023-10-18 | 2024-02-09 | 中国科学院合肥物质科学研究院 | 小麦透射光谱的异常光谱筛选模型确定方法、装置及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10317280B2 (en) | Method for correcting measuring-point-free temperature compensation model during online application of near infrared spectrum analyzer | |
WO2018010352A1 (zh) | 一种定性定量相结合的近红外定量模型构建方法 | |
SE503101C2 (sv) | Sätt att bestämma våtstyrkan hos papper och medel för processkontroll genom användning av sättet | |
Li et al. | Wavelength selection method for near-infrared spectroscopy based on standard-sample calibration transfer of mango and apple | |
CN116662751A (zh) | 一种基于主成分分析与杠杆值法剔除异常样本的烟叶含水率检测方法 | |
CN106053383A (zh) | 一种烟草加工过程中的近红外在线检测方法 | |
CN114088661A (zh) | 一种基于迁移学习和近红外光谱的烟叶烘烤过程化学成分在线预测方法 | |
CN104596979A (zh) | 近红外漫反射光谱技术测定造纸法再造烟叶纤维素的方法 | |
WO2020248961A1 (zh) | 一种无参考值的光谱波数选择方法 | |
CN104596975A (zh) | 近红外漫反射光谱技术测定造纸法再造烟叶木质素的方法 | |
CN109283153B (zh) | 一种酱油定量分析模型的建立方法 | |
CN111445469A (zh) | 一种基于高光谱的苹果冲击后损伤参数的无损预测方法 | |
CN110567894A (zh) | 一种含水溶液pH值快速检测方法和检测装置 | |
CN110672578A (zh) | 针对煎炸油极性组分检测的模型通用性及稳定性验证方法 | |
CN111366573B (zh) | 基于libs光谱成分分析结果的评价方法 | |
CN116026780B (zh) | 基于串联策略波长选择的包衣吸湿率在线检测方法及系统 | |
CN110186870B (zh) | 一种极限学习机光谱模型判别恩施玉露茶鲜叶产地的方法 | |
CN110632024B (zh) | 一种基于红外光谱的定量分析方法、装置、设备以及存储介质 | |
Chen et al. | Main inorganic component measurement of seawater using near-infrared spectroscopy | |
CN113984708A (zh) | 一种化学指标检测模型的维护方法和装置 | |
CN112649390A (zh) | 一种基于近红外光谱的粘合剂水分含量监测方法 | |
CN112861411A (zh) | 基于近红外光谱主成分和神经网络的生物质钠含量测量与建模方法 | |
CN114184576B (zh) | 一种基于分子光谱流程工业在线测量方法及系统 | |
CN118334650B (zh) | 用于粮食水分检测的建模方法、系统和设备 | |
LU504513B1 (en) | Multi-spectral state detection method for electrical equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |