CN117558361A - 用于烟叶物质成分分析的光谱分析模型的构建方法及应用 - Google Patents
用于烟叶物质成分分析的光谱分析模型的构建方法及应用 Download PDFInfo
- Publication number
- CN117558361A CN117558361A CN202311576296.7A CN202311576296A CN117558361A CN 117558361 A CN117558361 A CN 117558361A CN 202311576296 A CN202311576296 A CN 202311576296A CN 117558361 A CN117558361 A CN 117558361A
- Authority
- CN
- China
- Prior art keywords
- model
- spectrum
- data
- analysis
- analysis model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000002637 Nicotiana tabacum Nutrition 0.000 title claims abstract description 74
- 241000208125 Nicotiana Species 0.000 title claims abstract description 70
- 238000010183 spectrum analysis Methods 0.000 title claims abstract description 62
- 239000000463 material Substances 0.000 title claims abstract description 21
- 238000010276 construction Methods 0.000 title claims abstract description 18
- 238000000034 method Methods 0.000 claims abstract description 52
- 238000001228 spectrum Methods 0.000 claims abstract description 50
- 230000003595 spectral effect Effects 0.000 claims abstract description 37
- 238000004458 analytical method Methods 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 238000012067 mathematical method Methods 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 21
- 238000003860 storage Methods 0.000 claims description 17
- 239000000126 substance Substances 0.000 claims description 16
- 238000011156 evaluation Methods 0.000 claims description 15
- 238000012417 linear regression Methods 0.000 claims description 10
- 238000009499 grossing Methods 0.000 claims description 9
- 238000010801 machine learning Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000002790 cross-validation Methods 0.000 claims description 6
- 238000010187 selection method Methods 0.000 claims description 5
- 238000004611 spectroscopical analysis Methods 0.000 claims description 5
- 238000012706 support-vector machine Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 4
- 239000000470 constituent Substances 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 claims description 4
- 238000007637 random forest analysis Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000013441 quality evaluation Methods 0.000 abstract description 10
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 244000061176 Nicotiana tabacum Species 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000002835 absorbance Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000011897 real-time detection Methods 0.000 description 2
- SNICXCGAKADSCV-JTQLQIEISA-N (-)-Nicotine Chemical compound CN1CCC[C@H]1C1=CC=CN=C1 SNICXCGAKADSCV-JTQLQIEISA-N 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 229930002875 chlorophyll Natural products 0.000 description 1
- 235000019804 chlorophyll Nutrition 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 229960002715 nicotine Drugs 0.000 description 1
- SNICXCGAKADSCV-UHFFFAOYSA-N nicotine Natural products CN1CCCC1C1=CC=CN=C1 SNICXCGAKADSCV-UHFFFAOYSA-N 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012306 spectroscopic technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Biochemistry (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Immunology (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Crystallography & Structural Chemistry (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Analytical Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本申请实施例公开了一种用于烟叶物质成分分析的光谱分析模型的构建方法及应用,其中用于烟叶物质成分分析的光谱分析模型的构建方法包括:步骤1)获取通过光谱设备得到的样本的光谱数据;步骤2)对获取的所述光谱数据进行预处理;步骤3)对预处理后的所述光谱数据进行特征提取,提取出与所述样本的特征相关的光谱数据;步骤4)将提取的特征作为输入变量,所述样品的已知性质作为输出变量,通过数学方法构建模型,并利用特征提取后的光谱数据对模型进行训练,最终得到所述光谱分析模型。以解决现有技术中的烟叶质量评价手段存在对烟叶质量评价滞后、不全面、不统一的问题。
Description
技术领域
本申请涉及光谱分析技术领域,具体涉及一种用于烟叶物质成分分析的光谱分析模型的构建方法及应用。
背景技术
传统烟叶质量评价手段主要是以经验主义为主的人工判别模式,先进一点的会利用烟叶化学成分的实验室检测,但目前这种技术手段依然存在对烟叶质量评价滞后、不全面、不统一的实际问题。
发明内容
本申请的目的在于提供一种用于烟叶物质成分分析的光谱分析模型的构建方法及应用,用以解决现有技术中的烟叶质量评价手段存在对烟叶质量评价滞后、不全面、不统一的问题。
为实现上述目的,本申请实施例提供一种用于烟叶物质成分分析的光谱分析模型的构建方法,包括以下步骤:步骤1)获取通过光谱设备得到的样本的光谱数据;
步骤2)对获取的所述光谱数据进行预处理;
步骤3)对预处理后的所述光谱数据进行特征提取,提取出与所述样本的特征相关的光谱数据;
步骤4)将提取的特征作为输入变量,所述样品的已知性质作为输出变量,通过数学方法构建模型,并利用特征提取后的光谱数据对模型进行训练,最终得到所述光谱分析模型。
可选地,所述步骤2)具体包括:
对所述光谱数据进行数据清洗,具体包括:删除数据集中的重复数据记录,通过删除、替换或使用插值方法处理数据集中的缺失值和异常值,检查并纠正数据集中的错误值;
对所述光谱数据进行平滑处理。
可选地,在所述步骤4)中,所述通过数学方法构建模型,包括:
基于机器学习中的监督学习模型进行模型构建,所构建的光谱分析模型为线性回归模型或支持向量机模型或随机森林模型或神经网络模型。
可选地,所构建的光谱分析模型为线性回归模型,所述通过数学方法构建模型,包括:
对所述光谱数据进行特征选择或者降维处理,得到存在线性关系的光谱数据;
利用最小二乘法估计得到存在线性关系的光谱数据对应的最佳拟合线的参数,基于所述最佳拟合线构建光谱分析模型。
可选地,在所述步骤4)中,所述利用特征提取后的光谱数据对模型进行训练之后,还包括:
使用部分所述光谱数据作为测试集,对建立的所述光谱分析模型进行评估,进行评估的评估指标包括决定系数、交叉验证均方根误差、预测均方根误差和/或相对分析误差;
根据评估结果,对所述光谱分析模型进行参数优化,进行参数优化包括调整模型参数、改变特征选择方法和/或增加特征维度。
为实现上述目的,本申请还提供一种用于烟叶物质成分分析的光谱分析方法,包括:
获取通过光谱设备采集的待分析物质的光谱数据,输入上述任一项所述的用于烟叶物质成分分析的光谱分析模型的构建方法所构建的光谱分析模型中,进行物质成分预测,得到分析结果。
为实现上述目的,本申请还提供一种用于烟叶物质成分分析的光谱分析模型的构建装置,包括:存储器;以及
与所述存储器连接的处理器,所述处理器被配置成执行如上所述的方法的步骤。
为实现上述目的,本申请还提供一种计算机存储介质,其上存储有计算机程序,其中所述计算机程序被机器执行时实现如上所述的方法的步骤。
本申请实施例具有如下优点:
本申请实施例提供一种用于烟叶物质成分分析的光谱分析模型的构建方法,包括:步骤1)获取通过光谱设备得到的样本的光谱数据;步骤2)对获取的所述光谱数据进行预处理;步骤3)对预处理后的所述光谱数据进行特征提取,提取出与所述样本的特征相关的光谱数据;步骤4)将提取的特征作为输入变量,所述样品的已知性质作为输出变量,通过数学方法构建模型,并利用特征提取后的光谱数据对模型进行训练,最终得到所述光谱分析模型。
通过上述方法,构建出光谱分析模型,利用该模型,基于输入的光谱数据进行物质成分分析,相比于传统的人工判别和化学成分的实验室检测,具有分析速度快、操作简单、无损、实时检测等优点,能够快速地对待测样品的光学信号进行分析,获得样品的较全面的属性和内部品质参数等信息,并且分析评价标准统一、稳定。从而解决了现有技术中的烟叶质量评价手段存在对烟叶质量评价滞后、不全面、不统一的问题。
附图说明
为了更清楚地说明本申请的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引申获得其它的实施附图。
图1为本申请实施例提供的一种用于烟叶物质成分分析的光谱分析模型的构建方法的流程图;
图2为本申请实施例提供的一种用于烟叶物质成分分析的光谱分析模型的构建装置的模块框图。
具体实施方式
以下由特定的具体实施例说明本申请的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本申请的其他优点及功效,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
此外,下面所描述的本申请不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本申请一实施例提供一种用于烟叶物质成分分析的光谱分析模型的构建方法,参考图1,图1为本申请的一实施方式中提供的一种用于烟叶物质成分分析的光谱分析模型的构建方法的流程图,应当理解的是,该方法还可以包括未示出的附加框和/或可以省略所示出的框,本申请的范围在此方面不受限制。
在步骤1)处,获取通过光谱设备得到的样本的光谱数据。
在步骤2)处,对获取的所述光谱数据进行预处理。
具体地,包括去基线、平滑等处理,以提高数据的质量。
在一些实施例中,数据预处理的具体步骤包括以下部分:
2.1数据清洗:这是数据预处理的第一步,主要是为了处理原始数据中存在的错误、缺失、重复、异常等问题。具体步骤如下:
去重:检查数据集中是否存在重复的数据记录,如有重复,删除其中的一条或多条记录;
处理缺失值:数据集中可能存在某些数据缺失的情况,可以通过删除缺失值、替换缺失值或使用插值方法进行处理;
处理异常值:检查数据集中是否存在异常值,如有异常值,可以进行删除、替换或使用插值方法进行处理;
处理错误值:检查数据集中是否存在错误值,例如数据类型不正确等,需要进行数据纠正。
2.2平滑处理:平滑处理是用来解决句子中出现零概率的问题,平滑处理的基本思想是“劫富济贫”,即提高低概率(零概率),降低高概率,尽量使概率的分布趋于实际水平。
在步骤3)处,对预处理后的所述光谱数据进行特征提取,提取出与所述样本的特征相关的光谱数据。
在步骤4)处,将提取的特征作为输入变量,所述样品的已知性质(如成分、含量等)作为输出变量,通过数学方法构建模型,并利用特征提取后的光谱数据对模型进行训练,最终得到所述光谱分析模型。
具体地,通常基于机器学习中的监督学习模型进行构建。常见的模型包括线性回归模型、支持向量机(SVM)模型、随机森林模型和神经网络模型等。
以下实施例以线性回归模型为例,介绍光谱分析模型架构和包含的数学公式:
模型架构:
线性回归模型是一种简单但非常强大的机器学习算法,用于预测连续型数值变量。其基本思想是通过拟合一个线性方程来预测目标变量,即目标变量与自变量之间存在线性关系。
数学公式:
假设有一个光谱数据集,其中包含多个波长(X)和相应的吸光度(y)。线性回归模型试图找到一个最佳拟合线,使得吸光度(y)与波长(X)之间存在线性关系;
最佳拟合线的斜率和截距可以通过最小二乘法估计得到。最小二乘法通过最小化预测值与实际值之间的平方误差来寻找最佳拟合线;
数学公式如下:
y=β0+β1*X1+β2*X2+...+βn*Xn+ε
其中,y是吸光度,X1,X2,...,Xn是波长,β0是截距,β1,β2,...,βn是斜率,ε是误差项;
通过最小二乘法估计得到最佳拟合线的参数后,可以使用该拟合线对新的光谱数据进行预测。
需要注意的是,光谱数据通常具有很高的维度(即波长数量很多),因此需要进行特征选择或降维处理来减少维度对模型性能的影响。常见的特征选择方法包括基于统计量的特征选择、基于模型的特征选择和集成特征选择等。
在一些实施例中,在所述步骤4)中,所述利用特征提取后的光谱数据对模型进行训练之后,还包括:
模型评估:使用部分所述光谱数据作为测试集,对建立的所述光谱分析模型进行评估,主要的评估指标有决定系数(R2)、交叉验证均方根误差(RMSECV)、预测均方根误差(RMSEP)和相对分析误差(RPD);
根据评估结果,对光谱分析模型进行参数优化,以提升模型的性能。参数优化可能包括调整模型参数、改变特征选择方法、增加特征维度等。在优化模型后,还需要用新的光谱数据重新训练模型,以使模型能够更好地适应新的数据。
在一些实施例中,为了更准确地评估模型的性能,还可以进行交叉验证。交叉验证是将数据分成k份,每次用k-1份数据进行训练,剩余的一份数据进行测试,这样可以得到更稳定、更准确的评估结果。
本申请一实施例还提供一种用于烟叶物质成分分析的光谱分析方法,包括:
获取通过光谱设备采集的待分析物质的光谱数据,输入前述实施例所述的用于烟叶物质成分分析的光谱分析模型的构建方法所构建的光谱分析模型中,进行物质成分预测,得到分析结果。
具体实现方法参考前述方法实施例,此处不再赘述。
通过上述方法,构建出光谱分析模型,利用该模型,基于输入的光谱数据进行物质成分分析,相比于传统的人工判别和化学成分的实验室检测,具有分析速度快、操作简单、无损、实时检测等优点,能够快速地对待测样品的光学信号进行分析,获得样品的较全面的属性和内部品质参数等信息,并且分析评价标准统一、稳定。从而解决了现有技术中的烟叶质量评价手段存在对烟叶质量评价滞后、不全面、不统一的问题。
以下实施例通过一个关于烟叶成分分析的具体示例,说明如何通过具体的数据来执行上述实施例中的步骤。
1.烟叶光谱数据的获取:首先,我们需要获取烟叶样本的X射线光谱数据。这可以通过将烟叶样本置于X射线光谱仪中,然后收集光谱数据来实现。例如,可以收集100个烟叶样本的光谱数据。
2.烟叶光谱数据预处理:在提取特征之前,需要对烟叶光谱数据进行预处理。包括去噪(消除背景噪声)、归一化(将数据调整到一个共同的尺度)、或者其他形式的平滑处理。例如,可以通过某种形式的平滑处理,将收集到的烟叶光谱数据转化为更易于分析和解释的形式。
3.烟叶光谱数据特征提取:从预处理后的光谱数据中提取特征。包括寻找代表特定元素的峰值,或者识别出代表特定化学过程的特定模式。例如,可以识别出代表烟碱、叶绿素等元素的特定峰值,或者识别出代表特定值。
4.获取对应的光谱数据峰值特征:每个提取的特征都应与预处理后的光谱数据中的一部分相对应。例如,代表叶碱元素的峰值应出现在预处理后的光谱数据中的某个特定波长处。
通过这个过程,可以得到一系列的特征和对应的光谱数据。然后,使用这些数据来训练光谱分析模型,以预测烟叶样本的化学成分,或者进行其他类型的分析。这就是光谱分析的一种常见方法。具体的步骤和工具可能会根据所使用的光谱技术、所需解决的具体问题以及可用的数据集而变化。
需要注意的是,在光谱分析模型构建过程中,需要严格的数据处理和表达能力强的模型算法,同时还需要依赖获取的样本本身的特性,比如样本数据的精准性、数据特征能否反映样本本身的属性等。
前述实施例提供的光谱分析模型构建方法的应用场景包括:
制定烟叶标准采样流程,建立数据库和模型。进行批量采样,同一地区和品种的烟叶,每隔固定的时间,采集不同烟株同一部位的烟叶,并截取不同烟叶相同部位的叶片截面作为样本,每次采集的叶片截面作为一批样本,针对同一批烟叶,首先对烟叶做多光谱分析,获取烟叶不同成分在光谱上的显示特征,并将光谱的特征信息存放到数据库中,再将同一批烟叶做理化实验,获取该批烟叶的各元素的真实含量,同样也将这些信息存储在数据库中,再通过光谱分析模型,将各元素的真实含量与采集到的光谱特征对应起来,以便将来能够通过光谱分析模型,直接获得烟叶中各元素的数量,通过该信息,能够推测出烟叶的质量信息。通过在烟田搭建包括光谱分析模型的长势监测系统,每日检测烟苗的长势信息,通过烟田中烟苗的长势信息,能够推测出烟田中烟叶的产量信息。
在上述场景中的应用过程步骤包括:
1、采样准备
a.确定采样的烟叶所在的地区及品种,选择同一地区,同一品种的烟叶作为采样的烟叶;
b.准备手持光谱仪及叶冠多光谱分析仪;
c.搭建数据存储系统,机器学习系统;
2、采样阶段
a.在采样准备时确定的烟田中,每隔固定的时间段,采集同一批烟田,不同烟株上,同一位置的叶片,并建立烟叶外观质量的身份信息;
b.使用手持光谱仪和叶冠多光谱分析仪获取采集的叶片的多光谱图像,并存储在数据存储系统中;
c.将采集的叶片用于进行理化实验分析,获取不同叶片中各元素的具体含量,并将具体数据存储在数据存储系统中;
3、训练阶段
将手持光谱仪与叶冠多光谱分析仪获取的叶片多光谱图像与理化实验获取的叶片各元素含量对应起来,放入机器学习系统中进行机器学习,以生成多光谱图像与各元素含量对应关系的光谱分析模型
4、验证阶段
a.在采样准备时确定的烟田中,采集不同烟株的叶片;
b.使用手持光谱仪和叶冠多光谱分析仪获取叶片的多光谱图像;
c.使用机器训练生成的光谱分析模型对获取的多光谱图像进行识别,并获得识别后,分析出的各元素含量;
d.将采集的叶片进行理化实验,获取叶片中各元素的含量;
e.将光谱分析模型识别出来的各元素含量与理化实验分析的元素含量进行对比;
5、标准化阶段
当光谱分析模型识别出的各元素含量与理化分析的元素含量准确率达到90%以上,则将光谱分析模型部署到小型设备中,实现长势监测。
图2为本申请实施例提供的一种用于烟叶物质成分分析的光谱分析模型的构建装置的模块框图。该装置包括:
存储器101;以及与所述存储器101连接的处理器102,所述处理器102被配置成:步骤1)获取通过光谱设备得到的样本的光谱数据;
步骤2)对获取的所述光谱数据进行预处理;
步骤3)对预处理后的所述光谱数据进行特征提取,提取出与所述样本的特征相关的光谱数据;
步骤4)将提取的特征作为输入变量,所述样品的已知性质作为输出变量,通过数学方法构建模型,并利用特征提取后的光谱数据对模型进行训练,最终得到所述光谱分析模型。
在一些实施例中,所述处理器102还被配置成:所述步骤2)具体包括:
对所述光谱数据进行数据清洗,具体包括:删除数据集中的重复数据记录,通过删除、替换或使用插值方法处理数据集中的缺失值和异常值,检查并纠正数据集中的错误值;
对所述光谱数据进行平滑处理。
在一些实施例中,所述处理器102还被配置成:在所述步骤4)中,所述通过数学方法构建模型,包括:
基于机器学习中的监督学习模型进行模型构建,所构建的光谱分析模型为线性回归模型或支持向量机模型或随机森林模型或神经网络模型。
在一些实施例中,所述处理器102还被配置成:所构建的光谱分析模型为线性回归模型,所述通过数学方法构建模型,包括:
对所述光谱数据进行特征选择或者降维处理,得到存在线性关系的光谱数据;
利用最小二乘法估计得到存在线性关系的光谱数据对应的最佳拟合线的参数,基于所述最佳拟合线构建光谱分析模型。
在一些实施例中,所述处理器102还被配置成:在所述步骤4)中,所述利用特征提取后的光谱数据对模型进行训练之后,还包括:
使用部分所述光谱数据作为测试集,对建立的所述光谱分析模型进行评估,进行评估的评估指标包括决定系数、交叉验证均方根误差、预测均方根误差和/或相对分析误差;
根据评估结果,对所述光谱分析模型进行参数优化,进行参数优化包括调整模型参数、改变特征选择方法和/或增加特征维度。
具体实现方法参考前述方法实施例,此处不再赘述。
本申请可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本申请的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本申请操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本申请的各个方面。
这里参照根据本申请实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其他可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
注意,除非另有直接说明,否则本说明书(包含任何所附权利要求、摘要和附图)中所揭示的所有特征皆可由用于达到相同、等效或类似目的的可替代特征来替换。因此,除非另有明确说明,否则所公开的每一个特征仅是一组等效或类似特征的一个示例。在使用到的情况下,进一步地、较优地、更进一步地和更优地是在前述实施例基础上进行另一实施例阐述的简单起头,该进一步地、较优地、更进一步地或更优地后带的内容与前述实施例的结合作为另一实施例的完整构成。在同一实施例后带的若干个进一步地、较优地、更进一步地或更优地设置之间可任意组合的组成又一实施例。
虽然,上文中已经用一般性说明及具体实施例对本申请作了详尽的描述,但在本申请基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本申请精神的基础上所做的这些修改或改进,均属于本申请要求保护的范围。
Claims (8)
1.一种用于烟叶物质成分分析的光谱分析模型的构建方法,其特征在于,包括以下步骤:
步骤1)获取通过光谱设备得到的样本的光谱数据;
步骤2)对获取的所述光谱数据进行预处理;
步骤3)对预处理后的所述光谱数据进行特征提取,提取出与所述样本的特征相关的光谱数据;
步骤4)将提取的特征作为输入变量,所述样品的已知性质作为输出变量,通过数学方法构建模型,并利用特征提取后的光谱数据对模型进行训练,最终得到所述光谱分析模型。
2.根据权利要求1所述的用于烟叶物质成分分析的光谱分析模型的构建方法,其特征在于,所述步骤2)具体包括:
对所述光谱数据进行数据清洗,具体包括:删除数据集中的重复数据记录,通过删除、替换或使用插值方法处理数据集中的缺失值和异常值,检查并纠正数据集中的错误值;
对所述光谱数据进行平滑处理。
3.根据权利要求1所述的用于烟叶物质成分分析的光谱分析模型的构建方法,其特征在于,在所述步骤4)中,所述通过数学方法构建模型,包括:
基于机器学习中的监督学习模型进行模型构建,所构建的光谱分析模型为线性回归模型或支持向量机模型或随机森林模型或神经网络模型。
4.根据权利要求3所述的用于烟叶物质成分分析的光谱分析模型的构建方法,其特征在于,
所构建的光谱分析模型为线性回归模型,所述通过数学方法构建模型,包括:
对所述光谱数据进行特征选择或者降维处理,得到存在线性关系的光谱数据;
利用最小二乘法估计得到存在线性关系的光谱数据对应的最佳拟合线的参数,基于所述最佳拟合线构建光谱分析模型。
5.根据权利要求1所述的用于烟叶物质成分分析的光谱分析模型的构建方法,其特征在于,在所述步骤4)中,所述利用特征提取后的光谱数据对模型进行训练之后,还包括:
使用部分所述光谱数据作为测试集,对建立的所述光谱分析模型进行评估,进行评估的评估指标包括决定系数、交叉验证均方根误差、预测均方根误差和/或相对分析误差;
根据评估结果,对所述光谱分析模型进行参数优化,进行参数优化包括调整模型参数、改变特征选择方法和/或增加特征维度。
6.一种用于烟叶物质成分分析的光谱分析方法,其特征在于,包括:
获取通过光谱设备采集的待分析物质的光谱数据,输入权利要求1至5任一项所述的用于烟叶物质成分分析的光谱分析模型的构建方法所构建的光谱分析模型中,进行物质成分预测,得到分析结果。
7.一种用于烟叶物质成分分析的光谱分析模型的构建装置,其特征在于,包括:
存储器;以及
与所述存储器连接的处理器,所述处理器被配置成执行如权利要求1至5中任一项所述的方法的步骤。
8.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被机器执行时实现如权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311576296.7A CN117558361A (zh) | 2023-11-23 | 2023-11-23 | 用于烟叶物质成分分析的光谱分析模型的构建方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311576296.7A CN117558361A (zh) | 2023-11-23 | 2023-11-23 | 用于烟叶物质成分分析的光谱分析模型的构建方法及应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117558361A true CN117558361A (zh) | 2024-02-13 |
Family
ID=89821539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311576296.7A Pending CN117558361A (zh) | 2023-11-23 | 2023-11-23 | 用于烟叶物质成分分析的光谱分析模型的构建方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117558361A (zh) |
-
2023
- 2023-11-23 CN CN202311576296.7A patent/CN117558361A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Koch et al. | Iterative morphological and mollifier‐based baseline correction for Raman spectra | |
JP6091493B2 (ja) | 試料に存在する成分を決定するための分光装置と分光法 | |
Hoang | Wavelet-based spectral analysis | |
WO2018121121A1 (zh) | 用于扣除谱图本底的方法、通过拉曼谱图识别物质的方法和电子设备 | |
Boulet et al. | Pretreatments by means of orthogonal projections | |
JP2014532187A (ja) | 時および/または空間系列ファイルの多成分回帰/多成分分析 | |
CN112801300A (zh) | 预测烟草样品香气量的方法、装置和计算机可读取介质 | |
Mishra et al. | FRUITNIR-GUI: A graphical user interface for correcting external influences in multi-batch near infrared experiments related to fruit quality prediction | |
CN112951342A (zh) | 数据解析系统以及数据解析方法 | |
CN102135496A (zh) | 基于多尺度回归的红外光谱定量分析方法和装置 | |
CN116818687B (zh) | 基于光谱引导集成学习的土壤有机碳光谱预测方法及装置 | |
CN117558361A (zh) | 用于烟叶物质成分分析的光谱分析模型的构建方法及应用 | |
CN116858822A (zh) | 一种基于机器学习和拉曼光谱的水体中磺胺嘧啶定量分析方法 | |
CN112016636A (zh) | 一种基于Hadoop框架的作物光谱聚类分析处理方法 | |
Tan et al. | Determination of total sugar in tobacco by near-infrared spectroscopy and wavelet transformation-based calibration | |
JP7018321B2 (ja) | スペクトル処理装置及び方法 | |
Chen et al. | A new hybrid strategy for constructing a robust calibration model for near-infrared spectral analysis | |
WO2021253874A1 (zh) | 卷烟主流烟气光谱数据的感官评价方法 | |
CN109829513B (zh) | 一种顺序式波长色散x射线荧光光谱智能分析方法 | |
CN112666094A (zh) | 一种常见毒素识别系统及方法 | |
Malli et al. | Fused stagewise regression—A waveband selection algorithm for spectroscopy | |
CN113295674A (zh) | 一种基于s变换的激光诱导击穿光谱特征非线性处理方法 | |
Zhao et al. | Multiblock-based qualitative and quantitative spectral calibration analysis | |
CN116202980A (zh) | 基于红外光谱和去峰匹配的混合物质识别方法及装置 | |
Zhao et al. | Reducing Moisture Effects on Soil Organic Carbon Content Estimation in Vis-NIR Spectra with a Deep Learning Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |