CN113971990A - 一种基于相似光谱拟合的多化学指标预测方法 - Google Patents
一种基于相似光谱拟合的多化学指标预测方法 Download PDFInfo
- Publication number
- CN113971990A CN113971990A CN202111232351.1A CN202111232351A CN113971990A CN 113971990 A CN113971990 A CN 113971990A CN 202111232351 A CN202111232351 A CN 202111232351A CN 113971990 A CN113971990 A CN 113971990A
- Authority
- CN
- China
- Prior art keywords
- spectrum
- near infrared
- fitting
- value
- target spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 105
- 239000000126 substance Substances 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 91
- 238000001514 detection method Methods 0.000 claims abstract description 15
- 238000012216 screening Methods 0.000 claims abstract description 7
- 230000003595 spectral effect Effects 0.000 claims description 19
- 238000012937 correction Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 8
- 239000007787 solid Substances 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 239000000843 powder Substances 0.000 claims description 4
- 238000012360 testing method Methods 0.000 abstract description 11
- 241000208125 Nicotiana Species 0.000 description 19
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 19
- 238000012549 training Methods 0.000 description 14
- 239000000779 smoke Substances 0.000 description 10
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- SNICXCGAKADSCV-JTQLQIEISA-N (-)-Nicotine Chemical compound CN1CCC[C@H]1C1=CC=CN=C1 SNICXCGAKADSCV-JTQLQIEISA-N 0.000 description 2
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 2
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 2
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001311 chemical methods and process Methods 0.000 description 2
- 239000000460 chlorine Substances 0.000 description 2
- 229910052801 chlorine Inorganic materials 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003546 flue gas Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 229960002715 nicotine Drugs 0.000 description 2
- SNICXCGAKADSCV-UHFFFAOYSA-N nicotine Natural products CN1CCCC1C1=CC=CN=C1 SNICXCGAKADSCV-UHFFFAOYSA-N 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000011591 potassium Substances 0.000 description 2
- 229910052700 potassium Inorganic materials 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 238000004497 NIR spectroscopy Methods 0.000 description 1
- 238000001793 Wilcoxon signed-rank test Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 235000019504 cigarettes Nutrition 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 235000019505 tobacco product Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
Landscapes
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于相似光谱拟合的多化学指标预测方法,包括:(1)采集多个样品的近红外光谱;(2)计算选定的目标谱与其他近红外光谱的相似度;(3)在每个N的取值下,针对每个目标谱,选择与目标谱相似度前N大的N个近红外光谱进行趋近于目标谱的拟合,以确定N个拟合系数;(4)利用N个拟合系数计算每个目标谱的每个化学指标的拟合值,并计算拟合值与检测值的绝对误差;(5)针对每个化学指标,计算所有近红外光谱作为目标谱对应的绝对误差的平均值,筛选绝对误差的平均值最小时对应的N作为最终确定值N0;(6)利用确定的N0按照步骤(2)~(4)计算测试样本的每个化学指标的拟合值。该方法实现多化学指标的快速准确预测。
Description
技术领域
本发明属于近红外光谱及化学计量学领域,具体涉及一种基于相似光谱拟合的多化学指标预测方法。
背景技术
近红外光谱分析技术是一种快速、准确和无损的检测技术。近红外光谱主要是对含氢基团振动的倍频和合频吸收,其中包含了大多数类型有机化合物的组成信息,非常适合用于各种复杂混合物的检测。目前基于近红外的烟叶主要化学成分建模主要是通过偏最小二乘算法(Partial Least Squares,PLS)来实现。
PLS是为了弥补最小二乘在计算强共线性数据时的缺陷而提出,考虑一组因变量Y和一组自变量X,在X存在严重多重相关性或者样本数量少于变量个数时,对矩阵XTX求逆将会失效。PLS采用成分提取的办法解决这个问题,通过在X和Y中依次提取出成分分量,保证X中分量与Y中分量的协方差最大,从而实现回归建模、数据结构简化以及分析两组变量之间的相关性,能够有效地处理多变量和共线性问题,非常适合应用于近红外光谱的定量分析。
针对烟草、中药材等复杂农产品的主要物质建模问题,PLS主要如下几个缺陷,一是对于不同地域、品种、等级且含量范围较宽的物质,光谱与物质的关系可能是非线性的,PLS作为一种线性方法建模效果可能不理想;二是如果有多种物质需要建模,每种物质都需建立一个PLS模型,涉及多种预处理方法及多个模型参数,增加了模型的复杂性;三是PLS方法需要样本达到一定数量才可以建模,建模样本数量较少时无法进行预测。
公开号为CN101419207A的专利申请公开了一种烤烟烟气主要指标的预测方法,先建立烤烟烟气主要指标的模型:检测训练烤烟样品和测试烤烟样品的主要化学成分及烟气主要指标;利用灰色函数聚类将训练烤烟样品聚类;确定进入模型的变量;在每一类样品的烟气主要指标与主要化学成分之间建立灰色预测模型;建立每一类训练样品的BP神经网络;用测试样品烤烟的烟气主要指标对和主要化学成分进行测试和调整。检测时将待测烤烟样品的主要化学成分进行聚类后利用其所在类的模型进行预测从而得到烟气主要指标。该方法需要一定的样本量才能建模,不利于模型的更新。
公开号为CN104697955A的专利申请公开了一种卷烟烟气指标预测方法及系统,获取待测烟丝的常规化学成分含量;输入所述待测烟丝的常规化学成分含量至预先生成的烟气预测模型,所述烟气预测模型为依据烟气指标与常规化学成分含量构建的模型;运行所述烟气预测模型,输出待测烟丝的烟气指标。该方法同样需要一定的样本量才能建模,不利于模型的更新。
发明内容
鉴于上述,本发明的目的是提供一种基于相似光谱拟合的多化学指标预测方法,实现多化学指标的快速准确预测。
实施例提供的技术方案为:
一种基于相似光谱拟合的多化学指标预测方法,其特征在于,包括以下步骤:
(1)利用近红外光谱仪采集多个样品的近红外光谱作为样本集,采用分析化学方法检测每个样品的每种化学指标的检测值;
(2)对样本集中每个近红外光谱进行预处理后,选定一个近红外光谱作为目标谱,计算目标谱与样本集中其他近红外光谱的相似度;
(3)在每个N的取值下,针对每个目标谱,选择与目标谱相似度前N大的N个近红外光谱进行趋近于目标谱的拟合,以确定与近红外光谱对应的N个拟合系数,其中,N的取值为大于1的自然数;
(4)利用N个拟合系数计算每个目标谱的每个化学指标的拟合值,并计算拟合值与检测值的绝对误差;
(5)针对每个化学指标,计算所有近红外光谱作为目标谱对应的绝对误差的平均值,筛选绝对误差的平均值最小时对应的N作为最终确定值N0;
(6)对待测样本的近红外光谱作为目标谱,对目标谱进行预处理后,计算目标谱与样本集中其他近红外光谱的相似度,然后选择与目标谱相似度最大的N0个近红外光谱进行趋近于目标谱的拟合,以确定与近红外光谱对应的N0个拟合系数,利用N0个拟合系数计算目标谱的每个化学指标的拟合值。
优选地,所述对样本集中每个近红外光谱进行预处理,包括:
对近红外光谱进行一阶导处理,然后将一阶导处理后的近红外光谱平均分段得到多个谱段,对每个谱段内的波数点进行校正。
优选地,所述对每个谱段内的波数点进行校正,包括:
针对每个谱段,计算每个谱段内所有波数点的均值mean(x)和标准差std(x),然后利用均值mean(x)和标准差std(x)按照以下公式进行校正:
优选地,采用以下公式计算目标谱与样本集中其他近红外光谱的相似度:
s=-log10((1-p)*d)
其中,s表示相似度,p表示皮尔逊相关系数,计算公式为p=corr(y0,yj),y0表示目标谱,yj表示第j个近红外光谱,d表示目标谱y0与近红外光谱yj之间的欧式距离。
优选地,步骤(3)中,在每个N的取值下,针对每个目标谱,构建的拟合问题为:
其中,y0表示目标谱,Y表示与目标谱相似度最大的前N大的N个近红外光谱形成的向量,W表示与近红外光谱对应的N个拟合系数形成的向量;
在求解拟合问题时,增加拟合系数为非负性、拟合系数之和为1约束,通过求解拟合问题,确定与近红外光谱对应的N个拟合系数。
优选地,步骤(4)中,采用以下公式,利用N个拟合系数计算每个目标谱的每个化学指标的拟合值:
其中,wj表示第j个近红外光谱对应的拟合系数,zj,k表示第j个近红外光谱中第k个化学指标的化学值,Lk表示第k个化学指标的拟合值。
优选地,在获得每个化学指标的绝对误差的平均值后,对每个化学指标的绝对误差的平均值进行量纲统一后,计算所有化学指标的绝对误差的平均值之和,筛选之和最小时对应的N作为最终确定的值N0。
优选地,采用以下方式计算对每个化学指标的绝对误差的平均值进行量纲统一:
其中,ek表示第k个化学指标的绝对误差的平均值,fk表示第k个化学指标的检测值的平均值,cvk表示第k个化学指标的量纲统一值。
优选地,N的取值范围为2-100,若样本量低于200个,则N的下限为2,上限设定为样本量总数的一半。
优选地,当样品为固体时,利用近红外光谱仪采集样品的近红外光谱时,要求固体采用粉末状,粒度为35-45目,进一步优选为40目。
具有的有益效果至少包括:
实施例提供的于相似光谱拟合的多化学指标预测方法,采用局部方法,较线性算法有更好的灵活度,且不使用PLS方法建模,因此受样本量,参数选择等的影响较小,采用相似近红外光谱拟合目标谱,避免了多个不相似近红外光谱拟合为目标谱,避免了过拟合,且该方法可实现一次性预测多个指标,无需逐一建模,对于新增化学指标,可通过本方法直接预测,无需PLS建模,提升了化学指标的预测效率和准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是一实施例提供的基于相似光谱拟合的多化学指标预测方法的流程图。
图2是一实施例提供的烟叶近红外光谱;
图3是一实施例提供的以1号样本对应的近红外光谱作为目标谱时,与其他近红外光谱的相似度及排序,其中,数字标示样本序号,也就是近红外光谱的序号;
图4是一实施例提供的以1号样本对应的近红外光谱作为目标谱时,,在N=5时,各近红外光谱仪的拟合参数,其中1-5分别对应训练集中50#,63#,3#,38#,34#样本;
图5是一实施例提供的训练集的拟合误差,N=63时达到最小值。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
图1是一实施例提供的基于相似光谱拟合的多化学指标预测方法的流程图。如图1所示,实施例提供的基于相似光谱拟合的多化学指标预测方法,包括以下步骤:
步骤1,利用近红外光谱仪采集多个样品的近红外光谱作为样本集,采用分析化学方法检测每个样品的每种化学指标的检测值。
实施例中,样品可以是液体样品,也可以是固体样品。当为固体样品时,为了提升采集近红外光谱的准确性,限定固体样品粉末粒度为40目。
实施例中,还采用分析化学方法检测每个样品的每种化学指标的检测值,该检测值用于后续评判拟合值与检测值的差距,以筛选相似样本。
步骤2,对样本集中每个近红外光谱进行预处理。
实施例中,对近红外光谱进行预处理包括1阶求导和数值校正处理。在进行近红外光谱的1阶导处理时,参数为窗宽15,多项式阶数2。在对1阶求导处理后的近红外光谱进行数值校正时,为了提升校正的准确性,采用分段校正的方式,即将近红外光谱平均分段得到多个谱段,每个谱段含有M个波数点,M的取值范围为40-60,然后对每个谱段内的波数点进行谱段内校正,过程为:针对每个谱段,计算每个谱段内所有波数点的均值mean(x)和标准差std(x),然后利用均值mean(x)和标准差std(x)按照以下公式进行校正:
步骤3,分别将每个近红外光谱作为目标谱,计算目标谱与样本集中其他近红外光谱的相似度。
针对预处理后的近红外光谱进行相似度计算,具体过程为:选择1个近红外光谱作为目标谱,然后采用以下公式计算目标谱与样本集中其他近红外光谱的相似度:
s=-log10((1-p)*d)
其中,s表示相似度,p表示皮尔逊相关系数,计算公式为p=corr(y0,yj),y0表示目标谱,yj表示第j个近红外光谱,d表示目标谱y0与近红外光谱yj之间的欧式距离。
在获得每个目标谱与样本集中所有其他近红外光谱的相似度后,为每个目标谱对应的进行相似度排序,以用于后续相似度的筛选。
步骤4,对于当前N值,针对每个目标谱,选择与目标谱相似度前N大的N个近红外光谱进行趋近于目标谱的拟合,以确定与近红外光谱对应的N个拟合系数。
实施例中,N的取值为大于1的自然数,进一步,取值为2-100的自然数,在每个N值下,针对每个目标谱,选择与目标谱相似度前N大的N个近红外光谱进行趋近于目标谱的拟合,以确定与近红外光谱对应的N个拟合系数。这样,需要执行30轮计算,得到每个N值下的拟合系数。
实施例中,在每个N的取值下,针对每个目标谱,构建的拟合问题为:
其中,y0表示目标谱,Y表示与目标谱相似度最大的前N大的N个近红外光谱形成的向量,W表示与近红外光谱对应的N个拟合系数形成的向量;
在求解拟合问题时,增加拟合系数为非负性、拟合系数之和为1约束,通过求解拟合问题,确定与近红外光谱对应的N个拟合系数。
步骤5,利用N个拟合系数计算每个目标谱的每个化学指标的拟合值,并计算拟合值与检测值的绝对误差。
实施例中,在每个N取值下,采用以下公式,利用N个拟合系数计算每个目标谱的每个化学指标的拟合值:
其中,wj表示第j个近红外光谱对应的拟合系数,zj,k表示第j个近红外光谱中第k个化学指标的化学值,Lk表示第k个化学指标的拟合值。
步骤6,针对每个化学指标,计算所有近红外光谱作为目标谱对应的绝对误差的平均值,筛选绝对误差的平均值最小时对应的N0作为最终确定值。
实施例中,可以筛选适配单个化学指标的N值作为最终确定值N0,来用于后续测试样本单个化学指标的预测,具体过程为:对于每个化学指标,计算所有近红外光谱作为目标谱对应的绝对误差的平均值,如果总计有Q个样品,则此过程会得到Q个绝对误差的平均值,然后从Q个绝对误差的平均值中筛选筛选绝对误差的平均值最小时对应的N作为最终确定值N0。
实施例中,还可以筛选适配所有化学指标的N值作为最终确定值N0,来来用于后续测试样本所有化学指标的预测,具体过程为:在获得每个化学指标的绝对误差的平均值后,对每个化学指标的绝对误差的平均值进行量纲统一,计算公式为:
其中,ek表示第k个化学指标的绝对误差的平均值,fk表示第k个化学指标的检测值的平均值,cvk表示第k个化学指标的量纲统一值。
然后,计算所有化学指标的绝对误差的平均值之和,筛选之和最小时对应的N作为最终确定的值N0。
步骤7,以测试样本的近红外光谱作为目标谱,采用最终确定的N0,按照步骤2-步骤5,计算计算目标谱的每个化学指标的拟合值。
实施例中,对待测样本的近红外光谱作为目标谱,对目标谱进行预处理后,计算目标谱与样本集中其他近红外光谱的相似度,然后选择与目标谱相似度最大的N0个近红外光谱进行趋近于目标谱的拟合,以确定与近红外光谱对应的N0个拟合系数,利用N0个拟合系数计算目标谱的每个化学指标的拟合值。
实验例
实验例中,选取某企业烤烟样本646个。取样后将样本按照烟草行业标准《YC/T31-1996烟草及烟草制品试样的制备和水分测定烘箱法》制备成粉末样本(将烟叶置于烘箱中,40℃下干燥4h,用旋风磨(FOSS)磨碎过40目筛),密封平衡1d后进行光谱测量。同时利用国标法或其它方法测得样品的目标化学指标的检测值,包括总糖、烟碱、还原糖、氯、钾、总氮。同时采集样品的近红外光谱图,如图2所示。然后按照上述基于相似光谱拟合的多化学指标预测方法中的步骤2~步骤7进行测试,拟定以1号为目标,其他样本的近红外光谱相似度排序如图3所示,图4给出了在N=5时,1号样本的最相似的5个样本及拟合系数。图5给出了训练集拟合误差,N=63时达到最小值。
独立于训练集的烟叶样本230个。与训练样本同样的方式采集近红外光谱及测定化学指标的检测值。为了体现本方法的优势,与使用偏最小二乘方法(PLS2)对训练集进行建模及测试集的测试结果进行对比。
表1.本发明方法训练及测试结果
表2.PLS方法训练及测试结果
表3 Wilcoxon符号秩检验对比两方法结果的差异性
分析表1-表3可得,PLS模型预测结果中,总糖、烟碱、还原糖三项指标的预测误差远大于训练误差,显示出过拟合倾向,而氯、钾、总氮三项指标的预测误差低于训练误差,有悖常识,应该是数据批次巧合所致。相比之下,本方法6项指标中预测误差均稍高于训练误差,且预测结果与PLS方法相当,展示出良好的建模和模型预测效果。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于相似光谱拟合的多化学指标预测方法,其特征在于,包括以下步骤:
(1)利用近红外光谱仪采集多个样品的近红外光谱作为样本集,采用分析化学方法检测每个样品的每种化学指标的检测值;
(2)对样本集中每个近红外光谱进行预处理后,分别将每个近红外光谱作为目标谱,计算目标谱与样本集中其他近红外光谱的相似度;
(3)在每个N的取值下,针对每个目标谱,选择与目标谱相似度前N大的N个近红外光谱进行趋近于目标谱的拟合,以确定与近红外光谱对应的N个拟合系数,其中,N的取值为大于1的自然数;
(4)利用N个拟合系数计算每个目标谱的每个化学指标的拟合值,并计算拟合值与检测值的绝对误差;
(5)针对每个化学指标,计算所有近红外光谱作为目标谱对应的绝对误差的平均值,筛选绝对误差的平均值最小时对应的N作为最终确定值N0;
(6)对待测样本的近红外光谱作为目标谱,对目标谱进行预处理后,计算目标谱与样本集中其他近红外光谱的相似度,然后选择与目标谱相似度最大的N0个近红外光谱进行趋近于目标谱的拟合,以确定与近红外光谱对应的N0个拟合系数,利用N0个拟合系数计算目标谱的每个化学指标的拟合值。
2.根据权利要求1所述的基于相似光谱拟合的多化学指标预测方法,其特征在于,所述对样本集中每个近红外光谱进行预处理,包括:
对近红外光谱进行一阶导处理,然后将一阶导处理后的近红外光谱平均分段得到多个谱段,对每个谱段内的波数点进行校正。
4.根据权利要求1所述的基于相似光谱拟合的多化学指标预测方法,其特征在于,采用以下公式计算目标谱与样本集中其他近红外光谱的相似度:
s=-log10((1-p)*d)
其中,s表示相似度,p表示皮尔逊相关系数,计算公式为p=corr(y0,yj),y0表示目标谱,yj表示第j个近红外光谱,d表示目标谱y0与近红外光谱yj之间的欧式距离。
7.根据权利要求1所述的基于相似光谱拟合的多化学指标预测方法,其特征在于,在获得每个化学指标的绝对误差的平均值后,对每个化学指标的绝对误差的平均值进行量纲统一后,计算所有化学指标的绝对误差的平均值之和,筛选之和最小时对应的N作为最终确定的值N0。
9.根据权利要求1所述的基于相似光谱拟合的多化学指标预测方法,其特征在于,N的取值范围为2-100,若样本量低于200个,则N的下限为2,上限设定为样本量总数的一半。
10.根据权利要求1所述的基于相似光谱拟合的多化学指标预测方法,其特征在于,当样品为固体时,利用近红外光谱仪采集样品的近红外光谱时,要求固体采用粉末状,粒度为35-45目。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111232351.1A CN113971990A (zh) | 2021-10-22 | 2021-10-22 | 一种基于相似光谱拟合的多化学指标预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111232351.1A CN113971990A (zh) | 2021-10-22 | 2021-10-22 | 一种基于相似光谱拟合的多化学指标预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113971990A true CN113971990A (zh) | 2022-01-25 |
Family
ID=79587996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111232351.1A Pending CN113971990A (zh) | 2021-10-22 | 2021-10-22 | 一种基于相似光谱拟合的多化学指标预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113971990A (zh) |
-
2021
- 2021-10-22 CN CN202111232351.1A patent/CN113971990A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108181263B (zh) | 基于近红外光谱的烟叶部位特征提取及判别方法 | |
WO2018010352A1 (zh) | 一种定性定量相结合的近红外定量模型构建方法 | |
CN101915744B (zh) | 物质成分含量的近红外光谱无损检测方法及装置 | |
CN109324015B (zh) | 基于光谱相似的烟叶替代方法 | |
CN109100321A (zh) | 一种卷烟叶组配方维护方法 | |
US20090305423A1 (en) | Methods for Monitoring Composition and Flavor Quality of Cheese Using a Rapid Spectroscopic Method | |
CN104990895B (zh) | 一种基于局部区域的近红外光谱信号标准正态校正方法 | |
CN101995388A (zh) | 烟草近红外质量控制分析方法及系统 | |
CN107796782A (zh) | 基于烟叶特征光谱一致性度量的复烤质量稳定性评价方法 | |
CN105138834A (zh) | 基于近红外光谱波数k均值聚类的烟草化学值定量方法 | |
Bi et al. | Quality evaluation of flue-cured tobacco by near infrared spectroscopy and spectral similarity method | |
WO2020248961A1 (zh) | 一种无参考值的光谱波数选择方法 | |
CN111257277B (zh) | 一种基于近红外光谱技术的烟叶相似度判定方法 | |
CN110967313A (zh) | 电子烟烟油尼古丁含量的近红外光谱预测建模方法及应用 | |
CN109115692A (zh) | 一种光谱数据分析方法及装置 | |
CN115436508A (zh) | 一种基于水果原料指标预测果汁品质的方法 | |
CN109283153B (zh) | 一种酱油定量分析模型的建立方法 | |
CN113030007B (zh) | 基于相似度学习算法快速检验烟用香精质量稳定性的方法 | |
CN105223140A (zh) | 同源物质的快速识别方法 | |
CN112651173B (zh) | 一种基于跨域光谱信息的农产品品质无损检测方法及可泛化系统 | |
CN114088661A (zh) | 一种基于迁移学习和近红外光谱的烟叶烘烤过程化学成分在线预测方法 | |
CN108120694B (zh) | 用于晒红烟化学成分分析的多元校正方法及系统 | |
CN113984708B (zh) | 一种化学指标检测模型的维护方法和装置 | |
CN113971990A (zh) | 一种基于相似光谱拟合的多化学指标预测方法 | |
CN113484275B (zh) | 基于中红外光谱采用分峰分析技术快速预测新鲜烟叶中油分含量的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |