CN113125377A - 一种基于近红外光谱检测柴油性质的方法及装置 - Google Patents
一种基于近红外光谱检测柴油性质的方法及装置 Download PDFInfo
- Publication number
- CN113125377A CN113125377A CN202110344588.2A CN202110344588A CN113125377A CN 113125377 A CN113125377 A CN 113125377A CN 202110344588 A CN202110344588 A CN 202110344588A CN 113125377 A CN113125377 A CN 113125377A
- Authority
- CN
- China
- Prior art keywords
- model
- candidate
- near infrared
- model parameter
- infrared spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 58
- 239000002283 diesel fuel Substances 0.000 title claims abstract description 35
- 238000005457 optimization Methods 0.000 claims abstract description 33
- 238000004821 distillation Methods 0.000 claims abstract description 31
- 230000001902 propagating effect Effects 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 39
- 238000001228 spectrum Methods 0.000 claims description 26
- 238000012937 correction Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 7
- 238000004497 NIR spectroscopy Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 7
- 238000002372 labelling Methods 0.000 abstract 1
- 239000011159 matrix material Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 238000009835 boiling Methods 0.000 description 2
- 238000004817 gas chromatography Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000004611 spectroscopical analysis Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012773 Laboratory assay Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000010426 asphalt Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000003209 petroleum derivative Substances 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3577—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及一种基于近红外光谱检测柴油性质的方法及装置,该方法包括:获取包含标注信息的近红外光谱数据集;将近红外光谱数据集输入至每个模型参数候选值对应构建的SVR优化模型,确定对应的预测馏程温度;根据每个模型参数候选值对应的适应度函数,对模型参数候选值进行排序,确定候选队列;根据候选队列的排序,依次给每个模型参数候选值分配搜索空间,并在搜索空间内繁殖更新,确定更新候选值;根据更新候选值的适应度函数进行排序,更新候选列队;若满足迭代终止条件,则停止迭代,将更新后的候选队列中排在首位的更新候选值作为模型最优参数。本发明利用全局搜索,保证向量回归机的高分类准确率,提高检测结果的准确性。
Description
技术领域
本发明涉及近红外光谱数据分析技术领域,尤其涉及一种基于近红外光谱检测柴油性质的方法及装置。
背景技术
油品性质检测是炼化企业成品油生产过程中的重要环节,目前已经有很多成柴油性质检测的方法,包括常规实验室化验法、气相色谱法、光谱分析法等。其中,常规实验室化验法耗时长,不适合实时控制,而气相色谱法和光谱分析法属于快速检测技术,广泛应用于在线分析。在快速检测技术中应用最有前途的方法是基于近红外(NIR)光谱分析技术的检测方法。目前近红外光谱数据分析中常用到的算法有偏最小二乘法:建立回归模型的同时可以进行主成分分析简化数据,预测性能较好,但是仅在少数情况下使用具有优势;BP神经网络算法:具有很强的非线性映射能力和自学习能力,但是学习速度慢,容易出现过拟合现象。综上,如何提供高效准确的油品性质检测方法是亟待解决的问题。
发明内容
有鉴于此,有必要提供一种基于近红外光谱检测柴油性质的方法及装置,用以解决如何提供高效准确的油品性质检测方法的问题。
本发明提供一种基于近红外光谱检测柴油性质的方法,包括步骤S1至步骤S8,其中:
在步骤S1中,获取包含标注信息的近红外光谱数据集,所述标注信息为实际馏程温度;
在步骤S2中,随机生成多个模型参数候选值,将所述近红外光谱数据集输入至每个所述模型参数候选值对应构建的SVR优化模型,确定对应的预测馏程温度;
在步骤S3中,根据每个所述模型参数候选值对应的适应度函数,对所有所述模型参数候选值进行排序,确定候选队列,其中,所述适应度函数根据所述实际馏程温度和所述预测馏程温度之间的误差而确定;
在步骤S4中,根据所述候选队列的排序,依次给每个所述模型参数候选值分配对应的搜索空间,并在对应的所述搜索空间内繁殖更新,确定对应的更新候选值;
在步骤S5中,根据每个所述更新候选值的所述适应度函数进行排序,更新所述候选列队,判断更新后的候选队列是否满足迭代终止条件;
在步骤S6中,若满足,则停止迭代,将所述更新后的候选队列中排在首位的所述更新候选值作为模型最优参数,若不满足,则将每个所述更新候选值作为所述模型参数候选值,返回至步骤S3中;
在步骤S7中,将所述模型最优参数作为SVR优化模型的最终的模型参数,完成对SVR优化模型的训练,并将所述SVR优化模型进行存储;
在步骤S8中,将待测柴油的近红外光谱输入至训练完备的SVR优化模型,确定对应的预测馏程温度。
进一步地,所述SVR优化模型采用RBF核函数,所述模型参数候选值包括所述RBF核函数对应的正则化参数和RBF径向基核函数参数中的至少一种。
进一步地,在所述步骤S2之前还包括:
采用马氏距离的方法筛选出所述近红外光谱数据集中的界外样本;
采用多元散射校正方法和微分方法消除所述近红外光谱数据集中的光谱基线漂移,并对所述近红外光谱数据集进行平滑去噪。
进一步地,在所述步骤S2中,所述随机生成多个模型参数候选值包括:
获取随机数;
根据预设的自变量范围,确定自变量上限和自变量下限;
根据所述随机数、所述自变量上限和所述自变量下限,生成m个所述模型参数候选值,其中,m为整数。
进一步地,在所述步骤S3中,具体包括:
根据每个所述模型参数候选值对应的所述适应度函数的由小到大的顺序,依次对所有所述模型参数候选值进行排序;
根据排序后的所述模型参数候选值,确定所述候选队列。
进一步地,在所述步骤S4中,具体包括:
根据每个所述模型参数候选值在所述候选队列的位置,由小到大,依次分配给每个所述模型参数候选值相应的所述搜索空间;
每个所述模型参数候选值在对应的所述搜索空间进行无性繁殖,生成n个子代候选值;
所述模型参数候选值和对应的n个子代候选值进行竞争;
根据竞争结果,确定对应的所述更新候选值。
进一步地,分配所述搜索空间的方法通过如下公式表示:
其中,lbt i,j和ubt i,j分别表示在第t代进化中对应的所述候选列队中第i个所述模型参数候选值的第j个变量所分配的搜索空间的上限与下限;xt i,j是第t代进化中,所述候选列队中第i个所述模型参数候选值的第j个变量的值;Δtj是第j个变量在第t代的取值区间长度;lbj表示所述自变量范围的下限;ubj表示所述自变量范围的下限。
进一步地,在所述步骤S5中,所述迭代终止条件包括:在所述更新后的候选队列中,排在首位的所述更新候选值的所述适应度函数最小。
进一步地,在步骤S7中,具体包括:
当所述模型参数候选值为所述正则化参数,则对应的所述模型最优参数为最优正则化参数;
当所述模型参数候选值为所述RBF径向基核函数参数,则对应的所述模型最优参数为最优RBF径向基核函数参数;
将所述最优正则化参数和所述最优RBF径向基核函数参数作为SVR优化模型的最终的模型参数。
本发明还提供了一种基于近红外光谱检测柴油性质的装置,包括处理器以及存储器,存储器上存储有计算机程序,计算机程序被处理器执行时,实现如上所述的基于近红外光谱检测柴油性质的方法。
与现有技术相比,本发明的有益效果包括:首先,对近红外光谱数据集进行有效的获取;然后,针对SVR优化模型,生成该模型对应的多个模型参数候选值;进而,对模型参数候选值进行排序,便于进行搜索和比较;接着,依据排序先后,对模型参数候选值进行搜索空间的分配,并在该搜索空间内进行更新,确定更新候选值,即对于误差越小的模型参数候选值,所分配的搜索空间越大,以此加快搜索速度;然后,在每个模型参数候选值的搜索空间内进行更新后,再重新排序,确定更新后的候选队列是否满足迭代终止条件,并将满足迭代终止条件的更新后的候选队列的首个更新候选值(即生成误差最小的更新候选值)作为模型最优参数,带入SVR优化模型即可;最后,对于训练完备的SVR优化模型,将待测柴油的近红外光谱作为输入,输出对应的预测馏程温度即可。综上,本发明考虑列队的排序特性,进行相应的搜索空间分配,达到全局精确搜索的目的,并提高了搜索效率,使支持向量回归机的分类准确率更高,泛化能力更强,能提高模型精度,实现快速预测柴油性质。
附图说明
图1为本发明提供的基于近红外光谱检测柴油性质的方法的流程示意图;
图2为本发明提供的样本马氏距离的示意图;
图3为本发明提供的随机生成模型参数候选值的流程示意图;
图4为本发明提供的确定对应的更新候选值的流程示意图;
图5为本发明提供的最终的模型参数的流程示意图;
图6为本发明提供的原始的近红外光谱图;
图7为本发明提供的预处理后的近红外光谱图;
图8为本发明提供的测试集预测结果对比图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
实施例1
本发明实施例提供了一种基于近红外光谱检测柴油性质的方法,结合图1来看,图1为本发明提供的基于近红外光谱检测柴油性质的方法的流程示意图,包括步骤S1至步骤S8,其中:
在步骤S1中,获取包含标注信息的近红外光谱数据集,标注信息为实际馏程温度;
在步骤S2中,随机生成多个模型参数候选值,将近红外光谱数据集输入至每个模型参数候选值对应构建的SVR优化模型,确定对应的预测馏程温度;
在步骤S3中,根据每个模型参数候选值对应的适应度函数,对所有模型参数候选值进行排序,确定候选队列,其中,适应度函数根据实际馏程温度和预测馏程温度之间的误差而确定;
在步骤S4中,根据候选队列的排序,依次给每个模型参数候选值分配对应的搜索空间,并在对应的搜索空间内繁殖更新,确定对应的更新候选值;
在步骤S5中,根据每个更新候选值的适应度函数进行排序,更新候选列队,判断更新后的候选队列是否满足迭代终止条件;
在步骤S6中,若满足,则停止迭代,将更新后的候选队列中排在首位的更新候选值作为模型最优参数,若不满足,则将每个更新候选值作为模型参数候选值,返回至步骤S3中;
在步骤S7中,将模型最优参数作为SVR优化模型的最终的模型参数,完成对SVR优化模型的训练,并将SVR优化模型进行存储;
在步骤S8中,将待测柴油的近红外光谱输入至训练完备的SVR优化模型,确定对应的预测馏程温度。
在本发明实施例中,首先,对近红外光谱数据集进行有效的获取;然后,针对SVR优化模型,生成该模型对应的多个模型参数候选值;进而,对模型参数候选值进行排序,便于进行搜索和比较;接着,依据排序先后,对模型参数候选值进行搜索空间的分配,并在该搜索空间内进行更新,确定更新候选值,即对于误差越小的模型参数候选值,所分配的搜索空间越大,以此加快搜索速度;然后,在每个模型参数候选值的搜索空间内进行更新后,再重新排序,确定更新后的候选队列是否满足迭代终止条件,并将满足迭代终止条件的更新后的候选队列的首个更新候选值(即生成误差最小的更新候选值)作为模型最优参数,带入SVR优化模型即可;最后,对于训练完备的SVR优化模型,将待测柴油的近红外光谱作为输入,输出对应的预测馏程温度即可。
需要说明的是,上述馏程温度为50%蒸馏温度,其可以认为在某一温度(起始温度)开始馏出10%(重量或体积计)至某一温度馏份50%,至最终馏出90%的温度,形成整个馏出过程。这个过程是最优化的操作温度,其中,终馏点(干点)为油品在恩式装置上加热蒸馏到最后达到最高气相温度称为该油品的点(干点),而干点-初馏点=石油最后出来的气体的沸点(石油气)-最先出来的液体的沸点(沥青)。
优选地,SVR优化模型采用RBF核函数,模型参数候选值包括RBF核函数对应的正则化参数和RBF径向基核函数参数中的至少一种。作为具体实施例,本发明实施例优化支持向量机回归模型中的正则化参数C和径向基核函数参数σ。
优选地,在步骤S2之前还包括:
采用马氏距离的方法筛选出近红外光谱数据集中的界外样本;
采用多元散射校正方法和微分方法消除近红外光谱数据集中的光谱基线漂移,并对近红外光谱数据集进行平滑去噪。
作为具体实施例,本发明实施例除异常样本、对光谱进行预处理且优化了模型参数,使近红外光谱数据集能够更加真实的表征待测样品,能够提高检测结果的准确性。
需要说明的是,多元散射校正方法MSC(Multivariate scattering correction)多元散射校正经过散射校正后得到的光谱数据可以有效地消除散射影响,增强了与成分含量相关的光谱吸收信息。首先计算所有样品近红外光谱的平均光谱,然后将平均光谱作为标准光谱,每个样品的近红外光谱与标准光谱进行一元线性回归运算,求得各光谱相对于标准光谱的线性平移量(回归常数)和倾斜偏移量(回归系数),在每个样品原始光谱中减去线性平移量同时除以回归系数修正光谱的基线相对倾斜,这样每个光谱的基线平移和偏移都在标准光谱的参考下予以修正,而和样品成分含量所对应的光谱吸收信息在数据处理的全过程中没有任何影响,所以提高了光谱的信噪比。以下为具体的算法过程:
通过以下公式计算平均光谱,并将其作为理想光谱:
对理想光谱与每个样本光谱进行线性回归:
xi=mix+bi
多元散射校正公式:
式中,xij.属于光谱矩阵Xn×p的元素;n表示样本个数;p表示采集光谱的波长点数;xj.表示平均光谱的第j个元素;x表示求得的平均光谱;xi.是样本i的光谱数据;mi表示回归的系数;bi.表示回归偏移量;xi,mx即为多元散射校正后的样本的光谱。
在本发明一个具体的实施例中,结合图2来看,图2为本发明提供的样本马氏距离的示意图,各个样本与需要进行预测的样本的马氏距离的计算公式为:
优选地,结合图3来看,图3为本发明提供的随机生成模型参数候选值的流程示意图,上述步骤S2包括步骤S21至步骤S23,其中:
在步骤S21中,获取随机数;
在步骤S22中,根据预设的自变量范围,确定自变量上限和自变量下限;
在步骤S23中,根据随机数、自变量上限和自变量下限,生成m个模型参数候选值,其中,m为整数。
作为具体实施例,本发明实施例在自变量范围内采用随机的方法产生m个候选解代表m个家族,组成该节点的初始子家族群。
优选地,在步骤S3中,具体包括:
根据每个模型参数候选值对应的适应度函数的由小到大的顺序,依次对所有模型参数候选值进行排序;
根据排序后的模型参数候选值,确定候选队列。
作为具体实施例,本发明实施例对模型参数候选值进行排序,便于进行搜索和比较。
优选地,结合图4来看,图4为本发明提供的确定对应的更新候选值的流程示意图,上述步骤S4包括步骤S41至步骤S44,其中:
在步骤S41中,根据每个模型参数候选值在候选队列的位置,由小到大,依次分配给每个模型参数候选值相应的搜索空间;
在步骤S42中,每个模型参数候选值在对应的搜索空间进行无性繁殖,生成n个子代候选值;
在步骤S43中,模型参数候选值和对应的n个子代候选值进行竞争;
在步骤S44中,根据竞争结果,确定对应的更新候选值。
作为具体实施例,本发明实施例依据排序先后,对模型参数候选值进行搜索空间的分配,并在该搜索空间内进行更新,确定更新候选值,即对于误差越小的模型参数候选值,所分配的搜索空间越大,以此加快搜索速度。
优选地,分配搜索空间的方法通过如下公式表示:
其中,lbt i,j和ubt i,j分别表示在第t代进化中对应的所述候选列队中第i个所述模型参数候选值的第j个变量所分配的搜索空间的上限与下限;xt i,j是第t代进化中,候选列队中第i个模型参数候选值的第j个变量的值;Δt j.是第j个变量在第t代的取值区间长度;lbj表示自变量范围的下限;ubj表示自变量范围的下限。
作为具体实施例,本发明实施例利用候选列队的排序,对搜索空间进行有效的分配,保证误差小的模型参数候选值对应更大的搜索空间,以此加快搜索效率。
优选地,在步骤S5中,迭代终止条件包括:在更新后的候选队列中,排在首位的更新候选值的适应度函数最小。作为具体实施例,本发明实施例设置迭代终止条件,保证迭代的及时停止。
优选地,结合图5来看,图5为本发明提供的最终的模型参数的流程示意图,上述步骤S7包括步骤S71至步骤S73,其中:
在步骤S71中,当模型参数候选值为正则化参数,则对应的模型最优参数为最优正则化参数;
在步骤S72中,当模型参数候选值为RBF径向基核函数参数,则对应的模型最优参数为最优RBF径向基核函数参数;
在步骤S73中,将最优正则化参数和最优RBF径向基核函数参数作为SVR优化模型的最终的模型参数。
作为具体实施例,本发明实施例将最优正则化参数和最优RBF径向基核函数参数带入,以此确定模型最终参数,保证模型的最优。
在本发明一个具体的实施例中,结合图6至图8来看,其中,图6为本发明提供的原始的近红外光谱图,图7为本发明提供的预处理后的近红外光谱图,图8为本发明提供的测试集预测结果对比图,具体流程如下:
采集样本的近红外光谱图以及样本中柴油50%馏程温度,共390个样本(参见图6);
对数据计算马氏距离来筛选异常样本(参见上述图2,发现界外样本有3个,剔除后用于后续处理);
为了消除噪声和基线漂移,对剔除后的数据进行预处理,其中,本实施案例采用的预处理方法是对光谱数据先进行多元散射校正再一阶求导,用于后续模型构建(参见图7);
利用随机数函数产生得到的320个样本作为训练集,剩下的70个样本作为测试集;
对数据进行归一化处理;
建立50%馏程温度SVR优化模型,核函数采用了默认的RBF核函数,让正则化参数C和RBF径向基核函数参数σ在设定的范围内进行取值,采用步骤S2至步骤S6,求解出最优正则化参数C和最优RBF径向基核函数参数σ,以得到50%馏程温度训练模型,其中,具体包括:
优化变量:惩罚因子C和RBF径向基核函数参数σ;
约束条件:0≤C≤1000,0≤σ≤10(即自变量范围);
令k=1(迭代次数),在自变量范围内采用随机的方法产生m个候选解(即模型参数候选值)代表m个家族,组成该节点的初始子家族群,随机方法为:
xi,j 1=lbj+(ubj-lbj)×r i=1,2,3,m j=1,2
式中,lbj为自变量下限,ubj为自变量上限,r为随机数;
计算各家族(即各个模型参数候选值)的适应值;
根据各家族的适应值,将m个家族排成一个列队;
判断是否满足迭代终止条件,如果满足,选择排列在首位的个体作为最优解,对应的适应值作为最优值,否则再次依据更新后的候选值进行列队排序;
根据在列队中所处的位置,由小到大依次分配给各家族相应的搜索空间,其中,排在列队前面的家族分得最小的搜索空间,排在列队最后面的家族分得最大的搜索空间,分配方法为:
其中,lbt i,j和ubt i,j分别表示在第t代进化中对应的所述候选列队中第i个所述模型参数候选值的第j个变量所分配的搜索空间的上限与下限;xt i,j是第t代进化中,候选列队中第i个模型参数候选值的第j个变量的值;Δtj是第j个变量在第t代的取值区间长度;lbj表示自变量范围的下限;ubj表示自变量范围的下限;
每个家族在其搜索空间内通过无性繁殖产生n个子代,并与父代一起竞争,仅保留一个最优秀的个体代表此家族参与下一轮的家族地位竞争;
每个家族中的最优个体组成新的家族,并令k=k+1后重新执行步骤S2;
将模型准确率最高的C和σ作为最佳参数;当模型的性能相同时间,选择C较小的组合;
将最优C和σ带入支持向量机回归的模型中,对近红外光谱数据进行分析,得到训练集预测结果;存储训练出来的近红外光谱数据分析的回归模型;
具体应用时,分别进行BPNN和SVR模型以及本发明中的优化SVR模型仿真预测,得出训练集预测结果和实际值比较,通过比较参数MSE(均方误差)和R2(决定系数)与实际值比较,优化SVR模型如图,本实施案例中预测结果MSE=0.0059R2=0.9802,如表1,经过对比可知,本发明的预测结果更加准确。
表1
建模方法 | R2 | MSE | RMSEC | RMSEP |
BPNN | 0.9251 | 0.0092 | 0.0495 | 0.1058 |
SVR | 0.9642 | 0.0072 | 0.0432 | 0.0924 |
LCA-SVR | 0.9802 | 0.0059 | 0.0359 | 0.0768 |
综上,本实施案例提出的优化SVR模型建立柴油50%馏程温度近红外光谱预测,无需繁琐的实验过程,且预测结果更加准确。
实施例2
本发明实施例提供了一种基于近红外光谱检测柴油性质的装置,包括处理器以及存储器,存储器上存储有计算机程序,计算机程序被处理器执行时,实现如上所述的基于近红外光谱检测柴油性质的方法。
本发明公开了一种基于近红外光谱检测柴油性质的方法及装置,首先,对近红外光谱数据集进行有效的获取;然后,针对SVR优化模型,生成该模型对应的多个模型参数候选值;进而,对模型参数候选值进行排序,便于进行搜索和比较;接着,依据排序先后,对模型参数候选值进行搜索空间的分配,并在该搜索空间内进行更新,确定更新候选值,即对于误差越小的模型参数候选值,所分配的搜索空间越大,以此加快搜索速度;然后,在每个模型参数候选值的搜索空间内进行更新后,再重新排序,确定更新后的候选队列是否满足迭代终止条件,并将满足迭代终止条件的更新后的候选队列的首个更新候选值(即生成误差最小的更新候选值)作为模型最优参数,带入SVR优化模型即可;最后,对于训练完备的SVR优化模型,将待测柴油的近红外光谱作为输入,输出对应的预测馏程温度即可。
本发明技术方案,考虑列队的排序特性,进行相应的搜索空间分配,达到全局精确搜索的目的,并提高了搜索效率,使支持向量回归机的分类准确率更高,泛化能力更强,能提高模型精度,实现快速预测柴油性质。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种基于近红外光谱检测柴油性质的方法,其特征在于,包括步骤S1至步骤S8,其中:
在步骤S1中,获取包含标注信息的近红外光谱数据集,所述标注信息为实际馏程温度;
在步骤S2中,随机生成多个模型参数候选值,将所述近红外光谱数据集输入至每个所述模型参数候选值对应构建的SVR优化模型,确定对应的预测馏程温度;
在步骤S3中,根据每个所述模型参数候选值对应的适应度函数,对所有所述模型参数候选值进行排序,确定候选队列,其中,所述适应度函数根据所述实际馏程温度和所述预测馏程温度之间的误差而确定;
在步骤S4中,根据所述候选队列的排序,依次给每个所述模型参数候选值分配对应的搜索空间,并在对应的所述搜索空间内繁殖更新,确定对应的更新候选值;
在步骤S5中,根据每个所述更新候选值的所述适应度函数进行排序,更新所述候选列队,判断更新后的候选队列是否满足迭代终止条件;
在步骤S6中,若满足,则停止迭代,将所述更新后的候选队列中排在首位的所述更新候选值作为模型最优参数,若不满足,则将每个所述更新候选值作为所述模型参数候选值,返回至步骤S3中;
在步骤S7中,将所述模型最优参数作为SVR优化模型的最终的模型参数,完成对SVR优化模型的训练,并将所述SVR优化模型进行存储;
在步骤S8中,将待测柴油的近红外光谱输入至训练完备的SVR优化模型,确定对应的预测馏程温度。
2.根据权利要求1所述的基于近红外光谱检测柴油性质的方法,其特征在于,所述SVR优化模型采用RBF核函数,所述模型参数候选值包括所述RBF核函数对应的正则化参数和RBF径向基核函数参数中的至少一种。
3.根据权利要求1所述的基于近红外光谱检测柴油性质的方法,其特征在于,在所述步骤S2之前还包括:
采用马氏距离的方法筛选出所述近红外光谱数据集中的界外样本;
采用多元散射校正方法和微分方法消除所述近红外光谱数据集中的光谱基线漂移,并对所述近红外光谱数据集进行平滑去噪。
4.根据权利要求2所述的基于近红外光谱检测柴油性质的方法,其特征在于,在所述步骤S2中,所述随机生成多个模型参数候选值包括:
获取随机数;
根据预设的自变量范围,确定自变量上限和自变量下限;
根据所述随机数、所述自变量上限和所述自变量下限,生成m个所述模型参数候选值,其中,m为整数。
5.根据权利要求2所述的基于近红外光谱检测柴油性质的方法,其特征在于,在所述步骤S3中,具体包括:
根据每个所述模型参数候选值对应的所述适应度函数的由小到大的顺序,依次对所有所述模型参数候选值进行排序;
根据排序后的所述模型参数候选值,确定所述候选队列。
6.根据权利要求1所述的基于近红外光谱检测柴油性质的方法,其特征在于,在所述步骤S4中,具体包括:
根据每个所述模型参数候选值在所述候选队列的位置,由小到大,依次分配给每个所述模型参数候选值相应的所述搜索空间;
每个所述模型参数候选值在对应的所述搜索空间进行无性繁殖,生成n个子代候选值;
所述模型参数候选值和对应的n个子代候选值进行竞争;
根据竞争结果,确定对应的所述更新候选值。
8.根据权利要求1所述的基于近红外光谱检测柴油性质的方法,其特征在于,在所述步骤S5中,所述迭代终止条件包括:在所述更新后的候选队列中,排在首位的所述更新候选值的所述适应度函数最小。
9.根据权利要求2所述的基于近红外光谱检测柴油性质的方法,其特征在于,在步骤S7中,具体包括:
当所述模型参数候选值为所述正则化参数,则对应的所述模型最优参数为最优正则化参数;
当所述模型参数候选值为所述RBF径向基核函数参数,则对应的所述模型最优参数为最优RBF径向基核函数参数;
将所述最优正则化参数和所述最优RBF径向基核函数参数作为SVR优化模型的最终的模型参数。
10.一种基于近红外光谱检测柴油性质的装置,其特征在于,包括处理器以及存储器,存储器上存储有计算机程序,计算机程序被处理器执行时,实现根据权利要求1-9任一项所述的基于近红外光谱检测柴油性质的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110344588.2A CN113125377B (zh) | 2021-03-30 | 2021-03-30 | 一种基于近红外光谱检测柴油性质的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110344588.2A CN113125377B (zh) | 2021-03-30 | 2021-03-30 | 一种基于近红外光谱检测柴油性质的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113125377A true CN113125377A (zh) | 2021-07-16 |
CN113125377B CN113125377B (zh) | 2024-02-23 |
Family
ID=76775645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110344588.2A Active CN113125377B (zh) | 2021-03-30 | 2021-03-30 | 一种基于近红外光谱检测柴油性质的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113125377B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114354534A (zh) * | 2021-12-30 | 2022-04-15 | 中国航空油料有限责任公司 | 利用二元线性分类器建立航空煤油性质预测模型的方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060213554A1 (en) * | 2005-03-23 | 2006-09-28 | Marathon Ashland Petroleum Llc | Method and apparatus for analysis of relative levels of biodiesel in fuels by near-infrared spectroscopy |
CN103308463A (zh) * | 2013-06-28 | 2013-09-18 | 中国农业大学 | 一种近红外光谱特征谱区选择方法 |
CN103344600A (zh) * | 2013-06-28 | 2013-10-09 | 中国农业大学 | 一种蚁群优化算法的近红外光谱特征波长选择方法 |
CN107748146A (zh) * | 2017-10-20 | 2018-03-02 | 华东理工大学 | 一种基于近红外光谱检测的原油属性快速预测方法 |
CN107817223A (zh) * | 2017-10-20 | 2018-03-20 | 华东理工大学 | 快速无损实时预测原油性质模型的构建方法及其应用 |
CN108693139A (zh) * | 2018-05-18 | 2018-10-23 | 云南拓宝科技有限公司 | 电子烟油理化指标的近红外光谱预测模型建立方法及应用 |
CN108898242A (zh) * | 2018-06-07 | 2018-11-27 | 武汉理工大学 | 一种多目标原油选购优化方法 |
CN109324013A (zh) * | 2018-10-08 | 2019-02-12 | 华东理工大学 | 一种利用高斯过程回归模型构建原油性质近红外快速分析的方法 |
CN111007040A (zh) * | 2019-12-27 | 2020-04-14 | 黑龙江八一农垦大学 | 大米食味品质近红外光谱快速评价方法 |
WO2021036546A1 (zh) * | 2019-08-29 | 2021-03-04 | 山东科技大学 | 基于有偏估计的近红外定量分析模型构建方法 |
-
2021
- 2021-03-30 CN CN202110344588.2A patent/CN113125377B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060213554A1 (en) * | 2005-03-23 | 2006-09-28 | Marathon Ashland Petroleum Llc | Method and apparatus for analysis of relative levels of biodiesel in fuels by near-infrared spectroscopy |
CN103308463A (zh) * | 2013-06-28 | 2013-09-18 | 中国农业大学 | 一种近红外光谱特征谱区选择方法 |
CN103344600A (zh) * | 2013-06-28 | 2013-10-09 | 中国农业大学 | 一种蚁群优化算法的近红外光谱特征波长选择方法 |
CN107748146A (zh) * | 2017-10-20 | 2018-03-02 | 华东理工大学 | 一种基于近红外光谱检测的原油属性快速预测方法 |
CN107817223A (zh) * | 2017-10-20 | 2018-03-20 | 华东理工大学 | 快速无损实时预测原油性质模型的构建方法及其应用 |
CN108693139A (zh) * | 2018-05-18 | 2018-10-23 | 云南拓宝科技有限公司 | 电子烟油理化指标的近红外光谱预测模型建立方法及应用 |
CN108898242A (zh) * | 2018-06-07 | 2018-11-27 | 武汉理工大学 | 一种多目标原油选购优化方法 |
CN109324013A (zh) * | 2018-10-08 | 2019-02-12 | 华东理工大学 | 一种利用高斯过程回归模型构建原油性质近红外快速分析的方法 |
WO2021036546A1 (zh) * | 2019-08-29 | 2021-03-04 | 山东科技大学 | 基于有偏估计的近红外定量分析模型构建方法 |
CN111007040A (zh) * | 2019-12-27 | 2020-04-14 | 黑龙江八一农垦大学 | 大米食味品质近红外光谱快速评价方法 |
Non-Patent Citations (2)
Title |
---|
陈志;涂斌;彭博;郑晓;何东平;: "应用近红外光谱技术对植物油酸值预测的研究", 食品科技, no. 12, 20 December 2015 (2015-12-20) * |
马泉;史彬;鄢烈祥;: "柴油加氢双塔分馏系统模拟与多目标优化", 计算机与应用化学, no. 07, 28 July 2017 (2017-07-28) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114354534A (zh) * | 2021-12-30 | 2022-04-15 | 中国航空油料有限责任公司 | 利用二元线性分类器建立航空煤油性质预测模型的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113125377B (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109493287B (zh) | 一种基于深度学习的定量光谱数据分析处理方法 | |
Yun et al. | A hybrid variable selection strategy based on continuous shrinkage of variable space in multivariate calibration | |
CN112635063B (zh) | 一种肺癌预后综合预测模型、构建方法及装置 | |
WO2021073541A1 (zh) | 一种基于光谱相似度的校正集和验证集的选择及建模方法 | |
CN106650314A (zh) | 预测氨基酸突变的方法及系统 | |
CN110726694A (zh) | 光谱变量梯度集成遗传算法的特征波长选择方法和系统 | |
CN111795944B (zh) | 一种改进团队进步算法的近红外光谱波长筛选方法 | |
CN105431854B (zh) | 用于分析生物样品的方法和设备 | |
CN114093515A (zh) | 一种基于肠道菌群预测模型集成学习的年龄预测方法 | |
CN114741603A (zh) | 基于用户聚类和商品聚类的混合协同过滤推荐算法 | |
US20230009725A1 (en) | Use of genetic algorithms to determine a model to identity sample properties based on raman spectra | |
CN107480441B (zh) | 一种儿童脓毒性休克预后预测的建模方法及系统 | |
CN108519347A (zh) | 一种基于二进制蜻蜓算法的红外光谱波长选择方法 | |
Li et al. | Quantitative analysis of aflatoxin B1 of peanut by optimized support vector machine models based on near-infrared spectral features | |
CN109801681B (zh) | 一种基于改进的模糊聚类算法的snp选择方法 | |
CN116026795A (zh) | 一种基于反射透射光谱的水稻籽粒品质性状无损预测方法 | |
CN113125377B (zh) | 一种基于近红外光谱检测柴油性质的方法及装置 | |
Li et al. | Improvement of NIR prediction ability by dual model optimization in fusion of NSIA and SA methods | |
Farina et al. | Sparsity in transformers: A systematic literature review | |
CN114062306B (zh) | 一种近红外光谱数据分段预处理方法 | |
CN116519661A (zh) | 一种基于卷积神经网络的大米识别检测方法 | |
Watthaisong et al. | Comparative Evaluation of Imbalanced Data Management Techniques for Solving Classification Problems on Imbalanced Datasets | |
CN115995262A (zh) | 基于随机森林及lasso回归解析玉米遗传机理的方法 | |
CN115541531A (zh) | 基于二维相关光谱预测饲料中蛋白质含量的方法 | |
CN116108963A (zh) | 一种基于集成学习模块的电力碳排放预测方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |