CN116858818A - 基于拉曼光谱的硫化锑矿物品位的定量预测分析方法及装置 - Google Patents
基于拉曼光谱的硫化锑矿物品位的定量预测分析方法及装置 Download PDFInfo
- Publication number
- CN116858818A CN116858818A CN202310046496.5A CN202310046496A CN116858818A CN 116858818 A CN116858818 A CN 116858818A CN 202310046496 A CN202310046496 A CN 202310046496A CN 116858818 A CN116858818 A CN 116858818A
- Authority
- CN
- China
- Prior art keywords
- spectrum
- antimony sulfide
- raman spectrum
- data
- grade
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- YPMOSINXXHVZIL-UHFFFAOYSA-N sulfanylideneantimony Chemical compound [Sb]=S YPMOSINXXHVZIL-UHFFFAOYSA-N 0.000 title claims abstract description 55
- 238000001237 Raman spectrum Methods 0.000 title claims abstract description 45
- 229910052569 sulfide mineral Inorganic materials 0.000 title claims abstract description 19
- 238000004458 analytical method Methods 0.000 title claims abstract description 16
- 238000000034 method Methods 0.000 claims abstract description 51
- 238000005188 flotation Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 14
- 238000012937 correction Methods 0.000 claims abstract description 10
- 229910052787 antimony Inorganic materials 0.000 claims abstract description 5
- WATWJIUSRGPENY-UHFFFAOYSA-N antimony atom Chemical compound [Sb] WATWJIUSRGPENY-UHFFFAOYSA-N 0.000 claims abstract description 5
- 238000001228 spectrum Methods 0.000 claims description 38
- 238000004422 calculation algorithm Methods 0.000 claims description 29
- 239000011159 matrix material Substances 0.000 claims description 22
- 238000003066 decision tree Methods 0.000 claims description 21
- 230000003595 spectral effect Effects 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000009499 grossing Methods 0.000 claims description 14
- 239000006260 foam Substances 0.000 claims description 13
- 238000005259 measurement Methods 0.000 claims description 13
- 238000007637 random forest analysis Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 9
- 238000001069 Raman spectroscopy Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 claims description 3
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 210000000299 nuclear matrix Anatomy 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 239000012467 final product Substances 0.000 claims description 2
- 238000004445 quantitative analysis Methods 0.000 abstract description 11
- 238000012795 verification Methods 0.000 abstract 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 15
- 239000011707 mineral Substances 0.000 description 15
- 210000004027 cell Anatomy 0.000 description 7
- 238000012545 processing Methods 0.000 description 4
- 239000002994 raw material Substances 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000010410 layer Substances 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000012921 fluorescence analysis Methods 0.000 description 1
- 239000004088 foaming agent Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000009828 non-uniform distribution Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Landscapes
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Pathology (AREA)
- Evolutionary Computation (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明公开了一种基于拉曼光谱的硫化锑矿物品位的定量预测分析方法及装置。本发明首先对样本进行预处理(去噪、基线校正),选择硫化锑定量分析的特征波长,以及建立多变量的校准模型。根据锑浮选主要步骤中硫化锑的含量,提出了基于LWMKPLS定量分析的硫化锑含量多变量标定模型。该模型通过将原矿样品中硫化锑含量数据分为训练集和验证集,分别对模型进行训练和测试,证明该方法可以提高定量分析模型的预测精度。本发明对各种复杂的硫化锑矿物的品位都能实现准确完整的定量分析过程,为硫化锑矿物含量的定量分析提供了一条新途径。
Description
技术领域
本发明涉及光谱分析领域,特别涉及一种基于拉曼光谱的硫化锑矿物品位的定量预测分析方法及装置。
背景技术
矿物资源是现代工业发展中不可获缺的原材料,通常是由地质作用后经过几千甚至上亿年的演变而形成,为现代化建设提供了巨大价值。因此,矿物作为一种不可重生的重要资源,为人类社会的高速发展提供了所需的金属与无机原材料,在经济发展和科技创新等领域提供了稳定性的保障作用。在能源消耗中,有95%以上直接或间接来源于矿物资源,超过80%的工业原材料也来自于矿物资源。有色金属矿物作为矿物资源的典型代表,是重要的原材料与战略物质,同时也是电脑、半导体设备中关键组件的基础性材料,发挥着越来越重要的地位。
目前,工业中采用浮选工艺富集锑矿中的硫化锑。浮选工艺以表面化学为基础,根据矿物不同的理化性质,通过组合药剂添加,再鼓入足量的空气后,矿粒选择性吸附在空气泡沫表面后上升至浮选槽表层。堆积的泡沫通过溢口流出后收集,从而富集有用矿物。化学试剂如起泡剂、捕收剂以及硫酸等,工艺流程中的变量如充气量、液面高度等,其数值大小主要取决于浮选槽中硫化锑的含量。在实际的浮选生产中,矿厂主要采用化学离线检测的方式测量硫化锑的含量,该方法对于样品的制备和检测时间较长,存在较大误差,无法满足企业需要及时可靠的物质含量信息的需求。
发明内容
为了解决目前浮选过程中浮选槽泡沫中矿物品位难以检测的技术问题,本发明提供一种基于拉曼光谱的硫化锑矿物品位的定量预测分析方法及装置。
为了实现上述技术目的,本发明的技术方案是,
一种基于拉曼光谱的硫化锑矿物品位的定量预测分析方法,包括以下步骤:
S1,利用拉曼光谱仪从浮选槽的泡沫层采集若干份硫化锑的拉曼光谱样本;
S2,对步骤S1采集到的样本数据进行平滑滤波操作,获得平滑的拉曼光谱谱图;
S3,对步骤S2所得的拉曼光谱谱图进行去除荧光背景基线校正;
S4,对步骤S3得到的拉曼光谱谱图进行特征波长点的筛选;
S5,基于局部加权混合核偏最小二乘回归模型,采用处理后的样本进行训练,从而获得用于硫化锑矿物品位的定量预测模型,以实现对于硫化锑矿物品位的定量预测分析。
所述的方法,步骤S1中,采集若干份硫化锑的拉曼光谱样本的步骤为:
S101,预先采集不同硫化锑品位的拉曼光谱样本若干份;
S102,确定拉曼光谱样本中的硫化锑精确品位;
S103,按照预设的精度递增的关系选择不同品位的泡沫样本,且在同一品位选择多份样本作为初始建模样本。
所述的方法,步骤S2中,进行平滑滤波操作的步骤包括:
S201,基于Savitzky-Golay算法对每份拉曼光谱测量结果进行平滑处理,即利用最小二乘策略对数据进行多项式拟合处理,以拟合多项式的阶数为p,采用光谱点范围内2r+1数据点进行拟合:
其中r为窗口的宽度大小,Xi *表示平滑处理后的光谱向量,c0,ci,c2,...cp为光谱参数,i和k表示任意选取的代表参数;
S202,对步骤S201拟合的数据点利用最小二乘拟合求残差Q为:
其中Xi与Xi *分别表示平滑处理前后的同一个光谱向量;Xi *的值由原始光谱向量中,以光谱点Xi为中心,范围2r+1数据点的加权平均求得;j为设置的窗口中心;
S203,对步骤S202所求的Q,分别对光谱参数求偏导并解出对应的系数值,代入步骤S201的公式得到:
其中,wi代表权重系数,Xi代表平滑处理前的光谱向量。
所述的方法,步骤S3中,去除荧光背景基线校正,是采用基于双加权惩罚最小二乘的光谱基线校正算法对每份样本的每一次拉曼光谱测量结果进行基线校正处理,包括:
S301,首先:
F=W||Y-Z||2+λ(IN-ηW)||D2Z||2+||D1Z||2
其中,F为目标函数,W为输入光谱与拟合背景基线之间的惩罚因子所组成的左对角矩阵,Y为输入光谱,Z为拟合背景基线,λ为平滑参数,IN为单位矩阵,η为调节参数且取值范围限制在[0,1],矩阵D1、D2为一、二阶求导矩阵,定义为:
S302,对步骤S301得到的F求导,并令其等于0,得到光谱基线表达式为:
其中T表示矩阵转置;
S303,筛选测试光谱数据Y0,并设置参数λ、η、最大迭代次数maxiter和ratio;
S304,基于S302的公式进行迭代,并在每次迭代后判断是否满足迭代条件:|Wt-Wt -1|/|Wt-1|<ratio,如果不满足则继续迭代,否则结束迭代,最后得到迭代拟合基线Z,并将迭代结束后获得的光谱Y减Z,从而获得校正后拉曼光谱。
所述的方法,步骤S4中,对拉曼光谱谱图进行特征波长点的筛选,是基于组合随机森林、极端随机树和XGBoost算法,分别训练各森林模型,通过相应的策略组合计算波长在各森林模型中的重要程度后,均值加权求取各波长的重要程度,最后选取排序靠前的波长作为特征波长筛选结果。
所述的方法,步骤S4中,在组合随机森林计算波长重要程度时,采用袋外数据错误率进行分析,对于随机森林中的每一棵决策树,基于对应的袋外数据测试该树的性能,则特征的重要程度计算方法为:
其中,F为决策树的个数,OOBerror1、OOBerror2为预测误差率;
采用极端随机树算法计算波长重要程度时,是将基决策树均分为两部分,一部分采用所有数据训练决策树,另一部分则重采样构建决策树,其中重要程度的计算方法为Extra-Treesimp;
采用XGBoost算法计算波长重要程度时,是基于下式计算:
其中,为特征t的重要程度的平均和,N为决策树的个数,/>为特征t的重要程度,Tm为第m个决策树。
所述的方法,步骤S5中,获得用于硫化锑矿物品位的定量预测模型的方法为:
S501:基于Grubbs准则剔除每份样本40次测量结果中特征峰峰值过高或过低的光谱数据,并对剩余光谱测量结果求取平均,作为此份样本的代表光谱;
S502:对相同硫化锑品位下20份样本的代表光谱求取平均,作为此品位硫化锑的代表光谱;计算方法为:
其中M为样本的个数;
S503:在局部加权混合核偏最小二乘即LWMKPLS回归模型训练中,使用相似度值对用于训练的样本数据进行加权操作,即在高维空间中对输入变量Φ与输出变量Y进行加权,计算方法为:
Φw=WΦ,Yw=WY
从而得到训练数据的核矩阵Ktrain,w为:
Ktrain,w=ΦwΦw T=WΦ(WΦ)T=WΦΦTWT=WΦΦTWT=WKtrainWT
预测数据xpre与训练数据之间的核矩阵为:
Kpre,w=φ(xpre)Φw T=φ(xpre)ΦTWT=KpreW
S504:根据步骤S503,计算得到局部加权核偏最小二乘的系数矩阵为:
其中为零均值处理后的核矩阵,则对于预测锑矿光谱,计算方法为:
其中矩阵T和U为求解过程中计算的主成分矩阵。
一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现前述的方法。
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如前述的方法。
本发明的技术效果在于,通过测量不同品位浮选槽硫化锑样本的拉曼光谱并建立定量预测模型,获取浮选槽泡沫中硫化锑的拉曼光谱并带入预测模型中得到矿物品位,有效的解决了矿物浮选过程中浮选槽泡沫中硫化锑矿物品位难以在线测定的问题,从而进一步提高了工业现场的测量精度。本发明针对浮选槽泡沫中矿物分布非均匀问题提出了基于Grubbs(莱茵达)准则的异常光谱剔除算法,并基于双加权最小二乘算法消除荧光背景基线,基于集成森林算法筛选出特征波长以及在模型建立中应用LWMKPLS(核偏最小二乘)方法将非线性的自变量映射到高维特征空间,映射后的高维空间数据可以看作是线性的,并作为新的输入特征,因变量作为输出,利用偏最小二乘回归建立模型,大大提高了定量预测模型精度和与预测速度,能够满足浮选槽泡沫中硫化锑矿物品位定量分析对测量精确性和时效性的要求。
附图说明
图1为本发明所述矿物品位定量分析系统流程图。
图2为本发明基于集成森林的特征波长选择算法流程图。
图3为本发明基于LWMKPLS算法的硫化锑矿物拉曼光谱定量分析流程图。
具体实施方式
下面结合具体实施例,并参照附图,对本发明作进一步详细说明。
本实施例中提及的拉曼光谱是一种散射光谱,它可以提供分子振动频率相关的信息,可以对水溶液进行直接测量,样本处理较为简单,因此十分适合于浮选过程浮选槽泡沫的硫化锑矿物品位定量分析。
参见附图1所示,本实施例所述的方法,包括以下步骤:
S1:利用拉曼光谱仪从浮选槽的泡沫层采集若干份硫化锑的拉曼光谱样本。
S101:预先采集不同硫化锑品位的拉曼光谱样本若干份。
S102:本实施例中,在实验室中采用XRF荧光分析方法确定拉曼光谱样本中的硫化锑精确品位。
S103:本实施例中,按照0.1%的精度递增的关系选择不同硫化锑品位的泡沫样本以及同一品位选择20份样本作为初始建模样本。
S2:对步骤S1采集到的样本数据进行平滑滤波操作,获得平滑的拉曼光谱谱图。
S201:采用基于Savitzky-Golay算法(简称S-G算法)的方法对每份样本的每一次拉曼光谱测量结果进行平滑处理。S-G算法计算方法是利用最小二乘策略对数据进行多项式拟合处理。假设拟合多项式阶数为p,采用光谱点范围内2r+1数据点进行拟合:
S202:对步骤S201所得的数据点利用最小二乘拟合求残差为:
S203:对步骤S202所求的目标函数,S-G算法的求解是使目标函数Q取值最小,因此分别对光谱参数c0,ci,c2,...cp求得。其中Xi与Xi *分别表示平滑处理前后,光谱向量中的同一个元素。Xi *的值由原始光谱向量中,以光谱点Xi为中心,范围2r+1数据点的加权平均求得。计算方法为:
解该方程组对应的系数值c0,ci,c2,...cp,其中
由于S-G算法设置窗口中心为j=0,得
其中即为平滑后的拉曼光谱。
S3:对步骤S2所得的基于拉曼光谱获得的硫化锑谱图进行去除荧光背景基线校正。
S301:采用基于双加权惩罚最小二乘的光谱基线校正算法对每份样本的每一次拉曼光谱测量结果进行基线校正处理。计算方法为:
F=W||Y-Z||2+λ(IN-ηW)||D2Z||2+||D1Z||2
其中,矩阵W是由惩罚因子组成的左对角矩阵,表示为:
向量Y表示需基线校正的光谱,其长度为N:
Y={y1,y2,...,yN}
向量Z表示在迭代过程中的拟合基线:
矩阵D1和D2定义如下:
η为调节参数,并且取值范围限制在[0,1],t为迭代次数,λ为平滑参数,IN为单位矩阵。
S302:根据步骤S301得到的目标函数,对其求导,并令其等于0,可得光谱基线表达式为:
其中T表示矩阵转置。
S303:输入测试光谱数据Y0,并设置参数λ、η。
S304:迭代结束,得到迭代拟合基线Z,将光谱Y减Z,即可获得校正后拉曼光谱。
S4:对步骤S3得到的拉曼光谱谱图进行特征波长点的筛选。
S401:采用Random Forest算法计算波长重要度的方法时采用袋外数据错误率进行分析,对于随机森林中的每一棵决策树,基于对应的袋外数据测试该树的性能,计算预测误差率OOBerror1。对袋外数据中的特征分别添加噪声干扰产生新的数据集,再次计算预测误差率OOBerror2,因此在该决策树中,该特征的重要性度记为(OOBerror2-OOBerror1)。假设随机森林包含F棵决策树,则特征的重要程度计算方法为:
S402:采用Extra-Trees算法计算波长重要度的方法为:将基决策树均分为两部分,一部分采用所有数据训练决策树,另一部分则重采样构建决策树,重要程度的计算方法为Extra-Treesimp。
S403:采用XGBoost算法计算波长重要度的方法为:在XGBoost算法中,对于包含J个分支结构的树T,如果选择j为该树上的分裂变量,表示特征t的重要程度为每棵树上该特征值的平均和,XGBoost集成N棵决策树的重要程度计算方法为:
S404:根据步骤S401、S402、S403,通过融合Random Forest、Extra-Trees和XGBoost筛选干扰较少且与硫化锑品位相关的波长作为特征波长。
S5:根据以上步骤,最终建立硫化锑品位预测模型。
S501:基于Grubbs准则剔除每份样本40次测量结果中特征峰峰值过高或过低的光谱数据并对剩余光谱测量结果求取平均,作为此份样本的代表光谱。
S502:对相同硫化锑品位下20份样本的代表光谱求取平均,作为此品位硫化锑的代表光谱。计算方法为:
其中M为样本的个数。
S503:局部加权混合核偏最小二乘回归算法通过核技巧将原始数据映射到高维希尔伯特空间,模型精度会更佳。在LWMKPLS回归模型训练中,使用相似度值对训练样本数据进行加权操作,即在高维空间中对输入变量Φ与输出变量Y进行加权:计算方法为:
Φw=WΦ,Yw=WY
S504:根据步骤S503,可计算局部加权核偏最小二乘的系数矩阵为:
其中为零均值处理后的核矩阵,因此对于预测锑矿光谱,计算方法为:
其中矩阵T和U为求解过程中计算的主成分矩阵。
本实例中,首先通过拉曼光谱仪获取多组硫化锑光谱谱图,然后再对获取的拉曼光谱谱图进行S-G滤波平滑处理,接着采用双加权偏最小二乘算法对其进行荧光背景基线校正,从而实现了消除拉曼光谱谱图荧光背景基线干扰的目的,进而采用基于集成森林的特征波长筛选算法,从而实现了筛选出与后续定量分析相关性最大的波长信息的目的。最后使用得到预处理之后的硫化锑拉曼光谱谱图采用基于加权混合核偏最小二乘算法构造了硫化锑矿物品位的定量分析模型,进而总结出一种基于拉曼光谱的硫化锑矿物品分析方法,达到了理想的定量分析效果。
根据本发明的实施例,本发明还提供了一种电子设备和一种计算机可读介质。
其中电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现前述的方法。
具体使用中,用户能够通过作为终端设备的电子设备并基于网络来与同样作为电子设备的服务器进行交互,实现接收或发送消息等功能。终端设备一般是设有显示装置、基于人机界面来使用的各种电子设备,包括但不限于智能手机、平板电脑、笔记本电脑和台式电脑等。其中终端设备上根据需要可安装各种具体的应用软件,包括但不限于网页浏览器软件、即时通信软件、社交平台软件、购物软件等。
服务器是用于提供各种服务的网络服务端,如对收到的从终端设备传输过来的硫化锑光谱谱图提供相应定量预测分析的后台服务器。以实现对接收到的硫化锑光谱谱图基于模型来训练并进行定量预测分析,并将最终的定量预测分析结果返回至终端设备。
本实施例所提供的方法一般由服务器执行,在实际运用中,在满足必要条件下,终端设备亦可直接执行定量预测分析。
类似的,本发明的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的定量预测分析方法。
Claims (9)
1.一种基于拉曼光谱的硫化锑矿物品位的定量预测分析方法,其特征在于,包括以下步骤:
S1,利用拉曼光谱仪从浮选槽的泡沫层采集若干份硫化锑的拉曼光谱样本;
S2,对步骤S1采集到的样本数据进行平滑滤波操作,获得平滑的拉曼光谱谱图;
S3,对步骤S2所得的拉曼光谱谱图进行去除荧光背景基线校正;
S4,对步骤S3得到的拉曼光谱谱图进行特征波长点的筛选;
S5,基于局部加权混合核偏最小二乘回归模型,采用处理后的样本进行训练,从而获得用于硫化锑矿物品位的定量预测模型,以实现对于硫化锑矿物品位的定量预测分析。
2.根据权利要求1所述的方法,其特征在于,步骤S1中,采集若干份硫化锑的拉曼光谱样本的步骤为:
S101,预先采集不同硫化锑品位的拉曼光谱样本若干份;
S102,确定拉曼光谱样本中的硫化锑精确品位;
S103,按照预设的精度递增的关系选择不同品位的泡沫样本,且在同一品位选择多份样本作为初始建模样本。
3.根据权利要求1所述的方法,其特征在于,步骤S2中,进行平滑滤波操作的步骤包括:
S201,基于Savitzky-Golay算法对每份拉曼光谱测量结果进行平滑处理,即利用最小二乘策略对数据进行多项式拟合处理,以拟合多项式的阶数为p,采用光谱点范围内2r+1数据点进行拟合:
其中r为窗口的宽度大小,Xi *表示平滑处理后的光谱向量,c0,ci,c2,...cp为光谱参数,i和k表示任意选取的代表参数;
S202,对步骤S201拟合的数据点利用最小二乘拟合求残差Q为:
其中Xi与Xi *分别表示平滑处理前后的同一个光谱向量;Xi *的值由原始光谱向量中,以光谱点Xi为中心,范围2r+1数据点的加权平均求得;j为设置的窗口中心;
S203,对步骤S202所求的Q,分别对光谱参数求偏导并解出对应的系数值,代入步骤S201的公式得到:
其中,wi代表权重系数,Xi代表平滑处理前的光谱向量。
4.根据权利要求1所述的方法,其特征在于,步骤S3中,去除荧光背景基线校正,是采用基于双加权惩罚最小二乘的光谱基线校正算法对每份样本的每一次拉曼光谱测量结果进行基线校正处理,包括:
S301,首先:
F=W||Y-Z||2+λ(IN-ηW)||D2Z||2+||D1Z||2
其中,F为目标函数,W为输入光谱与拟合背景基线之间的惩罚因子所组成的左对角矩阵,Y为输入光谱,Z为拟合背景基线,λ为平滑参数,IN为单位矩阵,η为调节参数且取值范围限制在[0,1],矩阵D1、D2为一、二阶求导矩阵,定义为:
S302,对步骤S301得到的F求导,并令其等于0,得到光谱基线表达式为:
其中T表示矩阵转置;
S303,筛选测试光谱数据Y0,并设置参数λ、η、最大迭代次数maxiter和ratio;
S304,基于S302的公式进行迭代,并在每次迭代后判断是否满足迭代条件:|Wt-Wt-1|/|Wt-1|<ratio,如果不满足则继续迭代,否则结束迭代,最后得到迭代拟合基线Z,并将迭代结束后获得的光谱Y减Z,从而获得校正后拉曼光谱。
5.根据权利要求1所述的方法,其特征在于,步骤S4中,对拉曼光谱谱图进行特征波长点的筛选,是基于组合随机森林、极端随机树和XGBoost算法,分别训练各森林模型,通过相应的策略组合计算波长在各森林模型中的重要程度后,均值加权求取各波长的重要程度,最后选取排序靠前的波长作为特征波长筛选结果。
6.根据权利要求5所述的方法,其特征在于,步骤S4中,在组合随机森林计算波长重要程度时,采用袋外数据错误率进行分析,对于随机森林中的每一棵决策树,基于对应的袋外数据测试该树的性能,则特征的重要程度计算方法为:
其中,F为决策树的个数,OOBerror1、OOBerror2为预测误差率;
采用极端随机树算法计算波长重要程度时,是将基决策树均分为两部分,一部分采用所有数据训练决策树,另一部分则重采样构建决策树,其中重要程度的计算方法为Extra-Treesimp;
采用XGBoost算法计算波长重要程度时,是基于下式计算:
其中,为特征t的重要程度的平均和,N为决策树的个数,It 2为特征t的重要程度,Tm为第m个决策树。
7.根据权利要求1所述的方法,其特征在于,步骤S5中,获得用于硫化锑矿物品位的定量预测模型的方法为:
S501:基于Grubbs准则剔除每份样本40次测量结果中特征峰峰值过高或过低的光谱数据,并对剩余光谱测量结果求取平均,作为此份样本的代表光谱;
S502:对相同硫化锑品位下20份样本的代表光谱求取平均,作为此品位硫化锑的代表光谱;计算方法为:
其中M为样本的个数;
S503:在局部加权混合核偏最小二乘即LWMKPLS回归模型训练中,使用相似度值对用于训练的样本数据进行加权操作,即在高维空间中对输入变量Φ与输出变量Y进行加权,计算方法为:
Φw=WΦ,Yw=WY
从而得到训练数据的核矩阵Ktrain,w为:
Ktrain,w=ΦwΦw T=WΦ(WΦ)T=WΦΦTWT=WΦΦTWT=WKtrainWT
预测数据xpre与训练数据之间的核矩阵为:
Kpre,w=φ(xpre)Φw T=φ(xpre)ΦTWT=KpreW
S504:根据步骤S503,计算得到局部加权核偏最小二乘的系数矩阵为:
其中为零均值处理后的核矩阵,则对于预测锑矿光谱,计算方法为:
其中矩阵T和U为求解过程中计算的主成分矩阵。
8.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310046496.5A CN116858818A (zh) | 2023-01-31 | 2023-01-31 | 基于拉曼光谱的硫化锑矿物品位的定量预测分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310046496.5A CN116858818A (zh) | 2023-01-31 | 2023-01-31 | 基于拉曼光谱的硫化锑矿物品位的定量预测分析方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116858818A true CN116858818A (zh) | 2023-10-10 |
Family
ID=88227352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310046496.5A Pending CN116858818A (zh) | 2023-01-31 | 2023-01-31 | 基于拉曼光谱的硫化锑矿物品位的定量预测分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116858818A (zh) |
-
2023
- 2023-01-31 CN CN202310046496.5A patent/CN116858818A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Haas et al. | Updating the decision aids for tunneling | |
CN102622473A (zh) | 基于贝叶斯理论的步进应力加速退化试验优化设计方法 | |
CN104778298A (zh) | 基于egmm的高斯过程回归软测量建模方法 | |
CN108959844B (zh) | 采用分子模拟方法评价聚合物材料流动性能的方法及系统 | |
Fan et al. | Predictive quantile regressions under persistence and conditional heteroskedasticity | |
CN113642666B (zh) | 一种基于样本扩充和筛选的主动增强软测量方法 | |
van Rossum et al. | A method for optimization and validation of moving average as continuous analytical quality control instrument demonstrated for creatinine | |
CN114861120B (zh) | 浮选泡沫品位计算方法、装置、电子设备及介质 | |
Clark et al. | Using beta binomials to estimate classification uncertainty for ensemble models | |
CN111143768A (zh) | 一种基于arima-svm组合模型的空气质量预测算法 | |
Wang et al. | Assessing the sensitivity of land-atmosphere coupling strength to boundary and surface layer parameters in the WRF model over Amazon | |
Morgado et al. | Monte Carlo bottom-up evaluation of global instrumental quantification uncertainty: Flexible and user-friendly computational tool | |
CN112750507A (zh) | 基于混合机器学习模型的同时检测水中硝酸盐和亚硝酸盐含量的方法 | |
CN111460672A (zh) | 基于Simulink的水质模型多参数敏感性分析方法 | |
Morgado et al. | Monte Carlo bottom-up evaluation of the uncertainty of complex sample preparation: Elemental determination in sediments | |
CN103389360B (zh) | 基于概率主元回归模型的脱丁烷塔丁烷含量软测量方法 | |
CN117610195A (zh) | 一种带钢宽展的预测方法、装置、介质以及电子设备 | |
CN113793057A (zh) | 一种基于回归分析模型的建筑招投标数据生成方法 | |
CN116858818A (zh) | 基于拉曼光谱的硫化锑矿物品位的定量预测分析方法及装置 | |
CN111461329A (zh) | 一种模型的训练方法、装置、设备及可读存储介质 | |
CN106485049A (zh) | 一种基于蒙特卡洛交叉验证的nirs异常样本的检测方法 | |
Friginal et al. | Multi-criteria analysis of measures in benchmarking: Dependability benchmarking as a case study | |
CN110879873A (zh) | 一种基于哈密顿蒙特卡洛采样的vine copula相关性描述的软测量方法及系统 | |
CN115728290A (zh) | 一种土壤中铬元素的检测方法、系统、设备及存储介质 | |
CN112377177B (zh) | 油藏采收率预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |