CN114783538A - 一种煤炭灰分预测方法及装置 - Google Patents
一种煤炭灰分预测方法及装置 Download PDFInfo
- Publication number
- CN114783538A CN114783538A CN202210419261.1A CN202210419261A CN114783538A CN 114783538 A CN114783538 A CN 114783538A CN 202210419261 A CN202210419261 A CN 202210419261A CN 114783538 A CN114783538 A CN 114783538A
- Authority
- CN
- China
- Prior art keywords
- sample
- ash
- spectral
- coal
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/71—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light thermally excited
- G01N21/718—Laser microanalysis, i.e. with formation of sample plasma
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Crystallography & Structural Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Artificial Intelligence (AREA)
- Pathology (AREA)
- General Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Plasma & Fusion (AREA)
- Optics & Photonics (AREA)
- Immunology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明提供一种煤炭灰分预测方法及装置,包括:获取待测煤炭的目标光谱特征;将所述目标光谱特征输入至灰分预测模型,确定由所述灰分预测模型输出的目标灰分浓度值;所述灰分预测模型是利用多个带有灰分浓度标签的样本光谱特征进行训练后得到的。本发明提供的煤炭灰分预测方法及装置,通过获取待测煤炭的目标光谱特征,利用灰分预测模型对目标光谱特征进行灰分浓度的实时检测,在提高对煤炭质量的检测效率的同时,还提高了煤灰分测定准确度,有助于煤炭的质量评定及煤厂的选择。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种煤炭灰分预测方法。
背景技术
煤含灰分量的多少是关系到煤炭价格的主要因素,同时也是影响煤炭质量的重要因素。
目前煤炭灰分的标准测定的常用方法为灼烧称重法以及快灰快浮等人工测灰法,灼烧称重法根据燃烧前、后的重量比得出杂质百分含量。
上述方法耗时耗力、效率低下,导致信息反馈滞后,无法实时检测煤炭质量。
发明内容
本发明提供一种煤炭灰分预测方法及装置,用以解决现有技术中无法实时检测煤炭质量的缺陷,实现对煤炭的灰分浓度值的实时检测。
本发明提供一种煤炭灰分预测方法,包括:
获取待测煤炭的目标光谱特征;
将所述目标光谱特征输入至灰分预测模型,确定由所述灰分预测模型输出的目标灰分浓度值;所述灰分预测模型是利用多个带有灰分浓度标签的样本光谱特征进行训练后得到的。
根据本发明提供的一种煤炭灰分预测方法,在所述将所述目标光谱特征输入至灰分预测模型之前,还包括:
获取多个样本光谱数据,以及各样本光谱数据对应的灰分浓度标签;
根据每个样本光谱数据与所述每个样本光谱数据对应的灰分浓度标签,确定所述每个样本光谱数据对应的灰分浓度值,以及所述每个样本光谱数据中各特征元素的特征值;
确定所述各特征元素的特征值和灰分浓度值之间的互信息量;
根据互信息量非零的特征元素,确定每个样本光谱数据对应的样本非零光谱特征;
根据各样本非零光谱特征,确定多个训练样本;
利用所述多个训练样本,对所述灰分预测模型进行训练。
根据本发明提供的一种煤炭灰分预测方法,所述根据各样本非零光谱特征,确定多个训练样本,包括:
根据各样本非零光谱特征的分布区间,生成多个样本合成光谱特征,以及每个样本合成光谱特征对应的灰分浓度标签;
根据所有的样本非零光谱特征和所述多个样本合成光谱特征,确定多个样本光谱特征;
将每个样本光谱特征与所述每个样本光谱特征对应的灰分浓度标签的组合,作为一个训练样本,获取多个训练样本。
根据本发明提供的一种煤炭灰分预测方法,所述利用所述多个训练样本,对所述灰分预测模型进行训练,包括:
将所述多个训练样本划分为训练集和验证集;
将所述训练集中任一训练样本输入至所述灰分预测模型,获取所述灰分预测模型输出的所述训练集中任一训练样本对应的预测灰分浓度值;
利用预设损失函数根据所述任一训练样本对应的预测灰分浓度值和所述任一训练样本中的灰分浓度标签计算损失值;
若所述损失值小于预设阈值,则利用所述验证集对所述灰分预测模型进行验证。
根据本发明提供的一种煤炭灰分预测方法,所述利用所述验证集对所述灰分预测模型进行验证,包括:
将所述验证集中任一训练样本输入至所述灰分预测模型,获取所述灰分预测模型输出的所述验证集中任一训练样本对应的验证灰分浓度值;
根据所述验证集中各训练样本对应的验证灰分浓度值和灰分浓度标签,确定所述灰分预测模型在所述验证集上的平均绝对误差、R方以及平均相对误差。
根据本发明提供的一种煤炭灰分预测方法,所述获取多个样本光谱数据,包括:
获取样本煤炭的多个初始样本光谱特征;
对每个初始样本光谱特征进行噪声去除处理,获取多个降噪样本光谱特征;
对每个降噪样本光谱特征进行标准化处理,获取多个标准化样本光谱特征;
提取每个标准化样本光谱特征的谱线元素特征,获取所述多个样本光谱数据。
根据本发明提供的一种煤炭灰分预测方法,所述获取待测煤炭的目标光谱特征,包括:
对所述待测煤炭进行激光诱导击穿,获取待测光谱数据;
根据所述待测光谱数据,确定所述目标光谱特征。
本发明还提供一种煤炭灰分预测装置,包括:
获取模块,用于获取待测煤炭的目标光谱特征;
确定模块,用于将所述目标光谱特征输入至灰分预测模型,确定由所述灰分预测模型输出的目标灰分浓度值;所述灰分预测模型是利用多个带有灰分浓度标签的样本光谱特征进行训练后得到的。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述煤炭灰分预测方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述煤炭灰分预测方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述煤炭灰分预测方法。
本发明提供的煤炭灰分预测方法及装置通过获取待测煤炭的目标光谱特征,利用灰分预测模型对目标光谱特征进行灰分浓度的实时检测,在提高对煤炭质量的检测效率的同时,还提高了煤灰分测定准确度,有助于煤炭的质量评定及煤厂的选择。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的煤炭灰分预测方法的流程示意图之一;
图2是本发明提供的煤炭灰分预测方法的流程示意图之二;
图3是本发明提供的煤炭灰分预测装置的结构示意图;
图4是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
煤炭所含的灰分越高,对于煤炭加工利用的各种场合来说也就越不利,所以各大煤炭厂必须加大对煤灰分的测定,这不仅仅可以正确的评价煤炭质量而且对煤炭质量的加工具有重的现实意义。
传统的方法不仅检测结果滞后,且经常出现产品灰分超标的问题,已不能适应现代煤炭加工与利用,也不能满足企业为实现高效生产对煤炭快速测灰、在线检测的需求。
近几年,也出现了新的检测技术对煤炭灰分进行在线检测,如X射线荧光(X-RayFluorescence,XRF)分析法、激光诱导击穿光谱(Laser-Induced BreakdownSpectroscopy,LIBS)技术。
XRF分析法能够做到实时在线检测,但是用于煤炭灰分在线分析的XRF分析仪无法检测原子序数20以前的元素,且X射线具有放射性,具有潜在的危害性。
LIBS是一种新兴的检测技术,具有多元素同时分析、无需对样品处理、对样品的破坏小、快速分析实时检测等优点,相比XRF方法,LIBS更有利于对煤炭灰分的检测。
实际上,在分析煤炭灰分中元素成分时,灰分的成分复杂且自吸效应比较严重,采用传统的单变量定量分析方法不能达到对煤炭灰分元素分析的要求,因此在分析煤炭灰分元素成分时,常采用多变量分析方法以校正自吸收效应和基体效应。其中,支持向量机回归是一种多元统计回归分析算法,可以在自变量多重相关的情况下实现对目标变量灰分量的分析,并较为容易地排除自变量中的噪声,能够解决多元线性回归中比较难分析的问题。
下面结合图1至图4描述本发明的实施例所提供的煤炭灰分预测方法及装置。
图1是本发明提供的煤炭灰分预测方法的流程示意图之一,如图1所示,包括但不限于以下步骤:
首先,在步骤S1中,获取待测煤炭的目标光谱特征。
可以利用现场设备对待测煤炭进行激光诱导击穿,采集现场待测煤炭的实时待测光谱数据,对待测光谱数据进行异常值处理、噪声去除、标准化处理和谱线元素特征提取处理,得到待测煤炭的目标光谱特征。
进一步地,在步骤S2中,将所述目标光谱特征输入至灰分预测模型,确定由所述灰分预测模型输出的目标灰分浓度值;所述灰分预测模型是利用多个带有灰分浓度标签的样本光谱特征进行训练后得到的。
灰分预测模型可以是基于支持向量回归机(Support Vector Regression,SVR)构建的。
将待测煤炭的目标光谱特征输入至优化的光谱强度特征-灰分浓度的灰分预测模型,获取由灰分预测模型输出的目标灰分浓度值,目标灰分浓度值为待测煤炭中灰分的含量值。
本发明提供的煤炭灰分预测方法,通过获取待测煤炭的目标光谱特征,利用灰分预测模型对目标光谱特征进行灰分浓度的实时检测,在提高对煤炭质量的检测效率的同时,还提高了煤灰分测定准确度,有助于煤炭的质量评定及煤厂的选择。
可选地,所述获取待测煤炭的目标光谱特征,包括:
对所述待测煤炭进行激光诱导击穿,获取待测光谱数据;
根据所述待测光谱数据,确定所述目标光谱特征。
利用现场设备对待测煤炭进行激光诱导击穿,得到待测煤炭的待测光谱数据,对待测光谱数据进行异常值处理、噪声去除、标准化处理和谱线元素特征提取处理,得到待测煤炭的目标光谱特征。
根据本发明提供的煤炭灰分预测方法,通过对待测光谱数据进行预处理,有效提高灰分预测模型对光谱特征的识别效率。
可选地,所述获取多个样本光谱数据,包括:
获取样本煤炭的多个初始样本光谱特征;
对每个初始样本光谱特征进行噪声去除处理,获取多个降噪样本光谱特征;
对每个降噪样本光谱特征进行标准化处理,获取多个标准化样本光谱特征;
提取每个标准化样本光谱特征的谱线元素特征,获取所述多个样本光谱数据。
利用现场设备对样本煤炭进行激光诱导击穿,得到样本煤炭的多个初始样本光谱特征,在去掉初始样本光谱特征中的异常值之后,再进行平滑降噪,以去除噪声,可以得到多个降噪样本光谱特征。利用光谱标准化转换矩阵对每个降噪样本光谱特征进行标准化处理,获取多个标准化样本光谱特征;提取每个标准化样本光谱特征的谱线元素特征,可以获取样本煤炭的多个样本光谱数据。
根据本发明提供的煤炭灰分预测方法,通过对初始样本光谱特征进行噪声去除、标准化处理和谱线元素特征提取等预处理,能够提高训练样本对灰分预测模型对光谱特征的训练速度。
LIBS采集到的样本光谱数据中有大量对成分分析无用的冗余信息,采用全谱数据进行建模会增加建模复杂程度,导致数据维度高,建立的灰分预测模型性能不高。
可选地,在所述将所述目标光谱特征输入至灰分预测模型之前,还包括:
获取多个样本光谱数据,以及各样本光谱数据对应的灰分浓度标签;
根据每个样本光谱数据与所述每个样本光谱数据对应的灰分浓度标签,确定所述每个样本光谱数据对应的灰分浓度值,以及所述每个样本光谱数据中各特征元素的特征值;
确定所述各特征元素的特征值和灰分浓度值之间的互信息量;
根据互信息量非零的特征元素,确定每个样本光谱数据对应的样本非零光谱特征;
根据各样本非零光谱特征,确定多个训练样本;
利用所述多个训练样本,对所述灰分预测模型进行训练。
为了得到更加精确的元素特征,使得最终拟合的模型性能更优,根据现场烧灰的规则,在样本煤炭烧灰的过程中,每个出现灰分浓度值的时间点的前半小时内,取9个时间点所对应的9条光谱元素特征值,对这9条光谱元素特征值取均值,从而得到每个灰分浓度值对应的一条高度吻合的样本光谱数据;将每个样本光谱数据对应的灰分浓度值,作为该样本光谱数据的灰分浓度标签,进而实现灰分浓度标签与其对应的样本光谱数据的对应合并。
进一步地,一条光谱的样本光谱数据对应一个灰分浓度值,这条光谱由多个特征
元素组成,包括碳元素C、镁元素Mg和硅元素Si等。为了避免样本光谱数据的维度过多,减少
冗余信息的干扰,计算该样本光谱数据中各个特征元素的特征值与灰分浓度值之间的互信
息量,去除互信息量为0的特征元素,剩下的互信息量不为0的特征元素的组合作为样本非
零光谱特征。样本光谱数据的特征值X与灰分浓度值Y值之间的互信息量,具体计算
公式如下:
其中,x是样本光谱数据中某一特征元素的特征值;y是灰分浓度标签;p(x,y)表示X=x,Y=y同时发生的概率;p(x)是X=x的发生概率;p(y)是Y=y的发生的概率。
根据本发明提供的煤炭灰分预测方法,通过挑选出对预测灰分浓度值作用大的特征元素,提高了所建模型的精度,避免数据维度过多,减少冗余信息的干扰的问题。
可选地,所述根据各样本非零光谱特征,确定多个训练样本,包括:
根据各样本非零光谱特征的分布区间,生成多个样本合成光谱特征,以及每个样本合成光谱特征对应的灰分浓度标签;
根据所有的样本非零光谱特征和所述多个样本合成光谱特征,确定多个样本光谱特征;
将每个样本光谱特征与所述每个样本光谱特征对应的灰分浓度标签的组合,作为一个训练样本,获取多个训练样本。
若某一灰分浓度区间内的样本非零光谱特征的数量过少,则确定位于该灰分浓度区间内的样本非零光谱特征为样本少数类光谱特征。由于存在各灰分浓度区间内的样本非零光谱特征的数量不平衡的情况,会导致SVR建模的型泛化能力不强,可以采用合成少数类重采样技术(Synthetic Minority Over-sampling Technique,SMOTE),利用k最近邻域算法在该灰分浓度区间内合成多个样本合成光谱特征,能够补齐各灰分浓度区间的样本非零光谱特征的数量分布,从而使各灰分浓度区间的样本非零光谱特征的数量保持一致,训练样本的分布达到平衡。
对样本非零光谱特征中的每个作为样本少数类光谱特征a,从它最近邻中随机选取一个样本非零光谱特征b,然后在a和b连线上随机选取一点作为样本合成光谱特征c,按照如下公式计算:
其中,a为样本少数类光谱特征;b为a的任一近邻样本非零光谱特征;c为样本合成光谱特征。
将所有的样本非零光谱特征和样本合成光谱特征均作为样本光谱特征,可以得到多个样本光谱特征;将每个样本光谱特征与所述每个样本光谱特征对应的灰分浓度标签的组合,作为一个训练样本,获取多个训练样本组成的数据集。
根据本发明提供的煤炭灰分预测方法,通过将数据重采样技术和特征筛选技术引入到光谱数据处理中,有效避免了数据不平衡的问题,进而提高了灰分检测模型对灰分浓度区间样本少数类光谱特征的预测性能。
可选地,所述利用所述多个训练样本,对所述灰分预测模型进行训练,包括:
将所述多个训练样本划分为训练集和验证集;
将所述训练集中任一训练样本输入至所述灰分预测模型,获取所述灰分预测模型输出的所述训练集中任一训练样本对应的预测灰分浓度值;
利用预设损失函数根据所述任一训练样本对应的预测灰分浓度值和所述任一训练样本中的灰分浓度标签计算损失值;
若所述损失值小于预设阈值,则利用所述验证集对所述灰分预测模型进行验证。
将数据集中的训练样本划分训练集和测试集:假设数据集中训练样本的数量为N,随机选取数据集中70%的训练样本作为训练集,利用该样本进行建模,剩余30%的训练样本作为测试集,用于测试模型的性能效果。
利用训练集优化灰分预测模型,找到基于C-支持向量回归机(C-Support VectorClassification,C-SVC)构建的灰分预测模型最优的参数,可以包括惩罚参数C、核函数kernel、多项式poly函数的维度degree以及核函数参数gamma。
可选地,所述利用所述验证集对所述灰分预测模型进行验证,包括:
将所述验证集中任一训练样本输入至所述灰分预测模型,获取所述灰分预测模型输出的所述验证集中任一训练样本对应的验证灰分浓度值;
根据所述验证集中各训练样本对应的验证灰分浓度值和灰分浓度标签,确定所述灰分预测模型在所述验证集上的平均绝对误差、R方以及平均相对误差。
利用测试集验证优化后的灰分预测模型的性能,评价指标包括平均绝对误差(Mean Absolute Eerror,MAE)、R方(R-squared,R2)和均方误差(Mean Square Error,MSE)。
在灰分预测模型的指标符合预设标准的情况下,确定灰分预测模型训练完成。预设标准可以包括MAE,R2和MSE均低于预设误差阈值,预设误差阈值可以根据实际需求灵活设置,预设误差阈值越小,灰分预测模型的精度越高。
训练好的灰分预测模型可部署在云端、边端或移动端,能够高效实时检测煤炭灰分。
图2是本发明提供的煤炭灰分预测方法的流程示意图之二,如图2所示,包括:
首先,初始样本光谱特征预处理,得到样本光谱数据;进一步地,将灰分浓度标签与样本光谱数据合并;进一步地,计算样本光谱数据中各个维度的特征值与灰分浓度标签之间的互信息量;进一步地,去除样本光谱数据中互信息量为零的特征值,得到样本非零光谱特征;进一步地,对所有的样本非零光谱特征进行数据重采样,确定样本合成光谱特征;进一步地,将样本非零光谱特征和样本合成光谱特征划分为训练集和测试集,用训练集建立并优化灰分预测模型,测试集通过MAE、R2、MSE指标测试并评估灰分预测模型的性能,在灰分预测模型的指标符合预设标准的情况下,确定灰分预测模型训练完成。
下面对本发明提供的煤炭灰分预测装置进行描述,下文描述的煤炭灰分预测装置与上文描述的煤炭灰分预测方法可相互对应参照。
图3是本发明提供的煤炭灰分预测装置的结构示意图,如图3所示,包括:
获取模块301,用于获取待测煤炭的目标光谱特征;
确定模块302,用于将所述目标光谱特征输入至灰分预测模型,确定由所述灰分预测模型输出的目标灰分浓度;所述灰分预测模型是利用多个带有灰分浓度标签的样本光谱特征进行训练后得到的。
首先,获取模块301获取待测煤炭的目标光谱特征。
可以利用现场设备对待测煤炭进行激光诱导击穿,采集现场待测煤炭的实时待测光谱数据,对待测光谱数据进行异常值处理、噪声去除、标准化处理和谱线元素特征提取处理,得到待测煤炭的目标光谱特征。
进一步地,确定模块302将所述目标光谱特征输入至灰分预测模型,确定由所述灰分预测模型输出的目标灰分浓度值;所述灰分预测模型是利用多个带有灰分浓度标签的样本光谱特征进行训练后得到的。
灰分预测模型可以是基于SVR构建的。
将待测煤炭的目标光谱特征输入至优化的光谱强度特征-灰分浓度的灰分预测模型,获取由灰分预测模型输出的目标灰分浓度值,目标灰分浓度值为待测煤炭中灰分的含量值。
本发明提供的煤炭灰分预测装置,通过获取待测煤炭的目标光谱特征,利用灰分预测模型对目标光谱特征进行灰分浓度的实时检测,在提高对煤炭质量的检测效率的同时,还提高了煤灰分测定准确度,有助于煤炭的质量评定及煤厂的选择。
可选地,所述获取模块301,具体用于:
对所述待测煤炭进行激光诱导击穿,获取待测光谱数据;
根据所述待测光谱数据,确定所述目标光谱特征。
利用现场设备对待测煤炭进行激光诱导击穿,得到待测煤炭的待测光谱数据,对待测光谱数据进行异常值处理、噪声去除、标准化处理和谱线元素特征提取处理,得到待测煤炭的目标光谱特征。
根据本发明提供的煤炭灰分预测装置,通过对待测光谱数据进行预处理,有效提高灰分预测模型对光谱特征的识别效率。
可选地,煤炭灰分预测装置,还包括预处理模块,用于:
获取样本煤炭的多个初始样本光谱特征;
对每个初始样本光谱特征进行噪声去除处理,获取多个降噪样本光谱特征;
对每个降噪样本光谱特征进行标准化处理,获取多个标准化样本光谱特征;
提取每个标准化样本光谱特征的谱线元素特征,获取所述多个样本光谱数据。
利用现场设备对样本煤炭进行激光诱导击穿,得到样本煤炭的多个初始样本光谱特征,在去掉初始样本光谱特征中的异常值之后,再进行平滑降噪,以去除噪声,可以得到多个降噪样本光谱特征。利用光谱标准化转换矩阵对每个降噪样本光谱特征进行标准化处理,获取多个标准化样本光谱特征;提取每个标准化样本光谱特征的谱线元素特征,可以获取样本煤炭的多个样本光谱数据。
根据本发明提供的煤炭灰分预测装置,通过对初始样本光谱特征进行噪声去除、标准化处理和谱线元素特征提取等预处理,能够提高训练样本对灰分预测模型对光谱特征的训练速度。
LIBS采集到的样本光谱数据中有大量对成分分析无用的冗余信息,采用全谱数据进行建模会增加建模复杂程度,导致数据维度高,建立的灰分预测模型性能不高。
可选地,煤炭灰分预测装置,还包括学习模块,用于:
获取多个样本光谱数据,以及各样本光谱数据对应的灰分浓度标签;
根据每个样本光谱数据与所述每个样本光谱数据对应的灰分浓度标签,确定所述每个样本光谱数据对应的灰分浓度值,以及所述每个样本光谱数据中各特征元素的特征值;
确定所述各特征元素的特征值和灰分浓度值之间的互信息量;
根据互信息量非零的特征元素,确定每个样本光谱数据对应的样本非零光谱特征;
根据各样本非零光谱特征,确定多个训练样本;
利用所述多个训练样本,对所述灰分预测模型进行训练。
为了得到更加精确的元素特征,使得最终拟合的模型性能更优,根据现场烧灰的规则,在样本煤炭烧灰的过程中,每个出现灰分浓度值的时间点的前半小时内,取9个时间点所对应的9条光谱元素特征值,对这9条光谱元素特征值取均值,从而得到每个灰分浓度值对应的一条高度吻合的样本光谱数据;将每个样本光谱数据对应的灰分浓度值,作为该样本光谱数据的灰分浓度标签,进而实现灰分浓度标签与其对应的样本光谱数据的对应合并。
进一步地,一条光谱的样本光谱数据对应一个灰分浓度值,这条光谱由多个特征
元素组成,比如C、Mg、Si等等。为了避免样本光谱数据的维度过多,减少冗余信息的干扰,计
算该样本光谱数据中各个特征元素的特征值与灰分浓度值之间的互信息量,去除互信息量
为0的特征元素,剩下的互信息量不为0的特征元素的组合作为样本非零光谱特征。样本光
谱数据的特征值X与灰分浓度值Y值之间的互信息量,具体计算公式如下:
其中,x是样本光谱数据中某一特征元素的特征值;y是灰分浓度标签;p(x,y)表示X=x,Y=y同时发生的概率;p(x)是X=x的发生概率;p(y)是Y=y的发生的概率。
根据本发明提供的煤炭灰分预测装置,通过挑选出对预测灰分浓度值作用大的特征元素,提高了所建模型的精度,避免数据维度过多,减少冗余信息的干扰的问题。
可选地,学习模块包括合成子模块,用于:
根据各样本非零光谱特征的分布区间,生成多个样本合成光谱特征,以及每个样本合成光谱特征对应的灰分浓度标签;
根据所有的样本非零光谱特征和所述多个样本合成光谱特征,确定多个样本光谱特征;
将每个样本光谱特征与所述每个样本光谱特征对应的灰分浓度标签的组合,作为一个训练样本,获取多个训练样本。
若某一灰分浓度区间内的样本非零光谱特征的数量过少,则确定位于该灰分浓度区间内的样本非零光谱特征为样本少数类光谱特征。由于存在各灰分浓度区间内的样本非零光谱特征的数量不平衡的情况,会导致SVR建模的型泛化能力不强,可以采用SMOTE重采样技术,利用k最近邻域算法在该灰分浓度区间内合成多个样本合成光谱特征,能够补齐各灰分浓度区间的样本非零光谱特征的数量分布,从而使各灰分浓度区间的样本非零光谱特征的数量保持一致,训练样本的分布达到平衡。
对样本非零光谱特征中的每个作为样本少数类光谱特征a,从它最近邻中随机选取一个样本非零光谱特征b,然后在a和b连线上随机选取一点作为样本合成光谱特征c,按照如下公式计算:
其中,a为样本少数类光谱特征;b为a的任一近邻样本非零光谱特征;c为样本合成光谱特征。
将所有的样本非零光谱特征和样本合成光谱特征均作为样本光谱特征,可以得到多个样本光谱特征;将每个样本光谱特征与所述每个样本光谱特征对应的灰分浓度标签的组合,作为一个训练样本,获取多个训练样本组成的数据集。
根据本发明提供的煤炭灰分预测装置,通过将数据重采样技术和特征筛选技术引入到光谱数据处理中,有效避免了数据不平衡的问题,进而提高了灰分检测模型对灰分浓度区间样本少数类光谱特征的预测性能。
可选地,学习模块还包括训练子模块和验证子模块,训练子模块用于:
将所述多个训练样本划分为训练集和验证集;
将所述训练集中任一训练样本输入至所述灰分预测模型,获取所述灰分预测模型输出的所述训练集中任一训练样本对应的预测灰分浓度值;
利用预设损失函数根据所述任一训练样本对应的预测灰分浓度值和所述任一训练样本中的灰分浓度标签计算损失值;
验证子模块,用于若所述损失值小于预设阈值,则利用所述验证集对所述灰分预测模型进行验证。
将数据集中的训练样本划分训练集和测试集:假设数据集中训练样本的数量为N,随机选取数据集中70%的训练样本作为训练集,利用该样本进行建模,剩余30%的训练样本作为测试集,用于测试模型的性能效果。
利用训练集优化灰分预测模型,找到找到基于C-SVC构建的灰分预测模型最优的参数,可以包括惩罚参数C、核函数kernel、多项式poly函数的维度degree以及核函数参数gamma。
可选地,验证子模块,具体用于:
将所述验证集中任一训练样本输入至所述灰分预测模型,获取所述灰分预测模型输出的所述验证集中任一训练样本对应的验证灰分浓度值;
根据所述验证集中各训练样本对应的验证灰分浓度值和灰分浓度标签,确定所述灰分预测模型在所述验证集上的平均绝对误差、R方以及平均相对误差。
利用测试集验证优化后的灰分预测模型的性能,评价指标包括MAE、R2和MSE。
在灰分预测模型的指标符合预设标准的情况下,确定灰分预测模型训练完成。预设标准可以包括MAE,R2和MSE均低于对应的预设误差阈值,每个预设误差阈值可以根据实际需求灵活设置,预设误差阈值越小,灰分预测模型的精度越高。
训练好的灰分预测模型可部署在云端、边端或移动端,能够高效实时检测煤炭灰分。
图4是本发明提供的电子设备的结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行煤炭灰分预测方法,该方法包括:获取待测煤炭的目标光谱特征;将所述目标光谱特征输入至灰分预测模型,确定由所述灰分预测模型输出的目标灰分浓度值;所述灰分预测模型是利用多个带有灰分浓度标签的样本光谱特征进行训练后得到的。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的煤炭灰分预测方法,该方法包括:获取待测煤炭的目标光谱特征;将所述目标光谱特征输入至灰分预测模型,确定由所述灰分预测模型输出的目标灰分浓度值;所述灰分预测模型是利用多个带有灰分浓度标签的样本光谱特征进行训练后得到的。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的煤炭灰分预测方法,该方法包括:获取待测煤炭的目标光谱特征;将所述目标光谱特征输入至灰分预测模型,确定由所述灰分预测模型输出的目标灰分浓度值;所述灰分预测模型是利用多个带有灰分浓度标签的样本光谱特征进行训练后得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种煤炭灰分预测方法,其特征在于,包括:
获取待测煤炭的目标光谱特征;
将所述目标光谱特征输入至灰分预测模型,确定由所述灰分预测模型输出的目标灰分浓度值;所述灰分预测模型是利用多个带有灰分浓度标签的样本光谱特征进行训练后得到的。
2.根据权利要求1所述的煤炭灰分预测方法,其特征在于,在所述将所述目标光谱特征输入至灰分预测模型之前,还包括:
获取多个样本光谱数据,以及各样本光谱数据对应的灰分浓度标签;
根据每个样本光谱数据与所述每个样本光谱数据对应的灰分浓度标签,确定所述每个样本光谱数据对应的灰分浓度值,以及所述每个样本光谱数据中各特征元素的特征值;
确定所述各特征元素的特征值和灰分浓度值之间的互信息量;
根据互信息量非零的特征元素,确定每个样本光谱数据对应的样本非零光谱特征;
根据各样本非零光谱特征,确定多个训练样本;
利用所述多个训练样本,对所述灰分预测模型进行训练。
3.根据权利要求2所述的煤炭灰分预测方法,其特征在于,所述根据各样本非零光谱特征,确定多个训练样本,包括:
根据各样本非零光谱特征的分布区间,生成多个样本合成光谱特征,以及每个样本合成光谱特征对应的灰分浓度标签;
根据所有的样本非零光谱特征和所述多个样本合成光谱特征,确定多个样本光谱特征;
将每个样本光谱特征与所述每个样本光谱特征对应的灰分浓度标签的组合,作为一个训练样本,获取多个训练样本。
4.根据权利要求2所述的煤炭灰分预测方法,其特征在于,所述利用所述多个训练样本,对所述灰分预测模型进行训练,包括:
将所述多个训练样本划分为训练集和验证集;
将所述训练集中任一训练样本输入至所述灰分预测模型,获取所述灰分预测模型输出的所述训练集中任一训练样本对应的预测灰分浓度值;
利用预设损失函数根据所述任一训练样本对应的预测灰分浓度值和所述任一训练样本中的灰分浓度标签计算损失值;
若所述损失值小于预设阈值,则利用所述验证集对所述灰分预测模型进行验证。
5.根据权利要求4所述的煤炭灰分预测方法,其特征在于,所述利用所述验证集对所述灰分预测模型进行验证,包括:
将所述验证集中任一训练样本输入至所述灰分预测模型,获取所述灰分预测模型输出的所述验证集中任一训练样本对应的验证灰分浓度值;
根据所述验证集中各训练样本对应的验证灰分浓度值和灰分浓度标签,确定所述灰分预测模型在所述验证集上的平均绝对误差、R方以及平均相对误差。
6.根据权利要求2所述的煤炭灰分预测方法,其特征在于,所述获取多个样本光谱数据,包括:
获取样本煤炭的多个初始样本光谱特征;
对每个初始样本光谱特征进行噪声去除处理,获取多个降噪样本光谱特征;
对每个降噪样本光谱特征进行标准化处理,获取多个标准化样本光谱特征;
提取每个标准化样本光谱特征的谱线元素特征,获取所述多个样本光谱数据。
7.根据权利要求1至6中任一项所述的煤炭灰分预测方法,其特征在于,所述获取待测煤炭的目标光谱特征,包括:
对所述待测煤炭进行激光诱导击穿,获取待测光谱数据;
根据所述待测光谱数据,确定所述目标光谱特征。
8.一种煤炭灰分预测装置,其特征在于,包括:
获取模块,用于获取待测煤炭的目标光谱特征;
确定模块,用于将所述目标光谱特征输入至灰分预测模型,确定由所述灰分预测模型输出的目标灰分浓度值;所述灰分预测模型是利用多个带有灰分浓度标签的样本光谱特征进行训练后得到的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述煤炭灰分预测方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述煤炭灰分预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210419261.1A CN114783538A (zh) | 2022-04-21 | 2022-04-21 | 一种煤炭灰分预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210419261.1A CN114783538A (zh) | 2022-04-21 | 2022-04-21 | 一种煤炭灰分预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114783538A true CN114783538A (zh) | 2022-07-22 |
Family
ID=82430637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210419261.1A Pending CN114783538A (zh) | 2022-04-21 | 2022-04-21 | 一种煤炭灰分预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114783538A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116223480A (zh) * | 2022-12-29 | 2023-06-06 | 南京工业大学 | 煤化工污泥重金属含量检测方法及系统 |
-
2022
- 2022-04-21 CN CN202210419261.1A patent/CN114783538A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116223480A (zh) * | 2022-12-29 | 2023-06-06 | 南京工业大学 | 煤化工污泥重金属含量检测方法及系统 |
CN116223480B (zh) * | 2022-12-29 | 2023-12-19 | 南京工业大学 | 煤化工污泥重金属含量检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7138753B2 (ja) | 画像欠陥検出方法、装置、電子機器、記憶媒体および製品 | |
CN111177655B (zh) | 一种数据处理方法、装置及电子设备 | |
CN112527604A (zh) | 一种基于深度学习的运维检测方法、系统、电子设备及介质 | |
CN110689524B (zh) | 一种无参考在线图像清晰度评价方法与系统 | |
CN110020637B (zh) | 一种基于多粒度级联森林的模拟电路间歇故障诊断方法 | |
CN111343147A (zh) | 一种基于深度学习的网络攻击检测装置及方法 | |
CN114783538A (zh) | 一种煤炭灰分预测方法及装置 | |
Ekundayo | Wrapper feature selection based heterogeneous classifiers for software defect prediction | |
CN110376154A (zh) | 基于光谱校正的水果在线检测方法及系统 | |
TWI428581B (zh) | 辨識光譜的方法 | |
CN111914490A (zh) | 一种基于深度卷积随机森林自编码的泵站机组状态评价方法 | |
CN116775741A (zh) | 一种工程竣工决算的审计方法及相关装置 | |
Nie et al. | Machine vision-based apple external quality grading | |
CN113127342B (zh) | 基于电网信息系统特征选择的缺陷预测方法及装置 | |
CN114264626A (zh) | 一种基于时间序列残差网络的织物无损定量分析方法 | |
CN113239075A (zh) | 一种施工数据自检方法及系统 | |
CN113657656A (zh) | 贷款数据分析预测方法及装置 | |
CN117929356B (zh) | 一种基于高斯过程回归的libs定量分析方法 | |
CN114580982B (zh) | 一种工业设备的数据质量的评估方法、装置及设备 | |
CN117805024B (zh) | 一种酥梨糖精度检测方法、装置、云端设备及计算机装置 | |
CN114720436B (zh) | 基于荧光高光谱成像的农产品品质参数检测方法及设备 | |
CN116453437B (zh) | 显示屏模组的测试方法、装置、设备及存储介质 | |
Doan et al. | A Novel Mango Grading System Based on Image Processing and Machine Learning Methods | |
US20240013369A1 (en) | Image defect detecting system, generation method of image defect detecting system and non-transitory computer readable medium | |
CN114813631B (zh) | 小麦品种纯度检测方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |