CN115841594B - 基于注意力机制的煤矸高光谱变图像域数据识别方法 - Google Patents
基于注意力机制的煤矸高光谱变图像域数据识别方法 Download PDFInfo
- Publication number
- CN115841594B CN115841594B CN202211587979.8A CN202211587979A CN115841594B CN 115841594 B CN115841594 B CN 115841594B CN 202211587979 A CN202211587979 A CN 202211587979A CN 115841594 B CN115841594 B CN 115841594B
- Authority
- CN
- China
- Prior art keywords
- coal gangue
- hyperspectral
- layer
- information
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003245 coal Substances 0.000 title claims abstract description 140
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000007246 mechanism Effects 0.000 title claims abstract description 24
- 238000001228 spectrum Methods 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000012360 testing method Methods 0.000 claims abstract description 29
- 238000007781 pre-processing Methods 0.000 claims abstract description 21
- 230000004927 fusion Effects 0.000 claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims description 53
- 238000012545 processing Methods 0.000 claims description 42
- 230000003595 spectral effect Effects 0.000 claims description 37
- 238000010606 normalization Methods 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 12
- 230000009466 transformation Effects 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 7
- 238000009499 grossing Methods 0.000 claims description 5
- 230000008901 benefit Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 206010063385 Intellectualisation Diseases 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本实施例公开了一种基于注意力机制的煤矸高光谱变图像域数据识别方法;其中方法包括:对采集的煤矸高光谱数据进行预处理,获取具有特征级融合信息的高光谱RGB图像;基于该高光谱RGB图像构建训练集和测试集;构建煤矸分类识别模型,煤矸分类识别模型包括依次串联的EBAM层、Transformer Encoder层和MLP Head层;在训练集上对煤矸分类识别结果模型进行训练,并采用损失函数对训练的煤矸分类识别结果模型进行验证;在测试集上对训练后的煤矸分类识别结果模型进行测试,获得煤矸识别结果;本申请构建了一种新型煤矸分类识别模型,通过构建的EBAM层利用卷积层对煤矸石光谱信息进行卷积操作,有效提高煤矸识别的准确率。
Description
技术领域
本公开涉及煤矸识别技术领域,尤其涉及一种基于注意力机制的煤矸高光谱变图像域数据识别方法。
背景技术
煤矿智能化是实现煤炭工业高质量发展的核心技术支撑,煤矸石的识别和分选又是煤矿智能化的重要组成部分。在煤矿开采中,大量的煤矸石与原煤混合,容易造成污染,降低原煤的燃烧热;因此,将煤矸进行分选将有助于提高最终煤炭的质量。
近年来,煤矸干选的研究和应用发展迅速,包括射线透视检测、激光检测、图像检测等。射线透视检测技术(如伽马射线和X射线)易于实现集成,但在使用过程中存在辐射,因此需要进行辐射隔离。图像检测易受到各种干扰因素(如照明不均匀和照明不良)的影响,导致表面和纹理差异不可见,而且煤矸石周围的灰尘也可能会降低识别性能。
现有技术中公开的采用经典卷积神经网络模型对煤和矸石图像进行识别分类,存在运行速度慢,对煤和矸石图像中感兴趣区域的复杂像素信息特征提取能力不高,以及没有优秀的全局建模能力的缺陷。
发明内容
有鉴于此,本公开实施例提供了一种基于注意力机制的煤矸高光谱变图像域数据识别方法、系统,能够至少解决现有技术中存在的煤矸识别不精准、识别周期长、特征提取能力差的问题,实现煤矸的精准、快速识别。
第一方面,本公开实施例提供了一种基于注意力机制的煤矸高光谱变图像域数据识别方法,采用如下技术方案:
对采集的煤矸高光谱数据进行预处理,获取具有特征级融合信息的高光谱RGB图像;
基于所述高光谱RGB图像构建训练集和测试集;
构建煤矸分类识别模型,所述煤矸分类识别模型包括依次串联的EBAM层、Transformer Encoder层和MLP Head层;
在所述训练集上对所述煤矸分类识别结果模型进行训练,并采用损失函数对训练的所述煤矸分类识别结果模型进行验证;
在所述测试集上对训练后的煤矸分类识别结果模型进行测试,获得煤矸识别结果。
可选的,所述高光谱RGB图像的获取方法包括:
采用近红外光谱仪多次采集的煤矸高光谱数据,获得的平均值为初始煤矸高光谱数据;
对所述初始煤矸高光谱数据采用一阶微分处理,获得的光谱信息作为图像的R通道信息;
对所述初始煤矸高光谱数据采用Savitzky-Golay(SG)卷积平滑处理,获得的光谱信息作为图像的G通道信息;
对所述初始煤矸高光谱数据采用标准正态变量变换处理,获得的光谱信息作为图像的B通道信息;
将所述R通道信息、所述G通道信息、所述B通道信息分别转换为R像素矩阵、G像素矩阵、B像素矩阵;
对所述R像素矩阵、所述G像素矩阵、所述B像素矩阵分别进行归一化处理,获得R像素预处理矩阵、G像素预处理矩阵、B像素预处理矩阵;
融合所述R像素预处理矩阵、所述G像素预处理矩阵、所述B像素预处理矩阵为一个RGB像素矩阵,获得具有特征级融合信息的所述高光谱RGB图像。
可选的,所述训练集、所述测试集的构建包括:将所述第二煤矸高光谱数据按7:3的比例随机分配,以获取所述训练集、所述测试集。
可选的,所述EBAM层包括依次串联的第一卷积层、BAM层和第二卷积层;
所述第一卷积层用于输出光谱卷积特征;所述第一卷积层设置有32个卷积核,每个卷积核的尺寸均为1×3,卷积步长为3;
所述BAM层包括通道注意力模块、空间注意力模块,所述通道注意力模块、所述空间注意力模块分别对所述光谱卷积特征处理,获得光谱特征;
所述第二卷积层用于对所述光谱特征处理,获得光谱特征向量;其中,所述第二卷积层设置有64个卷积核,每个卷积核的尺寸均为1×1,卷积步长为1。
可选的,所述Transformer Encoder层包括依次串联的第一归一化层、多头注意力层、第二归一化层和全连接层;
所述第一归一化层用于对所述光谱特征向量进行归一化处理,得到第一煤矸信息;
所述多头注意力层用于对所述第一煤矸信息处理以获取多头自注意力值;
所述第二归一化层用于对多头自注意力值进行归一化处理,获得第二煤矸信息;
所述全连接层用于对所述第二煤矸信息处理,以获得第三煤矸信息。
可选的,所述MLPHead层用于对所述第三煤矸信息进行处理,以获得煤光谱信息和矸石光谱信息。
可选的,所述损失函数为交叉熵损失函数。
第二方面,本公开实施例还提供了一种基于注意力机制的煤矸高光谱变图像域数据识别系统,包括:
预处理模块,配置为对采集的煤矸高光谱数据进行预处理,获取具有特征级融合信息的高光谱RGB图像;
数据集构建模块,配置为基于高光谱RGB图像构建训练集和测试集;
模型构建模块,配置为构建煤矸分类识别模型;
训练模块,配置为在训练集上对煤矸分类识别结果模型进行训练,并采用损失函数对训练的煤矸分类识别结果模型进行验证;
识别模块,配置为在所述测试集上对训练后的煤矸分类识别结果模型进行测试,以获得煤矸识别结果。
第三方面,本公开实施例还提供了一种电子设备,采用如下技术方案:
所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行以上任一所述的基于注意力机制的煤矸高光谱变图像域数据识别方法。
第四方面,本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行以上任一所述的基于注意力机制的煤矸高光谱变图像域数据识别方法。
本申请中公开的基于注意力机制的煤矸高光谱变图像域数据识别方法,提供一种新型Vision Transformer网络模型,通过构建的EBAM层对煤矸石光谱信息进行卷积操作,生成多尺度高分辨率的注意力特征;通过构建的煤矸分类识别模型,不仅具有局部感知、共享权重和自动进行特征提取的优点,同时具有动态注意、全局上下文融合、更好的泛化的优点,实现对煤矸的精准识别。
上述说明仅是本公开技术方案的概述,为了能更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为让本公开的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请中的基于注意力机制的煤矸高光谱变图像域数据识别方法的逻辑流程图。
图2为图1中的高光谱RGB图像获取流程图。
图3为图1中的煤矸分类识别模型构成示意图。
图4为图2中的BAM层示意图。
图5为本公开实施例提供的一种电子设备的原理框图。
具体实施方式
下面结合附图对本公开实施例进行详细描述。
应当明确,以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目各方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
参照图1至图4,本申请的第一方面公开了一种基于注意力机制的煤矸高光谱变图像域数据识别方法,包括以下步骤:
S100,通过搭建的数据收集平台中的近红外光谱仪采集煤与矸石混合的煤矸高光谱数据。
数据收集平台包括近红外光谱仪、卤素灯和计算机等设备,近红外光谱仪用于采集光谱数据;计算机通过USB与近红外光谱仪连接,收集并处理光谱数据。
具体地,使用近红外光谱仪采集的煤矸高光谱数据,测量十次取平均值,获得初始煤矸高光谱数据,通过一阶微分处理后获得的光谱信息作为图像的R通道信息,通过Savitzky-Golay(SG)卷积平滑处理后获得的光谱信息作为图像的G通道信息,通过标准正态变量变换处理后获得的光谱信息作为图像的B通道信息,将R通道信息、G通道信息、B通道信息分别转换为R像素矩阵、G像素矩阵、B像素矩阵,然后对R像素矩阵、G像素矩阵、B像素矩阵进行归一化处理,获得R像素预处理矩阵、G像素预处理矩阵、B像素预处理矩阵;然后将三个矩阵融合成一个RGB像素矩阵,生成具有特征级融合信息的高光谱RGB图像。
一阶微分公式为:其中,Δλ为一阶微分的波长间隔,yi,λ+Δλ和yi,λ-Δλ分别为波长点为λ+Δλ和λ-Δλ的光谱反射率;y′i,λ为波长点λ的一阶微分光谱反射率。
Savitzky-Golay(SG)卷积平滑方法公式为:其中,yi,j为波长为j的光谱数据;n为滤波窗口宽度,取n=2r+1;/>为Savitzky-Golay卷积平滑后的数据。
标准正态变量变换法公式:
yi,k为第i个样本在k个波长点的光谱吸光度;m为光谱的维数。
通过本申请公开的数据处理方法,处理后获得的三通道信息维数更低,只包含主要信息,之后低维信息转化为具有特征级信息相融合的RGB图像;将高光谱数据转化为图像这种预处理方法具有易于部署和提高煤矸识别分类的优势。
进一步地,对采集的煤矸高光谱数据还可以通过构造HSV向量进行预处理,获得高光谱HSV向量,然后基于高光谱HSV向量构建训练集和测试集。具体地,将高光谱数据分别构建H通道、S通道和V通道,对V通道进行亮度调整,对S通道进行饱和度校正,将H通道、S通道和V通道三个通道合并,得到处理后的煤矸高光谱HSV图像。
利用小波变换把V通道分为高频部分和低频部分;对高频部分做去噪处理,对低频部分利用伽马校正进行亮度调整。
对S通道进行饱和度校正的公式为:其中,VI为调整完毕的亮度分量,SI为校正完毕的饱和度分量,t为变换系数。
S200,基于高光谱RGB图像构建训练集和测试集;具体地,将高光谱RGB图像按7:3的比例随机分配,以获取用于训练网络模型的训练集、用于测试网络模型准确率的测试集;并将煤的数据设置标签为煤,矸石的数据设置标签为矸石。
S300,构建煤矸分类识别模型,煤矸分类识别模型包括依次串联的EBAM层、Transformer Encoder层和MLP Head层,其中,EBAM层包括依次串联的第一卷积层、BAM层和第二卷积层,第一卷积层用于输出光谱卷积特征;BAM层通过通道注意力模块、空间注意力模块分别对光谱卷积特征处理,以获得光谱特征;第二卷积层用于对光谱特征处理,以获得光谱特征向量。
第一卷积层设置有32个卷积核,每个卷积核的尺寸均为1×3,卷积步长为3。
第二卷积层设置有64个卷积核,每个卷积核的尺寸均为1×1,卷积步长为1。
具体地,在第一卷积层后进行正则化处理,即经过修正线性单元激活函数得到光谱卷积特征。
对于光谱卷积特征,通过并联设置的通道注意力模块、空间注意力模块进行处理;具体地,通过通道注意力模块将输入的光谱卷积特征经过全局平均池化编码成一维特征向量,使得每个通道都具有全局感受野;然后,经过全连接层对一维特征向量进行降维操作,并使用Relu(Rectified Linear Unit,修正线性单元)激活函数进行非线性处理;然后再利用全连接层进行升维操作,完成第一特征提取,输出光谱通道特征MC(U);MC(U)=BN(W1(W0AvgPool(U)))。
通过空间注意力模块对光谱卷积特征经过1×1卷积进行降维操作,然后利用两个卷积核尺寸为3×3的空洞卷积提取特征信息,空洞卷积具有更大的感受野。
最后,利用1×1卷积映射到1*w*h,完成第二特征提取,输出光谱空间特征MS(U);
基于光谱通道特征、光谱空间特征获得光谱特征U′,然后将光谱特征输入到第二卷积层进行卷积操作。
U′=U+U·σ(MC(U)+MS(U)),其中,U为光谱卷积特征。
经过第二卷积层卷积操作后的光谱信息先经过线性变换进行归一化处理,随后将经过线性变换后的信息增加一个位置编码,从而确定每一部分的光谱信息拥有在原始光谱信息中的位置信息,然后将经过上述操作后的光谱特征向量送入到Transformer Encoder层内提取特征,在使用Transformer Encoder层中的多头自注意力时,对光谱特征添加位置编码,有利于学习关联特征。
Transformer Encoder层包括依次串联的第一归一化层、多头注意力层、第二归一化层和全连接层,需要说明的是,第一归一化层、第二归一化层均为归一化层,两者的设置不同而已。
第一归一化层用于对光谱特征向量进行归一化处理,得到第一煤矸信息。
多头注意力层用于对第一煤矸信息处理以获取多头自注意力值,具体地,多头自注意层中的多头注意力机制,允许模型在不同的位置共同关注来自不同表示子空间的信息,现有技术中公开的单独使用一个自注意力机制,是不能得到丰富的特征信息。
光谱特征学习过程具体为:Q=Wq·a;K=Wk·a;V=Wv·a;其中a为光谱特征矩阵,Wq为由查询向量q(query)组成的权重矩阵,Wk为由键向量k(key)组成的权重矩阵,Wv为由值向量v(value)组成的权重矩阵。
使用缩放点积作为注意力机制:
其中,dk是键向量维度的平方根,在自注意力机制中,自注意力的输出是值向量v的加权求和,分配给每个值向量的权重通过查询向量q和当前键向量k的相关程度,获得多头自注意力机制:
MultiHead(Q,K,V)=Concat(head1,head2,...,headh)W0;
其中,/>为可学习参数。
多头自注意力机制的输入由Q、K、V变成了选用12头自注意力机制,在维度上,将Q、K、V的维度由原来的12n维变成n维,每一次计算一个头,然后将12次的缩放点积自注意力结果进行拼接,通过Wo进行线性变换,得到最终的多头自注意力值。
第二归一化层用于对多头自注意力值进行归一化处理,获得第二煤矸信息,以作为全连接层的输入。
全连接层用于对第二煤矸信息处理,以获得第三煤矸信息;全连接层的计算公式为:ZL=MLP(LN(headi))。
经过L个Transformer Encoder层得到的光谱特征输入到MLP Head层。
MLP Head层用于对第三煤矸信息进行处理,即将Transformer Encoder层提取后的特征通过MLP Head层进行煤和矸石的分类,以获得精准的煤光谱信息和矸石光谱信息。具体地,MLP Head层由三层全连接层组成,参数分别为100、10、2;将煤矸石光谱数据集输入改进后的网络,依次经过上述结构最后输出分类结果,得到煤矸石预测值。
S400,在训练集上对煤矸分类识别结果模型进行训练,并采用损失函数对训练的煤矸分类识别结果模型进行验证。
在本实施例中,损失函数优选为交叉熵损失函数。
具体地,使用交叉熵损失函数计算煤矸识别分类结果和正确煤矸石标签之间的差距,并通过Adam优化器反向传播优化网络中的超参数;批量大小设置为64。
其中,初始学习率定义为5×e-4,每4个epoch下降0.5倍,总的训练次数被定义为50次。
S500,在测试集上对训练后的煤矸分类识别结果模型进行测试,获得煤矸识别结果;具体地,在测试中,判断网络是否收敛,如是则训练结束,否则继续训练,以获得训练好的煤矸分类识别模型。
进一步地,对于第一煤矸高光谱数据的预处理,还可以采用多种方法进行预处理,然后将多种方法处理后的多种光谱数据转化为一张RGB图像,以此获得特征级融合信息。
本申请通过构建的煤矸分类识别模型,提出一种新型Vision Transformer网络模型,通过构建的EBAM层利用卷积层对煤矸石光谱信息进行卷积操作,通过BAM层对光谱卷积特征分别在通道和空间两个分支进行注意力操作,生成多尺度高分辨率的注意力特征。然后输入到Vision Transformer网络结构中,所设计的网络模型不仅具有局部感知、共享权重和自动进行特征提取的优点,同时具有动态注意、全局上下文融合和更好的泛化,通过本申请公开的方案,可以有效提高识别模型的性能和鲁棒性,实现对煤矸的精准识别。
本申请第二方面公开了一种基于注意力机制的煤矸高光谱变图像域数据识别系统,包括:
预处理模块,配置为对采集的煤矸高光谱数据进行预处理,获取具有特征级融合信息的高光谱RGB图像;
数据集构建模块,配置为基于高光谱RGB图像构建训练集和测试集;
模型构建模块,配置为构建煤矸分类识别模型;
训练模块,配置为在训练集上对煤矸分类识别结果模型进行训练,并采用损失函数对训练的煤矸分类识别结果模型进行验证;
识别模块,配置为在测试集上对训练后的煤矸分类识别结果模型进行测试,以获得煤矸识别结果。
本申请第三方面公开了一种电子设备,该电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的基于注意力机制的煤矸高光谱变图像域数据识别方法。
本申请第四方面公开了一种计算机可读存储介质,该计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行所述的基于注意力机制的煤矸高光谱变图像域数据识别方法。
根据本公开实施例的电子设备包括存储器和处理器。该存储器用于存储非暂时性计算机可读指令。具体地,存储器可以包括一个或多个计算机程序产品,该计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。该易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。该非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。
该处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制电子设备中的其它组件以执行期望的功能。在本公开的一个实施例中,该处理器用于运行该存储器中存储的该计算机可读指令,使得该电子设备执行前述的本公开各实施例的基于注意力机制的煤矸高光谱变图像域数据识别方法全部或部分步骤。
本领域技术人员应能理解,为了解决如何获得良好用户体验效果的技术问题,本实施例中也可以包括诸如通信总线、接口等公知的结构,这些公知的结构也应包含在本公开的保护范围之内。
如图5为本公开实施例提供的一种电子设备的结构示意图。其示出了适于用来实现本公开实施例中的电子设备的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM)中的程序或者从存储装置加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有电子设备操作所需的各种程序和数据。处理装置、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
通常,以下装置可以连接至I/O接口:包括例如传感器或者视觉信息采集设备等的输入装置;包括例如显示屏等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信装置。通信装置可以允许电子设备与其他设备(比如边缘计算设备)进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从ROM被安装。在该计算机程序被处理装置执行时,执行本公开实施例的基于注意力机制的煤矸高光谱变图像域数据识别方法的全部或部分步骤。
有关本实施例的详细说明可以参考前述各实施例中的相应说明,在此不再赘述。
根据本公开实施例的计算机可读存储介质,其上存储有非暂时性计算机可读指令。当该非暂时性计算机可读指令由处理器运行时,执行前述的本公开各实施例的基于注意力机制的煤矸高光谱变图像域数据识别方法的全部或部分步骤。
上述计算机可读存储介质包括但不限于:光存储介质(例如:CD-ROM和DVD)、磁光存储介质(例如:MO)、磁存储介质(例如:磁带或移动硬盘)、具有内置的可重写非易失性存储器的媒体(例如:存储卡)和具有内置ROM的媒体(例如:ROM盒)。
有关本实施例的详细说明可以参考前述各实施例中的相应说明,在此不再赘述。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
在本公开中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
另外,如在此使用的,在以“至少一个”开始的项的列举中使用的“或”指示分离的列举,以便例如“A、B或C的至少一个”的列举意味着A或B或C,或AB或AC或BC,或ABC(即A和B和C)。此外,措辞“示例的”不意味着描述的例子是优选的或者比其他例子更好。
还需要指出的是,在本公开的系统和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
可以不脱离由所附权利要求定义的教导的技术而进行对在此所述的技术的各种改变、替换和更改。此外,本公开的权利要求的范围不限于以上所述的处理、机器、制造、事件的组成、手段、方法和动作的具体方面。可以利用与在此所述的相应方面进行基本相同的功能或者实现基本相同的结果的当前存在的或者稍后要开发的处理、机器、制造、事件的组成、手段、方法或动作。因而,所附权利要求包括在其范围内的这样的处理、机器、制造、事件的组成、手段、方法或动作。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (10)
1.一种基于注意力机制的煤矸高光谱变图像域数据识别方法,其特征在于,包括以下步骤:
对采集的煤矸高光谱数据进行预处理,获得具有特征级融合信息的高光谱RGB图像;具体为:获得初始煤矸高光谱数据;对所述初始煤矸高光谱数据采用一阶微分处理,获得的光谱信息作为图像的R通道信息;对所述初始煤矸高光谱数据采用SG卷积平滑处理,获得的光谱信息作为图像的G通道信息;对所述初始煤矸高光谱数据采用标准正态变量变换处理,获得的光谱信息作为图像的B通道信息;将所述R通道信息、所述G通道信息、所述B通道信息分别转换为R像素矩阵、G像素矩阵、B像素矩阵;对所述R像素矩阵、所述G像素矩阵、所述B像素矩阵分别进行归一化处理,获得R像素预处理矩阵、G像素预处理矩阵、B像素预处理矩阵;融合所述R像素预处理矩阵、所述G像素预处理矩阵、所述B像素预处理矩阵为一个RGB像素矩阵,获得具有特征级融合信息的所述高光谱RGB图像;
基于所述高光谱RGB图像构建训练集和测试集;
构建煤矸分类识别模型,所述煤矸分类识别模型包括依次串联的EBAM层、TransformerEncoder层和MLP Head层;其中,所述EBAM层包括依次串联的第一卷积层、BAM层和第二卷积层;所述第一卷积层用于输出光谱卷积特征;所述BAM层包括通道注意力模块、空间注意力模块,所述通道注意力模块、所述空间注意力模块分别对所述光谱卷积特征处理,获得光谱特征;所述第二卷积层用于对所述光谱特征处理,获得光谱特征向量;
在所述训练集上对所述煤矸分类识别结果模型进行训练,并采用损失函数对训练的所述煤矸分类识别结果模型进行验证;
在所述测试集上对训练后的煤矸分类识别结果模型进行测试,获得煤矸识别结果。
2.根据权利要求1所述的煤矸高光谱变图像域数据识别方法,其特征在于,所述初始煤矸高光谱数据的获取方法包括:
采用近红外光谱仪多次采集煤矸高光谱数据,获得的平均值作为所述初始煤矸高光谱数据。
3.根据权利要求2所述的煤矸高光谱变图像域数据识别方法,其特征在于,所述训练集、所述测试集的构建包括:
将所述高光谱RGB图像按7:3的比例随机分配,以获取所述训练集、所述测试集。
4.根据权利要求1所述的煤矸高光谱变图像域数据识别方法,其特征在于,所述第一卷积层设置有32个卷积核,每个卷积核的尺寸均为1×3,卷积步长为3;
所述第二卷积层设置有64个卷积核,每个卷积核的尺寸均为1×1,卷积步长为1。
5.根据权利要求4所述的煤矸高光谱变图像域数据识别方法,其特征在于,所述Transformer Encoder层包括依次串联的第一归一化层、多头注意力层、第二归一化层和全连接层;
所述第一归一化层用于对所述光谱特征向量进行归一化处理,得到第一煤矸信息;
所述多头注意力层用于对所述第一煤矸信息处理以获取多头自注意力值;
所述第二归一化层用于对多头自注意力值进行归一化处理,获得第二煤矸信息;
所述全连接层用于对所述第二煤矸信息处理,以获得第三煤矸信息。
6.根据权利要求5所述的煤矸高光谱变图像域数据识别方法,其特征在于,所述MLPHead层用于对所述第三煤矸信息进行处理,以获得煤光谱信息和矸石光谱信息。
7.根据权利要求1所述的煤矸高光谱变图像域数据识别方法,其特征在于,所述损失函数为交叉熵损失函数。
8.一种基于注意力机制的煤矸高光谱变图像域数据识别系统,其特征在于,包括:
预处理模块,配置为对采集的煤矸高光谱数据进行预处理,获取具有特征级融合信息的高光谱RGB图像;具体为:获得初始煤矸高光谱数据;对所述初始煤矸高光谱数据采用一阶微分处理,获得的光谱信息作为图像的R通道信息;对所述初始煤矸高光谱数据采用SG卷积平滑处理,获得的光谱信息作为图像的G通道信息;对所述初始煤矸高光谱数据采用标准正态变量变换处理,获得的光谱信息作为图像的B通道信息;将所述R通道信息、所述G通道信息、所述B通道信息分别转换为R像素矩阵、G像素矩阵、B像素矩阵;对所述R像素矩阵、所述G像素矩阵、所述B像素矩阵分别进行归一化处理,获得R像素预处理矩阵、G像素预处理矩阵、B像素预处理矩阵;融合所述R像素预处理矩阵、所述G像素预处理矩阵、所述B像素预处理矩阵为一个RGB像素矩阵,获得具有特征级融合信息的所述高光谱RGB图像;
数据集构建模块,配置为基于高光谱RGB图像构建训练集和测试集;
模型构建模块,配置为构建煤矸分类识别模型;所述煤矸分类识别模型包括依次串联的EBAM层、Transformer Encoder层和MLP Head层;其中,所述EBAM层包括依次串联的第一卷积层、BAM层和第二卷积层;所述第一卷积层用于输出光谱卷积特征;所述BAM层包括通道注意力模块、空间注意力模块,所述通道注意力模块、所述空间注意力模块分别对所述光谱卷积特征处理,获得光谱特征;所述第二卷积层用于对所述光谱特征处理,获得光谱特征向量;
训练模块,配置为在训练集上对煤矸分类识别结果模型进行训练,并采用损失函数对训练的煤矸分类识别结果模型进行验证;
识别模块,配置为在所述测试集上对训练后的煤矸分类识别结果模型进行测试,以获得煤矸识别结果。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7任一所述的基于注意力机制的煤矸高光谱变图像域数据识别方法。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行权利要求1-7任一所述的基于注意力机制的煤矸高光谱变图像域数据识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211587979.8A CN115841594B (zh) | 2022-12-07 | 2022-12-07 | 基于注意力机制的煤矸高光谱变图像域数据识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211587979.8A CN115841594B (zh) | 2022-12-07 | 2022-12-07 | 基于注意力机制的煤矸高光谱变图像域数据识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115841594A CN115841594A (zh) | 2023-03-24 |
CN115841594B true CN115841594B (zh) | 2023-11-10 |
Family
ID=85578460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211587979.8A Active CN115841594B (zh) | 2022-12-07 | 2022-12-07 | 基于注意力机制的煤矸高光谱变图像域数据识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115841594B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116956024A (zh) * | 2023-07-05 | 2023-10-27 | 西北工业大学 | 一种基于参数自进化策略的目标细粒度识别方法 |
CN117694857B (zh) * | 2023-08-17 | 2024-08-27 | 荣耀终端有限公司 | Ppg频域信号的去噪方法、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112465063A (zh) * | 2020-12-11 | 2021-03-09 | 中国矿业大学 | 一种基于多传感信息融合的放顶煤过程中煤矸识别方法 |
CN112488082A (zh) * | 2020-12-24 | 2021-03-12 | 刘强 | 基于深度学习的煤矸石智能分拣系统 |
CN112871751A (zh) * | 2021-02-03 | 2021-06-01 | 精英数智科技股份有限公司 | 识别煤和煤矸石的方法及其识别装置 |
CN112990028A (zh) * | 2021-03-22 | 2021-06-18 | 精英数智科技股份有限公司 | 基于分类器对煤和矸石进行分类的方法和煤矸分选装置 |
CN112990027A (zh) * | 2021-03-22 | 2021-06-18 | 精英数智科技股份有限公司 | 一种基于高光谱图像的煤矸识别方法及装置 |
CN113269725A (zh) * | 2021-04-28 | 2021-08-17 | 安徽理工大学 | 一种基于成像技术和深度学习的煤矸石快速检测方法 |
CN114494696A (zh) * | 2022-01-26 | 2022-05-13 | 安徽理工大学 | 一种多尺度煤矸图像快速检测的方法、系统及装置 |
-
2022
- 2022-12-07 CN CN202211587979.8A patent/CN115841594B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112465063A (zh) * | 2020-12-11 | 2021-03-09 | 中国矿业大学 | 一种基于多传感信息融合的放顶煤过程中煤矸识别方法 |
CN112488082A (zh) * | 2020-12-24 | 2021-03-12 | 刘强 | 基于深度学习的煤矸石智能分拣系统 |
CN112871751A (zh) * | 2021-02-03 | 2021-06-01 | 精英数智科技股份有限公司 | 识别煤和煤矸石的方法及其识别装置 |
CN112990028A (zh) * | 2021-03-22 | 2021-06-18 | 精英数智科技股份有限公司 | 基于分类器对煤和矸石进行分类的方法和煤矸分选装置 |
CN112990027A (zh) * | 2021-03-22 | 2021-06-18 | 精英数智科技股份有限公司 | 一种基于高光谱图像的煤矸识别方法及装置 |
CN113269725A (zh) * | 2021-04-28 | 2021-08-17 | 安徽理工大学 | 一种基于成像技术和深度学习的煤矸石快速检测方法 |
CN114494696A (zh) * | 2022-01-26 | 2022-05-13 | 安徽理工大学 | 一种多尺度煤矸图像快速检测的方法、系统及装置 |
Non-Patent Citations (2)
Title |
---|
Automatic Identification of Coal and Rock/Gangue Based on DenseNet and Gaussian Process;Yufan Li et al;《arXiv》;全文 * |
高光谱成像的煤与矸石分类;李廉洁 等;《光谱学与光谱分析》;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115841594A (zh) | 2023-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110717354B (zh) | 基于半监督k-svd与多尺度稀疏表示的超像元分类方法 | |
CN115841594B (zh) | 基于注意力机制的煤矸高光谱变图像域数据识别方法 | |
CN107169535B (zh) | 生物多光谱图像的深度学习分类方法及装置 | |
Montazer et al. | An improved radial basis function neural network for object image retrieval | |
CN105046276B (zh) | 基于低秩表示的高光谱图像波段选择方法 | |
CN105740912B (zh) | 基于核范数正则化的低秩图像特征提取的识别方法及系统 | |
CN104484658A (zh) | 一种基于多通道卷积神经网络的人脸性别识别方法及装置 | |
CN111090764B (zh) | 基于多任务学习和图卷积神经网络的影像分类方法及装置 | |
Toivanen et al. | Edge detection in multispectral images using the self-organizing map | |
CN111666900B (zh) | 基于多源遥感影像的土地覆盖分类图的获取方法和装置 | |
CN107563442A (zh) | 基于稀疏低秩正则图张量化嵌入的高光谱图像分类方法 | |
CN109190511A (zh) | 基于局部与结构约束低秩表示的高光谱分类方法 | |
CN111460966B (zh) | 基于度量学习和近邻增强的高光谱遥感图像分类方法 | |
JP2022000777A (ja) | 分類装置、分類方法、プログラム、ならびに、情報記録媒体 | |
US8913829B2 (en) | Automatic processing scale estimation for use in an image process | |
CN111639697A (zh) | 基于非重复采样与原型网络的高光谱图像分类方法 | |
CN105869161B (zh) | 基于图像质量评价的高光谱图像波段选择方法 | |
CN106780333A (zh) | 一种图像超分辨率重建方法 | |
CN116704378A (zh) | 一种基于自生长卷积神经网络的国土测绘数据分类方法 | |
CN116309477A (zh) | 一种基于神经网络的城墙多光谱成像病害无损检测方法 | |
CN113378979B (zh) | 一种基于波段注意力重建网络的高光谱波段选择方法及装置 | |
CN115908907A (zh) | 一种高光谱遥感图像分类方法及系统 | |
CN113628111B (zh) | 基于梯度信息约束的高光谱图像超分辨方法 | |
CN109460788A (zh) | 基于低秩-稀疏信息组合网络的高光谱图像分类方法 | |
CN114648512A (zh) | 舌下图像分析方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |