CN113486929B - 基于残差收缩模块与注意力机制的岩石薄片图像识别方法 - Google Patents

基于残差收缩模块与注意力机制的岩石薄片图像识别方法 Download PDF

Info

Publication number
CN113486929B
CN113486929B CN202110674575.1A CN202110674575A CN113486929B CN 113486929 B CN113486929 B CN 113486929B CN 202110674575 A CN202110674575 A CN 202110674575A CN 113486929 B CN113486929 B CN 113486929B
Authority
CN
China
Prior art keywords
classification
features
polarization image
channel
attention mechanism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110674575.1A
Other languages
English (en)
Other versions
CN113486929A (zh
Inventor
张夏林
刘东涛
翁正平
李章林
陈麒玉
张志庭
李新川
刘刚
田宜平
徐凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202110674575.1A priority Critical patent/CN113486929B/zh
Publication of CN113486929A publication Critical patent/CN113486929A/zh
Application granted granted Critical
Publication of CN113486929B publication Critical patent/CN113486929B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于残差收缩模块与注意力机制的岩石薄片图像识别方法,该方法包括同时输入岩石薄片的正交偏光图像与单偏光图像;两张图像在通道维度连接;通过分组卷积的方式分别独立提取两张图像的低层次特征;将两组低层次特征融合后,共同提取高层次特征;输入全连接层与softmax分类层完成岩石薄片图像的识别与分类。通过在残差收缩模块中引入软阈值函数抑制和消除特征中的噪音和冗余信息;经过卷积操作后,将不重要的冗余信息等拟合至零附近,通过软阈值化将特征通道中不重要的信息置为零;使用正交偏光图像和单偏光图像进行分类,提取两张图像的高层次特征,利用岩石薄片在不同偏光下反映出的特征,提高算法模型的识别分类效果。

Description

基于残差收缩模块与注意力机制的岩石薄片图像识别方法
技术领域
本发明涉及一种岩石薄片的图像识别方法,具体是一种基于残差收缩模块与注意力机制的岩石薄片图像识别方法,属于岩石薄片图像识别领域。
背景技术
岩石薄片镜下图像的识别与分类对岩石种类的精确鉴定具有重要意义。
一般而言,传统的岩石薄片图像识别与分类方式是人工观察。人工观察的方式不仅对岩石薄片图像进行识别与分类耗时耗力,而且对鉴定人员的专业知识和经验要求较高;同时鉴定结果易受鉴定人员主观因素的影响。
近年来,深度学习在图像识别与分类领域取得了卓越的成果,使用基于深度学习的方法可以实现自动提取岩石薄片图像的特征,并根据不同的特征对岩石薄片图像进行识别与分类。但是,岩石薄片图像与其他图像相比,具有信息丰富、特征复杂、含有较多冗余信息、干扰信息和噪音的特点。在这些信息和特征中,一方面,一些与分类任务无关的信息和特征对分类算法模型来说是一种干扰,影响了分类模型对有用特征的提取,从而影响了模型的识别与分类效果;另一方面,现有技术中存在的图像识别算法一般只输入一张图像,不能充分利用岩石薄片的正交偏光图像和单偏光图像的综合信息与特征进行识别与分类。
现有技术中:1)申请号为202011500128.6,专利名称为一种结合单偏光与正交偏光图像的岩石薄片图像对齐方法,该图像对齐方法仅仅是将岩石薄片图像进行正交偏光图像和单偏光图像处理,提出特征匹配,并没有对岩石薄片的综合信息与特征进行识别和分类;2)申请号为202110256098.7,专利名称为一种基于人工智能的岩石岩性快速分类识别方法和装置,该分类识别方法,虽然采用了人工智能的卷积神经网络处理图像,但是该技术仅仅是粗放式处理图像特征,并不能将图像无关的信息和特征进行一一分类和识别,导致处理的图像不够精确。
发明内容
为解决上述技术问题,本发明的目的在于提供一种基于残差收缩模块与注意力机制的岩石薄片图像识别方法,该方法通过残差收缩模块和注意力机制融合,能够对岩石薄片图像的综合信息和特征有效处理和提取,进而充分利用岩石薄片的正交偏光图像和单偏光图像的信息和特征进行识别与分类,从而提高算法模型的识别与分类的精确性。
为实现本发明的技术目的,本发明采取的技术方案为:一种基于残差收缩模块与注意力机制的岩石薄片图像识别方法,所述岩石薄片图像识别方法包括如下步骤:
S100:同时输入岩石薄片的正交偏光图像与单偏光图像;
S200:所述岩石薄片的正交偏光图像和单偏光图像在通道维度“concat”连接;
S300:通过分组卷积的方式分别独立提取出所述岩石薄片的正交偏光图像和单偏光图像的低层次特征,其中,分类网络的基础采用残差收缩模块与注意力机制相结合;
S400:将岩石薄片的正交偏光图像和单偏光图像的两组所述低层次特征融合后,共同提取高层次特征,其中,分类网络的基础采用残差收缩模块与注意力机制相结合;
S500:输入全连接层与softmax分类层完成岩石薄片图像的识别与分类。
进一步,所述步骤S100中:同时输入岩石薄片的正交偏光图像与单偏光图像是基于分类算法模型的两张图像,并且两张图像是岩石薄片同一视域下的正交偏光图像和单偏光图像。
进一步,所述步骤S200中:所述正交偏光图像位于所述单偏光图像前面,进而完成两张图像在通道维度的连接融合。
进一步,在步骤S300和S400中,构成所述分类网络基础模块的运算包括以下步骤:
S301:将基础模块的输入特征进行两次卷积操作;
S302:将步骤S301得到的特征进行绝对值化,然后输入至阈值子网络,获取每个特征通道的阈值;
S303:将步骤S301得到的特征输入基于通道域的注意力机制的权重系数子网络,获得每个特征通道的权重系数β;
S304:将步骤S301得到的特征使用步骤S302得到的阈值进行软阈值化操作,得到软阈值化后的新特征;
S305:将步骤S304得到的新特征使用步骤S303得到的权重系数进行特征通道的加权操作,得到基于通道域的注意力机制加权后的特征;
S306:将步骤S305得到的基于通道域的注意力机制加权后的特征与基础模块的输入特征完成短路连接,得到基础模块最终输出的特征。
进一步,在步骤S302中,所述获取每个特征通道的阈值的子网络包括以下步骤:
S3021:将输入的特征进行全局平均池化,得到C×1×1的特征通道表征实数;
S3022:将输入的特征进行全局最大池化,得到C×1×1的特征通道表征实数;
S3023:将步骤S3021与步骤S3022得到的两组特征通道表征实数分别输入至两个结构相同的全连接网络中,基于全连接网络的输出得到两组特征通道阈值尺度;其中,全连接网络共有两层神经元节点,第一层具有C个神经元节点,使用ReLU作为激活函数;第二层同样具有C个神经元节点,使用Sigmoid作为激活函数;
S3024:将步骤S3023中得到的两组特征通道阈值尺度求平均值,然后与步骤S3021中的特征通道表征实数相乘,得到各个特征通道的阈值。
进一步,在步骤S303中,每个特征通道的权重系数β由两部分组成,即β=ε+b;其中b是可设置的参数,起到约束权重区间范围的作用;ε是由注意力机制获得的权重因子,取值范围为(0,1),注意力机制的子网络采用SENet模块的设计方式。
进一步,所述步骤S300中:采用分组组数为2的分组卷积,实现双路特征提取的功能,同时,两组特征的软阈值化、注意力加权和短路连接单独进行;双路特征之间没有信息干扰,专注于提取各自图像中的低层次特征。
与现有技术相比,本发明具有的有益效果是:
(1)使用残差收缩模块为基础构建岩石薄片图像的分类网络,通过在残差收缩模块中引入软阈值函数作为非线性层抑制和消除特征中的噪音和冗余信息,卷积神经网络在经过卷积等操作后,将不重要的冗余信息、噪音等拟合至零附近,通过软阈值化将特征通道中不重要的信息置为零,增加了通道内特征之间的区分性;并通过将特征绝对值化后的全局平均池化与全局最大池化值作为信息表征,输入至阈值子网络自主学习到每个样本的阈值,减少人为选择阈值的偏差。
(2)通过对软阈值化后的岩石薄片图像特征进行基于通道域注意力机制的加权,增加了对特征通道之间重要程度的区分,使得模型更关注对分类任务有用的特征。
(3)使用岩石薄片的正交偏光图像和单偏光图像进行分类,在网络的浅层,分别独立地提取两张图像的低层次特征,融合后输入至网络的深层结构,提取两张图像的高层次特征,充分利用岩石薄片在不同偏光下反映出的特征,使得类别间特征差异更大,从而提高算法模型的识别分类效果。
附图说明
图1为本发明基于残差收缩模块与注意力机制的岩石薄片图像识别方法的流程图;
图2为本发明中构建分类网络的基础模块流程图;
图3为本发明中获取各特征通道阈值的阈值子网络流程图;
图4为本发明中构建分类网络的基础模块结构图;
图5为本发明中构建分类网络的浅层基础模块结构图;
图6为本发明中实施例中分类网络结构细节图。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
如图1所示,一种基于残差收缩模块与注意力机制的岩石薄片图像识别方法,该岩石薄片图像识别方法包括如下步骤:
S100:同时输入岩石薄片的正交偏光图像与单偏光图像。
岩石薄片的图像在正交偏光与单偏光下会反映出不同的特征,这些不同的特征对岩石薄片的分类都具有作用,在申请的技术方案中是同时使用两张图像(正交偏光图像和单偏光图像),并且输入的岩石薄片的正交偏光图像与单偏光图像是基于分类算法模型的,两张图像是岩石薄片同一视域下的正交偏光图像和单偏光图像,可以更充分地利用岩石薄片图像的信息,提高类别间的特征差异,从而提高分类算法的识别分类效果。
S200:岩石薄片的正交偏光图像和单偏光图像在通道维度“concat”连接;使得分类网络的首层输入数据的通道数为6(卷积神经网络中,卷积层的通道数要与输入数据的通道数相等,一般图片有RGB红绿蓝三个通道,所以在对一般图像进行识别的卷积神经网络中,首层卷积层的通道数为3,因为首层的输入直接就是图像数据。而在本发明中,需要将两幅图像合并成一个样本进行识别,所以将两幅图像在通道维度串联连接后,输入网络的数据通道数就变成了6,宽和高不变)。其中,正交偏光图像位于所述单偏光图像前面,进而完成两张图像在通道维度的连接融合。
这里对“concat”进一步解释:concat是tensorflow中的一个函数,它来自于英语单词concatenate,连接串联的意思,它的主要操作是对矩阵进行串联合并,结合图像中的通道维度来说,图像除了宽和高,每个像素点还有RGB即红绿蓝三个通道,每个通道取值范围为0到255,所以假设一幅宽高为1920×960的图像,在计算机存储中就是一个1920×960×3的矩阵,所谓通道维度就是RGB这个维度,所谓在通道维度concat连接就是将两个1920×960×3的矩阵合并成一个1920×960×6的矩阵。
S300:通过分组卷积的方式分别独立提取出岩石薄片的正交偏光图像和单偏光图像的低层次特征,其中,分类网络的基础采用残差收缩模块与注意力机制相结合。
采用分组组数为2的分组卷积,能够实现双路特征提取的功能,双路特征分组的方式使得经过不同分组路径得到的特征之间没有干扰,每个分组内关注不同的特征,组与组之间没有信息交流,因此,使用分组数为2的分组卷积可以实现分别提取岩石薄片正交偏光图像与单偏光图像特征的功能,专注于提取图像中的低层次特征。同时,两组特征的软阈值化、注意力加权和短路连接单独进行。
S400:将岩石薄片的正交偏光图像和单偏光图像的两组所述低层次特征融合后,共同提取高层次特征,其中,分类网络的基础采用残差收缩模块与注意力机制相结合。
在经过步骤S300分别提取到两张图像的低层次特征后,通过卷积核尺寸为1×1的逐点卷积将两组低层次特征进行融合,然后输入至深层网络中进行高层次特征的提取。
在在步骤S300和S400中,需要进一步说明的是,关于构成分类网络的基础模块运算方式。
如图2所示,分类网络中基础模块运算包括如下步骤:
S301:将基础模块的输入特征进行两次卷积操作;
S302:将步骤S301得到的特征进行绝对值化,然后输入至阈值子网络,获取每个特征通道的阈值;由于软阈值化是对正负特征同时收缩,因此使用绝对值化后的特征输入至阈值子网络具有更好的特征表征能力。
其中,阈值子网络具体包括以下步骤(如图3所示):
S3021:将输入的特征进行全局平均池化,得到C×1×1的特征通道表征实数;
S3022:将输入的特征进行全局最大池化,得到C×1×1的特征通道表征实数;
S3023:将步骤S3021与步骤S3022得到的两组特征通道表征实数分别输入至两个结构相同的全连接网络中,基于全连接网络的输出得到两组特征通道阈值尺度;其中,全连接网络共有两层神经元节点,第一层具有C个神经元节点,使用ReLU作为激活函数;第二层同样具有C个神经元节点,使用Sigmoid作为激活函数;
S3024:将步骤S3023中得到的两组特征通道阈值尺度求平均值,然后与步骤S3021中的特征通道表征实数相乘,得到各个特征通道的阈值。
阈值子网络通过参数调整与优化学习,自适应地为每个样本的每个特征通道输出阈值。
S303:将步骤S301得到的特征输入基于通道域的注意力机制的权重系数子网络,获得每个特征通道的权重系数β;
其中,每个特征通道的权重系数β由两部分组成,即β=ε+b;其中,b是可设置的参数,起到约束权重区间范围的作用;ε是由注意力机制获得的权重因子,取值范围为(0,1),注意力机制的子网络采用SENet模块的设计方式。
S304:将步骤S301得到的特征使用步骤S302得到的阈值进行软阈值化操作,得到软阈值化后的新特征。
步骤S304的目的是使得新特征中绝对值小于阈值的数据置为零,绝对值大于阈值的数据也同时向零收缩,起到降低新特征中冗余信息与噪音的作用。
S305:将步骤S304得到的新特征使用步骤S303得到的权重系数进行特征通道的加权操作,得到基于通道域的注意力机制加权后的特征;
S306:将步骤S305得到的基于通道域的注意力机制加权后的特征与基础模块的输入特征完成短路连接,得到基础模块最终输出的特征。
S500:输入全连接层与softmax分类层完成岩石薄片图像的识别与分类。
全连接层是卷积神经网络中的一个基础结构,卷积神经网络一般包含卷积层、池化层、全连接层等,然后全连接层一般放在网络的最后,作用是将前面卷积等操作提取到的特征信息综合起来,对于分类问题,后面会跟一个分类器将特征信息映射到样本空间,在多分类问题中,一般使用softmax分类器,它可以将特征映射到对应的样本类别,对于卷积神经网络来说,假设输入一张图片,然后经过多层卷积运算、池化运算,再进行全连接运算,最后在进行softmax分类,softmax分类可以输出该图片属于某一类的概率,一般将概率最大的作为分类结果。
实施例二
本发明主要针对岩石薄片图像在识别过程中具有信息丰富、特征复杂、含有较多冗余信息、干扰信息和噪音的特点,而设计的一种更高效的识别方法,方法中对算法的整体流程和构建分类算法网络的基本单元模块进行了详细的说明,为了更加清晰地介绍该算法及基本模块的使用,下面使用该基本模块,采用已被广泛应用的深度残差收缩网络ResNet18网络为基本骨架构建分类网络,形成一例完整的分类网络算法,并在具有12个类别的岩石薄片图像数据集上进行训练和测试。具体说明如下:
在该实施例中,岩石薄片图像分类算法的参数细节描述如下:
第一:分类网络的第一层是一个分组数为2的分组卷积,每组卷积核尺寸为7×7×3(首层输入融合后使得图像,通道数为6,每组就是3个)×32(本层每组卷积核个数),共64个卷积核,步长为2;
第二:分类网络的第二层池化核尺寸为3×3、步长为2的最大池化层;
第三:分类网络的第三层是一个卷积组,该卷积组对应上述步骤S300,用来分别提取两幅图像的低层次特征,由两个浅层基础模块构成,浅层基础模块的结构如图5所示,它是由两个并行的基础模块(图4)构成,每个浅层基础模块具有两个卷积层,每个卷积层采用分组数为2的分组卷积分别提取两幅图像的特征,每组卷积的卷积核尺寸为3×3×32(上一层输出通道数为64,每组就是32个)×32(本层每组卷积核个数),共64个卷积核;
第四:分类网络的第四层为1×1的逐点卷积层,对应步骤S400中的第一个分步骤,用来将分类网络第三层中的两组特征进行融合,同时将特征通道维度升为128,该层的卷积核尺寸为1×1×64×128,共128个卷积核;
第五:分类网络的第五、六、七层是三个卷积组,这三个卷积组对应上述步骤S400中的第二个分步骤,用来提取融合后图像的高层次特征,每个卷积组由两个基础模块(图4)构建而成,其中第五层的卷积组中卷积核尺寸为3×3×128×128,第六层的卷积组中卷积核尺寸为3×3×128×256,第七层的卷积组中卷积核尺寸为3×3×256×512,这三个卷积组的降采样操作分别在每个组的第一个卷积层采用步长为2的方式实现;
第六:分类网络的第八层是一个全局平均池化层,对特征进行降维为1×1×512;
第七:分类网络的最后是一个全连接层,具有12个节点,对应实施例中数据集中的12类样本,使用softmax分类器完成分类。分类网络的总体结构细节如图6。
分类网络的训练和测试过程描述如下:
首先将图像数据集中的每一个样本的两幅图像在通道维度融合;然后按照8:2划分成训练集和测试集,使用训练集对分类网络进行训练;最后使用测试集对训练好的模型进行测试。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (5)

1.一种基于残差收缩模块与注意力机制的岩石薄片图像识别与分类方法,其特征在于,所述岩石薄片图像识别与分类方法包括如下步骤:
S100:同时输入岩石薄片的正交偏光图像与单偏光图像;
S200:所述岩石薄片的正交偏光图像和单偏光图像在通道维度“concat”连接;
S300:通过分组卷积的方式分别独立提取出所述岩石薄片的正交偏光图像和单偏光图像的低层次特征,其中,分类网络的第三层是一个卷积组,用来分别提取两幅图像的低层次特征,由两个浅层基础模块构成,浅层基础模块的结构是由两个并行的基础模块构成;
S400:将岩石薄片的正交偏光图像和单偏光图像的两组所述低层次特征融合后,共同提取高层次特征,其中,分类网络的第五、六、七层是三个卷积组,用来提取融合后图像的高层次特征,每个卷积组由两个基础模块构建而成;
S500:输入全连接层与softmax分类层完成岩石薄片图像的识别与分类;
其中,分类网络的基础模块 采用残差收缩模块与注意力机制相结合;
所述分类网络的基础模块的运算包括以下步骤:
S301:将基础模块的输入特征进行两次卷积操作;
S302:将步骤S301得到的特征进行绝对值化,然后输入至阈值子网络,获取每个特征通道的阈值;
在步骤S302中,所述获取每个特征通道的阈值的子网络包括以下步骤:
S3021:将输入的特征进行全局平均池化,得到C×1×1的特征通道表征实数;
S3022:将输入的特征进行全局最大池化,得到C×1×1的特征通道表征实数;
S3023:将步骤S3021与步骤S3022得到的两组特征通道表征实数分别输入至两个结构相同的全连接网络中,基于全连接网络的输出得到两组特征通道阈值尺度;其中,全连接网络共有两层神经元节点,第一层具有C个神经元节点,使用ReLU作为激活函数;第二层同样具有C个神经元节点,使用Sigmoid作为激活函数;
S3024:将步骤S3023中得到的两组特征通道阈值尺度求平均值,然后与步骤S3021中的特征通道表征实数相乘,得到各个特征通道的阈值;
S303:将步骤S301得到的特征输入基于通道域的注意力机制的权重系数子网络,获得每个特征通道的权重系数β;
S304:将步骤S301得到的特征使用步骤S302得到的阈值进行软阈值化操作,得到软阈值化后的新特征;
S305:将步骤S304得到的新特征使用步骤S303得到的权重系数进行特征通道的加权操作,得到基于通道域的注意力机制加权后的特征;
S306:将步骤S305得到的基于通道域的注意力机制加权后的特征与基础模块的输入特征完成短路连接,得到基础模块最终输出的特征。
2.根据权利要求1所述的基于残差收缩模块与注意力机制的岩石薄片图像识别与分类方法,其特征在于,所述步骤S100中:同时输入岩石薄片的正交偏光图像与单偏光图像是基于分类算法模型的两张图像,并且两张图像是岩石薄片同一视域下的正交偏光图像和单偏光图像。
3.根据权利要求1所述的基于残差收缩模块与注意力机制的岩石薄片图像识别与分类方法,其特征在于,所述步骤S200中:所述正交偏光图像位于所述单偏光图像前面,进而完成两张图像在通道维度的连接融合。
4.根据权利要求3所述的基于残差收缩模块与注意力机制的岩石薄片图像识别与分类方法,其特征在于,在步骤S303中:每个特征通道的权重系数β由两部分组成,即β=ε+b;其中b是可设置的参数,起到约束权重区间范围的作用;ε是由注意力机制获得的权重因子,取值范围为0~1,注意力机制的子网络采用SENet模块的设计方式。
5.根据权利要求1所述的基于残差收缩模块与注意力机制的岩石薄片图像识别与分类方法,其特征在于,所述步骤S300中:采用分组组数为2的分组卷积,实现双路特征提取的功能,同时,两组特征的软阈值化、注意力加权和短路连接单独进行;双路特征之间没有信息干扰,专注于提取各自图像中的低层次特征。
CN202110674575.1A 2021-06-17 2021-06-17 基于残差收缩模块与注意力机制的岩石薄片图像识别方法 Active CN113486929B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110674575.1A CN113486929B (zh) 2021-06-17 2021-06-17 基于残差收缩模块与注意力机制的岩石薄片图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110674575.1A CN113486929B (zh) 2021-06-17 2021-06-17 基于残差收缩模块与注意力机制的岩石薄片图像识别方法

Publications (2)

Publication Number Publication Date
CN113486929A CN113486929A (zh) 2021-10-08
CN113486929B true CN113486929B (zh) 2023-02-24

Family

ID=77935463

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110674575.1A Active CN113486929B (zh) 2021-06-17 2021-06-17 基于残差收缩模块与注意力机制的岩石薄片图像识别方法

Country Status (1)

Country Link
CN (1) CN113486929B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113962899B (zh) * 2021-11-10 2024-06-21 北京工业大学 眼底图像处理方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224942A (zh) * 2015-07-09 2016-01-06 华南农业大学 一种rgb-d图像分类方法及系统
CN111563445A (zh) * 2020-04-30 2020-08-21 徐宇轩 一种基于卷积神经网络的显微镜下岩性识别方法
CN112508013A (zh) * 2020-12-02 2021-03-16 哈尔滨市科佳通用机电股份有限公司 一种锁扣丢失故障检测方法、系统及装置
CN112801158A (zh) * 2021-01-21 2021-05-14 中国人民解放军国防科技大学 基于级联融合和注意力机制的深度学习小目标检测方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112748368A (zh) * 2020-10-28 2021-05-04 上海交通大学 一种三电平逆变器igbt开路故障诊断方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224942A (zh) * 2015-07-09 2016-01-06 华南农业大学 一种rgb-d图像分类方法及系统
CN111563445A (zh) * 2020-04-30 2020-08-21 徐宇轩 一种基于卷积神经网络的显微镜下岩性识别方法
CN112508013A (zh) * 2020-12-02 2021-03-16 哈尔滨市科佳通用机电股份有限公司 一种锁扣丢失故障检测方法、系统及装置
CN112801158A (zh) * 2021-01-21 2021-05-14 中国人民解放军国防科技大学 基于级联融合和注意力机制的深度学习小目标检测方法及装置

Also Published As

Publication number Publication date
CN113486929A (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
CN109727246B (zh) 一种基于孪生网络的对比学习图像质量评估方法
CN109993220B (zh) 基于双路注意力融合神经网络的多源遥感图像分类方法
CN111275007B (zh) 基于多尺度信息融合的轴承故障诊断方法及系统
CN108090472B (zh) 基于多通道一致性特征的行人重识别方法及其系统
CN110728656A (zh) 基于元学习的无参考图像质量数据处理方法、智能终端
CN113469119B (zh) 基于视觉转换器和图卷积网络的宫颈细胞图像分类方法
CN110969066A (zh) 直播视频的识别方法、装置及电子设备
CN110991349B (zh) 一种基于度量学习的轻量级车辆属性识别方法
CN110009700B (zh) 基于rgb图和梯度图的卷积神经网络视觉深度估计方法
CN108345900B (zh) 基于颜色纹理分布特征的行人重识别方法及其系统
CN112381179A (zh) 一种基于双层注意力机制的异质图分类方法
CN112750129A (zh) 一种基于特征增强位置注意力机制的图像语义分割模型
CN113284100A (zh) 基于恢复图像对混合域注意力机制的图像质量评价方法
CN113628059A (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
CN111429402A (zh) 高级视觉感知特征与深度特征融合的图像质量评价方法
CN111222545A (zh) 基于线性规划增量学习的图像分类方法
CN116012653A (zh) 一种注意力残差单元神经网络高光谱图像分类方法及系统
CN113486929B (zh) 基于残差收缩模块与注意力机制的岩石薄片图像识别方法
CN113221614A (zh) 一种基于混合神经网络的电网绝缘子破损图像识别方法
CN116563410A (zh) 基于两级生成对抗网络的电气设备电火花图像生成方法
CN110414338B (zh) 基于稀疏注意力网络的行人再辨识方法
CN116188516A (zh) 缺陷数据生成模型的训练方法
CN111783864A (zh) 一种多形态的医学精子图像分类方法
CN111079930A (zh) 数据集质量参数的确定方法、装置及电子设备
CN112862766B (zh) 一种基于图像数据扩充技术的绝缘子检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant