CN117689960A

CN117689960A - 一种岩性场景分类模型构建方法及分类方法

Info

Publication number: CN117689960A
Application number: CN202410134343.0A
Authority: CN
Inventors: 李显巨; 隋志远; 范小洁; 邹崇尧; 陈刚; 李义龙
Original assignee: China University of Geosciences
Current assignee: China University of Geosciences
Priority date: 2024-01-31
Filing date: 2024-01-31
Publication date: 2024-03-12
Anticipated expiration: 2044-01-31
Also published as: CN117689960B

Abstract

本发明提供一种岩性场景分类模型构建方法及分类方法，涉及图像处理技术领域，岩性场景分类模型构建方法包括获取地质遥感影像，构建数据集；根据数据集，训练初始分类模型，得到岩性场景分类模型，其中，初始分类模型包括场景分类子模型、语义分割子模型以及结果融合模块，场景分类子模型用于根据地质遥感影像输出第一分类图，语义分割子模型用于根据地质遥感影像输出第二分类图，结果融合模型用于融合第一分类图和第二分类图，生成岩性场景分类图；场景分类子模型包括特征提取模块、通道特征增强模块、上下文特征增强模块以及输出模块。通过数据集对初始分类模型不断训练，得到的岩性场景分类模型可提高岩性场景分类的精度。

Description

一种岩性场景分类模型构建方法及分类方法

技术领域

本发明涉及图像处理技术领域，具体而言，涉及一种岩性场景分类模型构建方法及分类方法。

背景技术

岩性场景分类图通常指的是地质学中的岩石类型和分布情况，岩性场景分类图包括不同类型的岩石，例如火成岩、沉积岩、变质岩等，以及它们在地质时间尺度上的分布和相互关系，岩性场景分类图对于研究地质历史、矿产资源勘探和环境地质等方面都具有重要意义。

在现有技术中，一般采用人工实地考察的方式来构建岩性场景分类图，但是，人工实地考察成本高，还存在部分人工不能涉及的区域，且由于在岩性场景的特征中，相似特征过多，导致构建的岩性场景分类精度低，不能反馈真实的岩性场景。

发明内容

本发明解决的问题是如何提高岩性场景的分类精度。

为解决上述问题，第一方面，本发明提供一种岩性场景分类模型构建方法，包括：

获取地质遥感影像，构建数据集；

根据所述数据集，训练初始分类模型，得到岩性场景分类模型，其中，所述初始分类模型包括场景分类子模型、语义分割子模型以及结果融合模块，所述场景分类子模型用于根据所述地质遥感影像输出第一分类图，所述语义分割子模型用于根据所述地质遥感影像输出第二分类图，所述结果融合模型用于融合所述第一分类图和所述第二分类图，生成岩性场景分类图；

所述场景分类子模型包括特征提取模块、通道特征增强模块、上下文特征增强模块以及输出模块，所述特征提取模块用于提取所述地质遥感影像的岩性特征，所述通道特征增强模块用于根据所述岩性特征，生成视觉通道增强特征，所述上下文特征增强模块用于根据所述岩性特征，生成上下文增强特征，所述输出模块用于融合所述视觉通道增强特征和所述上下文增强特征，输出所述第一分类图。

可选地，所述通道特征增强模块包括至少一个视觉通道注意力单元和第一特征融合单元，每个所述视觉通道注意力单元的输入端分别与所述特征提取模块的输出端连接，每个所述视觉通道注意力单元的输出端分别与所述第一特征融合单元的输入端连接；

每个所述视觉通道注意力单元均采用通道注意力机制，提取所述岩性特征的通道注意力特征；

所述第一特征融合单元用于融合所有所述通道注意力特征，输出所述视觉通道增强特征。

可选地，所述视觉通道注意力单元包括第一提取子单元、第二提取子单元以及融合输出子单元，所述特征提取模块的输出端分别与所述第一提取子单元、所述第二提取子单元以及所述融合输出子单元的输入端连接，所述第一提取子单元与所述第二提取子单元的输出端分别与所述融合输出子单元的输入端连接，所述融合输出子单元的输出端与所述第一特征融合单元的输入端连接；

所述第一提取子单元用于提取所述岩性特征的显著岩性特征，所述第一提取子单元包括全局最大池化层、第一全连接层和第二全连接层，所述全局最大池化层、所述第一全连接层和所述第二全连接层顺次连接，且所述全局最大池化层的输入端与所述特征提取模块的输出端连接，所述第二全连接层的输出端与所述融合输出子单元的输入端连接；

所述第二提取子单元用于提取所述岩性特征的整体岩性特征，所述第二提取子单元包括全局平均池化层、第三全连接层和第四全连接层，所述全局平均池化层、所述第三全连接层和所述第四全连接层顺次连接，且所述全局平均池化层的输入端与所述特征提取模块的输出端连接，所述第四全连接层的输出端与所述融合输出子单元的输入端连接；

所述融合输出子单元用于融合所述显著岩性特征和所述整体岩性特征，输出所述通道注意力特征，所述融合输出子单元包括第一点加层、第一激活层、第一点乘层以及第二激活层，所述第一点加层、所述第一激活层、所述第一点乘层以及所述第二激活层顺次连接，且所述第一点加层的输入端分别与所述第二全连接层的输出端和所述第四全连接层的输出端连接，所述第二激活层的输出端与所述第一特征融合单元的输入端连接，所述第一点乘层的输入端还与所述特征提取模块的输出端连接。

可选地，所述第一特征融合单元包括全局池化层、滤波层、第五全连接层、第二点乘层以及第二点加层，所述全局池化层、所述滤波层、所述第五全连接层、所述第二点乘层以及所述第二点加层顺次连接，且所述第二点乘层的输入端还接收所述通道注意力特征。

可选地，所述上下文特征增强模块包括至少一个视觉自注意力单元和第二特征融合单元，每个所述视觉自注意力单元的输入端分别与所述特征提取模块的输出端连接，每个所述视觉通道注意力单元的输出端分别与所述第二特征融合单元的输入端连接；

每个所述视觉通道注意力单元均采用自注意力机制，提取所述岩性特征的自注意力特征；

所述第二特征融合单元用于融合所有所述自注意力特征，输出所述上下文增强特征。

可选地，所述输出模块包括第一输出单元、第二输出单元以及平均融合单元，所述第一输出单元的输入端与所述通道特征增强模块的输出端连接，所述第二输出单元的输入端与所述上下文特征增强模块的输出端连接，所述第一输出单元的输出端和所述第二输出单元的输出端均与所述平均融合单元的输入端连接；

所述第一输出单元用于将所述通道注意力特征转化为通道特征分类图；

所述第二输出单元用于将所述上下文增强特征转化为上下文特征分类图；

所述平均融合单元用于将所述通道特征分类图和所述上下文特征分类图融合为所述第一分类图。

可选地，所述语义分割子模型包括语义分割编码器和语义分割解码器，所述语义分割编码器的输出端和所述语义分割解码器的输入端连接，所述语义分割解码器的输出端与所述结果融合模块的输入端连接；

所述语义分割编码器用于提取并降维所述地质遥感影像的图像特征，生成语义编码特征；

所述语义分割解码器用于解译所述语义编码特征，生成所述第二分类图。

可选地，所述数据集包括场景分类数据集和语义分割数据集，所述获取地质遥感影像，构建数据集，包括：

获取所述地质遥感影像，并根据所述地质遥感影像构建岩性类别标签图；

根据滑动窗口规则，裁剪所述岩性类别标签图，生成标准场景标签图；

根据所述标准场景标签图生成所述场景分类数据集；

筛选所述标准场景标签图的场景边界影像，根据所述场景边界影像生成所述语义分割数据集。

可选地，所述根据所述数据集，训练初始分类模型，得到岩性场景分类模型，包括：

根据所述场景分类数据集训练所述初始分类模型的所述场景分类子模型，得到训练好的所述场景分类子模型；

根据所述语义分割数据集训练所述初始分类模型的所述语义分割子模型，得到训练好的所述语义分割子模型；

根据训练好的所述场景分类子模型和训练好的所述语义分割子模型，得到所述岩性场景分类模型。

第二方面，本发明提供一种岩性场景分类方法，包括：

获取待分类的地质遥感影像；

将所述待分类的地质遥感影像输入至如上所述的岩性场景分类模型构建方法中所构建的岩性场景分类模型，得到所述待分类的地质遥感影像的岩性场景分类图。

本发明的岩性场景分类模型构建方法及分类方法的有益效果为：

通过初始分类模型的场景分类子模型的特征提取模块，可以初步提取地质遥感影像的岩性特征，再通过通道特征增强模块和上下文特征增强模块分别处理岩性特征，对岩性特征进行视觉通道注意力和视觉自注意力上的特征增强，得到包含重要通道信息的视觉通道增强特征和捕捉了上下文信息的上下文增强特征，以应对岩性场景的相似特征过多造成的分类精度低问题，然后通过输出模块融合视觉通道增强特征和上下文增强特征，输出经过双重特征增强的第一分类图，并结合语义分割子模型对地质遥感影像进行语义分割，以准确识别地质遥感影像边界的岩性场景，得到第二分类图，最后由结果融合模块融合第一分类图和第二分类图，确定了岩性场景的种类于与边界，得到精准的岩性场景分类图。再通过数据集对初始分类模型不断训练，得到高精度的岩性场景分类模型可直接用于岩性场景分类，提供高精度的岩性场景分类图。

附图说明

图1为本发明实施例提供的岩性场景分类模型构建方法的流程示意图；

图2为本发明实施例提供的初始分类模型的结构示意图；

图3为本发明实施例提供的场景分类子模型的结构示意图；

图4为本发明实施例提供的视觉通道注意力单元的结构示意图；

图5为本发明实施例提供的第一特征融合单元的结构示意图；

图6为本发明实施例提供的视觉自注意力单元的结构示意图；

图7为本发明实施例提供的输出模块的结构示意图；

图8为本发明实施例提供的岩性场景分类方法的流程示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。虽然附图中显示了本发明的某些实施例，然而应当理解的是，本发明可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本发明。应当理解的是，本发明的附图及实施例仅用于示例性作用，并非用于限制本发明的保护范围。

应当理解，本发明的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本发明的范围在此方面不受限制。

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”；术语“可选地”表示“可选的实施例”。其他术语的相关定义将在下文描述中给出。需要注意，本发明中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本发明中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

为解决上述问题，如图1所示，本发明实施例提供一种岩性场景分类模型构建方法，包括：

S1，获取地质遥感影像，构建数据集。

具体地，通过互联网或其他平台系统获取已公开具有标签的地质遥感影像，例如，通过地质科学数据出版系统下载，将获取的地质遥感影像构建为数据集，便于训练初始分类模型。示例性地，可将数据集以6:2:2比例划分训练集、验证集和测试集，比例较大的训练集用于训练初始分类模型，验证集用于模型调参，测试集用于检验模型的泛化能力。

S2，根据所述数据集，训练初始分类模型，得到岩性场景分类模型，其中，所述初始分类模型包括场景分类子模型、语义分割子模型以及结果融合模块，所述场景分类子模型用于根据所述地质遥感影像输出第一分类图，所述语义分割子模型用于根据所述地质遥感影像输出第二分类图，所述结果融合模型用于融合所述第一分类图和所述第二分类图，生成岩性场景分类图。

具体地，如图2所示，初始分类模型包括场景分类子模型、语义分割子模型以及结果融合模块，将数据集分为场景分类数据集和语义分割数据集，以分别训练场景分类子模型和语义分割子模型，场景分类子模型可对场景分类数据集中的地质遥感影像进行岩性场景分类，得到具有岩性场景标签的第一分类图，语义分割子模型可对语义分割数据集中的地质遥感影像进行岩性场景分类，得到具有岩性场景标签的第二分类图，由于场景分类数据集一般为地质遥感影像的中心区域的数据集，且语义分割数据集一般为地质遥感影像的边界区域的数据集，所以场景分类子模型和语义分割子模型预测的第一分类图和第二分类图较为分散，需通过结果融合模块将第一分类图和第二分类图融合，以得到完整精准的岩性场景分类图。

S3，所述场景分类子模型包括特征提取模块、通道特征增强模块、上下文特征增强模块以及输出模块，所述特征提取模块用于提取所述地质遥感影像的岩性特征，所述通道特征增强模块用于根据所述岩性特征，生成视觉通道增强特征，所述上下文特征增强模块用于根据所述岩性特征，生成上下文增强特征，所述输出模块用于融合所述视觉通道增强特征和所述上下文增强特征，输出所述第一分类图。

具体地，如图3所示，场景分类子模型包括特征提取模块、通道特征增强模块、上下文特征增强模块以及输出模块，特征提取模块提取地质遥感影像的岩性特征分别由通道特征增强模块和上下文特征增强模块进行特征增强，得到视觉通道增强特征和上下文增强特征，最后输出模块融合视觉通道增强特征和上下文增强特征，输出第一分类图。通道特征增强模块是通过视觉通道注意力机制，关注更加重要的通道信息从而实现特征增强，上下文特征增强模块主要通过视觉自注意力机制，关注岩性特征上的上下文信息从而实现上下文特征增强，从而应对岩性场景不易分类且现有技术分类精度低的问题，以得到高精度的第一分类图，进而得到高精度的岩性场景分类图。

具体地，通道特征增强模块包括至少一个视觉通道注意力单元和第一特征融合单元，视觉通道注意力单元可根据实际情况设置数量，示例性地，如图3所示，本发明的通道特征增强模块设置2个视觉通道注意力单元，每个视觉通道注意力单元均采用通道注意力机制，提取所述岩性特征的通道注意力特征，再由第一特征融合单元用于融合所有的通道注意力特征，从而得到视觉通道增强特征。

具体地，如图4所示，视觉通道注意力单元包括第一提取子单元、第二提取子单元以及融合输出子单元，第一提取子单元包括全局最大池化层、第一全连接层和第二全连接层，第二提取子单元包括全局平均池化层、第三全连接层和第四全连接层，融合输出子单元包括第一点加层、第一激活层、第一点乘层以及第二激活层。第一提取子单元的全局最大池化层将岩性特征的每个特征图上取出最大的特征值作为输出，再经过第一全连接层和第二全连接层整合转换，得到显著岩性特征；第二提取子单元的全局平均池化层将岩性特征的每个特征图上取出所有特征值的平均值作为输出，再经过第三全连接层和第四全连接层整合转换，得到整体岩性特征；融合输出子单元的第一激活层和第二激活层可选用Sigmoid激活函数，第一点加层将第二全连接层和第四全连接层输出的显著岩性特征和整体岩性特征相加，得到相加特征后传递给第一激活层，第一点乘层将第一激活层输出的元素与特征提取模块提取的岩性特征进行矩阵相乘，得到相乘特征后输入至第二激活层，以得到通道注意力特征。示例性地，若岩性特征形状尺寸为C×H×W，C指通道数，H指高度，W指宽度，经过全局最大池化层和全局平均池化层后的形状尺寸为1×1×C，经过第一全连接层和第三全连接层后的形状尺寸为1×1×C/r，经过第二全连接层和第四全连接层后的形状尺寸为1×1×C。

具体地，第一特征融合单元包括全局池化层、滤波层、第五全连接层、第二点乘层以及第二点加层，全局池化层可接收所有视觉通道注意力单元的通道注意力特征，第二点乘层包含与通道注意力特征数量对应的点乘函数，点乘函数用于将通过注意力特征与其经过全局池化层、滤波层以及第五全连接层后的特征进行矩阵相乘，以得到相乘特征并输入至第二点加层，示例性地，以上述实施例为例，如图5所示，全局池化层接收的两个通道注意力特征由上述实施例的两个视觉通道注意力单元生成，则第二点乘层包含两个点乘函数，每个通道注意力特征经过全局池化层、滤波层以及第五全连接层后得到的特征与其本身相乘，得到通道相乘特征，每个由通道注意力特征得到的通道相乘特征均输入第二点加层，进行矩阵相加，得到视觉通道增强特征。

具体地，如图3所示，上下文特征增强模块包括至少一个视觉自注意力单元和第二特征融合单元视觉自注意力单元可根据实际情况设置数量，示例性地，如图3所示，本发明的通上下文特征增强模块设置2个视觉自注意力单元，每个视觉自注意力单元均采用自注意力机制，提取所述岩性特征的自注意力特征，再由第二特征融合单元用于融合所有的通道注意力特征，从而得到上下文增强特征。

在一个实施例中，如图6所示，所述视觉自注意力单元包括第一层归一化层、多头自注意力层、第三点加层、第二层归一化层、第一多层感知机层、第四点加层、第三层归一化层、移动窗口多头自注意力层、第五点加层、第四层归一化层、第二多层感知机层以及第六点加层，所述第一层归一化层、所述多头自注意力层、所述第三点加层、所述第二层归一化层、所述第一多层感知机层、所述第四点加层、所述第三层归一化层、所述移动窗口多头自注意力层、所述第五点加层、所述第四层归一化层、所述第二多层感知机层以及所述第六点加层顺次连接，且第三点加层接收多头自注意力层的多头特征以及岩性特征，进行点加计算，得到第三点加输出特征，并输入至第二层归一化层和第四点加层；第四点加层接收第一多层感知机层输出的第一感知机特征和第三点加输出特征，进行点加计算，得到第四点加输出特征，并输入至第三层归一化层和第五点加层；第五点加层接收移动窗口多头自注意力层的移动窗口特征和第四点加输出特征，进行点加计算，得到第五点加输出特征，并输入至第四层归一化层和第六点加层；第六点加层接收第二多层感知机层输出的第二感知机特征和第五点加输出特征，进行点加计算，输出自注意力特征，通过上述结构，可精准有效地提取自注意力特征。第二特征融合单元结构可根据实际情况设置，也可依据第一特征融合单元。

示例性地，依据第一特征融合单元设置的第二特征融合单元包括全局池化层、滤波层、第五全连接层、第二点乘层以及第二点加层，所述全局池化层、所述滤波层、所述第五全连接层、所述第二点乘层以及所述第二点加层顺次连接，且所述第二点乘层的输入端还接收所述自注意力特征。

具体地，第二特征融合单元包括全局池化层、滤波层、第五全连接层、第二点乘层以及第二点加层，全局池化层可接收所有视觉自注意力单元的自注意力特征，第二点乘层包含与自注意力特征数量对应的点乘函数，点乘函数用于将通过注意力特征与其经过全局池化层、滤波层以及第五全连接层后的特征进行矩阵相乘，以得到相乘特征并输入至第二点加层，示例性地，以上述实施例为例，全局池化层接收的两个自注意力特征由上述实施例的两个视觉自注意力单元生成，则第二点乘层包含两个点乘函数，每个自注意力特征经过全局池化层、滤波层以及第五全连接层后得到的特征与其本身相乘，得到自相乘特征，每个由自注意力特征得到的自相乘特征均输入第二点加层，进行矩阵相加，得到上下文增强特征。

具体地，如图7所示，所述第一输出单元包括第六全连接层和第一类别分数层，所述第六全连接层和所述第一类别分数层顺次连接，所述第六全连接层的输入端与所述通道特征增强模块的输出端连接，所述第一类别分数层的输出端与所述平均融合单元的输入端连接，通过第六全连接层和第一类别分数层可将所述通道注意力特征转化为通道特征分类图，并对所述通道特征分类图进行类别分数预测，得到第一类别分数；所述第二输出单元包括第三激活层、第七全连接层和第二类别分数层，所述第三激活层、所述第七全连接层和所述第二类别分数层顺次连接，所述第三激活层的输入端与所述上下文特征增强模块的输出端连接，所述第二类别分数层的输出端与所述平均融合单元的输入端连接，通过第三激活层、第七全连接层和第二类别分数层，可将上下文增强特征转化为上下文特征分类图，并对上下文特征分类图进行类别分数预测，得到第二类别分数；平均融合单元根据第一类别分数和第二类别分数的平均分数，对通道特征分类图和上下文特征分类图进行加权决策融合，生成第一分类图。

具体地，语义分割编码器提取特征并降低特征尺寸，生成语义编码特征，语义分割解码器解译语义编码特征，进行上采样，将语义编码特征恢复到语义分割解码器降维前的尺寸，生成第二分类图。

根据所述标准场景标签图生成所述场景分类数据集；

具体地，通过互联网或其他平台系统获取已公开具有标签的地质遥感影像，例如，通过地质科学数据出版系统下载。根据具有标签的地质遥感影像构建岩性类别标签图，岩性类别标签图就是地质遥感影像的岩性分布图，即地质遥感影像上各个岩性类别的分布，根据地质遥感影像构建岩性类别标签图就是将各个岩性类别及其范围以标签形式标注在地质遥感影像上。根据滑动窗口规则，裁剪岩性类别标签图，可以得到预设尺寸的影像及其对应的场景标签，即标准场景标签图，分别将同一场景标签的预设尺寸的影像的标准场景标签图筛选出来，每个场景标签的标准场景标签图制作一个文件集合，多个场景标签构建的多个文件集合组合为数据集，同时，由于裁剪得到的标准场景标签图一部分是地质遥感影像的中心影像，另一部分是地质遥感影像的边界影像，根据地质遥感影像的中心影像和地质遥感影像的边界影像划分数据集为场景分类数据集和语义分割数据集，并将场景分类数据集和语义分割数据集均以6:2:2比例划分训练集、验证集和测试集，即场景分类训练集、场景分类验证集和场景分类测试集，语义分割训练集、语义分割验证集和语义分割测试集。比例较大的训练集用于训练初始分类模型，验证集用于模型调参，测试集用于检验模型的泛化能力。

示例性地，当所述地质遥感影像是1:25w地质图比例尺的影像，其岩性类别中存在第四系类别，但是由于是1:25w地质图比例尺较大所以在范围边界处类别限定不准确，因此，获取公开的土地覆盖数据来修正1:25w地质图中第四系的范围，其中，第四系类别一般都是指土地覆盖中的一些建筑、耕地、居民区之类的类别，同时提取水体区域，修正第四系的范围，以保证清晰地显示地质遥感影像的岩性分布，从而使修正后的地质遥感影像便于制作数据集和进行岩性遥感场景分类。

具体地，通过场景分类数据集训练初始分类模型的所述场景分类子模型，通过语义分割数据集训练初始分类模型的语义分割子模型，将训练数据输入至场景分类子模型和语义分割子模型后，场景分类子模型和语义分割子模型输出对应的分类结果，将分类结果与真实结果做对比计算损失，分别得到场景分类子模型和语义分割子模型的损失函数，通过场景分类子模型和语义分割子模型的损失函数进行反向传播，分别调整对应的场景分类子模型和语义分割子模型的参数，重复训练，使场景分类子模型和语义分割子模型的损失函数越来越小，直至达到精度要求，完成训练，得到训练好的场景分类子模型和训练好的语义分割子模型，从而得到岩性场景分类模型。

如图8所示，本发明又一实施例提供一种岩性场景分类方法，包括：

S1，获取待分类的地质遥感影像；

S2，将所述待分类的地质遥感影像输入至如上所述的岩性场景分类模型构建方法中所构建的岩性场景分类模型，得到所述待分类的地质遥感影像的岩性场景分类图。

具体地，将待分类的地质遥感影像输入至本发明已经训练好的岩性场景分类模型中，通过本发明岩性场景分类模型中场景分类子模型的通道特征增强模块和上下文特征增强模块，得到包含重要通道信息的视觉通道增强特征和捕捉了上下文信息的上下文增强特征，再进行分类预测，可得到高精度的岩性场景分类图。

虽然本发明披露如上，但本发明的保护范围并非仅限于此。本领域技术人员在不脱离本发明的精神和范围的前提下，可进行各种变更与修改，这些变更与修改均将落入本发明的保护范围。

Claims

1.一种岩性场景分类模型构建方法，其特征在于，包括：

获取地质遥感影像，构建数据集；

2.根据权利要求1所述的岩性场景分类模型构建方法，其特征在于，所述通道特征增强模块包括至少一个视觉通道注意力单元和第一特征融合单元，每个所述视觉通道注意力单元的输入端分别与所述特征提取模块的输出端连接，每个所述视觉通道注意力单元的输出端分别与所述第一特征融合单元的输入端连接；

3.根据权利要求2所述的岩性场景分类模型构建方法，其特征在于，所述视觉通道注意力单元包括第一提取子单元、第二提取子单元以及融合输出子单元，所述特征提取模块的输出端分别与所述第一提取子单元、所述第二提取子单元以及所述融合输出子单元的输入端连接，所述第一提取子单元与所述第二提取子单元的输出端分别与所述融合输出子单元的输入端连接，所述融合输出子单元的输出端与所述第一特征融合单元的输入端连接；

4.根据权利要求2所述的岩性场景分类模型构建方法，其特征在于，所述第一特征融合单元包括全局池化层、滤波层、第五全连接层、第二点乘层以及第二点加层，所述全局池化层、所述滤波层、所述第五全连接层、所述第二点乘层以及所述第二点加层顺次连接，且所述第二点乘层的输入端还接收所述通道注意力特征。

5.根据权利要求1所述的岩性场景分类模型构建方法，其特征在于，所述上下文特征增强模块包括至少一个视觉自注意力单元和第二特征融合单元，每个所述视觉自注意力单元的输入端分别与所述特征提取模块的输出端连接，每个所述视觉通道注意力单元的输出端分别与所述第二特征融合单元的输入端连接；

6.根据权利要求1所述的岩性场景分类模型构建方法，其特征在于，所述输出模块包括第一输出单元、第二输出单元以及平均融合单元，所述第一输出单元的输入端与所述通道特征增强模块的输出端连接，所述第二输出单元的输入端与所述上下文特征增强模块的输出端连接，所述第一输出单元的输出端和所述第二输出单元的输出端均与所述平均融合单元的输入端连接；

7.根据权利要求1所述的岩性场景分类模型构建方法，其特征在于，所述语义分割子模型包括语义分割编码器和语义分割解码器，所述语义分割编码器的输出端和所述语义分割解码器的输入端连接，所述语义分割解码器的输出端与所述结果融合模块的输入端连接；

8.根据权利要求1所述的岩性场景分类模型构建方法，其特征在于，所述数据集包括场景分类数据集和语义分割数据集，所述获取地质遥感影像，构建数据集，包括：

根据所述标准场景标签图生成所述场景分类数据集；

9.根据权利要求8所述的岩性场景分类模型构建方法，其特征在于，所述根据所述数据集，训练初始分类模型，得到岩性场景分类模型，包括：

10.一种岩性场景分类方法，其特征在于，包括：

获取待分类的地质遥感影像；

将所述待分类的地质遥感影像输入至如权利要求1-9任一项所述的岩性场景分类模型构建方法中所构建的岩性场景分类模型，得到所述待分类的地质遥感影像的岩性场景分类图。