CN115880552B - 跨尺度图相似引导聚合系统、方法及应用 - Google Patents

跨尺度图相似引导聚合系统、方法及应用 Download PDF

Info

Publication number
CN115880552B
CN115880552B CN202211223060.0A CN202211223060A CN115880552B CN 115880552 B CN115880552 B CN 115880552B CN 202211223060 A CN202211223060 A CN 202211223060A CN 115880552 B CN115880552 B CN 115880552B
Authority
CN
China
Prior art keywords
scale
semantic
feature
boundary
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211223060.0A
Other languages
English (en)
Other versions
CN115880552A (zh
Inventor
聂婕
王瑞
宋宁
赵恩源
杨启成
陈昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ocean University of China
Original Assignee
Ocean University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ocean University of China filed Critical Ocean University of China
Publication of CN115880552A publication Critical patent/CN115880552A/zh
Application granted granted Critical
Publication of CN115880552B publication Critical patent/CN115880552B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Image Analysis (AREA)

Abstract

本发明属于图像处理技术领域,公开了跨尺度图相似引导聚合系统、方法及应用,用于遥感图像语义分割,该系统包括两个独立的子任务分支,称为语义特征提取分支和边界特征提取分支,在语义特征提取分支中,引入了跨尺度图交互模块CGI构建图结构,并利用图卷积推理并聚合跨尺度节点之间的关联关系,以增强遥感特征的表征能力;在边界特征提取分支中,引入了多尺度相似性引导聚合模块MSA以提取多尺度边界特征,以改善边缘特征对语义分割的辅助效果。

Description

跨尺度图相似引导聚合系统、方法及应用
技术领域
本发明属于图像处理技术领域,特别涉及一种跨尺度图相似引导聚合系统、方法及应用。
背景技术
遥感图像被广泛应用于如环境监测、土地资源管理和灾害评估等方面,在应用时,语义分割是遥感图像的关键技术之一,是将输入图像中每个像素划分为一个语义类别。然而,遥感图像具有多样的地球物理特性、计算量大等特点,因此很难实现有效的语义分割。
近年来,卷积神经网络凭借其强大的特征提取能力极大促进了遥感图像语义分割的发展。完全卷积网络(FCN)首先将全连接层修改为卷积层,使其成为全卷积的网络,实现像素级别的端到端训练。随即,为了更好的恢复图像细节信息,一种“编码器-解码器”结构被提出,该结构利用跳转连接将低级别细节信息与高级别语义信息连接起来,使模型获得更多的细节信息,增强模型预测能力。然而,这些方法在语义信息的提取中暴露了一个共同的缺点,模型受限于固定的几何结构和有限的感受野。为此,出现了一种多尺度上下文融合技术,它应用特定的技术,如空洞卷积或金字塔池模块来聚合上下文,虽然能够有效挖掘多尺度上下文信息,但是在跨尺度信息交互方面却被忽略。而往往跨尺度之间存在着重要的关联关系。这对于语义分割通常至关重要。除此之外,基于注意力的机制和图卷积网络(GCN),从通道或空间维度自适应地捕捉大范围的依赖关系,从而有效扩大感受野的范围。以上策略在一定程度上解决了多尺度问题,并增强了模型的表征能力。另外,为了进一步对遥感图像进行细粒度的分割,最近,有些方法将边界检测模块作为一个独立的分支进行并行探索,将提取出的边缘轮廓特征作为一种补充,这对提高边界细化能力和解决语义分割中的一致性问题都至关重要。
尽管上述方法具有重要意义和价值,但它们仍存在一些缺陷:1)对于多尺度模型,在上下文建模过程中忽略了跨尺度相关性。2)在边界检测过程中,忽略了边界的多尺度特性。3)边界信息稀疏,存在样本不均衡问题,导致对语义特征的指导不可靠。在遥感图像中,边界像素点数量往往只占整个图像的小部分,其边缘特征通常是一个稀疏矩阵,无法有效指导并改善语义分割效果
发明内容
针对现有技术存在的不足,本发明提供一种跨尺度图相似引导聚合系统、方法及应用,本发明通过跨尺度图交互模块构建图结构,并利用图卷积推理并聚合跨尺度节点之间的关联关系,以增强遥感特征的表征能力;通过多尺度相似性引导聚合模块聚合语义特征和边界特征,改善边缘特征对语义分割的辅助效果。
为了解决上述技术问题,本发明采用的技术方案是:
首先,本发明提供一种跨尺度图相似引导聚合系统,包括主干网络和两个独立的子任务分支,称为语义特征提取分支和边界特征提取分支,在语义特征提取分支中,引入了跨尺度图交互模块CGI以提取语义特征,在边界特征提取分支中,引入了多尺度相似性引导聚合模块MSA以提取多尺度边界特征;
所述主干网络首先使用常规的卷积操作挖掘原始图像丰富的语义特征Xi,随即利用空洞卷积方法,以不同膨胀率改变卷积操作的感受野,进一步挖掘原始图像的多尺度语义特征Fk,生成多尺度语义特征图;最后将主干网络所挖掘出的特征图作为输入,进入后续两个分支网络中,其中会将语义特征Xi输入进边缘特征提取分支,而将Fk输入到语义特征提取分支中;
所述语义特征提取分支包括跨尺度图交互模块GCI和图卷积网络GCN,在语义特征提取分支中,以主干网络挖掘出的原始图像的多尺度语义特征Fk作为输入,将其输入到所述的跨尺度图交互模块CGI,通过构建不同尺度的图节点和边缘的关系,从而建立出跨尺度图模型,最后利用图卷积网络GCN推理并聚合跨尺度语义特征之间的关联关系,以增强模型的表征能力,提取语义特征的跨尺度语义特征Gi
所述边界特征提取分支包括多尺度相似性引导聚合模块MSA,该模块包括多尺度边界特征提取MBFE单元和相似性引导聚合SGA单元,多尺度相似性引导聚合模块MSA将含有丰富语义特征Xi作为输入,首先会进行一次初步的特征融合,并进行有监督的训练,从而获得含有边界信息的边界特征B;随即,会将边界特征B输入进MBFE单元;MBFE单元利用具有不同膨胀率的空洞卷积来探测多尺度边界信息,提取含有多尺度的边界特征Bi,SGA单元计算边界特征Bi和所述语义特征提取分支输出的跨尺度语义特征Gi之间的相似性,并执行乘法运算来聚合跨尺度语义特征Gi和边界特征Bi的两个多尺度特征,以改善边缘特征对语义分割的辅助效果,最终输出融合了语义和边缘信息的特征图。
进一步的,所述跨尺度图交互模块CGI首先将主干网络生成的多尺度语义特征图通过特征拼接整合为跨尺度特征图,然后按照图卷积操作对跨尺度特征图进行图推理,将空间像素点转化为图模型中的节点,将计算节点的相似矩阵作为图模型的边;最后,通过图卷积网络GCN中的消息传递机制来执行跨尺度推理来聚合信息,通过跨尺度图推理的作用,使得语义分析在多尺度之间进行交互。
其次,本发明还提供一种如前所述的跨尺度图相似引导聚合系统的应用,用于遥感图像语义分割。
最后,本发明提供一种利用如前所述的跨尺度图相似引导聚合系统进行语义分割的方法,具体方法如下:
S1、首先将原始图像输入进主干网络中,主干网络一方面使用卷积操作挖掘原始图像丰富的语义特征Xi,一方面通过设定不同的空洞率以改变卷积操作的感受野大小,从而挖掘出原始图像的多尺度语义特征Fk,生成多尺度语义特征图;
S2、对于主干网络生成的多尺度语义特征图,输入跨尺度图交互模块GCI中,以空间像素点作为跨尺度图模型的节点,同时计算节点的相似矩阵作为图模型的边,随后,通过图卷积网络GCN中的消息传递机制来执行跨尺度推理来聚合信息,通过跨尺度图推理的作用,使得语义信息在多尺度特征之间进行交互,最终获得跨尺度语义特征Gi
S3、在边界特征提取分支,采用空洞卷积方法以挖掘多尺度边界特征,主干网路输出的语义特征Xi作为输入,首先进行一次初步的特征融合,并进行有监督的训练,从而获得含有边界信息的边界特征B;随即,将边界特征B输入进MBFE单元,对于边界特征B,通过MBFE单元使用不同膨胀率的空洞卷积作用于边界特征B,经过特征挖掘,从而得到不同尺度大小的边界特征Bi,实现多尺度的边界特征挖掘;为了方便后续与语义特征的融合,将挖掘的边界特征Bi的数目和语义特征Gi保持一致;
S4、针对边界特征提取分支挖掘出的边界特征为稀疏矩阵,导致样本不均衡问题,利用相似性引导聚合SGA单元计算边界特征Bi和语义特征提取分支输出的语义特征Gi之间的相似性,通过计算得到相似最强区域,并以此作为权重矩阵对原始的语义特征进行加权融合;
S5、最后输出融合了语义和边缘信息的特征图。
进一步的,步骤S2中,对于主干网络生成的多尺度语义特征Fk,将特征的空间像素点视为节点,并将其大小转换为Fk∈Rn×d,跨尺度节点集合为F=每个节点f都对原始图像中的不同区域进行编码,n和d的值由多尺度语义特征的空间和通道大小决定;将图的边定义为图像区域之间的成对相似性计算,并通过以下等式构造关系其中是一个常规的卷积,其参数通过反向传播学习到,分别表示第p个尺度的第i个节点和第q个尺度的第j个节点。
进一步的,步骤S4中,所述相似性引导聚合SGA单元进行相似性计算具体步骤如下:给定多尺度语义图特征和边界特征小写字母g,b分别表示相应的特征图,下标k表示当前为第几个特征k={1,2,3,4,5},上标n表示所属特征图的位置,首先计算两者的相似度 其中分别为两个非线性变换,分别表示非线性变换的参数,上标T表示矩阵转置。函数用来计算在边界上第j位置与语义图上第i个位置的影响数值;然后,在多尺度边界特征和相似矩阵之间进行矩阵乘法运算其中α是通过反向传播得到的参数,根据上述计算,同一类别的边界区域将以比其他无关区域高的权重被激活。
与现有技术相比,本发明优点在于:
通过本发明不仅能满足跨尺度目标之间的交互,还能挖掘多尺度边界信息,实现鲁棒聚合,极大地提高了遥感特征的表示能力。具体的,本发明设计了跨尺度图交互(CGI)模块,该模块建立跨尺度图结构,执行自适应图推理以捕获跨尺度语义相关信息。本发明还设计了多尺度相似性引导聚合(MSA)模块,挖掘多尺度边界信息,完成可靠的边界特征引导,该模块由多尺度边界特征提取(MBFE)单元和相似性引导聚合(SGA)单元组成。MBFE单元利用具有不同膨胀率的阿托斯卷积来探测多尺度边界信息,SGA单元利用相似性计算来增强边界制导的鲁棒性和可靠性。通过在两个基准遥感数据集上进行的数值实验中,本发明提出的语义分割方法优于现有技术中最先进的方法。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的系统架构图;
图2为本发明的语义特征提取分支结构图;
图3为本发明的相似性引导聚合单元结构图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步的说明。
实施例1
本发明提出了一种用于遥感图像语义分割的跨尺度图相似引导聚合网络(CGSAN),在现有语义分割的图卷积网络的基础上,设计了两个独立的子任务分支,分别用于获取语义特征之间的跨尺度相关性和边界特征的多尺度特性,最终获得包含了语义特征和边界特征的跨尺度特征图。
本实施例的跨尺度图相似引导聚合系统,结合图1所示,包括主干网络和两个独立的子任务分支,分别为语义特征提取分支和边界特征提取分支,下面分别介绍各部分。
所述主干网络包括两部分工作,一是使用常规的卷积操作挖掘原始图像丰富的语义特征Xi;一是利用空洞卷积技术(ASPP),以不同膨胀率改变卷积操作的感受野,从而挖掘原始图像的多尺度语义特征Fk,生成多尺度语义特征图。此部分内容为现有技术关于语义分割的如何获取多尺度特征,此处不再过多赘述。主干网络所挖掘出的特征图作为输入,进入后续的两个分支网络中,其中会将语义特征Xi输入进边界特征提取分支,而将Fk输入到语义特征提取分支中。
结合图2所示,语义特征提取分支包括跨尺度图交互模块GCI和图卷积网络GCN,在语义特征提取分支中,以主干网络挖掘出的原始图像的多尺度语义特征Fk作为输入,将其输入进所设计的跨尺度图交互模块GCI,通过构建不同尺度的图节点和边缘的关系,从而建立出跨尺度图结构,最后利用图卷积网络GCN推理并聚合跨尺度语义特征之间的关联关系,以增强模型的表征能力,提取语义特征的多尺度特征Gi
所述跨尺度图交互模块CGI,对于主干网络生成的多尺度语义特征图,首先通过特征拼接方式被整合为更大的跨尺度特征图(此处是将已有的多尺度特征拼接为尺度更大的特征图,例如尺寸为3X3的两个特征图,拼接之后就得到为6X3的更大的特征图)。随后就会按照常规的图卷积的操作,对这个跨尺度特征图进行图推理,即图的边缘和点的构建,以及信息的聚合等操作。具体的:将空间像素点转化为图模型中的节点,图卷积操作中,进行相似矩阵的计算,将计算节点的相似矩阵作为图模型的边。相关性计算时,会得到两个节点的相关性分数,如果两个节点具有很强的语义关系,则会获得较高的相关性分数,则表明两个节点强相关。最后,通过图卷积网络GCN中的消息传递机制来执行跨尺度推理来聚合信息,通过跨尺度图推理的作用,使得语义分析在多尺度之间进行交互,从而实现挖掘更大范围的语义信息的目的。
结合图3所示,边界特征提取分支中,包括多尺度相似性引导聚合模块MSA,该模块包括多尺度边界特征提取MBFE单元和相似性引导聚合SGA单元。多尺度相似性引导聚合模块MSA将含有丰富语义特征Xi作为输入,首先会进行一次初步的特征融合,并进行有监督的训练,从而获得含有边界信息的边界特征B;随即,会将边界特征B输入进MBFE单元。MBFE单元利用具有不同膨胀率的空洞卷积来探测多尺度边界信息,提取含有多尺度的边界特征Bi
相似性引导聚合SGA单元计算边界特征Bi和所述语义特征提取分支输出的语义特征Gi之间的相似性,并执行乘法运算来聚合语义特征和边界特征的两个多尺度特征,以改善边缘特征对语义分割的辅助效果。
相似性引导聚合SGA单元对边界特征Bi和语义特征提取分支输出的语义特征Gi进行相似性计算,通过计算得到相似最强区域,并以此作为权重矩阵对原始的语义特征进行加权融合。这样边缘特征便得到了增强。这在一定程度上解决了样本不均衡问题。后续实施例3中的方法步骤中详细介绍相似性计算和加权融合方法。
MBFE单元不同膨胀率的空洞卷积是一种有效的方法来生成不同尺度的边界特征。直观地说,这种策略有助于将生成的边界特征与语义特征对齐,从而促进后续的聚合。针对边界特征提取分支挖掘出的边界特征为稀疏矩阵,导致样本不均衡问题,本发明采用相似性分析方法搜寻相关性较强的边缘区域,以强化和引导边缘特征融合。利用边界特征通过计算相似度来指导语义特征学习,比传统的通过元素添加或连接来进行语义特征聚合更具说服力。因此设计出了相似性引导聚合单元SGA来解决特征融合中的稀疏边界矩阵问题。受注意力机制的启发,本发明在相应的尺度上计算语义特征和边界特征之间的相似性,从而突出语义特征的有效边界信息。根据上述计算,同一类别的边界区域将以比其他无关区域得到更高的权重。由于边界特征进行了增强,因此一定程度上解决了语义分割中类内一致性问题,从而提升模型在边缘附近的预测精度。
实施例2
本实施例提供一种跨尺度图相似引导聚合系统的应用,用于遥感图像语义分割。该系统的组成与功能参见实施例1部分的内容,此处不再赘述。
实施例3
本实施例提供一种语义分割方法,使用如实施例1所述的跨尺度图相似引导聚合系统进行,具体方法如下:
S1、首先将原始图像输入进主干网络中,主干网络一方面使用卷积操作挖掘原始图像丰富的语义特征Xi,一方面通过设定不同的空洞率以改变卷积操作的感受野大小,从而挖掘出原始图像的多尺度语义特征Fk,生成多尺度语义特征图;
S2、对于主干网络生成的多尺度语义特征图,输入跨尺度图交互模块GCI中,以空间像素点作为跨尺度图模型的节点,同时计算节点的相似矩阵作为图模型的边,随后,通过图卷积网络GCN中的消息传递机制来执行跨尺度推理来聚合信息,通过跨尺度图推理的作用,使得语义信息在多尺度特征之间进行交互,从而实现挖掘更大范围的语义信息的目的,最终获得跨尺度语义特征Gi
更具体的,步骤S2中,对于主干网络生成的多尺度语义特征Fk,将特征的空间像素点视为节点,并将其大小转换为Fk∈Rn×d,跨尺度节点集合为 每个节点f都对原始图像中的不同区域进行编码,n和d的值由多尺度语义特征的空间和通道大小决定;将图的边定义为图像区域之间的成对相似性计算,并通过以下等式构造关系其中是一个常规的卷积,其参数通过反向传播学习到,分别表示第p个尺度的第i个节点和第q个尺度的第j个节点。本发明可以挖掘出五个尺度的特征图,因此,p和q的最大值为5。从上面的等式可以看出,如果两个计算区域具有很强的语义关系,则会获得较高的相关性分数。在构造节点F和边R的跨尺度图模型之后,通过GCN中的消息传递机制来执行跨尺度推理来聚合信息。通过跨尺度图推理的作用,使得模型能包含了更广泛、更多样的跨尺度语义信息。
S3、在边界特征提取分支,采用空洞卷积方法以挖掘多尺度边界特征,主干网路输出的语义特征Xi作为输入,首先进行一次初步的特征融合,并进行有监督的训练,从而获得含有边界信息的边界特征B;随即,将边界特征B输入进MBFE单元,对于边界特征B,通过MBFE单元使用不同膨胀率的空洞卷积作用于边界特征B,经过特征挖掘,从而得到不同尺度大小的边界特征Bi,实现多尺度的边界特征挖掘;为了方便后续与语义特征的融合,将挖掘的边界特征Bi的数目和语义特征Gi保持一致。
S4、针对边界特征提取分支挖掘出的边界特征为稀疏矩阵,导致样本不均衡问题,利用相似性分析方法搜寻相关性较强的边缘区域,以强化和引导边缘特征与语义特征融合。本发明利用相似性引导聚合SGA单元计算边界特征Bi和语义特征提取分支输出的语义特征Gi之间的相似性,通过计算得到相似最强区域,并以此作为权重矩阵对原始的语义特征进行加权融合。
我们认为利用边界特征通过计算相似度来指导语义特征学习,比传统的通过元素添加或连接来进行语义特征聚合更具说服力。因此设计出了相似性引导聚合SGA单元来解决特征融合中的稀疏边界矩阵问题。受注意力机制的启发,在相应的尺度上计算语义特征和边界特征之间的相似性,从而突出语义特征的有效边界信息。根据上述计算,同一类别的边界区域将以比其他无关区域得到更高的权重。由于边缘特征进行了增强,因此一定程度上解决了语义分割中类内一致性问题,从而提升模型在边缘附近的预测精度。边缘特征会和语义特征进行相似性计算,通过计算得到相似最强区域,并以此作为权重矩阵对原始的语义特征进行加权融合。这样边缘特征便得到了增强。这在一定程度上解决了样本不均衡问题。具体的,步骤S4中,所述相似性引导聚合SGA单元进行相似性计算具体步骤如下:给定多尺度语义图特征和边界特征小写字母g,b分别表示相应的特征图,下标k表示当前为第几个特征k={1,2,3,4,5},上标n表示所属特征图的位置,首先计算两者的相似度 其中分别为两个非线性变换,分别表示非线性变换的参数,上标T表示矩阵转置。函数用来计算在边界上第j位置与语义图上第i个位置的影响数值;然后,在多尺度边界特征和相似矩阵之间进行矩阵乘法运算其中α是通过反向传播得到的参数,根据上述计算,同一类别的边界区域将以比其他无关区域高得多的权重被激活,这不仅确保了对象的类内一致性,而且还解决了边缘像素稀疏问题。
S5、最后输出的是融合了语义和边缘信息的特征图。
综上所述,本发明首先,将原始图像作为输入,利用主干网络学习多尺度特征图。随后,利用两个独立的子分支获取跨尺度语义信息、挖掘多尺度边界信息,具体的:跨尺度图交互模块(CGI)通过设计节点和边来建立跨尺度图结构,使用GCN对跨尺度特征的聚合有效确认进行推理;多尺度相似性引导聚合模块(MSA)由多尺度边界特征提取单元(MBFE)和相似性引导聚合单元(SGA)组成,MBFE单元利用具有不同膨胀率的空洞卷积来探测多尺度边界信息,SGA单元计算语义特征和边界特征之间的相似性,并执行乘法运算来聚合两个多尺度特征。本发明提出的CGSAN不仅能满足跨尺度目标之间的交互,还能挖掘多尺度边界信息,实现稳健的聚集,极大地提高了遥感特征的表征能力,更好的解决遥感图像语义分割问题。
当然,上述说明并非是对本发明的限制,本发明也并不限于上述举例,本技术领域的普通技术人员,在本发明的实质范围内,做出的变化、改型、添加或替换,都应属于本发明的保护范围。

Claims (6)

1.跨尺度图相似引导聚合系统,其特征在于,包括主干网络和两个独立的子任务分支,称为语义特征提取分支和边界特征提取分支,在语义特征提取分支中,引入了跨尺度图交互模块CGI以提取语义特征,在边界特征提取分支中,引入了多尺度相似性引导聚合模块MSA以提取多尺度边界特征;
所述主干网络首先使用常规的卷积操作挖掘原始图像丰富的语义特征Xi;随即利用空洞卷积方法,以不同膨胀率改变卷积操作的感受野,进一步挖掘原始图像的多尺度语义特征Fk,生成多尺度语义特征图;最后将主干网络所挖掘出的特征图作为输入,进入后续两个分支网络中,其中会将语义特征Xi输入进边界特征提取分支,而将Fk输入到语义特征提取分支中;
所述语义特征提取分支包括跨尺度图交互模块GCI和图卷积网络GCN,在语义特征提取分支中,以主干网络挖掘出的原始图像的多尺度语义特征Fk作为输入,将其输入到所述的跨尺度图交互模块CGI,通过构建不同尺度的图节点和边缘的关系,从而建立出跨尺度图模型,最后利用图卷积网络GCN推理并聚合跨尺度语义特征之间的关联关系,提取语义特征的跨尺度语义特征Gi
所述边界特征提取分支包括多尺度相似性引导聚合模块MSA,该模块包括多尺度边界特征提取MBFE单元和相似性引导聚合SGA单元,多尺度相似性引导聚合模块MSA将含有丰富语义特征Xi作为输入,首先会进行一次初步的特征融合,并进行有监督的训练,从而获得含有边界信息的边界特征B;随即,会将边界特征B输入进MBFE单元,MBFE单元利用具有不同膨胀率的空洞卷积来探测多尺度边界信息,提取含有多尺度的边界特征Bi;相似性引导聚合SGA单元计算边界特征Bi和所述语义特征提取分支输出的跨尺度语义特征Gi之间的相似性,并执行乘法运算来聚合跨尺度语义特征Gi和边界特征Bi,以改善边缘特征对语义分割的辅助效果,最终输出融合了语义和边缘信息的特征图。
2.根据权利要求1所述的跨尺度图相似引导聚合系统,其特征在于,所述跨尺度图交互模块CGI首先将主干网络生成的多尺度语义特征图通过特征拼接整合为跨尺度特征图,然后按照图卷积操作对跨尺度特征图进行图推理,将空间像素点转化为图模型中的节点,将计算节点的相似矩阵作为图模型的边;最后,通过图卷积网络GCN中的消息传递机制来执行跨尺度推理来聚合信息,通过跨尺度图推理的作用,使得语义分析在多尺度之间进行交互。
3.权利要求1所述的跨尺度图相似引导聚合系统的应用,其特征在于,用于遥感图像语义分割。
4.使用权利要求1所述的跨尺度图相似引导聚合系统进行语义分割的方法,其特征在于,具体方法如下:
S1、首先将原始图像输入进主干网络中,主干网络一方面使用卷积操作挖掘原始图像丰富的语义特征Xi,一方面通过设定不同的空洞率以改变卷积操作的感受野大小,从而挖掘出原始图像的多尺度语义特征Fk,生成多尺度语义特征图;
S2、对于主干网络生成的多尺度语义特征图,输入跨尺度图交互模块GCI中,以空间像素点作为跨尺度图模型的节点,同时计算节点的相似矩阵作为图模型的边,随后,通过图卷积网络GCN中的消息传递机制来执行跨尺度推理来聚合信息,通过跨尺度图推理的作用,使得语义信息在多尺度特征之间进行交互,最终获得跨尺度语义特征Gi
S3、在边界特征提取分支,采用空洞卷积方法以挖掘多尺度边界特征,主干网路输出的语义特征Xi作为输入,首先进行一次初步的特征融合,并进行有监督的训练,从而获得含有边界信息的边界特征B;随即,将边界特征B输入进MBFE单元,对于边界特征B,通过MBFE单元使用不同膨胀率的空洞卷积作用于边界特征B,经过特征挖掘,从而得到不同尺度大小的边界特征Bi,实现多尺度的边界特征挖掘;为了方便后续与语义特征的融合,将挖掘的边界特征Bi的数目和语义特征Gi保持一致;
S4、针对边界特征提取分支挖掘出的边界特征为稀疏矩阵,导致样本不均衡问题,利用相似性引导聚合SGA单元计算边界特征Bi和语义特征提取分支输出的语义特征Gi之间的相似性,通过计算得到相似最强区域,并以此作为权重矩阵对原始的语义特征进行加权融合;
S5、最后输出融合了语义和边缘信息的特征图。
5.根据权利要求4所述的语义分割的方法,其特征在于,步骤S2中,对于主干网络生成的多尺度语义特征Fk,将特征的空间像素点视为节点,并将其大小转换为Fk∈Rn×d,跨尺度节点集合为每个节点f都对原始图像中的不同区域进行编码,n和d的值由多尺度语义特征的空间和通道大小决定;将图的边定义为图像区域之间的成对相似性计算,并通过以下等式构造关系其中是一个常规的卷积,其参数通过反向传播学习到,分别表示第p个尺度的第i个节点和第q个尺度的第j个节点。
6.根据权利要求5所述的语义分割的方法,其特征在于,步骤S4中,所述相似性引导聚合SGA单元进行相似性计算具体步骤如下:给定多尺度语义图特征和边界特征首先计算两者的相似度 其中分别为两个非线性变换,分别表示非线性变换的参数,上标T表示矩阵转置, 函数用来计算在边界上第j位置与语义图上第i个位置的影响数值;然后,在多尺度边界特征和相似矩阵之间进行矩阵乘法运算 其中α是通过反向传播得到的参数,根据上述计算,同一类别的边界区域将以比其他无关区域高的权重被激活。
CN202211223060.0A 2022-09-29 2022-10-08 跨尺度图相似引导聚合系统、方法及应用 Active CN115880552B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2022112021200 2022-09-29
CN202211202120 2022-09-29

Publications (2)

Publication Number Publication Date
CN115880552A CN115880552A (zh) 2023-03-31
CN115880552B true CN115880552B (zh) 2025-05-23

Family

ID=85770250

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211223060.0A Active CN115880552B (zh) 2022-09-29 2022-10-08 跨尺度图相似引导聚合系统、方法及应用

Country Status (1)

Country Link
CN (1) CN115880552B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116968376A (zh) * 2023-08-01 2023-10-31 温州新盟包装有限公司 包装盒生产装置及其方法
CN119131798B (zh) * 2024-11-08 2025-04-01 河南科技学院 一种基于语义分割网络的田间道路分割方法
CN119942292B (zh) * 2025-04-10 2025-06-27 湘江实验室 一种多元组无人装备多模态信息体系构建方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113947814A (zh) * 2021-10-28 2022-01-18 山东大学 一种基于时空信息增强和多尺度显著性特征提取的跨视角步态识别方法
CN114037833A (zh) * 2021-11-18 2022-02-11 桂林电子科技大学 一种苗族服饰图像语义分割方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062756B (zh) * 2018-01-29 2020-04-14 重庆理工大学 基于深度全卷积网络和条件随机场的图像语义分割方法
CN112861722B (zh) * 2021-02-09 2022-02-22 中国科学院地理科学与资源研究所 一种半监督深度图卷积的遥感土地利用语义分割方法
CN115115831B (zh) * 2022-05-30 2025-03-28 西安理工大学 基于注意力引导的多尺度上下文信息交互的语义分割方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113947814A (zh) * 2021-10-28 2022-01-18 山东大学 一种基于时空信息增强和多尺度显著性特征提取的跨视角步态识别方法
CN114037833A (zh) * 2021-11-18 2022-02-11 桂林电子科技大学 一种苗族服饰图像语义分割方法

Also Published As

Publication number Publication date
CN115880552A (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
CN115880552B (zh) 跨尺度图相似引导聚合系统、方法及应用
CN113486190B (zh) 一种融合实体图像信息和实体类别信息的多模态知识表示方法
CN112183414A (zh) 一种基于混合空洞卷积的弱监督遥感目标检测方法
Li et al. Multi-perspective deep transfer learning model: A promising tool for bearing intelligent fault diagnosis under varying working conditions
CN118485927A (zh) 一种基于多尺度网络的高分辨率遥感图像目标检测方法
CN110443818A (zh) 一种基于涂鸦的弱监督语义分割方法与系统
CN113627557B (zh) 一种基于上下文图注意力机制的场景图生成方法
CN111985538A (zh) 基于语义辅助注意力机制的小样本图片分类模型及方法
CN116737979A (zh) 基于上下文引导多模态关联的图像文本检索方法及系统
CN116561771B (zh) 基于合约语义图与深广特征融合的智能合约漏洞检测方法
CN117409206A (zh) 基于自适应原型聚合网络的小样本图像分割方法
CN116452939A (zh) 基于多模态实体融合与对齐的社交媒体虚假信息检测方法
CN108985298B (zh) 一种基于语义一致性的人体衣物分割方法
CN118298639B (zh) 一种基于多跨度特征提取的交通流预测方法
CN117649582A (zh) 基于级联注意力的单流单阶段网络目标跟踪方法与系统
CN116704202A (zh) 一种基于知识嵌入的视觉关系检测方法
CN119397255A (zh) 信息伪造检测方法、计算机设备、存储介质及程序产品
CN116934796A (zh) 基于孪生残差注意力聚合网络的视觉目标跟踪方法
CN114861766B (zh) 一种基于多粒度演化的动态链路预测方法和系统
CN119648749B (zh) 基于空间通道求和注意力的目标跟踪方法与系统
CN112949501B (zh) 一种从示教视频学习物体的可供性方法
CN120014463A (zh) 基于状态空间模型的多标签遥感场景分类方法及系统
CN119649062A (zh) 一种基于微调clip的遥感图像变化检测方法
CN115129930B (zh) 一种视频的信息处理方法、装置、计算机设备和存储介质
Wu et al. Salient target detection in RGB-T image based on multi-level semantic information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant