CN111127472A - 一种基于权重学习的多尺度图像分割方法 - Google Patents
一种基于权重学习的多尺度图像分割方法 Download PDFInfo
- Publication number
- CN111127472A CN111127472A CN201911043952.0A CN201911043952A CN111127472A CN 111127472 A CN111127472 A CN 111127472A CN 201911043952 A CN201911043952 A CN 201911043952A CN 111127472 A CN111127472 A CN 111127472A
- Authority
- CN
- China
- Prior art keywords
- layer
- scale
- convolution
- features
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
Abstract
本发明公开了一种基于权重学习的多尺度图像分割方法。本发明设计的神经网络在不同尺度上充分提取了目标特征,充分保证了目标的边缘和形态特征,用可学习的权重来保留有用的特征剔除有噪声的特征。该网络模型主要包括编码和解码两部分,在编码阶段,网络提取不同尺度下的特征,在解码阶段融合多层特征空间的特征,每个增强的特征可以获得类别概率分布图,并且通过可学习的自适应权重对所获得增强特征进行加权得到最终特征。实验表明,应用本发明的方法在道路提取上具有更高的准确率和召回率,在道路外形上更贴近真实道路的轮廓。
Description
技术领域
本发明属于遥感图像处理技术领域,是一种基于权重学习的多尺度图像卷积层特征学习方法,可应用于图像目标识别、图像分割等图像特征提取阶段。
背景技术
特征提取是目标识别和图像分割的重要步骤。目标特征主要有目标的颜色特征、纹理特征、形状特征和空间关系特征。颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质;纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质;形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征,图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域;空间关系特征,是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。良好的特征表达,对最终算法的准确性起了非常关键的作用,而且系统主要的计算和测试工作都耗在这一大部分。但实际中一般都是人工完成的,然而,手工地选取特征是一件非常费力、启发式的方法,能不能选取好很大程度上靠经验和运气,而且它的调节需要大量的时间。
深度学习可以自动地学习一些特征,不需要人参与特征的选取过程,它是机器学习中的一个分支,是当今AI领域最热门最前沿的研究内容。它考虑的是用非线性多处理层来学习数据的多尺度特征的抽象表征用反向传播算法对计算模型训练,通过监督或若监督的特征学习和分层特征提取代替手工获取特征。随着网络越深,模型学习到的特征语义信息越高,空间分辨率越低,丢失了浅层的位置特征和形状特征。基于深度学习模型的图像特征提取是目标识别、图像分割等应用的重要步骤,良好的图像特征可极大提示目标识别及图像分割的准确率。然而浅层特征不仅包含物体的位置特征和形状特征,还包含大量的噪声,有效地利用浅层的特征,剔除噪声可以提高目标识别与图像分割的准确率,本发明针对上述现有技术中的不足,对现有的深度学习模型进行了改进。
发明内容
本发明设计了一种基于权重学习的多尺度图像分割方法,用于改善常规卷积特征质量,提升目标识别与图像分割的准确率,增强对不同尺度图像的特征表达能力。该模型在常规的编码-解码结构网络架构后端增加了尺度权重学习特征融合模块,以获得不同级别和不同尺度的特征。解码器用于根据特征级别融合不同级别和不同级别的特征。每个增强特征可以获得类别概率分布图,并且通过可学习的自适应权重对所获得的不同级别的类概率分布图进行加权来获得加权类别概率加权分布图,最后,通过分类器获得最终的分割结果。
本发明实现的具体步骤如下:
1)将样本输入到所构建的模型中进行训练,获得训练好的权重,所述模型包括编码器和解码器;
2)将测试区遥感影像作为输入源输入到训练好的模型中;
3)利用编码器对测试区影像进行特征编码,得到n个不同尺度的池化特征;所述编码器包括五个降采样模块,前两个降采样模块分别包含两个卷积模块和一个池化层,后三个降采样模块包含三个卷积模块和一个池化层,其中卷积模块包含一个BN层,一个3*3卷积核的卷积层和一个ReLu的激活层;
4)将第n层池化特征输入解码器中的尺度模块的第一个尺度子模块中进行解码,得到解码特征,将得到的解码特征与第n-1层池化特征进行融合,得到尺度增强特征一,其中尺度子模块的个数为n,每个尺度子模块包含一个上采样层、三个卷积模块,每个卷积模块包含一个BN层和一个3*3卷积层;
5)将4)得到的尺度增强特征一输入到尺度模块的第二个尺度子模块中进行解码,将得到的解码特征与n-2层池化特征进行融合,得到尺度增强特征二;
6)重复4)、5),直到与第一层池化特征进行融合;
7)将4)得到的尺度增强特征一输入到结构模块的第一个结构子模块中,得到尺度结构增强特征一,将5)得到的尺度增强特征二输入到结构模块的第二个结构子模块中,得到尺度结构增强特征二;
其中,结构模块中结构子模块的个数为n-1,每个结构子模块包含一个反卷积层、三个卷积模块,前两个卷积模块分别包含一个BN层和一个3*3卷积层,最后一个卷积模块包含一个BN层和一个1*1卷积层;
8)重复7)直到最后一个尺度增强特征输入完毕;
9)获得n-1个不同尺度增强后的类别概率分布图,利用1)中学习到的权重对其进行加权,然后利用softmax得到最终分割结果。
进一步的,步骤4)的具体实现方式如下,
在尺度模块中,对第i+1层的特征进行上采样,并通过卷积将其转换为密集特征,然后与前一层的池化特征融合,假设Mi是第i层的池化特征,Ni是第i层的尺度增强特征,Ni通过公式(1)计算,
其中Conv(X,w)表示X与w的卷积,w是滤波器,Up(X)表示X的上采样,⊙表示两个张量的加法运算。
进一步的,步骤9)中获得n-1个不同尺度增强后的类别概率分布图的具体实现方式如下,通过公式(2)预测每层的强化后尺度结构增强特征类别概率图Ci,
进一步的,步骤9)中利用softmax得到最终分割结果的具体实现方式如下,
其中S(X)表示softmax函数,e是自然指数,k是数据的维度,wi为权重;假设存在张量X,Xj表示X中的第j个元素,则该元素的softmax值如公式(4)所示。
本发明与常规遥感影像道路提取方法相比具有以下特点:将可以学习的权重值用于多层特征空间融合,应用本发明的方法在道路提取上具有更高的准确率和召回率,在道路外形上更贴近真实道路的轮廓。
附图说明
图1为本发明的总体框架图。
图2为本发明实施例中的编码器结构图。
图3为本发明实施例中的解码器结构图。
图4为本发明实施例中的结果图,其中(a)为原始影像,(b)为标签,(c)为Segnet模型处理结果图,(d)为U-net模型处理结果图,(e)为本发明方法处理结果图。
具体实施方式
下面结合附图对本发明方法的具体实施方式作进一步说明。
如图1所示,一种基于权重学习的多尺度图像卷积层特征学习方法,包括如下步骤:
1)将样本放入本发明设计的模型中进行训练;
本发明设计的模型的结构为:编码——解码结构
2)将测试区遥感影像作为输入源输入进1)中的模型;
3)利用编码器对测试区影像进行特征编码,得到五个不同尺度的池化特征。编码器采用五个降采样模块,前两个降采样模块包含两个卷积模块加一个池化层,后三个降采样模块包含三个卷积模块和一个池化层,卷积模块包含一个BN层,一个3*3卷积核的卷积层和一个ReLu的激活层,卷积层的输入和输出均为64个维度,如图2所示;
具体地,在编码阶段,通过卷积对图像进行编码,并且在每个卷积层之后通过池化层来压缩特征。
4)将最后一层池化特征输入解码器中的尺度模块进行解码将得到的解码特征与上一层池化特征进行融合,得到尺度增强特征一,其中尺度子模块的个数为n,每个尺度子模块包含一个上采样层、三个卷积模块,每个卷积模块包含一个BN层和一个3*3卷积层,如图3所示;
在尺度模块中,对第i+1层的特征进行上采样,并通过卷积将其转换为密集特征,然后与前一层的池化特征融合,我们假设Mi(i=1,2,…n)是第i层的池化特征,Ni是第i层的尺度增强特征,Ni可以通过公式(1)计算:
其中Conv(X,w)表示X与w的卷积,w是滤波器,Up(X)表示X的上采样,⊙表示两个张量的加法运算。
在尺度模块中,这里所述的第i层对应的即为第i个尺度子模块。
5)将4)得到的尺度增强特征一输入到尺度模块的第二个尺度子模块中进行解码,将得到的解码特征与上一层池化特征进行融合,得到尺度增强特征二;
6)重复4)、5),直到与第一层池化特征进行融合;
7)将4)得到的尺度增强特征一输入到结构模块的第一个结构子模块中,得到尺度结构增强特征一,将5)得到的尺度增强特征二输入到结构模块的第二个结构子模块中,得到尺度结构增强特征二;
其中,结构模块中结构子模块的个数为n-1,每个结构子模块包含一个反卷积层、三个卷积模块,前两个卷积模块分别包含一个BN层和一个3*3卷积层,3*3卷积层的输入和输出均为64个维度,最后一个卷积模块包含一个BN层和一个1*1卷积层,1*1卷积层的输入为64个维度和输出为1个维度;
8)重复7)直到最后一个尺度增强特征输入完毕;
9)得到四个不同尺度增强后的类别概率分布图,利用1)中学习到的权重对其进行加权,然后利用softmax得到最终分割结果。
在结构模块中,由于强化后的特征大小不同于图像的大小,因此有必要将强化后的特征上采样到图像的大小,然后通过卷积获得尺度结构增强特征Di,并通过公式(2)预测每层的强化后的特征类别概率图Ci。
最后,通过使用softmax分类器获得分割结果。
其中S(X)表示softmax函数,e是自然指数,k是数据的维度,wi为可学习的权重值;假设存在张量X,Xj表示X中的第j个元素,则该元素的softmax值如公式(4)所示。
为了验证本发明方法的性能,使用The Massachusetts Roads Dataset进行验证试验,该数据集中所有图像的大小为1500×1500,分辨率为1m。数据集由1108个训练图像,49个测试图像和14个验证图像组成。数据集在不同模型上的表现如表1和图4所示,从表中可以看出,本发明方法比Segnet召回率高15.4个百分点,精度则高18.9个百分点;从图中也可以直观的看出本发明方法分割的结果更完整,分割效果与标签图像最接近。
表1数据集在不同模型上的表现
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (4)
1.一种基于权重学习的多尺度图像分割方法,其特征在于,包括如下步骤:
1)将样本输入到所构建的模型中进行训练,获得训练好的权重,所述模型包括编码器和解码器;
2)将测试区遥感影像作为输入源输入到训练好的模型中;
3)利用编码器对测试区影像进行特征编码,得到n个不同尺度的池化特征;所述编码器包括五个降采样模块,前两个降采样模块分别包含两个卷积模块和一个池化层,后三个降采样模块包含三个卷积模块和一个池化层,其中卷积模块包含一个BN层,一个3*3卷积核的卷积层和一个ReLu的激活层;
4)将第n层池化特征输入解码器中的尺度模块的第一个尺度子模块中进行解码,得到解码特征,将得到的解码特征与第n-1层池化特征进行融合,得到尺度增强特征一,其中尺度子模块的个数为n,每个尺度子模块包含一个上采样层、三个卷积模块,每个卷积模块包含一个BN层和一个3*3卷积层;
5)将4)得到的尺度增强特征一输入到尺度模块的第二个尺度子模块中进行解码,将得到的解码特征与第n-2层池化特征进行融合,得到尺度增强特征二;
6)重复4)、5),直到与第一层池化特征进行融合;
7)将4)得到的尺度增强特征一输入到结构模块的第一个结构子模块中,得到尺度结构增强特征一,将5)得到的尺度增强特征二输入到结构模块的第二个结构子模块中,得到尺度结构增强特征二;
其中,结构模块中结构子模块的个数为n-1,每个结构子模块包含一个反卷积层、三个卷积模块,前两个卷积模块分别包含一个BN层和一个3*3卷积层,最后一个卷积模块包含一个BN层和一个1*1卷积层;
8)重复7)直到最后一个尺度增强特征输入完毕;
9)获得n-1个不同尺度增强后的类别概率分布图,利用1)中学习到的权重对其进行加权,然后利用softmax得到最终分割结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911043952.0A CN111127472B (zh) | 2019-10-30 | 2019-10-30 | 一种基于权重学习的多尺度图像分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911043952.0A CN111127472B (zh) | 2019-10-30 | 2019-10-30 | 一种基于权重学习的多尺度图像分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111127472A true CN111127472A (zh) | 2020-05-08 |
CN111127472B CN111127472B (zh) | 2021-09-14 |
Family
ID=70495488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911043952.0A Active CN111127472B (zh) | 2019-10-30 | 2019-10-30 | 一种基于权重学习的多尺度图像分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111127472B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111696094A (zh) * | 2020-06-12 | 2020-09-22 | 杭州迪英加科技有限公司 | 免疫组化pd-l1膜染色病理切片图像处理方法、装置和设备 |
CN112001293A (zh) * | 2020-08-19 | 2020-11-27 | 四创科技有限公司 | 结合多尺度信息和编解码网络的遥感影像地物分类方法 |
CN112419333A (zh) * | 2020-11-17 | 2021-02-26 | 武汉大学 | 一种遥感影像自适应特征选择分割方法及系统 |
CN112862774A (zh) * | 2021-02-02 | 2021-05-28 | 重庆市地理信息和遥感应用中心 | 一种遥感影像建筑物精确分割方法 |
CN113673539A (zh) * | 2021-08-19 | 2021-11-19 | 广西科技大学 | 一种基于深度学习模型的逐级交互式轮廓识别方法 |
CN114445421A (zh) * | 2021-12-31 | 2022-05-06 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 一种鼻咽癌淋巴结区域的识别分割方法、装置及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013114992A1 (ja) * | 2012-01-30 | 2013-08-08 | 三菱電機株式会社 | カラー動画像符号化装置、カラー動画像復号装置、カラー動画像符号化方法及びカラー動画像復号方法 |
CN103646239A (zh) * | 2013-12-25 | 2014-03-19 | 武汉大学 | 基于极坐标傅里叶变换的旋转不变性图像特征提取方法 |
CN108062754A (zh) * | 2018-01-19 | 2018-05-22 | 深圳大学 | 基于密集网络图像的分割、识别方法和装置 |
CN108921799A (zh) * | 2018-06-22 | 2018-11-30 | 西北工业大学 | 基于多尺度协同学习卷积神经网络的遥感图像薄云去除方法 |
CN109447994A (zh) * | 2018-11-05 | 2019-03-08 | 陕西师范大学 | 结合完全残差与特征融合的遥感图像分割方法 |
CN109584246A (zh) * | 2018-11-16 | 2019-04-05 | 成都信息工程大学 | 基于多尺度特征金字塔的dcm心肌诊疗放射影像分割方法 |
-
2019
- 2019-10-30 CN CN201911043952.0A patent/CN111127472B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013114992A1 (ja) * | 2012-01-30 | 2013-08-08 | 三菱電機株式会社 | カラー動画像符号化装置、カラー動画像復号装置、カラー動画像符号化方法及びカラー動画像復号方法 |
CN103646239A (zh) * | 2013-12-25 | 2014-03-19 | 武汉大学 | 基于极坐标傅里叶变换的旋转不变性图像特征提取方法 |
CN108062754A (zh) * | 2018-01-19 | 2018-05-22 | 深圳大学 | 基于密集网络图像的分割、识别方法和装置 |
CN108921799A (zh) * | 2018-06-22 | 2018-11-30 | 西北工业大学 | 基于多尺度协同学习卷积神经网络的遥感图像薄云去除方法 |
CN109447994A (zh) * | 2018-11-05 | 2019-03-08 | 陕西师范大学 | 结合完全残差与特征融合的遥感图像分割方法 |
CN109584246A (zh) * | 2018-11-16 | 2019-04-05 | 成都信息工程大学 | 基于多尺度特征金字塔的dcm心肌诊疗放射影像分割方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111696094A (zh) * | 2020-06-12 | 2020-09-22 | 杭州迪英加科技有限公司 | 免疫组化pd-l1膜染色病理切片图像处理方法、装置和设备 |
CN111696094B (zh) * | 2020-06-12 | 2021-06-08 | 杭州迪英加科技有限公司 | 免疫组化pd-l1膜染色病理切片图像处理方法、装置和设备 |
CN112001293A (zh) * | 2020-08-19 | 2020-11-27 | 四创科技有限公司 | 结合多尺度信息和编解码网络的遥感影像地物分类方法 |
CN112419333A (zh) * | 2020-11-17 | 2021-02-26 | 武汉大学 | 一种遥感影像自适应特征选择分割方法及系统 |
CN112419333B (zh) * | 2020-11-17 | 2022-04-29 | 武汉大学 | 一种遥感影像自适应特征选择分割方法及系统 |
CN112862774A (zh) * | 2021-02-02 | 2021-05-28 | 重庆市地理信息和遥感应用中心 | 一种遥感影像建筑物精确分割方法 |
CN113673539A (zh) * | 2021-08-19 | 2021-11-19 | 广西科技大学 | 一种基于深度学习模型的逐级交互式轮廓识别方法 |
CN114445421A (zh) * | 2021-12-31 | 2022-05-06 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 一种鼻咽癌淋巴结区域的识别分割方法、装置及系统 |
CN114445421B (zh) * | 2021-12-31 | 2023-09-29 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 一种鼻咽癌淋巴结区域的识别分割方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111127472B (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111127472B (zh) | 一种基于权重学习的多尺度图像分割方法 | |
CN110136154B (zh) | 基于全卷积网络与形态学处理的遥感图像语义分割方法 | |
CN107945204B (zh) | 一种基于生成对抗网络的像素级人像抠图方法 | |
CN114120102A (zh) | 边界优化的遥感图像语义分割方法、装置、设备及介质 | |
CN111797779A (zh) | 基于区域注意力多尺度特征融合的遥感图像语义分割方法 | |
CN112329760B (zh) | 基于空间变换网络端到端印刷体蒙古文识别翻译的方法 | |
CN112101364B (zh) | 基于参数重要性增量学习的语义分割方法 | |
CN113516133B (zh) | 一种多模态图像分类方法及系统 | |
CN110738663A (zh) | 双域适应模块金字塔型网络及无监督域适应图像分割方法 | |
CN114511576B (zh) | 尺度自适应特征增强深度神经网络的图像分割方法与系统 | |
CN114048822A (zh) | 一种图像的注意力机制特征融合分割方法 | |
CN116645592B (zh) | 一种基于图像处理的裂缝检测方法和存储介质 | |
CN114612660A (zh) | 一种基于多特征融合点云分割的三维建模方法 | |
CN114359631A (zh) | 基于编码-译码弱监督网络模型的目标分类与定位方法 | |
CN114612902A (zh) | 图像语义分割方法、装置、设备、存储介质及程序产品 | |
CN114387365A (zh) | 一种线稿上色方法及装置 | |
CN116563682A (zh) | 一种基于深度霍夫网络的注意力方案和条带卷积语义线检测的方法 | |
CN114998373A (zh) | 基于多尺度损失函数的改进型U-Net云图分割方法 | |
CN114332070A (zh) | 一种基于智能学习网络模型压缩的陨坑检测方法 | |
CN113436224A (zh) | 一种基于显式构图规则建模的智能图像裁剪方法及装置 | |
CN116580156A (zh) | 基于大数据深度学习的文本生成3d打印模型方法 | |
CN115222998A (zh) | 一种图像分类方法 | |
Rui et al. | Data Reconstruction based on supervised deep auto-encoder | |
JPWO2019116497A1 (ja) | 識別装置、識別方法、および識別プログラム | |
CN115564982A (zh) | 一种基于对抗学习的同域遥感影像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |