CN117173600A - 基于改进Mask2Former的草地退化指示草种的分割方法 - Google Patents

基于改进Mask2Former的草地退化指示草种的分割方法 Download PDF

Info

Publication number
CN117173600A
CN117173600A CN202311214166.9A CN202311214166A CN117173600A CN 117173600 A CN117173600 A CN 117173600A CN 202311214166 A CN202311214166 A CN 202311214166A CN 117173600 A CN117173600 A CN 117173600A
Authority
CN
China
Prior art keywords
network
improved
decoder
segmentation
feature map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311214166.9A
Other languages
English (en)
Other versions
CN117173600B (zh
Inventor
李春梅
李楷
李海洋
金云鹏
杨鹏
孔莎莎
方程梧
黄湘杰
韩耀生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qinghai University
Original Assignee
Qinghai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qinghai University filed Critical Qinghai University
Priority to CN202311214166.9A priority Critical patent/CN117173600B/zh
Publication of CN117173600A publication Critical patent/CN117173600A/zh
Application granted granted Critical
Publication of CN117173600B publication Critical patent/CN117173600B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于改进Mask2Former的草地退化指示草种的分割方法,包括无人机拍摄视频影像、逐帧截取、图片裁剪、使用Labelme软件进行标注、使用Swin Transoformer作为主干网络,使用改进Mask2Former分割网络对草地退化指示草种‑披针叶黄华进行语意分割,以披针叶黄华的IoU和Acc作为评估指标五个步骤。本发明通过FFAM模块既提升了网络的分割能力,又对query的初始化进行指导并添加了残差模块,增加了网络对图像特征的定位能力;最终达到了评估指标IoU和Acc的提高,解决了分割效果不明显的缺陷。

Description

基于改进Mask2Former的草地退化指示草种的分割方法
技术领域
本发明涉及计算机图像处理技术领域,特别涉及一种基于改进Mask2Former的草地退化指示草种的分割方法。
背景技术
草地退化既不利于生态系统的平衡稳定,也会影响到当地经济的健康发展;对草地退化等级进行评估以采取相应的措施是工作重点,其中草地退化评价往往采用野外调查和定点采样等人工方式,存在时间成本和人工成本往往很高,以及效率低下的问题。随着计算机图像处理技术快速发展的今天,其中CN115965781A公开了一种基于双解码器的语义分割方法,涉及使用mask2former进行实例分割任务以达到图像分割的目的;因此,使用深度学习与无人机遥感影像结合的方法对草地退化等级进行评价,相较人工方式则更加高效、节约时间和人工成本。
披针叶黄华(Thermopsis lanceolata)是一种牧场常见的有毒植物,其种子和全草都会引起家畜中毒;发明人通过无人机对披针叶黄华进行拍摄,通过截帧、裁剪、标注得到披针叶黄华数据集,使用Mask2Former进行草地退化评价,以草地退化指示草种披针叶黄华的覆盖度作为草地退化的指标;但该方法仍存在分割效果不明显的缺陷,见图6左部。
需要说明的是,虽然上述提及了使用Mask2Former进行草地退化评价所涉及的技术方案,但其不构成现有技术。
发明内容
本发明针对背景技术中使用深度学习与无人机遥感影像结合的方法对草地退化等级进行评价的方法,以及使用Mask2Former进行草地退化评价,以草地退化指示草种-披针叶黄华的覆盖度作为草地退化的指标存在分割效果不明显的缺陷,提供一种基于改进Mask2Former的草地退化指示草种的分割方法,目的在于使用本发明替代草地退化评价往往采用野外调查和定点采样等人工方式,以降低时间成本和人工成本,以提高效率,并解决使用Mask2Former进行草地退化评价存在分割效果不明显的缺陷。
本发明采用的技术方案为:一种基于改进Mask2Former的草地退化指示草种的分割方法,包括以下步骤:
S1、使用无人机拍摄目标草场,得到披针叶黄华的视频影像;
S2、通过逐帧截取、图片裁剪的方式得到披针叶黄华图片;
S3、使用Labelme软件进行标注,得到披针叶黄华数据集;
S4、使用Swin Transoformer作为主干网络,使用改进Mask2Former分割网络对草地退化指示草种-披针叶黄华进行语意分割;
S5、以披针叶黄华的IoU和Acc作为评估指标。
进一步的,所述Mask2former分为Pixel-Decoder、Transformer Decoder和Segmentation Moudel三个部分,其中:所述Pixel-Decoder部分在使用现有的Backbone网络对图像进行特征提取后对图像进行上采样操作,并且将每一次的上采样的特征图送到Transformer Decoder部分;所述Transformer Decoder部分使用Masked Attention的Transformer Decoder块,并且接收Pixel Decoder的多层特征图,对Query Features进行特征提取;所述Segmentation Moudel部分经过MLP后对Transformer Decoder输出的Query进行分类,同时将Mask进行embedding与Pixel Decoder的输出结果进行点乘得到二进制掩码,与分类结果相结合得到最终分割结果。
进一步的,所述改进Mask2Former在于既将FFAM(Feature fusion alignmentmodule)模块应用在Mask2Former网络中Pixel Decoder部分与Transformer Decoder部分的连接处,使得Pixel Decoder模块与Transformer Decoder模块的横向连接中更加准确的融合不同层次的信息,以提升网络的分割能力;又为Mask2Former中的Query的初始化进行了修改,使用backbone的输出结果通过MLP的转换后以在网络中提取位置信息,并对query的初始化进行指导并添加了残差模块,增加网络对图像特征的定位能力。
进一步的,所述FFAM模块输入部分为:由Backbone网络提取的同层横向的特征图,以及Pixel Decoder中上一层的特征图;所述横向特征图首先经过一个1*1卷积层,改层的主要作用是修改通道数,保证横向特征图和纵向特征图通道数量一直,然后经过一个通道注意力层,通道注意力层是由FC、Relu和Sigmod组成,作用是针对不同的通道给予不同的权重,让模型可以有侧重的认识不同通道的特征;输出的结果和上采样两倍的UP feature一起输入到一个可变性卷积层中,改层可以解决在上采样过程中导致横向特征和纵向特征图之间的特征不对齐问题;经过一个残差操作后,再通过一个3*3卷积层得到最后的输出结果。
实施本发明的有益效果:本发明所述基于改进Mask2Former的草地退化指示草种的分割方法,既将FFAM(Feature fusion alignment module)模块应用在Mask2Former网络中Pixel Decoder部分与Transformer Decoder部分的连接处,使得Pixel Decoder模块与Transformer Decoder模块的横向连接中更加准确的融合不同层次的信息,进一步提升了网络的分割能力;又为Mask2Former中的Query的初始化进行了修改,使用backbone的输出结果通过MLP的转换后以在网络中提取位置信息,并对query的初始化进行指导并添加了残差模块,增加了网络对图像特征的定位能力;实施本发明后评估指标IoU和Acc均得到了提高,并解决了分割效果不明显的缺陷。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1:改进Mask2Former的网络结构图;
图2:FFAM模块结构图;
图3:披针叶黄华样例图1;
图4:披针叶黄华样例图2;
图5:披针叶黄华图与标注图;
图6:Mask2Former预测图与Mask-FAFormer预测图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:一种基于改进Mask2Former的草地退化指示草种的分割方法,请参阅附图1、2所示,包括以下步骤:
S1、使用无人机拍摄目标草场,得到披针叶黄华的视频影像;
S2、通过逐帧截取、图片裁剪的方式得到披针叶黄华图片;
S3、使用Labelme软件进行标注,得到披针叶黄华数据集;
S4、使用Swin Transoformer作为主干网络,使用改进Mask2Former分割网络对草地退化指示草种-披针叶黄华进行语意分割;
S5、以披针叶黄华的IoU和Acc作为评估指标。
其中:
所述Mask2former主要分为Pixel-Decoder、Transformer Decoder和Segmentation Moudel三个部分,其中:所述Pixel-Decoder部分在使用现有的Backbone网络对图像进行特征提取后对图像进行上采样操作,并且将每一次的上采样的特征图送到Transformer Decoder部分;所述Transformer Decoder部分是使用了Masked Attention的Transformer Decoder块,并且接收了Pixel Decoder的多层特征图,对Query Features进行特征提取;所述Segmentation Moudel部分经过MLP后对Transformer Decoder输出的Query进行分类,同时将Mask进行embedding与Pixel Decoder的输出结果进行点乘得到二进制掩码,与分类结果相结合得到最终分割结果。
所述改进Mask2Former在于既将FFAM(Feature fusion alignment module)模块应用在Mask2Former网络中Pixel Decoder部分与Transformer Decoder部分的连接处,使得Pixel Decoder模块与Transformer Decoder模块的横向连接中更加准确的融合不同层次的信息,以提升网络的分割能力;又为Mask2Former中的Query的初始化进行了修改,使用backbone的输出结果通过MLP的转换后以在网络中提取位置信息,并对query的初始化进行指导并添加了残差模块,增加网络对图像特征的定位能力。
所述FFAM模块对Mask2Former进行改进,其输入部分为:由Backbone网络提取的同层横向的特征图,以及Pixel Decoder中上一层的特征图;所述横向特征图首先经过一个1*1卷积层,改层的主要作用是修改通道数,保证横向特征图和纵向特征图通道数量一直,然后经过一个通道注意力层,通道注意力层是由FC、Relu和Sigmod组成,作用是针对不同的通道给予不同的权重,让模型可以有侧重的认识不同通道的特征;输出的结果和上采样两倍的UP feature一起输入到一个可变性卷积层中,改层可以解决在上采样过程中导致横向特征和纵向特征图之间的特征不对齐问题;经过一个残差操作后,再通过一个3*3卷积层得到最后的输出结果。
通过本发明,其中:所述披针叶黄华数据集为自制的披针叶黄华数据集,拍摄于中国青海省海南藏族自治州贵南县、泽库县;即使用无人机拍摄的方式,得到披针叶黄华的视频影像,再通过逐帧截取,图片裁剪的方式得到披针叶黄华图片,使用Labelme软件进行标注,得到披针叶黄华数据集,该数据集一共951张图片,图像大小为512*512,其中训练集808张,验证集143张,训练集和验证集比例为5:1。图3和图4为披针叶黄华数据集样例图。
对比例:同样采用本发明实施例步骤S1-S5,区别在于其中步骤S4中,使用CNN网络和Trasnformer网络,其中CNN的网络使用ResNet101作为主干网络,分割头分别使用FCN、Upernet、PSPnet和Deeplabv3+进行分析,并得出表1。
表1.各个网络在披针叶黄华数据集的分割结果
Backbone Segment Head Acc IoU
ResNet-101 FCN 84.76% 73.08%
ResNet-101 pspnet 85.63% 73.63%
ResNet-101 UperNet 85.13% 74.05%
ResNet-101 DeeplabV3+ 87.84% 74.15%
Swin-S MaskFormer 85.67% 73.85%
Swin-L Mask2Former 87.20% 75.01%
Swin-L 改进Mask2Former(Ours) 88.21% 77.23%
由表1可见,Mask2Former模型在披针叶黄华数据集上的IoU为75.01%,而使用本发明改进Mask2Former的模型中,IoU达到了77.23%,提升了大约2%,Acc也从87.2%提升到了88.21%,提升了大约1%。
在本发明的使用效果中,其中:图5为披针叶黄华的图片以及手工标注的mask图,图6左边是使用Mask2Former网络对披针叶黄华图片进行预测的分割结果,右边为使用本发明改进Mask2Former网络对图片进行预测分割的结果。可以看到在MaskFormer网络中对图片的左边一小块植物的分割并不明显,而使用改进后的网络则可以准确的将左边的目标植物分割出来。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于改进Mask2Former的草地退化指示草种的分割方法,其特征在于,包括以下步骤:
S1、使用无人机拍摄目标草场,得到披针叶黄华的视频影像;
S2、通过逐帧截取、图片裁剪的方式得到披针叶黄华图片;
S3、使用Labelme软件进行标注,得到披针叶黄华数据集;
S4、使用Swin Transoformer作为主干网络,使用改进Mask2Former分割网络对草地退化指示草种-披针叶黄华进行语意分割;
S5、以披针叶黄华的IoU和Acc作为评估指标。
2.根据权利要求1所述的一种基于改进Mask2Former的草地退化指示草种的分割方法,其特征在于,所述Mask2former分为Pixel-Decoder、Transformer Decoder和SegmentationMoudel三个部分,其中:所述Pixel-Decoder部分在使用现有的Backbone网络对图像进行特征提取后对图像进行上采样操作,并且将每一次的上采样的特征图送到TransformerDecoder部分;所述Transformer Decoder部分使用Masked Attention的TransformerDecoder块,并且接收Pixel Decoder的多层特征图,对Query Features进行特征提取;所述Segmentation Moudel部分经过MLP后对Transformer Decoder输出的Query进行分类,同时将Mask进行embedding与Pixel Decoder的输出结果进行点乘得到二进制掩码,与分类结果相结合得到最终分割结果。
3.根据权利要求2所述的一种基于改进Mask2Former的草地退化指示草种的分割方法,其特征在于,所述改进Mask2Former在于既将FFAM(Feature fusion alignment module)模块应用在Mask2Former网络中Pixel Decoder部分与Transformer Decoder部分的连接处,使得Pixel Decoder模块与Transformer Decoder模块的横向连接中更加准确的融合不同层次的信息,以提升网络的分割能力;又为Mask2Former中的Query的初始化进行了修改,使用backbone的输出结果通过MLP的转换后以在网络中提取位置信息,并对query的初始化进行指导并添加残差模块,以增加网络对图像特征的定位能力。
4.根据权利要求3所述的一种基于改进Mask2Former的草地退化指示草种的分割方法,其特征在于,所述FFAM模块输入部分为:由Backbone网络提取的同层横向的特征图,以及Pixel Decoder中上一层的特征图;所述横向特征图首先经过一个1*1卷积层,改层的主要作用是修改通道数,保证横向特征图和纵向特征图通道数量一直,然后经过一个通道注意力层,通道注意力层是由FC、Relu和Sigmod组成,作用是针对不同的通道给予不同的权重,让模型可以有侧重的认识不同通道的特征;输出的结果和上采样两倍的UP feature一起输入到一个可变性卷积层中,改层可以解决在上采样过程中导致横向特征和纵向特征图之间的特征不对齐问题;经过一个残差操作后,再通过一个3*3卷积层得到最后的输出结果。
CN202311214166.9A 2023-09-20 2023-09-20 基于改进Mask2Former的草地退化指示草种的分割方法 Active CN117173600B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311214166.9A CN117173600B (zh) 2023-09-20 2023-09-20 基于改进Mask2Former的草地退化指示草种的分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311214166.9A CN117173600B (zh) 2023-09-20 2023-09-20 基于改进Mask2Former的草地退化指示草种的分割方法

Publications (2)

Publication Number Publication Date
CN117173600A true CN117173600A (zh) 2023-12-05
CN117173600B CN117173600B (zh) 2024-08-23

Family

ID=88939442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311214166.9A Active CN117173600B (zh) 2023-09-20 2023-09-20 基于改进Mask2Former的草地退化指示草种的分割方法

Country Status (1)

Country Link
CN (1) CN117173600B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647568A (zh) * 2018-03-30 2018-10-12 电子科技大学 基于全卷积神经网络的草地退化自动提取方法
CN116245930A (zh) * 2023-02-28 2023-06-09 北京科技大学顺德创新学院 一种基于注意力全景感知引导的深度补全方法及装置
CN116612283A (zh) * 2023-06-02 2023-08-18 湖南大学 一种基于大卷积核骨干网络的图像语义分割方法
CN116701681A (zh) * 2023-07-10 2023-09-05 天津大学 一种用于语义分割的多查询网络

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647568A (zh) * 2018-03-30 2018-10-12 电子科技大学 基于全卷积神经网络的草地退化自动提取方法
CN116245930A (zh) * 2023-02-28 2023-06-09 北京科技大学顺德创新学院 一种基于注意力全景感知引导的深度补全方法及装置
CN116612283A (zh) * 2023-06-02 2023-08-18 湖南大学 一种基于大卷积核骨干网络的图像语义分割方法
CN116701681A (zh) * 2023-07-10 2023-09-05 天津大学 一种用于语义分割的多查询网络

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHE XU ET AL.: "MMT: Mixed-Mask Transformer for Remote Sensing Image Semantic Segmentation", 《IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING》, 26 June 2023 (2023-06-26), pages 1 - 15 *

Also Published As

Publication number Publication date
CN117173600B (zh) 2024-08-23

Similar Documents

Publication Publication Date Title
CN112801230B (zh) 一种配电线路无人机智能验收方法
CN110046599A (zh) 基于深度融合神经网络行人重识别技术的智能监控方法
CN112633504B (zh) 一种基于知识图谱的果树病虫害智慧云知识服务系统及方法
CN104504109A (zh) 图片搜索方法和装置
CN103824053A (zh) 一种人脸图像的性别标注方法及人脸性别检测方法
JP7502570B2 (ja) 酒製品位置決め方法、酒製品情報管理方法及びその装置、デバイス及び記憶媒体
CN113470076A (zh) 一种平养鸡舍黄羽鸡多目标跟踪方法
Zheng et al. An efficient online citrus counting system for large‐scale unstructured orchards based on the unmanned aerial vehicle
US12080063B2 (en) Display method and display system for plant disease diagnosis information, and readable storage medium
Lv et al. YOLOV5-CBAM-C3TR: an optimized model based on transformer module and attention mechanism for apple leaf disease detection
CN113537119B (zh) 基于改进Yolov4-tiny的输电线路连接部件检测方法
CN112635060B (zh) 一种生存力评估方法、装置、评估设备及存储介质
CN117173600B (zh) 基于改进Mask2Former的草地退化指示草种的分割方法
Cai et al. Early detection on wheat canopy powdery mildew with hyperspectral imaging.
Wu et al. RaP: Redundancy-aware video-language pre-training for text-video retrieval
Shi et al. Small object detection algorithm incorporating swin transformer for tea buds
Jin et al. Hydroponic lettuce defective leaves identification based on improved YOLOv5s
CN117911939A (zh) 基于图像分割的松材线虫病灾害实时监测预警方法与系统
Zeng et al. MT-Det: A novel fast object detector of maize tassel from high-resolution imagery using single level feature
Li et al. Cattle face recognition under partial occlusion
Zhang et al. Improved YOLOv4 recognition algorithm for pitaya based on coordinate attention and combinational convolution
CN103942528A (zh) 蚜虫虫情调查方法及装置
CN114581758A (zh) 基于EfficientNet网络与深度学习的植物叶部病害识别方法
US11157777B2 (en) Quality control systems and methods for annotated content
CN116152537A (zh) 一种基于Yolov5s的15种林业害虫识别算法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant