CN113628180B - 一种基于语义分割网络的遥感建筑物检测方法及系统 - Google Patents
一种基于语义分割网络的遥感建筑物检测方法及系统 Download PDFInfo
- Publication number
- CN113628180B CN113628180B CN202110876041.7A CN202110876041A CN113628180B CN 113628180 B CN113628180 B CN 113628180B CN 202110876041 A CN202110876041 A CN 202110876041A CN 113628180 B CN113628180 B CN 113628180B
- Authority
- CN
- China
- Prior art keywords
- remote sensing
- image
- building
- building detection
- resolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 90
- 230000011218 segmentation Effects 0.000 title claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 44
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000011156 evaluation Methods 0.000 claims description 57
- 230000006870 function Effects 0.000 claims description 26
- 238000012360 testing method Methods 0.000 claims description 20
- 238000005520 cutting process Methods 0.000 claims description 16
- 238000010276 construction Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 13
- 230000006872 improvement Effects 0.000 claims description 12
- 238000012795 verification Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 230000009466 transformation Effects 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 5
- 238000013526 transfer learning Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 10
- 238000004590 computer program Methods 0.000 description 7
- 230000015654 memory Effects 0.000 description 7
- 238000011176 pooling Methods 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10032—Satellite or aerial image; Remote sensing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于语义分割网络的遥感建筑物检测方法及系统,该方法包括:获取包含建筑物的遥感影像,构建遥感影像数据集;对U‑Net网络按照预设方式进行改进,得到建筑物检测模型;基于所述数据集对建筑物检测模型进行训练;利用训练好的建筑物检测模型对待检测的遥感影像中的建筑物进行检测。本发明能够对影像建筑物进行提取,并提高分割精度和边界信息质量。
Description
技术领域
本发明涉及遥感影像处理技术领域,特别涉及一种基于语义分割网络的遥感建筑物检测方法及系统。
背景技术
随着遥感技术的进步,高分辨率的遥感影像具有更加精细丰富的信息,建筑物是其中最普遍且复杂的地物信息之一。建筑物提取是城市遥感影像的主要研究方向,一方面,建筑物的精确提取有利于遥感影像在城市规划、智慧城市建设等领域的深入应用和扩展,对遥感影像制图、城市变化检测、地理信息系统信息的获取具有重要价值;另一方面,建筑物提取更加精细化,对于数字城市建设以及自然灾害,如地震的风险预测与应急评估具有重要意义。
现有的研究中,深度学习方法虽然在遥感影像建筑物检测中较之于机器学习方法在精度上有了很大的提高,但是由于遥感影像自身的复杂性、多样性以及不确定性,造成现有网络模型的特征提取能力不足以获取大飞机遥感影像中丰富的语义信息以及细节、边缘信息太过粗糙,最终导致建筑物检测精度较低。
发明内容
本发明提供了一种基于语义分割网络的遥感建筑物检测方法及系统,以解决现有网络模型的特征提取能力不足以获取大飞机遥感影像中丰富的语义信息以及细节、边缘信息太过粗糙,最终导致建筑物检测精度较低的技术问题。
为解决上述技术问题,本发明提供了如下技术方案:
一方面,本发明提供了一种基于语义分割网络的遥感建筑物检测方法,该基于语义分割网络的遥感建筑物检测方法包括:
获取包含建筑物的遥感影像,构建遥感影像数据集;
对U-Net网络按照预设方式进行改进,得到建筑物检测模型;
基于所述遥感影像数据集,对所述建筑物检测模型进行训练;
利用训练好的建筑物检测模型,对待检测的遥感影像中的建筑物进行检测。
进一步地,在对待检测的遥感影像中的建筑物进行检测之后,所述方法还包括:采用预设的评估方式对所述建筑物检测模型进行有效性评估和验证;其中,所述预设的评估方式为精确率评估方式、F1分数评估方式、召回率评估方式、平均交并比评估方式和频权交并比评估方式中的任意一种或多种的组合。
进一步地,所述获取包含建筑物的遥感影像,构建遥感影像数据集,包括:
获取第一预设区域的全区高分辨率航空正射影像和第二预设区域的高分二号影像;其中,所述高分二号影像为由分辨率为1m的高分2号卫星拍摄的影像;
使用ArcGis中的栅格工具,对所述高分辨率航空正射影像进行裁剪处理,将所述高分辨率航空正射影像切割为大小分别为1024*1024的多张影像图,并选取切割后所得到的影像图中的一部分进行建筑物标注处理,以制作航空数据集;使用ArcGis中的栅格工具对所述高分二号影像进行裁剪,将所述高分二号影像切割为大小分别为1024*1024的多张影像图,并选取切割后所得到的影像图中的一部分进行建筑物标注处理,以制作高分数据集;
将所述航空数据集划分为第一训练集和第一测试集;将所述高分数据集划分为第二训练集和第二测试集;并对所述第一训练集和第二训练集中的数据进行数据预处理;其中,所述数据预处理包括数据增强和引入扩展的数据集;预处理后的第一训练集和预处理后的第二训练集用于对所述建筑物检测模型进行训练,所述第一测试集和所述第二测试集用于对所述建筑物检测模型进行测试。
进一步地,所述数据增强为随机翻转、明暗度调节和仿射变换中的一种或多种的组合。
进一步地,所述扩展的数据集为Inria Aerial Image Dataset。
进一步地,所述对U-Net网络按照预设方式进行改进,包括:
采用迁移学习的方法,将U-Net网络中的编码器结构替换为在ImageNet数据集上预训练的ResNet残差网络作为特征提取网络。
进一步地,所述对U-Net网络按照预设方式进行改进,还包括:
在U-Net网络中构建深度为4的特征金字塔。
进一步地,所述对U-Net网络按照预设方式进行改进,还包括:
将U-Net网络中的逐像素的交叉熵损失函数替换为在BasNet中提出的混合损失函数;所述混合损失函数包括交叉熵损失BCE、结构相似性损失SSIM和IOU损失,分别从pixel-level、patch-level、map-level三个不同层级关注显著信息。
另一方面,本发明还提供了一种基于语义分割网络的遥感建筑物检测系统,该基于语义分割网络的遥感建筑物检测系统包括:
数据集构建模块,用于获取包含建筑物的遥感影像,构建遥感影像数据集;
建筑物检测模型构建模块,用于对U-Net网络按照预设方式进行改进,得到建筑物检测模型;
模型训练模块,用于基于所述数据集构建模块所构建的遥感影像数据集,对所述建筑物检测模型构建模块所构建的建筑物检测模型进行训练;
建筑物检测模块,用于利用经所述模型训练模块训练好的建筑物检测模型,对待检测的遥感影像中的建筑物进行检测。
进一步地,所述系统还包括评估验证模块,用于:
采用预设的评估方式对所述建筑物检测模型进行有效性评估和验证;其中,所述预设的评估方式为精确率评估方式、F1分数评估方式、召回率评估方式、平均交并比评估方式和频权交并比评估方式中的任意一种或多种的组合。
再一方面,本发明还提供了一种电子设备,其包括处理器和存储器;其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行以实现上述方法。
又一方面,本发明还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现上述方法。
本发明提供的技术方案带来的有益效果至少包括:
本发明提供的基于语义分割网络的遥感建筑物检测方法是一种在遥感影像自身复杂性、多样性以及不确定性的条件下,对复杂的地物信息建筑物进行检测的方法。本发明的方法可以实现在遥感影像自身复杂性、多样性以及不确定性的条件下,对复杂的地物信息建筑物进行检测,并可以提高最终的检测精度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于语义分割网络的遥感建筑物检测方法的流程示意图;
图2是本发明实施例提供的残差结构示意图;
图3是本发明实施例提供的编码器结构示意图;
图4是本发明实施例提供的深度为4的金字塔结构示意图;
图5是本发明实施例提供的改进的U-Net网络结构示意图;
图6是本发明实施例提供的基于语义分割网络的遥感建筑物检测系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
第一实施例
本实施例提供了一种基于语义分割网络的遥感建筑物检测方法,该方法可以由电子设备实现,该电子设备可以是终端或者服务器。具体地,该基于语义分割网络的遥感建筑物检测方法的执行流程如图1所示,包括以下步骤:
S1,获取包含建筑物的遥感影像,构建遥感影像数据集;
S2,对U-Net网络按照预设方式进行改进,得到建筑物检测模型;
S3,基于遥感影像数据集,对所述建筑物检测模型进行训练;
S4,利用训练好的建筑物检测模型对待检测的遥感影像中的建筑物进行检测。
进一步地,在对遥感影像中的建筑物进行检测之后,所述方法还包括:
S5,采用预设的评估方式对所述建筑物检测模型进行有效性评估和验证;其中,所述预设的评估方式为精确率评估方式、F1分数评估方式、召回率评估方式、平均交并比评估方式和频权交并比评估方式中的任意一种或多种的组合。
具体地,在本实施例中,上述S1的实现过程如下:
获取第一预设区域的全区高分辨率航空正射影像和第二预设区域的高分二号影像;其中,所述高分二号影像为由分辨率为1m的高分2号卫星拍摄的影像;
使用ArcGis中的栅格工具,对所述高分辨率航空正射影像进行裁剪处理,将所述高分辨率航空正射影像切割为大小分别为1024*1024的多张影像图,并选取切割后所得到的影像图中的一部分进行建筑物标注处理,以制作航空数据集;使用ArcGis中的栅格工具对所述高分二号影像进行裁剪,将所述高分二号影像切割为大小分别为1024*1024的多张影像图,并选取切割后所得到的影像图中的一部分进行建筑物标注处理,以制作高分数据集;
需要说明的是,由于高分辨率航空正射遥感影像和高分影像都比较大,因此需要将原始影像利用ArcGis进行栅格化处理;具体如下:
打开ArcGis软件,将全区的影像加载进去,找到分割栅格工具,在输入栅格中输入加载的遥感影像,输出栅格的大小为想要分割后的图片分辨率大小(本实施例中为1024*1024),输出方法选择SIZE_OF_TILE方法,输出格式为PNG形式,所有参数填写完成后直接点击确定即可。
对高分辨率航空正射遥感影像和高分影像裁剪之后得到的图片分别从不同区域进行挑选;其中,航空正射影像中最终挑出300张图片;高分二号遥感影像中最终挑出118张图片,挑选出的图片均使用labelme工具进行标注处理。
将所述航空数据集划分为第一训练集和第一测试集;将所述高分数据集划分为第二训练集和第二测试集;并对所述第一训练集和第二训练集中的数据进行数据预处理;其中,所述数据预处理包括数据增强和引入扩展的数据集;预处理后的第一训练集和预处理后的第二训练集用于对所述建筑物检测模型进行训练,所述第一测试集和所述第二测试集用于对所述建筑物检测模型进行测试。
其中,航空正射影像的300张图片中选250张做训练集,50张做测试集;高分二号遥感影像的118张图片中选94张做训练集,24张做测试集。
所述数据预处理具体实现过程如下:
分别获取航空正射影像和高分二号影像不同区域的图像,对其进行数据增强操作,从而增加不同条件下地数据,使得模型具有更好地泛化性和鲁棒性;
从Inria Aerial Image Dataset数据集中,选取不同城市住区,不同城市景观和照明条件的影像加入航空正射影像和高分二号影像训练集中。其中,Inria Aerial Image数据集覆盖范围达到了810km2,训练和测试各占一半;其为航拍矫正彩色图,空间分辨率达到0.3m;覆盖了不同的城市住区、从人口稠密地区到高山城镇。
其中,所述数据增强的方式包括随机翻转、明暗度调节和仿射变换。
进一步地,为更好的理解上述数据增强方式,对其进行详细说明:
随机翻转:包括水平翻转、垂直翻转和对角线翻转。将一个n*n的二维矩阵分别左右翻转180度、上下旋转180度以及顺时针旋转180度;
明暗度调节:在图像的HSV颜色空间中,随机改变饱和度、亮度和对比度。其中亮度便是图像的明暗程度;饱和度指的图像颜色种类的多少;对比度则是图像最大灰度级和最小灰度级之间的差值;
仿射变换:一种二维坐标到二维坐标的线性变换,其通过一系列的原子变换复合实现,具体包括:平移、缩放、旋转、翻转。
本实施例中,将原始图像进行明暗度调节方式进行数据增强,采用HSL空间亮度饱和度调节,亮度调整将像素的强度整体变大或者变小,饱和度则可以改变图像最大和最小灰度级之间的颜色种类,使得图像看起来更鲜明,从而拓宽某个区域内的显示精度。
具体地,先将数字图像进行归一化处理,且变为浮点型,颜色空间转换BGR为HLS,其中HLS空间,三个通道分别是:Hue色相、Lightness亮度、saturation饱和度;然后分别对亮度和饱和度进行线性变化处理,并创建两个滑动条可手动分别调整亮度和饱和度。
将原始图像进行仿射变换,实际是同时将图像进行平移、缩放和旋转操作,其需要一个M矩阵,可以利用opencv提供的根据变换前后三个点的对应关系自动求解,本实例中给出的前后位置关系分别为[[0,0],[cols-1,0],[0,rows-1]],[cols*0.2,rows*0.1],[cols*0.9,rows*0.2],[cols*0.1,rows*0.9]],其中cols和rows分别代表输入影像的长和宽,大小为1024。
所述对U-Net网络按照预设方式进行改进,包括:
首先,需要说明的是,U-Net网络在提出之初,是一个典型地端到端地编码器-解码器结构,支持少量地数据训练模型,分割速度较快。该网络的编码器部分由4块编码模块组成,每个模块包含两个3*3的重复卷积,每个卷积后面跟着一个Relu函数,以及每个模块后面是一个步长为2的最大池化运算。此网络就是用此模块来进行图像的特征提取。
基于上述,本实施例的第一个改进就是采用迁移学习的方法,将U-Net网络中的编码器结构替换为在ImageNet数据集上预训练的ResNet34残差网络作为特征提取网络。ResNet34网络拥有34个卷积层,并提出了residual结构(如图2所示)解决降级问题,使得深度神经网络可以更好的优化。
具体地,本实施例的编码器分为五部分,如图3所示。第一部分使用一个输出通道为64、步幅为2的7×7卷积,后跟着批量归一化和ReLU激活函数,然后是一个步幅为2的3×3的最大池化层。第二部分到第五部分,分别包含3、4、6、3个残差块,每个残差块由2个3×3的卷积和一个跳跃连接组成,每个卷积后跟着一个批量归一化操作,自第三部分开始,每部分的第一个残差块的第一个3×3卷积设置步长为2进行下采样一次。整个卷积操作共下采样4次,图像分辨率缩小16倍。
此外,采用迁移学习的方式,引入在ImageNet数据集上预训练的ResNet34网络,将训练好的模型参数分享给新模型,替代从头训练网络,可以加快并优化模型的学习效率。
本实施例对U-Net做的第二个改进是加入金字塔模型,如图4所示。在U-Net网络中构建深度为4的特征金字塔,引入更多的上下文信息,增大感受野。
具体地,本实施例中,遥感影像经过编码器网络进行特征提取后,将其作为输入,送入深度为4的特征金字塔模块。不同深度的特征是基于输入的特征通过不同的池化操作得到的。在本实施例中,池化后获得的特征尺寸分别为1*1、2*2、3*3、6*6。之后在通过1*1的卷积层将特征维度缩减为原来的1/4,最后经过上采样,得到与输入特征相同的尺寸后,进行浅层特征和深层特征的融合。
本实施例对U-Net网络做的第三个改进就是将U-Net网络中的逐像素的交叉熵损失函数替换为在BasNet中提出的混合损失函数;其中,该混合损失函数包括交叉熵损失BCE、结构相似性损失SSIM、IOU损失,分别从pixel-level、patch-level、map-level三个不同层级关注显著信息。
进一步地,为了更好的理解上述混合损失函数,对其进行详细说明:
二值交叉熵损失函数:BCE Loss是二分类和分割任务中,最常用的损失函数,该损失函数又称为逐像素交叉熵损失。该损失函数分别评估每个像素点的预测值,将预测值与该像素点的标签值进行比较,然后对所有像素点的比较结果求平均。
结构相似损失:SSIM Loss是在被用于图像质量评价时提出的,可以捕捉图片的结构信息,是一个区块级的测度,考虑每个像素点的局部临近区域。
交并比损失:IOU Loss在提出时被用来衡量2个集合的相似性,后来被用作目标检测和分割的评估标准指标,是一个特征图级别的测度。
具体地,在本实施例中,训练的loss是各个侧边loss输出的加权和,每个侧边输出loss都是一个混合损失函数,即将上述三种损失函数融合,利用BCE Loss来进行pixel_level级别地监督,平滑所有像素,将其进行收敛;利用SSIM Loss来考虑每个像素的局部领域,对边界有更高的权重,使其有助于优化专注于边界;IOU Loss则是map_level级别的监督,给予前景更多的注意力,从而引导网络在像素级、patch级和map级三个层次上学习输入图像与地面真实值之间地转换,总的loss等于每层loss的加权和,公式如下:
每层的loss又由三部分loss组成,公式如下:
进一步地,如图5所示,在本实施例中,改进的U-Net网络结构主要分为三部分:编码器、金字塔、解码器。为了适应航空正射影像和高分二号影像建筑物提取的特性,在编码器和解码器之间,构建深度为4的金字塔,通过全局池化操作和特征融合引入更多的上下文信息,增大感受野。
当输入一张遥感影像时,首先通过残差网络ResNet34对其进行基础的特征提取,这个过程一共经历4个下采样,获取较高级别的特征映射;然后以残差网络输出的特征映射为输入构建深度为4的特征金字塔,通过全局池化和特征融合获取更多的上下文信息,作为原始图像的更高级的特征映射,这个过程没有改变特征映射的分辨率;最后通过解码器对特征映射进行4次上采样操作逐步恢复至原始图像分辨率;在每次上采样过程中,每个编码器的输入连接到对应解码器输出上,恢复下采样带来的空间信息丢失,同时可以减少解码器的参数,使网络执行的更高效;并且将每个decoder-stage作为3*3卷积的输入,后面跟着一个双线性上采样以及一个sigmoid函数来获取每层特征图的侧边输出。
具体地,上述遥感影像建筑物检测模型的训练过程如下:
按照上述步骤训练改进的U-Net网络,反复循环,直至损失不在收敛,得到最佳训练权重。
进一步地,本实施例基于改进的U-Net网络对航空正射影像和高分二号影像进行训练所得到的建筑物检测模型对测试数据集进行检测,具体过程如下:
进一步地,为更好的理解上述评估方式,对其进行详细说明:
精确率(Precision):被准确分类为正类的样本数与所有被分类为正类的样本数之比,意味着预测结果是正类的样本里具体有多少个样本真的是正类;
召回率(Recall):被分为正类的样本数与测试数据集中的实际正类的样本数之比,意味着应该被分为正类的样本中会有多少是被正确分类出来;
F1分数(f1-score):精确率和召回率这两个指标是一对矛盾体,无法做到双高。如果想要找到二者间的一个平衡点,就需要一个新的指标:F1分数。F1分数同时考虑了查准率和查全率,让二者同时达到最高,取一个平衡;
平均交并比(mIou):交并比是指实际类别样本和预测类别样本的交集和并集之比,即分类准确的正类样本数和分类准确的正类样本数与被错分类为负类的正类样本数以及被错分类为正类的负类之和的比值。平均交并比是对每一类交并比求和平均的结果;
频权交并比(FWIou):根据每一类出现的频率设置权重,权重乘以每一类的IoU并进行求和。
具体地,本实施例中,对建筑物检测模型进行有效性评估和验证的流程为:
构建建筑物检测模型的混淆矩阵:
混淆矩阵以矩阵的形式分别将航空正射影像和高分二号影像数据集中按照真实的类别与建筑物检测模型预测的类别进行汇总,其中,矩阵的行表示真实值,矩阵的列表示预测值,建筑物检测模型混淆矩阵形式如表1所示:
表1基于语义分割网络的遥感建筑物检测模型的混淆矩阵
表1中,TP(True Positive):表示将影像中正确预测为建筑物的数量;FN(FalseNegative):表示将影像中建筑物错误预测为非建筑物的数量;FP(False Positive):表示将影像中非建筑物错误预测为建筑物的数量;TN(True Negative,):表示将影像中非建筑物正确预测为非建筑物的数量。
进一步地,根据构建的建筑物检测模型的混淆矩阵,计算改进的U-Net网络模型地评价指标,具体包括:
①
②
③
④
⑤
按照上述评价指标分别将航空正射影像和高分二号影像的建筑物检测结果进行评估验证,验证结果分别如表2所示。
表2影像检测的验证评估结果
评价指标名称 | 航空正射影像数据集 | 高分2号影像数据集 |
Precision | 0.94 | 0.93 |
Recall | 0.96 | 0.97 |
f1-score | 0.957 | 0.956 |
mIou | 0.85 | 0.76 |
FWIou | 0.88 | 0.86 |
在上述表2中,本实例中所得到的Precision、f1-score、Recall、mIou、FWIou五种评价指标结果显示,均证明了无论对于航空正射影像还是高分二号影像,此改进的U-Net网络对于影像的建筑物检测都取得了比较好的分割效果,说明针对遥感影像建筑物检测专门设计的网络结构是有效的。从表2还可以看出航空正射影像的检测结果更好,原因可能如下:
①航空正射影像的分辨率更高,获取的特征更清晰;
②航空正射影像的标签更丰富。
综上,本实施例提供的遥感建筑物检测方法是一种在遥感影像自身复杂性、多样性以及不确定性的条件下,对复杂的地物信息建筑物进行检测的方法。本实施例的方法可以实现在遥感影像自身复杂性、多样性以及不确定性的条件下,对复杂的地物信息建筑物进行检测,并可以有效提高最终的检测精度。
第二实施例
本实施例提供了一种基于语义分割网络的遥感建筑物检测系统,该基于语义分割网络的遥感建筑物检测系统的结构如图6所示,包括以下模块:
数据集构建模块,用于获取包含建筑物的遥感影像,构建遥感影像数据集;
建筑物检测模型构建模块,用于对U-Net网络按照预设方式进行改进,得到建筑物检测模型;
模型训练模块,用于基于所述数据集构建模块所构建的遥感影像数据集,对所述建筑物检测模型构建模块所构建的建筑物检测模型进行训练;
建筑物检测模块,用于利用经所述模型训练模块训练好的建筑物检测模型,对待检测的遥感影像中的建筑物进行检测。
进一步地,所述系统还包括评估验证模块,用于:
采用预设的评估方式对所述建筑物检测模型进行有效性评估和验证;其中,所述预设的评估方式为精确率评估方式、F1分数评估方式、召回率评估方式、平均交并比评估方式和频权交并比评估方式中的任意一种或多种的组合。
本实施例的基于语义分割网络的遥感建筑物检测系统与上述第一实施例的基于语义分割网络的遥感建筑物检测方法相对应;其中,本实施例的基于语义分割网络的遥感建筑物检测系统中的各功能模块所实现的功能与上述基于语义分割网络的遥感建筑物检测方法中的各流程步骤一一对应;故,在此不再赘述。
第三实施例
本实施例提供一种电子设备,其包括处理器和存储器;其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行,以实现第一实施例的方法。
该电子设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)和一个或一个以上的存储器,其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行上述方法。
第四实施例
本实施例提供一种计算机可读存储介质,该存储介质中存储有至少一条指令,所述指令由处理器加载并执行,以实现上述第一实施例的方法。其中,该计算机可读存储介质可以是ROM、随机存取存储器、CD-ROM、磁带、软盘和光数据存储设备等。其内存储的指令可由终端中的处理器加载并执行上述方法
此外,需要说明的是,本发明可提供为方法、装置或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
最后需要说明的是,以上所述是本发明优选实施方式,应当指出,尽管已描述了本发明优选实施例,但对于本技术领域的技术人员来说,一旦得知了本发明的基本创造性概念,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
Claims (7)
1.一种基于语义分割网络的遥感建筑物检测方法,其特征在于,包括:
获取包含建筑物的遥感影像,构建遥感影像数据集;
对U-Net网络按照预设方式进行改进,得到建筑物检测模型;
基于所述遥感影像数据集,对所述建筑物检测模型进行训练;
利用训练好的建筑物检测模型,对待检测的遥感影像中的建筑物进行检测;
所述对U-Net网络按照预设方式进行改进,包括:
采用迁移学习的方法,将U-Net网络中的编码器结构替换为在ImageNet数据集上预训练的ResNet残差网络作为特征提取网络;
所述对U-Net网络按照预设方式进行改进,还包括:
在U-Net网络中构建深度为4的特征金字塔;遥感影像经过编码器网络进行特征提取后,将其作为输入,送入深度为4的特征金字塔;
所述对U-Net网络按照预设方式进行改进,还包括:
将U-Net网络中的逐像素的交叉熵损失函数替换为在BasNet中提出的混合损失函数;所述混合损失函数包括交叉熵损失BCE、结构相似性损失SSIM和IOU损失,分别从pixel-level、patch-level、map-level三个不同层级关注显著信息。
2.如权利要求1所述的基于语义分割网络的遥感建筑物检测方法,其特征在于,在对待检测的遥感影像中的建筑物进行检测之后,所述方法还包括:
采用预设的评估方式对所述建筑物检测模型进行有效性评估和验证;其中,所述预设的评估方式为精确率评估方式、F1分数评估方式、召回率评估方式、平均交并比评估方式和频权交并比评估方式中的任意一种或多种的组合。
3.如权利要求1所述的基于语义分割网络的遥感建筑物检测方法,其特征在于,所述获取包含建筑物的遥感影像,构建遥感影像数据集,包括:
获取第一预设区域的全区高分辨率航空正射影像和第二预设区域的高分二号影像;其中,所述高分二号影像为由分辨率为1m的高分2号卫星拍摄的影像;
使用ArcGis中的栅格工具,对所述高分辨率航空正射影像进行裁剪处理,将所述高分辨率航空正射影像切割为大小分别为1024*1024的多张影像图,并选取切割后所得到的影像图中的一部分进行建筑物标注处理,以制作航空数据集;使用ArcGis中的栅格工具对所述高分二号影像进行裁剪,将所述高分二号影像切割为大小分别为1024*1024的多张影像图,并选取切割后所得到的影像图中的一部分进行建筑物标注处理,以制作高分数据集;
将所述航空数据集划分为第一训练集和第一测试集;将所述高分数据集划分为第二训练集和第二测试集;并对所述第一训练集和第二训练集中的数据进行数据预处理;其中,所述数据预处理包括数据增强和引入扩展的数据集;预处理后的第一训练集和预处理后的第二训练集用于对所述建筑物检测模型进行训练,所述第一测试集和所述第二测试集用于对所述建筑物检测模型进行测试。
4.如权利要求3所述的基于语义分割网络的遥感建筑物检测方法,其特征在于,所述数据增强为随机翻转、明暗度调节和仿射变换中的一种或多种的组合。
5.如权利要求3所述的基于语义分割网络的遥感建筑物检测方法,其特征在于,所述扩展的数据集为Inria Aerial Image Dataset。
6.一种基于语义分割网络的遥感建筑物检测系统,其特征在于,包括:
数据集构建模块,用于获取包含建筑物的遥感影像,构建遥感影像数据集;
建筑物检测模型构建模块,用于对U-Net网络按照预设方式进行改进,得到建筑物检测模型;
模型训练模块,用于基于所述数据集构建模块所构建的遥感影像数据集,对所述建筑物检测模型构建模块所构建的建筑物检测模型进行训练;
建筑物检测模块,用于利用经所述模型训练模块训练好的建筑物检测模型,对待检测的遥感影像中的建筑物进行检测;
所述对U-Net网络按照预设方式进行改进,包括:
采用迁移学习的方法,将U-Net网络中的编码器结构替换为在ImageNet数据集上预训练的ResNet残差网络作为特征提取网络;
所述对U-Net网络按照预设方式进行改进,还包括:
在U-Net网络中构建深度为4的特征金字塔;遥感影像经过编码器网络进行特征提取后,将其作为输入,送入深度为4的特征金字塔;
所述对U-Net网络按照预设方式进行改进,还包括:
将U-Net网络中的逐像素的交叉熵损失函数替换为在BasNet中提出的混合损失函数;所述混合损失函数包括交叉熵损失BCE、结构相似性损失SSIM和IOU损失,分别从pixel-level、patch-level、map-level三个不同层级关注显著信息。
7.如权利要求6所述的基于语义分割网络的遥感建筑物检测系统,其特征在于,所述系统还包括评估验证模块,用于:
采用预设的评估方式对所述建筑物检测模型进行有效性评估和验证;其中,所述预设的评估方式为精确率评估方式、F1分数评估方式、召回率评估方式、平均交并比评估方式和频权交并比评估方式中的任意一种或多种的组合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110876041.7A CN113628180B (zh) | 2021-07-30 | 2021-07-30 | 一种基于语义分割网络的遥感建筑物检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110876041.7A CN113628180B (zh) | 2021-07-30 | 2021-07-30 | 一种基于语义分割网络的遥感建筑物检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113628180A CN113628180A (zh) | 2021-11-09 |
CN113628180B true CN113628180B (zh) | 2023-10-27 |
Family
ID=78381990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110876041.7A Active CN113628180B (zh) | 2021-07-30 | 2021-07-30 | 一种基于语义分割网络的遥感建筑物检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113628180B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116030347B (zh) * | 2023-01-06 | 2024-01-26 | 山东建筑大学 | 一种基于注意力网络的高分辨率遥感影像建筑物提取方法 |
CN117237648B (zh) * | 2023-11-16 | 2024-02-23 | 中国农业科学院农业资源与农业区划研究所 | 基于上下文感知的语义分割模型的训练方法、装置和设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583425A (zh) * | 2018-12-21 | 2019-04-05 | 西安电子科技大学 | 一种基于深度学习的遥感图像船只集成识别方法 |
CN110889449A (zh) * | 2019-11-27 | 2020-03-17 | 中国人民解放军国防科技大学 | 一种增强边缘的、多尺度的遥感影像建筑物语义特征提取方法 |
CN111047551A (zh) * | 2019-11-06 | 2020-04-21 | 北京科技大学 | 一种基于U-net改进算法的遥感影像变化检测方法及系统 |
CN111968088A (zh) * | 2020-08-14 | 2020-11-20 | 西安电子科技大学 | 一种基于像素和区域分割决策融合的建筑物检测方法 |
CN113033567A (zh) * | 2021-03-22 | 2021-06-25 | 安阳师范学院 | 一种融合分割网络和生成网络的甲骨拓片图像字符提取方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11164067B2 (en) * | 2018-08-29 | 2021-11-02 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems, methods, and apparatuses for implementing a multi-resolution neural network for use with imaging intensive applications including medical imaging |
-
2021
- 2021-07-30 CN CN202110876041.7A patent/CN113628180B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583425A (zh) * | 2018-12-21 | 2019-04-05 | 西安电子科技大学 | 一种基于深度学习的遥感图像船只集成识别方法 |
CN111047551A (zh) * | 2019-11-06 | 2020-04-21 | 北京科技大学 | 一种基于U-net改进算法的遥感影像变化检测方法及系统 |
CN110889449A (zh) * | 2019-11-27 | 2020-03-17 | 中国人民解放军国防科技大学 | 一种增强边缘的、多尺度的遥感影像建筑物语义特征提取方法 |
CN111968088A (zh) * | 2020-08-14 | 2020-11-20 | 西安电子科技大学 | 一种基于像素和区域分割决策融合的建筑物检测方法 |
CN113033567A (zh) * | 2021-03-22 | 2021-06-25 | 安阳师范学院 | 一种融合分割网络和生成网络的甲骨拓片图像字符提取方法 |
Non-Patent Citations (2)
Title |
---|
Pyramid U-Net for Retinal Vessel Segmentation;Qiao Zhang等;《International Conference on Neural Information Processing》;364–372 * |
遥感影像地裂缝检测技术;黄涛等;《信息记录材料》;第24卷(第1期);238-240 * |
Also Published As
Publication number | Publication date |
---|---|
CN113628180A (zh) | 2021-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113160234B (zh) | 基于超分辨率和域自适应的无监督遥感图像语义分割方法 | |
CN110889449A (zh) | 一种增强边缘的、多尺度的遥感影像建筑物语义特征提取方法 | |
CN113628180B (zh) | 一种基于语义分割网络的遥感建筑物检测方法及系统 | |
CN111369581A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN112927253B (zh) | 基于卷积神经网络的岩心fib-sem图像分割方法 | |
CN112508079B (zh) | 海洋锋面的精细化识别方法、系统、设备、终端及应用 | |
CN110334719B (zh) | 一种提取遥感影像中建筑物图像的方法及系统 | |
Du et al. | Segmentation and sampling method for complex polyline generalization based on a generative adversarial network | |
CN111598101A (zh) | 基于遥感影像场景分割的城区智能提取方法、系统及设备 | |
CN112950780B (zh) | 一种基于遥感影像的网络地图智能生成方法及系统 | |
CN114694038A (zh) | 基于深度学习的高分辨率遥感影像分类方法及系统 | |
CN111738113A (zh) | 基于双注意力机制与语义约束的高分辨遥感图像的道路提取方法 | |
CN116994140A (zh) | 基于遥感影像的耕地提取方法、装置、设备和介质 | |
CN112800955A (zh) | 基于加权双向特征金字塔的遥感影像旋转目标检测方法及系统 | |
CN114943888B (zh) | 基于多尺度信息融合的海面小目标检测方法 | |
CN116645592A (zh) | 一种基于图像处理的裂缝检测方法和存储介质 | |
CN116958827A (zh) | 一种基于深度学习的撂荒区域提取方法 | |
CN114926826A (zh) | 场景文本检测系统 | |
CN113378642B (zh) | 一种对农村违法占地建筑物进行检测的方法 | |
CN116719031B (zh) | 一种合成孔径雷达sar图像的海洋涡旋检测方法及系统 | |
CN110633633A (zh) | 一种基于自适应阈值的遥感影像道路提取方法 | |
CN116129191B (zh) | 基于遥感ai的多目标智能识别与精细分类方法 | |
CN110174714B (zh) | 基于机器学习的街道空间日照时数批量化测量方法及系统 | |
CN114445726B (zh) | 一种基于深度学习的样本库建立方法和装置 | |
CN113971764B (zh) | 一种基于改进YOLOv3的遥感图像小目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |