CN117787813B - 基于细粒度特征约束的城中村识别方法、装置及电子设备 - Google Patents
基于细粒度特征约束的城中村识别方法、装置及电子设备 Download PDFInfo
- Publication number
- CN117787813B CN117787813B CN202410199413.0A CN202410199413A CN117787813B CN 117787813 B CN117787813 B CN 117787813B CN 202410199413 A CN202410199413 A CN 202410199413A CN 117787813 B CN117787813 B CN 117787813B
- Authority
- CN
- China
- Prior art keywords
- village
- building
- data
- urban
- sample data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 55
- 238000000605 extraction Methods 0.000 claims abstract description 51
- 238000007637 random forest analysis Methods 0.000 claims abstract description 34
- 238000013145 classification model Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 238000004458 analytical method Methods 0.000 claims description 34
- 230000011218 segmentation Effects 0.000 claims description 34
- 238000012360 testing method Methods 0.000 claims description 25
- 238000004891 communication Methods 0.000 claims description 16
- 238000000638 solvent extraction Methods 0.000 claims description 14
- 230000000877 morphologic effect Effects 0.000 claims description 12
- 230000003595 spectral effect Effects 0.000 claims description 12
- 238000001228 spectrum Methods 0.000 claims description 11
- 238000003066 decision tree Methods 0.000 claims description 8
- 238000003709 image segmentation Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000007689 inspection Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 210000001367 artery Anatomy 0.000 claims description 4
- 238000011160 research Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 230000000452 restraining effect Effects 0.000 claims description 3
- 238000011022 operating instruction Methods 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 abstract description 6
- 238000012937 correction Methods 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000002349 favourable effect Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/60—Planning or developing urban green infrastructure
Landscapes
- Image Analysis (AREA)
Abstract
本发明属于遥感技术领域,涉及基于细粒度特征约束的城中村识别方法、装置及电子设备。该方法包括收集样本数据,对样本数据进行预处理;对训练样本数据进行特征提取,得到建筑物特征信息,计算Building‑Green指标,使用随机森林分类模型对样本数据提取的指标训练得到分类模型;将超像素单元识别为城中村;在滑动窗口内提取精细特征;将精细特征横向拼接;通过超像素块对精细特征提取结果进行约束;根据超像素单元内城中村像素总数的占比,得到目标城中村。本发明能够实现准确的城中村识别;本发明根据Building‑Green指标,通过建筑物的空间特征,为各社区整改优先级提供参考,利于城市管理。
Description
技术领域
本发明属于遥感技术领域,具体而言,涉及一种基于建筑物Building-Green指标特征和细粒度特征约束的多层次框架的城中村识别方法、装置及电子设备。
背景技术
随着城市规模不断扩张,形成一种城市包围农村、城乡混杂的二元城市景观和空间结构,这种空间结构被称为城中村。城中村具有景观多样性,包括住宅小区、密集村庄、小型工业以及商业建筑等功能区。然而,城中村的结构和人员相对复杂,这种复杂性导致了社区管理混乱和人员流动性大,因此,及时高效掌握城中村的精细数据,有利于城中村规划和城市协调发展。
目前遥感影像城中村识别方法主要有以下三类:第一类通过提取光谱、纹理特征等底层特征来识别城中村,然而,城市场景具有复杂的空间信息和光谱特征,底层特征不足以表征城中村地块,且识别精度较低;第二类基于对象影像分析(object-based imageanalysis,简称OBIA)的识别方法,充分利用城中村对象的空间形态多样性,捕获更为明显和完整的城中村上下文信息,有利于之后的分类,但基于对象的方法往往包含着冗余的上下文信息,无法适应更加细致的城中村提取需求;第三类深度学习的方法,深度学习可以将将训练好的全卷积网络(FCN)从一个数据集传输到另一个数据集,但城中村在影像上表现为弱特征响应,因此其周围建筑对于人工识别造成干扰,划分标签时间成本高,同时,不同地区城中村的规模和外形差异很大,导致在训练模型时比较耗时,且模型可迁移性差。因此,为适应大数据识别效率要求,亟需研究一种大范围城中村精细识别和更新的方法。
发明内容
为了解决上述技术问题,本发明提供基于细粒度特征约束的城中村识别方法,包括:
收集样本数据,构建数据库;样本数据包括遥感数据、道路数据、建成区数据与NDVI专题数据;
对样本数据进行预处理,包括道路数据简化、遥感数据分区、构建基本分析单元,NDVI数据阈值分割;
选择训练样本数据和测试样本数据,将训练样本数据分为城中村与非城中村样本,利用训练样本数据生成城中村识别的随机森林分类模型,利用测试样本数据验证模型的识别城中村的准确率,通过多次训练测试筛选出拟合最好的随机森林分类模型;
对训练样本数据进行特征提取,得到建筑物特征信息,计算Building-Green指标,使用随机森林分类模型对样本数据提取的指标训练得到分类模型;
根据Building-Green指标,在滑动窗口内提取细粒度特征,分类得到城中村像元,将超像素单元内城中村像元大于等于设定值的超像素单元识别为城中村;
根据分类模型提取结果,对城中村样本细分剔除样本数据中非城中村像元,在滑动窗口内提取精细特征,包括建筑物的光谱特征、纹理特征与结构特征;
将精细特征横向拼接,使用随机森林分类器进行特征分类后将结果赋给窗口像素;
对基本分析单元影像进行超像素分割,通过超像素块对精细特征提取结果进行约束,根据超像素块的像素个数与识别为城中村的像素数,计算超像素块内城中村像元总数;
根据超像素单元内城中村像素总数的占比,得到目标城中村。
第二方面,本发明提供了基于建筑物细粒度特征约束的城中村识别装置包括收集单元、预处理单元、选择单元、建筑物特征信息提取单元、识别单元、精细特征提取单元、分类单元、约束识别单元与输出单元;
收集单元,用于收集样本数据,构建数据库;样本数据包括遥感数据、道路数据、建成区数据与NDVI专题数据;
预处理单元,用于对样本数据进行预处理,包括道路数据简化、遥感数据分区、构建基本分析单元,NDVI数据阈值分割;
选择单元,用于选择训练样本数据和测试样本数据,将训练样本数据分为城中村与非城中村样本,利用训练样本数据生成城中村识别的随机森林分类模型,利用测试样本数据验证模型的识别城中村的准确率,通过多次训练测试筛选出拟合最好的随机森林分类模型;
建筑物特征信息提取单元,用于对训练样本数据进行特征提取,得到建筑物特征信息,计算Building-Green指标,使用随机森林分类模型对样本数据提取的指标训练得到分类模型;
识别单元,用于根据Building-Green指标,在滑动窗口内提取细粒度特征,分类得到城中村像元,将超像素单元内城中村像元大于等于设定值的超像素单元识别为城中村;
精细特征提取单元,用于根据分类模型提取结果,对城中村样本细分剔除样本数据中非城中村像元,在滑动窗口内提取精细特征,包括建筑物的光谱特征、纹理特征与结构特征;
分类单元,用于将精细特征横向拼接,使用随机森林分类器进行特征分类后将结果赋给窗口像素;
约束识别单元,用于对基本分析单元影像进行超像素分割,通过超像素块对精细特征提取结果进行约束,根据超像素块的像素个数与识别为城中村的像素数,计算超像素块内城中村像元总数;
输出单元,用于根据超像素单元内城中村像素总数的占比,得到目标城中村。
第三方面,本发明提供了一种电子设备,包括:
处理器和存储器;
所述存储器,用于存储计算机操作指令;
所述处理器,用于通过调用所述计算机操作指令,执行基于细粒度特征约束的城中村识别方法。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,遥感数据为RGB三波段数据;道路数据为开放街道地图中交通干道数据;建成区数据为与NDVI专题数据来自遥感图像数据平台;
道路数据简化包括在ArcGIS系统中建立道路数据缓冲区,然后利用自动捕捉工具提取中心线,整理补充矢量结果,最后进行拓扑检查,将重叠、空隙拓扑错误修正;
遥感数据分区包括将建成区数据与城市网格数据叠加分析得到建筑密度数据,以建筑密度级别最高的区域为核心区对城中村进行分区;
构建基本分析单元包括使用ecognition9.0平台,以OSM为辅助数据,多尺度分割得到基本分析单元;
NDVI数据阈值分割包括利用OTSU算法进行图像分割得到图像分割结果。
进一步,选择训练样本数据和测试样本数据,训练样本数据分为城中村样本数据和非城中村样本数据,两阶段样本选择包括:第一阶段在不同分区选择基本分析单元城中村和非城中村样本,采用随机采样选择样本,将在基本分析单元中城中村面积占比90%以上的样本选为城中村样本,不包含城中村的样本为非城中村样本;训练和测试样本比为7:3;第二阶基于第一阶段识别结果选择样本,以像元为单位选择样本像元,城中村区域的像元为城中村样本,非城中村区域的像元为非城中村样本。
进一步,对训练样本数据进行特征提取,计算Building-Green指标,使用随机森林分类器对样本数据提取的指标训练得到分类模型,包括:
计算建筑物形态学指数,提取光谱空间信息;
根据光谱空间信息得到建筑强度信息,阈值分割得到建筑物特征信息;
计算Building-Green指标的各个建筑物特征信息;
构建决策树,使用随机森林分类器拟合多个决策树的元估计器数据集的各种子样本上的分类器,并使用平均值计算拟合度。
进一步,Building-Green指标包括住区特征信息、颜色特征信息、纹理特征信息与专题特征信息;
住区特征由建筑物形态学指数提取结果计算得出,包括单位面积建筑物数量、单位面积建筑面积之和、单位面积内建筑物面积的平均值、建筑物面积和最小外接矩形比的平均值、建筑物到最近建筑距离的平均值以及建筑物最小外接矩形的平均长宽比;
颜色特征为RGB每个波段的均值和标准差;
纹理特征采用灰度共生矩阵的对比度、不相似度、均匀性、能量、相关性五个统计量;
专题特征为基本研究单元中NDVI阈值分割后像元值为1的像元数量。
进一步,设为连通区域总数,/>为单位面积,/>为第/>个连通区域的面积,/>为第/>个连通区域最小外接矩形面积,/>为第/>个连通区域到最近联通区的距离,/>为第个连通区域最小外接矩形的长;/>为第/>个连通区域最小外接矩形的宽,/>为单位面积建筑物数量,/>为单位面积建筑面积之和,/>为单位面积内建筑物面积的平均值,为建筑物面积和最小外接矩形比的平均值,/>为建筑物到最近建筑距离的平均值,为建筑物最小外接矩形的平均长宽比,则:
;
;
;
;
;
;
。
进一步,在滑动窗口内提取建筑物的光谱特征、纹理特征与结构特征时,结构特征采用密集格网尺度不变特征转换,通过设置滑动窗口与步长大小,逐步长的扫描全图,在每个滑动窗口区域内进行局部SIFT特征提取,提取灰度共生矩阵若干个统计量的各个方向,对窗口内RGB值求均值与标准差,将三组特征横向拼接,使用随机森林分类器进行特征分类后将结果赋给窗口像素。
本发明的有益效果是:本发明提出一种城中村精细提取方法,能够实现准确的城中村识别,有助于管理者快速掌握大区域内城中村数据,为城市土地高质量应用,优化城市土地资源配置提供了有利依据;本发明将社区建筑群特点与社区植被覆盖特征提取出来组成Building-Green指标,通过空间特征,为各社区整改优先级提供参考,利于城市管理。
附图说明
图1为本发明实施例1提供的基于细粒度特征约束的城中村识别方法的原理图;
图2为本发明实施例2提供的基于建筑物细粒度特征约束的城中村识别装置的原理图;
图3为本发明实施例3提供的一种电子设备的原理图。
图标:30-电子设备;310-处理器;320-总线;330-存储器;340-收发器。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
实施例1
作为一个实施例,如附图1所示,为解决上述技术问题,本实施例提供基于细粒度特征约束的城中村识别方法,包括:
收集样本数据,构建数据库;样本数据包括遥感数据、道路数据、建成区数据与NDVI专题数据;
对样本数据进行预处理,包括道路数据简化、遥感数据分区、构建基本分析单元,NDVI数据阈值分割;
选择训练样本数据和测试样本数据,将训练样本数据分为城中村与非城中村样本,利用训练样本数据生成城中村识别的随机森林分类模型,利用测试样本数据验证模型的识别城中村的准确率,通过多次训练测试筛选出拟合最好的随机森林分类模型;
对训练样本数据进行特征提取,得到建筑物特征信息,计算Building-Green指标,使用随机森林分类模型对样本数据提取的指标训练得到分类模型;
根据Building-Green指标,在滑动窗口内提取细粒度特征,分类得到城中村像元,将超像素单元内城中村像元大于等于设定值的超像素单元识别为城中村;
根据分类模型提取结果,对城中村样本细分剔除样本数据中非城中村像元,在滑动窗口内提取精细特征,包括建筑物的光谱特征、纹理特征与结构特征;
将精细特征横向拼接,使用随机森林分类器进行特征分类后将结果赋给窗口像素;
对基本分析单元影像进行超像素分割,通过超像素块对精细特征提取结果进行约束,根据超像素块的像素个数与识别为城中村的像素数,计算超像素块内城中村像元总数;
根据超像素单元内城中村像素总数的占比,得到目标城中村。
可选的,遥感数据为RGB三波段数据;道路数据为开放街道地图中交通干道数据;建成区数据为与NDVI专题数据来自遥感图像数据平台;
道路数据简化包括在ArcGIS系统中建立道路数据缓冲区,然后利用自动捕捉工具提取中心线,整理补充矢量结果,最后进行拓扑检查,将重叠、空隙拓扑错误修正;
遥感数据分区包括将建成区数据与城市网格数据叠加分析得到建筑密度数据,以建筑密度级别最高的区域为核心区对城中村进行分区;
构建基本分析单元包括使用ecognition9.0平台,以OSM为辅助数据,多尺度分割得到基本分析单元;
NDVI数据阈值分割包括利用OTSU算法进行图像分割得到图像分割结果。
在实际应用过程中,卫星遥感影像为16级谷歌地球卫星影像数据,波段为RGB三波段,空间分辨率为2m;道路数据为OSM(Open Street Map,开源路网地图)中主道路数据,建成区数据为2020年建成区数据,NDVI数据来自GEE(Google Earth Engine,全球地理空间数据)平台, Landsat系列卫星数据,去除云和云阴影得到10m分辨率的NDVI结果。
在对数据进行预处理过程中,道路简化在ArcGIS(Arc Geographic InformationSystem,地理信息系统)中计算,首先建立道路数据5m缓冲区,然后利用自动捕捉工具提取中心线,整理补充矢量结果,最后进行拓扑检查,将重叠、空隙拓扑错误修正;遥感述分区在ArcGIS中计算,将建成区数据与深圳网格数据叠加计算每个格网的建成区密度数据,按照建筑密度分级,以建筑密度级别最高的区域为核心区对城中村进行分区,然后将建筑密度不为0的格网与原始影像做交集处理,剔除掉不包含的建成区的格网;构建基本分析单元使用影像分析软件如ecognition9.0平台,以OSM为辅助数据,多尺度分割得到,结合参照规模参数ESP工具计算的最佳分割参数,将分割尺度设为100,颜色/形状权重为0.8,平滑度/紧凑度权重为0.5;NDVI数据阈值分割OTSU算法的实现,大于阈值的像素值设为1,小于阈值的像素值设为0。
可选的,选择训练样本数据和测试样本数据,训练样本数据分为城中村样本数据和非城中村样本数据,两阶段样本选择包括:第一阶段在不同分区选择基本分析单元城中村和非城中村样本,采用随机采样选择样本,将在基本分析单元中城中村面积占比90%以上的样本选为城中村样本,不包含城中村的样本为非城中村样本;训练和测试样本比为7:3;第二阶基于第一阶段识别结果选择样本,以像元为单位选择样本像元,城中村区域的像元为城中村样本,非城中村区域的像元为非城中村样本。
在实际应用过程中,第一阶段在不同分区选择基本分析单元城中村和非城中村样本,采用人工随机采样选择样本,城中村样本为基本分析单元中城中村面积占比90%的部分,训练和测试样本比为7:3。第二阶段样本在第一阶段识别为城中村的基本分析单元中选择,以像元为单位选择城中村样本和非城中村样本。两阶段的样本数量如图3所示。
可选的,对训练样本数据进行特征提取,计算Building-Green指标,,使用随机森林分类器对样本数据提取的指标训练得到分类模型,包括:
计算建筑物形态学指数,提取光谱空间信息;
根据光谱空间信息得到建筑强度信息,阈值分割得到建筑物特征信息;
计算Building-Green指标的各个建筑物特征信息;
构建决策树,使用随机森林分类器拟合多个决策树的元估计器数据集的各种子样本上的分类器,并使用平均值计算拟合度,防止过度拟合。
在实际应用过程中,计算建筑物形态学指数(Morphological building index,简称MBI),通过利用形态学算子提取光谱空间信息,综合考虑到建筑物的形状、方向、亮度和对比度特征,实现建筑物特征信息提取。MBI基本思想是利用建筑物屋顶和建筑物边界阴影的辐射反差,结合光谱空间信息得到建筑强度信息,再根据形状特点剔除虚警,最后阈值分割得到建筑物信息。实例中在计算MBI时,结构元素大小最小值设置为3,结构元素大小最大值设置为50,颗粒测定的间隔设置为1,利用Otsu自动阈值,确定最佳阈值进行分割,提取建筑物。
可选的,Building-Green指标包括住区特征信息、颜色特征信息、纹理特征信息与专题特征信息;
住区特征由建筑物形态学指数提取结果计算得出,包括单位面积建筑物数量、单位面积建筑面积之和、单位面积内建筑物面积的平均值、建筑物面积和最小外接矩形比的平均值、建筑物到最近建筑距离的平均值以及建筑物最小外接矩形的平均长宽比;
颜色特征为RGB每个波段的均值和标准差;
纹理特征采用灰度共生矩阵的对比度、不相似度、均匀性、能量、相关性五个统计量;
专题特征为基本研究单元中NDVI阈值分割后像元值为1的像元数量。
可选的,设为连通区域总数,/>为单位面积,/>为第/>个连通区域的面积,/>为第/>个连通区域最小外接矩形面积,/>为第/>个连通区域到最近联通区的距离,/>为第/>个连通区域最小外接矩形的长;/>为第/>个连通区域最小外接矩形的宽,/>为单位面积建筑物数量,/>为单位面积建筑面积之和,/>为单位面积内建筑物面积的平均值,为建筑物面积和最小外接矩形比的平均值,/>为建筑物到最近建筑距离的平均值,为建筑物最小外接矩形的平均长宽比,则:
;
;
;
;
;
;
。
可选的,实验得到识别精度如表1,RF分类在B区域表现较差,总体精度为88.57%,其他区域均高于90%。整体分类精度为92.71%,Kappa系数为84.73。
表1 识别精度
可选的,在滑动窗口内提取建筑物的光谱特征、纹理特征与结构特征时,结构特征采用密集格网尺度不变特征转换,通过设置滑动窗口与步长大小,逐步长的扫描全图,在每个滑动窗口区域内进行局部SIFT密集格网尺度不变特征转换(Scale Invariant FeatureTransform,简称SIFT),特征提取,提取灰度共生矩阵若干个统计量的各个方向,对窗口内RGB值求均值与标准差,将三组特征横向拼接,使用随机森林分类器进行特征分类后将结果赋给窗口像素。
在实际应用过程中,在每个滑动窗口区域内进行局部SIFT特征提取时,假设有一个窗口i,窗口移动步长为/>。在窗口内提取一个SIFT特征,设SIFT特征为/>,/>为窗口i中第j个梯度特征,S=1,2,……128,/>,提取纹理特征、光谱特征与Building-Green指标对城中村做初步提取方法相同,提取GLCM五个统计量的四方向,设为窗口i的GLCM特征向量,/>为0度扫描的对比度统计量,/>为0度扫描的非相似性统计量,/>为颜色特征,/>为i窗口内红色波段的平均值,/>为i窗口内绿色波段的平均值,/>为i窗口内蓝色波段的平均值,/>为i窗口内红色波段的标准差,/>为i窗口内绿色波段的标准差,/>为i窗口内蓝色波段的标准差,,对窗口内RGB值求均值和标准差,将三组特征横向拼接构成1×154维特征,设该特征为/>,/>,用于特征分类,使用随机森林分类器对特征分类后将结果赋给窗口像素。
采用简单线性迭代聚类(simple linear iterative clustering,简称SLIC)超像素分割约束,对基本分析单元影像超像素分割,通过超像素块对精细特征提取结果进行约束,将超像素块Si的面积,即超像素中包含的像素个数记为A(Si),与识别为城中村的像素Ui作比较,超像素块内城中村像元总数为A(Si∩Ui),判断超像素单元是否为城中村单元,选择超像素单元内城中村像素的占比大于或等于设定比例如85%则视为城中村。
实验识别结果为生产者精度为90.15%,使用者精度为83.78%,整体分类精度为94.27%,Kappa系数为83.20%。
本发明提出一种城中村精细提取方法,能够实现准确的城中村识别,有助于管理者快速掌握大区域内城中村数据,为城市土地高质量应用,优化城市土地资源配置提供了有利依据;本发明将社区建筑群特点与社区植被覆盖特征提取出来组成Building-Green指标,通过空间特征,为各社区整改优先级提供参考,利于城市管理。
实施例2
基于与本发明的实施例1中所示的方法相同的原理,本发明的实施例中还提供了基于建筑物细粒度特征约束的城中村识别装置包括收集单元、预处理单元、选择单元、建筑物特征信息提取单元、识别单元、精细特征提取单元、分类单元、约束识别单元与输出单元;
收集单元,用于收集样本数据,构建数据库;样本数据包括遥感数据、道路数据、建成区数据与NDVI专题数据;
预处理单元,用于对样本数据进行预处理,包括道路数据简化、遥感数据分区、构建基本分析单元,NDVI数据阈值分割;
选择单元,用于选择训练样本数据和测试样本数据,利用训练样本数据选择基本分析单元的城中村样本数据和非城中村样本数据;
建筑物特征信息提取单元,用于对训练样本数据进行特征提取,得到建筑物特征信息,计算Building-Green指标,使用随机森林分类模型对样本数据提取的指标训练得到分类模型;
识别单元,用于根据Building-Green指标,在滑动窗口内提取细粒度特征,分类得到城中村像元,将超像素单元内城中村像元大于等于设定值的超像素单元识别为城中村;
精细特征提取单元,用于根据分类模型提取结果,对城中村样本细分剔除样本数据中非城中村像元,在滑动窗口内提取精细特征,包括建筑物的光谱特征、纹理特征与结构特征;
分类单元,用于将精细特征横向拼接,使用随机森林分类器进行特征分类后将结果赋给窗口像素;
约束识别单元,用于对基本分析单元影像进行超像素分割,通过超像素块对精细特征提取结果进行约束,根据超像素块的像素个数与识别为城中村的像素数,计算超像素块内城中村像元总数;
输出单元,用于根据超像素单元内城中村像素总数的占比,得到目标城中村。
可选的,遥感数据为RGB三波段数据;道路数据为开放街道地图中交通干道数据;建成区数据为与NDVI专题数据来自遥感图像数据平台;
道路数据简化包括在ArcGIS系统中建立道路数据缓冲区,然后利用自动捕捉工具提取中心线,整理补充矢量结果,最后进行拓扑检查,将重叠、空隙拓扑错误修正;
遥感数据分区包括将建成区数据与城市网格数据叠加分析得到建筑密度数据,以建筑密度级别最高的区域为核心区对城中村进行分区;
构建基本分析单元包括使用ecognition9.0平台,以OSM为辅助数据,多尺度分割得到基本分析单元;
NDVI数据阈值分割包括利用OTSU算法进行图像分割得到图像分割结果。
可选的,选择训练样本数据和测试样本数据,训练样本数据分为城中村样本数据和非城中村样本数据,两阶段样本选择包括:第一阶段在不同分区选择基本分析单元城中村和非城中村样本,采用随机采样选择样本,将在基本分析单元中城中村面积占比90%以上的样本选为城中村样本,不包含城中村的样本为非城中村样本;训练和测试样本比为7:3;第二阶基于第一阶段识别结果选择样本,以像元为单位选择样本像元,城中村区域的像元为城中村样本,非城中村区域的像元为非城中村样本。
可选的,对训练样本数据进行特征提取,计算Building-Green指标,包括:
计算建筑物形态学指数,提取光谱空间信息;
根据光谱空间信息得到建筑强度信息,阈值分割得到建筑物特征信息;
计算Building-Green指标的各个建筑物特征信息;
构建决策树,使用随机森林分类器拟合多个决策树的元估计器数据集的各种子样本上的分类器,并使用平均值计算拟合度。
可选的,Building-Green指标包括住区特征信息、颜色特征信息、纹理特征信息与专题特征信息;
住区特征由建筑物形态学指数提取结果计算得出,包括单位面积建筑物数量、单位面积建筑面积之和、单位面积内建筑物面积的平均值、建筑物面积和最小外接矩形比的平均值、建筑物到最近建筑距离的平均值以及建筑物最小外接矩形的平均长宽比;
颜色特征为RGB每个波段的均值和标准差;
纹理特征采用灰度共生矩阵的对比度、不相似度、均匀性、能量、相关性五个统计量;
专题特征为基本研究单元中NDVI阈值分割后像元值为1的像元数量。
可选的,设为连通区域总数,/>为单位面积,/>为第/>个连通区域的面积,/>为第/>个连通区域最小外接矩形面积,/>为第/>个连通区域到最近联通区的距离,/>为第/>个连通区域最小外接矩形的长;/>为第/>个连通区域最小外接矩形的宽,/>为单位面积建筑物数量,/>为单位面积建筑面积之和,/>为单位面积内建筑物面积的平均值,为建筑物面积和最小外接矩形比的平均值,/>为建筑物到最近建筑距离的平均值,为建筑物最小外接矩形的平均长宽比,则:
;
;
;
;
;
;
。
可选的,在滑动窗口内提取建筑物的光谱特征、纹理特征与结构特征时,结构特征采用密集格网尺度不变特征转换,通过设置滑动窗口与步长大小,逐步长的扫描全图,在每个滑动窗口区域内进行局部SIFT特征提取,提取灰度共生矩阵若干个统计量的各个方向,对窗口内RGB值求均值与标准差,将三组特征横向拼接,使用随机森林分类器进行特征分类后将结果赋给窗口像素。
实施例3
基于与本发明的实施例中所示的方法相同的原理,本发明的实施例中还提供了一种电子设备,如附图3所示,该电子设备可以包括但不限于:处理器和存储器;存储器,用于存储计算机程序;处理器,用于通过调用计算机程序执行本发明实施例所示的基于细粒度特征约束的城中村识别方法。
在一个可选实施例中提供了一种电子设备,图3所示的电子设备30包括:处理器310和存储器330。其中,处理器310和存储器330相连,如通过总线320相连。
可选地,电子设备30还可以包括收发器340,收发器340可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器340不限于一个,该电子设备30的结构并不构成对本发明实施例的限定。
处理器310可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器310也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线320可包括一通路,在上述组件之间传送信息。总线320可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线320可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器330可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器330用于存储执行本发明方案的应用程序代码(计算机程序),并由处理器310来控制执行。处理器310用于执行存储器330中存储的应用程序代码,以实现前述方法实施例所示的内容。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.基于细粒度特征约束的城中村识别方法,其特征在于,包括:
收集样本数据,构建数据库;样本数据包括遥感数据、道路数据、建成区数据与NDVI专题数据;
对样本数据进行预处理,包括道路数据简化、遥感数据分区、构建基本分析单元,NDVI数据阈值分割;
选择训练样本数据和测试样本数据,将训练样本数据分为城中村与非城中村样本,利用训练样本数据生成城中村识别的随机森林分类模型,利用测试样本数据验证模型的识别城中村的准确率,通过多次训练测试筛选出拟合最好的随机森林分类模型;
对训练样本数据进行特征提取,得到建筑物特征信息,计算Building-Green指标,使用随机森林分类模型对样本数据提取的指标训练得到分类模型;
根据Building-Green指标,在滑动窗口内提取细粒度特征,分类得到城中村像元,将超像素单元内城中村像元大于等于设定值的超像素单元识别为城中村;
根据分类模型提取结果,对城中村样本细分剔除样本数据中非城中村像元,在滑动窗口内提取精细特征,包括建筑物的光谱特征、纹理特征与结构特征;
将精细特征横向拼接,使用随机森林分类器进行特征分类后将结果赋给窗口像素;
对基本分析单元影像进行超像素分割,通过超像素块对精细特征提取结果进行约束,根据超像素块的像素个数与识别为城中村的像素数,计算超像素块内城中村像元总数;
根据超像素单元内城中村像素总数的占比,得到目标城中村。
2.根据权利要求1所述基于细粒度特征约束的城中村识别方法,其特征在于,遥感数据为RGB三波段数据;道路数据为开放街道地图中交通干道数据;建成区数据为与NDVI专题数据来自遥感图像数据平台;
道路数据简化包括在ArcGIS系统中建立道路数据缓冲区,然后利用自动捕捉工具提取中心线,整理补充矢量结果,最后进行拓扑检查,将重叠、空隙拓扑错误修正;
遥感数据分区包括将建成区数据与城市网格数据叠加分析得到建筑密度数据,以建筑密度级别最高的区域为核心区对城中村进行分区;
构建基本分析单元包括使用ecognition9.0平台,以OSM为辅助数据,多尺度分割得到基本分析单元;
NDVI数据阈值分割包括利用OTSU算法进行图像分割得到图像分割结果。
3.根据权利要求1所述基于细粒度特征约束的城中村识别方法,其特征在于,选择训练样本数据和测试样本数据,训练样本数据分为城中村样本数据和非城中村样本数据,两阶段样本选择包括:第一阶段在不同分区选择基本分析单元城中村和非城中村样本,采用随机采样选择样本,将在基本分析单元中城中村面积占比90%以上的样本选为城中村样本,不包含城中村的样本为非城中村样本;训练和测试样本数量比设置为7:3;第二阶基于第一阶段识别结果选择样本,以像元为单位选择样本像元,城中村区域的像元为城中村样本,非城中村区域的像元为非城中村样本。
4.根据权利要求1所述基于细粒度特征约束的城中村识别方法,其特征在于,对训练样本数据进行特征提取,计算Building-Green指标,包括:
计算建筑物形态学指数,提取光谱空间信息;
根据光谱空间信息得到建筑强度信息,阈值分割得到建筑物特征信息;
计算Building-Green指标的各个建筑物特征信息;
构建决策树,使用随机森林分类器拟合多个决策树的元估计器数据集的各种子样本上的分类器,并使用平均值计算拟合度。
5.根据权利要求4所述基于细粒度特征约束的城中村识别方法,其特征在于,Building-Green指标包括住区特征信息、颜色特征信息、纹理特征信息与专题特征信息;
住区特征由建筑物形态学指数提取结果计算得出,包括单位面积建筑物数量、单位面积建筑面积之和、单位面积内建筑物面积的平均值、建筑物面积和最小外接矩形比的平均值、建筑物到最近建筑距离的平均值以及建筑物最小外接矩形的平均长宽比;
颜色特征为RGB每个波段的均值和标准差;
纹理特征采用灰度共生矩阵的对比度、不相似度、均匀性、能量、相关性五个统计量;
专题特征为基本研究单元中NDVI阈值分割后像元值为1的像元数量。
6.根据权利要求1所述基于细粒度特征约束的城中村识别方法,其特征在于,设为连通区域总数,/>为单位面积,/>为第/>个连通区域的面积,/>为第/>个连通区域最小外接矩形面积,/>为第/>个连通区域到最近联通区的距离,/>为第/>个连通区域最小外接矩形的长;/>为第/>个连通区域最小外接矩形的宽,/>为单位面积建筑物数量,/>为单位面积建筑面积之和,/>为单位面积内建筑物面积的平均值,/>为建筑物面积和最小外接矩形比的平均值,/>为建筑物到最近建筑距离的平均值,/>为建筑物最小外接矩形的平均长宽比,则:
;
;
;
;
;
;
。
7.根据权利要求1所述基于细粒度特征约束的城中村识别方法,其特征在于,其特征在于,在滑动窗口内提取建筑物的光谱特征、纹理特征与结构特征时,结构特征采用密集格网尺度不变特征转换,通过设置滑动窗口与步长大小,逐步长的扫描全图,在每个滑动窗口区域内进行局部SIFT特征提取,提取灰度共生矩阵若干个统计量的各个方向,对窗口内RGB值求均值与标准差,将三组特征横向拼接,使用随机森林分类器进行特征分类后将结果赋给窗口像素。
8.基于建筑物细粒度特征约束的城中村识别装置,其特征在于,包括收集单元、预处理单元、选择单元、建筑物特征信息提取单元、识别单元、精细特征提取单元、分类单元、约束识别单元与输出单元;
收集单元,用于收集样本数据,构建数据库;样本数据包括遥感数据、道路数据、建成区数据与NDVI专题数据;
预处理单元,用于对样本数据进行预处理,包括道路数据简化、遥感数据分区、构建基本分析单元,NDVI数据阈值分割;
选择单元,用于选择训练样本数据和测试样本数据,将训练样本数据分为城中村与非城中村样本,利用训练样本数据生成城中村识别的随机森林分类模型,利用测试样本数据验证模型的识别城中村的准确率,通过多次训练测试筛选出拟合最好的随机森林分类模型;
建筑物特征信息提取单元,用于对训练样本数据进行特征提取,得到建筑物特征信息,计算Building-Green指标,使用随机森林分类模型对样本数据提取的指标训练得到分类模型;
识别单元,用于根据Building-Green指标,在滑动窗口内提取细粒度特征,分类得到城中村像元,将超像素单元内城中村像元大于等于设定值的超像素单元识别为城中村;
精细特征提取单元,用于根据分类模型提取结果,对城中村样本细分剔除样本数据中非城中村像元,在滑动窗口内提取精细特征,包括建筑物的光谱特征、纹理特征与结构特征;
分类单元,用于将精细特征横向拼接,使用随机森林分类器进行特征分类后将结果赋给窗口像素;
约束识别单元,用于对基本分析单元影像进行超像素分割,通过超像素块对精细特征提取结果进行约束,根据超像素块的像素个数与识别为城中村的像素数,计算超像素块内城中村像元总数;
输出单元,用于根据超像素单元内城中村像素总数的占比,得到目标城中村。
9.一种电子设备,其特征在于,包括:
处理器和存储器;
所述存储器,用于存储计算机操作指令;
所述处理器,用于通过调用所述计算机操作指令,执行权利要求1至7中任一项所述的基于细粒度特征约束的城中村识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410199413.0A CN117787813B (zh) | 2024-02-23 | 2024-02-23 | 基于细粒度特征约束的城中村识别方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410199413.0A CN117787813B (zh) | 2024-02-23 | 2024-02-23 | 基于细粒度特征约束的城中村识别方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117787813A CN117787813A (zh) | 2024-03-29 |
CN117787813B true CN117787813B (zh) | 2024-05-31 |
Family
ID=90389225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410199413.0A Active CN117787813B (zh) | 2024-02-23 | 2024-02-23 | 基于细粒度特征约束的城中村识别方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117787813B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020063461A1 (zh) * | 2018-09-30 | 2020-04-02 | 广州地理研究所 | 基于随机森林分类算法的城市范围提取方法、装置及电子设备 |
CN111598048A (zh) * | 2020-05-31 | 2020-08-28 | 中国科学院地理科学与资源研究所 | 一种融合高分遥感影像和街景影像的城中村识别方法 |
CN112347926A (zh) * | 2020-11-06 | 2021-02-09 | 天津市勘察设计院集团有限公司 | 基于建筑形态分布的高分辨率影像城中村检测方法 |
CN112633140A (zh) * | 2020-12-21 | 2021-04-09 | 华南农业大学 | 多光谱遥感图像城中村多类别建筑物语义分割方法及系统 |
WO2023077816A1 (zh) * | 2021-11-03 | 2023-05-11 | 中国华能集团清洁能源技术研究院有限公司 | 边界优化的遥感图像语义分割方法、装置、设备及介质 |
KR20230140832A (ko) * | 2022-03-30 | 2023-10-10 | 창원대학교 산학협력단 | 드론 및 인공지능을 활용한 도시 공간정보 매핑 방법 및 장치 |
CN117274650A (zh) * | 2023-10-27 | 2023-12-22 | 华中师范大学 | 基于遥感-众源语义深度聚类的城市功能区识别方法 |
-
2024
- 2024-02-23 CN CN202410199413.0A patent/CN117787813B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020063461A1 (zh) * | 2018-09-30 | 2020-04-02 | 广州地理研究所 | 基于随机森林分类算法的城市范围提取方法、装置及电子设备 |
CN111598048A (zh) * | 2020-05-31 | 2020-08-28 | 中国科学院地理科学与资源研究所 | 一种融合高分遥感影像和街景影像的城中村识别方法 |
CN112347926A (zh) * | 2020-11-06 | 2021-02-09 | 天津市勘察设计院集团有限公司 | 基于建筑形态分布的高分辨率影像城中村检测方法 |
CN112633140A (zh) * | 2020-12-21 | 2021-04-09 | 华南农业大学 | 多光谱遥感图像城中村多类别建筑物语义分割方法及系统 |
WO2023077816A1 (zh) * | 2021-11-03 | 2023-05-11 | 中国华能集团清洁能源技术研究院有限公司 | 边界优化的遥感图像语义分割方法、装置、设备及介质 |
KR20230140832A (ko) * | 2022-03-30 | 2023-10-10 | 창원대학교 산학협력단 | 드론 및 인공지능을 활용한 도시 공간정보 매핑 방법 및 장치 |
CN117274650A (zh) * | 2023-10-27 | 2023-12-22 | 华中师范大学 | 基于遥感-众源语义深度聚类的城市功能区识别方法 |
Non-Patent Citations (1)
Title |
---|
基于随机森林的WorldVew2i影像建筑物精细提取;范驰等;《地理空间信息》;20160131;第14卷(第01期);第58-62页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117787813A (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109829399B (zh) | 一种基于深度学习的车载道路场景点云自动分类方法 | |
Gonçalves et al. | SegOptim—A new R package for optimizing object-based image analyses of high-spatial resolution remotely-sensed data | |
Hermosilla et al. | Assessing contextual descriptive features for plot-based classification of urban areas | |
CN111028255B (zh) | 基于先验信息与深度学习的农田区域预筛选方法及装置 | |
CN110309781B (zh) | 基于多尺度光谱纹理自适应融合的房屋损毁遥感识别方法 | |
CN109389163B (zh) | 一种基于地形图的无人机影像分类系统及方法 | |
CN109063754B (zh) | 一种基于OpenStreetMap的遥感影像多特征联合分类方法 | |
CN113033516A (zh) | 对象识别统计方法及装置、电子设备、存储介质 | |
CN113223042B (zh) | 一种遥感影像深度学习样本智能采集方法及设备 | |
CN104820841B (zh) | 基于低阶互信息和光谱上下文波段选择的高光谱分类方法 | |
CN113792667A (zh) | 基于三维遥感影像进行村镇建筑性质自动分类方法及装置 | |
Tang et al. | A multiple-point spatially weighted k-NN method for object-based classification | |
CN115953612A (zh) | 一种基于ConvNeXt的遥感影像植被分类方法和装置 | |
CN115019163A (zh) | 基于多源大数据的城市要素识别方法 | |
Zheng et al. | Single shot multibox detector for urban plantation single tree detection and location with high-resolution remote sensing imagery | |
CN113033386B (zh) | 一种基于高分辨率遥感影像的输电线路通道隐患识别方法及系统 | |
CN112597936B (zh) | 基于面向对象分层分割的建筑垃圾分离方法及相关产品 | |
Vaidya et al. | Classifying heterogeneous urban form into local climate zones using supervised learning and greedy clustering incorporating Landsat dataset | |
CN112858181A (zh) | 黑臭水体监测方法、装置及电子设备 | |
CN110929739B (zh) | 一种自动化的不透水面范围遥感迭代提取方法 | |
CN113034511A (zh) | 基于高分辨率遥感影像与深度学习的乡村建筑识别算法 | |
CN117787813B (zh) | 基于细粒度特征约束的城中村识别方法、装置及电子设备 | |
CN116543325A (zh) | 基于无人机影像的农作物人工智能自动识别方法和系统 | |
CN115984603A (zh) | 基于gf-2与开放地图数据的城市绿地精细化分类方法与系统 | |
CN115393368A (zh) | 基于元学习的聚落选址环境模式鉴别方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |