CN114708521A - 基于街景图像目标关系感知网络的城市功能区识别方法及系统 - Google Patents
基于街景图像目标关系感知网络的城市功能区识别方法及系统 Download PDFInfo
- Publication number
- CN114708521A CN114708521A CN202210372812.3A CN202210372812A CN114708521A CN 114708521 A CN114708521 A CN 114708521A CN 202210372812 A CN202210372812 A CN 202210372812A CN 114708521 A CN114708521 A CN 114708521A
- Authority
- CN
- China
- Prior art keywords
- street view
- view image
- functional area
- data
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008447 perception Effects 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000012549 training Methods 0.000 claims abstract description 61
- 238000011160 research Methods 0.000 claims abstract description 20
- 230000009466 transformation Effects 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 18
- 230000000007 visual effect Effects 0.000 claims description 13
- 238000013527 convolutional neural network Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 description 6
- 238000010200 validation analysis Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000003796 beauty Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013095 identification testing Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/043—Optimisation of two dimensional placement, e.g. cutting of clothes or wood
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于街景图像目标关系感知网络的城市功能区识别方法及系统,包括:获取街景图像,并对所述街景图像进行随机水平翻转、随机几何变换和随机颜色抖动操作,增强训练数据;根据所述训练数据构建训练数据集,将训练集街景图像输入到基于图的关系感知网络中进行训练,得到训练后的城市功能区识别模型;对街景图像进行空间关系感知,根据得到的城市功能区类型对所述街景图像进行识别;获取到研究区域范围内的POI数据,对所述POI数据进行分类,并基于POI数据得到城市功能区分类;能够模拟人类识别和推理过程,捕捉街景图像中的局部空间关系和全局语义关系,增强城市功能区检测器的能力。
Description
技术领域
本发明涉及城市功能区识别领域,特别涉及一种基于街景图像目标关系感知网络的城市功能区识别方法及系统。
背景技术
目前,针对高分辨率遥感影像进行城市功能区识别的研究主要使用了地物的低层次的视觉特征,无法准确识别纹理和灰度较为相似的不同类型的地物。例如,来自高分遥感影像的光谱信息不足以将相同(土地覆盖)材料区分为不同的建筑物类别。例如,一栋混凝土建筑可能属于一所学校、一个市政厅或一家酒店。此外,城市功能区通常由一系列不同材料、不同纹理的对象组成,并被围在某个边界之内。例如,医院可就可能包含以将公园、道路和建筑物围在其边界内。从俯视角度确定复杂城市地区的功能区类别要困难得多,因为我们无法从遥感图像上确定一座建筑物是餐厅还是理发店。利用遥感图像仅从俯视角度进行识别,缺少了重要的建筑物细节信息,很难得到正确的建筑物类型。因此,对经济社会特征十分明显的城市功能区类型,利用遥感影像很难进行识别。
随着街景图像服务例如谷歌街景服务(GSV)的兴起,越来越多不同城市的具有准确地理定位的街景图像可以被获得。在常见计算机视觉任务中表现良好的视觉模型,如CNN,最近被广泛用于提取街景图像的视觉特征,用于城市土地利用和城市功能区分析。然而,现有的基于街景图像的城市功能区分类热衷于关注图像的整体视觉特征,而忽略了图像中的局部视觉特征之间的关系。所以,在当直接使用整个图像时,它们包含的许多相同的视觉元素(例如天空和地面)的特征就会对不同功能区的区分造成干扰,而使得最具可区分性的视觉元素(例如建筑物)反而没有得到充分利用。这些方法的一个共性不足,就是本质上受限于对忽略图像中对象之间复杂的局部空间关系的忽略。对图像中对象之间复杂的全局语义关系的忽略也是这些方法的局限性之一。
发明内容
本发明提供了一种基于街景图像目标关系感知网络的城市功能区识别方法及系统,其目的是为了解决城市功能区类型识别的问题。
为了达到上述目的,本发明提供了一种基于街景图像目标关系感知网络的城市功能区识别方法,包括:
步骤1,获取街景图像,并对所述街景图像进行随机水平翻转、随机几何变换和随机颜色抖动操作,增强训练数据;
步骤2,根据所述训练数据构建训练数据集,将训练集街景图像输入到基于图的关系感知网络中进行训练,得到训练后的城市功能区识别模型;
步骤3,对街景图像进行空间关系感知,根据得到的城市功能区类型对所述街景图像进行识别;
步骤4,获取到研究区域范围内的POI数据,对所述POI数据进行分类,并基于POI数据得到城市功能区分类。
其中,所述步骤2具体包括:
从所述街景图像的每个类别中随机选择75%的样本作为训练/验证集,剩余的25%作为测试集,将训练/验证集按照9:1的比例随机分为训练集和验证集,将训练集街景图像输入到基于图的关系感知网络中进行训练,得到训练后的城市功能区识别模型。
其中,所述对街景图像进行空间关系感知的步骤具体包括:
将街景图像输入到预训练的基线模型Faster R-CNN网络中,得到街景图像中建筑物的目标框和分类权重;
利用得到的分类权重对建筑物对象进行视觉嵌入,使用成对的伪坐标函数u(a,b)捕获成对的空间信息,并从中确定具有可学习的均值和协方差K的高斯核WK作为图卷积网络的权重;
将区域视觉嵌入作为节点和高斯核WK作为权重,输入到图卷积网络中,进行街景图像的空间关系感知。
其中,所述根据得到的城市功能区类型对所述街景图像进行识别的步骤具体包括:
对街景图像进行语义关系感知,对街景图像的标签进行词嵌入,得到标签的词嵌入向量;
通过计算数据集中标签的共线次数得到一个归一化的图卷积网络的邻接矩阵;
将词嵌入向量和邻接矩阵输入到图卷积神经网络中,得到图像标签的图嵌入向量;
将图嵌入向量与预训练的基线模型Faster R-CNN得到的视觉特征向量进行点乘,得到街景图像的语义关系特征;
将得到的街景图像的空间关系特征与语义关系特征和街景图像整体的视觉关系特征进行连接;
将连接得到的向量输入到全连接网络当中,最后进行softmax分类得到城市功能区的类型。
其中,所述步骤4具体包括:
通过爬虫方式从OSM官网上获取到研究区域范围内的POI数据;
根据城市功能区类型将POI数据分为居住功能区、商业功能区、工业功能区和公共服务功能区,与街景图像功能区分类相对应;
通过对POI数据进行关键数据处理,完成POI的城市功能区类型界定;
获取研究区域内相应路网数据,根据研究区域范围进行数据裁剪;
将根据关系感知网络得到的基于街景图像的城市功能区分类和POI点数据得到的功能区映射进行结合,将4类功能区数据进行二维核密度计算,得到各功能区类别的核密度分布;
根据得到的各功能区类别的核密度分布,通过设定各区域内的核密度阈值,对各个区域内的城市功能区类型进行确定。
本发明还提供了一种基于街景图像目标关系感知网络的城市功能区识别系统,包括:
数据获取模块,用于获取街景图像,并对所述街景图像进行随机水平翻转、随机几何变换和随机颜色抖动操作,增强训练数据;
模型训练模块,用于根据所述训练数据构建训练数据集,将训练集街景图像输入到基于图的关系感知网络中进行训练,得到训练后的城市功能区识别模型;
图像识别模块,用于对街景图像进行空间关系感知,根据得到的城市功能区类型对所述街景图像进行识别;
功能区分类模块,用于获取到研究区域范围内的POI数据,对所述POI数据进行分类,并基于POI数据得到城市功能区分类。
本发明的上述方案有如下的有益效果:
本发明所述的基于街景图像目标关系感知网络的城市功能区识别方法及系统基于图的关系感知网络框架,可以用来捕捉街景图像中的局部空间关系和全局语义关系,能够获得更多的建筑物细节特征,从而获得更加准确的建筑物类别,与基于图像级CNN的街景图像城市功能区识别方法相比,能够模拟人类识别和推理过程,捕捉街景图像中的局部空间关系和全局语义关系,增强城市功能区检测器的能力。
本发明的其它有益效果将在随后的具体实施方式部分予以详细说明。
附图说明
图1为本发明的基于街景图像目标关系感知网络的城市功能区识别方法流程图。
图2为建筑物检测的可视化结果。
图3为卡尔加里预测建筑物的建筑类别比例及功能区比例。
图4为结合POI数据及街景数据的城市功能区分类图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是锁定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
如图1所示,本发明的实施例提供了一种基于街景图像目标关系感知网络的城市功能区识别方法,包括:
步骤1,街景图像的预处理:主要是对街景图像进行随机水平翻转、随机几何变换和随机颜色抖动来增强训练数据。
步骤2,构建训练数据集和模型训练:从街景图像的每个类别中随机选择75%的样本作为训练/验证集,剩余的25%作为测试集。然后将训练/验证集按照9:1的比例随机分为训练集和验证集。将训练集街景图像输入到基于图的关系感知网络中进行训练,得到训练后的城市功能区识别模型。
步骤3,对街景图像进行功能区识别的主要步骤如下:
对街景图像进行空间关系感知,首先,将街景图像输入到预训练的基线模型Faster R-CNN网络中,得到街景图像中建筑物的目标框和分类权重。
利用得到的分类权重对建筑物对象进行视觉嵌入。
使用成对的伪坐标函数u(a,b)捕获成对的空间信息,并从中确定具有可学习的均值和协方差K的高斯核WK作为图卷积网络的权重。
将区域视觉嵌入作为节点和高斯核WK作为权重,输入到图卷积网络中,进行街景图像的空间关系感知。
对街景图像进行语义关系感知,首先对街景图像的标签进行词嵌入,得到标签的词嵌入向量。
通过计算数据集中标签的共线次数得到一个归一化的图卷积网络的邻接矩阵。
将词嵌入向量和邻接矩阵输入到图卷积神经网络中,得到图像标签的图嵌入向量。
将图嵌入向量与预训练的基线模型Faster R-CNN得到的视觉特征向量进行点乘,得到街景图像的语义关系特征。
将得到的街景图像的空间关系特征与语义关系特征和街景图像整体的视觉关系特征进行连接。
将连接得到的向量输入到全连接网络当中,最后进行softmax分类得到城市功能区的类型。
步骤4,基于POI数据得到城市功能区分类的主要步骤如下:
通过爬虫方式从OSM官网上获取到研究区域范围内的POI数据。
对城市功能的普遍认知度以及功能显著性进行考虑,与街景图像功能区分类相同,将POI数据也分为居住功能区、商业功能区、工业功能区和公共服务功能区,直接作为城市功能区类型。
通过对POI数据进行提取、清洗、查重、坐标变换、定义投影和空间位置等关键数据处理,从而完成POI的城市功能区类型界定,以及相对地的数量计算。
从OpenStreetMap官网下载研究区域内相应路网数据,根据研究区域范围进行数据裁剪。
根据本发明的POI样本点,对其进行了二维平面的展开,再根据各类功能用地网络覆盖区域比例指数Sij,实现功能区域的初步提取。
将根据关系感知网络得到的基于街景图像的城市功能区分类和POI点数据得到的功能区映射进行结合,将4类功能区数据进行二维核密度计算,得到各功能区类别的核密度分布。根据得到的各功能区类别的核密度分布,通过设定各区域内的核密度阈值,对各个区域内的城市功能区类型进行确定。
本发明还提供了一种基于街景图像目标关系感知网络的城市功能区识别系统,包括:
数据获取模块,用于获取街景图像,并对所述街景图像进行随机水平翻转、随机几何变换和随机颜色抖动操作,增强训练数据;
模型训练模块,用于根据所述训练数据构建训练数据集,将训练集街景图像输入到基于图的关系感知网络中进行训练,得到训练后的城市功能区识别模型;
图像识别模块,用于对街景图像进行空间关系感知,根据得到的城市功能区类型对所述街景图像进行识别;
功能区分类模块,用于获取到研究区域范围内的POI数据,对所述POI数据进行分类,并基于POI数据得到城市功能区分类。
本发明所述的基于街景图像目标关系感知网络的城市功能区识别方法及系统基于图的关系感知网络框架,可以用来捕捉街景图像中的局部空间关系和全局语义关系,能够获得更多的建筑物细节特征,从而获得更加准确的建筑物类别,与基于图像级CNN的街景图像城市功能区识别方法相比,能够模拟人类识别和推理过程,捕捉街景图像中的局部空间关系和全局语义关系,增强城市功能区检测器的能力。
第一实施例
下面以加拿大的卡尔加里市为研究区域,对本发明的具体实施进行说明。
步骤一、数据预处理
1)本发明采用的数据集BEAUTY数据集其中包含19,070张街景图像和38,857个独立建筑物。
2)从每个类别中随机选择75%的样本作为训练/验证集,剩余的25%作为测试集。然后将训练/验证集按照9:1的比例随机分为训练集和验证集。为了减少类不平衡的影响并获得更好的性能,使用随机少数过采样策略对训练样本进行类重新平衡。公共和工业的样本分别扩大了2倍和2.5倍。由于在训练前的数据增强阶段所有训练样本都会在水平方向随机翻转,因此少数只需要随机复制即可。本发明还尝试了随机几何变换和随机颜色抖动来增强训练数据。但考虑到街景图像分类和建筑物检测的任务,性能不如随机水平翻转。再平衡后的样本分布。将数据增强的类平衡后,训练图像和单个建筑物的总数分别为16,871和32,439。
步骤二、街景图像分类的基线测试:对于街景图像分类的任务,选择ResNet50和ResNet101作为候选基线模型。我们以0.01的学习率对BEAUYT上的预训练模型5进行微调,每10个epoch后乘以0.1倍。使用Adam作为优化器进行了100个epoch的训练。虽然训练集已经重新平衡,使用每类指标的宏观平均值,即全局精度(M-P)、全局召回率(M-R)和全局F1Score(M-F1)。如表I所示,ResNet50在所有宏观平均指标上的表现都优于ResNet101。因此,选择ResNet50作为BEAUTY上街景图像分类的基线模型。
表I图像分类精度
步骤三、建筑物检测的基线测试:对于建筑物检测的任务,选择具有ResNet50和ResNet101主干的Faster R-CNN和Cascaded RCNN作为候选基线模型。建筑物检测精度如表II所示
表II建筑物检测精度
步骤四、基于关系感知网络的功能区识别测试:在选择Ca-101作为默认检测器后,通过两个关系感知网络,即空间关系感知和语义关系感知网络进行功能区识别测试。
表III功能区识别精度
步骤五、基于POI数据的功能区识别
1)通过爬虫方式从OSM官网上获取到研究区域范围内的POI数据。
2)对城市功能的普遍认知度以及功能显著性进行考虑,与街景图像功能区分类相同,将POI数据也分为居住功能区、商业功能区、工业功能区和公共服务功能区,直接作为城市功能区类型。
3)通过对POI数据进行提取、清洗、查重、坐标变换、定义投影和空间位置等关键数据处理,从而完成POI的城市功能区类型界定,以及相对地的数量计算。
4)从OpenStreetMap官网下载研究区域内相应路网数据,根据研究区域范围进行数据裁剪。
5)根据本发明的POI样本点,对其进行了二维平面的展开,再根据各类功能用地网络覆盖区域比例指数Sij,实现功能区域的初步提取。
6)将根据关系感知网络得到的基于街景图像的城市功能区分类和POI点数据得到的功能区映射进行结合,将4类功能区数据进行二维核密度计算,得到各功能区类别的核密度分布。根据得到的各功能区类别的核密度分布,通过设定各区域内的核密度阈值,对各个区域内的城市功能区类型进行确定。
步骤六、结合POI数据及街景图像数据得到的城市功能用核密度分析的方法进行城市功能区识别。
本发明的实验结果表明,与基于图像级CNN的模型相比,所提出的方法在宏观精度上实现了12.8%的性能提升,在宏观召回率上实现了12%的性能提升。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (6)
1.一种基于街景图像目标关系感知网络的城市功能区识别方法,其特征在于,包括:
步骤1,获取街景图像,并对所述街景图像进行随机水平翻转、随机几何变换和随机颜色抖动操作,增强训练数据;
步骤2,根据所述训练数据构建训练数据集,将训练集街景图像输入到基于图的关系感知网络中进行训练,得到训练后的城市功能区识别模型;
步骤3,对街景图像进行空间关系感知,根据得到的城市功能区类型对所述街景图像进行识别;
步骤4,获取到研究区域范围内的POI数据,对所述POI数据进行分类,并基于POI数据得到城市功能区分类。
2.根据权利要求1所述的基于街景图像目标关系感知网络的城市功能区识别方法,其特征在于,所述步骤2具体包括:
从所述街景图像的每个类别中随机选择75%的样本作为训练/验证集,剩余的25%作为测试集,将训练/验证集按照9:1的比例随机分为训练集和验证集,将训练集街景图像输入到基于图的关系感知网络中进行训练,得到训练后的城市功能区识别模型。
3.根据权利要求2所述的基于街景图像目标关系感知网络的城市功能区识别方法,其特征在于,所述对街景图像进行空间关系感知的步骤具体包括:
将街景图像输入到预训练的基线模型Faster R-CNN网络中,得到街景图像中建筑物的目标框和分类权重;
利用得到的分类权重对建筑物对象进行视觉嵌入,使用成对的伪坐标函数u(a,b)捕获成对的空间信息,并从中确定具有可学习的均值和协方差K的高斯核WK作为图卷积网络的权重;
将区域视觉嵌入作为节点和高斯核WK作为权重,输入到图卷积网络中,进行街景图像的空间关系感知。
4.根据权利要求3所述的基于街景图像目标关系感知网络的城市功能区识别方法,其特征在于,所述根据得到的城市功能区类型对所述街景图像进行识别的步骤具体包括:
对街景图像进行语义关系感知,对街景图像的标签进行词嵌入,得到标签的词嵌入向量;
通过计算数据集中标签的共线次数得到一个归一化的图卷积网络的邻接矩阵;
将词嵌入向量和邻接矩阵输入到图卷积神经网络中,得到图像标签的图嵌入向量;
将图嵌入向量与预训练的基线模型Faster R-CNN得到的视觉特征向量进行点乘,得到街景图像的语义关系特征;
将得到的街景图像的空间关系特征与语义关系特征和街景图像整体的视觉关系特征进行连接;
将连接得到的向量输入到全连接网络当中,最后进行softmax分类得到城市功能区的类型。
5.根据权利要求3所述的基于街景图像目标关系感知网络的城市功能区识别方法,其特征在于,所述步骤4具体包括:
通过爬虫方式从OSM官网上获取到研究区域范围内的POI数据;
根据城市功能区类型将POI数据分为居住功能区、商业功能区、工业功能区和公共服务功能区,与街景图像功能区分类相对应;
通过对POI数据进行关键数据处理,完成POI的城市功能区类型界定;
获取研究区域内相应路网数据,根据研究区域范围进行数据裁剪;
将根据关系感知网络得到的基于街景图像的城市功能区分类和POI点数据得到的功能区映射进行结合,将4类功能区数据进行二维核密度计算,得到各功能区类别的核密度分布;
根据得到的各功能区类别的核密度分布,通过设定各区域内的核密度阈值,对各个区域内的城市功能区类型进行确定。
6.一种基于街景图像目标关系感知网络的城市功能区识别系统,其特征在于,包括:
数据获取模块,用于获取街景图像,并对所述街景图像进行随机水平翻转、随机几何变换和随机颜色抖动操作,增强训练数据;
模型训练模块,用于根据所述训练数据构建训练数据集,将训练集街景图像输入到基于图的关系感知网络中进行训练,得到训练后的城市功能区识别模型;
图像识别模块,用于对街景图像进行空间关系感知,根据得到的城市功能区类型对所述街景图像进行识别;
功能区分类模块,用于获取到研究区域范围内的POI数据,对所述POI数据进行分类,并基于POI数据得到城市功能区分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210372812.3A CN114708521A (zh) | 2022-04-07 | 2022-04-07 | 基于街景图像目标关系感知网络的城市功能区识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210372812.3A CN114708521A (zh) | 2022-04-07 | 2022-04-07 | 基于街景图像目标关系感知网络的城市功能区识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114708521A true CN114708521A (zh) | 2022-07-05 |
Family
ID=82173077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210372812.3A Pending CN114708521A (zh) | 2022-04-07 | 2022-04-07 | 基于街景图像目标关系感知网络的城市功能区识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114708521A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227791A (zh) * | 2023-05-08 | 2023-06-06 | 湖南工商大学 | 基于语义融合模型探索城市功能区动态划分的可视分析方法 |
CN116229280A (zh) * | 2023-01-09 | 2023-06-06 | 广东省科学院广州地理研究所 | 崩岗识别方法、装置、电子设备以及存储介质 |
CN117079124A (zh) * | 2023-07-14 | 2023-11-17 | 北京大学 | 一种基于社群差异化的城乡景观意象量化及提升方法 |
CN117115566A (zh) * | 2023-10-22 | 2023-11-24 | 南京北斗创新应用科技研究院有限公司 | 利用全季节遥感影像的城市功能区识别方法及系统 |
CN117319610A (zh) * | 2023-11-28 | 2023-12-29 | 松立控股集团股份有限公司 | 基于高位全景相机区域增强的智慧城市道路监控方法 |
-
2022
- 2022-04-07 CN CN202210372812.3A patent/CN114708521A/zh active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116229280A (zh) * | 2023-01-09 | 2023-06-06 | 广东省科学院广州地理研究所 | 崩岗识别方法、装置、电子设备以及存储介质 |
CN116229280B (zh) * | 2023-01-09 | 2024-06-04 | 广东省科学院广州地理研究所 | 崩岗识别方法、装置、电子设备以及存储介质 |
CN116227791A (zh) * | 2023-05-08 | 2023-06-06 | 湖南工商大学 | 基于语义融合模型探索城市功能区动态划分的可视分析方法 |
CN116227791B (zh) * | 2023-05-08 | 2023-09-05 | 湖南工商大学 | 基于语义融合模型探索城市功能区动态划分的可视分析方法 |
CN117079124A (zh) * | 2023-07-14 | 2023-11-17 | 北京大学 | 一种基于社群差异化的城乡景观意象量化及提升方法 |
CN117079124B (zh) * | 2023-07-14 | 2024-04-30 | 北京大学 | 一种基于社群差异化的城乡景观意象量化及提升方法 |
CN117115566A (zh) * | 2023-10-22 | 2023-11-24 | 南京北斗创新应用科技研究院有限公司 | 利用全季节遥感影像的城市功能区识别方法及系统 |
CN117115566B (zh) * | 2023-10-22 | 2024-03-05 | 南京北斗创新应用科技研究院有限公司 | 利用全季节遥感影像的城市功能区识别方法及系统 |
CN117319610A (zh) * | 2023-11-28 | 2023-12-29 | 松立控股集团股份有限公司 | 基于高位全景相机区域增强的智慧城市道路监控方法 |
CN117319610B (zh) * | 2023-11-28 | 2024-01-30 | 松立控股集团股份有限公司 | 基于高位全景相机区域增强的智慧城市道路监控方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114708521A (zh) | 基于街景图像目标关系感知网络的城市功能区识别方法及系统 | |
CN110136170B (zh) | 一种基于卷积神经网络的遥感影像建筑物变化检测方法 | |
CN112949413B (zh) | 基于街景图片的城市景观要素分类及地方性度量方法 | |
CN108427965B (zh) | 一种基于路网聚类的热点区域挖掘方法 | |
CN111401692B (zh) | 一种度量城市空间功能紧凑度的方法 | |
CN113196331A (zh) | 利用卫星影像的应用服务提供装置及方法 | |
Ren et al. | The accuracy of LCZ maps generated by the world urban database and access portal tools (WUDAPT) method: A case study of Hong Kong | |
CN112861972A (zh) | 一种展业区域的选址方法、装置、计算机设备和介质 | |
CN111797188B (zh) | 一种基于开源地理空间矢量数据的城市功能区定量识别方法 | |
CN112365595A (zh) | 基于报警数据点要素的鉴别交通事故多发点的分析方法 | |
Alhasoun et al. | Streetify: Using street view imagery and deep learning for urban streets development | |
CN115880466A (zh) | 基于无人机遥感的城市工程测绘方法及系统 | |
CN113516060B (zh) | 基于多时相高分辨率数据的建筑空间融合判别方法及装置 | |
Sun et al. | Intraurban migration, neighborhoods, and city structure | |
CN111400877B (zh) | 一种基于gis数据的智能城市仿真系统和方法 | |
Liu | Estimation of the spatial distribution of urban population using high spatial resolution satellite imagery | |
CN116628531A (zh) | 众包地图道路对象要素聚类方法、系统及存储介质 | |
CN111105124A (zh) | 一种基于距离约束的多地标影响力的计算方法 | |
Wu et al. | Mixed land use measurement and mapping with street view images and spatial context-aware prompts via zero-shot multimodal learning | |
Panizzi et al. | Private or Public Parking Type Classifier on the Driver’s Smartphone | |
CN112257970A (zh) | 一种基于兴趣点大数据的城市功能区自动划分方法 | |
Meedeniya et al. | Land‐Use Classification with Integrated Data | |
Kubanek et al. | Capacities of remote sensing for population estimation in urban areas | |
CN114022772B (zh) | 流动摊贩空间分布的预测方法、系统、装置和存储介质 | |
CN115359346B (zh) | 基于街景图片的小微空间识别方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |