CN115577294A - 一种基于兴趣点空间分布和语义信息的城市区域分类方法 - Google Patents

一种基于兴趣点空间分布和语义信息的城市区域分类方法 Download PDF

Info

Publication number
CN115577294A
CN115577294A CN202211463701.XA CN202211463701A CN115577294A CN 115577294 A CN115577294 A CN 115577294A CN 202211463701 A CN202211463701 A CN 202211463701A CN 115577294 A CN115577294 A CN 115577294A
Authority
CN
China
Prior art keywords
semantic
region
interest point
interest
regional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211463701.XA
Other languages
English (en)
Other versions
CN115577294B (zh
Inventor
陈勐
徐榕荟
陈学业
郭晗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Planning And Natural Resources Data Management Center Shenzhen Spatial Geographic Information Center
Shandong University
Original Assignee
Shenzhen Planning And Natural Resources Data Management Center Shenzhen Spatial Geographic Information Center
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Planning And Natural Resources Data Management Center Shenzhen Spatial Geographic Information Center, Shandong University filed Critical Shenzhen Planning And Natural Resources Data Management Center Shenzhen Spatial Geographic Information Center
Priority to CN202211463701.XA priority Critical patent/CN115577294B/zh
Publication of CN115577294A publication Critical patent/CN115577294A/zh
Application granted granted Critical
Publication of CN115577294B publication Critical patent/CN115577294B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及数据挖掘技术领域,尤其涉及一种基于兴趣点空间分布和语义信息的城市区域分类方法,包括:获取目标城市范围以及城市内兴趣点经纬度信息和兴趣点类别信息,将目标城市网格划分为多个区域,将每个区域表示为一个三维张量,将所述三维张量输入卷积神经网络中得到携带兴趣点空间分布的区域空间特征表示;对每一个区域构造兴趣点语义树,对所述兴趣点语义树的兴趣点类别信息进行编码和挖掘,得到区域语义特征表示;基于Wide&Deep网络融合所述区域空间特征表示和所述区域语义特征表示,输入到分类器对城市区域进行分类。避免了使用用户数据造成的侵犯隐私问题,充分利用了空间数据的语义信息,实现了多种特征的充分融合。

Description

一种基于兴趣点空间分布和语义信息的城市区域分类方法
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种基于兴趣点空间分布和语义信息的城市区域分类方法。
背景技术
公开该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术。
城市是经济活动和创新的中心,其中存在着多种多样的功能区域。不同的功能区域分布着各种各样的兴趣点(Point of Interest,简称为POI)类别(如面馆、书店等)。城市功能区是城市居民从事各项社会经济活动的分布空间,如商业区、居住区、娱乐区等,由自然、社会、经济和历史等众多因素共同作用形成。城市区域特征和区域使用类型可以反映城市发展中潜在的自然和社会过程,可以为城市规划相关人员提供有效信息,以便制定城市规划和管理的重要决策。
现有的城市区域分类方法具有以下几种:①基于人类活动模式的感知:现有方法主要从用户的出租车轨迹或签到轨迹中挖掘人类移动模式来表征城市区域;②基于空间信息的感知:现有模型基于区域中兴趣点的空间模式与位置关系进行区域表示学习;③基于图像信息的感知:一些研究从区域的土地覆盖对象和物理环境的角度学习城市区域表示;④基于多种信息的感知:使用不同数据类型如图像、空间信息、轨迹信息和兴趣点中包含的文本信息等的组合来构建更稳健的模型。上述方法往往只依赖于兴趣点的空间分布数据,没有充分挖掘空间数据中蕴含的语义信息,造成部分信息丢失,导致城市区域分类结果不精确。
发明内容
针对现有技术存在的不足,本发明实施例的目的是提供一种基于兴趣点空间分布和语义信息的城市区域分类方法,充分挖掘了区域内兴趣点的空间分布信息以及兴趣点的语义信息,并将空间分布与语义信息充分融合,实现对城市区域更精准的分类。
为了实现上述目的,本发明实施例提供了如下技术方案:
一种基于兴趣点空间分布和语义信息的城市区域分类方法,包括:获取目标城市范围以及城市内兴趣点经纬度信息和兴趣点类别信息,将目标城市网格划分为多个区域,根据兴趣点的经纬度信息和类别信息将每个区域表示为一个三维张量,将所述三维张量输入卷积神经网络中得到携带兴趣点空间分布的区域空间特征表示;对每一个区域构造兴趣点语义树,对所述兴趣点语义树的兴趣点类别信息进行编码和挖掘,得到区域语义特征表示;基于Wide & Deep网络融合所述区域空间特征表示和所述区域语义特征表示,输入到分类器对城市区域进行分类。
优选的,所述三维张量为一个多通道图像,前两个维度是空间维度,第三个维度为兴趣点特征。
优选的,将每个区域表示为一个三维张量包括:将每个区域视为图像像素的拼接,为每个像素分配一个兴趣点特征向量,该特征向量是该区域所有兴趣点最高级类别向量的和,对于没有兴趣点的空像素,赋值为空特征向量。
优选的,给定一个区域,将其三维张量输入到Net(·)中,得到了区域空间特征表示。
优选的,对每一个区域构造兴趣点语义树包括:根据已知的兴趣点类别层次结构以及分布在区域内的所有兴趣点对每一个区域构造兴趣点语义树。
优选的,对所述兴趣点语义树的兴趣点类别信息进行编码包括:自动编码器包括编码器和解码器,编码器以兴趣点语义树作为输入,输出一个嵌入向量;解码器以嵌入向量作为输入对语义树进行重构,编码器和解码器之间的嵌入向量即为区域语义特征表示。
优选的,挖掘兴趣点语义树,挖掘不同兴趣点类别对于城市区域的重要程度,将高权重分配给整个城市区域很少出现的兴趣点类别,而低权重分配给整个城市区域频繁出现的类别。
优选的,对每个语义树中的所有权重进行降序排序,根据top K生成一个显著的子树来表示该区域中最显著的兴趣点信息;构造语义模式提取器,由MLP构成,用来提取兴趣点语义树中的显著子树;构造以自动编码器与语义模式提取器构成的生成器,建立由MLP构成的判别器,通过生成对抗机制使区域语义特征有效保存兴趣点语义树中的显著子树信息。
优选的,Wide & Deep网络包括Wide层和Deep层,在Deep层,两个d维表示向量被连接并传递给一个MLP来计算两个部分的联合表示,这个联合表示表示为一个深度向量;在Wide层中,计算区域空间特征表示与区域语义特征表示的外积,生成了一个d×d维的矩阵,然后将矩阵展开为一个d2维的向量并传递给一个新的一层MLP来转换维度来计算两个部分联合表示的宽度向量;将Wide层输出向量与Deep层输出向量连接,串联起来用于城市区域分类。
优选的,采用自动编码器重构目标,确保学习到的区域语义特征包含区域内整体兴趣点类别层次结构;采用生成对抗训练使学习到的区域语义特征强调显著的兴趣点;采用Wide & Deep网络融合区域空间和区域语义两种视角,并将城市区域分类作为指定的任务定制整个模型。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
1、本发明提出一种基于兴趣点空间分布和语义信息的城市区域分类方法,通过构建区域的兴趣点语义树,对区域内人类活动的特征、模式和偏好进行编码,将城市区域特征学习的概念转换成学习兴趣点语义树的深度表示,利用自动编码器生成包含每棵兴趣点语义树信息的区域语义特征,并采用生成对抗的形式学习兴趣点语义树的显著子结构。因此,本发明能够感知每个区域内兴趣点的总体类别结构以及突出的区域语义子结构(例如,火车站可以构成一个区域的突出的分类子结构)。通过本发明的方法对城市区域进行分类,城市规划相关人员根据城市区域类型的分布情况,便于将工业园区规划在远离高密度人口居住的区域。同时,该方法可以为人类移动轨迹预测、面向用户的位置推荐等提供额外的辅助信息,具有重要的支撑作用。能够更好地帮助人们全面地了解城市,更便于城市规划和城市区域的有效管理,对促进生产、便利居民生活、改善生态环境、高效利用土地资源等具有重要意义。
2、本发明将整个区域表示为一个三维张量,利用卷积神经网络来捕捉兴趣点的局部位置关系,用于挖掘区域空间特征。因此,本发明能够感知区域中兴趣点的空间配置模式,并利用这些信息执行下游任务。
3、本发明利用Wide & Deep网络融合区域语义特征和区域空间特征,考虑了两种类型特征之间的交叉视角与深度交互。因此,本发明可以从兴趣点语义和空间配置的角度融合城市区域类型的信息,并在融合的过程使两种视角之间紧密互动。
4、相比于遥感图像与用户轨迹等数据,本发明的分类方法获取数据成本低、可以频繁更新,而且不易侵犯隐私,具有广阔的适应场景。
本发明附加方面的优点将在下面的描述中给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合附图,作详细说明如下。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明实施例的基于兴趣点空间分布和语义信息的城市区域分类方法的总体框架图。
图2是本发明实施例的兴趣点语义树的构造图。
图3是图1中“区域内兴趣点语义树”或“生成的兴趣点语义树”或图2中“区域内兴趣点语义树”示意图。
图4是图2中“兴趣点类别层次结构”示意图。
图5是本发明实施例的流程图。
为显示各部位位置而夸大了互相间间距或尺寸,示意图仅作示意使用。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
为了解决如上的技术问题,本发明提出了一种基于兴趣点空间分布和语义信息的城市区域分类方法。
如图5所示,首先,本发明通过区域内兴趣点分布以及兴趣点类别信息为每个城市区域构造一个三维张量,利用卷积神经网络(CNN)来捕捉兴趣点的局部位置关系,学习区域空间特征表示。然后,根据已知的兴趣点类别层次结构以及区域内所有兴趣点类别对每一个区域构造兴趣点语义树,再利用一种深度自动编码器挖掘兴趣点语义树,学习区域语义特征表示。为捕捉兴趣点语义树中的关键特征,本发明构造语义模式提取器来获取高权重节点组成的子树,并基于生成对抗的思想进行挖掘。接着,在特征融合模块,采用Wide &Deep网络结构对区域内的空间特征和语义特征进行特征融合,并利用区域融合特征进行城市区域类型预测。同时,区域的城市区域类型信息也可以回传给深度网络,进而增强区域特征表示。在测试阶段,本发明通过区域内兴趣点分布以及兴趣点类别信息构造区域三维张量与区域兴趣点语义树,将区域三维张量与区域兴趣点语义树分别传给卷积神经网络和自动编码器来获得区域空间特征和区域语义特征,然后传入Wide & Deep网络得到区域表征与预测的城市区域类型。
如图1-图5所示,基于兴趣点空间分布和语义信息的城市区域分类方法对城市区域进行表征与分类。总体框架如图1所示,由三个模块组成,第一个模块为区域空间特征挖掘模块,挖掘每个区域兴趣点的空间配置。第二个模块为区域语义特征挖掘模块,结合自动编码器和生成对抗网络(GAN)对每个区域的兴趣点类别信息进行编码和挖掘,既保留了整体的兴趣点类别信息,又强调了兴趣点类别结构中的突出部分。第三个模块为多源特征融合预测模块,使用一个Wide & Deep网络将两个视角(空间和语义)融合在一起,并利用区域融合特征对每个区域进行最终的城市区域类型预测。下文将按顺序具体介绍。
区域空间特征挖掘模块:不同的兴趣点空间配置(布局)有时会导致不同的城市区域类型。本发明首先获取目标城市范围以及城市内兴趣点经纬度信息和兴趣点类别信息,将研究范围(城市)划分为200m×200m的网格,每个网格单元作为一个区域,作为城市区域分类的基本单元。在这种情况下,可以自然地将每个区域视为一个图像,其中兴趣点散落在其上作为其图像内容。基于这种思路,本发明将每个区域视为图像像素(10×10)的拼接。如果一个像素包含一个或多个兴趣点,则给它分配一个兴趣点特征向量,该特征向量是该区域所有兴趣点最高级类别(即图2、图3、图4中兴趣点类别层次结构中父节点为根节点的所有类别)的one-hot向量的和。对于没有兴趣点的空像素,赋值为空特征向量。这样,通过整合网格区域内的兴趣点分布信息将每个区域表示为一个三维张量,即一个多通道图像,前两个维度是空间维度,第三个维度为兴趣点特征。只使用最高级类别的原因是使区域(多通道图像)在计算上易于处理。
每个区域都是一个多通道图像(一个三维张量),然后利用CNN来感知兴趣点空间配置。由于卷积算子可以从局部到全局层次地提取兴趣点之间的相邻程度,同时保留兴趣点的类别信息,因此采用CNN来感知兴趣点空间配置。CNN以区域的三维张量为输入,输出携带兴趣点空间分布信息的区域空间特征表示。形式上,给定一个区域(网格),将其三维张量输入到Net(·)中,得到了区域空间特征表示:
Figure 618677DEST_PATH_IMAGE001
其中,i用于表示第i个区域(i为自然数),下文中的i含义均相同,
Figure 68113DEST_PATH_IMAGE002
表示第i 个区域的空间特征表示,Net(·)表示一个CNN,r i 表示第i个区域的三维张量。
区域语义特征挖掘模块:区域内兴趣点语义树是一棵层次结构的树(区域内兴趣点语义树的构造如图2-图4所示),顶层是根节点,第二层是第一级兴趣点类别,叶子节点是最详细的兴趣点类别。对于每个区域,每个兴趣点都会增加其类别层次结构中的所有节点计数,然后我们采用词频-逆文档频率(TF-IDF)算法平滑节点计数,从而挖掘不同兴趣点类别对于城市区域的重要程度(权重)。直观上,更显著的兴趣点类别往往是稀疏的,如火车站,而不那么重要的兴趣点类别,如餐馆,则更有可能分散在城市的各个地方。在这种情况下,TF-IDF将高权重分配给很少出现的兴趣点类别,而低权重分配给频繁出现的类别。TF-IDF被定义为:
Figure 500232DEST_PATH_IMAGE003
其中,c表示兴趣点类别,TF(c)是类别c的频率,m是区域的总数(m为自然数),IDF(c)是包含类别c的区域的数量,log(·)表示对数函数。然后将TF-IDF平滑后的语义树扁平化,形成每个区域的类别特征向量。然后,对类别特征向量进行运算,以获得有效的区域语义特征表示。
首先利用深度自动编码器来保存区域内兴趣点语义树的整体结构。特别地,自动编码器Fauto包括一个编码器和一个解码器。编码器以扁平化区域内兴趣点语义树作为输入,输出密集嵌入向量来表示区域的语义信息。解码器以上述密集嵌入向量作为输入,并对语义树进行重构。编码器和解码器通过最小化语义树的重建目标来进行优化。这样,编码器和解码器之间的嵌入向量就能体现每个区域兴趣点类别的整体结构。形式上,通过将所有节点连接成一个向量来扁平化给定的区域内兴趣点语义树,用来表示树的全局结构。编码器输出的d维向量(d是区域表征的维度大小)则是本发明要学习的区域语义特征表示。编码器本质上是一个多层感知器(MLP),可以表示为:
Figure 390827DEST_PATH_IMAGE004
其中,
Figure 250199DEST_PATH_IMAGE005
表示编码器中在第i个区域的隐藏层1, 2, …, o输出的 潜在特征向量,o代表隐藏层的层数。σ表示sigmoid激活函数;W 1, W 2, …, W o+1 表示编码 器中隐藏层1, 2, …, o+1的权重;b 1, b 2,…, b o+1 表示编码器中隐藏层1, 2, …, o+1 的偏置,x i 表示第i个区域的原始兴趣点语义树,
Figure 859035DEST_PATH_IMAGE006
是第i个区域的语义特征表示。
随后,解码器以编码器的输出为输入,重构语义树(扁平化向量),解码器同样由MLP构成,可以表示为:
Figure 94844DEST_PATH_IMAGE007
其中,
Figure 105525DEST_PATH_IMAGE008
表示第i个区域的解码器中隐藏层o, o-1, …, 1 输出的潜在特征向量,
Figure 135798DEST_PATH_IMAGE009
表示解码器中隐藏层o+1, o, …, 1的权重,
Figure 231930DEST_PATH_IMAGE010
表示解码器中隐藏层o+1, o, …, 1的偏置,
Figure 5851DEST_PATH_IMAGE011
表示第i个区域的重建兴趣点语义树。
最大限度地减少第i个区域的原始兴趣点语义树和第i个区域的重建兴趣点语义 树之间的平方差损失,该部分损失函数
Figure 871039DEST_PATH_IMAGE012
如下:
Figure 72213DEST_PATH_IMAGE013
其中,x i 表示第i个区域的原始兴趣点语义树,
Figure 655641DEST_PATH_IMAGE011
表示第i个区域的重建兴趣点 语义树,m是区域的总数(m为自然数),
Figure 973533DEST_PATH_IMAGE014
表示L2范数。
自动编码器学习和保存了区域内兴趣点类别的整体结构,同时我们也希望强调和突出显著的兴趣点类别在区域中的表示。为此,已有技术往往考虑使用自动编码器的正则化技术来将最显著的兴趣点语义信息传递给特征表示,但这是不切实际的,因为最显著的兴趣点类别在不同的区域不同。如果学习的区域语义特征表示能够生成语义树的突出部分(表示子树),那么,这种特征表示可以在很大程度上反映出每个区域中最重要的兴趣点。因此,本发明利用生成对抗学习策略来实现这一目的,并使学习的特征表示在很大程度上反映更显著的兴趣点。
扁平化的区域内兴趣点语义树中保存了每个类别的TF-IDF权重,可以很自然地表 示每个区域中兴趣点的不同重要程度。本发明对每个语义树中的所有TF-IDF权重进行降序 排序,并生成一个显著的子树来表示该区域中最显著的兴趣点信息。这里的子树是一个向 量,它与扁平化的语义树具有相同的维数,但是除了前K大的那些元素,它的所有元素都是 0。对于原始语义树来说,这是一项微不足道的任务,但本发明的目标可以在重构的语义树 (解码器的输出)中实现这样的top K挖掘,这间接证明了学习到的区域语义特征表示可以 在很大程度上反映每个区域中最重要的兴趣点。但由于传统top K算法是不可微分的,所以 本发明利用一个简单的五层MLP构造预训练的语义模式提取器,用来代替传统top K算法挖 掘区域内兴趣点语义树中前K个TF-IDF权重的类别结点所构成的区域语义子树(简称子 树)。语义模式提取器以扁平化的语义树向量作为输入,输出的向量尽可能接近传统top K 算法得到的top K子树。对语义模式提取器进行预训练时,最小化语义模式提取器提取的子 树与传统top K算法得到的实际子树之间的平方差损失函数
Figure 958807DEST_PATH_IMAGE015
如下:
Figure 330882DEST_PATH_IMAGE016
其中,FtopK表示语义模式提取器,s i 表示第i个区域实际的兴趣点语义树,m是区域 的总数(m为自然数),
Figure 463923DEST_PATH_IMAGE014
表示L2范数。
对于重建的子树,我们利用对抗学习策略整合子树所包含的信息,使它们尽可能 像真实的子树,这样学习到的区域语义特征表示将真正“理解”每个区域中最显著的兴趣 点。生成器由自动编码器和预先训练的语义模式提取器连接组成,即解码器的输出作为语 义模式提取器的输入,生成重构的子树。将FG表示生成器,则生成器FG(·)=FtopK(Fauto (·))。判别器FD由一个三层MLP构成,它输出子树来自真实子树集而不是生成的子树集的 概率,它的训练目的是最大化对判断生成器生成的真实子树和重构子树的分类精度。同时, 生成器的训练目标是生成尽可能像真实子树的重构子树,使判别器对生成器生成的重构子 树集进行分类时的准确性最小化。生成器的损失函数
Figure 517330DEST_PATH_IMAGE017
可以表示为:
Figure 357110DEST_PATH_IMAGE018
其中,FD表示判别器,FG表示生成器,x i 表示第i个区域的原始兴趣点语义树,m是区域的总数(m为自然数),log(·)表示对数函数。
判别器的损失函数
Figure 900087DEST_PATH_IMAGE019
可以表示为:
Figure 254845DEST_PATH_IMAGE020
多源特征融合预测模块:每个区域都有空间特征表示和语义特征表示对其进行描述。在城市区域感知与分类中,这两种观点是互补的,应适当融合。一种直接的方式是简单地将每个区域的两种表征连接起来,但这种方法在感知两个视角之间的相互作用方面是不够的。因此,本发明利用Wide & Deep网络融合两种视图。它考虑了两种视图的连接(Deep层)和元素级交互(Wide层)。Wide & Deep网络有两个主要组件:Wide层和Deep层。
在Deep层,d维的区域空间特征表示与区域语义特征表示被连接并传递给一个一层的MLP,输出d维的的联合表示向量g i ,其表达式如下:
Figure 111942DEST_PATH_IMAGE021
其中,W 1表示Deep层的一层MLP的权重,b 1表示Deep层的一层MLP的偏差,
Figure 868546DEST_PATH_IMAGE002
是 第i个区域的空间特征表示,
Figure 520107DEST_PATH_IMAGE022
是第i个区域的语义特征表示,
Figure 627740DEST_PATH_IMAGE023
表 示第i个区域的空间特征表示和语义特征表示的连接。
在Wide层中,计算区域空间特征表示与区域语义特征表示的外积,生成了一个d×d维的矩阵。然后将矩阵展开为一个d2维的向量并传递给一个新的一层MLP来转换维度,得到d维的Wide层的联合表示向量u i ,其数学表达式如下:
Figure 22949DEST_PATH_IMAGE024
其中,W 2表示Wide层的一层MLP的权重,b 2表示Wide层的一层MLP的偏差,F表示一个扁平化函数,它将d×d维矩阵展开,转化为一个d2维向量。接着,将Wide层输出向量u i 与Deep层输出向量g i 连接,串联起来输入一个三层的MLP分类器用于城市区域分类。第i个区域属于每种城市区域类型的概率计算公式如下:
Figure 634059DEST_PATH_IMAGE025
其中,p i 表示第i个区域属于每种城市区域类型的概率,W 3W 4W 5分别表示MLP分类器的第1, 2, 3层的权重,b 3, b 4, b 5分别表示三层的MLP分类器第1, 2, 3层的偏差,(u i g i )表示第i个区域在Wide层输出向量和Deep层输出向量的连接,softmax(·)即归一化指数函数,是MLP分类器最后一层的激活函数。
这一模块利用城市区域类型最小化损失函数(交叉熵损失),将已知的城市区域类 型信息回传到模型的深度网络中,损失函数
Figure 722101DEST_PATH_IMAGE026
表示为:
Figure 51451DEST_PATH_IMAGE027
其中,m是区域的总数(m为自然数),z表示城市区域类型的数量(z为自然数),t ij 表示第i个区域是否属于类型jp ij 表示模型预测的第i个区域属于类型j的概率,log(·)表示对数函数。
发明的最终训练目标是前面提出的损失函数的结合:采用卷积神经网络挖掘区域 内兴趣点的空间配置,使区域空间特征包含每个区域的空间分布信息;采用自动编码器重 构目标,确保学习到的区域语义特征包含区域内整体兴趣点类别层次结构;采用生成对抗 训练使学习到的区域语义特征强调显著的兴趣点;采用Wide & Deep网络融合区域空间和 区域语义两种视角,并将城市区域分类作为指定的任务定制整个模型。总的来说,训练时目 标函数
Figure 250351DEST_PATH_IMAGE028
可以形式化为:
Figure 715968DEST_PATH_IMAGE029
其中,
Figure 974911DEST_PATH_IMAGE030
为损失函数
Figure 791557DEST_PATH_IMAGE031
的权重,
Figure 528569DEST_PATH_IMAGE032
为判别器的损失函数
Figure 114271DEST_PATH_IMAGE033
与 生成器的损失函数
Figure 544115DEST_PATH_IMAGE034
的权重,
Figure 582479DEST_PATH_IMAGE035
为损失函数
Figure 123181DEST_PATH_IMAGE036
的权重。本发明利用随机梯度下 降法对目标函数进行优化。
上述分类方法的实施步骤如下:
第一步,获取城市内兴趣点类别信息、经纬度信息和城市区域类型信息。建立固定大小的网格,统计网格内兴趣点信息以及网格所属的区域类型,并基于网格区域建立区域三维张量与区域内兴趣点语义树。
第二步,基于区域三维张量与区域内兴趣点语义树分别得到区域空间特征表示与 区域语义特征表示。最终通过基于Wide & Deep网络的多源特征融合预测模块融合两种特 征表示,输出区域属于每种城市区域类型的概率。通过训练,即最小化总的损失函数
Figure 828969DEST_PATH_IMAGE037
, 学习模型的参数。
第三步,当进行城市区域感知与区域类型预测时,输入相应区域的区域三维张量与区域内兴趣点语义树,即可得到区域的向量表示与该区域属于每种城市区域类型的概率,我们将最大概率的城市区域类型作为该区域的类型预测结果。
在四个真实的数据集上运行本发明的模型,由于数据集不平衡的本质,本发明使用准确度(Accuracy)、加权精确度(Weighted precision)、加权F1 (Weighted F1)和Kappa系数(Kappa)的指标来评估本发明的模型与几个现有模型的性能。
表1 本发明与现有模型的性能对比表
Figure 226452DEST_PATH_IMAGE038
如表1所示,除了里斯本数据集的准确度与加权精确度外,本发明的其余指标表现都优于其他对比模型。需要注意的是,在本任务中,由于不同城市区域类型的样本数量不平衡,加权精确度在本任务中的参考价值有限。一些模型在这种数据不平衡的情况下,预测结果更容易偏向于样本量大的类别而不是样本量小的类别。Kappa系数可以反映模型是否存在这种偏差。模型的这种偏差越强,模型的Kappa系数越低。本发明的Kappa系数的表现明显优于其他模型,说明本发明可以很好地处理这种不平衡数据。总的来说,与基于频率的模型(例如:支持向量机-SVM、潜在狄利克雷分配模型-LDA)或者基于空间的模型(例如Place2vec、Doc2vec和图卷积网络-GCN)相比,本发明不仅考虑了区域内的空间和语义信息,而且通过区域内兴趣点语义树挖掘多层语义信息,并通过语义模式提取器捕获最重要的语义信息,因此可以更好地描绘城市功能使用。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,包括:
获取目标城市范围以及城市内兴趣点经纬度信息和兴趣点类别信息,将目标城市网格划分为多个区域,根据兴趣点的经纬度信息和类别信息将每个区域表示为一个三维张量,将所述三维张量输入卷积神经网络中得到携带兴趣点空间分布的区域空间特征表示;
对每一个区域构造兴趣点语义树,对所述兴趣点语义树的兴趣点类别信息进行编码和挖掘,得到区域语义特征表示;
基于Wide & Deep网络融合所述区域空间特征表示和所述区域语义特征表示,输入到分类器对城市区域进行分类。
2.如权利要求1所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,所述三维张量为一个多通道图像,前两个维度是空间维度,第三个维度为兴趣点特征。
3.如权利要求2所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,将每个区域表示为一个三维张量包括:将每个区域视为图像像素的拼接,为每个像素分配一个兴趣点特征向量,该特征向量是该区域所有兴趣点最高级类别向量的和,对于没有兴趣点的空像素,赋值为空特征向量。
4.如权利要求1所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,给定一个区域,将其三维张量输入到Net(·)中,得到了区域空间特征表示。
5.如权利要求1所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,对每一个区域构造兴趣点语义树包括:根据已知的兴趣点类别层次结构以及分布在区域内的所有兴趣点对每一个区域构造兴趣点语义树。
6.如权利要求1所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,对所述兴趣点语义树的兴趣点类别信息进行编码包括:
自动编码器包括编码器和解码器,编码器以兴趣点语义树作为输入,输出一个嵌入向量;解码器以嵌入向量作为输入对语义树进行重构,编码器和解码器之间的嵌入向量即为区域语义特征表示。
7.如权利要求1所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,挖掘兴趣点语义树,挖掘不同兴趣点类别对于城市区域的重要程度,将高权重分配给整个城市区域很少出现的兴趣点类别,而低权重分配给整个城市区域频繁出现的类别。
8.如权利要求7所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,对每个语义树中的所有权重进行降序排序,根据top K生成一个显著的子树来表示该区域中最显著的兴趣点信息;
构造语义模式提取器,由MLP构成,用来提取兴趣点语义树中的显著子树;
构造以自动编码器与语义模式提取器构成的生成器,建立由MLP构成的判别器,通过生成对抗机制使区域语义特征有效保存兴趣点语义树中的显著子树信息。
9.如权利要求1所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,Wide & Deep网络包括Wide层和Deep层,在Deep层,两个d维表示向量被连接并传递给一个MLP来计算两个部分的联合表示,这个联合表示表示为一个深度向量;
在Wide层中,计算区域空间特征表示与区域语义特征表示的外积,生成了一个d×d维的矩阵,然后将矩阵展开为一个d2维的向量并传递给一个新的一层MLP来转换维度来计算两个部分联合表示的宽度向量;
将Wide层输出向量与Deep层输出向量连接,串联起来用于城市区域分类。
10.如权利要求6所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,采用自动编码器重构目标,确保学习到的区域语义特征包含区域内整体兴趣点类别层次结构;采用生成对抗训练使学习到的区域语义特征强调显著的兴趣点;采用Wide &Deep网络融合区域空间和区域语义两种视角,并将城市区域分类作为指定的任务定制整个模型。
CN202211463701.XA 2022-11-22 2022-11-22 一种基于兴趣点空间分布和语义信息的城市区域分类方法 Active CN115577294B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211463701.XA CN115577294B (zh) 2022-11-22 2022-11-22 一种基于兴趣点空间分布和语义信息的城市区域分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211463701.XA CN115577294B (zh) 2022-11-22 2022-11-22 一种基于兴趣点空间分布和语义信息的城市区域分类方法

Publications (2)

Publication Number Publication Date
CN115577294A true CN115577294A (zh) 2023-01-06
CN115577294B CN115577294B (zh) 2023-03-24

Family

ID=84588075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211463701.XA Active CN115577294B (zh) 2022-11-22 2022-11-22 一种基于兴趣点空间分布和语义信息的城市区域分类方法

Country Status (1)

Country Link
CN (1) CN115577294B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116052019A (zh) * 2023-03-31 2023-05-02 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) 适合于大区域高分辨率卫星影像的建成区高质量检测方法
CN116341567A (zh) * 2023-05-29 2023-06-27 山东省工业技术研究院 基于空间与语义邻居信息的兴趣点语义标注方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294790A (zh) * 2013-05-22 2013-09-11 西北工业大学 一种面向gps轨迹数据的时空语义索引与检索方法
CN106845559A (zh) * 2017-02-28 2017-06-13 山东师范大学 顾及poi数据空间异质性的地表覆盖验证方法及系统
CN108763293A (zh) * 2018-04-17 2018-11-06 平安科技(深圳)有限公司 基于语义理解的兴趣点查询方法、装置和计算机设备
CN110457420A (zh) * 2019-08-13 2019-11-15 腾讯云计算(北京)有限责任公司 兴趣点位置识别方法、装置、设备及存储介质
CN112579922A (zh) * 2020-12-24 2021-03-30 东北大学 一种基于用户轨迹的兴趣点推荐方法
US20210390392A1 (en) * 2020-06-15 2021-12-16 Naver Corporation System and method for processing point-of-interest data
CN113918837A (zh) * 2021-10-15 2022-01-11 山东大学 城市兴趣点类别表示的生成方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294790A (zh) * 2013-05-22 2013-09-11 西北工业大学 一种面向gps轨迹数据的时空语义索引与检索方法
CN106845559A (zh) * 2017-02-28 2017-06-13 山东师范大学 顾及poi数据空间异质性的地表覆盖验证方法及系统
CN108763293A (zh) * 2018-04-17 2018-11-06 平安科技(深圳)有限公司 基于语义理解的兴趣点查询方法、装置和计算机设备
CN110457420A (zh) * 2019-08-13 2019-11-15 腾讯云计算(北京)有限责任公司 兴趣点位置识别方法、装置、设备及存储介质
US20210390392A1 (en) * 2020-06-15 2021-12-16 Naver Corporation System and method for processing point-of-interest data
CN112579922A (zh) * 2020-12-24 2021-03-30 东北大学 一种基于用户轨迹的兴趣点推荐方法
CN113918837A (zh) * 2021-10-15 2022-01-11 山东大学 城市兴趣点类别表示的生成方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李明洁等: ""基于多特征随机森林算法的深圳市土地利用分类"", 《世界地质》 *
罗月童等: ""空间语义增强下的城市交通事故数据可视分析"", 《中国图象图形学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116052019A (zh) * 2023-03-31 2023-05-02 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) 适合于大区域高分辨率卫星影像的建成区高质量检测方法
CN116341567A (zh) * 2023-05-29 2023-06-27 山东省工业技术研究院 基于空间与语义邻居信息的兴趣点语义标注方法及系统
CN116341567B (zh) * 2023-05-29 2023-08-29 山东省工业技术研究院 基于空间与语义邻居信息的兴趣点语义标注方法及系统

Also Published As

Publication number Publication date
CN115577294B (zh) 2023-03-24

Similar Documents

Publication Publication Date Title
CN115577294B (zh) 一种基于兴趣点空间分布和语义信息的城市区域分类方法
Li et al. Big data in smart cities
Jiang et al. Geospatial analysis and modelling of urban structure and dynamics
Sava et al. Evaluating lost person behavior models
CN111008337B (zh) 一种基于三元特征的深度注意力谣言鉴别方法及装置
Law et al. An unsupervised approach to geographical knowledge discovery using street level and street network images
Liang et al. Revealing spatio-temporal evolution of urban visual environments with street view imagery
Scepanovic et al. Jane Jacobs in the sky: predicting urban vitality with open satellite data
Cao et al. Urban land use classification based on aerial and ground images
Tohidi et al. A review of the machine learning in gis for megacities application
Linard et al. Modelling changing population distributions: an example of the Kenyan Coast, 1979–2009
Bhuyan et al. Mapping and characterising buildings for flood exposure analysis using open-source data and artificial intelligence
Hameed et al. Convolutional Autoencoder‐Based Deep Learning Approach for Aerosol Emission Detection Using LiDAR Dataset
Aahlaad et al. An object-based image analysis of worldview-3 image for urban flood vulnerability assessment and dissemination through ESRI story maps
Hu et al. Room semantics inference using random forest and relational graph convolutional networks: A case study of research building
Wu et al. Per‐field urban land use classification based on tax parcel boundaries
Abraham et al. Classification and detection of natural disasters using machine learning and deep learning techniques: A review
Li Mapping urban land use by combining multi-source social sensing data and remote sensing images
CN117079148A (zh) 城市功能区的识别方法、装置、设备和介质
Eyelade et al. Impacts of spatiotemporal resolution and tiling on SLEUTH model calibration and forecasting for urban areas with unregulated growth patterns
Krishnan et al. Impact of land use and land cover change on the environmental quality of a region: A case of Ernakulam district in Kerala, India
Sun et al. Automatic building age prediction from street view images
Kiavarz et al. BIM-GIS oriented intelligent knowledge discovery
Castro et al. State of the art on artificial intelligence in land use simulation
CN114819344A (zh) 一种基于关键影响因子的全局时空气象农灾预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant