CN115577294A - 一种基于兴趣点空间分布和语义信息的城市区域分类方法 - Google Patents
一种基于兴趣点空间分布和语义信息的城市区域分类方法 Download PDFInfo
- Publication number
- CN115577294A CN115577294A CN202211463701.XA CN202211463701A CN115577294A CN 115577294 A CN115577294 A CN 115577294A CN 202211463701 A CN202211463701 A CN 202211463701A CN 115577294 A CN115577294 A CN 115577294A
- Authority
- CN
- China
- Prior art keywords
- semantic
- region
- interest point
- interest
- regional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/60—Planning or developing urban green infrastructure
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及数据挖掘技术领域,尤其涉及一种基于兴趣点空间分布和语义信息的城市区域分类方法,包括:获取目标城市范围以及城市内兴趣点经纬度信息和兴趣点类别信息,将目标城市网格划分为多个区域,将每个区域表示为一个三维张量,将所述三维张量输入卷积神经网络中得到携带兴趣点空间分布的区域空间特征表示;对每一个区域构造兴趣点语义树,对所述兴趣点语义树的兴趣点类别信息进行编码和挖掘,得到区域语义特征表示;基于Wide&Deep网络融合所述区域空间特征表示和所述区域语义特征表示,输入到分类器对城市区域进行分类。避免了使用用户数据造成的侵犯隐私问题,充分利用了空间数据的语义信息,实现了多种特征的充分融合。
Description
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种基于兴趣点空间分布和语义信息的城市区域分类方法。
背景技术
公开该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术。
城市是经济活动和创新的中心,其中存在着多种多样的功能区域。不同的功能区域分布着各种各样的兴趣点(Point of Interest,简称为POI)类别(如面馆、书店等)。城市功能区是城市居民从事各项社会经济活动的分布空间,如商业区、居住区、娱乐区等,由自然、社会、经济和历史等众多因素共同作用形成。城市区域特征和区域使用类型可以反映城市发展中潜在的自然和社会过程,可以为城市规划相关人员提供有效信息,以便制定城市规划和管理的重要决策。
现有的城市区域分类方法具有以下几种:①基于人类活动模式的感知:现有方法主要从用户的出租车轨迹或签到轨迹中挖掘人类移动模式来表征城市区域;②基于空间信息的感知:现有模型基于区域中兴趣点的空间模式与位置关系进行区域表示学习;③基于图像信息的感知:一些研究从区域的土地覆盖对象和物理环境的角度学习城市区域表示;④基于多种信息的感知:使用不同数据类型如图像、空间信息、轨迹信息和兴趣点中包含的文本信息等的组合来构建更稳健的模型。上述方法往往只依赖于兴趣点的空间分布数据,没有充分挖掘空间数据中蕴含的语义信息,造成部分信息丢失,导致城市区域分类结果不精确。
发明内容
针对现有技术存在的不足,本发明实施例的目的是提供一种基于兴趣点空间分布和语义信息的城市区域分类方法,充分挖掘了区域内兴趣点的空间分布信息以及兴趣点的语义信息,并将空间分布与语义信息充分融合,实现对城市区域更精准的分类。
为了实现上述目的,本发明实施例提供了如下技术方案:
一种基于兴趣点空间分布和语义信息的城市区域分类方法,包括:获取目标城市范围以及城市内兴趣点经纬度信息和兴趣点类别信息,将目标城市网格划分为多个区域,根据兴趣点的经纬度信息和类别信息将每个区域表示为一个三维张量,将所述三维张量输入卷积神经网络中得到携带兴趣点空间分布的区域空间特征表示;对每一个区域构造兴趣点语义树,对所述兴趣点语义树的兴趣点类别信息进行编码和挖掘,得到区域语义特征表示;基于Wide & Deep网络融合所述区域空间特征表示和所述区域语义特征表示,输入到分类器对城市区域进行分类。
优选的,所述三维张量为一个多通道图像,前两个维度是空间维度,第三个维度为兴趣点特征。
优选的,将每个区域表示为一个三维张量包括:将每个区域视为图像像素的拼接,为每个像素分配一个兴趣点特征向量,该特征向量是该区域所有兴趣点最高级类别向量的和,对于没有兴趣点的空像素,赋值为空特征向量。
优选的,给定一个区域,将其三维张量输入到Net(·)中,得到了区域空间特征表示。
优选的,对每一个区域构造兴趣点语义树包括:根据已知的兴趣点类别层次结构以及分布在区域内的所有兴趣点对每一个区域构造兴趣点语义树。
优选的,对所述兴趣点语义树的兴趣点类别信息进行编码包括:自动编码器包括编码器和解码器,编码器以兴趣点语义树作为输入,输出一个嵌入向量;解码器以嵌入向量作为输入对语义树进行重构,编码器和解码器之间的嵌入向量即为区域语义特征表示。
优选的,挖掘兴趣点语义树,挖掘不同兴趣点类别对于城市区域的重要程度,将高权重分配给整个城市区域很少出现的兴趣点类别,而低权重分配给整个城市区域频繁出现的类别。
优选的,对每个语义树中的所有权重进行降序排序,根据top K生成一个显著的子树来表示该区域中最显著的兴趣点信息;构造语义模式提取器,由MLP构成,用来提取兴趣点语义树中的显著子树;构造以自动编码器与语义模式提取器构成的生成器,建立由MLP构成的判别器,通过生成对抗机制使区域语义特征有效保存兴趣点语义树中的显著子树信息。
优选的,Wide & Deep网络包括Wide层和Deep层,在Deep层,两个d维表示向量被连接并传递给一个MLP来计算两个部分的联合表示,这个联合表示表示为一个深度向量;在Wide层中,计算区域空间特征表示与区域语义特征表示的外积,生成了一个d×d维的矩阵,然后将矩阵展开为一个d2维的向量并传递给一个新的一层MLP来转换维度来计算两个部分联合表示的宽度向量;将Wide层输出向量与Deep层输出向量连接,串联起来用于城市区域分类。
优选的,采用自动编码器重构目标,确保学习到的区域语义特征包含区域内整体兴趣点类别层次结构;采用生成对抗训练使学习到的区域语义特征强调显著的兴趣点;采用Wide & Deep网络融合区域空间和区域语义两种视角,并将城市区域分类作为指定的任务定制整个模型。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
1、本发明提出一种基于兴趣点空间分布和语义信息的城市区域分类方法,通过构建区域的兴趣点语义树,对区域内人类活动的特征、模式和偏好进行编码,将城市区域特征学习的概念转换成学习兴趣点语义树的深度表示,利用自动编码器生成包含每棵兴趣点语义树信息的区域语义特征,并采用生成对抗的形式学习兴趣点语义树的显著子结构。因此,本发明能够感知每个区域内兴趣点的总体类别结构以及突出的区域语义子结构(例如,火车站可以构成一个区域的突出的分类子结构)。通过本发明的方法对城市区域进行分类,城市规划相关人员根据城市区域类型的分布情况,便于将工业园区规划在远离高密度人口居住的区域。同时,该方法可以为人类移动轨迹预测、面向用户的位置推荐等提供额外的辅助信息,具有重要的支撑作用。能够更好地帮助人们全面地了解城市,更便于城市规划和城市区域的有效管理,对促进生产、便利居民生活、改善生态环境、高效利用土地资源等具有重要意义。
2、本发明将整个区域表示为一个三维张量,利用卷积神经网络来捕捉兴趣点的局部位置关系,用于挖掘区域空间特征。因此,本发明能够感知区域中兴趣点的空间配置模式,并利用这些信息执行下游任务。
3、本发明利用Wide & Deep网络融合区域语义特征和区域空间特征,考虑了两种类型特征之间的交叉视角与深度交互。因此,本发明可以从兴趣点语义和空间配置的角度融合城市区域类型的信息,并在融合的过程使两种视角之间紧密互动。
4、相比于遥感图像与用户轨迹等数据,本发明的分类方法获取数据成本低、可以频繁更新,而且不易侵犯隐私,具有广阔的适应场景。
本发明附加方面的优点将在下面的描述中给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合附图,作详细说明如下。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明实施例的基于兴趣点空间分布和语义信息的城市区域分类方法的总体框架图。
图2是本发明实施例的兴趣点语义树的构造图。
图3是图1中“区域内兴趣点语义树”或“生成的兴趣点语义树”或图2中“区域内兴趣点语义树”示意图。
图4是图2中“兴趣点类别层次结构”示意图。
图5是本发明实施例的流程图。
为显示各部位位置而夸大了互相间间距或尺寸,示意图仅作示意使用。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
为了解决如上的技术问题,本发明提出了一种基于兴趣点空间分布和语义信息的城市区域分类方法。
如图5所示,首先,本发明通过区域内兴趣点分布以及兴趣点类别信息为每个城市区域构造一个三维张量,利用卷积神经网络(CNN)来捕捉兴趣点的局部位置关系,学习区域空间特征表示。然后,根据已知的兴趣点类别层次结构以及区域内所有兴趣点类别对每一个区域构造兴趣点语义树,再利用一种深度自动编码器挖掘兴趣点语义树,学习区域语义特征表示。为捕捉兴趣点语义树中的关键特征,本发明构造语义模式提取器来获取高权重节点组成的子树,并基于生成对抗的思想进行挖掘。接着,在特征融合模块,采用Wide &Deep网络结构对区域内的空间特征和语义特征进行特征融合,并利用区域融合特征进行城市区域类型预测。同时,区域的城市区域类型信息也可以回传给深度网络,进而增强区域特征表示。在测试阶段,本发明通过区域内兴趣点分布以及兴趣点类别信息构造区域三维张量与区域兴趣点语义树,将区域三维张量与区域兴趣点语义树分别传给卷积神经网络和自动编码器来获得区域空间特征和区域语义特征,然后传入Wide & Deep网络得到区域表征与预测的城市区域类型。
如图1-图5所示,基于兴趣点空间分布和语义信息的城市区域分类方法对城市区域进行表征与分类。总体框架如图1所示,由三个模块组成,第一个模块为区域空间特征挖掘模块,挖掘每个区域兴趣点的空间配置。第二个模块为区域语义特征挖掘模块,结合自动编码器和生成对抗网络(GAN)对每个区域的兴趣点类别信息进行编码和挖掘,既保留了整体的兴趣点类别信息,又强调了兴趣点类别结构中的突出部分。第三个模块为多源特征融合预测模块,使用一个Wide & Deep网络将两个视角(空间和语义)融合在一起,并利用区域融合特征对每个区域进行最终的城市区域类型预测。下文将按顺序具体介绍。
区域空间特征挖掘模块:不同的兴趣点空间配置(布局)有时会导致不同的城市区域类型。本发明首先获取目标城市范围以及城市内兴趣点经纬度信息和兴趣点类别信息,将研究范围(城市)划分为200m×200m的网格,每个网格单元作为一个区域,作为城市区域分类的基本单元。在这种情况下,可以自然地将每个区域视为一个图像,其中兴趣点散落在其上作为其图像内容。基于这种思路,本发明将每个区域视为图像像素(10×10)的拼接。如果一个像素包含一个或多个兴趣点,则给它分配一个兴趣点特征向量,该特征向量是该区域所有兴趣点最高级类别(即图2、图3、图4中兴趣点类别层次结构中父节点为根节点的所有类别)的one-hot向量的和。对于没有兴趣点的空像素,赋值为空特征向量。这样,通过整合网格区域内的兴趣点分布信息将每个区域表示为一个三维张量,即一个多通道图像,前两个维度是空间维度,第三个维度为兴趣点特征。只使用最高级类别的原因是使区域(多通道图像)在计算上易于处理。
每个区域都是一个多通道图像(一个三维张量),然后利用CNN来感知兴趣点空间配置。由于卷积算子可以从局部到全局层次地提取兴趣点之间的相邻程度,同时保留兴趣点的类别信息,因此采用CNN来感知兴趣点空间配置。CNN以区域的三维张量为输入,输出携带兴趣点空间分布信息的区域空间特征表示。形式上,给定一个区域(网格),将其三维张量输入到Net(·)中,得到了区域空间特征表示:
区域语义特征挖掘模块:区域内兴趣点语义树是一棵层次结构的树(区域内兴趣点语义树的构造如图2-图4所示),顶层是根节点,第二层是第一级兴趣点类别,叶子节点是最详细的兴趣点类别。对于每个区域,每个兴趣点都会增加其类别层次结构中的所有节点计数,然后我们采用词频-逆文档频率(TF-IDF)算法平滑节点计数,从而挖掘不同兴趣点类别对于城市区域的重要程度(权重)。直观上,更显著的兴趣点类别往往是稀疏的,如火车站,而不那么重要的兴趣点类别,如餐馆,则更有可能分散在城市的各个地方。在这种情况下,TF-IDF将高权重分配给很少出现的兴趣点类别,而低权重分配给频繁出现的类别。TF-IDF被定义为:
其中,c表示兴趣点类别,TF(c)是类别c的频率,m是区域的总数(m为自然数),IDF(c)是包含类别c的区域的数量,log(·)表示对数函数。然后将TF-IDF平滑后的语义树扁平化,形成每个区域的类别特征向量。然后,对类别特征向量进行运算,以获得有效的区域语义特征表示。
首先利用深度自动编码器来保存区域内兴趣点语义树的整体结构。特别地,自动编码器Fauto包括一个编码器和一个解码器。编码器以扁平化区域内兴趣点语义树作为输入,输出密集嵌入向量来表示区域的语义信息。解码器以上述密集嵌入向量作为输入,并对语义树进行重构。编码器和解码器通过最小化语义树的重建目标来进行优化。这样,编码器和解码器之间的嵌入向量就能体现每个区域兴趣点类别的整体结构。形式上,通过将所有节点连接成一个向量来扁平化给定的区域内兴趣点语义树,用来表示树的全局结构。编码器输出的d维向量(d是区域表征的维度大小)则是本发明要学习的区域语义特征表示。编码器本质上是一个多层感知器(MLP),可以表示为:
其中,表示编码器中在第i个区域的隐藏层1, 2, …, o输出的
潜在特征向量,o代表隐藏层的层数。σ表示sigmoid激活函数;W 1, W 2, …, W o+1 表示编码
器中隐藏层1, 2, …, o+1的权重;b 1, b 2,…, b o+1 表示编码器中隐藏层1, 2, …, o+1
的偏置,x i 表示第i个区域的原始兴趣点语义树,是第i个区域的语义特征表示。
随后,解码器以编码器的输出为输入,重构语义树(扁平化向量),解码器同样由MLP构成,可以表示为:
其中,表示第i个区域的解码器中隐藏层o, o-1, …, 1
输出的潜在特征向量,表示解码器中隐藏层o+1, o,
…, 1的权重,表示解码器中隐藏层o+1, o, …, 1的偏置,表示第i个区域的重建兴趣点语义树。
自动编码器学习和保存了区域内兴趣点类别的整体结构,同时我们也希望强调和突出显著的兴趣点类别在区域中的表示。为此,已有技术往往考虑使用自动编码器的正则化技术来将最显著的兴趣点语义信息传递给特征表示,但这是不切实际的,因为最显著的兴趣点类别在不同的区域不同。如果学习的区域语义特征表示能够生成语义树的突出部分(表示子树),那么,这种特征表示可以在很大程度上反映出每个区域中最重要的兴趣点。因此,本发明利用生成对抗学习策略来实现这一目的,并使学习的特征表示在很大程度上反映更显著的兴趣点。
扁平化的区域内兴趣点语义树中保存了每个类别的TF-IDF权重,可以很自然地表
示每个区域中兴趣点的不同重要程度。本发明对每个语义树中的所有TF-IDF权重进行降序
排序,并生成一个显著的子树来表示该区域中最显著的兴趣点信息。这里的子树是一个向
量,它与扁平化的语义树具有相同的维数,但是除了前K大的那些元素,它的所有元素都是
0。对于原始语义树来说,这是一项微不足道的任务,但本发明的目标可以在重构的语义树
(解码器的输出)中实现这样的top K挖掘,这间接证明了学习到的区域语义特征表示可以
在很大程度上反映每个区域中最重要的兴趣点。但由于传统top K算法是不可微分的,所以
本发明利用一个简单的五层MLP构造预训练的语义模式提取器,用来代替传统top K算法挖
掘区域内兴趣点语义树中前K个TF-IDF权重的类别结点所构成的区域语义子树(简称子
树)。语义模式提取器以扁平化的语义树向量作为输入,输出的向量尽可能接近传统top K
算法得到的top K子树。对语义模式提取器进行预训练时,最小化语义模式提取器提取的子
树与传统top K算法得到的实际子树之间的平方差损失函数如下:
对于重建的子树,我们利用对抗学习策略整合子树所包含的信息,使它们尽可能
像真实的子树,这样学习到的区域语义特征表示将真正“理解”每个区域中最显著的兴趣
点。生成器由自动编码器和预先训练的语义模式提取器连接组成,即解码器的输出作为语
义模式提取器的输入,生成重构的子树。将FG表示生成器,则生成器FG(·)=FtopK(Fauto
(·))。判别器FD由一个三层MLP构成,它输出子树来自真实子树集而不是生成的子树集的
概率,它的训练目的是最大化对判断生成器生成的真实子树和重构子树的分类精度。同时,
生成器的训练目标是生成尽可能像真实子树的重构子树,使判别器对生成器生成的重构子
树集进行分类时的准确性最小化。生成器的损失函数可以表示为:
其中,FD表示判别器,FG表示生成器,x i 表示第i个区域的原始兴趣点语义树,m是区域的总数(m为自然数),log(·)表示对数函数。
多源特征融合预测模块:每个区域都有空间特征表示和语义特征表示对其进行描述。在城市区域感知与分类中,这两种观点是互补的,应适当融合。一种直接的方式是简单地将每个区域的两种表征连接起来,但这种方法在感知两个视角之间的相互作用方面是不够的。因此,本发明利用Wide & Deep网络融合两种视图。它考虑了两种视图的连接(Deep层)和元素级交互(Wide层)。Wide & Deep网络有两个主要组件:Wide层和Deep层。
在Deep层,d维的区域空间特征表示与区域语义特征表示被连接并传递给一个一层的MLP,输出d维的的联合表示向量g i ,其表达式如下:
在Wide层中,计算区域空间特征表示与区域语义特征表示的外积,生成了一个d×d维的矩阵。然后将矩阵展开为一个d2维的向量并传递给一个新的一层MLP来转换维度,得到d维的Wide层的联合表示向量u i ,其数学表达式如下:
其中,W 2表示Wide层的一层MLP的权重,b 2表示Wide层的一层MLP的偏差,F表示一个扁平化函数,它将d×d维矩阵展开,转化为一个d2维向量。接着,将Wide层输出向量u i 与Deep层输出向量g i 连接,串联起来输入一个三层的MLP分类器用于城市区域分类。第i个区域属于每种城市区域类型的概率计算公式如下:
其中,p i 表示第i个区域属于每种城市区域类型的概率,W 3,W 4,W 5分别表示MLP分类器的第1, 2, 3层的权重,b 3, b 4, b 5分别表示三层的MLP分类器第1, 2, 3层的偏差,(u i ,g i )表示第i个区域在Wide层输出向量和Deep层输出向量的连接,softmax(·)即归一化指数函数,是MLP分类器最后一层的激活函数。
其中,m是区域的总数(m为自然数),z表示城市区域类型的数量(z为自然数),t ij 表示第i个区域是否属于类型j,p ij 表示模型预测的第i个区域属于类型j的概率,log(·)表示对数函数。
发明的最终训练目标是前面提出的损失函数的结合:采用卷积神经网络挖掘区域
内兴趣点的空间配置,使区域空间特征包含每个区域的空间分布信息;采用自动编码器重
构目标,确保学习到的区域语义特征包含区域内整体兴趣点类别层次结构;采用生成对抗
训练使学习到的区域语义特征强调显著的兴趣点;采用Wide & Deep网络融合区域空间和
区域语义两种视角,并将城市区域分类作为指定的任务定制整个模型。总的来说,训练时目
标函数可以形式化为:
上述分类方法的实施步骤如下:
第一步,获取城市内兴趣点类别信息、经纬度信息和城市区域类型信息。建立固定大小的网格,统计网格内兴趣点信息以及网格所属的区域类型,并基于网格区域建立区域三维张量与区域内兴趣点语义树。
第二步,基于区域三维张量与区域内兴趣点语义树分别得到区域空间特征表示与
区域语义特征表示。最终通过基于Wide & Deep网络的多源特征融合预测模块融合两种特
征表示,输出区域属于每种城市区域类型的概率。通过训练,即最小化总的损失函数,
学习模型的参数。
第三步,当进行城市区域感知与区域类型预测时,输入相应区域的区域三维张量与区域内兴趣点语义树,即可得到区域的向量表示与该区域属于每种城市区域类型的概率,我们将最大概率的城市区域类型作为该区域的类型预测结果。
在四个真实的数据集上运行本发明的模型,由于数据集不平衡的本质,本发明使用准确度(Accuracy)、加权精确度(Weighted precision)、加权F1 (Weighted F1)和Kappa系数(Kappa)的指标来评估本发明的模型与几个现有模型的性能。
表1 本发明与现有模型的性能对比表
如表1所示,除了里斯本数据集的准确度与加权精确度外,本发明的其余指标表现都优于其他对比模型。需要注意的是,在本任务中,由于不同城市区域类型的样本数量不平衡,加权精确度在本任务中的参考价值有限。一些模型在这种数据不平衡的情况下,预测结果更容易偏向于样本量大的类别而不是样本量小的类别。Kappa系数可以反映模型是否存在这种偏差。模型的这种偏差越强,模型的Kappa系数越低。本发明的Kappa系数的表现明显优于其他模型,说明本发明可以很好地处理这种不平衡数据。总的来说,与基于频率的模型(例如:支持向量机-SVM、潜在狄利克雷分配模型-LDA)或者基于空间的模型(例如Place2vec、Doc2vec和图卷积网络-GCN)相比,本发明不仅考虑了区域内的空间和语义信息,而且通过区域内兴趣点语义树挖掘多层语义信息,并通过语义模式提取器捕获最重要的语义信息,因此可以更好地描绘城市功能使用。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,包括:
获取目标城市范围以及城市内兴趣点经纬度信息和兴趣点类别信息,将目标城市网格划分为多个区域,根据兴趣点的经纬度信息和类别信息将每个区域表示为一个三维张量,将所述三维张量输入卷积神经网络中得到携带兴趣点空间分布的区域空间特征表示;
对每一个区域构造兴趣点语义树,对所述兴趣点语义树的兴趣点类别信息进行编码和挖掘,得到区域语义特征表示;
基于Wide & Deep网络融合所述区域空间特征表示和所述区域语义特征表示,输入到分类器对城市区域进行分类。
2.如权利要求1所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,所述三维张量为一个多通道图像,前两个维度是空间维度,第三个维度为兴趣点特征。
3.如权利要求2所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,将每个区域表示为一个三维张量包括:将每个区域视为图像像素的拼接,为每个像素分配一个兴趣点特征向量,该特征向量是该区域所有兴趣点最高级类别向量的和,对于没有兴趣点的空像素,赋值为空特征向量。
4.如权利要求1所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,给定一个区域,将其三维张量输入到Net(·)中,得到了区域空间特征表示。
5.如权利要求1所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,对每一个区域构造兴趣点语义树包括:根据已知的兴趣点类别层次结构以及分布在区域内的所有兴趣点对每一个区域构造兴趣点语义树。
6.如权利要求1所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,对所述兴趣点语义树的兴趣点类别信息进行编码包括:
自动编码器包括编码器和解码器,编码器以兴趣点语义树作为输入,输出一个嵌入向量;解码器以嵌入向量作为输入对语义树进行重构,编码器和解码器之间的嵌入向量即为区域语义特征表示。
7.如权利要求1所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,挖掘兴趣点语义树,挖掘不同兴趣点类别对于城市区域的重要程度,将高权重分配给整个城市区域很少出现的兴趣点类别,而低权重分配给整个城市区域频繁出现的类别。
8.如权利要求7所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,对每个语义树中的所有权重进行降序排序,根据top K生成一个显著的子树来表示该区域中最显著的兴趣点信息;
构造语义模式提取器,由MLP构成,用来提取兴趣点语义树中的显著子树;
构造以自动编码器与语义模式提取器构成的生成器,建立由MLP构成的判别器,通过生成对抗机制使区域语义特征有效保存兴趣点语义树中的显著子树信息。
9.如权利要求1所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,Wide & Deep网络包括Wide层和Deep层,在Deep层,两个d维表示向量被连接并传递给一个MLP来计算两个部分的联合表示,这个联合表示表示为一个深度向量;
在Wide层中,计算区域空间特征表示与区域语义特征表示的外积,生成了一个d×d维的矩阵,然后将矩阵展开为一个d2维的向量并传递给一个新的一层MLP来转换维度来计算两个部分联合表示的宽度向量;
将Wide层输出向量与Deep层输出向量连接,串联起来用于城市区域分类。
10.如权利要求6所述的基于兴趣点空间分布和语义信息的城市区域分类方法,其特征在于,采用自动编码器重构目标,确保学习到的区域语义特征包含区域内整体兴趣点类别层次结构;采用生成对抗训练使学习到的区域语义特征强调显著的兴趣点;采用Wide &Deep网络融合区域空间和区域语义两种视角,并将城市区域分类作为指定的任务定制整个模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211463701.XA CN115577294B (zh) | 2022-11-22 | 2022-11-22 | 一种基于兴趣点空间分布和语义信息的城市区域分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211463701.XA CN115577294B (zh) | 2022-11-22 | 2022-11-22 | 一种基于兴趣点空间分布和语义信息的城市区域分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115577294A true CN115577294A (zh) | 2023-01-06 |
CN115577294B CN115577294B (zh) | 2023-03-24 |
Family
ID=84588075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211463701.XA Active CN115577294B (zh) | 2022-11-22 | 2022-11-22 | 一种基于兴趣点空间分布和语义信息的城市区域分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115577294B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116052019A (zh) * | 2023-03-31 | 2023-05-02 | 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) | 适合于大区域高分辨率卫星影像的建成区高质量检测方法 |
CN116341567A (zh) * | 2023-05-29 | 2023-06-27 | 山东省工业技术研究院 | 基于空间与语义邻居信息的兴趣点语义标注方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294790A (zh) * | 2013-05-22 | 2013-09-11 | 西北工业大学 | 一种面向gps轨迹数据的时空语义索引与检索方法 |
CN106845559A (zh) * | 2017-02-28 | 2017-06-13 | 山东师范大学 | 顾及poi数据空间异质性的地表覆盖验证方法及系统 |
CN108763293A (zh) * | 2018-04-17 | 2018-11-06 | 平安科技(深圳)有限公司 | 基于语义理解的兴趣点查询方法、装置和计算机设备 |
CN110457420A (zh) * | 2019-08-13 | 2019-11-15 | 腾讯云计算(北京)有限责任公司 | 兴趣点位置识别方法、装置、设备及存储介质 |
CN112579922A (zh) * | 2020-12-24 | 2021-03-30 | 东北大学 | 一种基于用户轨迹的兴趣点推荐方法 |
US20210390392A1 (en) * | 2020-06-15 | 2021-12-16 | Naver Corporation | System and method for processing point-of-interest data |
CN113918837A (zh) * | 2021-10-15 | 2022-01-11 | 山东大学 | 城市兴趣点类别表示的生成方法及系统 |
-
2022
- 2022-11-22 CN CN202211463701.XA patent/CN115577294B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294790A (zh) * | 2013-05-22 | 2013-09-11 | 西北工业大学 | 一种面向gps轨迹数据的时空语义索引与检索方法 |
CN106845559A (zh) * | 2017-02-28 | 2017-06-13 | 山东师范大学 | 顾及poi数据空间异质性的地表覆盖验证方法及系统 |
CN108763293A (zh) * | 2018-04-17 | 2018-11-06 | 平安科技(深圳)有限公司 | 基于语义理解的兴趣点查询方法、装置和计算机设备 |
CN110457420A (zh) * | 2019-08-13 | 2019-11-15 | 腾讯云计算(北京)有限责任公司 | 兴趣点位置识别方法、装置、设备及存储介质 |
US20210390392A1 (en) * | 2020-06-15 | 2021-12-16 | Naver Corporation | System and method for processing point-of-interest data |
CN112579922A (zh) * | 2020-12-24 | 2021-03-30 | 东北大学 | 一种基于用户轨迹的兴趣点推荐方法 |
CN113918837A (zh) * | 2021-10-15 | 2022-01-11 | 山东大学 | 城市兴趣点类别表示的生成方法及系统 |
Non-Patent Citations (2)
Title |
---|
李明洁等: ""基于多特征随机森林算法的深圳市土地利用分类"", 《世界地质》 * |
罗月童等: ""空间语义增强下的城市交通事故数据可视分析"", 《中国图象图形学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116052019A (zh) * | 2023-03-31 | 2023-05-02 | 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) | 适合于大区域高分辨率卫星影像的建成区高质量检测方法 |
CN116341567A (zh) * | 2023-05-29 | 2023-06-27 | 山东省工业技术研究院 | 基于空间与语义邻居信息的兴趣点语义标注方法及系统 |
CN116341567B (zh) * | 2023-05-29 | 2023-08-29 | 山东省工业技术研究院 | 基于空间与语义邻居信息的兴趣点语义标注方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115577294B (zh) | 2023-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115577294B (zh) | 一种基于兴趣点空间分布和语义信息的城市区域分类方法 | |
Li et al. | Big data in smart cities | |
Jiang et al. | Geospatial analysis and modelling of urban structure and dynamics | |
Sava et al. | Evaluating lost person behavior models | |
CN111008337B (zh) | 一种基于三元特征的深度注意力谣言鉴别方法及装置 | |
Law et al. | An unsupervised approach to geographical knowledge discovery using street level and street network images | |
Liang et al. | Revealing spatio-temporal evolution of urban visual environments with street view imagery | |
Scepanovic et al. | Jane Jacobs in the sky: predicting urban vitality with open satellite data | |
Cao et al. | Urban land use classification based on aerial and ground images | |
Tohidi et al. | A review of the machine learning in gis for megacities application | |
Linard et al. | Modelling changing population distributions: an example of the Kenyan Coast, 1979–2009 | |
Bhuyan et al. | Mapping and characterising buildings for flood exposure analysis using open-source data and artificial intelligence | |
Hameed et al. | Convolutional Autoencoder‐Based Deep Learning Approach for Aerosol Emission Detection Using LiDAR Dataset | |
Aahlaad et al. | An object-based image analysis of worldview-3 image for urban flood vulnerability assessment and dissemination through ESRI story maps | |
Hu et al. | Room semantics inference using random forest and relational graph convolutional networks: A case study of research building | |
Wu et al. | Per‐field urban land use classification based on tax parcel boundaries | |
Abraham et al. | Classification and detection of natural disasters using machine learning and deep learning techniques: A review | |
Li | Mapping urban land use by combining multi-source social sensing data and remote sensing images | |
CN117079148A (zh) | 城市功能区的识别方法、装置、设备和介质 | |
Eyelade et al. | Impacts of spatiotemporal resolution and tiling on SLEUTH model calibration and forecasting for urban areas with unregulated growth patterns | |
Krishnan et al. | Impact of land use and land cover change on the environmental quality of a region: A case of Ernakulam district in Kerala, India | |
Sun et al. | Automatic building age prediction from street view images | |
Kiavarz et al. | BIM-GIS oriented intelligent knowledge discovery | |
Castro et al. | State of the art on artificial intelligence in land use simulation | |
CN114819344A (zh) | 一种基于关键影响因子的全局时空气象农灾预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |