CN116244426A - 地理功能区识别方法、装置、设备及存储介质 - Google Patents
地理功能区识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116244426A CN116244426A CN202111480343.9A CN202111480343A CN116244426A CN 116244426 A CN116244426 A CN 116244426A CN 202111480343 A CN202111480343 A CN 202111480343A CN 116244426 A CN116244426 A CN 116244426A
- Authority
- CN
- China
- Prior art keywords
- poi data
- poi
- data
- vector
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/387—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种地理功能区识别方法、装置、设备及存储介质。该方法包括:获取待识别区域的道路图层数据和POI数据,基于道路图层数据将待识别区域划分为多个子区域,基于POI数据之间的空间距离确定符合上下文关系的POI数据对,基于POI数据的特征信息生成向量组并作为词向量训练模型的输入,得到POI数据的词向量,加权计算词向量得到子区域的分区向量,对分区向量进行聚类分析以确定子区域所属的功能区类别。本方案涉及的POI数据对选取符合社会经济活动规律和统计数据,根据POI数据对训练得到的词向量能更好地挖掘POI数据的空间分布特征等语义信息,为后续子区域功能区的识别提供支撑。
Description
技术领域
本发明涉及地理区域规划设计与研究领域,尤其涉及一种地理功能区识别方法、装置、设备及存储介质。
背景技术
功能区作为地理区域中的基本组成单元,是地理区域规划和管理的重要组成部分,功能区的识别对揭示地理区域的物理和社会特征至关重要。兴趣点(Point ofInterest,POI)主要指与人们生活密切相关、可以被抽象为点的地理实体,如政府、学校、医院、商场等,其具有数据量大、类别多、覆盖范围广、易于获取等优点,集地理位置和属性信息于一体,是人口、土地、经济、社会等地理功能区的相关要素相互作用的综合体现。
相关技术中,在利用POI数据进行地理功能区识别方面,往往仅通过计算POI的频数密度来判断区域的功能,将功能区识别为单一功能区和混合功能区,使得功能区识别结果往往偏向于数量较多且较为普遍的POI类型(如餐饮、购物、企事业),而无法有效地呈现出区域的功能。此外,传统的语义模型如LDA(Latent Dirichlet Allocation,隐狄立克雷分配)模型往往只考虑POI数据的潜在语义信息,不能结合POI数据丰富的信息实现准确的地理功能区识别。
发明内容
有鉴于此,本申请实施例提供了一种地理功能区识别方法、装置、设备及存储介质,旨在准确地识别地理功能区。
本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种地理功能区识别方法,包括:
获取待识别区域的道路图层数据和所述待识别区域内的兴趣点(POI)数据;
基于所述道路图层数据将所述待识别区域划分为至少两个子区域;
基于各所述POI数据之间的空间距离和距离阈值,确定符合上下文关系的POI数据对;
基于所述POI数据的特征信息生成所述POI数据对的向量组,所述向量组包括所述POI数据对中的两个POI数据各自对应的向量;
将各所述向量组输入词向量训练模型,学习得到各所述POI数据的词向量;
基于所述POI数据与所述子区域的对应关系,加权计算各所述子区域内的POI数据的词向量,得到各所述子区域的分区向量;
基于设定的聚类数对所述分区向量进行聚类分析,并根据所述聚类分析的聚类簇确定各所述子区域所属的功能区类别。
本发明实施例还提供了一种地理功能区识别装置,包括:
数据获取模块,用于获取待识别区域的道路图层数据和所述待识别区域范围内的兴趣点POI数据;
子区域划分模块,用于基于所述道路图层数据将所述待识别区域划分为至少两个子区域;
数据对确定模块,用于基于各所述POI数据之间的空间距离和距离阈值,确定符合上下文关系的POI数据对;
向量生成模块,用于基于所述POI数据的特征信息生成所述POI数据对的向量组,所述向量组包括所述POI数据对中的两个POI数据各自对应的向量;
词向量训练模块,用于将各所述向量组输入词向量训练模型,学习得到各所述POI数据的词向量;
分区向量计算模块,用于基于所述POI数据与所述子区域的对应关系,加权计算各所述子区域内的POI数据的词向量,得到各所述子区域的分区向量;
聚类分区模块,用于基于设定的聚类数对所述分区向量进行聚类分析,并根据所述聚类分析的聚类簇确定各所述子区域所属的功能区类别。
本发明实施例又提供了一种地理功能区识别设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器,用于运行计算机程序时,执行本发明实施例所述地理功能区识别方法的步骤。
本发明实施例还提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现本发明实施例所述地理功能区识别方法的步骤。
本发明实施例提供的技术方案,当两个POI数据之间的距离在距离阈值内时,判断两个POI数据符合上下文关系,距离阈值的设定与区域内社会经济活动规律和统计范围密切相关。将符合上下文关系的两个POI数据确定为POI数据对,并将POI数据对相应的向量组作为词向量训练模型的输入时,可以监督学习POI数据对的概率分布,从而更好地通过训练得到的词向量挖掘POI数据在地理空间分布的语义相关性。对模型训练得到的包含POI数据语义相关性的词向量加权计算得到子区域分区向量,最终通过对分区向量聚类分析实现对地理功能区的识别。
附图说明
图1为本申请实施例地理功能区识别方法的流程示意图;
图2为本申请实施例词向量训练模型参数调整的流程示意图;
图3为本申请实施例地理功能区识别装置的结构示意图;
图4为本申请实施例地理功能区识别设备的结构示意图;
图5为本申请实施例POI类分布特征图的示例图;
图6为本申请实施例POI类型不同维数语义空间可视化展示的示例图;
图7为本申请实施例词向量训练模型平均准确率(MAP)曲线的示例图;
图8为本申请实施例词向量训练模型损失曲线的示例图。
具体实施方式
下面结合附图及实施例对本申请再作进一步详细的描述。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释:
在地理信息系统中,一个兴趣点(POI,Point of Interest)数据可以是一栋房子、一个商铺、一个邮筒、一个公交站等。兴趣点可以分类,例如,可以自上而下分为一级、二级和三级的层级类别,每个分类都有相应的行业代码和名称对应,方便信息采集的记录和区分。
在自然语言处理任务中,首先需要考虑词如何在计算机中表示。通常,有两种表示方式:离散表示(one-hot representation)和分布式表示(distributionrepresentation)。离散表示把每个词表示为一个长向量,这个向量的维度是词表大小,向量中只有一个维度的值为1,其余维度为0,这个维度就代表了当前的词。分布式表示将词表示成一个定长的连续的稠密向量。
词嵌入指的是将词转化成一种分布式表示,又称词向量,词嵌入是自然语言处理(NLP)中语言模型与表征学习技术的统称。概念上而言,它是指把一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中,每个单词或词组被映射为实数域上的向量。
词向量具有良好的语义特性,是表示词语特征的常用方式。词向量每一维的值代表一个具有一定的语义和语法上解释的特征。所以,可以将词向量的每一维称为一个词语特征。
语言模型生成词向量是通过训练神经网络语言模型(NNLM,neural networklanguage model)进行的,词向量是语言模型的附带产出。神经网络语言模型背后的基本思想是对出现在上下文环境里的词进行预测,这种对上下文环境的预测本质上也是一种对共现统计特征的学习。较著名的采用神经网络语言模型生成词向量的方法有:连续词袋(CBOW)模型、跳字(skip-gram)模型,连续词袋模型的核心思想是利用某个词语的上下文预测这个词语,跳字模型与连续词袋模型正好相反,使用“出现的词”来预测“上下文”。这些模型为浅而双层的神经网络,用来训练以重新构建语言学之词文本。训练完成之后,词向量训练模型可用来映射每个词到一个词向量,可用来表示词与词之间的关系。
加权平均值即将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的单位数。加权平均值的大小不仅取决于总体中各单位的数值(变量值)的大小,而且取决于各数值出现的次数(频数),由于各数值出现的次数对其在平均数中的影响起着权衡轻重的作用,因此叫做权数。因为加权平均值是根据权数的不同进行的平均数的计算,所以又叫加权平均数。
在统计学中,肯德尔相关系数是以Maurice Kendall命名的,并经常用希腊字母τ(tau)表示其值。肯德尔一致性系数是用以反映多组变量之间关系密切程度的统计指标。一个肯德尔检验是一个无参数假设检验,它使用计算而得的相关系数去检验两个随机变量的统计依赖性。肯德尔相关系数的取值范围在-1到1之间,当τ为1时,表示两个随机变量拥有一致的等级相关性;当τ为-1时,表示两个随机变量拥有完全相反的等级相关性;当τ为0时,表示两个随机变量是相互独立的。
聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,数据聚类后被分类到不同的类或者簇,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析是一种探索性的分析,在分类的过程中,可以不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。
聚类算法又叫做“无监督分类”,其目的是将数据划分成有意义或有用的组(或簇)。k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法。
轮廓系数(Silhouette Coefficient),是聚类效果好坏的一种评价方式,它结合内聚度和分离度两种因素。可以用来在相同原始数据的基础上用来评价不同算法、或者算法不同运行方式对聚类结果所产生的影响。
聚类的目标通常用一个目标函数表示,该函数依赖于点之间,或点到簇的质心的邻近性;如:最小化每个点到最近质心的距离的平方。使用误差的平方和(SSE,也称为散布)作为度量聚类质量的目标函数,计算每个数据点的误差,即它到最近质心的欧几里得距离,然后计算误差的平方和。
霍普金斯统计量(Hopkins Statistic)是一种空间统计量,检验空间分布的变量的空间随机性。如果整个样本空间是一个均匀的、没有聚类趋势(聚簇不明显)的空间,那么霍普金斯统计量数值为0.5左右。反之,如果是有聚类趋势(聚簇明显)的空间,那么霍普金斯统计量数值接近于1。
相关技术中,利用POI数据进行地理功能区识别,仅通过计算POI的频数密度来判断区域的功能,无法有效地呈现出区域的功能。此外,传统的语义模型如LDA模型往往只考虑POI数据的潜在语义信息,不能结合POI数据丰富的信息实现准确的地理功能区识别。
基于此,在本申请的各种实施例中,通过设置POI数据对的选取规则,基于POI数据的特征信息将POI数据对生成向量组并作为词向量训练模型的输入,学习POI数据对的概率分布,训练得到的词向量包含POI数据在地理空间内的语义信息,在此基础上对词向量加权计算可以得到子区域的分区向量,聚类分析子区域的分区向量,再根据聚类结果确定子区域所属的功能区类别。
本申请实施例提供了一种地理功能区识别方法,如图1所示,该地理功能区识别方法包括:
步骤101,获取待识别区域的道路图层数据和待识别区域内的POI数据。
这里,待识别区域为需要确定地理功能区类别的地理区域,可以为城市区域,也可以为乡镇区域。
这里,POI数据为待识别区域内特定位置的点数据,根据POI数据的属性内容可以确定特定空间位置的社会功能属性。
这里,对待识别区域内各类别POI数据的数量进行统计与排序,统计结果显示POI数据遵循幂律分布:即少数类型的POI数据占主导,对应自然语言中的高频词,大部分类型的POI数据对应自然语言中的低频词,由此可以认定地理空间中的POI数据与自然语言中的单词相对应。通过将POI数据类比自然语言中的单词,可以通过获取包含POI语义信息的词向量,进而挖掘区域内POI数据的空间分布概率和区域属性信息。
实际应用中,还可以类比自然语言词嵌入方法,构建包含各子区域POI数据的语料库。
步骤102,基于道路图层数据将待识别区域划分为至少两个子区域。
这里,道路图层数据可以为地理信息系统中包含了待识别区域内所有道路的数据集,依靠多条道路数据能将待识别区域按照道路边界划分为多个子区域。
实际应用中,可以基于城镇主干道将待识别区域划分为多个子区域,也可以基于非城镇主干道对待识别区域进行划分,可以单独利用道路图层数据将待识别区域划分为多个子区域,还可以将道路图层数据与栅格网络结合划分待识别区域为多个子区域。
实际应用中,基于道路图层数据将待识别区域划分为至少两个子区域,其划分过程可以包括:首先获取城市水体面状数据,利用软件工具或插件去除研究的城市区域的水体区域(河流、湖泊不参与计算);接着,获取待识别区域的道路数据,利用软件工具或插件生成道路图层数据,并将待识别区域划分为至少两个子区域,该子区域可以是交通分析小区(TAZ,Traffic Analysis Zone),也可以是基于其它规格尺度划分的区域。示例性地,还可以去除面积小于设定阈值(例如,1000平方米)的子区域,从而可以去除划分过程中产生的碎屑区域,得到有效的子区域。
步骤103,基于各POI数据之间的空间距离和距离阈值,确定符合上下文关系的POI数据对;
这里,距离阈值可以根据距离阈值范围内POI数据的统计数量确定,也可以根据地区的社会经济活动规律来确定。
实际应用中,可以设定一个距离阈值来定义“中心POI数据和上下文POI数据”这样的POI数据对,统计具有一定上下文POI数据数量的比例与距离阈值之间的关系。例如,当距离阈值增加到500米时,相邻POI数据数量超过设定间隔(20、40、60、80、100)的兴趣点的比例都达到较高的水平,意味着距离阈值为500米时可以捕获足够多的POI数据对。
在一些实施例中,POI数据包括地理位置信息,基于各POI数据之间的空间距离和距离阈值,确定符合上下文关系的POI数据对,包括:
基于各POI数据的地理位置信息计算任意两个POI数据之间的空间距离;
统计空间距离小于或等于距离阈值的成对POI数据,作为符合上下文关系的POI数据对。
在一应用示例中,POI数据包含的地理位置信息为经纬度,可以直接根据经纬度计算两个POI数据之间的距离,也可以先将经纬度转换成平面投影坐标系的坐标再计算两个POI数据之间的空间距离。
在一应用示例中,POI数据包含的地理位置信息为投影坐标,基于投影坐标可以计算两个POI数据之间的空间距离。
实际应用中,根据待识别区域子区域规格大小和/或识别精度要求,可以选择直接使用经纬度或者投影坐标计算两个POI数据之间的空间距离,也可以将经纬度转换为投影坐标后再计算两个POI数据之间的空间距离。
实际应用中,基于两个POI数据的经纬度计算空间距离,可以通过经纬度与长度的换算关系计算,也可以利用经纬度计算距离的现有公式进行计算,还可以利用外部的工具软件或内置的功能插件将经纬度信息转换成空间距离。
实际应用中,可以根据需要将距离阈值设置为200米到500米的范围。
步骤104,基于POI数据的特征信息生成POI数据对的向量组,向量组包括POI数据对中的两个POI数据各自对应的向量。
这里,POI数据的特征信息可以将各POI数据与其余POI数据区分开来。向量是指将POI数据的特征信息数值化后得到的可以表征各POI数据的向量表示,该向量的维数等于待识别区域POI数据的总数,因此该向量维数通常很高,且属于稀疏向量,无法用来计算彼此之间的语义相关性。
这里,向量组包括两个向量,示例性地,第k个POI数据对包括符合上下文关系的第i个POI数据和第j个POI数据,第i个POI数据向量化表示后为向量vi,第j个POI数据向量化表示后为向量vj,则向量组vk中为(vi,vj)两个向量。
在一些实施例中,基于POI数据的特征信息生成POI数据对的向量组,包括:
对POI数据的特征信息进行编码,生成与POI数据一一对应的向量,特征信息至少包括:地理位置信息和POI多级类别;
基于POI数据与向量的对应关系,以及POI数据对的上下文关系,生成POI数据对的向量组。
这里,POI数据可以包括:名称、地址名称、经纬度、所属区划、POI多级类别等信息,POI数据的特征信息至少包括地理位置信息和POI多级类别。
这里,POI多级类别是指逐级细分的多级POI分类,POI分类是树状的层次结构,低层次的POI类型蕴含的语义信息更加丰富和具体,更加有利于基于POI类型语义的地理功能区分析。例如,某个网吧店名叫“A网吧”,其在POI多级类别中体现为:一级分类结果为“体育休闲服务”,二级分类结果为“娱乐场所”,三级分类结果为“网吧”。
需要说明的是,早期的POI多级分类可能只有两类,而为了更好地对POI数据进行分类,POI分类也可能多于三级,POI多级类别并不受上述举例内容部分的限制。
这里,可以使用独热(one-hot)向量编码POI数据的特征信息。
步骤105,将各向量组输入词向量训练模型,学习得到各POI数据的词向量。
这里,词向量训练模型可以用于将输入的每一个稀疏的高维的向量嵌入到一个维数较低的权重矩阵,学习每个POI数据对的概率分布,基于训练好的词向量模型可以得到每个POI数据的词向量。
这里,词向量训练模型可以是跳字模型,也可以是适用于POI数据语义识别的其它神经网络语言模型。
在一些实施例中,将各向量组输入词向量训练模型,学习得到各POI数据的词向量,包括:
将各向量组作为各单个训练样本,生成包含各向量组的训练样本集,并将训练样本集作为词向量训练模型的输入;
各向量经词向量训练模型学习词嵌入,得到各POI数据的词向量。
这里,文档中单词的频率与排列顺序反映了该文档的特定上下文关系和语义,将待识别区域类比为一个语料库,地理空间中的POI数据所属的类别视为单词,根据处于地理空间中的中心POI数据来预测周围POI数据的词嵌入。通过预测给定中心词POI数据类型的上下文(即相邻)POI数据类型的概率分布来学习POI数据类型的嵌入。训练集中的每个POI数据被视为“中心POI数据”,其相邻POI数据被视为“上下文POI数据”。背后的思想为“地点可以由相邻地点来分类”,这与语言学中的假设“你应该通过一个词所拥有的周围词来认识这个词”类似。每个中心POI数据的上下文POI数据可以通过它们在地理空间上的空间邻近度来定义,然后提取地理空间中所有“中心POI数据,上下文POI数据”数据对的向量组作为词向量训练模型的输入。
这里,把区域看作文档,把地理功能区土地利用类型看作主题,把待识别区域内部POI数据看作基本词,那么一个待识别区域内POI数据的空间分布就可以看作文档中的词序列。因此,基于POI数据的序列和地理功能区类型之间的关系可以通过一个连续的空间语言模型进行量化。通过挖掘上下文关系的潜在关系,可以更好的挖掘POI数据内部的信息。利用POI数据的空间分布度量得到其末级类别的潜在分布特征,进而检测和提取首级类别作为地理功能区类别判断的依据。
在一应用示例中,可以根据训练得到的POI数据的词向量,计算POI类语义相似度,可以根据计算结果判断POI类语义相似度是否得到了捕捉。模型训练完之后,还可以根据得到的POI类语义相似度序列对模型训练效果进行检验。表1所示为POI类语义相似度序列。
表1 POI类语义相似度序列
这里,可以将待识别区域内所有POI数据构成的数据集中的每个POI数据视为中心POI数据,并且在距中心POI数据一定距离内的POI数据被选为与其对应的上下文POI数据,可以充分利用周围信息来决定中心POI数据的语义特征,有利于捕捉POI数据更靠近中心POI数据的潜在语义。
在一应用示例中,词向量训练模型可以为包括输入层、输出层的跳字模型,由于输入的向量组中对应了两个POI数据的向量,且两个POI数据互为中心词和背景词,因此,在使用跳字模型训练POI数据的词向量时,可以认为中心词和背景词都是确定的,此时训练样本的输入可以被用来训练模型的神经网络,通过遍历训练样本集中的所有训练样本,不断迭代更新模型参数,最终从训练好的词向量训练模型中得到更准确的词向量。
步骤106,基于POI数据与子区域的对应关系,加权计算各子区域内的POI数据的词向量,得到各子区域的分区向量。
这里,可以基于词向量训练模型得到的词向量,以及POI数据包含的地理位置信息,确定POI数据与子区域的对应关系,基于该对应关系加权计算子区域内POI数据的词向量,可以得到子区域的分区向量。
这里,将子区域视为文档,POI数据的词向量视为单词,使用词向量的加权平均值代表子区域的功能特征,代表子区域功能特征的分区向量通过下式计算:
其中,type(vi,k)表示第i个子区域(Sub-Regions,SR)中第k个POI数据的词向量,N表示子区域中词向量的总数。
这里,通过计算子区域中词向量的加权平均值,子区域分区向量可以成为被赋予含有具体意义的语义向量。
步骤107,基于设定的聚类数对分区向量进行聚类分析,并根据聚类分析的聚类簇确定各子区域所属的功能区类别。
这里,可以利用K-means算法对子区域的分区向量进行聚类,聚类数K被设为从2到20,分别计算其轮廓系数(Silhouette Coefficient)和簇内误方差(SSE),以确定最佳的聚类数从而进行子区域分区向量的聚类。
这里,可以根据地理功能区识别精度要求设置聚类数,聚类数可以与地理功能区类别总数相同或者呈正相关。
这里,可以判断子区域分区向量在空间上是否呈现非均匀分布,即是否呈现簇状分布,计算所有子区域分区向量对应的霍普金斯统计量,其值越高说明子区域特征的分区向量表现出明显的非均匀分布,具有较好的聚类趋势。
这里,可以根据各子区域分区向量聚类后的聚类簇大小,确定数量最多的末级类别POI数据形成的聚类簇为表征子区域功能的簇,以末级类别所从属的首级类别作为该簇的功能类别,并结合该簇的功能类别确认子区域的地理功能区类别。
在一些实施例中,POI数据包括:逐级细分的至少两级类别,其中,各级类别均为多个;该方法还包括:
基于聚类分析的聚类簇,计算各子区域内各首级类别的POI数据的密度数据,密度数值用于反映各首级类别的POI数据在聚类簇中的密度权重值;
基于聚类分析的聚类簇,计算子区域内各首级类别的POI数据的富集因子,富集因子用于反映各首级类别的POI数据在聚类簇中的富集程度;
相应地,根据聚类分析的聚类簇确定各子区域所属的功能区类别,包括:
针对各子区域,对聚类簇中POI数据的数量与POI数据的密度权重值和/或富集因子进行加权求和,选取求和值最大的聚类簇所属类别,作为相应子区域所属的功能区类别。
这里,可以计算每个子区域内各首级类别POI数据的密度,以反映各首级类别POI数据在各子区域聚类簇中的权重,计算公式如下:
其中,di q表示子区域聚类簇i中类别为q的POI数据的密度,Ni q表示类别q中的POI数据的数量,Ai表示子区域聚类簇i的子区域的总面积。
这里,还可以计算子区域内各首级类别的POI数据的富集因子,富集因子反映各首级类别的POI数据在聚类簇中的富集程度,可以用来降低高密度分布的如餐饮、购物等首级类型POI数据对子区域识别的影响,公式如下:
其中,EFi q表示首级类别为q的POI数据在第i类子区域聚类簇中的富集因子,Ni q表示第i类子区域聚类簇中首级类别为q的POI数据的数量,Ni表示聚类簇i中POI数据的总数量,Nq表示首级类别为q的POI数据的总数,N是待识别区域中POI数据的总数。
在一些实施例中,基于聚类分析的聚类簇,可以计算各子区域内各首级类别的POI数据的密度数据,密度数值用于反映各首级类别的POI数据在聚类簇中的密度权重值,针对各子区域,对聚类簇中POI数据的数量与POI数据的密度权重值进行加权求和,选取求和值最大的聚类簇所属类别,作为相应子区域所属的功能区类别。
在一些实施例中,基于聚类分析的聚类簇,可以引入富集因子指标对聚类簇中高密度分布的各所述首级类别POI数据进行加权,针对各子区域,对聚类簇中POI数据的数量与POI数据的富集因子进行加权求和,选取求和值最大的聚类簇所属类别,作为相应子区域所属的功能区类别。
在一些实施例中,基于聚类分析的聚类簇,可以计算各子区域内各首级类别的POI数据的密度数据,密度数值用于反映各首级类别的POI数据在聚类簇中的密度权重值,还可以引入富集因子指标对聚类簇中高密度分布的各所述首级类别POI数据进行加权,针对各子区域,对聚类簇中POI数据的数量与POI数据的密度权重值及富集因子进行加权求和,选取求和值最大的聚类簇所属类别,作为相应子区域所属的功能区类别。
在一应用示例中,POI数据的密度不能完全反映每个子区域聚类的特征,因为某些首级类型的POI数据可能在整个待识别区域范围内都具有较高的密度,如“餐饮服务”和“生活服务”。它们在整个待识别区域内的高密度分布对确定子区域聚类簇所属的具体功能具有干扰性。此时,可以在密度权重值的基础上加入富集因子,从而降低某些高密度分布的首级类型的POI数据对功能区识别结果的影响。
在一应用示例中,可以根据聚类结果计算得到各子区域聚类簇中各首级类别POI数据的密度和富集因子,绘制子区域聚类簇中POI类别的分布特征图,对子区域聚类簇所属的地理功能区进行分析和标识,下表为整理出的子区域聚类簇中POI类的密度权重值和富集因子,可以根据表2内容直观地分析每个簇的分区导向。
表2子区域聚类簇密度权重值和富集因子
将表2数据输入专业制图和数据分析软件,可以绘制出占比导向型的POI类分布特征图,该分布特征图可以是图5所示形式。
在一些实施例中,该方法还包括:
基于各子区域所属的功能区类别,对各子区域进行分区显示。
这里,根据聚类分析和功能区识别的结果,绘制子区域聚类簇中的POI类别分布特征图,对子区域聚类簇所属的具体地理功能区进行标识和展示。
实际应用中,可以采用单一颜色对属于相同地理功能区的子区域进行渲染,得到整个待研究区域中的分区显示结果,还可以对各子区域中代表主要功能的聚类簇和次要功能的其他聚类簇进行立体化展示,采用相同颜色或相同元素对相同POI类别聚类簇进行标示。
在一些实施例中,该方法还包括:
将词向量训练模型训练得到的词向量映射到二维语义空间中,属于相同首级类别的POI类型使用相同的颜色渲染,以便直观显示POI类之间的关系。
实际应用中,可以使用降维算法将语义向量维度为40、60、80、100时训练得到的所有POI类型的词向量映射到二维语义空间中,得到不同维度下POI类型的语义空间,该语义空间可以如图6所示实现可视化展示。
在一应用示例中,还可以将功能区识别结果与采样识别结果进行对比验证,根据二者的符合程度评价基于本发明技术方案的功能区识别结果准确率。
相对于自然语义识别所使用的庞大的语料库而言,基于待识别区域获取到的所有兴趣点POI数据构建的语料库存在规模小的缺点,不利于POI数据语义相关性的挖掘和利用,因此,本技术方案还采用了提高POI数据词向量训练准确性的技术手段。
基于此,在一些实施例中,POI数据包括:逐级细分的至少两级类别,其中,各级类别均为多个;如图2所示,该方法还包括:
步骤201,采用语义相似性度量方法,计算至少两个末级类别之间的语义相似性,得到第一POI类语义相似性序列;
这里,语义相似性度量方法包括基于分布的语义相似性度量,以及基于信息内容的语义相似性度量:
第一种基于分布的语义相似性度量方法计算表达式如下:
tics被定义为类t1和类t2的最近公共父类。N1是从t1到tics的最短路径,N2是从t2到tics的最短路径,N3是tics到根节点的最短路径。
第二种基于分布的语义相似性度量方法计算表达式如下:
其中,D是分类层次结构的最大深度,N是类型t1和t2间的最短路径。
第一种基于信息内容的语义相似性度量方法计算表达式如下:
第二种基于信息内容的语义相似性度量方法计算表达式如下:
其中,IC是每个节点类型对应的信息内容,tics被定义为类t1和类t2的最近公共父类。
这里,基于两种度量方法与其各自对应的两种计算公式,对应四种评估方法,因此,可以组合使用上述四种评估方法对POI分类体系中导出的原始层次结构进行评估,具体指选择至少两个属于相同末级类别的POI类别,计算其语义相似性,得到四组结果,利用肯德尔一致性系数来评估四种度量方法排名的一致性,当平均肯德尔系数较高时,表明这些指标之间所得到的相似性排序几乎完全一致。根据评估后的四组计算结果得到第一POI类语义相似性序列。
步骤202,基于词向量训练模型的训练结果,计算符合上下文关系的POI数据对之间的语义相似性,得到第二POI类语义相似性序列;
这里,通过词向量训练模型,可以学习到所有POI数据的词向量,它们的语义关系和语义相似度体现在它们的词嵌入之间的关系,使用余弦相似度可以计算POI数据词向量之间的语义相关性,余弦相似度公式如下所示:
其中,Sim(x,y)表示POI数据的词向量x和词向量y之间的语义相似度,语义相似度的取值在1和-1之间。对于每个目标POI数据类型,根据余弦相似度公式,我们也可以方便的计算出它与其余POI数据类型语义相似性大小,并根据语义相似性的大小得到与第二POI类语义相似度序列。
步骤203,基于第一POI类语义相似性序列加权计算得到第一语义相似度;
步骤204,基于第二POI类语义相似性序列加权计算得到第二语义相似度;
这里,对于每一个目标POI数据对应的类别,可以通过基于层次结构的语义相似性度量方法,获得与其最相似的第一POI类语义相似度序列,而根据POI数据的词向量之间的语义相似度可以得到第二POI类语义相似度序列。分别对这两个序列中的数据加权求和,得到第一语义相似度和第二语义相似性度。
步骤205,基于第一语义相似度和第二语义相似度的比较结果,调整词向量训练模型的训练参数,训练参数包括以下至少之一:向量维度和训练轮数。
这里,词向量训练的目标,可以是使基于模型训练后的词向量计算得到的第二语义相似度更接近第一语义相似度,而词向量训练模型中向量维数和训练轮数的设置,一定程度上与训练得到的词向量准确性呈正相关,因此,基于第一语义相似度和第二语义相似性度的比较结果,调整词向量训练模型的训练参数,可以得到更准确的词向量。
这里,词向量训练模型的向量维数设置范围为40到100,步长为10,模型训练轮数为0到200。在模型训练中,可以设定目标检测评价指标,绘制如下图7所示的平均准确率(MAP)曲线,观察当词向量维度达到多少时,整个训练过程取得效果最好。设置模型训练轮数,随着模型训练轮数的增加,平均准确率(MAP)得分逐渐增大,在训练后期,平均准确率(MAP)增大趋势逐渐放缓,说明词向量的准确性逐渐提高并趋于稳定。
这里,在训练前期,模型快速收敛,而后逐渐趋于平稳,模型训练损失曲线最终稳定时,模型训练结束且模型训练效果较好,损失曲线如图8所示。
这里,词向量模型训练完之后,可以得到词向量排序,对模型训练效果进行检验,根据得到的POI类型的词嵌入,计算POI类型的语义相似度。根据计算结果判断POI类型的语义相似度是否得到捕捉。
为了实现本申请实施例的方法,本申请实施例还提供一种地理功能区识别装置,该地理功能区识别装置与上述地理功能区识别方法对应,上述地理功能区识别方法实施例中的各步骤也完全适用于本地理功能区识别装置实施例。
如图3所示该装置包括:数据获取模块301、子区域划分模块302、数据对确定模块303、向量生成模块304、词向量训练模块305、分区向量计算模块306及聚类分区模块307,其中,数据获取模块301用于获取待识别区域的道路图层数据和待识别区域内的兴趣点POI数据;子区域划分模块302用于基于道路图层数据将待识别区域划分为至少两个子区域;数据对确定模块303用于基于各POI数据之间的空间距离和距离阈值,确定符合上下文关系的POI数据对;向量生成模块304用于基于POI数据的特征信息生成POI数据对的向量组,向量组包括POI数据对中的两个POI数据各自对应的向量;词向量训练模块305用于将各向量组输入词向量训练模型,学习得到各POI数据的词向量;分区向量计算模块306用于基于POI数据与子区域的对应关系,加权计算各子区域内的POI数据的词向量,得到各子区域的分区向量;聚类分区模块307用于基于设定的聚类数对分区向量进行聚类分析,确定各子区域所属的功能区类别。
在一些实施例中,POI数据包括:地理位置信息,基于各POI数据之间的空间距离和距离阈值,确定符合上下文关系的POI数据对,数据对确定模块303具体用于:
基于各POI数据的地理位置信息计算任意两个POI数据之间的空间距离;
统计空间距离小于或等于距离阈值的成对POI数据,作为符合上下文关系的POI数据对。
在一些实施例中,基于POI数据的特征信息生成POI数据对的向量组,向量生成模块304具体用于:
对POI数据的特征信息进行编码,生成与POI数据一一对应的向量,特征信息至少包括:地理位置信息和POI多级类别;
基于POI数据与向量的对应关系,以及POI数据对的上下文关系,生成POI数据对的向量组。
在一些实施例中,词向量训练模块305还用于:
将词向量训练模型训练得到的词向量映射到二维语义空间中,属于相同首级类别的POI类型使用相同的颜色渲染,以便直观显示POI类之间的关系。
在一些实施例中,POI数据包括:逐级细分的至少两级类别,其中,各级类别均为多个,聚类分区模块307具体用于:
基于聚类分析的聚类簇,计算各子区域内各首级类别的POI数据的密度数据,密度数值用于反映各首级类别的POI数据在聚类簇中的权重值;
基于聚类分析的聚类簇,计算子区域内各首级类别的POI数据的富集因子,富集因子用于反映各首级类别的POI数据在聚类簇中的富集程度;
相应地,根据聚类分析的聚类簇确定各子区域所属的功能区类别,聚类分区模块307还用于:
针对各子区域,对聚类簇中POI数据的数量与POI数据的密度权重值和/或富集因子进行加权求和,选取求和值最大的聚类簇所属类别,作为相应子区域所属的功能区类别。
在一些实施例中,聚类分区模块307还用于:
基于各子区域所属的功能区类别,对各子区域进行分区显示。
实际应用时,数据获取模块301、子区域划分模块302、数据对确定模块303、向量生成模块304、词向量训练模块305、分区向量计算模块306及聚类分区模块307,可以由地理功能区识别装置中的处理器来实现。当然,处理器需要运行存储器中的计算机程序来实现它的功能。
需要说明的是:上述实施例提供的地理功能区识别装置在进行地理功能区识别时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的地理功能区识别装置与地理功能区识别方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
基于上述程序模块的硬件实现,且为了实现本申请实施例的方法,本申请实施例还提供一种地理功能区识别设备。图4仅仅示出了该地理功能区识别设备的示例性结构而非全部结构,根据需要可以实施图4示出的部分结构或全部结构。
如图4所示,本申请实施例提供的地理功能区识别设备400包括:至少一个处理器401、存储器402、用户接口403和至少一个网络接口404。地理功能区识别设备400中的各个组件通过总线系统405耦合在一起。可以理解,总线系统405用于实现这些组件之间的连接通信。总线系统405除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图4中将各种总线都标为总线系统405。
其中,用户接口403可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
本申请实施例中的存储器402用于存储各种类型的数据以支持地理功能区识别设备的操作。这些数据的示例包括:用于在地理功能区识别设备上操作的任何计算机程序。
本申请实施例揭示的地理功能区识别方法可以应用于处理器401中,或者由处理器401实现。处理器401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,地理功能区识别方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器401可以是通用处理器、数字信号处理器(DSP,Digital SignalProcessor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器401可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器402,处理器401读取存储器402中的信息,结合其硬件完成本申请实施例提供的地理功能区识别方法的步骤。
在示例性实施例中,地理功能区识别设备可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable LogicDevice)、现场可编程逻辑门阵列(FPGA,Field Programmable Gate Array)、通用处理器、控制器、微控制器(MCU,Micro Controller Unit)、微处理器(Microprocessor)、或者其他电子元件实现,用于执行前述方法。
可以理解,存储器402可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本申请实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
在示例性实施例中,本申请实施例还提供了一种存储介质,即计算机存储介质,具体可以是计算机可读存储介质,例如包括存储计算机程序的存储器402,上述计算机程序可由地理功能区识别设备的处理器401执行,以完成本申请实施例方法的步骤。计算机可读存储介质可以是ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器。
需要说明的是:“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
另外,本申请实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请披露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种地理功能区识别方法,其特征在于,包括:
获取待识别区域的道路图层数据和所述待识别区域内的兴趣点POI数据;
基于所述道路图层数据将所述待识别区域划分为至少两个子区域;
基于各所述POI数据之间的空间距离和距离阈值,确定符合上下文关系的POI数据对;
基于所述POI数据的特征信息生成所述POI数据对的向量组,所述向量组包括所述POI数据对中的两个POI数据各自对应的向量;
将各所述向量组输入词向量训练模型,学习得到各所述POI数据的词向量;
基于所述POI数据与所述子区域的对应关系,加权计算各所述子区域内的POI数据的词向量,得到各所述子区域的分区向量;
基于设定的聚类数对所述分区向量进行聚类分析,并根据所述聚类分析的聚类簇确定各所述子区域所属的功能区类别。
2.根据权利要求1所述的方法,其特征在于,所述POI数据包括:地理位置信息,所述基于各所述POI数据之间的空间距离和距离阈值,确定符合上下文关系的POI数据对,包括:
基于各所述POI数据的地理位置信息计算任意两个所述POI数据之间的空间距离;
统计所述空间距离小于或等于距离阈值的成对POI数据,作为符合上下文关系的POI数据对。
3.根据权利要求1所述的方法,其特征在于,所述基于所述POI数据的特征信息生成所述POI数据对的向量组,包括:
对所述POI数据的特征信息进行编码,生成与所述POI数据一一对应的向量,所述特征信息至少包括:地理位置信息和POI多级类别;
基于所述POI数据与所述向量的对应关系,以及所述POI数据对的上下文关系,生成所述POI数据对的向量组。
4.根据权利要求1所述的方法,其特征在于,所述将各所述向量组输入词向量训练模型,学习得到各所述POI数据的词向量,包括:
将各所述向量组作为各单个训练样本,生成包含各所述向量组的训练样本集,并将所述训练样本集作为所述词向量训练模型的输入;
各所述向量经所述词向量训练模型学习词嵌入,得到各所述POI数据的词向量。
5.根据权利要求1所述的方法,其特征在于,所述POI数据包括:逐级细分的至少两级类别,其中,各级类别均为多个;所述方法还包括:
采用语义相似性度量方法,计算至少两个末级类别之间的语义相似性,得到第一POI类语义相似性序列;
基于所述词向量训练模型的训练结果,计算所述符合上下文关系的POI数据对之间的语义相似性,得到第二POI类语义相似性序列;
基于所述第一POI类语义相似性序列加权计算得到第一语义相似度;
基于所述第二POI类语义相似性序列加权计算得到第二语义相似度;
基于所述第一语义相似度和第二语义相似度的比较结果,调整所述词向量训练模型的训练参数,所述训练参数包括以下至少之一:向量维度和训练轮数。
6.根据权利要求1所述的方法,所述POI数据包括:逐级细分的至少两级类别,其中,各级类别均为多个;所述方法还包括:
基于所述聚类分析的聚类簇,计算各所述子区域内各首级类别的POI数据的密度数据,所述密度数值用于反映各首级类别的POI数据在所述聚类簇中的密度权重值;
基于所述聚类分析的聚类簇,计算所述子区域内各首级类别的POI数据的富集因子,所述富集因子用于反映各首级类别的POI数据在所述聚类簇中的富集程度;
相应地,所述根据所述聚类分析的聚类簇确定各所述子区域所属的功能区类别,包括:
针对各所述子区域,对所述聚类簇中POI数据的数量与POI数据的密度权重值和/或富集因子进行加权求和,选取求和值最大的聚类簇所属类别,作为相应子区域所属的功能区类别。
7.根据权利要求1所述的方法,所述方法还包括:
基于各所述子区域所属的功能区类别,对各所述子区域进行分区显示。
8.一种地理功能区识别装置,其特征在于,包括:
数据获取模块,用于获取待识别区域的道路图层数据和所述待识别区域内的兴趣点POI数据;
子区域划分模块,用于基于所述道路图层数据将所述待识别区域划分为至少两个子区域;
数据对确定模块,用于基于各所述POI数据之间的空间距离和距离阈值,确定符合上下文关系的POI数据对;
向量生成模块,用于基于所述POI数据的特征信息生成所述POI数据对的向量组,所述向量组包括所述POI数据对中的两个POI数据各自对应的向量;
词向量训练模块,用于将各所述向量组输入词向量训练模型,学习得到各所述POI数据的词向量;
分区向量计算模块,用于基于所述POI数据与所述子区域的对应关系,加权计算各所述子区域内的POI数据的词向量,得到各所述子区域的分区向量;
聚类分区模块,用于基于设定的聚类数对所述分区向量进行聚类分析,确定各所述子区域所属的功能区类别。
9.一种地理功能区识别设备,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,
所述处理器,用于运行计算机程序时,执行权利要求1至7任一项所述方法的步骤。
10.一种存储介质,所述存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111480343.9A CN116244426A (zh) | 2021-12-06 | 2021-12-06 | 地理功能区识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111480343.9A CN116244426A (zh) | 2021-12-06 | 2021-12-06 | 地理功能区识别方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116244426A true CN116244426A (zh) | 2023-06-09 |
Family
ID=86630007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111480343.9A Pending CN116244426A (zh) | 2021-12-06 | 2021-12-06 | 地理功能区识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116244426A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116612421A (zh) * | 2023-07-20 | 2023-08-18 | 山东高速股份有限公司 | 一种融合多源空间数据的建成环境识别方法及设备 |
-
2021
- 2021-12-06 CN CN202111480343.9A patent/CN116244426A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116612421A (zh) * | 2023-07-20 | 2023-08-18 | 山东高速股份有限公司 | 一种融合多源空间数据的建成环境识别方法及设备 |
CN116612421B (zh) * | 2023-07-20 | 2023-09-29 | 山东高速股份有限公司 | 一种融合多源空间数据的建成环境识别方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | REVISE: A tool for measuring and mitigating bias in visual datasets | |
WO2022116537A1 (zh) | 一种资讯推荐方法、装置、电子设备和存储介质 | |
CN106855853A (zh) | 基于深度神经网络的实体关系抽取系统 | |
CN107688870B (zh) | 一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置 | |
Kang et al. | The Association Between SOC and Land Prices Considering Spatial Heterogeneity Based on Finite Mixture Modeling | |
CN111160471A (zh) | 一种兴趣点数据处理方法、装置、电子设备和存储介质 | |
CN108090216B (zh) | 一种标签预测方法、装置及存储介质 | |
CN109271640B (zh) | 文本信息的地域属性识别方法及装置、电子设备 | |
CN113505204B (zh) | 召回模型训练方法、搜索召回方法、装置和计算机设备 | |
CN103778206A (zh) | 一种网络服务资源的提供方法 | |
CN116848490A (zh) | 使用模型相交进行文档分析 | |
CN109684477A (zh) | 一种专利文本特征提取方法及系统 | |
Camacho et al. | Sentiment mapping: point pattern analysis of sentiment classified Twitter data | |
Kang et al. | A random forest classifier with cost-sensitive learning to extract urban landmarks from an imbalanced dataset | |
CN112987940B (zh) | 一种基于样本概率量化的输入方法、装置和电子设备 | |
CN116244426A (zh) | 地理功能区识别方法、装置、设备及存储介质 | |
Ma et al. | Matching descriptions to spatial entities using a Siamese hierarchical attention network | |
CN111339258B (zh) | 基于知识图谱的大学计算机基础习题推荐方法 | |
KR102358357B1 (ko) | 시장규모추정장치 및 그 동작 방법 | |
Keskin et al. | Cohort fertility heterogeneity during the fertility decline period in Turkey | |
Meng | [Retracted] Text Clustering and Economic Analysis of Free Trade Zone Governance Strategies Based on Random Matrix and Subject Analysis | |
Benjumea et al. | Genetic clustering algorithm for extractive text summarization | |
Chakraborty et al. | Rough sets: some foundational issues | |
Fatah et al. | Sentiment Analysis of Public Opinion Towards Tourism in Bangkalan Regency Using Naïve Bayes Method | |
Tu et al. | A domain-independent text segmentation method for educational course content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |