CN115374198A - 城市全域数据的处理方法及装置 - Google Patents
城市全域数据的处理方法及装置 Download PDFInfo
- Publication number
- CN115374198A CN115374198A CN202210943654.2A CN202210943654A CN115374198A CN 115374198 A CN115374198 A CN 115374198A CN 202210943654 A CN202210943654 A CN 202210943654A CN 115374198 A CN115374198 A CN 115374198A
- Authority
- CN
- China
- Prior art keywords
- data
- city
- city data
- target
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title description 10
- 238000012545 processing Methods 0.000 claims abstract description 76
- 238000000034 method Methods 0.000 claims abstract description 54
- 238000012216 screening Methods 0.000 claims abstract description 13
- 238000004458 analytical method Methods 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 25
- 230000011218 segmentation Effects 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000002372 labelling Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 12
- 238000010276 construction Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000005611 electricity Effects 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012732 spatial analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/256—Integrating or interfacing systems involving database management systems in federated or virtual databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种城市全域数据的处理方法及装置,该方法包括:获取第一城市数据,并将所述第一城市数据进行数据空间化处理;获取与目标空间要素具有关联关系的第二城市数据;从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联。本申请提供的城市全域数据的处理方法及装置,用于将不同领域的城市全域数据进行深度融合,并使其与对应的空间元素相关联,从而实现相关数据的快速检索和展示。
Description
技术领域
本申请涉及城市数据处理领域,尤其涉及一种城市全域数据的处理方法及装置。
背景技术
随着物联网、大数据、云计算等各类技术在城市领域的深入应用,城市物联感知和政务感知等多源数据不断汇聚累积,驱动着城市智慧化建设进程中越发重视大数据平台建设。目标,我国的主要城市(直辖市、省会城市、副省级城市)基本上都建设了统一政务共享交换平台,部分主要城市正在启动或推进建设城市级大数据平台。
城市级大数据平台,主要利用数据汇聚的技术手段,打通不同物理域、安全域、管理域下的复杂网络环境壁垒,将原本分散的多源数据聚合到一起。尽管数据汇聚工作实现了不同网络环境下的数据互通,但获得的城市原始公共数据仍存在数据孤立零散、质量不高的问题,迫切需要通过数据治理提升数据质量、抽取关键信息,并以此为基础,突破数据之间的壁垒、实现全域数据通联。
因此,如何将海量多源的城市全域数据进行深度融合治理,成为一个亟待解决的技术问题。
发明内容
本申请的目的是提供一种城市全域数据的处理方法及装置,用于将不同领域的城市全域数据进行深度融合,并使其与对应的空间元素相关联,从而实现相关数据的快速检索和展示。
本申请提供一种城市全域数据的处理方法,包括:
获取第一城市数据,并将所述第一城市数据进行数据空间化处理;获取与目标空间要素具有关联关系的第二城市数据;从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联;其中,所述数据空间化处理用于将所述第一城市数据与对应的空间要素进行关联;所述目标城市数据与所述第一城市数据存在内容相关联的属性字段;所述目标空间要素为与所述第一城市数据相关联的空间要素;所述目标空间要素包括至少一个空间要素。
可选地,所述将所述第一城市数据进行数据空间化处理,包括:在所述第一城市数据包含空间坐标信息的情况下,根据所述空间坐标信息,将所述第一城市数据与所述空间坐标信息相关的空间要素进行关联。
可选地,所述将所述第一城市数据进行数据空间化处理,包括:在所述第一城市数据未包含空间坐标信息的情况下,对所述第一城市数据所包含的文本内容进行语义分析,并生成语义分析结果;根据语义分析结果,确定与所述第一城市数据相关的所述目标空间要素,并将所述第一城市数据与所述目标空间要素进行关联。
可选地,所述从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联,包括:根据所述第一城市数据中各个字段所包含内容的属性,对所述第一城市数据进行规范化处理,将所述第一城市数据中的字段进行语义标注。
可选地,所述根据所述第一城市数据中每个字段所包含内容的属性,对所述第一城市数据进行规范化处理,将所述第一城市数据中所包含的字段进行标注之后,包括:对所述第一城市数据中各个字段的标注内容以及所述第二城市数据中各个字段的标注内容进行相似度计算,确定所述目标城市数据;其中,所述目标城市数据的第一字段的标注内容与所述第一城市数据的第二字段的标注内容的文本相似程度满足预设相似度。
可选地,所述对所述第一城市数据中各个字段的标注内容以及所述第二城市数据中各个字段的标注内容进行相似度计算,确定所述目标城市数据,包括:获取所述第一字段的第一标注内容与所述第二字段的第二标注内容,并对所述第一标注内容以及所述第二标注内容分别进行分词处理;基于分词后的第一标注内容和分词后的第二标注内容,计算所述第一标注内容的第一特征向量以及所述第二标注内容的第二特征向量;根据所述第一特征向量以及所述第二特征向量,计算所述第一标注内容与所述第二标注内容之间的欧式距离;根据所述第一标注内容与所述第二标注内容之间的欧式距离,计算所述第一标注内容与所述第二标注内容之间的文本相似度;在所述第一标注内容与所述第二标注内容的文本相似程度满足预设相似度的情况下,确定所述第一字段对应的内容与所述第二字段对应的内容具有关联性。
可选地,所述方法还包括:基于不同空间要素之间的空间位置关联关系,建立空间要素类别之间的知识三元组;其中,所述空间位置关联关系用于指示两个空间要素之间的空间位置关系;所述空间位置关联关系包括:包含关系,相邻关系,相交关系;所述知识三元组包括:相同类型的空间要素之间的空间位置关联关系,不同类型的空间要素之间的空间位置关联关系。
可选地,所述基于不同空间要素之间的空间位置关联关系,建立空间要素类别之间的知识三元组之后,所述方法还包括:基于每个空间要素所关联的城市数据、各个城市数据之间的关联关系以及所述知识三元组,构建城市知识图谱;其中,所述城市知识图谱用于统计以空间要素为基础的城市状态数据。
可选地,所述基于每个空间要素所关联的城市数据、各个城市数据之间的关联关系以及所述知识三元组,构建城市知识图谱之后,所述方法还包括:基于所述城市知识图谱,显示目标界面;响应于用户选择目标区域以及目标功能的目标操作,显示所述目标区域对应的目标元素所包含的与所述目标功能相关联的统计数据。
本申请还提供一种城市全域数据的处理装置,包括:
获取模块,用于获取第一城市数据;数据处理模块,用于将所述第一城市数据进行数据空间化处理;所述获取模块,还用于获取与目标空间要素具有关联关系的第二城市数据;数据关联模块,用于从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联;其中,所述数据空间化处理用于将所述第一城市数据与对应的空间要素进行关联;所述目标城市数据与所述第一城市数据存在内容相关联的属性字段;所述目标空间要素为与所述第一城市数据相关联的空间要素;所述目标空间要素包括至少一个空间要素。
可选地,所述数据处理模块,具体用于在所述第一城市数据包含空间坐标信息的情况下,根据所述空间坐标信息,将所述第一城市数据与所述空间坐标信息相关的空间要素进行关联。
可选地,所述装置还包括:分析模块;所述分析模块,用于在所述第一城市数据未包含空间坐标信息的情况下,对所述第一城市数据所包含的文本内容进行语义分析,并生成语义分析结果;所述数据处理模块,具体用于根据语义分析结果,确定与所述第一城市数据相关的所述目标空间要素,并将所述第一城市数据与所述目标空间要素进行关联。
可选地,所述装置还包括:标注模块;所述标注模块,用于根据所述第一城市数据中各个字段所包含内容的属性,对所述第一城市数据进行规范化处理,将所述第一城市数据中的字段进行语义标注。
可选地,所述装置还包括:计算模块和确定模块;所述计算模块,用于对所述第一城市数据中各个字段的标注内容以及所述第二城市数据中各个字段的标注内容进行相似度计算;所述确定模块,用于确定所述目标城市数据;其中,所述目标城市数据的第一字段的标注内容与所述第一城市数据的第二字段的标注内容的文本相似程度满足预设相似度。
可选地,所述获取模块,还用于获取所述第一字段的第一标注内容与所述第二字段的第二标注内容;所述数据处理模块,具体用于对所述第一标注内容以及所述第二标注内容分别进行分词处理;所述计算模块,具体用于基于分词后的第一标注内容和分词后的第二标注内容,计算所述第一标注内容的第一特征向量以及所述第二标注内容的第二特征向量;所述计算模块,具体还用于根据所述第一特征向量以及所述第二特征向量,计算所述第一标注内容与所述第二标注内容之间的欧式距离;所述计算模块,具体还用于根据所述第一标注内容与所述第二标注内容之间的欧式距离,计算所述第一标注内容与所述第二标注内容之间的文本相似度;所述确定模块,还用于在所述第一标注内容与所述第二标注内容的文本相似程度满足预设相似度的情况下,确定所述第一字段对应的内容与所述第二字段对应的内容具有关联性。
可选地,所述装置还包括:构建模块;所述构建模块,用于基于不同空间要素之间的空间位置关联关系,建立空间要素类别之间的知识三元组;其中,所述空间位置关联关系用于指示两个空间要素之间的空间位置关系;所述空间位置关联关系包括:包含关系,相邻关系,相交关系;所述知识三元组包括:相同类型的空间要素之间的空间位置关联关系,不同类型的空间要素之间的空间位置关联关系。
可选地,所述构建模块,还用于基于每个空间要素所关联的城市数据、各个城市数据之间的关联关系以及所述知识三元组,构建城市知识图谱;其中,所述城市知识图谱用于统计以空间要素为基础的城市状态数据。
可选地,所述装置还包括:显示模块和操作模块;所述显示模块,用于基于所述城市知识图谱,显示目标界面;所述操作模块,用于响应于用户选择目标区域以及目标功能的目标操作,显示所述目标区域对应的目标元素所包含的与所述目标功能相关联的统计数据。
本申请还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如上述任一种所述城市全域数据的处理方法的步骤。
本申请还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述城市全域数据的处理方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述城市全域数据的处理方法的步骤。
本申请提供的城市全域数据的处理方法及装置,在对城市全域数据进行处理时,首先获取第一城市数据,并将所述第一城市数据进行数据空间化处理。之后,获取与目标空间要素具有关联关系的第二城市数据。最后,从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联。如此,便可以将不同领域的城市全域数据按照空间元素和属性进行关联,方便城市数据的查询和统计。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的城市全域数据的处理方法的流程示意图;
图2是本申请提供的基于数据通联关系表的数据图谱可视化表达示例;
图3是本申请提供的基于城市知识图谱构建的目标界面的界面示意图;
图4是本申请提供的城市全域数据的处理装置的结构示意图;
图5是本申请提供的电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
针对相关技术中存在的技术问题,本申请实施例旨在针对如何建立城市全域数据通联关系问题,引入知识图谱的思想和技术手段,在空间和属性两大维度上对城市多源数据的表级关联和实体关系进行抽取、并构建一种以知识三元组为主要表征形式的、能够对城市全域数据的通联关系进行合理直观可视表达的图谱组织模式。
当前的智慧城市数据中台建设等领域中,尽管数据进行了汇聚,但汇聚而来的海量数据倘若因为不能智能地构建起数据和数据之间的关联关系,则这些数据仍然的割裂而独立的,难以为城市信息的查询提供更加具有广度和深度的检索结果,限制了数据的价值发掘。但是,城市数据在空间和属性两个维度,其实存在着天然的联系。
具体地,首先需建立城市数据表之间的关联关系,再根据数据表之间的关联关系,对城市对象实体信息进行知识抽取和存储,形成城市全域数据通联的组织管理模式。在进行城市数据表关联关系抽取时,由于地理空间数据天然具有几何空间图形和属性信息表格两大内容,因此,以地理空间数据为枢纽,城市要素的空间知识和属性知识可无缝融合关联。所以,城市全域数据的关联关系构建,主要可从空间关联和属性关联两方面着手开展。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的城市全域数据的处理方法进行详细地说明。
如图1所示,本申请实施例提供的一种城市全域数据的处理方法,该方法可以包括下述步骤101至步骤103:
步骤101、获取第一城市数据,并将所述第一城市数据进行数据空间化处理。
其中,所述数据空间化处理用于将所述第一城市数据与对应的空间要素进行关联。
可以理解的是,城市全域数据涉及到的数据内容多样,包括:地理空间数据、传感器数据和各类公共业务数据等,这些数据之间在地理空间和属性信息上均存在着关联关系,如:城市的地块(可用地理空间元素进行表达,包含了几何图斑和属性表两类信息)上包含多个建筑、建筑内入住/包含多个企业等,这是一种地理空间上的关联关系。
示例性地,上述第一城市数据为城市全域数据,即由城市在正常运行过程中由任一领域产生的数据。为了能够将不同领域的城市数据进行关联,本申请实施例通过将不同领域的城市数据与空间元素进行关联的方式,将不同领域产生的城市数据进行第一层级的关联。
示例性地,上述第一城市数据包括至少一个城市数据,例如,该第一城市数据可以为某个领域实时产生的数据,也可以为某个领域的数据库中存储的一段时长内的多条数据。
需要说明的是,本申请实施例中的城市数据,均为按照数据库存储格式存储的数据。即上述第一城市数据以数据库表(数据表)的形式存在。
示例性地,在获取到上述第一城市数据之后,可以通过该第一城市数据所携带的信息,确定与该第一城市数据相关的目标空间要素。该目标空间要素可以为城市空间要素中的一个或多个空间要素。城市空间要素可以包括:地块、道路、建筑等。
具体地,可以通过对上述第一城市数据所携带的信息进行位置解析的方式,确定其对应的空间要素,即上述步骤101,可以包括以下步骤101a:
步骤101a、在所述第一城市数据包含空间坐标信息的情况下,根据所述空间坐标信息,将所述第一城市数据与所述空间坐标信息相关的空间要素进行关联。
示例性地,针对空间城市数据,其属性表中,包含数据对象的点位坐标,例如:物联网设备所在位置的地理坐标(x,y)。对于这类数据,可以直接利用地理信息系统(Geographic Information System,GIS)相关软件,依照坐标点对生成空间点文件数据。
需要说明的是,上述空间坐标信息对应的点位与附近的空间要素之间的关系可以包括:相邻、相交、包含等。由于误差的存在,根据上述空间坐标信息可能无法确定上述第一城市数据具体属于哪个空间要素,因此,在根据上述空间坐标信息确定与第一城市数据相关的空间要素时,若无法确定具体的空间要素,则可以将与上述点位具有相邻、相交或者包含关系的所有空间要素建立关联关系。之后,根据具体地数据匹配结果,确定该第一城市数据所属的空间要素。
具体地,还可以通过对上述第一城市数据所携带的信息进行语义解析的方式,确定其对应的空间要素,即上述步骤101,可以包括以下步骤101b1和步骤101b2:
步骤101b1、在所述第一城市数据未包含空间坐标信息的情况下,对所述第一城市数据所包含的文本内容进行语义分析,并生成语义分析结果。
步骤101b2、根据语义分析结果,确定与所述第一城市数据相关的所述目标空间要素,并将所述第一城市数据与所述目标空间要素进行关联。
示例性地,针对非空间数据,其属性表中,包含数据对象的地名地址信息,例如:某企业位于***市**区**路**房间,因此,可以利用这类地名地址信息,通过比对城市地名地址库,则可以将库中匹配的地名地址数据的空间信息赋予对应的城市对象,进而生成空间数据文件。
示例性地,在获取到上述第一城市数据对应的空间点文件数据,或者,空间数据文件后,便可以确定与该第一城市数据相关联的目标空间元素。
举例说明,该第一数据为某企业的缴税信息,该企业在完成缴税后,系统便可以根据该企业的企业信息,确定企业地址,并将该缴税信息与该企业地址对应的建筑或者地块进行关联。
步骤102、获取与目标空间要素具有关联关系的第二城市数据。
其中,所述目标空间要素为与所述第一城市数据相关联的空间要素;所述目标空间要素包括至少一个空间要素。
示例性地,上述关联关系可以包括直接关联关系以及间接关联关系,即上述第二城市数据可以为与目标空间要素具有直接关联关系的城市数据,也可以为与目标空间要素具有间接关联关系的城市数据。
举例说明,以上述目标空间要素为目标建筑为例,第二城市数据可以包括该目标建筑的建筑信息,也可以包括该目标建筑内目标企业的企业信息,还可以包括目标企业的企业法人以及该企业法人的亲属信息等。
示例性地,在将上述第一城市数据与目标空间要素进行关联后,还需要将该第一城市数据与该目标空间要素所关联的其城市数据进行关联。
可以理解的是,对于建筑而言,不仅包括建筑基础信息(如:建筑名称、建筑编码、占地面积等),还包括建筑的能耗信息(如:建筑的用水量、用电量等),这两类信息通常来源于不同系统、通过数据汇聚后分别存储在不同的数据表中;明显地,这些不同的数据表中均包含对建筑对象的描述,因此,在属性上也具有关联关系。
步骤103、从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联。
其中,所述目标城市数据与所述第一城市数据存在内容相关联的属性字段。
示例性地,为了将属性或者类别相同的数据进行关联,首先需要获取与目标空间要素相关联的所有城市数据,并将第一城市数据分别与每个城市数据进行特征匹配。
具体地,上述步骤102,可以包括以下步骤102a:
步骤102a、根据所述第一城市数据中各个字段所包含内容的属性,对所述第一城市数据进行规范化处理,将所述第一城市数据中的字段进行语义标注。
可以理解的是,由于不同领域之间存储数据的格式不同,命名方式也不同,因此,无法直接将不同领域之间产生的城市数据进行关联,需要根据城市数据所包含的信息进行匹配。然而,基于现有的数据存储方式,可能无法直接通过城市数据所包含的信息,或者,其字段名称识别出城市数据的类别或者属性等信息。此时,需要对城市数据的字段进行标注。
示例性地,对于上述第二城市数据,由于已经完成了不同城市数据之间的关联,因此,在对上述第一城市数据进行表级属性关联时,无需再次重复进行字段的标注(之前已经按照上述步骤102a中的方法进行了字段的标注)。
示例性地,在对上述第一城市数据进行字段的标注后,便可以根据字段的标注内容,从第二城市数据中筛选出与第一城市数据相关联的目标城市数据。
具体地,上述步骤102a之后,上述步骤102,还可以包括以下步骤102b:
步骤102b、对所述第一城市数据中各个字段的标注内容以及所述第二城市数据中各个字段的标注内容进行自然语言分析,确定所述目标城市数据。
其中,所述目标城市数据的第一字段的标注内容与所述第一城市数据的第二字段的标注内容的相似程度满足预设相似度。
需要说明的是,在将不同领域的城市数据进行关联后,可以根据其具有相关性的内容,单独进行存储。同时,第一城市数据可以与一个或多个城市数据相关联。
示例性地,在对城市数据的字段进行标注之前,还需要创建语料库,即需要确定字段可以被标记为哪些内容。
示例性地,上述步骤102之前,本申请实施例提供的城市全域数据处理方法,还可以包括以下步骤S1
S1、获取目标数据集。
其中,该目标数据集中包括多条城市数据。
S2、将所述目标数据集中的任一目标数据进行分段处理,将所述目标数据集中的城市数据划分为多个短语,并执行去重处理。
S3、根据去重后的短语,构建短语集合。
示例性地,在得到上述短语集合后,便可以基于该短语集合,对需要进行关联性匹配的城市数据进行标注。
举例说明,以下为表1所示的建筑物基础信息表和表2所示的企业的基础信息表:
字段名称 | 标注内容 |
ID | 建筑物编码 |
Name | 建筑物名称 |
Area | 建筑物占地面积 |
…… | …… |
表1
字段名称 | 标注内容 |
ID | 企业编码 |
Name | 企业名称 |
B_Name | 企业所在建筑物名称 |
…… | …… |
表2
建筑物a的基础信息以表1所示的数据表对应的格式进行存储,企业a的基础信息以表2所示的数据表对应的格式进行存储,根据其字段名称,无法判断每个字段对应的内容的真实含义,因此,需要通过对字段进行标注,以明确每个字段存储内容的属性信息。
示例性地,在完成对上述第一城市数据的标注之后,便可以利用自然语言处理(Natural Language Processing,NLP)的文本匹配方法,计算不同城市数据的字段的标注内容之间的文本相似度。
示例性地,自然语言处理的文本匹配方法很多,这类方法都可以用于此处进行表字段之间的文本相似度。两个表字段中文描述的相似度越高,则代表两个表之间基于这两个字段对进行关联的可能性越大。
进行文本相似度计算,主要包括如下步骤:首先,对文本进行切分(例如使用“n-gram语言模型”、“分词”、“句法分析”等),之后,对文本进行特征构建,即用数值向量来描述文本在语义空间中的位置(该步骤在某些具体的方法中可以跳过),例如TF、TF-IDF、Simhash等方法;再次,利用不同方法(如:欧式距离、余弦距离、海明距离、最小编辑距离)来对不同文本特征向量在语义空间中的相对距离进行度量,从而进行文本相似度的计算。
具体地,上述步骤102b之后,上述步骤102,还可以包括以下步骤102c:
步骤102c、对所述第一城市数据中各个字段的标注内容以及所述第二城市数据中各个字段的标注内容进行相似度计算,确定所述目标城市数据。
其中,所述目标城市数据的第一字段的标注内容与所述第一城市数据的第二字段的标注内容的相似程度满足预设相似度。
示例性地,在计算两个标注内容的相似度之后,若相似度大于相似度阈值,则可以确定两个标注内容分别对应的两个城市数据具有关联性。
具体地,上述步骤102c中相似度计算的方法可以包括以下步骤102c1至步骤102c5:
步骤102c1、获取所述第一字段的第一标注内容与所述第二字段的第二标注内容,并对所述第一标注内容以及所述第二标注内容分别进行分词处理。
步骤102c2、基于分词后的第一标注内容和分词后的第二标注内容,计算所述第一标注内容的第一特征向量以及所述第二标注内容的第二特征向量。
步骤102c3、根据所述第一特征向量以及所述第二特征向量,计算所述第一标注内容与所述第二标注内容之间的欧式距离。
步骤102c4、根据所述第一标注内容与所述第二标注内容之间的欧式距离,计算所述第一标注内容与所述第二标注内容之间的文本相似度。
步骤102c5、在所述第一标注内容与所述第二标注内容的文本相似程度满足预设相似度的情况下,确定所述第一字段对应的内容与所述第二字段对应的内容具有关联性。
需要说明的是,上述目标城市数据与第一城市数据之间存在关联性,是指目标城市数据的第一字段所对应的内容与第一城市数据的第二字段对应的内容存在关联系。相关联的数据可以在数据库中进行关联存储。
举例说明,以建筑基础信息表中的Name字段和企业基础信息表的Name字段以及B_Name字段的标记内容为例,进行文本相似度的计算。输入以下三个文本:String 1:建筑物名称;String 2:企业名称;String 3:企业所在建筑物名称。
Step 1、文本切分:以“n-gram语言模型”方法中的bigram模型为例,对文本进行切分String 1切分:建筑、筑物、物名、名称String 2切分:企业、业名、名称String 3切分:企业、业所、所在、在建、建筑、筑物、物名、名称。
Step 2、特征构建:根据上述文本切分结果,以词袋模型为例,构建语料库,即:{建筑、筑物、物名、名称、企业、业名、业所、所在、在建}对三个文本构建特征向量分别为:String 1的特征向量为:(1,1,1,1,0,0,0,0,0)、String 2的特征向量为:(0,0,0,1,1,1,0,0,0)、String3的特征向量为:(1,1,1,1,1,0,1,1,1)
Step3、距离度量与相似度计算:以基于欧氏距离的文本相似度计算为例,首先计算任意两个文本之间的欧式距离:
其中,Dis12表示String 1与String 2的欧氏距离;Dis13表示String 1与String 3的欧氏距离;Dis23表示String 2与String 3的欧氏距离。
之后,计算任意两个文本之间的相似度:
其中,Similarity12表示String 1与String 2的文本相似度;Similarity13表示String 1与String 3的文本相似度;Similarity 23表示String 2与String 3的文本相似度。
最后,建筑基础信息表中的Name字段,与企业基础信息表的B_Name字段具有最高的关联度,可优先考虑基于该关联进行属性关联三元组的构建,即(Building1.Name~关联~Enterprise.B_Name)。
示例性地,通过上述步骤计算出不同数据表的字段所对应的内容之间的相似度之后,可以通过表格的形式对其进行记录,如以下表3所示
数据表1.字段n | 数据表2.字段m | 相似度 |
表3
之后,可以设定一个(0,1)之间的数值作为相似度阈值,用于识别(小于该阈值)没有实质关联关系的字段对,并在上述表格中进行删除,最终得到一个数据表字段的相似度表。基于该相似度表,通过人工识别确认后,确定数据表两两之间的通联关系(用知识三元组进行标识),即(数据表1.字段n~属性关联~数据表2.字段m)。
需要说明的是,本申请实施例中,上述知识三元组用于建立不同层级的数据之间的关联关系。
可选地,在本申请实施例中,综合上述两个步骤得到的表级关联关系,即可建立最终的城市全域数据通联关系表。
具体地,本申请实施例提供的城市全域数据处理方法,还可以包括以下步骤104:
步骤104、基于不同空间要素之间的空间位置关联关系,建立空间要素类别之间的知识三元组。
其中,所述空间位置关联关系用于指示两个空间要素之间的空间位置关系;所述空间位置关联关系包括:包含关系,相邻关系,相交关系,连通关系,重叠关系,相接关系,上下方位关系等;所述知识三元组包括:相同类型的空间要素之间的空间位置关联关系,不同类型的空间要素之间的空间位置关联关系。
如:对城市地块(用面要素的矢量数据进行表示,具有结构化的数据表属性)的数据通联关系表可如下表4所示:
数据1 | 关联关系 | 数据2 |
地块 | 空间包含 | 小区 |
小区 | 空间包含 | 建筑 |
建筑.名称 | 属性关联 | 用电数据.建筑名称 |
建筑.名称 | 属性关联 | 企业名录.办公地址 |
企业名录.名称 | 属性关联 | 纳税情况.企业名称 |
企业名录.法人姓名 | 属性关联 | 住户信息.姓名 |
住户信息.小区名称 | 属性关联 | 小区.名称 |
表4
示例性地,依托于该关联表,即可对该城市全域数据的数据表关联关系进行可视化表达。如图2所示,为基于数据通联关系表的数据图谱可视化表达示例,建筑与小区属于不同类别的空间要素,建筑与小区之间在空间属于包含关系(建筑与建筑属于相同类别的空间要素,且建筑与建筑之间在空间上属于相邻关系,图中未标示出),小区与地块之间在空间上属于包含关系。建筑、小区以及地铁三个空间要素,每个空间要素均存在属性关联的城市数据,例如:与建筑相关联的用电数据、企业名录;与小区相关联的住户信息;同时,住户信息还与企业名录相关联(该住户就职于建筑内的某个企业);与企业名录关联的纳税情况(某个企业的纳税信息)。
示例性地,在得到上述知识三元组之后,基于知识三元组中每个空间要素所关联的城市数据,以及各个城市数据之间的关联关系,可以构建城市知识图谱。
具体地,上述步骤104之后,本申请实施例提供的城市全域数据的处理方法还可以包括以下步骤105:
步骤105、基于每个空间要素所关联的城市数据、各个城市数据之间的关联关系以及所述知识三元组,构建城市知识图谱。
其中,所述城市知识图谱用于统计以空间要素为基础的城市状态数据。
示例性地,对于某一空间数据(称之为:源空间数据,如地块——一种以多边形表达的矢量数据),逐要素(如:地块的每个多边形图斑)抽取该要素与其他空间数据(称之为:目标空间数据,如建筑等)中与之具有某种空间关系(如:包含、邻近、相交等)的相关要素/要素集合,并存储为知识三元组,如:(1号地块ID,空间包含,信息大厦ID)。
示例性地,空间实体对象的空间关系知识抽取,可直接利用常规的空间分析方法来完成,如:利用ArcGIS软件所提供的相关分析工具。通过相关分析工具可以将城市知识图谱进行可视化展示。
具体地,上述步骤105之后,本申请实施例提供的城市全域数据的处理方法,还可以包括以下步骤106和步骤107:
步骤106、基于所述城市知识图谱,显示目标界面。
步骤106、响应于用户选择目标区域以及目标功能的目标操作,显示所述目标区域对应的目标元素所包含的与所述目标功能相关联的统计数据。
举例说明,如图3所示,为经过相关分析工具构建的可视化展示界面(即上述目标界面)。所能实现的技术效果为:当用户选中小区A所对应的地块后,便可以展示小区A的相关信息。用户可以根据实际需求选择需要展示的信息,例如,当用户选择展示住户数量、总用电量和总用水量之后,便可以显示小区A的上述内容的统计信息。
本申请实施例提供的城市全域数据的处理方法,在对城市全域数据进行处理时,首先获取第一城市数据,并将所述第一城市数据进行数据空间化处理。之后,获取与目标空间要素具有关联关系的第二城市数据。最后,从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联。如此,便可以将不同领域的城市全域数据按照空间元素和属性进行关联,方便城市数据的查询和统计。
需要说明的是,本申请实施例提供的城市全域数据的处理方法,执行主体可以为城市全域数据的处理装置,或者该城市全域数据的处理装置中的用于执行城市全域数据的处理方法的控制模块。本申请实施例中以城市全域数据的处理装置执行城市全域数据的处理方法为例,说明本申请实施例提供的城市全域数据的处理装置。
需要说明的是,本申请实施例中,上述各个方法附图所示的。城市全域数据的处理方法均是以结合本申请实施例中的一个附图为例示例性的说明的。具体实现时,上述各个方法附图所示的城市全域数据的处理方法还可以结合上述实施例中示意的其它可以结合的任意附图实现,此处不再赘述。
下面对本申请提供的城市全域数据的处理装置进行描述,下文描述的与上文描述的城市全域数据的处理方法可相互对应参照。
图4为本申请一实施例提供的城市全域数据的处理装置的结构示意图,如图4所示,具体包括:
获取模块401,用于获取第一城市数据;数据处理模块402,用于将所述第一城市数据进行数据空间化处理;所述获取模块401,还用于获取与目标空间要素具有关联关系的第二城市数据;数据处理模块402,用于从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联;其中,所述数据空间化处理用于将所述第一城市数据与对应的空间要素进行关联;所述目标城市数据与所述第一城市数据存在内容相关联的属性字段;所述目标空间要素为与所述第一城市数据相关联的空间要素;所述目标空间要素包括至少一个空间要素。
可选地,所述数据处理模块402,具体用于在所述第一城市数据包含空间坐标信息的情况下,根据所述空间坐标信息,将所述第一城市数据与所述空间坐标信息相关的空间要素进行关联。
可选地,所述装置还包括:分析模块;所述分析模块,用于在所述第一城市数据未包含空间坐标信息的情况下,对所述第一城市数据所包含的文本内容进行语义分析,并生成语义分析结果;所述数据处理模块402,具体用于根据语义分析结果,确定与所述第一城市数据相关的所述目标空间要素,并将所述第一城市数据与所述目标空间要素进行关联。
可选地,所述装置还包括:标注模块;所述标注模块,用于根据所述第一城市数据中各个字段所包含内容的属性,对所述第一城市数据进行规范化处理,将所述第一城市数据中的字段进行语义标注。
可选地,所述装置还包括:计算模块和确定模块;所述计算模块,用于对所述第一城市数据中各个字段的标注内容以及所述第二城市数据中各个字段的标注内容进行相似度计算;所述确定模块,用于确定所述目标城市数据;其中,所述目标城市数据的第一字段的标注内容与所述第一城市数据的第二字段的标注内容的文本相似程度满足预设相似度。
可选地,所述获取模块401,还用于获取所述第一字段的第一标注内容与所述第二字段的第二标注内容;所述数据处理模块402,具体用于对所述第一标注内容以及所述第二标注内容分别进行分词处理;所述计算模块,具体用于基于分词后的第一标注内容和分词后的第二标注内容,计算所述第一标注内容的第一特征向量以及所述第二标注内容的第二特征向量;所述计算模块,具体还用于根据所述第一特征向量以及所述第二特征向量,计算所述第一标注内容与所述第二标注内容之间的欧式距离;所述计算模块,具体还用于根据所述第一标注内容与所述第二标注内容之间的欧式距离,计算所述第一标注内容与所述第二标注内容之间的文本相似度;所述确定模块,还用于在所述第一标注内容与所述第二标注内容的文本相似程度满足预设相似度的情况下,确定所述第一字段对应的内容与所述第二字段对应的内容具有关联性。
可选地,所述装置还包括:构建模块;所述构建模块,用于基于不同空间要素之间的空间位置关联关系,建立空间要素类别之间的知识三元组;其中,所述空间位置关联关系用于指示两个空间要素之间的空间位置关系;所述空间位置关联关系包括:包含关系,相邻关系,相交关系;所述知识三元组包括:相同类型的空间要素之间的空间位置关联关系,不同类型的空间要素之间的空间位置关联关系。
可选地,所述构建模块,还用于基于每个空间要素所关联的城市数据、各个城市数据之间的关联关系以及所述知识三元组,构建城市知识图谱;其中,所述城市知识图谱用于统计以空间要素为基础的城市状态数据。
可选地,所述装置还包括:显示模块和操作模块;所述显示模块,用于基于所述城市知识图谱,显示目标界面;所述操作模块,用于响应于用户选择目标区域以及目标功能的目标操作,显示所述目标区域对应的目标元素所包含的与所述目标功能相关联的统计数据。
本申请提供的城市全域数据的处理装置,在对城市全域数据进行处理时,首先获取第一城市数据,并将所述第一城市数据进行数据空间化处理。之后,获取与目标空间要素具有关联关系的第二城市数据。最后,从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联。如此,便可以将不同领域的城市全域数据按照空间元素和属性进行关联,方便城市数据的查询和统计。
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行城市全域数据的处理方法,该方法包括:获取第一城市数据,并将所述第一城市数据进行数据空间化处理;获取与目标空间要素具有关联关系的第二城市数据;从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联;其中,所述数据空间化处理用于将所述第一城市数据与对应的空间要素进行关联;所述目标城市数据与所述第一城市数据存在内容相关联的属性字段;所述目标空间要素为与所述第一城市数据相关联的空间要素;所述目标空间要素包括至少一个空间要素。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本申请还提供一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的城市全域数据的处理方法,该方法包括:获取第一城市数据,并将所述第一城市数据进行数据空间化处理;获取与目标空间要素具有关联关系的第二城市数据;从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联;其中,所述数据空间化处理用于将所述第一城市数据与对应的空间要素进行关联;所述目标城市数据与所述第一城市数据存在内容相关联的属性字段;所述目标空间要素为与所述第一城市数据相关联的空间要素;所述目标空间要素包括至少一个空间要素。
又一方面,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的城市全域数据的处理方法,该方法包括:获取第一城市数据,并将所述第一城市数据进行数据空间化处理;获取与目标空间要素具有关联关系的第二城市数据;从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联;其中,所述数据空间化处理用于将所述第一城市数据与对应的空间要素进行关联;所述目标城市数据与所述第一城市数据存在内容相关联的属性字段;所述目标空间要素为与所述第一城市数据相关联的空间要素;所述目标空间要素包括至少一个空间要素。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种城市全域数据的处理方法,其特征在于,包括:
获取第一城市数据,并将所述第一城市数据进行数据空间化处理;
获取与目标空间要素具有关联关系的第二城市数据;
从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联;
其中,所述数据空间化处理用于将所述第一城市数据与对应的空间要素进行关联;所述目标城市数据与所述第一城市数据存在内容相关联的属性字段;所述目标空间要素为与所述第一城市数据相关联的空间要素;所述目标空间要素包括至少一个空间要素。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一城市数据进行数据空间化处理,包括:
在所述第一城市数据包含空间坐标信息的情况下,根据所述空间坐标信息,将所述第一城市数据与所述空间坐标信息相关的空间要素进行关联。
3.根据权利要求1所述的方法,其特征在于,所述将所述第一城市数据进行数据空间化处理,包括:
在所述第一城市数据未包含空间坐标信息的情况下,对所述第一城市数据所包含的文本内容进行语义分析,并生成语义分析结果;
根据语义分析结果,确定与所述第一城市数据相关的所述目标空间要素,并将所述第一城市数据与所述目标空间要素进行关联。
4.根据权利要求1所述的方法,其特征在于,所述从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联,包括:
根据所述第一城市数据中各个字段所包含内容的属性,对所述第一城市数据进行规范化处理,将所述第一城市数据中的字段进行语义标注。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一城市数据中每个字段所包含内容的属性,对所述第一城市数据进行规范化处理,将所述第一城市数据中所包含的字段进行标注之后,包括:
对所述第一城市数据中各个字段的标注内容以及所述第二城市数据中各个字段的标注内容进行相似度计算,确定所述目标城市数据;
其中,所述目标城市数据的第一字段的标注内容与所述第一城市数据的第二字段的标注内容的文本相似程度满足预设相似度。
6.根据权利要求5所述的方法,其特征在于,所述对所述第一城市数据中各个字段的标注内容以及所述第二城市数据中各个字段的标注内容进行相似度计算,确定所述目标城市数据,包括:
获取所述第一字段的第一标注内容与所述第二字段的第二标注内容,并对所述第一标注内容以及所述第二标注内容分别进行分词处理;
基于分词后的第一标注内容和分词后的第二标注内容,计算所述第一标注内容的第一特征向量以及所述第二标注内容的第二特征向量;
根据所述第一特征向量以及所述第二特征向量,计算所述第一标注内容与所述第二标注内容之间的欧式距离;
根据所述第一标注内容与所述第二标注内容之间的欧式距离,计算所述第一标注内容与所述第二标注内容之间的文本相似度;
在所述第一标注内容与所述第二标注内容的文本相似程度满足预设相似度的情况下,确定所述第一字段对应的内容与所述第二字段对应的内容具有关联性。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于不同空间要素之间的空间位置关联关系,建立空间要素类别之间的知识三元组;
其中,所述空间位置关联关系用于指示两个空间要素之间的空间位置关系;所述空间位置关联关系包括:包含关系,相邻关系,相交关系;所述知识三元组包括:相同类型的空间要素之间的空间位置关联关系,不同类型的空间要素之间的空间位置关联关系。
8.根据权利要求7所述的方法,其特征在于,所述基于不同空间要素之间的空间位置关联关系,建立空间要素类别之间的知识三元组之后,所述方法还包括:
基于每个空间要素所关联的城市数据、各个城市数据之间的关联关系以及所述知识三元组,构建城市知识图谱;
其中,所述城市知识图谱用于统计以空间要素为基础的城市状态数据。
9.根据权利要求8所述的方法,其特征在于,所述基于每个空间要素所关联的城市数据、各个城市数据之间的关联关系以及所述知识三元组,构建城市知识图谱之后,所述方法还包括:
基于所述城市知识图谱,显示目标界面;
响应于用户选择目标区域以及目标功能的目标操作,显示所述目标区域对应的目标元素所包含的与所述目标功能相关联的统计数据。
10.一种城市全域数据的处理装置,其特征在于,所述装置包括:
获取模块,用于获取第一城市数据;
数据处理模块,用于将所述第一城市数据进行数据空间化处理;
所述获取模块,还用于获取与目标空间要素具有关联关系的第二城市数据;
所述数据处理模块,还用于从所述第二城市数据中筛选出目标城市数据,并将所述第一城市数据与所述目标城市数据进行关联;
其中,所述数据空间化处理用于将所述第一城市数据与对应的空间要素进行关联;所述目标城市数据与所述第一城市数据存在内容相关联的属性字段;所述目标空间要素为与所述第一城市数据相关联的空间要素;所述目标空间要素包括至少一个空间要素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210943654.2A CN115374198A (zh) | 2022-08-08 | 2022-08-08 | 城市全域数据的处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210943654.2A CN115374198A (zh) | 2022-08-08 | 2022-08-08 | 城市全域数据的处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115374198A true CN115374198A (zh) | 2022-11-22 |
Family
ID=84063231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210943654.2A Pending CN115374198A (zh) | 2022-08-08 | 2022-08-08 | 城市全域数据的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115374198A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115858712A (zh) * | 2023-02-01 | 2023-03-28 | 广州探迹科技有限公司 | 基于改进nlp算法的地址信息映射方法、系统以及介质 |
-
2022
- 2022-08-08 CN CN202210943654.2A patent/CN115374198A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115858712A (zh) * | 2023-02-01 | 2023-03-28 | 广州探迹科技有限公司 | 基于改进nlp算法的地址信息映射方法、系统以及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107092680B (zh) | 一种基于地理网格的政务信息资源整合方法 | |
Flatow et al. | On the accuracy of hyper-local geotagging of social media content | |
CN108628811B (zh) | 地址文本的匹配方法和装置 | |
Wei et al. | On the spatial distribution of buildings for map generalization | |
CN101350012B (zh) | 一种地址匹配的方法和系统 | |
CN113434623B (zh) | 一种基于多源异构空间规划数据的融合方法 | |
CN102163214B (zh) | 一种数字地图生成装置及方法 | |
CN112183036B (zh) | 一种格式文档生成方法、装置、设备及存储介质 | |
Lai et al. | Topic modeling to discover the thematic structure and spatial-temporal patterns of building renovation and adaptive reuse in cities | |
CN109918452A (zh) | 一种数据处理的方法、装置、计算机存储介质及终端 | |
CN108241867B (zh) | 一种分类方法及装置 | |
CN109299469A (zh) | 一种在长文本中识别复杂住址的方法 | |
CN115374198A (zh) | 城市全域数据的处理方法及装置 | |
Sheeren et al. | A data‐mining approach for assessing consistency between multiple representations in spatial databases | |
CN112416992B (zh) | 基于大数据和关键词的行业类型识别方法、系统及设备 | |
CN113377739A (zh) | 知识图谱应用方法、平台、电子设备及存储介质 | |
CN112818072A (zh) | 旅游知识图谱更新方法、系统、设备及存储介质 | |
CN110688995A (zh) | 地图查询的处理方法,计算机可读存储介质和移动终端 | |
CN116431625A (zh) | 一种地理实体的定位分析方法、装置及计算机设备 | |
CN111444299A (zh) | 基于地址树模型的中文地址提取方法 | |
Wang et al. | Hierarchical Extraction of Skeleton Structures from Discrete Buildings | |
CN116578676B (zh) | 一种地名时空演化查询方法及系统 | |
CN114048278B (zh) | 一种应用于国土测绘空间数据资源的建模校正系统与方法 | |
Jia et al. | An ontology‐based semantic description model of ubiquitous map images | |
CN115934870A (zh) | 地理对象生命周期管理方法和装置、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |