CN116522272A - 一种基于城市信息单元的多源时空数据透明融合方法 - Google Patents
一种基于城市信息单元的多源时空数据透明融合方法 Download PDFInfo
- Publication number
- CN116522272A CN116522272A CN202310180533.1A CN202310180533A CN116522272A CN 116522272 A CN116522272 A CN 116522272A CN 202310180533 A CN202310180533 A CN 202310180533A CN 116522272 A CN116522272 A CN 116522272A
- Authority
- CN
- China
- Prior art keywords
- data
- city
- time
- information
- urban
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007500 overflow downdraw method Methods 0.000 title claims abstract description 16
- 230000004927 fusion Effects 0.000 claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000005516 engineering process Methods 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 11
- 230000007613 environmental effect Effects 0.000 claims description 10
- 230000010354 integration Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 238000013136 deep learning model Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000011161 development Methods 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 238000013213 extrapolation Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000011664 signaling Effects 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 238000012800 visualization Methods 0.000 abstract description 11
- 230000003068 static effect Effects 0.000 abstract description 4
- 238000006243 chemical reaction Methods 0.000 abstract description 3
- 238000007726 management method Methods 0.000 description 21
- 239000013598 vector Substances 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000007499 fusion processing Methods 0.000 description 2
- 235000019580 granularity Nutrition 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于城市信息单元的多源时空数据透明融合方法,依据城市管理层级,将城市进行整体剖分,构建空间基础信息实体,定义多层级城市信息单元及其包含的多源异构时空数据;提取地理实体特征中的空间、时间和关联性属性,基于位置和时间属性建立综合地理单元编码标识;基于统一的地理单元编码标识将来自多部门、多类型的数据集成在一个平台上按剖分网格进行多尺度统计展示,实现基于剖分塔式层级数据的快速请求、生成与服务。本发明解决跨领域的数据在几何位置、属性语义、逻辑等方面的相似性、不一致性问题。实现静态三维可视化向智能动态可视化转变,构建多源异构时空数据资源池,实现多源、异构、封闭系统的城市政务大数据的透明融合。
Description
技术领域
本发明涉及城市物理-数字空间社会传感大数据领域,特别的是一种基于城市信息单元的多源时空数据透明融合方法,能够针对动态环境下的多源、多尺度、多主题、多时相的时空大数据,运用多源时空数据透明融合模型来为不同的用户提供多层次丰富的信息内容,为空间信息智能服务提供核心技术支撑。
背景技术
随着“互联网+”、大数据、5G、云计算、人工智能等技术的兴起,时空数据应用的领域不断扩展、应用的层次不断深入,用户对空间数据的生产、处理与分析等提出了更高的要求。
随着传感器技术、互联网技术的快速发展,时空数据信息获取能力大大提高,不同行业部门根据不同的需求生产了大量的空间数据。城市物理-数字空间社会传感大数据具有来源多样、数据格式多样、分散存储、数据量大等特点,为数据的协同表达、信息聚合、信息派生与增值以及数据挖掘带来了很大困难。多源时空大数据融合的关键在于对地理实体的几何位置、语义属性、和拓扑关系等特征的合并处理,即对需要对多源、多尺度的矢量数据中的同名实体进行融合处理,才能将不同数据集中在一起,形成一个质量更高、满足应用需求的时空数据库。
城市物理-数字空间多源异构数据融合意义重大,具有广阔的应用前景:1)时空数据融合有助于拓宽矢量数据研究的宽度和广度,完善相关的理论、技术和方法体系;2)同一地区不同来源的矢量空间数据之间的相互集成和融合处理可以使得这些数据在属性和几何位置上相互印证、相互补充和相互关联,可以准确确定地理实体的相关信息,提高数据的精度;3)将更新数据与原有数据进行空间匹配可实现多尺度时空数据之间的更新。
数据融合是指针对多个传感器采集得到的数据,利用计算机处理技术并采用一定的准则进行协调优化和综合处理,以得到满足实际需求且质量更高的数据,经过融合后的数据可以集合多种数据的优势,能获得更精确的状态和估计。空间数据融合主要是对多源空间数据进行集成和整合,是将不同的数据源融合生成一个新的、质量更好数据的过程,根据空间数据类型的不同,可分为矢量空间数据融合、栅格空间数据融合、矢量与栅格空间数据融合等。
目前,城市物理-数字空间多源异构数据融合存在以下问题:1)社会传感及政务信息数据信息形态复杂,在进行数据融合时难以对动态信息进行互联、互通、互用,无法较好的实现综合运行管理动态信息,容易出现动态融合的容错性和鲁棒性问题;2)多源时空数据与城市实体难以准确匹配,不同类型数据之间相对孤立、关联性差,较难实现时空大数据关联关系的解析与构建,影响城市实体与多源时空数据动态融合效率;3)现有的数据与空间实体的动态融合方法大多基于地理格网,按需在不同粒度下划分规则格网,忽略了城市管理时的不规则区域划分以及多层级之间的信息单元的隐含关联,然而城市的日常管理区域划分为不规则区域,同时城市的多层级信息也是密切相关的。
因此,如何能够克服现有技术的缺陷,研究物理-数字空间多源异构数据的动态融合问题,屏蔽数据融合的复杂性,针对多源数据的多重语义表达,优化数据的整合与管理,成为现有技术亟需解决的技术问题。
发明内容
本发明的目的在于提出一种基于城市信息单元的多源时空数据融合方法,可以屏蔽数据融合过程中的复杂性,通过唯一的数据编码,进行知识合并,实现数据的动态挂接,进而实现多源数据透明融合。
为达此目的,本发明采用以下技术方案:
一种基于城市信息单元的多源时空数据透明融合方法,包括:
城市信息单元划分和多源异构数据整合描述步骤S110:
依据城市管理层级,将城市进行整体剖分,构建空间基础信息实体,定义多层级城市信息单元和城市信息单元包含的多源异构时空数据;
多源异构数据的特征抽取步骤S120:
提取地理实体特征中的空间、时间和关联性属性,基于位置和时间属性建立综合地理单元编码标识;
基于城市单元的多源异构数据匹配步骤S130:
基于统一的地理单元编码标识将来自多部门、多类型的数据集成在一个平台上按剖分网格进行多尺度统计展示,实现基于剖分塔式层级数据的快速请求、生成与服务。
可选的,步骤S110包括:
城市信息单元定义划分子步骤S111:
定义划分城市单元,根据城市按管理层级将城市划分为在地理上相互独立的多个城市单元,在城市单元中集成城市管理中积累的基础政务数据以及社会传感数据得到城市信息单元,本层单元内部包含所有下一层单元的联合特征,基于多层级城市单元构建城市信息的整体架构;
城市信息单元数据定义子步骤S112:
城市信息单元包含的多源异构时空数据为基础政务数据和社会传感数据,具体包括:经济数据、环保数据、建设数据和社会数据,所述经济数据包括:社会保障、经济发展数据,所述环保数据包括:生态环保、空气质量和水质数据,所述建设数据包括:城乡建设和交通数据,所述社会数据包括:社会舆情、POI数据、手机信令和音频视频数据;基础政务数据和社会传感数据主要分为5大类型:文本、图像、视频、网页、表格;
数据整合步骤S113:
对多源异构时空数据进行过滤、筛选的调整,剔除不合理的数据,并消除同名异义和异名同义、检验一致性、删除冗余数据和数据归并。
可选的,在步骤S120中,
属性提取通过如下方式完成:
对于文本数据,通过深度学习模型自动学习上下文特征,通过随机场、最大熵利用模型抽取时间信息;利用规则匹配法、监督学习法获取到地理实体相关的属性特征和属性值;
对于图像数据:采用卷积神经网络通过图像识别技术对对象及场景的识别和内容简介的自动生成;
数据的时间特征提取为:利用最小二乘准则匹配法,内插外推的时间匹配算法将关于同一目标的不同来源的不同步的信息同步到同一时刻实现空间数据的时间配准;
数据的空间特征提取为:对于数据中的空间信息,进行语义地址匹配,对于给定的语料库数据集D={add1,add2,…,addn},语义地址匹配的目标是找到地址对(addi,addj),满足addi=addj,其中addi∈D,addj∈D且i≠j,以确保数据空间位置的准确性。
可选的,在步骤S120中,
综合地理单元编码标识由位置码+语义码+时间码+关联码组成。
可选的,综合地理单元编码标识编码规则如下:
1)位置码:行政区代码有9位,由省、市、区、街道组成,编码符合GB/T 2260和GD/T10114的规定,在此基础上添加6位,分别表示所在区域与最小格网;
2)语义码:表示数据属性信息;
3)时间码:表示信息单元产生时间中的时间元素“年”、“月”和“日”,执行GB/T7408;在此基础上添加4位,分别表示是否为节假日与时间间隔;
4)关联码:有效范围为01-99之间,用以标注此城市信息单元与相关信息单元的关联强度
可选的,步骤S130包括:
数据与地理单元挂接子步骤S131:
通过对多源时空数据进行整合、特征提取、数据编码,根据位置码实现数据与地理单元的动态挂接;
多层级挂接子步骤S132:
利用地理单元编码标识下的城市实体与数据匹配,实现多层级挂接。
可选的,在步骤S110中,
城市单元按城市管理层级设置包括省、市、行政区、街道、区域和网格在内的不同等级,不同管理层级形成包含关系,根据城市按管理层级将城市划分为在地理上相互独立的多个城市单元。
可选的,城市单元从大到小为省、市、行政区、街道、区域和地理格网。
城市单元能够面向不同的城市管理问题,应用不同尺度。
综上所述,本发明具有如下优点:
1.利用知识图谱、视觉知识和深度学习等技术,自动对城市实体的三维检测、分割、跟踪矢量、挂接属性入库,将物理世界中多源异构和多模态的空间大数据组织形成复杂庞大的数据语义网络,解决跨领域的数据在几何位置、属性语义、逻辑等方面的相似性、不一致性问题。
2.结合天-空-地一体化多源三维数据融合和可视化技术,实现静态三维可视化向智能动态可视化转变。
3.构建多源异构时空数据资源池,实现多源、异构、封闭系统的城市政务大数据的透明融合。
附图说明
图1是根据本发明具体实施例的基于城市信息单元的多源时空数据融合方法的流程图;
图2是根据本发明具体实施例的塔式城市信息单元数据剖分;
图3是根据本发明具体实施例的城市信息单元编码规则;
图4是根据本发明具体实施例的高精度城市环境评价系统框架;
图5是根据本发明具体实施例的基于地理编码的数据多语义表达与透明融合的示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本发明利用知识图谱、视觉知识和深度学习等技术,自动对城市实体的三维检测、分割、跟踪矢量、挂接属性入库,将物理世界中多源异构和多模态的空间大数据组织形成复杂庞大的数据语义网络,解决跨领域的数据在几何位置、属性语义、逻辑等方面的相似性、不一致性问题;并结合天-空-地一体化多源三维数据融合和可视化技术,实现静态三维可视化向智能动态可视化转变;构建多源异构时空数据资源池,实现多源、异构、封闭系统的城市政务大数据的透明融合。
具体的,本发明首先对多源、多维、异构时空大数据进行主动汇集,进行语义解析,完成地理知识时空构建;建立数据匹配模型和关联模型,搭建数据透明融合框架;结合多源异构数据要素匹配技术,构建时空数据透明融合规则;最终在众多融合方法的支持下,实现城市实体与时空多源时空数据的透明融合。
具体而言,参见图1,基于城市信息单元的多源时空数据透明融合方法包括如下步骤:
城市信息单元划分和多源异构数据整合描述步骤S110:
在地理空间信息的实际应用中,空间数据种类繁多、关系复杂,且不同行业有不同内容的专业信息,地理空间数据的生产、维护分散在不同的单位且采用的数据标准各异,造成了部门或系统之间、不同历史阶段之间标准不统一。
因此,本步骤为:依据城市管理层级,将城市进行整体剖分,构建空间基础信息实体,定义多层级城市信息单元和城市信息单元包含的多源异构时空数据。
具体的,
城市信息单元定义划分子步骤S111:
定义划分城市单元,根据城市按管理层级将城市划分为在地理上相互独立的多个城市单元,在城市单元中集成城市管理中积累的基础政务数据以及社会传感数据得到城市信息单元,本层单元内部包含所有下一层单元的联合特征,基于多层级城市单元构建城市信息的整体架构。
参见图3,为本发明实施例提供的一种塔式城市信息单元数据剖分示意图,按城市管理层级设置包括省、市、行政区、街道、区域和网格在内的不同等级,不同管理层级形成包含关系,根据城市按管理层级将城市划分为在地理上相互独立的多个城市单元。城市单元从大到小为省、市、行政区、街道、区域和地理格网,是一种多层级的单元,且存在上下级关联。如:北京市有16个行政区;其中海淀区由22个街道;每个街道又由学校、商超、运动场、小区等区域组成,在每个区域下,进一步划分格网,此时为最小的城市单元。
城市信息单元还是多粒度的,因此在本子步骤中,能够面向不同的城市管理问题,应用不同尺度的城市单元。如研究全市水电煤能耗情况时,采用市或区层级就可以满足需求,当研究某演唱会人群聚集情况时,则应选用区域或格网层级。
城市信息单元数据定义子步骤S112:
城市信息单元包含的多源异构时空数据为基础政务数据和社会传感数据,具体包括:经济数据、环保数据、建设数据和社会数据,所述经济数据包括:社会保障、经济发展数据,所述环保数据包括:生态环保、空气质量和水质数据,所述建设数据包括:城乡建设和交通数据,所述社会数据包括:社会舆情、POI数据、手机信令和音频视频数据;基础政务数据和社会传感数据主要分为5大类型:文本、图像、视频、网页、表格。
数据整合步骤S113:
对多源异构时空数据进行过滤、筛选等步骤的调整,剔除不合理的数据,并消除同名异义和异名同义、检验一致性、删除冗余数据和数据归并。
多源异构数据的特征抽取步骤S120:
提取地理实体特征中的空间、时间和关联性属性,基于位置和时间属性建立综合地理单元编码标识。
具体的,属性提取通过如下方式完成:
对于文本数据,通过深度学习模型自动学习上下文特征,通过随机场、最大熵利用模型抽取时间信息;利用规则匹配法、监督学习法获取到地理实体相关的属性特征和属性值。
由于深度学习模型对语料库的依赖较低,能够更好的识别数据中的地名、地址等信息,然后借助地名词典、上下文特征等进行地理实体消歧。同时,深度学习模型还可以从文本中辨别两个地理实体之间的关系,比如时间维度上的“相同”、“之前”、“之后”等时间关系;空间维度上的“相交”、“互斥”等空间关系。时间信息能够反映地理实体的变化,本发明通过随机场、最大熵等模型抽取时间信息。抽取属性信息的方法有规则匹配法、监督学习法等,获取到地理实体相关的属性特征和属性值。
对于图像数据:采用卷积神经网络通过图像识别技术对对象及场景的识别和内容简介的自动生成。
具体的,本发明中卷积神经网络卷积的数学表达由式(1)定义:
z(t)=f(t)*g(t)=∑f(τ)g(t-τ) (1)
其中,F和G分别叫做数学算子,由函数g重叠部分的面积计算得出,在由表征函数f经过翻转后,再经过平移而得到。其积分形式是:
z(t)=f(t)*g(t)=∫f(τ)g(t-τ)dτ=∫f(t-τ)g(τ)dτ (2)
将图像用二维坐标系的函数表示,记做f(x,y),g(x,y),由此得出z(x,y):
z(x,y)=f(x,y)*g(x,y) (3)
图像特征的提取是由卷积来实现的,二维坐标的计算表达式为:
z(x,y)=f(x,y)*g(x,y)=∑∑f(t,h)g(x-t,y-h) (4)
其积分形式为:
z(x,y)=(f-g)(x,y)=∫∫f(t,h)g(x-t,y-h)dtdh (5)
m*n卷积核的定义表达式为:
Z(x,y)=f(x,y)*g(x,y)=∑∑f(t,h)g(x-t,y-h) (6)
其中,f为输入图像,g为卷积核,m、n为卷积核大小,t,h为矩阵f的行列数。
设M*N为一张图像的大小,n*n为卷积核大小,把n*n乘每个M*M,就是把所有的n*n拿出来,最后形成一个向量,经过两个操作后,会得到(M-n+1)*(M-n+1);在所有的n*n被小图表示成功后就得到最终的表示。
数据的时间特征提取为:利用最小二乘准则匹配法,内插外推等的时间匹配算法将关于同一目标的不同来源的不同步的信息同步到同一时刻实现空间数据的时间配准,如来自2022/01/01北京市MODIS遥感影像数据与2022/2/1北京市MODIS遥感影像数据都可以被2022年北京市MODIS遥感影像检索到。
数据的空间特征提取为:对于数据中的空间信息,进行语义地址匹配,对于给定的语料库数据集D={add1,add2,…,addn},语义地址匹配的目标是找到地址对(addi,addj),满足addi=addj,其中ad□i∈D,addj∈D且i≠j,以确保数据空间位置的准确性。
对于综合地理单元编码标识,在多源时空大数据的应用过程中,合理的数据存储方式可以提高数据的检索效率,节约数据应用成本,提高数据服务质量。
参见图5,示出了一种编码规则,本方法采用了一种基于城市信息单元的数据立方体并赋予综合地理单元编码标识,在传统二维地理空间编码的基础上,增加对时间属性的编码,综合地理单元编码标识由位置码+语义码+时间码+关联码组成,在城市信息单元基础上开展时空数据透明融合服务模型设计和研究,遵循透明计算范式的数据服务,支持通过透明的集成和融合来自不同来源的数据来提供数据服务。根据上一步骤提取出来的数据特征,对数据进行编码。
具体的,综合地理单元编码标识编码规则如下:
1)位置码:行政区代码有9位,由省、市、区、街道组成,编码符合GB/T 2260和GD/T10114的规定,在此基础上添加6位,分别表示所在区域与最小格网;
2)语义码:表示数据属性信息;
3)时间码:表示信息单元产生时间中的时间元素“年”、“月”和“日”,执行GB/T7408;在此基础上添加4位,分别表示是否为节假日与时间间隔;
4)关联码:有效范围为01-99之间,用以标注此城市信息单元与相关信息单元的关联强度,数字越接近01,说明此条记录具有特殊性,用于监测时空行为异常。如:在某时间(时间码),某栋楼(位置码)出现停电现象(语义码),而周边信息单元并未发生此类情况时,此条记录的关联码应该较接近于01,用以表明数据特殊性。
城市单元也可以按位置码进行数据编码,粒度越大,位置码越短,反之越长。如:北京市为110,北京市朝阳区三里屯街道编码为110102004。
基于城市单元的多源异构数据匹配步骤S130:
基于唯一的地理单元编码标识,可支持多种环境信息快速入库和集中管理,实现地址语义与空间信息融合。地理编码可将空间查询转换为整型编码数值匹配查询,大大提高矢量、关注区域等查询效率。
因此,本步骤为:基于统一的地理单元编码标识将来自多部门、多类型的数据集成在一个平台上按剖分网格进行多尺度统计展示,实现基于剖分塔式层级数据的快速请求、生成与服务。
具体的,步骤S130包括:
数据与地理单元挂接子步骤S131:
通过对多源时空数据进行整合、特征提取、数据编码,根据位置码实现数据与地理单元的动态挂接。
参见图2展示了一种城市单元塔式划分和数据匹配规则。
多层级挂接子步骤S132:
利用地理单元编码标识下的城市实体与数据匹配,实现多层级挂接。
例如,当城市单元编码与数据编码前2、4、6、9、12、15位匹配时,便可挂接。如某一数据来自北京市海淀区羊坊店街道,则该数据可挂接的信息单元有北京市、北京市海淀区和北京市海淀区羊坊店街道。
通过统一的城市信息单元地理编码体系,可以在城市基础时空地理数据的基础上建立多源数据的关联匹配,实现多维空间信息的高效索引。
本发明中,所述的数据透明融合框架用于城市管理过程中多源异构数据的面向主题融合,该框架可以将海量多源异构数据的动态挂接至城市信息单元,实现面向主题的决策级融合,让使用者不需要了解原始数据来源与数据全貌,却能够获取到所需的融合后结果,让城市管理更加便捷高效。参见图5,示出了基于地理编码的数据多语义表达与透明融合。
实施例:
参见图4,示出了高精度城市环境质量评估框架,此类框架为城市大数据资源池中数据融合规则库的一部分,数据融合规则库中包含众多算法和框架,并在数据持续不断的接入与融合目标的不断扩充下得到提升。
此处展示的框架主要由3个部分组成:
1)同构数据聚合,其主要通过差异分析、数据分析及关系分析对不同源数据进行匹配,从而找到相似性较高的同构数据集合,通过语义关系和知识关联度,找到城市环境评价相关的因子并进行特征提取,例如气象数据、地表覆盖、污染物、遥感影像等数据;
2)构建子分类器,在同构的多源数据中,针对数据类型选择合适的建模方法对任务目标进行推理,对于城市环境评价,主要考虑三个子分类器:时间分类器、空间分类器及影像分类器,分别识别城市环境时间变化规律、空间分布现状以及根据影像信息对环境现状进行实时评估;
3)模型集成,基于多子分类器的推理结果进行模型集成,并得到最终的推理模型,本章采用基于极限学习机(Extreme Learning Machine,ELM)的多层神经网络对多子分类器进行聚合。
本发明具有如下优点:
1.利用知识图谱、视觉知识和深度学习等技术,自动对城市实体的三维检测、分割、跟踪矢量、挂接属性入库,将物理世界中多源异构和多模态的空间大数据组织形成复杂庞大的数据语义网络,解决跨领域的数据在几何位置、属性语义、逻辑等方面的相似性、不一致性问题。
2.结合天-空-地一体化多源三维数据融合和可视化技术,实现静态三维可视化向智能动态可视化转变。
3.构建多源异构时空数据资源池,实现多源、异构、封闭系统的城市政务大数据的透明融合。
显然,本领域技术人员应该明白,上述的本发明的各单元或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定保护范围。
Claims (9)
1.一种基于城市信息单元的多源时空数据透明融合方法,其特征在于:
城市信息单元划分和多源异构数据整合描述步骤S110:
依据城市管理层级,将城市进行整体剖分,构建空间基础信息实体,定义多层级城市信息单元和城市信息单元包含的多源异构时空数据;
多源异构数据的特征抽取步骤S120:
提取地理实体特征中的空间、时间和关联性属性,基于位置和时间属性建立综合地理单元编码标识;
基于城市单元的多源异构数据匹配步骤S130:
基于统一的地理单元编码标识将来自多部门、多类型的数据集成在一个平台上按剖分网格进行多尺度统计展示,实现基于剖分塔式层级数据的快速请求、生成与服务。
2.根据权利要求1所述的基于城市信息单元的多源时空数据透明融合方法,其特征在于:
步骤S110包括:
城市信息单元定义划分子步骤S111:
定义划分城市单元,根据城市按管理层级将城市划分为在地理上相互独立的多个城市单元,在城市单元中集成城市管理中积累的基础政务数据以及社会传感数据得到城市信息单元,本层单元内部包含所有下一层单元的联合特征,基于多层级城市单元构建城市信息的整体架构;
城市信息单元数据定义子步骤S112:
城市信息单元包含的多源异构时空数据为基础政务数据和社会传感数据,具体包括:经济数据、环保数据、建设数据和社会数据,所述经济数据包括:社会保障、经济发展数据,所述环保数据包括:生态环保、空气质量和水质数据,所述建设数据包括:城乡建设和交通数据,所述社会数据包括:社会舆情、POI数据、手机信令和音频视频数据;基础政务数据和社会传感数据主要分为5大类型:文本、图像、视频、网页、表格;
数据整合步骤S113:
对多源异构时空数据进行过滤、筛选的调整,剔除不合理的数据,并消除同名异义和异名同义、检验一致性、删除冗余数据和数据归并。
3.根据权利要求1所述的基于城市信息单元的多源时空数据透明融合方法,其特征在于:
在步骤S120中,
属性提取通过如下方式完成:
对于文本数据,通过深度学习模型自动学习上下文特征,通过随机场、最大熵利用模型抽取时间信息;利用规则匹配法、监督学习法获取到地理实体相关的属性特征和属性值;
对于图像数据:采用卷积神经网络通过图像识别技术对对象及场景的识别和内容简介的自动生成;
数据的时间特征提取为:利用最小二乘准则匹配法,内插外推的时间匹配算法将关于同一目标的不同来源的不同步的信息同步到同一时刻实现空间数据的时间配准;
数据的空间特征提取为:对于数据中的空间信息,进行语义地址匹配,对于给定的语料库数据集D={add1,add2,…,addn},语义地址匹配的目标是找到地址对(addi,addj),满足addi=addj,其中addi∈D,addj∈D且i≠j,以确保数据空间位置的准确性。
4.根据权利要求3所述的基于城市信息单元的多源时空数据透明融合方法,其特征在于:
在步骤S120中,
综合地理单元编码标识由位置码+语义码+时间码+关联码组成。
5.根据权利要求4所述的基于城市信息单元的多源时空数据透明融合方法,其特征在于:
综合地理单元编码标识编码规则如下:
1)位置码:行政区代码有9位,由省、市、区、街道组成,编码符合GB/T 2260和GD/T10114的规定,在此基础上添加6位,分别表示所在区域与最小格网;
2)语义码:表示数据属性信息;
3)时间码:表示信息单元产生时间中的时间元素“年”、“月”和“日”,执行GB/T 7408;在此基础上添加4位,分别表示是否为节假日与时间间隔;
4)关联码:有效范围为01-99之间,用以标注此城市信息单元与相关信息单元的关联强度。
6.根据权利要求1所述的基于城市信息单元的多源时空数据透明融合方法,其特征在于:
步骤S130包括:
数据与地理单元挂接子步骤S131:
通过对多源时空数据进行整合、特征提取、数据编码,根据位置码实现数据与地理单元的动态挂接;
多层级挂接子步骤S132:
利用地理单元编码标识下的城市实体与数据匹配,实现多层级挂接。
7.根据权利要求2所述的基于城市信息单元的多源时空数据透明融合方法,其特征在于:
在步骤S110中,
城市单元按城市管理层级设置包括省、市、行政区、街道、区域和网格在内的不同等级,不同管理层级形成包含关系,根据城市按管理层级将城市划分为在地理上相互独立的多个城市单元。
8.根据权利要求7所述的基于城市信息单元的多源时空数据透明融合方法,其特征在于:
城市单元从大到小为省、市、行政区、街道、区域和地理格网。
9.根据权利要求7所述的基于城市信息单元的多源时空数据透明融合方法,其特征在于:
城市单元能够面向不同的城市管理问题,应用不同尺度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310180533.1A CN116522272A (zh) | 2023-02-17 | 2023-02-17 | 一种基于城市信息单元的多源时空数据透明融合方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310180533.1A CN116522272A (zh) | 2023-02-17 | 2023-02-17 | 一种基于城市信息单元的多源时空数据透明融合方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116522272A true CN116522272A (zh) | 2023-08-01 |
Family
ID=87405341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310180533.1A Pending CN116522272A (zh) | 2023-02-17 | 2023-02-17 | 一种基于城市信息单元的多源时空数据透明融合方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116522272A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116737817A (zh) * | 2023-08-04 | 2023-09-12 | 深圳市智慧城市科技发展集团有限公司 | 多源异构数据融合方法、设备及计算机可读存储介质 |
CN117112654A (zh) * | 2023-10-24 | 2023-11-24 | 北京白龙马云行科技有限公司 | 城市数据展示方法、装置、计算机设备和存储介质 |
CN118114183A (zh) * | 2024-04-25 | 2024-05-31 | 青岛星邦光电科技有限责任公司 | 城市信息多源数据融合方法、装置、存储介质及电子系统 |
CN118115632A (zh) * | 2024-04-28 | 2024-05-31 | 山东省国土测绘院 | 一种跨区域地理实体数据协调处理方法及系统 |
-
2023
- 2023-02-17 CN CN202310180533.1A patent/CN116522272A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116737817A (zh) * | 2023-08-04 | 2023-09-12 | 深圳市智慧城市科技发展集团有限公司 | 多源异构数据融合方法、设备及计算机可读存储介质 |
CN116737817B (zh) * | 2023-08-04 | 2023-11-07 | 深圳市智慧城市科技发展集团有限公司 | 多源异构数据融合方法、设备及计算机可读存储介质 |
CN117112654A (zh) * | 2023-10-24 | 2023-11-24 | 北京白龙马云行科技有限公司 | 城市数据展示方法、装置、计算机设备和存储介质 |
CN117112654B (zh) * | 2023-10-24 | 2024-01-16 | 北京白龙马云行科技有限公司 | 城市数据展示方法、装置、计算机设备和存储介质 |
CN118114183A (zh) * | 2024-04-25 | 2024-05-31 | 青岛星邦光电科技有限责任公司 | 城市信息多源数据融合方法、装置、存储介质及电子系统 |
CN118115632A (zh) * | 2024-04-28 | 2024-05-31 | 山东省国土测绘院 | 一种跨区域地理实体数据协调处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xia et al. | Study on city digital twin technologies for sustainable smart city design: A review and bibliometric analysis of geographic information system and building information modeling integration | |
Zuiev et al. | Development of complex methodology of processing heterogeneous data in intelligent decision support systems | |
CN107092680B (zh) | 一种基于地理网格的政务信息资源整合方法 | |
Shyshatskyi et al. | Complex Methods of Processing Different Data in Intellectual Systems for Decision Support Systems | |
Wang et al. | Machine learning-based regional scale intelligent modeling of building information for natural hazard risk management | |
CN116522272A (zh) | 一种基于城市信息单元的多源时空数据透明融合方法 | |
CN108446293A (zh) | 一种基于城市多源异构数据构建城市画像的方法 | |
Liu et al. | Simulating urban dynamics in China using a gradient cellular automata model based on S-shaped curve evolution characteristics | |
CN115269751A (zh) | 地理实体时空知识图谱本体库构建方法 | |
CN115774861B (zh) | 一种自然资源多源异构数据汇聚融合服务系统 | |
CN104699734A (zh) | 一种面向主题的大规模地理空间数据动态融合方法 | |
CN113570275A (zh) | 基于bim和数字高程模型的水资源实时监测系统 | |
Guo et al. | Monitoring and simulation of dynamic spatiotemporal land use/cover changes | |
CN111104449A (zh) | 基于地理空间画像挖掘的多源城市时空标准地址融合方法 | |
Wang et al. | Spatial query based virtual reality GIS analysis platform | |
CN116010722A (zh) | 一种基于网格时空知识图谱的动态多目标时空问题的查询方法 | |
Zhang | Classification of Urban Land Use Based on Graph Theory and Geographic Information System. | |
Hu et al. | Urban landscape information atlas and model system based on remote sensing images | |
CN117113471A (zh) | 一种基于cim技术的城市仿真模型算法 | |
Li et al. | Comparing the three-dimensional morphologies of urban buildings along the urban-rural gradients of 91 cities in China | |
Ding et al. | Cloud computing and internet of things in the evaluation of ecological environment quality in rural tourist areas in smart cities | |
Lianbing et al. | Emergency management system of urban waterlogging based on cloud computing platform and 3D visualization | |
CN115048473A (zh) | 城市信息模型人工智能服务方法及系统 | |
CN108132992B (zh) | 一种人员信息基础地址编码方法、系统及电子设备 | |
Cheng et al. | Network SpaceTime AI: Concepts, Methods and Applications. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |