CN111949706A - 面向土地大数据分布式挖掘分析的存储方法 - Google Patents

面向土地大数据分布式挖掘分析的存储方法 Download PDF

Info

Publication number
CN111949706A
CN111949706A CN202010770169.0A CN202010770169A CN111949706A CN 111949706 A CN111949706 A CN 111949706A CN 202010770169 A CN202010770169 A CN 202010770169A CN 111949706 A CN111949706 A CN 111949706A
Authority
CN
China
Prior art keywords
information
land
big data
historical
administrative district
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010770169.0A
Other languages
English (en)
Other versions
CN111949706B (zh
Inventor
杨宜舟
李飞
郭瑞功
李晶云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiwei Space Information Co Ltd
Original Assignee
Beijing Jiwei Space Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiwei Space Information Co Ltd filed Critical Beijing Jiwei Space Information Co Ltd
Priority to CN202010770169.0A priority Critical patent/CN111949706B/zh
Publication of CN111949706A publication Critical patent/CN111949706A/zh
Application granted granted Critical
Publication of CN111949706B publication Critical patent/CN111949706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Fuzzy Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种面向土地大数据分布式挖掘分析的存储方法,属于数据处理技术领域。本发明在接收到土地大数据获取指令时,提取所述土地大数据获取指令中的输入参数;根据所述输入参数确定行政区属性信息;根据所述输入参数确定空间属性信息;根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据,通过行政区属性信息和空间属性信息从预设分布式土地数据库中得到目标土地大数据,能够将行政区属性以及空间属性与土地大数据进行有效关联,从而解除了在输入/输出(I/O)性能和业务适用性方面对土地大数据的分析计算性能的制约,提升了土地大数据计算分析的效率。

Description

面向土地大数据分布式挖掘分析的存储方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种面向土地大数据分布式挖掘分析的存储方法。
背景技术
随着土地资源数据管理与应用服务的深入开展,土地空间数据分析面临从“量变”到“质变”的挑战,对土地基础数据的保障需求全面性、应用服务的深入性以及计算分析的时效性提出了更高的要求。与传统计算相比,土地空间数据分析具有数据敏感性、拓扑一致性以及计算密集性等显著特征,而且国土业务中的数据组织也具有区域性的特点(例如县级行政区域组织数据)。传统架构的存储方法以及现有通用型的空间大数据存储方法,都不能很好为土地大数据存储与读取提供有效支撑,使得土地大数据的分析计算性能在输入/输出(I/O)性能和业务适用性方面存在制约。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种面向土地大数据分布式挖掘分析的存储方法,旨在解决现有技术中土地大数据的分析计算性能在I/O性能和业务适用性方面存在制约的技术问题。
为实现上述目的,本发明提供了一种面向土地大数据分布式挖掘分析的存储方法,所述方法包括以下步骤:
在接收到土地大数据获取指令时,提取所述土地大数据获取指令中的输入参数;
根据所述输入参数确定行政区属性信息;
根据所述输入参数确定空间属性信息;
根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据。
优选地,所述预设分布式土地数据库包括数据字典,所述数据字典包括依序排列的国家级行政区信息、省级行政区信息、市级行政区信息以及县级行政区信息;
所述根据所述输入参数确定行政区属性信息的步骤,包括:
根据所述输入参数信息查询所述预设分布式土地数据库中的数据字典,得到所述输入参数信息对应的国家级行政区信息;
根据所述国家级行政区信息得到省级行政区信息;
根据所述省级行政区信息得到市级行政区信息;
根据所述市级行政区信息得到县级行政区信息,将所述县级行政区信息作为所述行政区属性信息。
优选地,所述预设分布式土地数据库包括元数据信息;
所述根据所述输入参数确定空间属性信息的步骤包括:
根据所述输入参数查询所述预设分布式土地数据库中的元数据信息,得到所述元数据信息中的空间填充曲线;
根据所述空间填充曲线对所述输入参数进行解码,得到所述输入参数对应的编码列表;
将所述空间填充曲线和所述编码列表作为空间属性信息。
优选地,所述预设分布式土地数据库包括土地数据块集;
所述根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据的步骤包括:
根据所述空间属性信息从所述预设分布式土地数据库中的土地数据块集中获取所述输入参数对应的参考土地大数据;
根据所述行政区属性信息对所述参考土地大数据进行筛选,得到目标土地大数据。
优选地,所述根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据的步骤之前,还包括:
获取历史土地大数据的属性信息;
从所述属性信息中获取投影信息和空间范围信息;
根据所述投影信息确定历史数据字典;
根据所述空间范围信息确定历史土地数据块集和空间填充信息;
将所述投影信息、所述空间范围信息以及所述空间填充信息作为历史元数据信息;
根据所述历史数据字典、所述历史土地数据块集以及所述历史元数据信息建立预设分布式土地数据库。
优选地,所述根据所述投影信息确定历史数据字典的步骤包括:
根据所述投影信息确定历史县级行政区信息;
依次获取与所述历史县级行政区信息关联的历史市级行政区信息、历史省级行政区信息以及历史国家级行政区信息;
基于所述历史国家级行政区信息、所述历史省级行政区信息、所述历史市级行政区信息以及所述历史县级行政区信息构建历史数据字典。
优选地,所述根据所述空间范围信息确定历史土地数据块集和空间填充信息的步骤包括:
根据所述空间范围信息确定所述历史土地大数据对应的目标包围盒;
基于所述目标包围盒对所述历史土地大数据进行四叉树划分,以获得历史土地数据块集;
获取四叉树划分的深度以及所述历史土地数据块集中土地数据块的中心点;
在每层深度中按照预设方式对土地数据块进行编码,得到编码信息,并依次将土地数据块的中心点进行连接,得到空间填充曲线;
将所述编码信息、所述空间填充曲线以及所述深度作为空间填充信息。
此外,为实现上述目的,本发明还提出一种面向土地大数据分布式挖掘分析的存储装置,所述面向土地大数据分布式挖掘分析的存储装置包括:
接收模块,用于在接收到土地大数据获取指令时,提取所述土地大数据获取指令中的输入参数;
获取模块,用于根据所述输入参数确定行政区属性信息;
获取模块,还用于根据所述输入参数确定空间属性信息;
读取模块,用于根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据。
本发明在接收到土地大数据获取指令时,提取所述土地大数据获取指令中的输入参数;根据所述输入参数确定行政区属性信息;根据所述输入参数确定空间属性信息;根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据,通过行政区属性信息和空间属性信息从预设分布式土地数据库中得到目标土地大数据,能够将行政区属性以及空间属性与土地大数据进行有效关联,从而解除了在I/O性能和业务适用性方面对土地大数据的分析计算性能的制约,提升了土地大数据计算分析的效率。
附图说明
图1为本发明面向土地大数据分布式挖掘分析的存储方法第一实施例的流程示意图;
图2为本发明面向土地大数据分布式挖掘分析的存储方法第二实施例的流程示意图;
图3为本发明面向土地大数据分布式挖掘分析的存储方法第三实施例的流程示意图;
图4为本发明面向土地大数据分布式挖掘分析的存储装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明实施例提供了一种面向土地大数据分布式挖掘分析的存储方法,参照图1,图1为本发明一种面向土地大数据分布式挖掘分析的存储方法第一实施例的流程示意图。
本实施例中,所述面向土地大数据分布式挖掘分析的存储方法包括以下步骤:
步骤S10:在接收到土地大数据获取指令时,提取所述土地大数据获取指令中的输入参数。
在本实施例中,本实施例的执行主体可为计算机,还可以为其他用于数据存储与读取的终端设备,本实施例中不加以限制。
在具体实施中,接收到土地大数据获取指令,并从土地大数据获取指令中提取输入参数,输入参数可以为某一行政区的行政区信息,也可以为任意选取的区域范围,输入参数可以用于确定想要读取哪一行政区或哪一区域范围对应的土地大数据。
步骤S20:根据所述输入参数确定行政区属性信息。
需要说明的是,土地大数据中包含全国各地各个行政区的土地大数据,在对土地大数据进行读取的时候,通常读取的是某一行政区的土地大数据,为了能够确定所要读取土地大数据的行政区,需要获取行政区对应的行政区属性信息,本实施例中根据输入参数中的行政区信息可以确定行政区对应的县级行政区信息,县级行政区信息即为行政区的行政区属性信息。
步骤S30:根据所述输入参数确定空间属性信息。
需要说明的是,土地大数据实质是一种具有空间结构的数据,在确定所要读取土地大数据的行政区之后,还需要确定所要读取的土地大数据的空间属性信息,本实施例中根据输入参数在预设分布式土地数据库中查找输入参数对应的属性信息。
步骤S40:根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据。
需要说明的是,预设分布式土地数据库中存储有土地大数据,并且所存储的土地大数据在行政区属性和空间属性上具有关联性,因此在得到行政区属性信息和空间属性信息之后,可以根据所要读取的土地大数据对应的行政区属性信息和空间属性信息从预设分布式土地数据库中可以读取到目标土地大数据,目标土地大数据为用于分析与计算的土地大数据。
本实施例在接收到土地大数据获取指令时,提取所述土地大数据获取指令中的输入参数;根据所述输入参数确定行政区属性信息;根据所述输入参数确定空间属性信息;根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据,通过行政区属性信息和空间属性信息从预设分布式土地数据库中得到目标土地大数据,能够将行政区属性以及空间属性与土地大数据进行有效关联,从而解除了在I/O性能和业务适用性方面对土地大数据的分析计算性能的制约,提升了土地大数据计算分析的效率。
参考图2,图2为本发明一种面向土地大数据分布式挖掘分析的存储方法第二实施例的流程示意图。
基于上述第一实施例,在本实施例中,所述步骤S20具体包括:
步骤S201:根据所述输入参数信息查询所述预设分布式土地数据库中的数据字典,得到所述输入参数信息对应的国家级行政区信息。
需要说明的是,预设分布式土地数据库中存储有土地大数据对应的数据字典,数据字典包括依序排列的国家级行政区信息、省级行政区信息、市级行政区信息以及县级行政区信息,采用的是国家(G)-省级(Pn)-市级(Cn)-县级(Zn)四级关联的模式,从数据字典中可以查询到对应的国家级行政区信息。
步骤S202:根据所述国家级行政区信息得到省级行政区信息。
在具体实施中,根据国家级行政区信息可以得到省级行政区信息,例如国家级行政区信息为中国{湖北省、湖南省},可以得到湖北省行政区信息和湖南省行政区信息。
步骤S203:根据所述省级行政区信息得到市级行政区信息。
在具体实施中,根据省级行政区信息可以得到市级行政区信息,例如省级行政区信息为湖北省{武汉市、十堰市},可以得到武汉市行政区信息和十堰市行政区信息。
步骤S204:根据所述市级行政区信息得到县级行政区信息,将所述县级行政区信息作为所述行政区属性信息。
在具体实施中,根据市级行政区信息可以得到县级行政区信息,例如市级行政区信息为十堰市{房县、郧西县},可以得到房县行政区信息和郧西县行政区信息,房县行政区信息和郧西县行政区信息为行政区属性信息。
进一步地,所述步骤S30包括:
步骤S301:根据所述输入参数查询所述预设分布式土地数据库中的元数据信息,得到所述元数据信息中的空间填充曲线。
需要说明的是,预设分布式土地数据库中还存储有土地大数据的元数据信息,本实施例中存储在预设分布式土地数据库中的土地大数据进行了四叉树划分,每一层次四叉树深度中的土地数据块的中心点的连线为空间填充曲线,因此可以根据输入参数所在的深度得到元数据信息中的空间填充曲线。
步骤S302:根据所述空间填充曲线对所述输入参数进行解码,得到所述输入参数对应的编码列表。
需要说明的是,每层四叉树深度中的土地数据块都有相应的编码,通过空间填充曲线对输入参数进行解码可以得到输入参数对应的空间填充曲线所连接的土地数据块,获取各个土地数据块对应的编码,从而可以得到输入参数对应的编码列表。
步骤S303:将所述空间填充曲线和所述编码列表作为空间属性信息。
在本实施例中,空间填充曲线和编码列表即可构成空间属性信息。
本实施例中根据所述输入参数信息查询所述预设分布式土地数据库中的数据字典,得到所述输入参数信息对应的国家级行政区信息;根据所述国家级行政区信息得到省级行政区信息;根据所述省级行政区信息得到市级行政区信息;根据所述市级行政区信息得到县级行政区信息,将所述县级行政区信息作为所述行政区属性信息,通过预设分布式土地数据库中数据字典包含的四级关联行政区信息查询输入参数对应的县级行政区信息,同时根据所述输入参数查询所述预设分布式土地数据库中的元数据信息,得到所述元数据信息中的空间填充曲线;根据所述空间填充曲线对所述输入参数进行解码,得到所述输入参数对应的编码列表;将所述空间填充曲线和所述编码列表作为空间属性信息,能够准确获取到所要读取的土地大数据的行政区属性信息和空间属性信息,基于行政区属性信息与空间属性信息的关联性,从而解除土地大数据的分析计算性能在I/O性能和业务适用性方面的制约。
参考图3,图3为本发明一种面向土地大数据分布式挖掘分析的存储方法第三实施例的流程示意图。
基于上述第一实施例或第二实施例,提出本发明一种面向土地大数据分布式挖掘分析的存储方法第三实施例。
以基于上述第一实施例为例进行说明,在本实施例中,所述步骤S40之前,还包括:
步骤S401:获取历史土地大数据的属性信息。
容易理解的是,在根据行政区信息和空间属性信息查询预设分布式土地数据库查询土地大数据之前,需要建立预设分布式土地数据库,本实施例中基于历史土地大数据的属性信息构建预设分布式土地数据库,属性信息包括历史土地大数据的图层、空间范围以及最小包围盒范围等。
步骤S402:从所述属性信息中获取投影信息和空间范围信息。
需要说明的是,土地大数据是空间数据结构,基于三维空间转化为二维平面的原理可以根据土地大数据的空间范围获取投影信息,空间范围信息包括土地大数据的空间范围和最小包围盒范围等。
步骤S403:根据所述投影信息确定历史数据字典。
在具体实施中,根据投影信息可以确定历史数据字典,具体为:根据所述投影信息确定历史县级行政区信息;依次获取与所述历史县级行政区信息关联的历史市级行政区信息、历史省级行政区信息以及历史国家级行政区信息;基于所述历史国家级行政区信息、所述历史省级行政区信息、所述历史市级行政区信息以及所述历史县级行政区信息构建历史数据字典。
需要说明的是,投影信息为土地大数据的二维信息,类似于地球的地理数据转化为地图的过程,根据投影信息可以获取各级行政区信息,本实施例中从历史县级行政区信息开始依次获取与历史县级行政区信息关联的市级行政区信息、省级行政区信息以及国家级行政区信息,采用四级关联模式构建数据字典,数据字典的结构为G{Pi,Pj,...,Pm}、P{Ci,Cj,...,Cm}、C{Zi,Zj,...,Zm}、Z{N,Cn,dn,en,fn,hn},其中G表示国家级行政区信息,P表示省级行政区信息,C表示市级行政区信息,Z表示县级行政区信息,县级行政区信息中的N为行政区名称,Cn为行政区编码,dn,en,fn以及hn为行政区的小包围盒范围。
步骤S404:根据所述空间范围信息确定历史土地数据块集和空间填充信息。
在具体实施中,在得到空间范围信息后,根据空间范围信息确定历史土地数据集合空间填充信息的过程具体为:根据所述空间范围信息确定所述历史土地大数据对应的目标包围盒;基于所述目标包围盒对所述历史土地大数据进行四叉树划分,以获得历史土地数据块集;获取四叉树划分的深度以及所述历史土地数据块集中土地数据块的中心点;在每层深度中按照预设方式对土地数据块进行编码,得到编码信息,并依次将土地数据块的中心点进行连接,得到空间填充曲线;将所述编码信息、所述空间填充曲线以及所述深度作为空间填充信息。
需要说明的是,目标包围盒为土地大数据的最小包围盒,由土地大数据的空间范围所决定。本实施例中基于四叉树划分原理对土地大数据进行划分,可以得到历史土地数据块集Si{b1,b2,...,bm},其中b1,b2,...,bm为土地数据块,在完成四叉树划分之后,获取四叉树划分的深度以及历史土地数据块的中心点,四叉树结构的每层深度中都有一定数量的土地数据块,按照预设方式对各个土地数据块进行编码,例如四叉树结构第一层中划分四个土地数据块,四个土地数据块的编码分别为1、2、3以及4,四叉树结构第二层中将编码为1的土地数据块继续划分成四个土地数据块,编码分别为1-1、1-2、1-3以及1-4,再按照前缀+编码+后缀的形式为每个土地数据块命名,即可得到编码信息。然后将每层深度中土地数据块的中心点依次连接,可以得到每层深度中的填充曲线。编码信息、空间填充曲线以及深度即为空间填充信息。
步骤S405:将所述投影信息、所述空间范围信息以及所述空间填充信息作为历史元数据信息。
在本实施例中,投影信息、空间范围信息以及空间填充信息组成历史元数据信息,元数据信息Mi{Bi,Ji,fc,D},其中,Bi为最小包围盒,Ji为投影信息,fc为空间填充曲线,D为深度。
步骤S406:根据所述历史数据字典、所述历史土地数据块集以及所述历史元数据信息建立预设分布式土地数据库。
在本实施例中,将历史数据字典、历史土地数据块集以及历史元数据信息存储在分布式文件系统中即可完成预设分布式土地数据库的建立。
进一步地,在本实施例中,所述步骤S40具体包括:
步骤S407:根据所述空间属性信息从所述预设分布式土地数据库中的土地数据块集中获取所述输入参数对应的参考土地大数据。
需要说明的是,行政区通常为不规则区域,而对土地大数据所采用的四叉树划分为规则划分,因此得到的土地大数据为参考土地大数据,参考土地大数据中包括目标行政区以及其他行政区,目标行政区的土地大数据是最终需要读取的。
步骤S408:根据所述行政区属性信息对所述参考土地大数据进行筛选,得到目标土地大数据。
在具体实施中,根据行政区属性信息对参考土地大数据进行筛选可以得到目标土地大数据,例如现在需要读取武汉市的土地大数据,而得到的参考土地大数据中包括武汉市的土地大数据和孝感市的土地大数据,根据武汉市的行政属性信息可以得到武汉市对应的行政区范围,将不属于武汉市行政区范围的土地大数据从参考土地大数据中剔除,可得到武汉市的土地大数据即目标土地大数据。
本实施例中获取历史土地大数据的属性信息;从所述属性信息中获取投影信息和空间范围信息;根据所述投影信息确定历史数据字典;根据所述空间范围信息确定历史土地数据块集和空间填充信息;将所述投影信息、所述空间范围信息以及所述空间填充信息作为历史元数据信息;根据所述历史数据字典、所述历史土地数据块集以及所述历史元数据信息建立预设分布式土地数据库,通过将历史数据字典、历史土地数据以及历史元数据信息进行存储,以建立预设分布式土地数据库,并且根据所述空间属性信息从所述预设分布式土地数据库中的土地数据块集中获取所述输入参数对应的参考土地大数据;根据所述行政区属性信息对所述参考土地大数据进行筛选,得到目标土地大数据,对从建立的预设分布式土地数据库中读取的参考土地大数据进行筛选,得到目标土地大数据,能够读取到更加准确的土地大数据。
参照图4,图4为本发明面向土地大数据分布式挖掘分析的存储装置第一实施例的结构框图。
如图4所示,本发明实施例提出的面向土地大数据分布式挖掘分析的存储装置包括:
接收模块10,用于在接收到土地大数据获取指令时,提取所述土地大数据获取指令中的输入参数。
在具体实施中,接收到土地大数据获取指令,并从土地大数据获取指令中提取输入参数,输入参数可以为某一行政区的行政区信息,也可以为任意选取的区域范围,输入参数可以用于确定想要读取哪一行政区或哪一区域范围对应的土地大数据。
获取模块20,用于根据所述输入参数确定行政区属性信息。
需要说明的是,土地大数据中包含全国各地各个行政区的土地大数据,在对土地大数据进行读取的时候,通常读取的是某一行政区的土地大数据,为了能够确定所要读取土地大数据的行政区,需要获取行政区对应的行政区属性信息,本实施例中根据输入参数中的行政区信息可以确定行政区对应的县级行政区信息,县级行政区信息即为行政区的行政区属性信息。
所述获取模块20,还用于根据所述输入参数确定空间属性信息。
需要说明的是,土地大数据实质是一种具有空间结构的数据,在确定所要读取土地大数据的行政区之后,还需要确定所要读取的土地大数据的空间属性信息,本实施例中根据输入参数在预设分布式土地数据库中查找输入参数对应的属性信息。
读取模块30,用于根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据。
需要说明的是,预设分布式土地数据库中存储有土地大数据,并且所存储的土地大数据在行政区属性和空间属性上具有关联性,因此在得到行政区属性信息和空间属性信息之后,可以根据所要读取的土地大数据对应的行政区属性信息和空间属性信息从预设分布式土地数据库中可以读取到目标土地大数据,目标土地大数据为用于分析与计算的土地大数据。
本实施例在接收到土地大数据获取指令时,提取所述土地大数据获取指令中的输入参数;根据所述输入参数确定行政区属性信息;根据所述输入参数确定空间属性信息;根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据,通过行政区属性信息和空间属性信息从预设分布式土地数据库中得到目标土地大数据,能够将行政区属性以及空间属性与土地大数据进行有效关联,从而解除了在I/O性能和业务适用性方面对土地大数据的分析计算性能的制约,提升了土地大数据计算分析的效率。
在一实施例中,所述获取模块20,还用于根据所述输入参数信息查询所述预设分布式土地数据库中的数据字典,得到所述输入参数信息对应的国家级行政区信息;根据所述国家级行政区信息得到省级行政区信息;根据所述省级行政区信息得到市级行政区信息;根据所述市级行政区信息得到县级行政区信息,将所述县级行政区信息作为所述行政区属性信息。
在一实施例中,所述获取模块20,还用于根据所述输入参数查询所述预设分布式土地数据库中的元数据信息,得到所述元数据信息中的空间填充曲线;根据所述空间填充曲线对所述输入参数进行解码,得到所述输入参数对应的编码列表;将所述空间填充曲线和所述编码列表作为空间属性信息。
在一实施例中,所述读取模块30,还用于根据所述空间属性信息从所述预设分布式土地数据库中的土地数据块集中获取所述输入参数对应的参考土地大数据;根据所述行政区属性信息对所述参考土地大数据进行筛选,得到目标土地大数据。
在一实施例中,所述面向土地大数据分布式挖掘分析的存储装置还包括构建模块,用于获取历史土地大数据的属性信息;从所述属性信息中获取投影信息和空间范围信息;根据所述投影信息确定历史数据字典;根据所述空间范围信息确定历史土地数据块集和空间填充信息;将所述投影信息、所述空间范围信息以及所述空间填充信息作为历史元数据信息;根据所述历史数据字典、所述历史土地数据块集以及所述历史元数据信息建立预设分布式土地数据库。
在一实施例中,所述构建模块,还用于根据所述投影信息确定历史县级行政区信息;依次获取与所述历史县级行政区信息关联的历史市级行政区信息、历史省级行政区信息以及历史国家级行政区信息;基于所述历史国家级行政区信息、所述历史省级行政区信息、所述历史市级行政区信息以及所述历史县级行政区信息构建历史数据字典。
在一实施例中,所述构建模块,还用于根据所述空间范围信息确定所述历史土地大数据对应的目标包围盒;基于所述目标包围盒对所述历史土地大数据进行四叉树划分,以获得历史土地数据块集;获取四叉树划分的深度以及所述历史土地数据块集中土地数据块的中心点;在每层深度中按照预设方式对土地数据块进行编码,得到编码信息,并依次将土地数据块的中心点进行连接,得到空间填充曲线;将所述编码信息、所述空间填充曲线以及所述深度作为空间填充信息。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的面向土地大数据分布式挖掘分析的存储方法,此处不再赘述。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种面向土地大数据分布式挖掘分析的存储方法,其特征在于,所述面向土地大数据分布式挖掘分析的存储方法包括:
在接收到土地大数据获取指令时,提取所述土地大数据获取指令中的输入参数;
根据所述输入参数确定行政区属性信息;
根据所述输入参数确定空间属性信息;
根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据。
2.如权利要求1所述的面向土地大数据分布式挖掘分析的存储方法,其特征在于,所述预设分布式土地数据库包括数据字典,所述数据字典包括依序排列的国家级行政区信息、省级行政区信息、市级行政区信息以及县级行政区信息;
所述根据所述输入参数确定行政区属性信息的步骤,包括:
根据所述输入参数信息查询所述预设分布式土地数据库中的数据字典,得到所述输入参数信息对应的国家级行政区信息;
根据所述国家级行政区信息得到省级行政区信息;
根据所述省级行政区信息得到市级行政区信息;
根据所述市级行政区信息得到县级行政区信息,将所述县级行政区信息作为所述行政区属性信息。
3.如权利要求1所述的面向土地大数据分布式挖掘分析的存储方法,其特征在于,所述预设分布式土地数据库包括元数据信息;
所述根据所述输入参数确定空间属性信息的步骤包括:
根据所述输入参数查询所述预设分布式土地数据库中的元数据信息,得到所述元数据信息中的空间填充曲线;
根据所述空间填充曲线对所述输入参数进行解码,得到所述输入参数对应的编码列表;
将所述空间填充曲线和所述编码列表作为空间属性信息。
4.如权利要求1至3中任一项所述的面向土地大数据分布式挖掘分析的存储方法,其特征在于,所述预设分布式土地数据库包括土地数据块集;
所述根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据的步骤包括:
根据所述空间属性信息从所述预设分布式土地数据库中的土地数据块集中获取所述输入参数对应的参考土地大数据;
根据所述行政区属性信息对所述参考土地大数据进行筛选,得到目标土地大数据。
5.如权利要求1至3中任一项所述的面向土地大数据分布式挖掘分析的存储方法,其特征在于,所述根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据的步骤之前,还包括:
获取历史土地大数据的属性信息;
从所述属性信息中获取投影信息和空间范围信息;
根据所述投影信息确定历史数据字典;
根据所述空间范围信息确定历史土地数据块集和空间填充信息;
将所述投影信息、所述空间范围信息以及所述空间填充信息作为历史元数据信息;
根据所述历史数据字典、所述历史土地数据块集以及所述历史元数据信息建立预设分布式土地数据库。
6.如权利要求5所述的面向土地大数据分布式挖掘分析的存储方法,其特征在于,所述根据所述投影信息确定历史数据字典的步骤包括:
根据所述投影信息确定历史县级行政区信息;
依次获取与所述历史县级行政区信息关联的历史市级行政区信息、历史省级行政区信息以及历史国家级行政区信息;
基于所述历史国家级行政区信息、所述历史省级行政区信息、所述历史市级行政区信息以及所述历史县级行政区信息构建历史数据字典。
7.如权利要求5所述的面向土地大数据分布式挖掘分析的存储方法,其特征在于,所述根据所述空间范围信息确定历史土地数据块集和空间填充信息的步骤包括:
根据所述空间范围信息确定所述历史土地大数据对应的目标包围盒;
基于所述目标包围盒对所述历史土地大数据进行四叉树划分,以获得历史土地数据块集;
获取四叉树划分的深度以及所述历史土地数据块集中土地数据块的中心点;
在每层深度中按照预设方式对土地数据块进行编码,得到编码信息,并依次将土地数据块的中心点进行连接,得到空间填充曲线;
将所述编码信息、所述空间填充曲线以及所述深度作为空间填充信息。
8.一种面向土地大数据分布式挖掘分析的存储装置,其特征在于,所述面向土地大数据分布式挖掘分析的存储装置包括:
接收模块,用于在接收到土地大数据获取指令时,提取所述土地大数据获取指令中的输入参数;
获取模块,用于根据所述输入参数确定行政区属性信息;
所述获取模块,还用于根据所述输入参数确定空间属性信息;
读取模块,用于根据所述行政区属性信息和所述空间属性信息查询预设分布式土地数据库,得到目标土地大数据。
CN202010770169.0A 2020-08-03 2020-08-03 面向土地大数据分布式挖掘分析的存储方法 Active CN111949706B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010770169.0A CN111949706B (zh) 2020-08-03 2020-08-03 面向土地大数据分布式挖掘分析的存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010770169.0A CN111949706B (zh) 2020-08-03 2020-08-03 面向土地大数据分布式挖掘分析的存储方法

Publications (2)

Publication Number Publication Date
CN111949706A true CN111949706A (zh) 2020-11-17
CN111949706B CN111949706B (zh) 2023-11-14

Family

ID=73338895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010770169.0A Active CN111949706B (zh) 2020-08-03 2020-08-03 面向土地大数据分布式挖掘分析的存储方法

Country Status (1)

Country Link
CN (1) CN111949706B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116976568A (zh) * 2023-09-25 2023-10-31 深圳文科园林股份有限公司 一种辅助城乡规划编制的数据共享方法及系统

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101051076A (zh) * 2006-04-03 2007-10-10 上海市闸北区绿化管理局 移动式空间数据采集、处理及发布方法
CN101110079A (zh) * 2007-06-27 2008-01-23 中国科学院遥感应用研究所 一种数字地球原型系统
CN101350013A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地理信息的搜索方法和系统
CN101593210A (zh) * 2008-12-30 2009-12-02 中国科学院地理科学与资源研究所 一种提高空间分辨率和更新速度的人口统计方法及系统
CN101625690A (zh) * 2009-07-07 2010-01-13 中国科学院地理科学与资源研究所 一种分布式、异构地学数据资源共享访问的方法及装置
CN101853305A (zh) * 2010-06-11 2010-10-06 湖南大学 一种构建综合农业环境信息数据库的方法
US20110159837A1 (en) * 2009-12-29 2011-06-30 At&T Mobility Ii Llc System And Method For The Definition And Scope Of Commercial Mobile Alerts
US20110287784A1 (en) * 2010-05-24 2011-11-24 Moshe Levin Method and system for mobile station location
CN102902782A (zh) * 2012-09-27 2013-01-30 浙江大学 一种海量多源异构空间信息数据无缝集成管理方法
CN103069417A (zh) * 2010-08-25 2013-04-24 国际商业机器公司 地理空间数据库集成
CN103559375A (zh) * 2013-11-22 2014-02-05 华中科技大学 调度工程水质改善的数值模拟及可视化仿真系统
CN103577609A (zh) * 2013-11-21 2014-02-12 武大吉奥信息技术有限公司 一种城乡一体化地籍空间数据管理建模方法
CN104182472A (zh) * 2014-07-29 2014-12-03 浙江大学 一种基于内存数据库Redis的土地利用矢量数据存储方法
CN105654414A (zh) * 2015-12-25 2016-06-08 浙江大学城市学院 基于开源体系架构和建筑物空间数据库的城市多灾害风险损失评测系统及方法
CN106021336A (zh) * 2016-05-09 2016-10-12 厦门四方中信科技有限公司 一种对批量地址信息进行自动行政区划划分的方法
CN107194504A (zh) * 2017-05-09 2017-09-22 云南师范大学 土地使用状态的预测方法、装置和系统
CN109711627A (zh) * 2018-12-28 2019-05-03 大庆市嘉华科技有限公司 一种数据处理方法及装置
CN110442669A (zh) * 2019-08-12 2019-11-12 广州小鹏汽车科技有限公司 一种全场景确定定位设备所在行政区位置的方法和系统

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101051076A (zh) * 2006-04-03 2007-10-10 上海市闸北区绿化管理局 移动式空间数据采集、处理及发布方法
CN101110079A (zh) * 2007-06-27 2008-01-23 中国科学院遥感应用研究所 一种数字地球原型系统
CN101350013A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地理信息的搜索方法和系统
CN101593210A (zh) * 2008-12-30 2009-12-02 中国科学院地理科学与资源研究所 一种提高空间分辨率和更新速度的人口统计方法及系统
CN101625690A (zh) * 2009-07-07 2010-01-13 中国科学院地理科学与资源研究所 一种分布式、异构地学数据资源共享访问的方法及装置
US20110159837A1 (en) * 2009-12-29 2011-06-30 At&T Mobility Ii Llc System And Method For The Definition And Scope Of Commercial Mobile Alerts
US20110287784A1 (en) * 2010-05-24 2011-11-24 Moshe Levin Method and system for mobile station location
CN101853305A (zh) * 2010-06-11 2010-10-06 湖南大学 一种构建综合农业环境信息数据库的方法
CN103069417A (zh) * 2010-08-25 2013-04-24 国际商业机器公司 地理空间数据库集成
CN102902782A (zh) * 2012-09-27 2013-01-30 浙江大学 一种海量多源异构空间信息数据无缝集成管理方法
CN103577609A (zh) * 2013-11-21 2014-02-12 武大吉奥信息技术有限公司 一种城乡一体化地籍空间数据管理建模方法
CN103559375A (zh) * 2013-11-22 2014-02-05 华中科技大学 调度工程水质改善的数值模拟及可视化仿真系统
CN104182472A (zh) * 2014-07-29 2014-12-03 浙江大学 一种基于内存数据库Redis的土地利用矢量数据存储方法
CN105654414A (zh) * 2015-12-25 2016-06-08 浙江大学城市学院 基于开源体系架构和建筑物空间数据库的城市多灾害风险损失评测系统及方法
CN106021336A (zh) * 2016-05-09 2016-10-12 厦门四方中信科技有限公司 一种对批量地址信息进行自动行政区划划分的方法
CN107194504A (zh) * 2017-05-09 2017-09-22 云南师范大学 土地使用状态的预测方法、装置和系统
CN109711627A (zh) * 2018-12-28 2019-05-03 大庆市嘉华科技有限公司 一种数据处理方法及装置
CN110442669A (zh) * 2019-08-12 2019-11-12 广州小鹏汽车科技有限公司 一种全场景确定定位设备所在行政区位置的方法和系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
姚晓;邱强;肖茁建;方金云;崔绍龙;: "Spark框架下矢量多边形求交算法研究", 高技术通讯, no. 06, pages 28 - 35 *
安国强;仲阳;吴建廷;孔维剑;秦晓敏;许霄霄;陈龙飞;: "国土资源大数据上云高效运行体系及关键技术研究――以山东省为例", 山东国土资源, no. 07, pages 76 - 82 *
罗金有;王丹;: "土地资源基础数据可视化表达技术研究", 测绘与空间地理信息, no. 02, pages 122 - 125 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116976568A (zh) * 2023-09-25 2023-10-31 深圳文科园林股份有限公司 一种辅助城乡规划编制的数据共享方法及系统
CN116976568B (zh) * 2023-09-25 2023-12-22 深圳文科园林股份有限公司 一种辅助城乡规划编制的数据共享方法及系统

Also Published As

Publication number Publication date
CN111949706B (zh) 2023-11-14

Similar Documents

Publication Publication Date Title
US9719790B2 (en) Mapping uncertain geometries to graticules
CN109684428A (zh) 空间数据建设方法、装置、设备及存储介质
CN105373559A (zh) 一种地理信息获取方法及地理信息获取系统
CN107092623B (zh) 一种兴趣点查询方法及装置
WO2006059629A1 (ja) エリア情報の管理装置・方法・プログラム
CN110287426B (zh) 兴趣点父子关系的建立方法、装置、存储介质及处理器
CN111324679A (zh) 地址信息的处理方法、装置和系统
CN104539750A (zh) 一种ip定位方法和装置
CN116860905B (zh) 一种城市信息模型的空间单元编码生成方法
CN111522892A (zh) 地理要素的检索方法及装置
CN103324749B (zh) 一种基于标准文本地址的空间化解析及纠偏方法
CN114661846A (zh) 一种用于国土空间规划的数据处理方法及系统
CN109684425A (zh) 保单用户地址匹配方法及装置
CN109325089A (zh) 一种非定点对象查询方法、装置、终端设备及存储介质
CN112685616A (zh) 一种基于空间网格和建筑信息模型的精准化电力部件管理方法
CN113272798A (zh) 地图获取方法、装置、计算机设备和存储介质
KR102184048B1 (ko) Gis 기반 토지 이용 계획 검토 시스템 및 방법
CN111949706B (zh) 面向土地大数据分布式挖掘分析的存储方法
EP3149978B1 (en) System for providing location-based social networking services to users of mobile devices
CN111414445A (zh) 一种应用地理信息的地址反解析方法
CN107657474B (zh) 一种商圈边界的确定方法及服务端
CN115544979A (zh) 一种行政地址提取方法、装置和设备及存储介质
CN113642313A (zh) 地址文本的处理方法、装置、设备、存储介质及程序产品
CN108132992B (zh) 一种人员信息基础地址编码方法、系统及电子设备
CN113360586A (zh) 地址聚集度查询方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant