CN107357940A - 一种不动产数据整合的方法和设备 - Google Patents
一种不动产数据整合的方法和设备 Download PDFInfo
- Publication number
- CN107357940A CN107357940A CN201710748363.7A CN201710748363A CN107357940A CN 107357940 A CN107357940 A CN 107357940A CN 201710748363 A CN201710748363 A CN 201710748363A CN 107357940 A CN107357940 A CN 107357940A
- Authority
- CN
- China
- Prior art keywords
- data
- real estate
- database
- standard
- middle database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Abstract
本发明提出一种不动产数据整合的方法和设备,其中该方法包括:对不动产资料进行采集以及数字化,以生成不动产数据;基于预设的规则对所述不动产数据进行检查,并根据检查的结果进行整理,以生成预设标准规范的数据集;对将所述数据集中的数据分类抽取转换到不动产中间库中,并根据所述不动产中间库的标准对所述数据进行质检,以生成符合不动产中间库的标准的多个不动产中间库;将各所述不动产中间库与预设要求的数据库进行整合,并建立房地之间的关联关系,以形成最终的不动产正式数据库。
Description
技术领域
本发明涉及数据处理领域,特别涉及一种不动产数据整合的方法和设备。
背景技术
目前各地在土地调查、土地登记、房产调查测绘、房屋产权管理等业务中所生产的基础数据库类数据多数情况下是依赖于某个特定应用系统,所生成的数据高度依赖于特定的软件应用系统,只能在特定软件中或特定的业务系统中才能使用,无法供外部应用,导致数据丧失了其本该具有的独立于业务的特性。
在分散登记背景下的多种业务数据来源、多种介质来源的数据分别遵循各自相关的行业标准,有时同一种业务在不同时期,会对应不同的业务标准,无疑给数据整合造成了非常大的难度,主要表现为标准不一、数据精度不一、数据要素不齐全、没有关联、历史数据复杂。
综上,因不动产的多源异构、多业务多时点、无业务独立性等特点,在房产和土地登记数据整合过程中,必然涉及数据模式不匹配、数据内容不唯一、语义冲突等问题。
发明内容
有鉴于此,本发明提出了一种不动产数据整合的方法和设备。具体的,本发明提出了以下具体的实施例:
本发明实施例提出了一种不动产数据整合的方法,包括:
对不动产资料进行采集以及数字化,以生成不动产数据;
基于预设的规则对所述不动产数据进行检查,并根据检查的结果进行整理,以生成预设标准规范的数据集;
对将所述数据集中的数据分类抽取转换到不动产中间库中,并根据所述不动产中间库的标准对所述数据进行质检,以生成符合不动产中间库的标准的多个不动产中间库;
将各所述不动产中间库与预设要求的数据库进行整合,并建立房地之间的关联关系,以形成最终的不动产正式数据库。
在一个具体的实施例中,所述“对不动产资料进行采集以及数字化,以生成不动产数据”包括:
对不动产资料进行采集;
对采集的不动产资料中的非电子化数据进行数字化,以将所有不动产资料数字化;
对数字化后的不动产资料进行统一格式的处理,生成不动产数据。
在一个具体的实施例中,所述检查包括:数据完整性检查与数据逻辑性检查;
所述整理包括对通过ETL技术对所述不动产数据进行去重处理、修改处理以及补录处理。
在一个具体的实施例中,所述“对将所述数据集中的数据分类抽取转换到不动产中间库中,并根据所述不动产中间库的标准对所述数据进行质检,以生成符合不动产中间库的标准的多个不动产中间库”包括:
根据预设的抽取规则对所述数据集中的数据进行抽取;
对抽取出的数据进行清洗,以剔除已注销的数据、不符合预设业务规则的数据以及冗余数据;
根据预设的转换规则对进行清洗的数据进行数据转换,以生成语意一致的数据;
将完成数据转换的数据装载在不动产中间库中;
将存储在所述不动产中间库中的数据进行关于与各不动产中间库的标准相关的质检;其中,所述质检包括:对转换后与转换前的对应数据进行数据结构、属性信息统计、对比分析,分别校验空间数据的空间位置和属性值是否一致的判断,以及判断空间数据的拓扑关系和属性数据的逻辑关系是否正确;
基于质检通过的数据生成符合不动产中间库的标准的多个不动产中间库。
在一个具体的实施例中,所述建立房地之间的关联关系,包括:
通过宗地编号将宗地和不动产单元进行关联,以生成第一关联关系;
通过不动产单元编号将不动产和不动产权利进行关联,以生成第二关联关系;
通过业务号实现不动产权利和登记过程的关联,以生成第三关联关系;
综合第一关联关系、第二关联关系、第三关联关系生成关联关系。
在一个具体的实施例中,还包括:
对所述不动产数据以预设的整合单元进行划分;其中,所述整合单元包括宗地、或房屋的单元户;
对完成划分的所述不动产数据中土地登记数据与有空间图形的房产登记数据进行匹配,以及土地登记数据与无空间图形的房产登记数据进行匹配;
将完全匹配的不动产数据导入整合数据库;
基于部分匹配或不匹配的不动产数据生成任务;
基于所述任务的反馈信息,对部分匹配或不匹配的不动产数据进行数据规范、修正以及匹配情况的调整;
调整后匹配成功的不动产数据导入整合数据库;
对调整后匹配不成功的不动产数据进行标记后导入整合数据库。
本发明实施例还提出了一种不动产数据整合的设备,包括:
采集模块,用于对不动产资料进行采集以及数字化,以生成不动产数据;
整理模块,用于基于预设的规则对所述不动产数据进行检查,并根据检查的结果进行整理,以生成预设标准规范的数据集;
质检模块,用于对将所述数据集中的数据分类抽取转换到不动产中间库中,并根据所述不动产中间库的标准对所述数据进行质检,以生成符合不动产中间库的标准的多个不动产中间库;
整合模块,用于将各所述不动产中间库与预设要求的数据库进行整合,并建立房地之间的关联关系,以形成最终的不动产正式数据库。
在一个具体的实施例中,所述采集模块,用于:
对不动产资料进行采集;
对采集的不动产资料中的非电子化数据进行数字化,以将所有不动产资料数字化;
对数字化后的不动产资料进行统一格式的处理,生成不动产数据。
在一个具体的实施例中,所述检查包括:数据完整性检查与数据逻辑性检查;
所述整理包括对通过ETL技术对所述不动产数据进行去重处理、修改处理以及补录处理。
在一个具体的实施例中,所述质检模块,用于:
根据预设的抽取规则对所述数据集中的数据进行抽取;
对抽取出的数据进行清洗,以剔除已注销的数据、不符合预设业务规则的数据以及冗余数据;
根据预设的转换规则对进行清洗的数据进行数据转换,以生成语意一致的数据;
将完成数据转换的数据装载在不动产中间库中;
将存储在所述不动产中间库中的数据进行关于与各不动产中间库的标准相关的质检;其中,所述质检包括:对转换后与转换前的对应数据进行数据结构、属性信息统计、对比分析,分别校验空间数据的空间位置和属性值是否一致的判断,以及判断空间数据的拓扑关系和属性数据的逻辑关系是否正确;
基于质检通过的数据生成符合不动产中间库的标准的多个不动产中间库。
以此,本发明实施例提出一种不动产数据整合的方法和设备,以地籍数据为基础、宗地统一编码为索引,对存量不动产登记数据进行整理、清洗、转换编码、装载入库,建立内容完整、逻辑一致的不动产登记数据库,支撑不动产统一登记业务和不动产登记信息依法查询。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提出的一种不动产数据整合的方法的流程示意图;
图2为本发明实施例提出的一种基于ETL的不动产登记数据整合方法的流程示意图;
图3为本发明实施例提出的一种不动产登记数据整合ETL数据模型的示意图;
图4为本发明实施例提出的一种基于任务协同的不动产数据整合流程图;
图5为本发明实施例提出的一种不动产登记数据整合中任务推送过程示意图;
图6为本发明实施例提出的一种不动产登记数据整合中任务推送子模块类图;
图7为本发明实施例提出的一种不动产数据整合的设备的结构示意图。
具体实施方式
在下文中,将更全面地描述本公开的各种实施例。本公开可具有各种实施例,并且可在其中做出调整和改变。然而,应理解:不存在将本公开的各种实施例限于在此公开的特定实施例的意图,而是应将本公开理解为涵盖落入本公开的各种实施例的精神和范围内的所有调整、等同物和/或可选方案。
实施例1
本发明实施例1公开了一种不动产数据整合的方法,如图1以及图2所示,包括:
步骤101、对不动产资料进行采集以及数字化,以生成不动产数据;
具体的,可以根据项目的建设目标制定数据采集方案,对收集的不动产数据进行电子化处理和格式统一化处理入库形成原始数据库,并根据数据库建设文档对数据进行数据结构和数据内容进行分析。
步骤102、基于预设的规则对所述不动产数据进行检查,并根据检查的结果进行整理,以生成预设标准规范的数据集;
具体的,可以根据原有土地、房屋、林权、草原建设规范对历史数据进行质量检查,包括数据完整性质量检查和数据逻辑性检查,并根据检查结果对数据进行去重、修改和补录等数据处理工作,最终形成标准规范的数据集。
步骤103、对将所述数据集中的数据分类抽取转换到不动产中间库中,并根据所述不动产中间库的标准对所述数据进行质检,以生成符合不动产中间库的标准的多个不动产中间库;
具体的,可以运用数据抽取和转换的工具将标准规范数据集中的分类抽取转换到不动产中间库中,并根据不动产数据库标准对数据进行质量检查,形成多个符合不动产数据规范的中间库。在本步骤中,可以借助ETL(Extract-Transform-Load,据仓库技术)技术通过抽取、转换、映射将存量不动产登记数据装载到不动产中间库,本步骤可以依据房、地数据依赖的行业技术规范和《不动产登记数据库标准(试行)》进行。
依据土地、房产等现行的相关标准,借助ETL技术,通过对统一登记前已有的登记信息提取、转换、补录等。建成符合土地、房产等现行标准的数据集,进而依据《不动产登记数据库标准(试行)》建立规范的不动产登记数据中间库。
不动产登记存量数据ETL整合入库部分从过程和内容来讲,包括了数据抽取、数据清理、数据转换、数据装载4个阶段。整合集成建库主要涉及以下问题:①数据来源多样化,包括基础层、专业层、业务层、监管层等4类数据具有数据种类多、数据关系复杂、数据量大、标准不统一、整合难度高等特点。②数据格式多样化,涵盖业务办理过程中产生的业务审批的图属数据、测绘阶段产生的空间格式数据,以及现有的不同信息系统数据库,需对各种格式的数据抽取整合,建立数据关系。③空间拓扑关系建立,在集成过程中不仅要描述空间实体对象的空间位置和属性,还要体现各实体对象之间的空间拓扑关系。
步骤104、将各所述不动产中间库与预设要求的数据库进行整合,并建立房地之间的关联关系,以形成最终的不动产正式数据库。
具体的没可以通过ETL工具进行抽取、转换映射、装载将各不动产中间库与不动产登记发证系统中的数据库整合,形成统一的数据库,建立房地关联关系,经过质量检查与修改后,形成最终统一规范的不动产正式数据库。
具体的,通过对整理后的空间数据集进行图层合并、冗余数据剔除、信息补录等操作,形成符合《不动产登记数据库标准(试行)》要求的空间数据以及与之关联的属性数据,并以此为基础进行地籍区、地籍子区、宗地以及建筑物、构筑物等空间数据统一编码。通过对整理后的非空间数据进行数据归并、冗余数据剔除、信息补录等操作,形成与不动产登记相关技术要求以及《不动产登记数据库标准(试行)》要求相符的不动产登记簿。将整合后的空间数据和非空间数据进行关联,用宗地编号把宗地和不动产单元进行关联,用不动产单元编号把不动产和不动产权利关联,用业务号实现不动产权利和登记过程的关联,最终形成空间数据、非空间数据关联,历史和现状信息清晰完整的不动产登记信息。将整理后的不动产登记信息按照《不动产登记数据库标准(试行)》对基础地理信息、宗地数据、自然幢数据、权利数据、权利人数据、登记业务等进行数据组织、编码、入库,建成支撑不动产登记信息管理基础平台运行的不动产登记数据库(成果数据库),并按照元数据的要求填写所建数据库的元数据。
在一个具体的实施例中,步骤101中的所述“对不动产资料进行采集以及数字化,以生成不动产数据”包括:
对不动产资料进行采集;
对采集的不动产资料中的非电子化数据进行数字化,以将所有不动产资料数字化;
对数字化后的不动产资料进行统一格式的处理,生成不动产数据。
具体的,在一个实施例中,通过对当前房屋、土地登记信息的现状调查,搜集土地、房屋等登记执行的数据库标准、技术规程和原来的房、地登记图、表、卡、册等纸质资料和电子数据。
具体的,步骤102中的所述检查包括:数据完整性检查与数据逻辑性检查;
所述整理包括对通过ETL技术对所述不动产数据进行去重处理、修改处理以及补录处理。
在一个具体的实施例中,步骤103中的所述“对将所述数据集中的数据分类抽取转换到不动产中间库中,并根据所述不动产中间库的标准对所述数据进行质检,以生成符合不动产中间库的标准的多个不动产中间库”包括:
根据预设的抽取规则对所述数据集中的数据进行抽取;
对抽取出的数据进行清洗,以剔除已注销的数据、不符合预设业务规则的数据以及冗余数据;
根据预设的转换规则对进行清洗的数据进行数据转换,以生成语意一致的数据;
将完成数据转换的数据装载在不动产中间库中;
将存储在所述不动产中间库中的数据进行关于与各不动产中间库的标准相关的质检;其中,所述质检包括:对转换后与转换前的对应数据进行数据结构、属性信息统计、对比分析,分别校验空间数据的空间位置和属性值是否一致的判断,以及判断空间数据的拓扑关系和属性数据的逻辑关系是否正确;
基于质检通过的数据生成符合不动产中间库的标准的多个不动产中间库。
具体的,该步骤包括以下具体的过程:
一、数据抽取。可以根据相关标准规范,充分分析实际情景数据,针对多种异构的数据来源,建立ETL规则。梳理土地登记、房屋登记的历史数据。因各地的信息化程度不同,常见的土地、房屋的历史登记的源数据格式为Oracle、CAD、Excel等。结合实际数据,分析不动产登记数据库以及其他相关数据库、历史数据之间的对应关系,依据《城镇地籍数据库标准》、《房屋登记簿管理试行办法》、《房地产市场信息系统技术规范》、《不动产登记数据库标准》等相关登记数据标准、规范建立抽取规则。
二、数据清洗。逐项检查土地、房屋等已有不动产登记资料,剔除登记簿、权籍图中已注销的权利数据,把不合业务规则的数据以及冗余数据过滤掉,并把相应的信息转入档案库管理。数据清洗需要人工干预,并且需要业务人员进行确认。不符合规则的数据常见的有以下几种情形:①信息不完整,缺失坐落、权利人等必填的重要信息的记录。②错误数据,逻辑不一致数据,比如日期里填的不是日期,还有其他文字信息的情形。③冗余信息,比如已经注销的、重复录入的,但是没有被删除的无效信息。
三、数据转换。数据抽取中取得的数据来自不同的数据源,通常存在语义不一致的问题,需要对语义不一致的数据进行检测,将数据转化成集成的、一致的数据。数据源中的数据经常存在重复和缺失问题,这些数据会影响到数据仓库中数据的质量,并最终影响决策的准确性。因此要检测重复数据、缺失数据并制定相对应的规则消除重复数据,填充缺失数据。理清转换关系后,构建不动产领域的统一数据模型,建立异构数据源与核心数据库之间的字段映射关系、数据抽取规则、转换规则。利用数据抽取引擎将原有系统中的业务数据抽取到不动产统一登记数据库中的对应业务表单中,以中间库的形式存放。根据转换规则建立数据模型,核心部分如图3。
四、数据装载。依照统一数据模型对原来分布在各个应用系统中的业务数据完成抽取、转换整合后,载入至符合《不动产登记数据库标准(试行)》标准的中间库中。因为很多地市是先发证,再进行的不动产登记历史数据整合,随着日常登记业务的办理已经对数据库进行了实时动态更新,在历史数据入库的时候,还需要考虑与增量不动产登记业务数据的关联,建立不动产登记数据库动态扩展机制。
五、数据的校验。通过抽取、清洗、转换的ETL过程基本实现了数据重构与规范化整合。为保证来源于原分散在各行各业、各部门的数据在整合后的一致性、完整性,需要对其进行相互校验、检核。通过采用一定的程序校验、人机对话等方法,对转换前后数据结构、属性信息统计、对比分析,分别校验空间数据的空间位置和属性值在转换前后是否一致、完整,以及各类空间数据的拓扑关系、属性数据的逻辑关系是否正确等。
在一个具体的实施例中,所述建立房地之间的关联关系,包括:
通过宗地编号将宗地和不动产单元进行关联,以生成第一关联关系;
通过不动产单元编号将不动产和不动产权利进行关联,以生成第二关联关系;
通过业务号实现不动产权利和登记过程的关联,以生成第三关联关系;
综合第一关联关系、第二关联关系、第三关联关系生成关联关系。
以此,上述步骤一则构建不动产登记领域的统一数据模型,通过分析不同业务种类的异构数据源与核心数据库之间的字段映射关系建立了不动产登记领域的统一数据模型,解决了从原分散登记的土地、房屋等各领域登记业务数据到不动产统一登记数据库的融合关联问题,实现房、地信息互联互通和房地一体化;再者建立基于ETL的转换规则,实现多种异构数据源与核心数据库之间的转换,解决了不同的数据类型、不同的数据结构、不同的入库对象的整合入库问题。
具体的,在一个具体的实施例中,该方法还包括:
对所述不动产数据以预设的整合单元进行划分;其中,所述整合单元包括宗地、或房屋的单元户;
对完成划分的所述不动产数据中土地登记数据与有空间图形的房产登记数据进行匹配,以及土地登记数据与无空间图形的房产登记数据进行匹配;
将完全匹配的不动产数据导入整合数据库;
基于部分匹配或不匹配的不动产数据生成任务;
基于所述任务的反馈信息,对部分匹配或不匹配的不动产数据进行数据规范、修正以及匹配情况的调整;
调整后匹配成功的不动产数据导入整合数据库;
对调整后匹配不成功的不动产数据进行标记后导入整合数据库。
具体的,以宗地管理单元对数据整合区域进行剖分、基于任务协同和不动产单元的不动产登记数据整合技术,能够高效实现不动产登记数据集成,对构建不动产登记数据整合长效机制具有重要意义。
基于任务协同的不动产数据整合主要分为数据准备、数据匹配、匹配结果提取、任务推送和数据整合等5项任务,这些任务分别由不同的处理实体来完成,在任务执行过程中需要遵循业务规则,即遵守既定的步骤和限制,各处理实体完成任务后反馈回总系统,协同完成数据整合任务,整合流程图如图4所示。其中,
1、数据准备对待整合的房地数据进行规整;
2、数据匹配根据制定的标准和规则进行房地数据匹配;
3、匹配结果按完全匹配、部分匹配和不匹配进行分类,完全匹配的数据直接导入整合数据库,并依据宗地管理单元(地籍区、地籍子区)实现落宗,部分匹配和不匹配的数据进入任务推送环节;
4、任务推送依据数据匹配情况、所属辖区等特点,将部分匹配和不匹配的数据推送至核查人员进行核查;
5、数据整合依据任务推送反馈的信息,对登记数据进行数据规范、修正和匹配情况调整,核查后匹配成功的数据导入整合数据库,匹配失败的数据进行标记后导入整合数据库,可以根据不同的宗地管理单元,由不同角色的业务处理人员在日常登记工作中逐步调整和整合,也可定期启动房地数据整合流程,进行数据的清洗、整理。
具体的,数据匹配是利用宗地、房屋物理数据等范围容易确定、表达精度高、格式转换简单、空间计算可信度高的优点。构建基于空间图形和属性信息结合的不动产登记数据匹配方法体系,提高协同效应。具体的,依据房产登记系统是否具有空间图形,
数据匹配分为土地登记数据与有空间图形的房产登记数据匹配和与无空间图形的房产登记数据匹配两个部分。
土地登记数据与有空间图形的房产登记数据通过空间计算,以宗地为单位提取出落入同一宗地范围内的土地和房产登记数据,大大减少数据关联的计算量,通过土地登记的坐落信息与房产登记的楼盘表关联匹配,实现土地登记数据与房产登记数据的匹配,并依据分类结果提取数据。
土地登记数据与无空间图形的房产登记数据通过语义匹配进行关联,语义匹配相对复杂,以宗地为匹配单元,定义匹配标准,依据分类结果提取数据。
完全匹配的数据直接进行数据整合和集成,其他数据则分类提取,进入任务推送环节进行核查,利用核查的反馈信息对登记数据进行规范和调整,最终实现不动产登记数据的整合和集成。对整合后的数据利用不动产单元编码规则进行编码,使得宗地及其上所附着的建筑物、构筑物建立关联,为房地一体登记奠定数据基础。
任务推送是将提取到的部分匹配和不匹配数据项划分成任务,在工作流引擎驱动下,按任务岗位及人员角色的划分,推送到相应的部门和人员进行案头核查和实地核查,并将核查信息进行反馈。在不动产登记数据整合中,以宗地管理单元为划分基础,按照任务批次,从市局级向分局级进行推送,最后由分管科长向基础核查岗人员进行分配。任务划分和任务岗位、人员角色划分见图5所示。
在协同处理系统中,任务推送模块主要包括任务管理子模块、任务推送子模块和事项返回子模块三个部分。
(1)任务管理子模块。任务管理子模块是任务推送的基础子模块,主要负责任务的管理,包括任务添加、任务删除、任务项修改等后台功能。任务添加是根据用户筛选的信息进行任务的新建,新建任务功能的输入包括任务名称、事项受理号、任务人员信息、推送人员信息等。任务删除和修改负责修改任务的名称、任务对应的事项受理号等。
(2)任务推送子模块。任务推送子模块是任务推送的核心模块,主要负责任务推送的流程控制。包括任务环节驱动、任务状态控制、任务与事项的关联管理等,如图6所示。
任务推送采用OA的设计思路,利用工作流引擎实现任务的分发、驱动和管理。由于数据整合所划分的任务涉及空间数据和属性数据,因此,在强调工作流引擎稳定性与健壮性的同时,也要充分考虑工作流技术与GIS技术的有机整合与集成,将GIS、文(公文、表单等)与工作流技术进行有机融合,利用GIS与业务处理的协同交互,实现以房屋登记单元为基础的不动产登记数据整合的任务划分和任务处理。
(3)事项返回子模块。事项返回子模块主要负责在案头核查或实地核查工作完成后,将任务中的单个或多个事项通过任务推送引擎返回给上一级任务所有人,修改事项对应的任务状态和所有人信息等,实现任务的协同和数据的整合;具体的数据为:空间数据、业务数据、属性数据、工作流数据、要件数据。
本方案基于任务协同的高效的不动产登记数据整合方法以土地登记数据为基础,以宗地管理单元为整合数据组织单元,采用信息化技术,构建了不动产登记数据整合框架,解决了数据匹配、任务推送等关键问题,该方法能够高效、准确完成房地登记数据整合和集成。
实施例2
本发明实施例2还公开了一种不动产数据整合的设备,如图7所示,包括:
采集模块201,用于对不动产资料进行采集以及数字化,以生成不动产数据;
整理模块202,用于基于预设的规则对所述不动产数据进行检查,并根据检查的结果进行整理,以生成预设标准规范的数据集;
质检模块203,用于对将所述数据集中的数据分类抽取转换到不动产中间库中,并根据所述不动产中间库的标准对所述数据进行质检,以生成符合不动产中间库的标准的多个不动产中间库;
整合模块204,用于将各所述不动产中间库与预设要求的数据库进行整合,并建立房地之间的关联关系,以形成最终的不动产正式数据库。
在一个具体的实施例中,所述采集模块201,用于:
对不动产资料进行采集;
对采集的不动产资料中的非电子化数据进行数字化,以将所有不动产资料数字化;
对数字化后的不动产资料进行统一格式的处理,生成不动产数据。
在一个具体的实施例中,所述检查包括:数据完整性检查与数据逻辑性检查;
所述整理包括对通过ETL技术对所述不动产数据进行去重处理、修改处理以及补录处理。
在一个具体的实施例中,所述质检模块,用于:
根据预设的抽取规则对所述数据集中的数据进行抽取;
对抽取出的数据进行清洗,以剔除已注销的数据、不符合预设业务规则的数据以及冗余数据;
根据预设的转换规则对进行清洗的数据进行数据转换,以生成语意一致的数据;
将完成数据转换的数据装载在不动产中间库中;
将存储在所述不动产中间库中的数据进行关于与各不动产中间库的标准相关的质检;其中,所述质检包括:对转换后与转换前的对应数据进行数据结构、属性信息统计、对比分析,分别校验空间数据的空间位置和属性值是否一致的判断,以及判断空间数据的拓扑关系和属性数据的逻辑关系是否正确;
基于质检通过的数据生成符合不动产中间库的标准的多个不动产中间库。
在一个具体的实施例中,所述整合模块建立房地之间的关联关系,包括:
通过宗地编号将宗地和不动产单元进行关联,以生成第一关联关系;
通过不动产单元编号将不动产和不动产权利进行关联,以生成第二关联关系;
通过业务号实现不动产权利和登记过程的关联,以生成第三关联关系;
综合第一关联关系、第二关联关系、第三关联关系生成关联关系。
在一个具体的实施例中,还包括:处理模块,用于:
对所述不动产数据以预设的整合单元进行划分;其中,所述整合单元包括宗地、或房屋的单元户;
对完成划分的所述不动产数据中土地登记数据与有空间图形的房产登记数据进行匹配,以及土地登记数据与无空间图形的房产登记数据进行匹配;
将完全匹配的不动产数据导入整合数据库;
基于部分匹配或不匹配的不动产数据生成任务;
基于所述任务的反馈信息,对部分匹配或不匹配的不动产数据进行数据规范、修正以及匹配情况的调整;
调整后匹配成功的不动产数据导入整合数据库;
对调整后匹配不成功的不动产数据进行标记后导入整合数据库。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明序号仅仅为了描述,不代表实施场景的优劣。
以上公开的仅为本发明的几个具体实施场景,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (10)
1.一种不动产数据整合的方法,其特征在于,包括:
对不动产资料进行采集以及数字化,以生成不动产数据;
基于预设的规则对所述不动产数据进行检查,并根据检查的结果进行整理,以生成预设标准规范的数据集;
对将所述数据集中的数据分类抽取转换到不动产中间库中,并根据所述不动产中间库的标准对所述数据进行质检,以生成符合不动产中间库的标准的多个不动产中间库;
将各所述不动产中间库与预设要求的数据库进行整合,并建立房地之间的关联关系,以形成最终的不动产正式数据库。
2.如权利要求1所述的方法,其特征在于,所述“对不动产资料进行采集以及数字化,以生成不动产数据”包括:
对不动产资料进行采集;
对采集的不动产资料中的非电子化数据进行数字化,以将所有不动产资料数字化;
对数字化后的不动产资料进行统一格式的处理,生成不动产数据。
3.如权利要求1所述的方法,其特征在于,所述检查包括:数据完整性检查与数据逻辑性检查;
所述整理包括对通过ETL技术对所述不动产数据进行去重处理、修改处理以及补录处理。
4.如权利要求1所述的方法,其特征在于,所述“对将所述数据集中的数据分类抽取转换到不动产中间库中,并根据所述不动产中间库的标准对所述数据进行质检,以生成符合不动产中间库的标准的多个不动产中间库”包括:
根据预设的抽取规则对所述数据集中的数据进行抽取;
对抽取出的数据进行清洗,以剔除已注销的数据、不符合预设业务规则的数据以及冗余数据;
根据预设的转换规则对进行清洗的数据进行数据转换,以生成语意一致的数据;
将完成数据转换的数据装载在不动产中间库中;
将存储在所述不动产中间库中的数据进行关于与各不动产中间库的标准相关的质检;其中,所述质检包括:对转换后与转换前的对应数据进行数据结构、属性信息统计、对比分析,分别校验空间数据的空间位置和属性值是否一致的判断,以及判断空间数据的拓扑关系和属性数据的逻辑关系是否正确;
基于质检通过的数据生成符合不动产中间库的标准的多个不动产中间库。
5.如权利要求1所述的方法,其特征在于,所述建立房地之间的关联关系,包括:
通过宗地编号将宗地和不动产单元进行关联,以生成第一关联关系;
通过不动产单元编号将不动产和不动产权利进行关联,以生成第二关联关系;
通过业务号实现不动产权利和登记过程的关联,以生成第三关联关系;
综合第一关联关系、第二关联关系、第三关联关系生成关联关系。
6.如权利要求1所述的方法,其特征在于,还包括:
对所述不动产数据以预设的整合单元进行划分;其中,所述整合单元包括宗地、或房屋的单元户;
对完成划分的所述不动产数据中土地登记数据与有空间图形的房产登记数据进行匹配,以及土地登记数据与无空间图形的房产登记数据进行匹配;
将完全匹配的不动产数据导入整合数据库;
基于部分匹配或不匹配的不动产数据生成任务;
基于所述任务的反馈信息,对部分匹配或不匹配的不动产数据进行数据规范、修正以及匹配情况的调整;
调整后匹配成功的不动产数据导入整合数据库;
对调整后匹配不成功的不动产数据进行标记后导入整合数据库。
7.一种不动产数据整合的设备,其特征在于,包括:
采集模块,用于对不动产资料进行采集以及数字化,以生成不动产数据;
整理模块,用于基于预设的规则对所述不动产数据进行检查,并根据检查的结果进行整理,以生成预设标准规范的数据集;
质检模块,用于对将所述数据集中的数据分类抽取转换到不动产中间库中,并根据所述不动产中间库的标准对所述数据进行质检,以生成符合不动产中间库的标准的多个不动产中间库;
整合模块,用于将各所述不动产中间库与预设要求的数据库进行整合,并建立房地之间的关联关系,以形成最终的不动产正式数据库。
8.如权利要求7所述的设备,其特征在于,所述采集模块,用于:
对不动产资料进行采集;
对采集的不动产资料中的非电子化数据进行数字化,以将所有不动产资料数字化;
对数字化后的不动产资料进行统一格式的处理,生成不动产数据。
9.如权利要求7所述的设备,其特征在于,所述检查包括:数据完整性检查与数据逻辑性检查;
所述整理包括对通过ETL技术对所述不动产数据进行去重处理、修改处理以及补录处理。
10.如权利要求7所述的设备,其特征在于,所述质检模块,用于:
根据预设的抽取规则对所述数据集中的数据进行抽取;
对抽取出的数据进行清洗,以剔除已注销的数据、不符合预设业务规则的数据以及冗余数据;
根据预设的转换规则对进行清洗的数据进行数据转换,以生成语意一致的数据;
将完成数据转换的数据装载在不动产中间库中;
将存储在所述不动产中间库中的数据进行关于与各不动产中间库的标准相关的质检;其中,所述质检包括:对转换后与转换前的对应数据进行数据结构、属性信息统计、对比分析,分别校验空间数据的空间位置和属性值是否一致的判断,以及判断空间数据的拓扑关系和属性数据的逻辑关系是否正确;
基于质检通过的数据生成符合不动产中间库的标准的多个不动产中间库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710748363.7A CN107357940A (zh) | 2017-08-28 | 2017-08-28 | 一种不动产数据整合的方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710748363.7A CN107357940A (zh) | 2017-08-28 | 2017-08-28 | 一种不动产数据整合的方法和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107357940A true CN107357940A (zh) | 2017-11-17 |
Family
ID=60289294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710748363.7A Pending CN107357940A (zh) | 2017-08-28 | 2017-08-28 | 一种不动产数据整合的方法和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107357940A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977464A (zh) * | 2017-12-18 | 2018-05-01 | 华润电力湖北有限公司 | 一种存取标杆值数据的方法与装置 |
CN108197311A (zh) * | 2018-01-31 | 2018-06-22 | 平安好房(上海)电子商务有限公司 | 房源数据聚合展示方法、装置、设备及可读存储介质 |
CN108228815A (zh) * | 2017-12-29 | 2018-06-29 | 安徽迈普德康信息科技有限公司 | 一种不动产数据整合系统及方法 |
CN108509595A (zh) * | 2018-04-02 | 2018-09-07 | 深圳市华傲数据技术有限公司 | 异构数据的整理方法、装置、存储介质及设备 |
CN108614893A (zh) * | 2018-05-10 | 2018-10-02 | 成都传晟信息技术有限公司 | 一种基于不动产成果利用的方法及处理系统 |
CN108804672A (zh) * | 2018-06-11 | 2018-11-13 | 北京三正科技股份有限公司 | 一种不动产信息管理方法及装置 |
CN109062974A (zh) * | 2018-06-29 | 2018-12-21 | 浙江大学宁波理工学院 | 一种服务于不动产登记的数据组织与统计模型的构建方法 |
CN109284284A (zh) * | 2018-09-07 | 2019-01-29 | 新华三大数据技术有限公司 | 数据处理方法及装置 |
CN109460446A (zh) * | 2019-01-29 | 2019-03-12 | 江苏省测绘工程院 | 一种房产宗地的整合方法 |
CN110851463A (zh) * | 2019-11-08 | 2020-02-28 | 南京国图信息产业有限公司 | 一种基于互联网地图地理编码引擎的不动产登记数据脱敏与空间化方法 |
CN111028119A (zh) * | 2019-12-09 | 2020-04-17 | 南京苏测测绘科技有限公司 | 一种基于gis的不动产数据整合方法 |
CN111462305A (zh) * | 2020-03-17 | 2020-07-28 | 中国电建集团昆明勘测设计研究院有限公司 | 应用于农村房地一体的三维不动产管理方法 |
CN112597221A (zh) * | 2020-12-17 | 2021-04-02 | 四川新网银行股份有限公司 | 一种基于截面数据的测试环境数据抽取优化执行方法 |
CN112948375A (zh) * | 2021-02-01 | 2021-06-11 | 吉林大学 | 县市级尺度生态保护红线数据库逻辑一致性检测方法 |
CN116226152A (zh) * | 2023-04-25 | 2023-06-06 | 社治无忧(成都)智慧科技有限公司 | 一种基于社区治理的人房数据自更新方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104063482A (zh) * | 2014-07-03 | 2014-09-24 | 浙江大学 | 一种面向不动产登记的业务数据整合方法 |
CN105824870A (zh) * | 2016-01-15 | 2016-08-03 | 优品财富管理有限公司 | 一种基于校验规则的分类和质检方法及系统 |
CN106056492A (zh) * | 2016-06-13 | 2016-10-26 | 西安数驰信息科技有限公司 | 一种不动产统一登记信息管理解决的方法 |
CN106095953A (zh) * | 2016-06-13 | 2016-11-09 | 西安数驰信息科技有限公司 | 一种基于gis的不动产数据整合方法 |
-
2017
- 2017-08-28 CN CN201710748363.7A patent/CN107357940A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104063482A (zh) * | 2014-07-03 | 2014-09-24 | 浙江大学 | 一种面向不动产登记的业务数据整合方法 |
CN105824870A (zh) * | 2016-01-15 | 2016-08-03 | 优品财富管理有限公司 | 一种基于校验规则的分类和质检方法及系统 |
CN106056492A (zh) * | 2016-06-13 | 2016-10-26 | 西安数驰信息科技有限公司 | 一种不动产统一登记信息管理解决的方法 |
CN106095953A (zh) * | 2016-06-13 | 2016-11-09 | 西安数驰信息科技有限公司 | 一种基于gis的不动产数据整合方法 |
Non-Patent Citations (2)
Title |
---|
付丽莉等: ""基于任务协同的房地登记数据整合模式研究"", 《中国土地科学》 * |
徐财江等: ""不动产统一登记数据整合技术方法研究"", 《国土资源信息化》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977464B (zh) * | 2017-12-18 | 2020-05-26 | 华润电力湖北有限公司 | 一种存取标杆值数据的方法与装置 |
CN107977464A (zh) * | 2017-12-18 | 2018-05-01 | 华润电力湖北有限公司 | 一种存取标杆值数据的方法与装置 |
CN108228815A (zh) * | 2017-12-29 | 2018-06-29 | 安徽迈普德康信息科技有限公司 | 一种不动产数据整合系统及方法 |
CN108197311A (zh) * | 2018-01-31 | 2018-06-22 | 平安好房(上海)电子商务有限公司 | 房源数据聚合展示方法、装置、设备及可读存储介质 |
CN108197311B (zh) * | 2018-01-31 | 2020-06-05 | 平安好房(上海)电子商务有限公司 | 房源数据聚合展示方法、装置、设备及可读存储介质 |
CN108509595A (zh) * | 2018-04-02 | 2018-09-07 | 深圳市华傲数据技术有限公司 | 异构数据的整理方法、装置、存储介质及设备 |
CN108614893A (zh) * | 2018-05-10 | 2018-10-02 | 成都传晟信息技术有限公司 | 一种基于不动产成果利用的方法及处理系统 |
CN108804672A (zh) * | 2018-06-11 | 2018-11-13 | 北京三正科技股份有限公司 | 一种不动产信息管理方法及装置 |
CN109062974A (zh) * | 2018-06-29 | 2018-12-21 | 浙江大学宁波理工学院 | 一种服务于不动产登记的数据组织与统计模型的构建方法 |
CN109284284A (zh) * | 2018-09-07 | 2019-01-29 | 新华三大数据技术有限公司 | 数据处理方法及装置 |
CN109460446A (zh) * | 2019-01-29 | 2019-03-12 | 江苏省测绘工程院 | 一种房产宗地的整合方法 |
CN110851463A (zh) * | 2019-11-08 | 2020-02-28 | 南京国图信息产业有限公司 | 一种基于互联网地图地理编码引擎的不动产登记数据脱敏与空间化方法 |
CN111028119A (zh) * | 2019-12-09 | 2020-04-17 | 南京苏测测绘科技有限公司 | 一种基于gis的不动产数据整合方法 |
CN111462305A (zh) * | 2020-03-17 | 2020-07-28 | 中国电建集团昆明勘测设计研究院有限公司 | 应用于农村房地一体的三维不动产管理方法 |
CN112597221A (zh) * | 2020-12-17 | 2021-04-02 | 四川新网银行股份有限公司 | 一种基于截面数据的测试环境数据抽取优化执行方法 |
CN112597221B (zh) * | 2020-12-17 | 2023-04-11 | 四川新网银行股份有限公司 | 一种基于截面数据的测试环境数据抽取优化执行方法 |
CN112948375A (zh) * | 2021-02-01 | 2021-06-11 | 吉林大学 | 县市级尺度生态保护红线数据库逻辑一致性检测方法 |
CN116226152A (zh) * | 2023-04-25 | 2023-06-06 | 社治无忧(成都)智慧科技有限公司 | 一种基于社区治理的人房数据自更新方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107357940A (zh) | 一种不动产数据整合的方法和设备 | |
WO2022088407A1 (zh) | 基于实体模型的城市设计无纸化智能交互审查方法 | |
CN105849726B (zh) | 用于高效地支持通过分层标记数据的即席查询的通用索引 | |
CN104111973B (zh) | 一种学者重名的消歧方法及其系统 | |
Mađer et al. | Analysis of possibilities for linking land registers and other official registers in the Republic of Croatia based on LADM | |
CN110674311A (zh) | 一种基于知识图谱的电力资产异构数据融合方法 | |
CN103679373B (zh) | 生产基建标准成本体系的全链条预算数据处理系统及方法 | |
CN110597870A (zh) | 一种企业关系挖掘方法 | |
CN106250382A (zh) | 一种元数据管理引擎系统及实现方法 | |
CN104462227A (zh) | 一种图形化知识谱系自动构建方法 | |
CN105354267B (zh) | 实现多类型规划方案“多规合一”电子报批的方法 | |
CN110610002B (zh) | 一种问卷信息处理方法、装置、计算机设备及存储介质 | |
CN112182246A (zh) | 通过大数据分析建立企业画像的方法、系统、介质及应用 | |
CN108564283A (zh) | 基于bim的施工质量评价数据库构建方法 | |
CN106203787A (zh) | 基于一张图加的产业信息分析方法及系统 | |
CN115438199A (zh) | 一种基于智慧城市场景数据中台技术的知识平台系统 | |
CN101261659A (zh) | 一种健康监护信息系统 | |
CN117611397A (zh) | 基于多维数据分析的文旅综合管理平台 | |
CN116842092A (zh) | 数据建库及归集管理的方法及系统 | |
MOOR et al. | Reconstructing territorial units and hierarchies: A Belgian example | |
CN117455379A (zh) | 一种基层智慧治理管理系统及方法 | |
Asghari et al. | A semi-automatic system for data management and cleaning | |
CN106779459A (zh) | 一种市政数据管理分析系统 | |
CN108052637B (zh) | 电网时标量测数据接入全生命周期实时图文监控方法 | |
CN115203439B (zh) | 用于合规监管的知识图谱的构建方法、相关方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171117 |