CN107247787A - 一种基于多源数据融合的分类方法 - Google Patents

一种基于多源数据融合的分类方法 Download PDF

Info

Publication number
CN107247787A
CN107247787A CN201710452326.1A CN201710452326A CN107247787A CN 107247787 A CN107247787 A CN 107247787A CN 201710452326 A CN201710452326 A CN 201710452326A CN 107247787 A CN107247787 A CN 107247787A
Authority
CN
China
Prior art keywords
data
classification
government
social
internet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710452326.1A
Other languages
English (en)
Inventor
张峰
王晓斌
张兆勇
李志华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Inspur Cloud Service Information Technology Co Ltd
Original Assignee
Shandong Inspur Cloud Service Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Inspur Cloud Service Information Technology Co Ltd filed Critical Shandong Inspur Cloud Service Information Technology Co Ltd
Priority to CN201710452326.1A priority Critical patent/CN107247787A/zh
Publication of CN107247787A publication Critical patent/CN107247787A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多源数据融合的分类方法,该分类方法通过数据梳理、数据个性化分类、多源数据融合分类三步实现;数据梳理:分别对政府数据、社会数据、互联网数据生产者及数据进行梳理;数据个性化分类:根据政府数据、社会数据、互联网数据各自属性,分别对其按照不同的维度进行分类;多源数据融合分类:根据政府数据、社会数据、互联网数据各自分类,寻找共性分类维度,按照主题、行业进行融合分类,建立公有的主题和行业分类体系及各自个性化的分类维度,实现政府数据、社会数据、互联网数据深度融合。本发明实现了政府数据、社会数据、互联网数据的深度融合,为实现一体化大数据中心建设提供基础保障;该方法实用性较强,适用范围广泛。

Description

一种基于多源数据融合的分类方法
技术领域
本发明涉及数据处理技术领域,具体地说是一种基于多源数据融合的分类方法。
背景技术
当今世界,随着互联网特别是移动互联网发展,社会治理模式正在从单向管理转向双向互动,从线下转向线上线下融合,从单纯的政府监管向更加注重社会协同治理转变。我们要深刻认识互联网在国家管理和社会治理中的作用,以推行电子政务、建设新型智慧城市等为抓手,以数据集中和共享为途径,建设全国一体化的国家大数据中心,推进技术融合、业务融合、数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务,推进政府决策科学化、社会治理精准化、公共服务高效化,用信息化手段更好感知社会态势、畅通沟通渠道、辅助决策施政。
现阶段,政府数据、社会数据、互联网数据各自都有单独的分类体系,但是基于三者数据融合的分类没有统一的分类方法,无法实现三类数据的深度融合。
因此,为实现政府数据、社会数据、互联网数据深度融合,现提出基于多源数据融合的分类方法,基于政府数据、社会数据、互联网数据建立一套统一的分类方法,实现多源数据的深度融合,是建设全国一体化的国家大数据中心的基础和必要前提。
发明内容
本发明的技术任务是提供一种基于多源数据融合的分类方法。
本发明的技术任务是按以下方式实现的,该分类方法通过数据梳理、数据个性化分类、多源数据融合分类三步实现;
数据梳理:分别对政府数据、社会数据、互联网数据生产者及数据进行梳理;
数据个性化分类:根据政府数据、社会数据、互联网数据各自属性,分别对其按照不同的维度进行分类;
多源数据融合分类:根据政府数据、社会数据、互联网数据各自分类,寻找共性分类维度,按照主题、行业进行融合分类,建立公有的主题和行业分类体系及各自个性化的分类维度,实现政府数据、社会数据、互联网数据深度融合。
所述的数据梳理中政府数据梳理方法如下:分析政府各部门单位职责和机构设置,形成职责清单,根据职责清单梳理出本单位管理对象或服务对象,并完善职责清单,形成每个职责对应哪些管理对象或服务对象清单,并根据管理对象或服务对象的生命周期,分析形成每阶段对应的数据目录清单,汇聚各单位数据目录清单,形成政府数据目录全集清单。
所述的数据梳理中社会数据梳理方法如下:分析社会数据来源单位,并根据来源单位职责梳理本单位业务范围,根据本单位业务,梳理出本单位相关的数据目录,汇聚各社会组织单位数据目录,形成社会数据目录清单。
所述的数据梳理中互联网数据梳理方法如下:分析互联网数据产生者有哪些,按照互联网数据生产周期进行分类,根据不同的周期分析包含哪些数据,并对其进行分类,形成互联网数据目录清单。
所述的数据个性化分类中政府数据分类方法如下:政府数据按主题、领域、行业、部门进行分类,部门根据行政级别不同,建立统称部门;形成一套政府数据个性化的主题、领域、行业、部门分类体系。
所述的数据个性化分类中社会数据分类方法如下:社会数据按主题、行业、领域、服务对象的维度进行分类,形成社会数据个性化的主题、行业、服务对象的分类标准体系。
所述的数据个性化分类中互联网数据分类方法如下:互联网数据按主题、行业的维度进行分类,形成互联网数据个性化的主题、行业、平台功能类别分类标准体系。
本发明的一种基于多源数据融合的分类方法和现有技术相比,具有以下特点:
1)充分实现了政府数据、社会数据、互联网数据的深度融合,为实现一体化大数据中心建设提供基础保障;
2)更好的挖掘出不同类别的数据,保证数据梳理的全面性,为后期数据应用、数据流通提供强有力的支撑;
3)该方法实用性较强,适用范围广泛,并且易于推广,为政府、社会组织、互联网工作者提供了开阔的思路,促进了大数据环境和产业的发展。
具体实施方式
实施例1:
该基于多源数据融合的分类方法通过数据梳理、数据个性化分类、多源数据融合分类三步实现;
数据梳理:分别对政府数据、社会数据、互联网数据生产者及数据进行梳理;
政府数据梳理方法如下:分析政府各部门单位职责和机构设置,形成职责清单,根据职责清单梳理出本单位管理对象或服务对象,并完善职责清单,形成每个职责对应哪些管理对象或服务对象清单,并根据管理对象或服务对象的生命周期,分析形成每阶段对应的数据目录清单,汇聚各单位数据目录清单,形成政府数据目录全集清单。
社会数据梳理方法如下:分析社会数据来源单位,并根据来源单位职责梳理本单位业务范围,根据本单位业务,梳理出本单位相关的数据目录,汇聚各社会组织单位数据目录,形成社会数据目录清单。
互联网数据梳理方法如下:分析互联网数据产生者有哪些,按照互联网数据生产周期进行分类,根据不同的周期分析包含哪些数据,并对其进行分类,形成互联网数据目录清单。
数据个性化分类:根据政府数据、社会数据、互联网数据各自属性,分别对其按照不同的维度进行分类;
政府数据分类方法如下:政府数据可按主题、领域、行业、部门等进行分类,部门根据行政级别不同,可建立统称部门,如教育部门、民政部门等,以教育部门为例,国家为教育部,省级为教育厅,市级为教育局,为保证统一,可统称为教育部门;形成一套政府数据个性化的主题、领域、行业、部门分类体系。
社会数据分类方法如下:社会数据按主题、行业、领域、服务对象的维度进行分类,形成社会数据个性化的主题、行业、服务对象的分类标准体系。
互联网数据分类方法如下:互联网数据按主题、行业的维度进行分类,形成互联网数据个性化的主题、行业、平台功能类别分类标准体系。
多源数据融合分类:根据政府数据、社会数据、互联网数据各自分类,寻找共性分类维度,按照主题、行业进行融合分类,建立公有的主题和行业分类体系及各自个性化的分类维度,实现政府数据、社会数据、互联网数据深度融合。
通过上面具体实施方式,所述技术领域的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的几种具体实施方式。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。

Claims (7)

1.一种基于多源数据融合的分类方法,其特征在于,该分类方法通过数据梳理、数据个性化分类、多源数据融合分类三步实现;
数据梳理:分别对政府数据、社会数据、互联网数据生产者及数据进行梳理;
数据个性化分类:根据政府数据、社会数据、互联网数据各自属性,分别对其按照不同的维度进行分类;
多源数据融合分类:根据政府数据、社会数据、互联网数据各自分类,寻找共性分类维度,按照主题、行业进行融合分类,建立公有的主题和行业分类体系及各自个性化的分类维度,实现政府数据、社会数据、互联网数据深度融合。
2.根据权利要求1所述的一种基于多源数据融合的分类方法,其特征在于,所述的数据梳理中政府数据梳理方法如下:分析政府各部门单位职责和机构设置,形成职责清单,根据职责清单梳理出本单位管理对象或服务对象,并完善职责清单,形成每个职责对应哪些管理对象或服务对象清单,并根据管理对象或服务对象的生命周期,分析形成每阶段对应的数据目录清单,汇聚各单位数据目录清单,形成政府数据目录全集清单。
3.根据权利要求1所述的一种基于多源数据融合的分类方法,其特征在于,所述的数据梳理中社会数据梳理方法如下:分析社会数据来源单位,并根据来源单位职责梳理本单位业务范围,根据本单位业务,梳理出本单位相关的数据目录,汇聚各社会组织单位数据目录,形成社会数据目录清单。
4.根据权利要求1所述的一种基于多源数据融合的分类方法,其特征在于,所述的数据梳理中互联网数据梳理方法如下:分析互联网数据产生者有哪些,按照互联网数据生产周期进行分类,根据不同的周期分析包含哪些数据,并对其进行分类,形成互联网数据目录清单。
5.根据权利要求1所述的一种基于多源数据融合的分类方法,其特征在于,所述的数据个性化分类中政府数据分类方法如下:政府数据按主题、领域、行业、部门进行分类,部门根据行政级别不同,建立统称部门;形成一套政府数据个性化的主题、领域、行业、部门分类体系。
6.根据权利要求1所述的一种基于多源数据融合的分类方法,其特征在于,所述的数据个性化分类中社会数据分类方法如下:社会数据按主题、行业、领域、服务对象的维度进行分类,形成社会数据个性化的主题、行业、服务对象的分类标准体系。
7.根据权利要求1所述的一种基于多源数据融合的分类方法,其特征在于,所述的数据个性化分类中互联网数据分类方法如下:互联网数据按主题、行业的维度进行分类,形成互联网数据个性化的主题、行业、平台功能类别分类标准体系。
CN201710452326.1A 2017-06-15 2017-06-15 一种基于多源数据融合的分类方法 Pending CN107247787A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710452326.1A CN107247787A (zh) 2017-06-15 2017-06-15 一种基于多源数据融合的分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710452326.1A CN107247787A (zh) 2017-06-15 2017-06-15 一种基于多源数据融合的分类方法

Publications (1)

Publication Number Publication Date
CN107247787A true CN107247787A (zh) 2017-10-13

Family

ID=60019111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710452326.1A Pending CN107247787A (zh) 2017-06-15 2017-06-15 一种基于多源数据融合的分类方法

Country Status (1)

Country Link
CN (1) CN107247787A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109360136A (zh) * 2018-09-05 2019-02-19 中电科大数据研究院有限公司 一种政务数据统一融合系统
CN111625545A (zh) * 2020-06-08 2020-09-04 北京创鑫旅程网络技术有限公司 数据融合方法、数据融合装置及存储介质
CN112650731A (zh) * 2020-12-22 2021-04-13 浪潮云信息技术股份公司 一种基于数据治理的主题库建设方法及系统
CN114860875A (zh) * 2022-04-26 2022-08-05 深圳市生态环境智能管控中心 一种固定污染源的数据整合系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050171942A1 (en) * 2004-01-08 2005-08-04 Yohko Ohtani Information processing apparatus, data search method and data search program that can reduce processing time for obtaining data
CN104133912A (zh) * 2014-08-11 2014-11-05 浪潮软件股份有限公司 一种梳理政府开放数据集的方法
CN105159951A (zh) * 2015-08-17 2015-12-16 成都中科大旗软件有限公司 一种开放式的旅游多源异构数据融合方法及系统
CN105528412A (zh) * 2015-12-03 2016-04-27 中国科学院遥感与数字地球研究所 一种多元异构数据汇聚分析方法及系统
CN105740339A (zh) * 2016-01-25 2016-07-06 河北中科恒运软件科技股份有限公司 民政大数据融合管理系统
CN105787647A (zh) * 2016-02-19 2016-07-20 浪潮软件股份有限公司 一种基于政府业务数据梳理的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050171942A1 (en) * 2004-01-08 2005-08-04 Yohko Ohtani Information processing apparatus, data search method and data search program that can reduce processing time for obtaining data
CN104133912A (zh) * 2014-08-11 2014-11-05 浪潮软件股份有限公司 一种梳理政府开放数据集的方法
CN105159951A (zh) * 2015-08-17 2015-12-16 成都中科大旗软件有限公司 一种开放式的旅游多源异构数据融合方法及系统
CN105528412A (zh) * 2015-12-03 2016-04-27 中国科学院遥感与数字地球研究所 一种多元异构数据汇聚分析方法及系统
CN105740339A (zh) * 2016-01-25 2016-07-06 河北中科恒运软件科技股份有限公司 民政大数据融合管理系统
CN105787647A (zh) * 2016-02-19 2016-07-20 浪潮软件股份有限公司 一种基于政府业务数据梳理的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
中国IDC圈: "浪潮集团云服务产品部总经理朱勇:云的演进", 《HTTP://CLOUD.IDCQUAN.COM/YZX/115317.SHTML》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109360136A (zh) * 2018-09-05 2019-02-19 中电科大数据研究院有限公司 一种政务数据统一融合系统
CN111625545A (zh) * 2020-06-08 2020-09-04 北京创鑫旅程网络技术有限公司 数据融合方法、数据融合装置及存储介质
CN111625545B (zh) * 2020-06-08 2023-09-01 北京创鑫旅程网络技术有限公司 数据融合方法、数据融合装置及存储介质
CN112650731A (zh) * 2020-12-22 2021-04-13 浪潮云信息技术股份公司 一种基于数据治理的主题库建设方法及系统
CN114860875A (zh) * 2022-04-26 2022-08-05 深圳市生态环境智能管控中心 一种固定污染源的数据整合系统及方法

Similar Documents

Publication Publication Date Title
CN107247787A (zh) 一种基于多源数据融合的分类方法
Franco et al. Democratic land control and human rights
Boettcher et al. Ordinary percolation with discontinuous transitions
CN101789045B (zh) 一种面向制造领域的mda建模工具的实现方法
CN107786355A (zh) 一种智慧城市信息共享的方法和装置
Gomes et al. Towards an infrastructure to support big data for a smart city project
Simonsen Networks, flows, and fluids—reimagining spatial analysis?
CN103164476A (zh) 一种bi应用元数据描述文件的执行方法和装置
Ohnmacht et al. Mobilities and inequality–an introduction
Sevegnani et al. Towards a bigraphical encoding of actors
Hauder et al. Generating Dynamic Cross‐Organizational Process Visualizations through Abstract View Model Pattern Matching
Maunula et al. The implementation of building information modeling (BIM): A process perspective
CN107169044A (zh) 一种城市人才资源综合管理方法
Sabou et al. Collective intelligence aspects of cyber-physical social systems: results of a systematic mapping study
Olawumi et al. Scientometric review and analysis: A case example of smart buildings and smart cities
CN103353849A (zh) 一种基于事件的业务流程管理方法
Deicke CIDOC CRM-based modeling of archaeological catalogue data.
CN104917767A (zh) 基于rbac模型的家庭业务访问控制方法
Maynard et al. Ontologies as bridges between data sources and user queries: the KNOWMAK project experience
Kim et al. Incremental knowledge management of web community groups on web portals
Kingsford Learning to be a Woman: negotiating gender and identity in Zanzibar
Tilve Álvarez et al. Integrating medical and research information: a big data approach
CN116561222A (zh) 一种能够实现高效更新和查询的空间数据管理方法
Chen et al. The structural transition and reproduction of rural society in the urbanization of China
Roberts The uncertain future of immigrant transnational organization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171013