CN109739820A - 一种基于大数据分析的电子政务信息服务系统 - Google Patents

一种基于大数据分析的电子政务信息服务系统 Download PDF

Info

Publication number
CN109739820A
CN109739820A CN201811634255.8A CN201811634255A CN109739820A CN 109739820 A CN109739820 A CN 109739820A CN 201811634255 A CN201811634255 A CN 201811634255A CN 109739820 A CN109739820 A CN 109739820A
Authority
CN
China
Prior art keywords
enterprise
unit
data
information
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811634255.8A
Other languages
English (en)
Inventor
廖雅哲
陈思恩
杨紫胜
吴炎泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technology Valley (xiamen) Information Technology Co Ltd
Original Assignee
Technology Valley (xiamen) Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Technology Valley (xiamen) Information Technology Co Ltd filed Critical Technology Valley (xiamen) Information Technology Co Ltd
Priority to CN201811634255.8A priority Critical patent/CN109739820A/zh
Publication of CN109739820A publication Critical patent/CN109739820A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据分析的电子政务信息服务系统,包括数据采集单元、数据融合单元、大数据存储单元、企业图谱单元、企业标签建设单元、企业画像分析单元、机器学习引擎、数据中心及应用单元。本发明基于大数据分析技术,对电子政务数据进行挖掘分析,实现了信息资源的有效整合和开发利用,能够对辖区经济发展情况以及辖区企业有整体的了解,从而有助于使政府执政能力和公共服务水平得到进一步提升。

Description

一种基于大数据分析的电子政务信息服务系统
技术领域
本发明涉及大数据处理技术领域,特别涉及一种基于大数据分析的电子政务信息服务系统。
背景技术
随着信息化建设工作的开展,各个政府部门都在一定程度上积累了电子政务数据,但目前各部门的政务数据孤立存在,并没有形成有效的交换共享,并且由于各部门数据的孤立存在,没有形成政务信息的整合以及开发利用,不能对辖区经济发展情况以及辖区企业有整体的了解。
发明内容
为解决上述问题,本发明提供了一种基于大数据分析的电子政务信息服务系统。
本发明采用以下技术方案:
一种基于大数据分析的电子政务信息服务系统,包括数据采集单元、数据融合单元、大数据存储单元、企业图谱单元、企业标签建设单元、企业画像分析单元、机器学习引擎、数据中心及应用单元,其中:
所述数据采集单元用于采集各政府机构的原始业务数据并存储到大数据存储单元,其包括Sqoop数据抽取工具、Storm实时数据获取工具、HDFS文件传输工具、API接口Restful服务工具;
所述数据融合单元用于对采集到的原始出行数据进行清洗、转换及加载,得到目标业务数据;
所述企业图谱单元采用图数据库和力导图的可视化技术,还原出企业关系网络;
所述企业标签建设单元用于针对企业打标签,其包括标签管理模块、资源管理模块、作业调度模块及作业跟踪模块,所述标签管理模块采用树形结构的方式对企业相关的标签进行管理和配置信息的维护,所述资源管理模块用于管理自动化打标签的脚本文件,所述作业调度模块用于将要打的标签的树形结构和自动化打标签的脚本文件关联起来,实现根据周期对企业进行打标签的操作,所述作业跟踪模块是对打标签的作业进度进行跟踪;
所述企业画像分析单元基于所述目标业务数据,对已经打好标签的企业进行群体或者个体的分析,获得画像分析结果;
所述机器学习引擎用于提供所述数据融合单元、企业标签建设单元、企业画像分析单元、企业图谱单元在工作过程中所需的算法模型,所述机器学习引擎基于spark分布式计算框架实现;
所述数据中心包括全文检索数据库、自然人数据库、法人单位档案库、企业画像标签库、企业关系图谱库、区域经济汇总库及气象信息数据库;
所述应用单元包括查询模块及大屏监控服务模块,所述查询模块用于提供基于企业相关的关注要素的模糊查询和特征检索,所述大屏监控服务模块用于实时显示区域经济信息和气象信息。
优选地,所述企业图谱单元包括HDFS文件系统、图数据库引擎及应用层,所述HDFS文件系统上存储有HBASE数据库和Solrcloud索引,所述图数据库引擎包括数据及索引存储层、数据库层及Client API层,所述数据及索引存储层与所述HBASE数据库和Solrcloud索引相连,所述Client API层与所述应用层相连,所述应用层用于提供海量关系运算、海量检索、关系关联、手工绘制、GIS整合、实时关系运算、关系扩展、特征查询、属性收集及图分析。
优选地,所述应用单元还包括数据共享模块,所述数据共享模块用于为外部系统提供数据共享接口。
优选地,所述画像分析结果包含企业基本信息、工商信息、税务信息、用地信息、环保信息、能耗信息、经营信息、财务信息及风险信息。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
本发明基于大数据分析技术,对电子政务数据进行挖掘分析,实现了信息资源的有效整合和开发利用,能够对辖区经济发展情况以及辖区企业有整体的了解,从而有助于使政府执政能力和公共服务水平得到进一步提升。
附图说明
图1为本发明的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
参考图1所示,本发明公开了一种基于大数据分析的电子政务信息服务系统,包括数据采集单元1、数据融合单元2、大数据存储单元3、企业图谱单元4、企业标签建设单元5、企业画像分析单元6、机器学习引擎7、数据中心8及应用单元9,其中:
数据采集单元1用于采集各政府机构的原始业务数据并存储到大数据存储单元3,其包括Sqoop数据抽取工具、Storm实时数据获取工具、HDFS文件传输工具、API接口Restful服务工具。
数据融合单元2用于对采集到的原始出行数据进行清洗、转换及加载,得到目标业务数据。
企业图谱单元4采用图数据库和力导图的可视化技术,还原出企业关系网络。企业图谱单元4包括HDFS文件系统、图数据库引擎及应用层,HDFS文件系统上存储有HBASE数据库和Solrcloud索引,图数据库引擎包括数据及索引存储层、数据库层及Client API层,数据及索引存储层与HBASE数据库和Solrcloud索引相连,Client API层与应用层相连,应用层用于提供海量关系运算、海量检索、关系关联、手工绘制、GIS整合、实时关系运算、关系扩展、特征查询、属性收集及图分析。
企业标签建设单元5用于针对企业打标签,其包括标签管理模块、资源管理模块、作业调度模块及作业跟踪模块,标签管理模块采用树形结构的方式对企业相关的标签进行管理和配置信息的维护,资源管理模块用于管理自动化打标签的脚本文件,作业调度模块用于将要打的标签的树形结构和自动化打标签的脚本文件关联起来,实现根据周期对企业进行打标签的操作,作业跟踪模块是对打标签的作业进度进行跟踪。
企业画像分析单元6基于目标业务数据,对已经打好标签的企业进行群体或者个体的分析,获得画像分析结果。画像分析结果包含企业基本信息、工商信息、税务信息、用地信息、环保信息、能耗信息、经营信息、财务信息及风险信息。
机器学习引擎7用于提供数据融合单元2、企业标签建设单元5、企业画像分析单元6、企业图谱单元4在工作过程中所需的算法模型,机器学习引擎7基于spark分布式计算框架实现。
数据中心8包括全文检索数据库、自然人数据库、法人单位档案库、企业画像标签库、企业关系图谱库、区域经济汇总库及气象信息数据库。
应用单元9包括查询模块、大屏监控服务模块及数据共享模块,查询模块用于提供基于企业相关的关注要素的模糊查询和特征检索,大屏监控服务模块用于实时显示区域经济信息和气象信息,数据共享模块用于为外部系统提供数据共享接口。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (4)

1.一种基于大数据分析的电子政务信息服务系统,其特征在于,包括数据采集单元、数据融合单元、大数据存储单元、企业图谱单元、企业标签建设单元、企业画像分析单元、机器学习引擎、数据中心及应用单元,其中:
所述数据采集单元用于采集各政府机构的原始业务数据并存储到大数据存储单元,其包括Sqoop数据抽取工具、Storm实时数据获取工具、HDFS文件传输工具、API接口Restful服务工具;
所述数据融合单元用于对采集到的原始出行数据进行清洗、转换及加载,得到目标业务数据;
所述企业图谱单元采用图数据库和力导图的可视化技术,还原出企业关系网络;
所述企业标签建设单元用于针对企业打标签,其包括标签管理模块、资源管理模块、作业调度模块及作业跟踪模块,所述标签管理模块采用树形结构的方式对企业相关的标签进行管理和配置信息的维护,所述资源管理模块用于管理自动化打标签的脚本文件,所述作业调度模块用于将要打的标签的树形结构和自动化打标签的脚本文件关联起来,实现根据周期对企业进行打标签的操作,所述作业跟踪模块是对打标签的作业进度进行跟踪;
所述企业画像分析单元基于所述目标业务数据,对已经打好标签的企业进行群体或者个体的分析,获得画像分析结果;
所述机器学习引擎用于提供所述数据融合单元、企业标签建设单元、企业画像分析单元、企业图谱单元在工作过程中所需的算法模型,所述机器学习引擎基于spark分布式计算框架实现;
所述数据中心包括全文检索数据库、自然人数据库、法人单位档案库、企业画像标签库、企业关系图谱库、区域经济汇总库及气象信息数据库;
所述应用单元包括查询模块及大屏监控服务模块,所述查询模块用于提供基于企业相关的关注要素的模糊查询和特征检索,所述大屏监控服务模块用于实时显示区域经济信息和气象信息。
2.如权利要求1所述的一种基于大数据分析的电子政务信息服务系统,其特征在于:所述企业图谱单元包括HDFS文件系统、图数据库引擎及应用层,所述HDFS文件系统上存储有HBASE数据库和Solrcloud索引,所述图数据库引擎包括数据及索引存储层、数据库层及Client API层,所述数据及索引存储层与所述HBASE数据库和Solrcloud索引相连,所述Client API层与所述应用层相连,所述应用层用于提供海量关系运算、海量检索、关系关联、手工绘制、GIS整合、实时关系运算、关系扩展、特征查询、属性收集及图分析。
3.如权利要求1或2所述的一种基于大数据分析的电子政务信息服务系统,其特征在于:所述应用单元还包括数据共享模块,所述数据共享模块用于为外部系统提供数据共享接口。
4.如权利要求3所述的一种基于大数据分析的电子政务信息服务系统,其特征在于:所述画像分析结果包含企业基本信息、工商信息、税务信息、用地信息、环保信息、能耗信息、经营信息、财务信息及风险信息。
CN201811634255.8A 2018-12-29 2018-12-29 一种基于大数据分析的电子政务信息服务系统 Pending CN109739820A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811634255.8A CN109739820A (zh) 2018-12-29 2018-12-29 一种基于大数据分析的电子政务信息服务系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811634255.8A CN109739820A (zh) 2018-12-29 2018-12-29 一种基于大数据分析的电子政务信息服务系统

Publications (1)

Publication Number Publication Date
CN109739820A true CN109739820A (zh) 2019-05-10

Family

ID=66362231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811634255.8A Pending CN109739820A (zh) 2018-12-29 2018-12-29 一种基于大数据分析的电子政务信息服务系统

Country Status (1)

Country Link
CN (1) CN109739820A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377752A (zh) * 2019-06-26 2019-10-25 广东鼎义互联科技股份有限公司 一种应用于政务大厅运营的知识库系统
CN110472680A (zh) * 2019-08-08 2019-11-19 京东城市(北京)数字科技有限公司 目标分类方法、装置和计算机可读存储介质
CN110796470A (zh) * 2019-08-13 2020-02-14 广州中国科学院软件应用技术研究所 一种面向市场主体监管和服务的数据分析系统
CN111737272A (zh) * 2020-06-02 2020-10-02 脑谷人工智能研究院(南京)有限公司 一种可交互展示各类指标的大数据自动化管理平台
CN112487105A (zh) * 2020-11-12 2021-03-12 深圳市中博科创信息技术有限公司 一种企业画像的构建方法
CN112700170A (zh) * 2021-01-15 2021-04-23 科技谷(厦门)信息技术有限公司 一种基于园区大数据的精准招商平台
CN112837199A (zh) * 2021-02-25 2021-05-25 重庆数联铭信科技有限公司 一种建立中小微企业大数据服务平台的方法
CN117217568A (zh) * 2023-07-24 2023-12-12 广东省投资和信用中心(广东省发展和改革事务中心) 一种基于市场主体信息资源库的经济监测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636864A (zh) * 2015-01-28 2015-05-20 贵州省邮电规划设计院有限公司 基于云计算的政务信息资源管理系统
CN107229708A (zh) * 2017-05-27 2017-10-03 科技谷(厦门)信息技术有限公司 一种个性化出行服务大数据应用系统及方法
CN107748800A (zh) * 2017-11-15 2018-03-02 北京易讯通信息技术股份有限公司 一种分布式实时数据处理政务服务数据的融合与共享方法
US20180373781A1 (en) * 2017-06-21 2018-12-27 Yogesh PALRECHA Data handling methods and system for data lakes

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636864A (zh) * 2015-01-28 2015-05-20 贵州省邮电规划设计院有限公司 基于云计算的政务信息资源管理系统
CN107229708A (zh) * 2017-05-27 2017-10-03 科技谷(厦门)信息技术有限公司 一种个性化出行服务大数据应用系统及方法
US20180373781A1 (en) * 2017-06-21 2018-12-27 Yogesh PALRECHA Data handling methods and system for data lakes
CN107748800A (zh) * 2017-11-15 2018-03-02 北京易讯通信息技术股份有限公司 一种分布式实时数据处理政务服务数据的融合与共享方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
唐长乐: ""基于政务云数据中心的政府数据开放共享服务集成平台研究"", 《情报资料工作》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377752A (zh) * 2019-06-26 2019-10-25 广东鼎义互联科技股份有限公司 一种应用于政务大厅运营的知识库系统
CN110472680A (zh) * 2019-08-08 2019-11-19 京东城市(北京)数字科技有限公司 目标分类方法、装置和计算机可读存储介质
CN110796470A (zh) * 2019-08-13 2020-02-14 广州中国科学院软件应用技术研究所 一种面向市场主体监管和服务的数据分析系统
CN110796470B (zh) * 2019-08-13 2023-09-01 广州中国科学院软件应用技术研究所 一种面向市场主体监管和服务的数据分析系统
CN111737272A (zh) * 2020-06-02 2020-10-02 脑谷人工智能研究院(南京)有限公司 一种可交互展示各类指标的大数据自动化管理平台
CN112487105A (zh) * 2020-11-12 2021-03-12 深圳市中博科创信息技术有限公司 一种企业画像的构建方法
CN112700170A (zh) * 2021-01-15 2021-04-23 科技谷(厦门)信息技术有限公司 一种基于园区大数据的精准招商平台
CN112837199A (zh) * 2021-02-25 2021-05-25 重庆数联铭信科技有限公司 一种建立中小微企业大数据服务平台的方法
CN117217568A (zh) * 2023-07-24 2023-12-12 广东省投资和信用中心(广东省发展和改革事务中心) 一种基于市场主体信息资源库的经济监测方法及系统

Similar Documents

Publication Publication Date Title
CN109739820A (zh) 一种基于大数据分析的电子政务信息服务系统
Huang et al. Big spatial data for urban and environmental sustainability
CN112115198B (zh) 一种城市遥感智能服务平台
Li et al. Geomatics for smart cities-concept, key techniques, and applications
CN116307757A (zh) 一种数据智能交互方法、交互系统、计算机设备及应用
CN112687097A (zh) 一种高速公路路段级数据中台系统
Saravanan et al. Smart cities & IoT: evolution of applications, architectures & technologies, present scenarios & future dream
CN106407278A (zh) 一种大数据平台的架构设计系统
CN102915346A (zh) 面向物联网智能感知的数据索引建立与查询方法
CN103281351A (zh) 一种高效能遥感数据处理与分析的云服务平台
Bordogna et al. Clustering geo-tagged tweets for advanced big data analytics
Xing et al. The challenges of image segmentation in big remotely sensed imagery data
CN110968636A (zh) 面向地震预警的多维大数据分析与处理系统
CN113886596A (zh) 基于城市要素和多灾害融合的韧性城市知识图谱构建方法
CN101256677B (zh) 一种自动监测仿真及其并行化处理的方法
CN112883001A (zh) 一种基于营配贯通数据可视化平台的数据处理方法、装置及介质
CN116522272A (zh) 一种基于城市信息单元的多源时空数据透明融合方法
Zhang et al. Map generation from large scale incomplete and inaccurate data labels
Hu et al. Urban landscape information atlas and model system based on remote sensing images
CN109165203A (zh) 基于Hadoop架构的大型公共建筑能耗数据存储分析方法
Vasilev et al. A GIS-Based Approach in Support of Monitoring Sustainable Urban Consumption Variables
Gorgul et al. A visualization based analysis to assist rebalancing issues related to last mile problem for bike sharing programs in China: a big-data case study on mobike
Chaturvedi Integration and management of time-dependent properties with semantic 3D city models
CN117874498B (zh) 基于数据湖的智慧林业大数据系统、方法、设备及介质
Yun et al. Implementation of floating population analysis for smart cities: A case study in Songdo Incheon South Korea

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination