CN112435151B - 一种基于关联分析的政务信息数据处理方法及系统 - Google Patents
一种基于关联分析的政务信息数据处理方法及系统 Download PDFInfo
- Publication number
- CN112435151B CN112435151B CN202011356149.5A CN202011356149A CN112435151B CN 112435151 B CN112435151 B CN 112435151B CN 202011356149 A CN202011356149 A CN 202011356149A CN 112435151 B CN112435151 B CN 112435151B
- Authority
- CN
- China
- Prior art keywords
- data
- association
- government
- result
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012098 association analyses Methods 0.000 title claims abstract description 40
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000011161 development Methods 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 31
- 238000004140 cleaning Methods 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000000034 method Methods 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 11
- 238000012847 principal component analysis method Methods 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000013138 pruning Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 238000000513 principal component analysis Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2141—Access rights, e.g. capability lists, access control lists, access tables, access matrices
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Bioethics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Computing Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提出了一种基于关联分析的政务信息数据处理方法及系统,包括:通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作;对获取的数据进行清洗及预处理,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果。本公开技术方案将不同的政务指标数据进行了关联处理,获得数据之间的关联性。
Description
技术领域
本公开属于数据处理技术领域,尤其涉及一种基于关联分析的政务信息数据处理方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
目前的电子政务平台主要集中在政务服务器中进行数据的输入及输出工作,政务服务器处于局域网中,一般情况下,需要单独的服务器对政务服务器中存储的数据进行计算分析处理,这时则需要网络进行传输,但是上述政务数据在数据的传输过程中没有考虑数据传输的安全性及实时性。
另外,目前的政务数据的处理仅仅限于数据的简单统计及图形展示,没有将政务信息进一步挖掘分析,没有充分利用数据之间的关联性,不能充分对数据进行展示。
发明内容
为克服上述现有技术的不足,本公开提供了一种基于关联分析的政务信息数据处理方法,能够实现对数据的安全传输及实时展示。
为实现上述目的,本公开的一个或多个实施例提供了如下技术方案:
第一方面,公开了一种基于关联分析的政务信息数据处理方法,包括:
通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;
判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作,读取时经过加密数据过滤及安全防护;
对获取的数据进行清洗及预处理,针对政务公开关键指标数据获得定量数据的分布分析图,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;
将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;
调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果,将上述政务数据的关联结果进行发布。
进一步的技术方案,对获取的数据进行清洗时,扫描收集到的所有政务公开的关键指标数据以及该地经济发展相关的各项指标数据,对数据进行分类,去除不需要字段、填充缺失内容。
进一步的技术方案,对获取的数据进行清洗后,接收政务公开关键指标数据对其进行量化、除去异常数据点,绘制定量数据的分布分析图。
进一步的技术方案,对获取的数据进行清洗后,接受经济社会发展相关指标对其消除数据量纲、进行标准化,将标准化后的指标数据采用主成分分析法进行处理。
进一步的技术方案,调用第一数据列表及第二数据列表并进行数据关联分析时,通过迭代,检索出关联规则模型中的所有频繁项集,完成连接步和剪枝步,利用频繁项集的数据挖掘某地政务公开水平与经济社会发展水平之间的强关联规则,对关联结果进行分析并输出关联结果到界面。
进一步的技术方案,将上述政务数据的关联结果进行发布时,通过通信方式将结果数据推送至用户终端或者共享云平台。
进一步的技术方案,第一数据列表及第二数据列表分别暂存在存储器,为同一存储器或不同存储器。
第二方面,公开了一种基于关联分析的政务信息数据处理系统,包括:
数据获取模块,通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;
判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作,读取时经过加密数据过滤及安全防护;
数据清洗模块,对获取的数据进行清洗及预处理;
数据处理模块,针对政务公开关键指标数据获得定量数据的分布分析图,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;
关联分析模块,将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;
调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果,将上述政务数据的关联结果进行发布。
以上一个或多个技术方案存在以下有益效果:
本公开技术方案在数据获取阶段,基于数据传输的安全性考虑,通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作,读取时经过加密数据过滤及安全防护,确保数据的在传输阶段的安全性及准确性。
本公开技术方案将不同的政务指标数据进行了关联处理,获得数据之间的关联性。
本公开技术方案充分利用定量数据的分布分析方法以及主成分分析法将离散的政务公开数据转化为定量区间,并把海量的地方经济发展数据整合为综合指标,实现政务公开离散数据区间化、消除冗余数据,并实现经济社会发展信息整合。有效解决了离散数据难以导入计算模型的问题同时大大降低了运算量。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1为本公开实施例基于关联分析的政务信息数据处理系统结构示意图;
图2为本公开实施例基于关联分析的政务信息数据处理Apriori算法具体流程图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
从大量的数据集中找到两者的关联关系这就需要用到数据挖掘技术,在大量的数据挖掘技术中Apriori算法是解决此类问题的常用算法之一。Apriori算法是一种挖掘关联规则的频繁项集算法,是目前影响最为广泛的挖掘布尔关联规则频繁项集的算法,其核心是基于两阶段频集思想的递推算法,该关联规则在分类上属于单维、单层、布尔关联规则。
本发明选择Apriori算法是因为此算法采用了逐层搜索的迭代的方法,过程简单明了,没有复杂的理论推导,也易于实现,目前Apriori算法已经被广泛的应用到商业、网络安全等各个领域,因此Apriori算法也同样适用于政务公开水平与经济社会发展的关联分析当中。
实施例一
本实施例公开了一种基于关联分析的政务信息数据处理方法,包括:
通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;
判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作,读取时经过加密数据过滤及安全防护;
对获取的数据进行清洗及预处理,针对政务公开关键指标数据获得定量数据的分布分析图,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;
将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;
调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果,将上述政务数据的关联结果进行发布。
对获取的数据进行清洗时,扫描收集到的所有政务公开的关键指标数据以及该地经济发展相关的各项指标数据,对数据进行分类,去除不需要字段、填充缺失内容。
对获取的数据进行清洗后,接收政务公开关键指标数据对其进行量化、除去异常数据点,绘制定量数据的分布分析图。
对获取的数据进行清洗后,接受经济社会发展相关指标对其消除数据量纲、进行标准化,将标准化后的指标数据采用主成分分析法进行处理。
参见附图1所示,调用第一数据列表及第二数据列表并进行数据关联分析时,通过迭代,检索出关联规则模型中的所有频繁项集,完成连接步和剪枝步,利用频繁项集的数据挖掘某地政务公开水平与经济社会发展水平之间的强关联规则,对关联结果进行分析并输出关联结果到界面。
将上述政务数据的关联结果进行发布时,通过通信方式将结果数据推送至用户终端或者共享云平台。
第一数据列表及第二数据列表分别暂存在存储器,为同一存储器或不同存储器。
实施例子二
惨啊进附图2所示,本实施例子公开了一种基于关联分析的政务信息数据处理系统,包括:
数据获取模块,通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;
判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作,读取时经过加密数据过滤及安全防护;
数据清洗模块,对获取的数据进行清洗及预处理;
数据处理模块,针对政务公开关键指标数据获得定量数据的分布分析图,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;
关联分析模块,将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;
调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果,将上述政务数据的关联结果进行发布。
数据处理模块包括第一数据处理模块、第二数据处理模块,第一数据处理模块采用定量数据的分布分析方法对政务公开关键数据进行区间划分;第二数据模块采用主成分分析法对社会经济发展相关指标进行区间划分。在关联分析模块中利用Apriori算法对对政务公开的关键指标数据以及该地经济发展综合指标数据进行关联分析,最终获得两组数据间的关联结果。
数据清洗模块,用以扫描收集到的所有政务公开的关键指标数据以及该地经济发展相关的各项指标数据,对选取的某地政务公开关键指标评估得分数据(例如行政权力运行公开指标、政务公开保障机制指标等)和社会经济发展相关指标(例如地方人均GDP、地方标准化发展、依申请公开数量等)进行数据清洗,去除不需要字段、填充缺失内容;对数据进行分类分别传输到第一、第二数据处理模块。
第一数据处理模块,接收政务公开关键指标数据对其进行量化、除去异常数据点,绘制定量数据的分布分析图;清洗完成的行政权力运行公开、政务公开保障机制等指标评估得分数据离散为多个区间;对行政权力运行公开、政务公开保障机制等指标评估得分数据进行定量数据的分布分析绘制频率分布直方图并修剪异常值,根据直方图频数分布情况把政务公开关键指标数据划分为高水平公开、中低水平公开和低水平公开区间。
第二数据处理模块。接受经济社会发展相关指标对其消除数据量纲、进行标准化。将标准化后的指标数据采用主成分分析法进行处理,将处理后的综合指标划分为高发展水平、中低发展水平和低发展水平区间。
具体为:清洗完成的地方人均GDP、地方标准化发展、依申请公开数量等数据使用主成分分析法消除数据量纲、进行标准化处理。将经济社会发展主成分得分离散化为多个区间包括:高发展水平、中低发展水平和低发展水平区间。
关联分析模块。使用Apriori算法对处理的标准化数据进行关联分析,获得两组数据间的关联结果,关联分析模块又可分为以下三个模块:频繁项集生成模块:通过迭代,检索出关联规则模型中的所有频繁项集,完成连接步和剪枝步;关联规则计算模块:利用频繁项集模块生成的数据挖掘某地政务公开水平与经济社会发展水平之间的强关联规则;关联结果输出模块:获得两组数据间的关联结果,对产生的关联结果进行分析并输出分析结果。对关联结果进行分析并输出关联结果到界面。
在具体实施例子中,将上述处理模块处理后的数据导入所述关联规则模型,形成数据集T={T1,T2,...,TS...}。对关联规则模型中的数据集T进行关联分析,使用Apriori算法对数据集T进行关联分析,通过连接步和剪枝步迭代产生候选频繁项集,对频繁项集的每个候选集进行计数,抛弃小于最小支持度的项集,基于此频繁项集获取关联规则。根据频繁项集产生强关联规则,强关联规则满足最小支持度和最小置信度,在本发明中最小支持度设置为50%、最小置信度设置为70%,若关联规则高水平发展区间=>高发展水平区间,则认为政务公开水平和经济社会发展强关联。最终对关联结果进行分析并输出关联结果到界面。
本公开技术方案有利于开展地方政府政务公开水平与经济社会发展之间的关联分析,根据计算的关联结果可以调整政务公开相关性影响因子的权重使政务公开工作更加合理化、规范化也可以促进政务公开工作的发展。
实施例三
本实施例的目的是提供一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例子一中的所述方法的步骤。
实施例四
本实施例的目的是提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行上述实施例子一中的所述方法的步骤。
以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本公开中的任一方法。
本领域技术人员应该明白,上述本公开的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本公开不限制于任何特定的硬件和软件的结合。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。
Claims (8)
1.一种基于关联分析的政务信息数据处理方法,其特征是,包括:
通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;
判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作,读取时经过加密数据过滤及安全防护;
对获取的数据进行清洗及预处理,针对政务公开关键指标数据获得定量数据的分布分析图,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;
将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;具体包括:接受经济社会发展相关指标对其消除数据量纲、进行标准化,将标准化后的指标数据采用主成分分析法进行处理,将处理后的综合指标划分为高发展水平、中低发展水平和低发展水平区间;
调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果,将上述政务数据的关联结果进行发布;具体包括:使用Apriori算法对处理的标准化数据进行关联分析,获得两组数据间的关联结果,关联分析模块又可分为以下三个模块:频繁项集生成模块:通过迭代,检索出关联规则模型中的所有频繁项集,完成连接步和剪枝步;关联规则计算模块:利用频繁项集模块生成的数据挖掘某地政务公开水平与经济社会发展水平之间的强关联规则;关联结果输出模块:获得两组数据间的关联结果,对产生的关联结果进行分析并输出分析结果,对关联结果进行分析并输出关联结果到界面。
2.如权利要求1所述的一种基于关联分析的政务信息数据处理方法,其特征是,对获取的数据进行清洗时,扫描收集到的所有政务公开的关键指标数据以及该地经济发展相关的各项指标数据,对数据进行分类,去除不需要字段、填充缺失内容。
3.如权利要求2所述的一种基于关联分析的政务信息数据处理方法,其特征是,对获取的数据进行清洗后,接收政务公开关键指标数据对其进行量化、除去异常数据点,绘制定量数据的分布分析图。
4.如权利要求1所述的一种基于关联分析的政务信息数据处理方法,其特征是,将上述政务数据的关联结果进行发布时,通过通信方式将结果数据推送至用户终端或者共享云平台。
5.如权利要求1所述的一种基于关联分析的政务信息数据处理方法,其特征是,第一数据列表及第二数据列表分别暂存在存储器,为同一存储器或不同存储器。
6.一种基于关联分析的政务信息数据处理系统,用于实现权利要求1-5任一项所述的基于关联分析的政务信息数据处理方法,其特征是,包括:
数据获取模块,通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;
判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作,读取时经过加密数据过滤及安全防护;
数据清洗模块,对获取的数据进行清洗及预处理;
数据处理模块,针对政务公开关键指标数据获得定量数据的分布分析图,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;
关联分析模块,将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;
调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果,将上述政务数据的关联结果进行发布。
7.一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征是,所述处理器执行所述程序时实现上述权利要求1-5中的任一所述的方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征是,该程序被处理器执行时执行上述权利要求1-5中的任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011356149.5A CN112435151B (zh) | 2020-11-27 | 2020-11-27 | 一种基于关联分析的政务信息数据处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011356149.5A CN112435151B (zh) | 2020-11-27 | 2020-11-27 | 一种基于关联分析的政务信息数据处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112435151A CN112435151A (zh) | 2021-03-02 |
CN112435151B true CN112435151B (zh) | 2023-05-12 |
Family
ID=74697979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011356149.5A Active CN112435151B (zh) | 2020-11-27 | 2020-11-27 | 一种基于关联分析的政务信息数据处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112435151B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115017251B (zh) * | 2022-08-05 | 2022-10-25 | 山东省计算中心(国家超级计算济南中心) | 一种用于智慧城市的标准映射地图建立方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110597832A (zh) * | 2019-09-12 | 2019-12-20 | 腾讯云计算(北京)有限责任公司 | 基于区块链网络的政务信息处理方法、装置、电子设备及存储介质 |
CN110781236A (zh) * | 2019-10-29 | 2020-02-11 | 山西云时代技术有限公司 | 一种构建政务大数据治理体系的方法 |
CN111461513A (zh) * | 2020-03-20 | 2020-07-28 | 上海数据交易中心有限公司 | 政府开放数据的评估方法、数据分析平台 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100082362A1 (en) * | 2008-09-17 | 2010-04-01 | Baker Salsbury | Method and Apparatus for Assessing Salient Characteristics of a Community |
-
2020
- 2020-11-27 CN CN202011356149.5A patent/CN112435151B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110597832A (zh) * | 2019-09-12 | 2019-12-20 | 腾讯云计算(北京)有限责任公司 | 基于区块链网络的政务信息处理方法、装置、电子设备及存储介质 |
CN110781236A (zh) * | 2019-10-29 | 2020-02-11 | 山西云时代技术有限公司 | 一种构建政务大数据治理体系的方法 |
CN111461513A (zh) * | 2020-03-20 | 2020-07-28 | 上海数据交易中心有限公司 | 政府开放数据的评估方法、数据分析平台 |
Also Published As
Publication number | Publication date |
---|---|
CN112435151A (zh) | 2021-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241068A (zh) | 前后台数据比对的方法、装置及终端设备 | |
CN112702342A (zh) | 网络事件处理方法、装置、电子设备及可读存储介质 | |
CN107977504B (zh) | 一种非对称堆芯燃料管理计算方法、装置及终端设备 | |
CN116186759A (zh) | 一种面向隐私计算的敏感数据识别与脱敏方法 | |
CN112435151B (zh) | 一种基于关联分析的政务信息数据处理方法及系统 | |
CN114301692B (zh) | 攻击预测方法、装置、介质及设备 | |
CN113849595A (zh) | 一种基层治理事件类型识别方法及系统 | |
CN114398685A (zh) | 一种政务数据处理方法、装置、计算机设备及存储介质 | |
CN113240396A (zh) | 分析员工工作状态的方法、装置、设备及存储介质 | |
CN110380952B (zh) | 邮件收发方法及装置 | |
CN112231549A (zh) | 一种专利价值评估方法,系统、设备和存储介质 | |
CN116109114A (zh) | 一种常态化政务服务数据处理方法及系统 | |
CN114443738A (zh) | 异常数据挖掘方法、装置、设备及介质 | |
CN114385436A (zh) | 服务器分组方法、装置、电子设备和存储介质 | |
CN114493903A (zh) | 人伤风险评估中估损模型优化方法及相关设备 | |
CN113407495A (zh) | 一种基于simhash的文件相似度判定方法及系统 | |
CN112785335A (zh) | 一种面向电子政务绩效考核系统的数据处理方法和系统 | |
CN112750047A (zh) | 行为关系信息提取方法及装置、存储介质、电子设备 | |
CN115269879B (zh) | 知识结构数据的生成方法、数据搜索方法和风险告警方法 | |
CN116775889B (zh) | 基于自然语言处理的威胁情报自动提取方法、系统、设备和存储介质 | |
CN117573956B (zh) | 元数据管理方法、装置、设备及存储介质 | |
CN113987309B (zh) | 个人隐私数据识别方法、装置、计算机设备及存储介质 | |
CN112287186B (zh) | 一种用于城市管理的智能分类方法及其系统 | |
CN117709301A (zh) | 一种基于熵增原理的规范化日志生成方法 | |
CN113850462A (zh) | 一种事件预测处置推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |