CN115564332B - 基于大数据的政务风险分析方法及系统 - Google Patents

基于大数据的政务风险分析方法及系统 Download PDF

Info

Publication number
CN115564332B
CN115564332B CN202211221213.8A CN202211221213A CN115564332B CN 115564332 B CN115564332 B CN 115564332B CN 202211221213 A CN202211221213 A CN 202211221213A CN 115564332 B CN115564332 B CN 115564332B
Authority
CN
China
Prior art keywords
government
data
government affair
affair
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211221213.8A
Other languages
English (en)
Other versions
CN115564332A (zh
Inventor
李先美
雷海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhongke Baotai Technology Co ltd
Original Assignee
Shenzhen Zhongke Baotai Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhongke Baotai Technology Co ltd filed Critical Shenzhen Zhongke Baotai Technology Co ltd
Priority to CN202211221213.8A priority Critical patent/CN115564332B/zh
Publication of CN115564332A publication Critical patent/CN115564332A/zh
Application granted granted Critical
Publication of CN115564332B publication Critical patent/CN115564332B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据的政务风险分析方法及系统,包括业务层、平台层以及扩展层,群众用户的账号信息以及政务信息通过业务层录入,管理员管理群众用户的账号信息,政务办事员管理群众用户的政务信息,平台层基于扩展层中的大数据库建立政务风险模型辅助政务办事员诊断政务信息产生政务数据,并将政务数据发送至终端,群众用户通过终端查询政务数据,扩展层为平台层提供大数据库。本发明政务中心系统基于大数据库建立政务风险模型,用于辅助政务办事员诊断群众用户的政务信息,从而使得基础政务信息可以优先由政务风险模型进行诊断,有利于提高办事效率,并且有效减轻政务办事员的工作量。

Description

基于大数据的政务风险分析方法及系统
技术领域
本发明涉及政务管理系统技术领域,具体涉及一种基于大数据的政务风险分析方法及系统。
背景技术
政务服务中心(简称政务中心)是人民政府设立的集中办理本级政府权限范围内的行政许可、行政给付、行政确认、行政征收以及其他服务项目的综合性管理服务机构,也是加强政务服务、提高行政效能,为人民群众提供优质便捷高效服务的重要平台。
近年来,随着社会经济的发展,政务办事理念也随之改变,人们更加注重政务办事的便捷性和高效性,政务服务中心依托电子政务服务平台,深入开展“互联网+政务服务”工作,力争让企业和群众办事可以网上办、简化办,以实现最优的营商环境、高效的办事效率和智慧化的政务服务。
现有技术存在利用电子政务系统对政务数据和政务项目进行平台化管理的技术方案:
现有技术1(CN114971550A)公开了一种基于政务平台的预开对公户方法及系统,具体公开了通过对目标数据处理信息系统的历史攻击事件关系数据进行薄弱点分析,确定目标数据处理信息系统的系统薄弱点分布,获取其中各个目标系统薄弱点所对应的在其它数据处理信息系统上的历史安全防护升级策略簇。
现有技术2(CN114640471A)公开了一种基于国产操作系统的集中式政务办公客户端安全运维方法,具体公开了客户端获取用户信息,对其获取的用户信息进行处理后传输至政务平台,政务平台验证后后,客户端安全与政务平台连接。本发明能够实现安全登录政务平台,实现安全办公。
现有技术3(CN114595850A)公开了一种基于机器学习的政务预约服务推荐方法,具体公开了基于机器学习的政务预约服务推荐方法,分为多种场景进行推荐,场景一进行了数据联动,丰富数据来源,可根据各政务部门的个人记录推荐需办理事项。
但是,现有技术依然存在以下问题:
1、现有的政务系统在对群众用户进行政务信息诊断时,主要还是通过政务办事员诊断后,再将诊断产生的政务数据返回至终端供群众用户查询,然而,由于办事群众用户存在复杂性以及多样性的特点,使得现有政务中心需要接收处理的政务信息量大,这不仅增加了政务办事员的工作量,提高政务办事员的工作负担,而且单由政务办事员进行诊断的效率低。
2、现有的政务系统主要依赖办事项目提交的先后顺序安排交办,对于年老、体弱、帮扶对象、文化程度较低等需要照顾的群体,以及对于涉及土地、财产等问题,群众关注度大、容易爆发矛盾的政务事项,无法及时交办,不利于化解矛盾于未然。
发明内容
本发明的目的是提供一种基于大数据的政务风险分析系统,以解决背景技术中不足。
为了实现上述目的,本发明提供如下技术方案:一种基于大数据的政务风险分析系统,包括业务层、平台层以及扩展层;
群众用户的账号信息以及政务信息通过业务层录入,管理员管理群众用户的账号信息,政务办事员管理群众用户的政务信息,平台层基于扩展层中的大数据库建立政务风险模型辅助政务办事员诊断政务信息产生政务数据,并将政务数据发送至终端,群众用户通过终端查询政务数据,扩展层为平台层提供大数据库。
在一个优选的实施方式中,所述平台层包括诊断模块、处理模块以及查询模块,诊断模块用于建立政务风险模型辅助政务办事员诊断政务信息,处理模块用于接收诊断模块辅助政务办事员诊断产生的政务数据,处理后将数据发送至查询模块,群众用户通过查询模块查询政务数据。
在一个优选的实施方式中,所述诊断模块中,通过中心化处理对数据做无量纲化预处理,包括以下步骤:
(1)将数据按最小值进行中心化处理;
(2)按照极差进行缩放,计算公式为:
式中,yc表示处理后的数据,y表示原始数据,max(y)与min(y)分别表示极值,数据标准化处理MinMaxScaler函数实现。
在一个优选的实施方式中,所述诊断模块中,通过均值填充方法对政务风险模型数据缺失值填充,计算公式为:
式中,F1值为Precision与Sensitivity的一种调和平均数。
在一个优选的实施方式中,所述诊断模块基于支持向量机建立政务风险模型,支持向量机超平面计算公式为:
ωTx+b=0
式中,ω=(ω1;ω2;...;ωd)表示决定方向的法向量,b表示原点与超平面的距离,(ω,b)表示样本空间中的超平面。
在一个优选的实施方式中,所述诊断模块中,通过高斯径向基核函数对政务风险模型进行分类,包括以下步骤:
(1)对政务数据集进行导入;
(2)构建SVM分类器并进行学习;
(3)对模型进行评价。
在一个优选的实施方式中,所述查询模块包括Web浏览器、手机端APP以及工作站查询终端,群众用户在Web浏览器、手机端APP以及工作站查询终端登录个人账号获取政务数据,工作站查询终端支持政务数据查询以及办事表打印。
在一个优选的实施方式中,所述业务层包括登入模块以及管理模块,登入模块用于政务中心录入群众用户的账号信息以及政务信息,管理模块用于管理员管理群众用户的账号信息,以及政务办事员管理群众用户的政务信息。
在一个优选的实施方式中,所述扩展层包括维护模块以及大数据库,维护模块用于维护系统的基础数据,基础数据包括数据字典维护、员工信息维护以及权限维护。
在一个优选的实施方式中,所述大数据库包括个人信息登记表、政务记录表、政务项目表以及组合项目表;
(1)个人信息登记表记录办事群众的个人信息;
(2)政务记录表记录办事群众的政务办事;
(3)政务项目表与组合项目表包括政务中心开展的政务项目以及组合项目中包含的政务项目。
在上述技术方案中,本发明提供的技术效果和优点:
1、本发明政务中心系统基于大数据库建立政务风险模型,用于辅助政务办事员诊断群众用户的政务信息,从而使得基础政务信息可以优先由政务风险模型进行诊断,有利于提高办事效率,并且有效减轻政务办事员的工作量。
2、本发明选定为特征变量的政务信息指标之间有着不同的数值范围,在构建辅助政务风险模型时需要将不同规格或不同分布的数据转换到某个特定的或相同的分布,这种转换即是数据的无量纲化,通过对数据进行无量纲化操作,使模型具有较好的表达效果,避免某些特征向量的取值范围较大或较小,对数据分类造成影响,从而提高建立模型的精度以及效率。
3、本发明基于均值填充法对模型数据集的缺失值进行填充,在现实的数据集中,数据样本会由于某种原因造成一条或几条值的缺失,政务数据集也是如此,数据的缺失可能是政务办事员的失误,也可能是样本采集错误,或者是办事结果未被填写等等,对这些缺失值的处理是在进行模型训练时的必要步骤之一,如果将包含缺失值的特征变量直接进行删除,对于样本较少的数据会影响模型的泛化能力,有效避免造成数据的浪费。
4、本发明通过高斯径向基核函数对模型进行评价,借助于高斯径向基核函数,政务风险模型也就可以便捷的对实际应用时的高维数据集进行分类,优选高斯径向基核函数对政务风险模型进行评价,对政务风险模型的分类效果好,评价精度高,速度快。
5、本发明通过风险标记,将易于发生投诉风险、交办紧迫性较高的事务,优先分配给政务办事员,同时将预警信息抄送给政务管理员,方便进行办理进度督促。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明的系统构架图。
图2为本发明的大数据库E-R图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
请参阅图1所示,本实施例所述一种基于大数据的政务风险分析系统,所述系统基于SOA开放式框架设计架构,SOA架构具有松耦合的特性,更加注重业务流程的实现,将不同应用通过接口联系起来。同时,考虑到健康政务系统与其他系统的交互性及今后的扩展性,对整个应用系统进行了分层设计,以便今后扩展。
所述系统包括业务层、平台层以及扩展层;
业务层:用于政务中心录入群众用户的账号信息以及政务信息,管理员管理群众用户的账号信息,政务办事员管理群众用户的政务信息。
平台层:基于扩展层中的大数据库建立政务风险模型辅助政务办事员诊断政务信息产生政务数据,并将政务数据发送至终端,群众用户通过终端查询政务数据。
扩展层:用于维护系统的基础数据,并为平台层提供大数据库,该政务中心系统基于大数据库建立政务风险模型,用于辅助政务办事员诊断群众用户的政务信息,从而使得基础政务信息可以优先由政务风险模型进行诊断,有利于提高办事效率,并且有效减轻政务办事员的工作量。
所述业务层包括登入模块以及管理模块;
登入模块:用于政务中心录入群众用户的账号信息以及政务信息;
管理模块:用于管理员管理群众用户的账号信息,以及政务办事员管理群众用户的政务信息;
管理员的对账号信息的管理权限包括账户管理、套餐管理、事件管理、人群数据导入以及数据管理。
(1)账号管理:管理员对政务办事员人员的管理,包括政务办事员账号信息的录入,删除和修改,由管理员验证群众用户登陆的基本信息,并防止非法用户进入系统窃取和篡改用户数据;
管理员可修改用户的基本信息,包括个人姓名、年龄、工号、手机号码、邮箱、密码等;
当用户丟失或者忘记时,通过用户的邮箱或者手机号,或者通过管理员权限,找回用户或者重置自己的密码,以防账号密码被盗,导致用户数据泄露。
(2)套餐管理:管理员可以创建常用的政务清单,方便在政务清单中设置可选的政务项目。
(3)事件管理:添加或删除政务,关联政务清单,关联历史政务事件,还可以统一导入本次集中办理的人员名单。
(4)人群数据导入:对不同人群类型的群众用户进行信息管理,查找,编辑、修改和删除。
(5)数据管理:根据多个条件筛选政务数据,输入办事结果,批量导出政务数据,并对办理结果进行批量处理(编辑,打印办事回执)。
政务办事员对政务信息的管理权限包括定义政务清单、添加办事人员、快速检索。
(1)定义政务清单:政务办事员用户可自主勾选政务项目,根据自己负责的办事任务创建自定义的政务清单,进行合理的分工。
(2)添加办事人员:有些办事中,后台导入的办事人员名单有缺失或者需要现场录入办事人员,政务办事员可以手动或者通过身份证读卡器辅助添加办事人员名单。
(3)快速检索:政务办事员对办事群众信息的快速检索,输入办事群众有效证件的部分号码或者使用身份证读卡器读取用户身份证信息来查找相应的办事群众。
实施例2
所述平台层包括诊断模块、处理模块以及查询模块;
诊断模块的主要功能是完成办事群众的政务数据的录入工作,该模块是为了政务办事员对办事群众进行包括风险诊断在内的具体操作而设计的,同时政务办事员也可对本科室录入的办事结果进行查看及修改,总政务办事员可对该办事群众所有的办事结果进行查看及修改。
诊断模块分为各科室交办以及政务办事员总检,办事群众的事项交办是在各科室进行的,各科室内的政务办事员根据办事结果给出相应的回执,政务办事员汇总各科室的回执,并对这些信息进行审查。在科室管理界面,根据各政务项目的办事回执,政务办事员可以选择相应的回执内容,或手动对回执内容进行修改并给出相应的办事建议,在将回执及建议内容保存到大数据库中后,各分科室的录入工作结束,总务科室的政务办事员再将信息进行汇总并进行审查,给出管理综述及总结建议,最后进行办事回执的打印工作。
诊断模块:用于建立政务风险模型辅助政务办事员诊断政务信息,政务大数据库中存储有大量的客户政务信息。
选定为特征变量的群众画像指标之间有着不同的数值范围,在构建辅助政务风险模型时需要将不同规格或不同分布的数据转换到某个特定的或相同的分布,这种转换即是数据的无量纲化。
对数据进行无量纲化操作是为了使模型具有较好的表达效果,避免某些特征向量的取值范围较大或较小,对数据分类造成影响。
数据无量纲化有两种较常用的方法:缩放处理及中心化处理,缩放处理是对数据进行缩放,将数据限定在某个范围内,一般是通过除以某个常量将数据限定在需要的范围内,而中心化处理数据是让数据平移到某个位置,平移是通过减去某个常量来实现的。
将各种指标的量纲进行统一,是为了使政务风险模型能够达到更好的分类效果,本实施例中,数据无量纲化的统一采用中心化处理,具体包括以下步骤:
(1)将数据按最小值进行中心化处理;
(2)按照极差进行缩放,计算公式如下:
式中,yc表示处理后的数据,y表示原始数据,max(y)与min(y)分别表示极值,数据标准化处理MinMaxScaler函数实现。
在现实的数据集中,数据样本会由于某种原因造成一条或几条值的缺失,政务数据集也是如此,数据的缺失可能是政务办事员的失误,也可能是样本采集错误等等。
对这些缺失值的处理是在进行模型训练时的必要步骤之一,如果将包含缺失值的特征变量直接进行删除,对于样本较少的数据会影响模型的泛化能力,造成数据的浪费,因此对样本进行缺失值的填充处理是必要的。
常见的缺失值填充法包括均值填充、中位数填充、众数填充,这三种方法实现简单且填充速度快,三种填充方法的效果可由F1值进行评价,F1值为Precision与Sensitivity的一种调和平均数,F1值越大效果越好,计算公式为:
其中,均值填充F1值为0.819,中位数填充F1值为0.817,众数填充F1值为0.368,通过对三种缺失值填充法中F1值的对比可知:均值填充法有着最好的效果,因此,本实施例中,对政务数据集的缺失值填充采用均值填充方式。
本实施例中,政务数据集预处理完毕后总计5857条体数据,其中将4100条数据用于模型训练,1757条数据用于模型测试。
所述诊断模块基于支持向量机算法(SVM)建立政务风险模型,SVM算法是一种实现了结构风险最小化的,专门针对样本量较为有限的数据的学习算法,SVM算法可以得到全局最优解,在实际问题中,样本数据维度高,SVM通过映射变换,将实际问题转换到高维空间来求解,巧妙的解决了高维数据所带来的问题。
所述诊断模块界能将测试集中的数据进行准确分类,通过找出边际最大的决策边界,来对数据进行分类,决策边界即超平面计算公式为:
T
ωx+b=0
式中,ω=(ω1;ω2;...;ωd)表示决定方向的法向量,b表示原点与超平面的距离。(ω,b)表示样本空间中的超平面。
将原始样本空间向高维空间进行映射转换时,维数会发生较大的增长,此时的计算量也会变得非常复杂,因此需要通过核函数对计算方式进行转换,借助于核函数,政务风险模型也就可以便捷的对实际应用时的高维数据集进行分类,常用的几种核函数形式包括线性核函数、多项式核函数以及高斯径向基核函数;
其中,
(1)线性核函数主要适用于线性的分类情况,其参数较少且运行速度较快,对于数据分布较明显的如线性可分的分布,采用线性核函数核函数有着比较理想的分类效果,一般在不清楚样本数据集中的数据分布时,会首先选用线性核函数,然后再根据分类效果决定是否更换核函数及调整相关参数。
(2)多项式核函数主要适用于将原始样本空间映射到高维空间,多项式核函数参数较多,数据量较大时会增大计算难度。
(3)高斯径向基核函数主要适用于将原始样本空间映射到高维空间。相较与前三种,高斯径向基核函数应用范围较广,参数较少,且对不同规模的样本数据都有着较好的性能,本实施例中,优选高斯径向基核函数对政务风险模型进行评价,对政务风险模型的分类效果好,评价精度高,速度快。
政务风险模型预测过程主要包括以下步骤:
(1)对政务数据集进行导入;
(2)构建SVM分类器并进行学习;
(3)对模型进行评价。
处理模块:用于接收诊断模块辅助政务办事员诊断产生的政务数据,处理数据后,将数据发送至查询模块。
查询模块:群众用户可通过查询模块查询政务数据,查询模块包括Web浏览器、手机端APP以及工作站查询终端,其中,群众用户需要在Web浏览器、手机端APP以及工作站查询终端上登录个人账号才能获取相应的政务数据,工作站查询终端可支持政务数据查询以及办事表的打印。
实施例3
所述扩展层包括维护模块以及大数据库;
其中,
维护模块包括数据字典维护、员工信息维护以及权限维护。
数据字典维护:系统中需要使用到的各类基础数据都需要进行维护,包含政务中心、办事科室、政务项目等信息。
员工信息维护:维护总检、政务办事员、接待员、管理人员等政务中心所有人员的基本信息,包含姓名、年龄、联系方式等信息。
权限维护:为了更加规范的管理办事人员权限,不同人员对于不同业务有着不同等级的权限,通过权限维护可以定义到不同角色有着添加、修改、删除业务数据的功能。
请参阅图2所示,所述大数据库包括政务办事员、办事群众以及办事报告;
E-R图主要展示的是对办事群众进行用户画像时,办事项目、办事群众、政务办事员这三个实体间的关系,办事群众这一实体主要包含编号、婚姻状况、姓名、所在单位、性别、年龄、家庭住址、联系电话等属性;
办事报告这一实体主要包含文件完备度、办事进度、紧迫性程度等属性;
政务办事员主要包含政务办事员姓名、办事建议、交办结果、办理时间、所属科室等属性。
大数据库中,个人信息登记表如表1所示:
字段名 字段类型 字段长度 备注
dabh varchar2 20 编号
xm varchar2 10 姓名
xb varchar2 2 性别
nl varchar2 6 年龄
Csrq date - 出生日期
sfz varchar2 40 身份证号
dwbh varchar2 10 单位编号
addr varchar2 100 家庭住址
lxdh varchar2 16 联系电话
hyzk varchar2 2 婚姻状况
表1
个人信息登记表主要是记录办事群众的个人信息如姓名、性别、编号、年龄、联系方式、身份证号码、婚姻状况等。
政务记录表如表2所示:
表2
政务记录表主要记录办事群众的政务办事,即所选政务项目、政务项目的检查结果、政务项目的单项收费、所选政务清单包含哪些单项等。
政务项目表如表3所示:
字段名 字段类型 字段长度 备注
xmbh varchar2 16 项目编号
xmmc varchar2 60 项目名称
dj varchar2 10 项目费用
xm lx varchar2 2 项目类型
sfzh varchar2 2 标识该项目是否为组合
xmdw varchar2 10 数值型办事结果的单位
ckfw varchar2 12 检查结果的参考范围
pyjm varchar2 30 项目拼音首字母缩写
表3
组合项目表如表4所示:
表4
政务项目与组合项目表主要包括政务中心开展的政务项目、组合项目中包含的政务项目等。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。
应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系,但也可能表示的是一种“和/或”的关系,具体可参考前后文进行理解。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-onlymemory,ROM)、随机存取存储器(randomaccessmemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (7)

1.一种基于大数据的政务风险分析系统,其特征在于:包括业务层、平台层以及扩展层;
群众用户的账号信息以及政务信息通过业务层录入,政务管理员管理群众用户的账号信息,政务办事员管理群众用户的政务信息,平台层基于扩展层中的大数据库建立政务风险模型辅助政务办事员诊断政务信息产生政务数据,并将政务数据发送至终端,群众用户通过终端查询办事进度,扩展层为平台层提供大数据库;
所述平台层包括针对积压政务风险的诊断模块、处理模块以及查询模块,诊断模块用于建立政务风险模型辅助政务办事员诊断政务信息,处理模块用于接收诊断模块辅助政务办事员诊断产生的政务数据,处理后将数据发送至查询模块,群众用户通过查询模块查询政务数据;
所述诊断模块中,通过中心化处理对数据做无量纲化预处理,包括以下步骤:
(1)将数据按最小值进行中心化处理;
(2)按照极差进行缩放,计算公式为:
Figure FDA0004133285220000011
式中,yc表示处理后的数据,y表示原始数据,max(y)与min(y)分别表示极值,数据标准化处理通过MinMaxScaler函数实现;
对于处理后的yc大于预定值的数据,进行风险标记,向政务管理员进行风险预警,并优先推送给政务办事员,
其中,所述诊断模块中,通过均值填充方法对政务风险模型数据缺失值填充,计算公式为:
Figure FDA0004133285220000012
式中,Precision表示样本精确率,Sensitivity表示样本灵敏度;F1值为样本精确率Precision与样本灵敏度Sensitivity的调和平均数,
其中,所述诊断模块基于支持向量机建立政务风险模型,支持向量机超平面计算公式为:
ωTx+b=0
式中,ω=(ω1;ω2;...;ωd)表示决定方向的法向量,ω1、ω2、…、ωd为法元素,b表示原点与超平面的距离,(ω,b)表示样本空间中的超平面。
2.根据权利要求1所述的一种基于大数据的政务风险分析系统,其特征在于:所述诊断模块中,通过高斯径向基核函数对政务风险模型进行分类,包括以下步骤:
(1)对政务数据集进行导入;
(2)构建SVM分类器并进行学习;
(3)对模型进行评价。
3.根据权利要求2所述的一种基于大数据的政务风险分析系统,其特征在于:所述查询模块包括Web浏览器、手机端APP以及工作站查询终端,群众用户在Web浏览器、手机端APP以及工作站查询终端登录个人账号获取政务数据,工作站查询终端支持政务数据查询以及办事表打印。
4.根据权利要求3所述的一种基于大数据的政务风险分析系统,其特征在于:所述业务层包括登入模块以及管理模块,登入模块用于政务中心录入群众用户的账号信息以及政务信息,管理模块用于管理员管理群众用户的账号信息,以及政务办事员管理群众用户的政务信息。
5.根据权利要求4所述的一种基于大数据的政务风险分析系统,其特征在于:所述扩展层包括维护模块以及大数据库,维护模块用于维护系统的基础数据,基础数据包括数据字典维护、员工信息维护以及权限维护。
6.根据权利要求5所述的一种基于大数据的政务风险分析系统,其特征在于:所述大数据库包括个人信息登记表、政务记录表、办事项目表以及组合项目表;
(1)个人信息登记表记录办事群众的个人信息;
(2)政务记录表记录办事群众的政务办事;
(3)政务项目表与组合项目表包括政务中心开展的政务项目以及组合项目中包含的政务项目。
7.一种基于权利要求1-6任一项所述的基于大数据的政务风险分析系统的风险分析方法,其特征在于:包括以下步骤:
S1、群众用户输入账号信息登录政务平台,选择或输入待办项目,生成政务记录表、办事项目表以及组合项目表;
S2、所述政务风险分析系统基于群众用户的账号信息、待办项目的紧迫性信息、群众用户催办次数和群众用户投诉风险,利用诊断模块进行数据处理;
S3、对于处理后大于预定值的数据,进行风险标记,向政务管理员进行风险预警,并优先推送给政务办事员。
CN202211221213.8A 2022-10-08 2022-10-08 基于大数据的政务风险分析方法及系统 Active CN115564332B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211221213.8A CN115564332B (zh) 2022-10-08 2022-10-08 基于大数据的政务风险分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211221213.8A CN115564332B (zh) 2022-10-08 2022-10-08 基于大数据的政务风险分析方法及系统

Publications (2)

Publication Number Publication Date
CN115564332A CN115564332A (zh) 2023-01-03
CN115564332B true CN115564332B (zh) 2023-04-21

Family

ID=84745520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211221213.8A Active CN115564332B (zh) 2022-10-08 2022-10-08 基于大数据的政务风险分析方法及系统

Country Status (1)

Country Link
CN (1) CN115564332B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740339A (zh) * 2016-01-25 2016-07-06 河北中科恒运软件科技股份有限公司 民政大数据融合管理系统
CN106228491A (zh) * 2016-07-28 2016-12-14 浙江喊喊网络科技有限公司 一种在线政务服务系统及其使用方法
CN109189826A (zh) * 2018-08-14 2019-01-11 北京新广视通科技有限公司 一种基于大数据的政务服务系统
CN113537775A (zh) * 2021-07-16 2021-10-22 北京政信1890智能科技有限公司 政务诉求处理方法和系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106530127B (zh) * 2016-11-09 2023-07-14 国网江苏省电力公司南京供电公司 基于文本挖掘技术的客户投诉预警监测分析系统
CN108108352A (zh) * 2017-12-18 2018-06-01 广东广业开元科技有限公司 一种基于机器学习文本挖掘技术的企业投诉风险预警方法
US10963888B2 (en) * 2019-04-10 2021-03-30 Advanced New Technologies Co., Ltd. Payment complaint method, device, server and readable storage medium
CN110349039B (zh) * 2019-06-13 2024-03-05 中国平安人寿保险股份有限公司 投诉风险评估方法、系统、计算机设备及可读存储介质
CN110503564B (zh) * 2019-07-05 2024-04-02 中国平安人寿保险股份有限公司 基于大数据的保全案件处理方法、系统、设备及存储介质
CN110930108A (zh) * 2019-10-21 2020-03-27 深圳技术大学 一种政务数据处理方法、系统、装置和存储介质
CN110955776A (zh) * 2019-11-16 2020-04-03 中电科大数据研究院有限公司 一种政务文本分类模型的构建方法
CN111210057A (zh) * 2019-12-25 2020-05-29 广东飞企互联科技股份有限公司 手机上网用户投诉预测的方法
CN115115370A (zh) * 2021-03-18 2022-09-27 腾讯科技(深圳)有限公司 风险群组的识别方法、装置、设备以及存储介质
CN114548898A (zh) * 2022-01-10 2022-05-27 陈佳娜 一种基于云平台的政务大数据管理方法及系统
CN114757805A (zh) * 2022-04-07 2022-07-15 云上(江西)大数据发展有限公司 基于区块链的便民政务服务系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740339A (zh) * 2016-01-25 2016-07-06 河北中科恒运软件科技股份有限公司 民政大数据融合管理系统
CN106228491A (zh) * 2016-07-28 2016-12-14 浙江喊喊网络科技有限公司 一种在线政务服务系统及其使用方法
CN109189826A (zh) * 2018-08-14 2019-01-11 北京新广视通科技有限公司 一种基于大数据的政务服务系统
CN113537775A (zh) * 2021-07-16 2021-10-22 北京政信1890智能科技有限公司 政务诉求处理方法和系统

Also Published As

Publication number Publication date
CN115564332A (zh) 2023-01-03

Similar Documents

Publication Publication Date Title
Karr et al. Data quality: A statistical perspective
CN111738549A (zh) 食品安全风险评估方法、装置、设备及存储介质
CN109993233B (zh) 基于机器学习来预测数据审核目标的方法及系统
CN107122669A (zh) 一种评估数据泄露风险的方法和装置
CN110957024A (zh) 一种医疗信用评估方法、装置及存储介质
CN102870110B (zh) 文档登记系统
CN113592680A (zh) 基于区域级教育大数据的服务平台
CN114429398B (zh) 数据驱动的新型农业经营主体可信等级生成方法及装置
CN111754241A (zh) 一种用户行为感知方法、装置、设备及介质
CN113722301A (zh) 基于教育信息的大数据处理方法、装置及系统、存储介质
CN104704521B (zh) 多因素简档和安全指纹分析
Jiang et al. A method to identify the incomplete framework of discernment in evidence theory
Si Construction and application of enterprise internal audit data analysis model based on decision tree algorithm
US11222309B2 (en) Data processing systems for generating and populating a data inventory
CN110728567A (zh) 一种电子发票报销管理系统及方法
CN115564332B (zh) 基于大数据的政务风险分析方法及系统
CN115345401A (zh) 一种发现企业金融风险的六维分析方法
CN112950359A (zh) 一种用户识别方法和装置
CN107944841A (zh) 薪酬计算系统及方法
US20080270216A1 (en) System and method for standards and governance evaluation framework
Ceolin et al. Combining user reputation and provenance analysis for trust assessment
CN111582722A (zh) 风险识别方法、装置、电子设备及可读存储介质
CN115271514B (zh) 通讯企业的监控方法、装置、电子设备及存储介质
Zhou et al. Evaluation of the Development of Fintech‐Served Real Economy Based on Fintech Improvement
CN118174971B (zh) 一种用于网络威胁的多源异构数据治理方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant