CN109711627A - 一种数据处理方法及装置 - Google Patents
一种数据处理方法及装置 Download PDFInfo
- Publication number
- CN109711627A CN109711627A CN201811627854.7A CN201811627854A CN109711627A CN 109711627 A CN109711627 A CN 109711627A CN 201811627854 A CN201811627854 A CN 201811627854A CN 109711627 A CN109711627 A CN 109711627A
- Authority
- CN
- China
- Prior art keywords
- event
- dispute
- data
- index
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本申请公开了一种数据处理方法及装置,涉及综合治理技术领域,本申请所述的数据处理方法包括:针对多类事件,获取该类事件中每个事件的纠纷概率;基于该类事件中每个事件的纠纷概率,计算该类事件的目标纠纷指标;基于每类事件的目标纠纷指标,计算综合纠纷指标。本申请提供的一种数据处理方法及装置,能够对不同渠道的纠纷数据进行综合处理,从而对社会矛盾纠纷情况进行预测和评估。
Description
技术领域
本申请涉及综合治理技术领域,尤其是涉及一种数据处理方法及装置。
背景技术
社会稳定关系到国计民生的各个方面,当前解决社会矛盾纠纷面临两大难题,一是化解社会矛盾纠纷,二是预见社会矛盾纠纷,即社会矛盾纠纷的处理与预测。为了实现社会矛盾纠纷的及早发现和及时化解,维护社会稳定,需要能够对不同渠道的纠纷数据进行综合处理,从而对社会矛盾纠纷进行提前预测的方法。
发明内容
有鉴于此,本申请的目的在于提供一种数据处理方法及装置,能够对不同渠道的纠纷数据进行综合处理,从而对社会矛盾纠纷情况进行预测和评估。
第一方面,本申请实施例提供了一种数据处理方法,包括:
针对多类事件,获取该类事件中每个事件的纠纷概率;
基于该类事件中每个事件的纠纷概率,计算该类事件的目标纠纷指标;
基于每类事件的目标纠纷指标,计算综合纠纷指标。
一种可能的实施方式中,所述基于该类事件中每个事件的纠纷概率,计算该类事件的目标纠纷指标,包括:
基于该类事件中每个事件的纠纷概率的平均值和该类事件中每个事件的纠纷概率的和,计算该类事件的偏移概率值;
基于获取的预设基准值和该类事件的偏移概率值,得到该类事件的目标纠纷指标。
一种可能的实施方式中,所述基于每类事件的目标纠纷指标,计算综合纠纷指标,包括:
对每类事件的目标纠纷指标进行加权求和,得到综合纠纷指标。
一种可能的实施方式中,所述事件的类型,包括以下至少一种:
个体与个体的纠纷事件、个体与组织的纠纷事件和个体与机关的纠纷事件。
一种可能的实施方式中,采用下述步骤获取多类事件中每个事件的纠纷概率,包括:
获取存储在分布式数据库中的多类事件中每个事件的纠纷概率。
一种可能的实施方式中,采用下述步骤建立所述分布式数据库:
基于历史调解数据、历史政务数据和互联网舆情数据中的至少一种纠纷数据,计算多类事件中每个事件的纠纷概率;
采用负载均衡的方法,构建存储有所述多类事件中每个事件的纠纷概率的分布式数据库。
一种可能的实施方式中,所述计算多类事件中每个事件的纠纷概率之前,包括:
将所述纠纷数据的数据格式转换为预制数据格式;
删除所述多种类型的纠纷概率数据中的无效数据;
对所述多种类型的纠纷概率数据中的敏感信息进行替换。
一种可能的实施方式中,利用分布式爬虫工具获取所述互联网舆情数据。
一种可能的实施方式中,所述方法,还包括:
每隔预设的时间间隔,计算得到所述综合纠纷指标;
在所述综合纠纷指标大于预设的概率阈值的情况下,发出预警信号。
第二方面,本申请实施例还提供一种数据处理装置,包括:
获取模块,用于针对多类事件,获取该类事件中每个事件的纠纷概率;
第一计算模块,用于基于该类事件中每个事件的纠纷概率,计算该类事件的目标纠纷指标;
第二计算模块,用于基于每类事件的目标纠纷指标,计算综合纠纷指标。
一种可能的实施方式中,所述第一计算模块,具体用于:
基于该类事件中每个事件的纠纷概率的平均值和该类事件中每个事件的纠纷概率的和,计算该类事件的偏移概率值;
基于获取的预设值和该类事件的偏移概率值,得到该类事件的目标纠纷指标。
一种可能的实施方式中,所述第二计算模块,具体用于:
对每类事件的目标纠纷指标进行加权求和,得到综合纠纷指标。
一种可能的实施方式中,所述事件的类型,包括以下至少一种:
个体与个体的纠纷事件、个体与组织的纠纷事件和个体与机关的纠纷事件。
一种可能的实施方式中,所述获取模块,用于:
获取存储在分布式数据库中的多类事件中每个事件的纠纷概率。
一种可能的实施方式中,所述装置,还包括:
数据库模块,用于采用下述步骤建立所述分布式数据库:
基于历史调解数据、历史政务数据和互联网舆情数据中的至少一种纠纷数据,计算多类事件中每个事件的纠纷概率;
采用负载均衡的方法,构建存储有所述多类事件中每个事件的纠纷概率的分布式数据库。
一种可能的实施方式中,所述数据库模块,还用于:
将所述纠纷数据的数据格式转换为预制数据格式;
删除所述多种类型的纠纷概率数据中的无效数据;
对所述多种类型的纠纷概率数据中的敏感信息进行替换。
一种可能的实施方式中,所述数据库模块,还用于:利用分布式爬虫工具获取所述互联网舆情数据。
一种可能的实施方式中,所述装置,还包括:
预警模块,用于每隔预设的时间间隔,计算得到所述综合纠纷指标;并在所述综合纠纷指标大于预设的概率阈值的情况下,发出预警信号。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
本申请实施例提供的一种数据处理方法及装置,基于获取的该类事件多类事件中每个事件的纠纷概率,计算每类事件的目标纠纷指标,并基于每类事件的目标纠纷指标,计算综合纠纷指标。通过对多类事件的纠纷概率进行计算得到综合纠纷指标,能够对不同渠道的纠纷数据进行综合处理,从而对社会矛盾纠纷情况进行预测和评估。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种数据处理方法的流程图;
图2示出了本申请实施例所提供的一种数据处理方法中计算综合纠纷指标的方法流程图;
图3示出了本申请实施例所提供的一种数据处理装置的结构示意图;
图4示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种数据处理方法进行详细介绍。
实施例一
本申请实施例提供的一种数据处理方法可以用于对各个领域的矛盾纠纷进行预估和预测,例如,对社会矛盾纠纷进行预估和预测。如图1所示,是本申请实施例一提供的一种数据处理方法,包括:
S101:针对多类事件,获取该类事件中每个事件的纠纷概率。
对社会矛盾纠纷进行评估和预测的技术支撑是大数据分析云平台,大数据分析云平台由基础服务层、数据分析层和数据产生的应用层组成,基础服务层,用于输入社会矛盾公共信息;数据分析层,包括分布式数据库,用于对社会矛盾公共信息的大数据进行预处理、分析和挖掘工作;数据产生的应用层,用于基于每类事件中每个事件的纠纷概率,计算综合纠纷指标,从而依据综合纠纷指标,对社会矛盾纠纷进行评估和预测,还用于对社会矛盾公共信息的分析结果的展示、提供可视化的操作界面等。
在一种可能的实施方式中,采用下述步骤获取多类事件中每个事件的纠纷概率,包括:
获取存储在分布式数据库中的多类事件中每个事件的纠纷概率。
并且,采用下述步骤建立所述分布式数据库:
基于历史调解数据、历史政务数据和互联网舆情数据中的至少一种纠纷数据,计算多类事件中每个事件的纠纷概率;
采用负载均衡的方法,构建存储有所述多类事件中每个事件的纠纷概率的分布式数据库。
其中,历史调解数据从矛盾纠纷处置系统获取。历史政务数据通过链接该地区电子政务平台,获取公开的基础数据。互联网舆情数据,利用分布式爬虫工具获取。采用基础的分布式爬虫工具,通过二次定制开发,使平台具备对互联网门户网站、网络社交论坛、微博舆论信息、微信公众号等相关信息资源进行接入的能力。爬虫工具使用者通过在工具中配置目标网站或网址、爬取语义关键词、数据筛选、数据存储位置及方式等参数,可以快速实现对目标网站的数据爬取工作,减少人工干预,节约成本。例如,通过爬虫数据获取物价指数,人们对物价的满意度等纠纷数据。
分布式数据库中,除了存储有多类事件中每个事件的纠纷概率,还存储有历史调解数据、历史政务数据和互联网舆情数据中的纠纷数据的原始数据。本申请实施例可以使用任一种常用的分布式数据库,可以使用常用的数据库构建方法构建分布式数据库。例如可以使用Hive工具构建数据仓库,可以通过mapreduce程序将纠纷数据和/或纠纷概率采集到构建好的数据仓库中。
具体的,从不同的渠道获取不同维度的多类事件的纠纷数据,可以通过软件,建立数据采集接口,定期自动采集纠纷数据。例如,预先建立一个数据库,叫做数据采集的前置库,把需要的内容字段设计好,政务信息根据前置库的需要,把内容推送过来,然后数据接入子系统再从前置库读取数据到数据仓库中去处理。
也可以基于服务接口对接方式的数据接入,服务接口支持基于SOAP和WSDL、REST等主流方式的Web接口设计,以web应用界面的形式使用,把政务数据根据需要读取过来。
也可以通过手动及批量上报方式的将不同渠道的数据库中的纠纷数据转存到分布式数据库中。
其中,多类事件的纠纷数据主要包括:社会稳定关键维度、政府其他维度、社会补充维度。
其中,社会稳定关键维度,包括:社会矛盾纠纷测评、综治治理测评、信访走访情况测评、治安案件类指标会聚测评和社会安全指数测评五个方面。
政府其他维度,包括:公安局、法院、人力资源与社会保障部门等等除了关键领域的其他能够侧面反映社会稳定的辅助因素,例如人力资源与社会保障部门能从社会的就业情况、失业情况以及社会保险情况等方面反映(具有一定的权重)社会稳定情况。
社会补充维度,包括:通过舆情分析、爬虫等工具对地区范围内的经济指标、生活质量指标、社会问题指标、主观指标,通过进行全面收集、统计分析,得出综合测评数据。
在采集到纠纷数据后,对上述纠纷数据进行预处理。具体的,在计算多类事件中每个事件的纠纷概率之前,采用下述步骤对上述纠纷数据进行预处理:
将所述纠纷数据的数据格式转换为预制数据格式;
删除所述多种类型的纠纷概率数据中的无效数据;
对所述多种类型的纠纷概率数据中的敏感信息进行替换。
具体的例如,出生年月字段,从不同渠道采集的出生年月字段,数据格式可能不一致,需要整理成预制数据格式。
还例如,涉及姓名等敏感信息的内容,需要将姓名进行替换,替换成“李XX”等。
还可以对纠纷数据进行清洗、转换、去重和编目等处理,包括对数据定义、数据结构、数据标识、数据编码、数据编目、负责人、来源、转换关系、目标、质量等级、依赖关系、安全权限等相关内容进行管理,最终形成符合统一存储要求的数据模型;同时,利用分布式数据库和分布式文件系统对结构化数据和非结构化数据进行高效存储,建立信息资源的高可用性、高性能和可扩展性机制,利用云计算的弹性扩展和动态伸缩机制,实现对大数据的灵活存储。
进行预处理之后,可以基于历史调解数据、历史政务数据和互联网舆情数据中的至少一种纠纷数据,计算多类事件中每个事件的纠纷概率。
具体例如,基于历史调解数据里的案件数量,可以计算得到预设时间段中调解案件的发生率。
本申请实施例提供的分布式数据库,可以对结构化数据、非结构化数据和半结构化数据进行存储,为了满足所有数据的存储、管理以及对外共享的要求,本申请实施例提供的分布式数据库包括:
a:非结构化数据存储
应采用基于Hadoop分布式文件系统(HDFS)架构的分布式文档数据库来保存大量的非结构化及半结构化数据。
根据其数据的特点,首先搭建一个中小规模的HDFS集群系统,提供10TB非结构化数据的存储及处理能力,通过数据接入子系统将电子政务云平台的各类非结构化数据接入到大数据平台中。后期可根据数据量需求进行灵活扩容,只需增加更多的数据节点或增加磁盘空间即可实现平台的横向扩充,平台使用的HDFS集群功能如表1。
表1非结构化数据存储的功能要求
分布式文档数据库的功能要求如表2所示。
表2分布式文档的功能要求
b:结构化数据存储
采用分布式数据库集群的架构来存储大量的结构化数据,充分满足平台的业务需求。分布式数据库集群具备高扩展、高并发、高容错和动态节点管理等特性,结构化数据存储的功能要求如表3所示。
表3结构化数据存储的功能要求
c:高速缓存架构体系
由于社会稳定管理与服务大数据平台是同时面向政府内部和社会公众的统一大数据平台,某些数据可能访问极其频繁,达到每秒上万次的读写需求。所以对热数据具有高速缓存的能力,高速缓存架构体系的功能要求如表4所示。
表4高速缓存架构体系的功能要求
本申请实施例的大数据分析云平台,依托于大庆市华为计算中心,利用数据接入服务,将矛盾纠纷化解系统产生的历史调解数据、政务应用中存在的历史政务数据以及互联网舆情数据进行统一的接入,经过对结构化和非结构化数据进行处理后,采用负载均衡的方法,构建存储有所述多类事件中每个事件的纠纷概率的分布式数据库。同时,构建高效的大数据分析系统,利用分布式数据处理、分析工具和展示工具,为上层应用服务提供大数据处理和分析结论支持,并且将分析数据所得到的结论进行可视化展示,以更加直观的形式看到有关人民调解和社会稳定的各种指标情况和变化趋势。此外,利用大数据门户,为政府各委办局、社会公众、社会应用开发商提供资源查询、信息公开和数据服务。从而创新社会治理模式,整合基础数据,搭建多维度数据库平台;基于大数据挖掘,提供智能化决策引擎,实现动态决策支持;建设社会治理与服务的全方位评价体系。
并且可以依托大数据分析云平台进行数据挖掘,主要是在现有数据上面进行基于各种算法的计算,从而起到预测的效果。可以使用任一种常用的数据挖掘算法,比较典型算法有用于聚类的K-均值、用于统计学习的支持向量机和用于分类的朴素贝叶斯,主要使用的工具有Hadoop的Mahout等。当分布式数据库中的大数据积累到一定程度时,数据挖掘就会有的放矢,在社会稳定的大数据分析云平台中,挖掘出有价值的内容。
S102:基于该类事件中每个事件的纠纷概率,计算该类事件的目标纠纷指标。
具体的,采用下述步骤基于该类事件中每个事件的纠纷概率,计算该类事件的目标纠纷指标,包括:
基于该类事件中每个事件的纠纷概率的平均值和该类事件中每个事件的纠纷概率的和,计算该类事件的偏移概率值;基于获取的预设基准值和该类事件的偏移概率值,得到该类事件的目标纠纷指标。
S103:基于每类事件的目标纠纷指标,计算综合纠纷指标。
具体的,对每类事件的目标纠纷指标进行加权求和,得到综合纠纷指标。
对社会矛盾纠纷进行评估和预测的技术是通过结合管理学、社会学、计算机科学等相关学科的知识,在阅读大量文献的基础之上,将理论与实证研究相结合,运用科学方法对社会矛盾纠纷动态管理进行研究与分析之后,产生的结果。
对社会矛盾纠纷进行评估和预测的技术包括三个大的维度,既是社会稳定关键维度、政府其他维度、社会补充维度。通过进行全面收集、统计分析,得出综合测评数据。对社会矛盾纠纷进行评估和预测的技术是通过对每类事件的目标纠纷指标进行加权求和,得到综合纠纷指标等算法构造出来的反映某一段时期内某一地区阶段性的整体社会稳定情况。
对社会矛盾纠纷进行评估和预测的技术是一个宏观的数值,通过综合纠纷指标可以大致描述一个地区的社会稳定等级情况。可以通过在地图上标注灰、绿、蓝、黄、红等区块标识,来实现一个宏观的视觉可视化。最终得到的综合纠纷指标,通过数据可视化应用展示到客户端或手机App端。通过使用数据可视化工具,察看具体的指标变化情况。可以更具体的对比、分析,找到引起综合纠纷指标变化的关键指标情况。
在一种可能的实施方式中,每隔预设的时间间隔,计算得到所述综合纠纷指标;在所述综合纠纷指标大于预设的概率阈值的情况下,发出预警信号。
在得到综合纠纷指标的基础上,社会稳定监测、预警工作得以实现。整个社会预警系统里最核心的部分是指标体系,它的作用是承担风险传感器,预警的有效与否是由预警指标编制的内容和质量决定的。一般而言,指标体系编排的难点不外乎有两个,一是指标的可测性和有效性,二是有关权重的分配。前者指标的可测性和有效性涉及指标的实质内容,后者有关权重的分配则涉及统计量测的方法。在现代社会里,为了减少工作的复杂程度,为了不断地增减和完善风险预警指标,指标的项目测量必须与国家保持一致。具体来说,在内容方面,要把对风险的关注角度从自然界转移到社会,要考虑到制度层面的贫富差距、腐败问题、城乡隔阂等问题,用笼统的风险概念将社会预警系统延伸到各个方面。在衡量方法上,要区别对待。毕竟不同的指标对于风险的诱致程度不同。权重的确定,一方面来说需要各个专家结合各种突发情况进行反复论证。另一方面,需要借鉴成熟的西方社会预警系统。预警指标可以通过一定的程序获得相关数据,从而对不同的警区可以做出具体的参考。
具体的,对综合纠纷指标进行计算时,涉及的事件的类型,包括以下至少一种:个体与个体的纠纷事件、个体与组织的纠纷事件和个体与机关的纠纷事件。
个体与个体的纠纷事件中,可以包括以下至少一种:婚姻家庭纠纷率、邻里纠纷率、交通事故纠纷率、一般性财产纠纷率、一般性人身损害纠纷率等。
个体与组织的纠纷事件中,可以包括以下至少一种:物业服务纠纷率、合同纠纷率、消费纠纷率、环境纠纷率、劳动争议纠纷率、医疗纠纷率、村务管理纠纷率等。
个体与机关的纠纷事件中,可以包括以下至少一种:征地拆迁纠纷率、山林土地纠纷率、行政争议纠纷率、涉法涉诉纠纷率、政策性纠纷率等。
在对社会稳定进行监测时,除了计算综合纠纷指标,还可以评估社会关注性,例如对纠纷影响力和纠纷紧急性进行评估,还可以评估纠纷的级别,例如对纠纷的疑难复杂性和受损受害状况进行评估。
另外,对社会矛盾纠纷的预测和评估还可以进一步的扩展到对社会安全、综合治理、信访、就业失业、社会保险、经济指标、生活质量、社会问题指标、主观幸福度指标等方面来,从而对社会稳定进行360度的评测和预估,建立社会稳定360度测评和预警系统。
本申请实施例提供的一种数据处理方法,基于获取的该类事件多类事件中每个事件的纠纷概率,计算每类事件的目标纠纷指标,并基于每类事件的目标纠纷指标,计算综合纠纷指标。通过对多类事件的纠纷概率进行计算得到综合纠纷指标,能够对不同渠道的纠纷数据进行综合处理,从而对社会矛盾纠纷情况进行预测和评估。
实施例二
如2示出了,本申请实施例提供的一种数据处理方法具体应用于社会矛盾纠纷概率评估时,计算综合纠纷指标的方法流程图,包括:
S201:针对每类事件,计算该类事件中每个事件的纠纷概率的平均值。
例如,在个体与个体的纠纷事件中,包括:婚姻家庭纠纷率X1、邻里纠纷率X2、交通事故纠纷率X3、一般性财产纠纷率X4、一般性人身损害纠纷率X5的情况下,分别计算每个事件的纠纷概率的平均值,例如根据婚姻家庭纠纷率X1、邻里纠纷率X2、交通事故纠纷率X3、一般性财产纠纷率X4、一般性人身损害纠纷率X5进行计算,得到平均值X~等。
S202:计算该类事件中每个事件的纠纷概率的和。
使用如下公式计算每个事件的纠纷概率的和:例如,在个体与个体的纠纷事件中,包括:婚姻家庭纠纷率X1、邻里纠纷率X2、交通事故纠纷率X3、一般性财产纠纷率X4、一般性人身损害纠纷率X5的情况下,每个事件的纠纷概率的和为
S203:基于该类事件中每个事件的纠纷概率的平均值和该类事件中每个事件的纠纷概率的和,计算该类事件的偏移概率值。
可以采用下述公式计算该类事件的偏移概率值C,其中,计算得到的偏移概率值-1≤C≤1:
S204:基于获取的预设基准值和偏移概率值,得到该类事件的目标纠纷指标。
例如,基准值为50。
该类事件的目标纠纷指标A为:A=50+C*50。
S205:对每类事件的目标纠纷指标进行加权求和,得到综合纠纷指标。
具体的,综合纠纷指标S为:
其中,ω为每类事件的权重。
本申请实施例二提供的一种综合纠纷指标的计算方法,基于获取的该类事件多类事件中每个事件的纠纷概率,计算每类事件的目标纠纷指标,并基于每类事件的目标纠纷指标,计算综合纠纷指标。通过对多类事件的纠纷概率进行计算得到综合纠纷指标,能够对不同渠道的纠纷数据进行综合处理,从而对社会矛盾纠纷情况进行预测和评估。
基于相同的技术构思,本申请实施例还提供一种数据处理装置、电子设备、以及计算机存储介质等,具体可参见以下实施例。
实施例三
如图3所示,本申请实施例还提供一种数据处理装置300,包括:
获取模块301,用于针对多类事件,获取该类事件中每个事件的纠纷概率;
第一计算模块302,用于基于该类事件中每个事件的纠纷概率,计算该类事件的目标纠纷指标;
第二计算模块303,用于基于每类事件的目标纠纷指标,计算综合纠纷指标。
一种可能的实施方式中,所述第一计算模块302,具体用于:
基于该类事件中每个事件的纠纷概率的平均值和该类事件中每个事件的纠纷概率的和,计算该类事件的偏移概率值;
基于获取的预设值和该类事件的偏移概率值,得到该类事件的目标纠纷指标。
一种可能的实施方式中,所述第二计算模块303,具体用于:
对每类事件的目标纠纷指标进行加权求和,得到综合纠纷指标。
一种可能的实施方式中,所述事件的类型,包括以下至少一种:
个体与个体的纠纷事件、个体与组织的纠纷事件和个体与机关的纠纷事件。
一种可能的实施方式中,所述获取模块301,用于:
获取存储在分布式数据库中的多类事件中每个事件的纠纷概率。
一种可能的实施方式中,所述装置,还包括:
数据库模块304,用于采用下述步骤建立所述分布式数据库:
基于历史调解数据、历史政务数据和互联网舆情数据中的至少一种纠纷数据,计算多类事件中每个事件的纠纷概率;
采用负载均衡的方法,构建存储有所述多类事件中每个事件的纠纷概率的分布式数据库。
一种可能的实施方式中,所述数据库模块304,还用于:
将所述纠纷数据的数据格式转换为预制数据格式;
删除所述多种类型的纠纷概率数据中的无效数据;
对所述多种类型的纠纷概率数据中的敏感信息进行替换。
一种可能的实施方式中,所述数据库模块304,还用于:利用分布式爬虫工具获取所述互联网舆情数据。
一种可能的实施方式中,所述装置,还包括:
预警模块305,用于每隔预设的时间间隔,计算得到所述综合纠纷指标;并在所述综合纠纷指标大于预设的概率阈值的情况下,发出预警信号。
本申请实施例提供的一种数据处理装置,基于获取的该类事件多类事件中每个事件的纠纷概率,计算每类事件的目标纠纷指标,并基于每类事件的目标纠纷指标,计算综合纠纷指标。通过对多类事件的纠纷概率进行计算得到综合纠纷指标,能够对不同渠道的纠纷数据进行综合处理,从而对社会矛盾纠纷情况进行预测和评估。
实施例五
图4示出了本申请实施例所提供的一种电子设备400,包括处理器401,存储器402,总线403,所述处理器401和存储器402通过总线403连接;处理器401用于执行存储器402中存储的可执行模块,例如计算机程序。
其中,存储器402可能包含高速随机存取存储器(Random Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
总线403可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩充工业标准总结结构(Extended Industry Standard Architecture,EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器402用于存储程序,所述处理器401在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器401中,或者由处理器401实现。
处理器401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器401可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器402,处理器401读取存储器402中的信息,结合其硬件完成上述方法的步骤。
本发明实施例提供的一种数据处理装置及电子设备,与上述实施例提供的一种数据处理方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
实施例六
本实施例公开了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述数据处理方法中的步骤。
本申请实施例所提供的进行一种数据处理方法的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
针对多类事件,获取该类事件中每个事件的纠纷概率;
基于该类事件中每个事件的纠纷概率,计算该类事件的目标纠纷指标;
基于每类事件的目标纠纷指标,计算综合纠纷指标。
2.根据权利要求1所述的方法,其特征在于,所述基于该类事件中每个事件的纠纷概率,计算该类事件的目标纠纷指标,包括:
基于该类事件中每个事件的纠纷概率的平均值和该类事件中每个事件的纠纷概率的和,计算该类事件的偏移概率值;
基于获取的预设基准值和该类事件的偏移概率值,得到该类事件的目标纠纷指标。
3.根据权利要求1所述的方法,其特征在于,所述基于每类事件的目标纠纷指标,计算综合纠纷指标,包括:
对每类事件的目标纠纷指标进行加权求和,得到综合纠纷指标。
4.根据权利要求1所述的方法,其特征在于,所述事件的类型,包括以下至少一种:
个体与个体的纠纷事件、个体与组织的纠纷事件和个体与机关的纠纷事件。
5.根据权利要求1所述的方法,其特征在于,采用下述步骤获取多类事件中每个事件的纠纷概率,包括:
获取存储在分布式数据库中的多类事件中每个事件的纠纷概率。
6.根据权利要求5所述的方法,其特征在于,采用下述步骤建立所述分布式数据库:
基于历史调解数据、历史政务数据和互联网舆情数据中的至少一种纠纷数据,计算多类事件中每个事件的纠纷概率;
采用负载均衡的方法,构建存储有所述多类事件中每个事件的纠纷概率的分布式数据库。
7.根据权利要求6所述的方法,其特征在于,所述计算多类事件中每个事件的纠纷概率之前,包括:
将所述纠纷数据的数据格式转换为预制数据格式;
删除所述多种类型的纠纷概率数据中的无效数据;
对所述多种类型的纠纷概率数据中的敏感信息进行替换。
8.根据权利要求6所述的方法,其特征在于,利用分布式爬虫工具获取所述互联网舆情数据。
9.根据权利要求1所述的方法,其特征在于,所述方法,还包括:
每隔预设的时间间隔,计算得到所述综合纠纷指标;
在所述综合纠纷指标大于预设的概率阈值的情况下,发出预警信号。
10.一种数据处理装置,其特征在于,包括:
获取模块,用于针对多类事件,获取该类事件中每个事件的纠纷概率;
第一计算模块,用于基于该类事件中每个事件的纠纷概率,计算该类事件的目标纠纷指标;
第二计算模块,用于基于每类事件的目标纠纷指标,计算综合纠纷指标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811627854.7A CN109711627A (zh) | 2018-12-28 | 2018-12-28 | 一种数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811627854.7A CN109711627A (zh) | 2018-12-28 | 2018-12-28 | 一种数据处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109711627A true CN109711627A (zh) | 2019-05-03 |
Family
ID=66259261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811627854.7A Pending CN109711627A (zh) | 2018-12-28 | 2018-12-28 | 一种数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109711627A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461645A (zh) * | 2020-03-17 | 2020-07-28 | 浙江省方大标准信息有限公司 | 一种政务系统数据分析方法 |
CN111949706A (zh) * | 2020-08-03 | 2020-11-17 | 北京吉威空间信息股份有限公司 | 面向土地大数据分布式挖掘分析的存储方法 |
CN113254542A (zh) * | 2021-04-21 | 2021-08-13 | 泰康保险集团股份有限公司 | 数据可视化处理方法及装置、电子设备 |
CN113822498A (zh) * | 2021-10-29 | 2021-12-21 | 南京视察者智能科技有限公司 | 一种基于大数据的社会矛盾指数预测方法 |
CN116469576A (zh) * | 2023-03-27 | 2023-07-21 | 中关村科学城城市大脑股份有限公司 | 纠纷事件识别方法、装置、电子设备和计算机可读介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102075356A (zh) * | 2010-12-31 | 2011-05-25 | 深圳市永达电子股份有限公司 | 一种网络风险评估方法与系统 |
CN102945270A (zh) * | 2012-10-30 | 2013-02-27 | 北京腾逸科技发展有限公司 | 并行化分布式网络舆情数据管理方法及系统 |
CN103198231A (zh) * | 2013-04-23 | 2013-07-10 | 湖南工学院 | 通过hra判定dcs人机界面的可靠性的方法、系统 |
CN107704621A (zh) * | 2017-10-27 | 2018-02-16 | 西南财经大学 | 一种互联网舆情地图可视化展示方法 |
CN108038631A (zh) * | 2017-12-29 | 2018-05-15 | 中国科学技术大学 | 一种锂离子电池危险性评估方法 |
US20180181962A1 (en) * | 2016-12-23 | 2018-06-28 | Early Warning Services, Llc | System and method using multiple profiles and scores for assessing financial transaction risk |
-
2018
- 2018-12-28 CN CN201811627854.7A patent/CN109711627A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102075356A (zh) * | 2010-12-31 | 2011-05-25 | 深圳市永达电子股份有限公司 | 一种网络风险评估方法与系统 |
CN102945270A (zh) * | 2012-10-30 | 2013-02-27 | 北京腾逸科技发展有限公司 | 并行化分布式网络舆情数据管理方法及系统 |
CN103198231A (zh) * | 2013-04-23 | 2013-07-10 | 湖南工学院 | 通过hra判定dcs人机界面的可靠性的方法、系统 |
US20180181962A1 (en) * | 2016-12-23 | 2018-06-28 | Early Warning Services, Llc | System and method using multiple profiles and scores for assessing financial transaction risk |
CN107704621A (zh) * | 2017-10-27 | 2018-02-16 | 西南财经大学 | 一种互联网舆情地图可视化展示方法 |
CN108038631A (zh) * | 2017-12-29 | 2018-05-15 | 中国科学技术大学 | 一种锂离子电池危险性评估方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461645A (zh) * | 2020-03-17 | 2020-07-28 | 浙江省方大标准信息有限公司 | 一种政务系统数据分析方法 |
CN111949706A (zh) * | 2020-08-03 | 2020-11-17 | 北京吉威空间信息股份有限公司 | 面向土地大数据分布式挖掘分析的存储方法 |
CN111949706B (zh) * | 2020-08-03 | 2023-11-14 | 北京吉威空间信息股份有限公司 | 面向土地大数据分布式挖掘分析的存储方法 |
CN113254542A (zh) * | 2021-04-21 | 2021-08-13 | 泰康保险集团股份有限公司 | 数据可视化处理方法及装置、电子设备 |
CN113254542B (zh) * | 2021-04-21 | 2023-10-27 | 泰康保险集团股份有限公司 | 数据可视化处理方法及装置、电子设备 |
CN113822498A (zh) * | 2021-10-29 | 2021-12-21 | 南京视察者智能科技有限公司 | 一种基于大数据的社会矛盾指数预测方法 |
CN113822498B (zh) * | 2021-10-29 | 2023-07-18 | 南京视察者智能科技有限公司 | 一种基于大数据的社会矛盾指数预测方法 |
CN116469576A (zh) * | 2023-03-27 | 2023-07-21 | 中关村科学城城市大脑股份有限公司 | 纠纷事件识别方法、装置、电子设备和计算机可读介质 |
CN116469576B (zh) * | 2023-03-27 | 2023-10-27 | 中关村科学城城市大脑股份有限公司 | 纠纷事件识别方法、装置、电子设备和计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109711627A (zh) | 一种数据处理方法及装置 | |
Wang et al. | Privacy-aware traffic flow prediction based on multi-party sensor data with zero trust in smart city | |
Sarker | Smart City Data Science: Towards data-driven smart cities with open research issues | |
CN110210227B (zh) | 风险检测方法、装置、设备和存储介质 | |
Kocaguneli et al. | Software effort models should be assessed via leave-one-out validation | |
Baldominos et al. | A scalable machine learning online service for big data real-time analysis | |
CN110111198A (zh) | 用户金融风险预估方法、装置、电子设备及可读介质 | |
CN107003976A (zh) | 基于可准许活动规则确定可准许活动 | |
Fan et al. | Network-constrained spatio-temporal clustering analysis of traffic collisions in Jianghan District of Wuhan, China | |
Deng et al. | An assessment method for traffic state vulnerability based on a cloud model for urban road network traffic systems | |
Akbari et al. | A maritime search and rescue location analysis considering multiple criteria, with simulated demand | |
Wang et al. | A maximum entropy method using fractional moments and deep learning for geotechnical reliability analysis | |
Song et al. | Link sign prediction and ranking in signed directed social networks | |
CN110730164B (zh) | 安全预警方法及相关设备、计算机可读存储介质 | |
Celik et al. | Discovering socially similar users in social media datasets based on their socially important locations | |
CN104751387A (zh) | 用于环境化报告和个性化推荐的概率评估的系统和方法 | |
Demirbaga | HTwitt: a hadoop-based platform for analysis and visualization of streaming Twitter data | |
CN112306835A (zh) | 用户数据监控分析方法、装置、设备及介质 | |
CN114399321A (zh) | 一种业务系统稳定性分析方法、装置和设备 | |
Wang et al. | Spatio-temporal-categorical graph neural networks for fine-grained multi-incident co-prediction | |
Huang et al. | Compact and fast machine learning accelerator for IoT devices | |
Santos et al. | Road network vulnerability and city-level characteristics: A nationwide comparative analysis of Japanese cities | |
Jogarah et al. | Hybrid machine learning algorithms for fault detection in android smartphones | |
Zhou et al. | HID: Hierarchical multiscale representation learning for information diffusion | |
Yuan et al. | Subjective logic-based anomaly detection framework in wireless sensor networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190503 |