CN106202048A

CN106202048A - 一种舆情监测系统

Info

Publication number: CN106202048A
Application number: CN201610562023.0A
Authority: CN
Inventors: 党连坤; 石晔
Original assignee: HEFEI COMPASS ELECTRONIC TECHNOLOGY Co Ltd
Current assignee: HEFEI COMPASS ELECTRONIC TECHNOLOGY Co Ltd
Priority date: 2016-07-15
Filing date: 2016-07-15
Publication date: 2016-12-07

Abstract

本发明公开了一种舆情监测系统,包括：网络信息收集模块、网站信用评估模块、网络信息整理模块、信用计算排序模块、舆情倾向分析模块和评估结果输出模块。本发明提供的舆情监测系统，基于网络获取舆情信息，根据关键词对获取的信息进行归类处理，并根据情感倾向对舆情进行整体判断，处理效率高，评估全面，有利于舆情监测的实时性、可靠性。

Description

一种舆情监测系统

技术领域

本发明涉及信息处理技术领域，尤其涉及一种舆情监测系统。

背景技术

网络舆情监控是指通过对网络各类信息汇集、分类、整合、筛选等技术处理，再形成对网络热点、动态、网民意见等实时统计报表的一个过程。

随着互联网的快速发展，网络媒体作为一种新的信息传播形式，已深入人们的日常生活。网友言论活跃己达到前所未有的程度，不论是国内还是国际重大事件，都能马上形成网上舆论，通过这种网络来表达观点、传播思想，进而产生巨大的舆论压力，达到任何部门、机构都无法忽视的地步。可以说，互联网已成为思想文化信息的集散地和社会舆论的放大器。

网络舆情是通过互联网传播的公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点，主要通过BBS论坛、博客、新闻跟贴、转贴等实现并加以强化。当今，信息传播与意见交互空前迅捷，网络舆论的表达诉求也日益多元。如果引导不善，负面的网络舆情将对社会公共安全形成较大威胁。对相关政府部门来说，如何加强对网络舆论的及时监测、有效引导，以殁对网络舆论危机的积极化解，对维护社会稳定、促进国家发展具有重要的现实意义，也是创建和谐社会的应有内涵。

发明内容

基于背景技术存在的技术问题，本发明提出了一种舆情监测系统。

本发明提出的一种舆情监测系统,包括：

网络信息收集模块，用于根据预设的主题收集网络信息；

网站信用评估模块，其内部预设有网站信用测评模型，且用于根据网站信用测评模型对各个网站进行评估并赋予信用值；

网络信息整理模块，与网络信息收集模块连接，其获取网络信息收集模块收集的网络信息，并对网络信息进行关键词提取，然后根据关键词对网络信息进行聚类获得不少于一个信息类；

信用计算排序模块，其分别连接网络信息整理模块、网络信息收集模块和网站信用评估模块，其对各信息类中包含的网络信息来源网站进行统计，计算各信息类包含的网络信息来源网站的信用值之和作为类信权值，并根据类信权值对各信息类进行排序；

舆情倾向分析模块，其分别与网络信息整理模块和信用计算排序模块连接，其根据关键词为各信息类赋予一个情感倾向值，然后根据预设的情感评估模型结合情感倾向值和类信权值计算各信息类的情感值，并计算信息类情感值之和作为主题情感值；舆情倾向分析模块将主题情感值与预设的倾向阈值比较，根据比较结果评估舆情倾向；

评估结果输出模块，其分别连接信用计算排序模块和舆情分析模块，其将信用计算排序模块的排序结果制成评估表，评估表中各信息类根据关键词进行区别；评估结果输出模块输出评估表和舆情倾向。

优选地，网站信用测评模型为：T＝(t1+t2L+tn)/n，其中，t1、t2……tn分别为该网站中随机挑选的n条真实度已确认的信息对应的真实程度值。

优选地，n≥3。

优选地，n＝10。

优选地，舆情倾向分析模块判断各信息类中各关键词词性，并根据各关键词词性计算该信息类情感倾向值。

优选地，舆情倾向分析模块根据信息类对应的关键词中褒义词与贬义词的比值计算该信息类情感倾向值。

优选地，当信息类对应的关键词中褒义词个数与贬义词个数的比值大于1，则该信息类的情感倾向值为正数；当信息类对应的关键词中褒义词个数与贬义词个数的比值小于1，则该信息类的情感倾向值为负数。

优选地，倾向阈值为0。

优选地，情感评估模型为：E＝AD×T，其中，AD为情感倾向值，T为类信权值。

本发明提出的一种舆情监测系统中，网络信息整理模块获取网络信息收集模块收集的网络信息，并对网络信息进行关键词提取，然后将关键词相同的网络信息进行聚类获得信息类。从而将网络信息的分析转换为信息类的分析工作，简化了网络信息监测的工作量，避免了冗余工作，有利于提高舆情监测的高效与实时性。

本发明中，通过网站信用评估模块对网络信息来源的网站进行实时评估，有利于掌握网络信息来源的可靠性，从而提高网络信息真实性判断，为信用计算排序模块计算各信息类的类信权值奠定基础。舆情倾向分析模块在计算情感倾向时参考类信权值，提高了情感倾向计算结果的可信度，从而提高了整个舆情监测的可信度。

本发明提供的舆情监测系统，基于网络获取舆情信息，根据关键词对获取的信息进行归类处理，并根据情感倾向对舆情进行整体判断，处理效率高，评估全面，有利于舆情监测的实时性、可靠性。

附图说明

图1为本发明提出的一种舆情监测系统结构示意图。

具体实施方式

参照图1，本发明提出的一种舆情监测系统,包括：网络信息收集模块、网站信用评估模块、网络信息整理模块、信用计算排序模块、舆情倾向分析模块和评估结果输出模块。

网络信息收集模块用于根据预设的主题收集网络信息。具体地，主题由工作人员手动输入，或者，网络信息收集模块根据工作人员输入的信息进行简化提取主题。

网站信用评估模块，其内部预设有网站信用测评模型，且用于根据网站信用测评模型对各个网站进行评估并赋予信用值。本实施方式中，信用值可根据该网站上发布的已经进行真实程度确认的信息进行评估。例如，可从该网站随机选取10条已经确认了真实程度值的信息评估网站信用值，该网站信用值为该10条信息真实程度值得均值。

结合以上实施例，本实施方式中，网站信用测评模型可设置为：T＝(t1+t2L+tn)/n，其中，t1、t2……tn分别为该网站中随机挑选的n条真实度已确认的信息对应的真实程度值。本实施方式中，选取n＝10，具体实施时，n取值越大，网站的信用值越具有代表性。故而，为了避免信用值可信度过低，本实施方式中，限定n≥3。

网络信息整理模块与网络信息收集模块连接。网络信息整理模块获取网络信息收集模块收集的网络信息，并对网络信息进行关键词提取，然后将关键词相同的网络信息进行聚类，以获得不少于一个信息类。本实施方式中，信息类以关键词标注以便区分。

信用计算排序模块分别连接网络信息整理模块、网络信息收集模块和网站信用评估模块。信用计算排序模块对各信息类中包含的网络信息来源网站进行统计，计算各信息类包含的网络信息来源网站的信用值之和作为该信息类的类信权值，并根据类信权值对各信息类进行排序。

舆情倾向分析模块分别与网络信息整理模块和信用计算排序模块连接。舆情倾向分析模块判断各信息类中各关键词词性，并根据各关键词词性计算该信息类情感倾向值。具体地，舆情倾向分析模块根据信息类对应的关键词中褒义词与贬义词的比值计算该信息类情感倾向值。当信息类对应的关键词中褒义词个数与贬义词个数的比值大于1，则该信息类的情感倾向值为正数；当信息类对应的关键词中褒义词个数与贬义词个数的比值小于1，则该信息类的情感倾向值为负数。

具体实施时，可令情感倾向值AD根据以下原则计算：

当褒义词个数大于贬义词个数，

当贬义词个数大于褒义词个数，

当贬义词个数等于褒义词个数，AD＝0。

本实施方式中，舆情倾向分析模块根据关键词为各信息类赋予一个情感倾向值后，根据预设的情感评估模型结合情感倾向值和类信权值计算各信息类的情感值，并计算信息类情感值之和作为主题情感值。

情感评估模型为：E＝AD×T，其中，AD为情感倾向值，T为类信权值。

舆情倾向分析模块将主题情感值与预设的倾向阈值比较，根据比较结果评估舆情倾向。本实施方式中，倾向阈值为0。当主题情感值大于倾向阈值，则判定舆情倾向褒义；当主题情感值小于倾向阈值，则判定舆情倾向贬义。

评估结果输出模块分别连接信用计算排序模块和舆情分析模块，其将信用计算排序模块的排序结果制成评估表，评估表中各信息类根据关键词进行区别；评估结果输出模块输出评估表和舆情倾向。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种舆情监测系统,其特征在于，包括：

网络信息收集模块，用于根据预设的主题收集网络信息；

2.如权利要求1所述的种舆情监测系统,其特征在于，网站信用测评模型为：T＝(t1+t2L+tn)/n，其中，t1、t2……tn分别为该网站中随机挑选的n条真实度已确认的信息对应的真实程度值。

3.如权利要求2所述的种舆情监测系统,其特征在于，n≥3。

4.如权利要求3所述的种舆情监测系统,其特征在于，n＝10。

5.如权利要求1所述的种舆情监测系统,其特征在于，舆情倾向分析模块判断各信息类中各关键词词性，并根据各关键词词性计算该信息类情感倾向值。

6.如权利要求5所述的种舆情监测系统,其特征在于，舆情倾向分析模块根据信息类对应的关键词中褒义词与贬义词的比值计算该信息类情感倾向值。

7.如权利要求6所述的种舆情监测系统,其特征在于，当信息类对应的关键词中褒义词个数与贬义词个数的比值大于1，则该信息类的情感倾向值为正数；当信息类对应的关键词中褒义词个数与贬义词个数的比值小于1，则该信息类的情感倾向值为负数。

8.如权利要求5至7任一项所述的种舆情监测系统,其特征在于，倾向阈值为0。

9.如权利要求1至5任一项所述的种舆情监测系统,其特征在于，情感评估模型为：E＝AD×T，其中，AD为情感倾向值，T为类信权值。