CN106202048A - 一种舆情监测系统 - Google Patents

一种舆情监测系统 Download PDF

Info

Publication number
CN106202048A
CN106202048A CN201610562023.0A CN201610562023A CN106202048A CN 106202048 A CN106202048 A CN 106202048A CN 201610562023 A CN201610562023 A CN 201610562023A CN 106202048 A CN106202048 A CN 106202048A
Authority
CN
China
Prior art keywords
module
public sentiment
network information
info class
credit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610562023.0A
Other languages
English (en)
Inventor
党连坤
石晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HEFEI COMPASS ELECTRONIC TECHNOLOGY Co Ltd
Original Assignee
HEFEI COMPASS ELECTRONIC TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HEFEI COMPASS ELECTRONIC TECHNOLOGY Co Ltd filed Critical HEFEI COMPASS ELECTRONIC TECHNOLOGY Co Ltd
Priority to CN201610562023.0A priority Critical patent/CN106202048A/zh
Publication of CN106202048A publication Critical patent/CN106202048A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种舆情监测系统,包括:网络信息收集模块、网站信用评估模块、网络信息整理模块、信用计算排序模块、舆情倾向分析模块和评估结果输出模块。本发明提供的舆情监测系统,基于网络获取舆情信息,根据关键词对获取的信息进行归类处理,并根据情感倾向对舆情进行整体判断,处理效率高,评估全面,有利于舆情监测的实时性、可靠性。

Description

一种舆情监测系统
技术领域
本发明涉及信息处理技术领域,尤其涉及一种舆情监测系统。
背景技术
网络舆情监控是指通过对网络各类信息汇集、分类、整合、筛选等技术处理,再形成对网络热点、动态、网民意见等实时统计报表的一个过程。
随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。网友言论活跃己达到前所未有的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过这种网络来表达观点、传播思想,进而产生巨大的舆论压力,达到任何部门、机构都无法忽视的地步。可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器。
网络舆情是通过互联网传播的公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点,主要通过BBS论坛、博客、新闻跟贴、转贴等实现并加以强化。当今,信息传播与意见交互空前迅捷,网络舆论的表达诉求也日益多元。如果引导不善,负面的网络舆情将对社会公共安全形成较大威胁。对相关政府部门来说,如何加强对网络舆论的及时监测、有效引导,以殁对网络舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。
发明内容
基于背景技术存在的技术问题,本发明提出了一种舆情监测系统。
本发明提出的一种舆情监测系统,包括:
网络信息收集模块,用于根据预设的主题收集网络信息;
网站信用评估模块,其内部预设有网站信用测评模型,且用于根据网站信用测评模型对各个网站进行评估并赋予信用值;
网络信息整理模块,与网络信息收集模块连接,其获取网络信息收集模块收集的网络信息,并对网络信息进行关键词提取,然后根据关键词对网络信息进行聚类获得不少于一个信息类;
信用计算排序模块,其分别连接网络信息整理模块、网络信息收集模块和网站信用评估模块,其对各信息类中包含的网络信息来源网站进行统计,计算各信息类包含的网络信息来源网站的信用值之和作为类信权值,并根据类信权值对各信息类进行排序;
舆情倾向分析模块,其分别与网络信息整理模块和信用计算排序模块连接,其根据关键词为各信息类赋予一个情感倾向值,然后根据预设的情感评估模型结合情感倾向值和类信权值计算各信息类的情感值,并计算信息类情感值之和作为主题情感值;舆情倾向分析模块将主题情感值与预设的倾向阈值比较,根据比较结果评估舆情倾向;
评估结果输出模块,其分别连接信用计算排序模块和舆情分析模块,其将信用计算排序模块的排序结果制成评估表,评估表中各信息类根据关键词进行区别;评估结果输出模块输出评估表和舆情倾向。
优选地,网站信用测评模型为:T=(t1+t2L+tn)/n,其中,t1、t2……tn分别为该网站中随机挑选的n条真实度已确认的信息对应的真实程度值。
优选地,n≥3。
优选地,n=10。
优选地,舆情倾向分析模块判断各信息类中各关键词词性,并根据各关键词词性计算该信息类情感倾向值。
优选地,舆情倾向分析模块根据信息类对应的关键词中褒义词与贬义词的比值计算该信息类情感倾向值。
优选地,当信息类对应的关键词中褒义词个数与贬义词个数的比值大于1,则该信息类的情感倾向值为正数;当信息类对应的关键词中褒义词个数与贬义词个数的比值小于1,则该信息类的情感倾向值为负数。
优选地,倾向阈值为0。
优选地,情感评估模型为:E=AD×T,其中,AD为情感倾向值,T为类信权值。
本发明提出的一种舆情监测系统中,网络信息整理模块获取网络信息收集模块收集的网络信息,并对网络信息进行关键词提取,然后将关键词相同的网络信息进行聚类获得信息类。从而将网络信息的分析转换为信息类的分析工作,简化了网络信息监测的工作量,避免了冗余工作,有利于提高舆情监测的高效与实时性。
本发明中,通过网站信用评估模块对网络信息来源的网站进行实时评估,有利于掌握网络信息来源的可靠性,从而提高网络信息真实性判断,为信用计算排序模块计算各信息类的类信权值奠定基础。舆情倾向分析模块在计算情感倾向时参考类信权值,提高了情感倾向计算结果的可信度,从而提高了整个舆情监测的可信度。
本发明提供的舆情监测系统,基于网络获取舆情信息,根据关键词对获取的信息进行归类处理,并根据情感倾向对舆情进行整体判断,处理效率高,评估全面,有利于舆情监测的实时性、可靠性。
附图说明
图1为本发明提出的一种舆情监测系统结构示意图。
具体实施方式
参照图1,本发明提出的一种舆情监测系统,包括:网络信息收集模块、网站信用评估模块、网络信息整理模块、信用计算排序模块、舆情倾向分析模块和评估结果输出模块。
网络信息收集模块用于根据预设的主题收集网络信息。具体地,主题由工作人员手动输入,或者,网络信息收集模块根据工作人员输入的信息进行简化提取主题。
网站信用评估模块,其内部预设有网站信用测评模型,且用于根据网站信用测评模型对各个网站进行评估并赋予信用值。本实施方式中,信用值可根据该网站上发布的已经进行真实程度确认的信息进行评估。例如,可从该网站随机选取10条已经确认了真实程度值的信息评估网站信用值,该网站信用值为该10条信息真实程度值得均值。
结合以上实施例,本实施方式中,网站信用测评模型可设置为:T=(t1+t2L+tn)/n,其中,t1、t2……tn分别为该网站中随机挑选的n条真实度已确认的信息对应的真实程度值。本实施方式中,选取n=10,具体实施时,n取值越大,网站的信用值越具有代表性。故而,为了避免信用值可信度过低,本实施方式中,限定n≥3。
网络信息整理模块与网络信息收集模块连接。网络信息整理模块获取网络信息收集模块收集的网络信息,并对网络信息进行关键词提取,然后将关键词相同的网络信息进行聚类,以获得不少于一个信息类。本实施方式中,信息类以关键词标注以便区分。
信用计算排序模块分别连接网络信息整理模块、网络信息收集模块和网站信用评估模块。信用计算排序模块对各信息类中包含的网络信息来源网站进行统计,计算各信息类包含的网络信息来源网站的信用值之和作为该信息类的类信权值,并根据类信权值对各信息类进行排序。
舆情倾向分析模块分别与网络信息整理模块和信用计算排序模块连接。舆情倾向分析模块判断各信息类中各关键词词性,并根据各关键词词性计算该信息类情感倾向值。具体地,舆情倾向分析模块根据信息类对应的关键词中褒义词与贬义词的比值计算该信息类情感倾向值。当信息类对应的关键词中褒义词个数与贬义词个数的比值大于1,则该信息类的情感倾向值为正数;当信息类对应的关键词中褒义词个数与贬义词个数的比值小于1,则该信息类的情感倾向值为负数。
具体实施时,可令情感倾向值AD根据以下原则计算:
当褒义词个数大于贬义词个数,
当贬义词个数大于褒义词个数,
当贬义词个数等于褒义词个数,AD=0。
本实施方式中,舆情倾向分析模块根据关键词为各信息类赋予一个情感倾向值后,根据预设的情感评估模型结合情感倾向值和类信权值计算各信息类的情感值,并计算信息类情感值之和作为主题情感值。
情感评估模型为:E=AD×T,其中,AD为情感倾向值,T为类信权值。
舆情倾向分析模块将主题情感值与预设的倾向阈值比较,根据比较结果评估舆情倾向。本实施方式中,倾向阈值为0。当主题情感值大于倾向阈值,则判定舆情倾向褒义;当主题情感值小于倾向阈值,则判定舆情倾向贬义。
评估结果输出模块分别连接信用计算排序模块和舆情分析模块,其将信用计算排序模块的排序结果制成评估表,评估表中各信息类根据关键词进行区别;评估结果输出模块输出评估表和舆情倾向。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种舆情监测系统,其特征在于,包括:
网络信息收集模块,用于根据预设的主题收集网络信息;
网站信用评估模块,其内部预设有网站信用测评模型,且用于根据网站信用测评模型对各个网站进行评估并赋予信用值;
网络信息整理模块,与网络信息收集模块连接,其获取网络信息收集模块收集的网络信息,并对网络信息进行关键词提取,然后根据关键词对网络信息进行聚类获得不少于一个信息类;
信用计算排序模块,其分别连接网络信息整理模块、网络信息收集模块和网站信用评估模块,其对各信息类中包含的网络信息来源网站进行统计,计算各信息类包含的网络信息来源网站的信用值之和作为类信权值,并根据类信权值对各信息类进行排序;
舆情倾向分析模块,其分别与网络信息整理模块和信用计算排序模块连接,其根据关键词为各信息类赋予一个情感倾向值,然后根据预设的情感评估模型结合情感倾向值和类信权值计算各信息类的情感值,并计算信息类情感值之和作为主题情感值;舆情倾向分析模块将主题情感值与预设的倾向阈值比较,根据比较结果评估舆情倾向;
评估结果输出模块,其分别连接信用计算排序模块和舆情分析模块,其将信用计算排序模块的排序结果制成评估表,评估表中各信息类根据关键词进行区别;评估结果输出模块输出评估表和舆情倾向。
2.如权利要求1所述的种舆情监测系统,其特征在于,网站信用测评模型为:T=(t1+t2L+tn)/n,其中,t1、t2……tn分别为该网站中随机挑选的n条真实度已确认的信息对应的真实程度值。
3.如权利要求2所述的种舆情监测系统,其特征在于,n≥3。
4.如权利要求3所述的种舆情监测系统,其特征在于,n=10。
5.如权利要求1所述的种舆情监测系统,其特征在于,舆情倾向分析模块判断各信息类中各关键词词性,并根据各关键词词性计算该信息类情感倾向值。
6.如权利要求5所述的种舆情监测系统,其特征在于,舆情倾向分析模块根据信息类对应的关键词中褒义词与贬义词的比值计算该信息类情感倾向值。
7.如权利要求6所述的种舆情监测系统,其特征在于,当信息类对应的关键词中褒义词个数与贬义词个数的比值大于1,则该信息类的情感倾向值为正数;当信息类对应的关键词中褒义词个数与贬义词个数的比值小于1,则该信息类的情感倾向值为负数。
8.如权利要求5至7任一项所述的种舆情监测系统,其特征在于,倾向阈值为0。
9.如权利要求1至5任一项所述的种舆情监测系统,其特征在于,情感评估模型为:E=AD×T,其中,AD为情感倾向值,T为类信权值。
CN201610562023.0A 2016-07-15 2016-07-15 一种舆情监测系统 Pending CN106202048A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610562023.0A CN106202048A (zh) 2016-07-15 2016-07-15 一种舆情监测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610562023.0A CN106202048A (zh) 2016-07-15 2016-07-15 一种舆情监测系统

Publications (1)

Publication Number Publication Date
CN106202048A true CN106202048A (zh) 2016-12-07

Family

ID=57475627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610562023.0A Pending CN106202048A (zh) 2016-07-15 2016-07-15 一种舆情监测系统

Country Status (1)

Country Link
CN (1) CN106202048A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107562722A (zh) * 2017-08-14 2018-01-09 上海文军信息技术有限公司 基于大数据的互联网舆情监测分析系统
CN109508373A (zh) * 2018-11-13 2019-03-22 深圳前海微众银行股份有限公司 企业舆情指数的计算方法、设备及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408883A (zh) * 2008-11-24 2009-04-15 电子科技大学 一种网络舆情观点收集方法
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
CN104077377A (zh) * 2014-06-25 2014-10-01 红麦聚信(北京)软件技术有限公司 基于网络文章属性的网络舆情热点发现方法和装置
CN104598450A (zh) * 2013-10-30 2015-05-06 北大方正集团有限公司 一种网络舆情事件的热度分析方法及系统
CN105138510A (zh) * 2015-08-10 2015-12-09 昆明理工大学 一种基于微博的新词情感倾向判定方法
CN105389389A (zh) * 2015-12-10 2016-03-09 安徽博约信息科技有限责任公司 一种网络舆情传播态势媒体联动分析方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408883A (zh) * 2008-11-24 2009-04-15 电子科技大学 一种网络舆情观点收集方法
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
CN104598450A (zh) * 2013-10-30 2015-05-06 北大方正集团有限公司 一种网络舆情事件的热度分析方法及系统
CN104077377A (zh) * 2014-06-25 2014-10-01 红麦聚信(北京)软件技术有限公司 基于网络文章属性的网络舆情热点发现方法和装置
CN105138510A (zh) * 2015-08-10 2015-12-09 昆明理工大学 一种基于微博的新词情感倾向判定方法
CN105389389A (zh) * 2015-12-10 2016-03-09 安徽博约信息科技有限责任公司 一种网络舆情传播态势媒体联动分析方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107562722A (zh) * 2017-08-14 2018-01-09 上海文军信息技术有限公司 基于大数据的互联网舆情监测分析系统
CN109508373A (zh) * 2018-11-13 2019-03-22 深圳前海微众银行股份有限公司 企业舆情指数的计算方法、设备及计算机可读存储介质
CN109508373B (zh) * 2018-11-13 2021-08-06 深圳前海微众银行股份有限公司 企业舆情指数的计算方法、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN101408883B (zh) 一种网络舆情观点收集方法
CN107562722A (zh) 基于大数据的互联网舆情监测分析系统
CN104899267B (zh) 一种社交网站账号相似度的综合数据挖掘方法
CN103324745B (zh) 基于贝叶斯模型的文本垃圾识别方法和系统
CN106980692A (zh) 一种基于微博特定事件的影响力计算方法
CN103336766B (zh) 短文本垃圾识别以及建模方法和装置
CN103024746B (zh) 一种电信运营商垃圾短信处理系统及处理方法
CN108363753A (zh) 评论文本情感分类模型训练与情感分类方法、装置及设备
WO2020108430A1 (zh) 一种微博情感分析方法及系统
CN103077190A (zh) 基于排序学习技术的热门事件排名方法
CN105045857A (zh) 一种社交网络谣言识别方法及系统
CN108228853A (zh) 一种微博谣言识别方法及系统
CN106021545A (zh) 用于车辆远程诊断与备件检索的方法
CN103345524A (zh) 微博热点话题检测方法及系统
CN103218436A (zh) 一种融合用户类别标签的相似问题检索方法及装置
CN106600458B (zh) 基于改进功率介数的电网风险综合评估方法
CN109240258A (zh) 基于词向量的汽车故障智能辅助诊断方法和系统
CN107305545A (zh) 一种基于文本倾向性分析的网络意见领袖的识别方法
CN107885849A (zh) 一种基于文本分类的情绪指数分析系统
CN102375842A (zh) 面向领域整体的关键词集的评价和提取方法
CN103729388A (zh) 用于网络用户发表状态的实时热点检测方法
Shi et al. Rumor detection of COVID-19 pandemic on online social networks
CN106681989A (zh) 一种预测微博转发概率的方法
CN104077412A (zh) 一种基于多Markov链的微博用户兴趣预测方法
CN104598595A (zh) 欺诈网页检测方法及相应装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161207

RJ01 Rejection of invention patent application after publication