CN106126558B - 一种舆情监控方法及装置 - Google Patents

一种舆情监控方法及装置 Download PDF

Info

Publication number
CN106126558B
CN106126558B CN201610430180.6A CN201610430180A CN106126558B CN 106126558 B CN106126558 B CN 106126558B CN 201610430180 A CN201610430180 A CN 201610430180A CN 106126558 B CN106126558 B CN 106126558B
Authority
CN
China
Prior art keywords
public sentiment
user
comment
operation data
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610430180.6A
Other languages
English (en)
Other versions
CN106126558A (zh
Inventor
王磊
孔畅
张旭
张航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201610430180.6A priority Critical patent/CN106126558B/zh
Publication of CN106126558A publication Critical patent/CN106126558A/zh
Application granted granted Critical
Publication of CN106126558B publication Critical patent/CN106126558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种舆情监控方法,用于实现对融合新媒体的全平台舆情进行有效、准确地监控,该方法包括:从各个信息发布平台获取针对同一信息发布内容的用户操作数据,所述用户操作数据包括用户标识以及操作类型;根据所述用户操作数据计算舆情数值;当所述舆情数值超过预设阈值时,产生预警信息。本发明还公开了一种舆情监控装置。

Description

一种舆情监控方法及装置
技术领域
本发明涉及互联网技术领域,具体涉及一种舆情监控方法及装置。
背景技术
随着互联网的普及,新媒体得到了大力发展,很多机构都推出了自己的新媒体平台,通过融合传统媒体与新媒体,利用微博、微信、客户端以及网站等多渠道发布信息,为用户提供新的交互式的体验。新媒体一个最大的特点是互动性,用户的各种观点和看法也形成内容的一个部分,使得信息的发布与信息的接收形成开放格局闭环关系。这样的新媒体环境引发的问题是如果不对互动的内容进行有效的监控和管理很可能引发负面的社会效应。
在现有技术中,对舆情的监控主要是对单一渠道发布的信息内容进行监控,且仅监控用户对发布内容的评论行为,这样并不能有效地完成对多渠道的融合新媒体系统进行统一舆情监控以及对用户各种操作行为进行监控,无法有效、准确地实现对融合新媒体全平台进行舆情监控。
发明内容
有鉴于此,本发明提供一种舆情监控方法及装置,以解决现有技术中无法对融合新媒体的全平台舆情进行有效、准确地监控。
为解决上述问题,本发明提供的技术方案如下:
一种舆情监控方法,所述方法包括:
从各个信息发布平台获取针对同一信息发布内容的用户操作数据,所述用户操作数据包括用户标识以及操作类型;
根据所述用户操作数据计算舆情数值;
当所述舆情数值超过预设阈值时,产生预警信息。
相应的,所述操作类型包括评论、转发、点赞以及浏览;当所述操作类型为评论时,所述用户操作数据还包括评论内容;所述根据所述用户操作数据计算舆情数值包括以下任意一种或多种的组合:
根据所述用户操作数据计算舆情热度值;
根据所述用户操作数据计算正向舆情情感值;
根据所述用户操作数据计算负向舆情情感值;
根据所述用户操作数据计算舆情加速度值;
根据所述用户操作数据计算舆情恶意值。
相应的,所述根据所述用户操作数据计算舆情热度值,包括:
累计所述操作类型为评论的用户操作数据的数量作为评论数,累计所述操作类型为转发的用户操作数据的数量作为转发数,累计所述操作类型为点赞的用户操作数据的数量作为点赞数,累计所述操作类型为浏览的用户操作数据的数量作为浏览数;
将所述评论数、所述转发数、所述点赞数以及所述浏览数加权求和作为舆情热度值。
相应的,所述根据所述用户操作数据计算正向舆情情感值,包括:
累计所述操作类型为评论的用户操作数据的数量作为评论数;
对所述用户操作数据中的评论内容进行分词后,与正向情感关键词进行匹配;
对所述评论内容中具有与所述正向情感关键词匹配分词的评论内容数量进行累计作为正向评论数;
将所述正向评论数除以所述评论数作为正向舆情情感值;
所述根据所述用户操作数据计算负向舆情情感值,包括:
累计所述操作类型为评论的用户操作数据的数量作为评论数;
对所述用户操作数据中的评论内容进行分词后,与负向情感关键词进行匹配;
对所述评论内容中具有与所述负向情感关键词匹配分词的评论内容数量进行累计作为负向评论数;
将所述负向评论数除以所述评论数作为负向舆情情感值。
相应的,所述根据所述用户操作数据计算正向舆情情感值,包括:
累计所述操作类型为评论的用户操作数据的数量作为评论数;
利用机器学习算法确定所述用户操作数据中的评论内容是否为正向评论,累计正向评论数;
将所述正向评论数除以所述评论数作为正向舆情情感值;
所述根据所述用户操作数据计算负向舆情情感值,包括:
累计所述操作类型为评论的用户操作数据的数量作为评论数;
利用机器学习算法确定所述用户操作数据中的评论内容是否为负向评论,累计负向评论数;
将所述负向评论数除以所述评论数作为负向舆情情感值。
相应的,所述根据所述用户操作数据计算舆情加速度值,包括:
计算预定时间段内所述舆情热度值的变化量作为舆情加速度值。
相应的,所述根据所述用户操作数据计算舆情恶意值,包括:
对所述用户操作数据中的评论内容进行分词后,与恶意关键词进行匹配;
当所述评论内容中具有与所述恶意关键词匹配分词时,直接设置舆情恶意值。
相应的,当所述舆情数值超过预设阈值时,产生预警信息,包括:
当所述舆情数值超过预设阈值时,确定舆情倾向,当正向舆情情感值超过正向舆情情感值预设阈值时,确定所述舆情倾向为正向舆情,当所述负向舆情情感值超过负向舆情情感值预设阈值时,确定所述舆情倾向为负向舆情;
当所述舆情倾向为正向舆情,生成正向舆情记录;
当所述舆情倾向为负向舆情,产生预警信息。
相应的,所述方法还包括:
将信息发布内容同时发送至所述各个信息发布平台进行发布。
一种舆情监控装置,所述装置包括:
获取单元,用于从各个信息发布平台获取针对同一信息发布内容的用户操作数据,所述用户操作数据包括用户标识以及操作类型;
计算单元,用于根据所述用户操作数据计算舆情数值;
预警单元,用于当所述舆情数值超过预设阈值时,产生预警信息。
相应的,所述操作类型包括评论、转发、点赞以及浏览;当所述操作类型为评论时,所述用户操作数据还包括评论内容;所述计算单元包括以下任意一种或多种的组合:
第一计算子单元,用于根据所述用户操作数据计算舆情热度值;
第二计算子单元,用于根据所述用户操作数据计算正向舆情情感值;
第三计算子单元,用于根据所述用户操作数据计算负向舆情情感值;
第四计算子单元,用于根据所述用户操作数据计算舆情加速度值;
第五计算子单元,用于根据所述用户操作数据计算舆情恶意值。
相应的,所述第一计算子单元包括:
第一累计子单元,用于累计所述操作类型为评论的用户操作数据的数量作为评论数,累计所述操作类型为转发的用户操作数据的数量作为转发数,累计所述操作类型为点赞的用户操作数据的数量作为点赞数,累计所述操作类型为浏览的用户操作数据的数量作为浏览数;
求和子单元,用于将所述评论数、所述转发数、所述点赞数以及所述浏览数加权求和作为舆情热度值。
相应的,所述第二计算子单元包括:
第二累计子单元,用于累计所述操作类型为评论的用户操作数据的数量作为评论数;
第一匹配子单元,用于对所述用户操作数据中的评论内容进行分词后,与正向情感关键词进行匹配;
第三累计子单元,用于对所述评论内容中具有与所述正向情感关键词匹配分词的评论内容数量进行累计作为正向评论数;
第六计算子单元,用于将所述正向评论数除以所述评论数作为正向舆情情感值;
所述第三计算子单元包括:
第二累计子单元,用于累计所述操作类型为评论的用户操作数据的数量作为评论数;
第二匹配子单元,用于对所述用户操作数据中的评论内容进行分词后,与负向情感关键词进行匹配;
第四累计子单元,用于对所述评论内容中具有与所述负向情感关键词匹配分词的评论内容数量进行累计作为负向评论数;
第七计算子单元,用于将所述负向评论数除以所述评论数作为负向舆情情感值。
相应的,所述第二计算子单元包括:
第三累计子单元,用于累计所述操作类型为评论的用户操作数据的数量作为评论数;
第四累计子单元,用于利用机器学习算法确定所述用户操作数据中的评论内容是否为正向评论,累计正向评论数;
第八计算子单元,用于将所述正向评论数除以所述评论数作为正向舆情情感值;
所述第三计算子单元包括:
第五累计子单元,用于累计所述操作类型为评论的用户操作数据的数量作为评论数;
第六累计子单元,用于利用机器学习算法确定所述用户操作数据中的评论内容是否为负向评论,累计负向评论数;
第九计算子单元,用于将所述负向评论数除以所述评论数作为负向舆情情感值。
相应的,所述第四计算子单元具体用于:
计算预定时间段内所述舆情热度值的变化量作为舆情加速度值。
相应的,所述第五计算子单元包括:
第三匹配子单元,用于对所述用户操作数据中的评论内容进行分词后,与恶意关键词进行匹配;
设置子单元,用于当所述评论内容中具有与所述恶意关键词匹配分词时,直接设置舆情恶意值。
相应的,所述预警单元包括:
确定子单元,用于当所述舆情数值超过预设阈值时,确定舆情倾向,当正向舆情情感值超过正向舆情情感值预设阈值时,确定所述舆情倾向为正向舆情,当所述负向舆情情感值超过负向舆情情感值预设阈值时,确定所述舆情倾向为负向舆情;
生成子单元,用于当所述舆情倾向为正向舆情,生成正向舆情记录;
预警子单元,用于当所述舆情倾向为负向舆情,产生预警信息。
相应的,所述装置还包括:
发布单元,用于将信息发布内容同时发送至所述各个信息发布平台进行发布。
由此可见,本发明实施例具有如下有益效果:
本发明实施例从多个信息发布平台获取对同一信息发布内容的用户操作数据,进行舆情数值计算,且用于进行舆情数值计算的用户操作数据是用户对信息发布内容各种操作获得的数据,用户操作例如评论、转发、点赞以及浏览等等,获得的舆情数值可以是对融合新媒体的全平台舆情进行有效监控,且监控了用户的各类操作行为,舆情监控结果更为准确。
附图说明
图1为本发明实施例中提供的舆情监控方法实施例一的流程图;
图2为本发明实施例中提供的舆情监控方法实施例二的流程图;
图3为本发明实施例中提供的舆情监控装置实施例的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明实施例作进一步详细的说明。
参见图1所示,示出了本发明实施例中提供的舆情监控方法实施例一,可以包括以下步骤:
步骤101:从各个信息发布平台获取针对同一信息发布内容的用户操作数据,用户操作数据包括用户标识以及操作类型。
在实际应用中用户可以同时利用多个信息发布平台发布信息,信息发布平台例如微博、微信公众号、客户端以及网站等,对于微博、微信可以通过官方API(ApplicationProgramming Interface,应用程序编程接口)获取用户操作数据,对于客户端以及网站可以从后台服务器获取用户操作数据,在舆情监控中需要从各个信息发布平台获取针对同一条信息发布内容的多条用户操作数据。
在本发明的一些可能的实现方式中,操作类型可以包括评论、转发、点赞以及浏览;当操作类型为评论时,用户操作数据还包括评论内容。
也即一条用户操作数据可以包括进行操作用户的用户标识、所进行的操作类型以及当操作类型为评论时该用户进行的评论内容。
在本发明的一些可能的实现方式中,还可以包括:
将信息发布内容同时发送至各个信息发布平台进行发布。
由于在现有技术中需要分别在各个信息发布平台分别进行同一信息发布内容的发布,需要编辑多次发布多次,效率较低,为此,本发明实施例中提出通过统一的平台操作页面,进行待发布信息内容的编辑操作,编辑完成且审核无误后,通过一键发布将信息发布内容同时发布到各个信息发布平台,例如同时发布到微博、微信、客户端以及网站。微博、微信的信息发布可以通过调用官方开放API实现,客户端以及网站则可以调用服务器的API实现。一键将信息发布内容同时发布至各个信息发布平台,效率较高。
步骤102:根据用户操作数据计算舆情数值。
在实际应用中,可以通过storm或spark stream等流数据计算框架,利用kafuka等分布式消息队列近实时计算舆情数值。
在本发明的一些可能的实现方式中,根据用户操作数据计算舆情数值的实现可以包括以下任意一种或多种的组合:
根据用户操作数据计算舆情热度值;
根据用户操作数据计算正向舆情情感值;
根据用户操作数据计算负向舆情情感值;
根据用户操作数据计算舆情加速度值;
根据用户操作数据计算舆情恶意值。
在实际应用中舆情的产生可以有多种场景,其中一些重点值得关注的场景包括:有大量用户点赞,代表得到大量用户认可,可以认为是正向舆情;有大量用户转发,代表迅速传播,可以为正向舆情也可以为负向舆情;有大量用户评论,代表引发了讨论,可以为正向舆情也可以为负向舆情;有用户评论但言辞恶劣,可以认为是负向舆情。通过以上场景的分析,需要识别负向舆情的上升趋势,以避免造成不良的社会影响。为此,本发明实施例中需要对舆情热度值、正向舆情情感值、负向舆情情感值、舆情加速度值以及舆情恶意值中的一个或多个进行计算,及时发现舆情的变化,产生预警。
进一步的,在本发明的一些可能的实现方式中,根据用户操作数据计算舆情热度值的具体实现可以包括:
累计操作类型为评论的用户操作数据的数量作为评论数,累计操作类型为转发的用户操作数据的数量作为转发数,累计操作类型为点赞的用户操作数据的数量作为点赞数,累计操作类型为浏览的用户操作数据的数量作为浏览数。
将评论数、转发数、点赞数以及浏览数加权求和作为舆情热度值。
在本实施例中,舆情热度值=全平台评论数*加权系数A+全平台转发数*加权系数B+全平台点赞数*加权系数C+全平台浏览数*加权系数D。
根据传播影响力关系,可以认为评论(个人观点表达)>转发(传播)>点赞(认可)>浏览(无情感),在实际应用中,可以根据经验对各个加权系数进行设定,例如可以将加权系数定义为:A=0.5,B=0.3,C=0.1,D=0.1,需要注意的是,本发明对于加权系数的设定不进行限定。
在本发明的一些可能的实现方式中,根据用户操作数据计算正向舆情情感值的具体实现可以包括:
累计操作类型为评论的用户操作数据的数量作为评论数。
对用户操作数据中的评论内容进行分词后,与正向情感关键词进行匹配。
对评论内容中具有与正向情感关键词匹配分词的评论内容数量进行累计作为正向评论数。
将正向评论数除以评论数作为正向舆情情感值。
在本实施例中,可以根据实际情况建立正向情感关键词数据库,正向情感关键词例如很好、很棒等等,对每条评论内容首先进行分词,将分词后的评论内容与正向情感关键词进行匹配,当某一条评论内容中的分词与任一正向情感关键词匹配,则代表该条评论内容为正向评论,对正向评论数量进行累计,则正向舆情情感值=正向评论数/全平台评论数。
在本发明的一些可能的实现方式中,根据用户操作数据计算负向舆情情感值的具体实现可以包括:
累计操作类型为评论的用户操作数据的数量作为评论数;
对用户操作数据中的评论内容进行分词后,与负向情感关键词进行匹配;
对评论内容中具有与负向情感关键词匹配分词的评论内容数量进行累计作为负向评论数;
将负向评论数除以评论数作为负向舆情情感值。
类似的,可以根据实际情况建立负向情感关键词数据库,对每条评论内容首先进行分词,将分词后的评论内容与负向情感关键词进行匹配,当某一条评论内容中的分词与任一负向情感关键词匹配,则代表该条评论内容为负向评论,对负向评论数量进行累计,则负向舆情情感值=负向评论数/全平台评论数。
另外,在本发明的一些可能的实现方式中,根据用户操作数据计算正向舆情情感值的具体实现也可以包括:
累计操作类型为评论的用户操作数据的数量作为评论数;
利用机器学习算法确定用户操作数据中的评论内容是否为正向评论,累计正向评论数;
将正向评论数除以评论数作为正向舆情情感值。
也即还可以利用机器学习算法确定评论内容是否为正向评论,机器学习算法可以采用有监督式机器学习算法,预先输入正向评论样本进行训练,则利用机器学习算法可以确定获取到的评论内容是否为正向评论,对正向评论数量进行累计,则正向舆情情感值=正向评论数/全平台评论数。
在本发明的一些可能的实现方式中,根据用户操作数据计算负向舆情情感值的具体实现也可以包括:
累计操作类型为评论的用户操作数据的数量作为评论数;
利用机器学习算法确定用户操作数据中的评论内容是否为负向评论,累计负向评论数;
将负向评论数除以评论数作为负向舆情情感值。
类似的,还可以利用机器学习算法确定评论内容是否为负向评论,对负向评论数量进行累计,则负向舆情情感值=负向评论数/全平台评论数。
在本发明的一些可能的实现方式中,根据用户操作数据计算舆情加速度值的具体实现可以包括:
计算预定时间段内舆情热度值的变化量作为舆情加速度值。
舆情加速度值主要用来识别短期内迅速爆发呈上升趋势的舆论,舆情加速度值=舆情热度值的变化量除以产生该舆情热度值的变化量的所用时间,如果设定了预定时间段,例如五分钟,则舆情加速度值则为预定时间段内舆情热度值的变化量。
在本发明的一些可能的实现方式中,根据用户操作数据计算舆情恶意值的具体实现可以包括:
对用户操作数据中的评论内容进行分词后,与恶意关键词进行匹配;
当评论内容中具有与恶意关键词匹配分词时,直接设置舆情恶意值。
可以根据实际情况建立恶意关键词数据库,恶意关键词是比负向情感关键词更为恶劣的词汇,例如一些敏感词等等。首先,对每条评论内容首先进行分词,将分词后的评论内容与恶意关键词进行匹配,当某一条评论内容中的分词与任一恶意关键词匹配,则代表该条评论内容为恶意评论,只要发现评论为恶意评论,直接设置舆情恶意值,例如设置为1,直接产生预警信息,或者对评论内容中具有与恶意关键词匹配分词的评论内容数量进行累计作为恶意评论数,将恶意评论数设置为舆情恶意值。
步骤103:当舆情数值超过预设阈值时,产生预警信息。
在本发明的一些可能的实现方式中,当舆情数值超过预设阈值时,产生预警信息的具体实现可以包括:当舆情热度值超过预设舆情热度值阈值时,可以产生预警信息;当正向舆情情感值超过预设正向舆情情感值阈值时,可以产生预警信息;当负向舆情情感值超过预设负向舆情情感值阈值时,可以产生预警信息;当舆情加速度值超过预设舆情加速度值阈值时,可以产生预警信息;当舆情恶意值超过预设舆情恶意值阈值时,可以产生预警信息。例如预设舆情恶意值阈值可以设置为0,只要检测到恶意评论则直接产生预警信息。同时检测舆情热度值、正向舆情情感值、负向舆情情感值、舆情加速度值、舆情恶意值等舆情数值中的一个或多个,舆情监控的内容更加全面,并在任意一个舆情数值超过预设阈值时,均可以产生预警信息,并可以进一步提示因为何种原因产生的预警信息,使任何舆情异常情况都可以发现,舆情监控结果更为准确。
在本发明的一些可能的实现方式中,当舆情数值超过预设阈值时,也可以先确定舆情倾向,再产生预警信息。
当舆情数值超过预设阈值时(包括舆情热度值超过预设舆情热度值阈值;正向舆情情感值超过预设正向舆情情感值阈值;负向舆情情感值超过预设负向舆情情感值阈值;舆情加速度值超过预设舆情加速度值阈值;舆情恶意值超过预设舆情恶意值阈值中的一项或多项时),可以先确定舆情倾向,当正向舆情情感值超过正向舆情情感值预设阈值时,确定舆情倾向为正向舆情,当负向舆情情感值超过负向舆情情感值预设阈值时,确定舆情倾向为负向舆情;
当舆情倾向为正向舆情,生成正向舆情记录;当舆情倾向为负向舆情,产生预警信息。
当舆情倾向为正向舆情时,还可以对评论内容中的分词进行聚类得到主题词,记录于正向舆情记录中。预警信息可以通过邮件、短信等方式发送给管理者用户,预警信息还可以提示是否对负向评论或恶意评论进行删除,从而可以实现对全平台舆情的及时有效管控,降低负面影响传播。
这样,本发明实施例从多个信息发布平台获取对同一信息发布内容的用户操作数据,进行舆情数值计算,且用于进行舆情数值计算的用户操作数据是用户对信息发布内容各种操作获得的数据,用户操作例如评论、转发、点赞以及浏览等等,获得的舆情数值可以是对融合新媒体的全平台舆情进行有效监控,且监控了用户的各类操作行为,舆情监控结果更为准确。
以下再以实际应用中的实例对本发明实施例提供的舆情监控方法进行说明。参见图2所示,示出了本发明实施例中提供的舆情监控方法实施例二,可以包括以下步骤:
步骤201:编辑信息发布内容,将信息发布内容同时发布至各个信息发布平台。
步骤202:从各个信息发布平台获取针对该信息发布内容的用户操作数据。
步骤203:将获取的多条用户操作数据记录到待处理队列。
步骤204:并行读取待处理队列中的用户操作数据。
步骤205:判断用户操作数据中的操作类型是否为评论,如果是,进入步骤206,如果否,进入步骤209。
步骤206:累计评论数,即累计操作类型为评论的用户操作数据的数量作为评论数。
步骤207:对评论内容进行分词、关键词匹配。即对用户操作数据中的评论内容进行分词后,与正向情感关键词、负向情感关键词以及恶意关键词分别进行匹配。
步骤208:累计正向评论数、负向评论数以及恶意评论数。即对评论内容中具有与正向情感关键词匹配分词的评论内容数量进行累计作为正向评论数;对评论内容中具有与负向情感关键词匹配分词的评论内容数量进行累计作为负向评论数;对评论内容中具有与恶意关键词匹配分词的评论内容数量进行累计作为恶意评论数。
步骤209:累计转发数、点赞数以及浏览数。即累计操作类型为转发的用户操作数据的数量作为转发数,累计操作类型为点赞的用户操作数据的数量作为点赞数,累计操作类型为浏览的用户操作数据的数量作为浏览数。
步骤210:计算舆情数值,包括计算舆情热度值、正向舆情情感值、负向舆情情感值、舆情加速度值以及舆情恶意值中的一个或多个。计算舆情数值的方式可以参见上述实施例,在此不再赘述。
步骤211:判断舆情数值是否超过预设阈值,如果是,进入步骤212,如果否,返回步骤204。
步骤212:确定舆情倾向,当舆情倾向为正向舆情,进入步骤213,当舆情倾向为负向舆情,进入步骤214。
步骤213:生成正向舆情记录。
步骤214:产生预警信息。
这样,本发明实施例从多个信息发布平台获取对同一信息发布内容的用户操作数据,进行舆情数值计算,且用于进行舆情数值计算的用户操作数据是用户对信息发布内容各种操作获得的数据,用户操作例如评论、转发、点赞以及浏览等等,获得的舆情数值可以是对融合新媒体的全平台舆情进行有效监控,且监控了用户的各类操作行为,舆情监控结果更为准确。
参见图3所示,示出了本发明实施例中提供的一种舆情监控装置实施例,可以包括:
获取单元301,用于从各个信息发布平台获取针对同一信息发布内容的用户操作数据,用户操作数据包括用户标识以及操作类型。
在本发明的一些可能的实现方式中,操作类型包括评论、转发、点赞以及浏览;当操作类型为评论时,用户操作数据还包括评论内容。
计算单元302,用于根据用户操作数据计算舆情数值。
在本发明的一些可能的实现方式中,计算单元可以包括以下任意一种或多种的组合:
第一计算子单元,用于根据用户操作数据计算舆情热度值;
第二计算子单元,用于根据用户操作数据计算正向舆情情感值;
第三计算子单元,用于根据用户操作数据计算负向舆情情感值;
第四计算子单元,用于根据用户操作数据计算舆情加速度值;
第五计算子单元,用于根据用户操作数据计算舆情恶意值。
其中,在本发明的一些可能的实现方式中,第一计算子单元可以包括:
第一累计子单元,用于累计操作类型为评论的用户操作数据的数量作为评论数,累计操作类型为转发的用户操作数据的数量作为转发数,累计操作类型为点赞的用户操作数据的数量作为点赞数,累计操作类型为浏览的用户操作数据的数量作为浏览数;
求和子单元,用于将评论数、转发数、点赞数以及浏览数加权求和作为舆情热度值。
在本发明的一些可能的实现方式中,第二计算子单元可以包括:
第二累计子单元,用于累计操作类型为评论的用户操作数据的数量作为评论数;
第一匹配子单元,用于对用户操作数据中的评论内容进行分词后,与正向情感关键词进行匹配;
第三累计子单元,用于对评论内容中具有与正向情感关键词匹配分词的评论内容数量进行累计作为正向评论数;
第六计算子单元,用于将正向评论数除以评论数作为正向舆情情感值;
在本发明的一些可能的实现方式中,第三计算子单元可以包括:
第二累计子单元,用于累计操作类型为评论的用户操作数据的数量作为评论数;
第二匹配子单元,用于对用户操作数据中的评论内容进行分词后,与负向情感关键词进行匹配;
第四累计子单元,用于对评论内容中具有与负向情感关键词匹配分词的评论内容数量进行累计作为负向评论数;
第七计算子单元,用于将负向评论数除以评论数作为负向舆情情感值。
在本发明的一些可能的实现方式中,第二计算子单元可以包括:
第三累计子单元,用于累计操作类型为评论的用户操作数据的数量作为评论数;
第四累计子单元,用于利用机器学习算法确定用户操作数据中的评论内容是否为正向评论,累计正向评论数;
第八计算子单元,用于将正向评论数除以评论数作为正向舆情情感值;
在本发明的一些可能的实现方式中,第三计算子单元可以包括:
第五累计子单元,用于累计操作类型为评论的用户操作数据的数量作为评论数;
第六累计子单元,用于利用机器学习算法确定用户操作数据中的评论内容是否为负向评论,累计负向评论数;
第九计算子单元,用于将负向评论数除以评论数作为负向舆情情感值。
在本发明的一些可能的实现方式中,第四计算子单元可以具体用于:
计算预定时间段内舆情热度值的变化量作为舆情加速度值。
在本发明的一些可能的实现方式中,第五计算子单元可以包括:
第三匹配子单元,用于对用户操作数据中的评论内容进行分词后,与恶意关键词进行匹配;
设置子单元,用于当评论内容中具有与恶意关键词匹配分词时,直接设置舆情恶意值。
预警单元303,用于当舆情数值超过预设阈值时,产生预警信息。
在本发明的一些可能的实现方式中,预警单元可以包括:
确定子单元,用于当舆情数值超过预设阈值时,确定舆情倾向,当正向舆情情感值超过正向舆情情感值预设阈值时,确定舆情倾向为正向舆情,当负向舆情情感值超过负向舆情情感值预设阈值时,确定舆情倾向为负向舆情;
生成子单元,用于当舆情倾向为正向舆情,生成正向舆情记录;
预警子单元,用于当舆情倾向为负向舆情,产生预警信息。
在本发明的一些可能的实现方式中,本发明实施例中提供的舆情监控装置还可以包括:
发布单元,用于将信息发布内容同时发送至各个信息发布平台进行发布。
这样,本发明实施例从多个信息发布平台获取对同一信息发布内容的用户操作数据,进行舆情数值计算,且用于进行舆情数值计算的用户操作数据是用户对信息发布内容各种操作获得的数据,用户操作例如评论、转发、点赞以及浏览等等,获得的舆情数值可以是对融合新媒体的全平台舆情进行有效监控,且监控了用户的各类操作行为,舆情监控结果更为准确。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (14)

1.一种舆情监控方法,其特征在于,所述方法包括:
将信息发布内容同时发送至各个信息发布平台进行发布,从所述各个信息发布平台获取针对同时发布在各个信息发布平台的同一信息发布内容的用户操作数据,所述用户操作数据包括用户标识以及操作类型;所述操作类型包括评论、转发、点赞以及浏览;当所述操作类型为评论时,所述用户操作数据还包括评论内容;所述信息发布平台包括微博、微信公众号、客户端以及网站;
根据所述用户操作数据计算舆情数值;所述根据所述用户操作数据计算舆情数值包括以下任意一种或多种的组合:根据所述用户操作数据计算舆情热度值;根据所述用户操作数据计算正向舆情情感值;根据所述用户操作数据计算负向舆情情感值;根据所述用户操作数据计算舆情加速度值;根据所述用户操作数据计算舆情恶意值;
当所述舆情数值超过预设阈值时,产生预警信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用户操作数据计算舆情热度值,包括:
累计所述操作类型为评论的用户操作数据的数量作为评论数,累计所述操作类型为转发的用户操作数据的数量作为转发数,累计所述操作类型为点赞的用户操作数据的数量作为点赞数,累计所述操作类型为浏览的用户操作数据的数量作为浏览数;
将所述评论数、所述转发数、所述点赞数以及所述浏览数加权求和作为舆情热度值。
3.根据权利要求1所述的方法,其特征在于,所述根据所述用户操作数据计算正向舆情情感值,包括:
累计所述操作类型为评论的用户操作数据的数量作为评论数;
对所述用户操作数据中的评论内容进行分词后,与正向情感关键词进行匹配;
对所述评论内容中具有与所述正向情感关键词匹配分词的评论内容数量进行累计作为正向评论数;
将所述正向评论数除以所述评论数作为正向舆情情感值;
所述根据所述用户操作数据计算负向舆情情感值,包括:
累计所述操作类型为评论的用户操作数据的数量作为评论数;
对所述用户操作数据中的评论内容进行分词后,与负向情感关键词进行匹配;
对所述评论内容中具有与所述负向情感关键词匹配分词的评论内容数量进行累计作为负向评论数;
将所述负向评论数除以所述评论数作为负向舆情情感值。
4.根据权利要求1所述的方法,其特征在于,所述根据所述用户操作数据计算正向舆情情感值,包括:
累计所述操作类型为评论的用户操作数据的数量作为评论数;
利用机器学习算法确定所述用户操作数据中的评论内容是否为正向评论,累计正向评论数;
将所述正向评论数除以所述评论数作为正向舆情情感值;
所述根据所述用户操作数据计算负向舆情情感值,包括:
累计所述操作类型为评论的用户操作数据的数量作为评论数;
利用机器学习算法确定所述用户操作数据中的评论内容是否为负向评论,累计负向评论数;
将所述负向评论数除以所述评论数作为负向舆情情感值。
5.根据权利要求2所述的方法,其特征在于,所述根据所述用户操作数据计算舆情加速度值,包括:
计算预定时间段内所述舆情热度值的变化量作为舆情加速度值。
6.根据权利要求1所述的方法,其特征在于,所述根据所述用户操作数据计算舆情恶意值,包括:
对所述用户操作数据中的评论内容进行分词后,与恶意关键词进行匹配;
当所述评论内容中具有与所述恶意关键词匹配分词时,直接设置舆情恶意值。
7.根据权利要求1所述的方法,其特征在于,当所述舆情数值超过预设阈值时,产生预警信息,包括:
当所述舆情数值超过预设阈值时,确定舆情倾向,当正向舆情情感值超过正向舆情情感值预设阈值时,确定所述舆情倾向为正向舆情,当所述负向舆情情感值超过负向舆情情感值预设阈值时,确定所述舆情倾向为负向舆情;
当所述舆情倾向为正向舆情,生成正向舆情记录;
当所述舆情倾向为负向舆情,产生预警信息。
8.一种舆情监控装置,其特征在于,所述装置包括:
发布单元,用于将信息发布内容同时发送至各个信息发布平台进行发布;所述信息发布平台包括微博、微信公众号、客户端以及网站;
获取单元,用于从所述各个信息发布平台获取针对同时发布在各个信息发布平台的同一信息发布内容的用户操作数据,所述用户操作数据包括用户标识以及操作类型;所述操作类型包括评论、转发、点赞以及浏览;当所述操作类型为评论时,所述用户操作数据还包括评论内容;
计算单元,用于根据所述用户操作数据计算舆情数值;所述计算单元包括以下任意一种或多种的组合:第一计算子单元,用于根据所述用户操作数据计算舆情热度值;第二计算子单元,用于根据所述用户操作数据计算正向舆情情感值;第三计算子单元,用于根据所述用户操作数据计算负向舆情情感值;第四计算子单元,用于根据所述用户操作数据计算舆情加速度值;第五计算子单元,用于根据所述用户操作数据计算舆情恶意值;
预警单元,用于当所述舆情数值超过预设阈值时,产生预警信息。
9.根据权利要求8所述的装置,其特征在于,所述第一计算子单元包括:
第一累计子单元,用于累计所述操作类型为评论的用户操作数据的数量作为评论数,累计所述操作类型为转发的用户操作数据的数量作为转发数,累计所述操作类型为点赞的用户操作数据的数量作为点赞数,累计所述操作类型为浏览的用户操作数据的数量作为浏览数;
求和子单元,用于将所述评论数、所述转发数、所述点赞数以及所述浏览数加权求和作为舆情热度值。
10.根据权利要求8所述的装置,其特征在于,所述第二计算子单元包括:
第二累计子单元,用于累计所述操作类型为评论的用户操作数据的数量作为评论数;
第一匹配子单元,用于对所述用户操作数据中的评论内容进行分词后,与正向情感关键词进行匹配;
第三累计子单元,用于对所述评论内容中具有与所述正向情感关键词匹配分词的评论内容数量进行累计作为正向评论数;
第六计算子单元,用于将所述正向评论数除以所述评论数作为正向舆情情感值;
所述第三计算子单元包括:
第二累计子单元,用于累计所述操作类型为评论的用户操作数据的数量作为评论数;
第二匹配子单元,用于对所述用户操作数据中的评论内容进行分词后,与负向情感关键词进行匹配;
第四累计子单元,用于对所述评论内容中具有与所述负向情感关键词匹配分词的评论内容数量进行累计作为负向评论数;
第七计算子单元,用于将所述负向评论数除以所述评论数作为负向舆情情感值。
11.根据权利要求8所述的装置,其特征在于,所述第二计算子单元包括:
第三累计子单元,用于累计所述操作类型为评论的用户操作数据的数量作为评论数;
第四累计子单元,用于利用机器学习算法确定所述用户操作数据中的评论内容是否为正向评论,累计正向评论数;
第八计算子单元,用于将所述正向评论数除以所述评论数作为正向舆情情感值;
所述第三计算子单元包括:
第五累计子单元,用于累计所述操作类型为评论的用户操作数据的数量作为评论数;
第六累计子单元,用于利用机器学习算法确定所述用户操作数据中的评论内容是否为负向评论,累计负向评论数;
第九计算子单元,用于将所述负向评论数除以所述评论数作为负向舆情情感值。
12.根据权利要求9所述的装置,其特征在于,所述第四计算子单元具体用于:
计算预定时间段内所述舆情热度值的变化量作为舆情加速度值。
13.根据权利要求8所述的装置,其特征在于,所述第五计算子单元包括:
第三匹配子单元,用于对所述用户操作数据中的评论内容进行分词后,与恶意关键词进行匹配;
设置子单元,用于当所述评论内容中具有与所述恶意关键词匹配分词时,直接设置舆情恶意值。
14.根据权利要求8所述的装置,其特征在于,所述预警单元包括:
确定子单元,用于当所述舆情数值超过预设阈值时,确定舆情倾向,当正向舆情情感值超过正向舆情情感值预设阈值时,确定所述舆情倾向为正向舆情,当所述负向舆情情感值超过负向舆情情感值预设阈值时,确定所述舆情倾向为负向舆情;
生成子单元,用于当所述舆情倾向为正向舆情,生成正向舆情记录;
预警子单元,用于当所述舆情倾向为负向舆情,产生预警信息。
CN201610430180.6A 2016-06-16 2016-06-16 一种舆情监控方法及装置 Active CN106126558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610430180.6A CN106126558B (zh) 2016-06-16 2016-06-16 一种舆情监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610430180.6A CN106126558B (zh) 2016-06-16 2016-06-16 一种舆情监控方法及装置

Publications (2)

Publication Number Publication Date
CN106126558A CN106126558A (zh) 2016-11-16
CN106126558B true CN106126558B (zh) 2019-09-20

Family

ID=57470589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610430180.6A Active CN106126558B (zh) 2016-06-16 2016-06-16 一种舆情监控方法及装置

Country Status (1)

Country Link
CN (1) CN106126558B (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107038193B (zh) * 2016-11-17 2020-11-27 创新先进技术有限公司 一种文本信息的处理方法和装置
CN108153764A (zh) * 2016-12-05 2018-06-12 腾讯科技(深圳)有限公司 一种舆情处理方法及装置
CN108733706B (zh) * 2017-04-20 2022-12-20 腾讯科技(深圳)有限公司 热度信息的生成方法和装置
CN107274004A (zh) * 2017-05-11 2017-10-20 广东网金控股股份有限公司 一种融资项目热度预警方法及终端
CN107293309B (zh) * 2017-05-19 2021-04-30 四川新网银行股份有限公司 一种基于客户情绪分析提升舆情监控效率的方法
CN107562722A (zh) * 2017-08-14 2018-01-09 上海文军信息技术有限公司 基于大数据的互联网舆情监测分析系统
CN107704513A (zh) * 2017-08-31 2018-02-16 四川长虹电器股份有限公司 一种网络舆情监控方法及系统
CN107798112A (zh) * 2017-11-02 2018-03-13 国影(北京)科技有限责任公司 一种舆情信息处理方法及装置
CN107908699A (zh) * 2017-11-03 2018-04-13 福建中金在线信息科技有限公司 内容显示方法和服务器
CN108319587B (zh) * 2018-02-05 2021-11-19 中译语通科技股份有限公司 一种多权重的舆情价值计算方法及系统、计算机
CN108712569B (zh) * 2018-05-08 2021-03-12 天津网之易创新科技有限公司 内容筛选方法、介质、装置和计算设备
CN109255015A (zh) * 2018-06-29 2019-01-22 中译语通科技股份有限公司 一种评价热点事件价值度的方法
CN109376237B (zh) * 2018-09-04 2024-05-28 中国平安人寿保险股份有限公司 客户稳定性的预测方法、装置、计算机设备和存储介质
CN109471928B (zh) * 2018-10-31 2021-09-28 北京国信云服科技有限公司 一种基于扩散传播模型的关联实体情感判断方法
CN109508416B (zh) * 2018-11-09 2021-11-23 四川大学 基于评论数量的微博舆情事件热度与发展趋势预测方法
CN109977403B (zh) * 2019-03-18 2020-04-14 北京金堤科技有限公司 恶意评论信息识别方法及装置
CN110162626A (zh) * 2019-04-26 2019-08-23 湘潭大学 一种基于双向lstm的舆情情感热度熵的计算方法
CN110288431A (zh) * 2019-06-11 2019-09-27 达疆网络科技(上海)有限公司 一种根据用户差评情况识别恶意用户的方法
CN110674300B (zh) * 2019-09-30 2021-03-30 北京京东智能城市大数据研究院 用于生成信息的方法和装置
CN112116391A (zh) * 2020-09-18 2020-12-22 北京达佳互联信息技术有限公司 多媒体资源投放方法、装置、计算机设备及存储介质
CN112800343B (zh) * 2021-02-01 2022-09-30 霍尔果斯大颜色信息科技有限公司 一种基于大数据的网络舆情的监控方法及系统
CN113821729A (zh) * 2021-11-19 2021-12-21 湖北橙才教育研究院有限公司 一种大数据安全评估分析系统及方法
CN115934808B (zh) * 2023-03-02 2023-05-16 中国电子科技集团公司第三十研究所 一种融入关联分析和风暴抑制机制的网络舆情预警方法
CN117556146B (zh) * 2024-01-10 2024-03-22 石家庄邮电职业技术学院 一种网络数据信息处理系统、方法、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102385579A (zh) * 2010-08-30 2012-03-21 腾讯科技(深圳)有限公司 互联网信息分类方法和系统
CN103455705A (zh) * 2013-05-24 2013-12-18 中国科学院自动化研究所 网络社会事件的协同关联跟踪及全局态势分析与预测系统
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法
CN104954581A (zh) * 2015-06-30 2015-09-30 上海海漾软件技术有限公司 一种移动终端分享数据的方法、装置以及系统
CN105740228A (zh) * 2016-01-25 2016-07-06 云南大学 一种互联网舆情分析方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567393A (zh) * 2010-12-21 2012-07-11 北大方正集团有限公司 一种处理舆情话题的方法、装置和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102385579A (zh) * 2010-08-30 2012-03-21 腾讯科技(深圳)有限公司 互联网信息分类方法和系统
CN103455705A (zh) * 2013-05-24 2013-12-18 中国科学院自动化研究所 网络社会事件的协同关联跟踪及全局态势分析与预测系统
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法
CN104954581A (zh) * 2015-06-30 2015-09-30 上海海漾软件技术有限公司 一种移动终端分享数据的方法、装置以及系统
CN105740228A (zh) * 2016-01-25 2016-07-06 云南大学 一种互联网舆情分析方法

Also Published As

Publication number Publication date
CN106126558A (zh) 2016-11-16

Similar Documents

Publication Publication Date Title
CN106126558B (zh) 一种舆情监控方法及装置
Wei et al. Twitter bot detection using bidirectional long short-term memory neural networks and word embeddings
Al-Qurishi et al. Leveraging analysis of user behavior to identify malicious activities in large-scale social networks
Ferrara Measuring social spam and the effect of bots on information diffusion in social media
Bordin et al. Dspbench: A suite of benchmark applications for distributed data stream processing systems
US20150120583A1 (en) Process and mechanism for identifying large scale misuse of social media networks
CN104820686A (zh) 一种网络搜索方法及网络搜索系统
CN102902775B (zh) 互联网实时计算的方法和系统
CN105488092A (zh) 一种时间敏感和自适应的子话题在线检测方法及系统
CN108829656B (zh) 网络信息的数据处理方法及数据处理装置
Radovanović et al. Review spam detection using machine learning
Sahoo et al. Spammer detection approaches in online social network (OSNs): a survey
CN107704622A (zh) 一种基于大数据分析的智能商业服务系统
Guy et al. Identifying informational vs. conversational questions on community question answering archives
Yang et al. Hadoop-based dark web threat intelligence analysis framework
Hughes et al. Too much data? Opportunities and challenges of large datasets and cybercrime
Cheng et al. A heterogeneous hidden Markov model for mobile app recommendation
Krol et al. On rumor source detection and its experimental verification on twitter
Ameen et al. The impact of organizational innovation on financial performance: a perspective of employees within Dubai ports world
Girgin et al. From past to present: Spam detection and identifying opinion leaders in social networks
Ding et al. InterSpot: Interactive Spammer Detection in Social Media.
Mehta et al. Interactively learning social media representations improves news source factuality detection
CN110019697A (zh) 一种刑事文书的推送方法及装置
Noekhah et al. A comprehensive study on opinion mining features and their applications
TW201824113A (zh) 社群資料分析系統及其新興主題預測方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant