CN116992146A - 一种基于大数据的舆情监测系统及方法 - Google Patents

一种基于大数据的舆情监测系统及方法 Download PDF

Info

Publication number
CN116992146A
CN116992146A CN202311002430.2A CN202311002430A CN116992146A CN 116992146 A CN116992146 A CN 116992146A CN 202311002430 A CN202311002430 A CN 202311002430A CN 116992146 A CN116992146 A CN 116992146A
Authority
CN
China
Prior art keywords
public opinion
corresponding event
information
comment information
comment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311002430.2A
Other languages
English (en)
Inventor
钱俊冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Orange Storm Digital Technology Co ltd
Original Assignee
Beijing Orange Storm Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Orange Storm Digital Technology Co ltd filed Critical Beijing Orange Storm Digital Technology Co ltd
Priority to CN202311002430.2A priority Critical patent/CN116992146A/zh
Publication of CN116992146A publication Critical patent/CN116992146A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据的舆情监测系统及方法,属于舆情监测技术领域。本发明包括:S10:基于大数据对互联网上对应事件中的评论信息进行获取,对评论信息中的有用信息按照舆情分析角度进行分类,根据各类评论信息对对应事件的舆论走向情况进行预测,基于预测的舆论走向,判断是否对对应事件进行舆情监控;S20:根据对应事件在各时刻的转发情况和搜索情况,以及S10中预测的对应事件的舆论走向情况,对对应事件的传播情况进行预测;S30:对对应事件的舆情管理时间进行确定。本发明能够对对应事件的舆情管理时间进行确定,保证对应事件在舆情不可控前对舆情进行正向引导,实现对舆情事件的全面分析和监测,提高了系统的监测效果。

Description

一种基于大数据的舆情监测系统及方法
技术领域
本发明涉及舆情监测技术领域,具体为一种基于大数据的舆情监测系统及方法。
背景技术
舆情监测是指整合互联网信息采集技术及信息智能处理技术,通过对互联网海量信息自动抓取、自动分类聚类、主题检测、专题聚焦,实现用户的网络舆情监测。
现有的舆情监测系统在对舆情进行监测时只对事件中的部分信息进行采集和分析,无法实现对舆情事件的全面分析和监测,以及现有系统中的舆情监测技术功能较为单一,无法对舆情监控时间进行预测,即无法实现对舆情的有效控制,以及在对舆情进行分析时,分析过程较为繁琐且分析效率过低。
发明内容
本发明的目的在于提供一种基于大数据的舆情监测系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的舆情监测方法,其特征在于:所述方法包括:
S10:基于大数据对互联网上对应事件中的评论信息进行获取,对评论信息中的有用信息按照舆情分析角度进行分类,根据各类评论信息对对应事件的舆论走向情况进行预测,基于预测的舆论走向,判断是否对对应事件进行舆情监控;
S20:根据对应事件在各时刻的转发情况和搜索情况,以及S10中预测的对应事件的舆论走向情况,对对应事件的传播情况进行预测;
S30:对对应事件的舆情管理时间进行确定。
进一步的,所述S10包括:
S101:以时间间隔t对互联网上对应事件中的评论信息进行获取,根据评论信息之间是否具有回复关系,将获取的评论信息分为主要评论信息和次要评论信息,主要评论信息表示无回复信息且自身非回复信息的评论信息,次要评论信息为主要评论信息的回复信息,判断主要评论信息和匹配的次要评论信息的评论观点是否一致,若不一致,则将匹配的次要评论信息修改为主要评论信息,或作为与其评论观点一致的主要评论信息的次要评论信息,若一致,则无需对次要评论信息进行修改,对主要评论信息与对应事件之间的关联程度进行获取,若关联程度低于设定阈值,则表示对应主要评论信息和匹配的次要评论信息为无用信息,将无用信息和评论信息中评论观点保持中立的评论信息删除,删除后剩余信息为有用信息;
S102:根据S101中的有用信息对对应事件的受争议点数量进行确定,对确定的受争议点进行随机组合,基于随机组合情况,对对应事件的舆情分析角度数量进行确定,具体的确定公式为:
W=∑n v=1{n!/[v*(n-v)!]};
其中,v=1,2,…,n,表示组合内受争议点的数量,n表示对应事件的受争议点总数量,n!表示n的阶乘,(n-v)!表示n-v的阶乘,W表示对应事件的舆情分析角度数量,舆情分析角度指对应事件受争议点对应的争议角度,例如,对应事件的受争议点为学生应该注重课外活动,对应的舆情分析角度为学生是否应该注重课外活动;
将S101中的有用信息按照舆情分析角度进行分类,将属于同一分类的主要评论信息放入同一集合中,根据集合中的主要评论信息和与集合中主要评论信息匹配的次要评论信息,对对应事件的舆论走向进行预测;
S103:若对应事件的舆论走向为正向,则此时无需对对应事件进行舆情监控,若对应事件的舆论走向为负向,则此时需要对对应事件进行舆情监控。
进一步的,所述S102对对应事件的舆论走向进行预测的具体方法为;
A.对集合中主要评论信息的评论观点进行提取,利用公式Fi=[∑m,rj=1,i=1aji+∑m,rj=1,i=1 (aji*bj)]/(m+∑m j=1bj)对提取的各评论观点的支持率进行计算,其中,j=1,2,…,m,表示集合中放入的主要评论信息对应的编号,m表示放入集合中的主要评论信息总数量,i=1,2,…,r,表示提取的评论观点对应的编号,r表示提取的评论观点的总数量,aji=0或aji=1,当aji=1时表示编号为j的主要评论信息支持编号为i的评论观点,当aji=0时表示编号为j的主要评论信息不支持编号为i的评论观点,bj表示与编号为j的主要评论信息匹配的次要评论信息总数,Fi表示集合中对编号为i的评论观点的支持率;
B.根据A中计算的对提取的各评论观点的支持率,对对应事件的舆论走向进行预测,具体的预测公式为:
E=∑W,rp=1,i=1[αp*(Fipi)];
其中,p=1,2,…,W,表示集合对应的编号,αp表示编号为p的集合对应的舆情分析角度所对应的比例系数,∑Wp=1αp=1,Fip表示集合p中对编号为i的评论观点的支持率,βi=0或βi=1,当βi=1时,表示编号为i的评论观点为正向评论,当βi=0时,表示编号为i的评论观点为负向评论,E表示对应事件的舆论走向参考值;
当0.6≤E≤1时,表示对应事件的舆论走向为正向,当0≤E<0.6时,表示对应事件的舆论走向为负向。
进一步的,所述S20包括:
S201:根据S102中在各时刻预测的对应事件的舆论走向参考值,对对应事件在各时刻的传播速率进行计算,传播速率=[(ET+t*(z-1)-ET+t*z)/(1-ET+t*(z-1))],其中,T表示获取对应事件中评论信息的初始时间,z表示获取对应事件中评论信息的次数,z≥2,ET+t*z表示对应事件在T+t*z时间点的舆论走向参考值;
S202:对对应事件在各时刻的转发情况和搜索情况进行获取,基于获取信息对对应事件在各时刻的传播程度进行预测,具体的预测公式为:
S=γ*(QT+t*z-QT+t*(z-1))+(1-γ)*(PT+t*z-PT+t*(z-1));
其中,γ表示比例系数,QT+t*z表示对应事件在T+t*z时间点的转发量,PT+t*z表示对应事件在T+t*z时间点的搜索量,S表示对应事件在T+t*z时间点的传播程度。
进一步的,所述S30根据S201中预测的对应事件在各时刻的传播速率,以及S202中预测的对应事件在各时刻的传播程度,对对应事件的舆情管理时间进行确定,具体的确定方法为:对对应事件在各时刻的传播速率和传播程度之间的乘积进行计算,对计算的乘积的最大值进行确定,以确定的最大值对应的时间作为对应事件的舆情管理时间。
一种基于大数据的舆情监测系统,所述系统包括舆情监测分析模块、舆情传播情况预测模块和舆情管理时间确定模块;
所述舆情监测分析模块用于对互联网上对应事件中的评论信息进行获取,对评论信息中的有用信息按照舆情分析角度进行分类,根据各类评论信息对对应事件的舆论走向情况进行预测,基于预测的舆论走向,判断是否对对应事件进行舆情监控,基于判断结果将预测的对应事件的舆论走向传输至舆情传播情况预测模块;
所述舆情传播情况预测模块用于对舆情监测分析模块传输的对应事件的舆论走向进行接收,基于接收信息,结合对应事件在各时刻的转发情况和搜索情况,对对应事件的传播情况进行预测,并将预测结果传输至舆情管理时间确定模块;
所述舆情管理时间确定模块用于对舆情传播情况预测模块传输的预测结果进行接收,基于接收信息,对对应事件的舆情管理时间进行确定。
进一步的,所述舆情监测分析模块包括信息划分单元、舆情分析角度确定单元、舆论走向预测单元和舆情监控单元;
所述信息划分单元以时间间隔t对互联网上对应事件中的评论信息进行获取,根据评论信息之间是否具有回复关系,将获取的评论信息分为主要评论信息和次要评论信息,判断主要评论信息和匹配的次要评论信息的评论观点是否一致,根据判断结果对次要评论信息进行相关处理,对主要评论信息与对应事件之间的关联程度进行获取,若关联程度低于设定阈值,则表示对应主要评论信息和匹配的次要评论信息为无用信息,将无用信息和评论信息中评论观点保持中立的评论信息删除,删除后剩余信息为有用信息,将有用信息传输至舆情分析角度确定单元和舆论走向预测单元;
所述舆情分析角度确定单元对信息划分单元传输的有用信息进行接收,根据接收的有用信息对对应事件的受争议点数量进行确定,对确定的受争议点进行随机组合,基于随机组合情况,对对应事件的舆情分析角度数量进行确定,并将确定的舆情分析角度数量传输至舆论走向预测单元;
所述舆论走向预测单元对舆情分析角度确定单元传输的舆情分析角度数量,以及信息划分单元传输的有用信息进行接收,将接收的有用信息按照舆情分析角度进行分类,将属于同一分类的主要评论信息放入同一集合中,根据集合中的主要评论信息和与集合中主要评论信息匹配的次要评论信息,对对应事件的舆论走向进行预测,并将预测结果传输至舆情监控单元,将舆论走向参考值传输至舆情传播情况预测模块;
所述舆情监控单元对舆论走向预测单元传输的预测结果进行接收,根据接收信息,选择是否对对应事件进行舆情监控,并将选择结果传输至舆情传播情况预测模块。
进一步的,所述舆情传播情况预测模块包括传播速率预测单元和传播程度预测单元;
所述传播速率预测单元对舆情监控单元传输的选择结果进行接收,若选择对对应事件进行舆情监控,则对舆论走向预测单元传输的舆论走向参考值进行接收,基于接收信息,对对应事件在各时刻的传播速率进行计算,并将计算结果传输至舆情管理时间确定模块,若选择不对对应事件进行舆情监控,则无需对舆论走向预测单元传输的舆论走向参考值进行接收;
所述传播程度预测单元对对应事件在各时刻的转发情况和搜索情况进行获取,基于获取信息对对应事件在各时刻的传播程度进行预测,并将预测的传播程度传输至舆情管理时间确定模块。
进一步的,所述舆情管理时间确定模块对传播速率预测单元传输的传播速率,以及传播程度预测单元传输的传播程度进行接收,基于接收信息,对对应事件的舆情管理时间进行确定。
与现有技术相比,本发明所达到的有益效果是:
1.本发明在对各事件进行舆情分析时,将各事件中的有用信息筛选出,提高了系统对舆情的分析效率,将筛选出的有用信息按照舆情分析角度进行分类分析,避免对有用信息进行分析时由于分析角度不同对有用信息的表达含义进行错误判断,进而削弱了信息之间的联系,降低了对事件的舆情分析效果。
2.本发明通过将各事件中的有用信息按照舆情分析角度进行分类分析,对属于同一分类的有用信息中提取的评论观点的支持率进行计算,基于计算结果实现对对应事件的舆论在走向进行预测,此过程实现对舆情事件的全面分析和监测,提高了系统的监测效果。
3.本发明通过预测的对应事件的舆论走向参考值,对对应事件在各时刻的传播速率和传播程度进行预测,基于预测值,对对应事件的舆情管理时间进行确定,保证对应事件在舆情不可控前对舆情进行正向引导。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种基于大数据的舆情监测系统及方法的工作流程示意图;
图2是本发明一种基于大数据的舆情监测系统及方法的工作原理结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1和图2,本发明提供技术方案:一种基于大数据的舆情监测方法,方法包括:
S10:基于大数据对互联网上对应事件中的评论信息进行获取,对评论信息中的有用信息按照舆情分析角度进行分类,根据各类评论信息对对应事件的舆论走向情况进行预测,基于预测的舆论走向,判断是否对对应事件进行舆情监控;
S10包括:
S101:以时间间隔t对互联网上对应事件中的评论信息进行获取,根据评论信息之间是否具有回复关系,将获取的评论信息分为主要评论信息和次要评论信息,主要评论信息表示无回复信息且自身非回复信息的评论信息,次要评论信息为主要评论信息的回复信息,判断主要评论信息和匹配的次要评论信息的评论观点是否一致,若不一致,则将匹配的次要评论信息修改为主要评论信息,或作为与其评论观点一致的主要评论信息的次要评论信息,若一致,则无需对次要评论信息进行修改,对主要评论信息与对应事件之间的关联程度进行获取,若关联程度低于设定阈值,则表示对应主要评论信息和匹配的次要评论信息为无用信息,将无用信息和评论信息中评论观点保持中立的评论信息删除,删除后剩余信息为有用信息;
S102:根据S101中的有用信息对对应事件的受争议点数量进行确定,对确定的受争议点进行随机组合,基于随机组合情况,对对应事件的舆情分析角度数量进行确定,具体的确定公式为:
W=∑n v=1{n!/[v*(n-v)!]};
其中,v=1,2,…,n,表示组合内受争议点的数量,n表示对应事件的受争议点总数量,n!表示n的阶乘,(n-v)!表示n-v的阶乘,W表示对应事件的舆情分析角度数量;
将S101中的有用信息按照舆情分析角度进行分类,将属于同一分类的主要评论信息放入同一集合中,根据集合中的主要评论信息和与集合中主要评论信息匹配的次要评论信息,对对应事件的舆论走向进行预测,具体的预测方法为:
A.对集合中主要评论信息的评论观点进行提取,利用公式Fi=[∑m,rj=1,i=1aji+∑m,rj=1,i=1 (aji*bj)]/(m+∑m j=1bj)对提取的各评论观点的支持率进行计算,其中,j=1,2,…,m,表示集合中放入的主要评论信息对应的编号,m表示放入集合中的主要评论信息总数量,i=1,2,…,r,表示提取的评论观点对应的编号,r表示提取的评论观点的总数量,aji=0或aji=1,当aji=1时表示编号为j的主要评论信息支持编号为i的评论观点,当aji=0时表示编号为j的主要评论信息不支持编号为i的评论观点,bj表示与编号为j的主要评论信息匹配的次要评论信息总数,Fi表示集合中对编号为i的评论观点的支持率;
B.根据A中计算的对提取的各评论观点的支持率,对对应事件的舆论走向进行预测,具体的预测公式为:
E=∑W,rp=1,i=1[αp*(Fipi)];
其中,p=1,2,…,W,表示集合对应的编号,αp表示编号为p的集合对应的舆情分析角度所对应的比例系数,∑Wp=1αp=1,Fip表示集合p中对编号为i的评论观点的支持率,βi=0或βi=1,当βi=1时,表示编号为i的评论观点为正向评论,当βi=0时,表示编号为i的评论观点为负向评论,E表示对应事件的舆论走向参考值;
当0.6≤E≤1时,表示对应事件的舆论走向为正向,当0≤E<0.6时,表示对应事件的舆论走向为负向;
S103:若对应事件的舆论走向为正向,则此时无需对对应事件进行舆情监控,若对应事件的舆论走向为负向,则此时需要对对应事件进行舆情监控;
S20:根据对应事件在各时刻的转发情况和搜索情况,以及S10中预测的对应事件的舆论走向情况,对对应事件的传播情况进行预测;
S20包括:
S201:根据S102中在各时刻预测的对应事件的舆论走向参考值,对对应事件在各时刻的传播速率进行计算,传播速率=[(ET+t*(z-1)-ET+t*z)/(1-ET+t*(z-1))],其中,T表示获取对应事件中评论信息的初始时间,z表示获取对应事件中评论信息的次数,z≥2,ET+t*z表示对应事件在T+t*z时间点的舆论走向参考值;
S202:对对应事件在各时刻的转发情况和搜索情况进行获取,基于获取信息对对应事件在各时刻的传播程度进行预测,具体的预测公式为:
S=γ*(QT+t*z-QT+t*(z-1))+(1-γ)*(PT+t*z-PT+t*(z-1));
其中,γ表示比例系数,QT+t*z表示对应事件在T+t*z时间点的转发量,PT+t*z表示对应事件在T+t*z时间点的搜索量,S表示对应事件在T+t*z时间点的传播程度;
S30:对对应事件的舆情管理时间进行确定;
S30根据S201中预测的对应事件在各时刻的传播速率,以及S202中预测的对应事件在各时刻的传播程度,对对应事件的舆情管理时间进行确定,具体的确定方法为:对对应事件在各时刻的传播速率和传播程度之间的乘积进行计算,对计算的乘积的最大值进行确定,以确定的最大值对应的时间作为对应事件的舆情管理时间。
一种基于大数据的舆情监测系统,系统包括舆情监测分析模块、舆情传播情况预测模块和舆情管理时间确定模块;
舆情监测分析模块用于对互联网上对应事件中的评论信息进行获取,对评论信息中的有用信息按照舆情分析角度进行分类,根据各类评论信息对对应事件的舆论走向情况进行预测,基于预测的舆论走向,判断是否对对应事件进行舆情监控,基于判断结果将预测的对应事件的舆论走向传输至舆情传播情况预测模块;
舆情监测分析模块包括信息划分单元、舆情分析角度确定单元、舆论走向预测单元和舆情监控单元;
信息划分单元以时间间隔t对互联网上对应事件中的评论信息进行获取,根据评论信息之间是否具有回复关系,将获取的评论信息分为主要评论信息和次要评论信息,判断主要评论信息和匹配的次要评论信息的评论观点是否一致,根据判断结果对次要评论信息进行相关处理,对主要评论信息与对应事件之间的关联程度进行获取,若关联程度低于设定阈值,则表示对应主要评论信息和匹配的次要评论信息为无用信息,将无用信息和评论信息中评论观点保持中立的评论信息删除,删除后剩余信息为有用信息,将有用信息传输至舆情分析角度确定单元和舆论走向预测单元;
舆情分析角度确定单元对信息划分单元传输的有用信息进行接收,根据接收的有用信息对对应事件的受争议点数量进行确定,对确定的受争议点进行随机组合,基于随机组合情况,对对应事件的舆情分析角度数量进行确定,并将确定的舆情分析角度数量传输至舆论走向预测单元;
舆论走向预测单元对舆情分析角度确定单元传输的舆情分析角度数量,以及信息划分单元传输的有用信息进行接收,将接收的有用信息按照舆情分析角度进行分类,将属于同一分类的主要评论信息放入同一集合中,根据集合中的主要评论信息和与集合中主要评论信息匹配的次要评论信息,对对应事件的舆论走向进行预测,并将预测结果传输至舆情监控单元,将舆论走向参考值传输至舆情传播情况预测模块;
舆情监控单元对舆论走向预测单元传输的预测结果进行接收,根据接收信息,选择是否对对应事件进行舆情监控,并将选择结果传输至舆情传播情况预测模块;
舆情传播情况预测模块用于对舆情监测分析模块传输的对应事件的舆论走向进行接收,基于接收信息,结合对应事件在各时刻的转发情况和搜索情况,对对应事件的传播情况进行预测,并将预测结果传输至舆情管理时间确定模块;
舆情传播情况预测模块包括传播速率预测单元和传播程度预测单元;
传播速率预测单元对舆情监控单元传输的选择结果进行接收,若选择对对应事件进行舆情监控,则对舆论走向预测单元传输的舆论走向参考值进行接收,基于接收信息,对对应事件在各时刻的传播速率进行计算,并将计算结果传输至舆情管理时间确定模块,若选择不对对应事件进行舆情监控,则无需对舆论走向预测单元传输的舆论走向参考值进行接收;
传播程度预测单元对对应事件在各时刻的转发情况和搜索情况进行获取,基于获取信息对对应事件在各时刻的传播程度进行预测,并将预测的传播程度传输至舆情管理时间确定模块;
舆情管理时间确定模块对传播速率预测单元传输的传播速率,以及传播程度预测单元传输的传播程度进行接收,基于接收信息,对对应事件的舆情管理时间进行确定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于大数据的舆情监测方法,其特征在于:所述方法包括:
S10:基于大数据对互联网上对应事件中的评论信息进行获取,对评论信息中的有用信息按照舆情分析角度进行分类,根据各类评论信息对对应事件的舆论走向情况进行预测,基于预测的舆论走向,判断是否对对应事件进行舆情监控;
所述S10包括:
S101:以时间间隔t对互联网上对应事件中的评论信息进行获取,根据评论信息之间是否具有回复关系,将获取的评论信息分为主要评论信息和次要评论信息,判断主要评论信息和匹配的次要评论信息的评论观点是否一致,若不一致,则将匹配的次要评论信息修改为主要评论信息,或作为与其评论观点一致的主要评论信息的次要评论信息,若一致,则无需对次要评论信息进行修改,对主要评论信息与对应事件之间的关联程度进行获取,若关联程度低于设定阈值,则表示对应主要评论信息和匹配的次要评论信息为无用信息,将无用信息和评论信息中评论观点保持中立的评论信息删除,删除后剩余信息为有用信息;
S102:根据S101中的有用信息对对应事件的受争议点数量进行确定,对确定的受争议点进行随机组合,基于随机组合情况,对对应事件的舆情分析角度数量进行确定,具体的确定公式为:
W=∑n v=1{n!/[v*(n-v)!]};
其中,v=1,2,…,n,表示组合内受争议点的数量,n表示对应事件的受争议点总数量,n!表示n的阶乘,(n-v)!表示n-v的阶乘,W表示对应事件的舆情分析角度数量;
将S101中的有用信息按照舆情分析角度进行分类,将属于同一分类的主要评论信息放入同一集合中,根据集合中的主要评论信息和与集合中主要评论信息匹配的次要评论信息,对对应事件的舆论走向进行预测;
S103:若对应事件的舆论走向为正向,则此时无需对对应事件进行舆情监控,若对应事件的舆论走向为负向,则此时需要对对应事件进行舆情监控;
S20:根据对应事件在各时刻的转发情况和搜索情况,以及S10中预测的对应事件的舆论走向情况,对对应事件的传播情况进行预测;
S30:对对应事件的舆情管理时间进行确定。
2.根据权利要求1所述的一种基于大数据的舆情监测方法,其特征在于:所述S102对对应事件的舆论走向进行预测的具体方法为;
A.对集合中主要评论信息的评论观点进行提取,利用公式Fi=[∑m,rj=1,i=1aji+∑m,rj=1,i=1 (aji*bj)]/(m+∑m j=1bj)对提取的各评论观点的支持率进行计算,其中,j=1,2,…,m,表示集合中放入的主要评论信息对应的编号,m表示放入集合中的主要评论信息总数量,i=1,2,…,r,表示提取的评论观点对应的编号,r表示提取的评论观点的总数量,aji=0或aji=1,当aji=1时表示编号为j的主要评论信息支持编号为i的评论观点,当aji=0时表示编号为j的主要评论信息不支持编号为i的评论观点,bj表示与编号为j的主要评论信息匹配的次要评论信息总数,Fi表示集合中对编号为i的评论观点的支持率;
B.根据A中计算的对提取的各评论观点的支持率,对对应事件的舆论走向进行预测,具体的预测公式为:
E=∑W,rp=1,i=1[αp*(Fipi)];
其中,p=1,2,…,W,表示集合对应的编号,αp表示编号为p的集合对应的舆情分析角度所对应的比例系数,∑Wp=1αp=1,Fip表示集合p中对编号为i的评论观点的支持率,βi=0或βi=1,当βi=1时,表示编号为i的评论观点为正向评论,当βi=0时,表示编号为i的评论观点为负向评论,E表示对应事件的舆论走向参考值;
当0.6≤E≤1时,表示对应事件的舆论走向为正向,当0≤E<0.6时,表示对应事件的舆论走向为负向。
3.根据权利要求2所述的一种基于大数据的舆情监测方法,其特征在于:所述S20包括:
S201:根据S102中在各时刻预测的对应事件的舆论走向参考值,对对应事件在各时刻的传播速率进行计算,传播速率=[(ET+t*(z-1)-ET+t*z)/(1-ET+t*(z-1))],其中,T表示获取对应事件中评论信息的初始时间,z表示获取对应事件中评论信息的次数,z≥2,ET+t*z表示对应事件在T+t*z时间点的舆论走向参考值;
S202:对对应事件在各时刻的转发情况和搜索情况进行获取,基于获取信息对对应事件在各时刻的传播程度进行预测,具体的预测公式为:
S=γ*(QT+t*z-QT+t*(z-1))+(1-γ)*(PT+t*z-PT+t*(z-1));
其中,γ表示比例系数,QT+t*z表示对应事件在T+t*z时间点的转发量,PT+t*z表示对应事件在T+t*z时间点的搜索量,S表示对应事件在T+t*z时间点的传播程度。
4.根据权利要求3所述的一种基于大数据的舆情监测方法,其特征在于:所述S30根据S201中预测的对应事件在各时刻的传播速率,以及S202中预测的对应事件在各时刻的传播程度,对对应事件的舆情管理时间进行确定,具体的确定方法为:对对应事件在各时刻的传播速率和传播程度之间的乘积进行计算,对计算的乘积的最大值进行确定,以确定的最大值对应的时间作为对应事件的舆情管理时间。
5.一种应用于权利要求1-4任一项所述的基于大数据的舆情监测方法的基于大数据的舆情监测系统,其特征在于:所述系统包括舆情监测分析模块、舆情传播情况预测模块和舆情管理时间确定模块;
所述舆情监测分析模块用于对互联网上对应事件中的评论信息进行获取,对评论信息中的有用信息按照舆情分析角度进行分类,根据各类评论信息对对应事件的舆论走向情况进行预测,基于预测的舆论走向,判断是否对对应事件进行舆情监控,基于判断结果将预测的对应事件的舆论走向传输至舆情传播情况预测模块;
所述舆情传播情况预测模块用于对舆情监测分析模块传输的对应事件的舆论走向进行接收,基于接收信息,结合对应事件在各时刻的转发情况和搜索情况,对对应事件的传播情况进行预测,并将预测结果传输至舆情管理时间确定模块;
所述舆情管理时间确定模块用于对舆情传播情况预测模块传输的预测结果进行接收,基于接收信息,对对应事件的舆情管理时间进行确定。
6.根据权利要求5所述的一种基于大数据的舆情监测系统,其特征在于:所述舆情监测分析模块包括信息划分单元、舆情分析角度确定单元、舆论走向预测单元和舆情监控单元;
所述信息划分单元以时间间隔t对互联网上对应事件中的评论信息进行获取,根据评论信息之间是否具有回复关系,将获取的评论信息分为主要评论信息和次要评论信息,判断主要评论信息和匹配的次要评论信息的评论观点是否一致,根据判断结果对次要评论信息进行相关处理,对主要评论信息与对应事件之间的关联程度进行获取,若关联程度低于设定阈值,则表示对应主要评论信息和匹配的次要评论信息为无用信息,将无用信息和评论信息中评论观点保持中立的评论信息删除,删除后剩余信息为有用信息,将有用信息传输至舆情分析角度确定单元和舆论走向预测单元;
所述舆情分析角度确定单元对信息划分单元传输的有用信息进行接收,根据接收的有用信息对对应事件的受争议点数量进行确定,对确定的受争议点进行随机组合,基于随机组合情况,对对应事件的舆情分析角度数量进行确定,并将确定的舆情分析角度数量传输至舆论走向预测单元;
所述舆论走向预测单元对舆情分析角度确定单元传输的舆情分析角度数量,以及信息划分单元传输的有用信息进行接收,将接收的有用信息按照舆情分析角度进行分类,将属于同一分类的主要评论信息放入同一集合中,根据集合中的主要评论信息和与集合中主要评论信息匹配的次要评论信息,对对应事件的舆论走向进行预测,并将预测结果传输至舆情监控单元,将舆论走向参考值传输至舆情传播情况预测模块;
所述舆情监控单元对舆论走向预测单元传输的预测结果进行接收,根据接收信息,选择是否对对应事件进行舆情监控,并将选择结果传输至舆情传播情况预测模块。
7.根据权利要求6所述的一种基于大数据的舆情监测系统,其特征在于:所述舆情传播情况预测模块包括传播速率预测单元和传播程度预测单元;
所述传播速率预测单元对舆情监控单元传输的选择结果进行接收,若选择对对应事件进行舆情监控,则对舆论走向预测单元传输的舆论走向参考值进行接收,基于接收信息,对对应事件在各时刻的传播速率进行计算,并将计算结果传输至舆情管理时间确定模块,若选择不对对应事件进行舆情监控,则无需对舆论走向预测单元传输的舆论走向参考值进行接收;
所述传播程度预测单元对对应事件在各时刻的转发情况和搜索情况进行获取,基于获取信息对对应事件在各时刻的传播程度进行预测,并将预测的传播程度传输至舆情管理时间确定模块。
8.根据权利要求7所述的一种基于大数据的舆情监测系统,其特征在于:所述舆情管理时间确定模块对传播速率预测单元传输的传播速率,以及传播程度预测单元传输的传播程度进行接收,基于接收信息,对对应事件的舆情管理时间进行确定。
CN202311002430.2A 2023-08-10 2023-08-10 一种基于大数据的舆情监测系统及方法 Pending CN116992146A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311002430.2A CN116992146A (zh) 2023-08-10 2023-08-10 一种基于大数据的舆情监测系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311002430.2A CN116992146A (zh) 2023-08-10 2023-08-10 一种基于大数据的舆情监测系统及方法

Publications (1)

Publication Number Publication Date
CN116992146A true CN116992146A (zh) 2023-11-03

Family

ID=88529976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311002430.2A Pending CN116992146A (zh) 2023-08-10 2023-08-10 一种基于大数据的舆情监测系统及方法

Country Status (1)

Country Link
CN (1) CN116992146A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117494897A (zh) * 2023-11-14 2024-02-02 西安康奈网络科技有限公司 一种单一舆情事件发展倾向性判断方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117494897A (zh) * 2023-11-14 2024-02-02 西安康奈网络科技有限公司 一种单一舆情事件发展倾向性判断方法
CN117494897B (zh) * 2023-11-14 2024-05-17 西安康奈网络科技有限公司 一种单一舆情事件发展倾向性判断方法

Similar Documents

Publication Publication Date Title
US20070198937A1 (en) Method for determining a profile of a user of a communication network
CN116992146A (zh) 一种基于大数据的舆情监测系统及方法
CN111797752A (zh) 违规视频检测方法、装置、设备及存储介质
CN112435469B (zh) 车辆预警控制方法、装置、计算机可读介质及电子设备
JP2006525604A (ja) 広い範囲のネットワーク検索においての検索リスティングのためのコンテンツ性能査定の最適化
CN112298844B (zh) 一种垃圾分类监督方法及装置
US8024336B2 (en) System and method for development of search success metrics
KR20210118634A (ko) 데이터 기반 콜센터 업무 효율 개선 시스템 및 그 방법
US20100082605A1 (en) System and method for deducing user interaction patterns based on limited activities
CN109033147B (zh) 一种数据展示方法、终端和计算机可存储介质
CN116452212B (zh) 一种智能客服商品知识库信息管理方法及系统
JP3182169B2 (ja) 故障診断方法
CN117082113A (zh) 一种基于数据融合的分布式设备监测系统及方法
CN115409553B (zh) 一种基于大数据和位置信息的广告投放系统及其方法
CN114154018B (zh) 一种面向无人系统的云边协同视频流处理方法及系统
CN113379257A (zh) 一种销售线索自动智能分配的方法
US7260642B2 (en) Method and system for real-time monitoring image transmission
CN115795143B (zh) 一种基于计算机的信息评价系统及方法
CN116582452B (zh) 流量分类方法、装置、设备及介质
CN117278948B (zh) 一种企业短信的短信类型判别系统及方法
KR102155866B1 (ko) 반려 사유 기반의 작업자 모니터링 방법 및 장치
CN116152567A (zh) 一种图像序列识别方法、装置、设备、存储介质及产品
CN117576896A (zh) 一种融合公共交通系统的行车数据管控方法及装置
CN118113981A (zh) 微服务数据的采样处理方法及装置、非易失性存储介质
JP2007323504A (ja) プロセス解析システムおよびプロセス解析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination