CN109165340A - 网络舆情监测系统 - Google Patents
网络舆情监测系统 Download PDFInfo
- Publication number
- CN109165340A CN109165340A CN201810798409.0A CN201810798409A CN109165340A CN 109165340 A CN109165340 A CN 109165340A CN 201810798409 A CN201810798409 A CN 201810798409A CN 109165340 A CN109165340 A CN 109165340A
- Authority
- CN
- China
- Prior art keywords
- unit
- data
- public
- opinion
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种网络舆情监测系统,包括数据采集单元,智能爬取单元,数据提取单元,权重分配单元和舆情分析单元;数据采集单元用于筛选网络页面;智能爬取单元用于筛选出的网络页面进行数据爬取;数据提取单元用于进行数据提取、输出页面数据;权重分配单元用于对输出的页面数据作出倾向性判定并赋予倾向权重值;舆情分析单元用于计算舆情评估值、作出整体舆情倾向性判断。本发明结构简单,易于实现。能够帮助用户准确捕捉网络舆情信息,在海量数据中实时把握网络舆情导向,有助于用户在网络端建设品牌形象,第一时间对负面舆情作出应对。
Description
技术领域
本发明属于互联网信息处理技术领域,具体来说涉及一种网络舆情监测系统。
背景技术
随着技术的进步,网络媒体已经发展为继报纸、广播、电视之后的第四媒体。由于互联网具有虚拟性、隐蔽性、发散性和的特点,越来越多的网民开始习惯于在各大网络平台表达观点、传递思想。对企业来说,如何准确把握网络上的舆情风向,及时发现负面舆论导向并采取具有针对性的对策,及时挽救和维护自身企业的网络品牌形象,成为企业公关部门的一个重要课题。因此,如何开发出一种网络舆情监测系统,能够提高捕捉网络舆情信息的准确性和及时性,帮助企业完成在各大网络平台上的品牌形象建设,有效防止网络水军对舆情的误导,是本领域技术人员需要研究的方向。
发明内容
本发明的目的是提供一种网络舆情检测系统,能够准确捕捉网络舆情信息,在海量数据中实时把握网络舆情导向,有助于企业在网络端建设品牌形象,第一时间对负面舆情作出应对。
其采用的技术方案如下:
一种网络舆情监测系统,其包括数据采集单元,智能爬取单元,数据提取单元,权重分配单元和舆情分析单元;所述数据采集单元用于用户登录和设置关键词、并根据该关键词从指定网络平台上筛选包含该关键词的网络页面;所述智能爬取单元连接数据采集单元,用于对数据采集单元所筛选出的网络页面进行数据爬取、根据预定义事件过滤掉该网络页面上与关键词无关的页面数据;所述数据提取单元连接智能爬取单元,用于对智能爬取单元处理后输出的网络页面进行数据提取、输出页面数据;所述权重分配单元内设有比对词库;所述比对词库内存储有常用褒义词和常用贬义词;所述权重分配单元连接数据提取单元,用于将数据提取单元提取后输出的页面数据与比对词库进行比对并作出倾向性判定、并根据判定结果对页面数据赋予倾向权重值;所述舆情分析单元连接倾向性单元,用于计算对关键词的舆情评估值、作出整体舆情倾向性判断。
通过采用这种技术方案:首先,用户登录数据采集单元输入想要检测的事件的关键词,数据采集单元根据关键词从各大网络社交平台上截取相关的页面,实现数据的采集。第二步:通过智能爬取单元进行数据爬取,过滤掉与关键词无关的内容,从而删除网络页面中的不相关信息,以减少后继流程的工作量。第三步,以数据提取单元进行数据提取,将网络页面的信息整合为页面数据,方便量化评估。第四步,权重分配单元将输出的页面数据与比对词库进行比对并作出倾向性判定、对各个页面数据相应赋予倾向权重值。最后,舆情分析单元统计各被赋予权重值得页面数据,按照预设的计算公式计算对当前关键词的舆情评估值、作出整体舆情倾向性判断:当该评估值的绝对值越大,说明舆情倾向性越强(包括强烈正面或强烈负面);而当该评估值的绝对值越小,说明舆情倾向性越趋向中庸。
优选的是,上述网络舆情监测系统中:所述舆情分析单元的计算模型为:T=(t1+t2+t3+...tn)/n,所述T为舆情评估值,所述t1,t2,t3...tn均为页面数据的倾向权重值。
通过采用这种技术方案:以加权求和、且对所有页面数据设置的权重比皆一致的方式实现对页面数据的舆情评估,这种计算方式公式最为简单明了,对系统的计算资源消耗最低。同时在采样较大的前提下,也能较为客观的反映对事件关键词的整体舆情走向。
更优选的是,上述如权利要求所述网络舆情监测系统,其特征在于:所述n≥0。
通过采用这种技术方案:仅当对关键词的相关页面数据超过10条以上时才进行对关键词的舆情判断,而当相关页面数据低于10条时默认舆情无明显倾向。从而避免了大量无谓的运算,节约了用户的时间,也节约了系统的运算资源。
更优选的是,上述网络舆情监测系统中:还包括报警单元,所述报警单元中写有报警阈值,所述报警单元连接舆情分析单元、用于比对报警阈值与舆情评估值,并在舆情评估值达到报警阈值时对用户输出舆情报警通知。
通过采用这种技术方案:当输入关键词一段时间之后,舆情评估值发生了明显变化尤其是达到了报警阈值对用户进行报警通知,使用户无需时时输入关键词查询,节约了用户的大量时间。实现积极帮助用户在第一时间发现舆情负面倾向的技术效果。
进一步优选的是,上述网络舆情监测系统中:还包括数据过滤单元,所述数据过滤单元内保存有频率阈值,所述数据过滤单元连接数据提取单元、用于对数据提取单元输出的页面数据进行去重预处理、过滤掉出现频率低于频率阈值的页面数据。
通过采用这种技术方案:将出现频率过低、不利于舆情倾向性计算判断的页面数据排除出权重分配单元和舆情分析单元的计算范围,提高了运算的效率,增加运算结果的稳定性。
更进一步优选的是,上述网络舆情监测系统中:还包括舆情过滤单元,所述舆情过滤单元连接数据提取单元、用于对数据提取单元输出的页面数据进行过滤预处理、过滤掉同一登录ID上传的重复页面数据。
通过采用这种技术方案:针对现今网络中普遍存在的同一个ID反复多次就同一关键词连续表达舆情意见的情况,排除该ID的重复意见表达。无论其发言多少,皆作为单个舆情意见进行计算,大大提升了舆情分析单元的运算准确性,防止舆情判断被刷版的网络水军所误导。
更进一步优选的是,上述网络舆情监测系统中:还包括数据追踪单元,所述数据追踪单元内存有追踪阈值,所述数据追踪单元连接舆情过滤单元,用于跟踪同一登录ID的数据上传次数、在该数据上传次数达到追踪阈值时追踪该登录ID相关的地址,并对用户输出该追踪结果。
通过采用这种技术方案:同样是针对同一个ID反复多次就同一关键词连续表达舆情意见的情况,当其表达意见的次数达到追踪阈值时,判定其发言频率属于不正常范围,怀疑为网络水军,追踪器ID地址,查询类似情况的ID是否属于同一地址从而判断其出是否是有组织的水军行为,并将追踪结果反馈给用户。这样,有助于用户在针对网络水军进行舆情误导时能够言之有物,有理有据的进行意见反驳,维护自身的品牌形象。
与现有技术相比,本发明能够准确捕捉网络舆情信息,在海量数据中实时把握网络舆情导向,有助于企业在网络端建设品牌形象,第一时间对负面舆情作出应对,防止网络水军对舆情做出误导。
附图说明
下面结合附图与具体实施方式对本发明作进一步详细的说明:
图1为实施例1的结构示意图;
各附图标记与部件名称对应关系如下:
1、数据采集单元;2、智能爬取单元;3、数据提取单元;4、权重分配单元;5、舆情分析单元;6、报警单元;7、数据过滤单元;8、舆情过滤单元;9、数据追踪单元。
具体实施方式
为了更清楚地说明本发明的技术方案,下面将结合各个实施例作进一步描述。
如图1所示为实施例1:
一种网络舆情监测系统,其包括数据采集单元1,智能爬取单元2,数据提取单元3,权重分配单元4,舆情分析单元5,报警单元6,数据过滤单元7,舆情过滤单元8和数据追踪单元9。
其中:所述数据采集单元1用于用户登录和设置关键词、并根据该关键词从指定网络平台上筛选包含该关键词的网络页面;所述智能爬取单元2连接数据采集单元1,用于对数据采集单元1所筛选出的网络页面进行数据爬取、根据预定义事件过滤掉该网络页面上与关键词无关的页面数据;所述数据提取单元3连接智能爬取单元2,用于对智能爬取单元2处理后输出的网络页面进行数据提取、输出页面数据;所述权重分配单元4内设有比对词库;所述比对词库内存储有常用褒义词和常用贬义词;所述权重分配单元4连接数据提取单元3,用于将数据提取单元3提取后输出的页面数据与比对词库进行比对并作出倾向性判定、并根据判定结果对页面数据赋予倾向权重值;所述舆情分析单元5连接倾向性单元4,用于计算对关键词的舆情评估值、作出整体舆情倾向性判断。所述舆情分析单元5的计算模型为:T=(t1+t2+t3+...tn)/n,所述T为舆情评估值,所述t1,t2,...tn均为页面数据的倾向权重值。所述n≥10。所述报警单元6中写有报警阈值,所述报警单元连接舆情分析单元5、用于比对报警阈值与舆情评估值,并在舆情评估值达到报警阈值时对用户输出舆情报警通知。一般来说,报警阈值设置为-10~-20之间。客户可以通过登录报警单元6对报警阈值进行自行调整。所述数据过滤单元7内保存有频率阈值,所述数据过滤单元7连接数据提取单元3、用于对数据提取单元3输出的页面数据进行去重预处理、过滤掉出现频率低于频率阈值的页面数据。一般来说,频率阈值设置为1-2。所述舆情过滤单元8连接数据提取单元3、用于对数据提取单元3输出的页面数据进行过滤预处理、过滤掉同一登录ID上传的重复页面数据。所述数据追踪单元9内存有追踪阈值,所述数据追踪单元9连接舆情过滤单元8,用于跟踪同一登录ID的数据上传次数、在该数据上传次数达到追踪阈值时追踪该登录ID相关的地址,并对用户输出该追踪结果。
以上所述,仅为本发明的具体实施例,但本发明的保护范围并不局限于此,任何熟悉本领域技术的技术人员在本发明公开的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围以权利要求书的保护范围为准。
Claims (7)
1.一种网络舆情监测系统,其特征在于:包括数据采集单元(1),智能爬取单元(2),数据提取单元(3),权重分配单元(4)和舆情分析单元(5);
所述数据采集单元(1)用于用户登录和设置关键词、并根据该关键词从指定网络平台上筛选包含该关键词的网络页面;
所述智能爬取单元(2)连接数据采集单元(1),用于对数据采集单元(1)所筛选出的网络页面进行数据爬取、根据预定义事件过滤掉该网络页面上与关键词无关的页面数据;
所述数据提取单元(3)连接智能爬取单元(2),用于对智能爬取单元(2)处理后输出的网络页面进行数据提取、输出页面数据;
所述权重分配单元(4)内设有比对词库;所述比对词库内存储有常用褒义词和常用贬义词;所述权重分配单元(4)连接数据提取单元(3),用于将数据提取单元(3)提取后输出的页面数据与比对词库进行比对并作出倾向性判定、并根据判定结果对页面数据赋予倾向权重值;
所述舆情分析单元(5)连接倾向性单元(4),用于计算对关键词的舆情评估值、作出整体舆情倾向性判断。
2.如权利要求1所述网络舆情监测系统,其特征在于:所述舆情分析单元(5)的计算模型为:T=(t1+t2+t3+...tn)/n,所述T为舆情评估值,所述t1,t2,t3...tn均为页面数据的倾向权重值。
3.如权利要求2所述网络舆情监测系统,其特征在于:所述n≥10。
4.如权利要求1-3任一项所述网络舆情监测系统,其特征在于:还包括报警单元(6),所述报警单元(6)中写有报警阈值,所述报警单元连接舆情分析单元(5)、用于比对报警阈值与舆情评估值,并在舆情评估值达到报警阈值时对用户输出舆情报警通知。
5.如权利要求4所述网络舆情监测系统,其特征在于:还包括数据过滤单元(7),所述数据过滤单元(7)内保存有频率阈值,所述数据过滤单元(7)连接数据提取单元(3)、用于对数据提取单元(3)输出的页面数据进行去重预处理、过滤掉出现频率低于频率阈值的页面数据。
6.如权利要求4所述网络舆情监测系统,其特征在于:还包括舆情过滤单元(8),所述舆情过滤单元(8)连接数据提取单元(3)、用于对数据提取单元(3)输出的页面数据进行过滤预处理、过滤掉同一登录ID上传的重复页面数据。
7.如权利要求6所述网络舆情监测系统,其特征在于:还包括数据追踪单元(9),所述数据追踪单元(9)内存有追踪阈值,所述数据追踪单元(9)连接舆情过滤单元(8),用于跟踪同一登录ID的数据上传次数、在该数据上传次数达到追踪阈值时追踪该登录ID相关的地址,并对用户输出该追踪结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810798409.0A CN109165340A (zh) | 2018-07-19 | 2018-07-19 | 网络舆情监测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810798409.0A CN109165340A (zh) | 2018-07-19 | 2018-07-19 | 网络舆情监测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109165340A true CN109165340A (zh) | 2019-01-08 |
Family
ID=64897857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810798409.0A Pending CN109165340A (zh) | 2018-07-19 | 2018-07-19 | 网络舆情监测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109165340A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993448A (zh) * | 2019-04-08 | 2019-07-09 | 湖北风口网络科技有限公司 | 一种企业网络舆情潜在风险的评估方法及系统 |
CN110263238A (zh) * | 2019-06-21 | 2019-09-20 | 浙江华坤道威数据科技有限公司 | 一种基于大数据的舆情聆听系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408157A (zh) * | 2014-12-05 | 2015-03-11 | 四川诚品电子商务有限公司 | 一种网络舆情漏斗式数据采集分析推送系统及方法 |
CN105677802A (zh) * | 2015-12-31 | 2016-06-15 | 宁波公众信息产业有限公司 | 一种互联网信息分析系统 |
CN106022938A (zh) * | 2016-06-02 | 2016-10-12 | 北京奇艺世纪科技有限公司 | 社交网络的用户社团划分方法和装置 |
CN106250363A (zh) * | 2016-07-15 | 2016-12-21 | 合肥指南针电子科技有限责任公司 | 一种舆情监控分析方法 |
-
2018
- 2018-07-19 CN CN201810798409.0A patent/CN109165340A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408157A (zh) * | 2014-12-05 | 2015-03-11 | 四川诚品电子商务有限公司 | 一种网络舆情漏斗式数据采集分析推送系统及方法 |
CN105677802A (zh) * | 2015-12-31 | 2016-06-15 | 宁波公众信息产业有限公司 | 一种互联网信息分析系统 |
CN106022938A (zh) * | 2016-06-02 | 2016-10-12 | 北京奇艺世纪科技有限公司 | 社交网络的用户社团划分方法和装置 |
CN106250363A (zh) * | 2016-07-15 | 2016-12-21 | 合肥指南针电子科技有限责任公司 | 一种舆情监控分析方法 |
Non-Patent Citations (2)
Title |
---|
徐会杰: "《面向网络论坛的虚假舆情监测与抑制算法研究》", 《中国博士学位论文全文数据库 信息科技辑》 * |
杨艳: "《网络热点话题趋势分析及预测研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993448A (zh) * | 2019-04-08 | 2019-07-09 | 湖北风口网络科技有限公司 | 一种企业网络舆情潜在风险的评估方法及系统 |
CN110263238A (zh) * | 2019-06-21 | 2019-09-20 | 浙江华坤道威数据科技有限公司 | 一种基于大数据的舆情聆听系统 |
CN110263238B (zh) * | 2019-06-21 | 2021-10-15 | 浙江华坤道威数据科技有限公司 | 一种基于大数据的舆情聆听系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109033200B (zh) | 事件抽取的方法、装置、设备及计算机可读介质 | |
US8312035B2 (en) | Search engine enhancement using mined implicit links | |
CN104967629A (zh) | 网络攻击检测方法及装置 | |
CN110351244A (zh) | 一种基于多卷积神经网络融合的网络入侵检测方法及系统 | |
CN104809252B (zh) | 互联网数据提取系统 | |
CN112488716B (zh) | 一种异常事件检测系统 | |
CN108319672B (zh) | 基于云计算的移动终端不良信息过滤方法及系统 | |
WO2011152971A2 (en) | Research mission identification | |
CN112839014B (zh) | 建立识别异常访问者模型的方法、系统、设备及介质 | |
CN109165340A (zh) | 网络舆情监测系统 | |
CN104572877A (zh) | 游戏舆情的检测方法及系统 | |
Hruby | Using similarity measures in benthic impact assessments | |
CN114124484B (zh) | 网络攻击识别方法、系统、装置、终端设备以及存储介质 | |
CN104809253B (zh) | 互联网数据分析系统 | |
CN115392351A (zh) | 风险用户识别方法、装置、电子设备及存储介质 | |
Kumar et al. | Using folksonomies for building user interest profile | |
CN111814019A (zh) | 一种基于人工智能语义分析的政务公开评估系统 | |
Bhuvaneswari et al. | Identifying event bursts using log-normal distribution of tweet arrival rate in twitter stream | |
CN115689064B (zh) | 病害预测方法、装置、电子设备和存储介质 | |
CN114610982B (zh) | 一种计算机网络数据采集分析管理方法、设备及存储介质 | |
CN117596081B (zh) | 一种基于机器学习的社区爬虫行为识别方法及系统 | |
CN116701729B (zh) | 一种网络舆情检测系统及检测方法 | |
CAI et al. | A Method for Constructing Open-Domain Chinese Entity Hypernym Hierarchical Structure | |
CN113612765B (zh) | 一种网站检测方法、装置、计算机设备和存储介质 | |
CN116434972B (zh) | 一种提升畜禽疫病综合防控能力的系统及实现方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190108 |
|
WD01 | Invention patent application deemed withdrawn after publication |