CN107590193A - 一种政务舆情监测管理系统 - Google Patents
一种政务舆情监测管理系统 Download PDFInfo
- Publication number
- CN107590193A CN107590193A CN201710692443.5A CN201710692443A CN107590193A CN 107590193 A CN107590193 A CN 107590193A CN 201710692443 A CN201710692443 A CN 201710692443A CN 107590193 A CN107590193 A CN 107590193A
- Authority
- CN
- China
- Prior art keywords
- module
- public
- analysis
- management system
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种政务舆情监测管理系统,数据采集单元为自动网络爬虫模块,数据采集单元获取采集信息后从互联网中采集舆情信息;数据采集单元包括自动聚类模块和自动分类模块;舆情信息数据库用于接入外围系统数据,并对外提供API访问接口,舆情信息数据库包括自动摘要模块和实体抽取模块;舆情分析单元用于对舆情信息汇总后计算,舆情分析单元包括情感倾向分析模块和相似分析模块。本发明公开了一种政务舆情监测管理系统,整合互联网信息采集技术及信息智能处理技术,通过对互联网海量信息自动抓取采集、准确地筛选关键舆情信息,分析结果,为主管部门全面掌握网民、群众的网络舆情动态,做出正确舆论引导,为领导决策提供分析依据。
Description
技术领域
本发明属于舆情监测技术领域,特别是涉及一种政务舆情监测管理系统。
背景技术
舆情是“舆论情况”的简称,是指在一定的社会空间内,围绕中介性社会 事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度。它 是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等 表现的总和。网络舆情是社会舆情在互联网空间的映射,是社会舆情的直接反 映。
发明内容
本发明的目的在于提供一种政务舆情监测管理系统,为主管部门全面掌握 网民、群众的网络舆情动态,做出正确舆论引导,为领导决策提供分析依据。
本发明的目的可以通过以下技术方案实现:
一种政务舆情监测管理系统,包括数据采集单元、舆情信息数据库、舆情 分析单元;
所述数据采集单元为自动网络爬虫模块,所述数据采集单元获取采集信息 后从互联网中采集舆情信息;
所述数据采集单元包括自动聚类模块和自动分类模块,所述自动聚类模块 对采集的互联网数据进行自动聚类,所述自动分类模块对采集的文档进行分类, 并对分类后的文档赋予类别主题词;
所述舆情信息数据库用于接入外围系统数据,并对外提供API访问接口, 其中,所述舆情信息数据库包括自动摘要模块和实体抽取模块;
所述舆情分析单元用于对舆情信息汇总后计算,所述舆情分析单元包括情 感倾向分析模块和相似分析模块。
进一步地,所述采集信息包括采集目标、舆情关键词和采集频率。
进一步地,所述自动摘要模块获取原始处理后的文本,并对句子词语权重 计算,之后对原文中所有句子按权重值高低进行降序排列,并提取一句或多句 权重值最高的句子作为文摘句根据原文中的顺序输出。
进一步地,所述实体抽取模块用于识别并提取文本中的实体信息,所述实 体信息包括人名、地名、机构名、专有名词。
进一步地,所述相似分析模块用于对待测文本和文本库中已存储的文本进 行相似度分析。
进一步地,所述情感倾向分析模块用于判断负面信息并对负面信息进行划 分。
本发明的有益效果:
本发明公开了一种政务舆情监测管理系统,整合互联网信息采集技术及信 息智能处理技术,通过对互联网海量信息自动抓取采集、自动分类聚类、主题 检测、专题聚焦,准确地筛选关键舆情信息,形成简报、报告、图表等分析结 果,为主管部门全面掌握网民、群众的网络舆情动态,做出正确舆论引导,为 领导决策提供分析依据。
附图说明
下面结合附图和具体实施例对本发明作进一步详细描述。
图1是本发明系统结构示意图。
具体实施方式
一种政务舆情监测管理系统,包括数据采集单元、舆情信息数据库、舆情 分析单元;
所述数据采集单元为自动网络爬虫模块,数据采集单元获取采集信息后从 互联网中采集舆情信息,其中采集信息包括采集目标、舆情关键词和采集频率;
其中所述数据采集单元包括自动聚类模块和自动分类模块;
所述自动聚类模块对采集的互联网数据进行自动聚类,较优的,自动聚类 模块根据文本内容相似度将文本内容聚合成不同类别,并对每一个所述类别生 成类别主题词;
较优的,自动聚类包括如下步骤:特征提取;建立聚类相似矩阵;用算法 进行聚类;
所述自动分类模块对采集的文档进行分类,并对分类后的文档赋予类别主 题词;
所述舆情信息数据库用于接入外围系统数据,并对外提供API访问接口, 其中,舆情信息数据库包括自动摘要模块和实体抽取模块,数据信息通过自动 摘要模块和实体抽取模块加工后存储进入舆情信息数据库;
所述自动摘要模块获取原始处理后的文本,并对句子词语权重计算,之后 对原文中所有句子按权重值高低进行降序排列,并提取一句或多句权重值最高 的句子作为文摘句根据原文中的顺序输出;
较优的,所述词语权重计算为自动摘要模块对句子中关键词进行词频统计;
较优的,词语权重计算遵循的标准包括,句子权重与句中所含关键词的数 量成正比;文本信息中包含提示词,则提高句子权重;文本信息中特殊位置上 的句子权重增加;若句子中包含废弃指示词则句子权重减小;句子长度与句子 权重成反比;
所述实体抽取模块用于识别并提取文本中的实体信息,所述实体信息包括 人名、地名、机构名、专有名词;
所述舆情分析单元用于对舆情信息汇总后计算;
舆情分析单元包括情感倾向分析模块和相似分析模块;
其中,所述相似分析模块用于对待测文本和文本库中已存储的文本进行相 似度分析;
所述情感倾向分析模块用于判断负面信息并对负面信息进行划分,相似分 析模块包括主体词和负面行为词,较优的,情感倾向分析模块查找主体词后, 根据主体词前后几个词判断是否是为负面行为词,并根据主体词识别负面行为 词从而让计算相关度,对多个句子的相关度进行汇总后得到整段文字的负面性。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术 人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代, 只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明 的保护范围。
Claims (6)
1.一种政务舆情监测管理系统,其特征在于,包括数据采集单元、舆情信息数据库、舆情分析单元;
所述数据采集单元为自动网络爬虫模块,所述数据采集单元获取采集信息后从互联网中采集舆情信息;
所述数据采集单元包括自动聚类模块和自动分类模块,所述自动聚类模块对采集的互联网数据进行自动聚类,所述自动分类模块对采集的文档进行分类,并对分类后的文档赋予类别主题词;
所述舆情信息数据库用于接入外围系统数据,并对外提供API访问接口,其中,所述舆情信息数据库包括自动摘要模块和实体抽取模块;
所述舆情分析单元用于对舆情信息汇总后计算,所述舆情分析单元包括情感倾向分析模块和相似分析模块。
2.根据权利要求1所述的一种政务舆情监测管理系统,其特征在于:所述采集信息包括采集目标、舆情关键词和采集频率。
3.根据权利要求1所述的一种政务舆情监测管理系统,其特征在于:所述自动摘要模块获取原始处理后的文本,并对句子词语权重计算,之后对原文中所有句子按权重值高低进行降序排列,并提取一句或多句权重值最高的句子作为文摘句根据原文中的顺序输出。
4.根据权利要求1所述的一种政务舆情监测管理系统,其特征在于:所述实体抽取模块用于识别并提取文本中的实体信息,所述实体信息包括人名、地名、机构名、专有名词。
5.根据权利要求1所述的一种政务舆情监测管理系统,其特征在于:所述相似分析模块用于对待测文本和文本库中已存储的文本进行相似度分析。
6.根据权利要求1所述的一种政务舆情监测管理系统,其特征在于:所述情感倾向分析模块用于判断负面信息并对负面信息进行划分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710692443.5A CN107590193A (zh) | 2017-08-14 | 2017-08-14 | 一种政务舆情监测管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710692443.5A CN107590193A (zh) | 2017-08-14 | 2017-08-14 | 一种政务舆情监测管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107590193A true CN107590193A (zh) | 2018-01-16 |
Family
ID=61042261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710692443.5A Pending CN107590193A (zh) | 2017-08-14 | 2017-08-14 | 一种政务舆情监测管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107590193A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108399194A (zh) * | 2018-01-29 | 2018-08-14 | 中国科学院信息工程研究所 | 一种网络威胁情报生成方法及系统 |
CN108932291A (zh) * | 2018-05-23 | 2018-12-04 | 福建亿榕信息技术有限公司 | 电网舆情评价方法、存储介质及计算机 |
CN108984667A (zh) * | 2018-06-29 | 2018-12-11 | 郑州中博奥信息技术有限公司 | 一种舆情监测系统 |
CN109213928A (zh) * | 2018-07-23 | 2019-01-15 | 武汉网信安全技术股份有限公司 | 一种基于大数据的智慧城管系统和方法 |
CN110472119A (zh) * | 2019-07-17 | 2019-11-19 | 广东鼎义互联科技股份有限公司 | 一种应用于政务舆情分析平台 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408883A (zh) * | 2008-11-24 | 2009-04-15 | 电子科技大学 | 一种网络舆情观点收集方法 |
CN101446940A (zh) * | 2007-11-27 | 2009-06-03 | 北京大学 | 为文档集自动生成摘要的方法及装置 |
CN101751458A (zh) * | 2009-12-31 | 2010-06-23 | 暨南大学 | 一种网络舆情监控系统及方法 |
CN102546771A (zh) * | 2011-12-27 | 2012-07-04 | 西安博构电子信息科技有限公司 | 基于特征模型的云挖掘网络舆情监测系统 |
CN102708096A (zh) * | 2012-05-29 | 2012-10-03 | 代松 | 一种基于语义的网络智能舆情监测系统及其工作方法 |
CN104794161A (zh) * | 2015-03-24 | 2015-07-22 | 浪潮集团有限公司 | 对网络舆情监控的方法 |
-
2017
- 2017-08-14 CN CN201710692443.5A patent/CN107590193A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101446940A (zh) * | 2007-11-27 | 2009-06-03 | 北京大学 | 为文档集自动生成摘要的方法及装置 |
CN101408883A (zh) * | 2008-11-24 | 2009-04-15 | 电子科技大学 | 一种网络舆情观点收集方法 |
CN101751458A (zh) * | 2009-12-31 | 2010-06-23 | 暨南大学 | 一种网络舆情监控系统及方法 |
CN102546771A (zh) * | 2011-12-27 | 2012-07-04 | 西安博构电子信息科技有限公司 | 基于特征模型的云挖掘网络舆情监测系统 |
CN102708096A (zh) * | 2012-05-29 | 2012-10-03 | 代松 | 一种基于语义的网络智能舆情监测系统及其工作方法 |
CN104794161A (zh) * | 2015-03-24 | 2015-07-22 | 浪潮集团有限公司 | 对网络舆情监控的方法 |
Non-Patent Citations (1)
Title |
---|
熊理: "网络舆情监控系统的研究与设计", 《万方数据》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108399194A (zh) * | 2018-01-29 | 2018-08-14 | 中国科学院信息工程研究所 | 一种网络威胁情报生成方法及系统 |
CN108932291A (zh) * | 2018-05-23 | 2018-12-04 | 福建亿榕信息技术有限公司 | 电网舆情评价方法、存储介质及计算机 |
CN108932291B (zh) * | 2018-05-23 | 2022-08-23 | 福建亿榕信息技术有限公司 | 电网舆情评价方法、存储介质及计算机 |
CN108984667A (zh) * | 2018-06-29 | 2018-12-11 | 郑州中博奥信息技术有限公司 | 一种舆情监测系统 |
CN109213928A (zh) * | 2018-07-23 | 2019-01-15 | 武汉网信安全技术股份有限公司 | 一种基于大数据的智慧城管系统和方法 |
CN110472119A (zh) * | 2019-07-17 | 2019-11-19 | 广东鼎义互联科技股份有限公司 | 一种应用于政务舆情分析平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107590193A (zh) | 一种政务舆情监测管理系统 | |
CN112581006B (zh) | 筛选舆情信息及监测企业主体风险等级的舆情系统及方法 | |
Nguyen et al. | Automatic image filtering on social networks using deep learning and perceptual hashing during crises | |
CN108073569B (zh) | 一种基于多层级多维度语义理解的法律认知方法、装置和介质 | |
CN106202561B (zh) | 基于文本大数据的数字化应急管理案例库构建方法及装置 | |
CN107045524B (zh) | 一种网络文本舆情分类的方法及系统 | |
CN109299271B (zh) | 训练样本生成、文本数据、舆情事件分类方法及相关设备 | |
CN111950273A (zh) | 基于情感信息抽取分析的网络舆情突发事件自动识别方法 | |
CN101692639A (zh) | 一种基于url的不良网页识别方法 | |
CN108733791B (zh) | 网络事件检测方法 | |
CN110737821B (zh) | 相似事件查询的方法、装置、存储介质和终端设备 | |
Whitney et al. | Don’t want to get caught? don’t say it: The use of emojis in online human sex trafficking ads | |
CN114896305A (zh) | 一种基于大数据技术的智慧互联网安全平台 | |
KR102334236B1 (ko) | 음성 변환 Text Data에서 의미있는 키워드 추출 방법과 활용 | |
CN109918648B (zh) | 一种基于动态滑动窗口特征评分的谣言深度检测方法 | |
CN113378565A (zh) | 多源数据融合的事件分析方法、装置、设备及存储介质 | |
CN104809252A (zh) | 互联网数据提取系统 | |
CN109558587A (zh) | 一种针对类别分布不平衡的舆论倾向性识别的分类方法 | |
CN110830607A (zh) | 域名分析方法、装置和电子设备 | |
WO2011109195A1 (en) | System and associated method for determining and applying sociocultural characteristics | |
CN109471934B (zh) | 基于互联网的金融风险线索发掘方法 | |
CN113220888B (zh) | 基于Ernie模型的案件线索要素抽取方法及系统 | |
Aliyu et al. | Analysis of cyber bullying on Facebook using text mining | |
Do et al. | Constraints based taxonomic relation classification | |
CN110019763B (zh) | 文本过滤方法、系统、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180116 |
|
RJ01 | Rejection of invention patent application after publication |