CN111368550A - 一种舆情信息管理系统 - Google Patents
一种舆情信息管理系统 Download PDFInfo
- Publication number
- CN111368550A CN111368550A CN201811598809.3A CN201811598809A CN111368550A CN 111368550 A CN111368550 A CN 111368550A CN 201811598809 A CN201811598809 A CN 201811598809A CN 111368550 A CN111368550 A CN 111368550A
- Authority
- CN
- China
- Prior art keywords
- information
- public opinion
- unit
- module
- public
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 67
- 238000001914 filtration Methods 0.000 claims abstract description 21
- 230000010354 integration Effects 0.000 claims abstract description 14
- 230000006855 networking Effects 0.000 claims abstract description 4
- 230000008451 emotion Effects 0.000 claims description 12
- 230000001502 supplementing effect Effects 0.000 claims description 7
- 238000007405 data analysis Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 abstract 1
- 238000000034 method Methods 0.000 description 15
- 238000007792 addition Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及互联网领域,尤其涉及一种舆情信息管理系统。信息采集单元用于系统在联网状态下根据用户输入的关键字采集舆情信息;信息过滤单元用于对采集的舆情信息进行识别分析;信息整合单元用于对过滤的舆情信息按预设条件进行分类;语义解析单元用于对整合后的舆情信息进行语义解析:数掘分析单元用于获取经过语义解析的舆情信息,并对舆情信息进行关联于关腱字的分析,获得舆情信息的分析结果“有益效果是,能够通过对信息源的识别,在获取信息前首先通过筛选到符合用户要求的信息源,以及通过信息源对能够对此类信息进行较系统的分析,进而为需要的用户提供数据参考以及决策支持。
Description
技术领域
本发明涉及互联网领域,尤其涉及一种舆情信息管理分析系统。
背景技术
互联网的普及给各行各业带来了巨大的信息量,大数据也随之应用而生,大数据(bigdata,megadata),或称巨量资料,是指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。
互联网中的大小站点数以千万计,积淀下的信息量更是海量级,在这些信息中存在这相当巨大的关于商机,待遇等方面的数据,绝大部分分布在各大论坛中,各个空间中,BLOG等互动讨论空间中,这些互动空间中的数据具备相当的价值,在一定程度上具备相当大的参考价值,各企事业单位、政府机构等也需要关注这些空间中的互联网舆论,为客户提供及时的互联网舆论方向分析,为公共危机公关,舆论导向等提供数据支持。但目前还没有能够对此类信息进行较系统的分析,进而为需要的用户提供数据参考以及决策支持。
发明内容
针对上述问题一种舆情信息分析系统。具体的技术方案是:一种舆情信息分析系统,其中,包括:
信息采集单元,用于所述系统在联网状态下根据用户输入的关键字采集舆情信息;
信息过滤单元,连接所述信息采集单元,用于对采集的所述舆情信息进行识别分析,过滤与所述关键字无关的所述舆情信息;
信息整合单元,连接所述信息过滤单元,用于对过滤的所述舆情信息按预设条件进行分类,并对同一类别的所述舆情信息中信息进行两两信息间不重复部分的相互复制;
语义解析单元,连接所述信息整合单元,用于对整合后的所述舆情信息进行语义解析;
数据分析单元,连接所述语义解析单元,用于获取经过所述语义解析的所述舆情信息,并对所述舆情信息进行关联于所述关键字的分析,获得舆情信息的分析结果。
作为本发明的一种优选技术方案,上述的舆情信息管理分析系统,其中,包括:
信息存储单元,连接所述信息整合单元,用于存储进行所述分类后的所述舆情信息。
作为本发明的一种优选技术方案,上述的互联网信息分析系统,其中,所述舆情信息存储单元包括:
复数个存储模块,每个所述存储模块用于存储一个类别的所述舆情信息;
信息管理模块,连接所述存储模块,用于对存储的所述舆情信息进行删除、增加、修改的管理。
作为本发明的一种优选技术方案,上述的互联网信息分析系统,其中,所述过滤分析单元包括:
第一分类模块,用于对采集的所述舆情信息根据与所述关键字的关联进行识别,并分为关联信息与无关联信息;
过滤模块,连接所述第一分类模块,用于过滤所述无关联信息。如权利要求1所述的互联网信息采集系统,其特征在于,所述舆情信息整合单元包括:
第二分类模块,根据所述预设条件对过滤的所述舆情信息进行分类,并对每个所述分类存储在所述存储模块内;
信息补充模块,连接所述第二分类模块,用于对每个所述分类中的所述舆情信息中关联于所述关键字的特征词进行提取,对具有同一所述特征词的所述舆情信息进行相互复制;
信息删除模块,连接所述信息补充模块,用于对每个所述分类中所述特征词全部相同的重复所述舆情信息进行删除。
作为本发明的一种优选技术方案,上述的互联网信息分析系统,其中,所述语义解析单元包括:
识别模块,用于对整合的所述舆情信息进行识别,将识别的所述舆情信息分为语言信息和感情信息;
语言语义分析,连接所述识别模块,用于对识别的所述语言信息进行语义解析,获得语言解析语义;
感情语义分析,连接所述识别模块,用于对识别的所述感情信息进行语义解析,获得感情解析语义;
作为本发明的一种优选技术方案,上述的互联网信息分析系统,其中,包括:
自动预警单元,连接所述信息整合单元,用于当所述舆情信息被非所述合法用户获取时进行预警。
作为本发明的一种优选技术方案,上述的互联网信息分析系统,其中,包括:
报告生成单元,连接所述数据分析单元,用于根据所述分析结果,按预置格式形成一分析报告。
本发明的有益效果是,能够通过对信息源的识别,在获取信息前首先通过筛选到符合用户要求的信息源,以及通过信息源对能够对此类信息进行较系统的分析,进而为需要的用户提供数据参考以及决策支持。
附图说明
图1为一种舆情信息管理分析系统的较佳实施例中的总结构示意图;
图2-7为一种舆情信息管理分析系统的较佳实施例中,在图1的基础上,部分结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
如图1所示,一种互联网信息分析系统,其中,包括:
信息采集单元1,用于系统在联网状态下根据用户输入的关键字采集舆情信息;
信息过滤单元2,连接信息采集单元1,用于对采集的舆情信息进行识别分析,过滤与关键字无关的舆情信息;
信息整合单元3,连接信息过滤单元2,用于对过滤的舆情信息按预设条件进行分类,并对同一类别的舆情信息中信息进行两两信息间不重复部分的相互复制;
语义解析单元4,连接信息整合单元3,用于对整合后的舆情信息进行语义解析;
数据分析单元5,连接语义解析单元4,用于获取经过语义解析的舆情信息,并对舆情信息进行关联于关键字的分析,获得舆情信息的分析结果。
本发明是通过信息采集单元1获取用户输入的关键字采集与关键字相关联的信息,通过信息过滤单元2,过滤与关键字无关的信息,例如嵌在信息中的广告等信息,将过滤的信息通过信息整合单元3进行整合,对同一类别的舆情信息中信息进行两两信息间不重复部分的相互复制,对过滤的信息按预设条件进行分类,预设条件可以是某类商品的使用方法的分类,可以是不同功能的分类等,并对同一类别的信息进行信息间的相互补充,例如对商品使用方法的分类,将具有共性的使用方法集合成一个使用方法,并将相同共性集合成的使用方法中多余的信息删除。对与整合后的信息通过语义解析单元4进行语义的解析,使用户根据解析的语义对数据进行挖掘,进而获得用户所需的有商业价值的信息。
本发明主要面向各企事业单位、政府机构等需要关注互联网舆论的客户,为客户提供及时的互联网舆论方向分析,为公共危机公关,舆论导向等提供数据支持。
本发明较佳实施例中,如图2所示,包括:
信息存储单元6,连接信息整合单元3,用于存储进行分类后的信息。本单元方便用户对采集信息的管理。
在本技术方案的基础上,进一步的,如图2所示,信息存储单元6包括:
复数个存储模块601,每个存储模块601用于存储一个类别的信息;
信息管理模块602,连接存储模块601,用于对存储的信息进行删除、增加、修改的管理。
通过对每个类别信息的独立存储,进而对每个类别的信息进行管理,对于过滤的信息可以按食品、品牌、投诉、建议等进行分类,将不同的分类存储在不同的独立的存储模块601中,以便分析。
本发明较佳实施例中,如图3所示,过滤分析单元包括:
第一分类模块201,用于对采集的信息根据与关键字的关联进行识别,并分为关联信息与无关联信息;
过滤模块202,连接第一分类模块201,用于过滤无关联信息。
过滤分析单元主要是分离并过滤出与关键字无关联的信息,例如广告等,并将这些无关联的信息进行过滤删除。
本发明较佳实施例中,如图4所示,信息整合单元3包括:
第二分类模块301,根据预设条件对过滤的信息进行分类,并对每个分类存储在存储模块601没内;
信息补充模块302,连接第二分类模块301,用于对每个分类中的信息中关联于关键字的特征词进行提取,对具有同一特征词的信息进行相互复制;
信息删除模块303,连接信息补充模块302,用于对每个分类中特征词全部相同的重复信息进行删除。
将与关键字相关联的信息进行进一步的分类,如前述的按某类商品的使用方法的分类,或是不同功能的分类等,并对同一类别的信息通过信息补充模块302进行信息间的相互补充,首先提取同类信息中与关键字相关联的特征词,例如在使用方法的分类中,使用方法是关键字,“精华露在清洁面部后,均匀涂抹在面部,并按顺时针按摩3-5分钟”其中“清洁面部、均匀涂抹、顺时针按摩、3-5分钟”为与关联于关键字的特征词,提取特征词,当有两个使用方法中有相同的特征词时,将剩余的不同特征词相互复制,获得相同的使用方法,再通过信息删除模块303,对重复的信息进行删除,在关键字“使用方法”下的信息得到整合。
本发明较佳实施例中,如图5所示,语义解析单元4包括:
识别模块401,用于对整合的信息进行识别,将识别的信息分为语言信息和感情信息;
语言语义分析402,连接识别模块401,用于对识别的语言信息进行语义解析,获得语言解析语义;
感情语义分析403,连接识别模块401,用于对识别的感情信息进行语义解析,获得感情解析语义;
对与整合后的信息通过语义分析单元进行语义的分析,具体通过识别模块401进行识别,将存储的信息分为语言信息和感情信息,获得语言解析语义和感情解析语义。使用户根据解析的语义对数据进行挖掘,进而获得用户所需的有商业价值的信息。
本发明较佳实施例中,如图6所示,包括:
自动预警单元7,连接信息整合单元3,用于当信息被非合法用户获取时进行预警。为保护企业的数据,对于不合法用户登录系统时自动预警单元7进行预警。
本发明较佳实施例中,如图7所示,包括:
报告生成单元8,连接数据分析单元5,用于根据分析结果,按预置格式形成一分析报告。
方便用户直观的获得关联于关键字的商业分析报告,以便做出商业决策等。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
Claims (8)
1.一种舆情信息管理系统,其特征在于,包括:
信息采集单元,用于所述系统在联网状态下根据用户输入的关键字采集舆情信息;
信息过滤单元,连接所述信息采集单元,用于对采集的所述舆情信息进行识别分析,过滤与所述关键字无关的所述舆情信息;
信息整合单元,连接所述信息过滤单元,用于对过滤的所述舆情信息按预设条件进行分类,并对同一类别的所述舆情信息中进行两两信息的不重复部分的相互复制;
语义解析单元,连接所述信息整合单元,用于对整合后的所述舆情信息进行语义解析;
数据分析单元,连接所述语义解析单元,用于获取经过所述语义解析的所述舆情信息,并对所述舆情信息进行关联于所述关键字的分析,获得舆情信息的分析结果。
2.如权利要求1所述的互联网信息采集系统,其特征在于,包括:信息存储单元,连接所述信息整合单元,用于存储所述分类后的所述舆情信息。
3.如权利要求2所述的互联网信息采集系统,其特征在于,所述舆情信息存储单元包括:
复数个存储模块,每个所述存储模块用于存储一个类别的所述舆情信息;信息管理模块,连接所述存储模块,用于对存储的所述舆情信息进行删除.增加.修改的管理。
4.如权利要求1所述的互联网信息采集系统,其特征在于,所述过滤分析单元包括:
第一分类模块,用于对采集的所述舆情信息根据与所述关键字的关联进行识别,并分为关联信息与无关联佇;
过滤模块,连接所述第一分类模块,用于过滤所述无关联。
5.如权利要求1所述的互联网信息采集系统,其特征在于,所述舆情信息整合单元包括:
第二分类模块,根据所述预设条件对过滤的所述舆情信息进行分类,并对每个所述分类存储在所述存储模块没内;
信息补充模块,连接所述第二分类模块,用于对每个所述分类中的所述舆情信息中关联于所述关键字的特征词进行提取,对具有同一所述特征词的所述舆情信息进行相互复信息删除模块,连接所述信息补充模块,用于对每个所述分类中所述特征词全部相同的重复所述舆情信息进行删除。
6.如权利要求所述的互联网信息采集系统,其特征在于,所述语义解析单元包括:
识别模块,用于对整合的所述舆情信息进行识别,将识别的所述舆情信息分为语言信息和感情信息;
语言语义分析,连接所述识别模块,用于对识别的所述语言信息进行语义解析,获得语言解析语义:
感情语义分析,连接所述识别模块,用于对识别的所述感情信息进行语义解析,获得感情解析语义。
7.如权利要求1所述的互联网信息采集系统,其特征在于,包括:
自动预警单元,连接所述信息整合单元,用于当所述舆情信息被非所述合法用户获取时进行预警。
8.如权利要求1所述的互联网信息采集系统,其特征在于,包括:
报告生成单元,连接所述数据分析单元,用于根据所述分析结果,按预置格式形成一份分析报告。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811598809.3A CN111368550A (zh) | 2018-12-26 | 2018-12-26 | 一种舆情信息管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811598809.3A CN111368550A (zh) | 2018-12-26 | 2018-12-26 | 一种舆情信息管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111368550A true CN111368550A (zh) | 2020-07-03 |
Family
ID=71206391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811598809.3A Pending CN111368550A (zh) | 2018-12-26 | 2018-12-26 | 一种舆情信息管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111368550A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114385890A (zh) * | 2022-03-22 | 2022-04-22 | 深圳市世纪联想广告有限公司 | 互联网舆情监控系统 |
-
2018
- 2018-12-26 CN CN201811598809.3A patent/CN111368550A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114385890A (zh) * | 2022-03-22 | 2022-04-22 | 深圳市世纪联想广告有限公司 | 互联网舆情监控系统 |
CN114385890B (zh) * | 2022-03-22 | 2022-05-20 | 深圳市世纪联想广告有限公司 | 互联网舆情监控系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110765337B (zh) | 一种基于互联网大数据的服务提供方法 | |
Sebei et al. | Review of social media analytics process and big data pipeline | |
Japec et al. | Big data in survey research: AAPOR task force report | |
CN103176983B (zh) | 一种基于互联网信息的事件预警方法 | |
CN110147360B (zh) | 一种数据整合方法、装置、存储介质和服务器 | |
CN113887219B (zh) | 一种主管部门热线舆情识别与预警方法及系统 | |
Japec et al. | AAPOR report on big data | |
CN112632405A (zh) | 一种推荐方法、装置、设备及存储介质 | |
US20130246463A1 (en) | Prediction and isolation of patterns across datasets | |
Vysotska et al. | The commercial content digest formation and distributional process | |
CN110851667A (zh) | 一种多源头大量数据的整合分析方法及工具 | |
CN105677802A (zh) | 一种互联网信息分析系统 | |
Ashley et al. | Emerging AI & Law approaches to automating analysis and retrieval of electronically stored information in discovery proceedings | |
CN111198969A (zh) | 一种基于网络大数据的经济信息咨询系统和方法 | |
CN116384889A (zh) | 基于自然语言处理技术的情报大数据智能分析方法 | |
US9165053B2 (en) | Multi-source contextual information item grouping for document analysis | |
CN110889632B (zh) | 一种公司形象提升系统的数据监测分析系统 | |
CN111368550A (zh) | 一种舆情信息管理系统 | |
CN115080636A (zh) | 一种基于网络服务的大数据分析系统 | |
WO2023150112A1 (en) | System for identifying and predicting trends | |
CN115187122A (zh) | 一种企业政策推演方法、装置、设备及介质 | |
CN111291029B (zh) | 数据清洗方法及装置 | |
Gorvankolla et al. | Application of Text Mining in Effective Document Analysis: Advantages, Challenges, Techniques and Tools | |
CN115409297B (zh) | 一种政务服务流程优化方法、系统及电子设备 | |
US20170061000A1 (en) | System and method for analysing temporal text data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200703 |