CN107330076B - 一种网络舆情信息展示系统及方法 - Google Patents
一种网络舆情信息展示系统及方法 Download PDFInfo
- Publication number
- CN107330076B CN107330076B CN201710528308.7A CN201710528308A CN107330076B CN 107330076 B CN107330076 B CN 107330076B CN 201710528308 A CN201710528308 A CN 201710528308A CN 107330076 B CN107330076 B CN 107330076B
- Authority
- CN
- China
- Prior art keywords
- public opinion
- opinion information
- public
- information
- coordinate graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000004458 analytical method Methods 0.000 claims description 16
- 238000010586 diagram Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种网络舆情信息展示系统及方法,该方法包括:获取舆情信息;分析所获取的舆情信息并将舆情信息进行分类;展示分类后的舆情信息的数量与时间变化的坐标图,且该坐标图带有公开的舆情信息源地址的链接。本发明系统和方法将网络舆情信息获取后进行分类,然后在坐标图上进行显示,从而直观地查看不同类别的舆情信息的数量,并且点击坐标图上某个舆情信息的图标即可查看原链接,并且获知与该舆情信息相关的其他舆情信息,从而方便获知舆情信息的产生情况。
Description
技术领域
本发明涉及舆情展示技术领域,具体涉及一种网络舆情信息展示系统及方法。
背景技术
舆情信息是对舆情的一种描述和反映,从理论上讲,所谓舆情信息,就是指在民众社会政治态度的收集、整理、分析、报送、利用和反馈的信息运动过程中,用以客观反映舆情状态及其运动情况的资讯、消息、音信、情报、指令、数据和信号。
公开号为CN106339392A的中国专利文献公开了一种舆情信息获取方法及装置,该方法包括:接收客户端发送的舆情信息获取请求,根据所述待获取的舆情信息的行业主题,从舆情规则词库中确定与所述待获取的舆情信息的行业主题对应的舆情规则词组,对舆情数据库中的舆情信息进行筛选,获取与所述确定的舆情规则词组对应的舆情信息,将所述获取的与所述确定的规则词组对应的舆情信息发送至客户端。通过不同行业的舆情规则词组,可以获得不同行业的舆情信息,根据与待获取的舆情信息的主题确定的舆情规则词组,查找到的舆情信息,可以按照客户需求获取相应的舆情信息,实现获得的舆情信息无遗漏,并为客户及时提供重要的舆情信息。
公开号为CN103902659A的中国专利文献公开了一种舆情分析方法,包括根据用户设定的关键词监测与所述关键词相关的网络舆情信息;如果监测到与所述关键词相关的网络舆情信息,判断所述舆情信息是否为负面舆情信息;如果所述舆情信息为负面舆情信息,则计算用户对所述负面舆情信息的应对能力指数。本发明还公开了与上述方法相应的舆情分析装置。本发明能够为用户提供用户对当前负面舆情信息的应对能力指数,从而为用户提供直观的决策参考和指引,具有较好的用户体验。
现有舆情分析和展示工具不够直观,且无法使用户快速获得舆情信息。
发明内容
本发明的目的在于提供一种网络舆情信息展示系统及方法,本发明提供的系统和方法能够通过坐标图对不同分类的舆情信息进行展示,直观而且方便快捷。
为实现上述目的,本发明提供一种网络舆情信息展示方法,该方法包括:获取舆情信息;分析所获取的舆情信息并将舆情信息进行分类;展示分类后的舆情信息的数量与时间变化的坐标图,且该坐标图带有公开的舆情信息源地址的链接。
可选的,该方法还包括:关联分类后的舆情信息并展示在坐标图上。
可选的,所述获取舆情信息的步骤包括:输入关键字;采用分布式云计算在网页、即时通讯记录和微博搜寻含有关键字的舆情信息;对搜寻得到含有关键字的舆情信息进行相似度分析;剔除相似度大于90%的舆情信息。
可选的,所述分析所获取的舆情信息并将舆情信息进行分类的步骤包括:在NoSQL文档型数据库中对分类关键字进行关联,以获取每个关键字在NoSQL文档型数据库中的近似词;在所有舆情信息中根据近似词进行搜索、匹配和分类;剔除类属于不同近似词的舆情信息。
可选的,所述展示分类后的舆情信息的数量与时间的变化坐标图的步骤包括:根据分类的数量的递增建立直角二维坐标图或直角三维坐标图,坐标图中舆情信息的数量分布无重叠。
本发明还提供一种网络舆情信息展示系统,该系统包括:舆情信息获取单元,用于获取舆情信息;舆情信息分析分类单元,用于分析所获取的舆情信息并将舆情信息进行分类;坐标图展示单元,用于展示分类后的舆情信息的数量与时间变化的坐标图,且该坐标图带有公开的舆情信息源地址的链接。
可选的,该系统还包括:舆情信息关联单元,用于关联分类后的舆情信息并展示在坐标图上。
可选的,所述舆情信息获取单元包括:关键字输入子单元,用于输入关键字;舆情信息搜索子单元,用于采用分布式云计算在网页、即时通讯记录和微博搜寻含有关键字的舆情信息;相似度分析子单元,用于对搜寻得到含有关键字的舆情信息进行相似度分析;舆情信息剔除子单元,用于剔除相似度大于90%的舆情信息。
可选的,所述舆情信息分析分类单元包括:近似词获取子单元,用于在NoSQL文档型数据库中对分类关键字进行关联,以获取每个关键字在NoSQL文档型数据库中的近似词;分类子单元,用于在所有舆情信息中根据近似词进行搜索、匹配和分类;近似词剔除子单元,剔除类属于不同近似词的舆情信息。
可选的,所述坐标图展示单元包括:坐标图建立子单元,用于根据分类的数量的递增建立直角二维坐标图或直角三维坐标图,坐标图中舆情信息的数量分布无重叠。
本发明具有如下优点:
本发明系统和方法将网络舆情信息获取后进行分类,然后在坐标图上进行显示,从而直观地查看不同类别的舆情信息的数量,并且点击坐标图上某个舆情信息的图标即可查看原链接,并且获知与该舆情信息相关的其他舆情信息,从而方便获知舆情信息的产生情况。
附图说明
图1是一示例性实施例所提供的直角二维坐标图的示意图。
图2是一示例性实施例所提供的直角三维坐标图的示意图。
图3是一示例性实施例所提供的网络舆情信息展示方法的流程示意图。
图4是一示例性实施例所提供的网络舆情信息展示系统的结构示意图。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
图3是一示例性实施例所提供的网络舆情信息展示方法的流程示意图。如图3所示,该方法包括如下步骤。
步骤S10:获取舆情信息。用户可以根据想要获知的舆情信息的关键字进行检索,例如想检索“可燃冰”,则可以输入关键字“可燃冰”,然后可以通过采用分布式云计算在网页、即时通讯记录和微博搜寻含有关键字的舆情信息,通过该方式检索的舆情信息附带有时间信息,从而方便后续展示坐标图。接着,由于舆情信息有部分是转发或者复制粘贴,无法代表舆情的真实发表,因此,需要对搜寻得到含有关键字的舆情信息进行相似度分析;并剔除相似度大于90%的舆情信息,通过上述舆情信息获取步骤,大大减少了舆情获取的数量和真实性,从而获取真实的舆情来源。
步骤S20:分析所获取的舆情信息并将舆情信息进行分类。舆情信息的分类对舆情的展示具有重要意义,一般来说,人们倾向于获取认同感,热衷于寻找与自己想法相似的舆情,并证明自身想法的正确性,例如对于同一件事情,有正面评价的舆情和负面评价的舆情,当人们对该事情持正面态度时,会寻找持正面态度的舆情,并抨击持负面态度的舆情,从而获得情绪上的满足,但是现有信息分类并不能满足上述要求,因此,本发明寻找新的舆情信息分类方式,具体地,可以预先在数据库例如NoSQL文档型数据库中对分类关键字进行关联,以获取每个关键字在NoSQL文档型数据库中的近似词,例如,负面其近似词可以是坏、不好、错误等等,接着可以在所有舆情信息中根据近似词进行搜索、匹配和分类,例如根据标题和正文等部分出现的近似词的数量可以确认该舆情信息的倾向,若出现更多的负面词语,则可以判断该舆情信息为负面的,然而有些舆情信息会同时有负面和正面的近似词,因此需要剔除类属于不同近似词的舆情信息,以提高分类的准确性。
步骤S30:展示分类后的舆情信息的数量与时间变化的坐标图,且该坐标图带有公开的舆情信息源地址的链接。获取舆情信息以后可以对其进行统计,例如统计数量并显示在坐标图上,并且可以一个点代表一个舆情信息,点击该点即可进入源地址,从而浏览公开的舆情信息。若分类关键字的数量为一个,则可以将所有舆情信息分为两类,此时采用直角二维坐标图(如图1所示)即可,而若分类关键字是二个以及二个以上,则可以将所有舆情信息分为四类以及四类以上,此时采用直角三维坐标图(如图2所示)进行信息显示,此时坐标图中舆情信息的数量应分布无重叠。
另外,舆情信息的产生一般是在前一个舆情信息的基础上进行衍生或者创造的过程,因此,该方法还可以包括:关联分类后的舆情信息并展示在坐标图上,即若后出现的舆情信息与前面的舆情信息存在大于50%小于90%的相似性,则可以认为后出现的舆情信息是先出现的舆情信息的衍生信息,此时在点击一个舆情信息的点时,会出现连线将其相关的舆情信息关联起来,从而方便人们阅读,了解舆情随时间的变化的过程。
图4是一示例性实施例所提供的网络舆情信息展示系统的结构示意图。如图4所示,该系统包括如下单元。
舆情信息获取单元100,用于获取舆情信息。舆情信息获取单元100包括:关键字输入子单元,用于输入关键字;舆情信息搜索子单元,用于采用分布式云计算在网页、即时通讯记录和微博搜寻含有关键字的舆情信息;相似度分析子单元,用于对搜寻得到含有关键字的舆情信息进行相似度分析;舆情信息剔除子单元,用于剔除相似度大于90%的舆情信息。
舆情信息分析分类单元200,用于分析所获取的舆情信息并将舆情信息进行分类。舆情信息分析分类单元200包括:近似词获取子单元,用于在NoSQL文档型数据库中对分类关键字进行关联,以获取每个关键字在NoSQL文档型数据库中的近似词;分类子单元,用于在所有舆情信息中根据近似词进行搜索、匹配和分类;近似词剔除子单元,剔除类属于不同近似词的舆情信息。
坐标图展示单元300,用于展示分类后的舆情信息的数量与时间变化的坐标图,且该坐标图带有公开的舆情信息源地址的链接。坐标图展示单元300包括:坐标图建立子单元,用于根据分类的数量的递增建立直角二维坐标图或直角三维坐标图,坐标图中舆情信息的数量分布无重叠。
该系统还可以包括:舆情信息关联单元,用于关联分类后的舆情信息并展示在坐标图上。
系统包括的上述单元和子单元与方法的对应,本发明不再赘述。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (4)
1.一种网络舆情信息展示方法,其特征在于,该方法包括:
输入关键字,采用分布式云计算在网页、即时通讯记录和微博搜寻含有关键字的舆情信息;对搜寻得到含有关键字的舆情信息进行相似度分析;剔除相似度大于90%的舆情信息;
在NoSQL文档型数据库中对分类关键字进行关联,以获取每个关键字在NoSQL文档型数据库中的近似词;在所有舆情信息中根据近似词进行搜索、匹配和分类;剔除类属于不同近似词的舆情信息;
展示分类后的舆情信息的数量与时间变化的坐标图,且该坐标图带有公开的舆情信息源地址的链接;其中,所述展示分类后的舆情信息的数量与时间的变化坐标图的步骤包括:根据分类的数量的递增建立直角二维坐标图或直角三维坐标图,坐标图中舆情信息的数量分布无重叠。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:关联分类后的舆情信息并展示在坐标图上。
3.一种网络舆情信息展示系统,其特征在于,该系统包括:
舆情信息获取单元,包括:关键字输入子单元,用于输入关键字;舆情信息搜索子单元,用于采用分布式云计算在网页、即时通讯记录和微博搜寻含有关键字的舆情信息;相似度分析子单元,用于对搜寻得到含有关键字的舆情信息进行相似度分析;舆情信息剔除子单元,用于剔除相似度大于90%的舆情信息;
舆情信息分析分类单元,包括:近似词获取子单元,用于在NoSQL文档型数据库中对分类关键字进行关联,以获取每个关键字在NoSQL文档型数据库中的近似词;分类子单元,用于在所有舆情信息中根据近似词进行搜索、匹配和分类;近似词剔除子单元,剔除类属于不同近似词的舆情信息;
坐标图展示单元,用于展示分类后的舆情信息的数量与时间变化的坐标图,且该坐标图带有公开的舆情信息源地址的链接,所述坐标图展示单元包括坐标图建立子单元,用于根据分类的数量的递增建立直角二维坐标图或直角三维坐标图,坐标图中舆情信息的数量分布无重叠。
4.根据权利要求3所述的系统,其特征在于,该系统还包括:舆情信息关联单元,用于关联分类后的舆情信息并展示在坐标图上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710528308.7A CN107330076B (zh) | 2017-07-01 | 2017-07-01 | 一种网络舆情信息展示系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710528308.7A CN107330076B (zh) | 2017-07-01 | 2017-07-01 | 一种网络舆情信息展示系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107330076A CN107330076A (zh) | 2017-11-07 |
CN107330076B true CN107330076B (zh) | 2021-04-06 |
Family
ID=60198724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710528308.7A Expired - Fee Related CN107330076B (zh) | 2017-07-01 | 2017-07-01 | 一种网络舆情信息展示系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107330076B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109359229A (zh) * | 2018-10-26 | 2019-02-19 | 湖北大学 | 大数据可视化显示方法 |
CN110164516B (zh) * | 2019-05-24 | 2021-09-24 | 山东大学齐鲁医院 | 一种检查单据时间分布图绘制方法及系统 |
CN110164551B (zh) * | 2019-05-24 | 2022-03-29 | 山东大学齐鲁医院 | 血液病智能诊疗辅助系统 |
CN112132368A (zh) * | 2019-06-06 | 2020-12-25 | 阿里巴巴集团控股有限公司 | 信息处理方法以及装置、计算设备、存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853261A (zh) * | 2009-11-23 | 2010-10-06 | 电子科技大学 | 一种基于社会网络的网络舆情行为分析方法 |
CN103605658A (zh) * | 2013-10-14 | 2014-02-26 | 北京航空航天大学 | 一种基于文本情感分析的搜索引擎系统 |
CN105335349A (zh) * | 2015-08-26 | 2016-02-17 | 天津大学 | 一种基于时间窗口的lda微博主题趋势检测方法及装置 |
CN105718516A (zh) * | 2016-01-14 | 2016-06-29 | 神策网络科技(北京)有限公司 | 用于数据分析的图形用户交互方法和装置以及网络系统 |
-
2017
- 2017-07-01 CN CN201710528308.7A patent/CN107330076B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853261A (zh) * | 2009-11-23 | 2010-10-06 | 电子科技大学 | 一种基于社会网络的网络舆情行为分析方法 |
CN103605658A (zh) * | 2013-10-14 | 2014-02-26 | 北京航空航天大学 | 一种基于文本情感分析的搜索引擎系统 |
CN105335349A (zh) * | 2015-08-26 | 2016-02-17 | 天津大学 | 一种基于时间窗口的lda微博主题趋势检测方法及装置 |
CN105718516A (zh) * | 2016-01-14 | 2016-06-29 | 神策网络科技(北京)有限公司 | 用于数据分析的图形用户交互方法和装置以及网络系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107330076A (zh) | 2017-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9990368B2 (en) | System and method for automatic generation of information-rich content from multiple microblogs, each microblog containing only sparse information | |
CN107784010B (zh) | 一种用于确定新闻主题的热度信息的方法与设备 | |
US20130263019A1 (en) | Analyzing social media | |
CN107844565B (zh) | 商品搜索方法和装置 | |
CN107330076B (zh) | 一种网络舆情信息展示系统及方法 | |
US20140337328A1 (en) | System and method for retrieving and presenting concept centric information in social media networks | |
CN106557558B (zh) | 一种数据分析方法及装置 | |
US20160162582A1 (en) | Method and system for conducting an opinion search engine and a display thereof | |
CN109271574A (zh) | 一种热词推荐方法及装置 | |
US10229190B2 (en) | Latent semantic indexing in application classification | |
US9286379B2 (en) | Document quality measurement | |
TW201839628A (zh) | 一種基於網路媒體資料流程發現並跟蹤熱點話題的方法、系統和裝置 | |
US20130090918A1 (en) | System, method and apparatus for detecting related topics and competition topics based on topic templates and association words | |
CN107832338B (zh) | 一种识别核心产品词的方法和系统 | |
CN102799591A (zh) | 一种提供推荐词的方法及装置 | |
CN103026373A (zh) | 用于监视公司的方法及装置 | |
CN112307366B (zh) | 一种信息展示的方法、装置及计算机存储介质 | |
Ahlgren | Research on sentiment analysis: the first decade | |
CN104050243B (zh) | 一种将搜索与社交相结合的网络搜索方法及其系统 | |
CN107330079B (zh) | 基于人工智能呈现辟谣信息的方法和装置 | |
CN107918644A (zh) | 声誉管理框架内的新闻议题分析方法和实施系统 | |
Radovanović et al. | Review spam detection using machine learning | |
US20240176798A1 (en) | Generating and presenting a searchable graph based on a graph query | |
CN110737824A (zh) | 内容查询方法和装置 | |
US20150193444A1 (en) | System and method to determine social relevance of Internet content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210406 |
|
CF01 | Termination of patent right due to non-payment of annual fee |