CN103617212A - 一种处理舆情数据的方法和系统 - Google Patents

一种处理舆情数据的方法和系统 Download PDF

Info

Publication number
CN103617212A
CN103617212A CN201310585287.4A CN201310585287A CN103617212A CN 103617212 A CN103617212 A CN 103617212A CN 201310585287 A CN201310585287 A CN 201310585287A CN 103617212 A CN103617212 A CN 103617212A
Authority
CN
China
Prior art keywords
public sentiment
sentiment data
module
data
negative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310585287.4A
Other languages
English (en)
Inventor
贺松林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201310585287.4A priority Critical patent/CN103617212A/zh
Publication of CN103617212A publication Critical patent/CN103617212A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种处理舆情数据的方法和系统,有助于及时处理负面内容的舆情数据。该方法包括:根据预设的关键词抓取指定网站的舆情数据;对所述舆情数据进行正负面分类以确定负面内容的舆情数据;确定并输出所述负面内容的舆情数据的发起人信息。

Description

一种处理舆情数据的方法和系统
技术领域
本发明涉及计算机技术领域,特别地涉及一种处理舆情数据的方法和系统。
背景技术
企业舆情系统就是指从危机事件的征兆出现到危机开始造成可感知的损失这段时间内,化解和应对危机所采取的必要、有效行动。其意义在于及早发现危机的苗头,及早对可能产生的现实危机的走向、规模进行判断,及早通知各有关职能部门共同做好应对危机的准备。
随着新媒体时代的到来,舆论的力量不断地增强,尤其在社交网络的帮助下,社会舆论已经成为了一股无法被人忽视的力量。在这种大环境下,一个功能强大的,完善的系统的需求性就表露无遗,一款好的舆情系统可以帮助用户在第一时间掌握舆情动态,不用被舆情牵着鼻子走,而是始终保有主动权。主要体现在能否从每天海量的网络言论中敏锐地发现潜在危机的苗头,以及准确判断这种发现与危机可能爆发之间的时间差。这个时间差越大,相关职能部门越有充裕的时间来准备,为下一阶段危机的有效应对赢得宝贵的时间。
发明内容
有鉴于此,本发明提供一种处理舆情数据的方法和系统,有助于及时处理负面内容的舆情数据。
为实现上述目的,根据本发明的一个方面,提供了一种处理舆情数据的方法。
本发明的处理舆情数据的方法包括:根据预设的关键词抓取指定网站的舆情数据;对所述舆情数据进行正负面分类以确定负面内容的舆情数据;确定并输出所述负面内容的舆情数据的发起人信息。
可选地,在根据预设的关键词抓取指定网站的舆情数据之前,还包括:保存预设的关键词以及指定网站的网址。
可选地,根据预设的关键词抓取指定网站的舆情数据之后,还包括:对所述舆情数据按预设方式统计然后输出。
可选地,对所述舆情数据进行正负面分类的步骤之前,还包括:对所述舆情数据进行过滤。
可选地,对所述舆情数据进行过滤之后,在对所述舆情数据进行正负面分类之前,还包括:对所述舆情数据作去重处理。
根据本发明的另一方面,提供了一种处理舆情数据的系统。
本发明的处理舆情数据的系统包括:抓取模块,用于根据预设的关键词,抓取指定网站的舆情数据;分析模块,用于对所述舆情数据进行正负面分类以确定负面内容的舆情数据;处理模块,用于确定并输出所述负面内容的舆情数据的发起人信息。
可选地,还包括监控模块,用于保存预设的关键词以及指定网站的网址。
可选地,还包括统计模块,用于对所述舆情数据按预设方式统计然后输出。
可选地,还包括过滤模块,用于对所述舆情数据进行过滤。
可选地,还包括去重模块,用于对所述舆情数据作去重处理。
根据本发明的技术方案,对抓取的舆情数据进行正负面分类以确定负面内容的舆情数据,确定并输出负面内容的舆情数据的发起人信息,在得到了负面内容的舆情数据的发起人信息之后,就可以尽快与其联系,从而将舆情方向纳入管理以避免扩散。发明人在实现本发明的过程中发现,网站的舆情一般具有如下特点:舆情往往自成一体,即有关某一具体话题发布的信息往往只局限于该网站以内,迁移到其他网站一般需要一定的时间;然而一旦出现迁移,舆情将很快扩散;舆情数据发起人对于舆情的导向具有关键性作用。因此,按照图1所示的流程,能够尽快地确定舆情数据发起人以便舆情管理人员或其他相关人员与其联系并进行沟通,避免舆情扩散;同时有助于提升客户对企业的好感,维护企业形象。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的处理舆情数据的方法的基本步骤示意图;
图2是根据本发明实施例的处理舆情数据的系统的基本模块的示意图;
图3是根据本发明实施例的处理舆情数据的系统的优选结构及其中各模块功能的示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的处理舆情数据的方法的基本步骤示意图。如图1所示,本发明实施例中,处理舆情数据的方法主要包括如下的步骤S11至步骤S13。
步骤S11:根据预设的关键词抓取指定网站的舆情数据。
步骤S12:对舆情数据进行正负面分类以确定负面内容的舆情数据。本步骤中可以采用现有的中文分词技术、自然语言处理技术、中文信息处理技术等来实现。
步骤S13:确定并输出负面内容的舆情数据的发起人信息。用户在发布信息之前通常都会登录,并且在注册时会留下注册信息,另外用户终端的相关参数例如IP地址等也会被记录。这些都构成了发起人信息,并且能够被监听到。
在步骤S11之前,可以保存预设的关键词以及指定网站的网址。这里的指定网站可以是微博网站等。在步骤S12之前,可以先对舆情数据进行过滤;或者进行过滤和去重处理。在得到舆情数据之后可以对舆情数据按预设方式统计然后输出,从而形成舆情报告。
图2是根据本发明实施例的处理舆情数据的系统的基本模块的示意图。如图2所示,处理舆情数据的系统20基本地包括抓取模块21、分析模块22、以及处理模块23。抓取模块21用于根据预设的关键词,抓取指定网站的舆情数据;分析模块22用于对舆情数据进行正负面分类以确定负面内容的舆情数据;处理模块23用于确定并输出负面内容的舆情数据的发起人信息。
处理舆情数据的系统20还可包括监控模块、统计模块、过滤模块、去重模块(图中未示出),其中监控模块用于保存预设的关键词以及指定网站的网址;统计模块用于对舆情数据按预设方式统计然后输出;过滤模块用于对舆情数据进行过滤;去重模块用于对舆情数据作去重处理。
图3是根据本发明实施例的处理舆情数据的系统的优选结构及其中各模块功能的示意图。如图3所示,处理舆情数据的系统优选地包括舆情监控模块、舆情抓取模块、舆情分析模块、舆情处理模块、舆情统计模块、舆情展示模块。其中舆情监控模块的主要功能包括网站监控、关键词监控、预警设置、沟通模版设置;舆情抓取模块的主要功能包括根据监控抓取舆情;舆情分析模块的主要功能包括舆情过滤、舆情去重、正负分析、舆情预警;舆情处理模块的主要功能包括任务舆情、舆情领取、沟通模版、处理结果;舆情统计模块的主要功能包括舆情统计、报告生成;舆情展示模块的主要功能包括进行舆情展示。
根据本发明的技术方案,对抓取的舆情数据进行正负面分类以确定负面内容的舆情数据,确定并输出负面内容的舆情数据的发起人信息,在得到了负面内容的舆情数据的发起人信息之后,就可以尽快与其联系,从而将舆情方向纳入管理以避免扩散。发明人在实现本发明的过程中发现,网站的舆情一般具有如下特点:舆情往往自成一体,即有关某一具体话题发布的信息往往只局限于该网站以内,迁移到其他网站一般需要一定的时间;然而一旦出现迁移,舆情将很快扩散;舆情数据发起人对于舆情的导向具有关键性作用。因此,按照图1所示的流程,能够尽快地确定舆情数据发起人以便舆情管理人员或其他相关人员与其联系并进行沟通,避免舆情扩散;同时有助于提升客户对企业的好感,维护企业形象。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,对本领域的普通技术人员而言,能够理解本发明的方法和设备的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来开发出的任何存储介质。
还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种处理舆情数据的方法,其特征在于,包括:
根据预设的关键词抓取指定网站的舆情数据;
对所述舆情数据进行正负面分类以确定负面内容的舆情数据;
确定并输出所述负面内容的舆情数据的发起人信息。
2.根据权利要求1所述的方法,其特征在于,在根据预设的关键词抓取指定网站的舆情数据之前,还包括:保存预设的关键词以及指定网站的网址。
3.根据权利要求1所述的方法,其特征在于,根据预设的关键词抓取指定网站的舆情数据之后,还包括:对所述舆情数据按预设方式统计然后输出。
4.根据权利要求1至3中任一项所述的方法,其特征在于,对所述舆情数据进行正负面分类的步骤之前,还包括:对所述舆情数据进行过滤。
5.根据权利要求4所述的方法,其特征在于,对所述舆情数据进行过滤之后,在对所述舆情数据进行正负面分类之前,还包括:对所述舆情数据作去重处理。
6.一种处理舆情数据的系统,其特征在于,包括:
抓取模块,用于根据预设的关键词,抓取指定网站的舆情数据;
分析模块,用于对所述舆情数据进行正负面分类以确定负面内容的舆情数据;
处理模块,用于确定并输出所述负面内容的舆情数据的发起人信息。
7.根据权利要求6所述的系统,其特征在于,还包括监控模块,用于保存预设的关键词以及指定网站的网址。
8.根据权利要求6所述的系统,其特征在于,还包括统计模块,用于对所述舆情数据按预设方式统计然后输出。
9.根据权利要求6,7或8所述的系统,其特征在于,还包括过滤模块,用于对所述舆情数据进行过滤。
10.根据权利要求9所述的系统,其特征在于,还包括去重模块,用于对所述舆情数据作去重处理。
CN201310585287.4A 2013-11-19 2013-11-19 一种处理舆情数据的方法和系统 Pending CN103617212A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310585287.4A CN103617212A (zh) 2013-11-19 2013-11-19 一种处理舆情数据的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310585287.4A CN103617212A (zh) 2013-11-19 2013-11-19 一种处理舆情数据的方法和系统

Publications (1)

Publication Number Publication Date
CN103617212A true CN103617212A (zh) 2014-03-05

Family

ID=50167915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310585287.4A Pending CN103617212A (zh) 2013-11-19 2013-11-19 一种处理舆情数据的方法和系统

Country Status (1)

Country Link
CN (1) CN103617212A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951869A (zh) * 2015-05-27 2015-09-30 中国科学院信息工程研究所 一种基于工作流的舆情监控方法及装置
CN108681584A (zh) * 2018-05-12 2018-10-19 苏州华必讯信息科技有限公司 一种处理舆情数据的方法和系统
CN110263237A (zh) * 2019-05-31 2019-09-20 精硕科技(北京)股份有限公司 舆情数据的获取方法和装置
CN111046264A (zh) * 2019-11-29 2020-04-21 江西省天轴通讯有限公司 舆情线索处理方法、系统、可读存储介质及计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408883A (zh) * 2008-11-24 2009-04-15 电子科技大学 一种网络舆情观点收集方法
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
US20110184729A1 (en) * 2008-09-29 2011-07-28 Sang Hyob Nam Apparatus and method for extracting and analyzing opinion in web document
CN102708096A (zh) * 2012-05-29 2012-10-03 代松 一种基于语义的网络智能舆情监测系统及其工作方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110184729A1 (en) * 2008-09-29 2011-07-28 Sang Hyob Nam Apparatus and method for extracting and analyzing opinion in web document
CN101408883A (zh) * 2008-11-24 2009-04-15 电子科技大学 一种网络舆情观点收集方法
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
CN102708096A (zh) * 2012-05-29 2012-10-03 代松 一种基于语义的网络智能舆情监测系统及其工作方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951869A (zh) * 2015-05-27 2015-09-30 中国科学院信息工程研究所 一种基于工作流的舆情监控方法及装置
CN108681584A (zh) * 2018-05-12 2018-10-19 苏州华必讯信息科技有限公司 一种处理舆情数据的方法和系统
CN110263237A (zh) * 2019-05-31 2019-09-20 精硕科技(北京)股份有限公司 舆情数据的获取方法和装置
CN111046264A (zh) * 2019-11-29 2020-04-21 江西省天轴通讯有限公司 舆情线索处理方法、系统、可读存储介质及计算机设备

Similar Documents

Publication Publication Date Title
CN109271512B (zh) 舆情评论信息的情感分析方法、装置及存储介质
Chavoshi et al. Temporal patterns in bot activities
CN110347716B (zh) 日志数据处理方法、装置、终端设备及存储介质
US9424319B2 (en) Social media based content selection system
AU2013261007B2 (en) System and method for creating structured event objects
US9213997B2 (en) Method and system for social media burst classifications
US20110078584A1 (en) System for organising social media content to support analysis, workflow and automation
US20140067951A1 (en) System and method for displaying contextual activity streams
CN104504150A (zh) 新闻舆情监测系统
US10742688B2 (en) Platform for automated regulatory compliance monitoring of messaging services
US9634909B2 (en) Methods and systems of detection of most relevant insights for large volume query-based social data stream
CN106055608A (zh) 自动采集和分析交换机日志的方法和装置
WO2013118143A2 (en) Complete specification
CN103617212A (zh) 一种处理舆情数据的方法和系统
WO2016192568A1 (zh) 一种多点监控报警方法和系统
WO2014040570A1 (zh) 一种垃圾模板文章识别方法和设备
CN107766737B (zh) 一种数据库审计方法
US11756444B2 (en) Student message monitoring using natural language processing
Girish et al. Extreme event detection and management using twitter data analysis
CN105245394A (zh) 一种基于分层方式分析网络访问日志的方法和设备
CN115422448A (zh) 一种消息推送方法、装置、电子设备及存储介质
CN108681584A (zh) 一种处理舆情数据的方法和系统
Domdouzis et al. Service-oriented design of a command and control intelligence dashboard for crisis management
Hansen Wijaya et al. Twitter Sentiment Analysis and Insight for Indonesian Mobile Operators
CN107592214B (zh) 一种识别互联网应用系统登录用户名的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140305

RJ01 Rejection of invention patent application after publication