CN108153764A - 一种舆情处理方法及装置 - Google Patents

一种舆情处理方法及装置 Download PDF

Info

Publication number
CN108153764A
CN108153764A CN201611103665.0A CN201611103665A CN108153764A CN 108153764 A CN108153764 A CN 108153764A CN 201611103665 A CN201611103665 A CN 201611103665A CN 108153764 A CN108153764 A CN 108153764A
Authority
CN
China
Prior art keywords
public
application program
public sentiment
original
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611103665.0A
Other languages
English (en)
Inventor
许浩然
柯君
玄琨
陈晓宾
邱凤英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201611103665.0A priority Critical patent/CN108153764A/zh
Publication of CN108153764A publication Critical patent/CN108153764A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3684Test management for test design, e.g. generating new test cases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种舆情处理方法,用于对所产生的舆情及时进行跟进,该方法包括:获取应用程序的原始舆情信息;根据所述原始舆情信息生成舆情结果;当所述舆情结果达到第一预设条件时,生成舆情预警信息;当所述舆情预警信息达到第二预设条件时,生成所述应用程序的故障信息。本发明还公开了一种舆情处理装置。

Description

一种舆情处理方法及装置
技术领域
本发明涉及互联网领域,具体涉及一种舆情处理方法及装置。
背景技术
随着互联网的发展,大众往往以信息化的方式发表各自看法,由于互联网中信息传播速度比以往大大提升,因此需要有效的手段对网络舆情进行监控。在现有技术中,舆情普遍采用网络爬虫抓取原始舆情数据,利用分词技术以及自然语言处理技术等方式对原始舆情数据进行语义分析、情感研判及合并聚类,并配以辅助分析系统展示统计结果,获得热词趋势、正负面舆论分布等。
但是,在现有技术中舆情分析通常只关注新产生的社会热点,没有对特定的互联网产品例如游戏产品进行舆情实时分析,而如果对于一个互联网产品口碑没有实时监测,容易造成产品乃至品牌口碑的雪崩式下滑;同时,目前舆情分析只给出舆论热词的正负面分布、热词趋势等方面的结果展示,缺乏对突发热点事件的舆情跟进处理能力。
发明内容
有鉴于此,本发明提供一种舆情处理方法及装置,以解决现有技术中无法对互联网产品进行舆情监控且缺乏对舆情变化的跟进处理的技术问题。
为解决上述问题,本发明提供的技术方案如下:
一种舆情处理方法,所述方法包括:
获取应用程序的原始舆情信息;
根据所述原始舆情信息生成舆情结果;
当所述舆情结果达到第一预设条件时,生成舆情预警信息;
当所述舆情预警信息达到第二预设条件时,生成所述应用程序的故障信息。
相应的,所述获取应用程序的原始舆情信息,包括下述中的任意一种或者多种的组合:
利用网络爬虫从网络中获取应用程序的原始舆情信息;
从应用程序内部提取所述应用程序的原始舆情信息;
从应用程序的客服信息中获取所述应用程序的原始舆情信息。
相应的,所述根据所述原始舆情信息生成舆情结果,包括以下任意一种或多种的组合:
获得所述原始舆情信息的总数量作为舆情总量;
对所述原始舆情信息进行分词后,与预先建立的公用词库中的正向情感词进行匹配,将具有所述正向情感词的原始舆情信息的数量进行累计作为正向舆情总量;
对所述原始舆情信息进行分词后,与预先建立的公用词库中的负向情感词进行匹配,将具有所述负向情感词的原始舆情信息的数量进行累计作为负向舆情总量;
对所述原始舆情信息进行分词后,与预先建立的所述应用程序的私有词库中的关键词进行匹配,获得不同关键词所对应的原始舆情信息数量。
相应的,所述当所述舆情结果达到第一预设条件时,生成舆情预警信息,包括:
当所述舆情总量超过第一预设阈值和/或所述舆情总量在预定时间段内的变化量超过预设第二预设阈值时,生成舆情预警信息;
当所述负向舆情总量超过第三预设阈值和/或所述负向舆情总量在预定时间段内的变化量超过预设第四预设阈值时,生成舆情预警信息;
当任一关键词对应的原始舆情信息数量超过第五预设阈值时,生成舆情预警信息。
相应的,所述当所述舆情预警信息达到第二预设条件时,生成所述应用程序的故障信息,包括:
根据所述关键词的类别,当具有同一类别的关键词对应的原始舆情信息数量超过第五预设阈值所产生的舆情预警信息的数量超过第六预设阈值时,生成所述应用程序在该类别的故障信息。
相应的,所述方法还包括:
对所述应用程序的故障信息进行分析,确定故障原因。
相应的,所述对所述应用程序的故障信息进行分析,确定故障原因,包括:
确定所述故障信息所对应的发生时间段和/或发生地区;
获取所述发生时间段和/或所述发生地区的运营数据,按照预设链路顺序查找是否存在与所述故障信息对应的运营数据,确定故障原因。
相应的,所述对所述应用程序的故障信息进行分析,确定故障原因,包括:
确定所述应用程序的故障信息的类别;
运行该类别对应的测试用例,生成运行结果;
根据所述运行结果确定故障原因。
一种舆情处理装置,所述装置包括:
获取单元,用于获取应用程序的原始舆情信息;
第一生成单元,用于根据所述原始舆情信息生成舆情结果;
第二生成单元,用于当所述舆情结果达到第一预设条件时,生成舆情预警信息;
第三生成单元,用于当所述舆情预警信息达到第二预设条件时,生成所述应用程序的故障信息。
相应的,所述获取单元包括下述中的任意一种或者多种的组合:
第一获取子单元,用于利用网络爬虫从网络中获取应用程序的原始舆情信息;
第二获取子单元,用于从应用程序内部提取所述应用程序的原始舆情信息;
第三获取子单元,用于从应用程序的客服信息中获取所述应用程序的原始舆情信息。
相应的,所述第一生成单元包括以下任意一种或多种的组合:
第一获得子单元,用于获得所述原始舆情信息的总数量作为舆情总量;
第一匹配子单元,用于对所述原始舆情信息进行分词后,与预先建立的公用词库中的正向情感词进行匹配,将具有所述正向情感词的原始舆情信息的数量进行累计作为正向舆情总量;
第二匹配子单元,用于对所述原始舆情信息进行分词后,与预先建立的公用词库中的负向情感词进行匹配,将具有所述负向情感词的原始舆情信息的数量进行累计作为负向舆情总量;
第二获得子单元,用于对所述原始舆情信息进行分词后,与预先建立的所述应用程序的私有词库中的关键词进行匹配,获得不同关键词所对应的原始舆情信息数量。
相应的,所述第二生成单元包括:
第一生成子单元,用于当所述舆情总量超过第一预设阈值和/或所述舆情总量在预定时间段内的变化量超过预设第二预设阈值时,生成舆情预警信息;
第二生成子单元,用于当所述负向舆情总量超过第三预设阈值和/或所述负向舆情总量在预定时间段内的变化量超过预设第四预设阈值时,生成舆情预警信息;
第三生成子单元,用于当任一关键词对应的原始舆情信息数量超过第五预设阈值时,生成舆情预警信息。
相应的,所述第三生成单元具体用于:
根据所述关键词的类别,当具有同一类别的关键词对应的原始舆情信息数量超过第五预设阈值所产生的舆情预警信息的数量超过第六预设阈值时,生成所述应用程序在该类别的故障信息。
相应的,所述装置还包括:
确定单元,用于对所述应用程序的故障信息进行分析,确定故障原因。
相应的,所述确定单元包括:
第一确定子单元,用于确定所述故障信息所对应的发生时间段和/或发生地区;
第四获取子单元,用于获取所述发生时间段和/或所述发生地区的运营数据;
第二确定子单元,用于按照预设链路顺序查找是否存在与所述故障信息对应的运营数据,确定故障原因。
相应的,所述确定单元包括:
第三确定子单元,用于确定所述应用程序的故障信息的类别;
运行子单元,用于运行该类别对应的测试用例,生成运行结果;
第四确定子单元,用于根据所述运行结果确定故障原因。
由此可见,本发明实施例具有如下有益效果:
本发明实施例通过获取应用程序的原始舆情信息生成舆情结果,实现对应用程序的舆情进行监控,客观准确程序舆情的变化,监控应用程序的突发热点,进一步在舆情结果达到预设条件时生成舆情预警信息,自动分析舆情预警信息,在达到另一预设条件时将舆情预警信息转换为应用程序的故障信息并加以跟进,从而高效解决负面舆情所产生的影响。
附图说明
图1为本发明实施例中提供的舆情处理方法实施例的流程图;
图2为本发明实施例中提供的舆情处理方法的应用示意图;
图3为本发明实施例中提供的舆情处理装置实施例的示意图;
图4为本发明实施例中提供的一种服务器实施例的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明实施例作进一步详细的说明。
本发明实施例中提供的一种舆情处理方法及装置,是针对现有技术中无法对互联网产品进行舆情监控且缺乏对舆情变化的跟进处理的技术问题,提出通过舆情分析技术建立一套有效的应用程序的故障预警体系,并对所预测的故障预警进行分析进一步确定故障原因,以使及时对故障进行修复,高效地解决负面舆情所产生的影响,提升应用产品的质量。
本发明实施例将从舆情处理装置的角度进行描述,该舆情处理装置具体可以集成在服务器中,参见图1所示,本发明实施例中提供舆情处理方法,可以包括以下步骤:
步骤101:获取应用程序的原始舆情信息。
首先获取应用程序的原始舆情信息,原始舆情信息可以为对应用程序的评论内容、应用程序内部用户之间的交互信息、应用程序的客服反馈信息,例如投诉信息等等,通过获取应用程序的原始舆情信息对该应用程序的舆情进行监控。获取到的应用程序的原始舆情信息可以保存在数据库中。
在本发明一些可能的实现方式中,步骤101获取应用程序的原始舆情信息的实现可以包括下述中的任意一种或者多种的组合:
利用网络爬虫从网络中获取应用程序的原始舆情信息;
从应用程序内部提取应用程序的原始舆情信息;
从应用程序的客服信息中获取应用程序的原始舆情信息。
也即可以利用网络爬虫从外部网络中获取该应用程序的原始舆情信息,例如可以获取该应用程序论坛内用户所发布的内容,在应用市场中获取该应用程序的评论内容等等内容作为该应用程序的原始舆情信息。在实际应用中可以根据应用程序的名称、标识等信息抓取某一指定应用程序的原始舆情信息。同时可以根据应用程序的API(ApplicationProgramming Interface,应用程序编程接口)接口获取应用程序的原始舆情信息,例如获取应用程序内部论坛中用户所发布的内容、在应用程序内部用户之间的交互信息等等内容作为该应用程序的原始舆情信息。另外,还可以从客服工单中获取应用程序的客服信息,例如用户投诉反馈数据,作为原始舆情信息。本实施例在进行舆情监控时结合了最真实的客服信息,直接能反馈出用户在使用应用程序中所遇到的问题。
步骤102:根据原始舆情信息生成舆情结果。
在本实施例中,根据原始舆情信息可以自动生成舆情结果,舆情结果例如舆情总量、正向舆情总量、负向舆情总量、用户热点话题等等。
在本发明一些可能的实现方式中,步骤102根据原始舆情信息生成舆情结果的具体实现可以包括以下任意一种或多种的组合:
获得原始舆情信息的总数量作为舆情总量;
对原始舆情信息进行分词后,与预先建立的公用词库中的正向情感词进行匹配,将具有正向情感词的原始舆情信息的数量进行累计作为正向舆情总量;
对原始舆情信息进行分词后,与预先建立的公用词库中的负向情感词进行匹配,将具有负向情感词的原始舆情信息的数量进行累计作为负向舆情总量;
对原始舆情信息进行分词后,与预先建立的应用程序的私有词库中的关键词进行匹配,获得不同关键词所对应的原始舆情信息数量。
在本实施例中,可以有多种方式生成舆情结果,可以结合实际需求利用其中的一种或多种方式获得舆情结果。
在第一种方式中,原始舆情信息的总数量作为舆情总量可以在一定程度反映出应用程序的热度。另外,由于原始舆情信息的来源不同、所产生的地区不同,也可以分不同来源、不同地区分别统计原始舆情信息的总数量,例如北京的原始舆情信息的总数量、从应用程序内部提取的原始舆情信息的总数量等等。
在第二种方式中,可以利用机器学习模型训练出各个应用程序可以共有的公有词库,公有词库中可以包括正向情感词,正向情感词例如很好、很棒等等,对每条原始舆情信息首先进行分词,将分词后的原始舆情信息与正向情感词进行匹配,当某一条原始舆情信息中的分词与任一正向情感词匹配,则可以认为该条原始舆情信息为正向评论,将具有正向情感词的原始舆情信息的数量进行累计作为正向舆情总量。
类似的,在第三种方式中,可以利用机器学习模型训练出各个应用程序可以共有的公有词库,公有词库中可以包括负向情感词,对每条原始舆情信息首先进行分词,将分词后的原始舆情信息与负向情感词进行匹配,当某一条原始舆情信息中的分词与任一负向情感词匹配,则可以认为该条原始舆情信息为负向评论,将具有负向情感词的原始舆情信息的数量进行累计作为负向舆情总量。
在第四种方式中,可以利用机器学习模型训练出应用程序的私有词库,每个应用程序可以具有不同的私有词库,私有词库中可以包括针对应用程序的关键词,不同关键词可以代表不同的用户热点话题,进一步可以将关键词分为多个类别,例如无法登录、登录失败等关键词都属于登录类别。对每条原始舆情信息首先进行分词,将分词后的原始舆情信息与关键词进行匹配,当某一条原始舆情信息中的分词与任一关键词匹配,可以认为该关键词与该条原始舆情信息向对应,统计不同关键词所对应的原始舆情信息数量。
步骤103:当舆情结果达到第一预设条件时,生成舆情预警信息。
第一预设条件可以根据应用程序的实际应用情况进行设定,不同应用程序可以设置不同的第一预设条件,使舆情预警更具有针对性。
在本发明一些可能的实现方式中,步骤103当舆情结果达到第一预设条件时,生成舆情预警信息的具体实现可以包括:
当舆情总量超过第一预设阈值和/或舆情总量在预定时间段内的变化量超过预设第二预设阈值时,生成舆情预警信息;
当负向舆情总量超过第三预设阈值和/或负向舆情总量在预定时间段内的变化量超过预设第四预设阈值时,生成舆情预警信息;
当任一关键词对应的原始舆情信息数量超过第五预设阈值时,生成舆情预警信息。
在本实施例中,舆情总量可以反映应用程序的热点,舆情总量在预定时间段内的变化量可以理解为舆情加速度,可以识别短期内迅速爆发呈上升趋势的舆论,当舆情总量超过第一预设阈值和/或舆情总量在预定时间段内的变化量超过预设第二预设阈值时,可以生成舆情预警信息。第一预设阈值、第二预设阈值可以根据实际情况灵活设置。
类似的,负向舆情总量在预定时间段内的变化量可以理解为负向舆情加速度,可以识别短期内迅速爆发呈上升趋势的负向舆论,当负向舆情总量超过第三预设阈值和/或负向舆情总量在预定时间段内的变化量超过预设第四预设阈值时,可以生成舆情预警信息。第三预设阈值、第四预设阈值可以根据实际情况灵活设置。
而当任一关键词对应的原始舆情信息数量超过第五预设阈值时,生成舆情预警信息,第五预设阈值可以根据实际情况灵活设置,例如关键词无法登录对应的原始舆情信息数量超过第五预设阈值时,会生成舆情预警信息。
当舆情预警信息后可以发出预警通知,同时可以设置该舆情预警信息的处理状态,例如是否关闭、是否解除等,并对该舆情预警信息持续监控。
步骤104:当舆情预警信息达到第二预设条件时,生成应用程序的故障信息。
舆情预警信息在一定条件下可以转换为故障信息,第二预设条件可以根据应用程序的实际应用情况进行设定,不同应用程序可以设置不同的第二预设条件,最大限度地降低了故障误报的可能性。
在本发明一些可能的实现方式中,步骤104当舆情预警信息达到第二预设条件时,生成应用程序的故障信息的具体实现可以包括:
根据关键词的类别,当具有同一类别的关键词对应的原始舆情信息数量超过第五预设阈值所产生的舆情预警信息的数量超过第六预设阈值时,生成应用程序在该类别的故障信息。
在本实施例中,关键词有所属的类别,当属于同一类别的舆情预警信息的数量超过第六预设阈值时,生成应用程序在该类别的故障信息,例如,关键词无法登录、登录失败等都属于登录类别,关键词无法登录对应的原始舆情信息数量超过第五预设阈值会产生了一个登录类别的舆情预警信息,关键词登录失败对应的原始舆情信息数量超过第五预设阈值会产生了另一个登录类别的舆情预警信息,当登录类别的舆情预警信息超过第六预设阈值时,会生成应用程序在该登录类别的故障信息。
在本发明一些可能的实现方式中,本发明实施例中提供的舆论处理方法还可以包括:
对应用程序的故障信息进行分析,确定故障原因。
在产生故障信息之后,还可以对应用程序的故障信息进行分析,智能排查问题,最终确定故障原因。
在本发明一些可能的实现方式中,对应用程序的故障信息进行分析,确定故障原因的具体实现可以包括:
确定故障信息所对应的发生时间段和/或发生地区;
获取发生时间段和/或发生地区的运营数据,按照预设链路顺序查找是否存在与故障信息对应的运营数据,确定故障原因。
在本实施例中,可以建立故障分析链路,接入应用程序内部运营数据,结合运营事件对舆情产生的预警进行智能分析。例如产生了登录类的故障信息,首先获取相应时间段和/或发生地区的运营数据,查找是否存在网络机房环境、服务器硬件、周边平台、应用程序逻辑等方面的,运营数据中所包括的运营事件例如机房停电、服务器告警等等,最终确定由什么原因导致产生该故障信息。
在本发明一些可能的实现方式中,对应用程序的故障信息进行分析,确定故障原因的具体实现还可以包括:
确定应用程序的故障信息的类别;
运行该类别对应的测试用例,生成运行结果;
根据运行结果确定故障原因。
在本实施例中,在故障信息形成之后,还可以自动进行测试用例运行,对应运行失败的测试用例进行展示,从而定位到某个环境导致的故障原因。
这样,本发明实施例通过获取应用程序的原始舆情信息生成舆情结果,实现对应用程序的舆情进行监控,客观准确程序舆情的变化,监控应用程序的突发热点,进一步在舆情结果达到预设条件时生成舆情预警信息,自动分析舆情预警信息,在达到另一预设条件时将舆情预警信息转换为应用程序的故障信息并加以跟进,从而高效解决负面舆情所产生的影响。
参见图2所示,示出了本发明实施例中提供的舆情处理方法的应用示意图。在实际应用中,可以从外部网络、应用程序内部、客服信息中获取原始舆情信息,原始舆情信息可以保存在中间存储数据库中。可以与关键词进行匹配,统计不同关键词所对应的原始舆情信息数量,同时可以利用原始舆情信息分析任务调度来调用服务组件对原始舆情信息的来源进行解析,即进行LBS(Location Based Service,基于位置服务)-IP(InternetProtocol,网络之间互连的协议)解析,获得各个来源、地区的舆情总量,对原始舆情信息进行分词、在分词后可以进行情感分析,即与正向情感词与负向情感词分别匹配,获得正向舆情总量、负向舆情总量,也可以对关键词进行分类,进而获得不同分类的原始舆情信息的数量,所产生的舆情结果可以保存在数据仓库中。进一步根据舆情结果动态对突增的热点问题进行预警,并判断预警有效性,持续对预警进行监控,达到触发规则的,则可以产生相应的故障信息。按照预设链路顺序拉取内部运营系统在舆情时间期间的运营数据,智能排查问题,再辅以对业务影响分析,最终确定故障成因。另外,根据预先定义规则以及机器训练结果,对于舆情中出现的可能BUG风险进行过滤,清理,最终实时生成潜在BUG,反馈给相关人员处理。
参见图3所示,示出了本发明实施例中提供的舆情处理装置实施例的示意图,可以包括:
获取单元301,用于获取应用程序的原始舆情信息。
在本发明一些可能的实现方式中,获取单元可以包括下述中的任意一种或者多种的组合:
第一获取子单元,用于利用网络爬虫从网络中获取应用程序的原始舆情信息;
第二获取子单元,用于从应用程序内部提取应用程序的原始舆情信息;
第三获取子单元,用于从应用程序的客服信息中获取应用程序的原始舆情信息。
第一生成单元302,用于根据原始舆情信息生成舆情结果。
在本发明一些可能的实现方式中,第一生成单元可以包括以下任意一种或多种的组合:
第一获得子单元,用于获得原始舆情信息的总数量作为舆情总量;
第一匹配子单元,用于对原始舆情信息进行分词后,与预先建立的公用词库中的正向情感词进行匹配,将具有正向情感词的原始舆情信息的数量进行累计作为正向舆情总量;
第二匹配子单元,用于对原始舆情信息进行分词后,与预先建立的公用词库中的负向情感词进行匹配,将具有负向情感词的原始舆情信息的数量进行累计作为负向舆情总量;
第二获得子单元,用于对原始舆情信息进行分词后,与预先建立的应用程序的私有词库中的关键词进行匹配,获得不同关键词所对应的原始舆情信息数量。
第二生成单元303,用于当舆情结果达到第一预设条件时,生成舆情预警信息。
在本发明一些可能的实现方式中,第二生成单元可以包括:
第一生成子单元,用于当舆情总量超过第一预设阈值和/或舆情总量在预定时间段内的变化量超过预设第二预设阈值时,生成舆情预警信息;
第二生成子单元,用于当负向舆情总量超过第三预设阈值和/或负向舆情总量在预定时间段内的变化量超过预设第四预设阈值时,生成舆情预警信息;
第三生成子单元,用于当任一关键词对应的原始舆情信息数量超过第五预设阈值时,生成舆情预警信息。
第三生成单元304,用于当舆情预警信息达到第二预设条件时,生成应用程序的故障信息。
在本发明一些可能的实现方式中,第三生成单元可以具体用于:
根据关键词的类别,当具有同一类别的关键词对应的原始舆情信息数量超过第五预设阈值所产生的舆情预警信息的数量超过第六预设阈值时,生成应用程序在该类别的故障信息。
在本发明一些可能的实现方式中,本发明实施例中提供的舆情处理装置还可以包括:
确定单元,用于对应用程序的故障信息进行分析,确定故障原因。
在本发明一些可能的实现方式中,确定单元可以包括:
第一确定子单元,用于确定故障信息所对应的发生时间段和/或发生地区;
第四获取子单元,用于获取发生时间段和/或发生地区的运营数据;
第二确定子单元,用于按照预设链路顺序查找是否存在与故障信息对应的运营数据,确定故障原因。
在本发明一些可能的实现方式中,确定单元可以包括:
第三确定子单元,用于确定应用程序的故障信息的类别;
运行子单元,用于运行该类别对应的测试用例,生成运行结果;
第四确定子单元,用于根据运行结果确定故障原因。
这样,本发明实施例通过获取应用程序的原始舆情信息生成舆情结果,实现对应用程序的舆情进行监控,客观准确程序舆情的变化,监控应用程序的突发热点,进一步在舆情结果达到预设条件时生成舆情预警信息,自动分析舆情预警信息,在达到另一预设条件时将舆情预警信息转换为应用程序的故障信息并加以跟进,从而高效解决负面舆情所产生的影响。
相应的,本发明实施例还提供一种服务器,参见图4所示,可以包括:
处理器401、存储器402、输入装置403和输出装置404。舆情处理服务器中的处理器401的数量可以一个或多个,图4中以一个处理器为例。在本发明的一些实施例中,处理器401、存储器402、输入装置403和输出装置404可通过总线或其它方式连接,其中,图4中以通过总线连接为例。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行舆情处理服务器的各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入装置403可用于接收输入的数字或字符信息,以及产生与舆情处理服务器的用户设置以及功能控制有关的键信号输入。
具体在本实施例中,处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能:
获取应用程序的原始舆情信息;
根据所述原始舆情信息生成舆情结果;
当所述舆情结果达到第一预设条件时,生成舆情预警信息;
当所述舆情预警信息达到第二预设条件时,生成所述应用程序的故障信息。
相应的,所述获取应用程序的原始舆情信息,包括下述中的任意一种或者多种的组合:
利用网络爬虫从网络中获取应用程序的原始舆情信息;
从应用程序内部提取所述应用程序的原始舆情信息;
从应用程序的客服信息中获取所述应用程序的原始舆情信息。
相应的,所述根据所述原始舆情信息生成舆情结果,包括以下任意一种或多种的组合:
获得所述原始舆情信息的总数量作为舆情总量;
对所述原始舆情信息进行分词后,与预先建立的公用词库中的正向情感词进行匹配,将具有所述正向情感词的原始舆情信息的数量进行累计作为正向舆情总量;
对所述原始舆情信息进行分词后,与预先建立的公用词库中的负向情感词进行匹配,将具有所述负向情感词的原始舆情信息的数量进行累计作为负向舆情总量;
对所述原始舆情信息进行分词后,与预先建立的所述应用程序的私有词库中的关键词进行匹配,获得不同关键词所对应的原始舆情信息数量。
相应的,当所述舆情结果达到第一预设条件时,生成舆情预警信息,包括:
当所述舆情总量超过第一预设阈值和/或所述舆情总量在预定时间段内的变化量超过预设第二预设阈值时,生成舆情预警信息;
当所述负向舆情总量超过第三预设阈值和/或所述负向舆情总量在预定时间段内的变化量超过预设第四预设阈值时,生成舆情预警信息;
当任一关键词对应的原始舆情信息数量超过第五预设阈值时,生成舆情预警信息。
相应的,当所述舆情预警信息达到第二预设条件时,生成所述应用程序的故障信息,包括:
根据所述关键词的类别,当具有同一类别的关键词对应的原始舆情信息数量超过第五预设阈值所产生的舆情预警信息的数量超过第六预设阈值时,生成所述应用程序在该类别的故障信息。
相应的,还包括:
对所述应用程序的故障信息进行分析,确定故障原因。
相应的,所述对所述应用程序的故障信息进行分析,确定故障原因,包括:
确定所述故障信息所对应的发生时间段和/或发生地区;
获取所述发生时间段和/或所述发生地区的运营数据,按照预设链路顺序查找是否存在与所述故障信息对应的运营数据,确定故障原因。
相应的,所述对所述应用程序的故障信息进行分析,确定故障原因,包括:
确定所述应用程序的故障信息的类别;
运行该类别对应的测试用例,生成运行结果;
根据所述运行结果确定故障原因。
这样,本发明实施例通过获取应用程序的原始舆情信息生成舆情结果,实现对应用程序的舆情进行监控,客观准确程序舆情的变化,监控应用程序的突发热点,进一步在舆情结果达到预设条件时生成舆情预警信息,自动分析舆情预警信息,在达到另一预设条件时将舆情预警信息转换为应用程序的故障信息并加以跟进,从而高效解决负面舆情所产生的影响。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (16)

1.一种舆情处理方法,其特征在于,所述方法包括:
获取应用程序的原始舆情信息;
根据所述原始舆情信息生成舆情结果;
当所述舆情结果达到第一预设条件时,生成舆情预警信息;
当所述舆情预警信息达到第二预设条件时,生成所述应用程序的故障信息。
2.根据权利要求1所述的方法,其特征在于,所述获取应用程序的原始舆情信息,包括下述中的任意一种或者多种的组合:
利用网络爬虫从网络中获取应用程序的原始舆情信息;
从应用程序内部提取所述应用程序的原始舆情信息;
从应用程序的客服信息中获取所述应用程序的原始舆情信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述原始舆情信息生成舆情结果,包括以下任意一种或多种的组合:
获得所述原始舆情信息的总数量作为舆情总量;
对所述原始舆情信息进行分词后,与预先建立的公用词库中的正向情感词进行匹配,将具有所述正向情感词的原始舆情信息的数量进行累计作为正向舆情总量;
对所述原始舆情信息进行分词后,与预先建立的公用词库中的负向情感词进行匹配,将具有所述负向情感词的原始舆情信息的数量进行累计作为负向舆情总量;
对所述原始舆情信息进行分词后,与预先建立的所述应用程序的私有词库中的关键词进行匹配,获得不同关键词所对应的原始舆情信息数量。
4.根据权利要求3所述的方法,其特征在于,所述当所述舆情结果达到第一预设条件时,生成舆情预警信息,包括:
当所述舆情总量超过第一预设阈值和/或所述舆情总量在预定时间段内的变化量超过预设第二预设阈值时,生成舆情预警信息;
当所述负向舆情总量超过第三预设阈值和/或所述负向舆情总量在预定时间段内的变化量超过预设第四预设阈值时,生成舆情预警信息;
当任一关键词对应的原始舆情信息数量超过第五预设阈值时,生成舆情预警信息。
5.根据权利要求4所述的方法,其特征在于,所述当所述舆情预警信息达到第二预设条件时,生成所述应用程序的故障信息,包括:
根据所述关键词的类别,当具有同一类别的关键词对应的原始舆情信息数量超过第五预设阈值所产生的舆情预警信息的数量超过第六预设阈值时,生成所述应用程序在该类别的故障信息。
6.根据权利要求1或5所述的方法,其特征在于,所述方法还包括:
对所述应用程序的故障信息进行分析,确定故障原因。
7.根据权利要求6所述的方法,其特征在于,所述对所述应用程序的故障信息进行分析,确定故障原因,包括:
确定所述故障信息所对应的发生时间段和/或发生地区;
获取所述发生时间段和/或所述发生地区的运营数据,按照预设链路顺序查找是否存在与所述故障信息对应的运营数据,确定故障原因。
8.根据权利要求6所述的方法,其特征在于,所述对所述应用程序的故障信息进行分析,确定故障原因,包括:
确定所述应用程序的故障信息的类别;
运行该类别对应的测试用例,生成运行结果;
根据所述运行结果确定故障原因。
9.一种舆情处理装置,其特征在于,所述装置包括:
获取单元,用于获取应用程序的原始舆情信息;
第一生成单元,用于根据所述原始舆情信息生成舆情结果;
第二生成单元,用于当所述舆情结果达到第一预设条件时,生成舆情预警信息;
第三生成单元,用于当所述舆情预警信息达到第二预设条件时,生成所述应用程序的故障信息。
10.根据权利要求9所述的装置,其特征在于,所述获取单元包括下述中的任意一种或者多种的组合:
第一获取子单元,用于利用网络爬虫从网络中获取应用程序的原始舆情信息;
第二获取子单元,用于从应用程序内部提取所述应用程序的原始舆情信息;
第三获取子单元,用于从应用程序的客服信息中获取所述应用程序的原始舆情信息。
11.根据权利要求9所述的装置,其特征在于,所述第一生成单元包括以下任意一种或多种的组合:
第一获得子单元,用于获得所述原始舆情信息的总数量作为舆情总量;
第一匹配子单元,用于对所述原始舆情信息进行分词后,与预先建立的公用词库中的正向情感词进行匹配,将具有所述正向情感词的原始舆情信息的数量进行累计作为正向舆情总量;
第二匹配子单元,用于对所述原始舆情信息进行分词后,与预先建立的公用词库中的负向情感词进行匹配,将具有所述负向情感词的原始舆情信息的数量进行累计作为负向舆情总量;
第二获得子单元,用于对所述原始舆情信息进行分词后,与预先建立的所述应用程序的私有词库中的关键词进行匹配,获得不同关键词所对应的原始舆情信息数量。
12.根据权利要求11所述的装置,其特征在于,所述第二生成单元包括:
第一生成子单元,用于当所述舆情总量超过第一预设阈值和/或所述舆情总量在预定时间段内的变化量超过预设第二预设阈值时,生成舆情预警信息;
第二生成子单元,用于当所述负向舆情总量超过第三预设阈值和/或所述负向舆情总量在预定时间段内的变化量超过预设第四预设阈值时,生成舆情预警信息;
第三生成子单元,用于当任一关键词对应的原始舆情信息数量超过第五预设阈值时,生成舆情预警信息。
13.根据权利要求12所述的装置,其特征在于,所述第三生成单元具体用于:
根据所述关键词的类别,当具有同一类别的关键词对应的原始舆情信息数量超过第五预设阈值所产生的舆情预警信息的数量超过第六预设阈值时,生成所述应用程序在该类别的故障信息。
14.根据权利要求9或13所述的装置,其特征在于,所述装置还包括:
确定单元,用于对所述应用程序的故障信息进行分析,确定故障原因。
15.根据权利要求14所述的装置,其特征在于,所述确定单元包括:
第一确定子单元,用于确定所述故障信息所对应的发生时间段和/或发生地区;
第四获取子单元,用于获取所述发生时间段和/或所述发生地区的运营数据;
第二确定子单元,用于按照预设链路顺序查找是否存在与所述故障信息对应的运营数据,确定故障原因。
16.根据权利要求14所述的装置,其特征在于,所述确定单元包括:
第三确定子单元,用于确定所述应用程序的故障信息的类别;
运行子单元,用于运行该类别对应的测试用例,生成运行结果;
第四确定子单元,用于根据所述运行结果确定故障原因。
CN201611103665.0A 2016-12-05 2016-12-05 一种舆情处理方法及装置 Pending CN108153764A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611103665.0A CN108153764A (zh) 2016-12-05 2016-12-05 一种舆情处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611103665.0A CN108153764A (zh) 2016-12-05 2016-12-05 一种舆情处理方法及装置

Publications (1)

Publication Number Publication Date
CN108153764A true CN108153764A (zh) 2018-06-12

Family

ID=62469913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611103665.0A Pending CN108153764A (zh) 2016-12-05 2016-12-05 一种舆情处理方法及装置

Country Status (1)

Country Link
CN (1) CN108153764A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271512A (zh) * 2018-08-29 2019-01-25 中国平安保险(集团)股份有限公司 舆情评论信息的情感分析方法、装置及存储介质
CN109325124A (zh) * 2018-09-30 2019-02-12 武汉斗鱼网络科技有限公司 一种情感分类方法、装置、服务器和存储介质
CN109522463A (zh) * 2018-10-18 2019-03-26 西南石油大学 应用程序的舆情分析方法和装置
CN109543186A (zh) * 2018-11-22 2019-03-29 北京奇安信科技有限公司 一种舆情信息处理方法、系统、电子设备和介质
CN109684427A (zh) * 2018-12-06 2019-04-26 武汉虹旭信息技术有限责任公司 基于移动互联网有害信息的地图监控告警系统及其方法
CN114297990A (zh) * 2021-12-22 2022-04-08 北京捷通华声科技股份有限公司 舆情监控方法、装置、计算机可读存储介质及处理器

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
CN103902659A (zh) * 2014-03-04 2014-07-02 深圳市至高通信技术发展有限公司 一种舆情分析方法及相应的装置
CN104573016A (zh) * 2015-01-12 2015-04-29 武汉泰迪智慧科技有限公司 一种基于行业的垂直舆情分析系统及方法
CN105069103A (zh) * 2015-05-07 2015-11-18 Tcl集团股份有限公司 App搜索引擎利用用户评论的方法及系统
CN105824959A (zh) * 2016-03-31 2016-08-03 首都信息发展股份有限公司 舆情监控方法及系统
CN106022878A (zh) * 2016-05-19 2016-10-12 华南理工大学 基于社区评论情感倾向性分析的手游排行榜构建方法
CN106126558A (zh) * 2016-06-16 2016-11-16 东软集团股份有限公司 一种舆情监控方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
CN103902659A (zh) * 2014-03-04 2014-07-02 深圳市至高通信技术发展有限公司 一种舆情分析方法及相应的装置
CN104573016A (zh) * 2015-01-12 2015-04-29 武汉泰迪智慧科技有限公司 一种基于行业的垂直舆情分析系统及方法
CN105069103A (zh) * 2015-05-07 2015-11-18 Tcl集团股份有限公司 App搜索引擎利用用户评论的方法及系统
CN105824959A (zh) * 2016-03-31 2016-08-03 首都信息发展股份有限公司 舆情监控方法及系统
CN106022878A (zh) * 2016-05-19 2016-10-12 华南理工大学 基于社区评论情感倾向性分析的手游排行榜构建方法
CN106126558A (zh) * 2016-06-16 2016-11-16 东软集团股份有限公司 一种舆情监控方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
左东广: "《电子设备检测与故障分析》", 31 January 2016, 北京航空航天大学出版社 *
负荷: "腾讯舆情团队谈:如何发现下一个现象级游戏?", 《HTTPS://ZHUANLAN.ZHIHU.COM/P/21974305》 *
郭军: "《网络管理第2版》", 30 September 2003, 北京邮电大学出版社 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271512A (zh) * 2018-08-29 2019-01-25 中国平安保险(集团)股份有限公司 舆情评论信息的情感分析方法、装置及存储介质
CN109271512B (zh) * 2018-08-29 2023-11-24 中国平安保险(集团)股份有限公司 舆情评论信息的情感分析方法、装置及存储介质
CN109325124A (zh) * 2018-09-30 2019-02-12 武汉斗鱼网络科技有限公司 一种情感分类方法、装置、服务器和存储介质
CN109325124B (zh) * 2018-09-30 2020-10-16 武汉斗鱼网络科技有限公司 一种情感分类方法、装置、服务器和存储介质
CN109522463A (zh) * 2018-10-18 2019-03-26 西南石油大学 应用程序的舆情分析方法和装置
CN109543186A (zh) * 2018-11-22 2019-03-29 北京奇安信科技有限公司 一种舆情信息处理方法、系统、电子设备和介质
CN109543186B (zh) * 2018-11-22 2023-12-19 奇安信科技集团股份有限公司 一种舆情信息处理方法、系统、电子设备和介质
CN109684427A (zh) * 2018-12-06 2019-04-26 武汉虹旭信息技术有限责任公司 基于移动互联网有害信息的地图监控告警系统及其方法
CN114297990A (zh) * 2021-12-22 2022-04-08 北京捷通华声科技股份有限公司 舆情监控方法、装置、计算机可读存储介质及处理器

Similar Documents

Publication Publication Date Title
CN108153764A (zh) 一种舆情处理方法及装置
Ahmed et al. Detecting opinion spams and fake news using text classification
Nouh et al. Understanding the radical mind: Identifying signals to detect extremist content on twitter
Gu et al. " what parts of your apps are loved by users?"(T)
Ferrara Measuring social spam and the effect of bots on information diffusion in social media
Ratkiewicz et al. Detecting and tracking the spread of astroturf memes in microblog streams
Kolari et al. Detecting spam blogs: A machine learning approach
Kumar et al. Multimedia social big data: Mining
Brynielsson et al. Emotion classification of social media posts for estimating people’s reactions to communicated alert messages during crises
CN102946331B (zh) 一种社交网络僵尸用户检测方法及装置
BR112014028739B1 (pt) Sistema e método para criar objetos estruturados de evento
CN103299304A (zh) 分类规则生成装置、分类规则生成方法、分类规则生成程序以及记录介质
Menini et al. A system to monitor cyberbullying based on message classification and social network analysis
CN108021660B (zh) 一种基于迁移学习的话题自适应的微博情感分析方法
CN103164698A (zh) 指纹库生成方法及装置、待测文本指纹匹配方法及装置
Cao et al. Topics and trends of the on-line public concerns based on Tianya forum
CN108733791A (zh) 网络事件检测方法
Emmery et al. Simple queries as distant labels for predicting gender on twitter
Peng et al. Discovering the influence of sarcasm in social media responses
Spangler et al. Mining the talk: Unlocking the business value in unstructured information
CN106294406A (zh) 一种用于处理应用访问数据的方法与设备
CN110263817B (zh) 一种基于用户账号的风险等级划分方法及装置
Rajesh et al. Fraudulent news detection using machine learning approaches
Cécillon et al. Wac: A corpus of wikipedia conversations for online abuse detection
Meghji et al. Predicting student academic performance using data generated in higher educational institutes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180612

RJ01 Rejection of invention patent application after publication