CN109800302A - 基于循环神经网络算法的舆情预警方法、装置、终端及介质 - Google Patents

基于循环神经网络算法的舆情预警方法、装置、终端及介质 Download PDF

Info

Publication number
CN109800302A
CN109800302A CN201811530781.XA CN201811530781A CN109800302A CN 109800302 A CN109800302 A CN 109800302A CN 201811530781 A CN201811530781 A CN 201811530781A CN 109800302 A CN109800302 A CN 109800302A
Authority
CN
China
Prior art keywords
keyword
public sentiment
correlation
news
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811530781.XA
Other languages
English (en)
Inventor
谢波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201811530781.XA priority Critical patent/CN109800302A/zh
Publication of CN109800302A publication Critical patent/CN109800302A/zh
Priority to PCT/CN2019/122787 priority patent/WO2020119533A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Abstract

本发明属于神经网络技术领域,公开了一种基于循环神经网络算法的舆情预警方法、装置、终端及介质,通过获取预设时间内舆情新闻,并确定所述舆情新闻中关键词的倾向度,再根据所述关键词的倾向度,确定所述关键词对应的特征向量,再根据所述关键词对应的特征向量,确定所述舆情新闻的特征序列,最后将所述舆情新闻的特征序列输入已训练的循环神经网络模型,确定舆情预警指标,根据所述舆情预警指标,发出舆情预警,可以准确判断舆情走向,解决了现有技术舆情的发展趋势预测效果差的技术问题。

Description

基于循环神经网络算法的舆情预警方法、装置、终端及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于循环神经网络算法的舆情预警方法、装置、终端及介质。
背景技术
随着互联网技术的快速发展,网络的开发性和灵活性让其成为反映社会舆情的主要载体之一。舆情预警可以在第一时间发现与"我"相关的舆情信息、负面信息,重大舆情及时预警;提供定性定量的舆情分析数据,准确判断具体舆情或者某一舆情专题的发展变化趋势;自动生成舆情报告和各种统计报表,提高舆情管理的质量和效率,辅助领导决策。
目前,市场上存在许多舆情预警方法,但是存在很多不足和缺陷,例如舆情的发展趋势预测效果差。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供了一种基于循环神经网络算法的舆情预警方法、装置、终端及介质,旨在解决现有技术舆情的发展趋势预测效果差的技术问题。
为实现上述目的,本发明提供了一种基于循环神经网络算法的舆情预警方法,其特征在于,包括如下步骤:
获取预设时间内舆情新闻,并确定所述舆情新闻中关键词的倾向度;
根据所述关键词的倾向度,确定所述关键词对应的特征向量;
根据所述关键词对应的特征向量,确定所述舆情新闻的特征序列;
将所述舆情新闻的特征序列输入已训练的循环神经网络模型,确定舆情预警指标;
根据所述舆情预警指标,发出舆情预警。
优选地,所述获取预设时间内舆情新闻,并确定所述舆情新闻中关键词的倾向度的步骤,包括:
获取预设时间内舆情新闻以及预先建立的关键词库,并确定所述舆情新闻中关键词的倾向度。
优选地,所述关键词的倾向度包括正面倾向度、负面倾向度以及中立倾向度,所述正面倾向度、负面倾向度以及中立倾向度为所述关键词分别出现在正面新闻、负面新闻、中立新闻中概率;
相应地,所述获取预设时间内舆情新闻以及预先建立的关键词库,并确定所述舆情新闻中关键词的倾向度的步骤之前,所述基于循环神经网络算法的舆情预警方法还包括如下步骤:
建立关键词库,所述关键词库包括正面关键词集、负面关键词集以及中立关键词集;
计算每个关键词与各关键词集中的其余关键词的相关性;
根据每个关键词与各关键词集中的其余关键词的相关性,计算该关键词的正面倾向度、负面倾向度以及中立倾向度。
优选地,所述根据每个关键词与各关键词集中的其余关键词的相关性,计算该关键词的正面倾向度、负面倾向度以及中立倾向度的步骤,包括:
将关键词与正面关键词集中的其余关键词的相关性、与负面关键词集中的其余关键词的相关性、与中立关键词集中的其余关键词的相关性的差值作为正面倾向度;
将关键词与负面关键词集中的其余关键词的相关性、与正面关键词集中的其余关键词的相关性、与中立关键词集中的其余关键词的相关性的差值作为负面倾向度;
将关键词与中立关键词集中的其余关键词的相关性、与正面关键词集中的其余关键词的相关性、与负面关键词集中的其余关键词的相关性的差值作为中立倾向度。
优选地,所述计算每个关键词与各关键词集中的其余关键词的相关性的步骤,包括:
根据公式计算所述关键词与正面关键词集中的其余关键词的相关性;
其中,n为正面关键词集中关键词的个数;
rec(w,v)为w,v两个关键词的相关性;
P为正面关键词集;
p(w)为w关键词在文档中出现的概率,
p(v)为v关键词在文档中出现的概率;
p(w,v)为w和v共同在文档中出现的概率。
优选地,所述计算每个关键词与各关键词集中的其余关键词的相关性的步骤,包括:
根据公式计算所述关键词与负面关键词集中的其余关键词的相关性;
其中,m为负面关键词集中关键词的个数;
rec(w,v)为w,v两个关键词的相关性;
Q为正面关键词集;
p(w)为w关键词在文档中出现的概率,
p(v)为v关键词在文档中出现的概率;
p(w,v)为w和v共同在文档中出现的概率。
优选地,所述计算每个关键词与各关键词集中的其余关键词的相关性的步骤,包括:
根据公式计算所述关键词与中立关键词集中的其余关键词的相关性;
其中,k为中立关键词集中关键词的个数;
rec(w,v)为w,v两个关键词的相关性;
M为中立关键词集;
p(w)为w关键词在文档中出现的概率,
p(v)为v关键词在文档中出现的概率;
p(w,v)为w和v共同在文档中出现的概率。
基于上述发明目的,本发明还提供一种基于循环神经网络算法的舆情预警装置,包括:
舆情获取模块,用于获取预设时间内舆情新闻,并确定所述舆情新闻中关键词的倾向度;
向量建立模块,用于根据所述关键词的倾向度,确定所述关键词对应的特征向量;
序列确定模块,用于根据所述关键词对应的特征向量,确定所述舆情新闻的特征序列;
指标确定模块,用于将所述舆情新闻的特征序列输入已训练的循环神经网络模型,确定舆情预警指标;
预警发出模块,用于根据所述舆情预警指标,发出舆情预警。
基于上述发明目的,本发明还提供一种终端,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于循环神经网络算法的舆情预警程序,所述基于循环神经网络算法的舆情预警程序配置为实现如上述的基于循环神经网络算法的舆情预警方法的步骤。
基于上述发明目的,本发明还提供一种存储介质,所述存储介质上存储有基于循环神经网络算法的舆情预警程序,所述基于循环神经网络算法的舆情预警程序被处理器执行时实现如上述的基于循环神经网络算法的舆情预警方法的步骤。
本发明通过获取预设时间内舆情新闻,并确定所述舆情新闻中关键词的倾向度,再根据所述关键词的倾向度,确定所述关键词对应的特征向量,再根据所述关键词对应的特征向量,确定所述舆情新闻的特征序列,最后将所述舆情新闻的特征序列输入已训练的循环神经网络模型,确定舆情预警指标,根据所述舆情预警指标,发出舆情预警,可以准确判断舆情走向,解决了现有技术舆情的发展趋势预测效果差的技术问题。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的终端的结构示意图;
图2为本发明基于循环神经网络算法的舆情预警方法第一实施例的流程示意图;
图3为本发明基于循环神经网络算法的舆情预警方法第二实施例的流程示意图;
图4为本发明基于循环神经网络算法的舆情预警方法第三实施例的流程示意图;
图5为本发明基于循环神经网络算法的舆情预警方法第四实施例的流程示意图;
图6为本发明基于循环神经网络算法的舆情预警装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的终端结构示意图。
如图1所示,该终端可以包括:处理器1001,例如中央处理器(Central ProcessingUnit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入模块比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及基于循环神经网络算法的舆情预警程序。
在图1所示的终端中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明终端中的处理器1001、存储器1005可以设置在终端中,所述终端通过处理器1001调用存储器1005中存储的基于循环神经网络算法的舆情预警程序,并执行本发明实施例提供的基于循环神经网络算法的舆情预警方法。
本发明实施例提供了一种基于循环神经网络算法的舆情预警方法,参照图2,图2为本发明基于循环神经网络算法的舆情预警方法第一实施例的流程示意图。
本实施例中,所述基于循环神经网络算法的舆情预警方法包括如下步骤:
步骤S10:获取预设时间内舆情新闻,并确定所述舆情新闻中关键词的倾向度;
需要说明的是,本实施例方法的执行主体为终端,舆情新闻是一种网络舆情,通过网络平台进行扩散和传播。舆情新闻可以是通过网页、或者第三方软件、插件等发布的。而舆情新闻的获取可以是通过API接口获取,也可以是通过网页爬虫等方式获取,在此不做具体限制。
关键词的倾向度可以分为正面倾向度、负面倾向度,也可以分为正面倾向度、负面倾向度以及中立倾向度。关键词的正面倾向度为正面评价的程度,关键词的负面倾向度为负面评价的程度,关键词的中立倾向度为中立评价的程度。
通过在获取预设时间内舆情新闻前,需要对舆情新闻进行预处理,预处理的方法包括:
步骤S100a:对舆情新闻进行聚类。由于舆情新闻在时间上具有突发性,不具有普遍的规律,因此需要对舆情新闻的同一话题(例如关于公司高层人事离职、公司战略政策相关内容等)的数量进行预测。聚类过程主要是将所描述为同一话题的舆情新闻聚合到同一类别中。聚类方法可以采用现有技术中常规的聚类方法,在此不做具体限制。
步骤S100b:获取相关话题。网络上出现的舆情新闻数量通过会很多,对应的话题也会很多。舆情预测通常关注的话题可以是用户自定义,也可以是设置为企业关注的常规话题,例如公司高层人事离职、公司战略政策相关内容等。获取舆情新闻中相关话题,可以是通过关键词检索获取,也可以采用其他常规手段,在此不做具体限制。
步骤S100c:对舆情新闻进行数据聚合。通过对舆情新闻进行数据聚合,得到一个时间序列,每个时刻的值是到当前时刻为止网络上所有舆情新闻的数量。
具体实现时,获取预设时间内舆情新闻,采用分词工具对获取的舆情新闻进行分词,获取每条舆情新闻中的关键词,再确定关键词的倾向度。
确定关键词的倾向度可以是预先采集历史舆情新闻,对历史舆情新闻进行标记,统计舆情新闻中关键词在正面评价的舆情新闻中出现的次数,或负面评价的舆情新闻中出现的次数,以此建立关键词的倾向度库;在确定某个关键词的倾向度时,则在倾向度库中查找关键词对应的倾向度即可。
步骤S20:根据所述关键词的倾向度,确定所述关键词对应的特征向量;
需要说明的是,所述根据所述关键词的倾向度,确定所述关键词对应的特征向量是将关键词的倾向度作为对应的权值,构建关键词对应的特征向量。特征向量的维数可以根据倾向度的划分而定,例如倾向度分为正面倾向度、负面倾向度以及中立倾向度,则特征向量可以设置为至少三维。
步骤S30:根据所述关键词对应的特征向量,确定所述舆情新闻的特征序列;
应该理解的是,舆情新闻是由多个关键词组成的,所述根据所述关键词对应的特征向量,确定所述舆情新闻的特征序列的步骤可以为将关键词对应的特征向量组合形成舆情新闻的特征序列。例如,一条舆情新闻中关键词为m个,构建该舆情新闻的特征序列可以为3×m或者m×3维特征向量,也可以根据具体分类确定特征序列的维数。
步骤S40:将所述舆情新闻的特征序列输入已训练的循环神经网络模型,确定舆情预警指标;
应该理解的是,将舆情新闻的特征序列作为循环神经网络模型的输入,循环神经网络的隐含层包括历史舆情新闻的隐含向量,通过循环神经网络模型,得到舆情的整体倾向度,作为舆情预警指标。
另外,由于舆情新闻在某一时刻或时间段内,舆情新闻所影响的区域性范围也是不一样的,例如国家、省、市等,因此考虑舆情新闻的数量是可以将舆情新闻的区域性范围作为一修正值,记为t1。
由于媒体的报道也会对舆情新闻的数量有着较大的影响,因此,舆情新闻的曝光度也考虑作为一修正值,记为t2。
舆情新闻的流通量也可以反映出舆情信息在网络上传播情况以及讨论热度,因此,舆情新闻的流通量也可以作为一修正值,记为t3。修正值t3的设定可以是用户自定义。例如关于公司高层人事离职的舆情新闻的流通量可能并不一定大,但是对于企业而言,这一话题的关注度往往会比较高,因此可以通过调节t3来进行修正。
循环神经网络模型的训练方法可以是通过网络抓取舆情新闻数据;初始化循环神经网络模型的参数,根据舆情新闻数据中关键词数据以及循环神经网络模型计算循环神经网络模型中的参数,具体训练方式也可以采用本领域公知的方法。
步骤S50:根据所述舆情预警指标,发出舆情预警。
具体实现时,所述根据所述舆情预警指标,发出舆情预警,可以是在舆情预警指标大于一预设阀值时,发出舆情预警。其中预设阀值可以是用户自定义的,也可以根据舆情新闻的话题内容预先设定的。发出舆情预警的方式可以多种,例如通过手机电话、短信、邮件等形式,也可以是用户自定义的同时方式。
本发明通过获取预设时间内舆情新闻,并确定所述舆情新闻中关键词的倾向度,再根据所述关键词的倾向度,确定所述关键词对应的特征向量,再根据所述关键词对应的特征向量,确定所述舆情新闻的特征序列,最后将所述舆情新闻的特征序列输入已训练的循环神经网络模型,确定舆情预警指标,根据所述舆情预警指标,发出舆情预警,可以准确判断舆情走向,解决了现有技术舆情的发展趋势预测效果差的技术问题。
参考图3,图3为本发明基于循环神经网络算法的舆情预警方法第二实施例的流程示意图。
基于上述第一实施例,在本实施例中,所述步骤S10,包括:
步骤S101,获取预设时间内舆情新闻以及预先建立的关键词库,并确定所述舆情新闻中关键词的倾向度。
需要说明的是,关键词库也可以分为正面关键词集、负面关键词集以及中立关键词集,或者是分为正面关键词以及负面关键词集,具体分类方式根据需求设定。
预先建立的关键词库可以是根据带标签的舆情新闻,将标签为正面评价的舆情新闻中出现的关键词放入正面关键词集中,将标签为负面评价的舆情新闻中出现的关键词放入负面关键词集中,将标签为中立评价的舆情新闻中出现的关键词放入中立关键词集中。各关键词集中的关键词也可以是用户根据经验等定义的。
参考图4,图4为本发明基于循环神经网络算法的舆情预警方法第三实施例的流程示意图。
基于上述第二实施例,所述关键词的倾向度包括正面倾向度、负面倾向度以及中立倾向度,所述正面倾向度、负面倾向度以及中立倾向度为所述关键词分别出现在正面新闻、负面新闻、中立新闻中概率,在本实施例中,所述步骤S101,具体包括:
步骤S1011:建立关键词库,所述关键词库包括正面关键词集、负面关键词集以及中立关键词集;
需要说明的是,关键词库的定义可以根据具体需要进行分类,可以是包括正面关键词集、负面关键词集以及中立关键词集,也可以是包括正面关键词集、负面关键词集。
步骤S1012:计算每个关键词与各关键词集中的其余关键词的相关性;
需要说明的是,通过计算每个关键词与各关键词集中的其余关键词的相关性,可以确定该关键词的倾向度,例如关键词A,正面关键词集{A,B,C,D},通过计算A与B、C、D的相关性来确定A的正面倾向度。
根据公式计算所述关键词与正面关键词集中的其余关键词的相关性;
其中,n为正面关键词集中关键词的个数;
rec(w,v)为w,v两个关键词的相关性;
P为正面关键词集;
p(w)为w关键词在文档中出现的概率,
p(v)为v关键词在文档中出现的概率;
p(w,v)为w和v共同在文档中出现的概率。
优选地,根据公式计算所述关键词与负面关键词集中的其余关键词的相关性;
其中,m为负面关键词集中关键词的个数;
rec(w,v)为w,v两个关键词的相关性;
Q为正面关键词集;
p(w)为w关键词在文档中出现的概率,
p(v)为v关键词在文档中出现的概率;
p(w,v)为w和v共同在文档中出现的概率。
优选地,根据公式计算所述关键词与中立关键词集中的其余关键词的相关性;
其中,k为中立关键词集中关键词的个数;
rec(w,v)为w,v两个关键词的相关性;
M为中立关键词集;
p(w)为w关键词在文档中出现的概率,
p(v)为v关键词在文档中出现的概率;
p(w,v)为w和v共同在文档中出现的概率。
步骤S1013:根据每个关键词与各关键词集中的其余关键词的相关性,计算该关键词的正面倾向度、负面倾向度以及中立倾向度。
具体实现时,可以是将每个关键词与各关键词集中的其余关键词的相关性的均值作为该关键词的对应的倾向度。
参考图5,图5为本发明基于循环神经网络算法的舆情预警方法第四实施例的流程示意图。
基于上述第三实施例,在本实施例中,所述步骤S1013,具体包括:
步骤S1013a:将关键词与正面关键词集中的其余关键词的相关性、与负面关键词集中的其余关键词的相关性、与中立关键词集中的其余关键词的相关性的差值作为正面倾向度;
需要说明的是,步骤S1013a、步骤S1013b以及步骤S1013c之间没有先后关系,可以是步骤S1013c在前,步骤S1013a和步骤S1013b在后,也可以同步进行,故,在此不做具体限制。
具体实现时,某一关键词的正面倾向度=关键词与正面关键词集中的其余关键词的相关性-与负面关键词集中的其余关键词的相关性-与中立关键词集中的其余关键词的相关性,即rel1-rel2-rel3。
通常是,某一关键词的正面倾向度=关键词与正面关键词集中的其余关键词的相关性的平均值-与负面关键词集中的其余关键词的相关性的平均值-与中立关键词集中的其余关键词的相关性的平均值。
步骤S1013b:将关键词与负面关键词集中的其余关键词的相关性、与正面关键词集中的其余关键词的相关性、与中立关键词集中的其余关键词的相关性的差值作为负面倾向度;
具体实现时,某一关键词的负面倾向度=关键词与负面关键词集中的其余关键词的相关性-与正面关键词集中的其余关键词的相关性-与中立关键词集中的其余关键词的相关性,即rel2-rel1-rel3。
通常是,某一关键词的负面倾向度=关键词与负面关键词集中的其余关键词的相关性的平均值-与正面关键词集中的其余关键词的相关性的平均值-与中立关键词集中的其余关键词的相关性的平均值。
步骤S1013c:将关键词与中立关键词集中的其余关键词的相关性、与正面关键词集中的其余关键词的相关性、与负面关键词集中的其余关键词的相关性的差值作为中立倾向度。
具体实现时,某一关键词的中立倾向度=关键词与中立关键词集中的其余关键词的相关性-与正面关键词集中的其余关键词的相关性-与负面关键词集中的其余关键词的相关性,即rel3-rel1-rel2。
通常是,某一关键词的中立倾向度=关键词与中立关键词集中的其余关键词的相关性的平均值-与正面关键词集中的其余关键词的相关性的平均值-与负面关键词集中的其余关键词的相关性的平均值。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于循环神经网络算法的舆情预警程序,所述基于循环神经网络算法的舆情预警程序被处理器执行时实现如上文所述的基于循环神经网络算法的舆情预警方法的步骤。
参照图6,图6为本发明基于循环神经网络算法的舆情预警装置第一实施例的结构框图。
如图6所示,本发明实施例提出的基于循环神经网络算法的舆情预警装置包括:
舆情获取模块601,用于获取预设时间内舆情新闻,并确定所述舆情新闻中关键词的倾向度;
需要说明的是,舆情新闻是一种网络舆情,通过网络平台进行扩散和传播。舆情新闻可以是通过网页、或者第三方软件、插件等发布的。而舆情新闻的获取可以是通过API接口获取,也可以是通过网页爬虫等方式获取,在此不做具体限制。
关键词的倾向度可以分为正面倾向度、负面倾向度,也可以分为正面倾向度、负面倾向度以及中立倾向度。关键词的正面倾向度为正面评价的程度,关键词的负面倾向度为负面评价的程度,关键词的中立倾向度为中立评价的程度。
向量建立模块602,用于根据所述关键词的倾向度,确定所述关键词对应的特征向量;
需要说明的是,所述根据所述关键词的倾向度,确定所述关键词对应的特征向量是将关键词的倾向度作为对应的权值,构建关键词对应的特征向量。特征向量的维数可以根据倾向度的划分而定,例如倾向度分为正面倾向度、负面倾向度以及中立倾向度,则特征向量可以设置为至少三维。
序列确定模块603,用于根据所述关键词对应的特征向量,确定所述舆情新闻的特征序列;
应该理解的是,舆情新闻是由多个关键词组成的,所述根据所述关键词对应的特征向量,确定所述舆情新闻的特征序列的步骤可以为将关键词对应的特征向量组合形成舆情新闻的特征序列。例如,一条舆情新闻中关键词为m个,构建该舆情新闻的特征序列可以为3×m或者m×3维特征向量,也可以根据具体分类确定特征序列的维数。
指标确定模块604,用于将所述舆情新闻的特征序列输入已训练的循环神经网络模型,确定舆情预警指标;
应该理解的是,将舆情新闻的特征序列作为循环神经网络模型的输入,循环神经网络的隐含层包括历史舆情新闻的隐含向量,通过循环神经网络模型,得到舆情的整体倾向度,作为舆情预警指标。
另外,由于舆情新闻在某一时刻或时间段内,舆情新闻所影响的区域性范围也是不一样的,例如国家、省、市等,因此考虑舆情新闻的数量是可以将舆情新闻的区域性范围作为一修正值,记为t1。
由于媒体的报道也会对舆情新闻的数量有着较大的影响,因此,舆情新闻的曝光度也考虑作为一修正值,记为t2。
舆情新闻的流通量也可以反映出舆情信息在网络上传播情况以及讨论热度,因此,舆情新闻的流通量也可以作为一修正值,记为t3。修正值t3的设定可以是用户自定义。例如关于公司高层人事离职的舆情新闻的流通量可能并不一定大,但是对于企业而言,这一话题的关注度往往会比较高,因此可以通过调节t3来进行修正。
预警发出模块605,用于根据所述舆情预警指标,发出舆情预警。
具体实现时,所述根据所述舆情预警指标,发出舆情预警,可以是在舆情预警指标大于一预设阀值时,发出舆情预警。其中预设阀值可以是用户自定义的,也可以根据舆情新闻的话题内容预先设定的。发出舆情预警的方式可以多种,例如通过手机电话、短信、邮件等形式,也可以是用户自定义的同时方式。
本发明通过获取预设时间内舆情新闻,并确定所述舆情新闻中关键词的倾向度,再根据所述关键词的倾向度,确定所述关键词对应的特征向量,再根据所述关键词对应的特征向量,确定所述舆情新闻的特征序列,最后将所述舆情新闻的特征序列输入已训练的循环神经网络模型,确定舆情预警指标,根据所述舆情预警指标,发出舆情预警,可以准确判断舆情走向,解决了现有技术舆情的发展趋势预测效果差的技术问题。
本发明基于循环神经网络算法的舆情预警装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于循环神经网络算法的舆情预警方法,其特征在于,包括如下步骤:
获取预设时间内舆情新闻,并确定所述舆情新闻中关键词的倾向度;
根据所述关键词的倾向度,确定所述关键词对应的特征向量;
根据所述关键词对应的特征向量,确定所述舆情新闻的特征序列;
将所述舆情新闻的特征序列输入已训练的循环神经网络模型,确定舆情预警指标;
根据所述舆情预警指标,发出舆情预警。
2.如权利要求1所述的基于循环神经网络算法的舆情预警方法,其特征在于,所述获取预设时间内舆情新闻,并确定所述舆情新闻中关键词的倾向度的步骤,包括:
获取预设时间内舆情新闻以及预先建立的关键词库,并确定所述舆情新闻中关键词的倾向度。
3.如权利要求2所述的基于循环神经网络算法的舆情预警方法,其特征在于,所述关键词的倾向度包括正面倾向度、负面倾向度以及中立倾向度,所述正面倾向度、负面倾向度以及中立倾向度为所述关键词分别出现在正面新闻、负面新闻、中立新闻中概率;
相应地,所述获取预设时间内舆情新闻以及预先建立的关键词库,并确定所述舆情新闻中关键词的倾向度的步骤之前,所述基于循环神经网络算法的舆情预警方法还包括如下步骤:
建立关键词库,所述关键词库包括正面关键词集、负面关键词集以及中立关键词集;
计算每个关键词与各关键词集中的其余关键词的相关性;
根据每个关键词与各关键词集中的其余关键词的相关性,计算该关键词的正面倾向度、负面倾向度以及中立倾向度。
4.如权利要求3所述的基于循环神经网络算法的舆情预警方法,其特征在于,所述根据每个关键词与各关键词集中的其余关键词的相关性,计算该关键词的正面倾向度、负面倾向度以及中立倾向度的步骤,包括:
将关键词与正面关键词集中的其余关键词的相关性、与负面关键词集中的其余关键词的相关性、与中立关键词集中的其余关键词的相关性的差值作为正面倾向度;
将关键词与负面关键词集中的其余关键词的相关性、与正面关键词集中的其余关键词的相关性、与中立关键词集中的其余关键词的相关性的差值作为负面倾向度;
将关键词与中立关键词集中的其余关键词的相关性、与正面关键词集中的其余关键词的相关性、与负面关键词集中的其余关键词的相关性的差值作为中立倾向度。
5.如权利要求3所述的基于循环神经网络算法的舆情预警方法,其特征在于,所述计算每个关键词与各关键词集中的其余关键词的相关性的步骤,包括:
根据公式计算所述关键词与正面关键词集中的其余关键词的相关性;
其中,n为正面关键词集中关键词的个数;
rec(w,v)为w,v两个关键词的相关性;
P为正面关键词集;
p(w)为w关键词在文档中出现的概率,
p(v)为v关键词在文档中出现的概率;
p(w,v)为w和v共同在文档中出现的概率。
6.如权利要求3所述的基于循环神经网络算法的舆情预警方法,其特征在于,所述计算每个关键词与各关键词集中的其余关键词的相关性的步骤,包括:
根据公式计算所述关键词与负面关键词集中的其余关键词的相关性;
其中,m为负面关键词集中关键词的个数;
rec(w,v)为w,v两个关键词的相关性;
Q为正面关键词集;
p(w)为w关键词在文档中出现的概率,
p(v)为v关键词在文档中出现的概率;
p(w,v)为w和v共同在文档中出现的概率。
7.如权利要求3所述的基于循环神经网络算法的舆情预警方法,其特征在于,所述计算每个关键词与各关键词集中的其余关键词的相关性的步骤,包括:
根据公式计算所述关键词与中立关键词集中的其余关键词的相关性;
其中,k为中立关键词集中关键词的个数;
rec(w,v)为w,v两个关键词的相关性;
M为中立关键词集;
p(w)为w关键词在文档中出现的概率,
p(v)为v关键词在文档中出现的概率;
p(w,v)为w和v共同在文档中出现的概率。
8.一种基于循环神经网络算法的舆情预警装置,其特征在于,包括:
舆情获取模块,用于获取预设时间内舆情新闻,并确定所述舆情新闻中关键词的倾向度;
向量建立模块,用于根据所述关键词的倾向度,确定所述关键词对应的特征向量;
序列确定模块,用于根据所述关键词对应的特征向量,确定所述舆情新闻的特征序列;
指标确定模块,用于将所述舆情新闻的特征序列输入已训练的循环神经网络模型,确定舆情预警指标;
预警发出模块,用于根据所述舆情预警指标,发出舆情预警。
9.一种终端,其特征在于,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于循环神经网络算法的舆情预警程序,所述基于循环神经网络算法的舆情预警程序配置为实现如权利要求1至7中任一项所述的基于循环神经网络算法的舆情预警方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有基于循环神经网络算法的舆情预警程序,所述基于循环神经网络算法的舆情预警程序被处理器执行时实现如权利要求1至7任一项所述的基于循环神经网络算法的舆情预警方法的步骤。
CN201811530781.XA 2018-12-14 2018-12-14 基于循环神经网络算法的舆情预警方法、装置、终端及介质 Pending CN109800302A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811530781.XA CN109800302A (zh) 2018-12-14 2018-12-14 基于循环神经网络算法的舆情预警方法、装置、终端及介质
PCT/CN2019/122787 WO2020119533A1 (zh) 2018-12-14 2019-12-03 基于循环神经网络算法的舆情预警方法、装置、终端及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811530781.XA CN109800302A (zh) 2018-12-14 2018-12-14 基于循环神经网络算法的舆情预警方法、装置、终端及介质

Publications (1)

Publication Number Publication Date
CN109800302A true CN109800302A (zh) 2019-05-24

Family

ID=66556615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811530781.XA Pending CN109800302A (zh) 2018-12-14 2018-12-14 基于循环神经网络算法的舆情预警方法、装置、终端及介质

Country Status (2)

Country Link
CN (1) CN109800302A (zh)
WO (1) WO2020119533A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020119533A1 (zh) * 2018-12-14 2020-06-18 深圳壹账通智能科技有限公司 基于循环神经网络算法的舆情预警方法、装置、终端及介质
CN112256974A (zh) * 2020-11-13 2021-01-22 泰康保险集团股份有限公司 一种舆情信息的处理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090048998A (ko) * 2007-11-12 2009-05-15 주식회사 비즈모델라인 키워드를 통한 부정 여론 알림 방법 및 시스템과 이를 위한기록매체
US20130290232A1 (en) * 2012-04-30 2013-10-31 Mikalai Tsytsarau Identifying news events that cause a shift in sentiment
CN104657393A (zh) * 2013-11-25 2015-05-27 深圳市至高通信技术发展有限公司 一种舆情分析方法及相应的装置
CN108776671A (zh) * 2018-05-12 2018-11-09 苏州华必讯信息科技有限公司 一种网络舆情监控系统及方法
CN108959383A (zh) * 2018-05-31 2018-12-07 平安科技(深圳)有限公司 网络舆情的分析方法、装置及计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101074215B1 (ko) * 2009-02-27 2011-10-14 에스케이 텔레콤주식회사 여론 분석 장치 및 문서 분석을 통한 여론 평가 방법
CN105589941A (zh) * 2015-12-15 2016-05-18 北京百分点信息科技有限公司 网络文本的情感信息检测方法和装置
CN107066442A (zh) * 2017-02-15 2017-08-18 阿里巴巴集团控股有限公司 情绪值的检测方法、装置及电子设备
CN109800302A (zh) * 2018-12-14 2019-05-24 深圳壹账通智能科技有限公司 基于循环神经网络算法的舆情预警方法、装置、终端及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090048998A (ko) * 2007-11-12 2009-05-15 주식회사 비즈모델라인 키워드를 통한 부정 여론 알림 방법 및 시스템과 이를 위한기록매체
US20130290232A1 (en) * 2012-04-30 2013-10-31 Mikalai Tsytsarau Identifying news events that cause a shift in sentiment
CN104657393A (zh) * 2013-11-25 2015-05-27 深圳市至高通信技术发展有限公司 一种舆情分析方法及相应的装置
CN108776671A (zh) * 2018-05-12 2018-11-09 苏州华必讯信息科技有限公司 一种网络舆情监控系统及方法
CN108959383A (zh) * 2018-05-31 2018-12-07 平安科技(深圳)有限公司 网络舆情的分析方法、装置及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
尉译心: "情感倾向分析下的突发事件网络舆情预警分析", 《数字通信世界》, no. 07, pages 268 - 269 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020119533A1 (zh) * 2018-12-14 2020-06-18 深圳壹账通智能科技有限公司 基于循环神经网络算法的舆情预警方法、装置、终端及介质
CN112256974A (zh) * 2020-11-13 2021-01-22 泰康保险集团股份有限公司 一种舆情信息的处理方法及装置
CN112256974B (zh) * 2020-11-13 2023-11-17 泰康保险集团股份有限公司 一种舆情信息的处理方法及装置

Also Published As

Publication number Publication date
WO2020119533A1 (zh) 2020-06-18

Similar Documents

Publication Publication Date Title
WO2022161202A1 (zh) 多媒体资源分类模型训练方法和多媒体资源推荐方法
CN108804567A (zh) 提高智能客服应答率的方法、设备、存储介质及装置
CN109902216A (zh) 一种基于社交网络的数据采集与分析方法
US11556572B2 (en) Systems and methods for coverage analysis of textual queries
CN110110225B (zh) 基于用户行为数据分析的在线教育推荐模型及构建方法
US8972404B1 (en) Methods and systems for organizing content
US20220172260A1 (en) Method, apparatus, storage medium, and device for generating user profile
CN109509010A (zh) 一种多媒体信息处理方法、终端及存储介质
CN106951471A (zh) 一种基于svm的标签发展趋势预测模型的构建方法
CN112380433A (zh) 面向冷启动用户的推荐元学习方法
CN107527240A (zh) 一种运营商行业产品口碑营销效果鉴定系统及方法
CN109214444B (zh) 基于孪生神经网络和gmm的游戏防沉迷判定系统及方法
CN109800302A (zh) 基于循环神经网络算法的舆情预警方法、装置、终端及介质
CN112068962A (zh) 一种基于深度学习的云渲染资源兑换方法
Gao et al. Application of artificial intelligence and big data technology in digital marketing
CN106649380A (zh) 一种基于标签的热点推荐方法及系统
Lin Learning information recommendation based on text vector model and support vector machine
CN111339290A (zh) 一种文本分类方法和系统
CN106056137A (zh) 一种基于数据挖掘多分类算法的电信集团业务推荐方法
CN116957678A (zh) 一种数据处理方法和相关装置
US20230085599A1 (en) Method and device for training tag recommendation model, and method and device for obtaining tag
CN115221954B (zh) 用户画像方法、装置、电子设备以及存储介质
Chen High-concurrency big data precision marketing and advertising recommendation under 5g wireless communication network environment
US20220253610A1 (en) Systems and method for intent messaging
CN111984842B (zh) 银行客户数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination