CN108563686A

CN108563686A - 基于混合神经网络的社交网络谣言识别方法及系统

Info

Publication number: CN108563686A
Application number: CN201810208801.5A
Authority: CN
Inventors: 孔庆超; 王慧; 徐楠; 陈观淡; 毛文吉; 汪立东; 付戈; 刘春阳; 王萌
Original assignee: Institute of Automation of Chinese Academy of Science; National Computer Network and Information Security Management Center
Current assignee: Institute of Automation of Chinese Academy of Science; National Computer Network and Information Security Management Center
Priority date: 2018-03-14
Filing date: 2018-03-14
Publication date: 2018-09-21
Anticipated expiration: 2038-03-14
Also published as: CN108563686B

Abstract

本发明涉及计算机技术领域，具体提供了一种基于混合神经网络的社交网络谣言识别方法及系统，旨在解决如何在考虑谣言转发评论信息的情况下，准确识别社交网络中谣言的技术问题。为此目的，本发明中社交网络谣言识别方法，首先利用三种不同的神经网络分别获取用户特征向量、原文特征向量和传播信息特征向量，然后将用户特征向量、原文特征向量和传播信息特征向量融合为新的特征向量，最后利用第四种神经网络对融合后的特征向量进行谣言识别。基于上述步骤，能够快速且准确地检测到社交网络中的谣言。同时，本发明中的系统能够执行并实现上述步骤。

Description

基于混合神经网络的社交网络谣言识别方法及系统

技术领域

本发明涉及计算机技术领域，具体涉及一种基于混合神经网络的社交网络谣言识别方法及系统。

背景技术

网络社交指的是以互联网为基础，利用各种网络软件(如 Twitter、Facebook和新浪微博等)所实现的社会交往。网络社交在为人际交往提供便利的同时，也为谣言的传播开辟了新的场所。

当前，可以采用基于机器学习或深度循环神经网络的谣言识别方法对社交网络中的谣言进行识别。例如，方法1：《Enquiring minds: Early detection of rumors insocial media from enquiry posts》(In: Proceedings of the 24th InternationalConference on World Wide Web International World Wide Web ConferencesSteering Committee,p. 1395-1405)所公开的方法，考虑所有谣言相关推文的结构信息，使用事件级别的正则表达式将类似的帖子聚类在一起，用于谣言监测。方法2：《Automaticdetection of rumor on sina weibo》(in Proceedings of the ACM SIGKDD Workshopon Mining Data Semantics，2012，p.13)所公开的方法，根据推文的整体统计数据人工定义特征，并采用基于径向基内核的支持向量机模型识别谣言。方法3：《Informationcredibility on twitter》 (In：Proceedings of the 20th international conferenceon World wide web ACM，p.675-684)所公开的方法，通过分析谣言信息中与“趋势”主题相关的微博发帖，并利用决策树分类器将其分类为可信或不可信。方法4：《Prominentfeatures of rumor propagation in online social media》(In： Data Mining(ICDM)，2013IEEE 13th International Conference on IEEE， p.1103-1108)所公开的方法，采用随机森林分类器拟合时间序列微博的变化曲线，并利用谣言和非谣言曲线之间的差异检测谣言。方法5：《Detect rumors using time series of social context information onmicro blogging websites》(In：Proceedings of the 24th ACM International onConference on Information and Knowledge Management ACM，p.1751-1754)所公开的方法，通过动态时间序列结构学习内容特征的动态变换来识别谣言。方法6：《DetectingRumors from Micro blogs with Recurrent Neural Networks》(In：IJCAI，p.3818-3824)所公开的方法，利用深度循环神经网络学习传播内容中的隐含表示识别谣言。

上述谣言识别方法虽然能够识别到社交网络中的谣言，但是，这些方法均未分析谣言原文和转发评论信息，而转发评论信息通常会包含用户对谣言的质疑或更正，是影响谣言识别准确度的重要因素。

发明内容

为了解决现有技术中的上述问题，即为了解决如何在考虑谣言转发评论信息的情况下，准确识别社交网络中谣言的技术问题。为此目的，本发明提供了一种基于混合神经网络的社交网络谣言识别方法及系统。

在第一方面，本发明中基于混合神经网络的社交网络谣言识别方法，包括：

获取待识别谣言的发布者信息、原文和传播信息；其中，所述传播信息包括所述待识别谣言在传播过程中的转发/评论信息和流行度特征；

基于预设的第一感知器，并根据所述待识别谣言的发布者信息，获取用户特征向量；

基于预设的第一神经网络模型，并根据所述待识别谣言的原文，获取原文特征向量；其中，所述预设的第一神经网络模型由双向LSTM 模型和注意力模型合成；

基于预设的第二神经网络模型，并根据所述待识别谣言的传播信息，获取传播信息特征向量；其中，所述预设的第二神经网络模型由双向LSTM模型和注意力模型合成；

基于预设的第二感知器，并根据所述用户特征向量、原文特征向量和传播信息特征向量，对所述待识别谣言进行识别。

进一步地，本发明提供的一个优选技术方案为：

“基于预设的第一感知器，并根据所述待识别谣言的发布者信息，获取用户特征向量”的步骤具体包括：

根据所述待识别谣言的发布者信息，获取发布者基本特征和发布者社会影响力特征；

利用所述预设的第一感知器，对所述发布者基本特征和发布者社会影响力特征进行处理，得到所述用户特征向量；

其中，所述发布者基本特征包括账户认证信息、发布者简介、发布者性别、发布者位置信息、账户注册时长和日均信息发布量；所述发布者社会影响力特征包括被关注账户数量、关注账户数量、互相关注账户数量、所述关注账户数量与被关注账户数量的比率，所述被关注账户中互相关注账户所占的比率，所述关注账户中互相关注账户所占的比率。

进一步地，本发明提供的一个优选技术方案为：

“基于预设的第一神经网络模型，并根据所述待识别谣言的原文，获取原文特征向量”的步骤具体包括：

利用所述预设的第一神经网络模型中的双向LSTM模型，并根据所述待识别谣言的原文，获取隐含层输出的文本序列；

利用所述预设的第一神经网络模型中的注意力模型，并根据所述原文的上下文文本序列，计算所获取文本序列的注意力权重，进而对所述注意力权重进行加权求和得到所述原文特征向量。

进一步地，本发明提供的一个优选技术方案为：

“基于预设的第二神经网络模型，并根据所述待识别谣言的传播信息，获取传播信息特征向量”的步骤具体包括：

利用所述预设的第二神经网络模型中的双向LSTM模型，并根据所述传播信息中的转发/评论信息，获取隐含层输出的文本序列；

利用所述预设的第二神经网络模型中的注意力模型，并根据所述转发/评论信息的上下文文本序列和所述传播信息中的流行度特征，计算所获取文本序列的注意力权重，进而对所述注意力权重进行加权求和得到所述传播信息特征向量。

进一步地，本发明提供的一个优选技术方案为：

“利用所述预设的第二神经网络模型中的双向LSTM模型，并根据所述传播信息中的转发/评论信息，获取隐含层输出的文本序列”的步骤之前包括：

利用动态时间序列划分方法，将所述待识别谣言的传播过程等分为多个时间片段；

获取时间片段集；其中，所述时间片段集为最长的连续时间片段集合，且所述时间片段集内每个时间片段均至少包含一个转发/评论信息；

获取所述时间片段集内每个时间片段的词频-逆文档频率，形成传播文本序列，以能够根据所述传播文本序列获取隐含层输出的文本序列。

进一步地，本发明提供的一个优选技术方案为：

“利用所述预设的第二神经网络模型中的双向LSTM模型，并根据所述传播信息中的转发/评论信息，获取隐含层输出的文本序列”的步骤之前还包括：

获取所述时间片段集内每个时间片段的流行度特征，以能够根据所获取的流行度特征获取所述传播信息特征向量；

其中，所述流行度特征包括社会关系特征和活跃度特征；

所述社会关系特征包括所述时间片段集的每个时间片段内所有用户的平均关注账户数量和平均被关注账户数量；所述活跃度特征包括所述时间片段集的每个时间片段内所有发布信息的平均转发数量、平均喜欢数量和平均转发数量。

进一步地，本发明提供的一个优选技术方案为：

“基于预设的第二感知器，并根据所述用户特征向量、原文特征向量和传播信息特征向量，对所述待识别谣言进行识别”的步骤具体包括：

按照下式所示的方法，将所述用户特征向量、原文特征向量和传播信息特征向量拼接为一个新的特征向量v：

v＝[v_p,v_r,v_u]

利用所述预设的第二感知器，并根据所述特征向量v，获取谣言识别结果；

其中，v_p、v_r和v_u分别为用户特征向量、原文特征向量和传播信息特征向量。

进一步地，本发明提供的一个优选技术方案为：

“基于预设的第一神经网络模型，并根据所述待识别谣言的原文，获取原文特征向量”和“基于预设的第二神经网络模型，并根据所述待识别谣言的传播信息，获取传播信息特征向量”的步骤之前均包括：对文本内容预处理的步骤；

所述对文本内容预处理的步骤为：去除所述文本内容中的预设字符，并对去除预设字符后的文本内容进行分词处理。

在第二方面，本发明中基于混合神经网络的社交网络谣言识别系统包括：

信息获取模块，配置为获取待识别谣言的发布者信息、原文和传播信息；其中，所述传播信息包括所述待识别谣言在传播过程中的转发/评论信息和流行度特征；

第一感知器，配置为根据所述信息获取模块所获取的待识别谣言的发布者信息，获取用户特征向量；

第一神经网络模型，配置为根据所述信息获取模块所获取的待识别谣言的原文，获取原文特征向量；

第二神经网络模型，配置为根据所述信息获取模块所获取的待识别谣言的传播信息，获取传播信息特征向量；

第二感知器，配置为根据所述第一感知器所获取的用户特征向量、所述第一神经网络模型所获取的原文特征向量和所述第二神经网络模型所获取的传播信息特征向量，对所述待识别谣言进行识别。

进一步地，本发明提供的一个优选技术方案为：

所述信息获取模块包括第一信息获取子模块，其配置为根据所述待识别谣言的发布者信息，获取发布者基本特征和发布者社会影响力特征；

其中，所述发布者基本特征包括账户认证信息、发布者简介、发布者性别、发布者位置信息、账户注册时长和日均信息发布量；所述发布者社会影响力特征包括被关注账户数量、关注账户数量、互相关注账户数量、所述关注账户数量与被关注账户数量的比率，所述被关注账户中互相关注账户所占的比率，所述关注账户中互相关注账户所占的比率；

所述第一感知器，进一步配置为对所述第一信息获取子模块所获取的发布者基本特征和发布者社会影响力特征进行处理，得到所述用户特征向量。

进一步地，本发明提供的一个优选技术方案为：

所述第一神经网络模型包括双向LSTM模型和注意力模型；

所述双向LSTM模型，配置为根据所述待识别谣言的原文，获取隐含层输出的文本序列；

所述注意力模型，配置为根据所述原文的上下文文本序列，计算所述双向LSTM模型所获取文本序列的注意力权重，进而对所述注意力权重进行加权求和得到所述原文特征向量。

进一步地，本发明提供的一个优选技术方案为：

所述第二神经网络模型包括双向LSTM模型和注意力模型；

所述双向LSTM模型，配置为根据所述传播信息中的转发/ 评论信息，获取隐含层输出的文本序列；

所述注意力模型，配置为根据所述转发/评论信息的上下文文本序列和所述传播信息中的流行度特征，计算所述双向LSTM模型所获取文本序列的注意力权重，进而对所述注意力权重进行加权求和得到所述传播信息特征向量。

进一步地，本发明提供的一个优选技术方案为：

所述信息获取模块包括第二信息获取子模块，其配置为执行如下操作：

进一步地，本发明提供的一个优选技术方案为：

所述信息获取模块包括第三信息获取子模块，配置为执行如下操作：

其中，所述流行度特征包括社会关系特征和活跃度特征；

进一步地，本发明提供的一个优选技术方案为：

所述第二感知器包括特征向量拼接子模块，其配置为执行如下操作：

按照下式所示的方法，将用户特征向量、原文特征向量和传播信息特征向量拼接为一个新的特征向量v，以使第二感知器15能够根据特征向量v，获取谣言识别结果：

v＝[v_p,v_r,v_u]

其中，所述v_p、v_r和v_u分别用户特征向量、原文特征向量和传播信息特征向量。

进一步地，本发明提供的一个优选技术方案为：

所述系统还包括文本预处理模块，其配置为去除所述原文和转发/评论信息中的预设字符，并对去除预设字符后的原文和转发/评论信息进行分词处理。

在第三方面，本发明中存储系统存储有多条程序，所述程序适于由处理器加载并执行以实现上述技术方案所述的基于混合神经网络的社交网络谣言识别方法。

在第四方面，本发明中处理系统，包括：

处理器，适于执行各条程序；

存储设备，适于存储多条程序；

其特征在于，所述程序适于由处理器加载并执行以实现上述技术方案所述的基于混合神经网络的社交网络谣言识别方法。

与最接近的现有技术相比，上述技术方案至少具有如下有益效果：

1、本发明中的社交网络谣言识别方法，首先利用三种不同的神经网络分别获取用户特征向量(发布者个人信息的特征向量)、原文特征向量(发布信息原文的特征向量)和传播信息特征向量(其他用户转发/评论信息的特征向量)，然后将用户特征向量、原文特征向量和传播信息特征向量融合为新的特征向量，最后利用第四种神经网络对融合后的特征向量进行谣言识别，基于此，能够准确地检测到社交网络中的谣言。

2、本发明中的社交网络谣言识别方法，利用社交网络中发布信息在传播过程中的转发/评论信息和流行度特征，能够在谣言早期发生阶段，即快速检测到谣言。

3、本发明中的社交网络谣言识别方法，利用注意力模型挖掘待识别谣言原文和转发/评论信息中的关键词，能够提高谣言识别的准确性。

附图说明

图1是本发明实施例中一种基于混合神经网络的社交网络谣言识别方法的主要步骤示意图；

图2是本发明实施例中基于混合神经网络的社交网络谣言识别系统的主要结构示意图。

具体实施方式

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非旨在限制本发明的保护范围。

参阅附图1，图1示例性示出了本实施例中基于混合神经网络的社交网络谣言识别方法的主要步骤。如图1所示，本实施例中可以按照如下步骤对社交网络谣言进行识别：

步骤S101：获取待识别谣言的发布者信息、原文和传播信息；其中，传播信息包括待识别谣言在传播过程中的转发/评论信息和流行度特征。具体地，本实施例中可以按照如下步骤获取待识别谣言在传播过程中的流行度特征：

步骤S1011：利用动态时间序列划分方法，将待识别谣言的传播过程等分为多个时间片段，即将传播过程划分为多个时间长度相同的时间片段。

步骤S1012：获取时间片段集。

本实施例中时间片段集指的是最长的连续时间片段集合，并且时间片段集内每个时间片段均至少包含一个转发/评论信息，

步骤S1013：获取时间片段集内每个时间片段的流行度特征。

本实施例中流行度特征可以包括社会关系特征和活跃度特征。其中，社会关系特征可以包括时间片段集的每个时间片段内所有用户的平均关注账户数量和平均被关注账户数量。活跃度特征可以包括时间片段集的每个时间片段内所有发布信息的平均转发数量、平均喜欢数量和平均转发数量。

本实施例中关注账户指的是当前用户主动去关注的其他账户，被关注账户指的是关注当前用户的其他账户，即被关注账户可以理解为当前用户粉丝的账户。喜欢数量指的是当前发布信息被标识为喜欢的次数，平均喜欢数量指的是所有发布信息被标识为喜欢的平均次数。

本实施例中流行度特征可以表示为多维向量：其中，f_i(t,1)表示当前时间片段内包含的发布信息数量，f_i(t,2)表示当前时间片段内最后一条转发/评论发布时间与第一条转发/评论发布时间之间的间隔，f_i(t,3)表示当前时间片段内平均关注账户数量，f_i(t,4)表示当前时间片段内平均被关注账户数量，f_i(t,5)表示当前时间片段内平均转发数量，f_i(t,6)表示当前时间片段内平均喜欢数量，f_i(t,7)表示当前时间片段内平均喜欢数量。

步骤S102：基于预设的第一感知器，并根据待识别谣言的发布者信息，获取用户特征向量。具体地，本实施例中可以按照如下步骤获取用户特征向量：

步骤S1021：根据待识别谣言的发布者信息，获取发布者基本特征和发布者社会影响力特征。

具体地，本实施例中发布者基本特征可以包括账户认证信息、发布者简介、发布者性别、发布者位置信息、账户注册时长和日均信息发布量。发布者社会影响力特征可以包括被关注账户数量、关注账户数量、互相关注账户数量、关注账户数量与被关注账户数量的比率，被关注账户中互相关注账户所占的比率，关注账户中互相关注账户所占的比率。其中，被关注账户中互相关注账户指的是，在被关注账户中，当前用户也关注了的账户。关注账户中互相关注账户指的是，在关注账户中，也关注了当前账户的账户。

本实施例中发布者基本特征和发布者社会影响力特征可以表示为13维特征向量Ui＝[U_i(1) U_i(2) U_i(3) U_i(4) ...U_i(12) U_i(13)]

U_i(1)为账户认证信息，若U_i(1)＝0则表示账户未被认证，若U_i(1)＝1则表示账户被认证。U_i(2)为发布者简介，若U_i(2)＝0则表示没有发布者简介，若U_i(2)＝1则表示有发布者简介。U_i(3)为发布者性别，若U_i(3)＝0则表示发布者为男性，若U_i(3)＝1则表示发布者为女性。[U_i(4) U_i(5)]为发布者位置信息，且U_i(4)表示城市，U_i(5) 表示省。U_i(6)为账号注册时长，表示账号注册日至信息发布日的间隔天数。U_i(7)为日均消息发布量，即发布信息总数与账号注册时长的比值。U_i(8)～U_i(13)依次为被关注账户数量、关注账户数量、互相关注账户数量、关注账户数量与被关注账户数量的比率、被关注账户中互相关注账户所占的比率和关注账户中互相关注账户所占的比率。

步骤S1022：利用预设的第一感知器，对发布者基本特征和发布者社会影响力特征进行处理，得到用户特征向量。

本实施例中可以采用随机梯度下降法、小批量梯度下降或自适应学习速率方法(如Adagrad、Adadelta、RMSprop或Adam)等方法对预设的第一感知器进行网络训练，得到优化后的第一感知器，进而根据优化后的第一感知器获取用户特征向量。

具体地，本实施例中预设的第一感知器的数学模型如下式(1) 所示：

v_u＝σ(wUi+b) (1)

公式(1)中各参数含义为：

v_u为用户特征向量，Ui为特征向量，w和b分别为权重，σ()为激活函数，如于sigmoid、ReLU或tanh等。

步骤S103：基于预设的第一神经网络模型，并根据待识别谣言的原文，获取原文特征向量。本实施例中可以采用极小化交叉熵函数训练预设的第一神经网络模型，进而根据训练优化后的第一神经网络模型获取原文特征向量。

具体地，本实施例中可以按照如下步骤获取原文特征向量：

步骤S1031：去除待识别谣言的原文的文本内容中的预设字符，并对去除预设字符后的文本内容进行分词处理。

具体地，本实施例中首先可以利用基于正则表达式的方法，去除文本内容中的超链接、特定符号和停用词，然后利用结巴分词工具对去除超链接、特定符号和停用词后的文本内容进行分词处理。

例如，待识别谣言的原文的文本内容为“【黄石公园火山恐临近喷发】大家还记得电影《2012》的开头吗？美国黄石国家公园的火山爆发是灾难的开端，新闻里说，美国黄石公园地下超级火山恐临近喷发，而一旦喷发，美国三分之二的国土会被火山灰埋没，并可能由连锁反应带来全球大灾难……[衰]http://sinaurl.cn/hG5wqI”时，经上述预处理步骤后可以得到：

“【黄石公园火山恐临近喷发】大家还记得电影《2012》的开头吗？美国黄石国家公园的火山爆发是灾难的开端，新闻里说，美国黄石公园地下超级火山恐临近喷发，而一旦喷发，美国三分之二的国土会被火山灰埋没，并可能由连锁反应带来全球大灾难……[衰]”。

步骤S1032：利用预设的第一神经网络模型中的双向LSTM 模型，并根据待识别谣言的原文，获取隐含层输出的文本序列。

具体地，本实施例中可以按照如下步骤获取隐含层输出的文本序列：首先，利用Embedding算法将上述步骤S1031所得词集 [w₁,w₂,...,w_i,...w_n]中每个词w_i映射为d维向量空间中的x_i，并对每个词所对应向量进行初始化。然后，利用双向LSTM模型将向量[x₁,x₂,...,x_i,...x_n]映射到隐含层的特征空间，得到文本序列

本实施例中双向LSTM模型的数学模型如下式(2)所示：

其中，长短时记忆网络LSTM模型的数学模型如下式(3) 所示：

公式(2)和(3)中各参数含义为：

x_t表示词序列向量[x₁,x₂,...,x_i,...x_n]，i表示输入门，f 表示遗忘门，c表示LSTM细胞状态，o表示输出门，h_t表示t时刻的隐含状态，W_i为输入门权重，W_f为遗忘门权重，W_c为LSTM细胞状态的权重，W_o为输出门权重，b_i为输入门偏执权重，b_f为遗忘门偏执权重， b_c为LSTM细胞状态的偏执权重，b_o为输出门偏执权重。

步骤S1033：利用预设的第一神经网络模型中的注意力模型，并根据原文的上下文文本序列，计算所获取文本序列的注意力权重，进而对注意力权重进行加权求和得到原文特征向量。

具体地，本实施例中可以按照如下步骤获取原文特征向量：首先，将文本序列通过全连接层映射到隐含层的特征空间。然后，利用Softmax函数计算各个隐含状态的注意力权重α_t。最后，对各个隐含状态的注意力权重α_t进行加权求和，得到原文特征向量v_p。

本实施例中注意力模型的数学模型如下式(4)所示：

公式(4)中各参数含义为：W_q为注意力模型权重，b_q为注意力模型偏执权重，q_p为关键词位置指向向量，指示了关键词在隐含层的特征空间的位置信息。

步骤S104：基于预设的第二神经网络模型，并根据待识别谣言的传播信息，获取传播信息特征向量。本实施例中可以采用极小化交叉熵函数训练预设的第二神经网络模型，进而根据训练优化后的第二神经网络模型获取传播信息特征向量。

具体地，本实施例中可以按照如下步骤获取传播信息特征向量：

步骤S1041：去除待识别谣言的转发/评论信息的文本内容中的预设字符，并对去除预设字符后的文本内容进行分词处理。

步骤S1042：获取传播文本序列。

具体地，首先利用动态时间序列划分方法，将待识别谣言的传播过程等分为多个时间片段，即将传播过程划分为多个时间长度相同的时间片段。然后，获取时间片段集。最后，获取时间片段集内每个时间片段的词频-逆文档频率，形成传播文本序列[r₁,r₂,...,r_i,...,r_N]。

步骤S1043：利用预设的第二神经网络模型中的双向LSTM 模型，并根据传播信息中的转发/评论信息，获取隐含层输出的文本序列。

具体地，本实施例中可以利用双向LSTM模型将传播文本序列[r₁,r₂,...r_N]映射到隐含层的特征空间，得到文本序列其中，为根据第t个时间片段内的词频-逆文档频率r_i，得到的隐含层输出值。

本实施例中双向LSTM模型的数学模型如下式(5)所示：

步骤S1044：利用预设的第二神经网络模型中的注意力模型，并根据转发/评论信息的上下文文本序列和传播信息中的流行度特征，计算所获取文本序列的注意力权重，进而对注意力权重进行加权求和得到传播信息特征向量。

具体地，本实施例中可以按照如下步骤获取传播信息特征向量：首先，将文本序列通过全连接层映射到隐含层的特征空间。然后，利用Softmax函数计算各个隐含状态的注意力权重β_i。最后，对各个隐含状态的注意力权重β_i进行加权求和，得到原文特征向量v_r。

本实施例中注意力模型的数学模型如下式(6)所示：

公式(4)中各参数含义为：为注意力模型权重，b_d为注意力模型偏执权重，d_p为关键词位置指向向量，指示了关键词在隐含层的特征空间的位置信息。

步骤S105：基于预设的第二感知器，并根据用户特征向量、原文特征向量和传播信息特征向量，对待识别谣言进行识别。

具体地，本实施例中可以按照如下步骤进行谣言识别：

步骤S1051：按照下式(7)所示的方法，将用户特征向量v_p、原文特征向量v_r和传播信息特征向量v_u拼接为一个新的特征向量v：

v＝[v_p,v_r,v_u] (7)

步骤S1052：利用预设的第二感知器，并根据特征向量v，获取谣言识别结果。本实施例中可以采用随机梯度下降法、小批量梯度下降或自适应学习速率方法(如Adagrad、Adadelta、RMSprop或Adam) 等方法对预设的第二感知器进行网络训练，得到优化后的第二感知器，进而根据优化后的第二感知器获取谣言识别结果。

具体地，本实施例中预设的第二感知器的数学模型如下式(8) 所示：

公式(8)中各参数含义为：

w_y和b_y分别为权重，σ()为激活函数，如于sigmoid、ReLU 或tanh等。

下面以社交软件“新浪微博”中的发布信息为例，对本发明所提供的社交网络谣言识别方法进行说明。

本实施例中基于“新浪微博”得到的数据包括：1746818个微博用户，共同参与4664个微博事件，共计3805656条微博。在4664个微博事件中，有2313个谣言事件，2351个真实事件。其中，将10％的谣言事件作为验证数据，并按照3:1的比例将剩下90％的谣言时间划分为训练数据和测试数据。

具体地，本实施例中可以按照如下步骤进行谣言识别：

步骤S201：获取待识别谣言的发布者信息、原文和传播信息。

步骤S202：获取用户特征向量。

例如，一位拥有1500个粉丝的位于浙江金华的有个人简介的男性微博认证用户A的13维特征向量为 [1,1,0,7,33,526,2,0.4,0.1,0.2,0.25,0.5,0.5]，进而利用预设的第一感知器得到用户特征向量为[0.1,0.1,0.5,0.2,0.3,...0.2]。

步骤S203：获取用户原文特征向量。

本实施例中利用预设的第一神经网络模型中的双向LSTM 模型，可以得到隐含层输出的文本序列为：

黄石→[0，0，0，0，0，1]→[0.1，0.2，0.1，...0.1，0.2]

公园→[0，0，0，0，1，0]→[0.3，0.2，0.1，...0.3，0.4]

火山→[0，0，0，1，0，0]→[0.6，0.7，0.9，...0.5，0.8]

恐→[0，0，1，0，0，0]→[0.7，0.6，0.8，...0.7，0.9]

临近→[0，1，0，0，0，0]→[0.9，0.6，0.2，...0.7，0.1]

喷发→[1，0，0，0，0，0]→[0.2，0.3，0.8，...0.5，0.6]

进一步地，利用预设的第一神经网络模型中的注意力模型，并根据原文的上下文文本序列，计算文本序列的注意力权重为：

黄石：0.1

公园：0.1

火山：0.2

恐：0.25

临近：0.1

喷发：0.25

最后，对上述注意力权重进行加权求和得到原文特征向量。

步骤S204：获取传播信息特征向量。

例如，事件“黄石公园火山恐临近喷发”共有1000条转发/ 评论信息，将传播过程动态划分为50个时间片段，对每个时间片段内的文本内容抽取5000维的词频-逆文档频率，形成传播文本序列：进一步地，还可以得到每个时间片段内的流行度特征：最后，利用预设的第二神经网络模型中的注意力模型，并根据转发/评论信息的上下文文本序列和传播信息中的流行度特征，计算所获取文本序列的注意力权重，进而对注意力权重进行加权求和得到传播信息特征向量。

步骤S205：基于预设的第二感知器，并根据用户特征向量、原文特征向量和传播信息特征向量，对待识别谣言进行识别。

参阅表1，表1示出了本发明“背景技术”中所指出的方法1～方法5，以及本发明所公开的基于混合神经网络的社交网络谣言识别方法的识别结果。如表1所示，本实施例中社交网络谣言识别方法的准确率和F1值，均优于其他五种方法。

表1

表1中各参数/指标含义为：

R表示谣言时间，N表示非谣言时间，准确率为识别出的正确的样本占所有样本的比例。F1值为精度和召回率的调和平均数，精确率为识别出的谣言(或非谣言)样本中正确的谣言(或非谣言)样本所占的比例，召回率为识别出的正确谣言(或非谣言)样本占所有样本比例。

上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述，但是本领域技术人员可以理解，为了实现本实施例的效果，不同的步骤之间不必按照这样的次序执行，其可以同时(并行)执行或以颠倒的次序执行，这些简单的变化都在本发明的保护范围之内。

基于上述用于基于混合神经网络的社交网络谣言识别方法实施例，本发明实施例还提供了一种存储系统，该存储系统存储有多条程序，并且这些程序适于由处理器加载并执行以实现上述方法实施例所述的基于混合神经网络的社交网络谣言识别方法。

进一步地，基于上述基于混合神经网络的社交网络谣言识别方法实施例，本发明实施例还提供了一种处理系统，该处理系统包括处理器和存储设备，其中，处理器可以适于执行各条程序，存储设备可以适于存储多条程序，并且这些程序可以适于由处理器加载并执行以实现上述方法实施例所述的基于混合神经网络的社交网络谣言识别方法。

再进一步地，基于与方法实施例相同的技术构思，本发明实施例还提供一种基于混合神经网络的社交网络谣言识别系统。下面结合附图对该基于混合神经网络的社交网络谣言识别系统进行具体说明。

参阅附图2，图2示例性示出了本实施例中基于混合神经网络的社交网络谣言识别系统的主要结构。如图2所示，本实施例中基于混合神经网络的社交网络谣言识别系统可以包括信息获取模块11、第一感知器12、第一神经网络模型13、第二神经网络模型14和第二感知器。

具体地，信息获取模块11可以配置为获取待识别谣言的发布者信息、原文和传播信息；其中，传播信息可以包括待识别谣言在传播过程中的转发/评论信息和流行度特征。第一感知器12可以配置为根据信息获取模块11所获取的待识别谣言的发布者信息，获取用户特征向量。第一神经网络模型13可以配置为根据信息获取模块11所获取的待识别谣言的原文，获取原文特征向量。第二神经网络模型14可以配置为根据信息获取模块11所获取的待识别谣言的传播信息，获取传播信息特征向量。第二感知器15可以配置为根据第一感知器12所获取的用户特征向量、第一神经网络模型13所获取的原文特征向量和第二神经网络模型14所获取的传播信息特征向量，对待识别谣言进行识别。

进一步地，本实施例中图2所示信息获取模块11可以包括第一信息获取子模块，其配置为根据待识别谣言的发布者信息，获取发布者基本特征和发布者社会影响力特征。同时，第一感知器12还可以配置为对第一信息获取子模块所获取的发布者基本特征和发布者社会影响力特征进行处理，得到用户特征向量。

其中，发布者基本特征可以包括账户认证信息、发布者简介、发布者性别、发布者位置信息、账户注册时长和日均信息发布量。发布者社会影响力特征可以包括被关注账户数量、关注账户数量、互相关注账户数量、关注账户数量与被关注账户数量的比率，被关注账户中互相关注账户所占的比率，关注账户中互相关注账户所占的比率。

进一步地，本实施例中第一神经网络模型可以包括双向 LSTM模型和注意力模型。具体地，双向LSTM模型可以配置为根据待识别谣言的原文，获取隐含层输出的文本序列。注意力模型可以配置为根据原文的上下文文本序列，计算双向LSTM模型所获取文本序列的注意力权重，进而对注意力权重进行加权求和得到原文特征向量。

进一步地，本实施例中第二神经网络模型可以包括双向 LSTM模型和注意力模型。具体地，双向LSTM模型可以配置为根据传播信息中的转发/评论信息，获取隐含层输出的文本序列。注意力模型可以配置为根据转发/评论信息的上下文文本序列和传播信息中的流行度特征，计算双向LSTM模型所获取文本序列的注意力权重，进而对注意力权重进行加权求和得到传播信息特征向量。

进一步地，本实施例中图2所示信息获取模块11还可以包括第二信息获取子模块，其配置为执行如下操作：

首先，利用动态时间序列划分方法，将待识别谣言的传播过程等分为多个时间片段。其次，获取时间片段集；其中，时间片段集为最长的连续时间片段集合，且时间片段集内每个时间片段均至少包含一个转发/评论信息。最后，获取时间片段集内每个时间片段的词频-逆文档频率，形成传播文本序列，以能够根据传播文本序列获取隐含层输出的文本序列。

进一步地，本实施例中图2所示信息获取模块11还可以包括第三信息获取子模块，其配置为执行如下操作：

获取时间片段集内每个时间片段的流行度特征，以能够根据所获取的流行度特征获取传播信息特征向量。其中，流行度特征可以包括社会关系特征和活跃度特征。社会关系特征可以包括时间片段集的每个时间片段内所有用户的平均关注账户数量和平均被关注账户数量。活跃度特征可以包括时间片段集的每个时间片段内所有发布信息的平均转发数量、平均喜欢数量和平均转发数量。

进一步地，本实施例中第二感知器15可以包括特征向量拼接子模块。具体地，特征向量拼接子模块可以配置为按照公式(7)所示的方法，将用户特征向量v_p、原文特征向量v_r和传播信息特征向量v_u拼接为一个新的特征向量v，以使第二感知器15能够根据特征向量v，获取谣言识别结果。

进一步地，本实施例中图2所示社交网络谣言识别系统还可以包括文本预处理模块，其可以配置为去除原文和转发/评论信息中的预设字符，并对去除预设字符后的原文和转发/评论信息进行分词处理。

上述基于混合神经网络的社交网络谣言识别系统实施例可以用于执行上述基于混合神经网络的社交网络谣言识别方法实施例，其技术原理、所解决的技术问题及产生的技术效果相似，所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的基于混合神经网络的社交网络谣言识别系统的具体工作过程及有关说明，可以参考前述基于混合神经网络的社交网络谣言识别方法实施例中的对应过程，在此不再赘述。

本领域技术人员可以理解，上述基于混合神经网络的社交网络谣言识别系统还包括一些其他公知结构，例如处理器、存储器等，其中，存储器包括但不限于随机存储器、闪存、只读存储器、可编程只读存储器、易失性存储器、非易失性存储器、串行存储器、并行存储器或寄存器等，处理器包括但不限于CPLD/FPGA、DSP、ARM处理器、MIPS 处理器等，为了不必要地模糊本公开的实施例，这些公知的结构未在图2 中示出。

应该理解，图2中的各个模块的数量仅仅是示意性的。根据实际需要，各模块可以具有任意的数量。

本领域技术人员可以理解，可以对实施例中的系统中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个系统中。可以把实施例中的模块或单元组合成一个模块或单元，以及此外可以把它们分成多个子模块或子单元。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包括”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在本发明的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征作出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种基于混合神经网络的社交网络谣言识别方法，其特征在于，所述方法包括：

基于预设的第一神经网络模型，并根据所述待识别谣言的原文，获取原文特征向量；其中，所述预设的第一神经网络模型由双向LSTM模型和注意力模型合成；

2.根据权利要求1所述的基于混合神经网络的社交网络谣言识别方法，其特征在于，“基于预设的第一感知器，并根据所述待识别谣言的发布者信息，获取用户特征向量”的步骤具体包括：

3.根据权利要求1所述的基于混合神经网络的社交网络谣言识别方法，其特征在于，“基于预设的第一神经网络模型，并根据所述待识别谣言的原文，获取原文特征向量”的步骤具体包括：

4.根据权利要求1所述的基于混合神经网络的社交网络谣言识别方法，其特征在于，“基于预设的第二神经网络模型，并根据所述待识别谣言的传播信息，获取传播信息特征向量”的步骤具体包括：

5.根据权利要求1或4所述的基于混合神经网络的社交网络谣言识别方法，其特征在于，“利用所述预设的第二神经网络模型中的双向LSTM模型，并根据所述传播信息中的转发/评论信息，获取隐含层输出的文本序列”的步骤之前包括：

6.根据权利要求5所述的基于混合神经网络的社交网络谣言识别方法，其特征在于，“利用所述预设的第二神经网络模型中的双向LSTM模型，并根据所述传播信息中的转发/评论信息，获取隐含层输出的文本序列”的步骤之前还包括：

其中，所述流行度特征包括社会关系特征和活跃度特征；

7.根据权利要求1所述的基于混合神经网络的社交网络谣言识别方法，其特征在于，“基于预设的第二感知器，并根据所述用户特征向量、原文特征向量和传播信息特征向量，对所述待识别谣言进行识别”的步骤具体包括：

v＝[v_p,v_r,v_u]

8.根据权利要求1、3或4所述的基于混合神经网络的社交网络谣言识别方法，其特征在于，“基于预设的第一神经网络模型，并根据所述待识别谣言的原文，获取原文特征向量”和“基于预设的第二神经网络模型，并根据所述待识别谣言的传播信息，获取传播信息特征向量”的步骤之前均包括：对文本内容预处理的步骤；

9.一种基于混合神经网络的社交网络谣言识别系统，其特征在于，所述系统包括：

10.根据权利要求9所述的基于混合神经网络的社交网络谣言识别系统，其特征在于，

11.根据权利要求9所述的基于混合神经网络的社交网络谣言识别系统，其特征在于，所述第一神经网络模型包括双向LSTM模型和注意力模型；

12.根据权利要求9所述的基于混合神经网络的社交网络谣言识别系统，其特征在于，所述第二神经网络模型包括双向LSTM模型和注意力模型；

所述双向LSTM模型，配置为根据所述传播信息中的转发/评论信息，获取隐含层输出的文本序列；

13.根据权利要求9或12所述的基于混合神经网络的社交网络谣言识别系统，其特征在于，所述信息获取模块包括第二信息获取子模块，其配置为执行如下操作：

14.根据权利要求13所述的基于混合神经网络的社交网络谣言识别系统，其特征在于，所述信息获取模块包括第三信息获取子模块，配置为执行如下操作：

其中，所述流行度特征包括社会关系特征和活跃度特征；

15.根据权利要求9所述的基于混合神经网络的社交网络谣言识别系统，其特征在于，所述第二感知器包括特征向量拼接子模块，其配置为执行如下操作：

v＝[v_p,v_r,v_u]

16.根据权利要求9、11或12所述的基于混合神经网络的社交网络谣言识别系统，其特征在于，所述系统还包括文本预处理模块，其配置为去除所述原文和转发/评论信息中的预设字符，并对去除预设字符后的原文和转发/评论信息进行分词处理。

17.一种存储系统，其中存储有多条程序，其特征在于，所述程序适于由处理器加载并执行以实现权利要求1-8任一项所述的基于混合神经网络的社交网络谣言识别方法。

18.一种处理系统，包括：

处理器，适于执行各条程序；

存储设备，适于存储多条程序；

其特征在于，所述程序适于由处理器加载并执行以实现权利要求9-16任一项所述的基于混合神经网络的社交网络谣言识别方法。