CN117076911B

CN117076911B - 一种基于传播结构动态保持的网络谣言检测方法

Info

Publication number: CN117076911B
Application number: CN202311339162.3A
Authority: CN
Inventors: 胥帅; 许建秋; 李博涵; 关东海
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2023-10-17
Filing date: 2023-10-17
Publication date: 2024-01-26
Anticipated expiration: 2043-10-17
Also published as: CN117076911A

Abstract

本发明公开了一种基于传播结构动态保持的网络谣言检测方法，其包括如下步骤：获取包含信息传播树和传播内容流的信息传播事件；设定时间间隔将信息传播事件划分为多个传播阶段；抽取每个信息传播阶段的内容特征和整体结构特征；基于时间序列方法建模连续的传播阶段；基于神经网络二分类方式训练网络谣言检测模型；利用训练好的模型判断任意信息传播事件的初始信息是否为网络谣言。本发明在对信息传播事件进行阶段划分的基础上，针对每一阶段的原始传播树进行结构无损的标准化转换，以元树路径为媒介学习全局传播结构特征，并兼顾原始传播树的局部传播结构特征，在不同传播阶段均可保持谣言的传播结构，能够有效检测具有阶段性传播特点的网络谣言。

Description

一种基于传播结构动态保持的网络谣言检测方法

技术领域

本发明属于网络谣言检测领域，涉及一种基于传播结构动态保持的网络谣言检测方法。

背景技术

与传统的信息媒介相比，网络媒体上的信息流通具有门槛低、规模大、传播迅速、实时性强、覆盖面广等特点，这使得网络谣言的形成与发酵异常容易。因此，准确、高效地检测网络谣言对于营造良好网络空间至关重要。

一方面，网络谣言具有明确的发展和演变机理，在酝酿期、爆发期、蔓延期和平息期等不同阶段均对应不同的传播特点。为了准确刻画网络谣言的演化机理，捕捉网络谣言的传播模式，应当针对谣言自形成到平息所处的各个阶段分别建模并挖掘相邻阶段的动态演进特征，而非直接针对整个谣言传播事件进行建模，忽略不同传播阶段所呈现的不同发展状态。另一方面，网络谣言检测一般考虑信息内容和传播拓扑两个方面的特征。

然而，随着众包等在线协作方式的兴起，网络谣言相比以前更具隐蔽性，发布者和传播者会对内容本身进行针对性修改，使得信息真假难辨从而规避传统的检测方案。此外，由于不同的网络谣言在传播拓扑上差异较大，现有基于传播树统计特征（如树的广度与深度）的方案难以准确刻画谣言传播树的局部特征与全局特征，检测效果并不理想。

归结起来，现有网络谣言检测方案存在三个方面不足：1.现有方案一般针对网络谣言的整个传播事件（即初始信息及其评论、转发信息）进行建模，忽略了谣言在不同传播阶段具有的内容和结构特征；2.现有方案针对谣言的传播拓扑，主要提取传播树的统计特征（如树的广度与深度），然而不同的网络谣言在传播拓扑上差异较大，这种浅层的统计特征难以真正刻画网络谣言的传播结构；3.现有方案一般直接利用图神经网络学习谣言传播树的节点特征，这种方式仅能学习到节点及其邻居所具有的局部特征，难以学习到谣言传播树的全局特征。

综上所述，现有实现方案没有针对网络谣言传播事件进行分阶段动态建模，难以兼顾谣言传播树的局部与全局结构特征，针对网络谣言的检测性能并不理想。

发明内容

本发明的目的在于提出一种基于传播结构动态保持的网络谣言检测方法，该方法能够针对网络谣言传播事件进行分阶段动态建模，同时能够兼顾谣言传播树的局部与全局结构特征，以提高具有阶段性传播特点的网络谣言的检测性能。

本发明为了实现上述目的，采用如下技术方案：

一种基于传播结构动态保持的网络谣言检测方法，包括如下步骤：

步骤1. 获取包含信息传播树和传播内容流的信息传播事件；

步骤2. 设定时间间隔将得到的信息传播事件划分为多个传播阶段；

步骤3. 针对每个传播阶段，分别抽取该传播阶段的内容特征和整体结构特征；

步骤4. 将每个传播阶段的内容特征和整体结构特征进行拼接，获得每个传播阶段的整体特征，再将连续传播阶段的整体特征序列视作时间序列，并基于时间序列建模方法构建最终的网络谣言检测模型；

步骤5. 基于神经网络二分类方式训练网络谣言检测模型；

步骤6. 对于给定的来自网络空间的任意信息传播事件，利用训练好的网络谣言检测模型判断信息传播事件的初始信息是否为网络谣言。

本发明具有如下优点：

如上所述，本发明述及了一种基于传播结构动态保持的网络谣言检测方法，该方法一方面将网络空间中的信息传播事件按时间划分为不同的演化阶段，考虑内容特征和结构特征对信息传播事件进行动态建模；另一方面，针对每一传播阶段的原始传播树进行结构无损的标准化转换，以解决网络谣言传播结构差异大的问题，并通过元树路径学习标准化二叉树的全局传播结构特征，同时兼顾传播过程的全局结构特征和局部结构特征，在不同传播阶段均可保持谣言的传播结构，因而，本发明能够有效检测具有阶段性传播特点的网络谣言。

附图说明

图1为本发明实施例中基于传播树结构动态保持的网络谣言检测方法流程图。

图2为本发明实施例中信息传播树和传播内容流示意图。

图3为本发明实施例中网络谣言检测模型结构图。

图4为本发明实施例中结构无损的传播树标准化转换过程示意图。

图5为本发明实施例中深度d≤3的元树集合示意图。

图6为本发明实施例中针对二叉树构造元树路径的示意图。

图7为本发明实施例中基于CNN的全局传播结构特征学习示意图。

具体实施方式

下面结合附图以及具体实施方式对本发明作进一步详细说明：

本发明针对具有阶段性传播特点的网络谣言，设计了一种基于传播树结构动态保持的网络谣言检测方法，该方法在对信息传播事件进行阶段划分的基础上，首先建模不同传播阶段的内容与传播特征，在传播特征建模上兼顾信息传播树的局部与全局结构特征，随后将各传播阶段视作时间序列，利用时序神经网络捕捉相邻传播阶段的时序依赖关系，最后利用汇总的多阶段建模结果对传播事件进行二分类，判断传播事件的初始信息是网络谣言或真实信息。

基于以上发明构思，下面对基于传播树结构动态保持的网络谣言检测方法进行详细说明。如图1所示，基于传播树结构动态保持的网络谣言检测方法，包括如下步骤：

步骤1. 获取包含信息传播树和传播内容流的信息传播事件。

针对网络谣言传播事件，通过爬虫程序获取网络谣言的初始信息链接后，爬取网络谣言的初始信息以及相关的转发与评论信息；针对真实信息传播事件，通过爬虫程序直接爬取真实信息的初始信息以及相关的转发与评论信息。

以新浪微博这一中文在线社交网络为例，具体阐述如何获取包含传播树和内容流的信息传播事件集合（包含网络谣言和真实信息）。

针对网络谣言传播事件，新浪微博社区管理中心页面展示了经由用户举报且官方判定为不实信息的网络谣言，并在公示页面中给出了初始信息的访问链接。

对于任一网络谣言，通过 Scrapy 爬虫程序获取初始信息链接后，爬取初始信息以及相关的转发与评论信息（仅爬取被微博社区管理中心标记为网络谣言时间点之前的信息）。

针对真实信息传播事件，则通过 Scrapy 爬虫程序直接从新浪微博认证的官方账号中爬取，对于任一真实信息，爬取初始信息以及相关的转发与评论信息。

本发明实施例中收集网络空间中某用户发布的初始信息及其转发、评论信息来构建网络谣言检测模型，因此，原则上能针对任意社交网络实现谣言检测。

数据爬取阶段，网络谣言传播事件集合与真实信息传播事件集合的规模大小相当，此处的规模大小相当，例如可以是规模大小相同或相近。

例如，两类信息传播事件集合均爬取10000个传播事件。

对于爬取的每一类信息传播事件中的每个样本，将初始信息以及相关的转发与评论信息按时间先后顺序分别形成信息传播树和传播内容流。

以上两类信息传播事件集合用于有监督训练所述网络谣言检测模型。

步骤2. 设定时间间隔将得到的信息传播事件划分为多个传播阶段。

针对每一类信息传播事件中的每个样本，选取时间间隔Δt（在实施例中，Δt例如为2小时），将信息传播树和传播内容流划分为s个传播阶段。

其中位置相对靠后的传播阶段完全覆盖位置相对靠前的传播阶段。

如图2所示，例如将图中的信息传播事件划分为3个传播阶段，即S ₁、S ₂和S ₃。

其中，传播阶段S ₁与传播阶段S ₂相比，传播阶段S ₂位置相对靠后；而传播阶段S ₂与传播阶段S ₃相比，传播阶段S ₃位置相对靠后。

因此，传播阶段S ₂包含传播阶段S ₁，而传播阶段S ₃包含传播阶段S ₂。

当然，以上仅仅为示例性的，本实施例中并不局限于划分上述3个传播阶段。

步骤3. 针对每个传播阶段，分别抽取该传播阶段的内容特征和整体结构特征。

如图3所示，针对内容特征，利用双向长短时记忆网络Bi-LSTM学习每一条信息的嵌入表示，即对于任意一条信息m _i，通过Bi-LSTM将其映射为l维向量表示x _i∈R ^l。

定义第i个传播阶段为S _i，将传播阶段S _i的内容流（即按时间先后顺序排列的若干信息）视作时间序列，再次利用Bi-LSTM将传播阶段S _i的内容流映射为l维向量表示∈R ^l。

针对整体结构特征，首先利用图注意力网络GAT学习原始传播树的节点表示。

设传播阶段S _i的原始传播树为G(S _i)，设第n层节点的嵌入表示矩阵为h _n，则第n+1层节点的嵌入表示矩阵按如下公式获得：h _n+1=GAT(h _n,G(S _i))。

当n=0时，令h ₀为随机初始化的N×l维矩阵，N表示原始传播树G(S _i)的节点数量。

通过此方式能够学习原始传播树中每个节点所处的局部结构，求得每个节点的嵌入表示。

为了保证计算效率，取n=2时所对应的嵌入表示矩阵h ₃作为原始传播树G(S _i)的节点表示。此时，对于第j个节点，其嵌入表示z_j可直接从嵌入表示矩阵h ₃的第j行获得。

其次，为了克服不同网络谣言在传播拓扑上差异较大的问题，对传播阶段S _i的原始传播树G(S _i)进行结构无损的标准化操作，即将原始传播树通过定位、移除和旋转操作转换为标准的二叉树，过程如图4所示。其中图4(a)表示原始传播树，图4(b)、图4 (c)、图4(d)依次展示了通过定位操作、移除操作和旋转操作转换为标准的二叉树的过程。

特别地，定位操作是在所有节点的兄弟节点之间加一条连线，移除操作是对树中的每个节点，只保留它与第一个孩子节点之间的连线并删除它与其它孩子节点之间的连线，旋转操作是以树的根节点为轴心，将整棵树顺时针旋转一定角度，使之结构层次分明。

为了刻画二叉树自顶向下的全局结构，本发明使用元树路径（Meta-tree path）对二叉树的全局结构进行表达。其中，元树是一种彼此异构的树形结构，例如图5中深度d≤3的元树共有25个，分别为T ₁、T ₂、…、T ₂₅，且任意两个元树之间均异构。

为了保证计算效率，利用深度d≤3的元树构造元树路径。特别地，在构造元树路径时，采用广度优先遍历，首先访问二叉树的根节点，然后依次访问其左孩子节点和右孩子节点，依次类推，直到所有节点均被访问。对于每一次访问，均抽取一个深度d≤3的元树，抽取优先级为d=3＞d=2＞d=1，即优先抽取深度为3的元树，如无深度为3的元树，则抽取深度为2的元树，依次类推。通过该方式，对于节点个数为N的二叉树，可以抽取N个元树，按照遍历顺序可构造一条长度为N的元树路径。

图6展示了针对给定的二叉树构造元树路径的过程。依据广度优先遍历思想，首先，访问图6所示二叉树的根节点，并抽取一个深度d=3的元树T ₇；其次，访问根节点的左孩子节点，并抽取一个深度d=3的元树T ₂₂；然后，访问根节点左孩子节点的左孩子节点，抽取一个深度d=3的元树T ₉；再次，访问根节点左孩子节点的右孩子节点，抽取一个深度d=3的元树T ₁₄；依次类推，直到二叉树所有节点均被访问。对于每次访问，如果不存在深度d=3的元树，则抽取d=2的元树；如果不存在深度d=2的元树，则抽取d=1的元树。

为了学习信息传播的全局结构特征，通过独热编码One-hot为构造的元树路径按照广度优先遍历进行编码，获得元树路径编码矩阵，随后利用卷积神经网络CNN对编码矩阵进行卷积操作，自上而下抽取编码矩阵的结构特征，获得编码矩阵的全局结构特征。

为了更广泛地学习编码矩阵的全局结构特征，在CNN中设置k个卷积核，每个卷积核各自独立地运行，设k个卷积核学习到的全局结构特征分别为q ₁、q ₂、…、q _k。

如图7示出了基于CNN的全局传播结构特征学习示意图。对于抽取到的元树路径T ₇ →T ₂₂→T ₉→T ₁₄→T ₃→T ₁→T ₆→T ₁→T ₃→T ₁。

首先，对每个单元进行独热编码One-hot。由于每个单元对应的元树至多含有7个节点，因此可以基于广度优先遍历思想采用7个二进制位来表示每一个元树。

比如1000000表示仅有根节点的元树T ₁，1100000表示仅有根节点和左孩子节点的元树T ₂，1010000表示仅有根节点和右孩子节点的元树T ₃，1110000表示有根节点和左、右孩子节点的元树T ₄，依次类推。通过这种方式可以获得元树路径中每个单元的二进制编码，将编码按顺序组合可获得编码矩阵，即图7所示的矩阵。

其次，使用卷积神经网络CNN作用于编码矩阵，抽取编码矩阵的全局结构特征。

由于在卷积神经网络CNN中设置了k个卷积核，每个卷积核都能抽取到独一无二的全局结构特征，因此这一步骤能抽取到q ₁、q ₂、…、q _k个全局结构特征。

其中，每个全局结构特征q _i均为l维向量q _i∈R ^l。

为了刻画传播阶段S _i全局结构特征与局部特征之间的联系，通过如下方式计算全局结构特征q _i对于原始传播树中任意节点z _j的影响概率p(z _j|q _i)：

。

其中，z _j表示原始传播树中节点z _j的嵌入表示，w _i表示在全局结构特征q _i下待学习的权重向量，w _i ^T表示权重向量的转置，σ(·)表示sigmoid激活函数，⊕表示向量拼接操作。

基于计算获得的影响概率p(z _j|q _i)，通过线性加权的方式获得全局结构特征q _i影响下原始传播树中全体节点加权求和得到的结构特征f _i：

。

由于CNN中采用k个卷积核，存在k个全局结构特征，因此将k个全局结构特征下的传播结构特征进行聚合；采用向量拼接的方式进行特征聚合。

获得传播阶段S _i的整体结构特征：/>=f ₁⊕f ₂⊕…⊕f _k。

步骤4. 将每个传播阶段的内容特征和整体结构特征进行拼接，获得每个传播阶段的整体特征，再将连续传播阶段的整体特征序列视作时间序列，并基于时间序列建模方法构建最终的网络谣言检测模型。

基于步骤3获得的传播阶段S _i的内容特征和整体结构特征/>，将二者进行向量拼接获得代表传播阶段S _i的整体特征/>=/>⊕/>。

本发明将连续传播阶段S ₁、S ₂…、S _s的整体特征视作时间序列，从而能够基于时间序列方法建模连续的传播阶段。具体的，利用Bi-LSTM建模时间序列，将对应的Bi-LSTM隐藏层向量记作/>。

步骤5. 基于神经网络二分类方式训练网络谣言检测模型。

基于步骤4获取的隐藏层向量，首先通过平均池化（Averagepooling）操作计算隐藏层向量的平均值/>，随后将/>输入带有Softmax分类器的全连接神经网络进行二分类；类别标签分别为代表网络谣言的C ₁ =1和代表真实信息的C ₂ =1。

Softmax分类器本质上是一种神经元输出的概率分布形式。

Softmax分类器的最后一个输出层的节点个数与类别数量一致，在网络谣言检测背景下，输出层的节点个数为2，依次表示网络谣言和真实信息。

全连接神经网络按如下公式计算类别C _i的概率：p _m(C _i)=softmax(δ(W·+b))。

其中，p _m(C _i)表示传播事件m的初始信息被判定属于类别C _i的概率，δ(·)表示激活函数，W和b分别表示神经网络的隐藏层权重矩阵和偏置向量。

采取有监督方式训练网络谣言检测模型，将步骤1获取的网络谣言传播事件集合和真实信息传播事件集合作为训练数据集，使用二项交叉熵损失Loss作为优化目标函数，并且利用反向传播算法回传梯度以最小化目标函数，目标函数的计算方式为：

。

其中，M表示训练数据集中的样本总数，y _m表示传播事件m对应的真实标签。

对目标函数Loss进行最小化，即获得训练好的网络谣言检测模型。

基于步骤5训练得到的网络谣言检测模型，对于给定的来自网络空间的任意信息传播事件a，对信息传播事件a的初始信息所属类别进行分类，具体过程为：

步骤6.1. 依据步骤1获得信息传播事件a的信息传播树和传播内容流；

步骤6.2. 依据步骤2选择时间间隔Δt将信息传播事件a划分为多个传播阶段；

步骤6.3. 依据步骤3建模信息传播事件a每个传播阶段S _i的内容特征和整体结构特征；

步骤6.4. 依据步骤4建模信息传播事件a的连续传播阶段；

步骤6.5. 依据步骤5训练得到的网络谣言检测模型计算信息传播事件a的初始信息属于网络谣言或真实信息的概率，取较大概率值对应的类别作为信息传播事件a的初始信息所属类别。

当然，以上说明仅仅为本发明的较佳实施例，本发明并不限于列举上述实施例，应当说明的是，任何熟悉本领域的技术人员在本说明书的教导下，所做出的所有等同替代、明显变形形式，均落在本说明书的实质范围之内，理应受到本发明的保护。

Claims

1.一种基于传播结构动态保持的网络谣言检测方法，其特征在于，包括如下步骤：

步骤1.获取包含信息传播树和传播内容流的信息传播事件；

步骤2.设定时间间隔将得到的信息传播事件划分为多个传播阶段；

步骤3.针对每个传播阶段，分别抽取该传播阶段的内容特征和整体结构特征；

所述步骤3具体为：

针对内容特征，利用双向长短时记忆网络Bi-LSTM学习每一条信息的嵌入表示，即对于任意一条信息m_i，通过Bi-LSTM将其映射为l维向量表示x_i∈R^l；

定义第i个传播阶段为S_i，将传播阶段S_i的内容流视作时间序列，再次利用Bi-LSTM将传播阶段S_i的内容流映射为l维向量表示

针对整体结构特征，首先利用图注意力网络GAT学习原始传播树的节点表示；

设传播阶段S_i的原始传播树为G(S_i)，设第n层节点的嵌入表示矩阵为h_n，则第n+1层节点的嵌入表示矩阵按如下公式获得：h_n+1＝GAT(h_n,G(S_i))；

当n＝0时，令h₀为随机初始化的N×l维矩阵，N表示原始传播树G(S_i)的节点数量；

对传播阶段S_i的原始传播树G(S_i)进行结构无损的标准化操作，即将原始传播树G(S_i)通过定位、移除和旋转操作转换为标准的二叉树；

使用元树路径对二叉树的全局结构进行表达，利用深度d≤3的元树构造元树路径；

通过独热编码为构造的元树路径按照广度优先遍历进行编码，获得元树路径编码矩阵，随后利用卷积神经网络CNN对编码矩阵进行卷积操作，自上而下抽取编码矩阵的结构特征，获得编码矩阵的全局结构特征；在CNN中设置k个卷积核，每个卷积核各自独立地运行，设k个卷积核学习到的全局结构特征分别为q₁、q₂、…、q_k；

通过如下方式计算全局结构特征q_i对于原始传播树中任意节点z_j的影响概率p(z_j|q_i)：

其中，z_j表示原始传播树中节点z_j的嵌入表示，w_i表示在全局结构特征q_i下待学习的权重向量，w_i ^T表示权重向量的转置，σ(·)表示sigmoid激活函数，表示向量拼接操作；

基于计算获得的影响概率p(z_j|q_i)，通过线性加权的方式获得全局结构特征q_i影响下原始传播树中全体节点加权求和得到的结构特征f_i：

由于CNN中采用k个卷积核，存在k个全局结构特征，因此将k个全局结构特征下的传播结构特征进行聚合；采用向量拼接的方式进行特征聚合；

获得传播阶段S_i的整体结构特征

步骤4.将每个传播阶段的内容特征和整体结构特征进行拼接，获得每个传播阶段的整体特征，再将连续传播阶段的整体特征序列视作时间序列，并基于时间序列建模方法构建最终的网络谣言检测模型；

步骤5.基于神经网络二分类方式训练网络谣言检测模型；

步骤6.对于给定的来自网络空间的任意信息传播事件，利用训练好的网络谣言检测模型判断信息传播事件的初始信息是否为网络谣言。

2.根据权利要求1所述的基于传播结构动态保持的网络谣言检测方法，其特征在于，

所述步骤1具体为：

针对网络谣言传播事件，通过爬虫程序获取网络谣言的初始信息链接后，爬取网络谣言的初始信息以及相关的转发与评论信息；针对真实信息传播事件，通过爬虫程序直接爬取真实信息的初始信息以及相关的转发与评论信息；对于每一类信息传播事件中的每个样本，将初始信息以及相关的转发与评论信息按时间先后顺序分别形成信息传播树和传播内容流。

3.根据权利要求1所述的基于传播结构动态保持的网络谣言检测方法，其特征在于，

所述步骤2具体为：

针对每一类信息传播事件中的每个样本，选取时间间隔Δt，将信息传播树和传播内容流划分为s个传播阶段，其中位置相对靠后的传播阶段完全覆盖位置相对靠前的传播阶段。

4.根据权利要求1所述的基于传播结构动态保持的网络谣言检测方法，其特征在于，

在构造元树路径时，采用广度优先遍历，首先访问二叉树的根节点，然后依次访问其左孩子节点和右孩子节点，直到所有节点均被访问；

对于每一次访问，均抽取一个深度d≤3的元树，抽取优先级为d＝3＞d＝2＞d＝1。

5.根据权利要求1所述的基于传播结构动态保持的网络谣言检测方法，其特征在于，

所述步骤4具体为：

基于步骤3获得的传播阶段S_i的内容特征和整体结构特征/>将二者进行向量拼接获得代表传播阶段S_i的整体特征/>

将连续传播阶段S₁、S₂…、S_s的整体特征视作时间序列，从而基于时间序列方法建模连续的传播阶段；利用Bi-LSTM建模时间序列/>将对应的Bi-LSTM隐藏层向量记作/>

6.根据权利要求5所述的基于传播结构动态保持的网络谣言检测方法，其特征在于，

所述步骤5具体为：

基于步骤4获取的隐藏层向量首先通过平均池化操作计算隐藏层向量的平均值/>随后将/>输入带有Softmax分类器的全连接神经网络进行二分类；

全连接神经网络按如下公式计算类别C_i的概率：

其中，p_m(C_i)表示传播事件m的初始信息被判定属于类别C_i的概率，δ(·)表示激活函数，W和b分别表示神经网络的隐藏层权重矩阵和偏置向量；

其中，M表示训练数据集中的样本总数，y_m表示传播事件m对应的真实标签；

对目标函数Loss进行最小化，即获得训练好的网络谣言检测模型。

7.根据权利要求1所述的基于传播结构动态保持的网络谣言检测方法，其特征在于，

所述步骤6具体为：

基于步骤5训练得到的网络谣言检测模型，对于给定的来自网络空间的任意信息传播事件a，对信息传播事件a的初始信息所属类别进行分类。

8.根据权利要求7所述的基于传播结构动态保持的网络谣言检测方法，其特征在于，

所述步骤6中，对信息传播事件a的初始信息所属类别进行分类的具体过程为：

步骤6.1.依据步骤1获得信息传播事件a的信息传播树和传播内容流；

步骤6.2.依据步骤2选择时间间隔Δt将信息传播事件a划分为多个传播阶段；

步骤6.3.依据步骤3建模信息传播事件a每个传播阶段S_i的内容特征和整体结构特征；

步骤6.4.依据步骤4建模信息传播事件a的连续传播阶段；

步骤6.5.依据步骤5训练得到的网络谣言检测模型计算信息传播事件a的初始信息属于网络谣言或真实信息的概率，取较大概率值对应的类别作为信息传播事件a的初始信息所属类别。