CN112541081B

CN112541081B - 一种基于领域自适应的可迁移谣言检测方法

Info

Publication number: CN112541081B
Application number: CN202011518241.7A
Authority: CN
Inventors: 曹建军; 皮德常; 翁年凤; 吴致远; 江春; 陈俊夫; 丁鲲; 瞿雷
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2020-12-21
Filing date: 2020-12-21
Publication date: 2022-09-16
Anticipated expiration: 2040-12-21
Also published as: CN112541081A

Abstract

本发明公开了一种基于领域自适应的可迁移谣言检测方法，属于深度学习领域。包括：构建谣言检测模型；训练谣言分类模型，训练过程包括：在特征提取模块后连接域分类模块，引入域分类损失函数，并构建谣言分类损失与域分类损失的总体损失，利用总体损失对谣言分类模型进行训练；通过在特征提取模块与域分类模块之间添加梯度反转层，构建细粒度的梯度更新控制机制，对模型中需要更新的参数进行更新；获取谣言数据，并输入到训练好的谣言分类模型中进行分类，完成谣言检测。本发明的方法在实现谣言准确检测的同时，使得谣言检测方法具有较高的迁移性。

Description

一种基于领域自适应的可迁移谣言检测方法

技术领域

本发明属于深度学习领域，具体涉及一种基于领域自适应的可迁移谣言检测方法。

背景技术

网络谣言由于真伪难辨、蛊惑性强，容易带来严重的社会问题，甚至引发社会动荡和政局失稳。在现实中，谣言检测存在诸多挑战：社交网络上每时每刻都在产生新的新闻和资讯，并且内容涉及各个领域，依靠人工检测和群众举报的谣言检测方式无法处理海量的数据信息；一些谣言是被精心设计的，不仅普通用户甚至专业人士也难以分辨其真假。因谣言对于社会安全的危害性以及谣言检测的挑战性，近年来学术界和工业界的研究者对谣言检测问题越来越重视。随着人工智能技术的发展，机器学习算法获得了研究者们的青睐。如何在不需要过多人工干预的前提下，利用机器学习算法自动地对谣言进行检测，已经成为当下具有重要意义且极具挑战性的热点研究问题。然而，现有的谣言检测方法都将重点放在提高分类准确率上，忽视了谣言检测方法的可迁移性，将方法迁移到其它领域后，分类效果会不尽如人意。

例如申请号为201810198553.0的中国专利中公开了一种谣言检测方法及设备，通过谣言判别决策模块计算得到能判断和不能判断谣言的概率，若向所述GRU单元继续输入某一个消息矩阵后，对应计算得到的所述能判断谣言的概率大于预设阈值，则结束向所述GRU单元继续输入下一个消息矩阵，将最后一次更新的GRU单元状态发送给判别模块处理，该发明通过提高时效性来提高了谣言的检测准确率。但是，该方法确忽略了检测方法的可迁移性，当从一个领域迁移到另一个领域时，谣言检测的效果就会降低。

发明内容

技术问题：本发明针对现有的谣言检测方法迁移性较差的问题，提供了一种基于领域自适应的可迁移谣言检测方法，该方法通过加入域分类模块，引入域分类损失，利用谣言分类损失与域分类损失总体对谣言检测模型进行训练，有效地提高了谣言检测方法的可迁移性，使得该谣言检测方法能够迁移到其他领域。

技术方案：本发明的基于领域自适应的可迁移谣言检测方法，包括：

构建谣言检测模型，所述谣言检测模型包括词嵌入模块、特征提取模块、谣言分类模块；

训练谣言分类模型，训练过程包括：在特征提取模块后连接域分类模块，引入域分类损失函数，并构建谣言分类损失与域分类损失的总体损失，利用总体损失对谣言分类模型进行训练；通过在特征提取模块与域分类模块之间添加梯度反转层，构建细粒度的梯度更新控制机制，对模型中需要更新的参数进行更新；

获取谣言数据，利用训练后的词嵌入模块获得谣言数据的向量表示，并按照时间顺序排列，得到谣言数据的时间序列，将谣言数据的向量表示输入谣言分类模块进行时序特征提取，并将所提取的时序特征送入谣言分类模块进行分类。

进一步地，特征提取模块为基于门控循环单元的双向循环神经网络，包括前向门控循环单元和后向门控循环单元。

进一步地，基于门控循环单元的双向循环神经网络的模型公式如下：

z^t＝σ(W_zm^t+U_zh^t-1)

r^t＝σ(W_r ^t+U_rh^t-1)

其中，z^t为更新门，m^t为门控循环单元在第t个时间步的输入，r^t为重置门，h^t为当前时间步的状态，h^t-1为t-1时间步的状态，

是当前时间步的候选状态，W_z和U_z为更新门的权重矩阵，

和

为候选状态的权重矩阵σ(·)为sigmoid函数，⊙为哈达马积。

进一步地，利用基于门控循环单元的双向循环神经网络提取谣言的时序特征的过程包括：

(1)对于时间序列c_i，前向门控循环单元从

到

遍历c_i，得到t时刻的前向隐状态表示

计算公式为：

其中，

为时间序列c_i中的元素，GRU(·)表示基于门控机制的循环神经网络；

(2)后向门控循环单元从

到

遍历c_i，得到t时刻的后向隐状态表示

计算公式为：

(3)通过聚合

和

得到t时刻的隐状态表示

计算公式为：

其中，T表示转置符号，[·,·]表示聚合操作；

(4)对不同时刻的隐状态表示进行加权平均，得到时间序列c_i的隐状态表示h_i，计算公式为：

其中，h_i是对时间序列c_i的表示，α_t表示权重系数；

(5)用F_f(·；θ_f)函数表示对时序数据的特征提取模块，函数F_f(·；θ_f)以时序数据c作为输入，输出关于c_i的隐状态表示h_i，计算公式为：

h_i＝F_f(c_i；θ_f)

其中，θ_f表示特征提取模块的可训练参数。

进一步地，谣言分类损失的计算方法为：

首先以隐状态表示h_i作为输入，输出谣言的分类结果

计算公式为：

其中，F_y(·；θ_y)表示谣言分类模块，θ_y表示谣言分类模块的可训练参数；

然后计算谣言分类损失L_y，计算公式为：

其中，

表示分类损失函数，

为预测的谣言类别标签，

表示源域的预测的谣言类别标签，

表示目标域的预测的谣言类别标签，y为真实的谣言类别标签，

表示源域的预测的谣言类别标签，

表示目标域的预测的谣言类别标签；D_S表示源域，

表示目标域中有标签的数据，N_L表示目标域中有标签数据的数量。

进一步地，域分类损失的计算方法为：

首先，以隐状态表示h_i作为输入，输出关于h_i的域分类结果

计算公式为：

其中，F_d(·；θ_d)表示域分类模块，θ_d表示域分类模块的可训练参数；

然后计算域分类损失L_d，计算公式为：

其中，

表示分类损失函数，

为域分类的预测值，

表示源域的域分类预测值，

表示目标域的域分类预测值，d_i为域分类的真实值，若d_i来自源域，则d_i＝0，若d_i来自目标域，则d_i＝1；N_S表示源域中有标签数据的数量，D_T为目标域，N_U表示目标域中无标签数据的数量，N_L表示目标域中有标签数据的数量。

进一步地，总体损失的构建方法为：

L＝L_y-λ·L_d

其中，L表示总体分类损失，L_y表示谣言分类损失，L_d表示域分类损失，λ表示平衡参数。

进一步地，所述细粒度的梯度更新机制包括：

(1)前向传播过程中，梯度反转层R(·)以特征提取模块提取的隐状态表示h_i作为输入，输出值同样为h_i，计算公式为：

R(h_i)＝h_i

(2)后向传播过程中，梯度反转层将域分类模块参数的梯度乘以-β，传递给前层的特征提取模块，计算公式为：

其中，

表示偏微分，I为单位矩阵，β为缩放因子；

(3)特征提取模块的可训练参数θ_f采用如下公式进行更新：

谣言分类模块的可训练参数θ_y采用如下公式进行更新：

域分类模块的可训练参数θ_d采用如下公式进行更新：

其中，μ表示学习率。

进一步地，利用细粒度更新控制机制更新参数后，总体损失的计算方法为：

其中，

表示来源于源域的时间序列，

表示来源于目标域的时间序列。

进一步地，谣言分类模块和域分类模块均为一个全连接层。

有益效果：本发明与现有技术相比，本发明首先构建了谣言检测模型，利用词嵌入技术得到谣言数据的向量表示，利用基于门控循环单元的双向循环神经网络提取谣言的时序特征，然后对谣言进行分类，利用该模型能够对谣言进行有效的检测，并利用细粒度梯度更新机制对参数进行更新，从而能够及时有效地检测网络谣言。

同时，本发明的方法，在谣言检测模型的特征提取模块后连接域分类模块，进而引入了域分类损失函数，通过谣言分类损失与域分类损失组合对谣言分类模型进行训练，从而能够利用领域自适应方法，使得特征提取模块能够提取领域无关的特征，减小从源域中提取的特征和从目标域中提取的特征的差异，有效地缓解了因源域数据和目标域数据分布不一致导致的分类性能下降问题，提高了谣言检测方法的可迁移性。

此外，本发明通过在特征提取模块与域分类模块之间加了一个梯度反转层，构建了细粒度梯度更新机制，从而在模型训练时对模型的训练参数进行更新，在实现谣言准确检测的同时，又提高了谣言检测方法的可迁移性。

附图说明

图1为本发明的谣言检测方法的流程图；

图2为本发明的谣言检测方法的模型框架图。

具体实施方式

下面结合实施例和说明书附图对本发明作进一步的说明。

定义(1)源帖子：一个用户原创的帖子，它不是对任何其它帖子的回复、评论或是转发，在本发明的实施例中，使用R_i表示第i个源帖子。

定义(2)响应帖子：是在原帖发布后，对其进行回复、评论或是转发的帖子，在本发明的实施例中，使用

表示原帖R_i在t时刻的响应帖。

定义(3)帖子集合：每一个帖子集合由一条源帖和该帖的响应帖构成，记做

其中R_i表示源帖，

为按时间排列的响应帖，为了统一符号，也可以将源帖R_i记做

定义(4)源域和目标域：源域包含大量有标签的数据，记作

目标域包含少量有标签的数据(可能没有)和大量无标签的数据，记作

其中

和

为数据实例，

和

为相应的类别标签，N_S表示源域中有标签数据的数量，N_L表示目标域中有标签数据的数量，N_U表示目标域中无标签数据的数量。X为特征空间，Y为标签空间，并且

结合图1给出的本方法的流程，本发明的实施例中，构建了用于进行谣言检测的模型，该模型的框架如图2所示，具体包括词嵌入模块、特征提取模块、谣言分类模块，并且为了对谣言检测模型进行训练，在特征提取模块之后连接域分类模块，并且，为了对模型中的参数进行更新，在特征提取模块与域分类模块之间添加一个梯度反转层(gradientreversal layer,GRL)。图2中的黑色实线箭头表示前向传播过程，黑色虚线箭头表示后向传播过程。

对于互联网上发布的帖子，将原始的文本内容表示为低维向量，常用的做法是将文本的每一个单词表示为词向量，然后取均值作为文本的表示。根据收集的语料库将单词表示为词向量的技术，称为词嵌入技术。本发明的实施例中，使用Glove方法将离散的文本内容表示为连续的向量，即在本发明的实施例中，词嵌入模块采用的是Glove方法。

在利用Glove方法时，首先，需要根据语料库建立全局共现矩阵X，共现矩阵X中的每一个元素X_i,j表示单词V_i和单词V_j共同出现的次数。对于每一个单词V_i，通过将公式(1)中的损失函数J最小化，即可得到每一个单词V_i的向量表示v_i，构成词向量表E。

其中，w(x)为权重函数，w(x)定义如式(2)所示，x_max为指定的阈值，v_i为第i个单词V_i的向量表示，b_i为第i个单词V_i的偏置，b_i是一个标量。同样的，v_j为第j个单词V_j的向量表示，b_j为第j个单词V_j的偏置，b_j也是一个标量。N表示语料库中所有单词的数量。

对于帖子M中出现的单词，通过查找训练好的词向量表E(构成图2中的词嵌入层)，即可得到该单词的向量表示，未能查找到的单词，使用零向量填充。最后，通过取均值的方式即可得到帖子M的向量表示m。

原帖发布后，用户可以通过对原帖进行回复以及对他人的评论进行回复，来表达自己的观点。将用户的回复按时间排列即可构成响应帖，响应帖的文本内容包含了大量的语义信息，通过衡量响应帖的动态时序特性，可以判断原帖内容的真假。对于每一个帖子集合

使用词嵌入方法，可以得到C_i中每一条响应帖

的文本内容的向量表示

将文本表示按时间排列，可以得到时间序列

为了捕获谣言和非谣言的传播特性，本发明的实施例中，特征提取模块采用的是循环神经网络，从而能够提取时序数据的动态变化。在时间步t,时间序列c_i中的元素

作为循环神经网络的输入。

具体地，本发明的实施例中，使用基于门控循环单元(gated recurrent unit，GRU)的双向循环神经网络来对时间序列进行建模，基于门控循环单元包括两个GRU，分别为前向GRU和后向GRU，对于基于GRU的循环神经网络，其模型公式如式(3)～(6)所示。

z^t＝σ(W_zm^t+U_zh^t-1) (3)

r^t＝σ(W_r ^t+U_rh^t-1) (4)

其中，z^t为更新门，可以看作是一个平衡参数；m^t作为GRU在第t个时间步的输入，它是当前帖子集合中第t个响应帖的向量表示；σ(·)为sigmoid函数；

和

为更新门的权重矩阵；h^t为当前时间步的状态，h^t-1为t-1时间步的状态，

为当前时间步的候选状态；

和

为候选状态的权重矩阵；⊙为哈达马积；r^t为重置门，控制t-1时间步的状态h^t-1有多少信息能被写入到当前时间步的候选状态

上，重置门的数值越小，前一时间步的状态信息被写入的越少；从公式(5)可以看出，候选状态

的取值与重置门r^t、t-1时间步的状态h^t-1以及当前时间步的输入m^t有关。使用更新门，可以有选择地遗忘t-1时刻的信息h^t-1，同时有选择地增加候选状态

中的信息，从而得到当前时间步的状态表示h^t。

本发明的实施例中采用双向形式的GRU，是为了更好地捕获时序数据的上下文信息。在提取谣言的时序特征时，对于时间序列c_i，前向门控循环单元从

到

遍历c_i，得到t时刻的前向隐状态表示

计算公式为：

后向门控循环单元从

到

遍历c_i，得到t时刻的后向隐状态表示

计算公式为：

然后，通过聚合

和

得到t时刻的隐状态表示

计算公式为：

其中，T表示转置符号，[·,·]表示聚合操作。

聚合了前向GRU得到的

以及后向GRU得到的

因此，

能够更好的捕获响应帖

的上下文信息。

最后，对不同时刻的隐状态表示进行加权平均，得到时间序列c_i的隐状态表示h_i，计算公式为：

其中，h_i是对时间序列c_i的表示，α_t表示权重系数，通过调整系数α_t的大小，可以控制t时刻的状态表示

对h_i的影响。

在本发明的实施例中，用F_f(·；θ_f)函数表示对时序数据的特征提取模块，具体地，特征提取模块为一个全连接层，函数F_f(·；θ_f)以时序数据c_i作为输入，输出关于c_i的隐状态表示h_i，计算公式如(11)所示：

h_i＝F_f(c_i；θ_f) (11)

使用特征提取模块得到时间序列c_i的表示h_i后，将h_i输入全连接网络即可得到关于帖子集合c_i的分类结果，计算公式如(12)所示：

然后计算谣言分类损失，计算公式如(13)所示：

其中，

表示分类损失函数，

为预测的谣言类别标签，则用

表示源域的预测的谣言类别标签，

表示源域的预测的谣言类别标签，

表示目标域的预测的谣言类别标签；D_S表示源域，

表示目标域中有标签的数据，N_L表示目标域中有标签数据的数量。在本发明的实施例中，分类损失函数

可选择交叉熵损失函数。谣言分类损失L_y包含两部分：(1)源域中有标签数据的分类损失；(2)目标域中有标签数据的分类损失。

在训练谣言检测模型时，如果只通过最小化谣言损失的方法来进行训练，使模型的参数达到最优，此时由于源域和目标域数据之间存在分布的差异，而源域的数据远多于目标域的有标签数据，因此，训练得到的模型在应用于目标域的无标签数据时，会导致分类效果严重下降。

领域自适应研究表明，当给定的算法无法区别数据表示是来自于源域还是目标域时，该算法能够将源域的知识迁移到目标域。本发明的实施例中，使用领域自适应方法，使得特征提取函数F_f(·；θ_f)能提取领域无关的特征，从而在对目标域的谣言进行分类时，能够将源域的知识迁移到目标域。

类似于生成对抗网络(GAN，Generative Adversarial Networks)，领域自适应可以被看作是最小最大化博弈，在训练模型时，领域判别器(domain critic)F_d(·；θ_d)不断被优化，用来更好地区分得到的特征表示是来自于源域还是目标域；另一方面，通过优化特征提取函数F_f(·；θ_f)的参数，能够减小模型对谣言的分类损失，同时增大领域判别器的分类损失，即特征提取函数F_f(·；θ_f)在被优化时，希望能够提高模型对于谣言的分类准确率，同时降低领域判别器的分类准确率。领域判别器和特征提取函数经过上述过程的反复博弈，使模型的参数达到最优。最终，特征提取函数F_f(·；θ_f)能够学习到领域无关的特征表示。

在本发明的实施例中，利用全连接神经网络作为领域判别器F_d(·；θ_d)，具体地，域分类模块为一个全连接层，为了计算域分类损失，首先以隐状态表示h_i作为输入，输出关于h_i的域分类结果

计算公式如公式(14)所示：

输出的域分类结果

越接近0，表示h_i越可能来自源域，

越接近1，表示h_i越可能来自于目标域；θ_y表示域分类模块的可训练参数，即在本发明的实施例中，为全连接层网络的可训练参数。然后计算域分类损失，计算公式如公式(15)所示：

其中，

表示分类损失函数，

为域分类的预测值，

表示源域的域分类预测值，

表示目标域的域分类预测值，

和

均可以通过公式(14)计算获得；d_i为域分类的真实值，若d_i来自源域，则d_i＝0，若d_i来自目标域，则d_i＝1；N_S表示源域中有标签数据的数量，D_T为目标域，N_U表示目标域中无标签数据的数量，N_L表示目标域中有标签数据的数量。在本发明的实施例中，

可以选择交叉熵损失函数。最终的域分类损失L_d包含两部分：(1)源域中所有数据的域分类损失；(2)目标域中所有数据的域分类损失。

根据谣言分类损失以及域分类损失，即可构建总体损失，总体损失L由两部分组成：(1)谣言分类损失L_y；(2)域分类损失L_d，具体的计算公式如公式(16)所示：

L＝L_y-λ·L_d (16)

其中，λ表示平衡参数。

在训练阶段，一方面，模型需要优化参数θ_f和θ_y，使总体损失L减小，如式(17)所示；另一方面，模型需要优化参数θ_d，使总体损失L增大，如式(18)所示。

其中，

和

分别表示相应参数的预测值，由式(17)和(18)可知，在优化参数θ_f和θ_y时，需固定参数θ_d；而在优化参数θ_d时，需固定参数θ_f和θ_y。

为了对模型的参数更好的训练，本发明的实施例中，构建了一种细粒度的梯度更新控制机制，通过在特征提取模块和域分类模块之间增加了一个梯度反转层R(·)，在前向传播过程中，R(·)以特征提取模块提取的隐状态表示h_i作为输入，输出值同样为h_i，如式(19)所示；在后向传播过程中，梯度反转层将后层网络(域分类模块)参数的梯度乘以-β，传递给前层的网络(特征提取模块)，如式(20)所示。

R(h_i)＝h_i (19)

其中，

表示偏微分，I为单位矩阵，β为缩放因子，可以用来调节域分类模块的梯度经过梯度反转层后的大小。

当增加了梯度反转层后，参数θ_f、θ_y和θ_d的更新方式如式(21)～(23)所示。

其中，μ表示学习率，λ用来平衡参数θ_y和θ_d的学习速度。

根据所提出的细粒度梯度更新控制机制用来更新模型的参数后，式(16)中的总体损失L可写为：

其中，

表示来源于源域的时间序列，

表示来源于目标域的时间序列。

为了使模型达到最优，需要不断地重复遍历一个时期内的所有样本，直到损失函数L收敛或是满足停止的条件。例如，损失函数的值小于一定的阈值，或者是达到规定的最大时期数。在整个训练过程中，所有的参数通过反向传播进行更新。

本发明通过在特征提取模块后连接域分类模块，从而引入了域分类损失函数，将领域自适应方法引入到训练过程，利用谣言损失与域分类损失构成的总体损失对谣言检测模型进行训练，并利用所构建的细粒度梯度控制机制进行参数更新，使得谣言检测模型在能够对谣言进行准确检测的同时，具有更好的迁移性，从而能够适用不同领域的谣言检测。

利用训练好的谣言检测模型，可以有效地对谣言进行检测，首先获取互联网中的谣言数据，然后输入词嵌入模块，获得谣言的向量表示，并按照时间顺序排列，得到谣言数据的时间序列，将谣言数据的向量表示输入谣言分类模块进行时序特征提取，并将所提取的时序特征送入谣言分类模块进行分类。

综上方法，本发明的方法不仅能够对谣言进行有效的检测，同时，具有较好的迁移性，能够用于不同领域的谣言检测。

上述实施例仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和等同替换，这些对本发明权利要求进行改进和等同替换后的技术方案，均落入本发明的保护范围。

Claims

1.一种基于领域自适应的可迁移谣言检测方法，其特征在于，包括：

2.根据权利要求1所述的基于领域自适应的可迁移谣言检测方法，其特征在于，特征提取模块为基于门控循环单元的双向循环神经网络，包括前向门控循环单元和后向门控循环单元。

3.根据权利要求2所述的基于领域自适应的可迁移谣言检测方法，其特征在于，基于门控循环单元的双向循环神经网络的模型公式如下：

z^t＝σ(W_zm^t+U_zh^t-1)

r^t＝σ(W_r ^t+U_rh^t-1)

h^t＝(1-z^t)⊙h^t-1+z^t⊙h～^t

其中，z^t为更新门，m^t为门控循环单元在第t个时间步的输入，r^t为重置门，h^t为当前时间步的状态，h^t-1为t-1时间步的状态，h～^t是当前时间步的候选状态，W_z和U_z为更新门的权重矩阵，W_r ^t和U_r为重置门的权重矩阵，

和

为候选状态的权重矩阵,σ(.)为sigmoid函数，⊙为哈达马积。

4.根据权利要求3所述的基于领域自适应的可迁移谣言检测方法，其特征在于，利用基于门控循环单元的双向循环神经网络提取谣言的时序特征的过程包括：

(1)对于时间序列c_i，前向门控循环单元从

到

遍历c_i，得到t时刻的前向隐状态表示

计算公式为：

其中，

为时间序列c_i中的元素，GRU(.)表示基于门控机制的循环神经网络；

(2)后向门控循环单元从

到

遍历c_i，得到t时刻的后向隐状态表示

计算公式为：

(3)通过聚合

和

得到t时刻的隐状态表示h_i ^t，计算公式为：

其中，T表示转置符号，[.,.]表示聚合操作；

其中，h_i是对时间序列c_i的表示，α_t表示权重系数；

(5)为了简洁，将上述步骤(1)-(4)的时序数据的特征提取过程用F_f函数表示，函数F_f以时序数据c_i

作为输入，最终输出关于c_i的隐状态表示h_i，计算公式为:

h_i＝F_f(c_i；θ_f)

其中，θ_f表示特征提取模块的可训练参数。

5.根据权利要求4所述的基于领域自适应的可迁移谣言检测方法，其特征在于，谣言分类损失的计算方法为：

首先以隐状态表示h_i作为输入，输出谣言的分类结果

计算公式为：

其中，F_y(.；θ_y)表示谣言分类模块，θ_y表示谣言分类模块的可训练参数；

然后计算谣言分类损失L_y，计算公式为：

其中，L_y(y^,y)表示分类损失函数，

为预测的谣言类别标签，

表示源域的预测的谣言类别标签，

表示源域的预测的谣言类别标签，

表示目标域的预测的谣言类别标签；

表示目标域中有标签的数据，N_L表示目标域中有标签数据的数量，N_S表示源域中有标签数据的数量，D_S为源域样本数量，D_T为目标域有标签样本数量。

6.根据权利要求5所述的基于领域自适应的可迁移谣言检测方法，其特征在于，域分类损失的计算方法为：

首先，以隐状态表示h_i作为输入，输出关于h_i的域分类结果

计算公式为：

其中，F_d(.；9_d)表示域分类模块，9_d表示域分类模块的可训练参数；

然后计算域分类损失L_d，计算公式为：

其中，

表示分类损失函数，

为域分类的预测值，

表示源域的域分类预测值，

表示目标域的域分类预测值，d_i为域分类的真实值，若d_i来自源域，则d_i＝0，若d_i来自目标域，则d_i＝1；N_S表示源域中有标签数据的数量，D_T为目标域，N_U表示目标域中无标签数据的数量，N_L表示目标域中有标签数据的数量,D_S为源域样本数量，D_T为目标域有标签样本数量。

7.根据权利要求6所述的基于领域自适应的可迁移谣言检测方法，其特征在于，总体损失的构建方法为：

L＝L_y一入.L_d

其中，L表示总体分类损失，L_y表示谣言分类损失，L_d表示域分类损失，入表示平衡参数。

8.根据权利要求7所述的基于领域自适应的可迁移谣言检测方法，其特征在于，所述细粒度的梯度更新机制包括：

(1)前向传播过程中，梯度反转层R(.)以特征提取模块提取的隐状态表示h_i作为输入，输出值同样为h_i，计算公式为：

R(h_i)＝h_i

其中，a表示偏微分，I为单位矩阵，β为缩放因子；

(3)特征提取模块的可训练参数9_f采用如下公式进行更新：

谣言分类模块的可训练参数9_y采用如下公式进行更新：

域分类模块的可训练参数9_d采用如下公式进行更新：

其中，μ表示学习率。

9.根据权利要求8所述的基于领域自适应的可迁移谣言检测方法，其特征在于，利用细粒度更新控制机制更新参数后，总体损失的计算方法为：

其中，

表示来源于源域的时间序列，

表示来源于目标域的时间序列。

10.根据权利要求1-9任一项所述的基于领域自适应的可迁移谣言检测方法，其特征在于，谣言分类模块和域分类模块均为一个全连接层。