CN112148997A

CN112148997A - 一种用于灾害事件检测的多模态对抗模型的训练方法和装置

Info

Publication number: CN112148997A
Application number: CN202010791173.5A
Authority: CN
Inventors: 高望; 邓宏涛; 朱珣; 刘哲; 王煜炜; 曾凡综
Original assignee: Jianghan University
Current assignee: Jianghan University
Priority date: 2020-08-07
Filing date: 2020-08-07
Publication date: 2020-12-29
Anticipated expiration: 2040-08-07
Also published as: CN112148997B

Abstract

本发明涉及网络信息分析技术领域，具体涉及一种用于灾害事件检测的多模态对抗模型的训练方法和装置。该方法包括：获取社交媒体数据；抽取所述社交媒体数据的图像特征和文本特征；对所述社交媒体数据的图像特征和文本特征进行预处理；将预处理后的所述社交媒体数据的图像特征和文本特征，输入进多模态对抗模型，更新多模态特征提取单元、信息识别单元和对抗训练单元的参数集。本发明利用多模态特征提取单元和对抗训练单元之间的极大极小博弈，提高了卷积神经网络模型在利用社交媒体数据来检测出灾害事件时的效率和准确度。

Description

一种用于灾害事件检测的多模态对抗模型的训练方法和装置

技术领域

本发明涉及网络信息分析技术领域，具体涉及一种用于灾害事件检测的多模态对抗模型的训练方法和装置。

背景技术

地震、火灾、洪水等灾害给人们的生活带来了巨大的伤害。一方面使人们的生命、财产遭到严重的损失；另一方面在灾难发生时，给受灾群众的心理也带来创伤。因此，在自然和人为灾害期间，救援组织需要及时向受影响的人们提供援助。但是，由于受灾群众的位置信息有限，对于救援组织而言，这项任务是非常困难的。当前，在突发灾害事件发生时，大量用户倾向于在社交媒体(如微博、推特等)上发布各种信息。受灾群众和目击者通过文本和图像信息在这些平台分享自己的状态，传播人员或设施受损信息并寻求帮助。社交媒体生成的这些数据实时更新且广泛传播，可帮助政府相关部门和救援组织获取可操作的信息以挽救生命和修复基础设施。因此，如何在海量社交媒体数据中检测出与灾害事件相关的信息，成为了突发灾害事件处理中不容忽视的主题。

传统的事件检测方法一般只考虑文本一种模态的信息，然而社交媒体上包含大量图片、文字等多模态信息。较少研究同时使用社交媒体中文本和图片信息检测与突发灾害事件相关内容。此外，突发灾害事件检测的主要挑战在于如何识别与新出现的灾难事件相关的信息。基于机器学习的方法仅能检测出与训练集中已存在的灾害事件相关的信息，而对于训练集中不存在的灾害事件效果较差。这主要是因为这些方法在社交媒体数据中抽取的是特定于灾难事件的特征，这些特征无法在不同灾难事件之间共享，从而影响了对与新兴灾难事件相关信息的检测。

因此，如何高效准确地利用社交媒体数据来检测出灾害事件，是目前亟需解决的技术问题。

发明内容

本发明的目的是提供一种用于灾害事件检测的多模态对抗模型的训练方法和装置，以提高卷积神经网络模型在利用社交媒体数据来检测出灾害事件时的效率和准确度。

本发明实施例提供了以下方案：

第一方面，本发明实施例提供一种用于灾害事件检测的多模态对抗模型的训练方法，所述方法包括：

获取社交媒体数据；

抽取所述社交媒体数据的图像特征和文本特征；

对所述社交媒体数据的图像特征和文本特征进行预处理；

将预处理后的所述社交媒体数据的图像特征和文本特征，输入进多模态对抗模型，以更新所述多模态对抗模型中的多模态特征提取单元、信息识别单元和对抗训练单元的参数集；

其中，所述多模态特征提取单元的输出层为第一全连接层，所述信息识别单元的输入层为第二全连接层，所述对抗训练单元的输入层为第三全连接层；所述第一全连接层分别连接所述第二全连接层和所述第三全连接层；

所述多模态特征提取单元包括图像多模态特征提取层、文本多模态特征提取层和多模态特征连接层；所述图像多模态特征提取层用于提取所述社交媒体数据的图像特征的图像多模态特征；所述文本多模态特征提取层用于提取所述社交媒体数据的文本特征的文本多模态特征；所述多模态特征连接层用于将所述图像多模态特征和所述文本多模态特征连接为所述社交媒体数据的多模态特征；

所述所述信息识别单元包括Softmax层；所述Softmax层用于根据所述社交媒体数据的多模态特征，生成所述社交媒体数据与任何灾害事件无关的概率；所述Softmax层还用于根据第一损失函数，更新所述多模态特征提取单元和所述信息识别单元的参数集；所述第一损失函数根据所述社交媒体数据与任何灾害事件无关的概率构建；

所述对抗训练单元包括对抗训练层；所述对抗训练层用于根据第二损失函数，更新所述对抗训练单元的参数集；所述第二损失函数根据所述多模态特征提取单元的输出值和所述信息识别单元的识别结果构建。

在一种可能的实施例中，所述提取所述社交媒体数据的图像特征的图像多模态特征，包括：

将所述所述社交媒体数据的图像特征输入进训练好的VGG-19网络模型，获得所述社交媒体数据的图像特征的图像多模态特征。

在一种可能的实施例中，所述提取所述社交媒体数据的文本特征的文本多模态特征，包括：

将所述社交媒体数据的文本特征转化为输入文本；所述输入文本包括字符向量，分段向量和位置向量；

对所述输入文本中的字符向量，分段向量和位置向量按位求和，获得BERT模型的编码层输入量；

利用多头注意力和自注意力机制将所述BERT模型的编码层输入量转化为所述输入文本的隐藏状态集；

根据所述输入文本的隐藏状态集，获取所述社交媒体数据的文本特征的文本多模态特征。

在一种可能的实施例中，所述根据第一损失函数，更新所述多模态特征提取单元和所述信息识别单元的参数集，包括：

计算所述多模态特征提取单元的最优参数集

和所述信息识别单元的最优参数集

具体的计算公式为：

其中，

为所述第一损失函数，

为期望函数，Y_d为表示社交媒体数据x是否与灾害事件有关的标签，p(x)为社交媒体数据x与任何灾害事件无关的概率，θ_F为所述多模态特征提取单元的参数集，θ_D为所述信息识别单元的参数集；

将所述多模态特征提取单元的最优参数集

更新为所述多模态特征提取单元的参数集；

将所述信息识别单元的最优参数集

更新为所述信息识别单元的参数集。

在一种可能的实施例中，所述根据第二损失函数，更新所述对抗训练单元的参数集，包括：

计算所述对抗训练单元的最优参数集

具体的计算公式为：

其中，

为所述第二损失函数，Y_m为表示灾害事件的标签，f_F为所述多模态特征提取单元的输出值，f_M为所述信息识别单元的识别结果，θ_M为所述对抗训练单元的参数集；

将所述对抗训练单元的最优参数集

更新为所述对抗训练单元的参数集。

在一种可能的实施例中，所述对所述社交媒体数据的图像特征和文本特征进行预处理，包括：

将所述社交媒体数据的图像特征的尺寸转换为设定尺寸，获得预处理后的所述社交媒体数据的图像特征；

去除所述社交媒体数据的文本特征中的非拉丁字符，并将所述社交媒体数据的文本特征中的所有字母转换为小写字母，获得预处理后的所述社交媒体数据的文本特征。

第二方面，本发明实施例提供一种用于灾害事件检测的多模态对抗模型的训练装置，包括：

社交媒体数据获取模块，用于获取社交媒体数据；

特征抽取模块，用于抽取所述社交媒体数据的图像特征和文本特征；

预处理模块，用于对所述社交媒体数据的图像特征和文本特征进行预处理；

第一更新模块，用于将预处理后的所述社交媒体数据的图像特征和文本特征，输入进多模态对抗模型，以更新所述多模态对抗模型中的多模态特征提取单元、信息识别单元和对抗训练单元的参数集；

在一种可能的实施例中，所述第一更新模块，包括：

图像多模态特征获取模块，用于将所述所述社交媒体数据的图像特征输入进训练好的VGG-19网络模型，获得所述社交媒体数据的图像特征的图像多模态特征。

在一种可能的实施例中，所述第一更新模块，还包括：

输入文本转化模块，用于将所述社交媒体数据的文本特征转化为输入文本；所述输入文本包括字符向量，分段向量和位置向量；

编码层输入量获取模块，用于对所述输入文本中的字符向量，分段向量和位置向量按位求和，获得BERT模型的编码层输入量；

隐藏状态集转化模块，用于利用多头注意力和自注意力机制将所述BERT模型的编码层输入量转化为所述输入文本的隐藏状态集；

文本多模态特征获取模块，用于根据所述输入文本的隐藏状态集，获取所述社交媒体数据的文本特征的文本多模态特征。

在一种可能的实施例中，所述第一更新模块，还包括：

第一计算模块，用于计算所述多模态特征提取单元的最优参数集

和所述信息识别单元的最优参数集

具体的计算公式为：

其中，

为所述第一损失函数，

第二更新模块，用于将所述多模态特征提取单元的最优参数集

更新为所述多模态特征提取单元的参数集；

第三更新模块，用于将所述信息识别单元的最优参数集

更新为所述信息识别单元的参数集。

在一种可能的实施例中，所述第一更新模块，还包括：

第二计算模块，用于计算所述对抗训练单元的最优参数集

具体的计算公式为：

其中，

第四更新模块，用于将所述对抗训练单元的最优参数集

更新为所述对抗训练单元的参数集。

在一种可能的实施例中，所述预处理模块，包括：

图像预处理模块，用于将所述社交媒体数据的图像特征的尺寸转换为设定尺寸，获得预处理后的所述社交媒体数据的图像特征；

文字与处理模块，用于去除所述社交媒体数据的文本特征中的非拉丁字符，并将所述社交媒体数据的文本特征中的所有字母转换为小写字母，获得预处理后的所述社交媒体数据的文本特征。

第三方面，本发明实施例提供一种用于灾害事件检测的多模态对抗模型的训练设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序以实现第一方面中任一所述的用于灾害事件检测的多模态对抗模型的训练方法的步骤。

第四方面，本发明实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时以实现第一方面中任一所述的用于灾害事件检测的多模态对抗模型的训练方法的步骤。

本发明与现有技术相比，具有如下的优点和有益效果：

本发明中多模态对抗模型包括多模态特征提取单元、信息识别单元和对抗训练单元，信息识别单元能够根据第一损失函数更新多模态特征提取单元和信息识别单元的参数集，对抗训练单元能够根据第二损失函数更新对抗训练单元的参数集。一方面，多模态特征提取单元与信息识别单元共同作用最小化损失函数，以提高灾害事件相关信息检测性能。另一方面，多模态特征提取单元试图愚弄对抗训练单元以最大化损失函数，以学习到事件无关特征表示。本发明利用多模态特征提取单元和对抗训练单元之间的极大极小博弈，提高了卷积神经网络模型在利用社交媒体数据来检测出灾害事件时的效率和准确度。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种用于灾害事件检测的多模态对抗模型的训练方法的流程图；

图2是本发明实施例提供的一种多模态对抗模型的结构示意图；

图3是本发明实施例提供的检测结果对比图；

图4是本发明实施例提供的一种用于灾害事件检测的多模态对抗模型的训练装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例，基于本发明实施例，本领域普通技术人员所获得的所有其他实施例，都属于本发明实施例保护的范围。

请参阅图1，图1为本发明实施例提供的用于灾害事件检测的多模态对抗模型的训练方法的流程图，包括步骤11至步骤14。

步骤11，获取社交媒体数据。

具体的，社交媒体数据是指在微博、QQ空间、微信朋友圈、Twitter、Facebook等网络媒体上发布的带有文本和/或图像的数据。通过爬虫可以从社交媒体中收集大量含有文本、图像的社交媒体数据。

步骤12，抽取所述社交媒体数据的图像特征和文本特征。

具体的，由于多模式特征数据的提取技术中，图像特征处理和文本特征处理采用的是不同的技术，因而需要将社交媒体数据中的图像特征和文本特征进行分离，单独进行处理。

步骤13，对所述社交媒体数据的图像特征和文本特征进行预处理。

具体的，通过预处理，使社交媒体数据的图像特征和文本特征模式化和规范化，方便之后对模型的训练。

这里，给出一种较优的预处理方案，具体为：

步骤21，将所述社交媒体数据的图像特征的尺寸转换为设定尺寸，获得预处理后的所述社交媒体数据的图像特征。

具体的，在本实施例中，统一将社交媒体数据的图像特征的尺寸转换224ppi×224ppi大小。

步骤22，去除所述社交媒体数据的文本特征中的非拉丁字符，并将所述社交媒体数据的文本特征中的所有字母转换为小写字母，获得预处理后的所述社交媒体数据的文本特征。

步骤14，将预处理后的所述社交媒体数据的图像特征和文本特征，输入进多模态对抗模型，以更新所述多模态对抗模型中的多模态特征提取单元、信息识别单元和对抗训练单元的参数集。

具体的，多模态对抗模型属于一种MANN多模态对抗神经网络模型(Multi-modalAdversarial Neural Network)，具体包括多模态特征提取单元、信息识别单元和对抗训练单元。

图2为本实施例提供的一种较优的多模态对抗模型得结构示意图，多模态特征提取单元的输出层为第一全连接层，信息识别单元的输入层为第二全连接层，对抗训练单元的输入层为第三全连接层；第一全连接层分别连接第二全连接层和第三全连接层，以实现多模态特征提取单元与信息识别单元、对抗训练单元之间的数据传输。下面具体介绍模型中的三个单元。

1、多模态特征提取单元

多模态特征提取单元包括图像多模态特征提取层、文本多模态特征提取层和多模态特征连接层。

图像多模态特征提取层用于提取社交媒体数据的图像特征的图像多模态特征，具体可以使用训练好的Xception，ResNet50，VGG-16和VGG-19等深度卷积神经网络提取社交媒体数据的图像特征的图像多模态特征。

这里，本发明还提供了一种较优的图像多模态特征提取方案，具体为：

步骤31，将所述所述社交媒体数据的图像特征输入进训练好的VGG-19网络模型，获得所述社交媒体数据的图像特征的图像多模态特征。

为确保图像特征向量(即图像多模态特征)具有与文本特征向量(即文本多模态特征)相同的维度，本实施例在VGG-19模型的最后一层之上添加了一个全连接层。令

为图像特征向量，d为特征的维度。图像特征提取器中最后一层全连接层可以定义为：

F_V＝σ(W_V·F_VGG)

其中σ表示Relu激活函数，W_V表示全连接层的权重矩阵，F_VGG表示预训练VGG-19模型的输出。

文本多模态特征提取层用于提取社交媒体数据的文本特征的文本多模态特征。

这里，本发明还给出一种较优的利用BERT(Bidirectional EncoderRepresentations from Transformers)模型进行文本多模态特征提取的方案，具体为：

步骤41，将所述社交媒体数据的文本特征转化为输入文本。所述输入文本包括字符向量，分段向量和位置向量。

具体的，T＝{t₁,t₂,…,t_j,…,t_N}表示输入文本，输入的表示是字符向量，分段向量和位置向量的级联。字符向量将每个字符转换为向量表示形式，分段向量用来区分不同的语句，位置向量用来编码词语的位置信息。

步骤42，对所述输入文本中的字符向量，分段向量和位置向量按位求和，获得BERT模型的编码层输入量。

具体的，将三种向量表示按位求和可得E＝{e₁,e₂,…,e_j,…,e_N}，并将其作为BERT编码层的输入。

步骤43，利用多头注意力和自注意力机制将所述BERT模型的编码层输入量转化为所述输入文本的隐藏状态集。

具体的，自注意力机制将每个字符转换成查询(Query)、键(Key)和值(Value)。查询、键和值被表示为矩阵Q、K和V，并通过以下公式计算矩阵的输出。

多头注意力在文本中学习不同的连接以增加多样性，并通过以下公式连接并决定最终隐藏状态：

MultiHead(Q,K,V)＝Concat(head₁,head₂,...,head_h)W^O

head_i＝Attention(QW_i ^Q,KW_i ^K,VW_i ^V)

其中Concat表示连接操作，

表示参数矩阵。本发明将h设置为12，d_k＝d_v＝d_model/h＝64。[CLS]作为第一个字符被添加到字符序列，其隐藏状态h_c被用作BERT模型的输出。

根据隐藏状态h_c，获得了输入文本的隐藏状态集H＝{h₁,h₂,...,h_j,…,h_N}。

步骤44，根据所述输入文本的隐藏状态集，获取所述社交媒体数据的文本特征的文本多模态特征。

具体的，BERT模型的最后一层是全连接层，可以表示为：

F_T＝σ(W_T·h_c)

其中，

代表文本特征向量，W_T表示参数矩阵。

多模态特征连接层用于将图像多模态特征和文本多模态特征连接为社交媒体数据的多模态特征。

具体的，通过将图像特征向量F_V和文本特征向量F_T连接起来可得到多模态特征向量

F_M＝concat(F_V,F_T)

F_M是多模态特征提取单元的输出，该单元可以表示为f_F(X；θ_F)。X表示输入的社交媒体多模态数据，θ_F表示该单元的参数集。

2、信息识别单元

信息识别单元还包括两个全连接层和一个Softmax层；Softmax层用于根据社交媒体数据的多模态特征，生成社交媒体数据与任何灾害事件无关的概率。该概率能够用来识别社交媒体信息是否与灾害事件相关，从而形成信息识别单元的识别结果。由于信息识别单元基于多模态特征提取单元，因此多模式特征向量F_M是信息识别单元的输入。信息识别单元可以表示为f_D(F_M；θ_D)，其中θ_D表示信息识别单元的参数集。假设x_j为第j条社交媒体多模态数据，对于x_j，信息识别单元的输出是该条数据与任何灾害事件无关的概率：

p(x_j)＝f_D(f_F(x_j；θ_F)；θ_D)。

Softmax层还用于根据第一损失函数，更新多模态特征提取单元和信息识别单元的参数集；第一损失函数根据社交媒体数据与任何灾害事件无关的概率构建。

具体的，所述根据第一损失函数，更新所述多模态特征提取单元和所述信息识别单元的参数集，包括：

步骤51，计算所述多模态特征提取单元的最优参数集

和所述信息识别单元的最优参数集

具体的计算公式为：

其中，

为所述第一损失函数，

为期望函数，Y_d为表示社交媒体数据x是否与灾害事件有关的标签，p(x)为社交媒体数据x与任何灾害事件无关的概率，θ_F为所述多模态特征提取单元的参数集，θ_D为所述信息识别单元的参数集。y为社交媒体数据x对应的标签，X为包含有社交媒体数据x的社交媒体数据集。

步骤52，将所述多模态特征提取单元的最优参数集

更新为所述多模态特征提取单元的参数集。

步骤53，将所述信息识别单元的最优参数集

更新为所述信息识别单元的参数集。

3、对抗训练单元

与灾害事件相关的社交媒体数据检测的主要挑战来自训练语料库未涵盖的灾害事件。为了识别与新出现的突发灾害事件相关的社交媒体数据，需要模型捕获的特征具有事件无关和可迁移性。最小化损失函数

仅有助于识别与训练语料中已存在的灾害事件相关的社交媒体数据。由于此过程学习的是特定于灾害事件的特征、模式或知识(例如，事件的名称)，模型泛化性较差。因此，本发明需要抽取可以泛化的特征表示，并且这些特征蕴含不同灾害事件之间的公共信息。为了实现这一目标，学习得到的特征表示必须是事件无关的，并且包含尽可能少的特定于事件的信息。具体来说，本发明引入对抗训练以消除灾害事件特征的独特性。

对抗训练单元包括对抗训练层；对抗训练层用于根据第二损失函数，更新对抗训练单元的参数集；第二损失函数根据多模态特征提取单元的输出值和信息识别单元的识别结果构建。

具体的，所述根据第二损失函数，更新所述对抗训练单元的参数集，包括：

步骤61，计算所述对抗训练单元的最优参数集

具体的计算公式为：

其中，

为所述第二损失函数，Y_m为表示灾害事件的标签，f_F为所述多模态特征提取单元的输出值，f_M为所述信息识别单元的识别结果，θ_M为所述对抗训练单元的参数集。y为社交媒体数据x对应的标签，X为包含有社交媒体数据x的社交媒体数据集。

步骤62，将所述对抗训练单元的最优参数集

更新为所述对抗训练单元的参数集。

本发明提出的多模态对抗模型利用对抗训练单元来增强不同事件之间特征表示的相似度，从而学习到事件无关特征。该单元同样由两个全连接层组成，其目的是基于多模态特征将社交媒体数据归类为某一类灾害事件。该单元可以表示为f_M(F_M；θ_M)，其中θ_M为该单元的参数集。

用于衡量不同事件的相似性，损失函数越大，不同事件的特征表示越相似，并且特征的分布消除了每种灾害事件的独特性。因此，为了学习得到事件无关可迁移的特征，模型通过最优化参数

来最大化损失函数

这里，综合说明下第一损失函数和第二损失函数是如何训练本发明提出的多模态对抗模型的。

在多模态对抗神经网络模型MANN中，对抗训练是指特征提取单元和对抗训练单元之间的极大极小博弈。一方面，多模态特征提取单元f_F(·；θ_F)与信息识别单元f_D(·；θ_D)共同作用最小化损失函数

以提高灾害事件相关信息检测性能。另一方面，多模态特征提取单元f_F(·；θ_F)试图愚弄对抗训练单元以最大化损失函数

以学习到事件无关特征表示。此外，对抗训练单元还通过使损失函数

最小化来基于多模式特征检测社交媒体数据是否归属于某种灾害事件。三个单元的最终对抗损失函数可以定义为：

对于极大极小博弈，模型的最佳参数

可以通过以下公式进行计算：

上述训练过程中，当相邻两次训练过程中获得的第一损失函数最小值之间的差值和/或第二损失函数最小值之间的差值，在设定阈值以内，即说明训练完成。

本发明经上述训练获得的模型经实际数据测试，能够达到非常好的检测效果。

本发明所提出的方法MANN和基准模型通过实验比较可以验证本发明方法的先进性。基准模型包括仅使用BERT和全连接层的Text-only、仅使用VGG-19和全连接层的Image-only、DMN、att-RNN和仅包括特征提取模块和信息识别模块的MANN-。本发明使用社交媒体灾难事件检测常用的评价指标包括准确率、召回率和F1值对实验结果进行分析。本发明使用从推特平台爬取的开源多模态数据集CrisisMMD中的斯里兰卡洪水事件、加利福尼亚火灾事件、墨西哥地震事件和厄玛飓风事件作为正例数据。对于负例数据，本发明从推特平台收集了8415条包含图片的推文，这些推文被人类标注者识别为与灾难事件无关。本发明随机选择20％条数据作为测试数据集，剩余的数据作为训练数据集。

MANN的多模态特征提取单元使用BERT模型，使用Gelu作为激活函数，h_c的维数为768。在文本和图像特征提取器中，全连接层神经元的个数设置为32(d＝32)。对于信息识别单元和对抗训练单元，本发明将第一层全连接层神经元的个数设置为64，第二层全连接层神经元的个数设置为32。对于Text-only和Image-only，全连接层神经元的个数设置为32。Dropout概率设置为0.5。检测结果对比如附图3所示，本发明所提出的方法在3个评价指标上均要优于5种基准模型。从而验证了本发明的先进性。

基于与方法同样的发明构思，本发明实施例还提供了一种用于灾害事件检测的多模态对抗模型的训练装置，如图4所示为该装置实施例的结构示意图，所述装置包括：

社交媒体数据获取模块71，用于获取社交媒体数据；

特征抽取模块72，用于抽取所述社交媒体数据的图像特征和文本特征；

预处理模块73，用于对所述社交媒体数据的图像特征和文本特征进行预处理；

第一更新模块74，用于将预处理后的所述社交媒体数据的图像特征和文本特征，输入进多模态对抗模型，以更新所述多模态对抗模型中的多模态特征提取单元、信息识别单元和对抗训练单元的参数集；

在一种可能的实施例中，所述第一更新模块74，包括：

在一种可能的实施例中，所述第一更新模块，还包括：

在一种可能的实施例中，所述第一更新模块74，还包括：

和所述信息识别单元的最优参数集

具体的计算公式为：

其中，

为所述第一损失函数，

更新为所述多模态特征提取单元的参数集；

第三更新模块，用于将所述信息识别单元的最优参数集

更新为所述信息识别单元的参数集。

在一种可能的实施例中，所述第一更新模块74，还包括：

第二计算模块，用于计算所述对抗训练单元的最优参数集

具体的计算公式为：

其中，

第四更新模块，用于将所述对抗训练单元的最优参数集

更新为所述对抗训练单元的参数集。

在一种可能的实施例中，所述预处理模块73，包括：

基于与前述实施例中同样的发明构思，本发明实施例还提供一种用于灾害事件检测的多模态对抗模型的训练设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现前文任一所述方法的步骤。

基于与前述实施例中同样的发明构思，本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前文任一所述方法的步骤。

本发明实施例中提供的技术方案，至少具有如下技术效果或优点：

本发明实施例中多模态对抗模型包括多模态特征提取单元、信息识别单元和对抗训练单元，信息识别单元能够根据第一损失函数更新多模态特征提取单元和信息识别单元的参数集，对抗训练单元能够根据第二损失函数更新对抗训练单元的参数集。一方面，多模态特征提取单元与信息识别单元共同作用最小化损失函数，以提高灾害事件相关信息检测性能。另一方面，多模态特征提取单元试图愚弄对抗训练单元以最大化损失函数，以学习到事件无关特征表示。本发明实施例利用多模态特征提取单元和对抗训练单元之间的极大极小博弈，提高了卷积神经网络模型在利用社交媒体数据来检测出灾害事件时的效率和准确度。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、装置(模块、系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包括这些改动和变型在内。