CN111598710B

CN111598710B - 社交网络事件的检测方法和装置

Info

Publication number: CN111598710B
Application number: CN202010392714.7A
Authority: CN
Inventors: 杜军平; 崔婉秋; 寇菲菲; 周南
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2020-05-11
Filing date: 2020-05-11
Publication date: 2023-04-18
Anticipated expiration: 2040-05-11
Also published as: CN111598710A

Abstract

本发明提供一种社交网络事件的检测方法和装置，所述方法包括：将数据集中提取的推文和标签作为节点，构建社交网络事件异构图；基于异构图中推文和标签的文本内容构建语义视图，获得其特征矩阵和加权邻接矩阵；基于异构图中推文及推文的时间构建时间分布视图，获得其特征矩阵和加权邻接矩阵；将语义视图的特征矩阵和加权邻接矩阵，时间分布视图的特征矩阵和加权邻接矩阵输入至GCN中，结合注意力机制采用标签引导语义视图和时间分布视图的特征融合，生成给定标签下推文语义视图和时间分布视图的注意力分布概率，得到异构图中每个节点属于数据集中事件的概率，实现对节点的预测。本发明实施例的社交网络事件的检测方法，提高了社交事件的检测效果。

Description

社交网络事件的检测方法和装置

技术领域

本发明涉及社交网络事件检测领域，更具体而言，本发明涉及一种基于语义和标签进行社交网络事件的检测方法和装置。

背景技术

社交网络事件检测是目前研究的热点问题。大多数传统的事件检测方法都是基于消息内容的语义分析方法，它们通常取决于文本表示技术，例如传统的主题模型和基于句子的深度神经网络的序列表示等。主题模型方法构建图模型挖掘文本词与主题之间的分布关系，实现文本的相似性比较。TwitterLDA是第一个为推文(Tweet)数据提出的用于短文本语义分析的主题模型。近年来，随着深度学习的兴起，循环神经网络(RNN)、卷积神经网络(CNN)和图卷积神经网络(GCN)技术在事件检测中也取得了令人瞩目的成就。例如JEDS通过设计深度神经模型进行短文本表示，联合实现事件检测和摘要。PTE在深度神经网络中学习并聚合文本的多个位置表示以实现文本的语义匹配。Text GCN构造一个包含文档和单词的异构图，以实现基于GCN的文本表示与精准分类。尽管基于文本内容的语义分析方法可以充分考虑文本的局部和全局的语义，但是面对稀疏和非正式的文本数据，仅分析现有文本的主题模型和深度学习方法将会受到极大的阻碍，导致事件检测中的效果并不理想。

目前另一项研究重点采用社交网络属性特征来避免短文本的缺陷，来改进事件检测的性能和效果。此项研究通过使用引入的外部因素来辅助事件检测，这些外部因素主要包括主题标签、时间信息和空间信息。采用这些外部因素是因为主题标签是简洁的摘要，并随事件而散布，而时间和空间则反映了事件传播的轨迹。其他研究还尝试利用不同的社交属性，例如提及、转发、评论等来辅助事件检测。此外，为了更充分地利用事件的特征，在主题模型中集成了社交网络的内容和属性以相互制约和互补，例如融合文本、图像、时间、空间和社交特征标签。大量研究倾向于通过不同的社交关系或特征来构建图模型，以融合更多属性。尽管这种方法可以融合多种特征，能够实现对文本内容的扩展，但是所有这些方法都可能引入干扰事件检测的无关信息，如在时间分布或空间邻近度方面考虑突发特征频率的方法，它们主要依赖于检测特定特征在一段时间或区域内的频率增加，仅能够挖掘具有高突发性的部分事件。并且，这些方法融合了事件的更多特征，但是这些属性通常是对内容的补充，它们只是对事件的一个视角下的补充和融合，而没有充分发挥每个关键特征的独立性和优势。

目前，还存在基于多视图和社交网络图的事件检测的尝试，但基于多视图和社交网络图的事件检测尚存在若干挑战。大多数现有的社交网络图模型都建立在标签节点上，但标签节点无法挖掘短文本之间的关联。而社交网络异构图是由多种类型的节点构建的，可通过社交关系对短文本进行建模，但是，由于社交网络异构图中存在不同的元素，文本节点的关系松散，语义相关性无法得到充分挖掘。而且，多种视角之间需要满足独立性和互补性。所以，有大量的方法结合多视图数据进行特征表示，但其并没有通过共识信息充分探索不同视角之间的潜在语义相关性。因此，如何充分挖掘社交网络的多属性信息，利用多视角进行充分的语义融合和特征表示不仅是面向社交网络事件检测的发展趋势，也是一个巨大的挑战。

如何提高社交网络事件的检测效果，是一个亟待解决的问题。

发明内容

鉴于此，本发明提出了一种社交网络事件的检测方法和装置，以消除或改善现有技术中存在的一个或更多个缺陷。

本发明的技术方案如下：

根据本发明的一方面，提出了一种社交网络事件的检测方法，该方法包括以下步骤：

从预先采集的数据集中提取推文和标签文本信息作为节点，基于提取的推文和标签之间的共现关系来构建社交网络事件异构图；

基于所述社交网络事件异构图得到包含推文节点和标签节点的语义视图，并基于语义视图中推文节点和标签节点文本内容特征空间，进行一致性特征空间的映射，获得语义视图的语义特征矩阵和对应的加权邻接矩阵；

基于所述社交网络事件异构图中的推文节点，得到包含推文节点的时间分布视图，并基于所述时间分布视图获得时间分布特征矩阵和对应的加权邻接矩阵，所述时间分布特征矩阵包括各推文节点的时间信息及与各推文节点相关的标签节点的时间信息的表示；

将所述语义特征矩阵和对应的加权邻接矩阵，以及时间分布特征矩阵和对应的加权邻接矩阵分别输入至图卷积神经网络GCN中进行特征学习，将学习到的特征通过标签注意引导和融合，实现对节点的事件分类，以基于节点事件分类结果进行社交网络事件的检测。

可选地，所述基于提取的推文和标签之间的共现关系来构建社交网络事件异构图，包括：在标签是推文的一部分或推文与标签所在的消息有相同的URL的情况下，在推文与标签之间建立连接边；在两个标签出现在同一条推文中或两个标签所在的消息有相同的URL的情况下，在所述两个标签的节点之间建立连接边；在两个推文中包含相同的标签或两个推文有相同的URL的情况下，在所述两个推文的节点之间建立连接边。

可选地，所述基于语义视图中推文节点和标签节点文本内容特征空间，进行一致性特征空间的映射，获得语义视图的语义特征矩阵和对应的加权邻接矩阵，包括：

基于从数据集中提取的所有标签和从语料库中选择的频率最高的第一数量的单词生成特征词典，作为一致性特征空间；

对每个节点进行一致性特征空间的映射，基于如下公式获得每个节点的语义特征的特征向量：

基于获得的特征向量得到N个节点的语义特征矩阵Xs∈R^N*ds；

利用节点之间不同节点对的语义关联度生成语义特征矩阵对应的加权邻接矩阵；

其中，

为语义视图中节点v_i的语义特征的第j维向量，f_s为映射函数，ds为特征向量的维数，ds＝2000+(N-n)，N为节点数，n为推文数，N-n为标签数，R^N*ds表示语义特征矩阵的N*ds个元素。

可选地，所述节点之间不同节点对的语义关联度用所述社交网络事件异构图中不同节点对间的连接边的条数表示，不同节点对间的语义关联度与不同节点对间的连接边的条数成正比。

可选地，所述基于所述社交网络事件异构图中的推文节点，得到包含推文节点的时间分布视图，并基于所述时间分布视图获得时间分布特征矩阵和对应的加权邻接矩阵，包括：通过在所述社交网络事件异构图中保留推文节点并删除标签节点而得到包含推文节点的时间分布视图；基于数据集中标签节点的发布时间来构建时间字典；基于时间字典将标签节点的时间特征表示为向量，将所述社交网络事件异构图中直接连接到推文节点的所有标签节点对应的时间特征进行组合，作为推文节点的扩展时间特征；利用推文节点自身的时间特征和扩展时间特征获得推文节点的时间分布特征矩阵；基于时间分布视图中两个相邻推文节点之间的时间相似性生成时间分布特征矩阵对应的加权邻接矩阵。

可选地，所述将所述语义特征矩阵和对应的加权邻接矩阵，以及时间分布特征矩阵和对应的加权邻接矩阵分别输入至图卷积神经网络GCN中进行特征学习，将学习到的特征通过标签注意引导和融合，实现对节点的事件分类，以基于节点事件分类结果进行社交网络事件的检测，包括：

将所述语义特征矩阵和对应的加权邻接矩阵，以及时间分布特征矩阵和对应的加权邻接矩阵分别输入至多层图卷积神经网络GCN，得到新的语义特征矩阵和新的时间分布特征矩阵，将所述新的语义特征矩阵分割成文本语义特征矩阵和标签特征矩阵；

采用标签引导文本语义特征和时间分布特征，利用第一softmax函数生成各个标签对应的文本语义注意力分布和时间注意力分布；

在同一标签下进行文本语义特征和时间特征融合，以生成统一矩阵，将所述统一矩阵输入至全连接层，通过第二softmax函数输出得到所述社交网络事件异构图中的各节点的事件分类预测，以基于节点事件分类结果进行社交网络事件的检测。

可选地，利用推文节点自身的时间特征和扩展时间特征获得推文节点的时间分布特征矩阵包括：基于如下公式获得各推文节点的时间分布特征，并由此获得所有推文节点的时间分布特征矩阵：

基于如下公式计算时间分布视图中两个相邻推文节点之间的时间相似性：

其中，[；]表示两个向量的级联；

表示标签节点的时间特征的按位组合；

为推文节点i的时间分布特征；所有推文节点的时间分布特征矩阵表示为

d_t＝1+T，T为时间词典的大小；

为时间分布视图中两个相邻推文节点i和j的时间相似性，

表示两个相邻推文节点之间的发布时间的差值，λ为每单位时间内事件发生的次数。

可选地，所述方法还包括：利用损失函数来计算第二softmax函数的输出的交叉熵误差值，并用所述交叉熵误差值来更新图卷积神经网络参数，所述损失函数的公式表示为：

其中，L为交叉熵误差值，C是数据集中包含的事件类别数，l_i为节点的真正标签，S_j是第二softmax函数输出的第j维向量。

根据本发明的另一方面，还提供了一种社交网络事件的检测装置，该装置包括处理器和存储器，所述存储器中存储有计算机指令，所述处理器用于执行所述存储器中存储的计算机指令，当所述计算机指令被处理器执行时该装置实现如前所述方法的步骤。

本发明的又一方面，还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如前所述方法的步骤。

本发明实施例的社交网络事件的检测方法和装置，通过建立社交网络事件异构图，分析社交网络短文本的语义和时间分布特征，对多视角下的事件表示进行融合和学习，从而实现了准确的事件检测。

本领域技术人员将会理解的是，能够用本发明实现的目的和优点不限于以上具体所述，并且根据以下详细说明将更清楚地理解本发明能够实现的上述和其他目的。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。在附图中：

图1为本发明实施例中社交网络事件检测方法的概括示意图。

图2为本发明一实施例中社交网络事件检测方法的流程示意图。

图3为本发明一实施例中社交网络事件异构图构建过程的示意图。

图4为本发明一实施例中社交网络事件多视图表示示意图。

图5为本发明一实施例中基于GCN的标签注意力引导多视图融合模型示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施方式和附图，对本发明做进一步详细说明。在此，本发明的示意性实施方式及其说明用于解释本发明，但并不作为对本发明的限定。

在此，还需要说明的是，为了避免因不必要的细节而模糊了本发明，在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤，而省略了与本发明关系不大的其他细节。

应该强调，术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在，但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。

在此，还需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互结合。

本发明针对已有事件检测方法不能有效地挖掘多视角下的语义信息，导致网络短文本中事件检测效果不佳的问题，提出了一种针对异构社交网络图的标签注意力引导的多视图融合方法，通过语义视图和时间分布视图的融合与补充，充分表示文本特征，进而实现准确的社交网络事件检测结果。

如图2所述，本发明实施例的技术方案主要划分为三个部分，分别为：S110，社交网络事件异构图构建；S120，社交网络事件多视图表示；以及S130，基于GCN的标签注意力引导多视图融合。也即，首先，通过推文和标签之间的关联来构建社交网络事件异构图，使离散短文本之间形成语义关联。其次，从不同的视角，即短文本的语义视角和时间分布视角，学习社交网络事件的多视角特征表示。最后，设计了基于GCN的标签注意力引导多视图的融合模型，通过标签连接不同视图的相关域。该模型经过联合训练，融合多视角特征作为最终微博文本的表示，实现事件检测。本发明通过分析社交网络短文本的语义特征和时间分布特征，从语义视角和时间分布视角对事件表示进行融合和学习，充分表示文本特征，从而实现准确的社交网络事件检测结果。本发明的这3个部分有以下特点：

(1)在社交网络事件异构图的构建中，为了挖掘短文本之间的语义关联，提出了一种新的社交事件异构图构建规则。它通过引入标签节点，将标签(如主题标签)视为一类节点类型，在短文本推文之间构建上下文语义关系，从而扩展了短文本的语义信息，建模了上下文关联。

具体地，在推文的数据集中抽取标签(hashtag)和推文(tweet)的文本信息，分别作为图结构的两类节点，通过挖掘节点之间的显式和隐式关系，连接推文节点和标签节点，来构建紧凑、复杂的社交网络事件异构图。

(2)在实现社交网络事件的多视图表示的过程中，引入时间特征作为推文语义特征之外的另一个视角信息，以此充分挖掘短文本的时间分布特征，并将更多事件相关的信息进行表示和融合。

更具体地，对社交网络事件异构图进行多视角表示时，将语义特征和时间特征分别作为社交网络时间的不同视角，来分别生成语义视图表示和时间分布视图表示。在语义视图表示中，可基于推文节点和标签节点的文本内容特征空间，进行一致性特征空间的映射，从而实现语义视图的特征矩阵与邻接矩阵表示。在时间分布视图表示中，将社交网络事件异构图进行结构转换，通过删除标签节点生成同构图模型，进而对仅包含推文节点的图数据进行节点时间信息的表示，实现时间分布视图的特征矩阵与邻接矩阵的表示。

(3)设计了基于GCN的标签注意力引导多视图融合模型，通过采用GCN将语义和时间特征进行学习，形成不同视角下的充分表示。通过特定的卷积操作，将相连节点之间的信息进行聚合，由此缓解短文本稀疏的问题。

(4)通过基于GCN的标签注意力引导多视图融合模型，利用标签将语义视角和时间分布视角下的特征进行融合。采用标签注意力机制进行指导性学习。在此注意力模型的基础上，深入挖掘相关视角的特征表示，并实现准确的节点分类作为事件检测的结果。

本发明实施例设计的基于GCN的标签注意力引导多视图融合模型，集成来自文本语义视图和时间分布视图的属性特征。其输入语义视图与时间分布视图的特征表示，通过GCN学习，将语义视图下生成的特征矩阵分割出标签特征。进而使用同一标签关注并指导推文语义视图与时间分布视图的特征融合，挖掘不同视图的相关性，实现社交网络事件多视角特征的有效链接和融合。该模型经过GCN与注意力机制联合训练，融合多视角特征作为最终微博文本的表示，实现事件检测。

下面将基于如上表述的3个部分，更详细地描述本发明实施例的社交网络事件检测方法。

图2为本发明一实施例中社交网络事件检测方法的流程示意图。如图2所示，该方法包括以下步骤：

步骤S210，从预先采集的数据集中提取推文和标签文本信息作为节点，基于提取的推文和标签之间的共现关系来构建社交网络事件异构图。

推文例如可以是微博推文、推特、脸书(facebook)等社交网络上的短文本，推文可事先被采集到相应的数据集中。

本发明实施例中，除了推文节点类型，还引入标签作为一节点类型，通过挖掘各节点之间的显式和隐式关系，连接推诿节点和标签节点，由此来构建复杂、紧凑的社交网络异构图，并以此来挖掘短文本之间的语义一致性。

图3为本发明一实施例中社交网络事件异构图构建过程的示意图，如图3所示，在微博数据集中提取标签与文本，并将其作为节点，进一步通过挖掘节点之间的关系(包括显式和隐式关系)，来生成社交网络事件异构图。在生成的社交网络事件异构图内，节点包含内容信息和时间信息，如标签节点内容为“#PrayForBorston”，其时间信息包含{2013-04-25 22:20:04,2013-04-27 14:17:52…}，推文节点内容属性为“#PrayForBoston#BostonFeeling so blessed to be safe and healthy tonight.”，时间信息为“2013-04-25 13:07:57”。

作为示例，挖掘节点之间的关系可包括挖掘节点之间的mid共现co-mid、标签共现co-h和超链接共现co-url三类关系(见下述连接规则中的说明)，用于构建节点之间不同的关联关系，以构建社交网络事件异构图。

具体来说，引入提取的标签，并将具有代表性、摘要性和可扩展性的信息URL链接引入异构图的构建中，通过这些社交特征之间的共现关系，将标签节点和推文节点进行结构信息和语义相关性的建模。作为示例，基于以下的连接规则在节点之间建立连接边：

推文-标签关系：如果标签是推文的一部分(即co-mid关系)或推文与标签所在推文有相同的URL链接(即满足co-url关系)，则在推文与标签之间建立连接边；

标签-标签关系：如果两个标签出现在同一条推文中(满足co-mid关系)或两个标签所在的推文有相同的URL链接(即为co-url关系)，则在两个标签节点之间建立连接边；

推文-推文关系：如果两个推文包含相同的标签(属于co-h关系)或两个推文有相同的URL链接(即co-url)，则在两个推文节点之间建立连接边。

如图3所示，构建出的社交网络异构图是一种无向、加权图，可表示为G＝(V，E，f)，其中V＝V_t∪V_h表示节点集，V_t和V_h分别表示推文和标签的实体集。总节点数为|V|＝|V_t|+|V_h|＝N,其中推文节点数|V_t|＝n,边

表示三类边的集合。f:V→R^d表示每个节点的d维特征向量。异构性是异构图的一个内在属性，即各种类型的节点和边，不同类型的节点具有不同的特征。将标签看作是一类节点类型，基于对节点之间的显式和隐式关系的挖掘来连接节点建立连接边，形成紧凑的社交网络事件异构图。首先，从微博中提取推文和标签，以此来构成微博数据集，并在微博数据集中提取标签和推文的文本信息，将推文和标签分别作为社交网络事件异构图的两类节点，通过挖掘节点之间的显式和隐式关系，来连接推文节点和标签节点，利用这些节点为社交网络构建一个复杂、紧凑的异构图。

本步骤中，通过将推文和标签作为两类节点，并基于节点之间的共现关系，构建了社交网络事件异构图，使离散短文本之间形成了语义关联。

步骤S220，基于社交网络事件异构图得到包含推文节点和标签节点的语义视图，并基于语义视图中推文节点和标签节点文本内容特征空间，进行一致性特征空间的映射，获得语义视图的语义特征矩阵和对应的加权邻接矩阵。

步骤S230，基于社交网络事件异构图中的推文节点，得到包含推文节点的时间分布视图，并基于时间分布视图获得时间分布特征矩阵和对应的加权邻接矩阵。其中，时间分布特征矩阵包括各推文节点的时间信息及与各推文节点相关的标签节点的时间信息的表示。

在社交网络事件异构图中，节点包含不同的类型并具有不同的属性，为了挖掘节点的多属性，并从不同的特征空间中学习以确保短文本特征的互补性，本发明实施例设计了一种多视图社交事件结构，以从语义的视角和时间分布视角对社交网络事件进行表示，因为社交网络事件除了需对其基于文本语义的检测之外，其在发生时间的分布上也具有明显的特征。多视角社交事件图包含多个视图下的N个节点，表示为G_V＝(Gs，Gt)，其中每个视图都属于社交网络异构图。对于同一个社交网络，G_s＝(V,E,f_s)表示语义视图，G_t＝(V,E,f_t)为时间视图，在节点上具有不同的映射关系。对于每个节点，f_s将其映射到语义特征，f_t将其投影到时间特征。

图4为本发明一实施例中社交网络事件多视图表示示意图，如图4所示，基于语义视角和时间分布视角对步骤S210中构建的社交网络事件异构图进行表示，在语义视图内基于推文节点和标签节点的文本内容特征空间，进行一致性特征空间的映射，从而实现语义视图的特征矩阵与语义视图的加权邻接矩阵表示。在时间分布视图中，将社交网络事件异构图进行结构转换，通过删除标签节点生成同构图模型，进而对仅包含推文节点的图数据进行节点时间信息的表示，实现时间分布视图的特征矩阵与时间分布视图的加权邻接矩阵的表示。下面将对语义视图和时间分布视图做详细说明。

(1)语义视图Gs

尽管构建的社交网络事件异构图中的节点是由两种类型的实体组成的，但这两种类型的实体：推文和标签都是描述推文含义的文本信息，因此，社交网络事件异构图中的所有节点具有相同的特征空间，这避免了引入异构特征的复杂性。本发明实施例中设置一致性语义特征矩阵Xs来表示社交网络事件异构图中所有节点的语义特征。作为示例，可以选择微博语料库中频率最高的前2000个单词，然后添加从微博数据集中提取的所有标签，构成特征词典。在此，2000个单词仅为举例，本发明并不限于此，可根据情况来构建更大或更小的特征词典。基于特征词典将每个节点的特征转换为ds维向量，并且ds维向量的每一维的对应元素是在短文本中出现的该特征的个数，该特征基于以下公式进行归一化处理：

其中，

为语义视图中节点vi语义特征的第j维向量，f_s为映射函数，用于生成ds＝2000+(N-n)维的特征向量，ds为特征向量的维数，N为节点数，n为推文数，N-n为标签数；基于获得的特征向量可得到N个节点的特征矩阵Xs∈R^N*ds，R^N*ds表示语义特征矩阵的N*ds个元素。

此外，由于社交网络事件异构图中相连接的节点之间存在不同程度的语义相似度，为了避免由于文本稀疏性在短文本之间相似度计算中造成的缺陷，所以本发明实施例中使用满足社交网络事件异构图中节点之间不同连接规则的条件来表示不同节点对的关联度，并将其设置为边的权重。因为相同的标签或相同的URL链接信息可能包含在多个推文中，所以社交网络事件异构图中的两个节点可能会多次满足连接条件，而且两个节点之间满足的条件越多，两个节点之间的连接边的条数就越多，两个节点之间的语义关联就越强，所以节点之间的语义关联度是与节点之间满足的条件也是节点之间的连接边的条数成正比的。基于社交网络事件异构图中不同节点对间的语义关联度获得语义视图的加权邻接矩阵As作为结构信息。

(2)时间分布视图Gt

由于相同的标签可能会在不同的推文中传播，这将导致标签节点具有多个时间信息。在节点的时间分布中，标签节点可能会使同一消息的发布时间重复出现在异构图中，从而干扰事件中消息时间分布的发掘。因此，在时间分布视图中，删除标签节点，仅考虑推文节点之间的关系，基于时间分布特征学习节点的表示。

在本发明实施例中，基于社交网络事件异构图中的推文节点，得到包含推文节点的时间分布视图，并基于时间分布视图获得时间分布特征矩阵和对应的加权邻接矩阵的步骤可包括：

(1)通过在社交网络事件异构图中保留推文节点并删除标签节点而得到包含推文节点的时间分布视图；

(2)基于数据集中标签节点的发布时间来构建时间字典；

(3)基于时间字典将标签节点的时间特征表示为向量，将社交网络事件异构图中直接连接到推文节点的所有标签节点对应的时间特征进行组合，作为推文节点的扩展时间特征；

(4)利用推文节点自身的时间特征和扩展时间特征获得推文节点的时间分布特征矩阵；

(5)基于时间分布视图中两个相邻推文节点之间的时间相似性生成时间分布特征矩阵对应的加权邻接矩阵。

描述同一事件的推文在多个时间点传播，这些时间信息可以用作事件的时间分布特征。此外，通过标签在网络中的传播也可展示一条推文的相关时间。因此可将标签的发布时间转换为时间戳，并通过添加标签节点出现在数据集中的所有时间来构建时间字典，T是时间字典的大小。标签节点的时间特征可基于时间词典表示为向量，每个元素对应一个时间点。如果标签在该时间点出现，则将其设置为时间戳，否则为0。将社交网络事件异构图中直接连接到推文的所有标签的时间特征组合起来，以表示推文节点的扩展时间特征。利用推文节点自身的时间特征和扩展时间特征获得推文节点的时间分布特征矩阵。因此，推文节点的时间分布特征可以表示为：

其中，[；]是两个向量的级联，

表示主题标签节点的时间特征按位组合。如果所有向量的第j位为0，则

否则

为推文节点i的、经节点特征映射函数ft归一化的时间分布特征，映射函数ft的形式可如前面公式(1)所示。由此，时间分布特征矩阵表示为

d_t＝1+T。

通常情况下，与事件相关的推文数量会在事件到达时随时间呈现泊松分布，因此，任意两个推文节点的发布时间的相似度会随时间发展呈现下降趋势，这表明两个连续发布的推文消息的时间间隔服从指数分布。所以，本发明实施例中基于以下公式来测量两个推文节点的时间相似性：

其中，

为同构图中两个相邻推文节点的时间相似性，

表示相邻节点之间的发布时间的差值，λ是一个速率参数，表示每单位时间内事件发生的次数。

将节点之间的时间相似度作为边的权重，并从时间分布的角度形成时间分布视图的加权邻接矩阵At。

基于社交网络事件异构图中节点的多属性特征，从语义视角和时间分布视角对所述社交网络事件进行表示。基于文本语义特征学习节点的语义表示，将社交网络事件异构图中的所有节点映射到相同的特征空间，对文本类型数据进行统一表示，获得语义特征矩阵Xs。基于时间分布特征学习节点的时间分布表示，删除标签节点，将描述同一事件的推文的时间信息作为此事件的时间分布特征，获得时间分布特征矩阵Xt。另外，为了突出节点间的相关性和交互的重要性，本发明实施例在嵌入式学习中考虑了边缘的权重，也就是说，使用加权邻接矩阵来表示文本的语义视图和时间分布视图的拓扑结构，获得文本语义视图的加权邻接矩阵As和时间分布视图的加权邻接矩阵At。

步骤S240，将语义特征矩阵和对应的加权邻接矩阵，以及时间分布特征矩阵和对应的加权邻接矩阵分别输入至图卷积神经网络GCN中进行特征学习，将学习到的特征通过标签注意引导和融合，实现对节点的事件分类，以基于节点事件分类结果进行社交网络事件的检测。

本发明实施例设计了基于GCN的标签注意力引导多视图融合模型，以集成来自文本语义视图和时间分布视图的属性特征，从语义和时间分布的角度对事件进行全面的感知。

更具体地，本步骤可包括以下步骤：

(1)将语义特征矩阵和对应的加权邻接矩阵，以及时间分布特征矩阵和对应的加权邻接矩阵分别输入至多层图卷积神经网络GCN，得到新的语义特征矩阵和新的时间分布特征矩阵，并将新的语义特征矩阵分割成文本语义特征矩阵和标签特征矩阵；

(2)采用标签引导文本语义特征和时间分布特征，利用第一softmax函数生成各个标签对应的文本语义注意力分布和时间注意力分布；

(3)在同一标签下进行文本语义特征和时间特征融合，以生成统一矩阵，将所述统一矩阵输入至全连接层，通过第二softmax函数输出得到所述社交网络事件异构图中的各节点的事件分类预测，以基于节点事件分类结果进行社交网络事件的检测。

图5为本发明一实施例中基于GCN的标签注意力引导多视图融合模型示意图，如图5所示，将语义视图与时间分布视图的特征表示输入至多层GCN(例如两层GCN)中，通过GCN学习，将语义视图下生成的特征矩阵分割出标签特征，进而使用同一标签关注并指导推文语义视图与时间分布视图的特征融合，挖掘不同视图的相关性，实现社交网络事件多视角特征的有效链接和融合。该模型经过GCN与注意力机制联合训练，融合多视角特征作为最终微博文本的表示，实现对事件的检测。

为了保证聚合过程中的感受域能够有效地实现间接连接节点的特征收敛，本发明一实施例设计了两层GCN结构，来实现多视图和节点的分类。当然，本发明不限于此，也可根据实际情况设计更多层GCN结构来实现方案效果。在GCN根据节点的邻域属性(即相邻节点的特征)生成节点嵌入向量的过程中，将语义视图的特征矩阵Xs和语义视图的加权邻接矩阵As，时间分布视图的特征矩阵Xt和时间分布视图的加权邻接矩阵At分别输入到GCN中，由GCN生成的新节点特征矩阵表示为：

其中，s表示语义视图，t表示时间分布视图，

是规范化的邻接矩阵，其中

I是单位矩阵，D是A+I的度矩阵，

为第m层的节点特征矩阵，

是第m层的权重参数矩阵。通过经验性研究，设置m＝2。根据特征计算需求，设计第一层激活函数为ReLU，并选择softmax作为第二层的非线性激活函数。两个视图中的GCN输出分别为Hs∈R^N×K和Ht∈R^n×K，K为GCN输出层的单元个数。

经过两层GCN，将语义视图的输出矩阵Hs分割为文本语义特征矩阵Ts＝{s_i|s_i∈R^K,i＝1,2,…,n}和标签特征矩阵h_s＝{h_i|h_i∈R^K,i＝1,2,…,N-n}。由于一个标签描述一个事件，标签与T_s和H_t＝{t_i|t_i∈R^K,i＝1,2,…,n}中的部分推文和时间信息相关联。因此，标签特性被用作连接两个视图中相关内容的桥梁。因此，采用标签来引导文本的语义特征和时间分布特征，并确定哪些部分的信息被关注。通过逐步过滤，最终指向语义特征和时间分布特征中与标签高度相关的特征区域。将Ts和Ht分别输入标签注意力引导的多视角融合层，使用softmax生成n个文本语义或时间分布上的注意力分布，分别如式(6)和式(7)所示：

其中，(.)^T表示矩阵转置操作，||是矩阵和向量之间的级联操作，向量将矩阵的每一列连接起来。由于T_s∈R^n*K、H_t∈R^n*K，T_s ^T和H_t ^T均为R^K*n，且已知h_i∈R^1*K，设置参数W_Y和W_hi∈R^l*K，W_p∈R^1*2l，其中l为中间层的降维参数。因此，

和

分别为给定标签h_i下每个短文本的文本语义特征或时间分布特征的注意力分布概率。

基于注意力分布的标签h_i引导，可以获得新的特征表示：

其中，i∈[1，n]，s_i∈T_s，t_i∈H_t。在同一标签的关注下，分别生成n个

和

组成新的特征矩阵Ts`和Ht`∈R^K*n。

将组成的新的特征矩阵Ts`和Ht`进行合并，并规范化为如下形式：

其中T’_s||H’_t∈R^2K*n，融合参数W_fu∈R^1*2K，

对h_s矩阵中的标签进行多特征矩阵融合后，生成统一矩阵TH∈R^(N-n)*n。

最后，将统一矩阵输入到一个全连接层中，用softmax基于如下公式进行逐行(每个节点)分类预测，得到社交网络事件异构图中的每个节点属于预先采集的数据集中的事件的概率，从而实现对每个节点的预测，公式表示为：

P＝softmax(TH^TW_fc) (11)

其中，TH^T∈R^n*(N-n)，W_fc∈R^(N-n)*C是可训练的参数矩阵，C是数据集中包含的事件类别数。

可选地，可进一步计算交叉熵误差，采用图像描述生成任务常用的交叉熵作为损失函数进行模型训练，并用其更新整个网络中的所有参数，损失函数形式如下所示：

其中，Sj是softmax函数输出向量的第j维，它是节点属于第j类的概率，li是节点的真实类标。

如上步骤可以看出，本发明实施例设计了一个多视角的社交事件结构，从语义的角度和时间分布的角度对事件进行全面的感知。将GCN和注意力机制相结合，将一个多视角的社交事件投影到一个联合特征空间中，实现事件检测。每个视图都被输入到GCN中，以对短文本的不同属性执行特征学习。学习到的多视图特征通过标签注意引导和融合，实现对节点的分类。

本发明实施例提出将推文和标签作为节点构建社交网络事件异构图，通过标签特征将独立的微博文本之间形成一种紧密的关联关系。并基于社交网络多属性特征，获取事件描述的辅助信息，建立多视角社交网络事件表示模型，基于语义视角和时间分布视角分布对事件进行表示；基于文本语义信息，学习节点的语义表示，将社交网络异构图模型中的所有节点映射到相同的特征空间，对文本类型数据进行统一表示；基于时间分布特征学习节点的表示，删除标签节点，并将其时间信息汇集到相邻推文节点的时间特征内，作为推文所描述事件的时间分布特征。最后，基于GCN，采用标签注意力机制对多视角特征进行有效的指导和融合，充分学习社交网络短文本的深度语义，通过将不同视角数据映射到一致性语义空间，实现同一尺度下的事件特征表达。最终实现社交网络事件的中精确检测。

本发明提出的基于多视角图注意力网络的社交网络事件的检测方法理论系统完备，创新性突出，主要用于事件检测任务中，对短文本语义充分理解，并从多视角分析和表示给定的推文消息，可以有效地缓解社交网络的语义稀疏性，通过文本语义和时间分布视角融合表示学习节点的特征，根据丰富的特征表示，实现精准的文本分类，提高了社交网络事件检测的性能和效果。

本发明提出基于多视角图注意力网络的社交网络事件检测方法，能够从两个方面减轻短文本稀疏性在语义表达方面的障碍：(1)采用GCN来聚合属性信息和每个视图中异构图的关联结构。它聚合节点邻居的上下文信息，以实现短文本的有效扩展。(2)添加图注意力机制，通过标签特征指导多视图(语义与时间视角)的融合。挖掘不同视图特征之间的互补和关联性，实现短文本的特征增强。最终有效、全面地学习短文本的特征表示，并将对事件的检测转化为对图节点的分类问题。

本发明提出的社交网络事件检测方法应用在社交网络事件检测领域，可以处理不同社交网络环境下的事件检测，例如：微博，Twitter等，并对短文本进行充分的语义理解，从而提高对社交网络信息的融合与挖掘，使得在社交网络事件检测中返回更为准确的检测结果。本发明实施例中仅以对微博中事件的检测作为示例，但是本发明并不限于此，也可以将本发明应用在其他社交网络环境下的事件检测。

相应地，本发明实施例还提供了一种社交网络事件的检测装置，该装置包括处理器和存储器，存储器中存储有计算机指令，处理器用于执行存储器中存储的计算机指令，当计算机指令被处理器执行时该装置实现如前所述方法的步骤。

实现本发明实施例的软件可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的有形存储介质中。

相应地，本公开还涉及如上存储介质，其上可以存储有计算机程序代码，当程序代码被执行时可以实现本发明的方法的各种实施例。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种社交网络事件的检测方法，其特征在于，包括以下步骤：

将所述语义特征矩阵和对应的加权邻接矩阵，以及时间分布特征矩阵和对应的加权邻接矩阵分别输入至图卷积神经网络GCN中进行特征学习，将学习到的特征通过标签注意引导和融合，实现对节点的事件分类，以基于节点事件分类结果进行社交网络事件的检测；

所述基于所述社交网络事件异构图中的推文节点，得到包含推文节点的时间分布视图，并基于所述时间分布视图获得时间分布特征矩阵和对应的加权邻接矩阵，包括：

通过在所述社交网络事件异构图中保留推文节点并删除标签节点而得到包含推文节点的时间分布视图；

基于数据集中标签节点的发布时间来构建时间字典；

基于时间字典将标签节点的时间特征表示为向量，将所述社交网络事件异构图中直接连接到推文节点的所有标签节点对应的时间特征进行组合，作为推文节点的扩展时间特征；

利用推文节点自身的时间特征和扩展时间特征获得推文节点的时间分布特征矩阵；

基于时间分布视图中两个相邻推文节点之间的时间相似性生成时间分布特征矩阵对应的加权邻接矩阵。

2.根据权利要求1所述的方法，其特征在于，所述基于提取的推文和标签之间的共现关系来构建社交网络事件异构图，包括：

在标签是推文的一部分或推文与标签所在的消息有相同的URL的情况下，在推文与标签之间建立连接边；

在两个标签出现在同一条推文中或两个标签所在的消息有相同的URL的情况下，在所述两个标签的节点之间建立连接边；

在两个推文中包含相同的标签或两个推文有相同的URL的情况下，在所述两个推文的节点之间建立连接边。

3.根据权利要求2所述的方法，其特征在于，所述基于语义视图中推文节点和标签节点文本内容特征空间，进行一致性特征空间的映射，获得语义视图的语义特征矩阵和对应的加权邻接矩阵，包括：

基于获得的特征向量得到N个节点的语义特征矩阵Xs∈R^N*ds；

其中，

为语义视图中节点v_i的语义特征的第j维向量，f_s为映射函数，ds为特征向量的维数，ds＝第一数量+(N-n)，N为节点数，n为推文数，N-n为标签数，R^N*ds表示语义特征矩阵的N*ds个元素。

4.根据权利要求3所述的方法，其特征在于，所述节点之间不同节点对的语义关联度用所述社交网络事件异构图中不同节点对间的连接边的条数表示，不同节点对间的语义关联度与不同节点对间的连接边的条数成正比。

5.根据权利要求1所述的方法，其特征在于，

利用推文节点自身的时间特征和扩展时间特征获得推文节点的时间分布特征矩阵包括：基于如下公式获得各推文节点的时间分布特征，并由此获得所有推文节点的时间分布特征矩阵：

其中，[；]表示两个向量的级联；

表示标签节点的时间特征的按位组合；v_it为推文节点i的时间分布特征；所有推文节点的时间分布特征矩阵表示为

T为时间词典的大小；

为时间分布视图中两个相邻推文节点i和j的时间相似性，

6.根据权利要求1所述的方法，其特征在于，所述将所述语义特征矩阵和对应的加权邻接矩阵，以及时间分布特征矩阵和对应的加权邻接矩阵分别输入至图卷积神经网络GCN中进行特征学习，将学习到的特征通过标签注意引导和融合，实现对节点的事件分类，以基于节点事件分类结果进行社交网络事件的检测，包括：

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

利用损失函数来计算第二softmax函数的输出的交叉熵误差值，并用所述交叉熵误差值来更新图卷积神经网络参数，所述损失函数的公式表示为：

8.一种社交网络事件的检测装置，该装置包括处理器和存储器，其特征在于，所述存储器中存储有计算机指令，所述处理器用于执行所述存储器中存储的计算机指令，当所述计算机指令被处理器执行时该装置实现权利要求1-7中任意一项所述方法的步骤。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任意一项所述方法的步骤。