CN116805152A

CN116805152A - 基于图解纠缠的上下文感知事件预测方法、装置及介质

Info

Publication number: CN116805152A
Application number: CN202310993624.7A
Authority: CN
Inventors: 王翔; 张天宇; 马云山; 陈伟健; 何向南
Original assignee: Data Space Research Institute
Current assignee: Data Space Research Institute
Priority date: 2023-08-09
Filing date: 2023-08-09
Publication date: 2023-09-26

Abstract

本发明公开了一种基于图解纠缠的上下文感知事件预测方法，该事件预测方法基于图解纠缠模型将时间定义为五元组去预测客体事件o，五元组表达为：，其中，分别表示第n个事件的主体、关系、客体、时间戳和上下文，n表示第n个事件，N表示在时间戳t内总计发生的事件数量。探究事件预测方法中图解纠缠模型的性能，设计一种不依赖于知识图谱和图的自身特性的上下文感知图解析框架，同时为每个事件提供了更细粒度的信息，使得粗粒度的事件更具体和富有表现力，专注于将统一的表示分离成多个解析的组件，从而实现了许多优秀的建模特性。

Description

基于图解纠缠的上下文感知事件预测方法、装置及介质

技术领域

本发明涉及机器学习、数据挖掘领域，尤其涉及一种基于图解纠缠的上下文感知事件预测方法、装置及介质。

背景技术

数据科学和人工智能的发展赋予人类更强大的自动事件预测能力，相关研究领域近年来受到了广泛关注。自动事件预测是一项具有挑战性的长期课题，预测方向包括疫情爆发、国家动荡、国际冲突等事件。准确预测这类重大事件可以使相关人员提前准备，避免可能的灾难性后果或最大程度降低潜在的负面影响。当前自动事件预测技术的研究主要基于对事件演化机制的建模，通过分析事件之间的内在联系和时间序列规律来实现对未来事件的预测。

目前，上下文感知是自动事件预测技术发展的主要方向。具体来说，主要存在基于时间序列分析与基于知识图谱的两类技术手段。前者通过挖掘事件时间序列中的趋势特征实现预测，如模拟天气变化和社交网络热点事件的演化轨迹。但这类方法对数据质量和结构要求较高，应用范围受限。后者则是利用知识图谱中丰富的结构化信息，建立起事件、实体与关系之间的关联模型，以实现对上下文信息的感知。但是，构建高质量知识图谱需要投入大量时间和资源，并不一定能完全覆盖研究领域内的知识内容。此外，静态的知识图谱难以表达事件演化过程中的动态变化，这制约了预测结果的时效性。

发明内容

本发明是为了解决上述现有技术存在的不足之处，提出一种基于图解纠缠的上下文感知事件预测方法、装置及介质，探究事件预测方法中图解纠缠模型的性能，不仅为每个事件提供了更细粒度的信息使得事件表达更丰富和具体，而且通过设计分离和协作阶段将事件的统一表达分离为多个组件进行解析并整合上下文的语义信息。

本发明为达到上述发明目的，采用如下技术方案：

第一方面，本发明提供了一种基于图解纠缠的上下文感知事件预测方法，该事件预测方法基于图解纠缠模型将时间定义为五元组去预测客体事件o，五元组表达为：其中，s_n、r_n、o_n、t、c_n分别表示第n个事件的主体、关系、客体、时间戳和上下文，n表示第n个事件，N表示在时间戳t内总计发生的事件数量，所述图解纠缠模型包括在分离阶段中搭建的上下文特定的模型范式和在协作阶段中利用超图建模的跨上下文的语义信息，进行上下文感知的预测。

更进一步地，所述上下文特定的模型范式包括并发事件模型和时序事件模型，上下文特定的模型范式归属于分离阶段，在不同事件模型的分类中分别对应搭建捕捉上下文信息和演化过程的计算范式作为分离阶段，构建超图后再聚合信息的协作阶段，组成上下文感知事件预测的新范式。

更进一步地，并发事件模型中每一图传播层l的客体事件o所接收的信息被定义为：其中/>代表所有的事件，激活函数/>为RReLU函数，经历多个图传播层的信息传输后，将多层信息汇总成整体表达式：/> 其中L表示为信息传输经历的层数。

更进一步地，所述时间事件模型中建立可学习的门控，以保留实体与关联的时间演化方式，表达为E_t,c＝U_t,cE′_t,c+(1-U_t,c)E_t-1,c，其中，E′_t,c是指所有实体在时间戳t和上下文c下的特征矩阵，U_t,c＝σ(W₄E_t-1,c+b)是可学习的门控矩阵，此处σ是sigmoid激活函数，W₄和b是可训练的参数。

更进一步地，所述时序事件模型的时序关系表征r_t,c通过门控循环单元GRU以完成更新，表达为r_t,c＝GRU(r_t-1,c,r′_t,c)，其中为与关联r连接的实体集合。

更进一步地，由于分离阶段中具体先将事件图分解为多个上下文子图，每个上下文子图均比原始图稀疏，没有足够的训练数据将损害准确性，所述协作阶段利用超图来建模多个上下文之间潜在协作效应，针对每个实体v在不同上下文的每个子词嵌入层进行构建超图，然后用多层LightGCN去遍历每一个超图，表达式为其中/>定义为在上下文c中，第p层中对节点v传输的信息，Cv表示为所有实体v存在过的上下文；在经过超图传输之后，经历p层的传输后，聚集所有的嵌入以产出最后的实体表征，表述为/>

更进一步地，所述构建超图将不同上下文中的嵌入进行交互的具体过程如下：

(1)针对每一个实体或关系构建一个超图，其中节点是不同上下文中所有实体或关系的分离嵌入，每个超边连接着相同实体或关系的分离嵌入；

(2)利用多层LightGCN捕捉不同上下文之间的协作关联，并通过超图结构将不同上下文中的嵌入进行交互，交互表达式为：其中/>定义为在上下文c中，第p层中对关系X传输的信息，C_x代表实体v存在过的上下文总集合；同样经历了p层的传输后，聚合所有的嵌入以生成最后的关系表征，即/>

第二方面，本发明提供了一种上下文感知事件预测装置，包括存储器以及处理器，存储器存储有计算机可执行指令，处理器被配置为运行所述计算机可执行指令，所述计算机可执行指令被所述处理器运行时实现所述的基于图解纠缠的上下文感知事件预测方法。

第三方面，本发明提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时实现所述的基于图解纠缠的上下文感知事件预测方法。

与现有技术相比，本发明的有益效果在于：

1、本发明通过探究事件预测方法中图解纠缠模型的性能，不依赖于知识图谱和图的自身特性的上下文感知图解析框架，同时为每个事件提供了更细粒度的信息，使得粗粒度的事件更具体和富有表现力，专注于将统一的表示分离成多个解析的组件，从而实现了许多优秀的建模特性，如增强的表示能力或可解释性从而提高现有时间预测的准确性，准确预测重要事件使相关人员以提前准备，防止灾难性的结果或最小化潜在负面影响，自动事件预测目标是建模观察到的历史事件的丰富关系和时序模式，从而对未来的事件进行精确预测。

2、现有技术中上下文感知事件预测技术大致分为两种：一是基于时间序列的方法，当文本数据具有方向性和趋势性时，如天气变化和社交网络事件走向，可以通过分析历史数据确定走势和发展模式来预测之后的事件，但时间序列对数据的时空特性有较为严格的要求，不具有普遍的解释性，二是基于知识图谱的方法，这种方法利用知识图谱中的结构化信息，通过对实体、关系和事件之间的关联进行建模，实现上下文感知的事件预测，但是知识图谱的构建需要耗费大量的时间和资源，往往无法完整地覆盖所在领域的知识。而本发明基于图解缠结模型的上下文感知事件预测方法具有准确捕捉上下文信息的能力，并且强化了上下文之间的联系和关联的演化过程在预测中的重要性，在事件预测的发展过程中，两种不同超图的交互增加了模型的可解释性。

附图说明

图1为实施例1中上下文感知事件预测的框架图；

图2为实施例1中SCGDe的总体框架图。

具体实施方式

实施例1：

本实施例公开了一种基于图解纠缠的上下文感知事件预测方法，参考图1、图2，该事件预测方法基于图解纠缠模型将时间定义为五元组去预测客体事件o，五元组表达为：其中，s_n、r_n、o_n、t、c_n分别表示第n个事件的主体、关系、客体、时间戳和上下文，n表示第n个事件，N表示在时间戳t内总计发生的事件数量，所述图解纠缠模型包括在分离阶段中搭建的上下文特定的模型范式和在协作阶段中利用超图杠杆建模的跨上下文的协作关系属性，进行上下文感知的预测。

上下文特定的模型范式包括并发事件模型和时间事件模型，上下文特定的模型范式归属于分离阶段，在不同事件模型的分类中分别对应搭建捕捉上下文信息和演化过程的计算范式作为分离阶段，构建超图后再聚合信息的协作阶段，组成上下文感知时间预测的新范式，并发事件模型中每一图传播层l的客体事件o所接收的信息被定义为：其中/>代表所有的事件，激活函数为RReLU函数，经历多个图传播层的信息传输后，将多层信息汇总成整体表达式：/> 其中L表示为信息传输经历的层数，在上述时间事件模型中建立可学习的门控，以保留实体与关联的时间演化方式，表达为E_t,c＝U_t,cE′_t,c+(1-U_t,c)E_t-1,c，其中，E′_t,c是指所有实体在时间戳t和上下文c下的特征矩阵，U_t,c＝σ(W₄E_t-1,c+b)是可学习的门控矩阵，此处σ是sigmoid激活函数，W₄和b是可训练的参数。时序事件模型的时序关系表征r_t,c通过门控循环单元GRU以完成更新，表达为r_t,c＝GRU(r_t-1,c,r′_t,c)，其中V_r,t,c为与关联r连接的实体集合，构建超图将不同上下文中的嵌入进行交互的具体过程如下：

协作阶段中具体先将事件图分解为多个上下文子图，每个上下文子图均比原始图稀疏，则瞄准实现每个散开实体之间的知识传输，针对每个实体v在不同上下文的每个子词嵌入层进行构建超图，然后用多层LightGCN去遍历每一个超图，表达式为其中/>定义为在上下文c中，第p层中对节点v传输的信息，Cv表示为所有实体v存在过的上下文；在经过超图传输之后，经历p层的传输后，聚集所有的嵌入以产出最后的实体表征，表述为/>

通过实验发现SCGDe在事件预测任务上表现出色，优于当前最先进的方法。它不仅能有效地利用上下文信息进行预测，而且还可以解析出事件之间的复杂关系。此外，通过对关键模块和不同上下文的深入研究，进一步验证了它们的有效性和价值，也为提供了更准确、可解释和可靠的预测结果。

这一全新的研究没有现成的数据集可以使用，所以基于GDELT建立了三个大型的基准数据集来使用，先从GDELT数据集提取了特定事件的原始新闻文章的链接，再根据事件的地区和时间特性，选定时间为2015年二月到2022年三月，最后分成了EG、IR和IS三个数据集。在经过简单的数据清洗和比率为8/1/1的训练/验证/测试集划分后，得到的数据集具体信息如下：

图表中|V|表示为图结构中节点的数量，即实体集合大小，|E|表示为图结构中边的数量，即关系集合大小。

在上下文感知事件预测的准确性实验中，使用平均倒数排名(MRR)和HIT@{1，3，10}作为评估指标，这些指标越高代表模型性能越优越。从三个数据集上的实验证明,本实施例模型比当前所有的先进模型模型都要优越，数据统计对比如下表所示：

在上下文感知事件预测的设计合理性实验中，SCGDe的核心贡献在于引入了协作阶段来整合上下文间的关联语义，通过逐步去除实体和关系的两个超图设计了几个消融模型，结果如下表所示。表中“w/o Ent HG”、“w/o RelHG”和“w/o Ent and Rel HG”分别是指无关系超图、无实体超图、无实体超图和关系超图。从结果中可以看出，去除关系和实体超图后结果均变差，但比去除两者的结果好，证明了这两种超图的有效性。更有趣的是，删除实体超图的性能下降通常大于删除关系超图的性能下降，这意味着实体之间的协作更有价值，采集的数据如下表所示：

通过实际案例探究各种不同上下文背景下以预测事件结果的可靠性：在IS数据集的一个示例中，在一个更贴近国家之间军事战争的上下文情景下，SCGDe预测A国将为B国学生的访问提供接待服务，而在另一个与日常国家政治交流的上下文中预测的则是C国。这些预测结果都与对应的上下文信息相符，展示了SCGDe在不同情境中可以灵活并准确地进行事件预测。

实施例2：

本实施例公开了一种上下文感知事件预测装置，包括存储器以及处理器，存储器存储有计算机可执行指令，处理器被配置为运行所述计算机可执行指令，计算机可执行指令被所述处理器运行时实现实施例1公开的基于图解纠缠的上下文感知事件预测方法。

实施例3：

本实施例公开了本发明提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器运行时实现实施例1公开的基于图解纠缠的上下文感知事件预测方法。

Claims

1.一种基于图解纠缠的上下文感知事件预测方法，其特征是，该事件预测方法基于图解纠缠模型将事件定义为五元组去预测客体事件o，五元组表达为：，其中，/>分别表示为第n个事件的主体、关系、客体、时间戳和上下文，n表示第n个事件，N表示在时间戳t内总计发生的事件数量，所述图解纠缠模型包括在分离阶段中搭建的上下文特定的模型范式和在协作阶段中利用超图建模的跨上下文的语义信息，进行上下文感知的事件预测。

2.根据权利要求1所述的基于图解纠缠的上下文感知事件预测方法，其特征是，所述上下文特定的模型范式包括并发事件模型和时序事件模型，上下文特定的模型范式归属于分离阶段，在不同事件模型的分类中分别对应搭建捕捉上下文信息和演化过程的计算范式作为分离阶段，构建超图后再聚合信息的协作阶段，组成上下文感知事件预测的新范式。

3.根据权利要求2所述的基于图解纠缠的上下文感知事件预测方法，其特征是，所述并发事件模型中每一图传播层的客体事件o所接收的信息被定义为：，中/>代表所有的事件，激活函数/>为RReLU函数，经历多个图传播层的信息传输后，将多层信息汇总成整体表达式：/>，其中/>表示为信息传输经历的层数。

4.根据权利要求2所述的基于图解纠缠的上下文感知事件预测方法，其特征是，所述时间事件模型中建立可学习的门控，以保留实体与关联的时间演化方式，表达为，其中，/>是指所有实体在时间戳/>和上下文/>下的特征矩阵，/>是可学习的门控矩阵，此处/>是sigmoid激活函数，/>和/>是可训练的参数。

5.根据权利要求4所述的基于图解纠缠的上下文感知事件预测方法，其特征是，所述时序事件模型的时序关系表征通过门控循环单元GRU以完成更新，表达为，其中/>，/>为与关联r连接的实体集合，/>是实体v的向量表征，即/>的第v行向量。

6.根据权利要求1所述的基于图解纠缠的上下文感知事件预测方法，其特征是，由于分离阶段中具体先将事件图分解为多个上下文子图，每个上下文子图均比原始图稀疏，没有足够的训练数据将损害准确性，所述协作阶段利用超图来建模多个上下文之间潜在协作效应，针对每个实体v在不同上下文的每个子词嵌入层进行构建超图，然后用多层LightGCN去遍历每一个超图，表达式为，其中/>定义为在上下文c中，第p层中对节点v传输的信息，Cv表示为所有实体v存在过的上下文，在经过超图传输以及经历p层的传输后，聚集所有的嵌入以产出最后的实体表征，表述为/>。

7.根据权利要求1所述的基于图解纠缠的上下文感知事件预测方法，其特征是，在所述上下文感知预测中，选取ConvTransE作为解码器进行打分预测，预测分数计算公式为：，其中softmax归一化指数函数，ConvTransE为ConvTransE解码器，/>、/>分别表示主体(subject)、关系(relation)，预测的客体表示为/>。

8.根据权利要求6所述的基于图解纠缠的上下文感知事件预测方法，其特征是，所述构建超图将不同上下文中的嵌入进行交互的具体过程如下：

（1）针对每一个实体或关系构建一个超图，用此超图建模并提供该实体或关系在不同上下文中的语义信息；

（2）利用多层LightGCN捕捉不同上下文之间的协作关联，并通过超图结构将不同上下文中的嵌入进行交互，交互表达式为：，其中/>定义为在上下文中，第/>层中对关系/>传输的信息，/>代表实体v存在过的上下文总集合；同样经历了/>层的传输后，聚合所有的嵌入以生成最后的关系表征，即/>。

9.一种上下文感知事件预测装置，包括存储器以及处理器，存储器存储有计算机可执行指令，处理器被配置为运行所述计算机可执行指令，其特征在于，所述计算机可执行指令被所述处理器运行时实现权利要求1～8任一项所述的基于图解纠缠的上下文感知事件预测方法。

10.一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时实现权利要求1～8任一项所述的基于图解纠缠的上下文感知事件预测方法。