CN115577114A - 一种基于时序知识图谱的事件检测方法和装置 - Google Patents

一种基于时序知识图谱的事件检测方法和装置 Download PDF

Info

Publication number
CN115577114A
CN115577114A CN202111566708.XA CN202111566708A CN115577114A CN 115577114 A CN115577114 A CN 115577114A CN 202111566708 A CN202111566708 A CN 202111566708A CN 115577114 A CN115577114 A CN 115577114A
Authority
CN
China
Prior art keywords
event
knowledge graph
training
detection
time sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111566708.XA
Other languages
English (en)
Inventor
鄂海红
宋美娜
许友日
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202111566708.XA priority Critical patent/CN115577114A/zh
Priority to PCT/CN2022/087213 priority patent/WO2023115761A1/zh
Publication of CN115577114A publication Critical patent/CN115577114A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Abstract

本发明公开了一种基于时序知识图谱的事件检测方法和装置,其中,该方法包括:获取待检测事件,待检测事件包括多个文本数据以及每个文本数据对应的时间戳;以及,根据补全后的时序知识图谱训练预测模型,得到训练好的预测模型;将待检测事件输入训练好的预测模型,以得到待检测事件的检测结果。本发明能够对时序知识图谱直接进行补全,减小了搜索空间,提升了事件检测的性能。

Description

一种基于时序知识图谱的事件检测方法和装置
技术领域
本发明涉及信息技术及数据业务领域,尤其涉及一种基于时序知识图谱的事件检测方 法和装置。
背景技术
时序知识图谱是带有时间属性的事实的集合,如图1所示。时序知识图谱可表示为四 元组的集合G={(s,r,o,t)},其中s代表头实体,o代表尾实体,r代表关系,t代表时间,如(梅西,获奖,世界足球先生,2009年)。通常,时序知识图谱具有不完整性的特点, 即每个时间戳下可能缺失了部分事实。此外,它还具有不断更新的特点,即新的事实会不 断出现。因此,时序知识图谱主要有2个任务:补全和预测。补全任务即补全每个时间戳 下缺失的事实,而预测任务即预测未来会发生什么事实。
目前主流的时序知识图谱补全方法包括Hyte,DE-SimplE,TComplEx。这一类方法是 基于模型参数和数值向量,通过得分函数学会判断真四元组和假四元组。但这一类模型都 是判别式模型,不是生成式模型,由于搜索空间巨大(所有可能的四元组的搜索空间大小 为O(实体数×关系数×实体数×时间戳数)),因此无法直接补全缺失的事实。
目前主流的时序知识图谱预测方法包括RE-NET,CyGNet。这一类方法是基于已发生 的历史事实,预测未来的事实。但它们都没有考虑到图谱不完整性对预测的影响。理论上, 由于图谱的不完整性,用于预测的线索可能缺失,因此可能导致预测的性能下降。因此, 产生了先对图谱补全,再做预测的需求。但由于现有补全模型都是判别式模型,因此无法 直接进行补全。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的目的在于改进现有判别式的知识图谱补全模型,解决无法直接补全缺 失事实的问题,从而补充了用于事件真实性评估的线索,解决了事件真实性评估性能存在 缺陷的问题,提出了一种基于时序知识图谱的事件检测方法。
本发明的另一个目的在于提出一种基于时序知识图谱的事件检测装置。
为达上述目的,本发明一方面提出了基于时序知识图谱的事件检测方法,包括以下步 骤:
获取待检测事件,所述待检测事件包括多个文本数据以及每个文本数据对应的时间戳; 以及,
根据补全后的时序知识图谱训练预测模型,得到训练好的预测模型;
将所述待检测事件输入所述训练好的预测模型,以得到所述待检测事件的检测结果。
本发明实施例的基于时序知识图谱的事件检测方法,通过获取待检测事件,待检测事 件包括多个文本数据以及每个文本数据对应的时间戳;以及,根据补全后的时序知识图谱 训练预测模型,得到训练好的预测模型;将待检测事件输入训练好的预测模型,以得到待 检测事件的检测结果。本发明能够对时序知识图谱直接进行补全,减小了搜索空间,提升 了事件检测的性能。
另外,根据本发明上述实施例的基于时序知识图谱的事件检测方法还可以具有以下附 加的技术特征:
进一步地,所述根据补全后的时序知识图谱训练预测模型之前,还包括:
根据时序知识图谱补全模型训练得到所述补全后的时序知识图谱。
进一步地,所述根据时序知识图谱补全模型训练得到所述补全后的时序知识图谱,包 括:
利用所述时序知识图谱进行补全模型训练,学习训练集的所有事实,得到第一得分函 数模型,以计算已发生时间戳每个四元组成立的概率;
通过对所述时序知识图谱的逐时间戳补全,从所述训练集的所有事实得到候选三元组, 将所述候选三元组与每个所述已发生时间戳组合得到候选四元组;
通过所述补全模型对所述候选四元组进行评分,选出评分最高的预设个数的候选四元 组补全当前时间戳,以得到所述补全后的时序知识图谱。
进一步地,所述根据补全后的时序知识图谱训练预测模型,以得到训练好的预测模型, 包括:
将所述补全后的时序知识图谱输入预测模型进行模型训练;
基于所述模型训练,得到第二得分函数模型;
根据所述第二得分函数模型,计算未来时间戳每个四元组成立的概率,以得到训练好 的预测模型。
进一步地,所述将所述待检测事件输入所述训练好的预测模型,以得到所述待检测事 件的检测结果,包括:
在完成所述预测模型的训练后,对所述未来时间戳每个四元组进行评分,得到评分结 果;
基于所述评分结果,通过与负样本进行比较和排名评估事件检测性能,以得到所述待 检测事件的检测结果。
进一步地,所述根据时序知识图谱补全模型训练得到所述补全后的时序知识图谱,还 包括:
通过忽略时间戳,将所有事实用于补全的候选三元组:
Gstatic={(s,r,o)|(s,r,o,t)∈Gt}
对每个时间戳t,与所述补全的候选三元组组合,得到所述候选四元组:
Figure BDA0003422165420000036
使用在所述时序知识图谱上训练得到的DE-SimplE对所述候选四元组进行评分,选出 得分最高的前k个四元组,作为所述每个时间戳t的补全事件:
Figure BDA0003422165420000031
则所述每个时间戳t的图谱更新为:
Figure BDA0003422165420000032
进一步地,所述根据补全后的时序知识图谱训练预测模型,以得到训练好的预测模型, 包括:
通过循环事件网络RE-NET定义时序知识图谱G的所有事实的概率分布为:
Figure BDA0003422165420000033
其中,Gi:j代表从时间戳i到j的事实集合,时间戳t的每个头实体s的概率从时间戳t-1 的图特征片t-1得到:
Figure BDA0003422165420000034
每个关系r的概率由头实体s的局部特征es和历史特征ht-1(s)得到:
Figure BDA0003422165420000035
每个尾实体o的概率依赖于头实体s、关系r的局部特征es,er以及历史特征ht-1(s,r)得 到:
Figure BDA0003422165420000037
通过拷贝生成网络CyGNet,对于时间tk,每一个要查询的四元组(s,p,?,tk)的历史词 汇为:
Figure BDA0003422165420000041
其中,
Figure BDA0003422165420000042
是N维的multi-hot向量,拷贝模块生成索引向量:
vq=tanh(Wc[s,p,tk]+bc)
每个实体的概率为索引向量vq与历史词汇
Figure BDA0003422165420000043
之和:
Figure BDA0003422165420000044
生成模块预测新事实,不查询相关历史:
p(合)=softmax(Wg[s,p,tk]+bg)
最终概率为拷贝概率与生成概率之和:
p(o|s,p,t)=α·p(c)+(1-α)·p(g)。
进一步地,所述方法,还包括:
在完成对所述预测模型的训练后,得到所述第二得分函数模型,以检测未来的事件, 包括:头实体检测、尾实体检测和关系检测;其中,
所述头实体检测,包括:对于第一查询,将第一实体代入所述第一查询,得到所述第 一实体的第一得分,从所述第一得分中选出得到最高的实体作为答案,以得到第一检测事 件;
所述尾实体检测,包括:对于第二查询,将第二实体代入所述第二查询,得到所述第 二实体的第二得分,从所述第二得分中选出得到最高的实体作为答案,以得到第二检测事 件;
所述关系检测,包括:对于第三查询,将所有关系代入所述第三查询,得到所述所有 关系的第三得分,从所述第三得分中选出得到最高的关系作为答案,以得到第三检测事件。
为达到上述目的,本发明另一方面提出了一种基于时序知识图谱的事件检测装置,包 括:
获取模块,用于获取待检测事件,所述待检测事件包括多个文本数据以及每个文本数 据对应的时间戳;
训练模块,用于根据补全后的时序知识图谱训练预测模型,得到训练好的预测模型;
检测模块,用于将所述待检测事件输入所述训练好的预测模型,以得到所述待检测事 件的检测结果。
本发明实施例的基于时序知识图谱的事件检测装置,通过获取待检测事件,待检测事 件包括多个文本数据以及每个文本数据对应的时间戳;以及,根据补全后的时序知识图谱 训练预测模型,得到训练好的预测模型;将待检测事件输入训练好的预测模型,以得到待 检测事件的检测结果。本发明能够对时序知识图谱直接进行补全,减小了搜索空间,提升 了事件检测的性能。
本发明的有益效果:
本发明改进现有判别式的知识图谱补全模型,实现对时序知识图谱直接进行补全,补 充了用于事件真实性评估的线索,减小了搜索空间,弥补了事件真实性评估性能存在的缺 陷,提升了事件检测的性能。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明 显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和 容易理解,其中:
图1为现有的时序知识图谱的示意图;
图2为根据本发明实施例的基于时序知识图谱的事件检测框架示意图;
图3为根据本发明实施例的基于时序知识图谱的事件检测方法的流程图;
图4为根据本发明实施例的基于时序知识图谱的事件检测方法的训练、查询和检测过 程示意图;
图5为根据本发明实施例的预测模型训练示意图;
图6为根据本发明实施例的基于时序知识图谱的事件检测方法的使用示意图。
图7为根据本发明实施例的基于时序知识图谱的事件检测装置的结构示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组 合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发 明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面参照附图描述根据本发明实施例提出的基于时序知识图谱的事件检测方法及装置, 首先将参照附图描述根据本发明实施例提出的基于时序知识图谱的事件检测方法。
在时序知识图谱中,每个时间戳有缺失或潜在的事件。框架的思想是先对时序知识图 谱补全,再进行预测。该框架主要由3个模块组成:(1)时序知识图谱;(2)补全模块;(3)检测模块,如图2所示。同时,该框架以一种减小搜索空间的补全策略,将判别式补 全模型用于时序知识图谱补全,以便将补全后的图谱用于事件检测。3个模块之间主要有4 个交互流程:时序知识图谱补全模型训练,逐时间戳补全,事件检测模型训练及评估事件 真实性。
本发明对问题进行定义,
Figure BDA0003422165420000061
其中
Figure BDA0003422165420000062
表示在ti时刻的知识图谱,可表示 为四元组的集合,即
Figure BDA0003422165420000063
s,o∈V,V为G的实体集合;r∈R,R为G的关系集合。
问题如下:给定一个已发生的时序知识图谱
Figure BDA0003422165420000064
用于训练,目标是使系 统在该图谱上学习训练,获得预测未来事实的能力,即能够回答查询(s,r,?,t)或(?,r,o,t)或 (s,?,o,t),其中t>tn
图3是本发明一个实施例的基于时序知识图谱的事件检测方法的流程图。
如图3所示,该基于时序知识图谱的事件检测方法包括以下步骤:
步骤S1,获取待检测事件,待检测事件包括多个文本数据以及每个文本数据对应的时 间戳。
具体的,待检测事件可通过微博、新闻网页等浏览网站获得,例如,该待检测事件的 文本数据包括:四元组集合,G={(s,r,o,t)},其中s代表头实体,o代表尾实体,r代表关系,t代表时间。
步骤S2,根据补全后的时序知识图谱训练预测模型,得到训练好的预测模型。
可以理解的是,本发明先根据时序知识图谱补全模型训练得到补全后的时序知识图谱。
具体的,先进行时序知识图谱补全模型训练,时序知识图谱补全模型负责学习训练集 的所有事件,以得到一个判别式的得分函数模型f(s,r,o,t),能够衡量已发生的时间戳内 {t1,..,tn}任意一个四元组(s,r,o,ti)成立的概率(其中1≤i≤n)。
作为一种示例,本发明以以补全模型DE-SimplF为例说明补全模型的训练。首先假设 每个实体e有2个嵌入he、te,每个关系r有2个嵌入vr
Figure BDA0003422165420000065
假设实体的部分特征是静 态的,部分特征是动态的,DE-SimplF赋予每个实体v一个时间编码器,使实体的部分维 度的嵌入随时间变化:
Figure BDA0003422165420000066
其中,
Figure BDA0003422165420000067
代表实体v的静态嵌入,ωv、bv代表实体v编码时间的权值向量,σ为激活函数(如sin函数)。四元组(s,r,o,t)的得分定义为
Figure BDA0003422165420000068
Figure BDA0003422165420000069
再进行逐时间戳补全,由于许多事件如经济危机、外交活动呈现出周期性的特点,即 已发生的事件可能再次发生,从而对于某个时间戳t缺失的事件,可能是其他时间戳出现 的事件,并且这些事件成立的概率比随机生成的事件概率高。
因此,为减小补全的搜索空间,通过忽略时间戳,本发明将所有发生过的事件作为用 于补全的候选三元组,可从训练集的所有事件得到候选三元组:
Gstatic={(s,r,o)|(s,r,o,t)∈Gt}
然后,对每个时间戳t,与候选三元组组合,得到候选四元组
Figure BDA0003422165420000076
然后,这些候选四元组的真实性可以用判别式补全模型去衡量。一个四元组的分数越 高代表着模型认为该四元组的真实性越高。使用在不完整图谱上训练得到的DE-SimplE对 候选四元组评分,选出得分最高的前k个四元组,作为该时间戳t的补全事件:
Figure BDA0003422165420000071
最终,每个时间戳t的图谱更新为:
Figure BDA0003422165420000072
进一步地,将补全后的时序知识图谱输入预测模型进行模型训练,得到第二得分函数 模型,计算未来时间戳每个四元组成立的概率,以得到训练好的预测模型。
具体的,将补全后的时序知识图谱作为预测模型的输入,训练后得到得分函数模型 φ(s,r,o,t),能够衡量未来时间戳{tn+1,..,tn+j}任意一个四元组(s,r,o,ti)成立的概率(其中 n+1≤i≤n+j)。
作为一种示例,本发明以循环事件网络RE-NET和拷贝生成网络CyGNet为例进行阐述。 RE-NET定义时序知识图谱G的所有事实的概率分布为
Figure BDA0003422165420000073
其中,Gi:j代表从时间戳i到j的事实集合,时间戳t的每个头实体s的概率从时间戳t-1的图特征Ht-1得到:
Figure BDA0003422165420000074
每个关系r的概率由头实体s的局部特征es和历史特征ht-1(s)得到:
Figure BDA0003422165420000075
每个尾实体o的概率依赖于头实体s、关系r的局部特征es,er以及历史特征ht-1(s,r)得 到:
Figure BDA0003422165420000081
拷贝生成网络
CyGNet利用拷贝和生成机制,识别和预测出具有周期重复性的事实。对于时间tk,每 一个要查询的四元组(s,p,?,tk)的历史词汇为:
Figure BDA0003422165420000082
其中,
Figure BDA0003422165420000083
是N维的multi-hot向量。拷贝模块首先生成索引向量
vq=tanh(Wc[s,p,tk]+bc)
每个实体的概率为索引向量vq与历史词汇
Figure BDA0003422165420000084
之和:
Figure BDA0003422165420000085
生成模块直接预测新事实,而不查询相关历史:
p(g)=soffmax(Wg[s,p,tk]+bg)
最终概率为拷贝概率与生成概率之和:
p(o|s,p,t)=α·p(c)+(1-α)·p(g)
步骤S3,将待检测事件输入训练好的预测模型,以得到待检测事件的检测结果。
具体地,在完成事实预测模型的训练后,可对未来时间戳的事实集合
Figure BDA0003422165420000086
Figure BDA0003422165420000087
的每个四元组进行评分,通过与负样本进行比较和排名,评估整个框架的事实预测性能,以得到待检测事件的检测结果。本发明得到的检测结果更加具有真实性,预测更加具有可靠性。
具体的,在完成预测模型的训练后,得到得分函数模型
Figure BDA0003422165420000088
可对未来时间戳的 事件集合
Figure BDA0003422165420000089
的每个四元组进行评分,进而得到待检测事件的检测结果, 包括:头实体检测,尾实体检测和关系检测。本发明的训练、查询、检测过程如图5所示。
(1)头实体检测:对于某个查询(?,r,o,t),将所有的实体s’代入该查询,得到所有实 体的得分
Figure RE-GDA00038638678100000810
从中选出得到最高的实体s作为答案,得到事件(s,r,o,t),该评估方 式可用于预测如(?,爱吃,香蕉,tn+i)的查询。
(2)尾实体检测:对于某个查询(s,r,?,t),将所有的实体o’代入该查询,得到所有实 体的得分
Figure RE-GDA00038638678100000811
从中选出得到最高的实体o作为答案,得到事件(s,r,o,t),该评估方式评估可用于预测如(猴子,爱吃,?,tn+i)的查询。
(3)关系检测(s,?,o,t):对于某个查询(s,?,o,t),将所有的关系r’代入该查询,得到 所有关系的得分
Figure BDA00034221654200000812
从中选出得到最高的关系r作为答案,得到事件(s,r,o,t)。
进一步地,以查询尾实体检测为例,本发明检测的使用流程如图6所示。
通过上述步骤,通过获取待检测事件,待检测事件包括多个文本数据以及每个文本数 据对应的时间戳;以及,根据补全后的时序知识图谱训练预测模型,得到训练好的预测模 型;将待检测事件输入训练好的预测模型,以得到待检测事件的检测结果。本发明能够对 时序知识图谱直接进行补全,减小了搜索空间,提升了事件检测的性能。
需要说明的是,时序知识图谱补全和事件检测方法实现方式有多种,但无论具体的实 现方法如何,只要方法提升了事件检测的性能,都是针对现有技术问题的解决,并具有相 应的效果。
为了实现上述实施例,如图7所示,本实施例中还提供了一种基于时序知识图谱的事 件检测装置10,该装置10包括:获取模块100,训练模块200,检测模块300。
获取模块100,用于获取待检测事件,待检测事件包括多个文本数据以及每个文本数据 对应的时间戳;
训练模块200,用于根据补全后的时序知识图谱训练预测模型,得到训练好的预测模型;
检测模块300,用于将待检测事件输入训练好的预测模型,以得到待检测事件的检测结 果。
进一步地,上述训练模块200,还用于:
根据时序知识图谱补全模型训练得到所述补全后的时序知识图谱。
根据本发明实施例的基于时序知识图谱的事件检测装置,通过获取待检测事件,待检 测事件包括多个文本数据以及每个文本数据对应的时间戳;以及,根据补全后的时序知识 图谱训练预测模型,得到训练好的预测模型;将待检测事件输入训练好的预测模型,以得 到待检测事件的检测结果。本发明能够对时序知识图谱直接进行补全,减小了搜索空间, 提升了事件检测的性能。
需要说明的是,前述对基于时序知识图谱的事件检测方法实施例的解释说明也适用于 该实施例的基于时序知识图谱的事件检测装置,此处不再赘述。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以 明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个, 例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具 体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材 料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意 性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特 点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下, 本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特 征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的, 不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例 进行变化、修改、替换和变型。

Claims (10)

1.一种基于时序知识图谱的事件检测方法,其特征在于,包括以下步骤:
获取待检测事件,所述待检测事件包括多个文本数据以及每个文本数据对应的时间戳;以及,
根据补全后的时序知识图谱训练预测模型,得到训练好的预测模型;
将所述待检测事件输入所述训练好的预测模型,以得到所述待检测事件的检测结果。
2.根据权利要求1所述的基于时序知识图谱的事件检测方法,其特征在于,所述根据补全后的时序知识图谱训练预测模型之前,还包括:
根据时序知识图谱补全模型训练得到所述补全后的时序知识图谱。
3.根据权利要求2所述的基于时序知识图谱的事件检测方法,其特征在于,所述根据时序知识图谱补全模型训练得到所述补全后的时序知识图谱,包括:
利用所述时序知识图谱进行补全模型训练,学习训练集的所有事实,得到第一得分函数模型,以计算已发生时间戳每个四元组成立的概率;
通过对所述时序知识图谱的逐时间戳补全,从所述训练集的所有事实得到候选三元组,将所述候选三元组与每个所述已发生时间戳组合得到候选四元组;
通过所述补全模型对所述候选四元组进行评分,选出评分最高的预设个数的候选四元组补全当前时间戳,以得到所述补全后的时序知识图谱。
4.根据权利要求3所述的基于时序知识图谱的事件检测方法,其特征在于,所述根据补全后的时序知识图谱训练预测模型,以得到训练好的预测模型,包括:
将所述补全后的时序知识图谱输入预测模型进行模型训练;
基于所述模型训练,得到第二得分函数模型;
根据所述第二得分函数模型,计算未来时间戳每个四元组成立的概率,以得到训练好的预测模型。
5.根据权利要求4所述的基于时序知识图谱的事件检测方法,其特征在于,所述将所述待检测事件输入所述训练好的预测模型,以得到所述待检测事件的检测结果,包括:
在完成所述预测模型的训练后,对所述未来时间戳每个四元组进行评分,得到评分结果;
基于所述评分结果,通过与负样本进行比较和排名评估事件检测性能,以得到所述待检测事件的检测结果。
6.根据权利要求3所述的基于时序知识图谱的事件检测方法,其特征在于,所述根据时序知识图谱补全模型训练得到所述补全后的时序知识图谱,还包括:
通过忽略时间戳,将所有事实用于补全的候选三元组:
Gstatic={(s,r,o)|(s,r,o,t)∈Gt}
对每个时间戳t,与所述补全的候选三元组组合,得到所述候选四元组:
Figure FDA0003422165410000021
使用在所述时序知识图谱上训练得到的DE-SimplE对所述候选四元组进行评分,选出得分最高的前k个四元组,作为所述每个时间戳t的补全事件:
Figure FDA0003422165410000022
则所述每个时间戳t的图谱更新为:
Figure FDA0003422165410000023
7.根据权利要求4所述的基于时序知识图谱的事件检测方法,其特征在于,所述根据补全后的时序知识图谱训练预测模型,以得到训练好的预测模型,包括:
通过循环事件网络RE-NET定义时序知识图谱G的所有事实的概率分布为:
Figure FDA0003422165410000024
其中,Gi:j代表从时间戳i到j的事实集合,时间戳t的每个头实体s的概率从时间戳t-1的图特征Ht-1得到:
Figure FDA0003422165410000025
每个关系r的概率由头实体s的局部特征es和历史特征ht-1(s)得到:
Figure FDA0003422165410000026
每个尾实体o的概率依赖于头实体s、关系r的局部特征es,er以及历史特征ht-1(s,r)得到:
Figure FDA0003422165410000027
通过拷贝生成网络CyGNet,对于时间tk,每一个要查询的四元组(s,p,?,tk)的历史词汇为:
Figure FDA0003422165410000028
其中,
Figure FDA0003422165410000029
是N维的multi-hot向量,拷贝模块生成索引向量:
vq=tanh(Wc[s,p,tk]+bc)
每个实体的概率为索引向量vq与历史词汇
Figure FDA0003422165410000031
之和:
Figure FDA0003422165410000032
生成模块预测新事实,不查询相关历史:
p(g)=softmax(Wg[s,p,tk]+bg)
最终概率为拷贝概率与生成概率之和:
p(o|s,p,t)=α·p(c)+(1-α)·p(g)。
8.根据权利要求1所述的基于时序知识图谱的事件检测方法,其特征在于,所述方法还包括:
在完成对所述预测模型的训练后,得到所述第二得分函数模型,以检测未来的事件,包括:头实体检测、尾实体检测和关系检测;其中,
所述头实体检测,包括:对于第一查询,将第一实体代入所述第一查询,得到所述第一实体的第一得分,从所述第一得分中选出得到最高的实体作为答案,以得到第一检测事件;
所述尾实体检测,包括:对于第二查询,将第二实体代入所述第二查询,得到所述第二实体的第二得分,从所述第二得分中选出得到最高的实体作为答案,以得到第二检测事件;
所述关系检测,包括:对于第三查询,将所有关系代入所述第三查询,得到所述所有关系的第三得分,从所述第三得分中选出得到最高的关系作为答案,以得到第三检测事件。
9.一种基于时序知识图谱的事件检测装置,其特征在于,包括:
获取模块,用于获取待检测事件,所述待检测事件包括多个文本数据以及每个文本数据对应的时间戳;
训练模块,用于根据补全后的时序知识图谱训练预测模型,得到训练好的预测模型;
检测模块,用于将所述待检测事件输入所述训练好的预测模型,以得到所述待检测事件的检测结果。
10.根据权利要求9所述的基于时序知识图谱的事件检测装置,其特征在于,所述训练模块,还用于:
根据时序知识图谱补全模型训练得到所述补全后的时序知识图谱。
CN202111566708.XA 2021-12-20 2021-12-20 一种基于时序知识图谱的事件检测方法和装置 Pending CN115577114A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111566708.XA CN115577114A (zh) 2021-12-20 2021-12-20 一种基于时序知识图谱的事件检测方法和装置
PCT/CN2022/087213 WO2023115761A1 (zh) 2021-12-20 2022-04-15 基于时序知识图谱的事件检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111566708.XA CN115577114A (zh) 2021-12-20 2021-12-20 一种基于时序知识图谱的事件检测方法和装置

Publications (1)

Publication Number Publication Date
CN115577114A true CN115577114A (zh) 2023-01-06

Family

ID=84579241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111566708.XA Pending CN115577114A (zh) 2021-12-20 2021-12-20 一种基于时序知识图谱的事件检测方法和装置

Country Status (2)

Country Link
CN (1) CN115577114A (zh)
WO (1) WO2023115761A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117151227B (zh) * 2023-08-28 2024-05-17 深圳智现未来工业软件有限公司 一种半导体检测结果的推理方法及装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116611523B (zh) * 2023-07-18 2023-09-26 山东师范大学 涡轮风扇发动机的可解释故障预测方法及系统
CN117093727B (zh) * 2023-10-16 2024-01-05 湖南董因信息技术有限公司 基于时间关系感知的时序知识图谱补全方法
CN117094395B (zh) * 2023-10-19 2024-02-09 腾讯科技(深圳)有限公司 对知识图谱进行补全的方法、装置和计算机存储介质
CN117610513B (zh) * 2024-01-22 2024-04-02 南开大学 一种基于知识保护及选择的主题文本生成方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200065668A1 (en) * 2018-08-27 2020-02-27 NEC Laboratories Europe GmbH Method and system for learning sequence encoders for temporal knowledge graph completion
CN111881219A (zh) * 2020-05-19 2020-11-03 杭州中奥科技有限公司 动态知识图谱补全方法、装置、电子设备和存储介质
CN112395423B (zh) * 2020-09-09 2022-08-26 北京邮电大学 递归的时序知识图谱补全方法和装置
CN112905738B (zh) * 2021-02-05 2022-04-22 中山大学 一种基于时态知识图谱推理的社交关系演变预测方法
CN113190654A (zh) * 2021-05-08 2021-07-30 北京工业大学 一种基于实体联合嵌入和概率模型的知识图谱补全方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117151227B (zh) * 2023-08-28 2024-05-17 深圳智现未来工业软件有限公司 一种半导体检测结果的推理方法及装置

Also Published As

Publication number Publication date
WO2023115761A1 (zh) 2023-06-29

Similar Documents

Publication Publication Date Title
CN115577114A (zh) 一种基于时序知识图谱的事件检测方法和装置
Fortmann-Roe Consistent and clear reporting of results from diverse modeling techniques: the A3 method
Kou et al. An integrated expert system for fast disaster assessment
CN111460167A (zh) 基于知识图谱定位排污对象的方法及相关设备
US20110213788A1 (en) Information fusion for multiple anomaly detection systems
CN111539493B (zh) 一种告警预测方法、装置、电子设备及存储介质
CN111818198B (zh) 域名检测方法、域名检测装置和设备以及介质
CN112906764B (zh) 基于改进bp神经网络的通信安全设备智能诊断方法及系统
CN106294535A (zh) 网站的识别方法和装置
CN111291096A (zh) 数据集构建方法、装置和存储介质及异常指标检测方法
CN115373879A (zh) 一种面向大规模云数据中心智能运维的磁盘故障预测方法
Du et al. Convolutional neural network-based data anomaly detection considering class imbalance with limited data
Qiao et al. Improving collaborative recommendation via location-based user-item subgroup
Yu et al. MAG: A novel approach for effective anomaly detection in spacecraft telemetry data
WO2024027487A1 (zh) 基于智能运维场景的健康度评价方法及装置
CN106844765B (zh) 基于卷积神经网络的显著信息检测方法及装置
CN112016701A (zh) 一种融合时序和属性行为的异常变化检测方法及系统
CN116225848A (zh) 日志监测方法、装置、设备和介质
CN111221704B (zh) 一种确定办公管理应用系统运行状态的方法及系统
Yang et al. Adaptive density peak clustering for determinging cluster center
CN113688120A (zh) 数据仓库的质量检测方法、装置和电子设备
CN113762703A (zh) 确定企业画像的方法和装置、计算设备和存储介质
CN111565192A (zh) 基于可信度的内网安全威胁多模型协同防御方法
Zhang et al. A Multi-Mode Learning Behavior Real-time Data Acquisition Method Based on Data Quality
Melucci Can structural equation models interpret search systems?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination