CN116029408A - 基于时序图规则的事件预测的方法及装置 - Google Patents

基于时序图规则的事件预测的方法及装置 Download PDF

Info

Publication number
CN116029408A
CN116029408A CN202211071435.6A CN202211071435A CN116029408A CN 116029408 A CN116029408 A CN 116029408A CN 202211071435 A CN202211071435 A CN 202211071435A CN 116029408 A CN116029408 A CN 116029408A
Authority
CN
China
Prior art keywords
time sequence
rule
event prediction
data
diagram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211071435.6A
Other languages
English (en)
Inventor
樊文飞
靳若春
陆平
田超
许瑞琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Computing Sciences
Original Assignee
Shenzhen Institute of Computing Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Computing Sciences filed Critical Shenzhen Institute of Computing Sciences
Priority to CN202211071435.6A priority Critical patent/CN116029408A/zh
Priority to PCT/CN2022/119241 priority patent/WO2024045225A1/zh
Publication of CN116029408A publication Critical patent/CN116029408A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Medical Informatics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于时序图规则的事件预测的方法及装置,方法包括:获取时序图数据,并对所述时序图数据加入机器学习模型的事件预测结果得到时序图扩展数据;依据验证比例从时序图扩展数据中提取用于验证预测规则信赖度的子图;依据所述时序图扩展数据与所述子图对规则创造者进行训练,得到时序事件预测规则集合;依据所述时序事件预测规则集合与所述时序图数据获取预测事件集合。通过将事件预测的机器学习模型作为谓词嵌入基于规则的关联关系系统中,使关联规则不仅可以利用现有的机器学习模型事件预测结果,还可以用逻辑条件来完善机器学习模型的预测结果,表达能力更强,不必约束间隔时间恒定,也不必对于图模式有共同焦点约束。

Description

基于时序图规则的事件预测的方法及装置
技术领域
本发明主要涉及时序图关联规则领域,尤其涉及一种基于时序图规则的事件预测的方法及装置。
背景技术
如今已经开发出一系列时序关联规则,用于表示关系数据中的时间相关关系。然而面向图数据的关联规则研究相对有限,主要有以下三种。图关联规则(GraphAssociationRules,GAR)是定义在静态图上的关联规则,主要用于指定静态图中实体之间的相关性和规律,不适用于时序图处理。图时序关联规则(GraphTemporalAssociationRules,GTAR)通过两个共享同一焦节点和同一恒定时间间隔的事件模式来指定事件之间的联系,从而可以在时序图中进行事件关联分析。类似地,图演化规则(GraphEvolutionRules,GER)采用两个相连的子模式定义,这两个子模式由单一的图模式分解而成,从而可以表示时序图局部的变化。因此图演化规则可以用来描述时序图中节点的标签变化。
现有面向时序图的关联规则主要有以下缺点:第一,前人提出的关联规则不能有效融合机器学习算法对于时序图中事件预测的成果,这阻碍了关联规则用于事件预测的准确度提升;第二,前人提出的用于事件预测的关联规则具有过多限制条件,表达能力有限。例如GAR只能用于静态图数据,GTAR需要设置模式的共同焦点,GER只能表达恒定一致的时间间隔。
发明内容
鉴于所述问题,提出了本申请以便提供克服所述问题或者至少部分地解决所述问题的基于时序图规则的事件预测的方法及装置,包括:
一种基于时序图规则的事件预测的方法,包括:
获取时序图数据,并对所述时序图数据加入机器学习模型的事件预测结果得到时序图扩展数据;
依据验证比例从时序图扩展数据中提取用于验证预测规则信赖度的子图;
依据所述时序图扩展数据与所述子图对规则创造者进行训练,得到时序事件预测规则集合;
依据所述时序事件预测规则集合与所述时序图数据获取预测事件集合。
进一步的,所述依据所述时序图扩展数据以及所述子图对规则创造者进行迭代交互训练,得到时序事件预测规则集合的步骤,包括:
依据所述时序图扩展数据对所述规则创造者进行预训练;
依据所述时序图扩展数据与所述预训练数据对所述规则创造者进行迭代交互训练。
进一步的,所述依据所述时序图扩展数据对所述规则创造者进行预训练的步骤,包括:
所述规则创造者依据在所述时序图扩展数据中抽取预设位置的局部图结构数据生成若干候选时序事件预测规则;
所述规则创造者依据时序图模型生成所述候选时序事件预测规则的图模式并生成标签,得到图模式的候选时序事件预测规则;
所述规则创造者对所述图模式的候选时序事件预测规则运用层级扩展过程构建逻辑依赖并形成候选时序事件预测规则集合;
规则批评者依据所述子图将所述候选时序事件预测规则集合中,支持度与信赖度高于预设阈值的所述候选时序事件预测规则添加到新集合中生成时序事件预测规则集合。
进一步的,所述依据所述时序图扩展数据与所述预训练数据对所述规则创造者进行迭代交互训练的步骤,包括:
所述规则创造者依据在所述时序图扩展数据中抽取预设位置的局部图结构数据生成若干候选时序事件预测规则;
所述规则创造者依据时序图模型生成所述候选时序事件预测规则的图模式并生成标签,得到图模式的候选时序事件预测规则;
所述规则创造者对所述图模式的候选时序事件预测规则运用层级扩展过程构建逻辑依赖并形成候选时序事件预测规则集合;
规则批评者依据所述子图将所述候选时序事件预测规则集合中,支持度与信赖度高于预设阈值的所述候选时序事件预测规则添加到新集合中生成时序事件预测规则集合;
所述规则创造者依据所述时序事件预测规则集合改进时序图模型进行迭代训练。
进一步的,所述迭代训练中使用的所述时序图扩展数据与所述局部图数据均为上一次训练中的结果数据。
进一步的,所述依据所述时序事件预测规则集合与所述时序图数据获取预测事件集合的步骤,包括:
依据处理器数量对所述时序图数据进行时序划分,得到若干图分块;
对每个图分块分配一个不同的处理器,并指定一个处理器作为协调节点;
在所有所述处理器上并行地调用串行算法,获取所述时序图数据组由所述时序事件预测规则预测的所有事件。
进一步的,所述依据处理器数量对所述时序图数据进行时序划分,得到若干图分块的步骤,包括:
依据候选时间间隔区间、各个时刻时序图大小的集合、最大时间戳和最小时间戳获取一个针对所述时间间隔区间的分割点集合;
通过一个二维数组采用动态规划依据所述分割点集合与处理器数量确定分割点;
依照所述分割点对所述时序图数据进行时序划分。
一种基于时序图规则的事件预测的装置,所述基于时序图规则的事件预测的装置实现上述任一项所述的基于时序图规则的事件预测的方法的步骤,包括:
获取模块,用于获取时序图数据,并对所述时序图数据加入机器学习模型的事件预测结果得到时序图扩展数据;
子图生成模块,用于依据验证比例从时序图扩展数据中提取用于验证预测规则信赖度的子图;
训练模块,用于依据所述时序图扩展数据与所述子图对规则创造者进行训练,得到时序事件预测规则集合;
事件预测模块,用于依据所述时序事件预测规则集合与所述时序图数据获取预测事件集合。
电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任一项所述的基于时序图规则的事件预测的方法的步骤。
计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的基于时序图规则的事件预测的方法的步骤。
本申请具有以下优点:
本发明通过一种基于时序图规则的事件预测的方法,包括:获取时序图数据,并对所述时序图数据加入机器学习模型的事件预测结果得到时序图扩展数据;依据验证比例从时序图扩展数据中提取用于验证预测规则信赖度的子图;依据所述时序图扩展数据与所述子图对规则创造者进行训练,得到时序事件预测规则集合;依据所述时序事件预测规则集合与所述时序图数据获取预测事件集合。可以将基于规则和基于机器学习的事件预测方法相统一,通过将事件预测的机器学习模型作为谓词嵌入基于规则的关联关系系统中,使得关联规则TACO不仅可以利用现有的机器学习模型事件预测结果,还可以用逻辑条件来完善机器学习模型的预测结果。TACO相比于前人针对事件预测提出的图关联规则,表达能力更强,不必约束间隔时间恒定,也不必对于图模式有共同焦点约束。
附图说明
为了更清楚地说明本申请的技术方案,下面将对本申请的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的基于时序图规则的事件预测的方法的步骤流程图;
图2是本申请一实施例提供的基于时序图规则的事件预测装置的模块结构示意图;
图3是本发明一实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请的所述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本发明任一实施例中,将一个时序事件预测规则(temporaleventpredictionrule,TACO)定义为:ΔQ[x](X→(p0,τ)),其中,ΔQ[x]是Δ图模式,X是ΔQ[x]的谓词的合取,p0是ΔQ[x]的谓词,τ是一个时间窗口。当p0=l(x,y)时,由p0代表的边是规则所预测的,而不一定已经在ΔQ[x]中。我们把ΔQ[x]、X、p0和X→(p0,τ)分别称为的图模式、前提条件、事件和逻辑依赖。
Δ图模式的定义:一个Δ图模式是ΔQ[x]=(VQ,EQ,LQ,TQ,μ),其中,VQ是图模式节点的集合,EQ是图模式边的集合;LQ为每一个图模式的节点u∈VQ分配一个标签,LQ也为每一个图模式的边e∈EQ分配一个标签;TQ给图模式的每条边分配一个时间窗口τ。特别地,一个指定的边ex被赋予τ=[0,0]以表示当前时间;x是一系列互不相同的变量的列表;μ是一个从x到VQ的双射,即它给VQ的每个节点分配一个不同的变量。
谓词的定义:Δ图模式ΔQ[x]的谓词p具有以下形式之一:
x.A|l(x,y)|M(x,y,l,t)|x.A⊕y.B|x.A⊕c|e1.t⊕e2.t|e.t⊕c,其中e1、e2和e是的图模式边,x.A表示模式节点x的属性A,c是一个常数,l(x,y)是一条从x到y的标签为l的边,e.t是边e的时间戳,是=,!=,<,≤,>,≥之一。如果有e.t≥t1且e.t≤t2,那么我们记为e.t∈[t1,t2],本申请将称为时序谓词。
参照图1,示出了本申请一实施例提供的一种基于时序图规则的事件预测的方法;
所述方法包括:
S110、获取时序图数据,并对所述时序图数据加入机器学习模型的事件预测结果得到时序图扩展数据;
S120、依据验证比例从时序图扩展数据中提取用于验证预测规则信赖度的子图;
S130、依据所述时序图扩展数据与所述子图对规则创造者进行训练,得到时序事件预测规则集合;
S140、依据所述时序事件预测规则集合与所述时序图数据获取预测事件集合。
在本申请实施例中,通过一种基于时序图规则的事件预测的方法,包括:获取时序图数据,并对所述时序图数据加入机器学习模型的事件预测结果得到时序图扩展数据;依据验证比例从时序图扩展数据中提取用于验证预测规则信赖度的子图;依据所述时序图扩展数据与所述子图对规则创造者进行训练,得到时序事件预测规则集合;依据所述时序事件预测规则集合与所述时序图数据获取预测事件集合。可以将基于规则和基于机器学习的事件预测方法相统一,通过将事件预测的机器学习模型作为谓词嵌入基于规则的关联关系系统中,使得关联规则TACO不仅可以利用现有的机器学习模型事件预测结果,还可以用逻辑条件来完善机器学习模型的预测结果。TACO相比于前人针对事件预测提出的图关联规则,表达能力更强,不必约束间隔时间恒定,也不必对于图模式有共同焦点约束。
下面,将对本示例性实施例中基于时序图规则的事件预测的方法作进一步地说明。
如上述步骤S110所述,获取时序图数据,并对所述时序图数据加入机器学习模型的事件预测结果得到时序图扩展数据。
在本发明一实施例中,可以结合下列描述进一步说明步骤S110所述“获取时序图数据,并对所述时序图数据加入机器学习模型的事件预测结果得到时序图扩展数据”的具体过程。
需要说明的是,时序图数据输入之后,该步骤通过调用函数MLExp来准备图数据,将时序图G扩展为时序图扩展数据GM,通过GM可以方便发现具有机器学习谓词的时序事件预测规则,即添加输入的机器学习模型M所预测的边。该步骤允许规则创造者将机器学习模型M作为机器学习谓词纳入规则生成,并加速发现时序事件预测规则TACO,因为在发现过程中不需要重复调用机器学习模型M,所以这个步骤只需使用预先训练好的模型即可,而且效率很高。
如上述步骤S120所述,依据验证比例从时序图扩展数据中提取用于验证预测规则信赖度的子图。
在本发明一实施例中,可以结合下列描述进一步说明步骤S120所述“依据验证比例从时序图扩展数据中提取用于验证预测规则信赖度的子图”的具体过程。
需要说明的是,该步骤通过函数VGraph在时序图扩展数据GM提取一个用于验证规则的子图Gv M。函数VGraph执行时序BFS,从GM中提取一个用于规则验证的子图Gv M,使Gv M=η|GM|,用于有效地评估候选时序事件预测规则TACOs的质量。时序BFS扩展了传统的广度优先搜索(BFS),以寻找最短的时序路径,其中时序路径上所有边的时间戳都落在一个给定的时间窗口中。
如上述步骤S130所述,依据所述时序图扩展数据与所述子图对规则创造者进行训练,得到时序事件预测规则集合。
在本发明一实施例中,可以结合下列描述进一步说明步骤S130所述“依据所述时序图扩展数据与所述子图对规则创造者进行训练,得到时序事件预测规则集合”的具体过程。
作为一种示例,在执行该步骤操作时执行如下步骤:
输入:时序图G,规则发现需求d=(α,β,γ,δ),机器学习模型M,验证比例η,采样规模N,迭代次数I;
计算ε←0;Σd←0;GM←MLExp(G,M);
计算
计算
计算∑←GenerateRule(α,δ,∑d);
计算
当ε<I时:
计算
计算
计算∑←GenerateRule(α,δ,∑d);
计算
计算∑d←∑d∪∑′d;ε←ε+1;
返回∑d
输出从G中挖掘出来的TACOs集合∑d,使得∑d中的每个规则都符合d的要求。
如下列步骤所述,依据所述时序图扩展数据对所述规则创造者进行预训练。
需要说明的是,预训练的数据是由Localized Sample算法采样的局部图GS M,这样才使得创造可以开始生成可能达到输入需求d的支持度和置信度阈值的规则。规则创造者通过Generate Rule算法生成一个候选时序事件预测规则TACOs集合∑;之后规则批评者在验证图Gv M上评估∑,并通过函数Select Rule将高质量的TACOs保存在集合∑d中。
函数Localized Sample通过从GM\GV M中抽取局部图结构,收集包含多个Δ图模式的集合Gs M,作为每个迭代中规则创造者的训练数据。当采样Gs M的Δ图模式ΔQi时,Localized Sample采用随机选择的源节点v的时序随机行走来采样时序路径,并返回v周围的最频繁采样的α-1个节点。然后ΔQj由这些节点和连接它们的边组成。这里的输入参数α是对每个TACO的图模式节点数量的约束。在预训练期间,在G^s M中的Δ图模式的指导下,规则创造者可以学习生成更可能在图中找到匹配的图模式。这是因为每个ΔQi本身都有匹配,因为它是通过GM\Gv M中的随机游走获得的,生成模型可以学习生成与ΔQi在语义上和结构上相似的“新”图模式。如果没有预训练,创造者中随机初始化的生成模型可能会产生无意义的TACOs。
如下列步骤所述,依据所述时序图扩展数据与所述预训练数据对所述规则创造者进行迭代交互训练。
需要说明的是,函数Localized Sample通过从GM\Gv M中抽取局部图结构,收集包含多个Δ图模式的集合Gs M,作为每个迭代中规则创造者的训练数据。当采样Gs M的Δ图模式ΔQi时,Localized Sample采用随机选择的源节点v的时序随机行走来采样时序路径,并返回v周围的最频繁采样的α-1个节点。然后ΔQi由这些节点和连接它们的边组成。这里的输入参数α是对每个TACO的图模式节点数量的约束。
挖掘算法迭代地发现高质量的TACOs,并通过多轮迭代的交互训练过程向Σd添加更多高质量规则。每次迭代与预训练阶段类似,不同之处在于后续迭代中Gs M和Σd都被用来训练和改进创造者。这里Σd的TACOs是来自批评者的用于提升创造者的反馈,最后Σd被返回。
如下列步骤所述,所述规则创造者依据在所述时序图扩展数据中抽取预设位置的局部图结构数据生成若干候选时序事件预测规则。
需要说明的是,该步骤为通过Localized Sample算法采样的局部图数据Gs M,通过该算法采样取得的局部图数据,可以使规则创造者生成的规则的支持度和置信度都在需求阈值之内,排除大量无效规则,增加工作效率。
如下列步骤所述,所述规则创造者依据时序图模型生成所述候选时序事件预测规则的图模式并生成标签,得到图模式的候选时序事件预测规则。
需要说明的是,规则创造者通过两个步骤生成图模式的候选时序事件预测规则:结构生成和语义标签生成。两步骤分别采用时序图GAN模型和LSTM网络。首先,规则创造者将Gs M和Σd中的每个Δ图模式ΔQi作为输入。它采用Tag Gen,一个端到端的时序图深度生成框架,以导出候选Δ图模式ΔQg i。由于Tag Gen采用GAN生成模型,每个生成的ΔQg i和输入的ΔQi都有相同数量的节点(最多alpha个),并且有类似的拓扑结构和时间窗限制。由于Tag Gen不支持标签,所以在这一步中没有生成标签。因此,需要在下一个步骤中为模式附加标签。
规则创造者采用LSTM语言模型ML为每个候选Δ-图模式ΔQg i生成标签。采用LSTM网络,可以对知识图谱中路径上的标签的丰富语义进行建模。具体来说,它首先在一个由混乱度驱动的语料库C上训练ML,其中每个词都是由边标签和节点标签组成的:<L(e),L(v)>,被称为“标签对”。语料库C由时序路径的标签对序列组成,这些标签对是通过对每个ΔQi应用时序随机游走得到的。这里,一个时序路径的标签对序列(v0,e1,v1,e2,...,es,vs)是(<L(v0)>,<L(e1),L(v1)>,...,<L(es),L(vs)>)。训练结束后,对于ΔQg i中的每两个节点u和v,从u到v的最短时序路径ρ,ML用随机种子生成一个标签对序列,并将这个标签序列赋到ρ。这里只考虑最短的路径,因为与其他较长的路径相比,两点间的最短路径在图中一般拥有更强的关联性。最后,创造者从ΔQg i中建立了一个Δ图模式ΔQ′i,保留了附着在每个节点和边上的最频繁的标签。
如下列步骤所述,所述规则创造者对所述图模式的候选时序事件预测规则运用层级扩展过程构建逻辑依赖并形成候选时序事件预测规则集合。
需要说明的是,给出一个生成的Δ图模式ΔQ,创造者运用层级扩展过程,构建一套有效的逻辑依赖X→(p0,τ),并形成Σ集合中的候选TACOs。更具体地说,对于每个可能的事件(p0,τ),它从开始,迭代地为ΔQ扩展前提条件X。规则创造者还验证了候选的在G中是否有效,即是否成立。该算法在生成后直接验证其有效性,规则创造者首先检查是否是多余的,即是否被先前迭代中发现的TACOs集合Σd所蕴含(Σd=φ),如果不是多余的,即不成立,算法将继续进行验证,并在时将纳入Σ。
如下列步骤所述,规则批评者依据所述子图将所述候选时序事件预测规则集合中,支持度与信赖度高于预设阈值的所述候选时序事件预测规则添加到新集合中生成时序事件预测规则集合。
需要说明的是,对于Σ中每个生成的候选规则批评者计算并选择支持度和信赖度高于阈值的高质量TACOs。这些规则被添加到Σd中,并被提供给规则创造者,以便在下一次迭代中改进生成模型。
如下列步骤所述,所述规则创造者依据所述时序事件预测规则集合改进时序图模型进行迭代训练。
需要说明的是,所述迭代训练中使用的所述时序图扩展数据与所述局部图数据均为上一次训练中的结果数据。通过多次迭代训练,不断挖掘时序事件预测规则,并进行筛选,得到完善机器学习模型的预测结果,同时拥有更强的表达能力,可以对所以常规的情况进行预测。
如上述步骤S140所述,依据验证比例从时序图扩展数据中提取用于验证预测规则信赖度的子图。
在本发明一实施例中,可以结合下列描述进一步说明步骤S140所述“依据所述时序事件预测规则集合与所述时序图数据获取预测事件集合”的具体过程。
需要说明的是,可以根据时间局部性来划分时序图G,这是用TACOs进行时序模式匹配的一个独特属性。也就是说,Δ图模式ΔQ的每个匹配h(x)中的边的时间戳都在局部时间范围内[t*+tmin,t*+tmax],其中tmin表示ΔQ中最小的时间戳,tmax表示ΔQ中最大的时间戳。
作为一种示例,当执行该步骤时执行如下操作:
输入:处理器个数k,一个k个随机分块的时序图G,TACOs集合Σ,时间窗口τ0;
计算[t0,tk)←RefTime(Σ,τ0);(tmin,tmax)←ExtractTS(Σ);
针对t∈[t0,tk),收集t-图Gt的尺寸|Gt|;
计算{t1,......,tk-1}←BTPart([t0,tk),{|Gt||t∈[t0,tk)},k,tmin,tmax);
计算其中,
计算
对于在每个分块Fi运行SepEP(Fi,Σ,τ0)以获取Ri
返回∪i∈[,]Ri
计算Function BTPart([t0,tk),{|Gt||t∈[t0,tk)},k,tmin,tmax);
计算foreach t∈[t0,tk)do
计算foreach i∈[2,tk)do
foreach t′∈[t0,tk)do
计算foreach i∈[2,tk)按照降序do
返回{t1,......,tk-1};
输出:由∑预测的表示事件发生在τ0内的边集合R。
如下列步骤所述,依据处理器数量对所述时序图数据进行时序划分,得到若干图分块。
需要说明的是,并行事件预测的计算是由这些图分块中尺寸最大的一个为maxi∈[1,k]|Fi|决定。因此,需要找到一个好的时间间隔划分,以最小化maxi∈[1,k]|Fi|。为了做到这一点,使用函数BT Part作为算法的一部分。函数的输入如下:候选时间间隔为[t0,tk)(从事件预测中用于匹配指定边的TACOs∑和时间窗口τ0得出)、各个时刻时序图大小的集合为{|Gt||t∈[t0,tk)}、图分块处理器的数量为k、∑中的最大时间戳tmax和∑中的最小时间戳tmin。其中,Gt指的是由G中带有时间戳t的所有边组成的t-图。BT Part计算得到一个包含针对区间[t0,tk)的k-1个分割点的集合{t1,…,tk-1},使得分块Fi对于i∈[1,k]成为G[ti-1+tmin,ti+tmax)(它包括G中时间戳在[ti-1+tmin,ti+tmax)范围内的边)。这里tmin和tmax是为了保证上述的整个覆盖范围。
函数BT Part采用了动态规划。它维护一个二维数组S,其中S[t][i]记录了将G[t0+tmin,t+tmax)分割成i个子区间所得到的最大分块的最小尺寸。因此S[tk][k]是我们的目标值。BT Part首先处理基础情况i=1,其中S[t][1]=|G[t0+tmin,t+tmax)|因为针对单个子区间只会有一个分块。这里的尺寸是由输入的t-图的大小得出的。对于i>1的情况,S[t′][i]是通过检查t<t′的所有可能范围[t0,t)的值及其i-1子区间来确定的。在计算了S[tk][k]之后,算法确定相应的k-1个划分点并作为结果返回。
如下列步骤所述,对每个图分块分配一个不同的处理器,并指定一个处理器作为协调节点。
需要说明的是,时序划分之后,得到的k个图分块,有k+1个处理器,每一个图分块都能分配到一个处理器,同时,单独有一个处理器作为协调节点,从所以处理器中收集t-图的大小并运行函数BT part。
如下列步骤所述,在所有所述处理器上并行地调用串行算法,获取所述时序图数据组由所述时序事件预测规则预测的所有事件。
需要说明的是,给定时序图G,TACOs集合Σ和一个时间窗口τ0,一个顺序预测算法(记为Seq EP)找到G中由Σ预测的所有边(事件)R。对于Σ中的τ=[t1,t2]的每一个串行算法通过图同构找到ΔQ在ΔGQ的所有匹配。对于每个匹配的h(x),它检查h(x)|=X是否成立并检查导出的时间窗口[t*+t1,t*+t2]是否是τ0的一个子区间,其中,t是指当前时间。如果上述检查均成立,串行算法将匹配p0中变量的节点之间相连的边加入集合R。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
参照图2,示出了本申请一实施例提供的一种基于时序图规则的事件预测的装置;
具体包括:
获取模块S210,用于获取时序图数据,并对所述时序图数据加入机器学习模型的事件预测结果得到时序图扩展数据;
子图生成模块S220,用于依据验证比例从时序图扩展数据中提取用于验证预测规则信赖度的子图;
训练模块S230,用于依据所述时序图扩展数据与所述子图对规则创造者进行训练,得到时序事件预测规则集合;
事件预测模块S240,用于依据所述时序事件预测规则集合与所述时序图数据获取预测事件集合。
在本发明一实施例中,所述训练模块S220,包括:
预训练子模块,用于依据所述时序图扩展数据对所述规则创造者进行预训练;
迭代训练子模块,用于依据所述时序图扩展数据与所述预训练数据对所述规则创造者进行迭代交互训练。
在本发明一实施例中,所述预训练子模块,包括:
采样子模块,用于所述规则创造者依据在所述时序图扩展数据中抽取预设位置的局部图结构数据生成若干候选时序事件预测规则;
图模式生成子模块,用于所述规则创造者依据时序图模型生成所述候选时序事件预测规则的图模式并生成标签,得到图模式的候选时序事件预测规则;
逻辑依赖子模块,用于所述规则创造者对所述图模式的候选时序事件预测规则运用层级扩展过程构建逻辑依赖并形成候选时序事件预测规则集合;
规则批评子模块,用于规则批评者依据所述子图将所述候选时序事件预测规则集合中,支持度与信赖度高于预设阈值的所述候选时序事件预测规则添加到新集合中生成时序事件预测规则集合。
在本发明一实施例中,所述迭代训练子模块,包括:
采样子模块,用于所述规则创造者依据在所述时序图扩展数据中抽取预设位置的局部图结构数据生成若干候选时序事件预测规则;
图模式生成子模块,用于所述规则创造者依据时序图模型生成所述候选时序事件预测规则的图模式并生成标签,得到图模式的候选时序事件预测规则;
逻辑依赖子模块,用于所述规则创造者对所述图模式的候选时序事件预测规则运用层级扩展过程构建逻辑依赖并形成候选时序事件预测规则集合;
规则批评子模块,用于规则批评者依据所述子图将所述候选时序事件预测规则集合中,支持度与信赖度高于预设阈值的所述候选时序事件预测规则添加到新集合中生成时序事件预测规则集合。
反馈子模块,用于所述规则创造者依据所述时序事件预测规则集合改进时序图模型进行迭代训练。
参照图3,示出了本发明的一种基于时序图规则的事件预测的方法的计算机设备,具体可以包括如下:
上述计算机设备12以通用计算设备的形式表现,计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线18结构中的一种或多种,包括存储器总线18或者存储器控制器,外围总线18,图形加速端口,处理器或者使用多种总线18结构中的任意总线18结构的局域总线18。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线18,微通道体系结构(MAC)总线18,增强型ISA总线18、音视频电子标准协会(VESA)局域总线18以及外围组件互连(PCI)总线18。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其他移动/不可移动的、易失性/非易失性计算机体统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质界面与总线18相连。存储器可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块42,这些程序模块42被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其他程序模块42以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24、摄像头等)通信,还可与一个或者多个使得医护人员能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其他计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)界面22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)),广域网(WAN)和/或公共网络(例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其他模块通信。应当明白,尽管图3中未示出,可以结合计算机设备12使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元16、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统34等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的基于时序图规则的事件预测的方法。
也即,上述处理单元16执行上述程序时实现:基于时序图规则的事件预测的。
在本发明实施例中,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有实施例提供的基于时序图规则的事件预测的方法:
也即,给程序被处理器执行时实现:基于时序图规则的事件预测的。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机克顿信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦可编程只读存储器(EPOM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言——诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在医护人员计算机上执行、部分地在医护人员计算机上执行、作为一个独立的软件包执行、部分在医护人员计算机上部分在远程计算机上执行或者完全在远程计算机或者服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到医护人员计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种基于时序图规则的事件预测的方法及装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种基于时序图规则的事件预测的方法,其特征在于,包括:
获取时序图数据,并对所述时序图数据加入机器学习模型的事件预测结果得到时序图扩展数据;
依据验证比例从时序图扩展数据中提取用于验证预测规则信赖度的子图;
依据所述时序图扩展数据与所述子图对规则创造者进行训练,得到时序事件预测规则集合;
依据所述时序事件预测规则集合与所述时序图数据获取预测事件集合。
2.根据权利要求1所述的方法,其特征在于,所述依据所述时序图扩展数据以及所述子图对规则创造者进行迭代交互训练,得到时序事件预测规则集合的步骤,包括:
依据所述时序图扩展数据对所述规则创造者进行预训练;
依据所述时序图扩展数据与所述预训练数据对所述规则创造者进行迭代交互训练。
3.根据权利要求2所述的方法,其特征在于,所述依据所述时序图扩展数据对所述规则创造者进行预训练的步骤,包括:
所述规则创造者依据在所述时序图扩展数据中抽取预设位置的局部图结构数据生成若干候选时序事件预测规则;
所述规则创造者依据时序图模型生成所述候选时序事件预测规则的图模式并生成标签,得到图模式的候选时序事件预测规则;
所述规则创造者对所述图模式的候选时序事件预测规则运用层级扩展过程构建逻辑依赖并形成候选时序事件预测规则集合;
规则批评者依据所述子图将所述候选时序事件预测规则集合中,支持度与信赖度高于预设阈值的所述候选时序事件预测规则添加到新集合中生成时序事件预测规则集合。
4.根据权利要求2所述的方法,其特征在于,所述依据所述时序图扩展数据与所述预训练数据对所述规则创造者进行迭代交互训练的步骤,包括:
所述规则创造者依据在所述时序图扩展数据中抽取预设位置的局部图结构数据生成若干候选时序事件预测规则;
所述规则创造者依据时序图模型生成所述候选时序事件预测规则的图模式并生成标签,得到图模式的候选时序事件预测规则;
所述规则创造者对所述图模式的候选时序事件预测规则运用层级扩展过程构建逻辑依赖并形成候选时序事件预测规则集合;
规则批评者依据所述子图将所述候选时序事件预测规则集合中,支持度与信赖度高于预设阈值的所述候选时序事件预测规则添加到新集合中生成时序事件预测规则集合;
所述规则创造者依据所述时序事件预测规则集合改进时序图模型进行迭代训练。
5.根据权利要求4所述的系统,其特征在于,所述迭代训练中使用的所述时序图扩展数据与所述局部图数据均为上一次训练中的结果数据。
6.根据权利要求1所述的方法,其特征在于,所述依据所述时序事件预测规则集合与所述时序图数据获取预测事件集合的步骤,包括:
依据处理器数量对所述时序图数据进行时序划分,得到若干图分块;
对每个图分块分配一个不同的处理器,并指定一个处理器作为协调节点;
在所有所述处理器上并行地调用串行算法,获取所述时序图数据组由所述时序事件预测规则预测的所有事件。
7.根据权利要求6所述的方法,其特征在于,所述依据处理器数量对所述时序图数据进行时序划分,得到若干图分块的步骤,包括:
依据候选时间间隔区间、各个时刻时序图大小的集合、最大时间戳和最小时间戳获取一个针对所述时间间隔区间的分割点集合;
通过一个二维数组采用动态规划依据所述分割点集合与处理器数量确定分割点;
依照所述分割点对所述时序图数据进行时序划分。
8.一种基于时序图规则的事件预测的装置,其特征在于,所述基于时序图规则的事件预测的装置实现如权利要求1至7中任一项所述的基于时序图规则的事件预测的方法的步骤,包括:
获取模块,用于获取时序图数据,并对所述时序图数据加入机器学习模型的事件预测结果得到时序图扩展数据;
子图生成模块,用于依据验证比例从时序图扩展数据中提取用于验证预测规则信赖度的子图;
训练模块,用于依据所述时序图扩展数据与所述子图对规则创造者进行训练,得到时序事件预测规则集合;
事件预测模块,用于依据所述时序事件预测规则集合与所述时序图数据获取预测事件集合。
9.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的基于时序图规则的事件预测的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于时序图规则的事件预测的方法的步骤。
CN202211071435.6A 2022-09-02 2022-09-02 基于时序图规则的事件预测的方法及装置 Pending CN116029408A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211071435.6A CN116029408A (zh) 2022-09-02 2022-09-02 基于时序图规则的事件预测的方法及装置
PCT/CN2022/119241 WO2024045225A1 (zh) 2022-09-02 2022-09-16 基于时序图规则的事件预测的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211071435.6A CN116029408A (zh) 2022-09-02 2022-09-02 基于时序图规则的事件预测的方法及装置

Publications (1)

Publication Number Publication Date
CN116029408A true CN116029408A (zh) 2023-04-28

Family

ID=86076541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211071435.6A Pending CN116029408A (zh) 2022-09-02 2022-09-02 基于时序图规则的事件预测的方法及装置

Country Status (2)

Country Link
CN (1) CN116029408A (zh)
WO (1) WO2024045225A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117077802A (zh) * 2023-06-15 2023-11-17 深圳计算科学研究院 一种时序性数据的排序预测方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697852B (zh) * 2019-01-23 2021-04-02 吉林大学 基于时序交通事件的城市道路拥堵程度预测方法
CN110334213B (zh) * 2019-07-09 2021-05-11 昆明理工大学 基于双向交叉注意力机制的汉越新闻事件时序关系识别方法
CN111367961B (zh) * 2020-02-27 2023-03-28 西安交通大学 基于图卷积神经网络的时序数据事件预测方法、系统及其应用
US11669751B2 (en) * 2020-11-27 2023-06-06 At&T Intellectual Property I, L.P. Prediction of network events via rule set representations of machine learning models
CN114330719A (zh) * 2021-12-24 2022-04-12 中国人民解放军国防科技大学 从事件的时序图中发现关联规则的方法及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117077802A (zh) * 2023-06-15 2023-11-17 深圳计算科学研究院 一种时序性数据的排序预测方法及装置

Also Published As

Publication number Publication date
WO2024045225A1 (zh) 2024-03-07

Similar Documents

Publication Publication Date Title
Huang et al. Knowledge graph embedding based question answering
US11562012B2 (en) System and method for providing technology assisted data review with optimizing features
Rekatsinas et al. Holoclean: Holistic data repairs with probabilistic inference
Zhang et al. DeepDive: Declarative knowledge base construction
WO2023097929A1 (zh) 一种基于改进型kgat模型的知识图谱推荐方法及系统
Leake et al. Towards case-based support for e-science workflow generation by mining provenance
RU2693324C2 (ru) Способ и сервер преобразования значения категориального фактора в его числовое представление
CN113535984A (zh) 一种基于注意力机制的知识图谱关系预测方法及装置
KR20200071877A (ko) 자율 증강형 반복 학습을 이용한 정보 추출 방법 및 시스템
Wang et al. A survey on temporal knowledge graph completion: Taxonomy, progress, and prospects
CN117035073A (zh) 一种基于分层事件发展模式归纳的未来气象事件预测方法
CN116861269A (zh) 工程领域的多源异构数据融合及分析方法
Babur Statistical analysis of large sets of models
Tan et al. Walklm: A uniform language model fine-tuning framework for attributed graph embedding
CN117389542A (zh) 一种工业软件构建方法、装置、电子设备及存储介质
US20160004976A1 (en) System and methods for abductive learning of quantized stochastic processes
CN116029408A (zh) 基于时序图规则的事件预测的方法及装置
CN113076089B (zh) 一种基于对象类型的api补全方法
Nehmeh et al. Integer word-length optimization for fixed-point systems
Jung et al. Crowdsourced truth discovery in the presence of hierarchies for knowledge fusion
CN115700492A (zh) 一种基于图区间神经网络的程序语义表示学习和预测方法
US11797735B1 (en) Regression testing based on overall confidence estimating
Simari et al. Parallel abductive query answering in probabilistic logic programs
LU101238B1 (en) Method for consolidating dynamic knowledge organization systems
Gonçalves et al. $\Upsilon $-DB: A system for data-driven hypothesis management and analytics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination