CN115757826B - 事件图谱构建方法、装置、设备及介质 - Google Patents
事件图谱构建方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN115757826B CN115757826B CN202211452904.9A CN202211452904A CN115757826B CN 115757826 B CN115757826 B CN 115757826B CN 202211452904 A CN202211452904 A CN 202211452904A CN 115757826 B CN115757826 B CN 115757826B
- Authority
- CN
- China
- Prior art keywords
- event
- node
- code set
- candidate
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 52
- 230000003993 interaction Effects 0.000 claims abstract description 43
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000010586 diagram Methods 0.000 claims abstract description 25
- 238000000605 extraction Methods 0.000 claims description 47
- 238000004422 calculation algorithm Methods 0.000 claims description 36
- 238000004590 computer program Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 12
- 238000005096 rolling process Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 description 6
- 238000012935 Averaging Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本公开提供了一种事件图谱构建方法、装置、电子设备及存储介质,其中,该方法包括:获取事件描述文本,识别事件描述文本中包括的实体、句子和触发词;将实体、句子和触发词为节点,各节点之间的交互关系为边,构建面向触发词的篇章级异质交互图;对各节点进行多层图卷积操作,得到候选论元特征编码集、候选触发词特征编码集和句子特征编码集;定义事件路径模板和全局捕捉器;基于句子特征编码集、事件路径模板和全局捕捉器,依次从候选触发词特征编码集和候选论元特征编码集中提取与每条事件路径对应的触发词和多个论元;定义事件路径的名称,将事件路径的事件名称、触发词和多个论元组成三元组,构建事件图谱。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及一种事件图谱构建方法、装置、电子设备及介质。
背景技术
在大数据环境下,人力搜索无法以足够快的速度和稳定的质量从海量数据中掌握事件的来龙去脉。因此,事件图谱构建技术应运而生。事件图谱构建技术使用图谱的方式对事件中的信息进行识别、存储与表示,不仅使得事件信息的统计、分析与展示更加便捷,也为后续推理分析以及去伪存真等应用打下了坚实的基础。
在大部分人工智能系统中,事件图谱的构建需要命名实体识别算法、实体链接算法以及事件抽取算法的支撑。然而,大部分事件图谱的人工系统中各个算法之间是相互独立的。这种事件图谱构建方法虽然能够最大程度的提高各个算法的精度,但在实际使用过程中容易出现算力浪费,大幅增加了模型的训练成本,同时也存在全流程精度不高的问题。
事件抽取是构建事件图谱的关键任务。目前,事件抽取方法多为句子级事件抽取方法和篇章级事件抽取方法。传统的句子级事件抽取方法使用句子内部的文本特征,只能抽取句子内部的事件信息。例如Yaojie Lu等人在2021年提出《Efld-to-end EventExtraction as Controllable Generation》,利用一种将文本转化为事件记录的方式抽取句子中的事件。如果出现一个事件涉及的内容分散在不同的句子中时,句子级事件抽取方法难以捕捉该事件的语义特征,从而造成事件信息提取不完整的问题。常用的篇章级事件抽取方法多为集成式方法,需同时训练多个子任务,例如Weizhong Zhao等人在2021年提出《Anovel joint biomedical event extraction framework via two-level modeling ofdocuments》,利用了一种基于堆叠的多层超图聚合神经网络(Hypergraph AggregationNeural Network,HANN)提取篇章中的事件。但该类方法存在计算资源需求大,模型训练难度大等问题。除此之外,大多数现有的事件抽取方法都需要预先定义事件类型,通过抽取到的事件类型确定事件论元,不再抽取触发词。如果事件类型抽取出现误差,就容易丢失整个事件记录,模型缺少泛化能力和发现新类型事件的能力。
发明内容
鉴于上述问题,本发明提供了一种事件图谱构建方法、装置、电子设备及介质,以解决上述技术问题。
本公开的一个方面提供了一种事件图谱构建方法,包括:获取事件描述文本,识别所述事件描述文本中包括的实体、句子和触发词;将所述实体、所述句子和所述触发词作为节点,以各节点之间的交互关系作为边,构建面向触发词的篇章级异质交互图;对各所述节点进行多层图卷积操作,得到实体节点的候选论元特征编码集、触发词节点的候选触发词特征编码集和句子节点的句子特征编码集;定义事件路径和全局捕捉器,基于所述句子特征编码集、事件路径和全局捕捉器,分别从所述候选触发词特征编码集和所述候选论元特征编码集中提取与每条事件路径对应的触发词和论元,所述论元包括主语、宾语、时间和地点;定义所述事件路径的名称,将所述事件路径的事件名称、触发词和论元组成三元组,构建事件图谱。
可选地,所述获取事件描述文本,识别所述事件描述文本中包括的实体、句子和触发词包括:基于命名实体识别算法识别所述事件描述文本中包括的实体、句子和触发词;将所述实体节点、触发词节点和句子节点分别输入所述命名实体识别模型,对应得到所述命名实体识别模型的CRF层的前一层的编码输出;计算各所述实体节点、各所述触发词节点和各所述句子节点的编码输出均值,构成所述候选论元初始编码集、所述候选触发词初始编码集和所述句子初始编码集。
可选地,所述方法还包括:利用实体链接算法识别所述事件描述文本中同义不同名的实体和同名不同义的实体;合并所述候选论元初始编码集中同义不同名的实体对应的编码。
可选地,所述合并所述候选论元初始编码集中同义不同名的实体对应的编码包括:计算所述候选论元初始编码集中同义不同名的实体对应的编码的均值,以所述均值替换所述同义不同名的实体的编码。
可选地,所述对各所述节点进行多层图卷积操作,得到实体节点的候选论元特征编码集、触发词节点的候选触发词特征编码集和句子节点的句子特征编码集包括:基于所述候选论元初始编码集、候选触发词初始编码集和所述句子初始编码集分别对各所述节点进行多层图卷积操作,得到各所述节点在每层图卷积操作中的隐层编码,构成各所述节点的特征编码;基于节点类别得到所述候选论元特征编码集、所述候选触发词特征编码集和所述句子特征编码集。
可选地,所述进行多层图卷积操作的计算公式包括:
其中,Re L U()表示激活函数,K表示节点u的邻居节点集合,k表示节点u的邻居节点,du、dk分别为节点u和节点k的度,/>是可训练权重参数,/>表示邻居节点k在第l层图卷积的隐层编码,/>表示节点u在第l+1层图卷积的隐层编码。
可选地,基于所述句子特征编码集、事件路径模板内角色的定义顺序和全局捕捉器,依次从所述候选触发词特征编码集和所述候选论元特征编码集中提取与每条事件路径对应的触发词和多个论元,所述全局捕捉器随着所述事件路径内角色的更新而更新,包括:根据所述事件路径模板内角色的定义顺序,依次将对应的角色信息融入所述候选触发词特征编码集或所述候选论元特征编码集,分别与所述句子特征编码集、所述事件路径模板和所述全局捕捉器进行矩阵拼接,并进行线性映射,得到维度为1的特征向量;对所述特征向量内的元素进行二分类,判定所述元素对应的触发词或论元是否属于所述事件路径,以获取所述事件路径的触发词或论元。
本公开的第二个方面提供了一种事件图谱构建装置,包括:元素识别模块,用于获取事件描述文本,识别所述事件描述文本中包括的实体、句子和触发词;异质交互图构建模块,用于将所述实体、所述句子和所述触发词作为节点,以各节点之间的交互关系作为边,构建面向触发词的篇章级异质交互图;特征提取模块,用于对各所述节点进行多层图卷积操作,得到实体节点的候选论元特征编码集、触发词节点的候选触发词特征编码集和句子节点的句子特征编码集;模板定义模块,用于定义事件路径模板和全局捕捉器,所述事件路径模板内的角色包括触发词和多个论元,所述多个论元包括主语、宾语、时间和地点;事件路径捕捉模块,用于基于所述句子特征编码集、事件路径模板内角色的定义顺序和全局捕捉器,依次从所述候选触发词特征编码集和所述候选论元特征编码集中提取与每条事件路径对应的触发词和多个论元,所述全局捕捉器随着所述事件路径内角色的更新而更新;事件图谱构建模块,用于定义所述事件路径的名称,将所述事件路径的事件名称、触发词和多个论元组成三元组,构建事件图谱。
本公开的第三个方面提供了一种电子设备,包括:存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现第一方面中的任一项所述事件图谱构建方法中的各个步骤。
本公开的第四个方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现第一方面中的任一项事件图谱构建方法中的各个步骤。
在本公开实施例采用的上述至少一个技术方案能够达到以下有益效果:
本公开实施例提供了一种事件图谱构建方法,该方法将命名实体识别和实体链接算法从事件抽取算法中剥离出来,充分利用了图谱构建必需的命名实体识别算法和实体链接算法的结果,为事件抽取算法提供支撑。这种流程式的方式,降低了事件抽取模型的复杂度,使模型可以快速拟合,提升了模型的性能。更有利于获取到文本数据后,快速、实时的生成事件图谱。该方法还提出一种面向触发词的篇章级异质交互图,增强了句子与触发词、论元与触发词之间的关系。构建异质交互图时,引入了实体链接算法,避免部分实体同名不同义和同义不同名对交互图的影响,增强了交互图对整篇文章的语义特征表示。该方法还提出了基于统一事件模板的树形事件论元抽取方式,统一所有事件类型,以触发词引导事件抽取,从未预先定义的事件也可以被抽取出来,避免了需要预先定义事件类型的问题。因为无需抽取事件类型,在降低了模型训练难度的同时,增强了事件抽取模型的泛化能力和发现新类型事件的能力。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了本公开实施例提供的一种事件图谱构建方法的流程图;
图2示意性示出了本公开实施例提供的一种事件图谱构建方法的流程示意图;
图3是本公开实施例提供的一种篇章级异质交互图的示意图;
图4是本公开实施例提供的基于事件路径模板的形成的树形事件论元抽取示意图;
图5是本公开实施例提供的事件图谱示例图的示意图;
图6示意性示出了本公开实施例提供的一种事件图谱构建装置的结构框图;
图7示意性示出了本公开实施例提供的一种电子设备的结构框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。
因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。在本公开的上下文中,计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。计算机可读介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
本公开创新的提供了一种基于事件抽取算法的流程式事件图谱构建技术,首先,利用命名实体识别算法获取每个句子中的实体作为篇章级事件抽取算法所需的候选论元,获取句子的编码构建候选论元的语义编码表示和句子的语义编码表示,然后利用已有的句法分析树获取每个句子中的动词作为篇章级事件抽取算法所需的候选触发词并获取其对应的语义编码表示;利用实体链接算法(Entity Linking,简称EL)消除实体歧义,利用多层图卷积网络(multi-layer Graph Convolution Network,简称GCN),获取富含篇章语义特征的候选论元、候选触发词和句子的编码特征;基于统一事件模板的树形事件论元抽取方式,先从候选触发词中提取触发词作为有序树的开始节点,再从候选论元中逐步提取主语、宾语、时间、地点四个关键事件论元;最后,将触发词与提取到的主语、宾语、时间、地点四个关键事件论元分别组成三元组存储在图数据库中。
图1示意性示出了本公开实施例提供的一种事件图谱构建方法的流程图,图2示意性示出了本公开实施例提供的一种事件图谱构建方法的流程示意图。
如图1和图2所示,本公开实施例提供的一种事件图谱构建方法包括S110~S160。
S110,获取事件描述文本,识别事件描述文本中包括的实体、句子和触发词。
在本实施例中,可以利用命名实体识别算法(Named Entities Recognition,简称NER)获取每个句子和每个句子中的实体,将实体作为篇章级事件抽取算法所需的候选论元,获取句子的编码构建候选论元的语义编码表示和句子的语义编码表示。可以利用已有的句法分析树获取每个句子中的动词作为篇章级事件抽取算法所需的候选触发词并获取其对应的语义编码表示。
具体的,S110可以包括S111~S113。
S111,基于命名实体识别算法识别所述事件描述文本中包括的实体、句子和触发词。
S112,将所述实体节点、触发词节点和句子节点分别输入所述命名实体识别模型,对应得到所述命名实体识别模型的CRF层的前一层的编码输出。
S113,计算各所述实体节点、各所述触发词节点和各所述句子节点的编码输出均值,构成所述候选论元初始编码集、所述候选触发词初始编码集和所述句子初始编码集。
在本实施例中,可以使用句号、问好、感叹号、省略号等标点符号将文本数据进行分割,获得文本句子集S={s1,s2...,sn}。对获取到的句子,使用已有的命名实体识别技术自动识别数据中的实体获得实体集作为篇章级事件抽取的候选论元集R={r1,r2...,ri}。例如,有文本数据“张三出生于上海,毕业后去百度任职”,凭借NER技术可标注实体“张三(人名)”,“上海(地名)”及“百度(机构名)”。
根据识别到的候选论元集R和NER模型中CRF层的前一层输出,获得候选论元编码集公式如下:
其中,表示第i个候选论元的编码,gi表示NER模型中第i个候选论元在CRF层前一层对应位置的编码,Mean()函数表示对函数的输入求平均值。
根据获得的文本句子集S和NER模型中CRF层的前一层输出,获得句子语义编码集公式如下:
其中,表示第n个句子的编码,gn表示第n个句子在NER模型中CRF层的前一层的编码输出,Mean()函数表示对函数的输入求平均值。
在本实施例中,可以利用已有的句法分析树获取每个句子中的动词作为篇章级事件抽取算法所需的候选触发词并获取其对应的语义编码。利用句法分析树获得每个句子的动词组成动词集V={v1,v2...,vj},作为篇章级事件抽取算法所需的候选触发词,再利用命名实体识别模型中CRF层的前一层输出获取候选触发词编码集公式如下:
其中,表示第j个候选触发词的编码,gj表示第j个动词在NER模型中CRF层的前一层对应位置的输出,Mean()函数表示对函数的输入求平均值。
进一步的,在S110还可以包括S114~S115。
S114,利用实体链接算法识别所述事件描述文本中同义不同名的实体和同名不同义的实体。
利用实体链接算法识别所述事件描述文本中同义不同名的实体和同名不同义的实体,可以避免部分实体同名不同义和同义不同名对交互图的影响,增强了交互图对整篇文章的语义特征表示。
例如,文本数据为“我一边吃着苹果,一边用苹果手机打电话,我的朋友又递给了我一个苹果让我吃”,其中包括三个实体提及“苹果”,利用实体链接算法可得到第一个“苹果”和第三个“苹果”关联的是同一个实体,是一种水果类别的实体,而第二个“苹果”关联的是物品类别的手机。
S115,合并所述候选论元初始编码集中同义不同名的实体对应的编码。
具体的,S115可以为:计算所述候选论元初始编码集中同义不同名的实体对应的编码的均值,以所述均值替换所述同义不同名的实体的编码。公式如下:
其中,Mean()函数代表对多个编码求平均,N表示指向同一实体的所有候选论元集合,表示第n个候选论元的编码。
利用上述公式,对关联同一实体的所有候选论元的编码表示求平均,得到该候选论元的新编码表示,新的编码表示融合了该候选论元在不同句子中的的语义信息。
S120,将实体、句子和触发词作为节点,以各节点之间的交互关系作为边,构建面向触发词的篇章级异质交互图。
参考图3,图3是本公开实施例提供的一种篇章级异质交互图的示意图,在本实施例中,构建面向触发词的篇章级异质交互图,将候选论元、候选触发词、句子分别定义为异质图的节点u,并定义6种类型的交互边,即句子-句子交互边(如图3中句子1和句子2的边),句子-触发词交互边(如图3中句子1和触发词1的边),触发词-触发词交互边(如图3中触发词3与触发词3的边),触发词-实体交互边(如图3中触发词3与实体D的边),实体-实体(句内)交互边(如图3中实体A与实体B的边),实体-实体(句间)交互边(如图3中实体C与实体D的边)。
构建向触发词的篇章级异质交互图可以增强句子与触发词、论元与触发词之间的关系。
S130,对各节点进行多层图卷积操作,得到实体节点的候选论元特征编码集、触发词节点的候选触发词特征编码集和句子节点的句子特征编码集。
在S130中,基于所述候选论元初始编码集、候选触发词初始编码集和所述句子初始编码集分别对各所述节点进行多层图卷积操作,得到各所述节点在每层图卷积操作中的隐层编码,构成各所述节点的特征编码。进行多层图卷积操作的计算公式包括:
其中,Re L U()表示激活函数,K表示节点u的邻居节点集合,k表示节点u的邻居节点,du、dk分别为节点u和节点k的度,/>是可训练权重参数,/>表示邻居节点k在第l层图卷积的隐层编码,/>表示节点u在第l+1层图卷积的隐层编码。
基于上述公式,即可得到得到异质交互图中各个节点最后的隐藏状态表示:
其中,是节点u的初始节点嵌入,l是多层图卷积中的层数。上述公式得到的hu表示经过图卷积后,融合了全局上下文语义特征表示的节点u编码。
基于节点类别,将实体节点、句子节点、触发词节点的编码分类构成集合,得到所述候选论元特征编码集、所述候选触发词特征编码集和所述句子特征编码集。其中,候选论元特征编码集可以表示为候选触发词特征编码集可以表示为/>句子特征编码集可以表示为/>各特征编码集中的node对应了一个节点的隐藏状态。
S140,定义事件路径模板和全局捕捉器,事件路径模板内的角色顺序包括触发词和多个论元,多个论元包括主语、宾语、时间和地点。
在本实施例中,可以定义一个事件路径模板U,具体公式如下:
Ui=[TiA,EiB,EiC,…]
其中,Ui表示第i条路径,TiA如示意图所示为第i条路径的触发词,EiB和EiC分别为第i条路径的主语和宾语,该事件路径模板内还可以包括
定义一个全局捕获器G,具体公式如下:
G=LSTM(Ui)
其中,G为随着事件路径获取到更新角色后利用LSTM编码得到的全局捕获器,Ui作为第i条路径的表示。
S150,基于句子特征编码集、事件路径模板内角色的定义顺序和全局捕捉器,依次从候选触发词特征编码集和候选论元特征编码集中提取与每条事件路径对应的触发词和多个论元,全局捕捉器随着事件路径内角色的更新而更新。
S150具体包括S151~S152。
S151,根据事件路径模板内角色的定义顺序,依次将对应的角色信息融入候选触发词特征编码集或候选论元特征编码集,分别与句子特征编码集、事件路径模板和全局捕捉器进行矩阵拼接,并进行线性映射,得到维度为1的特征向量。
S152,对特征向量内的元素进行二分类,判定元素对应的触发词或论元是否属于事件路径,以获取事件路径的触发词或论元。
在本实施例中,根据事件路径模板内的角色定义顺序,将依次获取Ui=[TiA,EiB,EiC,…]中的触发词、主语、宾语、时间和地点。
按照角色定义顺序,首先会获取事件路径中的触发词。具体的,利用候选触发词特征编码集Te′,融入随机初始化并可训练的触发词角色信息,公式如下:
其中,RoleT为可训练的触发词的角色信息表示。
将融入了触发词角色信息的触发词特征编码具备篇章级实体特征与关联关系的句子特征编码集Se′以及事件路径U和全局捕捉器G进行矩阵拼接,通过已有的Transformer编码器得到一个全新的特征矩阵/>公式表示为:
其中,为融入了触发词角色信息的特征编码,Se′为句子特征编码,Ui为第i条事件路径表示,G为全局捕获器。
为了进行各个候选触发词的二分类任务,将进行线性映射,经过一层全连接层得到维度为1的/>
利用已有的逻辑回归算法进行二分类,判定各个候选触发词是否为当前路径的触发词TRIGGER,由此获得一条事件路径的触发词,具体公式如下:
其中,为S44得到的/>经过一层全连接层得到的值,/>表示候选触发词是当前路径触发词的概率。
在获取到一条事件路径的触发词的基础上,更新全局捕捉器,将上述操作过程中的候选触发词编码Te′更改为候选论元编码Re′,从候选论元中依次获得该事件路径上的论元ROLE(例如主语、宾语、地点和时间)。
图4是本公开实施例提供的基于事件路径模板的形成的树形事件论元抽取示意图。
参考图4,根据本公开实施例的S150,基于事件路径模板,从候选触发词中提取触发词作为事件路径的有序树的开始节点,再从候选论元中逐步提取主语、宾语、时间、地点四个关键事件论元,以获取完整的事件路径。该方法基于统一事件模板的树形事件论元抽取方式,统一所有事件类型,以触发词引导事件抽取,从未预先定义的事件也可以被抽取出来,避免了需要预先定义事件类型的问题。因为无需抽取事件类型,在降低了模型训练难度的同时,增强了事件抽取模型的泛化能力和发现新类型事件的能力。
S160,定义事件路径的名称,将事件路径的事件名称、触发词和多个论元组成三元组,构建事件图谱。
在本实施例中,在获取到各个事件路径之后,基于各事件路径包括的触发词,可以定义事件名称,比如触发词为“撤离”的事件,其事件名称为“撤离事件”。之后,将事件名称与提取到的触发词、主语、宾语、时间、地点分别与事件名称组成三元组,构建出事件图谱并存储在图数据库中。
图5是本公开实施例提供的事件图谱示例图的示意图。
如图5所示,基于事件名称、触发词和多个论元组成的事件图谱可以清晰的展示该事件的关键内容,而且能够反应各个事件之间的关联关系。
基于上述技术方案可知,本公开提供的面向文本数据的流程式事件图谱构建方法相对于现有技术至少具有如下增益效果的一部分:
本公开提供的事件图谱构建方法将命名实体识别和实体链接算法从事件抽取算法中剥离出来,充分利用了图谱构建必需的命名实体识别算法和实体链接算法的结果,为事件抽取算法提供支撑。这种流程式的方式,降低了事件抽取模型的复杂度,使模型可以快速拟合,提升了模型的性能。更有利于获取到文本数据后,快速、实时的生成事件图谱。
该事件图谱构建方法还提出一种面向触发词的篇章级异质交互图,增强了句子与触发词、论元与触发词之间的关系。构建异质交互图时,引入了实体链接算法,避免部分实体同名不同义和同义不同名对交互图的影响,增强了交互图对整篇文章的语义特征表示。
该事件图谱构建方法还提出了基于统一事件模板的树形事件论元抽取方式,统一所有事件类型,以触发词引导事件抽取,从未预先定义的事件也可以被抽取出来,避免了需要预先定义事件类型的问题。因为无需抽取事件类型,在降低了模型训练难度的同时,增强了事件抽取模型的泛化能力和发现新类型事件的能力。
图6示意性示出了本公开实施例提供的一种事件图谱构建装置的结构框图。
如图6所示,本公开实施例提供的一种事件图谱构建装置600包括:元素识别模块610、异质交互图构建模块620、特征提取模块630、模板定义模块640、事件路径捕捉模块650和事件图谱构建模块660。
元素识别模块610用于获取事件描述文本,识别事件描述文本中包括的实体、句子和触发词。
异质交互图构建模块620用于将实体、句子和触发词作为节点,以各节点之间的交互关系作为边,构建面向触发词的篇章级异质交互图。
特征提取模块630用于对各节点进行多层图卷积操作,得到实体节点的候选论元特征编码集、触发词节点的候选触发词特征编码集和句子节点的句子特征编码集。
模板定义模块640用于定义事件路径模板和全局捕捉器,事件路径模板内的角色顺序包括触发词和多个论元,多个论元包括主语、宾语、时间和地点。
事件路径捕捉模块650用于基于句子特征编码集、事件路径模板内角色的定义顺序和全局捕捉器,依次从候选触发词特征编码集和候选论元特征编码集中提取与每条事件路径对应的触发词和多个论元,全局捕捉器随着事件路径内角色的更新而更新。
事件图谱构建模块660用于定义事件路径的名称,将事件路径的事件名称、触发词和多个论元组成三元组,构建事件图谱。
可以理解的是,元素识别模块610、异质交互图构建模块620、特征提取模块630、模板定义模块640、事件路径捕捉模块650和事件图谱构建模块660可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本发明的实施例,元素识别模块610、异质交互图构建模块620、特征提取模块630、模板定义模块640、事件路径捕捉模块650和事件图谱构建模块660中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以以对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式的适当组合来实现。或者,元素识别模块610、异质交互图构建模块620、特征提取模块630、模板定义模块640、事件路径捕捉模块650和事件图谱构建模块660中的至少一个可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。
图7示意性示出了本公开实施例提供的一种电子设备的结构框图。
如图7所示,本实施例中所描述的电子设备,包括:电子设备700包括处理器710、计算机可读存储介质720。该电子设备700可以执行上面参考图1描述的方法,以实现对特定操作的检测。
具体地,处理器710例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器710还可以包括用于缓存用途的板载存储器。处理器710可以是用于执行参考图1描述的根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质720,例如可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
计算机可读存储介质720可以包括计算机程序721,该计算机程序721可以包括代码/计算机可执行指令,其在由处理器710执行时使得处理器710执行例如上面结合图1所描述的方法流程及其任何变形。
计算机程序721可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序721中的代码可以包括一个或多个程序模块,例如包括721A、模块721B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器710执行时,使得处理器710可以执行例如上面结合图1所描述的方法流程及其任何变形。
根据本发明的实施例,元素识别模块610、异质交互图构建模块620、特征提取模块630、模板定义模块640、事件路径捕捉模块650和事件图谱构建模块660中的至少一个可以实现为参考图7描述的计算机程序模块,其在被处理器710执行时,可以实现上面描述的相应操作。
本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。
Claims (10)
1.一种事件图谱构建方法,其特征在于,包括:
获取事件描述文本,识别所述事件描述文本中包括的实体、句子和触触发词;
将所述实体、所述句子和所述触发词作为节点,以各节点之间的交互关系作为边,构建面向触发词的篇章级异质交互图;
对各所述节点进行多层图卷积操作,得到实体节点的候选论元特征编码集、触发词节点的候选触发词特征编码集和句子节点的句子特征编码集;
定义事件路径模板和全局捕捉器,所述事件路径模板内的角色顺序包括触发词和多个论元,所述多个论元包括主语、宾语、时间和地点;
基于所述句子特征编码集、事件路径模板内角色的定义顺序和全局捕捉器,依次从所述候选触发词特征编码集和所述候选论元特征编码集中提取与每条事件路径对应的触发词和多个论元,所述全局捕捉器随着所述事件路径内角色的更新而更新;
定义所述事件路径的名称,将所述事件路径的事件名称、触发词和多个论元组成三元组,构建事件图谱。
2.根据权利要求1所述的方法,其特征在于,所述获取事件描述文本,识别所述事件描述文本中包括的实体、句子和触发词包括:
基于命名实体识别算法识别所述事件描述文本中包括的实体、句子和触发词;
将所述实体节点、触发词节点和句子节点分别输入所述命名实体识别模型,对应得到所述命名实体识别模型的CRF层的前一层的编码输出;
计算各所述实体节点、各所述触发词节点和各所述句子节点的编码输出均值,构成候选论元初始编码集、候选触发词初始编码集和句子初始编码集。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
利用实体链接算法识别所述事件描述文本中同义不同名的实体和同名不同义的实体;
合并所述候选论元初始编码集中同义不同名的实体对应的编码。
4.根据权利要求3所述的方法,其特征在于,所述合并所述候选论元初始编码集中同义不同名的实体对应的编码包括:
计算所述候选论元初始编码集中同义不同名的实体对应的编码的均值,以所述均值替换所述同义不同名的实体的编码。
5.根据权利要求2所述的方法,其特征在于,所述对各所述节点进行多层图卷积操作,得到实体节点的候选论元特征编码集、触发词节点的候选触发词特征编码集和句子节点的句子特征编码集包括:
基于所述候选论元初始编码集、所述候选触发词初始编码集和所述句子初始编码集分别对各所述节点进行多层图卷积操作,得到各所述节点在每层图卷积操作中的隐层编码,构成各所述节点的特征编码;
基于节点类别得到所述候选论元特征编码集、所述候选触发词特征编码集和所述句子特征编码集。
6.根据权利要求5所述的方法,其特征在于,所述进行多层图卷积操作的计算公式包括:
其中,ReLU()表示激活函数,K表示节点u的邻居节点集合,k表示节点u的邻居节点,du、dk分别为节点u和节点k的度,/>是可训练权重参数,/>表示邻居节点k在第l层图卷积的隐层编码,/>表示节点u在第l+1层图卷积的隐层编码。
7.根据权利要求1所述的方法,其特征在于,所述基于所述句子特征编码集、事件路径模板内角色的定义顺序和全局捕捉器,依次从所述候选触发词特征编码集和所述候选论元特征编码集中提取与每条事件路径对应的触发词和多个论元,所述全局捕捉器随着所述事件路径内角色的更新而更新,包括:
根据所述事件路径模板内角色的定义顺序,依次将对应的角色信息融入所述候选触发词特征编码集或所述候选论元特征编码集,分别与所述句子特征编码集、所述事件路径模板和所述全局捕捉器进行矩阵拼接,并进行线性映射,得到维度为1的特征向量;
对所述特征向量内的元素进行二分类,判定所述元素对应的触发词或论元是否属于所述事件路径,以获取所述事件路径的触发词或论兀。
8.一种事件图谱构建装置,其特征在于,包括:
元素识别模块,用于获取事件描述文本,识别所述事件描述文本中包括的实体、句子和触发词;
异质交互图构建模块,用于将所述实体、所述句子和所述触发词作为节点,以各节点之间的交互关系作为边,构建面向触发词的篇章级异质交互图;
特征提取模块,用于对各所述节点进行多层图卷积操作,得到实体节点的候选论元特征编码集、触发词节点的候选触发词特征编码集和句子节点的句子特征编码集;
模板定义模块,用于定义事件路径模板和全局捕捉器,所述事件路径模板内的角色顺序包括触发词和多个论元,所述多个论元包括主语、宾语、时间和地点;
事件路径捕捉模块,用于基于所述句子特征编码集、事件路径模板内角色的定义顺序和全局捕捉器,依次从所述候选触发词特征编码集和所述候选论元特征编码集中提取与每条事件路径对应的触发词和多个论元,所述全局捕捉器随着所述事件路径内角色的更新而更新;
事件图谱构建模块,用于定义所述事件路径的名称,将所述事件路径的事件名称、触发词和多个论元组成三元组,构建事件图谱。
9.一种电子设备,包括:存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现权利要求1至7中的任一项所述事件图谱构建方法中的各个步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至7中的任一项事件图谱构建方法中的各个步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211452904.9A CN115757826B (zh) | 2022-11-18 | 2022-11-18 | 事件图谱构建方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211452904.9A CN115757826B (zh) | 2022-11-18 | 2022-11-18 | 事件图谱构建方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115757826A CN115757826A (zh) | 2023-03-07 |
CN115757826B true CN115757826B (zh) | 2024-01-05 |
Family
ID=85333155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211452904.9A Active CN115757826B (zh) | 2022-11-18 | 2022-11-18 | 事件图谱构建方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115757826B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111897908A (zh) * | 2020-05-12 | 2020-11-06 | 中国科学院计算技术研究所 | 融合依存信息和预训练语言模型的事件抽取方法及系统 |
US10831452B1 (en) * | 2019-09-06 | 2020-11-10 | Digital Asset Capital, Inc. | Modification of in-execution smart contract programs |
CN112632230A (zh) * | 2020-12-30 | 2021-04-09 | 中国科学院空天信息创新研究院 | 一种基于多层级图网络的事件联合抽取方法及装置 |
CN112966079A (zh) * | 2021-03-02 | 2021-06-15 | 中国电子科技集团公司第二十八研究所 | 一种用于对话系统的面向事件画像的文本分析方法 |
CN114330366A (zh) * | 2021-12-30 | 2022-04-12 | 科大讯飞华南人工智能研究院(广州)有限公司 | 事件抽取方法及相关装置、电子设备和存储介质 |
CN114661881A (zh) * | 2022-03-30 | 2022-06-24 | 中国科学院空天信息创新研究院 | 一种基于问答模式的事件抽取方法、装置和设备 |
CN115168541A (zh) * | 2022-07-13 | 2022-10-11 | 山西大学 | 基于框架语义映射和类型感知的篇章事件抽取方法及系统 |
CN115329746A (zh) * | 2022-08-05 | 2022-11-11 | 杭州海康威视数字技术股份有限公司 | 一种事件抽取方法、装置及设备 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009097558A2 (en) * | 2008-01-30 | 2009-08-06 | Thomson Reuters Global Resources | Financial event and relationship extraction |
US9218163B2 (en) * | 2011-06-28 | 2015-12-22 | International Business Machines Corporation | Generating complex event processing rules |
US10956468B2 (en) * | 2017-11-30 | 2021-03-23 | International Business Machines Corporation | Cognitive template question system |
US11947914B2 (en) * | 2020-06-30 | 2024-04-02 | Microsoft Technology Licensing, Llc | Fact checking based on semantic graphs |
US12086548B2 (en) * | 2020-09-30 | 2024-09-10 | Amazon Technologies, Inc. | Event extraction from documents with co-reference |
US11669680B2 (en) * | 2021-02-02 | 2023-06-06 | International Business Machines Corporation | Automated graph based information extraction |
US11893345B2 (en) * | 2021-04-06 | 2024-02-06 | Adobe, Inc. | Inducing rich interaction structures between words for document-level event argument extraction |
-
2022
- 2022-11-18 CN CN202211452904.9A patent/CN115757826B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10831452B1 (en) * | 2019-09-06 | 2020-11-10 | Digital Asset Capital, Inc. | Modification of in-execution smart contract programs |
CN111897908A (zh) * | 2020-05-12 | 2020-11-06 | 中国科学院计算技术研究所 | 融合依存信息和预训练语言模型的事件抽取方法及系统 |
CN112632230A (zh) * | 2020-12-30 | 2021-04-09 | 中国科学院空天信息创新研究院 | 一种基于多层级图网络的事件联合抽取方法及装置 |
CN112966079A (zh) * | 2021-03-02 | 2021-06-15 | 中国电子科技集团公司第二十八研究所 | 一种用于对话系统的面向事件画像的文本分析方法 |
CN114330366A (zh) * | 2021-12-30 | 2022-04-12 | 科大讯飞华南人工智能研究院(广州)有限公司 | 事件抽取方法及相关装置、电子设备和存储介质 |
CN114661881A (zh) * | 2022-03-30 | 2022-06-24 | 中国科学院空天信息创新研究院 | 一种基于问答模式的事件抽取方法、装置和设备 |
CN115168541A (zh) * | 2022-07-13 | 2022-10-11 | 山西大学 | 基于框架语义映射和类型感知的篇章事件抽取方法及系统 |
CN115329746A (zh) * | 2022-08-05 | 2022-11-11 | 杭州海康威视数字技术股份有限公司 | 一种事件抽取方法、装置及设备 |
Non-Patent Citations (3)
Title |
---|
CNN-ELM 混合短文本分类模型;韩众和等;《计算机应用研究》;第663-667、672页 * |
Wenjuan Luo等.Dynamic Heterogeneous Graph Neural Network for Real-time Event Prediction.《KDD '20: Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining》.2020,第3213–3223页. * |
利用门控机制融合依存与语义信息的事件检测方法;陈佳丽等;《中文信息学报》;第51-60页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115757826A (zh) | 2023-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112084331B (zh) | 文本处理、模型训练方法、装置、计算机设备和存储介质 | |
US11544550B2 (en) | Analyzing spatially-sparse data based on submanifold sparse convolutional neural networks | |
CN111602147B (zh) | 基于非局部神经网络的机器学习模型 | |
US20210397980A1 (en) | Information recommendation method and apparatus, electronic device, and readable storage medium | |
US10026021B2 (en) | Training image-recognition systems using a joint embedding model on online social networks | |
US10922609B2 (en) | Semi-supervised learning via deep label propagation | |
US20190188285A1 (en) | Image Search with Embedding-based Models on Online Social Networks | |
US20190114362A1 (en) | Searching Online Social Networks Using Entity-based Embeddings | |
US10678786B2 (en) | Translating search queries on online social networks | |
US20190108282A1 (en) | Parsing and Classifying Search Queries on Online Social Networks | |
US20180089542A1 (en) | Training Image-Recognition Systems Based on Search Queries on Online Social Networks | |
US11586838B2 (en) | End-to-end fuzzy entity matching | |
CN108647800B (zh) | 一种基于节点嵌入的在线社交网络用户缺失属性预测方法 | |
US20240086731A1 (en) | Knowledge-graph extrapolating method and system based on multi-layer perception | |
US11727686B2 (en) | Framework for few-shot temporal action localization | |
EP3769270A1 (en) | A method, an apparatus and a computer program product for an interpretable neural network representation | |
Huang et al. | Location prediction for tweets | |
CN112861474B (zh) | 一种信息标注方法、装置、设备及计算机可读存储介质 | |
Namdarpour et al. | Using genetic programming on GPS trajectories for travel mode detection | |
Lee et al. | Mobile context inference using two-layered Bayesian networks for smartphones | |
CN115757826B (zh) | 事件图谱构建方法、装置、设备及介质 | |
US20230018525A1 (en) | Artificial Intelligence (AI) Framework to Identify Object-Relational Mapping Issues in Real-Time | |
CN114579876A (zh) | 虚假信息检测方法、装置、设备及介质 | |
CN112149692B (zh) | 基于人工智能的视觉关系识别方法、装置及电子设备 | |
US11829735B2 (en) | Artificial intelligence (AI) framework to identify object-relational mapping issues in real-time |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |