CN113111184B - 基于显式事件结构知识增强的事件检测方法及终端设备 - Google Patents
基于显式事件结构知识增强的事件检测方法及终端设备 Download PDFInfo
- Publication number
- CN113111184B CN113111184B CN202110461202.6A CN202110461202A CN113111184B CN 113111184 B CN113111184 B CN 113111184B CN 202110461202 A CN202110461202 A CN 202110461202A CN 113111184 B CN113111184 B CN 113111184B
- Authority
- CN
- China
- Prior art keywords
- event
- knowledge
- graph
- node
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 57
- 238000004364 calculation method Methods 0.000 claims abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000001914 filtration Methods 0.000 claims abstract description 12
- 238000010276 construction Methods 0.000 claims abstract description 4
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000003780 insertion Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 2
- 238000012360 testing method Methods 0.000 description 10
- 238000012549 training Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Machine Translation (AREA)
Abstract
本发明提供一种基于显式事件结构知识增强的事件检测方法,包括如下步骤:根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件背景知识图,实现对事件结构显式地构建事件检测模型;将事件背景知识图中的事件结构的知识与输入句子进行动态知识匹配,构建属于所述输入句子的包含高度相关的事件背景知识的子图;对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示;将所述包含事件结构的知识的信息的图表示输入事件检测分类器中,确定事件触发词的类别,从而确定所述输入句子对应的事件类型。本发明提升了歧义触发词和生僻触发词的检测准确率和召回率,从而提升事件触发词的检测效果。
Description
技术领域
本发明涉及自然语言处理技术领域,尤其是涉及基于显式事件结构知识增强的事件检测方法。
背景技术
事件检测旨在从非结构化的文本中识别特定类型的事件,但现有的事件检测任务中对于带有歧义的触发词和生僻触发词存在检测效率低下的问题,事件检测中的歧义触发词和生僻触发词示例如图1所示。由于自然语言自身带有一定的多样性和歧义性,相同的事件触发词可能会根据上下文语境的不同从而代表不同的事件类别。在没有其他额外的知识或信息作为参考的情况下,歧义触发词可能会导致事件检测系统错误地对触发词的事件类别进行标记。现有技术为解决歧义触发词的问题,通常对上下文中其他事件元素的信息进行学习,而并没有对事件自身的结构知识进行探索与利用。对事件检测任务来说,识别生僻触发词等未在训练数据集中出现过的事件触发词同样也是一项艰巨的挑战。现有的事件检测模型通常通过学习同种事件类型下其他事件触发词的通用知识来检测生僻触发词。因此,如何从其他事件中选择更合适的通用知识,并采用全方位的事件结构知识来增强生僻触发词的向量表示仍然值得探索。
发明内容
本发明的目的在于提供一种基于显式事件结构知识增强的事件检测方法,以解决歧义触发词和生僻触发词检测准确率和召回率低的技术问题。
为实现上述目的,本发明采用下述技术方案:
一种基于显式事件结构知识增强的事件检测方法,其特征在于,包括如下步骤:
S1:根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件背景知识图,实现对事件结构显式地构建事件检测模型;
S2:将所述事件背景知识图中的事件结构的知识与输入句子进行动态知识匹配,构建属于所述输入句子的包含高度相关的事件背景知识的子图;
S3:对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示;
S4:将所述包含事件结构的知识的信息的图表示输入事件检测分类器中,确定事件触发词的类别,并根据事件触发词的类别确定所述输入句子对应的事件类型。
在一些实施例中,所述事件背景知识图的构建步骤包括:
S1.1:将事件触发词和事件论元的文字作为所述事件背景知识图的文本节点,将事件触发词和事件论元角色的注释标签作为知识节点;
S1.2:将各文本节点和知识节点分别进行连接,分别对事件触发词、事件论元和事件注释之间的关系,文本之间的关系,事件中的核心元素之间的关系,进行事件检测模型的构建;
在一些实施例中,各文本节点和知识节点的连接方式包括:
根据事件结构将对应的文本节点与知识节点进行纵向连接;
将事件触发词的文本节点与事件论元的文本节点进行文本横向连接;
将事件触发词的知识节点与同一事件内的其他论元角色的知识节点进行知识横向连接。
在一些实施例中,所述动态知识匹配的步骤包括:
S2.1:将所述事件背景知识图中事件触发词相关的背景知识与所述输入句子中的潜在事件触发词进行匹配;计算所述潜在事件触发词与所述事件背景知识图中事件触发词文本节点之间的事件触发词语义相似度得分;
S2.2:选择所述事件触发词语义相似度得分最高的前k个潜在事件触发词作为候选事件触发词,并将所述候选事件触发词的文本节点所匹配的知识节点的事件类型作为输入句子的候选事件类型;
S2.3:将输入句子中的潜在事件论元与所述事件背景知识图中的事件论元文本节点进行匹配;计算出所述潜在事件论元与所述事件背景知识图中事件论元文本节点之间的事件论元语义相似度得分;
S2.4:选择所述事件论元语义相似度得分得分最高的前k个潜在事件论元,基于所述步骤S2.2获得的所述候选事件类型,选择属于所述候选事件类型的事件论元角色作为输入句子中所述事件论元的知识节点;
S2.5:采用所述步骤S1.1-S1.3的方法构建所述输入句子的子图。
在一些实施例中,所述事件触发词语义相似度得分的计算公式为:
simtrg(wti,tnj)=cosine(E(wti),E(tnj))
其中,wti表示输入句子中的一个潜在事件触发词,tnj表示事件背景知识图中存在的与潜在事件触发词相同的事件触发词文本节点,cosine表示余弦相似度计算,E表示通过ELMo模型获取的词嵌入;
当所述潜在事件触发词未存在于所述事件背景知识图中时,所述事件触发词语义相似度得分的计算公式为:
simtrg(wti,tnj)=α*cosine(E(wti),E(tnj))+(1-α)*cosine(E(st),E(stn))
其中α是人工设置的可调权重,st和stn是输入句子中词语的ELMO嵌入的平均值;
在一些实施例中,所述事件论元语义相似度得分的计算公式为:
simarg(ek,enq)=cosine(E(ak),E(anq))
其中,
E(qnq)=[E(tnj),E(enq)]
上述公式中,E(wti)表示输入句子中的候选事件触发词wti的词嵌入,E(ek)表示实体ek的词嵌入,E(ak)表示输入句子中的潜在事件论元,E(tnj)表示获得的候选事件触发词文本节点的嵌入,E(enq)表示同一事件类型中的论元角色文本节点enq的嵌入,E(anq)表示事件背景知识图中的事件论元。
在一些实施例中,其特征在于,对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示的步骤包括:
S3.1:将事件背景知识图中的每个事件中的事件触发词和事件论元角色的知识节点之间的连接作为所述每个事件的事件结构模式,预先设置一个次数作为阈值,再统计事件背景知识图中的所有事件结构模式,将同一事件中出现次数超过所述阈值的事件结构模式判定为高频事件结构模式;
S3.2:通过事件选择路径机制对所述子图进行过滤;
S3.3:通过文本编码器对所述子图中的文本节点进行编码;通过知识编码器对所述子图中的知识节点进行编码;
S3.4:通过对所述边添加权重门来进一步更新边的权重并进行学习;再将所述子图的节点编码与边的权重输入多层图卷积神经网络,通过图卷积计算得到所述输入句子的图嵌入并进行学习,得到包含事件结构的知识的信息的图表示。
在一些实施例中,通过事件选择路径机制对所述子图进行过滤的方式为:
当所述输入句子的子图中的候选事件的事件结构模式属于高频事件结构模式时,则保留所述子图中的所述候选事件的知识节点与事件结构模式,并对所述子图中连接文本节点和知识节点的边的权重进行初始化,初始化的值为所述潜在事件论元语义相似度得分,对于所述子图中文本节点与文本节点、知识节点与知识节点横向连接的边,将边的权重初始化为1;当所述输入句子的子图中的候选事件的事件结构模式不属于高频事件结构模式时,则将所述子图中连接文本节点和知识节点之间的边的权重设置为0,对于所述子图中文本节点与文本节点、知识节点与知识节点横向连接的边,将边的权重初始化为0;边的权重为0的,表示被过滤的候选事件结构。
在一些实施例中,对于所述子图中属于高频事件结构模式的事件背景知识中的非事件类型,设置表示非事件类型的知识节点,并将所述非事件类型的知识节点添加到每个候选事件触发词和事件论元的文本节点,以及将边的权重设置为0;对于所述被过滤的候选事件结构中的文本节点,设置表示无事件类型的知识节点,并将所述无事件类型的知识节点添加到每个候选事件触发词和事件论元的文本节点,以及将边的权重设置为1。
本发明还提供一种事件检测终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9任一所述方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-9任一所述方法的步骤。
本发明的有益效果包括:本发明通过显式地利用事件结构的知识提高了事件检测模型对歧义事件触发词和生僻事件触发词检测的准确率与召回率。通过构建事件背景知识图,对包括事件类型、事件触发词、论元角色和事件中的核心元素的事件结构显式地进行建模。在检测输入句子中是否存在事件时,通过动态知识匹配将具有高相关性的事件结构的知识与输入句子中的词和实体进行匹配,并生成子图,通过事件选择路径机制对子图进行过滤,对所述子图进行编码,并通过图卷积计算得到包含事件结构的知识的信息的上下文表示,再通过注意力触发词分类器对事件触发词的类别进行分类,并根据事件触发词的类别确定输入句子对应的事件类型,提升歧义触发词和生僻触发词的检测准确率和召回率,从而提升事件触发词的检测效果。
附图说明
图1是本发明的事件检测中的歧义触发词和生僻触发词示意图。
图2是本发明实施例的事件背景知识图构建示意图。
图3是本发明实施例的事件检测模型结构示意图。
图4是本发明实施例的流程图。
具体实施方式
下面结合附图通过具体实施例对本发明进行详细的介绍,以使更好的理解本发明,但下述实施例并不限制本发明范围。另外,需要说明的是,下述实施例中所提供的图示仅以示意方式说明本发明的基本构思,附图中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的形状、数量及比例可为一种随意的改变,且其组件布局形态也可能更为复杂。
需要说明的是,本实施例中的左、右、上、下、顶、底等方位用语,仅是互为相对概念,或是以产品的正常使用状态为参考的,而不应该认为是具有限制性的。
本实施例提供一种基于显式事件结构知识增强的事件检测方法,通过显式地利用事件触发词、事件论元和事件注释标签对事件自身的结构进行事件检测模型的构建,并动态地将事件结构的知识与输入句子进行匹配构成子图,以提高事件触发词检测的准确率和召回率。
参考图2、图3和图4,本实施例的基于显式事件结构知识增强的事件检测方法包括如下步骤:
S1:构建事件背景知识图
为了显式地对事件结构进行事件检测模型的构建并应用到事件检测中,通过使用文本中的文字与实体和其相关的事件注释来构建事件背景知识图,对包括事件类型、事件触发词、论元角色和事件中的核心元素的事件结构显式地进行事件检测模型的构建。事件中的核心元素是指句子中的作为“事件触发词”的词和作为“事件论元”的实体,如图2中的(a)部分上方的三个文本节点所示。在训练阶段,对于一个事件实例,首先使用事件中事件触发词的文字和事件论元的文字作为图的文本节点。其次,使用事件触发词与事件论元角色的注释标签作为知识节点,事件触发词的知识节点表示为“[事件类型|触发词]”,事件论元角色的知识节点表示为“[事件类型|论元角色]”。如图2所示,“事件论元”是指实体“坦克”,而事件论元角色则代表该事件论元在事件中所扮演的角色,因此事件论元“坦克”在图2中的“攻击”事件中的“事件论元角色”为“攻击者”;“攻击”是事件触发词“开火”的事件类型。
在构建完文本节点与知识节点后,根据事件自身的结构将对应的文本节点与知识节点进行纵向连接,对事件结构中文本与事件触发词知识的关系、实体与事件论元角色知识的关系进行模拟。如图2中的(a)部分所示,事件触发词的知识节点“[攻击|触发词]”与事件触发词的文本节点“开火”连接,并将边的类别设置为“触发词”。事件论元角色的知识节点“[攻击|攻击者]”和“[攻击|目标]”则与事件中对应的实体元素“坦克”和“房屋”连接,并将边的类别设置为“论元”。文本节点和知识节点之间的连接包括了触发词和论元的事件相关的背景知识,对触发词、论元和事件注释之间的关系进行了事件检测模型的构建。事件注释包含事件类型和事件论元角色,如图2中的(a)部分下方的三个知识节点所示。
如图2中的(b)部分所示,为了获取分布在句子中不同位置的非连续上下文信息来增强信息流,将事件触发词的文本节点与事件论元的文本节点进行横向的连接,从而对事件中文本之间的关系进行事件检测模型的构建。同时,将事件触发词的知识节点与同一事件内的其他论元角色的知识节点进行连接,以此对事件中的核心元素之间的关系进行事件检测模型的构建。
对图2进一步说明如下:
文本节点是指句子中的事件触发词的“词”和事件论元的“实体”文字,如图2中的(a)部分上方的节点所示。
知识节点是指事件触发词和事件论元在事件中的类型,如图2中的(a)部分下方的三个节点所示。
事件触发词联系包括:事件事件触发词的文本节点、事件触发词的知识节点,以及它们之间的连接。事件触发词联系表示事件结构中的事件触发词部分结构。
事件论元联系包括:论元文本节点、论元角色知识节点,以及它们之间的连接。事件论元联系表示事件结构中的事件论元部分的结构。
文本联系包括:事件结构中的所有文本节点以及它们之间的连接。文本联系表示事件结构中的文本部分的结构,如图2中的(b)部分上半部所示。
知识联系包括:事件结构中的所有知识节点以及它们之间的连接。知识联系表示事件结构中的知识部分的结构,图2中的(b)部分下半部所示。
事件结构是指事件本身的结构,事件结构如图2中的(b)部分所示。
事件结构的知识是指事件结构中的“知识节点”、“文本节点与知识节点之间的联系”、“文本节点与文本节点之间的联系”、“知识节点与知识节点之间的联系”,这些可以通过步骤S2“动态知识匹配”被进一步运用的,统称为“事件结构的知识”。
事件结构的知识的信息则为事件结构的知识中所蕴含的信息,可以为事件检测模型提供线索,帮助事件检测模型正确地对事件进行识别。
S2:动态知识匹配
在推论阶段,动态知识匹配机制旨在动态地对输入句子中的文字和实体与事件背景知识图中的事件结构的知识进行匹配,从而构建一个属于输入句子自身且包含高度相关的事件背景知识的子图,提高事件触发词检测的召回率。
(1)事件触发词相关的背景知识匹配
首先将事件背景知识图中触发词相关的背景知识与输入句子中的潜在事件触发词进行匹配。基于对事件抽取数据集ACE2005的分析,数据集中94.7%的事件触发词属于名词与动词,因此我们将输入句子中所有的名词与动词视为潜在事件触发词。对于输入句子中的一个潜在事件触发词wti,如果在事件背景知识图中存在与潜在事情触发词相同的文本节点tnj,则计算两者之间的语义相似度得分simtrg(wti,tnj)=cosine(E(wti),E(tnj)),其中cosine表示余弦相似度计算,E表示通过ELMo模型获取的词嵌入。对于未存在于事件背景知识图中的潜在事件触发词,除了计算潜在事件触发词与事件背景知识图中事件触发词文本节点之间的语义相似度得分之外,同时将输入句子的上下文文本信息纳入考虑范围内,并计算语义相似度得分simtrg(wti,tnj)=α*cosine(E(wti),E(tnj))+(1-α)*cosine(E(st),E(stn)),其中α是人工设置的可调权重,st和stn是句子中词语的ELMO嵌入的平均值。在将输入句子中的潜在事件触发词与事件背景知识图中的所有触发词文本节点进行比较之后,选择语义相似度得分最高的前k个匹配项,将所选的潜在触发词视为候选事件触发词,并将文本节点所匹配的知识节点的事件类型视为输入句子的候选事件类型。
(2)事件论元相关的背景知识匹配
为了从事件背景知识图中获取事件论元角色相关的事件背景知识,基于输入句子已选的候选事件类型,将输入句子中的实体与事件背景知识图中的论元的文本节点进行匹配。将输入句子中所有的实体视为潜在事件论元,并计算潜在事件论元与事件背景知识图中事件论元的文本节点的语义相似度得分。为了在匹配时考虑事件结构的整体信息,将输入句子中的候选事件触发词wti的词嵌入E(wti)与实体ek的词嵌入E(ek)进行拼接,得到一个同时包含事件触发词与实体信息的嵌入来表示句子中的潜在事件论元。同理,将通过事件触发词相关的背景知识匹配而获得的候选事件触发词的文本节点的嵌入E(tnj)与同事件类型中的论元角色的文本节点的嵌入E(enq)进行拼接,得到E(anq)=[E(tnj),E(enq)]来表示事件背景知识图中的事件论元。通过计算语义相似度得分simarg(ek,enq)=cosine(E(ak),E(anq)),得到输入句子中的潜在事件论元与事件背景知识图中的事件论元的匹配得分。对于输入句子中的每个潜在事件论元,选择语义相似度得分最高的前k个匹配项。同时,基于通过事件触发词相关的背景知识匹配而获得的候选事件类型,仅保留属于输入句子中候选事件类型的论元角色作为输入句子中事件论元的知识节点,并按照步骤S1中事件背景知识图的构图方法构建输入句子的子图,如图3中的(b)部分所示。
S3:事件选择图卷积神经网络
在对输入句子进行动态知识匹配后,构建的子图中可能会包含一部分噪声知识。为了尽可能的减少噪声对图卷积神经网络的影响,提出事件路径选择机制来对途中的噪声进行过滤。此外,基于动态知识匹配过程中得到的语义相似度得分来初始化子图中边的权重,以此来进一步区分不同的事件背景知识对于输入句子的重要程度。同时,引入表示非事件种类的知识节点“[其他]”以进一步增强事件检测模型的鲁棒性。从而提高事件触发词检测的准确率。
(1)事件路径选择机制
对于事件背景知识图中的每个事件,将该事件中的事件触发词知识节点和论元角色知识节点之间的连接视为该事件的事件结构模式,例如“[攻击|攻击者,攻击|触发词,攻击|目标]”,并预先设置一个次数作为阈值。通过统计事件背景知识图中的所有事件结构模式,将出现次数超过设置阈值的事件结构模式视为高频事件结构模式。对于输入句子,在通过动态匹配构建的子图中,如果子图中的候选事件的事件结构模式属于高频事件结构模式之一,则保留子图中的该候选事件的知识节点与事件结构,并对子图中连接文本节点和知识节点的边的权重进行初始化,初始化的值为步骤S2动态知识匹配中计算出的语义相似度得分。对于文本节点与文本节点、知识节点与知识节点横向连接的边,边的权重初始化为1。
如果子图中候选事件的事件结构模式不属于高频结构模式,则该事件结构模式所表示的结构化事件知识可能并不是该事件类型中一个恰当的事件结构表示。然而,不是直接过滤并删除构成该事件结构模式的所有知识节点,而是将子图中属于该事件结构模式的文本节点和知识节点之间的边的权重初始化为0,以此保持子图的完整性并增强鲁棒性。如图3的(b)部分所示,实线表示满足事件路径选择条件的边,而虚线则表示被过滤的事件结构的知识。
此外,为了防止子图中属于高频结构结构模式的事件背景知识仍然包含噪声,将表示非事件类别的知识节点“[其他]”添加到每个候选事件触发词和候选事件论元的文本节点,并将边的权重设置为0。对于被过滤的候选事件结构中的文本节点,将表示无事件类别的知识节点“[其他]”添加到文本节点并将边的权重设置为1。
(2)节点编码器
使用文本编码器对输入句子的文本进行编码,同时使用知识编码器对输入句子的子图进行编码。文本编码器将输入句子的文本进行编码,获得句子的文本嵌入。首先,将输入句子中的词语的预训练词嵌入、POS标签嵌入、位置嵌入和实体类型嵌入进行拼接,构造句子的向量序列。使用双向长短期记忆神经网络进一步对句子的序列信息进行编码,获得新的句子表示向量作为输入句子中文本节点的文本嵌入。使用TransE作为知识编码器,对事件背景知识图中的知识节点进行编码。
(3)图卷积计算
在对输入句子的子图中的文本节点和知识节点进行编码,并对边的权重进行初始化后,通过对边添加权重门来对边的权重进行进一步的更新,以此让事件检测模型对事件中每条边各自的重要性进行学习。接着将子图的节点编码与边的权重输入多层图卷积神经网络并得到输入句子的图表示。输入句子的文本节点的表示向量通过图卷积神经网络对相邻的知识节点进行学习,使图表示包含事件结构的知识的信息。
(4)注意力触发词分类器
使用自注意力机制来抽取事件触发词。经过图卷积神经网络更新的图表示在经过一层自注意力层和全连接层后,对图表示的事件触发词标签进行预测,从而确定输入句子对应的事件类型,实现事件检测。
本实施例的具体测试例如下:
训练语料:
训练例1:During their visit to Pyongyang,the delegation also met thechairman of North Korea's legislature。
训练例2:Tuesday's meeting was the first step toward that goal afterthe ouster of Jarvan。
测试语料:
测试例1:“President makes Russia his destination since becoming leaderin a visit that could seal a major pipeline”。
测试例2:“Mahathir's sacking of the charismatic and popular Anwar inSeptember 1998 rock Malaysian politics”。
在测试例1中,输入句子中的触发词“visit”属于歧义触发词,该词在训练集的不同句子中具有“会面”和“运送”事件类型。本测试例通过动态地对全局事件背景知识进行匹配,得到与词“visit”匹配度得分最高的训练例1中的事件触发词“visit”和其事件触发词知识节点[Transport|Trigger],以及与实体“Russia”匹配度得分最高的训练例1中的事件论元“Pyongyang”和其论元角色知识节点[Transport|Destination]。基于以上匹配到的事件结构的知识的信息,本测试例将歧义触发词准确地判定为Transport-Movement事件类型。
在测试例2中,输入句子中的事件触发词“sacking”是训练集中未曾出现过的生僻触发词。本测试例通过与事件背景知识图进行全局匹配,得到了事件背景知识图中具有End-Position触发词背景知识的触发词“ouster”,并通过动态匹配机制将相关的触发词知识节点[End-Position|Trigger]添加到输入句子的子图中。通过从全局事件结构中匹配到更合适的事件相关知识来构建子图,并通过图卷积计算将相关信息融入上下文表示,本测试例可以正确地将生僻触发词“sacking”识别出,并将其分类为End-Position事件类型。
本实施例的事件检测方法可以应用于各领域类型的文本,如新闻、广播、博客、金融、司法等领域,对其中的如出生、结婚、死亡、攻击、诽谤、运送、转账、起诉等事件进行检测。事件检测在工业界中的多个领域的应用场景中也都得到了应用,例如:在金融领域中,对企业资讯、公告、金融新闻等文本数据中对可能对市场造成影响的事件进行检测,从而为交易人员及时提供最新的信息;在社交媒体领域中,平台可以通过使用事件检测技术对新闻资讯进行发掘,从而对当前的热点新闻事件进行监测;在电商和论坛等领域,平台可以使用事件检测技术对售后服务、产品质量等问题进行监测,及时发现潜在的隐患;比如:可以用于智能汽车企业及时发现产品质量缺陷,避免造成事故。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。
Claims (8)
1.一种基于显式事件结构知识增强的事件检测方法,其特征在于,包括如下步骤:
S1:根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件背景知识图,实现对事件结构显式地构建事件检测模型;
S2:将所述事件背景知识图中的事件结构的知识与输入句子进行动态知识匹配,构建属于所述输入句子的包含高度相关的事件背景知识的子图;
S3:对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示;
S4:将所述包含事件结构的知识的信息的图表示输入事件检测分类器中,确定事件触发词的类别,并根据事件触发词的类别确定所述输入句子对应的事件类型;
所述事件背景知识图的构建步骤包括:
S1.1:将事件触发词和事件论元的文字作为所述事件背景知识图的文本节点,将事件触发词和事件论元角色的注释标签作为知识节点;
S1.2:将各文本节点和知识节点分别进行连接,分别对事件触发词、事件论元和事件注释之间的关系,文本之间的关系,事件中的核心元素之间的关系,进行事件检测模型的构建;
各文本节点和知识节点的连接方式包括:
根据事件结构将对应的文本节点与知识节点进行纵向连接;
将事件触发词的文本节点与事件论元的文本节点进行文本横向连接;
将事件触发词的知识节点与同一事件内的其他论元角色的知识节点进行知识横向连接;
所述动态知识匹配的步骤包括:
S2.1:将所述事件背景知识图中事件触发词相关的背景知识与所述输入句子中的潜在事件触发词进行匹配;计算所述潜在事件触发词与所述事件背景知识图中事件触发词文本节点之间的事件触发词语义相似度得分;
S2.2:选择所述事件触发词语义相似度得分最高的前k个潜在事件触发词作为候选事件触发词,并将所述候选事件触发词的文本节点所匹配的知识节点的事件类型作为输入句子的候选事件类型;
S2.3:将输入句子中的潜在事件论元与所述事件背景知识图中的事件论元文本节点进行匹配;计算出所述潜在事件论元与所述事件背景知识图中事件论元文本节点之间的事件论元语义相似度得分;
S2.4:选择所述事件论元语义相似度得分最高的前k个潜在事件论元,基于所述S2.2获得的所述候选事件类型,选择属于所述候选事件类型的事件论元角色作为输入句子中所述事件论元的知识节点;
S2.5:采用所述S1.1-S1.2的方法构建所述输入句子的子图。
2.如权利要求1所述的基于显式事件结构知识增强的事件检测方法,其特征在于,所述事件触发词语义相似度得分的计算公式为:
simtrg(wti,tnj)=cosine(E(wti),E(tnj))
其中,wti表示输入句子中的一个潜在事件触发词,tnj表示事件背景知识图中存在的与潜在事件触发词相同的事件触发词文本节点,cosine表示余弦相似度计算,E表示通过ELMo模型获取的词嵌入;
当所述潜在事件触发词未存在于所述事件背景知识图中时,所述事件触发词语义相似度得分的计算公式为:
simtrg(wti,tnj)=α*cosine(E(wti),E(tnj))+(1-α)*cosine(E(st),E(stn))
其中α是人工设置的可调权重,st和stn是输入句子中词语的ELMO嵌入的平均值。
4.如权利要求1所述的基于显式事件结构知识增强的事件检测方法,其特征在于,对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示的步骤包括:
S3.1:将事件背景知识图中的每个事件中的事件触发词和事件论元角色的知识节点之间的连接作为所述每个事件的事件结构模式,预先设置一个次数作为阈值,再统计事件背景知识图中的所有事件结构模式,将同一事件中出现次数超过所述阈值的事件结构模式判定为高频事件结构模式;
S3.2:通过事件选择路径机制对所述子图进行过滤;
S3.3:通过文本编码器对所述子图中的文本节点进行编码;通过知识编码器对所述子图中的知识节点进行编码;
S3.4:通过对边添加权重门来进一步更新边的权重并进行学习;再将所述子图的节点编码与边的权重输入多层图卷积神经网络,通过图卷积计算得到所述输入句子的图嵌入并进行学习,得到包含事件结构的知识的信息的图表示。
5.如权利要求4所述的基于显式事件结构知识增强的事件检测方法,其特征在于,通过事件选择路径机制对所述子图进行过滤的方式为:
当所述输入句子的子图中的候选事件的事件结构模式属于高频事件结构模式时,则保留所述子图中的所述候选事件的知识节点与事件结构模式,并对所述子图中连接文本节点和知识节点的边的权重进行初始化,初始化的值为所述潜在事件论元语义相似度得分,对于所述子图中文本节点与文本节点、知识节点与知识节点横向连接的边,将边的权重初始化为1;当所述输入句子的子图中的候选事件的事件结构模式不属于高频事件结构模式时,则将所述子图中连接文本节点和知识节点之间的边的权重设置为0,对于所述子图中文本节点与文本节点、知识节点与知识节点横向连接的边,将边的权重初始化为0;边的权重为0的,表示被过滤的候选事件结构。
6.如权利要求5所述的基于显式事件结构知识增强的事件检测方法,其特征在于,对于所述子图中属于高频事件结构模式的事件背景知识中的非事件类型,设置表示非事件类型的知识节点,并将所述非事件类型的知识节点添加到每个候选事件触发词和事件论元的文本节点,以及将边的权重设置为0;对于所述被过滤的候选事件结构中的文本节点,设置表示无事件类型的知识节点,并将所述无事件类型的知识节点添加到每个候选事件触发词和事件论元的文本节点,以及将边的权重设置为1。
7.一种事件检测终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6任一所述方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110461202.6A CN113111184B (zh) | 2021-04-27 | 2021-04-27 | 基于显式事件结构知识增强的事件检测方法及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110461202.6A CN113111184B (zh) | 2021-04-27 | 2021-04-27 | 基于显式事件结构知识增强的事件检测方法及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113111184A CN113111184A (zh) | 2021-07-13 |
CN113111184B true CN113111184B (zh) | 2022-03-08 |
Family
ID=76721792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110461202.6A Active CN113111184B (zh) | 2021-04-27 | 2021-04-27 | 基于显式事件结构知识增强的事件检测方法及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113111184B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113648660B (zh) * | 2021-08-16 | 2024-05-28 | 网易(杭州)网络有限公司 | 一种非玩家角色的行为序列生成方法及装置 |
CN116795963A (zh) * | 2023-05-25 | 2023-09-22 | 上海蜂威科技发展有限公司 | 一种基于知识图谱问答的热线分拨方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020263228A1 (en) * | 2019-06-25 | 2020-12-30 | Google Llc | Developing event-specific provisional knowledge graphs |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101685053B1 (ko) * | 2015-01-20 | 2016-12-09 | 한국과학기술원 | 지식표현 확장 방법 및 장치 |
CN108763555A (zh) * | 2018-06-01 | 2018-11-06 | 北京奇虎科技有限公司 | 基于需求词的画像数据获取方法及装置 |
CN110209807A (zh) * | 2018-07-03 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 一种事件识别的方法、模型训练的方法、设备及存储介质 |
CN109903314A (zh) * | 2019-03-13 | 2019-06-18 | 腾讯科技(深圳)有限公司 | 一种图像区域定位的方法、模型训练的方法及相关装置 |
US11522881B2 (en) * | 2019-08-28 | 2022-12-06 | Nec Corporation | Structural graph neural networks for suspicious event detection |
CN112163416B (zh) * | 2020-10-09 | 2021-11-02 | 北京理工大学 | 一种融合句法和实体关系图卷积网络的事件联合抽取方法 |
CN112395393B (zh) * | 2020-11-27 | 2022-09-30 | 华东师范大学 | 一种基于多任务多示例的远程监督关系抽取方法 |
-
2021
- 2021-04-27 CN CN202110461202.6A patent/CN113111184B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020263228A1 (en) * | 2019-06-25 | 2020-12-30 | Google Llc | Developing event-specific provisional knowledge graphs |
Also Published As
Publication number | Publication date |
---|---|
CN113111184A (zh) | 2021-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230134742A1 (en) | Deep neural network system for similarity-based graph representations | |
Tifrea et al. | Poincar\'e glove: Hyperbolic word embeddings | |
CN110032641B (zh) | 计算机执行的、利用神经网络进行事件抽取的方法及装置 | |
CN112966074B (zh) | 一种情感分析方法、装置、电子设备以及存储介质 | |
CN109376222B (zh) | 问答匹配度计算方法、问答自动匹配方法及装置 | |
CN111199474B (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN112632230B (zh) | 一种基于多层级图网络的事件联合抽取方法及装置 | |
CN113111184B (zh) | 基于显式事件结构知识增强的事件检测方法及终端设备 | |
CN110909540B (zh) | 短信垃圾新词识别方法、装置及电子设备 | |
CN113127933B (zh) | 一种基于图匹配网络的智能合约庞氏骗局检测方法及系统 | |
CN113392209A (zh) | 一种基于人工智能的文本聚类方法、相关设备及存储介质 | |
CN115391570A (zh) | 一种基于方面的情感知识图谱构建方法及装置 | |
CN114385930A (zh) | 一种兴趣点推荐方法及系统 | |
CN114065702A (zh) | 一种融合实体关系和事件要素的事件检测方法 | |
CN110852066A (zh) | 一种基于对抗训练机制的多语言实体关系抽取方法及系统 | |
CN117390140A (zh) | 基于机器阅读理解的中文方面级情感分析方法及系统 | |
CN117354067B (zh) | 一种恶意代码检测方法及系统 | |
WO2021160822A1 (en) | A method for linking a cve with at least one synthetic cpe | |
CN117009516A (zh) | 换流站故障策略模型训练方法、推送方法及装置 | |
Jung et al. | Improving visual relationship detection using linguistic and spatial cues | |
CN115730221A (zh) | 基于溯因推理的虚假新闻识别方法、装置、设备及介质 | |
Ye et al. | Deep truth discovery for pattern-based fact extraction | |
CN117151089A (zh) | 新词发现方法、装置、设备和介质 | |
CN113961978A (zh) | 一种基于有向图的硬件木马检测方法与装置 | |
CN113705692A (zh) | 基于人工智能的情感分类方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |