CN116629358A - 事件知识图谱gcn嵌入表示方法、系统、设备及终端 - Google Patents
事件知识图谱gcn嵌入表示方法、系统、设备及终端 Download PDFInfo
- Publication number
- CN116629358A CN116629358A CN202310631121.5A CN202310631121A CN116629358A CN 116629358 A CN116629358 A CN 116629358A CN 202310631121 A CN202310631121 A CN 202310631121A CN 116629358 A CN116629358 A CN 116629358A
- Authority
- CN
- China
- Prior art keywords
- gcn
- behavior
- event
- state
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 230000006399 behavior Effects 0.000 claims abstract description 185
- 239000013598 vector Substances 0.000 claims description 73
- 238000012549 training Methods 0.000 claims description 39
- 238000002372 labelling Methods 0.000 claims description 29
- 238000010586 diagram Methods 0.000 claims description 27
- 238000010276 construction Methods 0.000 claims description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 5
- 238000007670 refining Methods 0.000 claims description 2
- 230000009471 action Effects 0.000 abstract description 18
- 230000014509 gene expression Effects 0.000 abstract description 12
- 238000000605 extraction Methods 0.000 description 23
- 239000011159 matrix material Substances 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000001364 causal effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000008449 language Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于事件知识表示技术领域,公开了一种事件知识图谱GCN嵌入表示方法、系统、设备及终端,通过构造特定场景下的事件行为状态空间以及态势语义表示模型,提出基于原子行为的三层事件表示模型和GCN嵌入方法;将行为态势语义的状态层表示为GCN的节点与边,再通过状态节点实体和节点关系的嵌入构建行为基,从而形成动作驱动事件的行为状态空间到事件关联的可解释表达。本发明GCN模型为特定场景中的事件行为建立状态信息空间,通过状态集合对行为相关的状态信息变化进行态势语义解释和定义,形成了动作驱动事件的行为状态空间到事件关联的可解释表达,提高了特定场景事件中行为分类识别的准确性。
Description
技术领域
本发明属于事件知识表示技术领域,尤其涉及一种事件知识图谱GCN嵌入表示方法、系统、设备及终端。
背景技术
事件知识图谱是一种以事件为中心,用来描述事件信息以及事件之间各种关系的知识图谱,其主要的研究对象是事件,包括与事件相关的知识、事件的演变过程以及事件间的关联关系等。在事件图谱的构建、推理与应用的过程中,需要用到多种信息处理技术和知识表示方法,位于上游的核心技术是事件抽取技术。事件抽取技术是从非结构化的文本数据中提取出与事件有关的信息,并将信息以结构化的形式呈现出来,为下游的事件预测、事件推理等任务奠定基础。现有的研究主要存在以下问题:
(一)语义信息丢失
在事件知识表示领域,以ACE为代表的现有研究中,大多认为事件的触发词是最清楚地表达其发生的词,将动词视为最重要的组分,却缺乏对事件和相关实体的状态描述的形式化表示,可能会导致信息丢失。由于自然语言的模糊性,从识别的触发词到相应的以动作驱动的事件类型映射准确性有限,只在词法、语法概念层面依据动词短语对事件建模,也不能验证事件发生的真实性。
(二)情境语义识别能力不足
目前事件知识图谱的抽取技术研究主要采用的是深度学习方法,代表性的神经网络方法有基于注意力机制的核心词抽取方法、基于预训练模型的词向量实体表示方法和基于图神经网络的实体与关系融合抽取方法,这三类方法对事件间的因果关联或时序关联的识别都依赖相关动词词法或语法规则。然而在特定场景中,由于自然语言的多样性,行为或动作并未使用相同或相似动词表达,导致动词词法或语法规则无法区分相同含义事件行为,使基于触发词的事件分类和预测任务准确率低于预期。
因此,需要构建对于词法语法规则具有弱依赖的、对于特定场景有较好识别度的、对于由多个事件构成的复杂事件更具表现力的形式化表示模型和相关嵌入技术。本发明旨在解决上述问题,提出一种基于行为态势语义的事件知识图谱GCN嵌入表示方法。
发明内容
针对现有技术存在的问题,本发明提供了一种事件知识图谱GCN嵌入表示方法、系统、设备及终端,尤其涉及一种基于行为态势语义的事件知识图谱GCN嵌入表示方法、系统、介质、设备及终端。
本发明是这样实现的,一种事件知识图谱的GCN嵌入表示方法,事件知识图谱GCN嵌入表示方法包括:为特定场景中的事件行为建立状态信息空间,通过状态集合对行为相关的状态信息变化进行态势语义解释和定义;再将行为态势语义的状态层表示为GCN的节点与边,通过状态节点实体和节点关系的嵌入构建行为基,形成状态层—行为层—事件层的行为基GCN事件表示模型,具体包括以下步骤:
步骤一,数据标注,对每条对话数据预定义事件及进行行为状态空间属性标注,转换为行为状态空间结构化数据集;
步骤二,词向量模型训练,根据步骤一,对训练数据集和测试数据集定义行为类型,对状态空间实体的标注内容进行词向量模型训练,生成表示标注数据集的词向量;
步骤三,根据词向量对的向量文件构建行为GCN,根据步骤二,向GCN构建算法输入向量文件内容,输出每条对话数据标注数据集的行为基。
进一步,步骤一中的数据标注包括:
(1)对每条对话进行事件定义及行为状态空间属性定义;
(2)细化行为态势语义的离散函数值域空间,扩展状态信息实体。
进一步,步骤一中,为每条对话识别事件表示的六个属性,包括对话ID、内容、行为、客体、状态以及类别。
进一步,步骤二中的词向量模型训练包括:
(1)通过Word2Vector算法,对测试数据集定义行为类型,对状态空间实体的标注内容进行词向量模型训练;
(2)利用Skip-grams网训练参数将数据状态空间内实体进行词向量的转化;
(3)处理后生成表示优化标注数据集的词向量。
进一步,步骤三中的GCN的构建包括:
(1)根据行为类型状态空间图构建词向量对的向量文件,存储GCN图中的节点和节点对等信息;
(2)输入GCN构建算法,进行GCN嵌入;
(3)输出标注数据集对话的行为基。
本发明的另一目的在于提供一种应用所述的事件知识图谱GCN嵌入表示方法的事件知识图谱GCN嵌入表示系统,事件知识图谱GCN嵌入表示系统包括:
数据标注模块,用于对每条对话数据预定义事件及进行行为状态空间属性标注,转换为行为状态空间结构化数据集;
词向量模型训练模块,用于对训练数据集和测试数据集定义行为类型,对状态空间实体的标注内容进行词向量模型训练,生成表示标注数据集的词向量;
GCN构建模块,用于根据行为类型状态空间图构建词向量对的向量文件,向GCN构建算法输入GCN图中的节点和节点对等信息,输出每条对话数据标注数据集的行为基。
本发明的另一目的在于提供一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行所述的事件知识图谱GCN嵌入表示方法的步骤。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行所述的事件知识图谱GCN嵌入表示方法的步骤。
本发明的另一目的在于提供一种信息数据处理终端,信息数据处理终端用于实现所述的事件知识图谱GCN嵌入表示系统。
结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:
第一,针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:
本发明提供了一种基于行为态势语义的事件知识图谱GCN嵌入表示方法,通过构造特定场景下的事件行为状态空间及态势语义表示模型,将行为态势语义的状态层表示为GCN的节点与边,再通过状态节点实体和节点关系的嵌入构建行为基,从而形成了动作驱动事件的行为状态空间到事件关联的可解释表达。
另外,本发明还具有以下有益效果:
1、以往的很多事件知识图谱分析中,事件间的因果关联或时序关联的识别依赖相关动词词法或语法规则,然而在特定场景事件中,行为或者动作并未使用相同或相似的动词表达,导致基于动词词法或语法规则表示的事件分类和预测任务的准确率低于预期。因此,本发明的技术方案通过构造特定场景下的事件行为状态空间及态势语义表示模型并应用GCN嵌入方法,形成了动作驱动事件的行为状态空间到事件关联的可解释表达,提高了特定场景事件中行为分类识别的准确性。
2、目前现有技术中未曾有过基于行为态势语义和GCN嵌入对事件识别和分类的模型,本发明为特定场景中的事件行为建立状态信息空间,通过状态集合对行为相关的状态信息变化进行态势语义解释和定义,提出了状态层—行为层—事件层的行为基GCN事件表示模型,并基于GCN对于图结构的特征属性提取的能力及逐层属性传递的特点,将行为态势语义的状态层表示为GCN的节点与边,通过状态节点实体和节点关系的嵌入构建行为基,从而为行为层和事件层提供行为属性计算,实现对特定场景下事件的识别和分类。
第二,把技术方案看做一个整体或者从产品的角度,本发明所要保护的技术方案具备的技术效果和优点,具体描述如下:
本发明基于行为态势语义理论,提出了一种事件知识图谱的行为知识表示方法和嵌入方法,为特定场景中的事件行为建立状态信息空间,通过状态集合对行为相关的状态信息变化进行态势语义解释和定义,构造状态层—行为层—事件层的行为基GCN事件表示模型,从而形成动作驱动事件的行为状态空间到事件关联的可解释表达。本发明提出的这一方法提供了事件所涉及的实体的信息转换,通过信息转换识别事件的发生,可以作为验证事件真实性的依据,也丰富了事件的深层语义信息,为事件预测、事件推理等下游任务奠定了基础。
本发明提出的基于行为的GCN,融合了图卷积网络和行为态势语义形式化方法,用行为函数来定义态势语义,构建基于图的半监督学习。本发明构造特定场景下的事件行为状态空间,将行为态势语义的状态层表示为GCN的节点与边,再通过状态节点实体和节点关系的嵌入构建行为基,为事件抽取任务提供了态势语义层面的知识表示嵌入方法,提高了特定场景事件中行为分类识别的准确性,增强了事件知识在情境下的可信度。
第三,作为本发明的权利要求的创造性辅助证据,还体现在以下几个重要方面:
(1)本发明的技术方案填补了国内外业内技术空白:
当前事件知识图谱对事件相关实体信息的知识表示方法各有优劣:ACE 2005将事件的触发器视为最能表达事件的词汇,其优点为给出了事件的强定义,缺点为从识别的动词到相应的事件类型的映射可会导致信息丢失;NEEG利用神经网络结构提出了更具表现力的知识表示模型,其优点为神经网络适用于编码,缺点为只在概念意义上对事件建模,依然将动词视为最重要的组分;ESO形式化了事件的后置条件以及与事件相关的实体的角色,却缺乏对事件和相关实体的状态描述的形式化表示。
本发明提出的基于行为态势语义的事件知识图谱的行为知识表示方法和嵌入方法,则是通过为特定场景中的事件行为建立状态信息空间,用状态集合对行为相关的状态信息变化进行态势语义解释和定义,所构造出的状态层—行为层—事件层的行为基GCN事件表示模型,为事件抽取任务提供了态势语义层面的知识表示嵌入方法,也丰富了事件的深层语义信息,为事件预测、事件推理等下游任务奠定了基础。
(2)本发明的技术方案解决了人们一直渴望解决、但始终未能获得成功的技术难题:
目前事件抽取技术研究主要采用的是深度学习方法,代表性的神经网络方法有基于注意力机制的核心词抽取方法、基于预训练模型的词向量实体表示方法和基于图神经网络的实体与关系融合抽取方法,这三类方法对事件间的因果关联或时序关联的识别都依赖相关动词词法或语法规则。但在特定场景中,行为或动作并未使用相同或相似动词表达,导致动词词法或语法规则无法区分相同含义事件行为,使基于触发词的事件分类和预测任务准确率低于预期。
当前事件知识表示领域的迫切需求之一,是构建对于词法语法规则具有弱依赖的、对于特定场景有较好识别度的、对于由多个事件构成的复杂事件更具表现力的形式化表达模型和相关嵌入技术。
本发明提出的基于行为的GCN,融合了图卷积网络和行为态势语义形式化方法,为特定场景下的事件构造了行为状态空间,通过状态集合对行为相关的状态信息变化进行了态势语义解释和定义,提供了事件所涉及的实体的信息转换,通过信息转换识别事件的发生,可以作为验证事件真实性的依据,增强了事件知识在情境下的可信度,提高了特定场景事件中行为分类识别的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的事件知识图谱GCN嵌入表示方法流程图;
图2是本发明实施例提供的事件知识图谱GCN嵌入表示方法原理图;
图3是本发明实施例提供的三层事件形式化模型图;
图4是本发明实施例提供的三层事件表示模型图;
图5是本发明实施例提供的六类行为基GCN图;
图6是本发明实施例提供的Word2Vector模型图;
图7是本发明实施例提供的行为GCN构造流程图。.
图8是本发明实施例提供的标注数据实例;
图9是本发明实施例提供的向量文件实例及内容示例。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种事件知识图谱GCN嵌入表示方法、系统、设备及终端,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的事件知识图谱GCN嵌入表示方法包括以下步骤:
S101,构造特定场景下的事件行为状态空间以及态势语义表示模型;
S102,将行为态势语义的状态层表示为GCN的节点与边;
S103,通过状态节点实体和节点关系的嵌入构建行为基,形成从行为状态空间到事件关联的可解释表达。
作为优选实施例,如图2所示,本发明实施例提供的事件知识图谱GCN嵌入表示方法具体包括以下步骤:
S1、数据标注,对每条对话数据预定义事件及进行行为状态空间属性标注,转换为行为状态空间结构化数据集;
S2、词向量模型训练,根据步骤S1,对训练数据集和测试数据集定义行为类型,对状态空间实体的标注内容进行词向量模型训练,生成表示标注数据集的词向量;
S3、根据词向量对的向量文件构建行为GCN,根据步骤S2,向GCN构建算法输入向量文件内容,输出每条对话数据标注数据集的行为基。
本发明实施例提供的事件知识图谱GCN嵌入表示方法的原理为:
通过构造特定场景下的事件行为状态空间及态势语义表示模型,采用行为基对事件进行形式化定义后,利用GCN图卷积结构将事件和事件间的关系共同嵌入到一个连续向量空间中,最终提取出事件的态势语义,从而形成了动作驱动事件的行为状态空间到事件关联的可解释表达,提高了特定场景事件中行为分类识别的准确性。
本发明基于行为态势理论和态势语义学。行为态势是行为运行的意义,利用行为态势语义形式化方法,将可观察行为的状态信息集合作为态势的对象,分析其信息的态势含义和表达方法。在给定相关环境状态空间情况下:
ES=EnvST×SubST
行为态势语义是建立在该状态集合上的函数,可以表示为集合ES到集合ES的映射,即:
Fsituation:ES→ES
本发明通过事件发生过程中相关状态信息的提取,将行为态势语义解释为状态信息集合的函数。设I=Subst×Objst是一个状态集合,其为事件中的主体和客体建立了一个状态空间。行为提取函数是行为发生时态势语义的解释函数,它是从I到I的映射,即B:I→I,代表运行中的行为导致的主体和客体状态转换。
本发明实施例依据行为态势语义模型和特定场景下相关行为集合,提出基于状态层-行为层-事件层的行为基GCN事件表示模型,如图3~4所示,以下为每层的详细机制:
状态层:状态层是指参与事件的实体间的信息转变函数,可被认为是行为的可观测信息:
B:I→I,I=Infosub×Infoobj
动作层:动作层可被视为事件主体的一套行动集合,每个行动代表一个信息转换函数:
Act={A1,A2,..,An},Ai=b|b·b,b∈B
事件层:事件层可由原子事件或复合事件组成。原子事件是一个完整事件发生的核心事件或不可再分的事件,复合事件为事件中有行为关联的事件。原子事件的形式化表示为五元组:
E={Sub,Act,Obj,Time,Loc}
本发明实施例将行为态势语义的状态层表示为GCN的节点与边,利用GCN对于图结构的特征属性提取的能力及逐层属性传递的特点,通过状态节点实体和节点关系的嵌入构建行为基,从而为行为层和事件层提供行为属性计算,实现对特定场景下事件的识别和分类。GCN模型是对利用共享参数的过滤器的图神经网络的统称,其输入为节点特征矩阵XN×D和描述图结构的邻接矩阵AN×N,经变换后输出特征矩阵ZN×F,其中N为节点数量,D为输入特征维数,F为输出特征维数,或称嵌入的维度。
GCN的每一层传播都是一个非线性方程:
H(l+1)=f(H(l),A)
其中,l是GCN的层数,H(0)=X,H(l)=Z。不同的GCN模型的区别就在于非线性方程f(·,·)的选择以及如何设定这个方程的参数,通常可以选择使用非线性激活函数,例如ReLU。
本发明实施例中基于行为的GCN是指与事件所涉及的情境内容信息相关的状态实体的内容转换函数。在行为驱动事件中,状态层构建行为,其中B:I→I表示行为态势语义。本发明实施例采用事件信息的潜在状态空间,表示为I=Infosub×Infoobj,从事件的发生导致事件主体客体状态变化出发,结合GCN模型,将事件状态层嵌入GCN,提出了行为基的概念:
令I=Infosub×Infoobj作为行为状态集合,其中i∈I,是GCN的节点,i之间的状态转换关系为GCN的边,构成的GCN是一个从I到I的图映射,即B:I→I,称此GCN为行为基。
行为基是行为驱动事件的基础,即为事件涉及的实体的状态转换功能。行为基的具体定义因事件类型而异。本发明实施例对于购物场景下交易事件,定义六类以行为驱动的事件:
E={eorder,ereturn,eexchange,ereceive,epayment,edeliver}
将上述六类事件的驱动行为基定义为:
B={Border,Breturn,Bexchange,Breceive,Bpayment,Bdeliver}
这六类行为基的GCN图如图5所示。
本发明实施例对由行为基相关节点和边的关系构造的GCN图,采用Word2Vec词向量算法,将表示状态空间的行为基节点构建为词向量。Word2Vec词向量模型是一种无监督文本语料训练模型,其基本结构图如图6所示。它是一种词语的分布式表示,使用一个固定长度的向量表示词语,这个向量之中同时也包含了词语的语义信息。在Word2Vec模型的输入层中,所接受的输入是词语的one-hot向量x。经过共享的权重矩阵WV×N得到隐层向量h,即:
h=x·WV×N
然后再经过权重矩阵W'V×N得到对输出词语的预测,即:
y=h·W'V×N
本发明实施例中,关注的并不是对词语上下文的预测,而是在这一任务的训练过程之中产生的副产品——模型参数。模型参数之中,每一个向量都与一个词语相对应,将这些参数作为词语的词向量表示。
本发明中的行为基GCN模型为:
本发明将行为态势语义的GCN嵌入方法定义为状态图的构建过程和邻接矩阵的构建过程,如图7所示。行为状态图可以定义为:
G={V,E,C}
其中,V是点集;E是边集;C是类别集,解释当前图形的类别。V={S,I,W,L},S是状态集合,I是节点索引,L是类别集,用于描述节点的类别,W是节点词向量,表示状态实体对应的节点向量,由原始语料库进行状态信息标注后训练的Word2Vec模型得来。
本发明实施例对原始数据集是以对话id的形式进行数据划分的,对话id作为数据输入的处理单元,描述了相关事件以及驱动该事件的相关行为,因此嵌入算法以对话id作为原始输入语料,为每一组对话构建相应行为基的状态图和转换矩阵。由此定义k∈M,k={1,…,M},M是对话id的数量,设i∈N,i={1,…,Nk},Nk是行为基状态图中的节点数。
行为基状态图中,设i∈Nk表示节点,节点对/>表示/>和/>之间的边,邻接矩阵Ak表示为Nk×Nk,其中,/>用于确定边的存在。将输入的每个对话id中以节点命名的形式标注相关节点和节点对,从而为嵌入算法提供有效输入,嵌入算法调用行为基状态图构建函数,为每个对话id生成行为基。
行为基的邻接矩阵Ak为集合其中k∈M,i,j∈N。
节点集合V中,i对应于所有节点编号,C对应行为状态图的类别,W为所有节点的词向量。L为节点的类别,每个节点Vi的相关信息存储在节点文件中,为邻接矩阵转换和后续计算提供后续数据查询。
本发明的技术方案的实现方法:
1、数据标注阶段
为了得到行为状态空间结构化数据集,对每条对话数据预定义事件及进行行为状态空间属性标注,即为每条对话识别六个属性:对话ID,内容,行为,客体,状态,类别;并在初步标注基础上进一步细化行为态势语义的离散函数值域空间,扩展“状态”信息实体。
2、词向量模型训练阶段
首先通过Word2vector算法,对测试数据集定义行为类型,对状态空间实体的标注内容进行词向量模型训练;再利用skip-grams网训练参数将数据状态空间内项目实体进行词向量的转化,处理后生成表示优化标注数据集的词向量。
3、GCN构建阶段
根据行为类型状态空间图构建词向量对的向量文件,存储GCN图中的节点和节点对等信息,输入GCN构建算法,进行GCN嵌入,输出标注数据集对话的行为基。
4、测试结果
本发明应用的工具已在事件知识表示技术领域完成相关数据标注、模型训练以及系统测试等一系列完整的构建流程,并已在真实数据下运行。
通过本发明的实施例,本发明的技术方案中为特定场景中的事件行为建立状态信息空间,解释了特定事件下行为的发生;且基于GCN对于图结构的特征属性提取的能力及逐层属性传递的特点,通过状态节点实体和节点关系的嵌入构建行为基,能够形成动作驱动事件的行为状态空间到事件关联的可解释表达,从而为行为层和事件层提供行为属性计算,提高了特定场景事件中行为分类识别的准确性。
本发明实施例提供的事件知识图谱GCN嵌入表示系统包括:
数据标注模块,用于对每条对话数据预定义事件及进行行为状态空间属性标注,转换为行为状态空间结构化数据集;
词向量模型训练模块,用于对训练数据集和测试数据集定义行为类型,对状态空间实体的标注内容进行词向量模型训练,生成表示标注数据集的词向量;
GCN构建模块,用于根据行为类型状态空间图构建词向量对的向量文件,向GCN构建算法输入GCN图中的节点和节点对等信息,输出每条对话数据标注数据集的行为基。
为了证明本发明的技术方案的创造性和技术价值,该部分是对权利要求技术方案进行具体产品上或相关技术上的应用实施例。
对于本发明提出的基于行为态势语义的事件知识图谱行为知识表示GCN嵌入方法,本实施例在选取语料数据时主要考虑以下因素:
(1)应为特定场景下的语料,对应本发明“情境语义”的设定;
(2)该场景应具有一定常见性;
(3)该语料应具有一定规模,以保证分组训练及验证的数据可靠性。
考虑以上因素,本实施例选择京东商家与顾客的聊天记录(https://storage/com/jimi/JDDC2020/data_train)作为原始语料库和训练数据集。
本实施例的提供的事件知识图谱GCN嵌入表示方法具体包括以下步骤:
步骤一,将原始数据集转换为行为状态空间结构化数据集。先进行相关数据的标注工作,对每条对话数据预定义事件及进行行为状态空间属性标注,,即为每条对话识别六条基本属性,包括对话ID、内容、行为、客体、状态、类别。进一步地,对行为态势语义的离散函数值域空间进行细化,即扩展“状态”信息实体,标注后的数据实例如图8所示。
步骤二,词向量模型训练,根据步骤一,通过word2vector算法,对训练数据集和测试数据集定义行为类型,对状态空间实体的标注内容进行词向量模型训练,利用skip-grams网训练参数将数据数据状态空间内项目实体进行词向量的转化,生成如图9所示的五个向量文件,文件表示了生成表示优化标注数据集的词向量。
步骤三,根据行为类型状态空间图构建词向量对的向量文件,存储GCN图中的节点和节点对等信息,输入GCN构建算法,进行GCN嵌入,输出标注数据集对话的行为基。
目前事件抽取领域先进的模型方法主要有以下几类:
(1)Cross Event方法将整个文档级别的信息用于事件抽取;
(2)DMCNN建立了动态多池化的CNN模型;
(3)JRNN使用了双向RNN和人工输入的特征;
(4)DEEB-RNN使用分层、有监督的注意力机制和文档级别信息进行事件抽取;
(5)dbRNN将语法依赖弧添加到双向LSTM网络来增强事件提取能力;
(6)GCN-ED使用参数池机制并基于GCN进行事件抽取;
(7)JMEE使用句法捷径弧和基于注意力机制的GCN来提取事件信息。
以上方法在ACE 2005测试数据集上的事件抽取准确率如表1所示。
表1不同方法在ACE 2005测试数据集的事件抽取准确率
方法 | 准确率(%) |
CrossEvent | 68.7 |
DMCNN | 75.6 |
JRNN | 66.0 |
DEEB-RNN | 72.3 |
dbRNN | 74.1 |
GCN-ED | 77.9 |
JMEE | 76.3 |
以上方法在基于场景和情境模型下,进行事件抽取的准确均不能满足下游任务需要。比如在处理京东聊天数据时,准确率不超过60%。
本实施例基于情境语义,因此选择京东商家与顾客的聊天记录作为原始语料库和训练数据集,对于样本集的实际识别准确率如表2所示,在特定场景下,对原子事件和对由多个事件构成的复杂事件,行为分类识别的准确性达到了先进水平。
表2本发明实施例在测试集的事件抽取准确率
原子事件 | eorder | epayment | edeliver | ereceive |
准确率(%) | 68.8 | 72.6 | 69.4 | 71.3 |
合成事件 | ereturn | eexchange | ||
准确率(%) | 61.5 | 62.3 |
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种事件知识图谱GCN嵌入表示方法,其特征在于,事件知识图谱GCN嵌入表示方法包括:为特定场景中的事件行为建立状态信息空间,通过状态集合对行为相关的状态信息变化进行态势语义解释和定义;再将行为态势语义的状态层表示为GCN的节点与边,通过状态节点实体和节点关系的嵌入构建行为基,形成状态层—行为层—事件层的行为基GCN事件表示模型。
2.如权利要求1所述的事件知识图谱GCN嵌入表示方法,其特征在于,事件知识图谱GCN嵌入表示方法包括以下步骤:
步骤一,数据标注,对每条对话数据预定义事件及进行行为状态空间属性标注,转换为行为状态空间结构化数据集;
步骤二,词向量模型训练,根据步骤一,对训练数据集和测试数据集定义行为类型,对状态空间实体的标注内容进行词向量模型训练,生成表示标注数据集的词向量;
步骤三,根据词向量对的向量文件构建行为GCN,根据步骤二,向GCN构建算法输入向量文件内容,输出每条对话数据标注数据集的行为基。
3.如权利要求2所述的事件知识图谱GCN嵌入表示方法,其特征在于,步骤一中的数据标注包括:
(1)对每条对话进行事件定义及行为状态空间属性定义;
(2)细化行为态势语义的离散函数值域空间,扩展状态信息实体。
4.如权利要求3所述的事件知识图谱GCN嵌入表示方法,其特征在于,步骤(1)中,为每条对话识别六个属性,包括对话ID、内容、行为、客体、状态以及类别。
5.如权利要求2所述的事件知识图谱GCN嵌入表示方法,其特征在于,步骤二中的词向量模型训练包括:
(1)通过Word2Vector算法,对测试数据集定义行为类型,对状态空间实体的标注内容进行词向量模型训练;
(2)利用Skip-grams网训练参数将数据状态空间内实体进行词向量的转化;
(3)处理后生成表示优化标注数据集的词向量。
6.如权利要求2所述的事件知识图谱GCN嵌入表示方法,其特征在于,步骤三中的GCN的构建包括:
(1)根据行为类型状态空间图构建词向量对的向量文件,存储GCN图中的节点和节点对等信息;
(2)输入GCN构建算法,进行GCN嵌入;
(3)输出标注数据集对话的行为基。
7.一种应用如权利要求1~6任意一项所述的事件知识图谱GCN嵌入表示方法的事件知识图谱GCN嵌入表示系统,其特征在于,事件知识图谱GCN嵌入表示系统包括:
数据标注模块,用于对每条对话数据预定义事件及进行行为状态空间属性标注,转换为行为状态空间结构化数据集;
词向量模型训练模块,用于对训练数据集和测试数据集定义行为类型,对状态空间实体的标注内容进行词向量模型训练,生成表示标注数据集的词向量;
GCN构建模块,用于根据行为类型状态空间图构建词向量对的向量文件,向GCN构建算法输入GCN图中的节点和节点对等信息,输出每条对话数据标注数据集的行为基。
8.一种计算机设备,其特征在于,计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行如权利要求1~6任意一项所述的事件知识图谱GCN嵌入表示方法的步骤。
9.一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行如权利要求1~6任意一项所述的事件知识图谱GCN嵌入表示方法的步骤。
10.一种信息数据处理终端,其特征在于,信息数据处理终端用于实现如权利要求7所述的事件知识图谱GCN嵌入表示系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310631121.5A CN116629358A (zh) | 2023-05-31 | 2023-05-31 | 事件知识图谱gcn嵌入表示方法、系统、设备及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310631121.5A CN116629358A (zh) | 2023-05-31 | 2023-05-31 | 事件知识图谱gcn嵌入表示方法、系统、设备及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116629358A true CN116629358A (zh) | 2023-08-22 |
Family
ID=87602338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310631121.5A Pending CN116629358A (zh) | 2023-05-31 | 2023-05-31 | 事件知识图谱gcn嵌入表示方法、系统、设备及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116629358A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110968700A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种融合多类事理与实体知识的领域事件图谱构建方法和装置 |
CN113157859A (zh) * | 2021-04-06 | 2021-07-23 | 北京理工大学 | 一种基于上位概念信息的事件检测方法 |
CN114004223A (zh) * | 2021-10-12 | 2022-02-01 | 北京理工大学 | 一种基于行为基的事件知识表示方法 |
CN115034224A (zh) * | 2022-01-26 | 2022-09-09 | 华东师范大学 | 一种融合多种文本语义结构图表示的新闻事件检测方法和系统 |
US20230127652A1 (en) * | 2021-10-25 | 2023-04-27 | Adobe Inc. | Event understanding with deep learning |
-
2023
- 2023-05-31 CN CN202310631121.5A patent/CN116629358A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110968700A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种融合多类事理与实体知识的领域事件图谱构建方法和装置 |
CN113157859A (zh) * | 2021-04-06 | 2021-07-23 | 北京理工大学 | 一种基于上位概念信息的事件检测方法 |
CN114004223A (zh) * | 2021-10-12 | 2022-02-01 | 北京理工大学 | 一种基于行为基的事件知识表示方法 |
US20230127652A1 (en) * | 2021-10-25 | 2023-04-27 | Adobe Inc. | Event understanding with deep learning |
CN115034224A (zh) * | 2022-01-26 | 2022-09-09 | 华东师范大学 | 一种融合多种文本语义结构图表示的新闻事件检测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102310487B1 (ko) | 속성 단위 리뷰 분석 장치 및 방법 | |
de Araújo et al. | Re-bert: automatic extraction of software requirements from app reviews using bert language model | |
Goel et al. | Sarcasm detection using deep learning and ensemble learning | |
CN112711953A (zh) | 一种基于注意力机制和gcn的文本多标签分类方法和系统 | |
Kruszewski et al. | Deriving boolean structures from distributional vectors | |
Patnaik et al. | Intelligent and adaptive web data extraction system using convolutional and long short-term memory deep learning networks | |
Cambria et al. | SenticNet 8: Fusing emotion AI and commonsense AI for interpretable, trustworthy, and explainable affective computing | |
CN113392209B (zh) | 一种基于人工智能的文本聚类方法、相关设备及存储介质 | |
CN107103363B (zh) | 一种基于lda的软件故障专家系统的构建方法 | |
CN111339260A (zh) | 一种基于bert和qa思想的细粒度情感分析方法 | |
CN116304748B (zh) | 一种文本相似度计算方法、系统、设备及介质 | |
CN110678882A (zh) | 使用机器学习从电子文档选择回答跨距 | |
CN113761868B (zh) | 文本处理方法、装置、电子设备及可读存储介质 | |
CN113239143B (zh) | 融合电网故障案例库的输变电设备故障处理方法及系统 | |
CN114647713A (zh) | 基于虚拟对抗的知识图谱问答方法、设备及存储介质 | |
CN115759254A (zh) | 基于知识增强生成式语言模型的问答方法、系统及介质 | |
CN114896386A (zh) | 基于BiLSTM的电影评论语义情感分析方法及系统 | |
CN114742016B (zh) | 一种基于多粒度实体异构图的篇章级事件抽取方法及装置 | |
CN113779227A (zh) | 案情事实抽取方法及系统及装置及介质 | |
CN118193677A (zh) | 关键人物姓名纠错方法、系统、电子设备和存储介质 | |
CN116186219A (zh) | 一种人机对话交互方法方法、系统及存储介质 | |
CN112989001B (zh) | 一种问答处理方法、装置、介质及电子设备 | |
CN116629358A (zh) | 事件知识图谱gcn嵌入表示方法、系统、设备及终端 | |
CN115129863A (zh) | 意图识别方法、装置、设备、存储介质和计算机程序产品 | |
TS et al. | Fake news detection on social media using Adaptive Optimization based Deep Learning Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |