CN111797233A

CN111797233A - 基于垂直领域的事件链结构识别的方法和装置

Info

Publication number: CN111797233A
Application number: CN202010540031.1A
Authority: CN
Inventors: 刘昌鑫; 王毅; 杜向阳
Original assignee: Nanjing Aegis Information Technology Co ltd
Current assignee: Nanjing Aegis Information Technology Co ltd
Priority date: 2020-06-12
Filing date: 2020-06-12
Publication date: 2020-10-20
Anticipated expiration: 2040-06-12
Also published as: CN111797233B

Abstract

本发明提供一种基于垂直领域的事件链结构识别的方法和装置，方法包括：获取待识别语义数据；将待识别语义信息数据至预设事件链结构识别模型中，得到模型识别结果；预设事件链结构识别模型采用包括事件数据，事件状态数据，事件关系数据及语义角色数据的训练集训练而成；根据模型识别结果、垂直领域知识库，确定事件链结构待补充信息；对补充后的事件链结构进行事件节点的分析和推理，得到事件链结构的逻辑关键节点，建立完整的事件链结构。本发明降低了识别事件链结构的实施成本和构建难度，与垂直领域知识库结合更能够准确抽取文本语义事件信息，准确分析事件状态及事件间关系，准确辨别主体客体角色，进而确定出一完整的事件链结构。

Description

基于垂直领域的事件链结构识别的方法和装置

技术领域

本发明涉及自然语言理解领域，尤其涉及一种基于垂直领域的事件链结构识别的方法和装置。

背景技术

目前，在自然语言理解领域，对自然语言描述的事件信息的识别或分类常见方法是在句子级别标注事件分类，然后通过神经网络训练分类器，或通过目标语句中的触发词和触发词的上下文词语确定目标事件的类型，其中比较具有代表性的专利比如CN201810716380公开的结构，在事件识别过程中结合触发词和触发词的上下文词语进行识别，采用这种词分类的方法进行事件识别。

现有技术具有以下缺点：

1、信息认知不够充分。句子级别的事件分类任务，或者基于事件触发词的事件分类任务中，假设在其正确识别分类的情况下，也只是发现了描述信息中的核心事件或某个关键事件的信息，而自然语言描述过程中完全有可能涉及多个事件，以及事件的转变过程。比如“今天朋友过生日去喝酒，喝完酒开车撞伤一个人，然后逃逸了”一句，描述的是喝酒-酒驾-肇事逃逸的整个过程，如果基于事件触发词识别，或事件分类任务识别，无论识别到的是酒驾，还是肇事逃逸，在法律垂直领域内是不足以准确界定原语句描述的问题的。因为酒驾和肇事逃逸在法律上都是违法行为，是分别具有责任和惩罚必要的，这时候如果只识别到其中一个，显然是无法准确理解语义的。必须识别到酒驾，逃逸这两个事件，并形成一条关于酒驾后逃逸的事件链，才是对信息的充分识别，有助于下游更高级任务的进行。

2、结论不够准确。在句子级别发现事件信息，以及事件相关各要素信息的任务目标，在逻辑性比较复杂的场景是不足以支撑的，尤其是当存在事件状态变化，长文本长距离事件描述和转折过程时，可能涉及到的事件转变关系，事件结构状态变化等问题，如果只是对核心事件进行识别或分类，即使识别任务没有错，结论也不一定是正确的结论。

3、无法获取语义转折变化的过程信息。现有技术对事件的识别停留在一个结论性的目标，对于过程性的目标关注不够，而自然语言表达的语义信息不仅仅是一个结论性的事件可以代表，往往还依赖于事件的发展、状态、逻辑转折等等。

发明内容

为了解决现有技术在事件识别上信息认知不够充分、结论不准确、无法获取语义转折变化的过程信息的问题，本发明提供一种基于垂直领域的事件链结构识别的方法和装置。

第一方面，本发明提供一种基于垂直领域的事件链结构识别的方法，该方法包括：

获取待识别语义数据；

将待识别语义信息数据至预设事件链结构识别模型中，得到模型识别结果；预设事件链结构识别模型采用包括事件数据，事件状态数据，事件关系数据及语义角色数据的训练集训练而成；

根据模型识别结果、垂直领域知识库，确定事件链结构待补充信息；

对补充后的事件链结构进行事件节点的分析和推理，得到事件链结构的逻辑关键节点，建立完整的事件链结构。

进一步地，将待识别事件信息输入至预设事件链结构识别模型中，得到模型识别结果；预设事件链结构识别模型采用包括事件数据，事件状态数据，事件关系数据及语义角色数据的训练集训练而成包括：

利用专家知识体系的垂直领域知识库对当前待识别语义数据进行事件标注，事件状态标注，事件关系标注及语义角色标注的综合标注；

根据事件标注数据，事件状态标注数据，事件关系标注数据及语义角色标注数据建立元事件标注训练集、状态识别标注训练集、意图识别标注训练集、角色识别标注训练集；

根据元事件标注训练集、状态识别标注训练集、意图识别标注训练集、角色识别标注训练集建立多任务学习模型，得到模型识别结果。

进一步地，根据模型识别结果、垂直领域知识库，确定事件链结构待补充信息包括：

根据模型识别结果中的事件识别结果、事件关系识别结果、状态识别结果，构建事件三元组；

将事件三元组内加入角色识别信息，并与意图识别信息进行结合，得到初步事件链结构；

将初步事件链结构与垂直领域知识库进行事件链匹配，对当前初步事件链结构进行补充。

进一步地，对补充后的事件链结构进行事件节点的分析和推理，得到事件链结构的逻辑关键节点，建立完整的事件链结构包括：

对初步事件链结构进行事件节点的分析和推理，确定事件节点补充信息；

将事件节点补充信息发送至用户并与用户进行多轮交互，确定构成事件链的逻辑关键节点；

将逻辑关键节点加入事件链结构内，确定完整的事件链结构。

进一步地，多任务学习模型包括：事件识别模型、事件状态判断模型、事件关系识别模型、角色识别模型。

进一步地，根据元事件标注训练集、角色识别标注训练集、意图识别标注训练集、状态识别标注训练集建立多任务学习模型，得到模型识别结果包括：

利用事件识别模型和事件状态判断模型，识别元事件标注训练集和状态识别标注训练集中事件时序、肯定或否定状态词，确定事件状态信息；

利用事件识别模型和事件关系识别模型，识别元事件标注训练集中事件因果关系、时序关系、相关关系，确定事件三元组；

利用角色识别模型和法律三阶层论的逻辑结构，对元事件标注训练集中角色信息进行分层标注，确定目标对象；

根据事件状态信息、事件三元组、目标对象，得到模型识别结果。

第二方面，本发明提供一种基于垂直领域的事件链结构识别的装置，该装置包括：

待识别信息获取模块，用于获取待识别事件信息；

模型识别确定模块，用于将待识别事件信息输入至预设事件链结构识别模型中，得到模型识别结果；预设事件链结构识别模型采用包括事件数据，事件状态数据，事件关系数据及语义角色数据的训练集训练而成；

待补充信息确定模块，用于根据模型识别结果、垂直领域知识库，确定事件链结构待补充信息；

事件链结构建立模块，用于对补充后的事件链结构进行事件节点的分析和推理，得到事件链结构的逻辑关键节点，建立完整的事件链结构。

进一步地，模型识别确定模块包括：

标注单元，用于利用专家知识体系的垂直领域知识库对当前待识别语义数据进行事件标注，事件状态标注，事件关系标注及语义角色标注的综合标注；

生成训练集单元，用于根据事件标注数据，事件状态标注数据，事件关系标注数据及语义角色标注数据建立元事件标注训练集、状态识别标注训练集、意图识别标注训练集、角色识别标注训练集；

模型识别结果获取单元，用于根据元事件标注训练集、状态识别标注训练集、意图识别标注训练集、角色识别标注训练集建立多任务学习模型，得到模型识别结果。

第三方面，本发明提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现第一方面提供的基于垂直领域的事件链结构识别的方法的步骤。

第四方面，本发明提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现第一方面提供的基于垂直领域的事件链结构识别的方法的步骤。

本发明在与法律专家知识体系严格结合的基础上，利用法律专家知识体系构建了一套有目标、有效果、有顺序的识别方案，在具体任务的结合上采用多任务学习模型框架，降低了识别事件链结构的实施成本和构建难度，与垂直领域知识库进行结合更能够准确抽取文本语义事件信息，准确分析事件状态及事件间关系，准确辨别主体客体角色，进而确定出一完整的事件链结构。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于垂直领域的事件链结构识别的方法流程示意图；

图2为本发明实施例提供的数据综合标注及基于专家知识体系的数据标注标准构建结构图；

图3为本发明实施例提供的多任务学习模型结构示意图；

图4为本发明实施例提供的根据识别结果初步构建事件链的结构示意图；

图5为本发明实施例提供的事件链与用户交互补充事件链信息示意图；

图6为本发明实施例提供的基于垂直领域的事件链结构识别的装置框图；

图7为本发明实施例提供的电子设备框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

现有技术存在信息认知不够充分、结论不够准确、无法获取语义转折变化的过程信息的缺点，究其原因，一是，因为针对广泛领域的事件识别，其事件知识体系是难以总结和整理的，而且事件直接的关系体系更是错综复杂，无法用有限的表示进行表征，也就无法进行世界观和领域观的限定。二是因为对事件状态信息的识别目前在广泛领域没有很好的定义和重视，而在法律领域事件状态的改变，是否发生，是否存在的信息对法律责任认定、法律概念适用等等问题具有非常重要的影响作用。三是没有在垂直领域下的法律专家知识支撑，无法基于垂直领域下的三阶层论对领域内的知识进行体系化限定，降低了识别准确率。为了解决上述问题，本发明实施例提供一种基于垂直领域的事件链结构识别的方法，如图1所示，该方法包括：

步骤S101，获取待识别语义数据；

步骤S102，将待识别语义信息数据至预设事件链结构识别模型中，得到模型识别结果；预设事件链结构识别模型采用包括事件数据，事件状态数据，事件关系数据及语义角色数据的训练集训练而成；

步骤S103，根据模型识别结果、垂直领域知识库，确定事件链结构待补充信息；

步骤S104，对补充后的事件链结构进行事件节点的分析和推理，得到事件链结构的逻辑关键节点，建立完整的事件链结构。

具体为，如图2，利用专家知识体系建立当前待识别语义数据所属垂直领域知识库，即通过法律三阶层论的专家角色体系共同制定细分领域的知识体系，包含领域内的事件体系，事件关系体系，角色知识体系等，形成统一的标注解释规范和对知识工程师标注工作的指导文件。相关专家建立垂直领域的专家知识体系，通过专家知识体系的构建，梳理本领域的世界观、领域观和专家观知识，对领域范围内的相关事件、意图、角色等信息进行构建，并在该知识体系下进行数据综合标注任务。其中标注任务包括事件标注，事件状态标注，事件关系标注(意图标注)及语义角色标注等的综合标注。

对标注数据根据不同算法场景需要，进行特定的训练集、测试集生成，主要包括实体识别数据集、角色识别数据集、事件数据集、事件关系数据集等，作为多任务学习的子任务分别对应的训练集。详细的训练集包括元事件标注训练集、状态识别标注训练集、意图识别标注训练集、角色识别标注训练集。

根据元事件标注训练集、状态识别标注训练集、意图识别标注训练集、角色识别标注训练集建立多任务学习模型，如图3所示，将上述各训练集输入分享层获得识别出的元事件、角色、意图、状态间的关系，同时各任务之间互相监督，提高训练效率，降低数据生产和模型生产的成本。

将识别出的元事件、角色、意图、状态间的关系与垂直领域知识库做匹配，参照专家知识体系的垂直领域知识库，采用生成+校验的方式生成事件链数据，根据行业知识进行事件链的校验和修正工作，确定事件链结构待补充信息；然后对补充后的事件链结构进行事件节点的分析和推理，得到事件链结构的逻辑关键节点，建立完整的事件链结构。

本发明实施例在与法律专家知识体系严格结合的基础上，利用法律专家知识体系构建了一套有目标、有效果、有顺序的识别方案，在具体任务的结合上采用多任务学习模型框架，降低了识别事件链结构的实施成本和构建难度，与垂直领域知识库进行结合更能够准确抽取文本语义事件信息，准确分析事件状态及事件间关系，准确辨别主体客体角色，进而确定出一完整的事件链结构。

基于上述各实施例的内容，作为一种可选实施例：根据模型识别结果、垂直领域知识库，确定事件链结构待补充信息包括：

具体为，如图4，根据模型识别结果中的事件识别结果、事件关系识别结果、状态识别结果，建立事件三元组，将事件三元组内加入角色识别信息，并与意图识别信息进行结合，得到结合后的初步事件链结构，将初步事件链结构与垂直领域知识库进行事件链相似度匹配，匹配对应的事件链，通过事件链中包括的子事件、子事件之间的关系以及状态转变过程，得到逻辑和状态上最相似的事件链，代表本条语句的事件和状态结构，这时将事件链知识与识别结果进行比对，发现缺少的信息，对缺少信息进行补充。

基于上述各实施例的内容，作为一种可选实施例：对补充后的事件链结构进行事件节点的分析和推理，得到事件链结构的逻辑关键节点，建立完整的事件链结构包括：

具体为，对初步事件链结构进行事件节点的分析和推理，确定事件节点补充信息，以补充事件节点信息为目标向用户反馈与用户进行多轮交互，根据事件链的反馈进行多轮交互，补充事件链构成所需的逻辑重点节点，得到完善的事件链信息，这样得到的事件链信息更理解用户，更贴近用户意图。具体参见图5。

基于上述各实施例的内容，作为一种可选实施例：根据元事件标注训练集、角色识别标注训练集、意图识别标注训练集、状态识别标注训练集建立多任务学习模型，得到模型识别结果包括：

具体为，多任务学习模型包括：事件识别模型、事件状态判断模型、事件关系识别模型、角色识别模型。用事件识别模型和事件状态判断模型，识别元事件标注训练集和状态识别标注训练集中事件时序、肯定或否定状态词，确定事件状态信息，举例：“办事处让我交立案材料，我交了，接下来应该做什么”，识别“交立案材料”和“交了”表达“立案材料”事件已经结束。是否逻辑的识别是为了判定事件是否发生，是否存在，比如短语“我还没有交立案材料”中，仅识别“立案材料”是无法正确理解文本的含义的，必须对“立案材料”事件的状态“没有”进行识别，才能正确理解文本的真实含义。对事件状态的识别目的在于对用户描述信息的事件状态进行充分理解，以助于清晰的掌握用户表达语义中的事件处于的阶段和状态，包含的信息和否定的信息，是对语义信息的充分识别和理解的前提。

利用事件识别模型和事件关系识别模型，识别元事件标注训练集中事件因果关系、时序关系、相关关系，确定事件三元组。举例：比如“我喝酒后开车，发生交通事故后逃逸，应该负什么责任”，识别事件“喝酒-开车-交通肇事-逃逸”，喝酒和开车之间属于时序关系，肇事和逃逸事件属于因果关系，对事件关系的判定和识别，主要是为了构建事件三元组，并根据三元组的组成关系构建事件链，理解用户信息中事件与事件发生的顺序，事件发生的原因和导致的后果，以及事件之间转移的过程。

利用角色识别模型和法律三阶层论的逻辑结构，对元事件标注训练集中角色信息进行分层标注，确定目标对象。对标注数据建立角色识别模型，基于法律三阶层论的主要逻辑结构，进行世界观-领域观-专家观的分层标注，比如在"个税缴纳标准"短语中，对"个税"一词，分层标注为(税种-所得税-个人所得税)分层后增加了层内的同质性，因而可使观察值的变异度减小，各层的抽样误差减小，同时从世界观的角度讲，不会把物-人这种大的概念混淆，有利于减小识别误差，分层角色标注识别效果实际超过了90％。对语义角色的识别有利于判断事件内部的主客体关系，判断文本中涉及到的各主体在事件中的角色以便确定认责、归因等目标的对象。

将识别的事件状态信息、事件三元组、目标对象相关联，得到模型识别结果。

根据本发明的再一个方面，本发明实施例提供基于垂直领域的事件链结构识别的装置，参见图6，图6为本发明实施例提供的基于垂直领域的事件链结构识别的装置框图。该装置用于在前述各实施例中完成本发明实施例提供的基于垂直领域的事件链结构识别。因此，在前述各实施例中的本发明实施例提供的基于垂直领域的事件链结构识别的方法中的描述和定义，可以用于本发明实施例中各执行模块的理解。

该装置包括：

待识别信息获取模块601，用于获取待识别事件信息；

模型识别确定模块602，用于将待识别事件信息输入至预设事件链结构识别模型中，得到模型识别结果；预设事件链结构识别模型采用包括事件数据，事件状态数据，事件关系数据及语义角色数据的训练集训练而成；

待补充信息确定模块603，用于根据模型识别结果、垂直领域知识库，确定事件链结构待补充信息；

事件链结构建立模块604，用于对补充后的事件链结构进行事件节点的分析和推理，得到事件链结构的逻辑关键节点，建立完整的事件链结构。

具体的，本实施例的装置中各模块实现其功能的具体过程可参见对应的方法实施例中的相关描述，此处不再赘述。

基于上述各实施例的内容，作为一种可选实施例：模型识别确定模块包括：

图7为本发明实施例提供的电子设备框图，如图7所示，该设备包括：处理器701、存储器702和总线703；

其中，处理器701及存储器702分别通过总线703完成相互间的通信；处理器701用于调用存储器702中的程序指令，以执行上述实施例所提供的基于垂直领域的事件链结构识别的方法，例如包括：获取待识别语义数据；将待识别语义信息数据至预设事件链结构识别模型中，得到模型识别结果；预设事件链结构识别模型采用包括事件数据，事件状态数据，事件关系数据及语义角色数据的训练集训练而成；根据模型识别结果、垂直领域知识库，确定事件链结构待补充信息；对补充后的事件链结构进行事件节点的分析和推理，得到事件链结构的逻辑关键节点，建立完整的事件链结构。

本发明实施例提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现基于垂直领域的事件链结构识别的方法的步骤。例如包括：获取待识别语义数据；将待识别语义信息数据至预设事件链结构识别模型中，得到模型识别结果；预设事件链结构识别模型采用包括事件数据，事件状态数据，事件关系数据及语义角色数据的训练集训练而成；根据模型识别结果、垂直领域知识库，确定事件链结构待补充信息；对补充后的事件链结构进行事件节点的分析和推理，得到事件链结构的逻辑关键节点，建立完整的事件链结构。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分的方法。

最后，本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于垂直领域的事件链结构识别的方法，其特征在于，所述方法包括：

获取待识别语义数据；

将所述待识别语义信息数据至预设事件链结构识别模型中，得到模型识别结果；所述预设事件链结构识别模型采用包括事件数据，事件状态数据，事件关系数据及语义角色数据的训练集训练而成；

2.根据权利要求1所述的方法，其特征在于，所述将所述待识别事件信息输入至预设事件链结构识别模型中，得到模型识别结果；所述预设事件链结构识别模型采用包括事件数据，事件状态数据，事件关系数据及语义角色数据的训练集训练而成包括：

3.根据权利要求1所述的方法，其特征在于，所述根据模型识别结果、垂直领域知识库，确定事件链结构待补充信息包括：

将所述事件三元组内加入角色识别信息，并与意图识别信息进行结合，得到初步事件链结构；

将所述初步事件链结构与垂直领域知识库进行事件链匹配，对当前初步事件链结构进行补充。

4.根据权利要求3所述的方法，其特征在于，所述对补充后的事件链结构进行事件节点的分析和推理，得到事件链结构的逻辑关键节点，建立完整的事件链结构包括：

对所述初步事件链结构进行事件节点的分析和推理，确定事件节点补充信息；

将所述事件节点补充信息发送至用户并与用户进行多轮交互，确定构成事件链的逻辑关键节点；

将所述逻辑关键节点加入事件链结构内，确定完整的事件链结构。

5.根据权利要求2所述的方法，其特征在于，所述多任务学习模型包括：事件识别模型、事件状态判断模型、事件关系识别模型、角色识别模型。

6.根据权利要求5所述的方法，其特征在于，所述根据元事件标注训练集、角色识别标注训练集、意图识别标注训练集、状态识别标注训练集建立多任务学习模型，得到模型识别结果包括：

利用所述事件识别模型和所述事件状态判断模型，识别元事件标注训练集和状态识别标注训练集中事件时序、肯定或否定状态词，确定事件状态信息；

利用所述事件识别模型和所述事件关系识别模型，识别元事件标注训练集中事件因果关系、时序关系、相关关系，确定事件三元组；

利用所述角色识别模型和法律三阶层论的逻辑结构，对元事件标注训练集中角色信息进行分层标注，确定目标对象；

根据所述事件状态信息、事件三元组、目标对象，得到模型识别结果。

7.一种基于垂直领域的事件链结构识别的装置，其特征在于，所述装置包括：

待识别信息获取模块，用于获取待识别事件信息；

模型识别确定模块，用于将所述待识别事件信息输入至预设事件链结构识别模型中，得到模型识别结果；所述预设事件链结构识别模型采用包括事件数据，事件状态数据，事件关系数据及语义角色数据的训练集训练而成；

8.根据权利要求7所述的装置，其特征在于，所述模型识别确定模块包括：

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所述基于垂直领域的事件链结构识别的方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1至6任一项所述基于垂直领域的事件链结构识别的方法的步骤。