CN109101492A

CN109101492A - 一种自然语言处理中使用历史对话行为进行实体提取的方法及系统

Info

Publication number: CN109101492A
Application number: CN201810825397.6A
Authority: CN
Inventors: 徐恒
Original assignee: Nanjing Walkiri Network Technology Co Ltd
Current assignee: Nanjing Walkiri Network Technology Co Ltd
Priority date: 2018-07-25
Filing date: 2018-07-25
Publication date: 2018-12-28

Abstract

本发明公开了一种自然语言处理中使用历史对话行为进行实体提取的方法及系统，其中方法包括：S1，向量化表示用户输入信息中的每个词语；S2，根据词向量或字向量与其上下文之间的关系，利用卷积神经网络初步得到命名实体；S3，根据注意力机制，结合历史对话信息，确定命名实体和当前任务；S4，根据命名实体和当前任务，基于规则过滤不必要的标注，提取实体之间的关系。本发明能够有效地找到特定类型文本这种蕴含的实体关系，提高实体提取的准确率，把文本本身提取到的实体进一步完善，从而最有效的辅助人工完成信息或服务获取的任务。

Description

一种自然语言处理中使用历史对话行为进行实体提取的方法及系统

技术领域

本发明涉及人工智能技术领域，尤其涉及一种自然语言处理中使用历史对话行为进行实体提取的方法及系统。

背景技术

文本实体提取是自然语言处理的主要任务之一，从特定类型文本中提取实体关系。人工智能技术领域除了有很多结构化数据之外，还有更多的文本数据，通俗意义上都叫做非结构化数据，非结构化数据不包括语音、图片、视频等。在应用里面，结构化描述的数据是非常清楚的，但对于文本来说，由于人为书写的形式各异，表达方式多样，涉及多种要素，如人名、车牌号、手机号、组织名等都称之为实体。实体和实体的关系，以及实体和事件的关系，比较难发现之间的关联。

发明内容

本发明的目的在于提供一种自然语言处理中使用历史对话行为进行实体提取的方法及系统，旨在有效地找到特定类型文本蕴含的实体关系，提高实体提取的准确率。

为实现上述目的，本发明的技术方案如下：

一种自然语言处理中使用历史对话行为进行实体提取的方法，包括：

S1，根据用户输入的对话信息，将待处理文本中的词或字采用分布式向量表示，记作词向量或字向量；

S2，根据词向量或字向量与其上下文之间的关系，利用卷积神经网络初步得到命名实体；

S3，根据注意力机制，结合历史对话信息，确定命名实体和当前任务；

S4，根据命名实体和当前任务，基于规则提取实体之间的关系。

上述方案中，所述词向量为语言词表中的词映射成一个长度固定的向量，所有词向量构成一个向量空间，每一个词为词向量空间中的一个点。

上述方案中，所述步骤S2具体包括，根据词向量或字向量与其上下文之间的关系，利用卷积神经网络对待处理文本进行编码，重新输出一个新的向量或矩阵，并且对输出矩阵进行分类识别，识别出是否构成实体。

上述方案中，所述步骤S3具体包括，将历史对话信息作为背景，结合注意力机制，训练一个神经网络作为模型，确定文本中的命名实体以及当前任务。

上述方案中，所述步骤S4具体包括，根据当前任务和命名实体，重新训练实体识别模型，通过规则引擎及半监督方法，提取实体之间的关系。

一种自然语言处理中使用历史对话行为进行实体提取的系统，包括：

向量化单元，向量化处理用户输入信息中的每个词语；

初步筛选单元，通过卷积神经网络或者机器学习分类器，筛选出初步的命名实体；

深度筛选单元，结合历史对话文本信息，通过注意力机制将命名实体具体化；

关系抽取单元，利用预设定的规则引擎及监督训练方法，提取出实体间的关系。

本发明的自然语言处理中使用历史对话行为进行实体提取的方法，有效地找到特定类型文本这种蕴含的实体关系，提高实体提取的准确率，把文本本身提取到的实体进一步完善，从而最有效的辅助人工完成信息或服务获取的任务。

附图说明

图1是本发明一个实施例的自然语言处理中使用历史对话行为进行实体提取的方法的流程图；

图2是本发明一个实施例的自然语言处理中使用历史对话行为进行实体提取的系统的结构示意图。

具体实施方式

下面结合附图和实施例对本发明的技术方案做进一步的详细说明。

图1是本发发明一个实施例中一种自然语言处理中使用历史对话行为进行实体提取的方法的流程图。

如图1所示，该自然语言处理中使用历史对话行为进行实体提取的方法包括以下几个步骤：

S1，根据用户输入的对话信息，将待处理文本中的词或字采用分布式向量表示，记作词向量或字向量，作为后续步骤的输入。

其中，词向量或者字向量可以事先训练得到，也可以先初始化成随机向量，然后在训练当前任务的过程中调整。词向量计算是通过训练的方法，将语言词表中的词映射成一个长度固定的向量，词表中的所有词向量构成一个向量空间，每一个词为词向量空间中的一个点，利用该方法，实现文本的可计算。

举例说明：用户输入的对话信息为“今天我们的讨论主题是手机厂商。美国苹果公司是目前全球最大的手机厂商”，对对话信息中的每个词向量化处理，如将“美国”、“苹果”、“公司”映射成4096维度的向量。

S2，根据词向量或字向量与其上下文之间的关系，利用卷积神经网络或循环神经网络对文本进行编码，输出新的向量或矩阵，并且对输出矩阵进行分类识别，识别出是否构成实体。

举例而言，对于每个词，结合上下文关系，初步得到命名实体。如将“美国”、“苹果”、“公司”的向量形式拼接组合在一起，通过卷积神经网络或循环神经网络进行重新编码，训练得到新向量，用于表示实体的分布概率。例如实体类别为“水果”的概率为40％，“手机公司”的概率55％，其他类别的概率和为5％。

S3，根据注意力机制，结合历史对话信息，确定命名实体和当前任务。

将历史对话信息作为背景，结合注意力机制，训练一个神经网络作为模型，确定文本中的命名实体以及当前任务。

结合历史用户输入信息“今天我们的讨论主题是手机厂商”，通过注意力模型，例如，进一步筛选出手机公司的概率为95％。

根据当前任务和命名实体，重新训练实体识别模型，通过规则引擎及半监督方法，提取实体之间的关系。

根据预设的规则和一定的监督学习，提取出实体的关系与任务的意图。例如“美国苹果公司是目前全球最大的手机厂商”，提取出“苹果公司-属于-美国”和“苹果公司-属性-最大手机厂商”的关系。

向量化单元，向量化处理用户输入信息中的每个词语；

以“今天我们的讨论主题是手机厂商。美国苹果公司是目前全球最大的手机厂商”为例

通过向量化单元对用户输入信息中的每个词语向量化处理，例如将“苹果”映射成4096维度的向量。

对于每个词，结合上下文关系，通过初步筛选单元初步得到命名实体。例如将“美国”，“苹果”，“公司”的向量形式拼接组合在一起，通过卷积神经网络或循环神经网络训练得到一个新向量，用于表示实体的分布概率。例如实体类别为“水果”的概率为40％，“手机公司”的概率55％，其他类别的概率和为5％。

通过深度筛选单元，结合历史数据“今天我们的讨论主题是手机厂商”，通过注意力模型，例如，进一步筛选出手机公司的概率为95％。

关系提取单元，根据预设的规则和一定的监督学习，提取出实体的关系与任务的意图。例如“美国苹果公司是目前全球最大的手机厂商”，可以提取出“苹果公司-属于-美国”和“苹果公司-属性-最大手机厂商”的关系。

本发明的自然语言处理中使用历史对话行为进行实体提取的方法及系统，有效地找到特定类型文本这种蕴含的实体关系，提高实体提取的准确率，把文本本身提取到的实体进一步完善，从而最有效的辅助人工完成信息或服务获取的任务。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是，以上所述仅为本发明的具体实施方式，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应含在本发明的保护范围之内。

Claims

1.一种自然语言处理中使用历史对话行为进行实体提取的方法，其特征在于，包括：

2.根据权利要求1所述的自然语言处理中使用历史对话行为进行实体提取的方法，其特征在于：所述词向量为语言词表中的词映射成一个长度固定的向量，所有词向量构成一个向量空间，每一个词为词向量空间中的一个点。

3.根据权利要求1所述的自然语言处理中使用历史对话行为进行实体提取的方法，其特征在于：所述步骤S2包括，根据词向量或字向量与其上下文之间的关系，利用卷积神经网络对待处理文本进行编码，重新输出一个新的向量或矩阵，并且对输出矩阵进行分类识别，识别出是否构成实体。

4.根据权利要求1所述的自然语言处理中使用历史对话行为进行实体提取的方法，其特征在于：所述步骤S3包括，将历史对话信息作为背景，结合注意力机制，训练一个神经网络作为模型，确定文本中的命名实体以及当前任务。

5.根据权利要求1所述的自然语言处理中使用历史对话行为进行实体提取的方法，其特征在于：所述步骤S4包括，根据当前任务和命名实体，重新训练实体识别模型，通过规则引擎及半监督方法，提取实体之间的关系。

6.一种自然语言处理中使用历史对话行为进行实体提取的系统，其特征在于，包括：向量化单元，向量化处理用户输入信息中的每个词语；