CN109885827A

CN109885827A - 一种基于深度学习的命名实体的识别方法和系统

Info

Publication number: CN109885827A
Application number: CN201910017357.3A
Authority: CN
Inventors: 李健; 王富田; 张连毅; 武卫东
Original assignee: BEIJING INFOQUICK SINOVOICE SPEECH TECHNOLOGY CORP
Current assignee: BEIJING INFOQUICK SINOVOICE SPEECH TECHNOLOGY CORP
Priority date: 2019-01-08
Filing date: 2019-01-08
Publication date: 2019-06-14
Anticipated expiration: 2039-01-08
Also published as: CN109885827B

Abstract

本发明实施例提供了一种基于深度学习的命名实体的识别方法和系统，应用于问答系统或者机器翻译系统，具体为将待识的文本数据按句传入基于注意机制训练得到的命名实体识别模型，得到第一标注结果；利用预置的专家知识系统对第一标注结果进行过滤，滤除其中的错误标注结果，得到第二标注结果；利用预置的置信度评分系统对第二标注结果的置信度进行评分，从中滤除置信度低于预设置信度阈值的标注结果，得到最终的实体识别结果。通过对命名实体的识别，能够发现其中的命名实体，进而有助于提高问答系统和机器翻译系统的准确率。

Description

一种基于深度学习的命名实体的识别方法和系统

技术领域

本发明涉及人工智能技术领域，特别是涉及一种基于深度学习的命名实体的识别方法和系统。

背景技术

随着互联网技术的飞速发展，相关领域研究的不断深入，可用信息资源得到了极大的丰富，这些可用信息资源中包含有大量的非结构化文本。在此背景下，人们迫切需要从海量的非结构化文本中获取有用的信息，为满足这一需求，信息抽取技术应运而生。

其中，命名实体识别是信息抽取技术的一个重要子任务，受到了广大国内外学者的极大关注。特别在问答系统和机器翻译领域，一些专属名词的不断更新迭代，其均有对应的特殊翻译，通过命名实体识别，可以及时发现文本中的特殊含义的命名实体，能够提高问答系统和机器翻译的准确率。

发明内容

有鉴于此，本发明提供了一种基于深度学习的中文命名实体的识别方法和系统，通过对中文命名实体的识别来提高问答系统和机器翻译的准确率。

为了解决上述问题，本发明公开了一种基于深度学习的命名实体的识别方法，应用于问答系统或者机器翻译系统，包括步骤：

将待识的文本数据按句传入基于注意机制训练得到的命名实体识别模型，得到第一识别结果；

利用预置的专家知识系统对所述第一识别结果进行过滤，滤除其中的错误标注结果，得到第二识别结果；

利用预置的置信度评分系统对所述第二识别结果的置信度进行评分，从中滤除置信度低于预设置信度阈值的识别结果，得到最终的命名实体识别结果。

可选的，所述命名实体识别模型的训练方法为：

对预置的文本数据进行标注，所述文本数据包括多个人名、地名、组织机构名和数字实体；

将标注后的文本数据输入基于注意机制建立的深度神经网络模型进行模型训练，得到所述命名实体识别模型。

可选的，所述深度神经网络包括两层并列的GatedCNN编码网络，和分别与两层所述GatedCNN网络相连接的LSTM解码网络。

可选的，所述专家知识系统包括姓氏约束条件和人名长度约束条件。

可选的，所述置信度评分系统通过如下方法得到：

对用于训练所述命名实体识别模型的文本数据进行网络检索，所述文本数据经过标注；

提取网络检索得到的检索结果与经过标注的文本数据的相关部分；

根据所述相关部分对所述文本数据进行评分排序，得到所述置信度评分系统。

相应的，为了实现上述方法，本发明还提供了一种基于深度学习的命名实体的识别系统，应用于问答系统或者机器翻译系统，包括：

实体识别模块，用于将待识的文本数据按句传入基于注意机制训练得到的命名实体识别模型，得到第一识别结果；

第一过滤模块，用于利用预置的专家知识系统对所述第一识别结果进行过滤，滤除其中的错误标注结果，得到第二识别结果；

第二过滤模块，用于利用预置的置信度评分系统对所述第二识别结果的置信度进行评分，从中滤除置信度低于预设置信度阈值的识别结果，得到最终的命名实体识别结果。

可选的，还包括用于训练所述命名实体识别模型的模型训练模块，所述模型训练模块包括：

样本标注单元，用于对预置的文本数据进行标注，所述文本数据包括多个人名、地名、组织机构名和数字实体；

训练执行单元，用于将将注后的文本数据输入基于注意机制建立的深度神经网络模型进行模型训练，得到所述命名实体识别模型。

可选的，还包括用于配置所述置信度评分系统的评分系统配置模块，所述评分系统配置模块包括：

网络检索单元，用于对用于训练所述命名实体识别模型的文本数据进行网络检索，所述文本数据经过标注；

相关提取单元，用于提取网络检索得到的检索结果与经过标注的文本数据的相关部分；

系统配置单元，用于根据所述相关部分对所述文本数据进行评分排序，得到所述置信度评分系统。

从上述技术方案可以看出，本发明提供了一种基于深度学习的命名实体的识别方法和系统，应用于问答系统或者机器翻译系统，具体为将待识的文本数据按句传入基于注意机制训练得到的命名实体识别模型，得到第一标注结果；利用预置的专家知识系统对第一标注结果进行过滤，滤除其中的错误标注结果，得到第二标注结果；利用预置的置信度评分系统对第二标注结果的置信度进行评分，从中滤除置信度低于预设置信度阈值的标注结果，得到最终的实体识别结果。通过对命名实体的识别，能够发现其中的命名实体，进而有助于提高问答系统和机器翻译系统的准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于深度学习的命名实体的识别方法的步骤流程图；

图2为本发明实施例提供的一种基于深度学习的命名实体的识别系统的结构框图；

图3为本发明实施例提供的另一种基于深度学习的命名实体的识别系统的结构框图；

图4为本发明实施例提供的又一种基于深度学习的命名实体的识别系统的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

图1为本发明实施例提供的一种基于深度学习的命名实体的识别方法的步骤流程图。

命名实体包括人名、地名、组织机构名、时间和数字表达(包括时间、日期、货币量和百分数等)，一般都是结构化信息中的关键内容，由节点和联想构成，表示诸多对象及其相互联系。在数学中，网络是一种加权图，其还具有物理含义，是从某种相同类型的实际问题中抽象出来的模型；

参照图1所示，本实施例提供的识别方法应用于问答系统或者机器翻译系统，用于对其接受到的文本数据中的命名实体进行识别。该识别方法基于通过深度学习得到的神经网络模型，具体包括如下步骤：

S1、将文本数据按句传入命名实体识别模型进行识别。

这里的文本数据是指成段或成篇的中文文档，在进行识别时按每一句作为一个输入单元输入到预先训练的命名实体识别模型中进行识别，从而得到初步的识别结果，这里称之为第一识别结果。

这里的命名实体识别模型通过如下方法训练得到：

首先，对预置的文本数据进行标注，本实施例中所采用的样本包括18万条数据，其中包含6万人名、4.5万地名、2.1万组织结构名、8万数字实体(包括时间、日期、货币等)。

在对文本数据中实体进行统一标注时基于字符的实体信息标注。其中per表示人名(b-per表示中文人名的第一个字，i-per表示中文人名的其他部分字符)，loc表示地名(b-loc表示中文地名的第一个字，i-loc表示中文地名的其他部分字符)，org表示组织机构名(b-org表示中文组织机构名的第一个字，i-org表示中文组织机构名的其他部分字符)，num表示数字信息(b-num表示数字的第一个字，i-num表示数字的其他字符，另dat表示日期、tim表示时间、mon表示货币等。

然后，将标注好的文本数据输入到基于注意机制建立的深度神经网络模型中进行训练，从而得到该命名实体识别模型。这里的深度神经网络模型为GatedCNN+LSTM的编解码模型。其中，包括作为输入层、且并列的GatedCNN网络，其中一个将字符顺序方向读入编码，另一各用于将字符顺序反向读入编码。还包括LSTM网络，上述两个GatedCNN网络的输出统一流入LSTM网络进行解码操作。且，上述两个GatedCNN网络中各加入独立的attention机制。

S2、利用专家知识系统对第一识别结果进行过滤。

经过过滤，滤除其中的错误识别结果，从而得到第二识别结果。这里的专家知识系统中包括多个约束条件，例如，包括中文人名的476种姓氏的姓氏约束条件，还包括姓名在8个字符内的人名长度约束条件等。

S3、利用置信度评分系统对第二识别结果进行置信度评分。

通过置信度评分系统的评分，将第二识别结果中将置信度低于预设置信度阈值的识别结果予以滤除，从而最终得到可信度较高的命名实体识别结果。

这里的置信度评分系统通过如下方法得到：

首先，对经过标注的文本数据进行网络检索，该文本数据就是上述的用于训练该命名实体识别模型的文本数据；

然后，对网络检索所得的检索结果进行数据提取，提取其中与文本数据相关联的关联部分；

最后，将该关联部分进行置信度分析，从而得到相应文本数据的置信度，然后根据置信度对其进行排序，从而得到该置信度评分系统。

从上述技术方案可以看出，本实施例提供了一种基于深度学习的命名实体的识别方法，应用于问答系统或者机器翻译系统，具体为将待识的文本数据按句传入基于注意机制训练得到的命名实体识别模型，得到第一标注结果；利用预置的专家知识系统对第一标注结果进行过滤，滤除其中的错误标注结果，得到第二标注结果；利用预置的置信度评分系统对第二标注结果的置信度进行评分，从中滤除置信度低于预设置信度阈值的标注结果，得到最终的实体识别结果。通过对命名实体的识别，能够发现其中的命名实体，进而有助于提高问答系统和机器翻译系统的准确率。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

实施例二

图2为本发明实施例提供的一种基于深度学习的中文命名实体的识别系统的结构框图。

参照图2所示，本实施例提供的识别系统应用于问答系统或者机器翻译系统，用于对其接受的文本数据中的命名实体进行识别。该识别系统基于通过深度学习得到的神经网络模型，具体包括实体识别模块10、第一过滤模块20和第二过滤模块30。

实体识别模块用于将文本数据按句传入命名实体识别模型进行识别。

命名实体识别模型第一过滤模块用于利用专家知识系统对第一识别结果进行过滤。

经过过滤，滤除其中的错误识别结果，从而得到第二识别结果。这里的专家知识系统中包括多个约束条件，例如，包括人名的476种姓氏的姓氏约束条件，还包括姓名在8个字符内的人名长度约束条件等。

第二过滤模块用于利用置信度评分系统对第二识别结果进行置信度评分。

从上述技术方案可以看出，本实施例提供了一种基于深度学习的命名实体的识别系统，该系统应用于问答系统或者机器翻译系统，具体用于将待识的文本数据按句传入基于注意机制训练得到的命名实体识别模型，得到第一标注结果；利用预置的专家知识系统对第一标注结果进行过滤，滤除其中的错误标注结果，得到第二标注结果；利用预置的置信度评分系统对第二标注结果的置信度进行评分，从中滤除置信度低于预设置信度阈值的标注结果，得到最终的实体识别结果。通过对命名实体的识别，能够发现其中的命名实体，进而有助于提高问答系统和机器翻译系统的准确率。

另外，在本实施例的一个具体实施方式中，还包括用于训练命名实体识别模型的模型训练模块40，参照图3所示，该模块具体包括样本标注单元和训练执行单元。

样本标注单元用于对预置的文本数据进行标注，本实施例中所采用的样本包括18万条数据，其中包含6万人名、4.5万地名、2.1万组织结构名、8万数字实体(包括时间、日期、货币等)。

训练执行单元用于将标注好的文本数据输入到基于注意机制建立的深度神经网络模型中进行训练，从而得到该命名实体识别模型。这里的深度神经网络模型为GatedCNN+LSTM的编解码模型。其中，包括作为输入层、且并列的GatedCNN网络，其中一个将字符顺序方向读入编码，另一各用于将字符顺序反向读入编码。还包括LSTM网络，上述两个GatedCNN网络的输出统一流入LSTM网络进行解码操作。且，上述两个GatedCNN网络中各加入独立的attention机制。

还有，在本实施例的另一个具体实施方式中，还包括用于配置该置信度评分系统的评分系统配置模块50，参照图4所示，该模块具体包括网络检索单元、相关提取单元和系统配置单元。

网络检索单元用于对经过标注的文本数据进行网络检索，该文本数据就是上述的用于训练该命名实体识别模型的文本数据；

相关提取单元用于对网络检索所得的检索结果进行数据提取，提取其中与文本数据相关联的关联部分；

系统配置单元用于将该关联部分进行置信度分析，从而得到相应文本数据的置信度，然后根据置信度对其进行排序，从而得到该置信度评分系统。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的技术方案进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于深度学习的命名实体的识别方法，应用于问答系统或者机器翻译系统，其特征在于，包括步骤：

2.如权利要求1所述的识别方法，其特征在于，所述命名实体识别模型的训练方法为：

3.如权利要求2所述的识别方法，其特征在于，所述深度神经网络包括两层并列的GatedCNN编码网络，和分别与两层所述GatedCNN网络相连接的LSTM解码网络。

4.如权利要求1所述的识别方法，其特征在于，所述专家知识系统包括姓氏约束条件和人名长度约束条件。

5.如权利要求1所述的识别方法，其特征在于，所述置信度评分系统通过如下方法得到：

6.一种基于深度学习的命名实体的识别系统，应用于问答系统或者机器翻译系统，其特征在于，包括：

7.如权利要求6所述的识别系统，其特征在于，还包括用于训练所述命名实体识别模型的模型训练模块，所述模型训练模块包括：

训练执行单元，用于将标注后的文本数据输入基于注意机制建立的深度神经网络模型进行模型训练，得到所述命名实体识别模型。

8.如权利要求7所述的识别系统，其特征在于，所述深度神经网络包括两层并列的GatedCNN编码网络，和分别与两层所述GatedCNN网络相连接的LSTM解码网络。

9.如权利要求6所述的识别系统，其特征在于，所述专家知识系统包括姓氏约束条件和人名长度约束条件。

10.如权利要求6所述的识别系统，其特征在于，还包括用于配置所述置信度评分系统的评分系统配置模块，所述评分系统配置模块包括：