CN116992879A

CN116992879A - 基于人工智能的实体识别方法、装置、设备及介质

Info

Publication number: CN116992879A
Application number: CN202310830995.3A
Authority: CN
Inventors: 林桂
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2023-07-06
Filing date: 2023-07-06
Publication date: 2023-11-03

Abstract

本发明实施例涉及人工智能及智慧医疗技术领域，公开了一种基于人工智能的实体识别方法、装置、设备及介质，方法包括：获取待识别文本的文本信息和待识别实体的目标类别信息；根据目标类别信息确定目标提示信息；将目标提示信息和文本信息拼接后输入预训练语言模型，得到文本信息在目标提示信息下的语义表征信息；将语义表征信息输入预设前馈神经网络，得到语义表征信息中头实体的第一位置信息和尾实体的第二位置信息；基于第一位置信息、第二位置信息和目标类别信息得到头实体和尾实体的实体表征；将实体表征输入预设线性分类层，得到头实体和尾实体与目标类别信息相对应的概率，并根据概率完成文本信息的实体识别。

Description

基于人工智能的实体识别方法、装置、设备及介质

技术领域

本发明涉及基于人工智能及智慧医疗技术领域，尤其涉及一种基于人工智能的实体识别方法、装置、设备及介质。

背景技术

命名实体识别(Name Entity Recognition，NER)是在一段文本中，将预先定义好的实体类型(人名，机构，地名等)识别出来；命名实体识别是自然语言处理中一个非常重要且基础的问题。

医学病历文本通常包括众多实体及属性，智能化的病历理解可以提供较大的临床价值和实际意义，对于医学场景抽取核心命名实体，是医学场景智能化理解的基础工作。医学信息抽取主要工作即是从海量医学文本中自动化智能化抽取出疾病(Disease)、症状(Symptom)、药品(Drug)、手术操作(Operation)、检查检验(Test)、身体部位(Body)等六类核心实体。对于海量的医学文本，核心实体的抽取不仅可以快速帮助医务工作人员理解患者既往诊断信息，同时也有利于帮助医疗工作者对于特定类型风险如VTE等风险进行提示。

医学领域文本内容非常多样，常见的如医学病历(case history)、健康档案、在线问诊等数据，作为历史参考具有非常重要的挖掘价值。医学场景通常关注的核心实体主要包括疾病(Disease)、症状(Symptom)、药品(Drug)、手术操作(Operation)、检查检验(Test)、身体部位(Body)等六类。但是在医学表述中，嵌套实体尤为常见，如“腹部疼痛”示例中，“疼痛”和“腹部疼痛”均可以标为嵌套症状，而“腹部”作为身体部位和“腹部疼痛”作为症状产生嵌套。

传统基于序列标注的命名实体模型，将实体抽取转换为分类问题，受限于编码和解码方式，对于嵌套的命名实体无法解决。同时，现有实体识别模型存在预训练任务和下游分类任务不一致的情况，导致实体识别效果不及预期，依赖大量标注资源。

发明内容

有鉴于此，本发明提供了一种基于人工智能的实体识别方法、装置、设备及介质，用于解决现有技术中嵌套的命名实体无法识别，实体识别效果不佳，依赖大量标注资源的问题。

为达上述之一或部分或全部目的或是其他目的，本发明提出一种基于人工智能的实体识别方法，包括：获取待识别文本的文本信息和待识别实体的目标类别信息；

根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息，作为目标提示信息；

将所述目标提示信息和所述文本信息拼接后输入预训练语言模型，得到所述文本信息在目标提示信息下的语义表征信息，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量；

将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息，并基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征；

将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别。

另一方面，本申请提供了一种基于人工智能的实体识别装置，所述装置包括：

数据采集模块，用于获取待识别文本的文本信息和待识别实体的目标类别信息；

提示模块，用于根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息，作为目标提示信息；

拼接模块，用于将所述目标提示信息和所述文本信息拼接后输入预训练语言模型，得到所述文本信息在目标提示信息下的语义表征信息，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量；

实体表征模块，用于将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息，并基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征；

识别模块，用于将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别。

另一方面，本申请提供了一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过所述总线通信，所述机器可读指令被所述处理器执行时执行：获取待识别文本的文本信息和待识别实体的目标类别信息；根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息，作为目标提示信息；将所述目标提示信息和所述文本信息拼接后输入预训练语言模型，得到所述文本信息在目标提示信息下的语义表征信息，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量；将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息，并基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征；将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别。

另一方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行：获取待识别文本的文本信息和待识别实体的目标类别信息；根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息，作为目标提示信息；将所述目标提示信息和所述文本信息拼接后输入预训练语言模型，得到所述文本信息在目标提示信息下的语义表征信息，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量；将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息，并基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征；将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别。

实施本发明实施例，将具有如下有益效果：

通过获取待识别文本的文本信息和待识别实体的目标类别信息；根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息，作为目标提示信息；将所述目标提示信息和所述文本信息拼接后输入预训练语言模型，得到所述文本信息在目标提示信息下的语义表征信息，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量；将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息，并基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征；将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别。针对医学文本常见的嵌套实体情况，提出基于实体头尾位置分类的编解码方式，可以有效的解决嵌套实体表征问题。同时为了融入预训练任务和实体识别任务，使用提示学习更好的学习到当前实体的类别信息表征，统一了上游预训练任务和下游命名实体识别任务，更精准的抽取实体。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

其中：

图1是本申请实施例提供的一种基于人工智能的实体识别方法的应用场景图；

图2是本申请实施例提供的一种基于人工智能的实体识别方法的流程图；

图3是本申请实施例提供的一种基于人工智能的实体识别装置的结构示意图；

图4是本发明一实施例中计算机设备的一结构示意图；

图5是本发明一实施例中计算机设备的另一结构示意图。

图6是本申请实施例提供的一种电子设备的结构示意图；

图7是本申请实施例提供的一种存储介质的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的基于人工智能的实体识别方法，可应用在如图1的应用环境中，其中，客户端通过网络与服务端进行通信。服务端可以获取待识别文本的文本信息和待识别实体的目标类别信息；根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息，作为目标提示信息；将所述目标提示信息和所述文本信息拼接后输入预训练语言模型，得到所述文本信息在目标提示信息下的语义表征信息，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量；将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息，并基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征；将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别。在本发明中，针对医学文本常见的嵌套实体情况，提出基于实体头尾位置分类的编解码方式，即，得到由所述头实体和所述尾实体组成的实体对的实体表征；将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别，可以有效的解决嵌套实体表征问题，同时为了融入预训练任务和实体识别任务，使用提示学习更好的学习到当前实体的类别信息表征，即，根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息，作为目标提示信息；将所述目标提示信息和所述文本信息拼接后输入预训练语言模型，统一了上游预训练任务和下游命名实体识别任务，实现了更精准的抽取实体。其中，客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面通过具体的实施例对本发明进行详细的描述。

为减轻服务端的计算压力，本发明实施例提供的基于人工智能的实体识别方法，也可在应用在图1中的客户端，即，获取待识别文本的文本信息和待识别实体的目标类别信息；根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息，作为目标提示信息；将所述目标提示信息和所述文本信息拼接后输入预训练语言模型，得到所述文本信息在目标提示信息下的语义表征信息，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量；将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息，并基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征；将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别。

如图2所示，本申请实施例提供了一种基于人工智能的实体识别方法，包括：

S101、获取待识别文本的文本信息和待识别实体的目标类别信息；

本申请实施例提供的实体识别方法，可应用于各种场景下的实体识别装置或实体识别引擎中，实体识别的过程通常通过服务端来实现，进行实体识别的服务端可以实时与用户的客户端进行数据传输。比如，当服务端接收到客户端的实体识别请求信息后，根据实体识别请求信息获取实体识别请求信息针对的待识别文本的文本信息和实体识别请求信息中待识别实体的目标类别信息，例如，实体识别请求信息为“识别文件A中的X类实体”，则获取实体识别请求信息针对的文件A中的文本信息，“X类”为待识别实体的目标类别信息。

示例性的，在医疗领域，获取待识别文本的文本信息和待识别实体的目标类别信息的步骤，具体可以体现为：获取病历文案中的疾病实体，其中，病历文案为待识别文本，疾病为待识别实体的目标类别信息。

S102、根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息，作为目标提示信息；

示例性的，为提高后续实体识别的效果，引入提示学习的方法，可以在不显著改变预训练语言模型结构和参数的情况下，通过向输入增加“提示信息”，将下游任务改为文本生成任务的做法。提示学习是适合低资源场景的学习方法，可以结合要预测的实体类别信息，让预训练模型更好的和下游任务结合，提升下游命名实体识别任务。

提示学习中提示信息的设计对于提示学习的效果十分关键，因此通过在预设提示信息库中确定与所述目标类别信息对应的提示信息的方式获取目标提示信息，以保证目标提示信息的质量。

S103、将所述目标提示信息和所述文本信息拼接后输入预训练语言模型，得到所述文本信息在目标提示信息下的语义表征信息，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量；

示例性的，不同于传统直接将文本输入序列<x₁,x₂,x₃,…,x_n>放进预训练模型，提示学习需要不同模型的提示信息<prompt>，即，将所述目标提示信息和所述文本信息拼接为：<[cls]prompt[sep][x₁,x₂,x₃,…,x_n]>，预训练语言模型可以学习在不同实体类型提示信息下的文本表征向量。

S104、将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息，并基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征。

示例性的，前馈神经网络中各神经元从输入层开始，接收前一级输入，并输入到下一级，直至输出层。整个前馈神经网络中无反馈，可用一个有向无环图表示，进而用于确定所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息。

S105、将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别。

针对医学文本常见的嵌套实体情况，提出基于实体头尾位置分类的编解码方式，可以有效的解决嵌套实体表征问题。同时为了融入预训练任务和实体识别任务，使用提示学习更好的学习到当前实体的类别信息表征，统一了上游预训练任务和下游命名实体识别任务，更精准的抽取实体。

在一种可能的实施方式中，在所述根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息的步骤之前，还包括：

获取历史文本信息的历史实体识别结果；

基于所述历史实体识别结果确定所述历史文本信息中包含的所有实体类别；

针对所有实体类别中的每个实体类别构建提示信息，得到预设提示信息库。

示例性的，医学病历文本通常包括众多实体及属性，智能化的病历理解可以提供较大的临床价值和实际意义，对于医学场景抽取核心命名实体，是医学场景智能化理解的基础工作。医学信息抽取主要工作即是从海量医学文本中自动化智能化抽取出疾病(Disease)、症状(Symptom)、药品(Drug)、手术操作(Operation)、检查检验(Test)、身体部位(Body)等六类核心实体。医学领域文本内容非常多样，常见的如医学病历(casehistory)、健康档案、在线问诊等数据，作为历史参考具有非常重要的挖掘价值。医学场景通常关注的核心实体主要包括疾病(Disease)、症状(Symptom)、药品(Drug)、手术操作(Operation)、检查检验(Test)、身体部位(Body)等六类。

示例性的，通过在预设提示信息库中确定与所述目标类别信息对应的提示信息的方式获取目标提示信息，提前构建预设提示信息库避免在实体识别时构建目标提示信息占用的时间，同时，发起实体识别的用户并不一定了解设计提示信息的技术，进而提前构建预设提示信息库增加了实体识别的应用范围。

示例性的，通过获取历史文本信息的历史实体识别结果，并根据历史实体识别结果确定所述历史文本信息中包含的所有实体类别，使得获取的所有实体类别更具有针对性，例如，植发医院、美容医院、牙医诊所等医疗机构，对特定的身体部位具有针对性，因此，在实体识别时，并不需要针对特定的身体部位进行识别，只需将特定的身体部位作为关键词等方式完成实体识别，避免计算资源浪费。

在一种可能的实施方式中，所述针对所有实体类别中的每个实体类别构建提示信息，得到预设提示信息库的步骤，包括：

获取所有实体类别中的每个实体类别的类别名称；

根据所述类别名称构建所有实体类别中的每个实体类别的提示信息，得到预设提示信息库。

示例性的，采用所有实体类别中的每个实体类别的类别名称构建所有实体类别中的每个实体类别的提示信息，能够直观的查看到每个提示信息对应的实体类别。

在一种可能的实施方式中，在所述将所述目标提示信息和所述文本信息拼接后输入预训练语言模型的步骤之前，还包括：

在所述历史文本信息中选择与所述预设提示信息库中各个提示信息对应的文本信息，作为训练文本；

基于所述训练文本与所述预设提示信息库中各个提示信息构建数据对，得到训练集；

基于所述训练集训练所述初始语言模型，得到预训练语言模型，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量，所述初始语言模型为文本表征模型。

示例性的，根据所述历史文本信息构建训练集，进而训练所述初始语言模型，得到预训练语言模型，使得预训练语言模型具有针对性，也使得预训练语言模型可以学习在不同实体类型提示信息下的文本表征向量，基于实体类型名称的提示信息可以更有效地表征医学文本文本，为下游命名实体识别任务带来显著提升。

在一种可能的实施方式中，所述将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息的步骤，包括：

将所述语义表征信息输入所述预设前馈神经网络对中的第一预设前馈神经网络，通过所述第一预设前馈神经网络对所述语义表征信息中的起始位置进行标注，得到所述语义表征信息中头实体的第一位置信息；

将所述语义表征信息输入所述预设前馈神经网络对中的第二预设前馈神经网络，通过所述第二预设前馈神经网络对所述语义表征信息中的终止位置进行标注，得到所述语义表征信息中尾实体的第二位置信息，所述第二预设前馈神经网络与所述第一预设前馈神经网络相互独立。

示例性的，对于语义表征信息x∈R^T×d，需分别经过两个独立的预设前馈神经网络(FeedForward Neural Networks)，所述第一预设前馈神经网络记作FFNN-Start，所述第二预设前馈神经网络记作FFNN-End，通过所述第一预设前馈神经网络和所述第二预设前馈神经网络学习到基于头实体、头位置及分类位置的语义表示：h^s∈R^T×d和基于尾实体、尾位置及分类位置的语义表示：h^e∈R^T×d。

示例性的，所述第二预设前馈神经网络与所述第一预设前馈神经网络相互独立，即，可以同时进行确定h^s∈R^T×d和h^e∈R^T×d的过程，并行的数据处理相比于串行的数据处理过程更快速，有利于实体识别的效率。

在一种可能的实施方式中，所述基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征的步骤，包括：

根据所述第一位置信息和所述第二位置信息确定所述头实体和所述尾实体之间嵌入向量的长度；

基于所述长度确定由所述头实体和所述尾实体组成的实体对的实体表征。

示例性的，枚举任两个起始位置组合，即，由所述头实体和所述尾实体组成的实体对，(i,j)，得到实体表征为：

其中，为(j-i)个长度的嵌入向量，U∈R^d×c×d,/> b∈R^c均为学习的参数，/>为连接函数。

在一种可能的实施方式中，所述将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别的步骤，包括：

将所述第一概率和所述第二概率分别与概率阈值进行比较，若所述第一概率大于或等于所述概率阈值，则确定与所述第一概率对应的头实体的类别信息为所述目标类别信息，对所述头实体进行识别；

若所述第二概率大于或等于所述概率阈值，则确定与所述第二概率对应的尾实体的类别信息为所述目标类别信息，对所述尾实体进行识别；

当对所述尾实体和所述头实体均进行识别时，得到所述头实体的第一识别结果和所述尾实体的第二识别结果；

将所述第一概率和所述第二概率进行比较，若所述第一概率大于所述第二概率，则将所述第二识别结果进行标注，将所述第一识别结果和带有标注的第二识别结果均作为目标识别结果；

若所述第一概率小于所述第二概率，则将所述第一识别结果进行标注，将所述第二识别结果和带有标注的第一识别结果均作为目标识别结果；

若所述第一概率等于所述第二概率，则将所述第二识别结果和所述第一识别结果均作为目标识别结果。

示例性的，最后经过线性分类层，输出当前枚举组合(i,j)是否为目标实体类别信息的概率，即：

y_i,j＝softmax(r_ij)

将预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，softmax()为归一化函数。

示例性的，概率阈值默认为0.5，概率大于或等于概率阈值时，认为概率对应的实体属于所述目标类别信息，概率小于概率阈值时，认为概率对应的实体不属于所述目标类别信息。

示例性的，当所述第一概率和所述第二概率均大于或等于阈值时，比较所述第一概率和所述第二概率，认为概率值更高的概率对应的实体属于所述目标类别信息，概率值低的概率虽然也超过概率阈值，但概率值低的概率对应的实体属于所述目标类别信息的结论并不确定，因此对概率值低的概率对应的实体识别结果进行标注，为后续其他方案中对实体识别的错误修正，修正实体识别的误差等过程提供数据支持。

在一种可能的实施方式中，如图3所示，本申请提供了一种基于人工智能的实体识别装置，所述装置包括：

数据采集模块201，用于获取待识别文本的文本信息和待识别实体的目标类别信息；

提示模块202，用于根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息，作为目标提示信息；

拼接模块203，用于将所述目标提示信息和所述文本信息拼接后输入预训练语言模型，得到所述文本信息在目标提示信息下的语义表征信息，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量；

实体表征模块204，用于将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息，并基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征；

识别模块205，用于将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别。

在一种可能的实施方式中，提示模块202，用于：

获取历史文本信息的历史实体识别结果；

在一种可能的实施方式中，提示模块202，用于：

获取所有实体类别中的每个实体类别的类别名称；

在一种可能的实施方式中，拼接模块203，用于：

在一种可能的实施方式中，实体表征模块204，用于：

在一种可能的实施方式中，识别模块205，用于：

本发明提供了一种实体识别装置，针对医学文本常见的嵌套实体情况，提出基于实体头尾位置分类的编解码方式，可以有效的解决嵌套实体表征问题。同时为了融入预训练任务和实体识别任务，使用提示学习更好的学习到当前实体的类别信息表征，统一了上游预训练任务和下游命名实体识别任务，更精准的抽取实体。

关于实体识别装置的具体限定可以参见上文中对于实体识别方法的限定，在此不再赘述。上述实体识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务端，其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的实体识别方法服务端侧的功能或步骤。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是客户端，其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的实体识别方法客户端侧的功能或步骤。

在一种可能的实施方式中，如图6所示，本申请实施例提供了一种电子设备300，包括：包括存储器310、处理器320及存储在存储器310上并可在处理器320上运行的计算机程序311，处理器320执行计算机程序311时，实现：获取待识别文本的文本信息和待识别实体的目标类别信息；根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息，作为目标提示信息；将所述目标提示信息和所述文本信息拼接后输入预训练语言模型，得到所述文本信息在目标提示信息下的语义表征信息，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量；将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息，并基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征；将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别。

在一种可能的实施方式中，如图7所示，本申请实施例提供了一种计算机可读存储介质400，其上存储有计算机程序411，该计算机程序411被处理器执行时实现：获取待识别文本的文本信息和待识别实体的目标类别信息；根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息，作为目标提示信息；将所述目标提示信息和所述文本信息拼接后输入预训练语言模型，得到所述文本信息在目标提示信息下的语义表征信息，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量；将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息，并基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征；将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别。

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于：电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言，诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

本领域普通技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个计算装置上，或者分布在多个计算装置所组成的网络上，可选地，他们可以用计算机装置可执行的程序代码来实现，从而可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件的结合。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里上述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种基于人工智能的实体识别方法，其特征在于，包括：

获取待识别文本的文本信息和待识别实体的目标类别信息；

2.如权利要求1所述的基于人工智能的实体识别方法，其特征在于，在所述根据所述目标类别信息在预设提示信息库中确定与所述目标类别信息对应的提示信息的步骤之前，还包括：

获取历史文本信息的历史实体识别结果；

3.如权利要求2所述的基于人工智能的实体识别方法，其特征在于，所述针对所有实体类别中的每个实体类别构建提示信息，得到预设提示信息库的步骤，包括：

获取所有实体类别中的每个实体类别的类别名称；

4.如权利要求2所述的基于人工智能的实体识别方法，其特征在于，在所述将所述目标提示信息和所述文本信息拼接后输入预训练语言模型的步骤之前，还包括：

基于所述训练集训练初始语言模型，得到预训练语言模型，所述预训练语言模型用于在不同提示信息下生成同一文本的不同文本表征向量，所述初始语言模型为文本表征模型。

5.如权利要求1所述的基于人工智能的实体识别方法，其特征在于，所述将所述语义表征信息输入预设前馈神经网络对，得到所述语义表征信息中头实体的第一位置信息和尾实体的第二位置信息的步骤，包括：

6.如权利要求1所述的基于人工智能的实体识别方法，其特征在于，所述基于所述第一位置信息、所述第二位置信息和所述目标类别信息得到由所述头实体和所述尾实体组成的实体对的实体表征的步骤，包括：

7.如权利要求1所述的基于人工智能的实体识别方法，其特征在于，所述将所述实体表征输入预设线性分类层，得到所述头实体与所述目标类别信息相对应的第一概率和所述尾实体与所述目标类别信息相对应的第二概率，并根据所述第一概率和所述第二概率完成对所述文本信息的实体识别的步骤，包括：

将所述第一概率和所述第二概率分别与概率阈值进行比较；

若所述第一概率大于或等于所述概率阈值，则确定与所述第一概率对应的头实体的类别信息为所述目标类别信息，对所述头实体进行识别；

8.一种基于人工智能的实体识别装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过所述总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1至7中任一项所述的基于人工智能的实体识别方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述的基于人工智能的实体识别方法的步骤。