CN112101035B

CN112101035B - 命名实体识别方法、装置、可读存储介质及电子设备

Info

Publication number: CN112101035B
Application number: CN202010996339.7A
Authority: CN
Inventors: 王宏; 王贺青
Original assignee: Beike Technology Co Ltd
Current assignee: Beike Technology Co Ltd
Priority date: 2020-09-21
Filing date: 2020-09-21
Publication date: 2022-08-09
Anticipated expiration: 2040-09-21
Also published as: CN112101035A

Abstract

本公开实施例公开了一种命名实体识别方法和装置，其中，该方法包括：从预设的问答日志中提取提问信息及对应的回答信息；将提问信息和回答信息输入预先训练的问答匹配模型，得到表征提问信息和回答信息是否匹配的匹配结果；如果匹配结果表示提问信息和回答信息匹配，确定提问信息的提问意图信息，以及回答信息的回答意图信息；确定提问意图信息和回答意图信息表征的意图是否一致；如果一致，从回答信息中识别与意图相关的命名实体并输出命名实体。本公开实施例可以使确定的命名实体更有针对性地对应到提问信息，有助于向知识库中添加更准确且更有针对性的命名实体，提高问答系统回复用户提问的准确性。

Description

命名实体识别方法、装置、可读存储介质及电子设备

技术领域

本公开涉及计算机技术领域，尤其是一种命名实体识别方法、装置、计算机可读存储介质及电子设备。

背景技术

随着信息技术的发展，互联网上积累了大量的数据。当人们遇到问题的时候，已经习惯从互联网上获取各种信息以解答面对的问题。线上问答系统是当前用户频繁使用的一种服务方式。

目前的线上问答系统，通常根据用户的询问语句对用户的询问意图进行识别，然后根据已有的知识库进行答案组合推荐给用户或服务提供方。

发明内容

本公开的实施例提供了一种命名实体识别方法、装置、计算机可读存储介质及电子设备。

本公开的实施例提供了一种命名实体识别方法，该方法包括：从预设的问答日志中提取提问信息及对应的回答信息；将提问信息和回答信息输入预先训练的问答匹配模型，得到表征提问信息和回答信息是否匹配的匹配结果；如果匹配结果表示提问信息和回答信息匹配，确定提问信息的提问意图信息，以及回答信息的回答意图信息；确定提问意图信息和回答意图信息表征的意图是否一致；如果一致，从回答信息中识别与意图相关的命名实体并输出命名实体。

在一些实施例中，问答匹配模型预先基于如下步骤训练得到：获取第一训练样本集合，其中，第一训练样本集合中的训练样本包括样本提问信息和样本回答信息，以及对应的表征样本提问信息和样本回答信息是否匹配的标注信息；将第一训练样本集合中的训练样本包括的样本提问信息和样本回答信息作为输入，将与输入的样本提问信息和样本回答信息对应的标注信息作为期望输出，训练得到问答匹配模型。

在一些实施例中，确定提问信息的提问意图信息，以及回答信息的回答意图信息，包括：将提问信息输入预先训练的提问意图识别模型，得到提问意图信息；将回答信息输入预先训练的回答意图识别模型，得到回答意图信息。

在一些实施例中，提问意图识别模型预先基于如下步骤训练得到：获取第二训练样本集合，其中，第二训练样本集合中的训练样本包括样本提问信息和预先标注的标注提问意图信息；将第二训练样本集合中的训练样本包括的样本提问信息作为输入，将与输入的样本提问信息对应的标注提问意图信息作为期望输出，训练得到提问意图识别模型。

在一些实施例中，回答意图识别模型预先基于如下步骤训练得到：获取第三训练样本集合，其中，第三训练样本集合中的训练样本包括样本回答信息和预先标注的标注回答意图信息；将第三训练样本集合中的训练样本包括的样本回答信息作为输入，将与输入的样本回答信息对应的标注回答意图信息作为期望输出，训练得到回答意图识别模型。

在一些实施例中，从回答信息中识别与意图相关的命名实体，包括：将回答信息输入预先训练的命名实体识别模型，得到命名实体。

在一些实施例中，命名实体识别模型预先基于如下步骤训练得到：获取第四训练样本集合，其中，第四训练样本集合中的训练样本包括样本回答信息，以及预先标注的标注命名实体；将第四训练样本集合中的训练样本包括的样本回答信息作为输入，将与输入的样本回答信息对应的标注命名实体作为期望输出，训练得到命名实体识别模型。

在一些实施例中，在从回答信息中识别与意图相关的命名实体之后，方法还包括：基于命名实体，生成用于支持用户提问的信息，并将信息存入预设的知识库中。

根据本公开实施例的另一个方面，提供了一种命名实体识别装置，该装置包括：提取模块，用于从预设的问答日志中提取提问信息及对应的回答信息；第一确定模块，用于将提问信息和回答信息输入预先训练的问答匹配模型，得到表征提问信息和回答信息是否匹配的匹配结果；第二确定模块，用于如果匹配结果表示提问信息和回答信息匹配，确定提问信息的提问意图信息，以及回答信息的回答意图信息；第三确定模块，用于确定提问意图信息和回答意图信息表征的意图是否一致；识别模块，用于如果一致，从回答信息中识别与意图相关的命名实体并输出命名实体。

在一些实施例中，第二确定模块包括：第一识别单元，用于将提问信息输入预先训练的提问意图识别模型，得到提问意图信息；第二识别单元，用于将回答信息输入预先训练的回答意图识别模型，得到回答意图信息。

在一些实施例中，识别模块进一步用于：将回答信息输入预先训练的命名实体识别模型，得到命名实体。

在一些实施例中，装置还包括：生成模块，用于基于命名实体，生成用于支持用户提问的信息，并将信息存入预设的知识库中。

根据本公开实施例的另一个方面，提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序用于执行上述命名实体识别方法。

根据本公开实施例的另一个方面，提供了一种电子设备，电子设备包括：处理器；用于存储处理器可执行指令的存储器；处理器，用于从存储器中读取可执行指令，并执行指令以实现上述命名实体识别方法。

基于本公开上述实施例提供的命名实体识别方法、装置、计算机可读存储介质及电子设备，通过对提问信息和回答信息进行匹配，并在匹配的情况下，确定提问信息的提问意图信息，以及回答信息的回答意图信息，在提问意图信息和回答意图信息表征的意图一致的情况下，从回答信息中识别与意图相关的命名实体并输出命名实体，从而实现了在确定命名实体时，使回答信息和提问信息精确匹配，且回答信息和提问信息表征的意图一致，即预先对回答信息进行筛选，最终确定的命名实体更有针对性地对应到提问信息，有助于向知识库中添加更准确且更有针对性的命名实体，提高问答系统回复用户提问的准确性。

下面通过附图和实施例，对本公开的技术方案做进一步的详细描述。

附图说明

通过结合附图对本公开实施例进行更详细的描述，本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解，并且构成说明书的一部分，与本公开实施例一起用于解释本公开，并不构成对本公开的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1是本公开所适用的系统图。

图2是本公开一示例性实施例提供的命名实体识别方法的流程示意图。

图3是本公开的实施例的命名实体识别方法的一个具体示例的示意图。

图4是本公开一示例性实施例提供的命名实体识别装置的结构示意图。

图5是本公开另一示例性实施例提供的命名实体识别装置的结构示意图。

图6是本公开一示例性实施例提供的电子设备的结构图。

具体实施方式

下面，将参考附图详细地描述根据本公开的示例实施例。显然，所描述的实施例仅仅是本公开的一部分实施例，而不是本公开的全部实施例，应理解，本公开不受这里描述的示例实施例的限制。

应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

本领域技术人员可以理解，本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等，既不代表任何特定技术含义，也不表示它们之间的必然逻辑顺序。

还应理解，在本公开实施例中，“多个”可以指两个或两个以上，“至少一个”可以指一个、两个或两个以上。

还应理解，对于本公开实施例中提及的任一部件、数据或结构，在没有明确限定或者在前后文给出相反启示的情况下，一般可以理解为一个或多个。

另外，本公开中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本公开中字符“/”，一般表示前后关联对象是一种“或”的关系。

还应理解，本公开对各个实施例的描述着重强调各个实施例之间的不同之处，其相同或相似之处可以相互参考，为了简洁，不再一一赘述。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备，其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于：个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境，等等。

终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常，程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等，它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施，分布式云计算环境中，任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中，程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。

申请概述

目前的线上问答系统，通常基于用户意图识别来回复提问，但意图识别只从用户角度出发，存在识别偏差，从而会造成目前线上问答的答案采纳率不高。在训练意图识别模型时，需要将用户提问和服务提供方的回答进行精确匹配，当训练意图识别模型需要大量的样本时，这些样本无法做到一问一答精准匹配，从而导致回复答案准确性降低。此外，现有的知识库中通常没有将回答信息中的命名实体收录其中，导致知识库覆盖问题的全面性较低，不利用提高答案采纳率。

示例性系统

图1示出了可以应用本公开的实施例的命名实体识别方法或命名实体识别装置的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101，网络102和服务器103。网络102用于在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101通过网络102与服务器103交互，以接收或发送消息等。终端设备101上可以安装有各种通讯客户端应用，例如购物类应用、房屋交易应用、搜索类应用、网页浏览器应用、即时通信工具等。

终端设备101可以是各种电子设备，包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。

服务器103可以是提供各种服务的服务器，例如对终端设备101上传的提问信息进行回复的后台问答服务器。后台问答服务器可以对获取的提问信息和回答信息进行处理，得到处理结果(例如命名实体)。

需要说明的是，本公开的实施例所提供的命名实体识别方法可以由服务器103执行，也可以由终端设备101执行，相应地，命名实体识别装置可以设置于服务器103中，也可以设置于终端设备101中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。在提问信息和回答信息不需要从远程获取的情况下，上述系统架构可以不包括网络，只包括服务器或终端设备。

示例性方法

图2是本公开一示例性实施例提供的命名实体识别方法的流程示意图。本实施例可应用在电子设备(如图1所示的终端设备101或服务器103)上，如图2所示，该方法包括如下步骤：

步骤201，从预设的问答日志中提取提问信息及对应的回答信息。

在本实施例中，电子设备可以从预设的问答日志中提取提问信息及对应的回答信息。其中，问答日志可以是在一定的时间段内对多个用户使用如图1所示的终端设备提出的大量提问信息和服务提供方针对提问信息回复的回答信息所做的记录。

步骤202，将提问信息和回答信息输入预先训练的问答匹配模型，得到表征提问信息和回答信息是否匹配的匹配结果。

在本实施例中，电子设备可以将提问信息和回答信息输入预先训练的问答匹配模型，得到表征提问信息和回答信息是否匹配的匹配结果。具体地，针对一个提问信息，其对应的回答信息可能符合也可能不符合上下文的意思。例如，如果提问信息为“这个房子是几层的”，回答信息为“六层的”，则回答信息符合上下文的意思，两者匹配。如果提问信息为“这个房子可以上什么小学？”，回答信息为“您想要几楼的房子呢”，则回答信息不符合上下文的意思，两者不匹配。

上述问答匹配模型用于对提问信息和回答信息进行匹配，并输出匹配结果。匹配结果用于表征提问信息和回答信息是否匹配，匹配结果可以为各种形式的信息。例如“1”代表匹配，“0”代表不匹配。通常，问答匹配模型可以输出一个概率值，该概率值可以为表示提问信息和回答信息相匹配的概率，当概率值大于预设阈值(例如0.5)时，匹配结果为“1”，否则为“0”。

问答匹配模型可以利用各种结构的初始模型(例如BERT、ELMO等)，采用机器学习方法训练得到。采用预先训练的问答匹配模型进行匹配，可以提高将提问信息和回答信息进行匹配的准确性。

可选的，电子设备可以利用其他方式确定提问信息和回答信息是否匹配。例如，可以利用预先统计的、包含大量问答信息对的对应关系表确定提问信息和回答信息是否匹配。电子设备可以从该对应关系表中包括的问答信息对中，确定是否存在与步骤201中提取的提问信息和回答信息相同或相似的问答信息对，如果有则可以确定提问信息和回答信息匹配，否则不匹配。

步骤203，如果匹配结果表示提问信息和回答信息匹配，确定提问信息的提问意图信息，以及回答信息的回答意图信息。

在本实施例中，如果匹配结果表示提问信息和回答信息提问信息和回答信息匹配，电子设备可以确定提问信息的提问意图信息，以及回答信息的回答意图信息。

作为示例，电子设备可以利用现有的意图识别方法确定提问信息的提问意图信息，以及回答信息的回答意图信息。上述意图识别方法可以包括但不限于以下至少一种：基于规则模板的方法、基于语法的方法、基于统计的方法等。

上述提问意图信息用于表征用户提问的意图，回答意图信息用于表征服务提供方回答的意图。提问意图信息和回答意图信息可以包含在预设的意图体系中。例如，当提问信息和回答信息与房屋相关时，意图体系可以表征楼层、楼盘、楼龄、售价等。作为示例，假设提问信息为“这套房子几楼的？”，提问意图信息为“房屋-所在楼层”。假设回答信息为“这套房子在5楼”，回答意图信息为“房屋-所在楼层-5层”。

步骤204，确定提问意图信息和回答意图信息表征的意图是否一致。

在本实施例中，电子设备可以确定提问意图信息和回答意图信息表征的意图是否一致。具体地，可以将提问意图信息和回答意图信息进行对比，当提问意图信息和回答意图信息完全相同或部分相同时，确定提问意图信息和回答意图信息表征的意图一致。例如，提问意图信息为“房屋-所在楼层”，回答意图信息为“房屋-所在楼层-5层”，则提问意图信息和回答意图信息表征的意图一致。

步骤205，如果一致，从回答信息中识别与上述意图相关的命名实体并输出命名实体。

在本实施例中，如果提问意图信息和回答意图信息表征的意图一致，电子设备可以从回答信息中识别与上述意图相关的命名实体并输出命名实体。其中，命名实体是指在文本中识别出的特殊对象，这些对象的语义类别通常在识别前被预定义好，预定义类别如人、地址、组织等。例如，回答信息为：“这个房子对应的小学是阳光小学”，回答意图信息为：“小区-小学”，则与意图相关的命名实体为：“阳光小学”。回答信息为：“这个小区的物业是乐阳物业公司”，回答意图信息为：“小区-物业”，则与意图相关的命名实体为：“乐阳物业公司”。

电子设备可以利用现有的各种方法从回答信息中识别命名实体。例如，命名实体识别方法可以包括但不限于以下至少一种：基于规则模板的方法、基于统计的方法、基于深度学习的方法等。

在识别出命名实体后，电子设备可以进一步按照各种方式输出命名实体。例如，可以将命名实体在显示器上显示，或将命名实体存入预设的知识库中。

本公开的上述实施例提供的方法，通过对提问信息和回答信息进行匹配，并在匹配的情况下，确定提问信息的提问意图信息，以及回答信息的回答意图信息，在提问意图信息和回答意图信息表征的意图一致的情况下，从回答信息中识别与意图相关的命名实体并输出命名实体，从而实现了在确定命名实体时，使回答信息和提问信息精确匹配，且回答信息和提问信息表征的意图一致，即预先对回答信息进行筛选，最终确定的命名实体更有针对性地对应到提问信息，有助于向知识库中添加更准确且更有针对性的命名实体，提高问答系统回复用户提问的准确性。

在一些可选的实现方式中，问答匹配模型预先基于如下步骤训练得到：

首先，获取第一训练样本集合。其中，第一训练样本集合中的训练样本包括样本提问信息和样本回答信息，以及对应的表征样本提问信息和样本回答信息是否匹配的标注信息。第一训练样本集合可以是电子设备从远程或从本地获取的，样本提问信息和样本回答信息可以是从上述问答日志中提取的，也可以是单独设置的。标注信息可以为人工设置的，例如“1”表示匹配(正样本)，“0”表示不匹配(负样本)。通常，正样本和负样本的数量比例可以任意设置(例如1:1)。

然后，将第一训练样本集合中的训练样本包括的样本提问信息和样本回答信息作为输入，将与输入的样本提问信息和样本回答信息对应的标注信息作为期望输出，训练得到问答匹配模型。

具体地，电子设备可以利用机器学习方法，将第一训练样本集合中的训练样本包括的样本提问信息和样本回答信息作为输入，将与输入的样本提问信息和样本回答信息对应的标注信息作为期望输出，对初始模型(例如BERT、ELMO等)进行训练，针对每次训练输入的样本提问信息和样本回答信息，可以得到实际输出。其中，实际输出是初始模型实际输出的数据，用于表征标注信息。然后，电子设备可以采用梯度下降法和反向传播法，基于实际输出和期望输出，调整初始模型的参数，将每次调整参数后得到的模型作为下次训练的初始模型，并在满足预设的训练结束条件的情况下，结束训练，从而训练得到问答匹配模型。

需要说明的是，这里预设的训练结束条件可以包括但不限于以下至少一项：训练时间超过预设时长；训练次数超过预设次数；利用预设的损失函数(例如交叉熵损失函数)计算所得的损失值收敛。

本实现方式提供的利用机器学习方法训练得到的问答匹配模型，可以使提问信息和回答信息的匹配结果更加准确，有助于更有针对性地从回答信息中识别命名实体。

在一些可选的实现方式中，步骤203可以如下执行：

将提问信息输入预先训练的提问意图识别模型，得到提问意图信息。以及将回答信息输入预先训练的回答意图识别模型，得到回答意图信息。

其中，提问意图识别模型用于表征提问信息和提问意图信息的对应关系，回答意图识别模型用于表征回答信息和回答意图信息的对应关系。提问意图识别模型和回答意图识别模型可以利用各种结构的初始模型(例如TextCNN、LSTM等)，采用机器学习方法训练得到。采用预先训练的提问意图识别模型和回答意图识别模型进行意图识别，可以提高识别用户提问的意图和服务提供方回答的意图的准确性。

在一些可选的实现方式中，提问意图识别模型可以基于如下步骤训练得到：

首先，获取第二训练样本集合，其中，第二训练样本集合中的训练样本包括样本提问信息和预先标注的标注提问意图信息。第二训练样本集合可以是电子设备从远程或从本地获取的，样本提问信息可以是从上述问答日志中提取的，也可以是单独设置的。标注提问意图信息可以是人工设置的。例如，样本提问信息为“这个房子对口的小学是哪所？”，标注提问意图信息为“小区-小学”。

然后，将第二训练样本集合中的训练样本包括的样本提问信息作为输入，将与输入的样本提问信息对应的标注提问意图信息作为期望输出，训练得到提问意图识别模型。这里，训练提问意图识别模型的方法与上述训练问答匹配模型的方法相似，这里不再赘述。

本实现方式提供的利用机器学习方法训练得到的提问意图识别模型，可以更精确地识别用户意图，有助于更有针对性地从回答信息中识别命名实体。

在一些可选的实现方式中，回答意图识别模型可以基于如下步骤训练得到：

首先，获取第三训练样本集合，其中，第三训练样本集合中的训练样本包括样本回答信息和预先标注的标注回答意图信息。第三训练样本集合可以是电子设备从远程或从本地获取的，样本回答信息可以是从上述问答日志中提取的，也可以是单独设置的。标注回答意图信息可以是人工设置的。例如，样本回答信息为“这个房子对口的小学是阳光小学。”，标注回答意图信息为“小区-小学-阳光小学”。

然后，将第三训练样本集合中的训练样本包括的样本回答信息作为输入，将与输入的样本回答信息对应的标注回答意图信息作为期望输出，训练得到回答意图识别模型。这里，训练回答意图识别模型的方法与上述训练问答匹配模型的方法相似，这里不再赘述。

本实现方式提供的利用机器学习方法训练得到的回答意图识别模型，可以更精确地识别服务提供方的意图，有助于更有针对性地从回答信息中识别命名实体。

在一些可选的实现方式中，步骤205可以如下执行：

将回答信息输入预先训练的命名实体识别模型，得到命名实体。

其中，命名实体识别模型用于表征回答信息和命名实体的对应关系。命名实体识别模型可以利用各种结构的初始模型(例如由BERT-LSTM-CRF组成)，采用机器学习方法训练得到。采用预先训练的命名实体识别模型进行命名实体识别，可以提高命名实体识别准确性。

在一些可选的实现方式中，上述命名实体识别模型预先基于如下步骤训练得到：

首先，获取第四训练样本集合。其中，第四训练样本集合中的训练样本包括样本回答信息，以及预先标注的标注命名实体。第四训练样本集合可以是电子设备从远程或从本地获取的，样本回答信息可以是从上述问答日志中提取的，也可以是单独设置的。标注命名实体可以是人工设置的。例如，样本回答信息为“附近的地铁是xxx地铁站”，标注命名实体为“xxx地铁站”。

然后，将第四训练样本集合中的训练样本包括的样本回答信息作为输入，将与输入的样本回答信息对应的标注命名实体作为期望输出，训练得到命名实体识别模型。这里，训练命名实体识别模型的方法与上述训练问答匹配模型的方法相似，这里不再赘述。

本实现方式提供的利用机器学习方法训练得到的命名实体识别模型，可以更精确地从回答信息中识别命名实体。

在一些可选的实现方式中，在步骤205之后，电子设备还可以执行如下步骤：

基于命名实体，生成用于支持用户提问的信息，并将信息存入预设的知识库中。其中，用于支持用户提问的信息用于在用户提问时，根据用户输入的询问语句输出相应的回复内容。作为示例，上述用于支持用户提问的信息可以是结构化的信息存储在知识库中。例如结构化的信息为三元组信息，包括<房源1，小区-小学，阳光小学>，<房源2，房屋-楼层，6层>等。当用户询问房源1对应的小学的信息时，则从知识库中查找，找到<房源1，小区-小学，阳光小学>，从中提取学校信息(即阳光小学)作为答案返回给用户。

本实现方式将命名实体存入知识库中，由于命名实体是从经过筛选的回答信息中识别的，因此，可以使知识库中的信息更加具有针对性，有助于在用户提问时，向用户更精确地推送答案。

继续参见图3，图3是根据本实施例的命名实体识别方法的一个具体示例的示意图。电子设备首先从包括历史聊天数据的问答日志中提取提问信息和回答信息，经过人工标注生成的问答信息对及对应的标注信息，提问信息和对应的标注提问意图信息，回答信息和对应的标注回答意图信息，以及回答信息和对应的标注命名实体。然后，利用问答信息对和标注信息训练BERT问答匹配模型，利用提问信息和对应的标注提问意图信息训练textCNN提问意图识别模型，利用回答信息和对应的标注回答意图信息训练textCNN回答意图识别模型，利用回答信息和对应的标注命名实体训练BERT-LSTM-CRF命名实体识别模型。然后将各个模型应用到上述各步骤中，得到命名实体，最后将命名实体添加到知识库中。

示例性装置

图4是本公开一示例性实施例提供的命名实体识别装置的结构示意图。本实施例可应用在电子设备上，如图4所示，命名实体识别装置包括：提取模块401，用于从预设的问答日志中提取提问信息及对应的回答信息；第一确定模块402，用于将提问信息和回答信息输入预先训练的问答匹配模型，得到表征提问信息和回答信息是否匹配的匹配结果；第二确定模块403，用于如果匹配结果表示提问信息和回答信息匹配，确定提问信息的提问意图信息，以及回答信息的回答意图信息；第三确定模块404，用于确定提问意图信息和回答意图信息表征的意图是否一致；识别模块405，用于如果一致，从回答信息中识别与意图相关的命名实体并输出命名实体。

在本实施例中，提取模块401可以从预设的问答日志中提取提问信息及对应的回答信息。其中，问答日志可以是在一定的时间段内记录的、多个用户使用如图1所示的终端设备提出的大量提问信息和服务提供方针对提问信息回复的回答信息。

在本实施例中，第一确定模块402可以将提问信息和回答信息输入预先训练的问答匹配模型，得到表征提问信息和回答信息是否匹配的匹配结果。具体地，针对一个提问信息，其对应的回答信息可能符合也可能不符合上下文的意思。例如，如果提问信息为“这个房子是几层的”，回答信息为“六层的”，则回答信息符合上下文的意思，两者匹配。如果提问信息为“这个房子可以上什么小学？”，回答信息为“您想要几楼的房子呢”，则回答信息不符合上下文的意思，两者不匹配。

可选的，上述第一确定模块402可以利用其他方式确定提问信息和回答信息是否匹配。例如，可以利用预先统计的、包含大量问答信息对的对应关系表确定提问信息和回答信息是否匹配。第一确定模块402可以从该对应关系表中包括的问答信息对中，确定是否存在与提取模块401提取到的提问信息和回答信息相同或相似的问答信息对，如果有则可以确定提问信息和回答信息匹配，否则不匹配。

在本实施例中，如果匹配结果表示提问信息和回答信息，第二确定模块403可以确定提问信息的提问意图信息，以及回答信息的回答意图信息。

作为示例，第二确定模块403可以利用现有的意图识别方法确定提问信息的提问意图信息，以及回答信息的回答意图信息。上述意图识别方法可以包括但不限于以下至少一种：基于规则模板的方法、基于语法的方法、基于统计的方法等。

上述提问意图信息用于表征用户提问的意图，回答意图信息用于表征服务提供方回答的意图。提问意图信息和回答意图信息可以包含在预设的意图体系红。例如，当提问信息和回答信息与房屋相关时，意图体系可以表征楼层、楼盘、楼龄、售价等。作为示例，假设提问信息为“这套房子几楼的？”，提问意图信息为“房屋-所在楼层”。假设回答信息为“这套房子在5楼”，回答意图信息为“房屋-所在楼层-5层”。

在本实施例中，第三确定模块404可以确定提问意图信息和回答意图信息表征的意图是否一致。具体地，可以将提问意图信息和回答意图信息进行对比，当提问意图信息和回答意图信息完全相同或部分相同时，确定提问意图信息和回答意图信息表征的意图一致。例如，提问意图信息为“房屋-所在楼层”，回答意图信息为“房屋-所在楼层-5层”，则提问意图信息和回答意图信息表征的意图一致。

在本实施例中，如果提问意图信息和回答意图信息表征的意图一致，识别模块405可以从回答信息中识别与意图相关的命名实体并输出命名实体。其中，命名实体是指在文本中识别出的特殊对象，这些对象的语义类别通常在识别前被预定义好，预定义类别如人、地址、组织等。例如，回答信息为：“这个房子对应的小学是阳光小学”。命名实体为：“阳光小学”。回答信息为：“这个小区的物业是乐阳物业公司”。命名实体为：“乐阳物业公司”。

上述识别模块405可以利用现有的各种方法从回答信息中识别命名实体。例如，命名实体识别方法可以包括但不限于以下至少一种：基于规则模板的方法、基于统计的方法、基于深度学习的方法等。

参照图5，图5是本公开另一示例性实施例提供的命名实体识别装置的结构示意图。

在一些可选的实现方式中，问答匹配模型预先基于如下步骤训练得到：获取第一训练样本集合，其中，第一训练样本集合中的训练样本包括样本提问信息和样本回答信息，以及对应的表征样本提问信息和样本回答信息是否匹配的标注信息；将第一训练样本集合中的训练样本包括的样本提问信息和样本回答信息作为输入，将与输入的样本提问信息和样本回答信息对应的标注信息作为期望输出，训练得到问答匹配模型。

在一些可选的实现方式中，第二确定模块403包括：第一识别单元4031，用于将提问信息输入预先训练的提问意图识别模型，得到提问意图信息；第二识别单元4032，用于将回答信息输入预先训练的回答意图识别模型，得到回答意图信息。

在一些可选的实现方式中，提问意图识别模型预先基于如下步骤训练得到：获取第二训练样本集合，其中，第二训练样本集合中的训练样本包括样本提问信息和预先标注的标注提问意图信息；将第二训练样本集合中的训练样本包括的样本提问信息作为输入，将与输入的样本提问信息对应的标注提问意图信息作为期望输出，训练得到提问意图识别模型。

在一些可选的实现方式中，回答意图识别模型预先基于如下步骤训练得到：获取第三训练样本集合，其中，第三训练样本集合中的训练样本包括样本回答信息和预先标注的标注回答意图信息；将第三训练样本集合中的训练样本包括的样本回答信息作为输入，将与输入的样本回答信息对应的标注回答意图信息作为期望输出，训练得到回答意图识别模型。

在一些可选的实现方式中，识别模块405进一步用于：将回答信息输入预先训练的命名实体识别模型，得到命名实体。

在一些可选的实现方式中，命名实体识别模型预先基于如下步骤训练得到：获取第四训练样本集合，其中，第四训练样本集合中的训练样本包括样本回答信息，以及预先标注的标注命名实体；将第四训练样本集合中的训练样本包括的样本回答信息作为输入，将与输入的样本回答信息对应的标注命名实体作为期望输出，训练得到命名实体识别模型。

在一些可选的实现方式中，装置还包括：生成模块406，用于基于命名实体，生成用于支持用户提问的信息，并将信息存入预设的知识库中。

本公开上述实施例提供的命名实体识别装置，通过对提问信息和回答信息进行匹配，并在匹配的情况下，确定提问信息的提问意图信息，以及回答信息的回答意图信息，在提问意图信息和回答意图信息表征的意图一致的情况下，从回答信息中识别与意图相关的命名实体并输出命名实体，从而实现了在确定命名实体时，使回答信息和提问信息精确匹配，且回答信息和提问信息表征的意图一致，可以使确定的命名实体更有针对性地对应到提问信息，有助于向知识库中添加更准确且更有针对性的命名实体，提高问答系统回复用户提问的准确性。

示例性电子设备

下面，参考图6来描述根据本公开实施例的电子设备。该电子设备可以是如图1所示的终端设备101和服务器103中的任一个或两者、或与它们独立的单机设备，该单机设备可以与终端设备101和服务器103进行通信，以从它们接收所采集到的输入信号。

图6图示了根据本公开实施例的电子设备的框图。

如图6所示，电子设备600包括一个或多个处理器601和存储器602。

处理器601可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备600中的其他组件以执行期望的功能。

存储器602可以包括一个或多个计算机程序产品，计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器601可以运行程序指令，以实现上文的本公开的各个实施例的命名实体识别方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如提问信息、回答信息等各种内容。

在一个示例中，电子设备600还可以包括：输入装置603和输出装置604，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

例如，在该电子设备是终端设备101或服务器103时，该输入装置603可以是鼠标、键盘、麦克风等设备，用于输入提问信息和回答信息。在该电子设备是单机设备时，该输入装置603可以是通信网络连接器，用于从终端设备101和服务器103接收所输入的提问信息和回答信息。

该输出装置604可以向外部输出各种信息，包括确定出的命名实体。该输出设备604可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图6中仅示出了该电子设备600中与本公开有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备600还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外，本公开的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的命名实体识别方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本公开的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的命名实体识别方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本公开的基本原理，但是，需要指出的是，在本公开中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本公开为必须采用上述具体的细节来实现。

本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

可能以许多方式来实现本公开的方法和装置。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明，本公开的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本公开实施为记录在记录介质中的程序，这些程序包括用于实现根据本公开的方法的机器可读指令。因而，本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

还需要指出的是，在本公开的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此，本公开不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种命名实体识别方法，包括：

从预设的问答日志中提取提问信息及对应的回答信息；

将所述提问信息和所述回答信息输入预先训练的问答匹配模型，得到表征所述提问信息和所述回答信息是否匹配的匹配结果；

如果所述匹配结果表示所述提问信息和所述回答信息匹配，确定所述提问信息的提问意图信息，以及所述回答信息的回答意图信息；

确定所述提问意图信息和所述回答意图信息表征的意图是否一致；

如果一致，从所述回答信息中识别与所述意图相关的命名实体并输出所述命名实体。

2.根据权利要求1所述的方法，其中，所述问答匹配模型预先基于如下步骤训练得到：

获取第一训练样本集合，其中，所述第一训练样本集合中的训练样本包括样本提问信息和样本回答信息，以及对应的表征样本提问信息和样本回答信息是否匹配的标注信息；

将所述第一训练样本集合中的训练样本包括的样本提问信息和样本回答信息作为输入，将与输入的样本提问信息和样本回答信息对应的标注信息作为期望输出，训练得到所述问答匹配模型。

3.根据权利要求1所述的方法，其中，所述确定所述提问信息的提问意图信息，以及所述回答信息的回答意图信息，包括：

将所述提问信息输入预先训练的提问意图识别模型，得到所述提问意图信息；

将所述回答信息输入预先训练的回答意图识别模型，得到所述回答意图信息。

4.根据权利要求3所述的方法，其中，所述提问意图识别模型预先基于如下步骤训练得到：

获取第二训练样本集合，其中，所述第二训练样本集合中的训练样本包括样本提问信息和预先标注的标注提问意图信息；

将所述第二训练样本集合中的训练样本包括的样本提问信息作为输入，将与输入的样本提问信息对应的标注提问意图信息作为期望输出，训练得到所述提问意图识别模型。

5.根据权利要求3所述的方法，其中，所述回答意图识别模型预先基于如下步骤训练得到：

获取第三训练样本集合，其中，所述第三训练样本集合中的训练样本包括样本回答信息和预先标注的标注回答意图信息；

将所述第三训练样本集合中的训练样本包括的样本回答信息作为输入，将与输入的样本回答信息对应的标注回答意图信息作为期望输出，训练得到所述回答意图识别模型。

6.根据权利要求1所述的方法，其中，所述从所述回答信息中识别与所述意图相关的命名实体，包括：

将所述回答信息输入预先训练的命名实体识别模型，得到所述命名实体。

7.根据权利要求6所述的方法，其中，所述命名实体识别模型预先基于如下步骤训练得到：

获取第四训练样本集合，其中，所述第四训练样本集合中的训练样本包括样本回答信息，以及预先标注的标注命名实体；

将所述第四训练样本集合中的训练样本包括的样本回答信息作为输入，将与输入的样本回答信息对应的标注命名实体作为期望输出，训练得到所述命名实体识别模型。

8.根据权利要求1-7之一所述的方法，其中，在所述从所述回答信息中识别与所述意图相关的命名实体之后，所述方法还包括：

基于所述命名实体，生成用于支持用户提问的信息，并将所述信息存入预设的知识库中。

9.一种命名实体识别装置，包括：

提取模块，用于从预设的问答日志中提取提问信息及对应的回答信息；

第一确定模块，用于将所述提问信息和所述回答信息输入预先训练的问答匹配模型，得到表征所述提问信息和所述回答信息是否匹配的匹配结果；

第二确定模块，用于如果所述匹配结果表示所述提问信息和所述回答信息，确定所述提问信息的提问意图信息，以及所述回答信息的回答意图信息；

第三确定模块，用于确定所述提问意图信息和所述回答意图信息表征的意图是否一致；

识别模块，用于如果一致，从所述回答信息中识别与所述意图相关的命名实体并输出所述命名实体。

10.根据权利要求9所述的装置，其中，所述问答匹配模型预先基于如下步骤训练得到：

11.根据权利要求9所述的装置，其中，所述第二确定模块包括：

第一识别单元，用于将所述提问信息输入预先训练的提问意图识别模型，得到所述提问意图信息；

第二识别单元，用于将所述回答信息输入预先训练的回答意图识别模型，得到所述回答意图信息。

12.根据权利要求11所述的装置，其中，所述提问意图识别模型预先基于如下步骤训练得到：

13.根据权利要求11所述的装置，其中，所述回答意图识别模型预先基于如下步骤训练得到：

14.根据权利要求9所述的装置，其中，所述识别模块进一步用于：

15.根据权利要求14所述的装置，其中，所述命名实体识别模型预先基于如下步骤训练得到：

16.根据权利要求9-15之一所述的装置，其中，所述装置还包括：

生成模块，用于基于所述命名实体，生成用于支持用户提问的信息，并将所述信息存入预设的知识库中。

17.一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述权利要求1-8任一所述的方法。

18.一种电子设备，所述电子设备包括：

处理器；

用于存储所述处理器可执行指令的存储器；

所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现上述权利要求1-8任一所述的方法。