CN112328759A

CN112328759A - 自动问答方法、装置、设备及存储介质

Info

Publication number: CN112328759A
Application number: CN202011187360.9A
Authority: CN
Inventors: 侯丽; 刘翔
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-10-29
Filing date: 2020-10-29
Publication date: 2021-02-05
Also published as: WO2022088671A1

Abstract

本发明涉及人工智能技术领域，公开了一种自动问答方法、装置、计算机设备及计算机可读存储介质，该方法包括：根据预置别名词典，获取待预测问题中各个字词的候选实体；基于预置实体识别模型，根据待预测问题和多个所述候选实体，确定待预测问题对应的实体名；根据实体名和预置图数据库，确定实体名对应的三元组；基于预置属性映射模型，根据各个属性名和所述待预测问题确定待预测问题对应的目标属性名，并将目标属性名对应的属性值作为待预测问题的问答，实现预置实体识别模型对问题的实体识别和使用属性映射模型对问题的属性映射都进行语义编码，提高机器阅读文本的表示能力和泛化能力，从而提升了预置实体识别模型和属性映射模型的准确率。

Description

自动问答方法、装置、设备及存储介质

技术领域

本申请涉及人工智能技术领域，尤其涉及一种自动问答方法、装置、计算机设备及计算机可读存储介质。

背景技术

知识图谱技术是人工智能技术的重要组成部分，以结构化的方式描述客观世界中的概念、实体及其键的关系。知识图谱技术提供了一种更好的组织、管理和理解互联网海量信息的能力，将互联网的信息表达成更接近于人类认知世界的形式。因此，建立一个具有语义处理能力与开放互联能力的知识库，可以在智能搜索、智能问答、个性化推荐等智能信息服务中产生应用价值。

目前主流的基于知识库的自动问答中采用的方法可以分为两类:基于语义分析(semantic parsingbased,SP-based)方法和基于信息检索(information retrieve-based,IR-based)方法。基于语义分析的方法首先将自然语言形式的问句转换为某种特定类型的逻辑表达形式。传统的语义分析其需要通过词性系信息标注好的逻辑形式作为监督，并且受制于只有少量逻辑谓词狭窄域。而信息检索的方法首先通过比较粗糙的方法,从知识库中获取一系列的候选答案,然后对问句和候选答案进行特征抽取,利用它们对候选答案进行排序,选择得分最高的作为最终答案，但信息检索的方法缺少对深层语义的理解，导致自动问答准确率较低。

发明内容

本申请的主要目的在于提供一种自动问答方法、装置、计算机设备及计算机可读存储介质，旨在解决传统的语义分析其需要标注好的逻辑形式作为监督数据，并且依赖少量的逻辑谓词，而信息检索缺少对深层语义的理解，从而导致语义分析和信息检索的自动问答准确率较低的技术问题。

第一方面，本申请提供一种自动问答方法，所述自动问答方法包括以下步骤：

根据预置别名词典，获取待预测问题中各个字词的实体别名，并将所述实体别名作为候选实体，其中，所述实体别名和所述候选实体为多个；

基于预置实体识别模型，根据所述待预测问题和多个所述候选实体，确定所述待预测问题对应的实体名；

根据所述实体名和预置图数据库，确定所述预置图数据库中所述实体名对应的三元组，其中，所述三元组包括所述实体名、属性名和属性值，所述三元组为多个；

基于预置属性映射模型，根据各个所述属性名和所述待预测问题确定所述待预测问题对应的目标属性名，并将所述目标属性名对应的属性值作为所述待预测问题的问答。

第二方面，本申请还提供一种自动问答装置，所述自动问答装置包括：

获取模块，用于根据预置别名词典，获取待预测问题中各个字词的实体别名，并将所述实体别名作为候选实体，其中，所述实体别名和所述候选实体为多个；

第一确定模块，用于基于预置实体识别模型，根据所述待预测问题和多个所述候选实体，确定所述待预测问题对应的实体名；

第二确定模块，用于根据所述实体名和预置图数据库，确定所述预置图数据库中所述实体名对应的三元组，其中，所述三元组包括属性名和属性值，所述三元组为多个；

第三确定模块，用于基于预置属性映射模型，根据各个所述属性名和所述待预测问题确定所述待预测问题对应的目标属性名，并将所述目标属性名对应的属性值作为所述待预测问题的问答。

第三方面，本申请还提供一种计算机设备，所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序，其中所述计算机程序被所述处理器执行时，实现如上述的自动问答方法的步骤。

第四方面，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其中所述计算机程序被处理器执行时，实现如上述的自动问答方法的步骤。

本申请提供一种自动问答方法、装置、计算机设备及计算机可读存储介质，通过根据预置别名词典，获取待预测问题各个字词中的实体别名，并将所述实体别名作为候选实体，其中，所述实体别名和所述候选实体为多个；基于预置实体识别模型，根据所述待预测问题和多个所述候选实体，确定所述待预测问题对应的实体名；根据所述实体名和预置图数据库，确定所述预置图数据库中所述实体名对应的三元组，其中，所述三元组包括所述实体名、属性名和属性值，所述三元组为多个；基于预置属性映射模型，根据各个所述属性名和所述待预测问题确定所述待预测问题对应的目标属性名，并将所述目标属性名对应的属性值作为所述待预测问题的问答，实现预置实体识别模型对问题的实体识别和使用属性映射模型对问题的属性映射进行语义编码，提高阅读文本的表示能力和泛化能力，从而提升了预置实体识别模型和属性映射模型的准确率，达到提高自动问答的准确率。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种自动问答方法的流程示意图；

图2为图1中的自动问答方法的子步骤流程示意图；

图3为图1中的自动问答方法的子步骤流程示意图；

图4为训练预置实体识别模型的步骤流程示意图；

图5为训练预置属性映射模型的步骤流程示意图；

图6为本申请实施例提供的一种自动问答装置的示意性框图；

图7为本申请一实施例涉及的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

附图中所示的流程图仅是示例说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解、组合或部分合并，因此实际执行的顺序有可能根据实际情况改变。

本申请实施例提供一种自动问答方法、装置、计算机设备及计算机可读存储介质。其中，该自动问答方法可应用于计算机设备中，该计算机设备可以是笔记本电脑、台式电脑等电子设备。

下面结合附图，对本申请的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

请参照图1，图1为本申请的实施例提供的一种自动问答方法的流程示意图。

如图1所示，该自动问答方法包括步骤S101至步骤S104。

步骤S101、根据预置别名词典，获取待预测问题中各个字词的实体别名，并将所述实体别名作为候选实体，其中，所述实体别名和所述候选实体为多个。

示范例的，获取待预测问题，根据预置别名词典的别名列表，获取待预测问题中各个字词的实体别名，其中，该别名列表包括多个实体别名。例如，在获取待预测问题时，基于预置别名词典的别名列表，将该别名列表中的实体别名与该待预测问题中的各个字词进行比对，若该待预测问题中的字词与该别名列表中的任意一个实体别名相同，则确定该实体名对应的别名列表中所有的实体别名，并将该所有的实体别名都为待预测问题该字词的实体别名。或者，将待预测问题拆分为多个字词，将各个字词作为搜索信息搜索别名列表，若该确定该别名列表中的任意一个实体别名与待预测问题中的字词相同，则确定该别名列表中所有的实体别名都为待预测问题中该字词的实体别名。将获取到的实体别名作为候选实体，其中，实体别名和候选实体的数量为多个。

步骤S102、基于预置实体识别模型，根据所述待预测问题和多个所述候选实体，确定所述待预测问题对应的实体名。

示范例的，预置实体识别模型为预先通过待训练数据训练第一预置预训练语言模型得到的，基于该预置实体识别模型，根据待预测问题和多个候选实体，确定该待预测问题对应的实体名。其中，实体名为问题中名称常用名，候选实体为实体别名，而实体别名为特殊名或曾用名等。例如，待预测问题为“红楼梦的作者是谁？”其中，“红楼梦”为实体名；或者，待预测问题为“石头记的作者是谁？”其中，“石头记”为实体别名，而“石头记”对应的“红楼梦”为实体名。

示范性的，将待预测问题输入该预置实体识别模型中，基于该预置实体识别模型识别出该待预测问题对应的名称，基于该名称和多个候选实体，确定该待预测问题对应的实体名。例如，将该名称与各个候选实体进行比对，若该名称与多个候选实体中的任意一个候选实体相同，则将该名称作为该待预测问题的实体名。

在一实施例中，具体地，参照图2，步骤S102包括：子步骤S1021至子步骤S1023。

子步骤S1021、根据多个所述候选实体分别对所述待预测问题中对应的字词进行替换，生成多个文本记录。

示例性的，获取待预测问题中各个字词对应的多个候选实体，基于该各个候选实体分别对该待预测问题中对应的字词进行替换，生成多个文本记录。示范性的，确定待预测问题中任意一个字词是否对应多个候选实体；若多个候选实体为同一个字词的候选实体，则确定多个候选实体对应待预测问题中的字词位置，并在该待预测问题中该字词位置处将该字词替换为各个候选实体，生成对应的多个文本记录。例如，待预测问题是“石头记的作者是谁？”而红楼梦是该待预测问题“石头记的作者是谁？”中字词“石头记”的候选实体，确定该待预测问题“石头记的作者是谁？”中石头记的位置，在待预测问题“石头记的作者是谁？”中石头记的位置处将字词“石头记”替换为候选实体“红楼梦”。或者，若多个候选实体不是同一个字词的候选实体，则确定各个候选实体对应待预测问题中的字词位置，并在该待预测问题中各个字词位置处将该字词替换为对应的候选实体，生成对应的文本记录，即文本记录的数量与候选实体的数量相同。

子步骤S1022、将多个所述文本记录分别输入预置实体识别模型，预测各个所述文本记录中候选实体的预测值。

示范例的，在获取到多个文本记录时，将各个文本记录分别输入到预置实体识别模型中，通过该预置实体识别模型预测各个文本记录中候选实体的预测值。示范性的，将各个文本记录输入到预置实体识别模型中，该预置实体识别模型包括字典文件，通过该字典文本对各个文本记录进行拆分，得到多个文本记录对应的文本序列。在得到该文本序列时，对该文本序列进行向量化表示，得到对应的文本向量信息。该预置实体识别模型包括多头注意力机制模型，将该文本向量信息输入到该多头注意力机制模型中，该多头注意力机制模型获取文本向量信息中融合上下文信息的每个单词所对应的向量表示，输出文本语义向量信息。获取该文本语义向量信息中各个文本记录对应的语义向量，该预置实体识别模型包括线性转换层，通过该线性转换层对各个文本记录对应的文本语义向量信息进行线性转换，得到各个文本记录中候选实体的预测值。

子步骤S1023、根据所述各个所述文本记录中候选实体的预测值，确定目标文本记录中的候选实体为实体名，将所述实体名作为所述待预测问题对应的实体名。

实施例的，在获取到各个文本记录中候选实体的预测值时，将各个文本记录中候选实体的预测值进行比对，确定候选别名的预测值最高的文本记录。获取预置实体识别模型输出该候选别名的预测值最高的目标文本记录，将该候选别名预测值最高的目标文本记录中的候选实体作为该待预测问题中的实体名。

步骤S103、根据所述实体名和预置图数据库，确定所述预置图数据库中所述实体名对应的三元组；其中，所述三元组包括所述实体名、属性名和属性值，所述三元组为多组。

示范例的，在获取到待预测问题的实体名时，基于该实体名查询预置图数据库，该预置图数据库包括多组三元组，其中每一组三元组都是通过结构的方式存储在图数据中。通过该实体名查询预置图数据库，获取该预置图数据库中该实体名对应的多组三元组，该三元组包括该实体名、属性名和属性值。示范性的，当该实体名为笑傲江湖时，基于该笑傲江湖在预置图数据库中进行搜索，得到该笑傲江湖对应的三元组“《笑傲江湖》|||语言版本|||粤语、普通话”，其中，该语言版本作为属性名；粤语、普通话作为属性值，笑傲江湖对应的三元组为多组。

步骤S104、基于预置属性映射模型，根据各个所述属性名和所述待预测问题确定所述待预测问题对应的目标属性名，并将所述目标属性名对应的属性值作为所述待预测问题的问答。

示范例的，在获取到实体名对应的多组三元组时，通过将该待预测问题与各组三元组中的属性值进行组合，得到各个属性文本对。将各个属性文本对输入到预置属性映射模型中，该预置属性映射模型预测各个属性文本对的预测分值，确定预测分值最高的属性文本对，将该预测分值最高的属性文本对作为目标属性文本对，获取预置属性映射模型输出的该目标属性文本对。在获取到该目标属性文本对时，确定该目标数据文本对中的属性名为目标属性名，基于该目标属性名确定该图数据库中该目标属性名对应的三元组，将该目标属性名对应的三元组中的属性值作为该待预测问题对应的问答。

在一实施例中，具体地，参照图3，步骤S104包括：子步骤S1041至子步骤S1043。

子步骤S1041、各个所述属性名分别与所述待预测问题进行组合，生成多个属性文本对。

示范例的，获取实体名对应的多组三元组，并获取各组三元组中的属性名。将获取到各个属性名分别与待预测问题进行组合，得到各个属性名与待预测问题进行组合对应的属性文本对，其中，属性文本对与属性值的数量相同。

子步骤S1042、将各个所述属性文本对输入预置属性映射模型，得到各个所述属性文本对中属性名的预测分值。

实施例的，将得到的各个属性文本对输入到预置属性映射模型中，该预置属性映射模型包括字典文件，通过该字典文件对该各个属性文本对进行拆分，得到各个属性文本对中各个问题和属性名的单词序列，将各个问题的单词序列和各个属性名的单词序列进行填充，得到统一固定长度的单词序列。将问题的单词序列和属性名的单词序列进行拼接，生成对应的属性文本序列。其中，该属性文本序列中通过特殊符号标记问题和各个属性值的分割位置，并对该属性文本序列进行标记。在得到属性文本序列时，对该属性文本序列进行向量化表示，得到对应的文本向量信息。该预置属性映射模型包括多头注意力网络模型，将该文本向量信息输入到多头注意力网络模型中，该多头注意力网络模型获取输入文本向量中融合上下文信息的每个单词所对应的向量表示，从而获取多头注意力网络模型输出的文本语义向量信息。基于特殊符号标记该文本语义向量信息中问题与各个属性名的分割位置，获取该文本语义向量信息中各个属性文本对应的语义向量，该预置实体识别模型包括线性转换层，通过该线性转换层对各个属性文本对的语义向量进行线性转换，得到各个属性文本对中属性名的预测分值。

子步骤S1043、根据各个所述属性文本对中属性名的预测分值，获取所述预置属性映射模型输出预测分值最高的目标属性文本对。

示范例的，在得到各个属性文本对中属性名的预测分值时，比对各个各个属性文本对中属性名的预测分值，确定多个属性文本对中属性名的预测分值最高的属性文本对，将该预测分值最高的属性文本对作为目标属性文本对，获取预置属性映射模型输出预测分值最高的目标属性文本对。

子步骤S1044、将所述目标属性文本对中的属性名作为所述待预测问题对应的目标属性名。

示范例的，在获取到预置属性映射模型输出预测分值最高的目标属性文本对时，该目标属性文本对包括待预测问题和属性名，将该目标属性文本对中的属性名作为目标属性名。

在一实施例中，所述根据所述实体名和预置图数据库，确定所述实体名对应的三元组之前，包括：获取预置知识库中的任意一个三元组，以及基于预置别名词典获取所述三元组中实体名的别名列表；根据所述别名列表，确定预置图知识库中是否存在所述三元组；若确定存在所述三元组，则将所述预置图知识库作为预置图数据库；若确定不存在所述三元组，则在所述预置知识库中创建节点并在所述节点处导入所述三元组，生成预置图数据库。

实施例的，获取预置知识库，该预置知识库中包括多组三元组。获取预置知识库中的任意一个三元组，该三元组包括实体名、属性名和属性值。基于该实体名查询预置别名词典，该别名词典中包括该实体名对应的多个实体别名，其中，该实体名也为实体别名。在获取到该实体别名时，搜索预置图知识库，确定该预置图知识库是否存在该实体别名的节点，若存在该实体别名的节点，则确定该该实体别名的节点是否存在该三元组中的属性名节点，若存在该三元组中的属性名节点，则将该预置图知识库作为预置图数据库。若不存在该实体别名的节点，则创建一个实体别名的节点，并在该实体别名的节点中导入该实体别名的节点对应的三元组，将导入该实体别名的节点对应的三元组生成预置图数据库。

在一实施例中，所述根据预置别名词典，获取待预测问题中的实体别名，并将所述实体别名作为候选实体之前，还包括：获取预置知识库中各个文本，并识别各个所述文本中的实体名；基于预设属性规则抽取所述实体名的实体别名，生成预置别名词典。

实施例的，获取知识库中各个文本，识别各个文本中的实体名。该实体名为名称的常见名，实体别名该名称的曾用名。该识别方式包括认为进行标注，获取同一语义名称的所有名称，按照预设属性规则抽取所有名称中的实体名，以及该实体名的实体别名，生成该实体名的别名列表，各个实体名的别名列表组成别名词典。其中，预设属性规则可以为概率方式抽取，例如，获取同一语义名称的所有名称的概率，将概率最高的名称作为实体名，其它名称作为实体别名。

在本发明实施例中，通过预置别名词典获取待预测问题中的实体名的候选实体，将各个候选实体和待预测问题输入到预置实体识别模型中得到待预测问题的实体名，基于预置图数据库和实体名，得到该实体名对应的三元组中的各个属性名，将各个属性名和待预测问题输入到预置属性映射模型中，得到预测问题对应的目标属性名，从而获取待预测问题对应的问答，从而提高机器阅读多文档的准确率。

在一实施例中，具体地，参照图4，图4为训练预置实体识别模型的流程示意图。

如图4所示，该训练预置实体识别模型包括步骤S201至步骤S204。

步骤S201、获取待训练数据，确定待训练数据中问题的目标实体名和候选实体名，其中，所述目标实体名与所述候选实体名不相同，所述候选实体名为多个。

示范例的，获取待训练数据，该待训练数据包括待训练问题、待训练问题的问答、以及该待训练问题对应的三元组。例如，待训练数据为待训练问题“梅花落作者是谁来着？”、三元组“梅花落|||作者|||鲍照”、待训练问题的问答“鲍照”。确定该待训练问题中的目标实体名，该实体名可以是人工进行标注。以及确定该待训练问题中的候选实体名，该候选实体名可以是同一个字词的候选实体名，也可以各个字词的候选实体名。例如，通过将该该待训练问题切分为各个字词，通过别名词典获取各个字词的候选实体名。

步骤S202、获取所述目标实体名的第一字符，将所述第一字符替换所述问题中的目标实体名，生成所述待训练数据的正例数据，其中，所述正例数据的标签值为1。

示范例的，在确定该待训练数据中待训练问题的目标实体名时，获取该目标实体名的第一字符，该第一字符为预置字符。例如，该字符为[MASK]。确定该目标实体名在该问题中的位置，将该第一字符替换该目标实体名。例如，问题为“梅花落作者是谁来着？”，其中，“梅花落”为该问题的目标实体名，在确定该“梅花落”在“梅花落作者是谁来着？”中的位置时，将[MASK]替换该“梅花落”，生成对应的正例数据，其中，正例数据中的问题为“[MASK]作者是谁来着？”并对该正例数据进行标签，该该正例数据的标签值为1。

步骤S203、获取所述候选实体名的第二字符，将所述第二字符替换所述问题中的各个候选实体名，生成所述待训练数据的多个负例数据，其中，所述各个负例数据的标签值为0。

示范例的，在确定该待训练数据中待训练问题的多个候选实体名时，获取该候选实体名的第二字符，该第二字符为预置字符。例如，该第二字符为[MASK]。确定该各个候选实体名在该问题中的位置，将该第二字符替换该目标实体名。例如，问题为“梅花落作者是谁来着？”，其中，“梅花”和“花落”为该问题的候选实体名，在分别确定该“梅花”和“花落”在“梅花落作者是谁来着？”的位置时，将[MASK]替换该“梅花”，生成对应的负例数据，其中，负例数据中的问题为“[MASK]落作者是谁来着？”或者，将[MASK]“花落”，替换该生成对应的负例数据，其中，负例数据中的问题为“梅[MASK]作者是谁来着？”并对该正例数据进行标签，该该正例数据的标签值为0。

步骤S204、根据所述正例数据和所述正例数据的标签值，以及所述多个负例数据和所述各个负例数据的标签值训练第一预训练语言模型，生成对应的预置实体识别模型。

示范例的，将该正例数据和多个负例数据输入到第一预置预训练语言模型中，其中，该第一预置预训练语言模型(Bidirectional Encoder Representations fromTransformers BERT)，包括字典文件vocab.txt，通过该字典文件vocab.txt将正例数据和负例数据中的问题按照字词切分，得到各个正例数据和负例数据中的问题的单词序列，且将问题的单词序列时按照预置填充规则或截断规则，生成统一长度的字符单词序列。其中，切分后的各个问题进行拼接，得到对应的文本序列，其中，文本序列中包括类型符号和各个问题的位置符号，例如，将[CLS]字符作为文本序列的分类符号，将[SEP]作为各个问题的位置分割符号。将得到的文本序列进行向量化表示，得到该文本序列对应的文本向量信息。示范例的，将输入文本序列中每个单词用预训练的单词特征向量表示，得到文本向量信息，该文本向量信息包括文本序列中每个单词的语义表示信息、位置表示信息、分段表示的加和信息。

该第一预置预训练语言模型包括多头注意力网络模型，将获取到的文本向量信息输入到多头注意力网络模型中，该多头注意力网络模型获取输入文本向量中融合上下文信息的每个单词所对应的向量表示，获取多头注意力网络模型输出的文本语义向量信息。示范性的，将获取到的文本向量信息输入到多头注意力网络模型中，该多头注意力网络模型包括第一线性映射层，通该第一线性映射层将该文本向量信息映射到不同语义空间的语义向量，捕捉不同维度的语义信息。并在不同语义空间语义向量上进行self-attention操作，输出不同语义空间的文本语义向量。将不同语义空间的文本语义向量进行拼接，将拼接后的向量信息通过第一线性映射层映射回原语义空间，得到输出的文本语义向量信息。

例如，将获取到的文本向量信息输入到多头注意力网络模型中，该多头注意力网络模型包括第一线性映射层，通该第一线性映射层将该文本向量信息映射到不同语义空间的语义向量，捕捉不同维度的语义信息。例如，第一线性映射层中的线性项公式为Q′_i＝QW_i ^Q，K′_i＝KW_t ^k，V′_i＝VW_i ^V，其中Q为查询值、K为键值、V为值向量，i为映射到i个语义空间的线性项，Q′，i，K′i，V′。i为第i个语义空间的语义向量。

通过在不同语义空间语义向量上进行self-attention操作，输出不同语义空间的文本语义向量。例如，self-attention操作公式为

其中，softmax为归一化函数，T为向量转置操作，d_k为键向量的维度，hend_i为第i个语义空间的输入文本序列的文本语义向量。在得到不同语义空间的文本语义向量时，将不同语义空间的文本语义向量进行拼接，例如c＝Concat(hend₁,......,hend_i)W,其中，Concat为向量拼接操作，W为不同语义空间映射回初始语义空间的线性项，C为多头自注意力网络模型输出的第二文本语义向量。将拼接后的向量信息通过第一线性映射层映射回原语义空间，得到输出的文本语义向量信息。

在获取到文本语义向量信息时，从该文本语义向量信息中获取实体名和各个实体别名的语义向量。基于该第一预置预训练语言模型的第二线性映射层对实体名和各个实体别名的语义向量做线性变换，得到实体名的概率得分值以及各个实体别名的概率得分值。将获取到的实体名的概率得分值分别与各个实体别名的概率得分值作为softmax归一化处理后，计算其于标签值(1或者0)的交差熵损失，将该交差熵损失作为损失函数。在得到多个损失函数时，通过反向传播机制，得到对应的模型参数，通过该模型参数更新第一第一预置预训练语言模型的模型参数，生成对应的预置实体识别模型。

在本实施例中，通过训练预训练语言模型，得到预置实体识别模型，实现预置实体识别模型对问题的实体识别，从而对实体名进行语义编码，提高预置实体识别模型的表示能力和泛化能力，从而提升了预置实体识别模型的准确率。

在一实施例中，具体地，参照图5，图5为预置属性映射模型的流程示意图。

如图5所示，该预置属性映射模型包括步骤S301至步骤S304。

步骤S301、获取待训练数据，确定待训练数据中问题的目标属性名，并获取所述目标属性名关联的候选属性名，其中，所述候选属性名为多个。

示范例的，获取待训练数据，该待训练数据包括待训练问题、待训练问题的问答、以及该待训练问题对应的三元组。例如，待训练数据为待训练问题“梅花落作者是谁来着？”、三元组“梅花落|||作者|||鲍照”、待训练问题的问答“鲍照”。通过确定该问题中的目标属性名，该目标属性名可以是人工进行标注。通过该目标属性名获取关联的候选属性名。获取候选属性名的方式包括，通过该目标属性名查询预置图数据库，该预置图数据库包括多组三元组，每一组三元组包括实体名、属性名和属性值。获取该目标属性同一节点的各个三元组中的属性名，将获取到的属性名作为该目标属性名的候选属性名。

步骤S302、将包含所述目标属性名的问题，生成所述待训练数据的正例数据，其中，所述正例数据的标签值为1。

示范例的，在确定该待训练数据中待训练问题的属性名为目标属性名时，生成待训练数据的正例数据，其中，正例数据包括待训练问题、待训练问题的答案以及对应的三元组。并对该正例数据进行标签，该该正例数据的标签值为1。

步骤S303、将各个候选属性名分别替换所述问题中的目标属性名，生成所述待训练数据的多个负例数据，其中，所述各个负例数据的标签值为0。

示范例为，在确定该待训练数据中待训练问题的多个候选属性名时，确定该目标属性名在该问题中的位置，将该各个候选属性名替换该目标属性名。例如，问题为“笑傲江湖是什么语种的电视剧？”，其中，“语种”为该问题的目标属性名，而“方言”、“主演”、“导演”等为目标属性名的候选属性名时，在确定该“语种”在“笑傲江湖是什么语种的电视剧？”中的位置时，将“方言”、“主演”、“导演”等替换该“语种”，生成对应的负例数据，其中，负例数据中的问题为“笑傲江湖是什么方言的电视剧？”，或，“笑傲江湖是什么主演的电视剧？”等。并对该负例数据进行标签，该该负例数据的标签值为0。

步骤S304、根据所述正例数据和所述正例数据的标签值，以及所述多个负例数据和所述各个负例数据的标签值训练第二预训练语言模型，生成对应的预置属性映射模型。

示范例的，将该正例数据和多个负例数据输入到第二预置预训练语言模型中，其中，该第二预置预训练语言模型(Bidirectional Encoder Representations fromTransformers BERT)，包括字典文件vocab.txt，通过该字典文件vocab.txt将正例数据和负例数据中的问题按照字词切分，得到各个正例数据和负例数据中的问题的单词序列，且将问题的单词序列时按照预置填充规则或截断规则，生成统一长度的字符单词序列。其中，切分后的各个问题进行拼接，得到对应的文本序列，其中，文本序列中包括类型符号和各个问题的位置符号，例如，将[CLS]字符作为文本序列的分类符号，将[SEP]作为各个问题的位置分割符号。将得到的文本序列进行向量化表示，得到该文本序列对应的文本向量信息。示范例的，将输入文本序列中每个单词用预训练的单词特征向量表示，得到文本向量信息，该文本向量信息包括文本序列中每个单词的语义表示信息、位置表示信息、分段表示的加和信息。

该第二预置预训练语言模型包括多头注意力网络模型，将获取到的文本向量信息输入到多头注意力网络模型中，该多头注意力网络模型获取输入文本向量中融合上下文信息的每个单词所对应的向量表示，获取多头注意力网络模型输出的文本语义向量信息。示范性的，将获取到的文本向量信息输入到多头注意力网络模型中，该多头注意力网络模型包括第一线性映射层，通该第一线性映射层将该文本向量信息映射到不同语义空间的语义向量，捕捉不同维度的语义信息。并在不同语义空间语义向量上进行self-attention操作，输出不同语义空间的文本语义向量。将不同语义空间的文本语义向量进行拼接，将拼接后的向量信息通过第一线性映射层映射回原语义空间，得到输出的文本语义向量信息。

例如，将获取到的文本向量信息输入到多头注意力网络模型中，该多头注意力网络模型包括第一线性映射层，通该第一线性映射层将该文本向量信息映射到不同语义空间的语义向量，捕捉不同维度的语义信息。例如，第一线性映射层中的线性项公式为Q′_i＝QW_i ^Q，K′_i＝KW_t ^k，V′_i＝VW_i ^V，其中Q为查询值、K为键值、V为值向量，i为映射到i个语义空间的线性项，Q′，i，K′i，V′i为第i个语义空间的语义向量。

在获取到文本语义向量信息时，从该文本语义向量信息中获取实体名和各个实体别名的语义向量。基于该第一预置预训练语言模型的第二线性映射层对实体名和各个实体别名的语义向量做线性变换，得到属性名的概率得分值以及各个其它属性名的概率得分值。将获取到的属性名的概率得分值分别与各个其它属性名的概率得分值作为softmax归一化处理后，计算其于标签值(1或者0)的交差熵损失，将该交差熵损失作为损失函数。在得到多个损失函数时，通过反向传播机制，得到对应的模型参数，通过该模型参数更新第一第一预置预训练语言模型的模型参数，生成对应的预置属性映射模型。

在本实施例中，通过训练预训练语言模型，得到预置属性映射模型，实现预置属性映射模型对问题的属性映射，从而对属性名进行语义编码，提高预置属性映射模型的表示能力和泛化能力，从而提升了预置属性映射模型的准确率。

请参照图6，图6为本申请实施例提供的一种自动问答装置的示意性框图。

如图6所示，该自动问答装置400，包括：获取模块401、第一确定模块402、第二确定模块403、第三确定模块404。

获取模块401，用于根据预置别名词典，获取待预测问题中各个字词的实体别名，并将所述实体别名作为候选实体，其中，所述实体别名和所述候选实体为多个；

第一确定模块402，用于基于预置实体识别模型，根据所述待预测问题和多个所述候选实体，确定所述待预测问题对应的实体名；

第二确定模块403，用于用于根据所述实体名和预置图数据库，确定所述预置图数据库中述实体名对应的三元组；其中，所述三元组包括所述实体名、属性名和属性值，所述三元组为多组；

第三确定模块404，用于基于预置属性映射模型，根据各个所述属性名和所述待预测问题确定所述待预测问题对应的目标属性名，并将所述目标属性名对应的属性值作为所述待预测问题的问答。

其中，第一确定模块402具体还用于：

根据多个所述候选实体分别对所述待预测问题中对应的字词进行替换，生成多个文本记录；

将多个所述文本记录分别输入预置实体识别模型，预测各个所述文本记录中候选实体的预测值；

根据各个所述文本记录中候选实体的预测值，确定目标文本记录中的候选实体为实体名，将所述实体名作为所述待预测问题对应的实体名。

其中，第三确定模块404具体还用于：

各个所述属性名分别与所述待预测问题进行组合，生成多个属性文本对；

将各个所述属性文本对输入预置属性映射模型，得到各个所述属性文本对中属性名的的预测分值；

根据各个所述属性文本对中属性名的的预测分值，获取所述预置属性映射模型输出预测分值最高的目标属性文本对；

将所述目标属性文本对中的属性名作为所述待预测问题对应的目标属性名。

其中，确自动问答装置具体还用于：

获取待训练数据，确定待训练数据中问题的目标实体名和候选实体名，其中，所述目标实体名与所述候选实体名不相同，所述候选实体名为多个；

获取所述目标实体名的第一字符，将所述第一字符替换所述问题中的目标实体名，生成所述待训练数据的正例数据，其中，所述正例数据的标签值为1；

获取所述候选实体名的第二字符，将所述第二字符替换所述问题中对应的各个候选实体名，生成所述待训练数据的多个负例数据，其中，所述各个负例数据的标签值为0；

根据所述正例数据和所述正例数据的标签值，以及所述多个负例数据和所述各个负例数据的标签值训练第一预训练语言模型，生成对应的预置实体识别模型。

其中，自动问答装置具体还用于：

获取待训练数据，确定待训练数据中问题的目标属性名，并获取所述目标属性名关联的候选属性名，其中，所述候选属性名为多个；

将包含所述目标属性名的问题，生成所述待训练数据的正例数据，其中，所述正例数据的标签值为1；

将各个候选属性名分别替换所述问题中的目标属性名，生成所述待训练数据的多个负例数据，其中，所述各个负例数据的标签值为0；

根据所述正例数据和所述正例数据的标签值，以及所述多个负例数据和所述各个负例数据的标签值训练第二预训练语言模型，生成对应的预置属性映射模型。

其中，自动问答装置具体还用于：

获取预置知识库中任意一个三元组，以及基于预置别名词典获取所述三元组中实体名的别名列表；

根据所述别名列表，确定预置图知识库中是否存在所述三元组；

若确定存在所述三元组，则将所述预置图知识库作为预置图数据库；

若确定不存在所述三元组，则在所述预置知识库中创建节点并在所述节点处导入所述三元组，生成预置图数据库。

其中，自动问答装置具体还用于：

获取预置知识库中各个文本，并识别各个所述文本中的实体名；

基于预设属性规则抽取所述实体名的实体别名，生成预置别名词典。

需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的装置和各模块及单元的具体工作过程，可以参考前述自动问答方法实施例中的对应过程，在此不再赘述。

上述实施例提供的装置可以实现为一种计算机程序的形式，该计算机程序可以在如图7所示的计算机设备上运行。

请参阅图7，图7为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为终端。

如图7所示，该计算机设备包括通过系统总线连接的处理器、存储器和网络接口，其中，存储器可以包括非易失性存储介质和内存储器。

非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令，该程序指令被执行时，可使得处理器执行任意一种自动问答方法。

处理器用于提供计算和控制能力，支撑整个计算机设备的运行。

内存储器为非易失性存储介质中的计算机程序的运行提供环境，该计算机程序被处理器执行时，可使得处理器执行任意一种自动问答方法。

该网络接口用于进行网络通信，如发送分配的任务等。本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

应当理解的是，处理器可以是中央处理单元(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digita l Signa l Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中，在一个实施例中，所述处理器用于运行存储在存储器中的计算机程序，以实现如下步骤：

根据所述实体名和预置图数据库，确定所述预置图数据库中所述实体名对应的三元组；其中，所述三元组包括所述实体名、属性名和属性值，所述三元组为多组；

在一个实施例中，所述处理器所述基于预置实体识别模型，根据所述待预测问题和多个所述候选实体，确定所述待预测问题对应的实体名实现时，用于实现：

在一个实施例中，所述处理器基于预置属性映射模型，根据各个所述属性名和所述待预测问题确定所述问题对应的目标属性名实现时，用于实现：

在一个实施例中，所述处理器自动问答方法还包括实现时，用于实现：

在一个实施例中，所述处理器根据所述实体名和预置图数据库，确定所述实体名对应的三元组之前实现时，用于实现：

在一个实施例中，所述处理器根据预置别名词典，获取待预测问题中的实体别名，并将所述实体别名作为候选实体之前实现时，用于实现：

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序中包括程序指令，所述程序指令被执行时所实现的方法可参照本申请自动问答方法的各个实施例。

其中，所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元，例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备，例如所述计算机设备上配备的插接式硬盘，智能存储卡(SmartMedia Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。

进一步地，所述计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

本发明所指区块链预置别名词典、预置实体识别模型、预置图数据库和预置属性映射模型的存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种自动问答方法，其特征在于，包括：

根据所述实体名和预置图数据库，确定所述预置图数据库中所述实体名对应的三元组，其中，所述三元组包括所述实体名、属性名和属性值，所述三元组为多组；

2.如权利要求1所述的自动问答方法，其特征在于，所述基于预置实体识别模型，根据所述待预测问题和多个所述候选实体，确定所述待预测问题对应的实体名，包括：

3.如权利要求1所述的自动问答方法，其特征在于，所述基于预置属性映射模型，根据各个所述属性名和所述待预测问题确定所述问题对应的目标属性名，包括：

将各个所述属性文本对输入预置属性映射模型，得到各个所述属性文本对中属性名的预测分值；

根据各个所述属性文本对中属性名的预测分值，获取所述预置属性映射模型输出预测分值最高的目标属性文本对；

4.如权利要求1所述的自动问答方法，其特征在于，所述方法还包括：

5.如权利要求1所述的自动问答方法，其特征在于，所述方法还包括：

6.如权利要求1所述的自动问答方法，其特征在于，所述根据所述实体名和预置图数据库，确定所述实体名对应的三元组之前，还包括：

获取预置知识库中的任意一个三元组，以及基于预置别名词典获取所述三元组中实体名的别名列表；

7.如权利要求1所述的自动问答方法，其特征在于，所述根据预置别名词典，获取待预测问题中的实体别名，并将所述实体别名作为候选实体之前，还包括：

8.一种自动问答装置，其特征在于，包括：

第二确定模块，用于根据所述实体名和预置图数据库，确定所述预置图数据库中所述实体名对应的三元组，其中，所述三元组包括所述实体名、属性名和属性值，所述三元组为多个；

9.一种计算机设备，其特征在于，所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序，其中所述计算机程序被所述处理器执行时，实现如权利要求1至7中任一项所述的自动问答方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，其中所述计算机程序被处理器执行时，实现如权利要求1至7中任一项所述的自动问答方法的步骤。