CN111506722A

CN111506722A - 基于深度学习技术的知识图谱问答方法、装置及设备

Info

Publication number: CN111506722A
Application number: CN202010550506.5A
Authority: CN
Inventors: 张圣
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-06-16
Filing date: 2020-06-16
Publication date: 2020-08-07
Anticipated expiration: 2040-06-16
Also published as: WO2021139283A1; CN111506722B

Abstract

本申请揭示了一种基于深度学习技术的知识图谱问答方法、装置及设备，其中方法包括：接收用户的问题语句；利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别，得到所述问题语句中的实体信息；利用属性识别模型对问题语句进行属性识别，得到问题语句中的属性信息；对属性信息进行属性拓展和属性标准化，得到对应到知识图谱中的标准属性；根据实体信息和标准属性生成知识图谱的结构化查询，在知识图谱中查询答案，将查询到的答案返回给用户。模型和知识图谱信息可以存储于区块链中。本申请的基于深度学习技术的知识图谱问答方法通过多层Bi‑LSTM及Attention操作很好地将实体层、短语层、问题层的语义信息融入到模型中，提高了模型的效果和问答的准确性。

Description

基于深度学习技术的知识图谱问答方法、装置及设备

技术领域

本申请涉及到自然语言处理技术领域，特别是涉及到一种基于深度学习技术的知识图谱问答方法、装置及设备。

背景技术

问答系统是用来回答人提出的自然语言的问题的系统，对于问答系统而言用户的问题基本可以分成事实型问题和观点型问题，事实型问题是指存在标准答案的问题，比如“乙肝疫苗的免疫原理是什么？”。观点型问题的答案一般不存在唯一标准答案，比如“疫苗是打国内的好还是国外的好？”，事实型问题是在问答系统中关注较多的一种，但目前问答系统中最常用的技术是基于信息检索技术的问答系统，主要是通过关键词搜索以及提取答案，由于自然语言文本的复杂性，该方法实现问答准确率很低。

目前已经出现了基于知识图谱的问答技术，然而，现有的基于知识图谱问答技术，实际应用落地过程中多是基于设计的规则，或者是简单的机器学习模型，基于复杂模型复杂度较高，真实上线需要机器和时间成本高，效果提升不明显。

发明内容

本申请的主要目的为提供一种基于深度学习技术的知识图谱问答方法、装置及设备，旨在解决现有技术中基于知识图谱的问答系统效果较差、硬件成本较高的技术问题。

为了实现上述发明目的，本申请提出一种基于深度学习技术的知识图谱问答方法，包括：

接收用户的问题语句；

利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别，得到所述问题语句中的实体信息；

利用基于注意力机制的属性识别模型对所述问题语句进行属性识别，得到所述问题语句中的属性信息；

对所述属性信息进行属性拓展和属性标准化，得到对应到知识图谱中的标准属性；

根据所述实体信息和所述标准属性生成知识图谱的结构化查询，在知识图谱中查询答案，将查询到的答案返回给用户。

进一步地，所述利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别，得到所述问题语句中的实体信息步骤，包括：

先将所述问题语句分词，输入实体识别模型的Token Embedding层，将单词转化为词向量；

将词向量输入到实体识别模型的Bi-LSTM层，得到第一隐藏向量；

将第一隐藏向量输入到实体识别模型的CRF层，得到预测标签序列；

根据预测标签序列确定所述问题语句中的实体信息。

进一步地，所述利用基于注意力机制的属性识别模型对所述问题语句进行属性识别，得到所述问题语句中的属性信息的步骤包括：

对所述问题语句进行分词处理得到词序列，通过Word Embedding获取每个词的词向量w₁，w₂...，w_n；

将词向量w₁，w₂...，w_n映射成对应的概念词向量e₁，e₂...，e_n；

将概念词向量e₁，e₂...，e_n输入到属性识别模型的Bi-LSTM层，并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h₁，h₂...，h_n；

将第二隐藏向量h₁，h₂...，h_n再次输入到属性识别模型的Bi-LSTM层，并使用短语层的表征向量Phrase进行Attention操作，并对输出的第三隐藏向量进行加权求和，得到表征向量Vector；

将表征向量Vector输入到属性识别模型的全连接层并进行Softmax操作，得到所述问题语句中的属性信息。

进一步地，所述对识别到的属性进行属性拓展和属性标准化，得到对应到知识图谱中的标准属性的步骤包括：

提取用户问题语句中的实体和第一属性词；

根据所述用户问题语句中的实体，在知识图谱中查找与该实体匹配的多个第二属性词；

计算所述第一属性词和多个所述第二属性词的之间的相关度，并根据相关度对多个所述第二属性词进行筛选，确定出一个或多个第三属性词；

如果存在多个第三属性词，统计每个第三属性词在知识图谱中出现的次数，次数最多的作为标准属性。

进一步地，所述根据所述实体信息和所述标准属性生成知识图谱的结构化查询，在知识图谱中查询答案，将查询到的答案返回给用户的步骤包括：

将所述实体信息视为主语或宾语，与所述标准属性相结合，生成SPARQL查询，从知识图谱中检索并找到对应的三元组；

若将所述实体信息视为主语，则以该三元组中的宾语作为问题的答案；

若将所述实体信息视为宾语，则以该三元组中的主语作为问题的答案；

若没有检索到对应的三元组，则提示系统尚未收录该问题。

进一步地，所述基于注意力机制的属性识别模型的标签数据是概念化标签数据集，其中，得到所述概念化标签数据集的步骤包括：

对初始标签数据中的问题经过实体识别、实体概念化，得到所述概念化标签数据集。

本申请实施例还提供一种基于深度学习技术的知识图谱问答装置，包括：

接收单元，用于接收用户的问题语句；

实体识别单元，用于利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别，得到所述问题语句中的实体信息；

属性识别单元，用于利用基于注意力机制的属性识别模型对所述问题语句进行属性识别，得到所述问题语句中的属性信息；

属性处理单元，用于对所述属性信息进行属性拓展和属性标准化，得到对应到知识图谱中的标准属性；

查询单元，用于根据所述实体信息和所述标准属性生成知识图谱的结构化查询，在知识图谱中查询答案，将查询到的答案返回给用户。

进一步地，所述属性识别单元包括：

词向量获取单元，用于对所述问题语句进行分词处理得到词序列，通过WordEmbedding获取每个词的词向量w₁，w₂...，w_n；

概念词向量获取单元，用于将词向量w₁，w₂...，w_n映射成对应的概念词向量e₁，e₂...，e_n；

第二隐藏向量获取单元，用于将概念词向量e₁，e₂...，e_n输入到属性识别模型的Bi-LSTM层，并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h₁，h₂...，h_n；

表征向量获取单元，用于将第二隐藏向量h₁，h₂...，h_n再次输入到属性识别模型的Bi-LSTM层，并使用短语层的表征向量Phrase进行Attention操作，并对输出的第三隐藏向量进行加权求和，得到表征向量Vector；

属性信息获取单元，用于将表征向量Vector输入到属性识别模型的全连接层并进行Softmax操作，得到所述问题语句中的属性信息。

本申请还提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请的基于深度学习技术的知识图谱问答方法、装置和计算机设备，通过实体概念化，降低了模型的复杂程度和相应时间，降低了硬件成本，并且通过多层Bi-LSTM及Attention操作很好地将实体层、短语层、问题层的语义信息融入到模型中，提高了模型的效果和问答的准确性。

附图说明

图1为本申请一实施例的基于深度学习技术的知识图谱问答方法的流程示意图；

图2为本申请一实施例的基于深度学习技术的知识图谱问答装置的结构示意框图；

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请实施例中提供一种基于深度学习技术的知识图谱问答方法，包括步骤：

S1、接收用户的问题语句；

S2、利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别，得到所述问题语句中的实体信息；

S3、利用基于注意力机制的属性识别模型对所述问题语句进行属性识别，得到所述问题语句中的属性信息；

S4、对所述属性信息进行属性拓展和属性标准化，得到对应到知识图谱中的标准属性；

S5、根据所述实体信息和所述标准属性生成知识图谱的结构化查询，在知识图谱中查询答案，将查询到的答案返回给用户。

如上述步骤S1所述，要实现知识图谱的问答方法，首先需要接收用户的问题语句。目前常见的输入方式有两种，文字输入和语音输入，对于语音输入的问题语句首先要进行语音识别，将用户输入的语音转化为对应的文字，方便模型进行处理。

如上述步骤S2所述，实体识别主要是从自然语句中识别出其中的实体，后续的属性拓展、知识图谱查询等操作都需要实体识别的支撑。这里使用的实体识别模型是比较成熟的基于LSTM+CRF(Long Short Term Memory+Conditional Random Field)的序列标注模型，实体识别模型的输入是句子的词序列，输出是句子中实体信息，以实体识别模型输入“黄晓明的妻子是谁”为例，转成模型的word序列也就是(黄，晓，明，的，妻，子，是，谁，？)实体识别输出：(B，I，I，O，O，O，O，O，O)，其中B表示实体的开始word，I表示实体的中间或结束word，O表示不是实体的word。模型的输出也就是黄晓明被预测为实体部分。

如上述步骤S3所述，这里采用的是基于RNN(循环神经网络)以及注意力机制设计的深度学习模型对用户问题语句中的属性进行识别。属性也就是知识图谱中的属性(关系类别)，通过上述模型对用户问题语句进行属性识别，可以预测出用户问题对应到知识图谱中的关系(属性)类别。

如上述步骤S4所述，属性扩展的主要目的是对属性(知识图谱中关系类型)进行扩展。知识图谱中很多关系无法使用某一个具体属性(关系)直接表达，而是需要多个属性进行表达。比如在知识图谱中，对于spouse of(配偶)这个关系是通过三个属性进行表达的，marriage→person→name。这里通过对知识图谱的属性扩展可以表达更多的关系(属性)。通过已有的属性标准化数据库对属性进行标准化，比如夫妻、妻子、丈夫、老公、配偶等可以标准化为配偶。通过属性标准化，可以降低系统的复杂度，标准化后的属性便于更加精准知识图谱查询。

如上述步骤S5所述，用户的问题经过实体识别部分的实体等信息以及基于属性模型预测部分得到关系(属性)类型，对属性进行标准化、以及属性扩展得到最终的属性类别(关系类别)，从而将实体信息以及标准属性转换成知识图谱的结构化查询，在知识图谱中进行查询，最终将用户问题的答案返回给用户。

在一个具体的实施例中，所述利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别，得到所述问题语句中的实体信息步骤，包括：

S21、先将所述问题语句分词，输入实体识别模型的Token Embedding层，将单词转化为词向量；

S22、将词向量输入到实体识别模型的Bi-LSTM层，得到第一隐藏向量；

S23、将第一隐藏向量输入到实体识别模型的CRF层，得到预测标签序列；

S24、根据预测标签序列确定所述问题语句中的实体信息。

如上述所述，举例说明，实体识别模型输入：黄晓明的妻子是谁？转成模型的word序列也就是(黄，晓，明，的，妻，子，是，谁，？)，经过Token Embedding层编码和Bi-LSTM层后，实体识别结果输出：(B，I，I，O，O，O，O，O，O)，其中B表示实体的开始word，I表示实体的中间或结束word，O表示不是实体的word。模型的输出也就是“黄晓明”被预测为实体部分。

在一个具体的实施例中，所述利用基于注意力机制的属性识别模型对所述问题语句进行属性识别，得到所述问题语句中的属性信息的步骤包括：

S31、对所述问题语句进行分词处理得到词序列，通过Word Embedding获取每个词的词向量w₁，w₂...，w_n；

S32、将词向量w₁，w₂...，w_n映射成对应的概念词向量e₁，e₂...，e_n；

S33、将概念词向量e₁，e₂...，e_n输入到属性识别模型的Bi-LSTM层，并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h₁，h₂...，h_n；

S34、将第二隐藏向量h₁，h₂...，h_n再次输入到属性识别模型的Bi-LSTM层，并使用短语层的表征向量Phrase进行Attention操作，并对输出的第三隐藏向量进行加权求和，得到表征向量Vector；

S35、将表征向量Vector输入到属性识别模型的全连接层并进行Softmax操作，得到所述问题语句中的属性信息。

如上所述，首先对用户的问题语句进行分词得到句子的词序列，通过WordEmbedding获取每个词的词向量w₁，w₂...，w_n。然后经过实体概念映射操作映射成对应的概念的词向量e₁，e₂...，e_n，词向量携带了单词语义信息，而且通过实体的概念映射可以获取整个问题句子的更深层的语义。将概念化的词向量输入Bi-LSTM层，并使用实体层的表征向量Entity进行Attention操作得到隐藏向量h₁，h₂...，h_n。Bi-LSTM可以很好的学习到对应词前后的语义信息，使用实体层信息进行Attention操作可以很好地将实体层的语义信息融入到模型中。然后将上一层得到的序列表征向量再次输入到Bi-LSTM层，并使用短语层的表征向量Phrase进行Attention操作，做一个近似于加权求和的操作，得到表征向量Vector。这里学习到表征向量Vector很好的融合了实体层语义、短语层语义、问题层语义。最后，将学习到的表征向量Vector经过全连接层以及Softmax操作，得到句子(用户问题)中对应到知识图谱的关系(属性)类别。其中实体层Entity、短语层Phrase的处理如下：

实体层语义Entity：实体是自然语言的基本单位之一，基于知识图谱的实体语义理解为上层语义计算，特别是问题中的实体语义。本发明关于实体层的语义解析这里使用了语义社团搜索模型，获取实体层的语义信息。

短语层语义Phrase：短文本是自然语言的最常见形式之一，起到对实体和更复杂文本单元(如问句)的承接作用，短文本已经有了基本的语法结构和上下文的语义信息。这里主要是使用动词模板用来细粒度的语义表示，并综合使用了上下文信息进行实体的概念化。

以下举例说明：

原始输入：李安执导过哪些电影作品？

问题概念化后：导演执导过哪些电影作品？

模型的输入：(导，演，执，导，过，哪，些，电，影，作，品，？)

模型的输出：代表作品(属性)

在一个具体的实施例中，所述对识别到的属性进行属性拓展和属性标准化，得到对应到知识图谱中的标准属性的步骤包括：

S41、提取用户问题语句中的实体和第一属性词；

S42、根据所述用户问题语句中的实体，在知识图谱中查找与该实体匹配的多个第二属性词；

S43、计算所述第一属性词和多个所述第二属性词的之间的相关度，并根据相关度对多个所述第二属性词进行筛选，确定出一个或多个第三属性词；

S44、如果存在多个第三属性词，统计每个第三属性词在知识图谱中出现的次数，次数最多的作为标准属性。

如上所述，知识图谱中的属性词也就是同一个属性或关系可能有多个表达方式，所以对三元组中的属性进行拓展可以提高问答系统的覆盖率。在本实施例中，采用了计算知识图谱中的相关属性词的相关度的方法对属性词进行扩展。其中，所述第一属性词和多个所述第二属性词之间的相关度计算方法可以采用将属性词转换为语义向量并进行语义关联性分析，生成所述多个第二属性词和第一属性词之间相关度的排序和/或相关度，然后根据预设相关度阈值和/或相关度排序筛选策略，确定出一个或多个第三属性词。如果存在多个第三属性词，统计每个第三属性词在知识图谱中出现的次数，次数最多的作为标准属性，即语义相同的属性词，采用最常用的属性词作为标准谓词，确定为标准属性。

在一个具体的实施例中，所述根据所述实体信息和所述标准属性生成知识图谱的结构化查询，在知识图谱中查询答案，将查询到的答案返回给用户的步骤包括：

S51、将所述实体信息视为主语或宾语，与所述标准属性相结合，生成SPARQL查询，从知识图谱中检索并找到对应的三元组；

S52、若将所述实体信息视为主语，则以该三元组中的宾语作为问题的答案；

S53、若将所述实体信息视为宾语，则以该三元组中的主语作为问题的答案；

S54、若没有检索到对应的三元组，则提示系统尚未收录该问题。

如上所述，在知识图谱中，知识数据是以(S、P、O)三元组形式保存的，对应表示为实体、属性(关系)、属性值(关系类别)，其中实体和其对应的属性值可能都是以实体的形式表示的，例如，黄晓明的妻子是谁，在知识图谱中可能表示为(黄晓明、配偶、杨颖)，即问句中的主语和宾语在一些情况下是可以互换的，根据模型输出的实体和属性结果，若将所述实体信息视为主语，则以该三元组中的宾语作为问题的答案；若所述实体信息视为宾语，则以该三元组中的主语作为问题的答案。在一个具体的实施例中，还可以设置用户对答案的满意度评价系统，使该问答系统根据用户的评价进行自我改进或为知识图谱的构建和更新提出建议。

在一个具体的实施例中，所述若没有检索到对应的三元组，则提示系统尚未收录该问题的步骤之后包括：

将问题发送给人工处理，将人工处理的结果更新到知识图谱中。

如上所述，知识图谱的问答系统可能基于各种各样的原因不能够匹配到问题答案时，可以将问题记录下来发送给人工处理，然后由人工主动对知识图谱进行更新。目前的知识图谱基于各种庞大的数据来源，知识覆盖面相对广泛，但仍可能因为问题太新没有被收录、用户问题表述难以被机器模型理解、模型算法不够精确等诸多原因造成无法回答用户的问题。这种情况可以记录无法解决的问题后交由系统开发人员处理并针对问题产生的原因做出改进，提高知识图谱智能问答的全面性和准确性。

在一个具体的实施例中，所述基于注意力机制的属性识别模型的标签数据是概念化标签数据集，其中，得到所述概念化标签数据集的步骤包括：

如上所述，对初始的属性识别模型的标签数据中的问题进行实体识别、实体概念化，得到概念化标签数据集合。比如：“甲肝疫苗的免疫原理是？”“乙肝疫苗的免疫原理是？”等类似问题，通过实体识别，可以得到问题中的甲肝疫苗、乙肝疫苗为实体，通过实体概念映射，甲肝疫苗、乙肝疫苗的概念是疫苗，从而标签数据集中这一类问题都可以概念化为：疫苗的免疫原理是什么？通过实体概念化，可以将去除大量冗余的数据，可以将标签数据集的规模降低10-50倍左右，有效降低模型的复杂程度，提高模型的训练速度和响应速度，降低了硬件成本。

在一个实施例中，用于实体识别和属性识别的模型、知识图谱相关数据等信息均可以存储与区块链中，在区块链网络中实现如上所述的基于深度学习技术的知识图谱问答方法。

如上所述，区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。

区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中，用户管理模块负责所有区块链参与者的身份信息管理，包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等，并且在授权的情况下，监管和审计某些真实身份的交易情况，提供风险控制的规则配置(风控审计)；基础服务模块部署在所有区块链节点设备上，用来验证业务请求的有效性，并对有效请求完成共识后记录到存储上，对于一个新的业务请求，基础服务先对接口适配解析和鉴权处理(接口适配)，然后通过共识算法将业务信息加密(共识管理)，在加密之后完整一致的传输至共享账本上(网络通信)，并进行记录存储；智能合约模块负责合约的注册发行以及合约触发和合约执行，开发人员可以通过某种编程语言定义合约逻辑，发布到区块链上(合约注册)，根据合约条款的逻辑，调用密钥或者其它的事件触发执行，完成合约逻辑，同时还提供对合约升级注销的功能；运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出，例如：告警、监控网络情况、监控节点设备健康状态等。

本申请实施例的基于深度学习技术的知识图谱问答方法，通过实体概念化，降低了模型的复杂程度和相应时间，降低了硬件成本，并且通过多层Bi-LSTM及Attention操作很好地将实体层、短语层、问题层的语义信息融入到模型中，提高了模型的效果和问答的准确性。

参照图2，本申请实施例中还提供一种基于深度学习技术的知识图谱问答装置，包括：

接收单元1，用于接收用户的问题语句；

实体识别单元2，用于利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别，得到所述问题语句中的实体信息；

属性识别单元3，用于利用基于注意力机制的属性识别模型对所述问题语句进行属性识别，得到所述问题语句中的属性信息；

属性处理单元4，用于对所述属性信息进行属性拓展和属性标准化，得到对应到知识图谱中的标准属性；

查询单元5，用于根据所述实体信息和所述标准属性生成知识图谱的结构化查询，最终将用户问题的答案返回给用户。

在一个具体的实施例中，所述实体识别单元2包括：

分词单元，用于将所述问题语句分词，输入实体识别模型的Token Embedding层，将单词转化为词向量；

第一隐藏向量生成单元，用于将词向量输入到实体识别模型的Bi-LSTM层，得到第一隐藏向量；

预测标签序列生成单元，用于将第一隐藏向量输入到实体识别模型的CRF层，得到预测标签序列；

实体信息确定单元，用于根据预测标签序列确定所述问题语句中的实体信息。

在一个具体的实施例中，所述属性识别单元3包括：

在一个具体的实施例中，所述属性处理单元4包括：

提取单元，用于提取用户问题语句中的实体和第一属性词；

查找单元，用于根据所述用户问题语句中的实体，在知识图谱中查找与该实体匹配的多个第二属性词；

确定单元，用于计算所述第一属性词和多个所述第二属性词之间的相关度，并根据相关度对多个所述第二属性词进行筛选，确定出一个或多个第三属性词；

统计单元，用于如果存在多个第三属性词，统计每个第三属性词在知识图谱中出现的次数，次数最多的作为标准属性。

在一个具体的实施例中，所述查询单元5包括：

检索单元：用于将所述实体信息视为主语或宾语，与所述标准属性相结合，生成SPARQL查询，从知识图谱中检索并找到对应的三元组；

第一答案生成单元，用于若将所述实体信息视为主语，则以该三元组中的宾语作为问题的答案；

第二答案生成单元，用于若将所述实体信息视为宾语，则以该三元组中的主语作为问题的答案；

提示单元，用于若没有检索到对应的三元组，则提示系统尚未收录该问题。

如上所述，可以理解地，本发明中提出的所述基于深度学习技术的知识图谱问答装置的各组成部分可以实现如上所述基于深度学习技术的知识图谱问答方法任一项的功能，具体结构不再赘述。

参照图3，本发明实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于储存知识图谱等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于深度学习技术的知识图谱问答方法。

上述处理器执行上述的基于深度学习技术的知识图谱问答方法，包括：接收用户的问题语句；利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别，得到所述问题语句中的实体信息；利用基于注意力机制的属性识别模型对所述问题语句进行属性识别，得到所述问题语句中的属性信息；对所述属性信息进行属性拓展和属性标准化，得到对应到知识图谱中的标准属性；根据所述实体信息和所述标准属性生成知识图谱的结构化查询，在知识图谱中查询答案，将查询到的答案返回给用户。

在一个实施例中，所述利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别，得到所述问题语句中的实体信息步骤，包括：先将所述问题语句分词，输入实体识别模型的Token Embedding层，将单词转化为词向量；将词向量输入到实体识别模型的Bi-LSTM层，得到第一隐藏向量；将第一隐藏向量输入到实体识别模型的CRF层，得到预测标签序列；根据预测标签序列确定所述问题语句中的实体信息。

提取用户问题语句中的实体和第一属性词；

在一个具体的实施例中，所述根据所述实体信息和所述标准属性生成知识图谱的结构化查询，在知识图谱中查询答案，将查询到的的答案返回给用户的步骤包括：

若没有检索到对应的三元组，则提示系统尚未收录该问题。

进一步地，所述若没有检索到对应的三元组，则提示系统尚未收录该问题的步骤之后包括：

本发明一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现基于深度学习技术的知识图谱问答方法，包括步骤：接收用户的问题语句；利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别，得到所述问题语句中的实体信息；利用基于注意力机制的属性识别模型对所述问题语句进行属性识别，得到所述问题语句中的属性信息；对所述属性信息进行属性拓展和属性标准化，得到对应到知识图谱中的标准属性；根据所述实体信息和所述标准属性生成知识图谱的结构化查询，在知识图谱中查询答案，将查询到的答案返回给用户。

提取用户问题语句中的实体和第一属性词；

若没有检索到对应的三元组，则提示系统尚未收录该问题。

在一个具体的实施例中，所述利用基于注意力机制的属性识别模型对所述问题语句进行属性识别，得到所述问题语句中的属性信息的步骤之前还包括：

对初始的属性识别模型的标签数据中问题经过实体识别、实体概念化，得到概念化标签数据集合。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个......”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种基于深度学习技术的知识图谱问答方法，其特征在于，包括：

接收用户的问题语句；

2.根据权利要求1所述的基于深度学习技术的知识图谱问答方法，其特征在于，所述利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别，得到所述问题语句中的实体信息的步骤包括：

将所述问题语句分词，输入实体识别模型的Token Embedding层，将单词转化为词向量；

根据预测标签序列确定所述问题语句中的实体信息。

3.根据权利要求1所述的基于深度学习技术的知识图谱问答方法，其特征在于，所述利用基于注意力机制的属性识别模型对所述问题语句进行属性识别，得到所述问题语句中的属性信息的步骤包括：

对所述问题语句进行分词处理得到词序列，通过Word Embedding获取每个词的词向量w₁，w₂…，w_n；

将词向量w₁，w₂…，w_n映射成对应的概念词向量e₁，e₂…，e_n；

将概念词向量e₁，e₂…，e_n输入到属性识别模型的Bi-LSTM层，并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h₁，h₂…，h_n；

将第二隐藏向量h₁，h₂…，h_n再次输入到属性识别模型的Bi-LSTM层，并使用短语层的表征向量Phrase进行Attention操作，并对输出的第三隐藏向量进行加权求和，得到表征向量Vector；

4.根据权利要求1所述的基于深度学习技术的知识图谱问答方法，其特征在于，所述对识别到的属性进行属性拓展和属性标准化，得到对应到知识图谱中的标准属性的步骤包括：

提取用户问题语句中的实体和第一属性词；

计算所述第一属性词和多个所述第二属性词之间的相关度，并根据相关度对多个所述第二属性词进行筛选，确定出一个或多个第三属性词；

5.根据权利要求1所述的基于深度学习技术的知识图谱问答方法，其特征在于，所述根据所述实体信息和所述标准属性生成知识图谱的结构化查询，在知识图谱中查询答案，将查询到的答案返回给用户的步骤包括：

若没有检索到对应的三元组，则提示系统尚未收录该问题。

6.根据权利要求1所述的基于深度学习技术的知识图谱问答方法，其特征在于，所述基于注意力机制的属性识别模型的标签数据是概念化标签数据集，其中，得到所述概念化标签数据集的步骤包括：

7.一种基于深度学习技术的知识图谱问答装置，其特征在于，包括：

接收单元，用于接收用户的问题语句；

8.根据权利要求7所述的基于深度学习技术的知识图谱问答装置，其特征在于，所述属性识别单元包括：

词向量获取单元，用于对所述问题语句进行分词处理得到词序列，通过WordEmbedding获取每个词的词向量w₁，w₂…，w_n；

概念词向量获取单元，用于将词向量w₁，w₂…，w_n映射成对应的概念词向量e₁，e₂…，e_n；

第二隐藏向量获取单元，用于将概念词向量e₁，e₂…，e_n输入到属性识别模型的Bi-LSTM层，并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h₁，h₂…，h_n；

表征向量获取单元，用于将第二隐藏向量h₁，h₂…，h_n再次输入到属性识别模型的Bi-LSTM层，并使用短语层的表征向量Phrase进行Attention操作，并对输出的第三隐藏向量进行加权求和，得到表征向量Vector；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。