CN109271496A

CN109271496A - 一种基于文本、知识库及序列到序列的自然问答方法

Info

Publication number: CN109271496A
Application number: CN201811005005.8A
Authority: CN
Inventors: 叶志豪; 廖朝辉; 蔡瑞初; 崔洪刚; 李卓章
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2018-08-30
Filing date: 2018-08-30
Publication date: 2019-01-25
Anticipated expiration: 2038-08-30
Also published as: CN109271496B

Abstract

本发明具体涉及一种基于文本、知识库及序列到序列的自然问答方法，包括如下：S1：用户输入一个问题；S2：初始化模型；S3：序列到序列模型中的编码器对问题进行编码，得到上下文向量；S4：利用用户问题来对知识进行检索得到与问题相关的知识候选集；S5：利用解码器当前状态和问题上下文向量，来决定生产回答中词的来源；S6：将上下文向量输入解码器，用于生产常用词；S7：利用解码器当前状态和问题上下文，知识候选集来匹配最终知识实体；S8：迭代执行步骤S5‑S7，直至最终输出自然答案。本发明克服了现有不能有效查询知识和所需知识不存在、不能有效的回答多个知识实体的缺陷，完全采用生成式，大量减少了人工干预。

Description

一种基于文本、知识库及序列到序列的自然问答方法

技术领域

本发明涉及自动问答领域，具体的涉及一种基于文本、知识库及序列到序列的自然问答方法。

背景技术

自动问答技术是一种能够自动回答问题，可以计算出用户输入问题与问答库中的候选问答对之间的各种特征，例如，词频、逆向词频、空间向量模型等等。然后，利用问答排序模型，根据所计算出的特征、以及各种特征的权值，得出问题与候选答案之间的匹配度，再根据该匹配度对候选问答对进行排序，并将排名靠前的问答对返回给用户。对于自动问答技术，一个重要的评价指标就是回答答案中知识的匹配程度，比如一个问题是“西游记的作者是谁”，回答应该为：“西游记的作者是吴承恩”，在该例子中可以把吴承恩看作为一个知识实体。通用策略是指通过联合嵌入结构化知识库和文本的知识形成统一的结构化表示，允许信息的交错传播，实际上，通用策略是一个矩阵，每一行都是实体对，每一列是结构化三元组和非结构化文本关系。现有的通用策略是用于在知识群体的背景下做关系抽取。每一行都是一个实体对，每一列代表了它们之间的关系，可以为结构化知识库关系，也可以是文本之间存在的一种策略。

现有的问答系统方法利用文本和结构化知识作为知识源，但文本是非结构化知识，三元组知识库是结构化知识，只有有效的结合文本和结构化知识，才能在匹配查询知识的时候能够查询到更相符合的知识。现有的自然问答方法存在着不能将文本和结构化知识结合作为统一的知识来源的技术缺陷。并且现有的自然问答方法不能有效查询知识和知识来源缺乏的问题，在回答每一个用户的问题时不能自然生成一句自然问答语句，而是单个知识实体，并且不能有效的回答需要多个知识实体的问题。

发明内容

本发明克服了现有的自然问答方法的不能有效的解决传统生成式系统中非结构化文本和结构化文本有效结合的技术缺陷，提供了一种基于文本、知识库及序列到序列的自然问答方法。

为解决上述技术问题，本发明的技术方案如下：

一种基于文本、知识库及序列到序列的自然问答方法，包括如下步骤：

S1：用户输入一个问题；

S2：根据当前对话历史和上一轮用户对话初始化模型；

S3：序列到序列模型中的编码器对问题进行编码，得到上下文向量；

S4：利用用户问题来对知识进行检索得到与问题相关的知识候选集；

S5：利用解码器当前状态和问题上下文向量，来决定生产回答中词的来源；

S6：将上下文向量输入解码器，用于生产常用词；

S7：利用解码器当前状态和问题上下文，知识候选集来匹配最终知识实体；

S8：迭代执行步骤S5-S7，直至最终输出自然答案。

序列到序列模型包括解码器和编码器，所述编码器根据输入的前对话历史和上一轮用户对话进行编码，提取对话的特征，并将特征转变成上下文向量；所述编码器提取的上下文向量传输至解码器；所述解码器根据上下文向量生成新的序列。

S3具体包括如下步骤：

S3.1：编码器对当前问题编码，得到隐含向量和解码器当前隐含向量，并且计算相似度向量；

S3.2：根据S3.1得到的相似度向量计算注意力权重；

S3.3：根据S3.2得到的注意力权重、S3.1解码器的隐含向量，计算编码器当前的上下文向量，具体为注意力权重与隐含向量相乘；

S4具体包括如下步骤：

S4.1：提取问题的关键词；

S4.2：利用关键词得到结构化知识库中对应的三元组，组成一个集合；

S4.3：根据结构化知识库中对应的三元组查找文本知识，组成一个集合；

S4.4：根据S4.3得到的集合与结构化知识库候选知识结合做交集运算得到最

终的知识候选集合。

S7具体步骤为：

S7.1：得到当前状态

S7.2：将当前状态与问题上下向量相结合，生成待匹配向量输出知识匹配模

块，所述知识匹配模块包括多层神经网络或记忆网络；

S7.3：根据待匹配向量和知识候选集合进行知识匹配，生成当前状态的知识

实体。

S7.2记忆网络利用当前知识候选集作为知识来源，当前问题和当前解码器状态作为查询向量，经过网络计算，得到最为匹配的知识实体。

与现有技术相比，本发明技术方案的有益效果是：采用通用模式，有效的解决传统生成式系统和非结构化文本和结构化文本不能有效结合的问题，使得自然问答方法能够查询一个更加有效的知识来源。解决传统方法不能有效查询知识和所需要的知识不存在的问题，本发明技术方法采用通用策略对结构化知识库和非结构化文本进行有效整合，解决了生成式问答方法只能生成一个实体的问题，提升自然回答方法的效果和能力。

附图说明

图1为本发明的方法流程图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；

对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1：

如图1所示，一种基于文本、知识库及序列到序列的自然问答方法，包括如下步骤：

S1：用户输入一个问题；

S2：根据当前对话历史和上一轮用户对话初始化模型；

S3：序列到序列模型中的编码器对问题进行编码，得到上下文向量；具体如下：S3.1：编码器对当前问题编码，得到隐含向量和解码器当前隐含向量，并且计算相似度向量；S3.2：根据S3.1得到的相似度向量计算注意力权重；S3.3：根据S3.2得到的注意力权重、S3.1解码器的隐含向量，计算编码器当前的上下文向量，具体为注意力权重与隐含向量相乘；

S4：利用用户问题来对知识进行检索得到与问题相关的知识候选集；具体如下：S4具体包括如下步骤：S4.1：提取问题的关键词；S4.2：利用关键词得到结构化知识库中对应的三元组，组成一个集合；S4.3：根据结构化知识库中对应的三元组查找文本知识，组成一个集合；S4.4：根据S4.3得到的集合与结构化知识库候选知识结合做交集运算得到最终的知识候选集合。

S6：将上下文向量输入解码器，用于生产常用词；

S7：利用解码器当前状态和问题上下文，知识候选集来匹配最终知识实体；具体为：S7.1：得到当前状态S7.2：将当前状态与问题上下向量相结合，生成待匹配向量输出知识匹配模块，所述知识匹配模块包括多层神经网络或记忆网络；S7.3：根据待匹配向量和知识候选集合进行知识匹配，生成当前状态的知识实体。

S8：迭代执行步骤S5-S7，直至最终输出自然答案。

其中，在解码器部分，

h^t＝f(h^t-1,x^t),t＝1,...,T_x

x表示输入，t表示时间步，h表示每一个时间步的编码状态，c表示上下文向量；

在编码器部分，

h⁰＝tanh(V’c)

h^t＝f(h^t-1,y^t-1,c),t＝1,...,T_x

p(y^t|y^t-1,y^t-2,...,y¹,c)＝g(h^t,y^t-1,c)

y表示当前生成词表示输入，t表示时间步，h表示每一个时间步的解码状态，c表示编码器上下文向量；

其中，隐含向量的权重可由下式得到，

a_ij表示第i个目标与隐层向量h_j之间的相关性。

附图中描述位置关系的用语仅用于示例性说明，不能理解为对本专利的限制；

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种基于文本、知识库及序列到序列的自然问答方法，其特征在于，所述方法包括如下步骤：

S1：用户输入一个问题；

S2：根据当前对话历史和上一轮用户对话初始化模型；

S6：将上下文向量输入解码器，用于生产常用词；

S8：迭代执行步骤S5-S7，直至最终输出自然答案。

2.根据权利要求1所述的基于文本、知识库及序列到序列的自然问答方法，其特征在于，所述序列到序列模型包括解码器和编码器，所述编码器根据输入的前对话历史和上一轮用户对话进行编码，提取对话的特征，并将特征转变成上下文向量；所述编码器提取的上下文向量传输至解码器；所述解码器根据上下文向量生成新的序列。

3.根据权利要求1所述的基于文本、知识库及序列到序列的自然问答方法，其特征在于，所述S3具体包括如下步骤：

S3.2：根据S3.1得到的相似度向量计算注意力权重；

S3.3：根据S3.2得到的注意力权重、S3.1解码器的隐含向量，计算编码器当前的上下文向量，具体为注意力权重与隐含向量相乘。

4.根据权利要求1所述的基于文本、知识库及序列到序列的自然问答方法，其特征在于，所述S4具体包括如下步骤：

S4.1：提取问题的关键词；

S4.4：根据S4.3得到的集合与结构化知识库候选知识结合做交集运算得到最终的知识候选集合。

5.根据权利要求1所述的基于文本、知识库及序列到序列的自然问答方法，其特征在于，所述S7具体步骤为：

S7.1：得到当前状态

S7.2：将当前状态与问题上下向量相结合，生成待匹配向量输出知识匹配模块，所述知识匹配模块包括多层神经网络或记忆网络；

S7.3：根据待匹配向量和知识候选集合进行知识匹配，生成当前状态的知识实体。

6.根据权利要求5所述的基于文本、知识库及序列到序列的自然问答方法，其特征在于，所述S7.2记忆网络利用当前知识候选集作为知识来源，当前问题和当前解码器状态作为查询向量，经过网络计算，得到最为匹配的知识实体。