WO2019223362A1

WO2019223362A1 - 自动问答方法及装置

Info

Publication number: WO2019223362A1
Application number: PCT/CN2019/073662
Authority: WO
Inventors: 陈华杰
Original assignee: 北京国双科技有限公司
Priority date: 2018-05-23
Filing date: 2019-01-29
Publication date: 2019-11-28
Also published as: CN110597966A

Abstract

本发明提供的自动问答方法及装置，先获取用户问题语句与候选问题集，再利用通过问题语句训练样本对注意力神经网络进行训练得到的问题模型，从所述候选问题集中确定出与所述用户问题语句相匹配的问题语句，作为目标问题语句，最后采用所述目标问题语句对应的答案信息，对所述用户问题语句进行回应，利用注意力神经网络的特性，使利用所述问题模型实现的自动问答过程及结果更具有可解释性，提高了自动问答效果。

Description

自动问答方法及装置

本申请要求于2018年5月23日提交中国专利局、申请号为201810502726.3、发明名称为“自动问答方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及信息处理领域，更具体的说，涉及自动问答方法及装置。

背景技术

自动问答技术通过智能助手或者智能客服的形式，自动回答用户在办理相关事务时遇到的问题，大幅减少了人工客服的工作量，同时也让用户享受到更快捷的问答服务。

传统的自动问答方案，将自动问答过程转化成用户问题在常见问题库中的检索过程，具体会利用自然语言处理工具对用户问题语句进行分析，识别出用户问题语句的关键词，并根据获得的关键词从常见问题库中检索出相匹配问题及其答案。然而，在传统自动问答方案中所采用的机器学习方法通常是基于词袋模型的，其中忽略了问题语句中各个词语之间的先后顺序关系，丢失了问题语句中部分语义信息，使得机器学习过程与机器学习结果缺乏可解释性，同样也导致自动问答过程及结果缺乏可解释性。

因此，目前迫切需要一种切实有效的技术方案，以提高自动问答过程及结果的可解释性。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的自动问答方法及装置。

为实现上述目的，本发明提供如下技术方案：

一种自动问答方法，包括：

获取用户问题语句与候选问题集，其中，所述候选问题集中的问题语句均对应有预设的答案信息；

利用预置的问题模型，从所述候选问题集中确定出与所述用户问题语句相匹配的问题语句，作为目标问题语句；其中，所述问题模型为，将历史问题语句作为训练样本对注意力神经网络进行训练得到的；

采用所述目标问题语句对应的答案信息，对所述用户问题语句进行回应。

优选的，所述获取用户问题语句与候选问题集包括：

获取用户问题语句；

采用BM25算法，从预置问题库中检索出与所述用户问题语句相关联的至少一条问题语句，作为候选问题集；所述预置问题库中的问题语句均对应有预设的答案信息。

优选的，所述利用预置的问题模型，从所述候选问题集中确定出与所述用户问题语句相匹配的问题语句，作为目标问题语句包括：

利用预置的问题模型，获取所述用户问题语句与所述候选问题集中的问题语句的相似度；

将所述候选问题集中所述相似度符合预设相似度条件的问题语句，确定为与所述用户问题语句相匹配的问题语句，作为目标问题语句。

优选的，所述问题模型的训练过程包括：

获取训练样本，所述训练样本中包括样本问题语句；

采用所述样本问题语句对注意力神经网络进行训练，得到所述问题模型。

优选的，所述获取训练样本包括：

获取第一问题语句；

获取与所述第一问题语句语义相同的第二问题语句，以及，与所述第一问题语句语义不同的第三问题语句；

将所述第二问题语句作为所述第一问题语句的正样本，将所述第三问题语句作为所述第一问题语句的负样本；其中，所述正样本与所述负样本为训练样本。

优选的，所述采用所述样本问题语句对注意力神经网络进行训练，得到所述问题模型包括：

获取所述样本问题语句中各个词对应的词向量；

根据所述词向量，利用双向门结构的循环神经网络，抽取所述样本问题语句中各个时刻对应的特征向量；

利用注意力机制，确定所述样本问题语句中各个时刻对应的权重信息；

根据所述样本问题语句中各个时刻对应的特征向量与权重信息，确定所述样本问题语句对应的句向量；

根据所述句向量，确定所述注意力神经网络的网络参数，得到所述问题模型。

优选的，在所述采用所述样本问题语句对注意力神经网络进行训练之前，所述方法还包括：

获取目标领域的文本语句；

对所述文本语句进行分词处理，得到所述文本语句的分词结果；

对所述文本语句的分词结果进行词向量训练，得到词向量模型；

相应的，

所述获取所述样本问题语句中各个词对应的词向量包括：

对所述样本问题语句进行分词处理，得到所述样本问题语句的分词结果；

根据所述词向量模型，获取所述样本问题语句中各个词对应的词向量。

一种自动问答装置，包括：

问题获取单元，用于获取用户问题语句与候选问题集，其中，所述候选问题集中的问题语句均对应有预设的答案信息；

问题确定单元，用于利用预置的问题模型，从所述候选问题集中确定出与所述用户问题语句相匹配的问题语句，作为目标问题语句；其中，所述问题模型为，将历史问题语句作为训练样本对注意力神经网络进行训练得到的；

问题回应单元，用于采用所述目标问题语句对应的答案信息，对所述用户问题语句进行回应。

一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行上述的自动问答方法。

一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行上述的自动问答方法。

借由上述技术方案，本发明提供的自动问答方法及装置，先获取用户问题语句与候选问题集，再利用通过问题语句训练样本对注意力神经网络进行训练得到的问题模型，从所述候选问题集中确定出与所述用户问题语句相匹配的问题语句，作为目标问题语句，最后采用所述目标问题语句对应的答案信息，对所述用户问题语句进行回应，利用注意力神经网络的特性，使利用所述问题模型实现的自动问答过程及结果更具有可解释性，提高了自动问答效果。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本申请实施例提供的自动问答方法的一种流程图；

图2为本申请实施例提供的自动问答方法的另一种流程图；

图3为本申请实施例提供的问题模型训练过程的一种流程图；

图4为本申请实施例提供的问题模型训练过程的另一种流程图；

图5为本申请实施例提供的语句编码示意图；

图6为本申请实施例提供的问题模型训练过程的又一种流程图；

图7为本申请实施例提供的自动问答装置的一种结构示意图；

图8为本申请实施例提供的自动问答装置的另一种结构示意图；

图9为本申请实施例提供的自动问答业务流程示例图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

请参阅图1，图1为本申请实施例提供的自动问答方法的一种流程图。

如图1所示，所述方法包括：

S101：获取用户问题语句与候选问题集。

用户问题语句是指表征用户提出的问题的语句，用户问题语句可以是用户直接输入的文本形式的问题语句，也可以是将用户说出的问题语音转换成文本形式后得到的问题语句。

候选问题集是用于匹配用户问题语句的一个问题集合，候选问题集中的问题语句均对应有预设的答案信息。

S102：利用预置的问题模型，从所述候选问题集中确定出与所述用户问题语句相匹配的问题语句，作为目标问题语句。

其中，所述问题模型为，将历史问题语句作为训练样本对注意力神经网络进行训练得到的。基于时序来对问题语句进行编码时，问题语句中词的不同位置对应不同时刻，采用注意力神经网络可以学习到问题语句中不同时刻的权重信息，并可以有效提高问题语句中重要词的权重，降低问题语句中无用信息的干扰，在依据问题语句中不同时刻的权重信息生成句向量时，能够使句向量具备问题语句的语义信息，从而提高句向量的可解释性。

所述问题模型实际上是一种注意力神经网络模型，其具备注意力神经网络的特性。所以，利用所述问题模型从所述候选问题集中去匹配所述用户问题语句，能够提高匹配结果的可解释性。

候选问题集中与所述用户问题语句相匹配的问题语句，应与所述用户问题语句的语义相同，应表达同一含义，也即，所述目标问题语句与所述用户问题语句实际上为同一问题。所述目标问题语句与所述用户问题语句的语义应相同，但表达形式可以相同，也可以不同。例如，所述目标问题语句可以是所述用户问题语句的变形语句，这样所述目标问题语句与所述用户问题语句的语义相同，但表达形式不同。

S103：采用所述目标问题语句对应的答案信息，对所述用户问题语句进行回应。

由于目标问题语句与用户问题语句相匹配，表明两者实际上是同一问题，而目标问题语句又对应有预设的答案信息，所以，目标问题语句对应的答案信息，实际上就是用户问题语句的答案信息。

在确定出用户问题语句的答案信息后，采用所述答案信息对用户问题语句进行回应，便实现了自动问答过程。

本实施例提供的自动问答方法，先获取用户问题语句与候选问题集，再利用通过问题语句训练样本对注意力神经网络进行训练得到的问题模型，从所述候选问题集中确定出与所述用户问题语句相匹配的问题语句，作为目标问题语句，最后采用所述目标问题语句对应的答案信息，对所述用户问题语句进行回应，利用注意力神经网络的特性，使利用所述问题模型实现的自动问答过程及结果更具有可解释性，提高了自动问答效果。

请参阅图2，图2为本申请实施例提供的自动问答方法的另一种流程图。

如图2所示，所述方法包括：

S201：获取用户问题语句。

S202：采用BM25算法，从预置问题库中检索出与所述用户问题语句相关联的至少一条问题语句，作为候选问题集。

预置问题库(FAQ，Frequently Asked Questions)是根据预先收集到的问题语句构建得到的问题库，具体地，所述预置问题库可以具体为针对某一领域的问题库，也可以是针对多个领域的问题库。

一示例中，所述预置问题库中的问题语句可包括：目标领域的常见问题语句，以及，所述常见问题语句的变形语句。

所述常见问题语句的变形语句，是指与所述常见问题语句语义相同但表达形式不同的问题语句，其具体可以是采用检索的方式在互联网中爬取所述常见问题语句而得到的。通过常见问题语句的变形语句，可以丰富常见问题语句的表达形式，提高用户问题语句的命中率。

一示例中，所述目标领域可以是指司法领域，也可以是指金融领域、计算机技术领域或其他领域。

所述预置问题库中的问题语句均对应有预设的答案信息，所述预设的答案信息可以是人工总结编写的，也可以是采取其他方式获取到的。

BM25(Best Match25)算法是一种用来评价搜索词和文档之间相关性的算法，具有较高的搜索效率与效果。采用BM25算法，从预置问题库中检索出与所述用户问题语句相关联的至少一条问题语句，作为候选问题集，而并不是将预置问题库直接作为候选问题集，从而减少了候选问题集的数据量，提高了从所述候选问题集中匹配所述用户问题语句的处理速度。

S203：利用预置的问题模型，获取所述用户问题语句与所述候选问题集中的问题语句的相似度。

利用所述问题模型，可以将所述用户问题语句与所述候选问题集中任一问题语句均转换成相应的句向量，通过计算句向量之间的相似度，可以得到所述用户问题语句与所述候选问题集中任一问题语句之间的相似度。

所述问题模型是将历史问题语句作为训练样本对注意力神经网络进行训练得到的，利用所述问题模型得到的句向量包含了问题语句的语义信息，所以，语义信息越相近的问题语句之间的句向量的相似度就越高。

S204：将所述候选问题集中所述相似度符合预设相似度条件的问题语句，确定为与所述用户问题语句相匹配的问题语句，作为目标问题语句。

在获取到所述用户问题语句与所述候选问题集中每个问题语句的相似度后，可以将所述候选问题集中所述相似度最高的问题语句确定为目标问题语句，也可以将所述候选问题集中所述相似度最高且大于预设相似度阈值的问题语句确定为目标问题语句。

相应的，所述预设相似度条件为：相似度最高，或，相似度最高且大于预设相似度阈值。

S205：采用所述目标问题语句对应的答案信息，对所述用户问题语句进行回应。

本实施例提供的自动问答方法，在获取到用户问题语句后，先采用BM25算法，从预置问题库中检索出与所述用户问题语句相关联的至少一条问题语句，作为候选问题集，而并不是直接将预置问题库整个作为候选问题集，从而降低了候选问题集的数据量，提高了利用问题模型从候选问题集中匹配用户问题语句的处理速度，减少了整个自动问答过程的响应时间，能够充分满足自动问答领域的高并发以及快速响应的需求。

请参阅图3，图3为本申请实施例提供的问题模型训练过程的一种流程图。

本实施例提供的问题模型训练过程，是指采用问题语句训练样本对注意力神经网络进行训练的过程。

如图3所示，所述问题模型训练过程包括：

S301：获取训练样本。

其中，所述训练样本中包括样本问题语句，样本问题语句就是作为训练样本的问题语句。

一示例中，所述样本问题语句可以是预置问题库(FAQ)中的问题语句，也可以是通过其他渠道获取到的问题语句。

一示例中，所述获取训练样本的过程可包括：

a1、获取第一问题语句；

其中，所述第一问题语句可以是所述预置问题库中的任一问题语句。

a2、获取与所述第一问题语句语义相同的第二问题语句，以及，与所述第一问题语句语义不同的第三问题语句；

a3、将所述第二问题语句作为所述第一问题语句的正样本，将所述第三问题语句作为所述第一问题语句的负样本；其中，所述正样本与所述负样本为训练样本。

其中，所述第二问题语句与所述第三问题语句也可以是所述预置问题库中的问题语句；所述第二问题语句的数量可以是一个或多个；同样的，所述第三问题语句的数量也可以是一个或多个。

利用步骤a1～a3、可以针对预置问题库中的每个问题语句，将语义相同的问题语句作为正样本，将语义不同的问题语句作为负样本。

一示例中，还可以通过一些无监督的方法来增加容易混淆的语义不同的问题语句作为负样本。所述无监督的方法可以包括：TF-IDF(term frequency–inverse document frequency，词频-逆向文件频率)的向量空间模型、BM25与WMD(word mover’s distance，词移距离)算法中的至少一种。

S302：采用所述样本问题语句对注意力神经网络进行训练，得到所述问题模型。

一示例中，根据获取到的训练样本，可使用tensorflow来对注意力神经网络进行训练，训练的目标是使语义相近的问题语句具有相近的句向量(语义相同的问题语句应具有相同的句向量)，相似度可通过余弦相似度来度量。

其他示例中，还可以使用Theano、Keras、Torch等来对注意力神经网络进行训练。TensorFlow、Theano、Keras、Torch均是机器学习框架。

本实施例提供的问题模型训练过程，在获取训练样本后，采用所述样本问题语句对注意力神经网络进行训练，使语义相近的问题语句可具有相近的句向量，从而使机器学习过程与学习结果均具有较强的可解释性，得到具备可解释性的问题模型。

请参阅图4，图4为本申请实施例提供的问题模型训练过程的另一种流程图。

如图4所示，所述问题模型训练过程包括：

S401：获取训练样本。

S402：获取所述样本问题语句中各个词对应的词向量。

在训练注意力神经网络时，需要将样本问题语句中各个词先转化为词向量的形式，来作为注意力神经网络的输入数据。

S403：根据所述词向量，利用双向门结构的循环神经网络，抽取所述样本问题语句中各个时刻对应的特征向量。

在基于时序对语句进行分析时，可以语句中的词看做是一个时间序列，语句中的每个词均对应一个时刻。

利用双向门结构的循环神经网络，可以充分结合词向量的上下文关系来对当前时刻的信息进行编码，从而抽取出具有更多语义信息的特征向量。双向门结构的循环神经网络可包括长短期记忆网络(LSTM，Long Short-Term Memory)、门控循环单元(GRU，Gated Recurrent Unit)等。

S404：利用注意力机制，确定所述样本问题语句中各个时刻对应的权重信息。

在一条语句中，不同的词具有不同的重要度，所以，根据不同词的重要度，利用注意力机制，可以学习到语句中不同时刻的权重信息。

S405：根据所述样本问题语句中各个时刻对应的特征向量与权重信息，确定所述样本问题语句对应的句向量。

利用所述样本问题语句中各个时刻的权重信息，针对所述各个时刻的特征向量进行加权汇总，便可以得到所述样本问题语句对应的句向量；当然也可以采取其他计算方式来确定所述样本问题语句对应的句向量，在此不做赘述。

其中，步骤S403-S405的实现过程可如图5所示，针对任一样本问题语句中各个词对应的词向量进行双向门结构的特征抽取，并确定各个词向量所对应时刻的权重w1～wn，最后根据权重w1～wn与抽取出来的各个特征向量，确定出所述样本问题语句的句向量。

S406：根据所述句向量，确定所述注意力神经网络的网络参数，得到所述问题模型。

利用双向门结构的循环神经网络与注意力机制编码得到的句向量，充分包含了样本问题语句的语义信息，降低了无用信息的干扰。语义相同的样本问题语句应具有相同或相近的句向量，所以，可以根据各个样本问题语句的句向量之间的相似度，来不断调整注意力神经网络的网络参数，直至确定出一组可以实现语义相同的样本问题语句具有相同或相近的句向量这一目标的网络参数，进而得到训练好的问题模型。

本实施例提供的问题模型训练过程，根据样本问题语句中各个词对应的词向量，利用双向门结构的循环神经网络，抽取所述样本问题语句中各个时刻对应的特征向量；并利用注意力机制确定所述样本问题语句中各个时刻对应的权重信息；然后根据所述样本问题语句中各个时刻对应的特征向量与权重信息确定所述样本问题语句对应的句向量，最后根据所述句向量，确定所述注意力神经网络的网络参数，得到所述问题模型，在确定句向量过程中，充分挖掘了样本问题语句的语义信息，进一步提高了机器学习过程与学习结果的可解释性，得到可解释性更强的问题模型。

请参阅图6，图6为本申请实施例提供的问题模型训练过程的又一种流程图。

如图6所示，所述问题模型训练过程包括：

S501：获取目标领域的文本语句。

目标领域为自动问答装置的应用领域，为了提高自动问答装置的精准度，需要获取到样本问题语句中各个词对应的准确的词向量。以司法领域为例，为了获得更适用于司法领域的词向量，可以大量收集司法领域的文本语句，作为司法领域的文本语句库。

S502：对所述文本语句进行分词处理，得到所述文本语句的分词结果。

分词处理可使用开源分词工具软件来进行，如利用哈工大的语言技术平台(LTP，Language Technology Plantform)，对所述文本语句库中的文本语句进行分词，得到分词结果。所述文本语句的分词结果包括所述文本语句中的各个词。

S503：对所述文本语句的分词结果进行词向量训练，得到词向量模型。

对于所述文本语句的分词结果，可以采用词向量训练工具来进行训练，以生成相应的词向量模型。词向量训练工具可采用Word2vec，也可以采取其他词向量训练工具。

S504：获取训练样本，所述训练样本中包括样本问题语句。

S505：对所述样本问题语句进行分词处理，得到所述样本问题语句的分词结果。

样本问题语句的分词结果包括所述样本问题语句中的各个词。

S506：根据所述词向量模型，获取所述样本问题语句中各个词对应的词向量。

利用词向量模型可以获取词对应的词向量，所以，针对样本问题语句中的各个词，可以从所述词向量模型中获取样本问题语句中各个词对应的词向量。

一示例中，当样本问题语句中某一词或某些词，从所述词向量模型中获取不到对应的词向量时，可以将这些词称为“集外词(out of vocabulary)”，并为这些集外词指定一个随机词向量(如UNK的词向量)，作为所述集外词对应的词向量。

S507：根据所述词向量，利用双向门结构的循环神经网络，抽取所述样本问题语句中各个时刻对应的特征向量。

S508：利用注意力机制，确定所述样本问题语句中各个时刻对应的权重信息。

S509：根据所述样本问题语句中各个时刻对应的特征向量与权重信息，确定所述样本问题语句对应的句向量；

S510：根据所述句向量，确定所述注意力神经网络的网络参数，得到所述问题模型。

本实施例提供的问题模型训练过程，获取目标领域的文本语句并对所述文本语句进行分词处理，再对所述文本语句的分词结果进行词向量训练得到词向量模型，以用于提高所述样本问题语句中各个词对应的词向量的获取效率，进而提高问题模型训练效率。

对应于前述的自动问答方法，本发明实施例还提供了相应的自动问答装置。下文描述的自动问答装置的技术内容，可与上文描述的自动问答方法的技术内容与相互对应参照。

请参阅图7，图7为本申请实施例提供的自动问答装置的一种结构示意图。

本实施例的自动问答装置，用于实施前述实施例的自动问答方法，如图7所示，所述装置包括：

问题获取单元100，用于获取用户问题语句与候选问题集，其中，所述候选问题集中的问题语句均对应有预设的答案信息。

问题确定单元200，用于利用预置的问题模型，从所述候选问题集中确定出与所述用户问题语句相匹配的问题语句，作为目标问题语句；其中，所述问题模型为，将历史问题语句作为训练样本对注意力神经网络进行训练得到的；

问题回应单元300，用于采用所述目标问题语句对应的答案信息，对所述用户问题语句进行回应。

一示例中，所述问题获取单元100具体用于：

获取用户问题语句；

一示例中，所述问题确定单元200具体用于：

本实施例提供的自动问答装置，先获取用户问题语句与候选问题集，再利用通过问题语句训练样本对注意力神经网络进行训练得到的问题模型，从所述候选问题集中确定出与所述用户问题语句相匹配的问题语句，作为目标问题语句，最后采用所述目标问题语句对应的答案信息，对所述用户问题语句进行回应，利用注意力神经网络的特性，使利用所述问题模型实现的自动问答过程及结果更具有可解释性，提高了自动问答效果。

请参阅图8，图8为本申请实施例提供的自动问答装置的另一种结构示意图。

如图8所示，本实施例的自动问答装置，除了包括前述实施例中的问题获取单元100、问题确定单元200、问题回应单元300外，还包括：模型训练单元400与问题库单元500。

所述模型训练单元400，用于获取训练样本，所述训练样本中包括样本问题语句；采用所述样本问题语句对注意力神经网络进行训练，得到所述问题模型。

所述问题库单元500，用于收集历史问题语句，根据收集到的历史问题语句配置问题库，得到预置问题库。

一示例中，所述模型训练单元400获取训练样本的过程包括：

获取第一问题语句；

一示例中，所述模型训练单元400采用所述样本问题语句对注意力神经网络进行训练，得到所述问题模型的过程包括：

获取所述样本问题语句中各个词对应的词向量；

一示例中，所述模型训练单元400在采用所述样本问题语句对注意力神经网络进行训练之前，还用于：

获取目标领域的文本语句；

对所述文本语句的分词结果进行词向量训练，得到词向量模型。

相应的，

所述模型训练单元400获取所述样本问题语句中各个词对应的词向量的过程包括：

本实施例提供的自动问答装置，根据样本问题语句中各个词对应的词向量，利用双向门结构的循环神经网络，抽取所述样本问题语句中各个时刻对应的特征向量；并利用注意力机制确定所述样本问题语句中各个时刻对应的权重信息；然后根据所述样本问题语句中各个时刻对应的特征向量与权重信息确定所述样本问题语句对应的句向量，最后根据所述句向量，确定所述注意力神经网络的网络参数，得到所述问题模型，在确定句向量过程中，充分挖掘了样本问题语句的语义信息，进一步提高了机器学习过程与学习结果的可解释性，得到可解释性更强的问题模型。

请参阅图9，图9为本申请实施例提供的自动问答业务流程示例图。

如图9所示，本实施例的自动问答业务流程包括：

首先，获取用户查询问题，并对用户查询问题进行预处理以及用户意图识别，得到用户问题语句；其中，预处理可以包括个性化分词与关键词提取。

然后，从知识库(即预置问题库)中初步检索出与所述用户问题语句相关联的至少一条问题语句，作为候选问题集。知识库中问题语句的获取方式可以包括网络智能爬取、用户数据挖掘与用户自定义中至少一项。

最后，利用训练好的问题模型，对所述用户问题语句与所述候选问题集进行语义匹配，确定出目标问题语句及其答案信息，并采用所述答案信息对所述用户问题语句进行回应。

本发明实施例提供的自动问答装置，包括处理器和存储器，上述问题获取单元100、问题确定单元200、问题回应单元300、模型训练单元400与问题库单元500等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来解决目前自动问答方案缺乏可解释性的技术问题。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。

本发明实施例提供了一种存储介质，其上存储有程序，该程序被处理器执行时实现所述自动问答方法。

本发明实施例提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行所述自动问答方法。

本发明实施例提供了一种设备，设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序，处理器执行程序时实现以下步骤：

优选的，所述获取用户问题语句与候选问题集包括：

获取用户问题语句；

优选的，所述问题模型的训练过程包括：

获取训练样本，所述训练样本中包括样本问题语句；

优选的，所述获取训练样本包括：

获取第一问题语句；

获取所述样本问题语句中各个词对应的词向量；

获取目标领域的文本语句；

相应的，

所述获取所述样本问题语句中各个词对应的词向量包括：

本文中的设备可以是服务器、PC、PAD、手机等。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有如下方法步骤的程序：

优选的，所述获取用户问题语句与候选问题集包括：

获取用户问题语句；

优选的，所述问题模型的训练过程包括：

获取训练样本，所述训练样本中包括样本问题语句；

优选的，所述获取训练样本包括：

获取第一问题语句；

获取所述样本问题语句中各个词对应的词向量；

获取目标领域的文本语句；

相应的，

所述获取所述样本问题语句中各个词对应的词向量包括：

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

一种自动问答方法，其中，包括：

获取用户问题语句与候选问题集，其中，所述候选问题集中的问题语句均对应有预设的答案信息；

利用预置的问题模型，从所述候选问题集中确定出与所述用户问题语句相匹配的问题语句，作为目标问题语句；其中，所述问题模型为，将历史问题语句作为训练样本对注意力神经网络进行训练得到的；

采用所述目标问题语句对应的答案信息，对所述用户问题语句进行回应。
如权利要求1所述的方法，其中，所述获取用户问题语句与候选问题集包括：

获取用户问题语句；

采用BM25算法，从预置问题库中检索出与所述用户问题语句相关联的至少一条问题语句，作为候选问题集；所述预置问题库中的问题语句均对应有预设的答案信息。
如权利要求1所述的方法，其中，所述利用预置的问题模型，从所述候选问题集中确定出与所述用户问题语句相匹配的问题语句，作为目标问题语句包括：

利用预置的问题模型，获取所述用户问题语句与所述候选问题集中的问题语句的相似度；

将所述候选问题集中所述相似度符合预设相似度条件的问题语句，确定为与所述用户问题语句相匹配的问题语句，作为目标问题语句。
如权利要求1所述的方法，其中，所述问题模型的训练过程包括：

获取训练样本，所述训练样本中包括样本问题语句；

采用所述样本问题语句对注意力神经网络进行训练，得到所述问题模型。
如权利要求4所述的方法，其中，所述获取训练样本包括：

获取第一问题语句；

获取与所述第一问题语句语义相同的第二问题语句，以及，与所述第一问题语句语义不同的第三问题语句；

将所述第二问题语句作为所述第一问题语句的正样本，将所述第三问题语句作为所述第一问题语句的负样本；其中，所述正样本与所述负样本为训练样本。
如权利要求4所述的方法，其中，所述采用所述样本问题语句对注意力神经网络进行训练，得到所述问题模型包括：

获取所述样本问题语句中各个词对应的词向量；

根据所述词向量，利用双向门结构的循环神经网络，抽取所述样本问题语句中各个时刻对应的特征向量；

利用注意力机制，确定所述样本问题语句中各个时刻对应的权重信息；

根据所述样本问题语句中各个时刻对应的特征向量与权重信息，确定所述样本问题语句对应的句向量；

根据所述句向量，确定所述注意力神经网络的网络参数，得到所述问题模型。
如权利要求6所述的方法，其中，在所述采用所述样本问题语句对注意力神经网络进行训练之前，所述方法还包括：

获取目标领域的文本语句；

对所述文本语句进行分词处理，得到所述文本语句的分词结果；

对所述文本语句的分词结果进行词向量训练，得到词向量模型；

相应的，

所述获取所述样本问题语句中各个词对应的词向量包括：

对所述样本问题语句进行分词处理，得到所述样本问题语句的分词结果；

根据所述词向量模型，获取所述样本问题语句中各个词对应的词向量。
一种自动问答装置，其中，包括：

问题获取单元，用于获取用户问题语句与候选问题集，其中，所述候选问题集中的问题语句均对应有预设的答案信息；

问题确定单元，用于利用预置的问题模型，从所述候选问题集中确定出与所述用户问题语句相匹配的问题语句，作为目标问题语句；其中，所述问题模型为，将历史问题语句作为训练样本对注意力神经网络进行训练得到的；

问题回应单元，用于采用所述目标问题语句对应的答案信息，对所述用户问题语句进行回应。
一种存储介质，其中，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行如权利要求1-7中任一项所述的自动问答方法。
一种处理器，其中，所述处理器用于运行程序，其中，所述程序运行时执行如权利要求1-7中任一项所述的自动问答方法。