CN110134790B

CN110134790B - 一种语境集合与回复集合的匹配方法及装置

Info

Publication number: CN110134790B
Application number: CN201910411042.7A
Authority: CN
Inventors: 顾佳宸; 凌震华; 刘权
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2019-05-17
Filing date: 2019-05-17
Publication date: 2022-09-30
Anticipated expiration: 2039-05-17
Also published as: CN110134790A

Abstract

本申请提供了一种语境集合与回复集合的匹配方法及装置，在本申请中，分别对语境集合中的各个句子中的各个语境单词分别进行编码及对回复集合中各个句子中的各个回复单词分别进行编码，在此基础上，得到语境集合中各个句子的匹配向量序列及回复集合中各个句子的匹配向量序列，并基于利用句子上下文信息表达句子的原则，分别基于语境集合中各个句子的匹配向量序列，整合得到第一整合语句向量，及分别基于回复集合中各个句子的匹配向量序列，整合得到第二整合语句向量，保证得到的目标语句匹配向量中包含有语境集合中句子与回复集合中句子之间的关系信息，将其输入分类器，可以提高匹配度的准确性，进而可以提高从回复候选集中选择回复集合的准确性。

Description

一种语境集合与回复集合的匹配方法及装置

技术领域

本申请涉及自然语言处理技术领域，特别涉及一种语境集合与回复集合的匹配方法及装置。

背景技术

随着智能化技术的发展，人机对话也受到越来越多的关注。人机对话的关键在于：终端依据给定的语境从回复候选集中自动选择最匹配的回复集合。

因此，如何提高回复集合的选择可靠性成为问题。

发明内容

为解决上述技术问题，本申请实施例提供一种语境集合与回复集合的匹配方法及装置，以达到提高从回复候选集中选择回复集合的准确性的目的，技术方案如下：

一种语境集合与回复集合的匹配方法，包括：

对语境集合中各个句子中的各个语境单词分别进行编码，分别得到目标语境单词，所述目标语境单词至少包含有所述语境单词及所述语境单词的上下文信息；

对回复集合中各个句子中的各个回复单词分别进行编码，分别得到目标回复单词，所述目标回复单词至少包含有所述回复单词及所述回复单词的上下文信息；

基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词，得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列；

基于所述语境集合中各个句子的匹配向量序列，整合得到第一整合语句向量，所述第一整合语句向量至少包含有表征所述语境集合中各个句子及其上下文信息的向量，及基于所述回复集合中各个句子的匹配向量序列，整合得到第二整合语句向量，所述第二整合语句向量至少包含有表征所述回复集合中各个句子及其上下文信息的向量；

对所述第一整合语句向量和所述第二整合语句向量进行拼接，得到目标语句匹配向量；

将所述目标语句匹配向量输入分类器，得到所述分类器输出的匹配度，作为所述语境集合与所述回复集合的匹配度。

一种语境集合与回复集合的匹配装置，包括：

第一编码模块，用于对语境集合中各个句子中的各个语境单词分别进行编码，分别得到目标语境单词，所述目标语境单词至少包含有所述语境单词及所述语境单词的上下文信息；

第二编码模块，用于对回复集合中各个句子中的各个回复单词分别进行编码，分别得到目标回复单词，所述目标回复单词至少包含有所述回复单词及所述回复单词的上下文信息；

匹配模块，用于基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词，得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列；

整合模块，用于基于所述语境集合中各个句子的匹配向量序列，整合得到第一整合语句向量，所述第一整合语句向量至少包含有表征所述语境集合中各个句子及其上下文信息的向量，及基于所述回复集合中各个句子的匹配向量序列，整合得到第二整合语句向量，所述第二整合语句向量至少包含有表征所述回复集合中各个句子及其上下文信息的向量；

拼接模块，用于对所述第一整合语句向量和所述第二整合语句向量进行拼接，得到目标语句匹配向量；

分类模块，用于将所述目标语句匹配向量输入分类器，得到所述分类器输出的匹配度，作为所述语境集合与所述回复集合的匹配度。

与现有技术相比，本申请的有益效果为：

在本申请中，基于利用单词上下文信息表达单词的原则，分别对语境集合中的各个句子中的各个语境单词分别进行编码及对回复集合中各个句子中的各个回复单词分别进行编码，在此基础上，建立语境集合与回复集合之间句子之间的关系，得到语境集合中各个句子的匹配向量序列及回复集合中各个句子的匹配向量序列，并基于利用句子上下文信息表达句子的原则，分别基于语境集合中各个句子的匹配向量序列，整合得到第一整合语句向量，及分别基于所述回复集合中各个句子的匹配向量序列，整合得到第二整合语句向量，保证得到的目标语句匹配向量中包含有语境集合中句子与回复集合中句子之间的关系信息，将包含有语境集合中句子与回复集合中句子之间的关系信息的目标语句匹配向量输入分类器，可以提高匹配度的准确性，进而可以提高从回复候选集中选择回复集合的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请提供的一种语境集合与回复集合的匹配方法的流程图；

图2是本申请提供的一种得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列的流程图；

图3是本申请提供的一种得到所述语境集合中各个句子的匹配向量序列的流程图；

图4是本申请提供的另一种得到所述语境集合中各个句子的匹配向量序列的流程图；

图5是本申请提供的一种得到所述回复集合中各个句子的匹配向量序列的流程图；

图6是本申请提供的另一种得到所述回复集合中各个句子的匹配向量序列的流程示意图；

图7是本申请提供的一种基于所述语境集合中各个句子的匹配向量序列，整合得到第一整合语句向量的流程图；

图8是本申请提供的一种基于所述回复集合中各个句子的匹配向量序列，整合得到第二整合语句向量的流程图；

图9是本申请提供的另一种基于所述回复集合中各个句子的匹配向量序列，整合得到第二整合语句向量的流程图；

图10是本申请提供的一种语境集合与回复集合的匹配装置的逻辑结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例公开了一种语境集合与回复集合的匹配方法，包括：对语境集合中的各个句子中的各个语境单词分别进行编码，分别得到目标语境单词，所述目标语境单词至少包含有所述语境单词及所述语境单词的上下文信息；对回复集合中的各个句子中的各个回复单词分别进行编码，分别得到目标回复单词，所述目标回复单词至少包含有所述回复单词及所述回复单词的上下文信息；基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词，得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列；基于所述语境集合中各个句子的匹配向量序列，整合得到第一整合语句向量，所述第一整合语句向量至少包含有所述语境集合中至少一个句子的匹配向量及其上下文信息，及基于所述回复集合中各个句子的匹配向量序列，整合得到第二整合语句向量，所述第二整合语句向量至少包含有所述回复集合中至少一个句子的匹配向量及其上下文信息；对所述第一整合语句向量和所述第二整合语句向量进行拼接，得到目标语句匹配向量；将所述目标语句匹配向量输入分类器，得到所述分类器输出的匹配度，作为所述语境集合与所述回复集合的匹配度。在本申请中，可以提高从回复候选集中选择回复集合的准确性。

接下来对本申请实施例公开的语境集合与回复集合的匹配方法进行介绍，如图1所示的，为本申请提供的一种语境集合与回复集合的匹配方法实施例1的流程图，该方法应用于一计算机设备，该方法包括以下步骤：

步骤S11、对语境集合中各个句子中的各个语境单词分别进行编码，分别得到目标语境单词；

所述目标语境单词至少包含有所述语境单词及所述语境单词的上下文信息。

语境单词的上下文信息可以理解为：所述语境单词在所述语境单词所属句子中的上下文信息。如，语境单词所属句子为：请问两位想要买什么？语境单词分别为：请问、两位、想、要、买、什么，其中，语境单词“想”的上下文信息为“两位”及“要”。

语境集合可以理解为：某种语境下的问题集合。如，购衣语境集合下的问题集合，包括：

语句1：请问两位想要买什么？

语句2：我想买一件长袖衬衫。

语句3：请问你穿几号的衬衫？

语句4：我穿中号的。

可以理解的是，语境集合中可以包括一个句子或多个句子。

对语境集合中各个句子中的各个语境单词分别进行编码，分别得到目标语境单词，可以理解为：对语境集合中各个句子的各个语境单词分别进行编码，编码结果作为目标语境单词。

优选的，可以采用BiLSTM编码方式对语境集合中的各个句子中的各个语境单词分别进行编码。

本实施例中，语境集合中各个句子中的各个语境单词可以表示为：

其中，

表示语境集合中第m个句子中包括的语境单词的个数，

表示第m个句子中第i个语境单词，

为d维的向量，d为大于1的整数，

表示第m个句子中语境单词组成的集合。

本实施例中，可以利用如下关系式，采用BiLSTM编码方式对语境集合中的各个句子中的各个语境单词分别进行编码：

其中，

表示对语境集合中第m个句子中第i个语境单词进行编码的结果。

目标语境单词组成的集合可以表示为：

步骤S12、对回复集合中各个句子中的各个回复单词分别进行编码，分别得到目标回复单词；

所述目标回复单词至少包含有所述回复单词及所述回复单词的上下文信息。

回复单词的上下文信息可以理解为：所述回复单词在所述回复单词所属句子中的上下文信息。如，回复单词所属句子为：您想要什么颜色的衬衫？回复单词分别为：您、想、要、什么、颜色、的、衬衫，其中，语境单词“什么”的上下文信息为“要”及“颜色”。

回复集合可以理解为：针对某种语境的问题的回复集合。如，针对购衣语境的回复集合，包括：

语句1：您想要什么颜色的衬衫？

语句2：我们店里有许多不同颜色的衬衫。

语句3：你看看这件黄色的怎么样？

可以理解的是，回复集合中可以包括一个句子或多个句子。

优选的，可以采用BiLSTM编码方式对回复集合中各个句子中的各个回复单词分别进行编码。

本实施例中，回复集合中各个句子中的各个回复单词可以表示为

其中，

表示回复集合中第n个句子中包括的回复单词的个数，

表示第n个句子中第j个语境单词，

为d维的向量，d为大于1的整数，

表示回复集合中第n个句子中回复单词组成的集合。

本实施例中，可以利用如下关系式，采用BiLSTM编码方式对回复集合中各个句子中的各个回复单词分别进行编码：

其中，

表示对回复集合中第n个句子中第j个语境单词进行编码的结果。

目标回复单词组成的集合可以表示为：

步骤S13、基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词，得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列；

基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词，得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列，可以理解为：基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词，得到所述语境集合中各个句子的匹配向量序列；及，基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词，得到所述回复集合中各个句子的匹配向量序列。

所述语境集合中句子的匹配向量至少包括语境集合中句子的向量及表征语境集合中句子的向量与回复集合中句子之间关系的向量。

所述回复集合中句子的匹配向量至少包括回复集合中句子的向量及表征回复集合中句子的向量与语境集合中句子之间关系的向量。

步骤S14、基于所述语境集合中各个句子的匹配向量序列，整合得到第一整合语句向量，及基于所述回复集合中各个句子的匹配向量序列，整合得到第二整合语句向量；

其中，所述第一整合语句向量至少包含有表征所述语境集合中各个句子及其上下文信息的向量；

所述第二整合语句向量至少包含有表征所述回复集合中各个句子及其上下文信息的向量。

步骤S15、对所述第一整合语句向量和所述第二整合语句向量进行拼接，得到目标语句匹配向量；

对所述第一整合语句向量和所述第二整合语句向量进行拼接，得到目标语句匹配向量，可以理解为：将所述第一整合语句向量与所述第二整合语句向量组合为一个向量，作为目标语句匹配向量。

步骤S16、将所述目标语句匹配向量输入分类器，得到所述分类器输出的匹配度，作为所述语境集合与所述回复集合的匹配度。

优选的，分类器可以为具有Sigmoid输出的多层感知器(Multi-LayerPerceptron,MLP)分类器。

作为本申请另一可选实施例2，参照图2，为本申请提供的一种得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列的流程示意图，本实施例主要是对上述实施例1描述的所述基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词，得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列的细化方案，如图2所示，该过程可以包括但并不局限于以下步骤：

步骤S21、基于多个所述目标语境单词，生成所述语境集合的全局向量序列，及基于多个所述目标回复单词，生成所述回复集合的全局向量序列；

基于多个所述目标语境单词，生成所述语境集合的全局向量序列，可以理解为：对多个所述目标语境单词拼接，拼接的结果作为所述语境集合的全局向量序列。

以实施例1中步骤S11介绍的

为例，对对多个所述目标语境单词拼接，拼接的结果作为所述语境集合的全局向量序列进行说明，如，对

中全部目标语境单词拼接，拼接的结果作为所述语境集合的全局向量序列，表示为：

l_c表示所有目标语境单词的个数，

表示第1个目标语境单词，

表示第l_c个目标语境单词。

基于多个所述目标回复单词，生成所述回复集合的全局向量序列，可以理解为：对多个所述目标回复单词拼接，拼接的结果作为所述回复集合的全局向量序列。

以实施例1中步骤S12介绍的

为例，对对多个所述目标回复单词拼接，拼接的结果作为所述回复集合的全局向量序列进行说明，如，对

中全部目标回复单词拼接，拼接的结果作为所述回复集合的全局向量序列，表示为：

l_r表示所有目标回复单词的个数，

表示第1个目标回复单词，

表示第l_r个目标回复单词。

步骤S22、基于所述语境集合的全局向量序列及所述回复集合的全局向量序列，计算所述语境集合的全局向量序列中的各个词向量与所述回复集合的全局向量序列中的各个词向量之间的距离，作为软对齐值；

本实施例中，可以采用如下关系式，计算所述语境集合的全局向量序列中的各个词向量与所述回复集合的全局向量序列中的各个词向量之间的距离：

其中，e_ij表示语境集合的全局向量序列中第i个词向量与回复集合的全局向量序列中第j个词向量之间的距离，

表示语境集合的全局向量序列中第i个词向量，

表示回复集合的全局向量序列中第j个词向量，()^T表示转置。

步骤S23、利用所述软对齐值及所述回复集合的全局向量序列，分别计算表征所述语境集合的全局向量序列中各个词向量与所述回复集合的全局向量序列中词向量之间关系的向量，作为语境对偶向量；

本实施例中，可以采用softmax的方式归一化及加权和的方式，利用所述软对齐值及所述回复集合的全局向量序列，分别计算表征所述语境集合的全局向量序列中各个词向量与所述回复集合的全局向量序列中词向量之间关系的向量。

采用softmax的方式归一化及加权和的方式，可以采用如下关系式，利用所述软对齐值及所述回复集合的全局向量序列，分别计算表征所述语境集合的全局向量序列中各个词向量与所述回复集合的全局向量序列中词向量之间关系的向量：

其中，exp()表示以自然常数e为底的指数函数，

表示

中第j个词向量，∑表示求和函数，e_il表示语境集合的全局向量序列中第i个词向量与回复集合的全局向量序列中第l个词向量之间的距离，

表示表征所述语境集合的全局向量序列中第i个词向量与所述回复集合的全局向量序列中词向量

之间关系的向量。

步骤S24、利用所述软对齐值及所述语境集合的全局向量序列，分别计算表征所述回复集合的全局向量序列中各个词向量与所述语境集合的全局向量序列中词向量之间关系的向量，作为回复对偶向量；

本实施例中，同样可以采用softmax的方式归一化及加权和的方式，利用所述软对齐值及所述语境集合的全局向量序列，分别计算表征所述回复集合的全局向量序列中各个词向量与所述语境集合的全局向量序列中词向量之间关系的向量。

采用softmax的方式归一化及加权和的方式，可以采用如下关系式，利用所述软对齐值及所述回复集合的全局向量序列，分别计算表征所述语境集合的全局向量序列中各个词向量与所述语境集合的全局向量序列中词向量之间关系的向量：

其中，exp()表示以自然常数e为底的指数函数，

表示

中第i个词向量，∑表示求和函数，e_lj表示回复集合的全局向量序列中第j个词向量与语境集合的全局向量序列中第l个词向量之间的距离，

表示表征所述回复集合的全局向量序列中第j个词向量与所述语境集合的全局向量序列中词向量

之间关系的向量。

步骤S25、基于所述语境集合的全局向量序列及各个所述语境对偶向量，得到所述语境集合中各个句子的匹配向量序列；

由于语境对偶向量表征了语境集合的全局向量序列中词向量与回复集合中词向量之间的关系，因此基于语境集合的全局向量序列及各个语境对偶向量，来得到句子级的可以表征语境集合中词向量与回复集合中词向量之间关系的匹配向量。

步骤S26、基于所述回复集合的全局向量序列及各个所述回复对偶向量，得到所述回复集合中各个句子的匹配向量序列。

由于回复对偶向量表征了回复集合的全局向量序列中各个词向量与语境集合中词向量之间的关系，因此基于回复集合的全局向量序列及各个回复对偶向量，来得到句子级的可用表征回复集合中词向量与语境集合中词向量之间关系的匹配向量。

作为本申请另一可选实施例3，参照图3，为本申请提供的一种得到所述语境集合中各个句子的匹配向量序列的流程示意图，本实施例主要是对上述实施例2描述的所述基于所述语境集合的全局向量序列及各个所述语境对偶向量，得到所述语境集合中各个句子的匹配向量序列的细化方案，如图3所示，该过程可以包括但并不局限于以下步骤：

步骤S31、基于各个所述语境对偶向量，生成全局语境对偶向量序列；

基于各个所述语境对偶向量，生成全局语境对偶向量序列，可以理解为：

将各个所述语境对偶向量组合为一个向量，作为全局语境对偶向量序列。

参见实施例2中的

全局语境对偶向量序列可以表示为

步骤S32、将所述语境集合的全局向量序列及所述全局语境对偶向量序列拼接，得到语境全局向量序列；

将所述语境集合的全局向量序列及所述全局语境对偶向量序列拼接，得到语境全局向量序列，可以理解为：

将所述语境集合的全局向量序列及所述全局语境对偶向量序列组合为一个向量序列，作为语境全局向量序列。语境全局向量序列可以表示为

步骤S33、将所述语境全局向量序列拆分为所述语境集合中各个句子对应的向量，作为所述语境集合中各个句子的匹配向量序列。

现举例对将所述语境全局向量序列拆分为所述语境集合中各个句子对应的向量进行说明，例如，语境全局向量序列表示为：

其中

及

为语境集合中第一个句子对应的向量，

及

为语境集合中第二个句子对应的向量，

及

为语境集合中第三个句子对应的向量，将

拆分为

和

本实施例中，可以利用如下关系式将所述语境全局向量序列拆分为所述语境集合中各个句子对应的向量：

其中，

表示语境集合中第m个句子对应的向量序列，n_c表示语境集合中句子的总数，Separate()表示拆分运算函数。

作为本申请另一可选实施例4，参照图4，为本申请提供的一种得到所述语境集合中各个句子的匹配向量序列的流程示意图，本实施例主要是对上述实施例2描述的所述基于所述语境集合的全局向量序列及各个所述语境对偶向量，得到所述语境集合中各个句子的匹配向量序列的细化方案，如图4所示，该过程可以包括但并不局限于以下步骤：

步骤S41、基于各个所述语境对偶向量，生成全局语境对偶向量序列；

步骤S41的详细过程可以参见实施例3中步骤S31的相关介绍，在此不再赘述。

步骤S42、将所述语境集合的全局向量序列与所述全局语境对偶向量序列之差作为第一向量序列差；

第一向量序列差可以表示为：

步骤S43、将所述语境集合的全局向量序列与所述全局语境对偶向量序列之乘作为第一向量序列乘；

第一向量序列乘可以表示为：

步骤S44、将所述语境集合的全局向量序列、所述全局语境对偶向量序列、所述第一向量序列差及所述第一向量序列乘拼接，得到语境全局向量序列；

将所述语境集合的全局向量序列、所述全局语境对偶向量序列、所述第一向量序列差及所述第一向量序列乘拼接，得到语境全局向量序列，可以理解为：

将所述语境集合的全局向量序列、所述全局语境对偶向量序列、所述第一向量序列差及所述第一向量序列乘组合为一个向量序列，作为语境全局向量序列。语境全局向量序列可以表示为：

本实施例中，将所述语境集合的全局向量序列、所述全局语境对偶向量序列、所述第一向量序列差及所述第一向量序列乘拼接，得到语境全局向量序列，可以保证语境全局向量序列可以更准确、更全面的表征语境集合中词向量与回复集合中词向量之间的关系。

步骤S45、将所述语境全局向量序列拆分为所述语境集合中各个句子对应的向量，作为所述语境集合中各个句子的匹配向量序列。

步骤S45的拆分过程可以参见实施例3中步骤S33的相关介绍，在此不再赘述。

作为本申请另一可选实施例5，参照图5，为本申请提供的一种得到所述回复集合中各个句子的匹配向量序列的流程示意图，本实施例主要是对上述实施例2描述的所述基于所述回复集合的全局向量序列及各个所述回复对偶向量，得到所述回复集合中各个句子的匹配向量序列的细化方案，如图5所示，该过程可以包括但并不局限于以下步骤：

步骤S51、基于各个所述回复对偶向量，生成全局回复对偶向量序列；

基于各个所述回复对偶向量，生成全局回复对偶向量序列，可以理解为：

将各个所述回复对偶向量组合为一个向量，作为全局回复对偶向量序列。

参见实施例2介绍的

全局回复对偶向量序列可以表示为：

步骤S52、将所述回复集合的全局向量序列及所述全局回复对偶向量序列拼接，得到回复全局向量序列；

将所述回复集合的全局向量序列及所述全局回复对偶向量序列拼接，得到回复全局向量序列，可以理解为：

将所述回复集合的全局向量序列及所述全局回复对偶向量序列组合为一个向量序列，作为回复全局向量序列。回复全局向量序列可以表示为：

步骤S53、将所述回复全局向量序列拆分为所述回复集合中各个句子对应的向量，作为所述回复集合中各个句子的匹配向量序列。

现举例对将所述回复全局向量序列拆分为所述回复集合中各个句子对应的向量进行说明，例如，回复全局向量序列表示为：

其中

及

为回复集合中第一个句子对应的向量，

及

为回复集合中第二个句子对应的向量，

及

为回复集合中第三个句子对应的向量，将

拆分为

和

作为本申请另一可选实施例6，参照图6，为本申请提供的一种得到所述回复集合中各个句子的匹配向量序列的流程示意图，本实施例主要是对上述实施例2描述的所述基于所述回复集合的全局向量序列及各个所述回复对偶向量，得到所述回复集合中各个句子的匹配向量序列的细化方案，如图6所示，该过程可以包括但并不局限于以下步骤：

步骤S61、基于各个所述回复对偶向量，生成全局回复对偶向量序列；

步骤S61的详细过程可以参见实施例5中步骤S51的相关介绍，在此不再赘述。

步骤S62、将所述回复集合的全局向量序列与所述全局回复对偶向量序列之差作为第二向量序列差；

第二向量序列差可以表示为：

步骤S63、将所述回复集合的全局向量序列与所述全局回复对偶向量序列之乘作为第二向量序列乘；

第二向量序列乘可以表示为：

步骤S64、将所述回复集合的全局向量序列、所述全局回复对偶向量序列、所述第二向量序列差及所述第二向量序列乘拼接，得到回复全局向量序列；

将所述回复集合的全局向量序列、所述全局回复对偶向量序列、所述第二向量序列差及所述第二向量序列乘拼接，得到回复全局向量序列，可以理解为：

将所述回复集合的全局向量序列、所述全局回复对偶向量序列、所述第二向量序列差及所述第二向量序列乘组合为一个向量序列，作为回复全局向量序列。回复全局向量序列可以表示为：

本实施例中，将所述回复集合的全局向量序列、所述全局回复对偶向量序列、所述第二向量序列差及所述第二向量序列乘拼接，得到回复全局向量序列，可以保证回复全局向量序列可以更准确、更全面的表征语境集合中词向量与回复集合中词向量之间的关系。

步骤S65、将所述回复全局向量序列拆分为所述回复集合中各个句子对应的向量，作为所述回复集合中各个句子的匹配向量序列。

步骤S65的拆分过程可以参见实施例5中步骤S53的相关介绍，在此不再赘述。

基于实施例4的内容，在本申请中另一可选实施例7中，介绍所述基于所述语境集合中各个句子的匹配向量序列，整合得到第一整合语句向量的细化方案，如图7所示，该过程可以包括但并不局限于以下步骤：

步骤S71、分别对所述语境集合中各个句子的匹配向量序列中各个词向量进行编码，编码结果组成的集合作为第一编码结果集合；

所述第一编码结果集合中至少包括有所述语境集合中句子的匹配向量中的各个词向量及其上下文信息。

优选的，可以采用BiLSTM编码方式分别对所述语境集合中各个句子的匹配向量序列中各个词向量进行编码。

本实施例中，可以利用如下关系式，分别对所述语境集合中各个句子的匹配向量序列中各个词向量进行编码：

表示语境集合中第m个句子对应的向量序列，

表示对

中第i个词向量进行编码，

表示编码结果。

可以理解的是，语境集合中每个句子各自对应一个第一编码结果集合。

步骤S72、分别对各个所述第一编码结果集合进行池化，池化的结果作为第一池化结果；

本实施例中，对第一编码结果集合进行池化的过程，可以包括：

对第一编码结果集合进行最大值池化；

或，对第一编码结果集合进行最后时刻状态池化；

或，对第一编码结果集合进行最大值池化，并对第一编码结果集合进行最后时刻状态池化，并将最大值池化的结果与最后时刻状态池化的结果拼接。

本实施例中，优选的，采用对第一编码结果集合进行最大值池化，并对第一编码结果集合进行最后时刻状态池化，并将最大值池化的结果与最后时刻状态池化的结果拼接的方式分别对各个所述第一编码结果集合进行池化。对某一个第一编码解雇集合进行池化的结果可以表示为：

其中，

表示对第一编码结果集合进行池化的结果，

表示对第一编码结果集合进行最大值池化的结果，

表示对第一编码结果集合进行最后时刻状态池化的结果。

本实施例中，对第一编码结果集合进行池化，实现用一个向量表征一个句子，减少后续运算量。

各个第一池化结果组成的集合可以表示为：

步骤S73、分别对各个所述第一池化结果进行编码，编码结果组成的集合作为第二编码结果集合；

所述第二编码结果集合至少包含有所述第一池化结果及其上下文信息。

优选的，可以采用BiLSTM编码方式分别对各个所述第一池化结果进行编码。

本实施例中，可以利用如下关系式，分别对各个所述第一池化结果进行编码：

表示对第m个第一池化结果进行编码的结果，BiLSTM(U^c,agr,m)表示对U^c,agr中第m个第一池化结果进行编码。

步骤S74、对所述第二编码结果进行池化，池化的结果作为第一整合语句向量。

本实施例中，对所述第二编码结果集合进行池化的过程，可以包括：

对所述第二编码结果集合进行最大值池化；

或，对所述第二编码结果集合进行最后时刻状态池化；

或，对所述第二编码结果集合进行最大值池化，并对所述第二编码结果集合进行最后时刻状态池化，并将最大值池化的结果与最后时刻状态池化的结果拼接。

本实施例中，优选的，采用对所述第二编码结果集合进行最大值池化，并对所述第二编码结果集合进行最后时刻状态池化，并将最大值池化的结果与最后时刻状态池化的结果拼接的方式分别对所述第二编码结果集合进行池化。对所述第二编码结果集合进行池化的结果可以表示为：

其中，c^agr表示对第二编码结果集合进行池化的结果，

表示对第二编码结果集合进行最大值池化的结果，

表示对第二编码结果集合进行最后时刻状态池化的结果。

本实施例中，对第二编码结果集合进行池化，实现用一个向量表征第二编码结果集合，可以减少后续运算量。

基于实施例6的内容，在本申请中另一可选实施例8中，介绍所述基于所述回复集合中各个句子的匹配向量序列，整合得到第二整合语句向量的细化方案，如图8所示，该过程可以包括但并不局限于以下步骤：

步骤S81、分别对所述回复集合中各个句子的匹配向量序列中各个词向量进行编码，编码结果组成的集合作为第三编码结果集合；

所述第三编码结果集合中至少包括有所述回复集合中句子的匹配向量中各个词向量及其上下文信息。

优选的，可以采用BiLSTM编码方式分别对所述回复集合中各个句子的匹配向量序列中各个词向量进行编码。

本实施例中，可以利用如下关系式，分别对所述回复集合中各个句子的匹配向量序列中各个词向量进行编码：

表示回复集合中第n个句子对应的向量序列，

表示对

中第j个词向量进行编码，

表示编码结果。

可以理解的是，回复集合中每个句子各自对应一个第三编码结果集合。

步骤S82、分别对各个所述第三编码结果集合进行池化，池化的结果作为第二池化结果；

本实施例中，对第三编码结果集合进行池化的过程，可以包括：

对第三编码结果集合进行最大值池化；

或，对第三编码结果集合进行最后时刻状态池化；

或，对第三编码结果集合进行最大值池化，并对第三编码结果集合进行最后时刻状态池化，并将最大值池化的结果与最后时刻状态池化的结果拼接。

本实施例中，优选的，采用对第三编码结果集合进行最大值池化，并对第三编码结果集合进行最后时刻状态池化，并将最大值池化的结果与最后时刻状态池化的结果拼接的方式分别对各个所述第三编码结果集合进行池化。对某一个第三编码解雇集合进行池化的结果可以表示为：

其中，

表示对第三编码结果集合进行池化的结果，

表示对第三编码结果集合进行最大值池化的结果，

表示对第三编码结果集合进行最后时刻状态池化的结果。

本实施例中，对第三编码结果集合进行池化，实现用一个向量表征一个句子，减少后续运算量。

各个第二池化结果组成的集合可以表示为：

步骤S83、分别对各个所述第二池化结果进行编码，编码结果组成的集合作为第四编码结果集合；

所述第四编码结果集合至少包含有所述第二池化结果及其上下文信息。

优选的，可以采用BiLSTM编码方式分别对各个所述第二池化结果进行编码。

本实施例中，可以利用如下关系式，分别对各个所述第二池化结果进行编码：

表示对第n个第二池化结果进行编码的结果，BiLSTM(U^r,agr,n)表示对U^r,agr中第n个第二池化结果进行编码。

步骤S84、对所述第四编码结果进行池化，池化的结果作为第二整合语句向量。

本实施例中，对所述第四编码结果进行池化的过程，可以包括：

对所述第四编码结果进行最大值池化；

或，对所述第四编码结果进行最后时刻状态池化；

或，对所述第四编码结果进行最大值池化，并对所述第四编码结果进行最后时刻状态池化，并将最大值池化的结果与最后时刻状态池化的结果拼接。

本实施例中，优选的，采用对所述第四编码结果集合进行最大值池化，并对所述第四编码结果集合进行最后时刻状态池化，并将最大值池化的结果与最后时刻状态池化的结果拼接的方式分别对所述第四编码结果集合进行池化。对所述第四编码结果集合进行池化的结果可以表示为：

其中，r^agr表示对第四编码结果集合进行池化的结果，

表示对第四编码结果集合进行最大值池化的结果，

表示对第四编码结果集合进行最后时刻状态池化的结果。

本实施例中，对第四编码结果集合进行池化，实现用一个向量表征全部第四编码结果集合，可以减少后续运算量。

基于实施例6的内容，在本申请中另一可选实施例9中，介绍所述基于所述回复集合中各个句子的匹配向量序列，整合得到第二整合语句向量的细化方案，如图9所示，该过程可以包括但并不局限于以下步骤：

步骤S91、分别对所述回复集合中各个句子的匹配向量序列中各个词向量进行编码，编码结果组成的集合作为第三编码结果集合；

步骤S92、分别对各个所述第三编码结果集合进行池化，池化的结果作为第二池化结果；

步骤S91-S92的详细过程可以参见实施例8中步骤S81-S82的相关介绍，在此不再赘述。

步骤S93、分别将各个所述第二池化结果及其对应的基于位置的语句权重相乘，并将相乘的结果之和作为所述第二整合语句向量。

本实施例中利用Attention整合方式得到第二整合语句向量，具体过程为：分别将各个所述第二池化结果及其对应的基于位置的语句权重相乘，并将相乘的结果之和作为所述第二整合语句向量。

本实施例中，可以利用如下关系式，分别将各个所述第二池化结果及其对应的基于位置的语句权重相乘，并将相乘的结果之和作为所述第二整合语句向量：

表示与第n个第二池化结果对应的基于位置的语句权重，

表示第n个第二池化结果，∑表示求和函数，r^agr表示第二整合语句向量。

基于前述各个实施例介绍的内容，目标语句匹配向量可以表示为：M＝[c^agr,r^agr]。

其中，M表示目标语句匹配向量，c^agr表示第一整合语句向量，r^agr表示第二整合语句向量。

接下来对本申请提供的语境集合与回复集合的匹配装置进行介绍，下文介绍的语境集合与回复集合的匹配装置与上文介绍的语境集合与回复集合的匹配方法可相互对应参照。

请参见图10，语境集合与回复集合的匹配装置包括：第一编码模块11、第二编码模块12、匹配模块13、整合模块14、拼接模块15和分类模块16。

第一编码模块11，用于对语境集合中各个句子中的各个语境单词分别进行编码，分别得到目标语境单词，所述目标语境单词至少包含有所述语境单词及所述语境单词的上下文信息；

第二编码模块12，用于对回复集合中各个句子中的各个回复单词分别进行编码，分别得到目标回复单词，所述目标回复单词至少包含有所述回复单词及所述回复单词的上下文信息；

匹配模块13，用于基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词，得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列；

整合模块14，用于基于所述语境集合中各个句子的匹配向量序列，整合得到第一整合语句向量，所述第一整合语句向量至少包含有表征所述语境集合中各个句子及其上下文信息的向量，及基于所述回复集合中各个句子的匹配向量序列，整合得到第二整合语句向量，所述第二整合语句向量至少包含有表征所述回复集合中各个句子及其上下文信息的向量；

拼接模块15，用于对所述第一整合语句向量和所述第二整合语句向量进行拼接，得到目标语句匹配向量；

分类模块16，用于将所述目标语句匹配向量输入分类器，得到所述分类器输出的匹配度，作为所述语境集合与所述回复集合的匹配度。

本实施例中，所述匹配模块13，可以包括：

第一生成子模块，用于基于多个所述目标语境单词，生成所述语境集合的全局向量序列，及基于多个所述目标回复单词，生成所述回复集合的全局向量序列；

第一计算子模块，用于基于所述语境集合的全局向量序列及所述回复集合的全局向量序列，计算所述语境集合的全局向量序列中的各个词向量与所述回复集合的全局向量序列中的各个词向量之间的距离，作为软对齐值；

第二计算子模块，用于利用所述软对齐值及所述回复集合的全局向量序列，分别计算表征所述语境集合的全局向量序列中各个词向量与所述回复集合中词向量之间关系的向量，作为语境对偶向量；

第三计算子模块，用于利用所述软对齐值及所述语境集合的全局向量序列，分别计算表征所述回复集合的全局向量序列中各个词向量与所述语境集合中词向量之间关系的向量，作为回复对偶向量；

第一确定子模块，用于基于所述语境集合的全局向量序列及各个所述语境对偶向量，得到所述语境集合中各个句子的匹配向量序列；

第二确定子模块，用于基于所述回复集合的全局向量序列及各个所述回复对偶向量，得到所述回复集合中各个句子的匹配向量序列。

本实施例中，所述第一确定子模块，具体可以用于：

基于各个所述语境对偶向量，生成全局语境对偶向量序列；

将所述语境集合的全局向量序列与所述全局语境对偶向量序列之差作为第一向量序列差；

将所述语境集合的全局向量序列与所述全局语境对偶向量序列之乘作为第一向量序列乘；

将所述语境集合的全局向量序列、所述全局语境对偶向量序列、所述第一向量序列差及所述第一向量序列乘拼接，得到语境全局向量序列；

将所述语境全局向量序列拆分为所述语境集合中各个句子对应的向量，作为所述语境集合中各个句子的匹配向量序列。

所述第二确定子模块，具体可以用于：

基于各个所述回复对偶向量，生成全局回复对偶向量序列；

将所述回复集合的全局向量序列与所述全局回复对偶向量序列之差作为第二向量序列差；

将所述回复集合的全局向量序列与所述全局回复对偶向量序列之乘作为第二向量序列乘；

将所述回复集合的全局向量序列、所述全局回复对偶向量序列、所述第二向量序列差及所述第二向量序列乘拼接，得到回复全局向量序列；

将所述回复全局向量序列拆分为所述回复集合中各个句子对应的向量，作为所述回复集合中各个句子的匹配向量序列。

本实施例中，所述整合模块14，具体可以用于：

分别对所述语境集合中各个句子的匹配向量序列中各个词向量进行编码，编码结果组成的集合作为第一编码结果集合，所述第一编码结果集合中至少包括有所述语境集合中句子的匹配向量中的各个词向量及其上下文信息；

分别对各个所述第一编码结果集合进行池化，池化的结果作为第一池化结果；

分别对各个所述第一池化结果进行编码，编码结果组成的集合作为第二编码结果集合，所述第二编码结果集合至少包含有所述第一池化结果及其上下文信息；

对所述第二编码结果集合进行池化，池化的结果作为第一整合语句向量。

本实施例中，所述整合模块14，具体可以用于：

分别对所述回复集合中各个句子的匹配向量序列中各个词向量进行编码，编码结果组成的集合作为第三编码结果集合，所述第三编码结果集合中至少包括有所述回复集合中句子的匹配向量中各个词向量及其上下文信息；

分别对各个所述第三编码结果集合进行池化，池化的结果作为第二池化结果；

分别对各个所述第二池化结果进行编码，编码结果组成的集合作为第四编码结果集合，所述第四编码结果集合至少包含有所述第二池化结果及其上下文信息；

对所述第四编码结果集合进行池化，池化的结果作为第二整合语句向量；

或，分别将各个所述第二池化结果及其对应的基于位置的语句权重相乘，并将相乘的结果之和作为所述第二整合语句向量。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

以上对本申请所提供的一种语境集合与回复集合的匹配方法及装置进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种语境集合与回复集合的匹配方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述语境集合中各个句子中的目标语境单词及所述回复集合中各个句子中的目标回复单词，得到所述语境集合中各个句子的匹配向量序列及所述回复集合中各个句子的匹配向量序列，包括：

基于多个所述目标语境单词，生成所述语境集合的全局向量序列，及基于多个所述目标回复单词，生成所述回复集合的全局向量序列；

基于所述语境集合的全局向量序列及所述回复集合的全局向量序列，计算所述语境集合的全局向量序列中的各个词向量与所述回复集合的全局向量序列中的各个词向量之间的距离，作为软对齐值；

利用所述软对齐值及所述回复集合的全局向量序列，分别计算表征所述语境集合的全局向量序列中各个词向量与所述回复集合的全局向量序列中词向量之间关系的向量，作为语境对偶向量；

利用所述软对齐值及所述语境集合的全局向量序列，分别计算表征所述回复集合的全局向量序列中各个词向量与所述语境集合的全局向量序列中词向量之间关系的向量，作为回复对偶向量；

基于所述语境集合的全局向量序列及各个所述语境对偶向量，得到所述语境集合中各个句子的匹配向量序列；

基于所述回复集合的全局向量序列及各个所述回复对偶向量，得到所述回复集合中各个句子的匹配向量序列。

3.根据权利要求2所述的方法，其特征在于，所述基于所述语境集合的全局向量序列及各个所述语境对偶向量，得到所述语境集合中各个句子的匹配向量序列，包括：

基于各个所述语境对偶向量，生成全局语境对偶向量序列；

将所述语境全局向量序列拆分为所述语境集合中各个句子对应的向量序列，作为所述语境集合中各个句子的匹配向量序列；

所述基于所述回复集合的全局向量序列及各个所述回复对偶向量，得到所述回复集合中各个句子的匹配向量序列，包括：

基于各个所述回复对偶向量，生成全局回复对偶向量序列；

将所述回复全局向量序列拆分为所述回复集合中各个句子对应的向量序列，作为所述回复集合中各个句子的匹配向量序列。

4.根据权利要求3所述的方法，其特征在于，所述基于所述语境集合中各个句子的匹配向量序列，整合得到第一整合语句向量，包括：

5.根据权利要求3所述的方法，其特征在于，所述基于所述回复集合中各个句子的匹配向量序列，整合得到第二整合语句向量，包括：

6.一种语境集合与回复集合的匹配装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述匹配模块，包括：

第二计算子模块，用于利用所述软对齐值及所述回复集合的全局向量序列，分别计算表征所述语境集合的全局向量序列中各个词向量与所述回复集合的全局向量序列中词向量之间关系的向量，作为语境对偶向量；

第三计算子模块，用于利用所述软对齐值及所述语境集合的全局向量序列，分别计算表征所述回复集合的全局向量序列中各个词向量与所述语境集合的全局向量序列中词向量之间关系的向量，作为回复对偶向量；

8.根据权利要求7所述的装置，其特征在于，所述第一确定子模块，具体用于：

基于各个所述语境对偶向量，生成全局语境对偶向量序列；

将所述语境全局向量序列拆分为所述语境集合中各个句子对应的向量，作为所述语境集合中各个句子的匹配向量序列；

所述第二确定子模块，具体用于：

基于各个所述回复对偶向量，生成全局回复对偶向量序列；

9.根据权利要求8所述的装置，其特征在于，所述整合模块，具体用于：

10.根据权利要求8所述的装置，其特征在于，所述整合模块，具体用于：