CN109597881A

CN109597881A - 匹配度确定方法、装置、设备和介质

Info

Publication number: CN109597881A
Application number: CN201811542089.9A
Authority: CN
Inventors: 鲍思琪; 何煌; 王凡; 吴华; 何径舟
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-12-17
Filing date: 2018-12-17
Publication date: 2019-04-09
Anticipated expiration: 2038-12-17
Also published as: CN109597881B

Abstract

本发明实施例公开了一种匹配度确定方法、装置、设备和介质，涉及智能对话领域。该方法包括：基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量；基于所述关联向量，确定目标候选回复与历史对话的匹配度。本发明实施例提供了一种匹配度确定方法、装置、设备和介质，实现了基于历史对话与候选回复间丰富的关联信息，确定目标候选回复与历史对话的匹配度。

Description

匹配度确定方法、装置、设备和介质

技术领域

本发明实施例涉及智能对话领域，尤其涉及一种匹配度确定方法、装置、设备和介质。

背景技术

最近几年，智能对话系统开始进入人们的视线，智能对话产品开始更多的给人们的生活带来便利和影响。针对用户所说的话，这些对话系统会智能的产生回复。

一般对话系统都会先产生若干候选回复，后续再计算历史对话的向量表示与候选回复的向量表示之间的欧式距离，根据欧式距离从候选回复中确定最终回复。

但是，上述从向量到数值的转换导致了大量信息湮灭，不利于后续历史对话和候选回复的匹配度估计。

发明内容

本发明实施例提供一种匹配度确定方法、装置、设备和介质，以实现基于历史对话与候选回复间丰富的关联信息，确定目标候选回复与历史对话的匹配度。

第一方面，本发明实施例提供了一种匹配度确定方法，包括：

基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量；

基于所述关联向量，确定目标候选回复与历史对话的匹配度。

第二方面，本发明实施例还提供了一种匹配度确定装置，包括：

关联向量确定模块，用于基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量；

匹配度确定模块，用于基于所述关联向量，确定目标候选回复与历史对话的匹配度。

第三方面，本发明实施例还提供了一种设备，所述设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明实施例中任一所述的匹配度确定方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例中任一所述的匹配度确定方法。

本发明实施例通过基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量。而向量相比数值包括有更多信息，从而实现基于历史对话与候选回复间丰富的关联信息，确定目标候选回复与历史对话的匹配度。进而提高依据匹配度确定最终回复的准确率。

附图说明

图1为本发明实施例一提供的一种匹配度确定方法的流程图；

图2是本发明实施例二提供的一种匹配度确定方法的流程图；

图3是本发明实施例三提供的一种匹配度确定方法的流程图；

图4是本发明实施例四提供的一种深度关联网络的整体结构示意图；

图5是本发明实施例五提供的一种匹配度确定装置的结构示意图；

图6为本发明实施例六提供的一种设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

发明人在实现本发明的过程中发现：两个文本之间的匹配分析，是自然语言处理的一个核心问题，经典的方式是用神经网络把两个文本映射到低维空间，用低维的向量表示文本；然后计算两个向量之间的距离作为它们的相关性。每个文本映射到低维空间提取特征，这个阶段都是独立进行的，也就是说，在低维特征提取阶段，文本之间是没有相互影响的。由于缺乏对文本之间相关性的考虑，提取得到的特征不够有区分性，估计文本匹配度时的准确率也就比较有限。

匹配矩阵中的每个元素表征着两个文本中词语之间的相关性，后续的卷积层可以进一步提取出词语之间的匹配模式。

以上提到的技术，两个向量之间(无论是文本低维表示，还是词向量)相关性或者匹配度的衡量，都是通过距离函数(比如余弦相似度、点积等)来衡量。然而，这种估计方法把向量转化成了数值，导致了急剧的信息损失。从信息论的角度看，在神经网络较低层时采用这种高强度的信息压缩，限制了后续网络高层的特征提取能力，不利于网络整体的性能。

因此，发明人提出了一种新的方法，对上文和候选回复进行深度关联性估计：两个词语之间的丰富关联性由一个向量(而不再是一个数值)来衡量。

实施例一

图1为本发明实施例一提供的一种匹配度确定方法的流程图。本实施例可适用于确定目标候选回复与历史对话之间匹配度的情况，以基于匹配度从候选回复中确定最终回复。该方法可以由一种匹配度确定装置来执行，该装置可以由软件和/或硬件的方式实现。参见图1，本实施例提供的匹配度确定方法包括：

S110、基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量。

其中，目标候选回复是待打分的候选回复。

具体地，将目标候选回复中的每个词进行词向量转化，由各词的词向量构成目标候选回复的向量表示。

类似地，可以确定历史对话的向量表示。

关联向量用于描述目标候选回复中一个词的词向量与一条历史对话中一个词的词向量间的关联信息。

具体地，所述基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量，包括：

将目标候选回复的向量表示和各历史对话的向量表示进行拼接；

对拼接后的向量表示进行非线性化，生成非线性向量表示；

基于非线性向量表示，确定描述历史对话和目标候选回复之间关联信息的关联向量。

典型地，所述基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量，包括：

依据如下公式，确定描述各历史对话和目标候选回复之间关联信息的关联向量：

其中，[·；·]表示的是历史对话中词u_i的向量表示和目标候选回复中词r_j的向量表示的拼接，W^C是可训练的关联性估计参数，C_ij是包含有词u_i和词r_j的关联信息的关联向量。

S120、基于所述关联向量，确定目标候选回复与历史对话的匹配度。

通常所述关联向量是高维向量，因此需要对关联向量进行整合，基于整合结果确定目标候选回复与历史对话的匹配度。

具体地，所述基于所述关联向量，确定目标候选回复与历史对话的匹配度，包括：

按照设定方向对由所述关联向量构成的深度关联矩阵进行整合；

基于整合结果确定目标候选回复与历史对话的匹配度。

本发明实施例通过基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量。而向量相比数值包括有更多信息，从而实现基于历史对话与候选回复间丰富的关联信息，确定目标候选回复与历史对话的匹配度。进而提高依据匹配度了对候选回复打分的准确率。

为进一步提高向量间的关联性，所述按照设定方向对由所述关联向量构成的深度关联矩阵进行整合，包括：

基于门控循环单元(gated recurrent unit，简称GRU)，按照设定方向对所述关联向量构成的深度关联矩阵进行整合。

其中，门控循环单元可以进行一步挖掘向量间的关联信息。

此外，因为门控循环单元支持不定长文本，从而门控循环单元的应用还使得上述匹配度确定方法中避免了文本不定长引进的误差。

为在整合过程中提取历史对话和目标候选回复的有意义的特征，所述按照设定方向对由所述关联向量构成的深度关联矩阵进行整合，包括：

沿历史对话的方向和/或目标候选回复的方向，对由所述关联向量构成的深度关联矩阵进行整合。

其中，历史对话的方向是指目标候选回复中每个词分别与一条历史对话中各词关联的方向。

目标候选回复的方向是指一条历史对话中每个词分别与目标候选回复中各词关联的方向。

实施例二

图2是本发明实施例二提供的一种匹配度确定方法的流程图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图2，本实施例提供的匹配度确定方法包括：

S210、基于句子中各成分间的依存关系，分别对目标候选回复的向量表示和至少一条历史对话的向量表示进行更新，生成回复关系向量和至少一条对话关系向量。

具体地，可以基于门控循环单元实现句子中各成分间依存关系的提取。

将目标候选回复的向量表示输入门控循环单元，输出回复关系向量；将历史对话的向量表示输入门控循环单元，输出对话关系向量。

S220、基于生成的回复关系向量和至少一条对话关系向量，确定描述各历史对话和目标候选回复之间关联信息的关联向量。

S230、基于所述关联向量，确定目标候选回复与历史对话的匹配度。

本发明实施例的技术方案，通过基于句子中各成分间的依存关系，分别对目标候选回复的向量表示和至少一条历史对话的向量表示进行更新，生成回复关系向量和至少一条对话关系向量；然后基于生成的回复关系向量和至少一条对话关系向量，确定描述各历史对话和目标候选回复之间关联信息的关联向量。从而使得关联向量包括历史对话和目标候选回复之间的更多关联信息。进而提高依据匹配度确定最终回复的准确率。

实施例三

图3是本发明实施例三提供的一种匹配度确定方法的流程图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图3，本实施例提供的匹配度确定方法包括：

S310、基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量。

S320、沿历史对话的方向对深度关联矩阵进行整合,并对整合结果沿目标候选回复的方向进行整合，生成回复整合向量。

其中，深度关联矩阵由至少一个关联向量构成。

具体地，将描述一条历史对话中各词的词向量与目标候选回复中一个词的词向量间的关联信息的多个关联向量，整合为一个数值。整合后一条历史对话中的多个词的整合数值构成了一个整合矩阵，沿目标候选回复的方向对整合矩阵进行再次整合，生成一维的回复整合向量。

S330、沿目标候选回复的方向对深度关联矩阵进行整合,并对整合结果沿历史对话的方向进行整合，生成对话整合向量。

具体地，将描述目标候选回复中各词的词向量与一条历史对话中一个词的词向量间的关联信息的多个关联向量，整合为一个数值。整合后目标候选回复中的多个词的整合数值构成了一个整合矩阵，沿目标候选回复的方向对整合矩阵进行再次整合，生成一维的对话整合向量。

S340、对由各深度关联矩阵整合得到的各回复整合向量进行整合，生成最终回复向量；对由各深度关联矩阵整合得到的各对话整合向量进行整合，生成最终对话向量。

S350、根据最终对话向量和/或最终回复向量，确定目标候选回复与历史对话的匹配度。

具体地，所述根据最终对话向量和/或最终回复向量，确定目标候选回复与历史对话的匹配度，包括：

依据如下公式，确定目标候选回复与历史对话的匹配度：

Q(U,r)＝S_U ^T·S_r

其中，S_U为最终对话向量，S_r为最终回复向量，U是历史对话，r是目标候选回复，Q(U，r)是目标候选回复与历史对话的匹配度。上述运算表示S_U和S_r的内积。

本实施例并不对上述方法的执行步骤进行任何限定，可选地，S330可以先于S320执行。

本发明实施例的技术方案，通过沿历史对话的方向以及沿目标候选回复的方向对深度关联矩阵进行整合。从而实现对目标候选回复和历史对话中关联信息的进一步挖掘。

实施例四

图4是本发明实施例四提供的一种深度关联网络的整体结构示意图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图4，本实施例提供的匹配度确定方法，包括：

获取至少一条历史对话和一个目标候选回复。

其中，至少一条历史对话表示为U＝{u¹,u²,…,u^N}，u^N表示历史对话中的第N句话，历史对话中的每一句话(表示为u)也是由一系列的词组成，即u＝{u₁，u₂，…，u_m}，其中u_m表示历史对话中一句话的第m个词。

目标候选回复表示为r，目标候选回复中也是由一系列的词组成，表示为r＝{r₁，r₂,…,r_n}。r_n表示目标候选回复中一句话的第n个词。

将上述历史对话和目标候选回复中的词语，经过词向量表示(Embedding)层后，可以映射到词向量上，生成历史对话的向量表示和目标候选回复的向量表示。

对生成的各历史对话向量表示和目标候选回复的向量表示进行门控循环单元操作，进一步提取词间的相邻关系，得到每个词语更加高阶的向量表示，其中代表历史对话中的每个词的向量表示，代表目标候选回复中的每个词的向量表示。这样，历史对话中每句话的向量表示为目标候选回复的向量表示为

依据如下公式确定描述各历史对话和目标候选回复之间关联信息的关联向量：

其中，词语u_i是历史对话中的词语，r_j是目标候选回复中的词语，[·；·]表示的是词语u_i和词语r_j的低维特征向量和的拼接，W^C是可训练的关联性估计参数，也可以理解为激活函数，C_ij是包含有词语u_i和词语r_j的丰富关联性信息关联向量。

基于上述公式，确定每条历史对话中每个词语和目标候选回复中的每个词语的关联向量。并按照设定排列顺序，对关联向量进行排列，生成高维深度关联矩阵(参见图4中的黄色立方体)。

参见图4中的黄色立方体，其中针对每条历史对话中每个词语和目标候选回复中一个词语的关联向量按照u的方向排列。

其中针对目标候选回复中每个词语和每条历史对话中一个词语的关联向量按照r的方向排列。

其中，u的方向和r的方向可以根据实际需要设定，本实施例对此并不进行任何限制。

例如，一条历史对话为：明天天气怎么样？目标候选回复是：好吧。将明天和好的关联向量排在深度关联矩阵的左上角；将天气和好的关联向量，邻着明天和好的关联向量，沿着u的方向顺序排列；将怎么样和好的关联向量，邻着天气和好的关联向量，沿着u的方向顺序排列；将明天和吧的关联向量，邻着明天和好的关联向量，沿着r的方向顺序排列，依次排列生成深度关联矩阵。

为了从深度关联矩阵中提取有效特征，在深度关联矩阵上沿着历史对话方向(即u方向)，进行门控循环单元操作(图4中显示的1st stage)，输出整合矩阵。

其中，通过门控循环单元内部重置门和更新门，目标候选回复中的每一个词语在每条历史对话中的关联性就被收集到门控循环单元最终的输出结果里。

对输出的整合矩阵沿着目标候选回复方向(即r方向)，再次进行门循环单元操作(图4中显示的2nd stage)，进一步从目标候选回复中整合关联性信息，生成回复整合向量。

类似的，这两阶段的整合操作也应用到了上文句子上，只是操作的方向顺序不同，具体为：

在深度关联矩阵上先沿着目标候选回复方向(即r方向)，进行门循环单元操作，输出整合向量；

对输出的回复整合向量再沿着历史对话方向(即u方向)，进行门循环单元操作，输出对话整合向量。

上述这两个阶段的整合过程，有着明确的物理意义，通过沿着不同方向整合，可以得到历史对话和目标候选回复的有意义特征。

对于多轮对话系统，通常历史对话中包括了多句话，针对历史对话中的每一句话和目标候选回复都进行了关联性估计和整合计算，得到多个对话整合向量和多个回复整合向量。基于门控循环单元，对多个对话整合向量进行整合，生成最终对话向量；基于门控循环单元，对多个回复整合向量进行整合，生成最终回复向量。

依据如下公式，根据最终对话向量和最终回复向量确定目标候选回复与历史对话的匹配度：

Q(U,r)＝S_U ^T·S_r

其中，S_U为最终对话向量，S_r为最终回复向量，U是历史对话，r是目标候选回复，Q(U，r)是目标候选回复与历史对话的匹配度。

本发明实施例描述的深度关联网络，不受句子长度的限制，通过在不同的句子上共享参数，它可以应用在任意长度的对话上。

在对本实施例提供的深度关联网络进行效果评估如下：

在公开的英文数据集Ubuntu上进行了实验。该数据集共有1百万个多轮对话，50万用于训练，50万用于测试。真正的回复是作为正样本的候选回复，随机召回的回复是作为负样本的候选回复。在训练时，正负样本比例为1:1，测试时正负样本比例为1:9。使用召回率Recall n@k(有n个候选，正样本排在前k的比例)作为评估指标，与现有的方案进行对比，实验结果如表1所示：

表1

从表1中可以看出，深度关联网络在各个指标上，都能取得最优的结果，验证了本实施例方法在用于对话系统回复选择的有效性。

本发明实施例的有益效果在于：深度关联网络使用了向量形式对上文和候选回复的关联性进行估计，相比于数值，向量形式保留了丰富的关联信息，有利于网络的后续匹配估计。深度关联网络基于门控循环单元对深度关联矩阵的信息进行整合，由于门控循环单元可以很好的支持不定长文本，深度关联网络的整合阶段可以避免文本不定长引进的误差。

需要说明的是，经过本实施例的技术教导，本领域技术人员有动机将上述实施例中描述的任一种实施方式进行方案的组合，以实现对目标候选回复与历史对话匹配度的确定。

实施例五

图5是本发明实施例五提供的一种匹配度确定装置的结构示意图。参见图5，本实施例提供的匹配度确定装置包括：关联向量确定模块10和匹配度确定模块20。

其中，关联向量确定模块10，用于基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量；

匹配度确定模块20，用于基于所述关联向量，确定目标候选回复与历史对话的匹配度。

本发明实施例的技术方案，通过基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量。而向量相比数值包括有更多信息，从而实现基于历史对话与候选回复间丰富的关联信息，确定目标候选回复与历史对话的匹配度。进而提高依据匹配度确定最终回复的准确率。

进一步的，所述关联向量确定模块，包括：拼接单元、非线性化单元和关联向量确定单元。

其中，拼接单元，用于将目标候选回复的向量表示和各历史对话的向量表示进行拼接；

非线性化单元，用于对拼接后的向量表示进行非线性化，生成非线性向量表示；

关联向量确定单元，用于基于非线性向量表示，确定描述历史对话和目标候选回复之间关联信息的关联向量。

进一步地，所述关联向量确定模块，包括：关联向量确定单元。

其中，关联向量确定单元，用于依据如下公式，确定描述各历史对话和目标候选回复之间关联信息的关联向量：

其中，[·；·]表示的是历史对话中词语u_i的向量表示和目标候选回复中词语r_j的向量表示的拼接，W^C是可训练的关联性估计参数，C_ij是包含有词语u_i和词语r_j的关联信息的关联向量。

进一步地，所述关联向量确定模块，包括：向量更新单元和关联向量确定单元。

其中，向量更新单元，用于基于句子中各成分间的依存关系，分别对目标候选回复的向量表示和至少一条历史对话的向量表示进行更新，生成回复关系向量和至少一条对话关系向量；

关联向量确定单元，用于基于生成的回复关系向量和至少一条对话关系向量，确定描述各历史对话和目标候选回复之间关联信息的关联向量。

进一步地，所述匹配度确定模块，包括：整合单元和匹配度确定单元。

其中，整合单元，用于按照设定方向对由所述关联向量构成的深度关联矩阵进行整合；

匹配度确定单元，用于基于整合结果确定目标候选回复与历史对话的匹配度。

进一步地，所述整合单元，包括：门循环子单元。

其中，门循环子单元，用于基于门控循环单元，按照设定方向对由所述关联向量构成的深度关联矩阵进行整合。

进一步地，所述整合单元，包括：整合子单元。

其中，整合子单元，用于沿历史对话的方向和/或目标候选回复的方向，对由所述关联向量构成的深度关联矩阵进行整合。

进一步地，所述整合子单元，具体用于：

沿历史对话的方向对深度关联矩阵进行整合,并对整合结果沿目标候选回复的方向进行整合，生成回复整合向量；和/或，

沿目标候选回复的方向对深度关联矩阵进行整合,并对整合结果沿历史对话的方向进行整合，生成对话整合向量。

进一步地，所述匹配度确定单元，包括：最终回复确定子单元、最终对话确定子单元和匹配度确定子单元。

其中，最终回复确定子单元，用于对由各深度关联矩阵整合得到的各回复整合向量进行整合，生成最终回复向量；和/或，

最终对话确定子单元，用于对由各深度关联矩阵整合得到的各对话整合向量进行整合，生成最终对话向量；

匹配度确定子单元，用于根据最终对话向量和/或最终回复向量，确定目标候选回复与历史对话的匹配度。

进一步地，所述匹配度确定子单元，具体用于：

依据如下公式，确定目标候选回复与历史对话匹配度：

Q(U,r)＝S_U ^T·S_r

本发明实施例所提供的匹配度确定装置可执行本发明任意实施例所提供的匹配度确定方法，具备执行方法相应的功能模块和有益效果。

实施例六

图6为本发明实施例六提供的一种设备的结构示意图。图6示出了适于用来实现本发明实施方式的示例性设备12的框图。图6显示的设备12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示，通常称为“硬盘驱动器”)。尽管图6中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该设备12交互的设备通信，和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与设备12的其它模块通信。应当明白，尽管图中未示出，可以结合设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的匹配度确定方法。

实施例七

本发明实施例七还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例中任一所述的匹配度确定方法，该方法包括：

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种匹配度确定方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量，包括：

对拼接后的向量表示进行非线性化，生成非线性向量表示；

3.根据权利要求1所述的方法，其特征在于，所述基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于目标候选回复的向量表示和至少一条历史对话的向量表示，确定描述各历史对话和目标候选回复之间关联信息的关联向量，包括：

基于句子中各成分间的依存关系，分别对目标候选回复的向量表示和至少一条历史对话的向量表示进行更新，生成回复关系向量和至少一条对话关系向量；

基于生成的回复关系向量和至少一条对话关系向量，确定描述各历史对话和目标候选回复之间关联信息的关联向量。

5.根据权利要求1所述的方法，其特征在于，所述基于所述关联向量，确定目标候选回复与历史对话的匹配度，包括：

基于整合结果确定目标候选回复与历史对话的匹配度。

6.根据权利要求5所述的方法，其特征在于，所述按照设定方向对由所述关联向量构成的深度关联矩阵进行整合，包括：

基于门控循环单元，按照设定方向对由所述关联向量构成的深度关联矩阵进行整合。

7.根据权利要求5所述的方法，其特征在于，所述按照设定方向对由所述关联向量构成的深度关联矩阵进行整合，包括：

8.根据权利要求7所述的方法，其特征在于，所述沿历史对话的方向和目标候选回复的方向对由所述关联向量构成的深度关联矩阵进行整合，包括：

9.根据权利要求8所述的方法，其特征在于，所述基于整合结果目标候选回复与历史对话的匹配度，包括：

对由各深度关联矩阵整合得到的各回复整合向量进行整合，生成最终回复向量；和/或，

对由各深度关联矩阵整合得到的各对话整合向量进行整合，生成最终对话向量；

根据最终对话向量和/或最终回复向量，确定目标候选回复与历史对话的匹配度。

10.根据权利要求9所述的方法，其特征在于，所述根据最终对话向量和最终回复向量，确定目标候选回复与历史对话的匹配度，包括：

依据如下公式，确定目标候选回复与历史对话的匹配度：

Q(U，r)＝S_U ^T·S_r

11.一种匹配度确定装置，其特征在于，包括：

12.根据权利要求11所述的装置，其特征在于，所述关联向量确定模块，包括：

拼接单元，用于将目标候选回复的向量表示和各历史对话的向量表示进行拼接；

13.根据权利要求11所述的装置，其特征在于，所述关联向量确定模块，包括：

关联向量确定单元，用于依据如下公式，确定描述各历史对话和目标候选回复之间关联信息的关联向量：

14.根据权利要求11所述的装置，其特征在于，所述关联向量确定模块，包括：

向量更新单元，用于基于句子中各成分间的依存关系，分别对目标候选回复的向量表示和至少一条历史对话的向量表示进行更新，生成回复关系向量和至少一条对话关系向量；

15.根据权利要求11所述的装置，其特征在于，所述匹配度确定模块，包括：

整合单元，用于按照设定方向对由所述关联向量构成的深度关联矩阵进行整合；

16.根据权利要求15所述的装置，其特征在于，所述整合单元，包括：

门循环子单元，用于基于门控循环单元，按照设定方向对由所述关联向量构成的深度关联矩阵进行整合。

17.根据权利要求15所述的装置，其特征在于，所述整合单元，包括：

整合子单元，用于沿历史对话的方向和/或目标候选回复的方向，对由所述关联向量构成的深度关联矩阵进行整合。

18.根据权利要求17所述的装置，其特征在于，所述整合子单元，具体用于：

19.根据权利要求18所述的装置，其特征在于，所述匹配度确定单元，包括：

最终回复确定子单元，用于对由各深度关联矩阵整合得到的各回复整合向量进行整合，生成最终回复向量；和/或，

20.根据权利要求19所述的装置，其特征在于，所述匹配度确定子单元，具体用于：

依据如下公式，确定目标候选回复与历史对话匹配度：

Q(U,r)＝S_U ^T·S_r

21.一种设备，其特征在于，所述设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-10中任一所述的匹配度确定方法。

22.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-10中任一所述的匹配度确定方法。