CN112487173A

CN112487173A - 人机对话方法、设备和存储介质

Info

Publication number: CN112487173A
Application number: CN202011507159.4A
Authority: CN
Inventors: 雷泽阳; 徐俊; 牛正雨; 吴华; 王海峰
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-12-18
Filing date: 2020-12-18
Publication date: 2021-03-12
Anticipated expiration: 2040-12-18
Also published as: CN112487173B

Abstract

本申请公开了人机对话方法、设备和存储介质，涉及深度学习、自然语言处理等人工智能技术领域。具体实现方案为：在进行人机对话的过程中，结合基于当前输入语句的对话类型，从预先构建的图谱所得到的多个知识片段，并根据上文对话信息与多个知识片段之间的多个语义相关度，从多个知识片段中选择出目标知识片段从知识片段中确定出生成当前输入语句所需要的目标知识片段，并基于该目标知识片段以及当前输入语句对应的上文对话信息，准确生成了该当前输入语句的回复语句，提升了人机交互对话的体验。

Description

人机对话方法、设备和存储介质

技术领域

本申请涉及计算机技术领域，具体涉及深度学习、自然语言处理等人工智能技术领域，尤其涉及人机对话方法、设备和存储介质。

背景技术

人机对话系统是指人与机器通过自然语言进行信息交互的系统，目前市场上基于人机对话系统所提供的产品有很多，有的以个人助理形态出现(siri，度秘等)，有的以聊天机器人出现，还有的则内置在智能音箱、智能车载设备、智能电视等终端内。

相关技术中，在进行人机对话的过程中，通常会涉及到多轮对话，这多轮对话中可能涉及到不同类型的对话。在一段对话的过程中，如何结合不同类型的对话进行准确回复，对于人机对话来说是一个非常有挑战性的问题。

发明内容

本申请提供了一种用于人机对话方法、设备和存储介质。根据本申请的一方面，提供了一种人机对话方法，包括：获取当前输入语句以及对应的上文对话信息，并确定所述当前输入语句对应的对话类型；根据所述对话类型，从预先构建的图谱中，确定出所述当前输入语句所对应的第一目标节点以及与所述第一目标节点对应的多个第一邻居节点；获取所述多个第一邻居节点所对应的多个第一知识片段；根据所述上文对话信息与所述多个第一知识片段之间的多个语义相关度，从所述多个第一知识片段中选择出目标知识片段；根据所述目标知识片段以及所述上文对话信息，生成所述当前输入语句对应的回复语句。

根据本申请的另一方面，提供了一种人机对话装置，包括：第一获取模块，用于获取当前输入语句以及对应的上文对话信息，并确定所述当前输入语句对应的对话类型；确定模块，用于根据所述对话类型，从预先构建的图谱中，确定出所述当前输入语句所对应的第一目标节点以及与所述第一目标节点对应的多个第一邻居节点；第二获取模块，用于获取所述多个第一邻居节点所对应的多个第一知识片段；选择模块，用于根据所述上文对话信息与所述多个第一知识片段之间的多个语义相关度，从所述多个第一知识片段中选择出目标知识片段；生成模块，用于根据所述目标知识片段以及所述上文对话信息，生成所述当前输入语句对应的回复语句。

根据本申请的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请的人机对话方法。

根据本申请的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本申请实施例公开的人机对话方法。

根据本申请的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现本申请的人机对话方法。

上述申请中的一个实施例具有如下优点或有益效果：

在进行人机对话的过程中，获取当前输入语句以及对应的上文对话信息，并结合当前输入语句对应的对话类型，从预先构建的图谱中，确定出当前输入语句所对应的第一目标节点以及与第一目标节点对应的多个第一邻居节点，并获取多个第一邻居节点所对应的多个第一知识片段，以及根据上文对话信息与多个第一知识片段之间的多个语义相关度，从多个第一知识片段中选择出目标知识片段；根据目标知识片段以及上文对话信息，生成当前输入语句对应的回复语句。由此，在进行人机对话的过程中，结合基于当前输入语句的对话类型，从预先构建的图谱所得到的知识片段，并从知识片段中确定出生成当前输入语句所需要的目标知识片段，并基于该目标知识片段以及上文对话信息，准确生成了该当前输入语句的回复语句，提升了人机交互对话的体验。

应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请一个实施例提供的一种人机对话方法的流程示意图；

图2是步骤104的细化流程示意图；

图3是训练语义表示模型和先验网络的训练过程的流程示意图；

图4是语义表示模型、先验网络和后验网络之间的结构示意图；

图5是步骤105的细化流程示意图；

图6是训练对话生成模型的流程示意图；

图7是基于PLATO-2训练第一对话生成模型的示例图。

图8是基于PLATO-2训练第二对话生成模型的示例图。

图9根据本申请一个实施例提供的一种人机对话装置的结构示意图；

图10根据本申请另一个实施例提供的一种人机对话装置的结构示意图；

图11是用来实现本申请实施例的人机对话方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

下面参考附图描述本申请实施例的人机对话方法、设备和存储介质。

图1是根据本申请第一实施例提供的一种人机对话方法的流程示意图。

如图1所示，该人机对话方法可以包括：

步骤101，获取当前输入语句以及对应的上文对话信息，并确定当前输入语句对应的对话类型。

其中，上述人机对话方法的执行主体为人机对话装置，该人机对话装置可以由软件和/或硬件的方式实现，该实施例中的人机对话装置可以配置电子设备中，该电子设备可以包括但不限于终端设备、服务器等。

作为一种示例性的实施方式，在进行人机对话的过程中，可获取用户向终端设备输入的当前会话语句，并将当前会话语句作为当前输入语句，并当前输入语句之前的预设N轮对话，并将所获取到的N轮对话作为当前会话的上文对话信息。其中，N是预先设置的，例如，N可以为7、6、或者8等，在实际应用中，可基于实际业务需求设置N的取值，该实施例对此不作具体限定。

其中，上述对话类型可以包括但不限于闲聊、问答、知识对话等，例如，上述对话类型还可以包括任务型对话，该实施例对此不作具体限定。

可以理解的是，在不同应用场景中，确定当前输入语句对应的对话类型可通过多种方式实现，举例说明如下：

作为一种示例性的实施方式，可将当前输入语句输入到预先训练的会话分析模型，以通过会话分析模型确定出当前输入语句对应的对话类型。

作为另一种示例性的实施方式，可通过对当前输入语句进行对话类型分析，以得到当前输入语句的分析结果，以及根据分析结果，确定当前输入语句对应的对话类型。

其中，需要说明的是，上述仅是对确定当前输入语句对应的对话类型的实现方式进行示例，在实际应用中，还可以通过本领域已知的其他方法来确定当前输入语句对应的对话类型，只要能确定出对话类型即可，该实施例对此不作具体限定。

步骤102，根据对话类型，从预先构建的图谱中，确定出当前输入语句所对应的第一目标节点以及与第一目标节点对应的多个第一邻居节点。

在本申请的实施例中，上述根据对话类型，从预先构建的图谱中，确定出当前输入语句所对应的第一目标节点以及与第一目标节点对应的多个第一邻居节点可通过多种方式实现，示例性说明如下：

作为一种可能的实现方式，可根据对话类型，从预先构建的图谱中，获取与该对话类型对应的子图谱，并从子图谱中，确定出该当前输入语句对应的第一目标节点，并获取与第一目标节点对应的多个第一邻居节点。其中，可以理解的是，该目标节点与邻居节点之间是具有连接边的。

例如，当前输入语句为“你知道世界上最大的国家是哪个吗”，假设确定该当前输入语句的对话类型为问答，可对当前输入语句以及问答对应的子图像，确定出该当前输入语句对应的目标节点为“最大国家”，然后，获取与该目标节点所连接的多个邻居节点，邻居节点可以包括国家1、国家2、国家3等。

在本实施例中，为了可以准确确定出目标节点以及邻居节点，可预先对上述图谱进行构建，构建上述图谱的一种可能实现方式为：作为一种示例，上述图谱包含了对话子图谱，问答子图谱，以及知识子图谱等。对于对话子图谱，主要是通过抽取闲聊对话语料中连续上下句的语义短语，然后根据上下句之间的话题来连接边，从而构成对话子图谱。而对于问答子图谱，可将问题挂载到问题句中所包含的语义短语上，然后将对应的回答作为其子节点，问答句之间连接边。对于知识子图谱，以实体entity作为挂载节点，将关于实体的多条知识都作为一个entity的子节点，从属关系构成了边，从而构建了知识子图谱。

作为另一种可能的实现方式，从预先构建的图谱中，确定出当前输入语句所对应的第一目标节点，然后，基于第一目标节点和对话类型，获取与第一目标节点对应的多个第一邻居节点，其中，第一邻居节点与该对话类型对应。

步骤103，获取多个第一邻居节点所对应的多个第一知识片段。

在本申请的一个实施例中，可通过预存的节点与知识之间的对应关系，获取第一邻居节点对应的知识，从而通过该对应关系，获取多个第一邻居各自所对应的知识片段。

其中，上述知识片段可以包括但不限于关键词短语、知识语句等，该实施例对此不作具体限定。

步骤104，根据上文对话信息与多个第一知识片段之间的多个语义相关度，从多个第一知识片段中选择出目标知识片段。

作为一种可能的实现方式，可将上文对话信息与多个第一知识片段输入到知识选择模型中，以通过该知识选择模型，从多个第一知识片段中选择出目标知识片段。

其中，本实施例中的知识选择模型从多个第一知识片段中选择出目标知识片段的具体过程可以为：对上文对话信息以及多个第一知识片段进行语义表示，以得到上文对话信息的语义表示向量以及多个第一知识片段对应的语义表示向量；针对每个第一知识片段，基于上文对话信息的语义表示向量和第一知识片段的语义表示向量，确定上文对话信息和第一知识片段的语义相关度；根据多个语义相关度，从多个第一知识片段中，选择出相关度最高的知识片段作为目标知识片段。

步骤105，根据目标知识片段以及上文对话信息，生成当前输入语句对应的回复语句。

本申请实施例的人机对话方法，在进行人机对话的过程中，获取当前输入语句以及对应的上文对话信息，并结合当前输入语句对应的对话类型，从预先构建的图谱中，确定出当前输入语句所对应的第一目标节点以及与第一目标节点对应的多个第一邻居节点，并获取多个第一邻居节点所对应的多个第一知识片段，以及根据上文对话信息与多个第一知识片段之间的多个语义相关度，从多个第一知识片段中选择出目标知识片段；根据目标知识片段以及上文对话信息，生成当前输入语句对应的回复语句。由此，在进行人机对话的过程中，结合基于当前输入语句的对话类型，从预先构建的图谱所得到的知识片段，并从知识片段中确定出生成当前输入语句所需要的目标知识片段，并基于该目标知识片段以及上文对话信息，准确生成了该当前输入语句的回复语句，提升了人机交互对话的体验。

基于上述实施例的基础上，在本申请的一个实施例中，为了从多个第一知识片段中准确选择出目标知识片段，如图2所示，上述步骤104的一种可能实现方式为：

步骤201，将上文对话信息输入到预先训练好的语义表示模型中，以得到上文对话信息的语义表示向量。

其中，本实施例中的语义表示模型可以为任意类型的语义表示模型。作为一种示例，为了可以准确表示出输内容的语义表示向量，上述语义表示模型可以为知识增强语义表示模型(Enhanced Representation from kNowledgeIntEgration，ERNIE)。

步骤202，将多个第一知识片段分别输入到语义表示模型中，以得到多个第一知识片段分别对应的多个语义表示向量。

步骤203，根据上文对话信息的语义表示向量以及多个第一知识片段分别对应的多个语义表示向量，生成上文对话信息与多个第一知识片段之间的多个语义相关度。

在本申请的一个实施例中，为了准确确定出上文对话信息与每个第一知识片段之间的语义相关度，上述步骤203的一种可能实现方式为：针对每个第一知识片段，将上文对话信息的语义表示向量以及第一知识片段的语义表示向量输入到预先训练好的先验网络中，以得到上文对话信息与第一知识片段的语义相关度。

步骤204，根据多个语义相关度，从多个第一知识片段中选择出目标知识片段。

在本申请的一个实施例中，在获取多个语义相关度后，可从多个第一知识片段中选择出语义相关度最大的一个知识片段作为目标知识片段。

在本申请的另一个实施例中，在获取多个语义相关度后，可按照语义相关度从高到低的顺序，对多个第一知识片段进行排序，以得到排序结果，并从排序结果中获取排序在第一位的知识片段作为目标知识片段。

在本实施例中，通过同一个语义表示模型对知识片段以及上文对话信息进行语义表示，并结合知识片段和上文对话信息的语义表示向量，来确定知识片段与上文对话信息之间的语义相关度，并结合语义相关度，从多个第一知识片段中选择出目标知识片段。由此，从多个第一知识片段中准确确定出目标知识片段。

基于上述实施例的基础上，为了准确从多个知识片段中准确出目标知识片段，在本申请的一个实施例中，可对语义表示模型和先验网络进行联合训练，其中，训练语义表示模型和先验网络的训练过程，如图3所示，可以包括：

步骤301，获取训练数据，其中，训练数据包括样本语句、样本语句对应的样本回复、多个样本知识片段以及上文对话样本。

在本申请的一个实施例中，为了提高本实施例的人对对话的准确性，上述多个样本知识片段的一种可能实现方式为：根据样本语句对应的对话类型，从图谱中获取样本语句所对应的第二目标节点以及与第二目标节点对应的多个第二邻居节点；获取多个第二邻居节点所对应的多个第二知识片段，并将所获取的多个第二知识片段作为多个样本知识片段。

在本实施例中，结合样本语句对应的对话类型，从预先构建的图谱中获取样本语句对应的多个样本知识片段，并通过从图谱中获取的样本知识片段进行训练，从而可提高后续该人机交互方法的确定回复的准确性。

步骤302，通过初始的语义表示模型分别得到样本语句、样本回复以及多个样本知识片段各自对应的语义表示向量。

步骤303，将多个第二知识片段各自对应的语义表示向量以及样本语句对应的语义表示向量输入到初始的先验网络中，以得到在样本语句的条件下每个第二知识片段的概率。

步骤304，将多个第二知识片段各自对应的语义表示向量以及样本回复对应的语义表示向量输入到初始的后验网络中，以得到在样本回复的条件下每个第二知识片段的概率。

步骤305，根据在样本语句的条件下每个第二知识片段的概率以及在样本回复的条件下每个第二知识片段的概率，对语义表示模型、先验网络以及后验网络进行训练。

在本实施例中，结合训练数据对语义表示模型以及先验网络进行训练，从而使得训练后的先验网络，可结合语义表示模型的输出，准确确定出上文对话信息与对应第一知识片段之间的语义相关度。

为了使得本领域技术人员可以清楚了解训练语义表示模型以及先验网络的过程，下面结合图4对训练过程进行进一步示例性阐述。其中，图4中以语义表示模型为ENIER模型为例进行示例。

如图4所示，可将样本语句对应的多个样本知识片段knowledge(k1,k2,…,kn)、样本回复response(简称为r)以及上文对话样本context(简称为c)分别输入到ENIER模型，以分别得到多个样本知识片段、样本回复以及上文对话样本各自对应的语义表示向量。然后，将上文对话样本和样本知识片段的表示(k1,k2,…,kn)输入到先验网络(Prior Network)得到先验分布P＝(p(k1|c),p(k2|c),…,p(kn|c))；同时样本回复c和多个知识片段的表示(k1,k2,…,kn)输入到后验网络(Posterior Network)中Q＝(q(k1|r),q(k2|r),…,q(kn|r))。最后，计算先验分布P与后验分布Q的KL散度(Kullback-Leibler divergence，简称KLD)作为KLD损失，同时分别计算先验分布与后验分布对应的交叉熵损失(cross-entropyloss，CE loss)。最后将这两类损失进行加权和作为总的损失函数，并结合该总的损失函数进行训练，直至总的损失函数满足结束条件。

作为一种示例，上述先验网络(Prior Network)和后验网络(Posterior Network)分别采用全连接层的前馈网络(Feed-Forward Network，FFN)

在本实施例中，在训练语义表示模型以及先验网络的过程中，在增强基于上下文来进行知识选择能力的同时，也考虑到了样本回复对知识选择的作用，从而使得后期训练出的先验网络可准确确定目标知识片段。

基于上述实施例的基础上，为了保证生成的对话上下文连贯，同时提升生成回复中的知识准确性，上述步骤105的一种可能实现方式为，如图5所示，可以包括：

步骤501，获取与对话类型对应的对话生成模型。

步骤502，将目标知识片段以及上文对话信息输入到对话生成模型中，以得到包括目标知识片段的回复语句。

本实施例中，将目标知识片段以及上文对话信息输入到与对话类型对应的对话生成模型，以得到包含目标知识片段的回复语句，从而使得所生成的回复语句中包括目标知识片段，保证了生成的回复语句上下文连贯。

在本申请的一个实施例中，为了使得对话生成模型可以准确生成回复语句，可通过下述方式对对话生成模型进行训练，其中，训练对话生成模型的过程，如图6所示，可以包括：

步骤601，获取与对话类型对应的训练数据，其中，训练数据包括样本语句以及样本语句对应的上文对话样本、样本知识、样本回复。

步骤602，将上文对话样本以及样本知识输入到初始的对话生成模型中，以得到样本语句对应的预测回复。

步骤603，根据预测回复以及样本回复，对对话生成模型进行训练。

在本申请的一个实施例中，可基于预测回复以及样本回复之间的差异性信息，对上述对话生成模型进行训练，直至训练后的对话生成模型可准确输出对应输入语句的回复语句。

在本申请的一个实施例中，在根据对话类型，确定目标知识片段是短语形式，还句子形式，在确定目标知识片段为短语形式的情况下，可采用与短语形式的第一对话生成模型，结合目标知识片段以及上文对话信息来生成当前输入语句的回复语句。在确定目标知识片段为句子形式的情况下，可采用与句子形式对应的第二对话生成模型，结合目标知识片段以及上文对话信息来生成当前输入语句的回复语句。

为了使得本领域技术人员可以清楚了解本申请，下面结合图7对训练与短语形式对应的第一对话生成模型进行示例性描述。

具体而言，为了保证在生成的回复中包含关键词。获取预先构建的训练语料，并使用预训练的开放域对话模型PLATO-2(Pre-trained Dialogue Generation Model)来训练第一对话生成模型。

在训练阶段，可从样本回复response＝(w1,w2,…,wn)随机选择一个词wi，然后组成训练样本<上文对话样本,wi，样本回复>，其中<上文对话样本,wi>作为PLATO-2的输入，样本回复作为真实回复来训练PLATO-2模型，以得到第一对话生成模型。

在推理阶段，将对话上下文和被选择的关键词知识作为输入，使用被训练好的第一对话生成模型来生成包含关键词的回复。

为了使得本领域技术人员可以清楚了解本申请，下面结合图8对训练与句子形式对应的第二对话生成模型进行示例性描述。

如图8所示，在训练阶段，构造训练样本<上文对话样本,样本知识语句,样本回复>,可以理解的是，这里知识语句表示被标注的样本回复所利用的知识句。然后使用被在开放域对话数据集预训练的PLATO-2模型来进行微调，以得到训练好的第二对话生成模型。

在推理阶段,将对话上下文和被选择的知识句作为输入第二对话生成模型，使用被预训练好的第二对话生成模型来生成包含知识句的回复。

为了实现上述实施例，本申请实施例还提供一种人机对话装置。

图9是根据本申请一个实施例提供的一种人机对话装置的结构示意图。

如图9所示，该人机对话装置900可以包括第一获取模块901、确定模块902、第二获取模块903、选择模块904和生成模块905，其中：

第一获取模块901，用于获取当前输入语句以及对应的上文对话信息，并确定当前输入语句对应的对话类型。

确定模块902，用于根据对话类型，从预先构建的图谱中，确定出当前输入语句所对应的第一目标节点以及与第一目标节点对应的多个第一邻居节点。

第二获取模块903，用于获取多个第一邻居节点所对应的多个第一知识片段。

选择模块904，用于根据上文对话信息与多个第一知识片段之间的多个语义相关度，从多个第一知识片段中选择出目标知识片段。

生成模块905，用于根据目标知识片段以及上文对话信息，生成当前输入语句对应的回复语句。

其中，需要说明的是，前述对人机对话方法实施例的解释说明也适用于本实施例，本实施对此不再赘述。

本申请实施例的人机对话装置，在进行人机对话的过程中，获取当前输入语句以及对应的上文对话信息，并结合当前输入语句对应的对话类型，从预先构建的图谱中，确定出当前输入语句所对应的第一目标节点以及与第一目标节点对应的多个第一邻居节点，并获取多个第一邻居节点所对应的多个第一知识片段，以及根据上文对话信息与多个第一知识片段之间的多个语义相关度，从多个第一知识片段中选择出目标知识片段；根据目标知识片段以及上文对话信息，生成当前输入语句对应的回复语句。由此，在进行人机对话的过程中，结合基于当前输入语句的对话类型，从预先构建的图谱所得到的知识片段，并从知识片段中确定出生成当前输入语句所需要的目标知识片段，并基于该目标知识片段以及上文对话信息，准确生成了该当前输入语句的回复语句，提升了人机交互对话的体验。

在本申请的一个实施例中，如图10所示，该人机对话装置可以包括：第一获取模块1001、确定模块1002、第二获取模块1003、选择模块1004、生成模块1005、第一训练模块1006和第二训练模块1007，选择模块1004可以包括第一语义表示单元10041、第二语义表示单元10042、第一生成单元10043和选择单元10044，生成模块1005可以包括获取单元10051和第二生成单元10052，其中：

其中，关于第一获取模块1001、确定模块1002、第二获取模块1003、的详细描述请参考图9所示实施例中第一获取模块901、确定模块902、第二获取模块903的说明，此处不再进行描述。

在本申请的一个实施例中，第一语义表示单元10041，用于将上文对话信息输入到预先训练好的语义表示模型中，以得到上文对话信息的语义表示向量。

第二语义表示单元10042，用于将多个第一知识片段分别输入到语义表示模型中，以得到多个第一知识片段分别对应的多个语义表示向量。

第一生成单元10043，用于根据上文对话信息的语义表示向量以及多个第一知识片段分别对应的多个语义表示向量，生成上文对话信息与多个第一知识片段之间的多个语义相关度。

选择单元10044，用于根据多个语义相关度，从多个第一知识片段中选择出目标知识片段。

在本申请的一个实施例中，上述第一生成单元10043，具体用于：

针对每个第一知识片段，将上文对话信息的语义表示向量以及第一知识片段的语义表示向量输入到预先训练好的先验网络中，以得到上文对话信息与第一知识片段的语义相关度。

在本申请的一个实施例中，上述第一训练模块1006，具体用于：获取训练数据，其中，训练数据包括样本语句、样本语句对应的样本回复、多个样本知识片段以及上文对话样本；通过初始的语义表示模型分别得到样本语句、样本回复以及多个样本知识片段各自对应的语义表示向量；将多个第二知识片段各自对应的语义表示向量以及样本语句对应的语义表示向量输入到初始的先验网络中，以得到在样本语句的条件下每个第二知识片段的概率；将多个第二知识片段各自对应的语义表示向量以及样本回复对应的语义表示向量输入到初始的后验网络中，以得到在样本回复的条件下每个第二知识片段的概率；根据在样本语句的条件下每个第二知识片段的概率以及在样本回复的条件下每个第二知识片段的概率，对语义表示模型、先验网络以及后验网络进行训练。

在本申请的一个实施例中，多个样本知识片段是通过下述步骤得到的：根据样本语句对应的对话类型，从图谱中获取样本语句所对应的第二目标节点以及与第二目标节点对应的多个第二邻居节点；获取多个第二邻居节点所对应的多个第二知识片段，并将所获取的多个第二知识片段作为多个样本知识片段。

在本申请的一个实施例中，获取单元10051，用于获取与对话类型对应的对话生成模型。

第二生成单元10052，用于将目标知识片段以及上文对话信息输入到对话生成模型中，以得到包括目标知识片段的回复语句。

在本申请的一个实施例中，上述第二训练模块1007，具体用于：获取与对话类型对应的训练数据，其中，训练数据包括样本语句以及样本语句对应的上文对话样本、样本知识、样本回复；将上文对话样本以及样本知识输入到初始的对话生成模型中，以得到样本语句对应的预测回复；根据预测回复以及样本回复，对对话生成模型进行训练。

其中，需要说明的是，前述对人机对话方法实施例的解释说明也适用于本实施例中的人机对话装置，此处不再赘述。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质和一种计算机程序产品。

图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图11所示，设备1100包括计算单元1101，其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序，来执行各种适当的动作和处理。在RAM 1103中，还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。

设备1100中的多个部件连接至I/O接口1105，包括：输入单元1106，例如键盘、鼠标等；输出单元1107，例如各种类型的显示器、扬声器等；存储单元1108，例如磁盘、光盘等；以及通信单元1109，例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理，例如人机对话方法。例如，在一些实施例中，人机对话方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1108。在一些实施例中，计算机程序的部分或者全部可以经由ROM1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时，可以执行上文描述的人机对话方法的一个或多个步骤。备选地，在其他实施例中，计算单元1101可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行人机对话方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务("Virtual Private Server"，或简称"VPS")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

其中，需要说明的是，人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种人机对话方法，包括：

获取当前输入语句以及对应的上文对话信息，并确定所述当前输入语句对应的对话类型；

根据所述对话类型，从预先构建的图谱中，确定出所述当前输入语句所对应的第一目标节点以及与所述第一目标节点对应的多个第一邻居节点；

获取所述多个第一邻居节点所对应的多个第一知识片段；

根据所述上文对话信息与所述多个第一知识片段之间的多个语义相关度，从所述多个第一知识片段中选择出目标知识片段；

根据所述目标知识片段以及所述上文对话信息，生成所述当前输入语句对应的回复语句。

2.根据权利要求1所述的方法，其中，所述根据所述上文对话信息与所述多个第一知识片段之间的多个语义相关度，从所述多个第一知识片段中选择出目标知识片段，包括：

将所述上文对话信息输入到预先训练好的语义表示模型中，以得到所述上文对话信息的语义表示向量；

将所述多个第一知识片段分别输入到所述语义表示模型中，以得到所述多个第一知识片段分别对应的多个语义表示向量；

根据所述上文对话信息的语义表示向量以及所述多个第一知识片段分别对应的多个语义表示向量，生成所述上文对话信息与所述多个第一知识片段之间的多个语义相关度；

根据所述多个语义相关度，从所述多个第一知识片段中选择出目标知识片段。

3.根据权利要求2所述的方法，所述根据所述上文对话信息的语义表示向量以及所述多个第一知识片段分别对应的多个语义表示向量，生成所述上文对话信息与所述多个第一知识片段之间的多个语义相关度，包括：

针对每个第一知识片段，将所述上文对话信息的语义表示向量以及所述第一知识片段的语义表示向量输入到预先训练好的先验网络中，以得到所述上文对话信息与所述第一知识片段的语义相关度。

4.根据权利要求3所述的方法，其中，所述语义表示模型和所述先验网络是通过下述步骤训练得到的：

获取训练数据，其中，所述训练数据包括样本语句、所述样本语句对应的样本回复、多个样本知识片段以及上文对话样本；

通过初始的语义表示模型分别得到所述样本语句、样本回复以及所述多个样本知识片段各自对应的语义表示向量；

将所述多个第二知识片段各自对应的语义表示向量以及所述样本语句对应的语义表示向量输入到初始的先验网络中，以得到在所述样本语句的条件下每个所述第二知识片段的概率；

将所述多个第二知识片段各自对应的语义表示向量以及所述样本回复对应的语义表示向量输入到初始的后验网络中，以得到在所述样本回复的条件下每个所述第二知识片段的概率；

根据在所述样本语句的条件下每个所述第二知识片段的概率以及在所述样本回复的条件下每个所述第二知识片段的概率，对所述语义表示模型、所述先验网络以及所述后验网络进行训练。

5.根据权利要求4所述的方法，其中，所述多个样本知识片段是通过下述步骤得到的：

根据所述样本语句对应的对话类型，从所述图谱中获取所述样本语句所对应的第二目标节点以及与所述第二目标节点对应的多个第二邻居节点；

获取所述多个第二邻居节点所对应的多个第二知识片段，并将所获取的多个第二知识片段作为所述多个样本知识片段。

6.根据权利要求1所述的方法，其中，所述根据所述目标知识片段以及所述上文对话信息，生成所述当前输入语句对应的回复语句，包括：

获取与所述对话类型对应的对话生成模型；

将所述目标知识片段以及所述上文对话信息输入到所述对话生成模型中，以得到包括所述目标知识片段的回复语句。

7.根据权利要求6所述的方法，其中，所述对话生成模型通过以下步骤训练得到：

获取与所述对话类型对应的训练数据，其中，所述训练数据包括样本语句以及所述样本语句对应的上文对话样本、样本知识、样本回复；

将所述上文对话样本以及所述样本知识输入到初始的对话生成模型中，以得到所述样本语句对应的预测回复；

根据所述预测回复以及所述样本回复，对所述对话生成模型进行训练。

8.一种人机对话装置，包括：

第一获取模块，用于获取当前输入语句以及对应的上文对话信息，并确定所述当前输入语句对应的对话类型；

确定模块，用于根据所述对话类型，从预先构建的图谱中，确定出所述当前输入语句所对应的第一目标节点以及与所述第一目标节点对应的多个第一邻居节点；

第二获取模块，用于获取所述多个第一邻居节点所对应的多个第一知识片段；

选择模块，用于根据所述上文对话信息与所述多个第一知识片段之间的多个语义相关度，从所述多个第一知识片段中选择出目标知识片段；

生成模块，用于根据所述目标知识片段以及所述上文对话信息，生成所述当前输入语句对应的回复语句。

9.根据权利要求8所述的装置，其中，所述选择模块，包括：

第一语义表示单元，用于将所述上文对话信息输入到预先训练好的语义表示模型中，以得到所述上文对话信息的语义表示向量；

第二语义表示单元，用于将所述多个第一知识片段分别输入到所述语义表示模型中，以得到所述多个第一知识片段分别对应的多个语义表示向量；

第一生成单元，用于根据所述上文对话信息的语义表示向量以及所述多个第一知识片段分别对应的多个语义表示向量，生成所述上文对话信息与所述多个第一知识片段之间的多个语义相关度；

选择单元，用于根据所述多个语义相关度，从所述多个第一知识片段中选择出目标知识片段。

10.根据权利要求9所述的装置，所述第一生成单元，具体用于：

11.根据权利要求10所述的装置，其中，所述装置还包括第一训练模块，所述第一训练模块，具体用于：

12.根据权利要求11所述的装置，其中，所述多个样本知识片段是通过下述步骤得到的：

13.根据权利要求8所述的装置，其中，所述生成模块，包括：

获取单元，用于获取与所述对话类型对应的对话生成模型；

第二生成单元，用于将所述目标知识片段以及所述上文对话信息输入到所述对话生成模型中，以得到包括所述目标知识片段的回复语句。

14.根据权利要求13所述的装置，其中，所述装置还包括第二训练模块，所述第二训练模块，具体用于：

15.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。

17.一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。