CN111259162B

CN111259162B - 对话交互方法、装置、设备和存储介质

Info

Publication number: CN111259162B
Application number: CN202010017420.6A
Authority: CN
Inventors: 贺文嵩; 苗亚飞; 汤其超; 徐犇; 谢剑
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd; Shanghai Xiaodu Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Shanghai Xiaodu Technology Co Ltd
Priority date: 2020-01-08
Filing date: 2020-01-08
Publication date: 2023-10-03
Anticipated expiration: 2040-01-08
Also published as: JP2021119451A; CN111259162A; US11556719B2; US20210209312A1

Abstract

本申请实施例公开了一种对话交互方法、装置、设备和存储介质，涉及人工智能技术领域。具体实现方案为：根据句子树，确定接收到的用户信息的第一语义编码；根据所述第一语义编码，从对话树中确定用于响应所述用户信息的第二语义编码；其中，所述句子树和所述对话树通过逻辑脑图样本中句子节点信息和/或词语节点信息训练得到；从所述句子树中确定所述第二语义编码的目标响应句子，用于与用户对话。本申请实施例基于逻辑脑图将对话逻辑快速学习到句子树和对话树中，通过句子树和对话树之间的交替匹配，使得响应内容考虑了上文对话内容，且包容了对话内容的多种表示，保障了对话内容的多样性，提高人机之间多轮对话的准确性。

Description

对话交互方法、装置、设备和存储介质

技术领域

本申请实施例涉及计算机技术领域，尤其涉及人工智能技术领域，具体涉及一种对话交互方法、装置、设备和存储介质。

背景技术

随着智能音箱设备等智能设备的普及，用户与智能设备之间的对话需求日益增长，除了资源点播、家居控制等需求外，大部分用户还有与智能设备进行情感交流、日常对话、话题聊天等人机交互行为。然而，现有技术通常仅能够实现单轮对话效果，缺乏对话上下文的逻辑性，多轮对话的准确率较低，且训练语料成本较高。

发明内容

本申请实施例提供了一种对话交互方法、装置、设备和存储介质，能够提高人机之间多轮对话的准确性。

第一方面，本申请实施例提供了一种对话交互方法，包括：

根据句子树，确定接收到的用户信息的第一语义编码；

根据所述第一语义编码，从对话树中确定用于响应所述用户信息的第二语义编码；其中，所述句子树和所述对话树通过逻辑脑图样本中句子节点信息和/或词语节点信息训练得到；

从所述句子树中确定所述第二语义编码的目标响应句子，用于与用户对话。

上述申请中的一个实施例具有如下优点或有益效果：基于逻辑脑图将对话逻辑快速学习到句子树和对话树中，通过句子树和对话树之间的交替匹配，使得响应内容考虑了上文对话内容，且包容了对话内容的多种表示，保障了对话内容的多样性，提高人机之间多轮对话的准确性。

可选的，所述句子树用于表示词语与句子之间的组合关系，所述对话树用于表示对话中句子之间的响应关系。

上述申请中的一个实施例具有如下优点或有益效果：通过具有组合关系的句子树，以及具有响应关系的对话树，使得响应内容考虑了上文对话内容，且包容了对话内容的多种表示，保障了对话内容的多种可能性。

可选的，所述句子树和所述对话树通过如下方式确定，包括：

根据所述逻辑脑图样本，学习得到句子树和对话树中的节点；

在所述句子树和所述对话树中，确定节点之间的转换概率。

上述申请中的一个实施例具有如下优点或有益效果：根据逻辑脑图样本确定的节点信息和节点之间的转换概率，公同构成了句子树和对话树，使得树中的节点之间具有对话逻辑，包容了对话内容的多种表示，保障了对话内容的多种可能性。

可选的，根据所述逻辑脑图样本，学习得到句子树中的节点，包括：

对所述逻辑脑图样本进行词语节点深度搜索，得到完整对话路径；

根据所述完整对话路径中的词语节点，构成对话词典；

对所述对话词典词语所组成的句子进行句子语义压缩，生成句子树中的句子节点，以及根据所述对话词典得到所述句子节点中的词语节点组合；

根据所述句子节点中词语节点组合的语义，为所述句子节点添加标识句子语义的语义编码。

上述申请中的一个实施例具有如下优点或有益效果：基于逻辑脑图样本构建的对话词典中的词语，构成了句子树中的词语节点，词语节点组合所表达的语义构成了句子节点，基于词语节点的不同组合方式，句子节点可能含有不同的句子语义，从而每一种句子语义都配置有对应的语义编码，有利于对不同表示的用户信息的识别，以及对同一语义的多种表示，确保了对话的多样性。

可选的，根据所述逻辑脑图样本，学习得到对话树中的节点，包括：

对所述逻辑脑图样本中的句子节点进行语义压缩，生成对话树中的句子节点；

基于逻辑脑图中句子节点之间连接关系所表示的对话逻辑，确定对话树中句子节点之间的响应关系；

根据所述句子节点以及句子节点之间的响应关系，得到对话树，并根据所述句子节点的语义为所述句子节点添加标识句子语义的语义编码。

上述申请中的一个实施例具有如下优点或有益效果：基于逻辑脑图样本压缩后的句子语义，构成了对话树中的句子节点，并为每个句子节点添加语义编码，基于逻辑脑图中的对话逻辑，确定对话树中的句子节点之间的响应关系，语义的相应关系有利于确定对话中话语之间的对话逻辑，且不局限于句子中词语的表示。

可选的，所述根据句子树，确定接收到的用户信息的第一语义编码，包括：

根据所述用户信息的词语信息，从所述句子树的词语节点向句子节点遍历，确定构成所述用户信息的目标词语节点组合；

根据所述目标词语节点组合，从所述目标词语节点组合所属句子节点中，确定用于表示所述用户信息的第一语义编码。

上述申请中的一个实施例具有如下优点或有益效果：通过将用户信息中的词语信息与句子树中的句子节点进行匹配，确定符合词语信息的目标词语节点组合，从而确定目标词语节点组合所属句子节点的第一语义编码，实现了对用户信息的语义识别。

可选的，所述根据所述第一语义编码，从对话树中确定用于响应所述用户信息的第二语义编码，包括：

从所述对话树中定位得到与所述第一语义编码一致的目标用户句子节点；

根据与所述目标用户句子节点具有响应关系的候选句子节点的转换概率，从所述候选句子节点中抽取得到响应句子节点；

确定所述响应句子节点的第二语义编码。

上述申请中的一个实施例具有如下优点或有益效果：基于第一语义编码在对话树中进行句子节点定位，从而根据句子节点之间的响应关系，确定响应用户信息的第二语义编码，实现了在对话逻辑的基础上确定响应语义，避免了词语表示对于对话的局限性以及对话上文的忽略，保障了对话的多样性和准确性。

可选的，所述从所述句子树中确定所述第二语义编码的目标响应句子，包括：

从所述句子树中，查找与所述第二语义编码一致的目标响应句子节点；

根据与所述目标响应句子节点具有组合关系的候选词语节点的转换概率，从所述候选词语节点中抽取得到目标响应词语节点；

将所述目标响应词语节点进行组合，得到所述目标响应句子。

上述申请中的一个实施例具有如下优点或有益效果：根据作为响应语义的第二语义编码从句子树中确定目标响应句子节点，并根据第二语义编码确定表达该第二语义的词语组合，最终形成目标响应句子用于对话。在语义表达正确的情况下，保障了对话的多样性。

第二方面，本申请实施例提供了一种对话交互装置，包括：

用户语义识别模块，用于根据句子树，确定接收到的用户信息的第一语义编码；

响应语义确定模块，用于根据所述第一语义编码，从对话树中确定用于响应所述用户信息的第二语义编码；其中，所述句子树和所述对话树通过逻辑脑图样本中句子节点信息和/或词语节点信息训练得到；

响应句子确定模块，用于从所述句子树中确定所述第二语义编码的目标响应句子，用于与用户对话。

第三方面，本申请实施例提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请任意实施例所述的对话交互方法。

第四方面，本申请实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本申请任意实施例所述的对话交互方法。

上述申请中的一个实施例具有如下优点或有益效果：通过逻辑脑图样本中句子节点信息和/或词语节点信息，预先训练学习得到句子树和对话树，在接收到用户对话的用户信息时，根据句子树确定用户信息的第一语义编码，根据第一语义编码，从对话树中确定响应用户信息的第二语义编码，最终根据第二语义编码，从句子树中确定目标响应句子，以与用户进行对话。本申请实施例基于逻辑脑图将对话逻辑快速学习到句子树和对话树中，通过句子树和对话树之间的交替匹配，使得响应内容考虑了上文对话内容，且包容了对话内容的多种表示，保障了对话内容的多样性，提高人机之间多轮对话的准确性。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请第一实施例的一种对话交互方法的流程图；

图2是根据本申请第二实施例的句子树和对话树的训练流程图；

图3是根据本申请第二实施例的句子树中节点的训练流程图；

图4是根据本申请第二实施例的逻辑脑图样本的示例图；

图5是根据本申请第二实施例的对话树中节点的训练流程图；

图6是根据本申请第三实施例的一种对话交互方法的流程图；

图7是根据本申请第四实施例的一种对话交互装置的结构示意图；

图8是用来实现本申请实施例的对话交互方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

第一实施例

图1是根据本申请第一实施例的一种对话交互方法的流程图，本实施例可适用于人机之间多轮对话中确定响应语句的情况，该方法可由一种对话交互装置来执行，该装置采用软件和/或硬件的方式实现，优选是配置于电子设备中，例如智能音箱等。如图1所示，该方法具体包括如下：

S110、根据句子树，确定接收到的用户信息的第一语义编码。

在本申请具体实施例中，用户信息是指用户向电子设备输入的对话语音，可以是在用户唤醒电子设备之后，由用户主动向电子设备发起对话的初始语音，也可以是在对话过程中用户输入的任意对话语音，还可以是由电子设备主动发起对话时用户所输入的对话语音。用户信息可以不局限于同一对话场景中，可以在不同的对话场景之间进行转换，由电子设备配合用户实现对话。

本实施例中，第一语义编码是指表达用户信息语义的编码。鉴于词语或句子都具有至少一种语义，因此本实施采用语义编码的形式来唯一标识一种语义，以便通过根本的语义来呈现对话逻辑，避免将对话局限于外在形式上词语的表示。

本实施例中，电子设备中用于对话交互的数据结构至少可以包括句子树和对话树。其中，句子树用于表示词语与句子之间的组合关系，对话树用于表示对话中句子之间的响应关系，句子树和对话树均是通过逻辑脑图样本中句子节点信息和/或词语节点信息训练得到。

具体的，逻辑脑图是指将对话中所涉及的词语和/或句子，通过相互隶属与相关的节点层级关系表现出来。逻辑脑图中可以包括词语与句子之间的组合关系以及对话树用于表示对话中句子之间的响应关系。本实施例可以预先对不同场景构建逻辑脑图，用于表示不同场景下的对话逻辑。将不同场景下的逻辑脑图作为大量基础样本，挖掘大量句子以及句子的词语表示。保留逻辑脑图样本中的词语，但对逻辑脑图样本中的句子进行语义压缩，基于语义为句子节点和词语节点添加语义编码，即每一种语义都配置有唯一对应的语义编码，相应的富含多种语义的节点则配置有多个语义编码，用于唯一标识一种语义。最终确定节点之间的转换概率，形成句子树和对话树保存在电子设备中，供电子设备在与用户对话时使用。其中，句子树和对话树的训练过程将在后续实施例中进行解释说明。

本实施例在接收到用户信息之后，基于句子树中词语与句子语义之间的组合关系，将外在形式上的用户信息转化为根本的语义。从而首先从接收到的用户信息上，实现不局限于外在的表示形式。具体的，可以根据句子树中词语与句子之间的组合关系，确定用户信息的外在形式所表达的语义，实现对用户信息进行语义理解，得到表达用户信息的语义的第一语义编码。

示例性的，电子设备可以是智能音箱、服务机器人等具有对话功能的智能设备。电子设备通过传感器等装置接收到用户输入的语音形式的用户信息之后，可以将语音形式的用户信息转化为文本形式，对于文本形式的用户信息进行词语拆分。按照用户信息中词语的排列顺序，基于句子树中词语节点之间的连接关系，从句子树的词语节点向句子节点遍历，确定构成用户信息的目标词语节点组合。从而从目标词语节点组合所属句子节点中，确定用于表示用户信息的第一语义编码。

S120、根据第一语义编码，从对话树中确定用于响应用户信息的第二语义编码。

在本申请具体实施例中，第一语义编码是指表达用户信息语义的编码，相应的，第二语义编码是指表达用于响应用户信息的语义编码。其中，第一和第二的限定并无具体含义，只是对用户信息及其响应所对应的语义的区分。

本实施例中在确定用户信息的语义之后，基于对话树中对话中句子之间的响应关系，由用户信息语义确定响应信息语义。从而从响应上也实现不局限于外在的表示形式，以语义为匹配的根本。具体的，可以从对话树中定位得到与第一语义编码一致的目标用户句子节点，即定位当前用户信息所达到的对话程度。根据对话树中句子之间的响应关系，确定用于承接或响应目标用户句子节点的响应句子节点，得到表达响应句子节点的语义的第二语义编码。

其中，由于第二语义编码是在对话树的整体对话逻辑的基础上确定的，因此第二语义编码的确定考虑了对话上文，而非单纯地对用户信息这一次交互进行回复，从而将整体对话联系起来，实现对响应语义的准确确定。

示例性的，对话树中包含了一次次完整的对话内容及逻辑关系，假设其中某一次对话中由7层对话语义构成，这7层对话语义之间具有响应关系。假设根据第一语义编码从对话树中定位到当前用户信息所达到的对话程度达到第3层对话语义。从而根据对话树中句子节点之间的响应关系，确定对话中的第4层对话语义的语义编码作为第二语义编码。

其中，对话树中用于响应用户信息的候选对话语义可能包括多个，即以目标用户句子节点为父节点，目标用户句子节点可以包括多个子节点。且基于逻辑脑图样本统计得到的，由父节点转换到各个子节点的转换概率不同。因此可以选择转换概率最高的候选语义作为第二语义编码。而为了保证对话的多样性，避免将对话局限于一种情况，本实施例可以根据候选对话语义的转换概率进行随机抽取，以得到第二语义编码。

S130、从句子树中确定第二语义编码的目标响应句子，用于与用户对话。

在本申请具体实施例中，目标响应句子是指能够表达第二语义编码语义，且具有具体的外在词语表示形式的句子。目标响应句子可以以文本形式存在，通过电子设备将目标响应句子播放给用户，以对用户的用户信息进行响应，实现与用户的对话。

本实施例中，鉴于同一语义可以有多种外在的词语表示形式，因此在确定第二语义编码之后，可以基于句子树中词语与句子语义之间的组合关系，将根本的语义转化为外在形式上的目标响应句子。从而从目标响应句子的输出上，实现不局限于同一种外在的词语表示形式。具体的，从句子树中查找与第二语义编码一致的目标响应句子节点，根据与目标响应句子节点具有组合关系的词语节点，确定用于组成目标响应句子的目标响应词语节点，最终将目标响应词语节点进行组合，得到目标响应句子。

其中，句子树中同义词语可能包括多个，即以目标响应句子节点或某一个目标响应词语节点为父节点，其可以包括多个子节点。且基于逻辑脑图样本统计得到的，由父节点转换到各个子节点的转换概率不同。因此可以选择转换概率最高的候选词语节点作为连接句子所需的目标响应词语节点。而为了保证对话的多样性，避免将对话局限于一种表示方式，本实施例可以根据候选词语节点的转换概率进行随机抽取，以得到每一层级的目标响应词语节点。

本实施例的技术方案，通过逻辑脑图样本中句子节点信息和/或词语节点信息，预先训练学习得到句子树和对话树，在接收到用户对话的用户信息时，根据句子树确定用户信息的第一语义编码，根据第一语义编码，从对话树中确定响应用户信息的第二语义编码，最终根据第二语义编码，从句子树中确定目标响应句子，以与用户进行对话。本申请实施例基于逻辑脑图将对话逻辑快速学习到句子树和对话树中，通过句子树和对话树之间的交替匹配，使得响应内容考虑了上文对话内容，且包容了对话内容的多种表示，保障了对话内容的多样性，提高人机之间多轮对话的准确性。

第二实施例

图2是根据本申请第二实施例的句子树和对话树的训练流程图，本实施例在上述第一实施例的基础上，进一步对句子树和对话树的训练方式进行解释说明，能够基于逻辑脑图样本中的句子节点信息和/或词语节点信息训练得到。如图2所示，该方法具体包括如下：

S210、根据逻辑脑图样本，学习得到句子树和对话树中的节点。

在本申请具体实施例中，逻辑脑图是指将对话中所涉及的词语和/或句子，通过相互隶属与相关的节点层级关系表现出来。可以预先对不同场景构建逻辑脑图，用于表示不同场景下的对话逻辑，以不同场景下的逻辑脑图为大量样本。

本实施例中，不局限于逻辑脑图样本中存在的外在词语表示形式以及语义，通过对逻辑脑图样本中的节点进行深度优先搜索(Depth-First-Search，DFS)，得到完整对话路径。鉴于完整对话路径中的局部也可以构成对话，因此对完整对话路径进行拆分，挖掘句子大量的词语表示及其所表达的语义。

本实施例中，保留逻辑脑图样本中的词语，但对逻辑脑图样本中的句子进行语义压缩，基于语义为句子节点和词语节点添加语义编码，即每一种语义都配置有唯一对应的语义编码，相应的富含多种语义的节点则配置有多个语义编码，每个语义编码用于唯一标识一种语义，形成句子树和对话树中的节点。

具体的，图3为句子树中节点的训练流程图。如图3所示，根据逻辑脑图样本，学习得到句子树中的节点，包括：

S2111、对逻辑脑图样本进行词语节点深度搜索，得到完整对话路径。

本实施例中，从逻辑脑图样本的父节点起，对每一个可能的分支路径深入到不能再深入为止，得到完整对话路径。其中，对于所遍历路径中的句子节点，可以学习得到句子节点之间的对话逻辑；对于遍历路径中的词语节点，可以得到句子的完整表示。

S2112、根据完整对话路径中的词语节点，构成对话词典。

本实施例中，由于完整句子路径中的局部也可以构成对话，完整词语路径中的局部也可以组合成句子，因此对完整对话路径进行拆分，以挖掘句子大量的词语表示及其所表达的语义。其中，在句子树训练的过程中，保留逻辑脑图样本以及挖掘中所有的词语节点，以及词语节点之间的连接关系，构成对话词典。

S2113、对对话词典词语所组成的句子进行句子语义压缩，生成句子树中的句子节点，以及根据对话词典得到句子节点中的词语节点组合。

本实施例中，根据对话词典中的词语节点及其连接关系，对对话词典中的词语进行组合，以得到词语所组成的句子的语义。基于电子设备中数据量存储的最小化，以及句子树的完整性和唯一性，对所组成的句子的语义进行语义压缩。即将相同语义的句子进行合并，生成句子树中的句子节点。但保留各句子下的所有词语，即得到句子节点中的词语节点组合。可以理解的是，句子树保留了句子的多种词语表示形式。

示例性的，若表达句子语义为老张批评小王，则可以包括如下三种表示形式：“老张批评了小王”、“老张把小王批评了”和“小王被老张批评了”。进而将这三种表示形式基于语义相同可以压缩为同一句子节点，而该句子节点包括三种词语节点组合。

S2114、根据句子节点中词语节点组合的语义，为句子节点添加标识句子语义的语义编码。

本实施例中，采用语义编码的形式来唯一标识一种语义，以便通过根本的语义来呈现对话逻辑，避免将对话局限于外在形式上词语的表示。其中，由于句子节点中，基于同一路径上的不同词语节点所组合成的句子，可能表达了另外的语义，相应的，为句子节点赋予额外的句子语义。因此，根据句子节点中词语节点组合的语义，为每一种语义添加一个语义编码。相应的，句子树中同一句子节点可以具有多个语义编码。

其中，句子树中的词语节点也可以具有语义编码，相应的，句子节点的语义编码是根据词语节点组合中所包括的词语节点的语义编码，所生成的语义编码。即句子节点与词语节点组合，在语义编码上呈现出一定的关联关系。例如，句子节点的语义编码，可以是词语节点组合中各词语节点的语义编码的连接，还可以是各词语节点的语义编码通过一定的算法所生产的编码。

示例性的，图4为逻辑脑图样本的示例图。如图4所示，假设样本中包括C1至C9共9层节点，C1层至C6层可以为句子节点，C7层至C9层可以为词语节点。对样本进行深度优先搜索，可以得到完整路径为[C1，C2，……，C9]，构成对话。对完整路径进行拆分，以最左侧分支为例，[C1，C2，C3]也可以构成对话，以挖掘句子大量的词语表示及其所表达的语义。将C7层至C9层构成对话词语。其中，对样本进行句子语义压缩，可以将C7层中的多个节点合并到同一语义的句子节点C6，生成句子树中的句子节点。对于句子节点C6，可以得到[C7，C8，C9]中的多种词语节点组合。根据句子节点中局部词语节点组合的语义，假设“按时回”与“按时到”可以形成与C7至C9完整路径的不同语义，因此可以为句子节点C6添加至少两个语义编码。

值得注意的是，基于逻辑脑图的复杂性，图4只是逻辑脑图的简单示意，可能存在不完全准确性，且逻辑脑图并不限定示例的具体表示形式。

具体的，图5为对话树中节点的训练流程图。如图5所示，根据逻辑脑图样本，学习得到对话树中的节点，包括：

S2121、对逻辑脑图样本中的句子节点进行语义压缩，生成对话树中的句子节点。

本实施例中，在对话树的生成过程中，基本保留了逻辑脑图样本中的句子节点，仅仅是对逻辑脑图中的句子节点进行语义压缩，即将相同语义的句子进行合并，生成对话树中的句子节点。例如，逻辑脑图样本中存在三个句子节点中的语句分别为“老张批评了小王”、“老张把小王批评了”和“小王被老张批评了”，由于该三个句子节点的句子语义相同，因此该三个句子节点的句子语义可以生成为对话树中的同一句子节点。

S2122、基于逻辑脑图中句子节点之间连接关系所表示的对话逻辑，确定对话树中句子节点之间的响应关系。

本实施例中，遵从逻辑脑图中句子节点之间的连接关系，为对话树中的句子节点之间建立响应关系。相应的，由于对话树是基于大量逻辑脑图样本训练得到的，因此对话树中与同一句子节点具有响应关系的候选句子节点可以包括多个。

S2123、根据句子节点以及句子节点之间的响应关系，得到对话树，并根据句子节点的语义为句子节点添加标识句子语义的语义编码。

本实施例中，句子节点及其之间的响应关系，共同构成了对话树。对话树中句子节点通常只有一种语义，相应的，对话树中的每个句子节点都具有唯一对应的语义编码。其中，对话树中句子节点的语义编码与句子树中句子节点的语义编码对应，即有对应关系的，对话树中的句子节点与句子树中的句子节点，具有相同的语义编码。以便由句子树到对话树中，定位用户信息的对话程度，由对话树到句子树中，查找响应句子。

S220、在句子树和对话树中，确定节点之间的转换概率。

在本申请具体实施例中，转换概率是指，在具有连接关系的节点之间，由前一节点转换连接至后一节点的概率。本实施例中，每个节点都可以配置有一转换概率列表，用于表示不同节点连接至本节点的转换概率。

在句子树中，可以基于逻辑脑图样本，统计表达句子节点语义的首个词语的使用概率，并统计一个词语节点连接至另一词语节点的使用概率。例如，对于句子节点语义“我按时回家”，在“我”之后，可以连接“按时”和“准时”，其中，“按时”的使用概率为60％，“准时”的使用概率为40％。因此在语义“我按时回家”的基础上，由词语节点“我”至词语节点“按时”的转换概率为60％，由词语节点“我”至词语节点“准时”的转换概率为40％。

在对话树中，可以基于逻辑脑图样本，统计响应于同一语义的不同句子节点的使用概率。例如，对于句子节点语义“我想你”，可以响应句子节点语义“我也想你”的概率为70％，可以响应句子节点语义“么么哒”的概率为30％。

其中，对于对话中的疑问型用户信息，电子设备可以通过网络搜索确定回复答案，可以直接将回复答案作为响应实现对话，也可以通过句子树中词语节点的遍历确定回复答案的语义，并在句子树中重新确定回复答案的词语节点组合。

本实施例的技术方案，通过逻辑脑图样本中句子节点信息和/或词语节点信息，预先训练学习得到句子树和对话树中的节点，根据逻辑脑图样本统计节点之间的转换概率，以形成句子树和对话树。本申请实施例基于逻辑脑图将对话逻辑快速学习到句子树和对话树中，包容了对话内容的多种表示，保障了对话内容的多样性，提高人机之间多轮对话的准确性。

第三实施例

图6是根据本申请第三实施例的一种对话交互方法的流程图，本实施例在上述第一实施例的基础上，进一步对目标响应句子的确定方式进行解释说明，能够通过句子树中的词语节点遍历来识别用户信息的语义，并通过对话树中句子节点之间的响应关系来确定响应语义，最终通过句子树中对响应语义下词语节点的抽取来确定目标响应句子。如图6所示，该方法具体包括如下：

S610、根据用户信息的词语信息，从句子树的词语节点向句子节点遍历，确定构成用户信息的目标词语节点组合。

在本申请具体实施例中，用户信息是指用户向电子设备输入的对话语音。相应的，用户信息的词语信息可以是将语音形式的用户信息转化为文本形式，对于文本形式的用户信息进行拆分得到的词语，以及各词语之间的顺序等信息。

本实施例中，目标词语节点组合是指句子树中，与用户信息的词语信息的外在形式相匹配的，且节点之间具有连接关系能够构成路径的词语节点。通过由形式的匹配可以得到用户信息的根本语义。

具体的，可以根据词语信息中各词语的倒序，依次采用词语信息中的每个词语，在前序词语所匹配成功的词语节点的基础上，依据句子树中词语节点之间的连接关系，按照由子节点向根节点的顺序进行遍历。其中，所遍历匹配成功的且构成路径的所有词语节点的组合，构成用户信息的目标词语节点组合。

示例性的，假设以图4中节点C6至节点C9为句子树，并假设用户信息为“按时回家”，则得到用户信息的词语信息为“按时”->“回”->“家”。进而按照由子节点向根节点的顺序进行遍历，首先将词语信息“家”与词语节点C9进行匹配，若匹配成功到词语节点“家”，则其次将词语信息“回”与词语节点C8中的“回”进行匹配，若匹配成功，最后将词语信息“按时”与词语节点C7中的“按时”进行匹配。若匹配成功，且构成路径，则将词语节点C7中的“按时”、词语节点C8中的“回”以及词语节点C9中的“按时”作为目标词语节点组合。

S620、根据目标词语节点组合，从目标词语节点组合所属句子节点中，确定用于表示用户信息的第一语义编码。

在本申请具体实施例中，由于目标词语节点组合中的各个词语节点构成了路径，因此目标词语节点组合属于同一个句子节点，因此将该句子节点的语义编码作为用户信息的第一语义编码。其中，若句子节点包括多个语义编码，则根据目标词语节点组合中所包含的词语节点，基于句子节点的语义编码的生成依据，从多个语义编码中确定目标词语节点组合所表达的语义的语义编码，作为用户信息的第一语义编码。示例性的，在上述示例中，将句子节点C6的语义编码作为用户信息的第一语义编码。

S630、从对话树中定位得到与第一语义编码一致的目标用户句子节点。

在本申请具体实施例中，目标用户句子节点是指对话树中，与用户信息的语义相匹配的句子节点。鉴于句子树表示了对话中句子之间的响应关系，因此目标用户句子节点定位了用户信息当前的对话程度。

具体的，将第一语义编码与对话树中各个句子节点的语义编码进行匹配，得到与第一语义编码相匹配的句子节点作为目标用户句子节点。其中，若用户信息是对话过程中的对话信息，则可以依据对话树中句子节点之间的连接关系，在对话上文所匹配的句子节点所连接的子节点中，继续进行目标用户句子节点的匹配，以缩小匹配范围。若匹配失败，则可以表示用户发起了其他话题的对话，因此此时可以从全部对话树中进行匹配。

S640、根据与目标用户句子节点具有响应关系的候选句子节点的转换概率，从候选句子节点中抽取得到响应句子节点。

在本申请具体实施例中，响应句子节点是指对话树中用于响应目标用户句子节点的句子节点。对话树中用于响应目标用户句子节点的候选句子节点可能包括多个，即以目标用户句子节点为父节点，目标用户句子节点可以包括多个子节点。响应句子节点是与目标用户句子节点具有响应关系的候选句子节点中的一个。

其中，基于逻辑脑图样本统计得到的，由父节点转换到各个子节点的转换概率不同。因此可以选择转换概率最高的候选句子节点作为响应句子节点。而为了保证对话的多样性，避免将对话局限于一种情况，本实施例可以根据各个候选句子节点的转换概率，从候选句子节点中进行随机抽取，以得到响应句子节点。

示例性的，假设目标用户句子节点包括两个候选句子节点，即在用户表达了目标用户句子节点的对话语义后，智能设备有两种响应方式。其中，假设第一候选句子节点的转换概率为60％，第二候选句子节点的转换概率为40％，则在随机抽取过程中，有60％的概率可以抽中第一候选句子节点，有40％的概率可以抽中第二候选句子节点。

S650、确定响应句子节点的第二语义编码。

在本申请具体实施例中，由于对话树中句子节点通常只具有一个语义编码，因此将响应句子节点的语义编码作为第二语义编码。

S660、从句子树中，查找与第二语义编码一致的目标响应句子节点。

在本申请具体实施例中，在确定用户信息的响应之后，即可确定响应的具体表示形式。具体的，目标响应句子节点是指句子树中能够表达响应语义的句子节点，将第二语义编码与句子树中各句子节点的语义编码进行匹配，并将语义编码相匹配的句子节点作为目标响应句子节点。

S670、根据与目标响应句子节点具有组合关系的候选词语节点的转换概率，从候选词语节点中抽取得到目标响应词语节点。

在本申请具体实施例中，目标响应词语节点是指句子树中用于表示目标响应句子节点的语义的词语节点。句子树中用于表示目标响应句子节点的候选词语节点可能包括多个，即以目标响应句子节点为父节点，目标响应句子节点可以包括多个子节点，且各个子节点可能还包括多个子节点。目标响应词语节点是与目标响应句子节点具有组合关系的候选词语节点中的至少一个。

其中，基于逻辑脑图样本统计得到的，由父节点转换到各个子节点的转换概率不同。因此可以选择转换概率最高的候选词语节点作为目标响应词语节点。而为了保证对话的多样性，避免将对话局限于一种情况，本实施例可以根据各个候选词语节点的转换概率，从候选词语节点中进行随机抽取，以得到目标响应词语节点。并在表达第二语义编码的词语节点范围之内，依据词语节点之间的连接关系，逐层抽取目标响应词语节点。

示例性的，假设以目标响应句子节点为父节点，一共包括5层词语节点。并假设目标响应句子节点具有两个语义编码，其中之一与第二语义编码相匹配，且能够表达该语义编码的词语节点范围为父节点所连接的3层词语节点。因此，以目标响应句子节点为父节点，先抽取与父节点相连接的第一层词语节点，其次以所抽取得到的第一层词语节点为父节点，抽取第二次词语节点，最终以所抽取得到的第二次词语节点为父节点，抽取第三次词语节点，将这三个词语节点作为目标响应词语节点。

S680、将目标响应词语节点进行组合，得到目标响应句子。

本实施例中，可以按照各个目标词语节点之间的连接关系，将目标词语节点进行组合，形式目标响应句子。示例性的，在上述示例中，按照句子树中有父节点向子节点的顺序，可以将第一层词语节点、第二次词语节点以及第三次词语节点按顺序连接起来，组合形成目标响应句子。

本实施例的技术方案，通过句子树中的词语节点遍历来识别用户信息的语义，并通过对话树中句子节点之间的响应关系来确定响应语义，最终通过句子树中对响应语义下词语节点的抽取来确定目标响应句子，以与用户进行对话。本申请实施例基于逻辑脑图将对话逻辑快速学习到句子树和对话树中，通过句子树和对话树之间的交替匹配，使得响应内容考虑了上文对话内容，且包容了对话内容的多种表示，保障了对话内容的多样性，提高人机之间多轮对话的准确性。

第四实施例

图7是根据本申请第四实施例的一种对话交互装置的结构示意图，本实施例可适用于人机之间多轮对话中确定响应语句的情况，该装置可实现本申请任意实施例所述的对话交互方法。该装置700具体包括如下：

用户语义识别模块710，用于根据句子树，确定接收到的用户信息的第一语义编码；

响应语义确定模块720，用于根据所述第一语义编码，从对话树中确定用于响应所述用户信息的第二语义编码；其中，所述句子树和所述对话树通过逻辑脑图样本中句子节点信息和/或词语节点信息训练得到；

响应句子确定模块730，用于从所述句子树中确定所述第二语义编码的目标响应句子，用于与用户对话。

进一步的，所述装置700还包括训练模块740，具体用于：

在所述句子树和所述对话树中，确定节点之间的转换概率。

可选的，所述训练模块740具体用于：

根据所述完整对话路径中的词语节点，构成对话词典；

可选的，所述训练模块740具体用于：

可选的，所述用户语义识别模块710具体用于：

可选的，所述响应语义确定模块720具体用于：

确定所述响应句子节点的第二语义编码。

可选的，所述响应句子确定模块730具体用于：

本实施例的技术方案，通过各个功能模块之间的相互配合，实现了逻辑脑图的构建、句子树和对话树的训练、用户语义的识别、响应语义的确定以及响应句子的确定等功能。本申请实施例基于逻辑脑图将对话逻辑快速学习到句子树和对话树中，通过句子树和对话树之间的交替匹配，使得响应内容考虑了上文对话内容，且包容了对话内容的多种表示，保障了对话内容的多样性，提高人机之间多轮对话的准确性。

第五实施例

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图8所示，是根据本申请实施例的对话交互方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图8所示，该电子设备包括：一个或多个处理器801、存储器802，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置，诸如，耦合至接口的显示设备，其上显示图形用户界面(Graphical User Interface，GUI)的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作，例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统。图8中以一个处理器801为例。

存储器802即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的对话交互方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的对话交互方法。

存储器802作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的对话交互方法对应的程序指令/模块，例如，附图7所示的用户语义识别模块710、响应语义确定模块720、响应句子确定模块730和训练模块740。处理器801通过运行存储在存储器802中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的对话交互方法。

存储器802可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据对话交互方法的电子设备的使用所创建的数据等。此外，存储器802可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器802可选包括相对于处理器801远程设置的存储器，这些远程存储器可以通过网络连接至对话交互方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

对话交互方法的电子设备还可以包括：输入装置803和输出装置804。处理器801、存储器802、输入装置803和输出装置804可以通过总线或者其他方式连接，图8中以通过总线连接为例。

输入装置803可接收输入的数字或字符信息，以及产生与对话交互方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置804可以包括显示设备、辅助照明装置和触觉反馈装置等，其中，辅助照明装置例如发光二极管(LightEmittingDiode，LED)；触觉反馈装置例如，振动电机等。该显示设备可以包括但不限于，液晶显示器(Liquid Crystal Display，LCD)、LED显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路(Application Specific Integrated Circuit，ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序，也称作程序、软件、软件应用、或者代码，包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置，例如，磁盘、光盘、存储器、可编程逻辑装置(Programmable Logic Device，PLD)，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置，例如，阴极射线管(Cathode Ray Tube，CRT)或者LCD监视器；以及键盘和指向装置，例如，鼠标或者轨迹球，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈，例如，视觉反馈、听觉反馈、或者触觉反馈；并且可以用任何形式，包括声输入、语音输入或者、触觉输入，来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统，例如，数据服务器，或者实施在包括中间件部件的计算系统，例如，应用服务器、或者实施在包括前端部件的计算系统，例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互，或者实施在包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信，例如，通信网络，来将系统的部件相互连接。通信网络的示例包括：局域网(Local Area Network，LAN)、广域网(WideArea Network，WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案，基于逻辑脑图将对话逻辑快速学习到句子树和对话树中，通过句子树和对话树之间的交替匹配，使得响应内容考虑了上文对话内容，且包容了对话内容的多种表示，保障了对话内容的多样性，提高人机之间多轮对话的准确性。

另外，通过具有组合关系的句子树，以及具有响应关系的对话树，使得响应内容考虑了上文对话内容，且包容了对话内容的多种表示，保障了对话内容的多种可能性。

另外，根据逻辑脑图样本确定的节点信息和节点之间的转换概率，公同构成了句子树和对话树，使得树中的节点之间具有对话逻辑，包容了对话内容的多种表示，保障了对话内容的多种可能性。

另外，基于逻辑脑图样本构建的对话词典中的词语，构成了句子树中的词语节点，词语节点组合所表达的语义构成了句子节点，基于词语节点的不同组合方式，句子节点可能含有不同的句子语义，从而每一种句子语义都配置有对应的语义编码，有利于对不同表示的用户信息的识别，以及对同一语义的多种表示，确保了对话的多样性。

另外，基于逻辑脑图样本压缩后的句子语义，构成了对话树中的句子节点，并为每个句子节点添加语义编码，基于逻辑脑图中的对话逻辑，确定对话树中的句子节点之间的响应关系，语义的相应关系有利于确定对话中话语之间的对话逻辑，且不局限于句子中词语的表示。

另外，通过将用户信息中的词语信息与句子树中的句子节点进行匹配，确定符合词语信息的目标词语节点组合，从而确定目标词语节点组合所属句子节点的第一语义编码，实现了对用户信息的语义识别。

另外，基于第一语义编码在对话树中进行句子节点定位，从而根据句子节点之间的响应关系，确定响应用户信息的第二语义编码，实现了在对话逻辑的基础上确定响应语义，避免了词语表示对于对话的局限性以及对话上文的忽略，保障了对话的多样性和准确性。

另外，根据作为响应语义的第二语义编码从句子树中确定目标响应句子节点，并根据第二语义编码确定表达该第二语义的词语组合，最终形成目标响应句子用于对话。在语义表达正确的情况下，保障了对话的多样性。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种对话交互方法，其特征在于，包括：

根据句子树，确定接收到的用户信息的第一语义编码；

根据所述第一语义编码，从对话树中确定用于响应所述用户信息的第二语义编码，包括：从所述对话树中定位与所述第一语义编码一致的目标用户句子节点；所述目标用户句子节点用于表征当前用户信息所达到的对话程度；根据所述对话树中句子之间的响应关系，确定用于承接或响应所述目标用户句子节点的响应句子节点，并确定表达所述响应句子节点的语义的第二语义编码；其中，所述句子树和所述对话树通过逻辑脑图样本中句子节点信息和/或词语节点信息训练得到；

2.根据权利要求1所述的方法，其特征在于，所述句子树用于表示词语与句子之间的组合关系，所述对话树用于表示对话中句子之间的响应关系。

3.根据权利要求1所述的方法，其特征在于，所述句子树和所述对话树通过如下方式确定，包括：

在所述句子树和所述对话树中，确定节点之间的转换概率。

4.根据权利要求3所述的方法，其特征在于，根据所述逻辑脑图样本，学习得到句子树中的节点，包括：

根据所述完整对话路径中的词语节点，构成对话词典；

5.根据权利要求3所述的方法，其特征在于，根据所述逻辑脑图样本，学习得到对话树中的节点，包括：

6.根据权利要求1所述的方法，其特征在于，所述根据句子树，确定接收到的用户信息的第一语义编码，包括：

7.根据权利要求1所述的方法，其特征在于，所述根据所述第一语义编码，从对话树中确定用于响应所述用户信息的第二语义编码，包括：

确定所述响应句子节点的第二语义编码。

8.根据权利要求1所述的方法，其特征在于，所述从所述句子树中确定所述第二语义编码的目标响应句子，包括：

9.一种对话交互装置，其特征在于，包括：

响应语义确定模块，用于根据所述第一语义编码，从对话树中确定用于响应所述用户信息的第二语义编码，包括：从所述对话树中定位与所述第一语义编码一致的目标用户句子节点；所述目标用户句子节点用于表征当前用户信息所达到的对话程度；根据所述对话树中句子之间的响应关系，确定用于承接或响应所述目标用户句子节点的响应句子节点，并确定表达所述响应句子节点的语义的第二语义编码；其中，所述句子树和所述对话树通过逻辑脑图样本中句子节点信息和/或词语节点信息训练得到；

10.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-8中任一项所述的对话交互方法。

11.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的对话交互方法。