CN112017660B

CN112017660B - 一种智能语音机器人的对话策略构建方法、装置及系统

Info

Publication number: CN112017660B
Application number: CN202011191991.8A
Authority: CN
Inventors: 李蒙; 张常睿
Original assignee: Beijing Qilu Information Technology Co Ltd
Current assignee: Beijing Qilu Information Technology Co Ltd
Priority date: 2020-10-30
Filing date: 2020-10-30
Publication date: 2021-01-12
Anticipated expiration: 2040-10-30
Also published as: CN112017660A

Abstract

本发明属于计算机技术领域，提供一种智能语音机器人的对话策略构建方法、装置及系统。其中方法包括：接收操作人员输入以获取对话主题，以及与该对话主题相关的主题说明；设置多个对话节点，输入对话节点语料，判断所述对话节点语料与所述主题说明的重要性程度；按所述重要性关系对所述多个对话节点排序，构建对话策略。采用该技术方案，操作人员仅需要确定好对话的主题以及对话中的节点就能生成适合的对话策略，对操作人员要求低，构建对话策略简单快速，能够满足满足客户服务中心每天的需求。

Description

一种智能语音机器人的对话策略构建方法、装置及系统

技术领域

本发明属于计算机技术领域，尤其涉及一种智能语音机器人的对话策略构建方法、装置及系统，该对话策略适用于具体的任务型应用场景。

背景技术

客户服务中心是企业与用户沟通的主要桥梁，提升用户满意度的主要渠道。以前客户服务中心主要以人工客服为主，由专业的客服人员为用户进行服务。随着计算机信息处理技术的发展，越来越多的客户服务中心开始采用智能语音机器人为用户进行服务。

目前在行业细分领域构建智能语音机器人对话策略的构建需要对该领域非常了解才能够构建合适的对话顺序。行业细分领域，诸如具体某个产品的智能语音推销，通常需要人员对当前的任务型对话场景进行了解，再来设定智能语音机器人的对话策略。如果对话顺序安排不合适，效果非常不理想，用户体验不好。然而经验丰富的操作人员数量较少，培训成本较高，仅靠目前现有的操作人员很难满足客户服务中心每天的需求。

发明内容

本发明旨在解决现有的智能语音机器人对话策略构建比较复杂，无法满足客户服务中心每天不同任务型智能语音对话需求的问题。

为解决上述技术问题，本发明的一方面提出一种智能语音机器人的对话策略构建方法，该对话策略适用于具体的任务型应用场景，方法包括：

接收操作人员输入以获取对话主题，以及与该对话主题相关的主题说明；

设置多个对话节点，输入对话节点语料，判断所述对话节点语料与所述主题说明的重要性程度；

按所述重要性关系对所述多个对话节点排序，构建对话策略。

根据本发明的一种优选实施方式，判断所述对话节点语料与所述主题说明的重要性关系具体为：

将所述对话节点语料和所述主题说明输入重要性判断模型；

所述重要性判断模型输出重要性参考值，所述重要性参考值表示所述对话节点语料与所述主题说明的重要性程度。

根据本发明的一种优选实施方式，所述重要性判断模型包括编码层和匹配层，所述编码层用于将所述对话节点语料和所述主题说明转为句向量，所述匹配层用于计算对话节点语料句向量和主题说明句向量的重要性程度。

根据本发明的一种优选实施方式，所述编码层采用双向长短期记忆网络，所述匹配层采用余弦算法。

根据本发明的一种优选实施方式，方法还包括：

设置知识库，所述知识库中存储有通用对话主题以及相对应的通用对话语料；

当用户输入的语句触发通用对话主题时，将所述通用对话主题对应的通用对话语料加入对话策略与用户进行对话。

根据本发明的一种优选实施方式，所述用户输入的语句触发通用对话主题具体为：

将所述用户输入的语句输入主题判断模型，如果输出的主题结果与所述知识库中设置的通用主题匹配，则触发所述通用对话主题。

根据本发明的一种优选实施方式，所述主题判断模型为基于深度学习的TextCNN模型，所述主题判断模型包括输入层、卷积层、池化层以及全连接层。

本发明第二方面提出一种智能语音机器人的对话策略构建装置，该对话策略适用于具体的任务型应用场景，装置包括：

主题确定模块，用于接收操作人员输入以获取对话主题，以及与该对话主题相关的主题说明；

对话节点设置模块，用于设置多个对话节点，输入对话节点语料，判断所述对话节点语料与所述主题说明的重要性程度；

策略建立模块，用于按所述重要性关系对所述多个对话节点排序，构建对话策略。

将所述对话节点语料和所述主题说明输入重要性判断模型；

根据本发明的一种优选实施方式，装置还包括：

知识库模块，用于设置知识库，所述知识库中存储有通用对话主题以及相对应的通用对话语料；

本发明第三方面提出一种智能语音机器人的对话策略构建系统，该对话策略适用于具体的任务型应用场景，系统包括：

存储单元，用于存储计算机可执行程序；

处理单元，用于读取所述存储单元中的计算机可执行程序，以执行所述的智能语音机器人的对话策略构建方法。

本发明的第四方面一种计算机可读介质，存储有计算机可执行程序，其特征在于，所述计算机可执行程序被执行时，实现所述的智能语音机器人的对话策略构建方法。

采用该技术方案，操作人员仅需要确定好对话的主题以及对话中的节点就能生成适合的对话策略，对操作人员要求低，构建对话策略简单快速，能够满足满足客户服务中心每天的需求。

附图说明

图1是本发明实施例中一种智能语音机器人的对话策略构建方法的流程示意图；

图2是本发明实施例中重要性判断模型的结构示意图；

图3是本发明实施例中一种智能语音机器人的对话策略构建装置的结构示意图；

图4是本发明实施例中电子设备的结构示意图；

图5是本发明实施例中的计算机可读记录介质的示意图。

具体实施方式

在对于具体实施例的介绍过程中，对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是，并不排除本领域技术人员可以在特定情况下，以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。

附图中的流程图仅是一种示例性的流程演示，不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤，也不代表必须按照图中所显示的的顺序执行。例如，流程图中有的操作/步骤可以分解，有的操作/步骤可以合并或部分合并，等等，在不脱离本发明的发明主旨的情况下，流程图中显示的执行顺序可以根据实际情况改变。

附图中的框图一般表示的是功能实体，并不一定必然与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。

各附图中相同的附图标记表示相同或类似的元件、组件或部分，因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解，虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分，但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说，这些定语仅是用来将一者与另一者区分。例如，第一器件亦可称为第二器件，但不偏离本发明实质的技术方案。此外，术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。

图1是本发明一种智能语音机器人的对话策略构建方法的流程示意图，该对话策略适用于具体的任务型应用场景，如图1所示，本发明具有如下步骤：

S101、接收操作人员输入以获取对话主题，以及与该对话主题相关的主题说明。

在本实施方式中，构建对话策略，首先确定好本次对话的目的，根据目的确定好对话主题，并对对话主题进行简单的文字说明。例如，目的是向用户推销笔记本，则对话主题为推销产品，主题说明中记载“向用户推销XX牌笔记本，目前有活动价格低于其他销售平台等等”。

本申请中的对话主题及主题说明可以是操作人员手工输入，也可以是操作人员从预先设置的对话主题库中选取并进行编辑和修改。

S102、设置多个对话节点，输入对话节点语料，判断所述对话节点语料与所述主题说明的重要性程度。

在本实施方式中，对话策略中还需要设置具体的对话节点，对话节点为更为具体的对话内容，对话节点语料为对话时使用的文本内容。比如在对话主题为推销的对话策略中，设置四个对话节点，N1为产品介绍，N2为产品硬件，N3为产品软件，N4位产品价格，N1的对话节点语料为“尺寸为XXX，总量为XXX，续航时间XXX”，N2的对话节点语料为“处理器为XXX，内存为XXX，硬盘为固定硬盘容量为XXX”，N3的对话节点语料为“软件预装正版WIN10和OFFICE”，N4的对话节点语料为“促销活动，价格低于其他销售平台”。

本申请中的对话节点及对话节点语料可以是操作人员手工输入，也可以是操作人员从预先设置的对话节点库中选取并进行编辑和修改。

在上述技术方案的基础上，进一步地，判断所述对话节点语料与所述主题说明的重要性关系具体为：

将所述对话节点语料和所述主题说明输入重要性判断模型；

在现有技术中为了保证对话的效果，对话策略中的节点顺序是由经验丰富的操作人员设置，但毕竟经验丰富的操作人员培训成本高，数量有限，客户服务中心需要设置的对话策略有很多，很难满足需求。因此，在本实施方式中，为了确定对话策略中各个节点的顺序，需要确定各个对话节点与对话主题的重要性程度。

在本实施方式中通过重要性判断模型确定各个对话节点与对话主题的重要性程度。

在上述技术方案的基础上，进一步地，所述重要性判断模型包括编码层和匹配层，所述编码层用于将所述对话节点语料和所述主题说明转为句向量，所述匹配层用于计算对话节点语料句向量和主题说明句向量的重要性程度。

在上述技术方案的基础上，进一步地，所述编码层采用双向长短期记忆网络，所述匹配层采用余弦算法。

图2是本发明实施例中重要性判断模型的结构示意图，如图2所示，所述编码层采用双向长短时期记忆网络模型。

双向长短时期记忆网络模型是循环神经网络的一种，能够更好的对语句的前后词进行考虑，比如“我不觉得今天天气好”，其中“不”是对后面的“天气好”进行限定，表示对天气好的否定，采用双向长短时期记忆网络模型可以更好的捕捉到较长距离的依赖关系，而且双向长短时期记忆网络模型还可以顾及到后面的词对前面的词的限定，比如“今天的天气冷的不行”，其中“不行”是“冷”的修饰和限定。

在本实施方式中，双向长短时期记忆网络模型为采用有监督学习的方式使用历史对话策略做为训练数据对模型进行训练。通过人工标引的方式对历史对话策略中的对话节点与对话主题的重要性程序进行标注，然后将标注好的历史对话策略分成训练集和校验集。先使用训练集对双向长短时期记忆网络模型进行训练，直至双向长短时期记忆网络模型收敛或者已经达到预期的效果时结束训练。然后使用校验集对双向长短时期记忆网络模型进行校验，如果通过验证则双向长短时期记忆网络模型构训练完成。

在本实施方式中，由于对话节点设置为4个，所以编码层的输入接口为5个，其中第一个为输入对话主题相关的主题说明，后面四个输入4个对话节点相对应的对话语料。经过双向长短时期记忆网络模型的运算，编码层输出5个对应的句向量。

在匹配层通过余弦算法计算4个节点的对话语料与对话主题的主题说明的重要性程度，经过计算，N1的重要性参考值为0.65，N2的重要性参考值为0.33，N3的重要性参考值为0.21，N4的重要性参考值为0.57。

S103、按所述重要性关系对所述多个对话节点排序，构建对话策略。

由于经过匹配层的计算，N1的重要性参考值最大，其次是N4、N2和N3。因此，该对话策略中对话节点的顺序为N1→N4→N2→N3，即先对产品进行介绍，然后介绍促销活动，商品的价格，然后介绍硬件和软件。

在上述技术方案的基础上，进一步地，方法还包括：

S104、设置知识库，所述知识库中存储有通用对话主题以及相对应的通用对话语料；

在本实施方式中，预先设置知识库，知识库中的内容为一些比较通用对话主题，比如公司介绍，实体店铺地址等等主题。在与用户进行沟通的过程中，用户可能会提及一些问题，这些问题并没有在预设的4个对话节点语料范围内，此时就需要对用户的输入进行主题识别，判断用户语句的主题是什么，与知识库中的哪个通用主题匹配，从而选取合适的回答应答用户。比如对话已经介绍完产品和价格，用户突然询问“你们有店面么，我想现场看看”此时经过判断，与知识库中“实体店铺地址”主题匹配，因此在对话策略中增加节点T1，此时对话策略变成N1→N4→T1→N2→N3，从“实体店铺地址”主题下面选取语料回答用户，“我们实体店地址在北京市XX区XX路XX号，您乘坐公交XX或地铁XX到XX站就能到达”。

在上述技术方案的基础上，进一步地，所述用户输入的语句触发通用对话主题具体为：

在上述技术方案的基础上，进一步地，所述主题判断模型为基于深度学习的TextCNN模型，所述主题判断模型包括输入层、卷积层、池化层以及全连接层。

在本是实施方式中，TextCNN模型的输入层需要输入一个定长的文本序列，我们需要通过分析语料集样本的长度指定一个输入序列的长度L，比L短的样本序列需要填充，比L长的序列需要截取。最终输入层输入的是文本序列中各个词汇对应的词向量。

在模型的池化层中使用了最大值池化，即减少了模型的参数，又保证了在不定长的卷基层的输出上获得一个定长的全连接层的输入。

卷积层与池化层在分类模型的核心作用就是特征提取的功能，从输入的定长文本序列中，利用局部词序信息，提取初级的特征，并组合初级的特征为高级特征，通过卷积与池化操作，省去了传统机器学习中的特征工程的步骤。

全连接层的作用就是分类器，将输入的文本进行分类，归纳为不同的主题。通过这种方式我们能够判断得到用户输入的主题，从而在知识库中进行匹配。

在本实施方式中，按构建好的对话策略与用户进行对话时，用户可能没有按照对话策略的顺序进行，需要实时将用户输入的语句输入主题判断模型，如果输出的主题结果与对话策略中靠后的对话节点的主题一致，则将该节点的顺序提前。比如刚对产品进行初步介绍，此时用户突然输入“这个笔记本都装什么软件了”经过判断与N3的主题一致，因此此时对话策略调整为N1→N3→N4→N2。

上述技术方案不但应用于产品销售领域，还以用于保险、金融、咨询等等多个领域。

图3是本发明实施例中一种智能语音机器人的对话策略构建装置的结构示意图，如图3所示，本发明提供一种智能语音机器人的对话策略构建装置300，该对话策略适用于具体的任务型应用场景，装置300包括：

主题确定模块301，用于接收操作人员输入以获取对话主题，以及与该对话主题相关的主题说明。

在本实施方式中，构建对话策略，首先先确定好本次对话的目的，根据目的确定好对话主题，并对对话主题进行简单的文字说明。例如，目的是向用户推销笔记本，则对话主题为推销产品，主题说明中记载“向用户推销XX牌笔记本，目前有活动价格低于其他销售平台等等”。

对话节点设置模块302，用于设置多个对话节点，输入对话节点语料，判断所述对话节点语料与所述主题说明的重要性程度。

在本实施方式中，对话策略中还需要设置具体的对话节点，对话节点为更为具体的对话内容，对话节点语料为对话时使用的文本内容。比如在对话主题为推销的对话策略中，设置四个对话节点，N1为产品介绍，N2为产品硬件，N3为产品软件，N4位产品价格，N1的对话节点语料为“尺寸为XXX，重量为XXX，续航时间XXX”，N2的对话节点语料为“处理器为XXX，内存为XXX，硬盘为固定硬盘容量为XXX”，N3的对话节点语料为“软件预装正版WIN10和OFFICE”，N4的对话节点语料为“促销活动，价格低于其他销售平台”。

将所述对话节点语料和所述主题说明输入重要性判断模型；

编码层采用双向长短时期记忆网络模型。双向长短时期记忆网络模型是循环神经网络的一种，能够更好的对语句的前后词进行考虑，比如“我不觉得今天天气好”，其中“不”是对后面的“天气好”进行限定，表示对天气好的否定，采用双向长短时期记忆网络模型可以更好的捕捉到较长距离的依赖关系，而且双向长短时期记忆网络模型还可以顾及到后面的词对前面的词的限定，比如“今天的天气冷的不行”，其中“不行”是“冷”的修饰和限定。

策略建立模块303，用于按所述重要性关系对所述多个对话节点排序，构建对话策略。

在上述技术方案的基础上，进一步地，装置还包括：

知识库模块304，用于设置知识库，所述知识库中存储有通用对话主题以及相对应的通用对话语料；

如图4所示，本发明的一个实施例中还公开一种智能语音机器人的对话策略构建系统，该对话策略适用于具体的任务型应用场景，图4显示的智能语音机器人的对话策略构建系统仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

智能语音机器人的对话策略构建系统400，包括存储单元420，用于存储计算机可执行程序；处理单元410，用于读取所述存储单元中的计算机可执行程序，以执行本发明各种实施方式的步骤。

在本实施方式中智能语音机器人的对话策略构建系统400还包括，连接不同系统组件（包括存储单元420和处理单元410）的总线430、显示单元440等。

其中，所述存储单元420存储有计算机可读程序，其可以是源程序或都只读程序的代码。所述程序可以被处理单元410执行，使得所述处理单元410执行本发明各种实施方式的步骤。例如，所述处理单元410可以执行如图1所示的步骤。

所述存储单元420可以包括易失性存储单元形式的可读介质，例如随机存取存储单元（RAM）4201和/或高速缓存存储单元4202，还可以进一步包括只读存储单元（ROM）4203。所述存储单元420还可以包括具有一组（至少一个）程序模块4205的程序/实用工具4204，这样的程序模块4205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线430可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

智能语音机器人的对话策略构建系统400也可以与一个或多个外部设备470（例如键盘、显示器、网络设备、蓝牙设备等）通信，使得用户能经由这些外部设备470通过输入/输出（I/O）接口450进行与处理单元410进行交互，还可以通过网络适配器460与一个或者多个网络（例如局域网（LAN），广域网（WAN）和/或公共网络，例如因特网）进行。网络适配器460可以通过总线430与智能语音机器人的对话策略构建系统400的其它模块通信。应当明白，尽管图中未示出，智能语音机器人的对话策略构建系统400中可使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

图5是本发明的一个计算机可读介质实施例的示意图。如图5所示，所述计算机程序可以存储于一个或多个计算机可读介质上。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储单元（RAM）、只读存储单元（ROM）、可擦式可编程只读存储单元（EPROM或闪存）、光纤、便携式紧凑盘只读存储单元(CD-ROM)、光存储单元件、磁存储单元件、或者上述的任意合适的组合。当所述计算机程序被一个或多个数据处理设备执行时，使得该计算机可读介质能够实现本发明的上述方法，即：

S101、接收操作人员输入以获取对话主题，以及与该对话主题相关的主题说明；

S102、设置多个对话节点，输入对话节点语料，判断所述对话节点语料与所述主题说明的重要性程度；

S103、按所述重要性关系对所述多个对话节点排序，构建对话策略；

S104、设置知识库，所述知识库中存储有通用对话主题以及相对应的通用对话语料；当用户输入的语句触发通用对话主题时，将所述通用对话主题对应的通用对话语料加入对话策略与用户进行对话。

通过以上的实施方式的描述，本领域的技术人员易于理解，本发明描述的示例性实施例可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本发明实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个计算机可读的存储介质（可以是CD-ROM，U盘，移动硬盘等）中或网络上，包括若干指令以使得一台数据处理设备（可以是个人计算机、服务器、或者网络设备等）执行根据本发明的上述方法。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网（LAN）或广域网（WAN），连接到用户计算设备，或者，可以连接到外部计算设备（例如利用因特网服务提供商来通过因特网连接）。

综上所述，本发明可以执行计算机程序的方法、装置、电子设备或计算机可读介质来实现。可以在实践中使用微处理单元或者数字信号处理单元（DSP）等通用数据处理设备来实现本发明的一些或者全部功能。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，应理解的是，本发明不与任何特定计算机、虚拟装置或者电子设备固有相关，各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种智能语音机器人的对话策略构建方法，该对话策略适用于具体的任务型应用场景，其特征在于，方法包括：

按所述重要性程度对所述多个对话节点排序，构建对话策略。

2.如权利要求1所述的对话策略构建方法，其特征在于，判断所述对话节点语料与所述主题说明的重要性程度具体为：

将所述对话节点语料和所述主题说明输入重要性判断模型；

3.如权利要求2所述的对话策略构建方法，其特征在于，所述重要性判断模型包括编码层和匹配层，所述编码层用于将所述对话节点语料和所述主题说明转为句向量，所述匹配层用于计算对话节点语料句向量和主题说明句向量的重要性程度。

4.如权利要求3所述的对话策略构建方法，其特征在于，所述编码层采用双向长短期记忆网络，所述匹配层采用余弦算法。

5.如权利要求1所述的对话策略构建方法，其特征在于，方法还包括：

6.如权利要求5所述的对话策略构建方法，其特征在于，所述用户输入的语句触发通用对话主题具体为：

7.如权利要求6所述的对话策略构建方法，其特征在于，所述主题判断模型为基于深度学习的TextCNN模型，所述主题判断模型包括输入层、卷积层、池化层以及全连接层。

8.一种智能语音机器人的对话策略构建装置，该对话策略适用于具体的任务型应用场景，其特征在于，装置包括：

策略建立模块，用于按所述重要性程度对所述多个对话节点排序，构建对话策略。

9.一种智能语音机器人的对话策略构建系统，该对话策略适用于具体的任务型应用场景，其特征在于，系统包括：

存储单元，用于存储计算机可执行程序；

处理单元，用于读取所述存储单元中的计算机可执行程序，以执行如权利要求1-7中任一项所述的智能语音机器人的对话策略构建方法。

10.一种计算机可读介质，存储有计算机可执行程序，其特征在于，所述计算机可执行程序被执行时，实现如权利要求1-7中任一项所述的智能语音机器人的对话策略构建方法。