CN115470314A

CN115470314A - 一种基于真人对话语料的话术流程推荐方法和系统

Info

Publication number: CN115470314A
Application number: CN202211000498.2A
Authority: CN
Inventors: 吴宇; 肖龙源; 李海洲; 李稀敏; 李威
Original assignee: Xiamen Kuaishangtong Technology Co Ltd
Current assignee: Xiamen Kuaishangtong Technology Co Ltd
Priority date: 2022-08-19
Filing date: 2022-08-19
Publication date: 2022-12-13

Abstract

本发明提供一种基于真人对话语料的话术流程推荐方法，包括：获取历史多轮真人对话语料；提取用户角色、客服角色的语料，进行聚类，分析聚类结果并进行主题分类，得到主题分类标签、意图分类标签以及动作分类标签；根据历史多轮真人对话语料以及相应的主题分类、意图分类以及动作分类，统计得到意图‑动作映射表，各主题分类下不同动作的优质话术表以及主题下流程推荐表，共同组成映射模型；利用用户角色的语料和对应的主题分类标签训练主题分类识别模型、意图分类识别模型和动作分类识别模型，并组成话术流程推荐模型；将真人语料输入话术流程推荐模型中，推荐相应的话术流程；本发明即时动态地推荐对话的答疑、问诊话术，极大提升客服对话效率。

Description

一种基于真人对话语料的话术流程推荐方法和系统

技术领域

本发明涉及营销话术领域，特别是指一种基于真人对话语料的话术流程推荐方法和系统。

背景技术

智能营销客服技术中台为真人客服和机器人客服提供平台，基于这一平台进行营销活动，流量管理，智能机器人搭建等。真人客服和对话机器人可以在技术中台单独进行活动也可以进行角色切换。营销对话机器人的作用主要是代替真人进行营销活动，区别于普通机器人客服的是，营销机器人客服不仅仅是对常规问题进行回答，营销成功是机器人的目标，因此营销客服机器人还需具备主题识别、意图识别、信息抓取、流程判别、情感极性判别等功能。

当前主流的营销对话机器人核心算法为自然语言理解，框架为任务型对话，体现为一问一答的形式，依靠人工设置流程进行对话引导。对话推荐包括检索式和生成式。生成式对话推荐具有文本生成类问题的不可控性，文本的生成如同黑匣子一般，很难控制生成的语句的具体场景含义，如主题、动作等。在商业应用中，检索式对话推荐更具有可控性。但一般的检索式对话难以对流程进行控制，特别在特定营销领域，客服如何引导对话达成营销目的，是对话的重点和难点。

发明内容

本发明的主要目的在于克服现有技术中的上述缺陷，提出一种基于真人对话语料的话术流程推荐方法，为优化机器人提供应答话术和搭建流程，提高机器人维护效率，帮助提高营销机器人留联率。

本发明采用如下技术方案：

一种基于真人对话语料的话术流程推荐方法，包括：

获取历史多轮真人对话语料；

提取用户角色的语料，进行聚类，分析聚类结果并进行主题分类，得到主题分类标签；提取用户角色的语料，进行聚类，分析聚类结果并进行意图分类，得到意图分类标签，提取客服角色的语料，进行聚类，分析聚类结果并进行动作分类，得到动作分类标签；

根据历史多轮真人对话语料以及相应的主题分类、意图分类以及动作分类，统计得到意图-动作映射表，各主题分类下不同动作的优质话术表以及主题下流程推荐表，共同组成映射模型；

利用用户角色的语料和对应的主题分类标签训练主题分类识别模型，利用用户角色的语料和对应的意图分类标签训练意图分类识别模型，利用客服角色的语料和对应的动作分类标签训练动作分类识别模型，得到训练好的主题分类识别模型、训练好的意图分类识别模型和训练好的动作分类识别模型；

将主题分类识别模型、意图分类识别模型以及动作分类识别模型并联拼接，并与映射模型串联拼接，组成话术流程推荐模型；

将真人语料输入话术流程推荐模型中，推荐相应的话术流程。

具体地，获取多轮真人对话语料，具体包括：表示每次会话的唯一识别号，表示每轮对话的序号，角色身份和对话语句。

具体地，所述聚类方法包括但不限于：K-Means聚类、均值飘移聚类、基于密度的聚类方法、用高斯混合模型的最大期望聚类、凝聚层次聚类和图团体检测聚类。

具体地，主题分类标签包括但不限于双眼皮咨询、皮肤美白、牙齿美白，所述意图分类标签包括但不限于咨询价格、咨询手术方式、咨询疗程，所述动作分类标签包括但不限于确认咨询目的、费用介绍。

具体地，主题分类识别模型、意图分类识别模型和动作分类识别模型包括但不限于，卷积神经网络、长短记忆网络、bert模型、LSTM模型。

具体地，根据历史多轮真人对话语料以及相应的主题分类、意图分类以及动作分类，统计得到各主题分类下意图-动作映射表，不同动作的优质话术表以及流程推荐表；具体为：

各主题分类下意图-动作映射表：根据各个主题分类下，意图分类与动作分类相对应的关系表；

不同动作的优质话术表：各个动作分类下次数排名在设定范围的话术组成的关系表；

流程推荐表：各主题分类下，意图分类和动作分类出现的次数在设定范围内的次序表。

具体地，还包括：

实时获取并更新真人对话语料。

本发明实施例另一方面还提供一种基于真人对话语料的话术流程推荐系统，包括：

对话语料获取单元：获取历史多轮真人对话语料；

分类单元：提取用户角色的语料，进行聚类，分析聚类结果并进行主题分类，得到主题分类标签；提取用户角色的语料，进行聚类，分析聚类结果并进行意图分类，得到意图分类标签，提取客服角色的语料，进行聚类，分析聚类结果并进行动作分类，得到动作分类标签；

统计单元：根据历史多轮真人对话语料以及相应的主题分类、意图分类以及动作分类，统计得到意图-动作映射表，各主题分类下不同动作的优质话术表以及主题下流程推荐表，共同组成映射模型；

模型训练单元：利用用户角色的语料和对应的主题分类标签训练主题分类识别模型，利用用户角色的语料和对应的意图分类标签训练意图分类识别模型，利用客服角色的语料和对应的动作分类标签训练动作分类识别模型，得到训练好的主题分类识别模型、训练好的意图分类识别模型和训练好的动作分类识别模型；

话术流程推荐模型组成单元：将主题分类识别模型、意图分类识别模型以及动作分类识别模型并联拼接，并与映射模型串联拼接，组成话术流程推荐模型；

推荐单元：将真人语料输入话术流程推荐模型中，推荐相应的话术流程。

本发明再一实施例提供一种电子设备，包括：存储器，处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现上述一种基于真人对话语料的话术流程推荐方法步骤。

本发明又一实施例提供一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述一种基于真人对话语料的话术流程推荐方法步骤。

由上述对本发明的描述可知，与现有技术相比，本发明具有如下有益效果：

本发明提供一种基于真人对话语料的话术流程推荐方法，包括：获取历史多轮真人对话语料；提取用户角色的语料，进行聚类，分析聚类结果并进行主题分类，得到主题分类标签；提取用户角色的语料，进行聚类，分析聚类结果并进行意图分类，得到意图分类标签，提取客服角色的语料，进行聚类，分析聚类结果并进行动作分类，得到动作分类标签；根据历史多轮真人对话语料以及相应的主题分类、意图分类以及动作分类，统计得到意图-动作映射表，各主题分类下不同动作的优质话术表以及主题下流程推荐表，共同组成映射模型；利用用户角色的语料和对应的主题分类标签训练主题分类识别模型，利用用户角色的语料和对应的意图分类标签训练意图分类识别模型，利用客服角色的语料和对应的动作分类标签训练动作分类识别模型，得到训练好的主题分类识别模型、训练好的意图分类识别模型和训练好的动作分类识别模型；将主题分类识别模型、意图分类识别模型以及动作分类识别模型并联拼接，并与映射模型串联拼接，组成话术流程推荐模型；将真人语料输入话术流程推荐模型中，推荐相应的话术流程；本发明提供的方法，即时动态地推荐该轮对话的答疑话术和问诊话术，可以极大提升客服对话效率，也将经过大数据挖掘后的优质话术和优质流程推荐给客服，帮助客服改进在对话中的话术，也可以有效避免新手客服在对话过程中生涩等问题，帮助新手客服快速适应对话环境。

附图说明

图1为本发明实施例提供的一种基于真人对话语料的话术流程推荐方法的流程图；

图2为本发明实施例提供的话术流程推荐模型架构图；

图3为本发明实施例提供的一种基于真人对话语料的话术流程挖掘辅助系统架构图；

图4为本发明实施例提供的一种电子设备示意图；

图5为本发明实施例提供的一种计算机可读存储介质的实施例示意图。

以下结合附图和具体实施例对本发明作进一步详述。

具体实施方式

本发明提出的一种基于真人对话语料的话术流程推荐方法，即时动态地推荐该轮对话的答疑话术和问诊话术，可以极大提升客服对话效率，也将经过大数据挖掘后的优质话术和优质流程推荐给客服，帮助客服改进在对话中的话术，也可以有效避免新手客服在对话过程中生涩等问题，帮助新手客服快速适应对话环境。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上所述仅是本申请的具体实施方式，使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

如下结合具体的应用示例，对本申请实施例所提供的一种基于真人对话语料的话术流程推荐方法进行解释说明。该方法的执行主体可以是终端设备，例如手机、电脑、穿戴设备等，也可以是服务器，在此不作限制。

本发明可以应用于智能客服平台，智能营销客服saas技术中台集成了客服系统、外呼营销机器人系统、智能问答机器人系统和SCRM系统。其中客服系统为真人客服运营平台，不同领域、不同公司的商业客户基于这一平台进行营销活动，流量管理，咨询答疑等；

NLP对话系统是一种模仿人类对话过程，旨在现实中与真人形成连续流畅对话的计算机系统。对话系统根据场景可分为三种：任务型对话、问答型对话、开放与对话。在不同的场景领域，三种在内容上可能有交叉，如营销对话领域首先是任务型对话，目的是完成营销指标，但是在营销过程中需要进行咨询答疑。本发明首先应用于营销对话领域。

对话推荐系统作为一种真人对话辅助系统，目的是帮助真人客服提升沟通效率，帮助实现特定的商业目的。在每轮对话中，对话辅助系统会自动识别潜在客户发送的文本信息，经过NLU(自然语言理解)模块后，返回该轮对话客服“应该”回答和提问的话术。

如图1，为本发明实施例提供的一种基于真人对话语料的话术流程推荐方法的流程图，具体包括：

一种基于真人对话语料的话术流程推荐方法，包括：

S101：获取历史多轮真人对话语料；

首先获取多轮真人对话语料，语料包括对话session_id，sentence_id，role，sentence，其中，session_id表示每次会话的唯一识别号，sentence_id表示每轮对话的序号，role表示身份，这里主要是客服(server)及用户(client)两个身份，sentence为对话语句。

数据示列：

表1

S102：提取用户角色的语料，进行聚类，分析聚类结果并进行主题分类，得到主题分类标签，在该主题分类下提取客服角色的语料，进行聚类，分析聚类结果并进行动作分类，得到动作分类标签；

S1021：提取用户角色的语料，进行聚类，分析聚类结果并进行分析，得到主题分类标签，在此之前制定主题(topic)分类规范，Topic标签如：双眼皮咨询、皮肤美白、牙齿美白等。分别代表不同医美产品主题。标签示列如下：

双眼皮可以做吗？——双眼皮咨询

打水光针需要什么条件——水光针咨询

我想美白——美白；

S1021：提取用户角色的语料，进行聚类，分析聚类结果并进行分析，得到意图分类标签，所述意图分类标签包括但不限于咨询价格、咨询手术方式、咨询疗程；

S1023：提取客服角色的语料，进行聚类，分析聚类结果并进行分析，制定动作(action)分类规范，action标签如：确认咨询目的、费用介绍等。该分类模型用于判断客服动作类别属性，为优质流程挖掘和优质话术挖掘做准备。分类示列如下：

您是想要做双眼皮是吗？——确认咨询目的

您之前有就诊过吗？——询问就诊史

您的微信号是多少呢——询问联系方式

美白有多种方式，光子嫩肤、微针、水光针等，具体需要根据您的情况来看——治疗方式介绍

您今年多大了？——咨询年龄

具体的聚类方法，本发明实施例采用的基于密度的聚类方法，基于密度的聚类方法为现有技术，这里不再赘述，当然聚类方法也可以采用，K-Means聚类、均值飘移聚类、用高斯混合模型的最大期望聚类、凝聚层次聚类和图团体检测聚类等。

S103：根据历史多轮真人对话语料以及相应的主题分类、意图分类以及动作分类，统计得到意图-动作映射表，各主题分类下不同动作的优质话术表以及主题下流程推荐表，共同组成映射模型；

表2意图-动作映射表

分类统计不同主题下，每个客服动作action的出现位置以及对应的话术，即各主题分类下不同动作的优质话术表，根据各个动作分类下频率出现较多(比如前10)的话术组成的关系表，最终得到数据如下：

表3

分类统计不同主题下，每个客服动作action的出现位置以及对应的话术，例如，双眼皮主题下，“确认咨询目的”这一action最常出现的位置为{“1”：50，“2”：20，“3”：10，表示“确认咨询目的”在第一轮对话出现的频率为50，在第二轮出现的频率为20，在第三轮对话出现的频率为10。选取最常出现的频率，即第一轮，作为该action的最常见轮次，同理统计该主题下其他action最常见轮次和其他主题的不同action最常见轮次；最终得到各主题分类下，意图分类和动作分类出现的次数在设定范围内的次序表。

S104：利用用户角色的语料和对应的主题分类标签训练主题分类识别模型，利用用户角色的语料和对应的意图分类标签训练意图分类识别模型，利用客服角色的语料和对应的动作分类标签训练动作分类识别模型，得到训练好的主题分类识别模型、训练好的意图分类识别模型和训练好的动作分类识别模型；

在本发明实施例中，选择LSTM模型，具体训练步骤包括：

使用预训练模型进行文本特征提取；

搭建LSTM模型，并进行训练；

模型调优，获得泛化能力相对较高的模型。

S105：将主题分类识别模型、意图分类识别模型以及动作分类识别模型并联拼接，并与映射模型串联拼接，组成话术流程推荐模型；

如图2，为本发明实施例提供的话术流程推荐模型架构图，具体为将将主题分类识别模型、意图分类识别模型以及动作分类识别模型并联拼接，并与映射模型串联拼接。

S106：将真人语料输入话术流程推荐模型中，推荐相应的话术流程。

根据确定的主题类别，获取各动作分类出现的轮次以及动作分类下对应的话术，组成对话流程，进行推荐。

具体地，还包括：

实时获取并更新真人对话语料。

随着线上真人对话数据越来越多，日常需要分析对话日志，对机器人进行维护更新，基于真人对话数据的话术流程推荐可以依据最新的真人对话数据，给出最新的优质话术和优质流程，帮助周期性、持续性跟新维护机器人。

如图3，本发明实施例另一方面提供一种基于真人对话语料的话术流程推荐方法系统，包括：

对话语料获取单元301：获取历史多轮真人对话语料；

分类单元302：提取用户角色的语料，进行聚类，分析聚类结果并进行主题分类，得到主题分类标签；提取用户角色的语料，进行聚类，分析聚类结果并进行意图分类，得到意图分类标签，提取客服角色的语料，进行聚类，分析聚类结果并进行动作分类，得到动作分类标签；

统计单元303：根据历史多轮真人对话语料以及相应的主题分类、意图分类以及动作分类，统计得到意图-动作映射表，各主题分类下不同动作的优质话术表以及主题下流程推荐表，共同组成映射模型；

模型训练单元304：利用用户角色的语料和对应的主题分类标签训练主题分类识别模型，利用用户角色的语料和对应的意图分类标签训练意图分类识别模型，利用客服角色的语料和对应的动作分类标签训练动作分类识别模型，得到训练好的主题分类识别模型、训练好的意图分类识别模型和训练好的动作分类识别模型；

话术流程推荐模型组成单元305：将主题分类识别模型、意图分类识别模型以及动作分类识别模型并联拼接，并与映射模型串联拼接，组成话术流程推荐模型。

图4所示，本发明实施例提供了一种电子设备400，包括存储器410、处理器420及存储在存储器410上并可在处理器420上运行的计算机程序411，处理器420执行计算机程序411时实现本发明实施例提供的一种基于真人对话语料的话术流程推荐方法。

由于本实施例所介绍的电子设备为实施本发明实施例中所采用的设备，故而基于本发明实施例中所介绍的方法，本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式，所以在此对于该电子设备如何实现本发明实施例中的方法不再详细介绍，只要本领域所属技术人员实施本发明实施例中的方法所采用的设备，都属于本发明所欲保护的范围。

请参阅图5，图5为本发明实施例提供的一种计算机可读存储介质的实施例示意图。

如图5所示，本实施例提供了一种计算机可读存储介质500，其上存储有计算机程序511，该计算机程序511被处理器执行时实现本发明实施例提供的一种基于真人对话语料的话术流程推荐方法；

需要说明的是，在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详细描述的部分，可以参见其它实施例的相关描述。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

上述仅为本发明的具体实施方式，但本发明的设计构思并不局限于此，凡利用此构思对本发明进行非实质性的改动，均应属于侵犯本发明保护范围的行为。

Claims

1.一种基于真人对话语料的话术流程推荐方法，其特征在于，包括：

获取历史多轮真人对话语料；

2.根据权利要求1所述的一种基于真人对话语料的话术流程推荐方法，其特征在于，获取多轮真人对话语料，具体包括：表示每次会话的唯一识别号，表示每轮对话的序号，角色身份和对话语句。

3.根据权利要求1所述的一种基于真人对话语料的话术流程推荐方法，其特征在于，所述聚类方法包括但不限于：K-Means聚类、均值飘移聚类、基于密度的聚类方法、用高斯混合模型的最大期望聚类、凝聚层次聚类和图团体检测聚类。

4.根据权利要求1所述的一种基于真人对话语料的话术流程推荐方法，其特征在于，主题分类标签包括但不限于双眼皮咨询、皮肤美白、牙齿美白，所述意图分类标签包括但不限于咨询价格、咨询手术方式、咨询疗程，所述动作分类标签包括但不限于确认咨询目的、费用介绍。

5.根据权利要求1所述的一种基于真人对话语料的话术流程推荐方法，其特征在于，主题分类识别模型、意图分类识别模型和动作分类识别模型包括但不限于，卷积神经网络、长短记忆网络、bert模型、LSTM模型。

6.根据权利要求1所述的一种基于真人对话语料的话术流程推荐方法，其特征在于，根据历史多轮真人对话语料以及相应的主题分类、意图分类以及动作分类，统计得到各主题分类下意图-动作映射表，不同动作的优质话术表以及流程推荐表；具体为：

7.根据权利要求1所述的一种基于真人对话语料的话术流程推荐方法，其特征在于，还包括：

实时获取并更新真人对话语料。

8.一种基于真人对话语料的话术流程推荐系统，其特征在于，包括：

对话语料获取单元：获取历史多轮真人对话语料；

9.一种电子设备，其特征在于，包括：存储器，处理器及存储在所述存储器上并在所述处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现权利要求1至7任一所述的方法步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。