CN110162611B

CN110162611B - 一种智能客服应答方法及系统

Info

Publication number: CN110162611B
Application number: CN201910327536.7A
Authority: CN
Inventors: 龚雪飞; 周彬; 汤毅平; 杜柏圣
Original assignee: Suning Financial Technology Nanjing Co Ltd
Current assignee: Nanjing Xingyun Digital Technology Co Ltd
Priority date: 2019-04-23
Filing date: 2019-04-23
Publication date: 2021-03-26
Anticipated expiration: 2039-04-23
Also published as: CN110162611A

Abstract

本发明公开一种智能客服应答方法及系统，涉及智能客服技术领域，能够解决现有技术中依靠人工客服带来的应答效率低、用户体验不佳的问题。该方法包括：预处理客服历史聊天语句导出客服语料，通过对客服语料分词训练得到语言识别模型；通过对用户提问的语料进行意图识别匹配对应的业务模块，利用意图识别结果在业务模块对应的elasticsearch数据库进行检索分析，将输出的关联关键词答案汇总后构成预选数据集；将用户提问语料分词后形成的文本作为输入在预选数据集中进行elasticsearch检索输出候选关键词答案；将分词后关键词及候选关键词答案分别转化为词向量，同时使用WMD算法两两计算各分词后关键词与各候选关键词答案的相似度，并基于相似度值选择关键词答案应答用户。

Description

一种智能客服应答方法及系统

技术领域

本发明涉及智能客服技术领域，尤其涉及一种智能客服应答方法及系统。

背景技术

随着电商业务的快速发展，客服咨询量的迅速增加给平台的客服工作带来了不小的压力，特别是在“双十一”等重大购物节期间，仅仅通过人工客服系统已经不能满足业务的需求，同时也无法提供7*24小时不间断咨询服务，对于客户来说若不能及时得到准确的响应，将会导致用户体验不佳。

发明内容

本发明的目的在于提供一种智能客服应答方法及系统，能够解决现有技术中依靠人工客服产生的应答效率低、用户体验不佳的问题。

为了实现上述目的，本发明的一方面提供一种智能客服应答方法，包括：

步骤S1，预处理客服历史聊天语句导出客服语料，通过对客服语料分词训练得到语言识别模型，以及预设多个领域业务模块构建业务知识库，所述业务模块中存储有该领域知识数据的elasticsearch数据库，所述知识数据包括关键词答案、索引及对应检索字段；

步骤S3，预设问候关键字及对应答案构建问候场景知识库，当用户提问的语料通过语言识别模型分词后命中所述问候关键词，则从所述问候场景知识库中调取对应答案应答用户，当用户提问的语料通过语言识别模型分词后未命中所述问候关键词，执行步骤S4；

步骤S4，通过对用户提问的语料进行意图识别匹配对应的业务模块，同时利用意图识别结果在所述业务模块对应的elasticsearch数据库进行检索分析，将输出的关联关键词答案汇总后构成预选数据集；

步骤S5，将用户提问语料分词后形成的文本作为输入在预选数据集中进行elasticsearch检索输出候选关键词答案；

步骤S6，将分词后关键词及候选关键词答案分别转化为词向量，同时使用WMD算法两两计算各分词后关键词与各候选关键词答案的相似度，并基于相似度值选择关键词答案应答用户。

优选地，还包括：

步骤S2，设置人工应答和机器人应答两种客服模式，当用户主动选择人工应答时则自动分配人工客服，此时结束智能客服应答程序，当用户未选择人工应答时则自动启动机器人客服模式，继续执行如下步骤。

具体地，预处理客服历史聊天语句导出客服语料，通过对客服语料分词训练得到语言识别模型的方法包括：

从系统中调取多份客服历史聊天语句，分别对其编码处理和字符纯化处理后得到客服语料；

基于所述客服语料中词语的参数筛选关键词构建专用字典，所述参数包括词频、凝固度、熵中的一种或多种；

通过分词工具结合所述专用字典对所述客服语料分词，得到切好词的分词语料；

使用Glove模型、Word2vec模型或Elmo模型训练所述客服分词语料，得到语言识别模型。

可选地，所述业务模块领域包括售前咨询业务模块、售后服务业务模块、技术支持业务模块和金融知识业务模块中的一种或多种。

进一步地，通过对用户提问的语料进行意图识别匹配对应的业务模块，同时利用意图识别结果在所述业务模块对应的elasticsearch数据库进行检索分析，将输出的关联关键词答案汇总后构成预选数据集的方法包括：

将用户提问的语料进行字符纯化处理后进行意图识别，并根据意图识别结果匹配对应的业务模块；

基于意图识别结果在对应业务模块中的elasticsearch数据库中检索，汇总输出关联的关键词答案得到预选数据集。

进一步地，将分词后关键词及候选关键词答案分别转化为词向量，同时使用WMD算法两两计算各分词后关键词与各候选关键词答案的相似度，并基于相似度值选择关键词答案应答用户的方法包括：

对各分词后关键词及各候选关键词答案转化为词向量，同时分别将各分词后关键词的词向量与各候选关键词答案的词向量两两匹配；

基于两两匹配词向量的相似度值排序，顺序输出前n个关联的候选关键词答案供用户选择输出。

与现有技术相比，本发明提供的智能客服应答方法具有以下有益效果：

本发明提供的智能客服应答方法中，通过深度学习技术训练得到的语言识别模型能够对客户提问的语料准确分词以及精准的挖掘语料的语义特征，通过业务知识库的设置能够基于语义识别对用户提问的语料初步筛选，结合elasticsearch全文检索技术能够加快语义分析的检索性能，保证了检索结果的准确性，具体实现步骤为：当用户输入提问语料时，系统首先调用语言识别模型对提问语料分词提取出其中的关键词，并在该关键词命中了问候场景知识库时表明该提问语料为简单的常规问题，此时直接从问候场景知识库中调取对应的答案应答即可，从而在保证应答准确率的同时减轻了人工客服的服务工作量，当该关键词没有命中问候场景知识库时，此时说明问候场景知识库中不存在用户提问语料的答案，需进一步对用户提问语料执行智能语义识别，并根据识别结果结合elasticsearch全文检索技术输出候选关键词答案供用户选择，最终准确解答用户的提问。

可见，本发明提供了多种针对用户提问语料的应答方案，确保用户提问语料应答结果的准确性和实时性，在确保服务服务质量的同时减轻了人工客服的工作量，提高了用户体验。

本发明的另一方面提供一种智能客服应答系统，应用于上述技术方案的智能客服应答方法中，该系统包括：

模型训练单元1，用于预处理客服历史聊天语句导出客服语料，通过对客服语料分词训练得到语言识别模型，以及预设多个领域业务模块构建业务知识库，业务模块中存储有该领域知识数据的elasticsearch数据库，知识数据包括关键词答案、索引及对应检索字段；

问候场景单元3，用于预设问候关键字及对应答案构建问候场景知识库，当用户提问的语料通过语言识别模型分词后命中问候关键词，则从问候场景知识库中调取对应答案应答用户，当用户提问的语料通过语言识别模型分词后未命中问候关键词响应预筛选单元；

预筛选单元4，用于通过对用户提问的语料进行意图识别匹配对应的业务模块，同时利用意图识别结果在业务模块对应的elasticsearch数据库进行检索分析，将输出的关联关键词答案汇总后构成预选数据集；

答案候选单元5，将用户提问语料分词后形成的文本作为输入在预选数据集中进行elasticsearch检索输出候选关键词答案；

计算反馈单元6，用于将分词后关键词及候选关键词答案分别转化为词向量，同时使用WMD算法两两计算各分词后关键词与各候选关键词答案的相似度，并基于相似度值选择关键词答案应答用户。

较佳地，还包括：

客服模式单元2，用于设置人工应答和机器人应答两种客服模式，当用户主动选择人工应答时则自动分配人工客服，此时结束智能客服应答程序，当用户未选择人工应答时则自动相应机器人客服模式响应问候场景单元。

优选地，模型训练单元1包括：

语料处理模块，用于从系统中调取多份客服历史聊天语句，分别对其编码处理和字符纯化处理后得到客服语料；

专用字典模块，用于基于客服语料中词语的参数筛选关键词构建专用字典，参数包括词频、凝固度、熵中的一种或多种；

分词处理模块，用于通过分词工具结合专用字典对客服语料分词，得到切好词的分词语料；

模型训练模块，用于使用Glove模型、Word2vec模型或Elmo模型训练客服分词语料，得到语言识别模型。

优选地，计算反馈单元6包括：

词向量转化模块，用于对各分词后关键词及各候选关键词答案转化为词向量，同时分别将各分词后关键词的词向量与各候选关键词答案的词向量两两匹配；

选择输出模块，用于基于两两匹配词向量的相似度值排序，顺序输出前n个关联的候选关键词答案供用户选择输出。

与现有技术相比，本发明提供的智能客服应答系统的有益效果与上述技术方案提供的智能客服应答方法的有益效果相同，在此不做赘述。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明实施例一中智能客服应答方法的流程示意图；

图2为本发明实施例二中智能客服应答系统的结构框图。

附图标记：

1-模型训练单元， 2-客服模式单元；

3-问候场景单元， 4-预筛选单元；

5-答案候选单元， 6-计算反馈单元。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例，均属于本发明保护的范围。

实施例一

请参阅图1，本实施例提供一种智能客服应答方法，包括：

步骤S1，预处理客服历史聊天语句导出客服语料，通过对客服语料分词训练得到语言识别模型，以及预设多个领域业务模块构建业务知识库，业务模块中存储有该领域知识数据的elasticsearch数据库，知识数据包括关键词答案、索引及对应检索字段；步骤S3，预设问候关键字及对应答案构建问候场景知识库，当用户提问的语料通过语言识别模型分词后命中问候关键词，则从问候场景知识库中调取对应答案应答用户，当用户提问的语料通过语言识别模型分词后未命中问候关键词，执行步骤S4；步骤S4，通过对用户提问的语料进行意图识别匹配对应的业务模块，同时利用意图识别结果在业务模块对应的elasticsearch数据库进行检索分析，将输出的关联关键词答案汇总后构成预选数据集；步骤S5，将用户提问语料分词后形成的文本作为输入在预选数据集中进行elasticsearch检索输出候选关键词答案；步骤S6，将分词后关键词及候选关键词答案分别转化为词向量，同时使用WMD算法两两计算各分词后关键词与各候选关键词答案的相似度，并基于相似度值选择关键词答案应答用户。

本实施例提供的智能客服应答方法中，通过深度学习技术训练得到的语言识别模型能够对客户提问的语料准确分词以及精准的挖掘语料的语义特征，通过业务知识库的设置能够基于语义识别对用户提问的语料初步筛选，结合elasticsearch全文检索技术能够加快语义分析的检索性能，保证了检索结果的准确性，具体实现步骤为：当用户输入提问语料时，系统首先调用语言识别模型对提问语料分词提取出其中的关键词，并在该关键词命中了问候场景知识库时表明该提问语料为简单的常规问题，此时直接从问候场景知识库中调取对应的答案应答即可，从而在保证应答准确率的同时减轻了人工客服的服务工作量，当该关键词没有命中问候场景知识库时，此时说明问候场景知识库中不存在用户提问语料的答案，需进一步对用户提问语料执行智能语义识别，并根据识别结果结合elasticsearch全文检索技术输出候选关键词答案供用户选择，最终准确解答用户的提问。

可见，本实施例提供了多种针对用户提问语料的应答方案，确保用户提问语料应答结果的准确性和实时性，在确保服务服务质量的同时减轻了人工客服的工作量，提高了用户体验。

请继续参阅图1，考虑到用户可能会对机器人应答结果不满意，故基于上述实施例还包括：

本方法采取了人工客服和机器人客服协同的工作模式，其中有两种情况下会优先转接人工客服模式，第一种为当用户主动选择人工应答时则自动分配人工客服，第二种为当用户的提问语料必须由人工客服解答情况下则自动必须由人工客服解答情况下，例如，通过预先录入人工场景关键字及对应人工场景编号，当用户的提问语料分词后命中人工场景关键字，则按照对应的人工场景编号转人工客服，除上述两种情况外，用户所有的提问语料均采用机器人客服应答，综上，通过上述多种应答策略的设置能够将简单且常规的问题交由机器人客服处理，不仅提高了客服的应答效率而且还减轻了人工客服的压力。

具体地，上述实施例中预处理客服历史聊天语句导出客服语料，通过对客服语料分词训练得到语言识别模型的方法包括：

从系统中调取多份客服历史聊天语句，分别对其编码处理和字符纯化处理后得到客服语料；基于客服语料中词语的参数筛选关键词构建专用字典，参数包括词频、凝固度、熵中的一种或多种；通过分词工具结合专用字典对客服语料分词，得到切好词的分词语料；使用Glove模型、Word2vec模型或Elmo模型训练客服分词语料，得到语言识别模型。

具体实施时，首先对历史聊天语句进行标准化编码，如将历史聊天语句转成utf-8编码，然后对其字符纯化去除无关字符得到客服语料，接着，分别对客服语料中出现的词语进行参数化计算，其中，参数包括词频、凝固度、熵中的一种或多种，通过筛选参数值大于阈值的词语构建专用字典，然后再利用分词工具(如jieba分词工具)结合专用字典对客服语料分词，具体地分词策略为，首先将客服语料输入专用字典，筛选出专用字典中对应存储的词语，然后使用分词工具对剩余语段进行分词得到全部分词语料，最后使用Glove模型、Word2vec模型或Elmo模型训练客服分词语料，得到语言识别模型。通过采用上述两种相结合的分词模式，以提高分词结果的准确性。

示例性地，上述业务模块领域包括售前咨询业务模块、售后服务业务模块、技术支持业务模块和金融知识业务模块中的一种或多种。

可以理解的是，本实施例提供的智能客服应答方法优选无监督机器学习算法，以方便业务人员实时调整elasticsearch数据库内容，对热点内容做修正补充。

具体地，上述实施例中通过对用户提问的语料进行意图识别匹配对应的业务模块，同时利用意图识别结果在业务模块对应的elasticsearch数据库进行检索分析，将输出的关联关键词答案汇总后构成预选数据集的方法包括：

将用户提问的语料进行字符纯化处理后进行意图识别，并根据意图识别结果匹配对应的业务模块，其中，字符纯化处理的技术手段为现有技术中常用的方法，例如，依次对用户的提问语料进行纯化处理、标准化处理、切词处理和意图识别处理，具体过程在此不做赘述；将意图识别结果转化为检索字段在对应业务模块中的elasticsearch数据库中检索，汇总输出关联的关键词答案得到预选数据集，由于业务模块中预存储有专用业务知识库，当用户输入问题语料后会自动识别出一条意图，例如，当用户咨询购买基金的风险时，会自动匹配到金融知识业务模块，然后基于基金风险的意图识别结果在金融知识业务模块的elasticsearch数据库中检索，查找关于基金风险的关键词答案得到预选数据集，实现初步筛选，之后将用户提问语料利用语言识别模型分词，同时将分词后形成的文本作为输入在预选数据集中进行elasticsearch检索输出候选关键词答案，本实施例通过将elasticsearch全文检索技术与机器学习算法融合，提高了语义分析的准确性。需要说明的是，elasticsearch检索技术为现有技术，本实施在此不再对其赘述。

进一步地，上述实施例中将分词后关键词及候选关键词答案分别转化为词向量，同时使用WMD算法两两计算各分词后关键词与各候选关键词答案的相似度，并基于相似度值选择关键词答案应答用户的方法包括：

对各分词后关键词及各候选关键词答案转化为词向量，同时分别将各分词后关键词的词向量与各候选关键词答案的词向量两两匹配；基于两两匹配词向量的相似度值排序，顺序输出前n个关联的候选关键词答案供用户选择输出。

具体实施时，候选关键词答案的数量可通过后台自由设置，本实施例对此不做限制，而相似度值的计算方法可采用现有的tf-idf算法，通过将分词后的每个关键词与各候选关键词答案遍历计算，能够得到多个词向量相似度值，然后按照词向量相似度值结果大小将对应的候选关键词答案顺序排列输出，可见，本实施例通过将elasticsearch检索技术与机器学习模型相融合，匹配出最接近的关键词答案并形成返回列表一目了然的呈现给用户，由用户选择认为准确的问题答案输出，提高了用户的参与体验。

实施例二

请参阅图1和图2，本实施例提供一种智能客服应答系统，包括：

优选地，还包括：

优选地，模型训练单元1包括：

优选地，计算反馈单元6包括：

与现有技术相比，本发明实施例提供的智能客服应答系统的有益效果与上述实施例一提供的智能客服应答方法的有益效果相同，在此不做赘述。

本领域普通技术人员可以理解，实现上述发明方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，上述程序可以存储于计算机可读取存储介质中，该程序在执行时，包括上述实施例方法的各步骤，而的存储介质可以是：ROM/RAM、磁碟、光盘、存储卡等。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种智能客服应答方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，还包括：

步骤S2，设置人工应答和机器人应答两种客服模式，当用户主动选择人工应答时则自动分配人工客服，此时结束智能客服应答程序，当用户未选择人工应答时则自动启动机器人客服模式，继续执行步骤S3至步骤S6。

3.根据权利要求1所述的方法，其特征在于，预处理客服历史聊天语句导出客服语料，通过对客服语料分词训练得到语言识别模型的方法包括：

4.根据权利要求1所述的方法，其特征在于，所述业务模块领域包括售前咨询业务模块、售后服务业务模块、技术支持业务模块和金融知识业务模块中的一种或多种。

5.根据权利要求1所述的方法，其特征在于，通过对用户提问的语料进行意图识别匹配对应的业务模块，同时利用意图识别结果在所述业务模块对应的elasticsearch数据库进行检索分析，将输出的关联关键词答案汇总后构成预选数据集的方法包括：

6.根据权利要求1所述的方法，其特征在于，将分词后关键词及候选关键词答案分别转化为词向量，同时使用WMD算法两两计算各分词后关键词与各候选关键词答案的相似度，并基于相似度值选择关键词答案应答用户的方法包括：

7.一种智能客服应答系统，其特征在于，包括：

模型训练单元，用于预处理客服历史聊天语句导出客服语料，通过对客服语料分词训练得到语言识别模型，以及预设多个领域业务模块构建业务知识库，所述业务模块中存储有该领域知识数据的elasticsearch数据库，所述知识数据包括关键词答案、索引及对应检索字段；

问候场景单元，用于预设问候关键字及对应答案构建问候场景知识库，当用户提问的语料通过语言识别模型分词后命中所述问候关键词，则从所述问候场景知识库中调取对应答案应答用户，当用户提问的语料通过语言识别模型分词后未命中所述问候关键词响应预筛选单元；

预筛选单元，用于通过对用户提问的语料进行意图识别匹配对应的业务模块，同时利用意图识别结果在所述业务模块对应的elasticsearch数据库进行检索分析，将输出的关联关键词答案汇总后构成预选数据集；

答案候选单元，将用户提问语料分词后形成的文本作为输入在预选数据集中进行elasticsearch检索输出候选关键词答案；

计算反馈单元，用于将分词后关键词及候选关键词答案分别转化为词向量，同时使用WMD算法两两计算各分词后关键词与各候选关键词答案的相似度，并基于相似度值选择关键词答案应答用户。

8.根据权利要求7所述的系统，其特征在于，还包括：

客服模式单元，用于设置人工应答和机器人应答两种客服模式，当用户主动选择人工应答时则自动分配人工客服，此时结束智能客服应答程序，当用户未选择人工应答时则自动相应机器人客服模式响应问候场景单元。

9.根据权利要求7所述的系统，其特征在于，所述模型训练单元包括：

专用字典模块，用于基于所述客服语料中词语的参数筛选关键词构建专用字典，所述参数包括词频、凝固度、熵中的一种或多种；

分词处理模块，用于通过分词工具结合所述专用字典对所述客服语料分词，得到切好词的分词语料；

模型训练模块，用于使用Glove模型、Word2vec模型或Elmo模型训练所述客服分词语料，得到语言识别模型。

10.根据权利要求7所述的系统，其特征在于，所述计算反馈单元包括：