CN117591657B

CN117591657B - 一种基于ai的智能对话管理系统及方法

Info

Publication number: CN117591657B
Application number: CN202311778623.7A
Authority: CN
Inventors: 章飞; 朱丹丹
Original assignee: Suqian Lexiangzhitu Network Technology Co ltd
Current assignee: Suqian Lexiangzhitu Network Technology Co ltd
Priority date: 2023-12-22
Filing date: 2023-12-22
Publication date: 2024-05-07
Anticipated expiration: 2043-12-22
Also published as: CN117591657A

Abstract

本发明涉及智能客服技术领域，公开了一种基于AI的智能对话管理系统，包括：数据收集模块，收集智能客服的历史对话数据；数据处理模块，对历史对话数据进行数据处理获得备用数据；知识图谱构建模块，基于备用数据构建第一知识图谱；异常检测模块，将第一知识图谱输入异常检测模型，输出第一邻接矩阵；异常处理模块，根据第一邻接矩阵和第一知识图谱进行异常处理获得第二知识图谱；智能问答模块，将第二知识图谱存储在图数据库中，根据当前用户输入的问题文本通过图数据库提供的查询工具检索获得对应的实体返回给用户；本发明通过神经网络模型综合考虑了知识图谱的实体的关联关系，通过对知识图谱的信息融合来提高异常情况的检测精度。

Description

一种基于AI的智能对话管理系统及方法

技术领域

本发明涉及智能客服技术领域，更具体地说，它涉及一种基于AI的智能对话管理系统及方法。

背景技术

现有的智能客服通常是通过人工配置应答模板或者自动化构建知识图谱的方式来回答用户问题。

人工配置应答模板的方式是通过提取用户问题的关键词与应答模板的索引关键词进行相似度计算，将相似度最大的应答模板返回给用户；自动化构建知识图谱的方式是通过提取智能客服的历史对话数据，以历史的用户问题和客服回答作为知识图谱的实体或者通过提取用户问题和客服回答中的关键词作为知识图谱的实体，存在于同一会话或者同一对话轮次的实体之间存在连接关系，最后将当前的用户问题与知识图谱的用户问题进行相似度匹配作为客服回答。

然而无论是人工配置应答模板还是自动化构建知识图谱的过程中可能都存在异常情况，例如：人工配置应答模板时恶意填写不合法或者敏感词汇；自动化构建知识图谱时可能存在错误或者歧义的问答组合或者用户问题不存在对应的客服回答等异常情况。

现有的智能客服通过人工校验和设置校验规则可以快速检测应答模板是否存在异常，然而知识图谱数据量庞大、复杂度较高，单一的人工校验耗时耗力，单一的设置校验规则缺乏语义理解，导致对知识图谱的异常情况的检测精度较低，从而导致智能客服回答不准确，用户满意度下降。

发明内容

本发明提供一种基于AI的智能对话管理系统，解决相关技术中通过人工校验知识图谱耗时耗力和通过设置校验规则校验知识图谱缺乏语义理解，导致对知识图谱的异常情况的检测精度较低，智能客服回答不准确的技术问题。

本发明提供了一种基于AI的智能对话管理系统，包括：

数据收集模块，其用于收集智能客服的历史对话数据；

历史对话数据包括：用户问题数据和客服应答数据；

数据处理模块，其用于对历史对话数据进行数据处理获得备用数据；

知识图谱构建模块，其用于基于备用数据构建第一知识图谱；

第一知识图谱包括：实体、实体的属性值和实体的连接关系；

每个实体都分配有一个唯一的标识符；

实体的类型包括：文本类型、数值类型和布尔类型；

实体和实体的属性值通过提取备用数据生成；

实体的连接关系表示实体之间存在边；

异常检测模块，其用于将第一知识图谱输入异常检测模型，输出第一邻接矩阵；异常检测模型包括：第一隐藏层和第二隐藏层；

第一隐藏层输入第一知识图谱，输出第一矩阵；第一矩阵的行向量表示一个实体的更新属性值；

第二隐藏层输入第一矩阵，输出第一邻接矩阵；第一邻接矩阵的第i行的第j列的元素值表示第一知识图谱的第i个实体和第j个实体之间是否存在边，如果存在边则第一邻接矩阵的第i行的第j列的元素值赋值为1，否则赋值为0；

异常处理模块，其用于根据第一邻接矩阵和第一知识图谱进行异常处理获得第二知识图谱；第二知识图谱和第一知识图谱的表示相同；

智能问答模块，其用于将第二知识图谱存储在图数据库中，根据当前用户输入的问题文本通过图数据库提供的查询工具检索获得对应的实体返回给用户。

进一步地，对历史对话数据进行数据处理获得备用数据包括以下步骤：

步骤S301，文本预处理；通过自然语言处理工具去除历史对话数据中的特殊字符、标点符号和停用词；

步骤S302，敏感词处理；通过构建敏感词库识别历史对话数据中的敏感词，并将该敏感词直接删除作为脱敏处理，敏感词库中的敏感词汇通过人工添加设置；

步骤S303，去除存在缺失值的数据；当历史对话数据中的一条数据存在缺失值则直接去除该条数据；

步骤S304，文本纠错处理；通过文本纠错工具对历史对话数据进行文本纠错获得备用数据。

进一步地，实体的类型为文本类型的属性值通过词向量模型编码生成；实体的类型为数值类型的属性值通过实数编码表示；实体的类型为布尔类型的属性值通过整数编码表示。

进一步地，实体和实体的属性值根据智能客服的业务决定。

进一步地，知识图谱的构建包括以下步骤：

步骤S401，分词处理；通过中文分词工具将备用数据进行分词；

步骤S402，词性标注处理；通过词性标注工具对分词后的备用数据进行词性标注；

步骤S403，实体识别；通过实体识别工具对词性标注后的备用数据进行实体识别获得命名实体；

步骤S404，实体链接；将备用数据中的命名实体与知识图谱中的实体建立链接；

步骤S405，抽取实体的连接关系；通过抽取实体连接关系工具构建实体之间的边。

进一步地，第一隐藏层的计算公式包括：

第一矩阵P的计算公式如下：其中/>表示第u个实体的更新属性值，Pile_M表示将M个实体的更新属性值进行堆叠操作，M表示第一知识图谱的实体的总数量的值；

第u个实体的更新属性值的计算公式如下：

其中N_u表示第u个实体的邻居实体的集合，第u个实体的邻居实体表示与第u个实体存在边的实体，h_v表示第v个邻居实体的属性值，α_uv表示第u个实体与第v个邻居实体之间的归一化注意力系数，W表示权重参数，sigmoid表示sigmoid激活函数；

第u个实体与第v个邻居实体之间的归一化注意力分数α_uv的计算公式如下：

其中N_u表示第u个实体的邻居实体的集合，h_u、h_v和h_x分别表示第u个实体的属性值、第v个邻居实体的属性值和第x个邻居实体的属性值，β表示注意力权重参数，W表示权重参数，||表示拼接操作，T表示转置操作，exp表示取自然指数函数的幂运算，LeakyReLU表示LeakyReLU激活函数。

进一步地，第二隐藏层的计算公式如下：

Q＝sigmoid(P*P^T)，其中Q表示第一邻接矩阵，P表示第一矩阵，T表示转置操作，sigmoid表示sigmoid激活函数，第一矩阵的元素值大于等于0.5则赋值为1，否则赋值为0。

进一步地，用于训练异常检测模型的训练数据集中的训练样本对应的样本知识图谱和第二知识图谱的表示相同，即样本知识图谱不存在异常情况，异常检测模型在训练的过程中，通过学习实体之间的关联信息，并更新第一知识图谱以逼近样本知识图谱，第一知识图谱对应的第一邻接矩阵和样本知识图谱对应的样本邻接矩阵之间的差作为损失函数，用于反向传播更新异常检测模型的权重参数。

进一步地，提取第一邻接矩阵中元素值为0的实体，并将对应的第一知识图谱的实体删除获得第二知识图谱。

一种基于AI的智能对话管理方法，用于执行上述的一种实时客服云端数据管理系统，包括以下步骤：

步骤S501，收集智能客服的历史对话数据；

步骤S502，对历史对话数据进行数据处理获得备用数据；

步骤S503，基于备用数据构建第一知识图谱；

步骤S504，将第一知识图谱输入异常检测模型，输出第一邻接矩阵；

步骤S505，根据第一邻接矩阵和第一知识图谱进行异常处理获得第二知识图谱；

步骤S506，将第二知识图谱存储在图数据库中，根据当前用户输入的问题文本通过图数据库提供的查询工具检索获得对应的实体返回给用户。

本发明的有益效果在于：本发明通过神经网络模型综合考虑了知识图谱的实体的关联关系，实体的连接关系的关联程度通过归一化注意力系数表示，通过对知识图谱的信息融合来提高知识图谱的异常情况的检测精度。

附图说明

图1是本发明的一种基于AI的智能对话管理系统的模块图；

图2是本发明的异常检测模型的示意图；

图3是本发明的数据处理获得备用数据的流程图；

图4是本发明的知识图谱的构建的流程图；

图5是本发明的一种基于AI的智能对话管理方法的流程图。

图中：数据收集模块101、数据处理模块102、知识图谱构建模块103、异常检测模块104、异常处理模块105、智能问答模块106、异常检测模型200、第一隐藏层201、第二隐藏层202。

具体实施方式

现在将参考示例实施方式讨论本文描述的主题。应该理解，讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题，可以在不脱离本说明书内容的保护范围的情况下，对所讨论的元素的功能和排列进行改变。各个示例可以根据需要，省略、替代或者添加各种过程或组件。另外，相对一些示例所描述的特征在其他例子中也可以进行组合。

如图1-图5所示，一种基于AI的智能对话管理系统，包括：

数据收集模块101，其用于收集智能客服的历史对话数据；

历史对话数据包括：用户问题数据和客服应答数据；

数据处理模块102，其用于对历史对话数据进行数据处理获得备用数据；

知识图谱构建模块103，其用于基于备用数据构建第一知识图谱；

每个实体都分配有一个唯一的标识符；

实体的类型包括：文本类型、数值类型和布尔类型；

实体和实体的属性值通过提取备用数据生成；

实体的连接关系表示实体之间存在边；

异常检测模块104，其用于将第一知识图谱输入异常检测模型，输出第一邻接矩阵；

如图2所示，异常检测模型200包括：第一隐藏层201和第二隐藏层202；

异常处理模块105，其用于根据第一邻接矩阵和第一知识图谱进行异常处理获得第二知识图谱；

第二知识图谱和第一知识图谱的表示相同；

智能问答模块106，其用于将第二知识图谱存储在图数据库中，根据当前用户输入的问题文本通过图数据库提供的查询工具检索获得对应的实体返回给用户。

在本发明的一个实施例中，历史对话数据通过收集智能客服的日志文件和数据库文件获得；历史对话数据还可以包括相关业务领域的数据，例如：相关业务领域的文献、期刊等，可以通过爬虫工具来获得相关业务领域的数据，例如：Scrapy、Selenium、Jsoup等。

在本发明的一个实施例中，如图3所示，对历史对话数据进行数据处理获得备用数据包括以下步骤：

步骤S301，文本预处理；通过自然语言处理工具去除历史对话数据中的特殊字符、标点符号和停用词等；自然语言处理工具可以是NLTK、spaCy、OpenNLP等；

步骤S303，去除存在缺失值的数据；当历史对话数据中的一条数据存在缺失值则直接去除该条数据；例如：同一轮次的历史对话数据中，用户问题数据为：“请问A商品的价格是多少？”，客服应答数据为：“A商品的价格是”，很明显客服应答数据中缺失A商品的价格，那么直接去除该轮次的历史对话数据；

步骤S304，文本纠错处理；通过文本纠错工具对历史对话数据进行文本纠错获得备用数据；文本纠错工具可以是LanguageTool、Grammarly、HanLP等。

在本发明的一个实施例中，实体的类型为文本类型的属性值通过词向量模型编码生成，词向量模型可以是Word2Vec、GloVe、FastText等；实体的类型为数值类型的属性值通过实数编码表示；实体的类型为布尔类型的属性值通过整数编码表示。

在本发明的一个实施例中，实体和实体的属性值根据智能客服的业务决定。

例如：智能客服的业务为医疗行业，实体可以包括：疾病名称实体、症状实体、药物名称实体、价格实体等，那么对应的实体的属性值可以包括：疾病名称的词向量表示、症状的词向量表示、药物名称的词向量表示、价格的实数表示等。

例如：智能客服的业务为电商行业，实体可以包括：商品名称实体、订单实体、促销活动实体、支付类型实体等，那么对应的实体的属性值可以包括：商品名称的词向量表示、订单编号的实数表示、促销活动内容的词向量表示、支付类型的整数表示等。

在本发明的一个实施例中，实体的连接关系表示实体的从属关系；例如：智能客服的业务为医疗行业，B实体和C实体存在从属关系可以表示B实体对应的疾病名称包括C实体对应的症状；智能客服的业务为电商行业，D实体和E实体存在从属关系可以表示D实体对应的E商品包括C实体对应的商品标签。

在本发明的一个实施例中，如图4所示，知识图谱的构建包括以下步骤：

步骤S401，分词处理；通过中文分词工具将备用数据进行分词；中文分词工具可以是jieba、HanLP等；

步骤S402，词性标注处理；通过词性标注工具对分词后的备用数据进行词性标注；词性标注工具可以是HMM(隐马尔可夫模型)、CRF(条件随机场)、BiLSTM(双向长短时记忆网络模型)等；

步骤S403，实体识别；通过实体识别工具对词性标注后的备用数据进行实体识别获得命名实体；实体识别工具可以是NER(命名实体识别)、CRF(条件随机场)、RNN(循环神经网络模型)、Transformer模型等；

步骤S405，抽取实体的连接关系；通过抽取实体连接关系工具构建实体之间的边；抽取实体连接关系工具可以是OpenIE、spaCy等。

在本发明的一个实施例中，第一隐藏层的计算公式包括：

第一矩阵P的计算公式如下：

其中表示第u个实体的更新属性值，Pile_M表示将M个实体的更新属性值进行堆叠操作，M表示第一知识图谱的实体的总数量的值；

第u个实体的更新属性值的计算公式如下：

在本发明的一个实施例中，第二隐藏层的计算公式如下：

Q＝sigmoid(P*P^T)

其中Q表示第一邻接矩阵，P表示第一矩阵，T表示转置操作，sigmoid表示sigmoid激活函数，第一矩阵的元素值大于等于0.5则赋值为1，否则赋值为0。

在本发明的一个实施例中，用于训练异常检测模型的训练数据集中的训练样本对应的样本知识图谱和第二知识图谱的表示相同，即样本知识图谱不存在异常情况，异常检测模型在训练的过程中，通过学习实体之间的关联信息，并更新第一知识图谱以逼近样本知识图谱，第一知识图谱对应的第一邻接矩阵和样本知识图谱对应的样本邻接矩阵之间的差作为损失函数，用于反向传播更新异常检测模型的权重参数。

在本发明的一个实施例中，通过大量的训练数据集训练异常检测模型可以提高模型异常检测的精确度，但是由于对应的样本知识图谱复杂度较高，训练数据集难以构建，为了加快异常检测模型的收敛，可以通过迁移学习，即先通过与智能客服的业务相同或者类似的公开数据集上进行预训练，在此基础上进行参数微调；此外还可以通过图采样的方式(Mini-batch)进行训练，即将样本知识图谱划分为多个完整且不存在异常情况的子知识图谱，分开训练，逐步合并，减少单次训练的规模，从而加快异常检测模型的收敛。

在本发明的一个实施例中，提取第一邻接矩阵中元素值为0的实体，并将对应的第一知识图谱的实体删除获得第二知识图谱。

在本发明的一个实施例中，图数据库可以是Neo4j、Amazon Neptune、TigerGraph等，并通过图数据库提供的可视化界面或者命令行工具根据当前用户输入的问题文本检索获得对应的实体。

如图5所示，提供一种基于AI的智能对话管理方法，包括以下步骤：

步骤S501，收集智能客服的历史对话数据；

步骤S502，对历史对话数据进行数据处理获得备用数据；

步骤S503，基于备用数据构建第一知识图谱；

需要说明的是，本发明的智能客服的历史对话数据不限于只有文本格式，还可以包括音频格式和图片格式；通过语音转换文字工具将音频格式的历史对话数据转换为文本格式，语音转换文字工具可以是谷歌语音识别工具或者百度语音识别工具等；通过图片转换文字工具将图片格式的历史对话数据转换为文本格式，图片转换文字工具可以是百度OCR识别工具或者腾讯OCR识别工具等。

需要说明的是，本发明不排除人工客服的接入，并且用户呼叫人工客服的优先级最高，当用户输入的问题文本中包括人工客服时，则直接将该用户转接到人工客服，当没有空闲的人工客服，则提示该用户当前人工客服繁忙，并将该用户加入等待队列，等待队列按照先进先出(FIFO)的原则，即先进入等待队列的用户先被安排到空闲的人工客服。

上面对本实施例的实施例进行了描述，但是本实施例并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本实施例的启示下，还可做出很多形式，均属于本实施例的保护之内。

Claims

1.一种基于AI的智能对话管理系统，其特征在于，包括：

数据收集模块，其用于收集智能客服的历史对话数据；

历史对话数据包括：用户问题数据和客服应答数据；

每个实体都分配有一个唯一的标识符；

实体的类型包括：文本类型、数值类型和布尔类型；

实体和实体的属性值通过提取备用数据生成；

实体的连接关系表示实体之间存在边；

2.根据权利要求1所述的一种基于AI的智能对话管理系统，其特征在于，对历史对话数据进行数据处理获得备用数据包括以下步骤：

3.根据权利要求1所述的一种基于AI的智能对话管理系统，其特征在于，实体的类型为文本类型的属性值通过词向量模型编码生成；实体的类型为数值类型的属性值通过实数编码表示；实体的类型为布尔类型的属性值通过整数编码表示。

4.根据权利要求1所述的一种基于AI的智能对话管理系统，其特征在于，实体和实体的属性值根据智能客服的业务决定。

5.根据权利要求1所述的一种基于AI的智能对话管理系统，其特征在于，知识图谱的构建包括以下步骤：

6.根据权利要求1所述的一种基于AI的智能对话管理系统，其特征在于，第一隐藏层的计算公式包括：

第u个实体的更新属性值的计算公式如下：

7.根据权利要求1所述的一种基于AI的智能对话管理系统，其特征在于，第二隐藏层的计算公式如下：

8.根据权利要求1所述的一种基于AI的智能对话管理系统，其特征在于，用于训练异常检测模型的训练数据集中的训练样本对应的样本知识图谱和第二知识图谱的表示相同，即样本知识图谱不存在异常情况，异常检测模型在训练的过程中，通过学习实体之间的关联信息，并更新第一知识图谱以逼近样本知识图谱，第一知识图谱对应的第一邻接矩阵和样本知识图谱对应的样本邻接矩阵之间的差作为损失函数，用于反向传播更新异常检测模型的权重参数。

9.根据权利要求1所述的一种基于AI的智能对话管理系统，其特征在于，提取第一邻接矩阵中元素值为0的实体，并将对应的第一知识图谱的实体删除获得第二知识图谱。

10.根据权利要求1所述的一种基于AI的智能对话管理方法，其特征在于，其用于执行如权利要求1-9任一所述一种基于AI的智能对话管理系统，包括以下步骤：

步骤S501，收集智能客服的历史对话数据；

步骤S502，对历史对话数据进行数据处理获得备用数据；

步骤S503，基于备用数据构建第一知识图谱；