CN115408526A - 一种客服机器人学习系统及学习方法 - Google Patents

一种客服机器人学习系统及学习方法 Download PDF

Info

Publication number
CN115408526A
CN115408526A CN202211342068.9A CN202211342068A CN115408526A CN 115408526 A CN115408526 A CN 115408526A CN 202211342068 A CN202211342068 A CN 202211342068A CN 115408526 A CN115408526 A CN 115408526A
Authority
CN
China
Prior art keywords
learning
classification
customer service
clustering
unidentified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211342068.9A
Other languages
English (en)
Inventor
李良
张小龙
冉亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Meiqia Network Technology Co ltd
Original Assignee
Chengdu Meiqia Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Meiqia Network Technology Co ltd filed Critical Chengdu Meiqia Network Technology Co ltd
Priority to CN202211342068.9A priority Critical patent/CN115408526A/zh
Publication of CN115408526A publication Critical patent/CN115408526A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种客服机器人学习系统及学习方法,属于机器人计算机系统技术领域,解决了现有技术中的难以对大量问题进行持续迭代学习的问题,本发明包括问题收集模块;自动聚类模块;学习管理模块。学习系统学习方法包括:A、问题收集:通过问题收集模块的收集,将问题自动添加到未识别问题库;B、问题自动聚类:问题收集模块以后台服务的形式,采用聚类Single‑Pass算法,自动对未识别问题做机器学习自动分类;C、系统学习管理:通过管理员操作学习管理模块。本发明用于客服机器人的自动化持续迭代学习,提高了学习效率。

Description

一种客服机器人学习系统及学习方法
技术领域
本发明属于机器人计算机系统技术领域,具体涉及一种客服机器人学习系统及学习方法。
背景技术
客服机器人作为一套自动对话系统,已逐渐成为很多企业售后环节的标配产品,它能够在一定程度上减轻客服人员的接待压力。对于客服机器人而言, 如何正确识别用户意图并给出合适的答案,始终是摆在面前的核心任务。而机器人识别率,正是其中最重要的衡量指标之一。当前工业界的机器人系统,需要依赖大量提前准备好的知识图谱(包括领域特定的知识), 实际接待中不可避免地会遇到识别不准/无法识别的问题。
因此,一个完善的客服机器人,需要一个对应的学习系统,以对一些识别不准/无法识别的常见问题进行学习。目前市面上常见的客服机器人,采用的学习机制比较原始:收集用户反馈上来的未识别/识别不准(不满意)的问题, 管理员进行归类并调整后将其再次添加到知识图谱。 对于此类系统而言,其应对识别率低情形时存在诸多问题:
(1)不能及时发现未识别/识别不准的情况,常常依赖于客户反馈;
(2)对未识别问题的学习不够及时,通常依赖于管理员后台手动配置/调整;
(3)管理员后台手动配置的方式难以应对大量的待学习任务;
通过以上问题不难发现: 现有的系统存在许多需要人为介入的操作, 严重缺乏自动化。 也难以实现对大量待学习问题的持续迭代学习, 随着后续业务的持续增长, 这些问题会进一步放大。
发明内容
本发明的目的在于:
为解决现有技术中的难以对大量问题进行持续迭代学习的问题,提供一种客服机器人学习系统及学习方法。
本发明采用的技术方案如下:
一种客服机器人学习系统,包括:
问题收集模块:用于知识图谱产生未识别问题时或者访客对识别不准或不符合期望的问题进行上报时, 将问题自动添加到未识别问题库;
自动聚类模块:用于以后台的形式提供服务,自动对未识别问题做机器学习自动分类, 形成分类整理后的结果;
学习管理模块:用于进行人机交互操作,人机交互操作包括搜索问题、查看问题列表、查看问题详情、忽略问题、批量操作和查看问题关联的历史对话。
一种客服机器人学习系统学习方法,包括如下步骤:
A、问题收集:通过问题收集模块的收集,当知识图谱产生未识别问题时或者访客对识别不准或不符合期望的问题进行上报时,将问题自动添加到未识别问题库;
B、问题自动聚类:问题收集模块以后台服务的形式,采用聚类Single-Pass 算法,自动对未识别问题做机器学习自动分类,将一个问题的多个相似问法分为一类,将零散的问题经过分类后呈现为较分类前更少的分类结果;
C、系统学习管理:通过管理员操作学习管理模块,对学习系统进行包括搜索问题、查看问题列表、查看问题详情、忽略问题、批量操作和查看问题关联的历史对话的操作,将无效问题忽略,将有效问题重新添加至知识图谱,实现对知识图谱的知识补充。
进一步地,所述步骤B中的聚类Single-Pass 算法包括如下步骤:
(1)以第一篇文档为种子,建立一个分类;
(2)将文档 D 向量化;
(3)将文档 D 与已有的所有分类均以single-link 策略做相似度计算,采用欧氏距离或余弦距离作为距离度量方法;
(4)找出与文档 D 具有最大相似度的已有分类;
(5)根据聚类的需求设置相似度阈值θ,阈值θ在[0,1]之间,阈值θ设置得越高,得到的簇粒度越小,簇内文本数量越少,簇的个数越多;相反地,阈值θ设置得越低,簇粒度越大,则簇内文本数量越多,簇的个数越少;
(6)若相似度值大于阈值θ,则把文档D加入到有最大相似度的分类中,跳转至步骤(8);
(7)若相似度值小于阈值θ,则文档D不属于任一已有分类,需创建新的分类,同时将当前文本归属到新创建的分类中;
(8)聚类结束,等待下一篇文档进入。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.通过机器学习自动聚类,对大量未识别问题进行分类,极大地提高了学习系统的自动化程度和学习效率。
2.自动聚类模块支持多算法架构,可以对不同行业的 SaaS 企业使用不同的分类算法。
3.学习管理模块功能丰富、界面友好,同时提供了生命周期管理,实现了更加智能的学习管理操作。
附图说明
图1为本发明学习系统结构图;
图2为本发明自动聚类流程图。
其中,Cn为第n个已存在分类;Sn为问题文本与分类Cn中心文本相似度。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
一种客服机器人学习系统,其结构图如图1所示,包括:
问题收集模块:用于知识图谱产生未识别问题时或者访客对识别不准或不符合期望的问题进行上报时, 将问题自动添加到未识别问题库;
自动聚类模块:用于以后台的形式提供服务,自动对未识别问题做机器学习自动分类, 形成分类整理后的结果,自动聚类的流程原理如图2所示,其算法处理过程为:
对每个待分类问题文本依次计算其与已存在分类的中心文本相似度;
如果最大相似度值为Sn且Sn超过某个阈值,则将该问题归入分类Cn;
如果最大相似度值为Sm但Sm小于阈值,将该问题独立成一个新分类;
其中,Cn为第n个已存在分类;Sn为问题文本与分类Cn中心文本相似度。
学习管理模块:用于进行人机交互操作,人机交互操作包括搜索问题、查看问题列表、查看问题详情、忽略问题、批量操作和查看问题关联的历史对话。
一种客服机器人学习系统学习方法,包括如下步骤:
A、问题收集:通过问题收集模块的收集,当知识图谱产生未识别问题时或者访客对识别不准或不符合期望的问题进行上报时,将问题自动添加到未识别问题库;
B、问题自动聚类:问题收集模块以后台服务的形式,采用聚类Single-Pass 算法,自动对未识别问题做机器学习自动分类,将一个问题的多个相似问法分为一类,将零散的问题经过分类后呈现为较分类前更少的分类结果;
C、系统学习管理:通过管理员操作学习管理模块,对学习系统进行包括搜索问题、查看问题列表、查看问题详情、忽略问题、批量操作和查看问题关联的历史对话的操作,将无效问题忽略,将有效问题重新添加至知识图谱,实现对知识图谱的知识补充。
本发明的系统从学习自动化、操作易用性等方面着手实现了更智能的问题收集系统,更自动化的待学习问题处理系统,能支撑业务持续增长的机器人学习系统。考虑到识别率问题将是一个长期迭代优化的过程,新的学习系统以组合多个部件的方式完成学习任务,可以做到后续使用更优的实现替代其中的某些部件。
进一步地,所述步骤B中的聚类Single-Pass 算法包括如下步骤:
(1)以第一篇文档为种子,建立一个分类;
(2)将文档 D 向量化;
(3)将文档 D 与已有的所有分类均以single-link 策略做相似度计算,采用欧氏距离或余弦距离作为距离度量方法;
(4)找出与文档 D 具有最大相似度的已有分类;
(5)根据聚类的需求设置相似度阈值θ,阈值θ在[0,1]之间,阈值θ设置得越高,得到的簇粒度越小,簇内文本数量越少,簇的个数越多;相反地,阈值θ设置得越低,簇粒度越大,则簇内文本数量越多,簇的个数越少;
(6)若相似度值大于阈值θ,则把文档D加入到有最大相似度的分类中,跳转至步骤(8);
(7)若相似度值小于阈值θ,则文档D不属于任一已有分类,需创建新的分类,同时将当前文本归属到新创建的分类中;
(8)聚类结束,等待下一篇文档进入。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种客服机器人学习系统,其特征在于,包括:
问题收集模块:用于知识图谱产生未识别问题时或者访客对识别不准或不符合期望的问题进行上报时, 将问题自动添加到未识别问题库;
自动聚类模块:用于以后台的形式提供服务,自动对未识别问题做机器学习自动分类,形成分类整理后的结果;
学习管理模块:用于进行人机交互操作,人机交互操作包括搜索问题、查看问题列表、查看问题详情、忽略问题、批量操作和查看问题关联的历史对话。
2.一种客服机器人学习系统学习方法,应用于如权利要求1中所述的客服机器人学习系统中,其特征在于,包括如下步骤:
A、问题收集:通过问题收集模块的收集,当知识图谱产生未识别问题时或者访客对识别不准或不符合期望的问题进行上报时,将问题自动添加到未识别问题库;
B、问题自动聚类:问题收集模块以后台服务的形式,采用聚类Single-Pass 算法,自动对未识别问题做机器学习自动分类,将一个问题的多个相似问法分为一类,将零散的问题经过分类后呈现为较分类前更少的分类结果;
C、系统学习管理:通过管理员操作学习管理模块,对学习系统进行包括搜索问题、查看问题列表、查看问题详情、忽略问题、批量操作和查看问题关联的历史对话的操作,将无效问题忽略,将有效问题重新添加至知识图谱,实现对知识图谱的知识补充。
3.根据权利要求2所述的一种客服机器人学习系统学习方法,其特征在于,所述步骤B中的聚类Single-Pass 算法包括如下步骤:
(1)以第一篇文档为种子,建立一个分类;
(2)将文档 D 向量化;
(3)将文档 D 与已有的所有分类均以single-link 策略做相似度计算,采用欧氏距离或余弦距离作为距离度量方法;
(4)找出与文档 D 具有最大相似度的已有分类;
(5)根据聚类的需求设置相似度阈值θ,阈值θ在[0,1]之间,阈值θ设置得越高,得到的簇粒度越小,簇内文本数量越少,簇的个数越多;相反地,阈值θ设置得越低,簇粒度越大,则簇内文本数量越多,簇的个数越少;
(6)若相似度值大于阈值θ,则把文档D加入到有最大相似度的分类中,跳转至步骤(8);
(7)若相似度值小于阈值θ,则文档D不属于任一已有分类,需创建新的分类,同时将当前文本归属到新创建的分类中;
(8)聚类结束,等待下一篇文档进入。
CN202211342068.9A 2022-10-31 2022-10-31 一种客服机器人学习系统及学习方法 Pending CN115408526A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211342068.9A CN115408526A (zh) 2022-10-31 2022-10-31 一种客服机器人学习系统及学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211342068.9A CN115408526A (zh) 2022-10-31 2022-10-31 一种客服机器人学习系统及学习方法

Publications (1)

Publication Number Publication Date
CN115408526A true CN115408526A (zh) 2022-11-29

Family

ID=84168140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211342068.9A Pending CN115408526A (zh) 2022-10-31 2022-10-31 一种客服机器人学习系统及学习方法

Country Status (1)

Country Link
CN (1) CN115408526A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679910A (zh) * 2015-03-25 2015-06-03 北京智齿博创科技有限公司 智能应答方法及系统
CN107908624A (zh) * 2017-12-12 2018-04-13 太原理工大学 一种基于全覆盖粒计算的K‑medoids文本聚类方法
CN112487186A (zh) * 2020-11-27 2021-03-12 上海浦东发展银行股份有限公司 一种人人对话日志分析方法、系统、设备及存储介质
CN113342946A (zh) * 2021-05-19 2021-09-03 北京百度网讯科技有限公司 客服机器人的模型训练方法、装置、电子设备及介质
CN114461763A (zh) * 2022-04-13 2022-05-10 南京众智维信息科技有限公司 一种基于突发词聚类的网络安全事件抽取方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679910A (zh) * 2015-03-25 2015-06-03 北京智齿博创科技有限公司 智能应答方法及系统
CN107908624A (zh) * 2017-12-12 2018-04-13 太原理工大学 一种基于全覆盖粒计算的K‑medoids文本聚类方法
CN112487186A (zh) * 2020-11-27 2021-03-12 上海浦东发展银行股份有限公司 一种人人对话日志分析方法、系统、设备及存储介质
CN113342946A (zh) * 2021-05-19 2021-09-03 北京百度网讯科技有限公司 客服机器人的模型训练方法、装置、电子设备及介质
CN114461763A (zh) * 2022-04-13 2022-05-10 南京众智维信息科技有限公司 一种基于突发词聚类的网络安全事件抽取方法

Similar Documents

Publication Publication Date Title
EP4020315A1 (en) Method, apparatus and system for determining label
CN112069310A (zh) 基于主动学习策略的文本分类方法及系统
CN110134719A (zh) 一种结构化数据敏感属性的识别与分类分级方法
CN108241925A (zh) 一种基于离群点检测的离散制造机械产品质量溯源方法
CN113484837A (zh) 一种面向电磁大数据的未知雷达辐射源智能识别方法
CN112990371B (zh) 一种基于特征扩增的无监督夜间图像分类方法
CN113723501A (zh) 一种病原微生物参考知识库的最大多样性聚类构建方法
CN115408526A (zh) 一种客服机器人学习系统及学习方法
CN108460119B (zh) 一种使用机器学习提升技术支持效率的系统
CN109523031B (zh) 一种用于深度分析的大数据智能机器学习系统
CN115731419A (zh) 一种基于智能判别算法的细胞生长状态判别方法及系统
CN116665390A (zh) 基于边缘计算及优化YOLOv5的火灾检测系统
CN110889309A (zh) 金融单据分类管理系统及方法
CN113888231A (zh) 一种基于人工智能的营销数据筛选分析系统
CN114372145A (zh) 一种基于知识图谱平台的运维资源动态分配的调度方法
CN112307671A (zh) 一种自适应不同大型设备仪器状态阈值的方法
CN111026745A (zh) 一种基于用户浏览轨迹推的大数据建模系统
CN117610891B (zh) 一种基于大数据的灵活用工接单与风险控制系统
CN117193509B (zh) 一种数据中心的节能控制管理方法及系统
CN117314356A (zh) 一种基于ai的企业信息化管理系统
Al_Mashhadani et al. Data mining management system optimization using swarm intelligence
CN112612888B (zh) 一种用于对文本文件进行智能聚类的方法及系统
CN117436809A (zh) 一种基于人工智能算法的办公信息管理系统
CN116503663A (zh) 一种基于大数据的分类识别方法及系统
CN114219502A (zh) 一种基于nlp的运营商工单智能处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20221129

RJ01 Rejection of invention patent application after publication