CN113256180B - 一种基于机器学习的客服工单信息智能动态加载方法和系统 - Google Patents

一种基于机器学习的客服工单信息智能动态加载方法和系统 Download PDF

Info

Publication number
CN113256180B
CN113256180B CN202110766483.6A CN202110766483A CN113256180B CN 113256180 B CN113256180 B CN 113256180B CN 202110766483 A CN202110766483 A CN 202110766483A CN 113256180 B CN113256180 B CN 113256180B
Authority
CN
China
Prior art keywords
service
information
data
customer
customer service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110766483.6A
Other languages
English (en)
Other versions
CN113256180A (zh
Inventor
张诗林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Real Intelligence Technology Co ltd
Original Assignee
Hangzhou Real Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Real Intelligence Technology Co ltd filed Critical Hangzhou Real Intelligence Technology Co ltd
Priority to CN202110766483.6A priority Critical patent/CN113256180B/zh
Publication of CN113256180A publication Critical patent/CN113256180A/zh
Application granted granted Critical
Publication of CN113256180B publication Critical patent/CN113256180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Educational Administration (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于机器学习的客服工单信息智能动态加载方法和系统,需预训练出场景分类算法模块和组件显示预测算法模块,通过场景分类算法模块预测出客户咨询的业务场景并按照置信度由高到低进行排序;在客户的真实场景确定之后,对客户涉及的所有业务进行特征构造,通过异常检测算法预测出可能存在异常的业务,并且进入通过组件显示预测算法模块预测出的与该业务场景和客户相关的组件动态展示界面,组件动态展示界面展示与该客户以及业务相关的信息组件,对预测出的信息组件中数值信息进行业务异常值分析,通过高斯分布异常值检测算法找出数据中可能存在的异常值,并给异常值进行标记以提醒客服人员此项数据可能存在异常。

Description

一种基于机器学习的客服工单信息智能动态加载方法和系统
技术领域
本发明涉及信息智能动态加载技术领域,特别涉及一种基于机器学习的客服工单信息智能动态加载方法和系统。
背景技术
随着机器学习等人工智能技术的发展,构建可学习的信息化系统逐渐成为了一种趋势。相对于传统的信息化系统,基于人工智能技术的系统通过机器学习算法进行决策,更加灵活地处理业务,可以极大的提升工作效率。在电信运营商以及电商领域需要大量的客服人员处理大量的业务工单,通过机器学习等人工智能技术对客服业务系统进行改造和优化对提升客服人员的工作效率,降低企业运营成本有着重要的价值。
在客服领域客服人员一般要先通过询问客户具体待办问题听取客户的疑问,然后根据客户反映的问题进入客服业务系统进行相关问题的查证确定问题来源;最后根据对查证信息的判断向用户做出解答或者进行相关业务的进一步处理。在信息查证的过程中往往会涉及业务系统的多个页面,传统业务系统中信息展示的方式是固定的。虽然页面信息在大的类别上进行了划分,但是在更细粒度的业务上客服人员往往需要通过鼠标调用多个页面的信息进行查证。多页面查证的方式存在大量的信息冗余,导致客服人员工作效率下降以及对客户造成不好的体验。本发明的目的就是通过使用机器学习技术提高客服人员信息查证的效率,进而降低企业运营成本。
现有的客服业务系统多采用B/S架构(即浏览器服务器架构),在B/S架构下工作界面只需通过浏览器接入,具体的业务逻辑放在远程服务器上进行实现,主要实现方式可以分为三层:表示层、业务逻辑层、数据访问层,现对三层内容进行具体描述:
1、表示层:用于控制浏览器中操作界面显示。在传统的客服业务系统中每个页面显示的内容由业务专家根据业务内容进行了初步的设计,页面布局和显示的内容是固定的。客服人员在针对具体客户问题进行信息查证的过程之中可能会涉及多个页面的信息,在对多个页面的信息进行分析之后对客户的问题进行处理,页面的跳转通过URL来实现。页面中每个模块的信息由业务逻辑层输出的相应接口提供。
2、业务逻辑层:整个客服业务系统的业务逻辑由该层实现,表示层显示的信息为业务逻辑层提供的接口信息。业务逻辑层由业务专家设计,涉及关键信息的查询、删除、更改、添加等逻辑,业务逻辑层的输出形式为接口,每个接口相对独立,为表示层提供需要显示的数据,以及根据表示层的操作向数据访问层提供数据更改等逻辑。
3、数据访问层:数据访问层根据业务逻辑层的需要直接对数据库进行操作,对数据库常见的操作有增加数据、删除数据、更新数据、查询数据。
进一步总结就是客服行业作为劳动密集型行业,其现有业务系统在信息查证与展示方面存在很大的智能化空间,在其页面信息展示方式、客服疑问点定位以及关键信息提示的问题上可以通过机器学习技术进行实现,通过运用机器学习技术可以提高客服人员的工作效率,降低企业的运营成本。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种基于机器学习的客服工单信息智能动态加载方法和系统。
针对现有技术的缺点,首先采用组件的形式封装业务系统页面中的每个模块,以方便针对不同的用户与不同的业务灵活的调用有效的信息组件进行展示,以电信业务场景为例:业务系统页面中显示个人流量信息的部分通常包括本月流量的总量、流量剩余情况、具体流量包名称等信息,可以通过前端技术将其封装成个人流量信息组件,当某用户涉及的业务有关流量信息时系统调用该组件进行展示,如用户涉及的业务与流量信息无关则不进行该组件的调用展示。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种基于机器学习的客服工单信息智能动态加载方法,需预训练出场景分类算法模块和组件显示预测算法模块,具体包括以下步骤:
步骤S1,对客服业务系统中的用户案例数据进行采集和打标,对采集的数据和打标结果进行数据解析并完成特征构造,预训练出场景分类算法模块和组件显示预测算法模块;
步骤S2,用户来电之后激活客服业务系统,通过场景分类算法模块预测出客户咨询的业务场景并按照置信度由高到低进行排序,由客服选择确定最终的业务场景;
步骤S3,当客服人员确定某个业务场景后,进入通过组件显示预测算法模块预测出的与该业务场景和客户相关的组件动态展示界面,组件动态展示界面展示与该客户以及业务相关的信息组件。
优选地,所述步骤S1中的数据采集与打标具体包括以下步骤:
通过开发采用数据采集助手的方式,通过在页面植入插件的方式进行打标,接待完客户之后在其具体的业务类型上进行勾选打标,就代表对该工单打上业务类型标签;
数据采集助手会根据时间先后顺序记录客服的操作轨迹并把客服业务系统中接口数据存储到数据库,并通过统计操作轨迹信息对每个客户每种业务涉及到客服业务系统中哪些接口进行打标。
优选地,所述步骤S1中的预训练算法模型通过采用构造的大量用户特征数据为模型预训练数据,标签采用打标的业务类型和客服业务系统中的接口,具体标签分别采用业务场景类别与客服处理此客户案例调用的信息接口名称,分别预训练出场景分类算法模块和组件显示预测算法模块。
优选地,所述步骤S2具体通过列出所有业务场景,根据场景分类算法模块预测的概率值进行排序,预测概率最高的场景排在最前面,并根据预测概率的大小依次递减。
优选地,所述步骤S2与步骤S3之间还包括:
在客户的真实场景确定之后,对客户涉及的所有业务进行特征构造,通过异常检测算法预测出可能存在异常的业务。
优选地,所述步骤S3中的组件显示预测算法模块的训练和预测为多标签任务,在新的客户到来时,通过多标签预测方式预测出对于信息查证有用的接口名称并展示各接口对应的组件。
优选地,所述方法还包括:
当客户的真实场景确定之后,对预测出的信息组件中数值信息进行业务异常值分析,通过高斯分布异常值检测算法找出数据中可能存在的异常值,并给异常值进行标记以提醒客服人员此项数据可能存在异常。
优选地,所述高斯分布异常值检测算法通过给定的数值信息,计算得到期望和方差以得到一个确定的高斯分布,通过交叉验证来确定一个阈值,对于新的数据值在高斯分布上计算出其概率值,若概率值小于阈值则数据判断为异常。
本发明的另外一个目的是提供一种基于机器学习的客服工单信息智能动态加载系统,用于执行上述客服工单信息智能动态加载方法,包括以下部分:
数据库,用于用户信息、业务等数据的存储;
DOA层,为系统中负责数据操作的部分,其与系统中业务逻辑进行隔离,只负责对数据增加、删除、更改、查询;
业务逻辑层,其由业务专家设计,涉及业务信息的查询、删除、更改、添加等逻辑,业务逻辑层的输出形式为接口;
特征工程,通过接口调用的形式获得业务逻辑层的输出的接口数据,对接口数据进行解析之后获得客户数值型特征、类别特征、NLP特征并对特征进行组合,为机器学习层的模型训练和预测提供数据;
机器学习层,其主要由业务场景分类算法模块、组件显示预测算法模块、异常检测模块三部分构成,分别负责客户所属业务场景预测、客户与其业务相关的显示组件预测、客服异常业务预测。
综上所述,本发明对比于现有技术的有益效果为:
客服行业属于典型劳动密集型产业,雇佣众多的客服人员给企业带来巨大的人力成本,提高客服人员的工作效率成为相关企业实施降本、增效的新的切入点。在传统客服业务系统中页面显示布局固定,在客服进行客户业务相关信息查证的过程中需要在多个页面中反复跳转极大的降低了工作效率,漫长的等待使得用户体验变差。本发明独创性的将机器学习技术与客服业务系统页面展示方式进行了结合。首先对原有业务系统中的页面信息以接口为单位进行了组件化封装,通过对业务系统中用户数据进行特征处理,通过机器学习算法预测客服来电咨询业务场景,业务场景确定后再通过算法预测客户在该业务下调用显示哪些组件可以满足信息查证的需求,通过这种方法避免客服在页面之间进行跳转。本发明进一步提供了异常业务预判功能和异常数据高亮显示功能辅助客服人员进行决策。本发明极大提高了客服人员的工作效率,为企业降低运营成本带来了可能。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1为实施例中不同客户的预测流程图;
图2为实施例中具体实施流程图;
图3为实施例的系统架构图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。说明书中的“实施例”或“实施方式”既可表示一个实施例或一种实施方式,也可表示一些实施例或一些实施方式的情况。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种基于机器学习的客服工单信息智能动态加载方法和系统。
需要说明的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面对本发明中所涉及的技术术语进行简单描述,以便相关人员更好的理解本方案。
支持向量机(support vector machines,SVM)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;SVM还包括核技巧,这使它成为实质上的非线性分类器。SVM的的学习策略就是间隔最大化,可形式化为一个求解凸二次规划的问题,也等价于正则化的合页损失函数的最小化问题。SVM的学习算法就是求解凸二次规划的最优化算法。
Xgboost是Boosting算法的其中一种,Boosting算法的思想是将许多弱分类器集成在一起,形成一个强分类器;因为Xgboost是一种提升树模型,所以它是将许多树模型集成在一起,形成一个很强的分类器。
独热编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效,即只有一位是1,其余都是零值。
深度学习算法DNN是指深度神经网络,其与RNN循环神经网络、CNN卷积神经网络的区别就是DNN特指全连接的神经元结构,并不包含卷积单元或是时间上的关联。
iForest异常检测算法是一个基于Ensemble的快速异常检测方法,具有线性时间复杂度和高精准度,是符合大数据处理要求的算法。其可以用于网络安全中的攻击检测,金融交易欺诈检测,疾病侦测,和噪声数据过滤等。
One-Class SVM是一种无监督算法,它学习用于新颖性(novelty)检测的决策函数:将新数据分类为与训练集相似或不同的数据。
一种基于机器学习的客服工单信息智能动态加载方法,需预训练出场景分类算法模块和组件显示预测算法模块,具体包括以下步骤:
步骤S1,对客服业务系统中的用户案例数据进行采集和打标,对采集的数据和打标结果进行数据解析并完成特征构造,预训练出场景分类算法模块和组件显示预测算法模块;
步骤S2,用户来电之后激活客服业务系统,通过场景分类算法模块预测出客户咨询的业务场景并按照置信度由高到低进行排序,由客服选择确定最终的业务场景;
步骤S3,当客服人员确定某个业务场景后,进入通过组件显示预测算法模块预测出的与该业务场景和客户相关的组件动态展示界面,组件动态展示界面展示与该客户以及业务相关的信息组件。
具体地,当客户来电激活业务系统,通过场景分类算法模块根据客户通话信息、业务信息等预测出客户咨询的业务场景,场景分类算法模块为机器学习分类算法,可为SVM、Xgboost等算法,并按照置信度由高到低进行排序。
当客服人员用鼠标确认某个业务场景后,进入与该业务场景和客户相关的组件动态展示界面,组件动态展示界面通过多标签分类算法的组件显示预测算法模块预测得出,组件动态展示界面展示与该客户以及业务相关的信息组件,这样避免了现有客服业务系统中客服人员需要在不同界面之间来回跳转以进行信息查证,提高接续的效率。
最后为了进一步提高查证信息的效率,通过异常检测算法检测什么业务导致了用户来电进行问题咨询,并根据每个组件的特点设置其与业务相关关键信息高亮显示。对于异常业务的检测可以辅助客服人员进行可疑点的判断,若异常点准确率很高,客服人员甚至不用查看任何信息组件就能判断什么原因导致可客户来电咨询。
参照图1所示,客服接待了A、B、C、D四位不同的客户,其中客户A、B两位客户涉及业务场景1,C、D两位客户涉及业务场景3。
在客户接入客服业务系统后激活场景分类算法模块,根据每位客户的特征信息预测出最可能符合的业务场景,并按照概率由高到低排序。系统预测出A、B两位客户最可能属于业务场景1,C、D两位客户最可能属于业务场景3,由于4位客户的不同,预测出业务场景的排序也不同。
客服人员点击确认业务场景进入信息组件显示界面,组件显示预测算法模块根据用户与业务信息预测出该用户在该业务场景下的应该显示的组件名称,并调用其进行展示。从图1中可以看出虽然A与B、C与D属于相同的业务场景,但是其显示的组件不完全相同,这是因为在组件预测中不仅有业务场景特征还有用户个人信息特征。
根据上述的步骤,本发明内容主要涉及训练数据的采集、机器学习特征工程、对于用户咨询的业务场景的预测、结合业务和不同用户动态显示信息组件、异常业务识别、组件中异常数值信息的检测几个部分,现对这几个部分进行具体介绍。
1、训练数据的采集
基于机器学习的方法需要大量的历史训练数据,本发明通过开发数据采集助手的方式对客服业务系统中的用户案例数据进行数据采集和打标。
数据采集助手通过在页面植入插件的方式进行打标,接待完客户之后在其具体的业务类型上进行勾选打标,当客服接待完一个客户后勾选对应客户咨询业务类别,就代表对该工单打上业务类型标签。
除此之外数据采集助手会根据时间先后顺序记录客服的操作轨迹并把业务系统中接口数据存储到数据库,由此可以根据统计操作轨迹信息对每个客户每种业务涉及到业务系统中哪些接口进行打标,也就是在传统工单系统中浏览了哪些页面。
所以本发明中对于数据的打标分为两种,第一种为每个用户电话咨询的业务类别打标,每个用户只有一个标签,比如流量超额使用业务场景、不知情定制了某个项业务场景等更多业务场景中的一种;第二种为针对某个用户,客服调用了哪几个页面的哪几个接口,由于每个客户的基本信息不同和具体业务场景不同导致一个样本可能会有多个接口。比如A客户咨询的流量超额使用业务下,客服调用了流量信息查询接口、月账单接口等,所以每个样本可能对应多标签。
2、机器学习特征工程
利用机器学习技术的关键就是构造特征,即以用户为中心构造精细的特征。对利用数据采集助手采集到的数据以及打标结果进行数据解析并构造特征。
数值型特征包括用户的当前话费、本月流量总量、流量超出数额等基础的数值特征,还要根据对业务的理解构造客服信息在不同月份之间变化的信息,比如相邻两个月之间有无业务变更的信息;类别特征包括:客户星级、客户归属地、客服套餐类型以及本月是否有业务优惠到期等,在类别特征处理过程中往往通过独热编码的形式对于出现的类别用“1”表示,未出现的类别用“0”表示;文本特征包括衡量业务优惠名称与业务的相似度。
本申请方案中机器学习特征工程包括如下步骤:
步骤11、数据清洗,去除接口返回的异常数据;步骤12、数值型特征提取;步骤13、类别特征哑编码;步骤14、NLP特征(文本特征)计算;步骤15、特征组合;步骤16、特征重要度分析。
3、对于用户咨询的业务场景的预测
当用户来电之后激活业务系统,本发明利用机器学习技术实现第一时间预测出用户来电咨询场景;具体体现方式为,在页面列出所有业务场景,根据预测的概率值进行排序,预测概率最高的场景排在最前面,并根据概率的大小依次递减。
在模型训练阶段使用的数据为构造的大量用户特征样本,其标签为业务场景类别,通过机器学习算法SVM、Xgboost和深度学习算法DNN对数据进行单标签业务场景分类模型的训练;当新的客服案例到来时对客户对疑问场景作出预测,预测输出为分别属于某个业务场景的概率,并在前端显示界面进行按照概率的大小的推荐,最终业务场景由客服点击确认,当模型效果好的情况下概率最大的推荐业务场景就是真正的业务场景。
4、结合业务和不同用户动态显示信息组件
当客服选定模型推荐的业务类别后进入组件展示页面,模型将根据用户的特点和业务场景显示,个性化选择合适的组件进行显示。
此功能模块训练数据为大量历史用户特征数据,标签为客服处理此客户案例调用的信息接口名称,在此场景下模型的训练和预测为多标签任务,在新的客户到来时,预测出对于信息查证有用的接口名称并展示各接口对应的组件。
5、异常业务识别
识别出可能存在的异常业务,辅助客服人员快速定位客户疑问点的原因。
综合考虑某项业务的多维度特征,比如:业务生效时间、业务截止时间、业务收费金额、业务是否有优惠活动、业务优惠生失效时间等;对用户所有业务进行如上机器学习特征工程的特征构造,通过iForest异常检测算法和One-Class-SVM异常检测算法预测出可能存在异常的业务。
6、组件中异常数值信息的检测
对于组件中显示的异常数值,组件会通过红色字体进行标记以提醒客服人员此项数值可能存在异常。
具体地,在给定n个月份的数值信息,计算得到期望和方差就得到了一个确定的高斯分布,通过交叉验证来确定一个阈值,对于新的数据值在高斯分布上计算出其概率值,若概率值小于阈值则数据判断为异常,若概率值大于阈值则判断为非异常数据。若异常数值对应某科目列表中的一个,则该科目在科目列表中考前排序。
基于上述发明内容设计,采用了机器学习技术改变了传统工单系统在接续的过程之中在多个页面之间跳转的弊端,并且给出用户业务异常预测以及相关异常信息高亮显示,辅助客服对用户业务作出判断,一个具体的实施流程可参照图2所示,包括以下步骤:
步骤21、当客服来电接入客服业务系统后,系统激活客服业务信息,调用服务端接口数据;
步骤22、对接口返回的Json格式的数据进行解析,将解析后的数据构造成可以用于机器学习学习和预测的样本数据;
步骤23、通过场景分类算法模块预测出用户来电咨询对应的具体业务场景,场景分类算法模块属于单标签预测模型,其应用支持向量机、梯度提升树、深度神经网络算法结果的融合输出本次来电咨询属于某项业务的概率,前端页面会按照概率大小顺序显示出所有业务场景,概率最大排在第一位即最有可能的业务场景,并由客服选择确定最终的业务场景;
步骤24、当客户的真实业务场景确定之后对客户涉及的所有业务进行异常业务的预测,其实现方式是对所有业务建立业务特征,通过异常检测算法iForest进行无监督预测出可能存在异常的业务;
步骤25、当客户真实业务场景确定之后,由组件显示预测算法模块预测出该客户在该场景下应该显示的功能组件,该组件显示预测算法模块使用用户特征样本数据,通过多标签预测方式预测出应该显示的组件的名称;
步骤26、对步骤25中预测出的组件的数据进行业务异常值分析,通过高斯分布异常值检测算法找出数据中可能存在的异常值,并给异常值以标记用后前端高亮显示;
步骤27、重新封装接口信息用于组件的数值显示;
步骤28、封装异常业务信息用于“异常业务提醒”组件的显示;
步骤29、最终生成根据不同用户不同业务场景的智能信息查证组件。
参照图3所示,本发明内容还提供一种基于机器学习的客服工单信息智能动态加载系统,用于执行上述客服工单信息智能动态加载方法,包括以下部分:
数据库,用于用户信息、业务等数据的存储;
DOA层,为系统中负责数据操作的部分,其与系统中业务逻辑进行隔离,只负责对数据增加、删除、更改、查询;
业务逻辑层,其由业务专家设计,涉及业务信息的查询、删除、更改、添加等逻辑,业务逻辑层的输出形式为接口;
特征工程,通过接口调用的形式获得业务逻辑层的输出的接口数据,对接口数据进行解析之后获得客户数值型特征、类别特征、NLP特征并对特征进行组合,为机器学习层的模型训练和预测提供数据;
机器学习层,其主要由业务场景分类算法模块、组件显示预测算法模块、异常检测模块三部分构成,分别负责客户所属业务场景预测、客户与其业务相关的显示组件预测、客服异常业务预测。
本发明内容的技术关键点在于:
本发明独创性的将机器学习技术与客服业务系统页面展示方式进行了结合,本发明将业务系统中各个模块封装成组件的形式,首先通过客服特征信息预测所属咨询业务场景,业务场景确定后进一步通过客户信息特征与业务场景特征预测显示哪些信息组件,并将这些组件在一个页面集中展示,通过此方式避免了客服人员在不同页面之间进行信息查证,从而提高工作效率。
本发明同时独创性的采用机器学习技术对客服咨询的可疑业务进行预测,对业务建立多维度特征信息,通过异常检测算法在客户接入系统的第一时间对可疑点做出判断,从而辅助客服人员进行决策。
以上所述仅是本发明的示范性实施方式,而非用于限制本发明的保护范围,本发明的保护范围由所附的权利要求确定。

Claims (4)

1.一种基于机器学习的客服工单信息智能动态加载方法,其特征在于,需预训练出场景分类算法模块和组件显示预测算法模块,具体包括以下步骤:
步骤S1,通过开发数据采集助手的方式对客服业务系统中的用户案例数据进行数据采集和打标,打标具体通过在页面植入插件的方式进行,接待完客户之后在其具体的业务类型上进行勾选打标,就代表对该工单打上业务类型标签;同时数据采集助手会根据时间先后顺序记录客服的操作轨迹并把客服业务系统中接口数据存储到数据库,并通过统计操作轨迹信息对每个客户每种业务涉及到客服业务系统中哪些接口进行打标;对采集的数据和打标结果进行数据解析并完成特征构造,预训练出场景分类算法模块和组件显示预测算法模块;
步骤S2,客户来电之后激活客服业务系统,通过场景分类算法模块根据客户通话信息和业务信息预测出客户咨询的业务场景,由客服选择确定最终的业务场景;
步骤S3,在客户的真实场景确定之后,对客户涉及的所有业务进行特征构造,通过异常检测算法进行无监督预测出存在异常的业务,并根据每个信息组件的特点设置其与业务相关的关键信息高亮显示;
步骤S4,进入通过组件显示预测算法模块预测出的与该业务场景和用户相关的组件动态展示界面,组件动态展示界面展示与该用户以及业务相关的信息组件,相关的信息组件会高亮显示步骤S3检测出存在异常的业务的关键信息;
步骤S5,对预测出的信息组件中数值信息进行业务异常值分析,通过高斯分布异常值检测算法找出数据中存在的异常值,并给异常值进行标记在组件动态展示界面展示以提醒客服人员此项数据存在异常,并将对应异常值的业务信息靠前排序。
2.根据权利要求1所述的一种基于机器学习的客服工单信息智能动态加载方法,其特征在于,所述步骤S2具体通过列出所有业务场景,根据场景分类算法模块预测的概率值进行排序,预测概率最高的场景排在最前面,并根据预测概率的大小依次递减。
3.根据权利要求1所述的一种基于机器学习的客服工单信息智能动态加载方法,其特征在于,所述高斯分布异常值检测算法通过给定的数值信息,计算得到期望和方差以得到一个确定的高斯分布,通过交叉验证来确定一个阈值,对于新的数据值在高斯分布上计算出其概率值,若概率值小于阈值则数据判断为异常。
4.一种基于机器学习的客服工单信息智能动态加载系统,用于执行如权利要求1所述的客服工单信息智能动态加载方法,其特征在于,包括以下部分:
数据库,用于用户信息、业务数据的存储;
DOA层,为系统中负责数据操作的部分,其与系统中业务逻辑进行隔离,只负责对数据增加、删除、更改、查询;
业务逻辑层,其由业务专家设计,涉及业务信息的查询、删除、更改、添加的逻辑,业务逻辑层的输出形式为接口;
特征工程,通过接口调用的形式获得业务逻辑层的输出的接口数据,对接口数据进行解析之后获得客户数值型特征、类别特征、NLP特征并对特征进行组合,为机器学习层的模型训练和预测提供数据;
机器学习层,其主要由业务场景分类算法模块、组件显示预测算法模块、异常检测模块三部分构成,分别负责客户所属业务场景预测、客户与其业务相关的显示组件预测、客服异常业务预测。
CN202110766483.6A 2021-07-07 2021-07-07 一种基于机器学习的客服工单信息智能动态加载方法和系统 Active CN113256180B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110766483.6A CN113256180B (zh) 2021-07-07 2021-07-07 一种基于机器学习的客服工单信息智能动态加载方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110766483.6A CN113256180B (zh) 2021-07-07 2021-07-07 一种基于机器学习的客服工单信息智能动态加载方法和系统

Publications (2)

Publication Number Publication Date
CN113256180A CN113256180A (zh) 2021-08-13
CN113256180B true CN113256180B (zh) 2022-05-27

Family

ID=77191050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110766483.6A Active CN113256180B (zh) 2021-07-07 2021-07-07 一种基于机器学习的客服工单信息智能动态加载方法和系统

Country Status (1)

Country Link
CN (1) CN113256180B (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108958714B (zh) * 2018-07-02 2021-08-24 平安科技(深圳)有限公司 业务组件式开发方法、装置、计算机设备及存储介质
CN110968767B (zh) * 2018-09-28 2023-03-31 北京嘀嘀无限科技发展有限公司 排序引擎训练方法及装置、业务卡排序方法及装置
CN109343995A (zh) * 2018-10-25 2019-02-15 金税信息技术服务股份有限公司 基于多源异构数据融合、机器学习及客服机器人的智能运维分析系统
CN109783170A (zh) * 2018-12-27 2019-05-21 北京奇安信科技有限公司 业务场景拼装方法、装置、电子设备及存储介质
CN111401041A (zh) * 2020-03-23 2020-07-10 北京奇艺世纪科技有限公司 一种问题预测方法、装置、电子设备及存储介质
CN112231452A (zh) * 2020-10-12 2021-01-15 平安信托有限责任公司 基于自然语言处理的问答方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN113256180A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
CN103294592B (zh) 利用用户工具交互来自动分析其服务交付中的缺陷的方法与系统
AU2019261735A1 (en) System and method for recommending automation solutions for technology infrastructure issues
US11403712B2 (en) Methods and systems for injury segment determination
CN108984775B (zh) 一种基于商品评论的舆情监控方法及系统
US20220291966A1 (en) Systems and methods for process mining using unsupervised learning and for automating orchestration of workflows
CN112085281B (zh) 检测业务预测模型安全性的方法及装置
CN112288279A (zh) 基于自然语言处理和线性回归的业务风险评估方法和装置
CN113705909A (zh) 基于预测模型的风险等级预测方法、装置与存储介质
WO2021024145A1 (en) Systems and methods for process mining using unsupervised learning and for automating orchestration of workflows
CN115545886A (zh) 逾期风险识别方法、装置、设备及存储介质
Ohata et al. A text classification methodology to assist a large technical support system
CN113593692A (zh) 基于大数据智慧医疗的数据处理方法和云计算服务器
CN113256180B (zh) 一种基于机器学习的客服工单信息智能动态加载方法和系统
CN111143558B (zh) 基于单个分层多任务模型的消息识别方法和系统
Bodinga et al. On The Analysis of Customer Engagements with A Telecommunication Company in Sokoto-North western Nigeria Using Machine Learning Techniques
CN115203382A (zh) 业务问题场景识别方法、装置、电子设备及存储介质
CN113468203A (zh) 基于循环神经网络与注意力机制的金融用户画像方法
CN110795941B (zh) 一种基于外部知识的命名实体识别方法、系统及电子设备
US20220284988A1 (en) Predictive engine maintenance apparatuses, methods, systems and techniques
Boka Predicting Fake Job Posts Using Machine Learning Models
Özbaltan APPLYING MACHINE LEARNING TO AUDIT DATA: ENHANCING FRAUD DETECTION, RISK ASSESSMENT AND AUDIT EFFICIENCY
Kasztelnik et al. Financial Statement Fraud Detection in the Digital Age.
Chelly et al. Oussama Chelly and Hendrik Blockeel 10 Industry examples where different AI techniques are combined
Banka et al. Securing Fintech: A Machine Learning Approach for Credit Card Fraud Detection
Aggarwal et al. Customer Churn Prediction in the Telecom Sector

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant