CN106600298B - 基于工单数据分析的电力信息系统客服知识库构建方法 - Google Patents
基于工单数据分析的电力信息系统客服知识库构建方法 Download PDFInfo
- Publication number
- CN106600298B CN106600298B CN201611208017.1A CN201611208017A CN106600298B CN 106600298 B CN106600298 B CN 106600298B CN 201611208017 A CN201611208017 A CN 201611208017A CN 106600298 B CN106600298 B CN 106600298B
- Authority
- CN
- China
- Prior art keywords
- work order
- vocabulary
- knowledge
- service
- customer service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000007405 data analysis Methods 0.000 title claims abstract description 11
- 238000009411 base construction Methods 0.000 title description 2
- 238000004458 analytical method Methods 0.000 claims description 86
- 230000011218 segmentation Effects 0.000 claims description 51
- 238000006243 chemical reaction Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 20
- 238000001914 filtration Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000010219 correlation analysis Methods 0.000 claims description 9
- 238000010223 real-time analysis Methods 0.000 claims description 7
- 230000000977 initiatory effect Effects 0.000 claims description 5
- 230000001502 supplementing effect Effects 0.000 claims description 4
- 238000012423 maintenance Methods 0.000 claims description 3
- 230000001960 triggered effect Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/015—Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
- G06Q30/016—After-sales
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
Abstract
本发明公开了一种基于工单数据分析的电力信息系统客服知识库构建方法,基于客服工单为数据来源建立电力信息系统客服知识库,并将历史客服经验数据转化为专家知识来实现用户问题的自助在线解答,其通过工单分词、知识转化和知识重用来建立电力信息系统客服知识库。本发明以电力信息系统客服工单为数据源,通过构建电力信息系统客服知识库,将历史客服经验数据转化为专家知识,支持用户在线自主咨询和解决问题,实现了用户问题的自助在线解答功能,提高了客服效率,降低了在线客服工作量。
Description
技术领域
本发明涉及一种电力信息系统知识库构建方法,具体地说是一种基于工单数据分析的电力信息系统客服知识库构建方法,属于电力信息系统人工智能技术领域。
背景技术
随着电力行业信息化建设的逐步深入,电力企业各级单位、各业务领域基本实现信息化全覆盖,电力信息系统的运行支持和服务质量也更加受到重视,围绕电力信息系统的深入细致的客户服务和在线支持也将成为今后的重点工作。因此,对电力信息系统客服工单进行分析计算,发现用户在使用系统时提出的问题、建议、意见的分布情况,构建电力信息系统客服知识库,支持用户在线自主咨询和解决问题,提高客服效率,降低在线客服工作量,具有重要意义。
目前,电力信息系统客服以电话客服为主,电话客服受坐席数量、工作时间、客服人员能力和经验等因素限制,电话客服在实际工作中还存在以下局限性和不足:
(1)坐席数量有限,可能导致咨询用户长时间等待。
(2)电话客服一般在工作时间提供服务,非工作时间无法为用户提供服务。
(3)对于一些复杂问题,电话客服专责不能在线解决,需要通过将问题提交给相关专责,然后进行再对用户回访答复。
(4)电话客服专责所拥有的对各个信息系统客服经验,不能有效转化为知识,不能在尽可能大的范围共享,对内容重复或类似的电话咨询,需要耐心反复解答处理,效率低效果差。
发明内容
针对上述不足,本发明提供了一种基于工单数据分析的电力信息系统客服知识库构建方法,其能够实现对历史和当前电话咨询解答处理经验的知识转化,支持用户咨询问题的自助在线解答。
本发明解决其技术问题所采取的技术方案是:基于工单数据分析的电力信息系统客服知识库构建方法,其特征是,基于客服工单为数据来源建立电力信息系统客服知识库,并将历史客服经验数据转化为专家知识来实现用户问题的自助在线解答。
进一步地,建立电力信息系统客服知识库的过程包括以下过程:
工单分词,以客服工单为数据来源,对采集的工单文件进行文本转换,按域保存到工单源库,在对工单文本进行分词处理,过滤无效词汇,形成词汇列表,同时更新电力信息系统客服知识库中的词汇列表;
知识转化,利用多种相似性分析算法对词汇列表进行相似性分析,并将分析结果做必要规整,形成知识条目,保存到电力信息系统客服知识库;
知识重用,响应用户的查询请求,对查询条件进行分词、匹配和相关性分析,将满足匹配要求的结果返回给用户,如果没有合适的匹配结果,则可发起即时分析,直接从工单源库分析获得满足要求的结果。
进一步地,所述工单分词的过程包括以下步骤:
(1)工单分词处理流程以工单采集为起点,来自客服系统的工单文件实时或批量提交给本模块,触发工单文件进行自动转文本处理;所述工单文本包括以下文本域:工单编号、工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、当前环节、职位、办公区域、房间号、申请人、手机号码、申请人部门、申请人单位、联系人、来电号码、受理人、工单标签、紧急程度、影响范围、工单来源、运维组、处理人、解决方案、是否回访、回访成功标志、创建开始时间、创建结束时间、处理开始时间、处理结束时间、回访开始时间、回访结束时间、预警超期状态、工单状态、工单类型、满意度和客户意见;
(2)以工单为单位,对工单数据进行分词处理;
(3)对转化为文本的工单数据,按工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签和解决方案文本域进行分组,并保存到工单源库中,所述工单源库是基于hadoop的hdfs库,方便知识转化时采用spark任务进行分析和计算;
(4)对工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签和解决方案文本域分别进行域分词处理,采用基于字符串匹配的分词方法分别对各分组的内容进行词汇切分;
(5)根据无效词汇表进行无效词汇过滤,过滤掉无效词汇和敏感词汇;
(6)将有效词汇与知识库中词汇表进行比对,将新词汇加入到知识库的词汇列表,对已有词汇进行累加其出现的频次。
进一步地,所述知识转化过程为对词汇进行实时分析或者即时分析来对用户咨询信息的知识转化,从而形成支持自助在线客服的知识库。
进一步地,所述对词汇进行实时分析的过程为对工单分词后形成的词汇列表进行实时分析来执行知识转化的过程,它包括以下具体步骤:
(1)对词汇列表中的每个词分别进行按词按域分析;
(2)获得词汇列表中的一个词,采用Jaccard相似性系数算法、欧几里得算法、编辑距离算法和余弦相似度算法分别按工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签和解决方案文本域进行相似性分析,分析的数据源为本次追加到工单源库中的新工单数据;
(3)对步骤(2)的相似性分析结果进行规整,按照词汇列表的条目建立电力信息系统客服知识库中的知识条目,建立知识条目的过程为以每条词汇为基准,建立词汇在新增工单数据每个文本域上的权重值记录,每个工单数据在知识条目中以工单标号代表,罗列每种相似度算法的计算分析获得权重值;
(4)对规整后分析结果形成的知识条目进行新知识记录,根据知识库中该词汇的知识记录情况,如果没有该词汇则新增该词汇所有知识条目到电力信息系统客服知识库中;如果已存在该词汇,则补充在新工单上分析计算所获得的新知识条目到电力信息系统客服知识库中。
进一步地,所述对词汇进行即时分析的过程为当用户查询搜索没有获得合适的查询结果,则启动即时分析来执行知识转化的过程,它包括以下步骤:
(1)根据用户通过自助在线客服录入的查询条件,当电力信息系统客服知识库中没有与查询条件匹配的知识条目时,开始启动即时分析流程;
(2)获得用户输入的查询条件,对查询条件文本进行分词,形成条件词汇列表,对条件词汇列表中的每个词分别进行按词按域分析;
(3)获得的条件词汇列表中的一个词,采用Jaccard相似性系数算法、欧几里得算法、编辑距离算法和余弦相似度算法分别按工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签和解决方案文本域进行相似性分析,分析的数据源为本次追加到新增工单源库中的新工单数据,最终获得条件词汇列表中的每个词汇对每个域在新增工单源库上的相似度分析结果;
(4)对步骤(3)的相似性分析结果进行规整,按照条件词汇列表的条目建立电力信息系统客服知识库中的知识条目,建立知识条目的过程为以每条词汇为基准,建立词汇在新增工单数据每个域上的权重值记录,每个工单数据在知识条目中以工单标号代表,罗列每种相似度算法的计算分析获得权重值;
(5)对规整后分析结果形成的知识条目进行新知识记录,根据知识库中该词汇的知识记录情况,如果没有该词汇则新增该词汇所有知识条目到电力信息系统客服知识库中;如果已存在该词汇,则补充在新工单上分析计算所获得的新知识条目到电力信息系统客服知识库中。
进一步地,所述知识重用的过程包括以下步骤:
(1)获取用户通过自助在线客服在终端界面提交查询条件信息;
(2)将查询条件转化为文本,并做分词处理,采用基于字符串的分词算法进行词切分,形成条件词汇列表;
(3)对获得的条件词汇列表中的每个词汇到知识库中查询可匹配的知识记录,如果有匹配的知识记录,则进入下一步骤;如果没有匹配的记录存在,则发起对词汇进行即时分析的知识转化流程;
(4)根据获得的条件词汇列表每个词汇匹配的知识记录,进行条件词汇与匹配知识记录的相关性分析;对于条件词汇列表中的每一个词汇采用式(1)进行相关性分析:
K(m,n)=Max(Ri,Fj,Ac) (1)
K代表该词汇与工单内容的相关性有效值,m表示当前词汇,n表示该词汇的一个相关性;
R代表工单记录,i表示工单编号;
F代表域,j表示工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签、解决方案域中的一个;
A代表Jaccard相似性系数算法、欧几里得算法、编辑距离算法和余弦相似度算法中的某一种算法权重值,c表示Jaccard相似性系数算法、欧几里得算法、编辑距离算法和余弦相似度算法中的一种算法;
当条件词汇列表中一个词汇在某一个工单某一域下不同算法均有权重值,那么取其中最大值作为该词汇在当前工单当前域下相关性有效值;当该词汇在同一工单下,不同域获得多个有效值,则该词汇与该工单相关性更高;
对于条件词汇列表中所有词汇与所有匹配知识记录所对应工单的相关性按照式(2)进行排序,
Smr=Count(Kr(m,n)) (2)
S代表所有匹配方案的排序,m表示词汇,r表示工单;
当不同工单按照式(1)计算出某一次词汇对应一个工单内容的相关性有效值;针对不同的工单,可以计算出该词汇的多个有效值,其排序的先后是按照同一工单下相关性有效值个数最多排在前面,否则排在后面;按照此办法,可以计算出不同词汇在不同工单内容下的相关性有效值,最终获得条件词汇与所匹配知识记录对应的工单的若干条有效值,其排序的先后是按照不同词汇对应不同工单的相关性有效值个数最多的排在前面,否则排在后面;
(5)对分析结果按照相关性排序,根据需要将排在前面的若干条作为本次查询的有效分析结果,比如:返回相关性最高的5条,并分别按照每条分析结果对应的工单编号,从工单源库中提取工单完整信息,构建用户查询问题的返回结果列表;
(6)将结果反馈给用户。
本发明的有益效果是:本发明以电力信息系统客服工单为数据源,通过构建电力信息系统客服知识库,将历史客服经验数据转化为专家知识,支持用户在线自主咨询和解决问题,实现了用户问题的自助在线解答功能,提高了客服效率,降低了在线客服工作量。
与现有技术相比,本发明具有以下特点:
(1)将电话客服经验转化为知识库的知识。
以往的客服工单以文件形式保存,查找历史客服资料需要人工打开文件浏览,不利于历史经验的共享和再利用。本发明通过对工单数据的分析,将分析结果构建客服知识库,可以为用户提供及时高效的在线服务。
(2)减轻电力信息系统电话客服压力。
为均衡成本和效率,客服坐席数量一般会按照接访数量均值设置,在高峰时段,客服坐席较忙,需要用户排队等待,特别是新系统上线或者升级调整、业务集中办理阶段,会对电话客服造成较大压力。借助本发明构建客服知识库方法,可以通过构建知识库,提供自助服务,可大大缓解高峰时段客服压力。
(3)提供7*24小时在线服务,有效降低成本。
电话客服一般在工作时间提供服务,在非工作时间用户遇到问题不能获得相应的服务,通过本发明可以构建一个自助在线服务,提供7*24小时的在线客服,既解决了非工作时段客服问题,又不需要安排非工作时段值班。
附图说明
图1为本发明的整体流程图;
图2为本发明的工单分词流程图;
图3为本发明的知识转化流程图;
图4为本发明的知识重用流程图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式并结合其附图对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件、算法和处理技术及工艺的描述以避免不必要地限制本发明。
如图1所示,本发明的一种基于工单数据分析的电力信息系统客服知识库构建方法,它基于客服工单为数据来源建立电力信息系统客服知识库,并将历史客服经验数据转化为专家知识来实现用户问题的自助在线解答。
本发明建立电力信息系统客服知识库的过程包括以下过程:
工单分词,以客服工单为数据来源,对采集的工单文件进行文本转换,按域保存到工单源库,在对工单文本进行分词处理,过滤无效词汇,形成词汇列表,同时更新电力信息系统客服知识库中的词汇列表;
知识转化,利用已经成熟的各种相似性分析算法对词汇列表进行相似性分析,并将分析结果做必要规整,形成知识条目,保存到电力信息系统客服知识库;
知识重用,响应用户的查询请求,对查询条件进行分词、匹配和相关性分析,将满足匹配要求的结果返回给用户,如果没有合适的匹配结果,则可发起即时分析,直接从工单源库分析获得满足要求的结果。
本发明提出了一种实时的客服工单分词、分析、知识转化和知识重用的方法,其建立电力信息系统客服知识库的过程可以分为工单分词、知识转化和知识重用三个部分。如图2至图4所示,下面详细阐述本发明的工单分词、知识转化和知识重用的流程步骤。
一、工单分词
对实时采集的工单文件进行文本转换,结合实际业务情况进行按域分组保存到工单源库,再对工单文本进行分词处理,过滤无效词汇,形成词汇列表,更新知识库中词汇列表。
(1)工单分词处理流程以工单采集为起点,来自客服系统的工单文件既可以实时也可以批量形式提交给本模块,触发工单文件自动转文本处理功能,其中,工单文本包括很多文本域,分别为:工单编号、工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、当前环节、职位、办公区域、房间号、申请人、手机号码、申请人部门、申请人单位、联系人、来电号码、受理人、工单标签、紧急程度、影响范围、工单来源、运维组、处理人、解决方案、是否回访、回访成功标志、创建开始时间、创建结束时间、处理开始时间、处理结束时间、回访开始时间、回访结束时间、预警超期状态、工单状态、工单类型、满意度、客户意见等。
(2)以工单为单位,对工单数据进行分词处理,分别执行后续步骤(3)。
(3)对转化为文本的工单数据,按工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签、解决方案几个域进行分组,并保存到工单源库中,工单源库是基于hadoop的hdfs库,方便知识转化时采用spark任务进行分析和计算。之后执行步骤(4)。
(4)将工单存储到工单源库后,本步骤对工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签、解决方案域分别进行分词处理,词汇切分采用基于字符串匹配的分词方法,分别对各分组的内容进行词汇切分。
(5)对上一步骤切分的词汇,根据无效词汇表进行无效词汇过滤,过滤掉“的、地、得”等无效词汇,以及敏感词汇。
(6)将上一步骤过滤后剩余有效词汇,与知识库中词汇表进行比对,将新词汇加入到知识库的词汇列表,已有词汇进行累加出现频次。
二、知识转化
通过工单分词模块产生的词汇列表,利用已经成熟的多种相似性分析算法(Jaccard相似性系数算法、欧几里得算法、编辑距离算法、余弦相似度算法),进行相似性分析,并将分析结果做必要规整,形成知识条目,保存到知识库。知识转化可以通过两个途径发起,一是对工单分词后形成的待分析词汇组集进行实时分析,二是当用户查询搜索没有获得合适的查询结果,启动了即时分析。对词汇进行实时分析或者即时分析,目的都是通过词汇的相似性分析,实现对用户咨询信息的知识转化,形成支持自助在线客服的知识库。
1、实时分析流程:
(1)执行工单分词后,形成了更新后的词汇列表,以下要对词汇列表中的每个词循环执行按词按域分析,详见步骤(2)。
(2)获得词汇列表中的一个词,采用已经成熟的相似性算法,包括:Jaccard相似性系数算法、欧几里得算法、编辑距离算法、余弦相似度算法,分别按工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签、解决方案几个域进行相似性分析,分析的数据源为本次追加到工单源库中的新工单数据。
Jaccard | 欧几里得 | 编辑距离 | 余弦相似度 | |
工单标题 | ||||
工单描述 | ||||
服务分类 | ||||
服务细分 | ||||
所属应用系统 | ||||
工单标签 | ||||
解决方案 |
如上表所示,对一个词汇,按照上述算法分别计算分析表中罗列各个域的相似度权重,建立词汇、相似度权重值、工单间的映射关系。通过并行执行spark计算任务,对词汇列表中的每个词汇,实现前述计算分析,获得所有词汇对每个域在新增工单源库上的相似度分析结果。
(3)对步骤(2)计算分析的结果进行规整,按照词汇列表的条目建立知识库中知识条目,具体方法是以每条词汇为基准,建立词汇在新增工单数据每个域上的权重值记录,每个工单数据在知识条目中以工单标号代表,罗列每种相似度算法的计算分析获得权重值。
形如:词汇名→工单编号→域名→算法1权重值→算法2权重值→……→算法n权重值。
(4)对步骤(3)规整后分析结果形成的知识条目进行新知识记录,根据知识库中该词汇的知识记录情况,如果没有该词汇则新增该词汇所有知识条目到知识库中;如果已存在该词汇,则补充在新订单上分析计算所获得的新知识条目到知识库中。
2、即时分析流程:
(1)即时分析流程源自于用户自助查询信息系统的客服信息,当知识库中没有与查询条件匹配的知识条目时,则启动即时分析流程。
(2)即时分析流程首先获得用户输入的查询条件,对查询条件文本进行分词,形成新的词汇列表(以下称为:条件词汇列表),在该流程环节中,并不对这些条件词汇列表与知识库中进行比对和更新,只是用于下一步骤的逐词按域分析。
(3)从上一步骤获得的条件词汇列表获取一个词,后续处理与实时分析流程(2)步骤相同,最终获得条件词汇列表每个词汇对每个域在新增工单源库上的相似度分析结果。
(4)与实时分析流程(3)步骤相同,按照条件词汇列表的条目建立新知识条目。
(5)与实时分析流程(4)步骤相似,将上一步骤规整后分析结果形成的知识条目进行知识记录,根据该词汇在知识库中存在情况,如果没有该词汇则新增该词汇所有知识条目到知识库中;如果已存在该词汇,则补充在新订单上分析计算所获得的新知识条目到知识库中。
三、知识重用
知识重用主要是用户通过自助在线客服功能,查询有关信息系统客服信息,自助在线客服功能响应用户的查询请求,对查询条件进行分词、匹配和相关性分析,将满足匹配要求的结果返回给用户,如果没有合适的匹配结果,则可发起即时分析,直接从工单源库分析获得满足要求的结果。其详细步骤如下:
(1)用户通过使用自助在线客服,在终端界面输入查询内容,提交查询请求。
(2)将用户输入的查询条件转化为文本,并做分词处理,词切分仍然采用成熟的基于字符串的分词算法,形成条件词汇列表。
(3)对上一步骤获得的条件词汇列表,循环获取每个词汇,到知识库中查询可匹配的知识记录。如果有匹配的知识记录,则进入下一步骤;如果没有匹配的记录存在,则发起即时分析流程,具体步骤参见知识转化部分中的即时分析流程。
(4)根据上一步骤获得的条件词汇列表每个词汇匹配的知识记录,进行条件词汇与匹配知识记录的相关性分析。对于条件词汇列表中的每一个词汇,其相关性分析公式如下:
K(m,n)=Max(Ri,Fj,Ac) (1)
K代表该词汇与工单内容的相关性有效值,m表示当前词汇,n表示该词汇的一个相关性。
R代表工单记录,i表示工单编号;
F代表域,j表示工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签、解决方案域中的一个;
A代表某一种算法(当前包括Jaccard相似性系数算法、欧几里得算法、编辑距离算法、余弦相似度算法)权重值,c表示四种算法中的一种;
当条件一个词汇在某一个工单某一域下不同算法均有权重值,那么取其中最大值作为该词汇在当前工单当前域下相关性有效值。当该词汇在同一工单下,不同域获得多个有效值,则该词汇与该工单相关性更高。
对于条件词汇列表中所有词汇与所有匹配知识记录所对应工单的相关性排序,可以按照以下公式:
Smr=Count(Kr(m,n)) (2)
S代表所有匹配方案的排序,m表示词汇,r表示工单;
当不同工单按照公式(1)计算出某一次词汇对应一个工单内容的相关性有效值;针对不同的工单,可以计算出该词汇的多个有效值,其排序先后,按照同一工单下相关性有效值个数最多排在前面,否则排在后面。按照此办法,可以计算出不同词汇在不同工单内容下的相关性有效值,最终获得条件词汇与所匹配知识记录对应的工单的若干条有效值,其排序按照不同词汇对应不同工单的相关性有效值个数最多的排在前面,否则排在后面。
(5)根据分析结果,按照相关性排序,根据需要将排在前面的若干条作为本次查询的有效分析结果,比如:返回相关性最高的5条,并分别按照每条分析结果对应的工单编号,从工单源库中提取工单完整信息,构建用户查询问题的返回结果列表。
(6)将结果反馈给用户。
本发明以电力信息系统客服工单为数据源,通过构建电力信息系统客服知识库,将历史客服经验数据转化为专家知识,支持用户在线自主咨询和解决问题,实现了用户自助在线问题解答,提高了客服效率,降低了在线客服工作量。
本发明在建立电力信息系统客服知识库的过程中,工单分词以客服工单为数据来源,对工单文件进行文本转换,按域保存到工单源库,同时对工单文本进行分词处理,形成词汇列表;知识转化通过工单分词产生的词汇列表,利用已经成熟的多种相似性分析算法,进行相似性分析,并将分析结果做必要规整,形成知识条目,保存到知识库;知识重用主要是响应用户的查询请求,对查询条件进行分词、匹配和相关性分析,将满足匹配要求的结果返回给用户,如果没有合适的匹配结果,则可发起即时分析,直接从工单源库分析获得满足要求的结果。
此外,本发明的应用范围不局限于说明书中描述的特定实施例的工艺、机构、制造、物质组成、手段、方法及步骤。从本发明的公开内容,作为本领域的普通技术人员将容易地理解,对于目前已存在或者以后即将开发出的工艺、机构、制造、物质组成、手段、方法或步骤,其中它们执行与本发明描述的对应实施例大体相同的功能或者获得大体相同的结果,依照本发明可以对它们进行应用。因此,本发明所附权利要求旨在将这些工艺、机构、制造、物质组成、手段、方法或步骤包含在其保护范围内。
Claims (5)
1.基于工单数据分析的电力信息系统客服知识库构建方法,其特征是,基于客服工单为数据来源建立电力信息系统客服知识库,并将历史客服经验数据转化为专家知识来实现用户问题的自助在线解答;
建立电力信息系统客服知识库的过程包括以下过程:
工单分词,以客服工单为数据来源,对采集的工单文件进行文本转换,按域保存到工单源库,在对工单文本进行分词处理,过滤无效词汇,形成词汇列表,同时更新电力信息系统客服知识库中的词汇列表;
知识转化,利用多种相似性分析算法对词汇列表进行相似性分析,并将分析结果做必要规整,形成知识条目,保存到电力信息系统客服知识库;
知识重用,响应用户的查询请求,对查询条件进行分词、匹配和相关性分析,将满足匹配要求的结果返回给用户,如果没有合适的匹配结果,则可发起即时分析,直接从工单源库分析获得满足要求的结果;
所述知识重用的过程包括以下步骤:
(1)获取用户通过自助在线客服在终端界面提交查询条件信息;
(2)将查询条件转化为文本,并做分词处理,采用基于字符串的分词算法进行词切分,形成条件词汇列表;
(3)对获得的条件词汇列表中的每个词汇到知识库中查询可匹配的知识记录,如果有匹配的知识记录,则进入下一步骤;如果没有匹配的记录存在,则发起对词汇进行即时分析的知识转化流程;
(4)根据获得的条件词汇列表每个词汇匹配的知识记录,进行条件词汇与匹配知识记录的相关性分析;对于条件词汇列表中的每一个词汇采用式(1)进行相关性分析:
K(m,n)=Max(Ri,Fj,Ac) (1)
K代表该词汇与工单内容的相关性有效值,m表示当前词汇,n表示该词汇的一个相关性;
R代表工单记录,i表示工单编号;
F代表域,j表示工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签、解决方案域中的一个;
A代表Jaccard相似性系数算法、欧几里得算法、编辑距离算法和余弦相似度算法中的某一种算法权重值,c表示Jaccard相似性系数算法、欧几里得算法、编辑距离算法和余弦相似度算法中的一种算法;
当条件词汇列表中一个词汇在某一个工单某一域下不同算法均有权重值,那么取其中最大值作为该词汇在当前工单当前域下相关性有效值;当该词汇在同一工单下,不同域获得多个有效值,则该词汇与该工单相关性更高;
对于条件词汇列表中所有词汇与所有匹配知识记录所对应工单的相关性按照式(2)进行排序,
Smr=Count(Kr(m,n)) (2)
S代表所有匹配方案的排序,m表示词汇,r表示工单;
当不同工单按照式(1)计算出某一次词汇对应一个工单内容的相关性有效值;针对不同的工单,可以计算出该词汇的多个有效值,其排序的先后是按照同一工单下相关性有效值个数最多排在前面,否则排在后面;按照此办法,可以计算出不同词汇在不同工单内容下的相关性有效值,最终获得条件词汇与所匹配知识记录对应的工单的若干条有效值,其排序的先后是按照不同词汇对应不同工单的相关性有效值个数最多的排在前面,否则排在后面;
(5)对分析结果按照相关性排序,根据需要将排在前面的若干条作为本次查询的有效分析结果,并分别按照每条分析结果对应的工单编号,从工单源库中提取工单完整信息,构建用户查询问题的返回结果列表;
(6)将结果反馈给用户。
2.根据权利要求1所述的基于工单数据分析的电力信息系统客服知识库构建方法,其特征是,所述工单分词的过程包括以下步骤:
(1)工单分词处理流程以工单采集为起点,来自客服系统的工单文件实时或批量提交给本模块,触发工单文件进行自动转文本处理;所述工单文本包括以下文本域:工单编号、工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、当前环节、职位、办公区域、房间号、申请人、手机号码、申请人部门、申请人单位、联系人、来电号码、受理人、工单标签、紧急程度、影响范围、工单来源、运维组、处理人、解决方案、是否回访、回访成功标志、创建开始时间、创建结束时间、处理开始时间、处理结束时间、回访开始时间、回访结束时间、预警超期状态、工单状态、工单类型、满意度和客户意见;
(2)以工单为单位,对工单数据进行分词处理;
(3)对转化为文本的工单数据,按工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签和解决方案文本域进行分组,并保存到工单源库中,所述工单源库是基于hadoop的hdfs库,方便知识转化时采用spark任务进行分析和计算;
(4)对工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签和解决方案文本域分别进行域分词处理,采用基于字符串匹配的分词方法分别对各分组的内容进行词汇切分;
(5)根据无效词汇表进行无效词汇过滤,过滤掉无效词汇和敏感词汇;
(6)将有效词汇与知识库中词汇表进行比对,将新词汇加入到知识库的词汇列表,对已有词汇进行累加其出现的频次。
3.根据权利要求1所述的基于工单数据分析的电力信息系统客服知识库构建方法,其特征是,所述知识转化过程为对词汇进行实时分析或者即时分析来对用户咨询信息的知识转化,从而形成支持自助在线客服的知识库。
4.根据权利要求3所述的基于工单数据分析的电力信息系统客服知识库构建方法,其特征是,所述对词汇进行实时分析的过程为对工单分词后形成的词汇列表进行实时分析来执行知识转化的过程,它包括以下具体步骤:
(1)对词汇列表中的每个词分别进行按词按域分析;
(2)获得词汇列表中的一个词,采用Jaccard相似性系数算法、欧几里得算法、编辑距离算法和余弦相似度算法分别按工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签和解决方案文本域进行相似性分析,分析的数据源为本次追加到工单源库中的新工单数据;
(3)对步骤(2)的相似性分析结果进行规整,按照词汇列表的条目建立电力信息系统客服知识库中的知识条目,建立知识条目的过程为以每条词汇为基准,建立词汇在新增工单数据每个文本域上的权重值记录,每个工单数据在知识条目中以工单标号代表,罗列每种相似度算法的计算分析获得权重值;
(4)对规整后分析结果形成的知识条目进行新知识记录,根据知识库中该词汇的知识记录情况,如果没有该词汇则新增该词汇所有知识条目到电力信息系统客服知识库中;如果已存在该词汇,则补充在新工单上分析计算所获得的新知识条目到电力信息系统客服知识库中。
5.根据权利要求3所述的基于工单数据分析的电力信息系统客服知识库构建方法,其特征是,所述对词汇进行即时分析的过程为当用户查询搜索没有获得合适的查询结果,则启动即时分析来执行知识转化的过程,它包括以下步骤:
(1)根据通过自助在线客服录入的查询条件,当电力信息系统客服知识库中没有与查询条件匹配的知识条目时,开始启动即时分析流程;
(2)获得用户输入的查询条件,对查询条件文本进行分词,形成条件词汇列表,对条件词汇列表中的每个词分别进行按词按域分析;
(3)获得的条件词汇列表中的一个词,采用Jaccard相似性系数算法、欧几里得算法、编辑距离算法和余弦相似度算法分别按工单标题、工单描述、服务分类、服务细分、服务项、所属应用系统、工单标签和解决方案文本域进行相似性分析,分析的数据源为本次追加到新增工单源库中的新工单数据,最终获得条件词汇列表中的每个词汇对每个域在新增工单源库上的相似度分析结果;
(4)对步骤(3)的相似性分析结果进行规整,按照条件词汇列表的条目建立电力信息系统客服知识库中的知识条目,建立知识条目的过程为以每条词汇为基准,建立词汇在新增工单数据每个域上的权重值记录,每个工单数据在知识条目中以工单标号代表,罗列每种相似度算法的计算分析获得权重值;
(5)对规整后分析结果形成的知识条目进行新知识记录,根据知识库中该词汇的知识记录情况,如果没有该词汇则新增该词汇所有知识条目到电力信息系统客服知识库中;如果已存在该词汇,则补充在新工单上分析计算所获得的新知识条目到电力信息系统客服知识库中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611208017.1A CN106600298B (zh) | 2016-12-23 | 2016-12-23 | 基于工单数据分析的电力信息系统客服知识库构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611208017.1A CN106600298B (zh) | 2016-12-23 | 2016-12-23 | 基于工单数据分析的电力信息系统客服知识库构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106600298A CN106600298A (zh) | 2017-04-26 |
CN106600298B true CN106600298B (zh) | 2020-09-01 |
Family
ID=58601411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611208017.1A Active CN106600298B (zh) | 2016-12-23 | 2016-12-23 | 基于工单数据分析的电力信息系统客服知识库构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106600298B (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480140A (zh) * | 2017-08-23 | 2017-12-15 | 北京仿真中心 | 一种基于众创的智能案例库实现方法 |
CN107562726A (zh) * | 2017-09-06 | 2018-01-09 | 国家电网公司 | 一种基于热词的供电服务搜索引擎 |
CN107818510A (zh) * | 2017-11-02 | 2018-03-20 | 长江证券股份有限公司 | 一种用于投资决策辅助的分布式处理系统及方法 |
CN109840534B (zh) * | 2017-11-29 | 2021-10-01 | 北京京东尚科信息技术有限公司 | 处理事件的方法和装置 |
CN108009944A (zh) * | 2017-12-01 | 2018-05-08 | 广州赞加信息科技有限公司 | 一种基于互联网的信息技术咨询服务系统 |
CN108460136A (zh) * | 2018-03-08 | 2018-08-28 | 国网福建省电力有限公司 | 电力运维信息知识图谱构建方法 |
CN108491378B (zh) * | 2018-03-08 | 2021-11-09 | 国网福建省电力有限公司 | 电力信息运维智能应答系统 |
WO2019195532A1 (en) | 2018-04-04 | 2019-10-10 | Schneider Electric USA, Inc. | Systems and methods for intelligent alarm grouping |
CN108874928B (zh) * | 2018-05-31 | 2024-02-02 | 平安科技(深圳)有限公司 | 简历数据信息解析处理方法、装置、设备及存储介质 |
CN109033284A (zh) * | 2018-07-12 | 2018-12-18 | 国网福建省电力有限公司 | 基于知识图谱的电力信息运维系统数据库构建方法 |
CN108874783A (zh) * | 2018-07-12 | 2018-11-23 | 国网福建省电力有限公司 | 电力信息运维知识模型构建方法 |
CN111611353B (zh) * | 2019-02-25 | 2023-08-18 | 北京嘀嘀无限科技发展有限公司 | 筛选方法、装置、电子设备及计算机可读存储介质 |
CN112445893A (zh) * | 2019-09-05 | 2021-03-05 | 北京国双科技有限公司 | 一种信息搜索方法、装置、设备及存储介质 |
CN112860714A (zh) * | 2019-11-12 | 2021-05-28 | 斑马智行网络(香港)有限公司 | 知识库、数据库、信息更新方法和装置 |
CN111506698A (zh) * | 2020-03-13 | 2020-08-07 | 浙江执御信息技术有限公司 | 一种基于sop智能流程处理方法 |
CN111753055B (zh) * | 2020-06-28 | 2024-01-26 | 中国银行股份有限公司 | 一种客户问答自动提示方法及装置 |
CN111858913A (zh) * | 2020-07-08 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种自动生成文本摘要的方法和系统 |
CN111915327B (zh) * | 2020-07-15 | 2023-12-29 | 山东瑞智飞控科技有限公司 | 一种基于事件特征的智能分发方法和装置 |
CN112035202B (zh) | 2020-08-25 | 2021-11-23 | 北京字节跳动网络技术有限公司 | 好友活跃信息的显示方法、装置、电子设备和存储介质 |
CN112308440A (zh) * | 2020-11-06 | 2021-02-02 | 平安证券股份有限公司 | 工单处理方法、装置、计算机设备及计算机可读存储介质 |
CN112380358A (zh) * | 2020-12-31 | 2021-02-19 | 神思电子技术股份有限公司 | 一种行业知识库的快速构建方法 |
US20230040315A1 (en) * | 2021-08-05 | 2023-02-09 | Ebay Inc. | Techniques for automated review-based insights |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942220A (zh) * | 2013-01-23 | 2014-07-23 | 成都勤智数码科技股份有限公司 | 一种适用于it运维系统的工单智能关联知识库知识的方法 |
CN104615696A (zh) * | 2015-01-23 | 2015-05-13 | 国家电网公司 | 一种95598知识库系统及建设方法 |
CN105335488A (zh) * | 2015-10-16 | 2016-02-17 | 中国南方电网有限责任公司电网技术研究中心 | 一种知识库构建方法 |
CN105760493A (zh) * | 2016-02-18 | 2016-07-13 | 国网江苏省电力公司电力科学研究院 | 一种电力营销服务热点95598工单自动分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6236768B1 (en) * | 1997-10-14 | 2001-05-22 | Massachusetts Institute Of Technology | Method and apparatus for automated, context-dependent retrieval of information |
-
2016
- 2016-12-23 CN CN201611208017.1A patent/CN106600298B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942220A (zh) * | 2013-01-23 | 2014-07-23 | 成都勤智数码科技股份有限公司 | 一种适用于it运维系统的工单智能关联知识库知识的方法 |
CN104615696A (zh) * | 2015-01-23 | 2015-05-13 | 国家电网公司 | 一种95598知识库系统及建设方法 |
CN105335488A (zh) * | 2015-10-16 | 2016-02-17 | 中国南方电网有限责任公司电网技术研究中心 | 一种知识库构建方法 |
CN105760493A (zh) * | 2016-02-18 | 2016-07-13 | 国网江苏省电力公司电力科学研究院 | 一种电力营销服务热点95598工单自动分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106600298A (zh) | 2017-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106600298B (zh) | 基于工单数据分析的电力信息系统客服知识库构建方法 | |
CN109635117B (zh) | 一种基于知识图谱识别用户意图方法及装置 | |
CN108363821A (zh) | 一种信息推送方法、装置、终端设备及存储介质 | |
CN102236663B (zh) | 一种基于垂直搜索的查询方法、系统和装置 | |
CN108460136A (zh) | 电力运维信息知识图谱构建方法 | |
CN109033284A (zh) | 基于知识图谱的电力信息运维系统数据库构建方法 | |
CN104077407B (zh) | 一种智能数据搜索系统及方法 | |
CN104834651B (zh) | 一种提供高频问题回答的方法和装置 | |
CN103309869B (zh) | 数据对象的展示关键词推荐方法及系统 | |
CN107729336A (zh) | 数据处理方法、设备及系统 | |
CN104254851A (zh) | 用于向用户推荐内容的方法和系统 | |
CN109711708A (zh) | 全过程工程咨询服务方法及系统 | |
CN108172225A (zh) | 语音交互方法及机器人、计算机可读存储介质、终端 | |
CN110245214A (zh) | 一种在线服务的方法及系统 | |
CN111950851A (zh) | 一种工单处理方法及装置 | |
CN109189902A (zh) | 自动应答咨询的方法及装置 | |
CN114936727A (zh) | 一种工单派发系统、方法及计算机设备 | |
CN115358481A (zh) | 一种企业外迁预警识别的方法、系统及装置 | |
CN113362102B (zh) | 一种客户线索分发方法、系统及存储介质 | |
CN110287495A (zh) | 一种电力营销专业词识别方法及系统 | |
CN113918697A (zh) | 一种智能问答系统的优化方法以及优化系统 | |
CN109493186A (zh) | 确定推送信息的方法和装置 | |
CN110362828B (zh) | 网络资讯风险识别方法及系统 | |
CN116501844A (zh) | 语音关键词检索方法及系统 | |
CN112800219B (zh) | 客服日志反馈回流数据库的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |