CN108470282A - 客户服务中心投诉工单智能分类方法 - Google Patents
客户服务中心投诉工单智能分类方法 Download PDFInfo
- Publication number
- CN108470282A CN108470282A CN201810250290.3A CN201810250290A CN108470282A CN 108470282 A CN108470282 A CN 108470282A CN 201810250290 A CN201810250290 A CN 201810250290A CN 108470282 A CN108470282 A CN 108470282A
- Authority
- CN
- China
- Prior art keywords
- work order
- word
- text
- theme
- vocabulary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/015—Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
- G06Q30/016—After-sales
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Finance (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据处理方法,具体涉及客户服务中心投诉工单智能分类方法。客户服务中心投诉工单智能分类方法,包括如下过程:建立同义词数据库、停用词数据库:针对不同区域的客户在语音话务中针对同一问题的描述用词不一致等问题,依据工单“受理内容”信息进行同义词定义;文本分词:基于上述构建的同义词数据库、停用词数据库,进行文本分词,并对分词词汇进行词性标注;词频统计:形成客户投诉感知信息词云图,通过词频统计,能够直观反应客户投诉感知;文档工单主题提取。本发明解决了针对用电用户投诉工单和回访不满意工单无法准确、有效获知用户感知的问题。
Description
技术领域:
本发明涉及数据处理方法,具体涉及客户服务中心投诉工单智能分类方法。
背景技术:
目前在95598客户服务过程中,主要通过专家经验法感知用户,在大数据环境下,专家经验法将无法满足实际应用需求;现有用户对用电台区、客户投诉热点的感知,主要通过统计分析方法感知;目前的用户感知,智能辨识大类特征,无法有效感知用户的具体原因,例如一线工作人员的工作态度、工作规范性等;无法通过客户服务投诉工单及不满意工单感知客户需求,对投诉或客户回访处理不满意工单的具体原因、敏感台区以及特征台区客户的诉求热点,不能及时掌握,影响客户服务质量的提升。
基于LDA主题生成模型,首先通过对95598客户服务过程中产生的投诉类工单,辨识工单主题,并以辨识的工单主题为基础,基于文本分析技术,通过计算工单主题的相似性,实现客户投诉工单智能分类;其次,根据客户投诉工单分类结果,利用文本情感分析和文本余弦相似度计算,实现客户投诉根因定位。最后,基于客户投诉根因分析结果,结合波士顿矩阵,实现客户投诉区域分布分析、投诉热点分布分析,改善客户服务感知。
LDA是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含次、主题和文档三层结构,是一种非监督机器学习技术,可以用来识别大规模文档及语料库中潜藏的主题信息,采用词袋方法,将每一篇文档视为一个词频向量,从而将文本信息转化为易于建模的数字信息,基于每一篇文档代表了一些主题所构成的一个概率分布,而每一个主题又代表了很多单词所组成的概率分布的理论,实现生成文档主题。
在LDA模型中,一篇文档生成的方式如下:
从狄利克雷分布α中取样生成文档i的主题分布θi;
从主题的多项式分布θi中取样生成文档i第j个词的主题Zi,j;
从狄利克雷分布β中取样生成主题zi,j对应的词语分布φci,j;
从词语的多项式分布φci,j中采样最终生成词语wi,j;
其中,类似Beta分布是二项式分布的共轭先验概率分布,而狄利克雷分布(Dirichlet分布)是多项式分布的共轭先验概率分布。
LDA技术的出现为客户服务中心投诉工单智能分类提供了理论基础。
发明内容:
针对以上情况,本发明的主要目的在于通过文本分析技术,基于情感分析算法、分词技术、文本相似度计算等技术,实现客户投诉工单的智能分类,客户投诉原因的根因分析,便于客户服务单位能够直观的感知用户需求。具体技术方案如下:
客户服务中心投诉工单智能分类方法,包括如下过程:
(一)建立同义词数据库、停用词数据库:针对不同区域的客户在语音话务中针对同一问题的描述用词不一致等问题,依据工单“受理内容”信息进行同义词定义;
(二)文本分词:基于上述构建的同义词数据库、停用词数据库,进行文本分词,并对分词词汇进行词性标注;
(三)词频统计:形成客户投诉感知信息词云图,通过词频统计,能够直观反应客户投诉感知;
(四)文档工单主题提取:将文档设为D,由一个单词序列<w1,w2,...wn>组成,其中wi表示第i个单词,1≤i≤n;假设上述文档可能有T个主题(特征词),则上述文本中的第i个词汇wi可以表示如下:
P(wi)=∑T j=1P(wi|wi=j)P(zi=j)
式中:zi是潜在变量,表明第i个词汇记号;wi取自该主题;P(wi|zi=j)是词汇wi记号属于主题j的概率;P(zi=j)给出主题j属于当前文本的概率,
假定T个主题形成d个文本,且以W个唯一性词汇表示,为记号方便,令ψ(w z=j)=P(z=j)表示对于主题jW个词汇上的多项分布,其中w是W个唯一性词汇表中的词汇;令表示对于文本d,T个主题上的多项分布,于是文本d中词汇w的概率为:
通过上述公式,生成客户意见规范化表达式,提取文档主题词,计算主题词隶属度,形成最终的工单主题词。
作为优选方案,还包括如下后续过程:
(五)工单投诉根因定位:以对投诉工单进行文档主题提取的工单主题内容为基础,结合工单文本内容分析过程中定义的同义词,对文档工单主题进行反向匹配,同时,根据同义词数据库,并向下钻取,找出客户投诉的根因。
本发明解决了针对用电用户投诉工单和回访不满意工单无法准确、有效获知用户感知的问题,不能基于95598客服投诉、建议等工单文本内容辨识客户需求,支撑公司运营管理。
本发明构建了基于LDA模型的主题生成模型辨识工单,在工单智能分类方面,围绕客户投诉工单/回访不满意工单,通过工单分类以及相应的的工单量,聚焦客户投诉热点业务类型、客户诉求热点,识别服务短板;在工单根因定位方面,对客户诉求中涉及到的公司人员服务态度、业务规范等问题,进行客户投诉根因定位,从投诉台区分布、区域投诉热点等维度深入定性分析,挖掘公司运营管理过程中应着重提高的管理内容。
附图说明:
附图1是LDA的模型原理结构示意图。
具体实施方式:
实施例:
客户服务中心投诉工单智能分类方法,包括如下过程:
(一)建立同义词数据库、停用词数据库:针对不同区域的客户在语音话务中针对同一问题的描述用词不一致等问题,依据工单“受理内容”信息进行同义词定义;形成例如“装表”、“复电”、“补抄”、“催费”等合计7200余例自定义同义词数据库,例如:将“不满”、“不满意”等词汇统一定义为“不满意”,将“断掉”、“减掉”、“断电”等词汇统一定义为“断电”;同时,对于客户感知没有相关的词汇,在文本分词的过程中摒弃该部分词汇,例如:“的”、“与”、“西善桥供电所”等词汇,共构建4300余个停用词,构成客户服务主题生成模型的停用词数据库。
(二)文本分词:基于上述构建的同义词数据库、停用词数据库,进行文本分词,利用R分析工具加载jieba分词包,并对分词词汇进行名词/动词/副词词性标注;文本分词是一个反复的过程,需要对自定义词库、同义词词库、停用词词库进行不断的完善,以提升文本分词的效果;在完成文本分词后,对进行词频统计,形成客户投诉感知信息词云图,通过词频统计,能够直观反应客户投诉感知。例如:
“客户来电反映之前报修,7点19分报修一直到10点多仍无工作人员与其联系处理,经中心解释无效,且已多次催办,坚持认为工作人员服务不到位,未在承诺时间内到达现场,工作态度不端正,要求核实”,通过文本分词,并进行词性标注,形成分析结果,“客户/n来电/v反映/v之前/f报修/v,/w 7点/m 19分/m报修/v一直/d到/v10点/m多/m仍/d无/v工作/vn人员/n与/p其/r联系/v处理/v,/w经/p中心/n解释/v无效/v,/w且/c已/d多次/m催办/v,/w坚持/v认为/v工作/vn人员/n服务/vn不/d到位/v,/w未/d在/p承诺/v时间/n内/f到达/v现场/s,/w工作/vn态度/n不/d端正/v,/w要求/v核实/v”。
(三)词频统计:形成客户投诉感知信息词云图,通过词频统计,能够直观反应客户投诉感知;
(四)文档工单主题提取:将文档设为D,由一个单词序列<w1,w2,...wn>组成,其中wi表示第i个单词,1≤i≤n。假设上述文档可能有T个主题(特征词),则上述文本中的第i个词汇wi可以表示如下:
P(wi)=∑T j=1P(wi|wi=j)P(zi=j)
式中:zi是潜在变量,表明第i个词汇记号;wi取自该主题;P(wi|zi=j)是词汇wi记号属于主题j的概率;P(zi=j)给出主题j属于当前文本的概率,
假定T个主题形成d个文本,且以W个唯一性词汇表示,为记号方便,令ψ(w z=j)=P(z=j)表示对于主题jW个词汇上的多项分布,其中w是W个唯一性词汇表中的词汇;令表示对于文本d,T个主题上的多项分布,于是文本d中词汇w的概率为:
通过上述工公式,生成客户意见规范化表达式,提取文档主题词,包括“服务、态度、不到位、反映”,主题词隶属度分别为0.215、0.193、0.203、0.167,形成最终的工单主题词“服务-不到位”。
(五)工单投诉根因定位:
以对投诉工单进行文档主题提取的工单主题内容为基础,结合工单文本内容分析过程中定义的同义词,对文档工单主题进行反向匹配,同时,根据同义词词典,并向下钻取,找出客户投诉的根因,例如,“投诉-抄催人员-不耐烦”、“投诉-抄催人员-傲慢”、“投诉-抄催人员-吸烟”。通过客户投诉的具体原因,找出客户投诉的真实原因,感知用户,提升服务品质。
投诉热点/区域分析:根据提取的客户投诉工单的根因,结合客户档案信息中客户台区信息,按照所属台区、工单类型、文档主题类型进行多维统计分析,找出各区域的投诉热点及客户投诉的热点台区区域,并进行可视化展示。
Claims (2)
1.客户服务中心投诉工单智能分类方法,其特征在于,包括如下过程:
(一)建立同义词数据库、停用词数据库:针对不同区域的客户在语音话务中针对同一问题的描述用词不一致等问题,依据工单“受理内容”信息进行同义词定义;
(二)文本分词:基于上述构建的同义词数据库、停用词数据库,进行文本分词,并对分词词汇进行词性标注;
(三)词频统计:形成客户投诉感知信息词云图,通过词频统计,能够直观反应客户投诉感知;
(四)文档工单主题提取:将文档设为D,由一个单词序列<w1,w2,...wn>组成,其中wi表示第i个单词,1≤i≤n,假设上述文档可能有T个主题(特征词),则上述文本中的第i个词汇wi可以表示如下:
P(wi)=∑T j=1P(wi|wi=j)P(zi=j)
式中:zi是潜在变量,表明第i个词汇记号;wi取自该主题;P(wi|zi=j)是词汇wi记号属于主题j的概率;P(zi=j)给出主题j属于当前文本的概率,
假定T个主题形成d个文本,且以W个唯一性词汇表示,为记号方便,令ψ(w z=j)=P(z=j)表示对于主题jW个词汇上的多项分布,其中w是W个唯一性词汇表中的词汇;令表示对于文本d,T个主题上的多项分布,于是文本d中词汇w的概率为:
通过上述公式,生成客户意见规范化表达式,提取文档主题词,计算主题词隶属度,形成最终的工单主题词。
2.根据权利要求1所述客户服务中心投诉工单智能分类方法,其特征在于,还包括如下后续过程:
(五)工单投诉根因定位:以对投诉工单进行文档主题提取的工单主题内容为基础,结合工单文本内容分析过程中定义的同义词,对文档工单主题进行反向匹配,同时,根据同义词数据库,并向下钻取,找出客户投诉的根因。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810250290.3A CN108470282A (zh) | 2018-03-26 | 2018-03-26 | 客户服务中心投诉工单智能分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810250290.3A CN108470282A (zh) | 2018-03-26 | 2018-03-26 | 客户服务中心投诉工单智能分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108470282A true CN108470282A (zh) | 2018-08-31 |
Family
ID=63264704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810250290.3A Pending CN108470282A (zh) | 2018-03-26 | 2018-03-26 | 客户服务中心投诉工单智能分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108470282A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492091A (zh) * | 2018-09-28 | 2019-03-19 | 科大国创软件股份有限公司 | 一种基于卷积神经网络的投诉工单智能分类方法 |
CN109636329A (zh) * | 2018-12-04 | 2019-04-16 | 广西电网有限责任公司电力科学研究院 | 一种基于热力图的用电客户投诉分析系统及分析方法 |
CN110427959A (zh) * | 2019-06-14 | 2019-11-08 | 合肥工业大学 | 投诉文本的分类方法、系统和存储介质 |
CN110929032A (zh) * | 2019-11-21 | 2020-03-27 | 山东鲁能软件技术有限公司 | 一种软件系统的用户需求处理系统及处理方法 |
CN110955777A (zh) * | 2019-12-11 | 2020-04-03 | 国网河北省电力有限公司电力科学研究院 | 一种基于95598工单提升客服质量的方法 |
CN111340323A (zh) * | 2018-12-19 | 2020-06-26 | 中国移动通信集团湖南有限公司 | 一种投诉服务请求自动派单方法及系统 |
CN111797145A (zh) * | 2020-07-17 | 2020-10-20 | 贵州电网有限责任公司电力科学研究院 | 一种电力客户容忍度评价分类方法 |
CN111915336A (zh) * | 2020-09-08 | 2020-11-10 | 北京嘀嘀无限科技发展有限公司 | 确定投诉消息的真实性的方法、装置、设备和存储介质 |
CN112488736A (zh) * | 2020-12-15 | 2021-03-12 | 济南市城乡建设数字化中心 | 一种住建领域政务热线工单数据分析方法及系统 |
CN112633904A (zh) * | 2020-12-30 | 2021-04-09 | 中国平安财产保险股份有限公司 | 投诉行为分析方法、装置、设备及计算机可读存储介质 |
CN113094567A (zh) * | 2021-03-31 | 2021-07-09 | 四川新网银行股份有限公司 | 一种基于文本聚类的恶意投诉识别方法及系统 |
CN113360647A (zh) * | 2021-06-03 | 2021-09-07 | 云南大学 | 一种基于聚类的5g移动业务投诉溯源分析方法 |
WO2021217855A1 (zh) * | 2020-04-30 | 2021-11-04 | 平安科技(深圳)有限公司 | 异常根因定位方法、装置、电子设备及存储介质 |
CN116596489A (zh) * | 2023-07-19 | 2023-08-15 | 广东电网有限责任公司广州供电局 | 一种分布式光伏运营工单数据采集分析方法 |
-
2018
- 2018-03-26 CN CN201810250290.3A patent/CN108470282A/zh active Pending
Non-Patent Citations (3)
Title |
---|
刘兴平等: "电力企业投诉工单文本挖掘模型", 《电力需求侧管理》 * |
厉建宾等: "基于大数据技术的客户诉求分析与应用", 《电力大数据》 * |
方小飞等: "基于LDA模型的移动投诉文本热点话题识别", 《数据分析与知识发现》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492091A (zh) * | 2018-09-28 | 2019-03-19 | 科大国创软件股份有限公司 | 一种基于卷积神经网络的投诉工单智能分类方法 |
CN109636329A (zh) * | 2018-12-04 | 2019-04-16 | 广西电网有限责任公司电力科学研究院 | 一种基于热力图的用电客户投诉分析系统及分析方法 |
CN109636329B (zh) * | 2018-12-04 | 2022-05-24 | 广西电网有限责任公司电力科学研究院 | 一种基于热力图的用电客户投诉分析系统及分析方法 |
CN111340323A (zh) * | 2018-12-19 | 2020-06-26 | 中国移动通信集团湖南有限公司 | 一种投诉服务请求自动派单方法及系统 |
CN111340323B (zh) * | 2018-12-19 | 2023-09-05 | 中国移动通信集团湖南有限公司 | 一种投诉服务请求自动派单方法及系统 |
CN110427959A (zh) * | 2019-06-14 | 2019-11-08 | 合肥工业大学 | 投诉文本的分类方法、系统和存储介质 |
CN110929032A (zh) * | 2019-11-21 | 2020-03-27 | 山东鲁能软件技术有限公司 | 一种软件系统的用户需求处理系统及处理方法 |
CN110929032B (zh) * | 2019-11-21 | 2022-12-09 | 山东鲁能软件技术有限公司 | 一种软件系统的用户需求处理系统及处理方法 |
CN110955777A (zh) * | 2019-12-11 | 2020-04-03 | 国网河北省电力有限公司电力科学研究院 | 一种基于95598工单提升客服质量的方法 |
WO2021217855A1 (zh) * | 2020-04-30 | 2021-11-04 | 平安科技(深圳)有限公司 | 异常根因定位方法、装置、电子设备及存储介质 |
CN111797145A (zh) * | 2020-07-17 | 2020-10-20 | 贵州电网有限责任公司电力科学研究院 | 一种电力客户容忍度评价分类方法 |
CN111915336A (zh) * | 2020-09-08 | 2020-11-10 | 北京嘀嘀无限科技发展有限公司 | 确定投诉消息的真实性的方法、装置、设备和存储介质 |
CN112488736A (zh) * | 2020-12-15 | 2021-03-12 | 济南市城乡建设数字化中心 | 一种住建领域政务热线工单数据分析方法及系统 |
CN112633904A (zh) * | 2020-12-30 | 2021-04-09 | 中国平安财产保险股份有限公司 | 投诉行为分析方法、装置、设备及计算机可读存储介质 |
CN112633904B (zh) * | 2020-12-30 | 2024-04-30 | 中国平安财产保险股份有限公司 | 投诉行为分析方法、装置、设备及计算机可读存储介质 |
CN113094567A (zh) * | 2021-03-31 | 2021-07-09 | 四川新网银行股份有限公司 | 一种基于文本聚类的恶意投诉识别方法及系统 |
CN113360647A (zh) * | 2021-06-03 | 2021-09-07 | 云南大学 | 一种基于聚类的5g移动业务投诉溯源分析方法 |
CN116596489A (zh) * | 2023-07-19 | 2023-08-15 | 广东电网有限责任公司广州供电局 | 一种分布式光伏运营工单数据采集分析方法 |
CN116596489B (zh) * | 2023-07-19 | 2024-01-02 | 广东电网有限责任公司广州供电局 | 一种分布式光伏运营工单数据采集分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108470282A (zh) | 客户服务中心投诉工单智能分类方法 | |
CN113704451B (zh) | 一种电力用户诉求筛选方法、系统、电子设备和存储介质 | |
CN108460136A (zh) | 电力运维信息知识图谱构建方法 | |
CN109033284A (zh) | 基于知识图谱的电力信息运维系统数据库构建方法 | |
CN105844424A (zh) | 基于网络评论的产品质量问题发现及风险评估方法 | |
CN111797210A (zh) | 基于用户画像的信息推荐方法、装置、设备及存储介质 | |
CN104199972A (zh) | 一种基于深度学习的命名实体关系抽取与构建方法 | |
CN105630827B (zh) | 一种信息处理方法、系统及辅助系统 | |
CN112650858B (zh) | 应急协助信息的获取方法、装置、计算机设备及介质 | |
CN113627797B (zh) | 入职员工画像生成方法、装置、计算机设备及存储介质 | |
CN110532358A (zh) | 一种面向知识库问答的模板自动生成方法 | |
CN112836018A (zh) | 应急预案的处理方法及装置 | |
CN110929007A (zh) | 一种电力营销知识体系平台及应用方法 | |
CN114218291A (zh) | 基于目标对象的画像生成方法、装置、设备及存储介质 | |
CN110196849A (zh) | 基于大数据治理技术实现用户画像构建处理的系统及其方法 | |
CN112417996A (zh) | 工业图纸的信息处理方法、装置、电子设备和存储介质 | |
CN110633468A (zh) | 一种关于对象特征提取的信息处理方法及装置 | |
CN116361367A (zh) | 一种高效发布招聘信息的内容识别系统及方法 | |
CN113656579B (zh) | 文本分类方法、装置、设备及介质 | |
CN115759562A (zh) | 一种核电厂大修预防性维修工单逻辑关系和工期计算算法 | |
CN112488593B (zh) | 一种用于招标的辅助评标系统及方法 | |
CN114996494A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN114461748A (zh) | 标签抽取方法、装置、存储介质以及电子设备 | |
CN114637831A (zh) | 基于语义分析的数据查询方法及其相关设备 | |
CN113987164A (zh) | 一种基于领域事件知识图谱的项目研判方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180831 |
|
RJ01 | Rejection of invention patent application after publication |