CN109657240A - 确定故障类型的方法、装置、设备和介质 - Google Patents

确定故障类型的方法、装置、设备和介质 Download PDF

Info

Publication number
CN109657240A
CN109657240A CN201811520497.4A CN201811520497A CN109657240A CN 109657240 A CN109657240 A CN 109657240A CN 201811520497 A CN201811520497 A CN 201811520497A CN 109657240 A CN109657240 A CN 109657240A
Authority
CN
China
Prior art keywords
work order
original
complaint
complaint work
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811520497.4A
Other languages
English (en)
Inventor
周岩
王鑫
徐朋朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Jiangsu Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Jiangsu Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Jiangsu Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811520497.4A priority Critical patent/CN109657240A/zh
Publication of CN109657240A publication Critical patent/CN109657240A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了确定故障类型的方法、装置、设备和介质。该方法包括:获取由业务支撑系统的操作人员生成的多个原始投诉工单;利用投诉工单词库对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元;基于多个原始投诉工单对应的分词单元,对多个原始投诉工单聚类,得到多个原始投诉工单集群,每个原始投诉工单集群中任意两个投诉工单的相似度大于预设的相似度阈值;确定每一原始投诉工单集群对应的故障类型。根据本发明实施例提供的确定故障类型的方法、装置、设备和介质,可以提高确认原始投诉工单对应的故障类型的效率。

Description

确定故障类型的方法、装置、设备和介质
技术领域
本发明涉及通信领域,尤其涉及确定故障类型的方法、装置、设备和介质。
背景技术
业务支撑系统,通信运营商的工作人员可以通过该系统为用户执行相应业务操作。例如,话费充值、办理套餐等。一个业务支撑系统上可能有数万操作人员同时进行操作。
当业务支撑系统出现故障时,可能会接收到操作人员的海量投诉工单。而现有的三种投诉申告收集方式(同时也是结果反馈方式)—申告工单、邮件、即时聊天工具无法实现信息汇聚,确认各个工单对应的故障类型的效率较低。
发明内容
本发明实施例提供确定故障类型的方法、装置、设备和介质,可以提高确认原始投诉工单对应的故障类型的效率。
根据本发明实施例的一方面,提供一种确定故障类型的方法,包括:
获取由业务支撑系统的操作人员生成的多个原始投诉工单;利用投诉工单词库对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元;基于多个原始投诉工单对应的分词单元,对多个原始投诉工单聚类,得到多个原始投诉工单集群,每个原始投诉工单集群中任意两个投诉工单的相似度大于预设的相似度阈值;确定每一原始投诉工单集群对应的故障类型。
在一种可选的实施方式中,方法还包括:
利用由业务支撑系统的操作人员生成的多个历史投诉工单和业务支撑系统特有词汇,训练投诉工单词库。
在一种可选的实施方式中,方法还包括:
从每个原始投诉工单集群中选择一个投诉工单;
将选择的投诉工单发送至与该投诉工单所属的原始投诉工单集群的故障类型对应的故障处理端。
在一种可选的实施方式中,方法还包括:
接收由各故障处理端返回的针对所对应的原始故障工单集群的故障类型的处理结果。
在一种可选的实施方式中,基于多个原始投诉工单对应的分词单元,对多个原始投诉工单聚类,得到多个原始投诉工单集群,具体包括:
选取多个原始投诉工单中任意一个作为目标投诉工单,将多个原始投诉工单中除目标投诉工单之外的投诉工单作为待聚类投诉工单;
从待聚类投诉工单中,筛选出与目标投诉工单相似度大于预设的相似度阈值的原始投诉工单作为第一投诉工单,目标投诉工单与待聚类投诉工单的相似度是基于目标投诉工单的分词单元和待聚类投诉工单的分词单元得到的,
将第一投诉工单和目标投诉工单聚类,得到与目标投诉工单对应的原始投诉工单集群,将待聚类投诉工单中除第一投诉工单之外的工单作为新的待聚类投诉工单;
从新的待聚类投诉工单中任意选取一个作为目标投诉工单,直到新的待聚类投诉工单为空集。
在一种可选的实施方式中,从待聚类投诉工单中,筛选出与目标投诉工单相似度大于预设相似度阈值的原始投诉工单作为第一投诉工单,具体包括:
计算待聚类投诉工单中每一原始投诉工单与目标投诉工单的相似度,其中,相似度等于该原始投诉工单与目标投诉工单的相同分词单元的字符串长度除以该原始投诉工单的字符串总长度得到的商值。
在一种可选的实施方式中,利用投诉工单词库对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元,具体包括:
利用投诉工单词库和jiaba分词技术,对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元。
根据本发明实施例的另一方面,提供一种确定故障类型的装置,包括:
获取处理模块,用于获取由业务支撑系统的操作人员生成的多个原始投诉工单;分词处理模块,用于利用投诉工单词库对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元;聚类处理模块,用于基于多个原始投诉工单对应的分词单元,对多个原始投诉工单聚类,得到多个原始投诉工单集群,每个原始投诉工单集群中任意两个投诉工单的相似度大于预设的相似度阈值;确定故障模块,用于确定每一原始投诉工单集群对应的故障类型。
在一种可选的实施方式中,装置还包括:
训练处理模块,用于利用由业务支撑系统的操作人员生成的多个历史投诉工单和业务支撑系统特有词汇,训练投诉工单词库。
在一种可选的实施方式中,装置还包括:
选择处理模块,用于从每个原始投诉工单集群中选择一个投诉工单;
发送处理模块,用于将选择的投诉工单发送至与该投诉工单所属的原始投诉工单集群的故障类型对应的故障处理端。
在一种可选的实施方式中,装置还包括:
接收处理模块,用于接收由各故障处理端返回的针对所对应的原始故障工单集群的故障类型的处理结果。
根据本发明实施例的又一方面,提供一种确定故障类型的设备,包括:
存储器,用于存储程序;
处理器,用于运行存储器中存储的程序,以执行本发明实施例提供的确定故障类型的方法。
根据本发明实施例的再一方面,提供一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现本发明实施例提供的确定故障类型的方法。
根据本发明实施例中的确定故障类型的方法、装置、设备和介质,能够根据多个原始投诉工单对应的分词单元,对多个原始投诉工单聚类,并确定每一原始投诉工单集群。由于每一原始投诉工单集群中任意两个投诉工单的相似度大于预设的相似度阈值,每一集群中的原始投诉工单对应同一故障类型。因此,确定了每个集群的故障类型即可确定该集群中所有原始投诉工单的故障类型,因此,提高了确定故障类型的效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是示出根据本发明实施例的确定故障类型的方法的示意流程图;
图2示出了本发明实施例的示例性的投诉工单聚类过程的示意图;
图3示出了本发明实施例中示例性的原始投诉工单集群与故障处理端的对应关系;
图4示出了根据本发明一实施例提供的确定故障类型的装置的结构示意图;
图5是本发明实施例中确定故障类型的设备的示例性硬件架构的结构图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
若业务支撑系统的部分功能故障,例如,缴费功能故障。会收到由多个操作人员生成的多个原始投诉工单。然而,可能不同地区、不同语言习惯的人对同一故障的表述方式不同。例如,用户A提交的原始投诉工单的具体内容为“缴费提交卡住了”,用户B提交的原始投诉工单的具体内容为“缴费提交报500错误”,用户C“缴费提交不了”,用户D“缴费提交失败”。无法对海量投诉工单进行批量处理,效率较低。
因此,需要一种能提高对投诉清单处理效率的方法、装置、系统和介质。
为了更好的理解本发明,下面将结合附图,详细描述根据本发明实施例的确定故障类型的方法、装置、设备和介质,应注意,这些实施例并不用来限制本发明公开的范围。
图1是示出根据本发明实施例的确定故障类型的方法的示意流程图。如图1所示,本实施例中的确定故障类型的方法100可以包括以下步骤:
S110,获取由业务支撑系统的操作人员生成的多个原始投诉工单。
在本发明的一些实施例中,原始投诉工单的具体形式可以是操作人员对业务支撑系统故障的一句中文描述。例如,“业务套餐无法取消”。
具体地,当业务支撑系统的操作人员发现业务支撑系统的某一功能出现问题时,可以在相应的平台填写并提交原始投诉工单。
在本发明的一些实施例中,业务支撑系统的操作人员可以指:对通信运营商的业务支撑系统拥有操作权限的人员。例如,通信运营商的营业厅的营业员。
S120,利用投诉工单词库对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元。
在本发明的一些实施例中,对每一原始投诉工单进行分词处理后,将一句话切分为多个词。其中,每个词视为一个分词单元。
例如,用户A提交了“缴费提交卡住了”进行分词处理后,得到5个分词单元“缴费”“提交”“卡住”“了”。
在本发明的一些实施例中,由于分词处理是基于投诉工单词库进行的,S120中的分词单元是具有通信领域特色或者业务支撑系统特色的分词单元。
例如“月账单”、“话费充值”“500错误”等特色分词单元。
在本发明的一些实施例中,为了提高分词的精度以及词库的针对性,S120中的投诉工单词库是通过训练得到的。训练投诉工单词库的方法,具体包括:
利用由业务支撑系统的操作人员生成的多个历史投诉工单和业务支撑系统特有词汇,训练投诉工单词库。
在一些实施例中,用来训练投诉工单词库的历史投诉工单可以是从某一时间段产生的原始投诉工单中筛选的、较为典型的原始投诉工单。
作一个示例,由于在不同年份使用词语可能具有不同特点,为了保证词库的准确性,可以是从近三年内的原始投诉工单中筛选出的典型的原始投诉工单。
在一些实施例中,业务支撑系统特有词汇是指在使用业务支撑系统的过程中使用或涉及的专有词汇。
与现有的通用词汇的不同之处在于,在业务支撑系统中的特有词汇往往具有通信领域词汇的特点。例如,“套餐办理”、“开户”、“话单”和“结算”等。
在本发明的一些实施例中,为了进一步提高分词的精准性,S120的具体实施方式包括:
利用投诉工单词库和jiaba分词技术,对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元。
S130,基于多个原始投诉工单对应的分词单元,对多个原始投诉工单聚类,得到多个原始投诉工单集群。
其中,每个原始投诉工单集群中任意两个投诉工单的相似度大于预设的相似度阈值。
在本发明的一些实施例中,相似度阈值可以是根据实际情况确定的值,以使相似度高于预设的相似度阈值的投诉工单属于同一故障类型。当相似度阈值的取值过大时,原始投诉工单集群中的投诉工单的数量越少,可能同一故障类型的投诉工单无法划分入该集群。当相似度阈值取值过小时,原始故障工单集群中的投诉工单数量较多,可能无法按照故障类型划分出多个集群。
在一个可选的实施例中,相似度阈值可以预设为90%。
具体地,当两个原始投诉工单的相似度大于等于90%时,该两个投诉工单属于同一原始投诉工单集群,且对应同一故障类型;若两个原始投诉工单的相似度小于90%,两个原始投诉工单属于不同的集群,且对应于不同的故障类型。
在本发明的一些实施例中,两个原始投诉工单中,一原始投诉工单B相对于另一原始投诉工单A的相似度P满足公式(1):
其中,Len(B)是原始投诉工单B的字符串总长度。原始投诉工单A和原始投诉工单B共有n个相同分词单元,分别为W1、W2、……、Wn。n个相同分词单元的长度分别为Len(W1)、Len(W2)、……、Len(Wn)。
通过本发明实施例中的相似度计算公式,能使得语义接近的投诉工单的相似度计算值较大;语义较远的投诉工单的相似度计算值较小。
在一些实施例中,原始投诉工单的字符串总长度可以是原始投诉工单的字数,分词单元的长度可以是分词单元的字数。例如“通话账单”的长度为4。
在一些实施例中,为了能够提高相似度计算的准确性,在分词及相似度计算时,可以忽略原始投诉清单中的语气词、助词、形容词等。例如“了”“啊”、“的”等。
作一个具体的示例,若原始投诉工单A为“业务套餐缴费提交卡住了”,原始投诉工单A的分词单元包括“业务套餐”、“缴费”、“提交”和“卡住”。
原始投诉工单B为“业务套餐缴费提交失败”,原始投诉工单B的分词单元包括:“业务套餐”、“缴费”、“提交”和“失败”。此时,Len(B)=10。
两个投诉工单的相同分词单元为“业务套餐”、“缴费”和“提交”。
此时,原始投诉工单B相对于原始投诉工单A的相似度P等于80%。
在本发明的一些实施例中,S130具体包括:
S131,选取多个原始投诉工单中任意一个作为目标投诉工单,将多个原始投诉工单中除目标投诉工单之外的投诉工单作为待聚类投诉工单。
作一个示例,图2示出了本发明实施例的示例性的投诉工单聚类过程的示意图。如图2所示,若多个原始投诉工单分别为工单A、工单B、工单C、工单D、工单E和工单F。
A工单“缴费提交卡住了”可作为目标投诉工单。工单B、工单C、工单D、工单E和工单F为待聚类工单。
具体地,工单B“缴费提交报500错误”,工单C“缴费提交不了”、工单D“缴费提交失败”、工单E“月账单无法打印”、工单F“月账单打印失败”。
S132,从待聚类投诉工单中,筛选出与目标投诉工单相似度大于预设的相似度阈值的原始投诉工单作为第一投诉工单。
其中,目标投诉工单与待聚类投诉工单的相似度是基于目标投诉工单的分词单元和待聚类投诉工单的分词单元得到的。
作一个示例,继续参照图2,若工单B、工单C和工单D,相对于工单A的相似度大于预设的相似度阈值,则工单B、工单C和工单D为第一投诉工单。
在一些实施例中,S132具体包括:
计算待聚类投诉工单中每一原始投诉工单与目标投诉工单的相似度,其中,相似度等于该原始投诉工单与目标投诉工单的相同分词单元的字符串长度除以该原始投诉工单的字符串总长度得到的商值。
本实施例中的计算方法与公式(1)相同,在此不再赘述。
S133,将第一投诉工单和目标投诉工单聚类,得到与目标投诉工单对应的原始投诉工单集群,将待聚类投诉工单中除第一投诉工单之外的工单作为新的待聚类投诉工单。
作一个示例,继续参照图2,可以将工单A、工单B、工单C和工单D聚合成一个原始投诉工单集群A。由于工单E、工单F相对于工单A的相似度小于预设的相似度阈值,则可以将工单E和工单F作为新的待聚类投诉工单。
S134,从新的待聚类投诉工单中任意选取一个作为目标投诉工单,直到新的待聚类投诉工单为空集。
作一个示例,继续参照图2,可以将工单E作为目标投诉工单,然后返回执行S132,工单F与工单E的相似度大于预设的相似度阈值,工单F作为第一投诉工单。工单E和工单F聚类,得到原始投诉工单集群A。此时,新的待聚类投诉工单为空集,没有新的待聚类投诉工单。确定所有原始投诉工单均完成聚类。
在一些实施例中,S134的具体实施方式包括:
S1341,判断S133得到的新的待聚类投诉工单是否为空集。若为空集,确定所有原始投诉工单均完成聚类;若不为空集,执行S1342。
S1342,从新的待聚类投诉工单中任意选择一个投诉工单作为目标投诉工单,重复执行S132至S134,直到新的待聚类投诉工单为空集。
在本发明的一些实施例中,S120和S130的实现方式可以通过F-IDF模型实现。具体地,将S110获取的多个原始投诉工单输入TF-IDF模型后,可以得到多个原始投诉工单集群。
其中,F-IDF模型可以包括用以实现S120的分词模块和实现S130的相似度计算模块和计算模块。
在一些实施例中,TF-IDF模型是基于投诉工单词库训练的。
S140,确定每一原始投诉工单集群对应的故障类型。
根据本发明实施例中的确定故障类型的方法、装置、设备和介质,能够根据多个原始投诉工单对应的分词单元,对多个原始投诉工单聚类,并确定每一原始投诉工单集群。由于每一原始投诉工单集群中任意两个投诉工单的相似度大于预设的相似度阈值,每一集群中的原始投诉工单对应同一故障类型。因此,确定了每个集群的故障类型即可确定该集群中所有原始投诉工单的故障类型,因此,提高了确定故障类型的效率。
在本发明的一些实施例中,可以基于业务支撑平台可能出现的故障,预先划分出多个故障类型。例如,缴费类故障、话单查询类故障等。
在本发明的一些实施例中,每一原始投诉工单集群均各自对应一个故障类型。
在本发明的一些实施例中,由于一个原始投诉工单集群中的全部投诉工单均是针对同一故障的投诉。确定故障类型的方法100还包括:
S150,从每个原始投诉工单集群中选择一个投诉工单。
具体地,可以从每个原始投诉工单集群中任意选择一个投诉工单,作为代表该集群反映故障的原始投诉工单。
作一个示例,继续参照图2,可以从原始投诉工单集群A中选择工单D“缴费提示失败”。
S160,将选择的投诉工单发送至与该投诉工单所属的原始投诉工单集群的故障类型对应的故障处理端。
作一个示例,图3示出了本发明实施例中示例性的原始投诉工单集群与故障处理端的对应关系。
如图3所示,每一故障类型均对应一个用于处理该故障的故障处理端。如,故障处理端A用于处理故障类型A;故障处理端B用于处理故障类型B;……;故障处理端N用于处理故障类型N。
根据S140确定了N个原始投诉工单集群对应的故障类型后,可以从原始投诉工单集群中选择一个投诉工单,发送给该集群的故障类型对应的故障处理端。具体地,若原始投诉工单集群A对应故障类型N,则可以将该集群中的工单D“缴费提交失败”发送至故障处理端N。
在一些实施例中,为了能够准确的找到与S150中选择的投诉工单对应的故障处理端,S160的具体实施方式可以包括:
S161,确定S150中选择的投诉工单对应的故障网页的统一资源定位符(UniformResource Locator,URL)。
具体地,操作人员打开业务支撑系统的某一页面进行某一功能操作,若操作失败,会自动记录该出错网页的URL。此外,操作人员可以生成该功能操作失败的原始投诉工单。
S162,基于故障网页的URL、故障处理端与可处理URL的对应关系,确定S150中选择的投诉工单对应的故障处理端。相应地,也是S150中选择的投诉工单所属原始投诉工单集群对应的故障处理端。
作一个示例,故障处理端A处理第一URL产生的故障,若S150中选择的工单X对应的故障网元同为第一URL,则可以将工单X发送至故障处理端A。
需要说明的是,在现有技术中,若产生了多个投诉工单,则会将多个投诉工单均发送至故障处理端。此时故障处理端可能会接收到反映同一故障的多个重复的投诉工单。为了减小故障处理端的工作量,可以从一个原始投诉工单集群中选择一个代表性的、能够反映故障类型的投诉工单发送至故障处理端。
在一些实施例中,S160中可以自动将S150中选择的投诉工单派发至相应的故障处理端。
在本发明的一些实施例中,为了提高操作人员使用感知,S160之后,确定故障类型的方法100还包括:
S170,接收由各故障处理端返回的针对所对应的原始故障工单集群的故障类型的处理结果。
作一个示例,若故障处理端N接收到工单D“缴费提交失败”。故障处理端可以根据工单D得知相应的故障,并对故障进行修复。修复之后,可以将修复结果返回给工单D所属的原始投诉工单集群A。
下面结合附图,详细介绍根据本发明实施例的装置。
基于相同的发明构思,本发明另一实施例提供了确定故障类型的装置。图4示出了根据本发明一实施例提供的确定故障类型的装置的结构示意图。如图4所示,确定故障类型的装置400包括获取处理模块410、分词处理模块420、聚类处理模块430和确定故障模块440:
获取处理模块410,用于获取由业务支撑系统的操作人员生成的多个原始投诉工单。
分词处理模块420,用于利用投诉工单词库对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元。
聚类处理模块430,用于基于多个原始投诉工单对应的分词单元,对多个原始投诉工单聚类,得到多个原始投诉工单集群,每个原始投诉工单集群中任意两个投诉工单的相似度大于预设的相似度阈值。
确定故障模块440,用于确定每一原始投诉工单集群对应的故障类型。
在本发明的一些实施例中,确定故障类型的装置400还包括:
训练处理模块,用于利用由业务支撑系统的操作人员生成的多个历史投诉工单和业务支撑系统特有词汇,训练投诉工单词库。
在本发明的一些实施例中,确定故障类型的装置400还包括:
选择处理模块,用于从每个原始投诉工单集群中选择一个投诉工单;
发送处理模块,用于将选择的投诉工单发送至与该投诉工单所属的原始投诉工单集群的故障类型对应的故障处理端。
在本发明的一些实施例中,确定故障类型的装置400还包括:
接收处理模块,用于接收由各故障处理端返回的针对所对应的原始故障工单集群的故障类型的处理结果。
在本发明的一些实施例中,聚类处理模块430,具体用于:
选取多个原始投诉工单中任意一个作为目标投诉工单,将多个原始投诉工单中除目标投诉工单之外的投诉工单作为待聚类投诉工单;
从待聚类投诉工单中,筛选出与目标投诉工单相似度大于预设的相似度阈值的原始投诉工单作为第一投诉工单,目标投诉工单与待聚类投诉工单的相似度是基于目标投诉工单的分词单元和待聚类投诉工单的分词单元得到的,
将第一投诉工单和目标投诉工单聚类,得到与目标投诉工单对应的原始投诉工单集群,将待聚类投诉工单中除第一投诉工单之外的工单作为新的待聚类投诉工单;
从新的待聚类投诉工单中任意选取一个作为目标投诉工单,直到新的待聚类投诉工单为空集。
在本发明的一些实施例中,聚类处理模块430,具体用于:
计算待聚类投诉工单中每一原始投诉工单与目标投诉工单的相似度,其中,相似度等于该原始投诉工单与目标投诉工单的相同分词单元的字符串长度除以该原始投诉工单的字符串总长度得到的商值。
在本发明的一些实施例中,分词处理模块420,具体用于:
利用投诉工单词库和jiaba分词技术,对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元。
根据本发明实施例的确定故障类型的装置的其他细节与以上结合图1至图3描述的根据本发明实施例的方法类似,在此不再赘述。
图5是本发明实施例中确定故障类型的设备的示例性硬件架构的结构图。
如图5所示,确定故障类型的设备500包括输入设备501、输入接口502、中央处理器503、存储器504、输出接口505、以及输出设备506。其中,输入接口502、中央处理器503、存储器504、以及输出接口505通过总线510相互连接,输入设备501和输出设备506分别通过输入接口502和输出接口505与总线510连接,进而与确定故障类型的设备500的其他组件连接。
具体地,输入设备501接收来自外部的输入信息,并通过输入接口502将输入信息传送到中央处理器503;中央处理器503基于存储器504中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器504中,然后通过输出接口505将输出信息传送到输出设备506;输出设备506将输出信息输出到确定故障类型的设备500的外部供用户使用。
也就是说,图5所示的确定故障类型的设备也可以被实现为包括:存储有计算机可执行指令的存储器;以及处理器,该处理器在执行计算机可执行指令时可以实现结合图1至图2描述的确定故障类型的设备的方法和装置。
在一个实施例中,图5所示的确定故障类型的设备500可以被实现为一种设备,该设备可以包括:存储器,用于存储程序;处理器,用于运行所述存储器中存储的所述程序,以执行本发明实施例的确定故障类型的方法。
本发明实施例还提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现本发明实施例的确定故障类型的方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

Claims (13)

1.一种确定故障类型的方法,其特征在于,所述方法包括:
获取由业务支撑系统的操作人员生成的多个原始投诉工单;
利用投诉工单词库对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元;
基于多个原始投诉工单对应的分词单元,对所述多个原始投诉工单聚类,得到多个原始投诉工单集群,每个原始投诉工单集群中任意两个投诉工单的相似度大于预设的相似度阈值;
确定每一原始投诉工单集群对应的故障类型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用由所述业务支撑系统的操作人员生成的多个历史投诉工单和业务支撑系统特有词汇,训练所述投诉工单词库。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从每个原始投诉工单集群中选择一个投诉工单;
将选择的投诉工单发送至与该投诉工单所属的原始投诉工单集群的故障类型对应的故障处理端。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
接收由各故障处理端返回的针对所对应的原始故障工单集群的故障类型的处理结果。
5.根据权利要求1所述的方法,其特征在于,所述基于多个原始投诉工单对应的分词单元,对所述多个原始投诉工单聚类,得到多个原始投诉工单集群,具体包括:
选取所述多个原始投诉工单中任意一个作为目标投诉工单,将所述多个原始投诉工单中除所述目标投诉工单之外的投诉工单作为待聚类投诉工单;
从所述待聚类投诉工单中,筛选出与所述目标投诉工单相似度大于所述预设的相似度阈值的原始投诉工单作为第一投诉工单,所述目标投诉工单与待聚类投诉工单的相似度是基于所述目标投诉工单的分词单元和所述待聚类投诉工单的分词单元得到的,
将所述第一投诉工单和所述目标投诉工单聚类,得到与所述目标投诉工单对应的原始投诉工单集群,将所述待聚类投诉工单中除第一投诉工单之外的工单作为新的待聚类投诉工单;
从所述新的待聚类投诉工单中任意选取一个作为目标投诉工单,直到所述新的待聚类投诉工单为空集。
6.根据权利要求5所述的方法,其特征在于,所述从所述待聚类投诉工单中,筛选出与所述目标投诉工单相似度大于预设相似度阈值的原始投诉工单作为第一投诉工单,具体包括:
计算所述待聚类投诉工单中每一原始投诉工单与所述目标投诉工单的相似度,其中,所述相似度等于该原始投诉工单与所述目标投诉工单的相同分词单元的字符串长度除以该原始投诉工单的字符串总长度得到的商值。
7.根据权利要求1所述的方法,其特征在于,所述利用投诉工单词库对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元,具体包括:
利用投诉工单词库和jiaba分词技术,对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元。
8.一种确定故障类型的装置,其特征在于,所述装置包括:
获取处理模块,用于获取由业务支撑系统的操作人员生成的多个原始投诉工单;
分词处理模块,用于利用投诉工单词库对每一原始投诉工单进行分词处理后,得到该原始投诉工单对应的分词单元;
聚类处理模块,用于基于多个原始投诉工单对应的分词单元,对所述多个原始投诉工单聚类,得到多个原始投诉工单集群,每个原始投诉工单集群中任意两个投诉工单的相似度大于预设的相似度阈值;
确定故障模块,用于确定每一原始投诉工单集群对应的故障类型。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
训练处理模块,用于利用由所述业务支撑系统的操作人员生成的多个历史投诉工单和业务支撑系统特有词汇,训练所述投诉工单词库。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
选择处理模块,用于从每个原始投诉工单集群中选择一个投诉工单;
发送处理模块,用于将选择的投诉工单发送至与该投诉工单所属的原始投诉工单集群的故障类型对应的故障处理端。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
接收处理模块,用于接收由各故障处理端返回的针对所对应的原始故障工单集群的故障类型的处理结果。
12.一种确定故障类型的设备,其特征在于,所述设备包括:
存储器,用于存储程序;
处理器,用于运行所述存储器中存储的所述程序,以执行权利要求1-7任一权利要求所述的确定故障类型的方法。
13.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现权利要求1-7任一权利要求所述的确定故障类型的方法。
CN201811520497.4A 2018-12-12 2018-12-12 确定故障类型的方法、装置、设备和介质 Pending CN109657240A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811520497.4A CN109657240A (zh) 2018-12-12 2018-12-12 确定故障类型的方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811520497.4A CN109657240A (zh) 2018-12-12 2018-12-12 确定故障类型的方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN109657240A true CN109657240A (zh) 2019-04-19

Family

ID=66114402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811520497.4A Pending CN109657240A (zh) 2018-12-12 2018-12-12 确定故障类型的方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN109657240A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110337118A (zh) * 2019-04-24 2019-10-15 中国联合网络通信集团有限公司 用户投诉快速处理方法及装置
CN110601904A (zh) * 2019-09-27 2019-12-20 苏州浪潮智能科技有限公司 一种电子邮件故障识别方法、装置和计算机可读存储介质
CN113836888A (zh) * 2021-11-25 2021-12-24 中关村科学城城市大脑股份有限公司 一种确定工单主题的方法、装置、介质及计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104299182A (zh) * 2014-10-08 2015-01-21 天津大学 基于聚类的城市基础设施突发事件的检测方法
CN108182523A (zh) * 2017-12-26 2018-06-19 新疆金风科技股份有限公司 故障数据的处理方法和装置、计算机可读存储介质
CN108345670A (zh) * 2018-02-09 2018-07-31 国网江苏省电力有限公司电力科学研究院 一种用于95598电力工单的服务热点发现方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104299182A (zh) * 2014-10-08 2015-01-21 天津大学 基于聚类的城市基础设施突发事件的检测方法
CN108182523A (zh) * 2017-12-26 2018-06-19 新疆金风科技股份有限公司 故障数据的处理方法和装置、计算机可读存储介质
CN108345670A (zh) * 2018-02-09 2018-07-31 国网江苏省电力有限公司电力科学研究院 一种用于95598电力工单的服务热点发现方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110337118A (zh) * 2019-04-24 2019-10-15 中国联合网络通信集团有限公司 用户投诉快速处理方法及装置
CN110601904A (zh) * 2019-09-27 2019-12-20 苏州浪潮智能科技有限公司 一种电子邮件故障识别方法、装置和计算机可读存储介质
CN113836888A (zh) * 2021-11-25 2021-12-24 中关村科学城城市大脑股份有限公司 一种确定工单主题的方法、装置、介质及计算机设备

Similar Documents

Publication Publication Date Title
CN102768659B (zh) 重复账号自动识别方法和系统
CN109583746B (zh) 设置流程的路由规则的方法及装置、可读存储介质
CN109657240A (zh) 确定故障类型的方法、装置、设备和介质
CN110515937A (zh) 一种数据校验方法及装置
CN110162516B (zh) 一种基于海量数据处理的数据治理的方法及系统
EP2581843A2 (en) Bigram Suggestions
CN1983210A (zh) 软件跟踪能力管理方法和装置
EP3279806A1 (en) Data processing method and apparatus
CN105630827B (zh) 一种信息处理方法、系统及辅助系统
CN108027814A (zh) 停用词识别方法与装置
CN106156170B (zh) 舆情分析方法及装置
CN110764999A (zh) 自动化测试方法、装置、计算机装置及存储介质
CN103488672B (zh) 在关联存储器内创建优化比较标准
CN109960719A (zh) 一种文件处理方法和相关装置
CN114064112A (zh) 业务流程配置方法、装置、设备及存储介质
US20200082822A1 (en) System and method for mapping a customer journey to a category
CN109308564A (zh) 人群绩效等级识别方法、装置、存储介质及计算机设备
CN114462582A (zh) 基于卷积神经网络模型的数据处理方法及装置、设备
CN112860672A (zh) 标签权重的确定方法和装置
CN101495978A (zh) 减少总线连接的消费者和产生者之间的消息流
CN108711074B (zh) 业务分类方法、装置、服务器及可读存储介质
CN115496440B (zh) 一种二手车库存量的确定方法及装置
US20180239835A1 (en) Automatically optimizing business process platforms
CN104899216A (zh) 一种废弃话单处理方法及装置
CN111798299A (zh) 一种财务报表的账目结算方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190419