CN112667805A - 一种工单类别确定方法、装置、设备及介质 - Google Patents
一种工单类别确定方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN112667805A CN112667805A CN201910945506.2A CN201910945506A CN112667805A CN 112667805 A CN112667805 A CN 112667805A CN 201910945506 A CN201910945506 A CN 201910945506A CN 112667805 A CN112667805 A CN 112667805A
- Authority
- CN
- China
- Prior art keywords
- work order
- feature vector
- category
- title
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 239000013598 vector Substances 0.000 claims abstract description 322
- 238000013145 classification model Methods 0.000 claims abstract description 58
- 230000002159 abnormal effect Effects 0.000 claims description 52
- 238000004590 computer program Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000012706 support-vector machine Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- QZJWUZMNCFEIMD-UHFFFAOYSA-N [4-[benzyl(2-phenylethyl)amino]-2-(2,5-dimethoxyphenyl)-1h-imidazo[4,5-c]pyridin-6-yl]carbamic acid Chemical compound COC1=CC=C(OC)C(C=2NC3=CC(NC(O)=O)=NC(=C3N=2)N(CCC=2C=CC=CC=2)CC=2C=CC=CC=2)=C1 QZJWUZMNCFEIMD-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种工单类别确定方法、装置、设备及介质,所述方法包括:获取待处理工单,提取出待处理工单中包含的工单信息;根据工单信息中的工单标题、工单内容和工单提示信息生成标题特征向量、内容特征向量、提示信息特征向量,将标题特征向量、内容特征向量和提示信息特征向量进行拼接,得到待处理工单的特征向量;待处理工单的特征向量,将特征向量输入至预先训练好的工单分类模型中,并获得工单分类模型输出的分类结果;根据分类结果确定待处理工单的类别。本发明实施例提供的方法通过根据待处理订单的特征向量以及预先训练好的工单分类模型确定待处理订单的类别,提高了工单类别确定的准确度,进而提高了工单分配的效率。
Description
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种工单类别确定方法、装置、设备及介质。
背景技术
业务工单分配是指待处理的业务工单(例如事件单、问题单等)分配给具体处理人进行处理操作。一般是通过处理人员手动提取工单或者由服务台管理人员指派工单处理人员进行工单分配处理。其中,服务台管理人员的主要工作就是解答咨询类工单,并通过工单标题、详细内容和附件等信息对各类别的业务工单进行所属业务类别的判断,并分配给相应的处理组,进而交由处理组内的处理人受理后解决。
在实现本发明的过程中,发明人发现现有技术中至少存在以下技术问题:目前的工单分配中,工单分配的准确率主要由分配人的业务知识水平决定,若分配人业务水平较弱,则会影响整个业务工单的处理时效,并且人工分配的方式效率低,耗时耗力。
发明内容
本发明实施例提供了一种工单类别确定方法、装置、设备及介质,以实现准确确定工单的类别,以提高工单的分配效率。
第一方面,本发明实施例提供了一种工单类别确定方法,包括:
获取待处理工单,提取出所述待处理工单中包含的工单信息,其中,所述工单信息包括工单标题、工单内容和工单提示信息;
将所述工单标题与各类别的标题关键词相匹配,根据所述工单标题与各所述类别标题关键词的匹配结果生成所述待处理工单的标题特征向量;
将所述工单内容与各类别的内容关键词相匹配,根据所述工单内容与各所述类别内容关键词的匹配结果生成所述待处理工单的内容特征向量;
计算所述工单提示信息与各所述类别对应的异常库信息之间的相似度,根据各所述相似度生成所述待处理工单的提示信息特征向量;
将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行拼接,得到所述待处理工单的特征向量;
将所述特征向量输入至预先训练好的工单分类模型中,并获得所述工单分类模型输出的分类结果;
根据所述分类结果确定所述待处理工单的类别。
第二方面,本发明实施例还提供了一种工单类别确定装置,包括:
工单信息获取模块,用于获取待处理工单,提取出所述待处理订单中包含的工单信息,其中,所述工单信息包括工单标题、工单内容和工单提示信息;
标题特征向量模块,用于将所述工单标题与各类别的标题关键词相匹配,根据所述工单标题与各所述类别标题关键词的匹配结果生成所述待处理工单的标题特征向量;
内容特征向量模块,用于将所述工单内容与各类别的内容关键词相匹配,根据所述工单内容与各所述类别内容关键词的匹配结果生成所述待处理工单的内容特征向量;
提示信息特征向量模块,用于计算所述工单提示信息与各所述类别对应的异常库信息之间的相似度,根据各所述相似度生成所述待处理工单的提示信息特征向量;
工单特征向量模块,用于将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行拼接,得到所述待处理工单的特征向量;
分类结果获取模块,用于将所述特征向量输入至预先训练好的工单分类模型中,并获得所述工单分类模型输出的分类结果;
工单类别确定模块,用于根据所述分类结果确定所述待处理工单的类别。
第三方面,本发明实施例还提供了一种计算机设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所提供的工单类别确定方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的工单类别确定方法。
本发明实施例通过获取待处理工单,提取出待处理工单中包含的工单信息,其中,工单信息包括工单标题、工单内容和工单提示信息;将工单标题与各类别的标题关键词相匹配,根据工单标题与各类别标题关键词的匹配结果生成待处理工单的标题特征向量;将工单内容与各类别的内容关键词相匹配,根据工单内容与各类别内容关键词的匹配结果生成待处理工单的内容特征向量;计算工单提示信息与各类别对应的异常库信息之间的相似度,根据各相似度生成待处理工单的提示信息特征向量;将标题特征向量、内容特征向量和提示信息特征向量进行拼接,得到待处理工单的特征向量;将特征向量输入至预先训练好的工单分类模型中,并获得工单分类模型输出的分类结果;根据分类结果确定待处理工单的类别,通过根据待处理订单的标题特征向量、内容特征向量、提示信息特征向量,将标题特征向量、内容特征向量和提示信息特征向量生成待处理工单的特征向量,将特征向量输入至预先训练好的工单分类模型中确定待处理订单的类别,提高了工单类别确定的准确度,进而提高了工单分配的效率。
附图说明
图1是本发明实施例一所提供的一种工单类别确定方法的流程图;
图2是本发明实施例二所提供的一种工单类别确定方法的流程图;
图3是本发明实施例三所提供的一种工单类别确定方法的流程图;
图4a是本发明实施例四所提供的一种工单类别确定方法的流程图;
图4b是本发明实施例四所提供的一种工单类别确定系统的结构示意图;
图5是本发明实施例五所提供的一种工单类别确定装置的结构示意图;
图6是本发明实施例六所提供的计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一所提供的一种工单类别确定方法的流程图。本实施例可适用于确定待处理工单的工单类别时的情形。该方法可以由工单类别确定装置执行,该工单类别确定装置可以采用软件和/或硬件的方式实现,例如,该工单类别确定装置可配置于计算机设备中。如图1所示,所述方法包括:
S110、获取待处理工单,提取出所述待处理工单中包含的工单信息,其中,所述工单信息包括工单标题、工单内容和工单提示信息。
在本实施例中,待处理工单可以为待处理的IT基础架构库(InformationTechnology Infrastructure Library,ITIL)业务工单,如用户通过工单系统反馈的事件单、问题单等。可选的,用户通过工单系统填写工单后,通过控件触发工单提交功能,工单处理系统获取用户提交的待处理工单,并提取出待处理工单中包含的工单信息。
在本发明的一种实施方式中,用户通过工单处理系统填写的工单格式相同,可以通过预先设置提取规则从待处理工单中提取出待处理工单的工单信息。可选的,工单信息包括工单标题、工单内容、工单提示信息等信息。可以预先设置各工单信息对应的信息控件,针对每一工单信息,从与该工单信息对应的信息控件中获取与该工单信息对应的内容。
示例性的,如工单标题对应的信息控件为信息控件1,信息控件1中的文本内容为“商品库存有误”,则获取信息控件1中的文本内容“商品库存有误”作为待处理工单的工单标题。
在本实施例中,工单提示信息为待处理工单中的系统提示信息。如,当用户在管理系统中输入某一参数时,管理系统通过弹窗提示用于“参数输入有误”,用户可以对包含有系统弹窗的区域进行截图,在填写工单时,将该截图作为附件添加至工单中。工单系统获取附件中的截图,将该截图作为工单提示信息。可选的,提取出的待处理工单中的工单信息为文本格式的信息。当获取的待处理工单中的工单信息为图片格式时,可以通过文字识别的方式将图片格式的工单信息转化为文本格式的工单信息。如上述工单提示信息为用户上传的截图,为图片格式的提示信息,可以通过文字识别算法对图片格式的工单提示信息进行文字识别,获得文本格式的工单提示信息。
S120、将所述工单标题与各类别的标题关键词相匹配,根据所述工单标题与各所述类别标题关键词的匹配结果生成所述待处理工单的标题特征向量。
在本实施例中,分别从待处理工单的工单标题、工单内容和提示信息中进行特征提取,构建待处理工单的标题特征向量、内容特征向量以及提示信息特征向量,然后将标题特征向量、内容特征向量以及提示信息特征向量进行拼接生成待处理工单的特征向量。
可选的,将工单标题分别与工单类别进行精准文本匹配,判断工单标题中是否包含各工单类别,根据判断结果生成待处理工单的标题特征向量。可选的,针对每一工单类别,可以预先设置该工单类别对应的至少一个标题关键词,根据待处理工单的工单标题与各工单类别对应的标题关键词的匹配度构建待处理工单的标题特征向量。其中,待处理工单的标题特征向量中的各元素与工单类别为一一对应的关系。可选的,工单类别对应的标题关键词可以为工单类别的名称。
在本发明的一种实施方式中,所述将所述工单标题与各类别的标题关键词相匹配,根据所述工单标题与各所述类别标题关键词的匹配结果生成所述待处理工单的标题特征向量,包括:
针对每一类别,将所述工单标题与所述类别的关键词相匹配,根据匹配结果生成与所述类别对应的标题特征值;
将各所述类别对应的标题特征值作为所述标题特征向量中各元素的元素值,生成所述待处理工单的标题特征向量。
可选的,可以预先设置匹配结果与标题特征值的对应关系。确定待处理工单的标题特征向量时,将工单标题与各工单类别的关键词相匹配,根据匹配结果以及预先设置的对应关系确定工单标题对应于各工单类别的标题特征值。
示例性的,可以设置匹配成功对应的标题特征值为1,匹配失败对应的标题特征值为0。则当待处理工单的工单标题与某一工单类别的关键词匹配时,该待处理订单对应于该工单类别的标题特征值为1;当待处理工单的工单标题与某一工单类别的关键词不匹配时,该待处理订单对应于该工单类别的标题特征值为0。
在本实施例中,确定待处理订单对应于各工单类别的标题特征值后,将各标题特征值作为标题特征向量中各元素的元素值,生成待处理工单的标题特征向量。
示例性的,若工单类别个数为5,待处理订单对应于工单类别1的标题特征值为1,待处理订单对应于工单类别2的标题特征值为1,待处理订单对应于工单类别3标题特征值为0,待处理订单对应于工单类别4的标题特征值为0,待处理订单对应于工单类别5的标题特征值为0,则生成待处理工单的标题特征向量为H1=[1,1,0,0,0]。
S130、将所述工单内容与各类别的内容关键词相匹配,根据所述工单内容与各所述类别内容关键词的匹配结果生成所述待处理工单的内容特征向量。
可选的,将工单内容分别与工单类别进行精准文本匹配,判断工单内容中是否包含各工单类别,根据判断结果构建待处理工单的内容特征向量。可选的,针对每一工单类别,可以预先设置该工单类别对应的至少一个内容关键词。根据待处理工单的工单内容与各工单类别对应的内容关键词的匹配度确定待处理工单的内容特征向量,其中,待处理工单的内容特征向量中的各元素与工单类别为一一对应的关系。可选的,工单类别对应的内容关键词可以与工单类别的内容关键词相同,也可于与工单类别的内容关键词不同。
在本发明的一种实施方式中,所述将所述工单内容与各类别的内容关键词相匹配,根据所述工单内容与各所述类别内容关键词的匹配结果生成所述待处理工单的内容特征向量,包括:
针对每一类别,将所述工单内容与所述类别的内容关键词相匹配,根据匹配结果生成与所述类别对应的内容特征值;
将各所述类别对应的内容特征值作为所述内容特征向量中各元素的元素值,生成所述待处理工单的内容特征向量。
可选的,可以预先设置匹配结果与内容特征值的对应关系。确定待处理工单的内容特征向量时,将工单内容与各工单类别的关键词相匹配,根据匹配结果以及预先设置的对应关系确定工单内容对应于各工单类别的内容特征值。其中,匹配结果与内容特征值的对应关系可以和匹配结果与内容特征值的对应关系相同,也可以不同。
示例性的,可以设置匹配成功对应的内容特征值为1,匹配失败对应的内容特征值为0。则当待处理工单的工单内容与某一工单类别的内容关键词匹配时,该待处理订单对应于该工单类别的内容特征值为1;当待处理工单的工单内容与某一工单类别的关键词不匹配时,该待处理订单对应于该工单类别的内容特征值为0。
在本实施例中,确定待处理订单对应于各工单类别的内容特征值后,将各内容特征值作为内容特征向量中各元素的元素值,生成待处理工单的内容特征向量。
示例性的,若工单类别个数为5,待处理订单对应于工单类别1的内容特征值为0,待处理订单对应于工单类别2的内容特征值为1,待处理订单对应于工单类别3内容特征值为0,待处理订单对应于工单类别4的内容特征值为0,待处理订单对应于工单类别5的内容特征值为0,则生成待处理工单的内容特征向量为H2=[0,1,0,0,0]。
S140、计算所述工单提示信息与各所述类别对应的异常库信息之间的相似度,根据各所述相似度生成所述待处理工单的提示信息特征向量。
在本实施例中,计算工单提示信息与各工单类别之间的相似度,根据工单提示信息与各工单类别之间的相似度生成待处理工单的提示信息特征向量。可选的,可以预先设置各工单类别对应的异常信息库,其中每一工单类别对应的异常库信息中包括至少一个异常信息。针对每一工单类型,根据工单提示信息与该工单类型中各异常信息之间的相似度确定工单提示信息与该工单类型的相似度,然后根据工单提示信息与各工单类型的相似度构造待处理工单的提示信息特征向量。可选的,针对任一工单类别,该工单类别对应的异常信息库中包含的异常信息可以为该工单类别可能发生事件中系统弹出的弹窗消息或提示消息。
在本发明的一种实施方式中,所述计算所述工单提示信息与各所述类别对应的异常库信息之间的相似度,根据各所述相似度生成所述待处理工单的提示信息特征向量,包括:
针对每一类别,计算所述工单提示信息与所述类别对应的异常库信息中各异常信息之间的相似度,将相似度最大值作为所述工单提示信息与所述类别对应的异常库信息之间的相似度;
将各所述类别对应的相似度作为所述提示信息特征向量中各元素的元素值,生成所述待处理工单的提示信息特征向量。
在本实施例中,可以通过词频-逆向文件频率(term frequency–inversedocument frequency,TF-IDF)算法计算工单提示信息与该工单类别的异常库信息中各异常信息之间的相似度。可选的,针对某一工单类别,可以将工单提示信息与该工单类别的异常库信息中各异常信息之间的相似度最大值作为工单提示信息与该工单类别之间的余弦相似度。
示例性的,若针对工单类别1,其对应的异常库信息中包含有5个异常信息,工单提示信息与异常信息1之间的相似度为0.6,工单提示信息与异常信息2之间的相似度为0.2,工单提示信息与异常信息3之间的相似度为0.1,工单提示信息与异常信息4之间的相似度为0.4,工单提示信息与异常信息5之间的相似度为0.3,则确定工单提示信息与工单类别1之间的相似度为0.6。
在本实施例中,确定工单提示信息与各工单类别之间的相似度后,将各相似度作为提示信息特征向量中各元素的元素值,生成待处理工单的提示信息特征向量。
示例性的,若工单类别个数为5,待处理订单的工单提示信息与工单类别1之间的相似度为0.6,待处理订单的工单提示信息与工单类别2之间的相似度为0.2,待处理订单的工单提示信息与工单类别3之间的相似度为0.8,待处理订单的工单提示信息与工单类别4之间的相似度为0.3,待处理订单的工单提示信息与工单类别5之间的相似度为0.2,则生成待处理工单的提示信息特征向量为H3=[0.6,0.2,0.8,0.3,0.2]。
S150、将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行拼接,得到所述待处理工单的特征向量。
在本实施例中,分别构建待处理工单的标题特征向量、内容特征向量以及提示信息特征向量之后,将标题特征向量、内容特征向量以及提示信息特征向量进行拼接生成待处理工单的特征向量。
在本发明的一种实施方式中,所述将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行拼接,得到所述工单信息的特征向量,包括:
将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行串行拼接,得到所述待处理工单的一维特征向量;或者,
将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行并行拼接,得到所述待处理工单的三维特征向量。
可选的,特征向量的构造分为两种:一种是将两组特征向量首尾相连生成一个联合向量作为新的特征向量,在更高维的向量空间进行特征提取,即串行组合;另一种是利用复向量将同一样本的两组特征向量合并在一起,在复向量空间进行特征提取,即并行组合。本实施例中,对向量的拼接方式不做限定,只要满足工单分类模型的输入要求即可。需要说明的是,在进行向量拼接时,要保证标题特征向量、内容特征向量和提示信息特征向量中各相应元素对应的工单类型为同一工单类型。例如,标题特征向量、内容特征向量和提示信息特征向量中的第一个元素对应的工单类型均为工单类型1。
示例性的,若标题特征向量H1=[1,1,0,0,0],内容特征向量H2=[0,1,0,0,0],提示信息特征向量H3=[0.6,0.2,0.8,0.3,0.2],则将标题特征向量、内容特征向量和提示信息特征向量进行串行拼接后,得到所述待处理工单的一维特征向量为H=[1,1,0,0,0,0,1,0,0,0,0.6,0.2,0.8,0.3,0.2];将标题特征向量、内容特征向量和提示信息特征向量进行并行拼接后,得到所述待处理工单的三维特征向量为H=[1,1,0,0,0;0,1,0,0,0;0.6,0.2,0.8,0.3,0.2]。
S160、将所述特征向量输入至预先训练好的工单分类模型中,并获得所述工单分类模型输出的分类结果。
在本实施例中,根据待处理工单的工单信息生成待处理工单的特征向量,然根据待处理工单的特征向量以及预先训练好的工单分类模型得到待处理工单的分类结果。一般的,不同的工单类别具有不同的类别特征(如关键词、异常信息等特征),待处理工单的特征向量用于表征待处理工单的工单信息与各工单类别的类别特征之间的关系。
可选的,可以根据待处理工单的工单信息与各工单类别的类别特征之间的关联度生成待处理工单的特征向量。示例性的,可以将待处理工单的各工单信息与各工单类别的类别特征进行匹配,根据匹配结果生成待处理工单的特征向量。
可选的,获得待处理工单的特征向量后,将待处理工单的特征向量输入至预先训练好的工单分类模型中,获得工单分类模型输出的分类结果,作为待处理工单的分类结果。
S170、根据所述分类结果确定所述待处理工单的类别。
在本实施例中,可以将工单分类模型输出的分类结果作为待处理工单的类别;也可以预先建立分类结果与类别之间的对应关系表,在获得工单分类模型输出的分类结果后,通过查找预先设置的对应关系表,确定与分类结果对应的类别,将确定的类别作为待处理工单的类别。
本发明实施例通过获取待处理工单,提取出待处理工单中包含的工单信息,其中,工单信息包括工单标题、工单内容和工单提示信息;将工单标题与各类别的标题关键词相匹配,根据工单标题与各类别标题关键词的匹配结果生成待处理工单的标题特征向量;将工单内容与各类别的内容关键词相匹配,根据工单内容与各类别内容关键词的匹配结果生成待处理工单的内容特征向量;计算工单提示信息与各类别对应的异常库信息之间的相似度,根据各相似度生成待处理工单的提示信息特征向量;将标题特征向量、内容特征向量和提示信息特征向量进行拼接,得到待处理工单的特征向量;将特征向量输入至预先训练好的工单分类模型中,并获得工单分类模型输出的分类结果;根据分类结果确定待处理工单的类别,通过根据待处理订单的标题特征向量、内容特征向量、提示信息特征向量,将标题特征向量、内容特征向量和提示信息特征向量生成待处理工单的特征向量,将特征向量输入至预先训练好的工单分类模型中确定待处理订单的类别,提高了工单类别确定的准确度,进而提高了工单分配的效率。
实施例二
图2是本发明实施例二所提供的一种工单类别确定方法的流程图。本实施例在上述实施例的基础上进行进一步地优化。如图2所示,所述方法包括:
S210、获取至少一个历史工单对应的历史工单特征向量以及所述历史工单的历史工单类别。
S220、基于所述历史工单特征向量与所述历史工单类别生成样本对,对预先建立的工单分类模型进行训练,得到训练好的工单分类模型。
在本实施例中,在使用工单分类模型确定待处理工单的工单类型之前,对预先建立好的工单分类模型进行训练,得到训练好的工单分类模型。
在本实施例的一种实施方式中,可以预先获取至少一个历史工单以及历史工单的工单类别,根据历史工单的工单信息构建历史工单的特征向量。基于历史工单特征向量与历史工单类别生成样本对,对预先建立好的工单分类模型进行训练,获得训练好的工单分类模型,便可以通过训练好的工单分类模型确定待处理工单的分类信息。可选的,可以基于聚类方法、K近邻法、神经网络和支持向量机方法中的一种以上分类方法建立工单分类模型。例如,可以采用支持向量机的学习分类算法,构建SVM分类器模型作为工单分类模型。
可选的,历史工单的特征向量的构建方式可以参见上述实施例,在此不再赘述。
S230、获取待处理工单,提取出所述待处理工单中包含的工单信息,其中,所述工单信息包括工单标题、工单内容和工单提示信息。
S240、将所述工单标题与各类别的标题关键词相匹配,根据所述工单标题与各所述类别标题关键词的匹配结果生成所述待处理工单的标题特征向量。
S250、将所述工单内容与各类别的内容关键词相匹配,根据所述工单内容与各所述类别内容关键词的匹配结果生成所述待处理工单的内容特征向量。
S260、计算所述工单提示信息与各所述类别对应的异常库信息之间的相似度,根据各所述相似度生成所述待处理工单的提示信息特征向量。
S270、将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行拼接,得到所述待处理工单的特征向量。
S280、将所述特征向量输入至预先训练好的工单分类模型中,并获得所述工单分类模型输出的分类结果。
S290、根据所述分类结果确定所述待处理工单的类别。
本发明实施例的技术方案,在上述实施例的基础上增加了使用历史工单信息对建立好的工单分类模型进行训练的操作,通过获取至少一个历史工单对应的历史工单特征向量以及历史工单的历史工单类别。基于历史工单特征向量与历史工单类别生成样本对,对预先建立的工单分类模型进行训练,得到训练好的工单分类模型,使得基于工单分类模型的分类更加准确。
实施例三
图3是本发明实施例三所提供的一种工单类别确定方法的流程图。本实施例在上述实施例的基础上进行进一步地优化。如图4所示,所述方法包括:
S310、获取待处理工单,提取出所述待处理工单中包含的工单信息,其中,所述工单信息包括工单标题、工单内容和工单提示信息。
S320、将所述工单标题与各类别的标题关键词相匹配,根据所述工单标题与各所述类别标题关键词的匹配结果生成所述待处理工单的标题特征向量。
S330、将所述工单内容与各类别的内容关键词相匹配,根据所述工单内容与各所述类别内容关键词的匹配结果生成所述待处理工单的内容特征向量。
S340、计算所述工单提示信息与各所述类别对应的异常库信息之间的相似度,根据各所述相似度生成所述待处理工单的提示信息特征向量。
S350、将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行拼接,得到所述待处理工单的特征向量。
S360、将所述特征向量输入至预先训练好的工单分类模型中,并获得所述工单分类模型输出的分类结果。
S370、根据所述分类结果确定所述待处理工单的类别。
S380、根据预先设置的类别与处理组的对应关系,确定与所述类别对应的处理组。
一般的,待处理工单需要分配至具体的处理人进行处理。在本实施例中,通过待处理工单的类别确定待处理工单对应的处理组,然后从确定的处理组中选取处理人作为待处理工单的处理人。
在本发明的一种实施方式中,可以预先设置类别与处理组的对应关系,在确定待处理工单的类别后,通过查找预先设置的对应关系,确定与待处理工单类别对应的处理组。示例性的,若待处理工单类别为1,预先设置的与类别“1”对应的处理组为1组,则将1组作为待处理工单对应的处理组。
S390、根据预先设置的工单分配规则,从所述处理组中选取一处理人作为所述待处理工单的处理人。
确定待处理工单的处理组后,从处理组中选取一处理人作为待处理工单的处理人。可选的,可以随机从处理组中的所有处理人中选取一处理人作为待处理工单的处理人,也可以计算各处理人未处理工单的个数,将未处理工单个数最少的处理人作为待处理工单的处理人,或者计算所述处理组中各处理人未处理工单的总处理时长,将总处理时长最短的处理人作为所述待处理工单的处理人。
在本发明的一种实施方式中,所述计算所述处理组中各处理人未处理工单的总处理时长,包括:
针对每一处理人,统计所述处理人所有未处理工单的工单级别以及与所述工单级别对应的工单个数;
根据各所述工单级别、与所述工单级别对应的工单个数,以及与所述工单级别对应的处理时长计算所述处理人的总处理时长。
为了使待处理工单的分配更加公平合理,待处理工单的处理更加及时,可以根据各处理人未处理工单的总处理时长为待处理工单分配处理人。可选的,可以预先设置工单级别以及工单级别对应的处理时长,在计算各处理人未处理工单的总处理时长时,根据处理人未处理工单中各工单级别的个数以及工单级别对应的处理时长计算该处理人未处理工单的总处理时长。示例性的,表1中示出了工单级别与处理时长之间的对应关系。
表1
工单级别 | 处理时长(小时) |
高 | 3t |
中 | 2t |
低 | 1t |
如表1所示,工单级别为高时,对应的处理时长为3t小时,工单级别为中时,对应的处理时长为2t小时,工单级别为低时,对应的处理时长为1t小时。
示例性的,若处理人未处理工单的总处理时长为T,工单级别为高的未处理工单的个数为n1,工单级别为中的未处理工单的个数为n2,工单级别为低的未处理工单的个数为n3,则T=n1*3t+n2*2t+n3*t。
本发明实施例的技术方案,在上述实施例的基础上增加了为待处理工单分配处理人的操作,通过根据预先设置的类别与处理组的对应关系,确定与类别对应的处理组;根据预先设置的工单分配规则,从处理组中选取一处理人作为待处理工单的处理人,使得待处理工单的分配更加准确,提高了待处理工单的分配效率。
实施例四
图4a是本发明实施例五所提供的一种工单类别确定方法的流程图。本实施例在上述实施例的基础上提供了一种优选实施例。图4b是本发明实施例四所提供的一种工单类别确定系统的结构示意图。在本实施例中,结合图4a和4b对工单类别确定方法进行说明。如图4a和4b所示,所述系统分为四个模块:接收ITIL业务工单、提取基本信息模块,自动识别ITIL业务工单的所属业务类别模块,根据所属业务类别分配处理组模块和将ITIL业务工单分配给处理组内的处理人模块,所述方法包括:
S410、收集ITIL业务工单、提取基本信息。
在本实施例中,用户通过工单系统填写工单标题、工单内容和附件截图等信息提交ITIL工单,工单系统按照用户填写的信息保存到数据库中。获取业务工单后,提取工单中的基本信息(如图4b中的10、20),假设ITIL工单为X,从中分别提取工单标题T、工单内容C和异常提示的文本信息A,提取出的工单信息记作:X=(T,C,A)。
S420、自动识别ITIL业务工单的所属业务类别。
本发明实施例自动识别ITIL业务工单的所属业务类别(如图4b中的30):通过分别对ITIL业务工单的标题、内容和异常提示信息进行信息提取(如图4b中的31、33),并构造融合为相应的特征向量(如图4b中的35、36),最后通过机器学习的方法自动识别ITIL业务工单的所属业务类别(如图4b中的37、40)。
假设ITIL业务工单的所属业务类别集合为Z:{Z1,Z2,......,Zk},其中k为所属业务分类的个数;分别从ITIL业务工单的工单标题T、工单内容C和异常提示的文本信息A中进行特征提取,构造特征向量H=(H1,H2,H3)。
首先,将所属业务类别分别与标题和内容进行精准文本匹配(如图4b中的32),具体的,判断工单标题T中是否包含所属业务类别信息istrue,当工单标题T中包含该所属业务类别,则istrue=1,反之istrue=0,构建出不IL业务工单的标题特征向量:H1={istrue1,istrue2,......,istruek}。
同理,可判断工单内容C是否包含所属业务类别信息,构建出ITIL业务工单的内容特征向量:H2={istrue1,istrue2,......,istruek}。
然后,计算ITIL业务工单的异常提示的文本信息与异常库的信息的语义相似度(如图4b中的34),通过计算ITIL业务工单的异常提示的文本信息A与异常库中的信息的余弦相似度来构造提示信息特征向量H3。
具体的,若某一所属业务类别Zi对应的异常库集合Yi=(Yi1,Yi2,......,Yix),其中x为异常库集合Yi的个数,可以通过分别计算该ITIL业务工单中的异常提示的文本信息A分别与异常库集合的词向量的余弦距离Li=(Yi1,Yi2,......,Yix),并取最大值Lmax作为语义相似度的值,其中,Lmax=Max(L1,L2......,Lx)。此处可以用“结巴”中文分词,TF-IDF模型向量化文本、Word2vec等计算两个文本向量的相似度。最终,构建出ITIL业务工单的提示信息特征向量:
H3={Lmax 1,Lmax 2,......,Lmax k}
分别构建标题特征向量、内容特征向量以及提示信息特征向量后,根据标题特征向量、内容特征向量以及提示信息特征向量构建ITIL业务工单的特征向量。
特征向量的构造分为两种:一种是将两组特征向量首尾相连生成一个联合向量作为新的特征向量,在更高维的向量空间进行特征提取,即串行组合;另一种是利用复向量将同一样本的两组特征向量合并在一起,在复向量空间进行特征提取,即并行组合。
示例性的,采用串行组合的方式构建某一个ITIL业务工单的特征向量(Hi),其中Hi={H1i,H2i,H3i}。由此可见,特征向量(Hi)由如下几部分组成:工单标题T中是否包含所属业务类别信息、出工单内容C中是否包含所属业务类别信息、工单的异常提示的文本信息A与异常库的余弦相似度的最大值。
构建ITIL业务工单的特征向量后,利用机器学习识别该ITIL业务工单的所属业务类别。可选的,可以利用聚类方法、K近邻法、神经网络和支持向量机方法中的一种以上分类方法,将进行特征选择和特征组合后的训练样本进行训练,得到所述分类模型。示例性的,可以采用支持向量机的学习分类算法,构建SVM分类器模型来识别该ITIL业务工单的所属业务类别。
S430、按照预设ITIL业务工单分配规则将所述ITIL业务工单分配给对应的业务处理人员组。
在本实施例中,可以预先配置分配规则,如建立业务类别与处理组的对应关系,根据ITIL业务工单的所属业务类别与处理人员组的一一对应关系,找到该ITIL工单的处理人员组(如图4b中的50)。
S440、基于处理时长的分配策略来分配ITIL业务工单。
本发明实施例提出了基于处理时长的分配策略以分配ITIL业务工单:分别统计处理组下在岗的处理人名下的ITIL业务工单的处理时长之和(如图4b中的60),确定将该ITIL业务工单分配给处理时长之和最小的处理人(如图4b中的70)。
可选的,对处理组内在线的处理人进行任务排序,可以按照处理人名下所有“处理中”ITIL业务工单的数量排序或按照处理人名下所有“处理中”ITIL业务工单所需处理时长排序,依次由小到大分配该ITIL业务工单。按照ITIL业务工单处理时长的策略来分配工单,更公平有效。
具体的,可以将ITIL业务工单的优先级分为高、中和低三种,为每一种ITIL业务工单赋予不同单位的处理时长(可根据ITIL业务工单的处理时效自行定义单位处理时长)。可选的,可以设置工单级别为高时,对应的处理时长为3t小时,工单级别为中时,对应的处理时长为2t小时,工单级别为低时,对应的处理时长为1t小时。则计算当前处理人名下所有处于“处理中”状态的ITIL业务工单的总处理时长T的计算公式如下:T=n1*3t+n2*2t+n3*t,其中n1,n2,n3分别代表优先级分为高、中和低的ITIL业务工单的个数。
最后将各处理人的总处理时长进行由小到大的排序,将当前待分配的ITIL业务工单分配给总处理时长最短的处理人即可。
实施例五
图5是本发明实施例五所提供的一种工单类别确定装置的结构示意图。该工单类别确定装置可以采用软件和/或硬件的方式实现,例如该工单类别确定装置可以配置于计算机设备中。如图5所示,所述装置包括工单信息获取模块510、标题特征向量模块520、内容特征向量模块530、提示信息特征向量模块540、工单特征向量模块550、分类结果获取模块560和工单类别确定模块570,其中:
工单信息获取模块510,用于获取待处理工单,提取出所述待处理订单中包含的工单信息,其中,所述工单信息包括工单标题、工单内容和工单提示信息;
标题特征向量模块520,用于将所述工单标题与各类别的标题关键词相匹配,根据所述工单标题与各所述类别标题关键词的匹配结果生成所述待处理工单的标题特征向量;
内容特征向量模块530,用于将所述工单内容与各类别的内容关键词相匹配,根据所述工单内容与各所述类别内容关键词的匹配结果生成所述待处理工单的内容特征向量;
提示信息特征向量模块540,用于计算所述工单提示信息与各所述类别对应的异常库信息之间的相似度,根据各所述相似度生成所述待处理工单的提示信息特征向量;
工单特征向量模块550,用于将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行拼接,得到所述待处理工单的特征向量;
分类结果获取模块560,用于将所述特征向量输入至预先训练好的工单分类模型中,并获得所述工单分类模型输出的分类结果;
工单类别确定模块570,用于根据所述分类结果确定所述待处理工单的类别。
本发明实施例通过工单信息获取模块获取待处理工单,提取出待处理工单中包含的工单信息,其中,工单信息包括工单标题、工单内容和工单提示信息;标题特征向量模块将工单标题与各类别的标题关键词相匹配,根据工单标题与各类别标题关键词的匹配结果生成待处理工单的标题特征向量;内容特征向量模块将工单内容与各类别的内容关键词相匹配,根据工单内容与各类别内容关键词的匹配结果生成待处理工单的内容特征向量;提示信息特征向量模块计算工单提示信息与各类别对应的异常库信息之间的相似度,根据各相似度生成待处理工单的提示信息特征向量;工单特征向量模块将标题特征向量、内容特征向量和提示信息特征向量进行拼接,得到待处理工单的特征向量;分类结果获取模块将特征向量输入至预先训练好的工单分类模型中,并获得工单分类模型输出的分类结果;工单类别确定模块根据分类结果确定待处理工单的类别,通过根据待处理订单的标题特征向量、内容特征向量、提示信息特征向量,将标题特征向量、内容特征向量和提示信息特征向量生成待处理工单的特征向量,将特征向量输入至预先训练好的工单分类模型中确定待处理订单的类别,提高了工单类别确定的准确度,进而提高了工单分配的效率。
在上述方案的基础上,所述标题特征向量模块520具体用于:
针对每一类别,将所述工单标题与所述类别的关键词相匹配,根据匹配结果生成与所述类别对应的标题特征值;
将各所述类别对应的标题特征值作为所述标题特征向量中各元素的元素值,生成所述待处理工单的标题特征向量。
在上述方案的基础上,所述内容特征向量模块530具体用于:
针对每一类别,将所述工单内容与所述类别的关键词相匹配,根据匹配结果生成与所述类别对应的内容特征值;
将各所述类别对应的内容特征值作为所述内容特征向量中各元素的元素值,生成所述待处理工单的标题特征向量。
在上述方案的基础上,所述提示信息特征向量模块540具体用于:
针对每一类别,计算所述工单提示信息与所述类别对应的异常库信息中各异常信息之间的相似度,将相似度最大值作为所述工单提示信息与所述类别对应的异常库信息之间的相似度;
将各所述类别对应的相似度作为所述提示信息特征向量中各元素的元素值,生成所述待处理工单的提示信息特征向量。
在上述方案的基础上,所述工单特征向量模块550具体用于:
将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行串行拼接,得到所述待处理工单的一维特征向量;或者,
将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行并行拼接,得到所述待处理工单的三维特征向量。
在上述方案的基础上,所述装置还包括分类模型训练模块,用于:
在所述获取待处理工单,提取出所述待处理订单对应的工单信息之前,获取至少一个历史工单对应的历史工单特征向量以及所述历史工单的历史工单类别;
基于所述历史工单特征向量与所述历史工单类别生成样本对,对预先建立的工单分类模型进行训练,得到训练好的工单分类模型。
在上述方案的基础上,所述装置还包括处理人分配模块,包括:
处理组确定单元,用于在所述根据所述分类结果确定所述待处理工单的类别之后,根据预先设置的类别与处理组的对应关系,确定与所述类别对应的处理组;
处理人确定单元,用于根据预先设置的工单分配规则,从所述处理组中选取一处理人作为所述待处理工单的处理人。
在上述方案的基础上,所述处理人确定单元具体用于:
计算所述处理组中各处理人未处理工单的总处理时长,将总处理时长最短的处理人作为所述待处理工单的处理人。
在上述方案的基础上,所述处理人确定单元具体用于:
针对每一处理人,统计所述处理人所有未处理工单的工单级别以及与所述工单级别对应的工单个数;
根据各所述工单级别、与所述工单级别对应的工单个数,以及与所述工单级别对应的处理时长计算所述处理人的总处理时长。
本发明实施例所提供的工单类别确定装置可执行任意实施例所提供的工单类别确定方法,具备执行方法相应的功能模块和有益效果。
实施例六
图6是本发明实施例六所提供的计算机设备的结构示意图。图6示出了适于用来实现本发明实施方式的示例性计算机设备612的框图。图6显示的计算机设备612仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备612以通用计算设备的形式表现。计算机设备612的组件可以包括但不限于:一个或者多个处理器616,系统存储器628,连接不同系统组件(包括系统存储器628和处理器616)的总线618。
总线618表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器616或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备612典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备612访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器628可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)630和/或高速缓存存储器632。计算机设备612可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储装置634可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线618相连。存储器628可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块642的程序/实用工具640,可以存储在例如存储器628中,这样的程序模块642包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块642通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备612也可以与一个或多个外部设备614(例如键盘、指向设备、显示器624等)通信,还可与一个或者多个使得用户能与该计算机设备612交互的设备通信,和/或与使得该计算机设备612能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口622进行。并且,计算机设备612还可以通过网络适配器620与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器620通过总线618与计算机设备612的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备612使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器616通过运行存储在系统存储器628中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的工单类别确定方法,该方法包括:
获取待处理工单,提取出所述待处理工单中包含的工单信息,其中,所述工单信息包括工单标题、工单内容和工单提示信息;
将所述工单标题与各类别的标题关键词相匹配,根据所述工单标题与各所述类别标题关键词的匹配结果生成所述待处理工单的标题特征向量;
将所述工单内容与各类别的内容关键词相匹配,根据所述工单内容与各所述类别内容关键词的匹配结果生成所述待处理工单的内容特征向量;
计算所述工单提示信息与各所述类别对应的异常库信息之间的相似度,根据各所述相似度生成所述待处理工单的提示信息特征向量;
将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行拼接,得到所述待处理工单的特征向量;
将所述特征向量输入至预先训练好的工单分类模型中,并获得所述工单分类模型输出的分类结果;
根据所述分类结果确定所述待处理工单的类别。
当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的工单类别确定方法的技术方案。
实施例七
本发明实施例七还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的工单类别确定方法,该方法包括:
获取待处理工单,提取出所述待处理工单中包含的工单信息,其中,所述工单信息包括工单标题、工单内容和工单提示信息;
将所述工单标题与各类别的标题关键词相匹配,根据所述工单标题与各所述类别标题关键词的匹配结果生成所述待处理工单的标题特征向量;
将所述工单内容与各类别的内容关键词相匹配,根据所述工单内容与各所述类别内容关键词的匹配结果生成所述待处理工单的内容特征向量;
计算所述工单提示信息与各所述类别对应的异常库信息之间的相似度,根据各所述相似度生成所述待处理工单的提示信息特征向量;
将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行拼接,得到所述待处理工单的特征向量;
将所述特征向量输入至预先训练好的工单分类模型中,并获得所述工单分类模型输出的分类结果;
根据所述分类结果确定所述待处理工单的类别。
当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的工单类别确定方法中的相关操作。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (12)
1.一种工单类别确定方法,其特征在于,包括:
获取待处理工单,提取出所述待处理工单中包含的工单信息,其中,所述工单信息包括工单标题、工单内容和工单提示信息;
将所述工单标题与各类别的标题关键词相匹配,根据所述工单标题与各所述类别标题关键词的匹配结果生成所述待处理工单的标题特征向量;
将所述工单内容与各类别的内容关键词相匹配,根据所述工单内容与各所述类别内容关键词的匹配结果生成所述待处理工单的内容特征向量;
计算所述工单提示信息与各所述类别对应的异常库信息之间的相似度,根据各所述相似度生成所述待处理工单的提示信息特征向量;
将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行拼接,得到所述待处理工单的特征向量;
将所述特征向量输入至预先训练好的工单分类模型中,并获得所述工单分类模型输出的分类结果;
根据所述分类结果确定所述待处理工单的类别。
2.根据权利要求1所述的方法,其特征在于,所述将所述工单标题与各类别的标题关键词相匹配,根据所述工单标题与各所述类别标题关键词的匹配结果生成所述待处理工单的标题特征向量,包括:
针对每一类别,将所述工单标题与所述类别的标题关键词相匹配,根据匹配结果生成与所述类别对应的标题特征值;
将各所述类别对应的标题特征值作为所述标题特征向量中各元素的元素值,生成所述待处理工单的标题特征向量。
3.根据权利要求1所述的方法,其特征在于,所述将所述工单内容与各类别的内容关键词相匹配,根据所述工单内容与各所述类别内容关键词的匹配结果生成所述待处理工单的内容特征向量,包括:
针对每一类别,将所述工单内容与所述类别的内容关键词相匹配,根据匹配结果生成与所述类别对应的内容特征值;
将各所述类别对应的内容特征值作为所述内容特征向量中各元素的元素值,生成所述待处理工单的标题特征向量。
4.根据权利要求1所述的方法,其特征在于,所述计算所述工单提示信息与各所述类别对应的异常库信息之间的相似度,根据各所述相似度生成所述待处理工单的提示信息特征向量,包括:
针对每一类别,计算所述工单提示信息与所述类别对应的异常库信息中各异常信息之间的相似度,将相似度最大值作为所述工单提示信息与所述类别对应的异常库信息之间的相似度;
将各所述类别对应的相似度作为所述提示信息特征向量中各元素的元素值,生成所述待处理工单的提示信息特征向量。
5.根据权利要求1所述的方法,其特征在于,所述将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行拼接,得到所述工单信息的特征向量,包括:
将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行串行拼接,得到所述待处理工单的一维特征向量;或者,
将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行并行拼接,得到所述待处理工单的三维特征向量。
6.根据权利要求1所述的方法,其特征在于,在所述获取待处理工单,提取出所述待处理订单对应的工单信息之前,还包括:
获取至少一个历史工单对应的历史工单特征向量以及所述历史工单的历史工单类别;
基于所述历史工单特征向量与所述历史工单类别生成样本对,对预先建立的工单分类模型进行训练,得到训练好的工单分类模型。
7.根据权利要求1-6中任一项所述的方法,其特征在于,在所述根据所述分类结果确定所述待处理工单的类别之后,还包括:
根据预先设置的类别与处理组的对应关系,确定与所述类别对应的处理组;
根据预先设置的工单分配规则,从所述处理组中选取一处理人作为所述待处理工单的处理人。
8.根据权利要求7所述的方法,其特征在于,所述根据预先设置的工单分配规则,从所述处理组中选取一处理人作为所述待处理工单的处理人,包括:
计算所述处理组中各处理人未处理工单的总处理时长,将总处理时长最短的处理人作为所述待处理工单的处理人。
9.根据权利要求8所述的方法,其特征在于,所述计算所述处理组中各处理人未处理工单的总处理时长,包括:
针对每一处理人,统计所述处理人所有未处理工单的工单级别以及与所述工单级别对应的工单个数;
根据各所述工单级别、与所述工单级别对应的工单个数,以及与所述工单级别对应的处理时长计算所述处理人的总处理时长。
10.一种工单类别确定装置,其特征在于,包括:
工单信息获取模块,用于获取待处理工单,提取出所述待处理订单中包含的工单信息,其中,所述工单信息包括工单标题、工单内容和工单提示信息;
标题特征向量模块,用于将所述工单标题与各类别的标题关键词相匹配,根据所述工单标题与各所述类别标题关键词的匹配结果生成所述待处理工单的标题特征向量;
内容特征向量模块,用于将所述工单内容与各类别的内容关键词相匹配,根据所述工单内容与各所述类别内容关键词的匹配结果生成所述待处理工单的内容特征向量;
提示信息特征向量模块,用于计算所述工单提示信息与各所述类别对应的异常库信息之间的相似度,根据各所述相似度生成所述待处理工单的提示信息特征向量;
工单特征向量模块,用于将所述标题特征向量、所述内容特征向量和所述提示信息特征向量进行拼接,得到所述待处理工单的特征向量;
分类结果获取模块,用于将所述特征向量输入至预先训练好的工单分类模型中,并获得所述工单分类模型输出的分类结果;
工单类别确定模块,用于根据所述分类结果确定所述待处理工单的类别。
11.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-10中任一所述的工单类别确定方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的工单类别确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910945506.2A CN112667805B (zh) | 2019-09-30 | 2019-09-30 | 一种工单类别确定方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910945506.2A CN112667805B (zh) | 2019-09-30 | 2019-09-30 | 一种工单类别确定方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112667805A true CN112667805A (zh) | 2021-04-16 |
CN112667805B CN112667805B (zh) | 2024-04-09 |
Family
ID=75399698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910945506.2A Active CN112667805B (zh) | 2019-09-30 | 2019-09-30 | 一种工单类别确定方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112667805B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113138837A (zh) * | 2021-04-22 | 2021-07-20 | 康键信息技术(深圳)有限公司 | 基于工单信息的虚拟机安装方法、装置、设备及存储介质 |
CN113435859A (zh) * | 2021-07-12 | 2021-09-24 | 建信金融科技有限责任公司 | 信访件处理方法、装置、电子设备和计算机可读介质 |
CN113468886A (zh) * | 2021-07-28 | 2021-10-01 | 拉扎斯网络科技(上海)有限公司 | 工单处理方法、装置及计算机设备 |
CN113807650A (zh) * | 2021-08-04 | 2021-12-17 | 北京房江湖科技有限公司 | 房源业主面访管理方法、系统、电子设备及存储介质 |
CN113836888A (zh) * | 2021-11-25 | 2021-12-24 | 中关村科学城城市大脑股份有限公司 | 一种确定工单主题的方法、装置、介质及计算机设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109885768A (zh) * | 2019-02-18 | 2019-06-14 | 中国联合网络通信集团有限公司 | 工单处理方法、装置及系统 |
CN109902283A (zh) * | 2018-05-03 | 2019-06-18 | 华为技术有限公司 | 一种信息输出方法及装置 |
WO2019141144A1 (zh) * | 2018-01-17 | 2019-07-25 | 华为技术有限公司 | 确定网络故障的方法和装置 |
-
2019
- 2019-09-30 CN CN201910945506.2A patent/CN112667805B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019141144A1 (zh) * | 2018-01-17 | 2019-07-25 | 华为技术有限公司 | 确定网络故障的方法和装置 |
CN109902283A (zh) * | 2018-05-03 | 2019-06-18 | 华为技术有限公司 | 一种信息输出方法及装置 |
CN109885768A (zh) * | 2019-02-18 | 2019-06-14 | 中国联合网络通信集团有限公司 | 工单处理方法、装置及系统 |
Non-Patent Citations (1)
Title |
---|
李雪蕾, 张冬茉: "一种基于向量空间模型的文本分类方法", 计算机工程, no. 17, 5 September 2003 (2003-09-05) * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113138837A (zh) * | 2021-04-22 | 2021-07-20 | 康键信息技术(深圳)有限公司 | 基于工单信息的虚拟机安装方法、装置、设备及存储介质 |
CN113435859A (zh) * | 2021-07-12 | 2021-09-24 | 建信金融科技有限责任公司 | 信访件处理方法、装置、电子设备和计算机可读介质 |
CN113468886A (zh) * | 2021-07-28 | 2021-10-01 | 拉扎斯网络科技(上海)有限公司 | 工单处理方法、装置及计算机设备 |
CN113468886B (zh) * | 2021-07-28 | 2023-07-21 | 拉扎斯网络科技(上海)有限公司 | 工单处理方法、装置及计算机设备 |
CN113807650A (zh) * | 2021-08-04 | 2021-12-17 | 北京房江湖科技有限公司 | 房源业主面访管理方法、系统、电子设备及存储介质 |
CN113836888A (zh) * | 2021-11-25 | 2021-12-24 | 中关村科学城城市大脑股份有限公司 | 一种确定工单主题的方法、装置、介质及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112667805B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112667805B (zh) | 一种工单类别确定方法、装置、设备及介质 | |
US9390378B2 (en) | System and method for high accuracy product classification with limited supervision | |
EP3696746A1 (en) | Method and apparatus for determining description information, electronic device and computer storage medium | |
US10049148B1 (en) | Enhanced text clustering based on topic clusters | |
US20140314311A1 (en) | System and method for classification with effective use of manual data input | |
US20180068221A1 (en) | System and Method of Advising Human Verification of Machine-Annotated Ground Truth - High Entropy Focus | |
CN109299245B (zh) | 知识点召回的方法和装置 | |
CN111340054A (zh) | 数据标注方法、装置及数据处理设备 | |
EP3289489B1 (en) | Image entity recognition and response | |
CN110597978A (zh) | 物品摘要生成方法、系统、电子设备及可读存储介质 | |
CN110909768B (zh) | 一种标注数据获取方法及装置 | |
CN113435859A (zh) | 信访件处理方法、装置、电子设备和计算机可读介质 | |
CN111949785A (zh) | 查询语句管理方法和装置、可读存储介质、电子设备 | |
CN115563271A (zh) | 人工智能的会计数据分录方法、系统、设备及存储介质 | |
CN113361240B (zh) | 用于生成目标文章的方法、装置、设备和可读存储介质 | |
CN112926308B (zh) | 匹配正文的方法、装置、设备、存储介质以及程序产品 | |
CN113962401A (zh) | 联邦学习系统、联邦学习系统中的特征选择方法及装置 | |
CN113408301A (zh) | 一种样本处理方法、装置、设备和介质 | |
JP6535863B2 (ja) | 情報処理装置及びプログラム | |
CN112579781A (zh) | 文本归类方法、装置、电子设备及介质 | |
CN116485019A (zh) | 一种数据处理方法及装置 | |
CN114742062B (zh) | 文本关键词提取处理方法及系统 | |
WO2023164312A1 (en) | An apparatus for classifying candidates to postings and a method for its use | |
CN113570286B (zh) | 基于人工智能的资源分配方法、装置、电子设备及介质 | |
CN113050933B (zh) | 脑图数据处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |