CN109993391B - 网络运维任务工单的派发方法、装置、设备及介质 - Google Patents

网络运维任务工单的派发方法、装置、设备及介质 Download PDF

Info

Publication number
CN109993391B
CN109993391B CN201711494858.8A CN201711494858A CN109993391B CN 109993391 B CN109993391 B CN 109993391B CN 201711494858 A CN201711494858 A CN 201711494858A CN 109993391 B CN109993391 B CN 109993391B
Authority
CN
China
Prior art keywords
label
work order
task work
node
existing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711494858.8A
Other languages
English (en)
Other versions
CN109993391A (zh
Inventor
姚旭清
王洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Shanxi Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Shanxi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Shanxi Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201711494858.8A priority Critical patent/CN109993391B/zh
Publication of CN109993391A publication Critical patent/CN109993391A/zh
Application granted granted Critical
Publication of CN109993391B publication Critical patent/CN109993391B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q50/40

Abstract

本发明实施例公开了一种网络运维任务工单的派发方法、装置、设备及介质,特点是充分考虑层次标签树的层次结构,将层次多标签分类问题转换为层次标签树上各个标签节点的二分类问题,进而在层次标签树中搜索最优结果标签集来得到多标签分类结果,因为每个标签节点上分类器的构造过程仅依赖于相关的训练数据,且所有分类器都是相互独立的,因此可以通过并行化任务来提高性能,而对于最优结果标签集的搜索只跟层次标签树的规模相关,大大减少计算量,降低计算复杂度,本发明能够在大规模网络运维中高效率的进行运维任务工单的派发。

Description

网络运维任务工单的派发方法、装置、设备及介质
技术领域
本发明涉及网络运维技术领域,尤其涉及一种网络运维任务工单的派发方法、装置、设备及介质。
背景技术
网络运维是指为保障电信网络与业务正常、安全、有效运行而采取的生产组织管理活动,简称网络运维管理或(Operation Administration and Maintenance,OAM)。通信网络集中监控管理体系关键技术与现网规模应用实现了设备告警接入、性能指标上报、故障实时通知、故障智能预处理、工单自动派发、排障闭环管理的全流程管控。但随着通信网络规模扩大、网络设备种类增多、网络结构复杂、网络业务种类多样,信息通信网络产生的设备数据、网管数据、业务等数据均呈现出数量级的增长。因此,如何将网络运维与大数据、云计算相结合将成为通信网今后难点技术攻关方向。随着网络运维大数据的沉淀积累,数据处理已经逐步由数据统计向数据价值挖掘转变,大数据统计分析转化为大数据价值挖掘将成为网络运维发展方向。
在IT化的基础设施运维过程中,许多网络故障问题反复出现,在相关的事件以及过去已经解决大量的任务工单中找到对应的解决方案成为故障挖掘分析的趋势。在当前网络模型中,不同的网络段落往往会由不同的维护团队进行维护,但是网络业务具有连通性,网络故障在不同网络段落或者层面体现出不一样的故障告警提示,这样网络就会呈现出多样化的、大量的具有关联性的故障告警。
IT问题通过专门化处理可以自然地组织成一种层次结构,并且一个问题往往会涉及多个网络组织,问题的层次结构可用于将分类后的任务工单转发给相应的一个或者多个维护团队来解决。
综上所述,在网络运维过程中,如何进行快速、准确的任务工单派发,是解决网络故障、加速网络业务恢复的关键。
发明内容
本发明实施例提供了一种速度快且准确度高的网络运维任务工单的派发方法、装置、设备及介质。
第一方面,本发明实施例提供了一种网络运维任务工单的派发方法,方法包括:
根据已有运维任务工单中描述的问题症状构造每一张已有任务工单的特征向量和每一张已有任务工单标签集;
根据所述已有任务工单的特征向量和所述已有任务工单标签集中各标签节点的二分类器,计算每一张已有任务工单对应各标签节点的概率,按照每一张已有任务工单对应各标签节点的概率和惩罚因子,计算得到每一张已有任务工单的修正概率值;
根据所述的修正概率值,使用GLabel算法搜索出所述已有任务工单对应的多标签节点,进而得到汉明损失最小的GLabel算法阈值;
根据新任务工单中描述的问题症状构造新的特征向量和新的标签集;
在所述新的标签集中,除根标签节点外,对层次标签树中所有其他标签节点的二分类器,根据所述新的特征向量计算新任务工单的修正概率值;
使用GLabel算法和所述的GLabel算法阈值,搜索出最优结果标签集;
将新任务工单派发给具有最优结果标签集的父标签节点应的维护团队。
第二方面,本发明实施例提供了一种网络运维任务工单的派发装置,装置包括:
第一特征构造模块,用于根据已有运维任务工单中描述的问题症状构造每一张已有任务工单的特征向量和每一张已有任务工单标签集;
概率计算模块,用于根据所述已有任务工单的特征向量和所述已有任务工单标签集中各标签节点的二分类器,计算每一张已有任务工单对应各标签节点的概率,按照每一张已有任务工单对应各标签节点的概率和在惩罚因子,计算得到每一张已有任务工单的修正概率值;
标签搜索模块,用于根据所述的修正概率值,使用GLabel算法搜索出所述已有任务工单对应的多标签节点,进而得到汉明损失最小的GLabel算法阈值;
第二特征构造模块,用于使用GLabel算法和所述的GLabel算法阈值,搜索出最优结果标签集;
工单派发模块,用于将新任务工单派发给具有最优结果标签集的父标签节点应的维护团队。
第三方面,本发明实施例提供了一种网络运维任务工单的派发设备,包括:至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
本发明实施例提供的网络运维任务工单的派发方法、装置、设备及介质能够在大规模网络运维中高效率的进行运维任务工单的层次多标签分类,进而可以高效、准确地将任务工单派发给相应的维护团队。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例提供的网络运维任务工单的派发方法的流程图;
图2示出了本发明实施例提供的网络运维任务工单的派发装置的结构示意图;
图3示出了本发明实施例提供的网络运维任务工单的派发方法中筛选出各个父标签节点应的训练数据集的流程图;
图4示出了本发明实施例提供的网络运维任务工单的派发方法中层次标签树的结构示意图;
图5示出了本发明实施例提供的网络运维任务工单的派发方法中汉明损失算法的流程图;
图6示出了本发明实施例提供的网络运维任务工单的派发设备的硬件结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
实施例一
本发明实施例的任务工单派发方法如图1所示,本发明实施例的任务工单派发装置如图2所示,派发装置包括依次连接的第一特征构造模块101、训练模块102、概率计算模块103、标签搜索模块104、第二特征构造模块105和工单派发模块106。本发明实施例的任务工单派发方法可以包括:
派发装置的第一特征构造模块101根据已有运维任务工单中描述的问题症状构造每一张已有任务工单的特征向量和每一张已有任务工单标签集;
将所述已有任务工单对应的所有原始标签节点和各父标签节点应层次标签树的所有祖先标签节点并集去重后得到所述已有任务工单标签集。
示例性的,派发装置的第一特征构造模块101用自然语言处理技术移除已有运维任务工单中描述问题症状的短文本消息中的非特征词,并为短文本消息中的词构造标签,从每一张已有任务工单中提取出短文本消息中的名词、形容词和动词;其次,根据从所有已有任务工单短文本消息中提取出的所有名词、形容词和动词,计算对应的TF-IDF值,将TF-IDF值最高的1000个特征词作为特征成分并根据TF-IDF值排序,将序号作为特征成分的下标,得到1000维的已有任务工单特征向量,其中每个特征成分的值是该特征词在已有任务工单短文本消息中出现的频率,即已有任务工单特征向量每一维的值为该下标对应的特征词在该已有任务工单出现的次数;最后,将一张文本类型的已有任务工单转换为对应的已有任务工单标签集和1000维的已有任务工单特征向量,其中已有任务工单标签集为该已有任务工单对应的所有原始标签节点和各父标签节点应层次标签树的所有祖先标签节点的并集去重得到的标签节点集合。
示例性的,如图4为一棵已有运维任务工单层次标签树的示意图,如果一条已有任务工单含有标签节点“Down”,那么该已有任务工单也对应标签节点“Down”的所有祖先标签节点,即“DB2”,“Database”,“ALL”,如果有多个重复的去除重复标签节点。
进一步的,在构造每一张已有任务工单的特征向量和每一张已有任务工单标签集时,并不仅限定针对已有任务工单的短文本消息,选择特征成分时也并不是仅TF-IDF值最高的1000个特征词,可以视情况改变,不影响本发明的方案。
TF-IDF是一种用于信息检索与数据挖掘的常用加权技术。TF-IDF值是指词频与逆向文件频率的乘积,对应于某一个已有任务工单,词频TFm,j的计算公式如下:
Figure BDA0001536209700000061
其中j表示已有任务工单序号,m表示所有已有任务工单中的第m个词,nm,j为第m个词在第j个已有任务工单中的个数,分母为该条已有任务工单中所有词的个数,k表示所有已有任务工单中的名词、形容词和动词的总数;对应于某一个给定的词,所述的逆向文件频率IDFm表示为:
Figure BDA0001536209700000062
其中|D|表示已有任务工单数据集中的已有任务工单总数,分母|{j:tm∈dj}|为包含第m个词的已有任务工单总数,当分母为0时,在分母上加1作为新的分母。
本发明实施例中,派发装置的训练模块102根据所述已有任务工单标签集中层次标签树的层次关系和每一张已有任务工单所对应的多标签,筛选出层次标签树中每个标签节点的标签训练数据集。
示例性的,如图3所示,派发装置的训练模块102针对所述已有任务工单标签集中层次标签树上的每一个标签节点,判断已有任务工单,若一个已有任务工单同时含有每一个标签节点和每一个标签节点的父标签节点则将该已有任务工单标为正例1,并将该已有任务工单作为每一个标签节点的训练数据集的任务工单,否则标为负例0;针对层次标签树上除了根标签节点外的所有标签节点,循环判断所有的已有任务工单,筛选出各个父标签节点应的标签训练数据集。
派发装置的训练模块102根据层次标签树中每一个标签节点的标签训练数据集,采用libSVM库中提供的SVM算法为层次标签树中每一个标签节点构造原始二分类器,通过设定相应的参数使得SVM输出为相应的概率值;然后借助hadoop和spark平台对所有原始二分类器进行并行化的独立训练。
进一步的,构造二分类器并不一定要采用libSVM库中提供的SVM算法,也可以是其它的算法;而训练的平台也不局限于hadoop和spark平台。
将训练后的原始二分类器作为各标签节点的二分类器。
派发装置的概率计算模块103,用于根据所述已有任务工单的特征向量和所述已有任务工单标签集中各标签节点的二分类器,计算每一张已有任务工单对应各标签节点的概率,按照每一张已有任务工单对应各标签节点的概率和在惩罚因子,计算得到每一张已有任务工单的修正概率值;
示例性的,对于第i个标签节点和已有任务工单x,利用Logistic函数(或称为 Sigmoid函数)构造一个预测函数:作为特征向量,函数hθ(x)的值 表示结果取1的概率,而本发明的二分类器的输出只有两个类别,即类别1和类别0,故对于 一个标签节点和已有任务工单,对应的多标签向量为y={y0,y1,...yi...,yN-1},N为多标签 向量的维数;当已有任务工单x含有第i个节点的标签时,yi=1,否则yi=0;由工单的特征向 量和该父标签节点应的二分类器即可计算出类别1和类别0的概率值分别为:
Figure BDA0001536209700000073
类别1的概率值即为该已有任务工单x含有该标签的概率,类别0即为该已有任务工单x不含有该标签的概率。
示例性的,如图5对应的标签层次树,灰色节点为已有任务工单x对应的标签节点,即已有任务工单x含有标签0,1,3三个节点,向量化后y=<1,1,0,1,0,0,0,0,0>。当i=4时,pa(i)=1,即编号为4的节点的父节点的编号为1。
对于已有任务工单x的多标签向量yi,定义层次标签树中所有标签节点的序号为i;定义第i个标签节点的父标签节点为pa(i),所述父标签节点的多标签向量为ypa(i),所述父标签节点的概率为ppa(i);节点对pa(i)的概率通过二元分类算法得到,即为上一步得出的所有标签的二元分类器,由标签层次树的约束得出p(yi=1|ypa(i)=0)=0和p(yi=1|x)=p(yi=1,ypa(i)=1|x),简化标记后,计算得到第i个标签节点的概率:
pi=P(yi=1|ypa(i)=1,x)ppa(i)
定义第i个标签节点的惩罚因子Ci为:
Figure BDA0001536209700000081
其中,Cpa(i)为第i个节点的父节点的惩罚因子,即从根节点开始迭代计算每个节点的惩罚因子;计算每个标签节点的每一张已有任务工单的修正概率值σi=2Cipi-Ci
本发明实施例中,派发装置的标签搜索模块104根据修正概率值,使用GLabel算法搜索出已有任务工单对应的多标签节点,进而得到汉明损失最小的GLabel算法阈值。
示例性的,可以选择[-1,1]作为阈值候选集区间,针对该阈值候选集区间内的不同的阈值,标签搜索模块104的最优数据搜索模块使用GLabel算法,每次迭代步长可以为0.05,在层次标签树中搜索出阈值候选集区间内不同阈值的最优标签数据集。
示例性的,GLabel算法可以如下:
Algorithm Glabel(H),H是带有σi值的标签层次关系,
1:定义L为一个集合,并初始化L={0}
2:定义U为一个集合,并初始化U=H\{0}
3:while TRUE do
4:if H中的所有标签节点都被标记过then
5:return L
6:end if
7:查找具有最大的σi值的标签节点i
8:ifσi<0 then
9:return L
10:end if
11:if标签节点i的所有父标签节点都被标记过then
12: 将标签节点i放入L,并且将其从U中移除
13:else
14:将标签节点i与其父标签节点合并为一个超级标签节点i*
15:σi*的值等于超级标签节点中所有标签节点σi的平均值
16: 将超级标签节点i*放入U
17:end if
18:end while。
上述的阈值候选集区间和迭代步长仅仅是一个例子。
示例性的,标签搜索模块104的GLabel阈值获取模块计算各阈值的汉明损失,得到汉明损失最小的阈值作为GLabel算法的阈值,记为
Figure BDA0001536209700000092
汉明损失用于度量分类器分类错误的程度,它统计标记集合中被错误地预测的标记的个数,因此汉明损失值越小,说明多标签分类器的性能越好。
汉明损失的定义如下:
Figure BDA0001536209700000091
其中,N表示测试样本的总数,Yi表示真实的标签集,q表示训练数据中不同标签的个数,即标签树的节点个数,Zi表示预测的标签集,Δ表示真实的标签集和预测的标签集的对称差。
示例性的,如图5所示,层次标签树中有9个节点,即对应的q为9,标签集用含9个元素的向量表示,向量的每一个元素即表示一个标签节点,若一条样本含有对应向量位置的标签则该位置为1,否则为0;在图5中,灰色节点表示一条样本对应的标签节点<y0,y1,y3>,则该样本对应的标签集为向量<1,1,0,1,0,0,0,0,0>,即该样本Yi为<1,1,0,1,0,0,0,0,0>,假设预测的标签集为<y0,y1,y4,y8>,向量化为<1,1,0,0,1,0,0,0,1>,即Zi为<1,1,0,0,1,0,0,0,1>,Yi与Zi有三个元素不同,即YiΔZi等于3。该示例的汉明损失为3/9。
本发明实施例中,对于新任务工单,派发装置的第二特征构造模块105使用GLabel算法和GLabel算法阈值,搜索出最优结果标签集。
示例性的,如图1所示,对于新任务工单,派发装置的第二特征构造模块105根据新任务工单中描述的问题症状构造新的任务工单的特征向量和新的任务工单的标签集;根据层次标签树中除根标签节点外的所有其他标签节点的二分类器,计算新任务工单的概率值;使用GLabel算法和GLabel算法阈值,搜索出最优结果标签集。
本发明实施例中,派发装置的工单派发模块106将新任务工单派发给具有最优结果标签集的父标签节点应的维护团队。
另外,结合图1和图2描述的本发明实施例的网络运维任务工单的派发方法可以由网络运维任务工单的派发设备来实现。图6示出了本发明实施例提供的网络运维任务工单的派发设备的硬件结构示意图。
网络运维任务工单的派发设备可以包括处理器401以及存储有计算机程序指令的存储器402。
具体地,上述处理器401可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器402可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器402可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器402可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器402可在数据处理装置的内部或外部。在特定实施例中,存储器402是非易失性固态存储器。在特定实施例中,存储器402包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器401通过读取并执行存储器402中存储的计算机程序指令,以实现上述实施例中的任意一种网络运维任务工单的派发方法。
在一个示例中,网络运维任务工单的派发设备还可包括通信接口403和总线410。其中,如图5所示,处理器401、存储器402、通信接口403通过总线410连接并完成相互间的通信。
通信接口403,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线410包括硬件、软件或两者,将网络运维任务工单的派发设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线410可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该网络运维任务工单的派发设备可以基于获取到待测小区的网管性能指标,执行本发明实施例中的网络运维任务工单的派发方法,从而实现结合图1和图2描述的网络运维任务工单的派发方法。
另外,结合上述实施例中的网络运维任务工单的派发方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种网络运维任务工单的派发方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (14)

1.一种网络运维任务工单的派发方法,其特征在于,所述派发方法包括:
根据已有运维任务工单中描述的问题症状构造每一张已有任务工单的特征向量和每一张已有任务工单标签集;
根据所述已有任务工单的特征向量和所述已有任务工单标签集中各标签节点的二分类器,计算每一张已有任务工单对应各标签节点的概率,按照每一张已有任务工单对应各标签节点的概率和惩罚因子,计算得到每一张已有任务工单的修正概率值;
根据所述的修正概率值,使用GLabel算法搜索出所述已有任务工单对应的多标签节点,进而得到汉明损失最小的GLabel算法阈值;
根据新任务工单中描述的问题症状构造新的特征向量和新的标签集;
在所述新的标签集中,除根标签节点外,对层次标签树中所有其他标签节点的二分类器,根据所述新的特征向量计算新任务工单的修正概率值;
根据新任务工单的修正概率值,使用GLabel算法和所述的GLabel算法阈值,搜索出最优结果标签集;
将新任务工单派发给具有最优结果标签集的父标签节点相应的维护团队。
2.根据权利要求1所述的网络运维任务工单的派发方法,其特征在于,所述根据已有运维任务工单中描述的问题症状构造每一张已有任务工单的特征向量和每一张已有任务工单标签集,包括:
在已有运维任务工单中描述的问题症状中提取名词、形容词和动词;
根据提取出的所有词计算对应的TF-IDF值,将TF-IDF值最高的M个特征词作为所述已有任务工单的特征向量;
将所述已有任务工单对应的所有原始标签节点和各父标签节点对应层次标签树的所有祖先标签节点并集去重后得到所述已有任务工单标签集。
3.根据权利要求1所述的网络运维任务工单的派发方法,其特征在于,所述根据所述已有任务工单的特征向量和所述已有任务工单标签集中各标签节点的二分类器,计算每一张已有任务工单对应各标签节点的概率之前,还包括:
根据所述已有任务工单标签集中层次标签树的层次关系和每一张已有任务工单所对应的多标签,筛选出层次标签树中每个标签节点的标签训练数据集;
根据所述的标签训练数据集,并行训练各父标签节点对应的原始二分类器;
将训练后的原始二分类器作为各标签节点的二分类器。
4.根据权利要求3所述的网络运维任务工单的派发方法,其特征在于,所述根据所述已有任务工单标签集中层次标签树的层次关系和每一张已有任务工单所对应的多标签,筛选出层次标签树中每个标签节点的标签训练数据集,包括:
针对所述已有任务工单标签集中层次标签树上的每一个标签节点,判断已有任务工单,将同时含有所述每一个标签节点和所述每一个标签节点的父标签节点的已有任务工单作为所述每一个标签节点的标签训练数据集的任务工单;
针对所述层次标签树上除了根标签节点外的所有标签节点,循环判断所有的已有任务工单,筛选出各个父标签节点对应的标签训练数据集。
5.根据权利要求3所述的网络运维任务工单的派发方法,其特征在于,所述原始二分类器是根据所述层次标签树中每一个标签节点的标签训练数据集,采用libSVM库中提供的SVM算法构造的分类器。
6.根据权利要求1所述的网络运维任务工单的派发方法,其特征在于,所述根据所述已有任务工单的特征向量和所述已有任务工单标签集中各标签节点的二分类器,计算每一张已有任务工单对应各标签节点的概率,按照每一张已有任务工单对应各标签节点的概率和惩罚因子,计算得到每一张已有任务工单的修正概率值,包括:
计算得到每一张任务工单的修正概率值σi包括:
对于已有任务工单x的多标签向量y,定义层次标签树中所有标签节点的序号为i;
定义第i个标签节点的父标签节点为pa(i),定义第i个标签节点的多标签向量为yi,所述父标签节点的多标签向量为ypa(i),所述父标签节点的概率为ppa(i)
计算第i个标签节点的概率:
pi=P(yi=1|ypa(i)=1,x)ppa(i)
定义第i个标签节点的惩罚因子Ci为:
Figure FDA0002789038340000031
其中,Cpa(i)为第i节点的父节点的惩罚因子,即从根节点开始根据节点的孩子个数迭代计算每个节点的惩罚因子;
计算每个标签节点的每一张已有任务工单的修正概率值σi=2Cipi-Ci
7.根据权利要求1所述的网络运维任务工单的派发方法,其特征在于,所述根据所述的修正概率值,使用GLabel算法搜索出所述已有任务工单对应的多标签节点,进而得到汉明损失最小的GLabel算法阈值,包括:
根据所述的修正概率值,选定阈值候选集区间和迭代步长;
使用GLabel算法,在层次标签树中依据所述迭代步长,搜索出所述阈值候选集区间内不同阈值的最优标签数据集;
计算所述阈值的汉明损失,得到汉明损失最小的GLabel算法阈值。
8.一种网络运维任务工单的派发装置,其特征在于,所述装置包括:
第一特征构造模块,用于根据已有运维任务工单中描述的问题症状构造每一张已有任务工单的特征向量和每一张已有任务工单标签集;
概率计算模块,用于根据所述已有任务工单的特征向量和所述已有任务工单标签集中各标签节点的二分类器,计算每一张已有任务工单对应各标签节点的概率,按照每一张已有任务工单对应各标签节点的概率和惩罚因子,计算得到每一张已有任务工单的修正概率值;
标签搜索模块,用于根据所述的修正概率值,使用GLabel算法搜索出所述已有任务工单对应的多标签节点,进而得到汉明损失最小的GLabel算法阈值;
第二特征构造模块,用于根据新任务工单中描述的问题症状构造新的特征向量和新的标签集,在所述新的标签集中,除根标签节点外,对层次标签树中所有其他标签节点的二分类器,根据所述新的特征向量计算新任务工单的修正概率值,根据新任务工单的修正概率值,使用GLabel算法和所述的GLabel算法阈值,搜索出最优结果标签集;
工单派发模块,用于将新任务工单派发给具有最优结果标签集的父标签节点相应的维护团队。
9.根据权利要求8所述的网络运维任务工单的派发装置,其特征在于,所述第一特征构造模块,具体用于
在已有运维任务工单中描述的问题症状中提取名词、形容词和动词;
根据提取出的所有词计算对应的TF-IDF值,将TF-IDF值最高的M个特征词作为所述已有任务工单的特征向量;
将所述已有任务工单对应的所有原始标签节点和各父标签节点对应层次标签树的所有祖先标签节点并集去重后得到所述已有任务工单标签集。
10.根据权利要求8所述的网络运维任务工单的派发装置,其特征在于,所述装置还包括训练模块,
所述训练模块,用于根据所述已有任务工单标签集中层次标签树的层次关系和每一张已有任务工单所对应的多标签,筛选出层次标签树中每个标签节点的标签训练数据集;
根据所述的标签训练数据集,并行训练各父标签节点对应的原始二分类器;
将训练后的原始二分类器作为各标签节点的二分类器。
11.根据权利要求10所述的网络运维任务工单的派发装置,其特征在于,所述训练模块,具体用于针对所述已有任务工单标签集中层次标签树上的每一个标签节点,判断已有任务工单,将同时含有所述每一个标签节点和所述每一个标签节点的父标签节点的已有任务工单作为所述每一个标签节点的标签训练数据集的任务工单;
针对所述层次标签树上除了根标签节点外的所有标签节点,循环判断所有的已有任务工单,筛选出各个父标签节点对应的标签训练数据集。
12.根据权利要求10所述的网络运维任务工单的派发装置,其特征在于,所述原始二分类器是根据所述层次标签树中每一个标签节点的标签训练数据集,采用libSVM库中提供的SVM算法构造的分类器。
13.一种网络运维任务工单的派发设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-7中任一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-7中任一项所述的方法。
CN201711494858.8A 2017-12-31 2017-12-31 网络运维任务工单的派发方法、装置、设备及介质 Active CN109993391B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711494858.8A CN109993391B (zh) 2017-12-31 2017-12-31 网络运维任务工单的派发方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711494858.8A CN109993391B (zh) 2017-12-31 2017-12-31 网络运维任务工单的派发方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN109993391A CN109993391A (zh) 2019-07-09
CN109993391B true CN109993391B (zh) 2021-03-26

Family

ID=67110874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711494858.8A Active CN109993391B (zh) 2017-12-31 2017-12-31 网络运维任务工单的派发方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN109993391B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111104436B (zh) * 2019-12-27 2023-06-23 苏宁云计算有限公司 一种标签维值自调整方法及系统
CN111599444A (zh) * 2020-05-18 2020-08-28 深圳市悦动天下科技有限公司 智能舌诊检测方法、装置、智能终端和存储介质
CN113672736B (zh) * 2021-09-09 2023-08-22 上海德拓信息技术股份有限公司 一种文本多标签分类方法及系统
CN115983609B (zh) * 2023-03-17 2023-06-13 中关村科学城城市大脑股份有限公司 工单处理方法、装置、电子设备和计算机可读介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868773A (zh) * 2016-03-23 2016-08-17 华南理工大学 一种基于层次随机森林的多标签分类方法
CN106779084A (zh) * 2016-09-30 2017-05-31 广州英康唯尔互联网服务有限公司 机器学习系统及方法
CN107292186A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 一种基于随机森林的模型训练方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080195577A1 (en) * 2007-02-09 2008-08-14 Wei Fan Automatically and adaptively determining execution plans for queries with parameter markers

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868773A (zh) * 2016-03-23 2016-08-17 华南理工大学 一种基于层次随机森林的多标签分类方法
CN107292186A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 一种基于随机森林的模型训练方法和装置
CN106779084A (zh) * 2016-09-30 2017-05-31 广州英康唯尔互联网服务有限公司 机器学习系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"信息通信网络集中监控运维体系架构与工程实践";王洋等;《武汉理工大学学报(信息与管理工程版)》;20170815;第39卷(第4期);第439-443页 *

Also Published As

Publication number Publication date
CN109993391A (zh) 2019-07-09

Similar Documents

Publication Publication Date Title
US11438212B2 (en) Fault root cause analysis method and apparatus
CN109993391B (zh) 网络运维任务工单的派发方法、装置、设备及介质
Thung et al. Active semi-supervised defect categorization
CN114785666B (zh) 一种网络故障排查方法与系统
US20100318846A1 (en) System and method for incident management enhanced with problem classification for technical support services
CN109633369B (zh) 一种基于多维数据相似性匹配的电网故障诊断方法
CN111325260B (zh) 数据处理方法及装置、电子设备、计算机可读介质
JP2016042359A (ja) 認識装置、実数行列分解方法、認識方法
CN116152016A (zh) 一种配电网故障定位方法、装置、设备及存储介质
CN113780367A (zh) 分类模型训练和数据分类方法、装置、电子设备
CN114328106A (zh) 日志数据处理方法、装置、设备及存储介质
CN113591077A (zh) 一种网络攻击行为预测方法、装置、电子设备及存储介质
CN115858906A (zh) 企业搜索方法、装置、设备、计算机存储介质及程序
CN114897085A (zh) 一种基于封闭子图链路预测的聚类方法及计算机设备
CN114491081A (zh) 基于数据血缘关系图谱的电力数据溯源方法及系统
Szarmach et al. Multi-label classification for AIS data anomaly detection using wavelet transform
Li et al. Improving performance of log anomaly detection with semantic and time features based on bilstm-attention
CN116795886A (zh) 用于销售数据的数据分析引擎及方法
CN115035966B (zh) 基于主动学习和符号回归的超导体筛选方法、装置及设备
CN114880584A (zh) 一种基于社区发现的发电机组故障分析方法
CN113392579A (zh) 基于因果模型的主效应因素分析方法及设备
Xi et al. A novel ensemble approach to multi-label classification for electric power fault diagnosis
CN112418449A (zh) 一种供电线路故障定位模型的生成方法、定位方法、装置
CN117254980B (zh) 一种基于注意力机制的工业网络安全风险评估方法及系统
CN111259918B (zh) 一种意图标签的标注方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant