CN105847065B - 一种网元设备误配置检测方法及检测设备 - Google Patents

一种网元设备误配置检测方法及检测设备 Download PDF

Info

Publication number
CN105847065B
CN105847065B CN201610349172.9A CN201610349172A CN105847065B CN 105847065 B CN105847065 B CN 105847065B CN 201610349172 A CN201610349172 A CN 201610349172A CN 105847065 B CN105847065 B CN 105847065B
Authority
CN
China
Prior art keywords
configuration file
junior
group
configuration
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610349172.9A
Other languages
English (en)
Other versions
CN105847065A (zh
Inventor
林雪峰
宋跃忠
程敏
刘文印
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201610349172.9A priority Critical patent/CN105847065B/zh
Publication of CN105847065A publication Critical patent/CN105847065A/zh
Application granted granted Critical
Publication of CN105847065B publication Critical patent/CN105847065B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种网元设备误配置检测方法及检测设备,涉及数据挖掘和网络管理领域,以解决现有误配置检测需要投入大量的人力和时间,导致的误配置检测效率和灵活性较低的问题。所述方法包括:获取M个配置文件,对所述M个配置文件进行聚类处理,形成N个配置文件组群,对每个配置文件组群进行处理,确定每个配置文件组群中的一致性规律,根据待检测的配置文件所属的配置文件组群的一致性规律,对待检测的配置文件进行误配置检查。

Description

一种网元设备误配置检测方法及检测设备
技术领域
本发明涉及数据挖掘和网络管理领域,尤其涉及一种网元设备误配置检测方法及检测设备。
背景技术
随着网络技术的发展,宽带路由器在网络中的应用变得越来越广泛,且在网络中占据重要地位。然而,宽带路由器在运行过程中难免会出现故障,甚至导致网络暂时性的中断,这不但会给企业带来诸多的不便,也可能会因此造成一定的损失,因而及时地检测并解决路由器的故障是很有必要的。而在对路由器故障产生原因的排查过程中,人们发现:路由器配置错误(即误配置)的原因占了很大一部分比例,因而对路由器的配置错误进行检测及更正是很有必要的,这样可以很好的避免路由器故障的发生。
目前,人们多采用人工检测配置文件的方式,逐条检测配置文件中的命令配置,检测出配置文件中出现的错误。由于,目前在误配置检测过程中人为参与的部分较多,投入了大量的人力和时间,同时,又需要结合大量的专业知识识别出网络设备的错误配置,误配置检测效率和灵活性较低。
发明内容
为解决上述问题,本发明实施例提供一种网元设备误配置检测方法及检测设备,以解决现有误配置检测需要投入大量的人力和时间,导致的误配置检测效率和灵活性较低的问题。
为达到上述目可选的,本发明的实施例采用如下技术方案:
第一方面,本发明实施例提供一种网元设备误配置检测方法,应用于检测设备,该检测方法可以包括:
获取M个包含:上级命令行、以及属于所述上级命令行的至少一个下级命令行的配置文件;
对这M个配置文件进行聚类处理,将实现功能或配置结构相同或相似的配置文件作为一类配置文件集合在一起,得到N个配置文件组群;
确定每个配置文件组群中的一致性规律;
根据待检测的配置文件所属的配置文件组群的一致性规律,对待检测的配置文件进行误配置检查。
如此,可以寻找出一类配置文件群组中存在的一致性规律,根据一致性规律自动对属于该类的配置文件进行检测,确定出配置文件中的误配置命令,实现了自动检测,显著提升了误配置问题的解决效率
可选的,在第一方面的一种可实现方式中,所述对所述M个配置文件进行聚类处理,形成N个配置文件组群,可以包括:
计算M个配置文件中任意两个配置文件间的相似距离,得到M*M的矩阵,M*M的矩阵中第i行第j列的元素表示:M个配置文件中配置文件i与配置文件j之间的相似距离,i、j均为小于等于M的整数;
对M*M的矩阵进行处理,得到归一化的拉普拉斯矩阵;
对归一化的拉普拉斯矩阵进行计算,得到由S个M行向量组成的M*S的特征向量矩阵,M*S的特征向量矩阵的M行向量与所述M个配置文件一一对应;
对所述M行向量进行聚类,形成N个向量组群;
遍历所述N个向量组群中的每个向量组群,将与所述向量组群包含的向量相对应的配置文件组合成一个配置文件组群,得到N个配置文件组群。
如此,可以通过配置文件间相似距离的计算,将相似的配置文件聚合在一起组成配置文件组群,提高同类配置文件一致性规律挖掘的完整性和准确性。
具体的,对于M个配置文件中的任意两个配置文件:第一配置文件和第二配置文件,可以根据下述方法计算这两个配置文件间的相似距离:
在计算M个配置文件中任意两个配置文件间的相似距离之前,将M个配置文件中每个配置文件转化为一颗包含至少一个字符串的配置树,每个字符串可以包含:上级命令行、与上级命令行对应的一个下级参数命令、以及与下级参数命令相对应的参数值。
若第一配置文件对应第一配置树,第二配置文件对应第二配置树,则遍历第一配置树中的每个字符串,分别计算字符串与第二配置树中每个字符串间的相似距离;
将计算出来的相似距离进行求和,得到与字符串对应的相似距离;
将第一配置树中每个字符串对应的相似距离进行求和,得到第一配置文件与第二配置文件间的相似距离。
如此,可以将配置文件简化为一颗配置树,通过配置树中字符串的比较来确定配置文件间的相似距离,降低了相似距离计算的复杂性。
由于,在实际应用中,本领域技术人员发现:对于实现功能或配置结构相似的多个配置文件而言,通常存在下述一致性规律:在这些配置文件中某些参数命令对应的参数值可能是相同的、固定不变的,即取该参数值的参数命令在这些配置文件中出现的频率是较高的,而与该参数命令对应的其他参数值支持度较少或者不会出现;同时,在这些配置文件中,某些参数命令常常会联系在一起同时且高频率地出现在这些配置文件中。
基于此,在第一方面的一种可实现方式中,对于N个配置文件组群中的第一配置文件组群,第一配置文件组群为N个配置文件中的任一配置文件组群,可以根据下述两种方式确定第一配置文件组群中的一致性规律,并根据确定出的一致性规律进行误配置检测:
(1)根据贝叶斯检测方法,确定第一配置文件组群中与属于第一上级命令行的第一下级参数命令相对应的训练参数;第一上级命令行为第一配置文件组群中的任一上级命令行,第一下级参数命令为属于第一上级命令行的任一下级参数命令;
对待检测的配置文件进行归类处理;
若待检测的配置文件归为第一配置文件组群,则计算待检测的配置文件中,属于第一上级命令行的第一下级参数命令所对应的参数值的概率,
若概率小于训练参数,则确定待检测的配置文件中属于第一上级命令行的第一下级参数命令的配置是错误的。
具体的,所述根据贝叶斯检测方法,确定所述第一配置文件组群中与属于第一上级命令行的第一下级参数命令相对应的训练参数,可以包括:
分别根据下述公式,计算属于第一上级命令行Pi的第一下级参数命令Cj的熵和逆文档频率:
熵:
逆文档频率:其中,所述Pi@Cj表示:属于第一上级命令行的第一下级参数命令,所述A为Pi@Cj对应的参数值的所有可能取值,Q为所述第一配置文件组群包含的配置文件的总个数,t为所述第一配置文件组群中出现Pi@Cj的配置文件的个数;
令Zi,j=Pi@Cj,则H(Zi,j)=I(Zi,j)*Idf(Zi,j)
根据下述公式得到与Pi@Cj相对应的训练参数alpha:
(2)遍历第一配置文件群组中的任一上级命令行,确定属于上级命令行的下级命令行组,下级命令行组包含:属于上级命令行的至少一个下级命令行,且至少一个下级命令行在第一配置文件组群中的支持度大于等于最小支持度,且至少一个下级命令行满足最小置信度;
对待检测的配置文件进行归类处理;
若待检测的配置文件归为第一配置文件组群,则查看待检测的配置文件中的下级命令行;
若在待检测的配置文件中的下级命令行中,存在属于第一上级命令行的第一下级命令行包含在确定出的属于第一上级命令行的第一下级命令行组内,而第一下级命令行组内的其他下级命令行未包含在待检测的配置文件中,则确定待检测的配置文件中属于第一上级命令行的配置是错误的。
具体的,对于第一配置文件群组中的第一上级命令行Pi,第一上级命令行为第一配置文件组群中的任一上级命令行,确定属于Pi的下级命令行组,可以包括:
以Pi为单位,统计属于Pi的每个下级命令行在第一配置文件群组中的支持度,将支持度大于等于最小支持度的下级命令行放入一阶频繁项集L1中;
若L1不为空,则根据L1生成二阶候选项集C2,C2包含至少一个候选项,候选项由L1中两个不同的下级命令行组成;
以Pi为单位,统计C2中每个候选项在第一配置文件群组中的支持度,将支持度大于等于最小支持度的候选项放入二阶频繁项集L2中;
若L2不为空,则重复上述过程,直到生成K阶频繁项集LK,LK包含至少一个频繁项,每个频繁项由K-1阶频繁项集LK-1中的K个不同的下级命令行组成;
若LK不为空,则根据LK中的频繁项生成规则集合,所述规则集合包含至少一个规则项,每个规则项包含:所述LK中的至少一个频繁项、以及所述至少一个频繁项之间的相互关系;
将所述规则集合中置信度大于等于最小置信度的规则项作为属于所述第一上级命令行的下级命令行组
如此,可以根据上述方式确定出配置文件组群中存在的一致性规律,根据确定出的一致性规律,将不满足该一致性规律的网元设备的配置确定为误配置。
第二方面,本发明实施例还提供一种检测设备,用于执行第一方面所述的网元设备误配置检测方法,对网元设备的配置进行误配置检测,该设备可以包括:
获取单元,用于获取M个包含上级命令行、以及属于上级命令行的至少一个下级命令行的配置文件,每个下级命令行包含:下级参数命令、以及与下级参数命令相对应的参数值;
聚类单元,用于对获取单元获取到的M个配置文件进行聚类处理,形成N个配置文件组群;
规律确定单元,用于确定聚类单元得到的每个配置文件组群中的一致性规律;
检测单元,用于根据待检测的配置文件所属的配置文件组群的一致性规律,对待检测的配置文件进行误配置检查。
具体的,上述获取单元、聚类单元、规律确定单元以及检测单元的执行过程可以参照第一方面所述方法中的执行过程,在此不再详细赘述。
需要说明的是,第二方面中的获取单元可以为检测设备的通信单元,第二方面中的聚类单元、规律确定单元以及检测单元可以为单独设立的处理器,也可以集成在检测设备的某一个处理器中实现,此外,也可以以程序代码的形式存储于检测设备的存储器中,由检测设备的某一个处理器调用并执行以上聚类单元、规律确定单元以及检测单元的功能。这里所述的处理器可以是一个中央处理器(Central Processing Unit,CPU),或者是特定集成电路(Application Specific Integrated Circuit,ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路。
由上可知,本发明实施例提供一种网元设备误配置检测方法及检测设备,获取M个配置文件,对所述M个配置文件进行聚类处理,形成N个配置文件组群,确定配置文件组群中的一致性规律,根据待检测的配置文件所属的配置文件组群的一致性规律,对待检测的配置文件进行误配置检查。如此,寻找配置文件中存在的一致性规律,根据一致性规律自动对配置文件进行检测,确定出配置文件中的误配置命令,实现了自动检测,显著提升了误配置问题的解决效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的误配置检测的原理框图;
图2为本发明实施例提供的检测设备20的结构图;
图3为本发明实施例提供的网元设备误配置检测方法的流程图;
图4为本发明实施例提供的检测设备30的结构图。
具体实施方式
本发明的基本原理是:在一个局域网中,对不同路由器的配置文件进行汇总处理,将配置形似或相同的配置文件进行聚类,找到每类配置文件中存在的一致性规律(如某条参数命令的参数值在配置文件中具有较高的出现频率,或者,多条参数命令在配置文件中组合出现的频率较高),然后根据这种规律找到一种合适的数学检测方法对待检测的配置文件中的参数命令进行实时检测,若该条参数命令违反该一致性规律,则确定该参数命令配置的参数值或者该配置文件内可能存在错误配置,如此,根据合适的检测方法对配置文件进行自动检测,提升了误配置检测的效率和灵活性。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
例如,图1为本发明实施例提供的误配置检测的原理框图,如图1所示,将处于同一局域网的不同路由器的配置文件作为训练文件,对这些文件进行配置文件聚类,将相同或相似的配置文件归为一类,对每类配置文件进行一致性规律挖掘,找出该类配置文件中参数命令出现的规律性,然后,对待检测的配置文件归类,根据配置文件所属类别对应的一致性规律进行误配置检测,进而将误配置结果通过检测报告反馈给检测人员。
其中,本发明提供的网元设备误配置检测方法可由图2所示的检测设备20执行,用于对网络设备10的配置进行误差检测,所述网络设备10可以为路由器,所述检测设备20可以为:交换机、路由器、网管设备、Web(网页)服务器、软件定义网络(Software DefinedNetwork,SDN)控制器等设备中的任一种设备。可选的,如图2所示,所述检测设备20可以包括:处理器2011、存储器2012、通信单元2013以及至少一个通信总线2014,通信总线2014用于实现这些装置之间的连接和相互通信;
处理器2011,可能是一个中央处理器(central processing unit,简称为CPU),也可以是特定集成电路(Application Specific Integrated Circuit,ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路,例如:一个或多个微处理器(digitalsingnal processor,DSP),或,一个或者多个现场可编程门阵列(Field ProgrammableGate Array,FPGA)。
存储器2012,可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);或者非易失性存储器(non-volatile memory),例如只读存储器(read-only memory,ROM),快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);或者上述种类的存储器的组合。
通信单元2013可用于与外部网元之间进行数据交互,如:收集网络设备10产生的配置文件,并将检测出的误配置文件反馈给检测人员。
通信总线2014可以分为地址总线、数据总线、控制总线等,可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。为便于表示,图2中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
具体的,通信单元2013,可以用于获取M个配置文件,所述M为大于等于1的整数,所述配置文件包含上级命令行、以及属于所述上级命令行的至少一个下级命令行,每个所述下级命令行包含:下级参数命令、以及与所述下级参数命令相对应的参数值.
处理器2011,可以用于对所述M个配置文件进行聚类处理,形成N个配置文件组群,所述配置文件组群包含至少一个配置文件,所述N≤M,所述N为大于等于1的整数;
确定所述配置文件组群中的一致性规律,根据待检测的配置文件所属的配置文件组群的一致性规律,对待检测的配置文件进行误配置检查。
如此,可以寻找出一类配置文件群组中存在的一致性规律,根据一致性规律自动对属于该类的配置文件进行检测,确定出配置文件中的误配置命令,实现了自动检测,显著提升了误配置问题的解决效率。
为了便于描述,以下实施例一以步骤的形式示出并详细描述了本发明中检测设备20执行的网元设备误配置检测方法,其中,示出的步骤也可以在除检测设备20之外的诸如一组可执行指令的计算机系统中执行,如:本发明所述的方法还可以由网络设备10执行,即图2所示的检测设备20中包含的执行本发明提供的方法的单元也可以包含在网络设备10中,由网络设备10执行本发明提供的网元设备误配置检测方法。此外,虽然在图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一
图3为本发明实施例提供的网元设备误配置检测方法的流程图,由图2所示的检测设备20执行,用于对图2中的检测设备20进行误配置检测,如图3所示,所述方法可以包括:
S101:获取M个配置文件,所述M为大于等于1的整数。
其中,配置文件为网络设备活动行为的执行依据,每个配置文件可以包含多个命令片段,每个命令片段可以由一系列具有等级结构的字符串组成,可以包含:上级命令行、以及属于上级命令行的至少一个下级命令行,所述上级命令行包含:上级参数命令、以及与上级参数命令相对应的参数值,下级命令行包含下级参数命令、以及与下级参数命令相对应的参数值;需要说明的是,在某些情况下,配置文件中命令片段包含的上级命令行可以为空,即可以在该命令片段中不存在上级命令行,仅包含至少一个下级命令行。
例如,对于下述命令片段:
isis 112
is-level level-2
cost-style wide
其中,isis 112为上级命令行,isis为上级参数命令,112为与上级参数命令相对应的参数值,“is-level level-2”、“cost-style wide”分别为同属于上级命令行isis 112的下级命令行,以下级命令行“is-level level-2”为例,“is-level”为下级参数命令,“level-2”为与该下级参数命令相对应的参数值。
可选的,检测设备可以直接从至少一个网络设备的存储器中读取得到至少一个配置文件,也可以从独立于网络设备之外的数据库中获取至少一个网络设备在一段时间内的配置文件,其中,数据库可以存在于一服务器中,且该服务器可以预先存储网络中每个网络设备的配置文件。需要说明的是,在本发明实施例中,每个网络设备可对应一个配置文件。
S102:对所述M个配置文件进行聚类处理,形成N个配置文件组群,所述N≤M,所述N为大于等于1的整数。
可选的,所述对所述M个配置文件进行聚类处理,形成N个配置文件组群,可以包括:
计算所述M个配置文件中任意两个配置文件间的相似距离,得到M*M的矩阵,所述M*M的矩阵中第i行第j列的元素表示:所述M个配置文件中配置文件i与配置文件j之间的相似距离,i、j均为小于等于M的整数;
对所述M*M的矩阵进行处理,得到归一化的拉普拉斯矩阵;
对所述归一化的拉普拉斯矩阵进行计算,得到M*S的特征向量矩阵,所述M*S的特征向量矩阵由S个M行向量组成,所述M*S的特征向量矩阵的M行向量与所述M个配置文件一一对应,所述S≤M,所述S为大于等于1的整数;
对所述M行向量进行聚类,形成N个向量组群,所述N个向量组群包含至少一行向量;
遍历所述N个向量组群中的每个向量组群,将与所述向量组群包含的向量相对应的配置文件组合成一个配置文件组群,得到N个配置文件组群。
其中,两个配置文件间的相似距离用于表示:这两个配置文件实现的功能和/或配置结构的相似程度。通常情况下,配置文件间的相似距离越大,则表示配置文件间的功能和/或结构越不相似,配置文件间的相似距离越小,则表示配置文件间的功能和/或结果越相似。
可选的,在本发明实施例中,在计算M个配置文件中任意两个配置文件间的相似距离之前,可以将M个配置文件中每个配置文件转化为一颗配置树,所述配置树可以包含:至少一个字符串,每个字符串可以包含下述三个部分:上级命令行、属于该上级命令行的一个下级参数命令、以及与该下级参数命令相对应的参数值,这三部分之间可以采用特殊符号隔开,如:可以采用符号@隔开;
对于M个配置文件中的任意两个配置文件:第一配置文件和第二配置文件,第一配置文件对应第一配置树,第二配置文件对应第二配置树,计算第一配置文件和第二配置文件间的相似距离具体可以包括:
遍历所述第一配置树中的每个字符串,分别计算所述字符串与所述第二配置树中每个字符串间的相似距离;
将计算出来的相似距离进行求和,得到与所述字符串对应的相似距离;
将所述第一配置树中每个字符串对应的相似距离进行求和,得到所述第一配置文件与所述第二配置文件间的相似距离。
如此,将配置文件表示为一颗配置树,既可以保留配置文件中的等级信息又可以提升配置文件间相似距离计算的准确性和简单程度。
其中,可以采用下述顺序匹配的方式来计算字符串间的相似距离,先匹配字符串间的上级命令行是否相同,若相同,则将字符串间的相似距离记为0,若不相同,则将字符串间的相似距离记为1;然后,匹配字符间的下级参数命令,若相同,则将字符串的相似距离记为0,若不相同,则将字符串的相似距离记为1,最后,匹配字符串间的参数值,若相同,则将字符串的相似距离记为0,若不相同,则将字符串间的相似距离记为1,累计每次记录的相似距离,将累计后的值作为字符串间的相似距离。
应当理解的是,上述采用数字0和1来记录匹配结果的方式仅为本实施例的可选方式,本领域技术人员还可以根据具体的应用环境以及其他相关背景选取其他数字来对应记录匹配结果,此外,上述顺序匹配上级命令行、下级参数命令、参数值的方式也仅为本实施例的可选方式,本领域技术人员还可以根据具体的应用环境以及其他相关背景打乱上述匹配顺序,采用其他顺序进行匹配,如,可采用下述顺序:参数值、下级参数命令、顺序匹配上级命令行进行匹配。
例如,若第一配置文件包含下述命令片段:
isis 112
is-level level-2
cost-style wide
第二配置文件包含下述命令片段:
isis 112
timer lsp-generation 1 50 50level-2
flash-flood level-2
则该第一配置文件对应的配置树为:isis 112@is-level@level-2、isis112@cost-style@wide;第二配置文件对应的配置树为:isis 112@timer lsp-generation@1 5050level-2、isis 112@flash-flood@level-2;
将第一配置文件的字符串“isis 112@is-level@level-2”与第二配置文件对应的配置树中的字符串“isis 112@timer lsp-generation@1 50 50level-2、isis 112@flash-flood@level-2”分别进行匹配,得到“isis 112@is-level@level-2”与“isis 112@timerlsp-generation@1 50 50level-2”间的相似距离为:2,字符串“isis 112@is-level@level-2”与“isis 112@flash-flood@level-2”的相似距离为1,则字符串“isis 112@is-level@level-2”对应的相似距离为:2+1=3;
同理,计算得到字符串“isis 112@cost-style@wide”的相似距离为:2+2=4,则第一配置文件与第二配置文件间的相似距离为:3+4=7。
如此,可以根据上述方法得到M个配置文件中任意两个配置文件间的相似距离。可理解的而是,当计算配置文件与自身之间的相似距离时,可以计算与该配置文件对应的配置树中每个字符串与该配置树中其他字符串之间的相似距离,将计算得到的每个字符串对应的相似距离相加得到该配置文件与自身之间的相似距离。
可选的,对于M*M的矩阵E,可以先根据公式:L=D-E得到拉普拉斯矩阵L,矩阵D为对角矩阵,其对角线上的元素为M*M的矩阵E对应行或列所有元素的和,然后,在对得到的拉普拉斯矩阵L进行归一化处理,得到归一化的拉普拉斯矩阵。
其中,归一化处理可以为现有技术,在此不再进行详细赘述。
可选的,可以采用K-mean聚类的方法对M行向量进行聚类,形成N个向量组群;其中,K-means聚类算法是一种基于样本间相似性度量的间接聚类方法,此算法以k为参数,把多个对象分为k个簇,以使簇内具有较高的相似度,而且簇间的相似度较低,相似度的计算根据一个簇中对象的平均值来进行,此算法首先随机选择k个对象,每个对象代表一个聚类中心,对于其余的每一个对象,根据该对象与各聚类中心之间的距离,把它分配到与之最相似的聚类中,然后,计算每个聚类的新中心,重复上述过程,直到准则函数收敛。
S103:确定每个配置文件组群的一致性规律,根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的配置文件进行误配置检查。
由于,在实际应用中,本领域技术人员发现:对于实现功能或配置结构相似的多个配置文件而言,通常存在下述两个规律(1)在这些配置文件中某些参数命令对应的参数值可能是相同的、固定不变的,即取该参数值的参数命令在这些配置文件中出现的频率是较高的,而与该参数命令对应的其他参数值出现次数较少或者不会出现,(2)在这些配置文件中,某些参数命令常常会联系在一起同时且高频率地出现在这些配置文件中,为此,本发明技术人员采集大量的配置文件,结合合适的数学方法对采集到的配置文件进行训练,找到实现功能或配置结构相似的同类配置文件中的一致性规律,若属于该类配置文件的待检测的配置文件违反该一致性规律(如:本该出现次数较频繁的参数命令却在待检测的配置文件中出现次数较低或不出现,或者,本该和其他参数命令一起同时出现在待检测的配置文件中的参数命令,在待检测的配置文件却没有出现),则确定该待检测的配置文件中出现配置错误。
基于此,对于所述N个配置文件组群中的第一配置文件组群,所述第一配置文件组群为所述N个配置文件中的任一配置文件组群,可以根据下述两种方式确定所述第一配置文件组群中的一致性规律,并进行误配置检测:
(1)根据贝叶斯检测方法,确定所述第一配置文件组群中与属于第一上级命令行的第一下级参数命令相对应的训练参数;所述第一上级命令行为所述第一配置文件组群中的任一上级命令行,所述第一下级参数命令为属于所述第一上级命令行的任一下级参数命令;
所述根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的配置文件进行误配置检查,可以包括:
对所述待检测的配置文件进行归类处理;
若所述待检测的配置文件归为所述第一配置文件组群,则计算所述待检测的配置文件中,属于所述第一上级命令行的第一下级参数命令所对应的参数值的概率,
若所述概率小于所述训练参数,则确定所述待检测的配置文件中属于所述第一上级命令行的第一下级参数命令的配置是错误的。
其中,计算属于第一上级命令行的第一下级参数命令所对应的参数值的概率可以为:
统计待检测的配置文件中,包含该参数值的第一下级参数命令的个数、以及第一下级参数命令的总个数,将统计的包含该参数值的第一下级参数命令的个数作为分子、第一下级参数命令的总个数作为分母进行计算,将得到的分数值作为该参数值的概率。
具体的,根据贝叶斯检测方法,确定所述第一配置文件组群中与属于第一上级命令行的第一下级参数命令相对应的训练参数,可以包括:
根据下述公式分别计算属于第一上级命令行Pi的第一下级参数命令Cj的熵和逆文档频率:
熵:
逆文档频率:其中,Pi@Cj为属于第一上级命令行的第一下级参数命令,所述A为Pi@Cj相对应的参数值的所有可能取值,Q为所述第一配置文件组群包含的配置文件的总个数,t为所述第一配置文件组群中出现Pi@Cj的配置文件的个数;
令Zi,j=Pi@Cj,则H(Zi,j)=I(Zi,j)*Idf(Zi,j)
根据下述公式得到与Pi@Cj相对应的训练参数alpha:
其中,ak∈anomaly表示Pi@Cj配置错误时对应的参数值,m、n、l分别表示配置正常的上级参数命令、下级参数命令以及参数值。
若待检测的配置文件中的命令Zi,j的概率满足:则说明该待检测的配置文件中的命令Zi,j为误配置。
(2)遍历所述第一配置文件群组中的任一上级命令行,确定属于所述上级命令行的下级命令行组,下级命令行组包含:属于所述上级命令行的至少一个下级命令行,且所述至少一个下级命令行在所述第一配置文件组群中的支持度大于等于最小支持度,且所述至少一个下级命令行满足最小置信度;
所述根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的配置文件进行误配置检查,可以包括:
对所述待检测的配置文件进行归类处理;
若所述待检测的配置文件归为所述第一配置文件组群,则查看所述待检测的配置文件中的下级命令行;
若在所述待检测的配置文件中的下级命令行中,存在属于第一上级命令行的第一下级命令行包含在确定出的属于所述第一上级命令行的第一下级命令行组内,而第一下级命令行组内的其他下级命令行未包含在所述待检测的配置文件中,则确定所述待检测的配置文件中属于所述第一上级命令行的配置是错误的。
具体的,对于所述第一配置文件群组中的第一上级命令行Pi,所述第一上级命令行为所述第一配置文件组群中的任一上级命令行,所述确定属于所述第一上级命令行的下级命令行组,可以包括:
以Pi为单位,统计属于Pi的每个下级命令行在第一配置文件群组中的支持度,将支持度大于等于最小支持度的下级命令行放入一阶频繁项集L1中;
若L1不为空,则根据L1生成二阶候选项集C2,所述C2包含至少一个候选项,所述候选项由所述L1中两个不同的下级命令行组成;
以Pi为单位,统计C2中每个候选项在第一配置文件群组中的支持度,将支持度大于等于最小支持度的候选项放入二阶频繁项集L2中;
若L2不为空,则重复上述过程,直到生成K阶频繁项集LK,LK包含至少一个频繁项,每个频繁项由K-1阶频繁项集LK-1中的K个不同的下级命令行组成,且由所述LK生成的K+1候选项集CK+1中所有候选项的在所述第一配置文件群组中的支持度均小于所述最小支持度;
若LK不为空,则根据LK中的频繁项生成规则集合,所述规则集合包含至少一个规则项,每个规则项包含:所述LK中的至少一个频繁项、以及所述至少一个频繁项之间的相互关系;
将所述规则集合中置信度大于等于最小置信度的规则项作为属于所述第一上级命令行的下级命令行组。
其中,在本发明实施例中,最小支持度、最小置信度为预先设置的门限值,其具体取值可以根据需要进行设置,本发明实施例对此不进行限定;若命令行或候选项的支持度大于等于最小支持度,则表示该命令行或候选项在该配置文件群组中出现的频率较高,为频繁出现项,若命令行的支持度小于最小支持度,则表示该命令行在该配置文件群组中的出现频率较低。
若确定出的规则项的置信度大于等于最小置信度,则表示该规则项中设置的频繁项之间的相互关系在配置文件群组中可靠度较高,若确定出的规则项的置信度小于最小置信度,则表示该规则项中设置的频繁项之间的相互关系在配置文件群组中的可靠度较低,有可能在某种情况下,该规则项中各频繁项之间的相互关系可能会发生变化。
其中,上述下级命令行在第一配置文件群组中的支持度可以为:第一配置文件组群中出现该下级命令行的次数与第一配置文件组群包含的总的配置文件个数的比值,当候选项是由多个下级命令行组成时,该候选项在该第一配置文件组群中的支持度可以指:第一配置文件组群中出现候选项的次数与组成候选项的每个下级命令行在第一配置文件组群中出现的次数的和的比值。需要说明的是,在本发明实施例中,若下级命令行或候选项在第一配置文件组群的S个配置文件中出现过,则表示该下级命令行或候选项出现的次数为S次,即下级命令行或候选项只要在一个配置文件中出现过,不论在该配置文件中出现一次或多次,都可以确定为该下级命令行或候选项在该配置文件中出现1次。
例如,若一配置文件组群包含10个配置文件,且P1@C1@a1在第一个配置文件中出现的次数为4(即第一个配置文件包含4个命令行P1@C1@a1),P1@C1@a1在第五个配置文件中出现的次数为3,P1@C1@a1在第八个配置文件中出现的次数为5,由此可知,命令行P1@C1@a1仅在第一个配置文件、第五个配置文件、以及第八个配置文件3个配置文件中出现过,因此,P1@C1@a1的出现次数为3次,P1@C1@a1的支持度为3/10=0.3。
需要说明的是,在本发明实施例中,规则项中至少一个频繁项之间的相互关系可以任意设定,如:可以将至少一个频繁项中的任一个频繁项设置为处于主导地位,其他频繁项由该频繁项推导出来,即至少一个频繁项中的其他频繁项从属与该频繁项,其中,规则项的置信度可以为:该规则项中至少一个频繁项同时出现在配置文件组群中的次数与规则项中处于主导地位的频繁项在配置文件组群中出现的次数的比值。
例如:若最终确定出的LK包含4个频繁项{a,b,c,d},则可以将LK中的频繁项任何组合,生成规则集合,如可以生成{(a→b),(a→b、c),(a→c、d),(b→c、d)}的规则集合,其中,“a→b”表示:a推到出来b,a处于主导地位,b处于从属地位,规则项(a→b)的置信度为:a和b同时在配置文件组群中出现的次数/a在配置组群中出现的次数。
可理解的是,在上述确定属于所述第一上级命令行的下级命令行组的过程中,若任意阶频繁项集Li为空,则结束循环,返回i-1阶频繁项集Li-1,根据Li-1中的频繁项生成规则集合,将规则集合中置信度大于等于最小置信度的频繁项作为属于所述第一上级命令行的下级命令行组。
例如,若一配置文件组群中属于上级命令行P1的下级命令行P1@C1@a1、P1@C1@a2、P1@C2@a1的支持度均大于等于最小支持度,则将P1@C1@a1、P1@C1@a2、P1@C2@a1放入一阶频繁项集L1中,然后,将P1@C1@a1、P1@C1@a2、P1@C2@a1两两组合生成二阶候选项集C2={(P1@C1@a1、P1@C1@a2),(P1@C1@a1、P1@C2@a1),(P1@C1@a2、P1@C2@a1)},若二阶候选项集C2中候选项(P1@C1@a1、P1@C1@a2)、(P1@C1@a1、P1@C2@a1)的支持度大于等于最小支持度,则将(P1@C1@a1、P1@C1@a2)、(P1@C1@a1、P1@C2@a1)两个候选项放入二阶频繁项集L2中,此时,若根据L2生成的三阶候选项集C3={(P1@C1@a1、P1@C1@a2、P1@C2@a1)}中的候选项(P1@C1@a1、P1@C1@a2、P1@C2@a1)的支持度小于最小支持度,则结束计算,返回L2,根据L2中的频繁项生成规则集合{((P1@C1@a1、P1@C1@a2)→(P1@C1@a1、P1@C2@a1))},将规则集合中置信度大于等于最小置信度的规则项(P1@C1@a1、P1@C1@a2)→(P1@C1@a1、P1@C2@a1)作为属于上级命令行P1的下级命令行组。
需要说明的是,上述两种方式可以单独执行,也可以结合在一起执行,以更加准确的检测出配置文件中的误配置命令,例如:可以先通过方式(2)确定出配置文件中属于上级命令行1的配置是错误的,然后,再根据方式(1)仅对属于上级命令行1的下级命令行的配置进行检测,确定出属于上级命令行1的具体哪个下级命令行的配置是错误的。
由上可知,本发明实施例提供一种网元设备误配置检测方法,获取M个配置文件,对所述M个配置文件进行聚类处理,形成N个配置文件组群,确定配置文件组群中的一致性规律,根据待检测的配置文件所属的配置文件组群的一致性规律,对待检测的配置文件进行误配置检查。如此,寻找配置文件中存在的一致性规律,根据一致性规律自动对配置文件进行检测,确定出配置文件中的误配置命令,实现了自动检测,显著提升了误配置问题的解决效率。
根据本发明实施例,本发明下述实施例还提供了一种检测设备30,优选地用于实现上述方法实施例中的方法。
实施例二
图4为本发明实施例提供的一种检测设备30的结构图,所述检测设备30可以为:交换机、路由器、网管设备、Web(网页)服务器、软件定义网络(Software Defined Network,SDN)控制器等设备中的任一种设备,用于执行实施例一所述的方法,如图4所示,所述检测设备30可以包括:
获取单元301,用于获取M个配置文件,所述M为大于等于1的整数,所述配置文件包含上级命令行、以及属于所述上级命令行的至少一个下级命令行,每个所述下级命令行包含:下级参数命令、以及与所述下级参数命令相对应的参数值。
聚类单元302,用于对所述获取单元301获取到的M个配置文件进行聚类处理,形成N个配置文件组群,所述配置文件组群包含至少一个配置文件,所述N≤M,所述N为大于等于1的整数。
规律确定单元303,用于确定出所述聚类单元302得到的每个配置文件组群中的一致性规律。
检测单元304,用于根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的配置文件进行误配置检查。
可选的,所述聚类单元302,可以用于:
计算所述M个配置文件中任意两个配置文件间的相似距离,得到M*M的矩阵,所述M*M的矩阵中第i行第j列的元素表示:所述M个配置文件中配置文件i与配置文件j之间的相似距离,i、j均为小于等于M的整数;
对所述M*M的矩阵进行处理,得到归一化的拉普拉斯矩阵;
对所述归一化的拉普拉斯矩阵进行计算,得到S个M行向量,所述S个M行向量与所述M个配置文件一一对应;
对所述S个M行向量进行聚类,形成N个向量组群;
根据所述N个向量组群,得到与所述N个向量组群一一对应的N个配置文件组群。
其中,对于所述M个配置文件中的任意两个配置文件:第一配置文件和第二配置文件,所述聚类单元302具体可以用于通过下述方式计算配置文件间的相似距离:
在计算所述M个配置文件中任意两个配置文件间的相似距离之前,将所述M个配置文件中每个配置文件转化为一颗配置树,所述第一配置文件对应第一配置树,所述第二配置文件对应第二配置树,所述配置树包含:至少一个字符串,每个字符串包含:上级命令行、与所述上级命令行对应的一个下级参数命令、以及与所述下级参数命令相对应的参数值;
遍历所述第一配置树中的每个字符串,分别计算所述字符串与所述第二配置树中每个字符串间的相似距离;
将计算出来的相似距离进行求和,得到与所述字符串对应的相似距离;
将所述第一配置树中每个字符串对应的相似距离进行求和,得到所述第一配置文件与所述第二配置文件间的相似距离。
可选的,对于所述N个配置文件组群中的第一配置文件组群,所述第一配置文件组群为所述N个配置文件中的任一配置文件组群,所述规律确定单元303可以用于通过下述两种方式确定第一配置文件组群中的一致性规律,检测单元304可以根据规律确定单元303确定出的一致性规律采用不同的网元设备误配置检测方法:
(1)根据贝叶斯检测设备,确定所述第一配置文件组群中与属于第一上级命令行的第一下级参数命令相对应的训练参数;所述第一上级命令行为所述第一配置文件组群中的任一上级命令行,所述第一下级参数命令为属于所述第一上级命令行的任一下级参数命令;
所述检测单元304用于:
对待检测的配置文件进行归类处理;
若所述待检测的配置文件归为所述第一配置文件组群,则计算所述待检测的配置文件中,属于所述第一上级命令行的第一下级参数命令所对应的参数值的概率,
若所述概率小于所述训练参数,则确定所述待检测的配置文件中属于所述第一上级命令行的第一下级参数命令的配置是错误的。
具体的,所述规律确定单元303,可以用于:
分别根据下述公式,计算属于第一上级命令行Pi的第一下级参数命令Cj的熵和逆文档频率:
熵:
逆文档频率:其中,所述Pi@Cj表示:属于第一上级命令行的第一下级参数命令,所述A为Pi@Cj对应的参数值的所有可能取值,Q为所述第一配置文件组群包含的配置文件的总个数,t为所述第一配置文件组群中出现Pi@Cj的配置文件的个数;
令Zi,j=Pi@Cj,则H(Zi,j)=I(Zi,j)*Idf(Zi,j)
根据下述公式得到与Pi@Cj相对应的训练参数alpha:
所述检测单元304可以用于:
若待检测的配置文件中的命令Zi,j的概率满足:则说明该待检测的配置文件中的命令Zi,j为误配置。
(2)遍历所述第一配置文件群组中的任一上级命令行,确定出属于所述上级命令行的下级命令行组,下级命令行组包含:属于所述上级命令行的至少一个下级命令行,且所述至少一个下级命令行在所述第一配置文件组群中的支持度大于等于最小支持度,所述至少一个下级命令行满足最小置信度;
所述检测单元304用于:
对所述待检测的配置文件进行归类处理;
若所述待检测的配置文件归为所述第一配置文件组群,则查看所述待检测的配置文件中的下级命令行;
若在所述待检测的配置文件中的下级命令行中,存在属于第一上级命令行的第一下级命令行包含在确定出的属于所述第一上级命令行的第一下级命令行组内,而第一下级命令行组内的其他下级命令行未包含在所述待检测的配置文件中,则确定所述待检测的配置文件中属于所述第一上级命令行的配置是错误的。
具体的,对于所述第一配置文件群组中的第一上级命令行Pi,所述第一上级命令行为所述第一配置文件组群中的任一上级命令行,所述规律确定单元303,具体用于:
以所述Pi为单位,统计属于所述Pi的每个下级命令行在第一配置文件群组中的支持度,将支持度大于等于最小支持度的下级命令行放入一阶频繁项集L1中;
若所述L1不为空,则根据所述L1生成二阶候选项集C2,所述C2包含至少一个候选项,所述候选项由所述L1中两个不同的下级命令行组成;
以所述Pi为单位,统计所述C2中每个候选项在第一配置文件群组中的支持度,将支持度大于等于最小支持度的候选项放入二阶频繁项集L2中;
若所述L2不为空,则重复上述过程,直到生成K阶频繁项集LK,LK包含至少一个频繁项,每个频繁项由K-1阶频繁项集LK-1中的K个不同的下级命令行组成;
若LK不为空,则根据LK中的频繁项生成规则集合,所述规则集合包含至少一个规则项,每个规则项包含:所述LK中的至少一个频繁项、以及所述至少一个频繁项之间的相互关系;
将所述规则集合中置信度大于等于最小置信度的规则项作为属于所述第一上级命令行的下级命令行组。
需要说明的是,图4中的获取单元301可以为图2所示检测设备20中的通信单元2013,图4中的聚类单元302、规律确定单元303以及检测单元304可以为单独设立的处理器2011,也可以集成在图2所示检测设备20中的某一个处理器2011中实现,此外,也可以以程序代码的形式存储于图2所示检测设备20中的存储器2012中,由图2所示检测设备20中的某一个处理器2011调用并执行以上聚类单元302、规律确定单元303以及检测单元304的功能。
由上可知,本发明实施例提供一种检测设备,获取M个配置文件,对所述M个配置文件进行聚类处理,形成N个配置文件组群,确定配置文件组群中的一致性规律,根据待检测的配置文件所属的配置文件组群的一致性规律,对待检测的配置文件进行误配置检查。如此,寻找配置文件中存在的一致性规律,根据一致性规律自动对配置文件进行检测,确定出配置文件中的误配置命令,实现了自动检测,显著提升了误配置问题的解决效率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的单元和系统的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件(例如处理器)来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘或光盘等。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (14)

1.一种网元设备误配置检测方法,应用于检测设备,其特征在于,所述方法包括:
获取M个配置文件,所述M为大于等于1的整数,所述配置文件为网络设备活动行为的执行依据,所述配置文件包含上级命令行、以及属于所述上级命令行的至少一个下级命令行,每个所述下级命令行包含:下级参数命令、以及与所述下级参数命令相对应的参数值;
对所述M个配置文件进行聚类处理,形成N个配置文件组群,所述配置文件组群包含至少一个配置文件,所述N≤M,所述N为大于等于1的整数;
确定每个配置文件组群中的一致性规律;
根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的配置文件进行误配置检查;
对于所述N个配置文件组群中的第一配置文件组群,所述第一配置文件组群为所述N个配置文件中的任一配置文件组群,确定所述第一配置文件组群中的一致性规律,包括:
根据贝叶斯检测方法,确定所述第一配置文件组群中与属于第一上级命令行的第一下级参数命令相对应的训练参数;所述第一上级命令行为所述第一配置文件组群中的任一上级命令行,所述第一下级参数命令为属于所述第一上级命令行的任一下级参数命令;
所述根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的配置文件进行误配置检查,包括:
对所述待检测的配置文件进行归类处理;
若所述待检测的配置文件归为所述第一配置文件组群,则计算所述待检测的配置文件中,属于所述第一上级命令行的第一下级参数命令所对应的参数值的概率;
若所述概率小于所述训练参数,则确定所述待检测的配置文件中属于所述第一上级命令行的第一下级参数命令的配置是错误的。
2.根据权利要求1所述的方法,其特征在于,所述根据贝叶斯检测方法,确定所述第一配置文件组群中与属于第一上级命令行的第一下级参数命令相对应的训练参数,包括:
分别根据下述公式,计算属于第一上级命令行Pi的第一下级参数命令Cj的熵和逆文档频率:
熵:
逆文档频率:其中,所述Pi@Cj表示:属于第一上级命令行的第一下级参数命令,所述A为Pi@Cj对应的参数值的所有可能取值,Q为所述第一配置文件组群包含的配置文件的总个数,t为所述第一配置文件组群中出现Pi@Cj的配置文件的个数;
令Zi,j=Pi@Cj,则H(Zi,j)=I(Zi,j)*Idf(Zi,j)
根据下述公式得到与Pi@Cj相对应的训练参数alpha:
3.根据权利要求1所述的方法,其特征在于,对于所述N个配置文件组群中的第一配置文件组群,所述第一配置文件组群为所述N个配置文件中的任一配置文件组群,确定所述第一配置文件组群中的一致性规律,还包括:
遍历所述第一配置文件群组中的任一上级命令行,确定属于所述上级命令行的下级命令行组,下级命令行组包含:属于所述上级命令行的至少一个下级命令行,且所述至少一个下级命令行在所述第一配置文件组群中的支持度大于等于最小支持度,且所述至少一个下级命令行满足最小置信度;
所述根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的配置文件进行误配置检查,包括:
对所述待检测的配置文件进行归类处理;
若所述待检测的配置文件归为所述第一配置文件组群,则查看所述待检测的配置文件中的下级命令行;
若在所述待检测的配置文件中的下级命令行中,存在属于第一上级命令行的第一下级命令行包含在确定出的属于所述第一上级命令行的第一下级命令行组内,而第一下级命令行组内的其他下级命令行未包含在所述待检测的配置文件中,则确定所述待检测的配置文件中属于所述第一上级命令行的配置是错误的;
其中,所述下级命令行在所述第一配置文件群组中的支持度为:所述第一配置文件组群中出现所述下级命令行的次数与所述第一配置文件组群包含的总的配置文件个数的比值。
4.根据权利要求3所述的方法,其特征在于,对于所述第一配置文件群组中的第一上级命令行Pi,所述第一上级命令行为所述第一配置文件组群中的任一上级命令行,所述确定属于所述Pi的下级命令行组,包括:
以所述Pi为单位,统计属于所述Pi的每个下级命令行在第一配置文件群组中的支持度,将支持度大于等于最小支持度的下级命令行放入一阶频繁项集L1中;
若所述L1不为空,则根据所述L1生成二阶候选项集C2,所述C2包含至少一个候选项,所述候选项由所述L1中两个不同的下级命令行组成;
以所述Pi为单位,统计所述C2中每个候选项在第一配置文件群组中的支持度,将支持度大于等于最小支持度的候选项放入二阶频繁项集L2中;
若所述L2不为空,则重复上述过程,直到生成K阶频繁项集LK,LK包含至少一个频繁项,每个频繁项由K-1阶频繁项集LK-1中的K个不同的下级命令行组成;
若LK不为空,则根据LK中的频繁项生成规则集合,所述规则集合包含至少一个规则项,每个规则项包含:所述LK中的至少一个频繁项、以及所述至少一个频繁项之间的相互关系;
将所述规则集合中置信度大于等于最小置信度的规则项作为属于所述第一上级命令行的下级命令行组;
其中,若命令行或候选项的支持度大于等于最小支持度,则表示所述命令行或所述候选项在该配置文件群组中出现的频率较高,为频繁项。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述对所述M个配置文件进行聚类处理,形成N个配置文件组群,包括:
计算所述M个配置文件中任意两个配置文件间的相似距离,得到M*M的矩阵,所述M*M的矩阵中第i行第j列的元素表示:所述M个配置文件中配置文件i与配置文件j之间的相似距离,i、j均为小于等于M的整数;
对所述M*M的矩阵进行处理,得到归一化的拉普拉斯矩阵;
对所述归一化的拉普拉斯矩阵进行计算,得到M*S的特征向量矩阵,所述M*S的特征向量矩阵由S个M行向量组成,所述M*S的特征向量矩阵的M行向量与所述M个配置文件一一对应,所述S≤M,所述S为大于等于1的整数;
对所述M行向量进行聚类,形成N个向量组群,所述N个向量组群包含至少一行向量;
遍历所述N个向量组群中的每个向量组群,将与所述向量组群包含的向量相对应的配置文件组合成一个配置文件组群,得到N个配置文件组群;
其中,两个配置文件间的相似距离用于表示:这两个配置文件实现的功能和/或配置结构的相似程度。
6.根据权利要求5所述的方法,其特征在于,在所述计算所述M个配置文件中任意两个配置文件间的相似距离之前,所述方法还包括:
将所述M个配置文件中每个配置文件转化为一颗配置树,所述配置树包含:至少一个字符串,每个字符串包含:上级命令行、与所述上级命令行对应的一个下级参数命令、以及与所述下级参数命令相对应的参数值。
7.根据权利要求6所述的方法,其特征在于,对于所述M个配置文件中的任意两个配置文件:第一配置文件和第二配置文件,所述第一配置文件对应第一配置树,所述第二配置文件对应第二配置树,计算所述第一配置文件和所述第二配置文件间的相似距离包括:
遍历所述第一配置树中的每个字符串,分别计算所述字符串与所述第二配置树中每个字符串间的相似距离;
将计算出来的相似距离进行求和,得到与所述字符串对应的相似距离;
将所述第一配置树中每个字符串对应的相似距离进行求和,得到所述第一配置文件与所述第二配置文件间的相似距离。
8.一种检测设备,其特征在于,所述设备包括:
获取单元,用于获取M个配置文件,所述M为大于等于1的整数,所述配置文件包含上级命令行、以及属于所述上级命令行的至少一个下级命令行,每个所述下级命令行包含:下级参数命令、以及与所述下级参数命令相对应的参数值;
聚类单元,用于对所述获取单元获取到的M个配置文件进行聚类处理,形成N个配置文件组群,所述配置文件组群包含至少一个配置文件,所述N≤M,所述N为大于等于1的整数;
规律确定单元,用于确定所述聚类单元得到的每个配置文件组群中的一致性规律;
检测单元,用于根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的配置文件进行误配置检查;
对于所述N个配置文件组群中的第一配置文件组群,所述第一配置文件组群为所述N个配置文件中的任一配置文件组群,所述规律确定单元可以用于:
根据贝叶斯检测设备,确定所述第一配置文件组群中与属于第一上级命令行的第一下级参数命令相对应的训练参数;所述第一上级命令行为所述第一配置文件组群中的任一上级命令行,所述第一下级参数命令为属于所述第一上级命令行的任一下级参数命令;
所述检测单元用于:
对所述待检测的配置文件进行归类处理;
若所述待检测的配置文件归为所述第一配置文件组群,则计算所述待检测的配置文件中,属于所述第一上级命令行的第一下级参数命令所对应的参数值的概率,
若所述概率小于所述训练参数,则确定所述待检测的配置文件中属于所述第一上级命令行的第一下级参数命令的配置是错误的。
9.根据权利要求8所述的设备,其特征在于,所述规律确定单元,具体用于:
分别根据下述公式,计算属于第一上级命令行Pi的第一下级参数命令Cj的熵和逆文档频率:
熵:
逆文档频率:其中,所述Pi@Cj表示:属于第一上级命令行的第一下级参数命令,所述A为Pi@Cj对应的参数值的所有可能取值,Q为所述第一配置文件组群包含的配置文件的总个数,t为所述第一配置文件组群中出现Pi@Cj的配置文件的个数;
令Zi,j=Pi@Cj,则H(Zi,j)=I(Zi,j)*Idf(Zi,j)
根据下述公式得到与Pi@Cj相对应的训练参数alpha:
10.根据权利要求8所述的设备,其特征在于,对于所述N个配置文件组群中的第一配置文件组群,所述第一配置文件组群为所述N个配置文件中的任一配置文件组群,所述规律确定单元,还可以用于:
遍历所述第一配置文件群组中的任一上级命令行,确定属于所述上级命令行的下级命令行组,下级命令行组包含:属于所述上级命令行的至少一个下级命令行,且所述至少一个下级命令行在所述第一配置文件组群中的支持度大于等于最小支持度,且所述至少一个下级命令行满足最小置信度;
所述检测单元用于:
对所述待检测的配置文件进行归类处理;
若所述待检测的配置文件归为所述第一配置文件组群,则查看所述待检测的配置文件中的下级命令行;
若在所述待检测的配置文件中的下级命令行中,存在属于第一上级命令行的第一下级命令行包含在确定出的属于所述第一上级命令行的第一下级命令行组内,而第一下级命令行组内的其他下级命令行未包含在所述待检测的配置文件中,则确定所述待检测的配置文件中属于所述第一上级命令行的配置是错误的;
其中,所述下级命令行在所述第一配置文件群组中的支持度为:所述第一配置文件组群中出现所述下级命令行的次数与所述第一配置文件组群包含的总的配置文件个数的比值。
11.根据权利要求10所述的设备,其特征在于,对于所述第一配置文件群组中的第一上级命令行Pi,所述第一上级命令行为所述第一配置文件组群中的任一上级命令行,所述规律确定单元,具体用于:
以所述Pi为单位,统计属于所述Pi的每个下级命令行在第一配置文件群组中的支持度,将支持度大于等于最小支持度的下级命令行放入一阶频繁项集L1中;
若所述L1不为空,则根据所述L1生成二阶候选项集C2,所述C2包含至少一个候选项,所述候选项由所述L1中两个不同的下级命令行组成;
以所述Pi为单位,统计所述C2中每个候选项在第一配置文件群组中的支持度,将支持度大于等于最小支持度的候选项放入二阶频繁项集L2中;
若所述L2不为空,则重复上述过程,直到生成K阶频繁项集LK,LK包含至少一个频繁项,每个频繁项由K-1阶频繁项集LK-1中的K个不同的下级命令行组成;
若LK不为空,则根据LK中的频繁项生成规则集合,所述规则集合包含至少一个规则项,每个规则项包含:所述LK中的至少一个频繁项、以及所述至少一个频繁项之间的相互关系;
将所述规则集合中置信度大于等于最小置信度的规则项作为属于所述第一上级命令行的下级命令行组;
其中,若命令行或候选项的支持度大于等于最小支持度,则表示所述命令行或所述候选项在该配置文件群组中出现的频率较高,为频繁项。
12.根据权利要求8-11任一项所述的设备,其特征在于,所述聚类单元,用于:
计算所述M个配置文件中任意两个配置文件间的相似距离,得到M*M的矩阵,所述M*M的矩阵中第i行第j列的元素表示:所述M个配置文件中配置文件i与配置文件j之间的相似距离,i、j均为小于等于M的整数;
对所述M*M的矩阵进行处理,得到归一化的拉普拉斯矩阵;
对所述归一化的拉普拉斯矩阵进行计算,得到M*S的特征向量矩阵,所述M*S的特征向量矩阵由S个M行向量组成,所述M*S的特征向量矩阵的M行向量与所述M个配置文件一一对应,所述S≤M,所述S为大于等于1的整数;
对所述M行向量进行聚类,形成N个向量组群,所述N个向量组群包含至少一行向量;
遍历所述N个向量组群中的每个向量组群,将与所述向量组群包含的向量相对应的配置文件组合成一个配置文件组群,得到N个配置文件组群;
其中,两个配置文件间的相似距离用于表示:这两个配置文件实现的功能和/或配置结构的相似程度。
13.根据权利要求12所述的设备,其特征在于,所述聚类单元,还用于:
在计算所述M个配置文件中任意两个配置文件间的相似距离之前,将所述M个配置文件中每个配置文件转化为一颗配置树,所述配置树包含:至少一个字符串,每个字符串包含:上级命令行、与所述上级命令行对应的一个下级参数命令、以及与所述下级参数命令相对应的参数值。
14.根据权利要求13所述的设备,其特征在于,对于所述M个配置文件中的任意两个配置文件:第一配置文件和第二配置文件,所述第一配置文件对应第一配置树,所述第二配置文件对应第二配置树,所述聚类单元,具体用于:
遍历所述第一配置树中的每个字符串,分别计算所述字符串与所述第二配置树中每个字符串间的相似距离;
将计算出来的相似距离进行求和,得到与所述字符串对应的相似距离;
将所述第一配置树中每个字符串对应的相似距离进行求和,得到所述第一配置文件与所述第二配置文件间的相似距离。
CN201610349172.9A 2016-05-24 2016-05-24 一种网元设备误配置检测方法及检测设备 Active CN105847065B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610349172.9A CN105847065B (zh) 2016-05-24 2016-05-24 一种网元设备误配置检测方法及检测设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610349172.9A CN105847065B (zh) 2016-05-24 2016-05-24 一种网元设备误配置检测方法及检测设备

Publications (2)

Publication Number Publication Date
CN105847065A CN105847065A (zh) 2016-08-10
CN105847065B true CN105847065B (zh) 2019-05-10

Family

ID=56594231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610349172.9A Active CN105847065B (zh) 2016-05-24 2016-05-24 一种网元设备误配置检测方法及检测设备

Country Status (1)

Country Link
CN (1) CN105847065B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108933691B (zh) * 2017-05-26 2021-09-07 华为技术有限公司 一种获取网络设备标准配置模板的方法和计算设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473262A (zh) * 2013-07-17 2013-12-25 北京航空航天大学 一种基于关联规则的Web评论观点自动分类系统及分类方法
CN105471659A (zh) * 2015-12-25 2016-04-06 华为技术有限公司 一种故障根因分析方法和分析设备
CN105512267A (zh) * 2015-12-03 2016-04-20 北京锐安科技有限公司 一种配置文件的调整方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140108625A1 (en) * 2011-05-20 2014-04-17 Hewlett-Packard Development Company L.P. System and method for configuration policy extraction
IN2013MU03264A (zh) * 2013-10-17 2015-08-07 Tata Consultancy Services Ltd

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473262A (zh) * 2013-07-17 2013-12-25 北京航空航天大学 一种基于关联规则的Web评论观点自动分类系统及分类方法
CN105512267A (zh) * 2015-12-03 2016-04-20 北京锐安科技有限公司 一种配置文件的调整方法和装置
CN105471659A (zh) * 2015-12-25 2016-04-06 华为技术有限公司 一种故障根因分析方法和分析设备

Also Published As

Publication number Publication date
CN105847065A (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
US10649838B2 (en) Automatic correlation of dynamic system events within computing devices
CN110245078B (zh) 一种软件的压力测试方法、装置、存储介质和服务器
US10983856B2 (en) Identifying root causes of performance issues
Orman et al. A comparison of community detection algorithms on artificial networks
CN106326067B (zh) 一种在压力测试下对cpu性能进行监控的方法及装置
CN109034562B (zh) 一种社交网络节点重要性评估方法及系统
KR20110131094A (ko) 정보 네트워크 내의 커뮤니티를 식별하는 방법 및 시스템
US20130325817A1 (en) Linear sweep filesystem checking
RU2016105426A (ru) Постоянно читаемый компьютером носитель, система и способ для обнаружения сомнительного контента в социальной сети.
CN109522316A (zh) 日志处理方法、装置、设备和存储介质
Wang et al. DevNet: exploring developer collaboration in heterogeneous networks of bug repositories
CN105847065B (zh) 一种网元设备误配置检测方法及检测设备
Aggarwal et al. Gconnect: A connectivity index for massive disk-resident graphs
CN116228045B (zh) 基于性能退化的产品可靠性薄弱环节评估方法和装置
Kivimäki et al. Maximum likelihood estimation for randomized shortest paths with trajectory data
Islam et al. MOTCP: A tool for the prioritization of test cases based on a sorting genetic algorithm and Latent Semantic Indexing
CN108733707A (zh) 一种确定搜索功能稳定性及装置
May et al. BigBug: Practical concurrency analysis for SDN
CN107590160A (zh) 一种监控基数树内部结构的方法及装置
Jebabli et al. Overlapping community detection versus ground-truth in amazon co-purchasing network
Jin et al. A center-based community detection method in weighted networks
WO2016200413A1 (en) Application session analysis and recommendation system
US10229140B2 (en) Extensible indexing system evaluation and recommendation
CN104461848A (zh) 一种文件系统评估方法及系统
US10228825B1 (en) Display and analysis of information related to monitored elements of a computer system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant