CN104579717A - Dcn的故障定位方法及装置 - Google Patents

Dcn的故障定位方法及装置 Download PDF

Info

Publication number
CN104579717A
CN104579717A CN201310466941.XA CN201310466941A CN104579717A CN 104579717 A CN104579717 A CN 104579717A CN 201310466941 A CN201310466941 A CN 201310466941A CN 104579717 A CN104579717 A CN 104579717A
Authority
CN
China
Prior art keywords
node
node device
dcn
equipment
annexation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310466941.XA
Other languages
English (en)
Other versions
CN104579717B (zh
Inventor
陈若鹏
刘利明
江卫冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Jiangsu Co Ltd
Original Assignee
China Mobile Group Jiangsu Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Jiangsu Co Ltd filed Critical China Mobile Group Jiangsu Co Ltd
Priority to CN201310466941.XA priority Critical patent/CN104579717B/zh
Publication of CN104579717A publication Critical patent/CN104579717A/zh
Application granted granted Critical
Publication of CN104579717B publication Critical patent/CN104579717B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种数据通信网络DCN的故障定位方法,所述方法包括:依据DCN节点设备的连接关系,建立节点设备之间的关联关系;检测DCN中出现故障的节点设备,并标识出现故障的节点设备;依据所述关联关系,在所述故障节点设备中确定故障源;同时本发明还公开了一种DCN的故障定位装置。利用本发明的技术方案,提高了故障定位的有效性及效率、加快了故障定位时间。

Description

DCN的故障定位方法及装置
技术领域
本发明涉及网络故障检测技术,具体涉及一种数据通信网络(DCN,DataCommunication Network)的故障定位方法及装置。
背景技术
DCN因具有良好的灵活性、稳定性等优势,而受到企业、公司的欢迎。良好的DCN可保证企业内部日常工作的有序进行。一旦DCN出现故障,便给企业带来了很大的不便。目前,业内惯用的检测DCN故障的方法大致分为以下三种:
第一种,在DCN出现故障时,需要网络维护人员人工定位故障;此种方式依赖于维护人员的个人能力,如果维护人员的工作经验不足,容易导致DCN故障得不到及时解决;
第二种,采用基于案例推理(CBR,Case-Based Reasoning)的网络故障定位方法和基于规则推理的网络故障定位方法。这两种方法共有一个原则:将成功解决DCN故障的案例保存至案例库,当再次遇到故障时,将当前遇到的故障与案例库记载的案例进行匹配,匹配到相同或相似的案例时,依据查找到的相同或相似的案例所记载的解决方案来解决当前的网络故障。如果匹配不到相同或相似的案例,则在成功解决当前的网络故障之后,将当前的案例添加到案例库中。这种方法比较适用于公司、企业等拓扑结构比较单一的DCN,当在复杂的DCN网络环境下,案例库中记载的案例较多,处理器需要对案例库中的案例逐条匹配,加长了匹配时间、且加重了处理器的资源负担。况且对案例库的添加或更新无形当中也增加了工作量。
第三种,采用基于代码书技术的网络故障定位方法,这种方法是将由故障源引发的故障事件集合视作故障源的密码,定位故障源的就是对检测到的一系列故障事件进行解码,即判定哪个故障源能够最大限度地匹配故障事件集合。这种方法需要故障源及与故障源有关的节点产生关联矩阵,在复杂的DCN网络环境下,此关联矩阵的数据结构通常显得很复杂。
发明内容
有鉴于此,本发明实施例的主要目的在于提供一种DCN的故障定位方法及装置,无需案例匹配、过多的人工干预及复杂的关联矩阵,可提高故障定位的有效性、加快故障定位时间、提高故障定位效率。
为达到上述目的,本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种数据通信网络DCN的故障定位方法,依据DCN节点设备的连接关系,建立节点设备之间的关联关系;所述方法还包括:
检测DCN中出现故障的所有节点设备,并标识出现故障的节点设备;
依据所述关联关系,在所述故障节点设备中确定故障源。
上述方案中,所述依据DCN节点设备的连接关系,建立节点设备之间的关联关系,包括:
根据所述DCN中的节点设备的数量,建立每一个维度长度均等于所述数量值的二维数组;所述二维数组中的每一元素对应于所述DCN中节点设备之间的连接关系。
上述方案中,所述建立每一个维度长度等于所述数量值的二维数组,所述二维数组中的每一元素对应于所述DCN中节点设备之间的连接关系,包括:
初始化所述二维数组中的所有元素;
查找DCN的第一节点设备分别与第二节点设备至第N节点设备是否存在有连接关系;查找到第一节点设备与第M1节点设备存在连接关系时,更新所述二维数组中第1行第M1列的数组元素;同时,更新所述二维数组中第M1行第1列的数组元素;其中,2≤M1≤N;
再查找第二节点设备分别与第三节点设备至第N节点设备是否存在有连接关系;查找到第二节点设备与第M2节点设备存在有连接关系时,更新所述二维数组中第2行第M2列的数组元素;同时,更新所述二维数组中第M2行第2列的数组元素;其中,3≤M2≤N;
以此类推,直到查找完第N节点设备与其他节点设备是否存在有连接关系;
其中,N为正整数,代表DCN的节点设备的数量。
上述方案中,所述检测DCN中出现故障的节点设备,并标识出现故障的节点设备,包括:
建立用于表示DCN的每个节点设备是否出现故障的一维数组,所述一维数组长度等于所述数量值;初始化所述一维数组的所有元素;当检测到有节点设备出现故障时,更新所述出现故障的节点设备所对应的数组元素。
上述方案中,依据所述关联关系,在所述故障节点设备中确定故障源,包括:
确定当前故障节点设备为头节点设备时,在关联关系中,确定出与所述当前故障节点相关联的所有后向节点设备均是出现故障的节点设备时,确定所述当前故障节点设备为DCN的故障源;
确定当前故障节点设备为中间节点设备时,在关联关系中,确定出与所述当前节点设备相关联的所有前向节点设备均不是出现故障的节点设备,而确定出与所述当前节点设备相关联的所有后向节点设备均是出现故障的节点设备,确定所述当前节点设备为DCN的故障源;
确定当前故障节点设备为尾节点设备时,在关联关系中,当确定出与所述当前节点设备相关联的所有前向节点设备均不是出现故障的节点设备,确定出所述当前节点设备为DCN的故障源。
本发明实施例提供了一种数据通信网络DCN的故障定位装置,所述装置包括:建立单元、检测与标识单元以及确定单元;其中,
所述建立单元,用于依据DCN节点设备的连接关系,建立节点设备之间的关联关系;
所述检测与标识单元,用于检测到DCN中出现故障节点设备时,标识出现故障的节点设备;
所述确定单元,用于依据所述关联关系,在所述故障节点设备中确定故障源。
上述方案中,所述建立单元,用于根据所述DCN中的节点设备的数量,建立每一个维度长度均等于所述数量值的二维数组;所述二维数组中的每一元素对应于所述DCN中节点设备之间的连接关系。
上述方案中,所述建立单元,还用于:
初始化所述二维数组中的所有元素;
并查找DCN的第一节点设备分别与第二节点设备至第N节点设备是否存在有连接关系;查找到第一节点设备与第M1节点设备存在连接关系时,更新所述二维数组中第1行第M1列的数组元素,并更新所述二维数组中第M1行第1列的数组元素;其中,2≤M1≤N;
再查找第二节点设备分别与第三节点设备至第N节点设备是否存在有连接关系;查找到第二节点设备与第M2节点设备存在有连接关系时,更新所述二维数组的第2行第M2列的元素,并更新第M2行第2列的元素;其中,3≤M2≤N;
以此类推,直到查找完第N节点设备与其他节点设备是否存在有连接关系;
其中,N为正整数,代表DCN的节点设备的数量。
上述方案中,所述检测与标识单元,还用于:
建立用于表示DCN的每个节点设备是否出现故障的一维数组,所述一维数组长度等于所述数量值;初始化所述一维数组的所有元素;
当检测到有节点设备出现故障时,更新所述出现故障的节点设备所对应的数组元素。
上述方案中,所述确定单元,还用于:
确定当前故障节点设备为头节点设备时,在关联关系中,确定出与所述当前故障节点相关联的所有后向节点设备均是出现故障的节点设备时,确定所述当前故障节点设备为DCN的故障源;
确定当前故障节点设备为中间节点设备时,在关联关系中,确定出与所述当前节点设备相关联的所有前向节点设备均不是出现故障的节点设备,而确定出与所述当前节点设备相关联的所有后向节点设备均是出现故障的节点设备,确定所述当前节点设备为DCN的故障源;
确定当前故障节点设备为尾节点设备时,在关联关系中,当确定出与所述当前节点设备相关联的所有前向节点设备均不是出现故障的节点设备,确定出所述当前节点设备为DCN的故障源。
本发明实施例提供的DCN的故障定位方法及装置,依据DCN网络节点设备的连接关系,建立节点设备之间的关联关系,检测DCN网络中出现故障的节点设备,并标识出现故障的节点设备,依据所述关联关系,在所述故障节点设备中确定故障源。与现有技术的需要案例匹配、过多的人工干预及复杂的关联矩阵不同,利用本发明的技术方案,无需案例匹配及复杂的关联矩阵,提高了故障定位的有效性及效率、加快了故障定位时间。
附图说明
图1为本发明实施例的DCN的故障定位方法的流程示意图;
图2为本发明实施例的DCN的节点设备的连接示意图;
图3为本发明实施例的DCN的故障定位装置的流程示意图。
具体实施方式
本发明实施例提供了一种DCN的故障定位方法,如图1所示,所述方法包括:
步骤11:依据DCN网络节点设备的连接关系,建立节点设备之间的关联关系。
这里,在应用于DCN的公司、企业将网络铺设完成之后,节点设备之间的连接关系就已经确定。
本发明实施例中,建立一个二维数组Link[N][N],用于保存节点设备之间的关联关系;其中,N为正整数,代表DCN的节点设备的数量。初始化阶段,将二维数组Link[N][N]的每一元素取值均置为0,随着对DCN中节点设备之间的连接关系的查找将二维数组Link[N][N]的元素取值进行更新,即所述二维数组Link[N][N]中的每一元素对应于所述DCN中节点设备之间的连接关系。
较佳地,从DCN的节点设备1开始,查找DCN的节点设备1分别与其他节点设备(节点设备2~节点设备N)是否存在有连接关系;查找到节点设备1与节点设备M1存在连接关系时,更新数组元素Link[1][M1]=1;同时,由于节点设备之间的连接关系是相互的即数组取值有对称性,更新数组元素Link[M1][1]=1;其中,2≤M1≤N;
再查找节点设备2分别与节点设备3~节点设备N是否存在有连接关系;查找到节点设备2与节点设备M2存在有连接关系时,更新数组元素Link[2][M2]=1;同时,更新数组元素Link[M2][2]=1;其中,3≤M2≤N;
以此类推,直到查找完节点设备N与其他节点设备是否存在有连接关系。
上述方案中,为完善节点设备连接关系查找的完整性,直到查找完节点设备N与其他节点设备是否存在有连接关系;此外,由于数组取值的对称性,在查找节点1~N-1的连接关系时,已经确定了数组元素Link[N][1]~Link[N][N]的取值,所以节点设备N与其他节点设备之间的连接关系也可无需再查找。
其中,当查找到节点设备M3与节点设备M4无连接关系时,数组元素Link[M3][M4]取值不变,仍为0。其中,M3、M4均为正整数,且M1≤N、M2≤N。如此,在查找完所有节点设备的连接关系后,二维数组Link[N][N]的每一项取值或为0或为1。
这里,所述节点设备1、节点设备2...节点设备N也可称之为第一节点设备、第二节点设备以及第N节点设备。
由上述对技术方案的描述可知,本发明实施例考虑到了数组取值的对称性,更新Link[2][M2]=时也更新数组元素Link[M2][2]=1;且在查找节点设备2的连接关系的时候,从节点设备3开始进行查找,不再对节点设备2与节点设备1的连接关系进行查找,如此,便可减少查找时间,加快故障定位的时间。
图2为本发明实施例的DCN的节点设备的连接示意图,如图2所示:取N=12即共有12个节点设备;二维数组Link[12][12]为12行12列的数组,且在初始化阶段更新该数组的每一元素为0。
在DCN中,先查找节点设备1与其他节点设备(节点设备2~节点设备12)之间是否存在有连接关系,查找到节点设备1仅与节点设备2存在连接关系,更新数组元素Link[1][2]=1;查找到节点设备1与除节点设备2之外的其他节点设备(节点设备3~节点设备12)没有存在连接关系,数组元素Link[1][3]至Link[1][12]取值不变,仍然均为0;
这里,因为节点设备之间的连接关系是相互的,之前在查找节点设备1与其他节点设备之间关系时,已经查找到节点设备1与节点设备2存在连接关系即Link[1][2]=1了,所以节点设备2与节点设备1也存在连接关系,Link[2][1]=Link[1][2]=1。
在查找节点设备2与其他节点设备是否存在连接关系时,需从节点设备3开始,查找节点设备2与除节点设备1、2之外的其他节点设备(节点设备3至节点设备12)是否存在连接关系,查找到节点设备2与节点设备3存在连接关系时更新数组元素Link[2][3]=1;查找到节点设备2与节点设备6存在连接关系时更新数组元素Link[2][6]=1;查找到节点设备2与节点设备4、5、7~12均不存在连接关系,数组元素Link[2][4]、Link[2][5]、Link[2][7]~Link[2][12]的取值仍然为0;
这里,考虑到数组取值的对称性,更新数组元素Link[3][2]=1、Link[6][2]=1。
以此类推,直到完查找节点设备11与节点设备12是否存在有连接关系,这里,由于节点设备11与节点设备12没有连接关系,数组元素Link[11][12]取值不变仍然为0。
在图2所示的本发明实施例中,没有对节点设备12与其他节点设备之间的连接关系进行查找,因为在查找节点设备1~11与除自身之外的其他节点设备之间的连接关系时,对于查找到的有连接关系的两个节点设备如Y1、Y2而言,在更新数组元素Link[Y1][Y2]=1的同时也更新了数组元素Link[Y2][Y1]=1;也就是说,随着节点设备1~11与除了自身之外的其他节点设备之间是否存在有连接关系的确定,节点设备12与其他节点设备之间的连接关系也随之确定。其中,Y1、Y2均为正整数,1≤Y1≤11,1≤Y2≤11。
步骤12:检测DCN中出现故障的所有节点设备,并标识出现故障的节点设备。
本发明实施例中,检测节点设备是否出现故障为现有技术如每隔一段时间,对DCN的节点设备的流量进行检测,当检测到有节点设备在所述时间段内的流量低于预设的流量值,确定所述节点设备存在有故障;此外,还有其他对节点设备的故障检测方法,本发明实施例中对所述其它检测方法不再赘述。
这里,建立一维数组DATA[N]用来表示DCN的N个节点设备是否出现了故障;初始化阶段将数组元素DATA[1]~DATA[N]均置为0,表示初始化阶段所有节点设备均无故障出现;当检测到节点设备N1出现故障时,置数组元素DATA[N1]=1;其中,N1为正整数且N1≤N。
以图2为例,本步骤中,N=12,初始化阶段,置数组元素DATA[1]~DATA[12]均为0;检测到节点设备5、节点设备10~12以及节点设备9出现故障,则更新数组元素DATA[5]、DATA[10]~DATA[12]以及DATA[9]均为1。
步骤13:依据所述关联关系,在所述故障节点设备中确定故障源。
在DCN中,从放置的位置来分,节点设备的类型可包括:头节点设备,尾节点设备以及中间节点设备;本发明实施例中,将从不同节点设备的类型出发来说明确定DCN的故障源。
1、当前故障节点设备为头节点设备时,在关联关系中,确定出与所述当前故障节点相关联的所有后向节点设备均是出现故障的节点设备时,确定所述当前故障节点设备为DCN的一个故障源;
2、当前故障节点设备为中间节点设备时,在关联关系中,当确定出与所述当前节点设备相关联的所有前向节点设备均不是出现故障的节点设备,而确定出与所述当前节点设备相关联的所有后向节点设备均是出现故障的节点设备,确定所述当前节点设备为DCN的一个故障源;
3、当前故障节点设备为尾节点设备时,在关联关系中,当确定出与所述当前节点设备相关联的所有前向节点设备均不是出现故障的节点设备,确定出所述当前节点设备为DCN的一个故障源。
这里,在图2所示的示意图中,出现故障的节点设备为节点设备5、节点设备10~12以及节点设备9;
其中,故障节点设备5为中间节点设备,且在所建立的关联关系二维数组Link[12][12]中,节点设备10、节点设备11、节点设备12均与节点设备5相关联,且节点设备10~12均是节点设备5的后向节点设备,同时,节点设备10~12也是出现故障的节点设备,由此可确定节点设备5为DCN的一个故障源;但是对于故障节点设备10~12出现是故障是由于节点设备5出现的故障而导致的还是由于自身出现的问题而导致的,通过下面方法来确定。
节点设备5的故障被修复好即节点设备5不再是出现故障的节点设备后,如果故障节点设备10~12均可正常工作,那么可确定故障节点设备10~12之前出现是故障是由于节点设备5出现的故障而导致;如果故障节点设备10~12中有无法正常工作的节点设备时,那么可确定此时该无法正常工作的故障节点设备是由自身出现的问题而引起的。
故障节点设备9为尾节点设备,在且在所建立的关联关系二维数组Link[12][12]中,节点设备4是与故障节点设备9相关联的前向节点设备且节点设备4不是出现故障的节点设备,则确定节点设备9为DCN的一个故障源。
所述方法还包括:
修复所述故障源,使DCN恢复正常。
这里,在定位出DCN的故障源时,可通过人工排查或软、硬件设置的方式对故障进行恢复,使得DCN恢复正常。
此外,本发明实施例还可以在修复完故障源之后,将此次故障产生的原因、修复方法的对应关系填写到案例库中,以方便维护人员日后对网络的维护。
在上述方案中,以初始化数组元素为0、并更新数组元素为1为例,此外,还可以以初始化数组元素为1、并更新数组元素为0为例进行说明,只要初始化数组元素的取值与更新后的数组元素取值不同即可。
基于上述DCN的故障定位方法,本发明实施例还提供了一种DCN的故障定位装置,如图3所示,所述装置包括:建立单元31、检测与标识单元32以及确定单元33;其中,
所述建立单元31,用于依据DCN节点设备的连接关系,建立节点设备之间的关联关系;
所述检测与标识单元32,用于检测到DCN中出现故障的节点设备时,标识出现故障的节点设备;
所述确定单元33,用于依据所述关联关系,在所述故障节点设备中确定故障源。
所述装置还包括:修复单元(图3中未示出),用于对所述故障源进行修改,使得DCN恢复正常。
较佳地,如图3所示,所述建立单元31,用于建立一个二维数组Link[N][N],并初始化所述二维数组的元素均为0;
其中,N为正整数,代表DCN的节点设备的数量,二维数组Link[N][N]用于保存节点设备之间的关联关系;初始化阶段,所述建立单元31将二维数组Link[N][N]的每一元素均置为0;并查找节点设备之间的连接关系,当查找到有节点设备M3、节点设备M4之间存在有连接关系时,更新所述二维数组的数组元素Link[M3][M4]=1;其中,M3、M4均为正整数,且M1≤N、M2≤N。
具体的,所述建立单元31从DCN的节点设备1开始,查找DCN的节点设备1分别与其他节点设备(节点设备2~节点设备N)是否存在有连接关系;查找到节点设备1与节点设备M1存在连接关系时,将数组元素Link[1][M1]更新为1;由于节点设备之间的连接关系是相互的即数组取值有对称性,所述建立单元31同时更新数组元素Link[M1][1]=1;其中,2≤M1≤N;
再查找节点设备2分别与节点设备3~节点设备N是否存在有连接关系;查找到节点设备2与节点设备M2存在有连接关系时,更新数组元素Link[2][M2]=1;并更新数组元素Link[M2][2]=1;其中,3≤M2≤N;
以此类推,直到所述建立单元31查找完节点设备N与其他节点设备是否存在有连接关系。
所述检测与标识单元32,还用于建立一个用于表示网络中的每一个节点设备是否出现故障的一维数组DATA[N],并初始化所述一维数组的每一个元素均为0;在检测到有节点设备出现故障时,更新所述故障节点设备对应的数组元素为1。
其中,所述检测与标识单元32使用到的对节点设备的故障进行检测方法请参见现有技术,这里不再赘述。
所述确定单元33,还用于确定当前故障节点设备为头节点设备时,在关联关系中,确定出与所述当前故障节点相关联的所有后向节点设备均是出现故障的节点设备时,确定所述当前故障节点设备为DCN的一个故障源;
确定当前故障节点设备为中间节点设备时,在关联关系中,当确定出与所述当前节点设备相关联的所有前向节点设备均不是出现故障的节点设备,而确定出与所述当前节点设备相关联的所有后向节点设备均是出现故障的节点设备,确定所述当前节点设备为DCN的一个故障源;
确定当前故障节点设备为尾节点设备时,在关联关系中,当确定出与所述当前节点设备相关联的所有前向节点设备均不是出现故障的节点设备,确定出所述当前节点设备为DCN的一个故障源。
本领域技术人员应当理解,图3中所示的DCN的故障定位装置中的各处理模块的实现功能可参照前述DCN的故障定位方法的相关描述而理解。本领域技术人员应当理解,图3所示的DCN的故障定位装置中各处理单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
在实际应用中,所述建立单元31、检测与标识单元32、确定单元33均可由中央处理单元(CPU,Central Processing Unit)、或数字信号处理(DSP,DigitalSignal Processor)、或现场可编程门阵列(FPGA,Field Programmable Gate Array)等来实现;所述CPU、DSP、FPGA均可内置于故障定位服务器中,所述定位服务器可位于网络侧。
本发明实施例提供的DCN的故障定位方法,依据DCN节点设备的连接关系,建立节点设备之间的关联关系,检测DCN中出现故障的节点设备,并标识出现故障的节点设备,依据所述关联关系,在所述故障节点设备中确定故障源。与现有技术的需要案例匹配、过多的人工干预及复杂的关联矩阵不同,利用本发明的技术方案,无需案例匹配及复杂的关联矩阵,提高了故障定位的有效性及效率、加快了故障定位时间。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种数据通信网络DCN的故障定位方法,依据DCN节点设备的连接关系,建立节点设备之间的关联关系;其特征在于,所述方法还包括:
检测DCN中出现故障的所有节点设备,并标识出现故障的节点设备;
依据所述关联关系,在所述故障节点设备中确定故障源。
2.根据权利要求1所述的DCN的故障定位方法,其特征在于,所述依据DCN节点设备的连接关系,建立节点设备之间的关联关系,包括:
根据所述DCN中的节点设备的数量,建立每一个维度长度均等于所述数量值的二维数组;所述二维数组中的每一元素对应于所述DCN中节点设备之间的连接关系。
3.根据权利要求2所述的DCN的故障定位方法,其特征在于,所述建立每一个维度长度等于所述数量值的二维数组,所述二维数组中的每一元素对应于所述DCN中节点设备之间的连接关系,包括:
初始化所述二维数组中的所有元素;
查找DCN的第一节点设备分别与第二节点设备至第N节点设备是否存在有连接关系;查找到第一节点设备与第M1节点设备存在连接关系时,更新所述二维数组中第1行第M1列的数组元素;同时,更新所述二维数组中第M1行第1列的数组元素;其中,2≤M1≤N;
再查找第二节点设备分别与第三节点设备至第N节点设备是否存在有连接关系;查找到第二节点设备与第M2节点设备存在有连接关系时,更新所述二维数组中第2行第M2列的数组元素;同时,更新所述二维数组中第M2行第2列的数组元素;其中,3≤M2≤N;
以此类推,直到查找完第N节点设备与其他节点设备是否存在有连接关系;
其中,N为正整数,代表DCN的节点设备的数量。
4.根据权利要求2所述的DCN的故障定位方法,其特征在于,所述检测DCN中出现故障的节点设备,并标识出现故障的节点设备,包括:
建立用于表示DCN的每个节点设备是否出现故障的一维数组,所述一维数组长度等于所述数量值;初始化所述一维数组的所有元素;当检测到有节点设备出现故障时,更新所述出现故障的节点设备所对应的数组元素。
5.根据权利要求1至4任一项所述的DCN的故障定位方法,其特征在于,依据所述关联关系,在所述故障节点设备中确定故障源,包括:
确定当前故障节点设备为头节点设备时,在关联关系中,确定出与所述当前故障节点相关联的所有后向节点设备均是出现故障的节点设备时,确定所述当前故障节点设备为DCN的故障源;
确定当前故障节点设备为中间节点设备时,在关联关系中,确定出与所述当前节点设备相关联的所有前向节点设备均不是出现故障的节点设备,而确定出与所述当前节点设备相关联的所有后向节点设备均是出现故障的节点设备,确定所述当前节点设备为DCN的故障源;
确定当前故障节点设备为尾节点设备时,在关联关系中,当确定出与所述当前节点设备相关联的所有前向节点设备均不是出现故障的节点设备,确定出所述当前节点设备为DCN的故障源。
6.一种数据通信网络DCN的故障定位装置,其特征在于,所述装置包括:建立单元、检测与标识单元以及确定单元;其中,
所述建立单元,用于依据DCN节点设备的连接关系,建立节点设备之间的关联关系;
所述检测与标识单元,用于检测到DCN中出现故障节点设备时,标识出现故障的节点设备;
所述确定单元,用于依据所述关联关系,在所述故障节点设备中确定故障源。
7.根据权利要求6所述的DCN的故障定位装置,其特征在于,所述建立单元,用于根据所述DCN中的节点设备的数量,建立每一个维度长度均等于所述数量值的二维数组;所述二维数组中的每一元素对应于所述DCN中节点设备之间的连接关系。
8.根据权利要求7所述的DCN的故障定位方法,其特征在于,所述建立单元,还用于:
初始化所述二维数组中的所有元素;
并查找DCN的第一节点设备分别与第二节点设备至第N节点设备是否存在有连接关系;查找到第一节点设备与第M1节点设备存在连接关系时,更新所述二维数组中第1行第M1列的数组元素,并更新所述二维数组中第M1行第1列的数组元素;其中,2≤M1≤N;
再查找第二节点设备分别与第三节点设备至第N节点设备是否存在有连接关系;查找到第二节点设备与第M2节点设备存在有连接关系时,更新所述二维数组的第2行第M2列的元素,并更新第M2行第2列的元素;其中,3≤M2≤N;
以此类推,直到查找完第N节点设备与其他节点设备是否存在有连接关系;
其中,N为正整数,代表DCN的节点设备的数量。
9.根据权利要求7所述的DCN的故障定位装置,其特征在于,所述检测与标识单元,还用于:
建立用于表示DCN的每个节点设备是否出现故障的一维数组,所述一维数组长度等于所述数量值;初始化所述一维数组的所有元素;
当检测到有节点设备出现故障时,更新所述出现故障的节点设备所对应的数组元素。
10.根据权利要求6至9任一项所述的DCN的故障定位装置,其特征在于,所述确定单元,还用于:
确定当前故障节点设备为头节点设备时,在关联关系中,确定出与所述当前故障节点相关联的所有后向节点设备均是出现故障的节点设备时,确定所述当前故障节点设备为DCN的故障源;
确定当前故障节点设备为中间节点设备时,在关联关系中,确定出与所述当前节点设备相关联的所有前向节点设备均不是出现故障的节点设备,而确定出与所述当前节点设备相关联的所有后向节点设备均是出现故障的节点设备,确定所述当前节点设备为DCN的故障源;
确定当前故障节点设备为尾节点设备时,在关联关系中,当确定出与所述当前节点设备相关联的所有前向节点设备均不是出现故障的节点设备,确定出所述当前节点设备为DCN的故障源。
CN201310466941.XA 2013-10-09 2013-10-09 Dcn的故障定位方法及装置 Active CN104579717B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310466941.XA CN104579717B (zh) 2013-10-09 2013-10-09 Dcn的故障定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310466941.XA CN104579717B (zh) 2013-10-09 2013-10-09 Dcn的故障定位方法及装置

Publications (2)

Publication Number Publication Date
CN104579717A true CN104579717A (zh) 2015-04-29
CN104579717B CN104579717B (zh) 2018-02-23

Family

ID=53094995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310466941.XA Active CN104579717B (zh) 2013-10-09 2013-10-09 Dcn的故障定位方法及装置

Country Status (1)

Country Link
CN (1) CN104579717B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107707408A (zh) * 2017-10-20 2018-02-16 杭州杭淳广播电视设备有限公司 一种数字广播发射机远程监控方法及系统
CN107769963A (zh) * 2017-09-29 2018-03-06 贵州白山云科技有限公司 一种内容分发网络故障定位方法和装置
CN108646140A (zh) * 2018-05-25 2018-10-12 广东电网有限责任公司 一种确定故障设备的方法和装置
CN110620698A (zh) * 2018-06-19 2019-12-27 杭州海康威视数字技术股份有限公司 一种软件异常诊断方法、装置、设备及系统
CN111679953A (zh) * 2020-06-09 2020-09-18 平安科技(深圳)有限公司 基于人工智能的故障节点识别方法、装置、设备和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0841774A2 (en) * 1996-09-13 1998-05-13 Digital Vision Laboratories Corporation Communication system and communication path control method
CN101520662A (zh) * 2009-02-18 2009-09-02 嘉兴学院 流程工业分布式设备故障诊断系统
CN102035715A (zh) * 2010-12-17 2011-04-27 南京中兴力维软件有限公司 一种2m环网络故障诊断方法及系统
CN102404141A (zh) * 2011-11-04 2012-04-04 华为技术有限公司 一种告警抑制的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0841774A2 (en) * 1996-09-13 1998-05-13 Digital Vision Laboratories Corporation Communication system and communication path control method
CN101520662A (zh) * 2009-02-18 2009-09-02 嘉兴学院 流程工业分布式设备故障诊断系统
CN102035715A (zh) * 2010-12-17 2011-04-27 南京中兴力维软件有限公司 一种2m环网络故障诊断方法及系统
CN102404141A (zh) * 2011-11-04 2012-04-04 华为技术有限公司 一种告警抑制的方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107769963A (zh) * 2017-09-29 2018-03-06 贵州白山云科技有限公司 一种内容分发网络故障定位方法和装置
CN107707408A (zh) * 2017-10-20 2018-02-16 杭州杭淳广播电视设备有限公司 一种数字广播发射机远程监控方法及系统
CN108646140A (zh) * 2018-05-25 2018-10-12 广东电网有限责任公司 一种确定故障设备的方法和装置
CN110620698A (zh) * 2018-06-19 2019-12-27 杭州海康威视数字技术股份有限公司 一种软件异常诊断方法、装置、设备及系统
CN111679953A (zh) * 2020-06-09 2020-09-18 平安科技(深圳)有限公司 基于人工智能的故障节点识别方法、装置、设备和介质
CN111679953B (zh) * 2020-06-09 2022-04-12 平安科技(深圳)有限公司 基于人工智能的故障节点识别方法、装置、设备和介质

Also Published As

Publication number Publication date
CN104579717B (zh) 2018-02-23

Similar Documents

Publication Publication Date Title
KR101888029B1 (ko) 가상 머신 클러스터 모니터링 방법 및 모니터링 시스템
CN103812699A (zh) 基于云计算的监控管理系统
US9983941B2 (en) Method and apparatus for recovering data
CN104579717A (zh) Dcn的故障定位方法及装置
CN104598341B (zh) 用于确定在互连/控制器之间的故障的位置的方法和系统
CN109508295B (zh) 区块链共识算法测试方法、装置、计算装置和存储介质
CN105243004A (zh) 一种故障资源检测方法及装置
CN103595572B (zh) 一种云计算集群中节点自修复的方法
CN104461765A (zh) 基于版本校验的联锁系统数据准确性检测方法
CN111106944B (zh) 一种故障告警信息处理方法及设备
CN111913824B (zh) 确定数据链路故障原因的方法及相关设备
CN114063582B (zh) 用于监控产品测试过程的方法和装置
CN107356284A (zh) 一种检测方法、装置及系统
CN102541722B (zh) 一种监控服务器内存的方法以及服务器内存监控系统
CN105849699B (zh) 控制数据中心架构设备的方法
US20140289398A1 (en) Information processing system, information processing apparatus, and failure processing method
CN116506340A (zh) 流量链路的测试方法、装置、电子设备及存储介质
CN112905410B (zh) 设备状态监控系统及方法
CN109117317A (zh) 一种集群故障恢复方法和相关装置
US20180336084A1 (en) Managing component errors with a common software sensor based diagnostic method
CN113987065A (zh) 数据库漂移方法、系统、电子设备和存储介质
Wu et al. A study on the dependability of software defined networks
CN109302322B (zh) 一种提高核安全级网络测试准确性的测试系统及方法
CN113221096A (zh) 一种在混沌工程中随机事件相关性分析方法及系统
CN105446857A (zh) 一种故障诊断方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant