CN112968804B - 一种基于容错哈密顿圈的数据中心网络故障诊断方法 - Google Patents

一种基于容错哈密顿圈的数据中心网络故障诊断方法 Download PDF

Info

Publication number
CN112968804B
CN112968804B CN202110291165.9A CN202110291165A CN112968804B CN 112968804 B CN112968804 B CN 112968804B CN 202110291165 A CN202110291165 A CN 202110291165A CN 112968804 B CN112968804 B CN 112968804B
Authority
CN
China
Prior art keywords
fault
node
hamiltonian
nodes
tolerant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110291165.9A
Other languages
English (en)
Other versions
CN112968804A (zh
Inventor
杜晓玉
赵志宇
李辉
韩志杰
丁帅
孟盼盼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University
Original Assignee
Henan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University filed Critical Henan University
Priority to CN202110291165.9A priority Critical patent/CN112968804B/zh
Publication of CN112968804A publication Critical patent/CN112968804A/zh
Application granted granted Critical
Publication of CN112968804B publication Critical patent/CN112968804B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Environmental & Geological Engineering (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明的目的是提供一种基于容错哈密顿圈的数据中心网络故障诊断方法,无需诊断度限制就可以实现数据中心网络中故障检测和快速定位,包括将网络中设备看作节点、链路看作边,构建一个网络拓扑,生成哈密顿圈;使用PMC模型按照哈密顿圈上节点的顺序进行检测,若检测到故障节点,在拓扑中删除此节点构成新的哈密顿圈继续进行检测;当故障节点数超过可删除节点上限时,使用概率诊断方法去确定故障节点;结合数据中心网络结构递归构造的特点,对若干个低一层结构进行并行的诊断从而提高诊断效率。

Description

一种基于容错哈密顿圈的数据中心网络故障诊断方法
技术领域
本发明属于数据中心网络的故障诊断领域,具体涉及一种基于容错哈密顿圈的数据中心网络故障诊断方法。
背景技术
随着云计算和大数据技术的快速发展,作为这些技术基石的数据中心网络很大程度决定了它们的性能,随着数据中心的规模越来越庞大,数据中心网络中服务器的数量大规模增加,服务器发生故障的情形是不可避免的。特别是以服务器为中心的数据中心网络中服务器需进行大量的数据处理,若出现系统级故障,即服务器处理数据出错,会极大的影响数据中心的服务质量。所以能否及时准确的检测到系统的故障进行准确的定位并采取相应的处理措施,是影响系统可用性的关键。
近年来,在数据中心网络故障诊断的研究上人们主要还是使用传统诊断方式,即精确诊断和悲观诊断。精确诊断的意思是系统中每一个节点的状态都可被正确的识别出来。悲观诊断的意思是最多有一个节点是无法被识别的(即保持未知状态)。在精确诊断策略(悲观诊断策略)下允许系统中存在的最大错误节点个数称之为精确诊断度(悲观诊断度),目前虽已经存在很多精确诊断算法和悲观诊断算法,但数据中心网络中故障检测和快速定位的方法仍受诊断度的限制。
发明内容
本发明的目的是提供一种基于容错哈密顿圈的数据中心网络故障诊断方法,无需诊断度限制就可以实现数据中心网络中故障检测和快速定位。
本发明解决其技术问题的技术方案为:一种基于容错哈密顿圈的数据中心网络故障诊断方法,包括以下步骤:
S1:设X(V,E)为一个存在容错哈密顿圈的数据中心网络,其中V代表点集,E代表边集;X(V,E)生成的哈密顿圈用H(Vh,Eh)表示,其中Vh=V,Eh∈E;
Figure BDA0002981994840000011
使用PMC测试模型结合概率测试的方法对vi,vj进行诊断若vi,vj都无故障则以vi为哈密顿圈的起始节点,将节点vj用a来表示;
S2:以a为起点按照哈密顿圈的顺序依次进行测试,设a的下一个节点为b即(a,b)∈Eh,当a为正确节点时可准确测得b节点状态,若b正常,则重复此过程,直到测试完所有节点或测出故障节点时进入步骤S3;
S3:使用结构的容错哈密顿性质,删除不超过限制个数的节点,剩下的节点仍能构成哈密顿圈,使用步骤S2中的方法继续测试;直到故障节点数超过限制的节点个数后执行步骤S4;
S4:通过PMC测试模型结合概率测试的方法去测试接下来两个节点的状态,直至对所有节点完成测试。
所述步骤S1中的PMC测试模型结合概率测试的方法具体为:
利用在PMC模型中正常节点能够准确的得出被测节点的状态,而故障节点无法准确得出被测节点状态的原理,(vi,vj)表示vi对vj进行测试若vi是正常节点,(vi,vj)=0表示vj是正常节点,(vi,vj)=1表示vj是故障节点;若vi是故障节点无论vj是否正常其测试结果可能为(vi,vj)=0或(vi,vj)=1;假设(vi,vj)=1的概率为p;vi对vj进行n次测试结果都为0,那么vi和vj故障的概率为pn;若pn足够小,则认为vi和vj都正常。对于两个相邻节点vi,vj可以得到以下四种情况(n为测试的次数且n足够大):
若满足
Figure BDA0002981994840000021
则vi,vj为正常节点;
若满足
Figure BDA0002981994840000022
则vi正常vj故障;
若满足,
Figure BDA0002981994840000023
则vi故障vj正常;
若满足
Figure BDA0002981994840000024
则vi,vj都故障。
所述步骤S2具体为:
Figure BDA0002981994840000025
即b为a的下一个节点,让a对b进行检测;
若(a,b)=0,则令a=b,重复步骤S2,直到检测完所有节点;
若(a,b)=1,则记录故障节点,进入步骤S3。
所述步骤S3具体为:
所选取的网络具有容错哈密顿性,即删除k个节点之后仍可构成哈密顿圈;用i记录删除的节点个数;
若i≤k,将故障节点b从整个拓扑删除,构建新的哈密顿圈并执行步骤S2;
若i>k,记录故障节点b,进入步骤S4。
所述步骤S4具体为:
按照哈密顿圈的顺序让故障节点后边的两个节点相互测试,即将b的下个节点设为a’,a’的下个节点设为b’;让a’和b’执行步骤S1中的n次互相测试;存在4种情况
若a’和b’都故障,记录故障节点a’,b’重复步骤S4,直到检测完所有节点;
若a’和b’都正常,令a’=b’,跳转到步骤S2;
若a’正常b’故障,记录故障节点b’,重复步骤S4,直到检测完所有节点;
若a’故障b’正常,记录故障节点a’,令a’=b’,跳转到步骤S2。
在整个测试过程中利用数据中心网络结构递归性的特点,高层结构往往由若干个低一层结构构成,采用并行诊断的方式同时对若干个低一层结构并行的进行测试,从而增加测试效率。
所述并行诊断的方法具体为:
用X(n,k)表示具有容错哈密顿性质的结构,通常X(n,k)构造规则满足递归性:即X(n,k)由m个X(n,k-1)组成(m>2),由于结构不同m值也不同;对m个X(n,k-1)同时进行测试测试,并将测试结果汇总到一起,等同于对X(n,k)进行测试,从而提高测试效率。
本发明的有益效果为:
(1)传统的故障诊断方法规定了故障节点个数的上限所以不能检测出所有故障节点,本方法对故障节点的个数几乎没有限制;
(2)传统基于PMC模型测试方法是让两个未知节点进行测试,结果是不确定的,本发明提出的方法确保了测试节点为正常,从而可以准确得知被测节点的状态,使得测试更准确减少测试次数;
(3)利用数据中心网络结构递归构造的特点,将一个高层结构划分为若干个低一层结构,并行的对每个低一层的结构进行测试,极大的提升测试效率。
附图说明
图1是本发明的流程图。
图2是本发明的H(Vh,Eh)结构。
图3是本发明的删除故障节点后的H(Vh,Eh)。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明包括以下步骤:
S1:设X(V,E)为一个存在容错哈密顿圈的数据中心网络,其中V代表点集,E代表边集;X(V,E)生成的哈密顿圈用H(Vh,Eh)表示,其中Vh=V,Eh∈E;
Figure BDA0002981994840000044
使用PMC测试模型结合概率测试的方法对vi,vj进行诊断若vi,vj都无故障则以vi为哈密顿圈的起始节点,将节点vj用a来表示;
所述步骤S1中的PMC测试模型结合概率测试的方法具体为:
利用在PMC模型中正常节点能够准确的得出被测节点的状态,而故障节点无法准确得出被测节点状态的原理,(vi,vj)表示vi对vj进行测试若vi是正常节点,(vi,vj)=0表示vj是正常节点,(vi,vj)=1表示vj是故障节点;若vi是故障节点无论vj是否正常其测试结果可能为(vi,vj)=0或(vi,vj)=1;假设(vi,vj)=1的概率为p;vi对vj进行n次测试结果都为0,那么vi和vj故障的概率为pn;若pn足够小,则认为vi和vj都正常。对于两个相邻节点vi,vj可以得到以下四种情况(n为测试的次数且n足够大):
若满足
Figure BDA0002981994840000041
则vi,vj为正常节点;
若满足
Figure BDA0002981994840000042
则vi正常vj故障;
若满足
Figure BDA0002981994840000043
则vi故障vj正常;
若满足
Figure BDA0002981994840000051
则vi,vj都故障。
如图2所示,X(V,E)生成的哈密顿圈用H(Vh,Eh)表示哈密顿路径为<xi1,xi2,...,,xi|v|>其中<i1,i2,...,i|V|>是[0,1,...,|V|]的序列组合;(xi1,xi2)表示xi1对xi2进行测试,若xi1是正常节点则(xi1,xi2)=0(或1)表示xi1测得xi2是正常(或故障)。若xi1是故障节点则xi1测xi2的结果可能为正常也可能为故障即可能出现(xi1,xi2)=0也可能出现(xi1,xi2)=1,假设出现(xi1,xi2)=1的概率p=0.5,测试次数n=8。xi1和xi2中存在故障且满足公式
Figure BDA0002981994840000052
的概率为pn<0.01,则认为节点xi1和节点xi2为正常,以xi1为哈密顿圈的起始节点,并将xi2用a来表示。
S2:以a为起点按照哈密顿圈的顺序依次进行测试,设a的下一个节点为b即(a,b)∈Eh,当a为正确节点时可准确测得b节点状态,若b正常,则重复此过程,直到测试完所有节点或测出故障节点时进入步骤S3;
所述步骤S2具体为:
Figure BDA0002981994840000053
即b为a的下一个节点,让a对b进行检测;
若(a,b)=0,则令a=b,重复步骤S2,直到检测完所有节点;
若(a,b)=1,则记录故障节点,进入步骤S3。
在本实施例中,具体来说,
Figure BDA0002981994840000054
即b为a的下一个节点,让a对b进行检测;由于a为正常节点则一定可以准确的测得b是否正常。
若(a,b)=0,则令a=b。即(xi2,xi3)=0,把xi3用a来表示;重复步骤S2,直到检测完所有节点。
若(a,b)=1,即(xi2,xi3)=1,则记录故障节点xi3,进入步骤S3。
S3:使用结构的容错哈密顿性质,删除不超过限制个数的节点,剩下的节点仍能构成哈密顿圈,使用步骤S2中的方法继续测试;直到故障节点数超过限制的节点个数后执行步骤S4;
所述步骤S3具体为:
所选取的网络具有容错哈密顿性,即删除k个节点之后仍可构成哈密顿圈;用i记录删除的节点个数;
若i≤k,将故障节点b从整个拓扑删除,构建新的哈密顿圈并执行步骤S2;
若i>k,记录故障节点b,进入步骤S4。
具体地,若i≤k,将故障节点b从整个网络删除,构建新的哈密顿圈并执行步骤S2,如图3所示为删除故障节点xi3后的哈密顿圈;
若i>k,表示继续删除故障节点则无法构成哈密顿圈,记录故障节点,例如节点xi5故障且无法删除,进入步骤S4。
S4:通过PMC测试模型结合概率测试的方法去测试接下来两个节点的状态,直至对所有节点完成测试。
所述步骤S4具体为:
按照哈密顿圈的顺序让故障节点后边的两个节点相互测试,即将b的下个节点设为a’,a’的下个节点设为b’;例如图3中a’为xi6,b’为xi7,让a’和b’执行步骤S1中的n次互相测试;存在4种情况
若a’和b’都故障,记录故障节点a’,b’重复步骤S4,直到检测完所有节点;
若a’和b’都正常,令a’=b’,跳转到步骤S2;
若a’正常b’故障,记录故障节点b’,重复步骤S4,直到检测完所有节点;
若a’故障b’正常,记录故障节点a’,令a’=b’,跳转到步骤S2。
在整个测试过程中利用数据中心网络结构递归性的特点,高层结构往往由若干个低一层结构构成,采用并行诊断的方式同时对若干个低一层结构并行的进行测试,从而增加测试效率。
所述并行诊断的方法具体为:
用X(n,k)表示具有容错哈密顿性质的结构,通常X(n,k)构造规则满足递归性:即X(n,k)由m个X(n,k-1)组成(m>2),由于结构不同m值也不同;对m个X(n,k-1)同时进行测试测试,并将测试结果汇总到一起,等同于对X(n,k)进行测试,从而提高测试效率。
本发明的有益效果为:
(1)传统的故障诊断方法规定了故障节点个数的上限所以不能检测出所有故障节点,本方法对故障节点的个数几乎没有限制;
(2)传统基于PMC模型测试方法是让两个未知节点进行测试,结果是不确定的,本发明提出的方法确保了测试节点为正常,从而可以准确得知被测节点的状态,使得测试更准确减少测试次数;
(3)利用数据中心网络结构递归构造的特点,将一个高层结构划分为若干个低一层结构,并行的对每个低一层的结构进行测试,极大的提升测试效率。

Claims (6)

1.一种基于容错哈密顿圈的数据中心网络故障诊断方法,其特征在于,包括以下步骤:
S1:设X(V,E)为一个存在容错哈密顿圈的数据中心网络,其中V代表点集,E代表边集;X(V,E)生成的哈密顿圈用H(Vh,Eh)表示,其中Vh=V,Eh∈E;
Figure FDA0003519352670000011
vj∈Vh,(vi,vj)∈Eh,i≠j,使用PMC测试模型结合概率测试的方法对vi,vj进行诊断若vi,vj都无故障则以vi为哈密顿圈的起始节点,将节点vj用a来表示;
所述步骤S1中的PMC测试模型结合概率测试的方法具体为:
利用在PMC模型中正常节点能够准确的得出被测节点的状态,而故障节点无法准确得出被测节点状态的原理,(vi,vj)表示vi对vj进行测试,若vi是正常节点,则(vi,vj)=0表示vj是正常节点,(vi,vj)=1表示vj是故障节点;若vi是故障节点,无论vj是否正常其测试结果可能为(vi,vj)=0或(vi,vj)=1;假设(vi,vj)=1的概率为p;vi对vj进行n次测试结果都为0,那么vi和vj故障的概率为pn;若pn小于0.01,则认为vi和vj都正常;对于两个相邻节点vi,vj可以得到以下四种情况,其中n为测试的次数:
若满足
Figure FDA0003519352670000012
则vi,vj为正常节点;
若满足
Figure FDA0003519352670000013
则vi正常vj故障;
若满足
Figure FDA0003519352670000014
则vi故障vj正常;
若满足
Figure FDA0003519352670000015
则vi,vj都故障;
S2:以a为起点按照哈密顿圈的顺序依次进行测试,设a的下一个节点为b即(a,b)∈Eh,当a为正确节点时可准确测得b节点状态,若b正常,则重复此过程,直到测试完所有节点或测出故障节点时进入步骤S3;
S3:使用结构的容错哈密顿性质,删除不超过限制个数的节点,剩下的节点仍能构成哈密顿圈,使用步骤S2中的方法继续测试;直到故障节点数超过限制的节点个数后执行步骤S4;
S4:通过PMC测试模型结合概率测试的方法去测试接下来两个节点的状态,直至对所有节点完成测试。
2.根据权利要求1所述的一种基于容错哈密顿圈的数据中心网络故障诊断方法,其特征在于,所述步骤S2具体为:
Figure FDA0003519352670000021
(a,b)∈Eh即b为a的下一个节点,则让a对b进行检测;
若(a,b)=0,则令a=b,重复步骤S2,直到检测完所有节点;
若(a,b)=1,则记录故障节点,进入步骤S3。
3.根据权利要求2所述的一种基于容错哈密顿圈的数据中心网络故障诊断方法,其特征在于,所述步骤S3具体为:
所选取的网络具有容错哈密顿性,即删除k个节点之后仍可构成哈密顿圈;用i记录删除的节点个数;
若i≤k,将故障节点b从整个拓扑删除,构建新的哈密顿圈并执行步骤S2;
若i>k,记录故障节点b,进入步骤S4。
4.根据权利要求3所述的一种基于容错哈密顿圈的数据中心网络故障诊断方法,其特征在于,所述步骤S4具体为:
按照哈密顿圈的顺序让故障节点后边的两个节点相互测试,即将b的下个节点设为a’,a’的下个节点设为b’;让a’和b’执行步骤S1中的n次互相测试;存在4种情况
若a’和b’都故障,记录故障节点a’,b’重复步骤S4,直到检测完所有节点;
若a’和b’都正常,令a’=b’,跳转到步骤S2;
若a’正常b’故障,记录故障节点b’,重复步骤S4,直到检测完所有节点;
若a’故障b’正常,记录故障节点a’,令a’=b’,跳转到步骤S2。
5.根据权利要求1所述的一种基于容错哈密顿圈的数据中心网络故障诊断方法,其特征在于:
在整个测试过程中利用数据中心网络结构递归性的特点,高层结构由若干个低一层结构构成,采用并行诊断的方式同时对若干个低一层结构并行的进行测试,从而增加测试效率。
6.根据权利要求5所述的一种基于容错哈密顿圈的数据中心网络故障诊断方法,其特征在于,所述并行诊断的方法具体为:
用X(n,k)表示具有容错哈密顿性质的结构,通常X(n,k)构造规则满足递归性:即X(n,k)由m个X(n,k-1)组成,其中m>2,由于结构不同m值也不同;对m个X(n,k-1)同时进行测试,并将测试结果汇总到一起,等同于对X(n,k)进行测试,从而提高测试效率。
CN202110291165.9A 2021-03-18 2021-03-18 一种基于容错哈密顿圈的数据中心网络故障诊断方法 Active CN112968804B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110291165.9A CN112968804B (zh) 2021-03-18 2021-03-18 一种基于容错哈密顿圈的数据中心网络故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110291165.9A CN112968804B (zh) 2021-03-18 2021-03-18 一种基于容错哈密顿圈的数据中心网络故障诊断方法

Publications (2)

Publication Number Publication Date
CN112968804A CN112968804A (zh) 2021-06-15
CN112968804B true CN112968804B (zh) 2022-04-15

Family

ID=76279323

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110291165.9A Active CN112968804B (zh) 2021-03-18 2021-03-18 一种基于容错哈密顿圈的数据中心网络故障诊断方法

Country Status (1)

Country Link
CN (1) CN112968804B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113595896B (zh) * 2021-08-05 2022-04-05 河南大学 一种基于vlc链路的混合数据中心网络的多路由通信方法
CN113726879B (zh) * 2021-08-30 2023-10-24 河南大学 一种基于vlc链路的混合数据中心网络系统vhcn

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1294136A1 (en) * 2001-09-14 2003-03-19 Alcatel Fast restoration mechanism and method of determining minimum restoration capacity in a transmission network

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE268081T1 (de) * 2001-04-04 2004-06-15 Cit Alcatel Mechanismus und verfahren zur bestimmung und schnellen wiederherstellung einer minimalen kapazität in einem vermaschten netz
CN107347183B (zh) * 2016-12-26 2020-02-18 福建师范大学 一种基于pmc检测模型的移动网络中恶意用户的检测方法
CN107168842B (zh) * 2017-06-02 2020-09-25 西安电子科技大学 基于pmc模型的自适应顺序故障诊断方法
CN111294237B (zh) * 2020-01-20 2021-11-02 福州大学 基于pmc模型的2-阶段网络故障诊断方法
CN112217668B (zh) * 2020-09-29 2021-10-29 福州大学 基于比较模型的自适应网络故障诊断方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1294136A1 (en) * 2001-09-14 2003-03-19 Alcatel Fast restoration mechanism and method of determining minimum restoration capacity in a transmission network

Also Published As

Publication number Publication date
CN112968804A (zh) 2021-06-15

Similar Documents

Publication Publication Date Title
Lin et al. Predicting node failure in cloud service systems
CN112968804B (zh) 一种基于容错哈密顿圈的数据中心网络故障诊断方法
CN107832219B (zh) 基于静态分析和神经网络的软件故障预测技术的构建方法
CN111294237B (zh) 基于pmc模型的2-阶段网络故障诊断方法
CN112217668B (zh) 基于比较模型的自适应网络故障诊断方法
CN115348159A (zh) 基于自编码器和服务依赖图的微服务故障定位方法及装置
CN107168842A (zh) 基于pmc模型的自适应顺序故障诊断方法
CN113590429A (zh) 一种服务器故障诊断方法、装置及电子设备
CN114116292A (zh) 一种融合ap聚类与宽度学习系统的硬盘故障预测方法
CN111949459B (zh) 一种基于迁移学习和主动学习的硬盘故障预测方法及系统
Lin et al. Edits: An easy-to-difficult training strategy for cloud failure prediction
CN111240883B (zh) 基于有限状态机的系统诊断方法、装置、设备及存储介质
CN113221496B (zh) 一种基于三维测试性分析模型的故障诊断方法
Kreutzer et al. System-level fault diagnosis: A survey
CN115687951B (zh) 一种混合电子系统的可靠性评估方法及装置
CN113127274A (zh) 磁盘故障预测方法、装置、设备及计算机存储介质
Duarte Jr et al. A distributed system-level diagnosis model for the implementation of unreliable failure detectors
CN115550144A (zh) 分布式故障节点预测方法、装置、电子设备及存储介质
CN114448834A (zh) 一种基于折叠超立方体的多处理机网络故障节点诊断方法
CN103501320B (zh) 一种利用失效日志计算存储集群可用性的方法
CN113342651A (zh) 一种用于测试用例缺陷与用例模糊关联关系的恢复方法
CN117421145B (zh) 一种异构硬盘系统故障预警方法及装置
CN117591337B (zh) 计算机信息数据交互传输管理系统及方法
CN116112344B (zh) 一种机房故障网络设备检测方法、设备及介质
TW201916207A (zh) 用於確定受測試電路中的系統性缺陷的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant