CN102662831A - 一种容错系统诊断策略优化方法 - Google Patents

一种容错系统诊断策略优化方法 Download PDF

Info

Publication number
CN102662831A
CN102662831A CN2012100738454A CN201210073845A CN102662831A CN 102662831 A CN102662831 A CN 102662831A CN 2012100738454 A CN2012100738454 A CN 2012100738454A CN 201210073845 A CN201210073845 A CN 201210073845A CN 102662831 A CN102662831 A CN 102662831A
Authority
CN
China
Prior art keywords
node
test
diagnosis
probability
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100738454A
Other languages
English (en)
Other versions
CN102662831B (zh
Inventor
胡政
张士刚
刘颖
李岳
杨定新
宋立军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201210073845.4A priority Critical patent/CN102662831B/zh
Publication of CN102662831A publication Critical patent/CN102662831A/zh
Application granted granted Critical
Publication of CN102662831B publication Critical patent/CN102662831B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明公开了一种容错系统诊断策略优化方法,包括如下步骤:首先以多信号流模型为基础,自动生成贝叶斯网络模型,并设置网络节点参数;同时以信息熵理论为基础,构建同时考虑诊断能力和测试费用的代价函数,实现测试序列优化选择及序贯诊断;最后根据获得的推理模型和优化的测试序列进行系统的多故障诊断。本发明方法适用于故障容错系统,能够有效处理故障诊断中的不确定问题和多故障问题,并能及时、准确定位故障。

Description

一种容错系统诊断策略优化方法
技术领域
本发明属于基于贝叶斯网络的故障诊断策略优化方法,具体涉及一种容错系统诊断策略优化方法。
背景技术
容错系统的核心是系统的冗余设计,它以增加资源来提高系统的可靠性,能够保证当系统出现故障时仍然可以稳定运行。容错系统有两个主要特点,一是由于大量采用容错技术,系统的复杂程度较高;二是为保证及时启用冗余资源,系统必须能够实时检测、诊断和定位故障,这些都对系统的可测性设计提出了更高的要求。诊断策略优化是可测性设计中的一项重要内容,主要目的是增强对复杂系统故障的监控与精确定位能力,提高诊断效率,减少装备的全寿命周期费用。现有的诊断策略优化方法很多,国内外学者提出了很多行之有效的理论和方法。从推理模型看,主要有故障树、决策树、神经网络、信息模型、有向图模型等。这些方法在故障诊断和维修领域均得到了广泛的应用,但总体来说,这些方法的不确定性处理能力和多源信息表达与融合能力有待提高,对复杂系统中的多故障、隐藏故障的处理能力相对较弱,诊断策略构建困难,并且大多为静态诊断策略,无法满足复杂容错系统对诊断性能的要求。因此容错系统的诊断策略优化问题成为系统测试性设计的一个难点。
发明内容
本发明目的在于给出一种适用于故障容错系统,能够有效处理故障诊断中的不确定问题和多故障问题,并能及时、准确定位故障的容错系统诊断策略优化方法。
为了实现上述发明目的,本发明的容错系统诊断策略优化方法包括如下步骤:首先以多信号流模型为基础,自动生成贝叶斯网络模型,并设置网络节点参数;同时以信息熵理论为基础,构建同时考虑诊断能力和测试费用的代价函数,实现测试序列优化选择及序贯诊断;最后根据获得的推理模型和优化的测试序列进行系统的多故障诊断。
本发明实现具体步骤如下:
一、基于多信号模型自动构建贝叶斯网络
第一步:利用TEAMS软件构建多信号模型,并导出相关性矩阵;
利用多信号流图建模软件TEAMS构建容错系统的多信号模型,用{F1,F2,·,Fm}和{T1,T2,·,Tn}分别表示模型中所有的故障模式Fi和测试Tj的集合,导出容错系统的相关性矩阵,用下式表示:
D m × n = d 11 d 12 · d 1 n d 21 d 22 · d 2 n · · · · d m 1 d m 2 · d mn - - - ( 1 )
在上述相关性矩阵(1)中,不同行表示不同的故障模式Fi,不同列表示不同的测试Tj,并且
Figure BDA0000145063530000022
其中,1≤i≤m,1≤j≤n;
上述相关性矩阵是实现自动构建贝叶斯网的基础,后续步骤将以其为输入实现贝叶斯网的自动构建。
第二步:基于相关性矩阵依据下述原则设定四种贝叶斯网节点:
1、故障节点:针对相关性矩阵中的所有故障模式Fi(1≤i≤m),分别设定与之相对应的故障节点,记为故障节点fi
2、测试节点:针对相关性矩阵中所有的测试Tj(1≤j≤n),分别设定与之对应的测试节点,记为测试节点tj
3、辅助监控节点:选取若干个故障模式{F1,F2,·,Fm}的子集{Fi|i∈(1,m)},对应于每一个子集{Fi|i∈(1,m)},分别设定一个节点,称之为辅助监控节点。在此过程中,子集{Fi|i∈(1,m)}的数目以及其中包含的具体元素由使用人员依据需求自行确定;
4、总监控节点:设定一个节点表示系统整体状态,即为总监控节点;
上述四种节点均是所构建的贝叶斯网的组成部分
第三步:添加节点间的连接关系
沿用第一步中相关性矩阵的表示符号,按照下述规则在第二步构建的节点之间添加连接关系:
1、针对相关性矩阵中的所有元素,如果dij=1,添加从故障节点fi到测试节点tj的连接关系;
2、添加由故障节点fi到子集{Fi|i∈(1,m)}对应的辅助监控节点间的连接关系;
3、添加由所有故障节点fi到总监控节点的连接关系,或者由添加辅助监控节点到总监控节点的连接关系,最终能保证从任何故障节点fi均有路径到达总监控节点即可满足要求;
第四步:设定贝叶斯网节点参数,具体过程为:
1、故障节点参数设定
在构建的贝叶斯网中,故障节点fi均为父节点,对其设定两种状态:Good、Bad,假定每种故障模式Fi的平均故障间隔时间分别用MTBFi(i=1,2,·m)表示,则故障节点fi的状态概率按下式计算:
P iBad = 1 MTBF i Σ r = 1 m 1 MTBF r - - - ( 2 )
PiGood=1-PiBad         (3)
式(2)(3)中PiBad、PiGood作为故障节点参数分别表示故障节点fi状态为Bad和Good的概率设置;
2、测试节点参数设定
测试节点tj设定为两种状态,分别对应于测试通过、未通过,记为Pass、Fail,测试节点tj均为子节点,因此设定的参数应为条件概率,具体设定规则为:
针对测试节点tj,用Sj表示与其相关的故障节点fi个数,用集合{Zr}(r=1,2,·Sj)具体表示与之相关的故障节点fi集合,则测试节点tj各种状态的条件概率为:
P(tj=Pass|Zr=Good,r=1,2,·Sj)=1         (4)
P(tj=Fail|Zr=Good,r=1,2,·Sj)=0          (5)
否则,若至少存在一个k(1≤k≤Sj)满足Zk=Bad,则:
P(tj=Pass|Zr,r=1,2,·Sj)=0               (6)
P(tj=Fail|Zr,r=1,2,·Sj)=1               (7)
式(4)-(7)所表达的概率即为测试节点tj的参数。以此类推,对每个测试节点tj进行相应的设置;
3、辅助监控节点参数设定
辅助监控节点设定两种状态:Good和Bad,将其对应于测试节点tj的两种状态Pass和Fail,按照和测试节tj点完全相同的方式设定条件概率并作为辅助监控节点参数;
4、总监控节点参数设定
总监控节点设定两种状态:Good和Bad,当其状态全部为Good时,总监控节点为Good的概率为1,否则为0;
至此,贝叶斯网的自动构建已经实现。具体而言,所构建的贝叶斯网包括第二步中设定的四种节点、第三步中设定的节点间的连接关系、第四步中设定的节点参数。
二、测试序列选择及序贯诊断
第一步:测试诊断能力的计算
与上述多信号模型中的符号相同,设Tj表示系统的一个测试,测试Tj的诊断能力用该测试的信息熵H(Tj)表示,即
H(Tj)=-P(tj=Pass)logP(tj=Pass)-P(tj=Fail)logP(tj=Fail)(8)
式中P(tj=Pass)和P(tj=Fail)分别表示测试Tj所对应的测试节点tj状态为Pass和Fail的概率,该值基于当前已知测试结果和已知故障状态通过所构建的贝叶斯网进行推理运算(如采用团树传播算法等已有的成熟算法)得到;
第二步:测试诊断价值的计算
利用式(9)计算测试Tj的诊断价值
Figure BDA0000145063530000061
V T j = H ( T j ) - w * C - - - ( 10 )
式中:C为测试费用,其中包括人员的费用、测试资源的费用、测试时间等方面,并将费用转换为同一单位(比如美元)来表示;w为权重系数,表示测试费用C在诊断价值
Figure BDA0000145063530000063
中所占的比重,即测试费用C对测试序列选择的影响程度,该值根据经验进行设定;H(Tj)为依据式(8)计算的诊断能力;
第三步,序贯诊断的实施:
基于第一步和第二步中计算的诊断价值
Figure BDA0000145063530000064
序贯诊断执行过程为:
S1在未加入证据的情况下对贝叶斯网进行初始推理;
S2依据公式错误!未找到引用源。计算测试的诊断价值;
S3选择诊断价值最高的测试并执行该测试,将测试结果作为证据加入贝叶斯网,具体实施规则为:假定选择执行的测试为Tj,并且测试结果为通过,则将其对应的测试节点tj状态设为tj=Pass,否则设为tj=Fail;
S4执行贝叶斯网推理;
S5依次判读是否达到停机条件一和停机条件二,若达到条件一或同时达到两个条件转步骤S6,若只达到条件二,转步骤S7,否则转步骤S2;
S6按条件一输出序贯诊断结果;
S7按条件二输出序贯诊断结果。
上述序贯诊断中的两个停机条件分别为:
条件一:容错系统所有故障模式Fi中,某些故障模式Fi对应的故障节点fi状态为Bad的概率高于设定阈值,此时输出结果为这些故障模式Fi;或者总监控节点状态为Good的概率高于设定值,此时输出结果为“系统正常”;或者只关心辅助监控节点的状态,某些辅助监控节点状态为Bad的概率高于设定阈值,此时输出结果为这一辅助监控节点对应的故障模式{F1,F2,·,Fm}的子集{Fi|i∈(1,m)};
条件二:所有剩余测试Tj的诊断价值均低于设定值,此时的输出结果为可能故障集合即故障模式{F1,F2,·,Fm}的子集{Fi|i∈(1,m)},该集合的元素为:对应故障节点fi状态为Bad的概率大于0的故障模式Fi
三、组合故障诊断
执行组合故障诊断的条件为:上一节序贯诊断中给出的故障模式Fi在维修操作中被证明是不存在的,此时需要进行组合故障诊断。
组合故障诊断的实现步骤为:
1、将利用序贯诊断得到的状态为Bad的概率最高的故障节点fi状态设为Good,并作为贝叶斯网的证据节点看待;
2、利用组合故障推理算法(如马尔可夫链-蒙特卡洛方法等已有的成熟算法)进行贝叶斯网推理,计算序贯诊断结果中状态为Bad的概率不为0的故障节点fi的状态组合为组合故障诊断结果。
本发明方法适用于故障容错系统,能够有效处理故障诊断中的不确定问题和多故障问题,并能及时、准确定位故障。
下面结合附图对本发明方法做进一步的说明。
附图说明
图1是容错系统的多信号模型示意图。
图2是只包含节点的贝叶斯网示意图。
图3是含连接关系的贝叶斯网示意图。
具体实施方式
采用上述方法步骤,用某容错系统为例来说明本发明应用的具体过程与有益效果:
一、基于多信号模型自动构建贝叶斯网络。
第一步:利用TEAMS软件构建多信号模型,并导出相关性矩阵。
利用多信号流图建模软件TEAMS构建容错系统的多信号模型,用{F1,F2,·,Fm}和{T1,T2,·,Tn}分别表示模型中所有的故障模式Fi和测试Tj的集合,导出容错系统的相关性矩阵,用下式表示:
D m × n = d 11 d 12 · d 1 n d 21 d 22 · d 2 n · · · · d m 1 d m 2 · d mn - - - ( 11 )
在上述相关性矩阵(1)中,不同行表示不同的故障模式Fi,不同列表示不同的测试Tj,并且
其中,1≤i≤m,1≤j≤n。
利用TEAMS构建的多信号模型如图1所示,并导出相关性矩阵如表1所示。
表1系统相关性矩阵
  T1   T2   T3   T4
  F1   1   0   1   0
  F2   0   0   1   0
  F3   0   1   1   1
  F4   1   1   0   0
  F5   0   0   1   0
在该系统中,m=5,n=4。
第二步:基于相关性矩阵添加贝叶斯网的四种节点。
(1)故障节点:针对相关性矩阵中的所有故障模式F1~F5,设定与之相对应的故障节点,即故障节点f1~f5
(2)测试节点:针对相关性矩阵中所有的测试T1~T4,设定与之相对应的测试节点,即测试节点t1~t4
(3)辅助监控节点:选取{F1,F2,F3}作为一个感兴趣的故障模式的子集,并设定一个辅助监控节点与该子集对应,命名为“辅助监控节点0”.
选取剩余的故障模式{F4,F5}作为另一个感兴趣的故障模式的子集,并设定另一个辅助监控节点与之对应,命名为“辅助监控节点1”。
(4)总监控节点:添加一个节点至贝叶斯网表示系统整体状态,命名为“总监控节点”。
此时拟构建的贝叶斯网只含有上述节点,无连接关系,如图2所示。
第三步:添加节点间的连接关系
(1)添加故障节点和测试节点间的关系。依据相关性矩阵的值,添加的连接关系为:故障节点f1到测试节点t1、t3;故障节点f2到测试节点t3;故障节点f3到测试节点t2、t3、t4;故障节点f4到测试节点t1、t2;故障节点f5到测试节点t3
(2)添加由故障节点到与之相关的辅助监控节点间的连接关系,即:添加故障节点f1、f2、f3到“辅助监控节点0”的关系,以及添加故障节点f4、f5到“辅助监控节点1”的关系。
(3)添加到总监控节点的连接关系,在此采用通过辅助监控节点的方式,即添加“辅助监控节点0”和“辅助监控节点1”到总监控节点的关系,也可添加由所有故障节点fi到总监控节点的连接关系(未画)。
在添加完连接关系后,拟构建的贝叶斯网变为如图3所示。
第四步:设定贝叶斯网络节点参数。
(1)故障节点参数设定
故障节点fi均为父节点,对其设定两种状态:Good、Bad。故障模式F1~F5的平均故障间隔时间(即MTBFi(i=1,2,·5))为{10e+006,3e+006,5e+006,2e+006,6e+006}小时。依据前述公式(2)、(3),计算各故障模式PiBad的概率值为{0.0769,0.2564,0.1538,0.3846,0.1282},PiGood的值为{0.9231,0.7436,0.8462,0.6154,0.8718}。
(2)测试节点参数设定
测试节点t1~t4均设定Pass、Fail两种状态,每个测试节点的参数如表2-5所示。表2-5中参数的含义与公式(4)-(7)所论述的条件概率相同,以表2为例,写成公式(4)-(7)的形式为:
P(t1=Pass|f1=Good,f2=Good)=1           (12)
P(t1=Fail|f1=Good,f2=Good)=0             (13)
P(t1=Pass|f1,f2至少一个状态为Bad)=0        (14)
P(t1=Fail|f1,f2至少一个状态为Bad)=1        (15)
表2测试节点t1的参数
Figure BDA0000145063530000111
表3测试节点t2的参数
Figure BDA0000145063530000112
表4测试节点t3的参数
Figure BDA0000145063530000113
表5测试节点t4的参数
(3)辅助监控节点参数设定
辅助监控节点的参数如表6、7所示,表的含义与测试节点的参数含义相同。
表6“辅助监控节点0”的参数
Figure BDA0000145063530000121
表7“辅助监控节点1”的参数
Figure BDA0000145063530000122
(3)总监控节点参数设定
表8“总监控节点”的参数
Figure BDA0000145063530000123
二、测试序列选择及序贯诊断
本步骤中,测试诊断能力、测试诊断价值的计算及序贯诊断执行过程等均按照前述的方法和步骤编制成程序由计算机完成,在此不做赘述。
由于序贯诊断为循环逐次执行,本节结合案例直接论述序贯诊断的实施过程。系统中每个测试T1~T4的费用分别为{2,3,15,10},权重系数f=0.05。
(1)诊断案例一
本案例演示停机条件一,只关心故障模式的发生概率,而不考虑辅助监控节点的失效概率。表9-11中左侧表示故障节点(含总体监控节点)的状态及概率,右侧表示测试节点的名称、状态、状态概率、诊断价值。测试依据诊断价值的大小逐步执行,加入测试结果后进行贝叶斯网推理运算,每一步的执行结果如表9-11所示。
表9初始故障率与诊断价值
  诊断目标   状态   概率   测试节点   状态   概率   诊断价值
  f4   Bad   0.3846   t1   Fail   0.4319   0.8865
  总监控节点   Good   0.3116   t2   Fail   0.4792   0.8487
  f2   Bad   0.2564   t3   Fail   0.4936   0.2498
  f3   Bad   0.1538   t4   Fail   0.1538   0.1192
  f5   Bad   0.1282
  f1   Bad   0.0769
表10加入测试结果“t1=Fail”后
  诊断目标   状态   概率   测试节点   状态   概率   诊断价值
  f4   Bad   0.8904   t2   Fail   0.9072   0.2954
  f2   Bad   0.2564   t3   Fail   0.5491   0.2430
  f1   Bad   0.1780   t4   Fail   0.1538   0.1192
  f3   Bad   0.1538
  f5   Bad   0.1282
  总监控节点   Good   0
表11加入测试结果“t2=Fail”后
  诊断目标   状态   概率   测试节点   状态   概率   诊断价值
  f4   Bad   0.9814   t3   Fail   0.5030   0.2499
  f2   Bad   0.2564   t4   Fail   0.1695   0.1565
  f3   Bad   0.1695
  f5   Bad   0.1282
  f1   Bad   0.0940
  总监控节点   Good   0
在本案例中,停机条件一的故障判决阈值设定为90%。在表11中,由于故障节点f4状态为Bad的概率为98.14%,超过了判决阈值,达到了停机条件一,为此可以输出序贯诊断结果,即:系统中的故障为故障模式F4
若关注重点为辅助监控节点,则将辅助监控节点看成故障模式,采用与上述步骤相同的诊断过程即可。
(2)诊断案例二
本案例主要是为了演示停机条件二。
某次诊断过程如表12-15所示。
表12初始故障率与诊断价值
  诊断目标   状态   概率   测试节点   状态   概率   诊断价值
  f4   Bad   0.3846   t1   Fail   0.4319   0.8865
  总监控节点   Good   0.3116   t2   Fail   0.4792   0.8487
  f2   Bad   0.2564   t3   Fail   0.4936   0.2498
  f3   Bad   0.1538   t4   Fail   0.1538   0.1192
  f5   Bad   0.1282
  f1   Bad   0.0769
表13加入测试结果“t1=Pass”后
  诊断目标   状态   概率   测试节点   状态   概率   诊断价值
  总监控节点   Good   0.5485   t2   Fail   0.1538   0.4692
  f2   Bad   0.2564   t3   Fail   0.4514   0.2431
  f3   Bad   0.1538   t4   Fail   0.1538   0.1192
  f5   Bad   0.1282
表14加入测试结果“t2=Pass”后
  诊断目标   状态   概率   测试节点   状态   概率   诊断价值
  总监控节点   Good   0.6482   t3   Fail   0.3517   0.1856
  f2   Bad   0.2564
  f5   Bad   0.1282
表15加入测试结果“t3=Fail”后
  诊断目标   状态   概率   测试节点   状态   概率   诊断价值
  f2   Bad   0.7289
  f5   Bad   0.3644
  总监控节点   Good   0
由表15可以看出,所有的故障模式概率均未超过停机条件一的判决阈值,未达到停机条件一,但是,所有的测试均已经没有诊断价值,故达到了停机条件二,仍然停机,输出诊断结果为故障模式{F2,F5}。
三、组合故障诊断
假定在上一节案例一中的诊断结果与实际不符,即维修操作证明故障模式F4未发生,此时需要进行组合故障诊断。
(1)在案例一序贯诊断步骤的基础上将故障节点f4的状态设为Good,并作为贝叶斯网证据。
(2)选定除故障节点f4以外的所有序贯诊断结果状态为Bad的概率不为0的故障节点作为计算对象,即:故障节点f1,f2,f3,f5,利用组合故障推理算法(马尔可夫链-蒙特卡洛方法)计算所得的状态组合即为组合故障诊断结果,如表16所示,其中状态为Bad的故障节点所对应的故障模式即为诊断结果,本案例中组合故障为故障模式F1和F3
表16组合故障诊断结果
  诊断目标   状态   目标类型
  f3   Bad   故障节点
  f1   Bad   故障节点
  f2   Good   故障节点
  f5   Good   故障节点

Claims (1)

1.一种容错系统诊断策略优化方法,其特征在于包括以下步骤:
一、基于多信号模型自动构建贝叶斯网络:
第一步,利用TEAMS软件构建多信号模型,并导出相关性矩阵;
利用多信号流图建模软件TEAMS构建容错系统的多信号模型,用{F1,F2,·,Fm}和{T1,T2,·,Tn}分别表示模型中所有的故障模式Fi和测试Tj的集合,导出容错系统的相关性矩阵,用下式表示:
D m × n = d 11 d 12 · d 1 n d 21 d 22 · d 2 n · · · · d m 1 d m 2 · d mn - - - ( 1 )
在上述相关性矩阵错误!未找到引用源。中,不同行表示不同的故障模式Fi,不同列表示不同的测试Tj,并且
Figure FDA0000145063520000012
其中,1≤i≤m,1≤j≤n;
第二步,基于相关性矩阵错误!未找到引用源。依据下述原则设定四种贝叶斯网节点:
1、故障节点:针对相关性矩阵错误!未找到引用源。中的所有故障模式Fi(1≤i≤m),分别设定与之相对应的故障节点,记为故障节点fi
2、测试节点:针对相关性矩阵错误!未找到引用源。中所有的测试Tj(1≤j≤n),分别设定与之对应的测试节点,记为测试节点tj
3、辅助监控节点:选取若干个故障模式{F1,F2,·,Fm}的子集{Fi|i∈(1,m)},对应于每一个子集{Fi|i∈(1,m)},分别设定一个节点,称之为辅助监控节点;
4、总监控节点:设定一个节点表示系统整体状态,即为总监控节点;
第三步,添加节点间的连接关系:
1、针对相关性矩阵错误!未找到引用源。中的所有元素,如果dij=1,添加从故障节点fi到测试节点tj的连接关系;
2、添加由故障节点fi到辅助监控节点间的连接关系;
3、添加由所有故障节点fi到总监控节点的连接关系,或者添加由辅助监控节点到总监控节点的连接关系,最终能保证从任何故障节点fi均有路径到达总监控节点即可满足要求;
第四步,设定贝叶斯网节点参数:
1、故障节点参数设定
在构建的贝叶斯网中,故障节点fi均为父节点,对其设定两种状态:Good、Bad,假定每种故障模式Fi的平均故障间隔时间分别用MTBFi(i=1,2,·m)表示,则故障节点fi的状态概率按下式计算:
P iBad = 1 MTBF i Σ r = 1 m 1 MTBF r - - - ( 2 )
PiGood=1-PiBad            (3)
式错误!未找到引用源。、错误!未找到引用源。中PiBad、PiGood作为故障节点参数分别表示故障节点fi状态为Bad和Good的概率设置;
2、测试节点参数设定
测试节点tj设定为两种状态,分别对应于测试通过、未通过,记为Pass、Fail,测试节点tj均为子节点,因此设定的参数应为条件概率,具体设定规则为:
针对测试节点tj,用Sj表示与其相关的故障节点fi个数,用集合{Zr}(r=1,2,·Sj)具体表示与之相关的故障节点fi集合,则测试节点tj各种状态的条件概率为:
P(tj=Pass|Zr=Good,r=1,2,·Sj)=1          (4)
P(tj=Fail|Zr=Good,r=1,2,·Sj)=0          (5)
否则,若至少存在一个k(1≤k≤Sj)满足Zk=Bad,则:
P(tj=Pass|Zr,r=1,2,·Sj)=0                (6)
P(tj=Fail|Zr,r=1,2,·Sj)=1                (7)
式错误!未找到引用源。-错误!未找到引用源。所表达的概率即为测试节点tj的参数,以此类推,对每个测试节点tj进行相应的设置;
3、辅助监控节点参数设定
辅助监控节点设定两种状态:Good和Bad,将其对应于测试节点tj的两种状态Pass和Fail,按照和测试节点tj完全相同的方式设定条件概率并作为辅助监控节点参数;
4、总监控节点参数设定
总监控节点设定两种状态:Good和Bad,当其状态全部为Good时,总监控节点为Good的概率为1,否则为0;
至此完成贝叶斯网的自动构建;
二、测试序列选择及序贯诊断:
第一步,测试诊断能力的计算:
测试Tj的诊断能力用该测试的信息熵H(Tj)表示,即
H(Tj)=-P(tj=Pass)logP(tj=Pass)-P(tj=Fail)logP(tj=Fail)(8)
式中P(tj=Pass)和P(tj=Fail)分别表示测试Tj所对应的测试节点tj状态为Pass和Fail的概率,该值基于当前已知测试结果和已知故障状态通过所构建的贝叶斯网进行推理运算得到;
第二步,测试诊断价值的计算:
利用式(9)计算测试Tj的诊断价值
Figure FDA0000145063520000041
V T j = H ( T j ) - w * C - - - ( 10 )
式中:C为测试费用;w为权重系数,表示测试费用C在诊断价值
Figure FDA0000145063520000043
中所占的比重,即测试费用C对测试序列选择的影响程度,该值根据经验进行设定;H(Tj)为依据式错误!未找到引用源。计算的诊断能力;
第三步,序贯诊断的实施:
基于诊断价值
Figure FDA0000145063520000044
序贯诊断执行过程为:
S1在未加入证据的情况下对贝叶斯网进行初始推理;
S2依据公式错误!未找到引用源。计算测试的诊断价值;
S3选择诊断价值最高的测试并执行该测试,将测试结果作为证据加入贝叶斯网,具体实施规则为:假定选择执行的测试为Tj,并且测试结果为通过,则将其对应的测试节点tj状态设为tj=Pass,否则设为tj=Fail;
S4执行贝叶斯网推理;
S5依次判读是否达到停机条件一和停机条件二,若达到条件一或同时达到两个条件转步骤S6,若只达到条件二,转步骤S7,否则转步骤S2;
S6按条件一输出序贯诊断结果;
S7按条件二输出序贯诊断结果;
上述序贯诊断中的两个停机条件分别为:
条件一:容错系统所有故障模式Fi中,某些故障模式Fi对应的故障节点fi状态为Bad的概率高于设定阈值,此时输出结果为这些故障模式Fi;或者总监控节点状态为Good的概率高于设定值,此时输出结果为“系统正常”;或者只关心辅助监控节点的状态,某些辅助监控节点状态为Bad的概率高于设定阈值,此时输出结果为这一辅助监控节点对应的故障模式{F1,F2,·,Fm}的子集{Fi|i∈(1,m)};
条件二:所有剩余测试Tj的诊断价值均低于设定值,此时的输出结果为可能故障集合即故障模式{F1,F2,·,Fm}的子集{Fi|i∈(1,m)},该集合的元素为:对应故障节点fi状态为Bad的概率大于0的故障模式Fi
三、组合故障诊断:
执行组合故障诊断的条件为:上一节序贯诊断中给出的故障模式Fi在维修操作中被证明是不存在的,此时需要进行组合故障诊断;
组合故障诊断的实现步骤为:
1、将利用序贯诊断得到的状态为Bad的概率最高的故障节点fi状态设为Good,并作为贝叶斯网的证据节点看待;
2、利用组合故障推理算法进行贝叶斯网推理,计算序贯诊断结果中状态为Bad的概率不为0的故障节点fi的状态组合为组合故障诊断结果。
CN201210073845.4A 2012-03-20 2012-03-20 一种容错系统诊断策略优化方法 Expired - Fee Related CN102662831B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210073845.4A CN102662831B (zh) 2012-03-20 2012-03-20 一种容错系统诊断策略优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210073845.4A CN102662831B (zh) 2012-03-20 2012-03-20 一种容错系统诊断策略优化方法

Publications (2)

Publication Number Publication Date
CN102662831A true CN102662831A (zh) 2012-09-12
CN102662831B CN102662831B (zh) 2015-02-11

Family

ID=46772328

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210073845.4A Expired - Fee Related CN102662831B (zh) 2012-03-20 2012-03-20 一种容错系统诊断策略优化方法

Country Status (1)

Country Link
CN (1) CN102662831B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400036A (zh) * 2013-07-29 2013-11-20 电子科技大学 一种基于rfid管理的质量事故快速定位方法
CN105718355A (zh) * 2016-01-21 2016-06-29 中国人民解放军国防科学技术大学 基于在线学习的超级计算机结点故障主动容错方法
CN105759782A (zh) * 2016-01-26 2016-07-13 中国人民解放军装甲兵工程学院 一种基于危害度的车辆故障诊断策略构建方法
CN106708725A (zh) * 2015-11-17 2017-05-24 上海机电工程研究所 一种测试与诊断相结合的测试序列动态管理方法
CN108204331A (zh) * 2016-12-19 2018-06-26 北京金风科创风电设备有限公司 风力发电机组的故障处理方法及装置
CN109066819A (zh) * 2018-09-25 2018-12-21 中国人民解放军军事科学院国防工程研究院 一种基于案件推理的配电网的无功优化方法
CN110221144A (zh) * 2019-05-30 2019-09-10 北京博锐尚格节能技术股份有限公司 建筑机电故障原因定位方法
CN113887452A (zh) * 2021-10-09 2022-01-04 中国舰船研究设计中心 基于相关性矩阵的故障诊断优化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101226499A (zh) * 2007-01-16 2008-07-23 国际商业机器公司 用于诊断应用程序的方法和系统
CN102364448A (zh) * 2011-09-19 2012-02-29 浪潮电子信息产业股份有限公司 一种计算机故障管理系统的容错方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101226499A (zh) * 2007-01-16 2008-07-23 国际商业机器公司 用于诊断应用程序的方法和系统
CN102364448A (zh) * 2011-09-19 2012-02-29 浪潮电子信息产业股份有限公司 一种计算机故障管理系统的容错方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡政等: "非高斯噪声下基于Unscented粒子滤波器的非线性系统故障诊断方法", 《兵工学报》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400036A (zh) * 2013-07-29 2013-11-20 电子科技大学 一种基于rfid管理的质量事故快速定位方法
CN103400036B (zh) * 2013-07-29 2016-09-28 电子科技大学 一种基于rfid管理的质量事故快速定位方法
CN106708725A (zh) * 2015-11-17 2017-05-24 上海机电工程研究所 一种测试与诊断相结合的测试序列动态管理方法
CN105718355B (zh) * 2016-01-21 2018-02-16 中国人民解放军国防科学技术大学 基于在线学习的超级计算机结点故障主动容错方法
CN105718355A (zh) * 2016-01-21 2016-06-29 中国人民解放军国防科学技术大学 基于在线学习的超级计算机结点故障主动容错方法
CN105759782B (zh) * 2016-01-26 2018-06-08 中国人民解放军装甲兵工程学院 一种基于危害度的车辆故障诊断策略构建方法
CN105759782A (zh) * 2016-01-26 2016-07-13 中国人民解放军装甲兵工程学院 一种基于危害度的车辆故障诊断策略构建方法
CN108204331A (zh) * 2016-12-19 2018-06-26 北京金风科创风电设备有限公司 风力发电机组的故障处理方法及装置
CN109066819A (zh) * 2018-09-25 2018-12-21 中国人民解放军军事科学院国防工程研究院 一种基于案件推理的配电网的无功优化方法
CN109066819B (zh) * 2018-09-25 2021-08-20 中国人民解放军军事科学院国防工程研究院 一种基于案件推理的配电网的无功优化方法
CN110221144A (zh) * 2019-05-30 2019-09-10 北京博锐尚格节能技术股份有限公司 建筑机电故障原因定位方法
CN110221144B (zh) * 2019-05-30 2021-08-31 博锐尚格科技股份有限公司 建筑机电故障原因定位方法
CN113887452A (zh) * 2021-10-09 2022-01-04 中国舰船研究设计中心 基于相关性矩阵的故障诊断优化方法
CN113887452B (zh) * 2021-10-09 2024-05-21 中国舰船研究设计中心 基于相关性矩阵的故障诊断优化方法

Also Published As

Publication number Publication date
CN102662831B (zh) 2015-02-11

Similar Documents

Publication Publication Date Title
CN102662831B (zh) 一种容错系统诊断策略优化方法
Cai et al. Bayesian networks in fault diagnosis
Lampis et al. Bayesian belief networks for system fault diagnostics
Ding et al. Fuzzy universal generating functions for multi-state system reliability assessment
CN102637019B (zh) 一种工业生产过程智能集成故障诊断方法及装置
Cai et al. A multiphase dynamic Bayesian networks methodology for the determination of safety integrity levels
CN102721901B (zh) 基于时序贝叶斯知识库tbkb的电网故障诊断方法
CN101783749B (zh) 一种网络故障定位方法和装置
RU2557771C1 (ru) Способ технического контроля и диагностирования бортовых систем беспилотного летательного аппарата с поддержкой принятия решений и комплекс контрольно-проверочной аппаратуры с интеллектуальной системой поддержки принятия решений для его осуществления
CN102684902B (zh) 基于探针预测的网络故障定位方法
CN103853889A (zh) 一种基于键合图的电力电子系统故障诊断方法
CN109597752A (zh) 基于复杂网络模型的故障传播路径仿真方法
CN102662389A (zh) 一种基于故障特性分析的监测参数选择方法
Duan et al. Fault diagnosis for complex systems based on reliability analysis and sensors data considering epistemic uncertainty
Li et al. Reliability modeling of redundant systems considering CCF based on DBN
Xie et al. Fault diagnosis of the satellite power system based on the Bayesian network
Cai et al. Bayesian networks in fault diagnosis: Practice and application
CN102281103A (zh) 基于模糊集合解算的光网络多故障恢复方法
Duan et al. Diagnosis strategy for complex systems based on reliability analysis and MA DM under epistemic uncertainty
CN106130780A (zh) 一种基于静态贝叶斯模型的ip网络故障定位方法
Ahmed et al. Formal reliability analysis of wireless sensor network data transport protocols using HOL
Duan et al. Diagnosis strategy for micro-computer controlled straight electro-pneumatic braking system using fuzzy set and dynamic fault tree
Bhattacharyya et al. A discrete event systems approach to network fault management: detection and diagnosis of faults
Cai et al. A multiphase dynamic bayesian network methodology for the determination of safety integrity levels
CN109784629A (zh) 一种基于神经网络的变电站工控网络故障定位方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150211

Termination date: 20160320