CN103592141B

CN103592141B - 用于测试复杂系统的可靠性的方法

Info

Publication number: CN103592141B
Application number: CN201310335865.9A
Authority: CN
Inventors: C·格雷; N·哈塞尔格鲁伯; F·朗玛丽
Original assignee: Uptime Holdings Ltd
Current assignee: Uptime Holding GmbH
Priority date: 2012-08-13
Filing date: 2013-08-02
Publication date: 2017-08-22
Anticipated expiration: 2033-08-02
Also published as: CN103592141A; EP2698680A1; EP2698680B1; US20140047271A1; US9348720B2

Abstract

本发明涉及用于测试复杂系统的可靠性的方法，包括如下步骤：‑通过标识出系统的各部件来建立具有若干层的系统分层结构；‑标识故障模式并将其分配给各部件；‑确定各故障模式的测试过程；‑可以使用最少量的测试通过以下步骤来获得与技术系统的可用性有关的可靠信息：‑标识出用于向建立系统的分层分解的各部件分配可用性目标的层；‑通过定性方法向之前步骤中标识出的部件分配可用性目标；‑计算出所有部件的预计可用性；‑通过所述预计可用性标识出不满足可用性目标的那些部件，并选择另一测试或增加已经选择的测试的严格性，直到可用性目标被满足；‑计算系统的总可用性。

Description

用于测试复杂系统的可靠性的方法

技术领域

本发明涉及用于测试复杂系统的可靠性的方法，包括对这样的系统的可用性的评估和优化。

背景技术

研究复杂系统的可靠性是设计和生产过程的重要部分。为了获得与可靠性有关的可靠结果，只执行测试是不够的，还必须仔细地计划测试程序，也要以使得可以获得统计上可靠的结果的方式来分析测试结果。

这样的方法包括以下步骤：

a.通过标识出系统的部件来建立具有若干层的系统分层结构。系统是诸如机器或车辆等复杂技术实体，它由在此被指定为部件的若干部分组成。部件本身可以由各部分组成，使得分层结构被建立，在该分层结构中，该系统由第一层的若干部件组成。这些第一层部件中的至少一些由第二层部件组成，并以此类推。在此，对于较高层部件的一部分，使用术语子部件。

在该步骤中，分析系统，并标识出部件树，以表示系统分层结构。

b.标识和分配各部件的故障模式。分析所有的部件，以检测出可导致系统的机能失常的可能故障，该系统的机能失常会导致不可用性。这些故障模式以其包括以下各项的所有方面来进行描述，以便得到全面信息：

-故障种类，例如磨损，

-故障位置，例如滑动表面，

-因果链，例如高局部压力-高温-表面部分熔化-粘着磨损-裂缝形成

-可观察到的应力参数，

-先兆(precursors)。

通常，某些部件可具有若干故障模式，而某些部件仅具有一个故障模式。可能会发生没有向特定部件分配任何故障模式，但在这种情况下，应该向至少一个子部件分配了故障模式。与每一故障模式有关的另一个非常重要的参数是系统在这种故障情况下的预期停机时间，包括用于检测、备用部分的分发及修理的时间。

可用性是部件正在工作的操作时间的百分比。任何故障发生都会导致停机时间，直到成功的修理被完成，并且该停机时间表示系统的不可用性。

c.确定不同部件的故障模式的测试过程，以获得对该部件的可用性的估计。至少一个测试被选择。在现有技术方案中，这些测试以可以通过统计计算来表明预定寿命可以被实现的方式来设计。详细地，确定测试的足够的持续时间，可以将该持续时间与顾客操作的特定时间(即，等效持续时间)进行比较。

这样的过程的缺点是各测试通常必须以获得预后寿命或可用性的特殊方式来设计，并且在复杂的情况下，某些测试可能太过苛刻。同时，可能会忽视潜在的风险。

发明内容

本发明的目的是避免这些缺点，并提供一种以最少量的测试和用于评估的其他努力来给出与技术系统的可用性有关的可靠信息的方法。

为了实现这些目的，本发明提供一种用于测试复杂系统的可靠性的方法，包括对这样的系统的可用性的评估和优化，所述方法包括以下步骤：

a.通过标识出所述系统的部件来建立具有若干层的系统分层结构；

b.标识故障模式并将其分配给部件；

c.确定不同部件的故障模式的测试过程以获得对该部件的可用性的估计，并选择至少一个测试；

其特征在于以下步骤：

d.标识出用于向建立所述系统的分层分解的各部件分配可用性目标的层；

e.通过考虑经验、故障的关键性以及设计或材料的新颖性的定性方法来向之前步骤中标识出的各部件分配可用性目标，所述可用性目标组合起来导致所述系统的总可用性目标，并标识出需要分析的那些目标；

f.计算具有需要被分析的目标的所有部件的预计可用性，在这些测试成功的情况下，该预计可用性是最可能的可用性值的估计；

g.通过所述预计可用性来标识出不满足可用性目标的那些部件，并选择另一测试来改进预计可用性或增加已经选择的测试的严格性，直到可用性目标被满足；

h.计算所述系统的总可用性。

现在，附加的步骤将被进一步解释。

d.标识出用于向各部件分配可用性目标并因此建立该系统的分层分解的层。确保表示该系统的分层树是完整分解是一个重要的步骤。这意味着，该树中的每一水平部分将包括该系统的每一部件，每一部件要么被直接地包括，要么由相应的子部件来表示。

理论上，将每一部件划分成某些子部件并以此类推是可能的。然而，对于这种分解存在合理的限制。通过这种限制，可以以充分的方式来评估部件的功能和可用性，而无需深入更多细节。从另一观点来看，该最大深度层是从以下角度来选择的：合理性测试对该层可用，而对之下的层不可用。也在该层上分配可用性目标是有用的。

不得不提的是，在实践中，该步骤可以在步骤b和步骤c之前执行。

e.通过考虑经验、故障的关键性和设计或材料的新颖性的定性方法来向之前步骤中标识出的各部件分配可用性目标，这些可用性目标一起导致系统的总可用性目标，并标识出需要分析的那些目标。

本发明的重要特征是以使得实现系统的总目标的方式来向各部件分配可用性目标，这样足以满足系统用户的需求。在该上下文中，定性意味着分配不是根据精确的数学或统计方法来执行的，而是根据考虑了所有种类的经验的试探方法来执行的。例如，通过这种方法，对部分的新材料的使用或新供应商的使用一般将导致需要进行调查。只有那些被很好了解的部件(这些部件具有没有问题的历史并且没有任何新状况被观察到)才可被认为是不关键的，因此无需执行任何测试，即这些部件无须被分析。然而，也向这样的部件分配某一余差(residual)可用性目标。然而，假设即使在没有执行任何测试的情况下，也满足这个目标。

f.计算具有需要被分析的目标的所有部件的预计可用性，在假设这些测试成功的情况下，该预计可用性是最可能可用性值的估计。

如果实施了所有的计划测试，而没有任何失败，则可以计算出可论证的存活概率(survival probability)和可论证的可用性。这些值是实际存活概率和实际可用性的保守置信下限。这意味着与每一故障模式有关的真实存活概率和真实可用性预期比处于特定置信水平下的相应下限要高。

已发现，基于可论证的可用性来聚集可用性会导致远非保守的结果，即故障的风险被过高估计到取决于测试的数量和故障的分布的程度。

只要没有任何故障发生，就无法计算出存活概率/可用性的真实预期值。本发明现基于对预计可用性的使用，该预计可用性代替了这些预期值。这些是将用于聚集与可用性值有关的故障模式以得到总系统可用性的测量法。

g.通过所述预计可用性来标识出不满足可用性目标的那些部件，并选择另一测试来改进预计可用性，或增加已选择的测试的严格性(severtity)直到可用性目标被满足。

该这个步骤中，所标识出的要被验证的那些部件按照附加的测试或者按照更频繁或更长时间地执行相同测试来获得附加的测试努力。

h.计算系统的总可用性由于在所有基本上相关的情况下，系统可以是不可用的时间的百分比较小，因此可以通过累加各部件的可用性来获得该总可用性。

注意，本发明的方法并不仅仅使得设计用于评估可用性的测试成为必须。对可能得到与部件的可能故障(该可能故障可容易地得到)有关的某些信息的任何测试的计算的贡献可被使用。

对各部件或对整个系统执行测试，其中优选对可能的最低层部件进行测试。每一测试可以产生与被测试的部件或其子部件的某些故障模式有关的信息。可能发生某一测试并不会对其他故障模式的评估有贡献。

优选地，可以预见不同的测试被实施，并被组合起来计算特定故障模式的风险。因此，例如震动台测试、过载测试和整车可有利于检查如后面描述的故障模式—液压系统的连接盘的高循环疲劳。

以上的解释涉及在系统的设计和开发阶段期间计划验证活动。在这个阶段，测试被计划，以便在测试结果为正数的条件下获取与可用性有关的信息。本发明还涉及如下方法，在该方法中，随后的测试被实际执行，并且，取决于结果，对测试程序的改变被可选地考虑，并且或许其他动作被采取。

计算了系统的总可用性后，测试被实际地实施，并且该方法通过执行如下程度的评估来扩展：由于测试失败而需要附加的测试或设计改变。

附图说明

现参考附图来详细解释本发明。附图包括以下：

图1是示出根据本发明的方法的流程图；

图2示出表示随时间的顾客负载的可变性的示图，该可变性为由两个应力参数(速度n(t)和压力P(t))组成的参考谱(reference profile)；

图3是示出从可论证的可用性计算预计可用性的示图；

图4是示出用于不同参数的集度函数的图示。

具体实施方式

首先，参考图1解释该方法。

步骤1：定义要检查的系统，并确定必须要实现的总可用性。

步骤2：建立包含该系统的所有部件的表示其结构的分层结构树。

步骤3：标识出可能影响产品可用性的技术和补充风险，并且这些风险被分配给表示该系统的部件的相应系统树节点。

步骤4：通过考虑影响与各单独部件有关的故障风险的相关环境来执行风险评估，并且基于这样的评估来分配可用性目标。

步骤5a1到5c2可以部分地彼此并行地执行，因此它们被表示在三个分支上。

步骤5a1：可能的先验故障模式被分析，并被分配给系统树中的各节点。标识出对于设置故障模型的物理性质而言相关的应力参数。

步骤5a2：向每一故障模式分配故障模型(PoF)的物理性质。

步骤5b1：验证测试候选根据与累积损坏强度有关的效率而获得资格。

步骤5b2：向系统树的相应节点分配有资格的验证测试。

步骤5c1：设置顾客使用空间，分析目标市场的需求，实施使用测量数据的加权的主成分分析(PCA)。

步骤5c2：定位有资格的验证测试，并标识出使用空间中的预期参考工作循环。

步骤6：根据参考谱根据相关的故障模式为所计划的每一测试计算出可论证的可用性。

步骤7：将获得的结果聚集成针对每一树节点的预计可用性的值。

步骤I：检查预计可用性是否可接受，即它是否满足每一树节点的目标。

如果为是->步骤VI

如果为否->步骤8。

步骤8：从可用性不足的所有树节点中选择以最大的偏差偏离可用性目标的那个节点。

步骤II：检查针对所选节点的故障模式的任何有资格的测试是否都可用。

如果为是->步骤9。

如果为否->步骤IV

步骤9：为该节点选择顶部的性能测试。

步骤10：这个测试被分配给该系统树的最低可能层。

步骤11：为所有受影响的树节点重新计算可论证的可用性和预计可用性。

步骤12：在考虑所分配的风险以及所有标识出的先验故障模式的情况下，基于经调整的测试程序来确定系统的预期(预计)可用性。

步骤III：检查预计可用性是否可接受，即它是否满足目标要求。

如果为是->步骤14。

如果为否->返回步骤8

步骤IV：检查是否任何其他节点可用于被选择。

如果为是->步骤13

如果为否->步骤14

步骤13：选择不可用性评级中的下一节点。

步骤14：实施所定义的测试并报告结果。

步骤V：检查任何观察到的测试中的故障是否要求设计改变。

如果为是->步骤15

如果为否->返回步骤I

步骤15：重置各树节点处受到设计改变影响的所有相关故障模式的测试贡献。

去往步骤8

步骤VI：检查各测试是否已被实施。

如果为是->步骤16。

如果为否->返回步骤14

步骤16：如果必要的话，定义早期警告系统的树结点和故障模式的范围。在实践应用中，可以预期，对于未被充分验证的每一故障模式而言，边界条件不允许增加验证程序的严格性或扩展性。尤其地，这可适用于因验证程序执行期间观察到的故障而必须被重新验证的故障节点，尤其如果这些故障节点要求实时以表现出诸如(侵蚀、因沉积而阻塞等)。在这样情况下，可以决定在如下条件下发布该系统：无法充分验证的那些故障模式在早期警告系统中是特别注意地被监视的。

步骤17：有条件的系统发布。

现在将使用仅用于说明而给出、并非旨在限制本发明的范围的示例来解释本发明该示例描绘了对液压系统的评估。

这些步骤被按序执行，但是用相同的字母被指定为权利要求书中的步骤。

初始步骤：定义目的和可用性目标

液压系统HS01在顾客操作中的可用性必须在开发阶段中被尽可能早的得到保证，因为它是关键的产品特征。每年的年操作时间是3600小时。在使用的前三年中，总可用性目标是99％。只要发生导致要实施所需的修理动作的系统停机时间的故障事件发生，系统的不可用性就出现。最终，在系统未被操作的时间段(例如，晚上、周末期间)中实施所需的调度维护动作。

平均修理时间(即，修理或翻新动作所需的平均时间)被假设为与受影响部件无关，因为这些动作的主要工作是将该系统从车辆处拆卸掉，而该拆卸被假设为在每一不可用性情况下都是必须。平均修理时间被假设为是18小时。一般来说，修理的平均时间取决于受影响的部件并取决于观察到的故障模式。

a.定义范围

要考虑的液压系统由下面的树结构来表示：

表1：具有组合件层(连接板、控制盘、…)和部件层(活塞、油缸、…)的液压系统的分层树。

该分层树提供了液压系统的完整分解。至少在根之下的第一级(组合件级)上的完整性环境是强制性的，因为对系统可用性的评估基于组合件和部件的可用性。

e1.标识风险——风险过滤

如果开发在时间和预算方面都按计划完成，并且产品在定义的时间段内提供其预期的功能而无需任何修理动作，则该产品可被认为是成功的。在这种情况下，术语风险描述了未达到产品成功的增加的可能性。

针对由各种分类(技术、时间、组织、生产、经济)所导致的风险，对液压系统的所有组合件进行评估。由于风险很难量化，因此根据分类来判断是否发现了增加的风险。所标识的风险集在树中是作为风险设置来继承的，但是只要一个节点的所有孩子都继承同一值，这些风险对较下层不会具有任何影响。

表2：适用于液压系统的风险过滤

只要标识出每个组合件至少一个增加的风险(Y)，则将更详细地进行分析。对于液压系统的除控制盘和旋转斜盘之外的所有组合件，标识出了至少一个增加的风险。

e2.分配可用性目标

如上所标识出的，该产品每年被操作3600小时。如果一次修理动作需要18小时，且可用性应该是99％，则可忍受每个系统每年最多2个故障。

对于可用性评估，基于步骤a的分析估计来导出每个组合件和每个部件的允许故障数。每个树节点的孩子数用作风险的加权因子以将系统复杂性考虑在内。

表3：为液压系统分配可用性目标

一个节点每年的最大可允许故障数被分发给其子节点，这从根的总目标开始。结果，所有组合件目标(在最大允许故障数方面)之和为总目标，而所有部件目标(在最大允许故障数方面)之和为相应组合件节点的目标。

通过使用年操作时间和平均修理时间来将导出的每一最大允许故障数转换成可用性目标。例如，对于连接盘，这为3600*(1–0.125*18/3600)≈0.99938。

b.故障模式的先验分析

对于具有增加的风险的所有组合件，故障模式分析被实施。与公知的FMEA相反，在使用严格性、出现和检测概率来标识和评估功能和故障的情况下，此处的焦点在于使用故障模型的物理性质来对故障现象进行物理描述。

表4：液压系统的分析得到的故障模式的列表。

对于识别到的每一故障模式，因果链与构建故障模型的物理性质所必需的物理参数一起被标识出。该分析的结果是为描述故障模式所要应用的故障模型的物理性质。例如，连接板的故障模式“高循环疲劳(HCF)”用标准HCF模型n*p^k来描述，其中n是该系统的旋转速度，p是液压(在该情况下为负载特征)，且k是模型参数。

c1.测试程序

对液压系统的设计核查计划进行与持久性测试有关的调查，该持久性测试可以向关于可用性的系统验证提供任何贡献。以下测试已经被标识出：

测试	所计划的持续时间[h]	重复数
			震动台测试	20	6
过载测试	300	2
			整车	800	3
压力波动测试	2.000	2
			动态的负载循环测试	1.500	2

表5：所计划的用于验证液压系统的测试的列表。

震动台测试是针对连接板的部件测试，并测试来免于高循环疲劳。因此，该测试仅与部件和故障模式的结合相关，而其他测试是对完整系统实施的，并由此为该系统树的每一节点提供潜在的损坏贡献。副本数示出每一测试要使用多少个样本来实施。值6意味着在震动台测试中6个连接板被测试，每个连接板被测试了20小时。同样，对于2个过载测试，计划每个测试具有300小时的持续时间等等。

c2.顾客使用

必须对顾客使用的负载可变性进行与步骤b的故障模式分析中列出的所有相关可观察变量有关的调查。由于液压泵在本示例中的应用是升降操作，因此顾客负载谱的可变性较小，并且必须选择以仅使用一个参考谱来用于程序的估计。一般来说，可以使用多于一个顾客参考谱。

图2用以秒为单位的时间t上的两个应力参数(速度n(t)和压力p(t))示出了用于该计算的顾客参考谱。该所选的顾客使用谱用作用于估计这些测试的损坏贡献的参考。

f₁.根据故障模式计算可用性论证和预计

对于步骤b中标识出的故障模式中的每一个，将相应的损坏模型应用于所有相关测试和顾客参考谱。

使用连接板的故障模式来对该步骤进行说明：

表6：与液压系统的连接板的所标识的故障模式有关的每一单个测试的等效持续时间

对于故障模式泄漏，震动台测试并不相关，因为在那里只有该板本身得到测试(而没有与其他部件的任何接触也没有油)。故障模式的物理性质基于该系统的动态操作。由于过载测试是以固定的最大速度操作的，因此不存在与动态操作有关的损坏贡献。整车的损坏与参考顾客谱的损坏间的比较提供如下结果：即，800小时的整车(即，一次测试运行)等于219小时的顾客操作。另一方面，2000小时的压力波动测试与5234小时的顾客操作相当。

对于第二故障模式(HCF)，大贡献来自震动台测试(因为HCF正是该测试的目的)以及过载测试。同样，动态测试提供巨大的贡献。

对于每一个故障模式，这些等效的持续时间用于计算可论证的最大可允许故障数。在此，使用通过本文献了解的原理。再次，对于连接板的故障模式泄漏，该计算被示出。

所需输入为：

·年操作时间t_a＝3600小时

·平均修理时间t_r＝18小时

·n个测试的等效持续时间t₁,t₂,…(在此，n＝7且t₁＝t₂＝t₃＝219小时,t₄＝t₅＝5234小时,t₆＝t₇＝4800小时)

·韦伯形状参数β＝2(…随时间线性增加的故障风险)

·统计测试的最大错误概率α(0.1，默认设置，工业标准)

为了确定可论证的可变性，首先计算出一年后的可论证存活概率S(t_a)，假定式为按韦伯分布的故障时间：

S(t_a)＝α^(t_a ^β/(t₁ ^β+…+t₇ ^β))＝0.1^(3600²/(3*219²+2*5234²+2*4800²))≈0.7442

由此，可论证的可用性为：

A(t_a)＝(t_a–t_r*(-ln(S(t_a))))/t_a＝(3600–18*(-ln(0.7442)))/3600≈0.9985

这意味着我们期望连接板与在3600小时后泄漏有关的存活概率高于74.42％。如果一次修理平均耗费18小时，则我们期望相应的可用性大于99.85％。

注意，这个结果仅在所考虑的时间段中每个部件最多一次故障发生的情况下才是精确的。在部件层上，这是对典型可用性目标的极好逼近，因为那些接近100％。

如果所计划的所有测试被实施而没有任何失败，则可论证存活概率以及可论证可用性是实际存活概率和实际可用性的保守的置信下限。这意味着与每一故障模式有关的真实存活概率和真实可用性预期比相应的下限要高。只要没有任何故障出现，则预期的存活概率/可用性无法计算出，但是相反，基于风险数，提供代替这些预期值的预计存活概率/可用性。这些是将用于聚集与可用性值有关的故障模式以得到总系统可用性的措施。

该预计按如下方式工作。可论证存活概率是α-置信下限，即真实的存活概率大于经论证的值的概率>(1-α)*100％。这一关系在图3中示出。

在图3中的左图中，可论证存活概率S(t_a)被表示在以操作小时为单位的时间t上。假定式是具有形状参数β的韦伯分布。

图3中的右图示出表示依赖于可论证存活概率S(t_a)的预计存活概率S*(t_a)的贝塔(Beta)分布。

我们假设预计存活概率遵循具有参数a和b的贝塔分布。参数b默认被设为1，并且在与担保数据有关的历史信息指示对于相关的故障模式，在过去没有任何问题发生时，该参数b将减小。将b减小为<1的值会导致垂直渐近线在S(t_a)＝1处的密度。这意味着如果相关的部件/故障模式在过去不显著，则预计存活概率被增加。参数a是通过风险估计得到的，并使用下式来进行初始化：

exp((最大可能总风险值－(总风险值－1))/2)。

这确保了a总是>1，即贝塔(beta)密度的左分支向0逼近。如果对于这些参数a和b，贝塔概率密度从0到S(t_a)的区域均>α，则参数a被增加，直到S(t_a)>α。因此，预计存活概率S*(t_a)是最终选择的贝塔分布的期望值，即：

S*(t_a)＝a/(a+b).

再次，对于第一部件/故障模式，即(连接板，泄漏)，没有任何历史信息可用，因此b＝1。由于最大可能风险值为12(风险分类数，对照前面的风险过滤)，并且连续板的总风险值为4(标识出4个风险)，a为

exp((12-4-1)/2)＝exp(3.5)≈33.12.

由于贝塔密度的图示在S(t_a)左边(即在区间[0；0.7442]内)的区域<α，因此参数a无需被进一步调整。因此，假定的贝塔分布具有参数a＝33.12和b＝1。预计存活概率

S*(t_a)＝a/(a+b)＝33.12/(33.12.+1)＝0.9707.

经论证值的预计可用性可能为：

A^*(t_a)＝(t_a–t_r*(-ln(S*(t_a))))/t_a＝(3600–18*(-ln(0.9707)))/3600≈0.99985.

这些步骤对故障模式分析表中列出的所有部件和故障模式实施。注意，对于每一故障模式，从故障模型的物理性质得到的相应等效持续时间必须被使用。下表包含这些结果。

表7：为液压系统分析得到的部件和故障模式的可论证的和预计的存活概率和可用性

f2.根据树节点来聚集预计的(不)可用性

分析得到的故障模式的列表包含被标识为关键的故障模式。从统计的观点来看，必须假设：某些故障模式以后将在顾客的手里发生，对于这些故障模式在开发期间没有预先检测到。我们将一个节点的总故障模式数估计为：

n_t＝n_f*(1+p/max(1,d)+d/n_f)

其中，n_f是所标识出的该节点处的故障模式数，p是生产风险，d是开发风险。两个风险指标p和d均是从步骤3中应用的风险过滤处提取出的。在此，开发风险d是风险过滤的前6个分类中标识出的风险(Y)的数目，而生产风险p是后6个分类中的风险(Y)的数目。

例如，对于连接板，为n_f＝2(标识出两个故障模式，对照前面)，d＝3(风险过滤中的前6个风险栏中的三个风险(Y))，且p＝1(风险过滤中的后6栏中的一个风险(Y))，因此我们估计出2*(1+1/3+3/2)＝34/6≈6个故障模式。

一般来说，通过故障行为可知(引用)，顾客手中发生的故障并非均匀地分布在不同的潜在故障模式上，相反，它们高度地集中在较小数量的模式上(即，在《有问题的》那些模式上)。此处使用通过本文了解的Lorenz和Münzner集度测量法，并通过简单的幂函数x^k来对该集度测量法进行建模，其中k≥1。图4的图表示出了从k＝{1,2,4,8,16}中得出的不同集度函数。

在图4中，将累积故障的百分比x^k描绘在故障模式的百分比x之上。对应于k＝2⁰＝1的关系是线性的，对应于更大值的k的关系为递增的抛物线。

例如，具有k＝8的集度函数暗示最关键的10％的故障模式引起所有故障中的60％的故障。

在假设在某部件(节点)的n_t个故障模式之上的故障集度k₀的情况下，该节点处最关键的故障模式(即，具有最高故障频率的故障模式)，可以引起该节点的最大允许故障数(对照步骤4中具有最大允许故障数的表)中的(1–((n_t–1)/n_t)^k0)*100％的故障。

显然，在计划测试时，仍不知道哪个故障模式将是最关键的那个故障模式。然而，对于属于特定节点的每一个故障模式，如果可以论证该故障模式比假设集度k₀时的最关键故障模式更好，则可以得出该完整节点将实现可用性目标。

步骤4中的目标表示出了连接板的最大可允许故障数为0.12。随着使用现有的担保数据确定集度参数k₀＝8，对于最关键的故障模式，我们具有如下目标：最大允许故障数为0.12个故障的(1–(5/6)⁸)*100％≈77％，即为0.092个故障。这导致对每一单独的故障模式的可用性目标为99.95％。

通过所预计的每一部件的故障数来执行对若干故障模式对部件估计的贡献的聚集。由标识出的n_f个故障模式所引起的故障的预计数目通过下式来估计：

–Σ_i ln(S_i*(t_a)),i＝1,…,n_f,

该式假设各单独故障模式的根源是独立的。另外，假设顶部故障模式是所标识出的n_f个故障模式，则通过该集度函数取得剩余的n_t–n_f个故障模式所引起的故障的数目。因此，剩余的故障数通过下式来估计：

该节点的最大允许故障数的((n_t–n_f)/n_t)^k0*100％。

回想，对于连接板，我们已经计算出对于故障模式《泄漏》，预计存活概率为97.07％。对于第二故障模式《HCF》，预计存活概率为99.72％。因此，节点“连接板”的预计总故障数为：

在t_a＝3600小时后，n_f＝2,n_t＝6且k₀＝8的情况下，等于–ln(0.9707)–ln(0.9972)+((6–2)/6)⁸≈0.072。

以类似的方式将对故障模式的聚集原理应用于故障模式已被分析的所有其他部件。对于所有其他部件，假设目标将被精确地达到。

通过这种方式，使用可用性结果自底向上一直到根地填充整颗树。如果该预计不满足根的目标，则通过按照节点与各相应目标进行比较可以立刻发现差距(gap)位于哪里。

g.增加测试程序的严格性以及h.计算总可用性

表8示出了对可用性值的自底向上的聚集。对每一部件应用最后一个步骤中描述的原理，并递归地对每一组合件应用该原理，最终对系统应用该原理。对于每一预计故障数，可以在每一步骤上再次计算预计可用性。

表8：聚集预计的故障数和可用性以评估验证程序

只要平均修理时间被假设为对于所有部件都相等(如在我们的论证示例中)，是否将预计的故障数或可用性与相应目标进行比较并不是问题。然而，通常情况并非如此。因此，作为标准，对于该评估将使用可用性。

第一行中的可用性比较示出完整系统的目标未被达到。因此，该验证程序是不充分的。在组合件层，可以发现，该验证程序对于连接板和控制器单元是充分的。由于对于控制盘和旋转斜盘没有标识出任何风险，因此假设这些组合件即使在没有优化该验证程序的情况下也将达到其可用性目标。

对于轴向活塞单元和驱动单元，验证程序是不充分的。

在表8中，可以发现，轴向活塞单元的所有部件以及驱动轴都没有被充分地验证。对轴向活塞单元的油缸出现最大的差距，而对驱动轴的验证非常接近于目标。

分析现有测试表明它们都没有为油缸提供大于2500小时的等效持续时间。对这些测试进行扩展因实践上的原因而不可能。因此，必须开发出新的轴向活塞应力测试。根据该故障模式，考虑应该覆盖被分析的位置的HCF、磨损和热过载。

如果这样的测试将为每一个被分析的故障模式提供至少9000小时的等效持续时间，则另外还将需要2个这样的测试。

在驱动轴的验证中，最大的差距位于故障模式“磨损”处。在此，仅整车提供了验证贡献。由于验证已经接近于目标，在这种情况下将整车的损坏强度增加因子2将是充分的。这可通过相应地增加测试应力来达到。

Claims

1.一种用于测试复杂系统的可靠性的方法，包括对这样的系统的可用性的评估和优化，所述方法包括以下步骤：

b.标识故障模式并将其分配给部件；

其特征在于以下步骤：

h.计算所述系统的总可用性。

2.如权利要求1所述的方法，其特征在于，当在步骤e.中分配了可用性目标之后，在所述测试为成功的情况下，先计算出表示特定置信水平下的可用性下限的可论证可用性，并从所述可论证可用性导出所述预计可用性。

3.如权利要求1所述的方法，其特征在于，选择使得所述系统分层结构中的最低可能层被首先检查的那些测试。

4.如权利要求1所述的方法，其特征在于，首先选择出于其他目的而执行的那些测试。

5.如权利要求1所述的方法，其特征在于，故障模型的物理性质被应用以针对对预计可用性的贡献来评估所选的测试。

6.如权利要求5所述的方法，其特征在于，根据按照故障模型的物理性质建立的排序，来执行对另一测试的选择以改进可论证可用性。

7.如权利要求1所述的方法，其特征在于，在没有对一部件标识出任何故障模式的情况下，认为所述可用性目标已被实现。

8.如权利要求1所述的方法，其特征在于，不同的测试被实施，并且组合起来用于计算特定故障模式的风险。

9.如权利要求1所述的方法，其特征在于，步骤f.中对预计可用性的计算是在假设贝塔分布的情况下执行的。

10.如权利要求1所述的方法，其特征在于，在计算出了所述系统的总可用性之后，测试被实际实施，并且因失败的测试而估计是否需要附加的测试或设计改变或其他动作。

11.如权利要求10所述的方法，其特征在于，在实施所计划的测试之后，贡献被实际测试贡献所取代。