CN101153830A - 测量可用度的方法、装置及收集端 - Google Patents

测量可用度的方法、装置及收集端 Download PDF

Info

Publication number
CN101153830A
CN101153830A CNA2006101523825A CN200610152382A CN101153830A CN 101153830 A CN101153830 A CN 101153830A CN A2006101523825 A CNA2006101523825 A CN A2006101523825A CN 200610152382 A CN200610152382 A CN 200610152382A CN 101153830 A CN101153830 A CN 101153830A
Authority
CN
China
Prior art keywords
time
equipment
availability
module
repair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006101523825A
Other languages
English (en)
Other versions
CN101153830B (zh
Inventor
李夫兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2006101523825A priority Critical patent/CN101153830B/zh
Publication of CN101153830A publication Critical patent/CN101153830A/zh
Application granted granted Critical
Publication of CN101153830B publication Critical patent/CN101153830B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明公开一种测量可用度的方法。该方法为:在设备发生工作态和故障态间的状态变换时,设备记录状态变换时间和变换属性,并根据所述记录信息计算出设备的平均故障间隔时间和平均故障修复时间,进而计算得到可用度。相应的本发明公开一种测量可用度装置及收集端。本发明能够得到关于设备的更精确的可用度,更真实反映设备状态。

Description

测量可用度的方法、装置及收集端
技术领域
本发明涉及检测技术领域,尤其涉及测量可用度的方法、装置及收集端。
背景技术
可用度是衡量设备可靠性、维修性和保障性的指标,其在国标GJB451-1990《可靠性维修性术语》中定义的含义为:在规定的条件下,当任务需要时,装备处于可使用状态的概率。可用度Ai的计算公式如下:
Ai=MTBF/(MTBF+MTTR)
MTBF(mean time between failure)是指平均故障间隔时间,通常用来作为度量设备可靠性的指标;MTTR(mean time to repair)是指平均故障修复时间,通常用来作为度量设备的可维修性的指标。
可见,如果要获得单台设备的可用度,就必须知道该设备的MTBF和MTTR信息;同时,如果要获得多台设备的可用度,就必须知道所有这些设备的MTBF和MTTR信息。
目前计算可用度的方法一般是在设备开始投入使用后,通过人工详细记录其正常运行的时间和处于故障期的时间,得到设备的MTBF和MTTR,然后根据可用度计算公式,计算该设备的可用度。设备的MTBF和MTTR可以是仅包括系统级的MTBF和MTTR,所谓系统级,就是指考虑设备整体情况;同时也可以包括系统级的MTBF和MTTR和模块级的MTBF和MTTR,所谓模块级,就是指考虑设备中的各模块的情况。可以通过人工记录设备中的各模块的正常运行的时间和处于故障期的时间,得到模块级的MTBF和MTTR,并将这些模块级的MTBF和MTTR按对业务的影响程度λ取值后再计算入系统级的MTBF和MTTR。
如果要计算多台设备的可用度,则需要事先得到所有这些设备的MTBF和MTTR,然后进行累计,再计算可用度。
但现有技术由于是人工记录时间,受外界因素影响大。因为设备运行状态的变化,例如出现故障或故障恢复,通常无法被人工立即感知,有一定的滞后性,另外也可能存在一些人为疏忽或不可抗力等因素,这样就使得记录的时间不精确,得到的MTBF和MTTR也不精确,所以,计算得到的可用度不精确,不能真实反映该设备状态。
发明内容
本发明要解决的技术问题是提供测量可用度的方法、装置及收集端,本发明能够得到关于设备的更精确的可用度,更真实反映设备状态。
本发明的目的是通过以下技术方案实现的:
本发明提供一种测量可用度的方法,包括:在设备发生工作态和故障态间的状态变换时,设备记录状态变换时间和变换属性,并根据所述记录信息计算出设备的平均故障间隔时间和平均故障修复时间,进而计算得到可用度。
进一步的,设备处于工作态时,按设置的时间间隔记录当前时间,若设备出现故障由工作态进入故障态时无法记录状态变换时间,则当前时间为故障态起始时间,变换属性为开始故障。
进一步的,在设备的模块发生工作态和故障态间的状态变换时,设备记录模块状态变换时间和变换属性,根据所述记录信息计算出模块的平均故障间隔时间和平均故障修复时间,再分别按设置的模块影响系数取值后计入设备的平均故障间隔时间和平均故障修复时间。
进一步的,包括向设备输入根据业务情况判断出模块故障的状态变换时间和变换属性。
进一步的,包括向设备输入设备或模块从故障态起始时间到开始修复故障所花费时间;以及,计算平均故障修复时间时减去所述花费时间。
进一步的,计算出多台设备的平均故障间隔时间的总和及平均故障修复时间的总和,进而计算得到多台设备的可用度。
相应的,本发明提供一种测量可用度的装置,包括第一记录单元和计算单元;第一记录单元,用于在设备发生工作态和故障态间的状态变换时,记录状态变换时间和变换属性;计算单元,用于根据所述记录信息计算出设备的平均故障间隔时间和平均故障修复时间,进而计算得到可用度。
第一记录单元在设备处于工作态时,按设置的时间间隔记录当前时间,若设备出现故障由工作态进入故障态时第一记录单元无法记录时间,则记录的当前时间为故障态起始时间,变换属性为开始故障。
装置进一步包括第二记录单元,用于在设备的模块发生工作态和故障态间的状态变换时,记录模块状态变换时间和变换属性;以及,计算单元根据所述记录信息计算出模块的平均故障间隔时间和平均故障修复时间,并按设置的模块影响系数取值后计入设备的平均故障间隔时间和平均故障修复时间。
第二记录单元包括记录根据业务情况判断出模块故障并输入的模块状态变换时间和变换属性。
装置进一步包括第三记录单元,用于记录设备或模块从故障态起始时间到开始修复所花费的时间,以及,计算单元计算平均故障修复时间时减去所述花费时间。
装置进一步包括上报单元,用于将记录的状态变换时间和变换属性主动上报给收集端,或者,在收集端下发获取请求后再上报给收集端。
本发明还提供一种测量可用度的收集端,包括收发单元和统计单元;收发单元,用于接收设备主动上报或响应获取请求而上报的由设备在发生工作态和故障态间的状态变换时记录的状态变换时间和变换属性;统计单元,用于根据所述接收信息计算出多台设备的平均故障间隔时间的总和及平均故障修复时间的总和,进而计算得到多台设备的可用度。
以上技术方案可以看出:
首先,现有技术由于人工记录设备处于正常运行的时间和处于故障期的时间,受外界因素影响大,导致得到的可用度不精确,而本发明通过在设备发生工作态和故障态间的状态变换时,设备自行记录状态变换时间和变换属性,避免了外界因素的影响,从而可以得到更精确的MTBF和MTTR,进而得到精确的可用度,真实反映设备状态;
其次,本发明考虑到有些设备在发生故障时,可能无法记录故障的起始时间,则通过在设备处于工作态时,按照一定的时间间隔记录当前时间,那么在设备出现故障而无法记录状态变换时间时,则认为当前时间是故障的起始时间,即故障态起始时间,变换属性为开始故障。
进一步的,本发明中设备自行记录的包括系统级和模块级的状态变换时间和变换属性,更精确反映设备状况,并且在记录模块级状态变换时间和变换属性时,同时可以将某些通过人工判断的故障的相关数据输入设备中进行调整,也使得记录更精确;
更进一步的,本发明考虑到有些情况下占用的时间是不计算进MTTR的,如在设备发生故障或设备中的模块发生故障后维护人员到达现场花费的时间,则可以对设备的记录进行手工调整,使得记录数据更客观;
另外,本发明还可以自动收集多台设备的所记录的数据,进行多台设备可用度的计算。
附图说明
图1是本发明方法总括流程图;
图2是本发明方法实施例一示意图;
图3是本发明方法实施例二示意图;
图4是本发明方法实施例三示意图;
图5是本发明方法实施例四示意图;
图6是本发明方法实施例五示意图;
图7是本发明装置结构示意图;
图8是本发明收集端结构示意图。
具体实施方式
本发明提供一种测量可用度的方法,其核心思想是:在设备发生工作态和故障态间的状态变换时,设备记录状态变换时间和变换属性,并根据所述记录信息计算出设备的平均故障间隔时间和平均故障修复时间,进而计算得到可用度。
本发明中,所谓的工作态和故障态也可以称为被使用态和被闲置态。设备的被使用态是指设备正常运行,可被正常使用的状态;设备的被闲置态是指设备出现故障,无法正常使用的状态。当考虑到设备中的模块时,本发明也将模块状态也分为被使用态和被闲置态。模块的被使用态是指模块正常运行,可被正常使用的状态;模块的被闲置态是指模块出现故障,无法正常使用的状态。
请参阅图1,是本发明方法总括流程图,包括步骤:
A1、设备自动记录状态变换时间和变换属性;
首先考虑系统级的记录方法。
设备上电,完成初始化后,就将真正投入使用,进入“被使用态”,此时的时间记录为MTBF计算的起点,变换属性为“系统开始使用”;
设备出现故障,将无法提供所需功能,进入“被闲置态”,此时的时间可自动记录为MTBF计算的终点,并作为MTTR的起点,变换属性为“系统开始故障”;
出现故障后,设备将重新初始化,或经过一定时间的维修处理后,继续投入使用,重新进入“被使用态”,此时的时间可记录为MTTR的终点,MTBF计算的起点,变换属性为“系统开始使用”。
进一步的,在上述系统级记录方法的基础上可以增加考虑模块级的影响因素。当设备没有出现整机故障,而是某些局部模块发生故障时,虽然没有达到使整个设备无法工作的程度,但会导致局部业务崩溃,或业务受到部分影响,这时,可用度也是受到影响的。在这种情况下,为更准确计算可用度,就需要将模块级的MTTR和MTBF计算考虑进去。所以,增加模块级记录数据,可以更精确反映设备状况。模块级的记录方法与上面类似,在检测到模块状态变换时自动记录状态变换时间和变换属性。
模块进入“被使用态”,此时的时间记录为模块的MTBF计算的起点,变换属性为“模块开始使用”;
模块出现故障,将无法提供所需功能,进入“被闲置态”,此时的时间可自动记录为模块的MTBF计算的终点,并作为模块的MTTR的起点,变换属性为“模块开始故障”。
A2、根据记录信息计算设备的平均故障间隔时间MTBF和平均故障修复时间MTTR;
根据记录的状态变换时间和其反映的状态变换属性,则可计算出MTTR和MTBF。
但模块级的MTTR和MTBF,是不能直接计算进系统级的MTTR和MTBF的,需根据这些模块故障对业务的影响程度λ,将模块级的MTTR和MTBF分别乘以λ得到的结果再计算进去。不同模块的故障,同一模块的不同故障,对业务的影响程度都是不一样的,用户可以事先对所有可能的模块故障类型定义λ,其取值范围小于1。
A3、根据可用度公式将MTTR和MTBF代入计算得到设备的可用度。
将上述步骤得到的设备的平均故障间隔时间MTBF和平均故障修复时间MTTR代入可用度Ai的计算公式:Ai=MTBF/(MTBF+MTTR),则可以得到设备的可用度。
为便于对本发明进一步理解,下面结合具体实施方式对本发明进行更详细介绍。
先介绍实施例一。实施例一只考虑系统级因素。
设备处于“被使用态”和“被闲置态”的变换迁移点时,记录本地时间信息T,作为状态变换时间,并记录迁移的动作属性,即状态变换属性,表示向哪个状态迁移。
请参阅图2,是设备自动记录状态变换时间和迁移动作属性的示意图。图2中,包括时间点T1、T2、T3和T4,T1为设备开始使用时间,即是进入“被使用态”,T2为设备开始故障时间,即是设备由“被使用态”向“被闲置态”变换的迁移点的时间、T3为设备开始使用时间,即是设备由“被闲置态”向“被使用态”变换的迁移点的时间,T4为当前时间。T1到T2是计入MTBF,T2到T3是计入MTTR,T3到T4是计入MTBF。
这些信息记录在设备的非易失存储器中。另外,因为是设备的状态,所以影响度λ均为1。具体这些信息的情况请参阅下面的表1。
  时间   动作属性   影响度λ   记录方式
  T1   系统开始使用   1   自动
  T2   系统开始故障   1   自动
  T3   系统开始使用   1   自动
  T4   系统当前时间   1   自动
表1
根据上述记录信息,则可以计算出系统级的MTTR和MTBF,而计算出MTTR和MTBF后,进一步把MTTR和MTBF代入可用度计算公式则可计算得到可用度Ai。
需要说明的是,上述设备在进入“被闲置态”时,是有能力记录故障的起始时间的。如果设备在进入“被闲置态”时,无法记录故障的起始时间,本发明提供以下方法解决此问题:设备处于“被使用态”过程中,按照一定的时间间隔周期记录当前时间,并且动作属性是“开始故障”,那么在设备出现故障时,如果无法记录,则认为当前时间就是故障的起始时间,并作为计算MTTR的起点。如果设置的时间间隔越小,则故障的起始时间越准确。
以下介绍实施例二。实施例二在实施例一的基础上,考虑了模块故障的影响。
前面描述了设备中的模块故障也会影响可用度,所以模块进入“被使用态”和“被闲置态”的时间,也需要记录,作为计算可用度的依据。如图3所示,模块A在T31时刻出现故障,在T32时刻恢复,故障可以是自动恢复或人工恢复,模块A对系统可用度的影响系数为0.3,而其他时间点T1、T2、T3和T4表示的含义与图2中表示的含义相同。T1为设备开始使用时间,即是进入“被使用态”,T2为设备开始故障时间,即是设备由“被使用态”向“被闲置态”变换的迁移点的时间、T3为设备开始使用时间,即是设备由“被闲置态”向“被使用态”变换的迁移点的时间,T4为当前时间。T1到T2是计入MTBF,T2到T3是计入MTTR,T3到T4是计入MTBF,但T3到T4需考虑模块故障影响,也就是说要将模块级的MTTR和MTBF分别乘以λ得到的结果再计算进去。具体图中模块级的T31到T32是如何计入系统级的T3到T4时间,本发明并不限定,可以采用不同算法进行计算。
这些信息记录在设备的非易失存储器中。具体这些信息的情况请参阅下面的表2。
  时间  动作属性   影响度λ   记录方式
  T1  系统开始使用   1   自动
  T2  系统开始故障   1   自动
  T3  系统开始使用   1   自动
  T31  模块A开始故障   0.3   自动
  T32  模块A开始使用   0.3   自动
  T4  系统当前时间   1   自动
表2
根据上述记录信息,则可以计算出包括系统级和模块级的MTTR和MTBF,而计算出MTTR和MTBF后,进一步把MTTR和MTBF代入可用度计算公式则可计算得到可用度Ai。
以下介绍实施例三。实施例三与上述实施例的区别是包括人工判断模块故障并输入相关数据。
在设备运行中,并不是所有的模块故障设备都可以检测出来,这时候,往往需要人工参与,根据业务是否受到影响,可以人工判断出设备的模块是否出现故障。
如图4所示,T33到T34期间发生的模块B的故障是人工判断出来的,并且T33和T34记录是手工输入的。T33为模块B开始故障时间,T34为模块B故障恢复后开始使用时间。模块B对系统可用度的影响系数为0.2,而模块A对系统可用度的影响系数为0.3,而其他时间点T1、T2、T3、T4、T31和T32表示的含义与图3中表示的含义相同。T1为设备开始使用时间,即是进入“被使用态”,T2为设备开始故障时间,即是设备由“被使用态”向“被闲置态”变换的迁移点的时间、T3为设备开始使用时间,即是设备由“被闲置态”向“被使用态”变换的迁移点的时间,T4为当前时间,T31为模块A开始故障时间,T32为模块A故障恢复后开始使用时间。T1到T2是计入MTBF,T2到T3是计入MTTR,T3到T4是计入MTBF,但T3到T4需考虑模块A和B的故障影响,也就是说要将模块级的MTTR和MTBF分别乘以λ得到的结果再计算进去。具体图中模块级的T31到T32、T33到T34是如何计入系统级的T3到T4时间,本发明并不限定,可以采用不同算法进行计算。
这些信息记录在设备的非易失存储器中。具体这些信息的情况请参阅下面的表3。其中T33和T34记录是手工输入的。
  时间   动作属性   影响度λ   记录方式
  T 1  系统开始使用   1   自动
  T2  系统开始故障   1   自动
  T3  系统开始使用   1   自动
  T31  模块A开始故障   0.3   自动
  T32  模块A开始使用   0.3   自动
  T33  模块B开始故障   0.2   手工
  T34  模块B开始使用   0.2   手工
  T4  系统当前时间   1   自动
表3
根据上述记录信息,则可以计算出包括系统级和模块级的MTTR和MTBF,而计算出MTTR和MTBF后,进一步把MTTR和MTBF代入可用度计算公式则可计算得到可用度Ai。
以下介绍实施例四。实施例四与上述实施例的区别是包括人工对数据进行调整。
在设备发生故障后,或设备中的某个模块发生故障后,到进行修复故障前,某些情况下所占用的时间是不计算进MTTR的,例如维护人员到达现场所花费的时间等,这时,为了更客观的计算出可用度,需要进行人工调整。
如图5所示,设备T2时间发生故障,但维护人员到达现场,真正投入故障处理前,要花费时间t。这时,可以人工调整故障时间,即时间t是需要减去的。而其他时间点T1、T2、T3、T4、T31、T32、T33和T34表示的含义与图4中表示的含义相同。T1为设备开始使用时间,即是进入“被使用态”,T2为设备开始故障时间,即是设备由“被使用态”向“被闲置态”变换的迁移点的时间、T3为设备开始使用时间,即是设备由“被闲置态”向“被使用态”变换的迁移点的时间,T4为当前时间,T31为模块A开始故障时间,T32为模块A故障恢复开始使用时间,T33为模块B开始故障时间,T34为模块B故障恢复开始使用时间。T1到T2是计入MTBF,T2到T3是计入MTTR,T3到T4是计入MTBF,但T3到T4需考虑模块A和B的故障影响,也就是说要将模块级的MTTR和MTBF分别乘以λ得到的结果再计算进去。具体图中模块级的T31到T32、T33到T34是如何计入系统级的T3到T4时间,本发明并不限定,可以采用不同算法进行计算。
这些信息记录在设备的非易失存储器中。具体这些信息的情况请参阅下面的表4。其中的t是手工输入用于时间调整的。
  时间   动作属性   影响度λ   记录方式
  T1   系统开始使用   1   自动
  T2   系统开始故障   1   自动
  t   减少   手工
  T3   系统开始使用   1   自动
  T31   模块A开始故障   0.3   自动
  T32   模块A开始使用   0.3   自动
  T33   模块B开始故障   0.2   手工
  T34   模块B开始使用   0.2   手工
  T4   系统当前时间   1   自动
表4
根据上述记录信息,则可以计算出包括系统级和模块级的MTTR和MTBF,而计算出MTTR和MTBF后,进一步把MTTR和MTBF代入可用度计算公式则可计算得到可用度Ai。
以下介绍实施例五。是关于计算多台设备的可用度的方法。
以上内容都是介绍单台设备如何计算可用度,在实际运用中,可能涉及多台设备可用度的计算。多台设备的MTTR和MTBF,是所有这些设备MTTR和MTBF的总和,所以,为了计算多台设备的可用度,需要获得所有这些设备记录的相关信息,例如设备记录的状态变换时间和变换属性等,然后根据这些信息计算出所有这些设备MTTR和MTBF的总和,进而计算出多台设备的可用度。
为了提高效率,可通过集中管理的方式提取这些设备记录的相关信息。
请参阅图6,是本发明方法实施例五示意图。图中包括设备1、设备2、设备3到设备N,以及收集端。
集中管理方式的一种方式是,各设备主动向收集端上报本设备在状态变换时记录的状态变换时间和变换属性等相关信息,具体各设备记录这些信息的方法与前面实施例介绍的相同,收集端收到各设备上报的信息后,计算出所有这些设备MTTR和MTBF的总和,再进一步把得到的MTTR和MTBF代入可用度计算公式则可计算得到多台设备的可用度Ai。
集中管理方式的另一种方式是,收集端向各设备发送获取设备记录的状态变换时间和变换属性等相关信息的请求,各设备收到请求后向收集端上报本设备在状态变换时记录的状态变换时间和变换属性等相关信息,具体各设备记录这些信息的方法与前面实施例介绍的相同,收集端收到各设备上报的信息后,计算出所有这些设备MTTR和MTBF的总和,再进一步把得到的MTTR和MTBF代入可用度计算公式则可计算得到多台设备的可用度Ai。
以上内容介绍了本发明方法,相应的,本发明提供一种测量可用度的装置。
测量可用度的装置位于设备中。请参阅图7,是本发明测量可用度的装置结构示意图。
该装置包括第一记录单元701和计算单元702。
第一记录单元701用于在设备的正常运行的被使用态和出现故障的被闲置态间发生状态变换时,自动记录状态变换时间和变换属性。设备上电,完成初始化后,就将真正投入使用,进入“被使用态”,此时的时间第一记录单元701将记录为MTBF计算的起点,变换属性为“系统开始使用”;设备出现故障,将无法提供所需功能,进入“被闲置态”,此时的时间第一记录单元701将自动记录为MTBF计算的终点,并作为MTTR的起点,变换属性为“系统开始故障”;出现故障后,设备将重新初始化,或经过一定时间的维修处理后,继续投入使用,重新进入“被使用态”,此时的时间第一记录单元701将记录为MTTR的终点,MTBF计算的起点,变换属性为“系统开始使用”。
计算单元702用于根据第一记录单元701的记录信息计算出设备的平均故障间隔时间MTBF和平均故障修复时间MTTR,进而计算得到可用度。可用度Ai的计算公式为:Ai=MTBF/(MTBF+MTTR)。
第一记录单元701在设备处于被使用态时,按设置的时间间隔记录当前时间,若设备出现故障由被使用态进入被闲置态时第一记录单元701无法记录时间,则记录的当前时间为被闲置态起始时间,变换属性为“系统开始故障”。
可选的,测量可用度的装置可以进一步包括第二记录单元703,用于在设备中的各模块的正常运行的被使用态和出现故障的被闲置态间发生状态变换时,记录模块状态变换时间和变换属性;以及,计算单元702根据所述记录信息计算出模块的模块级MTTR和MTBF,并按设置的模块影响系数λ取值后计入设备系统级的MTTR和MTBF。因为模块级的MTTR和MTBF,是不能直接计算进设备系统级的MTTR和MTBF的,所以需根据这些模块故障对业务的影响程度λ,将模块级的MTTR和MTBF分别乘以λ得到的结果再计算进去。不同模块的故障,同一模块的不同故障,对业务的影响程度都是不一样的,用户可以事先对所有可能的模块故障类型定义λ,其取值范围小于1。
可选的,第二记录单元703记录的模块状态变换时间和变换属性还可以包括根据业务情况由人工判断出模块故障并输入的模块状态变换时间和变换属性。因为在设备运行中,并不是所有的模块故障设备都可以检测出来,这时候,往往需要人工参与,根据业务是否受到影响,可以人工判断出设备的模块是否出现故障,并将相关数据输入到第二记录单元703。
可选的,测量可用度的装置可以进一步包括第三记录单元704,用于记录人工输入的设备或模块从被闲置态起始时间到开始修复所花费的时间,以及,计算单元702计算平均故障修复时间时减去所述花费时间。因为在设备发生故障后,或设备中的某个模块发生故障后,到进行修复故障前,某些情况下所占用的时间是不计算进MTTR的,例如维护人员到达现场所花费的时间等,这时,为了更客观的计算出可用度,需要将这些花费时间输入到第三记录单元704,进行手工调整。
可选的,测量可用度的装置还可以进一步包括上报单元705,用于将记录的关于设备的状态变换时间和变换属性主动上报给收集端,或者,在收集端下发获取请求后再上报给收集端。收集端接收到各设备上报的信息后计算出多台设备的平均故障间隔时间的总和及平均故障修复时间的总和,进而计算得到多台设备的可用度。
相应的,本发明还提供一种测量可用度的收集端,用于计算得到多台设备的可用度。
在实际运用中,可能涉及多台设备可用度的计算。本发明提供的收集端,可以计算多台设备的可用度。多台设备的MTTR和MTBF,是所有这些设备MTTR和MTBF的总和,所以,收集端为了计算多台设备的可用度,需要获得所有这些设备记录的状态变换时间和变换属性等相关信息,然后根据这些信息计算出所有这些设备MTTR和MTBF的总和,进而计算出多台设备的可用度。
请参阅图8是本发明收集端结构示意图。收集端包括收发单元801和统计单元802。
收发单元801接收由设备主动上报的状态变换时间和变换属性等相关信息;或者,收发单元801向各设备发送获取设备记录的状态变换时间和变换属性等相关信息的请求,各设备收到请求后向收集端收发单元801上报本设备记录的状态变换时间和变换属性等相关信息。
统计单元802用于根据收发单元801接收的信息计算出多台设备的平均故障间隔时间MTBF的总和及平均故障修复时间MTTR的总和,再进一步代入可用度计算公式则可计算得到多台设备的可用度Ai。
以上对本发明所提供的测量可用度的方法、装置及收集端进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1.一种测量可用度的方法,其特征在于,包括:
在设备发生工作态和故障态间的状态变换时,设备记录状态变换时间和变换属性,并根据所述记录信息计算出设备的平均故障间隔时间和平均故障修复时间,进而计算得到可用度。
2.根据权利要求1所述的测量可用度的方法,其特征在于:
设备处于工作态时,按设置的时间间隔记录当前时间,若设备出现故障由工作态进入故障态时无法记录状态变换时间,则当前时间为故障态起始时间,变换属性为开始故障。
3.根据权利要求1或2所述的测量可用度的方法,其特征在于:
在设备的模块发生工作态和故障态间的状态变换时,设备记录模块状态变换时间和变换属性,根据所述记录信息计算出模块的平均故障间隔时间和平均故障修复时间,再分别按设置的模块影响系数取值后计入设备的平均故障间隔时间和平均故障修复时间。
4.根据权利要求3所述的测量可用度的方法,其特征在于:
进一步包括向设备输入根据业务情况判断出模块故障的状态变换时间和变换属性。
5.根据权利要求4所述的测量可用度的方法,其特征在于:
进一步包括向设备输入设备或模块从故障态起始时间到开始修复故障所花费时间;
以及,计算平均故障修复时间时减去所述花费时间。
6.根据权利要求5所述的测量可用度的方法,其特征在于:
进一步计算出多台设备的平均故障间隔时间的总和及平均故障修复时间的总和,进而计算得到多台设备的可用度。
7.一种测量可用度的装置,其特征在于:
包括第一记录单元和计算单元;
第一记录单元,用于在设备发生工作态和故障态间的状态变换时,记录状态变换时间和变换属性;
计算单元,用于根据所述记录信息计算出设备的平均故障间隔时间和平均故障修复时间,进而计算得到可用度。
8.根据权利要求7所述的测量可用度的装置,其特征在于:
第一记录单元在设备处于工作态时,按设置的时间间隔记录当前时间,若设备出现故障由工作态进入故障态时第一记录单元无法记录时间,则记录的当前时间为故障态起始时间,变换属性为开始故障。
9.根据权利要求7或8所述的测量可用度的装置,其特征在于:
进一步包括第二记录单元,用于在设备的模块发生工作态和故障态间的状态变换时,记录模块状态变换时间和变换属性;
以及,计算单元根据所述记录信息计算出模块的平均故障间隔时间和平均故障修复时间,并按设置的模块影响系数取值后计入设备的平均故障间隔时间和平均故障修复时间。
10.根据权利要求9所述的测量可用度的装置,其特征在于:
第二记录单元包括记录根据业务情况判断出模块故障并输入的模块状态变换时间和变换属性。
11.根据权利要求10所述的测量可用度的装置,其特征在于:
进一步包括第三记录单元,用于记录设备或模块从故障态起始时间到开始修复所花费的时间,
以及,计算单元计算平均故障修复时间时减去所述花费时间。
12.根据权利要求11所述的测量可用度的装置,其特征在于:
进一步包括上报单元,用于将记录的状态变换时间和变换属性主动上报给收集端,或者,在收集端下发获取请求后再上报给收集端。
13.一种测量可用度的收集端,其特征在于:
包括收发单元和统计单元;
收发单元,用于接收设备主动上报或响应获取请求而上报的由设备在发生工作态和故障态间的状态变换时记录的状态变换时间和变换属性;
统计单元,用于根据所述接收信息计算出多台设备的平均故障间隔时间的总和及平均故障修复时间的总和,进而计算得到多台设备的可用度。
CN2006101523825A 2006-09-28 2006-09-28 测量可用度的方法、装置及收集端 Expired - Fee Related CN101153830B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006101523825A CN101153830B (zh) 2006-09-28 2006-09-28 测量可用度的方法、装置及收集端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006101523825A CN101153830B (zh) 2006-09-28 2006-09-28 测量可用度的方法、装置及收集端

Publications (2)

Publication Number Publication Date
CN101153830A true CN101153830A (zh) 2008-04-02
CN101153830B CN101153830B (zh) 2012-04-25

Family

ID=39255601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006101523825A Expired - Fee Related CN101153830B (zh) 2006-09-28 2006-09-28 测量可用度的方法、装置及收集端

Country Status (1)

Country Link
CN (1) CN101153830B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103178995A (zh) * 2013-02-05 2013-06-26 中国电子科技集团公司电子科学研究院 一种体系化多尺度通信网效能评估方法
CN104982008A (zh) * 2013-03-22 2015-10-14 华为技术有限公司 测量可用度的方法及相关装置
CN105338198A (zh) * 2015-09-24 2016-02-17 携程计算机技术(上海)有限公司 呼叫中心系统的可用性的计算方法
CN106797322A (zh) * 2015-07-30 2017-05-31 华为技术有限公司 一种统计可用度的装置及方法
CN107730776A (zh) * 2017-09-28 2018-02-23 广州御银科技股份有限公司 一种自修正开机率的atm
CN109300076A (zh) * 2018-11-15 2019-02-01 中车株洲电力机车有限公司 一种轨道交通车辆故障数据分析方法
WO2019084850A1 (zh) * 2017-11-01 2019-05-09 日立楼宇技术(广州)有限公司 一种电梯元件参数校准方法、装置、设备及存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103178995A (zh) * 2013-02-05 2013-06-26 中国电子科技集团公司电子科学研究院 一种体系化多尺度通信网效能评估方法
CN103178995B (zh) * 2013-02-05 2016-01-06 中国电子科技集团公司电子科学研究院 一种体系化多尺度通信网效能评估方法
CN104982008A (zh) * 2013-03-22 2015-10-14 华为技术有限公司 测量可用度的方法及相关装置
CN104982008B (zh) * 2013-03-22 2019-06-18 华为技术有限公司 测量可用度的方法及相关装置
CN106797322A (zh) * 2015-07-30 2017-05-31 华为技术有限公司 一种统计可用度的装置及方法
US10547529B2 (en) 2015-07-30 2020-01-28 Huawei Technologies Co., Ltd. Availability counting apparatus and method
CN105338198A (zh) * 2015-09-24 2016-02-17 携程计算机技术(上海)有限公司 呼叫中心系统的可用性的计算方法
CN107730776A (zh) * 2017-09-28 2018-02-23 广州御银科技股份有限公司 一种自修正开机率的atm
CN107730776B (zh) * 2017-09-28 2021-01-19 广州御银科技股份有限公司 一种自修正开机率的atm
WO2019084850A1 (zh) * 2017-11-01 2019-05-09 日立楼宇技术(广州)有限公司 一种电梯元件参数校准方法、装置、设备及存储介质
CN109300076A (zh) * 2018-11-15 2019-02-01 中车株洲电力机车有限公司 一种轨道交通车辆故障数据分析方法

Also Published As

Publication number Publication date
CN101153830B (zh) 2012-04-25

Similar Documents

Publication Publication Date Title
CN101153830B (zh) 测量可用度的方法、装置及收集端
CN109765883B (zh) 配电自动化终端运行状态评价与故障诊断方法
CN110212645B (zh) 一种用电信息采集终端停电事件上报方法及装置
CN104487991A (zh) 使用基于通信的数据审核验收的能量管理
CN108010305B (zh) 一种综合能源管理平台数据采集故障的自诊断方法
CN110209552A (zh) 一种设备管理方法和装置
CN111160791A (zh) 一种基于gbdt算法及因素融合的异常用户识别方法
CN112987696A (zh) 一种区域配电网设备管理平台及其运行方法
CN114154035A (zh) 一种动环监控的数据处理系统
CN111045364B (zh) 一种基于大数据平台的动力环境监控系统辅助决策方法
JP5007247B2 (ja) ジョブ処理システムおよびジョブ管理方法
CN109544827B (zh) 带数据备份装置的收银机及其使用方法
CN110716875A (zh) 一种国产办公环境下基于反馈机制的并发测试方法
US20100214075A1 (en) Apparatus and method for failure management of rfid middleware management system
CN102957202A (zh) 集成型数据记录分析装置及comtrade分文件方法
CN105025179A (zh) 呼叫中心座席的监控方法及系统
CN107622011A (zh) 一种动态日志控制方法及系统
CN101867488A (zh) 一种单板在位信息监测和记录装置和方法
CN111614504A (zh) 基于时间序列和故障树分析的电网调控数据中心业务特性故障定位方法及系统
CN106451791A (zh) 供断电信息检测方法和系统
CN105868409A (zh) 数据采集系统
CN114036911A (zh) 生产批次能源抄录方法、装置、设备及存储介质
CN114647531A (zh) 故障解决方法、故障解决系统、电子设备及存储介质
CN113472068A (zh) 一种海岛微电网远程运维方法、系统及存储介质
CN110618891A (zh) 一种固态硬盘故障在线处理方法及固态硬盘

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120425

Termination date: 20160928

CF01 Termination of patent right due to non-payment of annual fee