CN104982008B - 测量可用度的方法及相关装置 - Google Patents

测量可用度的方法及相关装置 Download PDF

Info

Publication number
CN104982008B
CN104982008B CN201380000421.8A CN201380000421A CN104982008B CN 104982008 B CN104982008 B CN 104982008B CN 201380000421 A CN201380000421 A CN 201380000421A CN 104982008 B CN104982008 B CN 104982008B
Authority
CN
China
Prior art keywords
equipment
failure
time
availability
year
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380000421.8A
Other languages
English (en)
Other versions
CN104982008A (zh
Inventor
王姗姗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN104982008A publication Critical patent/CN104982008A/zh
Application granted granted Critical
Publication of CN104982008B publication Critical patent/CN104982008B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0695Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种测量可用度的方法,包括:记录设备的故障发生时间及故障恢复时间;根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间;及根据所述设备的年停机时间计算所述设备的可用度。上述的测量可用度的方法通过记录设备的故障发生时间及故障恢复时间,来计算故障持续时间及年停机时间,再根据公式计算设备的可用度,因而记录的信息便于读取且量相对较小,设备的故障时间段明确,换算简单,提高了可用度测量的效率。

Description

测量可用度的方法及相关装置
技术领域
本发明涉及检测技术领域,具体涉及测量可用度的方法及相关装置。
背景技术
随着控制器网元容量和能力的不断增大,越来越多的运营商对无线接入网的可靠性提出关注和质疑,提出重要网元要实现设备运行稳定度查询以满足对设备运维网络整体监控的需求,这使得设备稳定度的度量迫在眉睫。设备稳定度包含可用度和导致设备不稳定的事件两个方面的度量。
目前计算可用度的方法一般是在设备开始投入使用后,通过人工详细记录其正常运行的时间和处于故障期的时间,得到设备的平均故障间隔时间(mean time betweenfailure,简称MTBF)和平均故障修复时间(mean time to repair,简称MTTR),然后根据可用度计算公式,计算该设备的可用度。设备的MTBF和MTTR可以是仅包括系统级的MTBF和MTTR,所谓系统级,就是指考虑设备整体情况;同时也可以包括系统级的MTBF和MTTR和模块级的MTBF和MTTR,所谓模块级,就是指考虑设备中的各模块的情况。可以通过人工记录设备中的各模块的正常运行的时间和处于故障期的时间,得到模块级的MTBF和MTTR,并将这些模块级的MTBF和MTTR按对业务的影响程度取值后再计算入系统级的MTBF和MTTR。如果要计算多台设备的可用度,则需要事先得到所有这些设备的MTBF和MTTR,然后进行累计,再计算可用度。
现有技术由于是人工记录时间,受外界因素影响大。因为设备运行状态的变化,例如出现故障或故障恢复,通常无法被人工立即感知,有一定的滞后性,另外也可能存在一些人为疏忽或不可抗力等因素,这样就使得记录的时间不精确,得到的MTBF和MTTR也不精确,所以,计算得到的可用度不精确,不能真实反映该设备状态。
目前另外一种计算可用度的方法一般是在设备发生工作态和故障态间的状态变换时,设备记录状态变换时间和变换属性,并根据所述记录信息计算出设备的平均故障间隔时间和平均故障修复时间,进而计算得到可用度。该技术需要记录系统和模块的平均故障间隔时间和平均故障修复时间,记录信息量大,设备的故障时间段不明确,换算复杂。
发明内容
本发明实施例提供测量可用度的方法及相关装置,用于精确并高效测量可用度。
本发明第一方面提供一种测量可用度的方法,包括:记录设备的故障发生时间及故障恢复时间;根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间;及根据所述设备的年停机时间计算所述设备的可用度。
在第一种可能的实现方式中,所述记录设备的故障发生时间及故障恢复时间的步骤进一步包括:上报所述设备的故障告警,根据所述故障告警记录所述设备的故障发生时间及故障恢复时间。
结合第一种可能的实现方式,在第二种可能的实现方式中,所述根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤进一步包括:将所述设备的故障发生时间与故障恢复时间相减计算所述设备的故障持续时间;汇总所述设备的故障持续时间,得到所述设备的年停机时间。
结合本发明的第一方面或第一方面的第一种可能的实现方式或第二种可能的实现方式,在第三种可能的实现方式中,在所述根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤之前还包括:记录所述设备的模块的故障发生时间及故障恢复时间;根据所述模块的故障发生时间及故障恢复时间计算所述模块的故障持续时间;及根据所述模块的故障影响百分比,将所述模块的故障持续时间折算为所述设备的故障持续时间。
结合第三种可能的实现方式,在第四种可能的实现方式中,所述根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤还包括:根据所述设备的故障发生时间及故障恢复时间及所述折算后的设备的故障持续时间计算所述设备的年停机时间。
结合本发明的第一方面或第一方面的第一种可能的实现方式或第二种可能的实现方式,在第五种可能的实现方式中,在所述根据所述设备的年停机时间计算所述设备的可用度的步骤之前还包括:计算多个设备的年停机时间及所述多个设备的年停机时间总和;及根据所述多个设备的年停机时间总和计算所述多个设备的平均年停机时间。
结合第五种可能的实现方式,在第六种可能的实现方式中,所述根据所述设备的年停机时间计算所述设备的可用度的步骤进一步包括:根据所述多个设备的平均年停机时间计算所述多个设备的可用度或者网络的可用度。
本发明第二方面提供一种测量可用度的装置,包括:
第一记录模块,用于记录与所述测量可用度的装置相连的设备的故障发生时间及故障恢复时间;
第二记录模块,用于记录所述设备的故障恢复时间;
计算模块,用于根据所述设备的故障发生时间及所述设备的故障恢复时间计算所述设备的年停机时间,并根据所述设备的年停机时间计算所述设备的可用度。
在第一种可能的实现方式中,所述装置还包括故障告警模块,用于上报所述设备的故障告警,所述第一记录模块与所述第二记录模块根据所述故障告警模块的故障告警记录所述设备的故障发生时间及所述设备的故障恢复时间。
结合第一种可能的实现方式,在第二种可能的实现方式中,所述计算模块将所述设备的故障发生时间与故障恢复时间相减计算所述设备的故障持续时间,汇总所述设备的故障持续时间,得到所述设备的年停机时间。
结合本发明的第二方面或第二方面的第一种可能的实现方式或第二种可能的实现方式,在第三种可能的实现方式中,所述第一记录模块还用于记录所述设备的模块的故障发生时间,所述第二记录模块还用于记录所述模块的故障恢复时间,所述计算模块还用于根据所述模块的故障发生时间及所述模块的故障恢复时间计算所述模块的故障持续时间,并根据所述模块的故障影响百分比,将所述模块的故障持续时间折算为所述设备的故障持续时间,根据所述设备的故障发生时间及故障恢复时间及所述折算后的设备的故障持续时间计算所述设备的年停机时间。
结合本发明的第二方面或第二方面的第一种可能的实现方式或第二种可能的实现方式,在第四种可能的实现方式中,所述第一记录模块还用于记录与所述测量可用度的装置相连的多个设备的故障发生时间,所述第二记录模块还用于记录所述多个设备的故障恢复时间,所述计算模块还用于计算所述多个设备的年停机时间及所述多个设备的年停机时间总和,根据所述多个设备的年停机时间总和计算所述多个设备的平均年停机时间,及根据所述多个设备的平均年停机时间计算所述多个设备的可用度。
本发明第三方面提供一种计算机存储介质,所述计算机存储介质可存储有程序,该程序执行时包括如权利要求1至7本发明第一方面或第一方面的第一至第六种可能的实现方式中任一种所述的步骤。
本发明第四方面提供一种测量可用度的装置,包括:输入装置、输出装置、存储器和处理器;其中,所述处理器执行如下步骤:记录设备的故障发生时间及故障恢复时间;根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间;及根据所述设备的年停机时间计算所述设备的可用度。
在第一种可能的实现方式中,所述处理器执行的记录设备的故障发生时间及故障恢复时间的步骤进一步包括:上报所述设备的故障告警,根据所述故障告警记录所述设备的故障发生时间及故障恢复时间。
结合第一种可能的实现方式,在第二种可能的实现方式中,所述处理器执行的根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤进一步包括:将所述设备的故障发生时间与故障恢复时间相减计算所述设备的故障持续时间;汇总所述设备的故障持续时间,得到所述设备的年停机时间。
结合本发明的第四方面或第四方面的第一种可能的实现方式或第二种可能的实现方式,在第三种可能的实现方式中,所述处理器在所述根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤之前还执行如下步骤:记录所述设备的模块的故障发生时间及故障恢复时间;根据所述模块的故障发生时间及故障恢复时间计算所述模块的故障持续时间;及根据所述模块的故障影响百分比,将所述模块的故障持续时间折算为所述设备的故障持续时间。
结合第三种可能的实现方式,在第四种可能的实现方式中,所述处理器根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤还包括:根据所述设备的故障发生时间及故障恢复时间及所述折算后的设备的故障持续时间计算所述设备的年停机时间。
结合本发明的第四方面或第四方面的第一种可能的实现方式或第二种可能的实现方式,在第五种可能的实现方式中,所述处理器在所述根据所述设备的年停机时间计算所述设备的可用度的步骤之前还执行如下步骤:计算多个设备的年停机时间及所述多个设备的年停机时间总和;及根据所述多个设备的年停机时间总和计算所述多个设备的平均年停机时间。
结合第五种可能的实现方式,在第六种可能的实现方式中,所述处理器执行的根据所述设备的年停机时间计算所述设备的可用度的步骤进一步包括:根据所述多个设备的平均年停机时间计算所述多个设备的可用度。
上述测量可用度的方法及相关装置中,摒弃了之前通过获取正常运行的时间和处于故障期的时间,得到设备的平均故障间隔时间和平均故障修复时间,然后根据可用度计算公式,计算该设备的可用度的复杂的方法,而是通过记录设备的故障发生时间及故障恢复时间,来计算故障持续时间及年停机时间,再根据公式计算设备的可用度,因而记录的信息便于读取且量相对较小,设备的故障时间段明确,换算简单,提高了可用度测量的效率。
此外,上述测量可用度的方法及相关装置中,因将模块的故障持续时间按设置的模块故障影响百分比折算后,计入设备的年停机时间,从而精确的反映设备的状况,使得计算的设备的可用度更为准确。
另外,上述测量可用度的方法及相关装置中,通过计算多个相同设备的平均年停机时间,从而可计算出该类设备的可用度,使可用度的计算更为准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图;
图1与图2是本发明第一实施例提供的一种测量可用度的方法的流程示意图。
图3是本发明实施例提供的设备故障记录表格的示意图。
图4是本发明第二实施例提供的一种测量可用度的方法的流程示意图。
图5是本发明实施例提供的模块故障记录表格的示意图。
图6是本发明第三实施例提供的一种测量可用度的方法的流程示意图。
图7至图9分别是本发明第一至三实施例提供的一种测量可用度的装置的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,本发明第一实施例提供的一种测量可用度的方法,包括:
S101,记录设备的故障发生时间及故障恢复时间。
设备整体出现故障,将无法提供所需功能,设备进入故障态,上报所述设备的故障告警,根据所述故障告警记录所述设备的故障发生时间及故障恢复时间。在本发明的一些实施例中,设备的故障发生时间是指设备进入故障态的起始时间,设备的故障恢复时间是指设备的故障态结束的时间,也就是设备重新进入运行态的时间。
在本发明的一些实施例中,设备上电,完成初始化后,就投入使用,进入运行态,此时可以设置系统稳定性度量的监控时间段,作为监控周期内的系统的累计运行时间,并记录监控时间段内的故障发生时间及故障恢复时间。
S102,根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间。
在本发明的一些实施例中,步骤S102具体实现过程如图2所示。
首先,S201,将所述设备的故障发生时间与故障恢复时间相减计算所述设备的故障持续时间。
在本发明的一些实施例中,所述设备的故障发生时间与故障恢复时间及所述设备的故障持续时间依次记录在如图3所示的设备故障记录表格中,该表格例如为Excel表格。在本发明的一些实施例中,还记录设备的类型、身份标识、位置信息、故障描述、告警名称及告警原因等。
S202,汇总所述设备的故障持续时间,得到所述设备的年停机时间。
在本发明的一些实施例中,所述设备的年停机时间为一年内的所述故障持续时间的总和,即为图3的表格中一年内的故障持续时间的总和。
S103,根据所述设备的年停机时间计算所述设备的可用度。
在本发明的一些实施例中,用DT代表所述设备的年停机时间(单位为小时),用A代表所述设备的可用度,则A=1-(DT/8760)。
上述的测量可用度的方法摒弃了之前通过获取正常运行的时间和处于故障期的时间,得到设备的平均故障间隔时间和平均故障修复时间,然后根据可用度计算公式,计算该设备的可用度的复杂的方法,而是通过记录设备的故障发生时间及故障恢复时间,来计算故障持续时间及年停机时间,再根据公式计算设备的可用度,因而记录的信息便于读取且量相对较小,设备的故障时间段明确,换算简单,提高了可用度测量的效率。
当设备没有出现整机故障,而是某些局部模块发生故障时,虽然没有达到使整个设备无法工作的程度,但会导致局部业务崩溃,或业务受到部分影响,这时,可用度也是受到影响的,因而也需就模块的故障持续时间,其记录方法同设备的故障记录方法大体一致。参阅图4,本发明第二实施例提供的测量可用度的方法,包括:
S401,记录设备的模块的故障发生时间及故障恢复时间。
设备的模块出现故障,将无法提供所需功能,设备的模块进入故障态,上报所述设备的模块的故障告警,根据所述故障告警记录所述模块的故障发生时间及故障恢复时间。在本发明的一些实施例中,设备的模块的故障发生时间是指设备的模块进入故障态的起始时间,设备的模块的故障恢复时间是指设备的模块的故障态结束的时间,也就是设备的模块重新进入运行态的时间。
S402,根据所述模块的故障发生时间及故障恢复时间计算所述模块的故障持续时间。
在本发明的一些实施例中,将所述模块的故障发生时间与故障恢复时间相减计算所述模块的故障持续时间。
S403,根据所述模块的故障影响百分比,将所述模块的故障持续时间折算为所述设备的故障持续时间。折算后的设备的故障持续时间等于模块的故障持续时间与模块的故障百分比的乘积。
在本发明的一些实施例中,所述模块的故障发生时间与故障恢复时间、所述模块的故障影响百分比及所述模块的故障持续时间依次记录在如图5所示的模块故障记录表格中,该表格例如为Excel表格。在本发明的一些实施例中,还记录模块的类型、身份标识、故障描述、告警名称及告警原因等。在本发明的一些实施例中,所述模块的故障记录表格与所述设备的故障记录表格整合在一起。在本发明的另外一些实施例中,所述模块的故障记录表格与所述设备的故障记录表格分开。
S404,记录设备的故障发生时间及故障恢复时间。步骤S404的实现可参照图1中的步骤S101,此处不再赘述。
S405,根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间。其中,步骤S405具体为根据所述设备的故障发生时间及故障恢复时间及所述折算后的设备的故障持续时间计算所述设备的年停机时间。
首先,将所述设备的故障发生时间与故障恢复时间相减计算所述设备的故障持续时间,然后计算一年内的设备的故障持续时间及一年内的折算后的设备的故障持续时间,将一年内的设备的故障持续时间与一年内的折算后的设备的故障持续时间加总,即得到设备的年停机时间。
S406,根据所述设备的年停机时间计算所述多个设备的可用度或者网络的可用度。
可选的,上述网络为所述多个设备所在的网络。
在本发明的一些实施例中,用DT代表所述设备的年停机时间(单位为小时),用A代表所述设备的可用度,则A=1-(DT/8760)。
上述的测量可用度的方法相对于图1中的测量可用度的方法,因将模块的故障持续时间按设置的模块故障影响百分比折算后,计入设备的年停机时间,从而精确的反映设备的状况,使得计算的设备的可用度更为准确。
在本发明的第三实施例中,参阅图6,有多个相同的设备在网运行,本发明第三实施例提供的测量可用度的方法,包括:
S601,计算多个相同设备的年停机时间及所述多个相同设备的年停机时间总和。
其中,所述多个相同设备的年停机时间的计算可参照图1及图4中设备的年停机时间的计算方法,此处不再赘述。
S602,根据所述多个相同设备的年停机时间总和计算所述多个相同设备的平均年停机时间。将所述多个相同设备的年停机时间总和除以所述多个相同设备的数目,即得到所述多个相同设备的平均年停机时间。
S603,根据所述设备的年停机时间计算所述多个设备的可用度或者网络的可用度。其中,根据所述设备的年停机时间计算所述设备的可用度具体为根据所述多个相同设备的平均年停机时间计算所述多个相同设备的可用度。
上述的测量可用度的方法通过计算多个相同设备的平均年停机时间,从而可计算出该类设备的可用度,使可用度的计算更为准确。
上述所有的故障的记录支持人工手动输入和纠正,支持手动输入设备及模块的故障描述等,以便于区分是否是设备商的问题。
为便于更好的实施本发明实施例的上述方案,下面还提供用于配合实施上述方案的相关装置。
参阅图7,本发明第一实施例提供的测量可用度的装置70,包括第一记录模块700、第二记录模块710及计算模块720。
第一记录模块700,用于记录与所述测量可用度的装置70相连的设备的故障发生时间及故障恢复时间。
第二记录模块710,用于记录所述设备的故障恢复时间。
计算模块720,用于根据所述设备的故障发生时间及所述设备的故障恢复时间计算所述设备的年停机时间,并根据所述设备的年停机时间计算所述设备的可用度。
在本发明的一些实施例中,所述计算模块720将所述设备的故障发生时间与故障恢复时间相减计算所述设备的故障持续时间,汇总所述设备的故障持续时间,得到所述设备的年停机时间。
上述的测量可用度的装置70摒弃了之前通过获取正常运行的时间和处于故障期的时间,得到设备的平均故障间隔时间和平均故障修复时间,然后根据可用度计算公式,计算该设备的可用度的复杂的方法,而是通过记录设备的故障发生时间及故障恢复时间,来计算故障持续时间及年停机时间,再根据公式计算设备的可用度,因而记录的信息便于读取且量相对较小,设备的故障时间段明确,换算简单,提高了可用度测量的效率。
在本发明的一些实施例中,所述第一记录模块700还用于记录所述设备的模块的故障发生时间,所述第二记录模块710还用于记录所述模块的故障恢复时间,所述计算模块720还用于根据所述模块的故障发生时间及所述模块的故障恢复时间计算所述模块的故障持续时间,并根据所述模块的故障影响百分比,将所述模块的故障持续时间折算为所述设备的故障持续时间,根据所述设备的故障发生时间及故障恢复时间及所述折算后的设备的故障持续时间计算所述设备的年停机时间。在本发明的实施例中,因将模块的故障持续时间按设置的模块故障影响百分比折算后,计入设备的年停机时间,从而精确的反映设备的状况,使得计算的设备的可用度更为准确。
在本发明的一些实施例中,所述第一记录模块700还用于记录与所述测量可用度的装置70相连的多个设备的故障发生时间,所述第二记录模块710还用于记录所述多个设备的故障恢复时间,所述计算模块720还用于计算所述多个设备的年停机时间及所述多个设备的年停机时间总和,根据所述多个设备的年停机时间总和计算所述多个设备的平均年停机时间,及根据所述多个设备的平均年停机时间计算所述多个设备的可用度。在本发明的实施例中,通过计算多个相同设备的平均年停机时间,从而可计算出该类设备的可用度,使可用度的计算更为准确。
上述第一记录模块700与第二记录模块710还可接收人工手动输入和纠正,接收手动输入设备及模块的故障描述等,以便于区分是否是设备商的问题。
本实施例的测量可用度的装置70例如可以是服务器、电脑等具有记录及计算功能的装置。
可以理解的是,本实施例的测量可用度的装置70的各功能模块的功能可根据上述方法第一至第三实施例中的方法具体实现,其具体实现过程可参照上述方法第一至第三实施例中的相关描述,此处不再赘述。
参阅图8,本发明第二实施例提供的测量可用度的装置80,包括第一记录模块800、第二记录模块810、计算模块820及故障告警模块830。其中,第一记录模块800、第二记录模块810及计算模块820的功能分别与图7中的第一记录模块700、第二记录模块710及计算模块720相似,此处不再赘述。故障告警模块830用于上报所述设备的故障告警,所述第一记录模块800与所述第二记录模块810根据所述故障告警模块830的故障告警记录所述设备的故障发生时间及所述设备的故障恢复时间。
本发明实施例还提供一种计算机存储介质,其中,所述计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的数据处理方法的部分或全部步骤。
参阅图9,本发明第三实施例还提供一种测量可用度的装置90,包括处理器900、存储器910、输入装置920及输出装置930(宏基站180测量可用度的装置90中的处理器900的数量可以为一个或多个,图9中以一个处理器为例)。在本发明的一些实施例中,输入装置920、输出装置930、存储器910和处理器900可通过总线或其它方式连接,其中,图9中以通过总线连接为例。
其中,处理器900执行如下步骤:
记录设备的故障发生时间及故障恢复时间;
根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间;及
根据所述设备的年停机时间计算所述设备的可用度。
在本发明的一些实施例中,所述处理器900执行的记录设备的故障发生时间及故障恢复时间的步骤进一步包括:上报所述设备的故障告警,根据所述故障告警记录所述设备的故障发生时间及故障恢复时间。
在本发明的一些实施例中,所述处理器900执行的根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤进一步包括:将所述设备的故障发生时间与故障恢复时间相减计算所述设备的故障持续时间;汇总所述设备的故障持续时间,得到所述设备的年停机时间。
在本发明的一些实施例中,所述处理器900在所述根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤之前还执行如下步骤:记录所述设备的模块的故障发生时间及故障恢复时间;根据所述模块的故障发生时间及故障恢复时间计算所述模块的故障持续时间;及根据所述模块的故障影响百分比,将所述模块的故障持续时间折算为所述设备的故障持续时间。
在本发明的一些实施例中,所述处理器900根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤还包括:根据所述设备的故障发生时间及故障恢复时间及所述折算后的设备的故障持续时间计算所述设备的年停机时间。
在本发明的一些实施例中,所述处理器900在所述根据所述设备的年停机时间计算所述设备的可用度的步骤之前还执行如下步骤:计算多个设备的年停机时间及所述多个设备的年停机时间总和;及根据所述多个设备的年停机时间总和计算所述多个设备的平均年停机时间。
在本发明的一些实施例中,所述处理器900执行的根据所述设备的年停机时间计算所述设备的可用度的步骤进一步包括:根据所述多个设备的平均年停机时间计算所述多个设备的可用度或者网络的可用度。
本实施例的测量可用度的装置90例如可以是电脑、服务器等具有记录及计算功能的装置。
可以理解的是,本实施例的测量可用度的装置90的各功能模块的功能可根据上述方法第一至第三实施例中的方法具体实现,其具体实现过程可参照上述方法第一至第三实施例中的相关描述,此处不再赘述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
综上,本发明第一实施例的测量可用度的方法及相关装置中,摒弃了之前通过获取正常运行的时间和处于故障期的时间,得到设备的平均故障间隔时间和平均故障修复时间,然后根据可用度计算公式,计算该设备的可用度的复杂的方法,而是通过记录设备的故障发生时间及故障恢复时间,来计算故障持续时间及年停机时间,再根据公式计算设备的可用度,因而记录的信息便于读取且量相对较小,设备的故障时间段明确,换算简单,提高了可用度测量的效率。
本发明第二实施例的测量可用度的方法及相关装置中,相对于第一实施例中的测量可用度的方法,因将模块的故障持续时间按设置的模块故障影响百分比折算后,计入设备的年停机时间,从而精确的反映设备的状况,使得计算的设备的可用度更为准确。
本发明第三实施例的测量可用度的方法及相关装置中,通过计算多个相同设备的平均年停机时间,从而可计算出该类设备的可用度,使可用度的计算更为准确。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质例如可以包括:只读存储器、随机存储器、磁盘或光盘等。
以上对本发明实施例所提供的测量可用度的方法和相关装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均有改变之处,综上,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种测量可用度的方法,其特征在于,包括:
记录设备的故障发生时间及故障恢复时间;
根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间;
根据所述设备的年停机时间计算所述设备的可用度;
所述根据所述设备的年停机时间计算所述设备的可用度,包括以下公式:
A=1-(DT/8760),所述A为所述设备的可用度,所述DT为所述设备的年停机时间;
在所述根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤之前还包括:
记录所述设备的模块的故障发生时间及故障恢复时间;
根据所述模块的故障发生时间及故障恢复时间计算所述模块的故障持续时间;及
根据所述模块的故障影响百分比,将所述模块的故障持续时间折算为所述设备的故障持续时间;
所述根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤还包括:
根据所述设备的故障发生时间及故障恢复时间及所述折算后的设备的故障持续时间计算所述设备的年停机时间。
2.如权利要求1所述的测量可用度的方法,其特征在于,所述记录设备的故障发生时间及故障恢复时间的步骤进一步包括:
上报所述设备的故障告警,根据所述故障告警记录所述设备的故障发生时间及故障恢复时间。
3.如权利要求2所述的测量可用度的方法,其特征在于,所述根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤进一步包括:
将所述设备的故障发生时间与故障恢复时间相减计算所述设备的故障持续时间;
汇总所述设备的故障持续时间,得到所述设备的年停机时间。
4.如权利要求1至3任一项所述的测量可用度的方法,其特征在于,在所述根据所述设备的年停机时间计算所述设备的可用度的步骤之前还包括:
计算多个设备的年停机时间及所述多个设备的年停机时间总和;及
根据所述多个设备的年停机时间总和计算所述多个设备的平均年停机时间。
5.如权利要求4所述的测量可用度的方法,其特征在于,所述根据所述设备的年停机时间计算所述设备的可用度的步骤进一步包括:
根据所述多个设备的平均年停机时间计算所述多个设备的可用度或者网络的可用度。
6.一种测量可用度的装置,其特征在于,包括:
第一记录模块,用于记录与所述测量可用度的装置相连的设备的故障发生时间及故障恢复时间;
第二记录模块,用于记录所述设备的故障恢复时间;
计算模块,用于根据所述设备的故障发生时间及所述设备的故障恢复时间计算所述设备的年停机时间,并根据所述设备的年停机时间计算所述设备的可用度;
其中,所述计算模块根据所述设备的年停机时间计算所述设备的可用度,包括以下公式:
A=1-(DT/8760),所述A为所述设备的可用度,所述DT为所述设备的年停机时间;
所述第一记录模块还用于记录所述设备的模块的故障发生时间,所述第二记录模块还用于记录所述模块的故障恢复时间,所述计算模块还用于根据所述模块的故障发生时间及所述模块的故障恢复时间计算所述模块的故障持续时间,并根据所述模块的故障影响百分比,将所述模块的故障持续时间折算为所述设备的故障持续时间,根据所述设备的故障发生时间及故障恢复时间及所述折算后的设备的故障持续时间计算所述设备的年停机时间。
7.如权利要求6所述的装置,其特征在于,还包括故障告警模块,用于上报所述设备的故障告警,所述第一记录模块与所述第二记录模块根据所述故障告警模块的故障告警记录所述设备的故障发生时间及所述设备的故障恢复时间。
8.如权利要求7所述的装置,其特征在于,所述计算模块将所述设备的故障发生时间与故障恢复时间相减计算所述设备的故障持续时间,汇总所述设备的故障持续时间,得到所述设备的年停机时间。
9.如权利要求6至8任一项所述的装置,其特征在于,所述第一记录模块还用于记录与所述测量可用度的装置相连的多个设备的故障发生时间,所述第二记录模块还用于记录所述多个设备的故障恢复时间,所述计算模块还用于计算所述多个设备的年停机时间及所述多个设备的年停机时间总和,根据所述多个设备的年停机时间总和计算所述多个设备的平均年停机时间,及根据所述多个设备的平均年停机时间计算所述多个设备的可用度。
10.一种计算机存储介质,其特征在于,
所述计算机存储介质存储有程序,该程序在计算机上运行时,使得所述计算机执行如权利要求1至5任一项所述的方法。
11.一种测量可用度的装置,其特征在于,包括:输入装置、输出装置、存储器和处理器;
其中,所述处理器执行如下步骤:
记录设备的故障发生时间及故障恢复时间;
根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间;
根据所述设备的年停机时间计算所述设备的可用度;
所述根据所述设备的年停机时间计算所述设备的可用度,包括以下公式:
A=1-(DT/8760),所述A为所述设备的可用度,所述DT为所述设备的年停机时间;
所述处理器在所述根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤之前还执行如下步骤:
记录所述设备的模块的故障发生时间及故障恢复时间;
根据所述模块的故障发生时间及故障恢复时间计算所述模块的故障持续时间;及
根据所述模块的故障影响百分比,将所述模块的故障持续时间折算为所述设备的故障持续时间;
所述处理器根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤还包括:
根据所述设备的故障发生时间及故障恢复时间及所述折算后的设备的故障持续时间计算所述设备的年停机时间。
12.如权利要求11所述的装置,其特征在于,所述处理器执行的记录设备的故障发生时间及故障恢复时间的步骤进一步包括:
上报所述设备的故障告警,根据所述故障告警记录所述设备的故障发生时间及故障恢复时间。
13.如权利要求12所述的装置,其特征在于,所述处理器执行的根据所述设备的故障发生时间及故障恢复时间计算所述设备的年停机时间的步骤进一步包括:
将所述设备的故障发生时间与故障恢复时间相减计算所述设备的故障持续时间;
汇总所述设备的故障持续时间,得到所述设备的年停机时间。
14.如权利要求11至13任一项所述的装置,其特征在于,所述处理器在所述根据所述设备的年停机时间计算所述设备的可用度的步骤之前还执行如下步骤:
计算多个设备的年停机时间及所述多个设备的年停机时间总和;及
根据所述多个设备的年停机时间总和计算所述多个设备的平均年停机时间。
15.如权利要求14所述的装置,其特征在于,所述处理器执行的根据所述设备的年停机时间计算所述设备的可用度的步骤进一步包括:
根据所述多个设备的平均年停机时间计算所述多个设备的可用度。
CN201380000421.8A 2013-03-22 2013-03-22 测量可用度的方法及相关装置 Active CN104982008B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013073041 2013-03-22

Publications (2)

Publication Number Publication Date
CN104982008A CN104982008A (zh) 2015-10-14
CN104982008B true CN104982008B (zh) 2019-06-18

Family

ID=54277095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380000421.8A Active CN104982008B (zh) 2013-03-22 2013-03-22 测量可用度的方法及相关装置

Country Status (1)

Country Link
CN (1) CN104982008B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101153830A (zh) * 2006-09-28 2008-04-02 华为技术有限公司 测量可用度的方法、装置及收集端
CN102215141A (zh) * 2010-04-02 2011-10-12 华为技术有限公司 中断测量方法和系统及监控设备
CN102945317A (zh) * 2012-10-26 2013-02-27 华北电力大学 一种考虑软件和人为因素的继电保护装置可靠性评估方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060041881A1 (en) * 2004-08-19 2006-02-23 Adkasthala Bheema P Universal upgrade architecture

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101153830A (zh) * 2006-09-28 2008-04-02 华为技术有限公司 测量可用度的方法、装置及收集端
CN102215141A (zh) * 2010-04-02 2011-10-12 华为技术有限公司 中断测量方法和系统及监控设备
CN102945317A (zh) * 2012-10-26 2013-02-27 华北电力大学 一种考虑软件和人为因素的继电保护装置可靠性评估方法

Also Published As

Publication number Publication date
CN104982008A (zh) 2015-10-14

Similar Documents

Publication Publication Date Title
US9367382B2 (en) Apparatus, method, and program product for calculating abnormality based on degree of correlation destruction
CN102129372B (zh) 通过事件相关来进行根本原因问题标识
JP2019502191A (ja) サービス呼び出し情報処理の方法及びデバイス
CN102567185B (zh) 一种应用服务器的监控方法
CN104796273A (zh) 一种网络故障根源诊断的方法和装置
CN102231673B (zh) 用于监控业务服务器的系统和方法
CN101707632A (zh) 一种动态监控服务器集群性能并实时报警的方法
US20240020215A1 (en) Analyzing large-scale data processing jobs
CN106294065A (zh) 硬盘故障监测方法、装置及系统
CN104166611A (zh) 硬盘温度信息获取装置及方法
CN104572795B (zh) 规则的自动生成和动态更新
CN106789239A (zh) 面向电力业务的信息应用系统故障趋势预测方法及装置
CN102546205B (zh) 一种故障关系生成及故障确定方法及装置
US8850321B2 (en) Cross-domain business service management
CN102541722B (zh) 一种监控服务器内存的方法以及服务器内存监控系统
CN109918354B (zh) 一种基于hdfs的磁盘定位方法、装置、设备及介质
CN109905261A (zh) 故障诊断方法及装置
CN109196458A (zh) 存储系统可用容量计算方法及装置
CN106708648B (zh) 一种文本数据的存储校验方法和系统
CN109271270A (zh) 存储系统中底层硬件的故障排除方法、系统及相关装置
CN104982008B (zh) 测量可用度的方法及相关装置
CN105760284A (zh) 网站性能监控方法及装置
CN110119334A (zh) 一种页面脚本监控方法及装置
CN104348641A (zh) 一种故障的检测方法和故障检测装置
CN106779221A (zh) 面向电力业务的信息应用系统故障趋势信息获取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant