CN107220152A - 一种nfv系统可用性测试方法及装置 - Google Patents

一种nfv系统可用性测试方法及装置 Download PDF

Info

Publication number
CN107220152A
CN107220152A CN201710473538.8A CN201710473538A CN107220152A CN 107220152 A CN107220152 A CN 107220152A CN 201710473538 A CN201710473538 A CN 201710473538A CN 107220152 A CN107220152 A CN 107220152A
Authority
CN
China
Prior art keywords
field
replaceable unit
time
test
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710473538.8A
Other languages
English (en)
Inventor
张新秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710473538.8A priority Critical patent/CN107220152A/zh
Publication of CN107220152A publication Critical patent/CN107220152A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种NFV系统可用性测试方法及装置,上述方法包括以下步骤:定系统的可更换部件的冗余度;对所述可更换部件进行平均失效工作时间测评和平均恢复时间测评;根据所述可更换部件的测评结果获取所述系统的可用性评测结果,通过在相对短的时间内对冗余部件进行MTTR测试和MTBF测试,通过MTTR和MTBF的值完成整个系统的可用性测评,不需要长时间在线测测的方法测量全系统可用性指标,解决成本高及测试时间有限的问题。

Description

一种NFV系统可用性测试方法及装置
技术领域
本发明属于计算机领域,尤其涉及一种NFV系统可用性测试方法及装置。
背景技术
NFV,即网络功能虚拟化,是运营商提出并主导的下一代网络构建解决方案,旨在通过使用X86等通用硬件以及虚拟化技术,来承载愈来愈多的移动网络功能软件。
传统的可用性测试技术是通过在线跟踪的方法,将多台同配置的待测系统并行的连续运行相当长一段时间,并记录此间系统的失效个数,而后计算失效系统个数百分比,此百分比即为该段时间内被测系统的可靠度。对于可维修系统,记录各个系统出现故障的时间间隔以及用于恢复故障的时间,计算瓶颈值得到平均故障间隔指标MTTF(mean time tofailure)和平均修复时间指标MTTR(mean time to recover),进而计算稳态可用度。
NFV系统采用容错设计策略,可用性高,造价较高,大批量并行测试成本高,且在线跟踪测试方法测试时间过长。因此,迫切需要提供一种可用性测试方案,解决测试时间有限的问题。
发明内容
本发明提供一种NFV系统可用性测试方法及装置,以解决上述问题。
本发明提供一种NFV系统可用性测试方法。上述方法包括以下步骤:
确定系统的可更换部件的冗余度;
对所述可更换部件进行平均失效工作时间测评和平均恢复时间测评;
根据所述可更换部件的测评结果获取所述系统的可用性评测结果;
其中,所述平均失效工作时间是可更换部件在相继两次失效间运行的平均持续时间,所述平均恢复时间是在可更换部件失效后恢复运行所需要的平均持续时间。
本发明还提供一种NFV系统可用性测试装置,包括:冗余度确定单元,第一测试单元和第二测试单元,其中,所述冗余度确定单元与所述第一测试单元连接,所述第一测试单元与所述第二测试单元连接,
所述冗余度确定单元,用于确定系统的可更换部件的冗余度;
所述第一测试单元,用于对所述可更换部件进行平均失效工作时间测评和平均恢复时间测评;
所述第二测试单元,用于根据所述可更换部件的测评结果获取所述系统的可用性评测结果;
其中,所述平均失效工作时间是可更换部件在相继两次失效间运行的平均持续时间,所述平均恢复时间是在可更换部件失效后恢复运行所需要的平均持续时间。
通过以下方案:确定系统的可更换部件的冗余度,对所述更换部件进行平均失效工作时间测评和平均恢复时间测评,根据可更换部件的测评结果获取系统的可用性评测结果可,通过在相对短的时间内对冗余部件进行MTTR测试和MTBF测试,通过MTTR和MTBF的值完成整个系统的可用性测评,不需要长时间在线测测的方法测量全系统可用性指标,解决成本高及测试时间有限的问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1所示为本发明实施例1的NFV系统可用性测试方法处理流程图;
图2所示为本发明实施例2的NFV系统可用性测试方法处理流程图;
图3所示为本发明实施例4的NFV系统可用性测试装置结构图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
图1所示为本发明实施例1的NFV系统可用性测试方法处理流程图,包括以下步骤:
步骤102:确定系统的可更换部件的冗余度。
步骤104:对所述可更换部件进行平均失效工作时间测评和平均恢复时间测评。
步骤106:根据所述可更换部件的测评结果获取所述系统的可用性评测结果。
其中,所述平均失效工作时间(MTBF)是可更换部件在相继两次失效间运行的平均持续时间,所述平均恢复时间(MTTR)是在可更换部件失效后恢复运行所需要的平均持续时间。
平均失效工作时间MTBF(mean time between failure),在给定条件下,功能单元相继两次失效间运行的平均持续时间。
平均恢复时间MTTR(mean time to recovery),对于给定的功能单元,失效后恢复运行所需要的平均持续时间。
对于NFV冗余系统,若其冗余部件的MTTR和MTBF可以通过测试获得,则可通过在相对短的时间内对冗余部件进行MTTR测试和MTBF测试,通过MTTR和MTBF的值完成整个系统的可用性测评,不需要长时间在线测试的方法测量全系统可用性指标。
进一步地,所述平均恢复时间包括更换时间和服务能力恢复时间。
进一步地,所述平均失效工作时间MEBF的计算方式是MEBF=nT/f,其中,n是所述可更换部件的数量,T是预设测试时间段,f是在所述测试时间段内发生故障的可更换部件的数量。
进一步地,确定系统的可更换部件,包括:
通过故障注入手段验证所述系统对于给定故障集的隔离能力,以将目标系统划分为多个能够隔离故障、且不相关的功能子系统;
确定所述功能子系统中的可更换部件的冗余度,所述冗余度包括所述可更换部件的数量以及可接受的可更换部件的失效个数。
进一步地,根据所述可更换部件的测评结果获取所述系统的可用性评测结果,包括:
根据所述可更换部件的测评结果获取各功能子系统的可用性数据;
根据所述各功能子系统的可用性数据获取所述系统的可用性评测结果。
图2所示为本发明实施例2的NFV系统可用性测试方法处理流程图。
如图2所示,步骤202,考察目标系统的体系结构。通过故障注入等手段验证测试目标系统对于给定故障集的隔离能力,从而将目标系统划分为若干个能够隔离故障、且不相关的功能子系统。
步骤204,测试功能子系统内部现场可更换部件FRU的冗余度。将故障注入方法和负载压力相结合,测试上述划分的功能子系统内部FRU部件的冗余度,即测试维持某个功能子系统正常工作所需要的FRU部件个数以及该功能子系统可以容忍的FRU部件失效个数。
前两步完成后得到各功能子系统可靠性框图。
步骤206,进行部件MTTR测试。MTTR测试包括两类:更换时间和服务能力恢复时间。某些FRU部件如风扇、电源等发生失效只改变系统运行的环境,并不会影响系统对外的服务能力,测试其更换时间即可。另一些部件如计算节点板、IO箱等发生失效时将会很可能降低系统对外的服务能力,因此针对这部分FRU部件的MTTR测试不仅需要测试其更换时间,还需要测试FRU部件失效降低了系统的对外服务能力后,经过多长时间才能使得系统服务能力恢复至正常水平。
进行部件MTBF验证测试。对于某类FRU,假设其MTBF阈值表示为minMTBF,系统中该类FRU总数为n,令定时截尾试验的时长为T≥minMTBF,相当于单个FRU进行了总测试时长为nT的测试,测试时段内FRU发生故障的个数记为f,则该类FRU的MEBF为nT/f。
步骤208,根据系统设计特点以及系统维修策略,为各个功能子系统建立可靠性模型,利用步骤206中得到的MTTR和MTBF测试数据,计算各个功能子系统的可用度。
步骤210,最后结合步骤204得到的功能子系统可靠性框图以及步骤208得到各功能子系统的可用度计算得出全系统的可用度。
图3所示为本发明实施例4的NFV系统可用性测试装置结构图。
如图3所示,根据本发明的实施例的一种NFV系统可用性测试装置,包括:冗余度确定单元302,第一测试单元304和第二测试单元306,其中,所述冗余度确定单元302与所述第一测试单元304连接,所述第一测试单元304与所述第二测试单元306连接,
所述冗余度确定单元302,用于确定系统的可更换部件的冗余度;
所述第一测试单元304,用于对所述可更换部件进行平均失效工作时间测评和平均恢复时间测评;
所述第二测试单元306,用于根据所述可更换部件的测评结果获取所述系统的可用性评测结果;
其中,所述平均失效工作时间是可更换部件在相继两次失效间运行的平均持续时间,所述平均恢复时间是在可更换部件失效后恢复运行所需要的平均持续时间。
进一步地,所述平均恢复时间包括更换时间和服务能力恢复时间。
进一步地,所述平均失效工作时间MEBF的计算方式是MEBF=nT/f,其中,n是所述可更换部件的数量,T是预设测试时间段,f是在所述测试时间段内发生故障的可更换部件的数量。
进一步地,所述冗余度确定单元302通过故障注入手段验证所述系统对于给定故障集的隔离能力,以将目标系统划分为多个能够隔离故障、且不相关的功能子系统,以及确定所述功能子系统中的可更换部件的冗余度,所述冗余度包括所述可更换部件的数量以及可接受的可更换部件的失效个数。
进一步地,所述第二测试单元306还用于根据所述可更换部件的测评结果获取各功能子系统的可用性数据,以及根据所述各功能子系统的可用性数据获取所述系统的可用性评测结果。
通过以下方案:确定系统的可更换部件的冗余度,对所述更换部件进行平均失效工作时间测评和平均恢复时间测评,根据可更换部件的测评结果获取系统的可用性评测结果可,通过在相对短的时间内对冗余部件进行MTTR测试和MTBF测试,通过MTTR和MTBF的值完成整个系统的可用性测评,不需要长时间在线测测的方法测量全系统可用性指标,解决成本高及测试时间有限的问题。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种NFV系统可用性测试方法,其特征在于,包括以下步骤:
确定系统的可更换部件的冗余度;
对所述可更换部件进行平均失效工作时间测评和平均恢复时间测评;
根据所述可更换部件的测评结果获取所述系统的可用性评测结果;
其中,所述平均失效工作时间是可更换部件在相继两次失效间运行的平均持续时间,所述平均恢复时间是在可更换部件失效后恢复运行所需要的平均持续时间。
2.根据权利要求1所述的方法,其特征在于,所述平均恢复时间包括更换时间和服务能力恢复时间。
3.根据权利要求1所述的方法,其特征在于,所述平均失效工作时间MEBF的计算方式是MEBF=nT/f,其中,n是所述可更换部件的数量,T是预设测试时间段,f是在所述测试时间段内发生故障的可更换部件的数量。
4.根据权利要求1至3中任一项所述的方法,其特征在于,确定系统的可更换部件,包括:
通过故障注入手段验证所述系统对于给定故障集的隔离能力,以将目标系统划分为多个能够隔离故障、且不相关的功能子系统;
确定所述功能子系统中的可更换部件的冗余度,所述冗余度包括所述可更换部件的数量以及可接受的可更换部件的失效个数。
5.根据权利要求4所述的方法,其特征在于,根据所述可更换部件的测评结果获取所述系统的可用性评测结果,包括:
根据所述可更换部件的测评结果获取各功能子系统的可用性数据;
根据所述各功能子系统的可用性数据获取所述系统的可用性评测结果。
6.一种NFV系统可用性测试装置,其特征在于,包括:冗余度确定单元,第一测试单元和第二测试单元,其中,所述冗余度确定单元与所述第一测试单元连接,所述第一测试单元与所述第二测试单元连接,
所述冗余度确定单元,用于确定系统的可更换部件的冗余度;
所述第一测试单元,用于对所述可更换部件进行平均失效工作时间测评和平均恢复时间测评;
所述第二测试单元,用于根据所述可更换部件的测评结果获取所述系统的可用性评测结果;
其中,所述平均失效工作时间是可更换部件在相继两次失效间运行的平均持续时间,所述平均恢复时间是在可更换部件失效后恢复运行所需要的平均持续时间。
7.根据权利要求6所述的装置,其特征在于,所述平均恢复时间包括更换时间和服务能力恢复时间。
8.根据权利要求6所述的装置,其特征在于,所述平均失效工作时间MEBF的计算方式是MEBF=nT/f,其中,n是所述可更换部件的数量,T是预设测试时间段,f是在所述测试时间段内发生故障的可更换部件的数量。
9.根据权利要求6至8中任一项所述的装置,其特征在于,所述冗余度确定单元通过故障注入手段验证所述系统对于给定故障集的隔离能力,以将目标系统划分为多个能够隔离故障、且不相关的功能子系统,以及确定所述功能子系统中的可更换部件的冗余度,所述冗余度包括所述可更换部件的数量以及可接受的可更换部件的失效个数。
10.根据权利要求9所述的装置,其特征在于,所述第二测试单元还用于根据所述可更换部件的测评结果获取各功能子系统的可用性数据,以及根据所述各功能子系统的可用性数据获取所述系统的可用性评测结果。
CN201710473538.8A 2017-06-20 2017-06-20 一种nfv系统可用性测试方法及装置 Pending CN107220152A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710473538.8A CN107220152A (zh) 2017-06-20 2017-06-20 一种nfv系统可用性测试方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710473538.8A CN107220152A (zh) 2017-06-20 2017-06-20 一种nfv系统可用性测试方法及装置

Publications (1)

Publication Number Publication Date
CN107220152A true CN107220152A (zh) 2017-09-29

Family

ID=59950057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710473538.8A Pending CN107220152A (zh) 2017-06-20 2017-06-20 一种nfv系统可用性测试方法及装置

Country Status (1)

Country Link
CN (1) CN107220152A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108833209A (zh) * 2018-06-26 2018-11-16 郑州云海信息技术有限公司 一种云计算系统可用性确定方法及装置
CN113055218A (zh) * 2019-12-29 2021-06-29 中国移动通信集团浙江有限公司 Nfv网络的冗余性评价方法、装置及计算设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222024A (zh) * 2011-08-02 2011-10-19 哈尔滨工业大学 计算机系统可用性建模与评估工具
US20130286871A1 (en) * 2012-04-28 2013-10-31 Eden Rock Communications, Llc Method and system for measuring availability in a communications network
CN104780075A (zh) * 2015-03-13 2015-07-15 浪潮电子信息产业股份有限公司 一种云计算系统可用性评估方法
CN106845820A (zh) * 2017-01-16 2017-06-13 北京航空航天大学 一种基于性能裕量的nfv系统可靠性测评方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222024A (zh) * 2011-08-02 2011-10-19 哈尔滨工业大学 计算机系统可用性建模与评估工具
US20130286871A1 (en) * 2012-04-28 2013-10-31 Eden Rock Communications, Llc Method and system for measuring availability in a communications network
CN104780075A (zh) * 2015-03-13 2015-07-15 浪潮电子信息产业股份有限公司 一种云计算系统可用性评估方法
CN106845820A (zh) * 2017-01-16 2017-06-13 北京航空航天大学 一种基于性能裕量的nfv系统可靠性测评方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冯懿: "复杂计算机系统可用性评测技术研究", 《中国博士学位论文全文数据库信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108833209A (zh) * 2018-06-26 2018-11-16 郑州云海信息技术有限公司 一种云计算系统可用性确定方法及装置
CN113055218A (zh) * 2019-12-29 2021-06-29 中国移动通信集团浙江有限公司 Nfv网络的冗余性评价方法、装置及计算设备
CN113055218B (zh) * 2019-12-29 2022-08-05 中国移动通信集团浙江有限公司 Nfv网络的冗余性评价方法、装置及计算设备

Similar Documents

Publication Publication Date Title
CN100451977C (zh) 检测错误和预报潜在故障的系统以及方法
US8639466B2 (en) Computerised storage system comprising one or more replaceable units for managing testing of one or more replacement units
CN102129372B (zh) 通过事件相关来进行根本原因问题标识
CN104796273A (zh) 一种网络故障根源诊断的方法和装置
CN111104293A (zh) 用于支持盘故障预测的方法、设备和计算机程序产品
CN104583968A (zh) 管理系统及管理程序
CN104731701B (zh) 测试系统及执行测试任务的方法和装置
CN109947585A (zh) Pcie设备故障的处理方法及装置
CN102075368A (zh) 一种业务故障诊断方法、装置和系统
CN107220152A (zh) 一种nfv系统可用性测试方法及装置
CN111881014A (zh) 一种系统测试方法、装置、存储介质及电子设备
CN115687951B (zh) 一种混合电子系统的可靠性评估方法及装置
CN108833209A (zh) 一种云计算系统可用性确定方法及装置
US20100251029A1 (en) Implementing self-optimizing ipl diagnostic mode
Assaf et al. Diagnosis based on reliability analysis using monitors and sensors
CN115658373B (zh) 基于服务器的内存处理方法和装置、处理器及电子设备
Chen et al. Design and Evaluation of an Online Anomaly Detector for Distributed Storage Systems.
CN106533824A (zh) 一种给定扰动下的通信网络弹性测评方法
Dilenno et al. Fault tolerance testing in the advanced automation system
US20090055832A1 (en) System, method and computer program product for evaluatng a test of an alternative system
CN115664928A (zh) 一种可解释的基于图的根因定位方法及装置
CN112383462B (zh) 一种网络设备以及总线配置方法
Min et al. Verification of failover effects from distributed control system communication networks in digitalized nuclear power plants
JP5696492B2 (ja) 故障検出装置、故障検出方法、及び、故障検出プログラム
RU2818987C2 (ru) Способ динамического резервирования встроенной системы летательного аппарата

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170929