CN106571969B - 一种云服务可用性评估方法和系统 - Google Patents

一种云服务可用性评估方法和系统 Download PDF

Info

Publication number
CN106571969B
CN106571969B CN201610995841.XA CN201610995841A CN106571969B CN 106571969 B CN106571969 B CN 106571969B CN 201610995841 A CN201610995841 A CN 201610995841A CN 106571969 B CN106571969 B CN 106571969B
Authority
CN
China
Prior art keywords
software
coefficient
cloud service
failure rate
availability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610995841.XA
Other languages
English (en)
Other versions
CN106571969A (zh
Inventor
郭雪
栗蔚
陈屹力
闫丹
沈滢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Information and Communications Technology CAICT
Original Assignee
China Academy of Telecommunications Research CATR
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Telecommunications Research CATR filed Critical China Academy of Telecommunications Research CATR
Priority to CN201610995841.XA priority Critical patent/CN106571969B/zh
Publication of CN106571969A publication Critical patent/CN106571969A/zh
Application granted granted Critical
Publication of CN106571969B publication Critical patent/CN106571969B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Hardware Redundancy (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种云服务可用性评估方法和系统。用于云服务系统,所述云服务系统包含机房基础设施、服务器、交换机、软件,本发明的系统进行云服务系统的服务器、交换机、软件的故障监测;对云服务系统设定冗余备份后,根据服务器平均故障率和服务器冗余备份数量,计算服务器可用性系数;根据交换机平均故障率和交换机冗余备份数量,计算网络可用性系数;根据软件故障率,计算软件可用性系数;根据云服务系统中机房条件数据和标准化评估方法,得出基础设施可用性系数;最后,根据基础设施可用性系数、服务器可用性系数、网络可用性系数、软件可用性系数计算云服务可用性系数。本发明解决传统的云服务风险评估不完整、且没有可预测性的问题。

Description

一种云服务可用性评估方法和系统
技术领域
本申请涉及计算机技术领域,尤其涉及一种互联网设施可用性评估的的方法和系统。
背景技术
目前云服务涉及的可用性评估方法缺少统一的理论,在进行风险评估时往往根据各家云服务厂商云服务实际运行情况以及故障统计,采用历史数据平均得到云服务月可用性系数,例如月可用性系数=(月总时长-月不可用时长)/月总时长。现有可用性计算方法主要从实际运行情况出发,多根据经验值平均得到,缺少从系统架构角度进行的理论推导过程,无法在事前对云服务的可用性进行整体评估。例如,浪潮提出的云计算系统可用性评估方法(CN201510112060.7),采用事后评估方法,根据故障时间得出云计算系统可用性,缺少从容灾角度分析软硬件等各模块间的可用性。
发明内容
本发明提出一种云服务可用性评估方法和系统,解决云服务事前进行风险评估的需求。
本申请实施例提供一种云服务可用性评估系统,用于云服务系统,所述云服务系统包含机房基础设施、服务器、交换机、软件,包括:第一计算单元、第二计算单元、第三计算单元、第四计算单元、第五计算单元所述第一计算单元,用于根据服务器平均故障率和服务器冗余备份数量,计算服务器可用性系数;所述第二计算单元,用于根据交换机平均故障率和交换机冗余备份数量,计算网络可用性系数;所述第三计算单元,用于根据软件故障率,计算软件可用性系数;所述第四计算单元,用于根据云服务系统中机房条件数据和标准化评估方法,得出基础设施可用性系数;所述第五计算单元,用于计算云服务可用性系数:云服务可用性系数=基础设施可用性系数×服务器可用性系数×网络可用性系数×软件可用性系数。
优选地,本申请的云服务可用性评估系统实施例实施例,包含第一监测单元、第二监测单元、第三监测单元中的至少一个;所述第一监测单元,用于对所述云服务系统中的服务器运行状态进行监测,得到服务器平均故障率;所述第二监测单元,用于对所述云服务系统中的交换机运行状态进行监测,得到交换机平均故障率;所述第三监测单元,用于对所述云服务系统中的软件运行状态进行监测,得到软件故障率。
优选地,本申请的云服务可用性评估系统实施例中,所述交换机为内网交换机;所述第二计算单元还用于接收外网可用性系数;当未向所述第二计算单元输入外网可用性系数时,所述网络可用性系数为内网可用性系数;当向所述第二计算单元输入外网可用性系数后,所述网络可用性系数为所述外网可用性系数和内网可用性系数的乘积。
优选地,本申请实施例提供一种云服务可用性评估系统中,所述云服务系统的软件包含以下软件中的至少一种:虚拟化软件、虚拟化管理软件、集群软件;
优选地,本申请实施例提供一种云服务可用性评估系统中,所述第三监测单元,用于对所述虚拟化软件、虚拟化管理软件、集群软件的运行状态进行监测,得到虚拟化软件故障率、虚拟化管理软件故障率、集群软件故障率;所述第三计算单元,用于根据所述虚拟化软件故障率、虚拟化管理软件故障率、集群软件故障率计算虚拟化软件可用性系数、虚拟化管理软件可用性系数、集群软件可用性系数;并计算所述软件可用性系数:软件可用性系数=虚拟化软件可用性系数×虚拟化管理软件可用性系数×集群软件可用性系数。
进一步优选地,本申请实施例提供一种云服务可用性评估系统中,所述第四计算单元,用于根据机房物理环境等级数据、建筑结构等级数据、电力模块冗余、空调模块冗余、消防模块冗余,根据国际TIA标准,得出基础设施可用性系数。
本申请实施例还提出一种云服务可用性评估方法,包括以下步骤
对云服务系统中的服务器运行状态进行监测,得到服务器平均故障率;
对云服务系统中的交换机运行状态进行监测,得到交换机平均故障率;
对云服务系统中的软件运行状态进行监测,得到软件故障率;
根据所述服务器平均故障率和服务器冗余备份数量,计算服务器可用性系数;
根据所述交换机平均故障率和交换机冗余备份数量,计算网络可用性系数;
根据所述软件故障率,计算软件可用性系数;
根据云服务系统中机房条件数据和标准化评估方法,得出基础设施可用性系数;
根据所述基础设施可用性系数、服务器可用性系数、网络可用性系数和软件可用性系数,计算云服务可用性系数:
云服务可用性系数=基础设施可用性系数×服务器可用性系数×网络可用性系数×软件可用性系数。
优选地,本申请提供的一种云服务可用性评估方法实施例中,所述网络可用性系数为内网可用性系数;或者,所述网络可用性系数为外网可用性系数和内网可用性系数的乘积。
优选地,本申请提供的一种云服务可用性评估方法实施例中,所述云服务系统的软件包含以下软件中的至少一种:虚拟化软件、虚拟化管理软件、集群软件,所数据方法还包含以下步骤:
分别对所述虚拟化软件、虚拟化管理软件、集群软件的运行状态进行监测,得到虚拟化软件故障率、虚拟化管理软件故障率、集群软件故障率;
根据所述虚拟化软件故障率、虚拟化管理软件故障率、集群软件故障率计算虚拟化软件可用性系数、虚拟化管理软件可用性系数、集群软件可用性系数;
所述软件可用性系数为:虚拟化软件可用性系数×虚拟化管理软件可用性系数×集群软件可用性系数。
优选地,本申请云服务可用性评估方法的实施例中,所述机房条件数据包含物理环境等级数据、建筑结构等级数据、电力模块冗余、空调模块冗余、消防模块冗余;根据国际TIA标准,得出基础设施可用性系数。
作为本发明云服务可用性评估方法进一步优化的实施例,其特征在于,所述服务器可用性系数为:1-单台服务器故障率^冗余备份数量
作为本发明云服务可用性评估方法进一步优化的实施例,所述网络可用性系数为:外网可用性系数×内网可用性系数;所述内网可用性系数为:1-单台交换机故障率^冗余备份数量。
本申请实施例采用的上述技术方案能够达到以下有益效果:
本发明的实施例综合考虑系统架构各组成部分,给出整体云服务系统可用性的理论值和预测,能够实现事先评估和自动风险识别。此外,本发明包含冗余设计条件下的风险评估,评估结果相对准确和完整。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明提供的一种云服务可用性评估系统实施例;
图2为本发明云服务可用性评估系统包含第一监测模块的实施例;
图3为本发明云服务可用性评估系统包含第二监测模块的实施例;
图4为本发明云服务可用性评估系统包含第三监测模块的实施例;
图5为本发明提供的一种云服务可用性评估方法实施例。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本发明提出一套完整的云服务可用性评估方法,从系统架构角度出发给出一套完整的计算计算方法,实现事前判断云服务的可用性以及出险概率。
本发明认为,基础设施可用性系数、服务器可用性系数、网络可用性系数、软件可用性系数四个因子均会对整体云服务可用性系数产生影响。各因子之间相互独立,任何一个因子故障均会导致整体不可用,当且仅当四个因子涉及的模块均可正常运转时,整体云服务才可以实现可用。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本发明提供的一种云服务可用性评估系统实施例;
本申请实施例提供一种云服务可用性评估系统,用于云服务系统,所述云服务系统包含机房基础设施、服务器、交换机、软件,包括:第一计算单元10、第二计算单元20、第三计算单元30、第四计算单元40、第五计算单元50;所述第一计算单元,用于根据所述服务器平均故障率和服务器冗余备份数量,计算服务器可用性系数;所述第二计算单元,用于根据所述交换机平均故障率和交换机冗余备份数量,计算网络可用性系数;所述第三计算单元,用于根据所述软件故障率,计算软件可用性系数;所述第四计算单元,用于根据云服务系统中机房条件数据和标准化评估方法,得出基础设施可用性系数;所述第五计算单元,用于计算云服务可用性系数:云服务可用性系数=基础设施可用性系数×服务器可用性系数×网络可用性系数×软件可用性系数。
优选地,本申请的云服务可用性评估系统实施例中,所述交换机为内网交换机;所述第二计算单元还用于接收外网可用性系数;当未向所述第二计算单元输入外网可用性系数时,所述网络可用性系数为内网可用性系数;当向所述第二计算单元输入外网可用性系数后,所述网络可用性系数为所述外网可用性系数和内网可用性系数的乘积。
进一步优选地,本申请实施例提供一种云服务可用性评估系统中,所述第四计算单元,用于根据机房物理环境等级数据、建筑结构等级数据、电力模块冗余、空调模块冗余、消防模块冗余,根据国际TIA标准,得出基础设施可用性系数。
图2为本发明云服务可用性评估系统包含第一监测模块的实施例,用于云服务系统,所述云服务系统包含机房基础设施42、服务器12、交换机22、软件,优选地,本申请的云服务可用性评估系统实施例,包含第一监测单元11;所述第一监测单元,用于对所述云服务系统中的服务器运行状态进行监测,得到服务器平均故障率。
对云服务系统中涉及的所有服务器近半年运行状态进行监测,例如,通过对单台服务器六个月内故障时间和正常运行时间进行统计,得出单台服务器故障率。通过对所有服务器故障率进行平均,得到云服务系统中服务器平均故障率。
单台服务器月故障率=月故障时间/(月故障时间+正常运行时间)。
图3为本发明云服务可用性评估系统包含第二监测模块的实施例,用于云服务系统,所述云服务系统包含机房基础设施42、服务器12、交换机22、软件,优选地,本申请的云服务可用性评估系统实施例,包含第二监测单元21;所述第二监测单元,用于对所述云服务系统中的交换机运行状态进行监测,得到交换机平均故障率。
云服务网络状态与交换机故障概率、运营商提供的网络环境密切相关,为此需要对交换机平均故障率及运营商提供的外网稳定性进行监测。
例如,可以对近半年整个网络环境所涉及的所有交换机运行状态进行监测,通过对单台交互机历史运行数据中故障时间和正常运行时间进行筛查得出单台交换机故障率。对网络环境中所有交换机近半年故障率进行平均及得到云服务网络环境中交换机故障率。
单台交换机月故障率=月故障时间/(月故障时间+正常运行时间)。
图4为本发明云服务可用性评估系统包含第三监测模块的实施例,用于云服务系统,所述云服务系统包含机房基础设施42、服务器12、交换机22、软件,优选地,本申请的云服务可用性评估系统实施例,包含第三监测单元31;所述第三监测单元,用于对所述云服务系统中的软件运行状态进行监测,得到软件故障率。
进一步优选地,本申请实施例提供的云服务可用性评估系统中,所述云服务系统的软件包含以下软件中的至少一种:虚拟化软件、虚拟化管理软件、集群软件;所述第三监测单元31,用于对所述虚拟化软件、虚拟化管理软件、集群软件的运行状态进行监测,得到虚拟化软件故障率、虚拟化管理软件故障率、集群软件故障率;所述第三计算单元30,用于根据所述虚拟化软件故障率、虚拟化管理软件故障率、集群软件故障率计算虚拟化软件可用性系数、虚拟化管理软件可用性系数、集群软件可用性系数;并计算所述软件可用性系数:软件可用性系数=虚拟化软件可用性系数×虚拟化管理软件可用性系数×集群软件可用性系数。
例如,通过对近六个月软件运行状态进行监测,对软件原因导致平台不可用时间进行统计,得出软件故障率。
软件月故障率=每月软件原因导致平台故障时间/(每月软件原因导致平台故障时间+正常运行时间)。
图5为本发明提供的一种云服务可用性评估方法实施例。所述云服务可用性评估方法,包括以下步骤:
步骤100、对云服务系统中的服务器运行状态进行监测,得到服务器平均故障率;根据所述服务器平均故障率和服务器冗余备份数量,计算服务器可用性系数。
服务器可用性系数=1-单台服务器故障率^冗余备份数量(公式1)
需要说明的是,单台服务器故障率的具体数值除了通过历史运行数据平均得到外,还可通过设备供应商承诺的平均无故障时间参数计算,实现事前评估。服务器型号直接影响单台服务器可用性系数、或单个物理服务器故障概率。不同厂商提供的服务器在硬件设计及制作工艺上有所差别,发生故障的理论概论存在差异,
系统架构是云平台的关键技术,双机热备、HA、多活容灾技术可实现服务器高可用,减少单台服务器故障对整体云平台的影响。根据服务器冗余设计情况,计算得到所有冗余服务器同时故障的概率,即得到服务器可用性系数。
步骤200、对云服务系统中的交换机运行状态进行监测,得到交换机平均故障率;根据所述交换机平均故障率和交换机冗余备份数量,计算网络可用性系数。
优选地,所述网络可用性系数为内网可用性系数;或者,所述网络可用性系数为外网可用性系数和内网可用性系数的乘积。本实施例中,当没有外网可用性系数,所述网络可用性系数为内网可用性系数;当有外网可用性系数时,所述网络可用性系数为所述外网可用性系数和内网可用性系数的乘积。
网络可用性系数=外网可用性系数×内网可用性系数 (公式2.1)
内网可用性系数=1-单台交换机故障率^冗余备份数量 (公式2.2)
网络可用性系数和外网可用性系数、交换机型号、单台交换机故障率、网络架构、网络安全直接相关,外网可用性系数与电信运营商直接相关,同时多线BGP技术可提升外网冗余,提高外网可用性。具体外网可用性系数数值由网络服务质量决定、可由网络运营商提供。
需要说明的是,单台交换机故障率的具体数值除了通过历史运行数据平均得到外,还可通过设备供应商承诺的平均无故障时间参数计算,实现事前评估。交换机是影响内网可用性的重要因素,交换机型号及使用环境直接影响单台交换机故障率,不同提供商的交换机理论上可用性存在差异。
网络架构是是影响内网可用性的重要因素,通过交换机堆叠等技术提高交换机冗余度,减少单台交互机故障对内网可用性的影响。根据交换机冗余设计情况,计算得到所有冗余交换机同时故障的概率,即得到内网可用性系数。网络安全防御手段即外部攻击或突发事件的抵御能力,对网络质量及网络可用性会造成影响,网络安全防御手段的评估结果作为整体网络可用性的间接参考项。
步骤300、对云服务系统中的软件运行状态进行监测,得到软件故障率;根据所述软件故障率,计算软件可用性系数。
优选地,所述云服务系统的软件包含以下软件中的至少一种:虚拟化软件、虚拟化管理软件、集群软件,所述方法进一步包含以下步骤:
步骤301、分别对所述虚拟化软件、虚拟化管理软件、集群软件的运行状态进行监测,得到虚拟化软件故障率、虚拟化管理软件故障率、集群软件故障率。
步骤302、根据所述虚拟化软件故障率、虚拟化管理软件故障率、集群软件故障率计算虚拟化软件可用性系数、虚拟化管理软件可用性系数、集群软件可用性系数。
步骤303、软件可用性系数与软件出现bug的频率直接相关,通过对bug出现频率以及软件运行情况监测得出单个软件可用性系数,云平台相关软件可用性系数的乘积即为整体软件可用性系数。
软件可用性系数=虚拟化软件可用性系数
×虚拟化管理软件可用性系数
×集群软件可用性系数 (公式3)
步骤400、根据云服务系统中机房条件数据和标准化评估方法,得出基础设施可用性系数。
优选地,本申请云服务可用性评估方法的实施例中,所述机房条件数据包含物理环境等级数据、建筑结构等级数据、电力模块冗余、空调模块冗余、消防模块冗余;根据国际TIA标准,得出基础设施可用性系数。
具体地,基础设施可用性系数,和机房级别、机房物理位置、机房类别、环境要求、建筑结构、空调、电力、消防、监控、人员情况直接相关,通过对电力、空调、消防等关键模块冗余情况进行分析,参考机房级别(T3:99.982%;T4:99.995%)以及相关机房可靠性评估结果,给出基础设施可用性系数。
基础设施涉及的各个模块2N冗余比N+1冗余更为安全可靠。
步骤500、根据所述基础设施可用性系数、服务器可用性系数、网络可用性系数和软件可用性系数,计算云服务可用性系数。
基础设施可用性系数、服务器可用性系数、网络可用性系数、软件可用性系数四个因子均会对整体云服务可用性系数产生影响。各因子之间相互独立,任何一个因子故障均会导致整体不可用,当且仅当四个因子涉及的模块均可正常运转时,整体云服务才可以实现可用。所以各可用性系数相乘得到整体云平台可用性系数。具体计算公式如下:
云服务可用性系数=基础设施可用性系数
×服务器可用性系数
×网络可用性系数
×软件可用性系数 (公式4)
需要指出的是,关于云服务可用性评估影响因素,本申请首次提出云服务可用性的影响因素,包括基础设施、服务器、网络、软件。四个模块是云服务涉及的关键部分,也是影响云服务可用性的关键因子。四个模块的可用性相互独立,每个模块均可影响整理可用性。
关于云服务可用性评估理论值计算方法,本申请首次提出事前判断云服务可用性的方法,即影响云服务的四个模块基础设施可用性系数、服务器可用性系数、网络可用性系数、软件可用性系数相乘,当且仅当四个模块均可用时,整体云平台才可用。
因此,本申请重点从系统架构角度出发,综合评估数据中心、服务器、网络、软件四个因子对整个云服务系统可用性的影响,从系统设计初始的容灾备份策略出发,计算所有冗余软硬件同时故障的概率,给出整体云平台可用性的理论值。可事前进行预测。通用的云计算可用性计算方法多根据历史运行数据的故障时间进行推导,所以可用性的计算需要系统运行一段时间方可进行,即事后进行评估。而风险评估多需要在事前完成,本申请侧重分析可用性设计的系统架构,从理论推导角度出发,可实现事前评估,满足特定场景(例如投保前风险评估)风险评估要求。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(trans itory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (8)

1.一种云服务可用性评估系统,用于云服务系统,所述云服务系统包含机房基础设施、服务器、交换机、软件,其特征在于,包括:
第一计算单元、第二计算单元、第三计算单元、第四计算单元、第五计算单元;
所述第一计算单元,用于根据服务器平均故障率和服务器冗余备份数量,计算服务器可用性系数;
所述第二计算单元,用于根据交换机平均故障率和交换机冗余备份数量,计算网络可用性系数;
所述第三计算单元,用于根据软件故障率,计算软件可用性系数;
所述第四计算单元,用于根据所述云服务系统中机房条件数据和标准化评估方法,得出基础设施可用性系数;
所述第五计算单元,用于计算云服务可用性系数:
云服务可用性系数=基础设施可用性系数×服务器可用性系数×网络可用性系数×软件可用性系数;
所述交换机为内网交换机;
所述第二计算单元还用于接收外网可用性系数;
当未向所述第二计算单元输入外网可用性系数时,所述网络可用性系数为内网可用性系数;
当向所述第二计算单元输入外网可用性系数后,所述网络可用性系数为所述外网可用性系数和内网可用性系数的乘积。
2.如权利要求1所述云服务可用性评估系统,其特征在于,还包含第一监测单元,第二监测单元,第三监测单元中至少一个;
所述第一监测单元,用于对所述云服务系统中的服务器运行状态进行监测,得到所述服务器平均故障率;
所述第二监测单元,用于对所述云服务系统中的交换机运行状态进行监测,得到所述交换机平均故障率;
所述第三监测单元,用于对所述云服务系统中的软件运行状态进行监测,得到软件故障率。
3.如权利要求2所述云服务可用性评估系统,其特征在于,
所述云服务系统的软件包含以下软件中的至少一种:虚拟化软件、虚拟化管理软件、集群软件;
所述第三监测单元,用于对所述虚拟化软件、虚拟化管理软件、集群软件的运行状态进行监测,得到虚拟化软件故障率、虚拟化管理软件故障率、集群软件故障率;
所述第三计算单元,用于根据所述虚拟化软件故障率、虚拟化管理软件故障率、集群软件故障率计算虚拟化软件可用性系数、虚拟化管理软件可用性系数、集群软件可用性系数;并计算所述软件可用性系数:
软件可用性系数=虚拟化软件可用性系数×虚拟化管理软件可用性系数×集群软件可用性系数。
4.如权利要求1或2所述云服务可用性评估系统,其特征在于,所述第四计算单元,用于根据机房物理环境等级数据、建筑结构等级数据、电力模块冗余、空调模块冗余、消防模块冗余,根据国际TIA标准,得出基础设施可用性概率。
5.一种云服务可用性评估方法,其特征在于,包括以下步骤:
对云服务系统中的服务器运行状态进行监测,得到服务器平均故障率;
对云服务系统中的交换机运行状态进行监测,得到交换机平均故障率;
对云服务系统中的软件运行状态进行监测,得到软件故障率;
根据所述服务器平均故障率和服务器冗余备份数量,计算服务器可用性系数;
根据所述交换机平均故障率和交换机冗余备份数量,计算网络可用性系数;
根据所述软件故障率,计算软件可用性系数;
根据云服务系统中机房条件数据和标准化评估方法,得出基础设施可用性系数;
根据所述基础设施可用性系数、服务器可用性系数、网络可用性系数和软件可用性系数,计算云服务可用性系数:
云服务可用性系数=基础设施可用性系数×服务器可用性系数×网络可用性系数×软件可用性系数;
所述交换机为内网交换机;
当未输入外网可用性系数时,所述网络可用性系数为内网可用性系数;
当输入外网可用性系数后,所述网络可用性系数为所述外网可用性系数和内网可用性系数的乘积。
6.如权利要求5所述云服务可用性评估方法,所述云服务系统的软件包含以下软件中的至少一种:虚拟化软件、虚拟化管理软件、集群软件,其特征在于,还包含以下步骤:
分别对所述虚拟化软件、虚拟化管理软件、集群软件的运行状态进行监测,得到虚拟化软件故障率、虚拟化管理软件故障率、集群软件故障率;
根据所述虚拟化软件故障率、虚拟化管理软件故障率、集群软件故障率计算虚拟化软件可用性系数、虚拟化管理软件可用性系数、集群软件可用性系数;
所述软件可用性系数为:虚拟化软件可用性系数×虚拟化管理软件可用性系数×集群软件可用性系数。
7.如权利要求5所述云服务可用性评估方法,其特征在于,所述机房条件数据包含物理环境等级数据、建筑结构等级数据、电力模块冗余、空调模块冗余、消防模块冗余;根据国际TIA标准,得出基础设施可用性系数。
8.如权利要求5~7任一所述云服务可用性评估方法,其特征在于,
所述服务器可用性系数为:1-单台服务器故障率^冗余备份数量;
所述内网可用性系数为:1-单台交换机故障率^冗余备份数量。
CN201610995841.XA 2016-11-11 2016-11-11 一种云服务可用性评估方法和系统 Active CN106571969B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610995841.XA CN106571969B (zh) 2016-11-11 2016-11-11 一种云服务可用性评估方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610995841.XA CN106571969B (zh) 2016-11-11 2016-11-11 一种云服务可用性评估方法和系统

Publications (2)

Publication Number Publication Date
CN106571969A CN106571969A (zh) 2017-04-19
CN106571969B true CN106571969B (zh) 2019-09-27

Family

ID=58542463

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610995841.XA Active CN106571969B (zh) 2016-11-11 2016-11-11 一种云服务可用性评估方法和系统

Country Status (1)

Country Link
CN (1) CN106571969B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112947843A (zh) * 2019-12-10 2021-06-11 北京金山云网络技术有限公司 存储系统的配置、调度方法、装置及电子设备
CN112351105B (zh) * 2020-11-12 2022-09-16 中国信息通信研究院 一种云服务评估方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104038392A (zh) * 2014-07-04 2014-09-10 云南电网公司 一种云计算资源服务质量评估方法
CN104780075A (zh) * 2015-03-13 2015-07-15 浪潮电子信息产业股份有限公司 一种云计算系统可用性评估方法
CN105337999A (zh) * 2015-12-01 2016-02-17 成都中讯创新信息技术有限公司 一种提高云计算环境稳定性的方法
CN105429952A (zh) * 2015-10-27 2016-03-23 江苏华大网安科技有限公司 面向云计算环境的网络安全评估系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9426029B2 (en) * 2008-11-12 2016-08-23 Teloip Inc. System, apparatus and method for providing improved performance of aggregated/bonded network connections with cloud provisioning

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104038392A (zh) * 2014-07-04 2014-09-10 云南电网公司 一种云计算资源服务质量评估方法
CN104780075A (zh) * 2015-03-13 2015-07-15 浪潮电子信息产业股份有限公司 一种云计算系统可用性评估方法
CN105429952A (zh) * 2015-10-27 2016-03-23 江苏华大网安科技有限公司 面向云计算环境的网络安全评估系统
CN105337999A (zh) * 2015-12-01 2016-02-17 成都中讯创新信息技术有限公司 一种提高云计算环境稳定性的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
云计算系统可用性分析方法初探;陆伟宙,蔡向峰,王晖;《信息通信技术》;20150415;第9卷(第45期);第16-21页 *

Also Published As

Publication number Publication date
CN106571969A (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
Yodo et al. Engineering resilience quantification and system design implications: A literature survey
US20190268283A1 (en) Resource Demand Prediction for Distributed Service Network
US20220075704A1 (en) Perform preemptive identification and reduction of risk of failure in computational systems by training a machine learning module
CN104115077B (zh) 主机代管电气架构
CN104809051B (zh) 用于预测计算机应用中的异常和故障的方法和装置
CN105989155B (zh) 识别风险行为的方法及装置
US6868311B2 (en) Method and system for on-line dynamical screening of electric power system
US20220075676A1 (en) Using a machine learning module to perform preemptive identification and reduction of risk of failure in computational systems
CN104615476B (zh) 用于所选择的虚拟机复制和虚拟机重新启动的方法和系统
US10379146B2 (en) Detecting non-technical losses in electrical networks based on multi-layered statistical techniques from smart meter data
EP2651098A1 (en) Event processing system for an electrical power system
CN103348557B (zh) 现场响应系统
CN109472369A (zh) 电力设备的监测方法及装置
CN106571969B (zh) 一种云服务可用性评估方法和系统
CN103634167B (zh) 云环境中对目标主机进行安全配置检查的方法和系统
US20210184925A1 (en) Model-driven technique for virtual network function rehoming for service chains
CN110415136B (zh) 一种电力调度自动化系统服务能力评估系统与方法
US10656988B1 (en) Active monitoring of packet loss in networks using multiple statistical models
Nijhawan et al. On development of change point based generalized SRGM for software with multiple releases
Rosendo et al. Modeling and analyzing power system failures on cloud services
CN105450751B (zh) 一种提高云计算环境稳定性的系统
Bolodurina et al. Development and research of model for ensuring reliability of operation of network infrastructure objects in cyber-physical system located in the cloud platform
CN105516283B (zh) 一种提高云计算环境稳定性的装置
Babazadeh et al. Resilience of smart integrated energy systems
Khodadadeh Designing a Software Platform for Evaluating Cyber-Attacks on The Electric PowerGrid

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211223

Address after: 100191 No. 40, Haidian District, Beijing, Xueyuan Road

Patentee after: CHINA ACADEMY OF INFORMATION AND COMMUNICATIONS

Address before: 100191 No. 52 Garden North Road, Beijing, Haidian District

Patentee before: CHINA ACADEME OF TELECOMMUNICATION RESEARCH OF MIIT

TR01 Transfer of patent right