CN103516778A - 云计算中基于风险式动态地理定位的服务复制方法和系统 - Google Patents

云计算中基于风险式动态地理定位的服务复制方法和系统 Download PDF

Info

Publication number
CN103516778A
CN103516778A CN201310239140.XA CN201310239140A CN103516778A CN 103516778 A CN103516778 A CN 103516778A CN 201310239140 A CN201310239140 A CN 201310239140A CN 103516778 A CN103516778 A CN 103516778A
Authority
CN
China
Prior art keywords
service
cisp
local calculation
architecture
calculation service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310239140.XA
Other languages
English (en)
Inventor
M·D·德阿桑考
T·M·莱纳尔
K·C·B·斯蒂尔
M·A·S·内托
C·维其拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN103516778A publication Critical patent/CN103516778A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters

Abstract

本发明公开一种云计算中基于风险式动态地理定位的服务复制方法和系统。在分布式计算基础架构中,采用动态资源供应来复制能力和/或服务,以便克服可能的能力和/或服务中断。采用用于天气预测的预测工具、基于数据/服务中心地理定位的风险状况分析和历史数据来提高服务弹性。进一步,对于考虑用于复制的每个局部计算服务,比较中断成本与总复制成本,以便确保以经济高效的方式选择计算基础架构服务提供者。

Description

云计算中基于风险式动态地理定位的服务复制方法和系统
技术领域
本公开涉及云计算中基于风险式动态地理定位的服务复制的方法以及实现该方法的系统。
背景技术
云计算按需提供存储、计算和其它信息技术(IT)服务。多年来,许多组织将其全部或部分应用和服务移动到云中或者采用云解决方案,以便通过根据激增和峰值需求集成计算服务,来提供IT基础架构或者动态调整IT基础架构。
发明内容
在分布式计算基础架构中,采用动态供应资源以复制能力和/或服务,以便克服可能的能力和/或服务中断。采用用于天气预测的预测工具、基于数据/服务中心地理定位的风险状况分析和历史数据来提高服务弹性。进一步,对于考虑用于复制的每个局部计算服务,比较中断成本与总复制成本,以便确保以经济高效的方式选择计算基础架构服务提供者。
根据本公开的一个方面,提供了一种为分布式计算基础架构动态供应资源的方法。所述方法包括在至少一个预测环境事件下,评估不复制至少一个局部计算服务的风险,所述至少一个局部计算服务预计由所述分布式计算基础架构的运营者提供。所述方法进一步包括根据所述风险的评估,确定是否通过将至少一个计算基础架构服务提供者(CISP)添加到所述分布式计算基础架构来复制所述至少一个局部计算服务。此外,所述方法进一步包括如果确定添加选定CISP,则将所述至少一个选定CISP添加到所述分布式计算基础架构。
根据本公开的另一个方面,提供了一种用于为分布式计算基础架构动态供应资源的系统。所述系统包括一个或多个处理器单元,所述一个或多个处理器单元与存储器通信,并被配置为执行一种方法。所述方法包括以下步骤:在至少一个预测环境事件下,评估不复制至少一个局部计算服务的风险,所述至少一个局部计算服务预计由所述分布式计算基础架构的运营者提供。所述方法进一步包括以下步骤:根据所述风险的所述评估,确定是否通过将至少一个计算基础架构服务提供者(CISP)添加到所述分布式计算基础架构来复制所述至少一个局部计算服务。所述方法更进一步包括以下步骤:如果确定添加选定CISP,则将所述至少一个选定CISP添加到所述分布式计算基础架构。
根据本公开的另一个方面,提供了一种用于为分布式计算基础架构动态供应资源的系统。所述系统包括计算资源选择模块,其包括风险分析模块,所述风险分析模块被配置为在至少一个预测环境事件下,评估不复制至少一个局部计算服务的风险,所述至少一个局部计算服务预计由所述分布式计算基础架构的运营者提供;以及被配置为根据所述风险的所述评估,确定是否通过将至少一个计算基础架构服务提供者(CISP)添加到所述分布式计算基础架构来复制所述至少一个局部计算服务。所述系统进一步包括服务复制和计算基础架构分配模块,其被配置为从所述计算资源选择模块接收指令,并且如果所述计算资源选择模块生成用于添加至少一个选定CISP的指令,则将所述至少一个选定CISP添加到所述分布式计算基础架构。
根据本公开的另一个方面,提供了一种用于为分布式计算基础架构动态供应资源的非临时性机器可读数据存储介质,其包含计算机程序。所述计算机程序包括用于执行以下步骤的指令:在至少一个预测环境事件下,评估不复制至少一个局部计算服务的风险,所述至少一个局部计算服务预计由所述分布式计算基础架构的运营者提供。所述计算机程序进一步包括用于以下操作的指令:根据所述风险的评估,确定是否通过将至少一个计算基础架构服务提供者(CISP)添加到所述分布式计算基础架构来复制所述至少一个局部计算服务。此外,所述计算机程序包括用于以下操作的指令:如果确定添加选定CISP,则将所述至少一个选定CISP添加到所述分布式计算基础架构。
附图说明
图1是示出根据本公开的实施例的云计算中基于风险式动态地理定位的服务复制的系统的各种组件的示意图。
图2是示出根据本公开的实施例的云计算中实现基于风险的动态服务复制的方法的各种步骤的流程图。
图3A是根据本公开的实施例的针对每个要被复制的局部计算服务选择计算基础架构服务提供者的流程图的第一部分。
图3B是根据本公开的实施例的针对每个要被复制的局部计算服务选择计算基础架构服务提供者的流程图的第二部分。
图4是示出根据本公开的实施例的云计算基础架构的扩展的示意图。
具体实施方式
如上所述,本公开涉及云计算中基于风险式动态地理定位的服务复制的方法以及实现该方法的系统。现在通过附图详细描述本公开的各方面。附图不一定按比例绘制。
如在此使用的,“云计算”是指将计算硬件、计算软件和/或存储容量作为服务交付给最终接收者的异构共同体。
如在此使用的,“云”是指为了提供云计算服务而采用的全部基础架构的组。
如在此使用的,“基于网格的计算”或“网格计算”是指分布式和并行计算的形式,因此虚拟计算机包括协调操作以执行超大型任务的联网、松散耦合的计算机集群。
如在此使用的,“备选基础架构”是指不属于云的一部分的任何基础架构,针对所述云引用所述备选基础架构。
如在此使用的,“计算服务”可以是云计算能够提供的任何服务。
如在此使用的,“局部计算服务”是在小于全球的地理上有限的区域中提供的计算服务。
从广义上讲,根据本公开的实施例,提供了一种用于在备选基础架构上动态复制分布式计算系统的服务的系统和方法。如在此使用的,分布式计算系统是指包括多个自主计算机的任何系统,这些自主计算机通过计算机网络通信以便实现共同目标。分布式计算系统例如包括基于云和基于网格的计算系统。分布式计算系统的动态服务复制可以补偿和/或减少公司的物理计算基础架构的预测中断导致的损坏。分布式计算系统的动态服务复制可以使用备选计算基础架构技术、环境预测、数据中心地理定位信息和历史数据,以便提高服务可用性和交付性。
根据本公开的一个方面,利用描述分布式计算基础架构的动态供应能力(例如云和网格计算服务),弹性地形成公司的物理基础并将弹性作为服务提供。
为了提供动态供应能力而采用的本公开的一个特性包括风险式服务复制或迁移的分析。
为了提供动态供应而采用的本公开的另一个特性包括使用环境事件预测(例如天气预测)和地理定位信息,以便确定哪里需要复制服务和需要选择计算基础架构服务提供者。对于通常在地理位置发生的自然和人为灾难,该特性可以很有用。其它环境事件预测可以包括但不限于自然现象,例如暴风雨、森林火灾和洪水。这种人为或自然环境事件可以产生中断,这些中断可能使系统的服务不可用或不可达。例如,通信线路和网络连接的中断可以导致系统服务不可用。因为许多环境事件都在地理位置发生,可以通过按需使可能受影响的服务冗余,最小化环境事件的影响。
为了提供动态供应能力而采用的本公开的另一个特性包括使用有关环境事件(例如天气事件)的历史数据和服务需求,以便帮助评估必须将服务复制或迁移到的可能站点(或位置)。
参考图1,示意图示出了根据本公开的实施例的云计算中风险式动态服务复制的系统的各种组件。该系统可以由提供一个或多个云应用服务、云平台服务和/或云基础架构服务的云提供者采用,以便提高云提供者提供的服务的可用性和可靠性。尽管在此针对云计算的情况描述了本公开的实施例,但本公开的实施例也可以应用于采用分布式计算基础架构的任何系统。
该系统可以包括计算资源选择模块(在应用于云计算的实施例中,也被称为“云选择模块”)。计算资源选择模块可以包括服务信息管理模块、可用性预测模块、基础架构监视模块和风险分析模块。其中每一个模块都可以包括一个或多个处理器,所述处理器与存储器通信并被配置为运行编程指令,以便执行模块启用的各种步骤。
进一步,该系统包括服务复制和计算基础架构分配模块,其被配置为从计算资源选择模块接收指令,并将至少一个选定计算基础架构服务提供者(CISP)添加到分布式计算基础架构。在一个实施例中,分布式计算基础架构可以作为云计算基础架构提供,所述云计算基础架构被配置为提供基础架构即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)中的一个或多个。如在此使用的,CISP指以Iaas、PaaS、SaaS或它们的任意组合的形式提供计算基础架构服务的任何服务提供者。CISP可以与分布式计算基础架构的运营者在同一公司中,或者可以是不同于分布式计算架构的运营者的公司。
基础架构即服务是如下云服务模型:其中云提供者提供计算机(作为物理机或虚拟机)、存储、防火墙、负载平衡器和网络。平台即服务是如下云服务模型:其中云提供者提供计算平台和/或解决方案体系,通常包括操作系统、编程语言执行环境、数据库和网络服务器。软件即服务(SaaS)是如下云服务模型:其中云提供者在云中安装并操作应用软件,并且云用户从云客户机访问软件。云提供的各种服务可以由本领域中公知的各种计算设备访问,这些计算设备包括但不限于服务器、笔记本计算机、台式计算机、平板PC和电话。
可以采用图2的流程图中所示的步骤操作图1的系统,以便为分布式计算基础架构动态供应资源。针对图1的系统执行以便实现图2的方法的各种步骤的各种操作,在图1中使用代表相应操作的标号示意性地表示。
计算资源选择模块可以选择位置或基础架构服务,其中采用该模块中的各种模块复制服务。参考图1的操作10和图2的步骤100,计算资源选择模块中的服务信息管理模块被配置为监视有关分布式计算基础架构运营者托管的服务的信息。服务信息管理模块可以接收有关分布式计算基础架构运营者(即,云提供者)的信息、分布式计算基础架构运营者通过至少一个计算基础架构服务提供者(CISP)提供的服务、以及与分布式计算基础架构运营者预计维护的每个服务关联的所需弹性级别。可以将有关服务提供者托管的服务的信息提供给服务信息管理模块作为输入数据。
在一个实施例中,分布式计算基础架构是云计算基础架构。在一个实施例中,分布式计算基础架构运营者通过至少一个计算基础架构服务提供者(CISP)提供的服务可以包括至少一个局部计算服务。如在此使用的,“局部计算服务”是强制运营者在小于全球的地理上有限的区域中提供的服务。地理上有限的区域可以在某个洲、某个国家、某个州或任何地理上定义的区域中。在一个实施例中,至少一个局部计算服务包括云应用服务、云平台服务和云基础架构服务中的至少一个。
参考图1的操作20和图2的步骤200,可用性预测模块被配置为在至少一个预测环境事件下,确定至少一个局部计算服务的可用性。如在此使用的,环境事件是指可以被预测并可以影响分布式计算基础架构提供的局部计算服务的任何自然或人为事件。至少一个预测环境事件可以包括但不限于:天气事件、地热活动(例如,火山爆发)、地质力学活动(例如,地震),或者地热活动导致的自然现象(例如,火山爆发导致的火山灰扩散)或地质力学活动导致的自然现象(例如,地震导致的海啸),以及使分布式计算基础架构的至少一个组件的操作中断的人为事件(例如,战争)。
因为每个局部计算服务被限制在对应的地理上限制的区域中,分析每个预测环境事件以确定对应的影响区域,即,受预测环境事件影响的区域。在一个实施例中,仅当影响区域影响局部计算服务时,可用性预测模块才可以执行计算。如果给出指定预测的环境影响的各种参数的输入,则可用性预测模块可以计算预测的可用性值。
提供环境事件预测作为可用性预测模块的输入。进一步,可用性预测模块可以包括有关环境事件历史数据的数据库或与其通信。有关环境事件历史数据的数据库例如可以包括有关天气条件、季节特征和过去中断的历史信息。采用环境事件预测和有关环境事件历史数据的数据库,可用性预测模块可以提供有关以下影响的预测,所述影响是预测环境事件的影响区域中预测环境事件对分布式计算基础架构和局部计算服务的影响。例如,可用性预测模块可以针对预测环境事件的影响区域中的每个候选计算基础架构(例如云站点或数据中心)和局部计算服务,进行可用性预测。例如,可以根据有关某些天气事件对被考虑区域的信息技术(IT)基础架构的影响的以往经验,获得可用性索引。例如,可以考虑影响特定地理区域的强季节性降雨,以便确定可用性索引。
在一个实施例中,可用性预测模块可以被配置为仅当至少一个局部计算服务的中断的估计概率大于预定义值时,调用风险分析模块的操作。
参考图1的操作30和图2的步骤300,基础架构监视模块被配置为监视有关分布式计算基础架构的可用基础架构的信息。基础架构监视模块可以持续分析分布式计算基础架构中的可用计算基础架构站点的功能参数。例如,可用计算基础架构站点的功能参数可以包括但不限于:计算基础架构站点的吞吐量、计算基础架构站点的利用率、以及计算基础架构站点中的可用资源的容量。可以采用功能参数以选择优于另一个备选结构的备选基础架构,以便在后续步骤(例如,在步骤400和/或500)复制服务。
参考图1的操作40和图2的步骤400,风险分析模块被配置为在至少一个预测环境事件下,评估不复制至少一个局部计算服务的风险,所述至少一个局部计算服务预计由分布式计算基础架构的运营者提供。进一步,风险分析模块被配置为根据风险的评估,确定是否通过将至少一个计算基础架构服务提供者(CISP)添加到分布式计算基础架构来复制至少一个局部计算服务。
例如,在预测的极端天气条件下,计算资源选择模块可以调用风险分析模块,以便评估复制或不复制给定服务的风险。复制的风险包括在复制处理期间产生过多成本的风险。不复制的风险包括分布式计算环境的运营者的服务中断以及随之而来的财务和非财务损失的风险。
参考图1的操作50和图2的步骤500,风险分析模块可以考虑计算基础架构提供者的客户(即,分布式计算基础架构的运营者的客户)的风险因素和状况。可以提供客户的风险因素和状况作为风险分析模块的输入。可以采用客户的风险因素和状况,以便确定风险分析模块执行的分析的风险规避(averseness)程度。可以将中断对客户具有高影响的服务分类为具有高风险规避的服务,可以将中断对客户具有低影响的服务分类为具有低风险规避的服务。可以根据本领域中公知的任何度量测量服务中断对客户的影响,这些度量用于测量客户业务中的中断影响,包括直接和间接的财务损失以及信誉方面的无形损失。例如,除了有关服务不可用性导致的损失的财务估计之外,可以用于测量中断及其对客户业务的影响的度量包括但不限于平均故障间隔时间(MTBF)和平均恢复时间(MTTR)。
在一个实施例中,风险分析模块被配置为确定至少一个局部计算服务的中断对运营者的影响,并通过添加至少一个计算基础架构服务提供者,确定复制至少一个局部计算服务的估计总成本。进一步,风险分析模块可以被配置为确定预计预测环境事件中断至少一个局部计算服务的概率。例如,风险评估技术(通常用于IT安全目的,其中产生的风险取决于威胁、漏洞和资产/服务价值)可以适合于计算将服务集合复制(或不复制)到备选基础架构的风险。在这种情况下,可以将恶劣天气条件因素包括进去作为可能的威胁,其可以危及考虑中的IT基础架构的正常运行。
在一个实施例中,风险分析模块可以被配置为计算不复制局部计算服务的总财务成本的预期值,并比较预期值与复制至少一个局部计算服务的估计总成本。可以采用上述任意方法,以便计算不复制局部计算服务的总财务成本的预期值。
在一个实施例中,风险分析模块可以被配置为在复制至少一个局部计算服务的估计总成本中包括将至少一个计算基础架构服务提供者添加到分布式计算基础架构的成本,以及在至少一个预测环境事件的持续时间内操作至少一个计算基础架构服务提供者的成本。
在一个实施例中,风险分析模块可以被配置为针对至少一个局部计算服务中的每个选定局部计算服务生成可用备选计算基础架构服务提供者(CISP)列表,并针对可用备选CISP列表中的每个可用备选CISP计算复制选定局部计算服务所需的复制时间。进一步,风险分析模块可以被配置为计算由于至少一个预测环境事件引发可能中断之前的估计时间。此外,风险分析模块可以被配置为仅针对复制时间小于引发可能中断之前的估计时间的可用备选CISP,确定复制至少一个局部计算服务的估计总成本。
在一个实施例中,风险分析模块可以被配置为计算至少一个预测环境事件导致的可能中断的估计持续时间。进一步,风险分析模块可以被配置为根据计算的可能中断的估计持续时间,确定复制至少一个局部计算服务的估计总成本。
在一个实施例中,风险分析模块可以被配置为针对至少一个局部计算服务中的每个选定局部计算服务,生成可用备选CISP列表,并计算采用可用备选CISP列表中的备选CISP复制选定局部计算服务的最小总成本。可以根据CISP的地理定位选择可用备选CISP列表,以便列表中的CISP提供的服务不受预测环境事件的影响。
在一个实施例中,风险分析模块可以被配置为通过以下操作计算最小总成本:针对可用备选CISP列表中的每个可用备选CISP,计算采用每个可用备选CISP复制选定局部计算服务的总成本,以及在计算的复制选定局部计算服务的总成本中选择最小值。
在一个实施例中,风险分析模块可以被配置为在将选定局部计算服务复制到考虑中的可用备选CISP的总成本中包括将选定局部计算服务复制到考虑中的可用备选CISP的成本,以及从考虑中的可用备选CISP恢复选定局部计算服务的成本。
在一个实施例中,风险分析模块可以被配置为针对至少一个局部计算服务中的每个选定局部计算服务,根据预定的指定标准或预定的业务约束,生成可用备选CISP的索引列表。进一步,风险分析模块可以被配置为将针对可用备选CISP的索引列表的索引的初始值设置在极值(例如,最小值或最大值),并增加(如果最初将索引设置在最小值)或减少(如果最初将索引设置在最大值)索引,直到发现可用备选CISP或者直到检查可用备选CISP的索引列表中的所有CISP,所述可用备选CISP能够在复制选定局部计算服务的总成本小于不复制局部计算服务的总财务成本的预期值的情况下,提供选定局部计算服务。
在一个实施例中,选择和复制过程考虑候选CISP的定位、将数据和代码从要被复制的云基础架构移动到选定备选基础架构所需的时间、出现中断情况下的估计损失,以及在计划时间内使用提供者的服务产生的成本。
在一个实施例中,计算资源选择模块可以采用一种算法,该算法持续监视有关预测环境事件(例如天气预测)的信息的到达。接收预测环境事件的预测之后,可用性预测模块可以计算该事件导致中断的概率。如果该概率超过预定义阈值(可以由系统管理员指定,或者由系统根据历史数据获得),则风险分析模块可以计算在中断和中断持续时间之前的剩余时间。
随后,针对每个服务和基础架构服务提供者,风险分析模块计算中断、复制和恢复的成本。风险分析模块可以执行分析,以便检查到每个基础架构服务提供者的复制是否在各个方面(包括时间、可靠性、稳健性和成本)是有利的。
参考图3A和3B,根据本公开的实施例的流程图示出了风险分析模块可以用于针对每个要被复制的局部计算服务,选择计算基础架构服务提供者(CISP)的步骤的非限制性实例。在某些实施例中,也可以采用该流程图的变体,其中一个或多个步骤不按顺序执行或被省略。
参考步骤410,可以生成可能受预测环境事件影响的局部计算服务的索引列表。例如,洪水泛滥是过去几年内影响许多人口密集区域(尤其在发展中国家)的条件。根据本公开的实施例,当预测这种事件时,可以确定可能被危及的基础架构列表,并可以确定当前依赖于这种基础架构以便操作的服务列表。列表中的服务可以是复制候选者。
参考步骤412,可以根据有关预测环境事件的性质的预测,计算针对每个局部计算服务的预测引发可能中断之前的估计时间。例如,可以采用可用性预测模块根据预测环境事件的参数(例如,恶劣天气条件的开始或海啸的到达)生成的数据,计算引发可能中断之前的估计时间。
参考步骤414,可以根据针对每个局部计算服务的预测,计算可能中断的估计持续时间。例如,可以采用可用性预测模块根据预测环境事件的参数生成的数据,计算可能中断的估计持续时间。
参考步骤416,可以例如根据公用数据库(例如,电话簿)、被配置为存储有关备选CISP的信息的数据库(未示出)和/或通过手动输入信息,生成可用备选计算基础架构服务提供者(CISP)列表。可以采用本领域中公知的任何算法索引可用CISP列表。
参考步骤418,可以将局部计算服务的索引设置为最小值。备选地,如果可以在后续步骤期间处理受预测环境事件影响的所有局部计算服务,则可以采用任何系统性索引更改方法,以便按照比较总复制成本与不复制的成本(即,每个服务的中断价值)所确定的那样,提供足够的服务复制。
参考步骤425,可以确定是否已经决定复制选定局部计算服务。如果已经确定是否复制对应于当前索引值的局部计算服务,则过程流程继续到步骤426。
在步骤426,确定局部计算服务的索引是否在最大值。如果索引方案采用任何其它算法而不是从最小值增加索引值,则可以确定是否存在尚未针对其确定是否复制局部计算服务的任何局部计算服务。如果索引值在最大值,或者备选地,如果没有尚未针对其确定是否复制局部计算服务的其它局部计算服务,则过程流程继续到步骤499,在该步骤过程流程终止。
如果索引值不在最大值,则过程流程继续到步骤428,在该步骤将局部计算服务的索引值增加到下一值。备选地,如果索引方案采用任何其它算法而不是从最小值增加索引值,则选择尚未针对其确定是否复制局部计算服务的新局部计算服务。
如果尚未确定是否复制对应于当前索引值的局部计算服务,则过程流程从步骤425继续到步骤430。在步骤430,可以计算预期中断持续时间内选定局部计算服务的估计中断成本。例如,这种中断成本可以包括但不限于服务不可用性导致的财务损失,以及提供服务的组织和托管服务的IT基础架构提供者引起的名誉损坏。
参考步骤432,可以根据指定标准或业务约束(例如资源的单位成本、最大资源容量和基础架构利用率),生成CISP的索引列表。一般而言,在迭代托管服务和候选计算基础架构(即,备选CISP)列表之前,可以根据系统管理员指定的一组标准,或者根据预定义编程业务约束,对可用备选CISP列表进行排序。例如,可以按以下各项对可用备选CISP列表进行排序:可用性的降序、成本的升序,或者受考虑中的天气事件影响的增加概率。在步骤432,可以将CISP索引设置为最小值。
参考步骤440,可以针对选定CISP(即,针对与当前CISP索引值对应的CISP),计算采用选定CISP复制选定局部计算服务所需的复制时间。
参考步骤445,比较针对采用选定CISP(对应于当前CISP索引值的CISP)的选定局部计算服务计算的复制时间与引发选定局部计算服务中断的预期时间。可以确定是否具有足够的复制时间,即,针对采用选定CISP的选定局部计算服务计算的复制时间是否小于引发选定局部计算服务中断的预期时间。
如果没有足够的复制时间,则过程流程继续到步骤456,在该步骤确定CISP索引是否在最大值。如果CISP索引不在最大值(即,如果可以增加CISP索引),则过程流程继续到步骤448,在该步骤将CISP索引增加到下一值。过程流程然后继续到步骤440,并具有增加的CISP索引值。
如果在步骤456,CISP索引在最大值,则过程流程继续到步骤459,在该步骤确定不复制选定局部计算服务。过程流程然后继续到步骤466,在该步骤确定局部计算服务的索引是否在最大值。备选地,如果索引方案采用任何其它算法而不是从最小值增加索引值,则可以确定是否存在尚未针对其确定是否复制局部计算服务的任何局部计算服务。
如果在步骤466,确定局部计算服务的索引在最大值(或者针对所有考虑中的局部计算服务决定是否复制局部计算服务),则过程流程然后继续到步骤499,在该步骤过程流程终止。如果步骤466确定局部计算服务的索引不在最大值(或者确定存在针对其决定是否需要复制的至少一个局部计算服务),则过程流程继续到步骤468,在该步骤将局部计算服务的索引增加到下一值。过程流程然后继续到步骤425。
如果在步骤445确定具有足够的复制时间,则过程流程继续到步骤450,在该步骤计算将选定局部计算服务复制到选定CISP的成本。
参考步骤452,可以计算从选定CISP恢复局部计算服务的成本。
将选定局部计算服务复制到考虑中的选定CISP(是可用备选CISP之一)的总成本包括将选定局部计算服务复制到考虑中的选定CISP的成本,以及从考虑中的选定CISP恢复选定局部计算服务的成本。
参考步骤455,比较将选定局部计算服务复制到选定CISP的总成本与分布式计算基础架构运营者的中断成本(即,选定局部计算服务提供者的中断成本)。要指出的是,分布式计算基础架构的运营者可以与选定局部计算服务的客户在同一公司中,也可以不在同一公司中。
如果步骤455确定将选定局部计算服务复制到选定CISP的总成本大于分布式计算基础架构运营者的中断成本,则过程流程继续到步骤456。在步骤456,确定CISP索引是否在最大值(如上所述),并且过程流程继续到步骤448或步骤459,具体取决于CISP索引是否在最大值。
如果步骤455确定将选定局部计算服务复制到选定CISP的总成本小于分布式计算基础架构运营者的中断成本,则过程流程继续到步骤460。
在步骤460,决定将选定局部计算服务复制到选定CISP。过程流程然后继续到步骤466,在该步骤确定局部计算服务的索引是否在最大值(或者针对所有考虑中的局部计算服务决定是否复制局部计算服务),如上所述。根据局部计算服务的索引是否在最大值,过程流程继续到步骤468或步骤499。
参考图1的操作60和图2的步骤600,风险分析模块可以被配置为,如果预期值大于复制至少一个局部设备的估计总成本,则通过有线或无线通信,指示服务复制和计算基础架构分配模块复制至少一个局部计算服务。进一步,风险分析模块可以被配置为,如果预期值小于复制至少一个局部计算服务的估计总成本,则通过有线或无线通信,指示服务复制和计算基础架构分配模块不复制至少一个局部计算服务。
如果满足复制服务的条件,则风险分析模块可以导致服务复制和计算基础架构分配模块执行对应的复制操作。具体地说,可以将有关哪里需要复制哪些服务的信息(如云选择模块所确定的)传递到服务复制和计算基础架构分配模块。例如,可以收集在图3B的步骤460和步骤466进行的确定并将其转送到服务复制和计算基础架构分配模块。
参考图1的操作70和图2的步骤700,服务复制和计算基础架构分配模块可以在计算基础架构站点上分配资源以执行复制。具体地说,服务复制和计算基础架构分配模块可以被配置为从计算资源选择模块接收指令,并且,如果计算资源选择模块生成用于添加至少一个选定CISP的指令,则将至少一个选定CISP添加到分布式计算基础架构。至少一个局部计算服务可以包括分布式计算基础架构能够提供的任何服务,包括但不限于:云应用服务、云平台服务和云基础架构服务。如上所讨论的,云客户机可以包括但不限于服务器、笔记本计算机、台式计算机、电话和平板PC。
参考图4,示意图示出了根据本公开的实施例的云基础架构的扩展。云(由一组双实线示出)可以包括一组云基础架构。该组云基础架构可以包括第一类型云基础架构10A,其受预测环境事件影响(即,在预测环境事件期间具有的不能提供服务的概率大于预定义阈值概率)。第一类型云基础架构10A可以位于受预测环境事件影响的地理区域中,例如,位于受恶劣天气条件影响的区域中或者位于火灾的预计途径中。该组云基础架构可以包括第二类型云基础架构10B,其不受预测环境事件影响。
本公开的实施例的计算资源选择模块可以调用风险分析模块,以便确定是否采用可用备选CISP(即,不是云中的该组云基础架构一部分的可用CISP)复制受影响的局部计算服务。风险分析模块分析可用备选CISP,以便确定将服务复制到的备份CISP10C,并筛选出未选择的CISP(不用于复制云的服务)。备份CISP10C变成扩展云的一部分,扩展云由该组双实线和包围备份CISP10C的虚线表示。换言之,备份CISP10C作为额外的云基础架构临时添加到云,直到由于预测环境事件导致的服务中断的概率不复存在。
参考图1的操作80和图2的步骤800,服务复制和计算基础架构分配模块可以更新有关计算基础架构提供者托管的服务的信息,例如,将备份CISP10C临时添加到云。
参考图1的操作90和图2的步骤900,服务复制和计算基础架构分配模块可以更新有关计算基础架构可用性的信息。
可以独立于分布式计算基础架构的基础架构物理站点,实现包括计算资源选择模块和服务复制计算基础架构分配模块的系统。因此,包括计算资源选择模块和服务复制计算基础架构分配模块的系统可以在需要复制服务的站点中,或者在包含触发复制所需的所有数据的任何其它位置中。
以下情景作为对本公开的实施例的方法应用的说明提供。如果预测未来两天内有暴风雨,并且估计影响区域包含公司的一个数据中心,则可以采用本公开的实施例的系统,以便选择公司的受影响数据中心提供的服务所在的最适当的数据中心,并防止公司的数据中心提供的服务中断。
尽管根据特定实施例描述了本公开,但通过上面的描述看出,对于本领域的技术人员来说许多替代物、修改和变化都将是显而易见的。可以单独或者与任何其它实施例组合采用本公开的各种实施例,除非另外明确指明或者另外相互之间显然不兼容。因此,本公开旨在包含所有这种替代物、修改和变化,它们落入本公开和以下权利要求的范围和精神之内。

Claims (25)

1.一种为分布式计算基础架构动态供应资源的方法,所述方法包括:
在至少一个预测环境事件下,评估不复制至少一个局部计算服务的风险,所述至少一个局部计算服务预计由所述分布式计算基础架构的运营者提供;
根据所述风险的所述评估,确定是否通过将至少一个计算基础架构服务提供者(CISP)添加到所述分布式计算基础架构来复制所述至少一个局部计算服务;以及
如果确定添加至少一个选定CISP,则将所述至少一个选定CISP添加到所述分布式计算基础架构。
2.根据权利要求1的方法,进一步包括:
确定所述至少一个局部计算服务的中断对所述运营者的影响;以及
通过所述至少一个计算基础架构服务提供者的所述添加,确定复制所述至少一个局部计算服务的估计总成本。
3.根据权利要求2的方法,进一步包括确定预计所述至少一个预测环境事件中断所述至少一个局部计算服务的概率。
4.根据权利要求2的方法,进一步包括:
计算不复制所述局部计算服务的总财务成本的预期值;以及
比较所述预期值与复制所述至少一个局部计算服务的所述估计总成本。
5.根据权利要求4的方法,进一步包括:
如果所述预期值大于复制所述至少一个局部设备的所述估计总成本,则复制所述至少一个局部计算服务;以及
如果所述预期值小于复制所述至少一个局部设备的所述估计总成本,则不复制所述至少一个局部计算服务。
6.根据权利要求2的方法,其中复制所述至少一个局部计算服务的所述估计总成本包括:
将所述至少一个计算基础架构服务提供者添加到所述分布式计算基础架构的成本;以及
在所述至少一个预测环境事件的持续时间内操作所述至少一个计算基础架构服务提供者的成本。
7.根据权利要求1的方法,进一步包括:
针对所述至少一个局部计算服务中的每个选定局部计算服务生成可用备选CISP列表;以及
针对所述可用备选CISP列表中的每个可用备选CISP计算复制所述选定局部计算服务所需的复制时间。
8.根据权利要求7的方法,进一步包括计算由于所述至少一个预测环境事件引发可能中断之前的估计时间。
9.根据权利要求8的方法,进一步包括仅针对复制时间小于引发所述可能中断之前的所述估计时间的可用备选CISP,确定复制所述至少一个局部计算服务的估计总成本。
10.根据权利要求1的方法,进一步包括计算至少一个预测环境事件导致的可能中断的估计持续时间。
11.根据权利要求10的方法,进一步包括根据所述计算的所述可能中断的估计持续时间,确定复制所述至少一个局部计算服务的估计总成本。
12.根据权利要求1的方法,进一步包括针对所述至少一个局部计算服务中的每个选定局部计算服务:
生成可用备选CISP列表;以及
计算采用所述可用备选CISP列表中的备选CISP复制所述选定局部计算服务的最小总成本。
13.根据权利要求12的方法,其中通过以下操作计算所述最小总成本:
针对所述可用备选CISP列表中的每个可用备选CISP,计算采用所述每个可用备选CISP复制所述选定局部计算服务的总成本;以及
在所述计算的复制所述选定局部计算服务的总成本中选择最小值。
14.根据权利要求12的方法,其中将所述选定局部计算服务复制到考虑中的可用备选CISP的总成本包括:
将所述选定局部计算服务复制到所述考虑中的可用备选CISP的成本;以及
从所述考虑中的可用备选CISP恢复所述选定局部计算服务的成本。
15.根据权利要求1的方法,进一步包括针对所述至少一个局部计算服务中的每个选定局部计算服务,根据预定的指定标准或预定的业务约束,生成可用备选CISP的索引列表。
16.根据权利要求15的方法,进一步包括:
将针对可用备选CISP的所述索引列表的索引的初始值设置在极值;以及
增加或减少所述索引,直到发现可用备选CISP或者直到检查可用备选CISP的所述索引列表中的所有CISP,所述可用备选CISP能够在复制所述选定局部计算服务的总成本小于不复制所述局部计算服务的总财务成本的预期值的情况下,提供所述选定局部计算服务。
17.根据权利要求1的方法,进一步包括监视有关所述运营者托管的服务的信息。
18.根据权利要求1的方法,进一步包括在所述至少一个预测环境事件下,确定所述至少一个局部计算服务的可用性。
19.根据权利要求18的方法,进一步包括确定所述至少一个局部计算服务的中断的估计概率是否大于预定义值。
20.根据权利要求1的方法,进一步包括监视有关所述分布式计算基础架构的可用基础架构的信息。
21.根据权利要求1的方法,其中所述至少一个局部计算服务包括云应用服务、云平台服务和云基础架构服务中的至少一个。
22.根据权利要求1的方法,其中所述至少一个预测环境事件包括天气事件。
23.根据权利要求1的方法,其中所述至少一个预测环境事件包括地热活动、地质力学活动,或者地热活动或地质力学活动导致的自然现象。
24.根据权利要求1的方法,其中所述至少一个预测环境事件包括中断所述分布式计算基础架构的至少一个组件的操作的人为事件。
25.一种用于为分布式计算基础架构动态供应资源的系统,所述系统包括被配置为执行权利要求1至24中的任一权利要求的方法步骤的装置。
CN201310239140.XA 2012-06-18 2013-06-17 云计算中基于风险式动态地理定位的服务复制方法和系统 Pending CN103516778A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/525,738 US20130339203A1 (en) 2012-06-18 2012-06-18 Risk-based dynamic geo-location based replication of services in cloud computing
US13/525,738 2012-06-18

Publications (1)

Publication Number Publication Date
CN103516778A true CN103516778A (zh) 2014-01-15

Family

ID=49756791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310239140.XA Pending CN103516778A (zh) 2012-06-18 2013-06-17 云计算中基于风险式动态地理定位的服务复制方法和系统

Country Status (2)

Country Link
US (2) US20130339203A1 (zh)
CN (1) CN103516778A (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103777092B (zh) * 2013-12-23 2016-08-31 国家电网公司 一种基于云技术的继电保护测试系统及其方法
US10185924B1 (en) * 2014-07-01 2019-01-22 Amazon Technologies, Inc. Security risk response impact analysis
CN104780075B (zh) * 2015-03-13 2018-02-23 浪潮电子信息产业股份有限公司 一种云计算系统可用性评估方法
US10148489B2 (en) 2015-09-01 2018-12-04 At&T Intellectual Property I, L.P. Service impact event analyzer for cloud SDN service assurance
US10002039B2 (en) 2015-10-29 2018-06-19 At&T Intellectual Property I, L.P. Predicting the reliability of large scale storage systems
US10460296B2 (en) 2016-02-08 2019-10-29 Bank Of America Corporation System for processing data using parameters associated with the data for auto-processing
US10437778B2 (en) * 2016-02-08 2019-10-08 Bank Of America Corporation Archive validation system with data purge triggering
US10768920B2 (en) 2016-06-15 2020-09-08 Microsoft Technology Licensing, Llc Update coordination in a multi-tenant cloud computing environment
US10169139B2 (en) * 2016-09-15 2019-01-01 International Business Machines Corporation Using predictive analytics of natural disaster to cost and proactively invoke high-availability preparedness functions in a computing environment
US10547633B1 (en) * 2017-11-07 2020-01-28 Symantec Corporation Systems and methods for mapping services utilized by network domains
US11238448B1 (en) * 2019-03-21 2022-02-01 Equinix, Inc. Efficient network service provisioning

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101662773A (zh) * 2008-08-29 2010-03-03 国际商业机器公司 支持降低通信欺诈风险的计算机实现方法和设备
US20110145392A1 (en) * 2009-12-11 2011-06-16 International Business Machines Corporation Dynamic provisioning of resources within a cloud computing environment
US20110154358A1 (en) * 2009-12-17 2011-06-23 International Business Machines Corporation Method and system to automatically optimize execution of jobs when dispatching them over a network of computers

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101662773A (zh) * 2008-08-29 2010-03-03 国际商业机器公司 支持降低通信欺诈风险的计算机实现方法和设备
US20110145392A1 (en) * 2009-12-11 2011-06-16 International Business Machines Corporation Dynamic provisioning of resources within a cloud computing environment
US20110154358A1 (en) * 2009-12-17 2011-06-23 International Business Machines Corporation Method and system to automatically optimize execution of jobs when dispatching them over a network of computers

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
魏奕: "《万方数据库》", 29 April 2009 *

Also Published As

Publication number Publication date
US20130339204A1 (en) 2013-12-19
US20130339203A1 (en) 2013-12-19

Similar Documents

Publication Publication Date Title
CN103516778A (zh) 云计算中基于风险式动态地理定位的服务复制方法和系统
US10891182B2 (en) Proactive failure handling in data processing systems
US9542296B1 (en) Disk replacement using a predictive statistical model
JP4374378B2 (ja) 運用実績評価装置、運用実績評価方法、およびプログラム
US11290360B2 (en) Analyzing resource placement fragmentation for capacity planning
US10789102B2 (en) Resource provisioning in computing systems
US8380960B2 (en) Data allocation and replication across distributed storage system
TWI725744B (zh) 透過多層次相關性建立系統資源預測及資源管理模型的方法
US20190268283A1 (en) Resource Demand Prediction for Distributed Service Network
CN104704773A (zh) 云存储环境中基于一致性的服务级协定
US11194628B2 (en) Workload allocation utilizing real-time enterprise resiliency scoring
US20180165111A1 (en) Predictive virtual server scheduling and optimization of dynamic consumable resources to achieve priority-based workload performance objectives
US10169139B2 (en) Using predictive analytics of natural disaster to cost and proactively invoke high-availability preparedness functions in a computing environment
US10884885B2 (en) Proactively predicting failure in data collection devices and failing over to alternate data collection devices
US20190163528A1 (en) Automated capacity management in distributed computing systems
Jiao et al. Cost optimization for online social networks on geo-distributed clouds
JP2003337918A (ja) 複雑なシステムの利用可能性を求める方法
US9612890B2 (en) Method and apparatus for workflow based high availability analysis
US11301141B2 (en) Optimized selection of subset of storage devices for data backup
EP2245539A1 (en) System and method for estimating combined workloads of systems with uncorrelated and non-deterministic workload patterns
Pandey et al. Modeling availability in clouds for mobile computing
US20200236169A1 (en) Cloud platform or cloud provider selection
US20230244687A1 (en) Optimization of Virtual Warehouse Computing Resource Allocation
CN109558152A (zh) 系统灰度发布时流量切换方法、装置、介质及电子设备
Kang et al. An efficient scheme to ensure data availability for a cloud service provider

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140115