CN106575244B - 确保云应用的高可用性的修补过程 - Google Patents

确保云应用的高可用性的修补过程 Download PDF

Info

Publication number
CN106575244B
CN106575244B CN201580041290.7A CN201580041290A CN106575244B CN 106575244 B CN106575244 B CN 106575244B CN 201580041290 A CN201580041290 A CN 201580041290A CN 106575244 B CN106575244 B CN 106575244B
Authority
CN
China
Prior art keywords
servers
server
cloud application
subset
overall
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580041290.7A
Other languages
English (en)
Other versions
CN106575244A (zh
Inventor
J·张
B·奥康纳
M·邵
R·西尔瓦
M·哈瓦尔德森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN106575244A publication Critical patent/CN106575244A/zh
Application granted granted Critical
Publication of CN106575244B publication Critical patent/CN106575244B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • G06F8/658Incremental updates; Differential updates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Security & Cryptography (AREA)
  • Debugging And Monitoring (AREA)
  • Error Detection And Correction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

可以定义与云应用相关联的定期修补过程来确保云应用的高可用性(HA),以便防止影响对终端用户的可用性。与托管云应用的数据中心的一个或多个服务器相对应的服务器标识的列表可以被接受。服务器标识的每一个的HA度量值可以被确定以便计算云应用的总体HA度量值。服务器的子集可以基于所确定的HA度量值从云应用的轮转框架移除,其中该移除不影响云应用的总体HA度量值。一个或多个补丁可以并行地被应用到服务器子集中的每一个子集,并且服务器的子集可以在云应用的轮转框架中被恢复。

Description

确保云应用的高可用性的修补过程
背景技术
具有复杂架构的大型云应用可以具有指示云应用的一个或多个不同子系统的各种角色。例如,云应用可以包括web服务器角色、数据库角色、批量作业角色、以及索引角色等其他角色。由于云应用的功能,云应用和/或服务提供者可能需要强制安全合规性,并且还要快速地使云应用发展,例如来对反馈进行迭代,并且生成新的特征。因此,云应用和其托管的架构可以常规地被修补。此外,终端用户还可以假定云应用和/或服务可以在任何时间、任何地点被访问。由此,云应用和其托管架构的常规修补不应当影响使用。这样的影响可以是基于云应用的高可用性(HA)度量值的,其中云应用的HA度量值进一步基于在云应用中的各个角色的HA度量值。
当前修补方法没有考虑云应用和/或服务的各种角色的HA度量值,也没有提供对修补过程良好管理的生命周期。因此,与云应用相关联的当前的修补方法将使用改进和/或可替换的或者附加的解决方案,使得自动以及周期性的修补过程可以被定义,其能够实现应用的高可用性被维护。
发明内容
提供本发明内容是以简化的形式引入将在后文的具体实施方式中进一步描述的概念的选择。本发明内容不是要排他地识别所要求保护的主题的关键特征或者必要特征,也不是要作为确定所要求保护的主题的范围的辅助。
实施例是关于与云应用相关联的修补过程的定义的。可以接受与托管云应用的数据中心的一个或多个服务器相对应的服务器标识的列表。列表中的服务器标识中的每一个的高可用性(HA)度量值可以被确定,以便计算云应用的总体HA度量值。一个或多个服务器的子集可以基于所确定的HA度量值而从云应用的轮转框架中移除,其中,从轮转框架中移除服务器的子集不影响云应用的总体HA度量值。一个或多个补丁可以并行地被应用到服务器子集中的每一个服务器,并且可以在完成补丁的应用之后,在云应用的轮转框架中恢复该服务器的子集。
这些和其他特征和优势将根据阅读以下的具体实施方式以及相关联的附图的查看而显而易见。应当理解的是,前述的通用描述以及以下的具体实施方式是示例性的,并且不将方面限制为要求保护的。
附图说明
图1包括示出了示例的基于数据中心的系统的概念图,在所述系统中,可以实现与云应用相关联的修补过程;
图2示出了其中可以定义与云应用相关联的修补过程的示例网络环境;
图3A和图3B示出了与云应用相关联的示例修补过程;
图4示出了与云应用相关联的另一示例修补过程;
图5是示例通用计算设备的框图,可以使用所述通用计算设备来定义与云应用相关联的修补过程;以及
图6示出了根据实施例的用于定义与云应用相关联的修补过程的方法的逻辑流程图。
具体实施方式
如上简要描述的,可以定义与云应用相关联的修补过程,使得云应用的高可用性(HA)被维护,以防止影响对一个或多个终端用户的云应用的可用性。包括一个或多个服务器的数据中心可以被配置为托管云应用。与数据中心的管理系统和/或第三方数据中心管理服务相关联的业务流程模块可以被配置为接受与数据中心的服务器相对应的服务器标识符的列表。服务器标识符中的每一个的HA度量值可以被确定,以便计算云应用的总体HA度量值。服务器的子集可以基于所确定的HA度量值从云应用的轮转框架中移除,其中,服务器的子集的移除不影响云应用的总体HA度量值。一个或多个补丁可以并行地被应用到服务器的子集中的每一个服务器,并且服务器的子集可以在补丁的应用完成之后,在云应用的轮转框架中恢复。
在以下的具体实施方式中,参考形成了其一部分的附图,并且其中示出了示意的具体实施例或者示例。可以组合这些方面,可以利用其他方面,并且可以在不偏离不公开的范围的情况下做出结构改变。以下的具体实施方式因此不是在限制意义上的,并且本发明的范围是由随附的权利要求以及其等效物来进行定义的。
虽然在程序模块的通用上下文中描述了一些实施例,所述程序模块结果运行在个人计算机上的操作系统上的应用程序执行,但是本领域中的技术人员将意识到方面还可以结合其他程序模块来实现。
通常,程序模块包括例程、程序、组件、数据结构、以及执行特定任务或者实现特定抽象数据类型的其他类型的结构。此外,本领域中的技术人员将意识到实施例可以利用其他计算机系统配置来实施,包括手持式设备、多处理器系统、基于多处理器或可编程消费者电子设备、微型计算机、大型计算机、以及类似的计算设备。实施例还可以被实施在分布式计算环境中,其中,任务由通过通信网络连接的远程处理设备来进行执行。在分布式计算环境中,程序模块可以位于本地以及远程存储器存储设备中。
一些实施例可以被实现为计算机实现的过程(方法)、计算系统或者制品,例如,计算机程序产品或者计算机可读介质。计算机程序产品可以是由计算机系统可读的计算机存储介质,并且其对包括用于使计算机或者计算系统执行示例过程的指令的计算机程序进行编码。计算机可读存储介质是计算机可读存储器设备。计算机可读存储介质可以例如经由易失性计算机存储器、非易失性存储器、硬盘驱动器、闪速驱动器、软盘、或者压缩盘、以及类似的硬件介质中的一个或多个实现。
贯穿整个说明书,术语“平台”可以是用于定义与云应用相关联的修补过程的软件和硬件组件的组合。平台的示例包括但不限于在多个服务器上执行的托管的服务、在单个计算设备上执行的应用,以及类似的系统。术语“服务器”通常指典型地在联网的环境中执行一个或多个软件程序的计算设备。然而,服务器还可以被实现为被视作网络上的服务器的在一个或多个计算设备上执行的虚拟服务器(软件程序)。关于这些技术的更详细的介绍以及示例操作在以下提供。
图1包括示出了示例的基于数据中心的系统的概念图,在所述系统中,可以实现与云应用相关联的修补过程。
如图100所示出的,数据中心102可以包括作为与软件相关联的物理服务器,以及数据中心102的基础硬件的一个或多个服务器110、111以及113。一个或多个服务器110、111以及113可以被配置为执行一个或多个虚拟服务器104。例如,服务器111和113可以被分别配置为提供四个虚拟服务器以及两个虚拟服务器。在一些实施例中,一个或多个虚拟服务器可以被组合为一个或多个虚拟数据中心。例如,由服务器111提供的四个虚拟服务器可以被组合为虚拟数据中心112。虚拟服务器104和/或虚拟数据中心112可以被配置为托管大量的服务器以经由云106来提供云相关的数据/计算设备,例如,各种应用、数据存储、数据处理、或者与一个或多个终端用户108(例如,单独的用户或者企业客户)类似的。
在示例实施例中,数据中心102可以托管云应用。业务流程模块可以校验服务器110、111、以及113和/或由服务器110、111、以及113执行的虚拟服务器104是否需要被修补,以便例如更新程序或者数据、执行安全合规动作、和/或改进服务器的使用性或者性能。如果服务器中的任一个不需要被修补,那么它们可以从修补过程中移除。与不需要修补的服务器110、111、以及113和/或虚拟服务器104相对应的服务器标识的列表可以在业务流程模块处被接受。服务器标识可以包括与标识相对应的服务器110、111以及113和/或虚拟服务器104的角色。角色可以包括例如web服务器角色、数据库角色、批量作业角色、以及索引角色。业务流程模块可以通过数据中心102的管理系统或者通过第三方数据中心管理服务来执行,所述第三方数据中心管理服务管理与多个数据中心相关联的多个数据中心和服务器(例如,数据中心102和相关联的服务器110、111、以及113和/或虚拟服务器104),正如结合图2将进一步描述的。
HA度量值可以针对列表中的服务器标识中的每一个来确定,以便计算云应用的总体HA度量值。用于确定HA度量值的测量可以包括恢复的均值时间、失败之间的均值时间、以及”9”的数量(a number of nines),例如,其中这些测量用于确定当被需要时所需要的云应用将高可用性服务提供给终端用户108的总体可能性。服务器标识中的每一个的HA度量值可以基于与标识相对应的服务器110、111、以及113和/或虚拟服务器104的角色和交叉角色是不同的。每一个角色或者交叉角色可以对可用性具有不同的影响,这还可以取决于其他外部因素,例如,日期的时间。例如,具有web服务器角色的服务器可以被配置为从云应用的终端用户108接受超文本传输协议(HTTP)请求,并且响应于接收到HTTP请求,来向云应用的终端用户108提供用户接口。当这样的请求被进行时,在日间不存在具有web服务器角色的服务器可能高度影响对终端用户108的云应用的可用性,而在晚间和/或较早的早上的时间当较少的终端用户108正在请求时,不存在具有web服务器角色的服务器可以不会对可用性如此高级别的影响。
服务器110、111、以及113和/或虚拟服务器104的子集然后可以基于所确定的HA度量值从云应用的轮转框架中移除。服务器的子集被移除,使得移除不影响云应用的总体HA度量值,以便防止影响对终端用户108的云应用的可用性。返回到之前的示例,在晚间和/或较早的早上的时间当较少的终端用户108正在请求时,由web服务器角色标识的服务器的子集可以从轮转框架中移除,以便不影响云应用的总体HA度量值,由此防止对终端用户108的云应用可用性的干扰。
一旦服务器的子集被从云应用的轮转框架中移除,则每一个服务器上的活动的工作负载可以被移除和/或排空,以便确保这些服务器不再从云应用接受请求和/或向云应用添加,并且因此在修补期间不影响对终端用户108的可用性。一个或多个补丁可以被并行地应用到服务器的子集中的每一个服务器。服务器的子集可以在补丁的应用完成之后,在云应用的轮转框架中恢复。在被恢复之前,活动的工作负载可以被重载到每一个服务器上,以确保这些服务器再次从云应用接受请求和/或添加到云应用,以防止影响对终端用户108的可用性。一旦被恢复,来自数据中心102的服务器110、111、以及113和/或虚拟服务器104的另一个子集可以基于所确定的HA度量值以上文所描述的类似的方式来从轮转框架中移除。相应地,上文定义的修补过程可以在数据中心102的服务器的多个子集上是定期的并且连续的,使得适当的安全合规动作、维护以及更新能够被执行,而不影响对终端用户108的云应用的可用性。
图2示出了根据一些实施例的其中可以定义与云应用相关联的修补过程的示例网络环境。
正如在图200中所示出的,数据中心202可以包括一个或多个服务器204,以及被配置为管理数据中心202的服务器204的数据中心管理系统206。数据中心管理系统206可以包括一个或多个数据管理服务器,其中的至少一个可以能够操作来执行业务流程模块210。在一些示例中,数据中心202可以被配置为托管云应用。业务流程模块210可以被配置为接受与数据中心202的服务器204相对应的服务器标识的列表,并且确定列表上的服务器标识的每一个的HA度量值,以便计算云应用的总体HA度量值。业务流程模块210可以进一步被配置为基于所确定的HA度量值从云应用的轮转框架中移除服务器204的子集,并行地将一个或多个补丁应用到服务器204的子集中的每一个服务器,并且在补丁的应用完成之后在云应用的轮转框架中恢复服务器204的子集。
可替换地,正如在图250中所示出的,数据中心管理服务264可以被配置为管理多个数据中心,例如,数据中心252、256、260,以及分别与多个数据中心相关联的多个服务器,例如,服务器254、258、以及262。数据中心管理服务264可以包括一个或多个数据管理服务器266,其中的至少一个可以可操作用于执行业务流程模块268。业务流程模块268可以被配置为执行类似于业务流程模块210的动作,正如上述结合图200所描述的。
图3A和图3B示出了根据实施例的与云应用相关联的示例修补过程。
正如在图300中所示出的,与托管云应用的数据中心的一个或多个服务器相对应的服务器标识的列表可以在业务流程模块302处被接受。业务流程模块302可以例如自动地或者通过校验306过程来确定是否需要在服务器中出于安全合规、维护、和/或性能改进目标而执行任何补丁。如果确定不需要修补304,那么服务器可以从修补过程中被移除,并且修补过程可以结束320。如果确定需要修补,那么业务流程模块302可以被配置为校验与数据中心的服务器相对应的服务器标识的列表。服务器标识可以包括与标识相对应的服务器的角色,例如,web服务器角色、数据库角色、批量作业角色、以及索引角色。一旦被校验308,则可以针对列表上的服务器标识中的每一个来确定HA度量值,以便计算云应用的总体HA度量值。用于确定HA度量值的测量可以包括恢复的均值时间、失败之间的均值时间、以及”9”的数量,例如,其中这些测量用于确定当被需要时所需要的云应用将高可用性服务提供给终端用户108的总体可能性。服务器标识中的每一个的HA度量值可以基于与标识相对应的服务器的角色和交叉角色而是不同的。每一个角色或者交叉角色可以对服务的可用性具有不同的影响,这还可以取决于其他外部因素,例如,日期的时间。例如,具有批量作业角色的服务器可以配置为路由、入队、修改、以及执行批量作业。批量作业倾向于在白天的时间当许多终端用户与云应用进行交互时而进行累积,并且然后在晚间和/或较早的早上时间执行批量作业。在晚间和/或较早的早上时间当批量作业被执行时,不存在具有批量作业角色的服务器对于云应用的可用性具有影响,在白天时间当批量作业被累积时,不存在具有批量作业角色的服务器不影响可用性。
服务器的子集然后可以基于所确定的HA度量值从云应用的轮转框架中移除(即,不在轮转310)。服务器的子集被移除,使得移除不影响云应用的总体HA度量值,以便防止影响对终端用户的云应用的可用性。返回到之前的示例,由批量作业角色识别的服务器的子集可以在白天当批量作业被累积时从轮转框架中移除,以便不影响云应用的总体HA度量值,由此防止对终端用户的云应用可用性的干扰。
一旦服务器的子集被从云应用的轮转框架中移除,则每一个服务器上的活动的工作负载可以被移除和/或排空312,以便确保这些服务器不再向云应用添加,使得在修补期间不影响对终端用户的可用性。一旦准备好修补314,则一个或多个补丁可以被并行地应用到服务器的子集中的每一个服务器。一旦被修补316,服务器的子集可以在补丁的应用完成之后,在云应用的轮转框架中恢复(返回到轮转318),以便完成320修补过程。在被恢复之前,活动的工作负载可以被重载到每一个服务器上,以确保这些服务器再次添加到云应用,以防止影响针对终端用户的可用性。一旦修补过程完成320,则来自数据中心的服务器的另一个子集可以基于所确定的HA度量值以上文所描述的类似的方式来从轮转框架中移除(即,不在轮转310)。相应地,上文定义的修补过程可以在数据中心的服务器的多个子集上是定期的并且连续的,使得修补能够被执行,而不影响云应用的针对终端用户的可用性。
业务流程模块302可以被配置为在修补过程的各个阶段处阻止322一个或多个服务器完成修补过程,以及在修补过程的各个阶段处确定潜在的错误324,这将进一步结合图350来进行描述。另外,如果需要,在修补过程中的每个阶段可以被重试。
图350详细示出了修补过程的每一个阶段。与托管云应用的数据中心的一个或多个服务器相对应的服务器标识的列表可以在业务流程模块352处被接受。业务流程模块352可以自动地或者通过校验356过程来确定任何修补是否需要在服务器上执行。如果通过校验356过程的测试353确定不需要修补354,那么服务器可以从修补过程移除,并且修补过程可以结束370。如果确定需要修补,那么业务流程模块302可以被配置为校验358与数据中心的服务器相对应的服务器标识的列表。
一旦被校验358,则可以执行查询359来确定列表上的服务标识的每一个的HA度量值,以便计算云应用的总体HA度量值。服务器的子集然后可以基于所确定的HA度量值来从云应用的轮转框架中移除(即,不在轮转360)。服务器的子集被移除,使得移除不影响云应用的总体HA度量值,以便防止影响针对终端用户的云应用的可用性。可替换地,如果确定太多的服务器已经不在轮转384(即,服务器的阈值已经从轮转框架移除),并且因此,如果服务器的子集被移除则云应用的总体HA度量值受到影响,则修补过程可以被阻止372。
一旦服务器的子集被从云应用的轮转框架中移除(即,不在轮转360),则每一个服务器上的活动的工作负载可以被移除和/或排空362以准备修补364,,以便确保这些服务器不再从云应用接受请求和/或向云应用添加,使得在修补期间不影响对终端用户的可用性。可替换地,如果活动的工作负载的移除和/或排空超时或者失败382,则修补过程可以被阻止372。
一旦准备好修补364,则一个或多个补丁可以并行地被应用378到服务器子集中的每一个服务器,使得服务器被同步修补366。可替换地,如果服务器被重新启动376,则可以确定错误374,并且服务器可以被阻止修补366。一旦被修补366,则服务器的子集可以在补丁的应用完成之后,在云应用的轮转框架中恢复(回到轮转368),以便结束370修补过程。在被恢复之前,活动的工作负载可以被重载到每一个服务器上,以确保这些服务器再次从云应用接受请求和/或添加到云应用,以防止影响对终端用户的可用性。可替换地,如果在服务器的子集在云应用的轮转框架中恢复中发生超时或者失败380,则可以确定错误374并且可以防止服务器被恢复。
图4示出了根据实施例的与云应用相关联的另一示例修补过程。
正如在图400中示出的,业务流程模块402可以被配置为校验托管云应用的数据中心的一个或多个服务器是否需要修补、从修补过程移除不需要修补的任何服务器、以及接受与不需要修补的服务器相对应的服务器标识的列表。服务器标识可以包括每一个服务器的角色,例如,web服务器角色、数据库角色、批量作业角色、以及索引角色。
HA度量值可以针对列表中的服务器标识中的每一个来确定,以便计算云应用的总体HA度量值。用于确定HA度量值的测量可以包括恢复的均值时间、失败之间的均值时间、以及”9”的数量,例如,其中这些测量用于确定当被需要时所需要的云应用将高可用性服务提供给终端用户108的总体可能性。服务器标识中的每一个的HA度量值可以基于与标识相对应的服务器的角色和交叉角色是不同的。每一个角色或者交叉角色可以对应用的可用性具有不同的影响,这还可以取决于其他外部因素,例如,日期的时间。例如,具有数据库角色的服务器可以被配置为存储和维持数据。不存在具有数据库角色的服务器可能在日间在用户输入要被存储的数据和/或访问/编辑需要被维持的数据时高度影响云应用的针对终端用户的可用性。然而,从轮转框架中不存在具有数据库角色的服务器在晚间和/或较早的早上时间当较少的终端用户输入要被存储的数据和访问/编辑要被维持的数据时,可能不会对可用性如此高级别的影响。
服务器的子集可以基于所确定的HA度量值被确定(例如,操作406),使得从云应用的轮转框架中子集的移除不影响云应用的总体HA度量值。服务器的子集然后可以从云应用的轮转框架中被移除(操作408)。返回到之前的示例,在晚间和/或较早的早上的时间当较少的终端用户输入数据并且访问/编辑要被维持的数据时,从轮转框架中移除由数据库角色标识的服务器的子集不影响云应用的总体HA度量值,由此防止对终端用户的云应用可用性的干扰。
一旦服务器的子集被从云应用的轮转框架中移除,则每一个服务器上的活动的工作负载可以被移除和/或排空(例如,操作410),以便确保这些服务器不再从云应用接受请求和/或向云应用添加,并且因此在修补期间不影响对终端用户的可用性。一个或多个补丁可以被并行地应用到服务器的子集中的每一个服务器(例如,操作412)。一旦被修补,活动的工作负载可以被重载到每一个服务器上(例如,操作414),以确保这些服务器再次从云应用接受请求和/或添加到云应用,以防止影响对终端用户的可用性。服务器的子集然后可以在补丁的应用完成之后,在云应用的轮转框架中恢复(例如,操作416)。一旦被恢复,来自数据中心的服务器的另一个子集可以基于所确定的HA度量值以上文所描述的类似的方式来从轮转框架中移除。相应地,上文定义的修补过程可以在数据中心102的服务器的多个子集上是定期的并且连续的,使得在不影响云应用的对终端用户的可用性的情况下,修补能够被执行。
图1到图4中的示例结合包括数据中心、系统、服务器、应用、模块和交互的特定平台进行了描述。实施例并不限于根据这些示例的配置的系统。与云应用相关联的修补过程可以使用本文中所描述的原理、以类似的方式以使用包括数据中心、系统、服务器、应用、模块和交互的其它类型的平台在配置中定义和实现。
图5和相关联的讨论旨在提供对通用计算设备的简要的、总体描述,该计算设备可以用于定义根据本文中所描述的至少一些实施例布置的与云应用相关联的修补过程。
例如,计算设备500可以被用作为服务器、桌面型计算机、便携式计算机、智能电话、专用计算机、或类似的设备。在示例的基本配置502中,计算设备500可以包括一个或多个处理器504和系统存储器506。存储总线508可以用于在处理器504与系统存储器506之间进行通信。基本配置502在图5中通过内部虚线内的那些部件进行例示。
取决于期望的配置,处理器504可以具有任何类型,包括但不限于微处理器(μP)、微控制器(μC)、数字信号处理器(DSP)、或它们的组合。处理器504可以包括一个或多个级别的高速缓存,例如,一级高速缓存存储器512、一个或多个处理器核514、以及寄存器516。示例的处理器核514可以(各自)包括算法逻辑单元(ALU)、浮点单元(FPU)、数字信号处理核(DSP核)、或者它们的任意组合。示例的存储器控制器518也可以与处理器504一起使用,或者在一些实施方式中,存储器控制器518可以是处理器504的内部部分。
取决于期望的配置,系统存储器506可以具有任何类型,包括但不限于易失性存储器(例如,RAM)、非易失性存储器(例如,ROM、闪存、等等)或者它们的任意组合。系统存储器506可包括操作系统520、应用522、以及编程数据524。应用522可以包括业务流程模块526,其可以是应用的内部部件或者自身作为单独的应用。业务流程模块526可以被配置为接受与托管云应用的数据中心的一个或多个服务器相对应的服务器标识的列表,并且确定列表中的服务器标识中的每一个的HA度量值,以便计算云应用的总体HA度量值。业务流程模块526还可以被配置为基于所确定的HA度量值而从云应用的轮转框架中移除服务器的子集,将一个或多个补丁并行地应用到服务器子集中的每一个服务器,并且在完成补丁的应用之后,在云应用的轮转框架中恢复该服务器的子集。编程数据524可以包括与HA度量值相关的过程数据528,正如本文所描述的。
计算设备500可以具有附加特征或功能以及附加接口以有助于基本配置502与任何期望的设备和接口之间的通信。例如,总线/接口控制器530可以用于有助于经由存储接口总线534而进行基本配置520与一个或多个数据存储设备532之间的通信。数据存储设备532可以是一个或多个可移动存储设备536、一个或多个不可移动存储设备538、或者它们的组合。可移动存储设备和不可移动存储设备的示例包括磁盘设备,例如软盘驱动器和硬盘驱动器(HDD)、光盘驱动器例如压缩盘(CD)驱动器或数字多功能盘(DVD)驱动器、固态驱动器(SSD)、磁带驱动器,仅举几例。示例的计算机存储介质可以包括用任何方法或技术实现以用于存储信息(例如计算机可读指令、数据结构、程序模块、或其它数据)的易失性和非易失性、可移动或不可移动的介质。
系统存储器506、可移动存储设备536和不可移动存储设备538是计算机存储介质的示例。计算机存储介质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储技术、CD-ROM、数字多功能盘(DVD)、固态驱动器、或其它光学存储器、磁带盒、磁带、磁盘存储或其它磁存储设备、或可用于存储期望的信息并且可由计算设备500访问的任何其它介质。任何这种计算机存储介质可以是计算设备500的部分。
计算设备500也可以包括用于有助于经由总线/接口控制器530从不同的接口设备(例如,一个或多个输出设备542、一个或多个外围部件接口544、和一个或多个通信设备546)到基本配置502的通信。示例的输出设备542中的一些包括图形处理单元548和音频处理单元550,其可以被配置为经由一个或多个A/V端口552与不同的外部设备(例如,显示器或者扬声器)进行通信。一个或多个示例的外围部件接口544可以包括串行接口控制器554或并行接口控制器556,其可以被配置为经由一个或多个I/O端口558与诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备、等等)或其它外围设备(例如,打印机、扫描仪、等等)之类的外部设备进行通信。示例的通信设备546包括网络控制器560,其可以被布置为经由一个或多个通信端口564、通过网络通信链路与一个或多个其它计算设备562进行通信。一个或多个其它计算设备562可以包括服务器、客户端设备、等等设备。
网络通信链路可以是通信介质的一个示例。通信介质通常可以通过计算机可读指令、数据结构、程序模块、或者用经调制的数据信号(例如载波或其它传输机制)的其它数据来体现,并且可以包括任何信息传送介质。“经调制的数据信号”可以是使得其特性中的一个或多个以对信号中的信息进行编码的方式来进行设置或者改变的信号。通过示例而不是限制的方式,通信介质可以包括诸如有线网络或直接有线连接之类的有线介质,以及诸如声波、射频(RF)、微波、红外(IR)或其它无线介质之类的无线介质。如本文中所使用的术语计算机可读介质可以包括存储介质和通信介质两者。
计算设备500可以被实现为通用或专用服务器、主机、或包括以上功能中的任何功能的类似的计算机的一部分。计算设备500也可以被实现为包括膝上计算机和非膝上计算机配置两者的个人计算机。
示例实施例还可以包括用于定义与云应用相关联的修补过程的方法。这些方法可以以各种方式实现,包括本文所描述的结构。一个这样的方式可以是通过本公开内容中所描述的类型的设备的机器操作。另一种可选的方式可以是对于要被执行的方法的个体操作中的一个或多个操作,结合一个或多个人类操作员执行操作中的某些操作,而其它操作可以由机器来执行。这些人类操作员不需要彼此共位,而是每个可以仅具有执行程序的一部分的机器。在其它实施例中,人类交互可以例如通过预选的标准来自动化,该预选的标准可以是机器自动化的。
图6示出了根据实施例的用于定义和实现与云应用相关联的修补过程的方法的过程600的逻辑流程图。过程600可以在服务器或者其他系统上实现。
过程600开始于操作610,其中,与托管云应用的数据中心的一个或多个服务器相对应的服务器标识的列表可以在业务流程模块处被接受。业务流程模块可以由托管云应用的数据中心的数据中心管理系统内的一个或多个服务器执行。可替换地,业务流程模块可以由管理多个数据中心,以及与多个数据中心(例如,托管云应用的数据中心)相关联的一个或多个服务器的数据中心管理服务的一个或多个服务器执行。服务器标识可以包括与标识相对应的服务器的角色。示例角色可以包括web服务器角色、数据库角色、批量作业角色、以及索引角色,等等。
在操作620处,HA度量值可以针对列表中的服务器标识中的每一个来确定,以便计算云应用的总体HA度量值。服务器标识中的每一个的HA度量值可以基于与标识相对应的服务器角色和交叉角色是不同的。每一个角色或者交叉角色可以对云应用的可用性具有不同的影响,这可以取决于其他外部因素,例如,日期的时间。因此,基于相对应的服务器的角色针对列表上的每一个服务器标识所确定的HA度量值可以被组合,以便计算云应用的总体HA度量值。
在操作630处,一个或多个服务器的子集可以基于所确定的HA度量值而从云应用的轮转框架中移除,以确保从轮转框架中移除服务器的子集不影响云应用的总体HA度量值。一旦服务器的子集被从云应用的轮转框架中移除,则每一个服务器上的活动的工作负载可以被移除,以便确保这些服务器不再从云应用接受请求和/或向云应用添加,并且因此不影响对终端用户的可用性。
在操作640处,一个或多个补丁可以被并行地应用到服务器的子集中的每一个服务器。在操作650处,服务器的子集在补丁的应用完成之后,在云应用的轮转框架中恢复。在被恢复之前,活动的工作负载可以被重载到每一个服务器上,以确保这些服务器再次添加到云应用。一旦被恢复,来自数据中心的服务器的另一个子集可以基于所确定的HA度量值以上文所描述的类似的方式来从轮转框架中移除,如上文所描述的,使得修补过程可以在数据中心102的服务器的多个子集上是定期的并且连续的,而不影响云应用的对终端用户的可用性。
被包括在过程600中的操作是出于示出性的目的。与云应用相关联的修补过程的定义可以通过具有较少或者额外的步骤的类似的过程实现,以及以与使用本文所描述的原理的操作不同的顺序实现。
根据一些示例,提供了用于定义与云应用相关联的修补过程的方法。示例方法可以包括接受与托管云应用的数据中心的一个或多个服务器相对应的服务器标识的列表,确定针对列表中的服务器标识中的每一个的HA度量值,以便计算云应用的总体HA度量值,并且基于所确定的HA度量值而从云应用的轮转框架中移除服务器的子集,其中从轮转框架中移除服务器的子集,可以不影响云应用的总体HA度量值。示例方法还可以包括并行地将一个或多个补丁应用到服务器的子集中的每一个服务器,并且在补丁的应用完成之后,在云应用的轮转框架中恢复服务器的子集。
在其他示例中,响应于服务器的子集被恢复到云应用的轮转框架中,服务器的另一子集基于所确定的HA度量来从云应用的轮转框架中移除,其中服务器的其他子集从云应用的轮转框架中移除可以不影响云应用的总体HA度量值。一个或多个补丁可以并行地被应用到服务器的其他子集中的每一个服务器,并且服务器的其他子集可以在补丁的应用完成之后,在云应用的轮转框架中恢复。确定服务器标识的中的每一个的HA度量值可以包括使用恢复的均值时间、失败之间的均值时间、和/或”9”的数量来计算HA度量值。示例方法还可以包括在接受服务器标识的列表之前,校验托管云应用的数据中心的服务器是否需要修补,以及如果托管云应用的数据中心的服务器中的至少一个不需要修补,则从修补过程中移除该至少一个服务器。
在另一示例中,响应于确定服务器的阈值已经从轮转框架中被移除,使得如果服务器的子集被移除,云应用的总体HA度量值受到影响,则可以阻止服务器的子集从轮转框架中移除。活动的工作负载可以从服务器的子集中的每一个服务器中被移除,以便将补丁应用到每一个服务器。响应于确定活动的工作负载的移除的超时或者失败,可以阻止将补丁应用到服务器的子集中的每一个服务器。在补丁的应用完成之后,活动的工作负载可以被重载到服务器的子集中的每一个服务器。响应于确定在补丁的应用之前服务器子集中的至少一个服务器被重新启动,则可以确定错误。响应于服务器的子集在云应用的轮转框架中恢复的超时或者失败,则可以进一步确定错误。
根据一些实施例,描述了用于定义与云应用相关联的修补过程的系统。示例系统可以包括包含了一个或多个服务器的数据中心,其中数据中心被配置为托管云应用和业务流程模块。业务流程模块可以被配置为接受与数据中心的服务器相对应的服务器标识的列表,确定列表上的服务器标识中的每一个的HA度量值以便计算云应用的总体HA度量值,并且基于所确定的HA度量值来从云应用的轮转框架移除服务器的子集,其中,从轮转框架移除服务器的子集可以不影响云应用的总体HA度量值。业务流程模块还被配置为并行地将一个或多个补丁应用到服务器的子集中的每一个服务器,其中来自服务器的子集中的每一个服务器的活动的工作负载被移除,以便应用补丁,并且在补丁的应用的完成之后,在云应用的轮转框架中恢复服务器的子集。
在其他实施例中,业务流程模块可以由托管云应用的数据中心的管理服务器来执行。业务流程模块可以由管理多个数据中心以及与多个数据中心相关联的一个或多个服务器的数据中心管理服务执行。服务器标识可以包括相对应的托管云应用的数据中心的一个或多个服务器的角色或者交叉角色,其中角色包括web服务器角色、数据库角色、批量作业角色、和/或索引角色。角色可以基于一个或多个外部因素添加到服务器标识的每一个的不同的HA度量值。
根据一些示例,描述了具有存储在其上的指令的计算机可读存储器设备,所述指令用于定义与云应用相关联的修补过程。示例指令可以包括校验托管云应用的数据中心的一个或多个服务器是否需要修补,并且如果至少一个服务器不需要修补,则从修补过程中移除该至少一个服务器。示例指令还可以包括接受需要修补的与数据中心的服务器相对应的服务器标识的列表,确定列表上的服务器标识的每一个的HA度量值,以便计算云应用的总体HA度量值,并且基于所确定的HA度量值来从云应用的轮转框架中移除服务器的子集,其中从轮转框架移除服务器的子集可以不影响云应用的总体HA度量值。示例指令还可以包括并行地将一个或多个补丁应用到服务器的子集中的每一个服务器,并且在补丁的应用完成之后,在云应用的轮转框架中恢复该服务器的子集。
在其他示例中,来自服务器的子集中的每一个服务器的活动的工作负载可以被移除,以便将补丁应用到每一个服务器,并且在补丁的应用完成之后,活动的工作负载可以被重载到服务器的子集中的每一个服务器。
以上说明书、示例和数据提供了对实施例的组成的制造和使用的完整描述。尽管已经用特定于结构特征和/或方法行为的语言描述了主题,但是应当理解的是,在所附权利要求中所定义的主题并非必须限于上面所描述的特定特征或动作。相反,上面所描述的特定特征和动作被公开为实现权利要求和实施例的示例形式。

Claims (14)

1.一种用于定义与云应用相关联的修补过程的方法,所述方法包括:
接收与托管所述云应用的数据中心的多个服务器相对应的服务器标识的列表;
确定针对所述多个服务器的多个高可用性(HA)度量值,其中,每个HA度量值与所述多个服务器中的特定服务器相对应,并且是基于以下中的至少一项确定的:
所述特定服务器从失败恢复的均值时间;
所述特定服务器的失败之间的均值时间;或者
所述特定服务器的可用性百分比;
基于针对所述多个服务器所确定的HA度量值,计算所述云应用的总体HA度量值,其中,所述总体HA度量值指示由所述云应用向终端用户提供的服务的可用性;
基于所述多个HA度量值,确定所述多个服务器中的每个服务器对所述云应用的所述总体HA度量值的影响;
基于所确定的所述多个服务器中的每个服务器对所述总体HA度量值的影响,识别要从所述云应用的轮转框架中移除的所述多个服务器的子集;
从所述云应用的轮转框架中移除所述子集中的每个服务器;
将一个或多个补丁并行地应用到所述子集中的每一个服务器;以及
在所述一个或多个补丁的应用完成之后,在所述云应用的轮转框架中恢复所述子集中的每个服务器。
2.如权利要求1所述的方法,还包括:
在接受所述服务器标识的列表之前,校验托管所述云应用的所述数据中心的多个服务器是否需要修补。
3.如权利要求2所述的方法,还包括:
如果托管所述云应用的所述数据中心的多个服务器中的至少一个服务器不需要修补,则从所述修补过程移除所述至少一个服务器。
4.如权利要求1所述的方法,还包括:
响应于确定所述多个服务器的阈值已经从所述轮转框架中被移除,使得如果所述子集被移除,所述云应用的总体HA度量值受到影响,则阻止所述子集从所述轮转框架中移除。
5.如权利要求1所述的方法,还包括:
将活动的工作负载从所述子集中的每一个服务器中移除,以便将所述一个或多个补丁应用到每一个服务器。
6.如权利要求5所述的方法,还包括:
响应于确定以下中的一项而阻止将所述一个或多个补丁应用到所述子集中的特定服务器:从所述特定服务器移除活动的工作负载的超时;以及从所述特定服务器移除活动的工作负载的失败。
7.如权利要求5所述的方法,还包括:
在所述一个或多个补丁的应用完成之后,将所述活动的工作负载重载到所述子集中的每一个服务器。
8.如权利要求1所述的方法,还包括:
响应于确定在所述一个或多个补丁的应用之前所述子集中的至少一个服务器被重新启动,则确定错误。
9.如权利要求1所述的方法,还包括:
响应于所述子集在所述云应用的轮转框架中恢复的超时以及失败中的一个,则确定错误。
10.一种用于定义与云应用相关联的修补过程的系统,所述系统包括:
包括多个服务器的数据中心,所述数据中心被配置为托管所述云应用;以及
业务流程模块,其被配置为:
接收与所述数据中心的多个服务器相对应的多个服务器标识的列表;
确定针对所述多个服务器的多个高可用性(HA)度量值,其中,每个HA度量值与所述多个服务器中的特定服务器相对应,并且是基于以下中的至少一项确定的:
所述特定服务器从失败恢复的均值时间;
所述特定服务器的失败之间的均值时间;或者
所述特定服务器的可用性百分比;
基于针对所述多个服务器所确定的HA度量值,计算所述云应用的总体HA度量值,其中,所述总体HA度量值指示由所述云应用向终端用户提供的服务的可用性;
基于所述多个HA度量值,确定所述多个服务器中的每个服务器对所述云应用的所述总体HA度量值的影响;
基于所确定的所述多个服务器中的每个服务器对所述总体HA度量值的影响,识别要从所述云应用的轮转框架中移除的所述多个服务器的子集;
从所述云应用的轮转框架中移除所述子集中的每个服务器;
将一个或多个补丁并行地应用到所述子集中的每一个服务器,其中,来自所述子集中的每一个服务器的活动的工作负载被移除,以便应用所述一个或多个补丁;以及
在所述一个或多个补丁的应用完成之后,在所述云应用的轮转框架中恢复所述子集中的每个服务器。
11.如权利要求10所述的系统,其中,所述业务流程模块是由托管所述云应用的所述数据中心的管理服务器执行的。
12.如权利要求10所述的系统,其中,所述业务流程模块是由管理多个数据中心以及与所述多个数据中心相关联的一个或多个服务器的数据中心管理服务执行的。
13.如权利要求10所述的系统,其中,所述服务器标识包括托管所述云应用的所述数据中心的相对应的一个或多个服务器的角色。
14.一种具有存储于其上的指令的计算机可读存储器设备,所述指令用于定义与云应用相关联的修补过程,所述指令包括:
校验托管所述云应用的数据中心的多个服务器中的每个服务器是否需要修补;
如果至少一个服务器不需要修补,则从所述修补过程移除所述至少一个服务器;
确定针对需要修补的服务器的集合的多个高可用性(HA)度量值,其中,每个HA度量值与所述服务器的集合中的特定服务器相对应,并且是使用以下中的至少一项确定的:
所述特定服务器从失败恢复的均值时间;
所述特定服务器的失败之间的均值时间;或者
所述特定服务器的可用性百分比;
基于针对所述服务器的集合所确定的HA度量值,计算所述云应用的总体HA度量值,其中,所述总体HA度量值指示由所述云应用向终端用户提供的服务的可用性;
基于所述多个HA度量值,确定所述服务器的集合中的每个服务器对所述云应用的所述总体HA度量值的影响;
基于所确定的所述服务器的集合中的每个服务器对所述总体HA度量值的影响,识别要从所述云应用的轮转框架中移除的所述服务器的集合的子集;
从所述云应用的轮转框架中移除所述服务器的子集中的每个服务器;
将一个或多个补丁并行地应用到所述子集中的每一个服务器;以及
在所述一个或多个补丁的应用完成之后,在所述云应用的轮转框架中恢复所述子集。
CN201580041290.7A 2014-07-28 2015-07-22 确保云应用的高可用性的修补过程 Active CN106575244B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/445,007 US9442715B2 (en) 2014-07-28 2014-07-28 Patch process ensuring high availability of cloud application
US14/445,007 2014-07-28
PCT/US2015/041435 WO2016018680A1 (en) 2014-07-28 2015-07-22 Patch process ensuring high availability of cloud application

Publications (2)

Publication Number Publication Date
CN106575244A CN106575244A (zh) 2017-04-19
CN106575244B true CN106575244B (zh) 2020-07-21

Family

ID=53777004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580041290.7A Active CN106575244B (zh) 2014-07-28 2015-07-22 确保云应用的高可用性的修补过程

Country Status (5)

Country Link
US (1) US9442715B2 (zh)
EP (1) EP3175359B1 (zh)
CN (1) CN106575244B (zh)
BR (1) BR112017000347B1 (zh)
WO (1) WO2016018680A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10181066B2 (en) * 2016-06-06 2019-01-15 Paypal, Inc. Smart harbor device for intelligent updating and selection for use of transaction processing terminal devices
US11243755B1 (en) * 2016-06-22 2022-02-08 Amazon Technologies, Inc. Resource aware patching service
US10230712B2 (en) * 2016-09-12 2019-03-12 Microsoft Technology Licensing, Llc Binary experimentation on running web servers
US9753834B1 (en) * 2016-12-19 2017-09-05 General Electric Company Certification process for cloud platform
US20180331973A1 (en) * 2017-05-09 2018-11-15 Microsoft Technology Licensing, Llc Increasing virtual machine availability during server updates
US10191732B2 (en) 2017-06-09 2019-01-29 Citrix Systems, Inc. Systems and methods for preventing service disruption during software updates
US10579357B2 (en) 2017-07-20 2020-03-03 International Business Machines Corporation Cognitive expected program code installation result assessment
CN107688331A (zh) * 2017-08-30 2018-02-13 深圳增强现实技术有限公司 机器操作监督系统及其通信方法
US10565021B2 (en) * 2017-11-30 2020-02-18 Microsoft Technology Licensing, Llc Automated capacity management in distributed computing systems
US11323524B1 (en) * 2018-06-05 2022-05-03 Amazon Technologies, Inc. Server movement control system based on monitored status and checkout rules
US11038752B1 (en) 2020-06-16 2021-06-15 Hewlett Packard Enterprise Development Lp Creating a highly-available private cloud gateway based on a two-node hyperconverged infrastructure cluster with a self-hosted hypervisor management system
US11599837B2 (en) 2020-12-30 2023-03-07 Microsoft Technology Licensing, Llc Method and system for selection of users in feature rollout
US11829743B2 (en) 2021-09-29 2023-11-28 Microsoft Technology Licensing, Llc Method and system for providing customized rollout of features

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101495970A (zh) * 2005-06-24 2009-07-29 信科索尔特公司 用于高性能企业数据保护的系统和方法
CN102550004A (zh) * 2009-09-30 2012-07-04 阿尔卡特朗讯公司 企业网络中分配的云资源的动态负载平衡和调配
CN102959508A (zh) * 2010-06-25 2013-03-06 微软公司 更新考虑服务模型约束的节点

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2465151A1 (en) * 2003-04-16 2004-10-16 Novadigm, Inc. Method and system for patch management
US20060075401A1 (en) * 2004-10-05 2006-04-06 Microsoft Corporation Patch installation control
US7765538B2 (en) * 2004-10-29 2010-07-27 Hewlett-Packard Development Company, L.P. Method and apparatus for determining which program patches to recommend for installation
US7904706B2 (en) * 2004-12-01 2011-03-08 Innovation First, Inc. System and method for processing encrypted source code updates
US8271974B2 (en) 2008-10-08 2012-09-18 Kaavo Inc. Cloud computing lifecycle management for N-tier applications
JP5168112B2 (ja) * 2008-12-02 2013-03-21 富士通株式会社 パッチ適用装置、パッチ適用方法およびパッチ適用プログラム
US8589535B2 (en) 2009-10-26 2013-11-19 Microsoft Corporation Maintaining service performance during a cloud upgrade
US20120102220A1 (en) 2010-10-20 2012-04-26 Microsoft Corporation Routing traffic in an online service with high availability
US20120102480A1 (en) * 2010-10-20 2012-04-26 Microsoft Corporation High availability of machines during patching
US9235423B2 (en) * 2010-11-26 2016-01-12 Nec Corporation Availability evaluation device and availability evaluation method
US9262148B2 (en) 2011-09-12 2016-02-16 Microsoft Technology Licensing, Llc Modular architecture for distributed system management
US8606938B1 (en) 2012-09-27 2013-12-10 Ringcentral, Inc. High availability for cloud-based services
US9098375B2 (en) * 2013-12-23 2015-08-04 Verizon Patent And Licensing Inc. Automatic management of software patch installation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101495970A (zh) * 2005-06-24 2009-07-29 信科索尔特公司 用于高性能企业数据保护的系统和方法
CN102550004A (zh) * 2009-09-30 2012-07-04 阿尔卡特朗讯公司 企业网络中分配的云资源的动态负载平衡和调配
CN102959508A (zh) * 2010-06-25 2013-03-06 微软公司 更新考虑服务模型约束的节点

Also Published As

Publication number Publication date
EP3175359A1 (en) 2017-06-07
WO2016018680A1 (en) 2016-02-04
BR112017000347A2 (pt) 2017-10-31
US9442715B2 (en) 2016-09-13
EP3175359B1 (en) 2020-11-18
US20160026453A1 (en) 2016-01-28
BR112017000347B1 (pt) 2023-01-17
CN106575244A (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
CN106575244B (zh) 确保云应用的高可用性的修补过程
US10678656B2 (en) Intelligent restore-container service offering for backup validation testing and business resiliency
US10956403B2 (en) Verifying data consistency
US10592825B2 (en) Application placement among a set of consolidation servers utilizing license cost and application workload profiles as factors
US9015164B2 (en) High availability for cloud servers
US9081640B2 (en) Apparatus, method and medium for calculating an update order on a service level objective
US9003014B2 (en) Modular cloud dynamic application assignment
US10171315B2 (en) Orchestration process template for generation of orchestration process to tolerate errors
US10216429B2 (en) Performing post-processing operations for log file writes
US20150095283A1 (en) Master schema shared across multiple tenants with dynamic update
US10678626B2 (en) Distributed product deployment validation
US11048577B2 (en) Automatic correcting of computing cluster execution failure
US20200151071A1 (en) Validation of data written via two different bus interfaces to a dual server based storage controller
US9971589B2 (en) Upgrade management for a shared pool of configurable computing resources
CN108369503A (zh) 对外部场可更换单元(fru)过程的自动系统响应
JP7212440B2 (ja) システムにおける時系列ログ構造のキーバリュー・ストア内のチェックポイントを使用した障害後のリカバリのための方法、コンピュータ・プログラム、および装置
US20200174680A1 (en) Checking of data difference for writes performed via a bus interface to a dual-server storage controller
JP2023044720A (ja) クラッシュしたアプリケーションを修復するためのコンピュータ実装方法、コンピュータプログラム製品、およびリモートコンピュータサーバ(クラッシュしたプロセスのリモート修復)
US9674105B2 (en) Applying a platform code level update to an operational node
US10339037B1 (en) Recommendation engine for recommending prioritized performance test workloads based on release risk profiles
US11474707B2 (en) Data loss recovery in a secondary storage controller from a primary storage controller
US20200099593A1 (en) Automated self-recovery of distributed services
US10956399B1 (en) Transaction pipelining in a journaled database

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant