CN108885554A - 特定分散计算机系统 - Google Patents

特定分散计算机系统 Download PDF

Info

Publication number
CN108885554A
CN108885554A CN201780020246.7A CN201780020246A CN108885554A CN 108885554 A CN108885554 A CN 108885554A CN 201780020246 A CN201780020246 A CN 201780020246A CN 108885554 A CN108885554 A CN 108885554A
Authority
CN
China
Prior art keywords
server
resource
resources
entity
server entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780020246.7A
Other languages
English (en)
Other versions
CN108885554B (zh
Inventor
E.申菲尔德
V.萨拉普拉
R.马欣德鲁
J.A.比文斯
H.V.拉马萨米
阮耀平
李旻
K.达斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN108885554A publication Critical patent/CN108885554A/zh
Application granted granted Critical
Publication of CN108885554B publication Critical patent/CN108885554B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • H04L41/0897Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities by horizontal or vertical scaling of resources, or by migrating entities, e.g. virtual resources or entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5019Ensuring fulfilment of SLA
    • H04L41/5025Ensuring fulfilment of SLA by proactively reacting to service quality change, e.g. by reconfiguration after service quality degradation or upgrade
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/83Admission control; Resource allocation based on usage prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5011Pool
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5077Network service management, e.g. ensuring proper service fulfilment according to agreements wherein the managed service relates to simple transport services, i.e. providing only network infrastructure

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)
  • Stored Programmes (AREA)

Abstract

数据中心中的服务器资源分解为共享服务器资源池。通过从这些资源池分配,可以根据工作负载要求动态、按需构建服务器。这种类型的分解计算系统跟踪共享服务器资源池中可用的资源,并根据该信息管理这些资源。为构建的每个服务器实体分配唯一的服务器ID,并且用标识符标记包括组件的每个资源。当工作负载由服务器实体处理时,其组成可能会改变,例如,通过向服务器实体分配更多资源,或通过从服务器实体取消分配资源。工作负载请求与服务器实体的唯一服务器ID相关联。在资源上收到工作负载请求时,它会在为该请求在提供服务之前将其唯一的服务器ID与该请求的ID相匹配。

Description

特定分散计算机系统
技术领域
本申请总体上涉及在数据中心操作环境中的数据处理系统。
背景技术
众所周知的信息技术(IT)传递模型是云计算,通过该云计算,可以通过因特网向计算机和其他设备按需提供共享资源,软件和信息。云计算可显著降低IT成本和复杂性,同时改善工作负载优化和服务交付。利用这种方法,托管应用程序实例并使其可从基于因特网的资源获得,例如通过HTTP上的传统Web浏览器可访问这些资源。云计算资源通常位于运行一个或多个网络应用程序的大型服务器场(large server farms)中,通常使用虚拟化体系结构,其中应用程序在虚拟服务器内运行,或称为“虚拟机”(VM),映射到数据中心设施备中的物理服务器中。
在数据中心本身内,数据中心网络通常根据包括若干层电气开关(即,访问,聚合和核心层)的分层设计来架构。在数据中心的前端,内容和负载均衡交换机通过网关路由器连接到因特网(Internet),而在后端,它们链接到核心交换机。通常,核心交换机链接到聚合交换机,聚合交换机连接到机架交换机。每个机架交换机都连接到机架中的服务器。数据中心网络中的交换机通常通过电子交换结构运行,它们之间的链路可以是铜缆或光纤。当请求来自外部网络时,它首先来到负载平衡和内容交换机,它们将请求路由到适当的服务器。为了满足请求,服务器可以与相同或不同机架内的其他服务器协调。例如,应用程序服务器可以与数据库服务器协调以处理请求。完成请求后,响应将通过网关路由器发送到外部网络。
诸如所描述的传统数据中心架构面临许多挑战,包括但不限于可扩展性,容错性和能量效率。因此,许多人难以应对云计算日益增长的需求。
数据中心性能还受到包括数据中心的硬件系统的性质的影响。目前,硬件系统预先包装有预定数量的CPU和存储器,这限制了灵活性。例如,在典型的虚拟机环境中,定义了虚拟CPU的数量,并分配了存储器。虽然可以在这样的环境中更改许多虚拟CPU,但无法指定要使用哪些物理CPU,或者如何增加物理CPU的数量。
另外,通常需要动态地放大或缩小物理硬件容量,以便可以在没有任何停机时间和客户影响的情况下调整虚拟和非虚拟容量。例如,考虑应用服务器的情况,该应用服务器包括存储器中的,面向列的关系数据库管理系统(例如,HANA服务器)。如果希望在非虚拟化环境中向此类服务器添加更多CPU或其他资源,则必须构建硬件盒,而不是动态添加更多资源。虚拟化环境中存在类似的问题,因为通常,管理程序容量被绑定到硬件盒的底层容量。
数据中心资源供应的另一种已知方法涉及使用具有从制造商预先组装的特定组件的预构建服务器。在该方法中,数据中心客户可以从选项菜单列表中进行选择(包括识别服务器应该具有哪些资源),但是匹配通常由用户手动选择具有所需特征的最相近框来完成。但是,所选框可能不可用,在这种情况下,使用更高值的框来满足客户的需求。该过程需要每个物理数据中心的非常大的不同类型服务器库存的可用性,每个服务器具有许多可能的资源组合(即处理器类型,存储器,存储GPU等)。从成本和资源管理的角度来看,这是不可取的。而且,即使有这样的库存,选择和供应过程也是耗时且复杂的。
因此,仍然需要提供解决与现有技术相关的这些和其他问题的技术。
发明内容
根据本公开的第一方面,提供了一种用于在计算环境中分配资源的方法。该方法通过提供一组服务器资源池开始,其中服务器资源池包括一组公共类型的资源(例如,计算池,存储器池等)。响应于接收到请求,定义了服务器实体。服务器实体由从一个或多个服务器资源池中选择的一个或多个资源组成。基于与请求相关联的预计工作负载从一个或多个服务器资源池中选择一个或多个资源。此后,当正在处理工作负载时,从监视一个或多个资源收集的信息作为工作负载被接收。基于从监视收集的信息,基于工作负载的变化来调整服务器实体的组成。
优选地,唯一服务器标识符与服务器实体相关联并用于监视目的。唯一服务器标识符还与为服务器实体选择的每个资源相关联。更新唯一标识符以反映服务器实体的组成的任何调整。
根据本公开的第二方面,描述了一种用于在计算环境中分配资源的装置。该装置包括一组一个或多个硬件处理器,以及保存由硬件处理器执行的计算机程序指令的计算机存储器,以执行一组操作,例如上述步骤。
根据本公开的第三方面,描述了一种用于在数据处理系统中使用的用于在计算环境中分配资源的非暂时性计算机可读介质中的计算机程序产品。该计算机程序产品保存在数据处理系统中执行的计算机程序指令,并且可操作以执行诸如上述步骤的操作。
根据本公开的第四方面,描述了一种数据中心设备。数据中心包括一组服务器资源池,分散的计算系统,数据库和监视系统。服务器资源池至少包括计算池和存储器池。分散的计算系统包括从计算池中选择的处理器,从存储器池中选择的计算机存储器,以及光学互连。数据库存储定义分散的计算系统的唯一服务器标识符。唯一服务器标识符在数据库中与分配给分散的计算系统中的服务器(例如,处理器和计算机存储器)的每个资源的标识符相关联。监视系统响应于分散的计算系统中的工作负载变化,以根据工作负载需求选择性地调整处理器或其中的计算机存储器的组成。在操作中,在数据库中更新唯一服务器标识符以反映分散的计算系统的组成的调整。
优选地,并且作为可选方面,在上述数据中心中,基于以下之一来选择处理器和计算机存储器:它们的位置,最适合预期工作负载以及与数据中心设备相关联的未来扩展要求。
上述技术和技术特征提供了显著的优点。它们可以根据预计需求在数据中心中正确分配初始资源,并在不停机的情况下动态扩展或缩小物理或虚拟硬件容量,并且对客户的影响很小或没有影响。因为服务器实体是通过分配处理器子集,存储器子集等构建的,所以仅使用处理工作负载所需的那些资源。此外,当需要放大时,系统获得所需的额外资源,优选地基于地点考虑(即,附加资源在哪里)以确保以低成本继续良好的性能。由于该方法利用了分散服务器,因此这些优势使数据中心能够实现更高的模块化,更高的资源利用率,更低的成本和更好的性能。服务器实体根据需要构建,构成这些实体的资源也可以按需动态变化。该方法解决了由于使用传统服务器而导致的工作负载分配问题,当其中的一个或多个资源由于不匹配或变化的工作负载要求而未充分利用时,所述传统服务器遭受资源碎片化。通过使用此处描述的共享资源池和资源分配方法,通过根据工作负载的要求从这些资源池分配来动态地和按需地构建服务器。
前面已经概述了所公开的主题的一些更相关的特征。这些特征应该被解释为仅仅是说明性的。通过以不同方式应用所公开的主题或通过修改将要描述的主题,可以获得许多其他有益结果。
附图说明
为了更完整地理解本主题及其优点,现在参考以下结合附图的描述,其中:
图1描绘了其中可以实现本公开的示例性方面的计算系统环境的示例性框图;
图2是光学连接的存储器系统的硬件结构的示例性框图,其中可以实现说明性实施例的各方面;
图3描绘了图2中的光学连接的存储器系统中的处理器设计的硬件结构的框图;
图4是说明用于在处理器处访问存储器的硬件结构的框图;
图5描绘了根据本公开的分散的计算系统;
图6描绘了可替换的数据中心架构,其中可以实现本公开的技术;
图7描绘了根据第一实施例的用于新服务器分配的处理流程;
图8描绘了根据第二实施例的服务器放大资源分配方法的处理流程;和
图9描绘了根据第三实施例的服务器缩小资源分配方法的处理流程。
具体实施方式
本公开的技术优选地在“分解的”计算系统环境的上下文中实现,其中“分解的服务器”-在本文中有时称为“服务器实体”-是被组成或构成的服务器资源,其是选自(或被分配自)共享服务器资源池,即,以下中的一个或多个:计算池,存储器池,加速器池(例如,GPU加速器,网络加速器等),存储池等。正如命名法所暗示的,“计算”池通常构成物理处理器(例如多个CPU),“存储器”池通常构成物理存储器设备(例如双列直插式存储器模块(DIMM))等。给定的共享池优选地,仅包括特定资源类型,但是特定资源池可以由一个或多个资源子类型组成。“池”的概念不是限制性的,因为可以以任何合适的方式收集,聚合或以其他方式组合公共资源。此外,“池”可以是具有共同类型或子类型的专用资源集,或者这些资源的一些临时集合。优选地,特定服务器实体包括来自一个或多个服务器资源池的服务器资源。
在优选实施例中,并且如下面所描述的,其中实现本公开的教导的分解计算系统利用光学(与电气相反)互连用于存储器,但是这不是限制。
通常,共享资源池在特定数据中心的物理范围内可用,但是这同样不是限制。因此,共享资源池本身可以跨物理数据中心共享。此外,不要求特定服务器实体由来自每个服务器池的资源组成。
切换光学连接的存储器架构
作为背景技术,但不作为限制,以下描述了代表性计算机环境,其中可以实现本公开的技术(下面描述)。
现在转向图1,图1描绘了可以实现本公开的分解计算系统的计算环境的示例性架构10。计算机系统10包括中央处理单元(CPU)12,其连接到通信端口18和存储器设备16.通信端口18与通信网络20通信。通信网络20和存储网络可以被配置为与服务器(主机)24和22以及存储系统通信,存储系统可以包括存储设备14.存储系统可以包括硬盘驱动器(HDD)设备,固态设备(SSD)等,其可以配置为冗余独立磁盘阵列(RAID)。如下所述的操作可以在位于系统10或其他地方的存储设备14上执行,并且可以具有独立工作和/或与其他CPU设备12一起工作的多个存储器设备16.存储器设备16可以包括如下存储器。电可擦除可编程只读存储器(EEPROM)或许多相关设备。存储器装置16和存储装置14经由信号承载介质连接到CPU 12。另外,CPU 12通过通信端口18连接到通信网络20,通信网络20具有附加的多个附加计算机主机系统24和22.此外,存储器设备16和CPU 12可以嵌入并包括在每个组件中。每个存储系统还可以包括单独和/或不同的存储器设备16和CPU 12,它们一起工作或作为单独的存储器设备16和/或CPU 12工作。
图2示出计算机系统中光学连接的存储器系统的硬件结构的示例性框图200。由于光链路204的高带宽距离乘积,存储器214通过光互连结构204与CPU 218的隔离是可行的。在这种光连接存储器(OCM)系统200中,CPU 218和存储器214是组织成通过光学链路和至少一个交换结构204连接的单独的机架202和208.在存储器机架206中,存储器刀片208被布置并通信地耦合到其他存储器刀片和处理器(CPU)机架202.每个存储器刀片208容纳多个存储器设备214,代理212和存储器控制器210.CPU机架202包括处理器刀片216,每个处理器刀片216可通信地耦合到其他处理器刀片216和存储器机架206.处理器刀片216包括处理器218,每个处理器218包含本地存储器(未示出)。处理器机架216内的处理器218(和各个物理计算节点)通过已知的快速互连装置(未示出)在本地连接,该快速互连装置可以是在处理器刀片216内的处理器218的物理计算节点之间具有某种拓扑的直接连接网络,或者是交换机,通过高速缓存一致(coherent)对称多处理器(SMP)结构的存储器,或者上述的组合。处理器218,处理器刀片216,存储器214和存储器刀片208中的每一个共享多个光学外部链路。这些外部链路用于在非常高的带宽下优化光交换结构内的点对点连接。该优化可以在所使用的物理实现中,或者在为了促进这种高带宽而选择的协议中,并且优选地,它具有支持一个物理链路或多个物理链路内的存储器切换的能力,看起来像是由几个物理链接构成的一个高带宽物理链路。因为这些外部链路通常通过至少一个不知道其数据或内容的光开关204进行电路交换,所以这些应该使用非常轻量级的通信协议。
这些外部链路的物理特性可能需要在WDM(波分复用器)中使用多个光波长,它们都耦合到一个光纤或一个外部链路中,但在两端是可分离的。基于镜子的微机电系统“MEMS”光学电路开关“OCS”将在光学域中偏转这些外部链路内的光束,无论其波长,协议和信令速度如何。优选地,并且在所描绘的实施例中,这些外部链路对于所有存储器刀片和处理器刀片是共用的。
在优选的架构中,在光学外部链路之间共享至少一个光学电路交换机。而且,可以在处理器和共享光电路交换机的存储器刀片之间建立若干独立电路。这些外部链路用于优化非常高带宽的点对点连接。该优化可以在所选择的协议中使用的物理实现中,以促进这种高带宽,并且能够支持在一个物理链路或多个物理链路内聚合多个流,看起来像由一些物理链路构成的一个高带宽物理链路。因为这些外部链路通过不了解其协议,数据或内容的全光开关进行电路交换,所以使用了非常轻量级的通信协议。此外,这些外部链路的物理特性可能需要在WDM(波分复用器)中使用多个光波长,它们都耦合到一个光纤或一个外部链路中,但在两端是可分离的。基于镜子的微机电系统“MEMS”光学电路开关“OCS”将在光学域中偏转这些外部链路内的光束,而不管它们的波长,协议和信令速度的数量。这些外部链路对于所有处理器,刀片,存储器和独立电路是共同的,使得任何存储器刀片/处理器刀片可以直接地或通过经过互连的处理器刀片在一个或所有这些外部链路上传递信息。在一个示例性实施例中,使用电路交换开关。电路交换开关不需要频繁切换,因此可以更加简单地构建,并且可以使用不同的技术(例如,所有光学,基于MEMS镜子)来动态地连接电路,存储器和处理器刀片。
这些类型的外部链路(未示出)和动态切换实现了根据需要动态改变的非常高吞吐量(例如,高带宽)连接。由于多核处理芯片需要非常高带宽的网络来将多核处理芯片互连到其他这样的物理处理节点或存储器子系统,所以示例性光学连接存储器架构在提供由存储器切换操作功能上实现的解决方案中起着至关重要的作用。
光学连接的存储器架构200产生许多益处:(a)跨系统节点的透明存储器容量改变,(b)消除存储器的最坏情况供应的概念并允许应用根据工作负载改变存储器占用空间(footprints),(c)将CPU停机时间与存储器模块故障分离,从而提高CPU可用性。如下所述,提供了一种用于存储器管理技术的架构。如图2所示,处理器刀片202托管多个处理器218,而存储器模块241被打包(例如,布置)在存储器刀片208中。处理器刀片216和存储器刀片208被组织在单独的机架202和206中,这是通过光交换结构204互连。CPU刀片202中的每个处理器218可以具有本地存储器池310a-n,其用于更快的存储器访问。除了动态随机存取存储器(DRAM)存储器设备之外,存储器刀片208还可以集成备用存储器设备,例如闪存或相变存储器,而不需要对CPU刀片216进行任何改变。
现在转向图3,图3是示出计算机系统中的光学连接的存储器系统中的处理器设计的硬件结构的框图300。如图3中所示,处理器侧设计300示出:系统中的软件栈(没有虚拟化)302和304(具有虚拟化),并且处理器刀片通过光学收发器308和312与远程存储器刀片通信。存在与本地存储器池310a-n相关联的存储器控制器306。如果系统存储器地址(SMA)空间(如图3的302和304所示)高于某个预定义的限制,则SMA被映射到远程存储器地址(RMMA)空间408(如图4所示),并且访问请求通过适当的通道路由到远程存储器刀片。应注意,存储器刀片208(参见图2)维持称为远程存储器地址(RMMA)空间的单独地址空间。
在光学连接的存储器系统中(参见图2200),每个处理器节点218为远程和本地存储器维护SMA空间。处理器节点218将本地物理存储器映射到该地址空间的下部。远程存储器被映射到可用(即,更高)的SMA地址空间(在302和304中示出)。在远程存储器侧,存储器刀片208保持RMMA。因此,应首先将处理器侧的每个存储器访问映射到SMA空间(如图3的302和304所示)。如果SMA(如302和304所示)对应于远程存储器,则SMA(如图3的302和304所示)被映射到RMMA,并且该RMMA被发送到远程存储器刀片208。光学平面将SMA(如图3的302和304所示)转换成相应的RMMA并与远程存储器交互,如图3所示。
处理器刀片(如图3中的组件306,308和310a-n所示)通过电-光(EO)/光-电(OE)收发器312连接到远程存储器。例如,连接到NorthbridgeTM芯片组。注意,在虚拟化系统中,SMA(如图3的302和304所示)对应于机器地址(MA)(如302和304所示),并且在没有虚拟化的系统中该SMA(如图3的302和304所示)对应于物理地址(PA)(如图3的302和304所示)。如图3所示,每个处理器刀片(示出为具有组件306,308和310a-n)可以通过单独的通道同时连接到多个存储器刀片。这里,在单模光纤的情况下,信道对应于单独的光收发器,而对于波分复用(WDM),单个收发器可以提供多个信道。
在光学连接系统中(如图2中的200所示),处理器节点通过在处理器节点和远程存储器刀片之间建立的独立电路访问远程存储器。现在转向图。参照图4,示出了示例性框图400,其示出了用于通过计算机系统中的光学互连结构切换存储器的硬件结构。处理器B402B与远程刀片C 406B建立电路,并获得对先前由处理器A 402A保持的数据的访问。如上面在图1中概述的那样如图2-4所示,处理器节点具有到远程存储器刀片的多个通道;此外,每个存储器刀片配备有多个通道,使得存储器刀片能够跨多个处理器节点共享。光学信道(在存储器刀片或处理器节点中)由一个或多个光学收发器提供。处理器节点402(示为402A和402B)可以通过利用存储器刀片406(示为406A-C)启动电路并将存储器请求发送到远程存储器控制器来从远程存储器刀片分配存储器。在这样的存储器系统中,保持远程存储器刀片内的超级页面的处理器节点402可以发信号通知另一个处理器与远程存储器刀片406(如406A-C所示)建立电路,从而启动向后者处理器节点的存储器空间的传送。前处理器节点(例如,处理器A 402A)可以将RMMA地址空间发送到接收处理器节点(例如,处理器B402B),其可以访问驻留在所提供的地址空间上的相同数据。如果电路不再需要该存储器刀片(例如,存储器刀片406B)处的任何超级页面,则发送处理器可以将电路与远程存储器刀片406(如406A-C所示)拆除(例如,断开)。这种跨处理器节点传送地址空间的过程称为存储器切换。存储器切换过程如图2所示。如图4所示,其中处理器节点A 402A将存储在远程存储器刀片C 406中的数据发送到处理器节点B 402B。处理器B 402B启动具有远程存储器刀片C406的电路。注意,由于存储器刀片406可以具有多个通道,所以存储器刀片406的存储器空间可以跨多个处理器节点共享,每个存储器空间占用非存储器空间。此外,存储器切换的源和目的地侧可以分别称为切换和切入操作。
虽然上述计算环境是优选的,但并不意图是限制性的。本公开的分解计算系统的各方面可以在提供服务递送的传统云计算模型的数据中心中实现。因此,为了完整起见,以下部分提供了有关云计算的其他详细信息。
云计算
云计算使得能够方便地按需网络访问可以快速供应的可配置计算资源(例如,网络,网络带宽,服务器,处理,存储器,存储,应用,虚拟机和服务)的共享池。以最小的管理努力或与服务提供商的互动发布。该云模型可以包括至少五个特征,至少三个服务模型和至少四个部署模型,所有这些都在2009年10月7日由Peter Mell和Tim Grance撰写的“DraftNIST Working Definition of Cloud Computing”中更具体地描述和定义。
特别地,如下是典型特征:
按需自助式服务:云的消费者在无需与服务提供者进行人为交互的情况下能够单方面自动地按需部署诸如服务器时间和网络存储等的计算能力。
广泛的网络接入:计算能力可以通过标准机制在网络上获取,这种标准机制促进了通过不同种类的瘦客户机平台或厚客户机平台(例如移动电话、膝上型电脑、个人数字助理PDA)对云的使用。
资源池:提供者的计算资源被归入资源池并通过多租户(multi-tenant)模式服务于多重消费者,其中按需将不同的实体资源和虚拟资源动态地分配和再分配。一般情况下,消费者不能控制或甚至并不知晓所提供的资源的确切位置,但可以在较高抽象程度上指定位置(例如国家、州或数据中心),因此具有位置无关性。
迅速弹性:能够迅速、有弹性地(有时是自动地)部署计算能力,以实现快速扩展,并且能迅速释放来快速缩小。在消费者看来,用于部署的可用计算能力往往显得是无限的,并能在任意时候都能获取任意数量的计算能力。
可测量的服务:云系统通过利用适于服务类型(例如存储、处理、带宽和活跃用户帐号)的某种抽象程度的计量能力,自动地控制和优化资源效用。可以监测、控制和报告资源使用情况,为服务提供者和消费者双方提供透明度。
典型服务模型如下:
软件即服务(SaaS):向消费者提供的能力是使用提供者在云基础架构上运行的应用。可以通过诸如网络浏览器的瘦客户机接口(例如基于网络的电子邮件)从各种客户机设备访问应用。除了有限的特定于用户的应用配置设置外,消费者既不管理也不控制包括网络、服务器、操作系统、存储、乃至单个应用能力等的底层云基础架构。
平台即服务(PaaS):向消费者提供的能力是在云基础架构上部署消费者创建或获得的应用,这些应用利用提供者支持的程序设计语言和工具创建。消费者既不管理也不控制包括网络、服务器、操作系统或存储的底层云基础架构,但对其部署的应用具有控制权,对应用托管环境配置可能也具有控制权。
基础架构即服务(IaaS):向消费者提供的能力是消费者能够在其中部署并运行包括操作系统和应用的任意软件的处理、存储、网络和其他基础计算资源。消费者既不管理也不控制底层的云基础架构,但是对操作系统、存储和其部署的应用具有控制权,对选择的网络组件(例如主机防火墙)可能具有有限的控制权。
典型部署模型如下:
私有云:云基础架构单独为某个组织运行。云基础架构可以由该组织或第三方管理并且可以存在于该组织内部或外部。
共同体云:云基础架构被若干组织共享并支持有共同利害关系(例如任务使命、安全要求、政策和合规考虑)的特定共同体。共同体云可以由共同体内的多个组织或第三方管理并且可以存在于该共同体内部或外部。
公共云:云基础架构向公众或大型产业群提供并由出售云服务的组织拥有。混合云:云基础架构由两个或更多部署模型的云(私有云、共同体云或公共云)组成,这些云依然是独特的实体,但是通过使数据和应用能够移植的标准化技术或私有技术(例如用于云之间的负载平衡的云突发流量分担技术)绑定在一起。
云计算环境是面向服务的,其关注于无状态,低耦合,模块化和语义互操作性。云计算的核心是包含互连节点网络的基础设施。特别地,在云计算节点中存在计算机系统/服务器,其可与许多其他通用或专用计算系统环境或配置一起操作。可适用于计算机系统/服务器的众所周知的计算系统,环境和/或配置的示例包括但不限于个人计算机系统,服务器计算机系统,瘦客户端,胖客户端,手持式或者膝上型设备,多处理器系统,基于微处理器的系统,机顶盒,可编程消费电子产品,网络PC,小型计算机系统,大型计算机系统,以及包括任何上述系统或设备的分布式云计算环境等。计算机系统/服务器可以在由计算机系统执行的计算机系统可执行指令(例如程序模块)的一般上下文中描述。通常,程序模块可以包括执行特定任务或实现特定抽象数据类型的例程,程序,对象,组件,逻辑,数据结构等。计算机系统/服务器可以在分布式云计算环境中实践,其中任务由通过通信网络链接的远程处理设备执行。在分布式云计算环境中,程序模块可以位于包括存储器存储设备的本地和远程计算机系统存储介质中。
典型的云计算环境具有一组高级功能组件,其包括前端身份管理器,业务支持服务(BSS)功能组件,操作支持服务(OSS)功能组件和计算云组件。身份管理器负责与请求客户端连接以提供身份管理,并且该组件可以用一个或多个已知系统实现,例如可从位于Armonk,New York的IBM公司获得的的Tivoli Federated Identity Manager(TFIM)。在适当的情况下,TFIM可用于向其他云组件提供联合单点登录(F-SSO)。业务支持服务组件提供某些管理功能,例如计费支持。操作支持服务组件用于提供其他云组件的供应和管理,例如虚拟机(VM)实例。云组件表示主要计算资源,其通常是多个虚拟机实例,其用于执行可通过云访问的目标应用程序。一个或多个数据库用于存储目录,日志和其他工作数据。所有这些组件(包括前端身份管理器)都位于云“内”,但这不是必需的。在备选实施例中,身份管理器可以在云外部操作。服务提供商也可以在云外部运营。
一些云基于非传统IP网络。因此,例如,云可以基于具有使用MAC地址散列(hashes)的特殊单层IP路由的基于CLOS的两层网络。这里描述的技术可以用在这种非传统云中。
图5示出了支持资源虚拟化的典型IT基础设施,并且其中本公开的下述技术也可以全部或部分地实现。出于解释的目的,提供共享(公共)资源的IT数据中心是“提供者”,并且使用这些共享资源来托管,存储和管理其数据和应用程序(以所有形式)的客户或公司是“订户”(或“客户”或“租户”)。在图5中,示出了示例虚拟机托管环境(在本文中可选地称为数据中心或“云”)。该环境包括通常经由管理程序管理VLAN 506连接到物理数据中心网络504的主机(HV)502(例如,服务器或类似物理机器计算设备)。虽然没有明确描述,但是通常环境还包括负载平衡器,网络数据交换机(例如,架顶式交换机),防火墙等。如图5所示,物理服务器502均适于使用虚拟化技术动态地提供一个或多个虚拟机(VM)508。这种技术可从商业上获得,例如从VMware或其他技术获得。服务器虚拟化是本领域公知的技术。如图所示,可以将多个VM放置在单个主机中并共享主机的CPU,存储器和其他资源,从而提高组织数据中心的利用率。在该环境中,租户应用510被托管在网络设备512中,并且租户数据被存储在数据存储和数据库514中。应用和数据存储通常经由网络管理/存储VLAN 516连接到物理数据中心网络504。总的来说,虚拟机,应用程序和租户数据代表订户可访问的虚拟化资源管理域505.通过该域,订户的雇员可以访问和管理(使用各种基于角色的特权)他们已经由提供商分配的由物理IT基础架构支持的虚拟化资源。基础设施的底部示出了提供者可访问的管理域515。该域包括提供者员工管理门户518,BSS/OSS管理功能520,各种身份和访问管理功能522,安全策略服务器524和管理功能526以管理服务器镜像(images)528。这些功能通过管理VLAN530与物理数据中心网络连接。提供商的员工具有专用权限(可能是特定的客户端/网络),他们可以从中访问运营和业务支持服务(OSS/BSS),他们用来管理IT数据中心基础设施(例如,硬件和软件安装,配置,监控,技术支持,计费等)。
概括地说,云计算基础设施提供虚拟机托管环境,其包括经由网络和一个或多个管理服务器连接的主机(例如,服务器或类似物理机计算设备)。通常,物理服务器均适于使用虚拟化技术动态提供一个或多个虚拟机,例如VMware ESX/ESXi。可以将多个VM放入单个主机并共享主机的CPU,存储器和其他资源,从而提高组织数据中心的利用率。在其他任务中,管理服务器监视基础结构并根据需要自动操纵VM放置,例如,通过在主机之间移动虚拟机。
在非限制性实现中,代表性平台技术是但不限于具有VMware vSphere 4.1Update1和5.0的IBM System服务器。
用于指定分解系统的方法和系统
通过提供若干代表性操作环境的以上描述,现在描述本公开的技术。
根据本公开的技术,将一个或多个数据中心中或跨越一个或多个数据中心的服务器资源分解为共享服务器资源池,即,以下中的一个或多个:计算池,存储器池,加速器池,存储池(storage pool)等。通过从这些资源池分配,动态构建服务器,例如,按需并基于工作负载要求。根据本公开,这种类型的分解计算系统跟踪共享服务器资源池中可用的资源,并基于该信息管理这些资源。
根据一个实施例,与分解的计算系统相关联的跟踪机制包括数据库。数据库存储跟踪定义可从资源池获得的服务器的各种资源的资源状况(resource state)或状态(status)(例如,空闲或使用的CPU,存储器,加速器和其他组件)的数据。另外,数据库存储数据记录(或更一般地,数据集),对于每个定义的服务器(有时称为“服务器实体”),该数据记录标识构成服务器的资源(例如,CPU,存储器,加速器或其他组件)。优选地,数据记录与标识符相关联,例如唯一的服务器ID,并且包括服务器的每个资源在数据库中与该唯一的服务器标识符相关联。资源池的各个组件还包括在数据库中跟踪的标识符。资源特定标识符提供关于资源状态,属性,与其他资源的关系等的信息。因此,可以集中或分布的数据库充当关于服务器实体,服务器池和包括特定服务器实体的各种资源的信息的存储库。
响应于对数据中心资源的请求,例如,当分配新服务器时,通过从一个或多个资源池中选择资源来定义服务器实体。可以基于与请求相关联的预计需求或指定需求或一些其他标准来选择资源。服务器实体与唯一服务器ID相关联,该唯一服务器ID与包括服务器实体的资源的标识符一起存储在数据库中。然后,可以根据请求的工作负载要求或一个或多个相关或关联请求,根据需要放大或缩小服务器实体。
因此,例如,当处理请求时,或者当接收到用于处理的附加相关请求时,跟踪系统监视使用以确定是否需要对包括服务器实体的资源进行调整。当基于监视,跟踪系统确定服务器实体组件中的调整是必要的时,例如通过改变与服务器实体相关联的资源的分配来执行调整。因此,例如,当需要额外的计算和存储器(放大)时,跟踪系统(通过其自身,或通过与数据中心中的其他资源供应系统的协作)调整服务器实体,例如,通过选择附加处理器和存储器,然后添加到服务器实体。可以基于一个或多个标准来选择这些附加处理器和存储器,例如加载,与包括服务器实体的现有资源的接近度,可用性等,如在数据库中维护和跟踪的信息所指示的。另一方面,当监视指示需要较少资源(缩小)时,跟踪系统调整服务器实体,例如通过取消选择某些处理器和存储器,然后从服务器实体解除分配并返回各自的资源池。
现在参考图6,本公开提供了用于指定分解的计算系统600的方法和系统。在优选方法中,分解的计算系统600配置在数据中心605内,其中使用切换光学连接的存储器架构。以上在图1-4的上下文中描述了该架构。但是,这不是限制性的。在分解的计算系统600中,存在共享服务器池,例如,计算池602,存储器池604,加速器池606,存储池608,以及可能还有其他。可能存在资源池的单个实例,或多个此类实例(有时称为“多个池”)。在本文的方法中,通过从这些资源池分配,动态地(例如,按需并且基于工作负载要求)构建服务客户工作负载的特定服务器。因此,例如,第一服务器实体610可以包括CPU 602a(从计算池602中选择或以其他方式获得),存储器604b(从存储器池604中选择或以其他方式获得),加速器606c(从加速器池606中选择或以其他方式获得)和存储器608d(从存储池608中选择或以其他方式获得)。第二服务器实体612可以包括CPU 602b,存储器604a,加速器606b和存储器608a。这些例子仅仅是代表性的。而且,如将要描述的,包括给定服务器实体的特定服务器池资源可以改变。
优选地,一旦资源池的特定资源与给定服务器实体相关联,该特定资源就不可用于构成另一服务器实体。换句话说,优选地,资源池的分配资源保持与服务器实体相关联,直到它被解除分配,此时资源被返回到资源池并且可以被另一个服务器实体再次使用。尽管不是限制性的,但优选地,服务器实体(一旦创建)与一个且仅一个数据中心客户(租户)相关联。换句话说,服务器实体优选地不在租户之间共享。
为了管理这样的分配和解除分配,并且根据本公开,分解的计算系统600具有跟踪共享服务器资源池中可用的以及分配或解除分配给各种服务器实体的资源的能力。为此,分解的计算系统600包括(或与之相关联)跟踪系统,该跟踪系统包括资源分配机制614和相关联的数据库系统616.通常,跟踪系统被实现为数据处理系统,并且它可以以独立方式或作为数据中心中某些其他系统或功能的组件进行操作。
通常,资源分配机制614以软件实现,即,作为一组计算机程序指令,在一个或多个硬件处理器中执行。资源分配机制614可以包括一个或多个子系统或模块,过程,程序或执行线程,并且这些组件可以共同定位或分布。资源分配机制614通常负责执行根据本公开的创建和管理服务器实体的一个或多个分配算法。如下所述,代表性算法包括,例如,用于执行服务器实体的初始构建的新服务器分配算法,当需要更多容量来处理工作负载时,在现有服务器的情况下用于添加更多服务器的服务器扩展算法,以及当需要较少容量处理工作负载时,在现有服务器的情况下,用于从现有服务器实体解除分配(流失)资源的服务器缩减算法。可以组合这些功能中的一个或多个,并且可以由资源分配机制614实现其他类型的算法。
包括资源分配机制614的一个或多个算法使用存储在数据库系统616中的信息来执行管理功能。如上所述,数据库系统616存储跟踪共享服务器池中的各种资源的状况(state),状态(status)或其他属性(properties)和属性(attributes)的信息。此外,数据库存储有关由资源分配机制构建的每个服务器实体的信息。通常而言并且众所周知,数据库系统616包括数据库618,即,以一种或多种方式(例如,通过模式,表格,查询,报告,视图和其他对象)组织的数据集合,以及数据库管理系统(DBMS)620,其是与用户,其他应用程序和数据库交互以捕获和分析数据的计算机软件应用程序。通用DBMS支持数据库的定义,创建,查询,更新和管理。代表性的DBMS是
在一个实施例中,数据库618是关系型的。数据库存储数据记录(或更一般地,数据集),对于每个定义的服务器实体,该数据记录标识构成服务器的资源。优选地,数据记录与标识符,唯一服务器ID相关联,并且包括服务器的每个资源在数据库中与该唯一服务器标识符相关联。因此,继续上述示例,第一服务器实体610可以与唯一服务器ID1相关联,而第二服务器612可以与用户服务器ID2相关联,等等。
还如所描述的,优选地,资源池的各个组件还包括在数据库中跟踪的标识符;当资源被分配给服务器实体时,资源的标识符然后与服务器实体相关联(交叉引用)。因此,继续上面的第一示例,CPU 602a,存储器604b,网络加速器606c和存储器608d的各种资源特定标识符(通过关系表或其他方式)与唯一服务器ID1相关联,唯一服务器ID1是用于第一服务器实体610的唯一服务器标识符。类似地,并且继续第二示例,CPU 602b,存储器604a,加速器606b和存储器610a的各种资源特定标识符与唯一服务器ID2相关联,唯一服务器ID2是第二服务器实体的唯一服务器标识符,并且对于每个服务器实体以此类推。
当首次构建服务器实体时,它包括由资源分配机制从服务器池中选择的一组一个或多个服务器池资源。因此,服务器实体的唯一服务器标识符将具有与其相关联的初始资源特定标识符集。随着稍后从服务器实体分配或解除分配资源,与特定服务器实体标识符相关联的组成资源标识符集合也因此改变。
如上所述,可能存在资源池的多个实例。当存在多个实例时,然后从这些实例中的一个或多个中选择用于支持服务器实体的特定资源。优选地,如果分配给资源池的第一实例的资源用于构建服务器实体,则当需要向该服务器实体添加容量时,优选地,在可能的情况下也从相同的实例中提取附加资源。
优选地,资源特定标识符提供关于资源状态,属性,与其他资源的关系等的信息。因此,可以集中或分布的数据库充当关于服务器实体、服务器池和包括特定服务器实体的各种资源的信息的储存库。
尽管关系数据库对于实现是有用的,但是服务器实体标识符和资源特定标识符可以以其他方式彼此相关,例如,作为链接列表,数据阵列,散列表或其他。
通常,资源分配机制614和数据库系统616一起工作以管理分解的计算系统。资源分配机制用作跟踪系统,跟踪空闲和使用的CPU,存储器,加速器和定义服务器的其他组件。此外,跟踪系统记录每个定义的服务器的何种CPU,存储器,加速器或是服务器一部分的其他组件。如上所述,并且对于每个定义的服务器,指定唯一ID,并且从空闲资源池中选择所请求的CPU,存储器和存储(storage)的数量,例如,基于将进一步描述的它们的位置,最佳匹配和未来的扩展需求。唯一的服务器ID以及这些资源中的每一个的ID都记录在跟踪系统中。优选地,并且如上所述,使用过的组件被标记为已使用过并且从空闲组件池中移除。
优选地,服务器实体的每个组件都标记有作为其一部分的唯一服务器ID。因此,使组件知道其是由唯一服务器ID标识的服务器实体的组件。
优选地,发布给分解计算系统的每个请求以及响应于该请求而接收的数据也用服务器实体ID标记。例如,当在资源处接收到请求时,资源然后将标记为请求的服务器实体ID与资源的服务器实体ID进行比较。换句话说,该组件具有检查请求是否与已经分配了组件的服务器实体ID匹配的能力。如果是,则组件将请求识别为可以被消费并采取行动的事物。当标记到请求的服务器实体ID与标记到组件的服务器实体ID不匹配时,组件知道可以忽略该请求。
如将要描述的,用于资源选择的算法(新服务器分配,服务器放大和服务器缩小)可以使用共同标准来促进选择,或者这些算法可以彼此不同,例如,基于关于资源拓扑和资源分配的目的。当资源互连时,系统可以获得分配资源的更大灵活性。对于不直接互连的资源,优选地,算法考虑资源的层次结构以及其他因素,例如跳数,等待时间,成本等。在后一种情况下,优选地,算法尝试最小化跳数。
图7描绘了根据第一实施例的用于新服务器分配的处理流程。该过程描述了说明性的新服务器分配算法。通常,算法通过检查所述池来操作,并确定哪个资源池(以及其中的哪些资源)最符合服务器实体的要求。如上所述,并且取决于池本身的性质和配置,可能是多个池满足服务器实体的标准的情况,在这种情况下,新服务器分配算法优选地从池中分配具有最大可用资源的资源,以使计算系统的未来扩展成为可能。
在接收到对新服务器的请求时,新服务器分配过程在步骤700开始。可以从用户或某个请求实体或系统接收该请求。可以以编程方式接收该请求。新服务器分配进程可以访问有关服务器池及其相关资源的信息的数据库。在步骤702,系统使用初始分配算法分配资源。在没有限制的情况下,该初始分配算法可以考虑资源池的数量和配置,资源是否互连,这种互连的性质等等。也就是说,所使用的特定初始资源分配方法不是对本公开的限制。在步骤704,并且已经选择了所需的池和资源,生成了唯一的服务器标识符(表示已经构建的新服务器定义)。在步骤706,系统然后更新跟踪系统以将新服务器定义添加到数据库。在步骤708,跟踪系统还更新数据库以反映为新服务器实体选择的资源不再可用(即,它们被使用)。在步骤710,与所定义的新服务器实体相关联的每个资源用唯一服务器标识符标记,以便它可以响应带有匹配标记的服务请求。
图8描绘了根据第二实施例的服务器放大资源分配方法的处理流程。通常,并且如上所述,该算法用于向现有服务器实体添加更多资源。当需要放大时,算法优选基于位置的资源,在所有其他条件相同的情况下,与服务器实体中已经存在的资源“更近”的资源优于远离网络的资源(网络方式)。当然,近或远的概念是相对术语,并且可以取决于一个或多个因素(例如,等待时间,损失,成本,跳数等)。在一种方法中,系统试图找到最接近已经分配的资源的资源。然而,这不是限制,因为可以使用利用其他标准的其他放大技术。
当用户或一些其他系统从服务器实体请求更多容量时,例程开始于步骤800。可以以编程方式接收该请求。在步骤802,系统基于所使用的特定资源放大分配算法,通过为唯一服务器ID分配更多资源来进行响应。所使用的特定放大资源选择方法不是对本公开的限制。在步骤804,更新跟踪系统以标记现在正在使用新分配的资源。例程然后在806继续,每个新分配的资源如前所述用用户服务器ID标记。
图9描绘了根据第三实施例的服务器缩小资源分配方法的处理流程。通常,此过程用于选择从现有服务器实体取消分配的资源。缩小规模的方法可能各不相同。例如,可以基于它们的位置来选择要解除分配的资源,以从资源池中释放资源,最大化可用池的大小,最大化池本身的大小等。可以强制执行这些因素的循环选择,例如,以促进跨池的平衡。在另一个变体中,该算法分析分配是否是给定工作负载的最佳解决方案,如果不是,则警告用户工作负载的性能将受到影响。在又一变型中,该算法基于给定的工作量预测系统中所需的容量并适当地提出推荐。
一旦接收到来自用户或某个其他系统的较少容量的请求,例程就在步骤900开始。可以以编程方式接收该请求。在步骤902,系统通过执行算法并从服务器实体解除分配资源来响应该请求。所使用的特定缩小资源选择方法不是对本公开的限制。在步骤904,更新跟踪系统,使得已解除分配的资源现已返回到它们各自的资源池并且不是空闲的,并且更新唯一的服务器ID。在步骤906,从资源标识符中移除标签(标识服务器实体)以完成该过程。
因此,响应于对数据中心资源的请求,例如,当分配新服务器时,通过从一个或多个资源池中选择资源来定义服务器实体。可以基于与请求相关联的预计需求或指定需求或一些其他标准来选择资源。服务器实体与唯一服务器ID相关联,该唯一服务器ID与包括服务器实体的资源的标识符一起存储在数据库中。然后,可以根据请求的工作负载要求或一个或多个相关或关联请求,根据需要放大或缩小服务器实体。
因此,例如,当处理请求时,或者当接收到用于处理的附加相关请求时,跟踪系统监视使用以确定是否需要对包括服务器实体的资源进行调整。使用由数据中心中的一个或多个监视系统或子系统监视。特定监视子系统可以与特定服务器资源类型相关联。因此,例如,一个监视子系统可用于监视存储器系统,而第二监视子系统用于监视CPUs。通过提供或配置资源以提供关于其状况(state)或状态(status)的信息来完成监视,所有这些都以已知的方式进行。监视子系统可以是分散的并且将数据提供回中央监视器,该中央监视器收集和分析服务器实体以确定是否需要调整,并且如果需要,则确定这种调整的性质和程度。
当,并且基于监视,跟踪系统确定服务器实体组件中的调整是必要的时,例如通过改变与服务器实体相关联的资源的分配来执行调整。因此,例如,当需要额外的计算和存储器(放大)时,跟踪系统(通过其自身,或通过与数据中心中的其他资源供应系统的协作)调整服务器实体,例如,通过选择附加处理器和存储器,然后添加到服务器实体。可以基于一个或多个标准来选择这些附加处理器和存储器,例如负载,与构成服务器实体的现有资源的接近度,可用性,功耗,发热等,如由在数据库中维护和跟踪的信息所指示的。另一方面,当监视指示需要较少资源(缩小)时,跟踪系统调整服务器实体,例如通过取消选择某些处理器和存储器,然后从服务器实体解除分配并返回各自的资源池。
本文描述的技术提供了显著的优点。它们可以根据预计的需求,动态扩展或缩小物理或虚拟硬件容量来实现初始资源的分配,而无需任何停机时间,并且客户影响极小或没有。因为服务器实体是通过分配处理器子集,存储器子集等构建的,所以仅使用处理工作负载所需的那些资源。此外,当需要放大时,系统获得所需的额外资源,优选地基于地点考虑(即,附加资源在哪里)以确保以低成本继续良好的性能。由于该方法利用了分解服务器,因此这些优势使数据中心能够实现更高的模块化,更高的资源利用率,更低的成本和更好的性能。实际上,随着大型数据中心的出现以及对具有越来越多服务器的云的需求,该方法为数据中心提供了一种以更具成本效益和可靠的方式运行的方式。根据需要构建服务器实体,并且根据需要动态地改变组成这些实体的资源。该方法解决了由于使用传统服务器而导致的工作负载分配问题,当其中的一个或多个资源由于不匹配或变化的工作负载要求而未充分利用时,所述传统服务器遭受资源碎片化。通过使用此处描述的共享资源池和资源分配方法,通过根据工作负载的要求从这些资源池分配来动态地和按需地构建服务器。
通过维护和使用各种资源服务器池以及实现服务器实体的生成和管理的资源分配机制来提供本文描述的优点。这种方法的一个实施例进一步包括跟踪系统及其相关的唯一服务器标识符及其相关数据的数据库,使系统能够在服务器资源池上提供更强大的库存管理,并确保放大和缩小算法工作效率更高。还使用那些唯一服务器标识符作为资源标签的这种方法的又一实施例提供了额外的优点,因为它确保了与服务器实体不相关联的资源不处理应由此处理的服务器请求。
如已经描述的,上述功能可以实现为独立方法,例如,由处理器执行的基于软件的功能,或者可以作为服务提供(包括通过SOAP/XML接口作为web服务)。这里描述的特定硬件和软件实现细节仅用于说明目的并不意味着限制所描述主题的范围。
更一般地,在所公开的主题的上下文内的计算设备每个都是包括硬件和软件的数据处理系统,并且这些实体通过网络彼此通信,例如因特网,内联网,外联网,专用网络或任何其他通信媒介或链接。数据处理系统上的应用程序为Web和其他已知服务和协议提供本机支持,包括但不限于对HTTP,FTP,SMTP,SOAP,XML,WSDL,UDDI和WSFL等的支持。有关SOAP,WSDL,UDDI和WSFL的信息可从万维网联盟(W3C)获得,该联盟负责开发和维护这些标准;有关HTTP,FTP,SMTP和XML的更多信息可从Internet Engineering Task Force(IETF)获得。假定熟悉这些已知的标准和协议。
本文描述的技术可以在各种服务器端体系结构中实现或与其结合实现,包括简单的n层体系结构,web门户,联合系统等。如已经指出的,这里的技术也可以在松散耦合的服务器(包括基于“云”的)环境中实现。
更一般地,本文描述的主题可以采用完全硬件实施例,完全软件实施例或包含硬件和软件元素的实施例的形式。在优选实施例中,可信平台模块功能以软件实现,包括但不限于固件,驻留软件,微代码等。此外,下载和删除接口和功能可以采用可从计算机可用或计算机可读介质访问的计算机程序产品的形式,该计算机可用或计算机可读介质提供由计算机或任何指令执行系统使用或与其结合使用的程序代码。出于本说明书的目的,计算机可用或计算机可读介质可以是能够包含或存储程序以供指令执行系统,装置或设备使用或与其结合使用的任何装置。介质可以是电子,磁,光,电磁,红外或半导体系统(或装置或设备)。计算机可读介质的示例包括半导体或固态存储器,磁带,可移动计算机磁盘,随机存取存储器(RAM),只读存储器(ROM),刚性磁盘和光盘。光盘的当前示例包括压缩盘-只读存储器(CD-ROM),压缩盘-读/写(CD-R/W)和DVD。计算机可读介质是有形的,非暂时性的物品。
计算机程序产品可以是具有程序指令(或程序代码)的产品,以实现所描述的一个或多个功能。在通过网络从远程数据处理系统下载之后,那些指令或代码可以存储在数据处理系统中的非暂时性计算机可读存储介质中。或者,那些指令或代码可以存储在服务器数据处理系统中的计算机可读存储介质中,并且适于通过网络下载到远程数据处理系统,以用于远程系统内的计算机可读存储介质。
在代表性实施例中,接口和实用程序在专用计算平台中实现,优选地在由一个或多个处理器执行的软件中实现。软件保存在与一个或多个处理器相关联的一个或多个数据存储器或存储器中,并且软件可以实现为一个或多个计算机程序。总的来说,这种专用硬件和软件包括上述功能。
虽然以上描述了由本发明的某些实施例执行的特定操作顺序,但是应该理解,这种顺序是示例性的,因为替代实施例可以以不同的顺序执行操作,组合某些操作,重叠某些操作,等等。说明书中对给定实施例的引用指示所描述的实施例可以包括特定特征,结构或特性,但是每个实施例可以不必包括特定特征,结构或特性。
最后,虽然已经分别描述了系统的给定组件,但是普通技术人员将理解,可以在给定指令,程序序列,代码部分等中组合或共享一些功能。
本文的技术通常提供对技术或技术领域的上述改进,以及对诸如上文所述的工作负荷管理方案的具体技术改进。
已经描述了我们的发明,我们现在要求保护的内容如下。

Claims (26)

1.一种用于在计算环境中分配资源的方法,包括:
提供一组服务器资源池,其中服务器资源池包括一组共同类型的资源;
响应于接收到请求,定义由从两个或更多个服务器资源池中选择的一个或多个资源组成的服务器实体,其中基于与所述请求相关的预计工作量从所述两个或更多个服务器资源池中选择所述一个或多个资源;
接收在处理工作量时从监视所述一个或多个资源收集的信息;以及
基于该监视,基于工作负载的变化调整服务器实体的组成。
2.如权利要求1所述的方法,还包括:
将唯一服务器标识符与服务器实体相关联,唯一服务器标识符也与所选择的一个或多个资源中的每一个相关联;和
更新唯一服务器标识符以反映服务器实体的组成的调整。
3.如权利要求1所述的方法,其中所述共享服务器资源池是以下中的至少一个:计算池和存储器池。
4.如权利要求1所述的方法,其中通过向服务器实体添加服务器资源池的一个或多个资源来调整服务器实体的组成。
5.如权利要求4所述的方法,其中,添加到服务器实体的一个或多个资源是基于它们相对于已经存在于服务器实体中的其他资源的网络位置来选择的。
6.如权利要求1所述的方法,其中通过从服务器实体中移除服务器资源池的一个或多个资源来调整服务器实体的组成。
7.如权利要求6所述的方法,还包括:向资源服务器池返回从服务器实体移除的一个或多个资源。
8.如权利要求2所述的方法,还包括:
将唯一服务器标识符与和工作负载相关联的服务请求相关联;和
在给定资源处,在确定该服务请求与和给定资源相关联的相同唯一服务标识符相关联时,服务该服务请求。
9.用于在计算环境中分配资源的装置,包括:
一个或多个硬件处理器;
计算机存储器,保存由硬件处理器执行的计算机程序指令,并操作用于:
管理一组服务器资源池,其中服务器资源池包括一组共同类型的资源;
响应于接收到请求,定义由从两个或更多个服务器资源池中选择的一个或多个资源组成的服务器实体,其中基于与所述请求相关的预计工作量从所述两个或更多个服务器资源池中选择所述一个或多个资源;
接收在处理工作量时从监视一个或多个资源收集的信息;以及
基于所述监视,基于工作负载的变化调整服务器实体的组成。
10.如权利要求9所述的装置,其中所述计算机程序指令还用于:
将唯一服务器标识符与服务器实体相关联,唯一服务器标识符也与所选择的一个或多个资源中的每一个相关联;以及
更新唯一服务器标识符以反映服务器实体组成的调整。
11.如权利要求9所述的装置,其中所述共享服务器资源池是以下中的至少一个:计算池和存储器池。
12.如权利要求9所述的装置,其中通过向服务器实体添加服务器资源池的一个或多个资源来调整服务器实体的组成。
13.如权利要求12所述的装置,其中,添加到服务器实体的一个或多个资源是基于它们相对于已经存在于服务器实体中的其他资源的网络位置来选择的。
14.如权利要求9所述的装置,其中服务器实体的组成是通过从服务器实体中移除服务器资源池的一个或多个资源来进行调整的。
15.如权利要求14所述的装置,其中,所述计算机程序指令还用于将从所述服务器实体移除的所述一个或多个资源返回到所述资源服务器池。
16.如权利要求10所述的装置,其中所述计算机程序指令还用于:
将唯一服务器标识符与和工作负载关联的服务请求相关联;以及
在给定资源处,在确定服务请求与和给定资源相关联的相同唯一服务标识符相关联时,服务该服务请求。
17.一种用于数据处理系统的非暂时性计算机可读介质中的计算机程序产品,用于在计算环境中分配资源,该计算机程序产品保存在数据处理系统中执行的计算机程序指令并且可操作用于:
管理一组服务器资源池,其中服务器资源池包括一组共同类型的资源;
响应于接收到请求,定义由从两个或更多个服务器资源池中选择的一个或多个资源组成的服务器实体,其中基于与所述请求相关的预计工作量从所述两个或更多个服务器资源池中选择所述一个或多个资源;
接收在处理工作量时从监视一个或多个资源收集的信息;以及
基于所述监视,基于工作负载的变化调整服务器实体的组成。
18.如权利要求17所述的计算机程序产品,其中所述计算机程序指令还用于:
将唯一服务器标识符与服务器实体相关联,唯一服务器标识符也与所选择的一个或多个资源中的每一个相关联;以及
更新唯一服务器标识符以反映服务器实体组成的调整。
19.如权利要求17所述的计算机程序产品,其中所述共享服务器资源池是以下中的至少一个:计算池和存储器池。
20.如权利要求17所述的计算机程序产品,其中通过向服务器实体添加服务器资源池的一个或多个资源来调整服务器实体的组成。
21.如权利要求20所述的计算机程序产品,其中,添加到服务器实体的一个或多个资源是基于它们相对于已经存在于服务器实体中的其他资源的网络位置来选择的。
22.如权利要求17所述的计算机程序产品,其中服务器实体的组成是通过从服务器实体中移除服务器资源池的一个或多个资源来进行调整的。
23.如权利要求22所述的计算机程序产品,其中,所述计算机程序指令还用于将从所述服务器实体移除的所述一个或多个资源返回到所述资源服务器池。
24.如权利要求18所述的计算机程序产品,其中所述计算机程序指令还用于:
将唯一服务器标识符与和工作负载关联的服务请求相关联;以及
在给定资源处,在确定服务请求与和给定资源相关联的相同唯一服务标识符相关联时,服务该服务请求。
25.一种数据中心设备,包括:
一组服务器资源池,所述服务器资源池至少包括计算池和存储器池;
至少一个分散的计算系统,包括从计算池中选择的处理器,从存储器池中选择的计算机存储器,以及光学互连;
存储定义分散的计算系统的唯一服务器标识符的数据库,该唯一服务器标识符在数据库中与分散的计算系统中的每个处理器和计算机存储器的标识符相关联;以及
跟踪系统,响应于分散的计算系统中的工作负载变化,以根据工作负载需求选择性地调整处理器或其中的计算机存储器的组成;
所述唯一服务器标识符在数据库中被更新以反映分散的计算系统的组成的调整。
26.如权利要求25所述的数据中心设备,其中基于以下之一选择处理器和计算机存储器:它们的位置,最适合预期工作负载,以及与该数据中心设备相关的未来扩展要求。
CN201780020246.7A 2016-04-07 2017-03-09 用于在计算环境中分配资源的方法、装置、介质和数据中心设备 Active CN108885554B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/093,082 US11153223B2 (en) 2016-04-07 2016-04-07 Specifying a disaggregated compute system
US15/093,082 2016-04-07
PCT/IB2017/051383 WO2017175079A1 (en) 2016-04-07 2017-03-09 Specifying disaggregated compute system

Publications (2)

Publication Number Publication Date
CN108885554A true CN108885554A (zh) 2018-11-23
CN108885554B CN108885554B (zh) 2022-02-18

Family

ID=59999836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780020246.7A Active CN108885554B (zh) 2016-04-07 2017-03-09 用于在计算环境中分配资源的方法、装置、介质和数据中心设备

Country Status (6)

Country Link
US (1) US11153223B2 (zh)
JP (1) JP6853829B2 (zh)
CN (1) CN108885554B (zh)
DE (1) DE112017000337T5 (zh)
GB (1) GB2557771B (zh)
WO (1) WO2017175079A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110784504A (zh) * 2019-08-29 2020-02-11 恒大智慧科技有限公司 智能分布式系统部署方法、系统及存储介质
CN111274022A (zh) * 2018-12-05 2020-06-12 北京华胜天成科技股份有限公司 服务器资源分配方法和系统
CN112199188A (zh) * 2019-07-08 2021-01-08 富士通株式会社 非暂态计算机可读记录介质、信息处理的方法和设备
CN115777192A (zh) * 2020-08-05 2023-03-10 国际商业机器公司 管理微服务间的通信

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10334334B2 (en) * 2016-07-22 2019-06-25 Intel Corporation Storage sled and techniques for a data center
US11138146B2 (en) * 2016-10-05 2021-10-05 Bamboo Systems Group Limited Hyperscale architecture
EP3791657A1 (en) * 2018-05-08 2021-03-17 Nokia Solutions and Networks Oy Method, computer program and circuitry for managing resources within a radio access network
US10637733B2 (en) 2018-09-25 2020-04-28 International Business Machines Corporation Dynamic grouping and repurposing of general purpose links in disaggregated datacenters
US11650849B2 (en) 2018-09-25 2023-05-16 International Business Machines Corporation Efficient component communication through accelerator switching in disaggregated datacenters
US10671557B2 (en) 2018-09-25 2020-06-02 International Business Machines Corporation Dynamic component communication using general purpose links between respectively pooled together of like typed devices in disaggregated datacenters
US11163713B2 (en) 2018-09-25 2021-11-02 International Business Machines Corporation Efficient component communication through protocol switching in disaggregated datacenters
US10831698B2 (en) 2018-09-25 2020-11-10 International Business Machines Corporation Maximizing high link bandwidth utilization through efficient component communication in disaggregated datacenters
US10802988B2 (en) 2018-09-25 2020-10-13 International Business Machines Corporation Dynamic memory-based communication in disaggregated datacenters
US11012423B2 (en) 2018-09-25 2021-05-18 International Business Machines Corporation Maximizing resource utilization through efficient component communication in disaggregated datacenters
US10915493B2 (en) 2018-09-25 2021-02-09 International Business Machines Corporation Component building blocks and optimized compositions thereof in disaggregated datacenters
US11182322B2 (en) 2018-09-25 2021-11-23 International Business Machines Corporation Efficient component communication through resource rewiring in disaggregated datacenters
US11050637B2 (en) 2018-09-26 2021-06-29 International Business Machines Corporation Resource lifecycle optimization in disaggregated data centers
US10761915B2 (en) 2018-09-26 2020-09-01 International Business Machines Corporation Preemptive deep diagnostics and health checking of resources in disaggregated data centers
US11188408B2 (en) 2018-09-26 2021-11-30 International Business Machines Corporation Preemptive resource replacement according to failure pattern analysis in disaggregated data centers
US10754720B2 (en) 2018-09-26 2020-08-25 International Business Machines Corporation Health check diagnostics of resources by instantiating workloads in disaggregated data centers
US10831580B2 (en) 2018-09-26 2020-11-10 International Business Machines Corporation Diagnostic health checking and replacement of resources in disaggregated data centers
US10838803B2 (en) 2018-09-26 2020-11-17 International Business Machines Corporation Resource provisioning and replacement according to a resource failure analysis in disaggregated data centers
US11164125B2 (en) * 2018-11-19 2021-11-02 Capital One Services, Llc Systems and methods for proactive infrastructure resource management for multiple application clusters
US10901918B2 (en) * 2018-11-29 2021-01-26 International Business Machines Corporation Constructing flexibly-secure systems in a disaggregated environment
US11275622B2 (en) * 2018-11-29 2022-03-15 International Business Machines Corporation Utilizing accelerators to accelerate data analytic workloads in disaggregated systems
CN113050874A (zh) * 2019-12-26 2021-06-29 华为技术有限公司 一种内存设置方法以及装置
US10817328B1 (en) * 2020-01-30 2020-10-27 Coupang Corp. Systems and methods for virtual server resource usage metric evaluation and performance tracking
JP7468651B2 (ja) 2020-06-26 2024-04-16 日本電信電話株式会社 サーバ群選択システム、サーバ群選択方法、および、プログラム
US11934875B2 (en) 2020-12-09 2024-03-19 Dell Products L.P. Method and system for maintaining composed systems
US11928515B2 (en) 2020-12-09 2024-03-12 Dell Products L.P. System and method for managing resource allocations in composed systems
US11442776B2 (en) * 2020-12-11 2022-09-13 Liqid Inc. Execution job compute unit composition in computing clusters
US20220237050A1 (en) * 2021-01-28 2022-07-28 Dell Products L.P. System and method for management of composed systems using operation data
US20230029380A1 (en) * 2021-07-06 2023-01-26 Unifabrix Ltd System and method of multilateral computer resource reallocation and asset transaction migration and management
US11947697B2 (en) 2021-07-22 2024-04-02 Dell Products L.P. Method and system to place resources in a known state to be used in a composed information handling system
US12013768B2 (en) 2021-07-22 2024-06-18 Dell Products L.P. Method and system for automated healing of hardware resources in a composed information handling system
US11928506B2 (en) 2021-07-28 2024-03-12 Dell Products L.P. Managing composition service entities with complex networks
US12008412B2 (en) 2021-07-28 2024-06-11 Dell Products Resource selection for complex solutions
US11588750B1 (en) 2021-09-16 2023-02-21 International Business Machines Corporation Dynamic orchestration of disaggregated resources
CN114650320B (zh) * 2022-03-10 2024-03-15 腾讯科技(深圳)有限公司 任务调度方法、装置、存储介质及电子设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040230762A1 (en) * 2003-05-15 2004-11-18 International Business Machines Corporation Methods, systems, and media for managing dynamic storage
US20080028107A1 (en) * 2006-07-28 2008-01-31 Jacob Cherian System and method for automatic reassignment of shared storage on blade replacement
US20090113124A1 (en) * 2007-10-25 2009-04-30 Kataoka Eri Virtual computer system and method of controlling the same
JP2012161033A (ja) * 2011-02-02 2012-08-23 Nippon Telegr & Teleph Corp <Ntt> リソース割当て装置およびリソース割当て方法
US20150012657A1 (en) * 2013-07-08 2015-01-08 International Business Machines Corporation Allocation of resources in a networked computing environment based on physical location mapping
US20150120887A1 (en) * 2013-10-31 2015-04-30 International Business Machines Corporation Deploying a cluster
US20150288753A1 (en) * 2014-04-02 2015-10-08 Netapp Inc. Remote monitoring pool management
CN105159784A (zh) * 2015-10-10 2015-12-16 浪潮(北京)电子信息产业有限公司 一种虚拟服务器的部署方法及系统
US20150381426A1 (en) * 2014-06-30 2015-12-31 Emc Corporation Dynamically composed compute nodes comprising disaggregated components
CN105357251A (zh) * 2015-09-24 2016-02-24 浪潮集团有限公司 一种资源池的管理系统及管理方法
CN105389196A (zh) * 2014-09-04 2016-03-09 中国石油化工股份有限公司 利用虚拟化技术进行地震资料处理的方法
CN105430027A (zh) * 2014-09-04 2016-03-23 中国石油化工股份有限公司 基于多资源尺度的负载均衡动态预调度方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11275551A (ja) * 1998-03-23 1999-10-08 Sony Corp 制御装置及び方法
US6823458B1 (en) * 1999-11-18 2004-11-23 International Business Machines Corporation Apparatus and method for securing resources shared by multiple operating systems
US20030014660A1 (en) * 2001-04-26 2003-01-16 Christopher Verplaetse PC card security system
US8489742B2 (en) * 2002-10-10 2013-07-16 Convergys Information Management Group, Inc. System and method for work management
US7530067B2 (en) * 2003-05-12 2009-05-05 International Business Machines Corporation Filtering processor requests based on identifiers
US8219752B1 (en) * 2008-03-31 2012-07-10 Amazon Technologies, Inc. System for caching data
JP5323554B2 (ja) * 2009-03-27 2013-10-23 株式会社日立製作所 ジョブ処理方法、ジョブ処理プログラムを格納したコンピュータ読み取り可能な記録媒体、および、ジョブ処理システム
US8943259B2 (en) * 2010-11-16 2015-01-27 Vmware, Inc. Relieving memory pressure in a host using database memory management
US9300548B2 (en) 2011-10-14 2016-03-29 Alcatel Lucent Providing dynamic reliability and security in communications environments
US20130173804A1 (en) * 2011-12-30 2013-07-04 Dell Products, Lp System and Method for Providing Effective Resource Reusability Management in a Virtualized Environment
US8954698B2 (en) 2012-04-13 2015-02-10 International Business Machines Corporation Switching optically connected memory
US9411648B2 (en) 2012-06-28 2016-08-09 Rackspace Us, Inc. Flexible resource configuration management for computing clusters
US9639435B2 (en) * 2013-11-11 2017-05-02 Hitachi, Ltd. Management computer and management method of computer system
US9553822B2 (en) 2013-11-12 2017-01-24 Microsoft Technology Licensing, Llc Constructing virtual motherboards and virtual storage devices
US9977618B2 (en) * 2013-12-27 2018-05-22 Intel Corporation Pooling of memory resources across multiple nodes
US9591064B2 (en) * 2014-03-31 2017-03-07 Verizon Patent And Licensing Inc. Method and apparatus for dynamic provisioning of communication services
CN103970587B (zh) 2014-04-21 2018-02-13 华为技术有限公司 一种资源调度的方法、设备和系统
US9766917B2 (en) * 2014-10-29 2017-09-19 Red Hat Israel, Ltd. Limited virtual device polling based on virtual CPU pre-emption
US10171382B2 (en) * 2015-06-23 2019-01-01 Advanced Micro Devices, Inc. Mechanism of identifying available memory resources in a network of multi-level memory modules
WO2017020235A1 (zh) * 2015-08-04 2017-02-09 华为技术有限公司 控制调度报文的方法和装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040230762A1 (en) * 2003-05-15 2004-11-18 International Business Machines Corporation Methods, systems, and media for managing dynamic storage
US20080028107A1 (en) * 2006-07-28 2008-01-31 Jacob Cherian System and method for automatic reassignment of shared storage on blade replacement
US20090113124A1 (en) * 2007-10-25 2009-04-30 Kataoka Eri Virtual computer system and method of controlling the same
JP2012161033A (ja) * 2011-02-02 2012-08-23 Nippon Telegr & Teleph Corp <Ntt> リソース割当て装置およびリソース割当て方法
US20150012657A1 (en) * 2013-07-08 2015-01-08 International Business Machines Corporation Allocation of resources in a networked computing environment based on physical location mapping
US20150120887A1 (en) * 2013-10-31 2015-04-30 International Business Machines Corporation Deploying a cluster
US20150288753A1 (en) * 2014-04-02 2015-10-08 Netapp Inc. Remote monitoring pool management
US20150381426A1 (en) * 2014-06-30 2015-12-31 Emc Corporation Dynamically composed compute nodes comprising disaggregated components
CN105389196A (zh) * 2014-09-04 2016-03-09 中国石油化工股份有限公司 利用虚拟化技术进行地震资料处理的方法
CN105430027A (zh) * 2014-09-04 2016-03-23 中国石油化工股份有限公司 基于多资源尺度的负载均衡动态预调度方法
CN105357251A (zh) * 2015-09-24 2016-02-24 浪潮集团有限公司 一种资源池的管理系统及管理方法
CN105159784A (zh) * 2015-10-10 2015-12-16 浪潮(北京)电子信息产业有限公司 一种虚拟服务器的部署方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DANIEL GMACH ET AL.: "《Satisfying Service Level Objectices in a Self-Managing Resource Pool》", 《2009 THIRD IEEE INTERNATIONAL CONFERENCE ON SELF-ADAPTIVE AND SELF-ORGANIZING SYSTEMS》 *
边爽: "《云计算系统资源弹性调度的评测方法研究》", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》 *
陈俊丽: "《 基于云计算服务的弹性负载均衡机制的研究与实现》", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274022A (zh) * 2018-12-05 2020-06-12 北京华胜天成科技股份有限公司 服务器资源分配方法和系统
CN111274022B (zh) * 2018-12-05 2024-05-14 北京华胜天成科技股份有限公司 服务器资源分配方法和系统
CN112199188A (zh) * 2019-07-08 2021-01-08 富士通株式会社 非暂态计算机可读记录介质、信息处理的方法和设备
CN110784504A (zh) * 2019-08-29 2020-02-11 恒大智慧科技有限公司 智能分布式系统部署方法、系统及存储介质
CN115777192A (zh) * 2020-08-05 2023-03-10 国际商业机器公司 管理微服务间的通信

Also Published As

Publication number Publication date
JP6853829B2 (ja) 2021-03-31
US11153223B2 (en) 2021-10-19
GB2557771A (en) 2018-06-27
GB201803301D0 (en) 2018-04-11
JP2019511051A (ja) 2019-04-18
CN108885554B (zh) 2022-02-18
DE112017000337T5 (de) 2018-09-27
GB2557771B (en) 2021-08-25
WO2017175079A1 (en) 2017-10-12
US20170295107A1 (en) 2017-10-12

Similar Documents

Publication Publication Date Title
CN108885554A (zh) 特定分散计算机系统
CN108885582A (zh) 存储器池结构的多租户存储器服务
US9916636B2 (en) Dynamically provisioning and scaling graphic processing units for data analytic workloads in a hardware cloud
US10489275B2 (en) Agentless distributed monitoring of microservices through a virtual switch
US10713071B2 (en) Method and apparatus for network function virtualization
US20180007127A1 (en) Managing software licenses in a disaggregated environment
Vaquero et al. Dynamically scaling applications in the cloud
CN103827825B (zh) 虚拟资源对象组件
CN107579931A (zh) 一种基于Kubernetes的区块链即服务资源适配方法
US11182322B2 (en) Efficient component communication through resource rewiring in disaggregated datacenters
CN109976667A (zh) 一种镜像管理方法、装置及系统
CN109155758A (zh) 虚拟基础架构
CN109075986A (zh) 一种网络功能实例的管理方法及相关设备
CN109074287A (zh) 基础设施资源状态
CN104780221A (zh) 中小企业知识产权综合服务平台系统
Mohamed et al. A survey of big data machine learning applications optimization in cloud data centers and networks
US10802988B2 (en) Dynamic memory-based communication in disaggregated datacenters
US11042665B2 (en) Data connectors in large scale processing clusters
US11650849B2 (en) Efficient component communication through accelerator switching in disaggregated datacenters
Panarello et al. Cloud federation to elastically increase mapreduce processing resources
Du et al. Big data, cloud computing, and internet of things
Chawla et al. Implementing microservices
Reali et al. Orchestration of cloud genomic services
US11876875B2 (en) Scalable fine-grained resource count metrics for cloud-based data catalog service
Patel et al. Distributed Storage Infrastructure: Foundations, Analytics, Tools, and Applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant