CN103210379B - 服务器系统、管理方法及设备 - Google Patents

服务器系统、管理方法及设备 Download PDF

Info

Publication number
CN103210379B
CN103210379B CN201280002787.4A CN201280002787A CN103210379B CN 103210379 B CN103210379 B CN 103210379B CN 201280002787 A CN201280002787 A CN 201280002787A CN 103210379 B CN103210379 B CN 103210379B
Authority
CN
China
Prior art keywords
service node
hardware resource
node device
resource
logical partition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280002787.4A
Other languages
English (en)
Other versions
CN103210379A (zh
Inventor
郑力
许利霞
张羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN103210379A publication Critical patent/CN103210379A/zh
Application granted granted Critical
Publication of CN103210379B publication Critical patent/CN103210379B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供一种服务器系统、管理方法及设备。其中,系统包括:管理设备、PCIE交换板和至少一个服务节点设备;管理设备通过PCIE交换板与每个服务节点设备连接;管理设备,用于通过PCIE交换板获取每个服务节点设备的硬件资源的信息,根据获取的信息构建物理资源池,并在物理资源池上建立逻辑分区。在本发明技术方案中,管理设备与服务节点设备通过PCIE交换板连接,提高了服务器系统中硬件资源使用的灵活性,进一步提高了整个系统的性能。

Description

服务器系统、管理方法及设备
技术领域
本发明涉及虚拟化技术,尤其涉及一种服务器系统、管理方法及设备。
背景技术
在服务器技术发展中,逻辑分区概念的提出有效的提高了服务器硬件资源的利用率。目前,服务器系统一般都是由多个服务节点设备互联组合形成,服务节点设备中的输入/输出(Input/Output,IO)资源之间采用传统的网线或电缆互联,服务节点设备中的中央处理单元(CentralProcessingUnit,CPU)之间采用快速通道互联(QuickPathInterconnect,QPI)线缆以及专用芯片互联。服务器管理系统在服务器系统的硬件资源上划分逻辑分区提供给业务使用。
但是,现有服务器系统中硬件资源的使用不够灵活,使得服务器系统的性能无法进一步提高。
发明内容
本发明实施例提供一种服务器系统、管理方法及设备,用以提高服务器系统中硬件资源使用的灵活性,进一步提高服务器系统的性能。
根据本发明实施例的第一方面提供一种服务器系统,包括:管理设备、高速外设组件互连PCIE交换板和至少一个服务节点设备;所述管理设备通过所述PCIE交换板与每个服务节点设备连接;
所述管理设备,用于通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息,根据获取的所述信息构建物理资源池,并在所述物理资源池上建立逻辑分区。
在所述第一方面的一可选实施方式中,所述管理设备具体用于将所述物理资源池包括的硬件资源的信息呈现给用户,接收所述用户的选中指令和划分指令,以建立所述逻辑分区,所述选中指令用于指示所述用户根据应用需求从所述物理资源池中选择的硬件资源,所述划分指令用于指示所述用户对所述选择的硬件资源进行分配形成的所述逻辑分区和所述逻辑分区包括的硬件资源。
在所述第一方面的一可选实施方式中,所述管理设备还用于在所述逻辑分区上电后,向所述用户呈现与所述逻辑分区对应的硬件平台,以使所述用户安装操作系统,所述硬件平台包括所述逻辑分区包括的硬件资源。
在所述第一方面的一可选实施方式中,所述管理设备还用于在所述逻辑分区包括的硬件资源的负载大于预设第一负载门限时,发出预警信息。
在所述第一方面的一可选实施方式中,所述管理设备还用于在所述逻辑分区包括的硬件资源的负载大于预设第一负载门限时,从所述物理资源池中选择空闲的硬件资源添加到所述逻辑分区中,并触发所述新添加的硬件资源的热插拔流程;或者
所述管理设备还用于在所述逻辑分区包括的硬件资源的负载小于预设第二负载门限时,从所述逻辑分区中移除过剩的硬件资源到所述物理资源池中,所述过剩的硬件资源是在所述逻辑分区中没有被利用或者利用率小于预设利用率门限的硬件资源。
在所述第一方面的一可选实施方式中,所述管理设备具体通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接;
所述管理设备具体用于通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息。
在所述第一方面的一可选实施方式中,所述管理设备具体通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接,并通过所述PCIE交换板与所述每个服务节点设备的管理控制器连接;
所述管理设备具体用于通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息,或者
所述管理设备具体用于根据存储的所述每个服务节点设备连接的第一端口和第二端口之间的对应关系,从所述每个服务节点设备的管理控制器获取所述每个服务节点设备的硬件资源的信息;
其中,所述每个服务节点设备的管理控制器用于监控所述每个服务节点设备的硬件资源的状态;第一端口为所述PCIE交换板上与所述每个服务节点设备的硬件资源连接的端口,第二端口为所述PCIE交换板上与所述每个服务节点设备的管理控制器连接的端口。
在所述第一方面的一可选实施方式中,所述管理设备具体通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接,并直接与所述每个服务节点设备的管理控制器连接;
所述管理设备具体用于通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息;或者
所述管理设备具体用于根据存储的所述每个服务节点设备连接的第一端口和第二端口之间的对应关系,从所述每个服务节点设备的管理控制器获取所述每个服务节点设备的硬件资源的信息;
其中,所述每个服务节点设备的管理控制器用于监控所述每个服务节点设备的硬件资源的状态;第一端口为所述PCIE交换板上与所述每个服务节点设备的硬件资源连接的端口,第二端口为所述管理设备上与所述每个服务节点设备的管理控制器连接的端口。。
根据本发明实施例的第二方面提供一种管理设备,包括:
监控模块,通过高速外设组件互连PCIE交换板与至少一个服务节点设备连接,用于通过所述PCIE交换板获取所述至少一个服务节点设备中的每个服务节点设备的硬件资源的信息,根据获取的所述信息构建物理资源池;
分区建立模块,用于在所述物理资源池上建立逻辑分区。
在所述第二方面的一可选实施方式中,所述分区建立模块具体用于将所述物理资源池包括的硬件资源的信息呈现给用户,并接收所述用户的选中指令和划分指令,以建立所述逻辑分区,所述选中指令用于指示所述用户根据应用需求从所述物理资源池中选择的硬件资源,所述划分指令用于指示所述用户对所述选择的硬件资源进行分配形成的所述逻辑分区和所述逻辑分区包括的硬件资源。
在所述第二方面的一可选实施方式中,所述分区建立模块还用于在所述逻辑分区上电后,向所述用户呈现与所述逻辑分区对应的硬件平台,以使所述用户安装操作系统,所述硬件平台包括所述逻辑分区包括的硬件资源。
在所述第二方面的一可选实施方式中,所述管理设备还包括:预警模块,用于在所述监控模块获取到所述逻辑分区包括的硬件资源的负载大于预设第一负载门限时,发出预警信息。
在所述第二方面的一可选实施方式中,所述分区建立模块还用于在所述监控模块获取到所述逻辑分区包括的硬件资源的负载大于预设第一负载门限时,从所述物理资源池中选择空闲的硬件资源添加到所述逻辑分区中,并触发所述新添加的硬件资源的热插拔流程;或者
所述分区建立模块还用于在所述监控模块获取到所述逻辑分区包括的硬件资源的负载小于预设第二负载门限时,从所述逻辑分区中移除过剩的硬件资源到所述物理资源池中,所述过剩的硬件资源是在所述逻辑分区中没有被利用或者利用率小于预设利用率门限的硬件资源。
在所述第二方面的一可选实施方式中,所述监控模块包括:
第一监控单元,通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接,用于通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息;
构建单元,用于根据所述第一监控单元获取的所述每个服务节点的硬件资源的信息,构建所述物理资源池。
在所述第二方面的一可选实施方式中,所述监控模块还包括:
第二监控单元,通过所述PCIE交换板或直接与所述每个服务节点设备的管理控制器连接,用于根据存储的所述每个服务节点设备连接的第一端口和第二端口之间的对应关系,从所述每个服务节点设备的管理控制器上获取所述每个服务节点设备的硬件资源的信息;
所述构建单元,还用于根据所述第一监控单元获取的所述每个服务节点的硬件资源的信息和/或所述第二监控单元获取的所述每个服务节点设备的硬件资源的信息,构建所述物理资源池;
其中,所述每个服务节点设备的管理控制器用于监控所述每个服务节点设备的硬件资源的状态;第一端口为所述PCIE交换板上与所述每个服务节点设备的硬件资源连接的端口,第二端口为所述管理设备上或所述PCIE交换板上与所述每个服务节点设备的管理控制器连接的端口。
根据本发明实施例的第三方面提供一种管理方法,包括:
管理设备通过高速外设组件互连PCIE交换板获取至少一个服务节点设备中的每个服务节点设备的硬件资源的信息;
所述管理设备根据获取的所述信息,构建物理资源池;
所述管理设备在所述物理资源池上建立逻辑分区;
其中,所述管理设备通过所述PCIE交换板与所述每个服务节点设备连接。
在所述第三方面的一可选实施方式中,所述管理设备在所述物理资源池上建立逻辑分区包括:
所述管理设备将所述物理资源池包括的硬件资源的信息呈现给用户,接收所述用户的选中指令和划分指令,以建立所述逻辑分区,所述选中指令用于指示所述用户根据应用需求从所述物理资源池中选择的硬件资源,所述划分指令用于指示所述用户对所述选择的硬件资源进行分配形成的所述逻辑分区和所述逻辑分区包括的硬件资源。
在所述第三方面的一可选实施方式中,所述方法还包括:所述管理设备在所述逻辑分区上电后,向所述用户呈现与所述逻辑分区对应的硬件平台,以使所述用户安装操作系统,所述硬件平台包括所述逻辑分区包括的硬件资源。
在所述第三方面的一可选实施方式中,所述方法还包括:所述管理设备在所述逻辑分区包括的硬件资源的负载大于预设第一负载门限时,发出预警信息。
在所述第三方面的一可选实施方式中,所述方法还包括:所述管理设备在所述逻辑分区包括的硬件资源的负载大于预设第一负载门限时,从所述物理资源池中选择空闲的硬件资源添加到所述逻辑分区中,并触发所述新添加的硬件资源的热插拔流程;或者
所述管理设备在所述逻辑分区包括的硬件资源的负载小于预设第二负载门限时,从所述逻辑分区中移除过剩的硬件资源到所述物理资源池中,所述过剩的硬件资源是在所述逻辑分区中没有被利用或者利用率小于预设利用率门限的硬件资源。
在所述第三方面的一可选实施方式中,所述管理设备通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接;
所述管理设备通过高速外设组件互连PCIE交换板获取至少一个服务节点设备中的每个服务节点设备的硬件资源的信息包括:
所述管理设备通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息。
在所述第三方面的一可选实施方式中,所述管理设备通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接,并通过所述PCIE交换板与所述每个服务节点设备的管理控制器连接;
所述管理设备通过高速外设组件互连PCIE交换板获取至少一个服务节点设备中的每个服务节点设备的硬件资源的信息包括:
所述管理设备通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息;或者
所述管理设备根据存储的所述每个服务节点设备连接的第一端口和第二端口之间的对应关系,从所述每个服务节点设备的管理控制器获取所述每个服务节点设备的硬件资源的信息;
其中,所述每个服务节点设备的管理控制器用于监控所述每个服务节点设备的硬件资源的状态;第一端口为所述PCIE交换板上与所述每个服务节点设备的硬件资源连接的端口,第二端口为所述PCIE上与所述每个服务节点设备的管理控制器连接的端口。
在所述第三方面的一可选实施方式中,所述管理设备通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接,并直接与所述每个服务节点设备的管理控制器连接;
所述管理设备通过高速外设组件互连PCIE交换板获取至少一个服务节点设备中的每个服务节点设备的硬件资源的信息包括:
所述管理设备通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息,或者
所述管理设备根据存储的所述每个服务节点设备连接的第一端口和第二端口之间的对应关系,从所述每个服务节点设备的管理控制器获取所述每个服务节点设备的硬件资源的信息;
其中,所述每个服务节点设备的管理控制器用于监控所述每个服务节点设备的硬件资源的状态;第一端口为所述PCIE交换板上与所述每个服务节点设备的硬件资源连接的端口,第二端口为所述管理设备上与所述每个服务节点设备的管理控制器连接的端口。
本发明实施例第一方面提供的服务器系统,管理设备与服务节点设备通过PCIE交换板连接,管理设备通过PCIE交换板获取各个服务节点设备的硬件资源的信息,并根据获取的硬件资源的信息构建物理资源池,进而在物理资源池上建立逻辑分区,充分利用PCIE交换板在物理资源层面实现了屏蔽物理拓扑信息的物理资源池,提高了物理资源池中的硬件资源使用的灵活性,从而有效提高了整个系统的性能。
本发明实施例第二方面提供的管理设备,与服务节点设备通过PCIE交换板连接,通过PCIE交换板获取各个服务节点设备的硬件资源的信息,并根据获取的硬件资源的信息构建物理资源池,进而在物理资源池上建立逻辑分区,充分利用PCIE交换板在物理资源层面实现了屏蔽物理拓扑信息的物理资源池,提高了物理资源池中的硬件资源使用的灵活性,从而有效提高了整个系统的性能。
本发明实施例第三方面提供的管理方法,管理设备通过高速外设组件互连PCIE交换板获取各个服务节点设备的硬件资源的信息,并根据获取的硬件资源的信息构建物理资源池,进而在物理资源池上建立逻辑分区,充分利用PCIE交换板在物理资源层面实现了屏蔽物理拓扑信息的物理资源池,提高了物理资源池中的硬件资源使用的灵活性,从而有效提高了整个系统的性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的服务器系统的结构示意图;
图2为本发明一实施例给出的一种服务器系统的具体结构的示意图;
图3为本发明一实施例提供的管理设备通过PCIE交换板与计算节点的CPU和管理控制器分别连接的结构示意图;
图4为本发明一实施例提供的逻辑分区的一种结构示意图;
图5为本发明一实施例提供的在物理资源池以及在物理资源池上构建的逻辑分区的整体结构示意图;
图6为本发明一实施例提供的管理设备的结构示意图;
图7为本发明另一实施例提供的管理设备的结构示意图;
图8为本发明一实施例提供的管理方法的流程图;
图9为本发明另一实施例提供的管理方法的结构示意图;
图10为本发明又一实施例提供的管理方法的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一实施例提供的服务器系统的结构示意图。如图1所示,本实施例的系统包括:管理设备11、高速外设组件互连(PeripheralComponentInterconnectExpress,PCIE)交换板12和至少一个服务节点设备13。其中,管理设备11通过PCIE交换板12与每个服务节点设备13连接。PCIE交换板12具有高带宽、低延迟等特性与优点。
其中,本实施例中的服务节点设备13可以是各种类型的服务节点设备,例如,IO节点,计算节点,存储节点,内存扩展板,风扇板,电源板等模块。
管理设备11,用于通过PCIE交换板12获取每个服务节点设备13的硬件资源的信息,根据获取的每个服务节点设备的硬件资源的信息构建物理资源池,并在所述物理资源池上建立逻辑分区。本文中的硬件资源指的是构成服务器系统的实际硬件,更具体地,硬件资源可以是例如一颗CPU,一张内存卡、一块硬盘等,可以由服务器系统实现对计算节点、存储节点、IO节点中的硬件资源的池化管理,形成物理资源池,资源池内部可以细分为例如CPU池、内存池、IO资源池、网卡池等。其中,每个服务节点设备13的硬件资源的信息包括例如网卡、CPU、内存、存储设备的在位信息、故障信息、负载、温度等硬件资源的状态信息,进一步还可以包括例如内存大小、CPU频率、生产厂家等硬件资源的设备属性信息。
具体的,管理设备11可以通过PCIE交换板12获取每个服务节点设备13的硬件资源的信息,并根据硬件资源的信息中包含的硬件资源的容量、型号等属性信息以及状态信息,用其中可用的硬件资源构成物理资源池,然后在所构建的物理资源池上建立逻辑分区。
在本实施例中,管理设备与服务节点设备通过PCIE交换板连接,管理设备通过PCIE交换板获取各个服务节点设备的硬件资源的信息,并根据获取的硬件资源的信息构建物理资源池,进而在物理资源池上建立逻辑分区,充分利用PCIE交换板在物理资源层面实现了屏蔽物理拓扑信息的物理资源池,提高了物理资源池中的硬件资源使用的灵活性,使逻辑分区动态可调,从而有效提高了整个系统的性能。
进一步,本实施例中的IO节点的硬件资源是指IO资源,计算节点的硬件资源是指CPU资源,存储节点的硬件资源是指硬盘驱动器(HardDiskDrive,HDD)、固态硬盘(SolidStateDisk,SSD)等各种存储资源。可选的,每个服务节点设备13除了包括上述硬件资源之外,还可以包括管理控制器。管理控制器可以一直保持上电状态,主要用于在异常情况下,供管理设备11获取服务节点设备13的硬件资源的信息,例如,服务节点设备13中的某个硬件资源断电导致管理设备11无法从硬件资源获取该硬件资源的信息,则管理设备11可以通过该服务节点设备13的管理控制器获取该硬件资源的信息,另外在正常情况下,也可以通过管理控制器获取服务节点设备13的硬件资源的信息。可选的,管理控制器可以是基板管理控制器(BaseboardManagementController,BMC),还可以是实现类BMC功能的逻辑器件。
在本实施例提供的服务器系统中,各种类型的服务节点设备根据需要可以部署一个或者多个,计算节点、存储节点等通常为多个,可以根据需要进行服务器系统的扩展。
PCIE交换板12上可以包括千M以太网(GigabitEthernet,GE)接口、快速以太网(FastEthernet,FE)接口和/或PCIE接口,管理设备11可以通过GE接口、FE接口和PCIE接口中的至少一种与每个服务节点设备13连接。在此说明,上述GE接口、FE接口和PCIE接口在具体实现上可以在一块PCIE交换板12上,也可以是在多块PCIE交换板12上。
基于上述,图2给出一种服务器系统的具体结构。在图2中,管理设备11通过PCIE交换板12上的PCIE接口与IO节点131、计算节点132、存储节点133等服务节点设备的硬件资源连接,管理设备11通过PCIE交换板12上的GE接口与IO节点131、计算节点132、存储节点133等的管理控制器连接。在图2中,整个服务器系统中的风扇板14等共用模块直接通过其管理控制器与管理设备11连接,但不限于此,风扇板14之外的其他服务节点设备,例如IO节点131、计算节点132、存储节点133等的管理控制器也可以直接与管理设备11连接。也就是说,服务节点设备的管理控制器可以直接与管理设备11连接,而不用通过PCIE交换板12,但服务节点设备13的硬件资源一定要通过PCIE交换板12与管理设备11连接。
基于上述可知,管理设备11与服务节点设备13之间的连接方式以及每种连接方式下的信息获取方式包括但不限于如下几种:
管理设备11具体可以通过PCIE交换板12与每个服务节点设备13的硬件资源连接,则管理设备11可以通过PCIE交换板12监控每个服务节点设备13的硬件资源的状态,进而通过PCIE交换板12获取每个服务节点设备13的硬件资源的信息。
除此之外,管理设备11具体还可以通过PCIE交换板12与每个服务节点设备13的硬件资源连接,并通过PCIE交换板12与每个服务节点设备13的管理控制器连接,则管理设备11可以通过PCIE交换板12监控每个服务节点设备13的硬件资源的状态,进而通过PCIE交换板12获取每个服务节点设备13的硬件资源的信息,或者,管理设备11也可以根据存储的每个服务节点设备13连接的第一端口和第二端口之间的对应关系,从每个服务节点设备13的管理控制器获取每个服务节点设备13的硬件资源的信息。其中,每个服务节点设备13的管理控制器用于监控每个服务节点设备13的硬件资源的状态。第一端口为PCIE交换板12上与每个服务节点设备13的硬件资源连接的端口,第二端口为PCIE交换板12上与每个服务节点设备13的管理控制器连接的端口。即,管理设备11可以通过PCIE交换板获取每个服务节点设备13的硬件资源的信息,也可以从每个服务节点设备13的管理控制器接收上报的每个服务节点设备13的硬件资源的信息,并根据存储的第一端口和第二端口之间的对应关系,确定管理控制器上报的信息所对应的硬件资源,从而获得每个服务节点设备13的硬件资源的信息。管理设备11可以通过PCIE交换板获取每个服务节点设备13的硬件资源的全部信息,也可以从管理控制器获取每个服务节点设备13的硬件资源的全部信息,也可以通过PCIE交换板获取硬件资源的一部分信息,从管理控制器获取另一部分信息。例如,通过管理控制器获取硬件资源的在位信息、厂家信息等,通过PCIE交换板获取硬件资源的负载信息等。
另外,管理设备11具体可以通过PCIE交换板12与每个服务节点设备13的硬件资源连接,并直接与每个服务节点设备13的管理控制器连接,则管理设备11具体可以通过PCIE交换板12监控每个服务节点设备13的硬件资源的状态,通过PCIE交换板12获取每个服务节点设备13的硬件资源的信息,或者,管理设备11也可以根据存储的每个服务节点设备13连接的第一端口和第二端口之间的对应关系,从每个服务节点设备13的管理控制器获取每个服务节点设备13的硬件资源的信息。其中,每个服务节点设备13的管理控制器用于监控每个服务节点设备13的硬件资源的状态;第一端口为PCIE交换板12上与每个服务节点设备13的硬件资源连接的端口,第二端口为管理设备11上与每个服务节点设备13的管理控制器连接的端口。即,管理设备11可以通过PCIE交换板获取每个服务节点设备13的硬件资源的信息,也可以从每个服务节点设备13的管理控制器接收上报的每个服务节点设备13的硬件资源的信息,并根据存储的第一端口和第二端口之间的对应关系,确定管理控制器上报的信息所对应的硬件资源,从而获得每个服务节点设备13的硬件资源的信息。管理设备11可以通过PCIE交换板获取每个服务节点设备13的硬件资源的全部信息,也可以从管理控制器获取每个服务节点设备13的硬件资源的全部信息,也可以通过PCIE交换板获取硬件资源的一部分信息,从管理控制器获取另一部分信息。例如,通过管理控制器获取硬件资源的在位信息、厂家信息等,通过PCIE交换板获取硬件资源的负载信息等。
其中,如果服务节点设备13的管理控制器与PCIE交换板12连接,则第二端口是PCIE交换板12上的端口;如果服务节点设备13的管理控制器与管理设备11直接连接,则第二端口是管理设备11上的端口。其中,以计算节点132作为服务节点设备13为例,计算节点132的一个CPU与管理设备11互联、以及计算节点132的管理控制器与管理设备11互联的详细结构如图3所示。管理设备11分别与PCIE交换板12上的GE接口和PCIE接口连接,计算节点132的管理控制器与GE接口的端口10(Port10)连接,计算节点132的该CPU与PCIE接口的端口20(Port20)连接。图3中仅示出一个CPU通过PCIE接口与管理设备11连接,但不限于此,当计算节点132包括多个CPU时,每个CPU分别通过一个PCIE接口与管理设备11连接。其中,Port10属于第二端口,Port20属于第一端口。管理设备11上存储有该计算节点132连接的Port10与Port20的对应关系,管理设备11通过该对应关系可以获取计算节点132上该CPU的信息,例如该CPU的槽号等。具体的,管理设备11上还存储有Port20与连接Port20的计算节点132上的CPU的标识与该CPU的槽号之间的对应关系,基于此,管理设备11可以通过Port10获取到计算节点132的管理控制器上报的该CPU的部分信息,例如CPU的在位信息、厂家信息等,进一步还可以根据Port10与Port20之间的对应关系获知该CPU所连接的Port20,然后根据获取的该CPU的标识获取该CPU的槽号、负载等其他信息。
在本实施例的一个可选实施方式中,管理设备11在物理资源池上建立逻辑分区的过程为:管理设备11用于将物理资源池包括的硬件资源的信息呈现给用户,接收用户的选中指令和划分指令,以建立所述逻辑分区。其中,选中指令用于指示用户根据应用需求从物理资源池中选择的硬件资源,划分指令用于指示用户对选中指令中所选择的硬件资源进行分配形成的逻辑分区和逻辑分区所包括的硬件资源。其中,管理设备11向用户呈现物理资源池包括的硬件资源的信息的功能相当于向用户提供了一个逻辑分区平台,以使用户在逻辑分区平台上进行硬件资源的选择以及逻辑分区的划分。在这里,由于使用PCIE交换板12进行管理设备11和服务节点设备13之间的互联,解决了使用网线、线缆等各种互联方式造成的各服务节点设备13的硬件资源之间的差异,同一类型的硬件资源的拓扑关系对用户来说是相同的,因此,在进行逻辑分区划分时可以仅考虑应用需求,而不需要考虑各硬件资源之间的差异,也不需要考虑各硬件资源构成的物理拓扑,有利于提高逻辑分区的划分效率。
对用户根据应用需求选择物理资源池中的硬件资源,并进行分配形成不同逻辑分区的过程进行举例说明。例如,在部署桌面云应用时,需要两个逻辑分区,分别承载桌面云终端业务和相关的数据库应用。根据评估得到:桌面云终端业务需要8个CPU,若干内存、存储,100张虚拟网卡;数据库应用需要2个CPU,若干内存、存储,一张虚拟网卡。则用户可以在管理设备11呈现出的逻辑分区平台上,根据要求进行CPU、内存、存储、网卡的选择,然后再将选择的CPU、内存、存储、网卡等硬件资源划分相应的CPU、内存、存储、网卡资源组成承载桌面云终端业务的逻辑分区和相关的数据库应用的逻辑分区即可。
在本实施例的一个可选实施方式中,在逻辑分区建立之后,管理设备11还用于在逻辑分区上电后,向用户呈现与所述逻辑分区对应的硬件平台,以使用户安装操作系统以及中间件或上层应用等。其中,硬件平台包括所述逻辑分区包括的硬件资源。其中,操作系统可以是普通操作系统也可以是虚拟操作系统。其中,在逻辑分区建立后,管理设备11通过向用户呈现每个逻辑分区中的硬件资源的信息,相当于向用户呈现一个个硬件平台,而每个硬件平台对用户来说就类似于普通的服务器或计算机。然后,用户可以在硬件平台上自行选择安装普通的操作系统或虚拟操作系统。其中,管理设备11向用户呈现逻辑分区对应的硬件平台的功能相当于在逻辑分区的硬件资源(可称为硬件层)上提供一个增强适配层。这里的增强适配层提供针对该逻辑分区的BIOS的作用,除此之外还提供开放硬件平台支持,各种虚拟化软件支持等。
基于上述,一种逻辑分区的结构如图4所示,从底向上依次包括硬件层、增强适配层和操作系统。
基于上述,本实施例提供一种管理设备11在物理资源池上建立的逻辑分区的整体结构,如图5所示。其中,物理资源池主要包括有CPU资源构成的CPU池、由IO资源构成的IO池和由MEM资源构成的内存(Memory,MEM)池,其中的CPU资源、IO资源和MEM资源为服务节点设备中的硬件资源;在该物理资源池上建立了N个逻辑分区,分别为逻辑分区1-逻辑分区N。每个逻辑分区以所包括的硬件资源作为硬件平台,硬件平台之上包括增强适配层、操作系统和应用程序。如图5所示,逻辑分区1的操作系统主要是普通操作系统,例如,Windows/Linux/unix等;逻辑分区N的操作系统是虚拟操作系统,需要先安装虚拟化操作系统,如vmware的ESX,在其上创建虚拟机(Virtualmachine,VM),然后才能为VM安装操作系统和应用程序等。其中,VMwareESX服务器是一种在通用环境下分区和整合系统的虚拟主机软件。由此可见,在本实施例的服务器系统中,由于使用PCIE交换板进行管理设备与服务节点设备之间的互联,充分利用PCIE交换板具有的高带宽、低延迟等特性与优点,使得所构建的物理资源池屏蔽了各硬件资源的物理拓扑信息,可以省去虚拟化管理软件层,解决了现有技术中必须通过虚拟化技术来屏蔽由于物理拓扑导致的硬件资源差异的问题,降低了管理成本,同时提高了性能。
在本实施例的一个可选实施方式中,管理设备11还用于在逻辑分区包括的硬件资源的负载大于预设第一负载门限时,发出预警信息。
在本实施例的一个可选实施方式中,管理设备11还用于在逻辑分区包括的硬件资源的负载大于预设第一负载门限时,从所构建的物理资源池中选择空闲的硬件资源添加到逻辑分区中,并触发新添加的硬件资源的热插拔流程。其中,新添加的硬件资源的热插拔流程会因新添加的硬件资源的不同而不同。举例说明,如果新添加的硬件资源为网卡资源,则相应的热插拔流程主要是为新添加的硬件资源增加驱动等操作。如果新添加的硬件资源为CPU,则相应的热插拔流程主要是CPU的热插拔、上线(online)、下线(offline)等流程。
在上述可选实施方式中,管理设备11可以在逻辑分区运行过程中,通过监控每个服务节点设备13的硬件资源的状态,获取逻辑分区中的硬件资源的负载情况,并在发现逻辑分区包括的硬件资源的负载大于预设第一负载门限时,发出预警信息和/或为逻辑分区新添加硬件资源,并在新添加硬件资源后触发热插拔流程。
上述第一负载门限可以是负载门限中的上门限,但不限于此。
进一步,管理设备11还可以在逻辑分区包括的硬件资源的负载小于预设第二负载门限时,从逻辑分区中移除过剩的硬件资源到所述物理资源池中。其中,第二负载门限可以是负载门限中的下门限。所述过剩的硬件资源是指在该逻辑分区中没有被利用的硬件资源或者利用率较低的硬件资源,移除逻辑分区中过剩的硬件资源到物理资源池有利于提高硬件资源的利用率。上述利用率较低的硬件资源通常是指利用率低于预设利用率门限的硬件资源,所述利用率门限可以根据不同应用场景设置不同的取值。
在此说明,上述第一负载门限大于第二负载门限,关于第一负载门限和第二负载门限的具体数值不做限定。
由上述可见,本实施例的管理设备11可以在逻辑分区运行时,通过获取逻辑分区中的硬件资源的信息,根据硬件资源的信息灵活调整逻辑分区中的硬件资源,管理IO、CPU等硬件资源的热插拔,实现对逻辑分区的动态管理。结合上述,对逻辑分区的动态管理具体可以由管理设备11提供的增强适配层实现。
由上述可见,本发明实施例通过PCIE交换板实现管理设备与服务节点设备之间的互联,充分利用PCIE交换板实现了系统中的硬件资源的自由调度,使逻辑分区不受物理资源拓扑的影响,提升了逻辑分区的创建与使用效率;使得用户不需要感知PCIE交换架构的差异,可以在物理资源池上直接进行逻辑分区操作,可以省去虚拟化管理软件层,降低管理成本,同时提高了性能;另外,在逻辑分区运行过程中,通过对硬件资源的监控,实现了动态逻辑分区的管理方案,实现了IO等物理资源的灵活分配、热插拔等。
图6为本发明一实施例提供的管理设备的结构示意图。如图6所示,本实施例的管理设备包括:监控模块61和分区建立模块62。
其中,监控模块61,通过PCIE交换板与至少一个服务节点设备连接,用于通过PCIE交换板获取至少一个服务节点设备中的每个服务节点设备的硬件资源的信息,根据获取的所述信息构建物理资源池。分区建立模块62,与监控模块61连接,用于在监控模块61构建的物理资源池上建立逻辑分区。
本实施例中的服务节点设备可以是各种类型的服务节点设备,例如,IO节点,计算节点,存储节点,内存扩展板,风扇板,电源板等模块。其中,IO节点的硬件资源是指IO资源,计算节点的硬件资源是指CPU资源,存储节点的硬件资源是指HDD、SSD等各种存储资源。
本实施例的管理设备与服务节点设备通过PCIE交换板连接,管理设备通过PCIE交换板获取各个服务节点设备的硬件资源的信息,并根据获取的硬件资源的信息构建物理资源池,进而在物理资源池上建立逻辑分区,充分利用PCIE交换板在物理资源层面实现了屏蔽物理拓扑信息的物理资源池,提高了物理资源池中的硬件资源的使用灵活性,从而有效提高了整个系统的性能。
图7为本发明另一实施例提供的管理设备的结构示意图。本实施例基于图6所示实施例实现,如图7所示,本实施例的管理设备也包括:监控模块61和分区建立模块62。
可选的,每个服务节点设备除了包括硬件资源之外,还可以包括管理控制器。管理控制器可以一直保持上电状态,主要用于在异常情况下,供管理设备获取服务节点设备的硬件资源的信息。当然在正常情况下,管理控制器也可以获取服务节点设备的硬件资源的信息。
基于上述,本实施例的监控模块61具体包括第一监控单元611和构建单元613。
其中,第一监控单元611,通过PCIE交换板与每个服务节点设备的硬件资源连接,用于通过PCIE交换板监控每个服务节点设备的硬件资源的状态,通过PCIE交换板获取每个服务节点设备的硬件资源的信息。PCIE交换板上可以包括GE、FE和/或PCIE接口,第一监控单元611可以通过GE、FE和PCIE接口中的任何一种接口与每个服务节点设备的硬件资源连接。
构建单元613,与第一监控单元611连接,用于根据第一监控单元611获取的每个服务节点的硬件资源的信息,构建上述物理资源池。
进一步,本实施例的监控模块61还包括:第二监控单元612。第二监控单元612,通过PCIE交换板或者直接与每个服务节点设备的管理控制器连接,用于根据存储的每个服务节点设备连接的第一端口和第二端口之间的对应关系,从每个服务节点设备的管理控制器上获取每个服务节点设备的硬件资源的信息。同理,如果第二监控单元612通过PCIE交换板与服务节点设备的管理控制器连接,则第二监控单元612也可以通过GE、FE和PCIE接口中的任何一种接口与每个服务节点设备的管理控制器连接。此外,第二监控单元612也可以直接与服务节点设备的管理控制器连接,而不通过PCIE交换板。
构建单元613,还与第二监控单元612连接,还用于根据第一监控单元611获取的每个服务节点的硬件资源的信息和/或第二监控单元612获取的每个服务节点设备的硬件资源的信息,构建物理资源池。
其中,每个服务节点设备的管理控制器用于监控每个服务节点设备的硬件资源的状态;第一端口为PCIE交换板上与服务节点设备的硬件资源连接的端口,第二端口为与所述服务节点设备的管理控制器连接的端口。如果第二监控单元612通过PCIE交换板与服务节点设备的管理控制器连接,则第二端口可以是PCIE交换板12上的端口,如果第二监控单元612直接与服务节点设备的管理控制器连接,则第二端口可以是管理设备上的端口(更为具体的该端口可以是第二监控单元612上的端口)。可以由第一监控单元611通过PCIE交换板获取每个服务节点设备的硬件资源的信息,也可以由第二监控单元612从每个服务节点设备的管理控制器接收上报的每个服务节点设备的硬件资源的信息,并根据存储的第一端口和第二端口之间的对应关系,确定管理控制器上报的信息所对应的硬件资源,从而获得每个服务节点设备的硬件资源的信息。可以由第一监控单元611通过PCIE交换板获取每个服务节点设备的硬件资源的全部信息,也可以由第二监控单元612从管理控制器获取每个服务节点设备的硬件资源的全部信息,也可以由第一监控单元611通过PCIE交换板获取硬件资源的一部分信息,而由第二监控单元612从管理控制器获取另一部分信息。
其中,以计算节点作为服务节点设备为例,本实施例的监控模块61通过第一监控单元611和第二监控单元612分别与计算节点的每个CPU资源和计算节点的管理控制器互联的详细结构如图3所示。
进一步,本实施例的分区建立模块62具体用于将监控模块61构建的物理资源池包括的硬件资源的信息呈现给用户,接收用户发出的选中指令和划分指令,以建立所述逻辑分区。其中,选中指令用于指示用户根据应用需求从物理资源池中选择的硬件资源,划分指令用于指示用户对所选择的硬件资源进行分配形成的所述逻辑分区和所述逻辑分区包括的硬件资源。其中,分区建立模块62向用户呈现物理资源池包括的硬件资源的信息的功能相当于向用户提供了一个逻辑分区平台,以使用户在逻辑分区平台上进行逻辑分区的划分。在这里,由于管理设备使用PCIE交换板和服务节点设备之间互联,解决了使用网线、线缆等各种互联方式造成的各服务节点设备的硬件资源之间差异,同一类型的硬件资源的拓扑关系对用户来说是相同的,因此,在进行逻辑分区划分时可以仅考虑应用需求,而不需要考虑各硬件资源之间的差异,也不需要考虑各硬件资源构成的物理拓扑,有利于提高逻辑分区的划分效率。
对用户根据应用需求选择物理资源池中的硬件资源,并进行分配形成不同逻辑分区的过程进行的举例说明可参见上述系统实施例的描述。
进一步,本实施例的分区建立模块62还用于在逻辑分区上电后,向用户呈现与逻辑分区对应的硬件平台,以使用户安装操作系统。其中,硬件平台包括逻辑分区包括的硬件资源。其中,操作系统可以是普通操作系统也可以是虚拟操作系统。其中,在逻辑分区建立后,分区建立模块62通过向用户呈现每个逻辑分区中的硬件资源的信息,相当于向用户呈现一个个硬件平台,而每个硬件平台对用户来说就类似于普通的服务器或计算机。然后,用户可以在硬件平台上自行选择安装普通的操作系统或虚拟操作系统。其中,分区建立模块62向用户呈现逻辑分区对应的硬件平台的功能相当于在逻辑分区的硬件资源(可称为硬件层)上提供一个增强适配层。这里的增强适配层提供针对该逻辑分区的BIOS的作用,除此之外还提供开放硬件平台支持,各种虚拟化软件支持等。
本实施例管理设备通过监控模块61和分区建立模块62构建的逻辑分区的一种结构如图4所示。本实施例管理设备通过监控模块61和分区建立模块62构建的物理资源池以及在物理资源池上建立的逻辑分区的整体结构如图5所示。
进一步,本实施例的管理设备还包括:预警模块63。该预警模块63与监控模块61连接,用于在监控模块61获取到逻辑分区包括的硬件资源的负载大于预设第一负载门限时,发出预警信息。具体的,预警模块63分别与第一监控单元611和第二监控单元612连接。
其中,监控模块61可以通过PCIE交换板监控每个服务节点设备的硬件资源的状态,获取逻辑分区中的硬件资源的负载情况。或者,监控模块61也可以通过每个服务节点设备的管理控制器获取每个服务节点设备的硬件资源的状态,进而获取逻辑分区中的硬件资源的负载情况。
进一步,本实施例的分区建立模块62还用于在监控模块61获取到逻辑分区包括的硬件资源的负载大于预设第一负载门限时,从物理资源池中选择空闲的硬件资源添加到所述逻辑分区中,并触发新添加的硬件资源的热插拔流程。
其中,新添加的硬件资源的热插拔流程会因新添加的硬件资源的不同而不同。举例说明,如果新添加的硬件资源为网卡资源,则相应的热插拔流程主要是为新添加的硬件资源增加驱动等操作。如果新添加的硬件资源为CPU,则相应的热插拔流程主要是CPU的热插拔、online、offline等流程。
上述第一负载门限可以是负载门限中的上门限,但不限于此。
进一步,分区建立模块62还可以在逻辑分区包括的硬件资源的负载小于预设第二负载门限时,从逻辑分区中移除过剩的硬件资源到所述物理资源池中。其中,第二负载门限可以是负载门限中的下门限。所述过剩的硬件资源是指在该逻辑分区中没有被利用的硬件资源或者利用率较低的硬件资源,移除逻辑分区中过剩的硬件资源到物理资源池中有利于提高硬件资源的利用率。上述利用率较低的硬件资源通常是指利用率小于预设利用率门限的硬件资源,所述利用率门限可以根据实际需求设置不同的值。
在此说明,上述第一负载门限大于第二负载门限,关于第一负载门限和第二负载门限的具体数值不做限定。
由上述可见,本实施例的分区建立模块62可以在逻辑分区运行时,通过获取逻辑分区中的硬件资源的信息,根据硬件资源的信息灵活调整逻辑分区中的硬件资源,管理IO、CPU等硬件资源的热插拔,实现对逻辑分区的动态管理。结合上述,对逻辑分区的动态管理具体可以由分区建立模块62提供的增强适配层实现。
由上述可见,本实施例的管理设备通过PCIE交换板实现与服务节点设备之间的互联,利用PCIE交换板实现了系统中的硬件资源的自由调度,使逻辑分区不受物理资源拓扑的影响,提升了逻辑分区的创建与使用效率;使得用户不需要感知PCIE交换架构的差异,可以在物理资源池上直接进行逻辑分区操作,可以省去虚拟化管理软件层,降低管理成本,同时提高了性能;另外,在逻辑分区运行过程中,通过对硬件资源的监控,实现了动态逻辑分区的管理方案,实现了IO等物理资源的灵活分配、热插拔等。
图8为本发明一实施例提供的管理方法的流程图。如图8所示,本实施例的方法包括:
步骤801、管理设备通过PCIE交换板获取至少一个服务节点设备中的每个服务节点设备的硬件资源的信息。
步骤802、管理设备根据获取的所述信息,构建物理资源池。
步骤803、管理设备在上述物理资源池上建立逻辑分区。
其中,管理设备通过PCIE交换板与每个服务节点设备连接。
本实施例的服务节点设备可以是各种类型的服务节点设备,例如,IO节点,计算节点,存储节点,内存扩展板,风扇板,电源板等模块。其中,IO节点的硬件资源是指IO资源,计算节点的硬件资源是指CPU资源,存储节点的硬件资源是指HDD、SSD等各种存储资源。
在本实施例的一个可选实施方式中,管理设备通过PCIE交换板与每个服务节点设备的硬件资源连接。则步骤801的具体实施方式包括:管理设备通过PCIE交换板监控每个服务节点设备的硬件资源的状态,通过PCIE交换板获取每个服务节点设备的硬件资源的信息。具体的,管理设备与每个服务节点设备之间的交互通过PCIE交换板实现。在该实施方式中,管理设备可以通过PCIE交换板与每个服务节点设备的管理控制器连接,也可以直接与每个服务节点设备的管理控制器连接。
在本实施例的一个可选实施方式中,管理设备通过PCIE交换板与每个服务节点设备的硬件资源连接,并通过PCIE交换板与每个服务节点设备的管理控制器连接。基于此,步骤801的具体实施方式包括:管理设备通过PCIE交换板监控每个服务节点设备的硬件资源的状态,通过PCIE交换板获取每个服务节点设备的硬件资源的信息,或者管理设备根据存储的每个服务节点设备连接的第一端口和第二端口之间的对应关系,从每个服务节点设备的管理控制器获取每个服务节点设备的硬件资源的信息。其中,每个服务节点设备的管理控制器用于监控每个服务节点设备的硬件资源的状态。第一端口为PCIE交换板上与每个服务节点设备的硬件资源连接的端口,第二端口为PCIE交换板上与每个服务节点设备的管理控制器连接的端口。即,管理设备可以通过PCIE交换板获取每个服务节点设备的硬件资源的信息,也可以从每个服务节点设备的管理控制器接收上报的每个服务节点设备的硬件资源的信息,并根据存储的第一端口和第二端口之间的对应关系,确定管理控制器上报的信息所对应的硬件资源,从而获得每个服务节点设备的硬件资源的信息。管理设备可以通过PCIE交换板获取每个服务节点设备的硬件资源的全部信息,也可以从管理控制器获取每个服务节点设备的硬件资源的全部信息,也可以通过PCIE交换板获取硬件资源的一部分信息,从管理控制器获取另一部分信息。
在本实施例的一个可选实施方式中,管理设备通过PCIE交换板与每个服务节点设备的硬件资源连接,并直接与服务节点设备的管理控制器连接。基于此,步骤801的具体实施方式包括:管理设备通过PCIE交换板监控每个服务节点设备的硬件资源的状态,通过PCIE交换板获取每个服务节点设备的硬件资源的信息,或者管理设备根据存储的每个服务节点设备连接的第一端口和第二端口之间的对应关系,从每个服务节点设备的管理控制器获取每个服务节点设备的硬件资源的信息。其中,每个服务节点设备的管理控制器用于监控每个服务节点设备的硬件资源的状态。第一端口为PCIE交换板上与每个服务节点设备的硬件资源连接的端口,第二端口为管理设备上与每个服务节点设备的管理控制器连接的端口。也就是说,第二端口可以是PCIE交换板上的端口,也可以是管理设备上的端口。当管理设备通过PCIE交换板与服务节点设备的管理控制器连接时,第二端口为PCIE交换板上的端口;当管理设备直接与服务节点设备的管理控制器连接,而不通过PCIE交换板时,第二端口为管理设备上的端口。即,管理设备可以通过PCIE交换板获取每个服务节点设备的硬件资源的信息,也可以从每个服务节点设备的管理控制器接收上报的每个服务节点设备的硬件资源的信息,并根据存储的第一端口和第二端口之间的对应关系,确定管理控制器上报的信息所对应的硬件资源,从而获得每个服务节点设备的硬件资源的信息。管理设备可以通过PCIE交换板获取每个服务节点设备的硬件资源的全部信息,也可以从管理控制器获取每个服务节点设备的硬件资源的全部信息,也可以通过PCIE交换板获取硬件资源的一部分信息,从管理控制器获取另一部分信息。
在本实施例的一个可选实施方式中,步骤803的实施方式包括:管理设备将物理资源池包括的硬件资源的信息呈现给用户,接收用户的选中指令和划分指令,以建立所述逻辑分区。其中,选中指令用于指示用户根据应用需求从物理资源池中选择的硬件资源,划分指令用于指示用户对所选择的硬件资源进行分配形成的所述逻辑分区和所述逻辑分区包括的硬件资源。该过程相当于向用户提供了一个逻辑分区平台,以便于用户进行逻辑分区的划分。
在本实施例提供的管理方法中,管理设备与服务节点设备通过PCIE交换板连接,管理设备通过PCIE交换板获取各个服务节点设备的硬件资源的信息,并根据获取的硬件资源的信息构建物理资源池,进而在物理资源池上建立逻辑分区,充分利用PCIE交换板在物理资源层面实现了屏蔽物理拓扑信息的物理资源池,提高了物理资源池中的硬件资源使用的灵活性,从而有效提高了整个系统的性能。
图9为本发明另一实施例提供的管理方法的结构示意图。如图9所示,本实施例的方法包括:
步骤901、在旁路(standby)供电情况下,管理设备获取每个服务节点设备的硬件资源的信息。
具体的,管理设备可以通过PCIE交换板监控各服务节点设备的硬件资源的状态,通过PCIE交换板与每个服务节点设备进行交互,获取每个服务节点设备的硬件资源的信息。或者
管理设备还可以通过每个服务节点设备的管理控制器,接收管理控制器上报的管理控制器所在服务节点设备的硬件资源的信息。
步骤902、管理设备根据每个服务节点设备的硬件资源的信息,构建物理资源池。
步骤903、管理设备通过UI等方式将物理资源池呈现给用户,以使用户进行逻辑分区的划分。
步骤904、用户根据应用需求进行逻辑分区的划分。
步骤905、逻辑分区上电后,管理设备提供的增强适配层生效,向用户呈现该逻辑分区对应的硬件平台。
可选的,每个逻辑分区对应的硬件平台可以包括:CPU、IO、MEM等资源。
步骤906、用户在硬件平台上安装操作系统、中间及上层应用软件等,进行应用。
由上述可见,管理设备与服务节点设备通过PCIE交换板连接,管理设备通过PCIE交换板获取各个服务节点设备的硬件资源的信息,并根据获取的硬件资源的信息构建物理资源池,进而在物理资源池上建立逻辑分区,充分利用PCIE交换板在物理资源层面实现了屏蔽物理拓扑信息的物理资源池,即不再受现有技术中的互联方式的限制,使得物理资源池中的硬件资源可以灵活分配,使逻辑分区动态可调,从而有效提高了整个系统的性能。
进一步,如图10所示管理方法,在步骤906之后,还包括:
步骤907、管理设备监控逻辑分区的硬件资源的负载情况。
步骤908、管理设备判断逻辑分区包括的硬件资源的负载是否大于预设第一负载门限;如果判断结果为是,执行步骤909;如果判断结构为否,返回继续执行步骤907。
步骤909、管理设备从物理资源池中选择空闲的硬件资源添加到该逻辑分区中,并触发所述新添加的硬件资源的热插拔流程。
其中,新添加的硬件资源与负载超过第一负载门限的硬件资源属于同一类型,例如,如果负载超过第一负载门限的硬件资源是CPU,则新添加的硬件资源也是CPU资源;如果超过第一负载门限的硬件资源是IO,则新添加的硬件资源也是IO,等等。
进一步,步骤908的一可选实施方式还可以是:管理设备发出预警信息。
上述第一负载门限可以是负载门限中的上门限,但不限于此。
进一步可选的,管理设备还可以在逻辑分区包括的硬件资源的负载小于预设第二负载门限时,从逻辑分区中移除过剩的硬件资源到所述物理资源池中。其中,第二负载门限可以是负载门限中的下门限。所述过剩的硬件资源是指在该逻辑分区中没有被利用的硬件资源或者利用率较低的硬件资源,移除逻辑分区中过剩的硬件资源到物理资源池中有利于提高硬件资源的利用率。上述利用率较低的硬件资源通常是指利用率小于预设利用率门限的硬件资源,所述利用率门限可以根据实际需求设置不同的值。
在此说明,上述第一负载门限大于第二负载门限,关于第一负载门限和第二负载门限的具体数值不做限定。
由上述可见,本实施例提供的管理方法,在逻辑分区运行时,通过获取逻辑分区中的硬件资源的信息,根据硬件资源的信息灵活调整逻辑分区中的硬件资源,管理IO、CPU等硬件资源的热插拔,实现对逻辑分区的动态管理。结合上述,对逻辑分区的动态管理具体可以由管理设备提供的增强适配层实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (20)

1.一种服务器系统,其特征在于,包括:管理设备、高速外设组件互连PCIE交换板和至少一个服务节点设备;所述管理设备通过所述PCIE交换板与所述至少一个服务节点设备中的每个服务节点设备连接;
所述管理设备,用于通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息,根据获取的所述信息构建物理资源池,并在所述物理资源池上建立逻辑分区;
所述管理设备具体用于将所述物理资源池包括的硬件资源的信息呈现给用户,接收所述用户的选中指令和划分指令,以建立所述逻辑分区,所述选中指令用于指示所述用户根据应用需求从所述物理资源池中选择的硬件资源,所述划分指令用于指示所述用户对所述选择的硬件资源进行分配而形成的所述逻辑分区和所述逻辑分区包括的硬件资源。
2.根据权利要求1所述的服务器系统,其特征在于,所述管理设备还用于在所述逻辑分区上电后,向所述用户呈现与所述逻辑分区对应的硬件平台,以使所述用户安装操作系统,所述硬件平台包括所述逻辑分区包括的硬件资源。
3.根据权利要求1所述的服务器系统,其特征在于,所述管理设备还用于在所述逻辑分区包括的硬件资源的负载大于预设第一负载门限时,发出预警信息。
4.根据权利要求1所述的服务器系统,其特征在于,
所述管理设备还用于在所述逻辑分区包括的硬件资源的负载大于预设第一负载门限时,从所述物理资源池中选择空闲的硬件资源添加到所述逻辑分区中,并触发新添加的硬件资源的热插拔流程;或者
所述管理设备还用于在所述逻辑分区包括的硬件资源的负载小于预设第二负载门限时,从所述逻辑分区中移除过剩的硬件资源到所述物理资源池中,所述过剩的硬件资源是在所述逻辑分区中没有被利用或者利用率小于预设利用率门限的硬件资源。
5.根据权利要求1-4任一项所述的服务器系统,其特征在于,所述管理设备具体通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接;
所述管理设备具体用于通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息。
6.根据权利要求1-4任一项所述的服务器系统,其特征在于,所述管理设备具体通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接,并通过所述PCIE交换板与所述每个服务节点设备的管理控制器连接;
所述管理设备具体用于通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息;或者
所述管理设备具体用于根据存储的所述每个服务节点设备连接的第一端口和第二端口之间的对应关系,从所述每个服务节点设备的管理控制器获取所述每个服务节点设备的硬件资源的信息;
其中,所述每个服务节点设备的管理控制器用于监控所述每个服务节点设备的硬件资源的状态,第一端口为所述PCIE交换板上与所述每个服务节点设备的硬件资源连接的端口,第二端口为所述PCIE交换板上与所述每个服务节点设备的管理控制器连接的端口。
7.根据权利要求1-4任一项所述的服务器系统,其特征在于,所述管理设备具体通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接,并直接与所述每个服务节点设备的管理控制器连接;
所述管理设备具体用于通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息;或者
所述管理设备具体用于根据存储的所述每个服务节点设备连接的第一端口和第二端口之间的对应关系,从所述每个服务节点设备的管理控制器获取所述每个服务节点设备的硬件资源的信息;
其中,所述每个服务节点设备的管理控制器用于监控所述每个服务节点设备的硬件资源的状态,第一端口为所述PCIE交换板上与所述每个服务节点设备的硬件资源连接的端口,第二端口为所述管理设备上与所述每个服务节点设备的管理控制器连接的端口。
8.一种管理设备,其特征在于,包括:
监控模块,通过高速外设组件互连PCIE交换板与至少一个服务节点设备连接,用于通过所述PCIE交换板获取所述至少一个服务节点设备中的每个服务节点设备的硬件资源的信息,根据获取的所述信息构建物理资源池;
分区建立模块,用于在所述物理资源池上建立逻辑分区;
所述分区建立模块具体用于将所述物理资源池包括的硬件资源的信息呈现给用户,并接收所述用户的选中指令和划分指令,以建立所述逻辑分区,所述选中指令用于指示所述用户根据应用需求从所述物理资源池中选择的硬件资源,所述划分指令用于指示所述用户对所述选择的硬件资源进行分配形成的所述逻辑分区和所述逻辑分区包括的硬件资源。
9.根据权利要求8所述的管理设备,其特征在于,所述分区建立模块还用于在所述逻辑分区上电后,向所述用户呈现与所述逻辑分区对应的硬件平台,以使所述用户安装操作系统,所述硬件平台包括所述逻辑分区包括的硬件资源。
10.根据权利要求8所述的管理设备,其特征在于,还包括:
预警模块,用于在所述监控模块获取到所述逻辑分区包括的硬件资源的负载大于预设第一负载门限时,发出预警信息。
11.根据权利要求8所述的管理设备,其特征在于,
所述分区建立模块还用于在所述监控模块获取到所述逻辑分区包括的硬件资源的负载大于预设第一负载门限时,从所述物理资源池中选择空闲的硬件资源添加到所述逻辑分区中,并触发新添加的硬件资源的热插拔流程;或者
所述分区建立模块还用于在所述监控模块获取到所述逻辑分区包括的硬件资源的负载小于预设第二负载门限时,从所述逻辑分区中移除过剩的硬件资源到所述物理资源池中,所述过剩的硬件资源是在所述逻辑分区中没有被利用或者利用率小于预设利用率门限的硬件资源。
12.根据权利要求8-11任一项所述的管理设备,其特征在于,所述监控模块包括:
第一监控单元,通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接,用于通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息;
构建单元,用于根据所述第一监控单元获取的所述每个服务节点的硬件资源的信息,构建所述物理资源池。
13.根据权利要求12所述的管理设备,其特征在于,所述监控模块还包括:
第二监控单元,通过所述PCIE交换板或直接与所述每个服务节点设备的管理控制器连接,用于根据存储的所述每个服务节点设备连接的第一端口和第二端口之间的对应关系,从所述每个服务节点设备的管理控制器上获取所述每个服务节点设备的硬件资源的信息;
所述构建单元,还用于根据所述第一监控单元获取的所述每个服务节点的硬件资源的信息和/或所述第二监控单元获取的所述每个服务节点设备的硬件资源的信息,构建所述物理资源池;
其中,所述每个服务节点设备的管理控制器用于监控所述每个服务节点设备的硬件资源的状态;第一端口为所述PCIE交换板上与所述每个服务节点设备的硬件资源连接的端口,第二端口为所述PCIE交换板上或所述管理设备上与所述每个服务节点设备的管理控制器连接的端口。
14.一种管理方法,其特征在于,包括:
管理设备通过高速外设组件互连PCIE交换板获取至少一个服务节点设备中的每个服务节点设备的硬件资源的信息;
所述管理设备根据获取的所述信息,构建物理资源池;
所述管理设备在所述物理资源池上建立逻辑分区;
其中,所述管理设备通过所述PCIE交换板与所述每个服务节点设备连接;
所述管理设备在所述物理资源池上建立逻辑分区包括:
所述管理设备将所述物理资源池包括的硬件资源的信息呈现给用户,接收所述用户的选中指令和划分指令,以建立所述逻辑分区,所述选中指令用于指示所述用户根据应用需求从所述物理资源池中选择的硬件资源,所述划分指令用于指示所述用户对所述选择的硬件资源进行分配形成的所述逻辑分区和所述逻辑分区包括的硬件资源。
15.根据权利要求14所述的管理方法,其特征在于,还包括:
所述管理设备在所述逻辑分区上电后,向所述用户呈现与所述逻辑分区对应的硬件平台,以使所述用户安装操作系统,所述硬件平台包括所述逻辑分区包括的硬件资源。
16.根据权利要求14所述的管理方法,其特征在于,还包括:
所述管理设备在所述逻辑分区包括的硬件资源的负载大于预设第一负载门限时,发出预警信息。
17.根据权利要求14所述的管理方法,其特征在于,还包括:
所述管理设备在所述逻辑分区包括的硬件资源的负载大于预设第一负载门限时,从所述物理资源池中选择空闲的硬件资源添加到所述逻辑分区中,并触发新添加的硬件资源的热插拔流程;或者
所述管理设备在所述逻辑分区包括的硬件资源的负载小于预设第二负载门限时,从所述逻辑分区中移除过剩的硬件资源到所述物理资源池中,所述过剩的硬件资源是在所述逻辑分区中没有被利用或者利用率小于预设利用率门限的硬件资源。
18.根据权利要求14-17任一项所述的服务器方法,其特征在于,所述管理设备通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接;
所述管理设备通过高速外设组件互连PCIE交换板获取至少一个服务节点设备中的每个服务节点设备的硬件资源的信息包括:
所述管理设备通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息。
19.根据权利要求14-17任一项所述的管理方法,其特征在于,所述管理设备通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接,并通过所述PCIE交换板与所述每个服务节点设备的管理控制器连接;
所述管理设备通过高速外设组件互连PCIE交换板获取至少一个服务节点设备中的每个服务节点设备的硬件资源的信息包括:
所述管理设备通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息;或者
所述管理设备根据存储的所述每个服务节点设备连接的第一端口和第二端口之间的对应关系,从所述每个服务节点设备的管理控制器获取所述每个服务节点设备的硬件资源的信息;
其中,所述每个服务节点设备的管理控制器用于监控所述每个服务节点设备的硬件资源的状态;第一端口为所述PCIE交换板上与所述每个服务节点设备的硬件资源连接的端口,第二端口为所述PCIE交换板上与所述每个服务节点设备的管理控制器连接的端口。
20.根据权利要求14-17任一项所述的管理方法,其特征在于,所述管理设备通过所述PCIE交换板与所述每个服务节点设备的硬件资源连接,并直接与所述每个服务节点设备的管理控制器连接;
所述管理设备通过高速外设组件互连PCIE交换板获取至少一个服务节点设备中的每个服务节点设备的硬件资源的信息包括:
所述管理设备通过所述PCIE交换板监控所述每个服务节点设备的硬件资源的状态,通过所述PCIE交换板获取所述每个服务节点设备的硬件资源的信息,或者
所述管理设备根据存储的所述每个服务节点设备连接的第一端口和第二端口之间的对应关系,从所述每个服务节点设备的管理控制器获取所述每个服务节点设备的硬件资源的信息;
其中,所述每个服务节点设备的管理控制器用于监控所述每个服务节点设备的硬件资源的状态;第一端口为所述PCIE交换板上与所述每个服务节点设备的硬件资源连接的端口,第二端口为所述管理设备上与所述每个服务节点设备的管理控制器连接的端口。
CN201280002787.4A 2012-08-17 2012-08-17 服务器系统、管理方法及设备 Active CN103210379B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2012/080293 WO2014026374A1 (zh) 2012-08-17 2012-08-17 服务器系统、管理方法及设备

Publications (2)

Publication Number Publication Date
CN103210379A CN103210379A (zh) 2013-07-17
CN103210379B true CN103210379B (zh) 2016-05-25

Family

ID=48756620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280002787.4A Active CN103210379B (zh) 2012-08-17 2012-08-17 服务器系统、管理方法及设备

Country Status (2)

Country Link
CN (1) CN103210379B (zh)
WO (1) WO2014026374A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9672167B2 (en) * 2013-07-22 2017-06-06 Futurewei Technologies, Inc. Resource management for peripheral component interconnect-express domains
CN103533306B (zh) * 2013-10-11 2017-01-18 浙江宇视科技有限公司 一种视频带宽智能分配装置及方法
JP2016539397A (ja) * 2013-11-27 2016-12-15 インテル・コーポレーション 保守可能な不揮発性メモリモジュールを有効化するサーバプラットフォームアーキテクチャのための方法および装置
CN103955441B (zh) * 2014-04-02 2017-04-12 华为技术有限公司 一种设备管理系统、方法及一种io扩展接口
CN104168135B (zh) * 2014-08-06 2018-11-02 中国船舶重工集团公司第七0九研究所 网卡资源池化管理方法及系统
CN104125303B (zh) * 2014-08-12 2018-09-04 北京奇虎科技有限公司 数据读写请求方法、客户端及系统
US9934187B2 (en) * 2014-12-17 2018-04-03 Quanta Computer Inc. Hot-pluggable computing system
CN105515870B (zh) * 2015-12-18 2019-06-21 华为技术有限公司 一种刀片服务器、资源分配方法及系统
CN105512080A (zh) * 2015-12-31 2016-04-20 浪潮(北京)电子信息产业有限公司 一种服务器系统
CN106126357A (zh) * 2016-06-29 2016-11-16 浪潮集团有限公司 一种服务器管理系统实现方法
CN106445006B (zh) * 2016-09-29 2019-05-28 郑州云海信息技术有限公司 一种融合架构服务器
CN107205048A (zh) * 2017-07-21 2017-09-26 深圳市智网云联科技有限公司 一种基于pci‑e总线的桌面云协议编码系统
TWI658367B (zh) * 2017-10-31 2019-05-01 英業達股份有限公司 硬體資源擴充系統
CN107864055A (zh) * 2017-10-31 2018-03-30 云宏信息科技股份有限公司 虚拟化系统的管理方法及平台
CN108337307B (zh) * 2018-01-31 2021-06-29 郑州云海信息技术有限公司 一种多路服务器及其节点间通信方法
CN108388476A (zh) * 2018-03-01 2018-08-10 郑州云海信息技术有限公司 一种服务器计算加速资源池化方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102087618A (zh) * 2011-02-12 2011-06-08 浪潮(北京)电子信息产业有限公司 云计算操作系统的资源管理方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7765552B2 (en) * 2004-09-17 2010-07-27 Hewlett-Packard Development Company, L.P. System and method for allocating computing resources for a grid virtual system
US8141092B2 (en) * 2007-11-15 2012-03-20 International Business Machines Corporation Management of an IOV adapter through a virtual intermediary in a hypervisor with functional management in an IOV management partition

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102087618A (zh) * 2011-02-12 2011-06-08 浪潮(北京)电子信息产业有限公司 云计算操作系统的资源管理方法及系统

Also Published As

Publication number Publication date
WO2014026374A1 (zh) 2014-02-20
CN103210379A (zh) 2013-07-17

Similar Documents

Publication Publication Date Title
CN103210379B (zh) 服务器系统、管理方法及设备
EP3507692B1 (en) Resource oversubscription based on utilization patterns in computing systems
CN102932413B (zh) 一种计算资源分配方法、云管理平台节点和计算资源集群
CN102103516B (zh) 基于虚拟cpu的频率和电压调节
US10333859B2 (en) Multi-tenant resource coordination method
WO2021121115A1 (zh) 一种虚拟机的numa节点调度方法、装置、设备及介质
CN102681895B (zh) 一种动态自迁移云服务方法
CN102508718A (zh) 一种虚拟机负载均衡方法和装置
CN102419718A (zh) 资源调度方法
CN103856512A (zh) 云计算的管理服务器、工作和闲置主机以及资源调度方法
CN103399781A (zh) 云服务器及其虚拟机管理方法
CN104503932A (zh) 多主板服务器主基板管理控制器仲裁方法及系统
CN103609077A (zh) 用于数据传输的方法、装置和系统以及物理网卡
CN103645795A (zh) 一种基于人工神经网络的云计算数据中心节能方法
CN104184837A (zh) 高可用云计算一体机
CN102594881A (zh) 一种虚拟机负载均衡方法、管理模块及虚拟机集群系统
CN103902364A (zh) 一种物理资源管理方法、装置及智能终端设备
CN102339233A (zh) 云计算集中管理平台
CN104184604A (zh) 一种云平台基础架构监管系统
CN104850394A (zh) 分布式应用程序的管理方法和分布式系统
CN103580923A (zh) 软件部署的方法和装置
CN111418187A (zh) 云网络中的可伸缩统计和分析机制
CN101650666B (zh) 一种计算机管理系统及方法
CN112134752B (zh) 一种基于bmc监控交换机的方法、系统、设备及介质
CN102427468B (zh) 一种云计算操作系统及其调度方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant