CN106980529B - 基板管理控制器资源管理的电脑系统 - Google Patents

基板管理控制器资源管理的电脑系统 Download PDF

Info

Publication number
CN106980529B
CN106980529B CN201610245602.2A CN201610245602A CN106980529B CN 106980529 B CN106980529 B CN 106980529B CN 201610245602 A CN201610245602 A CN 201610245602A CN 106980529 B CN106980529 B CN 106980529B
Authority
CN
China
Prior art keywords
management device
physical computer
devices
computer system
master
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610245602.2A
Other languages
English (en)
Other versions
CN106980529A (zh
Inventor
黄铮
Original Assignee
美商安迈国际有限责任公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商安迈国际有限责任公司 filed Critical 美商安迈国际有限责任公司
Publication of CN106980529A publication Critical patent/CN106980529A/zh
Application granted granted Critical
Publication of CN106980529B publication Critical patent/CN106980529B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供一种基板管理控制器资源管理的电脑系统。电脑系统包括多个实体电脑装置、第一管理装置及第二管理装置。第一管理装置连接多个实体电脑装置的至少一部分,其中第一管理装置具有多个第一虚拟机分别对应于多个实体电脑装置的部分的不同实体电脑装置。第二管理装置连接第一管理装置,第二管理装置具有多个第二虚拟机,其中每一第二虚拟机分别对应于多个实体电脑装置的另一部分的不同实体电脑装置。第一管理装置与第二管理装置管理第一虚拟机与第二虚拟机的资源分配,以管理实体电脑装置。

Description

基板管理控制器资源管理的电脑系统
技术领域
本发明关于一种用于管理基板管理控制器(Baseboard Management Controller,BMC)资源的电脑系统;具体而言,本发明关于一种用于管理基板管理控制器单元虚拟化的电脑系统及其资源分配。
背景技术
服务器系统已被广泛地用在许多不同领域,例如数据中心。这种系统变得越来越复杂及走向网络化,故管理其操作环境的工作也变得同等重要。传统上,许多服务器包含基板管理控制器,且在服务器内有许多的元件和感应器用以管理操作环境。由于服务器系统走向网络化及变得复杂,因此如何通过虚拟化来延伸这些硬件优势以分享硬件及减少冗余位是有待努力的。然而,当这些虚拟机故障时,并无法得到警告或通知信息,服务器系统的基板管理控制器的管理也会适当停止执行。
发明内容
本发明的一目的在于提供一种电脑系统,用以提供基板管理控制器管理与监视的虚拟解决方案。
本发明的另一目的在于提供一种具有嵌入式故障安全机制的电脑系统,可防止出现故障的管理装置影响到整个电脑系统的执行效能。
本发明的再一目的在于提供一种电脑系统,可降低基板管理控制器管理的硬件成本。
本发明提供一种基板管理控制器资源管理的电脑系统。电脑系统包括多个实体电脑装置、第一管理装置及第二管理装置。第一管理装置连接多个实体电脑装置的至少一部分,其中第一管理装置具有多个第一虚拟机分别对应于多个实体电脑装置的部分的不同实体电脑装置。第二管理装置连接第一管理装置,第二管理装置具有多个第二虚拟机,其中每一第二虚拟机分别对应于多个实体电脑装置的另一部分的不同实体电脑装置。第一管理装置与第二管理装置管理第一虚拟机与第二虚拟机的资源分配,以管理实体电脑装置。
于一实施例中,该些第一虚拟机与该些第二虚拟机是用于管理及监视该些实体电脑装置的虚拟基板管理控制器。
于一实施例中,该第一管理装置与该第二管理装置彼此互相监视。
于一实施例中,更包括一主管理装置连接于该多个实体电脑装置与该第一管理装置及该第二管理装置之间。
于一实施例中,该主管理装置包括一转送模块与一资源分配模块,该转送模块转送对应的第一管理装置与实体电脑装置之间以及对应的第一管理装置与实体电脑装置之间的通讯,该资源分配模块管理资源分配以管理该些实体电脑装置。
于一实施例中,该主管理装置包括服务器电脑、桌上型电脑或数据处理电脑。
于一实施例中,更包括:一第二主管理装置,连接于该主管理装置,该第二管理装置连接该第二主管理装置,且该第二主管理装置连接于该多个实体电脑装置的该另一部分与该第二管理装置之间。
于一实施例中,该主管理装置与该第一管理装置是以主从式架构网络连接,且该第二主管理装置与该第二管理装置是以主从式架构网络连接。
于一实施例中,该主管理装置与该第二主管理装置彼此互相监视。
于一实施例中,该主管理装置与该第一管理装置是被分组在一第一区,以及该第二主管理装置与该第二管理装置是被分组在一第二区。
于一实施例中,该主管理装置分配资源至该第二区,或该第二主管理装置分配资源至该第一区。
于一实施例中,该些虚拟机为一档案系统中的一虚拟工作空间。
于一实施例中,该些虚拟机为一根档案系统。
于一实施例中,该基板管理控制器管理该些实体电脑装置的温度、湿度、电源供应电压、风扇速度、通讯参数及操作系统功能。
附图说明
图1为本发明的电脑系统的一实施例;
图2A为图1的管理装置的示意图;
图2B为图2A管理装置的基板管理控制器的虚拟实施例;
图2C为图2B的另一实施例;
图2D为图2C的另一实施例;
图2E为图2D的另一实施例;
图3A为图2A的管理装置的另一实施例;
图3B为图3A的管理装置检查实体电脑装置的可用性的流程图;
图3C为图3B的另一实施例;
图4为具主管理装置的电脑系统的一实施例;
图5A为图4的电脑系统的另一实施例;以及
图5B为图5A的电脑系统的另一实施例。
主要元件符号说明:
10 BMC模块
10A BMC虚拟层
10B 基础BMC
14 界面
100 电脑系统
110 第一管理装置
120 第二管理装置
130A~130F 实体电脑装置
200、210A~210C 终端装置
210 显示器
C1、C2 群组
VR1、VR2 地区
110M、110M1、110M2 主管理装置
110S1、110S2、110S3、110S4 从属管理装置
301~308 步骤
具体实施方式
本发明实施例提供一种电脑系统,可用于管理虚拟基板管理控制器及其资源分配。以下将以附图配合文字叙述公开本发明的实施方式或范例。这些实施例仅用以说明本发明,并非用以限制本发明的范围。此外,在本发明的附图中,相同标号代表相同元件,本发明的目的及实施样貌将描述于下。
图1为本发明的电脑系统100的一实施例。电脑系统100较佳包括多个实体电脑装置130A~130F、第一管理装置110及第二管理装置120。如图1所示,实体电脑装置130A~130F分别连接至第一管理装置110或第二管理装置120。在本实施例中,实体电脑装置130A~130F较佳是服务器电脑。然而,在其他不同实施例中,实体电脑装置130A~130F也可以是任何其他的电脑装置,例如桌上型电脑、笔记型电脑及任何其他相关的电脑装置。必须注意的是,第一管理装置110及第二管理装置120并不限于只能连接3台实体电脑装置,如本领域技术人员所知,第一管理装置110及第二管理装置120可连接在其处理能力内的任何数量的实体电脑装置。在本实施例中,实体电脑装置130A~130F是通过任意界面(如I2C或是UART)连接第一管理装置110及第二管理装置120。
请参照图1,在本实施例中,第一管理装置110及第二管理装置120较佳是用于管理及监视实体电脑装置130A~130F的实体状态的服务器电脑。在一实施例中,实体电脑装置130A~130F包括用于量测物理变数的感应器,例如温度、湿度、电源供应电压、风扇速度、通讯参数及操作系统功能,其中这些物理变数是由第一管理装置110及/或第二管理装置120监视及管理。然而,如本领域技术人员所知,感应器并不限于只能量测上述物理变数。
在本实施例中,管理者可经由连接第一管理装置110及/或第二管理装置120的终端装置200来监视实体电脑装置130A~130F的各种状态。在一实施例中,终端装置200可通过显示器210上的网络使用者界面显示实体电脑装置130A~130F的监视状态。管理者可通过运行于终端装置200上的网络浏览器远端连接第一管理装置110或第二管理装置120。在其他不同实施例中,可在终端装置200上安装应用软件以联系第一管理装置110及/或第二管理装置120。管理者可通过第一管理装置110及/或第二管理装置120监视实体电脑装置130A~130F的状态,以及传送指令给第一管理装置110及/或第二管理装置120以设定或修改第一管理装置110及/或第二管理装置120监视或管理实体电脑装置130A~130F的方式。当第一管理装置110或第二管理装置120侦测到一特定实体电脑装置的其中一个变数超过管理者设定的限制或范围时,第一管理装置110或第二管理装置120可通知管理者。在其他不同实施例中,第一管理装置110及/或第二管理装置120也可设定为自动处理这些状况,例如重新启动此特定实体电脑装置。
如图1所示,第一管理装置110及第二管理装置120彼此通讯连接。在一实施例中,管理者可连接至第一管理装置110及第二管理装置120其中之一,以监视连接第一管理装置110及第二管理装置120另一台的一特定实体电脑装置的状态。换言之,管理者可连接第一管理装置110,但仍然可监视连接第二管理装置120的实体电脑装置130D~130F的状态,或管理者可连接第二管理装置120并监视实体电脑装置130A~130C的状态。在这种情形下,管理者可以有多种连接选择,或也可以限制终端装置200只能连接到第一管理装置110及第二管理装置120的其中一个,以避免过多闸道进入电脑系统100,并确保电脑系统100的安全性。此外,在本实施例中,第一管理装置110及第二管理装置120也可彼此互相监视。例如,第一管理装置110发生故障,管理者通常不会被通知到这个问题或事件,直到一段时间后,发生故障的第一管理装置110无法监控,可能造成实体电脑装置130A~130C无法回复的伤害。然而,若第一管理装置110及第二管理装置120之间具有交叉监视的机制,第二管理装置120将可以发现发生故障的第一管理装置110的状态,并且可通知管理者及/或自动进行再启动第一管理装置110。在这种情形下,管理者可立即发现问题,并在后续进行故障排除。再者,上述交叉监视机制的另一个好处是其可作为故障安全机制,进而可预防发生其他的问题。
请参照图2A,图2A为图1的第一管理装置110的一实施例。如图2A所示,在本实施例中,实体电脑装置130A~130C通过任意界面(如I2C/UART)连接第一管理装置110的BMC模块10。在本实施例中,BMC模块10用以处理第一管理装置110与实体电脑装置130A~130C之间的通讯。再者,BMC模块10也会处理硬件资源的分配,以管理/监视实体电脑装置130A~130C的BMC感应器。较佳的是,BMC模块10包括用以执行这些工作的硬件元件例如处理器、网络界面卡、I2C界面及UART界面。然而,BMC模块10并不限于这些硬件元件。
如图2A所示,BMC模块10包括基础BMC 10B及BMC虚拟层10A。在本实施例中,基础BMC 10B用以处理传送终端装置200的要求或实体电脑装置130A~130C的要求及回应终端装置200的要求或实体电脑装置130A~130C的要求。一般来说,假如这三台实体电脑装置130A~130C都是主动的且已通过界面(如I2C或UART)连接第一管理装置110,基础BMC 10B传统上(如一范例)会需要三个不同的网络界面卡(NIC),以对应连接这三台实体电脑装置130A~130C的110管理装置,并让终端装置200通过网络查看/存取110管理装置所提供的信息。因此,为了减少基础BMC 10B的硬件数量,提供虚拟层10A使得只需要最少的硬件数量,其中此最少的硬件数量将会分担整体系统的负载。换言之,基础BMC 10B中的硬件元件可被分担及/或分配至BMC的不同虚拟化情况。必须注意的是,BMC模块10并不限于使有多个NIC卡分担多个管理装置对终端装置的连接。在其他不同实施例中,BMC管理装置可以共用/分享多个硬件装置来减少硬件的数量,其中不限定使用任何其他适当的实体界面、传输协定及/或硬件。
在本实施例中,第一管理装置110具有多个第一虚拟机VBMC11~VBMC13,其中每个第一虚拟机VBMC11~VBMC13对应于不同的实体电脑装置。例如,若实体电脑装置130A~130C通过界面(如I2C或UART)连接第一管理装置110,则虚拟机VBMC11对应于实体电脑装置130A,虚拟机VBMC12对应于实体电脑装置130B,虚拟机VBMC13对应于实体电脑装置130C。在本实施例中,虚拟机VBMC11~VBMC13是BMC模块10的模拟或虚拟实例。换言之,虚拟机VBMC11~VBMC13的操作是根据BMC模块10的电脑结构与功能。
如图2A所示,在本实施例中,虚拟层10A根据当前主动的实体电脑装置个数为基准来创建出VBMC11~VBMC13虚拟机来监视管理当前主动的实体装置。每个第一虚拟机VBMC11~VBMC13代表任一实体电脑装置130A~130C的BMC系统的一虚拟实施例。举例来说,当实体电脑装置(例如实体电脑装置130A~130C)连接第一管理装置110的BMC模块10时,BMC模块10将会创建一个对应的虚拟机(例如虚拟机VBMC11~VBMC13),并分配硬件资源给该虚拟机。例如,BMC模块10可分配处理资源、存储器储存、界面及/或存取通讯模块。
在本实施例中,BMC模块10管理第一虚拟机VBMC11~VBMC13的硬件资源分配,以使基础BMC 10B的硬件资源的效能/资源分配最佳化。在这种情况下,经由对第一虚拟机VBMC11~VBMC13提供虚拟层10A,基础BMC 10B的硬件资源可被分享于多个虚拟机VBMC11~VBMC13之中。例如,在上述使用NIC卡的范例中,需要被安装在基础BMC 10B中的NIC硬件的总数量可减少至仅有一个,其中BMC模块10可接着有效及/或选择性地分配使用NIC硬件给虚拟机VBMC11~VBMC13(亦即第一虚拟机VBMC11~VBMC13将分享NIC硬件并允许终端装置200通过NIC硬件来查看/存取管理装置)。
如图2A所示,一旦创建了虚拟机(例如第一虚拟机VBMC11~VBMC13)并由BMC模块10分配硬件资源,前端客户或终端装置(终端装置210A~210C)的使用者或管理者可通过第一管理装置110的界面14连接第一虚拟机VBMC11~VBMC13,由以监视其各自对应的实体电脑装置130A~130C。如上所述,终端装置210A~210C可通过任何使用者界面显示实体电脑装置130A~130C的监视状态。举例来说,使用者界面可以是网络使用者界面(Web UserInterface)或智能型管理界面工具(ipmitool)。在本范例中,终端装置210A前面的管理者可通过运行于终端装置210A上的网络浏览器远端连接第一管理装置110。也就是说,终端装置210A上的网络浏览器通过界面14连接第一虚拟机VBMC11。在其他不同实施例中,可安装应用软件于终端装置210A~210C上,由以和第一管理装置110相互作用/互动。必须注意的是,虽然图2A的第一管理装置110的界面14为为介于终端装置210A~210C与第一虚拟机VBMC11~VBMC13之间的界面,但本领域技术人员将可轻易得知,可在每个虚拟机与其各自对应的终端装置之间创建个别的界面14。
图2B至图2E为基础BMC 10B虚拟化的不同实施例。请参照图2A与图2B,实体电脑装置130A~130C通过基础BMC 10B的IPMI 1(智能型平台管理界面)、IPMI 2与IPMI 3连接第一管理装置110。IPMI是基板管理控制器系统的一部份,且是作为基础BMC 10B与实体电脑装置130A~130C之间的通讯界面。如图2B所示,图2A的虚拟层10A可经由档案系统下创建虚拟机VBMC1~VBMC3的虚拟工作空间VW1~VW3来实现。执行这些虚拟机VBMC1~VBMC3于各自私有的虚拟工作空间VW1~VW3,管理者可从终端装置210连接第一管理装置110的操作系统来存取这些虚拟机VBMC1~VBMC3。然而,在另一实施例中,如图2C所示,执行这些虚拟机VBMC1~VBMC3,可以通过各自私有的根档案目录来达成。然后管理者可通过操作系统存取这些虚拟机VBMC1~VBMC3。
图2D为支持管理程序(Hypervisor)的本发明一实施例,以允许支持不同的操作系统。如图2D所示,管理者可从终端装置200使用一操作系统(Operating System)OS1进行存取及连接第一管理装置110。在本实施例中,管理程序层(hypervisor layer)实行于虚拟层10A与终端装置200之间。管理程序层允许支持操作不同的操作系统用来执行虚拟机VBMC2或VBMC3。在这种情况下,可支持特定虚拟BMC系统的操作系统。然而,必须注意的是,也可以在同装置内实行图2B至图2D所示的虚拟法的组合或混合。举例来说,如图2E所示,对应于实体电脑装置130A与130B的虚拟机VBMC1与VBMC2可以图2B(或图2C)的虚拟法来实行,而对应于实体电脑装置130C的虚拟机VBMC3可以图2D的虚拟法来实行。
图3A为管理装置110(例如第一管理装置110或第二管理装置120)的基础BMC的一实施例,用以启动VBMC服务以对应每个连接的主动实体电脑装置(例如实体电脑装置130A~130D)。在本实施例中,VBMC服务是由基础BMC创建,用以管理及监视实体电脑装置130A~130D。
请参照图3A与图3B,基础BMC将会进行步骤301~305,以开始监视实体电脑装置130A~130D。在步骤301,基础BMC将会对连接管理装置110(例如第一管理装置或第二管理装置)的每个主动及非主动的实体电脑装置创建VBMC服务。例如,如图3A与图3B所示的范例,当实体电脑装置130A~130D连接管理装置110时,基础BMC将会创建VBMC服务1至VBMC服务4以各自对应实体电脑装置130A~130D。在创建这些VBMC服务之后,执行步骤302,更新主机电源状态。在本步骤中,当创建出VBMC服务并通讯连接其各自的实体电脑装置时,VBMC服务会将有关实体电脑装置的信息送回至基础BMC。基础BMC接着会根据VBMC服务送回的信息,更新实体电脑装置的电源状态。例如,所有的实体电脑装置130A~130D可连接至管理装置110,但一个或多个实体电脑装置130A~130D可以是主动的,而其余是非主动的。当基础BMC通过VBMC服务1~4检查实体电脑装置130A~130D的状态时,管理装置110会更新此信息。
在本实施例中,基础BMC会在实体电脑装置130A~130D上定期执行检查状态(步骤303),以确保实体电脑装置130A~130D是正常运作。基础BMC接着执行步骤304,更新VBMC及主电脑(实体电脑装置)的关系。在本实施例中,在接收来自VBMC服务的有关实体电脑装置130A~130D的电源状态的信息之后,基础BMC可确定实体电脑装置130A~130D是否正常运作。例如,假如实体电脑装置130B连接管理装置110但其是非主动的(关闭),基础BMC会从VBMC服务2接收到实体电脑装置130B的电源状态是非主动/关闭或不正常的信息。基础BMC接着可确定或断定实体电脑装置130B是在关闭过程中或已经关闭。因此,基础BMC接着可更新VBMC及主电脑的关系为“非主动的”。随后,在步骤305,假如实体电脑装置130A~130D其中之一确实是非主动的,基础BMC可将对应非主动实体电脑装置130B的虚拟机的资源(例如BMC系统的CPU资源)重新分配给其他主动实体电脑装置(实体电脑装置130A,130C~130D)。在这种情况下,BMC模块10的硬件资源可在虚拟机与主动实体电脑装置中有效地分享。
图3C是图3B的另一实施例,其中绘示出基础BMC与单一VBMC服务的流程图。请参照图3A~图3C,当基础BMC在步骤301创建VBMC服务并在随后步骤301的检查状态,基础BMC会要求VBMC服务执行步骤306,以确定对应实体电脑装置的电源状态是否存在。假如电源状态存在且实体电脑装置或终端装置发出BMC请求Q,VBMC服务将会接收此BMC请求Q,并在步骤307中处理此BMC请求Q,其中VBMC服务随后在步骤308中将会传送BMC回应R至实体电脑装置与客户请求。在这种情况下,基础BMC可定期检查实体电脑装置,以查看实体电脑装置是否为主动的。假如实体电脑装置是非主动的或在关闭过程中,基础BMC将会在管理装置10中更新虚拟机及实体电脑装置的关系,并将用于非主动实体电脑装置的虚拟机的基础BMC的资源重新分配给其他虚拟机。
图4为图1的电脑系统100的另一实施例。如图4所示,BMC系统可以主从式层级架构来实现,其中主管理装置110M可用于连接实体电脑装置130A~130E。在本实施例中,至少一个从属管理装置连接主管理装置110M。在图4的范例中,第一管理装置110S1与第二管理装置110S2分别连接主管理装置110M,并作为主从式关系中的从属装置。
如图4所示,主管理装置110M具有一转送模块与一资源分配模块。在一实施例中,主管理装置110M包括嵌入式系统、服务器电脑、桌上型电脑或具有可处理数据的处理器的任何其他电脑装置。在本实施例中,主管理装置110M转送对应虚拟机(VBMC11~13,VBMC21~22)与实体电脑装置(130A~130E)间的通讯。举例来说,当实体电脑装置130A~130E其中之一是关闭、非主动及/或断开时,主管理装置110M的资源分配模块可重新分配处理资源,以处理其他实体电脑装置及其各自对应虚拟机间的通讯。
图5A为图4的另一实施例。如图5A所示,至少两个主管理装置110M1与110M2彼此可通讯连接。在本实施例中,地区VR1包含主管理装置110M1及其从属管理装置110S1与110S2,而地区VR2包含主管理装置110M2及其从属管理装置110S3与110S4。在一实施例中,由于主管理装置110M1与主管理装置110M2彼此通过网络连接,主管理装置110M1与主管理装置110M2彼此可互相监视。例如,假如主管理装置110M1或110M2其中之一发生故障或失去作用,当另一个主管理装置110M1或110M2无法从该失去作用或发生故障的主管理装置接收到转送请求或无法分配资源时,该另一个主管理装置110M1或110M2将会立即得知此故障问题,并可通知管理者及/或报告该发生故障的主管理装置。在这种情况下,两地区VR1与VR2将可具有故障安全机制,使得任何故障情形可即时报告给管理者,以防止发生额外的伤害或成本损失。在这种情况下,于系统中导入故障安全机制,将可自动处理发生在系统的任一管理装置中的任何故障问题。此外,在其他不同实施例中,主管理装置并不限于只能连接到另一主管理装置。换言之,每个主管理装置可网络连接多个其他主管理装置。在这种情况下,整个系统可依照系统需求而动态地相应增加或缩减。
此外,如图5A所示,若BMC系统确定负载平衡足以被其他从属管理装置处理,则可撤销从属管理装置以节省电源。例如,请参照群组C2的从属管理装置110S3与110S4,地区VR2的主管理装置110M2可确定从属管理装置110S4上的负载太小以维持从属管理装置110S4运行。在这个例子中,主管理装置110M2可通讯连接其他地区的其他主管理装置(例如地区VR1的主管理装置110M1),以查看其是否能够容纳运行于从属管理装置110S4上的处理程序。一旦主管理装置110M1检查其群组C1的从属管理装置110S1与110S2并确认主管理装置110M2能够容纳运行于从属管理装置110S4上的处理程序,主管理装置110M2可和主管理装置110M1开始执行一迁移过程,由以将运行于从属管理装置110S4上的虚拟机迁移到群组C1。
举例来说,假如主管理装置110M2发现从属管理装置110S4把其资源仅用于运行一个虚拟机X(如图5A所示对应于实体电脑装置130F),主管理装置110M2可开始执行虚拟机X的迁移过程并将之迁移到主管理装置110M1。在本实施例中,如图5B所示,在主管理装置110M1确认主管理装置110M2可容纳处理对应虚拟机X的实体电脑装置130F之后,主管理装置110M1将指示群组C1的从属管理装置110S2创建一虚拟机X’。接着,主管理装置110M2会通过主管理装置110M1将从属管理装置110S4的虚拟机X迁移至从属管理装置110S4的新创建出的虚拟机X’。之后,主管理装置110M1会分配处理资源给虚拟机X’。然后,主管理装置110M2会取消分配给旧虚拟机X的处理资源,接着删除旧虚拟机X。在本实施例中,实体电脑装置130F与虚拟机X’间的通讯可经由主管理装置110M2与110M1转送。在这种情况下,整个系统可动态地更有效分配资源给虚拟机或一群虚拟机。换言之,依据从属管理装置上的负载平衡,主管理装置110M1与110M2可共同地决定如何更有效地利用从属管理装置。因此,在目前架构中,可从系统中增加或去除任何数量的新从属管理装置、主管理装置及/或实体电脑装置。也就是说,本发明也可在BMC系统的延展性提供改良式弹性的好处。
本发明已由上述相关实施例加以描述,然而上述实施例仅为实施本发明的范例。必需指出的是,已公开的实施例并未限制本发明的范围。相反地,包含于权利要求的精神及范围的修改及均等设置均包含于本发明的范围内。

Claims (11)

1.一种基板管理控制器资源管理的电脑系统,其特征在于,该电脑系统包括:
多个实体电脑装置;
一第一管理装置,连接该多个实体电脑装置的至少一部分,该第一管理装置具有多个第一虚拟机分别对应于该多个实体电脑装置的该部分的不同实体电脑装置;以及
一第二管理装置,连接该第一管理装置,该第二管理装置具有多个第二虚拟机,每一该第二虚拟机分别对应于该多个实体电脑装置的另一部分的不同实体电脑装置;
其中,该第一管理装置与该第二管理装置管理该些第一虚拟机与该些第二虚拟机的资源分配,以管理该些实体电脑装置;
其中,该第一管理装置与该第二管理装置彼此互相监视状态;
其中,该些第一虚拟机与该些第二虚拟机是用于管理及监视该些实体电脑装置的虚拟基板管理控制器。
2.如权利要求1所述的电脑系统,其特征在于,更包括一第一主管理装置连接于该多个实体电脑装置与该第一管理装置及该第二管理装置之间。
3.如权利要求2所述的电脑系统,其特征在于,该第一主管理装置包括一转送模块与一资源分配模块,该转送模块转送对应的第一管理装置与实体电脑装置之间以及对应的第一管理装置与实体电脑装置之间的通讯,该资源分配模块管理资源分配以管理该些实体电脑装置。
4.如权利要求3所述的电脑系统,其特征在于,该第一主管理装置包括数据处理电脑,该数据处理电脑为服务器电脑或桌上型电脑。
5.如权利要求2所述的电脑系统,其特征在于,更包括:
一第二主管理装置,连接于该第一主管理装置,一第三管理装置连接该第二主管理装置,且该第二主管理装置连接于该多个实体电脑装置的该另一部分与该第三管理装置之间。
6.如权利要求5所述的电脑系统,其特征在于,该第一主管理装置与该第一管理装置是以主从式架构网络连接,且该第二主管理装置与该第三管理装置是以主从式架构网络连接。
7.如权利要求5所述的电脑系统,其特征在于,该第一主管理装置与该第二主管理装置彼此互相监视。
8.如权利要求5所述的电脑系统,其特征在于,该第一主管理装置与该第一管理装置是被分组在一第一区,以及该第二主管理装置与该第三管理装置是被分组在一第二区。
9.如权利要求8所述的电脑系统,其特征在于,该第一主管理装置分配资源至该第二区,或该第二主管理装置分配资源至该第一区。
10.如权利要求1所述的电脑系统,其特征在于,该些虚拟机为一档案系统中的一虚拟工作空间。
11.如权利要求1所述的电脑系统,其特征在于,该基板管理控制器管理该些实体电脑装置的温度、湿度、电源供应电压、风扇速度、通讯参数及操作系统功能。
CN201610245602.2A 2016-01-18 2016-04-20 基板管理控制器资源管理的电脑系统 Active CN106980529B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/997,671 US20170206110A1 (en) 2016-01-18 2016-01-18 Computer System for BMC resource management
US14/997,671 2016-01-18

Publications (2)

Publication Number Publication Date
CN106980529A CN106980529A (zh) 2017-07-25
CN106980529B true CN106980529B (zh) 2021-03-26

Family

ID=59313764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610245602.2A Active CN106980529B (zh) 2016-01-18 2016-04-20 基板管理控制器资源管理的电脑系统

Country Status (2)

Country Link
US (1) US20170206110A1 (zh)
CN (1) CN106980529B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10846113B1 (en) 2017-03-30 2020-11-24 Amazon Technologies, Inc. Board management controller firmware virtualization
US10346187B1 (en) * 2017-03-30 2019-07-09 Amazon Technologies, Inc. Board management controller firmware emulation
US10521273B2 (en) * 2017-06-08 2019-12-31 Cisco Technology, Inc. Physical partitioning of computing resources for server virtualization
US10489594B2 (en) * 2017-07-19 2019-11-26 Dell Products, Lp System and method for secure migration of virtual machines between host servers
US10528397B2 (en) * 2017-11-13 2020-01-07 American Megatrends International, Llc Method, device, and non-transitory computer readable storage medium for creating virtual machine
US10979497B2 (en) * 2018-07-19 2021-04-13 Cisco Technology, Inc. Multi-node discovery and master election process for chassis management
US11012306B2 (en) * 2018-09-21 2021-05-18 Cisco Technology, Inc. Autonomous datacenter management plane
CN117319716B (zh) * 2023-11-28 2024-02-27 苏州元脑智能科技有限公司 基板管理控制芯片的资源调度方法及基板管理控制芯片

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024125A (zh) * 2009-09-23 2011-04-20 精品科技股份有限公司 应用于电脑及电脑系统架构的资讯安全管理方法
CN104899095A (zh) * 2014-03-03 2015-09-09 广达电脑股份有限公司 虚拟机器的资源调整方法及系统
US9535803B2 (en) * 2015-02-23 2017-01-03 Red Hat Israel, Ltd. Managing network failure using back-up networks

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7653824B2 (en) * 2006-08-03 2010-01-26 Dell Products, Lp System and method of managing heat in multiple central processing units
US9709965B2 (en) * 2008-12-04 2017-07-18 Baselayer Technology, Llc Data center intelligent control and optimization
US8521686B2 (en) * 2009-07-13 2013-08-27 Vmware, Inc. Concurrency control in a file system shared by application hosts
US9037880B2 (en) * 2012-06-15 2015-05-19 Infosys Limited Method and system for automated application layer power management solution for serverside applications

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024125A (zh) * 2009-09-23 2011-04-20 精品科技股份有限公司 应用于电脑及电脑系统架构的资讯安全管理方法
CN104899095A (zh) * 2014-03-03 2015-09-09 广达电脑股份有限公司 虚拟机器的资源调整方法及系统
US9535803B2 (en) * 2015-02-23 2017-01-03 Red Hat Israel, Ltd. Managing network failure using back-up networks

Also Published As

Publication number Publication date
CN106980529A (zh) 2017-07-25
US20170206110A1 (en) 2017-07-20

Similar Documents

Publication Publication Date Title
CN106980529B (zh) 基板管理控制器资源管理的电脑系统
US20200104222A1 (en) Systems and methods for managing server cluster environments and providing failure recovery therein
EP3340057B1 (en) Container monitoring method and apparatus
US11190440B2 (en) Methods and apparatus to configure and manage network resources for use in network-based computing
JP5851503B2 (ja) 高可用性仮想機械環境におけるアプリケーションの高可用性の提供
US8185776B1 (en) System and method for monitoring an application or service group within a cluster as a resource of another cluster
US7992032B2 (en) Cluster system and failover method for cluster system
US8156370B2 (en) Computer system and method of control thereof
US20050108593A1 (en) Cluster failover from physical node to virtual node
US20140012721A1 (en) Managing use of lease resources allocated on fallover in a high availability computing environment
US8112518B2 (en) Redundant systems management frameworks for network environments
EP1745374A2 (en) Dynamic migration of virtual machine computer programs
US9948509B1 (en) Method and apparatus for optimizing resource utilization within a cluster and facilitating high availability for an application
US9116860B2 (en) Cascading failover of blade servers in a data center
WO2012050224A1 (ja) コンピュータリソース制御システム
US12111733B2 (en) Orchestrating a container-based application on a terminal device
EP2645635B1 (en) Cluster monitor, method for monitoring a cluster, and computer-readable recording medium
WO2013190694A1 (ja) 計算機の復旧方法、計算機システム及び記憶媒体
US9973569B2 (en) System, method and computing apparatus to manage process in cloud infrastructure
WO2022009438A1 (ja) サーバメンテナンス制御装置、システム、制御方法及びプログラム
Stack et al. Self-healing in a decentralised cloud management system
US20180152352A1 (en) Virtual machine mobility
KR101883251B1 (ko) 가상 시스템에서 장애 조치를 판단하는 장치 및 그 방법
US11799714B2 (en) Device management using baseboard management controllers and management processors
US20240134656A1 (en) Self-contained worker orchestrator in a distributed system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: American Georgia

Applicant after: AMERICAN MEGATRENDS Inc.

Address before: Building No. 200, 5555 Oakbrook Park Avenue, 30093 Norcross, Georgia, USA

Applicant before: American Megatrends Inc.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant