CN111857836A - 服务器开机管理系统、方法及装置 - Google Patents

服务器开机管理系统、方法及装置 Download PDF

Info

Publication number
CN111857836A
CN111857836A CN201910344211.XA CN201910344211A CN111857836A CN 111857836 A CN111857836 A CN 111857836A CN 201910344211 A CN201910344211 A CN 201910344211A CN 111857836 A CN111857836 A CN 111857836A
Authority
CN
China
Prior art keywords
server
starting
target
instruction
cabinet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910344211.XA
Other languages
English (en)
Inventor
孙宏娟
姜峰
周淦斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910344211.XA priority Critical patent/CN111857836A/zh
Publication of CN111857836A publication Critical patent/CN111857836A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues

Abstract

本说明书一个或多个实施例提供一种服务器开机管理系统、方法及装置,该服务器开机管理系统包括:目标服务器,所述目标服务器上设有基板管理控制器;服务器自动开机管控平台,所述服务器自动开机管控平台在收到用户针对所述目标服务器发起的开机请求时,生成开机指令;带外管理服务器,所述带外管理服务器接收所述开机指令,并通过与所述基板管理控制器之间建立的带外管理通道,向所述基板管理控制器发送所述开机指令。

Description

服务器开机管理系统、方法及装置
技术领域
本说明书一个或多个实施例涉及服务器技术领域,尤其涉及一种服务器开机管理系统、方法及装置。
背景技术
当机房发生电力故障后,需要通过开启因断电而导致关机的服务器,以确保及时恢复相关功能。而为了加强数据中心的稳定性建设,需要实施机房断电演练,而演练结束后同样需要尽快将服务器恢复至开机状态,以避免影响相关功能的运行状态。
发明内容
有鉴于此,本说明书一个或多个实施例提供一种服务器开机管理系统、方法及装置。
为实现上述目的,本说明书一个或多个实施例提供技术方案如下:
根据本说明书一个或多个实施例的第一方面,提出了一种服务器开机管理系统,包括:
目标服务器,所述目标服务器上设有基板管理控制器;
服务器自动开机管控平台,所述服务器自动开机管控平台在收到用户针对所述目标服务器发起的开机请求时,生成开机指令;
带外管理服务器,所述带外管理服务器接收所述开机指令,并通过与所述基板管理控制器之间建立的带外管理通道,向所述基板管理控制器发送所述开机指令。
根据本说明书一个或多个实施例的第二方面,提出了一种服务器自动开机管控平台,所述服务器自动开机管控平台用于根据用户针对目标服务器发起的开机请求,向带外管理服务器发送开机指令,以使所述带外管理服务器通过与所述目标服务器的基板管理控制器之间建立的带外管理通道,向所述基板管理控制器发送所述开机指令。
根据本说明书一个或多个实施例的第三方面,提出了一种服务器开机管理方法,包括:
根据用户发起的开机请求,确定所述开机请求对应的目标服务器;
通过带外管理服务器与所述目标服务器上设置的基板管理控制器之间建立的带外管理通道,向所述基板管理控制器发送开机指令。
根据本说明书一个或多个实施例的第四方面,提出了一种服务器开机管理装置,包括:
服务器确定单元,根据用户发起的开机请求,确定所述开机请求对应的目标服务器;
指令发送单元,通过带外管理服务器与所述目标服务器上设置的基板管理控制器之间建立的带外管理通道,向所述基板管理控制器发送开机指令。
根据本说明书一个或多个实施例的第五方面,提出了一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如上述实施例中任一所述的方法。
根据本说明书一个或多个实施例的第六方面,提出了一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如上述实施例中任一所述方法的步骤。
附图说明
图1是一示例性实施例提供的一种服务器开机管理系统的架构示意图。
图2是一示例性实施例提供的一种服务器开机管理方法的流程图。
图3是一示例性实施例提供的一种服务器自动开机管控平台的架构图。
图4是一示例性实施例提供的一种服务器开机任务调度的示意图。
图5是一示例性实施例提供的另一种服务器开机任务调度的示意图。
图6是一示例性实施例提供的又一种服务器开机任务调度的示意图。
图7是一示例性实施例提供的一种服务器开机过程中实施流量控制的示意图。
图8是一示例性实施例提供的一种设备的结构示意图。
图9是一示例性实施例提供的一种服务器开机管理装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
图1是一示例性实施例提供的一种服务器开机管理系统的架构示意图。如图1所示,该系统可以包括带外管理服务器11、网络12、数据中心、网络16和服务器自动开机管控平台17。数据中心具体可由各个机房中的服务器进行承载,比如图1中的数据中心可以包括机房13、机房14和机房15,这些机房可以位于相同或不同的地理位置;每一机房可以设有若干机柜、每一机柜上设有若干台服务器,比如机房13中设有机柜130、该机柜130上装配有服务器1301和服务器1302等服务器,机房14中设有机柜140、该机柜140上装配有服务器1401和服务器1402等服务器,机房15中设有机柜150、该机柜150上装配有服务器1501和服务器1502等服务器。
服务器1301-1302、服务器1401-1402、服务器1501-1502均为目标服务器,当电力故障或机房断电演练导致至少一部分目标服务器发生断电后关机时,带外管理服务器11用于控制实施对目标服务器的开机操作,而无需人工触发目标服务器的开机按键。其中,每一目标服务器上设有基板管理控制器(Baseboard Management Controller,BMC),而带外管理服务器11可以通过BMC控制目标服务器的开机操作。
网络12用于在带外管理服务器11与机房13~15中的各台目标服务器之间建立带外管理通道,该带外管理通道是相对于目标服务器用于实现相关网络功能时采用的网络(譬如带外管理服务器11与服务器自动开机管控平台17之间的网络16)而言;换言之,本说明书中存在两套网络,使得机房13~15发生断电后,网络12所构建的带外管理通道将不受断电影响,使得带外管理服务器11可以通过带外管理通道向目标服务器上的基板管理控制器发送开机指令,从而控制目标服务器实现开机操作。
服务器自动开机管控平台17用于提供带外管理服务器11上层的应用系统,该应用系统可以向用户提供操作界面,使得用户可以基于该操作界面提交针对一台或多台目标服务器的开机请求,而该应用系统可以识别开机请求对应的目标服务器、生成针对目标服务器的开机指令,并将开机指令发送至带外管理服务器11,以由带外管理服务器11通过上述的带外管理通道转发至相应的目标服务器。当然,服务器自动开机管控平台17还可以提供其他功能,比如对用户进行身份识别与权限验证、对开机过程和开机结果的追踪反馈等,将在下文结合其他实施例进行描述。
图2是一示例性实施例提供的一种服务器开机管理方法的流程图。如图2所示,该方法应用于服务器自动开机管控平台(例如图1所示的服务器自动开机管控平台17等)可以包括以下步骤:
步骤202,根据用户发起的开机请求,确定所述开机请求对应的目标服务器。
在一实施例中,服务器自动开机管控平台用于联系用户与带外管理服务器,比如该服务器自动开机管控平台可以运行得到应用系统,该应用系统通过向用户提供操作界面,使得用户可以基于该操作界面提交开机请求,而服务器自动开机管控平台可以对该开机请求进行响应、生成开机指令,并通过带外管理服务器将该开机指令发送至目标服务器。例如,用户使用的计算设备可以与服务器自动开机管控平台之间建立网络连接,使得用户可以在该计算设备上生成开机请求,并基于该网络连接将该开机请求发送至服务器自动开机管控平台。例如,该计算设备可以包括工业控制计算机、个人计算机、笔记本电脑、平板、手机等,本说明书并不对此进行限制。
在一实施例中,开机请求中可以包含目标服务器的描述信息,使得服务器自动开机管控平台可以基于该描述信息确定开机请求对应的目标服务器。每条开机请求可以包含一台或多台目标服务器的描述信息,以控制对该一台或多台目标服务器进行开机操作。
例如,描述信息可以包括目标服务器的序列号(Serial Number,简称SN),由于序列号与目标服务器之间一一对应,因而可以据此区分不同的目标服务器。再例如,如果需要对同一机柜的目标服务器进行开机管理、避免同一机柜中同时开机的服务器数量过多,那么描述信息可以采用“服务器序列号@机柜名称”的形式,使得服务器自动开机管控平台可以据此快速确定目标服务器所属的机柜是否相同,便于实施开机管理;当然,描述信息中可以仅包含上述的序列号、不包含机柜名称,而由服务器自动开机管控平台维护“服务器的序列号-机柜名称”关系表,从而基于该关系表确定目标服务器所属的机柜。
以图3所示的服务器自动开机管控平台为例,该平台提供的平台功能可以包括开机申请处理模块311,该开机申请处理模块311可以向用户提供输入表单页面(比如用户通过浏览器输入网址访问该页面),使得用户可以在该输入表单页面上填写目标服务器的描述信息。用户还可以在输入表单页面上填写开机理由等其他信息,使得服务器自动开机管控平台予以自动审核,以确定是否需要对用户请求的目标服务器进行开机。同时,开机申请处理模块311还可以对用户在输入表单页面中的填写内容进行校验(比如目标服务器的描述信息是否符合格式要求、数量是否超出预设数量等)、转换(比如将填写内容转换为预设的统一格式等)、存储等。
上述平台还可以提供用户权限管理模块312,该用户权限管理模块312可以基于用户权限实现安全管理。例如,上述平台的持久层可以包括用户数据库331,该用户数据库331中可以保存每一用户的权限信息,而用户权限管理模块312在收到某一用户发起的开机请求后,可以根据该用户在用户数据库331中记录的权限信息,确定该用户是否具有申请目标服务器的开机操作的权限,从而避免不具有权限或权限过低的用户对目标服务器进行开机控制,确保运维过程的安全性。其中,不同目标服务器对应的权限要求可以相同。或者,当不同目标服务器的重要程度不同时,可以针对不同目标服务器设定不同的权限要求,使得用户权限管理模块312可以结合用户的权限信息和开机请求所含目标服务器的权限要求,确定发起开机请求的用户是否满足该权限要求,以确定对该开机请求的处理方式。
步骤204,通过带外管理服务器与所述目标服务器上设置的基板管理控制器之间建立的带外管理通道,向所述基板管理控制器发送开机指令。
在一实施例中,通过在带外管理服务器与目标服务器上的基板管理控制器之间建立带外管理通道,使得即便机房发生断电也不会影响该带外管理通道的工作状态,确保带外管理服务器能够基于该带外管理通道向目标服务器的基板管理控制器发送开机指令,从而控制目标服务器开机,而无需用户人工触发目标服务器上的开机按键,这样既可以提升对目标服务器的开机效率,又可以避免人工操作可能导致的误操作(比如认错服务器等)。当带外管理通道基于局域网实现时,带外管理服务器与目标服务器往往相距较近,带外管理服务器可以快速针对大量目标服务器实现准确、高效的开机操作;当带外管理通道基于广域网实现时,带外管理服务器与目标服务器不受距离限制,带外管理服务器可以对自身所处机房内的目标服务器、同一城市内的其他机房中的目标服务器、不同城市的机房中的目标服务器实现准确、高效的开机操作。
在一实施例中,基于IPMI(Intelligent Platform Management Interface,智能平台管理接口)接口规范中的定义,基板管理控制器可以接收带外管理服务器发送的外部指令(即上述的开机指令),以触发目标服务器实现开机。在图3所示的实施例中,服务器自动开机管控平台提供了与自动开机相关的功能,并通过带外管理服务层325向带外管理服务器发送开机指令,而带外管理服务器通过上述的带外管理通道向目标服务器转发开机指令。
在图3所示的实施例中,可由任务调度模块321和待开机设备池322进行配合,以针对大批量的目标服务器实现自动开机的调度管理。服务器自动开机管控平台在收到各个用户发起的开机请求后,将所有开机请求对应的目标服务器的描述信息统一添加至待开机设备池322,而任务调度模块321可以从待开机设备池322中选取目标服务器,并针对被选取的目标服务器进行开机调度,即向被选取的目标服务器发送开机指令。待开机设备池322可以剔除被选取的目标服务器的描述信息,使得待开机设备池322所含描述信息对应的目标服务器均尚未被调度。
以图4所示的调度场景为例。当目标服务器装配于对应的机柜中,由机柜对内置的所有服务器进行统一供电时,同一机柜内置的服务器在预设时长内被开启的数量应当不超过最大安全数量,以确保该机柜的电流值不超过最大安全电流,保证机柜的物理安全。相应的,待开机设备池322中所含目标服务器的描述信息可以采用“服务器的序列号@机柜的名称”的形式,使得任务调度模块321可以快速识别出目标服务器所处的机柜,从而对该机柜在预设时长内开机的服务器数量进行控制。例如,当描述信息为“SN1@cabinetA”时,表明目标服务器的序列号为SN1、安装在名称为cabinetA的机柜上。其中,图3所示的服务器自动开机管控平台还可以包括服务器数据库333,该服务器数据库333可以记录每一服务器的序列号、所处机柜等信息,使得任务调度模块321可以据此对待开机设备池322中的描述信息进行校验;或者,可由待开机设备池322在收到开机请求中对所含的描述信息进行校验,并避免将未通过校验(如描述信息所含的序列号或机柜不存在,或者序列号与机柜之间不对应等)的描述信息添加至待开机设备池322中。
在一实施例中,任务调度模块321可以确保开机指令的发送间隔不小于上述的预设时长;其中,所述开机指令对应于多台目标服务器,该多台目标服务器装配于一个或多个机柜中,且对应于同一机柜的目标服务器的数量不大于最大安全数量。
假定每一机柜对应的预设时长为2s、最大安全数量为2,即2s内开机的服务器数量不能超过2台,那么在图4所示的实施例中,可以通过合理的任务调度使得每一机柜在2s内开机的服务器数量为1、以满足上述要求。任务调度模块321可以从待开机设备池322中选取目标服务器(实际上目标服务器的描述信息),并对被选取的目标服务器进行批次划分,每一批次包含若干台分别属于不同机柜的目标服务器,并且当任务调度模块321依次对每一批次的目标服务器进行调度时,调度间隔δ不小于2s。
例如图4所示,对于SN1@cabinetA、SN2@cabinetA、SN3@cabinetB、SN4@cabinetA、SN5@cabinetB和SN6@cabinetB,任务调度模块321可以将SN1@cabinetA和SN3@cabinetB划分至批次1、将SN4@cabinetA和SN6@cabinetB划分至批次2、将SN2@cabinetA和SN5@cabinetB划分至批次3,并依次对批次1、批次2和批次3的目标服务器进行调度。其中,批次1的调度时刻为T0、批次2的调度时刻为T1=T0+δ、批次3的调度时刻为T2=T1+δ,以此类推。每一批次所含目标服务器的数量还可以更多,本说明书并不对此进行限制。
在上述实施例中,当每一机柜对应的预设时长为2s、最大安全数量为2时,每一批次所含目标服务器并不一定来自不同机柜,只要同一批次中来自同一机柜的目标服务器的数量不大于2即可。例如在图5所示的实施例中,任务调度模块321可以将SN1@cabinetA和SN2@cabinetA划分至批次1、将SN4@cabinetA和SN6@cabinetB划分至批次2、将SN3@cabinetB和SN5@cabinetB划分至批次3,由于针对批次1、批次2、批次3的调度时刻的间隙δ≥2s,因而仍然能够满足机柜的安全需求。
在一实施例中,任务调度模块321可以通过为各个机柜设定相应的调度标识,以准确获知相关机柜的目标服务器是否能够被安全调度,并据此实施对目标服务器的调度操作。那么,任务调度模块321可以首先确定目标服务器所处机柜对应的调度标识,当该调度标识表示允许调度时,通过调用带外管理服务层325向带外管理服务器发送开机指令、使得带外管理服务器将开机指令转发至该目标服务器的基板管理控制器,否则不会向带外管理服务器发送开机指令。
对调度标识的设定方式可以包括:任务调度模块321在向目标服务器的基板管理控制器发送开机指令后,针对该目标服务器所处机柜启动不小于上述预设时长的计时器,使得所述调度标识在所述计时器超时前表示禁止调度、在所述计时器超时后切换为允许调度。同时,当开机指令存在多个对应的目标服务器时,这些目标服务器可以处于一个或多个机柜,且处于同一机柜的目标服务器的数量不大于上述的最大安全数量。那么,由于开机指令对应于同一机柜的目标服务器的数量不大于最大安全数量,且任务调度模块321通过上述调度标识确保同一机柜在预设时长内最多收到一条开机指令,可以确保同一机柜内的目标服务器在预设时长内开机的数量不大于上述的最大安全数量,以保证机柜的物理安全。
譬如,当每一机柜对应的预设时长为3s、最大安全数量为2时,结合图6所示的实施例:假定所有机柜的调度标识均处于允许调度的状态,任务调度模块321首先将SN1@cabinetA和SN2@cabinetA划分至批次1,在时刻T0针对该批次1发出开机指令,并将涉及的机柜cabinetA的调度标识设置为禁止调度的状态、启动时长为3s的定时器,那么任务调度模块321在该定时器超时前无法向机柜cabinetA中的服务器发送开机指令。进一步地,假定任务调度模块321的调度频率为2s/次,那么在时刻T0完成调度后,任务调度模块321将在时刻T1(假定δ=2s)再次实施调度,此时由于机柜cabinetA的调度标识尚处于禁止调度的状态、而机柜cabinetB的调度标识处于允许调度的状态,因而任务调度模块321可以将诸如SN5@cabinetB和SN6@cabinetB划分至批次2,并在时刻T1针对该批次2发出开机指令,并将涉及的机柜cabinetB的调度标识设置为禁止调度的状态、启动时长为3s的定时器。进一步地,在时刻T1完成调度后,任务调度模块321将在时刻T1’=T0+3s将机柜cabinetA的调度标识设置为允许调度,使得任务调度模块321在时刻T2再次实施调度时,机柜cabinetA处于允许调度的状态、机柜cabinetB处于禁止调度的状态,因而任务调度模块321可以对机柜cabinetA和其他调度标识处于允许调度状态的机柜中的服务器进行调度、禁止对机柜cabinetB中的服务器进行调度,比如任务调度模块321可以将诸如SN4@cabinetA和SN7@cabinetC划分至批次3,并在时刻T2针对该批次3发出开机指令,并将涉及的机柜cabinetA和cabinetC的调度标识分别设置为禁止调度的状态、启动时长为3s的定时器。
除了机柜的物理安全之外,还可以对开机指令进行流量控制,即使得开机指令的发送频率不大于预设频率,以避免发生针对服务器自动开机管控平台的流量攻击等情况。例如图7所示,任务调度模块321可以通过以下步骤实施流量控制:
步骤701,读取任务运行参数arg。
在一实施例中,任务调度模块321可以设定一运行参数arg,该参数arg存在一动态取值,用于标明相应的设定时刻,该设定时刻用于标示下一次允许调度服务器的开机指令的时刻。而通过下文所述的对该参数arg的更新方案,可以实现对开机指令的流量控制。
步骤702,识别参数arg对应的设定时刻,并判断当前时刻是否已超出该设定时刻;若已超出,则转入步骤703,否则返回步骤701。
步骤703,调度服务器的开机指令。
在一实施例中,任务调度模块321按照预设频率实施调度操作,譬如该预设频率可以为上文所述的2s/次或其他取值。在实施调度操作之前,任务调度模块321分别读取当前时刻和参数arg对应的设定时刻,并将该当前时刻与设定时刻:如果当前时刻大于或等于设定时刻,表明当前时刻已超出该设定时刻,因而任务调度模块321可以通过诸如图4~6所示实施例的方式进行调度,以针对相应批次的目标服务器的基板管理控制器发送开机指令;如果当前时刻小于设定时刻,表明当前尚不允许实施调度,因而任务调度模块321将终止本次的调度操作。
步骤704,判断对开机指令的调度频率是否超出预定义的调度阈值;若已超出,则转入步骤705,否则返回步骤703。
步骤705,更新arg的设定时刻。
在一实施例中,任务调度模块321可以统计对开机指令的调度频率。例如,当预定义的调度阈值为“每分钟不超过100次”时,如果统计出的调度频率超过了100次/min,那么任务调度模块321可以通过更新arg的设定时刻,比如将设定时刻设定为当前时刻+1分钟,使得任务调度模块321在未来的1分钟内无法实施对开机指令的调度操作,从而实现流量控制。
上述的服务器自动开机管控平台的自动开机功能可以包括服务器状态检测模块323、过程追踪模块324,服务器状态检测模块323可以对开机请求对应的各台目标服务器的开机进度进行追踪,而过程追踪模块324可以在每一目标服务器的开机过程中、记录该平台对该目标服务器所实施的操作和结果等信息。服务器状态检测模块323和过程追踪模块324所得到的信息可以记录于持久层的平台数据库332中。同时,平台功能可以提供查询中心313,使得用户可以通过该查询中心313对平台数据库332进行内容查询,以获知诸如上述服务器状态检测模块323和过程追踪模块324所得到的信息,使得用户能够随时查看自己提交的开机请求对应的目标服务器的开机进度。
进一步地,服务器自动开机管控平台还可以根据平台数据库332中保存的信息,分析目标服务器的运行状态;当用户请求开机的目标服务器发生异常情况时,该平台可以及时通知该用户或目标服务器所处机房的工作人员等,以便于快速处理异常状态。
图8是一示例性实施例提供的一种设备的示意结构图。请参考图8,在硬件层面,该设备包括处理器802、内部总线804、网络接口806、内存808以及非易失性存储器810,当然还可能包括其他业务所需要的硬件。处理器802从非易失性存储器810中读取对应的计算机程序到内存808中然后运行,在逻辑层面上形成服务器开机管理装置。当然,除了软件实现方式之外,本说明书一个或多个实施例并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
请参考图9,在软件实施方式中,该服务器开机管理装置可以包括:
服务器确定单元91,根据用户发起的开机请求,确定所述开机请求对应的目标服务器;
指令发送单元92,通过带外管理服务器与所述目标服务器上设置的基板管理控制器之间建立的带外管理通道,向所述基板管理控制器发送开机指令。
可选的,所述目标服务器装配于对应的机柜中,所述机柜用于对内置的所有服务器进行统一供电;其中,所述机柜内置的服务器在预设时长内被开启的数量不超过最大安全数量。
可选的,所述开机指令的发送间隔不小于所述预设时长;其中,所述开机指令对应于多台目标服务器,所述多台目标服务器装配于一个或多个机柜中,且对应于同一机柜的目标服务器的数量不大于所述最大安全数量。
可选的,
还包括:标识确定单元93,确定所述目标服务器所处机柜对应的调度标识;
所述指令发送单元92具体用于:当所述调度标识表示允许调度时,向所述基板管理控制器发送开机指令,所述开机指令对应的处于同一机柜的目标服务器的数量不大于所述最大安全数量;针对所述目标服务器所处机柜启动计时器,使得所述调度标识在所述计时器超时前表示禁止调度、在所述计时器超时后切换为允许调度。
可选的,所述开机指令的发送频率被限制为不大于预设频率。
可选的,还包括:
获取单元94,获取所述目标服务器的开机进度和/或过程信息,以向所述用户进行反馈。
可选的,所述带外管理通道基于局域网实现;或者,所述带外管理通道基于广域网实现。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
在一个典型的配置中,计算机包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。

Claims (19)

1.一种服务器开机管理系统,其特征在于,包括:
目标服务器,所述目标服务器上设有基板管理控制器;
服务器自动开机管控平台,所述服务器自动开机管控平台在收到用户针对所述目标服务器发起的开机请求时,生成开机指令;
带外管理服务器,所述带外管理服务器接收所述开机指令,并通过与所述基板管理控制器之间建立的带外管理通道,向所述基板管理控制器发送所述开机指令。
2.根据权利要求1所述的方法,其特征在于,所述目标服务器装配于对应的机柜中,所述机柜用于对内置的所有服务器进行统一供电;其中,所述机柜内置的服务器在预设时长内被开启的数量不超过最大安全数量。
3.一种服务器自动开机管控平台,其特征在于,所述服务器自动开机管控平台用于根据用户针对目标服务器发起的开机请求,向带外管理服务器发送开机指令,以使所述带外管理服务器通过与所述目标服务器的基板管理控制器之间建立的带外管理通道,向所述基板管理控制器发送所述开机指令。
4.一种服务器开机管理方法,其特征在于,包括:
根据用户发起的开机请求,确定所述开机请求对应的目标服务器;
通过带外管理服务器与所述目标服务器上设置的基板管理控制器之间建立的带外管理通道,向所述基板管理控制器发送开机指令。
5.根据权利要求4所述的方法,其特征在于,所述目标服务器装配于对应的机柜中,所述机柜用于对内置的所有服务器进行统一供电;其中,所述机柜内置的服务器在预设时长内被开启的数量不超过最大安全数量。
6.根据权利要求5所述的方法,其特征在于,所述开机指令的发送间隔不小于所述预设时长;其中,所述开机指令对应于多台目标服务器,所述多台目标服务器装配于一个或多个机柜中,且对应于同一机柜的目标服务器的数量不大于所述最大安全数量。
7.根据权利要求5所述的方法,其特征在于,
还包括:确定所述目标服务器所处机柜对应的调度标识;
所述向所述基板管理控制器发送开机指令,包括:当所述调度标识表示允许调度时,向所述基板管理控制器发送开机指令,所述开机指令对应的处于同一机柜的目标服务器的数量不大于所述最大安全数量;针对所述目标服务器所处机柜启动不小于所述预设时长的计时器,使得所述调度标识在所述计时器超时前表示禁止调度、在所述计时器超时后切换为允许调度。
8.根据权利要求4所述的方法,其特征在于,所述开机指令的发送频率被限制为不大于预设频率。
9.根据权利要求4所述的方法,其特征在于,还包括:
获取所述目标服务器的开机进度和/或过程信息,以向所述用户进行反馈。
10.根据权利要求4所述的方法,其特征在于,所述带外管理通道基于局域网实现;或者,所述带外管理通道基于广域网实现。
11.一种服务器开机管理装置,其特征在于,包括:
服务器确定单元,根据用户发起的开机请求,确定所述开机请求对应的目标服务器;
指令发送单元,通过带外管理服务器与所述目标服务器上设置的基板管理控制器之间建立的带外管理通道,向所述基板管理控制器发送开机指令。
12.根据权利要求11所述的装置,其特征在于,所述目标服务器装配于对应的机柜中,所述机柜用于对内置的所有服务器进行统一供电;其中,所述机柜内置的服务器在预设时长内被开启的数量不超过最大安全数量。
13.根据权利要求12所述的装置,其特征在于,所述开机指令的发送间隔不小于所述预设时长;其中,所述开机指令对应于多台目标服务器,所述多台目标服务器装配于一个或多个机柜中,且对应于同一机柜的目标服务器的数量不大于所述最大安全数量。
14.根据权利要求12所述的装置,其特征在于,
还包括:标识确定单元,确定所述目标服务器所处机柜对应的调度标识;
所述指令发送单元具体用于:当所述调度标识表示允许调度时,向所述基板管理控制器发送开机指令,所述开机指令对应的处于同一机柜的目标服务器的数量不大于所述最大安全数量;针对所述目标服务器所处机柜启动计时器,使得所述调度标识在所述计时器超时前表示禁止调度、在所述计时器超时后切换为允许调度。
15.根据权利要求11所述的装置,其特征在于,所述开机指令的发送频率被限制为不大于预设频率。
16.根据权利要求11所述的装置,其特征在于,还包括:
获取单元,获取所述目标服务器的开机进度和/或过程信息,以向所述用户进行反馈。
17.根据权利要求11所述的装置,其特征在于,所述带外管理通道基于局域网实现;或者,所述带外管理通道基于广域网实现。
18.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求4-10中任一项所述的方法。
19.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求4-10中任一项所述方法的步骤。
CN201910344211.XA 2019-04-26 2019-04-26 服务器开机管理系统、方法及装置 Pending CN111857836A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910344211.XA CN111857836A (zh) 2019-04-26 2019-04-26 服务器开机管理系统、方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910344211.XA CN111857836A (zh) 2019-04-26 2019-04-26 服务器开机管理系统、方法及装置

Publications (1)

Publication Number Publication Date
CN111857836A true CN111857836A (zh) 2020-10-30

Family

ID=72951741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910344211.XA Pending CN111857836A (zh) 2019-04-26 2019-04-26 服务器开机管理系统、方法及装置

Country Status (1)

Country Link
CN (1) CN111857836A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112556113A (zh) * 2020-11-30 2021-03-26 珠海格力电器股份有限公司 一种多模块机组及其控制方法、装置、存储介质及处理器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101877640A (zh) * 2009-11-30 2010-11-03 英业达股份有限公司 服务器的电源控制系统
CN102448074A (zh) * 2010-09-30 2012-05-09 国际商业机器公司 一种服务器管理的方法和系统
CN102478948A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 服务器机柜系统及其启动方法、以及服务器启动方法
CN102710427A (zh) * 2012-07-10 2012-10-03 上海贝锐信息科技有限公司 一种远程开机系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101877640A (zh) * 2009-11-30 2010-11-03 英业达股份有限公司 服务器的电源控制系统
CN102448074A (zh) * 2010-09-30 2012-05-09 国际商业机器公司 一种服务器管理的方法和系统
CN102478948A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 服务器机柜系统及其启动方法、以及服务器启动方法
CN102710427A (zh) * 2012-07-10 2012-10-03 上海贝锐信息科技有限公司 一种远程开机系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112556113A (zh) * 2020-11-30 2021-03-26 珠海格力电器股份有限公司 一种多模块机组及其控制方法、装置、存储介质及处理器

Similar Documents

Publication Publication Date Title
EP3399692B1 (en) Method and apparatus for upgrading distributed storage system
CN107451147B (zh) 一种kafka集群动态切换的方法和装置
CN113037794B (zh) 计算资源配置调度方法、装置及系统
CN112799786A (zh) 微服务实例的退出方法、装置、设备及存储介质
CN110618869B (zh) 一种资源管理方法、装置及设备
CN107040576B (zh) 信息推送方法及装置、通讯系统
JP5503678B2 (ja) ホスト提供システム及びホスト提供方法
CN106326060A (zh) 基板管理控制系统及其方法
CN111953809B (zh) 一种管理资源地址的方法、装置、设备及系统
CN111857836A (zh) 服务器开机管理系统、方法及装置
US9348667B2 (en) Apparatus for managing application program and method therefor
CN115686746A (zh) 访问方法、任务处理方法、计算设备及计算机存储介质
CN112000390B (zh) 用户信息管理方法、装置、电子设备及存储介质
CN104504348A (zh) 一种基于高可用存储系统的数据保护方法
CN112866314B (zh) 分布式主从系统中从节点的切换方法、主节点设备和存储介质
CN114201284A (zh) 定时任务管理方法及系统
CN112148420B (zh) 基于容器技术的异常任务处理方法、服务器及云平台
CN110618863A (zh) 一种基于Raft算法的作业调度方法
CN108255820B (zh) 分布式系统中数据入库的方法、装置以及电子设备
US20200229247A1 (en) Network management method, wireless access device, terminal, system and storage medium
CN112784276A (zh) 可信度量的实现方法及装置
CN111339520B (zh) 基于硬件狗的在线管控方法、电子设备和存储介质
CN116627240B (zh) 功耗调节方法、装置、电子设备、存储介质及程序产品
CN111143037B (zh) 一种虚拟机资源分配方法、设备、系统及存储介质
CN117348951B (zh) 应用于linux内核的容器感知装置和容器感知方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination