CN114090329A - 一种全卸载架构下的服务器重启方法及相关设备 - Google Patents

一种全卸载架构下的服务器重启方法及相关设备 Download PDF

Info

Publication number
CN114090329A
CN114090329A CN202010750512.5A CN202010750512A CN114090329A CN 114090329 A CN114090329 A CN 114090329A CN 202010750512 A CN202010750512 A CN 202010750512A CN 114090329 A CN114090329 A CN 114090329A
Authority
CN
China
Prior art keywords
card
restart
server
host server
host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010750512.5A
Other languages
English (en)
Inventor
阮野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Cloud Computing Technologies Co Ltd
Original Assignee
Huawei Cloud Computing Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Cloud Computing Technologies Co Ltd filed Critical Huawei Cloud Computing Technologies Co Ltd
Priority to CN202010750512.5A priority Critical patent/CN114090329A/zh
Publication of CN114090329A publication Critical patent/CN114090329A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本申请提供一种全卸载架构下的服务器重启方法及相关设备。其中,该方法包括:卸载卡接收主机重启请求;该卸载卡根据主机重启请求,冻结所述卸载卡的磁盘写入并开启所述卸载卡与宿主服务器的联动重启,所述卸载卡插置于所述宿主服务器;所述卸载卡生成重启命令,所述重启命令用于重启所述宿主服务器。上述方法能够避免直接对卸载卡进行重启,保证在重启过程中不会对相关文件系统以及硬件造成损坏,提高重启安全性。

Description

一种全卸载架构下的服务器重启方法及相关设备
技术领域
本发明涉及云计算技术领域,尤其涉及一种全卸载架构下的服务器重启方法及相关设备。
背景技术
云计算作为近年来新兴的产业,获得了科研界和产业界的广泛关注。云计算在全世界范围的兴起,以其灵活、高效、低成本、节能的运作方式成为推动产业绿色发展的重要引擎和21世纪新的商业平台。随着公有云规模不断增加,无论是裸金属服务器(云上的专属物理服务器)还是弹性云服务器(由CPU、内存、操作系统、云硬盘组成的基础的计算组件)都对计算性能提出了更高的要求,为了在相同规格条件下提供更高的计算性能,目前业界都是通过卸载卡技术,将服务器的存储、网络层面的服务和管理等卸载到卸载卡上,并进一步对服务器的管理资源全面卸载到卸载卡上(即全卸载架构),以达到更高的计算性能。
在非卸载架构下,服务器通过本地的重启指令进行重启,由于非卸载架构系统中,管理节点所管控的服务器就是未进行管理资源卸载的服务器,所以本地重启指令能够满足需求。但在全卸载架构下,由于宿主服务器的管理资源几乎都卸载到了卸载卡上,因此管理节点所直接管控的是卸载卡而不再是宿主服务器,管理节点只能向卸载卡下发重启指令,卸载卡进行本地重启,但是直接重启卸载卡将会导致相关文件系统损坏、硬件损坏以及卸载卡无法复位等问题。
因此,如何构建卸载卡以及宿主服务器安全重启的能力,避免直接对卸载卡进行重启目前亟待解决的问题。
发明内容
本发明实施例公开了一种全卸载架构下的服务器重启方法及相关设备,能够避免直接对卸载卡进行重启,保证在重启过程中不会对相关文件系统造成损坏,提高重启安全性。
第一方面,本申请提供一种全卸载架构下的服务器重启方法,所述方法包括:卸载卡接收主机重启请求;该卸载卡根据所述主机重启请求,冻结该卸载卡的磁盘写入并开始该卸载卡与宿主服务器的联动重启,该卸载卡插置于所述宿主服务器;该卸载卡生成重启命令,所述重启命令用于重启所述宿主服务器。
在本申请提供的方案中,卸载卡通过冻结磁盘写入并配置与宿主服务器的联动重启能力,使得在重启宿主服务器的时候带动卸载卡进行重启,从而避免直接对卸载卡进行重启,可以避免对相关文件系统以及硬件造成损坏,提高了重启安全性。
结合第一方面,在第一方面的一种可能的实现方式中,所述卸载卡根据所述主机重启请求配置复杂可编程逻辑器件CPLD寄存器,所述CPLD寄存器用于确保所述卸载卡与所述宿主服务器实现同步重启。
在本申请提供的方案中,卸载卡通过配置CPLD寄存器以保证宿主服务器在重启的同时带动卸载卡进行重启,从而可以避免直接在卸载卡上进行重启导致的相关文件系统以及硬件故障。
结合第一方面,在第一方面的一种可能的实现方式中,所述卸载卡判断与所述宿主服务器之间是否存在远程命令执行通道,所述远程命令执行通道用于所述卸载卡和所述宿主服务器进行通信;在确定存在远程命令执行通道的情况下,所述卸载卡通过所述远程命令执行通道向所述宿主服务器下发所述重启命令。
在本申请提供的方案中,卸载卡在配置与宿主服务器的联动重启能力之后,可以通过远程命令执行通道直接向宿主服务器下发重启命令,以使得宿主服务器根据重启命令进行重启,并在重启的同时带动卸载卡也进行重启。
结合第一方面,在第一方面的一种可能的实现方式中,在所述卸载卡确定不存在远程命令执行通道的情况下,所述卸载卡调用远程重启接口向中心控制模块发送所述重启命令,以使所述中心控制模块调用管理接口向服务器管理模块发送所述重启命令,其中,所述服务器管理模块用于根据所述重启命令对所述宿主服务器进行重启,所述中心控制模块和所述服务器管理模块位于同一管理节点上,所述管理节点对所述宿主服务器进行管理和监控。
在本申请提供的方案中,若卸载卡与宿主服务器之间不存在远程命令执行通道,则卸载卡将通过管理区中的中心控制模块以及服务器管理模块间接向宿主服务器下发重启命令,在中心控制模块以及服务器管理模块的协助下完成对宿主服务器的重启,并在宿主服务器重启的同时带动卸载卡进行重启。
结合第一方面,在第一方面的一种可能的实现方式中,所述管理接口包括ironic接口和nova接口。
在本申请提供的方案中,针对不同的管控场景,中心控制模块可以通过调用不同的管理接口向服务器管理模块发送重启命令,以使得服务器管理模块能够对宿主服务器进行重启,扩展了适用场景。
第二方面,本申请提供了一种全卸载架构下的服务器重启系统,所述系统包括卸载卡和宿主服务器,所述卸载卡插置于所述宿主服务器,其中:所述卸载卡用于接收主机重启请求,根据所述主机重启请求冻结所述卸载卡的磁盘写入并开启所述卸载卡与所述宿主服务器的联动重启,生成重启命令;所述宿主服务器用于根据所述重启命令进行重启。
结合第二方面,在第二方面的一种可能的实现方式中,所述卸载卡还用于根据所述主机重启请求配置CPLD寄存器,所述CPLD寄存器用于确保所述卸载卡与所述宿主服务器实现同步重启。
结合第二方面,在第二方面的一种可能的实现方式中,所述卸载卡还用于判断与所述宿主服务器之间是否存在远程命令执行通道,所述远程命令执行通道用于所述卸载卡和所述宿主服务器进行通信;在确定存在远程命令执行通道的情况下,所述卸载卡通过所述远程命令执行通道向所述宿主服务器下发所述重启命令。
结合第二方面,在第二方面的一种可能的实现方式中,所述系统还包括中心控制模块和服务器管理模块,所述中心控制模块和所述服务器管理模块位于同一管理节点上,其中,所述中心控制模块用于接收所述卸载卡调用远程重启接口所发送的所述重启命令,并通过调用管理接口向所述服务器管理模块发送所述重启命令;所述服务器管理模块用于根据所述重启命令对所述宿主服务器进行重启。
结合第二方面,在第二方面的一种可能的实现方式中,所述管理接口包括ironic接口和nova接口。
第三方面,本申请提供了一种卸载卡,包括:接收单元,用于接收主机重启请求;处理单元,用于根据所述主机重启请求冻结所述卸载卡的磁盘写入并开启所述卸载卡与宿主服务器的联动重启,所述卸载卡插置于所述宿主服务器;生成单元,用于生成重启命令,所述重启命令用于重启所述宿主服务器。
结合第三方面,在第三方面的一种可能的实现方式中,所述处理单元,具体用于:根据所述主机重启请求配置复杂可编程逻辑器件CPLD寄存器,所述CPLD寄存器用于确保所述卸载卡与所述宿主服务器实现同步重启。
结合第三方面,在第三方面的一种可能的实现方式中,所述处理单元,还用于判断与所述宿主服务器之间是否存在远程命令执行通道,所述远程命令执行通道用于所述卸载卡和所述宿主服务器进行通信;所述生成单元,还用于在确定存在远程命令执行通道的情况下,通过所述远程命令执行通道向所述宿主服务器下发所述重启命令。
结合第三方面,在第三方面的一种可能的实现方式中,在所述处理单元确定不存在远程命令执行通道的情况下,所述生成单元,还用于调用远程重启接口向中心控制模块发送所述重启命令,以使所述中心控制模块调用管理接口向服务器管理模块发送所述重启命令,其中,所述服务器管理模块用于根据所述重启命令对所述宿主服务器进行重启,所述中心控制模块和所述服务器管理模块位于同一管理节点上,所述管理节点对所述宿主服务器进行管理和监控。
结合第三方面,在第三方面的一种可能的实现方式中,所述管理接口包括ironic接口和nova接口。
第四方面,本申请提供了一种计算设备,所述计算设备包括处理器和存储器,所述存储器用于存储程序代码,所述处理器用于调用所述存储器中的程序代码执行上述第一方面以及结合上述第一方面中的任意一种实现方式的方法。
第五方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当该计算机程序被处理器执行时,可以实现上述第一方面以及结合上述第一方面中的任意一种实现方式所提供的方法的流程。
第六方面,本申请提供了一种计算机程序产品,该计算机程序产品包括指令,当该计算机程序被计算机执行时,使得计算机可以执行上述第一方面以及结合上述第一方面中的任意一种实现方式所提供的方法的流程。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种服务器进行重启的场景示意图;
图2是本申请实施例提供的一种服务器重启系统的结构示意图;
图3是本申请实施例提供的一种服务器重启方法的流程示意图;
图4是本申请实施例提供的一种卸载卡的结构示意图;
图5是本申请实施例提供的一种计算设备的结构示意图。
具体实施方式
下面结合附图对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
首先,结合附图对本申请中所涉及的部分用语和相关技术进行解释说明,以便于本领域技术人员理解。
云计算(cloud computing)是与信息技术、软件、互联网相关的一种服务,云计算将多个计算资源集合起来,形成计算资源共享池,该计算资源共享池也叫做“云”,通过软件实现自动化管理,租户可以按照需求随时获取“云”上的资源,理论上,“云”上的资源可以无限扩展。
裸金属服务器是一台传统物理服务器的升级版,既具备传统物理服务器卓越性能,又具备云主机一样的便捷管理平台,为用户带来卓越的计算性能,能满足核心应用场景对高性能及稳定性的需求。
弹性云服务器(elastic cloud server,ECS)是由CPU、内存、操作系统、云硬盘组成的基础的计算组件,弹性云服务器的开通是自助完成的,用户只需要指定CPU、内存、操作系统、规格、登录鉴权方式即可,同时也可以根据用户的需求随时调整弹性云服务器规格,弹性云服务器创建成功后就可以像使用本地个人计算机(personal computer,PC)或物理服务器一样,在云上使用弹性云服务器。
卸载是指将CPU上的计算或处理转移到专门的处理单元上进行,卸载卡就是实现卸载功能的一种处理单元,其具体形态可以是一种物理计算设备,卸载卡可以实现将服务器(包括裸金属服务器或弹性云服务器)的存储功能、网络服务和管理功能(例如弹性负载均衡)、管控面服务等进行卸载,被卸载的服务器又称为宿主服务器,卸载卡与宿主服务器使用同一套服务器管理系统,在全卸载架构下,由于宿主服务器上的管理资源大部分都卸载到了卸载卡上,因此,在运维场景下,管理节点所直接管控(即直接通信的对象)的是卸载卡,不是宿主服务器。
Ironic旨在为用户提供自助式的裸金属管理服务,允许用户像管理虚拟机一样管理裸金属节点,部署裸机就像部署虚拟机一样简单,为用户提供多租户网络的裸金属云基础设施。Ironic主要依赖PXE和IPMI技术来实现裸金属节点批量部署和系统控制,因此大部分物理服务器型号都可以通过ironic进行系统安装和电源状态管理,对于个别物理服务器型号,也可以基于ironic的可插拔驱动架构快速开发出针对性的管理驱动程序,凭借标准API、广泛的驱动程序支持和轻量级的空间占用,使ironic适用于从小型边缘部署到大型数据中心的各种用例,提供了理想的运行环境来托管高性能的云应用程序和架构。
Nova是openstack核心的服务,负责维护和管理云环境的计算资源,例如,虚拟机生命周期管理就是通过nova实现的。Nova包含很多组件,这些组件以子服务的形式运行,nova通过这些组件可以实现对虚拟机(例如弹性云服务器)的管控,例如虚拟机的创建、虚拟机的调度、虚拟机的启动等。
在需要对卸载卡进行重启的场景中,管理节点直接向卸载卡下发重启指令,卸载卡根据管理节点发送的重启指令实现重启过程。如图1所示,宿主服务器100上部署有基础服务110,宿主服务器110可以是裸金属服务器或者是弹性云服务器,卸载卡200上部署有管控面服务210和操作系统(operating system,OS)及驱动220,管控面服务210是从宿主服务器100卸载至卸载卡200,用于与管理节点300进行直接通信,管控面服务210具体可以包括运营维护服务、资源调度服务等各种服务,管理节点300部署有管理控制模块310,用于对服务器100和卸载卡200进行管理。在卸载卡200存在重启需求时(例如卸载卡200需要进行冷升级),管理节点300中的管理控制模块310下发重启指令至卸载卡200中的管控面服务210,管控面服务210根据重启指令执行重启操作。
可以看出,上述卸载卡的重启方式是通过管理节点直接向卸载卡发送重启指令完成的,但是卸载卡直接进行重启将会导致相关文件系统损坏、硬件损坏等问题,无法确保卸载卡重启过程中的安全性。
基于上述,本申请提供了一种全卸载架构下的服务器重启方法及相关设备,通过执行该服务器重启方法,可以避免直接对卸载卡进行重启,保证在重启过程中不会对相关文件系统造成损坏,提高重启安全性。
本申请实施例的技术方案可以应用于全卸载架构下各种需要重启服务器的场景,包括但不限于日常运维场景、服务器升级场景等。
图2示出了本申请实施例提供的一种服务器重启系统的示意图。如图2所示,该服务器重启系统200包括:租户区210和管理区220,租户区210包括基于全卸载架构下的各类不同管控场景下的服务器模型,具体的,租户区210包括存在远程命令执行通道的服务器模型2110和不存在远程命令执行通道的nova管控下的服务器模型2120和ironic管控下的服务器模型2130。服务器模型2110中包括卸载卡21110和其对应的宿主服务器21120,卸载卡21110上部署有管控面服务21111和OS及驱动21112,卸载卡21110与宿主服务器21120之间存在远程命令执行通道,可以直接进行通信(例如卸载卡21110可以直接向宿主服务器21120下发重启命令);服务器模型2120中包括卸载卡21210和其对应的宿主服务器21220,宿主服务器21220可以是弹性云服务器,卸载卡21210上同样部署有管控面服务21211和OS及驱动21212,但是卸载卡21210与宿主服务器21220之间不存在远程命令执行通道,不能直接进行通信;服务器模型2130与服务器模型2120类似,其区别在于宿主服务器21320与宿主服务器21220不同,宿主服务器21320可以是裸金属服务器。管理区220用于对租户区210进行管控,其具体形式可以为一个或多个管理节点,管理区220中部署有中心控制模块2210和服务器管理模块2220,中心控制模块2210包括nova接口2221和ironic接口2222,中心控制模块用于向租户区中的卸载卡(例如卸载卡21110、卸载卡21210和卸载卡21310)下发重启请求以使卸载卡中的管控面服务配置与宿主服务器的联动重启能力(即在宿主服务器重启的同时带动卸载卡也进行重启),然后接收未部署远程命令执行通道的卸载卡(即卸载卡21210和卸载卡21310)返回的重启命令,并调用nova接口2221或ironic接口2222向服务器管理模块2220发送重启命令,服务器管理模块2220根据重启命令对宿主服务器21220或宿主服务器21320进行重启,并使宿主服务器21220或宿主服务器21320在重启的同时带动卸载卡21210或卸载卡21310进行重启。
基于上述,下面对本申请实施例提供的全卸载架构下的服务器重启方法及相关设备进行描述。参见图3,图3为本申请实施例提供的一种全卸载架构下的服务器重启方法的流程示意图。
如图3所示,该方法包括但不限于以下步骤:
S301:卸载卡接收主机重启请求。
具体地,当在对服务器进行运营维护过程中或者在对服务器进行冷升级(例如在OS层面或系统层面修改了相关配置)时,需要重启服务器,用户则通过上述管理区220中的中心控制模块2210向卸载卡下发主机重启请求。
S302:卸载卡根据主机重启请求,冻结该卸载卡的磁盘写入。
具体地,卸载卡中的管控面服务在接收到中心控制模块2210下发的主机重启请求之后,使用统一虚拟化平台(unified virtualizationplatform,UVP)命令对卸载卡的磁盘进行冻结,禁止写入,避免后续出现文件系统故障等问题。
S303:卸载卡开启与宿主服务器的联动重启。
具体地,卸载卡中的管控面服务在完成磁盘冻结之后,为该卸载卡配置重启联动能力,即管控面服务将会配置一个复杂可编程逻辑器件(complex programmable logicdevice,CPLD)的寄存器,该寄存器可以被宿主服务器进行访问,可以通过配置一个寄存器值以使得宿主服务器在发送复位信号至卸载卡时重启卸载卡,例如可以将该寄存器值设置为1,当宿主服务器在进行重启时将产生复位信号并发送至卸载卡,由于卸载卡事先配置了寄存器值为1,因此将会触发卸载卡进行重启,这样可以保证在宿主服务器进行重启的同时也将会带动卸载卡进行重启,实现了卸载卡与宿主服务器之间的联动重启。
可以看出,卸载卡通过冻结磁盘写入并配置与宿主服务器的重启联动能力,可以保证在宿主服务器重启的同时带动卸载卡进行重启,避免直接在卸载卡上进行重启导致对相关文件系统造成损坏以及对硬件造成损坏等问题。
S304:卸载卡判断与宿主服务器之间是否存在远程命令执行通道,若存在,则执行步骤S305,若不存在,则执行步骤S306。
具体地,卸载卡中的管控面服务可以在冻结磁盘写入并配置与宿主服务器的重启联动能力之后,检查与宿主服务器之间是否部署了远程命令执行通道,该远程命令执行通道用于卸载卡与宿主服务器之间进行直接通信,其具体形式可以是通信网络。
S305:卸载卡使用远程命令执行通道向宿主服务器下发重启命令。
具体地,卸载卡中的管控面服务生成重启命令,该重启命令用于重启宿主服务器,然后通过远程命令执行通道向宿主服务器下发该重启命令,以使得宿主服务器在接收到该重启命令进行重启,并在重启的同时带动卸载卡进行重启。例如,上述卸载卡21110中的管控面服务21111生成重启命令并通过远程命令执行通道发送给宿主服务器21120,宿主服务器21120进行重启的同时带动卸载卡21110也进行重启。
S306:卸载卡调用远程重启接口向中心控制模块发送重启命令。
具体地,卸载卡在确定无法直接向宿主服务器下发重启命令时,将会调用管理区220提供的远程重启接口,并向管理区220中的中心控制模块2210发送重启命令。
S307:中心控制模块调用管理接口向服务器管理模块发送重启命令。
具体地,中心控制模块2210基于不同的管控场景调用相应的管理接口向服务器管理模块2220发送重启命令。
可选的,对于裸金属服务器场景,中心控制模块2210可以调用nova接口向服务器管理模块2220发送重启命令;对于弹性云服务器场景,中心控制模块2210可以调用ironic接口向服务器管理模块2220发送重启命令。
S308:服务器管理模块检测宿主服务器的当前状态是否支持重启。
具体地,服务器管理模块2220在接收到重启命令之后,可以通过调度模块检测宿主服务器当前的状态是否支持重启,可选的,对于裸金属服务器场景,可以通过检测裸金属服务器是否正处于给租户发放资源的状态等确定宿主服务器是否支持重启,示例性的,若当前裸金属服务器正在给租户发放资源,则裸金属服务器处于不可重启状态,反之,则裸金属服务器处于可重启状态;对于弹性云服务器场景,可以通过检测宿主服务器上是否存在其它租户的虚拟机在运行确定宿主服务器是否支持重启,若存在其它租户的虚拟机,则宿主服务器当前状态不支持重启,需要关闭其它租户的虚拟机或对其它租户的虚拟机进行迁移以使得宿主服务器能够支持重启。
S309:服务器管理模块对宿主服务器进行重启。
具体地,服务器管理模块2220在确定宿主服务器当前的状态支持重启之后,可以通过调用智能平台管理接口工具(intelligent platform management interface tool,IPMItool)对宿主服务器进行重启。
可选的,对于裸金属服务器场景,服务器管理模块2220通过调用其对应的电源状态修改接口对裸金属服务器执行下电再上电的操作,从而完成对裸金属服务器的重启;对于弹性云服务器场景,服务器管理模块2220通过调用其对应的启停接口对弹性云服务器执行停止再启动的操作,从而完成对弹性云服务器的重启。
进一步的,宿主服务器在进行重启的同时将会产生复位信号,宿主服务器将该复位信号发送至卸载卡,由于卸载卡事先配置了相应的寄存器值,因此,当宿主服务器的复位信号发送过来时将会触发卸载卡也进行重启,从而完成了卸载卡与宿主服务器的联动重启。
可以看出,通过执行图3所示的方法,卸载卡通过冻结磁盘写入并预先配置与宿主服务器的联动重启能力,然后通过管理区向宿主服务器下发重启命令,这样,可以保证在宿主服务器重启的同时带动卸载卡进行重启,从而避免对卸载卡直接进行重启导致对相关文件系统以及硬件造成损坏,提高卸载卡重启的安全性。
上述详细阐述了本申请实施例的方法,为了便于更好的实施本申请实施例的上述方案,相应地,下面还提供用于配合实施上述方案的相关设备。
参见图4,图4是本申请实施例提供的一种卸载卡的结构示意图,该卸载卡可以是上述图3所述的方法实施例中的卸载卡,可以执行图3所述的全卸载架构下的服务器重启方法实施例中以卸载卡为执行主体的方法和步骤。如图4所示,该卸载卡400包括接收单元410、处理单元420和生成单元430。其中,
接收单元410,用于接收主机重启请求;
处理单元420,用于根据所述主机重启请求冻结所述卸载卡的磁盘写入并开启所述卸载卡与宿主服务器的联动重启,所述卸载卡插置于所述宿主服务器;
生成单元430,用于生成重启命令,所述重启命令用于重启所述宿主服务器。
具体地,所述接收单元410用于执行前述步骤S301,且可选的执行前述步骤中可选的方法,所述处理单元420用于执行前述步骤S302、S303以及S304,且可选的执行前述步骤中可选的方法,所述生成单元430用于执行前述步骤S305和S306,且可选的执行前述步骤中可选的方法。上述三个单元之间互相可以通过通信通路进行数据传输,应理解,卸载卡400包括的各单元可以为软件单元、也可以为硬件单元、或部分为软件单元部分为硬件单元。
作为一个实施例,所述处理单元,具体用于:根据所述主机重启请求配置复杂可编程逻辑器件CPLD寄存器,所述CPLD寄存器用于确保所述卸载卡与所述宿主服务器实现同步重启。
作为一个实施例,所述处理单元420,还用于判断与所述宿主服务器之间是否存在远程命令执行通道,所述远程命令执行通道用于所述卸载卡和所述宿主服务器进行通信;所述生成单元430,还用于在确定存在远程命令执行通道的情况下,通过所述远程命令执行通道向所述宿主服务器下发所述重启命令。
作为一个实施例,在所述处理单元420确定不存在远程命令执行通道的情况下,所述生成单元430,还用于调用远程重启接口向中心控制模块发送所述重启命令,以使所述中心控制模块调用管理接口向服务器管理模块发送所述重启命令,其中,所述服务器管理模块用于根据所述重启命令对所述宿主服务器进行重启,所述中心控制模块和所述服务器管理模块位于同一管理节点上,所述管理节点对所述宿主服务器进行管理和监控。
作为一个实施例,所述管理接口包括ironic接口和nova接口。
可以理解,本申请实施例中的接收单元410可以由收发器或收发器相关电路组件实现,处理单元420和生成单元430可以由处理器或处理器相关电路组件实现。
需要说明的是,上述卸载卡的结构仅仅作为一种示例,不应构成具体限定,可以根据需要对该卸载卡中的各个单元进行增加、减少或合并。此外,该卸载卡中的各个单元的操作和/或功能是为了实现上述图3所描述的方法的相应流程,为了简洁,在此不再赘述。
参见图5,图5是本申请实施例提供的一种计算设备的结构示意图。如图5所示,该计算设备500包括:处理器510、通信接口520以及存储器530,所述处理器510、通信接口520以及存储器530通过内部总线540相互连接。
所述处理器510可以由一个或者多个通用处理器构成,例如中央处理器(centralprocessing unit,CPU),或者CPU和硬件芯片的组合。上述硬件芯片可以是专用集成电路(application-specific integratedcircuit,ASIC)、可编程逻辑器件(programmablelogic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complexprogrammable logic device,CPLD)、现场可编程逻辑门阵列(field-programmable gatearray,FPGA)、通用阵列逻辑(generic array logic,GAL)或其任意组合。
总线540可以是外设部件互连标准(peripheral component interconnect,PCI)总线或扩展工业标准结构(extended industry standard architecture,EISA)总线等。所述总线540可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但不表示仅有一根总线或一种类型的总线。
存储器530可以包括易失性存储器(volatile memory),例如随机存取存储器(random access memory,RAM);存储器530也可以包括非易失性存储器(non-volatilememory),例如只读存储器(read-only memory,ROM)、快闪存储器(flash memory)、硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);存储器530还可以包括上述种类的组合。
需要说明的是,计算设备500的存储器530中存储了卸载卡400的各个单元对应的代码,处理器510执行这些代码实现了卸载卡400的各个单元的功能,即执行了S301-S309的方法。
本申请还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机程序,当该计算机程序被处理器执行时,可以实现上述方法实施例中记载的任意一种的部分或全部步骤。
本发明实施例还提供一种计算机程序,该计算机程序包括指令,当该计算机程序被计算机执行时,使得计算机可以执行任意一种发放区域资源的方法的部分或全部步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可能可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

Claims (17)

1.一种全卸载架构下的服务器重启方法,其特征在于,包括:
卸载卡接收主机重启请求;
所述卸载卡根据所述主机重启请求,冻结所述卸载卡的磁盘写入并开启所述卸载卡与宿主服务器的联动重启,所述卸载卡插置于所述宿主服务器;
所述卸载卡生成重启命令,所述重启命令用于重启所述宿主服务器。
2.如权利要求1所述的方法,其特征在于,所述卸载卡开启所述卸载卡与宿主服务器的联动重启,包括:
所述卸载卡根据所述主机重启请求配置复杂可编程逻辑器件CPLD寄存器,所述CPLD寄存器用于确保所述卸载卡与所述宿主服务器实现同步重启。
3.如权利要求1或2所述的方法,其特征在于,所述方法还包括:
所述卸载卡判断与所述宿主服务器之间是否存在远程命令执行通道,所述远程命令执行通道用于所述卸载卡和所述宿主服务器进行通信;
在确定存在远程命令执行通道的情况下,所述卸载卡通过所述远程命令执行通道向所述宿主服务器下发所述重启命令。
4.如权利要求3所述的方法,其特征在于,在所述卸载卡确定不存在远程命令执行通道的情况下,所述方法还包括:
所述卸载卡调用远程重启接口向中心控制模块发送所述重启命令,以使所述中心控制模块调用管理接口向服务器管理模块发送所述重启命令,其中,所述服务器管理模块用于根据所述重启命令对所述宿主服务器进行重启,所述中心控制模块和所述服务器管理模块位于同一管理节点上,所述管理节点对所述宿主服务器进行管理和监控。
5.如权利要求4所述的方法,其特征在于,所述管理接口包括裸机ironic接口和虚拟机nova接口。
6.一种全卸载架构下的服务器重启系统,其特征在于,包括卸载卡和宿主服务器,所述卸载卡插置于所述宿主服务器,其中:
所述卸载卡用于接收主机重启请求,根据所述主机重启请求冻结所述卸载卡的磁盘写入并开启所述卸载卡与所述宿主服务器的联动重启,生成重启命令;
所述宿主服务器用于根据所述重启命令进行重启。
7.如权利要求6所述的系统,其特征在于,
所述卸载卡还用于根据所述主机重启请求配置CPLD寄存器,所述CPLD寄存器用于确保所述卸载卡与所述宿主服务器实现同步重启。
8.如权利要求6或7所述的系统,其特征在于,
所述卸载卡还用于判断与所述宿主服务器之间是否存在远程命令执行通道,所述远程命令执行通道用于所述卸载卡和所述宿主服务器进行通信;
在确定存在远程命令执行通道的情况下,所述卸载卡通过所述远程命令执行通道向所述宿主服务器下发所述重启命令。
9.如权利要求8所述的系统,其特征在于,所述系统还包括中心控制模块和服务器管理模块,所述中心控制模块和所述服务器管理模块位于同一管理节点上,其中,
所述中心控制模块用于接收所述卸载卡调用远程重启接口所发送的所述重启命令,并通过调用管理接口向所述服务器管理模块发送所述重启命令;
所述服务器管理模块用于根据所述重启命令对所述宿主服务器进行重启。
10.如权利要求9所述的系统,其特征在于,所述管理接口包括ironic接口和nova接口。
11.一种卸载卡,其特征在于,包括:
接收单元,用于接收主机重启请求;
处理单元,用于根据所述主机重启请求冻结所述卸载卡的磁盘写入并开启所述卸载卡与宿主服务器的联动重启,所述卸载卡插置于所述宿主服务器;
生成单元,用于生成重启命令,所述重启命令用于重启所述宿主服务器。
12.如权利要求11所述的卸载卡,其特征在于,所述处理单元,具体用于:
根据所述主机重启请求配置复杂可编程逻辑器件CPLD寄存器,所述CPLD寄存器用于确保所述卸载卡与所述宿主服务器实现同步重启。
13.如权利要求11或12所述的卸载卡,其特征在于,
所述处理单元,还用于判断与所述宿主服务器之间是否存在远程命令执行通道,所述远程命令执行通道用于所述卸载卡和所述宿主服务器进行通信;
所述生成单元,还用于在确定存在远程命令执行通道的情况下,通过所述远程命令执行通道向所述宿主服务器下发所述重启命令。
14.如权利要求13所述的卸载卡,其特征在于,在所述处理单元确定不存在远程命令执行通道的情况下,
所述生成单元,还用于调用远程重启接口向中心控制模块发送所述重启命令,以使所述中心控制模块调用管理接口向服务器管理模块发送所述重启命令,其中,所述服务器管理模块用于根据所述重启命令对所述宿主服务器进行重启,所述中心控制模块和所述服务器管理模块位于同一管理节点上,所述管理节点对所述宿主服务器进行管理和监控。
15.如权利要求14所述的卸载卡,其特征在于,所述管理接口包括ironic接口和nova接口。
16.一种计算设备,其特征在于,所述计算设备包括存储器和处理器,所述处理器执行存储器存储的计算机指令,使得所述计算设备执行权利要求1-5任一项所述的方法。
17.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,所述处理器执行权利要求1-5任一项所述的方法。
CN202010750512.5A 2020-07-30 2020-07-30 一种全卸载架构下的服务器重启方法及相关设备 Pending CN114090329A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010750512.5A CN114090329A (zh) 2020-07-30 2020-07-30 一种全卸载架构下的服务器重启方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010750512.5A CN114090329A (zh) 2020-07-30 2020-07-30 一种全卸载架构下的服务器重启方法及相关设备

Publications (1)

Publication Number Publication Date
CN114090329A true CN114090329A (zh) 2022-02-25

Family

ID=80294890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010750512.5A Pending CN114090329A (zh) 2020-07-30 2020-07-30 一种全卸载架构下的服务器重启方法及相关设备

Country Status (1)

Country Link
CN (1) CN114090329A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024087717A1 (zh) * 2022-10-24 2024-05-02 华为云计算技术有限公司 云上资源管理系统及其部署方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024087717A1 (zh) * 2022-10-24 2024-05-02 华为云计算技术有限公司 云上资源管理系统及其部署方法

Similar Documents

Publication Publication Date Title
CN108616382B (zh) 升级网卡固件的方法、装置、网卡和设备
US11126420B2 (en) Component firmware update from baseboard management controller
US10102170B2 (en) System and method for providing input/output functionality by an I/O complex switch
US8296553B2 (en) Method and system to enable fast platform restart
US10866623B2 (en) Information handling system and method to detect and recover from no power/no post failures
EP2831722B1 (en) Method and system for verifying proper operation of a computing device after a system change
US11550593B2 (en) Information handling system quick boot
US10061596B2 (en) Systems and methods for loading firmware modules
WO2016074127A1 (zh) 计算机设备及计算机设备内存启动的方法
US20190026126A1 (en) System and Method for Operating System Initiated Firmware Update via UEFI Applications
CN114741233A (zh) 快速启动方法
CN114817105A (zh) 设备枚举的方法、装置、计算机设备以及存储介质
US10572151B2 (en) System and method to allocate available high bandwidth memory to UEFI pool services
CN114090329A (zh) 一种全卸载架构下的服务器重启方法及相关设备
US10996942B1 (en) System and method for graphics processing unit firmware updates
CN116450046A (zh) 云盘实现方法、装置、智能网卡、服务器及存储介质
US11809875B2 (en) Low-power pre-boot operations using a multiple cores for an information handling system
CN110688130A (zh) 物理机部署方法、装置、可读存储介质及电子设备
CN114115703A (zh) 裸金属服务器在线迁移方法以及系统
US20240020103A1 (en) Parallelizing data processing unit provisioning
US20240134632A1 (en) Maintenance mode in hci environment
US20240036896A1 (en) Generating installation images based upon dpu-specific capabilities
US9569324B2 (en) System and method for reducing boot time of a workload configuration on a target server
US11327852B1 (en) Live migration/high availability system
CN117421057A (zh) Dpu控制器的操作系统安装方法、系统、服务器、控制器及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination