CN116028094A - 一种bmc的升级方法和装置 - Google Patents
一种bmc的升级方法和装置 Download PDFInfo
- Publication number
- CN116028094A CN116028094A CN202310100874.3A CN202310100874A CN116028094A CN 116028094 A CN116028094 A CN 116028094A CN 202310100874 A CN202310100874 A CN 202310100874A CN 116028094 A CN116028094 A CN 116028094A
- Authority
- CN
- China
- Prior art keywords
- bmc
- hardware
- running state
- operating system
- network operating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 238000012544 monitoring process Methods 0.000 claims abstract description 169
- 230000002159 abnormal effect Effects 0.000 claims description 13
- 238000011084 recovery Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 description 29
- 238000012545 processing Methods 0.000 description 17
- 238000012423 maintenance Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Abstract
本发明实施例提供了一种BMC的升级方法和装置,涉及互联网技术领域,所述方法包括:BMC接收网络操作系统发送的固件升级指令;其中,所述固件升级指令包括待更新的固件镜像数据;根据所述固件升级指令擦除所述BMC的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC;当所述网络操作系统监控硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级。通过上述方法,提高了BMC升级时的可靠性,避免升级或升级失败时由于BMC暂时不可用而导致硬件的监控失控的情况,提高了BMC运行的安全性以及固件数据升级的可靠性。
Description
技术领域
本发明实施例涉及互联网技术领域,特别是涉及一种BMC的升级方法、一种BMC故障的处理方法、一种BMC的升级装置和一种BMC故障的处理装置。
背景技术
与传统交换机相比,白盒交换机的软件可与硬件解耦,便于部署安装。同时软件可降低成本、提高使用灵活性,为厂商专门的需求构建不同的组建和模块,在白盒交换机的使用过程中,不同的模块可分别部署,提高了灵活性及可靠性。
白盒交换机的一个重要特性是支持以BMC(Baseboard Management Controller基板管理控制器)为核心的管理平面,其可以在与交换机的CPU(Central Processing Unit中央处理器)管理的交换机控制平面互不影响的情况下对交换机状态进行监控及日志记录,甚至可以在交换机CPU出现宕机的情况下仍可对交换机状态进行监控、故障定位或者电源控制。综上,BMC可在不依赖白盒交换机其他部分的情况下对交换机状态进行监控及日志记录,BMC提高了白盒交换机整体的可靠性。
由于具有BMC,CPU一侧的NOS(Network Operating System 网络操作系统)即可把硬件状态监控功能交给BMC,只需BMC监控完成后,通过Restful(层状态传输接口)、IPMI(Intelligent Platform Management Interface 智能平台管理接口)等接口从BMC获取监控数据即可,这样可以大大减轻监控硬件而给CPU带来的压力问题。但由此带来的问题也很明显,如果BMC因固件数据升级而出现重启,或者BMC因故障等其他原因而失去响应,将直接导致白盒交换机硬件监控功能不可用。这是由于 BMC的固件一般保存于FLASH介质中,升级可通过BMC或CPU NOS擦除FLASH(Flash EEPROM Memory 快擦型存储器)介质后写入新的固件数据实现,但无论BMC还是CPU NOS擦写FLASH介质,为了使新升级的BMC生效必须重启BMC系统,这导致BMC功能在升级时会暂时失效。
虽然可以通过暂停CPU NOS中的监控程序以避免NOS程序报错或故障,但此时白盒交换机的硬件状态完全不可知,这对于可靠性要求极高的数据中心网络场景是难以接受的,可能导致机器进入异常状态而无法处理,特别是BMC升级导致的监控功能不可用,若升级时选择暂不重启BMC,使新固件数据生效时将使得需要进行升级BMC的交换机离线,若进行批量固件数据升级时,因设备离线导致的成本是巨大的。因此,有必要为白盒交换机系统提供一种无感知的BMC升级或故障时的临时处理方案,以保证依赖BMC的白盒交换机的正常运行。
发明内容
本发明实施例是提供一种BMC的升级方法、一种BMC故障的处理方法、一种BMC的升级装置和一种BMC故障的处理装置,以解决BMC因升级而重启或者BMC故障而导致的硬件监控功能不可用、以及无法及时备份文件的问题。
本发明实施例公开了一种BMC的升级方法,包括:
BMC接收所述网络操作系统发送的固件升级指令;其中,所述固件升级指令包括待更新的固件镜像数据;
根据所述固件升级指令擦除所述BMC的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC;
当所述网络操作系统监控硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级。
可选地,所述固件数据存储于所述BMC的FLASH介质,所述根据所述固件升级指令擦除所述BMC的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC,包括:
根据所述固件升级指令擦除所述BMC的FLASH介质中的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC的FLASH介质。
可选地,在所述允许所述BMC重启以根据所述待更新的固件镜像数据进行升级之前,所述方法还包括:
在重启所述BMC之前,禁止所述BMC监控硬件的运行状态并切换为所述网络操作系统监控所述硬件的运行状态。
可选地,所述BMC存储有记录信息,所述方法还包括:
将所述BMC的记录信息发送至所述网络操作系统,以使所述网络操作系统对所述BMC的记录信息进行备份。
可选地,所述记录信息至少包含配置文件和日志信息。
可选地,所述BMC与CPU连接,所述网络操作系统位于所述CPU中,所述CPU和所述BMC分别通过低速通道与逻辑器件连接,所述逻辑器件与硬件连接;其中,所述逻辑器件用于获取所述硬件的运行状态。
可选地,所述逻辑器件包含寄存器,所述寄存器用于存储所述硬件的运行状态,其中,将所述CPU与所述逻辑器件连接的低速通道作为备份链路,在所述当所述网络操作系统监控硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级之前,所述方法还包括:
在所述BMC重启之前,禁止所述BMC监控所述硬件的运行状态并切换为所述网络操作系统监控所述硬件的运行状态;
当切换为所述网络操作系统监控所述硬件的运行状态时,通过所述备份链路获取所述逻辑器件中寄存器存储的硬件的运行状态。
可选地,所述方法还包括:
根据所述逻辑器件中寄存器的取值,选择监控所述硬件的运行状态所对应的监控对象;其中,所述监控对象为所述BMC和所述网络操作系统。
可选地,所述根据所述逻辑器件中寄存器的取值,选择监控所述硬件的运行状态所对应的监控对象,包括
当所述寄存器的取值为默认值时,选择所述BMC作为监控对象以监控所述硬件的运行状态;
当所述寄存器的取值为非默认值时,启动所述备份链路并选择所述网络操作系统作为监控对象以监控所述硬件的运行状态。
可选地,所述方法还包括:
在所述BMC监控所述硬件的运行状态时,允许所述网络操作系统按照预设周期读取所述逻辑器件中的寄存器,以根据所述寄存器的取值选择监控所述硬件的运行状态所对应的监控对象。
可选地,所述方法还包括:
当所述寄存器的取值为非默认值时,检测所述备份链路的运行状态是否正常;
当所述备份链路的运行状态为正常时,允许所述网络操作系统监控所述硬件的运行状态;
当所述备份链路的运行状态为异常时,生成第一报错日志信息并禁止所述网络操作系统监控所述硬件的运行状态。
可选地,在所述当所述备份链路的运行状态为异常时,生成第一报错日志信息并禁止所述网络操作系统监控所述硬件的运行状态之后,所述方法还包括:
将所述第一报错日志信息写入所述网络操作系统的第一日志信息,并根据所述BMC的BMC日志格式将所述第一报错日志信息写入所述BMC的第二日志信息。
可选地,在所述当所述网络操作系统监控硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级之后,所述方法还包括:
当寄存器的取值为非默认值时,将所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC;其中,所述第一日志信息至少包括硬件的运行状态和第一报错日志信息。
可选地,所述方法还包括:
当所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC时,允许所述BMC监控所述硬件的运行状态并将所述寄存器的取值恢复为默认值。
可选地,所述方法还包括:
当所述网络操作系统检测到所述寄存器的取值为默认值时,禁止所述网络操作系统监控所述硬件的运行状态并切换为所述BMC监控所述硬件的运行状态;
在切换为所述BMC监控所述硬件的运行状态时,若所述BMC在预设时间内未对所述硬件的运行状态进行监控,则所述网络操作系统控制所述BMC进行重启并记录所述BMC对应的第二报错日志信息。
可选地,所述方法还包括:
当所述BMC在预设时间内未对所述硬件的运行状态进行监控时,允许所述网络操作系统监控所述硬件的运行状态并将所述寄存器的取值切换为非默认值。
本发明实施例还公开了一种BMC故障的处理方法,包括:
当BMC发生故障无法监控硬件的运行状态时,切换为网络操作系统监控所述硬件的运行状态;
在所述网络操作系统监控所述硬件的运行状态时,重启所述BMC以恢复所述BMC监控所述硬件的运行状态。
可选地,所述方法还包括:
在重启所述BMC时,记录所述BMC的故障日志;
将所述BMC的故障日志发送至客户端;
响应于客户端的恢复操作,恢复所述BMC监控所述硬件的运行状态。
可选地,所述BMC存储有记录信息,所述方法还包括:
当切换为所述网络操作系统监控所述硬件的运行状态时,将所述BMC的记录信息发送至所述网络操作系统,以使所述网络操作系统对所述BMC的记录信息进行备份;其中,所述记录信息至少包含配置文件和日志信息。
可选地,在所述重启所述BMC以恢复所述BMC监控所述硬件的运行状态之后,所述方法还包括:
当恢复所述BMC监控所述硬件的运行状态时,将所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC;其中,所述第一日志信息至少包括硬件的运行状态。
本发明实施例还公开了一种BMC的升级装置,包括:
固件升级指令接收模块,用于BMC接收所述网络操作系统发送的固件升级指令;其中,所述固件升级指令包括待更新的固件镜像数据;
固件镜像数据擦写模块,用于根据所述固件升级指令擦除所述BMC的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC;
BMC升级模块,用于当所述网络操作系统监控硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级。
可选地,所述固件数据存储于所述BMC的FLASH介质,所述固件镜像数据擦写模块具体用于:
根据所述固件升级指令擦除所述BMC的FLASH介质中的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC的FLASH介质。
可选地,所述装置还包括:
第一监控对象切换模块,用于在重启所述BMC之前,禁止所述BMC监控硬件的运行状态并切换为所述网络操作系统监控所述硬件的运行状态。
可选地,所述BMC存储有记录信息,所述装置还包括:
第一记录信息备份模块,用于将所述BMC的记录信息发送至所述网络操作系统,以使所述网络操作系统对所述BMC的记录信息进行备份。
可选地,所述逻辑器件包含寄存器,所述寄存器用于存储所述硬件的运行状态,其中,将所述CPU与所述逻辑器件连接的低速通道作为备份链路,所述装置还包括:
第二监控对象切换模块,用于在所述BMC重启之前,禁止所述BMC监控所述硬件的运行状态并切换为所述网络操作系统监控所述硬件的运行状态;
寄存器数据获取模块,用于当切换为所述网络操作系统监控所述硬件的运行状态时,通过所述备份链路获取所述逻辑器件中寄存器存储的硬件的运行状态。
可选地,所述装置还包括:
监控对象选择模块,用于根据所述逻辑器件中寄存器的取值,选择监控所述硬件的运行状态所对应的监控对象;其中,所述监控对象为所述BMC和所述网络操作系统。
可选地,所述装置还包括:
第一监控对象确认模块,用于当所述寄存器的取值为默认值时,选择所述BMC作为监控对象以监控所述硬件的运行状态;
第二监控对象确认模块,用于当所述寄存器的取值为非默认值时,启动所述备份链路并选择所述网络操作系统作为监控对象以监控所述硬件的运行状态。
可选地,所述装置还包括:
寄存器取值读取模块,用于在所述BMC监控所述硬件的运行状态时,允许所述网络操作系统按照预设周期读取所述逻辑器件中的寄存器,以根据所述寄存器的取值选择监控所述硬件的运行状态所对应的监控对象。
可选地,所述装置还包括:
检测模块,用于当所述寄存器的取值为非默认值时,检测所述备份链路的运行状态是否正常;
备份链路正常模块,用于当所述备份链路的运行状态为正常时,允许所述网络操作系统监控所述硬件的运行状态;
备份链路异常模块,用于当所述备份链路的运行状态为异常时,生成第一报错日志信息并禁止所述网络操作系统监控所述硬件的运行状态。
可选地,所述装置还包括:
日志信息写入模块,用于将所述第一报错日志信息写入所述网络操作系统的第一日志信息,并根据所述BMC的BMC日志格式将所述第一报错日志信息写入所述BMC的第二日志信息。
可选地,所述装置还包括:
第一信息回传模块,用于当寄存器的取值为非默认值时,将所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC;其中,所述第一日志信息至少包括硬件的运行状态和第一报错日志信息。
可选地,所述装置还包括:
取值恢复模块,用于当所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC时,允许所述BMC监控所述硬件的运行状态并将所述寄存器的取值恢复为默认值。
可选地,所述装置还包括:
第三监控对象切换模块,用于当所述网络操作系统检测到所述寄存器的取值为默认值时,禁止所述网络操作系统监控所述硬件的运行状态并切换为所述BMC监控所述硬件的运行状态;
BMC报错模块,用于在切换为所述BMC监控所述硬件的运行状态时,若所述BMC在预设时间内未对所述硬件的运行状态进行监控,则所述网络操作系统控制所述BMC进行重启并记录所述BMC对应的第二报错日志信息。
可选地,所述装置还包括:
取值切换模块,用于当所述BMC在预设时间内未对所述硬件的运行状态进行监控时,允许所述网络操作系统监控所述硬件的运行状态并将所述寄存器的取值切换为非默认值。
本发明实施例还公开了一种BMC故障的处理装置,包括:
监控切换模块,用于当BMC发生故障无法监控硬件的运行状态时,切换为网络操作系统监控所述硬件的运行状态;
第一BMC监控恢复模块,用于在所述网络操作系统监控所述硬件的运行状态时,重启所述BMC以恢复所述BMC监控所述硬件的运行状态。
可选地,所述装置还包括:
故障日志记录模块,用于在重启所述BMC时,记录所述BMC的故障日志;
故障日志发送模块,用于将所述BMC的故障日志发送至客户端;
第二BMC监控恢复模块,用于响应于客户端的恢复操作,恢复所述BMC监控所述硬件的运行状态。
可选地,所述BMC存储有记录信息,所述装置还包括:
第二记录信息备份模块,用于当切换为所述网络操作系统监控所述硬件的运行状态时,将所述BMC的记录信息发送至所述网络操作系统,以使所述网络操作系统对所述BMC的记录信息进行备份;其中,所述记录信息至少包含配置文件和日志信息。
可选地,所述装置还包括:
第二信息回传模块,用于当恢复所述BMC监控所述硬件的运行状态时,将所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC;其中,所述第一日志信息至少包括硬件的运行状态。
本发明实施例包括以下优点:
在本发明实施例中,BMC接收网络操作系统发送的固件升级指令,其中,固件升级指令包括待更新的固件镜像数据,进而可以根据固件升级指令擦除BMC的固件数据,并将待更新的固件镜像数据烧录到BMC中,当网络操作系统监控硬件的运行状态时,允许BMC重启以根据待更新的固件镜像数据进行升级。在本发明实施例中,通过将待更新的固件镜像数据烧录到BMC以升级BMC,将默认的BMC监控硬件的运行状态切换为网络操作系统监控硬件的运行状态,提高了BMC升级时的可靠性,避免升级或升级失败时由于BMC暂时不可用而导致硬件监控失控的情况,提高了系统运行的安全性以及固件数据升级的可靠性。
此外,当BMC发生故障无法监控硬件的运行状态时,切换为网络操作系统监控硬件的运行状态,避免BMC发生故障而导致硬件监控失控的情况,提高了系统运行的安全性和可靠性,在网络操作系统监控硬件的运行状态时,通过网络操作系统重启BMC以恢复BMC监控硬件的运行状态,能够实现对硬件的运行状态的不间断监控,保证了系统运行的可靠性。
附图说明
图1是本发明实施例中提供的一种BMC的升级方法的步骤流程图;
图2是本发明实施例中提供的一种硬件通道连接示意图;
图3是本发明实施例中提供的一种CPU网络操作系统侧升级程序流程示意图;
图4是本发明实施例中提供的一种BMC侧升级程序流程示意图;
图5是本发明实施例中提供的一种BMC故障的处理方法的步骤流程图;
图6是本发明实施例中提供的一种BMC的升级装置的结构框图;
图7是本发明实施例中提供的一种BMC故障的处理装置的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
为了使本领域技术人员更好地理解本发明实施例的技术方案,下面对本发明实施例中涉及的部分技术特征进行解释、说明:
网络操作系统(NOS),其为一种包含将计算机和设备接入局域网或网联特殊功能的操作系统。
白盒交换机NOS,即白盒交换机的网络操作系统,主要用于监控交换机工作的操作系统,具有一系列的网络配置功能及工具,例如SONiC(云上开放网络软件)系统。
BMC(Baseboard Management Controller基板管理控制器),其为一种独立于交换机中其他部分(如BIOS(Basic Input Output System基本输入输出系统)、CPU(CentralProcessing Unit中央处理器)、硬盘)的管理器,可通过IPMI等工具实现对交换机各器件的工作状态,例如电源、传感器、日志等器件的工作状态进行管理,一般用于提高交换机工作的可靠性。由于BMC独立于交换机系统运行,因此系统的故障不会影响BMC的正常运行。
NOS硬件监控程序:NOS硬件监控程序一般采用时间的轮询的方式监控硬件状态,即每隔固定的时间间隔向BMC通过Restful接口(BMC和CPU的连接接口)或IPMI接口(BMC和CPU的连接接口)请求全部传感器、风扇、电源的信息。
BMC升级,BMC的固件数据一般保存于FLASH(Flash EEPROM Memory 快擦型存储器)介质中,升级可通过BMC或CPU 网络操作系统擦除FLASH介质后写入新的固件数据实现,但无论通过BMC或CPU 网络操作系统擦写FLASH介质,为了使新升级的BMC生效必须重启BMC系统,这导致BMC功能在升级时会暂时失效。
作为一种示例,在BMC因固件数据升级而出现重启,或者BMC因故障等其他原因而失去响应时,将直接导致白盒交换机硬件监控功能不可用。这是由于 BMC的固件一般保存于FLASH介质中,升级可通过BMC或CPU NOS擦除FLASH介质后写入新的固件数据实现,但无论BMC还是CPU NOS擦写FLASH介质,为了使新升级的BMC生效必须重启BMC系统,这导致BMC功能在升级时会暂时失效。虽然可以通过暂停CPU NOS中的监控程序以避免NOS程序报错或故障,但此时白盒交换机的硬件状态完全不可知,这对于可靠性要求极高的数据中心网络场景是难以接受的,可能导致机器进入异常状态而无法处理,特别是BMC升级导致的监控功能不可用,若升级时选择暂不重启BMC,使新固件数据生效时将使得需要进行升级BMC的交换机离线,若进行批量固件数据升级时,因设备离线导致的成本是巨大的。因此,有必要为白盒交换机系统提供一种无感知的BMC升级或故障时的临时处理方案,以保证依赖BMC的白盒交换机的正常运行。
对此,本发明的核心发明点之一在于BMC接收网络操作系统发送的固件升级指令,其中,固件升级指令包括待更新的固件镜像数据,进而可以根据固件升级指令擦除BMC的固件数据,并将待更新的固件镜像数据烧录到BMC中,当网络操作系统监控硬件的运行状态时,允许BMC重启以根据待更新的固件镜像数据进行升级。在本发明实施例中,通过将待更新的固件镜像数据烧录到BMC以升级BMC,将默认的BMC监控硬件的运行状态切换为网络操作系统监控硬件的运行状态,提高了BMC升级时的可靠性,避免升级或升级失败时由于BMC暂时不可用而导致硬件监控失控的情况,提高了系统运行的安全性以及固件数据升级的可靠性。
参照图1,示出了本发明实施例中提供的一种BMC的升级方法的步骤流程图,具体可以包括如下步骤:
步骤101,BMC接收所述网络操作系统发送的固件升级指令;其中,所述固件升级指令包括待更新的固件镜像数据;
其中,在本发明实施例中,BMC主要为交换机中的BMC,对于交换机,其可以为白盒交换机,白盒交换机的一个重要特性是支持以BMC(Baseboard Management Controller 基板管理控制器)为核心的管理平面,其可以在与交换机的CPU(Central Processing Unit中央处理器)管理的交换机控制平面互不影响的情况下对交换机状态进行监控及日志记录,甚至可以在交换机的CPU出现宕机的情况下仍可对交换机状态进行监控、故障定位或者电源控制。综上,白盒交换机的BMC可在不依赖白盒交换机其他部分的情况下对交换机状态进行监控及日志记录,BMC提高了白盒交换机整体的可靠性。需要说明的是,对于交换机的类型,本领域技术人员可以根据实际情况进行选取,本发明实施例对此不作限制。
对于BMC,亦可称为BMC系统,其可以为白盒交换机中的管理器,是一种独立于交换机中其他部分(如BIOS(Basic Input Output System 基本输入输出系统)、CPU、硬盘)的管理器,其可通过IPMI等工具实现对交换机各器件的工作状态,如电源、传感器、日志等器件的工作状态进行管理,一般用于提高交换机工作的可靠性。由于BMC独立于交换机系统运行,因此系统的故障不会影响BMC的正常运行。
对于固件数据,其可以为软件代码,通常存储于FLASH(Flash EEPROM Memory 快擦型存储器)介质中;其中,对于FLASH介质,其可以通过特定的程序修改里面的数据。
对于网络操作系统,其为交换机的CPU中的一种网络操作系统,也可称之为CPU网络操作系统,其为白盒交换机的网络操作系统,其主要为用于监控交换机工作的操作系统,具有一系列的网络配置功能及工具,例如SONiC(云上开放网络软件)系统(CPU网络操作系统的一种);对于硬件,其可以为传感器、风扇或电源等。
对于固件升级指令,其可以为人为地针对BMC升级所设置的一种固件升级指令,用于升级交换机中的BMC,固件升级指令中包含固件镜像数据;对于固件镜像数据,其可以为待更新的固件镜像数据,待更新的固件镜像数据可以用于烧录进FLASH介质中以进行BMC的系统升级。
在一种示例中,可以应用于交换机的BMC,BMC包含固件数据,固件数据存储于FLASH介质,交换机的BMC与CPU连接,具体地,BMC接收网络操作系统发送的固件升级指令,其中,固件升级指令包括待更新的固件镜像数据,待更新的固件镜像数据能够用于进行BMC的系统升级。
参照图2,示出了本发明实施例中提供的一种硬件通道连接示意图,如图2所示,所有硬件的相关器件(如图2中所示的传感器1、传感器2、传感器3、风扇和电源)均可以通过低速通道连接于逻辑器件上,再由逻辑器件选择是由CPU中的CPU网络操作系统还是BMC负责管控,其中,CPU与BMC间有专门的管理通道,本发明实施例中采用Restful接口(层状态传输接口),而BMC和CPU均可擦写BMC的Flash介质对BMC进行更新或升级,但主要使用BMC进行操作,CPU可以通过Restful接口向BMC传输待更新的固件镜像数据,再使用BMC擦写Flash介质以升级BMC。
其中,对于低速通道,本发明实施例中采用的是I2C总线(双向二线制同步串行总线),也可以为LPC(linear Predictive Coding线性预测编码)等低速信号构成低速通道,本领域技术人员可以根据实际情况对低速通道进行选取,本发明实施例对此不作限制。
对于CPU与BMC间的管理通道,其可以为本发明实施例中采用的Restful接口,也可以为IPMI接口,可以理解的是,本发明实施例对此不作限制。
对于擦写通道,可以使用SPI(Serial Peripheral Interface串行外设接口)协议,本领域技术人员可以根据实际情况对擦写通道进行选取,本发明实施例对此不作限制。
具体地,目前BMC及网络操作系统监控传感器、风扇、电源等硬件通常是通过I2C、LPC等低速信号构成的低速通道实现,将逻辑器件中寄存器连接CPU的低速通道作为备份通道或备份链路。正常状态下,为防止访问冲突,与CPU连接的备份链路并不启用,备份链路切换由逻辑器件控制,并且可以通过CPU或BMC读写逻辑器件中寄存器的操作来选择监控的主体,此寄存器可以采用不同的I2C通道供BMC或CPU双方同时查询使用,若有冲突此寄存器以BMC侧配置优先,监控主体切换时即需要写此寄存器。
在本发明实施例中,BMC接收网络操作系统发送的固件升级指令,其中,固件升级指令包括待更新的固件镜像数据,待更新的固件镜像数据能够用于进行BMC的系统升级。
步骤102,根据所述固件升级指令擦除所述BMC的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC;
对于固件数据,其可以为软件代码,通常存储于BMC的FLASH介质中;其中,对于FLASH介质,其可以通过特定的程序修改里面的数据。
其中,对于擦除操作,其可以为根据固件升级指令擦除BMC的FLASH介质中存储于有的旧的固件数据,可以理解为旧的软件代码,通过擦除旧的软件代码才能将新的软件代码数据烧录到FLASH介质。
对于烧录操作,其可以为将待更新的固件镜像数据配置于FLASH介质中,从而可以根据待更新的固件镜像数据升级BMC。
如图2所示,CPU与BMC间有专门的管理通道,CPU与BMC间可以通过Restful接口或IPIM接口进行数据通信,BMC和CPU均可擦写BMC的Flash介质对BMC进行更新或升级,其中,主要使用BMC进行操作,当CPU需要擦写BMC的Flash介质时,可以通过Restful接口或IPIM接口向BMC传输待更新的固件镜像数据,再使用BMC擦写Flash介质以升级BMC。
在本发明实施例中,网络操作系统将包含待更新的固件镜像数据的固件升级指令发送至BMC,BMC接收网络操作系统发送的固件升级指令,进而BMC可以根据固件升级指令擦除BMC的FLASH介质原有的固件数据,并将待更新的固件镜像数据烧录到FLASH介质中以对BMC进行升级。
步骤103,当所述网络操作系统监控硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级。
对于运行状态,其可以为硬件的运行状态,也可以理解为交换机的运行状态,其主要为收集硬件的运行状态信息;其中,监控硬件的运行状态的对象可以为网络操作系统,也可以为BMC,在交换机的运行过程中,主要为BMC进行监控,可以理解的是,默认监控硬件的运行状态的管理控制器为BMC,这样可以大大减轻监控硬件而给网络操作系统对应的CPU带来的压力问题。
在一种示例中,如图2所示,当网络操作系统监控硬件的运行状态时,可以通过逻辑器件对传感器1、传感器2、传感器3、风扇和电源等硬件的运行状态进行监控,收集各个硬件的运行状态信息,从而可以通过逻辑器件中寄存器与CPU连接的低速通道将各个硬件的运行状态信息发送至CPU中的网络操作系统。
需要说明的是,对于需要监控的数据,其不仅可以包括硬件的运行状态,还可以包括用户的登录信息等,在本发明实施例中,主要为监控硬件的运行状态信息,可以理解的是,在实际的应用中,监控的数据并不仅有硬件的运行状态,本发明实施例对此不作限制。
需要说明的是,为了使新升级的BMC生效必须重启BMC系统,这导致BMC功能在升级时会暂时失效,虽然可以通过暂停CPU网络操作系统中的监控程序以避免网络操作系统程序报错或故障,但此时白盒交换机的硬件状态完全不可知,这对于可靠性要求极高的数据中心网络场景是难以接受的,可能导致机器进入异常状态而无法处理,特别是BMC升级导致的监控功能不可用,若升级时选择暂不重启BMC,使新固件数据生效时将使得需要进行升级BMC的交换机离线,若进行批量固件数据升级时,因设备离线导致的成本是巨大的。
在具体实现中,网络操作系统将包含待更新的固件镜像数据的固件升级指令发送至BMC,BMC接收网络操作系统发送的固件升级指令,进而BMC可以根据固件升级指令擦除BMC的FLASH介质原有的固件数据,并将待更新的固件镜像数据烧录到FLASH介质中,默认监控硬件的运行状态的管理控制器为BMC,在BMC需要重启或在BMC重启之前,BMC的监控权会交给网络操作系统,当网络操作系统监控硬件的运行状态时,允许BMC根据待更新的固件镜像数据进行升级。通过将待更新的固件镜像数据烧录到BMC的FLASH介质以升级交换机的BMC,将默认的BMC监控硬件的运行状态切换为网络操作系统监控硬件的运行状态,提高了交换机的BMC升级时的可靠性,避免升级或升级失败时由于BMC暂时不可用而导致的交换机的硬件监控失控的情况,提高了交换机运行的安全性以及固件数据升级的可靠性。
在本发明实施例中,BMC接收网络操作系统发送的固件升级指令,其中,固件升级指令包括待更新的固件镜像数据,进而可以根据固件升级指令擦除BMC的固件数据,并将待更新的固件镜像数据烧录到BMC中,当网络操作系统监控硬件的运行状态时,允许BMC重启以根据待更新的固件镜像数据进行升级。在本发明实施例中,通过将待更新的固件镜像数据烧录到BMC以升级BMC,将默认的BMC监控硬件的运行状态切换为网络操作系统监控硬件的运行状态,提高了BMC升级时的可靠性,避免升级或升级失败时由于BMC暂时不可用而导致硬件监控失控的情况,提高了系统运行的安全性以及固件数据升级的可靠性。
在一种可选实施例中,在所述允许所述BMC重启以根据所述待更新的固件镜像数据进行升级之前,所述方法还包括:
在重启所述BMC之前,禁止所述BMC监控硬件的运行状态并切换为所述网络操作系统监控所述硬件的运行状态。
其中,为了使新升级的BMC生效必须重启BMC系统,这导致BMC功能在升级时会暂时失效,虽然可以通过暂停CPU网络操作系统中的监控程序以避免网络操作系统程序报错或故障,但此时白盒交换机的硬件状态完全不可知,这对于可靠性要求极高的数据中心网络场景是难以接受的,可能导致机器进入异常状态而无法处理,特别是BMC升级导致的监控功能不可用,若升级时选择暂不重启BMC,使新固件数据生效时将使得需要进行升级BMC的交换机离线,若进行批量固件数据升级时,因设备离线导致的成本是巨大的。
在本发明实施例中,在重启BMC之前,禁止BMC监控硬件的运行状态并切换为网络操作系统监控所述硬件的运行状态。提高了BMC升级时的可靠性,避免升级或升级失败时由于BMC暂时不可用而导致硬件监控失控的情况,提高了系统运行的安全性以及固件数据升级的可靠性。
在一种可选实施例中,所述BMC存储有记录信息,所述方法还包括:
将所述BMC的记录信息发送至所述网络操作系统,以使所述网络操作系统对所述BMC的记录信息进行备份。
可选地,记录信息可以包括配置文件和日志信息;其中,对于配置文件,其可以为运维人员提供的或设置的监控时间间隔、故障处理方案等可配置的功能,并以配置文件的方式实现记录;对于日志信息,其可以为交换机的运行状态,主要为记录硬件的运行状态,其中,日志信息还可以包括用户登录等信息。
其中,能够响应于获取操作,得到包括待更新的固件镜像数据的固件升级指令,对于固件升级指令,通常为运维人员设置好的升级指令。
对于备份操作,当BMC因升级而需要重启时,需要BMC在升级前通过与CPU连接的接口将记录信息发送给CPU中网络操作系统进行备份,并由CPU中的CPU网络操作系统接替BMC进行相关日志记录工作。
在具体实现中,在BMC重启前,可以将BMC的记录信息发送至网络操作系统,对BMC的记录信息进行备份,提高了白盒交换机硬件监控功能的可靠性,防止由于BMC因故障等原因不可用时的硬件监控失效,实现硬件监控、日志功能的备份,简化运维人员的故障定位工作。
在一种可选实施例中,所述逻辑器件包含寄存器,所述寄存器用于存储所述硬件的运行状态,其中,将所述CPU与所述逻辑器件连接的低速通道作为备份链路,在所述步骤103、当所述网络操作系统监控硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级之前,所述方法还包括:
在所述BMC重启之前,禁止所述BMC监控所述硬件的运行状态并切换为所述网络操作系统监控所述硬件的运行状态;
当切换为所述网络操作系统监控所述硬件的运行状态时,通过所述备份链路获取所述逻辑器件中寄存器存储的硬件的运行状态。
可选地,由图2可知,BMC与CPU连接,网络操作系统位于CPU中,CPU和BMC分别通过低速通道与逻辑器件连接,逻辑器件与硬件连接;其中,逻辑器件用于获取所述硬件的运行状态。
其中,对于逻辑器件,其可以采用CPLD(Complex Programmable Logic Device复杂可编程逻辑器件),逻辑器件可以用于选择监控对象,监控对象可以用于监控硬件的运行状态,其中,逻辑器件中寄存器与CPU连接的低速通道为备份链路,可以通过备份链路将逻辑器件中寄存器存储的硬件的运行状态发送至CPU中的网络操作系统;其中,监控对象可以为BMC和网络操作系统。
其中,对于寄存器,其可以根据寄存器是否启动告知逻辑器件或连接的操作系统、BMC是否需要切换备份通道;对于取值,其可以为寄存器的取值,可以分为默认值和非默认值;其中,对于默认值,其可以设置为0,0可以表示寄存器的备份链路未启动,即未启用备份链路,则可以使用与BMC连接的相关接口从BMC中获取硬件的相关信息,或者通过BMC对硬件进行配置;对于非默认值,其可以设置为1,1可以表示寄存器的备份链路为启动状态,即可以启用备份链路,当启用备份链路时,则需要将BMC中的记录信息发送到CPU的网络操作系统进行备份。
在具体实现中,在BMC重启之前,禁止BMC监控硬件的运行状态并切换为网络操作系统监控硬件的运行状态,当切换为网络操作系统监控硬件的运行状态时,通过备份链路获取逻辑器件中寄存器存储的硬件的运行状态。
可选地,可以根据逻辑器件中寄存器的取值,选择监控硬件的运行状态所对应的监控对象;其中,监控对象可以为BMC和网络操作系统。
可选地,当寄存器的取值为默认值时,选择BMC作为监控对象以监控硬件的运行状态,当寄存器的取值为非默认值时,启动备份链路并选择网络操作系统作为监控对象以监控硬件的运行状态。
可选地,在BMC监控硬件的运行状态时,允许网络操作系统按照预设周期读取逻辑器件中的寄存器,以根据寄存器的取值选择监控硬件的运行状态所对应的监控对象。需要说明的是,对于预设周期,本领域技术人员可以根据实际情况进行选取,本发明实施例对此不作限制。
可选地,当寄存器的取值为非默认值时,可以检测备份链路的运行状态是否正常,当备份链路的运行状态为正常时,允许网络操作系统监控硬件的运行状态,当备份链路的运行状态为异常时,禁止网络操作系统监控硬件的运行状态并生成第一报错日志信息。
其中,对于第一报错日志信息,其可以用于表示网络系统中连接的备份链路不可用,从而产生的报错日志信息,其中,还可以将该报错日志信息发送给运维人员,可以通过运维人员手动操作恢复。
需要说明的是,网络操作系统的监控程序每次监控或配置硬件前,需要首先查询逻辑器件对应的备份链路的寄存器,若由BMC控制,则使用BMC提供的接口,例如Retful接口或IPMI接口查询硬件的运行状态或配置硬件;若此寄存器被切换为备份通道,则监控程序也需要切换接口,转为使用本地的I2C或LPC等通道获取硬件信息或者配置,即监控主体切换为网络操作系统,此时,可能涉及到逻辑器件对应驱动的重新加载或节点新创建。
在一种示例中,假设网络操作系统采用的是CPU SONiC系统(CPU网络操作系统的一种),逻辑器件采用的是CPLD(Complex Programmable Logic Device复杂可编程逻辑器件),网络操作系统中包含的物理链路接口为I2C总线接口,当CPU SONiC系统的硬件监控程序查询到逻辑器件CPLD的寄存器的取值为1时,则表示备份链路启动,首先需要检查备份链路是否可用,备份链路不可用则生成报错误日志信息并停止CPU SONiC系统监控,若备份链路可用则将使用网络操作系统的自身物理链路接口,即I2C总线接口,而非通过BMC的相关接口来获取硬件监控信息,从而可以保证在BMC升级或BMC长时间无响应时对硬件的监控不中断。
可选地,在网络操作系统监控硬件的运行状态时,可以记录硬件的运行状态,其中,将硬件的运行状态写入网络操作系统的第一日志信息,并根据BMC的BMC日志格式将硬件的运行状态写入BMC的第二日志信息,其中,在网络操作系统监控硬件的运行状态时,可能会出现备份链路异常的情况,则会产生第一报错日志信息,同理,可以将第一报错日志信息写入网络操作系统的第一日志信息,并根据BMC的BMC日志格式将第一报错日志信息写入BMC的第二日志信息。
在一种示例中,在网络操作系统监控硬件的运行状态时,假设BMC存储日志信息的位置为/tmp/bmc,对于硬件异常,除了向网络系统自身进行日志记录外,还需要向BMC的/tmp/bmc下的BMC备份日志中按BMC日志格式写入监控的相关日志信息。
在本发明实施例中,在BMC重启之前,禁止BMC监控硬件的运行状态并切换为网络操作系统监控硬件的运行状态,当切换为网络操作系统监控硬件的运行状态时,通过备份链路获取逻辑器件中寄存器存储的硬件的运行状态,其中,可以根据逻辑器件中寄存器的取值,选择监控硬件的运行状态所对应的监控对象;其中,监控对象可以为BMC和网络操作系统,具体地,当寄存器的取值为默认值时,选择BMC作为监控对象以监控硬件的运行状态,当寄存器的取值为非默认值时,启动备份链路并选择网络操作系统作为监控对象以监控硬件的运行状态,其中,在BMC监控硬件的运行状态时,允许网络操作系统按照预设周期读取逻辑器件中的寄存器,以根据寄存器的取值选择监控硬件的运行状态所对应的监控对象;当寄存器的取值为非默认值时,可以检测备份链路的运行状态是否正常,当备份链路的运行状态为正常时,允许网络操作系统监控硬件的运行状态,当备份链路的运行状态为异常时,禁止网络操作系统监控硬件的运行状态并生成第一报错日志信息,可以将第一报错日志信息写入网络操作系统的第一日志信息,并根据BMC的BMC日志格式将第一报错日志信息写入BMC的第二日志信息,同理,在网络操作系统监控硬件的运行状态时,可以记录硬件的运行状态,其中,将硬件的运行状态写入网络操作系统的第一日志信息,并根据BMC的BMC日志格式将硬件的运行状态写入BMC的第二日志信息,提高了交换机BMC的固件数据升级时的可靠性,避免升级或升级失败时由于BMC暂时不可用而导致的交换机硬件监控失控情况,提高交换机运行的安全性以及固件升级的可靠性,进一步提高白盒交换机硬件监控功能的可靠性,防止由于BMC因故障等原因不可用时的硬件监控失效,实现硬件监控、日志功能的备份,简化运维人员的故障定位工作。
在一种可选实施例中,在所述步骤103、当所述网络操作系统监控所述硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级之后,所述方法还包括:
当寄存器的取值为非默认值时,将所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC;其中,所述第一日志信息至少包括硬件的运行状态和第一报错日志信息。
其中,对于寄存器,其可以根据寄存器是否启动告知逻辑器件或连接的CPU、BMC是否需要切换备份链路;对于取值,其可以为寄存器的取值,可以分为默认值和非默认值;其中,对于默认值,其可以设置为0,0可以表示寄存器的备份链路未启动,即未启用备份链路,则可以使用与BMC连接的相关接口从BMC中获取硬件的相关信息,或者通过BMC对硬件进行配置;对于非默认值,其可以设置为1,1可以表示寄存器的备份链路为启动状态,即可以启用备份链路,当启用备份链路时,则需要将BMC中的记录信息发送到网络操作系统进行备份;对于回传操作,当BMC升级完成后,需要将监控权由网络操作系统切换回BMC,减轻CPU监控硬件而给CPU带来的压力问题,并且,将网络操作系统备份的BMC的记录信息以及网络操作系统监控硬件的运行状态时的第一日志信息回传于BMC,从而实现无感升级和BMC的短时间备份。
在具体实现中,如图2所示,若需要进行BMC升级,首先使用Restful接口将要更新的BMC固件镜像上传到BMC某一固定位置,例如/tmp/update目录下,再通过Restful接口向BMC下发升级BMC固件的指令,在BMC收到固件镜像数据及升级指令后,先擦写FLASH介质,将固件镜像数据烧录到FLASH介质中,为了保证BMC生效,必须重启BMC系统,因此在重启前需要将BMC的配置文件、日志信息通过Restful接口主动传输到CPU 网络操作系统指定目录,例如/tmp/bmc目录下,之后启动逻辑器件CPLD的备份链路,其中,当需要启动备份链路时,需要将寄存器的取值设置为1,从而启动备份链路,随后再次确保文件传输到网络操作系统,并在寄存器设置为1后执行重启BMC的操作;需要说明的是,当备份链路不启动时,需要将寄存器的取值设置为0,即默认状态下寄存器的取值为0。
可选地,当网络操作系统备份的BMC的记录信息以及网络操作系统的第一日志信息回传于BMC时,允许BMC监控硬件的运行状态并将寄存器的取值恢复为默认值,即,将寄存器的取值恢复为0,则表示未启动备份链路;当网络操作系统检测到寄存器的取值为默认值时,禁止使用网络操作系统监控硬件的运行状态并切换为BMC监控硬件的运行状态,即恢复BMC的监控权,另外,在切换为BMC监控硬件的运行状态,若BMC在预设时间内未对硬件的运行状态进行监控,则网络操作系统控制BMC进行重启,并记录BMC对应的第二报错日志信息,进而允许网络操作系统继续监控硬件的运行状态并将寄存器的取值切换为非默认值。
其中,对于预设时间,其可以根据实际情况进行调整,本发明实施例对此不作限制;对于重启操作,其为BMC升级时需要重启才可以使新的固件数据生效以完成BMC升级或BMC故障时需要进行重启的重启操作;对于第二报错日志信息,其为记录BMC的故障信息。
在一种示例中,如图2所示,在BMC重启后,首先可以检查逻辑器件CPLD对应的备份链路以启动寄存器,若寄存器的取值为1,则通过Restful接口或IPIM接口将CPU SONiC系统(网络操作系统)中备份的配置文件和日志信息传回BMC,并对BMC中原有的配置文件和日志信息进行替换,并应用配置,再向寄存器写0,即停止启动备份链路,恢复BMC的监控服务,其次,当CPU中的CPU SONiC系统查询到逻辑器件CPLD对应的寄存器写0后,将停止使用自身物理链路接口,转回使用Retful接口的默认模式。若长时间(如5分钟以上)BMC仍无响应,将尝试使用逻辑器件再次重启BMC,并记录BMC升级失败的错误日志信息,同时CPU SONiC系统保持使用自身物理链路获取硬件的运行状态的等信息,直到运维人员手动操作停止或BMC恢复为止。
值得一提的是,在日常的BMC备份功能工作中,若出现BMC连续长时间(5分钟)无响应的情况,且BMC 的IP(Internet Protocol 网络之间互连的协议)地址无法使用Ping(Packet Internet Groper 因特网包探索器)工具响应时,则CPU自动将逻辑器件CPLD的寄存器写1,并获取监控权,防止机器长时间无监控,并尝试使用逻辑器件CPLD再次重启BMC,同时向运维人员发送报错日志信息并记录BMC无响应日志,保持使用自身物理链路获取硬件的运行状态,直到运维人员手动操作停止或等待BMC恢复为止。
在本发明实施例中,当寄存器的取值为非默认值时,将网络操作系统备份的BMC的记录信息以及网络操作系统的第一日志信息回传于BMC;其中,第一日志信息至少包括硬件的运行状态和第一报错日志信息,当网络操作系统备份的BMC的记录信息以及网络操作系统的第一日志信息回传于BMC时,允许BMC监控硬件的运行状态并将寄存器的取值恢复为默认值,即,将寄存器的取值恢复为0,则表示未启动备份链路;当网络操作系统检测到寄存器的取值为默认值时,禁止使用网络操作系统监控硬件的运行状态并切换为BMC监控硬件的运行状态,即恢复BMC的监控权,另外,在切换为BMC监控硬件的运行状态,若BMC在预设时间内未对硬件的运行状态进行监控,则网络操作系统控制BMC进行重启,并记录BMC对应的第二报错日志信息,进而允许网络操作系统继续监控硬件的运行状态并将寄存器的取值切换为非默认值。提高白盒交换机BMC的固件数据升级时的便利性,简化运维所需步骤和减少所需时间,提高了交换机BMC的固件数据升级时的可靠性,避免升级或升级失败时由于BMC暂时不可用而导致的交换机硬件监控失控情况,提高交换机运行的安全性以及固件升级的可靠性,进一步提高交换机硬件监控功能的可靠性,防止由于BMC因故障等原因不可用时的硬件监控失效,实现硬件监控、日志功能的备份,简化运维人员的故障定位工作。
在本发明实施例中,BMC接收网络操作系统发送的固件升级指令,其中,固件升级指令包括待更新的固件镜像数据,进而可以根据固件升级指令擦除BMC的固件数据,并将待更新的固件镜像数据烧录到BMC中,当网络操作系统监控硬件的运行状态时,允许BMC重启以根据待更新的固件镜像数据进行升级。在本发明实施例中,通过将待更新的固件镜像数据烧录到BMC以升级BMC,将默认的BMC监控硬件的运行状态切换为网络操作系统监控硬件的运行状态,提高了BMC升级时的可靠性,避免升级或升级失败时由于BMC暂时不可用而导致硬件监控失控的情况,提高了系统运行的安全性以及固件数据升级的可靠性。
为了使本领域技术人员更好地理解本发明实施例的技术方案,下面通过一个例子进行示例性说明:
参照图3,示出了本发明实施例中提供的一种CPU网络操作系统侧升级程序流程示意图,具体流程如下;
S11、向BMC传输升级镜像并下发升级指令;
通常情况下,固件升级指令包括待更新的固件镜像数据。
S12、判断逻辑器件中的备份链路寄存器是否启动;
即,判断逻辑器件中寄存器的取值,当寄存器的取值为默认值0时,则表示备份链路未启动,同时继续使用原BMC的相关监控接口对硬件的运行状态进行监控;当寄存器的取值为非默认值1时,则表示备份链路启动,并且由CPU网络操作系统对硬件的运行状态进行监控。
S13、检查CPU网络操作系统的自身物理链路是否可用;
当CPU网络操作系统的自身物理链路不可用时,则产生报错日志信息并退出监控程序;当CPU网络操作系统的自身物理链路可用时,切换硬件监控的接口为CPU网络操作系统的自身物理链路。
S14、向备份的BMC日志文件中写入日志;
即,CPU网络操作系统将新收集到的日志信息写入BMC在升级前发送至CPU网络操作系统的日志信息中。
S15、查看BMC是否升级完成;
若BMC升级完成,则继续使用原BMC的相关监控接口对硬件的运行状态进行监控;若BMC升级未完成,则继续使用CPU网络操作系统对硬件的运行状态进行监控。
参照图4,示出了本发明实施例中提供的一种BMC侧升级程序流程示意图,具体流程如下;
S11、查看是否接收到CPU网络操作系统发送的升级镜像及升级指令;
S12、擦写FLASH,烧录新镜像;
即,当BMC接收到CPU网络操作系统发送的升级镜像及升级指令时,根据固件升级指令擦除FLASH介质原有的固件数据,并将待更新的固件镜像数据烧录到FLASH介质中。
S13、向CPU网络操作系统(CPU NOS)上传配置文件、日志信息;
即,BMC在重启BMC系统升级前,将BMC的配置文件和日志信息发送至CPU网络操作系统。
S14、写逻辑器件寄存器,启用备份链路;
即,将连接BMC的逻辑器件中的寄存器进行写入,具体地,向寄存器写1,启动寄存器以启动备份链路,对BMC的配置文件和日志信息进行备份。
S15、查看配置文件和日志信息是否上传成功,寄存器是否成功写入;
当BMC的配置文件和日志信息未能成功上传至CPU网络操作系统,寄存器未能成功写入1时,则重新执行步骤S13、向CPU网络操作系统(CPU NOS)上传配置文件、日志信息;当BMC的配置文件和日志信息成功上传至CPU网络操作系统,寄存器成功写入1时,则重启BMC系统。
S16、判断逻辑器件中的寄存器是否为默认;
当逻辑器件中的寄存器为默认值0时,直接启动BMC的监控服务;当逻辑器件中的寄存器为非默认值1时,向寄存器写入默认值0,并下载回发送至CPU网络操作系统的配置文件和日志信息,从而启动BMC的监控服务。
在本发明实施例中,BMC接收网络操作系统发送的固件升级指令,其中,固件升级指令包括待更新的固件镜像数据,进而可以根据固件升级指令擦除BMC的固件数据,并将待更新的固件镜像数据烧录到BMC中,当网络操作系统监控硬件的运行状态时,允许BMC重启以根据待更新的固件镜像数据进行升级。在本发明实施例中,通过将待更新的固件镜像数据烧录到FLASH介质以升级交换机的BMC,将默认的BMC监控硬件的运行状态切换为CPU网络操作系统监控硬件的运行状态,提高了交换机的BMC升级时的可靠性,避免升级或升级失败时由于BMC暂时不可用而导致的交换机的硬件监控失控的情况,提高了交换机运行的安全性以及固件数据升级的可靠性;同时,实现了BMC的固件数据的无感升级,简化了固件数据升级步骤及提高升级过程的可靠性,实现了BMC失效时的暂时BMC备份功能,防止因BMC失效导致交换机立即不可用,给运维人员定位或修复故障提供了充足的时间。
参照图5,示出了本发明实施例中提供的一种BMC故障的处理方法的步骤流程图,具体可以包括如下步骤:
步骤501,当BMC发生故障无法监控硬件的运行状态时,切换为网络操作系统监控所述硬件的运行状态;
其中,对于故障,其可以为BMC连续长时间无响应的情况,且BMC 的IP(InternetProtocol 网络之间互连的协议)地址无法使用Ping(Packet Internet Groper 因特网包探索器)工具响应。
对于硬件,其可以为传感器、风扇或电源等;其中,硬件的运行状态可以通过逻辑器件进行获取;对于默认的监控硬件的运行状态主体,其为BMC。
在具体实现中,当BMC发生故障无法监控硬件的运行状态时,切换为网络操作系统监控硬件的运行状态,避免BMC发生故障而导致硬件监控失控的情况,提高了系统运行的安全性和可靠性。
步骤502,在所述网络操作系统监控所述硬件的运行状态时,重启所述BMC以恢复所述BMC监控所述硬件的运行状态。
其中,当BMC连续长时间无响应的情况,且BMC 的IP地址无法使用Ping工具响应时,可以尝试采用重启以恢复BMC的监控功能。
在具体实现中,在网络操作系统监控硬件的运行状态时,重启BMC以恢复BMC监控硬件的运行状态,能够实现对硬件的运行状态的不间断监控,保证了系统运行的可靠性。
在一种可选实施例中,所述方法还包括:
在重启所述BMC时,记录所述BMC的故障日志;
将所述BMC的故障日志发送至客户端;
响应于客户端的恢复操作,恢复所述BMC监控所述硬件的运行状态。
其中,对于客户端,其可以代指日常的运维人员。
在具体实现中,在重启BMC的同时记录BMC的故障日志,并向客户端(运维人员)发送故障日志信息并记录BMC无响应日志,保持使用自身物理链路获取硬件的运行状态,直到运维人员手动操作停止或等待BMC恢复。
在一种可选实施例中,所述BMC存储有记录信息,所述方法还包括:
当切换为所述网络操作系统监控所述硬件的运行状态时,将所述BMC的记录信息发送至所述网络操作系统,以使所述网络操作系统对所述BMC的记录信息进行备份;其中,所述记录信息至少包含配置文件和日志信息。
其中,记录信息可以包括配置文件和日志信息;其中,对于配置文件,其可以为运维人员提供的或设置的监控时间间隔、故障处理方案等可配置的功能,并以配置文件的方式实现记录;对于日志信息,其可以为交换机的运行状态,主要为记录硬件的运行状态,其中,日志信息还可以包括用户登录等信息。
在具体实现中,当切换为网络操作系统监控硬件的运行状态时,将BMC的记录信息发送至网络操作系统,以使网络操作系统对BMC的记录信息进行备份。
在一种可选实施例中,在所述重启所述BMC以恢复所述BMC监控所述硬件的运行状态之后,所述方法还包括:
当恢复所述BMC监控所述硬件的运行状态时,将所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC;其中,所述第一日志信息至少包括硬件的运行状态。
其中,对于第一日志信息,其可以为在网络系统监控硬件时的硬件的运行状态,以及各种故障时的故障日志信息等。
在具体实现中,在重启BMC以恢复BMC监控硬件的运行状态之后,当恢复BMC监控硬件的运行状态时,将网络操作系统备份的BMC的记录信息以及网络操作系统的第一日志信息回传于BMC。
在本发明实施例中,当BMC发生故障无法监控硬件的运行状态时,切换为网络操作系统监控硬件的运行状态,避免BMC发生故障而导致硬件监控失控的情况,提高了系统运行的安全性和可靠性,在网络操作系统监控硬件的运行状态时,通过网络操作系统重启BMC以恢复BMC监控硬件的运行状态,能够实现对硬件的运行状态的不间断监控,保证了系统运行的可靠性。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图6,示出了本发明实施例中提供的一种BMC的升级装置的结构框图,具体可以包括如下模块:
固件升级指令接收模块601,用于BMC接收所述网络操作系统发送的固件升级指令;其中,所述固件升级指令包括待更新的固件镜像数据;
固件镜像数据擦写模块602,用于根据所述固件升级指令擦除所述BMC的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC;
BMC升级模块603,用于当所述网络操作系统监控硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级。
在一种可选实施例中,所述固件数据存储于所述BMC的FLASH介质,所述固件镜像数据擦写模块602具体用于:
根据所述固件升级指令擦除所述BMC的FLASH介质中的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC的FLASH介质。
在一种可选实施例中,所述装置还包括:
第一监控对象切换模块,用于在重启所述BMC之前,禁止所述BMC监控硬件的运行状态并切换为所述网络操作系统监控所述硬件的运行状态。
在一种可选实施例中,所述BMC存储有记录信息,所述装置还包括:
第一记录信息备份模块,用于将所述BMC的记录信息发送至所述网络操作系统,以使所述网络操作系统对所述BMC的记录信息进行备份。
在一种可选实施例中,所述逻辑器件包含寄存器,所述寄存器用于存储所述硬件的运行状态,其中,将所述CPU与所述逻辑器件连接的低速通道作为备份链路,所述装置还包括:
第二监控对象切换模块,用于在所述BMC重启之前,禁止所述BMC监控所述硬件的运行状态并切换为所述网络操作系统监控所述硬件的运行状态;
寄存器数据获取模块,用于当切换为所述网络操作系统监控所述硬件的运行状态时,通过所述备份链路获取所述逻辑器件中寄存器存储的硬件的运行状态。
在一种可选实施例中,所述装置还包括:
监控对象选择模块,用于根据所述逻辑器件中寄存器的取值,选择监控所述硬件的运行状态所对应的监控对象;其中,所述监控对象为所述BMC和所述网络操作系统。
在一种可选实施例中,所述装置还包括:
第一监控对象确认模块,用于当所述寄存器的取值为默认值时,选择所述BMC作为监控对象以监控所述硬件的运行状态;
第二监控对象确认模块,用于当所述寄存器的取值为非默认值时,启动所述备份链路并选择所述网络操作系统作为监控对象以监控所述硬件的运行状态。
在一种可选实施例中,所述装置还包括:
寄存器取值读取模块,用于在所述BMC监控所述硬件的运行状态时,允许所述网络操作系统按照预设周期读取所述逻辑器件中的寄存器,以根据所述寄存器的取值选择监控所述硬件的运行状态所对应的监控对象。
在一种可选实施例中,所述装置还包括:
检测模块,用于当所述寄存器的取值为非默认值时,检测所述备份链路的运行状态是否正常;
备份链路正常模块,用于当所述备份链路的运行状态为正常时,允许所述网络操作系统监控所述硬件的运行状态;
备份链路异常模块,用于当所述备份链路的运行状态为异常时,生成第一报错日志信息并禁止所述网络操作系统监控所述硬件的运行状态。
在一种可选实施例中,所述装置还包括:
日志信息写入模块,用于将所述第一报错日志信息写入所述网络操作系统的第一日志信息,并根据所述BMC的BMC日志格式将所述第一报错日志信息写入所述BMC的第二日志信息。
在一种可选实施例中,所述装置还包括:
第一信息回传模块,用于当寄存器的取值为非默认值时,将所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC;其中,所述第一日志信息至少包括硬件的运行状态和第一报错日志信息。
在一种可选实施例中,所述装置还包括:
取值恢复模块,用于当所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC时,允许所述BMC监控所述硬件的运行状态并将所述寄存器的取值恢复为默认值。
在一种可选实施例中,所述装置还包括:
第三监控对象切换模块,用于当所述网络操作系统检测到所述寄存器的取值为默认值时,禁止所述网络操作系统监控所述硬件的运行状态并切换为所述BMC监控所述硬件的运行状态;
BMC报错模块,用于在切换为所述BMC监控所述硬件的运行状态时,若所述BMC在预设时间内未对所述硬件的运行状态进行监控,则所述网络操作系统控制所述BMC进行重启并记录所述BMC对应的第二报错日志信息。
在一种可选实施例中,所述装置还包括:
取值切换模块,用于当所述BMC在预设时间内未对所述硬件的运行状态进行监控时,允许所述网络操作系统监控所述硬件的运行状态并将所述寄存器的取值切换为非默认值。
参照图7,示出了本发明实施例中提供的一种BMC故障的处理装置的结构框图,具体可以包括如下模块:
监控切换模块701,用于当BMC发生故障无法监控硬件的运行状态时,切换为网络操作系统监控所述硬件的运行状态;
第一BMC监控恢复模块702,用于在所述网络操作系统监控所述硬件的运行状态时,重启所述BMC以恢复所述BMC监控所述硬件的运行状态。
在一种可选实施例中,所述装置还包括:
故障日志记录模块,用于在重启所述BMC时,记录所述BMC的故障日志;
故障日志发送模块,用于将所述BMC的故障日志发送至客户端;
第二BMC监控恢复模块,用于响应于客户端的恢复操作,恢复所述BMC监控所述硬件的运行状态。
在一种可选实施例中,所述BMC存储有记录信息,所述装置还包括:
第二记录信息备份模块,用于当切换为所述网络操作系统监控所述硬件的运行状态时,将所述BMC的记录信息发送至所述网络操作系统,以使所述网络操作系统对所述BMC的记录信息进行备份;其中,所述记录信息至少包含配置文件和日志信息。
在一种可选实施例中,所述装置还包括:
第二信息回传模块,用于当恢复所述BMC监控所述硬件的运行状态时,将所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC;其中,所述第一日志信息至少包括硬件的运行状态。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
本领域普通技术人员可以意识到,结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (22)
1.一种BMC的升级方法,其特征在于,包括:
BMC接收网络操作系统发送的固件升级指令;其中,所述固件升级指令包括待更新的固件镜像数据;
根据所述固件升级指令擦除所述BMC的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC;
当所述网络操作系统监控硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级。
2.根据权利要求1所述的方法,其特征在于,所述固件数据存储于所述BMC的FLASH介质,所述根据所述固件升级指令擦除所述BMC的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC,包括:
根据所述固件升级指令擦除所述BMC的FLASH介质中的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC的FLASH介质。
3.根据权利要求1所述的方法,其特征在于,在所述允许所述BMC重启以根据所述待更新的固件镜像数据进行升级之前,所述方法还包括:
在重启所述BMC之前,禁止所述BMC监控硬件的运行状态并切换为所述网络操作系统监控所述硬件的运行状态。
4.根据权利要求1所述的方法,其特征在于,所述BMC存储有记录信息,所述方法还包括:
将所述BMC的记录信息发送至所述网络操作系统,以使所述网络操作系统对所述BMC的记录信息进行备份。
5.根据权利要求4所述的方法,其特征在于,所述记录信息至少包含配置文件和日志信息。
6.根据权利要求1所述的方法,其特征在于,所述BMC与CPU连接,所述网络操作系统位于所述CPU中,所述CPU和所述BMC分别通过低速通道与逻辑器件连接,所述逻辑器件与硬件连接;其中,所述逻辑器件用于获取所述硬件的运行状态。
7.根据权利要求6所述的方法,其特征在于,所述逻辑器件包含寄存器,所述寄存器用于存储所述硬件的运行状态,其中,将所述CPU与所述逻辑器件连接的低速通道作为备份链路,在所述当所述网络操作系统监控硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级之前,所述方法还包括:
在所述BMC重启之前,禁止所述BMC监控所述硬件的运行状态并切换为所述网络操作系统监控所述硬件的运行状态;
当切换为所述网络操作系统监控所述硬件的运行状态时,通过所述备份链路获取所述逻辑器件中寄存器存储的硬件的运行状态。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
根据所述逻辑器件中寄存器的取值,选择监控所述硬件的运行状态所对应的监控对象;其中,所述监控对象为所述BMC和所述网络操作系统。
9.根据权利要求8所述的方法,其特征在于,所述根据所述逻辑器件中寄存器的取值,选择监控所述硬件的运行状态所对应的监控对象,包括
当所述寄存器的取值为默认值时,选择所述BMC作为监控对象以监控所述硬件的运行状态;
当所述寄存器的取值为非默认值时,启动所述备份链路并选择所述网络操作系统作为监控对象以监控所述硬件的运行状态。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
在所述BMC监控所述硬件的运行状态时,允许所述网络操作系统按照预设周期读取所述逻辑器件中的寄存器,以根据所述寄存器的取值选择监控所述硬件的运行状态所对应的监控对象。
11.根据权利要求7所述的方法,其特征在于,所述方法还包括:
当所述寄存器的取值为非默认值时,检测所述备份链路的运行状态是否正常;
当所述备份链路的运行状态为正常时,允许所述网络操作系统监控所述硬件的运行状态;
当所述备份链路的运行状态为异常时,生成第一报错日志信息并禁止所述网络操作系统监控所述硬件的运行状态。
12.根据权利要求10所述的方法,其特征在于,在所述当所述备份链路的运行状态为异常时,生成第一报错日志信息并禁止所述网络操作系统监控所述硬件的运行状态之后,所述方法还包括:
将所述第一报错日志信息写入所述网络操作系统的第一日志信息,并根据所述BMC的BMC日志格式将所述第一报错日志信息写入所述BMC的第二日志信息。
13.根据权利要求4-12任一项所述的方法,其特征在于,在所述当所述网络操作系统监控硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级之后,所述方法还包括:
当寄存器的取值为非默认值时,将所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC;其中,所述第一日志信息至少包括硬件的运行状态和第一报错日志信息。
14.根据权利要求13所述的方法,其特征在于,所述方法还包括:
当所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC时,允许所述BMC监控所述硬件的运行状态并将所述寄存器的取值恢复为默认值。
15.根据权利要求14所述的方法,其特征在于,所述方法还包括:
当所述网络操作系统检测到所述寄存器的取值为默认值时,禁止所述网络操作系统监控所述硬件的运行状态并切换为所述BMC监控所述硬件的运行状态;
在切换为所述BMC监控所述硬件的运行状态时,若所述BMC在预设时间内未对所述硬件的运行状态进行监控,则所述网络操作系统控制所述BMC进行重启并记录所述BMC对应的第二报错日志信息。
16.根据权利要求15所述的方法,其特征在于,所述方法还包括:
当所述BMC在预设时间内未对所述硬件的运行状态进行监控时,允许所述网络操作系统监控所述硬件的运行状态并将所述寄存器的取值切换为非默认值。
17.一种BMC故障的处理方法,其特征在于,包括:
当BMC发生故障无法监控硬件的运行状态时,切换为网络操作系统监控所述硬件的运行状态;
在所述网络操作系统监控所述硬件的运行状态时,重启所述BMC以恢复所述BMC监控所述硬件的运行状态。
18.根据权利要求17所述的方法,其特征在于,所述方法还包括:
在重启所述BMC时,记录所述BMC的故障日志;
将所述BMC的故障日志发送至客户端;
响应于客户端的恢复操作,恢复所述BMC监控所述硬件的运行状态。
19.根据权利要求17所述的方法,其特征在于,所述BMC存储有记录信息,所述方法还包括:
当切换为所述网络操作系统监控所述硬件的运行状态时,将所述BMC的记录信息发送至所述网络操作系统,以使所述网络操作系统对所述BMC的记录信息进行备份;其中,所述记录信息至少包含配置文件和日志信息。
20.根据权利要求19所述的方法,其特征在于,在所述重启所述BMC以恢复所述BMC监控所述硬件的运行状态之后,所述方法还包括:
当恢复所述BMC监控所述硬件的运行状态时,将所述网络操作系统备份的所述BMC的记录信息以及所述网络操作系统的第一日志信息回传于所述BMC;其中,所述第一日志信息至少包括硬件的运行状态。
21.一种BMC的升级装置,其特征在于,包括:
固件升级指令接收模块,用于BMC接收网络操作系统发送的固件升级指令;其中,所述固件升级指令包括待更新的固件镜像数据;
固件镜像数据擦写模块,用于根据所述固件升级指令擦除所述BMC的固件数据,并将所述待更新的固件镜像数据烧录到所述BMC;
BMC升级模块,用于当所述网络操作系统监控硬件的运行状态时,允许所述BMC重启以根据所述待更新的固件镜像数据进行升级。
22.一种BMC故障的处理装置,其特征在于,包括:
监控切换模块,用于当BMC发生故障无法监控硬件的运行状态时,切换为网络操作系统监控所述硬件的运行状态;
第一BMC监控恢复模块,用于在所述网络操作系统监控所述硬件的运行状态时,重启所述BMC以恢复所述BMC监控所述硬件的运行状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310100874.3A CN116028094A (zh) | 2023-02-10 | 2023-02-10 | 一种bmc的升级方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310100874.3A CN116028094A (zh) | 2023-02-10 | 2023-02-10 | 一种bmc的升级方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116028094A true CN116028094A (zh) | 2023-04-28 |
Family
ID=86075877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310100874.3A Pending CN116028094A (zh) | 2023-02-10 | 2023-02-10 | 一种bmc的升级方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116028094A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116521209A (zh) * | 2023-07-04 | 2023-08-01 | 苏州浪潮智能科技有限公司 | 操作系统的升级方法及装置、存储介质及电子设备 |
CN116955093A (zh) * | 2023-09-21 | 2023-10-27 | 紫光恒越技术有限公司 | 一种cpu状态监控方法、装置、系统、设备及存储介质 |
CN117499347A (zh) * | 2023-12-29 | 2024-02-02 | 苏州元脑智能科技有限公司 | 一种基板控制器接口处理方法及其应用设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104615506A (zh) * | 2015-02-13 | 2015-05-13 | 浪潮电子信息产业股份有限公司 | 一种基于逻辑控制的bios和bmc备份方法 |
CN110990045A (zh) * | 2019-12-20 | 2020-04-10 | 苏州浪潮智能科技有限公司 | 一种双bmc flash升级方法和设备 |
CN114510134A (zh) * | 2021-12-30 | 2022-05-17 | 锐捷网络股份有限公司 | 一种调节单板风扇方法、装置及存储介质 |
CN115129345A (zh) * | 2022-07-01 | 2022-09-30 | 苏州浪潮智能科技有限公司 | 一种固件升级方法、装置、设备及存储介质 |
-
2023
- 2023-02-10 CN CN202310100874.3A patent/CN116028094A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104615506A (zh) * | 2015-02-13 | 2015-05-13 | 浪潮电子信息产业股份有限公司 | 一种基于逻辑控制的bios和bmc备份方法 |
CN110990045A (zh) * | 2019-12-20 | 2020-04-10 | 苏州浪潮智能科技有限公司 | 一种双bmc flash升级方法和设备 |
CN114510134A (zh) * | 2021-12-30 | 2022-05-17 | 锐捷网络股份有限公司 | 一种调节单板风扇方法、装置及存储介质 |
CN115129345A (zh) * | 2022-07-01 | 2022-09-30 | 苏州浪潮智能科技有限公司 | 一种固件升级方法、装置、设备及存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116521209A (zh) * | 2023-07-04 | 2023-08-01 | 苏州浪潮智能科技有限公司 | 操作系统的升级方法及装置、存储介质及电子设备 |
CN116521209B (zh) * | 2023-07-04 | 2023-09-15 | 苏州浪潮智能科技有限公司 | 操作系统的升级方法及装置、存储介质及电子设备 |
CN116955093A (zh) * | 2023-09-21 | 2023-10-27 | 紫光恒越技术有限公司 | 一种cpu状态监控方法、装置、系统、设备及存储介质 |
CN116955093B (zh) * | 2023-09-21 | 2024-01-30 | 紫光恒越技术有限公司 | 一种cpu状态监控方法、装置、系统、设备及存储介质 |
CN117499347A (zh) * | 2023-12-29 | 2024-02-02 | 苏州元脑智能科技有限公司 | 一种基板控制器接口处理方法及其应用设备 |
CN117499347B (zh) * | 2023-12-29 | 2024-04-12 | 苏州元脑智能科技有限公司 | 一种基板控制器接口处理方法及其应用设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116028094A (zh) | 一种bmc的升级方法和装置 | |
JP4940967B2 (ja) | ストレージシステム、ストレージ装置、ファームウェアの活性交換方法、ファームウェアの活性交換プログラム | |
US6904457B2 (en) | Automatic firmware update of processor nodes | |
JPH08272643A (ja) | クライアント/サーバシステム | |
US8117434B2 (en) | Component configuration mechanism for rebooting | |
CN113064757A (zh) | 一种服务器固件自恢复系统及服务器 | |
US7421596B2 (en) | Disk array system | |
JP2002500787A (ja) | ネットワーク・システムにおけるデータボリュームの分散ミラーリング | |
US20090106584A1 (en) | Storage apparatus and method for controlling the same | |
JP2004088570A (ja) | ネットワーク計算機システムおよび管理装置 | |
US10237131B2 (en) | Communication adapter and program update method for communication adapter | |
EP1185932B1 (en) | Method and apparatus for automatically reintegrating a module into a computer system | |
CN111949449A (zh) | 固件恢复方法、装置、系统、计算机设备和存储介质 | |
JP5868563B1 (ja) | 分散型制御システム用制御機器及びユニット | |
US9158666B2 (en) | Computer system and computer system information storage method | |
JP2007293802A (ja) | ディスクアレイ装置、ディスクアレイ装置の制御方法及びディスクアレイ装置の制御プログラム。 | |
Cisco | Operational Traps | |
Cisco | Operational Traps | |
Cisco | Operational Traps | |
Cisco | Operational Traps | |
Cisco | Operational Traps | |
Cisco | Operational Traps | |
Cisco | Operational Traps | |
Cisco | Operational Traps | |
Cisco | Operational Traps |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230428 |
|
RJ01 | Rejection of invention patent application after publication |