CN114296995A - 一种服务器自主修复bmc的方法、系统、设备及存储介质 - Google Patents
一种服务器自主修复bmc的方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN114296995A CN114296995A CN202111440616.7A CN202111440616A CN114296995A CN 114296995 A CN114296995 A CN 114296995A CN 202111440616 A CN202111440616 A CN 202111440616A CN 114296995 A CN114296995 A CN 114296995A
- Authority
- CN
- China
- Prior art keywords
- bmc
- server
- operating system
- management chip
- heartbeat signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012544 monitoring process Methods 0.000 claims abstract description 30
- 230000004044 response Effects 0.000 claims abstract description 28
- 230000008439 repair process Effects 0.000 claims abstract description 13
- 238000004891 communication Methods 0.000 claims description 23
- 230000008859 change Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 5
- 230000002567 autonomic effect Effects 0.000 claims 1
- 230000008901 benefit Effects 0.000 abstract description 5
- 238000001514 detection method Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Debugging And Monitoring (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明公开了一种服务器自主修复BMC的方法,包括:监控BMC的心跳信号,响应于预定时间内未监控到BMC的心跳信号,向服务器的操作系统发送刷新BMC的指令;响应于接收到刷新BMC的指令,服务器的操作系统通过刷新工具刷新BMC。通过本发明提供一种服务器自主修复BMC的方法,在BMC故障之后实现对BMC的自主修复,免去烧录器的现场烧录,在BMC故障之后自动识别利用服务器上现有的设备为跳板并主动修复BMC的故障,在不增加硬件成本的情况下极大地提升了服务器的稳定性。
Description
技术领域
本发明属于计算机领域,具体涉及一种服务器自主修复BMC的方法、系统、设备及存储介质。
背景技术
随着技术的更新迭代,对于如何能够高效的监控服务器的运行状态、记录服务器的运行日志,成为客户选择服务器的重中之重。众所周知,BMC是服务器中能够高效监控、记录其运行状态的最为重要的固件。BMC是否能够稳定的运行,也就成为了客户最为看重的一个选项。当BMC出现不可预知的问题造成挂死之后,就不能再继续监控服务器的运行状态。此时客户就希望能够有一种自主修复的方式来解决BMC挂死问题,恢复BMC正常运行,继续监控服务器运行。遇到此问题时,我们传统的修复都是被动的去建议客户刷新BMC来解决此问题,这就耗费了大量的时间,不能及时的为客户解决问题。
因此,亟需一种灵活的方案来解决上述问题。
发明内容
为解决以上问题,本发明提出了一种服务器自主修复BMC的方法,包括:
监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令;
响应于接收到所述刷新BMC的指令,所述服务器的操作系统通过刷新工具刷新所述BMC。
在本发明的一些实施例中,监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令,包括:
建立BIOS到BMC的独立通信线路,并通过所述BIOS监控所述BMC的心跳信号;
响应于在预定时间内未收到所述BMC的心跳信号,所述BIOS向所述服务器的操作系统发送所述刷新BMC的指令。
在本发明的一些实施例中,独立通信线路包括KCS通道或USB总线。
在本发明的一些实施例中,方法还包括:
将风扇管理芯片的数据接口与CPU相连以及将所述BMC的状态通过预定引脚与所述风扇管理芯片相连;
响应于所述BMC的所述预定引脚的状态发生变化且在预定时间内维持所述变化,切换所述风扇管理芯片的工作模式以实现所述CPU到所述BMC的通信。
在本发明的一些实施例中,方法还包括将所述风扇管理芯片的串口与所述BMC的flash芯片相连。
在本发明的一些实施例中,将所述风扇管理芯片的串口与所述BMC的flash芯片相连,包括:
在所述风扇管理芯片与所述BMC的flash芯片之间的所述串口电路添加多个控制模块;
所述控制模块的控制端与所述BMC的预定引脚相连,响应于所述BMC的预定引脚的电位发生变换,切换所述BMC的flash与所述风扇管理芯片之间的串口电路的连接的通断。
在本发明的一些实施例中,方法还包括:
响应于所述BMC正常,所述BMC将flash中的BMC的固件程序通过网路的方式发送到所述服务器的操作系统
本发明的另一方面还提出了一种服务器自主修复BMC的系统,包括:
监控模块,所述监控模块配置用于监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令;
修复模块,所述修复模块配置用于响应于接收到所述刷新BMC的指令,所述服务器的操作系统通过刷新工具刷新所述BMC。
本发明的又一方面还提出了一种计算机设备,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现上述实施方式中意一项所述方法的步骤。
本发明的再一方面还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述实施方式中任意一项所述方法的步骤。
通过本发明提供一种服务器自主修复BMC的方法,在BMC故障之后实现对BMC的自主修复,免去烧录器的现场烧录,在BMC故障之后自动识别利用服务器上现有的设备为跳板并主动修复BMC的故障,在不增加硬件成本的情况下极大地提升了服务器的稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种服务器自主修复BMC的方法的流程图;
图2为本发明实施例提供的一种服务器自主修复BMC的系统的结构示意图;
图3为本发明实施例提供的一种计算机设备的结构示意图;
图4为本发明实施例提供的一种计算机可读存储介质的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
如图1所示,本发明实施例的第一方面提出了一种服务器自主修复BMC的方法,包括:
步骤S1、监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令;
步骤S2、响应于接收到所述刷新BMC的指令,所述服务器的操作系统通过刷新工具刷新所述BMC。
在本发明的实施例中,本发明应用于服务器的运维领域,服务器生产商在售出服务器之后,服务器中BMC等管理部件是独立于服务器系统的较为复杂的监控系统,用于监测服务器的各项硬件运行参数,由于其复杂性较高,功能繁多,往往出问题的情况相对于其他系统要高很多。另外由于BMC的系统结构,在软件层面问题的修复只能通过重写写入新的固件程序或者重装固件程序而解决,但由于BMC的烧录需要特殊的烧录设备,甚至为防止服务器使用者对服务器相关信息的篡改,服务器制造商在一些情况下保留独有的烧录方式,在服务器出现故障时需要专门安排专业人员上门安装以保证BMC及相关服务器的安全性。但确造成很多的物力人力成本,仅能为安全而舍弃一些成本。而本发明提出的一种服务器自主修复BMC的方法可有效解决这一问题。
在步骤S1中,服务器上的BIOS与BMC进行通信以检测BMC是否正常,在BMC正常时,BMC可与BIOS之间周期性的发起心跳检测。如果BMC出现故障时,则与BIOS之间的通信无法进行。因此可通过这一机制检测BMC是否正常。为排除BMC与BIOS的周期性通信会因各自的任务或中断干扰,设置一个等待周期,即在受到以此通信成功的心跳检测信号后开始计时,当计时时间达到该等待周期时,若未收到BMC的心跳检测信号,则视为BMC故障,等待周期的时间设置,可根据具体的BMC的性能或者BIOS的性能而设定,以防止频繁通信影响BIOS或BMC中的正常的任务。一般设定为1分钟。如果在1分钟后仍未收到BMC的心跳检测信号,则BIOS则向操作系统发送BMC异常警告的指令。告知操作系统BMC出现问题。
在步骤S2中,如果操作系统接收到BIOS发送的关于BMC的状态的异常警告指令,则可通过网络与BMC进行通信,例如通过ping命令进行验证BMC是否正常工作。如果通过网络验证失败,则操作系统将执行对BMC自主修复的程序逻辑,通过调用服务器所选择的BMC芯片的类型所对应的刷新工具刷新BMC。例如SOCFlash强刷工具,借助SOCFlash强刷工具可将BMC中的固件进行刷新,以还原到BMC重新写入固件的状态。
在本发明的一些实施例中,还可根据BMC的Flash的具体类型及连接方式通过自主开发的Flash工具直连Flash并直接刷新Flash中的内容。
在本发明的一些实施例中,监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令,包括:
建立BIOS到BMC的独立通信线路,并通过所述BIOS监控所述BMC的心跳信号;
响应于在预定时间内未收到所述BMC的心跳信号,所述BIOS向所述服务器的操作系统发送所述刷新BMC的指令。
在本实施例中,为防止BIOS与BMC的通信受到其他部件的影响,BMC与BIOS之间的连接采用独立连接的方式进行连接。在一些实施例中选择LPC总线连接。LPC即Low pincount Bus,是在IBM PC兼容机中用于把低带宽设备和“老旧”设备连接到CPU上的一种数据传输中心。那些常见低速设备有:BIOS,串口,并口,PS/2的键盘和鼠标,软盘控制器,比较新的设备有可信平台模块。LPC总线通常和主板上的南桥物理相连,南桥在IBM PC AT平台上通常连接了一系列的“老旧”设备,例如两个可编程中断控制器,可编程计时器和两个ISADMA控制器。LPC总线是Intel在1998时作为工业标准架构体系(ISA)的替代品引入,它与ISA在软件层面是类似的,尽管在物理层面是有着巨大不同的,ISA是16bit宽,8.33MHz的总线,而它是4bit宽,有着四倍频率(33.3MHz)的总线。LPC总线最大的优点是只需要7个信号,在拥挤的现代主板上是很容易布局的。仅是通过用于BMC和BIOS的心跳检测信号的连接,因此可直接借助主板上的南桥与BMC相连,BIOS本身与南桥直接相连,因此可无需进行额外的连接布局。
在本发明的一些实施例中,BIOS与BMC之间的独立连接还可以通过USB总线实现。USB总线属于一种轮询式总线,主机控制端口初始化所有的数据传输。每一总线动作最多传送三个数据包,包括令牌(Token)、数据(Data)、联络(HandShake)。
按照传输前制定好的原则,在每次传送开始时,主机发送一个描述传输动作的种类、方向、USB设备地址和终端号的USB数据包,这个数据包通常被称为令牌包(TokenPacket)。USB设备从解码后的数据包的适当位置取出属于自己的数据。数据传输方向不是从主机到设备就是从设备到主机。在传输开始时,由标志包来标志数据的传输方向,然后发送端开始发送包含信息的数据包或表明没有数据传送。接收端也要相应发送一个握手的数据包表明是否传送成功。发送端和接收端之间的USB数据传输,在主机和设备的端口之间,可视为一个通道。USB中有一个特殊的通道一缺省控制通道,它属于消息通道,设备一启动即存在,从而为设备的设置、状态查询和输入控制信息提供一个入口。BMC与BIOS之间的心跳检测信号的频率可完全根据USB总线的轮询周期确定,即USB总线的轮询一次,即可视作向BMC发起一次心跳检测信号,如果轮询的结果无响应可视为未接收到BMC的心跳检测信号,如果在一分钟持续接收不到轮询结果,则认为BMC已经出现异常。通过USB总线的方式,无需实现对应的心跳检测信号,仅借助轮询机制便可实现心跳检测信号的作用。
进一步,如果在设定时间内未检测到BMC的心跳检测信号(轮询结果也算),则BIOS向服务器上的操作系统发送BMC异常的指令。
在本发明的一些实施例中,独立通信线路包括KCS通道或USB总线。
在本发明的一些实施例中,方法还包括:
将风扇管理芯片的数据接口与CPU相连以及将所述BMC的状态通过预定引脚与所述风扇管理芯片相连;
响应于所述BMC的所述预定引脚的状态发生变化且在预定时间内维持所述变化,切换所述风扇管理芯片的工作模式以实现所述CPU到所述BMC的通信。
在本实施例中,为使操作系统与BMC能够连接,将风扇管理芯片的数据接口与CPU相连,在服务器中,主板上一般设有用于管理风扇的转速等相关配置的管理芯片,多为单片机等嵌入式芯片,而且风扇管理芯片均通过数据接口与BMC存在数据总线相连,因此可将风扇管理芯片的数据接口与服务器上的CPU相连,在BMC出现故障时,可通过服务器接管该风扇管理芯片进行控制,另外还可以借助风扇管理芯片与BMC的数据连接进行对BMC的刷新。具体地,可通过CPU的I2C接口与风扇管理芯片的接口相连,风扇管理芯片的另外的I2C接口与BMC上的I2C接口相连,在BMC出现故障时,通过嵌入式编程的方式在将风扇管理芯片的上述两个I2C接口的电位信号完全同步,以此实现CPU到BMC的I2C通信。
另外,将BMC的表示BMC状态的引脚与风扇管理芯片上任意一个空闲引脚相连,以此来监控BMC的状态,当BMC的状态引脚的电位变化时,风扇管理芯片便可更改风扇管理芯片的工作模式,由于BMC已经失效,则将于BMC相连的I2C的电位与CPU相连的I2C同步。操作系统可借助I2C实现对BMC的刷新功能。
在本发明的一些实施例中,方法还包括将所述风扇管理芯片的串口与所述BMC的flash芯片相连。
在本实施例中,为了提供稳定的刷新功能,将风扇管理芯片的串口与BMC上的flash芯片直接相连,在无法通过I2C接口的方式对BMC进行强刷时,可通过直接修改BMC的flash芯片数据内容的方式进行修复。具体通过风扇管理芯片的串口与BMC上的flash相连。
在本发明的一些实施方式中,可根据BMC的flash类型通过其他如SPI接口的方式与flash相连。
在本发明的一些实施例中,将所述风扇管理芯片的串口与所述BMC的flash芯片相连,包括:
在所述风扇管理芯片与所述BMC的flash芯片之间的所述串口电路添加多个控制模块;
所述控制模块的控制端与所述BMC的预定引脚相连,响应于所述BMC的预定引脚的电位发生变换,切换所述BMC的flash与所述风扇管理芯片之间的串口电路的连接的通断。
在本实施例,由于flash芯片与风扇管理芯片直接相连,为保护flash芯片的数据安全性,在风扇管理芯片与flash芯片之间的数据线上添加控制模块。具体地,可以使用三极管的方式,对风扇管理芯片与flash芯片之间的数据线每一根线路添加三极管,并将多个三极管的发射级连接到BMC的状态引脚。当BMC功能正常时,三极管处于断开状态,风扇管理芯片上的电信号不会传递到flash芯片,在BMC功能异常时,三极管受制于BMC状态引脚的电位改变发生导通,flash芯片和风扇管理芯片连接。由此,在实现通过风扇管理芯片与flash芯片连接的情况下还可实现对flash芯片内容的保护。
在本发明的一些实施例中,当BMC出现故障时,服务器上的相关程序对BMC进行修复时,可先选择通过风扇管理芯片的I2C接口的方式实现对BMC的修复,如果该方式不成功,可选择通过串口直接修改BMC的flash芯片的方式进行修复。
在本发明的一些实施例中,方法还包括:
响应于所述BMC正常,所述BMC将flash中的BMC的固件程序通过网路的方式发送到所述服务器的操作系统。
在本发明的一些实施例中,在BMC正常运行时,BMC需要将BMC的固件程序通过网络发送到服务器的操作系统,以方便在BMC出现故障时通过该固件程序对BMC进行修复。
通过本发明提供一种服务器自主修复BMC的方法,在BMC故障之后实现对BMC的自主修复,免去烧录器的现场烧录,在BMC故障之后自动识别利用服务器上现有的设备为跳板并主动修复BMC的故障,在不增加硬件成本的情况下极大地提升了服务器的稳定性。
如图2所示,本发明的另一方面还提出了一种服务器自主修复BMC的系统,包括:
监控模块1,所述监控模块1配置用于监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令;
修复模块2,所述修复模块2配置用于响应于接收到所述刷新BMC的指令,所述服务器的操作系统通过刷新工具刷新所述BMC。
在本发明的一些实施例中,监控模块1监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令,包括:
建立BIOS到BMC的独立通信线路,并通过所述BIOS监控所述BMC的心跳信号;
响应于在预定时间内未收到所述BMC的心跳信号,所述BIOS向所述服务器的操作系统发送所述刷新BMC的指令。
在本发明的一些实施例中,监控模块1中的独立通信线路包括KCS通道或USB总线。
在本发明的一些实施例中,还包括中间模块,所述中间模块配置用于:
将风扇管理芯片的数据接口与CPU相连以及将所述BMC的状态通过预定引脚与所述风扇管理芯片相连;
响应于所述BMC的所述预定引脚的状态发生变化且在预定时间内维持所述变化,切换所述风扇管理芯片的工作模式以实现所述CPU到所述BMC的通信。
在本发明的一些实施例中,中间模块配置用于还包括将所述风扇管理芯片的串口与所述BMC的flash芯片相连。
在本发明的一些实施例中,中间模块还配置用于将所述风扇管理芯片的串口与所述BMC的flash芯片相连,具体包括:
在所述风扇管理芯片与所述BMC的flash芯片之间的所述串口电路添加多个控制模块;
所述控制模块的控制端与所述BMC的预定引脚相连,响应于所述BMC的预定引脚的电位发生变换,切换所述BMC的flash与所述风扇管理芯片之间的串口电路的连接的通断。
在本发明的一些实施例中,还包括数据备份模块,所示数据备份模块配置用于:
响应于所述BMC正常,所述BMC将flash中的BMC的固件程序通过网路的方式发送到所述服务器的操作系统。
如图3所示,本发明的又一方面还提出了一种计算机设备,包括:
至少一个处理器21;以及
存储器22,所述存储器22存储有可在所述处理器上运行的计算机指令23,所述指令23由所述处理器21执行时实现一种服务器自主修复BMC的方法,包括:
监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令;
响应于接收到所述刷新BMC的指令,所述服务器的操作系统通过刷新工具刷新所述BMC。
在本发明的一些实施例中,监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令,包括:
建立BIOS到BMC的独立通信线路,并通过所述BIOS监控所述BMC的心跳信号;
响应于在预定时间内未收到所述BMC的心跳信号,所述BIOS向所述服务器的操作系统发送所述刷新BMC的指令。
在本发明的一些实施例中,独立通信线路包括KCS通道或USB总线。
在本发明的一些实施例中,方法还包括:
将风扇管理芯片的I2C接口与CPU相连将风扇管理芯片的数据接口与CPU相连以及将所述BMC的状态通过预定引脚与所述风扇管理芯片相连;
响应于所述BMC的所述预定引脚的状态发生变化且在预定时间内维持所述变化,切换所述风扇管理芯片的工作模式以实现所述CPU到所述BMC的通信。
在本发明的一些实施例中,方法还包括将所述风扇管理芯片的串口与所述BMC的flash芯片相连。
在本发明的一些实施例中,将所述风扇管理芯片的串口与所述BMC的flash芯片相连,包括:
在所述风扇管理芯片与所述BMC的flash芯片之间的所述串口电路添加多个控制模块;
所述控制模块的控制端与所述BMC的预定引脚相连,响应于所述BMC的预定引脚的电位发生变换,切换所述BMC的flash与所述风扇管理芯片之间的串口电路的连接的通断。
在本发明的一些实施例中,方法还包括:
响应于所述BMC正常,所述BMC将flash中的BMC的固件程序通过网路的方式发送到所述服务器的操作系统。
如图4所示,本发明的再一方面还提出了一种计算机可读存储介质401,所述计算机可读存储介质401存储有计算机程序402,所述402被处理器执行时实现一种服务器自主修复BMC的方法,包括:
监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令;
响应于接收到所述刷新BMC的指令,所述服务器的操作系统通过刷新工具刷新所述BMC。
在本发明的一些实施例中,监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令,包括:
建立BIOS到BMC的独立通信线路,并通过所述BIOS监控所述BMC的心跳信号;
响应于在预定时间内未收到所述BMC的心跳信号,所述BIOS向所述服务器的操作系统发送所述刷新BMC的指令。
在本发明的一些实施例中,独立通信线路包括KCS通道或USB总线。
在本发明的一些实施例中,方法还包括:
将风扇管理芯片的数据接口与CPU相连以及将所述BMC的状态通过预定引脚与所述风扇管理芯片相连;
响应于所述BMC的所述预定引脚的状态发生变化且在预定时间内维持所述变化,切换所述风扇管理芯片的工作模式以实现所述CPU到所述BMC的通信。
在本发明的一些实施例中,方法还包括将所述风扇管理芯片的串口与所述BMC的flash芯片相连。
在本发明的一些实施例中,将所述风扇管理芯片的串口与所述BMC的flash芯片相连,包括:
在所述风扇管理芯片与所述BMC的flash芯片之间的所述串口电路添加多个控制模块;
所述控制模块的控制端与所述BMC的预定引脚相连,响应于所述BMC的预定引脚的电位发生变换,切换所述BMC的flash与所述风扇管理芯片之间的串口电路的连接的通断。
在本发明的一些实施例中,方法还包括:
响应于所述BMC正常,所述BMC将flash中的BMC的固件程序通过网路的方式发送到所述服务器的操作系统
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里所述功能的下列部件来实现或执行:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP和/或任何其它这种配置。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (10)
1.一种服务器自主修复BMC的方法,其特征在于,包括:
监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令;
响应于接收到所述刷新BMC的指令,所述服务器的操作系统通过刷新工具刷新所述BMC。
2.根据权利要求1所述的方法,其特征在于,所述监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令,包括:
建立BIOS到BMC的独立通信线路,并通过所述BIOS监控所述BMC的心跳信号;
响应于在预定时间内未收到所述BMC的心跳信号,所述BIOS向所述服务器的操作系统发送所述刷新BMC的指令。
3.根据权利要求2所述的方法,其特征在于,所述独立通信线路包括KCS通道或USB总线。
4.根据权利要求1所述的方法,其特征在于,还包括:
将风扇管理芯片的数据接口与CPU相连以及将所述BMC的状态通过预定引脚与所述风扇管理芯片相连;
响应于所述BMC的所述预定引脚的状态发生变化且在预定时间内维持所述变化,切换所述风扇管理芯片的工作模式以实现所述CPU到所述BMC的通信。
5.根据权利要求4所述的方法,其特征在于,还包括将所述风扇管理芯片的串口与所述BMC的flash芯片相连。
6.根据权利要求5所述的方法,其特征在于,所述将所述风扇管理芯片的串口与所述BMC的flash芯片相连,包括:
在所述风扇管理芯片与所述BMC的flash芯片之间的所述串口电路添加多个控制模块;
所述控制模块的控制端与所述BMC的预定引脚相连,响应于所述BMC的预定引脚的电位发生变换,切换所述BMC的flash与所述风扇管理芯片之间的串口电路的连接的通断。
7.根据权利要求6所述的方法,其特征在于,还包括:
响应于所述BMC正常,所述BMC将flash中的BMC的固件程序通过网路的方式发送到所述服务器的操作系统。
8.一种服务器自主修复BMC的系统,其特征在于,包括:
监控模块,所述监控模块配置用于监控BMC的心跳信号,响应于预定时间内未监控到所述BMC的心跳信号,向所述服务器的操作系统发送刷新BMC的指令;
修复模块,所述修复模块配置用于响应于接收到所述刷新BMC的指令,所述服务器的操作系统通过刷新工具刷新所述BMC。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-7任意一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111440616.7A CN114296995B (zh) | 2021-11-30 | 2021-11-30 | 一种服务器自主修复bmc的方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111440616.7A CN114296995B (zh) | 2021-11-30 | 2021-11-30 | 一种服务器自主修复bmc的方法、系统、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114296995A true CN114296995A (zh) | 2022-04-08 |
CN114296995B CN114296995B (zh) | 2023-11-03 |
Family
ID=80964704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111440616.7A Active CN114296995B (zh) | 2021-11-30 | 2021-11-30 | 一种服务器自主修复bmc的方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114296995B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116737471A (zh) * | 2023-08-04 | 2023-09-12 | 金舟远航(北京)信息产业有限公司 | Bios自动切换方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109976949A (zh) * | 2019-03-28 | 2019-07-05 | 苏州浪潮智能科技有限公司 | 一种bmc故障镜像回滚刷新方法、装置、终端及存储介质 |
CN110032462A (zh) * | 2018-01-12 | 2019-07-19 | 广达电脑股份有限公司 | 远端系统恢复的方法 |
CN111090319A (zh) * | 2019-11-21 | 2020-05-01 | 苏州浪潮智能科技有限公司 | 一种基于热敏电阻的控制服务器风扇的方法、设备及介质 |
CN112433580A (zh) * | 2020-11-06 | 2021-03-02 | 苏州浪潮智能科技有限公司 | 风扇控制方法、装置、计算机设备及存储介质 |
-
2021
- 2021-11-30 CN CN202111440616.7A patent/CN114296995B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110032462A (zh) * | 2018-01-12 | 2019-07-19 | 广达电脑股份有限公司 | 远端系统恢复的方法 |
CN109976949A (zh) * | 2019-03-28 | 2019-07-05 | 苏州浪潮智能科技有限公司 | 一种bmc故障镜像回滚刷新方法、装置、终端及存储介质 |
CN111090319A (zh) * | 2019-11-21 | 2020-05-01 | 苏州浪潮智能科技有限公司 | 一种基于热敏电阻的控制服务器风扇的方法、设备及介质 |
CN112433580A (zh) * | 2020-11-06 | 2021-03-02 | 苏州浪潮智能科技有限公司 | 风扇控制方法、装置、计算机设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116737471A (zh) * | 2023-08-04 | 2023-09-12 | 金舟远航(北京)信息产业有限公司 | Bios自动切换方法、装置、电子设备及存储介质 |
CN116737471B (zh) * | 2023-08-04 | 2023-11-21 | 金舟远航(北京)信息产业有限公司 | Bios自动切换方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114296995B (zh) | 2023-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6697963B1 (en) | Method of updating a system environmental setting | |
US6065053A (en) | System for resetting a server | |
US10693813B1 (en) | Enabling and disabling links of a networking switch responsive to compute node fitness | |
US6088816A (en) | Method of displaying system status | |
US6330690B1 (en) | Method of resetting a server | |
US7930425B2 (en) | Method of effectively establishing and maintaining communication linkages with a network interface controller | |
US9696777B2 (en) | Computer port control | |
US7996706B2 (en) | System to recover a failed flash of a blade service processor in a server chassis | |
US6163849A (en) | Method of powering up or powering down a server to a maintenance state | |
US6138250A (en) | System for reading system log | |
US6073255A (en) | Method of reading system log | |
US9645954B2 (en) | Embedded microcontroller and buses | |
WO2018095107A1 (zh) | 一种bios程序的异常处理方法及装置 | |
US8990632B2 (en) | System for monitoring state information in a multiplex system | |
US6122746A (en) | System for powering up and powering down a server | |
US7434085B2 (en) | Architecture for high availability using system management mode driven monitoring and communications | |
JP6130520B2 (ja) | 多重系システムおよび多重系システム管理方法 | |
TW200426571A (en) | Policy-based response to system errors occurring during os runtime | |
US20240289243A1 (en) | Server and control method therefor | |
WO2012001780A1 (ja) | システム制御装置、情報処理システム及び情報処理システムのデータ退避及び復元方法 | |
CN114296995B (zh) | 一种服务器自主修复bmc的方法、系统、设备及存储介质 | |
CN114281172A (zh) | 一种服务器风扇管理方法、系统、设备及存储介质 | |
CN115599617B (zh) | 总线检测方法、装置、服务器及电子设备 | |
CN115756648A (zh) | 一种双基板管理控制器芯片的主动恢复方法及终端 | |
JP2009237758A (ja) | サーバシステム、サーバ管理方法、およびそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |