CN107832167A - 一种bmc故障导致无法开机的恢复方法及系统 - Google Patents

一种bmc故障导致无法开机的恢复方法及系统 Download PDF

Info

Publication number
CN107832167A
CN107832167A CN201711240196.1A CN201711240196A CN107832167A CN 107832167 A CN107832167 A CN 107832167A CN 201711240196 A CN201711240196 A CN 201711240196A CN 107832167 A CN107832167 A CN 107832167A
Authority
CN
China
Prior art keywords
bmc
uboot
tftp
client
softwares
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711240196.1A
Other languages
English (en)
Other versions
CN107832167B (zh
Inventor
刘学艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201711240196.1A priority Critical patent/CN107832167B/zh
Publication of CN107832167A publication Critical patent/CN107832167A/zh
Application granted granted Critical
Publication of CN107832167B publication Critical patent/CN107832167B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供了一种BMC故障导致无法开机的恢复方法及系统,通过客户端与服务器的直连,通过BMC调试控制台进入uboot环境,在uboot里面设置IP地址跟客户机在同一网段,然后通过TFTP软件对服务器的BMC进行更新,使得BMC启动失败或者BMC挂掉导致服务器无法开机恢复;本发明操作步骤简便并且执行效率快,无需购买烧录器,减少成本,对于焊接在主板上的BMC芯片,减少对主板的损坏,维持服务器正常运行。

Description

一种BMC故障导致无法开机的恢复方法及系统
技术领域
本发明涉及服务器的技术领域,具体涉及一种BMC故障导致无法开机的恢复方法及系统。
背景技术
服务器的BMC(基板管理控制器)ROM芯片焊在主板上无法取下烧录,如果BMC启动失败(例如BMC刷新错误或者在BMC reset过程中异常断电等)导致服务器无法正常开机时,WEB界面也无法访问BMC IP,如此给服务器正常工作带来极大不便。
发明内容
基于上述问题,本发明提出了一种BMC故障导致无法开机的恢复方法及系统,能够实现BMC启动失败或者BMC挂掉导致无法开机的恢复恢复。
本发明提供如下技术方案:
一方面,本发明提供了一种BMC故障导致无法开机的恢复方法,包括:
步骤101,网线直连,将网线一端连接到BMC管理网口,另一端连接到客户机网口;步骤102,BMC调试线连接,将调试线连接到服务器主板上的串口插槽内,调试线另一端连接至所述客户机上,通过PuTTY软件打开;
步骤103,通过调试控制台在uboot下设置IP,进入uboot下载模式,把所述uboot中的IP地址设置成与客户端静态IP同一网段,确保两个静态IP可以ping通;
步骤104,通过TFTP软件刷新BMC。
其中,所述uboot中的IP地址为ech0IP地址。
其中,进入uboot下载模式具体为:插上电源后在客户端PuTTY软件上查看信息输出,当出现Hit“s”to stop auto boot”,按“s”键,进入到uboot下载模式。
其中,通过TFTP软件刷新BMC具体为:在客户端打开TFTP软件,TFTP自动抓取设置的IP,选择上传要刷新的镜像文件,在PuTTY界面输入tftp 0x89000000 imm2-uImage,然后输入bootm,当看到emmc后输入“m”,自动下载刷新镜像和自动更新,BMC自动重启,刷新完成。
另外,本发明还提供了一种BMC故障导致无法开机的恢复系统,所述系统包括:
网线连接模块,用于将网线直连,网线一端连接到BMC管理网口,另一端连接到客户机网口;
调试线连接模块,用于BMC调试线连接,将调试线连接到服务器主板上的串口插槽内,调试线另一端连接至所述客户机上,通过PuTTY软件打开;
IP设置模块,用于通过调试控制台在uboot下设置IP,进入uboot下载模式,把所述uboot中的IP地址设置成与客户端静态IP同一网段,确保两个静态IP可以ping通;
刷新模块,用于通过TFTP软件刷新BMC。
其中,所述uboot中的IP地址为ech0IP地址。
其中,进入uboot下载模式具体为:插上电源后在客户端PuTTY软件上查看信息输出,当出现Hit“s”to stop auto boot”,按“s”键,进入到uboot下载模式。
其中,通过TFTP软件刷新BMC具体为:在客户端打开TFTP软件,TFTP自动抓取设置的IP,选择上传要刷新的镜像文件,在PuTTY界面输入tftp 0x89000000 imm2-uImage,然后输入bootm,当看到emmc后输入“m”,自动下载刷新镜像和自动更新,BMC自动重启,刷新完成。
本发明提供了一种BMC故障导致无法开机的恢复方法及系统,通过客户端与服务器的直连,通过BMC调试控制台进入uboot环境,在uboot里面设置IP地址跟客户机在同一网段,然后通过TFTP软件对服务器的BMC进行更新,使得BMC启动失败或者BMC挂掉导致服务器无法开机恢复;本发明操作步骤简便并且执行效率快,无需购买烧录器,减少成本,对于焊接在主板上的BMC芯片,减少对主板的损坏,维持服务器正常运行。
附图说明
图1是本发明的方法流程图;
图2是本发明的系统结构框图;
具体实施方式
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
一方面,本发明的实施方式提供了一种BMC故障导致无法开机的恢复方法,附图1为本发明的方法流程图,附图2是本发明的系统结构框图,包括:
步骤101,网线直连,将网线一端连接到BMC管理网口,另一端连接到客户机网口;
步骤102,BMC调试线连接,将调试线连接到服务器主板上的串口插槽内,调试线另一端连接至所述客户机上,通过PuTTY软件打开;
将debug调试线接到服务器主板上的serial connector插槽内,debug线另一端连接到客户机上,通过PuTTY软件打开。
步骤103,通过调试控制台在uboot下设置IP,进入uboot下载模式,把所述uboot中的IP地址设置成与客户端静态IP同一网段,确保两个静态IP可以ping通;
插上电源后会在客户端PuTTY软件上面看到信息输出,当出现Hit“s”to stopauto boot”,然后立即按“s”,进入到uboot下载模式,把uboot里面的ech0IP地址设置成跟客户端静态IP同一网段,save保存,确保两个静态IP可以ping通。
步骤104,通过TFTP软件刷新BMC。
在客户端打开TFTP软件,TFTP会自动抓取设置的IP,选择上传要刷新的镜像文件,在PuTTY界面输入tftp 0x89000000 imm2-uImage,然后输入bootm,当看到emmc后输入“m”,自动下载刷新镜像和自动更新,等待3~5分钟后BMC会自动重启,刷新完成。
本发明提供了一种BMC故障导致无法开机的恢复方法,通过客户端与服务器的直连,通过BMC调试控制台进入uboot环境,在uboot里面设置IP地址跟客户机在同一网段,然后通过TFTP软件对服务器的BMC进行更新,使得BMC启动失败或者BMC挂掉导致服务器无法开机恢复;本发明操作步骤简便并且执行效率快,无需购买烧录器,减少成本,对于焊接在主板上的BMC芯片,减少对主板的损坏,维持服务器正常运行。
另一方面,本发明的实施方式提供了一种BMC故障导致无法开机的恢复系统,所述系统包括:
网线连接模块201,用于将网线直连,网线一端连接到BMC管理网口,另一端连接到客户机网口;
调试线连接模块202,用于BMC调试线连接,将调试线连接到服务器主板上的串口插槽内,调试线另一端连接至所述客户机上,通过PuTTY软件打开;
将debug调试线接到服务器主板上的serial connector插槽内,debug线另一端连接到客户机上,通过PuTTY软件打开。
IP设置模块203,用于通过调试控制台在uboot下设置IP,进入uboot下载模式,把所述uboot中的IP地址设置成与客户端静态IP同一网段,确保两个静态IP可以ping通;
插上电源后会在客户端PuTTY软件上面看到信息输出,当出现Hit“s”to stopauto boot”,然后立即按“s”,进入到uboot下载模式,把uboot里面的ech0IP地址设置成跟客户端静态IP同一网段,save保存,确保两个静态IP可以ping通。
刷新模块204,用于通过TFTP软件刷新BMC。
在客户端打开TFTP软件,TFTP会自动抓取设置的IP,选择上传要刷新的镜像文件,在PuTTY界面输入tftp 0x89000000 imm2-uImage,然后输入bootm,当看到emmc后输入“m”,自动下载刷新镜像和自动更新,等待3~5分钟后BMC会自动重启,刷新完成。
本发明提供了一种BMC故障导致无法开机的恢复系统,通过客户端与服务器的直连,通过BMC调试控制台进入uboot环境,在uboot里面设置IP地址跟客户机在同一网段,然后通过TFTP软件对服务器的BMC进行更新,使得BMC启动失败或者BMC挂掉导致服务器无法开机恢复;本发明操作步骤简便并且执行效率快,无需购买烧录器,减少成本,对于焊接在主板上的BMC芯片,减少对主板的损坏,维持服务器正常运行。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种BMC故障导致无法开机的恢复方法,其特征在于:
步骤101,网线直连,将网线一端连接到BMC管理网口,另一端连接到客户机网口;
步骤102,BMC调试线连接,将调试线连接到服务器主板上的串口插槽内,调试线另一端连接至所述客户机上,通过PuTTY软件打开;
步骤103,通过调试控制台在uboot下设置IP,进入uboot下载模式,把所述uboot中的IP地址设置成与客户端静态IP同一网段,确保两个静态IP可以ping通;
步骤104,通过TFTP软件刷新BMC。
2.根据权利要求1所述的方法,其特征在于:所述uboot中的IP地址为ech0IP地址。
3.根据权利要求1所述的方法,其特征在于:进入uboot下载模式具体为:插上电源后在客户端PuTTY软件上查看信息输出,当出现Hit“s”to stop auto boot”,按“s”键,进入到uboot下载模式。
4.根据权利要求1所述的方法,其特征在于:通过TFTP软件刷新BMC具体为:在客户端打开TFTP软件,TFTP自动抓取设置的IP,选择上传要刷新的镜像文件,在PuTTY界面输入tftp0x89000000 imm2-uImage,然后输入bootm,当看到emmc后输入“m”,自动下载刷新镜像和自动更新,BMC自动重启,刷新完成。
5.一种BMC故障导致无法开机的恢复系统,其特征在于:所述系统包括:
网线连接模块,用于将网线直连,网线一端连接到BMC管理网口,另一端连接到客户机网口;
调试线连接模块,用于BMC调试线连接,将调试线连接到服务器主板上的串口插槽内,调试线另一端连接至所述客户机上,通过PuTTY软件打开;
IP设置模块,用于通过调试控制台在uboot下设置IP,进入uboot下载模式,把所述uboot中的IP地址设置成与客户端静态IP同一网段,确保两个静态IP可以ping通;
刷新模块,用于通过TFTP软件刷新BMC。
6.根据权利要求5所述的系统,其特征在于:所述uboot中的IP地址为ech0IP地址。
7.根据权利要求5所述的系统,其特征在于:进入uboot下载模式具体为:插上电源后在客户端PuTTY软件上查看信息输出,当出现Hit“s”to stop auto boot”,按“s”键,进入到uboot下载模式。
8.根据权利要求5所述的系统,其特征在于:通过TFTP软件刷新BMC具体为:在客户端打开TFTP软件,TFTP自动抓取设置的IP,选择上传要刷新的镜像文件,在PuTTY界面输入tftp0x89000000 imm2-uImage,然后输入bootm,当看到emmc后输入“m”,自动下载刷新镜像和自动更新,BMC自动重启,刷新完成。
CN201711240196.1A 2017-11-30 2017-11-30 一种bmc故障导致无法开机的恢复方法及系统 Active CN107832167B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711240196.1A CN107832167B (zh) 2017-11-30 2017-11-30 一种bmc故障导致无法开机的恢复方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711240196.1A CN107832167B (zh) 2017-11-30 2017-11-30 一种bmc故障导致无法开机的恢复方法及系统

Publications (2)

Publication Number Publication Date
CN107832167A true CN107832167A (zh) 2018-03-23
CN107832167B CN107832167B (zh) 2021-04-13

Family

ID=61646885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711240196.1A Active CN107832167B (zh) 2017-11-30 2017-11-30 一种bmc故障导致无法开机的恢复方法及系统

Country Status (1)

Country Link
CN (1) CN107832167B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130326278A1 (en) * 2012-05-30 2013-12-05 Hon Hai Precision Industry Co., Ltd. Server and method of manipulation in relation to server serial ports
CN104580475A (zh) * 2015-01-13 2015-04-29 华为技术有限公司 远程控制方法、终端设备、管理服务器及远程控制系统
CN104572465A (zh) * 2015-01-05 2015-04-29 浪潮电子信息产业股份有限公司 一种新型BIOS Debug的方法
CN105915368A (zh) * 2016-04-01 2016-08-31 浪潮电子信息产业股份有限公司 一种基于tftpd恢复bios的方法
CN106020828A (zh) * 2016-05-24 2016-10-12 浪潮电子信息产业股份有限公司 一种服务器无法开机的救治方法
US20170091017A1 (en) * 2015-09-29 2017-03-30 Hon Hai Precision Industry Co., Ltd. Fault detecting device and method
US20170147453A1 (en) * 2015-11-24 2017-05-25 Quanta Computer Inc. Communication bus with baseboard management controller

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130326278A1 (en) * 2012-05-30 2013-12-05 Hon Hai Precision Industry Co., Ltd. Server and method of manipulation in relation to server serial ports
CN104572465A (zh) * 2015-01-05 2015-04-29 浪潮电子信息产业股份有限公司 一种新型BIOS Debug的方法
CN104580475A (zh) * 2015-01-13 2015-04-29 华为技术有限公司 远程控制方法、终端设备、管理服务器及远程控制系统
US20170091017A1 (en) * 2015-09-29 2017-03-30 Hon Hai Precision Industry Co., Ltd. Fault detecting device and method
US20170147453A1 (en) * 2015-11-24 2017-05-25 Quanta Computer Inc. Communication bus with baseboard management controller
CN105915368A (zh) * 2016-04-01 2016-08-31 浪潮电子信息产业股份有限公司 一种基于tftpd恢复bios的方法
CN106020828A (zh) * 2016-05-24 2016-10-12 浪潮电子信息产业股份有限公司 一种服务器无法开机的救治方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘佳等: "《基于UEFI的Flash更新的开发研究》", 《计算机工程与设计》 *

Also Published As

Publication number Publication date
CN107832167B (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
TWI571736B (zh) 自動除錯資訊收集之方法及系統
US20150106660A1 (en) Controller access to host memory
CN106776128A (zh) 一种保障Linux操作系统正常启动的方法
CN104850485A (zh) 一种基于bmc远程诊断服务器开机故障的方法及系统
CN103812726A (zh) 一种数据通信设备的自动化测试方法及装置
CN105354070A (zh) 一种通过i2c升级设备固件的方法
TW200403563A (en) Method and system to implement a system event log for system manageability
CN100465907C (zh) 一种cmos参数的设置维护装置及方法
WO2013060064A1 (zh) 一种用电信息采集终端及远程维护系统
CN114116280B (zh) 交互式bmc自恢复方法、系统、终端及存储介质
CN112069002B (zh) 一种服务器热插拔调试装置及方法
CN104734904B (zh) 旁路设备的自动测试方法及系统
CN107070747A (zh) 一种在网卡绑定模式下自动化测试网卡网络连接稳定性的方法
WO2012000328A1 (zh) 一种多媒体终端设备及其维护方法
CN116775376A (zh) 处理NVMe盘链路故障的方法、系统、设备和存储介质
TWI723477B (zh) 電子設備、可遠端維護電子設備運作的系統及方法
CN116974804A (zh) 管理引擎挂死的调试方法、装置、设备及存储介质
CN107832167A (zh) 一种bmc故障导致无法开机的恢复方法及系统
CN116795600A (zh) 用于基板管理控制器的数据恢复方法及系统
CN114115955B (zh) 服务器资源盒子fpga固件升级方法、系统、终端及存储介质
CN115168146A (zh) 一种异常检测方法和装置
CN109446002A (zh) 一种用于服务器抓取sata硬盘的治具板、系统及方法
CN108804269A (zh) 一种基于域控制测试raid板卡稳定性的系统及方法
Cisco Troubleshooting the Initial Hardware Configuration
Cisco Troubleshooting the Initial Hardware Configuration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant