CN111309509B - 一种基于服务器bmc通道切换失败的解决方法及系统 - Google Patents

一种基于服务器bmc通道切换失败的解决方法及系统 Download PDF

Info

Publication number
CN111309509B
CN111309509B CN202010110090.5A CN202010110090A CN111309509B CN 111309509 B CN111309509 B CN 111309509B CN 202010110090 A CN202010110090 A CN 202010110090A CN 111309509 B CN111309509 B CN 111309509B
Authority
CN
China
Prior art keywords
bmc
switch
polling
channel switching
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010110090.5A
Other languages
English (en)
Other versions
CN111309509A (zh
Inventor
梁磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010110090.5A priority Critical patent/CN111309509B/zh
Publication of CN111309509A publication Critical patent/CN111309509A/zh
Application granted granted Critical
Publication of CN111309509B publication Critical patent/CN111309509B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4022Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4282Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0016Inter-integrated circuit (I2C)

Abstract

本发明涉及服务器技术领域,提供一种基于服务器BMC通道切换失败的解决方法及系统,方法包括:当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令;当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令;在轮询过程中,判断所述BMC通道切换是否成功,当切换成功时,则判定通道切换失败故障解决,当切换仍然失败,则判定所述I2C切换开关硬件故障,从而解决了BMC通道切换失败会导致硬盘无法正常监控,服务器频繁关机造成业迁移的问题,为用户提供较大便利,也提高用户对服务器产品使用的满意度。

Description

一种基于服务器BMC通道切换失败的解决方法及系统
技术领域
本发明属于服务器技术领域,尤其涉及一种基于服务器BMC通道切换失败的解决方法及系统。
背景技术
在服务器实际应用端,Inspur 5280M5机型用的一款I2C Switch PCA9548出现了BMC概率性切换通道失败的问题,在BMC写完通道地址字后驱动返回错误码,可能是没有得到正确的ACK响应,再次读取该通道寄存器,发现内容为将要切换的通道,但是芯片想再次切换为其他通道时驱动依然返回错误码,切换操作均是在I2C stop条件产生之后才开始进行。
但是,BMC通道切换失败会导致硬盘无法正常监控,影响用户的正常使用,而且造成不良的客户对产品的投诉。
发明内容
针对现有技术中的缺陷,本发明提供了一种基于服务器BMC通道切换失败的解决方法,旨在解决现有技术BMC通道切换失败会导致硬盘无法正常监控,影响用户的正常使用的问题。
本发明所提供的技术方案是:一种基于服务器BMC通道切换失败的解决方法,所述方法包括下述步骤:
当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令;
当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令;
在轮询过程中,判断所述BMC通道切换是否成功,当切换成功时,则判定通道切换失败故障解决,当切换仍然失败,则判定所述I2C切换开关硬件故障。
作为一种改进的方案,所述当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令的之后;所述当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令的步骤之前还包括下述步骤:
向所述I2C切换开关发送工作状态采集指令;
接收所述I2C切换开关反馈的返回值,并对所述返回值进行解析,所述返回值为-1或0;
当所述I2C切换开关反馈返回值为-1时,则判定所述I2C切换开关处于异常工作状态,所述I2C切换开关出现硬件故障,控制不执行后续的轮询动作;
当所述I2C切换开关反馈返回值为0时,则判定所述I2C切换开关处于正常工作状态,并继续执行所述当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令的步骤。
作为一种改进的方案,所述BMC轮询初始化动作包括下述步骤:
通过ssh登录BMC;
当BMC登录成功后,控制停掉看门狗机制和ipmimain进程;
获取硬盘背板上所有硬盘信息;
对获取到的所述硬盘背板上所有的硬盘信息进行解析,获取可识别的数据帧。
作为一种改进的方案,所述当BMC登录成功后,控制停掉看门狗机制和ipmimain进程的步骤之后;所述获取硬盘背板上所有硬盘信息的步骤之前还包括下述步骤:
通过预先配置的命令,控制切换进入所述I2C切换开关的channel10通道上;
对所述I2C切换开关的channel10通道下的所有设备地址进行扫描,获取硬盘上CPLD的地址。
作为一种改进的方案,所述对获取到的所述硬盘背板上所有的硬盘信息进行解析,获取可识别的数据帧的步骤之后,所述当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令的步骤之前还包括下述步骤:
发送启动命令,控制恢复所述BMC的正常运行。
本发明的另一目的在于提供一种基于服务器BMC通道切换失败的解决系统,所述系统包括:
切换失败的指令接收模块,用于当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令;
轮询控制模块,用于当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令;
切换判断模块,用于在轮询过程中,判断所述BMC通道切换是否成功;
第一判定模块,用于当切换成功时,则判定通道切换失败故障解决;
第二判定模块,用于当切换仍然失败,则判定所述I2C切换开关硬件故障。
作为一种改进的方案,所述系统还包括:
工作状态采集指令发送模块,用于向所述I2C切换开关发送工作状态采集指令;
返回值接收解析模块,用于接收所述I2C切换开关反馈的返回值,并对所述返回值进行解析,所述返回值为-1或0;
第三判定模块,用于当所述I2C切换开关反馈返回值为-1时,则判定所述I2C切换开关处于异常工作状态,所述I2C切换开关出现硬件故障,控制不执行后续的轮询动作;
第四判定模块,用于当所述I2C切换开关反馈返回值为0时,则判定所述I2C切换开关处于正常工作状态,并继续执行所述当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令的步骤。
作为一种改进的方案,所述系统还包括:
轮询初始化动作模块,用于控制执行BMC轮询初始化动作;
其中,所述轮询初始化动作模块包括:
BMC登录模块,用于通过ssh登录BMC;
关停模块,用于当BMC登录成功后,控制停掉看门狗机制和ipmimain进程;
硬盘信息获取模块,用于获取硬盘背板上所有硬盘信息;
硬盘信息解析模块,用于对获取到的所述硬盘背板上所有的硬盘信息进行解析,获取可识别的数据帧。
作为一种改进的方案,所述轮询初始化动作模块还包括:
通道切换模块,用于通过预先配置的命令,控制切换进入所述I2C切换开关的channel10通道上;
地址获取模块,用于对所述I2C切换开关的channel10通道下的所有设备地址进行扫描,获取硬盘上CPLD的地址。
作为一种改进的方案,所述轮询初始化动作模块还包括:
BMC恢复运行控制模块,用于发送启动命令,控制恢复所述BMC的正常运行。
在本发明实施例中,当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令;当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令;在轮询过程中,判断所述BMC通道切换是否成功,当切换成功时,则判定通道切换失败故障解决,当切换仍然失败,则判定所述I2C切换开关硬件故障,从而解决了BMC通道切换失败会导致硬盘无法正常监控,服务器频繁关机造成业迁移的问题,为用户提供较大便利,也提高用户对服务器产品使用的满意度。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1是本发明提供的基于服务器BMC通道切换失败的解决方法的实现流程图;
图2是本发明提供的控制执行BMC轮询初始化动作的实现流程图;
图3是本发明提供的基于服务器BMC通道切换失败的解决系统的结构框图;
图4是本发明提供的轮询初始化动作模块的结构框图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的、技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
图1是本发明提供的基于服务器BMC通道切换失败的解决方法的实现流程图,其具体包括下述步骤:
在步骤S101中,当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令;
在步骤S102中,当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令;
在步骤S103中,在轮询过程中,判断所述BMC通道切换是否成功,当切换成功时,则判定通道切换失败故障解决,当切换仍然失败,则判定所述I2C切换开关硬件故障。
在该实施例中,该轮询机制中包含轮询的基本内容均如常规的机制,例如轮询的时间间隔、轮询次数以及轮询的指令发送格式等,其中,该轮询次数可以根据实际的情况进行设置,本发明可以设置三次,三次后切换仍然失败,这判定I2C切换开关硬件故障。
在本发明实施例中,当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令的之后;所述当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令的步骤之前还包括下述步骤:
(1)向所述I2C切换开关发送工作状态采集指令;
(2)接收所述I2C切换开关反馈的返回值,并对所述返回值进行解析,所述返回值为-1或0;
(3)当所述I2C切换开关反馈返回值为-1时,则判定所述I2C切换开关处于异常工作状态,所述I2C切换开关出现硬件故障,控制不执行后续的轮询动作;
(4)当所述I2C切换开关反馈返回值为0时,则判定所述I2C切换开关处于正常工作状态,并继续执行所述当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令的步骤。
该实施例的设置是为确定I2C切换开关为正常状态,如果自身已经出现故障,则不需要执行后续的步骤即可。
在本发明实施例中,在上述步骤S101之前还需要执行控制执行BMC轮询初始化动作的步骤,其中,如图2所示,控制执行BMC轮询初始化动作包括下述步骤:
在步骤S201中,通过ssh登录BMC;
该登录BMC的ssh命令为:
ssh sysadmin@100.2.76.127,密码为superuser;
如果在登录过程中出现提示“ssh:connect to host 100.2.76.127 port22:Connection refused”,则发送如下命令开启ssh服务后重试:
ipmitool-H 100.2.76.127-U admin-P admin-I lanplus raw 0x32 0x6A 0x200x00 0x00 0x00 0x01 0x46 0x46 0x46 0x46 0x46 0x46 0x46 0x46 0x46 0x46 0x460x46 0x46 0x46 0x46 0x46 0x00 0xFF 0xFF 0xFF 0xFF 0x16 0x00 0x00 0x00 0x580x02 0x00 0x00 0xFF 0x00。
在步骤S202中,当BMC登录成功后,控制停掉看门狗机制和ipmimain进程;
其中,服务器启用了看门狗机制,为防止在操作的过程中BMC重启,需要通过如下命令停掉看门狗的监控:
/etc/init.d/watchdogapp.sh stop。
在步骤S203中,获取硬盘背板上所有硬盘信息;
因bmc正常运行的过程中会不断切换switch及通过i2c访问CPLD中硬盘相关信息,为了防止对手动测试产生影响,需要通过如下命令停止掉bmc的ipmimain进程:
/etc/init.d/ipmistack stop。
在步骤S204中,对获取到的所述硬盘背板上所有的硬盘信息进行解析,获取可识别的数据帧。
其中,根据BMC与背板CPLD之间的交互协议,解析出来的获取到的数据帧如下:
66//version
04//port num
03//hdd0
07//hdd1
07//hdd2
87//hdd3
00//hdd4
00//hdd5
00//hdd6
00//hdd7
00//hdd8
00//hdd9
00//hdd10
00//hdd11
00//hdd12
00//hdd13
00//hdd14
00//hdd15
00//hdd16
00//hdd17
00//hdd18
00//hdd19
00//hdd20
00//hdd21
00//hdd22
00//hdd23
00//hdd24
fe//temp。
在该实施例中,所述当BMC登录成功后,控制停掉看门狗机制和ipmimain进程的步骤之后;所述获取硬盘背板上所有硬盘信息的步骤之前还包括下述步骤:
(1)通过预先配置的命令,控制切换进入所述I2C切换开关的channel10通道上;
硬盘的监控接在BMC的i2c6上,且通过一个I2C切换开关(地址为0xe0)连接各硬盘背板,如果需要读取第一块前置背板上面的所有硬盘的相关信息,则需要通过如下命令切换到该I2C切换开关的channel0上:
i2c-test-b 6-s 0x70-w-d 0x01。
(2)对所述I2C切换开关的channel10通道下的所有设备地址进行扫描,获取硬盘上CPLD的地址;
该扫描的实现命令为:i2c-test-b 6–scan。
图3示出了本发明提供的基于服务器BMC通道切换失败的解决系统的结构框图,为了便于说明,图中仅给出了与本发明实施例相关的部分。
基于服务器BMC通道切换失败的解决系统包括:
切换失败的指令接收模块11,用于当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令;
轮询控制模块12,用于当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令;
切换判断模块13,用于在轮询过程中,判断所述BMC通道切换是否成功;
第一判定模块14,用于当切换成功时,则判定通道切换失败故障解决;
第二判定模块15,用于当切换仍然失败,则判定所述I2C切换开关硬件故障。
在该实施例中,所述系统还包括:
工作状态采集指令发送模块16,用于向所述I2C切换开关发送工作状态采集指令;
返回值接收解析模块17,用于接收所述I2C切换开关反馈的返回值,并对所述返回值进行解析,所述返回值为-1或0;
第三判定模块18,用于当所述I2C切换开关反馈返回值为-1时,则判定所述I2C切换开关处于异常工作状态,所述I2C切换开关出现硬件故障,控制不执行后续的轮询动作;
第四判定模块19,用于当所述I2C切换开关反馈返回值为0时,则判定所述I2C切换开关处于正常工作状态,并继续执行所述当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令的步骤。
在本发明实施例中,所述系统还包括:
轮询初始化动作模块20,用于控制执行BMC轮询初始化动作;
其中,如图4所示,所述轮询初始化动作模块20包括:
BMC登录模块21,用于通过ssh登录BMC;
关停模块22,用于当BMC登录成功后,控制停掉看门狗机制和ipmimain进程;
硬盘信息获取模块23,用于获取硬盘背板上所有硬盘信息;
硬盘信息解析模块24,用于对获取到的所述硬盘背板上所有的硬盘信息进行解析,获取可识别的数据帧。
如图4所示,所述轮询初始化动作模块20还包括:
通道切换模块25,用于通过预先配置的命令,控制切换进入所述I2C切换开关的channel10通道上;
地址获取模块26,用于对所述I2C切换开关的channel10通道下的所有设备地址进行扫描,获取硬盘上CPLD的地址。
结合图4所示,所述轮询初始化动作模块20还包括:
BMC恢复运行控制模块27,用于发送启动命令,控制恢复所述BMC的正常运行。
其中,上述各个模块的功能如上述方法实施例所记载,在此不再赘述。
在本发明实施例中,上述各个模块的功能如上述方法实施例所记载,在此不再赘述。
在本发明实施例中,当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令;当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令;在轮询过程中,判断所述BMC通道切换是否成功,当切换成功时,则判定通道切换失败故障解决,当切换仍然失败,则判定所述I2C切换开关硬件故障,从而解决了BMC通道切换失败会导致硬盘无法正常监控,服务器频繁关机造成业迁移的问题,为用户提供较大便利,也提高用户对服务器产品使用的满意度。
以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (8)

1.一种基于服务器BMC通道切换失败的解决方法,其特征在于,所述方法包括下述步骤:
当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令;
当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令;
在轮询过程中,判断所述BMC通道切换是否成功,当切换成功时,则判定通道切换失败故障解决,当切换仍然失败,则判定所述I2C切换开关硬件故障;
所述当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令的之后;所述当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令的步骤之前还包括下述步骤:
向所述I2C切换开关发送工作状态采集指令;
接收所述I2C切换开关反馈的返回值,并对所述返回值进行解析,所述返回值为-1或0;
当所述I2C切换开关反馈返回值为-1时,则判定所述I2C切换开关处于异常工作状态,所述I2C切换开关出现硬件故障,控制不执行后续的轮询动作;
当所述I2C切换开关反馈返回值为0时,则判定所述I2C切换开关处于正常工作状态,并继续执行所述当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令的步骤。
2.根据权利要求1所述的基于服务器BMC通道切换失败的解决方法,其特征在于,所述BMC轮询初始化动作包括下述步骤:
通过ssh登录BMC;
当BMC登录成功后,控制停掉看门狗机制和ipmimain进程;
获取硬盘背板上所有硬盘信息;
对获取到的所述硬盘背板上所有的硬盘信息进行解析,获取可识别的数据帧。
3.根据权利要求2所述的基于服务器BMC通道切换失败的解决方法,其特征在于,所述当BMC登录成功后,控制停掉看门狗机制和ipmimain进程的步骤之后;所述获取硬盘背板上所有硬盘信息的步骤之前还包括下述步骤:
通过预先配置的命令,控制切换进入所述I2C切换开关的channel10通道上;
对所述I2C切换开关的channel10通道下的所有设备地址进行扫描,获取硬盘上CPLD的地址。
4.根据权利要求2所述的基于服务器BMC通道切换失败的解决方法,其特征在于,所述对获取到的所述硬盘背板上所有的硬盘信息进行解析,获取可识别的数据帧的步骤之后,所述当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令的步骤之前还包括下述步骤:
发送启动命令,控制恢复所述BMC的正常运行。
5.一种基于服务器BMC通道切换失败的解决系统,其特征在于,所述系统包括:
切换失败的指令接收模块,用于当BMC轮询初始化动作完成后,接收I2C切换开关反馈的通道切换失败的指令;
轮询控制模块,用于当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令;
切换判断模块,用于在轮询过程中,判断所述BMC通道切换是否成功;
第一判定模块,用于当切换成功时,则判定通道切换失败故障解决;
第二判定模块,用于当切换仍然失败,则判定所述I2C切换开关硬件故障;
所述系统还包括:
工作状态采集指令发送模块,用于向所述I2C切换开关发送工作状态采集指令;
返回值接收解析模块,用于接收所述I2C切换开关反馈的返回值,并对所述返回值进行解析,所述返回值为-1或0;
第三判定模块,用于当所述I2C切换开关反馈返回值为-1时,则判定所述I2C切换开关处于异常工作状态,所述I2C切换开关出现硬件故障,控制不执行后续的轮询动作;
第四判定模块,用于当所述I2C切换开关反馈返回值为0时,则判定所述I2C切换开关处于正常工作状态,并继续执行所述当接收到所述I2C切换开关反馈的通道切换失败的指令后,启动对所述I2C切换开关的轮询机制,控制向所述I2C切换开关发送BMC通道切换命令的步骤。
6.根据权利要求5所述的基于服务器BMC通道切换失败的解决系统,其特征在于,所述系统还包括:
轮询初始化动作模块,用于控制执行BMC轮询初始化动作;
其中,所述轮询初始化动作模块包括:
BMC登录模块,用于通过ssh登录BMC;
关停模块,用于当BMC登录成功后,控制停掉看门狗机制和ipmimain进程;
硬盘信息获取模块,用于获取硬盘背板上所有硬盘信息;
硬盘信息解析模块,用于对获取到的所述硬盘背板上所有的硬盘信息进行解析,获取可识别的数据帧。
7.根据权利要求6所述的基于服务器BMC通道切换失败的解决系统,其特征在于,所述轮询初始化动作模块还包括:
通道切换模块,用于通过预先配置的命令,控制切换进入所述I2C切换开关的channel10通道上;
地址获取模块,用于对所述I2C切换开关的channel10通道下的所有设备地址进行扫描,获取硬盘上CPLD的地址。
8.根据权利要求6所述的基于服务器BMC通道切换失败的解决系统,其特征在于,所述轮询初始化动作模块还包括:
BMC恢复运行控制模块,用于发送启动命令,控制恢复所述BMC的正常运行。
CN202010110090.5A 2020-02-23 2020-02-23 一种基于服务器bmc通道切换失败的解决方法及系统 Active CN111309509B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010110090.5A CN111309509B (zh) 2020-02-23 2020-02-23 一种基于服务器bmc通道切换失败的解决方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010110090.5A CN111309509B (zh) 2020-02-23 2020-02-23 一种基于服务器bmc通道切换失败的解决方法及系统

Publications (2)

Publication Number Publication Date
CN111309509A CN111309509A (zh) 2020-06-19
CN111309509B true CN111309509B (zh) 2022-12-23

Family

ID=71145594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010110090.5A Active CN111309509B (zh) 2020-02-23 2020-02-23 一种基于服务器bmc通道切换失败的解决方法及系统

Country Status (1)

Country Link
CN (1) CN111309509B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858239B (zh) * 2020-06-30 2022-06-10 浪潮电子信息产业股份有限公司 一种服务器硬盘监测方法、装置、设备及介质
CN112231145B (zh) * 2020-10-10 2022-05-31 苏州浪潮智能科技有限公司 一种基于cpld控制bmc重启的切换结构及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108089964A (zh) * 2017-12-07 2018-05-29 郑州云海信息技术有限公司 一种通过bmc监控服务器cpld状态的装置及方法
CN108287780A (zh) * 2018-01-25 2018-07-17 郑州云海信息技术有限公司 一种监控服务器cpld状态的装置及方法
CN109656767A (zh) * 2018-12-21 2019-04-19 广东浪潮大数据研究有限公司 一种cpld状态信息的获取方法、系统及相关组件

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108089964A (zh) * 2017-12-07 2018-05-29 郑州云海信息技术有限公司 一种通过bmc监控服务器cpld状态的装置及方法
CN108287780A (zh) * 2018-01-25 2018-07-17 郑州云海信息技术有限公司 一种监控服务器cpld状态的装置及方法
CN109656767A (zh) * 2018-12-21 2019-04-19 广东浪潮大数据研究有限公司 一种cpld状态信息的获取方法、系统及相关组件

Also Published As

Publication number Publication date
CN111309509A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN102244591B (zh) 客户端服务器及对其功能测试全程监测的方法
CN111309509B (zh) 一种基于服务器bmc通道切换失败的解决方法及系统
CN109408338B (zh) 抓取NVME硬盘trace的方法、装置、设备及系统
CN111752776B (zh) 一种服务器的循环上下电测试方法和系统
JPWO2009110111A1 (ja) サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム
US20120254662A1 (en) Automated test system and automated test method
CN112395122B (zh) 闪存控制器及闪存控制器的方法
CN104615523A (zh) 一种基于ipmi协议的bmc管理模块疲劳测试方法
CN111694710A (zh) 基板管理控制器故障监控方法、装置、设备及存储介质
CN111367743A (zh) 一种循环重启测试过程中服务器掉电的诊断方法及系统
CN111210864A (zh) Ddr芯片测试方法、装置、设备和计算机可读存储介质
CN111190755A (zh) 应用程序的功能异常处理方法及装置
CN111737064A (zh) 一种bmc系统控制方法、装置、存储介质和计算机设备
CN108763005B (zh) 一种内存ecc故障报错方法及系统
CN114510381A (zh) 故障注入方法、装置、设备和存储介质
CN113257334B (zh) 固态硬盘的测试方法、装置和系统
CN115168146A (zh) 一种异常检测方法和装置
JPH0962626A (ja) 分散処理システムのオンラインテスト方法
CN113553243A (zh) 远端侦错方法
CN112035219A (zh) 一种虚拟机数据访问方法、装置、设备及存储介质
CN115250249B (zh) 一种基于IPv6Ready自动化测试方法、装置、介质及设备
CN113869108B (zh) 一种识别硬盘背板连接的设备的方法及相关装置
CN116431453A (zh) 一种通过bios进行系统故障检测的方法、装置和设备
CN114138574A (zh) 控制器测试方法、装置、服务器和存储介质
CN105700995A (zh) 一种检测服务器入侵开关Intruder有效性的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant