CN110377490A - 一种简化服务器硬盘诊断提示的系统及方法 - Google Patents

一种简化服务器硬盘诊断提示的系统及方法 Download PDF

Info

Publication number
CN110377490A
CN110377490A CN201910546940.3A CN201910546940A CN110377490A CN 110377490 A CN110377490 A CN 110377490A CN 201910546940 A CN201910546940 A CN 201910546940A CN 110377490 A CN110377490 A CN 110377490A
Authority
CN
China
Prior art keywords
bmc
gpio
deserializer
post
hard disc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910546940.3A
Other languages
English (en)
Inventor
骆健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910546940.3A priority Critical patent/CN110377490A/zh
Publication of CN110377490A publication Critical patent/CN110377490A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/321Display for diagnostics, e.g. diagnostic result display, self-test user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明提出了一种简化服务器硬盘诊断提示的系统及方法,该系统包括BMC、PCH、串并转换器、多路选择器和硬盘;BMC对硬盘的数据收集、事件记录和错误诊断;PCH用于诊断以及获取硬盘的运行参数;串并转换器将硬盘的状态转换成并行数据;MUX将串并转换器输出的信号切换到POST LED;其中,BMC与PCH无线通信;BMC通过SCPIO与串并转换器输入端相连;其输出端与MUX相连;BMC也通过GPIO与MUX相连;MUX分别与POST LED和硬盘指示灯相连。基于本发明提出的系统,还提出了简化服务器硬盘诊断提示的方法,本发明降低了成本,减少了传输链路,加强了系统维护方便性和客户使用的简单性。

Description

一种简化服务器硬盘诊断提示的系统及方法
技术领域
本发明属于服务器诊断的技术领域,特别涉及一种简化服务器硬盘诊断提示的系统及方法。
背景技术
服务器系统中硬盘故障是比较常见的现象,系统管理员需要根据硬盘故障的信息做出相应的故障修复方案,如系统降级,硬盘替换等。
如图1给出现有技术中传统的服务器硬盘诊断提示的架构图。BMC(BaseboardManagement Controller,基板管理控制器),通过内置的FW(固件)和散布在基板,系统板和机箱的传感器(sensor)实现对服务器的数据收集,事件记录,错误诊断,故障排除等管理功能。目前BMC会收集SDR,SEL,黑盒日志,CPU寄存器日志等。BMC对硬盘的诊断包括硬盘状态记录在位,故障,重建。HSBP(HOT Swap Back Panel热插入背板),提供硬盘热插入功能的背板。PCH(Platform Control Hub)提供SATA和SAS控制器的芯片。传统的架构中由PCH监控到HDD的状况,比如failed或者rebuild,然后将所有HDD的健康状况的信息进行编码,以串行数据的方式透过SGPIO传输给背板。运行在背板上的FW抓取SGPIO的数据进行解析后,获取到各HDD的当前状况。BMC通过I2C实时访问HSBP获取各HDD的状况。BMC就是通过这样的途径来监控HDD的状态的。但是此方案有一些缺点,首先,要在HSBP增加一个MCU用于专门处理来自PCH的有关HDD状况的数据,增加成本。其次,PCH和HSBP,HSBP与BMC之间都存在通信链路,增加布线的困难。
发明内容
本发明提出了一种简化服务器硬盘诊断提示的系统及方法,节省PCBA硬件器件,加强了系统维护方便性和客户使用的简单性。
本发明提出了一种简化服务器硬盘诊断提示的系统及方法,包括BMC、PCH、串并转换器、多路选择器和服务器硬盘;
所述BMC通过SCPIO或者GPIO与PCH无线通信;所述BMC通过内置的FW固件和服务器硬盘中的传感器实现对服务器硬盘的数据收集、事件记录、和错误诊断;所述PCH提供硬盘控制器的芯片,用于获取以及诊断所述BMC采集的硬盘对应的运行参数;所述BMC通过SCPIO与串并转换器输入端相连;所述串并转换器输出端与多路选择器相连;所述串并转换器用于将BMC获取的硬盘的状态转换成并行数据;所述多路选择器用于将串并转换器输出的信号切换到POST LED;所述BMC也通过GPIO与所述多路选择器相连;所述多路选择器分别与POST LED和硬盘指示灯相连。
进一步的,所述多路选择器为若干个;
所述串并转换器输出端分别与多路选择器相连;所述BMC也通过GPIO与所述多路选择器相连;所述多路选择器分别与若干个POST LED和若干个硬盘指示灯相连。
进一步的,所述硬盘的状态包括硬盘状态记录在位、硬盘故障和硬盘重建。
一种简化服务器硬盘诊断提示的方法,是基于一种简化服务器硬盘诊断提示的系统实现的,包括以下步骤:
S1:BMC通过内置的FW固件和散布在服务器硬盘中的sensor解析关于硬盘状态的SCPIO信息;
S2:BMC通过PCH中硬盘控制器寄存器得到硬盘状态的SCPIO信息,如果硬盘状态存在变化,则更新硬盘相应的sensor的读值并且记录相应的SEL log;
S3:更新硬盘状态后,将硬盘状态信息进行编码后以串行数据的方式通过SGPIO传输到串并转换器。
进一步的,步骤S3的实现方法为:
在PCH芯片中分配GPIO,所述GPIO作为输入连接到BMC,当BIOS POST开始时,BIOS将所述GPIO设置为1,当所述POST结束时,BIOS将所述GPIO设置为0;
当BMC检测到所述GPIO为1时,BMC将POST CODE的信息通过SGPIO输出到串并转换器,当BMC检测到所述GPIO为0时,BMC获取来自PCH的SGPIO信息,进行解码后,更新各个硬盘状态,产生当前所有硬盘状态串行数据并通过SGPIO输出到串并转换器。
进一步的,步骤S3的实现方法还包括:把BIOS POST状态的GPIO信号作为LED控制MUX的输出控制信号;所述MUX的输出控制信号包括POST LED和硬盘状态。
进一步的,把BIOS POST状态的GPIO信号作为LED控制MUX的输出控制信号的步骤为:
所述GPIO为1时,多路选择器把串并转换器输出的信号切换到POST LED,显示当前系统POST的状态;当所述GPIO为0时,MUX会把串并转换器输出的信号切换到HDD LED,显示当前硬盘状态。
进一步的,当服务器上电,BIOS POST开始,直到服务器交给OS接管,则BIOS POST结束。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
本发明实施例提出了一种简化服务器硬盘诊断提示的系统及方法,该系统包括BMC、PCH、串并转换器、多路选择器和服务器硬盘;BMC通过SCPIO或者GPIO与PCH无线通信;BMC通过内置的FW固件和服务器硬盘中的传感器实现对服务器硬盘的数据收集、事件记录、和错误诊断;PCH提供硬盘控制器的芯片,用于获取以及诊断BMC采集的硬盘对应的运行参数;BMC通过SCPIO与串并转换器输入端相连;串并转换器输出端与多路选择器相连;串并转换器用于将BMC获取的硬盘的状态转换成并行数据;多路选择器用于将串并转换器输出的信号切换到POST LED;BMC也通过GPIO与多路选择器相连;多路选择器分别与POST LED和硬盘指示灯相连。基于本发明提出的一种简化服务器硬盘诊断提示的系统,还提出了一种简化服务器硬盘诊断提示的方法,BMC通过内置的FW固件和散布在服务器硬盘中的sensor解析关于硬盘状态的SCPIO信息;BMC通过PCH中硬盘控制器寄存器得到硬盘状态的SCPIO信息,如果硬盘状态存在变化,则更新硬盘相应的sensor的读值并且记录相应的SEL log;更新硬盘状态后,将硬盘状态信息进行编码后以串行数据的方式通过SGPIO传输到串并转换器。在PCH芯片中分配GPIO,GPIO作为输入连接到BMC,当BIOS POST开始时,BIOS将GPIO设置为1,当POST结束时,BIOS将GPIO设置为0;当BMC检测到GPIO为1时,BMC将POST CODE的信息通过SGPIO输出到串并转换器,当BMC检测到GPIO为0时,BMC获取来自PCH的SGPIO信息,进行解码后,更新各个硬盘状态,产生当前所有硬盘状态串行数据并通过SGPIO输出到串并转换器。本发明在传统的服务器诊断架构的基础上,把HSBP上的MCU去掉,将解析来自PCH的关于HDD状况的SGPIO信息的工作交由BMC的一个专门的线程来负责,降低了成本,也减少了传输链路,加强了系统维护方便性和客户使用的简单性。
附图说明
附图1是现有技术中传统的服务器硬盘诊断提示的架构图;
附图2是本发明实施例1提出的一种简化服务器硬盘诊断提示的系统架构图;
附图3是本发明实施例1提出的一种简化服务器硬盘诊断提示的方法流程图;
附图4是本发明实施例1提出的一种简化服务器硬盘诊断提示的系统硬盘诊断示例波形图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
实施例1
本发明实施例1提出了一种简化服务器硬盘诊断提示的系统及方法,该系统包括BMC、PCH、串并转换器、多路选择器和服务器硬盘;
BMC通过SCPIO或者GPIO与PCH无线通信;BMC通过内置的FW固件和服务器硬盘中的传感器实现对服务器硬盘的数据收集、事件记录、和错误诊断;PCH提供硬盘控制器的芯片,用于获取以及诊断BMC采集的硬盘对应的运行参数;BMC通过SCPIO与串并转换器输入端相连;串并转换器输出端与多路选择器相连;串并转换器用于将BMC获取的硬盘的状态转换成并行数据;多路选择器用于将串并转换器输出的信号切换到POST LED;BMC也通过GPIO与多路选择器相连;多路选择器分别与POST LED和硬盘指示灯相连。
如图2给出本发明实施例1提出的一种简化服务器硬盘诊断提示的系统架构图;
其中多路选择器可以为1个或者若干个,串并转换器输出端分别与多路选择器相连;BMC也通过GPIO与多路选择器相连;多路选择器分别与若干个POST LED和若干个硬盘指示灯相连。
其中对于硬盘的诊断,硬盘的状态包括硬盘状态记录在位、硬盘故障和硬盘重建等。
基于本发明提出的一种简化服务器硬盘诊断提示的系统,还提出了一种简化服务器硬盘诊断提示的方法,包括以下步骤:
S1:BMC通过内置的FW固件和散布在服务器硬盘中的sensor解析关于硬盘状态的SCPIO信息;
S2:BMC通过PCH中硬盘控制器寄存器得到硬盘状态的SCPIO信息,如果硬盘状态存在变化,则更新硬盘相应的sensor的读值并且记录相应的SEL log;
S3:更新硬盘状态后,将硬盘状态信息进行编码后以串行数据的方式通过SGPIO传输到串并转换器。
由于系统post LED的状态是由BMC通过SGPIO输出到串并转换器转换为并行数据后来控制各post LED的。鉴于post LED只有在系统post的过程中才是有效的而HDD的状态只有在系统post完之后才有用。出于节约器件节约PCB空间和节约成本的考虑,可以将BMC输出的HDD状态信息和POST code信息共享一个SGPIO借口和串并转换器。所以步骤S3的实现方法为:在PCH芯片中分配GPIO,GPIO作为输入连接到BMC,当BIOS POST开始时,BIOS将GPIO设置为1,当POST结束时,BIOS将GPIO设置为0;当BMC检测到GPIO为1时,BMC将POSTCODE的信息通过SGPIO输出到串并转换器,当BMC检测到GPIO为0时,BMC获取来自PCH的SGPIO信息,进行解码后,更新各个硬盘状态,产生当前所有硬盘状态串行数据并通过SGPIO输出到串并转换器。
步骤S3的实现方法还包括:把BIOS POST状态的GPIO信号作为LED控制MUX的输出控制信号;MUX的输出控制信号包括POST LED和硬盘状态。GPIO为1时,多路选择器把串并转换器输出的信号切换到POST LED,显示当前系统POST的状态;当GPIO为0时,MUX会把串并转换器输出的信号切换到HDD LED,显示当前硬盘状态。
当服务器上电,BIOS POST开始,直到服务器交给OS接管,则BIOS POST结束。
附图3所示为本发明实施例1提出的一种简化服务器硬盘诊断提示的方法流程图;
在步骤S301中,BMC通过内置的FW固件和散布在服务器硬盘中的sensor解析关于硬盘状态的SCPIO信息。
在步骤S302中,BMC通过PCH中硬盘控制器寄存器得到硬盘状态的SCPIO信息,如果硬盘状态存在变化,则更新硬盘相应的sensor的读值并且记录相应的SEL log。
在步骤S303中,更新硬盘状态后,将硬盘状态信息进行编码后以串行数据的方式通过SGPIO传输到串并转换器;同时把BIOS POST状态的GPIO信号作为LED控制MUX的输出控制信号。
本发明中以三个HDD为例说BMC对来自PCH的SGPIO译码和产生HDD状态串行数据通过另一个SGPIO接口输出到串并转换器过程。本发明保护的范围不局限于此。附图4所示为本发明实施例1提出的一种简化服务器硬盘诊断提示的系统硬盘诊断示例波形图。首先,load信号的下降沿表示一个资料帧的开始,一个资料帧表示的是当前时刻各HDD的状态。Data表示的是各HDD的状态,每个HDD占用三个clock,若第1个clock,data为高则说明该HDD存在,若第2个clock data为高,则说明该HDD存在failure,若第2和第3两个clock内data都为高,则说明该HDD正在rebuild。
以上内容仅仅是对本发明的结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (8)

1.一种简化服务器硬盘诊断提示的系统,其特征在于,包括BMC、PCH、串并转换器、多路选择器和服务器硬盘;
所述BMC通过SCPIO或者GPIO与PCH无线通信;所述BMC通过内置的FW固件和服务器硬盘中的传感器实现对服务器硬盘的数据收集、事件记录、和错误诊断;所述PCH提供硬盘控制器的芯片,用于获取以及诊断所述BMC采集的硬盘对应的运行参数;所述BMC通过SCPIO与串并转换器输入端相连;所述串并转换器输出端与多路选择器相连;所述串并转换器用于将BMC获取的硬盘的状态转换成并行数据;所述多路选择器用于将串并转换器输出的信号切换到POST LED;所述BMC也通过GPIO与所述多路选择器相连;所述多路选择器分别与POSTLED和硬盘指示灯相连。
2.根据权利要求1所述的一种简化服务器硬盘诊断提示的系统,其特征在于,所述多路选择器为若干个;
所述串并转换器输出端分别与多路选择器相连;所述BMC也通过GPIO与所述多路选择器相连;所述多路选择器分别与若干个POST LED和若干个硬盘指示灯相连。
3.根据权利要求1或2所述的一种简化服务器硬盘诊断提示的系统,其特征在于,所述硬盘的状态包括硬盘状态记录在位、硬盘故障和硬盘重建。
4.一种简化服务器硬盘诊断提示的方法,是基于权利要求1至3任意一项所述的一种简化服务器硬盘诊断提示的系统实现的,其特征在于,包括以下步骤:
S1:BMC通过内置的FW固件和散布在服务器硬盘中的sensor解析关于硬盘状态的SCPIO信息;
S2:BMC通过PCH中硬盘控制器寄存器得到硬盘状态的SCPIO信息,如果硬盘状态存在变化,则更新硬盘相应的sensor的读值并且记录相应的SEL log;
S3:更新硬盘状态后,将硬盘状态信息进行编码后以串行数据的方式通过SGPIO传输到串并转换器。
5.根据权利要求4所述的一种简化服务器硬盘诊断提示的方法,其特征在于,步骤S3的实现方法为:
在PCH芯片中分配GPIO,所述GPIO作为输入连接到BMC,当BIOS POST开始时,BIOS将所述GPIO设置为1,当所述POST结束时,BIOS将所述GPIO设置为0;
当BMC检测到所述GPIO为1时,BMC将POST CODE的信息通过SGPIO输出到串并转换器,当BMC检测到所述GPIO为0时,BMC获取来自PCH的SGPIO信息,进行解码后,更新各个硬盘状态,产生当前所有硬盘状态串行数据并通过SGPIO输出到串并转换器。
6.根据权利要求5所述的一种简化服务器硬盘诊断提示的方法,其特征在于,步骤S3的实现方法还包括:把BIOS POST状态的GPIO信号作为LED控制MUX的输出控制信号;所述MUX的输出控制信号包括POST LED和硬盘状态。
7.根据权利要求6所述的一种简化服务器硬盘诊断提示的方法,其特征在于,把BIOSPOST状态的GPIO信号作为LED控制MUX的输出控制信号的步骤为:
所述GPIO为1时,多路选择器把串并转换器输出的信号切换到POST LED,显示当前系统POST的状态;当所述GPIO为0时,MUX会把串并转换器输出的信号切换到HDD LED,显示当前硬盘状态。
8.根据权利要求5所述的一种简化服务器硬盘诊断提示的方法,其特征在于,当服务器上电,BIOS POST开始,直到服务器交给OS接管,则BIOS POST结束。
CN201910546940.3A 2019-06-24 2019-06-24 一种简化服务器硬盘诊断提示的系统及方法 Withdrawn CN110377490A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910546940.3A CN110377490A (zh) 2019-06-24 2019-06-24 一种简化服务器硬盘诊断提示的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910546940.3A CN110377490A (zh) 2019-06-24 2019-06-24 一种简化服务器硬盘诊断提示的系统及方法

Publications (1)

Publication Number Publication Date
CN110377490A true CN110377490A (zh) 2019-10-25

Family

ID=68250594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910546940.3A Withdrawn CN110377490A (zh) 2019-06-24 2019-06-24 一种简化服务器硬盘诊断提示的系统及方法

Country Status (1)

Country Link
CN (1) CN110377490A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767174A (zh) * 2020-06-30 2020-10-13 西安易朴通讯技术有限公司 一种bios刷新控制方法及服务器、存储介质
CN111949431A (zh) * 2020-08-27 2020-11-17 英业达科技有限公司 片上系统产品的致命错误提供方法与致命错误识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767174A (zh) * 2020-06-30 2020-10-13 西安易朴通讯技术有限公司 一种bios刷新控制方法及服务器、存储介质
CN111949431A (zh) * 2020-08-27 2020-11-17 英业达科技有限公司 片上系统产品的致命错误提供方法与致命错误识别方法

Similar Documents

Publication Publication Date Title
CN107832199A (zh) 基于cpld的硬盘监控系统
CN110377142A (zh) 一种支持服务器硬盘独立上下电的系统及方法
US20160147540A1 (en) Server system
CN106970866A (zh) 一种磁盘监控系统及方法
CN105955898A (zh) 一种兼容SAS硬盘与NVMe硬盘的硬盘背板
CN110377490A (zh) 一种简化服务器硬盘诊断提示的系统及方法
US9208047B2 (en) Device hardware agent
US7836349B2 (en) Storage control device and enclosure-unit power control method
CN100388140C (zh) 列车驾驶信息显示装置及其方法
CN105573895B (zh) 一种基于双控储存的硬盘指示灯设计方法
CN1598755A (zh) 磁盘驱动器组子系统及用于其中的外部模拟控制器
CN106354610A (zh) 伺服器系统及其操作方法
MX2014001056A (es) Método y sistema para construir un sistema informatico de baja potencia.
CN101727128B (zh) 服务器
CN108021493A (zh) 一种简化的控制硬盘指示灯的系统及方法
CN101937381B (zh) 一种sas背板上sgpio信号的测试方法
WO2021017232A1 (zh) 一种灵活调配且易于cpld管理背板的方法与系统
CN107622002A (zh) 一种兼容nvme硬盘的服务器硬盘指示灯设计系统及方法
US8095820B2 (en) Storage system and control methods for the same
CN109117342A (zh) 一种服务器及其硬盘健康状态监测系统
CN108845763A (zh) 一种可集中管理硬盘状态的系统及方法
CN202721755U (zh) 高清数字硬盘录像机音视频编解码核心板
CN101163308B (zh) 智能平台管理控制器
CN108776635A (zh) 一种背板硬盘点灯系统及方法
CN102376338A (zh) 硬盘模块

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20191025

WW01 Invention patent application withdrawn after publication