CN115016996A - 硬盘状态检测方法、系统、复杂可编程逻辑器件及服务器 - Google Patents
硬盘状态检测方法、系统、复杂可编程逻辑器件及服务器 Download PDFInfo
- Publication number
- CN115016996A CN115016996A CN202210764034.2A CN202210764034A CN115016996A CN 115016996 A CN115016996 A CN 115016996A CN 202210764034 A CN202210764034 A CN 202210764034A CN 115016996 A CN115016996 A CN 115016996A
- Authority
- CN
- China
- Prior art keywords
- hard disk
- state
- register
- programmable logic
- logic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 38
- 238000012544 monitoring process Methods 0.000 claims description 11
- 238000000034 method Methods 0.000 claims description 6
- 238000007726 management method Methods 0.000 description 13
- 239000000758 substrate Substances 0.000 description 8
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2205—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
- G06F11/2221—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test input/output devices or peripheral units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2205—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
- G06F11/221—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test buses, lines or interfaces, e.g. stuck-at or open line faults
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2273—Test methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2284—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by power-on test, e.g. power-on self test [POST]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供了一种硬盘状态检测方法、系统、复杂可编程逻辑器件及服务器,硬盘状态检测方法中,侦测到系统带盘上电时,复杂可编程逻辑器件接收、解析PCIe Switch发出的第一通知数据并将其存储在第一寄存器,过滤在第一时长PCIe Switch发出其他数据或多次发出第一通知数据而对第一寄存器产生其他操作或刷新,计时结束后恢复第一寄存器写入数据并监控第一寄存器的刷新状态,产生刷新时将第一通知数据与预设数据进行比对,比对结果一致时接收并锁存状态信号,根据状态信号判断硬盘的状态。通过复杂可编程逻辑器件结合第一通知数据和硬盘的状态信号对硬盘状态进行判断,实现系统带盘上电时对硬盘状态进行检测,防止工况过差无法完成轮询导致无法对硬盘状态进行检测。
Description
技术领域
本发明涉及硬盘状态检测技术领域,尤其涉及一种硬盘状态检测方法、系统、复杂可编程逻辑器件及服务器。
背景技术
目前在服务器或存储领域,为了提高数据传输速率,各大厂家纷纷布局PCIeSwitch架构,PCIe Switch技术已经被广泛应用在传统存储系统、服务器平台等。硬盘是存储系统中主要的存储媒介,硬盘相当于计算机的仓库,操作系统、安装的软件、文档、资料等都存储在硬盘中,软件的运行也是把数据先调入内存,CPU和内存进行交互,最后的结果放入硬盘中。因此,硬盘是存储系统中的重要硬件之一,需要对硬盘故障进行快速发现及定位,以防止影响存储系统工作。
但是基于PCIe Switch架构的PCIe链路中,系统上电时,主机先对EP设备发起侦测动作,然后HOST端对PCIe设备进行轮询扫描及后续动作,对于存在不同工况的硬盘,HOST端难以对硬盘的状态报告全面,当无法完成侦测时,HOST端无法感知EP设备,驱动也无法下发数据流对硬盘状态进行报告,因此,针对系统上电时工况差到无法完成侦测的情况下,如何对硬盘的状态进行检测及报告是本领域技术人员亟需解决的技术问题。
发明内容
本发明的目的在于提供一种硬盘状态检测方法、系统、复杂可编程逻辑器件及服务器,能够在系统上电时对硬盘进行状态检测。
为了实现上述目的,本发明提供了一种硬盘状态检测方法,用于对基于PCIeSwitch的系统上电时的硬盘状态进行检测,所述硬盘状态检测方法由复杂可编程逻辑器件执行,所述复杂可编程逻辑器件包括第一寄存器,所述硬盘状态检测方法包括:
侦测到系统上电;
接收PCIe Switch发出的第一通知数据,对所述第一通知数据进行解析并存储于第一寄存器,所述第一通知数据代表系统上电和解复位;
在预设第一时长停止所述第一寄存器写入数据;
在所述第一时长结束后,恢复所述第一寄存器写入数据并监控所述第一寄存器的刷新状态;
当监控到所述第一寄存器产生刷新时,将所述第一通知数据与预设数据进行比对,若比对结果一致,接收并锁存硬盘的状态信号;
根据所述状态信号判断硬盘的状态。
可选的,所述复杂可编程逻辑器件还包括第二寄存器,所述侦测到系统带盘上电包括:
接收上电信号和表示硬盘在位的硬盘在位信号,根据所述上电信号和所述硬盘在位信号,刷新并锁存所述第二寄存器内的状态码,该状态码表示系统带盘上电。
可选的,当所述第一通知数据与预设数据比对结果一致时,在预设第二时长接收并锁存硬盘的所述状态信号。
可选的,所述复杂可编程逻辑器件还包括故障标记寄存器,根据所述状态信号判断硬盘为故障状态时,将硬盘故障状态信息存储至所述故障标记寄存器。
可选的,所述复杂可编程逻辑器件分别连接基板管理控制器和状态指示模块,所述硬盘状态检测方法还包括:
将所述故障状态信息发送至所述基板管理控制器;
接收所述基板管理控制器根据所述故障状态信息发出的控制信号;
根据所述控制信号控制所述状态指示模块对硬盘的故障状态进行显示。
为了实现上述目的,本发明还提供了一种复杂可编程逻辑器件,包括:
侦测模块,用于侦测系统带盘上电;
接收模块和第一寄存器,所述接收模块与PCIe Switch连接,用于接收PCIeSwitch发出的第一通知数据,对所述第一通知数据进行解析并存储于所述第一寄存器,所述第一通知数据代表系统上电和解复位;
定时器,所述定时器用于设定第一时长进行计时,在所述第一时长停止所述第一寄存器写入数据,在所述第一时长结束后,恢复所述第一寄存器写入数据;
监控模块,所述监控模块用于恢复所述第一寄存器写入数据后监控监控所述第一寄存器的刷新状态;
比对模块,所述比对模块用于当监控到所述第一寄存器产生刷新时,将所述第一通知数据与预设数据进行比对;
状态判断模块,所述状态判断模块用于接收并锁存硬盘的状态信号,并根据所述状态信号判断硬盘的状态。
可选的,所述复杂可编程逻辑器件还包括第二寄存器,所述接收模块还用于接收上电信号和表示硬盘在位的硬盘在位信号,根据所述上电信号和所述硬盘在位信号,刷新并锁存所述第二寄存器内的状态码,所述状态码表示系统带盘上电。
可选的,所述复杂可编程逻辑器件还包括故障标记寄存器,所述状态判断模块根据所述状态信号判断硬盘为故障状态时,将硬盘故障状态信息存储至所述故障标记寄存器。
为了实现上述目的,本发明还提供了一种硬盘状态检测系统,包括如前所述的复杂可编程逻辑器件、基板管理控制器和状态指示模块,所述基板管理控制器用于接收所述复杂可编程逻辑器件发出的硬盘故障状态信息并根据硬盘故障状态信息发出控制信号;
所述复杂可编程逻辑器件根据所述控制信号控制所述状态指示模块对硬盘的故障状态进行显示。
为了实现上述目的,本发明还提供了一种服务器,包括主机、PCIe Switch、多个硬盘以及如前所述的硬盘状态检测系统,所述主机与所述PCIe Switch连接,所述PCIeSwitch与所述复杂可编程逻辑器件连接,多个所述硬盘与所述PCIe Switch连接。
本发明的硬盘状态检测方法中,侦测到系统带盘上电时,复杂可编程逻辑器件接收PCIe Switch发出的第一通知数据并对第一通知数据进行解析以并存储于第一寄存器,解析完成后,利用定时器设定第一时长进行计时,在第一时长停止第一寄存器写入数据,以过滤在第一时长内PCIe Switch发出其他数据或多次发出第一通知数据而对第一寄存器产生其他操作或刷新,计时结束后,复杂可编程逻辑器件恢复第一寄存器写入数据并监控第一寄存器的刷新状态,当第一寄存器产生刷新时,将第一通知数据与预设数据进行比对,若比对结果一致,说明系统上电完成开机,主机通过PCIe Switch对硬盘进行读写操作使硬盘状态信号产生跳动,复杂可编程逻辑器件接收并锁存硬盘的状态信号,并根据锁存的状态信号判断硬盘的状态。通过复杂可编程逻辑器件对PCIe Switch下发的第一通知数据进行解析,结合PCIe Switch下发的第一通知数据、硬盘的状态信号对硬盘状态进行判断,实现在系统带盘上电时对硬盘状态进行检测,防止工况过差无法完成轮询以至于无法对硬盘状态进行检测及报告。
附图说明
图1是本发明实施例硬盘状态检测方法的流程图。
图2是本发明实施例硬盘状态检测方法的部分流程图
图3是本发明实施例服务器的模块图。
图4是本发明实施例复杂可编程逻辑器件的模块图。
具体实施方式
为了详细说明本发明的技术内容、构造特征、实现的效果,以下结合实施方式并配合附图详予说明。
如图1所示,本发明实施例公开了一种硬盘状态检测方法,用于对基于PCIeSwitch的系统上电时的硬盘状态进行检测,硬盘状态检测方法由复杂可编程逻辑器件(CPLD)执行,复杂可编程逻辑器件包括第一寄存器,硬盘状态检测方法包括:
S110、侦测到系统带盘上电。
本发明实施例中,系统带盘上电是指“系统上电前,硬盘已插入槽位中”,复杂可编程逻辑器件通过接收上电信号和表示硬盘在位的硬盘在位信号,根据上电信号和表示硬盘在位的硬盘在位信号,刷新并锁存复杂可编程逻辑器件的第二寄存器内的状态码,该状态码表示系统带盘上电。
当硬盘在位信号表示硬盘在位时,产生PERST信号或PWREN信号(也就是上电信号)的有效边沿(比如上升沿或下降沿)时,系统带盘上电,便于复杂可编程逻辑器件判断系统是否带盘上电。
可以理解的是,硬盘在位信号可以表示硬盘在位,也可以表示硬盘不在位,比如,当硬盘在位信号为“1”时,表示硬盘在位,当硬盘在位信号为“0”时,表示硬盘不在位。同样地,第二寄存器中的状态码可以表示系统带盘上电或空闲状态,比如,当状态码为“00”时表示系统空闲状态(可以是系统下电、未上电、拔盘或无盘上电),当状态码为“01”时表示系统带盘上电。当复杂可编程逻辑器件接收到上电信号和表示硬盘在位的硬盘在位信号时,可以将第二寄存器内的状态码由“00”刷新为“01”并将状态码“01”进行锁存。
S120、接收PCIe Switch发出的第一通知数据,对第一通知数据进行解析并将第一通知数据存储于第一寄存器,第一通知数据代表系统上电和解复位。
本发明实施例中,根据PCIe Switch的特性,上电后,PCIe Switch会通过对与复杂可编程逻辑器件连接的SHP接口对复杂可编程逻辑器件的IO Expand接口进行扫描,首先获取对应槽位的硬盘在位信号,若硬盘在位,则确认对应IO Expand接口的配置信息与预设的配置信息是否一致,当配置信息与预设配置信息一致时,则PCIe Switch会向复杂可编程逻辑器件下发一些数据,最终稳定到一个数据,该数据即为第一通知数据,PCIe Switch下发第一通知数据后,暂时停止向复杂可编程逻辑器件发送数据。一般来说,系统在上电时,由于UPI/MEM等设备的初始化,系统的CPU可能会主动进行热插拔动作,此时,系统会跳转到初始状态,复杂可编程逻辑器件中存储的数据清零,待再次上电时再重新从步骤S110开始执行对硬盘状态的检测。可以理解的是,第一通知数据可以是数据码,比如第一通知数据是0x16时代表系统上电和系统解复位。
S130、在预设第一时长停止第一寄存器写入数据。
S140、在第一时长结束后,恢复第一寄存器写入数据并监控第一寄存器的刷新状态。
在以第一时长进行计时的过程中,PCIe Switch下发的数据在上电时连续复位会发出除第一通知数据之外的其他数据或多次发出第一通知数据,通过在第一时长停止第一寄存器写入数据,能够过滤此过程内PCIe Switch发出的其他数据或多次发出第一通知数据而产生对第一寄存器的其他操作或刷新。以第一时长计时结束后,PCIe Switch不再发出会对第一寄存器产生其他操作或刷新的操作的数据,直至系统上电完成开机后,才会产生对第一寄存器的刷新,因此,在第一时长计时结束后,复杂可编程逻辑器件恢复第一寄存器写入数据并对第一寄存器的刷新状态进行监控。其中,第一时长可以设置为20S、15S等,第一时长根据系统性能进行设置。
可以理解的是,步骤S130中,“在第一时长停止第一寄存器写入数据”可以是复杂可编程逻辑器件接收PCIe Switch下发的数据,但不对数据进行处理也不写入第一寄存器;也可以是复杂可编程逻辑器件暂停接收PCIe Switch下发的数据,从而不会对第一寄存器写入数据。
S150、当监控到第一寄存器产生刷新时,将第一通知数据与预设数据进行比对,若比对结果一致,接收并锁存硬盘的状态信号(active信号)。
需要说明的是,预设数据为系统上电和解复位对应的数据码,通过比对第一通知数据是否和预设数据相同判断系统是否上电完成开机,比如若预设数据为0x16,通过比对第一通知数据是否为0x16判断系统是否上电完成开机。当系统上电完成开机后,主机会通过PCIe Switch和硬盘之间产生数据交互,PCIe Switch会对硬盘产生读写操作,当硬盘正常时,对硬盘的读写操作会使得硬盘的状态信号产生跳动,复杂可编程逻辑器件对第一通知数据和预设数据进行比对的比对结果是一致时,复杂可编程逻辑器件获知系统已上电完成开机,即可接收硬盘的状态信号。实际上,监控到第一寄存器产生刷新时,系统上电完成开机,但为了确保第一寄存器产生的刷新是在系统上电完成开机后产生的,对第一通知数据和预设数据进行比对以确保系统是完成开机后第一寄存器才产生刷新。
需要说明的是,本发明实施例中,并非是复杂可编程逻辑器件比对出第一通知数据与预设数据一致时,PCIe Switch才对硬盘产生读写操作使硬盘状态信号产生跳动,而是系统上电完成开机的情况下,PCIe Switch就会和硬盘进行数据交互而产生读写操作,而系统上电完成开机,第一通知数据会和预设数据一致,因此,复杂可编程逻辑器件通过对比第一通知数据和对比数据是否一致获知系统是否上电完成开机。
可以理解的是,复杂可编程逻辑器件还可以包括数据缓存器,当复杂可编程逻辑器件监控到第一寄存器产生刷新时,可以将第一寄存器中存储的第一通知数据存入数据缓存器中,将数据缓冲器中存储的第一通知数据与预设数据进行比对。
S160、根据状态信号判断硬盘的状态。
对锁存的状态信号进行分析判断,当状态信号具有跳动时,认为该硬盘正常工作,当状态信号无跳动时,则认为该硬盘异常。其中,状态信号的跳动可以是信号由高电平跳变为低电平或由低电平跳变为高电平,比如,状态信号具有由“1”跳变到“0”或由“0”跳变到“1”的跳动。
本发明实施例的硬盘状态检测方法中,侦测到系统带盘上电时,复杂可编程逻辑器件接收PCIe Switch发出的第一通知数据并对第一通知数据进行解析以并存储于第一寄存器,解析完成后,利用定时器设定第一时长进行计时,在第一时长内停止第一寄存器写入数据,以过滤在第一时长PCIe Switch发出其他数据或多次发出第一通知数据而对第一寄存器产生其他操作或刷新,计时结束后,复杂可编程逻辑器件恢复第一寄存器写入数据并监控第一寄存器的刷新状态,当第一寄存器产生刷新时,将第一通知数据与预设数据进行比对,若比对结果一致,说明系统上电完成开机,主机通过PCIe Switch对硬盘进行读写操作使硬盘状态信号产生跳动,复杂可编程逻辑器件接收并锁存硬盘的状态信号,并根据锁存的状态信号判断硬盘的状态。通过复杂可编程逻辑器件对PCIe Switch下发的第一通知数据进行解析,结合PCIe Switch下发的第一通知数据、硬盘的状态信号对硬盘状态进行判断,实现在系统带盘上电时对硬盘状态进行检测,防止工况过差无法完成轮询以至于无法对硬盘状态进行检测及报告。
需要说明的是,上述系统指的是服务器系统、存储系统、计算机系统等需要设置硬盘进行数据存储的系统;系统上电开机时,PCIe Switch的HOST端会产生三次重启,每次重启后将相关的所有数据(如第一通知数据、状态信号)清除,重新从步骤S110开始进行硬盘状态检测,当重启间隔大于第一时长时,第一时长计时结束会进入步骤S140对第一寄存器的刷新状态进行监控,由于经过第一时长后,PCIe Switch不再发出会对第一寄存器产生其他操作或刷新的操作的数据,而经过第一时长需要系统上电完成开机后(也就是经过了三次重启后)才会对第一寄存器产生刷新,因此,即使重启间隔大于第一时长也不会执行后续步骤。
在一些具体的示例中,为了方便锁存和判断状态信号,防止接收状态信号时间过长,可以在第一通知数据和预设数据比对结果一致后,在预设第二时长接收并锁存硬盘的状态信号,根据在第二时长锁存的状态信号对硬盘状态进行判断。
为了方便技术人员获取硬盘的故障情况,复杂可编程逻辑器件还可以包括故障标记寄存器,根据状态信号判断硬盘为故障状态时,将硬盘故障状态信息存储至故障标记寄存器,从而将硬盘的故障状态信息进行保存。
可以理解的是,故障标记寄存器不限于存储硬盘的故障状态信息,也可以存储硬盘的正常状态信息,比如,故障标记寄存器可以存储硬盘的状态信号,状态信号可以通过设置不同的数据代码表示硬盘的不同状态,根据检测的硬盘状态,将对应的数据代码存入故障标记寄存器中,当需要获取硬盘故障状态时,即可从故障标记寄存器中读取该数据代码,根据该数据代码得出硬盘的状态。
如图2所示,为了方便工作人员及时获取硬盘的状态,复杂可编程逻辑器件分别连接基板管理控制器(BMC)和状态指示模块,硬盘状态检测方法还包括:
S170、将硬盘的故障状态信息发送至基板管理控制器。
为了及时收到硬盘的故障信息,可以将存储硬盘故障状态信息的故障标记寄存器开放给基板管理控制器,当有硬盘产生故障时,基板管理控制器可以及时获取故障信息。
S180、接收基板管理控制器根据故障状态信息发出的控制信号。
S190、根据控制信号控制状态指示模块对硬盘的故障状态进行显示。
通过控制信号控制状态指示模块对硬盘的故障状态进行指示,工作人员查看状态指示模块即可获知硬盘是否产生故障,从而能够及时对故障进行处理。在具体的示例中,状态指示模块可以是LED灯,每一硬盘可以对应一LED灯,LED灯根据控制信号进行亮灭以指示硬盘的状态,比如,控制信号可以与状态信号相同,使得LED灯根据状态信号闪烁,当硬盘正常时,状态信号会产生跳动,LED灯根据状态信号进行闪烁;当硬盘异常时,状态信号不产生跳动,LED灯根据状态信号常亮或常灭。当然,本发明实施例的状态指示模块不限于上述LED灯,也可以是其他具有指示作用的器件,比如显示器等等,能够根据控制信号将硬盘的状态进行显示即可。
请参阅图3和图4,本发明实施例还提供了一种复杂可编程逻辑器件10,包括侦测模块11、接收模块12、第一寄存器13、定时器14、监控模块15、比对模块16和状态判断模块17,侦测模块11用于侦测系统带盘上电;接收模块12与PCIe Switch连接,用于接收PCIeSwitch发出的第一通知数据,对第一通知数据进行解析并存储于第一寄存器13,第一通知数据代表系统上电和解复位;定时器14用于设定第一时长进行计时,在第一时长停止所述第一寄存器13写入数据,在第一时长结束后,恢复第一寄存器13写入数据;监控模块15用于恢复第一寄存器13写入数据后监控第一寄存器13的刷新状态;比对模块16用于当监控到第一寄存器13产生刷新时,将第一通知数据与预设数据进行比对;状态判断模块17用于接收并锁存硬盘的状态信号,并根据状态信号判断硬盘的状态。
进一步地,为了方便锁存和判断状态信号,防止接收状态信号时间过长,可以在第一通知数据和预设数据比对结果一致后,利用定时器设定第二时长进行计时,在第二时长接收并锁存硬盘的状态信号,根据在第二时长锁存的状态信号对硬盘状态进行判断。
需要说明的是,可以利用同一定时器14的复用分别设定第一时长和第二时长进行计时;定时器14也可以包括第一定时器和第二定时器,第一定时器设定第一时长进行计时,第二定时器设定第二时长进行计时。
可以理解的是,本发明实施例中复杂可编程逻辑器件10中的各个模块可以是电子硬件、计算机程序或二者的结合。第一寄存器13可以是集成于复杂可编程逻辑器件10中的PCA9555芯片。
在一些具体的示例中,复杂可编程逻辑器件10还包括第二寄存器(图未示),接收模块11还用于接收上电信号和表示硬盘在位的硬盘在位信号,根据上电信号和表示硬盘在位的硬盘在位信号,刷新并锁存第二寄存器内的状态码,该状态码表示系统带盘上电,方便复杂可编程逻辑器件10判断系统是否带盘上电。
为了方便技术人员获取硬盘的故障情况,复杂可编程逻辑器件10还包括故障标记寄存器,状态判断模块17根据状态信号判断硬盘为故障状态时,将硬盘故障状态信息存储至故障标记寄存器。
如图3所示,为了方便工作人员及时获取硬盘状态,本发明实施例还提供了一种硬盘状态检测系统1,包括如前所述的复杂可编程逻辑器件10、基板管理控制器20和状态指示模块30,基板管理控制器20用于接收复杂可编程逻辑器件10发出的硬盘故障状态信息并根据硬盘故障状态信息发出控制信号;复杂可编程逻辑器件10根据控制信号控制状态指示模块30对硬盘的故障状态进行显示。具体而言,基板管理控制器20可以读取故障标记寄存器中存储的硬盘故障状态信息,从而根据读取的硬盘故障状态信息发出控制信号。
如图3所示,本发明实施例还提供了一种服务器,包括主机2(CPU)、PCIe Switch40、多个硬盘3以及如前所述的硬盘状态检测系统1,主机2与PCIe Switch40连接,PCIeSwitch 40与复杂可编程逻辑器件10连接,多个硬盘3与PCIe Switch 40连接。
可以理解的是,硬盘3可以通过硬盘连接器与PCIe Switch 40连接,硬盘3的部分控制信号(比如上下电信号、在位信号、状态信号等)接口可以与复杂可编程逻辑器件10连接。
以上所揭露的仅为本发明的较佳实例而已,其作用是方便本领域的技术人员理解并据以实施,当然不能以此来限定本发明的之权利范围,因此依本发明的申请专利范围所作的等同变化,仍属于本发明的所涵盖的范围。
Claims (10)
1.一种硬盘状态检测方法,用于对基于PCIe Switch的系统上电时的硬盘状态进行检测,其特征在于,所述硬盘状态检测方法由复杂可编程逻辑器件执行,所述复杂可编程逻辑器件包括第一寄存器,所述硬盘状态检测方法包括:
侦测到系统带盘上电;
接收PCIe Switch发出的第一通知数据,对所述第一通知数据进行解析并存储于第一寄存器,所述第一通知数据代表系统上电和解复位;
在预设第一时长停止所述第一寄存器写入数据;
在所述第一时长结束后,恢复所述第一寄存器写入数据并监控所述第一寄存器的刷新状态;
当监控到所述第一寄存器产生刷新时,将所述第一通知数据与预设数据进行比对,若比对结果一致,接收并锁存硬盘的状态信号;
根据所述状态信号判断硬盘的状态。
2.根据权利要求1所述的硬盘状态检测方法,其特征在于,所述复杂可编程逻辑器件还包括第二寄存器,所述侦测到系统带盘上电包括:
接收上电信号和表示硬盘在位的硬盘在位信号,根据所述上电信号和所述硬盘在位信号,刷新并锁存所述第二寄存器内的状态码,所述状态码表示系统带盘上电。
3.根据权利要求1所述的硬盘状态检测方法,其特征在于,当所述第一通知数据与预设数据比对结果一致时,在预设第二时长接收并锁存硬盘的所述状态信号。
4.根据权利要求1所述的硬盘状态检测方法,其特征在于,所述复杂可编程逻辑器件还包括故障标记寄存器,根据所述状态信号判断硬盘为故障状态时,将所述硬盘故障状态信息存储至所述故障标记寄存器。
5.根据权利要求4所述的硬盘状态检测方法,其特征在于,所述复杂可编程逻辑器件分别连接基板管理控制器和状态指示模块,所述硬盘状态检测方法还包括:
将所述故障状态信息发送至所述基板管理控制器;
接收所述基板管理控制器根据所述故障状态信息发出的控制信号;
根据所述控制信号控制所述状态指示模块对硬盘的故障状态进行显示。
6.一种复杂可编程逻辑器件,其特征在于,包括:
侦测模块,用于侦测系统带盘上电;
接收模块和第一寄存器,所述接收模块与PCIe Switch连接,用于接收PCIe Switch发出的第一通知数据,对所述第一通知数据进行解析并存储于所述第一寄存器,所述第一通知数据代表系统上电和解复位;
定时器,所述定时器用于设定第一时长进行计时,在所述第一时长停止所述第一寄存器写入数据,在所述第一时长结束后,恢复所述第一寄存器写入数据;
监控模块,所述监控模块用于恢复所述第一寄存器写入数据后监控监控所述第一寄存器的刷新状态;
比对模块,所述比对模块用于当监控到所述第一寄存器产生刷新时,将所述第一通知数据与预设数据进行比对;
状态判断模块,所述状态判断模块用于接收并锁存硬盘的状态信号,并根据所述状态信号判断硬盘的状态。
7.根据权利要求6所述的复杂可编程逻辑器件,其特征在于,所述复杂可编程逻辑器件还包括第二寄存器,所述接收模块还用于接收上电信号和表示硬盘在位的硬盘在位信号,根据所述上电信号和所述硬盘在位信号,刷新并锁存所述第二寄存器内的状态码,所述状态码表示系统带盘上电。
8.根据权利要求6所述的复杂可编程逻辑器件,其特征在于,所述复杂可编程逻辑器件还包括故障标记寄存器,所述状态判断模块根据所述状态信号判断硬盘为故障状态时,将硬盘故障状态信息存储至所述故障标记寄存器。
9.一种硬盘状态检测系统,其特征在于,包括权利要求8所述的复杂可编程逻辑器件、基板管理控制器和状态指示模块,所述基板管理控制器用于接收所述复杂可编程逻辑器件发出的硬盘故障状态信息并根据硬盘故障状态信息发出控制信号;
所述复杂可编程逻辑器件根据所述控制信号控制所述状态指示模块对硬盘的故障状态进行显示。
10.一种服务器,其特征在于,包括主机、PCIe Switch、多个硬盘以及如权利要求9所述的硬盘状态检测系统,所述主机与所述PCIe Switch连接,所述PCIe Switch与所述复杂可编程逻辑器件连接,多个所述硬盘与所述PCIe Switch连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210764034.2A CN115016996A (zh) | 2022-06-30 | 2022-06-30 | 硬盘状态检测方法、系统、复杂可编程逻辑器件及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210764034.2A CN115016996A (zh) | 2022-06-30 | 2022-06-30 | 硬盘状态检测方法、系统、复杂可编程逻辑器件及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115016996A true CN115016996A (zh) | 2022-09-06 |
Family
ID=83078430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210764034.2A Pending CN115016996A (zh) | 2022-06-30 | 2022-06-30 | 硬盘状态检测方法、系统、复杂可编程逻辑器件及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115016996A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117806924A (zh) * | 2024-02-29 | 2024-04-02 | 苏州元脑智能科技有限公司 | 一种指示装置的控制方法、装置、服务器及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110055631A1 (en) * | 2009-09-02 | 2011-03-03 | Inventec Corporation | Pluggable error detection board and motherboard error detection system containing the same |
US20160196194A1 (en) * | 2014-12-17 | 2016-07-07 | Quanta Computer Inc. | Automatic hardware recovery system |
US9715428B1 (en) * | 2014-09-24 | 2017-07-25 | Sanmina Corporation | System and method for cache data recovery |
CN107203448A (zh) * | 2017-05-24 | 2017-09-26 | 郑州云海信息技术有限公司 | 一种测试PCIe switch芯片暴力热插拔功能的方法及系统 |
CN109815043A (zh) * | 2019-01-25 | 2019-05-28 | 华为技术有限公司 | 故障处理方法、相关设备及计算机存储介质 |
CN110147340A (zh) * | 2019-05-21 | 2019-08-20 | 苏州浪潮智能科技有限公司 | 一种PCIE switch引脚电平配置系统、方法及相关组件 |
US20210216388A1 (en) * | 2020-01-14 | 2021-07-15 | Nxp Usa, Inc. | Method and System to Detect Failure in PCIe Endpoint Devices |
-
2022
- 2022-06-30 CN CN202210764034.2A patent/CN115016996A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110055631A1 (en) * | 2009-09-02 | 2011-03-03 | Inventec Corporation | Pluggable error detection board and motherboard error detection system containing the same |
US9715428B1 (en) * | 2014-09-24 | 2017-07-25 | Sanmina Corporation | System and method for cache data recovery |
US20160196194A1 (en) * | 2014-12-17 | 2016-07-07 | Quanta Computer Inc. | Automatic hardware recovery system |
CN107203448A (zh) * | 2017-05-24 | 2017-09-26 | 郑州云海信息技术有限公司 | 一种测试PCIe switch芯片暴力热插拔功能的方法及系统 |
CN109815043A (zh) * | 2019-01-25 | 2019-05-28 | 华为技术有限公司 | 故障处理方法、相关设备及计算机存储介质 |
CN110147340A (zh) * | 2019-05-21 | 2019-08-20 | 苏州浪潮智能科技有限公司 | 一种PCIE switch引脚电平配置系统、方法及相关组件 |
US20210216388A1 (en) * | 2020-01-14 | 2021-07-15 | Nxp Usa, Inc. | Method and System to Detect Failure in PCIe Endpoint Devices |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117806924A (zh) * | 2024-02-29 | 2024-04-02 | 苏州元脑智能科技有限公司 | 一种指示装置的控制方法、装置、服务器及介质 |
CN117806924B (zh) * | 2024-02-29 | 2024-05-10 | 苏州元脑智能科技有限公司 | 一种指示装置的控制方法、装置、服务器及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH1078897A (ja) | コンピュータ・データ記憶システム | |
US7802147B1 (en) | Method and apparatus for system status monitoring, testing and restoration | |
US9946600B2 (en) | Method of detecting power reset of a server, a baseboard management controller, and a server | |
CN101576860B (zh) | linux或windows操作系统的测试方法及系统 | |
JPH10105343A (ja) | コンピュータ・データ記憶システム | |
CN104734979A (zh) | 一种路由器外接存储设备的控制方法 | |
US7373493B2 (en) | Boot methods, computer systems, and production methods thereof | |
US10387260B2 (en) | Reboot system and reboot method | |
US20210072924A1 (en) | Flash memory controller and method capable of efficiently reporting debug information to host device | |
US8234526B2 (en) | Computer system and monitoring device | |
US20090138740A1 (en) | Method and computer device capable of dealing with power fail | |
US20070220210A1 (en) | Cache disassociation detection | |
US10691569B2 (en) | System and method for testing a data storage device | |
CN115016996A (zh) | 硬盘状态检测方法、系统、复杂可编程逻辑器件及服务器 | |
JP2002529853A (ja) | 大容量メモリを備えたサブシステムのハードディスクのために書き込みを保護したディスクキャッシュ装置と方法 | |
CN117573455B (zh) | 一种pcie设备检测系统、方法、装置及产品 | |
CA2307212A1 (en) | Automatic backup based on disk drive condition | |
US20060206764A1 (en) | Memory reliability detection system and method | |
US20080209254A1 (en) | Method and system for error recovery of a hardware device | |
CN112363909B (zh) | 一种继电保护装置中文件系统可靠性的自动测试方法 | |
CN111858178B (zh) | 一种电源启动类型的判断方法、装置、设备及可读介质 | |
CN111124785B (zh) | 一种硬盘故障检查的方法、装置、设备及存储介质 | |
JP2008198322A (ja) | ハードディスク状態監視装置およびハードディスク状態監視方法 | |
CN105975382B (zh) | 一种硬件配置变动的报警方法 | |
TW201706844A (zh) | 電源失效偵測系統與其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |