CN109471763A - 抓取NVME硬盘trace的方法、装置、设备及系统 - Google Patents
抓取NVME硬盘trace的方法、装置、设备及系统 Download PDFInfo
- Publication number
- CN109471763A CN109471763A CN201811295906.5A CN201811295906A CN109471763A CN 109471763 A CN109471763 A CN 109471763A CN 201811295906 A CN201811295906 A CN 201811295906A CN 109471763 A CN109471763 A CN 109471763A
- Authority
- CN
- China
- Prior art keywords
- hard disk
- nvme hard
- trace
- jig plate
- error message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2284—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by power-on test, e.g. power-on self test [POST]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2205—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0772—Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3034—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/42—Bus transfer protocol, e.g. handshake; Synchronisation
- G06F13/4204—Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus
- G06F13/4221—Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus being an input/output bus, e.g. ISA bus, EISA bus, PCI bus, SCSI bus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/42—Bus transfer protocol, e.g. handshake; Synchronisation
- G06F13/4282—Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
- G06F13/4295—Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus using an embedded synchronisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2213/00—Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F2213/0026—PCI express
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明实施例公开了一种抓取NVME硬盘trace的方法、装置、设备、系统及计算机可读存储介质。其中,系统包括BMC、BIOS、协议分析仪及包含处理器和拨码开关的治具板。BIOS在NVME硬盘所在PCIe链路发生错误时,采集PCIe链路的寄存器错误信息,并将寄存器错误信息发送至BMC,然后BMC将接收到的信息发送至治具板;治具板在拨码开关当前对应的错误类型与处理器解析寄存器错误信息的错误类型相一致时,触发协议分析仪抓取NVME硬盘的PCIetrace。本申请提供的技术方案无需针对不同故障错误类型定制相应的BIOS或trigger,精确、有效的抓取出NVME硬盘故障错误对应的PCIetrace,有利于高效且准确的找出NVME硬盘和服务器系统不兼容的原因。
Description
技术领域
本发明实施例涉及服务器应用技术领域,特别是涉及一种抓取NVME硬盘trace的方法、装置、设备、系统及计算机可读存储介质。
背景技术
NVME(Non-Volatile Memory Express,非易失性内存主机控制器接口规范)硬盘为目前服务器领域性能比较高端的一种硬盘类型,其接口基于PCIe(peripheralcomponent interconnect express,高速串行计算机扩展总线标准)协议,具有接口速率高、IO吞吐快的特点。由于NVME硬盘性能较高,相应的,其对服务器系统兼容性的要求也相对较高。
常见的NVME硬盘在服务器系统中的故障可包括uncorrectable fatal error、correctable non-fatal error和correctable error等,表象通常为掉盘、宕机、降速等等。在做NVME硬盘在服务器系统中兼容性测试时,往往需要进行长时间各种模型的测试及调试,找出NVME硬盘和服务器系统不兼容的原因,以此来保证服务器系统的可用性。
在对NVME硬盘进行调试时,相关技术使用PCIe协议分析仪自带的trigger(触发条件)功能抓取NVME硬盘的接口协议实际运行数据(也即抓取NVME硬盘的trace)来分析各种不兼容的错误。针对具体的故障类型,可以使用BIOS(Basic Input Output System,基本输入输出系统)监控到PCIe出现错误时,解析出具体的故障,然后针对性的通过PCH(PlatformController Hub,俗称集成南桥)上的GPIO(General Purpose Input Output,通用输入/输出或总线扩展器)触发协议分析仪的外部trigger,该方法需要针对不同的故障类型进行定制BIOS。
采用协议分析仪厂商原厂软件trigger的方式,trigger类型有限,只能针对固定几种类型的错误进行trigger,不能很好的适应服务器复杂系统中出现的复杂错误。由于PCIe接口传输速率快,加上协议分析仪本身缓存容量受限,所以如果不能针对具体错误类型有效的进行触发,则往往无法抓取有效的PCIe trace进行分析。更有甚者,一些错误很难复现,一旦错过,则又需要等待很长时间,浪费了大量人力物力。
发明内容
本公开实施例提供了一种抓取NVME硬盘trace的方法、装置、设备、系统及计算机可读存储介质,无需针对不同故障错误类型定制相应的BIOS或trigger,精确、有效的抓取出NVME硬盘故障错误对应的PCIe trace。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明实施例一方面提供了一种抓取NVME硬盘trace的系统,包括BMC、BIOS、治具板与协议分析仪,所述BMC分别与所述治具板和所述BIOS相连,所述治具板与所述协议分析仪相连;
所述BIOS用于在NVME硬盘所在PCIe链路发生错误时,采集所述PCIe链路的寄存器错误信息,并将所述寄存器错误信息发送至所述BMC;所述BMC用于将所述寄存器错误信息发送至治具板;
所述治具板包括处理器和拨码开关,用于在所述拨码开关当前对应的错误类型与所述处理器解析所述寄存器错误信息的错误类型相一致时,触发所述协议分析仪抓取所述NVME硬盘的PCIe trace。
可选的,所述治具板的GPIO引脚与所述协议分析仪的trigger连接器相连,所述触发所述协议分析仪抓取所述NVME硬盘的PCIe trace为:
置位所述治具板的GPIO引脚,以触发所述协议分析仪抓取所述NVME硬盘的PCIetrace。
可选的,通过线缆将服务器主板上所述BMC的RS-232接口连接到所述治具板的输入端,所述治具板与所述协议分析仪通过同轴线缆相连。
可选的,所述BIOS通过KCS链路将所述寄存器错误信息发送至所述BMC。
本发明实施例另一方面提供了一种抓取NVME硬盘trace的方法,应用于治具板,包括:
获取寄存器错误信息,所述寄存器错误信息为BIOS在NVME硬盘所在PCIe链路发生错误时采集的寄存器信息;
解析所述寄存器错误信息携带的地址信息得到对应的错误类型;
判断所述错误类型是否和拨码开关当前对应的错误类型相一致;
若是,则触发协议分析仪抓取所述NVME硬盘的PCIe trace;
其中,所述治具板所述协议分析仪相连,所述寄存器错误信息为所述BIOS通过BMC发送至所述治具板;所述寄存器错误信息的地址信息与错误类型具有对应关系。
可选的,所述治具板的GPIO引脚与所述协议分析仪的trigger连接器相连,所述触发协议分析仪抓取所述NVME硬盘的PCIe trace包括:
发送置位GPIO引脚的指令,以触发协议分析仪抓取所述NVME硬盘的PCIe trace。
可选的,所述BIOS通过KCS链路将所述寄存器错误信息发送至所述BMC,所述BMC将接收到的寄存器错误信息通过RS-232串口发送至所述治具板。
本发明实施例还提供了一种抓取NVME硬盘trace的装置,应用于治具板,包括:
信息获取模块,用于获取寄存器错误信息,所述寄存器错误信息为BIOS在NVME硬盘所在PCIe链路发生错误时采集的寄存器信息;所述寄存器错误信息为所述BIOS通过BMC发送至所述治具板;所述治具板所述协议分析仪相连;
错误类型解析模块,用于解析所述寄存器错误信息携带的地址信息得到对应的错误类型;所述寄存器错误信息的地址信息与错误类型具有对应关系;
错误类型匹配结果判断模块,判断所述错误类型是否和拨码开关当前对应的错误类型相一致;
触发模块,用于在所述错误类型和拨码开关当前对应的错误类型相一致时,触发协议分析仪抓取所述NVME硬盘的PCIe trace。
本发明实施例还提供了一种抓取NVME硬盘trace的设备,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述抓取NVME硬盘trace的方法的步骤。
本发明实施例最后还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有抓取NVME硬盘trace的程序,所述抓取NVME硬盘trace的程序被处理器执行时实现如前任一项所述抓取NVME硬盘trace的方法的步骤。
本发明实施例提供了一种抓取NVME硬盘trace的系统,包括BMC、BIOS、协议分析仪及包含处理器和拨码开关的治具板。BIOS在NVME硬盘所在PCIe链路发生错误时,采集PCIe链路的寄存器错误信息,并将寄存器错误信息发送至BMC,然后BMC将接收到的信息发送至治具板;治具板在拨码开关当前对应的错误类型与处理器解析寄存器错误信息的错误类型相一致时,触发协议分析仪抓取NVME硬盘的PCIe trace。
本申请提供的技术方案的优点在于,利用BIOS监控NVME硬盘所在PCIe链路的运行状态信息,并及时抓取发生故障时的寄存器错误信息,治具板的处理器通过解析这些寄存器错误信息的类型,并通过与拨码开关选择的错误类型的比对控制协议分析仪trigger抓取trace,实现了准确、高效的抓取NVME硬盘的PCIe trace,不仅解决了相关技术需要针对不同错误类型定制对应的BIOS或trigger的现状,用户还可通过拨码开关自由选择所需要抓取的错误类型抓取出对应的PCIe trace进行分析,有利于高效且准确的找出NVME硬盘和服务器系统不兼容的原因。
此外,本发明实施例还针对抓取NVME硬盘trace的方法提供了相应的实现装置、设备及计算机可读存储介质,进一步使得所述方法更具有实用性,所述装置、设备及计算机可读存储介质具有相应的优点。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
为了更清楚的说明本发明实施例或相关技术的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本公开根据一示例性实施例示出的抓取NVME硬盘trace的系统的结构框架示意图;
图2为本发明实施例提供的一种抓取NVME硬盘trace的方法的流程示意图;
图3为本发明实施例提供的抓取NVME硬盘trace的装置的一种具体实施方式结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在介绍了本发明实施例的技术方案后,下面详细的说明本申请的各种非限制性实施方式。
首先参见图1,图1为本发明实施例提供的一种抓取NVME硬盘trace系统的结构框架示意图,本发明实施例可包括以下内容:
抓取NVME硬盘trace系统可包括BMC(Baseboard Management Controller,基板管理控制器)1、BIOS2、治具板3与协议分析仪4。
BMC1分别与治具板3和BIOS2相连,治具板3与协议分析仪4相连,BIOS2与NVME硬盘相连。
BMC1和BIOS2均位于服务器主板,可选的,BIOS2可通过KCS链路与BMC1进行通讯。
可选的,可通过线缆将服务器主板上BMC1的RS-232接口连接到治具板3的输入端,治具板3可通过其GPIO引脚作为输出端,可通过同轴线缆相连与协议分析仪4的trigger连接器相连。
BIOS1实时监控连接NVME硬盘的PCIe链路,在NVME硬盘所在PCIe链路发生错误时,也即当相关链路出现PCIe报错时,采集PCIe链路的寄存器错误信息,并可通过KSC链路将寄存器错误信息发送至BMC2。其中,BIOS1检测PCIe链路发生错误和采集PCIe链路的寄存器错误信息的实现过程可参阅相关技术的描述,此处,便不再赘述。
BMC2在接收到BIOS1发送的信息后,可将接收到的寄存器错误信息通过串口(RS-232)发送至治具板3中。
治具板3包括处理器和拨码开关,拨码开关的每一个位置对应一种寄存器错误类型,例如unsupported request、badTLP、badDLLP、malformed TLP等等。用户可通过拨码开关同时选择1个或者多个需要触发的寄存器错误类型,也即用户可通过拨码开关选择NVME硬盘和服务器系统不兼容的测试选项。
治具板3的处理器可对接收到的寄存器错误信息进行解析,得到其相应的错误类型。处理器可根据寄存器错误信息中携带的地址信息解析得到错误类型时,寄存器错误信息中携带的地址信息为自定义的地址,地址信息和错误类型种类唯一对应,需要说明的是,此处的地址信息不同于其在配置空间中的地址,寄存器错误信息携带的地址信息为一些自定义地址,例如携带的地址为11122时,该地址对应的寄存器错误信息的种类为A,而携带的地址为11221时,该地址对应的寄存器错误信息的种类为B。
当拨码开关当前对应的错误类型与处理器解析寄存器错误信息的错误类型相一致时,处理器控制触发协议分析仪4抓取NVME硬盘的PCIe trace,例如可通过控制输出端引脚的置位来进行触发trace的抓取。
举例来说,当治具板3的GPIO(General Purpose Input Output,通用输入/输出)引脚与协议分析仪4的trigger连接器相连,置位治具板3的GPIO引脚触发协议分析仪4抓取NVME硬盘的PCIe trace。
在本发明实施例提供的技术方案中,利用BIOS监控NVME硬盘所在PCIe链路的运行状态信息,并及时抓取发生故障时的寄存器错误信息,治具板的处理器通过解析这些寄存器错误信息的类型,并通过与拨码开关选择的错误类型的比对控制协议分析仪trigger抓取trace,实现了准确、高效的抓取NVME硬盘的PCIe trace,不仅解决了相关技术需要针对不同错误类型定制对应的BIOS或trigger的现状,用户还可通过拨码开关自由选择所需要抓取的错误类型抓取出对应的PCIe trace进行分析,有利于高效且准确的找出NVME硬盘和服务器系统不兼容的原因。
请首先参见图2,图2为本发明实施例提供的一种抓取NVME硬盘trace的方法的流程示意图,例如可用于上述实施例的治具板,本发明实施例可包括以下内容:
S201:获取寄存器错误信息,寄存器错误信息为BIOS在NVME硬盘所在PCIe链路发生错误时采集的寄存器信息。
S202:解析寄存器错误信息携带的地址信息得到对应的错误类型。
寄存器错误信息的地址信息与错误类型具有对应关系。
S203:判断错误类型是否和拨码开关当前对应的错误类型相一致,若是,则执行S204。
S204:触发协议分析仪抓取NVME硬盘的PCIe trace。
治具板协议分析仪相连,寄存器错误信息为BIOS通过BMC发送至治具板,BIOS通过KCS链路将寄存器错误信息发送至BMC,BMC将接收到的寄存器错误信息通过RS-232串口发送至治具板。
可选的,治具板的GPIO引脚与协议分析仪的trigger连接器相连,S204可为发送置位GPIO引脚的指令,以触发协议分析仪抓取NVME硬盘的PCIe trace。
由上可知,本发明实施例无需针对不同故障错误类型定制相应的BIOS或trigger,精确、有效的抓取出NVME硬盘故障错误对应的PCIetrace。
本发明实施例还针对抓取NVME硬盘trace的方法提供了相应的实现装置,进一步使得所述方法更具有实用性。下面对本发明实施例提供的抓取NVME硬盘trace的装置进行介绍,下文描述的抓取NVME硬盘trace的装置与上文描述的抓取NVME硬盘trace的方法可相互对应参照。
参见图3,图3为本发明实施例提供的抓取NVME硬盘trace的装置在一种具体实施方式下的结构图,该装置可包括:
信息获取模块301,用于获取寄存器错误信息,寄存器错误信息为BIOS在NVME硬盘所在PCIe链路发生错误时采集的寄存器信息;寄存器错误信息为BIOS通过BMC发送至治具板;治具板协议分析仪相连。
错误类型解析模块302,用于解析寄存器错误信息携带的地址信息得到对应的错误类型;寄存器错误信息的地址信息与错误类型具有对应关系。
错误类型匹配结果判断模块303,判断错误类型是否和拨码开关当前对应的错误类型相一致。
触发模块304,用于在错误类型和拨码开关当前对应的错误类型相一致时,触发协议分析仪抓取NVME硬盘的PCIe trace。
可选的,在本实施例的一些实施方式中,所述触发模块304例如还可以为在治具板的GPIO引脚与协议分析仪的trigger连接器相连,发送置位GPIO引脚的指令,以触发协议分析仪抓取NVME硬盘的PCIe trace的模块。
本发明实施例所述抓取NVME硬盘trace的装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例无需针对不同故障错误类型定制相应的BIOS或trigger,精确、有效的抓取出NVME硬盘故障错误对应的PCIetrace。
本发明实施例还提供了一种抓取NVME硬盘trace的设备,具体可包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序以实现如上任意一实施例所述抓取NVME硬盘trace的方法的步骤。
本发明实施例所述抓取NVME硬盘trace的设备的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例无需针对不同故障错误类型定制相应的BIOS或trigger,精确、有效的抓取出NVME硬盘故障错误对应的PCIetrace。
本发明实施例还提供了一种计算机可读存储介质,存储有抓取NVME硬盘trace的程序,所述抓取NVME硬盘trace的程序被处理器执行时如上任意一实施例所述抓取NVME硬盘trace的方法的步骤。
本发明实施例所述计算机可读存储介质的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例无需针对不同故障错误类型定制相应的BIOS或trigger,精确、有效的抓取出NVME硬盘故障错误对应的PCIetrace。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种抓取NVME硬盘trace的方法、装置、设备、系统及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (10)
1.一种抓取NVME硬盘trace的系统,其特征在于,包括BMC、BIOS、治具板与协议分析仪,所述BMC分别与所述治具板和所述BIOS相连,所述治具板与所述协议分析仪相连;
所述BIOS用于在NVME硬盘所在PCIe链路发生错误时,采集所述PCIe链路的寄存器错误信息,并将所述寄存器错误信息发送至所述BMC;所述BMC用于将所述寄存器错误信息发送至治具板;
所述治具板包括处理器和拨码开关,用于在所述拨码开关当前对应的错误类型与所述处理器解析所述寄存器错误信息的错误类型相一致时,触发所述协议分析仪抓取所述NVME硬盘的PCIe trace。
2.根据权利要求1所述的抓取NVME硬盘trace的系统,其特征在于,所述治具板的GPIO引脚与所述协议分析仪的trigger连接器相连,所述触发所述协议分析仪抓取所述NVME硬盘的PCIe trace为:
置位所述治具板的GPIO引脚,以触发所述协议分析仪抓取所述NVME硬盘的PCIetrace。
3.根据权利要求2所述的抓取NVME硬盘trace的系统,其特征在于,通过线缆将服务器主板上所述BMC的RS-232接口连接到所述治具板的输入端,所述治具板与所述协议分析仪通过同轴线缆相连。
4.根据权利要求3所述的抓取NVME硬盘trace的系统,其特征在于,所述BIOS通过KCS链路将所述寄存器错误信息发送至所述BMC。
5.一种抓取NVME硬盘trace的方法,其特征在于,应用于治具板,包括:
获取寄存器错误信息,所述寄存器错误信息为BIOS在NVME硬盘所在PCIe链路发生错误时采集的寄存器信息;
解析所述寄存器错误信息携带的地址信息得到对应的错误类型;
判断所述错误类型是否和拨码开关当前对应的错误类型相一致;
若是,则触发协议分析仪抓取所述NVME硬盘的PCIe trace;
其中,所述治具板所述协议分析仪相连,所述寄存器错误信息为所述BIOS通过BMC发送至所述治具板;所述寄存器错误信息的地址信息与错误类型具有对应关系。
6.根据权利要求5所述的抓取NVME硬盘trace的方法,其特征在于,所述治具板的GPIO引脚与所述协议分析仪的trigger连接器相连,所述触发协议分析仪抓取所述NVME硬盘的PCIe trace包括:
发送置位GPIO引脚的指令,以触发协议分析仪抓取所述NVME硬盘的PCIe trace。
7.根据权利要求6所述的抓取NVME硬盘trace的方法,其特征在于,所述BIOS通过KCS链路将所述寄存器错误信息发送至所述BMC,所述BMC将接收到的寄存器错误信息通过RS-232串口发送至所述治具板。
8.一种抓取NVME硬盘trace的装置,其特征在于,应用于治具板,包括:
信息获取模块,用于获取寄存器错误信息,所述寄存器错误信息为BIOS在NVME硬盘所在PCIe链路发生错误时采集的寄存器信息;所述寄存器错误信息为所述BIOS通过BMC发送至所述治具板;所述治具板所述协议分析仪相连;
错误类型解析模块,用于解析所述寄存器错误信息携带的地址信息得到对应的错误类型;所述寄存器错误信息的地址信息与错误类型具有对应关系;
错误类型匹配结果判断模块,判断所述错误类型是否和拨码开关当前对应的错误类型相一致;
触发模块,用于在所述错误类型和拨码开关当前对应的错误类型相一致时,触发协议分析仪抓取所述NVME硬盘的PCIe trace。
9.一种抓取NVME硬盘trace的设备,其特征在于,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求5至7任一项所述抓取NVME硬盘trace的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有抓取NVME硬盘trace的程序,所述抓取NVME硬盘trace的程序被处理器执行时实现如权利要求5至7任一项所述抓取NVME硬盘trace的方法的步骤。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811295906.5A CN109471763B (zh) | 2018-11-01 | 2018-11-01 | 抓取NVME硬盘trace的方法、装置、设备及系统 |
US17/275,827 US11442831B2 (en) | 2018-11-01 | 2019-06-27 | Method, apparatus, device and system for capturing trace of NVME hard disc |
PCT/CN2019/093360 WO2020087956A1 (zh) | 2018-11-01 | 2019-06-27 | 抓取NVME硬盘trace的方法、装置、设备及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811295906.5A CN109471763B (zh) | 2018-11-01 | 2018-11-01 | 抓取NVME硬盘trace的方法、装置、设备及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109471763A true CN109471763A (zh) | 2019-03-15 |
CN109471763B CN109471763B (zh) | 2022-02-18 |
Family
ID=65672566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811295906.5A Active CN109471763B (zh) | 2018-11-01 | 2018-11-01 | 抓取NVME硬盘trace的方法、装置、设备及系统 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11442831B2 (zh) |
CN (1) | CN109471763B (zh) |
WO (1) | WO2020087956A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020087956A1 (zh) * | 2018-11-01 | 2020-05-07 | 郑州云海信息技术有限公司 | 抓取NVME硬盘trace的方法、装置、设备及系统 |
CN112463490A (zh) * | 2020-12-01 | 2021-03-09 | 苏州浪潮智能科技有限公司 | 带PCIe retimer的链路状态诊断系统及方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116582471B (zh) * | 2023-07-14 | 2023-09-19 | 珠海星云智联科技有限公司 | Pcie设备、pcie数据捕获系统和服务器 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101126995A (zh) * | 2006-08-14 | 2008-02-20 | 国际商业机器公司 | 处理严重硬件错误的方法及设备 |
US7480303B1 (en) * | 2005-05-16 | 2009-01-20 | Pericom Semiconductor Corp. | Pseudo-ethernet switch without ethernet media-access-controllers (MAC's) that copies ethernet context registers between PCI-express ports |
US20120290875A1 (en) * | 2011-05-09 | 2012-11-15 | Lsi Corporation | Methods and structure for storing errors for error recovery in a hardware controller |
CN103748562A (zh) * | 2010-12-23 | 2014-04-23 | 英特尔公司 | 测试、验证和调试架构 |
US20140156897A1 (en) * | 2010-08-06 | 2014-06-05 | OCZ Storage Solutions Inc. | METHOD OF CONNECTING A PCIe BUS EXTENSION SYSTEM |
CN107122277A (zh) * | 2017-05-09 | 2017-09-01 | 郑州云海信息技术有限公司 | 基于pcie协议分析仪的pcieras注错测试系统及方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102081562A (zh) * | 2009-11-30 | 2011-06-01 | 华为技术有限公司 | 一种设备诊断方法及系统 |
US9954727B2 (en) * | 2015-03-06 | 2018-04-24 | Quanta Computer Inc. | Automatic debug information collection |
US9768952B1 (en) * | 2015-09-22 | 2017-09-19 | Seagate Technology Llc | Removable circuit for unlocking self-encrypting data storage devices |
CN106502814B (zh) | 2016-10-19 | 2020-04-03 | 杭州迪普科技股份有限公司 | 一种记录pcie设备错误信息的方法及装置 |
US20180300109A1 (en) | 2017-04-17 | 2018-10-18 | International Business Machines Corporation | Preserving dynamic trace purity |
CN107729220B (zh) * | 2017-09-27 | 2019-06-18 | 郑州云海信息技术有限公司 | 一种实现多NVMe硬盘背板点灯的设计方法 |
CN109471763B (zh) | 2018-11-01 | 2022-02-18 | 郑州云海信息技术有限公司 | 抓取NVME硬盘trace的方法、装置、设备及系统 |
-
2018
- 2018-11-01 CN CN201811295906.5A patent/CN109471763B/zh active Active
-
2019
- 2019-06-27 US US17/275,827 patent/US11442831B2/en active Active
- 2019-06-27 WO PCT/CN2019/093360 patent/WO2020087956A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7480303B1 (en) * | 2005-05-16 | 2009-01-20 | Pericom Semiconductor Corp. | Pseudo-ethernet switch without ethernet media-access-controllers (MAC's) that copies ethernet context registers between PCI-express ports |
CN101126995A (zh) * | 2006-08-14 | 2008-02-20 | 国际商业机器公司 | 处理严重硬件错误的方法及设备 |
US20140156897A1 (en) * | 2010-08-06 | 2014-06-05 | OCZ Storage Solutions Inc. | METHOD OF CONNECTING A PCIe BUS EXTENSION SYSTEM |
CN103748562A (zh) * | 2010-12-23 | 2014-04-23 | 英特尔公司 | 测试、验证和调试架构 |
US20120290875A1 (en) * | 2011-05-09 | 2012-11-15 | Lsi Corporation | Methods and structure for storing errors for error recovery in a hardware controller |
CN107122277A (zh) * | 2017-05-09 | 2017-09-01 | 郑州云海信息技术有限公司 | 基于pcie协议分析仪的pcieras注错测试系统及方法 |
Non-Patent Citations (2)
Title |
---|
HEINER GIEFERS ET AL: "Accelerating arithmetic kernels with coherent attached FPGA coprocessors", 《2015 DESIGN, AUTOMATION & TEST IN EUROPE CONFERENCE & EXHIBITION (DATE)》 * |
张亮: "PCI Express协议的实现与验证", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020087956A1 (zh) * | 2018-11-01 | 2020-05-07 | 郑州云海信息技术有限公司 | 抓取NVME硬盘trace的方法、装置、设备及系统 |
US11442831B2 (en) | 2018-11-01 | 2022-09-13 | Zhengzhou Yunhai Information Technology Co., Ltd. | Method, apparatus, device and system for capturing trace of NVME hard disc |
CN112463490A (zh) * | 2020-12-01 | 2021-03-09 | 苏州浪潮智能科技有限公司 | 带PCIe retimer的链路状态诊断系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
US20220043728A1 (en) | 2022-02-10 |
WO2020087956A1 (zh) | 2020-05-07 |
CN109471763B (zh) | 2022-02-18 |
US11442831B2 (en) | 2022-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109408338A (zh) | 抓取NVME硬盘trace的方法、装置、设备及系统 | |
US7000150B1 (en) | Platform for computer process monitoring | |
EP2696534B1 (en) | Method and device for monitoring quick path interconnect link | |
US20120174112A1 (en) | Application resource switchover systems and methods | |
KR20160044484A (ko) | 클라우드 배치 기반구조 검증 엔진 | |
CN109471763A (zh) | 抓取NVME硬盘trace的方法、装置、设备及系统 | |
CN112653600A (zh) | 基于usb网卡的网卡性能测试方法、装置及电子设备 | |
CN103138988B (zh) | 网络故障的定位处理方法及装置 | |
CN117378179A (zh) | 在实时网络中调试、优化、剖析或恢复网络设备的系统与方法 | |
CN106559288B (zh) | 一种基于icmp报文的快速故障检测方法 | |
CN110932887A (zh) | 一种bmc调试方法、系统及装置 | |
CN101667953B (zh) | 一种快速环网物理链路状态的上报方法及装置 | |
US6499113B1 (en) | Method and apparatus for extracting first failure and attendant operating information from computer system devices | |
US8880957B2 (en) | Facilitating processing in a communications environment using stop signaling | |
US7925728B2 (en) | Facilitating detection of hardware service actions | |
CN109885420B (zh) | 一种PCIe链路故障的分析方法、BMC及存储介质 | |
CN110134559B (zh) | 一种bmc故障检测方法、系统及相关组件 | |
CN115599617B (zh) | 总线检测方法、装置、服务器及电子设备 | |
CN109446002A (zh) | 一种用于服务器抓取sata硬盘的治具板、系统及方法 | |
Cisco | Release Notes for Cisco MGX 8260 Media Gateway, Version 1.2.5 | |
Cisco | Cisco MGX 8220 Firmware Release Notes, Release 5.0.17 | |
Pham et al. | An architecture for supporting ras on linux-based IoT gateways | |
CN116610516B (zh) | 一种基于设备数字孪生的物联网编程运维底座系统及方法 | |
CN112506685B (zh) | 日志存储方法及装置 | |
Bogdanov | Testing from X-machine specifications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |