CN108733500A - 故障定位方法及装置、对应关系的生成方法及装置 - Google Patents

故障定位方法及装置、对应关系的生成方法及装置 Download PDF

Info

Publication number
CN108733500A
CN108733500A CN201710240088.8A CN201710240088A CN108733500A CN 108733500 A CN108733500 A CN 108733500A CN 201710240088 A CN201710240088 A CN 201710240088A CN 108733500 A CN108733500 A CN 108733500A
Authority
CN
China
Prior art keywords
pcie interface
interface discs
discs
product serial
physical label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710240088.8A
Other languages
English (en)
Inventor
牛功彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201710240088.8A priority Critical patent/CN108733500A/zh
Publication of CN108733500A publication Critical patent/CN108733500A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0745Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test buses, lines or interfaces, e.g. stuck-at or open line faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提供了故障定位方法及装置、对应关系的生成方法及装置,其中,该故障定位方法应用于服务器上,所述服务器包括:多个非易失性规范PCIE接口盘;故障定位方法包括:检测所述多个PCIE接口盘是否出现故障,如果是,则获取故障PCIE接口盘的产品序列码;依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置。采用本申请实施例,可以直接定位故障PCIE接口盘在服务器的背板上的插槽位置,从而可以精确定位故障PCIE接口盘,并提高更换PCIE接口盘的效率。

Description

故障定位方法及装置、对应关系的生成方法及装置
技术领域
本申请涉及互联网数据处理技术领域,特别涉及一种基于多PCIE接口盘的故障定位方法及装置,一种多PCIE接口盘的对应关系的生成方法及装置,以及,计算机可读介质和计算机设备。
背景技术
PCIE(Peripheral Component Interconnect Express,总线和接口标准)是目前个人电脑中使用较多的一种接口标准,在服务器上可以采用多个PCIE接口盘的结构来存储数据。PCIE接口盘可以采用PCIE协议,也可以采用NVME(Non-Volatile Memory Express,非易失性存储协议)协议。NVME是基于PCIE的固态硬盘(SSDs,Solid State Disk Ssd))的接口协议,是专门为闪存类存储设计的协议。
现有技术中,服务器可以采用大量的PCIE接口盘的架构来实现存储系统,这大量的PCIE接口盘中如果有个别PCIE接口盘出现了故障,无法执行读写操作,技术人员很难在海量的NVME盘中精确定位出现故障的NVME盘。
发明内容
发明人在研究过程中发现,因为在服务器进行数据处理的过程中,在对数据进行读写操作的时候,都使用PCIE接口盘的产品序列码(SN,Serial Number)来区别各个PCIE接口盘,产品序列码是PCIE接口盘出厂时的序列号,用于唯一标识各PCIE接口盘。在服务器上配置了多个PCIE接口盘的情况下,各PCIE接口盘都会插在服务器的背板上的插槽位置上,而对于服务器来说,各插槽位置的物理标识都是唯一的,因此,如果能够将服务器上的各个插槽位置与PCIE接口盘的产品序列码相对应,就能根据出现故障的PCIE接口盘的产品序列码直接对应到服务器的背板上的插槽位置,就能精确定位出现故障的PCIE接口盘,还可以直接对出现故障的PCIE接口盘进行更换等。
基于此,本申请提供了一种PCIE接口盘的产品序列码和物理标识的对应关系的生成方法和一种故障定位方法,用以将服务器上的多个PCIE接口盘的产品序列码与物理标识一一对应起来,进而在某个PCIE接口盘或某些PCIE接口盘出现故障的时候,直接根据出现故障的PCIE接口盘的产品序列码来精确定位PCIE接口盘的物理位置。
本申请还提供了一种PCIE接口盘的产品序列码和物理标识的对应关系的生成装置和一种故障定位装置,计算机可读介质,以及计算机设备,用以保证上述方法在实际中的实现及应用。
为了解决上述问题,本申请公开了一种故障定位方法,该方法应用于计算设备上,所述计算设备包括:多个PCIE接口盘;该方法包括:
检测所述多个PCIE接口盘是否出现故障,如果是,则获取故障PCIE接口盘的产品序列码;
依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置。
其中,所述对应关系保存在预设的目标关系表中,所述依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置,包括:
在所述目标关系表中,查询所述故障PCIE接口盘的产品序列码是否存在,如果是,则获取所述故障PCIE接口盘的产品序列码对应的物理标识;所述物理标识为:PCIE接口盘在所述服务器的背板上的插槽号;
依据所述物理标识对应的插槽号,定位所述故障PCIE接口盘在所述服务器的背板上的插槽位置。
其中,该方法还包括:
将所述定位的插槽位置上的故障PCIE接口盘更换为其他PCIE接口盘。
其中,所述检测所述多个PCIE接口盘是否出现故障,包括:
响应于触发所述多个PCIE接口盘的读写命令,判断在所述多个PCIE接口盘上是否能执行所述读写命令。
其中,所述获取故障PCIE接口盘的产品序列码,包括:
获取不能执行的、所述读写命令中携带的读写地址,并依据所述读写地址获取相对应的产品序列码。
本申请还提供了一种PCIE接口盘的对应关系的生成方法,该生成方法包括:
响应于基本输入输出系统BIOS初始化,获取服务器上多个非易失性规范PCIE接口盘的产品序列码、总线端口标识及其第一参考关系;
响应于带外CPLD系统上电,获取所述带外CPLD系统读取到的PCIE接口盘的物理标识、总线端口标识及其第二参考关系;所述物理标识用于唯一标识所述PCIE接口盘在所述服务器的背板上的插槽位置;
依据所述第一参考关系和第二参考关系,生成所述多个PCIE接口盘的、物理标识和产品序列码的目标对应关系。
其中,所述方法还包括:
将所述多个PCIE接口盘的物理标识、产品序列码以及目标对应关系,保存至预设的目标关系表中。
其中,所述方法还包括:
判断是否到达预设的时间周期,如果是,依据所述带外CPLD系统实时获取的、更新的PCIE接口盘的物理标识和总线端口标识,更新所述第二参考关系。
本申请实施例还公开了一种故障定位装置,该定位装置集成于计算设备上,该定位装置包括:
检测单元,用于检测所述多个PCIE接口盘是否出现故障;
序列码获取单元,用于在所述检测单元的结果为是的情况下,获取故障PCIE接口盘的产品序列码;
定位单元,用于依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置。
其中,所述对应关系保存在预设的目标关系表中,所述定位单元包括:
查询子单元,用于在所述目标关系表中,查询所述故障NVME盘的产品序列码是否存在;
标识获取子单元,用于在所述查询子单元的结果为是的情况下,获取所述故障NVME盘的产品序列码对应的物理标识;所述物理标识为:NVME盘在所述服务器的背板上的插槽号;
定位子单元,用于依据所述物理标识对应的插槽号,定位所述故障NVME盘在所述服务器的背板上的插槽位置。
其中,所述定位装置还包括:
更换单元,用于将所述定位的插槽位置上的故障NVME盘更换为其他NVME盘。
其中,所述检测单元包括:
判断子单元,用于响应于触发所述多个NVME盘的读写命令,判断在所述多个NVME盘上是否能执行所述读写命令。
其中,所述序列码获取单元,包括:
地址获取子单元,用于获取不能执行的、所述读写命令中携带的读写地址;
序列码获取子单元,用于并依据所述读写地址获取相对应的产品序列码。
本申请实施例还公开了一种PCIE接口盘的对应关系的生成装置,该生成装置包括:
第一获取单元,用于响应于基本输入输出系统BIOS初始化,获取服务器上多个非易失性规范PCIE接口盘的产品序列码、总线端口标识及其第一参考关系;
第二获取单元,用于响应于带外CPLD系统上电,获取所述带外CPLD系统读取到的PCIE接口盘的物理标识、总线端口标识及其第二参考关系;所述物理标识用于唯一标识所述PCIE接口盘在所述服务器的背板上的插槽位置;
生成单元,用于依据所述第一参考关系和第二参考关系,生成所述多个PCIE接口盘的、物理标识和产品序列码的目标对应关系。
其中,该生成装置还包括:
保存单元,用于将所述多个NVME盘的物理标识、产品序列码以及目标对应关系,保存至预设的目标关系表中。
其中,该生成装置还包括:
时间判断单元,用于判断是否到达预设的时间周期;
更新单元,用于在所述时间判断单元的结果为是的情况下,依据所述带外CPLD系统实时获取的、更新的NVME盘的物理标识和总线端口标识,更新所述第二参考关系。
本申请实施例还公开了一种计算机可读介质,该计算机可读介质存储有使计算机执行用于故障定位的程序,该处理包括以下步骤:
检测步骤,其检测所述多个PCIE接口盘是否出现故障;
序列码获取步骤,其在检测步骤检测到故障的情况下,获取故障PCIE接口盘的产品序列码;以及
定位步骤,其依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置。
本申请实施例还公开了另一种计算机可读介质,该计算机可读介质存储有使计算机执行用于PCIE接口盘的对应关系的生成的程序,该处理包括以下步骤:
获取步骤,其响应于基本输入输出系统BIOS初始化,获取服务器上多个非易失性规范PCIE接口盘的产品序列码、总线端口标识及其第一参考关系;
获取步骤,其响应于带外CPLD系统上电,获取所述带外CPLD系统读取到的PCIE接口盘的物理标识、总线端口标识及其第二参考关系;所述物理标识用于唯一标识所述PCIE接口盘在所述服务器的背板上的插槽位置;以及
生成步骤,其依据所述第一参考关系和第二参考关系,生成所述多个PCIE接口盘的、物理标识和产品序列码的目标对应关系。
本申请实施例还公开了一种计算设备,该计算机设备包括:处理器、存储器、网络接口和总线系统;
所述总线系统,用于将所述计算设备的各个硬件组件耦合在一起;
所述网络接口,用于实现所述计算设备与至少一个其它计算设备之间的通信连接;
所述存储器,用于存储程序指令和/或数据;
所述处理器,用于读取所述存储器中存储的指令和/或数据,执行以下操作:
检测所述多个PCIE接口盘是否出现故障,如果是,则获取故障PCIE接口盘的产品序列码;依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置。
本申请实施例还公开了一种计算设备,该计算设备包括:处理器、存储器、网络接口和总线系统;
所述总线系统,用于将所述计算设备的各个硬件组件耦合在一起;
所述网络接口,用于实现所述计算设备与至少一个其它计算设备之间的通信连接;
所述存储器,用于存储程序指令和/或数据;
所述处理器,用于读取所述存储器中存储的指令和/或数据,执行以下操作:
响应于基本输入输出系统BIOS初始化,获取服务器上多个非易失性规范PCIE接口盘的产品序列码、总线端口标识及其第一参考关系;
响应于带外CPLD系统上电,获取所述带外CPLD系统读取到的PCIE接口盘的物理标识、总线端口标识及其第二参考关系;所述物理标识用于唯一标识所述PCIE接口盘在所述服务器的背板上的插槽位置;
依据所述第一参考关系和第二参考关系,生成所述多个PCIE接口盘的、物理标识和产品序列码的目标对应关系。
本申请实施例还提供了一种定位方法,该方法应用于计算设备上,所述计算设备包括:多个PCIE接口盘;该方法包括:
获取多个PCIE接口盘中至少一个PCIE接口盘的产品序列码,其中,所述多个PCIE接口盘中至少一个PCIE接口盘称为第一PCIE接口盘;
依据所述产品序列码和物理标识的目标对应关系,定位所述第一PCIE接口盘在所述计算设备上的插槽位置。
其中,所述对应关系保存在预设的目标关系表中,所述依据所述产品序列码和物理标识的目标对应关系,定位所述第一PCIE接口盘在所述服务器上的插槽位置,包括:
在所述目标关系表中,查询所述第一PCIE接口盘的产品序列码是否存在,如果是,则获取所述第一PCIE接口盘的产品序列码对应的物理标识;所述物理标识为:PCIE接口盘在所述服务器的背板上的插槽号;
依据所述物理标识对应的插槽号,定位所述第一PCIE接口盘在所述服务器的背板上的插槽位置。
与现有技术相比,本申请包括以下优点:
在本申请实施例中,在服务器上配置了多个PCIE接口盘的情况下,各PCIE接口盘都会插在服务器的背板上的插槽位置上,而对于服务器来说,各插槽位置的物理标识都是唯一的,因此,如果能够将服务器上的各个插槽位置与NVME盘的产品序列码相对应,就能根据出现故障的PCIE接口盘的产品序列码直接对应到服务器的背板上的插槽位置,就能精确定位出现故障的PCIE接口盘,还可以直接对出现故障的PCIE接口盘进行更换等。
当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的故障定位方法在实际应用中的场景框架图;
图2是本申请的多PCIE接口盘的对应关系的生成方法实施例的流程图;
图3是本申请的故障定位方法实施例的流程图;
图4是本申请中生成对应关系并且进行故障定位的整体流程图;
图5是本申请的故障定位装置的结构框图;
图6是本申请的对应关系的生成装置实施例的结构框图;
图7是本申请的计算机设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
术语定义:
(1)、BIOS(Basic Input Output System,基本输入输出系统),是一组固化到计算机内主板上一个ROM芯片上的程序,保存着计算机最重要的基本输入输出的程序、开机后自检程序和系统自启动程序。其主要功能是为计算机提供最底层的、最直接的硬件设置和控制。
(2)、NVME(Non-Volatile Memory Express,非易失性存储协议),是基于PCIE(总线和接口标准)的固态硬盘(SSDs,Solid State Disk Ssd))的接口协议,是专门为闪存类存储设计的协议。其中,PCIE(PCI Express)是新一代的总线接口。
(3)、CPLD(Complex Programmable Logic Device,复杂可编程逻辑器件),是一种用户根据各自需要而自行构造逻辑功能的数字集成电路。
(4)、PCIE(Peripheral Component Interconnect Express,总线和接口标准)是目前个人电脑中使用较多的一种接口标准,在服务器上可以采用多个PCIE接口盘的结构来存储数据。
(5)、计算设备,是用于提供计算服务的设备,例如,可以是服务器。
本申请的故障定位可以应用于计算设备上,以计算设备为服务器为例,参考图1所示,为本申请的故障定位方法在实际应用中的场景框架图,其中,服务器10的背板101上共设置有N个插槽,其中,N为大于2的整数。每一个插槽都可以插入一个PCIE接口盘,图1所示的服务器10一共可以插入N个PCIE接口盘。目标关系表103可以由服务器10预先生成并保存在存储器中,用于保存插槽101的物理标识和各PCIE接口盘的产品序列码之间的对应关系。在实际应用中,服务器10中的定位装置102在检测到某个插槽上的PCIE接口盘出现故障的时候,例如,该PCIE接口盘不能执行读写操作等,就获取该出现故障的PCIE接口盘的产品序列码,并从预设的目标关系表103查询该产品序列码对应的物理标识,进而定位到背板101上的插槽号码,从而精确查找到出现故障的PCIE接口盘的插槽号。
参考图2,示出了本申请一种多PCIE接口盘的对应关系的生成方法实施例的流程图,本实施例可以包括以下步骤:
步骤201:响应于基本输入输出系统BIOS初始化,获取服务器上多个PCIE接口盘的产品序列码、总线端口标识及其第一参考关系。
在本实施例中,BIOS(Basic Input Output System,基本输入输出系统),是一组固化到计算机内主板上一个ROM芯片上的程序,保存着计算机最重要的基本输入输出的程序、开机后自检程序和系统自启动程序。其主要功能是为计算机提供最底层的、最直接的硬件设置和控制。在本实施例中,PCIE接口盘以NVME盘为例进行说明。
在BIOS初始化的时候,BIOS会从服务器的背板上获取到各个NVME盘的产品序列码,以及各个NVME盘的总线端口标识(port ID),其中,因为各个NVME盘的是基于PCIE的,因此,总线端口标识即为PCIE port ID。因此,本步骤可以将BIOS获取的、各个NVME盘的产品序列码和总线端口标识对应保存至预设的EXCEL表格中,这两者的关系可以为第一参考关系。
步骤202:响应于带外CPLD系统上电,获取所述带外CPLD系统读取到的PCIE接口盘的物理标识、总线端口标识及其第二参考关系。
在实际应用中,CPLD(Complex Programmable Logic Device,复杂可编程逻辑器件),是一种用户根据各自需要而自行构造逻辑功能的数字集成电路。在服务器上电后,CPLD系统会从各个NVME盘在服务器的背板上的插槽位置来获取各个NVME盘的物理标识以及总线端口标识。其中,物理标识可以用于唯一标识NVME盘在服务器的背板上的插槽位置。例如,如果服务器的背板上有10个插槽号,则物理标识可以依次为1、2、3、4、5、6、7、8、9和10,或者可以设置成A、B、C、D、E、F、G、H、I和J,当然,该例子仅为示例性的说明,任何能够唯一区别这10个插槽的物理标识均可。其中,总线端口标识和步骤201中获取到的总线端口标识相同,在此不再赘述。
基于此,本步骤中可以将CPLD系统获取到的物理标识和总线端口标识对应保存至预设的EXCEL表格中,并将两者的对应关系作为第二参考关系。
可以理解的是,在本实施例中,物理标识还可以由本领域技术人员进行修改。例如,带外CPLD系统获取到了物理标识之后,还可以由本领域技术人员根据实际中服务器的背板上的各个插槽号来更新。例如,带外CPLD系统获取到了11个物理标识,而通过本领域技术人员对服务器的背板的检查确认,服务器只有10个插槽号,则可以在保存第二参考关系的EXCEL表格中删除对于的物理标识,即插槽号对应的表格数据,例如,对应的总线端口标识等。
还可以理解的是,步骤201和步骤202也可以同时执行,或者,先执行步骤202后执行步骤201,只要在执行步骤203之前得到前述的第一参考关系和第二参考关系即可。
步骤203:依据所述第一参考关系和第二参考关系,生成所述多个PCIE接口盘的、物理标识和产品序列码的目标对应关系。
在分别得到前述的第一次参考关系和第二参考关系,即分别得到了产品序列码和NVME盘的总线端口标识的对应关系,以及,总线端口标识与物理标识的对应关系,依据这两个对应关系即可得到物理标识和产品序列码之间的目标对应关系。
在实际应用中,在步骤203之后,还可以包括:
步骤204:将所述多个PCIE接口盘的物理标识、产品序列码以及目标对应关系,保存至预设的目标关系表中。
服务器可以将步骤203得到的、多个NVME盘的物理标识、产品序列码以及两者之间的目标对应关系,保存至预先设置好的目标关系表中,该目标关系表可以存放至存储器中,以便查询。
在实际应用中,在步骤203之后,还可以包括:
步骤A1:判断是否到达预设的时间周期,如果是,则进入步骤A2。
在本实施例中,因为服务器的背板上的各插槽中插入的NVME盘可能在后期进行更换等,所以如果插槽中插入了其他NVME盘,则总线端口标识就会发生变化,基于此,可以预先设置一个时间周期,例如半个小时等,在时间周期到来时,带外CPLD系统可以重新获取一次NVME盘的物理标识和总线端口标识之间的对应关系。如果时间周期还未到达,就可以继续实时执行步骤A1。
步骤A2:依据所述带外CPLD系统实时获取的、更新的PCIE接口盘的物理标识和总线端口标识,更新所述第二参考关系。
当时间周期到达时,带外CPLD系统会实时获取到NVME盘的物理标识和总线端口标识,更新所述第二参考关系。在实际应用中,PCIE的拓扑是树形的,简称胖树结构,因此,总线端口标识PCIE port ID的分配是在初始化时进行的,初始化完成后,总线端口标识也就确定了。如果服务器的背板上插入新的NVME盘,会为新的NVME盘再分配一个新的总线端口标识,并且,在不重启系统的情况下,各个NVME盘的插槽位置对应的总线端口标识不会释放。而在一个NVME盘例如NVME盘1有故障的情况下,假设换成了NVME盘2,而又没有重启系统,则B设备会被分配一个与NVME盘1的总线端口标识1不同的总线端口标识.即为各个NVME盘分配的总线端口标识分别对应于各个NVME盘。因此,在有新的NVME盘或者发生了NVME盘更换的情况下,需要更新物理标识与总线端口标识之间的对应关系。
可见,在本申请实施例中,通过BIOS初始化可以获取到多个NVME盘的产品序列码和总线端口标识之间的第一参考关系,并且通过带外CPLD系统可以获取到多个PCIE接口盘的物理标识和总线端口标识之间的第二参考关系,依据第一参考关系和第二参考关系即可得到各PCIE接口盘的物理标识和产品序列码之间的目标对应关系,从而可以根据各PCIE接口盘的产品序列码直接定位到服务器的背板上的插槽号码。进而,这种目标对应关系还可以保存在存储器中,以便在PCIE接口盘出现故障的时候,从PCIE接口盘的产品序列码找到服务器的背板上的插槽位置,并对出现故障的PCIE接口盘进行更换。
参考图3,示出了本申请一种故障定位方法实施例的流程图,本实施例可以应用于计算设备(例如,服务器)的定位装置上,在本实施例中,以NVME盘为例进行说明,服务器的背板上配置有多个NVME盘,本实施例可以包括以下步骤:
步骤301:检测多个NVME盘是否出现故障,如果是,则进入步骤302。
在本实施例中,首先检测服务器的背板上的各插槽中的多个NVME盘是否出现故障,如果出现故障再触发后续的故障定位过程。具体的,在实际应用中,服务器在进行数据处理的时候,会对各个NVME盘产生读写命令,读写命令可以包括读取命令和写入命令。例如,用户向服务器发送了一个请求,请求读取名称为“2016年工作总结”的文件,而该文件保存在产品序列号为“XA160809”的NVME盘中,则服务器会向该NVME盘发送一个读取命令,以便读取到“2016年工作总结”的文件并返回用户。
再例如,如果用户发送了一封邮件,邮件中的附件为“XX品牌服装价格明细表”的表格文件,服务器会将该附件进行保存,假设保存至产品序列码为“XB160910”的NVME盘中,则服务器会生成一个针对该NVME盘写入命令,该写入命令用于向该NVME盘写入“XX品牌服装价格明细表”的表格文件。
因此,在实际应用中,可以在触发所述多个NVME盘的读写命令的情况下,判断在对应的NVME盘上是否能执行读写命令,来对NVME盘是否出现故障进行判断。仍以上述例子进行说明,如果针对产品序列码为“XA160809”的NVME盘的读取命令无法执行,即无法从该NVME盘读取出“2016年工作总结”的文件,即可确认该NVME盘出现了故障。写入命令也一样,如果向产品序列码为“XB160910”的NVME盘写入“XX品牌服装价格明细表”的表格文件的写入命令无法执行,即无法成功将该表格文件保存至该NVME盘中,则确认产品序列码为“XB160910”的NVME盘出现了故障。
步骤302:获取故障NVME盘的产品序列码。
在确认某个或某几个NVME盘出现故障的时候,可以先获取出现故障的NVME盘的产品序列码。具体的,在某个或某几个NVME盘出现故障的时候,例如,不能执行读写命令的时候,就获取这些不能执行的读写命令中携带的读写地址,并依据读写地址来获取相对应的产品序列码。例如,从产品序列号为“XA160809”的NVME盘中读取目标文件的读取命令,包括了读取地址“C:/XA160809”和待读取的文件名称“2016年工作总结”,则可以从读取命令中包括的读取地址“C:/XA160809”来获取故障NVME盘的产品序列码“XA160809”。
步骤303:依据所述产品序列码和物理标识的目标对应关系,定位所述故障NVME盘在所述服务器上的插槽位置。
在本实施例中,各个NVME盘的产品序列码和物理标识的目标对应关系,就可以保存在预设的目标关系表中,本步骤可以在所述目标关系表中,查询故障NVME盘的产品序列码是否存在,如果存在,则直接获取故障NVME盘的产品序列码相对应的物理标识,因为物理标识是NVME盘在服务器的背板上的插槽号,所以依据所述物理标识对应的插槽号,就可以定位故障NVME盘在服务器的背板上的插槽位置。例如,物理标识为“3”,则可以定位到服务器的背板上的第3个插槽位置上插入的NVME盘就是故障NVME盘。
在实际应用中,还可以对故障NVME盘进行更换,则在步骤303之后还可以包括步骤304:
步骤304:将定位的插槽位置上的故障NVME盘更换为其他NVME盘。
在服务器的背板上定位了故障NVME盘的插槽位置之后,就可以直接将该插槽位置中的NVME盘进行更换,更换成其他的正常NVME盘,以免浪费服务器背板上的插槽位置,并且提高服务器的存储能力。
在本实施例中,如果检测到PCIE接口盘出现了故障,先根据故障PCIE接口盘的产品序列码,以及预先生成的、产品序列码和物理标识之间的目标对应关系,直接定位故障PCIE接口盘在服务器的背板上的插槽位置,从而可以精确定位故障PCIE接口盘,并提高更换PCIE接口盘的效率。
参考图4所示,在本实施例中,为本申请服务器生成对应关系并且进行故障定位的整体流程图。在步骤401处服务器的操作系统启动,然后步骤402处BIOS系统初始化,从而在步骤403处获得服务器中各个PCIE接口盘的产品序列码、总线端口标识和两者的第一参考关系;在执行步骤402和步骤403的同时,带外CPLD系统在步骤404处上电,然后带外CPLD系统在步骤405处获取到各个PCIE接口盘的物理标识和总线端口标识以及两者的第二参考关系;最后服务器在步骤406处根据第一参考关系和第二参考关系生成物理标识和产品序列码之间的目标对应关系,并保存至目标关系表中。在后续步骤407实时故障定位时,针对出现故障的PCIE接口盘的产品序列码,直接从目标关系表中查询到对应的物理标识,实现故障PCIE接口盘的定位。
本申请实施例还挺了另一种应用于计算设备上的定位方法,该计算设备例如服务器也包括:多个PCIE接口盘;该定位方法具体可以包括:
步骤B1:获取多个PCIE接口盘中至少一个PCIE接口盘的产品序列码,其中,所述多个PCIE接口盘中至少一个PCIE接口盘称为第一PCIE接口盘。
步骤B2:依据所述产品序列码和物理标识的目标对应关系,定位所述第一PCIE接口盘在所述计算设备上的插槽位置。
其中,所述目标对应关系可以保存在预设的目标关系表中,首先可以在目标关系表中,查询所述第一PCIE接口盘的产品序列码是否存在,如果存在,则获取所述第一PCIE接口盘的产品序列码对应的物理标识;所述物理标识为:PCIE接口盘在所述服务器的背板上的插槽号。如果不存在,则结束流程即可。在查询到插槽号之后,依据物理标识对应的插槽号,定位第一PCIE接口盘在所述服务器的背板上的插槽位置。
具体的,产品序列码、生成目标对应关系及定位的其他详细介绍,可以参考图2和图3对应的实施例,在此不再赘述。
对于前述的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
与上述本申请一种故障定位方法实施例所提供的方法相对应,参见图5,本申请还提供了一种故障定位装置实施例,在本实施例中,该装置可以集成于服务器端,该装置可以包括:
检测单元501,用于检测所述多个PCIE接口盘是否出现故障。
其中,所述检测单元501具体可以包括:
判断子单元,用于响应于触发所述多个PCIE接口盘的读写命令,判断在所述多个PCIE接口盘上是否能执行所述读写命令。
序列码获取单元502,用于在所述检测单元的结果为是的情况下,获取故障PCIE接口盘的产品序列码。
其中,所述序列码获取单元502具体可以包括:
地址获取子单元,用于获取不能执行的、所述读写命令中携带的读写地址;和,序列码获取子单元,用于并依据所述读写地址获取相对应的产品序列码。
定位单元503,用于依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置。
其中,目标对应关系可以保存在预设的目标关系表中,所述定位单元具体可以包括:查询子单元,用于在所述目标关系表中,查询所述故障PCIE接口盘的产品序列码是否存在;和,标识获取子单元,用于在所述查询子单元的结果为是的情况下,获取所述故障PCIE接口盘的产品序列码对应的物理标识;所述物理标识为:PCIE接口盘在所述服务器的背板上的插槽号;和,定位子单元,用于依据所述物理标识对应的插槽号,定位所述故障PCIE接口盘在所述服务器的背板上的插槽位置。
其中,该定位装置还可以包括:
更换单元504,用于将所述定位的插槽位置上的故障PCIE接口盘更换为其他PCIE接口盘。
在本申请实施例中,通过BIOS初始化可以获取到多个PCIE接口盘的产品序列码和总线端口标识之间的第一参考关系,并且通过带外CPLD系统可以获取到多个PCIE接口盘的物理标识和总线端口标识之间的第二参考关系,依据第一参考关系和第二参考关系即可得到各PCIE接口盘的物理标识和产品序列码之间的目标对应关系,从而可以根据各PCIE接口盘的产品序列码直接定位到服务器的背板上的插槽号码。进而,这种目标对应关系还可以保存在存储器中,以便在PCIE接口盘出现故障的时候,从PCIE接口盘的产品序列码找到服务器的背板上的插槽位置,并对出现故障的PCIE接口盘进行更换。
参考图6所示,本申请还提供了一种PCIE接口盘的对应关系的生成装置实施例,在本实施例中,该生成装置可以包括:
第一获取单元601,用于响应于基本输入输出系统BIOS初始化,获取服务器上多个非易失性规范PCIE接口盘的产品序列码、总线端口标识及其第一参考关系。
第二获取单元602,用于响应于带外CPLD系统上电,获取所述带外CPLD系统读取到的PCIE接口盘的物理标识、总线端口标识及其第二参考关系;所述物理标识用于唯一标识所述PCIE接口盘在所述服务器的背板上的插槽位置。
生成单元603,用于依据所述第一参考关系和第二参考关系,生成所述多个PCIE接口盘的、物理标识和产品序列码的目标对应关系。
其中,该生成装置还可以包括:
保存单元604,用于将所述多个PCIE接口盘的物理标识、产品序列码以及目标对应关系,保存至预设的目标关系表中。
其中,该生成装置还可以包括:
时间判断单元,用于判断是否到达预设的时间周期;和,更新单元,用于在所述时间判断单元的结果为是的情况下,依据所述带外CPLD系统实时获取的、更新的PCIE接口盘的物理标识和总线端口标识,更新所述第二参考关系。
在本实施例中,如果检测到PCIE接口盘出现了故障,先根据故障PCIE接口盘的产品序列码,以及预先生成的、产品序列码和物理标识之间的目标对应关系,直接定位故障PCIE接口盘在服务器的背板上的插槽位置,从而可以精确定位故障PCIE接口盘,并提高更换PCIE接口盘的效率。
本申请实施例还提供了一种计算机可读介质,该计算机可读介质存储有使计算机执行用于故障定位的程序,该处理包括以下步骤:检测步骤,其检测所述多个PCIE接口盘是否出现故障;序列码获取步骤,其在检测步骤检测到故障的情况下,获取故障PCIE接口盘的产品序列码;以及,定位步骤,其依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置。
本申请实施例还提供了另一种计算机可读介质,该计算机可读介质存储有使计算机执行用于PCIE接口盘的对应关系的生成的程序,该处理包括以下步骤:获取步骤,其响应于基本输入输出系统BIOS初始化,获取服务器上多个非易失性规范PCIE接口盘的产品序列码、总线端口标识及其第一参考关系;获取步骤,其响应于带外CPLD系统上电,获取所述带外CPLD系统读取到的PCIE接口盘的物理标识、总线端口标识及其第二参考关系;所述物理标识用于唯一标识所述PCIE接口盘在所述服务器的背板上的插槽位置;以及,生成步骤,其依据所述第一参考关系和第二参考关系,生成所述多个PCIE接口盘的、物理标识和产品序列码的目标对应关系。
图7为本申请实施例中一种计算机设备700的硬件结构示意图。计算设备700可用于实现故障定位,例如可以是客户端。在本实施例中,计算机设备700具体可以包括:处理器701、存储器702、网络接口703和总线系统704。
所述总线系统704,用于将计算机设备700的各个硬件组件耦合在一起。
所述网络接口703,用于实现计算机设备700与至少一个其它计算机设备之间的通信连接,可以使用互联网,广域网,本地网,城域网等方式。
所述存储器702,用于存储程序指令和/或数据。
所述处理器701,用于读取存储器702中存储的指令和/或数据,执行以下操作:
检测所述多个PCIE接口盘是否出现故障,如果是,则获取故障PCIE接口盘的产品序列码;依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置。
其中,所述对应关系保存在预设的目标关系表中,所述依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置,可以包括:
在所述目标关系表中,查询所述故障PCIE接口盘的产品序列码是否存在,如果是,则获取所述故障PCIE接口盘的产品序列码对应的物理标识;所述物理标识为:PCIE接口盘在所述服务器的背板上的插槽号;
依据所述物理标识对应的插槽号,定位所述故障PCIE接口盘在所述服务器的背板上的插槽位置。
其中,所述处理器701还可以执行以下指令:
将所述定位的插槽位置上的故障PCIE接口盘更换为其他PCIE接口盘。
其中,所述检测所述多个PCIE接口盘是否出现故障,可以包括:
响应于触发所述多个PCIE接口盘的读写命令,判断在所述多个PCIE接口盘上是否能执行所述读写命令。
其中,所述获取故障PCIE接口盘的产品序列码,可以包括:
获取不能执行的、所述读写命令中携带的读写地址,并依据所述读写地址获取相对应的产品序列码。
在另外一种计算机设备的实施例中,图7所示的计算机设备还可以用于PCIE接口盘的对应关系的生成,则在本实施例中,所述处理器701,用于读取存储器702中存储的指令和/或数据,可以执行以下操作:
响应于基本输入输出系统BIOS初始化,获取服务器上多个非易失性规范PCIE接口盘的产品序列码、总线端口标识及其第一参考关系;响应于带外CPLD系统上电,获取所述带外CPLD系统读取到的PCIE接口盘的物理标识、总线端口标识及其第二参考关系;所述物理标识用于唯一标识所述PCIE接口盘在所述服务器的背板上的插槽位置;以及,依据所述第一参考关系和第二参考关系,生成所述多个PCIE接口盘的、物理标识和产品序列码的目标对应关系。
在本实施例中,所述处理器701还可以执行以下指令:
将所述多个PCIE接口盘的物理标识、产品序列码以及目标对应关系,保存至预设的目标关系表中。
在本实施例中,所述处理器701还可以执行以下指令:
判断是否到达预设的时间周期,如果是,依据所述带外CPLD系统实时获取的、更新的PCIE接口盘的物理标识和总线端口标识,更新所述第二参考关系。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的故障定位方法及装置、对应关系的生成方法及装置、计算机可读介质和计算机设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (16)

1.一种故障定位方法,其特征在于,该方法应用于计算设备上,所述计算设备包括:多个PCIE接口盘;该方法包括:
检测所述多个PCIE接口盘是否出现故障,如果是,则获取故障PCIE接口盘的产品序列码;
依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述计算设备上的插槽位置。
2.根据权利要求1所述的方法,其特征在于,所述对应关系保存在预设的目标关系表中,所述依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置,包括:
在所述目标关系表中,查询所述故障PCIE接口盘的产品序列码是否存在,如果是,则获取所述故障PCIE接口盘的产品序列码对应的物理标识;所述物理标识为:PCIE接口盘在所述服务器的背板上的插槽号;
依据所述物理标识对应的插槽号,定位所述故障PCIE接口盘在所述服务器的背板上的插槽位置。
3.根据权利要求1所述的方法,其特征在于,还包括:
将所述定位的插槽位置上的故障PCIE接口盘更换为其他PCIE接口盘。
4.根据权利要求1所述的方法,其特征在于,所述检测所述多个PCIE接口盘是否出现故障,包括:
响应于触发所述多个PCIE接口盘的读写命令,判断在所述多个PCIE接口盘上是否能执行所述读写命令。
5.根据权利要求4所述的方法,其特征在于,所述获取故障PCIE接口盘的产品序列码,包括:
获取不能执行的、所述读写命令中携带的读写地址,并依据所述读写地址获取相对应的产品序列码。
6.一种PCIE接口盘的对应关系的生成方法,其特征在于,该生成方法包括:
响应于基本输入输出系统BIOS初始化,获取服务器上多个非易失性规范PCIE接口盘的产品序列码、总线端口标识及其第一参考关系;
响应于带外CPLD系统上电,获取所述带外CPLD系统读取到的PCIE接口盘的物理标识、总线端口标识及其第二参考关系;所述物理标识用于唯一标识所述PCIE接口盘在所述服务器的背板上的插槽位置;
依据所述第一参考关系和第二参考关系,生成所述多个PCIE接口盘的、物理标识和产品序列码的目标对应关系。
7.根据权利要求6所述的方法,其特征在于,还包括:
将所述多个PCIE接口盘的物理标识、产品序列码以及目标对应关系,保存至预设的目标关系表中。
8.根据权利要求6所述的方法,其特征在于,还包括:
判断是否到达预设的时间周期,如果是,依据所述带外CPLD系统实时获取的、更新的PCIE接口盘的物理标识和总线端口标识,更新所述第二参考关系。
9.一种故障定位装置,其特征在于,该定位装置集成于计算设备上,该定位装置包括:
检测单元,用于检测所述多个PCIE接口盘是否出现故障;
序列码获取单元,用于在所述检测单元的结果为是的情况下,获取故障PCIE接口盘的产品序列码;
定位单元,用于依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置。
10.一种PCIE接口盘的对应关系的生成装置,其特征在于,该生成装置包括:
第一获取单元,用于响应于基本输入输出系统BIOS初始化,获取服务器上多个非易失性规范PCIE接口盘的产品序列码、总线端口标识及其第一参考关系;
第二获取单元,用于响应于带外CPLD系统上电,获取所述带外CPLD系统读取到的PCIE接口盘的物理标识、总线端口标识及其第二参考关系;所述物理标识用于唯一标识所述PCIE接口盘在所述服务器的背板上的插槽位置;
生成单元,用于依据所述第一参考关系和第二参考关系,生成所述多个PCIE接口盘的、物理标识和产品序列码的目标对应关系。
11.一种计算机可读介质,该计算机可读介质存储有使计算机执行用于故障定位的程序,该处理包括以下步骤:
检测步骤,其检测所述多个PCIE接口盘是否出现故障;
序列码获取步骤,其在检测步骤检测到故障的情况下,获取故障PCIE接口盘的产品序列码;以及
定位步骤,其依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置。
12.一种计算机可读介质,该计算机可读介质存储有使计算机执行用于PCIE接口盘的对应关系的生成的程序,该处理包括以下步骤:
获取步骤,其响应于基本输入输出系统BIOS初始化,获取服务器上多个非易失性规范PCIE接口盘的产品序列码、总线端口标识及其第一参考关系;
获取步骤,其响应于带外CPLD系统上电,获取所述带外CPLD系统读取到的PCIE接口盘的物理标识、总线端口标识及其第二参考关系;所述物理标识用于唯一标识所述PCIE接口盘在所述服务器的背板上的插槽位置;以及
生成步骤,其依据所述第一参考关系和第二参考关系,生成所述多个PCIE接口盘的、物理标识和产品序列码的目标对应关系。
13.一种计算设备,其特征在于,该计算设备包括:处理器、存储器、网络接口和总线系统;
所述总线系统,用于将所述计算机设备的各个硬件组件耦合在一起;
所述网络接口,用于实现所述计算机设备与至少一个其它计算设备之间的通信连接;
所述存储器,用于存储程序指令和/或数据;
所述处理器,用于读取所述存储器中存储的指令和/或数据,执行以下操作:
检测所述多个PCIE接口盘是否出现故障,如果是,则获取故障PCIE接口盘的产品序列码;依据所述产品序列码和物理标识的目标对应关系,定位所述故障PCIE接口盘在所述服务器上的插槽位置。
14.一种计算设备,其特征在于,该计算设备包括:处理器、存储器、网络接口和总线系统;
所述总线系统,用于将所述计算机设备的各个硬件组件耦合在一起;
所述网络接口,用于实现所述计算机设备与至少一个其它计算设备之间的通信连接;
所述存储器,用于存储程序指令和/或数据;
所述处理器,用于读取所述存储器中存储的指令和/或数据,执行以下操作:
响应于基本输入输出系统BIOS初始化,获取服务器上多个非易失性规范PCIE接口盘的产品序列码、总线端口标识及其第一参考关系;
响应于带外CPLD系统上电,获取所述带外CPLD系统读取到的PCIE接口盘的物理标识、总线端口标识及其第二参考关系;所述物理标识用于唯一标识所述PCIE接口盘在所述服务器的背板上的插槽位置;
依据所述第一参考关系和第二参考关系,生成所述多个PCIE接口盘的、物理标识和产品序列码的目标对应关系。
15.一种定位方法,其特征在于,该方法应用于计算设备上,所述计算设备包括:多个PCIE接口盘;该方法包括:
获取多个PCIE接口盘中至少一个PCIE接口盘的产品序列码,其中,所述多个PCIE接口盘中至少一个PCIE接口盘称为第一PCIE接口盘;
依据所述产品序列码和物理标识的目标对应关系,定位所述第一PCIE接口盘在所述计算设备上的插槽位置。
16.根据权利要求15所述的方法,其特征在于,所述对应关系保存在预设的目标关系表中,所述依据所述产品序列码和物理标识的目标对应关系,定位所述第一PCIE接口盘在所述服务器上的插槽位置,包括:
在所述目标关系表中,查询所述第一PCIE接口盘的产品序列码是否存在,如果是,则获取所述第一PCIE接口盘的产品序列码对应的物理标识;所述物理标识为:PCIE接口盘在所述服务器的背板上的插槽号;
依据所述物理标识对应的插槽号,定位所述第一PCIE接口盘在所述服务器的背板上的插槽位置。
CN201710240088.8A 2017-04-13 2017-04-13 故障定位方法及装置、对应关系的生成方法及装置 Pending CN108733500A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710240088.8A CN108733500A (zh) 2017-04-13 2017-04-13 故障定位方法及装置、对应关系的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710240088.8A CN108733500A (zh) 2017-04-13 2017-04-13 故障定位方法及装置、对应关系的生成方法及装置

Publications (1)

Publication Number Publication Date
CN108733500A true CN108733500A (zh) 2018-11-02

Family

ID=63924404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710240088.8A Pending CN108733500A (zh) 2017-04-13 2017-04-13 故障定位方法及装置、对应关系的生成方法及装置

Country Status (1)

Country Link
CN (1) CN108733500A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109558282A (zh) * 2018-12-03 2019-04-02 郑州云海信息技术有限公司 一种pcie链路检测方法、系统及电子设备和存储介质
CN109656480A (zh) * 2018-12-12 2019-04-19 广东浪潮大数据研究有限公司 一种ssd缓存池的管理方法、系统以及装置
CN111273755A (zh) * 2018-12-04 2020-06-12 沃尔缇夫能源系统公司 一种槽位设置方法及装置
CN111342072A (zh) * 2020-03-05 2020-06-26 欣旺达电动汽车电池有限公司 电芯位置的识别方法及装置
WO2020151722A1 (zh) * 2019-01-25 2020-07-30 华为技术有限公司 故障处理方法、相关设备及计算机存储介质
TWI715066B (zh) * 2019-06-19 2021-01-01 神雲科技股份有限公司 定位叢集式儲存系統之硬碟實體裝設位置的方法
CN112349335A (zh) * 2019-08-08 2021-02-09 佛山市顺德区顺达电脑厂有限公司 定位丛集式储存系统之硬盘实体装设位置的方法
CN114758715A (zh) * 2022-04-29 2022-07-15 浪潮(山东)计算机科技有限公司 一种硬盘故障灯点亮方法、装置、设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100131693A1 (en) * 2008-11-21 2010-05-27 Inventec Corporation Hard disk system state monitoring method
CN103067485A (zh) * 2012-12-25 2013-04-24 曙光信息产业(北京)有限公司 云存储系统的磁盘监控方法
CN103763129A (zh) * 2013-12-31 2014-04-30 华为技术有限公司 一种PCIe设备管理方法及装置
CN105468482A (zh) * 2014-08-29 2016-04-06 研祥智能科技股份有限公司 一种硬盘盘位识别和故障诊断方法及其服务器设备
CN105589776A (zh) * 2015-12-23 2016-05-18 华为技术有限公司 一种故障定位方法及服务器
CN106933575A (zh) * 2017-02-27 2017-07-07 郑州云海信息技术有限公司 一种带外识别服务器资产信息的系统及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100131693A1 (en) * 2008-11-21 2010-05-27 Inventec Corporation Hard disk system state monitoring method
CN103067485A (zh) * 2012-12-25 2013-04-24 曙光信息产业(北京)有限公司 云存储系统的磁盘监控方法
CN103763129A (zh) * 2013-12-31 2014-04-30 华为技术有限公司 一种PCIe设备管理方法及装置
CN105468482A (zh) * 2014-08-29 2016-04-06 研祥智能科技股份有限公司 一种硬盘盘位识别和故障诊断方法及其服务器设备
CN105589776A (zh) * 2015-12-23 2016-05-18 华为技术有限公司 一种故障定位方法及服务器
CN106933575A (zh) * 2017-02-27 2017-07-07 郑州云海信息技术有限公司 一种带外识别服务器资产信息的系统及方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109558282A (zh) * 2018-12-03 2019-04-02 郑州云海信息技术有限公司 一种pcie链路检测方法、系统及电子设备和存储介质
CN109558282B (zh) * 2018-12-03 2021-10-29 郑州云海信息技术有限公司 一种pcie链路检测方法、系统及电子设备和存储介质
CN111273755A (zh) * 2018-12-04 2020-06-12 沃尔缇夫能源系统公司 一种槽位设置方法及装置
CN109656480A (zh) * 2018-12-12 2019-04-19 广东浪潮大数据研究有限公司 一种ssd缓存池的管理方法、系统以及装置
US11994940B2 (en) 2019-01-25 2024-05-28 Huawei Cloud Computing Technologies Co., Ltd. Fault processing method, related device, and computer storage medium
WO2020151722A1 (zh) * 2019-01-25 2020-07-30 华为技术有限公司 故障处理方法、相关设备及计算机存储介质
TWI715066B (zh) * 2019-06-19 2021-01-01 神雲科技股份有限公司 定位叢集式儲存系統之硬碟實體裝設位置的方法
CN112349335A (zh) * 2019-08-08 2021-02-09 佛山市顺德区顺达电脑厂有限公司 定位丛集式储存系统之硬盘实体装设位置的方法
CN112349335B (zh) * 2019-08-08 2024-05-28 佛山市顺德区顺达电脑厂有限公司 定位丛集式储存系统之硬盘实体装设位置的方法
CN111342072A (zh) * 2020-03-05 2020-06-26 欣旺达电动汽车电池有限公司 电芯位置的识别方法及装置
CN111342072B (zh) * 2020-03-05 2023-03-14 欣旺达电动汽车电池有限公司 电芯位置的识别方法及装置
CN114758715B (zh) * 2022-04-29 2023-12-22 浪潮(山东)计算机科技有限公司 一种硬盘故障灯点亮方法、装置、设备及可读存储介质
CN114758715A (zh) * 2022-04-29 2022-07-15 浪潮(山东)计算机科技有限公司 一种硬盘故障灯点亮方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN108733500A (zh) 故障定位方法及装置、对应关系的生成方法及装置
CN101589592B (zh) 多协议可移动存储设备
JP5074457B2 (ja) 計算機システム、スイッチ切り替え方法及びpciスイッチ
EP2585933B1 (en) Routing i/o expansion requests and responses in a pcie architecture
CN105589776B (zh) 一种故障定位方法及服务器
CN106030548B (zh) 用于可信计算的多节点中枢
CN106817402B (zh) 缓存数据的处理方法及装置
CN106406847A (zh) 远端系统配置管理方法、系统及非暂态可读式存储多媒体
JP2019036301A5 (zh)
CN102929745B (zh) 一种虚拟设备状态数据的更新方法及装置
CN103562874B (zh) 解除配置存储级内存命令
CN101202764A (zh) 确定虚拟以太网适配器的链路状态的方法和系统
CN101599046A (zh) 一种内存检测方法及装置
US20090083467A1 (en) Method and System for Handling Interrupts Within Computer System During Hardware Resource Migration
US20060112308A1 (en) Selection of status data from synchronous redundant devices
CN107733982A (zh) 一种数据同步方法、终端设备、云端服务器及系统
CN106168918A (zh) 扩展纠错编码数据存储
CN104679567A (zh) 一种持续保存fru信息的设计方法
CN109766147A (zh) 一种更新smbios中pcie丝印信息的方法
CN109462507A (zh) 配置更新方法、装置、系统及电子设备
CN107145399A (zh) 一种共享内存管理方法及共享内存管理设备
US7603585B2 (en) Systems and methods for updating field replaceable units
CN108156015A (zh) 数据的更新方法和装置
CN107430391B (zh) 管理系统
CN108629477A (zh) 设备信息管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181102