CN110674008B - Ssd的问题盘日志信息收集方法、装置、设备及介质 - Google Patents
Ssd的问题盘日志信息收集方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN110674008B CN110674008B CN201910844424.9A CN201910844424A CN110674008B CN 110674008 B CN110674008 B CN 110674008B CN 201910844424 A CN201910844424 A CN 201910844424A CN 110674008 B CN110674008 B CN 110674008B
- Authority
- CN
- China
- Prior art keywords
- serial number
- solid state
- disk
- number set
- log information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 239000007787 solid Substances 0.000 claims abstract description 97
- 230000004044 response Effects 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3037—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明实施例公开了一种NVME SSD的问题盘日志信息收集方法、装置、设备及计算机可读存储介质。其中,方法包括预先在所有固态硬盘的接口处设置通过相应PCIE设备可发送自身序列号的功能,获取当前服务器中处于正常运行状态下的各固态硬盘相应NVME设备响应的序列号,生成第一序列号集;根据服务器中所有固态硬盘通过相应PCIE设备主动发送的序列号生成第二序列号集;若第一序列号集和第二序列号集包含的序列号个数不同,则根据第一序列号集和第二序列号集定位问题盘的目标序列号;分别对各目标序列号对应的PCIE设备进行轮询搜索,并下发日志收集命令,得到各问题盘的日志信息。本申请实现了在不影响其他正常盘的情况下,有效、快速地收集问题盘的日志信息。
Description
技术领域
本公开涉及固态硬盘的故障检测技术领域,特别是涉及一种NVME SSD的问题盘日志信息收集方法、装置、设备及计算机可读存储介质。
背景技术
随着互联网、云技术的快速发展,数据呈现爆炸式增长,相应的数据存储技术也面临着严峻的挑战。在大数据时代,海量数据的存储位于越来重要的地位,在CPU等计算部件速率越来越高的同时,数据的存储成为系统性能提升的瓶颈。固态硬盘(Solid StateDrive,SSD)由于其读写速度快、能耗低,且随着NAND价格逐渐下降,而被广泛应用。
NVME(Non-Volatile Memory Express,非易失性内存主机控制器接口规范)硬盘为目前服务器领域性能比较高端的一种硬盘类型,其接口基于PCIE(peripheralcomponent interconnect express,高速串行计算机扩展总线标准)协议,具有接口速率高、IO吞吐快的特点。
NVME SSD作为新一代存储器件,广泛应用在数据中心的最低端,承载着数据存储的关键任务。为了满足服务器的巨大数据量存储要求,一般都是在服务器底层设置多块SSD共同使用。对应这种应用场景,如果SSD集群中的某一个或某几个盘片出现故障,相关技术通常基于NVME上层协议来实现故障定位或故障排查,但是这种方法不仅会影响其他正常盘的使用;而且如果出现故障的问题盘对应的NVME设备丢失,那么基于NVME协议便无法实现故障定位。
鉴于此,如何在不影响其他正常盘的情况下,有效、快速地收集问题盘的日志信息,是本领域技术人员需要解决的问题。
发明内容
本公开实施例提供了一种NVME SSD的问题盘日志信息收集方法、装置、设备及计算机可读存储介质,实现了在不影响其他正常盘的情况下,有效、快速地收集问题盘的日志信息。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明实施例一方面提供了一种NVME SSD的问题盘日志信息收集方法,预先在所有固态硬盘的接口处设置通过相应PCIE设备发送自身序列号,包括:
获取当前服务器中处于正常运行状态下的各固态硬盘相应NVME设备响应的序列号,生成第一序列号集;
根据所述服务器中所有固态硬盘通过相应PCIE设备主动发送的序列号生成第二序列号集;
若所述第一序列号集和所述第二序列号集包含的序列号个数不同,则根据所述第一序列号集和所述第二序列号集定位问题盘的目标序列号;
分别对各目标序列号对应的PCIE设备进行轮询搜索,并下发日志收集命令,得到各问题盘的日志信息。
可选的,所述根据所述服务器中所有固态硬盘相应PCIE设备主动发送的序列号生成第二序列号集包括:
通过lspci命令确定各固态硬盘的PCIE设备,并向相应PCIE设备下发SN收集命令;
接收各固态硬盘通过相应PCIE设备发送的自身序列号,并存储至所述第二序列号集。
可选的,所述获取当前服务器中处于正常运行状态下的各固态硬盘相应NVME设备响应的序列号,生成第一序列号集包括:
通过nvme list命令遍历所述服务器中处于正常运行状态下的各固态硬盘的SN号,并保存至所述第一序列号集。
可选的,根据所述第一序列号集和所述第二序列号集定位问题盘的目标序列号包括:
对比所述第一序列号集和所述第二序列号集;
将所述第二序列号集比所述第一序列号集多出来的序列号作为对应丢失NVME设备的问题盘的目标序列号,并存储至第三序列号集。
可选的,所述根据所述服务器中所有固态硬盘通过相应PCIE设备主动发送的序列号生成第二序列号集包括:
预先为各固态硬盘通过相应PCIE设备主动发送的序列号的操作设置优先级,且低于用户读写操作请求的优先级;
判断第一固态硬盘当前时刻是否接收或处理用户读写操作请求;
若否,则所述第一固态硬盘通过相应PCIE设备主动发送自己的序列号;
若是,则所述第一固态硬盘根据优先级依次处理用户读写操作请求和序列号发送操作。
本发明实施例另一方面提供了一种NVME SSD的问题盘日志信息收集装置,包括:
预处理模块,用于预先在所有固态硬盘的接口处设置通过相应PCIE设备发送自身序列号;
第一序列号集生成模块,用于获取当前服务器中处于正常运行状态下的各固态硬盘相应NVME设备响应的序列号,生成第一序列号集;
第二序列号集生成模块,用于根据所述服务器中所有固态硬盘通过相应PCIE设备主动发送的序列号生成第二序列号集;
问题盘序列号确定模块,用于若所述第一序列号集和所述第二序列号集包含的序列号个数不同,则根据所述第一序列号集和所述第二序列号集定位问题盘的目标序列号;
问题盘日志收集模块,用于分别对各目标序列号对应的PCIE设备进行轮询搜索,并下发日志收集命令,得到各问题盘的日志信息。
可选的,还包括优先级设置子模块,用于预先为各固态硬盘通过相应PCIE设备主动发送的序列号的操作设置优先级,且低于用户读写操作请求的优先级。
可选的,所述第二序列号集生成模块包括:
判断子模块,用于判断第一固态硬盘当前时刻是否接收或处理用户读写操作请求;
序列号发送子模块,用于若第一固态硬盘当前时刻没有接收或处理用户读写操作请求,则所述第一固态硬盘通过相应PCIE设备主动发送自己的序列号;
优先处理操作确定子模块,则若第一固态硬盘当前时刻接收或处理用户读写操作请求,则根据优先级依次处理用户读写操作请求和序列号发送操作。
本发明实施例还提供了一种NVME SSD的问题盘日志信息收集设备,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述NVME SSD的问题盘日志信息收集方法的步骤。
本发明实施例最后还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有NVME SSD的问题盘日志信息收集程序,所述NVME SSD的问题盘日志信息收集程序被处理器执行时实现如前任一项所述NVME SSD的问题盘日志信息收集方法的步骤。
本申请提供的技术方案的优点在于,预先在所有固态硬盘的接口处设置可通过相应PCIE设备发送自身序列号的功能,然后收集系统中各固态硬盘的PCIE设备和NVME设备的SN状态信息,由于在部分盘发生正常逻辑故障时,NVME设备会丢失,但PCIE设备会保留,故比较两种设备反馈的SN号可确定丢失NVME设备的问题盘,最后通过对问题盘PCIE设备进行序列号匹配和日志生成,从而保证在不影响正常盘的情况下有效、准确、快速地收集问题盘日志信息,可快速定位并修复问题盘,提升系统的稳定性和可靠性。
此外,本发明实施例还针对NVME SSD的问题盘日志信息收集方法提供了相应的实现装置、设备及计算机可读存储介质,进一步使得所述方法更具有实用性,所述装置、设备及计算机可读存储介质具有相应的优点。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
为了更清楚的说明本发明实施例或相关技术的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种NVME SSD的问题盘日志信息收集方法的流程示意图;
图2为本发明实施例提供的另一种NVME SSD的问题盘日志信息收集方法的流程示意图;
图3为本发明实施例提供的NVME SSD的问题盘日志信息收集装置的一种具体实施方式结构图;
图4为本发明实施例提供的NVME SSD的问题盘日志信息收集装置的另一种具体实施方式结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在介绍了本发明实施例的技术方案后,下面详细的说明本申请的各种非限制性实施方式。
首先参见图1,图1为本发明实施例提供的一种NVME SSD的问题盘日志信息收集方法的流程示意图,本发明实施例可包括以下内容:
S101:获取当前服务器中处于正常运行状态下的各固态硬盘相应NVME设备响应的序列号,生成第一序列号集。
可以理解的是,当前服务器上多块SSD盘在运行,可通过lspci命令查询看到各固态硬盘对应的PCIE设备,通过nvme list命令可以查询看到各固态硬盘响应的NVME设备。本发明实施例是针对固态硬盘故障后,故障的固态硬盘对应的NVME设备丢失了,也就是无法查询到问题盘对应的NVME设备,NVME协议在该种应用场景便无法应用。若是,故障的固态硬盘对应的NVME设备仍可以查询得到,可基于NVME协议进行问题盘定位。可选的,可通过nvmelist命令遍历服务器中处于正常运行状态下的各固态硬盘的SN号,并保存至第一序列号集。第一序列号集中各SN号对应的固态硬盘均是系统或服务器中处于正常运行状态的盘片。
S102:根据服务器中所有固态硬盘通过相应PCIE设备主动发送的序列号生成第二序列号集。
在本申请中,可预先在所有固态硬盘的接口处设置通过相应PCIE设备发送自身序列号的功能。然后可通过lspci命令确定各固态硬盘的PCIE设备,并向相应PCIE设备下发SN收集命令;接收各固态硬盘通过相应PCIE设备发送的自身序列号,并存储至第二序列号集。第二序列号集中包含的各SN号对应的固态硬盘为系统或服务器所有固态硬盘之一,也就是说,第二序列号集中的SN号对应的固态硬盘可能为正常运行的固态硬盘,也可能为已经发生故障的固态硬盘。若系统中没有问题盘,则第二序列号集和第一序列号集中包含的SN号的个数相同;若第二序列号集中的SN总数多于第一序列号集的SN号总数,那么势必存在丢失NVME设备的问题盘。
S103:判断第一序列号集和第二序列号集包含的序列号个数不同,若是,则执行S104。
S104:根据第一序列号集和第二序列号集定位问题盘的目标序列号。
可选的,可通过对比第一序列号集和第二序列号集的各SN号,将第二序列号集比第一序列号集多出来的序列号作为对应丢失NVME设备的问题盘的目标序列号,并存储至第三序列号集。
S105:分别对各目标序列号对应的PCIE设备进行轮询搜索,并下发日志收集命令,得到各问题盘的日志信息。
在本申请中,可对第三序列号集中的每个SN号对应的PCIE设备进行轮询搜索,并下发日志收集命令,从而将问题盘的日志收集上来。
在本发明实施例提供的技术方案中,预先在所有固态硬盘的接口处设置可通过相应PCIE设备发送自身序列号的功能,然后收集系统中各固态硬盘的PCIE设备和NVME设备的SN状态信息,由于在部分盘发生正常逻辑故障时,NVME设备会丢失,但PCIE设备会保留,故比较两种设备反馈的SN号可确定丢失NVME设备的问题盘,最后通过对问题盘PCIE设备进行序列号匹配和日志生成,从而保证在不影响正常盘的情况下有效、准确、快速地收集问题盘日志信息,可快速定位并修复问题盘,提升系统的稳定性和可靠性。
可以理解的是,固态硬盘还需要处理用户的读写操作请求,为了保证用户操作带宽,保证对用户操作的响应速度,提升系统性能。基于上述实施例,本申请还提供了另外一个实施例,参见图2,图2为本发明实施例提供的另一种NVME SSD的问题盘日志信息收集方法的流程示意图,本发明实施例例如可应用于数据中心,具体的可包括以下内容:
S201:预先在所有固态硬盘的接口处设置通过相应PCIE设备发送自身序列号。
S202:预先为各固态硬盘通过相应PCIE设备主动发送的序列号的操作设置优先级。
在本发明实施例中,为了保证用户操作带宽,预设设置各固态硬盘通过相应PCIE设备主动发送的序列号操作的优先级低于用户读写操作请求的优先级,优先处理用户的读写操作请求,在闲时定位问题盘。以第一固态硬盘为例,判断第一固态硬盘当前时刻是否接收或处理用户读写操作请求;若否,则第一固态硬盘通过相应PCIE设备主动发送自己的序列号;若是,则第一固态硬盘根据优先级依次处理用户读写操作请求和序列号发送操作。
S203:通过nvme list命令遍历所述服务器中处于正常运行状态下的各固态硬盘的SN号,并保存至所述第一序列号集。
S204:通过lspci命令确定各固态硬盘的PCIE设备,并向相应PCIE设备下发SN收集命令。
S205:接收各固态硬盘根据优先级执行通过相应PCIE设备发送的自身序列号,并存储至所述第二序列号集。
S206:对比第一序列号集和第二序列号集,将第二序列号集比所述第一序列号集多出来的序列号作为对应丢失NVME设备的问题盘的目标序列号,并存储至第三序列号集。
S207:分别对第三序列号集中的各序列号对应的PCIE设备进行轮询搜索,并下发日志收集命令,得到各问题盘的日志信息。
其中,S201和S202的执行顺序本申请并不限制,也可先执行S202或二者同时执行。本发明实施例与上述实施例相同的方法或步骤,可参阅上述实施例的描述,此实施例,便不再赘述。
由上可知,本发明实施例不仅可保证用户读写操作带宽,还可实现在不影响其他正常盘的情况下,有效、快速地收集问题盘的日志信息。
本发明实施例还针对NVME SSD的问题盘日志信息收集方法提供了相应的实现装置,进一步使得所述方法更具有实用性。下面对本发明实施例提供的NVME SSD的问题盘日志信息收集装置进行介绍,下文描述的NVME SSD的问题盘日志信息收集装置与上文描述的NVME SSD的问题盘日志信息收集方法可相互对应参照。
参见图3,图3为本发明实施例提供的NVME SSD的问题盘日志信息收集装置在一种具体实施方式下的结构图,该装置可包括:
预处理模块301,用于预先在所有固态硬盘的接口处设置通过相应PCIE设备发送自身序列号。
第一序列号集生成模块302,用于获取当前服务器中处于正常运行状态下的各固态硬盘相应NVME设备响应的序列号,生成第一序列号集。
第二序列号集生成模块303,用于根据服务器中所有固态硬盘通过相应PCIE设备主动发送的序列号生成第二序列号集。
问题盘序列号确定模块304,用于若第一序列号集和第二序列号集包含的序列号个数不同,则根据第一序列号集和第二序列号集定位问题盘的目标序列号。
问题盘日志收集模块305,用于分别对各目标序列号对应的PCIE设备进行轮询搜索,并下发日志收集命令,得到各问题盘的日志信息。
可选的,在本实施例的一些实施方式中,所述装置例如还可以包括优先级设置子模块306,用于预先为各固态硬盘通过相应PCIE设备主动发送的序列号的操作设置优先级,且低于用户读写操作请求的优先级。
基于上述实施例,所述第二序列号集生成模块303具体可包括:
判断子模块,用于判断第一固态硬盘当前时刻是否接收或处理用户读写操作请求;
序列号发送子模块,用于若第一固态硬盘当前时刻没有接收或处理用户读写操作请求,则第一固态硬盘通过相应PCIE设备主动发送自己的序列号;
优先处理操作确定子模块,则若第一固态硬盘当前时刻接收或处理用户读写操作请求,则根据优先级依次处理用户读写操作请求和序列号发送操作。
作为一种可选的实施方式,所述第二序列号集生成模块303还可包括:
命令下发子模块,用于通过lspci命令确定各固态硬盘的PCIE设备,并向相应PCIE设备下发SN收集命令;
生成子模块,用于接收各固态硬盘通过相应PCIE设备发送的自身序列号,并存储至所述第二序列号集。
可选的,在本实施例的一些实施方式中,所述第二序列号集生成模块303还可用于:
通过lspci命令确定各固态硬盘的PCIE设备,并向相应PCIE设备下发SN收集命令;接收各固态硬盘通过相应PCIE设备发送的自身序列号,并存储至第二序列号集。
在本实施例的另一些实施方式中,所述第一序列号集生成模块302还可用于:通过nvme list命令遍历服务器中处于正常运行状态下的各固态硬盘的SN号,并保存至第一序列号集。
此外,在其他一些实施方式中,所述问题盘序列号确定模块304还可用于:对比第一序列号集和第二序列号集;将第二序列号集比第一序列号集多出来的序列号作为对应丢失NVME设备的问题盘的目标序列号,并存储至第三序列号集。
本发明实施例所述NVME SSD的问题盘日志信息收集装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例实现了在不影响其他正常盘的情况下,有效、快速地收集问题盘的日志信息。
本发明实施例还提供了一种NVME SSD的问题盘日志信息收集设备,具体可包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序以实现如上任意一实施例所述NVME SSD的问题盘日志信息收集方法的步骤。
本发明实施例所述NVME SSD的问题盘日志信息收集设备的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例实现了在不影响其他正常盘的情况下,有效、快速地收集问题盘的日志信息。
本发明实施例还提供了一种计算机可读存储介质,存储有NVME SSD的问题盘日志信息收集程序,所述NVME SSD的问题盘日志信息收集程序被处理器执行时如上任意一实施例所述NVME SSD的问题盘日志信息收集方法的步骤。该存储介质可以为U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例所述计算机可读存储介质的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例实现了在不影响其他正常盘的情况下,有效、快速地收集问题盘的日志信息。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种NVME SSD的问题盘日志信息收集方法、装置、设备及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本公开进行若干改进和修饰,这些改进和修饰也落入本公开权利要求的保护范围内。
Claims (10)
1.一种NVME SSD的问题盘日志信息收集方法,其特征在于,预先在所有固态硬盘的接口处设置通过相应PCIE设备发送自身序列号,包括:
获取当前服务器中处于正常运行状态下的各固态硬盘相应NVME设备响应的序列号,生成第一序列号集;
根据所述服务器中所有固态硬盘通过相应PCIE设备主动发送的序列号生成第二序列号集;
若所述第一序列号集和所述第二序列号集包含的序列号个数不同,则根据所述第一序列号集和所述第二序列号集定位问题盘的目标序列号;
分别对各目标序列号对应的PCIE设备进行轮询搜索,并下发日志收集命令,得到各问题盘的日志信息。
2.根据权利要求1所述的NVME SSD的问题盘日志信息收集方法,其特征在于,所述根据所述服务器中所有固态硬盘通过相应PCIE设备主动发送的序列号生成第二序列号集包括:
通过lspci命令确定各固态硬盘的PCIE设备,并向相应PCIE设备下发SN收集命令;
接收各固态硬盘通过相应PCIE设备发送的自身序列号,并存储至所述第二序列号集。
3.根据权利要求2所述的NVME SSD的问题盘日志信息收集方法,其特征在于,所述获取当前服务器中处于正常运行状态下的各固态硬盘相应NVME设备响应的序列号,生成第一序列号集包括:
通过nvme list命令遍历所述服务器中处于正常运行状态下的各固态硬盘的SN号,并保存至所述第一序列号集。
4.根据权利要求3所述的NVME SSD的问题盘日志信息收集方法,其特征在于,根据所述第一序列号集和所述第二序列号集定位问题盘的目标序列号包括:
对比所述第一序列号集和所述第二序列号集;
将所述第二序列号集比所述第一序列号集多出来的序列号作为对应丢失NVME设备的问题盘的目标序列号,并存储至第三序列号集。
5.根据权利要求1至4任意一项所述的NVME SSD的问题盘日志信息收集方法,其特征在于,所述根据所述服务器中所有固态硬盘通过相应PCIE设备主动发送的序列号生成第二序列号集包括:
预先为各固态硬盘通过相应PCIE设备主动发送的序列号的操作设置优先级,且低于用户读写操作请求的优先级;
判断第一固态硬盘当前时刻是否接收或处理用户读写操作请求;
若否,则所述第一固态硬盘通过相应PCIE设备主动发送自己的序列号;
若是,则所述第一固态硬盘根据优先级依次处理用户读写操作请求和序列号发送操作。
6.一种NVME SSD的问题盘日志信息收集装置,其特征在于,包括:
预处理模块,用于预先在所有固态硬盘的接口处设置通过相应PCIE设备发送自身序列号;
第一序列号集生成模块,用于获取当前服务器中处于正常运行状态下的各固态硬盘相应NVME设备响应的序列号,生成第一序列号集;
第二序列号集生成模块,用于根据所述服务器中所有固态硬盘通过相应PCIE设备主动发送的序列号生成第二序列号集;
问题盘序列号确定模块,用于若所述第一序列号集和所述第二序列号集包含的序列号个数不同,则根据所述第一序列号集和所述第二序列号集定位问题盘的目标序列号;
问题盘日志收集模块,用于分别对各目标序列号对应的PCIE设备进行轮询搜索,并下发日志收集命令,得到各问题盘的日志信息。
7.根据权利要求6所述的NVME SSD的问题盘日志信息收集装置,其特征在于,还包括优先级设置子模块,用于预先为各固态硬盘通过相应PCIE设备主动发送的序列号的操作设置优先级,且低于用户读写操作请求的优先级。
8.根据权利要求7所述的NVME SSD的问题盘日志信息收集装置,其特征在于,所述第二序列号集生成模块包括:
判断子模块,用于判断第一固态硬盘当前时刻是否接收或处理用户读写操作请求;
序列号发送子模块,用于若第一固态硬盘当前时刻没有接收或处理用户读写操作请求,则所述第一固态硬盘通过相应PCIE设备主动发送自己的序列号;
优先处理操作确定子模块,则若第一固态硬盘当前时刻接收或处理用户读写操作请求,则根据优先级依次处理用户读写操作请求和序列号发送操作。
9.一种NVME SSD的问题盘日志信息收集设备,其特征在于,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至5任一项所述NVME SSD的问题盘日志信息收集方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有NVMESSD的问题盘日志信息收集程序,所述NVME SSD的问题盘日志信息收集程序被处理器执行时实现如权利要求1至5任一项所述NVME SSD的问题盘日志信息收集方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910844424.9A CN110674008B (zh) | 2019-09-06 | 2019-09-06 | Ssd的问题盘日志信息收集方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910844424.9A CN110674008B (zh) | 2019-09-06 | 2019-09-06 | Ssd的问题盘日志信息收集方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110674008A CN110674008A (zh) | 2020-01-10 |
CN110674008B true CN110674008B (zh) | 2022-08-02 |
Family
ID=69076627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910844424.9A Active CN110674008B (zh) | 2019-09-06 | 2019-09-06 | Ssd的问题盘日志信息收集方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110674008B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822015A (zh) * | 2020-06-16 | 2021-12-21 | 北京沃东天骏信息技术有限公司 | 序列号生成方法、装置、电子设备及计算机可读介质 |
CN111858532B (zh) * | 2020-07-17 | 2023-01-10 | 苏州浪潮智能科技有限公司 | 固态硬盘日志导出方法、系统、装置及可读存储介质 |
CN118132118B (zh) * | 2024-04-30 | 2024-08-23 | 苏州元脑智能科技有限公司 | 固件升级方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109240883A (zh) * | 2018-08-30 | 2019-01-18 | 郑州云海信息技术有限公司 | 定位smart报错硬盘的方法、系统、设备及存储介质 |
-
2019
- 2019-09-06 CN CN201910844424.9A patent/CN110674008B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109240883A (zh) * | 2018-08-30 | 2019-01-18 | 郑州云海信息技术有限公司 | 定位smart报错硬盘的方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110674008A (zh) | 2020-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110062025B (zh) | 数据采集的方法、装置、服务器及存储介质 | |
CN110674008B (zh) | Ssd的问题盘日志信息收集方法、装置、设备及介质 | |
EP3149591B1 (en) | Tracking application deployment errors via cloud logs | |
US8954545B2 (en) | Fast determination of compatibility of virtual machines and hosts | |
US7962803B2 (en) | Apparatus, system, and method for multi-address space tracing | |
US20200125473A1 (en) | Hybrid log viewer with thin memory usage | |
CN109614276A (zh) | 故障处理方法、装置、分布式存储系统和存储介质 | |
CN101149665B (zh) | 将iSCSI目标名称映射到存储资源的方法和计算系统 | |
CN110134738B (zh) | 分布式存储系统资源预估方法、装置 | |
US11409711B2 (en) | Barriers for dependent operations among sharded data stores | |
US11782609B2 (en) | Method and apparatus for auditing abnormality of block device in cloud platform, device, and storage medium | |
CN103927305B (zh) | 一种对内存溢出进行控制的方法和设备 | |
WO2019128299A1 (zh) | 一种测试系统及测试方法 | |
CN112506915A (zh) | 一种应用数据的管理系统以及处理方法、装置和服务器 | |
US20180004797A1 (en) | Application resiliency management using a database driver | |
CN113190417A (zh) | 微服务状态检测方法、模型的训练方法、设备及存储介质 | |
CN110647318A (zh) | 一种有状态应用的实例创建方法、装置、设备及介质 | |
CN111526038B (zh) | 业务请求分发方法、装置、计算机设备及可读存储介质 | |
CN116643906B (zh) | 云平台故障的处理方法、装置、电子设备及存储介质 | |
CN107729182B (zh) | 数据存储和访问的方法及装置 | |
CN110209550A (zh) | 存储介质的故障处理方法、装置、电子设备及存储介质 | |
CN117421167A (zh) | 硬件存储设备的性能瓶颈检测方法、装置及计算设备 | |
CN107340974B (zh) | 一种虚拟磁盘的迁移方法及迁移装置 | |
CN115686746A (zh) | 访问方法、任务处理方法、计算设备及计算机存储介质 | |
CN111506422B (zh) | 事件分析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |