CN112002370B - 一种识别磁盘异常的方法、装置及分布式存储系统 - Google Patents

一种识别磁盘异常的方法、装置及分布式存储系统 Download PDF

Info

Publication number
CN112002370B
CN112002370B CN202010716540.5A CN202010716540A CN112002370B CN 112002370 B CN112002370 B CN 112002370B CN 202010716540 A CN202010716540 A CN 202010716540A CN 112002370 B CN112002370 B CN 112002370B
Authority
CN
China
Prior art keywords
disk
request
scsi
module
error code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010716540.5A
Other languages
English (en)
Other versions
CN112002370A (zh
Inventor
李海静
马平川
张书东
蓝海
李庆林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fiberhome Telecommunication Technologies Co Ltd
Original Assignee
Fiberhome Telecommunication Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fiberhome Telecommunication Technologies Co Ltd filed Critical Fiberhome Telecommunication Technologies Co Ltd
Priority to CN202010716540.5A priority Critical patent/CN112002370B/zh
Publication of CN112002370A publication Critical patent/CN112002370A/zh
Application granted granted Critical
Publication of CN112002370B publication Critical patent/CN112002370B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C29/08Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
    • G11C29/12Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
    • G11C29/44Indication or identification of errors, e.g. for repair

Abstract

本发明属于分布式存储技术领域,涉及一种识别磁盘异常的方法、装置及分布式存储系统。该方法包括:通过虚拟块设备向内核模块中部署OSD与磁盘的映射关系;当所述OSD读写磁盘时,将接收到的IO请求提交给所述虚拟块设备,在所述虚拟块设备发送所述IO请求后,所述内核模块截获所述IO请求;所述内核模块根据所述映射关系将所述IO请求经SCSI层提交给所述OSD对应的磁盘;当所述IO请求在所述磁盘响应失败时,所述内核模块获取SCSI错误码,并解析所述SCSI错误码;根据所述SCSI错误码的解析结果识别所述磁盘的异常。本发明提供的识别磁盘异常的方法、装置及分布式存储系统能获取磁盘的SCSI错误码,根据SCSI错误码识别磁盘的异常,从而最大限度的保证了系统稳定运行。

Description

一种识别磁盘异常的方法、装置及分布式存储系统
技术领域
本发明属于分布式数据存储技术领域,更具体地涉及一种识别磁盘异常的方法、装置及分布式存储系统。
背景技术
磁盘作为分布式存储系统中数据最终存储的地方,磁盘的故障在存储系统中非常常见,集群中单个或少量磁盘出现故障后如何保证系统业务不受影响,是存储软件必须解决的问题。
在分布式存储系统中,当磁盘出现异常情况时,会导致IO请求处理失败,OSD(Object Storage Device,对象存储设备)会收到IO请求失败的响应,该响应一般是针对部分错误码进行简单的重试,而对于大部分错误会触发OSD异常退出。
发明人在实现本发明实施例的过程中,发现相关技术至少存在以下技术问题:1)对于本可以进行容错修复的错误未修复,导致磁盘最终被踢出集群,错误的磁盘当坏盘处理,增加了系统运营成本;2)OSD异常退出触发集群视图变更,会引起IO性能波动;3)OSD异常退出后触发数据重构,影响集群整体的IO性能。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种识别磁盘异常的方法、装置及分布式存储系统,其目的在于准确识别出磁盘的异常情况,以解决系统运营成本高、进程异常退出引起的IO性能波动的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种识别磁盘异常的方法,所述方法应用于分布式存储系统,所述分布式存储系统包括至少一台应用主机,所述至少一台应用主机包括内核模块和虚拟块设备,所述方法包括:
通过所述虚拟块设备向所述内核模块中部署OSD与磁盘的映射关系;
当所述OSD读写磁盘时,将接收到的IO请求提交给所述虚拟块设备,在所述虚拟块设备发送所述IO请求后,所述内核模块截获所述IO请求;
所述内核模块根据所述映射关系将所述IO请求经SCSI层提交给所述OSD对应的磁盘;
当所述IO请求在所述磁盘响应失败时,所述内核模块获取SCSI错误码,并解析所述SCSI错误码;
根据所述SCSI错误码的解析结果识别所述磁盘的异常。
可选地,所述内核模块部署于Linux系统内核的BIO层,所述内核模块用于与所述SCSI层进行交互。
可选地,所述在所述虚拟块设备发送所述IO请求后,所述内核模块截获所述IO请求,具体包括:
在所述虚拟块设备发送所述IO请求至所述Linux系统内核的VFS层时,所述内核模块从所述VFS层截获所述IO请求。
可选地,所述根据所述SCSI错误码的解析结果识别所述磁盘的异常,包括:
对所述SCSI错误码的解析结果进行分类,并分别处理所述分类的结果;
其中,所述分类包括需要重试的IO、需要重置的IO、坏扇区错误以及不可修复错误。
可选地,所述方法还包括:
获取IO错误次数、IO时延信息以及磁盘SMART信息;
根据所述SCSI错误码的解析结果、所述IO错误次数、所述IO时延信息以及所述磁盘SMART信息对所述磁盘进行故障预测;
根据所述故障预测的结果对所述磁盘进行预防处理。
按照本发明的另一方面,提供了一种识别磁盘异常的装置,所述装置应用于分布式存储系统,所述分布式存储系统包括至少一台应用主机,所述至少一台应用主机包括内核模块和虚拟块设备,所述装置包括:
信息部署模块,用于通过所述虚拟块设备向所述内核模块中部署OSD与磁盘的映射关系;
数据处理模块,用于当所述OSD读写磁盘时,将接收到的IO请求提交给所述虚拟块设备,在所述虚拟块设备发送所述IO请求后,所述内核模块截获所述IO请求;
数据提交模块,用于所述内核模块根据所述映射关系将所述IO请求经SCSI层提交给所述OSD对应的磁盘;
错误码解析模块,用于当所述IO请求在所述磁盘响应失败时,所述内核模块获取SCSI错误码,并解析所述SCSI错误码;
磁盘异常识别模块,用于根据所述SCSI错误码的解析结果识别所述磁盘的异常。
可选地,所述内核模块部署于Linux系统内核的BIO层,所述内核模块用于与所述SCSI层进行交互。
可选地,所述磁盘异常识别模块具体用于:
对所述SCSI错误码的解析结果进行分类,并分别处理所述分类的结果;
其中,所述分类包括需要重试的IO、需要重置的IO、坏扇区错误以及不可修复错误。
可选地,所述装置还包括:
信息获取模块,用于获取IO错误次数、IO时延信息以及磁盘SMART信息;
故障预测模块,用于根据所述SCSI错误码的解析结果、所述IO错误次数、所述IO时延信息以及所述磁盘SMART信息对所述磁盘进行故障预测;
预处理模块,用于根据所述故障预测的结果对所述磁盘进行预防处理。
按照本发明的又一方面,提供了一种分布式存储系统,所述分布式存储系统包括:至少一台应用主机;
所述至少一台应用主机包括:
至少一个处理器;
与所述至少一个处理器通信连接的存储器;
以及内核模块和虚拟块设备;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够基于所述内核模块和所述虚拟块设备执行如上所述的识别磁盘异常的方法。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有如下有益效果:本发明实施例提供了一种识别磁盘异常的方法、装置及分布式存储系统,通过增加内核模块和虚拟块设备,获取磁盘的SCSI错误码,根据所述SCSI错误码的解析结果识别出磁盘的异常情况,由此,可以针对不同的错误码在软件层面进行详细处理,最大限度的确保了系统稳定运行;对于真正的硬件故障,也可以主动触发节点隔离,从而避免了进程异常退出引起的IO性能波动、数据重构等问题。
附图说明
一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是本发明实施例提供的一种分布式存储系统的结构示意图;
图2是本发明实施例提供的一种分布式存储系统中OSD提交IO请求给磁盘的流程示意图;
图3是本发明实施例提供的一种识别磁盘异常的方法的流程图;
图4是本发明另一实施例提供的一种识别磁盘异常的方法的流程图;
图5是本发明实施例提供的一种识别磁盘异常的装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
请参阅图1,图1是本发明实施例提供的一种分布式存储系统的结构示意图。所述分布式存储系统100包括至少一台应用主机10,所述应用主机10具体可以是服务器,所述分布式存储系统100可以将多台服务器组成一个超大服务器集群。在该服务器集群中,包括配置中心和存储节点。其中,可以是一台或多台应用主机10构成所述配置中心,所述存储节点包括一个或多个,每一个存储节点可以由一台或多台应用主机10构成。所述存储节点与所述配置中心通信连接,所述配置中心用于管理所述存储节点的资源分配、存储等。比如,所述配置中心将所述存储节点中的每一应用主机10的磁盘资源整合到一起,形成一个巨大的资源池,对外提供存储服务,按需分配给应用使用。
其中,所述应用主机10的操作系统可以是Linux操作系统,所述Linux操作系统包括系统内核。在本实施例中,在所述系统内核中设置内核模块,比如将其命名为kernel_mod。所述内核模块用于在OSD下发IO请求时,通过所述内核模块截获所述IO请求,由所述内核模块与SCSI(Small Computer System Interface,小型计算机系统接口)层进行交互,从而可以避免BIO(Block input output,块设备的输入/输出)层对SCSI错误码进行转化,导致OSD无法感知磁盘上的真实错误。其中,所述SCSI错误码是SCSI设备在处理IO请求时,当发生错误后针对不同错误原因定义的错误码。SCSI错误码可以通过Sense key、Sensecode、Sense qualifier三部分组成,例如Sense key:3Sense code:11Sense qualifier:0,表示的SCSI错误码是:Medium Error–unrecovered read error,即读到了坏扇区。
具体地,请参阅图2,所述内核模块可以设于系统内核的BIO层。可以理解的是,当磁盘完成IO请求处理后会返回处理结果,所述处理结果经过所述BIO层之后,由于Linux系统对设备进行抽象封装,BIO层会向上屏蔽不同类型块设备之间的差异,对于SCSI层和磁盘自然也会屏蔽SCSI协议中定义的各类错误码,所以当底层磁盘发生异常引起IO错误后,SCSI层返回的错误码在BIO层会进行转换,转换为所述BIO层的通用错误码,比如EIO错误码等,所述EIO是Linux系统中定义的一个错误码,其具体定义比如:#define EIO 5/*I/Oerror*/,即表示IO失败。BIO层再将所述通用错误码通过VFS(Virtual File System,虚拟文件系统)层返回给OSD,OSD获得所述通用错误码后并不能感知底层磁盘真正的错误,从而无法进行细分处理。因此,在本实施例中,通过在BIO层设置所述内核模块,通过所述内核模块与SCSI层进行交互,避免通用BIO层对SCSI层错误码进行转化,导致OSD无法感知磁盘上的真实错误。
其中,所述内核模块可以按照Linux标准的内核模块进行开发,可以在操作系统启动或业务需要时通过insmod(insert module,载入驱动模块)标准命令在操作系统中插入所述内核模块。所述insmod标准命令用于加载模块,通过模式的方式在需要时载入内核,可使内核精简,高效。此类载入的模块,通常为设备驱动程序。在所述内核模块插入BIO层后,自动在操作系统中虚拟出一个块设备,即虚拟块设备,其名称可以自定义,比如/dev/block_dev等。
其中,当OSD启动时不再打开原始的磁盘,而是打开由新增内核模块虚拟出的所述虚拟块设备,并将OSD与磁盘的映射关系添加至所述内核模块中,通过所述内核模块的内存维护所述OSD与磁盘的映射关系。在分布式存储系统(比如ceph)中OSD与磁盘通常是一一对应的,每个OSD进程对应一块磁盘。可以预先设置好所述OSD与所述磁盘的映射关系。
其中,在OSD运行过程中需要提交IO请求至所述磁盘时,由于OSD启动阶段打开的是所述虚拟块设备,所以下发的所述IO请求经过所述VFS层处理后会被所述内核模块截获,所述内核模块按照内存中维护的所述OSD与磁盘的映射关系,将所述IO请求经所述SCSI层提交给OSD对应的磁盘。其中,IO请求经过OSD应用软件层处理后最终写入磁盘或从磁盘读取,OSD对磁盘进行读写,并在磁盘上的IO请求发生错误时,感知详细的错误原因。在所述IO请求返回时,按照原路径返回,所述内核模块获取SCSI错误码并解析所述SCSI错误码,将解析的结果返回给OSD,所述OSD可以根据所述返回的结果对错误码进行分类处理。
其中,所述内核模块可以根据SCSI标准协议解析所述SCSI错误码。在所述协议中包含详细的错误原因以及错误码定义,在协议数据包中携带有错误码,通过解析所述SCSI标准协议即可获取所述SCSI错误码。
其中,所述OSD根据返回的结果对错误码进行分类处理具体可以包括:
a)对于需要重试的IO请求进行重试处理;
b)对于需要重置的IO进行重置(reset,即重启)处理;
c)对于坏扇区错误,可通过触发读修复从其他正常副本读取数据,重新写入本地进行修复;
d)对于不可修复错误,则触发OSD上报monitor集群,将故障节点踢出集群,避免故障重启影响系统稳定运行。
在其他一些实施例中,所述内核模块还可以用于统计磁盘信息、IO信息、SCSI错误码信息等,根据这些信息进一步对磁盘故障进行预测,从而提升系统的可靠性。例如,所述内核模块还用于获取IO错误次数、IO时延信息以及磁盘SMART(Self-Monitoring Analysisand Reporting Technology,自我监测、分析及报告技术)信息;根据所述SCSI错误码的解析结果、所述IO错误次数、所述IO时延信息以及所述磁盘SMART信息对所述磁盘进行故障预测;根据所述故障预测的结果对所述磁盘进行预防处理。
需要说明的是,当所述应用主机10包括多个OSD和多个磁盘时,只需在所述应用主机10的系统内核中增加一个所述内核模块和虚拟块设备,通过所述一个内核模块和虚拟块设备维护全部OSD与磁盘的对应关系。
在本实施例中,如图1所示,所述应用主机10还包括一个或多个处理器11,以及存储器12,图1中以一个处理器11为例。处理器11和存储器12可以通过总线或其他方式连接,图1中以通过总线连接为例。
存储器12作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的识别磁盘异常的方法对应的程序指令/模块(例如,图5中的各个模块)。处理器11基于上述内核模块和上述虚拟块设备,通过运行存储在存储器12中的非易失性软件程序、非易失性计算机可执行程序以及模块,从而执行所述应用主机10的各种功能应用以及数据处理,即实现下述方法实施例识别磁盘异常的方法。
存储器12可以包括存储程序区和存储数据区,其中,存储程序区可存储包含所述内核模块和所述虚拟块设备的操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据识别磁盘异常的装置的使用所创建的数据等。此外,存储器12可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器12可选包括相对于处理器11远程设置的存储器,这些远程设置的存储器可以通过网络连接至识别磁盘异常的装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或多个模块存储在所述存储器12中,当被所述一个或多个处理器11执行时,执行下述方法实施例中的识别磁盘异常的方法,例如,图3和图4所示的方法。
本发明实施例提供的分布式存储系统100可以执行本发明实施例所提供的识别磁盘异常的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例提供的方法。
请参阅图3,图3是本发明实施例提供的一种识别磁盘异常的方法的流程图。所述方法可以应用于上述分布式存储系统100,所述方法包括:
S101、通过所述虚拟块设备向所述内核模块中部署OSD与磁盘的映射关系;
其中,所述OSD与磁盘的映射关系包括每一OSD对应的磁盘,具体可以是一一对应的关系。OSD提交的IO请求根据所述映射关系提交所述IO请求至所述OSD对应的磁盘。
S102、当所述OSD读写磁盘时,将接收到的IO请求提交给所述虚拟块设备,在所述虚拟块设备发送所述IO请求后,所述内核模块截获所述IO请求;
其中,所述虚拟块设备是内核系统中自定义的内核模块生成的。所述内核模块部署于Linux系统内核的BIO层,所述内核模块用于与Linux系统内核的SCSI层进行交互,比如,所述内核模块传递IO请求至所述SCSI层,或者从所述SCSI层获取SCSI错误码。所述虚拟块设备是所述内核模块插入后在操作系统中虚拟出来的一个块设备。当OSD启动时,通过系统函数打开磁盘在操作系统中对应的块设备,比如所述虚拟块设备。
所述虚拟块设备从OSD获得IO请求后,转发给Linux系统内核的VFS层,经所述VFS层处理后,所述IO请求会被所述内核模块截获。此时,所述IO请求不是通过VFS层到达通用的BIO层,由此,可以在IO请求在磁盘得到响应后,避免该响应被BIO层转化为通用的错误码。
S103、所述内核模块根据所述映射关系将所述IO请求经SCSI层提交给所述OSD对应的磁盘;
S104、当所述IO请求在所述磁盘响应失败时,所述内核模块获取SCSI错误码,并解析所述SCSI错误码;
S105、根据所述SCSI错误码的解析结果识别所述磁盘的异常。
其中,IO请求经过OSD应用软件层处理后最终写入磁盘或从磁盘读取,OSD对磁盘进行读写,并在磁盘上的IO请求发生错误时,感知详细的错误原因。在所述IO请求返回时,按照原路径返回,所述内核模块获取SCSI错误码并解析所述SCSI错误码,将解析的结果返回给OSD,所述OSD可以根据所述返回的结果对错误码进行分类处理。
其中,所述内核模块可以根据SCSI标准协议解析所述SCSI错误码。在所述协议中包含详细的错误原因以及错误码定义,在协议数据包中携带有错误码,通过解析所述SCSI标准协议即可获取所述SCSI错误码。所述SCSI错误码是SCSI设备在处理IO请求时,当发生错误后针对不同错误原因定义的错误码。SCSI错误码可以通过Sense key、Sense code、Sense qualifier三部分组成,例如Sense key:3Sense code:11Sense qualifier:0,表示的SCSI错误码是:Medium Error–unrecovered read error,即读到了坏扇区。
其中,所述根据所述SCSI错误码的解析结果识别所述磁盘的异常,包括:对所述SCSI错误码的解析结果进行分类,并分别处理所述分类的结果。其中,所述分类包括需要重试的IO、需要重置的IO、坏扇区错误以及不可修复错误。
所述分别处理所述分类的结果包括:对于需要重试的IO请求进行重试处理;对于需要重置的IO进行重置(reset,即重启)处理;对于坏扇区错误,可通过触发读修复从其他正常副本读取数据,重新写入本地进行修复;对于不可修复错误,则触发OSD上报monitor集群,将故障节点踢出集群,避免故障重启影响系统稳定运行。
本发明实施例提供了一种识别磁盘异常的方法,该方法可以应用于上述实施例描述的分布式存储系统,该方法通过所述虚拟块设备向所述内核模块中部署OSD与磁盘的映射关系;当所述OSD读写磁盘时,将接收到的IO请求提交给所述虚拟块设备,在所述虚拟块设备发送所述IO请求后,所述内核模块截获所述IO请求;所述内核模块根据所述映射关系将所述IO请求经SCSI层提交给所述OSD对应的磁盘;当所述IO请求在所述磁盘响应失败时,所述内核模块获取SCSI错误码,并解析所述SCSI错误码;根据所述SCSI错误码的解析结果识别所述磁盘的异常。由此,本发明实施例提供的识别磁盘异常的方法能够感知磁盘的真实错误,并且针对不同的错误在应用软件层进行细分处理,从而最大限度的保证了系统稳定的运行。并且,对于真正的硬件故障,也可以主动触发节点隔离,从而避免了进程异常退出引起的IO性能波动、数据重构等问题。
需要说明的是,图3提供的识别磁盘异常的方法与上述系统实施例具有相同的发明构思,未在本发明实施例详尽描述的部分具体可以参考上述系统实施例。
请参阅图4,图4是本发明另一实施例提供的一种识别磁盘异常的方法的流程图。图4与上述图3的主要区别在于,所述方法还包括:
S106、获取IO错误次数、IO时延信息以及磁盘SMART信息;
S107、根据所述SCSI错误码的解析结果、所述IO错误次数、所述IO时延信息以及所述磁盘SMART信息对所述磁盘进行故障预测;
S108、根据所述故障预测的结果对所述磁盘进行预防处理。
其中,所述IO错误次数和IO时延信息都是所述IO请求经OSD提交给磁盘的过程中产生的,可以周期性的统计这些信息。所述磁盘SMART信息指的是磁盘的硬件检测模块检测到的信息,该信息包括磁盘健康状况、不稳定扇区数、SMART错误日志、SMART自检日志等。
所述SCSI错误码的解析结果可以是上述实施例中在OSD上结合IO流程中返回的SCSI错误码的分析结果。
所述内核模块可以根据所述SCSI错误码的解析结果、所述IO错误次数、所述IO时延信息以及所述磁盘SMART信息对所述磁盘进行故障预测,从而根据所述故障预测的结果对所述磁盘进行预防处理。
其中,对所述磁盘进行故障预测的基本思路可以是,按照磁盘IO时延信息、各种错误原因,结合磁盘的SMART信息中的部分指标进行故障预测,例如,一般会重点关注下述几个指标::
SMART 5–Reallocated_Sector_Count.
SMART 187–Reported_Uncorrectable_Errors.
SMART 188–Command_Timeout.
SMART 197–Current_Pending_Sector_Count.
SMART 198–Offline_Uncorrectable.
当检测到磁盘的这些指标接近或超过阈值时,则认为该磁盘可能在短时间内会出现故障。此时可以开始数据重构等,并将该磁盘踢出集群,从而避免了故障出现后再进行事后处理所带来的风险,比如等出现故障后再处理时,有可能在处理过程中又出现其他磁盘故障,从而造成出现多点故障引起数据丢失等问题。
本发明实施例提供的识别磁盘异常的方法,通过增加内核模块,获取磁盘的SCSI错误码,针对不同的错误码在软件层面进行详细处理,最大限度的确保系统的稳定运行,对于真正的硬件故障,也能主动触发节点隔离,避免进程异常退出引起的IO性能波动等问题。另外,通过内核模块对磁盘的SMART信息、IO性能等进行统计,从而对磁盘进行故障预测,由此,进一步提升了系统的可靠性。
请参阅图5,图5是本发明实施例提供的一种识别磁盘异常的装置的结构示意图。所述装置20可以应用于上述实施例中的分布式存储系统,所述装置20包括信息部署模块21、数据处理模块22、数据提交模块23、错误码解析模块24以及磁盘异常识别模块25。
其中,所述信息部署模块21用于通过所述虚拟块设备向所述内核模块中部署OSD与磁盘的映射关系;所述数据处理模块22用于当所述OSD读写磁盘时,将接收到的IO请求提交给所述虚拟块设备,在所述虚拟块设备发送所述IO请求后,所述内核模块截获所述IO请求;所述数据提交模块23用于所述内核模块根据所述映射关系将所述IO请求经SCSI层提交给所述OSD对应的磁盘;所述错误码解析模块24用于当所述IO请求在所述磁盘响应失败时,所述内核模块获取SCSI错误码,并解析所述SCSI错误码;所述磁盘异常识别模块25用于根据所述SCSI错误码的解析结果识别所述磁盘的异常。
其中,所述内核模块部署于Linux系统内核的BIO层,所述内核模块用于与所述SCSI层进行交互。
其中,所述磁盘异常识别模块25具体用于:
对所述SCSI错误码的解析结果进行分类,并分别处理所述分类的结果;
其中,所述分类包括需要重试的IO、需要重置的IO、坏扇区错误以及不可修复错误。
在一些实施例中,同样如图5所示,所述装置20还包括信息获取模块26、故障预测模块27和预处理模块28。所述信息获取模块26用于获取IO错误次数、IO时延信息以及磁盘SMART信息;所述故障预测模块27用于根据所述SCSI错误码的解析结果、所述IO错误次数、所述IO时延信息以及所述磁盘SMART信息对所述磁盘进行故障预测;所述预处理模块28用于根据所述故障预测的结果对所述磁盘进行预防处理。
需要说明的是,上述识别磁盘异常的装置可执行本发明实施例所提供的识别磁盘异常的方法,具备执行方法相应的功能模块和有益效果。未在识别磁盘异常的装置实施例中详尽描述的技术细节,可参见本发明实施例所提供的识别磁盘异常的方法。
本发明实施例还提供了一种非易失性计算机存储介质,所述非易失性计算机存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如图1中的一个处理器31,可使得上述一个或多个处理器可执行上述任意方法实施例中的识别磁盘异常的方法。
本发明实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被所述应用主机执行时,使所述应用主机执行上述方法实施例所述的识别磁盘异常的方法。
以上所描述的装置或设备实施例仅仅是示意性的,其中所述作为分离部件说明的单元模块可以是或者也可以不是物理上分开的,作为模块单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络模块单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明,它们没有在细节中提供;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (8)

1.一种识别磁盘异常的方法,所述方法应用于分布式存储系统,所述分布式存储系统包括至少一台应用主机,所述至少一台应用主机包括内核模块和虚拟块设备,其特征在于,所述方法包括:
通过所述虚拟块设备向所述内核模块中部署OSD与磁盘的映射关系;
当所述OSD读写磁盘时,将接收到的IO请求提交给所述虚拟块设备,在所述虚拟块设备发送所述IO请求后,所述内核模块截获所述IO请求;
所述内核模块根据所述映射关系将所述IO请求经SCSI层提交给所述OSD对应的磁盘;
当所述IO请求在所述磁盘响应失败时,所述内核模块获取SCSI错误码,并解析所述SCSI错误码;
根据所述SCSI错误码的解析结果识别所述磁盘的异常;
所述内核模块部署于Linux系统内核的BIO层,所述内核模块用于与所述SCSI层进行交互。
2.如权利要求1所述的方法,其特征在于,所述在所述虚拟块设备发送所述IO请求后,所述内核模块截获所述IO请求,具体包括:
在所述虚拟块设备发送所述IO请求至所述Linux系统内核的VFS层时,所述内核模块从所述VFS层截获所述IO请求。
3.如权利要求1或2所述的方法,其特征在于,所述根据所述SCSI错误码的解析结果识别所述磁盘的异常,包括:
对所述SCSI错误码的解析结果进行分类,并分别处理所述分类的结果;
其中,所述分类包括需要重试的IO、需要重置的IO、坏扇区错误以及不可修复错误。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
获取IO错误次数、IO时延信息以及磁盘SMART信息;
根据所述SCSI错误码的解析结果、所述IO错误次数、所述IO时延信息以及所述磁盘SMART信息对所述磁盘进行故障预测;
根据所述故障预测的结果对所述磁盘进行预防处理。
5.一种识别磁盘异常的装置,所述装置应用于分布式存储系统,所述分布式存储系统包括至少一台应用主机,所述至少一台应用主机包括内核模块和虚拟块设备,其特征在于,所述装置包括:
信息部署模块,用于通过所述虚拟块设备向所述内核模块中部署OSD与磁盘的映射关系;
数据处理模块,用于当所述OSD读写磁盘时,将接收到的IO请求提交给所述虚拟块设备,在所述虚拟块设备发送所述IO请求后,所述内核模块截获所述IO请求;
数据提交模块,用于所述内核模块根据所述映射关系将所述IO请求经SCSI层提交给所述OSD对应的磁盘;
错误码解析模块,用于当所述IO请求在所述磁盘响应失败时,所述内核模块获取SCSI错误码,并解析所述SCSI错误码;
磁盘异常识别模块,用于根据所述SCSI错误码的解析结果识别所述磁盘的异常;
所述内核模块部署于Linux系统内核的BIO层,所述内核模块用于与所述SCSI层进行交互。
6.如权利要求5所述的装置,其特征在于,所述磁盘异常识别模块具体用于:
对所述SCSI错误码的解析结果进行分类,并分别处理所述分类的结果;
其中,所述分类包括需要重试的IO、需要重置的IO、坏扇区错误以及不可修复错误。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:
信息获取模块,用于获取IO错误次数、IO时延信息以及磁盘SMART信息;
故障预测模块,用于根据所述SCSI错误码的解析结果、所述IO错误次数、所述IO时延信息以及所述磁盘SMART信息对所述磁盘进行故障预测;
预处理模块,用于根据所述故障预测的结果对所述磁盘进行预防处理。
8.一种分布式存储系统,其特征在于,所述分布式存储系统包括:至少一台应用主机;
所述至少一台应用主机包括:
至少一个处理器;
与所述至少一个处理器通信连接的存储器;
以及内核模块和虚拟块设备;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够基于所述内核模块和所述虚拟块设备执行权利要求1至4中任一项所述的识别磁盘异常的方法。
CN202010716540.5A 2020-07-23 2020-07-23 一种识别磁盘异常的方法、装置及分布式存储系统 Active CN112002370B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010716540.5A CN112002370B (zh) 2020-07-23 2020-07-23 一种识别磁盘异常的方法、装置及分布式存储系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010716540.5A CN112002370B (zh) 2020-07-23 2020-07-23 一种识别磁盘异常的方法、装置及分布式存储系统

Publications (2)

Publication Number Publication Date
CN112002370A CN112002370A (zh) 2020-11-27
CN112002370B true CN112002370B (zh) 2022-04-15

Family

ID=73467692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010716540.5A Active CN112002370B (zh) 2020-07-23 2020-07-23 一种识别磁盘异常的方法、装置及分布式存储系统

Country Status (1)

Country Link
CN (1) CN112002370B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732494B (zh) * 2020-12-29 2024-02-13 北京浪潮数据技术有限公司 一种存储系统的坏盘更换方法、装置、设备及介质
CN113672415A (zh) * 2021-07-09 2021-11-19 济南浪潮数据技术有限公司 一种磁盘故障处理方法、装置、设备及存储介质
CN113672422B (zh) * 2021-08-18 2024-02-13 济南浪潮数据技术有限公司 一种磁盘故障探测方法、装置、设备及可读存储介质
CN114327662A (zh) * 2021-12-30 2022-04-12 山石网科通信技术股份有限公司 操作系统的处理方法及装置、存储介质和处理器
CN115658362A (zh) * 2022-10-26 2023-01-31 超聚变数字技术有限公司 一种确定硬盘状态的方法以及相关设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222033A (zh) * 2011-06-20 2011-10-19 中兴通讯股份有限公司 一种保存小型计算机系统接口访问错误的方法及装置
CN102270173A (zh) * 2011-07-21 2011-12-07 哈尔滨工业大学 基于scsi驱动层的故障注入工具
CN103220162A (zh) * 2012-01-19 2013-07-24 百度在线网络技术(北京)有限公司 基于hdfs的scsi容错优化方法及装置
CN105224474A (zh) * 2014-06-03 2016-01-06 深圳市腾讯计算机系统有限公司 固态硬盘闪存转换层的实现系统和闪存转换层的实现装置
CN105975358A (zh) * 2016-05-03 2016-09-28 深圳市杉岩数据技术有限公司 一种基于scsi设备的容错方法及系统
CN109101331A (zh) * 2018-08-31 2018-12-28 郑州云海信息技术有限公司 一种aio请求处理的方法、系统及设备
CN110989938A (zh) * 2019-12-15 2020-04-10 苏州浪潮智能科技有限公司 一种故障盘识别方法、装置、设备及计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222033A (zh) * 2011-06-20 2011-10-19 中兴通讯股份有限公司 一种保存小型计算机系统接口访问错误的方法及装置
CN102270173A (zh) * 2011-07-21 2011-12-07 哈尔滨工业大学 基于scsi驱动层的故障注入工具
CN103220162A (zh) * 2012-01-19 2013-07-24 百度在线网络技术(北京)有限公司 基于hdfs的scsi容错优化方法及装置
CN105224474A (zh) * 2014-06-03 2016-01-06 深圳市腾讯计算机系统有限公司 固态硬盘闪存转换层的实现系统和闪存转换层的实现装置
CN105975358A (zh) * 2016-05-03 2016-09-28 深圳市杉岩数据技术有限公司 一种基于scsi设备的容错方法及系统
CN109101331A (zh) * 2018-08-31 2018-12-28 郑州云海信息技术有限公司 一种aio请求处理的方法、系统及设备
CN110989938A (zh) * 2019-12-15 2020-04-10 苏州浪潮智能科技有限公司 一种故障盘识别方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN112002370A (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
CN112002370B (zh) 一种识别磁盘异常的方法、装置及分布式存储系统
Xu et al. Improving service availability of cloud systems by predicting disk error
CN109783262B (zh) 故障数据处理方法、装置、服务器及计算机可读存储介质
US20190129833A1 (en) Method, device and computer program product for executing test cases
US10037238B2 (en) System and method for encoding exception conditions included at a remediation database
CN108536548B (zh) 一种磁盘坏道的处理方法、装置及计算机存储介质
US10698605B2 (en) Multipath storage device based on multi-dimensional health diagnosis
US20090044053A1 (en) Method, computer system, and computer program product for problem determination using system run-time behavior analysis
US9697068B2 (en) Building an intelligent, scalable system dump facility
US10891181B2 (en) Smart system dump
US20210149783A1 (en) Auto-recovery for software systems
CN110096407A (zh) 识别成员处的软故障
CN111048139A (zh) 一种存储介质检测方法、装置、设备及可读存储介质
JP5419819B2 (ja) 計算機システムの管理方法、及び管理システム
US9176806B2 (en) Computer and memory inspection method
CN108845932B (zh) 一种网络库的单元测试方法、装置、存储介质及终端
US10740088B2 (en) Countermeasure verification assistance system and method
US11645156B1 (en) Updating error policy
US20240061765A1 (en) Distributed debugging environment for a continuous integration pipeline
US11652683B2 (en) Failure notification system, failure notification method, failure notification device, and failure notification program
CN113094221A (zh) 故障注入方法、装置、计算机设备以及可读存储介质
US20240028439A1 (en) Attributing errors to input/output peripheral drivers
CN116643906A (zh) 云平台故障的处理方法、装置、电子设备及存储介质
CN114356708A (zh) 一种设备故障监控方法、装置、设备及可读存储介质
CN115484267A (zh) 多集群部署处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant