CN116775362A - 独立冗余磁盘阵列的通路阻塞处理方法、系统 - Google Patents

独立冗余磁盘阵列的通路阻塞处理方法、系统 Download PDF

Info

Publication number
CN116775362A
CN116775362A CN202310782461.8A CN202310782461A CN116775362A CN 116775362 A CN116775362 A CN 116775362A CN 202310782461 A CN202310782461 A CN 202310782461A CN 116775362 A CN116775362 A CN 116775362A
Authority
CN
China
Prior art keywords
information
disk
period
redundant array
independent disks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310782461.8A
Other languages
English (en)
Inventor
苏永奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Data Technology Co Ltd
Original Assignee
Jinan Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Data Technology Co Ltd filed Critical Jinan Inspur Data Technology Co Ltd
Priority to CN202310782461.8A priority Critical patent/CN116775362A/zh
Publication of CN116775362A publication Critical patent/CN116775362A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本申请提供一种独立冗余磁盘阵列的通路阻塞处理方法,包括:获取所述独立冗余磁盘阵列中成员盘的健康参数信息;所述健康参数包括任务信息、链路信息和性能信息;若存在目标成员盘对应的任务信息、链路信息和性能信息中至少一项存在异常,关闭所述目标成员盘的通道端口,以将所述目标成员盘从所述独立冗余磁盘阵列踢出。本申请通过获取并监控独立冗余磁盘阵列中成员盘的健康参数信息,判断成员盘的健康状态,如果成员盘出现故障,关闭对应成员盘的通道端口,实现对故障成员盘的剔除,进而避免独立冗余磁盘阵列发生通路阻塞。本申请还提供一种独立冗余磁盘阵列的通路阻塞处理系统、计算机可读存储介质和电子设备,具有上述有益效果。

Description

独立冗余磁盘阵列的通路阻塞处理方法、系统
技术领域
本申请涉及数据存储,特别涉及一种独立冗余磁盘阵列的通路阻塞处理方法、系统、计算机可读存储介质和电子设备。
背景技术
独立冗余磁盘阵列(RAID,Redundant Arrays of Independent Disks)中每个工作盘都有一个镜像盘,每次写数据时必须同时写入镜像盘,读数据时同时从工作盘和镜像盘读出。但是由于RAID1写入数据的方式,如果RAID1的工作盘或者镜像盘出现故障后,独立冗余磁盘阵列没有把故障的工作盘或者镜像盘剔除,独立冗余磁盘阵列还会一直对故障的工作盘或者镜像盘下发数据,这时就会出现IO阻塞。
发明内容
本申请的目的是提供一种独立冗余磁盘阵列的通路阻塞处理方法、独立冗余磁盘阵列的通路阻塞处理系统、计算机可读存储介质和电子设备,能够避免磁盘阵列由于成员盘故障导致的通路阻塞问题。
为解决上述技术问题,第一方面,本申请提供一种独立冗余磁盘阵列的通路阻塞处理方法,具体技术方案如下:
获取所述独立冗余磁盘阵列中成员盘的健康参数信息;所述健康参数包括任务信息、链路信息和性能信息;
若存在目标成员盘对应的任务信息、链路信息和性能信息中至少一项存在异常,关闭所述目标成员盘的通道端口,以将所述目标成员盘从所述独立冗余磁盘阵列踢出。
可选的,获取所述独立冗余磁盘阵列中成员盘的健康参数信息之后,还包括:
对所述任务信息按照第一周期进行数据校验;
对所述链路信息按照第二周期进行数据校验;
对所述性能信息按照第三周期进行数据校验;
其中,所述第一周期、所述第二周期和所述第三周期依次减小。
可选的,对所述任务信息按照第一周期进行数据校验包括:
每隔所述第一周期,判断所述任务信息中硬盘参数的变化值是否超过变化阈值;所述变化值为所述硬盘参数本周期内的查询值与上一周期的查询值之差。
可选的,对所述链路信息按照第二周期进行数据校验包括:
确定硬盘类型;
根据硬盘类型确定对应的链路健康信息关键字;
每隔第二周期,判断所述链路健康信息关键字是否符合通道端口的关闭规则;所述关闭规则包括连接重置次数阈值。
可选的,对所述性能信息按照第三周期进行数据校验包括:
每隔第三周期,对性能信息中的日志进行数据校验。
可选的,获取所述独立冗余磁盘阵列中成员盘的健康参数信息之后,还包括:
对所述独立冗余磁盘阵列中成员盘的关键参数的变化值进行校验;
对串口硬盘和固态硬盘中的备份扇区使用情况、内部逻辑块地址与真实物理地址间映射出错次数、出现不可修复错误次数、错误日志和健康参数信息读取失败进行数据统计;
对机械硬盘的错误数据、硬盘坏道和健康参数信息读取失败进行数据统计;
对通道端口的关闭规则和告警规则进行校验;
对链接重置次数计算公式进行校验;
对所述成员盘的串行总线进行健康状态校验。
可选的,获取所述独立冗余磁盘阵列中成员盘的健康参数信息之前,还包括:
判断是否存在所述通道端口的关闭记录;
若是,根据所述关闭记录执行所述通道端口的关闭;
若否,执行获取所述独立冗余磁盘阵列中成员盘的健康参数信息的步骤。
第二方面,本申请还提供一种独立冗余磁盘阵列的通路阻塞处理系统,具体技术方案如下:
获取模块,用于获取所述独立冗余磁盘阵列中成员盘的健康参数信息;所述健康参数包括任务信息、链路信息和性能信息;
异常成员盘踢出模块,用于若存在目标成员盘对应的任务信息、链路信息和性能信息中至少一项存在异常,关闭所述目标成员盘的通道端口,以将所述目标成员盘从所述独立冗余磁盘阵列踢出。
可选的,还包括:
第一校验模块,用于在执行所述获取模块执行完毕之后,对所述任务信息按照第一周期进行数据校验;
第二校验模块,用于对所述链路信息按照第二周期进行数据校验;
第三校验模块,用于对所述性能信息按照第三周期进行数据校验;
其中,所述第一周期、所述第二周期和所述第三周期依次减小。
可选的,第一校验模块包括:
第一判断单元,用于每隔所述第一周期,判断所述任务信息中硬盘参数的变化值是否超过变化阈值;所述变化值为所述硬盘参数本周期内的查询值与上一周期的查询值之差。
可选的,第二校验模块包括:
第一确定单元,用于确定硬盘类型;
第二确定单元,用于根据硬盘类型确定对应的链路健康信息关键字;
第二判断单元,用于每隔所述第二周期,判断所述链路健康信息关键字是否符合通道端口的关闭规则;所述关闭规则包括连接重置次数阈值。
可选的,第三校验模块包括:
校验单元,用于每隔所述第三周期,对性能信息中的日志进行数据校验。
可选的,还包括:
第四校验模块,用于在执行所述获取模块执行完毕之后,对所述独立冗余磁盘阵列中成员盘的关键参数的变化值进行校验;
第一统计模块,用于对串口硬盘和固态硬盘中的备份扇区使用情况、内部逻辑块地址与真实物理地址间映射出错次数、出现不可修复错误次数、错误日志和健康参数信息读取失败进行数据统计;
第二统计模块,用于对机械硬盘的错误数据、硬盘坏道和健康参数信息读取失败进行数据统计;
第五校验模块,用于对通道端口的关闭规则和告警规则进行校验;
第六校验模块,用于对链接重置次数计算公式进行校验;
第七校验模块,用于对所述成员盘的串行总线进行健康状态校验。
可选的,还包括:
判断模块,用于在执行所述获取模块执行完毕之前,判断是否存在所述通道端口的关闭记录;
关闭模块,用于若存在所述通道端口的关闭记录,根据所述关闭记录执行所述通道端口的关闭;
跳转模块,用于若不存在所述通道端口的关闭记录,跳转至所述获取模块。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的独立冗余磁盘阵列的通路阻塞处理方法的步骤。
本申请还提供一种电子设备,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上所述的独立冗余磁盘阵列的通路阻塞处理方法的步骤。
本申请提供一种独立冗余磁盘阵列的通路阻塞处理方法,包括:获取所述独立冗余磁盘阵列中成员盘的健康参数信息;所述健康参数包括任务信息、链路信息和性能信息;若存在目标成员盘对应的任务信息、链路信息和性能信息中至少一项存在异常,关闭所述目标成员盘的通道端口,以将所述目标成员盘从所述独立冗余磁盘阵列踢出。
本申请通过获取并监控独立冗余磁盘阵列中成员盘的健康参数信息,判断成员盘的健康状态,如果成员盘出现故障,关闭对应成员盘的通道端口,实现对故障成员盘的剔除,进而避免独立冗余磁盘阵列发生通路阻塞。
本申请还提供一种独立冗余磁盘阵列的通路阻塞处理系统、计算机可读存储介质和电子设备,具有上述有益效果,此处不再赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种独立冗余磁盘阵列的通路阻塞处理方法的流程图;
图2为本申请实施例所提供的一种独立冗余磁盘阵列的通路阻塞处理系统结构示意图;
图3为本申请实施例提供的一种电子设备的结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1,图1为本申请实施例所提供的一种独立冗余磁盘阵列的通路阻塞处理方法的流程图,该方法包括:
第一步、获取所述独立冗余磁盘阵列中成员盘的健康参数信息;所述健康参数包括任务信息、链路信息和性能信息;
第二步、若存在目标成员盘对应的任务信息、链路信息和性能信息中至少一项存在异常,关闭所述目标成员盘的通道端口,以将所述目标成员盘从所述独立冗余磁盘阵列踢出。
第一步中,先获取所有成员盘的健康参数信息,该健康参数信息包括任务信息、链路信息和性能信息,一旦检测出有以上三种信息中至少一种存在异常的目标成员盘,直接关闭该目标成员盘的通道端口,实现将目标成员盘从独立冗余磁盘阵列踢出。
下文针对如何根据健康参数信息进行异常检测进行说明:
一方面,可以按照如下方式进行校验:
对所述任务信息按照第一周期进行数据校验;
对所述链路信息按照第二周期进行数据校验;
对所述性能信息按照第三周期进行数据校验;
其中,所述第一周期、所述第二周期和所述第三周期依次减小。例如,对于任务信息,其第一周期可以为1分钟,即每分钟监测一次。对于链路信息,第二周期可以设为30秒,则每30秒监测一次链路信息。对于性能信息,可以每秒钟监测,以获取成员盘的实时性能变化。
具体的,对所述任务信息按照第一周期进行数据校验可以采用如下过程:
每隔所述第一周期,判断所述任务信息中硬盘参数的变化值是否超过变化阈值。该变化值为所述硬盘参数本周期内的查询值与上一周期的查询值之差。主要是例测硬盘的任务信息的关键性参数,判断硬盘的任务信息的关键性参数的变化值是否超过阈值,如果超过阈值进行告警并且剔除对应的通道端口,且任务信息的关键性参数的变化值=本周期查询的数值-上周期查询的数值。
在确定链路健康信息关键字时,可以根据硬盘类型确定对应的关键字和关键字阈值,下文表1为串口硬盘和固态硬盘的关键字信息表,包含了关键字、查询命令和对应的关键字阈值,表2为机械硬盘的关键字信息表:
表1串口硬盘和固态硬盘的关键字信息表
表2机械硬盘的关键字信息表
具体的,对所述链路信息按照第二周期进行数据校验可以包括如下步骤:
第一步、确定硬盘类型;
第二步、根据硬盘类型确定对应的链路健康信息关键字;
第三步、每隔第二周期,判断所述链路健康信息关键字是否符合通道端口的关闭规则;所述关闭规则包括连接重置次数阈值。
链路信息主要为通道端口的链路信息,以判断该链路信息变化是否超过可关闭通道端口的规则,如果超过,进行告警并关闭对应的通道端口。
在此过程中,可以关注通道端口的重连次数,若是出现通道端口的链路误码,可以仅告警而不关闭通道端口。
具体的,可以采用短周期监控或者长周期监控。
以短周期监控为例,查询周期为30秒,如果在30秒内,通道端口的链接重置的次数超过为3次,上报对应硬盘的SAS链路告警,并且关闭对应成员盘的通道端口。如果在查询周期中,通道端口的链接重置的次数小于3,但是链接重置的次数大于0,本查询周期的查询得到的链接重置次数除于2,计算结果作为下一个查询周期的基数;以此类推。
以长周期为例,其查询周期可以为6小时,如果在6小时内,通道端口的链接重置的次数超过为30次,上报对应硬盘的串口链路告警,并且关闭对应成员盘的通道端口。如果在查询周期中,通道端口的链接重置的次数小于30,但是链接重置的次数大于0,本查询周期的查询得到的链接重置次数除于2,计算结果作为下一个查询周期的基数;以此类推。
还需要说明的是,仅支持手动恢复告警,不提供自动恢复策略,且支持查询expander的通道端口状态,在更换故障硬盘后,客服手动开启通道端口;
根据短周期的踢出故障成员盘的阈值和告警(120秒change count变化超过20)阈值不同,因为独立冗余磁盘阵列中单成员盘异常造成IO阻塞后,需要在120秒内关闭通道端口。
还可以进一步对SAS链路(Serial Attached SCSI,即串行连接SCSI,一种采用了串行总线的高速互连技术的链路)进行校验,同样的,也可以发呢为长周期和短周期监控。以长周期为例,可以测试通道端口的链路误码,在一定时间内,判断出现链路误码的次数与上一周期相同时间内出现的链路误码次数进行比较。在此对于一定时间不作限定,可以为30分钟。
若采用短周期监控,在上电启动后,初始值大于初始阈值,例测通道端口的链路误码,本次查询的数值相比与上一数值变化大于阈值。以及,例测通道端口的链路误码,本次返回值比上次的记录的通道端口的链路误码有变化,记录日志。
具体的,对所述性能信息按照第三周期进行数据校验包括:
每隔第三周期,对性能信息中的日志进行数据校验。
对性能信息进行数据校验,也可以视为对性能指标的监控,主要对于系统盘的使用率或者延迟进行监控,并形成日志。例如系统盘的使用率大于50%,或系统盘的延时大于900ms。
综上,获取所述独立冗余磁盘阵列中成员盘的健康参数信息之后,可以执行但不限于如下步骤:
对所述独立冗余磁盘阵列中成员盘的关键参数的变化值进行校验;
对串口硬盘和固态硬盘中的备份扇区使用情况、内部逻辑块地址与真实物理地址间映射出错次数、出现不可修复错误次数、错误日志和健康参数信息读取失败进行数据统计;
对机械硬盘的错误数据、硬盘坏道和健康参数信息读取失败进行数据统计;
对通道端口的关闭规则和告警规则进行校验;
对链接重置次数计算公式进行校验;
对所述成员盘的串行总线进行健康状态校验。
链接重置次数计算公式可以由本领域技术人员设定,也可以采用如下公式:
链接重置次数=(通道端口的变更次数-0x03)/0x04,其中,0x03为基数,0x04为累加次数。
可见,本申请实施例可以监控通过监控成员盘的数据完整性错误、任务参数、性能指标判定硬盘的健康的状态,根据硬盘的健康状态,如果成员盘出现故障,关闭对应成员盘的端口,实现对剔除故障成员盘,进而避免IO阻塞问题。
在上述实施例的基础上,获取所述独立冗余磁盘阵列中成员盘的健康参数信息之前,还可以先判断是否存在所述通道端口的关闭记录。若存在,根据关闭记录执行通道端口的关闭,否则执行获取所述独立冗余磁盘阵列中成员盘的健康参数信息的步骤。即在对独立冗余磁盘阵列进行监控前,可以先判断此前是否需要关闭通道端口,该关闭记录可能源于上一监控周期,但通道端口关闭失败,为此,可以在监控前先执行判断,并在检测到关闭记录时进行通道端口的关闭。若未检测到关闭记录,可以对独立冗余磁盘阵列进行监控。
下文为本申请提供的一种具体通路阻塞处理过程,可以包括如下步骤:
1.支持查询的成员盘的特征参数,硬盘的特征信息包括硬盘的任务信息、硬盘对应通道端口的链路误码、协商速率、变更次数;
2.若成员盘的任务信息关键性参数变化值超过阈值,支持关闭对应通道端口;
3.若成员盘对应通道端口的变更次数的变化规律符合关闭通道端口的策略,支持关闭通道端口;
4.若双成员盘检测异常,关闭第一个检测的硬盘特征参数异常对应的通道端口;
5.在关闭通道端口的时候,支持查询通道端口的开启状态,不支持同时关闭两个成员盘对应的通道端口;
6.在关闭通道端口后,支持记录当前关闭的通道端口的信息,通道端口的信息包括通道端口id、SAS地址信息和对应硬盘的编码;
7.在系统启动后,支持根据当前的关闭的通道端口的信息,在查询对应硬盘的SN和记录信息的中的硬盘的SN一致的时候,关闭对应的通道端口;在查询到硬盘编码和记录信息的中的硬盘的编码不一致的时候,删除当前的关闭的通道端口的信息;
8.支持将关闭的通道端口的信息记录到历史记录中,通道端口的信息包括通道端口id、SAS地址信息和对应硬盘的编码;
9.在执行关闭通道端口的时候,支持根据历史关闭通道端口的信息,查询同一个硬盘进行被剔除的次数,并且告警信息包含剔除硬盘的次数;
10.支持客服手动开启已经关闭的通道端口;
11.在开启通道端口的时候,开启通道端口成功,支持删除当前关闭通道端口的信息;
12.在系统启动后,查询得到的关闭通道端口的对应的成员盘的编码与记录当前关闭通道端口的对应硬盘的编码不同,支持删除当前关闭通道端口的信息。
参见图2,本申请还提供一种独立冗余磁盘阵列的通路阻塞处理系统,包括:
获取模块100,用于获取所述独立冗余磁盘阵列中成员盘的健康参数信息;所述健康参数包括任务信息、链路信息和性能信息;
异常成员盘踢出模块200,用于若存在目标成员盘对应的任务信息、链路信息和性能信息中至少一项存在异常,关闭所述目标成员盘的通道端口,以将所述目标成员盘从所述独立冗余磁盘阵列踢出。
本申请提供的独立冗余磁盘阵列的通路阻塞处理系统,通过获取模块获取独立冗余磁盘阵列中成员盘的健康参数信息,从而判断成员盘的健康状态,如果成员盘出现故障,利用异常成员盘踢出模块关闭对应成员盘的通道端口,实现对故障成员盘的剔除,进而避免独立冗余磁盘阵列发生通路阻塞。
基于上述实施例,该通路阻塞处理系统还包括:
第一校验模块,用于在执行所述获取模块执行完毕之后,对所述任务信息按照第一周期进行数据校验;
第二校验模块,用于对所述链路信息按照第二周期进行数据校验;
第三校验模块,用于对所述性能信息按照第三周期进行数据校验;
其中,所述第一周期、所述第二周期和所述第三周期依次减小。
基于上述实施例,第一校验模块包括:
第一判断单元,用于每隔所述第一周期,判断所述任务信息中硬盘参数的变化值是否超过变化阈值;所述变化值为所述硬盘参数本周期内的查询值与上一周期的查询值之差。
基于上述实施例,第二校验模块包括:
第一确定单元,用于确定硬盘类型;
第二确定单元,用于根据硬盘类型确定对应的链路健康信息关键字;
第二判断单元,用于每隔所述第二周期,判断所述链路健康信息关键字是否符合通道端口的关闭规则;所述关闭规则包括连接重置次数阈值。
基于上述实施例,第三校验模块包括:
校验单元,用于每隔所述第三周期,对性能信息中的日志进行数据校验。
基于上述实施例,通路阻塞处理系统还包括:
第四校验模块,用于在执行所述获取模块执行完毕之后,对所述独立冗余磁盘阵列中成员盘的关键参数的变化值进行校验;
第一统计模块,用于对串口硬盘和固态硬盘中的备份扇区使用情况、内部逻辑块地址与真实物理地址间映射出错次数、出现不可修复错误次数、错误日志和健康参数信息读取失败进行数据统计;
第二统计模块,用于对机械硬盘的错误数据、硬盘坏道和健康参数信息读取失败进行数据统计;
第五校验模块,用于对通道端口的关闭规则和告警规则进行校验;
第六校验模块,用于对链接重置次数计算公式进行校验;
第七校验模块,用于对所述成员盘的串行总线进行健康状态校验。
基于上述实施例,通路阻塞处理系统还包括:
判断模块,用于在执行所述获取模块执行完毕之前,判断是否存在所述通道端口的关闭记录;
关闭模块,用于若存在所述通道端口的关闭记录,根据所述关闭记录执行所述通道端口的关闭;
跳转模块,用于若不存在所述通道端口的关闭记录,跳转至所述获取模块。
本申请还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请还提供了一种电子设备,参见图3,本申请实施例提供的一种电子设备的结构图,如图3所示,可以包括处理器1410和存储器1420。
其中,处理器1410可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1410可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1410也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1410可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1410还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1420可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1420还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器1420至少用于存储以下计算机程序1421,其中,该计算机程序被处理器1410加载并执行之后,能够实现前述任一实施例公开的独立冗余磁盘阵列的通路阻塞处理中的相关步骤。另外,存储器1420所存储的资源还可以包括操作系统1422和数据1423等,存储方式可以是短暂存储或者永久存储。其中,操作系统1422可以包括Windows、Linux、Android等。
在一些实施例中,电子设备还可包括有显示屏1430、输入输出接口1440、通信接口1450、传感器1460、电源1470以及通信总线1480。
当然,图3所示的电子设备的结构并不构成对本申请实施例中电子设备的限定,在实际应用中电子设备可以包括比图3所示的更多或更少的部件,或者组合某些部件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的系统而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种独立冗余磁盘阵列的通路阻塞处理方法,其特征在于,包括:
获取所述独立冗余磁盘阵列中成员盘的健康参数信息;所述健康参数包括任务信息、链路信息和性能信息;
若存在目标成员盘对应的任务信息、链路信息和性能信息中至少一项存在异常,关闭所述目标成员盘的通道端口,以将所述目标成员盘从所述独立冗余磁盘阵列踢出。
2.根据权利要求1所述的通路阻塞处理方法,其特征在于,获取所述独立冗余磁盘阵列中成员盘的健康参数信息之后,还包括:
对所述任务信息按照第一周期进行数据校验;
对所述链路信息按照第二周期进行数据校验;
对所述性能信息按照第三周期进行数据校验;
其中,所述第一周期、所述第二周期和所述第三周期依次减小。
3.根据权利要求2所述的通路阻塞处理方法,其特征在于,对所述任务信息按照第一周期进行数据校验包括:
每隔所述第一周期,判断所述任务信息中硬盘参数的变化值是否超过变化阈值;所述变化值为所述硬盘参数本周期内的查询值与上一周期的查询值之差。
4.根据权利要求2所述的通路阻塞处理方法,其特征在于,对所述链路信息按照第二周期进行数据校验包括:
确定硬盘类型;
根据硬盘类型确定对应的链路健康信息关键字;
每隔第二周期,判断所述链路健康信息关键字是否符合通道端口的关闭规则;所述关闭规则包括连接重置次数阈值。
5.根据权利要求2所述的通路阻塞处理方法,其特征在于,对所述性能信息按照第三周期进行数据校验包括:
每隔第三周期,对性能信息中的日志进行数据校验。
6.根据权利要求2所述的通路阻塞处理方法,其特征在于,获取所述独立冗余磁盘阵列中成员盘的健康参数信息之后,还包括:
对所述独立冗余磁盘阵列中成员盘的关键参数的变化值进行校验;
对串口硬盘和固态硬盘中的备份扇区使用情况、内部逻辑块地址与真实物理地址间映射出错次数、出现不可修复错误次数、错误日志和健康参数信息读取失败进行数据统计;
对机械硬盘的错误数据、硬盘坏道和健康参数信息读取失败进行数据统计;
对通道端口的关闭规则和告警规则进行校验;
对链接重置次数计算公式进行校验;
对所述成员盘的串行总线进行健康状态校验。
7.根据权利要求1所述的通路阻塞处理方法,其特征在于,获取所述独立冗余磁盘阵列中成员盘的健康参数信息之前,还包括:
判断是否存在所述通道端口的关闭记录;
若是,根据所述关闭记录执行所述通道端口的关闭;
若否,执行获取所述独立冗余磁盘阵列中成员盘的健康参数信息的步骤。
8.一种独立冗余磁盘阵列的通路阻塞处理系统,其特征在于,包括:
获取模块,用于获取所述独立冗余磁盘阵列中成员盘的健康参数信息;所述健康参数包括任务信息、链路信息和性能信息;
异常成员盘踢出模块,用于若存在目标成员盘对应的任务信息、链路信息和性能信息中至少一项存在异常,关闭所述目标成员盘的通道端口,以将所述目标成员盘从所述独立冗余磁盘阵列踢出。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的独立冗余磁盘阵列的通路阻塞处理方法的步骤。
10.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如权利要求1-7任一项所述的独立冗余磁盘阵列的通路阻塞处理方法的步骤。
CN202310782461.8A 2023-06-29 2023-06-29 独立冗余磁盘阵列的通路阻塞处理方法、系统 Pending CN116775362A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310782461.8A CN116775362A (zh) 2023-06-29 2023-06-29 独立冗余磁盘阵列的通路阻塞处理方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310782461.8A CN116775362A (zh) 2023-06-29 2023-06-29 独立冗余磁盘阵列的通路阻塞处理方法、系统

Publications (1)

Publication Number Publication Date
CN116775362A true CN116775362A (zh) 2023-09-19

Family

ID=87991050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310782461.8A Pending CN116775362A (zh) 2023-06-29 2023-06-29 独立冗余磁盘阵列的通路阻塞处理方法、系统

Country Status (1)

Country Link
CN (1) CN116775362A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117234793A (zh) * 2023-11-14 2023-12-15 苏州元脑智能科技有限公司 数据存储方法、系统、设备及介质
CN117785074A (zh) * 2024-02-28 2024-03-29 济南浪潮数据技术有限公司 一种输入输出超时处理的方法、装置、服务器及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117234793A (zh) * 2023-11-14 2023-12-15 苏州元脑智能科技有限公司 数据存储方法、系统、设备及介质
CN117234793B (zh) * 2023-11-14 2024-02-23 苏州元脑智能科技有限公司 数据存储方法、系统、设备及介质
CN117785074A (zh) * 2024-02-28 2024-03-29 济南浪潮数据技术有限公司 一种输入输出超时处理的方法、装置、服务器及介质

Similar Documents

Publication Publication Date Title
CN108647136B (zh) 基于smart信息和深度学习的硬盘损坏预测方法及装置
CN116775362A (zh) 独立冗余磁盘阵列的通路阻塞处理方法、系统
CN103207820B (zh) 基于raid卡日志的硬盘的故障定位方法及装置
CN111104293A (zh) 用于支持盘故障预测的方法、设备和计算机程序产品
CN104951383A (zh) 用于监测硬盘的健康状况的方法和装置
CN111078515B (zh) Ssd分层日志记录方法、装置、计算机设备及存储介质
US20200327020A1 (en) Predicting and handling of slow disk
CN111045881A (zh) 一种慢盘检测方法及系统
CN109684141A (zh) 一种磁盘故障诊断方法、装置、终端及可读存储介质
CN112017723A (zh) 存储器的掉电测试方法、装置、可读存储介质及电子设备
CN110888763A (zh) 磁盘故障诊断方法、装置、终端设备及计算机存储介质
US8843781B1 (en) Managing drive error information in data storage systems
CN103049345B (zh) 基于异步通信机制的磁盘状态变迁检测方法及装置
CN114758714A (zh) 一种硬盘故障预测方法、装置、电子设备及存储介质
CN113590405A (zh) 硬盘错误的检测方法、装置、存储介质和电子装置
Pinciroli et al. The life and death of SSDs and HDDs: Similarities, differences, and prediction models
CN107301109A (zh) 一种硬盘质量筛选方法及装置
US20070277059A1 (en) Storage device, control device, and error reporting method
CN116775406A (zh) 一种分布式存储系统的磁盘状态监控方法及装置
CN113625957B (zh) 一种硬盘故障的检测方法、装置及设备
US10776240B2 (en) Non-intrusive performance monitor and service engine
CN110083470B (zh) 磁盘分析方法、装置及计算机可读存储介质
CN107643877A (zh) 磁盘故障检测方法以及装置
CN113190179B (zh) 提升机械硬盘使用寿命的方法、存储设备及系统
CN115793990A (zh) 存储器健康状态确定方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination