CN111984481A - 一种基于分布式存储的慢盘检测方法及装置 - Google Patents

一种基于分布式存储的慢盘检测方法及装置 Download PDF

Info

Publication number
CN111984481A
CN111984481A CN202010821201.3A CN202010821201A CN111984481A CN 111984481 A CN111984481 A CN 111984481A CN 202010821201 A CN202010821201 A CN 202010821201A CN 111984481 A CN111984481 A CN 111984481A
Authority
CN
China
Prior art keywords
setting
slow
disk
slow disk
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010821201.3A
Other languages
English (en)
Inventor
聂东旭
魏坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010821201.3A priority Critical patent/CN111984481A/zh
Publication of CN111984481A publication Critical patent/CN111984481A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种基于分布式存储的慢盘检测方法及装置,所述方法包括如下步骤:在分布式存储集群各存储节点为IO性能数据设置门限开关,并配置门限参数;设置对象存储设备OSD监控其所在的存储节点,根据门限开关状态以及门限参数配置值,判断存储节点是否为慢盘,以及在约定周期内慢盘判定次数达到约定次数时,将慢盘上报集群控制器;设置集群控制器隔离慢盘,更新对象存储设备OSD映射,将隔离慢盘数据备份到对象存储设备OSD映射的新硬盘,并向管理模块进行慢盘故障告警。本发明将分布式存储集群的IO性能数据与门限参数结合进行慢盘检测,通过约定周期的滑动窗口内,约定次数的不可达项目进行慢盘判定,并对慢盘隔离,保证数据冗余。

Description

一种基于分布式存储的慢盘检测方法及装置
技术领域
本发明属于分布式存储磁盘检测技术领域,具体涉及一种基于分布式存储的慢盘检测方法及装置。
背景技术
OSD,是Object-based Storage Device的简称,对象存储设备。
分布式存储ceph是为云平台提供Ceph对象存储,Ceph块设备,Ceph文件系统的一个统一开放标准的大规模分布式现代化存储系统。
在CEPH中如果有磁盘故障会导致OSD不工作,造成集群报警,甚至丢失数据。现在的技术普遍是针对磁盘的smart信息判断是否有问题,比如使用磁盘厂商希捷,日立,东芝等封装好的磁盘检查工具直接得出磁盘的健康状态,或者使用smartctl工具进行自行的封装检测,现有的检测手段比较单一,不能有效结合分布式存储的使用状况与整体磁盘效能去检测,也不能结合系统特性做处理,最后处理故障或者亚健康磁盘也比较暴力,采用直接踢盘的操作,不能有效做好数据冗余容易造成数据丢失。
此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种基于分布式存储的慢盘检测方法及装置,是非常有必要的。
发明内容
针对现有技术的上述现有分布式存储磁盘故障检测手段单一,不能结合分布式存储使用状态的缺陷,本发明提供一种基于分布式存储的慢盘检测方法及装置,以解决上述技术问题。
第一方面,本发明提供一种基于分布式存储的慢盘检测方法,包括如下步骤:
S1.在分布式存储集群各存储节点为IO性能数据设置门限开关,并配置门限参数;
S2.设置对象存储设备OSD监控其所在的存储节点,根据门限开关状态以及门限参数配置值,判断存储节点是否为慢盘,以及在约定周期内慢盘判定次数达到约定次数时,将慢盘上报集群控制器;
S3.设置集群控制器隔离慢盘,更新对象存储设备OSD映射,将隔离慢盘数据备份到对象存储设备OSD映射的新硬盘,并向管理模块进行慢盘故障告警。
进一步地,步骤S1具体步骤如下:
S11.在分布式存储集群内各存储节点设置慢盘检测开关;
S12.在分布式存储集群内各存储节点选择门限类别,设置各类别门限参与慢盘判决的方式;
S13.在分布式存储集群内各存储节点根据选择门限类别,设置各类别统一门限,并为各类别门限设置开关;
S14.根据存储节点的磁盘类型及各类别统一门限设置慢盘判定的IO性能模型。慢盘检测开关用于限定是否在存储节点开启慢盘检测;门限类别为选择的进行慢盘判定的参数,门限参与慢盘判决的方式包括满足该门限判定为慢盘或者满足该门限判定为非慢盘;类别门限开关为是否选用该门限参数进行慢盘判定;IO性能模型需要通过已有的IO性能数据进行训练。
进一步地,所述门限类别包括延时门限、服务时间门限、平均IO门限以及带宽门限;
所述磁盘类型包括但不限于5400转磁盘、7200转磁盘、10000转磁盘、15000转磁盘以及20000转磁盘。
进一步地,步骤S2具体步骤如下:
S21.设置对象存储设备OSD监控其所在的存储节点,对存储节点IO性能数据进行周期性统计;
S22.设置对象存储设备OSD根据慢盘判定的IO性能模型,判断存储节点是否为慢盘;
若是,统计约定周期内存储节点慢盘判定次数;
若否,返回步骤S21;
S23.设置对象存储设备OSD判断慢盘判定次数是否达到约定次数;
若是,进入步骤S24;
若否,返回步骤S21;
S24.设置对象存储设备OSD将慢盘上报集群控制器。采用以约定周期为滑动窗口的约定次数的不可达机制进行慢盘判断。
进一步地,所述约定周期取20周期,约定次数取16次。采用以20周期为滑动窗口的16次不可达机制进行慢盘判断。
进一步地,步骤S3具体步骤如下:
S31.设置集群控制器将慢盘隔离,更新对象存储设备OSD映射;
S32.设置集群控制器根据集群的副本状态为对象存储设备OSD配置新的硬盘,并同步对象存储设备OSD映射;
S33.设置集群控制器向管理模块进行慢盘故障告警。根据集群的副本状态对将隔离硬盘备份到新硬盘保证数据冗余。
第二方面,本发明提供一种基于分布式存储的慢盘检测装置,包括:
门限设置模块,用于在分布式存储集群各存储节点为IO性能数据设置门限开关,并配置门限参数;
慢盘判断模块,用于设置对象存储设备OSD监控其所在的存储节点,根据门限开关状态以及门限参数配置值,判断存储节点是否为慢盘,以及在约定周期内慢盘判定次数达到约定次数时,将慢盘上报集群控制器;
慢盘隔离模块,用于设置集群控制器隔离慢盘,更新对象存储设备OSD映射,将隔离慢盘数据备份到对象存储设备OSD映射的新硬盘,并向管理模块进行慢盘故障告警。
进一步地,门限设置模块包括:
慢盘检测开关设置单元,用于在分布式存储集群内各存储节点设置慢盘检测开关;
门限类别设置单元,用于在分布式存储集群内各存储节点选择门限类别,设置各类别门限参与慢盘判决的方式;
统一门限设置单元,用于在分布式存储集群内各存储节点根据选择门限类别,设置各类别统一门限,并为各类别门限设置开关;
IO性能模型设置单元,用于根据存储节点的磁盘类型及各类别统一门限设置慢盘判定的IO性能模型。
进一步地,慢盘判断模块包括:
IO性能数据统计单元,用于设置对象存储设备OSD监控其所在的存储节点,对存储节点IO性能数据进行周期性统计;
慢盘判断单元,设置对象存储设备OSD根据慢盘判定的IO性能模型,判断存储节点是否为慢盘;
慢盘判定次数统计单元,用于统计约定周期内存储节点慢盘判定次数;
慢盘判定次数判断单元,用于设置对象存储设备OSD判断慢盘判定次数是否达到约定次数;
慢盘上报单元,用于设置对象存储设备OSD将慢盘上报集群控制器。
进一步地,慢盘隔离模块包括:
慢盘隔离单元,用于设置集群控制器将慢盘隔离,更新对象存储设备OSD映射;
OSD新硬盘配置单元,用于设置集群控制器根据集群的副本状态为对象存储设备OSD配置新的硬盘,并同步对象存储设备OSD映射;
慢盘故障告警单元,用于设置集群控制器向管理模块进行慢盘故障告警。
本发明的有益效果在于,
本发明提供的基于分布式存储的慢盘检测方法及装置,将分布式存储集群的IO性能数据与门限参数结合进行慢盘检测,通过作为约定周期的滑动窗口内,作为约定次数的不可达项目进行慢盘判定,并对慢盘进行隔离,保证数据冗余。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的方法流程示意图一;
图2是本发明的方法流程示意图二;
图3为本发明的系统示意图;
图中,1-门限设置模块;1.1-慢盘检测开关设置单元;1.2-门限类别设置单元;1.3-统一门限设置单元;1.4-IO性能模型设置单元;2-慢盘判断模块;2.1-IO性能数据统计单元;2.2-慢盘判断单元;2.3-慢盘判定次数统计单元;2.4-慢盘判定次数判断单元;2.5-慢盘上报单元;3-慢盘隔离模块;3.1-慢盘隔离单元;3.2-OSD新硬盘配置单元;3.3-慢盘故障告警单元。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例1:
如图1所示,本发明提供一种基于分布式存储的慢盘检测方法,包括如下步骤:
S1.在分布式存储集群各存储节点为IO性能数据设置门限开关,并配置门限参数;
S2.设置对象存储设备OSD监控其所在的存储节点,根据门限开关状态以及门限参数配置值,判断存储节点是否为慢盘,以及在约定周期内慢盘判定次数达到约定次数时,将慢盘上报集群控制器;
S3.设置集群控制器隔离慢盘,更新对象存储设备OSD映射,将隔离慢盘数据备份到对象存储设备OSD映射的新硬盘,并向管理模块进行慢盘故障告警。
实施例2:
如图2所示,本发明提供一种基于分布式存储的慢盘检测方法,包括如下步骤:
S1.在分布式存储集群各存储节点为IO性能数据设置门限开关,并配置门限参数;具体步骤如下:
S11.在分布式存储集群内各存储节点设置慢盘检测开关;
S12.在分布式存储集群内各存储节点选择门限类别,设置各类别门限参与慢盘判决的方式;
S13.在分布式存储集群内各存储节点根据选择门限类别,设置各类别统一门限,并为各类别门限设置开关;
S14.根据存储节点的磁盘类型及各类别统一门限设置慢盘判定的IO性能模型;
S2.设置对象存储设备OSD监控其所在的存储节点,根据门限开关状态以及门限参数配置值,判断存储节点是否为慢盘,以及在约定周期内慢盘判定次数达到约定次数时,将慢盘上报集群控制器;具体步骤如下:
S21.设置对象存储设备OSD监控其所在的存储节点,对存储节点IO性能数据进行周期性统计;
S22.设置对象存储设备OSD根据慢盘判定的IO性能模型,判断存储节点是否为慢盘;
若是,统计约定周期内存储节点慢盘判定次数;
若否,返回步骤S21;
S23.设置对象存储设备OSD判断慢盘判定次数是否达到约定次数;
若是,进入步骤S24;
若否,返回步骤S21;
S24.设置对象存储设备OSD将慢盘上报集群控制器;
S3.设置集群控制器隔离慢盘,更新对象存储设备OSD映射,将隔离慢盘数据备份到对象存储设备OSD映射的新硬盘,并向管理模块进行慢盘故障告警;具体步骤如下:
S31.设置集群控制器将慢盘隔离,更新对象存储设备OSD映射;
S32.设置集群控制器根据集群的副本状态为对象存储设备OSD配置新的硬盘,并同步对象存储设备OSD映射;
S33.设置集群控制器向管理模块进行慢盘故障告警。
在某些实施例中,所述门限类别包括延时门限、服务时间门限、平均IO门限以及带宽门限;
所述磁盘类型包括但不限于5400转磁盘、7200转磁盘、10000转磁盘、15000转磁盘以及20000转磁盘。
在某些实施例中,所述约定周期取20周期,约定次数取16次。
在某些实施例中,7200转磁盘为例:
若周期内统计的平均IO大小小于等于8KB,则取硬盘门限中8KB模型子串配置和统一门限配置叠加的结果,即延时门限、服务时间门限、平均IO门限以及带宽门限四个门限分别为560ms、46ms、20/s、20480kB/s。其中,若未配置延时门限和服务时间的统一门限,则延时门限和服务时间门限取硬盘门限配置中8KB模型子串配置;因为配置了平均IO门限和带宽门限的统一门限,无论硬盘门限中8KB模型子串配置中是否配置ops和bw门限,都取统一门限;
若周期内统计的平均IO大小大于8KB且小于等于16KB,则取硬盘门限中16KB模型子串配置和统一门限配置叠加的结果,即延时门限、服务时间门限、平均IO门限以及带宽门限四个门限分别为565ms、45ms、20/s、20480kB/s;
其它IO性能模型大小对应的门限值,依上述原理类推;
大小超过硬盘门限配置中配置的最大IO性能模型大小时,则只取统一门限;
如果检测到慢盘则上报集群控制器消息,并进行更新OSD映射隔离该慢盘,并上报做管理模块的dashboard界面,进行告警通知,选择人工介入处理。
实施例3:
如图3所示,本发明提供一种基于分布式存储的慢盘检测装置,包括:
门限设置模块1,用于在分布式存储集群各存储节点为IO性能数据设置门限开关,并配置门限参数;门限设置模块1包括:
慢盘检测开关设置单元1.1,用于在分布式存储集群内各存储节点设置慢盘检测开关;
门限类别设置单元1.2,用于在分布式存储集群内各存储节点选择门限类别,设置各类别门限参与慢盘判决的方式;
统一门限设置单元1.3,用于在分布式存储集群内各存储节点根据选择门限类别,设置各类别统一门限,并为各类别门限设置开关;
IO性能模型设置单元1.4,用于根据存储节点的磁盘类型及各类别统一门限设置慢盘判定的IO性能模型;
慢盘判断模块2,用于设置对象存储设备OSD监控其所在的存储节点,根据门限开关状态以及门限参数配置值,判断存储节点是否为慢盘,以及在慢盘判定次数达到约定次数时,将慢盘上报集群控制器;慢盘判断模块2包括:
IO性能数据统计单元2.1,用于设置对象存储设备OSD监控其所在的存储节点,对存储节点IO性能数据进行周期性统计;
慢盘判断单元2.2,设置对象存储设备OSD根据慢盘判定的IO性能模型,判断存储节点是否为慢盘;
慢盘判定次数统计单元2.3,用于统计约定周期内存储节点慢盘判定次数;
慢盘判定次数判断单元2.4,用于设置对象存储设备OSD判断慢盘判定次数是否达到约定次数;
慢盘上报单元2.5,用于设置对象存储设备OSD将慢盘上报集群控制器;
慢盘隔离模块3,用于设置集群控制器隔离慢盘,更新对象存储设备OSD映射,并向管理模块进行慢盘故障告警;慢盘隔离模块3包括:
慢盘隔离单元3.1,用于设置集群控制器将慢盘隔离,更新对象存储设备OSD映射;
OSD新硬盘配置单元3.2,用于设置集群控制器根据集群的副本状态为对象存储设备OSD配置新的硬盘,并同步对象存储设备OSD映射;
慢盘故障告警单元3.3,用于设置集群控制器向管理模块进行慢盘故障告警。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种基于分布式存储的慢盘检测方法,其特征在于,包括如下步骤:
S 1.在分布式存储集群各存储节点为IO性能数据设置门限开关,并配置门限参数;
S2.设置对象存储设备OSD监控其所在的存储节点,根据门限开关状态以及门限参数配置值,判断存储节点是否为慢盘,以及在约定周期内慢盘判定次数达到约定次数时,将慢盘上报集群控制器;
S3.设置集群控制器隔离慢盘,更新对象存储设备OSD映射,将隔离慢盘数据备份到对象存储设备OSD映射的新硬盘,并向管理模块进行慢盘故障告警。
2.如权利要求1所述的基于分布式存储的慢盘检测方法,其特征在于,步骤S1具体步骤如下:
S 11.在分布式存储集群内各存储节点设置慢盘检测开关;
S 12.在分布式存储集群内各存储节点选择门限类别,设置各类别门限参与慢盘判决的方式;
S 13.在分布式存储集群内各存储节点根据选择门限类别,设置各类别统一门限,并为各类别门限设置开关;
S 14.根据存储节点的磁盘类型及各类别统一门限设置慢盘判定的IO性能模型。
3.如权利要求2所述的基于分布式存储的慢盘检测方法,其特征在于,所述门限类别包括延时门限、服务时间门限、平均IO门限以及带宽门限;
所述磁盘类型包括但不限于5400转磁盘、7200转磁盘、10000转磁盘、15000转磁盘以及20000转磁盘。
4.如权利要求2所述的基于分布式存储的慢盘检测方法,其特征在于,步骤S2具体步骤如下:
S21.设置对象存储设备OSD监控其所在的存储节点,对存储节点IO性能数据进行周期性统计;
S22.设置对象存储设备OSD根据慢盘判定的IO性能模型,判断存储节点是否为慢盘;
若是,统计约定周期内存储节点慢盘判定次数;
若否,返回步骤S21;
S23.设置对象存储设备OSD判断慢盘判定次数是否达到约定次数;
若是,进入步骤S24;
若否,返回步骤S21;
S24.设置对象存储设备OSD将慢盘上报集群控制器。
5.如权利要求4所述的基于分布式存储的慢盘检测方法,其特征在于,所述约定周期取20周期,约定次数取16次。
6.如权利要求1所述的基于分布式存储的慢盘检测方法,其特征在于,步骤S3具体步骤如下:
S31.设置集群控制器将慢盘隔离,更新对象存储设备OSD映射;
S32.设置集群控制器根据集群的副本状态为对象存储设备OSD配置新的硬盘,并同步对象存储设备OSD映射;
S33.设置集群控制器向管理模块进行慢盘故障告警。将慢盘隔离并根据集群副本状态为对象存储设备OSD配置新的硬盘,保证慢盘数据冗余。
7.一种基于分布式存储的慢盘检测装置,其特征在于,包括:
门限设置模块(1),用于在分布式存储集群各存储节点为IO性能数据设置门限开关,并配置门限参数;
慢盘判断模块(2),用于设置对象存储设备OSD监控其所在的存储节点,根据门限开关状态以及门限参数配置值,判断存储节点是否为慢盘,以及在约定周期内慢盘判定次数达到约定次数时,将慢盘上报集群控制器;
慢盘隔离模块(3),用于设置集群控制器隔离慢盘,更新对象存储设备OSD映射,将隔离慢盘数据备份到对象存储设备OSD映射的新硬盘,并向管理模块进行慢盘故障告警。
8.如权利要求7所述的基于分布式存储的慢盘检测装置,其特征在于,门限设置模块(1)包括:
慢盘检测开关设置单元(1.1),用于在分布式存储集群内各存储节点设置慢盘检测开关;
门限类别设置单元(1.2),用于在分布式存储集群内各存储节点选择门限类别,设置各类别门限参与慢盘判决的方式;
统一门限设置单元(1.3),用于在分布式存储集群内各存储节点根据选择门限类别,设置各类别统一门限,并为各类别门限设置开关;
IO性能模型设置单元(1.4),用于根据存储节点的磁盘类型及各类别统一门限设置慢盘判定的IO性能模型。
9.如权利要求7所述的基于分布式存储的慢盘检测装置,其特征在于,慢盘判断模块(2)包括:
IO性能数据统计单元(2.1),用于设置对象存储设备OSD监控其所在的存储节点,对存储节点IO性能数据进行周期性统计;
慢盘判断单元(2.2),设置对象存储设备OSD根据慢盘判定的IO性能模型,判断存储节点是否为慢盘;
慢盘判定次数统计单元(2.3),用于统计约定周期内存储节点慢盘判定次数;
慢盘判定次数判断单元(2.4),用于设置对象存储设备OSD判断慢盘判定次数是否达到约定次数;
慢盘上报单元(2.5),用于设置对象存储设备OSD将慢盘上报集群控制器。
10.如权利要求7所述的基于分布式存储的慢盘检测装置,其特征在于,慢盘隔离模块(3)包括:
慢盘隔离单元(3.1),用于设置集群控制器将慢盘隔离,更新对象存储设备OSD映射;
OSD新硬盘配置单元(3.2),用于设置集群控制器根据集群的副本状态为对象存储设备OSD配置新的硬盘,并同步对象存储设备OSD映射;
慢盘故障告警单元(3.3),用于设置集群控制器向管理模块进行慢盘故障告警。
CN202010821201.3A 2020-08-14 2020-08-14 一种基于分布式存储的慢盘检测方法及装置 Pending CN111984481A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010821201.3A CN111984481A (zh) 2020-08-14 2020-08-14 一种基于分布式存储的慢盘检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010821201.3A CN111984481A (zh) 2020-08-14 2020-08-14 一种基于分布式存储的慢盘检测方法及装置

Publications (1)

Publication Number Publication Date
CN111984481A true CN111984481A (zh) 2020-11-24

Family

ID=73435025

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010821201.3A Pending CN111984481A (zh) 2020-08-14 2020-08-14 一种基于分布式存储的慢盘检测方法及装置

Country Status (1)

Country Link
CN (1) CN111984481A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407409A (zh) * 2021-06-11 2021-09-17 济南浪潮数据技术有限公司 一种分布式存储系统的节点状态检测方法和装置
CN114979180A (zh) * 2022-05-24 2022-08-30 超聚变数字技术有限公司 数据同步方法、系统及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810062A (zh) * 2014-03-05 2014-05-21 华为技术有限公司 慢盘检测方法和装置
CN109815037A (zh) * 2017-11-22 2019-05-28 华为技术有限公司 慢盘检测方法和存储阵列
CN110083515A (zh) * 2019-04-24 2019-08-02 苏州元核云技术有限公司 分布式存储系统中慢盘的快速判断方法、装置及存储介质
CN111045881A (zh) * 2018-10-15 2020-04-21 深信服科技股份有限公司 一种慢盘检测方法及系统
CN111104239A (zh) * 2019-11-21 2020-05-05 北京浪潮数据技术有限公司 一种分布式存储集群的硬盘故障处理方法、系统及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810062A (zh) * 2014-03-05 2014-05-21 华为技术有限公司 慢盘检测方法和装置
CN109815037A (zh) * 2017-11-22 2019-05-28 华为技术有限公司 慢盘检测方法和存储阵列
CN111045881A (zh) * 2018-10-15 2020-04-21 深信服科技股份有限公司 一种慢盘检测方法及系统
CN110083515A (zh) * 2019-04-24 2019-08-02 苏州元核云技术有限公司 分布式存储系统中慢盘的快速判断方法、装置及存储介质
CN111104239A (zh) * 2019-11-21 2020-05-05 北京浪潮数据技术有限公司 一种分布式存储集群的硬盘故障处理方法、系统及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407409A (zh) * 2021-06-11 2021-09-17 济南浪潮数据技术有限公司 一种分布式存储系统的节点状态检测方法和装置
CN113407409B (zh) * 2021-06-11 2022-06-03 济南浪潮数据技术有限公司 一种分布式存储系统的节点状态检测方法和装置
CN114979180A (zh) * 2022-05-24 2022-08-30 超聚变数字技术有限公司 数据同步方法、系统及设备
CN114979180B (zh) * 2022-05-24 2024-05-17 超聚变数字技术有限公司 数据同步方法、系统及设备

Similar Documents

Publication Publication Date Title
TWI746512B (zh) 實體機器故障分類處理方法、裝置和虛擬機器恢復方法、系統
CN107612787B (zh) 一种基于Openstack开源云平台的云主机故障检测方法
CN108964960B (zh) 一种告警事件的处理方法及装置
CN107547273B (zh) 一种电力系统虚拟实例高可用的保障方法及系统
CN111984481A (zh) 一种基于分布式存储的慢盘检测方法及装置
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
CN101399883B (zh) 异常监测管理方法及装置
KR20140143819A (ko) 프로토콜 이벤트 관리 방법 및 장치
US20210044487A1 (en) Systems and method for replaying and debugging live states of network devices
US20160283307A1 (en) Monitoring system, monitoring device, and test device
CN113268399B (zh) 一种告警处理方法、装置和电子设备
CN107911387A (zh) 用电信息采集系统账号异常登陆和异常操作的监控方法
CN104639368A (zh) 通信网络设备的故障处理方法及装置
US8892703B2 (en) Cross-cutting event correlation
CN101631048A (zh) 一种监视被管理对象的方法、装置及系统
CN102902615A (zh) 一种Lustre并行文件系统错误报警方法及其系统
CN114356499A (zh) Kubernetes集群告警根因分析方法及装置
CN114090184A (zh) 一种虚拟化集群高可用性的实现方法和设备
CN102981939B (zh) 磁盘监控方法
WO2020052741A1 (en) Managing event data in a network
CN107528705B (zh) 故障处理方法及装置
CN115202958A (zh) 一种电力异常监控方法、装置、电子设备及存储介质
CN111062503B (zh) 一种电网监控告警处理方法、系统、终端及存储介质
CN106897189A (zh) 一种基于数据实时推送的日志监控系统
CN112099990A (zh) 一种容灾备份方法、装置、设备及机器可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201124