CN114063881A

CN114063881A - 分布式系统的磁盘管理方法及装置

Info

Publication number: CN114063881A
Application number: CN202010757550.3A
Authority: CN
Inventors: 王韬; 邱彭; 范苑
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2020-07-31
Filing date: 2020-07-31
Publication date: 2022-02-18

Abstract

本发明公开了一种分布式系统的磁盘管理方法及装置。所述分布式系统的磁盘管理方法包括：采集所述分布式系统的磁盘状态信息；基于所述磁盘状态信息，获得磁盘故障相关的状态监测数据；根据所述状态监测数据，预估状态监测数据的变化趋势；基于所述变化趋势，对所述分布式系统的磁盘故障进行预测。本发明实现了对磁盘故障的及时预测，使分布式系统具备了对磁盘故障提前感知和预测的能力，而不必在磁盘发生写入异常后才启动保护磁盘、备份文件等具体的维护措施，可进一步保证分布式系统的可靠性。

Description

分布式系统的磁盘管理方法及装置

技术领域

本发明涉及云计算技术领域，特别涉及一种分布式系统的磁盘管理方法及装置。

背景技术

近年来，云计算日益成为信息技术产业的发展重点，与传统的网络应用模式相比，云计算的特点包括采用虚拟化技术、分布式部署、动态可扩展性和较高的灵活性和性价比等等。

虽然使用虚拟化技术，但云计算的实现需要底层的物理存储介质来支撑，例如各种物理磁盘等，随着数据的频繁读写操作和持续运行，难免会出现磁盘故障或损坏的情况，如果待磁盘出现故障之后才来修复，例如发现写入异常后再隔离磁盘对应的故障块的措施，会严重影响磁盘的读写性能，更为重要的是，因为磁盘的故障，可能导致存储数据的丢失、读写异常，影响数据存储的可靠性。如何在磁盘故障发生之前，及时对可能发生的故障进行预测，保证云计算的可靠性，是亟待解决的问题。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种分布式系统磁盘管理方法及装置。

第一方面，本发明实施例提供一种分布式系统的磁盘管理方法，包括：

采集所述分布式系统的磁盘状态信息；

基于所述磁盘状态信息，获得磁盘故障相关的状态监测数据；

根据所述状态监测数据，预估状态监测数据的变化趋势；

基于所述变化趋势，对所述分布式系统的磁盘故障进行预测。

第二方面，本发明实施例提供一种分布式系统的磁盘管理方法，包括：

对所述分布式系统的磁盘故障进行预测；

对于预测出的所述分布式系统中将要发生故障的磁盘，推送对应的预警信息和/或调用分布式存储运维接口执行预设的磁盘保护操作；

其中，所述对所述分布式系统的磁盘故障进行预测的步骤，采用如前述的分布式系统的磁盘管理方法。

第三方面，本发明实施例提供一种分布式系统的磁盘管理方法，包括：

响应于磁盘检测指令，触发分布式服务集群中部分或全部磁盘执行自检测流程；

收集所述部分或全部磁盘的自检测流程的检测结果；

获取根据所述检测结果确定的磁盘故障预测信息，所述磁盘故障预测信息是根据所述检测结果中与磁盘故障相关的状态监测数据的变化趋势预测得到的；

在显示界面提供所述磁盘故障预测信息。

第四方面，本发明实施例提供一种分布式系统的磁盘管理装置，包括：

采集模块，用于采集所述分布式系统的磁盘状态信息；

获取模块，用于基于所述磁盘状态信息，获得磁盘故障相关的状态监测数据；

变化趋势预估模块，用于根据所述状态监测数据，预估状态监测数据的变化趋势；

故障预测模块，用于基于所述变化趋势，对所述分布式系统的磁盘故障进行预测。

第五方面，本发明实施例提供一种分布式系统的磁盘管理装置，包括：

故障预测模块，用于对所述分布式系统的磁盘故障进行预测；

预警模块，用于对于预测出的所述分布式系统中将要发生故障的磁盘，推送对应的预警信息和/或调用分布式存储运维接口执行预设的磁盘保护操作；

其中，所述故障预测模块对所述分布式系统的磁盘故障进行预测的步骤，采用前述分布式系统的磁盘管理方法。

第六方面，本发明实施例提供一种分布式系统的磁盘管理装置，包括：

触发模块，用于响应于磁盘检测指令，触发分布式服务集群中部分或全部磁盘执行自检测流程；

收集模块，用于收集所述部分或全部磁盘的自检测流程的检测结果；

获取模块，用于获取根据所述检测结果确定的磁盘预警信息，所述磁盘预警信息是根据所述检测结果中与磁盘故障相关的状态监测数据的变化趋势得到的；

显示模块，用于在显示界面提供所述磁盘故障预测信息。

第七方面，本发明实施例提供一种服务器，包括：存储器、处理器及存储于存储器上并可在处理器上运行的计算机指令，所述指令被处理器执行时能够实现如前述的分布式系统的磁盘管理方法。

第八方面，本发明实施例提供一种计算机可读存储介质，其上存储有计算机指令，所述指令被处理器执行时能够实现如前述的分布式系统的磁盘管理方法。

本发明实施例提供的上述技术方案的有益效果至少包括：

本发明实施例提供的上述分布式系统的磁盘管理方法及装置和客户端，采集分布式系统的磁盘状态信息，基于磁盘状态信息，获得磁盘故障相关的状态监测数据，根据状态监测数据，预估状态监测的变化趋势，根据变化趋势，对分布式系统的磁盘故障进行预测，并根据磁盘故障预测的结果，确定是否需要对预测将要发生故障的磁盘发出预警，并在需要预警时，发出预警信息，或者进行一系列的磁盘保护操作，实现了对磁盘故障的及时预测，使分布式系统具备了对磁盘故障提前感知和预测的能力，而不必在磁盘发生写入异常后才启动保护磁盘、备份文件等具体的维护措施，可进一步保证分布式系统数据的可靠性。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例提供的分布式系统的磁盘管理方法的流程图；

图2为本发明实施例提供的分布式系统的磁盘管理方法的又一流程图；

图3为本发明实施例提供的趋势图的示例；

图4为本发明实施例提供的分布式系统的磁盘管理方法的又一流程图；

图5为本发明实施例提供的实例所适用的网络架构图；

图6为本发明实施例提供的实例的流程图；

图7为本发明实施例提供的分布式系统的磁盘管理方法在客户端侧实现的流程图；

图8为本发明实施例提供的包含客户端的网络架构的示意图；

图9为本发明实施例提供的分布式系统的磁盘管理装置的结构框图；

图10为本发明实施例提供的分布式系统的磁盘管理装置的又一结构框图；

图11为本发明实施例提供的分布式系统的磁盘管理装置的又一的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

为了解决目前云计算的分布式系统存在的磁盘出现故障可能带来的修复慢、严重影响读写性能，可能影响数据存储的可靠性的问题，本发明实施例提供了一种分布式系统的磁盘管理方法及装置。

下面结合附图，分别对分布式系统的磁盘管理方法及装置的具体实施方式进行详细说明。

参照图1所示，本发明实施例提供的分布式系统的磁盘管理方法，至少包括下述步骤：

S11、采集分布式系统的磁盘状态信息；

为了保证磁盘状态监测数据的分析的准确性，上述磁盘的状态监测数据，例如可以是分不同时间针对同一分布式多次采集的磁盘的状态监测数据。

S12、基于磁盘状态信息，获得磁盘故障相关的状态监测数据；

S13、根据状态监测数据，预估状态监测数据的变化趋势；

S14、基于变化趋势，对分布式系统的磁盘故障进行预测。

本发明实施例提供的上述分布式系统的磁盘管理方法，提取出与磁盘故障相关的状态监测数据，对提取出的状态监测数据进行趋势预测，并根据变化趋势，对分布式系统的磁盘故障进行预测，并确定是否需要发出预警，实现了对分布式系统磁盘故障的及时预测，使分布式系统具备了对磁盘故障提前感知和预测的能力，而不必在磁盘发生写入异常后才启动保护磁盘、备份文件等具体的维护措施，可进一步保证分布式系统数据存储的可靠性。

本发明实施例中，分布式系统，是多个处理机通过通信线路互联而构成的松散耦合的系统，不同于普通的计算机系统，在一个分布式系统中，一组独立的计算机展现给用户的是一个统一的整体，就好像是一个系统似的。分布式系统拥有多种通用的物理和逻辑资源，可以动态的分配任务，分散的物理和逻辑资源通过计算机网络实现信息交换。

本发明实施例提供的上述分布式系统的磁盘管理的方法，在具体实施时，可以采用独立的例如磁盘故障预测服务器等服务器实现，即这类服务器可以与分布式系统的服务器并列部署，例如采用一对多的方式，也就是一个磁盘故障预测服务器负责监测多个分布式系统服务器的方式，当然，根据分布式系统服务器的数量，磁盘故障预测服务器的数量的设置还可以不止一个；也可以视服务器的能力，采用分布式系统服务器中的一个或多个来兼顾实现该磁盘故障预测服务器的功能的方式，本发明实施例对采用何种具体的网络架构并不限定。

在一个实施例中，上述磁盘状态信息，可以是利用各种方式采集的磁盘状态监测数据，例如利用各种传感技术，或者利用自动监测、分析及报告(S.M.A.T，全称Self-Monitoring Analysis and Reporting Technology)技术监测得到的磁盘状态监测数据。

以S.M.A.T技术得到的状态监测数据为例，S.M.A.T是一种自动的硬盘状态检测与预警系统和规范。通过在硬盘硬件内的检测指令对硬盘的硬件如磁头、盘片、马达及驱动系统、硬盘内部电路的运行情况进行监控，可以得到磁盘一系列的监测状态数据。

目前，使用S.M.A.T技术的厂商较多，所定义的S.M.A.T状态监测数据的类型也不太一样，以一个现有的S.M.A.T状态监测数据的例子来说，部分的状态监测数据的类型列举如下：

Read Error Rate错误读取率；

Start/Stop Count启动/停止次数(又称加电次数)；

Relocated Sector Count重映射扇区计数；

Spin up Retry Count旋转重试次数(即硬盘启动重试次数)；

Drive Calibration Retry Count磁盘校准重试次数；

ULTRA DMA CRC Error Rate(ULTRA DMA奇偶校验错误率)；

Current Pending Sector Count当前待映射扇区计数；

Multi-zone Error Rate多区域错误率；

Vendor-specific厂商特性；

Temperature磁盘温度。

上述仅列举S.M.A.T状态监测数据的部分类型，本发明并不限于上述已列举出的各类型。现有技术中的S.M.A.T状态监测数据中，并不是所有类型的状态监测都直接指向磁盘故障，换言之，不是所有类型的状态监测数据都与磁盘故障直接相关，为了更准确地预测磁盘的故障，需要根据情况，从S.M.A.T状态监测数据中，选取与磁盘故障相关度较高的状态监测数据。

具体实施时，与磁盘故障相关的例如可以选取重映射扇区计数(RelocatedSector Count，编号为05或005)和当前待映射扇区计数(Current Pending Sector Count，编号为C5或197)两项，还可以在此两项基础上选择其他选项例如错误读取率(Read ErrorRate)等等，本发明实施例并不限于上述选取状态监测数据的方式，只要能够选取与磁盘故障相关度较高的状态监测数据即可。

上述步骤S11中，采集分布式系统的磁盘状态信息，可以采用周期性采集分布式系统中磁盘的状态监测数据的方式，例如间隔预设的时间间隔采集一次的方式，当然，还可以是按照其他触发条件采集的方式，在每次采集磁盘的状态监测数据后，都从中提取出磁盘故障相关的状态监测数据，从时间序列上看，会形成一系列在不同时间点上的状态监测数据，从而为后续进行磁盘故障预测形成的数据分析基础。

为了对分布式系统本身的系统功能造成影响，在采集分布式系统的磁盘状态信息时，例如可以采用下述方式：周期性地从独立于分布式系统通信信道之外的网络通道，采集分布式系统的磁盘状态信息。采用独立于分布式系统通信信道的其他网络通道的方式，可以避免对分布式系统资源的不必要的占用，同时也能保证采集的信息的传输的时效性。

另一方面，从网络架构角度来说，磁盘故障预测服务器可以从挂载有磁盘(负责云存储的)的分布式系统中的服务器侧，获取这些采集到的状态监测数据。也就是说，挂载有磁盘的分布式系统服务器负责多次采集自身磁盘的状态监测数据，采用主动发送给磁盘故障预测服务器的方式，或者由磁盘故障预测服务器主动从分布式系统中服务器获取的方式，本发明实施例对此不做限定。

在一个实施例中，从分别多次采集的磁盘的状态监测数据中，分别提取出所述磁盘故障相关的状态监测数据之后，为了更准确地预测磁盘的故障，减少后续处理的数据量，提高磁盘故障预测的操作的效率，参照图2所示，该方法还可以执行下述步骤：

S15、判断所述提取出的各磁盘故障相关的状态监测数据中，是否存在低权重的状态监测数据；

在本发明实施例中，上述低权重的状态监测数据为：反映磁盘故障趋势的权重低于预设权重阈值的状态监测数据；

S16、若存在，则从磁盘故障相关的状态监测数据中剔除该低权重的状态监测数据。

在获得磁盘故障相关的状态监测数据之后，从逻辑判断，不同的状态监测数据，对于反映磁盘故障趋势的重要性之间是具有差异的，因此可以为不同类型的状态监测数据建立权重值，并基于与预设的权重阈值的比较结果，剔除掉其中权重值低于预设权重阈值的那一类状态监测数据。

例如，有些状态监测数据反映出磁盘的状态是相对正面的，即可以反映出磁盘处于一个相对健康的状态，那么这类数据对于反映磁盘故障趋势的重要性较低，对磁盘故障的预测没有太大用处，基于其权重值与权重阈值的比较，可以预先筛除。预设的权重阈值的大小可以预先定义。

还是重映射扇区计数和当前待映射扇区计数这两类的状态监测数据的例子来说，符合下面几种情形的状态监测数据，通常其权重值的数值较低(小于等于权重阈值)，也即属于上述低权重的状态监测数据：

1、重映射扇区计数(Relocated Sector Count，编号为05或005)的数值为0的情况；

2、重映射扇区计数(Relocated Sector Count，编号为05或005)的数值为非0且预设周期内数据未发生变化，且当前待映射扇区计数(Current Pending Sector Count，编号为C5或197)的数值较低(低于预设的阈值)。

……

反之，例如重映射扇区计数为非0且预设周期内数值存在变化的情况下，或者当前待映射扇区计数的值较高(高于预设的阈值)的状态监测数据，则通常对应的权重值较高(大于等于预设的权重阈值)，不属于上述“低权重的状态监测数据”，需要保留以进行进一步的预测算法处理。

后续步骤S12和S13中的状态监测数据，相对应地，也就是剔除掉了“低权重的状态监测数据”之后得到的状态监测数据。

在一个实施例中，上述步骤S13中，根据提取出的状态监测数据，预估状态监测数据的未来变化趋势，在具体实施时，可以采用多种预测算法，例如各类回归分析法、时间序列指数平滑算法等，本发明实施例在此不做限定。

因为步骤S12中，针对分布式系统每个磁盘，都从多次采集的状态监测数据中获取到了与磁盘故障相关的数据，这样，会得到一系列按照时间先后排列的与故障相关的状态监测数据。利用这些数据，可以对磁盘的故障进行趋势的预测。

以现有时间序列指数平滑算法为例，时间序列是指由一段时间内采集的信号(即磁盘故障相关的状态监测数据)组成的序列，序列前面的信号表示采集的时间较早。时间序列指数平滑算法的前提是假设获得的数据在时域上具有一定的相互依赖关系，该算法就能够发现这种隐含的依赖关系，以及对未观测到的或者尚未发生的时间序列进行预测。

指数平滑法的基本公式是：S_t＝a·y_t+(1-a)S_t-1，其中：

S_t为第t期的预测值(或指数平滑值)；

y_t为第t期的实际值；

S_t-1为第t-1期的预测值(或指数平滑值)；

a为平滑常数，其取值范围为[0,1]。

任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均，也可以理解为下一期数据的预测值与本期的实际值和上一期的预测值相关。

指数平滑模型包括一阶指数平滑、二阶指数平滑、三阶指数平滑，在具体实施时，可以情况进行选择。例如：

一阶指数平滑：当时间序列无明显的趋势变化，可用一阶指数平滑预测。其预测公式为：

y_t+1'＝ay_t+(1-a)y_t'

上式中，

y_t+1'为t+1期的预测值，即本期(t期)的平滑值S_t；

y_t为t期的实际值；

y_t'为t期的预测值，即上期的平滑值S_t-1；

a′为0和1之间的任意值，它控制着新旧信息之间的平衡；

即下一期的预测值等于本期的实际值与本期的预测值的加权平均。

二阶指数平滑：对一阶指数平滑的再平滑，它较适用于具线性趋势的时间序列。

具体预测公式详见现有技术，在此不再赘述。

三阶指数平滑：在二阶平滑基础上的再平滑。具体预测公式详见现有技术，在此不再赘述。

时间序列指数平滑算法的原理中，预测值是以前观测值的加权和，且对不同的数据给予不同的权重，新数据给较大的权重，旧数据给较小的权重。

其他预测算法的具体实现方式可参照现有技术，在此不再赘述。

上述步骤S14中，基于变化趋势，对分布式系统的磁盘故障进行预测，是指对分布式系统的哪个或者哪些磁盘在未来预设时长内将发生故障进行准确预测。

具体实现时，先根据分布式系统中至少一个磁盘的运行状态信息，确定分布式系统至少一个磁盘对应的故障判定阈值；然后，基于分布式系统中至少一个磁盘所对应的状态监测数据的变化趋势，以及故障判定阈值，确定至少一个磁盘中将要发生故障的磁盘。

其中，磁盘的运行状态信息，可包括下述一项或多项信息：

磁盘承载的业务属性信息；

磁盘存储空间大小的信息；

磁盘存储数据的使用率信息和所述磁盘存储数据的副本数量信息。

故障判定阈值可以是多维度的，为了准确预测，故障判定阈值可从时间长度和数值大小两方面来考虑。比如设定监测时长阈值和状态监测数据临界值；换言之，就是在未来某个时间段之前，分布式系统中的磁盘的状态监测数据的发展趋势将达到某个状态监测数据临界值。

在一个实施例中，对于分布式系统的不同磁盘，可以个性化地综合考虑它所承载的业务属性，磁盘存储空间大小，存储数据使用率大小，磁盘存储数据副本数量多少等等信息，来给出对应的监测时长阈值和状态监测数据临界值的大小。举例来说，对于承载的业务属性为重要性级别较高的业务，或者对响应速度和响应质量要求较高的业务，则这个监测时长阈值和状态监测数据临界值要设置的较小一些，反之可以设置的较大一些。又例如磁盘空间较大的，那么这个监测时长阈值和状态监测数据临界值设置的较大一些，反之设置的较小一些。再比如，磁盘存储数据的使用率较高，磁盘存储数据的副本数量较少，则对应监测时长和状态监测数据临界值设置的要较小一些，反之可以设置的较大一些。当综合考虑这些因素中的一项或多项的时候，可以考虑各项因素的权重，最终确定一个合适的监测时长阈值和状态监测数据临界值。

在确定将要发生故障的磁盘之后，还可以推送预测将要发生故障的磁盘所对应的预警信息。

例如，若判断未来趋势数据从当前时刻开始，在监测时长阈值的时间范围内，某磁盘的状态监测数据会达到预设的状态监测数据临界点，则确定需要推送该磁盘对应的预警信息。

根据前述预测算法，能够得到分布式系统中每个磁盘的状态监测数据的趋势图，在趋势图中，例如图3所示的例子，横轴为时间轴，时间轴上的编号表示日期和时间，例如2019010107表示2019年1月1日7时，纵轴为状态监测数据的具体数值。

根据趋势图中的数据，可以推测出在未来的某个时间点，例如在未来的三天时间内，是否可能达到预设的状态监测数据的临界值。

如前述，预设的未来的时间点的设置，可根据磁盘可能出现故障所造成的紧急程度来设定。比如设置为当前时间后的24小时，也可以设置为当前时间后的3天等等，本发明实施例对此不做限定。

进一步地，上述推送对应的预警信息操作之前，例如可包含下述步骤：

判断出将要发生故障的磁盘当前预警的级别；

根据所述级别，判断是否需要推送预警信息；

例如级别达到预设的级别阈值时，确定当前需要预警。

若判断需要，则推送将要发生故障的磁盘所对应的预警信息。

进一步地，推送的预警信息中，例如可具体包含：需要进行预警的磁盘所属服务器的标识、需要进行预警的磁盘的标识、在监测时长阈值的时间范围内将达到状态监测数据临界点的信息以及对应的预警的级别等等。

在针对需要预警的磁盘，在预警信息中进一步提示预警的级别，可反映出当前预警所提示的情况的紧急程度或严重程度，确定级别高低的原则较多，例如，在某些情况下，比如在较短的时间内，磁盘的某些状态监测数据就会达到预设的状态值临界点，这种情况，可以列为较高级别，反之则为较低级别。又比如，某磁盘在预设的时间点达到预设状态值临界点时，该磁盘的故障会导致某文件的副本数量低于标准阈值的情况，可以列为较高级别，反之为较低级别；又比如根据状态监测数据反映出的预警的重要性来确定级别的高低，或者磁盘上存储文件的业务的重要程度、磁盘上存储文件的使用频率的高低等等因素，本发明实施例在此不做限定。

磁盘故障的预测服务器，还可以综合根据各个磁盘的故障的预测情况，确定预警的级别，比如某个文件的副本存储在多个不同的磁盘中，如果多个磁盘的故障预测都显示如果这些磁盘出现故障，会导致文件的副本数量低于预设的阈值，这将威胁到数据存储的可靠性，则也可以将这些磁盘的预警级别同时调整到较高的级别。

在一个实施例中，本发明实施例还根据预测将要发生故障的磁盘的标识，生成包含将要发生故障的磁盘信息的故障集，以供查询故障集中的磁盘在分布式系统中的业务状态和逻辑属性。

故障集中记录了需要预警的磁盘的业务状态和逻辑属性，以供其他客户端查询，获取可能发生故障的磁盘的相关信息。

在对磁盘故障进行了合理的预测之后，还可以执行对应的预警操作，对应地，参照图4所示，本发明实施例还提供了另一种分布式系统的磁盘管理方法，该方法包括下述步骤：

S41、对分布式系统的磁盘故障进行预测；

S42、对于预测出的所述分布式系统中将要发生故障的磁盘，推送对应的预警信息和/或调用分布式存储运维接口执行预设的磁盘保护操作。

上述步骤S41的具体实施方式，与前述分布式系统的磁盘管理方法的具体实施方式相似，在此不做赘述。

在上述步骤S42中，可以通过下述任一方式或多项组合的方式来推送预警信息：

1、通过网页方式推送给监控终端；

2、通过预警网关推送短信息消息或邮件给监控终端；

3、通过预设的APP推送通知消息推送给监控终端；

当然，本发明实施例并不限于上述几种具体的推送方式，任何推送方式都可以。

相应地，上述预设的磁盘保护操作，也可以包括下述一项或多项操作：

外迁磁盘的数据、在其他磁盘中补充文件副本和减少磁盘的读写操作。

具体来说，例如将所述将要发生故障的磁盘中的数据迁移至目标磁盘中；或者，在所述目标磁盘中，增加所述将要发生故障的磁盘中数据的副本；或者，将指向将要发生故障的磁盘的读写请求调度至目标磁盘。

上述目标磁盘可以是预先指定的某磁盘，或者可以是分布式系统中，除了被预测出将要发生故障的磁盘之外的、运行状态正常的磁盘，本发明实施例对此不做限定。

需要说明的是，上述分布式系统的磁盘管理方法，可以由某个独立服务器完成，而磁盘故障预警信息的推送和执行磁盘保护操作可以由另外的服务器完成。也可以由某个独立服务器同时完成上述磁盘故障的预测方法及后续磁盘故障预警信息的推送和执行磁盘保护操作。

下面以一个具体的例子，说明本发明实施例提供的上述磁盘故障的预测方法和磁盘故障的预警方法：

参照图5所示，图5是该例子所适用的网络架构图，在图5中，包括磁盘探针模块，任务调度模块、告警管理模块、数据分析模块、智能评估模块和预警模块。

具体地，磁盘探针模块在部署时，可分为客户端和服务端，客户端位于挂载有磁盘的分布式系统服务器上，服务端可位于磁盘故障预警服务器上；

任务调度模块、告警管理模块、数据分析模块、智能评估模块和预警模块，可部署于独立的磁盘故障预警服务器上，或者分别部署于几个分离的服务器上，这几个分离的服务器作为集合可实现磁盘故障预警的功能。

其中：

任务调度模块用于定时触发对应的磁盘的S.M.A.T状态监测数据的探测操作，以及在触发完探测行为后定期推动预警列表的数据至预警网关；

磁盘探针模块的客户端，用于触发S.M.A.T的检测操作，以获得各项S.M.A.T状态监测数据(也就是采集过程)；并将采集到的S.M.A.T状态监测数据发送至磁盘探针模块的服务端。

磁盘探针模块的服务端，包括触发远程的磁盘探针模块的客户端运行，以及接收各个分布式系统服务器上的磁盘探针客户端发送的S.M.A.T状态监测数据的数据包，然后整合数据包，发送给告警管理模块。

告警管理模块，用于接收磁盘探针模块发送的S.M.A.T状态监测数据的数据包，并解析数据包，并解析出的数据格式化之后写入数据库。

数据分析模块，该模块是预测算法模型的数据生产方，用来筛选数据库中各分布式系统服务器挂载磁盘的相关数据，基本功能如下：从原始数据中提取出与磁盘故障相关的数据，使其能被预测算法模型所识别和使用。并且按照预先设置的规则，筛除其中低权重的状态监测数据。

智能评估模块，该模块用于预测未来的趋势数据，确定每个磁盘是否可能发生故障且需要发出预警，以及综合各种情况，确定出可能发生故障(也即需要发出预警)的磁盘的预警级别。

具体的磁盘故障的预警方法的流程，可参照图6所示，首先，任务调度模块定时触发对应的磁盘的S.M.A.T状态监测数据的探测操作，磁盘探针模块的探针客户端采集S.M.A.T各项属性值并发给磁盘探针模块的服务端；

磁盘探针模块的服务端再发送给告警管理模块，将原始采集的数据进行格式化后写入数据库；

例如，原始利用smartctl工具采集的数据如下：

ID#ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILEDRAW_VALUE

5 Reallocated_Sector_Ct 0x0032 100 100 000Old_age Always-0

9 Power_On_Hours 0x0032 100 100 000Old_age Always-37232

12 Power_Cycle_Count 0x0032 100 100 000Old_age Always-26

170 Unknown_Attribute 0x0033 100 100 010Pre-fail Always-0

171 Unknown_Attribute 0x0032 100 100 000Old_age Always-0

……

格式化的过程中，需要摘取中不同ID(例如上述5、9、12、170和171等)对应的value的值。

然后，由数据分析模块从数据库中各磁盘的原始采集的数据进行故障相关状态监测数据的提取、并筛除掉其中低权值的状态监测数据；

智能评估模块采用预设的算法模型，对个磁盘的故障进行预测，评估风险，如需要预警，则由预警模块，通过任务调度模块向外发出预警信息(例如向预警大盘、主动运维中心和预警网关发出预警信息)等。

本发明实施例还提供了另一种分布式系统的磁盘管理方法，在具体实施时，该方法可作为一个磁盘管理客户端的功能来实现，具体来说，其流程可参见图7所示，包括下述步骤：

S71、响应于磁盘检测指令，触发分布式服务集群中部分或全部磁盘执行自检测流程；

该磁盘检测指令，可以是通过人机交互方式得到的磁盘检测指令，也可以是担负分布式系统磁盘管理功能的服务器发出的磁盘检测指令。

S72、收集上述部分或全部磁盘的自检测流程的检测结果；

S73、获取根据检测结果确定的磁盘故障预测信息，其中，磁盘故障预测信息是根据检测结果中与磁盘故障相关的状态监测数据的变化趋势预测得到的；

S74、在显示界面提供磁盘故障预测信息。

在一个实施例中，上述步骤S73中，获取根据检测结果确定的磁盘提示信息，可以通过下述两个步骤实现：

1、将检测结果提交给分布式服务集群之外的目标服务器；

2、接收目标服务器根据检测结果确定的磁盘故障预测信息。

一方面采用分布式系统之外的目标服务器，另一方面，监测数据也可以通过分布式系统自身业务通信信道之外的网络通道来传送给该目标服务器(例如可以是独立的故障预警服务器等)，采用此类技术手段，在进行磁盘的故障监测的同时，还可以保证分布式系统正常的通信功能，不会对分布式系统产生性能上的影响。

在具体实施中，上述客户端可以是具有用户显示界面的可采集磁盘执行自检测流程的检测结果的任何用户设备，例如各种手持终端如手机、智能平板、PC机等等。在显示界面上提供磁盘故障的预测信息的方式也可以有多种，比如使用纯文本提示的方式、纯图形化提示的方式、图形及文本综合提示的方式、或者更为复杂的，将可视化的文本、图形和客户端的指示灯、振动等其他感知途径综合使用的方式，本发明实施例对此不做限定。

一个包含上述客户端的网络架构的例子参照图8所示，在该图8中，至少一个客户端81以及与磁盘故障预测服务器82或者磁盘故障预警服务器83连接；

客户端81，响应于磁盘故障预测服务器82或者磁盘故障预警服务器83的磁盘检测指令，触发分布式服务集群中部分或全部磁盘执行自检测流程，收集所述部分或全部磁盘的自检测流程的检测结果；例如触发各磁盘的自检测、分析及报告技术S.M.A.R.T的自检测流程，收集S.M.A.R.T的检测得到的S.M.A.R.T的各项状态监测数据并上传至磁盘故障预测服务器82或者磁盘故障预警服务器83；以及从磁盘故障预测服务器82或者磁盘故障预警服务器83获取根据检测结果确定的磁盘预警信息，并显示在用户显示界面上。

基于同一发明构思，本发明实施例还提供了一种分布式系统的磁盘管理装置，由于这些装置所解决问题的原理与前述分布式系统的磁盘管理方法相似，因此该装置、服务器和客户端的实施可以参见前述方法的实施，重复之处不再赘述。

本发明实施例提供的一种分布式系统的磁盘管理装置，参照图9所示，包括：

采集模块91，用于采集所述分布式系统的磁盘状态信息；

获取模块92，用于基于所述磁盘状态信息，获得磁盘故障相关的状态监测数据；

变化趋势预估模块93，用于根据所述状态监测数据，预估状态监测数据的变化趋势；

故障预测模块94，用于基于所述变化趋势，对所述分布式系统的磁盘故障进行预测。

在一个实施例中，上述获取模块92，还用于判断磁盘故障相关的状态监测数据中，是否存在低权重的状态监测数据；低权重的状态监测数据是反映磁盘故障趋势的权重低于预设权重阈值的状态监测数据；若存在，则从所述磁盘故障相关的状态监测数据中筛选掉上述低权重的状态监测数据。

在一个实施例中，变化趋势预估模块93，具体用于根据所述分布式系统中至少一个磁盘的运行状态信息，确定所述至少一个磁盘对应的故障判定阈值；所述运行状态信息，包括下述一项或多项信息：所述磁盘承载的业务属性信息、所述磁盘存储空间大小的信息、所述磁盘存储数据的使用率信息和所述磁盘存储数据的副本数量信息；基于所述至少一个磁盘所对应的状态监测数据的变化趋势，以及所述故障判定阈值，确定所述至少一个磁盘中将要发生故障的磁盘。

本发明实施例提供的另一种分布式系统的磁盘管理装置，参照图10所示，包括：

故障预测模块101，用于对所述分布式系统的磁盘故障进行预测；

预警模块102，用于对于预测出的所述分布式系统中将要发生故障的磁盘，推送对应的预警信息和/或调用分布式存储运维接口执行预设的磁盘保护操作；

其中，故障预测模块101对分布式系统的磁盘故障进行预测的步骤，可参见前述分布式系统的磁盘管理方法，在此不再赘述。

本发明实施例提供的另一种分布式系统的磁盘管理装置，参照图11所示，包括：

触发模块111，用于响应于磁盘检测指令，触发分布式服务集群中部分或全部磁盘执行自检测流程；

收集模块112，用于收集部分或全部磁盘的自检测流程的检测结果；

获取模块113，用于获取根据检测结果确定的磁盘预警信息，磁盘预警信息是根据检测结果中与磁盘故障相关的状态监测数据的变化趋势得到的；

显示模块114，用于在显示界面提供磁盘故障预测信息。

本发明实施例还提供了一种服务器，该服务器包括：存储器、处理器及存储于存储器上并可在处理器上运行的计算机指令，所述指令被处理器执行时能够实现如前述的分布式系统的磁盘管理方法。

本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机指令，所述指令被处理器执行时能够实现如前述的分布式系统的磁盘管理方法。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种分布式系统的磁盘管理方法，其特征在于，包括：

采集所述分布式系统的磁盘状态信息；

根据所述状态监测数据，预估状态监测数据的变化趋势；

2.如权利要求1所述的方法，其特征在于，所述基于所述变化趋势，对所述分布式系统的磁盘故障进行预测，包括：

根据所述分布式系统中至少一个磁盘的运行状态信息，确定所述至少一个磁盘对应的故障判定阈值；

基于所述至少一个磁盘所对应的状态监测数据的变化趋势以及所述故障判定阈值，确定所述至少一个磁盘中将要发生故障的磁盘。

3.如权利要求2所述的方法，其特征在于，所述故障判定阈值，包括：监测时长阈值和状态监测数据临界值；

根据所述状态监测数据，预估状态监测数据的变化趋势，包括：对获得的状态监测数据进行趋势预测，得到所述状态监测数据对应的磁盘状态的变化趋势数据；

基于所述变化趋势，对所述分布式系统的磁盘故障进行预测，包括：

从当前时刻开始，在所述监测时长阈值的时间范围内，判断所述磁盘状态的变化趋势数据，是否将会达到所述状态监测数据临界值；

若是，则预测所述状态监测数据所对应的磁盘将要发生故障。

4.如权利要求2或3所述的方法，其特征在于，确定所述至少一个磁盘中将要发生故障的磁盘之后，所述方法还包括：

判断所述将要发生故障的磁盘当前预警的级别；

根据所述级别，判断是否需要推送预警信息；

若判断需要，则推送所述将要发生故障的磁盘对应的预警信息。

5.如权利要求2或3所述的方法，其特征在于，确定所述至少一个磁盘中将要发生故障的磁盘之后，所述方法还包括：

对所述将要发生故障的磁盘，执行下述一项或多项操作：

将所述将要发生故障的磁盘中的数据迁移至目标磁盘中；

在所述目标磁盘中，增加所述将要发生故障的磁盘中数据的副本；

将指向所述将要发生故障的磁盘的读写请求调度至所述目标磁盘。

6.如权利要求4所述的方法，其特征在于，所述方法还包括：

根据所述将要发生故障的磁盘的标识，生成包含所述将要发生故障的磁盘信息的故障集，以供查询所述故障集中的磁盘在分布式系统中的业务状态和逻辑属性。

7.如权利要求1～3任一项所述的方法，其特征在于，获得磁盘故障相关的状态监测数据之后，预估状态监测数据的变化趋势之前，所述方法还包括：

判断磁盘故障相关的状态监测数据中，是否存在低权重的状态监测数据；所述低权重的状态监测数据是反映磁盘故障趋势的权重低于权重阈值的状态监测数据；

若存在，则从所述磁盘故障相关的状态监测数据中剔除所述低权重的状态监测数据。

8.一种分布式系统的磁盘管理方法，其特征在于，包括：

对所述分布式系统的磁盘故障进行预测；

对于预测出的所述分布式系统中将要发生故障的磁盘，推送对应的预警信息和/或调用分布式存储运维接口执行磁盘保护操作；

其中，所述对所述分布式系统的磁盘故障进行预测的步骤，采用如权利要求1～7任一项所述的分布式系统的磁盘管理方法。

9.一种分布式系统的磁盘管理方法，包括：

收集所述部分或全部磁盘的自检测流程的检测结果；

在显示界面提供所述磁盘故障预测信息。

10.如权利要求9所述的方法，其特征在于，获取根据所述检测结果确定的磁盘故障预测信息，包括：

将所述检测结果提交给目标服务器；

接收所述目标服务器根据所述检测结果确定的磁盘故障预测信息。

11.一种分布式系统的磁盘管理装置，其特征在于，包括：

采集模块，用于采集所述分布式系统的磁盘状态信息；

12.一种分布式系统的磁盘管理装置，其特征在于，包括：

预警模块，用于对于预测出的所述分布式系统中将要发生故障的磁盘，推送对应的预警信息和/或调用分布式存储运维接口执行磁盘保护操作；

其中，所述故障预测模块对所述分布式系统的磁盘故障进行预测的步骤，采用如权利要求1～8任一项所述的分布式系统的磁盘管理方法。

13.一种分布式系统的磁盘管理装置，其特征在于，包括：

显示模块，用于在显示界面提供所述磁盘故障预测信息。

14.一种服务器，其特征在于，包括：存储器、处理器及存储于存储器上并可在处理器上运行的计算机指令，其特征在于，所述指令被处理器执行时能够实现如权利要求1-10任一项所述的分布式系统的磁盘管理方法。

15.一种计算机可读存储介质，其上存储有计算机指令，其特征在于，所述指令被处理器执行时能够实现如权利要求1-10任一项所述的分布式系统的磁盘管理方法。