WO2018121456A1

WO2018121456A1 - 一种数据存储方法、服务器以及存储系统

Info

Publication number: WO2018121456A1
Application number: PCT/CN2017/118148
Authority: WO
Inventors: 杨定国
Original assignee: 华为技术有限公司
Priority date: 2016-12-29
Filing date: 2017-12-23
Publication date: 2018-07-05
Also published as: CN106844108A; CN106844108B

Abstract

本发明实施例提供一种数据存储方法、服务器以及存储系统，尤其涉及数据存储技术领域，用以解决现有技术中若逻辑分组中存在任意一个硬盘故障时，造成的存储该逻辑分组的数据出现降级写的问题，包括：第一服务器在确定第一服务器的第一逻辑分组中的第一硬盘故障时，获取目标硬盘的标识；目标硬盘为所述存储系统包括的硬盘中与第一硬盘不同的硬盘，第一服务器为所述多个服务器中的一个；第一服务器根据标识，将目标数据存储至标识所指示的目标硬盘中；目标数据为源数据中待存储至第一硬盘的数据；第一服务器将源数据中除目标数据之外的其余数据，存储至第一逻辑分组中除第一硬盘之外的其余硬盘中。

Description

一种数据存储方法、服务器以及存储系统

技术领域

本发明实施例涉及数据存储技术领域，尤其涉及一种数据存储方法、服务器以及存储系统。

背景技术

随着存储容量的不断增大，存储系统中服务器、硬盘数量也在增加，如何保证在出现节点、硬盘或网络等故障的情况下，还能保证新写入存储系统的数据的可靠性成为日益迫切的需求。

现有技术中，如图1a所示，存储系统1中任意一个服务器均包括多个逻辑分组，如图1a所示，服务器10包括多个逻辑分组，例如，逻辑分组101、逻辑分组102以及逻辑分组103，每个逻辑分组包括一个或多个硬盘，例如，逻辑分组101包括硬盘(Disk)1011、Disk1012以及Disk1013。服务器10将待存入数据(包括M个原始数据和N个冗余数据，其中，N个冗余数据为M个原始数据的校验和)以逻辑分组为粒度存入一个逻辑分组中，例如，如图1b所示，服务器10将原始数据写入Disk1011中，将冗余数据写入Disk1012和Disk1013中。

但是，如图1b所示，在Disk(硬盘)1011故障时，原始数据则不能成功存入Disk1011中，使得存入逻辑分组101的数据，会出现降级写(指源数据由于逻辑分组中的硬盘故障不能写入完整的原始数据和冗余数据)，并且数据出现降级写后，若在一个逻辑分组中再次出现硬盘故障，则会导致数据丢失，从而降低写入该逻辑分组的数据的可靠性。

发明内容

本发明的实施例提供一种数据存储方法、服务器以及存储系统，用以解决现有技术中若逻辑分组中任意一个硬盘故障时，造成的存储该逻辑分组的数据出现降级写的问题。

为达到上述目的，本发明的实施例采用如下技术方案：

第一方面，本发明实施例提供一种数据存储方法，应用于存储系统中，存储系统包括多个服务器，多个服务器中每个服务器包括至少一个逻辑分组，至少一个逻辑分组中每个逻辑分组包括多个硬盘,本发明实施例提供方法包括：第一服务器在确定第一服务器的第一逻辑分组中的第一硬盘故障时，获取目标硬盘的标识；目标硬盘为存储系统包括的硬盘中与所述第一硬盘不同的硬盘，第一服务器为所述多个服务器中的一个；第一服务器根据标识，将目标数据存储至标识所指示的目标硬盘中；目标数据为待存储至第一服务器的源数据中待存储至第一硬盘的数据；第一服务器将源数据中除所述目标数据之外的其余数据，存储至第一逻辑分组中除第一硬盘之外的其余硬盘中。

本发明实施例提供一种数据存储方法，通过在确定第一逻辑分组中的第一硬盘故障时，从存储系统的管理模块处获取目标硬盘的标识，然后将该标识指示的目标硬盘作为临时成员盘用于存储待存入第一硬盘的数据，这样能够在第一硬盘故障时，及时将待存入第一硬盘的数据临时记录到目标硬盘中，保证了源数据能够在存储系统中写入完整份数的冗余数据和原始数据，从而保证了源数据不存在降级写(指源数据由于逻辑分组中的硬盘故障不能写入完整的原始数据和冗余数据，并且，目标硬盘是从整个存储系统包括的多个硬盘中选择的，这样所选择的目标硬盘可以位于第一逻辑分组中，也可以不位于第一逻辑分组中，能够有效的平衡存储系统的容量。

结合第一方面，在第一方面的第一种可能的实现方式中，源数据包括M份原始数据和N份冗余数据，M份原始数据和N份冗余数据中每份数据均携带版本号；一份数据的版本号用于指示数据是否有效；N、M均为大于或等于1的正整数；M大于N，第一服务器将源数据中除目标数据之外的其余数据，存储至第一逻辑分组中除第一硬盘之外的其余硬盘中之后，本发明实施例提供的方法还包括：第一服务器接收客户端发送的用于读取源数据的读数据业务请求；第一服务器根据读数据业务请求，从第一逻辑分组以及目标硬盘中分别读取M份原始数据和N份冗余数据，以及每份数据的版本号；第一服务器根据每份数据的版本号，从M份原始数据和N份冗余数据中确定至少M份有效数据；第一服务器根据至少M份有效数据获取源数据，以及将源数据返回给客户端。

结合第一方面或第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，第一服务器根据每份数据的版本号，从M份原始数据和N份冗余数据中确定至少M份有效数据，包括：第一服务器若确定M份原始数据和N份冗余数据中存在M份或M份以上的数据的版本号一致，则确定M或M份以上的数据中的每份数据均为有效数据。

结合第一方面至第一方面的第二种可能的实现方式中的任意一种实现方式，在第一方面的第三种可能的实现方式中，第一服务器在其余硬盘中的每个硬盘以及所述目标硬盘中存储有操作日志，一个硬盘的操作日志用于指示存储在所述一个硬盘中的数据的偏移量，一个数据的偏移量用于指示所述数据在其存储的硬盘中的地址偏移量，本发明实施例提供的方法还包括：第一服务器在确定第一硬盘的状态为正常时，根据操作日志则将目标数据从目标硬盘中回迁至第一硬盘中。

结合第一方面至第一方面的第三种可能的实现方式中，在第一方面的第四种可能的实现方式中，从存储系统的管理模块处获取目标硬盘的标识之前，本发明实施例提供的方法还包括：第一服务器向管理模块发送用于指示所述管理模块从所述存储系统包括的多个硬盘或者所述多个硬盘中除属于所述第一逻辑分组之外的其余硬盘中选择一个用于存储所述目标数据的硬盘，作为目标硬盘的第一请求消息；第一服务器接收所述管理模块发送的携带有目标硬盘标识的第一响应消息，目标硬盘为所述管理模块根据预设策略从所述多个硬盘或者所述多个硬盘中除属于第一逻辑分组之外的其余硬盘中所选择。

结合第一方面至第一方面的第四种可能的实现方式中，在第一方面的第五种可能的实现方式中，预设策略为按照多个硬盘中每个硬盘的预设优先等级，将多个硬盘中除第一硬盘之外的其余硬盘中预设优先等级最高的硬盘确定为目标硬盘。

第二方面，本发明实施例提供一种服务器，应用于存储系统中，存储系统包括多个服务器，多个服务器中每个服务器包括至少一个逻辑分组，至少一个逻辑分组中每个逻辑分组包括多个硬盘，服务器包括：接收单元，用于在确定第一逻辑分组中的第一硬盘故障时，从存储系统的管理模块处获取目标硬盘的标识；目标硬盘为管理模块在接收到第一服务器发送的第一请求消息后，根据预设策略从所述存储系统包括的多个硬盘中选择的，第一逻辑分组位于第一服务器中，第一服务器为存储系统包括的多个服务器中任意一个；存储单元，用于根据标识，将目标数据存储至标识所指示的目标硬盘中；目标数据为待存储至第一服务器的源数据中待存储至第一硬盘的数据；存储单元，还用于将源数据中除目标数据之外的其余数据，存储至第一逻辑分组中除第一硬盘之外的其余硬盘中。

结合第二方面，在第二方面的第一种可能的实现方式中，源数据包括M份原始数据和N 份冗余数据，M份原始数据和N份冗余数据中每份数据均携带版本号；一份数据的版本号用于指示数据是否有效；N、M均为大于或等于1的正整数，M大于N，接收单元，用于接收客户端发送的用于读取源数据的读数据业务请求；读取单元，用于根据读数据业务请求，从第一逻辑分组以及目标硬盘中分别读取M份原始数据和N份冗余数据，以及每份数据的版本号；确定单元，用于根据每份数据的版本号，从M份原始数据和N份冗余数据中确定至少M份有效数据；响应单元，用于根据至少M份有效数据获取源数据，以及将源数据返回给客户端。

结合第二方面或第二方面的第一种可能的实现方式中，在第二方面的第二种可能的实现方式中，获取单元具体用于，若确定M份原始数据和N份冗余数据中存在M份或M份以上的数据的版本号一致，则确定M或M份以上的数据中的每份数据均为有效数据。

结合第二方面至第二方面的第二种可能的实现方式中，在第二方面的第三种可能的实现方式中，存储单元还用于：在其余硬盘中的每个硬盘以及目标硬盘中存储有操作日志，一个硬盘的操作日志用于指示存储在一个硬盘中的数据的偏移量，一个数据的偏移量用于指示所述数据在其存储的硬盘中的地址偏移量，以及用于在确定第一硬盘的状态为正常时，根据操作日志则将所述目标数据从所述目标硬盘中回迁至所述第一硬盘中。

结合第二方面至第二方面的第三种可能的实现方式中，在第二方面的第四种可能的实现方式中，服务器还包括发送单元，用于向管理模块发送第一请求消息，第一请求消息用于指示管理模块从存储系统包括的多个硬盘或者多个硬盘中除属于第一逻辑分组之外的其余硬盘中选择一个硬盘，作为目标硬盘；接收单元，还用于接收管理模块发送的携带有所述管理模块根据预设策略从所述多个硬盘或者所述多个硬盘中除属于所述第一逻辑分组之外的其余硬盘中所选择的目标硬盘的第一响应消息。

结合第二方面至第二方面的第四种可能的实现方式中，第二方面的第五种可能的实现方式中，预设策略为按照多个硬盘中每个硬盘的预设优先等级，将多个硬盘中预设优先等级最高的硬盘确定为目标硬盘。

第三方面，本发明实施例提供一种服务器，服务器包括处理器、存储器和通信总线，该处理器和存储器通过通信总线连接，该存储器用于存储软件程序以及模块，该处理器用于运行软件程序以及模块，从而执行：第一方面至第一方面的第六种可能的实现方式中任意一种可能的实现方式所描述的数据存储方法。

第四方面，本发明实施例提供一种存储系统，该存储系统中包括多个服务器，多个服务器中每个服务器包括至少一个逻辑分组，所述至少一个逻辑分组中每个逻辑分组包括多个硬盘，其中，每个服务器采用如第二方面任意一种可能的实现方式所描述的服务器。

第五方面，本发明实施例提供了一种计算机存储介质，用于储存为第一方面所描述的数据存储方法所用的计算机软件指令，其包含用于执行第三方面所描述的服务器所设计的程序。

附图说明

图1a为现有技术提供的一种存储系统的结构示意图；

图1b为现有技术提供的一种数据存储示意图；

图2a为本发明实施例提供的一种存储系统的结构示意图；

图2b为本发明实施例提供的一种服务器的结构示意图；

图3为本发明实施例提供的一种数据存储方法的流程示意图一；

图4a为本发明实施例提供的一种数据存储结构示意图一；

图4b为本发明实施例提供的一种数据存储结构示意图二；

图5为本发明实施例提供的一种数据存储方法的流程示意图二；

图6为本发明实施例提供的一种数据存储方法的流程示意图三；

图7为本发明实施例提供的一种数据存储方法的流程示意图四；

图8a为本发明实施例提供的一种服务器的结构示意图一；

图8b为本发明实施例提供的一种服务器的结构示意图二；

图8c为本发明实施例提供的一种服务器的结构示意图三。

具体实施方式

如图2a所示，本发明实施例提供一种存储系统，该存储系统2包括多个服务器(例如，服务器21、服务器22以及服务器23，一个或多个服务器之间通过交换机241和交换机242进行连接。该存储系统2包括的多个服务器中每个服务器包括一个或多个逻辑分组(例如，逻辑分组211、逻辑分组212以及逻辑分组213)，一个逻辑分组用于存储一个或多个源数据，一个逻辑分组包括多个硬盘，如图2a所示，逻辑分组211包括硬盘2111、硬盘2112以及硬盘2113，逻辑分组212包括硬盘2112、硬盘2121以及硬盘2122，为了保证每个硬盘的占用率均衡，一个硬盘可以属于多个逻辑分组，如图2a所示，硬盘2112既属于逻辑分组211又属于逻辑分组212，硬盘2113既属于逻辑分组213又属于逻辑分组211。在图2a中仅示出了三个服务器(服务器21、服务器22和服务器23)以及三个逻辑分组(分别为逻辑分组211、逻辑分组212和逻辑分组213)，但是可以理解的是，本发明实施例提供的存储系统还可以包括更多或者更少的服务器，每个服务器也可以包括更多或者更少的逻辑分组。

本发明实施例提供的如图2a所示的存储系统设置有管理模块25，该管理模块25与多个服务器中每个服务器相连，用于获取每个服务器包括的多个硬盘的信息，例如，多个硬盘的容量信息，多个硬盘的硬盘标识，多个硬盘中每个硬盘所属的逻辑分组的标识，多个硬盘中每个硬盘的状态等(例如，故障或者正常状态)。管理模块用于按照预设周期周期性的更新存储系统中每个硬盘的信息，并将每个硬盘的信息上报给该硬盘所在的服务器，以及用于在接收到服务器的请求消息(例如，第一请求消息)之后，根据服务器的请求消息从存储系统包括的多个硬盘中或者从多个硬盘中除属于第一逻辑分组之外的其余硬盘中选择一个硬盘作为目标硬盘。示例性的，管理模块25，在存储系统初始化成功后，查询该存储系统包括的每个硬盘的信息，然后将查询到的每个硬盘的信息记录在管理模块25中，并将查询到的每个硬盘的信息上报给对应硬盘所在的服务器。

其中，如图2b中所描述的任意一个服务器也可以称为节点，至少一个服务器为可以为客户端提供服务的网络设备，比如，服务器21、服务器22以及服务器23可以是具有服务器功能的计算机等。由于每个服务器的硬件结构相同，本发明实施例以服务器21为例介绍图2a所示的存储系统系统中每个服务器的硬件架构，参见图2b，服务器21包括存储器2031、处理器2032、系统总线2033、电源组件2034、输入\输出接口2035和通信组件2036等。其中，存储器2031可用于存储数据、软件程序以及模块，主要包括存储程序区和存储数据区，存储程序区可存储操作系统、至少一个功能所需的应用程序等，存储数据区可存储服务器203的使用所创建的数据等。处理器2032通过运行或执行存储在存储器2031内的软件程序和/或模块，以及调用存储在存储器2031内的数据，执行服务器203的各种功能和处理数据。系统总线2033包括地址总线、数据总线、控制总线，用于传输数据和指令；电源组件2034用于为服务器203的各个组件提供电源；输入\输出接口2035为处理器2032和外围接口模块之间提供接口；通信组件2036用于为服务器21和其他设备之间进行有线或无线方式的通信。在通信系统中，服务器21承担着数据的存储、转发、发布等关键任务，是各类基于客户机/服务器(Client/Server，简称：C/S)模式或者浏览器/服务器(Browser/Server，简称：B/S)模式网络中不可或缺的重要组成部分。

如图3所示，本发明实施例提供一种数据存储方法，应用于如图2a所示的存储系统中，存储系统包括多个服务器，所述多个服务器中每个服务器包括至少一个逻辑分组，所述至少一个逻辑分组中每个逻辑分组包括多个硬盘，本发明实施例提供的方法包括：

S101、第一服务器在确定第一服务器的第一逻辑分组中的第一硬盘故障时，获取目标硬盘的标识；目标硬盘为所述存储系统包括的硬盘中与所述第一硬盘不同的硬盘，第一服务器为所述多个服务器中的一个。

S102、第一服务器根据标识，将目标数据存储至标识所指示的目标硬盘中；目标数据为待存储至第一服务器的源数据中待存储至第一硬盘的数据。

S103、将源数据中除目标数据之外的其余数据，存储至第一逻辑分组中除第一硬盘之外的其余硬盘中。

本发明实施例提供一种数据存储方法，通过在确定第一逻辑分组中的第一硬盘故障时，从存储系统的管理模块处获取目标硬盘的标识，然后将该标识指示的目标硬盘作为临时成员盘用于存储待存入第一硬盘的数据，这样能够在第一硬盘故障时，及时将待存入第一硬盘的数据临时记录到目标硬盘中，保证了源数据能够在存储系统中写入完整份数的冗余数据和原始数据，从而保证了源数据不存在降级写(降级写指源数据由于逻辑分组中的硬盘故障不能写入完整的原始数据和冗余数据)，并且，目标硬盘是从整个存储系统包括的多个硬盘中选择的，这样所选择的目标硬盘可以位于第一逻辑分组中，也可以不位于第一逻辑分组中，能够有效的平衡存储系统的容量。

本发明实施例中当第一服务器确定位于其内的第一硬盘故障时，则向管理模块25上报第一硬盘故障的指示信息，这样管理模块25可以根据其存储的多个硬盘中每个硬盘的信息，确定能够存储目标数据的目标硬盘，并将所确定的目标硬盘的标识发送给第一服务器，以使得第一服务器根据该标识确定用于暂时替代第一硬盘的目标硬盘。

其中，目标硬盘的标识用于唯一识别目标硬盘，示例性的，可以为目标硬盘的IP地址，也可以为目标硬盘的物理地址，本发明实施例对此不进行限定。

本发明实施例中第一服务器将源数据以数据冗余方式存储在第一逻辑分组中，具体的，第一服务器将源数据分为M份原始数据和N份冗余数据，该M的值和N的值可以根据第一逻辑分组中硬盘的数量进行设置。示例性的，该源数据为2M数据，则可以将该2M的源数据分为两份大小各为1M的原始数据，并根据该两份大小各为1M的原始数据获取1份校验和作为一份冗余数据，将两份大小各1M的原始数据和一份冗余数据存入一个逻辑分组中。具体的，可以将每份原始数据分别存储在该逻辑分组中的一个硬盘中，将一份冗余数据存储在该一个逻辑分组中的一个其他硬盘中。

具体的，M和N之和可以小于或等于第一逻辑分组所包括的硬盘的数量，M大于N。

如图4a所示，本发明实施例以第一服务器为服务器21，以源数据包括两份原始数据(即M＝2)和一份冗余数据(即N＝1)为例进行说明，该服务器21将源数据中的两份原始数据分别存储在硬盘2111和硬盘2112中，并将一份冗余数据存储在硬盘2113中。

示例性的，如图4a所示，以故障硬盘为硬盘2113为例进行说明：当服务器21确定第一逻辑分组211中的硬盘2113(即第一硬盘)故障时，则服务器201从管理模块25处获取目标硬盘的标识，并将该目标硬盘作为临时成员盘，以用于存储待存入第一硬盘的数据，如图4b中所示，服务器21将硬盘2114作为目标硬盘，其中，该硬盘2114可以属于第一逻辑分组211，也可以不属于第一逻辑分组211，例如，硬盘2114可以为如图2a所示的存储系统中服务器22中的一个硬盘，或者该硬盘2114也可以为如图2a所示的存储系统中服务器21的第二逻辑组2112中的任意一个硬盘等。服务器21将待存入硬盘2113的冗余数据存入目标硬盘(即硬盘2114)中。

若目标硬盘位于第一服务器中，则第一服务器直接将目标数据存储至目标硬盘中。

若目标硬盘属于存储系统中第一服务器之外的其余服务器(例如，第二服务器)，则第一服务器通过交换机向该第二服务器发送请求消息，该请求消息中携带有目标数据，该请求消息用于指示第二服务器将目标数据写入目标硬盘中。

需要说明的是，若待存入硬盘2113的数据为文件1、文件2、文件3和文件4，在向硬盘2113中存入文件1、文件2后，硬盘2113故障，则只需要将文件3和文件4存储到硬盘2114中。在读取数据时，可以根据需要直接从硬盘2114中读取文件3和文件4即可。

具体的，结合图3，如图5所示，本发明实施例在步骤S101之前还可以包括步骤S104a和S104b：

S104a、第一服务器向存储系统的管理模块发送第一请求消息，该第一请求消息用于指示管理模块从存储系统包括的多个硬盘或者多个硬盘中除属于第一逻辑分组之外的其余硬盘中选择一个硬盘，作为目标硬盘。

S104b、第一服务器接收管理模块发送的第一响应消息，第一响应消息中携带有所述目标硬盘的标识，目标硬盘为所述管理模块根据预设策略从多个硬盘或者所述多个硬盘中除属于第一逻辑分组之外的其余硬盘中所选择。

具体的，该第一请求消息中携带有指示信息，该指示信息携带有第一硬盘的标识以及第一硬盘所处的状态为故障状态，管理模块在接收到该第一请求消息后，根据该第一请求消息确认第一硬盘故障后，一方面，管理模块按照预设策略从存储系统包括的多个硬盘中除第一硬盘之外的其余硬盘中选择一个硬盘作为目标硬盘，这样所选择的目标硬盘可以属于第一服务器的第一逻辑分组，也可以为存储系统中除第一服务器之外的其余服务器上的硬盘。另一方面，管理模块可以按照预设策略从存储系统包括的多个硬盘中除属于第一逻辑分组之外的其余硬盘中选择一个硬盘，作为目标硬盘，这样做的目的可以避免所选择的目标硬盘位于第一逻辑分组。又一方面，管理模块可以按照预设策略从存储系统包括的多个硬盘中除属于第一服务器之外的其余硬盘中选择一个硬盘，作为目标硬盘。

可选的，本发明实施例中的预设策略为按照多个硬盘中每个硬盘的预设优先等级，将多个硬盘中除第一硬盘之外的其余硬盘中预设优先等级最高的硬盘确定为目标硬盘。

可选的，本发明实施例中管理模块可以根据每个硬盘的容量或者容量占用率等确定每个硬盘的预设优先等级。

示例性的，可以将多个硬盘中容量最大的硬盘确定为预设优先等级最高的硬盘，然后按照容量由大到小的顺序，依次设置每个硬盘的预设优先等级，即容量最大的硬盘的预设优先等级最高，容量最小的硬盘的预设优先等级最低。

或者可以将多个硬盘中容量占用率最低的硬盘确定为预设优先等级最高的硬盘，然后按照容量占用率由低到高的顺序依次设置每个硬盘的预设优先等级，即容量占用率最低的硬盘的预设优先等级最高，容量占用率最高的硬盘的预设优先等级最低。

本发明实施例通过根据多个硬盘中每个硬盘的容量选择容量最大的硬盘作为目标硬盘，或者根据多个硬盘中每个硬盘的容量占用率选择容量占用率最低的硬盘作为目标硬盘，这样根据存储系统中每个硬盘的容量或者容量占用率去选择目标硬盘，能够均衡存储系统中每个硬盘的容量。

需要说明的是，当任意两个或两个以上的硬盘容量相等时，则可以根据该两个或两个以上的硬盘中每个硬盘对应的容量占用率来确定该两个或两个以上的硬盘中每个硬盘的预设优先等级。示例性的，将两个或两个以上的容量相等的硬盘中容量占用率按照容量占用率由低到高的顺序排序，将两个或两个以上的容量相等的硬盘中容量占用率最低的硬盘的预设优先等级设置为最高(在两个或两个以上的容量相等的硬盘中)，将两个或两个以上的容量相等的硬盘中容量占用率最高的硬盘的预设优先等级设置为最低(在两个或两个以上的容量相等的硬盘中)，。例如，硬盘A、硬盘B和硬盘C的容量分别为Q，但是硬盘A的容量占用率为50％，硬盘B的容量占用率为51％，硬盘C的容量占用率为49％，则在硬盘A、硬盘B和硬盘C中，可以设置硬盘C的预设优先等级高于硬盘A的预设优先等级，硬盘A的预设优先等级高于硬盘B的预设优先等级。

当任意两个或两个以上的硬盘的容量占用率相等时，则可以根据该两个或两个以上的容量占用率相等的硬盘中每个硬盘对应的容量来确定两个或两个以上的容量占用率相等的硬盘中每个硬盘对应的预设优先等级。示例性的，可以将任意两个或两个以上的硬盘的容量占用率相等的硬盘中容量最大的硬盘确定为较高预设优先等级的硬盘，然后按照两个或两个以上的容量占用率相等的硬盘中每个硬盘容量由高至低的顺序依次设置每个硬盘的预设优先等级。例如，硬盘A、硬盘B和硬盘C的预设优先等级均为60％，但是硬盘A的容量为32G，硬盘B的容量为16G，硬盘C的容量为64G，则在硬盘A，硬盘B和硬盘C中，硬盘A的预设优先等级高于硬盘B的预设优先等级，但是，硬盘A的预设优先等级低于硬盘C的预设优先等级。

可选的，结合图3，如图6所示，本发明实施例提供的方法中，M份原始数据和N份冗余数据中每份数据均携带版本号，版本号用于指示每份数据是否有效，因此，在步骤S103之后，本发明实施例提供的方法还包括：

S105、第一服务器接收客户端发送的读数据业务请求，该读数据业务请求用于读取源数据。

具体的，该读数据业务请求中携带有源数据的标识。

可以理解的是，第一服务器中存储有记录表，该记录表用于记录源数据包括的M份原始数据和N份冗余数据具体位于哪个逻辑分组。

S106、第一服务器根据读数据业务请求，从第一逻辑分组以及目标硬盘中分别读取所述M份原始数据和所述N份冗余数据，以及每份数据的版本号。

需要说明的是，此时若第一硬盘的状态从故障状态恢复为正常状态，则第一服务器还需要从该第一硬盘中获取，在第一硬盘故障之前该源数据中已存储在第一硬盘中的数据，以及源数据中已存储在第一硬盘中的数据的版本号。

S107、第一服务器根据每份数据的版本号，从M份原始数据和N份冗余数据中确定至少M份有效数据。

示例性的，第一服务器在将源数据写入第一逻辑分组时，将源数据分为两份原始数据，然后根据EC(ErasureCode，数据校验擦除码)算法计算出一份冗余数据。第一服务器在根据客户端发送的用于读取源数据的读数据业务请求时，只需要在这三份数据(即两份原始数据和一份冗余数据)中找出两份有效数据，就可以通过EC算法计算出源数据。

S108、第一服务器根据至少M份有效数据获取源数据，以及将源数据返回给客户端。

可选的，结合图6，本发明实施例提供的步骤S107可以通过以下方式实现：

S1071、第一服务器若确定所述M份原始数据和N份冗余数据中存在M份或M份以上的数据的版本号一致，则确定M或M份以上的数据中的每份数据均为有效数据。

本发明实施例通过设置源数据包括的M份原始数据和N份冗余数据中每份数据的版本号，这样即使存储至目标硬盘中的目标数据没有回迁至第一硬盘之前，也可以根据版本号获取M份原始数据和N份冗余数据中的至少M份有效数据，并根据至少M份有效数据获取源数据，这样使得客户端能够在目标数据没有回迁至第一硬盘之前，也可以读取源数据，增强了存储系统可用性。

可选的，结合图3所示，本发明实施例还包括步骤S109：

S109、第一服务器在其余硬盘中的每个硬盘以及目标硬盘中存储有操作日志，一个所述硬盘的操作日志用于指示存储在一个硬盘中的数据的偏移量，一个数据的偏移量用于指示数据在其存储的硬盘中的地址偏移量。

本发明实施例通过将操作日志存储在每个硬盘中，这样当第一服务器重启时，可以避免操作日志因为第一服务器的重启而丢失的问题，因为现有技术中将操作日志存储在第一服务器的内存中，这样当第一服务器重启后操作日志将丢失，第一服务器只能根据整盘重构回迁目标数据，使得目标数据回迁至第一硬盘的时间变长，因此，本发明实施例与现有技术相比，根据操作日志回迁目标数据，能够降低目标数据回迁至第一硬盘的时间。

本发明实施例中在执行步骤S102和103的同时可以执行S109，也可以在执行完步骤S102和S103之后再执行S109，本发明实施例对此不进行限定，可以理解的是，该步骤102和103与S109的顺序对本发明实施例的技术方案不构成影响，只有最终能够保证每个硬盘中均存储有操作日志即可。

可选的，结合图3，如图7所示，本发明实施例提供的方法还包括：

S110、第一服务器在确定第一硬盘的状态为正常时，根据操作日志则将所述目标数据从目标硬盘中回迁至第一硬盘中。

具体的，当该目标硬盘属于第一服务器时，该第一服务器可以直接将存储在该目标硬盘上的目标数据回迁至第一硬盘中。

当该目标硬盘不属于第一服务器(例如，该目标硬盘属于如图2a所示的服务器22)时，该第一服务器可以向该目标硬盘所在的服务器(例如，如图2a所示的服务器22)发送请求消息，该请求消息用于指示该目标硬盘所在的服务器将目标数据发送给第一服务器，然后第一服务器接收该目标硬盘所在的服务器反馈的目标数据，并将目标数据存储在第一硬盘中。

本发明实施例提供了一种计算机存储介质，用于储存为第一方面所描述的数据存储方法所用的计算机软件指令，其包含用于执行上述实施例的服务器所设计的程序。

上述主要从服务器的角度对本发明实施例提供的方案进行了介绍。可以理解的是，服务器等为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，本发明能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

本发明实施例可以根据上述方法示例对服务器等进行功能模块的划分，例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。需要说明的是，本发明实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

在采用对应各个功能划分各个功能模块的情况下，图8a示出了上述实施例中所涉及的服务器的一种可能的结构示意图，服务器1包括：接收单元10，存储单元11。接收单元10用于支持服务器1执行上述实施例描述的过程S101，S104b，S105；存储单元11用于支持服务器执行上述实施例中所描述的步骤S102、S103，S109，S110，。当然，本发明实施例提供的服务器1还可以包括读取单元、响应单元以及发送单元，发送单元用于支持服务器1执行上述实施例中的S104a，确定单元，用于支持服务器执行上述实施例中所描述的步骤S107(具体的，S1071)，响应单元，用于支持服务器执行上述实施例中所描述的S108，该读取单元用于支持服务器1执行上述实施例中的过程S106。其中，上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述，在此不再赘述。

在采用集成的单元的情况下，图8b示出了上述实施例中所涉及的服务器的一种可能的结构示意图。服务器1包括：处理模块102和通信模块103。处理模块102用于对服务器1的动作进行控制管理，例如，处理模块102用于支持服务器1执行实施例中所描述的步骤S101、S102、S103、S104a、S104b、S105、S106、S107(具体的包括S1071)、S108、S109以及S110，和/或用于本文所描述的技术的其它过程。通信模块103用于支持服务器与其他网络实体的通信，(例如，与管理模块25以及存储系统中除第一服务器之外的其余服务器进行通信以及与客户端进行通信)，服务器1还可以包括存储模块101，用于存储服务器1的程序代码和数据。

其中，处理模块102可以是处理器或控制器，例如可以是中央处理器(Central Processing Unit，CPU)，通用处理器，数字信号处理器(Digital Signal Processor，DSP)，专用集成电路(Application-Specific Integrated Circuit，ASIC)，现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框，模块和电路。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。通信模块103可以是收发器、收发电路或通信接口1013等。存储模块101可以是存储器。

当处理模块102为处理器1012，通信模块103为通信接口1013，存储模块101为存储器时，本发明实施例所涉及的服务器1可以为图8c所示的服务器。

参阅图8c所示，该服务器1包括：处理器1012、通信接口1013、存储器1011以及总线1014。其中，通信接口1013、处理器1012以及存储器1011通过总线1014相互连接；总线1014可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图8c中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器执行本发明各个实施例所述方法的全部或部分步骤。所述存储介质是非短暂性(英文：non-transitory)介质，包括：快闪存储器、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

一种数据存储方法，其特征在于，应用于存储系统中，所述存储系统包括多个服务器，所述多个服务器中每个服务器包括至少一个逻辑分组，所述至少一个逻辑分组中每个逻辑分组包括多个硬盘，所述方法包括：

第一服务器在确定所述第一服务器的第一逻辑分组中的第一硬盘故障时，获取目标硬盘的标识；所述目标硬盘为所述存储系统包括的硬盘中与所述第一硬盘不同的硬盘，所述第一服务器为所述多个服务器中的一个；

所述第一服务器根据所述标识，将目标数据存储至所述标识所指示的目标硬盘中；所述目标数据为源数据中待存储至第一硬盘的数据；

所述第一服务器将所述源数据中除所述目标数据之外的其余数据，存储至所述第一逻辑分组中除所述第一硬盘之外的其余硬盘中。
根据权利要求1所述的方法，其特征在于，所述源数据包括M份原始数据和N份冗余数据，所述M份原始数据和所述N份冗余数据中每份数据均携带版本号；一份数据的版本号用于指示所述一份数据是否有效；N、M均为大于或等于1的正整数；所述M大于N；

所述第一服务器将所述源数据中除所述目标数据之外的其余数据，存储至所述第一逻辑分组中除所述第一硬盘之外的其余硬盘中之后，所述方法还包括：

所述第一服务器接收客户端发送的读数据业务请求，所述读数据业务请求用于读取所述源数据；

所述第一服务器根据所述读数据业务请求，从所述第一逻辑分组以及所述目标硬盘中分别读取所述M份原始数据和所述N份冗余数据，以及所述每份数据的版本号；

所述第一服务器根据所述每份数据的版本号，从所述M份原始数据和所述N份冗余数据中确定至少M份有效数据；

所述第一服务器根据所述至少M份有效数据获取所述源数据，以及将所述源数据返回给所述客户端。
根据权利要求2所述的方法，其特征在于，所述第一服务器根据所述每份数据的版本号，从所述M份原始数据和所述N份冗余数据中确定至少M份有效数据，包括：

所述第一服务器若确定所述M份原始数据和所述N份冗余数据中存在M份或M份以上的数据的版本号一致，则确定所述M或M份以上的数据中的每份数据均为有效数据。
根据权利要求1所述的方法，其特征在于，所述第一服务器在所述其余硬盘中的每个硬盘以及所述目标硬盘中存储有操作日志，一个所述硬盘的操作日志用于指示存储在所述一个硬盘中的数据的偏移量，一个所述数据的偏移量用于指示所述数据在其存储的硬盘中的地址偏移量，所述方法还包括：

所述第一服务器在确定所述第一硬盘的状态为正常时，根据所述操作日志则将所述目标数据从所述目标硬盘中回迁至所述第一硬盘中。
根据权利要求1-4任意一项所述的方法，其特征在于，所述获取目标硬盘的标识，包括：

所述第一服务器向所述存储系统的管理模块发送第一请求消息，所述第一请求消息用于指示所述管理模块确定用于存储所述目标数据的目标硬盘；

所述第一服务器接收所述管理模块发送的第一响应消息，所述第一响应消息中携带有所述目标硬盘的标识，所述目标硬盘为所述管理模块根据预设策略从所述多个硬盘或者所述多个硬盘中除属于所述第一逻辑分组之外的其余硬盘中所选择。
根据权利要求1-5任意一项所述的方法，所述预设策略为按照所述多个硬盘中每个硬盘的预设优先等级，将所述多个硬盘中除所述第一硬盘之外的其余硬盘中预设优先等级最高的硬盘确定为所述目标硬盘。
一种服务器，其特征在于，应用于存储系统中，所述存储系统包括多个服务器，所述多个服务器中每个服务器包括至少一个逻辑分组，所述至少一个逻辑分组中每个逻辑分组包括多个硬盘，所述服务器包括：

接收单元，用于在确定所述第一服务器的第一逻辑分组中的第一硬盘故障时，获取目标硬盘的标识；所述目标硬盘为所述存储系统包括的硬盘中与所述第一硬盘不同的硬盘，所述第一服务器为所述多个服务器中的一个；

存储单元，用于根据所述标识，将目标数据存储至所述标识所指示的目标硬盘中；所述目标数据为源数据中待存储至第一硬盘的数据；

所述存储单元，还用于将所述源数据中除所述目标数据之外的其余数据，存储至所述第一逻辑分组中除所述第一硬盘之外的其余硬盘中。
根据权利要求7所述的服务器，其特征在于，所述源数据包括M份原始数据和N份冗余数据，所述M份原始数据和所述N份冗余数据中每份数据均携带版本号；一份数据的版本号用于指示所述数据是否有效；所述N、M均为大于或等于1的正整数，M大于N，所述接收单元，用于接收客户端发送的读数据业务请求，所述读数据业务请求用于读取所述源数据；

读取单元，用于根据所述读数据业务请求，从所述第一逻辑分组以及所述目标硬盘中分别读取所述M份原始数据和所述N份冗余数据，以及所述每份数据的版本号；

确定单元，用于根据所述每份数据的版本号，从所述M份原始数据和所述N份冗余数据中确定至少M份有效数据；

响应单元，用于根据所述至少M份有效数据获取所述源数据，以及将所述源数据返回给所述客户端。
根据权利要求8所述的服务器，其特征在于，所述获取单元具体用于，若确定所述M份原始数据和所述N份冗余数据中存在M份或M份以上的数据的版本号一致，则确定所述M或M份以上的数据中的每份数据均为有效数据。
根据权利要求7所述的服务器，其特征在于，所述存储单元还用于：在所述其余硬盘中的每个硬盘以及所述目标硬盘中存储有操作日志，一个所述硬盘的操作日志用于指示存储在所述一个硬盘中的数据的偏移量，一个所述数据的偏移量用于指示所述数据在其存储的硬盘中的地址偏移量，以及用于在确定所述第一硬盘的状态为正常时，根据所述操作日志则将所述目标数据从所述目标硬盘中回迁至所述第一硬盘中。
根据权利要求7-10任意一项所述的服务器，其特征在于，所述服务器还包括发送单元，用于向所述管理模块发送第一请求消息，所述第一请求消息用于指示所述管理模块从所述存储系统包括的多个硬盘或者所述多个硬盘中除属于所述第一逻辑分组之外的其余硬盘中选择一个硬盘，作为目标硬盘；

接收单元，还用于接收所述管理模块发送的第一响应消息，所述第一响应消息中携带有所述目标硬盘的标识，所述目标硬盘为所述管理模块根据预设策略从所述多个硬盘或者所述多个硬盘中除属于所述第一逻辑分组之外的其余硬盘中所选择。
根据权利要求7-11任意一项所述的服务器，其特征在于，所述预设策略为按照所述多个硬盘中每个硬盘的预设优先等级，将所述多个硬盘中预设优先等级最高的硬盘确定为所述目标硬盘。
一种存储系统，其特征在于，所述存储系统中包括多个服务器，所述多个服务器中每个服务器包括至少一个逻辑分组，所述至少一个逻辑分组中每个逻辑分组包括多个硬盘，其中，所述每个服务器为如权利要求7-12任意一项所述的服务器。