WO2014101044A1

WO2014101044A1 - 分布式存储系统中的分区平衡方法、装置及服务器

Info

Publication number: WO2014101044A1
Application number: PCT/CN2012/087661
Authority: WO
Inventors: 高贵举; 张烽; 王志美
Original assignee: 华为技术有限公司
Priority date: 2012-12-27
Filing date: 2012-12-27
Publication date: 2014-07-03
Also published as: CN103229487B; CN103229487A

Abstract

公开一种分布式存储系统中的分区平衡方法、装置及控制服务器，所述方法包括：需要进行分区平衡时，确定各个分区的最新状态；根据各个分区的最新状态进行分区平衡处理，得到源节点、源节点上的迁移分区以及目标节点之间的对应关系；向所述对应关系中的目标节点发送迁移任务；所述迁移任务中包括：在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区；所述迁移任务用于指示目标节点触发目标节点与所述目标节点对应的源节点之间的数据迁移，所述数据迁移是将源节点上迁移分区中的数据迁移至目标节点。本申请能够实现分布式存储系统的分区平衡，也即实现数据恢复和在线扩容。

Description

分布式存储系统中的分区平衡方法、装置及服务器

技术领域本发明涉及通信领域，尤其涉及一种分布式存储系统中的分区平衡方法、装置及服务器。背景技术随着计算机技术和网络技术的发展，信息量呈现几何级数的增长，人类的数据达到前所未有的规模，对这些超大规模数据的存储和管理已经成为工业界一大挑战。用传统的集中存储管理超大规模数据时，无法提供高效的读写操作，无法满足良好的扩展性以及高可用性。在这种背景下，出现了各种基于非关系型数据库的分布式存储系统。

只要涉及到数据存储，就必然存在数据损坏后的恢复操作。在各种基于非关系型数据库的分布式存储系统中，因为存储规模庞大，所以单点故障会成为系统的常态。所述分布式存储系统中一般都保存有多份副本，所以，维持数据的副本数量稳定也成为系统的迫切需求。另外，随着人们对存储系统可持续工作需求的日益剧增，分布式存储系统的在线扩容也成为系统基本功能的不可或缺部分。那么怎么在系统数据有损坏的情况下尽快的做好数据恢复、系统容量不足时如何及时做好系统的在线扩容需求，成为当前技术的重点。所述数据恢复和在线扩容一般被统称为分区平衡。

目前，没有关于分布式存储系统分区平衡的技术方案公开。发明内容

本发明实施例提供一种分布式存储系统中的分区平衡方法、装置及服务器，能够实现分布式存储系统的分区平衡，也即实现数据恢复和在线扩容。

为了解决上述技术问题，本发明实施例公开了如下技术方案：

第一方面，本发明实施例提供一种分布式存储系统中的分区平衡方法，包括：需要进行分区平衡时，确定各个分区的最新状态；

根据各个分区的最新状态进行分区平衡处理，得到源节点、源节点上的迁移分区以及目标节点三者之间的对应关系；

向所述对应关系中的目标节点发送迁移任务；所述迁移任务中包括：在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区；所述迁移任务用于指示目标节点触发目标节点与对应的源节点之间的数据迁移，所述数据迁移是将源节点上迁移分区中的数据迁移至目标节点。

结合上述第一方面，在第一种可能的实现方式中，所述分区平衡处理为数据恢复处理；所述根据各个分区的最新状态进行分区平衡处理包括：

统计处于故障状态的节点上的分区，将统计得到的分区作为故障分区；对于每个故障分区，确定故障分区的副本分区，从故障分区的副本分区中确定一个处于参与允许状态的副本分区作为该故障分区的迁移分区，将所述迁移分区所在的节点作为源节点；

确定每个迁移分区对应的目标节点，得到源节点、源节点上的迁移分区以及目标节点之间的对应关系。

结合上述第一种可能的实现方式，在第二种可能的实现方式中，所述确定每个迁移分区对应的目标节点包括：

根据以下原则确定每个迁移分区对应的目标节点：同一分区的副本分区不在同一节点、或同一框、或同一机架。

结合上述第一方面，在第三种可能的实现方式中，所述分区平衡处理为在线扩容处理；所述根据各个分区的最新状态进行分区平衡处理包括：

分别计算扩容前和扩容后节点的平均分区数，并且，确定新增加的节点为目标节点；

根据所述各个分区的最新状态以及所述扩容前和扩容后节点的平均分区数确定各个目标节点对应的源节点和迁移分区，得到目标节点、源节点以及源节点上迁移分区之间的对应关系。

结合上述第一方面，和 /或，第一种可能的实现方式，和 /或，第二种可能的实现方式，和 /或，第三种可能的实现方式，在第四种可能的实现方式中，确定各个分区的最新状态包括：

根据当前正在进行平衡处理的各个分区的状态更新分区状态表，得到各个分区的最新状态，所述分区状态表中存储有各个分区的状态。

第二方面，本发明实施例提供一种分布式存储系统中的分区平衡装置，包括：确定单元，用于需要进行分区平衡时，确定各个分区的最新状态；

处理单元，用于根据各个分区的最新状态进行分区平衡处理，得到源节点、源节点上的迁移分区以及目标节点三者之间的对应关系；发送单元，用于向所述对应关系中的目标节点发送迁移任务；所述迁移任务中包括：在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区；所述迁移任务用于指示目标节点触发目标节点与对应的源节点之间的数据迁移，所述数据迁移是将源节点上迁移分区中的数据迁移至目标节点。

结合上述第二方面，在第一种可能的实现方式中，所述分区平衡处理为数据恢复处理；所述处理单元具体包括：

统计子单元，用于统计处于故障状态的节点上的分区，将统计得到的分区作为故障分区；

第一确定子单元，用于对于每个故障分区，确定故障分区的副本分区，从故障分区的副本分区中确定一个处于参与允许状态的副本分区作为该故障分区的迁移分区，将所述迁移分区所在的节点作为源节点；

第二确定子单元，用于确定每个迁移分区对应的目标节点，得到源节点、源节点上的迁移分区以及目标节点之间的对应关系。

结合上述第一种可能的实现方式，在第二种可能的实现方式中，第二确定单元具体用于：根据以下原则确定每个迁移分区对应的目标节点：同一分区的副本分区不在同一节点、或同一框、或同一机架。

结合上述第二方面，在第三种可能的实现方式中，所述分区平衡处理为在线扩容处理；所述处理单元具体包括：

处理子单元，用于分别计算扩容前和扩容后节点的平均分区数，并且，确定新增加的节点为目标节点；

第三确定子单元，用于根据所述各个分区的最新状态以及所述扩容前和扩容后节点的平均分区数确定各个目标节点对应的源节点和迁移分区，得到目标节点、源节点以及源节点上迁移分区之间的对应关系。

结合上述第二方面，和 /或，第一种可能的实现方式，和 /或，第二种可能的实现方式，和 /或，第三种可能的实现方式，在第四种可能的实现方式中，所述确定单元具体用于：根据当前正在进行平衡处理的各个分区的状态更新分区状态表，得到各个分区的最新状态，所述分区状态表中存储有各个分区的状态。

第三方面，本发明实施例提供一种分布式存储系统中的控制服务器，包括：处理器，用于需要进行分区平衡时，确定各个分区的最新状态；根据各个分区的最新状态进行分区平衡处理，得到源节点、源节点上的迁移分区以及目标节点三者之间的对应关系；收发器，用于向所述对应关系中的目标节点发送迁移任务；所述迁移任务中包括: 在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区；所述迁移任务用于指示目标节点触发目标节点与对应的源节点之间的数据迁移，所述数据迁移是将源节点上迁移分区中的数据迁移至目标节点。

结合上述第三方面，在第一种可能的实现方式中，所述分区平衡处理为数据恢复处理；所述处理器具体用于：

结合上述第一种可能的实现方式，在第二种可能的实现方式中，所述处理器具体用于：根据以下原则确定每个迁移分区对应的目标节点：同一分区的副本分区不在同一节点、或同一框、或同一机架。

结合上述第三方面，在第三种可能的实现方式中，所述分区平衡处理为在线扩容处理；所述处理器具体用于：

结合上述第三方面，和 /或，第一种可能的实现方式，和 /或，第二种可能的实现方式，和 /或，第三种可能的实现方式，在第四种可能的实现方式中，所述处理器具体用于：根据当前正在进行平衡处理的各个分区的状态更新分区状态表，得到各个分区的最新状态，所述分区状态表中存储有各个分区的状态。

本发明实施例中，需要进行分区平衡时，确定各个分区的状态；根据各个分区的状态进行分区平衡处理，得到源节点以及源节点上的迁移分区与目标节点之间的对应关系；向所述对应关系中的目标节点发送迁移任务，以便目标节点根据所述迁移任务完成分区迁移；所述迁移任务中包括：所述目标节点对应的源节点以及源节点上的迁移分区，从而实现了分布式存储系统的分区平衡。附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图 1A为本发明分布式存储系统结构示意图；

图 1为本发明分布式存储系统中的分区平衡方法第一实施例示意图；

图 2为本发明分布式存储系统中的分区平衡方法第二实施例示意图；

图 3为本发明分布式存储系统中的分区平衡方法第三实施例示意图；

图 4为本发明实施例分布式存储系统中的分区平衡装置结构示意图；

图 5为本发明实施例分区平衡装置中处理单元的一种实现结构示意图；图 6为本发明实施例分区平衡装置中处理单元的另一种实现结构示意图；图 7为本发明实施例分布式存储系统中控制服务器的结构示意图。具体实施方式

为了使本技术领域的人员更好地理解本发明实施例中的技术方案，并使本发明实施例的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明实施例中技术方案作进一步详细的说明。

参见图 1A，为本发明实施例分区平衡方法所应用的分布式存储系统结构示意图，其中，在分布式存储系统中包括由若干个节点 110构成的节点网络 120; 所述节点网络 120与控制服务器 130连接，所述控制服务器 130可以与节点网络 120中的各个节点 110直接连接，或者通过节点网络 120连接。

参见图 1，为本发明分布式存储系统中的分区平衡方法第一实施例示意图，该方法包括：

步骤 101 : 需要进行分区平衡时，确定各个分区的最新状态；

步骤 102: 根据各个分区的最新状态进行分区平衡处理，得到源节点、源节点上的迁移分区以及目标节点三者之间的对应关系；

其中，所述源节点是指迁出数据的节点；迁移分区是指源节点上迁出数据的分区；目标节点是指接收数据的节点。

步骤 103 : 向所述对应关系中的目标节点发送迁移任务；所述迁移任务中包括：在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区；所述迁移任务用于指示目标节点触发目标节点与所述目标节点对应的源节点之间的数据迁移，所述数据迁移是将源节点上迁移分区中的数据迁移至目标节点。

图 1所示的方法中，需要进行分区平衡时，确定各个分区的最新状态；根据各个分区的最新状态进行分区平衡处理，得到源节点、源节点上的迁移分区以及目标节点三者之间的对应关系；向所述对应关系中的目标节点发送迁移任务；所述迁移任务中包括：在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区；所述迁移任务用于指示目标节点触发目标节点与所述目标节点对应的源节点之间的数据迁移，所述数据迁移是将源节点上迁移分区中的数据迁移至目标节点。从而实现了分布式存储系统的分区平衡。首先对本发明实施例中所述分区的状态进行说明。

首先，分区所处情况可以根据分区是否参与分区平衡处理划分为：参与分区平衡处理和未参与分区平衡处理两种情况；

进一步的，在分区参与分区平衡处理的情况下，又可以按照不同的分区平衡处理对分区所处情况进一步进行划分，具体为：

当分区平衡处理为数据恢复处理时，分为以下两种情况：

一是作为源节点上的迁移分区；此时，由于迁移分区是故障分区的一个副本分区，因此，数据恢复处理完成后，该迁移分区不会被删除；

二是作为目标节点中接收数据的分区；

当分区平衡处理为在线扩容处理时，分为以下两种情况：

一是作为源节点上的迁移分区；此时，由于是将迁移分区上的数据转换到目标节点上的分区进行存储，因此，迁移分区上的数据全部发送给目标节点后，该迁移分区将被删除；

二是作为目标节点上接收数据的分区。

优选地，在一种可能的实现方式中，可以依照以上五种情况，将分区状态划分为三种状态：

第一种为参与允许状态，表示该分区的数据是完整的，可以参与新的分区平衡处理；该状态包含以下两种情况：一种情况是该分区未参与分区平衡处理；另一种情况是该分区正在参与某一个或多个分区平衡处理中的数据恢复过程，作为源节点上的迁移分区；第二种为数据不完整状态，表示该分区的数据不完整，不可以参与新的分区平衡处理；该状态包括以下两种情况：一种情况是该分区正在参与数据恢复过程，作为目标节点中接收数据的分区；另一种情况是该分区正在参与在线扩容过程，作为目标节点中接收数据的分区；

第三种为即将删除状态，表示该分区数据是完整的，但是不可以参与新的分区平衡处理，且数据发送完毕后该分区将被删除。

在后续的实施例中，分区状态也以上述的划分为例进行说明。当然，在实际应用中，分区状态划分也可以有其他的实现方式，这里仅为示例，并不对分区状态如何划分进行限定。参见图 2，为本发明分布式存储系统中的分区平衡方法第二实施例示意图，该方法中以分区平衡处理为数据恢复处理为例，该方法包括：

步骤 201 : 对于分布式存储系统中的每一节点，控制服务器检测该节点状态为正常或故障，检测到节点状态为故障时，执行步骤 202; 检测到节点状态为正常时，返回步骤 201继续进行检测。

控制服务器检测节点状态为故障时，表明需要对节点上的分区数据进行数据恢复处理，执行步骤 202。

步骤 202: 控制服务器根据当前正在进行平衡处理的各个分区的状态更新分区状态表，得到各个分区的最新状态，所述分区状态表中存储有各个分区的状态。

步骤 203 : 控制服务器根据各个分区的最新状态以及处于故障状态的节点进行数据恢复处理，生成源节点、源节点上的迁移分区以及目标节点三者之间的对应关系。

控制服务器根据各个分区的最新状态以及处于故障状态的节点进行数据恢复处理具体可以包括：

确定每个迁移分区对应的目标节点，得到目标节点、源节点以及源节点上迁移分区三者之间的对应关系。

其中，每个故障分区的处于参与允许状态的副本分区可能不止一个，在一种可能的实现方式中，可以从处于参与允许状态的副本分区中任一选择一个副本分区作为迁移分区；

或者，某个故障分区可能不存在处于参与允许状态的副本分区，此时，可以认为该故障分区的迁移分区缺省，则该故障分区将不存在对应的迁移分区和目标节点。

在一种可能的实现方式中，所述根据所述各个分区的最新状态确定每个迁移分区的目标节点时，可以遵从以下两个原则实现：

1、同一分区的副本分区不在同一节点、或同一框、或同一机架，以满足数据的安全性；其中，所述节点可以为硬盘等存储设备，而多个节点组成所述框；多个所述框构成所述机架。

2、根据节点的平均分区数，将故障分区均匀的迁移到其他正常节点；其中，节点的平均分区数等于：总分区数 /正常节点数。

在第 1个原则下，在确定目标节点时，最好选择不包含故障分区的副本分区的节点作为所述故障分区的迁移分区对应的目标节点；

在第 2个原则下，在确定目标节点时，最好选择实际分区数低于所述平均分区数的正常节点作为目标节点；

对于某个迁移分区，满足以上两个原则的节点可能有多个，在一种可能的实现方式中，可以从中随机选择一个节点作为该迁移分区的目标节点。

步骤 204: 控制服务器向所述对应关系中的每个目标节点发送迁移任务；所述迁移任务中包括：在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区。

步骤 205 : 所述目标节点向控制服务器发送任务接收确认信息，并且，根据所述迁移任务，向所述迁移任务中的源节点发送数据请求，所述数据请求包括源节点上的迁移分区。

所述数据请求用于向源节点请求所述迁移分区中的数据。

其中，目标节点向控制服务器发送所述任务接收确认信息为可选步骤。

步骤 206: 所述源节点将本地的迁移分区上的数据发送给目标节点。

本发明实施例中，控制服务器根据各个分区的最新状态以及处于故障状态的节点进行数据恢复处理，生成源节点、源节点上的迁移分区以及目标节点三者之间的对应关系，向所述对应关系中的目标节点发送迁移任务，从而所述目标节点根据所述迁移任务与源节点之间实现数据迁移，从而实现了分布式存储系统中的数据恢复处理。参见图 3，为本发明分布式存储系统中的分区平衡方法第二实施例示意图，该方法中以分区平衡处理为在线扩容为例，该方法包括：

步骤 301 : 控制服务器接收扩容请求，所述扩容请求用于请求控制服务器进行扩容处理。

其中，所述扩容请求可以由第三方设备发送，或者，也可以由使用控制服务器的用户通过触发控制服务器提供的扩容功能实现，或者，也可以在满足某些预设条件例如分布式存储系统中新增加的节点数量达到某一数量阈值等时由控制服务器自动触发，这里并不限定。

步骤 302: 控制服务器根据当前正在进行平衡处理的各个分区的状态更新分区状态表，得到各个分区的最新状态，所述分区状态表中存储有各个分区的状态。

步骤 303 :控制服务器根据各个分区的最新状态进行在线扩容处理，生成源节点、源节点上的迁移分区以及目标节点三者之间的对应关系。

优选地，所述控制服务器根据各个分区的最新状态进行在线扩容处理具体可以包括：

控制服务器分别计算扩容前和扩容后节点的平均分区数，并且，确定新增加的节点为目标节点；其中，节点的平均分区数等于：总分区数 /正常节点数；

控制服务器根据所述各个分区的最新状态以及所述扩容前和扩容后节点的平均分区数确定各个目标节点对应的源节点和迁移分区，得到源节点、源节点上的迁移分区以及目标节点三者之间的对应关系。

其中，控制服务器确定目标节点时，可以将分布式存储系统中新增加的节点作为目标节点。控制服务器具体如何获取到这些新增加的节点的信息这里并不限定。

其中，控制服务器确定各个目标节点对应的源节点和迁移分区时，所述扩容前节点的平均分区数和扩容后节点的平均分区数可以用于确定各个节点上迁移分区的数量；例如，在一种可能的实现方式中，平均每个节点上迁移分区的数量 =扩容前节点的平均分区数一扩容后节点的平均分区数；因为迁移分区一般需要为处于参与允许状态的分区，因此，各个分区的最新状态可以用于确定节点上具体哪些分区可以作为迁移分区；另外，在确定目标节点对应的源节点和迁移分区时，一般还可以遵从以下两个原则： 1、同一分区的副本分区不在同一节点、或同一机框、或同一机架，以满足数据的安全性； 2、根据扩容前节点的平均分区数和扩容后节点的平均分区数，将分区迁移到目标节点，而使目标节点上的分区数接近或等于平均分区数。

在基于以上条件和说明的基础上，控制服务器具体如何实现所述根据所述各个分区的最新状态以及所述扩容前和扩容后节点的平均分区数确定各个目标节点对应的源节点和迁移分区，这里并不限定。

步骤 304: 控制服务器向所述对应关系中的每个目标节点发送迁移任务；所述迁移任务中包括：在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区。

步骤 305 : 所述目标节点向控制服务器发送任务接收确认信息，并且，根据所述迁移任务，向所述迁移任务中的源节点发送数据请求，所述数据请求包括源节点上的迁移分区；

所述目标节点向控制服务器发送任务接收确认信息为可选步骤。

步骤 306: 所述源节点将所述数据请求中包含的迁移分区上的数据发送给目标节点。

本发明实施例中，控制服务器根据各个分区的最新状态以及扩容请求进行在线扩容处理，生成源节点、源节点上的迁移分区以及目标节点之间的对应关系，向所述对应关系中的目标节点发送迁移任务，从而所述目标节点根据所述迁移任务与源节点之间实现数据迁移，从而实现分布式存储系统的在线扩容。与上述方法相对应的，本发明实施例还提供一种分布式存储系统中的分区平衡装置，参见图 4，该装置 400包括：

确定单元 410，用于需要进行分区平衡时，确定各个分区的最新状态；处理单元 420，用于根据确定单元 410确定的各个分区的最新状态进行分区平衡处理，得到源节点、源节点上的迁移分区以及目标节点三者之间的对应关系；

发送单元 430，用于向处理单元 420得到的所述对应关系中的目标节点发送迁移任务；所述迁移任务中包括：在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区；所述迁移任务用于指示目标节点触发目标节点与所述目标节点对应的源节点之间的数据迁移，所述数据迁移是将源节点上迁移分区中的数据迁移至目标节点。

在第一种可能的实现方式中，所述分区平衡处理可以为数据恢复处理；参见图 5 所示，所述处理单元 420具体可以包括：

统计子单元 510，用于统计处于故障状态的节点上的分区，将统计得到的分区作为故障分区；

第一确定子单元 520，用于对于统计子单元 510统计得到的每个故障分区，确定故障分区的副本分区，从故障分区的副本分区中确定一个处于参与允许状态的副本分区作为该故障分区的迁移分区，将所述迁移分区所在的节点作为源节点；

第二确定子单元 530，用于确定第一确定子单元 520所确定的每个迁移分区对应的目标节点，得到源节点、源节点上的迁移分区以及目标节点之间的对应关系。

优选地，第二确定单元 530具体可以用于：根据以下原则确定每个迁移分区对应的目标节点：同一分区的副本分区不在同一节点、或同一框、或同一机架。

在第二种可能的实现方式中，所述分区平衡处理可以为在线扩容处理；参见图 6，所述处理单元 420具体可以包括：

处理子单元 610，用于分别计算扩容前和扩容后节点的平均分区数，并且，确定新增加的节点为目标节点；

第三确定子单元 620，用于根据所述各个分区的最新状态以及处理子单元 610计算得到的所述扩容前和扩容后节点的平均分区数确定各个目标节点对应的源节点和迁移分区，得到目标节点、源节点以及源节点上迁移分区之间的对应关系。

优选地，所述确定单元 410具体可以用于：根据当前正在进行平衡处理的各个分区的状态更新分区状态表，得到各个分区的最新状态，所述分区状态表中存储有各个分区的状态。

本实施例中，需要进行分区平衡时，确定各个分区的最新状态；根据各个分区的最新状态进行分区平衡处理，得到源节点、源节点上的迁移分区以及目标节点之间的对应关系；向所述对应关系中的目标节点发送迁移任务；所述迁移任务中包括：在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区；所述迁移任务用于指示目标节点触发目标节点与所述目标节点对应的源节点之间的数据迁移，所述数据迁移是将源节点上迁移分区中的数据迁移至目标节点。从而实现了分布式存储系统的分区平衡。与上述方法和装置相对应的，本发明实施例还提供一种分布式存储系统中的控制服务器，参见图 7所示，该控制服务器 700包括：处理器 710、存储器 720、收发器 730和总线 740;

处理器 710、存储器 720、收发器 730通过总线 740相互连接；总线 740可以是 ISA总线、 PCI总线或 EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图 7中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器 720，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器 720可能包含高速 RAM存储器，也可能还包括非易失性存储器（non- volatile memory), 例如至少一个磁盘存储器。

所述处理器 710执行所述程序代码，用于需要进行分区平衡时，确定各个分区的最新状态；根据各个分区的最新状态进行分区平衡处理，得到源节点、源节点上的迁移分区以及目标节点三者之间的对应关系；

收发器 730用于连接其他设备，并与其他设备进行通信。具体的，收发器 730用于：向所述对应关系中的目标节点发送迁移任务；所述迁移任务中包括：在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区；所述迁移任务用于指示目标节点触发目标节点与所述目标节点对应的源节点之间的数据迁移，所述数据迁移是将源节点上迁移分区中的数据迁移至目标节点。

在第一种可能的实现方式中，所述分区平衡处理为数据恢复处理；所述处理器

710具体用于：

优选地，所述处理器 710具体可以用于：根据以下原则确定每个迁移分区对应的目标节点：同一分区的副本分区不在同一节点、或同一框、或同一机架。

在第二种可能的实现方式中，所述分区平衡处理为在线扩容处理；所述处理器 710具体用于：

优选地，所述处理器 710具体可以用于通过以下方式实现所述确定各个分区的最新状态：根据当前正在进行平衡处理的各个分区的状态更新分区状态表，得到各个分区的最新状态，所述分区状态表中存储有各个分区的状态。

本实施例中，需要进行分区平衡时，确定各个分区的最新状态；根据各个分区的最新状态进行分区平衡处理，得到源节点、源节点上的迁移分区以及目标节点之间的对应关系；向所述对应关系中的目标节点发送迁移任务，从而目标节点触发目标节点与所述目标节点对应的源节点之间的数据迁移，将源节点上迁移分区中的数据迁移至目标节点，从而实现了分布式存储系统的分区平衡。本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如 ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述的本发明实施方式，并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

权利要求

1、一种分布式存储系统中的分区平衡方法，其特征在于，包括：需要进行分区平衡时，确定各个分区的最新状态；

2、根据权利要求 1所述的方法，其特征在于，所述分区平衡处理为数据恢复处理；所述根据各个分区的最新状态进行分区平衡处理包括：

3、根据权利要求 2所述的方法，其特征在于，所述确定每个迁移分区对应的目标节点包括：

4、根据权利要求 1所述的方法，其特征在于，所述分区平衡处理为在线扩容处理；所述根据各个分区的最新状态进行分区平衡处理包括：

5、根据权利要求 1至 4任一项所述的方法，其特征在于，确定各个分区的最新状态包括：

6、一种分布式存储系统中的分区平衡装置，其特征在于，包括：确定单元，用于需要进行分区平衡时，确定各个分区的最新状态；处理单元，用于根据各个分区的最新状态进行分区平衡处理，得到源节点、源节点上的迁移分区以及目标节点三者之间的对应关系；

发送单元，用于向所述对应关系中的目标节点发送迁移任务；所述迁移任务中包括：在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区；所述迁移任务用于指示目标节点触发目标节点与对应的源节点之间的数据迁移，所述数据迁移是将源节点上迁移分区中的数据迁移至目标节点。

7、根据权利要求 6所述的装置，其特征在于，所述分区平衡处理为数据恢复处理；所述处理单元具体包括：

8、根据权利要求 7所述的装置，其特征在于，第二确定单元具体用于：根据以下原则确定每个迁移分区对应的目标节点：同一分区的副本分区不在同一节点、或同一框、或同一机架。

9、根据权利要求 6所述的装置，其特征在于，所述分区平衡处理为在线扩容处理；所述处理单元具体包括：

10、根据权利要求 6至 9任一项所述的装置，其特征在于，所述确定单元具体用于：根据当前正在进行平衡处理的各个分区的状态更新分区状态表，得到各个分区的最新状态，所述分区状态表中存储有各个分区的状态。

11、一种分布式存储系统中的控制服务器，其特征在于，包括：

处理器，用于需要进行分区平衡时，确定各个分区的最新状态；根据各个分区的最新状态进行分区平衡处理，得到源节点、源节点上的迁移分区以及目标节点三者之间的对应关系；

收发器，用于向所述对应关系中的目标节点发送迁移任务；所述迁移任务中包括:在所述对应关系中，所述目标节点对应的源节点以及源节点上的迁移分区；所述迁移任务用于指示目标节点触发目标节点与对应的源节点之间的数据迁移，所述数据迁移是将源节点上迁移分区中的数据迁移至目标节点。

12、根据权利要求 11所述的控制服务器，其特征在于，所述分区平衡处理为数据恢复处理；所述处理器具体用于：

13、根据权利要求 12所述的控制服务器，其特征在于，所述处理器具体用于：根据以下原则确定每个迁移分区对应的目标节点：同一分区的副本分区不在同一节点、或同一框、或同一机架。

14、根据权利要求 11所述的控制服务器，其特征在于，所述分区平衡处理为在线扩容处理；所述处理器具体用于：

15、根据权利要求 11至 14任一项所述的控制服务器，其特征在于，所述处理器具体用于：根据当前正在进行平衡处理的各个分区的状态更新分区状态表，得到各个分区的最新状态，所述分区状态表中存储有各个分区的状态。