WO2017016499A1

WO2017016499A1 - 分布式数据库负载调平的方法和装置

Info

Publication number: WO2017016499A1
Application number: PCT/CN2016/092005
Authority: WO
Inventors: 邹润谋
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2015-07-29
Filing date: 2016-07-28
Publication date: 2017-02-02
Also published as: EP3331218A1; US20180097875A1; AU2016299084A1; KR20180016479A; CN106713377B; KR102047900B1; CN106713377A; EP3331218A4; CA2990753A1; JP2018521439A; US10554737B2; JP6615342B2; EP3331218B1

Abstract

本申请公开了一种分布式数据库负载调平的方法，包括：统计分布式数据库系统中所有服务器的负载量和每一个服务器中每一个数据片的负载占比；将负载量排序排序靠前的n个服务器作为高负载服务器，将负载量排序排序靠后的n个服务器作为低负载服务器；将高负载服务器中负载占比排序在前的数据片作为源数据片，将低负载服务器中负载占比排序在后的数据片作为目标数据片，将目标数据片与源数据片对调。本申请还公开了一种分布式数据库负载调平的装置。

Description

分布式数据库负载调平的方法和装置

本申请要求于2015年7月29日提交中国专利局、申请号为201510456585.2、发明名称为“分布式数据库负载调平的方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及到互联网技术领域，特别涉及到分布式数据库负载调平的方法和装置。

背景技术

近年来，随着数据量的高速增长，分布式数据库技术也得到了快速的发展。分布式数据库将原来集中式数据库中的数据分割成大量数据片，分散存储到多个独立的数据存储节点上，利用网络将物理上分散的多个数据存储单元连接起来，组成一个逻辑上统一的数据库。它采用可扩展的系统结构，利用多台服务器分担存储负荷，不但提高了系统的可靠性、可用性和存取效率，还易于扩展。为了维护数据片的均衡分布，当一台服务器上的数据片数量在整个分布式数据库系统中的分布达到移动阈值(Migration Thresholds)时，就需要将数目最多的服务器上的数据片移动到数目比较少的服务器上。例如，数据集合在服务器A上有100个数据片，在服务器B上有50个数据片，就需将服务器A上的数据片移动到服务器B上，直至数据集合在两台服务器上的数据片数量接近或相等。

发明内容

本申请实施例提供一种分布式数据库负载调平的方法和装置，有效降低整个分布式数据库系统的负荷。

本申请实施例提出一种分布式数据库负载调平的方法，包括步骤：

在一个统计周期内统计分布式数据库系统中服务器的负载量和每一个所述服务器中的每一个数据片的负载占比；

将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个服务器作为高负载服务器，将排序靠后的n个服务器作为低负载服务器，n为正整数；

遍历所述高负载服务器和所述低负载服务器，执行相应的操作，包括：

将顺序第i个高负载服务器中的各数据片按照负载占比从高到低的顺序排序，将倒序第i个低负载服务器中的各数据片按照负载占比从高到低的顺序排序，i为正整数，i小于等于n；

将顺序第i个所述高负载服务器中负载占比排序在前的数据片作为第i个源数据片，将倒序第i个所述低负载服务器中负载占比排序在后的数据片作为第i个目标数据片，将第i个所述目标数据片与第i个所述源数据片对调。

本申请实施例还提出一种分布式数据库负载调平的装置，其包括处理器和存储器，所述存储器中存储有可被所述处理器执行的指令，所述指令用于执行以下操作：

在一个统计周期内统计系统中服务器的负载量和每一个所述服务器中的每一个数据片的负载占比；

本申请实施例还提出一种非易失性存储介质，存储有计算机指令，该计算机指令由处理器执行时执行以下步骤：

在一个统计周期内统计分布式数据库系统中所有服务器的负载量和每一个所述服务器中的每一个数据片的负载占比；

本申请实施例的分布式数据库系统根据服务器的负载情况对服务器排序，分别筛选出高负载服务器和低负载服务器，并将高负载服务器中的高负载占比的数据片与低负载服务器中的低负载占比的数据片对调，一方面有效降低了高负载服务器中的负载量，另一方面，由于低负载服务器将一部分数据片调出，减少了一部分负载压力，为新调入的数据片空出了一部分的负载空间，避免了因高负载服务器将数据片调入低负载服务器造成低负载服务器负荷过大的情况，有效降低整个分布式数据库系统的负荷。

附图简要说明

图1为本申请实施例中分布式数据库负载调平的装置所在系统的总线图；

图2为本申请分布式数据库负载调平的方法的第一实施例的流程图；

图3为本申请分布式数据库负载调平的方法的第二实施例的流程图；

图4为本申请分布式数据库负载调平的方法的第三实施例的流程图；

图5为本申请分布式数据库负载调平的方法的第四实施例的流程图；

图6为本申请分布式数据库负载调平的方法的第五实施例的流程图；

图7为本申请分布式数据库负载调平的方法的第六实施例的流程图；

图8为本申请分布式数据库负载调平的装置的第一实施例的模块示意图；

图9为本申请分布式数据库负载调平的装置的第二实施例的模块示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

实施本发明的方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

现有的使数据片均衡分布的方式只考虑到数据片的容量大小，没有考虑数据片占用的负载。而如果被移动的数据片占用负载过高，当将它移动到其他服务器后，会造成其他服务器的负荷过大，仍然会影响到整个分布式数据库系统的总体效率。

参照图1，图1为本申请实施例中分布式数据库负载调平的装置所在系统的总线图。该系统可以包括：处理器101，例如CPU，网络接口104，用户接口103，存储器105，通信总线102。其中，通信总线102用于实现这些组件之间的连接通信。其中，用户接口103可以包括显示屏(Display)、键盘(Keyboard)，还可以包括标准的有线接口、无线接口。网络接口104可以包括标准的有线接口、无线接口(如WIFI接口)。存储器105可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)或非易失性存储器，例如磁盘存储器。存储器105还可以是位于远离前述处理器101的存储装置。作为一种计算机存储介质的存储器105中可以包括操作系统、网络通信模块、用户接口模块以及分布式数据库负载调平程序。

在图1所示的分布式数据库负载调平的装置所在系统中，网络接口104主要用于连接服务器或终端，与服务器或终端进行数据通信；而用户接口103主要用于接收用户指令，并与用户进行交互；而处理器101可以用于调用存储器105中存储的分布式数据库负载调平程序，并执行以下操作：

在一个统计周期内统计分布式数据库系统中所有服务器的负载量和每一个服务器中的每一个数据片的负载占比；

将顺序第i个高负载服务器中负载占比排序在前的数据片作为第i个源数据片，将倒序第i个低负载服务器中负载占比排序在后的数据片作为第i个目标数据片，将第i个目标数据片与第i个源数据片对调。

在一个实施例中，处理器101调用存储器105中存储的分布式数据库负载调平程序可以执行以下操作：

将倒序第i个低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片；

将顺序第i个高负载服务器中负载占比排序第j位的数据片作为第i个源数据片，其中，j为正整数，j的初始值为1，j小于等于顺序第i个所述高负载服务器中的数据片的个数；

预判断如果将第i个目标数据片与第i个源数据片对调后，倒序第i个低负载服务器的总的负载占比是否超过预定的负载占比阈值；

如果是，则将第i个源数据片更新为高负载服务器中负载占比排序第j位的数据片的下一位数据片，并预判断如果将第i个目标数据片与更新后的第i个源数据片对调后，倒序第i个低负载服务器的总的负载占比是否超过预定的负载占比阈值，直至倒序第i个低负载服务器的总的负载占比小于或等于预定的负载占比阈值。

在一个实施例中，处理器101调用存储器105中存储的分布式数据库负载调平程序还可以执行以下操作：

判断顺序第i个高负载服务器中负载占比排序第一位的数据片的负载占比是否超过预定的负载占比阈值；

如果是，则拒绝调换顺序第i个高负载服务器中的数据片；

如果否，则执行将倒序第i个低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片的步骤。

将下一个统计周期作为当前统计周期，在当前统计周期内统计所有服务器的负载量；

将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个服务器作为当前统计周期的高负载服务器；

判断当前统计周期的n个高负载服务器是否与前一个统计周期的n个高负载服务器相同；

如果是，则增大预定的负载占比阈值，在当前统计周期内，重新调平所有高负载服务器。即，重新遍历所述高负载服务器和所述低负载服务器，执行所述相应的操作。

将各服务器按照CPU负载量从高到低的顺序排序，将排序靠前的n1个服务器作为第一组高负载服务器，将排序靠后的n1个服务器作为第一组低负载服务器，n1为小于n的正整数；

在各服务器中剔除第一组高负载服务器和第一组低负载服务器，将剩下的服务器按照流量负载量从高到低的顺序排序，将排序靠前的n2个服务器作为第二组高负载服务器，将排序靠后的n2个服务器作为第二组低负载服务器，n2为小于n的正整数，且n1+n2＝n。

从分布式数据库系统中获取空闲服务器；

将第i个源数据片从顺序第i个高负载服务器转移到空闲服务器中；

将第i个目标数据片从倒序第i个低负载服务器转移到顺序第i个高负载服务器中；

将已转移到空闲服务器上的第i个源数据片转移到倒序第i个低负载服务器中。

本实施例图1所描述的分布式数据库负载调平的装置及其所在的分布式数据库系统，根据服务器的负载情况对服务器排序，分别筛选出高负载服务器和低负载服务器，并将高负载服务器中的高负载占比的数据片与低负载服务器中的低负载占比的数据片对调，一方面有效降低了高负载服务器中的负载量，另一方面，由于低负载服务器将一部分数据片调出，减少了一部分负载压力，为新调入的数据片空出了一部分的负载空间，避免了因高负载服务器将数据片调入低负载服务器造成低负载服务器负荷过大的情况，有效降低整个分布式数据库系统的负荷。

如图2所示，图2为本申请分布式数据库负载调平的方法的第一实施例的流程图。本实施例提到的分布式数据库负载调平的方法，包括步骤：

步骤S10，在一个统计周期内统计分布式数据库系统中所有服务器的负载量和每一个服务器中的每一个数据片的负载占比。

本实施例的分布式数据库系统中包括多个分片的服务器，每个服务器上加载有多个数据片。预先在每个服务器上部署监控上报程序，定时将每个数据片的数据请求量、数据片访问时所占的流量等信息上报到分布式数据库系统中的统计库中。同时，系统还从网管服务器获得当前统计周期内各服务器的负载量，例如，CPU负载量和流量负载量。系统根据当统计周期内上报的某一个数据片的数据请求量、访问流量等信息，以及该数据片所在的服务器的负载量，获得该数据片在该服务器的负载量中的负载占比，即服务器处理该数据片的访问请求时为服务器带来的负载量在该服务器的总的负载量中的比例。一个统计周期可以是一天24小时，或更长时间段。以24小时为例，监控上报程序可每隔5分钟上报一次数据，则一天24小时内一个数据片就有288个上报信息。为了便于统计，可将288个上报信息点合成一个长的上报信息链，那么一个数据片就只对应一个上报信息链。同时，系统可在每一天的固定时刻从网管服务器获得各服务器的负载量，例如每天的凌晨1点钟。

步骤S20，将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个服务器作为高负载服务器，将排序靠后的n个服务器作为低负载服务器，n为正整数。

为了实现负载调平，本实施例将高负载服务器中的数据片与低负载服务器中的数据片对调。系统可根据统计的服务器负载量从高到低的顺序对各服务器依次排序，排在最前端的服务器负载量最高，排在最后端的服务器负载量最低。将前n个服务器作为高负载服务器，后n个服务器作为低负载服务器，调平就是在这两组服务器中进行数据片对调。

步骤S30，将顺序第i个高负载服务器中的各数据片按照负载占比从高到低的顺序排序，将倒序第i个低负载服务器中的各数据片按照负载占比从高到低的顺序排序，i为正整数，i的初始值为1，i小于等于n。

可预先将一个高负载服务器与一个低负载服务器配对成一组。本实施例中，各高负载服务器按照负载量从高到低的顺序排序，各低负载服务器也按照负载量从高到低的顺序排序。可将高负载服务器队列中顺序第i个高负载服务器与低负载服务器队列中倒序第i个低负载服务器配对成一组，例如将最大负载量的高负载服务器与最小负载量的低负载服务器配对，将第二大负载量的高负载服务器与第二小负载量的低负载服务器配对，以此类推。或者可将高负载服务器队列中顺序第i个高负载服务器与低负载服务器队列中顺序第i个低负载服务器配对成一组；或者随机分配。对于每一组配对的高负载服务器与低负载服务器，都对服务器各自的数据片进行排序，排序方式按照负载占比从高到低的顺序排序。

步骤S40，将顺序第i个高负载服务器中负载占比排序在前的数据片作为第i个源数据片，将倒序第i个低负载服务器中负载占比排序在后的数据片作为第i个目标数据片。

步骤S50，将第i个目标数据片与第i个源数据片对调。

为了降低高负载服务器的负载量，可将高负载服务器中的数据片移动到低负载服务器中，而为了避免因过多负荷加载到低负载服务器造成低负载服务器的负载量过大，本实施例可只将高负载服务器中负载占比较高的一个或几个数据片移动到低负载服务器中，同时还将低负载服务器中负载占比较低的数据片移动到高负载服务器中，两个服务器中移动的数据片个数相等，实现高低负载服务器之间的数据片对调。如此一来，高负载服务器中的负载量得到了有效降低，同时，由于低负载服务器将一部分数据片调出，减少了一部分负载压力，为新调入的数据片空出了一部分的负载空间，有效避免了因高负载服务器将数据片调入低负载服务器造成低负载服务器负荷过大的情况。

步骤S60，判断是否已调平所有高负载服务器，即是否已遍历所述高负载服务器和所述低负载服务器(例如，判断i是否等于n)；如果是，则跳转步骤S61；如果否，则i+1，返回步骤S30。

步骤S61，判定调平完成，即判定已遍历所述高负载服务器和所述低负载服务器。

在完成一组配对的高低负载服务器之间的源数据片和目标数据片对调后，再继续对下一组配对的服务器进行源数据片和目标数据片对调，直至将所有配对组的源数据片和目标数据片对调完成，结束本次调平程序。

本实施例的分布式数据库系统根据服务器的负载情况对服务器排序，分别筛选出高负载服务器和低负载服务器，并将高负载服务器中的高负载占比的数据片与低负载服务器中的低负载占比的数据片对调，一方面有效降低了高负载服务器中的负载量，另一方面，由于低负载服务器将一部分数据片调出，减少了一部分负载压力，为新调入的数据片空出了一部分的负载空间，避免了因高负载服务器将数据片调入低负载服务器造成低负载服务器负荷过大的情况，有效降低整个分布式数据库系统的负荷。

如图3所示，图3为本申请分布式数据库负载调平的方法的第二实施例的流程图。本实施例包括图2所示实施例的步骤，其中的步骤S40包括：

步骤S41，将倒序第i个低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片。

本实施例中，对于根据负载量从高到底排序的低负载服务器，排在前端的低负载服务器的负载量较高，排在后端的低负载服务器的负载量较低，同理，对于高负载服务器，排在前端的高负载服务器的负载量较高，排在后端的高负载服务器的负载量较低。为了让分布式数据库系统的负载获得最有效的调平，可将最高负载的服务器与最低负载的服务器配对，第二高负载的服务器与第二低负载的服务器配对，以此类推，即顺序第i个高负载服务器与倒序第i个低负载服务器配对成一组。

对于一配对组中的高低负载服务器，本实施例中只将高负载服务器中的一个数据片与低负载服务器中的一个数据片对调，当然，也可以对调多个，可采用与对调一对数据片相同的方式推导实现。在低负载服务器中确定目标数据片，为显著降低高负载服务器的负载，将低负载服务器中负载占比最低的数据片(即负载占比排序最后一位的数据片)作为目标数据片。

步骤S42，将顺序第i个高负载服务器中负载占比排序第j位的数据片作为第i个源数据片。

在高负载服务器中确定源数据片，但并不直接将确定的源数据片与目标数据片对调，而是要先对选择的源数据片是否合适进行预判断。在确定源数据片时，选择负载占比排序第j位的数据片作为源数据片，其中，j为正整数，j的初始值为1，j小于等于高负载服务器中数据片的个数，即在初始时，首先从高负载服务器中负载占比最高的数据片开始选择，如果经过预判断，该数据片在对调后不能缓解整个分布式数据库系统的负载压力，则选择负载占比第二高的数据片作为原数据片，再进行预判断。

步骤S43，预判断如果将第i个目标数据片与第i个源数据片对调后，倒序第i个低负载服务器的总的负载占比是否超过预定的负载占比阈值；如果是，则j+1，返回步骤S42；如果否，则执行步骤S50。

在预判断时，假设将目标数据片与源数据片对调，低负载服务器中原有的总的负载占比减去目标数据片的负载占比，再加上源数据片的负载占比，比较新计算的低负载服务器的总的负载占比是否超过预定的负载占比阈值。如果是，则说明本次选择的源数据片不合适，对调后会造成低负载服务器的负载过高，此时需重新选择新的源数据片，将源数据片更新为高负载服务器中负载占比排序下一位的数据片，并重新进行预判断。依此循环，直至低负载服务器的总的负载占比小于或等于预定的负载占比阈值，说明当前选择的源数据片是合理的，将目标数据片与源数据片对调后，不会造成低负载服务器的负载过高。

本实施例在对调高低负载服务器中的数据片前，预先判断对调后是否会对低负载服务器带来过高的负载，如果是，则重新选择新的源数据片，并重新进行预判断，直至选择的源数据片在与目标数据片对调后不会造成低负载服务器负载过高，在降低高负载服务器负载的同时，也保证了低负载服务器的正常负载，确保整个分布式数据库系统的有效运行。

如图4所示，图4为本申请分布式数据库负载调平的方法的第三实施例的流程图。本实施例包括图3所示实施例的步骤，在步骤S41之前还包括：

步骤S44，判断顺序第i个高负载服务器中负载占比排序第一位的数据片的负载占比是否超过预定的负载占比阈值；如果是，则执行步骤S45；如果否，则执行步骤S41。

步骤S45，拒绝调换顺序第i个高负载服务器中的数据片。

本实施例在进行预判断和数据片调平前，还判断高负载服务器中数据片的负载占比是否过高。如果将负载占比过高的数据片转移到低负载服务器中，会造成低负载服务器的负载过大，在下次调平时会将原来的低负载服务器作为高负载服务器，重新将该负载占比过高的数据片调出，造成重复转移数据片。此时，为了避免重复转移操作，暂时不对包括有过高负载占比数据片的高负载服务器进行处理，而采用其他措施或转至手动处理的方式进行处理。此外，对于与未处理的高负载服务器配对的低负载服务器，可以将其与其他的高负载服务器重新配对，也可以对其保留，在下次调平时再进行配对。

如图5所示，图5为本申请分布式数据库负载调平的方法的第四实施例的流程图。本实施例包括图2所示实施例的步骤，步骤S61之后还包括：

步骤S71，将下一个统计周期作为当前统计周期，在当前统计周期内统计所有服务器的负载量；

步骤S72，将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个服务器作为当前统计周期的高负载服务器；

步骤S73，判断当前统计周期的n个高负载服务器是否与前一个统计周期的n个高负载服务器相同；如果是，则执行步骤S74；如果否，则返回步骤S10；

步骤S74，增大预定的负载占比阈值，并返回步骤S10。

本实施例还对调平策略是否合理进行判断，统计下一个周期内各服务器运行时的负载情况，判断前一次调平后各服务器的负载量是否有所改善。例如，在7号凌晨1点，统计6号凌晨1点至7号凌晨1点各服务器负载情况，并对其进行第一次调平，系统继续运行，在8号凌晨1点，统计7号凌晨1点至8号凌晨1点各服务器负载情况，并分析7号第一次调平的结果是否合理，如果合理，则继续采用该调平策略进行第二次调平，否则，调整调平策略，并采用新的调平策略进行第二次调平。在统计的数据中，仍然根据服务器负载量筛选出高负载服务器。如果调平后再运行一个统计周期后筛选的高负载服务器与调平前的高负载服务器一样，则说明之前的高负载服务器的负载压力并未得到缓解，调平策略无效。此时需调整调平策略，例如增大预定的负载占比阈值，从高负载服务器选择负载占比较大的数据片作为源数据片，使高负载服务器中有更多的负载占比转移到低负载服务器中，确保调平策略的有效性。

如图6所示，图6为本申请分布式数据库负载调平的方法的第五实施例的流程图。本实施例包括图2所示实施例的步骤，其中的步骤S20包括：

步骤S21，将各服务器按照CPU负载量从高到低的顺序排序，将排序靠前的n1个服务器作为第一组高负载服务器，将排序靠后的n1个服务器作为第一组低负载服务器，n1为小于n的正整数；

步骤S22，在各服务器中剔除第一组高负载服务器和第一组低负载服务器，将剩下的服务器按照流量负载量从高到低的顺序排序，将排序靠前的n2个服务器作为第二组高负载服务器，将排序靠后的n2个服务器作为第二组低负载服务器，n2为小于n的正整数，且n1+n2＝n。

本实施例在筛选高低负载服务器时，可从CPU负载量和流量负载量两方面进行排序，CPU负载量和流量负载量的优先级可预先设置。本实施例以CPU负载量优先级高于流量负载量优先级为例。先将系统中的服务器按照CPU负载量从高到低的顺序排序，筛选出第一组高负载服务器和第一组低负载服务器，再对剩下的服务器进行第二次筛选，将剩下的服务器按照流量负载量从高到低的顺序排序，筛选出第二组高负载服务器和第二组低负载服务器。在配对时，第一组高负载服务器与第一组低负载服务器一一配对，第二组高负载服务器与第二组低负载服务器一一配对。调换数据片时，也是分别在第一组高负载服务器与第一组低负载服务器之间、第二组高负载服务器与第二组低负载服务器之间进行调换。由于本实施例分别从CPU负载量和流量负载量两方面分别筛选需调换数据片的服务器，使数据片调换更加有针对性，进一步使调平策略更加有效，有利于降低整个分布式数据库系统的负荷。

如图7所示，图7为本申请分布式数据库负载调平的方法的第六实施例的流程图。本实施例包括图2所示实施例的步骤，其中的步骤S50包括：

步骤S51，从分布式数据库系统中获取空闲服务器；

步骤S52，将第i个源数据片从顺序第i个高负载服务器转移到空闲服务器中；

步骤S53，将第i个目标数据片从倒序第i个低负载服务器转移到顺序第i个高负载服务器中；

步骤S54，将已转移到空闲服务器上的第i个源数据片转移到倒序第i个低负载服务器中。

本实施例为了避免在低负载服务器没有空闲时，如果源数据片直接转移到低负载服务器，会造成低负载服务器负载较高，影响数据片转移效率。因此在分布式数据库系统中会预留一部分空闲资源，即空闲的服务器，将源数据片先从高负载服务器转移到空闲服务器中，等目标数据片从低负载服务器中挪出后，再将源数据片转移到目标数据片。当然，如果低负载服务器上原本就有空闲，可直接将源数据片从高负载服务器转移到低负载服务器，再将目标数据片从低负载服务器转移到高负载服务器中。可预先判断低负载服务器是否有空闲，如果是则直接调换，如果否，再通过空闲服务器进行中转。如此一来，有利于提高数据片转移的效率，确保负载调平的高效进行。

如图8所示，图8为本申请分布式数据库负载调平的装置的第一实施例的模块示意图。本实施例提出的分布式数据库负载调平的装置，包括：

统计模块10，用于在一个统计周期内统计分布式数据库系统中所有服务器的负载量和每一个服务器中的每一个数据片的负载占比；

排序模块20，用于将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个服务器作为高负载服务器，将排序靠后的n个服务器作为低负载服务器，n为正整数；将顺序第i个高负载服务器中的各数据片按照负载占比从高到低的顺序排序，将倒序第i个低负载服务器中的各数据片按照负载占比从高到低的顺序排序，i为正整数，i的初始值为1，i小于等于n；

调整模块30，用于将顺序第i个高负载服务器中负载占比排序在前的数据片作为第i个源数据片，将倒序第i个低负载服务器中负载占比排序在后的数据片作为第i个目标数据片，将第i个目标数据片与第i个源数据片对调；依此循环，直至调平所有高负载服务器，即遍历所有的高负载服务器和低负载服务器。

本实施例的布式数据库系统根据服务器的负载情况对服务器排序，分别筛选出高负载服务器和低负载服务器，并将高负载服务器中的高负载占比的数据片与低负载服务器中的低负载占比的数据片对调，一方面有效降低了高负载服务器中的负载量，另一方面，由于低负载服务器将一部分数据片调出，减少了一部分负载压力，为新调入的数据片空出了一部分的负载空间，避免了因高负载服务器将数据片调入低负载服务器造成低负载服务器负荷过大的情况，有效降低整个分布式数据库系统的负荷。

如图9所示，图9为本申请分布式数据库负载调平的装置的第二实施例的模块示意图。本实施例包括图8所示实施例的模块，还包括判断模块40；

调整模块30还用于，将倒序第i个低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片；将顺序第i个高负载服务器中负载占比排序第j位的数据片作为第i个源数据片，其中，j为正整数，j的初始值为1，j小于等于顺序第i个所述高负载服务器中的数据片的个数；

判断模块40用于，预判断如果将第i个目标数据片与第i个源数据片对调后，倒序第i个低负载服务器的总的负载占比是否超过预定的负载占比阈值；

调整模块30还用于，当判断模块40判定倒序第i个低负载服务器的总的负载占比超过预定的负载占比阈值时，将第i个源数据片更新为高负载服务器中负载占比排序第j位的数据片的下一位数据片；

判断模块40还用于，预判断如果将第i个目标数据片与更新后的第i个源数据片对调后，倒序第i个低负载服务器的总的负载占比是否超过预定的负载占比阈值；依此循环，直至倒序第i个低负载服务器的总的负载占比小于或等于预定的负载占比阈值。

进一步的，判断模块40还用于，判断顺序第i个高负载服务器中负载占比排序第一位的数据片的负载占比是否超过预定的负载占比阈值；

如果是，则调整模块30还用于拒绝调换顺序第i个高负载服务器中的数据片；

如果否，则调整模块30还用于将倒序第i个低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片。

进一步的，统计模块10还用于，将下一个统计周期作为当前统计周期，在当前统计周期内统计所有服务器的负载量；

排序模块20还用于，将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个服务器作为当前统计周期的高负载服务器；

判断模块40用于，判断当前统计周期的n个高负载服务器是否与前一个统计周期的n个高负载服务器相同；

如果是，则调整模块30还用于增大预定的负载占比阈值，在当前统计周期内，重新调平所有高负载服务器。即，重新遍历所述高负载服务器和所述低负载服务器，执行相应的操作。

进一步的，排序模块20用于：

进一步的，调整模块30用于：

从分布式数据库系统中获取空闲服务器；

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个......”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣和对实施例的限制。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

以上所述仅为本申请的实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种分布式数据库负载调平的方法，其特征在于，包括步骤：

在一个统计周期内统计分布式数据库系统中所有服务器的负载量和每一个所述服务器中的每一个数据片的负载占比；

将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个服务器作为高负载服务器，将排序靠后的n个服务器作为低负载服务器，n为正整数；

遍历所述高负载服务器和所述低负载服务器，执行相应的操作，包括：

将顺序第i个高负载服务器中的各数据片按照负载占比从高到低的顺序排序，将倒序第i个低负载服务器中的各数据片按照负载占比从高到低的顺序排序，i为正整数，i小于等于n；

将顺序第i个所述高负载服务器中负载占比排序在前的数据片作为第i个源数据片，将倒序第i个所述低负载服务器中负载占比排序在后的数据片作为第i个目标数据片，将第i个所述目标数据片与第i个所述源数据片对调。
如权利要求1所述的分布式数据库负载调平的方法，其特征在于，所述将顺序第i个所述高负载服务器中负载占比排序在前的数据片作为第i个源数据片，将倒序第i个所述低负载服务器中负载占比排序在后的数据片作为第i个目标数据片的步骤包括：

将倒序第i个所述低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片；

将顺序第i个所述高负载服务器中负载占比排序第j位的数据片作为第i个源数据片，其中，j为正整数，j的初始值为1，j小于等于顺序第i个所述高负载服务器中的数据片的个数；

预判断如果将第i个所述目标数据片与第i个所述源数据片对调后，倒序第i个所述低负载服务器的总的负载占比是否超过预定的负载占比阈值；

如果是，则将第i个所述源数据片更新为所述高负载服务器中负载占比排序第j位的数据片的下一位数据片，并预判断如果将第i个所述目标数据片与更新后的第i个所述源数据片对调后，倒序第i个所述低负载服务器的总的负载占比是否超过所述预定的负载占比阈值，直至倒序第i个所述低负载服务器的总的负载占比小于或等于所述预定的负载占比阈值。
如权利要求2所述的分布式数据库负载调平的方法，其特征在于，所述将倒序第i个所述低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片的步骤之前还包括：

判断顺序第i个所述高负载服务器中负载占比排序第一位的数据片的负载占比是否超过所述预定的负载占比阈值；

如果是，则拒绝调换顺序第i个所述高负载服务器中的数据片；

如果否，则执行将倒序第i个所述低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片的步骤。
如权利要求2或3所述的分布式数据库负载调平的方法，其特征在于，所述遍历所述高负载服务器和所述低负载服务器，执行相应的操作的步骤之后还包括：

将下一个统计周期作为当前统计周期，在当前统计周期内统计所有服务器的负载量；

将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个所述服务器作为当前统计周期的高负载服务器；

判断当前统计周期的n个高负载服务器是否与前一个统计周期的n个高负载服务器相同；

如果是，则增大所述预定的负载占比阈值，在当前统计周期内，遍历所述高负载服务器和所述低负载服务器，执行所述相应的操作。
如权利要求1至3任一项所述的分布式数据库负载调平的方法，其特征在于，所述将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个服务器作为高负载服务器，将排序靠后的n个服务器作为低负载服务器的步骤包括：

将各服务器按照CPU负载量从高到低的顺序排序，将排序靠前的n1个服务器作为第一组高负载服务器，将排序靠后的n1个服务器作为第一组低负载服务器，n1为小于n的正整数；

在各服务器中剔除第一组高负载服务器和第一组低负载服务器，将剩下的服务器按照流量负载量从高到低的顺序排序，将排序靠前的n2个所述服务器作为第二组高负载服务器，将排序靠后的n2个所述服务器作为第二组低负载服务器，n2为小于n的正整数，且n1+n2＝n。
如权利要求1至3任一项所述的分布式数据库负载调平的方法，其特征在于，所述将第i个所述目标数据片与第i个所述源数据片对调的步骤包括：

从所述分布式数据库系统中获取空闲服务器；

将第i个源数据片从顺序第i个所述高负载服务器转移到所述空闲服务器中；

将第i个目标数据片从倒序第i个所述低负载服务器转移到顺序第i个所述高负载服务器中；

将已转移到所述空闲服务器上的第i个源数据片转移到倒序第i个所述低负载服务器中。
一种分布式数据库负载调平的装置，其特征在于，其包括处理器和存储器，所述存储器中存储有可被所述处理器执行的指令，所述指令用于执行以下操作：

在一个统计周期内统计分布式数据库系统中所有服务器的负载量和每一个所述服务器中的每一个数据片的负载占比；

将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个服务器作为高负载服务器，将排序靠后的n个服务器作为低负载服务器，n为正整数；

遍历所述高负载服务器和所述低负载服务器，执行相应的操作，包括：

将顺序第i个高负载服务器中的各数据片按照负载占比从高到低的顺序排序，将倒序第i个低负载服务器中的各数据片按照负载占比从高到低的顺序排序，i为正整数，i小于等于n；

将顺序第i个所述高负载服务器中负载占比排序在前的数据片作为第i个源数据片，将倒序第i个所述低负载服务器中负载占比排序在后的数据片作为第i个目标数据片，将第i个所述目标数据片与第i个所述源数据片对调。
如权利要求7所述的分布式数据库负载调平的装置，其特征在于，所述将顺序第i个所述高负载服务器中负载占比排序在前的数据片作为第i个源数据片，将倒序第i个所述低负载服务器中负载占比排序在后的数据片作为第i个目标数据片的操作包括：

将倒序第i个所述低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片；

将顺序第i个所述高负载服务器中负载占比排序第j位的数据片作为第i个源数据片，其中j为正整数，j的初始值为1，j小于等于顺序第i个所述高负载服务器中的数据片的个数；

预判断如果将第i个所述目标数据片与第i个所述源数据片对调后，倒序第i个所述低负载服务器的总的负载占比是否超过预定的负载占比阈值；

当所述判断模块判定倒序第i个所述低负载服务器的总的负载占比超过预定的负载占比阈值时，将第i个所述源数据片更新为所述高负载服务器中负载占比排序第j位的数据片的下一位数据片，并预判断如果将第i个所述目标数据片与更新后的第i个所述源数据片对调后，倒序第i个所述低负载服务器的总的负载占比是否超过所述预定的负载占比阈值，直至倒序第i个所述低负载服务器的总的负载占比小于或等于所述预定的负载占比阈值。
如权利要求8所述的分布式数据库负载调平的装置，其特征在于，所述将倒序第i个所述低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片的操作之前还包括：

判断顺序第i个所述高负载服务器中负载占比排序第一位的数据片的负载占比是否超过所述预定的负载占比阈值；

如果是，则拒绝调换顺序第i个所述高负载服务器中的数据片；

如果否，则将倒序第i个所述低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片。
如权利要求8或9所述的分布式数据库负载调平的装置，其特征在于，所述遍历所述高负载服务器和所述低负载服务器，执行相应的操作的步骤之后还包括：

将下一个统计周期作为当前统计周期，在当前统计周期内统计所有服务器的负载量；

将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个所述服务器作为当前统计周期的高负载服务器；

判断当前统计周期的n个高负载服务器是否与前一个统计周期的n个高负载服务器相同；

如果是，则所述调整模块还用于增大所述预定的负载占比阈值，在当前统计周期内，遍历所述高负载服务器和所述低负载服务器，执行所述相应的操作。
如权利要求7至9任一项所述的分布式数据库负载调平的装置，其特征在于，所述将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个服务器作为高负载服务器，将排序靠后的n个服务器作为低负载服务器的操作包括：

将各服务器按照CPU负载量从高到低的顺序排序，将排序靠前的n1个服务器作为第一组高负载服务器，将排序靠后的n1个服务器作为第一组低负载服务器，n1为小于n的正整数；

在各服务器中剔除第一组高负载服务器和第一组低负载服务器，将剩下的服务器按照流量负载量从高到低的顺序排序，将排序靠前的n2个所述服务器作为第二组高负载服务器，将排序靠后的n2个所述服务器作为第二组低负载服务器，n2为小于n的正整数，且n1+n2＝n。
如权利要求7至9任一项所述的分布式数据库负载调平的装置，其特征在于，所述将第i个所述目标数据片与第i个所述源数据片对调的操作包括：

从所述系统中获取空闲服务器；

将第i个源数据片从顺序第i个所述高负载服务器转移到所述空闲服务器中；

将第i个目标数据片从倒序第i个所述低负载服务器转移到顺序第i个所述高负载服务器中；

将已转移到所述空闲服务器上的第i个源数据片转移到倒序第i个所述低负载服务器中。
一种非易失性存储介质，其特征在于，其存储有计算机指令，所述计算机指令由处理器执行时执行以下步骤：

在一个统计周期内统计分布式数据库系统中所有服务器的负载量和每一个所述服务器中的每一个数据片的负载占比；

将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个服务器作为高负载服务器，将排序靠后的n个服务器作为低负载服务器，n为正整数；

遍历所述高负载服务器和所述低负载服务器，执行相应的操作，包括：

将顺序第i个高负载服务器中的各数据片按照负载占比从高到低的顺序排序，将倒序第i个低负载服务器中的各数据片按照负载占比从高到低的顺序排序，i为正整数，i小于等于n；

将顺序第i个所述高负载服务器中负载占比排序在前的数据片作为第i个源数据片，将倒序第i个所述低负载服务器中负载占比排序在后的数据片作为第i个目标数据片，将第i个所述目标数据片与第i个所述源数据片对调。
如权利要求13所述的非易失性存储介质，其特征在于，所述将顺序第i个所述高负载服务器中负载占比排序在前的数据片作为第i个源数据片，将倒序第i个所述低负载服务器中负载占比排序在后的数据片作为第i个目标数据片的步骤包括：

将倒序第i个所述低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片；

将顺序第i个所述高负载服务器中负载占比排序第j位的数据片作为第i个源数据片，其中，j为正整数，j的初始值为1，j小于等于顺序第i个所述高负载服务器中的数据片的个数；

预判断如果将第i个所述目标数据片与第i个所述源数据片对调后，倒序第i个所述低负载服务器的总的负载占比是否超过预定的负载占比阈值；

如果是，则将第i个所述源数据片更新为所述高负载服务器中负载占比排序第j位的数据片的下一位数据片，并预判断如果将第i个所述目标数据片与更新后的第i个所述源数据片对调后，倒序第i个所述低负载服务器的总的负载占比是否超过所述预定的负载占比阈值，直至倒序第i个所述低负载服务器的总的负载占比小于或等于所述预定的负载占比阈值。
如权利要求14所述的非易失性存储介质，其特征在于，所述将倒序第i个所述低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片的步骤之前还包括：

判断顺序第i个所述高负载服务器中负载占比排序第一位的数据片的负载占比是否超过所述预定的负载占比阈值；

如果是，则拒绝调换顺序第i个所述高负载服务器中的数据片；

如果否，则执行将倒序第i个所述低负载服务器中负载占比排序最后一位的数据片作为第i个目标数据片的步骤。
如权利要求14或15所述的非易失性存储介质，其特征在于，所述遍历所述高负载服务器和所述低负载服务器，执行相应的操作的步骤之后还包括：

将下一个统计周期作为当前统计周期，在当前统计周期内统计所有服务器的负载量；

将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个所述服务器作为当前统计周期的高负载服务器；

判断当前统计周期的n个高负载服务器是否与前一个统计周期的n个高负载服务器相同；

如果是，则增大所述预定的负载占比阈值，在当前统计周期内，遍历所述高负载服务器和所述低负载服务器，执行所述相应的操作。
如权利要求13至15任一项所述的非易失性存储介质，其特征在于，所述将各服务器按照负载量从高到低的顺序排序，将排序靠前的n个服务器作为高负载服务器，将排序靠后的n个服务器作为低负载服务器的步骤包括：

将各服务器按照CPU负载量从高到低的顺序排序，将排序靠前的n1个服务器作为第一组高负载服务器，将排序靠后的n1个服务器作为第一组低负载服务器，n1为小于n的正整数；

在各服务器中剔除第一组高负载服务器和第一组低负载服务器，将剩下的服务器按照流量负载量从高到低的顺序排序，将排序靠前的n2个所述服务器作为第二组高负载服务器，将排序靠后的n2个所述服务器作为第二组低负载服务器，n2为小于n的正整数，且n1+n2＝n。
如权利要求13至15任一项所述的非易失性存储介质，其特征在于，所述将第i个所述目标数据片与第i个所述源数据片对调的步骤包括：

从所述分布式数据库系统中获取空闲服务器；

将第i个源数据片从顺序第i个所述高负载服务器转移到所述空闲服务器中；

将第i个目标数据片从倒序第i个所述低负载服务器转移到顺序第i个所述高负载服务器中；

将已转移到所述空闲服务器上的第i个源数据片转移到倒序第i个所述低负载服务器中。