CN103678395B

CN103678395B - 一种数据分布方法和管理节点

Info

Publication number: CN103678395B
Application number: CN201210351902.0A
Authority: CN
Inventors: 曲文武
Original assignee: ZTE Corp
Current assignee: ZTE Corp
Priority date: 2012-09-20
Filing date: 2012-09-20
Publication date: 2017-07-11
Anticipated expiration: 2032-09-20
Also published as: SG11201502128QA; CN103678395A; IN2015DN02976A; US9684692B2; EP2891991A1; US20150254304A1; EP2891991B1; EP2891991A4; WO2014044092A1

Abstract

本发明公开了一种数据分布方法和管理节点，其中，所述方法包括：根据收到的交叉连接请求，获取需要进行交叉连接的表A和表B各自包括的子表的数目、子表的序列号、节点的数目和节点的序列号；将表A或表B包括的子表的序列号依次设置在横坐标或纵坐标方向，分别作为大矩形的长或宽，生成一个大矩形；根据构造的方法把所述大矩形分为两个子矩形，分别为第一子矩形和第二子矩形；对所述第一子矩形和第二子矩形分别进行均匀分割，形成若干小矩形，每个小矩形对应一个计算节点的序列号，并且与子表的序列号对应；将各小矩形所对应的子表分布到各小矩形对应的计算节点上。本发明能够减少传输的数据量，减轻网络传输负担。

Description

一种数据分布方法和管理节点

技术领域

本发明涉及分布式数据管理技术领域，尤其涉及一种数据分布方法和管理节点。

背景技术

通常，使用一台普通的计算机处理几百GB(吉比特)的数据，例如日志文件，往往需要几个小时或者更长的时间，而处理几十TB(太比特)的数据，可能需要几百个小时，处理用时太长，为此，人们采用数据分布的方法来解决上述问题，所述数据分布是指，全部数据的集合称为表，全部数据中的一部分的集合称为子表，一个表包括若干个子表，把若干个子表分布到若干个计算节点上，例如100个计算节点，每个计算节点只负责全部数据中的一部分数据的计算。这样，这些计算节点可以同时进行计算，可以大大减少处理用时。

数据分布系统通常包括一个管理节点和若干计算节点，参见图5所示，管理节点和计算节点通过网络相互连接。管理节点负责数据的分布、计算任务的调度等，管理节点往往与数据存储管理节点、集群管理节点在物理上是重合的，其中数据管理节点记录表的子表数目以及子表的位置等信息，集群管理节点记录节点的地址、内存大小、CPU能力等信息。计算节点负责在本地的硬盘或内存中存储子表，以及执行管理节点分配的任务，并将执行结果保存在本地的硬盘或内存中。所述管理节点和计算节点可以是计算机，也可以是处理器。

例如，{中国所有人的姓名}就是一个表，这个表包括16亿个名字，由于数据量太大了，需要把它分成一些子表，每个子表的姓名总数不超过1万。这样就形成了子表{{姓张的人1}，{姓张的人2}，...{姓钱的人1}，...}，一个表包括16万个子表。把这些子表分布到1000个计算节点上，可以把前160个子表存储在第一个计算节点，依此类推，这个过程就是数据分布。把一个子表放到一个计算节点上需要通过网络传输完成，如果一个计算节点存储160个子表，那么，就需要向这个计算节点传输160个子表的数据量，数据量越大网络传输的负担越大。

交叉连接(cross join)是两个表之间的一个标准操作命令，它的功能与日常算术中的乘法比较相近，但cross join是两个表之间的乘积(笛卡儿积)。例如，表1为(5，4)，表2为(3，2，6)，表1包括5和4两个元素，表2包括3、2、6三个元素。日常算术中5×5＝25，但是，(5，4)cross join(3，2，6)的结果可能是(5×3，4×3，5×2，4×2，5×6，4×6)＝(15，12，10，8，30，24)，或者是(5+3，4+3，5+2，4+2，5+6，4+6)＝(8，7，7，6，11，10)。这些实例得到的结果都是一个表，得到的表都包括2×3＝6个元素。

假设有两个计算节点，计算节点N1和计算节点N2，如果把上述表1和表2里的元素当作子表，子表{5}、{3}、{2}分布在N1上，子表{4}、{6}分布在N2上。当需要进行两个表之间的cross join计算时，即({5}，{4})cross join({3}，{2}，{6})时，会出现以下问题：完成cross join计算需要进行{5}和{6}、{4}和{3}和{4}和{2}之间的计算，而这两个子表在不同的计算节点上，导致无法进行计算。目前，为了正常进行cross join计算，通常使每个计算节点都存储其中一个表里的所有子表，另一个表里的子集均匀的分布在各计算节点上，例如N1和N2都存储{3}、{2}、{6}，N1存储{5}，N2存储{4}，或者，N1和N2都存储{5}和{4}，N1存储{3}、{2}，N2存储{6}等数据分布方式。但是现有这种数据分布方式，会使需要传输到计算节点上的数据量很大，网络传输的负担很重，尤其是数据分布的计算节点数量越多，两个表的子表数目接近时，数据量过大的问题更为明显。目前还没有一种能够减少传输的数据量的技术。

发明内容

有鉴于此，本发明的主要目的在于提供一种数据分布方法和管理节点，能够减少传输的数据量，减轻网络传输负担。

为达到上述目的，本发明的技术方案是这样实现的：

本发明提供了一种数据分布方法，应用于节点，所述方法包括：

根据收到的交叉连接请求，获取需要进行交叉连接的表A和表B各自包括的子表的数目、子表的序列号、节点的数目和节点的序列号；

将表A或表B包括的子表的序列号依次设置在横坐标或纵坐标方向，分别作为大矩形的长或宽，生成一个大矩形；

根据构造的方法把所述大矩形分为两个子矩形，分别为第一子矩形和第二子矩形；

对所述第一子矩形和第二子矩形分别进行均匀分割，形成若干小矩形，每个小矩形对应一个计算节点的序列号，并且与子表的序列号对应；

将各小矩形所对应的子表分布到各小矩形对应的计算节点上。

优选地，所述根据构造的方法把所述大矩形分为两个子矩形，为，

计算分配到所有计算节点上的表A或表B的子集的理想备份数目Ma或Mb；

根据计算得到的Ma或Mb，得到第一子矩形均匀分割系数Xa1*Xb1和第二子矩形均匀分割系数Xa2*Xb2；

根据得到的Xa1*Xb1和Xa2*Xb2，计算得到大矩形的长或宽的分割点Pa；

根据计算得到的Pa将所述大矩形分为两个子矩形。

优选地，所述根据计算得到的Pa将所述大矩形分为两个子矩形，为，

根据计算得到的Pa，在设置子表的序列号较多的边将所述大矩形分为两个子矩形。

优选地，所述对所述第一子矩形和第二子矩形分别进行均匀分割，为，

根据得到的Xa1*Xb1、Xa2*Xb2，分别对所述第一子矩形和第二子矩形分别进行均匀分割。

本发明提供了一种管理节点，所述管理节点包括：

信息获取单元，用于根据收到的交叉连接请求，获取需要进行交叉连接的表A和表B各自包括的子表的数目、子表的序列号、节点的数目和节点的序列号；

大矩形生成单元，用于将表A或表B包括的子表的序列号依次设置在横坐标或纵坐标方向，分别作为大矩形的长或宽，生成一个大矩形；

大矩形分割单元，用于根据构造的方法把所述大矩形分为两个子矩形，分别为第一子矩形和第二子矩形；

子矩形分割单元，用于对所述第一子矩形和第二子矩形分别进行均匀分割，形成若干小矩形，每个小矩形对应一个计算节点，并且与子表的序列号对应；

分布单元，用于将各小矩形所对应的子表分布到各小矩形对应的计算节点上。

优选地，所述大矩形分割单元包括：

理想备份数目计算子单元，用于计算分配到所有计算节点上的表A或表B的子集的理想备份数目Ma或Mb；

均匀分割系数计算子单元，根据理想备份数目计算子单元计算得到的Ma，得到第一子矩形均匀分割系数Xa1*Xb1和第二子矩形均匀分割系数Xa2*Xb2；

分割点计算子单元，用于根据均匀分割系数计算子单元得到的Xa1*Xb1和Xa2*Xb2，计算得到大矩形的长或宽的分割点Pa；

分割子单元，用于根据分割点计算子单元计算得到的Pa将所述大矩形分为两个子矩形。

优选地，所述分割子单元，具体用于根据分割点计算子单元计算得到的Pa，在设置子表的序列号较多的边将所述大矩形分为两个子矩形。

优选地，所述子矩形分割单元，具体用于根据均匀分割系数计算子单元得到的Xa1*Xb1、Xa2*Xb2，对所述第一子矩形和第二子矩形分别进行均匀分割。

由上可知，本发明的技术方案包括：根据收到的交叉连接请求，获取需要进行交叉连接的表A和表B各自包括的子表的数目、子表的序列号、节点的数目和节点的序列号；将表A或表B包括的子表的序列号依次设置在横坐标或纵坐标方向，分别作为大矩形的长或宽，生成一个大矩形；根据构造的方法把所述大矩形分为两个子矩形，分别为第一子矩形和第二子矩形；对所述第一子矩形和第二子矩形分别进行均匀分割，形成若干小矩形，每个小矩形对应一个计算节的序列号，并且与子表的序列号对应；将各小矩形所对应的子表分布到各小矩形对应的计算节点上；由此，本发明能够减少分布到计算节点上的子集数量，从而减少数据传输量。

附图说明

图1为本发明提供的一种数据分布方法的第一实施例的流程图；

图2为本发明提供的一种管理节点的实施例的结构图；

图3为本发明提供的一种数据分布方法的第二实施例的子表分布示意图；

图4为本发明提供的一种数据分布方法的第三实施例的子表分布示意图；

图5为数据分布系统的结构示意图。

具体实施方式

本发明提供的一种数据分布方法的第一实施例，如图1所示，所述方法包括：

步骤101、根据收到的交叉连接请求，获取需要进行交叉连接的表A和表B各自包括的子表的数目、子表的序列号、节点的数目和节点的序列号；

步骤102、将表A或表B包括的子表的序列号依次设置在横坐标或纵坐标方向，分别作为大矩形的长或宽，生成一个大矩形；

步骤103、根据构造的方法把所述大矩形分为两个子矩形，分别为第一子矩形和第二子矩形；

步骤104、对所述第一子矩形和第二子矩形分别进行均匀分割，形成若干小矩形，每个小矩形对应一个计算节点的序列号，并且与子表的序列号对应；

步骤105、将各小矩形包括的方格所对应的子表分布到各小矩形对应的计算节点上。

较佳地，所述根据构造的方法把所述大矩形分为两个子矩形，可以为，

计算分配到所有计算节点上的表A或表B的子表的理想备份数目Ma或Mb；

根据计算得到的Pa将所述大矩形分为两个子矩形。

较佳地，所述根据计算得到的Pa将所述大矩形分为两个子矩形，可以为，

较佳地，所述对所述第一子矩形和第二子矩形分别进行均匀分割，可以为，

本发明提供的一种管理节点的实施例，如图2所示，所述管理节点包括：

子矩形分割单元，用于对所述第一子矩形和第二子矩形分别进行均匀分割，形成若干小矩形，每个小矩形对应一个计算节点的序列号，并且与子表的序列号对应；

分布单元，用于将各小矩形包括的方格所对应的子表分布到各小矩形对应的计算节点上。

较佳地，所述大矩形分割单元包括：

均匀分割系数计算子单元，根据理想备份数目计算子单元计算得到的Ma或Mb，得到第一子矩形均匀分割系数Xa1*Xb1和第二子矩形均匀分割系数Xa2*Xb2；

较佳地，所述分割子单元，具体用于根据分割点计算子单元计算得到的Pa，在设置子表的序列号较多的边将所述大矩形分为两个子矩形。

较佳地，子矩形分割单元，具体用于根据均匀分割系数计算子单元得到的Xa1*Xb1、Xa2*Xb2，对所述第一子矩形和第二子矩形分别进行均匀分割。

下面结合图3对本发明提供的一种数据分布方法的第二实施例进行介绍，本例中，计算节点的数目Nn为3，计算节点的序列号可以表示为Node1、Node2、Node3；两个表分别表示为表A和表B，其中，表A的子表数目Na为4，表A的子表的序列号可以表示为A1、A2、A3、A4；表B的子表数目Nb为4，表B的子表的序列号可以表示为B1、B2、B3、B4；该方法包括以下步骤：

步骤201、管理节点根据收到的交叉连接请求，获取需要进行交叉连接的表A和表B各自包括的子表的数目、子表的序列号、节点的数目和节点的序列号。

步骤202、将表A或表B包括的子表的序列号依次设置在横坐标或纵坐标方向，分别作为大矩形的长或宽，生成一个由若干方格组成的大矩形，所述方格的数量为表A和表B各自包括的子表的数目的乘积；

本例中，参见图3所示，表A的子表的序列号依次设置在横坐标上，作为长，表B的子表的序列号依次设置在纵坐标上，作为宽，生成一个由16个方格组成的大矩形。

步骤203、根据构造的方法把所述大矩形分为两个子矩形，分别为第一子矩形和第二子矩形；

具体的，包括以下步骤：

步骤2031、计算分配到所有计算节点上的表A或表B的子集的理想备份数目Ma；

这里，需要完成的cross join的总计算量为Na*Nb，一个计算节点可完成的crossjoin的部分计算量为(Ma*Na/Nn)*(Mb*Nb/Nn)，那么一个节点可完成的cross join的部分计算量乘以计算节点数目应该大于等于需要完成的cross join的总计算量，即

(Ma*Na/Nn)*(Mb*Nb/Nn)*Nn≥Na*Nb， (1)

根据公式(1)可以得到Ma*Na*Mb*Nb≥Nn*Na*Nb，当数据传输量小时，Ma*Na*Mb*Nb＝Nn*Na*Nb；

Ma*Na+Mb*Nb为数据传输量，根据数学原理可知Ma*Na+Mb*Nb≥当Ma*Na＝Mb*Nb时，数据传输量最小，

由此得到

步骤2032、根据计算得到的Ma，得到第一子矩形均匀分割系数Xa1*Xb1和第二子矩形均匀分割系数Xa2*Xb2；

具体的，根据方程组：Xa1*Xb1+Xa2*Xb2＝Nn (2)

Xa1＝Ma的整数部分 (3)

Xa2＝Xa1+1 (4)

由于子表的实际备份数目只能为整数，因此需要对Ma进行整数调整以得到整数，本例中，得到Xa1＝1，Xa2＝2，Xb1＝1，Xb2＝1，由此得到Xa1*Xb1为1，Xa2*Xb2为2。在实践中，Xb1和Xb2可能分别有多个解，只要分别从两组解中各选取一个解即可。

步骤2033、根据得到的Xa1*Xb1和Xa2*Xb2，计算得到大矩形的长或宽的分割点Pa，所述Pa指的是从左起第几个方格处将所述大矩形进行分割；

具体的，根据公式(5)计算得到Pa的理想值，

Pa理想值＝Na*(Xa1*Xb1)/(Xa1*Xb1+Xa2*Xb2) (5)

本例中，Pa理想值＝4*(1)/(1+2)＝1.3，

当Pa理想值为非整数时，取Pa理想值的整数部分得到Pa，本例中Pa为1。

步骤2034、根据计算得到的Pa将所述大矩形分为两个子矩形，第一子矩形和第二子矩形；

本例中，从左起第一个方格处将所述大矩形分为左右两个子矩形。

步骤204、根据得到的Xa1*Xb1、Xa2*Xb2，对所述第一子矩形和第二子矩形分别进行均匀分割；

本例中，根据1*1将所述第一子矩形进行均匀分割，第一子矩形横坐标方向划分为1等份，第一子矩形纵坐标方向划分为1等份，即不对第一子矩形进行均匀分割；根据2*1将所述第二子矩形进行均匀分割，第二子矩形横坐标方向划分为1等份，第二子矩形纵坐标方向划分为2等份，即将第二子矩形分为上下相等的两个矩形；也可以，第二子矩形横坐标方向划分为1等份，第二子矩形纵坐标方向划分为2等份，即将第二子矩形分为左右相等的两个矩形。

步骤205、将各小矩形包括的方格所对应的子表分布到各小矩形对应的计算节点上。

参见图3所示，将表A的子表A1，表B的子表B1、B2、B3、B4分布到Node1；将表A的子表A2、A3、A4，表B的子表B1、B2分布到Node2；将表A的子表A2、A3、A4，表B的子表B3、B4分布到Node3，由此，本发明只需要传输15个子表的数据量即可；

而采用现有的技术，需要向Node1分布A1、A2、B1、B2、B3、B4；向Node2分布A3、B1、B2、B3、B4；向Node3分布A4、B1、B2、B3、B4；一共需要传输16个子表的数据量，通过对比可知，本发明能够减少数据传输量。

下面结合图4对本发明提供的一种数据分布方法的第三实施例进行介绍，本例中，计算节点的数目Nn为5，计算节点的序列号可以表示为Node1、Node2、Node3、Node4、Node5；两个表分别表示为表A和表B，其中，表A的子表数目Na为5，表A的子表的序列号可以表示为A1、A2、A3、A4、A5；表B的子表数目Nb为6，表B的子表的序列号可以表示为B1、B2、B3、B4、B5、B6；该方法包括以下步骤：

步骤301、管理节点根据收到的交叉连接请求，获取需要进行交叉连接的表A和表B各自包括的子表的数目、子表的序列号、节点的数目和节点的序列号。

步骤302、将表A或表B包括的子表的序列号依次设置在横坐标或纵坐标方向，分别作为大矩形的长或宽，生成一个由若干方格组成的大矩形，所述方格的数量为表A和表B各自包括的子表的数目的乘积，每个方格对应一个表A的子表和一个表B的子表的序列号；

本例中，参见图4所示，表A的子表的序列号依次设置在横坐标上，作为长，表B的子表的序列号依次设置在纵坐标上，作为宽，生成一个由30个方格组成的大矩形。

步骤303、根据构造的方法把所述大矩形分为两个子矩形，分别为第一子矩形和第二子矩形；

具体的，包括以下步骤：

步骤3031、计算分配到所有计算节点上的表A或表B的子集的理想备份数目Ma；

(Ma*Na/Nn)*(Mb*Nb/Nn)*Nn≥Na*Nb， (1)

根据公式(1)可以得到Ma*Na*Mb*Nb≥Nn Na*Nb，当数据传输量小时，Ma*Na*Mb*Nb＝Nn Na*Nb；

由此得到

12285/-1-CP-Z1E

步骤3032、根据计算得到的Ma，得到第一子矩形均匀分割系数Xa1*Xb1和第二子矩形均匀分割系数Xa2*Xb2；

具体的，根据方程组：Xa1*Xb1+Xa2*Xb2＝Nn (2)

Xa1＝Ma的整数部分 (3)

Xa2＝Xa1+1 (4)

本例中，得到Xa1＝2，Xa2＝3，Xb1＝1，Xb2＝1，由此得到Xa1*Xb1为2，Xa2*Xb2为3。

步骤3033、根据得到的Xa1*Xb1和Xa2*Xb2，计算得到大矩形的长或宽的分割点Pa；所述Pa指的是从左起第几个方格处将所述大矩形进行分割；

具体的，根据公式(5)计算得到Pa的理想值，

Pa理想值＝Na*(Xa1*Xb1)/(Xa1*Xb1+Xa2*Xb2) (5)

本例中，Pa理想值＝5*(2)/(2+3)＝2，

当Pa理想值为整数时，Pa理想值即为Pa，本例中Pa为2。

步骤3034、根据计算得到的Pa将所述大矩形分为两个子矩形，第一子矩形和第二子矩形；

本例中，从左起第二个方格处将所述大矩形分为左右两个子矩形。

步骤304、根据得到的Xa1*Xb1、Xa2*Xb2，对所述第一子矩形和第二子矩形分别进行均匀分割；

本例中，根据2*1将所述第一子矩形进行均匀分割，第一子矩形横坐标方向划分为1等份，第一子矩形纵坐标方向划分为2等份，即将第一子矩形分为上下相等的两个矩形；根据3*1将所述第二子矩形进行均匀分割，第二子矩形横坐标方向划分为1等份，第二子矩形纵坐标方向划分为3等份，即将第二子矩形分为相等的三个矩形。实践中，也可以，根据2*1将所述第一子矩形进行均匀分割，第一子矩形横坐标方向划分为2等份，第一子矩形纵坐标方向划分为1等份，即将第一子矩形分为左右相等的两个矩形；根据3*1将所述第二子矩形进行均匀分割，第二子矩形横坐标方向划分为3等份，第二子矩形纵坐标方向划分为1等份，即将第二子矩形分为相等的三个矩形。

步骤305、将各小矩形包括的方格所对应的子表分布到各小矩形对应的计算节点上。

参见图4所示，将表A的子表A1、A2，表B的子表B1、B2、B3分布到Node1；将表A的子表A1、A2，表B的子表B4、B5、B6分布到Node2；将表A的子表A3、A4、A5，表B的子表B1、B2分布到Node3；将表A的子表A3、A4、A5，表B的子表B3、B4分布到Node4；将表A的子表A3、A4、A5，表B的子表B5、B6分布到Node5；由此，本发明只需要传输25个子表的数据量即可；

而采用现有的技术，需要向Node1分布A1，B1、B2、B3、B4、B5、B6；向Node2分布A2，B1、B2、B3、B4、B5、B6；向Node3分布A3，B1、B2、B3、B4、B5、B6；向Node4分布A4，B1、B2、B3、B4、B5、B6；向Node5分布A5，B1、B2、B3、B4、B5、B6；一共需要传输35个子表的数据量，通过对比可知，本发明能够减少数据传输量。数据分布的计算节点数量越多，两个表的子表数目越接近时，本发明的效果越显著。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

Claims

1.一种数据分布方法，应用于节点，其特征在于，所述方法包括：

将各小矩形所对应的子表分布到各小矩形对应的计算节点上；其中，

所述根据构造的方法把所述大矩形分为两个子矩形，为，

根据计算得到的Pa将所述大矩形分为两个子矩形。

2.根据权利要求1所述的方法，其特征在于，所述根据计算得到的Pa将所述大矩形分为两个子矩形，为，

3.根据权利要求1所述的方法，其特征在于，所述对所述第一子矩形和第二子矩形分别进行均匀分割，为，

4.一种管理节点，其特征在于，所述管理节点包括：

分布单元，用于将各小矩形所对应的子表分布到各小矩形对应的计算节点上；其中，

所述大矩形分割单元包括：

5.根据权利要求4所述的管理节点，其特征在于，所述分割子单元，具体用于根据分割点计算子单元计算得到的Pa，在设置子表的序列号较多的边将所述大矩形分为两个子矩形。

6.根据权利要求4所述的管理节点，其特征在于，所述子矩形分割单元，具体用于根据均匀分割系数计算子单元得到的Xa1*Xb1、Xa2*Xb2，对所述第一子矩形和第二子矩形分别进行均匀分割。