CN110515939B

CN110515939B - 一种基于gpu的多列数据排序方法

Info

Publication number: CN110515939B
Application number: CN201910593411.9A
Authority: CN
Inventors: 孟令博
Original assignee: Yi Tai Fei Liu Information Technology LLC
Current assignee: Yi Tai Fei Liu Information Technology LLC
Priority date: 2019-07-03
Filing date: 2019-07-03
Publication date: 2022-08-12
Anticipated expiration: 2039-07-03
Also published as: CN110515939A

Abstract

本发明技术方案公开了一种基于GPU的多列数据排序方法，通过GPU分别对第一列、第二列、第n列数据进行排序，通过使用CPU结合GPU处理多列数据排序方法，在需要大数据量进行排序时，利用GPU强大的并发处理能力，可以有效提升单台机器的性能，有效弥补了单台服务器性能上的短板；在不增加集群规模前提下，通过增加GPU大幅提高集群计算能力。

Description

一种基于GPU的多列数据排序方法

技术领域

本发明涉及数据处理技术领域，尤其是涉及一种基于GPU的多列数据排序方法。

背景技术

随着人们对大数据处理性能的要求越来越高，对大数据并行处理技术提出了更高的要求。在集群规模难以扩大的情况下，由于单台服务器受限于CPU核数，很难提升集群性能；在这种情况下，近年来出现了将GPU与大数据结合的实例，相对于CPU核数限制，GPU拥有成千上万的处理核心，可以大幅提升大数据的并发处理能力，有效提升单台服务器的并行计算能力；同类技术中，有对MapReduce的排序进行优化，实现将单列数据排序移植到协处理器(GPU)执行，如《基于GPU排序的MapReduce优化方法》和《CN107102839A-一种基于硬件排序MapReduce的数据处理方法》，对于多列数据的排序方法未有提及。因此，本发明提出了一种针对一条记录多列数据的排序问题，借助CPU和GPU各自的优势，完成多列数据的排序。

发明内容

本发明解决的技术问题是提供一种使用协处理器处理多列数据排序的方法，在不增加集群规模的前提下，在原有集群配置基础上，通过增加配置GPU，提升多列数据排序的性能。

为解决上述的技术问题，本发明技术方案提供一种基于GPU的多列数据排序方法，其中，包括以下步骤：

步骤1：对第一列数据进行排序，处理方法如下；

GPU对第一列数据进行排序，以数据作为排序的关键字，数据索引同步跟随数据进行排序，排序后记录以下信息；

a、记录数据排序后对应的索引数组，最后一列排序结束后输出该索引数组；

b、对相同的数据进行分组，记录每组起始元素位于索引数组中的偏移量；

c、记录每个分组中的重复数据个数；

d、记录所有重复数据的索引，回传给业务层，由业务层根据重复数据索引，将下一列需要排序的数据放置到连续内存，在下一列排序时，将数据传递给GPU进行排序；

步骤2：对下一列数据进行排序，处理方法如下：

GPU对本列数据进行排序时，如果前一列重复数据索引为空，则流程结束，将排序后的数据索引传递给业务层，根据数据索引输出最终结果；如果前一列有重复数据，业务层根据重复数据的索引，将重复数据的索引对应的本列数据拷贝到连续内存空间，传递给GPU，按照所述每个分组中的重复数据个数对所述拷贝的数据分组，对每个分组中的数据分别进行排序并按排序顺序交换数据的索引，排序结束后，GPU将排序结果回传给CPU进行以下操作：

a、更新全局索引：对前一列重复、本列不重复的组内数据，按照本列排序对应的索引、所述偏移量、所述每个分组中的重复数据个数更新全局索引；

b、记录新的分组，每个分组内数据相同，记录每个分组位于全局索引中起始位置；

c、记录每个新的分组中重复数据的个数；

d、记录重复数据的索引，用于后一列数据排序时，将索引对应的数据传递给GPU进行后一列数据的排序；

在通过GPU对数据进行排序时，对于分组数量大于第一预设值，而每个分组内部元素小于第二预设值的情况，每个线程处理一个分组，每个分组内部使用冒泡排序以达到多组并发排序的目的；

步骤3：重复步骤2至所有需要排序的数据排序完成，流程结束。

可选地，在步骤1之前，还包括CPU读取业务层的数据并将数据缓存至堆外内存，同时将第一列数据传递给GPU，GPU对第一列数据进行排序。

为解决上述的技术问题，本发明技术方案还提供一种采用如上述中任一项所述的基于GPU的多列数据排序方法的数据处理设备，所述数据处理设备内部设有CPU和GPU。

本发明技术方案的有益效果是：

本发明通过使用CPU结合GPU处理多列数据排序方法，在需要大数据量进行排序时，利用GPU强大的并发处理能力，可以有效提升单台机器的性能，有效弥补了单台服务器性能上的短板；在不增加集群规模前提下，通过增加GPU大幅提高集群计算能力。

具体实施方式：

下面结合具体实施例对本发明作进一步说明，但不作为本发明的限定。

一种实施例的基于GPU的多列数据排序方法，其中，包括以下步骤：

步骤1：对第一列数据进行排序，处理方法如下；

c、记录每个分组中的重复数据个数；

步骤2：对下一列数据进行排序，处理方法如下：

GPU对本列数据进行排序时，如果前一列重复数据索引为空，则流程结束，将排序后的数据索引传递给业务层，根据数据索引输出最终结果；如果前一列有重复数据，业务层根据重复数据的索引，将重复数据的索引对应的本列数据拷贝到连续内存空间，传递给GPU，按照所述每个分组中的重复数据个数对所述拷贝的数据分组，对每个分组中的数据分别进行排序并按排序顺序交换数据的索引，排序结束后，GPU将排序结果回传给CPU进行以下操作；

c、记录每个新的分组中重复数据的个数；

本实施例中，在步骤3中还包括，没有重复数据，不需要对后续列继续排序时，流程结束。

本发明技术方案还提供一种采用如上述中任一项所述的数据处理设备，数据处理设备内部设有CPU和GPU。

通过以下说明进一步地认识本发明的技术方案。

如下表1所示，本实施例中以2列数据，每列10给数据排序为例，第一列为int型数据，第二列为long型数据。

数据索引	0	1	2	3	4	5	6	7	8	9
											第一列数据int	18	5	4	16	8	16	22	26	16	22
第二列数据long	18	23	4	22	8	7	22	6	17	2

表1

表1示出了第一列排序，其中索引3、5、8对应的都是数值16，数据索引6和9对应的都是数值22。

表2

对表1的多列数据进行排序，步骤如下：

步骤一：利用GPU对数据排序，同步对数据索引排序，可以得到“排序后数据”和“排序后数据索引”；

步骤二：对“排序后数据”遍历计算每个位置的值是否与后面值相同，且与前面值不同，记录这个值对应的下标，可以得到B，重复数据位于排序好的数组中的偏移量：[3,7]。

步骤三：在步骤二计算过程中，如果是第一个元素，判断该值与后面值是否相同，相同则该值对应的数量加1；如果是中间元素，则判断该值与前面值是否相同，相同则当前分组重复数据数量加1；如果与前面值不同，与后面值相同，则下一个分组数量加1.直到计算完最后一个元素，即可得到C，每个重复数据的分组内数据个数：[3,2]。

步骤四：在步骤二和步骤三中，如果元素与前面值相同或者与后面值相同，则保存排序后数据的索引。即可得到D，重复数据的索引：[3,5,8,6,9]，如上表2所示。

最终得到数据：

A、全局数据排序索引为：[2,1,4,3,5,8,0,6,9,7]。

B、重复数据位于排序好的数组中的偏移量：[3,7]。

C、每个重复数据的分组内数据个数：[3,2]。

D、重复数据的索引：[3,5,8,6,9]。

表3

数据原索引	0	1	2	3	4	5	6	7	8	9
											第二列数据	18	23	4	22	8	7	22	6	17	2
参与排序的数据				22		7	22		17	2

如上表3示出了第二列排序，且根据如上表2所示的第一列排序的结果。对表3的多列数据进行排序，步骤如下：

步骤一：第一列数据排序结束后，将第一列重复数据的下标对应的第二列中数值拷贝到连续的内存区域，可得到A，[22,7,17,22,2]；

步骤二：第一列数据排序后，重复数据每个分组中重复数据的数量为[3,2]，利用GPU对每个分组分别排序，每个分组使用冒泡排序对数据进行排序，同时交换数据的索引，得到B，排序后数据为[7,17,22,2,22]，及对应的索引[5,8,3,9,6]；

步骤三第一列排序后数据索引为[2,1,4,3,5,8,0,6,9,7]，同时记录了每个重复数据位于排序好的数组中的偏移量[3,7]，及每个重复数据的分组内数据个数[3,2]，这样就可以更新[3,5,8]为[5,8,3],[6,9]更新为[9,6].得到C全局数据索引排序[2,1,4,5,8,3,0,9,6,7]。同时利用第一列排序时的方法计算得到，第二列排序后的重复数据索引，每个分组内重复数据的数量及位于全局索引中的偏移量。

步骤四：判断是否还有待排序的列或者当前列没有重复数据，如果当前列是最后一列或当前列没有重复数据，则输出步骤三结论即为多列排序结果，如表4所示。

最终得到数据：

A、第一列中排序后重复数据的索引分别为[3,5,8,6,9]，这些索引对应的第二列数据分别为[22,7,17,22,2]。

B、第二列数据分为2组[22,7,17]和[22,2]进行组内排序，组间排序不交叉，排序后顺序为[7,17,22,2,22]，数据排序后对应的索引为[5,8,3,9,6]。

C、更新第一列排序的全局索引[2,1,4,3,5,8,0,6,9,7]中,生成的新的全局索引为[2,1,4,5,8,3,0,9,6,7]。

D、输出多列排序结果。

数据索引	0	1	2	3	4	5	6	7	8	9
											第一列数据值int	4	5	8	16	16	16	18	22	22	26
第二列数据值long	4	23	8	7	17	22	18	2	22	6

表4

综上所述，本发明通过使用CPU结合GPU处理多列数据排序方法，在需要大数据量进行排序时，利用GPU强大的并发处理能力，可以有效提升单台机器的性能，有效弥补了单台服务器性能上的短板；在不增加集群规模前提下，通过增加GPU大幅提高集群计算能力。

对于存在多列数据的记录，对多列数据排序，前列和后列之间有依赖关系，在数据库多列排序领域也可以应用此发明技术；

多列排序时，结合CPU和GPU完成多列数据的排序，第一列排序结果直接影响第二列排序的数据，采用了CPU内存预分配方案，减少内存的频繁申请和释放，提升了整体集群性能；

对于分组较多，而每个分组内部元素较少时，使用GPU进行排序时，每个线程处理一个分组，每个分组内部使用冒泡排序以达到多组并发排序的目的。

以上仅为本发明较佳的实施例，并非因此限制本发明的实施方式及保护范围，对于本领域技术人员而言，应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案，均应当包含在本发明的保护范围内。

Claims

1.一种基于GPU的多列数据排序方法，其特征在于，包括以下步骤：

步骤1：对第一列数据进行排序，处理方法如下；

c、记录每个分组中的重复数据个数；

步骤2：对下一列数据进行排序，处理方法如下：

c、记录每个新的分组中重复数据的个数；

2.根据权利要求1所述的基于GPU的多列数据排序方法，其特征在于，在步骤1之前，还包括CPU读取业务层的数据并将数据缓存至堆外内存，同时将第一列数据传递给GPU，GPU对第一列数据进行排序。

3.一种采用如权利要求1-2中任一项所述的基于GPU的多列数据排序方法的数据处理设备，其特征在于，所述数据处理设备内部设有CPU和GPU。