CN109189746B

CN109189746B - 通用流式Shuffle引擎的实现方法、装置、设备及存储介质

Info

Publication number: CN109189746B
Application number: CN201810761504.3A
Authority: CN
Inventors: 张建伟; 宋展
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-07-12
Filing date: 2018-07-12
Publication date: 2021-01-22
Anticipated expiration: 2038-07-12
Also published as: CN109189746A

Abstract

本发明公开了通用流式Shuffle引擎的实现方法、装置、设备及存储介质，其中方法包括：Shuffle获取dce writer在内存中进行计算的同时发送给Shuffle的数据；当每次符合预定条件时，Shuffle将获取到的数据在内存中进行排序后写入到HDFS，以便dce reader从HDFS中读取自身对应的数据。应用本发明所述方案，能够减少大量I/O等。

Description

通用流式Shuffle引擎的实现方法、装置、设备及存储介质

【技术领域】

本发明涉及计算机应用技术，特别涉及通用流式Shuffle引擎的实现方法、装置、设备及存储介质。

【背景技术】

在当今数据大爆炸时代，各行各业都在努力从海量数据中挖掘价值，而海量数据的处理对算力提出了很大的挑战。映射-归约(MapReduce)是海量数据处理中使用最广泛的计算框架，而Shuffle是其中最重要的基础组件，其实现性能决定了整个计算框架的性能。

不管社区版本，还是其它版本，都是基于磁盘拉(Pull)模式，映射(Map)端产出的数据会放到本地磁盘，归约(Reduce)在使用的时候拉过来，而这样处理至少会带来以下问题：首先，Map端数据需要全部写入磁盘，会导致多次输入输出(I/O，Input/Output)，其次，在Pull数据阶段也会产生大量随机I/O。

【发明内容】

有鉴于此，本发明提供了通用流式Shuffle引擎的实现方法、装置、设备及存储介质。

具体技术方案如下：

一种通用流式Shuffle引擎的实现方法，包括：

Shuffle获取分布式计算引擎写入端dce writer在内存中进行计算的同时发送给所述Shuffle的数据；

当每次符合预定条件时，所述Shuffle将获取到的数据在内存中进行排序后写入到Hadoop分布式文件系统HDFS，以便分布式计算引擎读取端dce reader从所述HDFS中读取自身对应的数据。

优选地，该方法进一步包括：

所述Shuffle将数据写入到所述HDFS中之后，向所述dce writer返回确认ACK信息，以便所述dce writer将所述ACK信息对应的数据从内存中删除。

优选地，所述符合预定条件包括：内存已满，或者，定时器到时。

一种通用流式Shuffle引擎的实现方法，包括：

分布式计算引擎写入端dce writer在内存中进行计算的同时，将输出的数据发送给Shuffle，以便当每次符合预定条件时，所述Shuffle将获取到的数据在内存中进行排序后写入到Hadoop分布式文件系统HDFS，进而由分布式计算引擎读取端dce reader从所述HDFS中读取自身对应的数据。

优选地，该方法进一步包括：

所述dce writer获取所述Shuffle将数据写入到所述HDFS中之后，向所述dcewriter返回的确认ACK信息，将所述ACK信息对应的数据从内存中删除。

优选地，该方法进一步包括：

当接收所述dce writer数据的Shuffle中存在慢节点时，所述dce writer将数据发送给重新为其分配的Shuffle，利用重新分配的Shuffle替换慢节点Shuffle的工作。

优选地，该方法进一步包括：

所述dce writer采用预约的模式将数据发送给所述Shuffle，包括：

向所述Shuffle发送预约大小的远程过程调用RPC请求；

若接收到针对所述请求的确认消息，则向所述Shuffle发送携带有所述预约大小的数据的RPC。

一种通用流式Shuffle引擎的实现方法，包括：

分布式计算引擎读取端dce reader从Hadoop分布式文件系统HDFS中读取自身对应的数据；所述数据为分布式计算引擎写入端dce writer在内存中进行计算的同时将输出的数据发送给Shuffle后，当每次符合预定条件时，所述Shuffle将获取到的数据在内存中进行排序后写入到所述HDFS中的。

优选地，该方法进一步包括：

所述dce reader在从所述HDFS中读取数据时，根据数据标识去除重复的数据。

一种通用流式Shuffle引擎的实现装置，包括：第一处理单元以及第二处理单元；

所述第一处理单元，用于获取分布式计算引擎写入端dce writer在内存中进行计算的同时输出的数据；

所述第二处理单元，用于当每次符合预定条件时，将获取到的数据在内存中进行排序后写入到Hadoop分布式文件系统HDFS，以便分布式计算引擎读取端dce reader从所述HDFS中读取自身对应的数据。

优选地，所述第二处理单元进一步用于，将数据写入到所述HDFS中之后，向所述dce writer返回确认ACK信息，以便所述dce writer将所述ACK信息对应的数据从内存中删除。

一种通用流式Shuffle引擎的实现装置，包括：第三处理单元；

所述第三处理单元，用于在内存中进行计算的同时，将输出的数据发送给Shuffle，以便当每次符合预定条件时，所述Shuffle将获取到的数据在内存中进行排序后写入到Hadoop分布式文件系统HDFS，进而由分布式计算引擎读取端dce reader从所述HDFS中读取自身对应的数据。

优选地，所述装置中进一步包括：第四处理单元；

所述第四处理单元，用于获取所述Shuffle将数据写入到所述HDFS中之后，返回的确认ACK信息，将所述ACK信息对应的数据从内存中删除。

优选地，所述第三处理单元进一步用于，当接收所述装置数据的Shuffle中存在慢节点时，将数据发送给重新为所述装置分配的Shuffle，利用重新分配的Shuffle替换慢节点Shuffle的工作。

优选地，所述第三处理单元进一步用于，采用预约的模式将数据发送给所述Shuffle，包括：向所述Shuffle发送预约大小的远程过程调用RPC请求；若接收到针对所述请求的确认消息，则向所述Shuffle发送携带有所述预约大小的数据的RPC。

一种通用流式Shuffle引擎的实现装置，包括：第五处理单元；

所述第五处理单元，用于从Hadoop分布式文件系统HDFS中读取自身对应的数据；所述数据为分布式计算引擎写入端dce writer在内存中进行计算的同时将输出的数据发送给Shuffle后，当每次符合预定条件时，所述Shuffle将获取到的数据在内存中进行排序后写入到所述HDFS中的。

优选地，所述第五处理单元进一步用于，在从所述HDFS中读取数据时，根据数据标识去除重复的数据。

一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现如以上所述的方法。

一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如以上所述的方法。

基于上述介绍可以看出，本发明所述方案中采用了基于内存推(push)模式，dcewriter在内存中边计算边把数据直接发送给远端的Shuffle，Shuffle对接收到的数据在内存中排序并写到HDFS，dce reader从HDFS中读取自身对应的数据，由于dce writer和Shuffle等的处理均在内存中进行，从而减少了写入磁盘所导致的多次I/O，另外，整个过程都是大段顺序读写，如dce reader读取的都是大段数据，从而减少了大量随机I/O等，进而达到了节省系统资源等效果。

【附图说明】

图1为本发明所述通用流式Shuffle引擎的实现方法实施例的流程图。

图2为本发明所述MapReduc系统架构示意图。

图3为本发明所述通用流式Shuffle引擎的实现装置第一实施例的组成结构示意图。

图4为本发明所述通用流式Shuffle引擎的实现装置第二实施例的组成结构示意图。

图5为本发明所述通用流式Shuffle引擎的实现装置第三实施例的组成结构示意图。

图6示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。

【具体实施方式】

为了使本发明的技术方案更加清楚、明白，以下参照附图并举实施例，对本发明所述方案进行进一步说明。

显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

图1为本发明所述通用流式Shuffle引擎的实现方法实施例的流程图。如图1所示，包括以下具体实现方式。

在101中，Shuffle获取分布式计算引擎写入端(dce writer)在内存中进行计算的同时发送给Shuffle的数据。

在102中，当每次符合预定条件时，Shuffle将获取到的数据在内存中进行排序后写入到Hadoop分布式文件系统(HDFS，Hadoop Distributed File System)，以便分布式计算引擎读取端(dce reader)从HDFS中读取自身对应的数据。

通常来说，一个计算框架(系统)中的dce writer、Shuffle以及dce reader均为多个，假设系统为MapReduce，那么dce writer即指MapReduce中的Map端，dce reader即指MapReduce中的Reduce。

对于每个dce writer来说，可以一边计算，一边将数据按照分区(partition)的方式组织发送给对应的Shuffle，每个dce writer分别对应至少一个Shuffle，对应的Shuffle数量以及对应哪些Shuffle均可根据实际情况而定。dce writer的计算等操作完全在内存中进行，不落磁盘。

Shuffle在dce writer运行前就全部启动，获取来自dce writer的数据，一个Shuffle可以处理一个或多个dce Reader的数据，但分开处理。当每次符合预定条件时，Shuffle可将获取到的数据在内存中进行排序(Sort)后写入到HDFS中，并向dce writer返回确认(ACK)信息，进而可由dce writer将ACK信息对应的数据从内存中删除。

其中，符合预定条件可以是指：内存已满，或者，定时器到时。也就是说，当内存已满时，可以将内存中的数据进行排序后顺序写入到HDFS中，或者，当定时器到时时，可以将数据进行排序后顺序写入到HDFS中，较佳地，定时器的定时时长可以是由dce writer指定的，dce writer可以根据自身的产出速度等确定出定时时长，并通知Shuffle，即通知Shuffle多长时间之后需要将数据发下去。

对于Shuffle写入到HDFS中的数据，dce reader可从HDFS中顺序读取属于其处理的文件数据。

以上主要是从Shuffle一侧对本发明所述方案进行说明，以下分别从dec writer以及dce reader一侧对本发明所述方案进行进一步说明。

dec writer一侧：dce writer在内存中进行计算的同时，可将输出的数据发送给Shuffle，以便当每次符合预定条件时，Shuffle将获取到的数据在内存中进行排序后写入到HDFS，进而由dce reader从HDFS中读取自身对应的数据。

dce writer可以一边计算，一边将数据按照partition的方式组织发送给对应的Shuffle，每个dce writer分别对应至少一个Shuffle。dce writer的计算等操作均在内存中进行，不落磁盘。

dce writer还可获取Shuffle每次将数据写入到HDFS中之后向dce writer返回的ACK信息，并将ACK信息对应的数据从内存中删除。当dce writer输出的数据均被ACK后，dcewriter可向系统管理者汇报成功，完成提交(commit)。

另外，当接收dce writer数据的Shuffle中存在慢节点时，dce writer可将数据发送给重新为其分配的Shuffle，利用重新分配的Shuffle替换慢节点Shuffle的工作。

比如，某一Shuffle由于负载较高等原因造成卡顿，那么所有向该Shuffle发送数据的dce writer均会受到影响，从而拖慢作业进度，该Shuffle即为慢节点。

各Shuffle可以定期向系统管理者汇报自身的负载信息，dce writer也可实时检测接收自身数据的各Shuffle的状态，如处理速度是否异常等，当检测到异常时，可向系统管理者汇报，进而由系统管理者为dce writer重新分配一个Shuffle，利用重新分配的Shuffle替换慢节点Shuffle的工作，从而确保了作业进度等。

在实际应用中，dce writer输出的数据可通过远程过程调用(RPC，RemoteProcedure Call)发送给Shuffle，Shuffle对数据进行Sort等，写入HDFS。较佳地，可通过一个固定大小的Buffer构造一个生产消费模型控制压力。dce writer可采用预约的模式将数据发送给Shuffle，具体可包括：向Shuffle发送预约大小的RPC请求，若接收到针对该请求的确认消息，则向Shuffle发送携带有所述预约大小的数据的RPC。即在每次发送数据之前，先进行预约，询问对方是否能够处理，若得到肯定答复，则发送数据，从而保证了数据的正常处理等。

dce reader一侧：dce reader从HDFS中读取自身对应的数据，所述数据为dcewriter在内存中进行计算的同时将输出的数据发送给Shuffle后，当每次符合预定条件时，Shuffle将获取到的数据在内存中进行排序后写入到HDFS中的。

如前所述，当dce writer输出的数据均被ACK后，dce writer可向系统管理者汇报成功，完成commit，当所有dce writer均完成commit时，意味着Shuffle也都结束处理，进一步地，系统管理者开始调度dce reader，dce reader从HDFS中顺序读取自身对应的文件数据，并进行相应处理。

在分布式环境中，个别任务失败重算属于正常容错，同时为应对个别机器异常造成慢节点等，需要使用预测执行，即一个任务有两个尝试(attempt)同时运行，但这样会造成Shuffler写入到HDFS中数据包含一部分重复数据，需要对这部分数据进行过滤，以保证数据的正确性。为此，dce reader在从HDFS中读取数据时，可根据数据标识去除重复的数据。

需要说明的是，对于前述的方法实施例，为了简单描述，将其表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

总之，本发明所述方案中采用了基于内存push模式，dce writer边计算边把数据直接发送给远端的Shuffle，整个过程数据都在内存，不落磁盘，Shuffle对接收到的数据在内存中排序并写到HDFS，dce reader从HDFS中读取自身对应的数据，由于dce writer和Shuffle等的处理均在内存中进行，从而减少了写入磁盘所导致的多次I/O，另外，整个过程都是大段顺序读写，如dce reader读取的都是大段数据，从而减少了大量随机I/O等，进而达到了节省系统资源等效果。

另外，本发明所述方案实现了与计算模型解耦，作为一个通用的Service，可适用于各种计算框架，如MapReduce以及Spark等。

以下以MapReduce为例进行进一步说明。图2为本发明所述MapReduc系统架构示意图。

如图2所示，在MapReduce中，Map即指前述的dce writer，Reduce即指前述的dcereader，Job Master和Shuffle Master即指前述的系统管理者。

Map、Shuffle以及Reduce的个数均为多个，具体个数可视实际情况而定。一个作业(Job)可以被分为多个任务(task)，包括Map task和Reduce task。不同的Map可分别处理不同的map task，每个Map通常分别对应多个Shuffle，具体对应哪些Shuffle同样可视实际情况而定。

Map可一边计算，一边将数据按照partition的方式组织发送给对应的Shuffle，计算等操作均在内存中实现，不落磁盘。当接收到来自Shuffle的ACK信息时，Map可将ACK信息对应的数据从内存中删除。另外，当输出的数据均被ACK后，Map可向Job Master汇报成功，完成commit。

Shuffle在Map运行前就全部启动，获取来自Map的数据，一个Shuffle可处理一个或者多个归约分片(reduce shard)的数据，但分开处理，当每次符合预定条件时，Shuffle可将获取到的数据在内存中进行Sort后顺序写入HDFS中对应的reduce shard的路径，并向Map返回ACK信息。

当所有Map task均成功commit时，意味着Shuffle也都结束处理，Job Master开始调度Reduce，每个Reduce从HDFS中顺序读取自身对应的即属于本shard的文件数据，并可进行多路归并排序，同时去重，然后调用用户的reduce逻辑等。

以上是关于本发明方法实施例的介绍，以下通过装置实施例，对本发明所述方案进行进一步说明。

图3为本发明所述通用流式Shuffle引擎的实现装置第一实施例的组成结构示意图。如图3所示，包括：第一处理单元301以及第二处理单元302。

第一处理单元301，用于获取dce writer在内存中进行计算的同时输出的数据。

第二处理单元302，用于当每次符合预定条件时，将获取到的数据在内存中进行排序后写入到HDFS，以便dce reader从HDFS中读取自身对应的数据。

其中，第二处理单元302在将数据写入到HDFS中之后，还可向dce writer返回ACK信息，以便dce writer将ACK信息对应的数据从内存中删除。

所述符合预定条件可以是指：内存已满或者定时器到时等。

图4为本发明所述通用流式Shuffle引擎的实现装置第二实施例的组成结构示意图。如图4所示，包括：第三处理单元401。

第三处理单元401，用于在内存中进行计算的同时，将输出的数据发送给Shuffle，以便当每次符合预定条件时，Shuffle将获取到的数据在内存中进行排序后写入到HDFS，进而由dce reader从HDFS中读取自身对应的数据。

所述装置中还可进一步包括：第四处理单元402，用于获取Shuffle将数据写入到HDFS中之后，返回的ACK信息，将ACK信息对应的数据从内存中删除。

另外，当接收所述装置的数据的Shuffle中存在慢节点时，第三处理单元401可将数据发送给重新为所述装置分配的Shuffle，利用重新分配的Shuffle替换慢节点Shuffle的工作。

再有，第三处理单元401可采用预约的模式将数据发送给Shuffle，包括：向Shuffle发送预约大小的RPC请求，若接收到针对该请求的确认消息，则向Shuffle发送携带有所述预约大小的数据的RPC。

图5为本发明所述通用流式Shuffle引擎的实现装置第三实施例的组成结构示意图。如图5所示，包括：第五处理单元501。

第五处理单元501，用于从HDFS中读取自身对应的数据，所述数据为dce writer在内存中进行计算的同时将输出的数据发送给Shuffle后，当每次符合预定条件时，Shuffle将获取到的数据在内存中进行排序后写入到HDFS中的。

第五处理单元501在从HDFS中读取数据时，还可根据数据标识去除重复的数据。

图3、图4和图5所示装置实施例的具体工作流程请参照前述方法实施例中的相应说明，不再赘述。

图6示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。图6显示的计算机系统/服务器12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于：一个或者多个处理器(处理单元)16，存储器28，连接不同系统组件(包括存储器28和处理器16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示，通常称为“硬盘驱动器”)。尽管图6中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信，和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图6所示，网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白，尽管图中未示出，可以结合计算机系统/服务器12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理器16通过运行存储在存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现图1所示实施例中的方法。

本发明同时公开了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时将实现如图1所示实施例中的方法。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法等，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种通用流式Shuffle引擎的实现方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，

该方法进一步包括：

3.根据权利要求1所述的方法，其特征在于，

所述符合预定条件包括：内存已满，或者，定时器到时。

4.一种通用流式Shuffle引擎的实现方法，其特征在于，包括：

5.根据权利要求4所述的方法，其特征在于，

该方法进一步包括：

所述dce writer获取所述Shuffle将数据写入到所述HDFS中之后，向所述dce writer返回的确认ACK信息，将所述ACK信息对应的数据从内存中删除。

6.根据权利要求4所述的方法，其特征在于，

该方法进一步包括：

7.根据权利要求4所述的方法，其特征在于，

该方法进一步包括：

向所述Shuffle发送预约大小的远程过程调用RPC请求；

8.一种通用流式Shuffle引擎的实现方法，其特征在于，包括：

9.根据权利要求8所述的方法，其特征在于，

该方法进一步包括：

10.一种通用流式Shuffle引擎的实现装置，其特征在于，包括：第一处理单元以及第二处理单元；

11.根据权利要求10所述的装置，其特征在于，

所述第二处理单元进一步用于，将数据写入到所述HDFS中之后，向所述dce writer返回确认ACK信息，以便所述dce writer将所述ACK信息对应的数据从内存中删除。

12.根据权利要求10所述的装置，其特征在于，

所述符合预定条件包括：内存已满，或者，定时器到时。

13.一种通用流式Shuffle引擎的实现装置，其特征在于，包括：第三处理单元；

14.根据权利要求13所述的装置，其特征在于，

所述装置中进一步包括：第四处理单元；

15.根据权利要求13所述的装置，其特征在于，

所述第三处理单元进一步用于，当接收所述装置的数据的Shuffle中存在慢节点时，将数据发送给重新为所述装置分配的Shuffle，利用重新分配的Shuffle替换慢节点Shuffle的工作。

16.根据权利要求13所述的装置，其特征在于，

所述第三处理单元进一步用于，采用预约的模式将数据发送给所述Shuffle，包括：向所述Shuffle发送预约大小的远程过程调用RPC请求；若接收到针对所述请求的确认消息，则向所述Shuffle发送携带有所述预约大小的数据的RPC。

17.一种通用流式Shuffle引擎的实现装置，其特征在于，包括：第五处理单元；

18.根据权利要求17所述的装置，其特征在于，

所述第五处理单元进一步用于，在从所述HDFS中读取数据时，根据数据标识去除重复的数据。

19.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1～9中任一项所述的方法。

20.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1～9中任一项所述的方法。