WO2024060228A1

WO2024060228A1 - 获取数据的方法、装置、系统及存储介质

Info

Publication number: WO2024060228A1
Application number: PCT/CN2022/120986
Authority: WO
Inventors: 魏星达; 陈榕; 王天下; 陈海波; 张旭
Original assignee: 华为技术有限公司
Priority date: 2022-09-23
Filing date: 2022-09-23
Publication date: 2024-03-28

Abstract

本申请公开了一种获取数据的方法、装置、系统及存储介质，属于通信领域。所述方法包括：第一节点接收第一标识和第二节点的节点标识，所述第一节点用于执行第一基本执行单元，所述第二节点用于执行第二基本执行单元，所述第二基本执行单元是所述第一基本执行单元的前驱依赖单元，所述第二节点的内存用于保存所述第二基本执行单元的运行数据，所述第一标识用于指示所述运行数据；所述第一节点基于所述第一标识和所述节点标识获取所述运行数据的存储地址；所述第一节点基于所述存储地址，读取所述第二节点的内存保存的运行数据。本申请能够节省内存拷贝开销以及时间开销。

Description

获取数据的方法、装置、系统及存储介质

技术领域

本申请涉及通信技术领域，特别涉及一种获取数据的方法、装置、系统及存储介质。

背景技术

分布式工作流包括多个基本执行单元，可以使用多个节点执行该多个基本执行单元。该多个基本单元之间存在依赖关系，该多个节点基于该依赖关系执行该多个节点。例如，假设分布式工作流包括第一基本执行单元和第二基本执行单元，第二基本执行单元是第一基本执行单元的前驱依赖单元，第一节点用于执行第一基本执行单元，第二节点用于执行第二基本执行单元。第一节点在执行第一基本执行单元前，需要获取第二基本执行单元被执行时产生的运行数据，然后基于该运行数据执行第一基本执行单元。

目前第一节点获取运行数据的过程为：第二节点的内存保存有第二基本执行单元被执行时产生的运行数据，第二节点从该内存中读取该运行数据并将该运行数据保存到文件系统包括的文件中，第一节点从文件系统中读取该文件，从该文件中获取该运行数据。

例如，在服务器无感知(Serverless computing)计算领域，分布式工作流可以为应用程序，第一基本执行单元和第二基本执行单元为应用程序的两个函数。假设第二基本执行单元为该应用程序的函数def A():return“hello”，第一基本执行单元为该应用程序的函数def B(input)：print(input)#hello。第二节点的内存包括第二基本执行单元被执行时产生的运行数据为“hello”，将该运行数据“hello”保存到文件系统包括的文件中。第一节点从文件系统中读取该文件，从该文件中获取该运行数据“hello”，基于该运行数据“hello”来执行第一基本执行单元。

然而，第二节点从该内存中读取运行数据并保存到文件中，会产生大量的内存拷贝开销，第一节点从文件系统中读取该文件，会产生较长的时间开销。

发明内容

本申请提供了一种获取数据的方法、装置、系统及存储介质，以节省内存拷贝开销以及时间开销。所述技术方案如下：

第一方面，本申请提供了一种获取数据的方法，在所述方法中，第一节点接收第一标识和第二节点的节点标识，第一节点用于执行第一基本执行单元，第二节点用于执行第二基本执行单元，第二基本执行单元是第一基本执行单元的前驱依赖单元，第二节点的内存用于保存第二基本执行单元的运行数据，第一标识用于指示该运行数据。第一节点基于第一标识和该节点标识获取该运行数据的存储地址。第一节点基于该存储地址，读取第二节点的内存保存的运行数据。

由于第一节点接收第一标识和第二节点的节点标识以及第一标识指示第二节点的内存保存的运行数据，因此第一节点基于第一标识和第二节点的节点标识，能够获取到该运行数据的存储地址，基于该存储地址直接读取第二节点的内存保存的运行数据。由于基于该存储地址直接读取第二节点的内存保存的运行数据，从而不用将第二节点的内存保存的运行数据拷贝到文件系统，省去了内存拷贝的开销。第一节点直接读取第二节点的内存保存的运行数据的速率较高，节省了时间开销。

在一种可能的实现方式中，第二节点的内存包括至少一个第一内存页，至少一个第一内存页用于保存该运行数据，第一标识用于指示该至少一个第一内存页。由于该至少一个第一内存页用于保存该运行数据，从而使得第一标识用于指示该运行数据。

在另一种可能的实现方式中，第一节点基于第一标识和该节点标识，获取至少一个第一内存页的地址。第一节点为第一基本执行单元分配至少一个第二内存页，第一节点包括至少一个第二内存页，该至少一个第二内存页与至少一个第一内存页一一对应。第一节点获取存储地址，该存储地址为第一基本执行单元首次读取的第二内存页对应的第一内存页的地址。

在第一基本执行单元首次读取第二内存页时，由于该第二内存页中的数据存储该第二内存页对应的第一内存页中，因此获取该第一内存页的地址，这样基于该第一内存页的地址，直接读取该第一内存页保存的运行数据，实现按需读取数据，节省网络资源。

在另一种可能的实现方式中，第一节点基于获取的第一内存页的地址，读取获取的第一内存页保存的运行数据，从而实现按需读取数据，节省网络资源。

在另一种可能的实现方式中，第二节点的内存还包括目标区域，该目标区域与第一标识相对应，该目标区域保存有至少一个第一内存页的地址。第一节点基于该节点标识向第二节点发送获取请求，该获取请求包括第一标识。第一节点接收第二节点发送的获取响应，该获取响应包括第一标识对应的该目标区域的地址和大小。第一节点基于该目标区域的地址和大小，读取该目标区域保存的该至少一个第一内存页的地址。

这样通过获取请求和获取响应使得第一节点能够得到该目标区域的地址和大小，基于该目标区域的地址和大小，读取该目标区域保存的该至少一个第一内存页的地址，可以提高读取效率，减小读取时间。

在另一种可能的实现方式中，第二节点包括至少一个第一页表项，至少一个第一页表项与至少一个第一内存页对应，第一节点包括至少一个第二页表项。第一节点为第一基本执行单元分配至少一个第二页表项，该至少一个第二页表项与该至少一个第一页表项一一对应，该至少一个第二内存页包括每个第二页表项对应的内存页，这样使得该至少一个第一内存页与该至少一个第二内存页对应。

在另一种可能的实现方式中，该目标区域保存有第二节点的中央处理器CPU运行状态，第一节点读取该目标区域保存的第二节点的CPU运行状态。第一节点将第一节点的CPU运行状态设置为第二节点的CPU运行状态。这样在第一节点上恢复出第二节点的CPU运行状态，不用初始化第一节点的CPU运行状态，提高第一节点执行第一基本执行单元的效率。

在另一种可能的实现方式中，第二节点的CPU运行状态包括至少一个第一CPU寄存器的状态，至少一个第一CPU寄存器是第二节点的CPU中的第二基于执行单元使用的寄存器，第一节点的CPU运行状态包括至少一个第二CPU寄存器的状态，至少一个第一CPU寄存器与至少一个第二CPU寄存器对应，至少一个第二CPU寄存器是第一节点的CPU中的第一基于执行单元使用的寄存器。

第一节点读取目标区域保存的至少一个第一CPU寄存器的状态。第一节点将每个第二CPU寄存器的状态分别设置为每个第二CPU寄存器对应的第一CPU寄存器的状态。如此，第一节点实现将第一节点的CPU运行状态设置为第二节点的CPU运行状态，从在第一节点上恢复第二节点的CPU运行状态。

在另一种可能的实现方式中，该目标区域还保存有第三内存页的地址与第一数据的存储位置之间的映射关系，第二节点的内存还包括第三内存页，第一数据存储在第二节点的磁盘中，第一数据是第二基本执行单元需要写入所述第三内存页但还未写入到第三内存页的数据，第一节点包括与第三内存页相对应的第四内存页。第一节点读取该目标区域保存的该映射关系。第一节点在第一基本执行单元首次读取第四内存页时，基于第四内存页对应的第三内存页的地址和该映射关系，获取第一数据的存储位置。第一节点基于该存储位置和该节点标识，获取第一数据，第一数据是第一节点执行第一基本执行单元使用的数据。这样保证第一节点能够成功运行第一基本执行单元。

在另一种可能的实现方式中，该目标区域还保存有第二基本执行单元在执行时打开的至少一个文件的文件描述符，第二节点包括该至少一个文件。第一节点读取该目标区域保存的该至少一个文件的文件描述符，该至少一个文件的文件描述符是第一节点执行第一基本执行单元使用的数据。这样保证第一节点能够成功运行第一基本执行单元。

在另一种可能的实现方式中，第一基本执行单元和第二基本执行单元是分布式工作流中的两个函数。

第二方面，本申请提供了一种获取数据的方法，在所述方法中，第二节点获取第一标识，第二节点用于执行第二基于执行单元，第一标识用于指示第二节点的内存中保存的第二基本执行单元的运行数据。第二节点发送第一标识，第一标识用于触发第一节点获取该运行数据的存储地址，以及基于该存储地址读取第二节点的内存保存的运行数据，第一节点用于执行第一基本执行单元，第二基本执行单元是第一基本执行单元的前驱依赖单元。

由于第二节点获取的第一标识指示第二节点的内存保存的运行数据，第二节点发送第一标识，这样第一节点基于第一标识能够获取到该运行数据的存储地址，基于该存储地址直接读取第二节点的内存保存的运行数据。由于第一节点基于该存储地址直接读取第二节点的内存保存的运行数据，从而第二节点不用将第二节点的内存保存的运行数据拷贝到文件系统，省去了内存拷贝的开销。第一节点直接读取第二节点的内存保存的运行数据的速率较高，节省了时间开销。

在一种可能的实现方式中，第二节点的内存包括至少一个第一内存页，该至少一个第一内存页用于保存该运行数据，第一标识用于指示该至少一个第一内存页。由于该至少一个第一内存页用于保存该运行数据，从而使得第一标识用于指示该运行数据。

在另一种可能的实现方式中，第二节点的内存包括目标区域，该目标区域与第一标识相对应。第二节点向该目标区域保存该至少一个第一内存页的地址。第二节点接收第一节点发送的获取请求，该获取请求包括第一标识。第二节点向第一节点发送获取响应，该获取响应包括第一标识对应的该目标区域的地址和大小，该获取响应用于触发第一节点基于该目标区域的地址和大小，读取该目标区域保存的该至少一个第一内存页的地址。这样通过获取请求和获取响应使得第一节点能够得到该目标区域的地址和大小，基于该目标区域的地址和大小，读取该目标区域保存的该至少一个第一内存页的地址，可以提高读取效率，减小读取时间。

在另一种可能的实现方式中，第二节点向该目标区域保存第二节点的CPU运行状态，以使第一节点读取该目标区域保存的CPU运行状态。这样第一节点基于读取的CPU运行状态，在第一节点上恢复出该CPU运行状态，不用初始化第一节点的CPU运行状态，提高第一节点执行第一基本执行单元的效率。

在另一种可能的实现方式中，第二节点的CPU包括第二基于执行单元使用的至少一个第一中央处理器CPU寄存器，该CPU运行状态包括该至少一个第一CPU寄存器的状态。

在另一种可能的实现方式中，第二节点向该目标区域保存第三内存页的地址与第一数据的存储位置之间的映射关系，第二节点的内存还包括第三内存页，第一数据存储在第二节点的磁盘中，第一数据是第二基本执行单元需要写入第三内存页但还未写入到第三内存页的数据，以使第一节点读取该目标区域保存的该映射关系。其中，第一节点基于该映射关系获取第一数据，第一数据用于执行第一基本执行单元，这样保证第一节点能够成功运行第一基本执行单元。

在另一种可能的实现方式中，第二节点向该目标区域保存第二基本执行单元在执行时打开的至少一个文件的文件描述符，第二节点包括该至少一个文件，以使触发第一节点读取该目标区域保存的该至少一个文件的文件描述符。该至少一个文件的文件描述符用于执行第一基本执行单元，这样保证第一节点能够成功运行第一基本执行单元。

第三方面，本申请提供了一种获取数据的方法，在所述方法中，调度节点接收第二节点发送的第一标识，第二节点用于执行第二基于执行单元，第二节点的内存用于保存第二基本执行单元的运行数据，第一标识用于指示该运行数据。调度节点向第一节点发送第一标识和第二节点的节点标识，第一节点用于执行第一基本执行单元，第二基本执行单元是第一基本执行单元的前驱依赖单元，第一标识和该节点标识用于触发第一节点获取该运行数据的存储地址，以及基于该存储地址读取第二节点的内存保存的运行数据。

由于第一标识指示第二节点的内存保存的运行数据，调度节点向第一节点发送第一标识和第二节点的节点标识，因此第一节点基于第一标识和第二节点的节点标识，能够获取到该运行数据的存储地址，基于该存储地址直接读取第二节点的内存保存的运行数据。由于基于该存储地址直接读取第二节点的内存保存的运行数据，从而不用将第二节点的内存保存的运行数据拷贝到文件系统，省去了内存拷贝的开销。第一节点直接读取第二节点的内存保存的运行数据的速率较高，节省了时间开销。

在一种可能的实现方式中，第二节点的内存包括至少一个第一内存页，该至少一个第一内存页用于保存该运行数据，第一标识用于指示至少一个第一内存页。由于该至少一个第一内存页用于保存该运行数据，从而使得第一标识用于指示该运行数据。

在一种可能的实现方式中，第一基本执行单元和第二基本执行单元是分布式工作流中两个的函数。

第四方面，本申请提供了一种获取数据的装置，用于执行第一方面或第一方面的任意一种可能的实现方式中的方法。具体地，所述装置包括用于执行第一方面或第一方面的任意一种可能的实现方式中的方法的单元。

第五方面，本申请提供了一种获取数据的装置，用于执行第二方面或第二方面的任意一种可能的实现方式中的方法。具体地，所述装置包括用于执行第二方面或第二方面的任意一种可能的实现方式中的方法的单元。

第六方面，本申请提供了一种获取数据的装置，用于执行第三方面或第三方面的任意一种可能的实现方式中的方法。具体地，所述装置包括用于执行第三方面或第三方面的任意一种可能的实现方式中的方法的单元。

第七方面，本申请提供了一种第一节点，包括至少一个处理器和存储器，所述至少一个处理器用于与存储器耦合，读取并执行所述存储器中的指令，以实现第一方面或第一方面的任意一种可能的实现方式中的方法。

第八方面，本申请提供了一种第二节点，包括至少一个处理器和存储器，所述至少一个处理器用于与存储器耦合，读取并执行所述存储器中的指令，以实现第二方面或第二方面的任意一种可能的实现方式中的方法。

第九方面，本申请提供了一种调度节点，包括至少一个处理器和存储器，所述至少一个处理器用于与存储器耦合，读取并执行所述存储器中的指令，以实现第三方面或第三方面的任意一种可能的实现方式中的方法。

第十方面，本申请提供了一种计算机程序产品，所述计算机程序产品包括在计算机可读存储介质中存储的计算机程序，并且所述计算程序通过处理器进行加载来实现上述第一方面、第二方面、第三方面、第一方面任意可能的实现方式、第二方面任意可能的实现方式或第三方面任意可能的实现方式的方法。

第十一方面，本申请提供了一种计算机可读存储介质，用于存储计算机程序，所述计算机程序通过处理器进行加载来执行上述第一方面、第二方面、第三方面、第一方面任意可能的实现方式、第二方面任意可能的实现方式或第三方面任意可能的实现方式的方法。

第十二方面，本申请提供了一种芯片，包括存储器和处理器，存储器用于存储计算机指令，处理器用于从存储器中调用并运行该计算机指令，以执行上述第一方面、第二方面、第三方面、第一方面任意可能的实现方式、第二方面任意可能的实现方式或第三方面任意可能的实现方式的方法。

第十三方面，本申请提供了一种获取数据的系统，所述系统包括第四方面所述的装置和第五方面所述的装置，或者，所述系统包括第七方面所述的第一节点和第八方面所述的第二节点。

在一种可能的实现方式中，所述系统还包括第六方面所述的装置或第九方面所述的调度节点。

附图说明

图1是本申请实施例提供的一种网络架构示意图；

图2是本申请实施例提供的一种计算节点的结构示意图；

图3是本申请实施例提供的一种获取数据的方法流程图；

图4是本申请实施例提供的一种有向无环图的示意图；

图5是本申请实施例提供的一种向第一目标区域保存数据的流程图；

图6是本申请实施例提供的一种获取存储地址的流程图；

图7是本申请实施例提供的一种读取第二节点的内存保存的运行数据的流程图；

图8是本申请实施例提供的一种数据量与传输时延之间的关系图；

图9是本申请实施例提供的一种分布式工作流的数量与吞吐量之间的关系图；

图10是本申请实施例提供的一种吞吐量和时延之间的关系图；

图11是本申请实施例提供的一种分布式工作流的数量与时延之间的关系图；

图12是本申请实施例提供的一种获取数据的装置结构示意图；

图13是本申请实施例提供的另一种获取数据的装置结构示意图；

图14是本申请实施例提供的另一种获取数据的装置结构示意图；

图15是本申请实施例提供的一种设备结构示意图；

图16是本申请实施例提供的一种获取数据的系统结构示意图。

具体实施方式

下面将结合附图对本申请实施方式作进一步地详细描述。

分布式工作流包括多个基本执行单元，用户向调度节点提供分布式工作流的基本执行单元，无需为分布式工作流的各基本执行单元部署执行所需要的计算资源。调度节点接收分布式工作流后，调用分布式工作流中的基本执行单元，每调用一个基本执行单元，自动启动至少一个计算节点来执行该基本执行单元。由于计算节点以按需的方式进行启动，因此能够更好的提高计算资源利用率。

例如，在服务器无感知计算领域，分布式工作流可能是应用程序，应用程序的基本执行单元为函数，用户向调度节点提供应用程序，调度节点在调用该应用程序的某个函数时，启动一个计算节点来执行该函数。再例如，应用程序包括方法，应用程序的基本执行单元为应用程序中的方法，调度节点在调用该应用程序的某个方法时，启动一个计算节点来执行该方法。上述列举了两个基本执行单元的实例，对于基本执行单元的其他实例，在此不再一一列举。

可选地，该计算节点可能是计算设备或运行在计算设备上虚拟实例等。该虚拟实例可以为虚拟机或容器等。

分布式工作流包括的多个基本执行单元之间存在依赖关系，调度节点基于该多个基本执行单元之间存在的依赖关系，调用分布式工作流的基本执行单元。

对于分布式工作流中具有依赖关系的两个基本执行单元，为了便于说明，将该两个基本执行单元分别称为第一基本执行单元和第二基本执行单元。所谓第一基本执行单元和第二基本执行单元之间具有的依赖关系是指第一基本执行单元在执行时需要第二基本执行单元产生的运行数据。

可选地，该运行数据是第二基本执行单元的执行结果，和/或，第二基本执行单元在执行过程中产生部分或全部中间结果等。

其中，第一基本执行单元可称为第二基本执行单元的后驱依赖单元，或者，第二基本执行单元可称为第一基本执行单元的前驱依赖单元。

前驱依赖单元是产生第一基本执行单元被执行时所需要的运行数据的单元。执行上述第一基本执行单元时需要第二基本执行单元被执行时产生的运行数据，即基于该运行数据执行第一基本执行单元，所以第二基本执行单元称为第一基本执行单元的前驱依赖单元。

为了便于说明，将执行第一基本执行单元的计算节点称为第一节点，将执行第二基本执行单元的计算节点称为第二节点，调度节点先调用第二基本执行单元，并启动第二节点来执行第二基本执行单元。在第二节点执行第二基本执行单元的过程中，第二基本执行单元产生目标运行数据时，目标运行数据是执行第一基本执行单元所需要的运行数据，调度节点调用第一基本执行单元，并启动第一节点。第一节点获取目标运行数据，基于目标运行数据执行第一基本执行单元。

例如，假设分布式工作流包括的第二基本执行单元为：def A():return“hello”，第一基本执行单元为：def B(input)：print(input)#hello。第二基本执行单元和第一基本执行单元之间具有依赖关系。

“hello”为第二基本执行单元在执行时产生的目标运行数据，目标运行数据“hello”是执行第一基本执行单元所需要的运行数据。所以第二基本执行单元可称为第一基本执行单元的前驱依赖单元，或者，第一基本执行单元可称为第二基本执行单元的后驱依赖节点。

调度节点接收该分布式工作流后，首先调用第二基本执行单元，启动第一节点并使用第一节点执行第二基本执行单元。在第二节点执行完第二基本执行单元后，第二节点包括第二基本执行单元产生的目标运行数据“hello”。调度节点调用第二基本执行单元的后驱依赖单元，即调用第一基本执行单元，启动第一节点。第一节点获取目标运行数据“hello”，基于目标运行数据“hello”执行第一基本执行单元。

第二节点在启动时，从第二节点的内存中为第二基本执行单元分配至少一个内存页。在第二节点执行第二基本执行单元的过程中，第二基本执行单元访问该至少一个内存页，也就是说，第二基本执行单元向该至少一个内存页写入数据和/或从该至少一个内存页读取数据，该至少一个内存页中保存的数据包括第二基本执行单元的运行数据。在第二基本执行单元产生目标运行数据时，该目标运行数据保存在该至少一个内存页中。

为了使第一节点能够获取到第二基本执行单元的运行数据，第二节点能够共享目标运行数据在第二节点的内存中的存储地址，第一节点基于该存储地址，直接读取第二节点的内存保存的部分或全部目标运行数据。

在一些实施例中，该存储地址包括该至少一个内存页的地址，第一节点可以基于该至少一个内存页中的部分或全部的内存页的地址，直接读取该部分或全部的内存页保存的运行数据。如此，实现了第一节点从第二节点的内存中读取部分或全部的目标运行数据。

在一些实施例中，第一节点可能采用远程直接内存访问(remote direct memory access，RDMA)技术直接读取第二节点中的该部分或全部的内存页保存的运行数据。

由于第一节点直接读取第二节点的内存中保存的部分或全部的目标运行数据，这样省去了第二节点向文件系统保存该目标运行数据产生的大量内存拷贝开销，以及省去了第一节点从文件系统中读取该目标运行数据产生的较长时间开销。

接下来，将通过如下任意一个实施例来详细说明第一节点获取目标运行数据的过程。

参见图1，本申请实施例提供了一种网络架构100，该网络架构100包括调度节点101和计算节点102，该网络架构100包括的计算节点102的个数可以为多个，每个计算节点102能够与调度节点101通信。

调度节点101用于获取分布式工作流，该分布式工作流包括多个基本执行单元。基于该分布式工作流包括的基本执行单元之间的依赖关系，调用该分布式工作流包括的基本执行单元，为了便于说明，将调用的该基本执行单元称为第一基本执行单元。调度至少一个计算节点102，向该至少一个计算节点102发送第一基本执行单元。

第一基本执行单元是分布式工作流的第一个基本执行单元，第一基本执行单元没有前驱依赖单元，但可能有后驱依赖单元。或者，第一基本执行单元不是分布式工作流的第一个基本执行单元，也不是分布式工作的最后一个基本执行单元，第一基本执行单元可能有前驱依赖单元，也可能有后驱依赖单元。或者，第一基本执行单元是分布式工作流的最后一个基本执行单元，第一基本执行单元可能有前驱依赖单元，但没有后驱依赖单元。

在一些实施例中，如果第一基本执行单元没有前驱依赖单元，则调度节点101向该至少一个计算节点102发送第一基本执行单元。如果第一基本执行单元有前驱依赖单元且该前驱依赖单元已产生第一目标运行数据，为了便于说明，将该前驱依赖单元称为第二基本执行单元，调度节点101向该至少一个计算节点102发送第一基本执行单元、第一标识和第二节点的节点标识。第一目标运行数据是执行第一基本执行单元所需要的运行数据，第一目标运行数据是第二基本执行单元产生的运行数据且第一目标运行数据保存在第二节点的内存中，第二节点是运行该前驱依赖单元的计算节点102，第一标识用于指示第二节点的内存中保存的第一目标运行数据。

对于该至少一个计算节点102中的任一个计算节点102，为了便于说明，将该计算节点102称为第一节点。第一节点，用于接收第一基本执行单元，执行第一基本执行单元。

在一些实施例中，如果第一基本执行单元没有前驱依赖单元，第一节点接收第一基本执行单元，执行第一基本执行单元。如果第一基本执行单元有前驱依赖单元且该前驱依赖单元已产生第一目标运行数据，第一节点接收第一基本执行单元，第一标识和第二节点的节点标识，基于第一标识和第二节点的节点标识读取第二节点的内存保存的部分或全部第一目标运行数据，基于读取的部分或全部的第一目标运行数据执行第一基本执行单元。

如果第一基本执行单元有后驱依赖单元，第一节点，还用于在第一基本执行单元产生第二目标运行数据时，向调度节点101发送第二标识。第二目标运行数据是执行该后驱依赖单元所需要的运行数据，且保存在第一节点的内存中，第二标识用于指示第一节点的内存中保存的第二目标运行数据。

调度节点101还用于接收第一节点发送的第二标识，如果分布式工作流中还有未执行的基本执行单元，则调用未执行的基本执行单元。为了便于说明，将调用的该基本执行单元称为第三基本执行单元，如果第三基本执行单元有前驱依赖单元且该前驱依赖单元为第一基本执行单元，则调度至少一个计算节点102，向该至少一个计算节点102发送第三基本执行单元、第二标识和第一节点的节点标识。如果分布式工作流中没有未执行的基本执行单元，则结束操作。

对于该至少一个计算节点102中的任一个计算节点102，该计算节点102执行与上述第一节点执行的相同操作，在此不再详细说明。

参见图2，对于该网络架构100中的任一个计算节点102，该计算节点102包括中央处理器(central processing unit，CPU)1021、页表1022和内存1023。CPU1021包括CPU寄存器，页表1022包括多个页表项，内存1023包括多个内存页，该多个页表项与该多个内存页一一对应，每个页表项分别包括每个页表项对应的内存页的地址。

对于任一个页表项，该页表项包括该页表项对应的内存页的虚拟地址和物理地址。例如，参见图2，页表1022包括页表项1、页表项2和页表项3等，内存1023包括内存页1、内存页2和内存页3等。页表项1与内存页1相对应，页表项1包括内存页1的虚拟地址和物理地址。页表项2与内存页2相对应，页表项2包括内存页2的虚拟地址和物理地址。页表项3与内存页3相对应，页表项3包括内存页3的虚拟地址和物理地址。

计算节点102在接收到调度节点101发送的基本执行单元，从该CPU1021的CPU寄存器中为该基本执行单元分配至少一个CPU寄存器，以及从页表1022中为该基本执行单元分配至少一个页表项。

该至少一个页表项与内存1023中的至少一个内存页相对应，也就是说，为该基本执行单元分配至少一个页表项可认为是：为该基本执行单元分配该至少一个内存页。

计算节点102的CPU1021用于执行该基本执行单元。在执行该基本执行单元的过程，该基本执行单元获取需要读写的内存页的虚拟地址，该至少一个内存页包括该内存页，从页表1022中获取包括该虚拟地址的页表项，基于该页表项包括该内存页的物理地址，读取该内存页中保存的数据和/或向该内存页写入数据。该至少一个内存页中保存的数据为该基本执行单元在执行过程中的运行数据。

在执行该基本执行单元的过程，该至少一个CPU寄存器用于保存计算节点102的CPU101的运行状态。CPU101的运行状态包括该至少一个CPU寄存器的状态，CPU101的运行状态发生变化时，该基本执行单元会修改该至少一个CPU寄存器的状态。

在一些实施例中，该网络架构100中的多个计算节点102可能包括计算设备和/或虚拟实例等，该虚拟实例包括容器和/或虚拟机等。

参见图3，本申请实施例提供了一种获取数据的方法300，所述方法300应用于图1所示的网络架构100，所述方法300包括如下步骤301至步骤310的流程。

步骤301：调度节点接收分布式工作流，调用分布式工作流的第一个基本执行单元。

例如，假设分布式工作流是应用程序，应用程序包括函数Func0，Func1，Func2，Func3，Func4，……。Func0，Func1，Func2，Func3，Func4均是应用程序的基本执行单元，调度节点接收应用程序，调用该应用程序的第一个基本执行单元Func0，为第一个基本执行单元Func0调度至少一个计算节点。

参见图4，调度节点还可能将分布式工作流转换成一个有向无环图，有向无环图是分布式工作流的树形表示，该有效无环图中的每个节点是分布式工作流的基本执行单元。对于具有依赖关系的两个基本执行单元，其中一个基本执行单元是另一个基本执行单元的前驱依赖单元。在有向无环图中该两个基本执行单元之间有边相连，该一个基本执行单元是另一个基本执行单元的父节点。该有向无环图的根节点为分布式工作流的第一个基本执行单元。

例如，参见图4，分布式工作流为应用程序，应用程序包括基本执行单元Func0，Func1，Func2，Func3，Func4，……。将该分布式工作流转换成如图5所示的有向无环图，Func0为该分布式工作流的第一基本执行单元，是有向无环图的根节点。Func0是Func1和Func2的前驱依赖单元，Func0是Func1和Func2的父节点。Func1是Func3的前驱依赖单元，Func1是Func3的父节点。Func2是Func4的前驱依赖单元，Func2是Func4的父节点。

步骤302：调度节点向第二节点发送第一个基本执行单元。

第二节点是调度节点调度的一个计算节点。可选地，调度节点可能调度至少一个计算节点，这样调度节点向调度的每个计算节点发送第一个基本执行单元。

调度节点向第二节点发送第一个基本执行单元后，等待第二节点在执行第一个基本执行单元的过程中得到第一目标运行数据。第一目标运行数据是第一个基本执行单元在执行时产生的运行数据，第一目标运行数据是执行第一个基本执行单元的后驱依赖单元所需要的数据。

如果调度节点调度多个计算节点，对于该多个计算节点中除第二节点之外的每个计算节点，该每个计算节点同第二节点一样，执行如下步骤303-步骤305的操作。

步骤303：第二节点接收第一个基本执行单元，执行第一个基本执行单元。

在步骤303中，第二节点工作在用户态，在用户态下接收第一个基本执行单元，执行第一个基本执行单元。

第二节点的CPU包括一个或多个CPU寄存器。第二节点还包括页表，该页表包括一个或多个页表项。

在步骤303中，第二节点接收第一个基本执行单元后，从第二节点的CPU包括的CPU寄存器中为第一个基本执行单元分配至少一个第一CPU寄存器，以及从第二节点包括的页表中为第一个基本执行单元分配至少一个页表项。该至少一个页表项与第二节点的内存中的至少一个内存页一一对应，每个页表项分别包括每个页表项对应的内存页的地址。初始化该至少一个第一CPU寄存器的初始状态，这样第一节点便可以使用该至少一个第一CPU寄存器和该至少一个页表项执行第一个基本执行单元。

对于任一个页表项，该页表项包括该页表项对应的内存页的虚拟地址和物理地址。即该内存页的地址包括该内存页的虚拟地址和物理地址。

该至少一个页表项是供第一个基本执行单元使用的页表项，与该至少一个页表项相对应的至少一个内存页是供第一个基本执行单元使用的内存页。

第二节点的页表包括多个页表项，该页表中的每个页表项具有序号。可选地，该页表中的每个页表项的序号可能是基于该页表中的每个页表项的顺序从0开始编号得到的。例如，该页表中的第一个页表项的序号为0，第二个页表项的序号为1，第三个页表项的序号为2，……。

第二节点的CPU运行状态包括该至少一个第一CPU寄存器的状态。初始化该至少一个第一CPU寄存器的初始状态可认为是初始化第二节点的CPU初始运行状态。也就是说，第二节点的CPU初始运行状态包括该至少一个第一CPU寄存器的初始状态。

在第二节点执行第一个基本执行单元的过程，如果第二节点的CPU运行状态发生变化时，第一个基本执行单元可能会修改该至少一个第一CPU寄存器中的部分或全部第一CPU寄存器的状态。

在第二节点执行第一个基本执行单元的过程，第一个基本执行单元基于该至少一个页表项，读写该至少一个页表项对应的至少一个内存页，该至少一个内存页中的部分内存页或全部内存页用于保存第一个基本执行单元产生的运行数据。在实现时，

在第一个基本执行单元需要读写某个内存页时，该内存页是该至少一个页表项中的某个页表项对应的内存页。第一个基本执行单元获取该内存页的虚拟地址，从第二节点的页表中获取包括该虚拟地址的页表项，该获取的页表项是该内存页对应的页表项。基于该获取的页表项包括的该内存页的物理地址，读取该内存页保存的数据和/或向该内存页写入数据。第一个基本执行单元的运行数据包括该读取的数据和/或该写入的数据。

步骤304：第二节点在第一个基本执行单元产生第一目标运行数据时，获取第一标识，第一标识用于指示第一目标运行数据，第一目标运行数据是执行第一个基本执行单元的后驱依赖单元所需要的运行数据。

第一目标运行数据可能是在第二节点执行完第一个基本执行单元后，第一个基本执行单元产生的运行结果，第二节点在执行完第一个基本执行单元后，便可确定第一个基本执行单元产生了第一目标运行数据，并获取指示第一目标运行数据的第一标识。或者，第一目标运行数据可能是在第二节点执行第一个基本执行单元的过程中，第一个基本执行单元产生的中间数据，第二节点在执行完第一个基本执行单元后，便可确定第一个基本执行单元产生了第一目标运行数据，并获取指示第一目标运行数据的第一标识。

在一些实施例中，上述至少一个内存页包括至少一个第一内存页，该至少一个第一内存页保存第一目标运行数据。上述至少一个页表项包括至少一个第一页表项，该至少一个第一页表项与该至少一个第一内存页一一对应。

其中，第一目标运行数据在第二节点中的内存的存储地址包括该至少一个第一内存页的地址。

在一些实施例中，上述至少一个内存页还包括第三内存页，第三内存页与第一数据相对应，第一数据是存储在第二节点的磁盘中的数据，第一数据是第一个基本执行单元需要写入第三内存页但还未写入第三内存页的数据。上述至少一个页表项还包括第三页表项，第三页表项与第三内存页对应。

第二节点包括第三页表项中的第三内存页的地址与第一数据的存储位置之间的映射关系。第一数据的存储位置是第一数据在第二节点的磁盘中的位置，第一数据是第一个基本执行单元需要从第二节点的磁盘中待读取并待写入到第三内存页的数据，但第一个基本执行单元还没有将第一数据从第二节点的磁盘中读取出来并写入到第三内存页中。

第二节点会记录第三内存页的地址(第三内存页的虚拟地址和/或物理地址)与第一数据的存储位置之间的映射关系。

在一些实施例中，第一数据是第二节点的磁盘中的第一文件保存的数据，第一数据的存储位置可能包括第一文件的文件标识、第一数据在第一文件中的偏移和大小等。

在第二节点执行第一个基本执行单元的过程中，第一个基本执行单元还可能打开至少一个文件，基于该至少一个文件中的数据进行执行。该至少一个文件可能是保存在第二节点的磁盘中的文件。第二节点会记录第一个基本执行单元打开的至少一个文件的文件描述符。对于任一个文件，该文件的文件描述符用于标识该文件。

参见图5，在步骤304中，第二节点在第一个基本执行单元产生第一目标运行数据时由用户态进入内核态，当运行到内存态时，在第二节点的内存中分配一个连续的第一目标区域，获取该至少一个第一页表项，将该至少一个第一页表项保存到第一目标区域中。第二节点生成与第一目标区域相对应的第一标识。

在一些实施例中，第一标识可能包括第一目标区域的地址和大小，或者，第一标识是第二节点生成用于标识第一目标区域的身份标识号(identity，ID)等。

其中，将该至少一个第一页表项保存到第一目标区域中，可认为是：将该至少一个第一页表项对应的至少一个第一内存页的地址保存到第一目标区域中。

由于该至少一个第一页表项与该至少一个第一内存页一一对应，该至少一个第一内存页用于保存第一目标运行数据，而第一标识与第一目标区域相对应，如此实现第一标识用于指示第一目标运行数据。

参见图5，第一标识为ID的情况，第二节点保存第一标识、第一目标区域的地址和第一目标区域的大小之间的映射关系，以实现第一标识与第一目标区域相对应。

在一些实施例中，第二节点还可能生成与第一标识相对应的第一校验信息，即第一标识与第一目标区域和第一校验信息相对应。可选地，第二节点保存第一标识、第一校验信息、第一目标区域的地址和第一目标区域的大小之间的映射关系，以实现第一标识与第一目标区域和第一校验信息相对应。

在一些实施例中，第二节点采用指定的数据结构来保存第一标识、第一目标区域的地址和第一目标区域的大小之间的映射关系，或者，采用指定的数据结构来保存第一标识、第一校验信息、第一目标区域的地址和第一目标区域的大小之间的映射关系。可选地，该指定的数据结构包括哈希图(hashmap)等。

参见图5，在步骤304中，第二节点还可能获取第三内存页的地址与第一数据的存储位置之间的映射关系，以及获取与第三内存页相对应的第三页表项，将第三内存页的地址与第一数据的存储位置之间的映射关系，以及第三页表项保存到第一目标区域中。

其中，将第三页表项保存到第一目标区域中，可认为是：将第三内存页的地址保存到第一目标区域中。

参见图5，在步骤304中，第二节点还可能获取第二节点的CPU运行状态，将第二节点的CPU运行状态保存到第一目标区域中。在实现时，

第二节点获取第一个基本执行单元使用的至少一个第一CPU寄存器的状态，第二节点的CPU运行状态包括该至少一个第一CPU寄存器的状态。将该至少一个第一CPU寄存器的状态保存到第一目标区域中。

参见图5，在步骤304中，第二节点还可能获取第一个基本执行单元在执行过程中打开的至少一个文件的文件描述符，将该至少一个文件的文件描述符保存到第一目标区域中。

步骤305：第二节点向调度节点发送第一信息，第一信息包括第一标识。

在第一标识还与第一校验信息相对应时，第一信息还可能包括第一校验信息。

在一些实施例中，第二节点还分配动态连接传输(dynamically connected transport，DCT)对象，该DCT对象用于与除第二节点之外的节点建立连接。

步骤306：调度节点接收第一信息，调用第i个基本执行单元，第一个基本执行单元是第i个基本执行单元的前驱依赖单元，i＝2、3、4、……。

第一个基本执行单元和第i个基本执行单元是分布式工作流中的两个基本执行单元。

在步骤306，调度节点接收到第一信息，从分布式工作流中调用第一个基本执行单元的后驱依赖单元，该后驱依赖单元是位于第一个基本执行单元之后的第i个基本执行单元。在实现时，

调度节点接收到第一信息后，确定分布式工作流是否有未被执行的基本执行单元，如果该分布式工作流没有未被执行的基本执行单元，结束操作。如果该分布式工作流有未被执行的基本执行单元，调度节点从分布式工作流对应的有向无环图中获取第一个基本执行单元的子节点。如果获取的子节点是未被执行的基本执行单元，则将获取的子节点作为第一个基本执行单元的后驱依赖单元，即得到了第i个基本执行单元。

例如，参见图4所示的分布式工作流的有向无环图，该分布式工作流的第一个基本执行单元为Func0，调度节点从该有向无环图中获取第一个基本执行单元Func0的两个子节点，该两个子节点为该分布式工作流的第二个基本执行单元Func1和第三个基本执行单元Func2。第二个基本执行单元Func1和第三个基本执行单元Func2均为第一个基本执行单元Func0的后驱依赖单元。第i个基本执行单元可能是第二个基本执行单元Func1，或者，可能是第三个基本执行单元Func2。

步骤307：调度节点向第一节点发送第二节点的节点标识、第一信息和第i个基本执行单元。

第一节点是调度节点调度的一个计算节点。可选地，调度节点可能调度至少个计算节点，这样调度节点向调度的每个计算节点发送第i个基本执行单元。

调度节点向第一节点发送第二节点的节点标识、第一信息和第i个基本执行单元后，等待第一节点在执行第i个基本执行单元的过程中得到第二目标运行数据。第二目标运行数据是第i个基本执行单元在执行时产生的运行数据，第二目标运行数据是执行第i个基本执行单元的后驱依赖单元所需要的数据。

如果调度节点调度多个计算节点，对于该多个计算节点中除第一节点之外的每个计算节点，该每个计算节点同第一节点一样，执行如下步骤308-步骤310的操作。

步骤308：第一节点接收第二节点的节点标识、第一信息和第i个基本执行单元，基于第一标识和该节点标识，获取第一目标运行数据的存储地址。

第一目标运行数据保存在第二节点的内存中，第一目标运行数据的存储地址是第一目标运行数据在第二节点的内存中的地址。

在一些实施例中，第二节点的内存包括至少一个第一内存页，该至少一个第一内存页保存第一目标运行数据。第一目标运行数据的地址包括该至少一个第一内存页的地址。

参见图6，在步骤308中，第一节点通过如下流程获取该至少一个第一内存页的地址。

3081：第一节点基于第二节点的节点标识向第二节点发送第一获取请求，第一获取请求包括第一标识。

在第一信息还包括第一校验信息的情况，第一获取请求还包括第一校验信息。

在一些实施例中，第一获取请求为第一远程过程调用(remote procedure call，RPC)请求，即第一节点基于第二节点的节点标识，向第二节点发送第一RPC请求，第一RPC请求包括第一标识，或者，第一RPC请求包括第一标识和第一校验信息。

在3081中，第一节点在接收到第二节点的节点标识、第一信息和第i个基本执行单元后，先由用户态进入内核态。在第一节点进入内核态后，第一节点基于第二节点的节点标识向第二节点发送第一获取请求。

3082：第二节点接收第一获取请求，向第一节点发送第一获取响应，第一获取响应包括与第一标识相对应的第一目标区域的地址和大小。

在一些实施例中，第一获取请求包括第一标识，第二节点包括第一标识、第一目标区域的地址和第一目标区域的大小之间的映射关系。第二节点接收第一获取请求，基于第一获取请求包括的第一标识，从该映射关系中获取与第一标识相对应的第一目标区域的地址和大小，向第一节点发送第一获取响应，第一获取响应包括与第一标识相对应的第一目标区域的地址和大小。

在一些实施例中，第一获取请求包括第一标识和第一校验信息，第二节点包括第一标识、第一校验信息、第一目标区域的地址和第一目标区域的大小之间的映射关系。第二节点接收第一获取请求，基于第一获取请求包括的第一标识，从该映射关系中获取与第一标识相对应的第一校验信息、第一目标区域的地址和大小。如果第一获取请求包括的第一校验信息与获取的第一校验信息相同，则向第一节点发送第一获取响应，第一获取响应包括与第一标识相对应的第一目标区域的地址和大小。

在一些实施例中，第一获取响应为第一RPC响应，即第二节点向第一节点发送第一RPC响应，第一RPC响应包括与第一标识相对应的第一目标区域的地址和大小。

3083：第一节点接收第一获取响应，基于第一获取响应包括的第一目标区域的地址和大小，读取第一目标区域保存的内容。

该内容包括至少一个第一页表项，读取该内容为：从第一目标区域读取该至少一个第一页表项对应的至少一个第一内存页的地址。

其中，上述3081-3082是可选的操作，在第一标识包括第一目标区域的地址和大小时，第一节点不用执行3081-3082的操作，直接基于第一获取响应包括的第一目标区域的地址和大小，读取第一目标区域保存的内容。在第一标识是ID时，第一节点执行3081-3082的操作。

在一些实施例中，第一节点接收第一获取响应，建立与第二节点之间的RDMA连接，基于第一目标区域的地址和大小，通过该RDMA连接读取第二节点的第一目标区域保存的内容。

在一些实施例中，第二节点包括DCT对象，第二节点通过该DCT对象与第一节点建立RDMA连接。

读取的该内容还可能包括如下一个或多个，第二节点的CPU运行状态、第三页表项、第三内存页的地址与第一数据的存储位置之间的映射关系，或者、第一个基本执行单元打开的至少一个文件的文件描述符等。

在一些实施例中，第二节点的CPU运行状态包括第二节点的至少一个第一CPU寄存器的状态。

参见图6，第一节点在读取到该内容后，还需要从第一节点的内存中为第i个基本执行单元分配至少一个第二内存页，该至少一个第二内存页与该至少一个第一内存页一一对应。可选地，在实现时，可通过如下3084的操作来实现。

3084：第一节点为第i个基本执行单元分配至少一个第二页表项，该至少一个第二页表项与至少一个第一页表项一一对应，该至少一个第二内存页包括每个第二页表项对应的内存页。

第一节点包括页表，该页表包括多个页表项，该页表中的每个页表项具有序号。可选地，该页表中的每个页表项的序号可能是基于该页表中的每个页表项的顺序从0开始编号得到的。例如，该页表中的第一个页表项的序号为0，第二个页表项的序号为1，第三个页表项的序号为2，……。

第一节点的内存包括多个内存页，该页表包括的多个页表项与第一节点的内存包括的多个内存页一一对应。

在3084中，第一节点参考该至少一个第一页表项的序号，在第一节点的页表中为第i个基本执行单元分配至少一个第二页表项，该至少一个第二页表项与至少一个第一页表项一一对应。可选地，对于任一个第二页表项以及对于该第二页表项对应的第一页表项，该第二页表项与该第一页表项对应可能是指：该第二页表项的序号和该第一页表项的序号相同。

该至少一个第二页表项与第一节点的内存中的至少一个第二内存页一一对应，将该至少一个第二页表项分配给第i个基本执行单元，可认为是：将该至少一个第二内存页分配给第i个基本执行单元。

由于该至少一个第一页表项与该至少一个第二页表项一一对应，使得该至少一个第一内存页与该至少一个第二内存页一一对应。

第一节点还可能将该至少一个第二页表项中的每个第二页表项的本地标记设置为第一标记。对于任一个第二页表项的第一标记，该第一标记用于指示第i个基本执行单元还未访问该第二页表项对应的第二内存页。

页表项的本地标记用于指示第i个基本执行单元是否已访问该页表项对应的内存页。该页表项的本地标记可能是第一标记或者可能是第二标记，第二标记用于指示第i个基本执行单元已访问该页表项对应的内存页。

在读取的该内容还包括第三页表项，第一节点参考第三页表项的序号，在第一节点的页表中为第i个基本执行单元分配第四页表项，第三页表项与第四页表项相对应。可选地，第三页表项与第四页表项相对应可能是指：第三页表项的序号和第四页表项的序号可能相同。

第四页表项与第一节点的内存中的第四内存页对应，将第四页表项分配给第i个基本执行单元，可认为是：将第四内存页分配给第i个基本执行单元。

由于第三页表项与第四页表项相对应，使得第三内存页与第四内存页也相对应。

第一节点还可能将第四页表项的本地标记设置为第一标记。该第一标记用于指示第i个基本执行单元还未访问第四页表项对应的第四内存页。

第一标记为0，第二标记为1；或者，第一标记为1，第二标记为0。当然第一标记的取值还可能是其他取值，第二标记的取值还可能是其他取值，在此不再一一列举说明。

第一节点还可能将该至少一个第二页表项中的每个第二页表项的远端标记设置为第三标记。对于任一个第二页表项的第三标记，该第三标记用于指示该第二页表项对应的第二内存页的数据保存在第二节点中。和/或，第一节点还可能将第四页表项的远端标记设置为第三标记，第四页表项的第三标记用于指示第四页表项对应的第四内存页的数据保存在第二节点中。

第三标记为0或1等值。第三标记的取值还可能是其他取值，在此不再一一列举说明。

其中，上述至少一个第二内存页和/或第四内存页是第一节点分配给第i个基本执行单元所使用的内存页。也就是说，第i个基本执行单元使用的内存页包括该至少一个第二内存页，可能还包括第四内存页。第i个基本执行单元使用的页表项包括该至少一个第二页表项，可能还包括第四页表项。

在读取的该内容还包括第二节点的CPU运行状态，第一节点还可能采用如下3085的操作在第一节点上恢复出第二节点的CPU运行状态。

3085：第一节点还将第一节点的CPU运行状态设置为第二节点的CPU运行状态。在实现时，

第二节点的CPU运行状态包括至少一个第一CPU寄存器的状态，第一节点为第i个基本执行单元分配至少一个第二CPU寄存器，第一节点的CPU包括该至少一个第二CPU寄存器，至少一个第一CPU寄存器与至少一个第二CPU寄存器一一对应，该至少一个第二CPU寄存器是第一节点中的寄存器。第一节点将每个第二CPU寄存器的状态分别设置为每个第二CPU寄存器对应的第一CPU寄存器的状态。第一节点的CPU运行状态包括该至少一个第二CPU寄存器的状态。

在读取的该内容还包括第三内存页的地址与第一数据的存储位置之间的映射关系时，第一节点保存第三内存页的地址与第一数据的存储位置之间的映射关系。

在读取的该内容还包括第一个基本执行单元在执行时打开的至少一个文件的文件描述符时，第一节点保存该至少一个文件的文件描述符。

其中，第i个基本执行单元使用的内存页与第一个基本执行单元使用的内存页一一对应，第一节点将第一节点的CPU运行状态设置为第二节点的CPU运行状态，这样第一节点不需要初始化第i个基本执行单元使用的内存页，也不需要初始化CPU运行状态，即不需要进行冷启动。第一节点接收第i个基本执行单元后，能够快速执行第i个基本执行单元，提高执行效率。

其中，上述3085是一个可选的操作，即也可以不执行3085的操作，这样第一节点为第i个基本执行单元分配至少一个第二CPU寄存器，并初始化该至少一个第二CPU寄存器的初始状态。

其中，3085的操作和3084的操作之间的执行顺序不分先后，可以先执行3084再执行3085，或者，可以先执行3085再执行3084，或者，可以同时执行3084和3085。

在执行完3084和3085的操作后，第一节点由内核态恢复为用户态，在第一节点运行在用户态，第一节点执行第i个基本执行单元。

步骤309：第一节点基于第一目标运行数据的存储地址，读取第二节点的内存保存的部分或全部第一目标运行数据。

在步骤309中，第一节点执行第i个基本执行单元。在第一节点执行第i个基本执行单元的过程中，第i个基本执行单元可能需要访问第i个基本执行单元所使用的内存页。

访问内存页包括写内存页和/或读内存页。

在第i个基本执行单元需要向某个内存页写入数据时，第i个基本执行单元获取该内存页的虚拟地址，从第二节点的页表中获取包括该虚拟地址的页表项，基于该页表项包括的该内存页的物理地址，向该内存页写入数据。

该内存页可能是某个第二内存页或第四内存页，该页表项可能是该第二内存页对应的第二页表项或第四内存页对应的第四页表项。可选地，如果该页表项的本地标记为第一标记，表示第i个基本执行单元首次访问该页表项对应的该内存页，在向该内存页写入数据后，将该页表项的本地标记设置为第二标记。

在第i个基本执行单元读取某个内存页时，如果该内存页是第i个基本执行单元首次读取的第二内存页，且在读取之前也未向该第二内存页写入数据。这样在第i个基本执行单元首次读取该第二内存页时，第一节点获取该第二内存页对应的第一内存页的地址，第一目标运行数据的存储地址包括获取的该第一内存页的地址。基于该第一内存页的地址，直接读取第二节点的内存中的该第一内存页保存的第一目标运行数据。

如果该内存页是第i个基本执行单元首次读取的第四内存页，且在读取之前也未向第四内存页写入数据。这样在第i个基本执行单元首次读取第四内存页时，第一节点获取第四内存页对应的第三内存页的地址，基于第三内存页的地址，从第三内存页的地址与第一数据的存储位置之间的映射关系中获取第一数据的存储位置。基于第一数据的存储位置，获取第二节点的磁盘中保存的第一数据。

在步骤309中，参见图7，第一节点可以通过如下3091-3097的操作，获取第一内存页保存的第一目标运行数据，或者，获取第一数据。

3091：第一节点获取第i个基本执行单元待读取的内存页的虚拟地址，待读取内存页可能是第二内存页或第四内存页，待读取内存页为第i个基本执行单元需要读取的内存页。

3092：第一节点基于待读取内存页的虚拟地址获取待读取内存页对应的待读取页表项，如果待读取页表项的本地标记为第一标记，执行操作3093。

如果待读取页表项的本地标记为第一标记，表明待读取内存页是第i个基本执行单元首次读取的内存页，且在读取待读取内存页之前，第i个基本执行单元也未向待读取内存页写入数据，也就是说，第i个基本执行单元首次访问待读取内存页。如果待读取页表项的本地标记为第二标记，第一节点直接读取待读取内存页中的数据。

在3092中，第一节点从第一节点的页表中找出包括待读取内存页的虚拟地址的页表项，该页表项为待读取页表项。如果待读取页表项的本地标记为第一标记，第一节点由用户态进入内核态，在第一节点运行在内核态时，通过如下3093-3097的操作读取数据。

在一些实施例中，第一节点通过缺页错误处理函数进入内核态。

3093：第一节点基于待读取页表项，确定待读取内存页是第二内存页还是第四内存页，如果待读取内存页为第二内存页，执行3094，如果待读取内存页为第四内存页，执行3095。

在执行3093的操作前，第一节点还可能确定待读取页表项的远端标记是否为第三标记，如果待读取页表项的远端标记是第三标记，表明待读取页表项对应的待读取内存页的数据保存在第二节点中，然后执行3093的操作。如果待读取页表项的远端标记不是第三标记，第一节点使用缺页处理函数获取待读取内存页保存的第一目标运行数据。

在3093中，第一节点获取与待读取页表项相对应的另一个页表项，该另一个页表项是第二节点的页表中的页表项。如果该另一个页表项是第一页表项，确定待读取内存页为第二内存页，如果该另一个页表项是第三页表项，确定待读取内存页为第四内存页。

3094：第一节点基于该第二内存页对应的第一内存页的地址，读取第二节点的内存中的该第一内存页中保存的第一目标运行数据，执行3097。

该另一个页表项包括该第二内存页对应的第一内存页的地址(物理地址)，通过与第二节点之间的RDMA连接，读取第二节点的内存中的该第一内存页中保存的第一目标运行数据。

由于在本申请实施例中，第一节点直接读取第二节点的内存中的该第一内存页保存的第一目标运行数据，相比传统方法从文件系统中读取第一目标运行数据，大幅减小读取数据所需要的传输时延。例如，参见图8，在读取的数据量越大，传统方法从文件系统读取数据所需要的传输时延，与本申请实施例直接从第二节点的内存中读取数据所需要的传输时延之间的差值就越大，所以第一节点直接读取第二节点的内存中的第一目标运行数据，能够减小时间开销。

3095：第一节点基于第四内存页对应的第三内存页的地址，以及第三内存页的地址与第一数据的存储位置之间的映射关系，获取第一数据的存储位置。

第一数据的存储位置包括第一数据属于的第一文件的文件标识、第一数据在第一文件中的偏移和大小。

3096：第一节点基于第一数据的存储位置和第二节点的节点标识，获取第一数据。

第一节点基于第二节点的节点标识，向第二节点发送第二获取请求，第二获取请求包括第一文件的文件标识、第一数据在第一文件中的偏移和大小。第二节点接收第二获取请求，基于第一文件的文件标识，获取第二节点的磁盘中保存的第一文件。基于第一数据在第一文件中的偏移和大小，从第一文件中获取第一数据。第二节点向第一节点发送第二获取响应，第二获取响应包括第一数据。第一节点接收第二获取响应，读取第二获取响应中的第一数据。

在一些实施例中，第二获取请求为第二RPC请求，即第一节点基于第二节点的节点标识，向第二节点发送第二RPC请求，第二RPC请求包括第一文件的文件标识、第一数据在第一文件中的偏移和大小。第二获取响应为第二RPC响应，即第二节点向第一节点发送第二RPC响应，第二RPC响应包括第一数据。

3097：第一节点将待读取页表项的本地标记设置为第二标记，第二标记用于指示第i个基本执行单元已访问待读取页表项对应的待读取内存页。

第一节点还从内核态切换为用户态，在第一节点运行在用户态下，执行如下步骤310。

步骤310：第一节点基于该部分或全部的第一目标运行数据，执行第i个基本执行单元。

在上述待读取内存页是第二内存页时，第一节点读取到该第二内存页对应的第一内存页保存的第一目标运行数据，基于第一目标运行数据执行第i个基本执行单元。在上述待读取内存页是第四内存页时，第一节点获取到第一数据，基于第一数据执行第i个基本执行单元。

在执行第i个基本执行单元时还可能需要上述至少一个文件的文件描述符，即第一节点还可能基于上述至少一个文件的文件描述符，执行第i个基本执行单元。

在步骤310中，第一节点执行第i个基本执行单元后，第i个基本执行单元可能产生第二目标运行数据。第二目标运行数据是第i个基本执行单元在执行时产生的运行数据，第二目标运行数据是执行第i个基本执行单元的后驱依赖单元所需要的数据。

在第i个基本执行单元产生第二目标运行数据后，第一节点向调度节点发送第二信息，第二信息包括第二标识，或者，第二信息包括第二标识和第二校验信息，第二标识用于指示第二目标运行数据。

在第i个基本执行单元产生第二目标运行数据后，第i个基本执行单元使用的内存页包括至少一个第五内存页，该至少一个第五内存页用于保存第二目标运行数据。该至少一个第五内存页可能包括上述第二内存页和/或第四内存页。第i个基本执行单元使用的页表项包括至少一个第五页表项，该至少一个第五页表项与该至少一个第五内存页一一对应。

第i个基本执行单元使用的内存页还可能包括第六内存页，第六内存页与第二数据相对应，第二数据是存储在第一节点的磁盘中的数据，第二数据是第i个基本执行单元需要写入第六内存页但还未写入第六内存页的数据。第六内存页可能是上述某个第二内存页或第四内存页。第i个基本执行单元使用的页表项还可能包括第六页表项，第六页表项与第六内存页对应。

第一节点包括第六页表项中的第六内存页的地址与第二数据的存储位置之间的映射关系。第二数据的存储位置是第二数据在第一节点的磁盘中的位置，第二数据是第i个基本执行单元需要从第二节点的磁盘中待读取并待写入到第六内存页的数据，但第i个基本执行单元还没有将第二数据从第一节点的磁盘中读取出来并写入到第六内存页中。

第一节点会记录第六内存页的地址(第六内存页的虚拟地址和/或物理地址)与第二数据的存储位置之间的映射关系。

在第i个基本执行单元产生第二目标运行数据后，第一节点进入内核态，在运行在内核态时，在第一节点的内存中分配一个连续的第二目标区域，获取该至少一个第五页表项，将该至少一个第五页表项保存到第二目标区域中。第一节点生成与第二目标区域相对应的第二标识。

在一些实施例中，第一节点保存第二标识、第二目标区域的地址和第二目标区域的大小之间的映射关系，以实现第二标识与第二目标区域相对应。

在一些实施例中，第一节点还可能生成与第二标识相对应的第二校验信息，即第二标识与第二目标区域和第二校验信息相对应。可选地，第一节点保存第二标识、第二校验信息、第二目标区域的地址和第二目标区域的大小之间的映射关系，以实现第二标识与第二目标区域和第二校验信息相对应。

步骤310中，第一节点还可能获取第六内存页的地址与第二数据的存储位置之间的映射关系，以及获取与第六内存页相对应的第六页表项，将第六内存页的地址与第二数据的存储位置之间的映射关系，以及第六页表项保存到第二目标区域中。

在步骤310中，第一节点还可能获取第一节点的CPU运行状态，将第一节点的CPU运行状态保存到第二目标区域中。在实现时，

第一节点获取第i个基本执行单元使用的至少一个第二CPU寄存器的状态，第一节点的CPU运行状态包括该至少一个第二CPU寄存器的状态。将该至少一个第二CPU寄存器的状态保存到第二目标区域中。

在步骤310中，第一节点还可能获取第i个基本执行单元在执行过程中打开的至少一个文件的文件描述符，将该至少一个文件的文件描述符保存到第二目标区域中。

调度节点接收第二信息，调用第j个基本执行单元，第i个基本执行单元是第j个基本执行单元的前驱依赖单元，j是大于i的整数。第i个基本执行单元和第j个基本执行单元是分布式工作流中的两个基本执行单元。调度节点向第三节点发送第一节点的节点标识、第二信息和第j个基本执行单元，第三节点是调度节点调度的一个计算节点。

第三节点接收第一节点的节点标识、第二信息和第j个基本执行单元，同第一节点一样执行按上述步骤308-310的操作来执行第j个基本执行单元。

在一些实施例中，向调度节点输入多个分布式工作流，调度节点对该多个分布式工作流中的基本执行单元进行调用，并调度计算节点来处理调用的基本执行单元。由于本申请实施例，计算节点获取运行数据时节省了时间开销和内存拷贝，本申请实施例处理的分布式工作流越多产生的吞吐量越大，且大于传统方法。例如，参见图9，横坐标代表处理的分布式工作流的数量，纵坐标代表吞吐量，从图9可以得出处理相同数量的分布式工作流，本申请实施例产生的吞吐量大于传统方法产生的吞吐量。另外，参见图10，横坐标代表吞吐量，该吞吐量是每秒能处理的分布式工作流的个数，纵坐标代表时延，展示了在不同并发配置下吞吐量和时延关系。以及，参见图11，横坐标代表处理的分布式工作流数量，纵坐标代表处理分布式工作流的时延，该时延采用对数方式表示，例如，本申请实施例在处理10000个分布式工作流，对应的对数方式表示的时延为2，表示的含义为处理10000个分布式工作流所需要的时延为10 ²ms。

在本申请实施例中，第二节点在得到第一个基本执行单元产生的第一目标运行数据后，向调度节点发送第一信息，第一信息包括第一标识。第一标识与第二节点的第一目标区域相对应，第一目标区域保存有至少一个第一页表项，该至少一个第一页表项对应的至少一个第一内存页用于保存第一目标运行数据。调度节点接收第一信息，调用第i个基本执行单元，第i个基本执行单元的前驱依赖单元为第一个基本执行单元，向第一节点发送第一信息和第i个基本执行单元。第一节点基于第一标识获取第一目标区域中的至少一个第一页表项，为第i个基本执行单元分配至少一个第二页表项，该至少一个第二页表项与该至少一个第一页表项一一对应。第一节点的内存中包括至少一个第二内存页，该至少一个第二内存页与该至少一个第二页表项一一对应。在第i个基本执行单元首次读取某个第二内存页时，第一节点获取该第二内存页对应的第二页表项，获取该第二页表项对应的第一页表项，基于该第一页表项包括的第一内存页的地址，读取第二节点的该第一内存页保存的第一目标运行数据，基于第一目标运行数据执行第一基本执行单元。由于第一节点直接读取第二节点的第一内存页中保存的数据，从而节省了内存拷贝开销以及时间开销。由于在读取某个第二内存页时，才读取该第二内存页对应的第一内存页保存的数据，实现按需求读取，减小网络资源的开销。

参见图12，本申请实施例提供了一种获取数据的装置1200，所述装置1200部署在图1所示的网络架构100中的计算节点上，或者，部署在所述方法300的第一节点上。所述装置1200包括：

接收单元1201，用于接收第一标识和第二节点的节点标识，所述装置1200用于执行第一基本执行单元，第二节点用于执行第二基本执行单元，第二基本执行单元是第一基本执行单元的前驱依赖单元，第二节点的内存用于保存第二基本执行单元的运行数据，第一标识用于指示该运行数据；

处理单元1202，用于基于第一标识和该节点标识获取该运行数据的存储地址；

处理单元1202，还用于基于该存储地址，读取第二节点的内存保存的运行数据。

可选地，接收单元1201接收第一标识和第二节点的节点标识的实现过程，参见图3所示的方法300的步骤308的相关内容，在此不再详细说明。

可选地，处理单元1202获取该运行数据的存储地址的实现过程，参见图3所示的方法300的步骤308的相关内容，在此不再详细说明。

可选地，处理单元1202读取该运行数据的实现过程，参见图3所示的方法300的步骤309的相关内容，在此不再详细说明。

可选地，第二节点的内存包括至少一个第一内存页，至少一个第一内存页用于保存该运行数据，第一标识用于指示至少一个第一内存页。

可选地，处理单元1202，用于：

基于第一标识和该节点标识，获取至少一个第一内存页的地址；

为第一基本执行单元分配至少一个第二内存页，所述装置1200包括至少一个第二内存页，至少一个第二内存页与至少一个第一内存页一一对应；

获取存储地址，该存储地址为第一基本执行单元首次读取的第二内存页对应的第一内存页的地址。

可选地，处理单元1202获取至少一个第一内存页的地址的实现过程，参见图3所示的方法300的3081-3083的相关内容，在此不再详细说明。

可选地，处理单元1202为第一基本执行单元分配至少一个第二内存页的地址的实现过程，参见图3所示的方法300的3084的相关内容，在此不再详细说明。

可选地，处理单元1202，用于基于获取的第一内存页的地址，读取获取的第一内存页保存的运行数据。

可选地，处理单元1202读取运行数据的实现过程，参见图3所示的方法300的3094的相关内容，在此不再详细说明。

可选地，第二节点的内存包括目标区域，目标区域与第一标识相对应，目标区域保存有至少一个第一内存页的地址；

所述装置1200还包括发送单元1203，

发送单元1203，用于基于该节点标识向第二节点发送获取请求，该获取请求包括第一标识；

接收单元1201，还用于接收第二节点发送的获取响应，该获取响应包括第一标识对应的目标区域的地址和大小；

处理单元1202，用于基于目标区域的地址和大小，读取目标区域保存的至少一个第一内存页的地址。

可选地，发送单元1203发送获取请求的实现过程，参见图3所示的方法300的3081的相关内容，在此不再详细说明。

可选地，接收单元1201接收第二节点发送的获取响应的实现过程，参见图3所示的方法300的3082的相关内容，在此不再详细说明。

可选地，处理单元1202读取目标区域保存的至少一个第一内存页的地址的实现过程，参见图3所示的方法300的3083的相关内容，在此不再详细说明。

可选地，第二节点包括至少一个第一页表项，至少一个第一页表项与至少一个第一内存页对应，所述装置1200包括至少一个第二页表项，

处理单元1202，用于为第一基本执行单元分配至少一个第二页表项，至少一个第二页表项与至少一个第一页表项对应，至少一个第二内存页包括每个第二页表项对应的内存页。

可选地，目标区域保存有第二节点的中央处理器CPU运行状态，处理单元1202，还用于：

读取目标区域保存的第二节点的CPU运行状态；

将所述装置1200的CPU运行状态设置为第二节点的CPU运行状态。

可选地，处理单元1202读取第二节点的CPU运行状态，以及设置所述装置1200的CPU运行状态的实现过程，参见图3所示的方法300的3085的相关内容，在此不再详细说明。

可选地，第二节点的CPU运行状态包括至少一个第一CPU寄存器的状态，至少一个第一CPU寄存器是第二节点的CPU中的第二基于执行单元使用的寄存器，所述装置1200的CPU运行状态包括至少一个第二CPU寄存器的状态，至少一个第一CPU寄存器与至少一个第二CPU寄存器一一对应，至少一个第二CPU寄存器是所述装置1200的CPU中的第一基于执行单元使用的寄存器，

处理单元1202，用于：

读取目标区域保存的至少一个第一CPU寄存器的状态；

将每个第二CPU寄存器的状态分别设置为每个第二CPU寄存器对应的第一CPU寄存器的状态。

可选地，处理单元1202读取目标区域保存的至少一个第一CPU寄存器的状态的实现过程，参见图3所示的方法300的3083的相关内容，在此不再详细说明。

可选地，处理单元1202分配至少一个第二CPU寄存器以及设置每个第二CPU寄存器的状态的实现过程，参见图3所示的方法300的3085的相关内容，在此不再详细说明。

可选地，目标区域还保存有第三内存页的地址与第一数据的存储位置之间的映射关系，第二节点的内存还包括第三内存页，第一数据存储在第二节点的磁盘中，第一数据是第二基本执行单元需要写入第三内存页但还未写入到所述第三内存页的数据，所述装置1200包括与第三内存页相对应的第四内存页，处理单元1202，还用于：

读取目标区域保存的该映射关系；

在第一基本执行单元首次读取第四内存页时，基于第四内存页对应的第三内存页的地址和该映射关系，获取第一数据的存储位置；

基于该存储位置和该节点标识，获取第一数据，第一数据是所述装置1200执行第一基本执行单元使用的数据。

可选地，处理单元1202读取目标区域保存的该映射关系的实现过程，参见图3所示的方法300的3083的相关内容，在此不再详细说明。

可选地，处理单元1202获取第一数据的存储位置的实现过程，参见图3所示的方法300的3095的相关内容，在此不再详细说明。

可选地，处理单元1202获取第一数据的实现过程，参见图3所示的方法300的3096的相关内容，在此不再详细说明。

可选地，目标区域还保存有第二基本执行单元在执行时打开的至少一个文件的文件描述符，第二节点包括至少一个文件，

处理单元1202，还用于读取目标区域保存的至少一个文件的文件描述符，至少一个文件的文件描述符是所述装置1200执行第一基本执行单元使用的数据。

可选地，处理单元1202读取目标区域保存的至少一个文件的文件描述符的实现过程，参见图3所示的方法300的3083的相关内容，在此不再详细说明。

可选地，第一基本执行单元和第二基本执行单元是分布式工作流中的两个函数。

在本申请实施例中，由于接收单元接收第一标识和第二节点的节点标识以及第一标识指示第二节点的内存保存的运行数据，因此处理单元基于第一标识和第二节点的节点标识，能够获取到该运行数据的存储地址，基于该存储地址直接读取第二节点的内存保存的运行数据。由于处理单元基于该存储地址直接读取第二节点的内存保存的运行数据，从而不用将第二节点的内存保存的运行数据拷贝到文件系统，省去了内存拷贝的开销。处理单元直接读取第二节点的内存保存的运行数据的速率较高，节省了时间开销。

参见图13，本申请实施例提供了一种获取数据的装置1300，所述装置1300部署在图1所示的网络架构100中的计算节点上，或者，部署在所述方法300的第二节点上。所述装置1300包括：

处理单元1301，用于获取第一标识，所述装置1300用于执行第二基于执行单元，第一标识用于指示所述装置1300的内存中保存的第二基本执行单元的运行数据；

发送单元1302，用于发送第一标识，第一标识用于触发第一节点获取运行数据的存储地址，以及基于存储地址读取所述装置1300的内存保存的运行数据，第一节点用于执行第一基本执行单元，第二基本执行单元是第一基本执行单元的前驱依赖单元。

可选地，处理单元1301获取第一标识的实现过程，参见图3所示的方法300的304的相关内容，在此不再详细说明。

可选地，发送单元1302发送第一标识的实现过程，参见图3所示的方法300的305的相关内容，在此不再详细说明。

可选地，所述装置1300的内存包括至少一个第一内存页，至少一个第一内存页用于保存运行数据，第一标识用于指示至少一个第一内存页。

可选地，所述装置1300的内存包括目标区域，目标区域与第一标识相对应，所述装置1300还包括接收单元1303，

处理单元1301，用于向目标区域保存至少一个第一内存页的地址；

接收单元1303，用于接收第一节点发送的获取请求，该获取请求包括第一标识；

发送单元1302，还用于向第一节点发送获取响应，该获取响应包括第一标识对应的目标区域的地址和大小，获取响应用于触发第一节点基于目标区域的地址和大小，读取目标区域保存的至少一个第一内存页的地址。

可选地，处理单元1301向目标区域保存至少一个第一内存页的地址的实现过程，参见图3所示的方法300的304的相关内容，在此不再详细说明。

可选地，接收单元1303接收获取请求的实现过程，参见图3所示的方法300的3082的相关内容，在此不再详细说明。

可选地，发送单元1302发送获取响应的实现过程，参见图3所示的方法300的3082的相关内容，在此不再详细说明。

可选地，处理单元1301，还用于向该目标区域保存所述装置1300的CPU运行状态，以使第一节点读取该目标区域保存的CPU运行状态。

可选地，处理单元1301向目标区域保存CPU运行状态的实现过程，参见图3所示的方法300的304的相关内容，在此不再详细说明。

可选地，所述装置1300的CPU包括第二基于执行单元使用的至少一个第一中央处理器CPU寄存器，该CPU运行状态包括至少一个第一CPU寄存器的状态。

可选地，处理单元1301，还用于：

向该目标区域保存第三内存页的地址与第一数据的存储位置之间的映射关系，所述装置1300的内存还包括第三内存页，第一数据存储在所述装置1300的磁盘中，第一数据是第二基本执行单元需要写入第三内存页但还未写入到第三内存页的数据，以使第一节点读取该目标区域保存的该映射关系。

可选地，处理单元1301向该目标区域保存该映射关系的实现过程，参见图3所示的方法300的304的相关内容，在此不再详细说明。

可选地，处理单元1301，还用于：

向该目标区域保存第二基本执行单元在执行时打开的至少一个文件的文件描述符，所述装置1300包括该至少一个文件，以使第一节点读取该目标区域保存的该至少一个文件的文件描述符。

可选地，处理单元1301向该目标区域保存该至少一个文件的文件描述符的实现过程，参见图3所示的方法300的304的相关内容，在此不再详细说明。

在本申请实施例中，由于处理单元获取的第一标识指示第二节点的内存保存的运行数据，发送单元发送第一标识，这样第一节点基于第一标识能够获取到该运行数据的存储地址，基于该存储地址直接读取第二节点的内存保存的运行数据。由于第一节点基于该存储地址直接读取第二节点的内存保存的运行数据，从而不用将所述装置的内存保存的运行数据拷贝到文件系统，省去了内存拷贝的开销。第一节点直接读取所述装置的内存保存的运行数据的速率较高，节省了时间开销。

参见图14，本申请实施例提供了一种获取数据的装置1400，所述装置1400部署在图1所示的网络架构100中的调度节点上，或者，部署在所述方法300的调度节点上。所述装置1400包括：

接收单元1401，用于接收第二节点发送的第一标识，第二节点用于执行第二基于执行单元，第二节点的内存用于保存第二基本执行单元的运行数据，第一标识用于指示该运行数据；

发送单元1402，用于向第一节点发送第一标识和第二节点的节点标识，第一节点用于执行第一基本执行单元，第二基本执行单元是第一基本执行单元的前驱依赖单元，第一标识和该节点标识用于触发第一节点获取该运行数据的存储地址，以及基于该存储地址读取第二节点的内存保存的运行数据。

可选地，接收单元1401接收第一标识的实现过程，参见图3所示的方法300的306的相关内容，在此不再详细说明。

可选地，发送单元1402发送第一标识和第二节点的节点标识的实现过程，参见图3所示的方法300的307的相关内容，在此不再详细说明。

可选地，第一基本执行单元和第二基本执行单元是分布式工作流中两个的函数。

在本申请实施例中，由于第一标识指示第二节点的内存保存的运行数据，发送单元向第一节点发送第一标识和第二节点的节点标识，因此第一节点基于第一标识和第二节点的节点标识，能够获取到该运行数据的存储地址，基于该存储地址直接读取第二节点的内存保存的运行数据。由于第一节点基于该存储地址直接读取第二节点的内存保存的运行数据，从而第二节点不用将第二节点的内存保存的运行数据拷贝到文件系统，省去了内存拷贝的开销。第一节点直接读取第二节点的内存保存的运行数据的速率较高，节省了时间开销。

参见图15，本申请实施例提供了一种设备1500示意图。该设备1500可以是上述任意实施例中的第一节点、第二节点或调度节点。例如该设备1500可以是上述图1所示网络架构100中的调度节点或计算节点，或者，是上述图3所示方法300中的第一节点、第二节点或调度节点。该设备1500包括至少一个处理器1501，内部连接1502，存储器1503以及至少一个收发器1504。

该设备1500是一种硬件结构的装置。

在一些实施例中，可以用于实现图12所述的装置1200中的功能模块。例如，本领域技术人员可以想到图12所示的装置1200中的处理单元1202可以通过该至少一个处理器1501调用存储器1503中的代码来实现。图12所示的装置1200中的接收单元1201和发送单元1203可以通过该至少一个收发器1504来实现。所述设备1500还可以用于实现上述任一实施例中第一节点的功能。

在一些实施例中，可以用于实现图13所述的装置1300中的功能模块。例如，本领域技术人员可以想到图13所示的装置1300中的处理单元1201可以通过该至少一个处理器1501调用存储器1503中的代码来实现。图13所示的装置1200中的发送单元1302和接收单元1303 可以通过该至少一个收发器1504来实现。所述设备1500还可以用于实现上述任一实施例中第二节点的功能。

在一些实施例中，可以用于实现图14所述的装置1400中的功能模块。例如，本领域技术人员可以想到图14所示的装置1400中的接收单元1401和发送单元1402可以通过该至少一个收发器1504来实现。所述设备1500还可以用于实现上述任一实施例中调度节点的功能。

可选的，上述处理器1501可以是一个通用中央处理器(central processing unit，CPU)，网络处理器(network processor，NP)，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制本申请方案程序执行的集成电路。

上述内部连接1502可包括一通路，在上述组件之间传送信息。可选的，内部连接1502为单板或总线等。

上述收发器1504，用于与其他设备或通信网络通信。

上述存储器1503可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory，EEPROM)、只读光盘(compact disc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线与处理器相连接。存储器也可以和处理器集成在一起。

其中，存储器1503用于存储执行本申请方案的应用程序代码，并由处理器1501来控制执行。处理器1501用于执行存储器1503中存储的应用程序代码，以及配合至少一个收发器1504，从而使得该设备1500实现本专利方法中的功能。

在具体实现中，作为一种实施例，处理器1501可以包括一个或多个CPU，例如图15中的CPU0和CPU1。

在具体实现中，作为一种实施例，该设备1500可以包括多个处理器，例如图15中的处理器1501和处理器1507。这些处理器中的每一个可以是一个单核(single-CPU)处理器，也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。

参见图16，本申请实施例提供了一种获取数据的系统1600，所述系统1600包括如图12所示的装置1200，如图13所示的装置1300和如图14所示的装置1400。如图12所示的装置可以为第一节点1601，如图13所示的装置1300可以为第二节点1602，如图14所示的装置1400可以为调度节点1603。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种获取数据的方法，其特征在于，所述方法包括：

第一节点接收第一标识和第二节点的节点标识，所述第一节点用于执行第一基本执行单元，所述第二节点用于执行第二基本执行单元，所述第二基本执行单元是所述第一基本执行单元的前驱依赖单元，所述第二节点的内存用于保存所述第二基本执行单元的运行数据，所述第一标识用于指示所述运行数据；

所述第一节点基于所述第一标识和所述节点标识获取所述运行数据的存储地址；

所述第一节点基于所述存储地址，读取所述第二节点的内存保存的运行数据。
如权利要求1所述的方法，其特征在于，所述第二节点的内存包括至少一个第一内存页，所述至少一个第一内存页用于保存所述运行数据，所述第一标识用于指示所述至少一个第一内存页。
如权利要求2所述的方法，其特征在于，所述第一节点基于所述第一标识和所述节点标识获取所述运行数据的存储地址，包括：

所述第一节点基于所述第一标识和所述节点标识，获取所述至少一个第一内存页的地址；

所述第一节点为所述第一基本执行单元分配至少一个第二内存页，所述第一节点包括所述至少一个第二内存页，所述至少一个第二内存页与所述至少一个第一内存页对应；

所述第一节点获取所述存储地址，所述存储地址为所述第一基本执行单元首次读取的第二内存页对应的第一内存页的地址。
如权利要求3所述的方法，其特征在于，所述第二节点包括至少一个第一页表项，所述至少一个第一页表项与所述至少一个第一内存页对应，所述第一节点包括至少一个第二页表项，所述第一节点为所述第一基本执行单元分配至少一个第二内存页，包括：

所述第一节点为所述第一基本执行单元分配所述至少一个第二页表项，所述至少一个第二页表项与所述至少一个第一页表项对应，所述至少一个第二内存页包括每个第二页表项对应的内存页。
如权利要求1-4任一项所述的方法，其特征在于，所述第二节点的内存包括目标区域，所述目标区域保存有所述第二节点的中央处理器CPU运行状态，所述方法还包括：

所述第一节点读取所述目标区域保存的所述第二节点的CPU运行状态；

所述第一节点将所述第一节点的CPU运行状态设置为所述第二节点的CPU运行状态。
如权利要求5所述的方法，其特征在于，所述目标区域还保存有第三内存页的地址与第一数据的存储位置之间的映射关系，所述第二节点的内存还包括所述第三内存页，所述第一数据存储在所述第二节点的磁盘中，所述第一数据是所述第二基本执行单元需要写入所述第三内存页但还未写入到所述第三内存页的数据，所述第一节点包括与所述第三内存页相对应的第四内存页，所述方法还包括：

所述第一节点读取所述目标区域保存的所述映射关系；

所述第一节点在所述第一基本执行单元首次读取所述第四内存页时，基于所述第四内存页对应的所述第三内存页的地址和所述映射关系，获取所述第一数据的存储位置；

所述第一节点基于所述存储位置和所述节点标识，获取所述第一数据，所述第一数据是所述第一节点执行所述第一基本执行单元使用的数据。
如权利要求5或6所述的方法，其特征在于，所述目标区域还保存有所述第二基本执行单元在执行时打开的至少一个文件的文件描述符，所述第二节点包括所述至少一个文件，所述方法还包括：

所述第一节点读取所述目标区域保存的所述至少一个文件的文件描述符，所述至少一个文件的文件描述符是所述第一节点执行所述第一基本执行单元使用的数据。
一种获取数据的方法，其特征在于，所述方法包括：

第二节点获取第一标识，所述第二节点用于执行第二基于执行单元，所述第一标识用于指示所述第二节点的内存中保存的所述第二基本执行单元的运行数据；

所述第二节点发送第一标识，所述第一标识用于触发第一节点获取所述运行数据的存储地址，以及基于所述存储地址读取所述第二节点的内存保存的运行数据，所述第一节点用于执行第一基本执行单元，所述第二基本执行单元是所述第一基本执行单元的前驱依赖单元。
如权利要求8所述的方法，其特征在于，所述第二节点的内存包括至少一个第一内存页，所述至少一个第一内存页用于保存所述运行数据，所述第一标识用于指示所述至少一个第一内存页。
如权利要求8或9所述的方法，其特征在于，所述第二节点的内存包括目标区域，所述方法还包括：

所述第二节点向所述目标区域保存所述第二节点的中央处理器CPU运行状态，以使所述第一节点读取所述目标区域保存的所述CPU运行状态。
如权利要求10所述的方法，其特征在于，所述方法还包括：

所述第二节点向所述目标区域保存第三内存页的地址与第一数据的存储位置之间的映射关系，所述第二节点的内存还包括所述第三内存页，所述第一数据存储在所述第二节点的磁盘中，所述第一数据是所述第二基本执行单元需要写入所述第三内存页但还未写入到所述第三内存页的数据，以使所述第一节点读取所述目标区域保存的所述映射关系。
如权利要求10或11所述的方法，其特征在于，所述方法还包括：

所述第二节点向所述目标区域保存所述第二基本执行单元在执行时打开的至少一个文件的文件描述符，所述第二节点包括所述至少一个文件，以使所述第一节点读取所述目标区域保存的所述至少一个文件的文件描述符。
一种获取数据的装置，其特征在于，所述装置包括：

接收单元，用于接收第一标识和第二节点的节点标识，所述装置用于执行第一基本执行单元，所述第二节点用于执行第二基本执行单元，所述第二基本执行单元是所述第一基本执行单元的前驱依赖单元，所述第二节点的内存用于保存所述第二基本执行单元的运行数据，所述第一标识用于指示所述运行数据；

处理单元，用于基于所述第一标识和所述节点标识获取所述运行数据的存储地址；

所述处理单元，还用于基于所述存储地址，读取所述第二节点的内存保存的运行数据。
如权利要求13所述的装置，其特征在于，所述第二节点的内存包括至少一个第一内存页，所述至少一个第一内存页用于保存所述运行数据，所述第一标识用于指示所述至少一个第一内存页。
如权利要求14所述的装置，其特征在于，所述处理单元，用于：

基于所述第一标识和所述节点标识，获取所述至少一个第一内存页的地址；

为所述第一基本执行单元分配至少一个第二内存页，所述装置包括所述至少一个第二内存页，所述至少一个第二内存页与所述至少一个第一内存页对应；

获取所述存储地址，所述存储地址为所述第一基本执行单元首次读取的第二内存页对应的第一内存页的地址。
如权利要求15所述的装置，其特征在于，所述第二节点包括至少一个第一页表项，所述至少一个第一页表项与所述至少一个第一内存页对应，所述装置包括至少一个第二页表项，

所述处理单元，用于为所述第一基本执行单元分配所述至少一个第二页表项，所述至少一个第二页表项与所述至少一个第一页表项对应，所述至少一个第二内存页包括每个第二页表项对应的内存页。
如权利要求13-16任一项所述的装置，其特征在于，所述第二节点的内存包括目标区域，所述目标区域保存有所述第二节点的中央处理器CPU运行状态，所述处理单元，还用于：

读取所述目标区域保存的所述第二节点的CPU运行状态；

将所述装置的CPU运行状态设置为所述第二节点的CPU运行状态。
如权利要求17所述的装置，其特征在于，所述目标区域还保存有第三内存页的地址与第一数据的存储位置之间的映射关系，所述第二节点的内存还包括所述第三内存页，所述第一数据存储在所述第二节点的磁盘中，所述第一数据是所述第二基本执行单元需要写入所述第三内存页但还未写入到所述第三内存页的数据，所述装置包括与所述第三内存页相对应的第四内存页，所述处理单元，还用于：

读取所述目标区域保存的所述映射关系；

在所述第一基本执行单元首次读取所述第四内存页时，基于所述第四内存页对应的所述第三内存页的地址和所述映射关系，获取所述第一数据的存储位置；

基于所述存储位置和所述节点标识，获取所述第一数据，所述第一数据是所述装置执行所述第一基本执行单元使用的数据。
如权利要求17或18所述的装置，其特征在于，所述目标区域还保存有所述第二基本执行单元在执行时打开的至少一个文件的文件描述符，所述第二节点包括所述至少一个文件，所述处理单元，还用于读取所述目标区域保存的所述至少一个文件的文件描述符，所述至少一个文件的文件描述符是所述第一节点执行所述第一基本执行单元使用的数据。
一种获取数据的装置，其特征在于，所述装置包括：

处理单元，用于获取第一标识，所述装置用于执行第二基于执行单元，所述第一标识用于指示所述装置的内存中保存的所述第二基本执行单元的运行数据；

发送单元，用于发送第一标识，所述第一标识用于触发第一节点获取所述运行数据的存储地址，以及基于所述存储地址读取所述装置的内存保存的运行数据，所述第一节点用于执行第一基本执行单元，所述第二基本执行单元是所述第一基本执行单元的前驱依赖单元。
如权利要求20所述的装置，其特征在于，所述装置的内存包括至少一个第一内存页，所述至少一个第一内存页用于保存所述运行数据，所述第一标识用于指示所述至少一个第一内存页。
如权利要求20或21所述的装置，其特征在于，所述装置的内存包括目标区域，所述处理单元，还用于向所述目标区域保存所述装置的中央处理器CPU运行状态，以使所述第一节点读取所述目标区域保存的所述CPU运行状态。
如权利要求22所述的装置，其特征在于，所述处理单元，还用于：

向所述目标区域保存第三内存页的地址与第一数据的存储位置之间的映射关系，所述装置的内存还包括所述第三内存页，所述第一数据存储在所述装置的磁盘中，所述第一数据是所述第二基本执行单元需要写入所述第三内存页但还未写入到所述第三内存页的数据，以使所述第一节点读取所述目标区域保存的所述映射关系。
如权利要求22或23所述的装置，其特征在于，所述处理单元，还用于：

向所述目标区域保存所述第二基本执行单元在执行时打开的至少一个文件的文件描述符，所述装置包括所述至少一个文件，以使所述第一节点读取所述目标区域保存的所述至少一个文件的文件描述符。
一种第一节点，其特征在于，包括至少一个处理器，所述至少一个处理器用于与存储器耦合，读取并执行所述存储器中的指令，以实现如权利要求1-7任一项所述的方法。
一种第二节点，其特征在于，包括至少一个处理器，所述至少一个处理器用于与存储器耦合，读取并执行所述存储器中的指令，以实现如权利要求8-12任一项所述的方法。
一种获取数据的系统，其特征在于，所述系统包括如权利要求13-19任一项所述的装置和如权利要求20-24任一项所述的装置，或者，所述系统包括如权利要求25所述的第一节点和如权利要求26所述的第二节点。
一种计算机存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1-12任一项所述的方法。
一种计算机程序产品，其包括计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1-12任一项所述的方法。