WO2020078044A1

WO2020078044A1 - 数据处理的方法、装置和计算设备

Info

Publication number: WO2020078044A1
Application number: PCT/CN2019/094203
Authority: WO
Inventors: 倪小珂; 陈锦鹏; 蓝昊
Original assignee: 华为技术有限公司
Priority date: 2018-10-19
Filing date: 2019-07-01
Publication date: 2020-04-23
Also published as: CN109547531A; EP3855704A1; CN109547531B; EP3855704A4; US20210232437A1

Abstract

本申请提供了一种数据处理的方法，包括：第一计算设备接收第二计算设备发送的第一报文，第一计算设备用于协助第二计算设备执行业务处理，第一计算设备是异构资源池中的计算设备，其与第二计算设备通过网络进行通信，异构资源池中包括至少一个第一计算设备，第一报文包括用于请求第一计算设备对待处理数据进行处理的指令，第一计算设备根据该指令，执行对该待处理数据的处理，并向第二计算设备发送第二报文，第二报文包括该待处理数据的处理结果。该方法能够提高服务器或虚拟机与异构服务器之间的通信性能。

Description

数据处理的方法、装置和计算设备

技术领域

本申请涉及信息技术领域，并且更具体地，涉及数据处理的方法、装置和计算设备。

背景技术

随着服务器领域的发展，相较于仅设置中央处理器(central processing unit，CPU)的普通服务器外，出现一种异构服务器。异构服务器是指同一服务器内除设置CPU外，还可以包括其他异构资源。其中，异构资源包括图形处理器(graphics processing unit，GPU)、现场可编程门阵列(field-programmable gate array，FPGA)、集成电路(application specific integrated circuit，ASIC)与神经网络处理单元(neural processing unit，NPU)。

异构服务器往往用于辅助普通服务器或普通服务器上运行的虚拟机进行数据处理。每个异构资源往往是被一个普通服务器或者一个虚拟机(virtual machine，VM)独占，例如，对于某一个异构资源而言，其往往是与某个特定的服务器或VM绑定，仅用于处理该服务器或虚拟机的指令。虚拟机或服务器上运行不同类型的应用程序，在虚拟机和异构资源的通信过程中，或者服务器和异构资源的通信过程中，都会产生较大网络流量，使虚拟机或服务器与异构服务器之间通信成为瓶颈，影响普通计算设备与异构计算设备之间的数据处理速度和效率。

发明内容

本申请提供一种数据处理的方法，该方法能够提高服务器或虚拟机与异构服务器之间的通信性能。

第一方面，提供了一种数据处理的方法，包括：第一计算设备接收第二计算设备发送的第一报文，第一计算设备用于协助第二计算设备执行业务处理，第一计算设备是异构资源池中的计算设备，其与第二计算设备通过网络进行通信，异构资源池中包括至少一个第一计算设备第一报文包括用于请求第一计算设备对待处理数据进行处理的指令，第一计算设备根据该指令，执行对该待处理数据的处理，并向第二计算设备发送第二报文，第二报文包括该待处理数据的处理结果。

通过将多个计算设备(例如，多个第一计算设备)组成异构资源池，使得当多个第二计算设备同时需要异构资源协助其执行业务请求时，可以将多个第二计算设备的请求分散在异构资源池中不同计算设备，使得异构资源池中的多个第一计算设备能够分别协助多个第二计算设备执行相应的业务请求，从而将第二计算设备与异构资源通信时产生的网络流量分散在异构资源池中不同计算设备之间，进而提高第二计算设备与异构资源之间的通信性能。

在一种可能的实现方式中，第一计算设备接收的第二计算设备发送的第一报文中包括待处理数据，第一计算设备对接收到的第一报文进行解析，获取待处理数据，并根据第一报文携带的指令，对待处理数据进行处理。

当待处理数据的传输不至于影响第一计算设备与第二计算设备之间的通信性能时，第二计算设备可以直接向第一计算设备发送携带有待处理数据的第一报文，降低第一计算设备与第二计算设备之间通信的时延。

在另一种可能的实现方式中，第二计算设备在存储设备中配置有第一存储资源，第一计算设备同样具有第一存储资源的访问权限，第二计算设备可以仅向第一计算设备发送携带有第一目标地址的第一报文，第一目标地址用于指示待处理数据在第一存储资源中的存储地址，其中，第一存储资源是为第二计算设备配置的拥有访问权限的存储资源，第一计算设备根据接收到的第一报文，从第一报文中获取第一目标地址，从而从第一存储资源中的第一目标地址对应的存储空间中获取待处理数据。

当待处理数据的传输过程会影响第一计算设备与第二计算设备之间的通信性能时，第二计算设备可以将待处理数据存储至第一存储资源中第一目标地址对应的存储空间，并在向第一计算设备发送的第一报文中携带第一目标地址，以使第一计算设备从第一存储资源中第一目标地址对应的存储空间获取待处理数据，避免向第一计算设备直接发送待处理数据，从而提高第一计算设备与第二计算设备之间的通信性能。

在另一种可能的实现方式中，第一计算设备在获得了待处理数据的处理结果后，可以向第二计算设备发送第二报文，第二报文中包括待处理数据的处理结果。

在另一种可能的实现方式中，第一计算设备在获得了待处理数据的处理结果后，可以将待处理数据的处理结果存储至第一存储资源中第二目标地址对应的存储空间，并将第二目标地址携带在第二报文中发送至第二计算设备，第二计算设备根据接收到的第二报文，从第二报文中获取第二目标地址，从而从第一存储资源中的第二目标地址对应的存储空间中获取待处理数据的处理结果。

当待处理数据的处理结果的传输过程可能会影响第一计算设备与第二计算设备之间的通信性能时，第一计算设备可以将待处理数据存储至第一存储资源中第二目标地址对应的存储空间，并在向第二计算设备发送的第二报文中携带第二目标地址，以使第二计算设备从第一存储资源中第二目标地址对应的存储空间获取待处理数据的处理结果，避免向第二计算设备直接发送待处理数据的处理结果，从而提高第一计算设备与第二计算设备之间的通信性能。

在另一种可能的实现方式中，当待处理数据为视频码流数据时，第一计算设备在对视频码流数据进行处理时，首先需要对该视频码流数据进行解码，获得该视频码流数据对应的图像数据，再根据第一报文携带的指令，对该视频码流数据对应的图像数据进行处理，得到视频码流数据对应的待处理数据的处理结果。

在另一种可能的实现方式中，当待处理数据为视频码流数据时，第一计算设备向计算设第二计算设备返回的待处理数据的处理结果中还应该包括对视频码流数据解码后获得的视频码流数据对应的图像数据。

在另一种可能的实现方式中，当待处理数据的处理结果由第一计算设备直接发送至第二计算设备时，待处理数据的处理结果可以由第一计算设备使用远程数据存取(remote direct memory access，RDMA)方式发送至第二计算设备。

在另一种可能的实现方式中，当待处理数据由第二计算设备直接发送至第一计算设备时，待处理数据可以由第二计算设备中使用RDMA方式发送至第一计算设备。

在另一种可能的实现方式中，配置有该第一存储资源的存储设备包括文件系统存储设备、分布式文件系统存储设备、块存储设备或对象存储设备。

在另一种可能的实现方式中，该指令对应的处理包括人工智能(artificial intelligence，AI)处理。

第二方面，提供了一种数据处理的方法，包括：第二计算设备向第一计算设备发送第一报文，第一计算设备用于协助第二计算设备执行业务处理，第一计算设备是异构资源池中的计算设备，其与第二计算设备通过网络进行通信，异构资源池中包括至少一个第一计算设备，第一报文包括用于请求第一计算设备对待处理数据进行处理的指令，第一计算设备根据该指令，执行对该待处理数据的处理，并向第二计算设备发送第二报文，第二报文包括该待处理数据的处理结果，第二计算设备接收第一计算设备发送的第二报文，第二报文包括该待处理数据的处理结果。

通过将多个计算设备(例如，多个第一计算设备)组成异构资源池，使得当多个第二计算设备同时需要异构资源协助其执行业务处理时，可以将多个第二计算设备的请求协助执行业务请求的需求分散在异构资源池中不同计算设备，使得异构资源池中的多个第一计算设备能够分别协助多个第二计算设备执行相应的业务处理，从而将第二计算设备与异构资源通信时产生的网络流量分散在异构资源池中不同计算设备，提高第二计算设备与异构资源之间的通信性能。

在一种可能的实现方式中，第二计算设备向第一计算设备发送的第一报文中包括待处理数据，第一计算设备对接收到的第一报文进行解析，获取待处理数据，并根据第一报文携带的指令，对待处理数据进行处理。

当待处理数据的传输不至于影响第一计算设备与第二计算设备之间的通信性能时，第二计算设备可以直接向第一计算设备发送携带有待处理数据的第一报文，从而降低第一计算设备与第二计算设备之间通信的时延。

在另一种可能的实现方式中，第二计算设备在存储设备中配置有第一存储资源，第一计算设备同样具有第一存储资源的访问权限，第二计算设备在第一报文中携带有第一目标地址，第一目标地址用于指示待处理数据在第一存储资源中的存储地址，其中，第一存储资源是为第二计算设备配置的拥有访问权限的存储资源，第一计算设备根据接收到的第一报文，从第一报文中获取第一目标地址，从而从第一存储资源中的第一目标地址对应的存储空间中获取待处理数据。

当待处理数据的传输可能会影响第一计算设备与第二计算设备之间的通信性能时，第二计算设备可以将待处理数据存储至第一存储资源中第一目标地址对应的存储空间，并在向第一计算设备发送的第一报文中携带第一目标地址，以使第一计算设备从第一存储资源中第一目标地址对应的存储空间获取待处理数据，避免向第一计算设备直接发送待处理数据，从而提高第一计算设备与第二计算设备之间的通信性能。

在另一种可能的实现方式中，第二计算设备接收到的第一计算设备发送的第二报文中包括待处理数据的处理结果。

当待处理数据的处理结果的传输不至于影响第一计算设备与第二计算设备之间的通信性能时，第一计算设备可以直接向第二计算设备发送携带有待处理数据的处理结果第二报文，从而降低第一计算设备与第二计算设备之间通信的时延。

当待处理数据的处理结果的传输可能会影响第一计算设备与第二计算设备之间的通信性能时，第一计算设备可以将待处理数据存储至第一存储资源中第二目标地址对应的存储空间，并在向第二计算设备发送的第二报文中携带第二目标地址，以使第二计算设备从第一存储资源中第二目标地址对应的存储空间获取待处理数据的处理结果，避免向第二计算设备直接发送待处理数据的处理结果，从而提高第一计算设备与第二计算设备之间的通信性能。

在另一种可能的实现方式中，该指令对应的处理包括人工智能AI处理。

第三方面，提供一种数据处理的装置，该装置用于执行上述第一方面或第一方面的任一可能的实现方式中的方法。具体地，该装置可以包括用于执行第一方面或第一方面的任一可能的实现方式中数据处理的方法的单元。

第四方面，提供一种数据处理的装置，该装置用于执行上述第二方面或第二方面的任一可能的实现方式中的方法。具体地，该装置可以包括用于执行第二方面或第二方面的任一可能的实现方式中数据处理的方法的单元。

第五方面，提供一种计算设备，该设备包括存储器、异构资源与处理器。该存储器用于存储程序，该处理器，用于执行该存储器中存储的程序，调度该异构资源执行第一方面或第一方面的任一可能的实现方式中数据处理的方法。

第六方面，提供一种计算设备，该设备包括存储器和处理器。该存储器用于存储指令；该处理器执行该存储器存储的指令，使得该设备执行第二方面或第二方面的任一可能的实现方式中数据处理的方法。

第七方面，提供一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当该指令在计算机上运行时，使得计算机执行第一方面或第一方面的任一可能的实现方式中数据处理的方法。

第八方面，提供一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当该指令在计算机上运行时，使得计算机执行第二方面或第二方面的任一可能的实现方式中数据处理的方法。

第九方面，提供一种包含指令的计算机程序产品，当该指令在计算机上运行时，使得计算机执行第一方面或第一方面的任一可能的实现方式中数据处理的方法。

第十方面，提供一种包含指令的计算机程序产品，当该指令在计算机上运行时，使得计算机执行第二方面或第二方面的任一可能的实现方式中数据处理的方法。

第十一方面，提供一种计算机系统，该计算机系统包括第一计算设备与第二计算设备，第一计算设备用于协助第二计算设备执行业务处理，第一计算设备是异构资源池中的计算设备，其与第二计算设备通过网络进行通信，异构资源池中包括至少一个第一计算设备，第二计算设备在存储设备中配置有第一存储资源，第一计算设备同样具有第一存储资源的访问权限，第一计算设备用于执行上述第一方面或第一方面的任一可能的实现方式中的方法，第二计算设备用于执行上述第二方面或第二方面的任一可能的实现方式中的方法。

本申请在上述各方面提供的实现方式的基础上，还可以进行进一步组合以提供更多实现方式。

附图说明

图1是本申请提供的一种计算机系统100的架构示意图。

图2是本申请提供的另一种计算机系统100的架构示意图。

图3是本申请提供的一种数据处理的方法200的流程图示意图。

图4为本申请的数据处理的装置300的结构示意图。

图5为本申请提供的一种数据处理的装置400的结构示意图。

图6为本申请提供的一种计算设备500的结构示意图。

具体实施方式

下面将结合附图，对本申请中的技术方案进行描述。

图1为本申请提供的一种计算机系统架构的示意图。如图1所示，计算机系统100包括至少一个计算设备101、至少一个计算设备102以及存储设备103。其中，计算设备101与计算设备102之间通过网络进行通信。计算设备101、计算设备102分别与存储设备103通过网络进行通信。存储设备103中包括多个存储单元。网络包括以太网、光纤、无线带宽(infiniband，IB)、无线等设备连接方式。

在本申请中，计算设备101用于协助计算设备102进行业务处理。计算设备102可以为服务器，该服务器上可以配置有中央处理器(central processing unit，CPU)1021。计算设备101具体实现时也可以为服务器，除了配置CPU外，还可以配置有图形处理器GPU、现场可编程门阵列FPGA、集成电路ASIC或神经网络处理单元NPU中的至少一种。此时，同一服务器中即配置有CPU，又配置有GPU、FPGA、ASIC或NPU中的至少一种的服务器中称为异构服务器，多个异构服务器共同构成异构资源池。其中，服务器中的GPU、FPGA、ASIC或NPU用于协助计算设备102中CPU1011执行业务处理。

为便于描述，本申请的以下描述中以计算设备101中包括GPU的异构服务器为例进行描述。

计算设备101在协助计算设备102执行业务处理时，可以配置计算设备101和计算设备102之间的绑定关系。也就是说，在异构资源池中可以选择一个或多个计算设备101用于处理执行指定计算设备102的业务。其中，对于同一个计算设备101而言，其包括的多个GPU可以仅用于处理同一个计算设备102的业务，也可以处理多个计算设备102的业务，本申请不限定。当计算设备101和某一个计算设备102建立绑定关系时，该计算设备101具有与其绑定的计算设备102能够访问的存储单元的访问权限。例如，当一个计算设备101与一个计算设备102建立绑定关系时，该计算设备101具有该计算设备102能够访问的存储单元的访问权限。

具体地，在计算设备101协助计算设备102执行业务处理之前，会在异构资源池中为计算设备102分配异构资源。例如，计算设备102向异构资源池中的某一个计算设备101发送初始化报文，该计算设备101负责对异构资源池中的异构资源进行管理(以下简称为“管理计算设备”)，初始化报文用于请求管理计算设备为计算设备102分配异构资源，初始化报文中可以携带有计算设备102请求为其分配的GPU的数量。

管理计算设备根据该初始化报文，在异构资源池中确定为计算设备102分配满足该数量的GPU，并在计算设备101上为分配给计算设备102的GPU建立容器，将该容器的标识反馈给计算设备102。至此，计算设备102便与为其分配的异构资源之间建立了绑定关系。其中，该容器的标识可以为容器的ID或容器的IP地址。

异构资源分配完成之后，还需要在存储设备103上为该异构资源对应的容器创建与计算设备102同等的访问权限，访问权限配置完成之后，分配给计算设备102的异构资源具有与其绑定的计算设备102能够访问的存储单元的访问权限。

需要说明的是，上述仅以异构资源池中仅存在一个管理计算设备为例进行说明，本申请并不限定于此。例如，异构资源池中的任意一个计算设备101均可以作为上述的管理计算设备，计算设备102在请求为其分配异构资源时，可以将初始化报文发送至异构资源池中的任意一个计算设备101(即，管理计算设备)，由该管理计算设备为计算设备102分配异构资源。

还需要说明的是，上述的对异构资源池的管理方式并不构成对本申请技术方案的限定，除上述的管理方式外，异构资源池还可以采用其他方式进行管理，例如，由一台非异构资源池中计算设备对该异构资源池中计算设备进行管理。

图2为本申请实施例提供的另一种计算机系统架构的示意图。如图所示，计算设备102中还可以在CPU1011上运行一个或多个虚拟机(virtual machine，VM)，其中，多个VM可以运行在一个CPU1021中，或者，该多个VM可以分布在多个CPU1021中。

计算设备101在协助计算设备102执行业务处理时，可以配置VM和计算设备101之间的绑定关系。也就是说，在异构资源池中可以选择一个或多个计算设备101用于处理执行VM的业务。其中，对于同一个计算设备101而言，其包括的多个GPU可以仅用于处理同一个VM的业务，也可以处理多个VM的业务，本申请不限定。当计算设备101和某一个VM建立绑定关系时，该计算设备101具有与其绑定的VM能够访问的存储单元的访问权限。例如，当VM1与一个计算设备101建立绑定关系时，该计算设备101具有VM1的存储单元的访问权限。

需要说明的是，当计算设备101协助计算设备102中的VM执行业务处理时，同样需要在异构资源池中为VM分配异构资源，并需要在存储设备103上为该异构资源创建与VM该同等的访问权限。

关于在异构资源池中为VM分配异构资源与在存储设备103上为分配给VM的异构资源创建与VM同等的访问权限的方法参照上述相关描述，为了简洁，此处不再赘述。

本申请中的存储设备103包括文件系统存储设备、分布式文件存储设备、块存储设备或对象存储设备。

作为一种可能的实施例，计算设备102除了配置CPU外，还可以配置有GPU、FPGA、ASIC或NPU中的至少一种(图1与图2中未示出)。此时，异构资源池的GPU资源也可以来自计算设备101。计算设备101中的CPU1021中还可以运行有一个或多个VM。本申请对此不作特别限定。

值得说明的是，图1和图2中每个计算设备102中CPU和VM的数量、每个CPU中包括的处理器核数，以及计算设备101中CPU和GPU的数量并不构成对本申请的限制。

下面以图2中所示的计算机系统为例，对本申请提供的数据处理的方法200进行说明。图3为本申请提供的一种数据处理的方法的流程示意图。为便于描述，本申请以图2中计算设备101为第一计算设备，计算设备102为第二计算设备，计算设备102上运行有虚拟机，计算设备101协助虚拟机执行业务处理为例介绍本申请提供的数据处理的方法。如图所示，方法200包括：

S201，第二计算设备向第一计算设备发送第一报文。

具体地，当第二计算设备(例如，计算设备102或计算设备102中运行的虚拟机)需要异构资源池中的第一计算设备(例如，计算设备101)协助执行业务处理时，计算设备102向与其存在绑定关系的计算设备101发送请求协助执行业务处理的报文(例如，第一报文)，该第一报文中包括用于请求计算设备102对待处理处理进行处理的指令。

例如，当计算设备102中运行的某个VM需要异构资源池中的计算设备101协助其执行业务处理时，该VM便会向异构资源池中的与其存在绑定关系的GPU所在的计算设备101发送第一报文，计算设备101中的CPU1011会接收到第一报文，并将第一报文转发至计算设备101中与该VM存在绑定关系的GPU1012，由GPU1012根据第一报文中携带的指令，执行对待处理数据的处理。

S202，第一计算设备接收第二计算设备发送的第一报文。

S203，第一计算设备根据指令，执行对待处理数据的处理。

具体地，计算设备101中的GPU1012根据接收到的第一报文携带的指令，对待处理数据进行处理。

首先，对计算设备101获取待处理数据的方法进行介绍。其中，计算设备102可以根据待处理数据类型，确定向计算设备101传输待处理数据的方式；或者，计算设备102还可以根据待处理数据的数据量的大小，确定向计算设备101传输待处理数据的方式。相应地，计算设备101也可以以类似的方式获取计算设备102传输的待处理数据。下面对计算设备101获取待处理数据的方式进行说明。

方式1：计算设备102向计算设备101发送的第一报文中包括待处理数据，计算设备101对接收到的第一报文进行解析，获取待处理数据，并根据第一报文携带的指令，对待处理数据进行处理。

具体地，计算设备102中CPU1021根据待处理数据类型(例如，待处理数据为视频码流)，将待处理数据携带在第一报文中，并向计算设备101中的CPU1011发送携带有待处理数据的第一报文，由CPU1011将第一报文发送至GPU1012。相应地，计算设备101中的CPU1011接收计算设备102中的CPU1021发送的第一报文，CPU1011将第一报文发送至GPU1012，GPU1012对第一报文进行解析，获取待处理数据。

方式2：计算设备102在第一报文中携带有第一目标地址，第一目标地址用于指示待处理数据在第一存储资源中的存储地址，其中，第一存储资源为计算设备102在存储设备103中拥有访问权限的存储资源，计算设备101根据接收到的第一报文，从第一报文中获取第一目标地址，从而从第一存储资源中的第一目标地址对应的存储空间中获取待处理数据。

具体地，计算设备102中CPU1021根据待处理数据的类型(例如，待处理数据为图像数据)，将待处理数据存储至第一存储资源中的第一目标地址对应的存储空间，并向计算设备101中的CPU1011发送携带有第一目标地址的第一报文，相应的，计算设备101中的CPU1011接收第一报文，CPU1011将第一报文发送至GPU1012，GPU1012获取第一报文中携带的第一目标地址，并在存储设备103中的第一目标地址所指示的存储空间中获取待处理数据。

可选地，计算设备102还可以根据待处理数据的数据量与预设的第一阈值的比较结果，确定传输待处理数据的方式。

例如，计算设备102中的CPU1021还可以将待处理数据的数据量与预设的第一阈值进行比较，当待处理数据的数据量(例如，待处理数据的数据量为1.3Gbyte(兆比特))大于或等于与预设的第一阈值(例如，预设的第一阈值的取值为1Gbyte)时，CPU1021可以以上述方式2中的方法向计算设备101传输待处理数据，相应的，计算设备101中的GPU1012可以以上述方式2中的方法获取待处理数据；或者，当待处理数据的数据量(例如，待处理数据的数据量为400Kbyte(千比特))小于或等于与预设的第一阈值(例如，预设的第一阈值的取值为1Gbyte)时，计算设备102的CPU1021可以以上述方式1中的方法向计算设备101传输待处理数据，计算设备101可以以上述方式2中的方法获取待处理数据。

计算设备101中的GPU1012在获取到待处理数据后，根据第一报文携带的指令，对待处理数据进行处理。

例如，待处理数据为图像数据，第一报文中携带的指令所对应的处理为人工智能(Artificial Intelligence，AI)处理，该AI处理具体为识别图像当中的动物是猫或者狗。

具体地，计算设备101中的GPU1012在对该图像数据进行AI处理后，得到的结果为图像中的动物为狗，计算设备101中的GPU1012便需要向计算设备102返回该图像数据的处理结果(即，待处理数据的处理结果)。

需要说明的是，第一阈值的取值还可以随着计算设备101与计算设备102之间的网络带宽和/或网络拥塞程度进行调整，例如，当网络通信质量较好时，可以将第一阈值的取值设为500Kbyte。

还需要说明的是，当待处理数据为视频码流数据时，计算设备101在对视频码流数据进行处理时，首先需要对该视频码流数据进行解码，获得该视频码流数据对应的图像数据，再根据第一报文携带的指令，对该视频码流数据对应的图像数据进行处理，得到视频码流数据对应的待处理数据的处理结果。

S204，第一计算设备向第二计算设备发送第二报文。

S205，第二计算设备接收第二计算设备发送的第二报文。

具体地，计算设备101中的GPU1012在获取到待处理数据的处理结果后，便将待处理数据的处理结果返回至计算设备102。

下面对计算设备101向计算设备102返回待处理数据的处理结果的方法进行介绍。

方式1：计算设备101向计算设备102发送第二报文，第二报文中携带有待处理数据的处理结果。

具体地，当待处理数据为图像数据时，计算设备101中的GPU1012将图像数据对应的待处理数据的处理结果携带在第二报文中，并向计算设备101中的CPU1011发送第二报文，CPU1011将第二报文发送至计算设备102中的CPU1021。

方式2：计算设备101将待处理数据的处理结果存储至第一存储资源中的第二目标地址对应的存储空间中，并向计算设备102发送携带有第二目标地址的第二报文。

具体地，当待处理数据为视频码流数据时，计算设备101中的GPU1012将视频码流数据对应的待处理数据的处理结果存储至第一存储资源中的第二目标地址对应的存储空间中，并向计算设备101中的CPU1011发送携带有第二目标地址的第二报文，CPU1011将第二报文发送至计算设备102中的CPU1021，以使计算设备102中的CPU1021根据第二目标地址，从第一存储资源中的第二目标地址对应的存储空间中获取待处理数据的处理结果。

可选地，计算设备101还可以根据待处理数据的处理结果的数据量与预设的第二阈值的比较结果，确定传输待处理数据的处理结果的方式。

例如，计算设备101中的GPU1012还可以将待处理数据的处理结果的数据量与预设的第二阈值进行比较，当待处理数据的处理结果的数据量(例如，待处理数据的处理结果的数据量为0.6Gbyte)大于或等于与预设的第二阈值(例如，预设的第二阈值的取值为0.4Gbyte)时，计算设备101中的GPU1012可以以上述步骤S205中方式2中的方法向计算设备102返回待处理数据的处理结果；或者，当待处理数据的处理结果的数据量(例如，待处理数据的处理结果的数据量600Kbyte)小于或等于与预设的第一阈值(例如，预设的第二阈值的取值为1Gbyte)时，计算设备101中的GPU1012可以以上述步骤S205中方式1中的方法向计算设备102返回待处理数据的处理结果。

需要说明的是，第二目标地址还可以是计算设备102向计算设备101指示的，在此情况下，计算设备101无需向计算设备102通知第二目标地址。

还需要说明的是，当待处理数据为视频码流数据时，计算设备101向计算设备102返回的待处理数据的处理结果中还应该包括对视频码流数据解码后获得的视频码流数据对应的图像数据。

需要说明的是，当待处理数据的处理结果由计算设备101直接发送至计算设备102时，待处理数据的处理结果可以由计算设备101中的GPU1022使用远程直接数据存取(Remote Direct Memory Access，RDMA)方式直接发送至计算设备101中的CPU1011，而不需要经过计算设备101中的CPU1011。作为一种可能的实现方式，GPU1022可以为支持RDMA功能的芯片，此时，GPU1022可以直接将待处理数据的处理结果存储至计算设备102的内存。对于GPU1022基于RDMA方式传输数据的具体过程本申请不作限制。

当待处理数据由计算设备102直接发送至计算设备101时，待处理数据可以由计算设备102中的CPU1021使用RDMA方式直接发送至计算设备101中的GPU1012，而不需要经过计算设备101中的CPU1011。

还需要说明的是，在本申请中，步骤S203中方式1和方式2，以及步骤S205中方式1和方式2仅为示例性说明，并不对本申请构成任何限定，例如，上述4种方式可以进行任意组合，对应下面四种组合形式。在具体使用时，可以结合实际的应用场景进行选择。

场景1：当待处理数据的数据量大于或等于预设的第一阈值，且待处理数据的处理结果大于或等于预设的第二阈值时，计算设备102按照方式2向计算设备101传输待处理数据，计算设备101在得到待处理数据的处理结果后，按照方式4向计算设备102返回处理数据的处理结果。

场景2：当待处理数据的数据量小于或等于预设的第一阈值，且待处理数据的处理结果大于或等于预设的第二阈值时，计算设备102按照方式1向计算设备101传输待处理数据，计算设备101在得到待处理数据的处理结果后，按照方式4向计算设备102返回处理数据的处理结果。

场景3：当待处理数据的数据量大于或等于预设的第一阈值，且待处理数据的处理结果小于或等于预设的第二阈值时，计算设备102按照方式2向计算设备101传输待处理数据，计算设备101在得到待处理数据的处理结果后，按照方式3向计算设备102返回处理数据的处理结果。

场景4：当待处理数据的数据量小于或等于预设的第一阈值，且待处理数据的处理结果小于或等于预设的第二阈值时，计算设备102按照方式1向计算设备101传输待处理数据，计算设备101在得到待处理数据的处理结果后，按照方式3向计算设备102返回处理数据的处理结果。

本申请提供的数据处理的方法，通过将多个计算设备(例如，多个第一计算设备)组成异构资源池，使得当多个第二计算设备同时需要异构资源协助其执行业务请求时，可以将多个第二计算设备的请求协助执行业务请求的需求分散在异构资源池中，即使得异构资源池中的多个第一计算设备能够分别协助多个第二计算设备执行相应的业务请求，从而将第二计算设备与异构资源通信时产生的网络流量分散在异构资源池中，进而提高第二计算设备与异构资源之间的通信性能。

上文结合图1至图3，描述了本申请提供的数据处理的方法，下面结合图4至图6描述本申请实施例提供的数据处理的装置和计算设备。

图4为本申请提供的数据处理的装置300的示意性框图，装置300包括接收单元310、处理单元320与发送单元330。

接收单元310，用于接收第二计算设备发送的第一报文，该数据处理的装置与该第二计算设备通过网络进行通信，装置300用于协助第二计算设备执行业务处理，装置300为异构资源池中的计算设备，该异构资源池中包括至少一个数据处理的装置，该第一报文包括用于请求该数据处理的装置对待处理数据进行处理的指令；

处理单元320，用于根据指令，执行对待处理数据的处理；

发送单元330，用于向第二计算设备发送第二报文，第二报文包括待处理数据的处理结果。

可选地，第一报文包括待处理数据，则处理单元320还用于，解析第一报文获取待处理数据；根据指令对待处理数据进行处理。

可选地，第二计算设备配置有第一存储资源，数据处理的装置具有第一存储资源的访问权限，该第一报文中携带有第一目标地址，该第一目标地址用于指示该待处理数据在该第一存储资源中的存储地址，则该处理单元320还用于，根据该第一目标地址，从该第一存储资源中获取该待处理数据；根据该指令对该待处理数据进行处理。

可选地，该处理单元320还用于：将该待处理器数据的处理结果存储至第二目标地址，该第二目标地址为该第一存储资源的存储地址，该数据处理的装置向该第二计算设备发送的该第二报文中包括该第二目标地址，以便于该第二计算设备根据该第二目标地址，从该第一存储资源中获取该待处理数据的处理结果。

可选地，该发送单元330还用于：向该第二计算设备发送携带该处理结果的数据的该第二报文。

可选地，该待处理数据是由该第二计算设备使用远程直接数据存取RDMA技术传输至该数据处理的装置的。

可选地，该待处理数据的处理结果是由该数据处理的装置使用RDMA技术传输至该第二计算设备的。

可选地，该待处理数据为视频码流数据，该处理单元还用于：对该视频码流数据进行解码，获得该视频码流数据对应的图像数据；根据该指令，执行对该视频码流数据对应的图像数据的处理，该待处理数据的处理结果中包括该视频码流数据对应的图像数据。

可选地，配置有该第一存储资源的存储设备包括文件系统存储设备、分布式文件系统存储设备、块存储设备或对象存储设备。

可选地，该指令对应的处理包括人工智能AI处理。

应理解的是，本申请实施例的装置300可以通过专用集成电路(application-specific integrated circuit，ASIC)实现，或可编程逻辑器件(programmable logic device，PLD)实现，上述PLD可以是复杂程序逻辑器件(complex programmable logical device，CPLD)，现场可编程门阵列(field-programmable gate array，FPGA)，通用阵列逻辑(generic array logic，GAL)或其任意组合。也可以通过软件实现图3所示的数据处理方法时，装置300及其各个模块也可以为软件模块。

根据本申请实施例的装置300可对应于执行本申请实施例中描述的方法，并且装置300中的各个单元的上述和其它操作和/或功能为了实现图3所述方法中第一计算设备执行的相应流程，为了简洁，在此不再赘述。

图5为本申请提供的数据处理的装置400的示意性框图，装置400包括发送单元410与接收单元420。

发送单元410，用于向第一计算设备发送第一报文，该第一计算设备与该数据处理的装置通过网络进行通信，第一计算设备用于协助装置400执行业务处理，该第一计算设备为异构资源池中的计算设备，该异构资源池中包括至少一个第一计算设备，该第一报文包括用于请求该第一计算设备对待处理数据进行处理的指令。

接收单元420，用于接收该第一计算设备发送的第二报文，该第二报文包括该待处理数据的处理结果。

可选地，该第一报文包括该待处理数据。

可选地，该数据处理的装置400配置有第一存储资源，该第一计算设备具有该第一存储资源的访问权限，该第一报文中携带有第一目标地址，该第一目标地址用于指示该待处理数据在该第一存储资源中的存储地址。

可选地，该第二报文中包括该第二目标地址，该数据处理的装置根据该第二目标地址，从该第一存储资源中获取该待处理数据的处理结果。

可选地，该接收单元420还用于：接收该第一计算设备发送的携带该处理结果的数据的该第二报文。

可选地，该待处理数据是由该数据处理的装置使用远程直接数据存取RDMA方式传输至该第一计算设备的。

可选地，该待处理数据的处理结果是由该第一计算设备使用RDMA方式传输至该数据处理的装置的。

可选地，该待处理数据的处理结果中包括该视频码流数据对应的图像数据。

可选地，该指令对应的处理包括人工智能AI处理。

应理解的是，本申请实施例的装置400可以通过专用集成电路(application-specific integrated circuit，ASIC)实现，或可编程逻辑器件(programmable logic device，PLD)实现，上述PLD可以是复杂程序逻辑器件(complex programmable logical device，CPLD)，现场可编程门阵列(field-programmable gate array，FPGA)，通用阵列逻辑(generic array logic，GAL)或其任意组合。也可以通过软件实现图3所示的数据处理方法时，装置300及其各个模块也可以为软件模块。

根据本申请实施例的装置400可对应于执行本申请实施例中描述的方法，并且装置400中的各个单元的上述和其它操作和/或功能为了实现图3所示方法中第二计算设备执行的相应流程，为了简洁，在此不再赘述。

图6为本申请提供的一种计算设备的结构示意图。如图所示，所述计算设备500包括第一处理器501、第二处理器502、存储器503、通信接口504和总线505。其中，第一处理器501、第二处理器502、存储器503和通信接口504通过总线505进行通信，也可以通过无线传输等其他手段实现通信。该存储器503用于存储指令，该第一处理器501用于执行该存储器503存储的指令。该存储器503存储程序代码5031，且第一处理器501可以调用存储器702中存储的程序代码5031执行图3所述数据处理方法。

应理解，在本申请中第一处理器501可以是CPU，第一处理器501还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。

第二处理器502包括GPU、FPGA、ASIC或NPU中的至少一种。第二处理器主要用于执行协助另一计算设备处理的任务，例如，第二处理器可以协助另一计算设备处理视频码流。

该存储器503可以包括只读存储器和随机存取存储器，并向第一处理器501提供指令和数据。存储器503还可以包括非易失性随机存取存储器。该存储器503可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasable PROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data date SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM，DR RAM)。

该总线505除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都标为总线505。

值得说明的是，计算设备500可以对应图1或图2所示的计算系统中的计算设备101；当计算设备500对应图1或图2所示的计算系统中的计算设备102时，第二处理器502可以作为一个可选的部件，计算设备102可以包括第二处理器502，也可以不包括第二处理器502。

应理解，根据本申请的计算设备500可对应于本申请中的数据处理的装置300或装置400，并可以对应于本申请图3所示方法中的第一计算设备或第二计算设备，并且当计算设备500对应于图3所示方法中的第一计算设备时，计算设备500中的各个模块的上述和其它操作和/或功能分别为了实现图3中的由第一计算设备执行的方法的操作步骤，当计算设备500对应于图3所示方法中的第二计算设备时，计算设备500中的各个模块的上述和其它操作和/或功能分别为了实现图3中的由第二计算设备执行的方法的操作步骤，为了简洁，在此不再赘述。

本申请还提供了一种计算机系统，该计算机系统可以为图1或图2中所示的计算机系统，该计算机系统中包括至少两个计算设备，其中一个计算设备可以为图1或图2中所示的计算设备101，该计算设备用于执行上述方法200中由第一计算设备执行的方法的操作步骤，另一个计算设备可以为图1或图2中所示的计算设备102，该计算设备用于执行上述方法200中由第二计算设备执行的方法的操作步骤，为了简洁，在此不再赘述。

上述实施例，可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时，上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质。半导体介质可以是固态硬盘(solid state drive，SSD)。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种数据处理的方法，其特征在于，包括：

第一计算设备接收第二计算设备发送的第一报文，所述第一计算设备与所述第二计算设备通过网络进行通信，所述第一计算设备用于协助所述第二计算设备执行业务处理，所述第一计算设备为异构资源池中的计算设备，所述异构资源池中包括至少一个第一计算设备，所述第一报文包括用于请求所述第一计算设备对待处理数据进行处理的指令；

所述第一计算设备根据所述指令，执行对所述待处理数据的处理；

所述第一计算设备向所述第二计算设备发送第二报文，所述第二报文包括所述待处理数据的处理结果。
根据权利要求1所述的方法，其特征在于，所述第一报文包括所述待处理数据，则所述第一计算设备根据所述指令，执行对所述待处理数据的处理，包括：

所述第一计算设备解析所述第一报文获取所述待处理数据；

所述第一计算设备根据所述指令对所述待处理数据进行处理。
根据权利要求1所述的方法，其特征在于，所述第二计算设备配置有第一存储资源，所述第一计算设备具有所述第一存储资源的访问权限，所述第一报文中携带有第一目标地址，所述第一目标地址用于指示所述待处理数据在所述第一存储资源中的存储地址，则所述第一计算设备根据所述指令，执行对所述待处理数据的处理，包括：

所述第一计算设备根据所述第一目标地址，从所述第一存储资源中获取所述待处理数据；

所述第一计算设备根据所述指令对所述待处理数据进行处理。
根据权利要求1所述的方法，其特征在于，在所述第一计算设备向所述第二计算设备发送第二报文之前，所述方法还包括：

所述第一计算设备将所述待处理数据的处理结果存储至第二目标地址，所述第二目标地址为所述第一存储资源的存储地址，

则所述第一计算设备向所述第二计算设备发送第二报文，包括：

所述第一计算设备向所述第二计算设备发送携带所述第二目标地址的所述第二报文，以便于所述第二计算设备根据所述第二目标地址，从所述第一存储资源中获取所述待处理数据的处理结果。
根据权利要求2或3所述方法，其特征在于，所述第一计算设备向所述第二计算设备发送第二报文，包括：

所述第一计算设备向所述第二计算设备发送携带所述处理结果的数据的所述第二报文。
根据权利要求2所述的方法，其特征在于，所述待处理数据是由所述第二计算设备使用远程直接数据存取RDMA方式传输至所述第一计算设备的。
根据权利要求5所述的方法，其特征在于，所述待处理数据的处理结果是由所述第一计算设备使用RDMA方式传输至所述第二计算设备的。
根据权利要求1至7中任一项所述的方法，其特征在于，所述待处理数据的处理结果中包括所述视频码流数据对应的图像数据。
根据权利要求1至8中任一项所述的方法，其特征在于，配置有所述第一存储资源的存储设备包括文件系统存储设备、分布式文件系统存储设备、块存储设备或对象存储设备。
根据权利要求1至9中任一项所述的方法，其特征在于，所述指令对应的处理包括人工智能AI处理。
一种数据处理的装置，其特征在于，包括：

接收单元，用于接收第二计算设备发送的第一报文，所述数据处理的装置与所述第二计算设备通过网络进行通信，所述数据处理的装置为异构资源池中的计算设备，所述异构资源池中包括至少一个数据处理的装置，所述数据处理的装置用于协助所述第二计算设备执行业务处理，所述第一报文包括用于请求所述数据处理的装置对待处理数据进行处理的指令；

处理单元，用于根据所述指令，执行对所述待处理数据的处理；

发送单元，用于向所述第二计算设备发送第二报文，所述第二报文包括所述待处理数据的处理结果。
根据权利要求11所述的装置，其特征在于，所述第一报文包括所述待处理数据，则所述处理单元还用于，解析所述第一报文获取所述待处理数据；根据所述指令对所述待处理数据进行处理。
根据权利要求11所述的装置，其特征在于，所述第二计算设备配置有第一存储资源，所述数据处理的装置具有所述第一存储资源的访问权限，所述第一报文中携带有第一目标地址，所述第一目标地址用于指示所述待处理数据在所述第一存储资源中的存储地址，则所述处理单元还用于，根据所述第一目标地址，从所述第一存储资源中获取所述待处理数据；根据所述指令对所述待处理数据进行处理。
根据权利要求12或13所述的装置，其特征在于，所述处理单元还用于：将所述待处理器数据的处理结果存储至第二目标地址，所述第二目标地址为所述第一存储资源的存储地址，所述数据处理的装置向所述第二计算设备发送的所述第二报文中包括所述第二目标地址。
根据权利要求12或13所述装置，其特征在于，所述发送单元还用于：向所述第二计算设备发送携带所述处理结果的数据的所述第二报文。
根据权利要求12所述的装置，其特征在于，所述待处理数据是由所述第二计算设备使用远程直接数据存取RDMA方式传输至所述数据处理的装置的。
根据权利要求15所述的装置，其特征在于，所述待处理数据的处理结果是由所述数据处理的装置使用RDMA方式传输至所述第二计算设备的。
根据权利要求11至17中任一项所述的装置，其特征在于，所述待处理数据为视频码流数据，所述处理单元还用于：对所述视频码流数据进行解码，获得所述视频码流数据对应的图像数据；根据所述指令，执行对所述视频码流数据对应的图像数据的处理，所述待处理数据的处理结果中包括所述视频码流数据对应的图像数据。
根据权利要求11至18中任一项所述的装置，其特征在于，配置有所述第一存储资源的存储设备包括文件系统存储设备、分布式文件系统存储设备、块存储设备或对象存储设备。
根据权利要求11至19中任一项所述的装置，其特征在于，所述指令对应的处理包括人工智能AI处理。
一种计算设备，其特征在于，所述计算设备包括处理器和存储器，所述存储器用于存储计算机程序指令，所述计算设备运行时，所述处理器执行所述存储器中的所述计算机程序指令，以执行权利要求1至10中任一项所述方法的操作步骤。