WO2022121866A1

WO2022121866A1 - 一种基于加速卡的服务运行方法、装置、电子设备及计算机可读存储介质

Info

Publication number: WO2022121866A1
Application number: PCT/CN2021/135879
Authority: WO
Inventors: 李孟轩; 刘一鸣
Original assignee: 第四范式（北京）技术有限公司
Priority date: 2020-12-09
Filing date: 2021-12-06
Publication date: 2022-06-16
Also published as: CN112598565B; CN112598565A

Abstract

一种基于加速卡的服务运行方法、装置、电子设备及计算机可读存储介质，涉及计算机技术领域，能够在保证加速卡服务响应速度的同时，有效提高加速卡的利用率。所述加速卡上部署有至少一个服务，该方法包括：对于所述至少一个服务中的每个服务，响应于该服务进入冻结状态的事件，将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存（S11）；以及，对于所述至少一个服务中的每个服务，响应于该服务进入激活状态的事件，将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存（S12）。本方法可用于加速卡的服务运行中。

Description

一种基于加速卡的服务运行方法、装置、电子设备及计算机可读存储介质

本公开要求于2020年12月9日提交中国专利局、申请号为202011431859.X，发明名称为“一种基于加速卡的服务运行方法、装置、电子设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开涉及计算机技术领域，尤其涉及一种基于加速卡的服务运行方法、装置、电子设备及计算机可读存储介质。

背景技术

随着大数据和人工智能技术的发展，很多服务都以大量而复杂的数据运算为基础，而CPU的运算能力却越来越难以满足计算要求。因此，在许多场景下，会借助加速卡进行运算加速。常见的加速卡例如可以包括GPU(Graphics Processing Unit，图形处理器)、TPU(tensor processing unit，张量处理器)、NPU(Neural-network Processing Unit，嵌入式神经网络处理器)、FPGA(Field Programmable Gate Array，现场可编程门阵列)等。

加速卡具有强大的计算功能，但却需要较长时间对其所执行的程序进行初始化，因此，为了保证程序能够对服务请求进行及时响应，加速卡上运行的程序往往一经初始化即长期在线保持服务监听状态，即便服务需求并不频繁。

举例而言，许多视频网站存在这样一种场景：有多个审核视频流的服务，每个所述审核视频流的服务需要根据传入的图片来判断某个视频流是否有违规的内容，若有则需要转交给人工处理。为了保证对审核请求的及时响应，每个服务都要独占一张加速卡。然而，该服务每天的请求数很低，可能一天只有几十个请求，从而造成大量的加速卡资源闲置。

针对上述如何在保证加速卡服务响应速度的同时，有效提高加速卡的利用率，相关领域尚无有效的解决方案。

发明内容

有鉴于此，本公开实施例提供一种基于加速卡的服务运行方法、装置、电子设备及计算机可读存储介质，能够在保证加速卡服务响应速度的同时，有效提高加速卡的利用率。

第一方面，本公开实施例提供一种基于加速卡的服务运行方法，其中，所述加速卡上部署有至少一个服务，该方法包括：对于所述至少一个服务中的每个服务，响应于该服务进入冻结状态的事件，将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存；以及，对于所述至少一个服务中的每个服务，响应于该服务进入激活状态的事件，将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存。

第二方面，本公开的实施例还提供一种基于加速卡的服务运行装置，其中，所述加速卡上部署有至少一个服务，该装置包括：换出单元，用于对于所述至少一个服务中的每个服务，响应于该服务进入冻结状态的事件，将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存；以及，换入单元，用于对于所述至少一个服务中的每个服务，响应于该服务进入激活状态的事件，将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存。

第三方面，本公开的实施例还提供一种电子设备，所述电子设备包括：壳体、处理器、存储器、电路板和电源电路，其中，电路板安置在壳体围成的空间内部，处理器和存储器设置在电路板上；电源电路，用于为上述电子设备的各个电路或器件供电；存储器用于存储可执行程序代码；处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序，用于执行本公开的实施例提供的任一种方法。

第四方面，本公开的实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现本公开的实施例提供的任一种方法。

本公开的实施例提供的基于加速卡的服务运行方法、装置、电子设备及计算机可读存储介质，对于加速卡中部署的至少一个服务中的每个服务，能够响应于该服务进入冻结状态的事件，将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存，也能够响应于该服务进入激活状态的事件，将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存。这样，就能够在加速卡中部署多个服务，并根据加速卡中出现的事件，使该服务进入冻结状态，并使服务对应的进程从板载内存换出到处理器的内存，从而释放出加速卡中对应的资源，或者使该服务从冻结状态进入激活状态，并使服务对应的进程从处理器的内存换入到板载内存，从而继续运行该服务。这样就能够根据各种不同的事件，灵活控制和调度每一项服务的暂停或运行，在保证加速卡服务响应速度的同时，有效提高了加速卡的利用率。

附图说明

为了更清楚地说明本公开实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本公开的实施例提供的基于加速卡的服务运行方法的一种流程图；

图2是本公开的实施例中加速卡中运行的进程所占用的加速卡的板载内存示意图；

图3是相关技术中没有使用板载内存换入换出技术的情况下的服务运行示意图；

图4为本公开的实施例中空闲服务的加速卡使用情况示意图；

图5为本公开的实施例中有服务被激活时的加速卡使用情况示意图；

图6为图5中被激活的服务执行完毕后的加速卡使用情况示意图；

图7为本公开的实施例提供的基于加速卡的服务运行方法的一种详细流程图；

图8为本公开的实施例提供的基于加速卡的服务运行装置的一种结构示意图；

图9为本公开的实施例提供的电子设备的一种结构示意图。

具体实施方式

下面结合附图对本公开实施例进行详细描述。

应当明确，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

如背景技术所言，为了弥补中央处理器计算能力的不足，在越来越多的场景下，会借助加速卡进行运算加速。加速卡虽具有强大的计算功能，但却需要较长时间对其所执行的程序进行初始化，因此，为了保证程序能够对服务请求进行及时响应，加速卡上运行的程序往往一经初始化即长期在线保持服务监听状态，即便服务需求并不频繁，从而使加速卡的利用率较低。

为了解决上述问题，发明人在研究中发现，可以利用中央处理器的内存与加速卡的板载内存，对加速卡中部署的服务进行冻结状态和激活状态的切换，从而在保证加速卡服务响应速度的同时，有效提高加速卡的利用率。

为使本领域技术人员更好地理解本公开的实施例的技术构思、实施方案和有益技术效果，以下通过具体实施例进行详细说明。

第一方面，本公开实施例提供一种基于加速卡的服务运行方法，能够在保证加速卡服务响应速度的同时，有效提高加速卡的利用率。

如图1所示，本公开的实施例提供的基于加速卡的服务运行方法，其中，所述加速卡上部署有至少一个服务，该方法可以包括：

S11，对于所述至少一个服务中的每个服务，响应于该服务进入冻结状态的事件，将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存；

其中，加速卡可以是具有强大计算功能的各种芯片，例如可以为GPU、TPU、NPU、FPGA等。加速卡可以与中央处理器配合使用，实现对服务的及时响应。加速卡中设置有具有运算功能的处理器，也设置有用于存储运算数据和程序的板载内存。然而板载内存的存储空间一般会比较小，难以存储大量的数据和程序。

在本公开的实施例中，加速卡上可以部署有一个或多个服务，例如，在本公开的一个实施例中，加速卡上可以部署一个针对图像识别的模型训练服务、一个针对语音识别的模型训练服务、一个商品查询服务等。根据加速卡中资源的充裕程度的不同，部署在加速卡上的各服务既可以同时运行在加速卡中，也可以根据加速卡中出现的各种事件，在不同时机运行。

具体而言，本步骤中，当出现该服务进入冻结状态的事件时，响应于该事件，可以将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存，从而释放该服务对应的加速卡资源，以使其他服务可以利用该资源，因此有效提高了加速卡的资源利用率。

S12，对于所述至少一个服务中的每个服务，响应于该服务进入激活状态的事件，将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存。

在一项服务进入冻结状态后，当出现该服务进入激活状态的事件时，响应于该事件，可以将该服务对应的进程从CPU的内存换入到加速卡的板载内存，从而继续运行该进程，以便及时响应该服务。

本公开的实施例提供的基于加速卡的服务运行方法，对于加速卡中部署的至少一个服务中的每个服务，能够响应于该服务进入冻结状态的事件，将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存，也能够响应于该服务进入激活状态的事件，将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存。这样，就能够在加速卡中部署多个服务，并根据加速卡中出现的事件，使该服务进入冻结状态，并使服务对应的进程从板载内存换出到处理器的内存，从而释放出加速卡中对应的资源，或者使该服务从冻结状态进入激活状态，并使服务对应的进程从处理器的内存换入到板载内存，从而继续运行该服务。这样就能够根据各种不同的事件，灵活控制和调度每一项服务的暂停或运行，在保证加速卡服务响应速度的同时，有效提高了加速卡的利用率。

上述技术可以应用在背景技术所述的视频网站场景，即许多个服务可以公用在一张加速卡上面，其中大部分服务都处于换出冻结的状态，当每个服务收到请求时，将其换入执行，完成之后再换出。这种方案极大的降低了所需要加速卡的数量，极大的节省了成本。

具体而言，在本公开的实施例中，各服务是否进入冻结状态，或是否进入激活状态，可以由各种事件来触发。在本公开的一个实施例中，对于每一项服务而言，进入冻结状态的事件可以包括以下一种或多种：所述服务的空闲时长超过预设时长阈值；所述服务的运行速率低于预设速率阈值；所述服务的运行优先级低于预设优先级阈值。

也即是说，如果一个服务在加速卡中的空闲时长过长，则说明已经有很长时间没有对该服务的请求，为了提高加速卡的利用率，可以根据该服务空闲时长过长的事件，使该服务进入冻结状态。或者，如果一个服务运行速率过低，则说明加速卡中的资源比较紧张，不足以支撑当前服务的有效运行，为了提高服务的执行效率，可以根据该服务运行速率过低的事件，使该服务进入冻结状态。或者，如果一个服务的运行优先级低于预设优先级，则说明当前该任务无需立即运行，可以暂时使该服务暂时进入冻结状态。在本公开的一个实施例中，服务的运行优先级还可以根据服务本身的性质以及加速卡中各任务的运行情况及时调整，使加速卡中的任务调度更加灵活。

与进入冻结状态的事件相反，在本公开的一个实施例中，对于每一项服务而言，进入激活状态的事件可以包括以下至少一项：服务被调用、加速卡有新的资源被释放。这样，当发生服务被调用的事件时，若该服务处于冻结状态，就可以及时将该服务激活，及时响应服务请求。当加速卡有新的资源被释放时，也可以将处于冻结状态的服务激活，从而及时利用新释放的资源运行该服务。

当然，在本公开的其他实施例中，还可以包括其他可以使服务进入冻结状态的事件或使服务进入激活状态的事件，本公开的实施例对此不做限定。

基于上述事件，在本公开的一个实施例中，步骤S11中将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存可以包括：在所述加速卡的板载内存中保留该服务对应的第一进程的上下文信息和所述第一进程所在的第一虚拟地址空间，将所述第一进程换出到所述中央处理器CPU的内存，以释放所述加速卡的板载内存中对应的被占用资源。

在本公开的实施例中，加速卡中部署的每个服务，可以对应一个进程，即第一进程。为了保证该进程的顺利运行，还会记录有该第一进程的上下文信息以及该第一进程对应虚拟地址空间，即第一虚拟地址空间。

其中，上下文信息中包含了进程的当前运行环境配置等信息，可以用于加速卡驱动对于进程的识别，进程状态的维持等。由于仅仅记录了这些配置信息，上下文信息的文件通常较小，通常在200M至1G，因此不会占用过多板载内存。以模型训练服务为例，在本公开的一个实施例中，加速卡中运行的进程所占用的加速卡的板载内存可以如图2所示。

虚拟地址空间是操作系统针对上层应用使用内存地址的一种寻址方式。虚拟地址空间是指虚拟地址中的一段地址区间。通过操作系统的映射，能够将虚拟地址映射到对应的物理地址。需要说明的是，虚拟地址空间和真实的物理空间并不是一一对应的，操作系统会根据当前应用程序以及当前内存占用情况，更新虚拟地址与物理地址之间的对应关系。

具体而言，本公开的实施例中，保留第一进程对应的第一虚拟地址空间，也即是保留第一虚拟地址空间相对应的一段虚拟地址所对应的虚拟地址空间，例如保留了X0100～XF000这段虚拟地址空间，从而使该段虚拟地址空间不会被其他应用服务占用。然而该段虚拟地址空间对应的物理地址，将随着该第一进程被换出加速卡的板载内存，而得以释放。

为了能够顺利保留第一进程对应的第一虚拟地址空间，以便使第一进程的冻结和激活性能更加稳定，在本公开的一个实施例中，在所述对于所述至少一个服务中的每个服务，响应于该服务进入冻结状态的事件，保留该服务对应的第一进程的上下文信息和所述第一进程所在的第一虚拟地址空间之前，本公开的实施例提供的基于加速卡的服务运行方法还可以包括：在所述加速卡的板载内存中，申请一段第一虚拟地址空间作为保留空间；将所述保留空间映射给所述第一进程，得到所述第一进程的第一虚拟地址空间；在所述第一虚拟地址空间运行所述第一进程。

示例性的，对于GPU类的加速卡而言，与传统的通过cuMemalloc接口分配的方式不同，本公开的实施例可以采用一种全新的以cuMemAddressReserve+cuMemMap接口，通过映射的方式申请加速卡的板载内存，从而可以使其保留虚拟地址空间不被占用，以便保证第一进程能够顺利从中央处理器的内存中重新换入到加速卡的板载内存并运行。不仅如此，本公开在换入换出内存时，所选择的内存段并不是通常进程申请内存时使用malloc方式申请的内存段，而是通过申请内存cuMemHostAlloc申请的与GPU共享页表的内存段，从而可以极大的降低换入换出的时间。整个过程，无论是换入还是换出都是秒级别的。

通过上述方法获得了第一进程对应的第一虚拟地址空间之后，当出现使服务进入冻结状态的事件时，可以保存服务所对应的第一进程的第一虚拟地址空间以及上下文信息，并将第一进程换出到中央处理器的内存。当出现了该服务进入激活状态的事件时，则响应于该事件，可以在步骤S12中将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存。

在本公开的一个实施例中，将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存可以包括：将该服务对应的第一进程，从中央处理器CPU的内存换入加速卡的板载内存，保存于所述板载内存的所述第一虚拟地址空间；根据所述第一进程的上下文信息，继续运行所述第一进程。也即是说，当该服务对应的第一进程被重新换入加速卡的板载内存之后，其使用的虚拟地址空间仍然为被换出加速卡的板载内存之前所使用的虚拟地址空间。被重新换入加速卡的板载内存后，可以根据保存的第一进程的上下文信息，识别该第一进程并继续运行该第一进程。

具体而言，在本公开的一个实施例中，根据所述第一进程的上下文信息，继续运行所述第一进程可以包括：根据所述上下文信息识别所述第一进程；根据所述上下文信息维持的进程状态，从所述第一进程被换出所述加速卡的板载内存时的程序断点开始，继续运行所述第一进程。这样，第一进程就可以根据上下文信息快速进入运行状态，无需重新进行初始化，从而大大加快了进程运行效率和服务响应速度。

第一进程可以根据进入激活状态的事件而换入加速卡的板载内存。进入激活状态的事件可以包多种类型的事件，例如服务被调用的事件、加速卡有新的资源被释放的事件等。当有这些事件出现时，可以将处于冻结状态的服务激活，并将该服务对应的第一进程从中央处理器的内存换入加速卡的板载内存。

举例而言，在本公开的一个实施例中，加速卡中出现了使服务进入激活状态的事件，且该进入激活状态的事件为：加速卡有新的资源被释放。则，响应于该服务进入激活状态的事件，将该服务对应的所述第一进程，从所述中央处理器CPU的内存换入所述加速卡的板载内存可以包括：确定所述板载内存的剩余空间是否大于或等于所述第一进程的第一虚拟地址空间；在所述板载内存的剩余空间大于或等于所述第一进程的第一虚拟地址空间的情况下，将所述第一进程从所述中央处理器CPU的内存换入所述加速卡的板载内存。

例如，如果加速卡中新的资源被释放后，板载内存的剩余空间的大小为3G，第一进程的第一虚拟地址空间的大小为2.8G，说明当前加速卡可以支持该服务较顺畅的运行，则可以将该服务对应的第一进程从中央处理器的内存换入到加速卡的板载内存中并运行。

在本公开的另一个实施例中，确定所述板载内存的剩余空间是否大于或等于所述第一进程的第一虚拟地址空间之后，在板载内存的剩余空间小于所述第一进程的第一虚拟地址空间的情况下，可以从所述中央处理器CPU的内存预先保存的其他加速卡进程中，选择一个占用虚拟地址空间小于或等于所述板载内存的剩余空间的其他服务的第二进程；将所述第二进程从所述中央处理器CPU的内存换入所述加速卡的板载内存并运行。

例如，如果加速卡中新的资源被释放后，板载内存的剩余空间的大小为3G，第一进程的第一虚拟地址空间的大小为3.7G，与此同时，中央处理器的内存中还保存有其他服务对应的进程P1、P2，其中P1占据的虚拟地址空间为1G，P2占据的虚拟地址空间为3.3G。则，由于3.7G大于3G，说明当前加速卡无法支持第一进程较顺畅的运行，因此可以从中央处理器的内存中预先保存的进程P1、P2中选择P1(1G小于3G)作为第二进程，将第二进程从中央处理器的内存换入到加速卡的板载内存中并运行。

在一实施方式中，当中央处理器的内存中存在多个这样的第二进程时，可以结合其他策略，例如进程运行优先级、进程存入中央处理器的内存的时间先后等，从多个第二进程中选择一个第二进程换入加速卡板载内存并运行。

在一实施方式中，上述实施例中加速卡不仅可以包括实体加速卡，也可以包括由实体加速卡虚拟出的多个虚拟加速卡中的任一个。

具体而言，在本公开的实施例中，加速卡可以具有虚拟化的能力，即通过切分板载内存，可以将一张实体加速卡虚拟成若干张虚拟加速卡，供不同的容器/进程使用，其中每个虚拟加速卡都可以复用多个服务，达到一卡多用再多用的目标。

以视频网站服务为例，如图3所示，在相关技术中没有使用板载内存换入换出技术的情况下，每个服务必须占用一个完整的加速卡，一个有4块GPU的节点1(Node1)只能运行4个服务(service)。

而当使用了板载内存换入换出技术时，每个GPU可以部署多个服务，这些服务平时进程都处于休眠状态，模型等数据结构放置在中央处理器的内存，这种状态称为冻结状态。当有请求到来时，对应的服务便可将对应的进程从中央处理器的内存换入加速卡的板载内存，恢复进程的执行，并开始处理请求，这种状态称为激活状态。服务处理完请求之后，进程便可以换出板载内存并重新进入冻结状态，具体过程可以如图4、图5、图6所示。由此可见，采用了板载内存换入换出技术后，只需要一块GPU即可满足需求，极大的降低了成本。如图4所示，使用板载内存换入换出技术后，空闲的服务不会占用板载内存。图5当有请求(query)来到时，可以临时激活对应的服务(假设为服务1(Service1))，将其进程(包括模型、数据等)从内存换入加速卡处理。在加速卡的板载内存有剩余的情况下，可以同时激活多个服务，若加速卡的板载内存不足，则可以排队等待处理。如图6所示，当服务处理完query时，继续将其换出到中央处理器的内存。

以GPU为例，某个节点有1张NVIDIA 2080TI显卡，显存为10G，分别在该GPU上同时运行两个需要8G显存的训练。若不使用板载内存换入换出技术，则至少会有一个训练会因为申请不到足够的显存而失败。而若使用板载内存换入换出技术的话，当一个训练申请显存失败时，其可以将自己换出到内存，并暂停执行。等待另外一个训练结束并释放显存之后即可从内存换回显存并恢复执行，这样的话，两个训练都可以成功运行。

下面通过具体的实施例对本公开的实施例提供的基于加速卡的服务运行方法进行详细说明。

如图7所示，本公开的实施例提供的基于加速卡的服务运行方法可以包括：

S201、在加速卡的板载内存中，申请一段第一虚拟地址空间作为保留空间。

S202、将所述保留空间映射给该服务对应的第一进程，得到所述第一进程的第一虚拟地址空间。

S203、在所述第一虚拟地址空间运行所述第一进程。

S204、第一进程的运行速率低于预设速率阈值，触发该服务进入冻结状态的事件。

S205、根据该进入冻结状态的事件，在所述加速卡的板载内存中保留该服务对应的第一进程的上下文信息和所述第一进程所在的第一虚拟地址空间，将所述第一进程换出到所述中央处理器CPU的内存，以释放所述加速卡的板载内存中对应的被占用资源。

S206、加速卡中有新的资源被释放，触发该服务进入激活状态的事件。

S207、确定所述板载内存的剩余空间大于或等于所述第一进程的第一虚拟地址空间，将所述第一进程从所述中央处理器CPU的内存换入所述加速卡的板载内存。

S208、根据所述上下文信息识别所述第一进程。

S209、根据所述上下文信息维持的进程状态，从所述第一进程被换出所述加速卡的板载内存时的程序断点开始，继续运行所述第一进程。

第二方面，本公开的实施例还提供一种基于加速卡的服务运行装置，能够在保证加速卡服务响应速度的同时，有效提高加速卡的利用率。

如图8所示，本公开的实施例提供的基于加速卡的服务运行装置，所述加速卡上部署有至少一个服务，该装置可以包括：

换出单元31，被配置为对于所述至少一个服务中的每个服务，响应于该服务进入冻结状态的事件，将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存；

以及，

换入单元32，被配置为对于所述至少一个服务中的每个服务，响应于该服务进入激活状态的事件，将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存。

本公开的实施例提供的基于加速卡的服务运行装置，对于加速卡中部署的至少一个服务中的每个服务，能够响应于该服务进入冻结状态的事件，将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存，也能够响应于该服务进入激活状态的事件，将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存。这样，就能够在加速卡中部署多个服务，并根据加速卡中出现的事件，使该服务进入冻结状态，并使服务对应的进程从板载内存换出到处理器的内存，从而释放出加速卡中对应的资源，或者使该服务从冻结状态进入激活状态，并使服务对应的进程从处理器的内存换入到板载内存，从而继续运行该服务。这样就能够根据各种不同的事件，灵活控制和调度每一项服务的暂停或运行，在保证加速卡服务响应速度的同时，有效提高了加速卡的利用率。

在一实施方式中，换出单元31可以被配置为：

对于所述至少一个服务中的每个服务，响应于该服务进入冻结状态的事件，在所述加速卡的板载内存中保留该服务对应的第一进程的上下文信息和所述第一进程所在的第一虚拟地址空间，将所述第一进程换出到所述中央处理器CPU的内存，以释放所述加速卡的板载内存中对应的被占用资源。

在一实施方式中，换入单元32可以包括：

换入模块，被配置为对于所述至少一个服务中的每个服务，响应于该服务进入激活状态的事件，将该服务对应的所述第一进程，从所述中央处理器CPU的内存换入所述加速卡的板载内存，保存于所述板载内存的所述第一虚拟地址空间；

继续运行模块，被配置为根据所述第一进程的上下文信息，继续运行所述第一进程。

在一实施方式中，所述进入激活状态的事件为：所述加速卡有新的资源被释放；

所述换入模块可以包括：

确定子模块，被配置为确定所述板载内存的剩余空间是否大于或等于所述第一进程的第一虚拟地址空间；

换入子模块，被配置为在所述板载内存的剩余空间大于或等于所述第一进程的第一虚拟地址空间的情况下，将所述第一进程从所述中央处理器CPU的内存换入所述加速卡的板载内存。

在一实施方式中，所述换入模块还包括：

选择子模块，被配置为在板载内存的剩余空间小于所述第一进程的第一虚拟地址空间的情况下，从所述中央处理器CPU的内存预先保存的其他加速卡进程中，选择一个占用虚拟地址空间小于或等于所述板载内存的剩余空间的其他服务的第二进程；

所述换入子模块，还被配置为将所述第二进程从所述中央处理器CPU的内存换入所述加速卡的板载内存并运行。

在一实施方式中，所述继续运行模块包括：

识别子模块，被配置为根据所述上下文信息识别所述第一进程；

继续运行子模块，被配置为根据所述上下文信息维持的进程状态，从所述第一进程被换出所述加速卡的板载内存时的程序断点开始，继续运行所述第一进程。

在一实施方式中，所述装置还可以包括：

申请单元，被配置为在保留该服务对应的第一进程的上下文信息和所述第一进程所在的第一虚拟地址空间之前，在所述加速卡的板载内存中，申请一段第一虚拟地址空间作为保留空间；

映射单元，被配置为将所述保留空间映射给所述第一进程，得到所述第一进程的第一虚拟地址空间；

运行单元，被配置为在所述第一虚拟地址空间运行所述第一进程。

在一实施方式中，所述进入冻结状态的事件包括以下至少一种：

所述服务的空闲时长超过预设时长阈值；

所述服务的运行速率低于预设速率阈值；

所述服务的运行优先级低于预设优先级阈值。

在一实施方式中，所述进入激活状态的事件包括以下至少一种：

所述服务被调用；

所述加速卡有新的资源被释放。

在一实施方式中，所述加速卡为实体加速卡，或者由实体加速卡虚拟出的多个虚拟加速卡中的任一个。

以上图1示出的具体操作可由图8的基于加速卡的服务运行装置中的各个单元来执行，这里，对于具体操作细节将不再赘述。

第三方面，相应的，本公开实施例提供一种电子设备，能够在保证加速卡服务响应速度的同时，有效提高加速卡的利用率。

如图9所示，本公开的实施例提供的一种电子设备，可以包括：壳体41、处理器42、存储器43、电路板44和电源电路45，其中，电路板44安置在壳体41围成的空间内部，处理器42和存储器43设置在电路板44上；电源电路45，被配置为为上述电子设备的各个电路或器件供电；存储器43被配置为存储可执行程序代码；处理器42通过读取存储器43中存储的可执行程序代码来运行与可执行程序代码对应的程序，被配置为执行前述任一实施例所述的基于加速卡的服务运行方法。

处理器42对上述步骤的具体执行过程以及处理器42通过运行可执行程序代码来进一步执行的步骤，可以参见前述实施例的描述，在此不再赘述。

该电子设备以多种形式存在，可具有单机或分布式的运算结构，本公开对此不作限制。

第四方面，本公开的实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现前述实施例提供的任一种基于加速卡的服务运行方法，因此也能实现相应的技术效果，前文已经进行了详细说明，此处不再赘述。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。

尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

为了描述的方便，描述以上装置是以功能分为各种单元/模块分别描述。当然，在实施本公开时可以把各单元/模块的功能在同一个或多个软件、同一个或多个硬件、同一个或多个软件和硬件中实现。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的计算机可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所述，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

一种基于加速卡的服务运行方法，其中，所述加速卡上部署有至少一个服务，该方法包括：

对于所述至少一个服务中的每个服务，响应于该服务进入冻结状态的事件，将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存；

以及，对于所述至少一个服务中的每个服务，响应于该服务进入激活状态的事件，将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存。
根据权利要求1所述的方法，其中，所述将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存包括：

在所述加速卡的板载内存中保留该服务对应的第一进程的上下文信息和所述第一进程所在的第一虚拟地址空间，将所述第一进程换出到所述中央处理器CPU的内存，以释放所述加速卡的板载内存中对应的被占用资源。
根据权利要求2所述的方法，其中，所述将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存包括：

将该服务对应的所述第一进程，从所述中央处理器CPU的内存换入所述加速卡的板载内存，保存于所述板载内存的所述第一虚拟地址空间；

根据所述第一进程的上下文信息，继续运行所述第一进程。
根据权利要求3所述的方法，其中，所述进入激活状态的事件为：所述加速卡有新的资源被释放；

所述响应于该服务进入激活状态的事件，将该服务对应的所述第一进程，从所述中央处理器CPU的内存换入所述加速卡的板载内存包括：确定所述板载内存的剩余空间是否大于或等于所述第一进程的第一虚拟地址空间；在所述板载内存的剩余空间大于或等于所述第一进程的第一虚拟地址空间的情况下，将所述第一进程从所述中央处理器CPU的内存换入所述加速卡的板载内存。
根据权利要求4所述的方法，其中，所述确定所述板载内存的剩余空间是否大于或等于所述第一进程的第一虚拟地址空间之后，所述方法还包括：

在板载内存的剩余空间小于所述第一进程的第一虚拟地址空间的情况下，从所述中央处理器CPU的内存预先保存的其他加速卡进程中，选择一个占用虚拟地址空间小于或等于所述板载内存的剩余空间的其他服务的第二进程；

将所述第二进程从所述中央处理器CPU的内存换入所述加速卡的板载内存并运行。
根据权利要求3所述的方法，其中，所述根据所述第一进程的上下文信息，继续运行所述第一进程包括：

根据所述上下文信息识别所述第一进程；

根据所述上下文信息维持的进程状态，从所述第一进程被换出所述加速卡的板载内存时的程序断点开始，继续运行所述第一进程。
根据权利要求2所述的方法，其中，所述对于所述至少一个服务中的每个服务，响应于该服务进入冻结状态的事件，保留该服务对应的第一进程的上下文信息和所述第一进程所在的第一虚拟地址空间之前，所述方法还包括：

在所述加速卡的板载内存中，申请一段第一虚拟地址空间作为保留空间；

将所述保留空间映射给所述第一进程，得到所述第一进程的第一虚拟地址空间；

在所述第一虚拟地址空间运行所述第一进程。
根据权利要求1所述的方法，其中，所述进入冻结状态的事件包括以下至少一种：

所述服务的空闲时长超过预设时长阈值；

所述服务的运行速率低于预设速率阈值；

所述服务的运行优先级低于预设优先级阈值。
根据权利要求1所述的方法，其中，所述进入激活状态的事件包括以下至少一种：

所述服务被调用；

所述加速卡有新的资源被释放。
根据权利要求1至9中任一项所述的方法，其中，所述加速卡为实体加速卡，或者由实体加速卡虚拟出的多个虚拟加速卡中的任一个。
一种基于加速卡的服务运行装置，其中，所述加速卡上部署有至少一个服务，该装置包括：

换出单元，被配置为对于所述至少一个服务中的每个服务，响应于该服务进入冻结状态的事件，将该服务对应的进程从所述加速卡的板载内存换出到中央处理器CPU的内存；

以及，

换入单元，被配置为对于所述至少一个服务中的每个服务，响应于该服务进入激活状态的事件，将该服务对应的进程从CPU的内存换入到所述加速卡的板载内存。
根据权利要求11所述的装置，其中，所述换出单元被配置为：

对于所述至少一个服务中的每个服务，响应于该服务进入冻结状态的事件，在所述加速卡的板载内存中保留该服务对应的第一进程的上下文信息和所述第一进程所在的第一虚拟地址空间，将所述第一进程换出到所述中央处理器CPU的内存，以释放所述加速卡的板载内存中对应的被占用资源。
根据权利要求12所述的装置，其中，所述换入单元包括：

换入模块，被配置为对于所述至少一个服务中的每个服务，响应于该服务进入激活状态的事件，将该服务对应的所述第一进程，从所述中央处理器CPU的内存换入所述加速卡的板载内存，保存于所述板载内存的所述第一虚拟地址空间；

继续运行模块，被配置为根据所述第一进程的上下文信息，继续运行所述第一进程。
根据权利要求13所述的装置，其中，所述进入激活状态的事件为：所述加速卡有新的资源被释放；

所述换入模块包括：

确定子模块，被配置为确定所述板载内存的剩余空间是否大于或等于所述第一进程的第一虚拟地址空间；

换入子模块，被配置为在所述板载内存的剩余空间大于或等于所述第一进程的第一虚拟地址空间的情况下，将所述第一进程从所述中央处理器CPU的内存换入所述加速卡的板载内存。
根据权利要求14所述的装置，其中，所述换入模块还包括：

选择子模块，被配置为在板载内存的剩余空间小于所述第一进程的第一虚拟地址空间的情况下，从所述中央处理器CPU的内存预先保存的其他加速卡进程中，选择一个占用虚拟地址空间小于或等于所述板载内存的剩余空间的其他服务的第二进程；

所述换入子模块，还被配置为将所述第二进程从所述中央处理器CPU的内存换入所述加速卡的板载内存并运行。
根据权利要求13所述的装置，其中，所述继续运行模块包括：

识别子模块，被配置为根据所述上下文信息识别所述第一进程；

继续运行子模块，被配置为根据所述上下文信息维持的进程状态，从所述第一进程被换出所述加速卡的板载内存时的程序断点开始，继续运行所述第一进程。
根据权利要求12所述的装置，其中，还包括：

申请单元，被配置为在保留该服务对应的第一进程的上下文信息和所述第一进程所在的第一虚拟地址空间之前，在所述加速卡的板载内存中，申请一段第一虚拟地址空间作为保留空间；

映射单元，被配置为将所述保留空间映射给所述第一进程，得到所述第一进程的第一虚拟地址空间；

运行单元，被配置为在所述第一虚拟地址空间运行所述第一进程。
根据权利要求11所述的装置，其中，所述进入冻结状态的事件包括以下至少一种：

所述服务的空闲时长超过预设时长阈值；

所述服务的运行速率低于预设速率阈值；

所述服务的运行优先级低于预设优先级阈值。
根据权利要求11所述的装置，其中，所述进入激活状态的事件包括以下至少一种：

所述服务被调用；

所述加速卡有新的资源被释放。
根据权利要求11至19中任一项所述的装置，其中，所述加速卡为实体加速卡，或者由实体加速卡虚拟出的多个虚拟加速卡中的任一个。
一种电子设备，其中，所述电子设备包括：壳体、处理器、存储器、电路板和电源电路，其中，电路板安置在壳体围成的空间内部，处理器和存储器设置在电路板上；电源电路，被配置为为上述电子设备的各个电路或器件供电；存储器被配置为存储可执行程序代码；处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序，被配置为执行前述权利要求1至10任一项所述的方法。
一种计算机可读存储介质，其中，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现前述权利要求1至10中任一项所述的方法。