WO2023230909A1

WO2023230909A1 - 调度方法及相关装置

Info

Publication number: WO2023230909A1
Application number: PCT/CN2022/096455
Authority: WO
Inventors: 朱湘毅
Original assignee: 华为技术有限公司
Priority date: 2022-05-31
Filing date: 2022-05-31
Publication date: 2023-12-07

Abstract

本申请实施例提供一种调度方法及相关装置。虚拟机系统包含主机，主机根据获取的虚拟机配置信息创建多个虚拟机，该多个虚拟机共享处理器的算力，处理器根据接收的来自主机的第一配置信息为多个虚拟机中的每个虚拟机分配时间片，其中，第一配置信息用于指示多个虚拟机中每个虚拟机的算力比例，算力比例越大的虚拟机分配到的时间片越多。能够满足各个虚拟机的算力需求，保证每个虚拟机中时间片分配的合理性。本申请提供的实施例能够用于智能汽车或新能源汽车等智能化计算设备。

Description

调度方法及相关装置

技术领域

本申请涉及信息技术领域，尤其涉及一种调度方法及相关装置。

背景技术

人工智能(artificial intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得判断结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人、自然语言处理、计算机视觉、决策与推理、人机交互、推荐与搜索、AI基础理论等。

但是智能汽车或其他智能终端的计算资源有限，为人工智能的落地应用带来了挑战。

发明内容

本申请提供了一种调度方法及相关装置，满足了各个虚拟机的算力需求，保证了每个虚拟机中时间片分配的合理性。

第一方面，本申请提供一种调度方法，应用于虚拟机系统，所述虚拟机系统包含多个虚拟机，所述多个虚拟机共享处理器的算力，所述方法包括：所述处理器根据第一配置信息为所述多个虚拟机中的每个虚拟机分配时间片，所述第一配置信息用于指示所述多个虚拟机中每个虚拟机的算力比例；在所述多个虚拟机中的第一虚拟机中存在所述时间片，且第一任务正在执行时，有第二任务到达，所述处理器停止执行所述第一任务，且调度执行所述第二任务，所述第二任务所属的执行序列的优先级高于所述第一任务所属的执行序列的优先级。

本方法中，处理器根据多个虚拟机中每个虚拟机的算力比例，为虚拟机系统中的每个虚拟机分配时间片，算力比例越大的虚拟机分配到的时间片越多，实现了多个虚拟机对处理器算力的共享，满足了各个虚拟机的算力需求；且当有优先级高的任务到达时，优先执行，可以保证高优先级任务执行的实时性。

在一种可能的实现方式中，所述多个虚拟机中的第一虚拟机包括n个执行序列，n为大于或等于0的整数；所述方法还包括：所述处理器根据所述第一配置信息和第二配置信息为所述n个执行序列中的s个执行序列分配所述时间片，所述第二配置信息用于指示所述第一虚拟机中的所述n个执行序列的优先级，s为小于或等于n的整数。

该实现方式中，第一虚拟机为虚拟机系统中多个虚拟机中的任意一个虚拟机，第一虚拟机中包括n个执行序列，处理器根据第一虚拟机中的n个执行序列的优先级为该n个执行序列中的s个执行序列分配时间片，s个执行序列中优先级越高的执行序列分配到的时间片越多，实现了时间片的二级分配，满足了第一虚拟机中各个执行序列的算力需求，同时保证了为每个执行序列分配时间片的合理性。

在一种可能的实现方式中，所述第一虚拟机中的执行序列的优先级包含普通类型的优先级和实时类型的优先级，所述实时类型的优先级高于所述普通类型的优先级；其中，所述s个执行序列的优先级为普通类型的优先级。

该实现方式中，第一虚拟机中的执行序列的优先级包含普通类型的优先级和实时类型的优先级，处理器根据第一虚拟机中n个执行序列的优先级，仅为n个执行序列中优先级为普通类型优先级的执行序列分配时间片，优先级为实时类型优先级的执行序列则按照实际需要进行调度，只要第一虚拟机有时间片，就能调度优先级为实时类型优先级的执行序列，保证了实时业务的实时性。

在一种可能的实现方式中，所述方法还包括：所述处理器根据所述第一配置信息和第三配置信息为所述每个虚拟机分配所述时间片，所述第三配置信息用于指示所述处理器为所述多个虚拟机分配时间片的周期长度。

该实现方式中，处理器根据第三配置信息指示的周期为虚拟机系统中的多个虚拟机分配时间片，满足了各个虚拟机的算力需求，同时保证了虚拟机中各项业务能够按时按需完成。

在一种可能的实现方式中，所述处理器为所述多个虚拟机分配时间片的周期长度大于或等于优先级为实时类型的优先级的执行序列的执行周期的周期长度。

该实现方式中，处理器为虚拟机系统中的多个虚拟机分配时间片的周期长度大于或等于优先级为实时类型优先级的执行序列的执行周期的周期长度，使得在虚拟机中的实时任务完成的情况下，再重新为多个虚拟机分配时间片，保证了实时任务的实时性。

在一种可能的实现方式中，所述方法还包括：所述处理器接收所述第一配置信息。

在一种可能的实现方式中，所述方法还包括：在所述多个虚拟机中的第一虚拟机中存在时间片和待执行的x个第一执行序列和q个第二执行序列时，所述处理器优先调度所述q个第二执行序列中的任务，所述第一执行序列的优先级为普通类型的优先级，所述第二执行序列的优先级为实时类型的优先级，x和q为大于或等于0的整数。该实现方式中，在第一虚拟机中既包括待执行的优先级为普通类型优先级的执行序列，又包括待执行的优先级为实时类型优先级的执行序列时，处理器优先调度待执行的优先级为实时类型优先级的执行序列中的任务，保证了实时任务的实时性。

在一种可能的实现方式中，所述处理器优先调度所述q个第二执行序列中的任务，包括：所述q个第二执行序列中实时类型的优先级还包括第一实时优先级和第二实时优先级，所述第一实时优先级的优先级高于所述第二实时优先级；所述处理器优先调度所述q个第二执行序列中第一实时优先级的任务。

该实现方式中，在第一虚拟机中有多个待执行的优先级为实时类型优先级的执行序列时，处理器优先调度等级高的实时类型优先级的执行序列中的任务，在很多种情况下，执行等级低的实时类型优先级的执行序列中的任务时，需要用到等级高的实时类型优先级的执行序列中的任务的执行结果，所以优先执行等级高的实时类型优先级的执行序列中的任务，有助于保证实时任务的实时性，同时提高了实时任务的执行效率。

在一种可能的实现方式中，所述第一任务属于所述x个第一执行序列中的任意一个执行序列，所述第二任务属于所述q个第二执行序列中的任意一个执行序列。

该实现方式中，在第一虚拟机中，普通类型优先级的任务正在执行时，有实时类型优先级的任务到达，则处理器停止调度该普通类型优先级的任务，启动调度实时类型优先级的任务，保证了实时任务的实时性。

在一种可能的实现方式中，若所述x个第一执行序列中存在时间片分配比例，则在所述q个第二执行序列中的任务执行完成后，所述处理器根据所述时间片分配比例将剩余的时间片分配给所述x个第一执行序列，所述剩余的时间片为所述处理器为所述x个第一执行序列分配的时间片的总和与所述q个第二执行序列中的任务执行所使用的时间片的差值。

该实现方式中，当实时类型的优先级的任务执行完成后，处理器将剩下的时间片按照原来的时间片分配比例分配给普通类型的优先级的执行序列，从而使得普通优先级执行序列的时间片仍然满足时间片分配比例。

在一种可能的实现方式中，所述第一任务和所述第二任务属于所述q个第二执行序列中不同的执行序列，且所述第二任务所属执行序列的优先级高于所述第一任务所属执行序列的优先级。

该实现方式中，在第一虚拟机中，等级低的实时类型优先级的任务正在执行时，有等级高的实时类型优先级的任务达到，则处理器停止调度等级低的实时类型优先级的任务，启动调度等级高的实时类型优先级的任务，保证了第一虚拟机中实时类型优先级的任务能够按照优先级等级顺序由高到低执行，保证了实时任务的实时性，提高了实时任务的执行效率。

在一种可能的实现方式中，所述方法还包括：所述处理器获取所述第一任务的总执行时间和当前执行的时间；所述处理器根据所述第一任务的总执行时间和所述当前执行的时间，计算所述第一任务的剩余执行时间；在所述第一任务的剩余执行时间小于预设阈值时，所述处理器执行所述第一任务。

该实现方式中，在第一虚拟机中，第一任务正在执行，有第二任务达到，处理器触发任务切换之前，先根据第一任务的总执行时间和当前执行的时间，计算第一任务的剩余执行时间，在第一任务的剩余执行时间小于预设阈值时，处理器仍执行第一任务，保证当前第一任务执行完成，以节约系统资源，提高业务的执行效率。

在一种可能的实现方式中，所述方法还包括：所述处理器获取所述第一任务的总执行时间和当前执行的时间；所述处理器根据所述第一任务的总执行时间和所述当前执行的时间，计算所述第一任务的剩余执行时间；在所述第一任务的剩余执行时间小于所述第一任务的预设切换备份时间与预设倍数的乘积时，所述处理器执行所述第一任务。

该实现方式中，在第一虚拟机中，第一任务正在执行，有第二任务达到，处理器触发任务切换之前，先根据第一任务的总执行时间和当前执行的时间，计算第一任务的剩余执行时间，在第一任务的剩余执行时间小于第一任务的预设切换备份时间与预设倍数的乘积时，处理器仍执行第一任务，保证当前第一任务执行完成，以节约系统资源，提高业务的执行效率。

在一种可能的实现方式中，所述方法还包括：所述处理器获取所述第一任务的总执行时间和当前执行的时间；所述处理器根据所述第一任务的总执行时间和所述当前执行的时间，计算所述第一任务的剩余执行时间；在所述第一任务的剩余执行时间大于或等于预设阈值时，所述处理器停止执行所述第一任务。

该实现方式中，在第一虚拟机中，第一任务正在执行，有第二任务达到，处理器触发任务切换之前，先根据第一任务的总执行时间和当前执行的时间，计算第一任务的剩余执行时间，在第一任务的剩余执行时间大于或等于预设阈值时，处理器停止执行第一任务，启动执行第二任务，以保证优先级高的第二任务的实时性，提高了业务的执行效率。

在一种可能的实现方式中，所述处理器停止调度所述第一任务之后，所述方法还包括：将所述第一任务的执行信息存储至备份内存单元中。

该实现方式中，处理器停止调度第一任务后，将第一任务的执行信息存储至备份内存单元中，处理器再次调度第一任务时，从备份内存单元中调取第一任务的执行信息，继续执行第一任务，提高了第一任务的执行效率。

在一种可能的实现方式中，所述第一任务的执行信息包括以下信息的一种或多种：执行所述第一任务的逻辑运算单元的通用寄存器、专用寄存器、内部高速缓冲存储器、缓冲区中的数据。

该实现方式中，处理器停止调度第一任务时，将执行第一任务的逻辑运算单元的通用寄存器、专用寄存器、内部高速缓冲存储器、缓冲区中的数据存储至备份内存单元中，为重新执行第一任务保留了充足的数据，提高了第一任务的执行效率。

在一种可能的实现方式中，所述处理器中的备份内存单元的数量满足以下关系式：L＝e*g，其中，L表示所述处理器中的备份内存单元的数量，e表示所述处理器中的逻辑运算单元的数量，g表示实时类型的优先级的等级个数。

该实现方式中，处理器中的备份内存单元的数量等于处理器中逻辑运算单元的数量与实时类型优先级的等级个数的乘积，相比于为虚拟机系统中每个执行序列设置一个备份内存单元，大大节省了内存空间。

在一种可能的实现方式中，所述方法还包括：当所述第二任务执行完成时，所述处理器执行未完成的所述第一任务。

该实现方式中，当实时任务或者更高优先级的任务执行完时，优先处理被抢占的任务，而不是执行新的任务，保证被抢占的任务先执行。

在一种可能的实现方式中，所述方法还包括：在所述第一虚拟机中没有时间片，且存在有待执行的执行序列时，所述处理器调度除所述第一虚拟机外的其他存在时间片的虚拟机执行所述第一虚拟机中的执行序列的任务。

该实现方式中，在第一虚拟机没有时间片但有待执行任务时，处理器调度其他空闲的虚拟机来执行任务，提高了虚拟机系统的业务处理效率，实现了处理器算力利用的最大化。

在一种可能的实现方式中，所述方法还包括：所述处理器根据第一配置信息为所述每个虚拟机分配的时间片满足如下关系式：

Y＝1000*1000/t*m*p

其中，Y表示为所述每个虚拟机分配的时间片；t表示调度周期，在每个所述调度周期，所述处理器为所述每个虚拟机分配所述时间片；m表示所述处理器中逻辑运算单元的数量；p表示所述每个虚拟机的算力比例。

第二方面，本申请提供一种调度方法，应用于虚拟机系统，所述虚拟机系统包含主机，所述方法包括：所述主机获取虚拟机配置信息，所述虚拟机配置信息用于指示创建多个虚拟机，所述虚拟机配置信息包括所述多个虚拟机中每个虚拟机的算力比例；所述主机根据所述虚拟机配置信息，创建所述多个虚拟机，所述多个虚拟机共享处理器的算力；所述主机向所述处理器发送第一配置信息，所述第一配置信息用于指示所述多个虚拟机中每个虚拟机的算力比例。

本方法中，虚拟机系统中包含主机，主机根据获取的虚拟机配置信息创建多个虚拟机，由创建的多个虚拟机共同完成虚拟机系统中的任务，并向处理器发送第一配置信息，用于指示处理器根据多个虚拟机中每个虚拟机的算力比例，提高了创建多个虚拟机的合理性，节约了虚拟机系统的资源，提高了虚拟机系统的执行效率。

在一种可能的实现方式中，所述方法还包括：所述主机获取多个模型；所述主机根据所述多个模型中的第一模型为所述多个虚拟机中的第一虚拟机创建n个执行序列，n为大于或等于0的整数；所述主机为所述n个执行序列中的每个执行序列配置优先级；向所述处理器发送第二配置信息，所述第二配置信息用于指示所述第一虚拟机中的n个执行序列的优先级。

该实现方式中，主机根据获取的多个模型中的第一模型为第一虚拟机创建n个执行序列，为n个执行序列中的每个执行序列配置优先级，并向处理器发送第二配置信息，用于指示第一虚拟机中n个执行序列的优先级，该n个执行序列能够并行处理，n个执行序列中的每个执行序列能够按照优先级等级顺序从高到低执行，提高了第一模型的执行效率，保证了第一模型的实时性要求。

在一种可能的实现方式中，所述优先级包含普通类型的优先级和实时类型的优先级，所述实时类型的优先级高于所述普通类型的优先级。

在一种可能的实现方式中，所述虚拟机配置信息还包括为所述多个虚拟机分配时间片的周期长度；所述方法还包括：所述主机向所述处理器发送第三配置信息，所述第三配置信息用于指示为所述多个虚拟机分配时间片的周期长度。

该实现方式中，主机向处理器发送第三配置信息，用于指示为虚拟机系统中的多个虚拟机分配时间片的周期，满足了各个虚拟机的算力需求，同时保证了虚拟机中各项业务能够按时按需完成。

在一种可能的实现方式中，所述为所述多个虚拟机分配时间片的周期大于或等于优先级为实时类型的优先级的执行序列的执行周期。

该实现方式中，为虚拟机系统中的多个虚拟机分配时间片的周期大于或等于优先级为实时类型的优先级的执行序列的执行周期，使得在虚拟机中的实时任务完成的情况下，再重新为多个虚拟机分配时间片，保证了实时任务的实时性。

第三方面，本申请提供一种调度装置，应用于虚拟机系统，所述虚拟机系统包含多个虚拟机，所述多个虚拟机共享处理器的算力，所述装置包括：分配模块，用于根据第一配置信息为所述多个虚拟机中的每个虚拟机分配时间片，所述第一配置信息用于指示所述多个虚拟机中每个虚拟机的算力比例；执行模块，用于在所述多个虚拟机中的第一虚拟机中存在所述时间片，且第一任务正在执行时，有第二任务到达，所述处理器停止执行所述第一任务，且调度执行所述第二任务，所述第二任务所属的执行序列的优先级高于所述第一任务所属的执行序列的优先级。

在一种可能的实现方式中，所述多个虚拟机中的第一虚拟机包括n个执行序列，n为大于或等于0的整数；所述装置还包括：所述分配模块还用于根据所述第一配置信息和第二配置信息为所述n个执行序列中的s个执行序列分配所述时间片，所述第二配置信息用于指示所述第一虚拟机中的所述n个执行序列的优先级，s为小于或等于n的整数。

在一种可能的实现方式中，所述分配模块还用于根据所述第一配置信息和第三配置信息为所述每个虚拟机分配所述时间片，所述第三配置信息用于指示所述处理器为所述多个虚拟机分配时间片的周期长度。

在一种可能的实现方式中，所述装置还包括：接收模块，用于所述处理器接收所述第一配置信息。

在一种可能的实现方式中，所述装置还包括：调度模块，用于在所述多个虚拟机中的第一虚拟机中存在时间片和待执行的x个第一执行序列和q个第二执行序列时，优先调度所述q个第二执行序列中的任务，所述第一执行序列的优先级为普通类型的优先级，所述第二执行序列的优先级为实时类型的优先级，x和q为大于或等于0的整数。

在一种可能的实现方式中，所述调度模块具体用于：所述q个第二执行序列中实时类型的优先级还包括第一实时优先级和第二实时优先级，所述第一实时优先级的优先级高于所述第二实时优先级；所述调度模块优先调度所述q个第二执行序列中第一实时优先级的任务。

在一种可能的实现方式中，若所述x个第一执行序列中存在时间片分配比例，则在所述q个第二执行序列中的任务执行完成后，所述分配模块还用于根据所述时间片分配比例将剩余的时间片分配给所述x个第一执行序列，所述剩余的时间片为所述处理器为所述x个第一执行序列分配的时间片的总和与所述q个第二执行序列中的任务执行所使用的时间片的差值。

在一种可能的实现方式中，所述装置还包括：获取模块，用于获取所述第一任务的总执行时间和当前执行的时间；计算模块用于根据所述第一任务的总执行时间和所述当前执行的时间，计算所述第一任务的剩余执行时间；在所述第一任务的剩余执行时间小于预设阈值时，所述执行模块还用于执行所述第一任务。

在一种可能的实现方式中，所述获取模块还用于获取所述第一任务的总执行时间和当前执行的时间；所述计算模块还用于根据所述第一任务的总执行时间和所述当前执行的时间，计算所述第一任务的剩余执行时间；在所述第一任务的剩余执行时间小于所述第一任务的预设切换备份时间与预设倍数的乘积时，所述执行模块还用于执行所述第一任务。

在一种可能的实现方式中，所述获取模块还用于获取所述第一任务的总执行时间和当前执行的时间；所述计算模块还用于根据所述第一任务的总执行时间和所述当前执行的时间，计算所述第一任务的剩余执行时间；在所述第一任务的剩余执行时间大于或等于预设阈值时，所述执行模块还用于停止执行所述第一任务。

在一种可能的实现方式中，所述处理器停止调度所述第一任务之后，所述装置还包括：存储模块，用于将所述第一任务的执行信息存储至备份内存单元中。

在一种可能的实现方式中，所述执行模块还用于当所述第二任务执行完成时，所述处理器执行未完成的所述第一任务。

在一种可能的实现方式中，所述调度模块还用于在所述第一虚拟机中没有时间片，且存在有待执行的执行序列时，调度除所述第一虚拟机外的其他存在时间片的虚拟机执行所述第一虚拟机中的执行序列的任务。

在一种可能的实现方式中，所述处理器根据第一配置信息为所述每个虚拟机分配的时间片满足如下关系式：

Y＝1000*1000/t*m*p

第三方面及第三方面的各种可能的实现方式中的有益效果可参见第一方面及第一方面的各种可能的实现方式中的有益效果，此处不再赘述。

第四方面，本申请提供一种调度装置，应用于虚拟机系统，所述虚拟机系统包含主机，所述装置包括：获取模块，用于获取虚拟机配置信息，所述虚拟机配置信息用于指示创建多个虚拟机，所述虚拟机配置信息包括所述多个虚拟机中每个虚拟机的算力比例；创建模块，用于根据所述虚拟机配置信息，创建所述多个虚拟机，所述多个虚拟机共享处理器的算力；发送模块，用于向所述处理器发送第一配置信息，所述第一配置信息用于指示所述多个虚拟机中每个虚拟机的算力比例。

在一种可能的实现方式中，所述获取模块还用于获取多个模型；所述创建模块还用于根据所述多个模型中的第一模型为所述多个虚拟机中的第一虚拟机创建n个执行序列，n为大于或等于0的整数；配置模块，用于为所述n个执行序列中的每个执行序列配置优先级；发送模块，用于向所述处理器发送第二配置信息，所述第二配置信息用于指示所述第一虚拟机中的n个执行序列的优先级。

在一种可能的实现方式中，所述虚拟机配置信息还包括为所述多个虚拟机分配时间片的周期长度；所述发送模块还用于向所述处理器发送第三配置信息，所述第三配置信息用于指示为所述多个虚拟机分配时间片的周期长度。

第四方面及第四方面的各种可能的实现方式中的有益效果可参见第二方面及第二方面的各种可能的实现方式中的有益效果，此处不再赘述。

第五方面，本申请提供一种调度装置。该装置可以包括与存储器耦合的处理器。其中，该存储器用于存储程序代码，该处理器用于执行该存储器中的程序代码，以实现第一方面或第二方面或其中任意一种实现方式中的方法。

可选地，该装置还可以包括该存储器。

第六方面，本申请提供一种芯片，包括至少一个处理器和通信接口，所述通信接口和所述至少一个处理器通过线路互联，所述至少一个处理器用于运行计算机程序或指令，以执行如第一方面或第二方面或其中任意一种可能的实现方式所述的方法。

第七方面，本申请提供一种芯片系统，该芯片系统包括多个如第六方面中的芯片。

第八方面，本申请提供一种计算机可读介质，该计算机可读介质存储用于设备执行的程序代码，该程序代码包括用于执行如第一方面或第二方面或其中任意一种可能的实现方式所述的方法。

第九方面，本申请提供一种包含指令的计算机程序产品，当该计算机程序产品在计算机上运行时，使得计算机执行如第一方面或第二方面或其中任意一种可能的实现方式所述的方法。

第十方面，本申请提供一种计算设备，包括至少一个处理器和通信接口，所述通信接口和所述至少一个处理器通过线路互联，所述通信接口与目标系统通信，所述至少一个处理器用于运行计算机程序或指令，以执行如第一方面或第二方面或其中任意一种可能的实现方式所述的方法。

第十一方面，本申请提供一种计算系统，包括至少一个处理器和通信接口，所述通信接口和所述至少一个处理器通过线路互联，所述通信接口与目标系统通信，所述至少一个处理器用于运行计算机程序或指令，以执行如第一方面或第二方面或其中任意一种可能的实现方式所述的方法。

第十二方面，本申请提供一种车辆，所述车辆包括如第六方面所述的芯片或第五方面所述的调度装置。

附图说明

图1为本申请的实施例提供的一种系统架构的示意图；

图2为本申请的实施例提供的一种调度方法的流程示意图；

图3为本申请一个实施例提供的调度周期的配置流程图；

图4为本申请一个实施例提供的一种调度方法的流程示意图；

图5为本申请一个实施例提供的主机创建多个虚拟机的流程示意图；

图6为本申请一个实施例提供的创建执行序列的流程示意图；

图7为本申请一个实施例提供的优先级抢占的示意图；

图8为本申请一个实施例提供的备份内存单元的示意图；

图9为本申请一个实施例的调度装置的示意性结构图；

图10为本申请另一个实施例的调度装置的示意性结构图；

图11为本申请又一个实施例的调度装置的结构示意图。

具体实施方式

下面将结合本申请的实施例中的附图，对本申请实施例中的技术方案进行描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

很多人工智能应用场景中会包含多种不同的业务。中央汽车计算机(Central Car Computer，CCC)架构能够在性能强大的底层硬件平台上，虚拟出多个不同安全等级的分区，供不同的业务使用，且这些分区共享具有计算处理能力的硬件。其中，分区也可以称为容器或虚拟机(virtual machine，VM)，计算机处理能力可以简称为算力，具有算力的硬件可以包括神经网络处理器(network process unit，NPU)或图形处理器(graphics processing unit，GPU)等处理器。

以自动驾驶领域为例，自动驾驶领域可以包含规划控制、预测规划、感知融合、管理面360度环视、驾驶员监控(driver monitor system，DMS)、娱乐系统或与座舱相关的功能等业务。这些业务对算力的要求和实时性的要求各不相同。

例如，规划控制、预测规划、感知融合等业务对算力要求和实时性要求均较高；DMS对算力要求要高，对实时性要求不高；与座舱相关业务对算力的要求与实际功能有关，对实时性要求不高。

图1为本申请的实施例提供的一种系统架构的示意图。如图1所示，虚拟机系统100包括主机110和处理器120。

主机110可以包括多个虚拟机(VM1，VM2，…，VMn)和虚拟机管理器(hypervisor)111，多个虚拟机中每个虚拟机包括应用程序(application，APP)、内存管理(runtime)和虚拟处理器驱动程序，虚拟机管理器111可以包括处理器驱动程序和中央处理器(central processing unit，CPU)。其中，处理器驱动程序可以为虚拟机管理器111提供处理器120的驱动功能，例如，处理器驱动程序能够为虚拟机管理器111提供设置虚拟机算力比例和设置虚拟机资源调度周期等的接口；runtime可以部署在APP中，可以提供处理器120的用户态驱动功能(例如应用程序接口(application programming interface，API)等)，APP通过调用runtime提供的API将AI模型加载至处理器120，并驱动处理器120执行AI模型，获取AI模型的执行结果。

处理器120可以为专用的神经网络处理器(AI芯片)，例如NPU或GPU等。处理器120可以包括控制器121和多个逻辑运算单元。控制器121用于接收主机110发送的AI模型，调度AI模型执行，得到AI模型的执行结果，并将AI模型的执行结果上报给主机110。逻辑运算单元用于执行控制器121下发的AI模型中的任务(执行序列中的执行单元)，给控制器121返回任务的执行结果。

示例性的，AI模型可以是计算图结构，APP将AI模型下发给处理器120之前，会将计算图结构的AI模型进行转换，转换成处理器120的执行序列结构，一个AI模型对应一个或多个执行序列(多个执行序列可以提高并行度)，每个执行序列有多个执行单元(也就是AI任务)。一个执行单元(AI任务)还可以切分为多个块(block)，block的个数一般和处理器120中逻辑运算单元的核数相等，每个逻辑运算单元一次执行一个block，因此对于一个AI任务，控制器121可以将其同时调度到多个逻辑运算单元上执行，AI模型的所有执行序列的所有AI任务都执行完成后，APP才能得到完整的计算结果。APP可以将AI模型加载到处理器120，一次加载多次执行，也可以分多次将AI模型的AI任务下发到处理器120执行。不管哪种执行方式，处理器120看到的都是执行序列中的AI任务需要执行，因此处理器120对AI模型并发调度，也就是对执行序列并发调度。

示例性的，控制器121可以一次只给逻辑运算单元下发一个执行单元的一个block，逻辑运算单元执行完成后，控制器121再下发下一个block到逻辑运算单元。

可以理解的是，图1所示的系统架构仅是本申请提供的虚拟机系统的一种示例，在本申请另一些实施例中，虚拟机系统100可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件、软件或软件和硬件的组合实现，本申请不作限定。

以自动驾驶领域为例，自动驾驶业务中的感知、预测、规划是实时业务，要求对应的AI模型执行的时间越短越好。AI模型执行是典型的并行计算，AI任务(算子)可以切分成多个block，因此可以同时在多个逻辑运算单元上执行以提高计算并行度，提高执行效率，缩短执行时间。

同时，感知、预测、规划业务执行AI模型，是有时间先后顺序的，感知的结果给预测和规划，预测的结果给规划。因此如果感知、预测、规划业务执行AI模型时，处理器所有的逻辑运算单元都给实时业务使用，则执行实时业务的AI模型的时间可以最短，进而最好的保证了业务的实时性。

因此，不为每个虚拟机隔离出一定数量的逻辑运算单元，而是让虚拟机系统中的所有虚拟机共享处理器所有的逻辑运算单元，这样能使实时业务的运行时间最短。

所有虚拟机都有配置的算力规格，为保证分区算力使用的精确性，需要为每个虚拟机分配使用处理器逻辑运算单元的时间片，处理器中的控制器控制各虚拟机的业务使用时间片，由时间片的使用来体现各虚拟机的算力配置规格。

由于非实时业务也有算力分配，也有AI模型需要执行，非实时业务的分配算力比例也要得到保证。因此，处理器中的控制器给各虚拟机分配使用处理器的时间片不能过小，也就是处理器中控制器的调度周期(每个调度周期给各虚拟机分配一次时间片)不能过小。

因此，如何为这些分区分配算力或者说为这些分区调度算力，才能满足各个业务的算力要求和实时性要求，成为了亟待解决的问题。

基于上述描述，本申请提出了一种调度方法。图2为本申请的实施例的一种调度方法的执行序列程示意图。如图2所示，该方法至少包括S201至S205。图2所示的方法可以应用于图1所示的虚拟机系统100中。

S201，主机获取虚拟机配置信息，虚拟机配置信息用于指示创建多个虚拟机，虚拟机配置信息包括多个虚拟机中每个虚拟机的算力比例。

作为一种示例，本实施例中的主机可以为图1中的主机110。

在一种可能的实现方式中，主机通过虚拟机管理器获取虚拟机配置信息。处理器驱动程序为虚拟机管理器提供配置虚拟机配置信息的接口。

作为一种示例，本实施例中的虚拟机管理器可以为图1中的虚拟机管理器111，本实施例中的处理器驱动程序可以为图1中虚拟机管理器111中的处理器驱动程序。

示例性的，虚拟机配置信息可以包括虚拟机系统中虚拟机的数量、多个虚拟机中每个虚拟机的算力比例、为多个虚拟机进行资源调度的周期等信息。

S202，主机根据虚拟机配置信息，创建多个虚拟机，多个虚拟机共享处理器的算力。

在一种可能的实现方式中，主机根据虚拟机配置信息指示的虚拟机中虚拟机的数量，创建多个虚拟机，该多个虚拟机共享处理器的算力。

在另一种可能的实现方式中，主机获取多个模型，主机根据多个模型中的第一模型为多个虚拟机中的第一虚拟机创建n个执行序列(执行序列)，n为大于或等于0的整数，并为n个执行序列中的每个执行序列配置优先级。其中，优先级可以包含普通类型的优先级和实时类型的优先级，实时类型的优先级高于普通类型的优先级。

需要说明的是，第一模型为主机获取的多个模型中的任意一个模型，第一虚拟机为虚拟机系统的多个虚拟机中的任意一个虚拟机。

S203，主机向处理器发送第一配置信息，第一配置信息用于指示多个虚拟机中每个虚拟机的算力比例。

在一种可能的实现方式中，主机向处理器发送第一配置信息，第一配置信息用于指示多个虚拟机中每个虚拟机的算力比例，以便处理器根据第一配置信息中指示的多个虚拟机中每个虚拟机的算力比例，为每个虚拟机分配时间片。

可选地，多个虚拟机中每个虚拟机的算力比例为NPU设置的每个虚拟机的可用的算力比例，例如，NPU中一共有五个虚拟机：VM1、VM2、VM3、VM4和VM5，VM1、VM2、VM3、VM4和VM5分别使用NPU总算力的25％、50％、10％、15％，每个虚拟机的算力比例可以分别设置，总算力比例小于等于100％。

在另一种可能的实现方式中，主机向处理器发送第二配置信息，第二配置信息用于指示第一虚拟机中的n个执行序列的优先级，以便处理器根据第二配置信息指示的第一虚拟机中的n个执行序列的优先级，为n个执行序列分配时间片。

其中，n个执行序列为第一虚拟机中的待执行的执行序列。

在又一种可能的实现方式中，主机获取的虚拟机配置信息中还包括为多个虚拟机分配时间片的周期长度，则主机还可以向处理器发送第三配置信息，第三配置信息用于指示为虚拟机系统中的多个虚拟机分配时间片的周期长度，以便处理器根据第三配置信息指示的周期为虚拟机系统中的多个虚拟机分配时间片。

作为一种示例，为多个虚拟机分配时间片的周期长度大于或等于优先级为实时类型优先级的执行序列的执行周期。

可选地，为多个虚拟机分配时间片的周期长度也称作调度周期。

也就是说，调度周期应不小于实时类型优先级的业务的周期，在一个算力时间片分配周期内，实时类型优先级的业务可以优先调度，然后再调度普通类型优先级的业务。如果周期过小，则实时类型优先级的业务很容易用完分配的时间片，普通类型优先级的业务的也有时间片，也可以执行AI模型，实时类型优先级的业务只能到下个周期才有时间片，导致实时类型优先级的业务不及时。

示例性地，调度周期的配置流程图如图3所示，虚拟机管理器将调度周期发送至NPU驱动器，NPU驱动器将该调度周期再发送至NPU控制器，NPU控制器保存该调度周期，供后续使用。

S204，处理器根据第一配置信息为每个虚拟机分配时间片，第一配置信息用于指示多个虚拟机中每个虚拟机的算力比例。

在一种可能的实现方式中，处理器根据第一配置信息指示的虚拟机的算力比例为虚拟机系统中的每个虚拟机分配时间片，算力比例越大的虚拟机分配到的时间片越多。

在另一种可能的实现方式中，虚拟机系统中的第一虚拟机包括n个执行序列，n为大于或等于0的整数；处理器接收第二配置信息，并根据接收的第一配置信息和第二配置信息为n个执行序列中的s个执行序列分配时间片，其中，s个执行序列中优先级越高的执行序列分配到的时间片越多，s为小于或等于n的整数。

作为一种示例，被分配到时间片的s个执行序列的优先级均为普通类型的优先级，处理器根据第一配置信息和第二配置信息，仅为优先级为普通类型的优先级的执行序列分配时间片，n个执行序列中优先级为实时类型优先级的执行序列不分配时间片，但在第一虚拟机有时间片的情况下，处理器就能调度优先级为实时类型优先级的执行序列中的任务。

在一种可能的实现方式中，处理器接收第三配置信息，并根据第三配置信息指示的为多个虚拟机分配时间片的周期长度为虚拟机系统中的每个虚拟机分配时间片。

作为一种示例，处理器按照第三配置信息指示的周期长度，基于第一配置信息为虚拟机系统中每个虚拟机分配时间片。

示例性的，处理器为虚拟机系统中的第一虚拟机分配的时间片满足如下关系式：

Y＝1000*1000/t*m*p

其中，Y表示为每个虚拟机分配的时间片；t表示调度周期，在每个调度周期，处理器为每个虚拟机分配时间片；m表示处理器中逻辑运算单元的数量；p表示每个虚拟机的算力比例。

作为另一种示例，处理器按照第三配置信息指示的周期，基于第一配置信息和第二配置信息为第一虚拟机中优先级为普通类型的优先级的执行序列分配时间片。

示例性的，普通类型的优先级分为多个等级，处理器根据第三配置信息指示的周期，基于第一配置信息和第二配置信息为第一虚拟机中不同等级的普通类型优先级的执行序列分配时间片。例如，第一虚拟机中的普通类型优先级的执行序列可以分为四个等级，这四个等级由高到低分配时间片的比例为10:8:4:2:1，所属优先级等级比例越大的执行序列分配的时间片越多。

在处理器为第一虚拟机分配时间片后，处理器对第一虚拟机中的任务进行调度。

S205，在多个虚拟机中的第一虚拟机中存在时间片，且第一任务正在执行时，有第二任务到达，停止执行第一任务，且调度执行第二任务，第二任务所属的执行序列的优先级高于第一任务所属的执行序列的优先级。

在一种可能的实现方式中，在多个虚拟机中的第一虚拟机中有时间片，且存在待执行的x个第一执行序列和q个第二执行序列时，处理器优先调度q个第二执行序列中的任务，第一执行序列的优先级为普通类型的优先级，第二执行序列的优先级为实时类型的优先级，x和q为大于或等于0的整数。

作为一种示例，q个第二执行序列中实时类型的优先级还包括第一实时优先级和第二实时优先级，第一实时优先级的优先级高于第二实时优先级，处理器优先调度q个第二执行序列中第一实时优先级的任务。

在一种可能的实现方式中，在第一虚拟机中，第一任务正在执行时，有第二任务到达，第一任务属于x个第一执行序列中的任意一个执行序列，第二任务属于q个第二执行序列中的任意一个执行序列，则处理器停止执行第一任务，调度执行第二任务。

在一种可能的实现方式中，若x个第一执行序列中存在时间片分配比例，如10:8:4:2:1，则在q个第二执行序列中的任务执行完成后，处理器根据时间片分配比例将剩余的时间片分配给x个第一执行序列，剩余的时间片为处理器为x个第一执行序列分配的时间片的总和与q个第二执行序列中的任务执行所使用的时间片的差值。

也就是说，当实时类型的优先级的任务执行完成后，处理器将剩下的时间片按照原来的时间片分配比例分配给普通类型的优先级的执行序列，从而使得普通优先级执行序列的时间片仍然满足时间片分配比例。

在另一种可能的实现方式中，在第一虚拟机中，第一任务正在执行时，有第二任务到达，第一任务和第二任务属于q个第二执行序列中不同的执行序列，且第二任务所属执行序列的优先级高于第一任务所属执行序列的优先级，则处理器停止执行第一任务，调度执行第二任务。

作为一种示例，针对上述两种可能的实现方式，在处理器停止调度第一任务之前，处理器获取第一任务的总执行时间和当前执行的时间，计算第一任务的剩余执行时间，在第一任务的剩余执行时间小于预设阈值时，处理器执行第一任务。

可选地，预设阈值包括切换备份时间。

也就是说，在第一虚拟机中，第一任务正在执行，有第二任务达到，处理器触发任务切换之前，先根据第一任务的总执行时间和当前执行的时间，计算第一任务的剩余执行时间，在第一任务的剩余执行时间小于预设阈值时，处理器仍执行第一任务，保证当前第一任务执行完成，以节约系统资源，提高业务的执行效率。

作为另一种示例，在处理器停止调度第一任务之前，处理器获取第一任务的总执行时间和当前执行的时间，计算第一任务的剩余执行时间，在第一任务的剩余执行时间小于第一任务的预设切换备份时间与预设倍数的乘积时，处理器执行所述第一任务。

其中，切换备份时间可以由NPU驱动器配置给NPU控制器，逻辑运算单元在不同核数、不同运行频率时的切换备份时间是不一样的，都由NPU驱动器配置给NPU控制器；预设倍数为提前配置好的。

也就是说，在第一虚拟机中，第一任务正在执行，有第二任务达到，处理器触发任务切换之前，先根据第一任务的总执行时间和当前执行的时间，计算第一任务的剩余执行时间，在第一任务的剩余执行时间小于第一任务的预设切换备份时间与预设倍数的乘积时，处理器仍执行第一任务，保证当前第一任务执行完成，以节约系统资源，提高业务的执行效率。

作为又一种示例，在处理器停止调度第一任务之前，处理器获取第一任务的总执行时间和当前执行的时间，计算第一任务的剩余执行时间，在第一任务的剩余执行时间大于或等于预设阈值时，处理器停止执行所述第一任务。

也就是说，在第一虚拟机中，第一任务正在执行，有第二任务达到，处理器触发任务切换之前，先根据第一任务的总执行时间和当前执行的时间，计算第一任务的剩余执行时间，在第一任务的剩余执行时间大于或等于预设阈值时，处理器停止执行第一任务，启动执行第二任务，以保证优先级高的第二任务的实时性，提高了业务的执行效率。

可选地，预设阈值包括切换备份时间。

作为一种示例，在处理器停止调度第一任务之后，将第一任务的执行信息存储至备份内存单元中。其中，第一任务的执行信息可以包括执行第一任务的逻辑运算单元的通用寄存器、专用寄存器、内部高速缓冲存储器、缓冲区中的数据等。

作为一种示例，处理器中的备份内存单元的数量满足以下关系式：

L＝e*g

其中，L表示处理器中的备份内存单元的数量，e表示处理器中的逻辑运算单元的数量，g表示实时类型优先级的等级个数。

在又一种可能的实现方式中，在第一虚拟机中没有时间片，且存在有待执行的执行序列时，处理器调度除第一虚拟机外的其他存在时间片的虚拟机执行第一虚拟机中的执行序列的任务。

也就是说，在第一虚拟机没有时间片但有待执行任务时，处理器可以调度其他有可用时间片或者有剩余时间片的虚拟机来执行任务，提高了虚拟机系统的业务处理效率，实现了处理器算力利用的最大化。

可选地，当所述第二任务执行完成时，处理器执行未完成的所述第一任务，即当实时任务或者更高优先级的任务执行完时，优先处理被抢占的任务，而不是执行新的任务，保证被抢占的任务先执行。

例如，某个普通类型优先级的任务被抢占，所有实时执行序列的任务都调度完成时，优先恢复被抢占的任务的执行，因为如果执行新的任务，而不是继续执行之前被打断的任务，则再次发生抢占时，对应的内存空间已经备份了现场信息，没有内存空间来备份这个任务的现场信息。

本申请提供的技术方案中，处理器根据多个虚拟机中每个虚拟机的算力比例，为虚拟机系统中的每个虚拟机分配时间片，算力比例越大的虚拟机分配到的时间片越多，实现了多个虚拟机对处理器算力的共享，满足了各个虚拟机的算力需求，同时保证了每个虚拟机中时间片分配的合理性，且当有优先级高的任务到达时，优先执行，可以保证高优先级任务执行的实时性。

下面以虚拟机系统中的处理器为NPU为例，对本申请提供的调度方法进行介绍。

图4为本申请一个实施例的一种调度方法的流程示意图。如图4所示，该方法至少包括S401至S407。图4所示的方法可以应用于图1所示的虚拟机系统100中。

S401，主机获取虚拟机配置信息。

需要说明的是，S401可以参考S201，此处不再进行赘述。

S402，主机根据虚拟机配置信息创建多个虚拟机。

在一种可能的实现方式中，主机获取的虚拟机配置信息中包括创建虚拟机的数量和创建的多个虚拟机中每个虚拟机的算力比例等信息。

作为一种示例，主机创建多个虚拟机的流程图如图5所示，主机中的虚拟机管理器(hypervisor)根据虚拟机配置信息，创建出多个虚拟机，hypervisor调用NPU驱动器(NPU driver)的接口，将各新增的虚拟机的虚拟机标识符(identity document，ID)和算力比例告知NPU driver，NPU driver将虚拟机ID告知虚拟机中的虚拟NPU驱动器(vNPU driver)，vNPU driver保存虚拟机ID信息，NPU driver将虚拟机ID和算力比例配置给NPU控制器，NPU控制器保存虚拟机ID和算力比例等信息。

S403，主机获取目标模型。

在一种可能的实现方式中，虚拟机系统中任意一个虚拟机中的APP获取目标模型，并对目标模型进行加载。

作为一种示例，目标模型可以为AI模型。

S404，主机根据目标模型创建多个执行序列。

在一种可能的实现方式中，虚拟机系统中任意一个虚拟机中的APP加载目标模型时，需要创建多个执行序列(执行序列)。

作为一种示例，图6为本申请一个实施例提供的创建执行序列的流程图。如图6所示，虚拟机管理器调用内存管理(runtime)的接口创建执行序列，并为创建的执行序列配置优先级，内存管理调用虚拟机中的虚拟NPU驱动器的接口申请执行序列ID，虚拟NPU驱动器向主机中的NPU驱动器申请执行序列ID，虚拟NPU驱动器将虚拟机ID也发给NPU驱动器，NPU驱动器为该虚拟机ID对应的虚拟机分配一个执行序列ID，并返回给虚拟NPU驱动器，NPU驱动器同时将虚拟机ID和执行序列ID配置给NPU控制器，NPU控制器保存虚拟机ID和执行序列ID信息，因此NPU控制器有各个虚拟机下执行序列ID的信息。

另外，APP不感知是运行在虚拟机上还是主机上，内存管理给APP提供的接口一样，执行序列的优先级定义也一样。其中，执行序列的优先级可以分为实时类型的优先级和普通类型的优先级，实时类型的优先级和普通类型的优先级又可以进一步细分为多个等级。

例如，实时优先级可以分为SP0、SP1和SP2三个等级，SP0的优先级高于SP1的优先级，SP1的优先级高于SP2的优先级；普通类型的优先级可以分为WRR0、WRR1、WRR3和WRR4四个等级，WRR0的优先级高于WRR1的优先级，WRR1的优先级高于WRR2的优先级，WRR2的优先级高于WRR3的优先级，WRR3的优先级高于WRR4的优先级；实时类型优先级的执行序列可以抢占普通类型优先级的执行序列，等级高的实时类型优先级的执行序列可以抢占等级低的实时类型优先级的执行序列；其优先级抢占的示意图如图7所示，优先级为SP0的执行序列可以抢占优先级为SP1和SP2的执行序列，优先级为SP1的执行序列可以抢占优先级为SP2的执行序列，普通类型优先级的等级高低可以体现于时间片的大小。

S405，主机向NPU发送资源配置信息。

虚拟机系统中的多个虚拟机共享NPU的资源，主机向NPU发送的资源配置信息用于指示NPU对多个虚拟机进行资源分配。

作为一种示例，主机向NPU发送的资源配置信息可以包括多个虚拟机中每个虚拟机的算力比例，每个虚拟机中执行序列的优先级和为每个虚拟机进行资源分配的周期长度等信息。

S406，NPU根据资源配置信息对多个虚拟机进行资源分配。

在一种可能的实现方式中，在资源配置信息指示的每个资源分配周期中，NPU控制器给各个虚拟机分配时间片。

作为一种示例，NPU控制器为第一虚拟机分配的时间片可以满足公式Y＝1000*1000/t*m*p，其中，Y表示NPU为第一虚拟机分配的时间片，t表示调度周期，在每个调度周期，处理器为第一虚拟机分配时间片，m表示NPU中逻辑运算单元的数量，p表示第一虚拟机的算力比例。时间片的单位为微秒(us)，资源配置信息指示的资源分配周期可以为30赫兹(hertz，HZ)。

在一种可能的实现方式中，NPU控制器按照第一虚拟机中执行序列的优先级为普通类型优先级的执行序列分配时间片。

作为一种示例，第一虚拟机中为普通类型优先级WRR0至WRR4的执行序列分配时间片的比例可以为10:8:4:2:1。由于实时类型优先级的执行序列可以抢占普通类型优先级的执行序列的时间片，因此实时类型优先级的执行序列不分配时间片。

作为一种示例，在多个虚拟机的任意一个虚拟机中，实时类型优先级的执行序列运行时，NPU控制器按照普通类型优先级的时间片比例，扣除普通类型优先级的执行序列的时间片，扣除时间片的总数就是实时类型优先级的执行序列使用的时间片，从而使得普通类型优先级的执行序列的时间片仍然满足预设比例。

在一种可能的实现方式中，在一个资源分配周期结束后，NPU控制器给各个虚拟机重新分配时间片。

作为一种示例，如果任意虚拟机在上个资源分配周期没有使用完时间片，剩余的时间片不带入下一个资源分配周期；如果任意虚拟机使用的时间片超出分配的规格，则应该是最后一个执行序列的任务(task)执行时间导致的，由于task的执行时间远小于虚拟机的时间片，因此超出部分也不在下一个资源分配周期中扣除。在虚拟机内部，普通类型优先级的执行序列没有使用完的时间片也不带入下一个资源分配周期，但是上一个资源分配周期中多用的时间片会在下一次分配时间片时扣除。

S407，NPU对多个虚拟机中的任务进行调度。

在一种可能的实现方式中，NPU中的NPU控制器对虚拟机系统中执行序列的任务进行调度。

作为一种示例，NPU控制器先调度有时间片的虚拟机中的实时类型优先级的执行序列和有时间片的普通类型优先级的执行序列，如果这些执行序列都没有任务调度，再调度其它执行序列，例如，没有时间片的执行序列。

作为另一种示例，在有实时类型优先级和普通类型优先级的执行序列一起调度时，按照实时高优先级、实时低优先级、普通优先级的顺序依次调度每种类型的执行序列。即等级高的实时类型优先级的执行序列都调度完成后，再调度等级低的实时类型优先级的执行序列，最后调度普通类型的执行序列。

作为又一种示例，在有多个同等优先级的执行序列一起调度时，任意一个执行序列的运行时间超过预设时间，或该执行序列的时间片用完，则NPU控制器调度其它执行序列。这种情况下，NPU控制器待当前运行的任务(task)执行完成后再切换其它执行序列的task，不中途切换正在执行的task/block。

在一种可能的实现方式中，NPU控制器在每个block执行完成时，可以得到block运行所用的时间片，并扣除对应的执行序列和虚拟机的时间片。

作为一种示例，在有时间片的虚拟机中普通类型优先级的任务正在执行时，有实时类型优先级执行序列的任务达到，则停止调度普通类型优先级的任务，启动调度实时类型优先级的任务。虚拟机中实时类型优先级执行序列的任务调度完成后，实时类型优先级任务所使用的时间片需要从该虚拟机的普通优先级执行序列的时间片中扣除。

示例性的，在实时类型优先级的执行序列有任务到达时，如果逻辑运算单元正在执行普通类型优先级执行序列的task的block；或等级低的实时类型优先级执行序列的task执行时，等级高的实时类型优先级执行序列的任务到达，NPU控制器需要中断正在执行的block，转而执行实时(高)优先级task的block，这个过程可以称为抢占。

执行序列的task/block的执行被打断后，NPU控制器需要备份该block当前运行的现场信息，现场信息可以包括执行该block的逻辑单元中的通用寄存器信息、专用寄存器信息、内部高速缓冲存储器(buffer)中的信息和缓冲区(cache)中的信息等。逻辑运算单元中的buffer和cache空间比较大，因此需要同样大的内存空间来备份这些信息。其中，备份一个逻辑运算单元所有现场信息(所有的通用寄存器、专用寄存器、buffer、cache)的内存空间称为一个备份内存单元。

作为一种示例，NPU中的备份内存单元的数量可以满足关系式L＝e*g，其中，L表示NPU中备份内存单元的数量，e表示NPU中逻辑运算单元的数量，g表示实时类型的优先级的等级个数。

示例性的，实时类型的优先级有3个等级，分别为SP0、SP1和SP2，则g的取值为3。

示例性的，每个逻辑运算单元中备份内存单元的数量等于实时类型的优先级的等级个数。实时类型的优先级有3个等级时，NPU中每个逻辑运算单元中备份内存单元的数量为3个。每个内存备份块用于存放逻辑运算单元的通用寄存器、专用寄存器、内部cache、buffer的数据，即逻辑运算单元运行block的现场信息。

可选地，图8为本申请一个实施例提供的备份内存单元示意图，如图8所示，NPU中包括多个逻辑运算单元(逻辑运算单元0至逻辑运算单元3)，由控制器进行控制，每个逻辑运算单元包括多个内部高速缓冲存储器(buffer)和多个缓冲区(cache)等，备份内存单元0至备份内存单元3中可以备份一个逻辑运算单元所有现场信息(所有的通用寄存器、专用寄存器、buffer、cache)。

示例性的，抢占发生时，被抢占的block在逻辑运算单元中的现场信息，备份到对应的空间中。优先级为普通类型的执行序列被优先级为实时类型SP0/1/2的执行序列抢占时，现场信息备份在备份内存单元2中；如果优先级为实时类型优先级SP2的执行序列被优先级为实时类型优先级SP0/1的执行序列抢占时，现场信息备份在备份内存单元1中；优先级为实时类型优先级SP1的执行序列被优先级为实时类型优先级SP0的执行序列抢占时，现场信息备份在备份内存单元0中。

示例性的，NPU驱动器根据NPU中逻辑运算单元的数量，分配备份内存单元的总空间，NPU驱动器在NPU启动时，将备份内存单元配置给NPU控制器。

作为一种示例，逻辑运算单元正在执行普通类型优先级的task/block或等级低的实时类型优先级的task/block时，NPU控制器检测到实时类型的执行序列或等级高的实时类型优先级的执行序列中有任务达到，则NPU控制器配置逻辑运算单元的控制寄存器，使逻辑运算单元停止执行当前的block，逻辑运算单元停止内部各执行序列水线的执行，并给NPU控制器回信号，告知NPU控制器已经停止执行当前block，NPU控制器配置逻辑运算单元的控制寄存器，使逻辑运算单元开启备份功能，逻辑运算单元启动内存标签扩展(memory tagging extension，MTE)，将寄存器、cache、buffer中的数据备份到指定的备份内存单元中，逻辑运算单元给NPU控制器回信号，告知NPU控制器备份完成，NPU控制器记录被停止的执行序列、task、block的信息，NPU控制器将实时(高)优先级task的block配置给逻辑运算单元，逻辑运算单元执行当前配置的实时类型优先级task的block。

作为一种示例，被抢占的task和执行序列队列中待调度的task都有调度机会时，优先恢复被抢占的task的block。

示例性的，某个普通类型优先级的task被抢占后，当所有实时类型优先级执行序列的task都调度完成时，优先恢复执行被抢占的task。因为如果执行新的task，而不是继续执行之前被打断的task，则再次发生抢占时，对应的内存空间已经备份了现场信息，没有内存空间来备份这个新的task的现场信息。

示例性的，抢占恢复执行序列程可以包括：NPU控制器配置逻辑运算单元的寄存器，使逻辑运算单元开启现场恢复功能，逻辑运算单元启动MTE，从指定的备份内存单元中把数据恢复到寄存器、cache和buffer中，逻辑运算单元给NPU控制器回信号，告知NPU控制器恢复完成，NPU控制器配置逻辑运算单元，使逻辑运算单元开始执行被抢占的block，即从当前恢复的环境继续执行之前被中断的block，同时NPU控制器清除备份内存单元中记录的被停止的执行序列、task、block信息。

需要说明的是，在逻辑运算单元A被抢占的block，可以在逻辑运算单元B上恢复运行。

作为一种示例，由于抢占需要备份和恢复环境，因此开销较大。如果当前block的执行剩余时间小于备份时间，则让该block执行完成比发生抢占更有利于任务调度，提高任务执行效率。那么，NPU控制器需要知道当前执行的task或block的总执行时间和已经执行的时间，才能知道当前的block还需要执行多长时间才能结束，才能知道是否可以避免抢占。因此需要增加task或block的执行时间统计。

示例性的，为NPU中每个逻辑单元内部增加一个性能统计计数器t_cnt，用于统计block的执行周期(cycle)数，为每个task增加一个空间存放task/block的执行cycle数，这个执行cycle数是根据block实际执行时间得来的，因此模型加载时执行cycle数为0。

示例性的，逻辑运算单元开始执行block时，将性能统计计数器t_cnt设置为0，执行过程中，逻辑运算单元每个cycle将t_cnt加1。在逻辑运算单元执行block过程中，NPU控制器可以读取block已经执行的cycle数，block执行结束时，NPU控制器可以获取block的执行总cycle数。

示例性的，NPU控制器控制调度task/block执行，block执行结束时，NPU控制器读取逻辑运算单元的t_cnt值，即block的执行时间，汇总到执行队列中对应的task的cyele数的位置，因此可以得到task的总执行cycle数，总执行cycle数除以block数，可以得到block的平均执行时间。

如果NPU中逻辑运算单元的频率和核数发生调整，task的执行cycle数也会变化，因此NPU控制器需要重新统计task的执行cycle数。NPU控制器只在第一次运行AI模型，或NPU中逻辑运算单元的频率和核数发生调整时，才重新统计和更新task的总cycle数。

作为一种示例，NPU控制器配置预设阈值，如果当前执行的block的剩余时间小于预设阈值，则不进行抢占，执行完当前的block后，再执行新到达的task的block。

示例性的，配置的预设阈值可以为切换备份时间的倍数，如果当前执行的block的剩余执行时间小于预设的切换备份时间的倍数，则不进行抢占。切换备份时间可以由NPU驱动器配置给NPU控制器，逻辑运算单元在不同核数、不同运行频率时的切换备份时间是不一样的，都由NPU驱动器配置给NPU控制器。

需要说明的是，模型初次运行、逻辑运算单元发生核数调整、运行频率调整时，模型队列中的task信息里没有task的执行统计时间，因此控制器不考虑抢占避免，直接抢占。模型执行一次后就有了task执行统计时间，之后NPU控制器就可以执行抢占避免操作。

在一种可能的实现方式中，当有时间片的虚拟机中的实时类型优先级的执行序列或有时间片的执行序列都没有任务调度时，NPU控制器进行空闲处理。

作为一种示例，NPU控制器调度有时间片的虚拟机执行没有时间片的虚拟机中的所有执行序列和虚拟机有时间片但执行序列无时间片的执行序列，并且在调度过程中，不区分执行序列的优先级，每个执行序列均执行预设时间后，再调度其它执行序列。

作为一种示例，在空闲处理状态下，执行序列的task执行的时间，不占用该虚拟机分配的时间片。

作为一种示例，在有时间片的虚拟机执行其它虚拟机中执行序列的task时，该虚拟机中实时类型优先级的执行序列有任务到达，则停止调度当前任务，启动调度到达的实时类型优先级执行序列的任务；如果是普通类型优先级的执行序列有任务到达，则等待当前任务执行完成后，调度该虚拟机执行到达的普通类型优先级执行序列的任务。

在一种可能的实现方式中，若虚拟机没有时间片，但该虚拟机中实时类型优先级的执行序列有task待调度，则表示该虚拟机资源分配异常。

作为一种示例，出现虚拟机资源分配异常的一种情况可以为该虚拟机中都是实时类型优先级的执行序列或该虚拟机中实时类型优先级执行序列的数量远远大于普通类型优先级执行序列的数量，导致该虚拟机分配的算力过小，解决方法是增加该虚拟机的算力比例。

作为另一种示例，NPU控制器调度该虚拟机执行实时类型优先级执行序列的task前，普通类型优先级的执行序列已用完该虚拟机中的时间片，导致该虚拟机中无时间片执行实时类型优先的执行序列，解决方法可以是将普通类型优先级的执行序列移到另外的虚拟机中执行或增加该虚拟机的算力。

本申请提供的技术方案，使虚拟机系统中各虚拟机按照配置的NPU算力比例，共享NPU算力；实时类型的任务优先执行，实时类型任务可以使用所有的NPU逻辑运算单元，从而保证了实时任务的实时性；当当前执行任务的block的剩余执行时间小于预设阈值时，NPU控制器不做抢占切换，提高了NPU的使用效率，同时提高了实时任务的实时性。

图9为本申请一个实施例的调度装置的示意性结构图。如图9所示，装置900可以包括分配模块901、执行模块902、接收模块903、调度模块904、获取模块905、计算模块906和存储模块907。装置900可以用于实现图2和图4中由处理器实现的操作。

本申请实施例中的任意模块可以全部或部分通过软件和/或硬件方式实现。

在一种实现方式中，装置900可以用于实现上述图2所示的方法。例如，分配模块901用于实现S204，执行模块902用于实现S205。

在另一种实现方式中，装置900还可以包括调度模块，该实现方式中的装置900可以用于实现上述图4所示的方法。例如，分配模块901用于实现S406，调度模块用于实现S407。

图10为本申请另一个实施例的调度装置的示意性结构图。如图10所示，装置1000可以包括获取模块1001、创建模块1002、发送模块1003和配置模块1004。装置1000可以用于实现图2和图4中由主机实现的操作。

在一种实现方式中，装置1000可以用于实现上述图2所示的方法。例如，获取模块1001用于实现S201，创建模块1002用于实现S202，发送模块1003用于实现S203。

在另一种实现方式中，装置1000可以用于实现上述图4所示的方法。例如，获取模块1001用于实现S401和S403，创建模块1002用于实现S402和S404，发送模块1003用于实现S405。

图11为本申请一个实施例提供的调度装置的结构示意图。图11所示的装置1100 可以用于执行前述任意一个实施例所述的方法。

如图11所示，本实施例的装置1100包括：存储器1101、处理器1102、通信接口1103以及总线1104。其中，存储器1101、处理器1102、通信接口1103通过总线1104实现彼此之间的通信连接。

存储器1101可以是只读存储器(read only memory，ROM)，静态存储设备，动态存储设备或者随机存取存储器(random access memory，RAM)。存储器1101可以存储程序，当存储器1101中存储的程序被处理器1102执行时，处理器1102可以用于执行图2至图4所示的方法的各个步骤。

处理器1102可以采用通用的中央处理器(central processing unit，CPU)，微处理器，应用专用集成电路(application specific integrated circuit，ASIC)，或者一个或多个集成电路，用于执行相关程序，以实现本申请方法实施例的调度方法。

处理器1102还可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，本申请各个实施例的方法的各个步骤可以通过处理器1102中的硬件的集成逻辑电路或者软件形式的指令完成。

上述处理器1102还可以是通用处理器、数字信号处理器(digital signal processing，DSP)、专用集成电路(ASIC)、现成可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1101，处理器1102读取存储器1101中的信息，结合其硬件完成本申请实施例中各个方法所需执行的功能，例如，可以执行图2至图4所示实施例的各个步骤/功能。

通信接口1103可以使用但不限于收发器一类的收发装置，来实现装置1100与其他设备或通信网络之间的通信。

总线1104可以包括在装置1100各个部件(例如，存储器1101、处理器1102、通信接口1103)之间传送信息的通路。

应理解，本申请实施例所示的装置1100可以是电子设备，或者，也可以是配置于电子设备中的芯片。

应理解，本申请实施例中的处理器可以为中央处理单元(central processing unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现成可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

还应理解，本申请实施例中的存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器 (read-only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasable PROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的随机存取存储器(random access memory，RAM)可用，例如静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM，DR RAM)。

上述实施例，可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时，上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质。半导体介质可以是固态硬盘。

应理解，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况，其中A,B可以是单数或者复数。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系，但也可能表示的是一种“和/或”的关系，具体可参考前后文进行理解。

本申请中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a,b,或c中的至少一项(个)，可以表示：a,b,c,a-b,a-c,b-c,或a-b-c，其中a,b,c可以是单个，也可以是多个。

应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种调度方法，其特征在于，应用于虚拟机系统，所述虚拟机系统包含多个虚拟机，所述多个虚拟机共享处理器的算力，所述方法包括：

所述处理器根据第一配置信息为所述多个虚拟机中的每个虚拟机分配时间片，所述第一配置信息用于指示所述多个虚拟机中每个虚拟机的算力比例；

在所述多个虚拟机中的第一虚拟机中存在所述时间片，且第一任务正在执行时，有第二任务到达，所述处理器停止执行所述第一任务，且调度执行所述第二任务，所述第二任务所属的执行序列的优先级高于所述第一任务所属的执行序列的优先级。
根据权利要求1所述的方法，其特征在于，所述多个虚拟机中的第一虚拟机包括n个执行序列，n为大于或等于0的整数；

所述方法还包括：

所述处理器根据所述第一配置信息和第二配置信息为所述n个执行序列中的s个执行序列分配所述时间片，所述第二配置信息用于指示所述第一虚拟机中的所述n个执行序列的优先级，s为小于或等于n的整数。
根据权利要求2所述的方法，其特征在于，所述第一虚拟机中的执行序列的优先级包含普通类型的优先级和实时类型的优先级，所述实时类型的优先级高于所述普通类型的优先级；

其中，所述s个执行序列的优先级为普通类型的优先级。
根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：

所述处理器根据所述第一配置信息和第三配置信息为所述每个虚拟机分配所述时间片，所述第三配置信息用于指示所述处理器为所述多个虚拟机分配时间片的周期长度。
根据权利要求4所述的方法，其特征在于，所述处理器为所述多个虚拟机分配时间片的周期长度大于或等于优先级为实时类型的优先级的执行序列的执行周期的周期长度。
根据权利要求1至5中任一项所述的方法，其特征在于，所述方法还包括：

所述处理器接收所述第一配置信息。
根据权利要求1至6中任一项所述的方法，其特征在于，所述方法还包括：

在所述多个虚拟机中的第一虚拟机中存在时间片和待执行的x个第一执行序列和q个第二执行序列时，所述处理器优先调度所述q个第二执行序列中的任务，所述第一执行序列的优先级为普通类型的优先级，所述第二执行序列的优先级为实时类型的优先级，x和q为大于或等于0的整数。
根据权利要求7所述的方法，其特征在于，所述处理器优先调度所述q个第二执行序列中的任务，包括：

所述q个第二执行序列中实时类型的优先级还包括第一实时优先级和第二实时优先级，所述第一实时优先级的优先级高于所述第二实时优先级；

所述处理器优先调度所述q个第二执行序列中第一实时优先级的任务。
根据权利要求7或8所述的方法，其特征在于，所述第一任务属于所述x个第一执行序列中的任意一个执行序列，所述第二任务属于所述q个第二执行序列中的任意一个执行序列。
根据权利要求9所述的方法，其特征在于，若所述x个第一执行序列中存在时间片分配比例，则在所述q个第二执行序列中的任务执行完成后，所述处理器根据所述时间片分配比例将剩余的时间片分配给所述x个第一执行序列，所述剩余的时间片为所述处理器为所述x个第一执行序列分配的时间片的总和与所述q个第二执行序列中的任务执行所使用的时间片的差值。
根据权利要求7或8所述的方法，其特征在于，所述第一任务和所述第二任务属于所述q个第二执行序列中不同的执行序列，且所述第二任务所属执行序列的优先级高于所述第一任务所属执行序列的优先级。
根据权利要求9至11中任一项所述的方法，其特征在于，所述方法还包括：

所述处理器获取所述第一任务的总执行时间和当前执行的时间；

所述处理器根据所述第一任务的总执行时间和所述当前执行的时间，计算所述第一任务的剩余执行时间；

在所述第一任务的剩余执行时间小于预设阈值时，所述处理器执行所述第一任务。
根据权利要求9至11中任一项所述的方法，其特征在于，所述方法还包括：

所述处理器获取所述第一任务的总执行时间和当前执行的时间；

所述处理器根据所述第一任务的总执行时间和所述当前执行的时间，计算所述第一任务的剩余执行时间；

在所述第一任务的剩余执行时间小于所述第一任务的预设切换备份时间与预设倍数的乘积时，所述处理器执行所述第一任务。
根据权利要求9至11中任一项所述的方法，其特征在于，所述方法还包括：

所述处理器获取所述第一任务的总执行时间和当前执行的时间；

所述处理器根据所述第一任务的总执行时间和所述当前执行的时间，计算所述第一任务的剩余执行时间；

在所述第一任务的剩余执行时间大于或等于预设阈值时，所述处理器停止执行所述第一任务。
根据权利要求9至13中任一项所述的方法，其特征在于，所述方法还包括：

将所述第一任务的执行信息存储至备份内存单元中。
根据权利要求15所述的方法，其特征在于，所述第一任务的执行信息包括以下信息的一种或多种：执行所述第一任务的逻辑运算单元的通用寄存器、专用寄存器、内部高速缓冲存储器、缓冲区中的数据。
根据权利要求15或16所述的方法，其特征在于，所述处理器中的备份内存单元的数量满足以下关系式：

L＝e*g

其中，L表示所述处理器中的备份内存单元的数量，e表示所述处理器中的逻辑运算单元的数量，g表示实时类型的优先级的等级个数。
根据权利要求1至17中任一项所述的方法，其特征在于，所述方法还包括：

当所述第二任务执行完成时，所述处理器执行未完成的所述第一任务。
根据权利要求7至18中任一项所述的方法，其特征在于，所述方法还包括：

在所述第一虚拟机中没有时间片，且存在有待执行的执行序列时，所述处理器调度除所述第一虚拟机外的其他存在时间片的虚拟机执行所述第一虚拟机中的执行序列的任务。
根据权利要求1至19中任一项所述的方法，其特征在于，所述处理器根据第一配置信息为所述每个虚拟机分配的时间片满足如下关系式：

Y＝1000*1000/t*m*p

其中，Y表示为所述每个虚拟机分配的时间片；t表示调度周期，在每个所述调度周期，所述处理器为所述每个虚拟机分配所述时间片；m表示所述处理器中逻辑运算单元的数量；p表示所述每个虚拟机的算力比例。
一种调度方法，其特征在于，应用于虚拟机系统，所述虚拟机系统包含主机，所述方法包括：

所述主机获取虚拟机配置信息，所述虚拟机配置信息用于指示创建多个虚拟机，所述虚拟机配置信息包括所述多个虚拟机中每个虚拟机的算力比例；

所述主机根据所述虚拟机配置信息，创建所述多个虚拟机，所述多个虚拟机共享处理器的算力；

所述主机向所述处理器发送第一配置信息，所述第一配置信息用于指示所述多个虚拟机中每个虚拟机的算力比例。
根据权利要求21所述的方法，其特征在于，所述方法还包括：

所述主机获取多个模型；

所述主机根据所述多个模型中的第一模型为所述多个虚拟机中的第一虚拟机创建n个执行序列，n为大于或等于0的整数；

所述主机为所述n个执行序列中的每个执行序列配置优先级；

向所述处理器发送第二配置信息，所述第二配置信息用于指示所述第一虚拟机中的n个执行序列的优先级。
根据权利要求22所述的方法，其特征在于，所述优先级包含普通类型的优先级和实时类型的优先级，所述实时类型的优先级高于所述普通类型的优先级。
根据权利要求21至23中任一项所述的方法，其特征在于，所述虚拟机配置信息还包括为所述多个虚拟机分配时间片的周期长度；

所述方法还包括：

所述主机向所述处理器发送第三配置信息，所述第三配置信息用于指示为所述多个虚拟机分配时间片的周期长度。
根据权利要求24所述的方法，其特征在于，所述为所述多个虚拟机分配时间片的周期大于或等于优先级为实时类型的优先级的执行序列的执行周期。
一种调度装置，其特征在于，包括：存储器和处理器；

所述存储器用于存储程序指令；

所述处理器用于调用所述存储器中的程序指令执行如权利要求1至20中任一项所述的方法或权利要求21至25中任一项所述的方法。
一种芯片，其特征在于，包括至少一个处理器和通信接口，所述通信接口和所述至少一个处理器通过线路互联，所述至少一个处理器用于运行计算机程序或指令，以执行如权利要求1至20中任一项所述的方法或权利要求21至25中任一项所述的方法。
一种计算机可读介质，其特征在于，所述计算机可读介质存储用于计算机执行的程序代码，该程序代码包括用于执行如权利要求1至20中任一项所述的方法或权利要求21至25中任一项所述的方法的指令。
一种计算机程序产品，其特征在于，所述计算机程序产品包括指令，当所述指令被执行时，使得计算机执行权利要求1至20中任一项所述的方法或权利要求21至25中任一项所述的方法。
一种车辆，其特征在于，所述车辆包括如权利要求26所述的调度装置或如权利要求27所述的芯片。