CN115442251A

CN115442251A - 为多个用户提供网络服务质量

Info

Publication number: CN115442251A
Application number: CN202210591616.5A
Authority: CN
Inventors: R·Y·埃弗雷姆; Y·弗里德曼; E·希施贝格
Original assignee: Mellanox Technologies Ltd
Current assignee: Mellanox Technologies Ltd
Priority date: 2021-06-03
Filing date: 2022-05-27
Publication date: 2022-12-06
Anticipated expiration: 2042-05-27
Also published as: CN115442251B; DE102022205480A1; US20220394081A1

Abstract

本公开涉及为多个用户提供网络服务质量。一种促进多个代理的有效操作的系统，所述系统包括：服务所述多个代理的设备；以及功能，其驻留在所述设备上且向所述多个代理中的代理的至少一个子集提供根据至少一个资源限定的给定服务质量。

Description

为多个用户提供网络服务质量

技术领域

本发明总体上涉及服务提供商设备，并且更具体地涉及在服务提供商设备上绑定的服务级别协议。

背景技术

根据维基百科的服务级别协议(SLA)，“是服务提供商和客户之间的承诺。服务提供商与服务用户之间商定服务的具体方面-质量、可用性、责任。SLA中最常见的组成部分是应按照合同中的约定向客户提供服务。作为示例，互联网服务提供商和电信运营商将通常包括在其与客户的合同条款内的服务级别协议，以定义以纯语言条款出售的服务级别。在这种情况下，SLA将通常具有以下技术定义：平均故障间隔时间(MTBF)、平均修复时间或平均恢复时间(MTTR)；识别哪一方负责报告故障或支付费用；负责各种数据速率；吞吐量；抖动”。

例如，服务级别协议可以指定与网络服务应用相关联的性能度量。

云计算可涉及由共享基础设施环境支持的共享资源。对云性能的测量、监视和报告可以基于最终用户体验(end UX)。维基百科关于服务级别协议表达了对“由于环境的复杂性质而难以确定服务中断的根本原因”的关注。

网络交换机例如在Wikipedia.org/wiki/Network_switch在线描述。

网络适配器(如果物理的)可以是工作站的硬件的组件，其能够使工作站通过有线或无线网络与网络上的其他节点(例如，工作站、服务器、联网设备)通信。然而，网络适配器也可以是虚拟的。虚拟网络适配器或虚拟NIC(网络接口卡)可以包括物理网络适配器的逻辑或软件实例，并且可以使物理工作站或虚拟机或其他计算机能够连接到有线或无线网络，由此经由网络与网络上的其他节点通信。虚拟网络适配器通常包括程序，与用硬件实现的物理网络适配器不同，但是虚拟和物理网络适配器都允许计算机连接到网络或将第一网络(例如，广域网或局域网(LAN或WAN))上的所有计算机连接到第二、通常更大的网络，例如互联网。

示例虚拟机在线描述，位于techterms.com/definition/virtual_machine。

SR-IOV虚拟功能在以下在线位置进行描述：docs.microsoft.com/en-us/windows-hardware/driver/network/sr-iov-virtual-functions--vfs-。

例如，在“调度(计算)”的维基百科条目中描述了传统的调度方法。例如，在“网络调度器”的维基百科条目中描述了网络调度器。

在关于“完全公平调度器”的维基百科条目中描述了常规的“完全公平调度器”。

发明内容

某些实施例寻求提供一种促进多个代理的有效操作的系统、方法和计算机程序产品。

示例实施例包括以下；

实施例1.一种促进多个代理的有效操作的系统，所述系统包括：设备，其通常服务所述多个代理；和/或功能，其通常驻留在所述设备上，并且通常向来自所述多个代理中的代理的至少一个子集提供给定服务质量，所述服务质量可以根据至少一个资源来限定。

实施例2.根据任一前述实施例的系统，其中所述服务质量根据至少一个资源r1来限定，服务所述多个代理的所述设备未被配置为控制所述至少一个资源r1向所述多个代理中的至少一些代理的分配，但是所述设备被配置为测量由所述多个代理中的至少一些代理中的每个代理对至少一个资源r1的使用级别，并且因此确定资源r1的级别是否提供所述给定服务质量。

实施例3.根据前述实施例中任一项所述的系统，其中通过控制另一个资源r2，所述至少一个资源r1由所述功能间接地改变，服务所述多个代理的所述设备被配置为测量所述至少一个资源r1的使用，但是所述设备未被配置为控制所述至少一个资源r1向所述多个代理的分配，所述设备被配置为控制所述另一个资源r2向所述多个代理的分配。

实施例4.根据前述实施例中任一项所述的系统，其中所述功能至少一次测量至少一个资源r1中有多少被分配给所述多个代理中的至少一个代理A，考虑到所述给定服务质量来识别不正确数量的资源r1已经被分配给代理A，并且作为响应，通过控制资源r2来间接地改变资源r1。

实施例5.根据前述实施例中任一项所述的系统，其中至少一个代理A对资源r2的使用与所述代理A对资源r1的使用之间的关系是已知的。

实施例6.根据前述实施例中任一项所述的系统，其中人工智能用于学习r2与r1的关系。

实施例7.根据前述实施例中任一项所述的系统，其中r2与r1的已知关系是：至少在一些已知条件下，r1是r2的递减函数，使得至少在给定所述已知条件下，当r2增加时，r1减小，以及当r2减小时，r1增加。

实施例8.根据前述实施例中任一项所述的系统，其中r2与r1的已知关系是：至少在一些已知条件下，r1是r2的增加函数，使得至少在给定所述已知条件下，当r2增加时，r1增加，以及当r2减小时，r1减小。

实施例9.根据前述实施例中任一项所述的系统，其中向代理的至少一个子集提供QoS的所述功能至少一次动态地计算所述关系，并且相应地修改至少一个QoS参数。

实施例10.根据前述实施例中任一项所述的系统，其中向代理的至少一个子集提供QoS的所述功能使用至少一种启发法并且相应地修改至少一个QoS参数。

实施例11.根据前述实施例中任一项所述的系统，其中所述设备被配置为测量但未被配置为控制的所述资源包括PPS。

实施例12.根据前述实施例中任一项所述的系统，其中所述设备被配置为控制的所述资源包括带宽。

实施例13.根据前述实施例中任一项所述的系统，其中所述代理中的至少一个代理包括虚拟机。

实施例14.根据前述实施例中任一项所述的系统，其中所述代理中的至少一个代理包括物理计算机。

实施例15.根据前述实施例中任一项所述的系统，其中所述设备包括交换设备，所述交换设备包括所述功能驻留在其上的物理网络交换机。

实施例16.根据前述实施例中任一项所述的系统，其中所述设备包括交换设备，所述交换设备包括所述功能驻留在其上的虚拟网络交换机。

实施例17.根据前述实施例中任一项所述的系统，其中所述服务质量包括始终被提供给所述多个代理的给定子集中的每个代理的资源的最小量。

实施例18.根据前述实施例中任一项所述的系统，其中所述服务质量包括由所述多个代理的给定子集中的每个代理使用的资源的量不许超过的资源的最大量。

实施例19.一种促进多个代理的有效操作的方法，所述方法结合服务多个代理的设备进行操作，所述方法包括：

提供驻留在所述设备上并且提供给定服务质量的功能；以及

使用所述功能向所述多个代理中的每个单独代理提供根据至少一个资源限定的服务质量，其中所述服务质量是根据至少一个资源r1限定的，所述设备不能控制至少一个资源r1向所述多个代理中的至少一些代理的分配，但是所述设备被配置为测量由所述多个代理中的至少一些代理中的每个代理对至少一个资源r1的使用级别，并且因此确定资源r1的级别是否提供所述给定服务质量，并且其中当通过控制另一个资源r2，所述至少一个资源r1由所述功能间接改变时，提供所述服务质量，所述设备被配置为控制所述另一个资源r2向所述多个代理的分配。

实施例20.根据前述实施例中任一项所述的系统，其中r2与r1的关系对于所述功能来说是已知的，从而定义r2与r1的已知关系。

实施例21.根据前述实施例中任一项所述的系统，其中r2与r1的已知关系是：至少在一些已知条件下，r1是r2的增加函数，使得至少在给定所述已知条件，当r2增加时，r1增加，以及当r2减小时，r1减小。

实施例22.根据前述实施例中任一项所述的系统，其中所述多个代理中的至少一个代理包括网络端口。

实施例23.根据前述实施例中任一项所述的系统，其中对于代理的子集中的所有代理共同定义至少一个QoS属性，其中所述子集包括少于所述系统中的代理的总数。

实施例24.根据前述实施例中任一项所述的系统，其中资源r2被来自所述系统中的所有代理的所有任务所使用。

某些实施例寻求提供改进的网络适配器和/或交换机和/或DPU，并且可以包括驻留在适配器SW的任何适当层中的软件。应当理解，单个网络适配器和/或交换机和/或DPU(数据处理单元)可以由多个用户或代理共享，例如由多个虚拟功能共享，例如多个SR-IOV虚拟功能。传统上讲，用户或代理之间的服务质量由管理员使用最小和最大网络带宽来限定，该最小和最大网络带宽应当满足用户或代理与虚拟化提供商之间的SLA。然而，网络带宽可能不是唯一需要服务质量(QoS)限定的有限资源。可替代地或附加地，有限的资源可以是实现特定的和/或提供商特定的，并且因此不能由管理员直接管理，或者在SLA中限定。可替代地或此外，由代理执行的任务可以在特征(例如，分组大小、所需要的卸载等)上不同。由此，管理员不能预先为每个代理静态分配资源，并且在任务被调度执行时适配器不能考虑所有需要的资源。替代地或附加地，代理通常不擅长提供关于他们将使用的任务的准确信息。替代地或附加地，将成为瓶颈的实际资源无法预先得知，并且即使将成为瓶颈的实际资源预先得知或学习，瓶颈可随时间改变，使得基于单个资源的QoS方案比本文中的实施例较不有利。

调度策略可以指(或表达为)两种类型的资源，即rl和r2两者(这些类型中的每一者可编号一个或更多个资源)。例如，调度策略可以定义最小BW和/或最大BW，并且还可以定义每秒最小分组(PPS)和/或最大PPS。使用本文的实施例，可通过控制其对代理的分配可由系统控制的资源r2来隐式地或间接地实现对于可测量但不可控制的资源r1的策略。可替代地或此外，在此的实施例可以用于实现针对两种类型的资源(针对r1型资源和r2型资源两者，并且这可以同时两者)的策略。

示例：当计算MaxR2＝minimum(OrigMaxR2，MaxR1)时，系统不是仅仅涉及R1信息，而是同时涉及R2要求。

可以理解，在每个时间点，可能会遇到不同的瓶颈。根据某些实施例，管理员可以定义多于一个SLA类型属性，也称为QoS属性(例如，最小/最大带宽(BW)、每秒最小/最大分组(PPS))，并且作为响应，适配器可以使用基于一个设备支持的资源(BW)的QoS来应用SLA，同时周期性地或连续地仅监控(也称为测量)其他资源的使用。适配器可以评估是否满足SLA，并且可以测量资源的利用率。资源分配可相应地改变以满足SLA和/或改善资源利用率(例如，如果SLA已经满足)。

根据某些实施例，监控(亦称测量)每个代理的资源消耗。在至少一个实例中，当未维持QoS要求(SLA)时，QoS属性(比如带宽的)会被修改，例如放松或收紧，无论哪个方向都改进SLA遵守和/或总资源使用率。QoS修改算法可以使用人工智能(亦称AI)来增强。

这可以是有利的，尤其是因为硬件QoS典型地要求每个{代理，作业}对所使用的资源的直接管理(亦称基于硬件的控制)，而本文中的某些实施例扩展了QoS能力，甚至缺乏直接管理资源的能力，而是依赖于各个代理监控或测量此类资源使用情况的能力。

因此，由于本文中的实施例，NIC(网络接口卡)或其他设备(其仅仅固有地能够提供带宽(比如)QoS参数，或设备被配置为控制的任何QoS参数)可以提供PPS(比如-或其他可测量的但不可控制的)QoS参数，作为设备固有地能够提供的QoS参数的替代或补充。

在此使用的术语网络交换机包括关于“网络交换机”的维基百科条目中描述的任何网络交换机。

这里的任何网络交换机可以或不可以在网络适配器中实现。网络适配器(如果有的话)可以或不可以在计算机硬件中。可替代的，可以提供虚拟NIC。

附图说明

图1至图10是本发明的相应实施例的简化框图图示。

具体实施方式

现在描述促进多个代理的有效操作的系统。系统通常与服务多个代理的设备协同操作，所述设备诸如调度多个代理或在多个代理之间切换的调度器或交换设备。所述系统可包含可驻留在服务于所述代理的设备上的功能，且所述功能向所述多个代理中的代理的至少一个子集提供根据至少一个资源限定的给定服务质量。每个子集包括少于全部多个代理的总数。

可以理解，代理可各自包括虚拟机或物理计算机。而且，可以存在多个应用，在它们之间进行仲裁，例如使用如在en.wikipedia.org/wiki/Arbiter_(Electronics)中定义的仲裁器。

图1至图6示出了示例实施例。在许多示例实施例中，代理的数量被示为三个——仅仅为了简单起见并且作为示例；然而，可以提供任何其他数量的代理，诸如两个或四个、或任何更大数量的代理，诸如几十个、或几百个或更多个代理。

在图1中，其中代理是网络端口，容纳系统的设备可以是网络交换机，其可以是虚拟的或物理的。网络交换机可以或不可以在网络适配器(和/或DPU)中实现。网络适配器(如果有的话)可以在计算机硬件中，或者可以存在虚拟NIC。图1的执行引擎可包括任何合适的分组执行管线逻辑。这可以包括以下元素的全部或任何子集：分组解析和/或分组分类、和/或分组报头修改、和/或统计信息收集、和/或分组传输。

更一般地，切换可以由CPU完成，而不是由网络交换机完成。

在图2中，代理是虚拟功能，诸如SR-IOV虚拟功能。在图3中，代理是进程。任何应用可以在多个进程中的每一个上运行，例如，电子邮件应用。在图4中，代理是传输队列，在图5中，代理是分别在北/南和东/西方向上行驶的交通车道，并且在图6中，代理是各种不同类型订单的来源，诸如客户订单(例如，在实体设施)、在线订单(例如，经由网站)和在线会员的订单(例如，经由会员在网站上的登录)。每个代理具有作业队列，也称为提交队列，其被提交给与所有代理联合(共享)的作业执行引擎。在图1至图4中，每个作业可包括可能需要通过网络传输的分组。在图5中，每个作业可包括单个车辆，其可在北/南或东/西行进。在图6中，每个作业可包括订单，其可能需要例如由服务于多个代理的物理厨房供应。

执行引擎可以包括任何合适的分组执行管线逻辑。这可以包括以下元素的全部或任何子集：从存储器取回工作描述符、和/或从存储器读取分组、和/或分组解析、和/或分组分类、和/或分组报头修改、和/或统计信息收集、和/或分组传输。

如图2、3和4中的示例所示，调度器和/或执行引擎可以驻留在网络接口卡(NIC)上。如图1所示，调度器和/或执行引擎可以驻留在网络交换机上，该网络交换机又叫做交换集线器、桥接集线器或MAC桥接器。网络交换机可以包括连接计算机网络上的节点的任何联网硬件，通常使用分组交换来接收数据并将数据转发到各个节点。交换机还可包括虚拟交换机，该虚拟交换机可在软件中实现并可被卸载到网络适配器。

如图所示，图3的实施例通常包括卸载的内核调度器。应当认识到，完全公平调度器(CFS)是作为默认调度器的Linux内核中的进程调度器，其处理用于执行进程的CPU资源分配，并且旨在最大化总体CPU利用率，同时还最大化交互性能。CFS管理CPU资源。为了管理联网资源，内核通常允许管理员配置软件队列(例如，迅速断开(Qdisc)，在Linux术语中)、映射逻辑和调度策略。通常，内核从进程获得联网请求，根据映射逻辑将请求映射到队列，并且根据调度策略选择下请求来处理，例如在以下位置在线描述的：t1dp.org/HOWTO/Traffic-Control-tcng-HTB-HOWTO/intro.html。可以通过使用NIC工作队列和NIC调度器来卸载该调度器(例如，从在CPU中运行到在NIC中运行)。

图7是概括图1至图6的实施例的一般框图，并且图8是图7的概括的实施例的示例实施方式的详细框图图示。根据某些实施例，提供给定服务质量的功能可以包括：QoS管理器和/或公共资源调度器和/或执行引擎，全部例如在图8中示出。应当理解，在图8中，示出了每个代理的提交队列；仅作为示例，代理A的队列示出为包括两个作业，而只有一个作业在等待代理B和C中的每一个。调度器被划分成各种资源，一个(例如，资源r2)对于所有代理是共用的(例如，资源r2由所有代理使用)并且其在代理之间的分配可以被控制，并且其他资源(例如，资源r1)被测量并且然后相应地间接控制，使用对公共资源调度器(又名专用调度器)的修改(例如，如在此描述的)，该公共资源调度器可以管理资源r2。示例：测量代理A的PPS，并且将指示代理A正使用多少PPS的测量结果与代理A的最小/最大PPS进行比较，并且作为响应，可以修改至少一个QoS参数，例如代理A的最小和/或最大带宽(也称为BW)。

在图中，通过示例的方式，每个代理使用的资源(又名执行资源)被示为包括带宽和PPS，并且这些资源中的每一个的QoS属性被示为包括允许代理使用的该资源的最大量和被分配给代理的该资源的最小量。由此，每个资源具有为每个代理定义的一个或更多个QoS属性。

然而，应理解，带宽(又名网络带宽(其可包括出口和/或入口))和PPS只是资源的两个可能示例。例如，代替PPS作为测量资源或除了PPS作为测量资源之外，其他测量但不可控制的资源(又名可测量的资源)可以例如包括多个存储器地址转换和/或多个密码操作。

更一般地，资源可以包括以下资源中的全部或任何子集，其可以是内部的或外部的：

外部资源，诸如但不限于：

〃网络带宽(出口和/或入口)

〃每秒分组

〃执行时间

〃PCIe带宽

内部资源，诸如但不限于：

〃地址转换的数目

〃所使用的执行引擎的数量

〃高速缓存的工作集的大小，例如，引起的高速缓存未命中的数量。

用户和/或代理通常不知道内部资源，即在设备/系统内部的可由设备隐式使用的资源。虽然内部资源通常不能被黑盒测试看到或查看设备的数据输入和输出，但是它们仍然是有限的资源，并且因此管理员或管理SW可以知道和可以寻求控制内部资源的使用，例如，以提供更准确的SLA。相反，外部资源对于系统或代理的用户是可见的和/或可由其测量。例如，在NIC中，设备提供网络连接性，因此网络BW和PPS被视为外部的。在NIC中，加速器(例如，加密引擎)可以是内部资源的示例。用户可以针对外部资源在代理之间寻求特定共享策略，然而管理员可以寻求应用给定策略以便在代理之间共享内部资源。

可以理解，与内部资源相反，外部资源通常在不知道任何实现细节的情况下通过查看系统是可测量的。外部资源通常是设备及其功能的特性，因此它们对于这种设备的所有实现方式是共有的。这些特性使得外部资源成为SLA(服务级别协议)的良好候选。每个资源通常具有为一个或更多个代理中的每一个定义的一个或更多个QoS属性。例如，资源r1可以是PPS，并且可以每个代理具有两个QoS属性：该代理被允许使用的最大PPS和系统必须提供给该代理的最小PPS。然后，资源r2可以是带宽，并且也可以具有两个属性或者更多或者更少，例如，包括分别被分配给给定代理的最小和/或最大带宽。而且，通常由系统针对一个或更多个资源中的每一个生成测量。由此，在示例中，测量代理A的PPS，并且将指示代理A正使用多少PPS的测量结果与代理A的最小/最大PPS进行比较，并且作为响应，可以修改至少一个QoS参数，例如代理A的最小和/或最大带宽(也称为BW)。应理解，资源rl和/或r2可增加，或可减小。可替代地或附加地，可以减少总资源。

通常，代理执行的任务或作业越少，该代理消耗或使用的资源就越少，反之亦然：代理执行的任务或作业越多，该代理消耗或使用的资源就越多。

可以理解，在一些实施例中，QoS(例如，至少一个QoS属性)可以被定义用于少于所有代理，因为代理中的至少一个不具有定义的QoS(例如，具有零QoS属性)。

此外，在一些实施例中，QoS可以针对代理子集中的每个代理被共同定义，其中该子集包括多个代理，编号小于系统中的代理的总数。这对于系统中的代理的总集合的多个子集来说可以是这种情况。可以为第一个子集定义第一个QoS，并且可以为相同的总代理集合的第n个子集定义第n个QoS。子集可以是树状的，例如，代理1和代理2可以被视为单个实体，或者可以被包括在为其定义了给定QoS的子集中，与代理3相反，代理3可以是不被包括在该子集中的单独实体，因此，为代理3定义不同的QoS。

应理解的是，每个代理对r1的使用可以是或可以不是预先已知的。而且，每个代理对资源r1的使用可以或不可以随时间而变化。而且，每个代理对资源r1的使用可以或可以不独立于其他代理对相同资源的使用。给定代理对资源r1和r2的使用之间的关系可以是或可以不是系统先验已知的，并且可以随时间变化或不随时间变化。根据一些实施例，该关系对于系统中的至少一个代理或对于所有代理是已知的。然而，这种关系对于系统可能是未知的，并且向代理的子集提供QoS的功能至少有时可以对其进行补偿。例如，向代理的子集提供QoS的功能可通过动态计算关系(例如，计算r1＝a*r2，以便通过参数a将QoS参数因子化)来补偿。可替代地或此外，向代理的子集提供QoS的功能可以通过使用启发法来进行补偿(例如，可以计算“偏离理想QoS”的评分并且将该评分用作用于修改r1的参数或因子)。评分函数可具有人工智能(又名AI支持)或可仅基于经验结果。

任何上述资源都可以由硬件控制。例如，给定硬件可控制网络带宽(出口和入口两者)，但不控制PPS。

根据本发明的实施例，带宽到PPS的转换的例子如下：系统可以测量r2带宽，比如以每秒字节数为单位。系统还可以测量r1PPS，比如以每秒分组数为单位。如果第一数量除以第二数量，那么结果为r2/r1＝平均分组大小，其在该示例中被表示为每分组的字节数。

根据某些实施方式，图8的系统包括以下实体，或者可替代地，这些实体可以如以下单独提供：

a.调度器，也称为设备调度器，其通常仅基于资源r2的支持策略来选择要服务的代理。调度器跟踪资源r2的所有代理的消耗，并使用该信息来实施策略。如各个所示实施例中所示，调度器可以被卸载或可以不被卸载，并且可以包括交换机调度器(例如虚拟交换机调度器)，或者可以包括内核调度器，或者可以包括应用调度器，例如，图5的红/绿灯调度器或图6的合成调度器。

来自调度器选择的代理的作业通常被发送到：

b.执行引擎，其通常提供作业的r2消耗。执行引擎通常处理由调度器分配给其的作业。处理可以包括激活子引擎和/或执行消耗内部资源和外部资源的任务，例如如上所述。例如，常规NIC引擎可从主机存储器读取分组并将该分组传输到网络。当进行该处理时，引擎通常向调度器(r2)报告每个代理的所有资源消耗，

以及发送到：

c.QoS管理器，也称为高级QoS管理器，其将完整的QoS策略转换成由基本调度器支持的策略。通常，QoS管理器使用来自执行引擎的所有资源消耗信息来计算适当的策略。

应当理解，图8的系统可以结合到处理来自多个代理的工作/任务/请求，并根据确定应当何时和/或如何服务哪个代理的某个策略来设法服务多个代理的任何设备中。

应当认识到，在图1的示例实施例中，设备被示出为包括网络交换机，而在图2至图4的示例实施例中，设备被示出为包括NIC(网络接口卡)。然而，这不旨在是限制性的。更一般地，服务于多个代理的任何合适的设备可以容纳本发明的系统(例如，图7或图8的系统)或与本发明的系统协作，诸如但不限于网络适配器、和/或交换机和/或DPU。

如果设备包括交换机，可以理解的是，交换机不需要包括硬件交换机，并且可以包括软件交换机，其可以被卸载到NIC设备。可以理解，一些(事实上许多)NIC使用工作队列来向NIC发布工作请求。由此，如果设备包括NIC，则多个队列或传输队列充当多个代理。

类似地，应用可以被分配来自多个代理的网络相关工作的任务，并且可以拥有软件调度器。一旦该软件调度器选择了要服务哪个代理，软件调度器就可以将工作发送到NIC。该应用可被卸载，使得NIC的硬件代替CPU执行一些应用工作。在这种情况下，可以命令应用为每个代理使用NIC工作队列并且根据代理之间的应用策略来配置NIC调度器。结果，应用可简单地将工作从代理传递到NIC队列，而不是执行CPU密集调度。类似地，可以提供OS内核来服务多个进程，而不是具有应用管理代理。OS(操作系统)内核可以具有其自身的机制以将进程调度到CPU，但是对于联网，OS内核可以允许每个进程有其自身的网络队列，并且可以给NIC调度器配置策略来控制网络使用，而不是以软件在CPU中实现策略。

以下是根据某些实施例提供的QoS管理方法的示例流程。该流程通常可由图8的QoS管理器周期性地执行，且可包括例如如下适当排序的以下操作的全部或任何子集：

操作a：通过接收每个代理对每个资源的使用的测量，收集和/或监控所有代理和所有资源的信息。

操作b：对于每个代理x，计算代理x的r2要求，取决于如所测量的代理x对资源r1和r2的利用(又名使用)级别。

操作c：使用接口函数(诸如但不限于内核调用)和PCI配置周期来修改调度器的r2要求配置。在一些实施例中，该接口可以在代理和内核之间，或者在代理/内核和PCI设备之间。应理解，类似地，此类接口函数可由QoS管理器使用以收集信息。

可以使用任何合适的方法来执行操作b，诸如以下三种示例方法：

执行操作b的直接计算方法：

对于前一时段或时间窗口(其可以包括自最后一次执行操作C起的时间间隔)，计算以下内容：

i.计算CR1和CR2之间的比率CR＝CR2/CR1:

代理x在前一时段对r1的利用，也就是消耗了的r1资源(CR1)

和

代理x在前一时段对r2的利用，也就是消耗了的r2资源(CR2)。

ii.使用r1的SLA QoS参数(OrigMaxR1,OrigMinR1)，根据r2计算r1的QoS参数(MaxR1,MinR1)。该计算可以是:

MaxR1＝CR*OrigMaxR1,

MinR1＝CR*OrigMinR1。

iii.计算r2的修改后参数:

MaxR2＝minimum(OrigMaxR2,MaxR1),

MinR2＝minimum(MaxR2,maximum(OrigMinR2,MinR1))

执行操作b的增加/减小计算：

对于可以包括自最后一次执行操作C起的时间间隔的前一时段或时间窗口，确定以下的所有或任何合适的子集：

i.代理x是否超过？可以通过计算以下是否为真来做出该确定：

(OrigMaxR1<CR1)或(OrigMaxR2<CR2)？

如果是，则通过因子例如MaxR2*＝alpha减小r2的QoS参数,其中0<alpha<＝1。

ii.代理x被剥夺了吗？可以通过计算以下是否为真来做出该确定：

(OrigMinR1>CR1)或(OrigMinR2>CR2),

如果是，则通过因子例如MinR2*＝beta增加r2的QoS参数，

iii.系统是否被充分利用？该确定可以通过计算以下是否为真来做出：所有代理CR1的总和等于总可用R1或所有代理CR2的总和等于总可用R2。如果系统没有被充分利用并且代理没有超过，则通过因子例如MaxR2*＝gamma增加r2参数。通常，gamma介于1和2之间。.

iv.新值是否一致？可以通过计算以下是否为真来做出该确定：(MaxR2>MinR2)。如果新值不一致，则可以将MinR2调整为与MaxR2相同的值。

基于AI的方法，用于执行操作b：

在设置阶段，例如通过提供例如在实际场景中在带宽与PPS之间的关系上积累的知识来训练AI，使用分数函数，其评估多少代理不满足其QoS参数以及已经发生了多少未充分利用。

在运行时间，向经训练的AI逻辑提供以下参数：CR1、CR2、OrigMaxR1、OrigMinR1、OrigMaxR2、OrigMinR2、MinR2、MaxR2、Total R1、total R2。更具体地：

CR1是代理x在前一时段对资源r1的使用

CR2是代理x在前一时段对资源r2的使用

OrigMaxR1,OrigMinR1是r1的原始QoS参数。

OrigMaxR2,OrigMinR2是r2的原始QoS参数。

Total R1是可以分配给所有代理的资源r1的总量。

Total R2是可以分配给所有代理的资源r2的总量。

作为响应，AI逻辑计算新的MinR2和新的MaxR2。

根据某些实施例，在考虑到给定服务质量，通过向代理的子集提供QoS的功能而发现已经向代理A分配了太多资源r1的至少一种情况下，作为响应，该功能通过减少资源r2来间接减少资源r1。

根据某些实施例，在考虑到给定的服务质量，通过向代理的子集提供QoS的功能而发现资源r1太少而无法分配给代理A的至少一种情况下，作为响应，该功能通过增加资源r2来间接增加资源r1。

根据某些实施例，在考虑到给定的服务质量，通过向代理的子集提供QoS的功能而发现已经向代理A分配了太多资源r1的至少一种情况下，作为响应，该功能通过增加资源r2来间接减少资源r1。

根据某些实施例，在考虑到给定的服务质量，通过向代理的子集提供QoS的功能而发现资源r1太少而无法被分配给代理A的至少一种情况下，作为响应，该功能通过减少资源r2来间接增加资源r1。

通常，如果代理A得到多于MIN PPS且小于MAX PPS，则这既不被视为太多也不被视为太少。然而，可替代地，可以认为这种情况太少。

图9为调度器的概念图，该调度器可包括用于M个资源中的每一个和用于N个代理中的每一个的单独的管理器。图9的调度器管理用于所有代理的所有资源并且知道如何应用整个策略。图10是包括用于多个资源0、……M的一个联合管理器(例如，带宽管理器)的更有限的调度器，然而，可以为分别对应于多个代理0、……N的多个SLA监控器0、……N中的每一个设置一个这样的管理器。通过使用在本文中示出和描述的方法，图10的更有限的调度器还可用于管理用于所有代理的所有资源并且应用整个策略。

用于修改r2的一个可能的参数是所有代理对r1的总体使用。例如，看PPS，可能所有代理都低于其最大QoS(又名MAX PPS)，并且高于其最小QoS。然而，将所有代理的PPS求和产生低于服务于多个代理的设备的潜在PPS的总值。在这种情况下，可以增加一些代理的最大带宽，以试图实现完全利用，而不超过MAX PPS值。

某些实施例的一个优点在于，系统不一定必须假设唯一的网络适配器和/或交换机和/或DPU瓶颈是链路带宽。

可以理解，可以存在所有代理共用的单个受控资源r2，或者可以存在多个这样的资源。可替代地或附加地，可存在系统不具有控制能力(除了隐式地或间接地，例如如本文所描述的)的单个测量的资源r1，或者可存在多个这样的资源。

本文中的实施例具有多种多样的应用，诸如增强较大系统的操作。仅通过示例的方式，这种较大的系统包括Mellanox

-5、

-6dx、

-7或其他以太网适配器卡，或数据处理单元(DPU)，诸如

单元，包括

-1、

-2。例如，在任何这些中，可提供允许或容纳本文所述的QoS参数并实现本文的功能的用户空间应用。可替代地或此外，可以修改这种大型系统中的固件以产生允许或容纳本文所描述的QoS参数并且实现本文中的功能的固件。在这种情况下，这些较大系统的API可以尤其暴露给内核。

本文中描述的人工智能功能可以由任何合适的AI系统(诸如但不限于

的DGX)提供。此AI系统可以例如包括被配置用于推理和/或用于深度学习和/或用于机器学习和/或其他人工智能任务的专门构建的计算系统(例如，超级计算机或HPC，又名高性能计算机)。AI系统可以包括GPU优化软件(例如，软件栈)，除了CPU和/或RAM和/或其他组件、特征或功能之外，所述GPU优化软件还可以使用多个GPU来执行。在至少一个实施例中，可以在用于执行AI处理任务的云中(例如，在数据中心中)实现一个或更多个AI系统。云可以包括GPU加速的基础结构(例如，

的NGC)，其可以提供用于执行人工智能处理的GPU优化平台。云可作为硬件抽象和缩放平台来执行基于AI的任务。云可以与应用编排功能(例如，用于管理容器化的工作负荷和服务(诸如Kubernetes)的合适平台)集成，这使得多个GPU能够在服务于人工智能功能的应用和服务之间和之中提供无缝缩放和负载平衡。云可以执行小批量推断和大批量推断(例如，执行

的TENSOR RT)，可以提供加速的并行计算API和平台(例如，

的CUDA)，可以提供图形渲染API和平台(例如，用于光线追踪和/或2D和/或3D图形，和/或例如用于生产影片的其他渲染技术)。

应当理解，如果需要，本发明的软件组件可以ROM(只读存储器)形式实现。如果需要，软件组件通常可以使用常规技术在固件或硬件中实现。还应当理解，软件组件可被实例化，例如：作为计算机程序产品，或在有形介质上。在一些情况下，有可能将软件组件实例化为可由适当的计算机解释的信号，尽管在本发明的某些实施例中可以排除这种实例化。

应当理解，为了清楚起见，在单独实施例的上下文中描述的本发明的各种特征也可在单个实施例中以组合的方式提供。相反，为了简洁起见，在单个实施例的上下文中描述的本发明的各种特征也可单独地提供，或以任何合适的子组合提供。

本领域技术人员应当理解，本发明不受在上文中具体示出和描述的限制。相反，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种促进多个代理的有效操作的系统，所述系统包括：

服务所述多个代理的设备；以及

功能，其驻留在所述设备上并向所述多个代理中的代理的至少一个子集提供根据至少一个资源限定的给定服务质量。

2.根据权利要求1所述的系统，其中所述服务质量根据至少一个资源r1来限定，服务所述多个代理的所述设备未被配置为控制所述至少一个资源r1向所述多个代理中的至少一些代理的分配，但是所述设备被配置为测量由所述多个代理中的至少一些代理中的每个代理对至少一个资源r1的使用级别，并且因此确定资源r1的级别是否提供所述给定服务质量。

3.根据权利要求2所述的系统，其中通过控制另一个资源r2，所述至少一个资源r1由所述功能间接地改变，服务所述多个代理的所述设备被配置为测量所述至少一个资源r1的使用，但是所述设备未被配置为控制所述至少一个资源r1向所述多个代理的分配，所述设备被配置为控制所述另一个资源r2向所述多个代理的分配。

4.根据权利要求1所述的系统，其中所述功能至少一次测量至少一个资源r1中有多少被分配给所述多个代理中的至少一个代理A，考虑到所述给定服务质量来识别不正确数量的资源r1已经被分配给代理A，并且作为响应，通过控制资源r2来间接地改变资源r1。

5.根据权利要求3所述的系统，其中至少一个代理A对资源r2的使用与所述代理A对资源r1的使用之间的关系是已知的。

6.根据权利要求1所述的系统，其中人工智能用于学习r2与r1的关系。

7.根据权利要求5所述的系统，其中r2与r1的已知关系是：至少在一些已知条件下，r1是r2的递减函数，使得至少在给定所述已知条件下，当r2增加时，r1减小，以及当r2减小时，r1增加。

8.根据权利要求5所述的系统，其中r2与r1的已知关系是：至少在一些已知条件下，r1是r2的增加函数，使得至少在给定所述已知条件下，当r2增加时，r1增加，以及当r2减小时，r1减小。

9.根据权利要求6所述的系统，其中向代理的至少一个子集提供QoS的所述功能至少一次动态地计算所述关系，并且相应地修改至少一个QoS参数。

10.根据权利要求6所述的系统，其中向代理的至少一个子集提供QoS的所述功能使用至少一种启发法并且相应地修改至少一个QoS参数。

11.根据权利要求1所述的系统，其中所述设备被配置为测量但未被配置为控制的所述资源包括PPS。

12.根据权利要求1所述的系统，其中所述设备被配置为控制的所述资源包括带宽。

13.根据权利要求1所述的系统，其中所述代理中的至少一个代理包括虚拟机。

14.根据权利要求1所述的系统，其中所述代理中的至少一个代理包括物理计算机。

15.根据权利要求1所述的系统，其中所述设备包括交换设备，所述交换设备包括所述功能驻留在其上的物理网络交换机。

16.根据权利要求1所述的系统，其中所述设备包括交换设备，所述交换设备包括所述功能驻留在其上的虚拟网络交换机。

17.根据权利要求1所述的系统，其中所述服务质量包括始终被提供给所述多个代理的给定子集中的每个代理的资源的最小量。

18.根据权利要求1所述的系统，其中所述服务质量包括由所述多个代理的给定子集中的每个代理使用的资源的量不许超过的资源的最大量。

19.一种促进多个代理的有效操作的方法，所述方法结合服务所述多个代理的设备进行操作，所述方法包括：

提供驻留在所述设备上并且提供给定服务质量的功能；以及

20.根据权利要求4所述的系统，其中r2与r1的关系对于所述功能来说是已知的，从而定义r2与r1的已知关系。

21.根据权利要求20所述的系统，其中r2与r1的已知关系是：至少在一些已知条件下，r1是r2的增加函数，使得至少在给定所述已知条件，当r2增加时，r1增加，以及当r2减小时，r1减小。

22.根据权利要求1所述的系统，其中所述多个代理中的至少一个代理包括网络端口。

23.根据权利要求1所述的系统，其中对于代理的子集中的所有代理共同定义至少一个QoS属性，其中所述子集包括少于所述系统中的代理的总数。

24.根据权利要求1所述的系统，其中资源r2被来自所述系统中的所有代理的所有任务所使用。