CN113826367A - 用于计算平台上的功能实现的计算资源估计 - Google Patents
用于计算平台上的功能实现的计算资源估计 Download PDFInfo
- Publication number
- CN113826367A CN113826367A CN202080032327.0A CN202080032327A CN113826367A CN 113826367 A CN113826367 A CN 113826367A CN 202080032327 A CN202080032327 A CN 202080032327A CN 113826367 A CN113826367 A CN 113826367A
- Authority
- CN
- China
- Prior art keywords
- current
- parameter
- resource demand
- processing function
- default
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5055—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering software capabilities, i.e. software resources associated or available to the machine
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
- G06F9/5016—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/501—Performance criteria
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5014—Reservation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5019—Workload prediction
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
- Stored Programmes (AREA)
- Computer And Data Communications (AREA)
Abstract
本申请描述了一种用于实现处理功能的资源估计方法。该方法可以包括接收资源需求参数的默认值,该资源需求参数的默认值指示用于在计算平台上,用处理功能的配置参数和输入参数的一个或多个默认参数值,实例化所述处理功能的参考实例的默认资源需求;以及基于所述资源需求参数的默认值,以及所述处理功能的配置参数和输入参数的所述一个或多个默认参数值和一个或多个当前参数值,估计所述资源需求参数的当前值,该资源需求参数的当前值指示用于在所述计算平台上,使用所述处理功能的配置参数和输入参数的一个或多个当前参数值,实例化所述处理功能的当前实例的当前资源需求。
Description
引用并入
本申请要求于2020年9月22日提交的申请号为17/028,426的美国专利申请“用于计算平台上的功能实现的计算资源估计(Compute Resource Estimation for FunctionImplementation on Computing Platform)”的优先权,该美国专利申请要求于2019年9月28日提交的申请号为62/907,629的美国临时专利申请“用于云平台上的功能实现的资源估计子(Resource Estimators for Function Implementations in Cloud Platform)”。所述在先申请的全部公开内容通过引用整体并入本申请中。
技术领域
本申请涉及用于在计算平台(例如,计算机或云平台)上实现处理功能的计算资源估计方法。一些实施例涉及基于网络的媒体处理(NBMP)。
背景技术
本文中提供的背景技术描述是为了大体上呈现本申请的上下文。在此背景技术部分描述的程度上,当前署名的发明人的工作,以及在本申请提交时可能不具有作为现有技术的资格的描述的各方面,既不明确认为也不隐含认为是本申请的现有技术。
多媒体服务提供者面临着使他们的服务适应多个云和网络服务提供者以到达他们的客户的挑战。这些云和网络服务提供者经常定义他们自己的应用程序接口(API)来给他们的客户分配计算资源。目前正在开发基于网络的媒体处理(NBMP)标准,以处理碎片化并提供统一的方式在任何云平台上和任何IP网络上进行媒体处理。NBMP定义了工作流管理器,工作流管理器可以使用现成的媒体处理功能的实现,将它们组合在一起以创建媒体处理工作流。
发明内容
本申请的各方面提供了一种用于实现处理功能的资源估计方法。所述方法可以包括:接收资源需求参数的默认值,该资源需求参数的默认值指示用于在计算平台上,用处理功能的配置参数和输入参数的一个或多个默认参数值,实例化所述处理功能的参考实例的默认资源需求;以及基于所述资源需求参数的默认值,以及所述处理功能的配置参数和输入参数的所述一个或多个默认参数值和一个或多个当前参数值,估计所述资源需求参数的当前值,该资源需求参数的当前值指示用于在所述计算平台上,使用所述处理功能的配置参数和输入参数的一个或多个当前参数值,实例化所述处理功能的当前实例的当前资源需求。
在实施例中,所述资源需求参数是以下之一:计算性能参数,其指示中央处理单元(CPU)或图形处理单元(GPU)的性能;内存大小参数;以及内存访问带宽参数,其指示CPU与内存之间的带宽。
在实施例中,所述指示当前资源需求的资源需求参数的当前值可以基于以下表达式进行估计:
当前值=估计子*默认值,
其中,所述估计子是所述处理功能的所述配置参数和输入参数的一个或多个当前参数值的函数。
在示例中,当所述处理功能的配置参数和输入参数的所述默认参数值和所述一个或多个当前参数值相同时,所述估计子等于1。在示例中,所述估计子是从存储包括所述处理功能的媒体处理功能的功能储存库接收的,所述功能储存库属于基于网络的媒体处理(NBMP)系统。
在示例中,所述估计子、所述资源需求参数的默认值、以及所述配置参数和输入参数的一个或多个默认参数值和一个或多个当前参数值,包括在从属于NBMP系统的功能储存库接收的所述处理功能的功能描述的描述符之中。
所述方法的实施例可以还包括:基于估计的资源需求参数的当前值,请求用于用所述处理功能的所述配置参数和输入参数的所述一个或多个当前参数值在当前计算平台上实例化所述处理功能的当前实例的计算资源;以及使用所请求的计算资源,在所述当前计算平台上实例化所述处理功能的当前实例。
本申请的各方面提供了一种包括电路的装置。所述电路可以配置为:接收资源需求参数的默认值,该资源需求参数的默认值指示用于在计算平台上,用处理功能的配置参数和输入参数的一个或多个默认参数值,实例化所述处理功能的参考实例的默认资源需求;以及基于所述资源需求参数的默认值,以及所述处理功能的配置参数和输入参数的所述一个或多个默认参数值和一个或多个当前参数值,估计所述资源需求参数的当前值,该资源需求参数的当前值指示用于在所述计算平台上,使用所述处理功能的配置参数和输入参数的一个或多个当前参数值,实例化所述处理功能的当前实例的当前资源需求。
本申请的各方面进一步提供了一种存储指令的非易失性计算机可读介质,所述指令在由处理器执行时,使所述处理器执行所述用于实现处理功能的资源估计方法。
附图说明
根据以下详细描述和附图,所公开的主题的进一步的特征、性质和各种优点将变得更加明显,其中:
图1示出了根据本申请实施例的示例性数据处理系统。
图2示出根据本申请实施例的工作流的示例。
图3示出了根据本申请实施例的用于实现处理功能的资源估计的示例性过程。
图4示出了根据本申请实施例的计算机系统的示意图。
具体实施方式
I.基于网络的媒体处理
本申请的各方面描述了与基于网络的媒体处理(NBMP)架构有关的资源估计方法。NBMP架构可用于初始化和控制网络中(例如,云平台上)的媒体处理。例如,NBMP源描述所请求的媒体处理,并提供关于媒体数据的性质和格式信息。作为响应,NBMP工作流管理器可以建立媒体处理工作流,并通知NBMP源工作流就绪,可以启动所请求的媒体处理。媒体源然后可以开始向网络发送媒体以进行处理。
NBMP工作流可以理解为是媒体处理任务的连接图,每个媒体处理任务执行明确定义的媒体处理操作。工作流管理器通过配置和监控每个任务以及工作流输出,确保工作流的正确操作。工作流管理器负责基于从NBMP源接收的工作流描述,选择媒体处理功能,并将所选择的功能实例化为任务。
当工作流管理器对媒体服务提供商隐藏与底层云计算平台的交互时,可以建立、加载和监控运行媒体处理任务的媒体处理实体(MPE)。在建立MPE的过程期间,本申请中所描述的资源估计方法可用于估计对实例化媒体处理任务有用的资源量。
图1示出了根据本申请实施例的示例性NBMP系统(100)。NBMP系统(100)可以支持现有的媒体传送方法,例如,流式传输、文件传送、基于推送的渐进下载、混合传送、多路径和异构网络环境。NBMP系统(100)还可以通过提供各种基于云的媒体处理能力来启用新兴的媒体应用,诸如网络辅助的媒体质量增强(例如,虚拟现实(VR)拼接、视频放大(up-scaling)、用于自适应流式传输的移动边缘编码、以及内容感知的云转码)、网络辅助的媒体分发(例如,直播媒体摄取、在线转码、以及媒体感知的高速缓存)、网络辅助的媒体合成(例如,增强视频的流式传输、定制的媒体合成)、沉浸式媒体处理(例如,网络聚合点云媒体)等。
如图所示,NBMP系统(100)可以包括NBMP源(101)、NBMP工作流管理器(103)、功能储存库(function repository)(105)、媒体源(111)、数据处理实体(MPE)(113)和媒体接收器(media sink)(115)。NBMP系统(100)可以包括附加的媒体源、媒体接收器和/或MPE。
NBMP源(101)可以描述或以其它方式指示要由媒体处理实体(113)执行的媒体处理操作。功能储存库(105)可以存储各种媒体处理功能。NBMP源(101)和NBMP工作流管理器(103)可以从功能储存库(105)中检索媒体处理功能。媒体处理功能或功能可用于执行特定的媒体处理过程,诸如360度视频流式传输服务中的拼接过程、视频传送服务中的基于人工智能(AI)的视频放大过程等。
媒体处理任务或任务可以是由MPE(113)执行的功能的运行时间实例(instance)。NBMP工作流或工作流可以由一个或多个连接起来的任务的图(例如,有向无环图(DAG))表示,所述一个或多个连接起来的任务实现所请求的媒体处理。NBMP工作流管理器(103)或工作流管理器(103)可以例如基于工作流描述文档(WDD)来提供一个或多个任务并连接一个或多个任务,以创建、控制、管理和监控工作流。
媒体源(111)可以提供要由工作流处理的媒体内容(例如,媒体数据、补充信息)。补充信息可包括与媒体数据相关的元数据或辅助信息。媒体源(111)可以向工作流提供输入。媒体接收器(115)可以使用工作流的输出。MPE(113)可以运行一个或多个媒体处理任务来处理媒体内容。
NBMP系统(100)中的不同实体(例如,NBMP源(101)、工作流管理器(103)和MPE(113))可以使用API来调用和响应媒体服务请求,如图1所示。API可以包括NBMP工作流API(或工作流API)、功能发现API和任务API。工作流API可以提供NBMP源(101)和工作流管理器(103)之间的接口。任务API可以提供工作流管理器(103)和媒体处理任务之间的接口。功能发现API可以提供工作流管理器(103)/NBMP源(101)和功能储存库(105)之间的接口。
上述NBMP接口可用于创建和控制网络中的媒体处理工作流。NBMP系统(100)可以被分割成控制平面和媒体平面(或媒体数据平面)。控制平面可以包括工作流API、功能发现API和任务API。
NBMP源(101)可以使用工作流API来创建和控制媒体处理工作流。NBMP源(101)可以使用工作流API与工作流管理器(103)通信,用于配置和控制网络中的媒体处理。当NBMP源(101)通过在工作流API的操作中包括工作流资源(WR)而向工作流管理器(103)发送请求时,工作流管理器(103)可以解析WR、所包括的WDD和对应的描述符,并根据所请求的操作采取适当的动作。然后,工作流管理器(103)可以用响应来确认该请求。工作流API操作可包括创建工作流(例如,CreateWorkflow)、更新工作流(例如,UpdateWorkflow)、删除工作流(例如,DeleteWorkflow)、检索工作流(例如,RetrieveWorkflow)等。
功能发现API可以为工作流管理器(103)和/或NBMP源(101)提供手段,用于发现可以作为媒体处理工作流的一部分而加载的媒体处理功能。
工作流管理器(103)可以使用任务API在运行时配置和监控一个或多个任务(例如,由MPE(113)运行的任务1和任务2)。例如,在MPE(113)中为任务分配资源之后,任务API可以定义用于由工作流管理器(103)配置媒体处理任务的一个或多个接口。任务API操作可包括创建任务(例如,CreateTask)、更新任务(例如,UpdateTask)、获取任务(例如,GetTask)、删除任务(例如,DeleteTask)等。
在媒体平面上,可以定义NBMP源(111)和一个或多个任务之间以及任务与任务之间的媒体格式、元数据和补充信息格式。
工作流描述(WD)可以从NBMP源(101)传递给工作流管理器(103)。WD可以描述工作流的诸如输入数据和输出数据、功能和其它要求等信息。
工作流管理器(103)可以从NBMP源(101)接收WDD,并且可以为所请求的媒体处理构建工作流。在工作流过程中,例如可以从功能储存库(105)中选择媒体处理功能,然后可以将对应的媒体处理任务配置并分发给一组一个或多个MPE(例如,包括MPE(113))。
功能储存库(105)提供的一组功能可以由NBMP源(101)和工作流管理器(103)读取。在实施例中,NBMP源(101)请求使用功能储存库(105)中的一组功能来创建工作流。相应地,NBMP源(101)被配置为选择工作流的功能。NBMP源(101)可以如下所述请求创建工作流。NBMP源(101)可以使用创建工作流所用的媒体处理任务的描述,并且可以指定连接图来定义媒体处理任务的输入和输出的连接。当工作流管理器(103)从NBMP源(101)接收到上述信息时,工作流管理器(103)可以基于相应的功能名称来实例化媒体处理任务,并且可以根据连接图来连接媒体处理任务。
可选地,NBMP源(101)可以使用一组关键字来请求创建工作流,工作流管理器(103)可以通过该组关键字来构造工作流。相应地,NBMP源(101)可能不知道要插入到工作流中的一组功能。NBMP源(101)可以如下所述请求创建工作流。NBMP源(101)可以使用一组关键字,工作流管理器(103)可以通过该组关键字来找到适当的功能,并且NBMP源(101)可以使用合适的工作流描述来说明工作流的要求。
当工作流管理器(103)从NBMP源(101)接收到上述信息(例如,一组关键字)时,工作流管理器(103)可以通过使用关键字搜索适当的功能来创建工作流,所述关键字例如在处理描述符中指定。工作流管理器(103)然后可以使用工作流描述中的其它描述符来提供媒体处理任务并连接媒体处理任务,以创建最终工作流。
工作流管理器(103)的处理模型可以如下所述。
工作流管理器(103)可以如下发现可用的媒体处理功能。NBMP功能储存库(105)可以提供功能发现接口(或API),以允许外部实体查询可以实现所请求的处理的媒体处理功能。工作流管理器(103)可以访问目录服务,该目录服务提供可搜索的媒体处理功能列表。工作流管理器(103)可以使用工作流描述中的媒体处理任务的描述,找到工作流的适当功能。
工作流的媒体处理任务的选择可以如下所述。当从NBMP源(101)接收到对媒体处理的请求时,工作流管理器(103)可搜索功能储存库(105),以找到可实现该工作流的所有可用功能的列表。使用来自NBMP源(101)的工作流描述,工作流管理器(103)可以从功能储存库(105)中找到功能以实现工作流,这可以取决于来自NBMP源(101)的媒体处理信息。媒体处理信息可以包括输入和输出描述、所请求的处理的描述、以及功能目录(105)中的功能的其它描述符中的信息。将源请求映射到要包括在工作流中的适当媒体处理任务,可以是在网络中实现NBMP的一部分。为了在创建任务时,引用并链接具有输入端口名称和输出端口名称的输入源,输入端口和输出端口可用于引用输入流。
对要被实例化为任务的适当功能的搜索,可以由工作流管理器(103)使用功能发现API来执行。或者,工作流管理器(103)可使用功能发现API来检索功能储存库(105)中的某些或所有合适功能的详细信息。然后,工作流管理器(103)可以将来自NBMP源(101)的媒体处理信息与每个功能的不同描述符进行比较。
可以在工作流中配置所选择的媒体处理任务。当识别出要包括在工作流中的功能时,NBMP工作流管理器(103)可以将这些功能实例化为相应的任务,并配置这些任务,使得这些任务可以被添加到工作流中。NBMP工作流管理器(103)可以从接收自NBMP源(101)的媒体处理信息中提取配置数据,并配置对应的任务。任务的配置可以使用任务API(例如,NBMP任务API)来执行。
任务分配和分发可以如下描述。工作流管理器(103)可以使用工作流来执行处理部署和配置媒体处理实体。在示例中,对于计算密集的媒体处理请求,工作流管理器(103)可建立多个计算实例,并在多个计算实例之间分发工作负载。因此,工作流管理器(103)可以根据需要连接和配置多个计算实例。在示例中,工作流管理器(103)将相同的任务分配给多个实例,并提供负载平衡器以使用所选择的调度机制在多个实例之间分发工作负载。在可选示例中,工作流管理器(103)将同一任务的不同操作分配给不同实例(例如,并行操作)。在上述两个示例中,工作流管理器(103)可以在实例之间建立工作流路径,并且因此可以成功地实现合适的工作负载。工作流管理器(103)可以配置任务,以将经处理的媒体数据/流推送到(或通过拉机制使它们可用)工作流图中的下一任务。
当工作流管理器(103)从NBMP源(101)接收到WDD时,工作流管理器(103)可以选择要插入到工作流中的媒体处理功能。当要包括在工作流中的任务列表编译好时,工作流管理器(103)然后可以连接任务以准备工作流。
工作流管理器(103)可以生成例如由图形(例如,DAG)表示的工作流。图2示出了根据本申请实施例的图形(例如,DAG)(200)的示例。DAG(200)可以包括多个节点(T1)-(T6)和多个链路(或连接)(202)-(208)。在示例中,DAG(200)表示工作流(200)。
DAG(200)的每个节点可以表示工作流(200)中的媒体处理任务。将DAG(200A)中的第一节点(例如,节点(T1))连接到第二节点(例如,节点(T2))的链路(例如,链路(202)),可以表示传输第一节点(例如,节点(T1))的输出作为第二节点(例如,节点(T2))的输入。
通常,工作流可以包括任何合适数量的输入(或工作流输入)和任何合适数量的输出(或工作流输出)。工作流输入可以连接到媒体源(111)、其它工作流等等之类,工作流输出可以连接到媒体接收器(115)、其它工作流等等之类。工作流(200)具有输入(201)以及输出(209)和输出(210)。在一些实施例中,工作流(200)可以具有来自中间节点的一个或多个输出。
II.在云平台上实现功能的资源估计
为了在云平台上实现或实例化媒体处理功能,可以执行资源估计以确定实现媒体处理功能所需的计算资源的量。例如,在图1的示例中,基于来自NBMP源(101)的媒体处理请求,NBMP工作流管理器(103)可以从功能储存库(105)中选择一个或多个媒体处理功能。随后,NBMP工作流管理器(103)可以估计将所选择的媒体处理功能转换为任务需要多少计算资源。基于估计的计算资源的量,NBMP工作流管理器(103)可以从将存储(host)任务的云平台请求计算资源。
例如,响应于对计算资源的请求,云平台的资源管理功能(例如,资源管理器)可以相应地分配计算资源(例如,计算、内存、网络等的资源)。例如,可以提供和分配虚拟机来执行任务。这些虚拟机可以充当NBMP架构(100)中的一个或多个MPE。当那些分配的资源变得可由NBMP工作流管理器(103)使用时,NBMP工作流管理器(103)可以实例化选择的媒体处理功能,以开始任务。
通常,用于媒体处理的云平台可以由不同的云运营商拥有,并且因此具有可以频繁更新的各种硬件模块。不同硬件平台上的媒体处理功能(例如,媒体处理库)的性能可以不同,例如,取决于中央处理单元(CPU)、图形处理单元(GPU)、L1和L2高速缓存、memcached、内存带宽、硬件加速模块、系统时钟、CPU或GPU时钟、网络配置或其它参数。换言之,对于给定的性能要求(例如,帧速率和图片分辨率),在不同的云平台上可能需要不同的计算资源。因此,对于在各种云平台中使用的不同硬件系统而言,使用单一的一组度量标准来描述媒体处理功能的资源需求是困难的或不可行的。
另一方面,媒体处理功能的实现或实例的资源需求可以取决于要执行的处理工作的复杂度(或性质)。处理工作的复杂度可以取决于媒体处理功能中使用的算法(对于该媒体处理功能不变)和处理工作的配置(可以变化)。在本申请中,媒体处理功能的实现或实例的资源需求或要求称为媒体处理功能的实现或实例的复杂度,或者与特定实例或实现相对应的媒体处理功能的复杂度。
以视频编码器的媒体处理功能为例,处理工作的复杂度可以根据输入数据的大小(输入参数)和处理配置(配置参数)而变化。例如,输入数据的大小可以由帧大小、帧速率、比特深度、颜色分量的数量、分量颜色格式等来表示。处理配置可以包括用于预测的参考帧的数量、编码模式(例如,用于算术编码的上下文配置文件的数量、以及上下文配置文件的大小)、图块和图块组的数量、目标比特率等。因此,当媒体处理功能的输入参数和配置参数改变时,实现该媒体处理功能所需的资源可以改变。
相应地,在本申请公开的资源估计方案中,为了描述实现具有给定配置(输入参数和配置参数)的媒体处理功能的计算资源需求,定义了具有参考配置的媒体处理功能的参考实例,并将其用作基准(参考)。该参考配置可以对应于一组参考输入参数和配置参数。具有给定配置的媒体处理功能的当前实例的资源需求可以相对于具有参考配置的参考实例的资源需求来进行描述。
此外,在资源估计方案中,可以将当前实例的资源需求定义为媒体处理功能的输入参数和配置参数的函数。这样的函数可以称为资源估计函数(REF)。换言之,当媒体处理功能的配置(输入参数和配置参数)改变时,可以根据基准实例的资源需求,基于REF来确定各个实例的不同资源需求。
在本申请中,参考实例的参考配置可以称为默认实例的默认配置。参考配置的参考输入参数和参考配置参数可以称为默认实例的默认输入参数和默认配置参数。参考实例的资源需求可以称为默认实例的默认资源需求。另一方面,可以将当前实例的给定配置称为当前配置。当前实例的给定配置的输入参数和配置参数可以称为当前输入参数和当前配置参数。当前实例的资源需求可以称为当前实例的当前资源需求。
在资源估计方案中,对于某个媒体处理功能,可以提供与用于实例化媒体处理功能的默认实例的一组默认输入参数和配置参数相对应的默认资源需求。在示例中,用为媒体处理功能定义的目标性能需求导出默认资源需求。
通常,用于实例化媒体处理功能的资源需求可基于诸如CPU或GPU的计算性能的度量的一组度量标准来指定,例如,以每秒浮点运算次数(FLOPS)、内存大小(例如,随机存取存储器(RAM))、内存访问带宽(CPU与内存之间)等形式。用于指示资源需求的那些度量标准的值可以称为资源需求参数或资源参数。相应地,默认资源需求可以由一组默认资源需求参数来表示。
可以使用考虑了功能的算法和默认配置参数的分析方法,来导出默认资源需求。可替换地或附加地,可以采用实验方法来确定与默认配置参数相对应的默认资源需求。在示例中,默认资源需求的推导可以基于具有一定硬件和软件配置的参考云平台。
此外,在资源估计方案中,可以将与不同的资源需求度量标准对应的一组REF与媒体处理功能一起提供。每个REF可以定义与媒体处理功能的不同实例对应的各个资源需求度量标准的值与可变配置参数(例如,输入参数和配置参数)的值之间的关系。在示例中,REF可以以方程的形式提供。相应地,可以使用具有给定(当前)配置参数的REF来计算当前资源需求的度量标准。在示例中,REF可以以包括条目的查找表的形式提供,每个条目包括一对度量值和一组当前配置参数值。
在用于实例化媒体处理功能的资源估计过程期间,可以以如下方式使用资源估计方案。图1示例中的NBMP工作流管理器(103)可以从功能储存库(105)接收默认资源需求、默认输入参数和默认配置参数的值以及一个或多个REF(或指示REF的信息)。此外,NBMP工作流管理器(103)可以从NBMP源(101)接收与媒体处理功能的当前实例相对应的一组当前输入参数和配置参数。基于这些可用信息,NBMP工作流管理器(103)可以估计当前实例的当前资源需求的度量值。
在实施例中,资源估计方案的实现可以如下。对于要被实例化为当前实例的媒体处理功能,令当前实例的输入参数由集合{p}来定义。集合{p}可以包括诸如图片宽度、图片高度、帧速率、比特深度、颜色分量的数量、颜色分量的样本比率等参数。令当前实例的配置参数由集合{c}定义。集合{c}可以包括诸如目标比特率、编码模式、选择模式、参考帧数等参数。
此外,对于媒体处理功能的参考实例,令参考实例的默认输入参数由{p0}定义。令参考实例的默认配置参数由{c0}定义。
此外,令用于实例化具有默认输入参数{p0}和配置参数{c0}的参考实例的默认资源需求由默认资源需求参数{h0,m0,b0}来定义。默认资源参数h0可以是例如表示为FLOPS的数目的CPU或GPU的默认计算复杂度(计算性能)。默认资源参数m0可以是默认内存大小,例如,表示为兆字节数(MB)。默认资源参数b0可以是CPU-内存访问带宽。
给定当前实例的上述当前参数{p}和{q}以及参考实例的默认参数{p0}、{c0}和{h0,m0,b0},可以根据以下REF确定当前实例的当前资源需求:
{h,m,b}={Eh({p},{c}).h0,Em({p},{c}).m0,Eb({p},{c}).b0}。
或者,上述表达式可以用以下方式表示:
h=Eh({p},{c}).h0,
m=Em({p},{c}).m0,
b=Eb({p},{c}).b0。
参数{h,m,b}是表示用于实例化具有当前参数{p}和{c}的当前实例的当前资源需求的当前资源参数。
在REF中,变量Eh、Em和Eb被称为资源估计估计子(REE)或估计子,并且可以根据图1示例中的功能储存库(105)中的功能来定义。每一估计子对应于三个资源需求度量标准中的一者:CPU或GPU的计算性能、内存大小和CPU内存访问带宽。相应地,估计子Eh、Em和Eb可以分别被称为计算估计子、内存估计子和带宽估计子。
使用拼接功能作为媒体处理功能的示例,REF的推导和定义解释如下。拼接功能可用于将两个相邻帧沿垂直方向拼接在一起,例如,在360度视频流式传输的媒体处理中。用于实现拼接功能的计算复杂度(资源需求)可以取决于图片高度和输入数据的帧速率。相应地,拼接功能的计算估计子Eh和内存估计子Em可以按如下方式推导:
其中,参数h0、f0和w0是默认输入参数,表示与拼接功能的参考实例相对应的默认图片高度、默认帧速率和默认图片宽度;参数h、f和w为当前输入参数,表示拼接功能当前实例对应的当前图片高度、当前帧速率和当前图片宽度。
可以看出,计算估计子和内存估计子是当前输入参数的函数。当当前输入参数与默认输入参数相同时,计算估计子和内存估计子在本示例中可以具有值1。相应地,各个当前资源参数可以与各个参考资源参数相同。
在另一示例中,相同的拼接功能用于拼接n个帧的序列。数字n可以是3、4等。在相邻两个帧之间进行拼接操作。总之,执行n-1次拼接操作,以将n个帧连接在一起。在这样的配置下,拼接功能的计算估计子Eh和内存估计子Em可以按如下方式推导:
在另一示例中,将视频编码器的功能认为是媒体处理功能的示例。视频编码器功能的计算复杂度(资源需求)可以是输入帧宽度w、帧高度h和帧速率f的乘数。相应地,用于该视频编码器功能的计算估计子Eh和内存估计子Em可以是:
相应地,视频编码器功能的计算复杂度增加了帧宽度w、帧高度h和帧速率f的乘数。如果帧宽度w、帧高度h和帧速率f中的每一个加倍,则相应的输入视频的实时处理所需的资源将增加8倍。
对于视频编码器功能,如果参考帧的数量从1增加到k,则内存估计子Em变为:
请注意,在不同的实施例中,用于指示实例化功能的资源需求的资源需求度量标准可以是不同的。例如,对于同一功能,可在不同的NBMP系统中定义不同的度量标准(例如,不同的定义和/或不同的数目),且不同的NBMP系统中,度量标准的数目可以变化。或者,对于同一NBMP系统中的不同功能,可以采用不同的度量标准(例如,不同的数目和/或不同的定义)。因此,REF和REE可以相应地因功能而变化,或者因NBMP系统而变化。
此外,媒体处理功能的输入参数和配置参数可以根据媒体处理功能定义,并且因此可以针对不同的媒体处理功能而变化。
III.在功能描述中包括估计子
在各种实施例中,资源估计估计子(例如,Eh、Em和Eb)和默认资源估计参数(或默认参数)(包括默认输入参数{p0}、默认配置参数{c0}和默认资源参数(例如,{h0,m0,b0}))可以作为与相应的媒体处理功能相关联的功能描述的一部分来提供。例如,媒体处理功能可以由服务提供商例如以程序或程序库的形式来提供。服务提供商可以确定并提供估计子和默认参数作为媒体处理功能的相关部分。
在实施例中,媒体处理功能的估计子和默认参数包括在图1示例中的NBMP系统(100)中的媒体处理功能的功能描述的一个或多个描述符中。
例如,媒体处理功能的描述可以存储在功能储存库(105)中,并且包括用于描述媒体处理功能的一组描述符。在一个示例中,该组描述符可以包括以下描述符中的一个或多个:通用、输入、输出、处理、要求、配置、客户端-辅助、声明、变量、事件和安全性。例如,运动图像编码专家组(MPEG)开发的NBMP标准规定了用于功能储存库中的功能的标准化功能描述和相应的描述符。
在示例中,输入描述符可以包括两个对象阵列:一个用于媒体输入,一个用于元数据输入。类似地,输出描述符可以包括两个对象阵列:一个用于媒体输出,一个用于元数据输出。例如,输入或输出媒体-参数对象可以包括流标识(id)、名称、关键字、多用途互联网邮件扩展类型(mime-type)、视频格式、音频格式、图像格式、编解码器类型、协议、吞吐量、缓冲器大小、高速缓存服务器统一资源定位符(url)等。输入或输出元数据参数对象可以包括流id、名称、关键字、多用途互联网邮件扩展类型、编解码器类型、协议、最大尺寸、最小间隔、高速缓存服务器url、方案通用资源标志符(uri)等。
在示例中,配置描述符提供用于配置功能的参数的细节。
在示例中,需求描述符提供表1中列出的需求参数。
表1需求描述符
表2中示出了表1底部的一组资源估计参数的示例。
表2资源估计子参数
在表2中,默认值可以包括用作表2中列出的资源估计子的参考的默认资源估计参数的名称-值对列表。例如,默认资源估计参数可以包括默认输入参数{p0}、默认配置参数{c0}、以及默认资源参数(例如,{h0,m0,b0})。
在表2中,接下来的3个条目包括媒体处理功能的估计子Eh、Em和Eb的信息。在示例中,接下来的3个条目为估计子Eh、Em和Eb中的每一个提供估计子方程。例如,对于估计子Eh,估计子方程可以被描述为编程方程:
Eh=(高度/高度0)*(帧速率/帧速率0),
其对应于以下方程:
在另一个示例中,接下来的3个条目为估计子Eh、Em和Eb中的每一个提供估计子表达式。例如,对于估计子Eh,估计子表达式可以被描述为编程方程:
(高度/高度0)*(帧速率/帧速率0),
其对应于以下表达式:
在实施例中,媒体处理功能的输入描述符、输出描述符和配置描述符中的一个或多个还包括该组资源估计参数。表2中的资源估计参数对于输入、输出、配置和要求描述符具有相同的名称、格式和语义。
请注意,这里公开的计算资源估计方案不限于媒体处理功能或NBMP系统,尽管NBMP系统中的媒体处理功能用于示例来解释计算资源估计方案。对于用于各种处理目的的任何类型的功能、应用、软件、程序库等,计算资源估计方案可以用于资源估计,以便请求和分配足够的计算资源。此外,计算资源可以是基于云的或非基于云的(例如,计算机或一组计算机的资源)。
IV.用于功能实现的计算资源估计的示例性过程
图3示出了根据本申请实施例的用于实现处理功能的计算资源估计的示例性方法(300)。处理功能可以是媒体处理功能,或者可以是非媒体应用的其它类型功能之一。在一个示例中,过程300可由图1示例中的NBMP工作流管理器(103)执行。在其它示例中,过程300可由不属于NBMP系统的实体来执行。这样的实体起到NBMP工作流管理器(103)的作用,并且提供将处理功能实例化为任务的服务。方法(300)可以从(S301)开始,进行到(S310)。
在(S310)处,可以接收资源需求参数的默认值。资源需求参数的默认值可以指示用于在计算平台(例如,云平台)上实例化处理功能的参考实例的默认资源需求。参考实例可以用处理功能的配置参数和输入参数的一组一个或多个默认参数值来实例化。
此外,还可以在(S310)接收配置参数和输入参数的所述一组默认参数值。在示例中,可以从图1示例中的功能储存库(105)接收资源需求参数的默认值以及配置参数和输入参数的默认参数值。在另一示例中,可以从与任何NBMP系统无关的源,接收资源需求参数的默认值以及配置参数和输入参数的默认值。
在(S320),可以估计资源需求参数的当前值。资源需求参数的当前值可以指示用于在计算平台上实例化处理功能的当前实例的当前资源需求。当前实例可以用处理功能的配置参数和输入参数的一组一个或多个当前参数值来实例化。此外,资源需求参数的当前值的估计可以基于处理功能的复杂度参数的默认值以及配置参数和输入参数的默认参数值和当前参数值。
例如,可以从功能储存库(105)或与NBMP系统无关的源,接收与资源需求参数对应的估计子。估计子可以是处理功能的配置参数和输入参数的一个或多个当前参数值的函数。相应地,资源需求参数的当前值的估计可以基于以下表达式:
当前值=估计子*默认值。
作为示例,可以从诸如图1示例中的NBMP源(101)等处理功能的用户,接收处理功能的配置参数和输入参数的当前参数值。
在(S330),可以请求用于在当前计算平台上实例化处理功能的当前实例的计算资源。该请求可以基于估计的资源需求参数的当前值。例如,NBMP工作流管理器(103)可以使用当前计算平台提供的API,将请求发送到当前计算平台。
在示例中,将估计的资源需求参数的当前值发送到计算平台。在示例中,向计算平台发送指示所请求的资源的转换值。例如,当前计算平台可以具有特定的API,并且使用与用于估计的度量标准(例如,资源需求参数)不同的度量标准来指示计算资源。NBMP工作流管理器(103)可以将估计的资源需求参数的当前值转换为计算平台所使用的度量标准的值,并将转换后的值包括在请求中。
在示例中,不同于方法(300),NBMP工作流管理器(103)可以将估计子、资源需求参数以及输入参数和配置参数的默认参数值,以及输入参数和配置参数的当前参数值转发到计算平台。该平台基于所接收的估计子以及默认参数值和当前参数值来执行资源估计(类似于(S320)处的操作)。
响应于该请求,当前计算平台可相应地分配计算资源,以匹配资源需求参数的估计的当前值所指示的资源。结果,所请求的计算资源变得可用于例如NBMP工作流管理器(103)。
在(S340),可以使用所请求的计算资源在当前计算平台上实例化处理功能的当前实例。方法(300)可以进行到(S399)并在(S399)终止。
在方法(300)的示例中,描述了一个资源需求参数。然而,在其它实施例中,用于描述实现功能所需的资源的资源需求参数的数量可以多于一个。相应地,可以在资源估计过程期间,为多个资源需求参数中的每一个资源需求参数提供默认值和资源估计估计子。
V.计算机系统
本申请中所公开的方法、实施例、实体或功能可以由处理电路(例如,一个或多个处理器或一个或多个集成电路)实施。在一个示例中,所述一个或多个处理器执行存储在非易失性计算机可读介质上的程序,以执行本申请中所公开的方法、实施例或功能。所述程序可使用任何合适的机器代码或计算机语言来编码,所述机器代码或计算机语言可经受汇编、编译、链接或类似机制以创建包括指令的代码,所述指令可直接或通过解译、微码执行等而由一个或多个计算机中央处理单元(central processing unit,CPU)、图形处理单元(Graphics Processing Unit,GPU)等执行。可在各种类型的计算机或计算机组件上执行所述指令,所述计算机或计算机组件包括例如个人计算机、平板电脑、服务器、智能电话、游戏装置、物联网装置等。
图4示出了适于实施本申请所公开主题的某些实施例的计算机系统(400)。图4中所示的用于计算机系统(400)的组件在本质上是示范性的,并非旨在暗示关于实施本申请实施例的计算机软件的使用或功能的范围的任何限制。也不应将组件的配置解释为对计算机系统(400)的示范性实施例中所示的组件中的任一个组件或组件组合有任何依赖或需求。
计算机系统(400)可包括某些人机接口输入装置。此类人机接口输入装置可响应于一个或多个人类用户通过例如触觉输入(例如:按键、滑动、数据手套移动)、音频输入(例如:语音、拍击)、视觉输入(例如:手势)、嗅觉输入(未描绘)进行的输入。人机接口装置还可用于捕获未必与人的有意识输入直接相关的某些媒体,例如音频(例如:话语、音乐、环境声)、图像(例如:扫描图像、从静态图像相机获得的摄影图像)、视频(例如,二维视频、包括立体视频的三维视频)。
输入人机接口装置可包括以下一个或多个(每种仅描绘一个):键盘(401)、鼠标(402)、轨迹垫(403)、触摸屏(410)、数据手套(未示出)、操纵杆(405)、麦克风(406)、扫描仪(407)、相机(408)。
计算机系统(400)还可包括某些人机接口输出装置。此类人机接口输出装置可通过例如触觉输出、声音、光和气味/味道刺激一个或多个人类用户的感觉。此类人机接口输出装置可包括触觉输出装置(例如,触摸屏(410)、数据手套(未示出)或操纵杆(405)的触觉反馈,但还可存在不充当输入装置的触觉反馈装置)、音频输出装置(例如:扬声器(409)、头戴式耳机(未描绘))、视觉输出装置(例如,屏幕(410),包括CRT屏幕、LCD屏幕、等离子体屏幕、OLED屏幕,各自具有或不具有触摸屏输入能力,各自具有或不具有触觉反馈能力--其中的一些能够通过例如立体平画输出的方式输出二维视觉输出或大于三维的输出;虚拟现实眼镜(未描绘)、全息显示器和烟雾箱(未描绘)),以及打印机(未描绘)。
计算机系统(400)还可包括人类可访问的存储装置和存储装置的相关联介质,例如,光学介质,包括具有CD/DVD等介质(421)的CD/DVD ROM/RW(420)、拇指驱动器(422)、可移动硬盘驱动器或固态驱动器(423)、磁带和软盘(未描绘)等旧版磁性媒体、基于ROM/ASIC/PLD的专用装置,例如,安全保护装置(未描绘),等等。
所属领域的技术人员还应理解,结合当前公开的主题使用的术语“计算机可读介质”并未涵盖传输介质、载波或其它瞬时信号。
计算机系统(400)还可包括到一个或多个通信网络(455)的接口(454)。网络可例如是无线的、有线的、光学的。网络还可以是本地的、广域的、城域的、车载和工业的、实时的、容忍延迟的等等。网络的实例包括例如以太网、无线LAN的局域网、包括GSM、3G、4G、5G、LTE等的蜂窝网络、包括有线TV、卫星TV和地面广播TV的TV有线或无线广域数字网络、包括CAN总线的车载网络和工业网络等。某些网络通常需要附接到某些通用数据端口或外围总线(449)(例如,计算机系统(400)的USB端口)的外部网络接口适配器;其它网络通常通过附接到如下文所描述的系统总线而集成到计算机系统(400)的核心中(例如,通过以太网接口集成到PC计算机系统中,或通过蜂窝网络接口集成到智能电话计算机系统中)。通过使用这些网络中的任一网络,计算机系统(400)可与其它实体通信。此类通信可以是仅单向接收(例如,广播TV)、仅单向发送(例如,连到某些CAN总线装置的CAN总线)或是双向的,例如,使用局域数字网络或广域数字网络连接到其它计算机系统。可在如上文所描述的那些网络和网络接口中的每一个上使用某些协议和协议栈。
上述人机接口装置、人类可访问存储装置和网络接口可附接到计算机系统(400)的核心(440)。
核心(440)可包括一个或多个中央处理单元(CPU)(441)、图形处理单元(GPU)(442)、现场可编程门区域(Field Programmable Gate Areas,FPGA)形式的专用可编程处理单元(443)、用于某些任务的硬件加速器(444)等等。这些装置连同只读存储器(read-only memory,ROM)(445)、随机存取存储器(446)、例如内部非用户可访问的硬盘驱动器、SSD等内部大容量存储装置(447)可通过系统总线(448)连接。在一些计算机系统中,系统总线(448)可通过一个或多个物理插头形式访问以实现通过额外CPU、GPU等来扩展。外围装置可直接或通过外围总线(449)附接到核心的系统总线(448)。在一示例中,屏幕(410)可以连接到图形适配器(450)。用于外围总线的架构包括PCI、USB等等。
CPU(441)、GPU(442)、FPGA(443)和加速器(444)可执行某些指令,所述指令组合起来可构成上述计算机代码。计算机代码可存储在ROM(445)或RAM(446)中。过渡数据也可存储在RAM(446)中,而永久性数据可例如存储在内部大容量存储装置(447)中。可通过使用高速缓冲存储器来实现对任一存储器装置的快速存储和检索,所述高速缓冲存储器可与一个或多个CPU(441)、GPU(442)、大容量存储装置(447)、ROM(445)、RAM(446)等紧密关联。
计算机可读介质上可具有用于执行各种计算机实施的操作的计算机代码。所述介质和计算机代码可以是专为本申请的目的设计和构建的介质和计算机代码,或可属于计算机软件领域中的技术人员众所周知且可用的种类。
举例来说但不作为限制,具有架构(400)且尤其是核心(440)的计算机系统可提供因处理器(包括CPU、GPU、FPGA、加速器等)执行以一个或多个有形计算机可读介质体现的软件而产生的功能。此类计算机可读介质可以是与上文所介绍的用户可访问大容量存储装置以及核心(440)的非暂时性质的某些存储装置(例如,核心内部大容量存储装置(447)或ROM(445))相关联的介质。实施本申请的各种实施例的软件可存储在此类装置中且由核心(440)执行。根据特定需求,计算机可读介质可包括一个或多个存储器装置或芯片。软件可使核心(440)且具体地说使其中的处理器(包括CPU、GPU、FPGA等等)执行本文中所描述的特定过程或特定过程的特定部分,包括限定存储在RAM(446)中的数据结构以及根据由软件限定的过程修改此类数据结构。另外或作为替代方案,计算机系统可提供由硬连线的或以其它方式体现于电路(例如:加速器(444))中的逻辑所产生的功能,所述逻辑可代替或连同软件一起操作以执行本文描述的特定过程或特定过程的特定部分。适当时,对软件的引用可涵盖逻辑,且反之亦然。适当时,对计算机可读介质的引用可涵盖存储用于执行的软件的电路(例如,集成电路(IC))、体现用于执行的逻辑的电路或这两种电路。本申请涵盖硬件与软件的任何合适的组合。
尽管本申请描述了若干示范性实施例,但在本申请的范围内,可以有各种改动、排列组合方式以及各种替代等同物。因此,应该理解,在申请的精神和范围内,本领域技术人员能够设计出各种虽未在本文明确示出或描述、但可以体现本申请的原理的系统和方法。
Claims (20)
1.一种方法,其特征在于,包括:
接收资源需求参数的默认值,该资源需求参数的默认值指示用于在计算平台上,用处理功能的配置参数和输入参数的一个或多个默认参数值,实例化所述处理功能的参考实例的默认资源需求;以及
基于所述资源需求参数的默认值,以及所述处理功能的配置参数和输入参数的所述一个或多个默认参数值和一个或多个当前参数值,估计所述资源需求参数的当前值,该资源需求参数的当前值指示用于在所述计算平台上,使用所述处理功能的配置参数和输入参数的一个或多个当前参数值,实例化所述处理功能的当前实例的当前资源需求。
2.根据权利要求1所述的方法,其特征在于,所述资源需求参数是以下之一:
计算性能参数,其指示中央处理单元CPU或图形处理单元GPU的性能;
内存大小参数;以及
内存访问带宽参数,其指示CPU与内存之间的带宽。
3.根据权利要求1所述的方法,其特征在于,所述估计指示用于实例化所述处理功能的当前实例的当前资源需求的资源需求参数的当前值包括:
基于以下表达式估计指示当前资源需求的资源需求参数的当前值:
当前值=估计子*默认值,
其中,所述估计子是所述处理功能的所述配置参数和输入参数的一个或多个当前参数值的函数。
4.根据权利要求3所述的方法,其特征在于,当所述处理功能的配置参数和输入参数的所述默认参数值和所述一个或多个当前参数值相同时,所述估计子等于1。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
从存储包括所述处理功能的媒体处理功能的功能储存库接收所述估计子,所述功能储存库属于基于网络的媒体处理NBMP系统。
6.根据权利要求3所述的方法,其特征在于,所述估计子、所述资源需求参数的默认值、以及所述配置参数和输入参数的一个或多个默认参数值和一个或多个当前参数值,包括在从属于NBMP系统的功能储存库接收的所述处理功能的功能描述的描述符之中。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于估计的资源需求参数的当前值,请求用于用所述处理功能的所述配置参数和输入参数的所述一个或多个当前参数值在当前计算平台上实例化所述处理功能的当前实例的计算资源;以及
使用所请求的计算资源,在所述当前计算平台上实例化所述处理功能的当前实例。
8.一种装置,其特征在于,包括配置为执行以下操作的电路:
接收资源需求参数的默认值,该资源需求参数的默认值指示用于在计算平台上,用处理功能的配置参数和输入参数的一个或多个默认参数值,实例化所述处理功能的参考实例的默认资源需求;以及
基于所述资源需求参数的默认值,以及所述处理功能的配置参数和输入参数的所述一个或多个默认参数值和一个或多个当前参数值,估计所述资源需求参数的当前值,该资源需求参数的当前值指示用于在所述计算平台上,使用所述处理功能的配置参数和输入参数的一个或多个当前参数值,实例化所述处理功能的当前实例的当前资源需求。
9.根据权利要求8所述的装置,其特征在于,所述资源需求参数是以下之一:
计算性能参数,其指示中央处理单元CPU或图形处理单元GPU的性能;
内存大小参数;以及
内存访问带宽参数,其指示CPU与内存之间的带宽。
10.根据权利要求8所述的装置,其特征在于,所述估计指示用于实例化所述处理功能的当前实例的当前资源需求的资源需求参数的当前值包括:
基于以下表达式估计指示当前资源需求的资源需求参数的当前值:
当前值=估计子*默认值,
其中,所述估计子是所述处理功能的所述配置参数和输入参数的一个或多个当前参数值的函数。
11.根据权利要求10所述的装置,其特征在于,当所述处理功能的配置参数和输入参数的所述默认参数值和所述一个或多个当前参数值相同时,所述估计子等于1。
12.根据权利要求10所述的装置,其特征在于,所述电路还配置为:
从存储包括所述处理功能的媒体处理功能的功能储存库接收所述估计子,所述功能储存库属于基于网络的媒体处理NBMP系统。
13.根据权利要求10所述的装置,其特征在于,所述估计子、所述资源需求参数的默认值、以及所述配置参数和输入参数的一个或多个默认参数值和所述一个或多个当前参数值,包括在从属于NBMP系统的功能储存库接收的所述处理功能的功能描述的描述符之中。
14.根据权利要求8所述的装置,其中,所述电路还配置为:
基于估计的资源需求参数的当前值,请求用于用所述处理功能的所述配置参数和输入参数的所述一个或多个当前参数值在当前计算平台上实例化所述处理功能的当前实例的计算资源;以及
使用所述请求的计算资源,在所述当前计算平台上实例化所述处理功能的当前实例。
15.一种存储指令的非易失性计算机可读介质,其特征在于,所述指令在由处理器执行时,使所述处理器执行一种方法,该方法包括:
接收资源需求参数的默认值,该资源需求参数的默认值指示用于在计算平台上,用处理功能的配置参数和输入参数的一个或多个默认参数值,实例化所述处理功能的参考实例的默认资源需求;以及
基于所述资源需求参数的默认值,以及所述处理功能的配置参数和输入参数的所述一个或多个默认参数值和一个或多个当前参数值,估计所述资源需求参数的当前值,该资源需求参数的当前值指示用于在所述计算平台上,使用所述处理功能的配置参数和输入参数的一个或多个当前参数值,实例化所述处理功能的当前实例的当前资源需求。
16.根据权利要求15所述的非易失性计算机可读介质,其特征在于,所述资源需求参数是以下之一:
计算性能参数,其指示中央处理单元CPU或图形处理单元GPU的性能;
内存大小参数;以及
内存访问带宽参数,其指示CPU与内存之间的带宽。
17.根据权利要求15所述的非易失性计算机可读介质,其特征在于,所述估计指示用于实例化所述处理功能的当前实例的当前资源需求的资源需求参数的当前值包括:
基于以下表达式估计指示当前资源需求的资源需求参数的当前值:
当前值=估计子*默认值,
其中,所述估计子是所述处理功能的所述配置参数和输入参数的一个或多个当前参数值的函数。
18.根据权利要求17所述的非易失性计算机可读介质,其特征在于,当所述处理功能的配置参数和输入参数的所述默认参数值和所述一个或多个当前参数值相同时,所述估计子等于1。
19.根据权利要求17所述的非易失性计算机可读介质,其特征在于,所述方法还包括:
从存储包括所述处理功能的媒体处理功能的功能储存库接收所述估计子,所述功能储存库属于基于网络的媒体处理NBMP系统。
20.根据权利要求17所述的非易失性计算机可读介质,其特征在于,所述估计子、所述资源需求参数的默认值、以及所述配置参数和输入参数的一个或多个默认参数值和一个或多个当前参数值,包括在从属于NBMP系统的功能储存库接收的所述处理功能的功能描述的描述符之中。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962907629P | 2019-09-28 | 2019-09-28 | |
US62/907,629 | 2019-09-28 | ||
US17/028,426 US11775350B2 (en) | 2019-09-28 | 2020-09-22 | Compute resource estimation for function implementation on computing platform |
US17/028,426 | 2020-09-22 | ||
PCT/US2020/052666 WO2021062115A1 (en) | 2019-09-28 | 2020-09-25 | Compute resource estimation for function implementation on computing platform |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113826367A true CN113826367A (zh) | 2021-12-21 |
CN113826367B CN113826367B (zh) | 2023-08-08 |
Family
ID=75162055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080032327.0A Active CN113826367B (zh) | 2019-09-28 | 2020-09-25 | 用于实现处理功能的资源估计方法、装置和电子设备 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11775350B2 (zh) |
EP (1) | EP4035335A4 (zh) |
JP (1) | JP7293393B2 (zh) |
KR (1) | KR102688854B1 (zh) |
CN (1) | CN113826367B (zh) |
WO (1) | WO2021062115A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210105338A1 (en) * | 2020-01-06 | 2021-04-08 | Intel Corporation | Quality of service (qos) management with network-based media processing (nbmp) |
US11297121B2 (en) * | 2020-04-07 | 2022-04-05 | Tencent America LLC | Split rendering using network based media processing workflow |
US11496532B2 (en) * | 2020-04-10 | 2022-11-08 | Samsung Electronics Co., Ltd. | Offering media services through network edge |
WO2022144507A2 (en) * | 2021-01-04 | 2022-07-07 | Nokia Technologies Oy | Flexible upstream/downstream support for network-based media processing pipelines |
US11539776B2 (en) | 2021-04-19 | 2022-12-27 | Tencent America LLC | Method for signaling protocol characteristics for cloud workflow inputs and outputs |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101449242A (zh) * | 2006-06-15 | 2009-06-03 | 国际商业机器公司 | 按需组合和拆卸服务基础架构的方法和装置 |
US20140215460A1 (en) * | 2013-01-31 | 2014-07-31 | International Business Machines Corporation | Optimization of virtual machine sizing and consolidation |
CN107615275A (zh) * | 2015-05-29 | 2018-01-19 | 国际商业机器公司 | 估计用于运行数据挖掘服务的计算资源 |
CN109522090A (zh) * | 2018-11-09 | 2019-03-26 | 中国联合网络通信集团有限公司 | 资源调度方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4134197B2 (ja) * | 2006-05-23 | 2008-08-13 | 本田技研工業株式会社 | 車両用開閉体の制御システム |
US10031785B2 (en) * | 2015-04-10 | 2018-07-24 | International Business Machines Corporation | Predictive computing resource allocation for distributed environments |
US10203991B2 (en) * | 2017-01-19 | 2019-02-12 | International Business Machines Corporation | Dynamic resource allocation with forecasting in virtualized environments |
KR20190033022A (ko) | 2017-09-20 | 2019-03-28 | 경희대학교 산학협력단 | 계산 오프로딩을 이용한 클라우드 멀티미디어 서비스 제공 장치 및 방법 |
US10873614B2 (en) | 2018-01-17 | 2020-12-22 | Samsung Electronics Co., Ltd. | Method and apparatus for configuration and deployment of media processing in the network |
EP3925189A4 (en) * | 2019-03-18 | 2022-04-13 | Samsung Electronics Co., Ltd. | METHOD AND DEVICE FOR AUTHENTICATION IN NETWORK-BASED MEDIA PROCESSING (NBMP ) SYSTEMS |
US12019761B2 (en) * | 2019-03-20 | 2024-06-25 | Nokia Technologies Oy | Network based media processing security |
US11544108B2 (en) * | 2019-04-23 | 2023-01-03 | Tencent America LLC | Method and apparatus for functional improvements to moving picture experts group network based media processing |
-
2020
- 2020-09-22 US US17/028,426 patent/US11775350B2/en active Active
- 2020-09-25 WO PCT/US2020/052666 patent/WO2021062115A1/en active Application Filing
- 2020-09-25 KR KR1020217032509A patent/KR102688854B1/ko active IP Right Grant
- 2020-09-25 JP JP2021557975A patent/JP7293393B2/ja active Active
- 2020-09-25 CN CN202080032327.0A patent/CN113826367B/zh active Active
- 2020-09-25 EP EP20868663.4A patent/EP4035335A4/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101449242A (zh) * | 2006-06-15 | 2009-06-03 | 国际商业机器公司 | 按需组合和拆卸服务基础架构的方法和装置 |
US20140215460A1 (en) * | 2013-01-31 | 2014-07-31 | International Business Machines Corporation | Optimization of virtual machine sizing and consolidation |
CN107615275A (zh) * | 2015-05-29 | 2018-01-19 | 国际商业机器公司 | 估计用于运行数据挖掘服务的计算资源 |
CN109522090A (zh) * | 2018-11-09 | 2019-03-26 | 中国联合网络通信集团有限公司 | 资源调度方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
EP4035335A4 (en) | 2023-10-11 |
KR20210134776A (ko) | 2021-11-10 |
KR102688854B1 (ko) | 2024-07-29 |
JP7293393B2 (ja) | 2023-06-19 |
CN113826367B (zh) | 2023-08-08 |
EP4035335A1 (en) | 2022-08-03 |
US11775350B2 (en) | 2023-10-03 |
US20210096922A1 (en) | 2021-04-01 |
JP2022526378A (ja) | 2022-05-24 |
WO2021062115A1 (en) | 2021-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113826367B (zh) | 用于实现处理功能的资源估计方法、装置和电子设备 | |
US11516628B2 (en) | Media streaming with edge computing | |
US12047306B2 (en) | First-in first-out function for segmented data stream processing | |
CN113785279B (zh) | 并行处理数据流的方法、装置和电子设备 | |
JP7451556B2 (ja) | ネットワークに基づいたメディア処理(nbmp)におけるメディア処理機能のための構成パラメータのグラフ表現及び記述 | |
US11861411B2 (en) | Variable and event reporting in a cloud service system | |
US11593150B2 (en) | Method and apparatus for cloud service |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |