CN115311123B - 一种像素流gpu资源调度方法及装置 - Google Patents
一种像素流gpu资源调度方法及装置 Download PDFInfo
- Publication number
- CN115311123B CN115311123B CN202210961232.8A CN202210961232A CN115311123B CN 115311123 B CN115311123 B CN 115311123B CN 202210961232 A CN202210961232 A CN 202210961232A CN 115311123 B CN115311123 B CN 115311123B
- Authority
- CN
- China
- Prior art keywords
- resource
- server
- user
- resources
- priority
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 238000012545 processing Methods 0.000 claims abstract description 70
- 238000009877 rendering Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明实施例提供一种像素流GPU资源调度方法及装置,所述方法包括:接收到用户的资源请求时,检测服务器端是否有空余资源处理所述资源请求;当服务器端没有空余资源处理资源请求,获取用户的用户权限等级,根据用户权限等级获取对应的资源处理策略,根据资源处理策略确定对资源请求进行处理的初始服务器;获取初始服务器中每台服务器的剩余资源数量及资源请求对应的资源要求,根据用户权限等级、剩余资源数量及资源要求判断初始服务器中每台服务器是否为候选服务器,计算候选服务器的工作时长,根据工作时长选择目标服务器。采用本方法能够根据用户权限优先级,合理分配资源使用,使小型项目在不需要使用大规模云资源的前提下,可以提高并发数。
Description
技术领域
本发明涉及渲染技术领域,尤其涉及一种像素流GPU资源调度方法及装置。
背景技术
像素流送(Pixel Streaming)技术是数字孪生应用领域一个重要方向,该技术通过后端高性能GPU服务器对三维数字孪生场景进行游戏级渲染,然后将渲染结果以实时像素流的形式通过WebRtc推送至Web端,使Web端能够在不依赖客户机配置的情况下得到高逼真的数字孪生场景。但是该技术存在的明显问题是独立并发访问数很低,一般每张GPU显卡仅能支持2路独立并发。
当前行业内的主要解决方案是通过分布式云服务器集群搭建GPU渲染云服务,实现对多路并发访问的支持,但是该方式需要投入的硬件成本项目较高,且需要使用云服务器,对于无法需要独立部署且不适合通过渲染云服务方式的项目并不适用。
发明内容
针对现有技术中存在的问题,本发明实施例提供一种像素流GPU资源调度方法及装置。
本发明实施例提供一种像素流GPU资源调度方法,包括:
接收到用户的资源请求时,检测服务器端是否有空余资源处理所述资源请求;
当所述服务器端有空余资源处理所述资源请求,判断所述用户是否为共享用户,并当所述用户为共享用户时,使用当前GPU渲染流处理资源请求,当所述用户不为共享用户时,从资源池中创建云资源处理资源请求;
当所述服务器端没有空余资源处理所述资源请求,获取所述用户的用户权限等级,根据所述用户权限等级获取对应的资源处理策略,并根据所述资源处理策略确定对所述资源请求进行处理的初始服务器;
获取初始服务器中每台服务器的剩余资源数量及所述资源请求对应的资源要求,根据所述用户权限等级、剩余资源数量及资源要求判断所述初始服务器中每台服务器是否为候选服务器,并计算候选服务器的工作时长,根据所述工作时长选择目标服务器。
在其中一个实施例中,所述方法还包括:
判断所述用户权限等级是否为独占等级;
当所述用户权限等级为独占等级时,获取独占等级对应的初始服务器;
当所述用户权限等级不为独占等级时,确定所述用户权限等级的优先级,查找比所述用户权限等级的优先级更低优先级的其他用户的资源,并抢占更低优先级的其他用户的资源对应的服务器作为初始服务器。
在其中一个实施例中,所述方法还包括:
当所述服务器端不能查找到比所述用户权限等级的优先级更低优先级的资源时,则查找与所述用户权限等级相同优先级的其他用户的资源,并在所述相同优先级的其他用户之后进入排队模式;
获取所述相同优先级的其他用户的资源处理时长,将所述排队模式与对应的资源处理时长反馈至用户的联络终端。
在其中一个实施例中,所述方法还包括:
当用户权限等级的优先级为高优先级时,所述资源要求为最佳性能资源要求,则根据所述最佳性能资源要求及剩余资源数量筛选所述初始服务器中每台服务器是否为候选服务器;
当用户权限等级的优先级为低优先级时,所述资源要求为可运行资源要求,则根据所述可运行资源要求及剩余资源数量筛选所述初始服务器中每台服务器是否为候选服务器。
在其中一个实施例中,所述方法还包括:
获取候选服务器最后一次的资源处理时长以及预设时间段内的空余时长,根据所述资源处理时长及空余时长计算所述候选服务器的工作时长;
选取所述候选服务器中工作时长最小的服务器,作为所述目标服务器。
本发明实施例提供一种像素流GPU资源调度装置,包括:
接收模块,用于接收到用户的资源请求时,检测服务器端是否有空余资源处理所述资源请求;
判断模块,用于当所述服务器端有空余资源处理所述资源请求,判断所述用户是否为共享用户,并当所述用户为共享用户时,使用当前GPU渲染流处理资源请求,当所述用户不为共享用户时,从资源池中创建云资源处理资源请求;
获取模块,用于当所述服务器端没有空余资源处理所述资源请求,获取所述用户的用户权限等级,根据所述用户权限等级获取对应的资源处理策略,并根据所述资源处理策略确定对所述资源请求进行处理的初始服务器;
服务器确定模块,用于获取初始服务器中每台服务器的剩余资源数量及所述资源请求对应的资源要求,根据所述用户权限等级、剩余资源数量及资源要求判断所述初始服务器中每台服务器是否为候选服务器,并计算候选服务器的工作时长,根据所述工作时长选择目标服务器。
在其中一个实施例中,所述装置还包括:
第二判断模块,用于判断所述用户权限等级是否为独占等级;
第二获取模块,用于当所述用户权限等级为独占等级时,获取独占等级对应的初始服务器;
抢占模块,用于当所述用户权限等级不为独占等级时,确定所述用户权限等级的优先级,查找比所述用户权限等级的优先级更低优先级的其他用户的资源,并抢占更低优先级的其他用户的资源对应的服务器作为初始服务器。
在其中一个实施例中,所述装置还包括:
查找模块,用于当所述服务器端不能查找到比所述用户权限等级的优先级更低优先级的资源时,则查找与所述用户权限等级相同优先级的其他用户的资源,并在所述相同优先级的其他用户之后进入排队模式;
反馈模块,用于获取所述相同优先级的其他用户的资源处理时长,将所述排队模式与对应的资源处理时长反馈至用户的联络终端。
本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述像素流GPU资源调度方法的步骤。
本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述像素流GPU资源调度方法的步骤。
本发明实施例提供的一种像素流GPU资源调度方法及装置,接收到用户的资源请求时,检测服务器端是否有空余资源处理所述资源请求;当服务器端有空余资源处理所述资源请求,判断用户是否为共享用户,并当用户为共享用户时,使用当前GPU渲染流处理资源请求,当用户不为共享用户时,从资源池中创建云资源处理资源请求;当服务器端没有空余资源处理资源请求,获取用户的用户权限等级,根据用户权限等级获取对应的资源处理策略,并根据资源处理策略确定对资源请求进行处理的初始服务器;获取初始服务器中每台服务器的剩余资源数量及资源请求对应的资源要求,根据用户权限等级、剩余资源数量及资源要求判断初始服务器中每台服务器是否为候选服务器,并计算候选服务器的工作时长,根据工作时长选择目标服务器。这样能够根据用户权限优先级,合理分配资源使用,使小型项目在不需要使用大规模云资源的前提下,可以提高并发数。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种像素流GPU资源调度方法的流程图;
图2为本发明实施例中一种资源处理策略的流程图;
图3为本发明另一实施例中一种服务器端资源池管理的流程图;
图4为本发明实施例中一种像素流GPU资源调度装置的结构图;
图5为本发明实施例中电子设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种像素流GPU资源调度方法的流程示意图,如图1所示,本发明实施例提供了一种像素流GPU资源调度方法,包括:
步骤S101,接收到用户的资源请求时,检测服务器端是否有空余资源处理所述资源请求。
具体地,当接收到用户的新的资源请求时,检测服务器端是否有空余资源处理资源请求,比如比较当前已绑定到用户的GPU资源进程数量是否超过当前服务器硬件资源允许的最大资源数量。
步骤S102,当所述服务器端有空余资源处理所述资源请求,判断所述用户是否为共享用户,并当所述用户为共享用户时,使用当前GPU渲染流处理资源请求,当所述用户不为共享用户时,从资源池中创建云资源处理资源请求。
具体地,如果服务器端有空余资源处理资源请求,再判断当前用户是否为共享用户,所有共享用户拥有使用同一GPU渲染流进程资源,因此如果此用户为共享用户,即使用当前GPU渲染流处理资源请求,具体为判断当前共享资源进程是否已经启动,若服务为启动,则直接使用共享资源;若共享资源未启动,先从资源池中启动共享资源,另外,若当前用户不是共享用户,则直接从资源池中创建云资源处理资源请求。
步骤S103,当所述服务器端没有空余资源处理所述资源请求,获取所述用户的用户权限等级,根据所述用户权限等级获取对应的资源处理策略,并根据所述资源处理策略确定对所述资源请求进行处理的初始服务器。
具体地,当服务器端没有空余资源处理所述资源请求,则获取用户的用户权限等级,根据用户权限等级获取对应的资源处理策略,具体可以包括:分配的用户权限等级从高到低依次为:“独占”,独享一路资源,其他用户不可去抢占、排队;“优先级”:按不同等级进行分配,高优先级可以抢占低优先级,同一优先级之间可以通过排队的方式等待资源,另外,还可以包括“共享”等级:共享资源使用同一路资源,该资源操作相互关联,用户之间的操作会互相影响,因此适用于不重要的展示场景,如漫游宣传页面等,然后根据对应的策略确定对应的处理的初始服务器。
另外,详细的处理步骤如图2所示,可以包括:
1、无资源服务时首先判断是否有独占用户,若当前用户不为独占用户,需要确定当前用户优先级,之后比较是否有低于当前用户优先级的用户;
2、若当前用户为独占用户或者存在优先级低的用户,那么就查找低优先级的用户,并抢占其资源,抢占策略可以根据用户连接时间判断,优先下线连接时间最长的低优先级用户;
3、若没有低于当前优先级的用户,则查找同优先级的用户。如果存在同优先级的用户,则当前用户进入排队模式,获取相同优先级的其他用户的资源处理时长,将排队模式与对应的资源处理时长反馈至用户的联络终端;
4、若没有同优先级的用户,则反馈当前用户无可用资源。
步骤S104,获取初始服务器中每台服务器的剩余资源数量及所述资源请求对应的资源要求,根据所述用户权限等级、剩余资源数量及资源要求判断所述初始服务器中每台服务器是否为候选服务器,并计算候选服务器的工作时长,根据所述工作时长选择目标服务器。
具体地,获取初始服务器中每台服务器的剩余资源数量及资源请求对应的资源要求,根据用户权限等级、剩余资源数量及资源要求判断初始服务器中每台服务器是否为候选服务器,包括:当用户权限等级的优先级为高优先级时,资源要求为最佳性能资源要求,则根据最佳性能资源要求及剩余资源数量筛选初始服务器中每台服务器是否为候选服务器;当用户权限等级的优先级为低优先级时,资源要求为可运行资源要求,则根据可运行资源要求及剩余资源数量筛选初始服务器中每台服务器是否为候选服务器,在筛选确定候选服务器,计算候选服务器的工作时长,包括:获取候选服务器最后一次的资源处理时长以及预设时间段内的空余时长,根据资源处理时长及空余时长计算候选服务器的工作时长,然后选取候选服务器中工作时长最小的服务器,作为目标服务器。
另外,详细的处理步骤可以包括:
1、确定资源请求对应的资源要求,影响资源占用的主要因素有GPU占用率和CPU占用率,但是同一应用在资源充裕时可能占用更多资源,当资源不足时也会采用效果降级的策略,因此须同时记录资源的“最佳性能最低资源要求(GPU用RgH,CPU资源用RcH)”和“可运行的最低资源要求(GPU用RgL,CPU资源用RcL)”;
2、确定每台服务器的可用资源总量(GPU用SRg0,CPU资源用SRc0),和服务器剩余资源数量(GPU用SRg,CPU资源用SRc);
3、当有资源请求时,根据用户的等级进行分配获取候选服务器。若用户是高权限用户,采用RgH<SRg&&RcH<SRc判断是否为候选服务器,若为低用户权限,使用RgL<SRg&&RcL<SRc判断是否为候选服务器;
4、从候选服务器中选择目标服务器:为保证每台服务器可以平衡的分配到工作时间以避免部分设备长时间高负载运行,采用最近最闲策略进行调度,即选取最近一段时间最空闲的服务器进行分配。计算公式为:w=Lu/Lf,其中Lu表示最后一次使用的服务的时长,Lf表示最近空余的时间长度。
本发明实施例提供的一种像素流GPU资源调度方法,接收到用户的资源请求时,检测服务器端是否有空余资源处理所述资源请求;当服务器端有空余资源处理所述资源请求,判断用户是否为共享用户,并当用户为共享用户时,使用当前GPU渲染流处理资源请求,当用户不为共享用户时,从资源池中创建云资源处理资源请求;当服务器端没有空余资源处理资源请求,获取用户的用户权限等级,根据用户权限等级获取对应的资源处理策略,并根据资源处理策略确定对资源请求进行处理的初始服务器;获取初始服务器中每台服务器的剩余资源数量及资源请求对应的资源要求,根据用户权限等级、剩余资源数量及资源要求判断初始服务器中每台服务器是否为候选服务器,并计算候选服务器的工作时长,根据工作时长选择目标服务器。这样能够根据用户权限优先级,合理分配资源使用,使小型项目在不需要使用大规模云资源的前提下,可以提高并发数。
在另一实施例中,如图3所示,在上述实施例的基础上,在目标服务器为用户提供资源服务时,已连接的用户每次操作时,都将通知到后端服务,并再下线前通知资源池回收资源。资源池也定期检查连接的操作时间,对于长时间无操做的用户,进行下线处理并回收资源。
用户下线操作时,先解绑资源与用户ID,将资源标记为可用资源,检查是否有多余的备用线程,如果此时线程池中没有多余线程,保留当前线程到进程池,否则释放资源销毁当前资源,减少服务器端负荷。
在本实施例中,一方面,创建多种不同等级的权限,通过权限实现资源的调度。权限包括独占、高优先级、低优先级、共享几种模式;其中独占模式可以占用独立的线程,不被其他用户抢占、排队等待,该权限适合那些重要演示及重点保障的用户,由于资源有限,因此独占用户不宜多于线程池最大线程数的70%;共享模式,该模式下所有用户使用同一GPU资源进程,同一资源进程存在画面联动的问题,但对于一些仅用于漫游展示的非重要场合,是满足用户需求的;其他的权限根据用户优先级来分配资源,其中高优先级用户可以抢占低优先级用户资源,同一用户优先级资源之间资源竞争可以排队等待,排队等待期间,一段时间其他用户无操作将断开连接,将资源分配给新用户使用,若一段时间后始终没有同等级用户下线,将断开连接时间最长的用户。
另一方面,使用GPU资源池对资源进行池化管理,减少渲染进程启动时的耗时,同时通过定时任务检查资源状态,维护资源池中的闲置进程数量,及时释放多余的进程,仅保留一路空闲进程,以保证及时相应用户请求的前提下,尽可能减少资源占用,提高服务器寿命及能源消耗。同时,提供一种资源与用户权限的绑定方式,以便通过用户的登录登出,控制资源的创建与回收。
图4为本发明实施例提供的一种像素流GPU资源调度装置,包括:接收模块S201、判断模块S202、获取模块S203、服务器确定模块S204,其中:
接收模块S201,用于接收到用户的资源请求时,检测服务器端是否有空余资源处理所述资源请求。
判断模块S202,用于当所述服务器端有空余资源处理所述资源请求,判断所述用户是否为共享用户,并当所述用户为共享用户时,使用当前GPU渲染流处理资源请求,当所述用户不为共享用户时,从资源池中创建云资源处理资源请求。
获取模块S203,用于当所述服务器端没有空余资源处理所述资源请求,获取所述用户的用户权限等级,根据所述用户权限等级获取对应的资源处理策略,并根据所述资源处理策略确定对所述资源请求进行处理的初始服务器。
服务器确定模块S204,用于获取初始服务器中每台服务器的剩余资源数量及所述资源请求对应的资源要求,根据所述用户权限等级、剩余资源数量及资源要求判断所述初始服务器中每台服务器是否为候选服务器,并计算候选服务器的工作时长,根据所述工作时长选择目标服务器。
在一个实施例中,装置还可以包括:
第二判断模块,用于判断所述用户权限等级是否为独占等级。
第二获取模块,用于当所述用户权限等级为独占等级时,获取独占等级对应的初始服务器。
抢占模块,用于当所述用户权限等级不为独占等级时,确定所述用户权限等级的优先级,查找比所述用户权限等级的优先级更低优先级的其他用户的资源,并抢占更低优先级的其他用户的资源对应的服务器作为初始服务器。
在一个实施例中,装置还可以包括:
查找模块,用于当所述服务器端不能查找到比所述用户权限等级的优先级更低优先级的资源时,则查找与所述用户权限等级相同优先级的其他用户的资源,并在所述相同优先级的其他用户之后进入排队模式。
反馈模块,用于获取所述相同优先级的其他用户的资源处理时长,将所述排队模式与对应的资源处理时长反馈至用户的联络终端。
关于像素流GPU资源调度装置的具体限定可以参见上文中对于像素流GPU资源调度方法的限定,在此不再赘述。上述像素流GPU资源调度装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)301、存储器(memory)302、通信接口(Communications Interface)303和通信总线304,其中,处理器301,存储器302,通信接口303通过通信总线304完成相互间的通信。处理器301可以调用存储器302中的逻辑指令,以执行如下方法:接收到用户的资源请求时,检测服务器端是否有空余资源处理所述资源请求;当服务器端有空余资源处理所述资源请求,判断用户是否为共享用户,并当用户为共享用户时,使用当前GPU渲染流处理资源请求,当用户不为共享用户时,从资源池中创建云资源处理资源请求;当服务器端没有空余资源处理资源请求,获取用户的用户权限等级,根据用户权限等级获取对应的资源处理策略,并根据资源处理策略确定对资源请求进行处理的初始服务器;获取初始服务器中每台服务器的剩余资源数量及资源请求对应的资源要求,根据用户权限等级、剩余资源数量及资源要求判断初始服务器中每台服务器是否为候选服务器,并计算候选服务器的工作时长,根据工作时长选择目标服务器。
此外,上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:接收到用户的资源请求时,检测服务器端是否有空余资源处理所述资源请求;当服务器端有空余资源处理所述资源请求,判断用户是否为共享用户,并当用户为共享用户时,使用当前GPU渲染流处理资源请求,当用户不为共享用户时,从资源池中创建云资源处理资源请求;当服务器端没有空余资源处理资源请求,获取用户的用户权限等级,根据用户权限等级获取对应的资源处理策略,并根据资源处理策略确定对资源请求进行处理的初始服务器;获取初始服务器中每台服务器的剩余资源数量及资源请求对应的资源要求,根据用户权限等级、剩余资源数量及资源要求判断初始服务器中每台服务器是否为候选服务器,并计算候选服务器的工作时长,根据工作时长选择目标服务器。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (6)
1.一种像素流GPU资源调度方法,其特征在于,包括:
接收到用户的资源请求时,检测服务器端是否有空余资源处理所述资源请求;
当所述服务器端有空余资源处理所述资源请求,判断所述用户是否为共享用户,并当所述用户为共享用户时,使用当前GPU渲染流处理资源请求,当所述用户不为共享用户时,从资源池中创建云资源处理资源请求;
当所述服务器端没有空余资源处理所述资源请求,获取所述用户的用户权限等级,根据所述用户权限等级获取对应的资源处理策略,并根据所述资源处理策略确定对所述资源请求进行处理的初始服务器;
获取初始服务器中每台服务器的剩余资源数量及所述资源请求对应的资源要求,根据所述用户权限等级、剩余资源数量及资源要求判断所述初始服务器中每台服务器是否为候选服务器,并计算候选服务器的工作时长,根据所述工作时长选择目标服务器;
所述根据所述用户权限等级获取对应的资源处理策略,并根据所述资源处理策略确定对所述资源请求进行处理的初始服务器,包括:
判断所述用户权限等级是否为独占等级;
当所述用户权限等级为独占等级时,获取独占等级对应的初始服务器;
当所述用户权限等级不为独占等级时,确定所述用户权限等级的优先级,查找比所述用户权限等级的优先级更低优先级的其他用户的资源,并抢占更低优先级的其他用户的资源对应的服务器作为初始服务器;
所述查找比所述用户权限等级的优先级更低优先级的资源,包括:
当所述服务器端不能查找到比所述用户权限等级的优先级更低优先级的资源时,则查找与所述用户权限等级相同优先级的其他用户的资源,并在所述相同优先级的其他用户之后进入排队模式;
获取所述相同优先级的其他用户的资源处理时长,将所述排队模式与对应的资源处理时长反馈至用户的联络终端。
2.根据权利要求1所述的像素流GPU资源调度方法,其特征在于,所述根据所述用户权限等级、剩余资源数量及资源要求判断所述初始服务器中每台服务器是否为候选服务器,包括:
当用户权限等级的优先级为高优先级时,所述资源要求为最佳性能资源要求,则根据所述最佳性能资源要求及剩余资源数量筛选所述初始服务器中每台服务器是否为候选服务器;
当用户权限等级的优先级为低优先级时,所述资源要求为可运行资源要求,则根据所述可运行资源要求及剩余资源数量筛选所述初始服务器中每台服务器是否为候选服务器。
3.根据权利要求1所述的像素流GPU资源调度方法,其特征在于,所述计算候选服务器的工作时长,根据所述工作时长选择目标服务器,包括:
获取候选服务器最后一次的资源处理时长以及预设时间段内的空余时长,根据所述资源处理时长及空余时长计算所述候选服务器的工作时长;
选取所述候选服务器中工作时长最小的服务器,作为所述目标服务器。
4.一种像素流GPU资源调度装置,其特征在于,所述装置包括:
接收模块,用于接收到用户的资源请求时,检测服务器端是否有空余资源处理所述资源请求;
判断模块,用于当所述服务器端有空余资源处理所述资源请求,判断所述用户是否为共享用户,并当所述用户为共享用户时,使用当前GPU渲染流处理资源请求,当所述用户不为共享用户时,从资源池中创建云资源处理资源请求;
获取模块,用于当所述服务器端没有空余资源处理所述资源请求,获取所述用户的用户权限等级,根据所述用户权限等级获取对应的资源处理策略,并根据所述资源处理策略确定对所述资源请求进行处理的初始服务器;
服务器确定模块,用于获取初始服务器中每台服务器的剩余资源数量及所述资源请求对应的资源要求,根据所述用户权限等级、剩余资源数量及资源要求判断所述初始服务器中每台服务器是否为候选服务器,并计算候选服务器的工作时长,根据所述工作时长选择目标服务器;
第二判断模块,用于判断所述用户权限等级是否为独占等级;
第二获取模块,用于当所述用户权限等级为独占等级时,获取独占等级对应的初始服务器;
抢占模块,用于当所述用户权限等级不为独占等级时,确定所述用户权限等级的优先级,查找比所述用户权限等级的优先级更低优先级的其他用户的资源,并抢占更低优先级的其他用户的资源对应的服务器作为初始服务器;
查找模块,用于当所述服务器端不能查找到比所述用户权限等级的优先级更低优先级的资源时,则查找与所述用户权限等级相同优先级的其他用户的资源,并在所述相同优先级的其他用户之后进入排队模式;
反馈模块,用于获取所述相同优先级的其他用户的资源处理时长,将所述排队模式与对应的资源处理时长反馈至用户的联络终端。
5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3任一项所述像素流GPU资源调度方法的步骤。
6.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至3任一项所述像素流GPU资源调度方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210961232.8A CN115311123B (zh) | 2022-08-11 | 2022-08-11 | 一种像素流gpu资源调度方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210961232.8A CN115311123B (zh) | 2022-08-11 | 2022-08-11 | 一种像素流gpu资源调度方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115311123A CN115311123A (zh) | 2022-11-08 |
CN115311123B true CN115311123B (zh) | 2023-04-28 |
Family
ID=83860366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210961232.8A Active CN115311123B (zh) | 2022-08-11 | 2022-08-11 | 一种像素流gpu资源调度方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115311123B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111176852A (zh) * | 2020-01-15 | 2020-05-19 | 上海依图网络科技有限公司 | 资源分配方法、装置、芯片及计算机可读存储介质 |
CN112346836A (zh) * | 2020-10-28 | 2021-02-09 | 海光信息技术股份有限公司 | 共享计算资源的抢占方法、装置、用户设备及存储介质 |
CN112764909A (zh) * | 2021-01-27 | 2021-05-07 | 联思智云(北京)科技有限公司 | 一种基于云架构工作站的共享方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106936883B (zh) * | 2015-12-31 | 2020-03-20 | 伊姆西Ip控股有限责任公司 | 用于云系统的方法和装置 |
CN109428912B (zh) * | 2017-08-24 | 2020-07-10 | 阿里巴巴集团控股有限公司 | 一种分布式系统资源分配方法、装置及系统 |
CN112988390A (zh) * | 2021-03-22 | 2021-06-18 | 上海超级计算中心 | 一种算力资源分配方法及装置 |
CN114153582A (zh) * | 2021-11-30 | 2022-03-08 | 上海商汤科技开发有限公司 | 资源调度方法及装置、电子设备和存储介质 |
CN114461384A (zh) * | 2021-12-28 | 2022-05-10 | 浙江大华技术股份有限公司 | 任务执行方法、装置、计算机设备和存储介质 |
-
2022
- 2022-08-11 CN CN202210961232.8A patent/CN115311123B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111176852A (zh) * | 2020-01-15 | 2020-05-19 | 上海依图网络科技有限公司 | 资源分配方法、装置、芯片及计算机可读存储介质 |
CN112346836A (zh) * | 2020-10-28 | 2021-02-09 | 海光信息技术股份有限公司 | 共享计算资源的抢占方法、装置、用户设备及存储介质 |
CN112764909A (zh) * | 2021-01-27 | 2021-05-07 | 联思智云(北京)科技有限公司 | 一种基于云架构工作站的共享方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115311123A (zh) | 2022-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112269641B (zh) | 一种调度方法、装置、电子设备及存储介质 | |
US9442763B2 (en) | Resource allocation method and resource management platform | |
US10397062B2 (en) | Cross layer signaling for network resource scaling | |
CN110474966B (zh) | 处理云平台资源碎片的方法及相关设备 | |
US20220070099A1 (en) | Method, electronic device and computer program product of load balancing | |
US20230379268A1 (en) | Resource scheduling method and system, electronic device, computer readable storage medium | |
CN113486042B (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
CN115311123B (zh) | 一种像素流gpu资源调度方法及装置 | |
CN111857992B (zh) | 一种Radosgw模块中线程资源分配方法和装置 | |
JP2009237918A (ja) | 分散型コンテンツ配信システム、センタサーバ、分散型コンテンツ配信方法及び分散型コンテンツ配信プログラム | |
CN112860383A (zh) | 集群资源调度方法、装置、设备及存储介质 | |
EP2983105B1 (en) | Electronic device, on-chip memory and method of operating the on-chip memory | |
CN116820769A (zh) | 一种任务分配方法、装置及系统 | |
CN109522113B (zh) | 一种内存管理方法及装置 | |
CN106790632B (zh) | 一种流数据的并发传输方法和装置 | |
US9483317B1 (en) | Using multiple central processing unit cores for packet forwarding in virtualized networks | |
RU2522995C2 (ru) | Способ и устройство создания одноранговой группы в одноранговом приложении и способ применения одноранговой группы | |
CN115063282A (zh) | 一种gpu资源调度方法、装置、设备及存储介质 | |
CN105278873B (zh) | 一种磁盘块的分配方法及装置 | |
CN117056064A (zh) | 资源分配方法、装置、服务器、存储介质和程序产品 | |
US10877800B2 (en) | Method, apparatus and computer-readable medium for application scheduling | |
CN113535378A (zh) | 一种资源调配方法、存储介质及终端设备 | |
CN110955522A (zh) | 一种协调性能隔离和数据恢复优化的资源管理方法及系统 | |
CN112995613B (zh) | 一种分析资源管理方法及装置 | |
CN114546279B (zh) | Io请求预测方法、装置、存储节点及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: 313200 building 6, No. 11, Keyuan Road, Wuyang street, Deqing County, Huzhou City, Zhejiang Province Patentee after: Zhejiang Zhongce Spacetime Technology Co.,Ltd. Address before: 313200 building 6, No. 11, Keyuan Road, Wuyang street, Deqing County, Huzhou City, Zhejiang Province Patentee before: ZHEJIANG TOPRS GEOGRAPHIC INFORMATION TECHNOLOGY Co.,Ltd. |
|
CP01 | Change in the name or title of a patent holder |