CN117112199A - 一种多租户资源调度方法、装置及存储介质 - Google Patents
一种多租户资源调度方法、装置及存储介质 Download PDFInfo
- Publication number
- CN117112199A CN117112199A CN202310921355.3A CN202310921355A CN117112199A CN 117112199 A CN117112199 A CN 117112199A CN 202310921355 A CN202310921355 A CN 202310921355A CN 117112199 A CN117112199 A CN 117112199A
- Authority
- CN
- China
- Prior art keywords
- tenant
- queue
- request
- proportion
- request information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000013468 resource allocation Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000005012 migration Effects 0.000 claims description 5
- 238000013508 migration Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 abstract description 27
- 230000008569 process Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000000275 quality assurance Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5038—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
- G06F9/5016—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及资源调度技术领域,尤其是指一种多租户资源调度方法、装置及存储介质。本发明所述的多租户资源调度方法,通过基于有效用户的占比和短作业请求的占比来确定租户的优先级,并基于优先级确定租户发出的请求所进入的队列,提高了对于租户的请求的处理效率以及资源利用率,保证了多租户系统的稳定运行,并且满足多租户的实际需求,是一种更灵活的资源调度方式,可以更好的进行业务系统的资源调度。
Description
技术领域
本发明涉及资源调度技术领域,尤其是指一种多租户资源调度方法、装置、设备及计算机存储介质。
背景技术
在高共享程度的多租户模式下,往往作为租户应用的宿主平台而使用。在多租户微服务场景中,对应用服务器性能的衡量主要存在以下两种,一种是应用服务器的服务提供能力,包括其线程池的大小,任务线程的绑定与回收,可承载的租户数量等,以及应用服务器所在物理主机的资源提供能力,包括CPU计算能力,内存,存储空间大小,网络带宽等,这种性能指标取决于硬件的性能和应用服务器的实现以及配置,具有明确的衡量标准。当租户的外部请求规模超过应用服务器所能处理的范围时,就会出现严重的性能下降。另一种是以租户服务质量保证为度量的性能指标,对不同租户而言,每个租户对服务质量的要求是不同的,在多租户环境下,资源总量固定,一个租户占用较多服务资源必将对其他租户的服务质量产生影响,如何平衡租户所享有的服务质量,以及在发生资源侵占时对租户的服务质量进行优化配置,是保证应用服务器多租户性能的一个重要问题。
多租户场景下的资源调度,目前往往是以多租户的预先设定好的优先级进行调度,然而这种情况很难应对一些特殊场景的需求,例如某一租户的紧急业务处理量剧增,造成的无法保证对于这一租户的任务的时效管理的问题,另外,也会在改变租户的资源配置的过程中,需要人工参与进来,需要额外耗费人力成本来进行维护。
发明内容
为此,本发明所要解决的技术问题在于克服现有技术中资源调度处理效率和资源利用率低、不符合实际需求的问题。
为解决上述技术问题,本发明提供了一种多租户资源调度方法,包括:
创建多个不同优先级的请求队列;
接收当前租户中用户发出的请求信息,计算有效用户比例;
根据所述有效用户比例确定当前租户的优先级,并根据所述当前租户的优先级确定当前租户的目标请求队列;
获取当前租户请求信息中短作业请求的比例,并根据所述短作业请求的比例确定当前租户在所述目标请求队列中资源分配的优先级;
将当前租户的请求信息放入所述目标请求队列,并基于所述资源分配的优先级,对当前租户进行资源调度。
优选地,所述接收当前租户中用户发出的请求信息,计算有效用户比例包括:
获取当前租户中的用户数量;
获取当前租户中在预设时段内发出请求信息的有效用户数量及有效用户角色信息;
基于所述有效用户数量、所述用户数量以及有效用户角色信息的重要程度,确定所述有效用户比例。
优选地,所述获取当前租户请求信息中短作业请求的比例包括:
获取预设时段内当前租户发出的历史请求信息;
识别所述历史请求信息中短作业请求的数量;
根据所述短作业请求的数量与历史请求信息的数量确定当前租户请求信息中短作业请求的比例。
优选地,所述获取当前租户请求信息中短作业请求的比例后还包括:
当所述有效用户比例达到第一比例范围,且所述短作业请求的比例达到第二比例范围时,提升当前租户的优先级。
优选地,所述将当前租户的请求信息放入所述目标请求队列包括:
当所述目标请求队列处于拥塞状态,且存在空闲状态的可迁移队列时,将所述当前租户的请求信息迁移至所述可迁移队列。
优选地,所述将所述当前租户的请求信息迁移至所述可迁移队列包括:
获取当前租户在所述目标请求队列中请求信息的队列编号;
根据所述队列编号确定所述当前租户的请求信息在所述可迁移队列中的队列位置,并基于所述队列位置进行迁移。
优选地,所述迁移队列为高于所述目标请求队列优先级的队列。
本发明还提供了一种多租户资源调度装置,包括:
队列创建模块,用于创建多个不同优先级的请求队列;
有效用户比例计算模块,用于接收当前租户中用户发出的请求信息,计算有效用户比例;
目标请求队列确定模块,用于根据所述有效用户比例确定当前租户的优先级,并根据所述当前租户的优先级确定当前租户的目标请求队列;
资源分配优先级确定模块,用于获取当前租户请求信息中短作业请求的比例,并根据所述短作业请求的比例确定当前租户在所述目标请求队列中资源分配的优先级;
资源调度模块,用于将当前租户的请求信息放入所述目标请求队列,并基于所述资源分配的优先级,对当前租户进行资源调度。
本发明还提供了一种多租户资源调度设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述一种多租户资源调度方法步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种多租户资源调度方法的步骤。
本发明的上述技术方案相比现有技术具有以下优点:
本发明所述的多租户资源调度方法,首先创建至少两个不同优先级请求队列,然后接收当前租户的至少一个用户发出的请求信息,获取所述当前租户的有效用户比例,根据所述有效用户比例,确定所述当前租户的优先级,根据所述优先级确定所述当前租户的目标请求队列,并获取所述当前租户的请求信息中短作业请求的比例,根据所述短作业请求的比例,确定所述当前租户在所述目标请求队列中的资源分配优先级,将所述当前租户的请求信息放入至所述目标请求队列,并基于所述资源分配优先级,对所述当前租户进行资源调度。本发明通过基于有效用户的占比和短作业请求的占比来确定租户的优先级,并基于优先级确定租户发出的请求所进入的队列,提高了对于租户的请求的处理效率以及资源利用率,保证了多租户系统的稳定运行,并且满足多租户的实际需求,是一种更灵活的资源调度方式,可以更好的进行业务系统的资源调度。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中:
图1是本发明所提供的一种多租户资源调度方法的实现流程图;
图2是本发明实施例提供的一种多租户资源调度装置的结构框图。
具体实施方式
本发明的核心是提供一种多租户资源调度方法、装置、设备及计算机存储介质,提高了对于租户的请求的处理效率以及资源利用率,保证了多租户系统的稳定运行,并且满足了多租户的实际需求。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明所提供的一种多租户资源调度方法的实现流程图;具体操作步骤如下:
首先,本发明的使用场景可以是在云平台,云平台是指基于硬件资源和软件资源的服务,提供计算、网络和存储能力。硬件资源主要指服务器交换机、磁盘以及GPU等;软件资源主要指各种软件工具,如域名服务、虚拟内网以及数据库软件等。在此云平台可以完成多租户业务平台的资源调度。
基于上述使用场景,可以理解的,本申请的执行主体可以是该云平台,此处不做过多的限定。
S101:创建多个不同优先级的请求队列;
S102:接收当前租户中用户发出的请求信息,计算有效用户比例;
S103:根据所述有效用户比例确定当前租户的优先级,并根据所述当前租户的优先级确定当前租户的目标请求队列;
S104:获取当前租户请求信息中短作业请求的比例,并根据所述短作业请求的比例确定当前租户在所述目标请求队列中资源分配的优先级;
S105:将当前租户的请求信息放入所述目标请求队列,并基于所述资源分配的优先级,对当前租户进行资源调度。
基于以上实施例,本发明对步骤S101进行详细说明:
首先,确定不同优先级的队列,每个优先级可以是与租户进行绑定的,例如租户A的优先级是1,则租户A发出请求后,会将租户A的请求放入至队列1中;其次,对于队列数量根据租户的请求来维护,例如当前有两个租户发来请求,如果不同的优先级,则创建2个队列,如果相同的优先级,则创建1个队列。
请求队列可以是一个双向链表,其元素就是请求描述符。在一种实施例中,请求队列可以是客户端与服务器进行信息交互的通道,当用户发出请求信息时,客户端的请求会发送到云平台服务器的处理器中,处理器会将此请求放入请求队列中,供请求处理线程获取。
优先级可以是是一种约定,优先级高的先做,优先级低的后做。在一种实施例中,可以将优先级分为三级,用文字表示。例如,一共有三个优先级,按优先级高到低分别为甲级、乙级以及丙级。若此时创建两个请求队列,等级分别为甲级和乙级,则甲级请求队列优先级较高,表示优先处理此队列中的请求。
创建请求队列可以是在云平台中建立相应的磁盘和分区后,利用相应代码在其中建立请求队列的过程。在服务器端监听客户连接请求时,可以设定客户端连接请求的队列长度,例如,将队列长度设为30,即表示此队列可以容纳30个请求。
基于以上实施例,本发明对步骤S102进行详细说明:
对于有效用户进行定义,例如在30天内发出请求的次数超过预设次数可以作为有效用户,或者,在以往发出过计算复杂程度达到预设程度的用户作为有效用户,或者,对于请求的资源配置达到一定规模的用户,作为有效用户;获取当前租户的所有用户的数量,并根据所确定的有效用户的数量确定所述有效用户所占的比例,即为有效用户比例。
接收可以是服务器的处理器收到用户通过客户端传送的请求信息的过程,当服务器的处理器收到请求信息后,会将此请求信息放入请求队列中,等待请求处理线程处理该请求信息;当得到该请求信息后,会调用相关方法处理该请求信息。本发明中,当请求处理线程获得请求信息后,会首先查询有效用户数量和使用此云平台提供服务的所有用户数量,并调用计算有效用户比例的方法计算当前租户的有效用户比例。
S201:获取当前租户中的用户数量;
当前租户可以是使用云平台系统或计算资源的客户,本发明中,租户可以是包含多个用户的企业或者学校等大型场所。
用户可以是企业或者学校等大型场所其中的一员,即租户中的一员。
获取当前租户的所有用户数量可以是处理器查询数据库中当前租户的所有用户数量的过程。
S202:获取当前租户中的有效用户数量及有效用户角色信息;
获取当前租户在预设时段内发出请求信息的用户的数量,得到所述有效用户数量,或
获取当前租户在预设时段内发出请求信息次数超过预设次数的用户的数量,得到所述有效用户数量,或
获取当前租户在预设时段内发出的请求信息计算复杂程度达到预设程度的用户的数量,得到所述有效用户数量,或
获取当前租户在预设时段内发出请求的资源配置达到预设规模的用户的数量,得到所述有效用户数量。
请求信息可以是客户端向服务器发送的请求服务器处理的信息。例如,云平台为某学校提供了学校所使用的管理云平台系统,在此系统中的其中一项服务为查询成绩,某学生通过此系统查询自己成绩时所提交的请求即为一个请求信息。
角色信息可以是根据租户的角色规定规则,所确定的用户所处的位置。例如,当租户为学校时,学校的角色共分为管理人员以及学生两种角色,每个用户都会有相对应的角色。
获取当前租户在预设时段内发出请求信息的用户的数量以及发出请求信息的用户的角色信息可以是处理器统计预设时段内发出请求信息的用户的数量,以及根据这些请求信息发出的用户id在数据库中查询对应角色信息的过程。
S203:基于所述有效用户数量、所述用户数量以及有效用户角色信息的重要程度,确定所述有效用户比例。
确定可以是处理器根据有效用户的数量,与所有用户数量,以及发出请求信息的用户的角色信息所占的权重,调用计算有效用户比例的方法,计算当前租户的有效用户比例的过程。
有效用户比例可以是真正使用此云平台提供的服务的用户在所有用户中的所占比例,可以用百分比进行表示,计算公式为:
有效用户比例=有效用户÷所有用户×100%
在一种实施例中,可以规定有效用户数量权重比为50%,所有用户数量权重比为30%,发出请求信息的用户的角色信息占比为20%。
例如,云平台为某学校提供了学校所使用的管理云平台系统,此学校共包含1600个学生,规定过去30天登录过此系统的学生为有效用户,若过去30天共有800个学生登录此平台,则有效用户比例=800÷1600×100%=50%。
基于以上实施例,本发明对步骤S103进行详细说明:
对于业务系统,可以是提供多种应用服务的,并且为多个租户提供服务。在这种情况下,如果接收到租户发来的请求,可以读取租户的优先级,将其放入至不同的队列中;因为业务系统的资源是动态分配的,在满足租户的QOS需求的情况下,可以基于各个租户的请求数量和请求计算的内容来灵活分配。
对于一般的租户优先级而言,其确定了优先级之后,是不会做出调整的。本发明采用有效用户占比作为考虑的对象,根据有效用户占比来确定优先级的级别。这样设置的好处是在于有效用户的占比越高,其对于资源的使用越充分,并且可能需要更多资源需求的可能性更大,所以对于有效用户的定义,以及对于有效用户占比的识别,是本发明提出的改进点所在,并且可以根据其有效用户占比的识别结果,确定是否需要对于租户进行优先级的变更,提高了业务系统的处理能力,资源调度的灵活性,更好的满足不同租户不同情况的需求。
目标请求队列可以是该租户的用户发出请求信息时,此请求信息的优先级对应的请求队列。例如,当某学校学生发送查询成绩的请求信息后,此学校优先级为甲级,则处理器会将此请求信息放入甲级的请求队列中进行处理。
确定优先级可以是处理器根据有效用户比例判断当前租户优先级的过程,在一种实施例中,可以设置有效用户比例在80%以上为甲级租户,有效用户比例在40%~80%之间为乙级租户,有效用户比例在40%以下为丙级租户。则当获取到有效用户比例后,处理器判断此有效用户比例处于哪一优先级对应范围中,根据判断结果确定当前租户优先级。例如,某学校使用了云平台所提供的服务,此学校有效用户比例为50%,则处理器根据此数据得到此学校优先级为乙级的结果。
确定目标请求队列可以是处理器确定当前租户优先级后,判断并寻找对应优先级的请求队列的过程。
基于以上实施例,本发明对步骤S104进行详细说明:
需要确定用户发出的请求是否为短作业请求,可以通过用户本次发出的作业的类型类计算,例如超大规模的计算,机器学习的计算或者是极为常规的数据获取或者计算,这三类来看,最后一类可以作为短作业请求。并根据该短作业请求确定当前租户的短作业请求占比,例如当前放入到请求队列中,当前租户的3个用户的请求来说,其中1个是短作业请求,另外两个不是短作业请求,则可以确定该占比为33.3%。另外的一种计算方式是,可以获取当前租户的历史发出的请求的记录,例如历史100条记录中,有20条是短作业请求,则可以确定为当前租户的短作业请求占比为20%。除了上述两种,还可以是统计租户在30天内发出的作业请求中,短作业请求数量的占比,例如得到结论为35%。
S401:获取预设时段内当前租户发出的历史请求信息;
预设时段可以是处理器为了确定短作业请求的比例所设置的时间范围,例如,可以规定每30天为确定短作业请求的比例的一个时间周期。
历史请求信息可以是在预设时段内,此租户发送的所有请求信息。历史请求数量则为在预设时段内,此租户发送的所有请求信息数量和。
获取可以是处理器统计在预设时段内当前租户发出的请求信息的数量的过程。
S402:识别所述历史请求信息中短作业请求的数量;
短作业请求的数量可以是在预设时段内,此租户发送的所有请求信息中短作业请求的数量和。
识别可以是处理器根据短作业请求的判断规则判断历史请求信息中短作业请求的数量的过程。
S403:根据所述短作业请求的数量与历史请求信息的数量确定当前租户请求信息中短作业请求的比例。
短作业请求可以是作业运行时间短的的请求,在一种实施例中,处理请求信息时间较短的请求即为短作业请求,可以规定请求信息处理时间在0.1s以下的请求为短作业请求。短作业请求的比例可以是某租户发出的所有请求信息中短作业请求所占的比例,计算公式可以表示为:
短作业请求比例=短作业请求÷所有请求信息×100%;
例如,某学校同时发出了100个请求,其中短作业请求为50个,则:
短作业请求比例=50÷100×100%=50%。
获取短作业请求比例可以是处理器收到客户端发送的所有请求信息后,根据请求信息的处理时间判断此请求信息对应的类型,即判断此请求信息为短作业请求或长作业请求。确定所有请求信息的数量后统计短作业请求的数量,然后调用短作业请求比例计算方法计算其中短作业请求所占的比例的过程。
S404:当所述有效用户比例达到第一比例范围,且所述短作业请求的比例达到第二比例范围时,提升当前租户的优先级。
若所述有效用户比例达到第一比例范围,且所述短作业请求的比例达到第二比例范围,则确定所述当前租户的优先级是否为可提升优先级,若是,则将所述当前租户的请求信息放入目标请求队列的更高优先级的队列。
第一比例范围可以是为了重新确定租户优先级所设置的有效用户比例,在一种实施例中,可以规定甲级租户有效用户比例为80%以上,乙级租户有效用户比例在40%~80%,丙级租户有效用户比例在40%以下,则当原来的乙级租户有效用户比例提升至80%以上,原来的丙级租户有效用户比例提升至40%~80%之间,视为达到了第一比例范围。
第二比例范围可以是为了重新确定租户优先级所设置的短作业请求的比例,在一种实施例中,可以规定甲级租户短作业请求的比例为80%以上,乙级租户短作业请求的比例为40%~80%,丙级租户短作业请求的比例为40%以下,则当原来的丙级租户短作业请求的比例提升至80%以上,原来的丙级租户短作业请求的比例提升至40%~80%之间,视为达到了第二比例范围。
例如,如果有效用户占比满足超过40%的范围,且短作业请求的占比经过在以往的一个周期内的统计中,占据所有请求1000条中的550条,也就是超过了50%,在这种情况下,可以将该租户的优先级重新来确定,即超出了目前所在队列的优先级,那么在这样的情况下,可以确定该租户的优先级已经可以对应于更高的优先级所对应的队列,则可以将该租户的左右请求转移至新的队列,从而提高租户的请求的处理效率,同时还能够因为其短作业请求数量足够多,而不会给其转移至的队列中的其他租户的请求的处理速度造成影响。
可提升优先级可以是当有效用户比例达到第一比例范围的同时短作业请求的比例达到第二比例范围时,视为当前租户的等级达到了可提升优先级,即租户后续可以进行优先级的提升。
确定可以是处理器调用判断第一比例范围以及第二比例范围的方法判断当前租户是否达到可提升优先级标准的过程,即判断当前租户的有效用户比例以及短作业请求的比例是否同时达到第一比例范围和第二比例范围的过程。
放入更高优先级的队列可以是处理器判断当前租户优先级为可提升优先级后,重新赋予优先级给此租户的过程。例如,租户优先级为丙级,此租户当前有效用户比例为50%,短作业请求的比例为50%,则达到了可提升优先级标准,处理器自动将此租户优先级提升至乙级。
本实施例中,通过设置预设时段的范围,以及根据预设时段确定短作业请求比例的方法,可以更加规范的确定短作业请求比例。以及根据短作业请求的比例可以确定租户的喜好请求类型,以便确定租户更加适应于哪一种类型的队列,并且可基于此,设置可提升优先级,可以对默认的租户的优先级进行重新确定,提高了业务系统的处理能力以及资源调度的灵活性,以此来更好的为租户提供充分的资源和使用体验。
资源分配优先级可以是按照处理器所调用的资源数量所设置的优先级,在一种实施例中中,也可以将资源分配优先级分为甲级、乙级以及丙级,可以规定甲级资源分配优先级使用请求处理线程数量为20,乙级资源分配优先级使用请求处理线程数量为10,丙级资源分配优先级使用请求处理线程数量为5。规定短作业请求比例在80%以上对应的资源分配优先级为甲级,40%~80%对应的资源分配优先级为乙级,40%以下对应的资源分配优先级为丙级。
确定资源分配优先级可以是处理器得到短作业请求比例后,根据判断资源分配优先级所设置的规则,判断短作业请求比例所处于的资源分配优先级的过程。
基于以上实施例,本发明对步骤S105进行详细说明:
放入目标请求队列可以是处理器识别到此租户的请求信息对应的请求队列的优先级后,将此请求信息发送到对应的目标请求队列的过程。
资源调度可以是当处理器确定此租户的请求信息的资源分配优先级后,调用相应数量的请求处理线程处理此请求信息的过程。例如,当某学校的资源分配优先级为甲级时,则处理器调用20个请求处理线程同时处理此学校所有用户发送的请求信息。
在一定的情况下,可以在租户当前的队列拥塞,且更高优先级的队列闲置的情况下,将当前租户由当前队列迁移至闲置的更高优先级队列,例如当前租户在队列中的请求数量达到一定数量的情况下,可以进行队列的迁移。
在进入队列之后可以结合队列中租户的请求的情况来确定是否对租户的队列发生迁移。在一种实施例中所采用的迁移方式往往是将租户迁移至相同或更高优先级的队列,但是租户的默认优先级是不作调整的,这样既能够满足实际使用的需求,还能够很好的对于租户的优先级进行管控,避免某一优先级的租户数量过多,导致队列出现拥塞等情况。
当所述目标租户队列处于拥塞状态(拥塞状态可以是目标请求队列被请求信息占满,无法处理新的请求信息的状态。例如,某请求队列可以处理30个请求信息,当前正在处理30个请求信息,则视为此队列处于拥塞状态),且存在空闲状态的可迁移队列时,将所述当前租户的请求信息迁移至所述可迁移队列:
S501:获取当前租户在所述目标租户队列中请求信息的队列编号;
S502:根据所述队列编号确定所述当前租户的请求信息在所述可迁移队列中的队列位置,并基于所述队列位置进行迁移。
可迁移队列可以是与拥塞队列处于同一优先级的队列。例如,拥塞队列优先级为甲级,则可迁移队列优先级也应该为甲级。
空闲状态可以是可迁移队列当前未被占满,还能继续处理请求的状态。
请求信息的队列编号可以是租户发送的请求信息在目标请求队列中所占的位置编号,例如,租户发送了3个请求信息,在此目标请求队列中排第2、第5以及第10,则请求信息的队列编号为2、4、10。
队列位置可以是迁移后的请求信息在可迁移队列中所处的位置,例如此队列当前正在处理5个请求,则在可迁移队列中所处的队列位置为2、4、8。
迁移可以是处理器确定目标请求队列为拥塞状态后,将全部请求信息转移到可迁移队列的过程。
本实施例通过设置可迁移队列,可以在目标请求队列处于拥塞状态时使用其他同优先级队列处理请求信息,在满足租户需求的同时,提高租户的请求的处理效率,并且采用灵活的资源调度方式,可以更好的进行业务系统的资源调度。
本发明在满足租户需求时,提高了租户的请求的处理效率,并且采用灵活的资源调度方式,可以更好的进行业务系统的资源调度。针对预先设定好的优先级进行调度,难以应对一些特殊场景的需求的问题,可以更好的进行资源的调度,并且在此过程中,可以无需工作人员的人工参与,实现自动的对于租户的请求进行高配合度的处理,提高了租户的使用体验,同时不影响平台的稳定运行。
请参考图2,图2为本发明实施例提供的一种多租户资源调度装置的结构框图;具体装置可以包括:
队列创建模块100,用于创建多个不同优先级的请求队列;
有效用户比例计算模块200,用于接收当前租户中用户发出的请求信息,计算有效用户比例;
目标请求队列确定模块300,用于根据所述有效用户比例确定当前租户的优先级,并根据所述当前租户的优先级确定当前租户的目标请求队列;
资源分配优先级确定模块400,用于获取当前租户请求信息中短作业请求的比例,并根据所述短作业请求的比例确定当前租户在所述目标请求队列中资源分配的优先级;
资源调度模块500,用于将当前租户的请求信息放入所述目标请求队列,并基于所述资源分配的优先级,对当前租户进行资源调度。
本实施例的多租户资源调度装置用于实现前述的多租户资源调度方法,因此多租户资源调度装置中的具体实施方式可见前文多租户资源调度方法的实施例部分,例如,队列创建模块100,有效用户比例计算模块200,目标请求队列确定模块300,资源分配优先级确定模块400,资源调度模块500,分别用于实现上述多租户资源调度方法中步骤S101,S102,S103,S104,S105,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本发明具体实施例还提供了一种多租户资源调度设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述一种多租户资源调度方法的步骤。
本发明具体实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种多租户资源调度方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (10)
1.一种多租户资源调度方法,其特征在于,包括:
创建多个不同优先级的请求队列;
接收当前租户中用户发出的请求信息,计算有效用户比例;
根据所述有效用户比例确定当前租户的优先级,并根据所述当前租户的优先级确定当前租户的目标请求队列;
获取当前租户请求信息中短作业请求的比例,并根据所述短作业请求的比例确定当前租户在所述目标请求队列中资源分配的优先级;
将当前租户的请求信息放入所述目标请求队列,并基于所述资源分配的优先级,对当前租户进行资源调度。
2.根据权利要求1所述的多租户资源调度方法,其特征在于,所述接收当前租户中用户发出的请求信息,计算有效用户比例包括:
获取当前租户中的用户数量;
获取当前租户中在预设时段内发出请求信息的有效用户数量及有效用户角色信息;
基于所述有效用户数量、所述用户数量以及有效用户角色信息的重要程度,确定所述有效用户比例。
3.根据权利要求1所述的多租户资源调度方法,其特征在于,所述获取当前租户请求信息中短作业请求的比例包括:
获取预设时段内当前租户发出的历史请求信息;
识别所述历史请求信息中短作业请求的数量;
根据所述短作业请求的数量与历史请求信息的数量确定当前租户请求信息中短作业请求的比例。
4.根据权利要求1所述的多租户资源调度方法,其特征在于,所述获取当前租户请求信息中短作业请求的比例后还包括:
当所述有效用户比例达到第一比例范围,且所述短作业请求的比例达到第二比例范围时,提升当前租户的优先级。
5.根据权利要求1所述的多租户资源调度方法,其特征在于,所述将当前租户的请求信息放入所述目标请求队列包括:
当所述目标请求队列处于拥塞状态,且存在空闲状态的可迁移队列时,将所述当前租户的请求信息迁移至所述可迁移队列。
6.根据权利要求5所述的多租户资源调度方法,其特征在于,所述将所述当前租户的请求信息迁移至所述可迁移队列包括:
获取当前租户在所述目标请求队列中请求信息的队列编号;
根据所述队列编号确定所述当前租户的请求信息在所述可迁移队列中的队列位置,并基于所述队列位置进行迁移。
7.根据权利要求5所述的多租户资源调度方法,其特征在于,所述迁移队列为高于所述目标请求队列优先级的队列。
8.一种多租户资源调度装置,其特征在于,包括:
队列创建模块,用于创建多个不同优先级的请求队列;
有效用户比例计算模块,用于接收当前租户中用户发出的请求信息,计算有效用户比例;
目标请求队列确定模块,用于根据所述有效用户比例确定当前租户的优先级,并根据所述当前租户的优先级确定当前租户的目标请求队列;
资源分配优先级确定模块,用于获取当前租户请求信息中短作业请求的比例,并根据所述短作业请求的比例确定当前租户在所述目标请求队列中资源分配的优先级;
资源调度模块,用于将当前租户的请求信息放入所述目标请求队列,并基于所述资源分配的优先级,对当前租户进行资源调度。
9.一种多租户资源调度设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述一种多租户资源调度方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述一种多租户资源调度方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310921355.3A CN117112199A (zh) | 2023-07-25 | 2023-07-25 | 一种多租户资源调度方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310921355.3A CN117112199A (zh) | 2023-07-25 | 2023-07-25 | 一种多租户资源调度方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117112199A true CN117112199A (zh) | 2023-11-24 |
Family
ID=88810090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310921355.3A Pending CN117112199A (zh) | 2023-07-25 | 2023-07-25 | 一种多租户资源调度方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117112199A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117632417A (zh) * | 2023-11-27 | 2024-03-01 | 北京神州云合数据科技发展有限公司 | 多租户saas服务的任务优先级控制方法及系统 |
-
2023
- 2023-07-25 CN CN202310921355.3A patent/CN117112199A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117632417A (zh) * | 2023-11-27 | 2024-03-01 | 北京神州云合数据科技发展有限公司 | 多租户saas服务的任务优先级控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10078533B2 (en) | Coordinated admission control for network-accessible block storage | |
EP2923479B1 (en) | Method and apparatus for controlling utilization in a horizontally scaled software application | |
CN110297699B (zh) | 调度方法、调度器、存储介质及系统 | |
CN107239336B (zh) | 一种实现任务调度的方法及装置 | |
CN109861850B (zh) | 一种基于sla的无状态云工作流负载均衡调度的方法 | |
US20150242234A1 (en) | Realtime Optimization Of Compute Infrastructure In A Virtualized Environment | |
CN112988390B (zh) | 一种算力资源分配方法及装置 | |
CN108123980B (zh) | 一种资源调度方法及系统 | |
CN110659123B (zh) | 一种基于消息的分布式任务分发调度方法及装置 | |
CN117112199A (zh) | 一种多租户资源调度方法、装置及存储介质 | |
CN111124687A (zh) | 一种cpu资源预留方法、装置及其相关设备 | |
US20210357269A1 (en) | Quality of service scheduling with workload profiles | |
CN112749002A (zh) | 一种集群资源动态管理的方法和装置 | |
CN110209166B (zh) | 多个移动式服务机器人的协同控制方法、装置和存储介质 | |
CN116610422A (zh) | 一种任务调度方法、装置和系统 | |
CN112416520B (zh) | 一种基于vSphere的智能资源调度方法 | |
CN105187483B (zh) | 分配云计算资源的方法及装置 | |
CN116820729A (zh) | 离线任务调度方法、装置及电子设备 | |
WO2016206441A1 (zh) | 一种虚拟资源分配方法及装置、计算机存储介质 | |
CN108429704B (zh) | 一种节点资源分配方法及装置 | |
CN116166181A (zh) | 一种云监控方法和云管理平台 | |
CN114124763A (zh) | 一种宽带接入速率的测量方法及系统 | |
CN113132266A (zh) | Io请求调度方法和装置 | |
CN118567865B (zh) | 基于算力优化的集群数据采集方法、系统、设备及介质 | |
KR101584770B1 (ko) | 실시간 마이그레이션 자원 할당 시스템 및 할당 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |