CN110968414A - 资源伸缩方法及装置 - Google Patents

资源伸缩方法及装置 Download PDF

Info

Publication number
CN110968414A
CN110968414A CN201811141554.8A CN201811141554A CN110968414A CN 110968414 A CN110968414 A CN 110968414A CN 201811141554 A CN201811141554 A CN 201811141554A CN 110968414 A CN110968414 A CN 110968414A
Authority
CN
China
Prior art keywords
capacity expansion
task
resource
demand
resources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811141554.8A
Other languages
English (en)
Inventor
田永军
何万青
贺荣徽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811141554.8A priority Critical patent/CN110968414A/zh
Publication of CN110968414A publication Critical patent/CN110968414A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5066Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种资源伸缩方法及装置。其中,该方法包括:接收扩容请求;根据扩容请求中的任务的任务特征确定对应的弹性策略;根据对应的弹性策略,确定扩容需求资源;根据扩容需求资源为任务进行扩容。本发明解决了相关技术中在对资源进行扩容或者缩容的过程中,无法依据任务的特性灵活调整伸缩策略,从而实现灵活伸缩资源的技术问题。

Description

资源伸缩方法及装置
技术领域
本发明涉及资源处理技术领域,具体而言,涉及一种资源伸缩方法及装置。
背景技术
当前,高性能计算(High Performance Computing,简称HPC)领域的应用,正在逐步使用云计算,云计算可以给企业、生活带来很多的方便,对于HPC集群来说,规模越大,对于资源的调度要求就越高,这时,就需要根据HPC集群的作业负载规划集群的规模,每个作业根据应用种类,用户的业务需求,对计算资源都有不同的需求,这样就需要更加灵活的资源调度方式,而当前的资源调度方式存在很多缺点,首先,HPC集群上可能会同时运行紧急程度不同的作业,有的作业是对时间敏感的,要求在尽可能短的时间内完成;有的作业对成本敏感,要求花尽可能少的成本完成,这就要求在资源调度时,根据具体的作业调度不同大小的资源,以实现资源的合理使用,而当前的HPC集群中在调度资源时,都是统一进行资源调度,无法灵活依据作业的紧急程度和作业成本等因素灵活调整。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种资源伸缩方法及装置,以至少解决相关技术中在对资源进行扩容或者缩容的过程中,无法依据任务的特性灵活调整伸缩策略,从而实现灵活伸缩资源的技术问题。
根据本发明实施例的一个方面,提供了一种资源伸缩方法,包括:接收扩容请求;根据所述扩容请求中的任务的任务特征确定对应的弹性策略;根据对应的弹性策略,确定扩容需求资源;根据所述扩容需求资源为所述任务进行扩容。
根据本发明实施例的另一方面,还提供了一种资源伸缩方法,包括:接收输入的配置信息,其中,所述配置信息用于配置请求扩容的任务的任务特征;确定所述配置信息对应的弹性策略;根据所述弹性策略对应的扩容需求资源进行扩容资源,并反馈扩容结果。
根据本发明实施例的另一方面,还提供了一种资源伸缩装置,包括:接收模块,用于接收扩容请求;第一确定模块,用于根据所述扩容请求中的任务的任务特征确定对应的弹性策略;第二确定模块,用于根据对应的弹性策略,确定扩容需求资源;扩容模块,用于根据所述扩容需求资源为所述任务进行扩容。
根据本发明实施例的另一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述资源伸缩方法。
根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述资源伸缩方法。
本发明下述实施例可以基于不同任务的资源需求,依据每个任务的任务特征为任务提供适量的资源,如扩容资源或者缩减资源。本发明中,依据任务特征确定对应的弹性策略,从而利用弹性策略,确定扩容需求资源,进而为任务进行扩容。
本发明实施例中的任务特征包括但不限于:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。并且还可以依据节点组规模等其它可能因素来确定任务的任务特征。
在本发明实施例中可以依据弹性伸缩策略来满足用户不同需求,利用任务的任务特征确定弹性策略,从而确定出节点规格以及节点的数目,根据节点规格以及节点数目,为任务扩容资源。
在本发明实施例中,接收扩容请求,并根据扩容请求中的任务的任务特征确定对应的弹性策略,进而根据对应的弹性策略,确定扩容需求资源,最后可以根据扩容需求为认为进行扩容,从而实现了依据任务的不同任务特性来为不同的任务进行扩容的技术效果,进而解决了相关技术中在对资源进行扩容或者缩容的过程中,无法依据任务的特性灵活调整伸缩策略,从而实现灵活伸缩资源的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了一种用于实现资源伸缩方法的计算机终端(或移动设备)的硬件结构框图;
图2是根据本发明实施例一的资源伸缩方法的流程图;
图3是根据本发明实施例的一种可选的资源伸缩方法的示意图(一);
图4是根据本发明实施例的一种可选的资源伸缩方法的示意图(二);
图5是根据本发明实施例的一种可选的资源伸缩方法的示意图(三);
图6是根据本发明实施例的另一种资源伸缩方法的示意图;
图7是根据本发明实施例的一种资源伸缩装置的示意图;
图8是根据本发明实施例的另一种可选的资源伸缩装置的示意图;
图9是根据本发明实施例的一种处理资源伸缩的系统的示意图;
图10是根据本发明实施例的另一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
云计算:英文名称为Cloud Computing,是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。
高性能计算,High Performance Computing,简称HPC,通常只是计算能力积聚,用并行计算方式解决更大规模的科学、工程等问题。
弹性高性能计算,Elastic-high performance computing,简称E-HPC。
软件即服务,Software as a Service,简称SaaS。
平台即服务,Platform as a Service,简称PaaS。
基础设施即服务,Infrastructure as a Service,简称IaaS。
互联网数据中心,Internet Data Center,简称IDC。
自动伸缩策略,Autoscale policy。
弹性许可证,Elastic License。
本发明下述实施例可以应用于高性能计算产品上,包括但不限于:弹性高性能计算产品,应用领域包括但不限于:科学计算、AI/计算学习,设计/仿真/渲染等领域。用户可以通过提交作业请求,依据作业请求确定是否需要对于该作业请求对应的任务进行资源扩容或者缩减,从而实现资源的灵活伸缩调用。
实施例1
根据本发明实施例,还提供了一种资源伸缩的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现资源伸缩方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104。除此以外,还可以包括:传输模块、显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的资源伸缩方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的资源伸缩方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述传输模块用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输模块包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输模块可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
本发明下述实施例中,提出HPC集群自动伸缩策略来满足HPC用户的不同场景下的需求:提供基于节点组的伸缩策略,用户可以将不同需求的作业提交到不同的节点组上,每个节点组配置不同的伸缩策略,比如配置不同的参数:节点组最大规模,最小规模;扩容缩容的时间间隔配置;扩容的比例配置。根据作业优先级,扩容系统配置的计算资源,比如优先级10的作业会扩容高规格配置的节点,以运行对时间敏感的作业;优先级0的作业会扩容低规格的竞价实例,以运行那些对成本敏感的作业;优先级5的作业会扩容带GPU(图形处理器,GraphicsProcessingUnit)卡的节点,以运行需要GPU加速的作业。并且在本发明实施例中,还可以提供提供对license的调度服务,在扩容资源的时候,加入当前可用license数量为影响因素。
在上述运行环境下,本申请提供了如图2所示的资源伸缩方法。图2是根据本发明实施例一的资源伸缩方法的流程图。如图2所示,该方法包括:
步骤S202,接收扩容请求。
步骤S204,根据扩容请求中的任务的任务特征确定对应的弹性策略。
步骤S206,根据对应的弹性策略,确定扩容需求资源。
步骤S208,根据扩容需求资源为任务进行扩容。
通过上述步骤,可以接收扩容请求,根据扩容请求中的任务的任务特征确定对应的弹性策略;根据对应的弹性策略,确定扩容需求资源,根据扩容需求资源为任务进行扩容。在该实施例中,可以依据任务的特征为任务灵活扩容资源,从而解决相关技术中在对资源进行扩容或者缩容的过程中,无法依据任务的特性灵活调整伸缩策略,从而实现灵活伸缩资源的技术问题。
下面对本发明上述各步骤进行详细说明。
首先,对于步骤S202,接收扩容请求。
可选地,扩容请求中可以携带有扩容任务。该扩容请求可以是资源需求方发送的,将扩容请求发送至资源分配方,从而为任务进行扩容。例如,该资源需求方可以是用户,用户又可以是个人用户,也可以是企业用户,还可以是对于国家而言的公众用户等。
步骤S204,根据扩容请求中的任务的任务特征确定对应的弹性策略。
任务的类型和数量在本申请中不做具体限定,可以是每个用户在有需求时,自行确定。可选的,用户可以通过任务提交框或者任务提交界面来提交任务,系统会自动接收到为任务扩容资源的扩容请求。
在本发明实施例中,扩容请求中的任务的任务特征可以由以下因素决定:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。
可选地,对于运行时间需求因素,指示了用户对扩容的时间要求,例如,不同的任务可能运行的紧急程度不同,有的任务是对时间敏感的,要求在尽可能短的时间内完成,而有的任务是对时间不敏感的,即可以允许在较长的时间内完成。因此,运行时间需求的因素可以决定任务的任务特征。
对于运行成本需求因素,指示了用户对扩容的成本要求,不同的任务可能会控制在不同的成本范围内,例如,有的可以控制在较高的成本内,有的可以控制在较低的成本内。因此,运行成本需求的因素也可以决定任务的任务特征。
对于扩容资源的时间间隔需求因素,指示了用户对扩容的时间间隔要求,不同的用户所请求的扩容任务对应的扩容时间间隔也会是不同的,依据用户的具体业务需求而定,例如,有的用户的业务需要资源的频率大一些,因此,对应的任务的扩容时间间隔就会要求得小一些,而对于有些用户的业务需要资源的频率小一些的时候,则对应的任务的扩容时间间隔就可以要求得长一些。因此,扩容资源的时间间隔需求因素也会决定任务的任务特征。
对于显卡需求因素,指示用户是否对显卡有需求,例如,有的用户是需要处理图片或者视频业务的,则扩容资源是对显卡有需求的,而对于有些用户仅仅是一些文本的业务,则对显卡是没有需求的,因此,可以不要求扩容有显卡功能的资源。因此,显卡需求因素也会决定任务的任务特征。
需要说明的是,上述各个因素可以分开考虑,也可以任意结合考虑。在本发明实施例中,综合考虑到任务的运行时间、运行成本、扩容资源的时间间隔以及显卡来决定扩容请求中的任务的任务特征。
其中,在接收到扩容请求时,会同时得到任务的任务特征,该任务特征包括但不限于:任务优先级、负载需求、需要扩容的节点组、通行证需求。当然,该任务特征还可以包括:任务标识,任务类型等任务属性信息。
在一可选的示例中,任务特征之间根据用户需求组合成不同的特征组合规则从而构成对应的弹性策略。例如,任务优先级和负载需求之间组合规则构成一种或多种弹性策略;或者任务优先级和需要扩容的节点组组合规则构成一种或多种弹性策略;或者任务优先级和通行证需求组合规则构成一种或多种弹性策略等等。
在本发明实施例中,根据扩容请求中的任务的任务特征确定对应的弹性策略包括以下至少之一:根据任务优先级确定扩容资源的扩容比例;根据负载需求确定扩容资源的所需要的核数;根据需要扩容的节点组确定扩容资源的节点规格;根据通行证需求确定扩容资源的可用通行证的数目。即可以通过上述的各个任务特征,分别确定扩容资源的比例、所需核数、节点规格、可用通行证数目。
可选的,扩容比例指示了可以扩容的比例大小。具体扩容比例大小可以根据任务的优先级确定,如50%、80%、100%。其中,扩容比例可以是通过任务优先级来确定的,即对应于优先级高的,可以分配的扩容比例较大,而优先级低的,其分配的扩容比例较低。比如,优先级为10对应的扩容比例为100%,优先级为5对应的扩容比例为80%,优先级为0对应的扩容比例为50%。
另一种可选的,节点规格指示处理任务的节点的能力,节点规格依据节点的核数目和内存大小划分。节点规格包括但不限于:2核4GB内存、1核1GB内存、4核8GB内存等。根据负载需求确定扩容资源的所需要的核数时,负载需求较大时,需要的核数的数量较多,而对于负载需求较小时,需要的核数的数量则较少。比如,对于单个任务而不指定资源需求的情况下,默认需求为1个核。对于多个任务而言的资源需求的情况下,需要的核数可以认为与任务的数量相同。比如,对于5个任务而言,可以认为需要5个核。
在本发明实施例中,扩容资源可以包括但不限于:核数目和内存大小。扩容请求可以指示扩容的核数目和内存大小。
根据需要扩容的节点组确定扩容资源的节点规格时,由于节点规格相同的节点可以归为一个节点组,因此确定节点组就可以确定扩容资源需要的节点规格。其中,对于节点组的规模在本发明中并不做具体限定,可以依据节点数量来自行确定。通过任务特征所要求的节点组就可以确定扩容资源要求的节点规格,即可以利用该节点组来确定出节点规格。在本发明实施例中,根据需要扩容的节点组可以确定出扩容资源的节点规格。
根据通行证需求确定扩容资源的可用通行证的数目。根据任务特征中所要求的通行证这一特征可以确定扩容资源的可用通行证的数目。例如,在任务特征中要求允许使用的核数。其中,任务中要求的核数一般由节点数及节点所属的节点组而定。例如,如果任务需要两个节点,节点在节点规格为4核8GB内存的节点组,因此,任务对应需要的通行证的数目即为8个。
对于上述可用通行证,如果可用通行证的数量小于任务扩容资源的通行证数量,则不满足节点运行条件,此时放弃扩容资源。例如,任务扩容资源的通行证数量为15个,此时可用通行证数量为11个,则不满足节点运行条件,放弃扩容资源。
步骤S206,根据对应的弹性策略,确定扩容需求资源。
根据本发明实施例的弹性策略,其可以确定一个具体的扩容操作所需要的资源。比如,扩容一个2核4GB内存的节点,又比如,扩容两个4核8GB内存的节点。
步骤S208,根据扩容需求资源为任务进行扩容。
即在确定扩容需求资源后,可以通过扩容需求资源来为任务进行扩容的操作。为保证进行扩容的时候,资源是足够满足扩容,可以采用以下处理:在本发明实施例中,根据扩容需求资源为任务进行扩容包括:在扩容需求资源无法被满足的情况下,将任务存储于等待队列中;待扩容需求资源被满足时,根据扩容需求资源为任务进行扩容。
对于上述等待队列,指示扩容任务队列,通过队列排序,以在待扩容需求资源被满足时,根据扩容需求资源为任务进行扩容。
在一种可选的实施例中,在对用户的扩容任务根据对应的伸缩策略进行扩容时,有些用户是通过竞价的方式来确定是否扩容的,即用户给出能够接受扩容的竞价价格,当扩容资源的价格满足竞价价格时,才允许执行扩容操作。因此,在本发明另一实施例中,根据扩容需求资源为任务进行扩容包括:在扩容请求中的任务为竞价任务的情况下,判断扩容需求资源的价格是否满足任务的竞价价格要求;在扩容需求资源的价格不满足任务的竞价价格要求的情况下,执行多次扩容尝试,直到扩容需求资源的价格满足任务的竞价价格要求,根据满足竞价价格要求的扩容需要资源进行扩容。
可选地,竞价任务可以为对价格进行竞争所对应的任务,在扩容需求资源的价格满足任务的竞价价格要求,根据满足竞价价格要求的扩容需要资源进行扩容。通过竞价价格要求的设定,满足了一些用户对扩容资源的花费的控制,提高了用户对扩容多可样性的需求。
另一种可选的实施例,为实现资源的高效利用,本发明实施例的方法还包括:在根据所述扩容需求资源为所述任务进行扩容之后,释放空闲的节点资源。即可以在任务运行完毕,节点扩容成功后,弹性伸缩服务可以释放空闲的节点,从而保证节点的灵活使用。
下面通过一种详细的实施例来说明本发明。下述中以作业作为本申请上述的任务,以此来说明本发明实施例的内容。
图3是根据本发明实施例的一种可选的资源伸缩方法的示意图(一),如图3所示,
31,设置节点组group1扩容的节点规格为2核(2core)4GB内存。
32,设置节点组group2扩容的节点规格为1核1GB内存(1core2GB)的竞价实例,用户还可以支持最高出价(指示Spot)。
33,设置节点组group3扩容的节点规格为4核8GB内存2GPU卡。
34,自动伸缩服务可以通过license服务查询可用license数据(即查询可用通行证数目),或者用户手动设置license总量(假设为基本CPU核的license)。其中,该license指示上述的可用通行证。
35,访问策略设置节点组Group,设置通行证license。
36,设置优先级为10的作业扩容比例为100%。
37,设置优先级为5的作业扩容比例为80%。
38,设置优先级为0的作业扩容比例为50%。
图4是根据本发明实施例的一种可选的资源伸缩方法的示意图(二),如图4所示,包括:
401,用户提交作业job1,优先级为10到节点组group1。
402,查询作业负载。本发明实施例中,可以是HPC集群作业负载(单个作业不指定资源需求的话,默认需求为1个核)。
403,根据伸缩策略扩容1个2核4GB节点到group1。
404,将扩容节点加入集群。
405,发送工作(job1)到公共云服务中。
406,确定工作完成,节点扩容成功。
407,查询作业负载(QueryWorkLoad()),
408,弹性伸缩服务会释放空闲的节点。
409,用户提交作业job2-job6(共5个作业),优先级5,到节点组group1。
410,查询作业负载。可选的,弹性伸缩服务查询到HPC集群作业负载。
411,确定扩容节点。根据伸缩策略,作业需求是5个核,扩容比例是80%,所以最终扩容4个核(两个核4GB节点到group1)。
节点扩容成功,作业运行完毕,弹性伸缩服务会释放空闲的节点(图中隐藏此缩容步骤)。
412,用户提交作业job7-job8(共2个作业),优先级0,到节点组group1。
413,查询作业负载。弹性伸缩服务查询到HPC集群作业负载。
414,确定扩容节点。根据伸缩策略,作业需求是2个核,扩容比例是50%,所以最终扩容1个核(一个1核1GB竞价实例节点到group1),由于是竞价实例,可能会扩容失败,弹性伸缩服务会不断尝试,直到扩容成功。
图5是根据本发明实施例的一种可选的资源伸缩方法的示意图(三),如图5所示,包括:
501,用户提交作业job9,优先级10,MPI作业,要求2个节点,到节点组3(group3)。
502,查询作业负载。弹性伸缩服务查询到HPC集群作业负载。
503,扩容节点。根据伸缩策略,作业需求是2个节点,所以license需求是8,扩容比例是100%,所以最终扩容2个4核8GB内存2GPU卡的节点。
504,用户提交作业job10,优先级10,MPI作业,要求4个节点,到节点组3。
505,查询作业负载。弹性伸缩服务查询到HPC集群作业负载。
506,放弃扩容。根据伸缩策略,作业需求是4个节点,所以license需求是16,扩容比例是100%,由于可用license只有12,不满足节点运行条件,放弃扩容,作业处于queue状态。
507,用户提交作业job11,优先级10,要求1个节点,到节点组3。
508,查询作业负载。弹性伸缩服务查询到HPC集群作业负载。
509,确定扩容节点。根据伸缩策略,作业需求是2个节点,所以license需求是4,扩容比例是100%,所以最终扩容1个4核8GB内存2GPU卡的节点。
510,工作完成。即job9运行完毕。
此时可用license是16,满足作业10的运行要求,另外job9运行完毕,会有2个空闲节点,所以只需要再扩容2个4核8GB内存2GPU卡到节点组3。
通过本发明上述实施例,实现针对不同任务的扩容需求,如对运行时间的不同需求、对成本的不同需求、对显卡的不同需求的任务,进而依据任务的任务特征确定对应的弹性策略,然后得到扩容需求资源,根据扩容需求资源为任务进行扩容。本申请中可以实现资源的扩容和资源的缩放,扩容可以指示增加节点资源,而缩放指示释放节点资源。通过灵活调整资源的分配方式来实现资源的自动伸缩,对资源的分配更加合理,且处理任务的效率也会相应提高。
下面通过另一种可选的方法来说明本发明。
图6是根据本发明实施例的另一种资源伸缩方法的示意图,如图6所示,该方法包括:
步骤S601,接收输入的配置信息,其中,配置信息用于配置请求扩容的任务的任务特征;
步骤S602,确定配置信息对应的弹性策略;
步骤S603,根据弹性策略对应的扩容需求资源进行扩容资源,并反馈扩容结果。
通过上述步骤,接收输入的配置信息,其中,配置信息用于配置请求扩容的任务的任务特征,确定配置信息对应的弹性策略,根据弹性策略对应的扩容需求资源进行扩容资源,并反馈扩容结果。在该实施例中,可以依据输入的配置信息进行扩容资源,实现灵活调整弹性策略,也相应调整了扩容的资源,从而解决相关技术中在对资源进行扩容或者缩容的过程中,无法依据任务的特性灵活调整伸缩策略,从而实现灵活伸缩资源的技术问题。
下面对本发明上述各步骤进行详细说明。
步骤S601,接收输入的配置信息,其中,配置信息用于配置请求扩容的任务的任务特征。
在本发明一可选的示例中,配置信息由以下因素决定:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。
在本发明另一可选的示例中,配置信息包括:任务优先级,负载需求,需要扩容的节点组,通行证需求。
步骤S602,确定配置信息对应的弹性策略。
可选地,确定配置信息对应的弹性策略包括以下至少一种:根据所述任务优先级确定扩容资源的扩容比例;根据所述负载需求确定扩容资源的所需要的核数;根据需要扩容的节点组确定扩容资源的节点规格;根据所述通行证需求确定扩容资源的可用通行证的数目。
步骤S603,根据弹性策略对应的扩容需求资源进行扩容资源,并反馈扩容结果。
即可以依据接收到的配置信息,确定弹性策略,利用该弹性策略进行资源扩容。实现资源缩放,从而实现资源自动伸缩,保证了资源的灵活使用。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的资源伸缩方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述资源伸缩方法的资源伸缩装置,图7是根据本发明实施例的一种资源伸缩装置的示意图,如图7所示,该装置包括:第一接收模块71,第一确定模块73,第二确定模块75,扩容模块77,其中,
第一接收模块71,用于接收扩容请求;
第一确定模块73,用于根据扩容请求中的任务的任务特征确定对应的弹性策略;
第二确定模块75,用于根据对应的弹性策略,确定扩容需求资源;
扩容模块77,用于根据扩容需求资源为任务进行扩容。
通过上述装置,可以通过第一接收模块71,接收为任务进行扩容资源的请求,通过第一确定模块73根据扩容请求中的任务的任务特征确定对应的弹性策略,通过第二确定模块75根据对应的弹性策略,确定扩容需求资源,通过扩容模块77根据扩容需求资源为任务进行扩容。在该实施例中,可以依据任务的任务特征为任务扩容,进行资源的灵活调整,从而解决相关技术中在对资源进行扩容或者缩容的过程中,无法依据任务的特性灵活调整伸缩策略,从而实现灵活伸缩资源的技术问题。
可选地,扩容请求中的任务的任务特征由以下因素决定:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。
另一种可选地,任务特征包括以下至少之一:任务优先级,负载需求,需要扩容的节点组,通行证需求。
在本发明实施例中,任务特征之间根据用户需求组合成不同的特征组合规则构成弹性策略。
作为本发明一可选的示例,第一确定模块73包括:第一确定单元,用于根据任务优先级确定扩容资源的扩容比例;第二确定单元,用于根据负载需求确定扩容资源的所需要的核数;第三确定单元,用于根据需要扩容的节点组确定扩容资源的节点规格;第四确定单元,用于根据通行证需求确定扩容资源的可用通行证的数目。
作为本发明另一可选的示例,扩容模块77包括:存储单元,用于在扩容需求资源无法被满足的情况下,将任务存储于等待队列中;扩容单元,用于待扩容需求资源被满足时,根据扩容需求资源为任务进行扩容。
作为本发明另一可选的示例,扩容模块77包括:判断单元,用于在扩容请求中的任务为竞价任务的情况下,判断扩容需求资源的价格是否满足任务的竞价价格要求;执行单元,用于在扩容需求资源的价格不满足任务的竞价价格要求的情况下,执行多次扩容尝试,直到扩容需求资源的价格满足任务的竞价价格要求,根据满足竞价价格要求的扩容需要资源进行扩容。
作为本发明另一可选的示例,上述装置还包括:释放模块,用于在根据扩容需求资源为任务进行扩容之后,释放空闲的节点资源。
图8是根据本发明实施例的另一种可选的资源伸缩装置的示意图,如图8所示,该装置可以包括:第二接收模块81,第三确定模块82,反馈模块83,其中,
第二接收模块81,用于接收输入的配置信息,其中,配置信息用于配置请求扩容的任务的任务特征;
第三确定模块82,用于确定配置信息对应的弹性策略;
反馈模块83,用于根据弹性策略对应的扩容需求资源进行扩容资源,并反馈扩容结果。
上述装置,通过第二接收模块81接收输入的配置信息,其中,配置信息用于配置请求扩容的任务的任务特征,通过第三确定模块82确定配置信息对应的弹性策略,通过反馈模块83根据弹性策略对应的扩容需求资源进行扩容资源,并反馈扩容结果。在该实施例中,可以根据输入的配置信息来为任务扩容资源,实现灵活调整处理任务的资源,也相应调整了扩充的资源,从而解决相关技术中在对资源进行扩容或者缩容的过程中,无法依据任务的特性灵活调整伸缩策略,从而实现灵活伸缩资源的技术问题。
可选的,配置信息由以下因素决定:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。
在本发明实施例中,配置信息包括:任务优先级,负载需求,需要扩容的节点组,通行证需求,确定模块包括:第一确定单元,用于根据任务优先级确定扩容资源的扩容比例;第二确定单元,用于根据负载需求确定扩容资源的所需要的核数;第三确定单元,用于根据需要扩容的节点组确定扩容资源的节点规格;第四确定单元,用于根据通行证需求确定扩容资源的可用通行证的数目。
此处需要说明的是,上述第一接收模块71,第一确定模块73,第二确定模块75,扩容模块77对应于实施例1中的步骤S202至步骤S208,第二接收模块81,第三确定模块82,反馈模块83对应于实施例1中的步骤S601至步骤S603,模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
实施例3
根据本申请实施例,还提供了一种用于处理资源伸缩方法的系统,图9是根据本发明实施例的一种处理资源伸缩的系统的示意图,如图9所示,该系统可以包括:客户端901和云计算资源903。
其中,客户端901用于发送待处理的至少一个任务至云计算资源,其中,任意一个任务包含一个或多个实例,以及处理任务所包含的实例所需的资源描述信息。
云计算资源903与客户端连接,用于接收扩容请求;根据扩容请求中的任务的任务特征确定对应的弹性策略;根据对应的弹性策略,确定扩容需求资源;根据扩容需求资源为任务进行扩容。
可选地,客户端可以为安装在计算机、平板电脑或者笔记本电脑等设备上的应用程序,用户可以通过登录客户端并在客户端上根据其特定的计算需求生成待处理的作业,其中,一个作业可以包括至少一个任务,每个任务可以包含一个或多个实例,且每个任务中的各个实例调用相同的计算资源,该计算资源可以通过上述的资源描述信息来描述。
可选的,扩容请求中的任务的任务特征由以下因素决定:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。
可选的,任务特征包括以下至少之一:任务优先级,负载需求,需要扩容的节点组,通行证需求。
可选的,任务特征之间根据用户需求组合成不同的特征组合规则构成弹性策略。
在一个可选的实施例中,根据扩容请求中的任务的任务特征确定对应的弹性策略包括以下至少之一:根据任务优先级确定扩容资源的扩容比例;根据负载需求确定扩容资源的所需要的核数;根据需要扩容的节点组确定扩容资源的节点规格;根据通行证需求确定扩容资源的可用通行证的数目。
在一个可选的实施例中,根据扩容需求资源为任务进行扩容包括:在扩容需求资源无法被满足的情况下,将任务存储于等待队列中;待扩容需求资源被满足时,根据扩容需求资源为任务进行扩容。
在一个可选的实施例中,根据扩容需求资源为任务进行扩容包括:在扩容请求中的任务为竞价任务的情况下,判断扩容需求资源的价格是否满足任务的竞价价格要求;在扩容需求资源的价格不满足任务的竞价价格要求的情况下,执行多次扩容尝试,直到扩容需求资源的价格满足任务的竞价价格要求,根据满足竞价价格要求的扩容需要资源进行扩容。
在一个可选的实施例中,在根据扩容需求资源为任务进行扩容之后,还包括:释放空闲的节点资源。
云计算资源903与客户端连接,还用于接收输入的配置信息,其中,配置信息用于配置请求扩容的任务的任务特征;确定配置信息对应的弹性策略;根据弹性策略对应的扩容需求资源进行扩容资源,并反馈扩容结果。
在一个可选的实施例中,配置信息由以下因素决定:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。
在一个可选的实施例中,配置信息包括:任务优先级,负载需求,需要扩容的节点组,通行证需求,确定配置信息对应的弹性策略包括以下至少一种:根据任务优先级确定扩容资源的扩容比例;根据负载需求确定扩容资源的所需要的核数;根据需要扩容的节点组确定扩容资源的节点规格;根据通行证需求确定扩容资源的可用通行证的数目。
本发明的实施例还可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行资源伸缩方法中以下步骤的程序代码:接收扩容请求;根据扩容请求中的任务的任务特征确定对应的弹性策略;根据对应的弹性策略,确定扩容需求资源;根据扩容需求资源为任务进行扩容。
可选地,图10是根据本发明实施例的另一种计算机终端的结构框图。如图10所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器1001、存储器1003、以及传输装置1005。
其中,存储器可用于存储软件程序以及模块,如本发明实施例中的资源伸缩方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的资源伸缩方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:接收扩容请求;根据扩容请求中的任务的任务特征确定对应的弹性策略;根据对应的弹性策略,确定扩容需求资源;根据扩容需求资源为任务进行扩容。
可选的,上述处理器还可以执行如下步骤的程序代码:扩容请求中的任务的任务特征由以下因素决定:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。
可选的,上述处理器还可以执行如下步骤的程序代码:任务特征包括以下至少之一:任务优先级,负载需求,需要扩容的节点组,通行证需求。
可选的,上述处理器还可以执行如下步骤的程序代码:任务特征之间根据用户需求组合成不同的特征组合规则构成弹性策略。
可选的,上述处理器还可以执行如下步骤的程序代码:根据任务优先级确定扩容资源的扩容比例;根据负载需求确定扩容资源的所需要的核数;根据需要扩容的节点组确定扩容资源的节点规格;根据通行证需求确定扩容资源的可用通行证的数目。
可选的,上述处理器还可以执行如下步骤的程序代码:在扩容需求资源无法被满足的情况下,将任务存储于等待队列中;待扩容需求资源被满足时,根据扩容需求资源为任务进行扩容。
可选的,上述处理器还可以执行如下步骤的程序代码:在扩容请求中的任务为竞价任务的情况下,判断扩容需求资源的价格是否满足任务的竞价价格要求;在扩容需求资源的价格不满足任务的竞价价格要求的情况下,执行多次扩容尝试,直到扩容需求资源的价格满足任务的竞价价格要求,根据满足竞价价格要求的扩容需要资源进行扩容。
在一个可选的实施例中,在根据扩容需求资源为任务进行扩容之后,还包括:释放空闲的节点资源。
处理器还可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:接收输入的配置信息,其中,配置信息用于配置请求扩容的任务的任务特征;确定所述配置信息对应的弹性策略;根据弹性策略对应的扩容需求资源进行扩容资源,并反馈扩容结果
在一个可选的实施例中,配置信息由以下因素决定:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。
在一个可选的实施例中,配置信息包括:任务优先级,负载需求,需要扩容的节点组,通行证需求,确定配置信息对应的弹性策略包括以下至少一种:根据任务优先级确定扩容资源的扩容比例;根据负载需求确定扩容资源的所需要的核数;根据需要扩容的节点组确定扩容资源的节点规格;根据通行证需求确定扩容资源的可用通行证的数目。
采用本发明实施例,先接收扩容请求,根据扩容请求中的任务的任务特征确定对应的弹性策略,根据对应的弹性策略,确定扩容需求资源,根据扩容需求资源为任务进行扩容,从而实现了依据任务的特征为任务进行灵活扩容资源的技术效果,进而解决了相关技术中在对资源进行扩容或者缩容的过程中,无法依据任务的特性灵活调整伸缩策略,从而实现灵活伸缩资源的技术问题。
本领域普通技术人员可以理解,图10所示的结构仅为示意,计算机终端A也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图10其并不对上述电子装置的结构造成限定。例如,计算机终端A还可包括比图10中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图10所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例4
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的资源伸缩方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:接收扩容请求;根据扩容请求中的任务的任务特征确定对应的弹性策略;根据对应的弹性策略,确定扩容需求资源;根据扩容需求资源为任务进行扩容。
可选的,扩容请求中的任务的任务特征由以下因素决定:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。
可选的,任务特征包括以下至少之一:任务优先级,负载需求,需要扩容的节点组,通行证需求。
可选的,任务特征之间根据用户需求组合成不同的特征组合规则构成弹性策略。
可选地,上述存储介质还可以被设置为存储用于执行以下步骤的程序代码:根据任务优先级确定扩容资源的扩容比例;根据负载需求确定扩容资源的所需要的核数;根据需要扩容的节点组确定扩容资源的节点规格;根据通行证需求确定扩容资源的可用通行证的数目。
可选地,上述存储介质还可以被设置为存储用于执行以下步骤的程序代码:在扩容需求资源无法被满足的情况下,将任务存储于等待队列中;待扩容需求资源被满足时,根据扩容需求资源为任务进行扩容。
可选地,上述存储介质还可以被设置为存储用于执行以下步骤的程序代码:在扩容请求中的任务为竞价任务的情况下,判断扩容需求资源的价格是否满足任务的竞价价格要求;在扩容需求资源的价格不满足任务的竞价价格要求的情况下,执行多次扩容尝试,直到扩容需求资源的价格满足任务的竞价价格要求,根据满足竞价价格要求的扩容需要资源进行扩容。
可选地,上述存储介质还可以被设置为存储用于执行以下步骤的程序代码:在根据扩容需求资源为任务进行扩容之后,释放空闲的节点资源。
可选地,上述存储介质还可以被设置为存储用于执行以下步骤的程序代码:接收输入的配置信息,其中,配置信息用于配置请求扩容的任务的任务特征;确定配置信息对应的弹性策略;根据弹性策略对应的扩容需求资源进行扩容资源,并反馈扩容结果。
可选地,上述存储介质还可以被设置为存储用于执行以下步骤的程序代码:配置信息由以下因素决定:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。
可选地,上述存储介质还可以被设置为存储用于执行以下步骤的程序代码:配置信息包括:任务优先级,负载需求,需要扩容的节点组,通行证需求,确定配置信息对应的弹性策略包括以下至少一种:根据任务优先级确定扩容资源的扩容比例;根据负载需求确定扩容资源的所需要的核数;根据需要扩容的节点组确定扩容资源的节点规格;根据通行证需求确定扩容资源的可用通行证的数目。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (14)

1.一种资源伸缩方法,其特征在于,包括:
接收扩容请求;
根据所述扩容请求中的任务的任务特征确定对应的弹性策略;
根据对应的弹性策略,确定扩容需求资源;
根据所述扩容需求资源为所述任务进行扩容。
2.根据权利要求1所述的方法,其特征在于,所述扩容请求中的任务的任务特征由以下因素决定:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。
3.根据权利要求2所述的方法,其特征在于,所述任务特征包括以下至少之一:任务优先级,负载需求,需要扩容的节点组,通行证需求。
4.根据权利要求1所述的方法,其特征在于,所述任务特征之间根据用户需求组合成不同的特征组合规则构成弹性策略。
5.根据权利要求3所述的方法,其特征在于,根据所述扩容请求中的任务的任务特征确定对应的弹性策略包括至少以下之一:
根据所述任务优先级确定扩容资源的扩容比例;
根据所述负载需求确定扩容资源的所需要的核数;
根据需要扩容的节点组确定扩容资源的节点规格;
根据所述通行证需求确定扩容资源的可用通行证的数目。
6.根据权利要求1所述的方法,其特征在于,根据所述扩容需求资源为所述任务进行扩容包括:
在所述扩容需求资源无法被满足的情况下,将所述任务存储于等待队列中;
待所述扩容需求资源被满足时,根据所述扩容需求资源为所述任务进行扩容。
7.根据权利要求1所述的方法,其特征在于,根据所述扩容需求资源为所述任务进行扩容包括:
在所述扩容请求中的任务为竞价任务的情况下,判断所述扩容需求资源的价格是否满足所述任务的竞价价格要求;
在所述扩容需求资源的价格不满足所述任务的竞价价格要求的情况下,执行多次扩容尝试,直到扩容需求资源的价格满足所述任务的竞价价格要求,根据满足竞价价格要求的扩容需要资源进行扩容。
8.根据权利要求1至7中任一项所述的方法,其特征在于,在根据所述扩容需求资源为所述任务进行扩容之后,还包括:
释放空闲的节点资源。
9.一种资源伸缩方法,其特征在于,包括:
接收输入的配置信息,其中,所述配置信息用于配置请求扩容的任务的任务特征;
确定所述配置信息对应的弹性策略;
根据所述弹性策略对应的扩容需求资源进行扩容资源,并反馈扩容结果。
10.根据权利要求9所述的方法,其特征在于,所述配置信息由以下因素决定:运行时间需求因素,运行成本需求因素,扩容资源的时间间隔需求因素,显卡需求因素。
11.根据权利要求9所述的方法,其特征在于,所述配置信息包括:任务优先级,负载需求,需要扩容的节点组,通行证需求,确定所述配置信息对应的弹性策略包括以下至少一种:
根据所述任务优先级确定扩容资源的扩容比例;
根据所述负载需求确定扩容资源的所需要的核数;
根据需要扩容的节点组确定扩容资源的节点规格;
根据所述通行证需求确定扩容资源的可用通行证的数目。
12.一种资源伸缩装置,其特征在于,包括:
接收模块,用于接收扩容请求;
第一确定模块,用于根据所述扩容请求中的任务的任务特征确定对应的弹性策略;
第二确定模块,用于根据对应的弹性策略,确定扩容需求资源;
扩容模块,用于根据所述扩容需求资源为所述任务进行扩容。
13.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至11中任意一项所述的资源伸缩方法。
14.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至11中任意一项所述的资源伸缩方法。
CN201811141554.8A 2018-09-28 2018-09-28 资源伸缩方法及装置 Pending CN110968414A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811141554.8A CN110968414A (zh) 2018-09-28 2018-09-28 资源伸缩方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811141554.8A CN110968414A (zh) 2018-09-28 2018-09-28 资源伸缩方法及装置

Publications (1)

Publication Number Publication Date
CN110968414A true CN110968414A (zh) 2020-04-07

Family

ID=70027758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811141554.8A Pending CN110968414A (zh) 2018-09-28 2018-09-28 资源伸缩方法及装置

Country Status (1)

Country Link
CN (1) CN110968414A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112698947A (zh) * 2020-12-31 2021-04-23 山东省计算中心(国家超级计算济南中心) 一种基于异构应用平台的gpu资源弹性调度方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130013328A1 (en) * 2010-11-12 2013-01-10 John Jospeh Donovan Systems, methods, and devices for an architecture to support secure massively scalable applications hosted in the cloud and supported and user interfaces
CN103257683A (zh) * 2013-05-07 2013-08-21 华为技术有限公司 一种云计算业务伸缩的方法和装置
CN105786985A (zh) * 2016-02-15 2016-07-20 浪潮(北京)电子信息产业有限公司 一种文件系统自动扩容方法及装置
CN106603631A (zh) * 2016-11-17 2017-04-26 北京奇艺世纪科技有限公司 分布式消息系统及扩容方法
CN108462656A (zh) * 2016-12-09 2018-08-28 中国移动通信有限公司研究院 基于容器的业务融合部署的资源调度方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130013328A1 (en) * 2010-11-12 2013-01-10 John Jospeh Donovan Systems, methods, and devices for an architecture to support secure massively scalable applications hosted in the cloud and supported and user interfaces
CN103257683A (zh) * 2013-05-07 2013-08-21 华为技术有限公司 一种云计算业务伸缩的方法和装置
CN105786985A (zh) * 2016-02-15 2016-07-20 浪潮(北京)电子信息产业有限公司 一种文件系统自动扩容方法及装置
CN106603631A (zh) * 2016-11-17 2017-04-26 北京奇艺世纪科技有限公司 分布式消息系统及扩容方法
CN108462656A (zh) * 2016-12-09 2018-08-28 中国移动通信有限公司研究院 基于容器的业务融合部署的资源调度方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
祝明发;邱世达;陶袁;秦广军;刘瑞;: "基于效益分析的云平台资源弹性伸缩方法", 吉林师范大学学报(自然科学版) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112698947A (zh) * 2020-12-31 2021-04-23 山东省计算中心(国家超级计算济南中心) 一种基于异构应用平台的gpu资源弹性调度方法
CN112698947B (zh) * 2020-12-31 2022-03-29 山东省计算中心(国家超级计算济南中心) 一种基于异构应用平台的gpu资源弹性调度方法

Similar Documents

Publication Publication Date Title
US11416307B2 (en) System and method for processing task resources
US20190228303A1 (en) Method and apparatus for scheduling resource for deep learning framework
CN107688492B (zh) 资源的控制方法、装置和集群资源管理系统
US9635103B2 (en) Dynamic virtual resource request rate control for utilizing physical resources
CN109408205B (zh) 基于hadoop集群的任务调度方法和装置
CN109361638B (zh) 智能设备控制权限共享的方法、系统及存储介质
CN107688495B (zh) 调度处理器的方法及设备
RU2697700C2 (ru) Равноправное разделение системных ресурсов в исполнении рабочего процесса
US9098378B2 (en) Computing reusable image components to minimize network bandwidth usage
CN113419846B (zh) 资源配置方法和装置、电子设备及计算机可读存储介质
CN104750690A (zh) 一种查询处理方法、装置及系统
WO2022179486A1 (zh) 多核处理器任务调度方法、装置及设备、存储介质
CN110806928A (zh) 一种作业提交方法及系统
CN112540841A (zh) 任务调度的方法、装置、处理器与电子设备
CN106302640A (zh) 数据请求处理方法及装置
CN112395075A (zh) 资源的处理方法、装置以及资源调度系统
CN115543615A (zh) 一种资源分配方法、装置、电子设备及存储介质
CN111427551A (zh) 编程平台的用户代码运行方法及平台、设备、存储介质
CN112749002A (zh) 一种集群资源动态管理的方法和装置
CN111901490A (zh) 资源共享方法、装置、计算机装置及存储介质
CN111491015A (zh) 预热任务处理方法及系统、代理服务器、服务中心
CN104202305A (zh) 一种转码处理方法、装置及服务器
CN114629960A (zh) 资源调度方法、装置、系统、设备、介质和程序产品
CN110968414A (zh) 资源伸缩方法及装置
CN111858035A (zh) 一种fpga设备分配方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40026968

Country of ref document: HK

RJ01 Rejection of invention patent application after publication

Application publication date: 20200407

RJ01 Rejection of invention patent application after publication