CN114637603A - 资源的控制方法、装置、计算机设备及存储介质 - Google Patents

资源的控制方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114637603A
CN114637603A CN202210234379.7A CN202210234379A CN114637603A CN 114637603 A CN114637603 A CN 114637603A CN 202210234379 A CN202210234379 A CN 202210234379A CN 114637603 A CN114637603 A CN 114637603A
Authority
CN
China
Prior art keywords
computing
resource
node
type
updating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210234379.7A
Other languages
English (en)
Inventor
任振锋
赵威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingdong Technology Information Technology Co Ltd
Original Assignee
Jingdong Technology Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingdong Technology Information Technology Co Ltd filed Critical Jingdong Technology Information Technology Co Ltd
Priority to CN202210234379.7A priority Critical patent/CN114637603A/zh
Publication of CN114637603A publication Critical patent/CN114637603A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44505Configuring for program initiating, e.g. using registry, configuration files
    • G06F9/4451User profiles; Roaming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources

Abstract

本公开提出一种资源的控制方法、装置、计算机设备及存储介质,涉及计算机技术领域。具体方案为:获取任一类型的计算资源的总算力及当前的剩余算力;在所述剩余算力与所述总算力满足预设条件的情况下,确定资源更新模式及资源更新量;根据所述资源更新模式,获取每个节点的状态信息;根据所述每个节点的状态信息及所述资源更新量,对所述任一类型的计算资源进行更新。由此,可以根据每个类型的计算资源的剩余算力与总算力之前的关系以及每个节点的状态信息,对计算资源进行实时、自动更新,提高了计算资源更新的准确性和实时性,从而为改善网络服务提供了条件。

Description

资源的控制方法、装置、计算机设备及存储介质
技术领域
本公开涉及计算机技术领域,尤其涉及一种资源的控制方法、装置、计算机设备及存储介质。
背景技术
互联网后端服务通常会对服务器物理资源,比如CPU、内存、带宽等的使用率进行监控,进而在面对突发网络流量使得资源占用比例达到阈值时,触发监控报警。传统的解决方案一般是在监控报警后,由运维人员进行资源扩容调配等工作,以改善服务器资源的配置。然而上述的资源扩容方式具有一定的不确定性和滞后性。因而,如何及时、高效地对服务器资源进行控制,是当前亟需解决的问题。
发明内容
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
根据本申请的第一方面,提供了一种资源的控制方法,包括:
获取任一类型的计算资源的总算力及当前的剩余算力;
在所述剩余算力与所述总算力满足预设条件的情况下,确定资源更新模式及资源更新量;
根据所述资源更新模式,获取每个节点的状态信息;
根据所述每个节点的状态信息及所述资源更新量,对所述任一类型的计算资源进行更新。
根据本申请的第二方面,提供了一种资源的控制装置,包括:
第一获取模块,用于获取任一类型的计算资源的总算力及当前的剩余算力;
确定模块,用于在所述剩余算力与所述总算力满足预设条件的情况下,确定资源更新模式及资源更新量;
第二获取模块,用于根据所述资源更新模式,获取每个节点的状态信息;
更新模块,用于根据所述每个节点的状态信息及所述资源更新量,对所述任一类型的计算资源进行更新。
本公开第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本公开第一方面实施例提出的数据处理方法。
本公开第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开第一方面实施例提出的数据处理方法。
本公开第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行如本公开第一方面实施例提出的数据处理方法。
本公开实施例中,首先获取任一类型的计算资源的总算力及当前的剩余算力,然后在剩余算力与总算力满足预设条件的情况下,确定资源更新模式及资源更新量,之后根据资源更新模式,获取每个节点的状态信息,最后根据每个节点的状态信息及资源更新量,对任一类型的计算资源进行更新。由此,可以根据每个类型的计算资源的剩余算力与总算力之前的关系以及每个节点的状态信息,对计算资源进行实时、自动更新,提高了计算资源更新的准确性和实时性,从而为改善网络服务提供了条件。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本公开一实施例提出的资源的控制方法的流程示意图;
图2是本公开又一实施例提出的资源的控制方法的流程示意图;
图3是本公开再一实施例提出的资源的控制方法的流程示意图;
图4是本公开一实施例提出的资源的控制装置的结构框图;
图5示出了适于用于实现本公开实施方式的示例性计算机设备的框图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开,而不能理解为对本公开的限制。相反,本公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本公开一实施例提出的资源的控制方法的流程示意图。
其中,可以说明的是,本实施例的资源的控制方法的执行主体为资源的控制装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在计算机设备中,计算机设备可以包括但不限于终端、服务器端等,下面本公开将以服务器作为执行主体来对本实施例的资源的控制方法进行说明。
如图1所示,该资源的控制方法,包括:
步骤S101,获取任一类型的计算资源的总算力及当前的剩余算力。
本公开中,将计算资源根据其可处理任务的类型,分为不同的类型。比如,用于进行视频解码的计算资源,或者用于进行文本识别的计算资源,或者用于进行图像识别的计算资源等等。另外,任一类型的计算资源中,又可以包括任一类型对应的中央处理器资源、内存资源、硬盘资源、网络资源等等,在此不进行限定。
可选的,服务器可以首先根据计算节点集中每个计算节点的类型及算力,确定任一类型计算资源的总算力,之后根据该任一类型计算资源中每个计算节点上报的剩余算力,确定任一类型计算资源的剩余算力。
其中,计算节点集可以为包含各个计算节点的计算集群。
可选的,计算节点可以按照固定的频率,比如10秒一次、11秒一次等等,向服务器上报自身的剩余算力,本公开中服务器可以根据当前计算资源中每个计算节点上报的剩余算力,确定当前计算资源的剩余算力,在此不做限定。
其中,每个计算节点的算力可以用该计算节点的容量表征,或者用该计算节点可以运行的任务数量表征。其中,计算节点的类型可以为该计算节点的型号。
举例来说,若类型为A的任一计算节点的算力为5,也即可以同时并行处理的任务数量为5,而该计算节点的剩余算力为2,也即该计算节点当前正在并行处理3个任务。若当前的计算节点集中,还包括两个类型为A的计算节点,且一个计算节点的剩余算力为1,另一个计算节点的剩余算力为3,且该两个计算节点的总算力均为5,则可以类型A的计算节点的总算力为15,当前,的剩余算力为6。需要说明的是,此处举例仅为一种示意性说明,而不作为对本公开的限定。
可选的,服务器还可以根据该任一类型计算资源中每个计算节点当前对应的计算任务,确定该任一类型计算资源当前的剩余算力。
其中,每个计算节点当前对应的计算任务,可以是由计算节点主动上报的,或者,也可以是由任务分配服务器同步至该服务器的等等,本公开对此不做限定。
步骤S102,在剩余算力与总算力满足预设条件的情况下,确定资源更新模式及资源更新量。
其中,预设条件,为预设的对计算资源进行扩容或者缩减的条件。资源更新模式可以为缩减资源或者扩充资源,针对相应的资源更新模式,资源更新量可以为需要注销(缩减)的资源量,或者需要扩充的资源量。本公开中,服务器可以根据需要注销(缩减)或者扩充的资源量,确定对应的计算节点的数量。
可选的,服务器可以在剩余算力与总算力间的比值小于第一阈值的情况下,确定资源更新模式为扩容模式,之后根据剩余算力与总算力间的差值及任一类型计算资源对应的计算任务的类型,确定资源更新量。
其中,资源更新量可以为需要缩减或者扩充的计算节点的数量,在此不进行限定。
举例来说,若当前计算任务的类型为图像处理计算,剩余算力为9,总算力为100,也即说明当前剩余算力和总算力的比值为9%,小于第一阈值10%,则说明当前正在使用的算力已经达到了可用阈值,因而需要对该计算资源进行扩容,以保证当前计算资源中计算任务的安全执行。
需要说明的是,对于不同类型的计算任务,其需要用到的计算资源的资源量也可能是不同的,因而,本公开可以结合当前剩余算力与总算力的差值以及计算任务的类型,确定当前的资源更新量。
举例来说,若当前剩余算力为9,总算力为100,剩余算力与总算力的差值为91,而计算任务的类型为图像处理计算,需要的算力为95,因而可以确定当前需要扩充的算力为4(95-91),因而可以确定资源更新量为一个容量至少为4的计算节点。
或者,还可以在剩余算力与总算力间的比值大于第二阈值的情况下,确定资源更新模式为缩容模式,之后根据剩余算力与总算力间的差值及任一类型计算资源对应的计算任务的类型,确定资源更新量,其中,第二阈值大于第一阈值。
举例来说,若当前剩余算力为60,总算力为100,计算任务的类型为图像处理计算,一个计算节点的容量为6,则可以确定当前剩余算力和总算力的比值为60%,大于第二阈值40%,则说明当前计算资源冗余,具有一定量的剩余计算资源,因而可以对该计算资源进行缩容,从而之后可以对剩余计算资源进行有效合理的安排,在此不进行限定。由于剩余算力和总算力之间的差值为40,当前任务类型需要的算力为40,则说明冗余的算力为60,而一个计算节点的容量为6,因而可以确定资源更新量至多为10个计算节点,在此不进行限定。
步骤S103,根据资源更新模式,获取每个节点的状态信息。
其中,节点的状态信息,包括节点的运行状态,即节点是否处于空闲状态。本公开中,节点处于空闲状态,是指节点未位于计算节点集中。
可选的,节点的状态信息,还可以包括节点的配置信息,比如节点的容量信息以及配置文件的配置状态,也即是否已配置文件,以及在已配置文件时配置文件的类型信息,在此不进行限定。需要说明的是,若当前节点没有配置文件,则说明该有节点可能一直没有加入到计算任务中,或者,该节点在加入到过计算任务之后,删除过配置文件,在此不做限定。
若当前节点有配置文件,则说明在该节点正在进行计算任务,或者,在执行计算任务后,一直未曾删除已安装的配置文件,在此不做限定。
在确定了资源更新模式之后,服务器可以根据当前的资源更新模式,确定对应的节点的状态信息。比如,若当前的资源更新模式为扩容模式,即需要增加新的计算节点,则服务器可以获取空闲节点的状态信息,若当前的资源更新模式为缩容模式,服务器则可以获取当前类型的计算资源对应的各个计算节点的状态信息。
步骤S104,根据每个节点的状态信息及资源更新量,对任一类型的计算资源进行更新。
需要说明的是,在当前的资源更新模式为扩容模式的情况下,可以根据空闲节点的状态信息以及当前计算资源对应的资源更新量,确定可用的空闲节点,并利用该空闲节点对该类型的计算资源进行扩容更新。或者,可以在资源更新模式为缩容模式的情况下,获取任一类型计算资源对应的计算节点的状态信息,以及当前计算资源对应的资源更新量,对该计算资源进行缩容更新,在此不进行限定。
本公开实施例中,首先获取任一类型的计算资源的总算力及当前的剩余算力,然后在剩余算力与总算力满足预设条件的情况下,确定资源更新模式及资源更新量,之后根据资源更新模式,获取每个节点的状态信息,最后根据每个节点的状态信息及资源更新量,对任一类型的计算资源进行更新。由此,可以根据每个类型的计算资源的剩余算力与总算力之前的关系以及每个节点的状态信息,对计算资源进行实时、自动更新,提高了计算资源更新的准确性和实时性,从而为改善网络服务提供了条件。
图2是本公开又一实施例提出的资源的控制方法的流程示意图。
如图2所示,该资源的控制方法,包括:
步骤S201,获取任一类型的计算资源的总算力及当前的剩余算力。
步骤S202,在剩余算力与总算力满足预设条件的情况下,确定资源更新模式及资源更新量。
需要说明的是,步骤S201、S202的具体实现方式可以参照上述实施例,在此不进行赘述。
步骤S203,在资源更新模式为扩容模式的情况下,获取每个空闲节点的状态信息。
其中,空闲节点的状态信息可以包含空闲节点的容量信息以及配置文件的配置状态,比如是否已配置文件,以及在已配置文件时配置文件的类型信息,在此不进行限定。
具体的,在确定了资源更新模式为扩容模式时,服务器则可以获取每个空闲节点的状态信息,从而之后可以针对性的根据每个空闲节点的状态信息对计算资源进行扩容。
步骤S204,根据每个空闲节点的状态信息及资源更新量,确定目标空闲节点。
需要说明的是,对于各个空闲节点,有的空闲节点可能是未曾被配置为计算节点以执行计算任务,有的空闲节点可能曾经被配置为计算节点,因而保留了对应的配置文件。
其中,目标空闲节点可以为满足配置条件的空闲节点,也即待部署的空闲节点。其中,资源更新量可以为待扩充的计算节点的数量,或者,也可以为当前待扩充的容量(算力)。
举例来说,若当前的资源更新量为50算力,而当前各个空闲节点的状态信息均为未加入配置文件,且每个空闲节点的容量均为10,因而可以从当前各个空闲节点中选择5个作为目标空闲节点,在此不进行限定。
步骤S205,根据任一类型的计算资源对应的计算任务,确定目标配置文件。
其中,目标配置文件可以包含与当前类型计算资源对应的计算任务所需的程序安装包等等,在此不进行限定。
具体的,服务器可以根据当前类型的计算资源对应的计算任务,确定对应版本的程序资源,进而将其确定为目标配置文件,从而利用目标配置文件对目标空闲节点进行配置,以使其成为可执行当前计算任务的计算节点。
步骤S206,将目标配置文件发送给目标空闲节点,以使目标空闲节点根据目标配置文件进行配置。
在确定了目标配置文件之后,服务器可以将目标配置文件发送给目标空闲节点,从而可以使得目标空闲节点根据目标配置文件中的相应版本的内容进行配置。
可理解的是,通过使目标空闲节点根据目标配置文件进行配置后,可以将配置后的目标空闲节点信息添加至服务器侧,从而服务器即可利用该新添加的计算节点,处理相应业务。
步骤S207,基于目标空闲节点对应的计算资源,对任一类型的计算资源进行更新。
需要说明的是,在将目标空闲节点根据目标配置文件进行配置后,可以将配置好的目标空闲节点补充至其对应的计算资源中,从而实现对该计算资源的更新,也即扩容。由此,实现了在系统繁忙的时候自动扩充计算资源的功能,有效地实现对计算资源的扩容更新,提高扩容的准确性和实时性。
可选的,若在进行扩容时,任一空闲节点中保留了配置文件、且该配置文件与当前待扩充的资源对应的配置文件相同,则可以直接将该任一空闲节点,确定的为目标空闲节点,以用来对计算资源进行更新。
本公开实施例中,首先获取任一类型的计算资源的总算力及当前的剩余算力,在剩余算力与总算力满足预设条件的情况下,确定资源更新模式及资源更新量并在资源更新模式为扩容模式的情况下,获取每个空闲节点的状态信息,之后在资源更新模式为扩容模式的情况下,根据每个空闲节点的状态信息及资源更新量,确定目标空闲节点,然后根据任一类型的计算资源对应的计算任务,确定目标配置文件,之后将目标配置文件发送给目标空闲节点,以使目标空闲节点根据目标配置文件进行配置,最后基于目标空闲节点对应的计算资源,对任一类型的计算资源进行更新。由此,在资源更新模式为扩容模式之后,根据目标配置文件对目标空闲节点进行配置,有效地实现对计算资源进行扩容更新,提高扩容的准确性和实时性。
图3是本公开再一实施例提出的资源的控制方法的流程示意图。
如图3所示,该资源的控制方法,包括:
步骤S301,获取任一类型的计算资源的总算力及当前的剩余算力。
步骤S302,在剩余算力与总算力满足预设条件的情况下,确定资源更新模式及资源更新量。
需要说明的是,步骤S301、S302的具体实现方式可以参照上述实施例,在此不进行赘述。
步骤S303,在资源更新模式为缩容模式的情况下,获取任一类型计算资源对应的计算节点的状态信息。
其中,计算节点的状态,可以包括当前计算节点已经利用的资源量以及正在处理的任务的已运行时长等等,在此不进行限定。
在确定当前资源更新模式为缩容模式之后,即可以获取该计算资源对应的计算节点的状态信息,从而之后可以根据状态信息确定是否将该计算节点确定为目标计算节点。
步骤S304,在资源更新量为缩容的资源量的情况下,根据任一类型计算资源对应的计算节点的状态信息及资源更新量,确定目标计算节点。
其中,目标计算节点可以为当前需要进行缩容处理的节点。可以理解的是,若该任一类型计算资源的状态信息利用的资源量较少,或者,已正在处理的任务的已运行时长比较长,则可以将该计算节点确定为目标计算节点。另外,服务器可以根据当前的资源更新量以及计算节点的容量,确定目标计算节点的个数,在此不进行限定。
步骤S305,将目标计算节点的状态更新为非可用状态。
需要说明的是,通过将目标计算节点的状态更新为非可用状态,也即可以注销当前目标计算节点的计算任务,从而可以避免目标计算节点持续执行当前计算任务。
步骤S306,向目标计算节点发送退出指令,以使目标计算节点在完成计算任务后进入空闲状态。
需要说明的是,服务器通过向目标计算节点发送退出指令,可以使得目标计算节点可以在结束当前的计算任务之后,处于空闲状态。从而服务器可以之后对空闲状态的节点进行调度和配置,以使该节点可以进行其他类型的计算任务。
本公开实施例中,首先获取任一类型的计算资源的总算力及当前的剩余算力,然后在剩余算力与总算力满足预设条件的情况下,确定资源更新模式及资源更新量,之后在资源更新模式为缩容模式的情况下,获取任一类型计算资源对应的计算节点的状态信息,在所述资源更新量为缩容的资源量的情况下,根据任一类型计算资源对应的计算节点的状态信息及所述资源更新量,确定目标计算节点,然后将所述目标计算节点的状态更新为非可用状态,最后向所述目标计算节点发送退出指令,以使所述目标计算节点在完成计算任务后进入空闲状态。由此,在资源更新模式为缩容模式之后,根据目标配置文件对目标空闲节点进行配置,使得目标计算节点在完成计算任务后进入空闲状态,有效地实现对计算资源进行缩容,提高缩容的准确性和实时性。
图4是本公开一实施例提出的资源的控制装置的结构示意图。
如图4所示,该资源的控制装置400,包括第一获取模块410、确定模块420、第二获取模块430、更新模块440:
第一获取模块,用于获取任一类型的计算资源的总算力及当前的剩余算力;
确定模块,用于在所述剩余算力与所述总算力满足预设条件的情况下,确定资源更新模式及资源更新量;
第二获取模块,用于根据所述资源更新模式,获取每个节点的状态信息;
更新模块,用于根据所述每个节点的状态信息及所述资源更新量,对所述任一类型的计算资源进行更新。
可选的,所述第一获取模块,具体用于:
根据计算节点集中每个计算节点的类型及算力,确定所述任一类型计算节点的总算力;
根据所述任一类型计算节点中每个计算节点上报的剩余算力,确定所述任一类型计算节点的剩余算力。
可选的,所述确定模块,具体用于:
在所述剩余算力与总算力间的比值小于第一阈值的情况下,确定资源更新模式为扩容模式;
根据所述剩余算力与所述总算力间的差值及所述任一类型计算资源对应的计算任务的类型,确定所述资源更新量。
可选的,所述确定模块,具体用于:
在所述剩余算力与总算力间的比值大于第二阈值的情况下,确定资源更新模式为缩容模式;
根据所述剩余算力与所述总算力间的差值及所述任一类型计算资源对应的计算任务的类型,确定所述资源更新量,其中,所述第二阈值大于第一阈值。
可选的,所述第二获取模块,具体用于:
在所述资源更新模式为扩容模式的情况下,获取每个空闲节点的状态信息;
在所述资源更新模式为扩容模式的情况下,获取所述任一类型计算资源对应的计算节点的状态信息。
可选的,所述更新模块,具体用于:
在所述资源更新模式为扩容模式的情况下,根据每个空闲节点的状态信息及所述资源更新量,确定目标空闲节点;
根据所述任一类型的计算资源对应的计算任务,确定目标配置文件;
将所述目标配置文件发送给所述目标空闲节点,以使所述目标空闲节点根据所述目标配置文件进行配置;
基于所述目标空闲节点对应的计算资源,对所述任一类型的计算资源进行更新。
可选的,所述更新模块,具体用于:
在所述资源更新量为缩容的资源量的情况下,根据任一类型计算资源对应的计算节点的状态信息及所述资源更新量,确定目标计算节点;
将所述目标计算节点的状态更新为非可用状态;
向所述目标计算节点发送退出指令,以使所述目标计算节点在完成计算任务后进入空闲状态。
本公开实施例中,首先获取任一类型的计算资源的总算力及当前的剩余算力,然后在剩余算力与总算力满足预设条件的情况下,确定资源更新模式及资源更新量,之后根据资源更新模式,获取每个节点的状态信息,最后根据每个节点的状态信息及资源更新量,对任一类型的计算资源进行更新。由此,可以根据每个类型的计算资源的剩余算力与总算力之前的关系以及每个节点的状态信息,对计算资源进行实时、自动更新,提高了计算资源更新的准确性和实时性,从而为改善网络服务提供了条件。
为了实现上述实施例,本公开还提出一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现如本公开前述实施例提出的资源的控制方法。
为了实现上述实施例,本公开还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开前述实施例提出的资源的控制方法。
为了实现上述实施例,本公开还提出一种计算机程序产品,当计算机程序产品中的指令处理器执行时,执行如本公开前述实施例提出的资源的控制方法。
图5示出了适于用于实现本公开实施方式的示例性计算机设备的框图。图5显示的计算机设备12仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其他可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。
尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其他程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其他计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其他模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及资源的控制,例如实现前述实施例中提及的资源的控制方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
可以说明的是,在本公开的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本公开的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施例所属技术领域的技术人员所理解。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (16)

1.一种资源的控制方法,其特征在于,包括:
获取任一类型的计算资源的总算力及当前的剩余算力;
在所述剩余算力与所述总算力满足预设条件的情况下,确定资源更新模式及资源更新量;
根据所述资源更新模式,获取每个节点的状态信息;
根据所述每个节点的状态信息及所述资源更新量,对所述任一类型的计算资源进行更新。
2.根据权利要求1所述的方法,其特征在于,所述获取任一类型计算资源的总算力及当前的剩余算力,包括:
根据计算节点集中每个计算节点的类型及算力,确定所述任一类型计算资源的总算力;
根据所述任一类型计算资源中每个计算节点上报的剩余算力,确定所述任一类型计算资源的剩余算力。
3.根据权利要求1所述的方法,其特征在于,所述在所述剩余算力与所述总算力满足预设条件的情况下,确定资源更新模式及资源更新量,包括:
在所述剩余算力与总算力间的比值小于第一阈值的情况下,确定资源更新模式为扩容模式;
根据所述剩余算力与所述总算力间的差值及所述任一类型计算资源对应的计算任务的类型,确定所述资源更新量。
4.如权利要求1所的方法,其特征在于,所述在所述剩余算力与所述总算力满足预设条件的情况下,确定资源更新模式及资源更新量,包括:
在所述剩余算力与总算力间的比值大于第二阈值的情况下,确定资源更新模式为缩容模式;
根据所述剩余算力与所述总算力间的差值及所述任一类型计算资源对应的计算任务的类型,确定所述资源更新量,其中,所述第二阈值大于第一阈值。
5.根据权利要求3或4所述的方法,其特征在于,所述根据所述资源更新模式,获取各个节点的状态信息;
在所述资源更新模式为扩容模式的情况下,获取每个空闲节点的状态信息;
在所述资源更新模式为缩容模式的情况下,获取所述任一类型计算资源对应的计算节点的状态信息。
6.如权利要求5所述的方法,其特征在于,所述根据所述每个节点的状态信息及所述资源更新量,对所述任一类型的计算资源进行更新,包括:
在所述资源更新模式为扩容模式的情况下,根据每个空闲节点的状态信息及所述资源更新量,确定目标空闲节点;
根据所述任一类型的计算资源对应的计算任务,确定目标配置文件;
将所述目标配置文件发送给所述目标空闲节点,以使所述目标空闲节点根据所述目标配置文件进行配置;
基于所述目标空闲节点对应的计算资源,对所述任一类型的计算资源进行更新。
7.如权利要求5所述的方法,其特征在于,所述根据所述每个节点的状态信息及所述资源更新量,对所述任一类型的计算资源进行更新,包括:
在所述资源更新量为缩容的资源量的情况下,根据任一类型计算资源对应的计算节点的状态信息及所述资源更新量,确定目标计算节点;
将所述目标计算节点的状态更新为非可用状态;
向所述目标计算节点发送退出指令,以使所述目标计算节点在完成计算任务后进入空闲状态。
8.一种资源的控制装置,其特征在于,包括:
第一获取模块,用于获取任一类型的计算资源的总算力及当前的剩余算力;
确定模块,用于在所述剩余算力与所述总算力满足预设条件的情况下,确定资源更新模式及资源更新量;
第二获取模块,用于根据所述资源更新模式,获取每个节点的状态信息;
更新模块,用于根据所述每个节点的状态信息及所述资源更新量,对所述任一类型的计算资源进行更新。
9.根据权利要求8所述的装置,其特征在于,所述第一获取模块,具体用于:
根据计算节点集中每个计算节点的类型及算力,确定所述任一类型计算节点的总算力;
根据所述任一类型计算节点中每个计算节点上报的剩余算力,确定所述任一类型计算节点的剩余算力。
10.根据权利要求8所述的装置,其特征在于,所述确定模块,具体用于:
在所述剩余算力与总算力间的比值小于第一阈值的情况下,确定资源更新模式为扩容模式;
根据所述剩余算力与所述总算力间的差值及所述任一类型计算资源对应的计算任务的类型,确定所述资源更新量。
11.如权利要求8所述的装置,其特征在于,所述确定模块,具体用于:
在所述剩余算力与总算力间的比值大于第二阈值的情况下,确定资源更新模式为缩容模式;
根据所述剩余算力与所述总算力间的差值及所述任一类型计算资源对应的计算任务的类型,确定所述资源更新量,其中,所述第二阈值大于第一阈值。
12.根据权利要求10或11所述的装置,其特征在于,所述第二获取模块,具体用于:
在所述资源更新模式为扩容模式的情况下,获取每个空闲节点的状态信息;
在所述资源更新模式为扩容模式的情况下,获取所述任一类型计算资源对应的计算节点的状态信息。
13.如权利要求12所述的装置,其特征在于,所述更新模块,具体用于:
在所述资源更新模式为扩容模式的情况下,根据每个空闲节点的状态信息及所述资源更新量,确定目标空闲节点;
根据所述任一类型的计算资源对应的计算任务,确定目标配置文件;
将所述目标配置文件发送给所述目标空闲节点,以使所述目标空闲节点根据所述目标配置文件进行配置;
基于所述目标空闲节点对应的计算资源,对所述任一类型的计算资源进行更新。
14.如权利要求12所述的装置,其特征在于,所述更新模块,具体用于:
在所述资源更新量为缩容的资源量的情况下,根据任一类型计算资源对应的计算节点的状态信息及所述资源更新量,确定目标计算节点;
将所述目标计算节点的状态更新为非可用状态;
向所述目标计算节点发送退出指令,以使所述目标计算节点在完成计算任务后进入空闲状态。
15.一种计算机设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。
CN202210234379.7A 2022-03-10 2022-03-10 资源的控制方法、装置、计算机设备及存储介质 Pending CN114637603A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210234379.7A CN114637603A (zh) 2022-03-10 2022-03-10 资源的控制方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210234379.7A CN114637603A (zh) 2022-03-10 2022-03-10 资源的控制方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN114637603A true CN114637603A (zh) 2022-06-17

Family

ID=81947774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210234379.7A Pending CN114637603A (zh) 2022-03-10 2022-03-10 资源的控制方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114637603A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115965517A (zh) * 2023-01-09 2023-04-14 摩尔线程智能科技(北京)有限责任公司 图形处理器资源管理方法及装置、电子设备和存储介质
CN116467071A (zh) * 2023-03-22 2023-07-21 北京神州泰岳软件股份有限公司 算力网络中算力感知的方法、装置、存储介质及电子设备
CN116991558A (zh) * 2023-09-22 2023-11-03 苏州元脑智能科技有限公司 算力资源的调度方法及多架构集群、装置、存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115965517A (zh) * 2023-01-09 2023-04-14 摩尔线程智能科技(北京)有限责任公司 图形处理器资源管理方法及装置、电子设备和存储介质
CN115965517B (zh) * 2023-01-09 2023-10-20 摩尔线程智能科技(北京)有限责任公司 图形处理器资源管理方法及装置、电子设备和存储介质
CN116467071A (zh) * 2023-03-22 2023-07-21 北京神州泰岳软件股份有限公司 算力网络中算力感知的方法、装置、存储介质及电子设备
CN116991558A (zh) * 2023-09-22 2023-11-03 苏州元脑智能科技有限公司 算力资源的调度方法及多架构集群、装置、存储介质
CN116991558B (zh) * 2023-09-22 2024-02-02 苏州元脑智能科技有限公司 算力资源的调度方法及多架构集群、装置、存储介质

Similar Documents

Publication Publication Date Title
CN114637603A (zh) 资源的控制方法、装置、计算机设备及存储介质
US9535775B2 (en) Session-based remote management system and load balance controlling method
CN108733509B (zh) 用于在集群系统中备份和恢复数据的方法和系统
CN110489306A (zh) 一种报警阈值确定方法、装置、计算机设备及存储介质
US10417062B2 (en) Method and apparatus of unloading out of memory processing flow to user space
CN110196770B (zh) 云系统内存数据处理方法、装置、设备及存储介质
EP1259030A2 (en) System and method for predicting network performance
CN107395458B (zh) 系统监控方法及装置
US10255124B1 (en) Determining abnormal conditions of host state from log files through Markov modeling
US11263069B1 (en) Using unsupervised learning to monitor changes in fleet behavior
CN108415765B (zh) 任务调度方法、装置及智能终端
CN114168071B (zh) 一种分布式集群扩容方法、分布式集群扩容装置及介质
JP6679201B1 (ja) 情報処理装置、情報処理システム、プログラム及び情報処理方法
CN110569157B (zh) 存储测试方法、装置、服务器及存储介质
CN115080253B (zh) Gpu任务的分配方法、装置、电子设备和存储介质
CN108737144B (zh) 资源管理的方法和设备
CN115168042A (zh) 监控集群的管理方法及装置、计算机存储介质、电子设备
US20050265362A1 (en) Message relay program and message relay device
CN114416326A (zh) 大数据管控方法、装置、管控系统及可读存储介质
JP2002366393A (ja) 計算機稼動情報収集方法及びその実施システム並びにその処理プログラム
CN112416568A (zh) 音视频转码任务的时长预估方法和时长预估装置
CN111694705A (zh) 监控方法、装置、设备及计算机可读存储介质
CN109474694A (zh) 一种基于san存储阵列的nas集群的管控方法及装置
CN116302577B (zh) 多接入边缘计算系统的算法卸载任务执行方法
CN109189664B (zh) 应用程序的信息采集方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination