CN117596244A - 一种算力节点选择方法、装置、设备及介质 - Google Patents

一种算力节点选择方法、装置、设备及介质 Download PDF

Info

Publication number
CN117596244A
CN117596244A CN202311549603.2A CN202311549603A CN117596244A CN 117596244 A CN117596244 A CN 117596244A CN 202311549603 A CN202311549603 A CN 202311549603A CN 117596244 A CN117596244 A CN 117596244A
Authority
CN
China
Prior art keywords
idle degree
information
node
computing
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311549603.2A
Other languages
English (en)
Inventor
张力方
王玉婷
李一喆
李宏平
魏星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202311549603.2A priority Critical patent/CN117596244A/zh
Publication of CN117596244A publication Critical patent/CN117596244A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/101Server selection for load balancing based on network conditions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种算力节点选择方法、装置、设备及介质。该方法包括:通过确定候选算力节点、以及候选算力节点的使用信息,根据候选算力节点的使用信息,确定候选算力节点的空闲度信息,根据候选算力节点的空闲度信息,确定候选算力节点的平均空闲度和空闲度方差,根据平均空闲度、空闲度方差和带宽空闲度,确定候选算力节点的算力性能信息;根据候选算力节点的算力性能信息,确定候选算力节点为目标算力节点。本申请提高了算力节点资源利用率,使得算力节点的选择更加合理。

Description

一种算力节点选择方法、装置、设备及介质
技术领域
本申请涉及通信技术领域,尤其涉及一种算力节点选择方法、装置、设备及介质。
背景技术
算力网络通过将边缘计算节点、云计算节点以及含广域网在内的各类网络资源深度融合在一起,减少边缘计算节点的管控复杂度,并通过集中控制或者分布式调度方法与云计算节点的计算和存储资源、广域网的网络资源进行协同,组成新一代信息基础设施,为客户提供包含计算、存储和连接的整体算力服务,并根据业务特性提供灵活、可调度的按需服务。
现有技术中,算力节点的选择采用基于Kubernetes平台的微服务部署,但存在算力节点选择效果不好的问题。
发明内容
本申请提供一种算力节点选择方法、装置、设备及介质,用以解决算力节点选择效果不好的问题。
第一方面,本申请提供一种算力节点选择方法,包括:
确定候选算力节点、以及候选算力节点的使用信息,使用信息包括CPU使用信息、磁盘使用信息、内存使用信息和带宽使用信息;
根据候选算力节点的使用信息,确定候选算力节点的空闲度信息,空闲度信息包括CPU空闲度、磁盘空闲度、内存空闲度和带宽空闲度;
根据候选算力节点的空闲度信息,确定候选算力节点的平均空闲度和空闲度方差;
根据平均空闲度、空闲度方差和带宽空闲度,确定候选算力节点的算力性能信息;
根据候选算力节点的算力性能信息,确定候选算力节点为目标算力节点。
在本申请中,确定候选算力节点、以及候选算力节点的使用信息,包括:
确定目标业务的需求信息、算力节点的使用信息,需求信息包括CPU需求量、内存需求量、以及带宽需求量;
根据目标业务的需求信息、以及算力节点的使用信息,确定候选算力节点、以及候选算力节点的使用信息。
在本申请中,根据候选算力节点的使用信息,确定候选算力节点的空闲度信息,包括:
根据候选算力节点的使用信息,确定候选算力节点的CPU总量、CPU剩余量、磁盘总量、磁盘剩余量、内存总量、内存剩余量、带宽总量、以及带宽剩余量;
根据候选算力节点的CPU总量、CPU剩余量、磁盘总量、磁盘剩余量、内存总量、内存剩余量、带宽总量、以及带宽剩余量,确定候选算力节点的空闲度信息。
在本申请中,根据候选算力节点的CPU总量、CPU剩余量、磁盘总量、磁盘剩余量、内存总量、内存剩余量、带宽总量、以及带宽剩余量,确定候选算力节点的空闲度信息,包括:
根据CPU总量和CPU剩余量,得到CPU空闲度;
根据磁盘总量和磁盘剩余量,得到磁盘空闲度;
根据内存总量和内存剩余量,得到内存空闲度;
根据带宽总量和带宽剩余量,得到带宽空闲度;
根据CPU空闲度、磁盘空闲度、内存空闲度、以及带宽空闲度,确定候选算力节点的空闲度信息。
在本申请中,根据候选算力节点的空闲度信息,确定候选算力节点的平均空闲度和空闲度方差,包括:
根据CPU空闲度、磁盘空闲度、以及内存空闲度,确定候选算力节点的平均空闲度;
根据CPU空闲度、磁盘空闲度、内存空闲度、以及候选算力节点的平均空闲度,得到候选算力节点的空闲度方差。
在本申请中,根据平均空闲度、空闲度方差和带宽空闲度,确定候选算力节点的算力性能信息,包括:
确定平均空闲度的权重、空闲度方差的权重和带宽空闲度的权重;
根据平均空闲度、平均空闲度的权重、空闲度方差、空闲度方差的权重、带宽空闲度、以及带宽空闲度的权重,得到候选算力节点的算力性能信息,其中,候选算力节点的算力性能信息满足:
Totali=[(αA)+(βB)+(γW0)]*10/3,
其中,Totali为候选算力节点的算力性能信息,A为空闲度方差,α为空闲度方差的权重,B为带宽空闲度,β为带宽空闲度的权重,W0为平均空闲度,γ为平均空闲度的权重,α+β+γ=1,且α、β、γ均大于0。
在本申请中,根据候选算力节点的算力性能信息,确定候选算力节点为目标算力节点,包括:
根据目标业务,确定算力节点性能要求;
若候选算力节点的算力性能信息满足算力节点性能要求,则确定候选算力节点为目标算力节点。
在本申请中,当候选算力节点有两个以上时,方法还包括:
确定每个候选算力节点的算力性能信息;
比对每个候选算力节点的算力性能信息,得到算力性能比对结果;
根据算力性能比对结果,确定候选算力节点中的目标算力节点,其中,目标算力节点的算力性能信息优于候选算力节点中其他算力节点的算力性能信息。
在本申请中,在根据候选算力节点的算力性能信息,确定候选算力节点为目标算力节点之后,方法还包括:
向目标算力节点发送指令,以使目标算力节执行目标业务。
第二方面,本申请提供一种算力节点选择装置,包括:
第一确定模块,用于确定候选算力节点、以及候选算力节点的使用信息,使用信息包括CPU使用信息、磁盘使用信息、内存使用信息和带宽使用信息;
第二确定模块,用于根据候选算力节点的使用信息,确定候选算力节点的空闲度信息,空闲度信息包括CPU空闲度、磁盘空闲度、内存空闲度和带宽空闲度;
第三确定模块,用于根据候选算力节点的空闲度信息,确定候选算力节点的平均空闲度和空闲度方差;
第三确定模块,用于根据平均空闲度、空闲度方差和带宽空闲度,确定候选算力节点的算力性能信息;
第四确定模块,用于根据候选算力节点的算力性能信息,确定候选算力节点为目标算力节点。
第三方面,本申请提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;
存储器存储计算机执行指令;
处理器执行存储器存储的计算机执行指令,以实现本申请提供的方法。
第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现本申请提供的方法。
本申请提供的一种算力节点选择方法、装置、设备及介质,通过确定候选算力节点、以及候选算力节点的使用信息,使用信息包括CPU使用信息、磁盘使用信息、内存使用信息和带宽使用信息;根据候选算力节点的使用信息,确定候选算力节点的空闲度信息,空闲度信息包括CPU空闲度、磁盘空闲度、内存空闲度和带宽空闲度;根据候选算力节点的空闲度信息,确定候选算力节点的平均空闲度和空闲度方差;根据平均空闲度、空闲度方差和带宽空闲度,确定候选算力节点的算力性能信息;根据候选算力节点的算力性能信息,确定候选算力节点为目标算力节点的手段,通过确定与算力节点的性能指标相关维度的使用信息,可以合理准确地确定表征算力节点使用情况的空闲度信息,通过表征算力节点的资源平衡情况的空闲度方差、表征算力节点的综合使用情况的平均空闲度、以及表征传输速率的带宽空闲度,使得算力节点的算力性能信息涵盖了多个维度和多个角度的信息,通过算力节点的算力性能信息对候选算力节点进行选择,使得算力节点的选择更加合理。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请提供的一种算力节点选择的场景示意图;
图2为本申请提供的一种算力节点选择方法的流程示意图;
图3为本申请提供的另一种算力节点选择方法的流程示意图;
图4为本申请提供的一种算力节点选择装置的结构示意图;
图5为本申请提供的电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
为了清楚理解本申请的技术方案,首先对现有技术的方案进行详细介绍。
算力网络通过将边缘计算节点、云计算节点以及含广域网在内的各类网络资源深度融合在一起,减少边缘计算节点的管控复杂度,并通过集中控制或者分布式调度方法与云计算节点的计算和存储资源、广域网的网络资源进行协同,组成新一代信息基础设施,为客户提供包含计算、存储和连接的整体算力服务,并根据业务特性提供灵活、可调度的按需服务。
现有技术中,算力节点的选择采用围绕着如何使原生Kubernetes更加高效地完成微服务部署工作,但是,从算网融合的需求来看,现有工作大都从原生Kubernetes部署微服务的评价指标入手,而对于大规模集群中的网络资源、磁盘资源等其它维度资源的状态信息缺乏有效地利用,导致会出现受其他维度资源限制而不能合理进行微服务部署的问题。
针对上述会出现受其他维度资源限制而不能合理进行微服务部署的问题,发明人在研究中发现,可以通过获取算力节点的CPU使用信息、磁盘使用信息、内存使用信息和带宽使用信息,从而确定算力节点的CPU空闲度、磁盘空闲度、内存空闲度和带宽空闲度,根据CPU空闲度、磁盘空闲度和内存空闲度,得到算力节点的平均空闲度和空闲度方差,最后根据平均空闲度、空闲度方差和带宽空闲度,得到算力节点的算力性能信息,最终根据算力节点的算力性能信息确定目标算力节点。
下面对本申请实施例提供的算力节点选择方法的应用场景进行介绍。
图1为本申请提供的一种算力节点选择的场景示意图,如图1所示,该场景图包括客户端、算力节点管理平台和算力节点,为了满足客户端发送的目标业务需求,算力节点管理平台根据目标业务的需求,从算力节点中确定目标算力节点提供给客户端进行使用的过程。
其中,算力节点管理平台可以被配置为执行本申请实施例提供的算力节点选择方法,基于算力节点的使用信息,评估算力节点的算力性能,从而与目标业务的需求进行匹配。
客户端可以指包含目标业务的计算机或移动终端,其中,移动终端包括手机、笔记本、POS机、车载电脑等,移动终端的功能包括通话、拍照、定位、信息处理、指纹扫描、身份证扫描、条码扫描、RFID扫描、IC卡扫描以及酒精含量检测等功能。
算力节点可以指具备一定计算能力和处理能力的网络节点,可以执行各种计算任务,包括数据处理、数据分析、机器学习等。
目标业务可以指需要使用算力节点的业务,例如待处理或待分析的数据。
需要说明的是,上述应用场景仅仅是示意性的,例如算力节点管理平台还可以为具有算力节点的算力性能评估功能的其他任意注册平台,本申请实施例提供的算力节点选择方法、装置、设备及介质包括但不仅限于上述应用场景。
图2为本申请提供的一种算力节点选择方法的流程示意图,如图2所示,该方法包括:
S201、确定候选算力节点、以及候选算力节点的使用信息,使用信息包括CPU使用信息、磁盘使用信息、内存使用信息和带宽使用信息。
其中,候选算力节点可以指从算力节点中选择的满足基本需要的算力节点。
CPU(Central Processing Unit)可以指中央处理器,其功能主要是解释计算机指令以及处理计算机软件中的数据。CPU总量与内核数量和逻辑处理器数量有关,CPU占用量可以指CPU在计算机上执行各种任务和进程所花费的时间量,CPU剩余量可以指CPU剩余可用于工作的时间量。
CPU使用信息可以指候选算力节点的CPU总量、CPU占用量和CPU剩余量的信息。
磁盘可以指用于数据存储的存储介质,磁盘总量可以指磁盘存储器所能存储的字节总数,磁盘占用量可以指磁盘中被使用的存储量,磁盘剩余量可以指磁盘中未被使用的存储量。
磁盘使用信息可以指候选算力节点的磁盘总量、磁盘占用量和磁盘剩余量的信息。
内存可以指内存储器,内存储器用于暂时存放CPU中的运算数据,以及与硬盘等外部存储器交换的数据。是外存与CPU进行沟通的桥梁,计算机中所有程序的运行都在内存中进行,内存性能的强弱影响计算机整体发挥的水平。内存总量可以指内存总的存储量,内存占用量可以指系统内核控制的内存数,内存剩余量可以指内核还未被纳入其管理范围的数量。
内存使用信息可以指候选算力节点的内存总量、内存占用量和内存剩余量的信息。
带宽可以指网络带宽,网络带宽指单位时间(一般指的是1秒钟)内能传输的数据量。带宽总量指单位时间内能传输的最大数据量,带宽占用量可以指单位时间内已使用的传输数据量,带宽剩余量可以指单位时间内未被使用的数据传输量。
带宽使用信息可以指候选算力节点的带宽总量、带宽占用量和带宽剩余量的信息。
在本申请实施例中,与算力节点的算力性能相关的主要参数为CPU信息、内存信息和磁盘信息,与算力节点传输速度相关的主要参数为带宽信息,因此,通过获取算力节点的CPU使用信息、内存使用信息、磁盘使用信息和带宽使用信息,使得计算的结果合理考虑了CPU信息、内存信息、磁盘信息和带宽信息的内容,从而提高了算力节点的资源利用率。
其中,在本申请实施例中,确定候选算力节点、以及候选算力节点的使用信息,包括:
确定目标业务的需求信息、算力节点的使用信息,需求信息包括CPU需求量、内存需求量、以及带宽需求量;
根据目标业务的需求信息、以及算力节点的使用信息,确定候选算力节点、以及候选算力节点的使用信息。
其中,目标业务的需求信息还可以包括时延等需求。
根据目标业务的需求信息、以及算力节点的使用信息,确定候选算力节点的方法可以包括:将目标业务的需求信息与算力节点的使用信息进行对比,将满足目标业务的需求信息的算力节点作为候选算力节点。具体地,可以将目标业务的需求信息与算力节点的剩余信息进行对比,保证算力节点的剩余信息可以满足目标业务的需求信息,其中,算力节点的剩余信息包括CPU剩余量、磁盘剩余量、内存剩余量和带宽剩余量。
S202、根据候选算力节点的使用信息,确定候选算力节点的空闲度信息,空闲度信息包括CPU空闲度、磁盘空闲度、内存空闲度和带宽空闲度。
其中,空闲度信息可以用于表征各参数的空闲程度,通过确定算力节点各参数的空闲程度,可以进一步确定算力节点还能够进行数据处理的能力。
其中,在本申请实施例中,根据候选算力节点的使用信息,确定候选算力节点的空闲度信息,包括:
根据候选算力节点的使用信息,确定候选算力节点的CPU总量、CPU剩余量、磁盘总量、磁盘剩余量、内存总量、内存剩余量、带宽总量、以及带宽剩余量;
根据候选算力节点的CPU总量、CPU剩余量、磁盘总量、磁盘剩余量、内存总量、内存剩余量、带宽总量、以及带宽剩余量,确定候选算力节点的空闲度信息。
其中,在本申请实施例中,根据候选算力节点的CPU总量、CPU剩余量、磁盘总量、磁盘剩余量、内存总量、内存剩余量、带宽总量、以及带宽剩余量,确定候选算力节点的空闲度信息,包括:
根据CPU总量和CPU剩余量,得到CPU空闲度;
根据磁盘总量和磁盘剩余量,得到磁盘空闲度;
根据内存总量和内存剩余量,得到内存空闲度;
根据带宽总量和带宽剩余量,得到带宽空闲度;
根据CPU空闲度、磁盘空闲度、内存空闲度、以及带宽空闲度,确定候选算力节点的空闲度信息。
其中,CPU空闲度可以根据CPU剩余量与CPU总量的比值确定,磁盘空闲度可以根据磁盘剩余量与磁盘总量的比值确定,内存空闲度可以根据内存剩余量与内存总量的比值确定,带宽空闲度可以根据带宽剩余量与带宽总量的比值确定。
S203、根据候选算力节点的空闲度信息,确定候选算力节点的平均空闲度和空闲度方差。
其中,平均空闲度可以指CPU空闲度、磁盘空闲度和内存空闲度的平均值,由于CPU、磁盘和内存为算力节点本身配置相关的参数,因此平均空闲度可用于表征候选算力节点的综合空闲程度。
空闲度方差可以指CPU空闲度、磁盘空闲度和内存空闲度的方差,用于表征候选算力节点各参数的波动情况,空闲度方差越大说明空闲度信息中的某个参数的空闲度越高,在候选算力节点能够完成目标业务的处理的情况下,为了提高各算力节点的资源利用率,空闲度方差越大的候选算力节点需要被使用的需求越大。其中,在本申请实施例中,根据候选算力节点的空闲度信息,确定候选算力节点的平均空闲度和空闲度方差,包括:
根据CPU空闲度、磁盘空闲度、以及内存空闲度,确定候选算力节点的平均空闲度;
根据CPU空闲度、磁盘空闲度、内存空闲度、以及候选算力节点的平均空闲度,得到候选算力节点的空闲度方差。
其中,平均空闲度可以指CPU空闲度、磁盘空闲度和内存空闲度的平均值。
空闲度方差可以指CPU空闲度、磁盘空闲度、以及内存空闲度的方差,空闲度方差满足:
其中,A为空闲度方差,Wj为第j个空闲度,第j个空闲度为CPU空闲度、磁盘空闲度和内存空闲度中任一空闲度,W0为平均空闲度。
S204、根据平均空闲度、空闲度方差和带宽空闲度,确定候选算力节点的算力性能信息。
其中,在本申请实施例中,根据平均空闲度、空闲度方差和带宽空闲度,确定候选算力节点的算力性能信息,包括:
确定平均空闲度的权重、空闲度方差的权重和带宽空闲度的权重;
根据平均空闲度、平均空闲度的权重、空闲度方差、空闲度方差的权重、带宽空闲度、以及带宽空闲度的权重,得到候选算力节点的算力性能信息,其中,候选算力节点的算力性能信息满足:
Totali=[(αA)+(βB)+(γW0)]*10/3,
其中,Totali为候选算力节点的算力性能信息,A为空闲度方差,α为空闲度方差的权重,B为带宽空闲度,β为带宽空闲度的权重,W0为平均空闲度,γ为平均空闲度的权重,α+β+γ=1,且α、β、γ均大于0。
其中,确定平均空闲度的权重、空闲度方差的权重和带宽空闲度的权重的方法可以包括:根据重点考虑维度而调节平均空闲度、空闲度方差和带宽空闲度的比重,平衡算力节点资源,例如,若目标业务处理时需要保证足够的带宽,可将带宽空闲度的权重调高;若目标业务处理时需要保证足够的运行存储性能,可将平均空闲度的权重调高。
S205、根据候选算力节点的算力性能信息,确定候选算力节点为目标算力节点。
其中,在本申请实施例中,根据候选算力节点的算力性能信息,确定候选算力节点为目标算力节点,包括:
根据目标业务,确定算力节点性能要求;
若候选算力节点的算力性能信息满足算力节点性能要求,则确定候选算力节点为目标算力节点。
其中,算力性能信息可以指具体的值,算力节点性能要求可以指所需的算力节点的算力性能信息需要满足阈值条件,例如,算力节点性能要求可以为高于阈值B,当候选算力节点的算力性能信息高于该阈值B时,则表示该候选算力节点的算力性能信息满足算力节点性能要求,该候选算力节点可以作为目标算力节点。
其中,在本申请实施例中,当候选算力节点有两个以上时,方法还包括:
确定每个候选算力节点的算力性能信息;
比对每个候选算力节点的算力性能信息,得到算力性能比对结果;
根据算力性能比对结果,确定候选算力节点中的目标算力节点,其中,目标算力节点的算力性能信息优于候选算力节点中其他算力节点的算力性能信息。
其中,当候选算力节点有两个以上时,表征有两个以上的算力节点的算力性能满足目标业务的基本处理要求,因此需要进行比对,得到比对结果。例如,候选算力节点为两个,根据两个候选算力节点的使用信息,分别计算两个候选算力节点的算力性能信息,得到两个候选算力节点的分数,将分数较高的候选算力节点作为目标算力节点。其中,在本申请实施例中,在根据候选算力节点的算力性能信息,确定候选算力节点为目标算力节点之后,方法还包括:
向目标算力节点发送指令,以使目标算力节执行目标业务。
其中,向目标算力节点发送指令可以包括:将目标业务的待执行数据包发送至目标算力节点,具体地,可以为客户端通过路由将控制指令发送至目标算力节点。目标业务可以包括科学计算、数据处理、图像处理、虚拟现实、智能制造、智慧城市等多个领域的算力需求。
本申请提供的一种算力节点选择方法、装置、设备及介质,通过确定候选算力节点、以及候选算力节点的使用信息,使用信息包括CPU使用信息、磁盘使用信息、内存使用信息和带宽使用信息;根据候选算力节点的使用信息,确定候选算力节点的空闲度信息,空闲度信息包括CPU空闲度、磁盘空闲度、内存空闲度和带宽空闲度;根据候选算力节点的空闲度信息,确定候选算力节点的平均空闲度和空闲度方差;根据平均空闲度、空闲度方差和带宽空闲度,确定候选算力节点的算力性能信息;根据候选算力节点的算力性能信息,确定候选算力节点为目标算力节点的手段,通过确定与算力节点的性能指标相关维度的使用信息,可以合理准确地确定表征算力节点使用情况的空闲度信息,通过表征算力节点的资源平衡情况的空闲度方差、表征算力节点的综合使用情况的平均空闲度、以及表征传输速率的带宽空闲度,使得算力节点的算力性能信息涵盖了多个维度和多个角度的信息,通过算力节点的算力性能信息对候选算力节点进行选择,使得算力节点的选择更加合理。
图3为本申请提供的另一种算力节点选择方法的流程示意图,如图3所示,该方法包括:
S301、根据业务请求,遍历各节点的参数,将满足业务请求的节点作为候选节点。
其中,业务请求包括业务需求,业务需求可以指处理业务需要服务器的cpu、内存、时延、带宽需求。
各节点的参数可以包括cpu处理器、存储和内存等参数。
S302、计算候选节点的评分。
其中,在本申请实施例中,计算候选节点的评分,包括:
根据候选节点的CPU总量、CPU占用量、磁盘总量、磁盘占用量、内存总量、内存占用量、带宽总量、以及带宽占用量,得到CPU空闲度、内存空闲度、磁盘空闲度和带宽空闲度;
根据CPU空闲度、内存空闲度和磁盘空闲度,得到CPU空闲度、内存空闲度和磁盘空闲度的平均值和方差;
确定平均值的权重、方差的权重和带宽空闲度的权重;
根据平均值、平均值的权重、方差、方差的权重、带宽空闲度、以及带宽空闲度的权重,得到候选节点的评分,其中,候选节点的评分满足:
C=[(lX)+(mY)+(nZ)]*10/3,
其中,C为候选节点的评分,X为方差,l为方差的权重,Y为带宽空闲度,m为带宽空闲度的权重,Z为平均值,n为平均值的权重,l+m+n=1,且l、m、n均大于0。
S303、根据候选节点的评分确定目标节点。
其中,根据候选节点的评分确定目标节点的方法可以包括:将候选节点中的评分高的候选节点确定为目标节点。通过目标节点对如数据处理、编码解码、文本处理等常规计算,图形计算,视频计算等业务请求进行算力计算。
本申请实施例提供的另一种算力节点选择方法,通过根据业务请求,遍历各节点的参数,将满足业务请求的节点作为候选节点,计算候选节点的评分,最后根据候选节点的评分确定目标节点的方式,采用候选节点的CPU信息、磁盘信息、内存信息和带宽信息用于节点的性能评分,使得最终确定的目标节点不仅可以满足业务请求的算力需求,同时还可以使各节点的资源利用率最大化。
图4为本申请提供的一种算力节点选择装置的结构示意图,如图4所示,该装置包括:第一确定模块401、第二确定模块402、第三确定模块403、第三确定模块404、以及第四确定模块405,具体为:
第一确定模块401,用于确定候选算力节点、以及候选算力节点的使用信息,使用信息包括CPU使用信息、磁盘使用信息、内存使用信息和带宽使用信息;
第二确定模块402,用于根据候选算力节点的使用信息,确定候选算力节点的空闲度信息,空闲度信息包括CPU空闲度、磁盘空闲度、内存空闲度和带宽空闲度;
第三确定模块403,用于根据候选算力节点的空闲度信息,确定候选算力节点的平均空闲度和空闲度方差;
第三确定模块404,用于根据平均空闲度、空闲度方差和带宽空闲度,确定候选算力节点的算力性能信息;
第四确定模块405,用于根据候选算力节点的算力性能信息,确定候选算力节点为目标算力节点。
其中,在本申请实施例中,第一确定模块401还用于:
确定目标业务的需求信息、算力节点的使用信息,需求信息包括CPU需求量、内存需求量、以及带宽需求量;
根据目标业务的需求信息、以及算力节点的使用信息,确定候选算力节点、以及候选算力节点的使用信息。
其中,在本申请实施例中,第二确定模块402还用于:
根据候选算力节点的使用信息,确定候选算力节点的CPU总量、CPU剩余量、磁盘总量、磁盘剩余量、内存总量、内存剩余量、带宽总量、以及带宽剩余量;
根据候选算力节点的CPU总量、CPU剩余量、磁盘总量、磁盘剩余量、内存总量、内存剩余量、带宽总量、以及带宽剩余量,确定候选算力节点的空闲度信息。
其中,在本申请实施例中,第二确定模块402还用于:
根据CPU总量和CPU剩余量,得到CPU空闲度;
根据磁盘总量和磁盘剩余量,得到磁盘空闲度;
根据内存总量和内存剩余量,得到内存空闲度;
根据带宽总量和带宽剩余量,得到带宽空闲度;
根据CPU空闲度、磁盘空闲度、内存空闲度、以及带宽空闲度,确定候选算力节点的空闲度信息。
其中,在本申请实施例中,第三确定模块403还用于:
根据CPU空闲度、磁盘空闲度、以及内存空闲度,确定候选算力节点的平均空闲度;
根据CPU空闲度、磁盘空闲度、内存空闲度、以及候选算力节点的平均空闲度,得到候选算力节点的空闲度方差。
其中,在本申请实施例中,第四确定模块404还用于:
确定平均空闲度的权重、空闲度方差的权重和带宽空闲度的权重;
根据平均空闲度、平均空闲度的权重、空闲度方差、空闲度方差的权重、带宽空闲度、以及带宽空闲度的权重,得到候选算力节点的算力性能信息,其中,候选算力节点的算力性能信息满足:
Totali=[(αA)+(βB)+(γW0)]*10/3,
其中,Totali为候选算力节点的算力性能信息,A为空闲度方差,α为空闲度方差的权重,B为带宽空闲度,β为带宽空闲度的权重,W0为平均空闲度,γ为平均空闲度的权重,α+β+γ=1,且α、β、γ均大于0。
其中,在本申请实施例中,第五确定模块405还用于:
根据目标业务,确定算力节点性能要求;
若候选算力节点的算力性能信息满足算力节点性能要求,则确定候选算力节点为目标算力节点。
图5为本申请实施例提供的电子设备的结构示意图。如图5所示,该电子设备50包括:
该电子设备50可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、通信部件503等部件。其中,处理器501、存储器502以及通信部件503通过总线504连接。
在具体实现过程中,至少一个处理器501执行存储器502存储的计算机执行指令,使得至少一个处理器501执行如上的算力节点选择方法。
处理器501的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的图5所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速存储器(Random Access Memory,RAM),也可能还包括非易失性存储器(Non-volatile Memory,NVM),例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
在一些实施例中,还提出一种计算机程序产品,包括计算机程序或指令,该计算机程序或指令被处理器执行时实现上述任一种算力节点选择方法中的步骤。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种算力节点选择方法中的步骤。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种算力节点选择方法中的步骤,因此,可以实现本申请实施例所提供的任一种算力节点选择方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (12)

1.一种算力节点选择方法,其特征在于,包括:
确定候选算力节点、以及所述候选算力节点的使用信息,所述使用信息包括CPU使用信息、磁盘使用信息、内存使用信息和带宽使用信息;
根据所述候选算力节点的使用信息,确定所述候选算力节点的空闲度信息,所述空闲度信息包括CPU空闲度、磁盘空闲度、内存空闲度和带宽空闲度;
根据所述候选算力节点的空闲度信息,确定所述候选算力节点的平均空闲度和空闲度方差;
根据所述平均空闲度、所述空闲度方差和所述带宽空闲度,确定所述候选算力节点的算力性能信息;
根据所述候选算力节点的算力性能信息,确定所述候选算力节点为目标算力节点。
2.根据权利要求1所述的方法,其特征在于,所述确定候选算力节点、以及所述候选算力节点的使用信息,包括:
确定目标业务的需求信息、算力节点的使用信息,所述需求信息包括CPU需求量、内存需求量、以及带宽需求量;
根据所述目标业务的需求信息、以及算力节点的使用信息,确定候选算力节点、以及所述候选算力节点的使用信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述候选算力节点的使用信息,确定所述候选算力节点的空闲度信息,包括:
根据所述候选算力节点的使用信息,确定所述候选算力节点的CPU总量、CPU剩余量、磁盘总量、磁盘剩余量、内存总量、内存剩余量、带宽总量、以及带宽剩余量;
根据所述候选算力节点的CPU总量、CPU剩余量、磁盘总量、磁盘剩余量、内存总量、内存剩余量、带宽总量、以及带宽剩余量,确定所述候选算力节点的空闲度信息。
4.根据权利要求3所述的方法,其特征在于,所述根据所述候选算力节点的CPU总量、CPU剩余量、磁盘总量、磁盘剩余量、内存总量、内存剩余量、带宽总量、以及带宽剩余量,确定所述候选算力节点的空闲度信息,包括:
根据所述CPU总量和所述CPU剩余量,得到CPU空闲度;
根据所述磁盘总量和所述磁盘剩余量,得到磁盘空闲度;
根据所述内存总量和所述内存剩余量,得到内存空闲度;
根据所述带宽总量和所述带宽剩余量,得到带宽空闲度;
根据所述CPU空闲度、所述磁盘空闲度、所述内存空闲度、以及所述带宽空闲度,确定所述候选算力节点的空闲度信息。
5.根据权利要求1所述的方法,其特征在于,所述根据所述候选算力节点的空闲度信息,确定所述候选算力节点的平均空闲度和空闲度方差,包括:
根据所述CPU空闲度、所述磁盘空闲度、以及所述内存空闲度,确定所述候选算力节点的平均空闲度;
根据所述CPU空闲度、所述磁盘空闲度、所述内存空闲度、以及所述候选算力节点的平均空闲度,得到所述候选算力节点的空闲度方差。
6.根据权利要求1所述的方法,其特征在于,所述根据所述平均空闲度、所述空闲度方差和所述带宽空闲度,确定所述候选算力节点的算力性能信息,包括:
确定所述平均空闲度的权重、所述空闲度方差的权重和所述带宽空闲度的权重;
根据所述平均空闲度、所述平均空闲度的权重、所述空闲度方差、所述空闲度方差的权重、所述带宽空闲度、以及所述带宽空闲度的权重,得到所述候选算力节点的算力性能信息,其中,所述候选算力节点的算力性能信息满足:
Totali=[(αA)+(βB)+(γW0)]*10/3,
其中,Totali为候选算力节点的算力性能信息,A为空闲度方差,α为空闲度方差的权重,B为带宽空闲度,β为带宽空闲度的权重,W0为平均空闲度,γ为平均空闲度的权重,α+β+γ=1,且α、β、γ均大于0。
7.根据权利要求1所述的方法,其特征在于,所述根据所述候选算力节点的算力性能信息,确定所述候选算力节点为目标算力节点,包括:
根据目标业务,确定算力节点性能要求;
若所述候选算力节点的算力性能信息满足算力节点性能要求,则确定所述候选算力节点为目标算力节点。
8.根据权利要求1所述的方法,其特征在于,当所述候选算力节点有两个以上时,所述方法还包括:
确定每个所述候选算力节点的算力性能信息;
比对每个所述候选算力节点的算力性能信息,得到算力性能比对结果;
根据所述算力性能比对结果,确定所述候选算力节点中的目标算力节点,其中,所述目标算力节点的算力性能信息优于所述候选算力节点中其他算力节点的算力性能信息。
9.根据权利要求1所述的方法,其特征在于,在所述根据所述候选算力节点的算力性能信息,确定所述候选算力节点为目标算力节点之后,所述方法还包括:
向所述目标算力节点发送指令,以使所述目标算力节执行目标业务。
10.一种算力节点选择装置,其特征在于,包括:
第一确定模块,用于确定候选算力节点、以及所述候选算力节点的使用信息,所述使用信息包括CPU使用信息、磁盘使用信息、内存使用信息和带宽使用信息;
第二确定模块,用于根据所述候选算力节点的使用信息,确定所述候选算力节点的空闲度信息,所述空闲度信息包括CPU空闲度、磁盘空闲度、内存空闲度和带宽空闲度;
第三确定模块,用于根据所述候选算力节点的空闲度信息,确定所述候选算力节点的平均空闲度和空闲度方差;
第三确定模块,用于根据所述平均空闲度、所述空闲度方差和所述带宽空闲度,确定所述候选算力节点的算力性能信息;
第四确定模块,用于根据所述候选算力节点的算力性能信息,确定所述候选算力节点为目标算力节点。
11.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-9中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-9任一项所述的方法。
CN202311549603.2A 2023-11-20 2023-11-20 一种算力节点选择方法、装置、设备及介质 Pending CN117596244A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311549603.2A CN117596244A (zh) 2023-11-20 2023-11-20 一种算力节点选择方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311549603.2A CN117596244A (zh) 2023-11-20 2023-11-20 一种算力节点选择方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN117596244A true CN117596244A (zh) 2024-02-23

Family

ID=89912735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311549603.2A Pending CN117596244A (zh) 2023-11-20 2023-11-20 一种算力节点选择方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN117596244A (zh)

Similar Documents

Publication Publication Date Title
CN108776934B (zh) 分布式数据计算方法、装置、计算机设备及可读存储介质
CN112784989B (zh) 推理系统、推理方法、电子设备及计算机存储介质
CN110674918B (zh) 信息处理方法、设备、系统及存储介质
CN111506434B (zh) 一种任务处理方法、装置及计算机可读存储介质
CN111176836B (zh) 一种云渲染资源调度方法及装置
CN111026493B (zh) 界面渲染的处理方法和装置
US20220229701A1 (en) Dynamic allocation of computing resources
CN112433844B (zh) 一种资源分配方法、系统、设备及计算机可读存储介质
CN111026532B (zh) 用于语音数据的消息队列管理方法
CN112488907A (zh) 数据处理方法及系统
CN114489963A (zh) 人工智能应用任务的管理方法、系统、设备及存储介质
CN108770014B (zh) 网络服务器的计算评估方法、系统、装置及可读存储介质
CN117596244A (zh) 一种算力节点选择方法、装置、设备及介质
CN116244231A (zh) 一种数据传输方法、装置、系统、电子设备及存储介质
CN114327862B (zh) 一种内存分配方法、装置、电子设备及存储介质
CN111669765B (zh) 网络扩容方法、装置、控制设备及存储介质
CN110610450A (zh) 数据处理方法、电子设备和计算机可读存储介质
CN110769027A (zh) 服务请求处理方法、装置、计算机设备及存储介质
CN117785486B (zh) 环境资源调配方法、装置、设备和介质
CN111240845B (zh) 一种数据处理方法、装置和存储介质
CN117349037B (zh) 在离线应用干扰消除方法、装置、计算机设备及存储介质
CN116431327B (zh) 一种任务限流处理方法及堡垒机
CN114884945B (zh) 数据传输方法、云服务器、设备、系统及存储介质
US20230195527A1 (en) Workload distribution by utilizing unused central processing unit capacity in a distributed computing system
CN114117010A (zh) Nlp任务的处理方法、装置、终端设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination