CN114518949A - 资源管理系统及资源管理方法 - Google Patents
资源管理系统及资源管理方法 Download PDFInfo
- Publication number
- CN114518949A CN114518949A CN202011293652.0A CN202011293652A CN114518949A CN 114518949 A CN114518949 A CN 114518949A CN 202011293652 A CN202011293652 A CN 202011293652A CN 114518949 A CN114518949 A CN 114518949A
- Authority
- CN
- China
- Prior art keywords
- resource
- sharable
- worker nodes
- resource management
- requests
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5011—Pool
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/504—Resource capping
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
一种资源管理系统及资源管理方法。资源管理系统包括彼此通信连接的多个工作者节点及主责节点,且该些工作者节点及该主责节点各包括资源池、资源监视器、收集器代理模块、流量引导推理模块、请求处理模块、许可控制器、临界值调整器,主责节点还包括数据收集器、人工智能计算模块及负载平衡器。本发明所提供的资源管理系统及资源管理方法,具有创新的分布式资源管理架构,可混合应用集中式与分布式资源管理机制,可兼容于现有的集中式资源管理机制,并可进一步避免在无网络传输环境及集中决策机制中可能发生的延迟情形,且达到负载平衡和资源使用优化的目的。
Description
技术领域
本发明涉及一种资源管理系统及资源管理方法,尤其涉及一种能够混合应用集中式与分布式资源管理机制的资源管理系统及资源管理方法。
背景技术
由于5G私有专网(Private Network)的兴起,混合云运算成为主流,运算装置中的边缘运算装置常以分散的方式建置在应用场域中,再利用网络连接私有云(PrivateCloud)或公有云(Public Cloud)。为了有效平衡运算或网络资源的使用,目前多以“丛集”(Cluster)方式并选定一个主责节点(Master Node,MN)来管理工作点(Worker Node,WN)的工作需求派遣。
然而,网络传输延迟和数据压缩延迟,却造成无法满足终端用户的服务质量要求,并造成资源浪费与耗电的问题。虽然目前有许多分布式资源管理机制发明被提出,但存在以下问题:
1.现有的分布式资源管理机制与集中式丛集资源管理机制无法共存。
2.在现有的分布式的资源管理机制中,为了达成负载平衡的快速派遣,需要每一个工作节点的资源状态分享,造成额外的网络流量和决策延迟;平衡效果也会因工作热点的转移、收敛时间较长,易产生钟摆效应。
3.现有的分布式的资源管理机制部分采用了预留的“可分享”/“不可分享”资源政策进行分布式管理,其固定且缺乏弹性的预留机制,反而让资源使用上产生浪费、效率更低。
4.在许多利用无线中继互联的Mesh Edge Cloud前案中,无论是采用单纯集中式或单纯分布式的资源管理都不利于资源使用服务质量与效益。
因此,如何通过资源管理机制的改良,来克服上述的缺陷,已成为该项事业所欲解决的重要课题之一。
发明内容
本发明所要解决的技术问题在于,针对现有技术的不足提供一种能够混合应用集中式与分布式资源管理机制的资源管理系统及资源管理方法。
为了解决上述的技术问题,本发明所采用的其中一技术方案是提供一种资源管理系统,其包括多个工作者节点及一主责节点,该些工作者节点及主责节点彼此通信连接,其中,该些工作者节点及该主责节点各包括资源池、资源监视器、收集器代理模块、流量引导推理模块、请求处理模块、许可控制器及临界值调整器。资源池将对应的系统资源划分为可共享资源及不可共享资源。资源监视器记录资源池的使用状况,并产生资源用量监视数据。收集器代理模块用于传送所产生的资源用量监视数据。流量引导推理模块接收资源用量监视数据,并依据资源用量监视数据计算不可共享资源及可共享资源的权重比例,以产生许可控制策略。请求处理模块接收来自多个电子装置的多个资源使用请求。许可控制器依据许可控制策略将该些资源使用请求分配给不可共享资源及可共享资源。临界值调整器用于调整可共享资源及不可共享资源的分配比例。其中,主责节点还包括数据收集器、人工智能计算模块及负载平衡器。数据收集器从该些工作者节点及主责节点的收集器代理模块接收该些工作者节点及主责节点的资源用量监视数据,以产生资源用量统计数据。人工智能计算模块经配置以将该资源用量统计数据输入经训练的人工智能模型,以产生分别用于分配该些工作者节点及主责节点的该些资源池的多个临界值数据。其中,各临界值数据定义各资源池中的分配比例,且该些工作者节点及主责节点的该些流量引导推理模块经配置以依据该些优化临界值数据分别控制对应的该些临界值调整器调整各该些资源池的可共享资源及不可共享资源。负载平衡器经配置以将该些工作者节点及该主责节点中分配至该些可共享资源中的该些资源使用请求平衡分配至该些工作者节点及该主责节点的该些可共享资源。
为了解决上述的技术问题,本发明所采用的另外一技术方案是提供一种资源管理方法,其适用于彼此通信连接的多个工作者节点及主责节点,且该些工作者节点及主责节点各包括资源池、资源监视器、收集器代理模块、流量引导推理模块、请求处理模块、许可控制器、临界值调整器,主责节点还包括数据收集器、人工智能计算模块及负载平衡器,该资源管理方法包括:针对该些工作者节点及该主责节点执行一内部资源管理流程,内部资源管理流程包括:配置该资源池以将对应的一系统资源划分为一可共享资源及一不可共享资源;配置该资源监视器以记录该资源池的使用状况,并产生一资源用量监视数据;配置该收集器代理模块以将所产生的该资源用量监视数据传送至该流量引导推理模块;配置该流量引导推理模块接收该资源用量监视数据,并依据该资源用量监视数据计算该不可共享资源及该可共享资源的权重比例,以产生一许可控制策略;配置该请求处理模块接收来自多个电子装置的多个资源使用请求;及配置该许可控制器依据该许可控制策略将该些资源使用请求分配给该不可共享资源及该可共享资源。其中,临界值调整器用于调整该可共享资源及该不可共享资源的一分配比例。资源管理方法还包括针对该些工作者节点及该主责节点执行一外部资源管理流程,外部资源管理流程包括:配置该数据收集器从该些工作者节点及该主责节点的该些收集器代理模块接收该些工作者节点及该主责节点的该些资源用量监视数据,以产生一资源用量统计数据;配置该人工智能计算模块以将该资源用量统计数据输入一经训练的人工智能模型,以产生分别用于分配该些工作者节点及该主责节点的该些资源池的多个临界值数据,其中,各该临界值数据定义各该资源池中的该分配比例;配置该些工作者节点及该主责节点的该些流量引导推理模块以依据该些优化临界值数据分别控制对应的该些临界值调整器调整各该些资源池的该可共享资源及该不可共享资源;及配置该负载平衡器以将该些工作者节点及该主责节点中分配至该些可共享资源中的该些资源使用请求平衡分配至该些工作者节点及该主责节点的该些可共享资源。
本发明的其中一有益效果在于,本发明所提供的资源管理系统及资源管理方法,具有创新的分布式资源管理架构,可混合应用集中式与分布式资源管理机制。其中,内部资源管理流程实现了快速及低延迟的分布式资源管理架构及可管道化(Pipeline)同步执行机制,同时,以资源池的架构为基础,实现可调整的可共享资源及不可共享资源的动态比例调整。
此外,本发明所提供的资源管理系统及资源管理方法通过整合每一个工作者节点的可共享资源以形成可共享资源池架构,其兼容于现有的集中式资源管理机制。另一方面,外部资源管理流程利用人工智能的大数据分析,进一步实现了资源临界值动态调整机制,可调整可共享资源及不可共享资源的分配比例。
针对效能及资源使用率方面,本发明所提供的资源管理系统及资源管理方法具有分布式内部资源管理流程与可管道化(Pipeline)同步执行机制,使本地端请求可以立即使用本地端资源,可进一步避免在无网络传输环境及集中决策机制中可能发生的延迟情形。
再者,通过人工智能的大数据分析实现的资源临界值动态调整机制,可以帮助负载较大的工作节点经由程序执行位置的vAPP转移(virtual App Migration)及增加不可共享资源的比例,达到负载平衡和资源使用优化的目的。
为使能更进一步了解本发明的特征及技术内容,请参阅以下有关本发明的详细说明与附图,然而所提供的附图仅用于提供参考与说明,并非用来对本发明加以限制。
附图说明
图1为根据本发明实施例的资源管理系统的方框示意图。
图2为根据本发明实施例的内部资源管理流程示意图。
图3为根据本发明的内部资源管理流程的流程图。
图4为根据本发明实施例的类神经网络模型的示意图。
图5为根据本发明实施例的外部资源管理流程的示意图。
图6为根据本发明实施例的外部资源管理流程的流程图。
主要组件符号说明:
1 资源管理系统
AC0、AC1、…、ACi 许可控制器
AI 人工智能计算模块
AIM 人工智能模型
C1~C3 时间信息
CA0、CA1、…、CAi 收集器代理模块
d1~d3 使用者需求资源
DC 数据收集器
hid1、hid2、hid3 隐含层
HIS 历史资源用量统计数据
Inp 输入层
LB 负载平衡器
Nb1~Nb3 不可共享资源剩余资源
NSR0、NSR1、…、NSRi 不可共享资源
O1-Tx~O3-Tx 资源使用状态
Out 输出层
RD0、RD1、…、RDi 资源用量监视数据
RH0、RH1、…、RHi 请求处理模块
RM0、RM1、…、RMi 资源监视器
RP0、RP1、…、RPi 资源池
RQ0、RQ1、…、RQi 资源使用请求
RS 资源用量统计数据
S30~S35、S60~S63 步骤
Sb1~Sb3 可共享资源剩余资源
SR0、SR1、…、SRi 可共享资源
TA0、TA1、…、TAi 临界值调整器
TS0、TS1、…、Tsi 流量引导推理模块
MN 主责节点
WN1、…、WNi 工作者节点
z[1][1]~z[1][5]、…、z[3][1]~z[3][5] 输出向量
具体实施方式
以下是通过特定的具体实施例来说明本发明所公开有关“资源管理系统及资源管理方法”的实施方式,本领域技术人员可由本说明书所公开的内容了解本发明的优点与效果。本发明可通过其他不同的具体实施例加以实行或应用,本说明书中的各项细节也可基于不同观点与应用,在不悖离本发明的构思下进行各种修改与变更。另外,本发明的附图仅为简单示意说明,并非依实际尺寸的描绘,事先声明。以下的实施方式将进一步详细说明本发明的相关技术内容,但所公开的内容并非用以限制本发明的保护范围。另外,本文中所使用的术语“或”,应视实际情况可能包括相关联的列出项目中的任一个或者多个的组合。
图1为根据本发明实施例的资源管理系统的方框示意图。参阅图1所示,本发明实施例提供一种资源管理系统1,其包括多个工作者节点WN1、…、WNi及主责节点MN,彼此通信连接。
工作者节点WN1包括资源池RP1、资源监视器RM1、收集器代理模块CA1、流量引导推理模块TS1、请求处理模块RH1、许可控制器AC1及临界值调整器TA1。而其余的工作者节点与主责节点MN基本上与工作者节点WN1具有相同的配置,例如,工作者节点WNi包括资源池RPi、资源监视器RMi、收集器代理模块CAi、流量引导推理模块TSi、请求处理模块RHi、许可控制器ACi及临界值调整器TAi,而主责节点MN包括资源池RP0、资源监视器RM0、收集器代理模块CA0、流量引导推理模块TS0、请求处理模块RH0、许可控制器AC0及临界值调整器TA0。因此如有必要,否则下文将不再赘述。
需要说明的是,上述工作者节点WN1及主责节点MN中使用的资源池、资源监视器、收集器代理模块、流量引导推理模块、请求处理模块、许可控制器及临界值调整器均可通过硬件、软件或固体的形式实现其功能。当以软件形式实现时,可将用于执行上述元件或模块的功能的程序代码储存于一般计算机系统内建的存储器中,并经由处理器执行来实现上述元件或模块。
资源池RP1将工作者节点WN1对应的系统资源划分为可共享资源SR1及不可共享资源NSR1。以工作者节点WN1为一常见的计算机系统进行举例,工作者节点WN1可包括中央处理器、存储器、闪存、网络传输接口、硬盘及图形处理器,因此,上述的系统资源可包括中央处理器可处理量、存储器可使用量、网络可使用量、闪存可使用量、硬盘可使用量及图形处理器可处理量,但本发明不限于此。本发明主要是通过整合每一个工作者节点WN1、…、WNi的可共享资源SR1、…、SRi以形成可共享资源池架构,其兼容于现有的集中式资源管理机制。
请求处理模块RH1接收来自多个电子装置的多个资源使用请求RQ1。其中,工作者节点WN1可与多个电子装置连接,且此多个电子装置相对于工作者节点WN1为本地端装置。在一些实施例中,不可共享资源NSR1仅用于服务本地端装置,亦即,仅用于回应来自本地端装置的请求RQ1,而可共享资源SR1可用于服务来自所有工作者节点WN1、…、WNi及主责节点MN上的电子装置的资源使用请求。
资源监视器RM1用于记录资源池RP1的使用状况,并产生资源用量监视数据RD1。举例而言,资源监视器RM1可长时间持续收集多个电子装置ED1(亦即,本地端装置)的资源使用请求RQ1,以作为资源用量监视数据RD1。
收集器代理模块CA1用于传送所产生的资源用量监视数据RD1,流量引导推理模块TS1接收资源用量监视数据RD1,并依据资源用量监视数据RD1计算不可共享资源NSR1的权重比例WNSR1及可共享资源SR1的权重比例WSR1,以产生许可控制策略。如前所述,资源用量监视数据RD1是通过资源监视器RM1长时间持续收集的,且可包括收集本地端装置的资源使用请求对应的时间点。因此,流量引导推理模块TS1可进一步取得当前时间,并依据此当前时间及资源用量监视数据RD1中对应此当前时间的资源使用请求的数量,进而计算不可共享资源NSR1的权重比例WNSR1及可共享资源SR1的权重比例WSR1。
例如,若当前时间对应于本地端装置的资源使用请求的数量较多的时段,则倾向保留较多的不可共享资源NR1,因此,不可共享资源NSR1的权重比例WNSR1将会大于可共享资源SR1的权重比例WSR1。然而,需要说明的是,不可共享资源NSR1的权重比例WNSR1及可共享资源SR1的权重比例WSR1相加将会是1。接着,许可控制策略则是用于使许可控制器AC1据其决定要如何将该些资源使用请求RQ1分配给不可共享资源NSR1及可共享资源SR1。在一些实施例中,流量引导推理模块TS1依据资源用量监视数据RD1计算不可共享资源NSR1及可共享资源SR1的负载量,以产生许可控制策略。举例而言,许可控制策略可包括下列项目:
1.若不可共享资源NSR1的负载量小于重载临界值,则将该些资源使用请求RQ1分配给不可共享资源NSR1。
2.若不可共享资源NSR1的负载量大于或等于重载临界值,且与该些资源使用请求RQ1相关的随机数值小于或等于不可共享资源NSR1的权重比例WNSR1,则将该些资源使用请求RQ1分配给不可共享资源NSR1。换言之,在重载的情形下,将当前待决定的资源使用请求RQ1关联于介于0至1之间的一随机数值,并将此随机数值与不可共享资源NSR1的权重比例WNSR1进行比较。
3.若不可共享资源NSR1的负载量大于或等于重载临界值,且与该些资源使用请求RQ1相关的随机数值大于不可共享资源NSR1的权重比例WNSR1,则将该些资源使用请求RQ1分配给可共享资源SR1。
4.若该些资源使用请求RQ1的数量大于资源池RP1的当前可使用资源量,则拒绝该些资源使用请求。
因此,许可控制器AC1依据上述许可控制策略将该些资源使用请求RQ1分配给不可共享资源NSR1及可共享资源SR1。需要说明的是,如图1所示的临界值调整器TA1是用于调整可共享资源SR1及不可共享资源NSR1的分配比例,然而,在下文将要描述的内部资源管理流程中,将不使用临界值调整器TA1。
请参考图2及图3,图2为根据本发明实施例的内部资源管理流程示意图,图3为根据本发明的内部资源管理流程的流程图。如图所示,在此配置下,可对工作者节点WN1的资源池RP1、资源监视器RM1、收集器代理模块CA1、流量引导推理模块TS1、请求处理模块RH1、许可控制器AC1及临界值调整器TA1等模块执行一内部资源管理流程,以将资源管理及负载平衡等机制进行管线化。内部资源管理流程包括:
步骤S30:配置资源池RP1以将对应的系统资源划分为可共享资源SR1及不可共享资源NSR1。
步骤S31:配置资源监视器RM1以记录资源池RP1的使用状况,并产生资源用量监视数据RD1。
步骤S32:配置收集器代理模块CA1以将资源用量监视数据RD1传送至流量引导推理模块TS1。
步骤S33:配置流量引导推理模块TS1接收资源用量监视数据RD1,并依据该资源用量监视数据RD1计算不可共享资源NSR1及可共享资源SR1的权重比例,以产生许可控制策略。
步骤S34:配置请求处理模块接收来自多个电子装置的多个资源使用请求。
步骤S35:配置许可控制器依据许可控制策略将该些资源使用请求分配给不可共享资源及可共享资源。
因此,内部资源管理流程可达成快速及低延迟的分布式资源管理架构及可管道化(Pipeline)同步执行机制,使本地端请求可以立即使用本地端资源,可进一步避免在无网络传输环境及集中决策机制中可能发生的延迟情形。
请再参考图1,以下进一步说明本发明的资源管理系统1的主责节点MN。如图1所示,主责节点MN具有与工作者节点WN1、…、WNi相同的架构,因此可用于处理相对于主责节点MN的本地端请求。除此之外,主责节点MN还包括数据收集器DC、人工智能计算模块AI及负载平衡器LB。
数据收集器DC从工作者节点WN1、…、WNi的收集器代理模块CA1、…、CAi及主责节点的收集器代理模块CA0接收资源用量监视数据RD0、RD1、…、RDi,以产生资源用量统计数据RS。
人工智能计算模块AI经配置以将资源用量统计数据RS输入经训练的人工智能模型,以产生分别用于分配工作者节点WN1、…、WNi的资源池RP1、…、RPi及主责节点MN的资源池RP0的临界值数据。经训练的人工智能模型是经由对人工智能模型AIM以历史资源用量统计数据HIS进行训练所产生。在本发明实施例中,人工智能模型AIM可为类神经网络模型。
请参考图4,其为根据本发明实施例的类神经网络模型的示意图。如图4所示,类神经网络模型包括输入层Inp、输出层Out及多个隐含层hid1、hid2、hid3,且输入层Inp、输出层Out及隐含层hid1、hid2、hid3各包括多个神经元。以图4举例,输入层Inp及输出层Out各包括15个神经元,而输入的历史资源用量统计数据HIS包括使用者需求资源d1~d3、不可共享资源剩余资源Nb1~Nb3、可共享资源剩余资源Sb1~Sb3、时间信息C1~C3、在特定时间Tx的资源使用状态O1-Tx~O3-Tx。
换言之,可从历史资源用量统计数据HIS的各字段取出3笔数据作为前述的使用者需求资源d1~d3、不可共享资源剩余资源Nb1~Nb3、可共享资源剩余资源Sb1~Sb3、时间信息C1~C3、在特定时间(Tx)的资源使用状态O1-Tx~O3-Tx来对类神经网络模型进行训练,并且给予类神经网络模型对应的优化计算量分配方式(如图4中的输出向量z[1][1]~z[1][5]、…、z[3][1]、…、z[3][5]),最终可产生经训练的人工智能模型。
接者,将长期进行数据收集而产生的资源用量统计数据RS输入如图4的多层类神经网络以及选定的人工智能/或机器学习模型,所输出的临界值数据可应用于主责节点MN及工作者节点WN1、…、WNi的资源池RP0、RP1、…、RPi,例如,每经过特定时间依据不可共享资源NSR与可共享资源SR之间的不同分配比例来调整临界值调整器TA0、TA1、…、TAi。需要说明的是,以工作者节点WN1为例,上述提到的分配比例指的是经过临界值调整器TA1依据人工智能/或机器学习模型所输出的临界值数据调整资源池RP1后所得到可共享资源SR0与不可共享资源NSR0的比例,且分配比例不同于上文中提到的权重比例,不可共享资源NSR1的权重比例WNSR1及可共享资源SR1的权重比例WSR1可用于使许可控制器AC1据以决定如何将许可控制器AC1所接收到的多个资源使用请求RQ1分别分配给可共享资源SR0与不可共享资源NSR0两者其中之一。
也因此,通过人工智能的大数据分析实现的资源临界值动态调整机制,可以帮助负载较大的工作节点经由程序执行位置的vAPP转移(virtual App Migration)及增加不可共享资源的比例,达到负载平衡和资源使用优化的目的。
在依据临界值数据决定资源池RP0、RP1、…、RPi中的不可共享资源与可共享资源的分配比例之后,负载平衡器LB可进一步将主责节点MN及工作者节点WN1、…、WNi中,在前述的内部资源管理流程中分配至可共享资源SR0、SR1、…、SRi中的资源使用请求RQ0、RQ1、…、RQi平衡分配至主责节点WN及工作者节点WN1、…、WNi的可共享资源SR0、SR1、…、SRi。
因此,在上述架构下,可针对主责节点MN及工作者节点WN1、…、WNi执行一外部资源管理流程。请进一步参考图5及图6,图5为根据本发明实施例的外部资源管理流程的示意图,图6为根据本发明实施例的外部资源管理流程的流程图。如图所示,外部资源管理流程包括:
步骤S60:配置数据收集器DC从主责节点MN及工作者节点WN1、…、WNi的收集器代理模块CA0、CA1、…、CAi接收资源用量监视数据RD0、RD1、…、RDi,以产生资源用量统计数据RS。
步骤S61:配置人工智能计算模块AI以将资源用量统计数据RS输入经训练的人工智能模型,以产生分别用于分配主责节点MN及工作者节点WN1、…、WNi的资源池RP0、RP1、…、RPi的优化临界值数据。
步骤S62:配置主责节点MN及工作者节点WN1、…、WNi的流量引导推理模块TS0、TS1、…、TSi以依据优化临界值数据分别控制对应的临界值调整器TA0、TA1、…、TAi调整资源池RP0、RP1、…、RPi的可共享资源SR0、SR1、…、SRi及不可共享资源NSR0、NSR1、…、NSRi的分配比例。
步骤S63:配置负载平衡器LB以将主责节点MN及工作者节点WN1、…、WNi中分配至可共享资源SR0、SR1、…、SRi中的资源使用请求RQ0、RQ1、…、RQi平衡分配至主责节点WN及工作者节点WN1、…、WNi的可共享资源SR0、SR1、…、SRi。
[实施例的有益效果]
本发明的其中一有益效果在于,本发明所提供的资源管理系统及资源管理方法,具有创新的分布式资源管理架构,可混合应用集中式与分布式资源管理机制。其中,内部资源管理流程实现了快速及低延迟的分布式资源管理架构及可管道化(Pipeline)同步执行机制,同时,以资源池的架构为基础,实现可调整的可共享资源及不可共享资源的动态比例调整。
此外,本发明所提供的资源管理系统及资源管理方法通过整合每一个工作者节点的可共享资源以形成可共享资源池架构,其兼容于现有的集中式资源管理机制。另一方面,外部资源管理流程利用人工智能的大数据分析,进一步实现了资源临界值动态调整机制,可调整可共享资源及不可共享资源的分配比例。
针对效能及资源使用率方面,本发明所提供的资源管理系统及资源管理方法具有分布式内部资源管理流程与可管道化(Pipeline)同步执行机制,使本地端请求可以立即使用本地端资源,可进一步避免在无网络传输环境及集中决策机制中可能发生的延迟情形。
再者,通过人工智能的大数据分析实现的资源临界值动态调整机制,可以帮助负载较大的工作节点经由程序执行位置的vAPP转移(virtual App Migration)及增加不可共享资源的比例,达到负载平衡和资源使用优化的目的。
以上所公开的内容仅为本发明的优选可行实施例,并非因此局限本发明的权利要求书的范围,所以凡是运用本发明说明书及附图内容所作的等同技术变化,均包含于本发明的权利要求书的范围内。
Claims (16)
1.一种资源管理系统,该资源管理系统包括:
多个工作者节点及一主责节点,该些工作者节点及主责节点彼此通信连接,其中该些工作者节点及该主责节点各包括:
一资源池,该资源池将对应的一系统资源划分为一可共享资源及一不可共享资源;
一资源监视器,该资源监视器记录该资源池的使用状况,并产生一资源用量监视数据;
一收集器代理模块,该收集器代理模块用于传送所产生的该资源用量监视数据;
一流量引导推理模块,该流量引导推理模块接收该资源用量监视数据,并依据该资源用量监视数据计算该不可共享资源及该可共享资源的一权重比例,以产生一许可控制策略;
一请求处理模块,该请求处理模块接收来自多个电子装置的多个资源使用请求;
一许可控制器,该许可控制器依据该许可控制策略将该些资源使用请求分配给该不可共享资源及该可共享资源;以及
一临界值调整器,该临界值调整器用于调整该可共享资源及该不可共享资源的一分配比例;
其中该主责节点还包括:
一数据收集器,该数据收集器从该些工作者节点及该主责节点的该些收集器代理模块接收该些工作者节点及该主责节点的该些资源用量监视数据,以产生一资源用量统计数据;
一人工智能计算模块,该人工智能计算模块经配置以将该资源用量统计数据输入一经训练的人工智能模型,以产生分别用于分配该些工作者节点及该主责节点的该些资源池的多个临界值数据,其中,各该临界值数据定义各该资源池中的该分配比例,且该些工作者节点及该主责节点的该些流量引导推理模块经配置以依据该些优化临界值数据分别控制对应的该些临界值调整器调整各该些资源池的该可共享资源及该不可共享资源;以及
一负载平衡器,该负载平衡器经配置以将该些工作者节点及该主责节点中分配至该些可共享资源中的该些资源使用请求平衡分配至该些工作者节点及该主责节点的该些可共享资源。
2.如权利要求1所述的资源管理系统,其中该流量引导推理模块还依据该资源用量监视数据计算该不可共享资源及该可共享资源的负载量,以产生该许可控制策略,且各该资源池的该不可共享资源及该可共享资源的该权重比例相加为1。
3.如权利要求2所述的资源管理系统,其中该许可控制策略包括:
若该不可共享资源的该负载量小于一重载临界值,则将该些资源使用请求分配给该不可共享资源;
若该不可共享资源的该负载量大于或等于该重载临界值且与该些资源使用请求相关的一随机数值小于或等于该不可共享资源的该权重比例,则将该些资源使用请求分配给该不可共享资源;以及
若该不可共享资源的该负载量大于或等于该重载临界值且与该些资源使用请求相关的该随机数值大于该不可共享资源的该权重比例,则将该些资源使用请求分配给该可共享资源。
4.如权利要求1所述的资源管理系统,其中该许可控制策略包括:
若该些资源使用请求的数量大于该资源池的一当前可使用资源量,则拒绝该些资源使用请求,各该资源池的该不可共享资源仅供属于该些工作者节点及该主责节点的本地端的该些电子装置的该些使用资源请求所使用。
5.如权利要求1所述的资源管理系统,其中该经训练的人工智能模型是经由对一人工智能模型以一历史资源用量统计数据进行训练所产生。
6.如权利要求5所述的资源管理系统,其中该人工智能模型为一类神经网络模型,该类神经网络模型包括一输入层、一输出层及多个隐含层,且该输入层、该输出层及该些隐含层各包括多个神经元。
7.如权利要求5所述的资源管理系统,其中该历史资源用量统计数据包括使用者需求资源、不可共享资源剩余资源、可共享资源剩余资源、时间信息、在特定时间的资源使用状态。
8.如权利要求1所述的资源管理系统,其中该系统资源包括中央处理器可处理量、存储器可使用量、网络可使用量、闪存可使用量、硬盘可使用量及图形处理器可处理量。
9.一种资源管理方法,该资源管理方法适用于彼此通信连接的多个工作者节点及一主责节点,且该些工作者节点及该主责节点各包括一资源池、一资源监视器、一收集器代理模块、一流量引导推理模块、一请求处理模块、一许可控制器及一临界值调整器,该主责节点还包括一数据收集器、一人工智能计算模块及一负载平衡器,该资源管理方法包括:
针对该些工作者节点及该主责节点执行一内部资源管理流程,该内部资源管理流程包括:
配置该资源池以将对应的一系统资源划分为一可共享资源及一不可共享资源;
配置该资源监视器以记录该资源池的使用状况,并产生一资源用量监视数据;
配置该收集器代理模块以将所产生的该资源用量监视数据传送至该流量引导推理模块;
配置该流量引导推理模块接收该资源用量监视数据,并依据该资源用量监视数据计算该不可共享资源及该可共享资源的权重比例,以产生一许可控制策略;
配置该请求处理模块接收来自多个电子装置的多个资源使用请求;以及
配置该许可控制器依据该许可控制策略将该些资源使用请求分配给该不可共享资源及该可共享资源,
其中该临界值调整器用于调整该可共享资源及该不可共享资源的一分配比例;以及
针对该些工作者节点及该主责节点执行一外部资源管理流程,该外部资源管理流程包括:
配置该数据收集器从该些工作者节点及该主责节点的该些收集器代理模块接收该些工作者节点及该主责节点的该些资源用量监视数据,以产生一资源用量统计数据;
配置该人工智能计算模块以将该资源用量统计数据输入一经训练的人工智能模型,以产生分别用于分配该些工作者节点及该主责节点的该些资源池的多个临界值数据,其中,各该临界值数据定义各该资源池中的该分配比例;
配置该些工作者节点及该主责节点的该些流量引导推理模块以依据该些优化临界值数据分别控制对应的该些临界值调整器调整各该些资源池的该可共享资源及该不可共享资源;以及
配置该负载平衡器以将该些工作者节点及该主责节点中分配至该些可共享资源中的该些资源使用请求平衡分配至该些工作者节点及该主责节点的该些可共享资源。
10.如权利要求9所述的资源管理方法,该资源管理方法还包括:
配置该流量引导推理模块还依据该资源用量监视数据计算该不可共享资源及该可共享资源的负载量,以产生该许可控制策略,其中各该资源池的该不可共享资源及该可共享资源的该些权重比例相加为1。
11.如权利要求10所述的资源管理方法,其中该许可控制策略包括:
若该不可共享资源的该负载量小于一重载临界值,则将该些资源使用请求分配给该不可共享资源;
若该不可共享资源的该负载量大于或等于该重载临界值且与该些资源使用请求相关的一随机数值小于或等于该不可共享资源的该权重比例,则将该些资源使用请求分配给该不可共享资源;以及
若该不可共享资源的该负载量大于或等于该重载临界值且与该些资源使用请求相关的该随机数值大于该不可共享资源的该权重比例,则将该些资源使用请求分配给该可共享资源。
12.如权利要求9所述的资源管理方法,其中该许可控制策略包括:
若该些资源使用请求的数量大于该资源池的一当前可使用资源量,则拒绝该些资源使用请求,其中各该资源池的该不可共享资源仅供属于该些工作者节点及该主责节点的本地端的该些电子装置的该些使用资源请求所使用。
13.如权利要求9所述的资源管理方法,其中该经训练的人工智能模型是经由对一人工智能模型以一历史资源用量统计数据进行训练所产生。
14.如权利要求13所述的资源管理方法,其中该人工智能模型为一类神经网络模型,该类神经网络模型包括一输入层、一输出层及多个隐含层,且该输入层、该输出层及该些隐含层各包括多个神经元。
15.如权利要求13所述的资源管理方法,其中该历史资源用量统计数据包括使用者需求资源、不可共享资源剩余资源、可共享资源剩余资源、时间信息、在特定时间的资源使用状态。
16.如权利要求11所述的资源管理方法,其中该系统资源包括中央处理器可处理量、存储器可使用量、网络可使用量、闪存可使用量、硬盘可使用量及图形处理器可处理量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011293652.0A CN114518949A (zh) | 2020-11-18 | 2020-11-18 | 资源管理系统及资源管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011293652.0A CN114518949A (zh) | 2020-11-18 | 2020-11-18 | 资源管理系统及资源管理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114518949A true CN114518949A (zh) | 2022-05-20 |
Family
ID=81595215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011293652.0A Pending CN114518949A (zh) | 2020-11-18 | 2020-11-18 | 资源管理系统及资源管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114518949A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI821038B (zh) * | 2022-11-22 | 2023-11-01 | 財團法人工業技術研究院 | 運算工作分派方法及應用其之終端電子裝置與運算系統 |
-
2020
- 2020-11-18 CN CN202011293652.0A patent/CN114518949A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI821038B (zh) * | 2022-11-22 | 2023-11-01 | 財團法人工業技術研究院 | 運算工作分派方法及應用其之終端電子裝置與運算系統 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108667748B (zh) | 一种控制带宽的方法、装置、设备和存储介质 | |
CN102469023B (zh) | 基于云计算的调度方法、单元及系统 | |
US7243351B2 (en) | System and method for task scheduling based upon the classification value and probability | |
US9325585B1 (en) | Mission-driven autonomous and adaptive resource management | |
CN109041130B (zh) | 基于移动边缘计算的资源分配方法 | |
CN105141541A (zh) | 一种基于任务的动态负载均衡调度方法及装置 | |
CN102970379A (zh) | 在多个服务器之间实现负载均衡的方法 | |
CN111614754B (zh) | 面向雾计算的成本效率优化的动态自适应任务调度方法 | |
US11838384B2 (en) | Intelligent scheduling apparatus and method | |
CN107370799B (zh) | 一种混合移动云环境中高能效的多用户在线计算迁移方法 | |
TWI744068B (zh) | 資源管理系統及資源管理方法 | |
Khan et al. | The utility model for adaptive multimedia systems | |
CN112463044B (zh) | 一种保证分布式存储系统服务器端读尾延迟的方法及系统 | |
Tran-Dang et al. | Task priority-based resource allocation algorithm for task offloading in fog-enabled IoT systems | |
CN106998340B (zh) | 一种板卡资源的负载均衡方法及装置 | |
CA3127795A1 (en) | An efficient inroute (return channel) load balancing scheme of guaranteed qos traffic mixed with best effort traffic in an oversubscribed satellite network | |
CN116467082A (zh) | 一种基于大数据的资源分配方法及系统 | |
CN114518949A (zh) | 资源管理系统及资源管理方法 | |
Pereira et al. | Increasing the efficiency of fog nodes through of priority-based load balancing | |
CN102799488B (zh) | 一种应用于数字电视的应用资源管理系统 | |
JP2023543744A (ja) | リソーススケジューリング方法、システム、電子デバイスおよびコンピュータ可読記憶媒体 | |
WO2023222061A1 (zh) | 意图驱动的无线网络资源冲突解决方法及其装置 | |
Patil et al. | Resource allocation and scheduling in the cloud | |
CN113656150A (zh) | 深度学习算力虚拟化系统 | |
Chauhan et al. | Adaptive application offloading for QoS maximization in cloud-fog environment with delay-constraint |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |