CN112463341A - 基于高性能计算集群hpc的cae作业运行时间预测方法及装置 - Google Patents
基于高性能计算集群hpc的cae作业运行时间预测方法及装置 Download PDFInfo
- Publication number
- CN112463341A CN112463341A CN202011458906.XA CN202011458906A CN112463341A CN 112463341 A CN112463341 A CN 112463341A CN 202011458906 A CN202011458906 A CN 202011458906A CN 112463341 A CN112463341 A CN 112463341A
- Authority
- CN
- China
- Prior art keywords
- job
- coef
- queue
- feature
- hpc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000006870 function Effects 0.000 claims description 37
- 238000010801 machine learning Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 abstract 1
- 238000013468 resource allocation Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/546—Message passing systems or structures, e.g. queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/54—Indexing scheme relating to G06F9/54
- G06F2209/548—Queue
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明涉及汽车诊断技术领域,提供了一种基于高性能计算集群HPC的CAE作业运行时间预测方法,包括如下步骤:S1、对接收的作业进行标识,采用作业编号进行标识;S2、基于特征属性序列Pi预测业务在不同队列下的运行时间TRi;S3、计算该作业在不同队列下的完成时间TTi,将该作业分配至完成时间TTi最早的队列,并输出该作业的作业完成时间。此方法可部署到拥有几百乃至数千个节点的高性能计算共用云/私有云HPC系统,提高作业调度系统负载均衡功能的性能,提高用户使用体验和HPC资源利用率。
Description
技术领域
本发明涉及到任务调度技术领域,提供了一种基于高性能计算集群的CAE作业运行时间预测方法及装置。
背景技术
随着CAE仿真技术在汽车研发领域的广泛应用,公有云和企业私有云HPC(高性能计算集群)系统在汽车等研发型企业中得到了广泛部署和大面积的使用。作业调度系统是HPC系统完成批量计算任务的核心业务系统。其功能为资源管理和作业调度,负责处理批量计算任务的软硬件资源分配和作业排队管理。支持批处理、交互式作业和串行、多种并行作业。作业调度系统的一个核心目标就是实现计算任务与软硬件资源的良好匹配。从而达到,任务能够快速的获得资源分配开始计算,计算资源也可以得到合理的利用,避免出现资源分配不合理导致的浪费。
作业调度系统的原理,是围绕着两个核心任务展开的。
一、任务调度:用户提交的作业给HPC作业调度系统之后,调度系统需要根据作业的各种属性信息,如求解软件类型、用户所属组,目标资源池等信息,将提交的作业拆分成具体的计算任务,并按照排队规则,将计算任务安排到各个批处理任务队列中,并且跟踪和监控任务的执行结果。
二、资源调度:本质上是对任务和资源做匹配,根据集群中主机的资源使用情况,分配合适的资源来运行任务。和操作系统的进程调度算法比较类似,资源调度的主要目标是,在固定的资源供给的情况下,尽可能提高资源使用率,减少任务等待的时间(任务等待资源去执行的时间),减少任务运行的延迟或者响应时间,尽可能公平分配资源(资源公平的被分配到所有任务)。
当前主流的HPC调度系统,如PBS、LSF、Platform、SGE,在资源分配和任务调度功能方面,存在一个缺点,即调度系统无法对用户关心的两个问题给出明确的答案:
1、用户的计算作业(若无法立即开始计算)需要等待多长时间才能开始运行
2、其提交的计算作业何时可以完成运行收到计算结果。
发明内容
本发明提供了一种基于高性能计算集群的CAE作业运行时间预测方法,旨在改善上述问题。
本发明是这样实现,一种基于高性能计算集群HPC的CAE作业运行时间预测方法,所述方法具体包括如下步骤:
S1、对接收的作业进行标识;
S2、基于特征属性序列Pi预测作业在不同队列下的运行时间TRi,每个队列对应于高性能计算集群HPC中的一个主机;
S3、预估该作业在不同队列下的完成时间TTi,将该作业分配至完成时间TTi最早的队列,并输出该作业的预估完成时间。
进一步的,业务在不同队列下的运行时间TRi的获取方法具体如下:
S21、提取作业中的指定特征属性序列Pi;
S22、将特征属性序列Pi输入对应队列的作业运行时间回归函数,输出该作业在不同队列的运行时间TRi;
作业运行时间回归函数TR表示具体如下:
TR=Feature_1*Coef_1+Feature_2*Coef_2+…+Feature_n*Coef_n+Coef_0
其中,Feature_0、…、Feature_n表示作业的n个特征属性,Coef_0、…、Coef_n分别表示n个特征属性的回归函数系数。
进一步的,回归函数系数的获取方法具体如下:
基于数据库中的作业信息构建机器学习训练数据集[Feature(i),TR(i)];
经机器学习算法训练后,得到各特征属性的回归函数系数Coef_0、…、Coef_n。
进一步的,作业在不同队列下的完成时间TTi的计算方法具体如下:
S31、计算各队列列表中已存在作业的运行时间,队列列表中所有作业的运行时间即为对应队列的等待时间TQi;
S32、计算各队列的等待时间TQi与作业在各队列下的运行时间TRi之和,即为该作业的完成时间TTi。
本发明是这样实现的,一种基于高性能计算集群HPC的CAE作业运行时间预测装置,所述装置包括:
作业接收单元,用于对接收的作业进行标识;
运行时间预估单元,基于特征属性序列Pi预测作业在不同队列下的运行时间TRi;
完成时间预估单元,用于预估该作业在不同队列下的完成时间TTi,将该作业分至配完成时间TTi最早的队列,并输出该作业的预估完成时间TTi。
进一步的,运行时间预估单元包括:
属性提取模块,用于提取作业中的指定特征属性序列Pi;
回归预测模块,用于将特征属性序列Pi输入对应队列的作业运行时间回归函数,输出该作业在不同队列的运行时间TRi;
作业运行时间回归函数TR表示具体如下:
TR=Feature_1*Coef_1+Feature_2*Coef_2+…+Feature_n*Coef_n+Coef_0
其中,Feature_0、…、Feature_n表示作业的n个特征属性,Coef_0、…、Coef_n分别表示n个特征属性的回归函数系数。
进一步的,回归预测模块包括:
训练集子模块,基于数据库中的作业信息构建机器学习训练数据集[Feature(i),TR(i)];
回归系数生成子模块,经机器学习算法训练后,得到各特征属性的回归函数系数Coef_0、…、Coef_n。
进一步的,完成时间预估单元包括:
等待时间计算模块,用于计算各队列列表中已存在作业的运行时间,队列列表中所有作业的运行时间即为对应队列的等待时间TQi;
完成时间计算模块,用于计算各队列的等待时间TQi与作业在在各队列下的运行时间TRi之和,即为该作业的完成时间TTi,并进行输出显示。
本发明的目的是解决高性能计算公有云/私有云集群上CAE作业运行时间的不可预测以及因此产生的资源利用率低下的问题而提出的利用机器学习算法估计计算作业运行时间的预测方法。此方法可部署到拥有几百乃至数千个节点的高性能计算共用云/私有云HPC系统,提高作业调度系统负载均衡功能的性能,提高用户使用体验和HPC资源利用率。
附图说明
图1为本发明实施例提供的基于高性能计算集群HPC的CAE作业运行时间预测方法的流程图;
图2为本发明实施例提供的基于高性能计算集群HPC的CAE作业运行时间预测装置的结构示意图。
具体实施方式
下面对照附图,通过对最优实施例的描述,对本发明的具体实施方式作进一步详细的说明。
图1为本发明实施例提供的基于高性能计算集群HPC的CAE作业运行时间预测方法的流程图,该方法具体包括如下步骤:
S1、对接收的作业进行标识,采用作业编号进行标识;
提交作业到HPC系统,并对作业进行合法性验证,验证通过后,给予正式的作业编号,用于标识HPC系统中的作业。
S2、基于特征属性序列Pi预测业务在不同队列下的运行时间TRi;
HPC系统扫描作业,提取出特征属性序列Pi,比如作业计算类型、作业规模,作业申请资源量(核数)、作业特性1、作业特性2等等,特征属性是通过人工定义的方式产生。
每个队列对应于高性能计算集群HPC中的一个主机,高性能计算集群HPC由主机群组成,主机群中的主机性能相同或不同,每类主机对应于一个作业运行时间回归函数TR,业务在不同队列下的运行时间TRi的获取方法具体如下:
S21、提取作业中的指定特征属性序列Pi;
S22、将特征属性序列Pi输入对应队列的作业运行时间回归函数,输出该作业在不同队列下的运行时间;
作业运行时间回归函数TR表示具体如下:
TR=Feature_1*Coef_1+Feature_2*Coef_2+…+Feature_n*Coef_n+Coef_0
其中,Feature_0、…、Feature_n表示作业的n个特征属性,Coef_0、…、Coef_n分别表示n个特征属性的回归函数系数,回归函数系数的获取方法具体如下:
基于数据库中的作业信息构建机器学习训练数据集[Feature(i),TR(i)],Feature(i),TR(i)分别表示机器学习训练数据集中第i各训练数据的特征属性及其运行时间;数据库中保存有历史作业的各特征属性Feature及其运行时间TR信息。
经机器学习算法训练后,得到各特征属性的回归函数系数Coef_0、…、Coef_n,将回归函数系数Coef_0、Coef_1、Coef_2…Coef_n与待预测作业的特征值Feature_1…Feature_n一起代入相应队列下的作业运行时间回归函数TR中,即可预测到该作业在对应队列下的运行时间。
S3、计算该作业在不同队列下的完成时间TTi,将该作业分配至完成时间TTi最早的队列,并输出该作业的预估完成时间。
在本发明实施例中,作业在不同队列下的作业运行时间TRi的计算方法具体如下:
S31、计算各队列中已存在作业的运行时间,队列中所有作业的运行时间即为对应队列的等待时间TQi;
S32、计算各队列的等待时间TQi与作业在各队列下的运行时间TRi之和,即为该作业的完成时间TTi。
依据各队列中作业列表,给出每个队列的等待时间TQi,待分配作业的预计运行时间TRi相加,得到待分配作业在每个队列的作业完成时间TTi。最后,依据作业完成时间TTi最短原则,将待分配作业分配到预计完成时间最短的队列q中,并将此作业队列下的预计运行时间TRi=q和TTi=q标记到此作业上。
图2为本发明实施例提供的基于高性能计算集群HPC的CAE作业运行时间预测装置的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分。
该装置包括:
作业接收单元,用于对接收的作业进行标识,采用作业编号进行标识;
提交作业到HPC系统,并对作业进行合法性验证,验证通过后,作业接收单元给予正式的作业编号,用于标识HPC系统中的作业。
运行时间预估单元,基于特征属性序列Pi预测业务在不同队列下的运行时间TRi;
在本发明实施例中,运行时间预估单元包括:
属性提取模块,用于提取作业中的指定特征属性序列Pi;
HPC系统扫描作业,提取出特征属性序列Pi,比如作业计算类型、作业规模,作业申请资源量(核数)、作业特性1、作业特性2等等,特征属性是通过人工定义的方式产生。
回归预测模块,用于将特征属性序列Pi输入对应队列的作业运行时间回归函数,输出该作业在不同队列下的运行时间;
每个队列对应于高性能计算集群HPC中的一个主机,高性能计算集群HPC由主机群组成,主机群中的主机性能相同或不同,每类主机对应于一个作业运行时间回归函数TR;
在本发明实施例中,作业运行时间回归函数TR表示具体如下:
TR=Feature_1*Coef_1+Feature_2*Coef_2+…+Feature_n*Coef_n+Coef_0
其中,Feature_0、…、Feature_n表示作业的n个特征属性,Coef_0、…、Coef_n分别表示n个特征属性的回归函数系数。其中,回归预测模块包括:
训练集子模块,基于数据库中的作业信息构建机器学习训练数据集[Feature(i),TR(i)];
回归系数生成子模块,经机器学习算法训练后,得到各特征属性的回归函数系数Coef_0、…、Coef_n。
将回归函数系数Coef_0、Coef_1、Coef_2…Coef_n与待预测作业的特征值Feature_1…Feature_n一起代入相应队列下的作业运行时间回归函数TR中,即可预测到该作业在对应队列下的运行时间。
完成时间预估单元,用于计算该作业在不同队列下的完成时间TTi,将该作业分配至完成时间TTi最早的队列,并输出该作业的作业完成时间。
在本发明实施例中,完成时间预估单元包括:
等待时间计算模块,用于计算各队列中已存在作业的运行时间,队列中所有作业的运行时间即为对应队列的等待时间TQi;
完成时间计算模块,用于计算各队列的等待时间TQi与作业在各队列下的运行时间TRi之和,即为该作业的完成时间TTi,并进行输出显示。
依据各队列中作业列表,给出每个队列的等待时间TQi,待分配作业的预计运行时间TRi相加,得到待分配作业在每个队列的作业完成时间TTi。最后,依据作业完成时间TTi最短原则,将待分配作业分配到预计完成时间最短的队列q中,并将此作业队列下的预计运行时间TRi=q和TTi=q标记到此作业上。
本发明的目的是解决高性能计算公有云/私有云集群上CAE作业运行时间的不可预测以及因此产生的资源利用率低下的问题而提出的利用机器学习算法估计计算作业运行时间的预测方法。此方法可部署到拥有几百乃至数千个节点的高性能计算共用云/私有云HPC系统,提高作业调度系统负载均衡功能的性能,提高用户使用体验和HPC资源利用率。
显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,均在本发明的保护范围之内。
Claims (8)
1.一种基于高性能计算集群HPC的CAE作业运行时间预测方法,其特征在于,所述方法具体包括如下步骤:
S1、对接收的作业进行标识;
S2、基于特征属性序列Pi预测作业在不同队列下的运行时间TRi,每个队列对应于高性能计算集群HPC中的一个主机;
S3、预估该作业在不同队列下的完成时间TTi,将该作业分配至完成时间TTi最早的队列,并输出该作业的预估完成时间。
2.如权利要求1所述基于高性能计算集群HPC的CAE作业运行时间预测方法,其特征在于,业务在不同队列下的运行时间TRi的获取方法具体如下:
S21、提取作业中的指定特征属性序列Pi;
S22、将特征属性序列Pi输入对应队列的作业运行时间回归函数,输出该作业在不同队列的运行时间TRi;
作业运行时间回归函数TR表示具体如下:
TR=Feature_1*Coef_1+Feature_2*Coef_2+…+Feature_n*Coef_n+Coef_0
其中,Feature_0、…、Feature_n表示作业的n个特征属性,Coef_0、…、Coef_n分别表示n个特征属性的回归函数系数。
3.如权利要求2所述基于高性能计算集群HPC的CAE作业运行时间预测方法,其特征在于,回归函数系数的获取方法具体如下:
基于数据库中的作业信息构建机器学习训练数据集;
经机器学习算法训练后,得到各特征属性的回归函数系数Coef_0、…、Coef_n。
4.如权利要求1所述基于高性能计算集群HPC的CAE作业运行时间预测方法,其特征在于,作业在不同队列下的完成时间TTi的计算方法具体如下:
S31、计算各队列中已存在作业的运行时间,队列中所有作业的运行时间即为对应队列的等待时间TQi;
S32、计算各队列的等待时间TQi与作业在各队列下的运行时间TRi之和,即为该作业的完成时间TTi。
5.一种基于高性能计算集群HPC的CAE作业运行时间预测装置,其特征在于,所述装置包括:
作业接收单元,用于对接收的作业进行标识;
运行时间预估单元,基于特征属性序列Pi预测作业在不同队列下的运行时间TRi;
完成时间预估单元,用于预估该作业在不同队列下的完成时间TTi,将该作业分至配完成时间TTi最早的队列,并输出该作业的预估完成时间TTi。
6.如权利要求5所述基于高性能计算集群HPC的CAE作业运行时间预测装置,其特征在于,运行时间预估单元包括:
属性提取模块,用于提取作业中的指定特征属性序列Pi;
回归预测模块,用于将特征属性序列Pi输入对应队列的作业运行时间回归函数,输出该作业在不同队列的运行时间TRi;
作业运行时间回归函数TR表示具体如下:
TR=Feature_1*Coef_1+Feature_2*Coef_2+…+Feature_n*Coef_n+Coef_0
其中,Feature_0、…、Feature_n表示作业的n个特征属性,Coef_0、…、Coef_n分别表示n个特征属性的回归函数系数。
7.如权利要求6所述基于高性能计算集群HPC的CAE作业运行时间预测装置,其特征在于,回归预测模块包括:
训练集子模块,基于数据库中的作业信息构建机器学习训练数据集;
回归系数生成子模块,经机器学习算法训练后,得到各特征属性的回归函数系数Coef_0、…、Coef_n。
8.如权利要求5所述基于高性能计算集群HPC的CAE作业运行时间预测装置,其特征在于,完成时间预估单元包括:
等待时间计算模块,用于计算各队列中已存在作业的运行时间,队列中所有作业的运行时间即为对应队列的等待时间TQi;
完成时间计算模块,用于计算各队列的等待时间TQi与作业在在各队列下的运行时间TRi之和,即为该作业的完成时间TTi,并进行输出显示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011458906.XA CN112463341A (zh) | 2020-12-11 | 2020-12-11 | 基于高性能计算集群hpc的cae作业运行时间预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011458906.XA CN112463341A (zh) | 2020-12-11 | 2020-12-11 | 基于高性能计算集群hpc的cae作业运行时间预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112463341A true CN112463341A (zh) | 2021-03-09 |
Family
ID=74802911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011458906.XA Pending CN112463341A (zh) | 2020-12-11 | 2020-12-11 | 基于高性能计算集群hpc的cae作业运行时间预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112463341A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111338791A (zh) * | 2020-02-12 | 2020-06-26 | 平安科技(深圳)有限公司 | 集群队列资源的调度方法、装置、设备及存储介质 |
US20200334089A1 (en) * | 2019-04-18 | 2020-10-22 | Oracle International Corporation | System and method for determining an amount of virtual machines for use with extract, transform, load (etl) processes |
CN111861012A (zh) * | 2020-07-23 | 2020-10-30 | 西安奥卡云数据科技有限公司 | 一种测试任务执行时间预测方法及最优执行节点选择方法 |
-
2020
- 2020-12-11 CN CN202011458906.XA patent/CN112463341A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200334089A1 (en) * | 2019-04-18 | 2020-10-22 | Oracle International Corporation | System and method for determining an amount of virtual machines for use with extract, transform, load (etl) processes |
CN111338791A (zh) * | 2020-02-12 | 2020-06-26 | 平安科技(深圳)有限公司 | 集群队列资源的调度方法、装置、设备及存储介质 |
CN111861012A (zh) * | 2020-07-23 | 2020-10-30 | 西安奥卡云数据科技有限公司 | 一种测试任务执行时间预测方法及最优执行节点选择方法 |
Non-Patent Citations (2)
Title |
---|
RATTAN PRIYA: "Predicting execution time of machine learning tasks using metalearning", 《2011 WORLD CONGRESS ON INFORMATION AND COMMUNICATION TECHNOLOGIES》 * |
姜海鸥: "混合云环境下资源调度与管理若干问题研究", 《中国优秀博硕士学位论文全文数据库(博士)信息科技辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107992359B (zh) | 一种云环境下代价感知的任务调度方法 | |
US9164785B2 (en) | Predicting performance of a consolidated virtualized computing environment | |
CN102667724B (zh) | 用于动态管理加速器资源的方法和系统 | |
CN109615411A (zh) | 基于算法模型的广告投放方法及装置、电子设备 | |
US20120266178A1 (en) | System Providing Resources Based on Licensing Contract with User by Correcting the Error Between Estimated Execution Time from the History of Job Execution | |
GB2475897A (en) | Resource allocation using estimated time to complete jobs in a grid or cloud computing environment | |
US20240036937A1 (en) | Workload placement for virtual gpu enabled systems | |
CN112416585B (zh) | 面向深度学习的gpu资源管理与智能化调度方法 | |
CN112579273B (zh) | 任务调度方法及装置、计算机可读存储介质 | |
CN110314381B (zh) | 任务处理方法及装置、计算机可读介质和电子设备 | |
US20080221857A1 (en) | Method and apparatus for simulating the workload of a compute farm | |
US11294719B2 (en) | Generating metrics for quantifying computing resource usage based on cost and utilization of virtualized services and optimizing performance through virtualized service migration | |
CN112181664A (zh) | 负载均衡方法及装置、计算机可读存储介质及电子设备 | |
KR20140097815A (ko) | 자원 할당 방법 및 그 장치 | |
CN112463341A (zh) | 基于高性能计算集群hpc的cae作业运行时间预测方法及装置 | |
Nurmi et al. | Varq: virtual advance reservations for queues | |
Watanabe et al. | Expected-credibility-based job scheduling for reliable volunteer computing | |
US7937356B2 (en) | Apparatus, and associated method, for assessing viability of communication system arrangement transformation | |
Tanash | Improving HPC system performance by predicting job resources for submitted jobs using machine learning techniques | |
Liu et al. | Sailfish: A Dependency-Aware and Resource Efficient Scheduling for Low Latency in Clouds | |
Anagnostopoulosa et al. | Timing issues and experiment scheduling in faster-than-real-time simulation | |
Nandwal et al. | Optimizing of resource allocation in cloud computing with advanced load balancing algorithm | |
JAIN et al. | SORTED BURST TIME AVERAGE ROUND-ROBIN ALGORITHM (SBTARRA) | |
Tapkire et al. | Parallel data processing in the cloud using nephele | |
Happe et al. | Performance evaluation of scheduling policies in symmetric multiprocessing environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210309 |
|
RJ01 | Rejection of invention patent application after publication |