CN109947532B - 一种教育云平台中的大数据任务调度方法 - Google Patents

一种教育云平台中的大数据任务调度方法 Download PDF

Info

Publication number
CN109947532B
CN109947532B CN201910154286.1A CN201910154286A CN109947532B CN 109947532 B CN109947532 B CN 109947532B CN 201910154286 A CN201910154286 A CN 201910154286A CN 109947532 B CN109947532 B CN 109947532B
Authority
CN
China
Prior art keywords
task
big data
resources
resource
tasks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910154286.1A
Other languages
English (en)
Other versions
CN109947532A (zh
Inventor
温木奇
谢明森
黄国燕
万海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Vinzor Information Technology Co ltd
Sun Yat Sen University
Original Assignee
Guangzhou Vinzor Information Technology Co ltd
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Vinzor Information Technology Co ltd, Sun Yat Sen University filed Critical Guangzhou Vinzor Information Technology Co ltd
Priority to CN201910154286.1A priority Critical patent/CN109947532B/zh
Publication of CN109947532A publication Critical patent/CN109947532A/zh
Application granted granted Critical
Publication of CN109947532B publication Critical patent/CN109947532B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明为教育云平台中的大数据任务调度方法,根据云平台总体资源、核心大数据处理任务优先级及其资源需求量、预期任务运行时间进行任务调度;若任务请求不是大数据任务,直接调度任务;若是核心任务则预测系统资源及运行时间;根据各项任务参数在数据库中添加相应的任务实例;根据调度方法将任务添加到任务队列中,获取运行优先级最高的任务;当云平台资源满足任务资源需求时按需分配资源,若当前使用资源未超过最大可用资源将任务分发到相应受培训者的大数据集群中;否则重新添加到任务队列中。能防止过多用户同时通过其已获得分配的虚拟机集群高并发运行大数据任务,从而支持机构利用有限物理机资源为每个受培训者提供有效的大数据实验环境。

Description

一种教育云平台中的大数据任务调度方法
技术领域
本发明涉及云计算与大数据技术领域,具体涉及一种教育云平台中的大数据任务调度方法。
背景技术
云计算环境下,物理机中所有虚拟机对于物理资源的使用总量一般都少于物理资源的总量。为了提高物理资源的利用率,在构建虚拟资源池(包括计算、存储、网络等资源)时,资源通常会超配(物理机中所有虚拟机的vCPU或/和内存资源总量超过了物理机本身的资源限制)。
随着云计算的快速发展,很多高校、培训机构及企事业单位的培训部门(统称培训单位)都建立了教育云平台,以对不同的实验课程提供支持。为支持受培训者进行大数据教学实验,云平台需要为每个受培训者配置独立的大数据集群(虚拟机集群)来进行大数据分析实验。较低配置(如8G内存、8vCPU、20G硬盘)的大数据集群(虚拟机集群)计算能力有限,只能用于在小数据集上进行实验;而较高配置(如640G内存、128vCPU、8T硬盘)的大数据集群(虚拟机集群)需要较多的物理机资源。为了能够给每个受培训者提供较高配置的大数据集群,突破培训单位的物理机资源有限的问题,培训单位需要使用较高的资源超配比来构建虚拟资源池支持实验。
在大数据分析实验课程中,受培训者大部分时间都在编程、查资料、写文档等,虚拟机在这段时间使用物理资源量低;受培训者只在少数时间提交并运行大数据任务。大数据任务运行时,虚拟机集群对于物理资源的使用量很高。考虑到受培训者的实验进度差不多,过多需要运行较长时间的大数据任务可能在差不多时间提交并运行,造成在物理资源超配较高的情况下,过多的大数据任务并发运行在不同的大数据集群(虚拟机集群)中,导致物理机集群负载过大,用户体验差。为了防止过多的大数据任务并发运行在不同的大数据集群(虚拟机集群)中,需要设计一种不同于标准云平台任务调度的大数据任务调度方法,对受培训者提交的任务进行合理调度,在较少总体资源,资源超正常超配的情况下,适当调度减少并发大数据任务,确保良好用户体验。
现有大数据任务调度方法无法对教育云平台中所有受培训者的大数据任务进行合理调度:现有大数据任务调度方法通常直接利用云平台的工作调度机制,不能对多个大数据虚拟集群的大数据任务进行统一调度,或者仅仅根据大数据任务运行数量以及预设阈值进行任务调度,容易导致资源的使用率在一些时段很低,但在另外一些时段超高。
因而,需要一种新的大数据任务调度方法,实现对教育云平台中所有受培训者的大数据任务进行合理统一调度。这种调度方法应该根据云平台的总体资源、任务优先级、预期任务的资源需求量以及运行时间进行任务调度,防止过多用户同时通过其已获得分配的超高超配大数据集群(虚拟机集群)运行高并发的资源密集型的大数据任务,从而支持培训单位利用较为有限的物理机资源为每个受培训者提供有效的大数据实验环境。
发明内容
本发明提供了一种教育云平台中的大数据任务调度方法,用于解决现有大数据任务调度方法无法对教育云平台中所有受培训者的大数据任务进行合理调度的问题,能防止过多用户同时通过其已获得分配的虚拟机集群高并发运行资源密集型的大数据任务,从而支持高校、培训机构、企事业单位等培训机构利用有限物理机资源为每个受培训者提供有效的大数据实验环境。
为了解决上述问题,本发明采用如下技术方案:一种教育云平台中的大数据任务调度方法,大数据任务调度方法运行在基于云计算技术的教育云平台,根据云平台的总体资源、核心大数据处理任务优先级及其资源需求量、预期任务运行时间进行任务调度;所述任务调度步骤包括:
1)受培训者提交任务;
2)系统自动拦截任务请求,并判断任务是否为大数据任务;若不是大数据任务,系统直接调度任务;否则,进入下一步骤;
3)判断任务是否为教师建议的核心任务,若是核心任务,则预测核心任务需要的系统资源及运行时间;否则,将任务的运行优先级设为最低;
4)根据任务代码、数据源、任务名称、任务运行参数,在数据库中添加相应的任务实例;
5)根据调度方法将任务添加到任务队列中;
6)根据调度方法从任务队列中获取运行优先级最高的任务;
7)当云平台的资源满足任务的资源需求时,进入下一步骤;否则,将任务重新添加到任务队列中;
8)按任务的资源需求分配资源后,如果用户当前使用的资源没有超过用户最大可用资源时,将任务分发到相应受培训者的大数据集群中;否则,将任务重新添加到任务队列中。
优选地,对于每个实验,受培训者通过系统设定以下任一种调度方法,以完成调度任务过程:
a)先到先服务调度算法:在满足任务资源需求的情况下,先提交的任务先运行;
b)高优先级优先调度算法:在满足任务资源需求的情况下,优先级高的任务先运行;
c)最快完成优先调度算法:在满足任务资源需求的情况下,根据任务预测运行时间,能够最快完成的任务优先运行;
d)最低资源需求得分优先调度算法;
e)资源需求得分与运行时间积最小优先调度算法:在各分项资源均满足的任务中,选取任务资源需求得分与运行时间积最小的任务先运行;
如果系统没有设定调度算法,缺省调度算法为e)。
优选地,最低资源需求得分优先调度算法d)中,任务j的资源需求得分为:
Sj=k1Cj+k2Mj+k3Ij+k4Dj
其中Cj表示任务j需要的计算能力;Mj表示任务j需要的内存;Ij表示任务j需要的中间结果存储空间;Dj表示任务j需要的磁盘空间;k1、k2、k3、k4的取值保证k1Cj、k2Mj、k3Ij、k4Dj的值均在0-1之间;在各分项资源均满足的任务中,选取得分最少的任务先运行。
优选地,所述核心任务需要的系统资源以及运行时间的预测,采用以下算法实现:
S31:教师试运行实验的核心任务,系统记录每个核心任务所需的系统资源及运行时间;
S32:受培训者运行实验时,如果其运行的核心任务j匹配教师建议的核心任务,则任务j在第i次运行需要的资源和运行时间分别为Rj(i-1)和Tj(i-1);如果任务j在第i次成功运行且云平台检测到任务j所需系统资源为rji、运行时间为tji,则将任务j的预测资源需求量及运行时间分别更新为:
Rj(i)=aRj(i-1)+(1-a)rji
Tj(i)=bTj(i-1)+(1-b)tji
其中Rj(i)和Tj(i)分别表示核心任务j在第i次运行后的预测资源需求量与运行时间,Rj(0)和Tj(0)分别表示系统仅依据教师运行核心任务的历史信息预测任务j需要的系统资源以及运行时间;a和b均为取值在(0,1)区间的可预设的常量;如果任务j未能匹配教师建议的核心任务,则其运行需要的资源与运行时间未知,运行优先级为最低。
优选地,任务的运行优先级由其用户u已提交但未运行的任务数mu、任务所需资源及运行时间决定。在优选的实施例中,任务的运行优先级设置成K级别,任务j的运行优先级为:
Figure BDA0001982398120000041
其中mu<K,As<K;S0、T0、As、K均为可预设的常量,S0、T0分别表示任务的标准资源需求得分和标准运行时间;Sj、Tj分别表示任务j的资源需求得分和运行时间。
从以上技术方案可知,本发明针对大数据教学平台平均资源使用量低、峰值资源需求高的特点,提出一种基于逻辑隔离、资源超正常超配的调度方法,对高峰核心业务进行核心资源需求预测、任务排队与调度管理。在总资源有限的情况下,大数据教学平台能以较低成本支持受培训者高效完成大数据实验。与现有技术相比,本发明的技术方案取得了如下有益效果:
1、能够根据云平台的总体资源、任务优先级、任务的资源需求量以及预期运行时间进行任务调度,防止过多用户同时通过其已获得分配的超高超配大数据集群(虚拟机集群)运行资源密集型的大数据任务,从而支持培训单位利用较为有限的物理机资源为每个受培训者提供有效的大数据实验环境;
2、能够根据用户已提交但未运行的任务数、任务所需资源及运行时间设置任务的优先级,并根据任务优先级进行任务调度;
3、能够预测任务资源需求量并根据任务需求量进行任务调度,实现资源的合理分配;
4、支持不同的大数据任务调度方法,满足不同的调度需求。
附图说明
图1为本发明教育云平台的结构示意图;
图2本发明教育云平台中的大数据任务调度的时序图;
图3为本发明教育云平台中的大数据任务调度的流程图;
图4为资源有限的大数据实验云平台、资源充足的大数据实验云平台、普通云平台、本发明的云平台对比图。
具体实施方式
以下结合附图和具体实施例对本发明做进一步的阐述,但本发明的实施方式不限于此。
图1为本发明教育云平台的结构示意图。在具体的实施过程中,本发明的大数据任务调度方法运行在一个基于云计算技术的教育云平台,根据云平台的总体资源、核心大数据处理任务优先级及其资源需求量、预期任务运行时间进行任务调度。所述的教育云平台包括大数据实验教学管理系统,支持给每个受培训者按照教学大纲要求配置软硬件资源并构建大数据实验环境。大数据实验环境按需构建,依据课程要求、基于实验环境模板自动生成包括基于虚拟云桌面集群的分布式大数据处理运行硬件环境、系统软件环境和支持大数据处理的软件系统包。
在具体的实施过程中,所述大数据任务调度方法包括任务管理、任务调度、资源管理;大数据实验教学管理系统包括任务管理模块、资源管理模块和任务调度模块。任务管理模块负责管理受培训者的大数据任务,包括提交、删除、运行情况跟踪,同时负责预测任务的系统资源需求量以及运行时间;任务调度模块根据系统资源信息、任务的运行优先级、任务的系统资源需求量及预期运行时间安排任务运行;资源管理模块负责管理系统总体资源、实时可用资源及用户对资源的使用情况,为任务调度模块安排资源,完成用户提交的任务。
大数据任务是受培训者在运行大数据处理软件时,按软件系统提供标准接口,如命令行运行界面、IDE运行界面或者web页面,提交的作业。
图2为本发明教育云平台中的大数据任务调度的时序图。在具体的实施过程中,任务管理模块在用户通过大数据处理软件系统提供的标准接口提交任务后,自动拦截任务请求,并根据用户提交的任务代码、数据源、任务名称、任务运行参数等参数在数据库中添加相应的任务实例,然后再通过本发明调度方法的任务调度模块统一安排调度,在合适时间将任务提交给云平台的任务调度模块,按资源实际要求统一安排运行。
在具体的实施过程中,任务管理模块由大数据实验教学管理系统依据教学方案,提供一个受培训者完成每次实验的核心任务列表,并依据教师或者平台运行历史信息预测核心任务需要的系统资源以及运行时间。任务管理模块将核心任务列表保存在数据库中,不同核心任务需要不同的系统资源以及运行时间。如果用户提交的任务在核心任务列表中,则可以预测其所需资源及运行时间;否则,任务所需的资源及运行时间未知。系统资源包括计算能力、内存、中间结果存储、硬盘。
所述资源管理模块负责管理系统及每个用户的总资源、监控资源实时使用情况,处理资源的分配与回收。当任务运行时,空闲资源将减少;任务完成时,资源将返回资源池。在具体的实施过程中,云平台资源的实时监控通过在物理机集群中的每一台物理机中安装代理服务,代理服务负责定时获取物理机资源的信息并发送到资源管理模块,资源管理模块负责把资源信息保存到数据库中。
图3为本发明教育云平台中的大数据任务调度的流程图,在具体的实施过程中,如图3所示,任务调度步骤包括:
1)受培训者提交任务;
2)系统自动拦截任务请求,并判断任务是否为大数据任务。如果该任务不是大数据任务,系统直接调度任务;否则,进入下一步骤;
3)判断任务是否为教师建议的核心任务。如果任务是核心任务,则可以预测核心任务需要的系统资源及运行时间;否则,任务需要的系统资源及运行时间未知,将任务的运行优先级设为最低;
所述核心任务需要的系统资源以及运行时间的预测,采用以下算法实现:
S31:教师试运行实验的核心任务,系统记录每个核心任务所需的系统资源及运行时间;
S32:受培训者运行实验时,如果其运行的核心任务j能匹配教师建议的核心任务,则任务j在第i次运行需要的资源和运行时间分别为Rj(i-1)和Tj(i-1)。如果任务j在第i次成功运行且云平台检测到任务j所需系统资源为rji、运行时间为tji,则将任务j的预测资源需求量及运行时间分别更新为:
Rj(i)=aRj(i-1)+(1-a)rji
Tj(i)=bTj(i-1)+(1-b)tji
其中Rj(i)和Tj(i)分别表示核心任务j在第i次运行后的预测资源需求量与运行时间,Rj(0)和Tj(0)分别表示系统仅仅依据教师运行核心任务的历史信息预测任务j需要的系统资源以及运行时间;a和b均为取值在(0,1)区间的可预设的常量。如果任务j未能匹配教师建议的核心任务,则其运行需要的资源与运行时间未知,运行优先级为最低。
4)根据用户提交的任务代码、数据源、任务名称、任务运行参数等参数在数据库中添加相应的任务实例;
5)系统根据调度方法将任务添加到任务队列中;
6)系统根据调度方法从任务队列中获取运行优先级最高的任务;
在调度任务时,将依据任务的资源需求量、云平台的总体资源、用户当前使用的资源以及用户最大可用资源,按照系统设定的调度方法安排任务运行。在具体的实施过程中,任务调度模块通过任务控制器对任务进行控制。所述任务控制器有以下作用:
(1)分配任务的优先级;
(2)根据核心任务列表预测任务的资源需求量及运行时间;
(3)根据系统设定的调度方法维护特定的任务队列;
(4)从任务队列中获取任务,根据系统使用的调度方法安排任务运行。
在具体的实施过程中,对于不同的调度方法,任务控制器从任务队列中获取任务的规则以及任务控制器添加到任务队列的元素不同。对于每个实验,受培训者可通过系统设定以下任一种调度方法,以完成调度任务过程:
a)先到先服务调度算法:任务先进先出,在满足任务资源需求的情况下,先提交的任务先运行;添加到任务队列的任务元组包含任务实例ID、任务资源需求量;
b)高优先级优先调度算法:在满足任务资源需求的情况下,优先级高的任务先运行;高优先级任务会被任务控制器优先获取,添加到任务队列的任务元组包含任务实例ID、任务资源需求量、任务优先级;
任务的运行优先级由其用户u已提交但未运行的任务数mu、任务所需资源及运行时间决定。本实施例将大数据任务的优先级设置成K级别,一个任务产生后,系统会依据其用户u已提交但未运行的任务数mu、任务所需资源及运行时间设置优先级。任务j的运行优先级为:
Figure BDA0001982398120000071
其中mu<K,As<K;S0、T0、As、K均为可预设的常量,S0、T0分别表示任务的标准资源需求得分和标准运行时间;Sj、Tj分别表示任务j的资源需求得分和运行时间。任务的优先级数值越大,其优先级越低,0为最高优先级。
c)最快完成优先调度算法:在满足任务资源需求的情况下,根据任务预测运行时间,能够最快完成的任务优先运行;预期运行时间最短的任务会被任务控制器优先获取,添加到任务队列的任务元组包含任务实例ID、任务资源需求量、任务预期运行时间;
d)最低资源需求得分优先调度算法:资源需求得分最少的会被任务控制器优先获取,添加到任务队列的任务元组包含任务实例ID、任务资源需求量、资源需求得分;任务j的资源需求得分为:
Sj=k1Cj+k2Mj+k3Ij+k4Dj
其中Cj表示任务j需要的计算能力;Mj表示任务j需要的内存;Ij表示任务j需要的中间结果存储空间;Dj表示任务j需要的磁盘空间;k1、k2、k3、k4的取值保证k1Cj、k2Mj、k3Ij、k4Dj的值均在0-1之间。在各分项资源均满足的任务中,选取得分最少的任务先运行;
e)资源需求得分与运行时间积最小优先调度算法:在各分项资源均满足的任务中,选取任务资源需求得分与运行时间积最小的任务先运行。资源需求得分与运行时间积最小的任务会被任务控制器优先获取,添加到任务队列的任务元组包含任务实例ID、任务资源需求量、资源需求得分与运行时间积。如果系统没有设定调度算法,缺省调度算法为e)。
7)当云平台的资源满足任务的资源需求时,进入下一步骤;否则,任务控制器将任务重新添加到任务队列中;
8)当按任务的资源需求分配资源后,如果用户当前使用的资源没有超过用户最大可用资源时,系统将任务分发到相应受培训者的大数据集群(虚拟机集群)中;否则,任务控制器将任务重新添加到任务队列中。
在具体的实施过程中,当任务成功运行后,系统需要更新对应核心任务的预测资源需求量及运行时间。
如图4所示,大数据实验云平台资源需求高峰很高,资源需求大部分时候很低,运行大数据任务的时间比较集中;而普通云平台资源需求不高。对于资源有限的大数据实验云平台,大批量受培训者运行大数据任务的时候云平台负载很高。通过使用本发明的调度方法,资源有限的大数据实验云平台可以保持正常的负载,而且能够更快地完成受培训者提交的任务。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (7)

1.一种教育云平台中的大数据任务调度方法,其特征在于,大数据任务调度方法运行在基于云计算技术的教育云平台,根据云平台的总体资源、核心大数据处理任务优先级及其资源需求量、预期任务运行时间进行任务调度;所述任务调度步骤包括:
1)受培训者提交任务;
2)系统自动拦截任务请求,并判断任务是否为大数据任务;若不是大数据任务,系统直接调度任务;否则,进入下一步骤;
3)判断任务是否为教师建议的核心任务,若是核心任务,则预测核心任务需要的系统资源及运行时间;否则,将任务的运行优先级设为最低;
4)根据任务代码、数据源、任务名称、任务运行参数,在数据库中添加相应的任务实例;
5)根据调度方法将任务添加到任务队列中;
6)根据调度方法从任务队列中获取运行优先级最高的任务;
7)当云平台的资源满足任务的资源需求时,进入下一步骤;否则,将任务重新添加到任务队列中;
8)按任务的资源需求分配资源后,如果用户当前使用的资源没有超过用户最大可用资源时,将任务分发到相应受培训者的大数据集群中;否则,将任务重新添加到任务队列中;
所述核心任务需要的系统资源以及运行时间的预测,采用以下算法实现:
S31:教师试运行实验的核心任务,系统记录每个核心任务所需的系统资源及运行时间;
S32:受培训者运行实验时,如果其运行的核心任务j匹配教师建议的核心任务,则任务j在第i次运行需要的资源和运行时间分别为Rj(i-1)和Tj(i-1);如果任务j在第i次成功运行且云平台检测到任务j所需系统资源为rji、运行时间为tji,则将任务j的预测资源需求量及运行时间分别更新为:
Rj(i)=aRj(i-1)+(1-a)rji
Tj(i)=bTj(i-1)+(1-b)tji
其中Rj(i)和Tj(i)分别表示核心任务j在第i次运行后的预测资源需求量与运行时间,Rj(0)和Tj(0)分别表示系统仅依据教师运行核心任务的历史信息预测任务j需要的系统资源以及运行时间;a和b均为取值在(0,1)区间的可预设的常量;如果任务j未能匹配教师建议的核心任务,则其运行需要的资源与运行时间未知,运行优先级为最低。
2.根据权利要求1所述的大数据任务调度方法,其特征在于,对于每个实验,受培训者通过系统设定以下任一种调度方法,以完成调度任务过程:
a)先到先服务调度算法:在满足任务资源需求的情况下,先提交的任务先运行;
b)高优先级优先调度算法:在满足任务资源需求的情况下,优先级高的任务先运行;
c)最快完成优先调度算法:在满足任务资源需求的情况下,根据任务预测运行时间,能够最快完成的任务优先运行;
d)最低资源需求得分优先调度算法;
e)资源需求得分与运行时间积最小优先调度算法:在各分项资源均满足的任务中,选取任务资源需求得分与运行时间积最小的任务先运行;
如果系统没有设定调度算法,缺省调度算法为e)。
3.根据权利要求2所述的大数据任务调度方法,其特征在于,最低资源需求得分优先调度算法d)中,任务j的资源需求得分为:
Sj=k1Cj+k2Mj+k3Ij+k4Dj
其中Cj表示任务j需要的计算能力;Mj表示任务j需要的内存;Ij表示任务j需要的中间结果存储空间;Dj表示任务j需要的磁盘空间;k1、k2、k3、k4的取值保证k1Cj、k2Mj、k3Ij、k4Dj的值均在0-1之间;在各分项资源均满足的任务中,选取得分最少的任务先运行。
4.根据权利要求1所述的大数据任务调度方法,其特征在于,任务的运行优先级由其用户u已提交但未运行的任务数mu、任务所需资源及运行时间决定。
5.根据权利要求4所述的大数据任务调度方法,其特征在于,任务的运行优先级设置成K级别,任务j的运行优先级为:
Figure FDA0004141174010000021
其中mu<K,As<K;S0、T0、As、K均为可预设的常量,S0、T0分别表示任务的标准资源需求得分和标准运行时间;Sj、Tj分别表示任务j的资源需求得分和运行时间。
6.根据权利要求1所述的大数据任务调度方法,其特征在于,所述教育云平台包括大数据实验教学管理系统,支持给每个受培训者按照教学大纲要求配置软硬件资源并构建大数据实验环境;大数据实验环境按需构建,依据课程要求、基于实验环境模板自动生成包括基于虚拟云桌面集群的分布式大数据处理运行硬件环境、系统软件环境和支持大数据处理的软件系统包。
7.根据权利要求6所述的大数据任务调度方法,其特征在于,大数据实验教学管理系统包括任务管理模块、资源管理模块和任务调度模块;任务管理模块负责管理受培训者的大数据任务、预测任务的系统资源需求量以及运行时间;任务调度模块根据系统资源信息、任务的运行优先级、任务的系统资源需求量及预期运行时间安排任务运行;资源管理模块负责管理系统总体资源、实时可用资源及用户对资源的使用情况,为任务调度模块安排资源,完成用户提交的任务。
CN201910154286.1A 2019-03-01 2019-03-01 一种教育云平台中的大数据任务调度方法 Active CN109947532B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910154286.1A CN109947532B (zh) 2019-03-01 2019-03-01 一种教育云平台中的大数据任务调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910154286.1A CN109947532B (zh) 2019-03-01 2019-03-01 一种教育云平台中的大数据任务调度方法

Publications (2)

Publication Number Publication Date
CN109947532A CN109947532A (zh) 2019-06-28
CN109947532B true CN109947532B (zh) 2023-06-09

Family

ID=67007139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910154286.1A Active CN109947532B (zh) 2019-03-01 2019-03-01 一种教育云平台中的大数据任务调度方法

Country Status (1)

Country Link
CN (1) CN109947532B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110688222B (zh) * 2019-09-10 2024-06-21 平安证券股份有限公司 资源处理请求的排序方法、装置、介质及电子设备
US11469943B2 (en) 2019-12-06 2022-10-11 Red Hat, Inc. Pre-scheduling for cloud resource provisioning
CN111176848B (zh) * 2019-12-31 2023-05-26 北大方正集团有限公司 集群任务的处理方法、装置、设备和存储介质
CN111654416B (zh) * 2020-05-29 2021-12-24 北京智网信测科技有限公司 一种物联网测试云平台和方法
CN112650575B (zh) * 2021-01-15 2023-08-18 百度在线网络技术(北京)有限公司 资源调度方法、装置和云端服务系统
CN116991246A (zh) * 2023-09-27 2023-11-03 之江实验室 用于导览机器人的算法调度方法、装置及导览机器人系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336714A (zh) * 2013-06-20 2013-10-02 北京奇虎科技有限公司 一种作业调度方法和装置
CN107832153A (zh) * 2017-11-14 2018-03-23 北京科技大学 一种Hadoop集群资源自适应分配方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10552774B2 (en) * 2013-02-11 2020-02-04 Amazon Technologies, Inc. Cost-minimizing task scheduler
CN107045456B (zh) * 2016-02-05 2020-03-10 华为技术有限公司 一种资源分配方法及资源管理器
CN106293952B (zh) * 2016-07-11 2019-06-21 河南大学 一种基于任务需求与服务能力匹配的遥感任务调度方法
CN107608777A (zh) * 2017-09-15 2018-01-19 郑州云海信息技术有限公司 一种分布式环境中大数据处理任务的调度方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336714A (zh) * 2013-06-20 2013-10-02 北京奇虎科技有限公司 一种作业调度方法和装置
CN107832153A (zh) * 2017-11-14 2018-03-23 北京科技大学 一种Hadoop集群资源自适应分配方法

Also Published As

Publication number Publication date
CN109947532A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
CN109947532B (zh) 一种教育云平台中的大数据任务调度方法
US8332862B2 (en) Scheduling ready tasks by generating network flow graph using information receive from root task having affinities between ready task and computers for execution
US10871998B2 (en) Usage instrumented workload scheduling
CN107888669B (zh) 一种基于深度学习神经网络的大规模资源调度系统及方法
Ge et al. GA-based task scheduler for the cloud computing systems
Polo et al. Performance-driven task co-scheduling for mapreduce environments
CN104298550B (zh) 一种面向Hadoop的动态调度方法
Ben-Yehuda et al. Expert: Pareto-efficient task replication on grids and a cloud
Marahatta et al. PEFS: AI-driven prediction based energy-aware fault-tolerant scheduling scheme for cloud data center
US20220012089A1 (en) System for computational resource prediction and subsequent workload provisioning
CN111338791A (zh) 集群队列资源的调度方法、装置、设备及存储介质
Zhu et al. A cost-effective scheduling algorithm for scientific workflows in clouds
CN109857535B (zh) 面向Spark JDBC的任务优先级控制的实现方法及装置
US20090007132A1 (en) Managing processing resources in a distributed computing environment
US8539495B2 (en) Recording medium storing therein a dynamic job scheduling program, job scheduling apparatus, and job scheduling method
CN102937918A (zh) 一种hdfs运行时数据块平衡方法
Kaleeswaran et al. Dynamic scheduling of data using genetic algorithm in cloud computing
Yang et al. Multi-policy-aware MapReduce resource allocation and scheduling for smart computing cluster
Zhong et al. Speeding up Paulson’s procedure for large-scale problems using parallel computing
CN101971141A (zh) 用于管理混合计算环境的系统和方法
CN110084507B (zh) 云计算环境下分级感知的科学工作流调度优化方法
CN116610422A (zh) 一种任务调度方法、装置和系统
US11036549B2 (en) Parallel processing apparatus, and method of maintaining parallel processing apparatus
Marahatta et al. Energy-aware fault-tolerant scheduling scheme based on intelligent prediction model for cloud data center
WO2020062047A1 (zh) 更新调度规则的方法、设备、系统、存储介质和终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant