CN109343939A - 一种分布式集群及并行计算任务调度方法 - Google Patents
一种分布式集群及并行计算任务调度方法 Download PDFInfo
- Publication number
- CN109343939A CN109343939A CN201810858396.1A CN201810858396A CN109343939A CN 109343939 A CN109343939 A CN 109343939A CN 201810858396 A CN201810858396 A CN 201810858396A CN 109343939 A CN109343939 A CN 109343939A
- Authority
- CN
- China
- Prior art keywords
- task
- subtask
- engine
- machine
- assigned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Abstract
本发明涉及一种分布式集群及并行计算任务调度方法,将待处理的任务进行分解,并对分解的子任务分配到多个任务机上执行,当已经完成的子任务数量与所有子任务数量的占比达到设定比值时,将剩余没有完成的子任务进行再分解,将分解得到的次级子任务分配到其他空闲的任务机上执行。本发明利用集群空闲资源对进度滞后的子任务进行同步计算,提高了任务运行的可靠性,加快了计算任务的运行速度,同时缩短了任务的执行时间。
Description
技术领域
本发明属于分布式系统并行计算任务调度技术领域,具体涉及一种分布式集群及并行计算任务调度方法。
背景技术
近年来,以大数据、云计算、物联网和移动互联网为代表的新一代信息技术蓬勃发展,而支撑这些信息技术发展的任务机(即服务器)规模也越来越庞大。并且随着信息技术应用领域的不断扩展,不同的任务机经常需要同时执行用户的多个应用(即任务)。因此如何高效、合理地对这些跨任务机执行的应用的服务关系进行管理、维护和调度,就成为迫切需要解决的问题。
随着信息技术的发展,针对海量数据的复杂计算任务,垂直升级任务机的配置已经不能满足任务的运行需要,水平扩展任务机集群已被公认是解决问题的最佳办法,但多任务机执行任务,调度的复杂度成倍增加,在现有的分布式系统中任务调度(尤其是分布式内存计算领域)就存在以下问题:
第一,对于每个任务(Task),客户端向分布式系统提交请求时,分布式系统会随机选择一台任务机启动一个针对该任务的管理模块(App master),负责任务的分配与执行状态的监控,但在大型分布式集群中,单台任务机出现故障的概率比较高,而现有的做法是在App master故障一段时间后,分布式系统针对该任务再重新启动一个App master,监控整个任务的运行情况,但从旧App master故障发生到新的App master启动成功,历时时间较长,大型复杂的任务计算实时性无法保证;
第二,对于大型且复杂的任务,可以拆分成多个子任务并发运行,子任务运行过程中会通过心跳向任务管理模块汇报任务状态,但由于任务机自身配置等原因,有些子任务的执行速度过于缓慢,以至于拖延了整个任务的完成时间,进而降低了整个分布式系统对外提供服务的性能。
例如,一篇公布号为CN106874094A、名称为“定时任务处理方法、装置及计算设备”的中国专利就存在上述问题。
发明内容
本发明的目的是提供一种分布式集群及并行计算任务调度方法,用于解决现有分布式系统并行任务的调度和执行效率慢的问题。
为解决上述技术问题,本发明提出一种基于分布式系统的并行计算任务调度方法,包括以下方法方案:
方法方案一,包括如下步骤:
1)根据接收的任务请求,将任务分解成两个以上的子任务,将各子任务分配到各任务机上;
2)实时监测各子任务的完成进度,当已经完成的子任务数量占所有子任务数量的比值达到设定的比值时,将剩余未完成的每个子任务分解成两个以上的次级子任务,将各次级子任务分配到空闲的任务机上。
方法方案二,在方法方案一的基础上,各次级子任务分配到空闲的任务机上进行运算的同时,保持所述剩余未完成的子任务在原来的任务机上继续进行运算,选择最先输出的运行结果作为最终的运行结果。
方法方案三,在方法方案一的基础上,还包括根据接收的任务请求选择第一任务机的步骤,第一任务机用于将任务分解成两个以上的子任务,并将各子任务分配到各任务机上,以及用于监视各任务机执行子任务的进度。
方法方案四,在方法方案三的基础上,包括根据接收的任务请求选择第二任务机的步骤,第二任务机用于在第一任务机工作异常时代替第一任务机工作。
方法方案五,在方法方案四的基础上,所述第一任务机和第二任务机分别设在分布式系统的不同任务机架上。
为解决上述技术问题,本发明还提出一种分布式集群,包括以下集群方案:
集群方案一,包括三个以上的任务机,所述任务机中的一个作为第一任务机,用于将任务分解成两个以上的子任务,将各子任务分配到其他各任务机上,并实时监测子任务的完成进度,当已经完成的子任务数量占所有子任务数量的比值达到设定的比值时,将剩余未完成的每个子任务分解成两个以上的次级子任务,将各次级子任务分配到空闲的任务机上。
集群方案二,在集群方案一的基础上,各次级子任务分配到空闲的任务机上进行运算的同时,保持所述剩余未完成的子任务在原来的任务机上继续进行运算,选择最先输出的运行结果作为最终的运行结果。
集群方案三,在集群方案一的基础上,排除所述第一任务机的剩余任务机中的一个作为第二任务机,用于第一任务机工作异常时代替第一任务机工作。
集群方案四,在集群方案三的基础上,所述第一任务机和第二任务机分别设在分布式系统的不同任务机架上。
本发明的有益效果是:
本发明将待处理的任务进行分解,并对分解的子任务分配到多个任务机上执行,当已经完成的子任务数量与所有子任务数量的占比达到设定比值时,将剩余没有完成的子任务进行再分解,将分解得到的次级子任务分配到其他空闲的任务机上执行。本发明利用集群空闲资源对进度滞后的子任务进行同步计算,提高了任务运行的可靠性,加快了计算任务的运行速度,同时缩短了任务的执行时间。
进一步,在各次级子任务分配到空闲的任务机上进行运算的同时,保持次级子任务分解前的子任务在原来任务机上的运算,并选择最先输出的运行结果作为最终的运行结果,保证子任务在最短的时间内完成。
进一步,再选取一个任务机,一共选取两个任务机分别担任主任务机和备用任务机,第一任务机作为主任务机,第二任务机作为备用任务机,主任务机在正常工作时承担分派子任务、次级子任务的工作,同时监视子任务的完成进度,在主任务机异常时,由备用任务机代替主任务机完成上述工作,有效的提高了分布式计算任务的可靠性和成功率。
进一步,在分布式系统的不同任务机架上选取上述主任务机和备用任务机,进一步提高分布式计算任务的可靠性和成功率,减少了因为任务失败而导致的资源浪费,优化了分布式集群的计算效率。
附图说明
图1是具有两个任务的主、备任务管理模块的分布式系统任务框图,其中一个任务的主、备任务管理模块分别为Active App Master1和Standby App Master1,另一个任务的主、备任务管理模块分别为Active App Master2和Standby App Master2;
图2是本发明一种任务的具体执行流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的说明。
实施例一:
本发明基于分布式系统,提出了以下并行计算任务的调度方法:
根据接收的任务请求,将待处理的任务分解成两个以上的子任务,并将各子任务分配到各任务机上。同时,实时监测子任务的完成进度,当已经完成的子任务数量占所有子任务数量的比值达到设定的比值时,将剩余未完成的子任务进行再分解,至少分解成两个次级子任务,将各次级子任务分配到空闲的任务机上。本发明利用集群空闲资源对进度滞后的子任务进行同步计算,提高了任务运行的可靠性,加快了计算任务的运行速度,同时缩短了任务的执行时间。
上述各次级子任务分配到空闲的任务机上进行运算的同时,保持剩余未完成的子任务在原来的任务机上继续进行运算,在剩余未完成的子任务的运算结果和所述各次级子任务的运算结果之中,选择最先输出的运行结果作为最终的运行结果,保证子任务在最短的时间内完成。
本发明子任务的分解和监视工作是通过选取第一任务机并由第一任务机承担上述工作的,为了提高了分布式计算任务的可靠性和成功率,作为第一任务机的备用,还需选取第二任务机作为备用任务机,而第一任务机作为主任务机,主任务机在正常工作时承担分派子任务、次级子任务的工作,同时监视子任务的完成进度,在主任务机异常时,由备用任务机代替主任务机完成上述工作。优选的,主任务机的正常工作状态包括主任务机能够周期上传各子任务的完成进度,主任务机主要异常可以表述为主管理模块失联(断网或断电),因为主备任务管理模块是实时通信的,当主管理模块失联时,即主任务机异常时,备用任务机及时接管主任务机的工作,监控子任务执行。
本发明在分布式系统的不同任务机架上选取上述主任务机和备用任务机,进一步提高分布式计算任务的可靠性和成功率,减少了因为任务失败而导致的资源浪费,优化了分布式集群的计算效率。
基于上述方法,本发明还提供了一种分布式集群,包括三个以上的任务机,任务机中的一个作为第一任务机,用于将任务分解成两个以上的子任务,将各子任务分配到其他各任务机上,并实时监测子任务的完成进度,当已经完成的子任务数量占所有子任务数量的比值达到设定的比值时,将剩余未完成的每个子任务分解成两个以上的次级子任务,将各次级子任务分配到空闲的任务机上。
同样,为了提高了分布式计算任务的可靠性和成功率,排除第一任务机的剩余任务机中的一个作为第二任务机,用于第一任务机工作异常时代替第一任务机工作,作为第一任务机的备用任务机。
本实施例的第一任务机和第二任务机除了担任分解任务、监视子任务完成进度的工作外,还能给自己分配子任务的运算工作。
实施例二:
如图1所示,本发明所采用的系统包括分布在不同机架上的若干任务机、分布式系统资源管理器、若干客户端机器。下面对各个组成部分进行详细描述:
1、Client(客户端)
Client是用户提交任务到分布式集群的客户端,采用普通的PC机即可,用户可以通过Client向分布式系统发送任务请求。
2、分布式系统资源管理器
分布式系统资源管理器用于整个分布式系统资源的统筹管理,同时为用户提交的任务分配相应的资源。其中,整个分布式系统资源包括CPU、内存、网络、磁盘IO等。
3、分布式集群
分布式集群由分散于若干机架上的任务机组成,每台任务机分配出一定的资源供资源管理器调用,并在运行过程中负责具体任务的执行。
下面结合任务执行的具体流程阐述一下发明内容的实现步骤:
分布式系统资源管理器首先接受用户从Client发送的任务提交请求,并响应任务请求然后回复给Client,同时为任务选择两个不同机架上的任务机分别启动针对该任务的主、备管理模块,然后由主管理模块(Active App master)向分布式系统资源管理器申请运行该任务所需的各种资源,主管理模块获取到资源后在具体的任务机上执行各个子任务,并监控各个子任务的工作状态,同时周期性地向分布式系统资源管理器汇报资源使用情况和任务执行进度,一旦主管理模块汇报超时(超时时间可自定义),分布式系统资源管理器立即通知备管理模块(Standby App master)切换为主管理模块,同时告知最近一次该任务的资源使用情况以及任务执行进度,然后,新的主管理模块继续监控完成该任务剩下的工作,直至整个任务运行结束。
分布式内存在计算任务时,会将任务分解成若干个子任务,然后分配到各个任务机上执行,在子任务运行过程中,各子任务时刻向主管理模块汇报自己的运行状态,各子任务完成速度快慢不同。若主管理模块监控到子任务的完成比例数达到80%时,自动将未完成的子任务重新拆分成若干次级子任务,重新分配到其他资源空闲的节点,并保持原来子任务继续运行,若原来的子任务完成时间早,则采用原来子任务的结果,否则采用次级子任务运算的结果,从而提高整个任务的执行速度,如图2所示。
本发明在用户向分布式系统提交计算任务时,由分布式系统资源管理器随机选取一台任务机,运行监控该任务具体执行情况的主管理模块,同时优先选取不同机架上的另一台任务机运行备管理模块,主、备管理模块分别与分布式系统资源管理器通信,在主管理模块出现故障时,备管理模块能够快速切换为主管理模块,继续执行未完成的任务,确保及时完成分布式系统计算任务。
本发明在分布式系统执行计算任务时,会将任务分解为若干子任务,然后分配到各任务机上并发执行,并由该任务的主管理模块监控各个子任务的执行情况,当监控到子任务完成数目达到一定比例时,针对剩余未完成的子任务,主管理模块自动将这些未完成的子任务拆分成次级子任务,然后分配到其他资源使用率较低的任务机上执行,同时保持原来的子任务继续运行,以先计算出的结果为准,从而缩短整个任务的执行时间。
综上所述,本发明针对现有分布式系统中任务调度存在的问题,通过在不同机架选取任务机作为主备任务管理器,有效的提高了分布式计算任务的可靠性和成功率,减少了因为任务失败而导致的资源浪费,优化了分布式集群的计算效率;利用集群空闲资源对进度滞后的子任务进行同步计算,提高了任务运行的可靠性,加快了计算任务的运行速度,同时缩短了任务的执行时间,这对于分布式系统处理任务的性能提升具有重要意义。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (9)
1.一种基于分布式系统的并行计算任务调度方法,其特征在于,包括以下步骤:
1)根据接收的任务请求,将任务分解成两个以上的子任务,将各子任务分配到各任务机上;
2)实时监测各子任务的完成进度,当已经完成的子任务数量占所有子任务数量的比值达到设定的比值时,将剩余未完成的每个子任务分解成两个以上的次级子任务,将各次级子任务分配到空闲的任务机上。
2.根据权利要求1所述的基于分布式系统的并行计算任务调度方法,其特征在于,各次级子任务分配到空闲的任务机上进行运算的同时,保持所述剩余未完成的子任务在原来的任务机上继续进行运算,选择最先输出的运行结果作为最终的运行结果。
3.根据权利要求1所述的基于分布式系统的并行计算任务调度方法,其特征在于,还包括根据接收的任务请求选择第一任务机的步骤,第一任务机用于将任务分解成两个以上的子任务,并将各子任务分配到各任务机上,以及用于监视各任务机执行子任务的进度。
4.根据权利要求3所述的基于分布式系统的并行计算任务调度方法,其特征在于,包括根据接收的任务请求选择第二任务机的步骤,第二任务机用于在第一任务机工作异常时代替第一任务机工作。
5.根据权利要求4所述的基于分布式系统的并行计算任务调度方法,其特征在于,所述第一任务机和第二任务机分别设在分布式系统的不同任务机架上。
6.一种分布式集群,包括三个以上的任务机,其特征在于,所述任务机中的一个作为第一任务机,用于将任务分解成两个以上的子任务,将各子任务分配到其他各任务机上,并实时监测子任务的完成进度,当已经完成的子任务数量占所有子任务数量的比值达到设定的比值时,将剩余未完成的每个子任务分解成两个以上的次级子任务,将各次级子任务分配到空闲的任务机上。
7.根据权利要求6所述的分布式集群,其特征在于,各次级子任务分配到空闲的任务机上进行运算的同时,保持所述剩余未完成的子任务在原来的任务机上继续进行运算,选择最先输出的运行结果作为最终的运行结果。
8.根据权利要求6所述的分布式集群,其特征在于,排除所述第一任务机的剩余任务机中的一个作为第二任务机,用于第一任务机工作异常时代替第一任务机工作。
9.根据权利要求8所述的分布式集群,其特征在于,所述第一任务机和第二任务机分别设在分布式系统的不同任务机架上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810858396.1A CN109343939B (zh) | 2018-07-31 | 2018-07-31 | 一种分布式集群及并行计算任务调度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810858396.1A CN109343939B (zh) | 2018-07-31 | 2018-07-31 | 一种分布式集群及并行计算任务调度方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109343939A true CN109343939A (zh) | 2019-02-15 |
CN109343939B CN109343939B (zh) | 2022-01-07 |
Family
ID=65291437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810858396.1A Active CN109343939B (zh) | 2018-07-31 | 2018-07-31 | 一种分布式集群及并行计算任务调度方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109343939B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110113387A (zh) * | 2019-04-17 | 2019-08-09 | 深圳前海微众银行股份有限公司 | 一种基于分布式批量处理系统的处理方法、装置及系统 |
CN110147278A (zh) * | 2019-04-08 | 2019-08-20 | 西安万像电子科技有限公司 | 数据处理方法及装置 |
CN111818159A (zh) * | 2020-07-08 | 2020-10-23 | 腾讯科技(深圳)有限公司 | 数据处理节点的管理方法、装置、设备及存储介质 |
CN113570220A (zh) * | 2021-07-14 | 2021-10-29 | 深圳市创茶网络科技有限公司 | 任务管理方法、装置、计算机设备和存储介质 |
CN113590277A (zh) * | 2021-06-25 | 2021-11-02 | 北京旷视科技有限公司 | 任务状态切换方法、装置和电子系统 |
CN113806052A (zh) * | 2021-09-24 | 2021-12-17 | 四川新网银行股份有限公司 | 一种去中心化的分布式定时任务处理方法 |
CN115514624A (zh) * | 2022-09-21 | 2022-12-23 | 中国农业银行股份有限公司 | 监控方法、装置、电子设备及存储介质 |
US11568019B2 (en) | 2020-07-06 | 2023-01-31 | Grokit Data, Inc. | Automation system and method |
CN116069480A (zh) * | 2023-04-06 | 2023-05-05 | 杭州登临瀚海科技有限公司 | 一种处理器及计算设备 |
US12124334B2 (en) | 2020-07-08 | 2024-10-22 | Tencent Technology (Shenzhen) Company Limited | Methods and devices for failovers in processing nodes for collaborative computing |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103049330A (zh) * | 2012-12-05 | 2013-04-17 | 大连理工大学 | 一种托管型分布式任务调度方法和系统 |
CN103870591A (zh) * | 2014-03-28 | 2014-06-18 | 武汉聪源科技有限责任公司 | 用于针对空间数据进行并行空间分析服务的方法及系统 |
CN103873321A (zh) * | 2014-03-05 | 2014-06-18 | 国家电网公司 | 基于分布式文件系统的仿真分布式并行计算平台及方法 |
CN104794194A (zh) * | 2015-04-17 | 2015-07-22 | 同济大学 | 一种面向大规模多媒体检索的分布式异构并行计算系统 |
-
2018
- 2018-07-31 CN CN201810858396.1A patent/CN109343939B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103049330A (zh) * | 2012-12-05 | 2013-04-17 | 大连理工大学 | 一种托管型分布式任务调度方法和系统 |
CN103873321A (zh) * | 2014-03-05 | 2014-06-18 | 国家电网公司 | 基于分布式文件系统的仿真分布式并行计算平台及方法 |
CN103870591A (zh) * | 2014-03-28 | 2014-06-18 | 武汉聪源科技有限责任公司 | 用于针对空间数据进行并行空间分析服务的方法及系统 |
CN104794194A (zh) * | 2015-04-17 | 2015-07-22 | 同济大学 | 一种面向大规模多媒体检索的分布式异构并行计算系统 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147278A (zh) * | 2019-04-08 | 2019-08-20 | 西安万像电子科技有限公司 | 数据处理方法及装置 |
CN110113387A (zh) * | 2019-04-17 | 2019-08-09 | 深圳前海微众银行股份有限公司 | 一种基于分布式批量处理系统的处理方法、装置及系统 |
US11860967B2 (en) | 2020-07-06 | 2024-01-02 | The Iremedy Healthcare Companies, Inc. | Automation system and method |
US11983236B2 (en) | 2020-07-06 | 2024-05-14 | The Iremedy Healthcare Companies, Inc. | Automation system and method |
US11568019B2 (en) | 2020-07-06 | 2023-01-31 | Grokit Data, Inc. | Automation system and method |
US11580190B2 (en) | 2020-07-06 | 2023-02-14 | Grokit Data, Inc. | Automation system and method |
US11640440B2 (en) | 2020-07-06 | 2023-05-02 | Grokit Data, Inc. | Automation system and method |
CN111818159A (zh) * | 2020-07-08 | 2020-10-23 | 腾讯科技(深圳)有限公司 | 数据处理节点的管理方法、装置、设备及存储介质 |
US12124334B2 (en) | 2020-07-08 | 2024-10-22 | Tencent Technology (Shenzhen) Company Limited | Methods and devices for failovers in processing nodes for collaborative computing |
CN111818159B (zh) * | 2020-07-08 | 2024-04-05 | 腾讯科技(深圳)有限公司 | 数据处理节点的管理方法、装置、设备及存储介质 |
CN113590277A (zh) * | 2021-06-25 | 2021-11-02 | 北京旷视科技有限公司 | 任务状态切换方法、装置和电子系统 |
CN113570220B (zh) * | 2021-07-14 | 2024-01-12 | 深圳市创茶网络科技有限公司 | 任务管理方法、装置、计算机设备和存储介质 |
CN113570220A (zh) * | 2021-07-14 | 2021-10-29 | 深圳市创茶网络科技有限公司 | 任务管理方法、装置、计算机设备和存储介质 |
CN113806052B (zh) * | 2021-09-24 | 2023-06-06 | 四川新网银行股份有限公司 | 一种去中心化的分布式定时任务处理方法 |
CN113806052A (zh) * | 2021-09-24 | 2021-12-17 | 四川新网银行股份有限公司 | 一种去中心化的分布式定时任务处理方法 |
CN115514624A (zh) * | 2022-09-21 | 2022-12-23 | 中国农业银行股份有限公司 | 监控方法、装置、电子设备及存储介质 |
CN115514624B (zh) * | 2022-09-21 | 2024-04-30 | 中国农业银行股份有限公司 | 监控方法、装置、电子设备及存储介质 |
CN116069480B (zh) * | 2023-04-06 | 2023-06-13 | 杭州登临瀚海科技有限公司 | 一种处理器及计算设备 |
CN116069480A (zh) * | 2023-04-06 | 2023-05-05 | 杭州登临瀚海科技有限公司 | 一种处理器及计算设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109343939B (zh) | 2022-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109343939A (zh) | 一种分布式集群及并行计算任务调度方法 | |
CN106844198B (zh) | 一种分布式调度自动化测试平台及方法 | |
CN107959705B (zh) | 流式计算任务的分配方法和控制服务器 | |
CN111221632B (zh) | 分布式并行任务调度方法、装置、计算机设备和存储介质 | |
CN109412874B (zh) | 设备资源的配置方法、装置、服务器及存储介质 | |
CN109857558A (zh) | 一种数据流处理方法及系统 | |
US20160048415A1 (en) | Systems and Methods for Auto-Scaling a Big Data System | |
CN106209482A (zh) | 一种数据中心监控方法及系统 | |
CN110888719A (zh) | 一种基于web服务的分布式任务调度系统及方法 | |
Jonathan et al. | WASP: Wide-area adaptive stream processing | |
CN111459641B (zh) | 一种跨机房的任务调度和任务处理的方法及装置 | |
CN112437129B (zh) | 集群的管理方法及集群的管理装置 | |
CN111160873A (zh) | 基于分布式架构的跑批处理装置及方法 | |
CN111064672A (zh) | 云平台通信系统、选举方法及资源调度管理方法 | |
CN114389955A (zh) | 嵌入式平台异构资源池化管理方法 | |
CN111767145A (zh) | 容器调度系统、方法、装置和设备 | |
CN112948077A (zh) | 批处理方法、装置、设备及存储介质 | |
CN114064199A (zh) | 一种集群容量管理方法及系统 | |
CN106452899B (zh) | 一种分布式数据挖掘系统及方法 | |
Zhou et al. | AHPA: adaptive horizontal pod autoscaling systems on alibaba cloud container service for kubernetes | |
CN104320433A (zh) | 数据处理方法和分布式数据处理系统 | |
CN111064586B (zh) | 一种分布式并行计费方法 | |
CN112527469B (zh) | 一种云计算服务器的容错组合方法 | |
CN107948001B (zh) | 一种船舶制造车间工业网络智能监控系统及方法 | |
CN113515356B (zh) | 一种轻量级分布式资源管理与任务调度器及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |