CN108446180A - 一种基于数据迁移的数据中心动态任务调度方法 - Google Patents

一种基于数据迁移的数据中心动态任务调度方法 Download PDF

Info

Publication number
CN108446180A
CN108446180A CN201810246487.XA CN201810246487A CN108446180A CN 108446180 A CN108446180 A CN 108446180A CN 201810246487 A CN201810246487 A CN 201810246487A CN 108446180 A CN108446180 A CN 108446180A
Authority
CN
China
Prior art keywords
task
server
data
scheduling
data block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810246487.XA
Other languages
English (en)
Inventor
李鑫
汪良媛
秦小麟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201810246487.XA priority Critical patent/CN108446180A/zh
Publication of CN108446180A publication Critical patent/CN108446180A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于数据迁移的数据中心动态任务调度方法,其中在进行任务调度时,对于有空闲节点但是队列中没有可以满足本地执行的任务之情形,采用时间短的调度策略。以及,对于没有空闲节点但是队列中有任务在等待调度之情形,通过找到负载最小的节点,判断是否启用数据迁移来调度任务。本发明提供的方法除了进一步改进任务的调度策略之外,还通过改变数据块的部署位置来提高数据本地性。由于是从数据块的部署情况做出改进,所以不会影响任务调度的公平性。在任务执行过程中,根据任务进度和节点的负载情况,动态调整数据块的部署位置,可以进一步提高数据本地性,从而减少整个系统的任务执行时间,提高效率。

Description

一种基于数据迁移的数据中心动态任务调度方法
技术领域
本发明涉及一种动态任务调度方法,特别涉及一种基于数据迁移的数据中心动态任务调度方法。
背景技术
任务调度是分布式计算系统中非常重要的研究问题之一。对于大型的分布式系统,高效的任务调度机制既可以提高吞吐量,缩短任务的响应时间,又能够充分利用系统资源,减少能源消耗,从而带来更多的利润。Hadoop(由Apache基金会所开发的分布式系统基础架构)中的FIFO调度策略将任务按照到达时间排序,依次调度执行。这种方法实现机制简单,开销小,且易于理解。但当任务数不断增加时,FIFO很容易延长系统整体的响应时间,导致低效率。因此人们从很多方面着手研究如何提升分布式系统处理任务的性能。在共享系统中,影响系统性能的因素有很多,主要包括数据本地性、容错机制以及系统资源的共享和感知等等。任务的数据本地性在提升系统性能上占有十分重要的地位。所谓数据本地性,简单来说是指任务和任务执行所需要的数据在同一个节点,这样在执行任务的过程中所需要的数据就可以直接从本节点获取而不需要经过网络传输从别的节点获得,所以任务可以很快的执行结束。这样既提高了系统的执行效率,又减轻了系统的网络负担,因此在分布式计算系统中,我们总是尽可能希望提高任务的数据本地性。
为了提高任务的数据本地性,人们研究出了延迟调度算法。在一个繁忙的系统上,如果一个进程请求某个节点,那么极有可能此时该节点正在被其他进程占用。显而易见的处理是,立刻放宽本地性需求,在同一机架中分配一个节点。然而,通过实践发现,此时如果等待一小段时间(不超过几秒),能够戏剧性的增加在所请求的节点上分配到资源的机会,从而可以提高系统的效率。这个特性称之为延迟调度。延迟调度可以极大地提高任务的数据本地性,但为了保证公平性,任务等待的时间不能过长,因此该方法还需要权衡公平性和数据本地性之间的矛盾。目前,许多调度算法都支持延迟调度,但是这些算法在改进数据本地性时,都只单方面考虑了任务分配的问题,忽略了另一个非常重要的因素,即数据部署。
FIFO(First Input First Output,先入先出队列)由于严格按照到达顺序来执行任务,完全不考虑任务是否能够本地执行,当任务队列中任务数较多时,很容易出现系统响应时间增长、资源利用率低下、系统吞吐量下降等问题。引入延迟调度虽然可以提高任务的数据本地性,但是如果让某个任务长时间等待具有所需数据的节点,会降低调度的公平性,造成某些或某类任务迟迟得不到响应的情况。如果追求公平性,整个队列中所有任务执行的时间又会被延长,系统的性能难以提升。因此延迟调度在权衡二者之间的矛盾时,对于数据本地性的改进有限。
发明内容
本发明的主要目的在于提供一种基于数据迁移的数据中心动态任务调度方法,以克服现有技术中的不足。
为实现前述发明目的,本发明采用的技术方案包括:
本发明实施例提供了一种基于数据迁移的数据中心动态任务调度方法,其包括:
Ⅰ、设定任务队列,其中有多个任务排队等待执行;以及,设定系统,其中包含有多个作为节点的服务器和多个不同数据块,其中每一数据块在系统中存在多个副本,每一服务器有多个存储空间,该多个存储空间分别用以存储多个数据块副本;
Ⅱ、以服务器处理任务,其中每一任务要得到执行,均需要服务器中的相应的一个输入数据块,在任务执行时,若任务运行的服务器与所需输入数据所在的服务器是同一个服务器,则认为该任务是在本地执行,而若任务运行的服务器与所需输入数据所在的服务器不是同一个服务器,则认为该任务是在远程执行;
Ⅲ、将时间划分为时间片,从0开始;
Ⅳ、进行任务调度,包括如下步骤:
(1)时间片从0开始,每个时间片都要检查服务器的状态,如果存在空闲的服务器,转入步骤(2),如果没有则转入步骤(3);
(2)将队列中的任务按照优先级进行排序,依次调度;
(3)若系统中没有空闲服务器,但队列中有任务在等待执行,则选择第一个待调度的任务,此时按下如下方法判断是否启用数据迁移,包括:
(3-1)找到系统中负载最小即可最快结束任务变为空闲状态的服务器,如果该服务器上没有部署当前待调度的任务所需的数据,转入步骤(3-2),否则不进行任何操作,进入下一时间片;
(3-2)比较如下两个时间,即:任务等待服务器转为空闲状态的时间,以及,将任务所需数据块迁移到该服务器上的时间;如果前者>后者,则启用数据迁移,否则转入步骤(3-3);(3-3)比较如下两个时间,即:任务先等待服务器变为空闲状态,再在该服务器上远程执行的总时间;以及,先将任务所需数据迁移到该服务器上,再本地执行的总时间;如果前者>后者,则启用数据迁移,否则不进行任何操作,进入下一时间片。
进一步地,步骤(2)具体包括:
(2-1)找出所有可在空闲服务器上本地执行的任务,再按照到达顺序排序,依次调度,重复该步骤,直到没有空闲服务器或队列中没有可本地执行的任务;
(2-2)如果队列中没有可在空闲服务器上本地执行的任务,将任务按照到达顺序排序,选择第一个任务,比较如下两个时间:立即在当前空闲服务器上远程执行的时间,以及,延迟调度,先等待有所需数据的服务器空闲,再本地执行的总时间;如果前者<后者,则立即调度当前任务到空闲服务器上远程执行,重复该步骤直到没有空闲服务器;如果所有任务都要延迟调度,则当前时间片不进行任何操作,进入下一时间片;
进一步地,所述的动态任务调度方法还包括如下步骤:
Ⅴ、进行数据迁移,包括:
(i)对于数据迁移的目的服务器,若该服务器上有数据块的存储空间,则直接将任务所需的数据部署在该服务器上,否则,转入步骤(ii);
(ii)若目的服务器上没有足够的数据存储空间,找到该服务器上被任务访问次数最少且在系统中至少存在两个副本的数据块,用所需数据块替换该数据块,如果没有合适的可替换的数据块,那么放弃数据迁移,不进行任何操作。
进一步地,在步骤Ⅱ中,每一服务器每次能够处理多个任务,每个任务所需的数据块不唯一。进一步地,在步骤(3)中,若系统中没有空闲服务器,但队列中有任务在等待执行,则按照FIFO策略选择第一个待调度的任务,再判断是否启用数据迁移。
进一步地,在步骤Ⅴ中,若确定启用数据迁移,则限制服务器上数据块的替换,以保证被替换的数据块在被替换之后,系统中至少还存在一个数据副本。
与现有技术相比,本发明提供的一种基于数据迁移的数据中心动态任务调度方法除了进一步改进任务的调度策略之外,还通过改变数据块的部署位置来提高数据本地性。由于是从数据块的部署情况做出改进,所以不会影响任务调度的公平性。在任务执行的过程中,根据任务进度和节点的负载情况,动态调整数据块的部署位置,进一步提高数据本地性,从而减少整个系统的任务执行时间,提高效率。
附图说明
图1是本发明一典型实施例中任务、数据与服务器的关系模型图。
图2是本发明一典型实施例中一种基于数据迁移的数据中心动态任务调度方法的方法流程图。
具体实施方式
如下将结合附图及若干实施例对本发明的技术方案作详细说明,如下实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
在本发明的说明书中,相关术语的释义如下:
分布式计算:把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机(服务器)进行处理,最后把这些计算结果综合起来得到最终的结果。
任务调度:当系统中有多个任务等待执行时,由于计算资源有限,为了尽可能提高资源利用率和任务处理效率,需要合理的将任务分配给不同的节点(服务器)去执行,即安排好每个任务在什么时间、哪个节点上运行。
数据本地性:当一个任务被分配到一个节点上执行时,如果该节点已经被部署了该任务所需的数据,此时任务只需要本地读取数据,无需通过网络传输从另一个节点传输数据,那么就称该任务是本地执行的,具有数据本地性。
数据迁移:一个数据块从一个节点传输部署到另一个节点上称为数据迁移。
本发明的如下实施例提供了一种基于数据迁移的数据中心动态任务调度方法,或者,可以认为,该方法是一种通过改变数据块的部署位置来提高数据本地性的任务调度方法。简要的讲,该方法可以包括进行准备工作、进行任务调度,以及进行数据迁移等步骤。
具体而言,请参阅图1-图2所示,本发明实施例的动态任务调度方法可以包含如下过程:
一、准备工作:
假设在任务队列中有X个任务在排队等待执行,系统中有Y个服务器(节点),K个不同数据块,每个数据块默认情况下在系统中存在3个副本(默认3个,数量可变),每个服务器有M个存储空间可以存储M个数据块副本。实际情况下,每台服务器每次可以处理多个任务,每个任务所需的数据块也并不唯一。在本实施例中,为简化问题描述,假设每个服务器每次只能处理一个任务,每个任务要执行的话都需要服务器中的一个输入数据块,将时间划分为时间片,从0开始。
任务执行有两种情况:
(1)任务运行的服务器与所需输入数据所在的服务器是同一个服务器,此时该任务称为本地任务;
(2)任务运行的服务器与所需输入数据所在的服务器不是同一个服务器,此时,该任务称为远程任务。
远程任务在运行时需要将自己所需的输入数据从一台服务器传递到另一台服务器,这明显会比本地运行的任务要耗费更多的时间,并且会加大系统的网络负载,因此我们需要找到一种合适的数据部署和任务调度方式,可以让更多的任务本地执行,尽可能避免远程执行。
二、任务调度,包括如下步骤:
(1)时间片从0开始,每个时间片都要检查服务器的状态,如果存在空闲的服务器,转入步骤(2),如果没有则转入步骤(3);
(2)将队列中的任务按照优先级进行排序,依次调度,具体方法包括:
(2-1)找出所有可在空闲服务器上本地执行的任务,再按照到达顺序排序,依次调度,重复该步骤,直到没有空闲服务器或队列中没有可本地执行的任务。
(2-2)如果队列中没有可在空闲服务器上本地执行的任务,将任务按照到达顺序排序,选择第一个任务,比较两个时间:立即在当前空闲服务器上远程执行的时间,以及延迟调度,先等待有所需数据的服务器空闲,再本地执行的总时间。如果远程执行时间<(等待时间+本地执行时间),则立即调度当前任务到空闲服务器上远程执行,重复该步骤直到没有空闲服务器。如果所有任务都要延迟调度,那么当前时间不进行任何操作,进入下一时间片;
(3)系统中没有空闲服务器,但队列中有任务在等待执行,按照FIFO策略选择任务来选择第一个待调度的任务,此时需要判断是都启用数据迁移,具体方法为:
(3-1)找到系统中负载最小即可最快结束任务变为空闲状态的服务器,如果该服务器上没有部署当前待调度的任务所需的数据,转入步骤(3-2),否则不进行任何操作,进入下一时间片;
(3-2)比较任务等待服务器转为空闲状态的时间和把任务所需数据块迁移到该服务器上的时间,如果等待时间>数据迁移时间,则启用数据迁移,否则转入步骤(3-3);
(3-3)比较任务先等待服务器变为空闲状态,再在该服务器上远程执行的总时间,以及先将任务所需数据迁移到该服务器上,再本地执行的总时间,如果(等待时间+远程执行时间)>(数据迁移时间+本地执行时间),则启用数据迁移,否则不进行任何操作,进入下一时间片。三、数据迁移,包括如下步骤:
(1)对于数据迁移的目的服务器,如果该服务器上还有数据块的存储空间,那么直接将任务所需的数据部署在该服务器上,否则,转入步骤(2);
(2)目的服务器上没有足够的数据存储空间,找到该服务器上被任务访问次数最少且在系统中至少存在两个副本的数据块,用所需数据块替换该数据块。如果没有合适的可替换的数据块,那么放弃数据迁移,不进行任何操作。
可以看到,一方面,本发明实施例的方法由于是从数据部署的角度出发,结合具体的调度策略,所以可以保证任务调度的公平性。另一方面,本发明实施例的方法在调度任务的同时,允许改变节点上的数据部署情况来提高数据本地性。而在现有技术中,若想要提高数据本地性,主要研究的还是如何更加合理的调度任务,使得更多的任务可以在具有本地数据的节点上执行。这种情况下,人们默认节点上的数据块一经部署便无法移动。所以相较于现有技术,本发明实施例的方法可以进一步提高数据本地性,从而减少所有任务的执行时间,提高效率,同时还可以保证较好的公平性。
需要说明的是,本发明所揭示的乃较佳实施例的多种,凡是局部的变更或修饰而源于本发明的技术思想而为熟习该项技术的人所易于推知的,俱不脱离本发明的专利权范围。

Claims (6)

1.一种基于数据迁移的数据中心动态任务调度方法,其特征在于包括:
Ⅰ、设定任务队列,其中有多个任务排队等待执行;以及,设定系统,其中包含有多个作为节点的服务器和多个不同数据块,其中每一数据块在系统中存在多个副本,每一服务器有多个存储空间,该多个存储空间分别用以存储多个数据块副本;
Ⅱ、以服务器处理任务,其中每一任务要得到执行,均需要服务器中的相应的一个输入数据块,在任务执行时,若任务运行的服务器与所需输入数据所在的服务器是同一个服务器,则认为该任务是在本地执行,而若任务运行的服务器与所需输入数据所在的服务器不是同一个服务器,则认为该任务是在远程执行;
Ⅲ、将时间划分为时间片,从0开始;
Ⅳ、进行任务调度,包括如下步骤:
(1)时间片从0开始,每个时间片都要检查服务器的状态,如果存在空闲的服务器,转入步骤(2),如果没有则转入步骤(3);
(2)将队列中的任务按照优先级进行排序,依次调度;
(3)若系统中没有空闲服务器,但队列中有任务在等待执行,则选择第一个待调度的任务,此时按下如下方法判断是否启用数据迁移,包括:
(3-1)找到系统中负载最小即可最快结束任务变为空闲状态的服务器,如果该服务器上没有部署当前待调度的任务所需的数据,转入步骤(3-2),否则不进行任何操作,进入下一时间片;
(3-2)比较如下两个时间,即:任务等待服务器转为空闲状态的时间,以及,将任务所需数据块迁移到该服务器上的时间;如果前者>后者,则启用数据迁移,否则转入步骤(3-3);
(3-3)比较如下两个时间,即:任务先等待服务器变为空闲状态,再在该服务器上远程执行的总时间;以及,先将任务所需数据迁移到该服务器上,再本地执行的总时间;如果前者>后者,则启用数据迁移,否则不进行任何操作,进入下一时间片。
2.如权利要求1所述的基于数据迁移的数据中心动态任务调度方法,其特征在于,步骤(2)具体包括:
(2-1)找出所有可在空闲服务器上本地执行的任务,再按照到达顺序排序,依次调度,重复该步骤,直到没有空闲服务器或队列中没有可本地执行的任务;
(2-2)如果队列中没有可在空闲服务器上本地执行的任务,将任务按照到达顺序排序,选择第一个任务,比较如下两个时间:立即在当前空闲服务器上远程执行的时间,以及,延迟调度,先等待有所需数据的服务器空闲,再本地执行的总时间;如果前者<后者,则立即调度当前任务到空闲服务器上远程执行,重复该步骤直到没有空闲服务器;如果所有任务都要延迟调度,则当前时间片不进行任何操作,进入下一时间片。
3.如权利要求1所述的基于数据迁移的数据中心动态任务调度方法,其特征在于还包括如下步骤:
Ⅴ、进行数据迁移,包括:
(i)对于数据迁移的目的服务器,若该服务器上有数据块的存储空间,则直接将任务所需的数据部署在该服务器上,否则,转入步骤(ii);
(ii)若目的服务器上没有足够的数据存储空间,找到该服务器上被任务访问次数最少且在系统中至少存在两个副本的数据块,用所需数据块替换该数据块,如果没有合适的可替换的数据块,那么放弃数据迁移,不进行任何操作。
4.如权利要求1所述的基于数据迁移的数据中心动态任务调度方法,其特征在于:在步骤Ⅱ中,每一服务器每次能够处理多个任务,每个任务所需的数据块不唯一。
5.如权利要求1所述的基于数据迁移的数据中心动态任务调度方法,其特征在于:在步骤(3)中,若系统中没有空闲服务器,但队列中有任务在等待执行,则按照FIFO策略选择第一个待调度的任务,再判断是否启用数据迁移。
6.如权利要求3所述的基于数据迁移的数据中心动态任务调度方法,其特征在于:在步骤Ⅴ中,若确定启用数据迁移,则限制服务器上数据块的替换,以保证被替换的数据块在被替换之后,系统中至少还存在一个数据副本。
CN201810246487.XA 2018-03-23 2018-03-23 一种基于数据迁移的数据中心动态任务调度方法 Withdrawn CN108446180A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810246487.XA CN108446180A (zh) 2018-03-23 2018-03-23 一种基于数据迁移的数据中心动态任务调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810246487.XA CN108446180A (zh) 2018-03-23 2018-03-23 一种基于数据迁移的数据中心动态任务调度方法

Publications (1)

Publication Number Publication Date
CN108446180A true CN108446180A (zh) 2018-08-24

Family

ID=63196880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810246487.XA Withdrawn CN108446180A (zh) 2018-03-23 2018-03-23 一种基于数据迁移的数据中心动态任务调度方法

Country Status (1)

Country Link
CN (1) CN108446180A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109542600A (zh) * 2018-11-15 2019-03-29 口碑(上海)信息技术有限公司 分布式任务调度系统及方法
CN109766171A (zh) * 2018-12-06 2019-05-17 斑马网络技术有限公司 任务处理方法、装置、设备以及存储介质
CN110245127A (zh) * 2019-06-12 2019-09-17 成都九洲电子信息系统股份有限公司 一种基于流程控制的数据迁移方法
CN110348681A (zh) * 2019-06-04 2019-10-18 国网浙江省电力有限公司衢州供电公司 一种电力cps动态负荷分配方法
CN112291367A (zh) * 2020-11-17 2021-01-29 珠海大横琴科技发展有限公司 一种数据处理的方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017032262A1 (zh) * 2015-08-27 2017-03-02 阿里巴巴集团控股有限公司 一种数据迁移方法及设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017032262A1 (zh) * 2015-08-27 2017-03-02 阿里巴巴集团控股有限公司 一种数据迁移方法及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李鑫 等: "数据中心基于迁移的在线CPSCN大数据分析", 《IEEE》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109542600A (zh) * 2018-11-15 2019-03-29 口碑(上海)信息技术有限公司 分布式任务调度系统及方法
CN109542600B (zh) * 2018-11-15 2020-12-25 口碑(上海)信息技术有限公司 分布式任务调度系统及方法
CN109766171A (zh) * 2018-12-06 2019-05-17 斑马网络技术有限公司 任务处理方法、装置、设备以及存储介质
CN109766171B (zh) * 2018-12-06 2021-03-30 斑马网络技术有限公司 任务处理方法、装置、设备以及存储介质
CN110348681A (zh) * 2019-06-04 2019-10-18 国网浙江省电力有限公司衢州供电公司 一种电力cps动态负荷分配方法
CN110348681B (zh) * 2019-06-04 2022-02-18 国网浙江省电力有限公司衢州供电公司 一种电力cps动态负荷分配方法
CN110245127A (zh) * 2019-06-12 2019-09-17 成都九洲电子信息系统股份有限公司 一种基于流程控制的数据迁移方法
CN112291367A (zh) * 2020-11-17 2021-01-29 珠海大横琴科技发展有限公司 一种数据处理的方法和装置
CN112291367B (zh) * 2020-11-17 2022-06-10 珠海大横琴科技发展有限公司 一种数据处理的方法和装置

Similar Documents

Publication Publication Date Title
CN108446180A (zh) 一种基于数据迁移的数据中心动态任务调度方法
CN105487930B (zh) 一种基于Hadoop的任务优化调度方法
US9442760B2 (en) Job scheduling using expected server performance information
Bicer et al. Time and cost sensitive data-intensive computing on hybrid clouds
Liu et al. Task scheduling with precedence and placement constraints for resource utilization improvement in multi-user MEC environment
CN108762896A (zh) 一种基于Hadoop集群任务调度方法及计算机设备
CN114138486A (zh) 面向云边异构环境的容器化微服务编排方法、系统及介质
CN101366012A (zh) 用于多处理器系统中的中断分配的方法和系统
CN104199739B (zh) 一种基于负载均衡的推测式Hadoop调度方法
CN111026519B (zh) 基于分布式的任务优先级调度方法和系统及存储介质
CN101833439B (zh) 基于分合思想的并行计算硬件结构
US10037225B2 (en) Method and system for scheduling computing
US7539995B2 (en) Method and apparatus for managing an event processing system
CN108509280A (zh) 一种基于推送模型的分布式计算集群本地性调度方法
US20140115601A1 (en) Data processing method and data processing system
CN115237586A (zh) 深度学习推理性能干扰感知的gpu资源配置方法
CN107589993A (zh) 一种基于linux实时操作系统的动态优先级调度算法
CN114691372A (zh) 一种多媒体端边云系统的群体智能控制方法
Li et al. A network-aware scheduler in data-parallel clusters for high performance
CN102184124B (zh) 任务调度方法及系统
CN112181498A (zh) 并发控制方法、装置和设备
CN116360922A (zh) 集群资源调度方法、装置、计算机设备和存储介质
CN113946430B (zh) 一种作业调度方法、计算设备及存储介质
US8918555B1 (en) Adaptive and prioritized replication scheduling in storage clusters
Fu et al. Optimizing data locality by executor allocation in spark computing environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20180824

WW01 Invention patent application withdrawn after publication