CN1306754C - 平衡网格计算环境中的工作负荷的方法和系统 - Google Patents

平衡网格计算环境中的工作负荷的方法和系统 Download PDF

Info

Publication number
CN1306754C
CN1306754C CNB2004100455145A CN200410045514A CN1306754C CN 1306754 C CN1306754 C CN 1306754C CN B2004100455145 A CNB2004100455145 A CN B2004100455145A CN 200410045514 A CN200410045514 A CN 200410045514A CN 1306754 C CN1306754 C CN 1306754C
Authority
CN
China
Prior art keywords
systems
information
scheduler
balance
computing environment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100455145A
Other languages
English (en)
Other versions
CN1581806A (zh
Inventor
J·F·斯科维拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1581806A publication Critical patent/CN1581806A/zh
Application granted granted Critical
Publication of CN1306754C publication Critical patent/CN1306754C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Multi Processors (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供了一种用于平衡网格计算环境中的工作负荷的方法和系统。一管理器守护程序从网格计算环境的多个系统的多个调度器中获取信息,并且应用这些信息平衡该环境中的工作负荷。这些信息包括空闲资源、等待的作业以及可能的其它信息的指示。

Description

平衡网格计算环境中的工作负荷的方法和系统
技术领域
本发明一般地涉及网格计算,更具体地涉及网格计算环境中的工作负荷管理。
背景技术
网格计算环境允许多个异类的和/或在地理上远离的系统间的互连。在一个例子中,为了方便系统间的互连,采用了位于纽约阿蒙克(Armonk)的国际商业机器公司所提供的Globus工具包。Globus使得用户能够指定所述多个系统中的哪个系统将运行作业。用户使用一种资源规范语言(Resource Specification Language,RSL)向选定系统提交作业。Globus收到这种RSL之后,将其转换成目标系统上的调度器所能识别的恰当格式。例如,如果调度器是国际商业机器公司所提供的LoadLeveler,那么该RSL将被转换成命令文件。
因为,或者说尽管,用户可以选择一个或多个系统运行他们的作业,网格计算环境的各系统可能会变得不平衡。例如,一个系统可能有过多的工作负荷,而另一个系统却可能有过少的工作负荷。因此,需要一种对网格计算环境中的工作负荷进行平衡的能力。并且需要一种用于对特定工作确定最佳配合的能力。
发明内容
通过提供一种网格计算环境中工作负荷平衡方法,本发明克服了以往技术的缺点并且具有其它优点。该方法包括,例如,获取关于网格计算环境的多个系统中一个或多个系统的信息;以及使用至少一部分所获取的信息来平衡所述所述多个系统中至少两个系统的工作负荷。
在这里,也对前面概述的方法所对应的系统及计算机程序产品进行了描述和声明。
通过本发明的技术还实现了其它的特性和优点。这里还对本发明的其它实施例和其它方面进行了详细描述,并且认为它们是所声明的本发明的一部分。
附图说明
本发明的主题在权利要求书中被具体指出并且被清楚声明。参照附图的以下详细描述,清晰描绘了本发明的以上和其它目的、特性和优点,其中:
图1示出了一种计算环境的实施例,该计算环境引入和采用了本发明的一个或多个方面;
图2示出了根据本发明的一个方面、与在图1的计算环境中平衡工作负荷相关联的逻辑的一个实施例;
图3示出了根据本发明的一个方面、关于工作负荷平衡逻辑的一个实施例的更具体的细节;以及
图4示出了根据本发明的一个方面、用于决定由该环境中的哪一个系统来运行一给定作业的逻辑的一个实施例。
具体实施方式
根据本发明的一个方面,在一网格计算环境中执行工作负荷平衡。在一个例子中,该网格计算环境的管理器守护程序(manager daemon)获取该环境中一个或者多个系统的信息,并且根据这些所获取的信息确定工作负荷在这些系统中的布置。工作负荷的布置可包括例如将作业从一个系统调换到另一个系统或者最初将作业布置到一特定系统等。举例来说,所述信息是从所述系统的调度器中获取的。
网格计算允许虚拟化分布式计算和数据资源,例如数据处理、网络带宽和存储能力,以便创建单个的系统映像,以准许用户和应用程序对海量信息技术(IT)能力的无缝访问。一个网格计算环境的各个系统经常是异类的系统。也就是说,所述环境的多个系统中至少一个系统包含与该环境的至少一个其它系统不同的硬件或者软件。此外或者可选择地,这些系统相互间可以是地理上相互远离的。关于网格计算的更多细节请参见例如网址www-1.ibm.com/grid/about_grid/what_is.shtml。
图1示出了一种计算环境的实施例,该计算环境引入和采用了本发明的一个或多个方面。网格计算环境100包括例如多个系统102。在这个特定例子中,描述了两个系统,系统A和系统B。但在其它例子中,计算环境可包含两个以上的系统。在一个例子中,系统A包含一个由位于纽约阿蒙克的国际商业机器公司所提供的具有多个RS/6000节点的可伸缩并行(Scalable Parallel,SP)机,而系统B包含一个也是由国际商业机器公司提供的LINUX群集。通过连接104,例如以太网连接或其它类型的连接,各系统102相互连接。
举例来讲,系统102包含一个调度器106用来调度该系统中的作业。一个调度器可以是多种类型的调度器中的一种,并且每个系统可具有相同或不同类型的调度器。例如,系统A中的调度器106包含有国际商业机器公司提供的LoadLeveler,而系统B中的调度器106包含有Altair GridTechnologies,LLC提供的Portable Batch System(PBS)。在2001年12月出版的、IBM出版号为SA22-7881-00的、V3R1、标题为“IBMLoadLeveler:Using and Administrating”(IBM Loadleveler:使用和管理)的IBM出版物中描述了LoadLeveler的一个例子,特此将该出版物作为参考全文引入本说明书。
在一个例子中,至少一个调度器进行回填调度(backfill scheduling)。回填调度允许一个应用程序乱序运行,只要其不影响已被调度运行的应用程序的开始时间。在2003年4月4日申请的、标题为“Backfill SchedulingOf Applications Based On Data of The Applications”(基于应用程序数据的应用程序回填调度)的美国专利申请No.10/406,985中描述了回填调度的一个例子,特此将该申请作为参考全文引入本说明书。
在一个例子中,由于网格计算环境中的各个系统是异类的,因此采用了由国际商业机器公司提供的称为Globus的工具包,以方便系统间的通信。这一工具包在各系统间创建了一个公共层。例如,对于一个启用了Globus的系统,作业的信息经由Globus,而Globus将其转换为一Globus格式,而后将该信息传给另一个Globus系统,并由它将该信息转换成一种该接收系统能够识别的格式。这使得具有一个或多个不同的操作系统、不同的中间件和/或不同的调度器的各个系统之间能够进行有效地通信。关于Globus的更多细节请参见例如2003年6月18日出版的、IBM出版号SG24-6936-00的、标题为“Enabling Applications for Grid Computing withGlobus”(具有Globus的网格计算的使能应用程序)的IBM出版物,特此将该出版物作为参考全文引入本说明书。
根据本发明的一个方面,在网格计算环境中的一个系统还包含一管理器守护程序108。所述管理器守护程序运行于后台,并负责平衡所述环境中至少一部分系统之间的工作负荷。所述管理器守护程序获取(例如,被提供、确定等)将被管理的多个系统的信息。这种信息包括例如这些系统的标识、联系这些系统的方式等。
管理器守护程序定期执行对网格计算环境中的工作负荷进行平衡的逻辑。在一个例子中,这种逻辑是以可配置的时间间隔执行的(例如,每5分钟执行一次)。作为另一个例子,这种逻辑的执行是基于事件的(例如,根据作业的启动和/或完成、可用系统资源的变化等)。参照图2-4描述了与平衡一网格计算环境中的工作负荷相关的逻辑的一实施例。
首先参看图2,所述管理器守护程序获取一个或多个系统的调度器信息(步骤200)。例如,管理器守护程序联系这些系统的调度器来获取所需的信息。这种信息包括,例如该系统当前的空闲节点、该系统的等待作业的作业队列、以及用于该系统的作业混合的当前状态的、调度器的特定变量设置,例如下一个等待作业的阴影时间(shadow time)(即,该作业需要等待资源多长时间)以及该阴影时间所保护的一个或多个资源。
根据所获取的信息,管理器守护程序执行工作负荷平衡(步骤202)。参照图3描述了关于工作负荷平衡的一个例子的进一步细节。首先,使用调度信息确定将由哪一个系统运行一给定的作业(步骤300)。在一个例子中,这包括确定一特定系统中哪一项等待作业可以在另一系统上运行。参照图4描述了进行这种确定所采用的逻辑的一个例子。在这里所描述的例子中,确定系统A中的一个或者多个作业是否可以转移到系统B中。但是本领域的技术人员明白的是,可使用类似的逻辑将作业转移到系统A或其它正在被管理的系统中。
参见图4,确定系统B中是否有任何空闲节点(查询400)。如果没有空闲节点,则该处理结束(步骤402)。但是,如果有一个或者多个空闲节点,就进一步确定系统A中是否有一个或多个等待的作业(查询404)。如果系统A中有等待的作业,就进一步确定该等待的作业是否适合于系统B(查询406)。如果该等待的作业适合于系统B,则在一个例子中,进一步确定这一作业是否可以回填(查询408)。如果这一作业适合该新的系统并且可以回填,那么这一作业就被放置于一传送列表中(步骤401)。否则就确定系统A中是否还有其它等待的作业(查询404)。如果没有,则该处理结束(步骤402)。
回到图3,除了确定由哪一个系统运行一给定的作业之外,工作负荷平衡还包括将所述作业放置于该系统中(步骤302)。在一个例子中,这包括将每一项作业(或者这些作业的一部分)从传送列表中转移到指定的一个(或多个)系统中。这包括,例如,将该作业在原系统(例如,系统A)中进行保持以防止启动被选定传送的该作业。这一作业然后被提交至新的系统中(例如,系统B)。如果转移成功,那么从第一个系统中将这一作业取消。通过使用保持而后转移的技术,可根据设计者的自行决定而提供进一步的错误校验功能。在一个例子中,在作业转移中使用了Globus所提供的命令。
以上详细描述的是与在一网格计算环境中采用管理器守护程序执行工作负荷平衡相关的逻辑的一实施例。以下是用于执行工作负荷平衡的伪码的一实施例:
Do forever{
#获得两个批系统的当前快照
访问系统A中的LoadLever以获得空闲节点A,阴影时间A,等待作业A
访问系统B中的LoadLever以获得空闲节点B,阴影时间B,等待作业B
清空A到B以及B到A的传送列表
#查找系统A中哪些等待的作业可以在系统B中运行
if(空闲节点B){#如果系统B中有空闲节点...
Foreach(等待作业A){#那么对于系统A中所有等待作业...
If(作业A的节点要求<=空闲节点B){#如果该作业适合在系统B
                                 中运行...
If(作业A Wallclock时间<=阴影时间B){#如果该作业可以回填...
    将作业A放入所述A到B的传送列表中
   }
  }
 }
}
#查找系统B中哪些等待的作业可以在系统A中运行
if(空闲节点A){#如果系统A中有空闲节点...
Foreach(等待作业B){#那么对于系统B中所有等待作业...
If(作业B的节点要求<=空闲节点A){#如果该作业适合在系统A
                                  中运行...
If(作业B Wallclock时间<=阴影时间A){#如果该作业可以回填...
    将作业B放入所述B到A的传送列表中
   }
     }
    }
  }
#将潜在的作业从A转移到B
foreach(所述A到B阵列中的作业){
转移作业A到系统B
}
#将潜在的作业从B转移到A
foreach(所述B到A阵列中的作业){
转移作业B到系统A
}
#睡眠一段时间#可由用户配置,大约30秒
}#Do forever结束
#转移作业子例程,用于将作业从一个系统转移到另一个系统
Sub Move JobX to SystemY{
    将作业X置于系统保持
    提交作业X至系统Y
    一旦作业X出现在系统Y中{
      将作业X从系统X中清除
    }
  }#子例程结束
这里描述的是在网格计算环境中平衡工作负荷的一种能力。在一个例子中,为了平衡工作负荷,将作业从一个负荷较重的系统转移到另外一个负荷较轻的系统中。在其它例子中,工作负荷也可以通过其它的方法进行平衡,例如,工作负荷平衡可包括首先确定由哪一个系统运行一特定的作业并向这一系统提交该作业。在这种情况下,用户将作业提交至对于管理器守护程序是可见的一待宰栏(holding pen)。在这一例子中,虽然所述待宰栏中的作业对于管理器守护程序是可见的,但对各个系统中的调度器来说是不可见的。管理器守护程序从调度器请求信息并根据该信息确定对一特定作业的最佳配合,而后将作业提交至选定的系统。
虽然作业的最初的提交是受控制的,但系统仍然可能变得不平衡。作业运行过程中的不可预知的事件可导致系统不平衡的发生(例如,导致作业提早结束的作业失败),这些事件将破坏先前的排队决策等。于是,在一个例子中,所述守护程序还运行上述的逻辑来保持工作负荷的平衡。
在平衡工作负荷的过程中所用到的信息可以不同于、少于和/或多于以上所描述的信息。作为例子,可使用作业类别和/或资源匹配(例如存储器或者软件许可)以及其它信息来决定工作负荷的布置。
本发明的工作负荷平衡能力使得能够有利地平衡网格计算环境中两个或者更多系统的工作负荷。而且,虽然这里只描述了两个系统,但却可以使用单个管理器守护程序对多于两个的具有独立的分批排队能力的系统进行控制。所述逻辑将被扩展以检查来自其它系统的信息。并且,虽然前面给出了系统的一些例子,但是还存在着很多其它的可能性。作为一个例子,系统是同类的,但却是在地理上远离的。还存在很多其它的变化。
在一个方面,可以使管理器守护程序无效。当其无效时,用户仍然可以向多个系统提交作业,但在两个网格连接的系统之间的自动负荷平衡就不再发生了。
此外,虽然上述例子中采用了回填调度的技术,但是,包括那些不回填的其它的调度技术也可被采用。如果采用了不回填的技术,则可不将阴影时间包括在所述所收集的信息中。举例说,在一种先进先出(FIFO)的调度技术中,管理器守护程序确定空闲的节点、等待的作业以及可能地等待的作业的顺序,但它不要求阴影时间。当决定要转移作业到一个系统时,将考虑空闲的资源,并且没有阴影时间的检测。以类似的方式,其它的批调度技术可以被用于管理工作负荷。
另外,对于那些采用回填技术的调度器,在其它实施例中,使用受阴影时间保护(以及不受阴影时间保护)的资源的列表来改善决策过程。例如,可以将具有大于阴影时间的Wallclock(总耗时)估计的作业转移到不被阴影时间保护的节点(因此,不限于回填时间约束)。
此外,虽然前面提供了调度器的例子,但也可以采用许多其它的调度器而并不违反本发明的精神。其它调度器的例子包括,例如,由PlatformComputing提供的Load Sharing Facility(LSF)以及由MauiSupercomputing Center提供的Maui。
作为另一个实施例,多于一个的系统可以包含有管理器守护程序,一个可作为另一个的备份并且/或者多个管理器守护程序协同工作来管理网格计算环境中的工作负荷等。并且,该计算环境中的一个或多个系统可以不具有调度器,而是由其它系统中的调度器进行调度,等等。
有利地,本发明的一个或多个方面使得能够实现网格计算环境工作负荷的平衡。这将提高效率和生产率。因为其动态和自动的特性,这种平衡对于用户是透明的。通过从调度器获取信息并保持调度器的调度责任,管理器守护程序的复杂性被降低到最小。因为管理器守护程序获取的信息来自复杂的调度软件程序,因此输入至管理器守护程序的信息量得到了减少。并且调度器可以将已经运行的算法的结果发送给管理器守护程序,这样管理器守护程序就不需要进行复杂的分析(例如,阴影时间的计算等)。
有利地,本发明的一个或多个方面使多个并行的机器能够借助例如单个Globus的实现而组合资源,其中每个机器被独立地管理。
本发明可以包含于具有例如计算机可用媒介的制造物品中(例如,一个或者多个计算机程序产品)。该媒介在其中具有例如计算机可读程序代码手段或者逻辑(例如,指令、代码、命令等),来提供或促进本发明的能力。这种制造物品可以被包括为一计算机系统中的一部分,或者单独出售。
另外,可以提供至少一个可被一机器读取的程序存储设备,该程序存储设备包含了至少一个指令程序,该指令程序可被该机器执行来实现本发明的能力。
这里示出的流程图只是一些例子。在这些流程图或这里描述的步骤(或操作)中可以有很多变化,而并不违反本发明的精神。例如,这些步骤可以不同的顺序执行,也可以增加、删除、更改某些步骤。所有这些变化都被认为是所声明的本发明的一部分。
虽然在这里详细说明和描述了优选实施例,但相关领域的技术人员明白的是,可以进行各种修改、增加、替换等,而并不违反本发明的精神,因此,这些修改等也被认为处于权利要求书中所定义的本发明的范围之内。

Claims (12)

1.一种平衡网格计算环境中的工作负荷的方法,所述方法包括:
由所述网格计算环境中的管理器守护程序从与所述网格计算环境的多个系统中的一个或多个系统相关联的一个或多个调度器中获取关于所述一个或多个系统的信息;
应用至少一部分所获取的信息平衡所述多个系统中的至少两个系统的工作负荷。
2.权利要求1的方法,其中,从至少两个调度器中获取信息,并且其中,所述至少两个调度器中的一个调度器是与所述至少两个调度器中的至少一个其它调度器不同的调度器。
3.权利要求1的方法,其中所述信息包括关于所述一个或多个系统的工作负荷的信息。
4.权利要求3的方法,其中所述关于系统的信息包括以下至少之一:所述系统中空闲节点的数量、零个或者多个等待作业的作业队列以及一个或多个用于所述系统的作业混合的当前状态的、特定于调度器的变量设置。
5.权利要求1的方法,其中所述平衡包括:
确定将作业分配给所述至少两个系统中哪一个系统;以及
将所述作业分配给所确定的系统。
6.权利要求1的方法,其中所述平衡包括:
从所述至少两个系统中的一个系统中清除作业;以及
将所述作业分配给所述至少两个系统中的另一个系统。
7.一种平衡网格计算环境中的工作负荷的系统,所述系统包括:
用于由所述网格计算环境中的管理器守护程序从与所述网格计算环境的多个系统中的一个或多个系统相关联的一个或多个调度器中获取关于所述一个或多个系统的信息的装置;
用于使用至少一部分所述所获取的信息来平衡所述多个系统中的至少两个系统的工作负荷的装置。
8.权利要求7的系统,其中,从至少两个调度器获取信息,并且其中,所述至少两个调度器中的一个调度器与所述至少两个调度器中的至少一个其它调度器不同。
9.权利要求7的系统,其中所述信息包括关于所述一个或多个系统的工作负荷的信息。
10.权利要求9的系统,其中所述关于系统的信息包括以下至少之一:所述系统的空闲节点的数量、零个或者多个等待作业的作业队列以及一个或多个用于所述系统的作业混合的当前状态的、特定于调度器的变量设置。
11.权利要求7的系统,其中所述用于平衡的装置包括:
用于确定将作业分配给所述至少两个系统中的哪一个系统的装置;以及
用于将所述作业分配给所确定的系统的装置。
12.权利要求7的系统,其中所述用于平衡的装置包括:
用于从所述至少两个系统中的一个系统中清除作业的装置;以及
用于将所述作业分配给所述至少两个系统中的另一个系统的装置。
CNB2004100455145A 2003-08-05 2004-05-28 平衡网格计算环境中的工作负荷的方法和系统 Expired - Fee Related CN1306754C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/634,693 US20050034130A1 (en) 2003-08-05 2003-08-05 Balancing workload of a grid computing environment
US10/634,693 2003-08-05

Publications (2)

Publication Number Publication Date
CN1581806A CN1581806A (zh) 2005-02-16
CN1306754C true CN1306754C (zh) 2007-03-21

Family

ID=34116088

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100455145A Expired - Fee Related CN1306754C (zh) 2003-08-05 2004-05-28 平衡网格计算环境中的工作负荷的方法和系统

Country Status (3)

Country Link
US (1) US20050034130A1 (zh)
JP (1) JP2005056391A (zh)
CN (1) CN1306754C (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8726278B1 (en) 2004-07-21 2014-05-13 The Mathworks, Inc. Methods and system for registering callbacks and distributing tasks to technical computing works
US8612980B2 (en) * 2003-12-04 2013-12-17 The Mathworks, Inc. Distribution of job in a portable format in distributed computing environments
US7908313B2 (en) * 2004-07-21 2011-03-15 The Mathworks, Inc. Instrument-based distributed computing systems
US20060064699A1 (en) * 2004-09-21 2006-03-23 Bonk Ted J Method and system for processing resource allocations
US8230424B2 (en) * 2005-08-01 2012-07-24 The Mathworks, Inc. General interface with arbitrary job managers
CN100396006C (zh) * 2005-12-20 2008-06-18 华为技术有限公司 一种网格计算中节点间负载转移的方法
CN100373343C (zh) * 2005-12-26 2008-03-05 北京航空航天大学 服务网格调度器及调度作业的方法
US7836212B2 (en) * 2006-07-20 2010-11-16 Oracle America, Inc. Reflecting bandwidth and priority in network attached storage I/O
US20080049254A1 (en) * 2006-08-24 2008-02-28 Thomas Phan Method and means for co-scheduling job assignments and data replication in wide-area distributed systems
US8903968B2 (en) * 2006-08-29 2014-12-02 International Business Machines Corporation Distributed computing environment
US7987467B2 (en) * 2007-04-13 2011-07-26 International Business Machines Corporation Scale across in a grid computing environment
JP5011006B2 (ja) 2007-07-03 2012-08-29 株式会社日立製作所 リソース割当方法、リソース割当プログラム、および、リソース割当装置
US8205208B2 (en) 2007-07-24 2012-06-19 Internaitonal Business Machines Corporation Scheduling grid jobs using dynamic grid scheduling policy
CN101782862B (zh) * 2009-01-16 2013-03-13 鸿富锦精密工业(深圳)有限公司 处理器分配控制系统及其控制方法
US9128771B1 (en) * 2009-12-08 2015-09-08 Broadcom Corporation System, method, and computer program product to distribute workload
US8364813B2 (en) 2010-11-02 2013-01-29 International Business Machines Corporation Administering incident pools for event and alert analysis
US8621277B2 (en) 2010-12-06 2013-12-31 International Business Machines Corporation Dynamic administration of component event reporting in a distributed processing system
US8805999B2 (en) * 2010-12-07 2014-08-12 International Business Machines Corporation Administering event reporting rules in a distributed processing system
US8868984B2 (en) 2010-12-07 2014-10-21 International Business Machines Corporation Relevant alert delivery in a distributed processing system with event listeners and alert listeners
US8737231B2 (en) 2010-12-07 2014-05-27 International Business Machines Corporation Dynamic administration of event pools for relevant event and alert analysis during event storms
US8756462B2 (en) 2011-05-24 2014-06-17 International Business Machines Corporation Configurable alert delivery for reducing the amount of alerts transmitted in a distributed processing system
US9213621B2 (en) 2011-05-27 2015-12-15 International Business Machines Corporation Administering event pools for relevant event analysis in a distributed processing system
US8713366B2 (en) 2011-06-22 2014-04-29 International Business Machines Corporation Restarting event and alert analysis after a shutdown in a distributed processing system
US8880943B2 (en) 2011-06-22 2014-11-04 International Business Machines Corporation Restarting event and alert analysis after a shutdown in a distributed processing system
US9419650B2 (en) 2011-06-22 2016-08-16 International Business Machines Corporation Flexible event data content management for relevant event and alert analysis within a distributed processing system
US8392385B2 (en) 2011-06-22 2013-03-05 International Business Machines Corporation Flexible event data content management for relevant event and alert analysis within a distributed processing system
US8887175B2 (en) 2011-10-18 2014-11-11 International Business Machines Corporation Administering incident pools for event and alert analysis
US8943366B2 (en) 2012-08-09 2015-01-27 International Business Machines Corporation Administering checkpoints for incident analysis
US9336057B2 (en) * 2012-12-21 2016-05-10 Microsoft Technology Licensing, Llc Assigning jobs to heterogeneous processing modules
US9256482B2 (en) 2013-08-23 2016-02-09 International Business Machines Corporation Determining whether to send an alert in a distributed processing system
US9086968B2 (en) 2013-09-11 2015-07-21 International Business Machines Corporation Checkpointing for delayed alert creation
US9602337B2 (en) 2013-09-11 2017-03-21 International Business Machines Corporation Event and alert analysis in a distributed processing system
US9563470B2 (en) * 2013-12-23 2017-02-07 International Business Machines Corporation Backfill scheduling for embarrassingly parallel jobs
US9389943B2 (en) 2014-01-07 2016-07-12 International Business Machines Corporation Determining a number of unique incidents in a plurality of incidents for incident processing in a distributed processing system
CN105607956B (zh) * 2016-01-06 2019-06-04 北京京东尚科信息技术有限公司 一种计算机中的任务分配方法及系统
CN109815019B (zh) * 2019-02-03 2021-06-15 普信恒业科技发展(北京)有限公司 任务调度方法、装置、电子设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0793262A (ja) * 1993-09-27 1995-04-07 Nec Corp アプリケーションツール実行管理システム
JP2000268012A (ja) * 1999-03-12 2000-09-29 Nec Corp クライアントサーバシステムにおけるサーバ負荷の分散方法ならびに装置
JP2002510077A (ja) * 1997-10-06 2002-04-02 ウェブ バランス インコーポレイテッド ネットワークサーバ間の負荷を平衡(バランス)させるためのシステム
CN1367439A (zh) * 2002-02-10 2002-09-04 苏州市蜗牛电子有限公司 多客户端互动的负载均衡方法及系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5841538B2 (ja) * 1975-12-04 1983-09-13 株式会社東芝 マルチプロセツサシステム ノ ユウセンセイギヨホウシキ
US4633387A (en) * 1983-02-25 1986-12-30 International Business Machines Corporation Load balancing in a multiunit system
JP2533495B2 (ja) * 1986-07-25 1996-09-11 株式会社日立製作所 ワ−クスケジユ−リング方法及び装置
US5031089A (en) * 1988-12-30 1991-07-09 United States Of America As Represented By The Administrator, National Aeronautics And Space Administration Dynamic resource allocation scheme for distributed heterogeneous computer systems
DE59310083D1 (de) * 1993-09-24 2000-09-07 Siemens Ag Verfahren zum Lastausgleich in einem Multiprozessorsystem
US5630129A (en) * 1993-12-01 1997-05-13 Sandia Corporation Dynamic load balancing of applications
US6202080B1 (en) * 1997-12-11 2001-03-13 Nortel Networks Limited Apparatus and method for computer job workload distribution
US6279001B1 (en) * 1998-05-29 2001-08-21 Webspective Software, Inc. Web service
US6418462B1 (en) * 1999-01-07 2002-07-09 Yongyong Xu Global sideband service distributed computing method
US7082606B2 (en) * 2001-05-01 2006-07-25 The Regents Of The University Of California Dedicated heterogeneous node scheduling including backfill scheduling
CA2365729A1 (en) * 2001-12-20 2003-06-20 Platform Computing (Barbados) Inc. Topology aware scheduling for a multiprocessor system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0793262A (ja) * 1993-09-27 1995-04-07 Nec Corp アプリケーションツール実行管理システム
JP2002510077A (ja) * 1997-10-06 2002-04-02 ウェブ バランス インコーポレイテッド ネットワークサーバ間の負荷を平衡(バランス)させるためのシステム
JP2000268012A (ja) * 1999-03-12 2000-09-29 Nec Corp クライアントサーバシステムにおけるサーバ負荷の分散方法ならびに装置
CN1367439A (zh) * 2002-02-10 2002-09-04 苏州市蜗牛电子有限公司 多客户端互动的负载均衡方法及系统

Also Published As

Publication number Publication date
JP2005056391A (ja) 2005-03-03
CN1581806A (zh) 2005-02-16
US20050034130A1 (en) 2005-02-10

Similar Documents

Publication Publication Date Title
CN1306754C (zh) 平衡网格计算环境中的工作负荷的方法和系统
Epema et al. A worldwide flock of condors: Load sharing among workstation clusters
US8205208B2 (en) Scheduling grid jobs using dynamic grid scheduling policy
Kaplan et al. A comparison of queueing, cluster and distributed computing systems
EP1730638B1 (en) Facilitating allocation of resources in a heterogeneous computing environment
US7689996B2 (en) Method to distribute programs using remote Java objects
US7281247B2 (en) Software image creation in a distributed build environment
US20080229320A1 (en) Method, an apparatus and a system for controlling of parallel execution of services
US20130111035A1 (en) Cloud optimization using workload analysis
CN1975679A (zh) 用于优化分段资源分配的方法和设备
US9424096B2 (en) Task allocation in a computer network
CN1908903A (zh) 执行作业步的系统和方法以及计算机产品
CN1845075A (zh) 面向服务的网格高性能计算作业调度方法
Bok et al. An efficient MapReduce scheduling scheme for processing large multimedia data
Maassen et al. Towards jungle computing with Ibis/Constellation
TWI554945B (zh) 例行工作的分配方法及應用其之多核心電腦
EP3997568B1 (en) Workflow-based scheduling and batching in multi-tenant distributed systems
CN110084507B (zh) 云计算环境下分级感知的科学工作流调度优化方法
Bucur et al. Trace-based simulations of processor co-allocation policies in multiclusters
CN110891083A (zh) 一种Gaia中支持多作业并行执行的代理方法
Ramezani et al. Task scheduling in cloud environments: A survey of population‐based evolutionary algorithms
Mishra et al. A memory-aware dynamic job scheduling model in Grid computing
CN1302412C (zh) 一种计算机机群系统及其作业管理方法
Lagerstrom et al. PScheD Political scheduling on the CRAY T3E
Kumar et al. Fuzzy based resource management framework for high throughput computing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070321