CN100424649C - 管理服务器、承担服务器及其所构成的系统和控制方法 - Google Patents

管理服务器、承担服务器及其所构成的系统和控制方法 Download PDF

Info

Publication number
CN100424649C
CN100424649C CNB2005800052414A CN200580005241A CN100424649C CN 100424649 C CN100424649 C CN 100424649C CN B2005800052414 A CNB2005800052414 A CN B2005800052414A CN 200580005241 A CN200580005241 A CN 200580005241A CN 100424649 C CN100424649 C CN 100424649C
Authority
CN
China
Prior art keywords
reception server
handling procedure
input data
reception
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2005800052414A
Other languages
English (en)
Other versions
CN1922578A (zh
Inventor
金子章弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qindarui Co.
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1922578A publication Critical patent/CN1922578A/zh
Application granted granted Critical
Publication of CN100424649C publication Critical patent/CN100424649C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • G06F9/4856Task life-cycle, e.g. stopping, restarting, resuming execution resumption being on a different machine, e.g. task migration, virtual machine migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)
  • Stored Programmes (AREA)
  • Debugging And Monitoring (AREA)
  • General Factory Administration (AREA)

Abstract

结合更多的计算机,构筑网格计算系统。提供一种网格计算系统,管理服务器生成执行指示信息,该信息包含执行作业各部分的各处理程序的识别信息、和多个处理程序的执行顺序,将输入数据和执行指示信息对应后发送到以输入数据为输入、执行应最先执行的处理程序的承担服务器,多个承担服务器各自通过以接收到的输入数据为输入、执行处理程序,更新输入数据,根据对应输入数据接收的执行指示信息,选择以输入数据为输入、执行下次应执行的处理程序的承担服务器,将接收到的执行指示信息和更新后的输入数据对应后发送到选择的承担服务器。

Description

管理服务器、承担服务器及其所构成的系统和控制方法
技术领域
本发明涉及一种管理服务器、承担服务器及其所构成的系统和控制方法。尤其是,本发明涉及一种用于协调由管理服务器管理的多个承担服务器、处理所请求的作业的网格(grid)计算系统、管理服务器、承担服务器、控制方法、控制程序及记录媒体。
背景技术
近年来,通过经网络连接的多个计算机分别处理包含在作业中的多个步骤(处理部分)之一而高效地执行作业的网格计算系统受到关注。利用网格计算系统,作业的委托者将处理一部分作业的程序和处理作业必需的数据的组发送到多个计算机中的每个。然后,多个计算机中的每一个以接收到的数据为输入,执行接收到的程序,并将执行结果返回给委托者。作业的委托者结合所返回的各个执行结果,得到作业的结果。由此,即便在作业必需的计算处理量庞大的情况下,通过由多个计算机并行执行作业的每个部分,可高效地完成作业。
在非专利文献1中说明网格计算系统的一实例。
非专利文献1:「信息处理」社团法人信息处理学会发行、2003年发行、Vol.44、特集「PC网格的现状与展望」
可是,在利用上述网格计算系统时,只有作业委托者的服务器向多个计算机中的每一个发送程序及数据。因此,对应于作为委托目标的计算机的数量,在委托者的服务器负荷增大的同时,网络通信量集中至委托者的服务器。因此,为了利用多个计算机高效地完成作业,必需花费许多费用来加强委托者的服务器设备。
发明内容
因此,本发明的目的在于提供一种可解决上述问题的网格计算系统、管理服务器、承担服务器、控制方法、控制程序及记录媒体。该目的通过记载于用以限定本发明的保护范围的独立权利要求的特征的组合来实现。另外,从属权利要求限定了本发明的更有利的具体例。
为了解决上述课题,提供一种系统、该系统的承担服务器及管理服务器、控制该承担服务器或管理服务器的控制方法、控制该承担服务器或管理服务器的控制程序及记录控制程序的记录媒体,该系统具备:多个承担服务器和管理服务器,其中所述承担服务器分别执行从用于处理包含在利用者所请求的作业中的多个步骤的多个处理程序中分配给该承担服务器的处理程序,而所述管理服务器管理所述多个承担服务器,其中,所述管理服务器具有:执行指示信息生成部,生成包含用以识别所述多个处理程序中的每一个的识别信息和所述多个处理程序的执行顺序的执行指示信息;和输入数据发送部,使输入到所述作业中的输入数据和所述执行指示信息相对应地发送到以所述输入数据为输入、执行应最先执行的处理程序的承担服务器,所述多个承担服务器分别具有:处理程序执行部,通过以接收到的所述输入数据为输入、执行所分配的所述处理程序来更新所述输入数据;承担服务器选择部,根据对应于所述输入数据而接收的执行指示信息,选择以更新后的所述输入数据为输入、执行下次应执行的处理程序的承担服务器;和输入数据交接部,使所接收到的所述执行指示信息和更新后的所述输入数据相对应地发送到由所述承担服务器选择部选择的所述承担服务器。
另外,上述的发明概要未列举本发明的全部必要特征,这些特征组的组合子集(sub-combination)也可构成为发明。
根据本发明,可结合更多的计算机来构筑网格计算系统。
附图说明
图1是网格计算系统10的功能框图。
图2是管理服务器20的功能框图。
图3是表示发送用数据30的数据结构的一个实例。
图4是表示承担服务器信息存储部220的数据结构的一个实例。
图5是承担服务器50-2的功能框图。
图6是表示正常动作时网格计算系统10的动作流程的概要(例1)。
图7是表示故障发生时网格计算系统10的动作流程的概要(例2)。
图8是表示故障发生时网格计算系统10的动作流程的概要(例3)。
图9是表示故障发生时网格计算系统10的动作流程的概要(例4)。
图10表示S610的操作的细节。
图11表示S620的操作的细节。
图12表示接着图11的操作的细节。
图13表示S630的操作的细节。
图14表示S670的操作的细节。
图15表示S700的操作的细节。
图16表示S800的操作的细节。
图17表示用作管理服务器20的计算机的硬件结构的一个实例。
符号说明
10、网格计算系统
20、管理服务器
30、发送用数据
40、利用者终端
50、承担服务器
55、数据库
200、执行指示信息生成部
210、输入数据发送部
220、承担服务器信息存储部
230、询问应对部
240、处理程序启动部
250、故障发生通知发送部
260、承担服务器变更部
270、删除指示部
300、执行指示信息
500、处理程序执行部
510、承担服务器选择部
520、高速缓存部
530、输入数据交接部
540、历史记录存储部
550、故障发生判断部
560、变更恢复部
具体实施方式
下面,通过发明的实施方式来说明本发明,但下面的实施方式并不限制本发明的保护范围,且并不限定实施方式中所说明的特征的全部组合对发明的解决方案而言是必须的。
图1是网格计算系统10的功能框图。网格计算系统10具备通过LAN、WAN或因特网等网络互相连接的管理服务器20、利用者终端40和承担服务器50-1~N。利用者终端40例如是个人电脑等终端,也可通过与现有网格计算系统中的作业委托者终端相同的结构来实现。而且,在每个承担服务器50-1~N中预先安装、启动用于处理包含在作业中的多个处理部分的多个处理程序中所分配的处理程序。在每个数据库55-1~N中预先存储有例如相同的数据。
首先,利用者终端40接收来自利用者的指示,向管理服务器20请求作业。管理服务器20将由输入到作业中的输入数据和表示多个处理程序的执行顺序等的执行指示信息构成的组作为发送用数据30发送到承担服务器50-1。承担服务器50-1根据接收到的执行指示信息,以从管理服务器20接收到的输入数据为输入执行处理程序,更新输入数据。承担服务器50-1将由更新后的输入数据和执行指示信息构成的组作为发送用数据30发送到承担服务器50-2。
这时,承担服务器50-1也可利用控制用数据向管理服务器20询问输入数据的下一个发送目的地。另外,承担服务器50-1也可根据处理的内容存取存储于数据库55-1中的数据。以后同样,承担服务器50-2~(N-1)各自以输入数据为输入,依次执行处理程序。最后,承担服务器50-N将全部处理程序执行完成的完成通知发送到管理服务器20。管理服务器20将接收到的完成通知传送到利用者终端40。
这样,在利用根据本实施例的网格计算系统10时,各承担服务器不发送处理程序,而仅发送处理必需的数据。结果,即便在从多个利用者终端40等输入多个作业时,通过以流水线方式执行各作业的各部分,能够高效地执行作业。
图2是管理服务器20的功能框图。管理服务器20具有执行指示信息生成部200、输入数据发送部210、承担服务器信息存储部220、询问应对部230、处理程序启动部240、故障发生通知发送部250、承担服务器变更部260和删除指示部270。执行指示信息生成部200一旦从利用者终端40接收到作业请求,则生成执行指示信息,该信息包含用于识别处理作业中所包含的多个处理部分的多个处理程序中的每一个的识别信息和该多个处理程序的执行顺序。然后,执行指示信息生成部200将生成的执行指示信息与应输入到作业中的输入数据一起发送到输入数据发送部210。
输入数据发送部210将输入数据和执行指示信息相对应地发送到以输入数据为输入、执行应最先执行的处理程序的承担服务器、例如承担服务器50-1。这时,输入数据发送部210也可以根据存储于承担服务器信息存储部220中的信息,选择执行应最先执行的处理程序的承担服务器。
承担服务器信息存储部220将用于识别多个处理程序中的每一个的识别信息和执行该处理程序的承担服务器的识别信息相对应地进行存储。并且,承担服务器信息存储部220对应于各承担服务器的识别信息,存储表示该承担服务器是否处于可新接收输入数据并执行处理程序的可执行状态的可否执行信息。另外,承担服务器信息存储部220还可对应于各承担服务器的识别信息,对应存储该承担服务器接收输入数据的时刻,也可对应存储该承担服务器的最大处理量及计算资源的使用率。
询问应对部230在从承担服务器50-1~N之一接收到执行规定处理程序的承担服务器的询问的情况下,从承担服务器信息存储部220取得与接受询问的处理程序的识别信息相对应的承担服务器的识别信息,并作为针对该询问的回复而发送。处理程序启动部240在满足规定条件的情况下,根据由执行指示信息生成部200生成的执行指示信息,以输入数据为输入,检测出应在第2此之后执行的各处理程序,在与输入数据发送部210的发送目的地不同的承担服务器之一中启动所检测出的各处理程序。
具体地说,处理程序启动部240也可在满足“执行应在第2此之后执行的该处理程序的承担服务器比规定基准台数少”的条件、或未能检测出1台这样的承担服务器的条件时,启动处理程序。另外,就询问应对部230接受询问的处理程序而言,在执行该处理程序的多个承担服务器中、数量超过预定基准比例的承担服务器是不可执行状态的情况下,处理程序启动部240也可在未启动该处理程序的承担服务器之一中启动该处理程序。
由此,由于可预先准备下一个处理程序,所以难以中断作业的处理。另外,处理程序启动部240也可伴随这些处理来更新承担服务器信息存储部220的数据。
故障发生通知发送部250在自从任一承担服务器接收到接收通知起的预定的基准处理时间内,根据存储于接收服务信息存储部220的信息,判断是否从该承担服务器接收到结束通知。然后,故障发生通知发送部250在于基准处理时间内未能接收的情况下,将表示“在该承担服务器中执行处理程序时发生了故障”的故障发生通知发送到作为向该承担服务器发送了输入数据等的发送源的承担服务器。
承担服务器变更部260根据存储于承担服务器信息存储部220中的数据,判断通过由多个承担服务器之一执行处理程序而使用的计算资源的使用率是否比预定的基准使用率低。而且,承担服务器变更部260在任一承担服务器中计算资源的使用率比基准使用率低时,设定承担服务器50-1~N,以在最大处理量小于该承担服务器的其他承担服务器中执行。与之相伴,承担服务器变更部260更新承担服务器信息存储部220内的数据。
删除指示部270在从最后执行处理程序的承担服务器50-N接收到完成通知的情况下,判断为通过全部执行了多个处理程序而完成了作业。然后,在此情况下,删除指示部270从该多个承担服务器的每一个中删除该作业执行过程中存储的输入数据及执行指示信息。取代之,删除指示部270也可仅通知“这些输入数据及执行指示信息是没用的”。在这种情况下,接收到该通知的承担服务器也可定期地检测并删除没用的输入数据及执行指示信息。
图3是表示发送用数据30的数据结构的一个实例。(a)表示发送用数据30的数据结构的概要。发送用数据30包含主体部分和标首部分。而且,发送用数据30在主体部分中包含输入数据,在标首部分中包含执行指示信息300。这样,输入数据发送部210也可以通过在输入数据的标首部分中存储执行指示信息300,将输入数据及执行指示信息300相对应地进行发送。
并且,最好发送用数据30在标首部分中包含表示在执行指示信息300所表示的处理程序中、已结束执行的处理程序的已处理标志。由此,即便在接收了发送用数据30的承担服务器50-1等可执行多个处理程序的情况下,也可适当地判断下次应执行哪个处理程序。并且,发送用数据30除已处理标志之外,也可以存储表示各处理程序的结束状态、例如正常结束或异常结束或错误代码等的信息。由此,可在故障发生时易于调查故障的原因。
取代之,发送用数据30也可以不具有已结束执行的处理程序的识别信息,而仅具有尚未执行的处理程序的识别信息。即,承担服务器50-1等也可从发送用数据30中删除已结束执行的处理程序的识别信息。由此,可减小发送用数据30的数据大小。
(b)表示执行指示信息300的一个实例。执行指示信息300在第1行中包含作为用于识别作业的信息的JOB。然后,执行指示信息300在第2行中包含表示应执行识别信息为程序A的处理程序的指示,作为第1步骤。并且,执行指示信息300在第3行及第4行中包含表示在执行程序A时所用的文件的信息。这些文件例如是存储于数据库55-1~N等中的文件。
执行指示信息300在第2行中包含表示应执行识别信息为程序A的处理程序的指示,作为第2步骤。与第1步骤相同,执行指示信息300在第6行及第7行中包含表示在执行程序B中所用的文件的信息。另外,执行指示信息300例如也可以利用工作流脚本(ワ-クフロ-スクリプト)或JCL(Job Control Language)等格式来记述。
这里,处理程序例如是在计算机的操作系统中作为1个可执行文件而处理的程序。取代之或除此之外,处理程序也可以是可执行文件及在执行时动态读入的程序库文件的组合。并且,处理程序也可以是通过执行规定程序而被启动的进程或线程,也可以是记述在规定程序中的至少1个函数、程序、方法或步骤。
这样,执行指示信息300包含各处理程序的识别信息、例如程序A及程序B以及这些程序的执行顺序。由此,接收了发送用数据30的承担服务器不仅能适当地选择应执行的处理程序,还可适当地选择下次应执行的处理程序。
另外,执行指示信息300除图3示出的数据之外,也可以包含完成作业所必需的各种信息。例如,执行指示信息300也可以包含各处理程序应参照的数据库的识别信息,在执行全部处理程序的情况下,也可以包含表示应通知该情况的通知目的地的信息。
图4表示承担服务器信息存储部220的数据结构的一个实例。承担服务器信息存储部220对应存储作为各承担服务器的识别信息的承担服务器1D、和安装于该承担服务器中被执行的处理程序的识别信息(ID)。并且,承担服务器信息存储部220与承担服务器ID相对应地存储表示该承担服务器正处理的输入数据的数量的处理数和最后接收到“该承担服务器从其他服务器接收到输入数据”的接收通知的时刻。
这里,所谓承担服务器正处理的输入数据的数量不仅包含该承担服务器实际执行的处理程序为输入的输入数据,还包含该承担服务器接收的待处理、未处理的输入数据数量。另外,所谓最后接收到接收通知的时刻为在接收到接收通知、但未接收到对应于该接收通知的结束通知的情况下的接收通知的接收时刻。由此,故障发生通知发送部250可以测量自从各承担服务器接收到接收通知起未接收到结束通知所经过的时间。
并且,承担服务器信息存储部220对应于各承担服务器ID,存储表示该承担服务器是否是可新接收输入数据、执行处理程序的可执行状态的可否执行信息。其中,承担服务器信息存储部220例如也可以根据各承担服务器允许的待处理输入数据的数量和该承担服务器处理中的输入数据,在判断各承担服务器是否是可执行状态后进行存储。例如,在某承担服务器(例如,“否”deBB)允许的待处理输入数据的数量为1、该承担服务器处理中的输入数据的数量为2的情况下,承担服务器信息存储部220判断该承担服务器为不可执行状态,并存储表示该情况的可否执行信息。
另外,承担服务器存储部220也可以对应于各承担服务器ID,进而对应存储该承担服务器的最大处理量及计算资源的使用率。所谓某承担服务器的最大处理量,例如可以是该承担服务器的CPU的操作频率,也可以是该CPU的种类,也可以是该CPU每单位时间可处理的指令数。除此之外,所谓最大处理量也可以是由该承担服务器的硬盘驱动器的存取速度或容量、或该承担服务器的存储器的存取速度或容量来确定的值。
另外,所谓某承担服务器中的计算资源的使用率,例如是在规定的基准时间内该承担服务器的CPU执行处理程序的时间相对于该基准时间的比例。取代之,所谓使用率也可以是存储器或硬盘的占有率。
图5是承担服务器50-2的功能框图。承担服务器50-2具有处理程序执行部500、承担服务器选择部510、高速缓存部520、输入数据交接部530、历史记录存储部540、故障发生判断部550和变更恢复部560。在图5中,为了说明承担服务器更新从其他承担服务器接收到的输入数据,进而与其他承担服务器交接的处理,而对承担服务器50-2进行说明。另外,由于承担服务器50-1及承担服务器50-3~N分别采用与图5中示出的承担服务器50-2基本相同的结构,所以省略其说明。
处理程序执行部500一旦在可执行状态的情况下从承担服务器50-1接收到输入数据,就从例如数据库55-2取得所分配的处理程序,并以接收到的输入数据为输入来执行。然后,处理程序执行部500通过执行处理程序来更新输入数据,并将更新后的输入数据发送到输入数据交接部530。另外,处理程序执行部500通过执行处理程序,也可以参照数据库55-2的数据,也可以更新数据库55-2的数据。
另外,数据库55-1~N各自也可以存储互不相同的数据,也可以是存储相同数据的的克隆数据库。在这种情况下,处理程序执行部500也可以利用保持数据库之一贯性的现有系统,将对数据库55-2的数据更新反映到其他数据库、例如数据库55-1及数据库55-3~N中。由此,不必以数据库的全部数据作为输入数据来发送,而仅发送更新后的部分,所以效率高。
另外,处理程序执行部500一旦在不是可执行状态的情况下从承担服务器50-1接收到输入数据,则判断为没有新接收输入数据。然后,处理程序执行部500将“拒绝输入数据”的拒绝通知发送给作为输入数据及执行指示信息的发送源的承担服务器50-1。处理程序执行部500在自最后接收到输入数据起的预定基准待机时间内未接收到输入数据及执行指示信息的情况下,中止执行承担服务器50-2中的处理程序,并向管理服务器20进行通知。并且,处理程序执行部500在管理服务器20指示“中止执行处理程序”的情况下,也中止执行处理程序。
承担服务器选择部510对应于输入数据地从承担服务器50-1接收执行指示信息。然后,承担服务器选择部510根据接收到的该执行指示信息,选择以由处理程序执行部500更新的输入数据为输入、执行下次应执行的处理程序的承担服务器。例如,承担服务器选择部510向管理服务器20询问以更新后的输入数据为输入、执行下次应执行的处理程序的承担服务器的识别信息,并选择利用作为询问结果的识别信息而识别的承担服务器。更具体地说,高速缓存部520对应于该承担服务器执行的处理程序的识别信息,高速缓存作为承担服务器选择部510过去询问管理服务器20的询问应对部230的结果而取得的承担服务器的识别信息。
然后,承担服务器选择部510在高速缓存部520未高速缓存执行该处理程序的承担服务器的识别信息的情况下,向管理服务器20的询问应对部230询问执行该处理程序的承担服务器。另一方面,承担服务器选择部510在高速缓存部520高速缓存了执行该处理程序的承担服务器的识别信息的情况下,选择识别信息被高速缓存的该承担服务器。另外,承担服务器选择部510在故障发生判断部550判断为发生了故障的情况下,重新选择以更新后的输入数据为输入、执行下次应执行的处理程序的其他承担服务器。在图5中,说明承担服务器选择部510选择了承担服务器50-(N-1)的情况。
接着,输入数据交接部530将接收到的执行指示信息和更新后的输入数据相对应地发送到由承担服务器选择部510选择的承担服务器50-(N-1)。然后,输入数据交接部530将发送的输入数据及执行指示信息存储在历史记录存储部540中。然后,输入数据交接部530在从承担服务器50-(N-1)接收到拒绝通知的情况下,将该情况发送到故障发生判断部550。在这种情况下,输入数据交接部530从历史记录存储部540取得输入数据及执行指示信息,并将其发送到由承担服务器选择部510选择的其他承担服务器。
如上所述,历史记录存储部540存储由输入数据交接部530发送到承担服务器的输入数据及执行指示信息的历史记录。并且,历史记录存储部540将通过处理程序执行部500执行处理程序而变更的承担服务器50-2上的数据的历史记录信息与可恢复该变更的信息相对应地存储。其中,所谓承担服务器50-2上的数据,例如为存储于数据库55-2中的数据。此外,所谓承担服务器50-2上的数据,不仅包含仅由承担服务器50-2管理的数据,还包含利用网络文件系统或共享文件系统与其他服务器装置共享的存储装置的数据。
故障发生判断部550一旦从管理服务器20接收到故障发生通知,就作为在输入数据交接部530发送了更新后的输入数据及执行指示信息的发送源的承担服务器中,判断为在执行处理程序时发生了故障。作为另一例,故障发生判断部550在从输入数据交接部530接收到“从承担服务器50-(N-1)接收到拒绝通知”的通知的情况下,判断为在承担服务器50-(N-1)中执行处理程序时发生了故障。然后,故障发生判断部550在发生故障的作业是在回避故障后可再试行的类型的情况下,向承担服务器选择部510通知“选择其他承担服务器”,在不是该类型时,向变更恢复部560通知“复原由处理程序执行部500执行的数据变更”的恢复指示。
变更恢复部560根据来自故障发生判断部550的通知,基于历史记录存储部540的历史记录信息,恢复由处理程序执行部500变更的数据、例如数据库55-2中的数据。
如上所述,如图5所示,承担服务器50-2以接收到的输入数据为输入,在执行预先安装、启动的处理程序的同时,选择执行下次应执行的处理程序的承担服务器,并将输入数据发送到该承担服务器。由此,在管理服务器20中可以减轻发送接收处理程序及输入数据的负荷。
下面,利用图6~图9说明在本实施例的网格计算系统10中,管理服务器20使承担服务器50-1~N各自执行处理程序的4个实例。须注意的是,在图6~图9中,用虚线表示输入数据及执行指示信息或结束通知,用点划线表示其他控制用数据。
图6表示正常动作时网格计算系统10的动作流程的概要(例1)。利用者终端40向管理服务器20请求作业(S600)。然后,管理服务器20将执行指示信息存储于输入数据的标首部分,并发送到承担服务器50-1(S610)。另外,管理服务器20也可以以输入数据为输入,检测出应在第2次之后执行的各处理程序,并在与承担服务器50-1不同的承担服务器、例如承担服务器50-N中启动所检测出的处理程序。
承担服务器50-1一旦接收到输入数据,就将接收通知发送到管理服务器20(S620)。然后,承担服务器50-1通过以接收到的输入数据为输入,执行处理程序(例如程序A),来更新输入数据。一旦处理程序执行结束,承担服务器50-1则将结束通知发送到管理服务器20。
接着,承担服务器50-1根据需要,通过询问管理服务器20来选择执行下次应执行的处理程序的承担服务器。承担服务器50-1将输入数据及执行指示信息发送到所选择的承担服务器50-2。管理服务器20在从承担服务器50-1接受到询问时,将与接受询问的处理程序的识别信息对应的承担服务器的识别信息回复到承担服务器50-1(S630)。
承担服务器50-2一旦接收到输入数据,就将接收通知发送到管理服务器20(S640)。然后,承担服务器50-2通过以接收到的输入数据为输入,执行处理程序(例如程序B),来更新输入数据。一旦处理程序执行结束,承担服务器50-2就将结束通知发送到管理服务器20。
接着,承担服务器50-2根据需要,通过询问管理服务器20来选择执行下次应执行的处理程序的承担服务器。承担服务器50-2将输入数据及执行指示信息发送到所选择的承担服务器。管理服务器20在从承担服务器50-2接收到询问时,将与接受询问的处理程序的识别信息对应的承担服务器的识别信息回复到承担服务器50-2(S650)。
接着,说明由承担服务器50-2发送的输入数据及执行指示信息依次经由多个承担服务器,到达承担服务器50-N的情况。
承担服务器50-N通过以接收到的输入数据为输入,执行处理程序(例如程序X),来更新输入数据(S660)。承担服务器50-N将表示“完成了对处理作业的全部执行程序的执行”的结束通知回复到管理服务器20。
管理服务器20将接收到的完成通知传送到利用者终端40(S670)。然后,管理服务器20将从多个承担服务器的历史记录存储部删除输入数据及执行指示信息的删除指示分别发送到承担服务器50-1~N。
另外,除图中示出的数据的发送接收之外,承担服务器50-1~N中的每一个也可以将表示通过执行处理程序来使用计算资源的使用率的信息定期发送到管理服务器20。
图7是表示故障发生时网格计算系统10的动作流程的概要(例2)。由于图7的S600、S610、S620及S630的处理与图6中相同符号的步骤的处理基本相同,所以省略其说明。在S640中,承担服务器50-2在不是可执行状态、或在执行处理程序时发生了故障的情况下,将“拒绝输入数据”的拒绝通知发送到承担服务器50-1(S640)。
承担服务器50-1再次选择以输入数据为输入、执行下次应执行的处理程序的其他承担服务器(S700)。例如,承担服务器50-1选择承担服务器50-N。然后,承担服务器50-1从历史记录存储部取得输入数据及执行指示信息,并再发送到承担服务器50-N。接收该信息后,承担服务器50-N通过以接收到的输入数据为输入、执行处理程序,来更新输入数据(S660)。然后,承担服务器50-N根据需要,通过询问管理服务器20来选择执行下次应执行的处理程序的承担服务器。由于S710中的处理与S630中的处理基本相同,所以省略其说明。
图8表示故障发生时网格计算系统10的动作流程的概要(例3)。由于图8的S600、S610、S620、S630、S660及S700的处理与图7中相同符号的步骤的处理基本相同,所以省略其说明。在图8中,对不同于图7在S640中、在执行处理程序时发生了故障且承担服务器50-2未能将拒绝通知发送到承担服务器50-1的情况进行说明。
管理服务器20在自最后从承担服务器50-2接收到接收通知起的基准处理时间内未能从承担服务器50-2接收到结束通知的情况下,判断为在承担服务器50-2中执行处理程序时发生了故障(S800)。然后,管理服务器20将表示该情况的故障发生通知发送到向承担服务器50-2发送了输入数据的发送源、即承担服务器50-1。
承担服务器50-1重新选择以输入数据为输入、执行下次应执行的处理程序的其他承担服务器(S700)。承担服务器50-1例如选择承担服务器50-N。然后,承担服务器50-1从历史记录存储部取得输入数据及执行指示信息,并再发送到承担服务器50-N。须指出的是,由于S710中的处理与S630中的处理基本相同,所以省略其说明。
图9表示故障发生时网格计算系统10的动作流程的概要(例4)。由于图9中的S600、S610、S620、S630、S640及S650的处理与图6中相同符号的步骤的处理基本相同,所以省略其说明。图9说明S660中的在执行处理程序时发生了故障的情况。
管理服务器20在自最后从承担服务器50-N接收到接收通知起的基准处理时间内未能从承担服务器50-N接收到结束通知的情况下,判断为在承担服务器50-N中执行处理程序时发生了故障(S800)。然后,管理服务器20在执行中的作业不是在回避故障后可再试行的类型的情况下,向在承担服务器50-N之前执行该作业的处理程序的全部承担服务器发送恢复由执行处理程序所产生的变更的恢复指示。
承担服务器50-1的变更恢复部560一旦接收到该恢复指示,就判断为在作为输入数据交接部530发送了更新后的输入数据等的发送目的地之一的承担服务器、例如承担服务器50-2~N之一中发生了故障。然后,变更恢复部560根据历史记录存储部540的历史记录信息,恢复由处理程序执行部500变更的数据(S900)。
同样地,承担服务器50-2的变更恢复部560一旦接受到该恢复指示,就根据历史记录存储部540的历史记录信息,恢复由处理程序执行部500变更的数据(S910)。由此,可以仅变更应变更的数据的一部分,并防止发生丧失数据库55-1或数据库55-2等的数据一贯性的事态。
下面,利用图10~图16说明在图6~图9中说明的管理服务器20及承担服务器50-1~N的处理的细节。与图6~图9相同,用虚线表示输入数据及执行指示信息或完成通知,用点划线表示其他控制用数据。
图10表示S610的操作细节。管理服务器20每从利用者终端40接收到作业请求,都进行以下处理。首先,执行指示信息生成部200生成执行指示信息(S1000)。然后,处理程序启动部240根据执行指示信息,以输入数据为输入,检测应在第2次之后执行的处理程序,并判断是否任一承担服务器中已启动了该处理程序(S1010)。
在1台承担服务器也未启动时(S1010:“否”),处理程序启动部240将“启动该处理程序”的指示发送到例如承担服务器50-N(S1020)。在这种情况下,处理程序启动部240将新启动处理程序的承担服务器的识别信息与该处理程序的识别信息相对应地存储到承担服务器信息存储部220中。
取代之,处理程序启动部240也可以根据过去执行的作业的信息,通过下述处理,判断是否新启动处理程序。具体地,每次各承担服务器的处理程序执行部500执行处理程序,都向处理程序启动部240通知执行该处理程序所需的处理量。根据该通知,处理程序启动部240将执行用于处理包含在过去接受的作业请求类型的作业中的多个处理部分的多个处理程序所需的处理量与该类型相对应地进行管理。
然后,处理程序启动部240每次接受作业请求时,在过去执行该类型的作业时执行各处理程序所需的处理量超过了已启动该处理程序的承担服务器可处理的最大处理量的情况下,在其他承担服务器中新启动处理程序。由此,预先启动担心不足的某处理程序,可顺利地完成作业。另外,作为另一实例,处理程序启动部240也可以根据作业的处理内容,来判断执行各处理程序所需的处理量是否超过了已启动该处理程序的承担服务器可处理的最大处理量。具体地,处理程序启动部240也可以按照每个处理程序根据预定处理量来进行判断,也可以进行用于解析处理程序的执行内容的处理。
接着,执行指示信息生成部200通过将所生成的执行指示信息存储到应输入到作业中的输入数据的标首部分中,而生成发送用数据,并发送到例如承担服务器50-1(S1030)。
图11表示S620的操作细节。承担服务器50-1在启动了处理程序的情况下,定期进行以下处理。首先,处理程序执行部500判断是否接收到发送用数据(S1100)。在未接收到的情况下(S1100:“否”),处理程序执行部500判断是否自最后接收到发送用数据起经过了基准待机时间(S1110)。
在经过了基准待机时间的情况下,即在自最后接收到发送用数据起的基准待机时间内未能接收到下一发送用数据的情况下(S1110:“是”),处理程序执行部500停止处理程序(S1120),向管理服务器20通知“停止处理程序”(S1130),并结束处理。另一方面,处理程序执行部500在接收到发送用数据的情况下(S1100:“是”),判断承担服务器50-1是否是可执行状态(S1140)。在不是可执行状态的情况下(S1140:“否”),处理程序执行部500将拒绝通知回复到管理服务器20(S1150)。这里,所谓可执行状态的情况,不仅包含待处理状态的输入数据是规定数目以上的情况,还包含承担服务器50-1已中止了执行处理程序A的情况。
除此之外,处理程序执行部500也可以通过以下处理将拒绝通知回复到管理服务器20。具体地说,处理程序执行部500根据接收到的执行指示信息,以接收到的输入数据为输入,检测应已被执行的处理程序。然后,处理程序执行部500在检测出的该处理程序不能由作为输入数据的发送源的承担服务器执行的情况下,回复拒绝通知。例如,处理程序执行部500也可以在检测出的该处理程序当前不能由作为输入数据的发送源的承担服务器执行的情况下,判断为该承担服务器在发送输入数据时也不能执行该处理程序。
并且,除此之外,处理程序执行部500也可以在对与输入数据同时接收的电子署名的验证失败时,回复拒绝通知。由此,作为发送源的承担服务器可完全成为正当的承担服务器,防止不正当行为。
在该承担服务器是可执行状态、检测出的该处理程序可由作为输入数据的发送源的承担服务器执行、且电子署名得以正确验证的情况下(S1140:“是”),处理程序执行部500向管理服务器20发送接收通知(S1160)。然后,处理程序执行部500通过以输入数据为输入、执行分配的处理程序,来更新该输入数据(S1170)。历史记录存储部540将通过处理程序执行部500执行处理程序而变更的承担服务器50-1上的数据的历史记录信息与可恢复该变更的信息相对应地进行存储(S1180)。
图12表示接着图11的操作的细节。承担服务器选择部510根据从管理服务器20接收到的执行指示信息,以输入数据为输入,检测下次应执行的处理程序(S1200)。承担服务器选择部510在不能检测出这样的处理程序的情况下(S1200:“否”),将完成通知发送到管理服务器20(S1205)。
另一方面,在可检测出处理程序的情况下(S1200:“是”),承担服务器选择部510通过参照高速缓存部520,判断是否高速缓存了用于执行该处理程序的识别信息的承担服务器的识别信息(S1210)。在进行了高速缓存的情况下(S1220:“是”),承担服务器选择部510选择被高速缓存的该识别信息的承担服务器(S1230)。
另一方面,在未进行高速缓存的情况下(S1220:“否”),承担服务器选择部510向管理服务器20询问执行该处理程序的承担服务器的识别信息,选择利用作为询问结果的识别信息而被识别的承担服务器(S1240)。在这种情况下,高速缓存部520与作为询问对象的处理程序的识别信息相对应地高速缓存作为询问结果的识别信息(S1245)。
接着,输入数据交接部530将接收到的指示信息和更新后的输入数据相对应地作为发送用数据发送到由承担服务器选择部510选择的承担服务器(S1250)。另外,输入数据交接部530也可以以该更新后的输入数据及执行指示信息为对象形成电子署名,并将所形成的电子署名与该输入数据及执行指示信息相对应地进行发送。
然后,处理程序执行部500将结束通知发送到管理服务器20(S1260)。另外,处理程序执行部500也可以在执行处理程序需要规定以上时间时等情况下,在结束通知之前先发送表示处理程序的处理经过的信息。接着,历史记录存储部540存储由输入数据交接部530发送到承担服务器的输入数据及执行指示信息的历史记录(S1270)。另外,承担服务器50-1除图12表示的操作之外,也可定期地向管理服务器20发送表示通过处理程序执行部500执行处理程序而使用的计算资源的使用率的信息。
这里,由于除发送用数据的发送源是用承担服务器50-1替代了管理服务器20,其发送目的地是用承担服务器50-N等替代了承担服务器50-2之外,在S640中的操作与S620中的操作基本相同,所以省略其说明。同样地,由于除发送用数据的发送源是以承担服务器50-2替代了管理服务器20之外,S660中的操作与S620中的操作基本相同,所以省略其说明。
图13表示S630的操作的细节。管理服务器20每从承担服务器50-1~N之一接收到任一通知或询问,都进行以下处理。首先,承担服务器信息存储部220判断是否从例如承担服务器50-1接收到接收通知或结束通知(S1300)。在接收到的情况下(S1300:“是”),承担服务器信息存储部220根据接收通知或结束通知,通过各承担服务器更新处理中的作业数量,并根据更新结果,来更新可否执行信息(S1310)。
接着,询问应对部230判断是否接受了对执行规定处理程序的承担服务器的识别信息的询问(S1320)。在接受了询问的情况下(S1320:“是”),处理程序启动部240针对询问应对部230接受了询问的处理程序,判断在执行该处理程序的多个承担服务器中处于不可执行状态的承担服务器是否超过了预定的基准比例(S1330)。
在超过了基准比例的情况下(S1330:“是”),处理程序启动部240在未启动该处理程序的承担服务器之一中新启动该处理程序(S1340)。在这种情况下,处理程序启动部240将新启动了处理程序的承担服务器的识别信息与该处理程序的识别信息相对应地存储在承担服务器信息存储部220中。
然后,询问应对部230从承担服务器信息存储部220取得与接受了询问的处理程序的识别信息相对应的承担服务器的识别信息,并作为针对该询问的回复来发送(S1350)。在承担服务器信息存储部220存储有多个与该处理程序的识别信息相对应的承担服务器的识别信息的情况下,询问应对部230也可以发送与该处理程序的识别信息相对应的全部识别信息,也可以根据规定的判断基准来选择发送一部分识别信息。
例如,询问应对部230也可以优先于与询问了的承担服务器之间的通信速度慢的承担服务器的识别信息地选择发送与询问了的承担服务器之间的通信速度快的承担服务器的识别信息。另外,在S1340中,在处理程序启动部240新启动处理程序的情况下,询问应对部230也可以仅发送启动了处理程序的该承担服务器的识别信息。
而且,在承担服务器信息存储部220从承担服务器50-1~N之一接收到通过执行处理程序而使用的计算资源的使用率的情况下(S1360:“是”),承担服务器变更部260判断该使用率是否是基准使用率以下(S1370)。在是基准使用率以下的情况下(S1370:“是”),承担服务器变更部260使最大处理量小于发送该使用率的承担服务器的其他承担服务器执行该处理程序(S1380)。具体地说,承担服务器变更部260向执行该处理程序的承担服务器发送用以中止执行该处理程序的中止指示,并向最大处理量小于该承担服务器的其他承担服务器发送启动该处理程序的启动指示。
结果,变更前的承担服务器通过处理程序执行部500停止执行该处理程序,变更后的承担服务器通过处理程序执行部500启动该处理程序。而且,在这种情况下,处理程序启动部240将新启动处理程序的承担服务器的识别信息与该处理程序的识别信息相对应地存储于承担服务器信息存储部220中。另一方面,处理程序启动部240从承担服务器信息存储部220中删除中止执行处理程序的承担服务器的识别信息。
另外,由于在S650中的操作除作为询问源的承担服务器以承担服务器50-2替代了承担服务器50-1的事项之外,与在S630中的操作基本相同,所以省略其说明。
图14表示S670的操作的细节。删除指示部270在从最后执行处理程序的承担服务器50-N接收到完成通知的情况下(S1400:“是”),通过执行了全部多个处理程序而判断为作业完成,并将该情况通知给利用者终端40(S1410)。然后,删除指示部270指示各个承担服务器50-1~N从承担服务器50-1~N各自的历史记录存储部540中删除在该作业的执行过程中存储的输入数据、执行指示信息及历史记录信息(S1420)。
图15表示S700的操作的细节。故障发生判断部550判断在作为输入数据发送目的地的承担服务器中是否发生了故障(S1500)。例如,故障发生判断部550在从管理服务器20接收到故障发生通知、或从承担服务器50-2接收到拒绝通知的情况下,判断为发生了故障。
然后,在通过故障发生判断部550判断为发生了故障的情况下(S1500:“是”),承担服务器选择部510向管理服务器20询问执行在执行过程中发生了故障的该处理程序的其他承担服务器的识别信息(S1510)。这时,高速缓存部520与作为询问对象的处理程序的识别信息相对应地高速缓存作为询问结果的识别信息(S1520)。
承担服务器选择部510选择利用询问结果的识别信息而被识别的承担服务器(S1530)。例如,询问应对部230优先回复与该承担服务器的通信速度等快的承担服务器的识别信息作为询问结果。结果,承担服务器选择部510从以更新后的输入数据为输入、执行下次应执行的处理程序的多个承担服务器中优先于与该承担服务器之间的通信速度慢的承担服务器地选择通信速度快的承担服务器。作为一个实例,承担服务器选择部510选择该通信速度最快的承担服务器,而不选择其他承担服务器。
输入数据交接部530从历史记录存储部540中取得已发送的输入数据及执行指示信息(S1540)。输入数据交接部530将所取得的这些输入数据及执行指示信息作为发送用数据,发送到重新选择的承担服务器、例如承担服务器50-N(S1550)。
图16表示S800的操作的细节。管理服务器20在使承担服务器50-1~N执行作业的情况下,例如定期重复以下处理。首先,承担服务器信息存储部220针对各承担服务器判断自最后从该承担服务器接收到接收通知起是否经过了基准处理时间(D1600)。在经过了基准处理时间的情况下,即在基准处理时间内未接收到结束通知的情况下(S1600:“是”),承担服务器信息存储部220判断发生了故障的作业是否是可再试行的类型(S1610)。
在是可再试行的类型的情况下(S1610:“是”),承担服务器信息存储部220将故障发生通知发送到承担服务器50-1(S1620)。而且,承担服务器信息存储部220在作为输入数据发送目的地的承担服务器的硬件发生了故障等情况下,也可以删除与发生了故障的该承担服务器对应存储的处理程序的识别信息。另一方面,在不是可再试行的类型时(S1610:“否”),承担服务器信息存储部220将“恢复由于执行该作业的一部分的处理程序而造成的数据变更”的指示发送到已执行了该处理程序的承担服务器。例如,承担服务器信息存储部220将该指示发送到承担服务器50-1及承担服务器50-2(S1630)。
图17表示用作管理服务器20的计算机的硬件结构的一个实例。管理服务器20具备:CPU外设部,其具有通过主机控制器1782相互连接的CPU1700、RAM1720、图形控制器1775及显示装置1780;输入输出部,其具有通过输入输出控制器1784连接于主机控制器1782的通信接口1730、硬盘驱动器1740及CD-ROM驱动器1760;和遗赠(レガシ-)输入输出部,其具有连接于输入输出控制器1784的BIOS1710、软盘驱动器1750及输入输出芯片1770。
主机控制器1782连接RAM1720、以高传输速率存取RAM1720的CPU1700及图形控制器1775。CPU1700根据BIOS1710及存储于RAM1720中的程序而动作,以控制各部分。图形控制器1775取得CPU1700等在设置于RAM1720内的帧缓冲器上生成的图像数据,并显示在显示装置1780上。取代之,图形控制器1775也可以在内部包含存储CPU1700等所生成的图像数据的帧缓冲器。
输入输出控制器1784连接主机控制器1782、作为较高速的输入输出装置的通信接口1730、硬盘驱动器1740及CD-ROM驱动器1760。通信接口1730经网络与外部装置进行通信。硬盘驱动器1740存储管理服务器20所使用的程序及数据。CD-ROM驱动器1760从CD-ROM1795中读取程序或数据,并经RAM1720提供给输入输出芯片1770。
另外,将BIOS1710和软盘驱动器1750或输入输出芯片1770等较低速的输入输出装置连接到输入输出控制器1784。BIOS1710存储管理服务器20启动时CPU1700执行的导入程序、和取决于管理服务器20的硬件的程序等。软盘驱动器1750从软盘1790读取程序或数据,经RAM1720提供给输入输出芯片1770。输入输出芯片1770经软盘1790、或例如并行端口、串行端口、键盘端口、鼠标端口等连接各种输入输出装置。
提供给管理服务器20的程序存储于软盘1790、CD-ROM 1795或IC卡等记录媒体,由利用者提供。程序经输入输出芯片1770及/或输入输出控制器1784,从记录媒体被读出,并安装于管理服务器20中被执行。
安装于管理服务器20中被执行的控制程序包含执行指示信息生成模块、输入数据发送模块、承担服务器信息存储模块、询问应对模块、处理程序启动模块、故障发生通知发送模块、承担服务器变更模块和删除指示模块。由于各模块让管理服务器20进行的操作与图1~图16中说明的管理服务器20中对应的部件的操作相同,所以省略说明。
另外,提供给管理服务器20的控制程序也可以经网络等安装于承担服务器50-1~N的每一个中被执行。安装于承担服务器50-1~N的每一个中执行的控制程序包含处理程序执行模块、承担服务器选择模块、高速缓存模块、输入数据交接模块、历史记录存储模块和故障发生判断模块。由于各模块让承担服务器50-1~N分别进行的操作与图1~图16中说明的承担服务器50-1~N的每一个中对应的部件的操作相同,所以省略其说明。
以上示出的程序或模块也可以存储于外部存储媒体中。作为存储媒体,除软盘1790、CD-ROM1795之外,还可使用DVD或PD等光学记录媒体、MD等光磁记录媒体、磁带媒体、IC卡等半导体存储器等。另外,也可以将设置在连接于专用通信网络或因特网的服务器系统中的硬盘或RAM等存储装置作用记录媒体,经网络将程序提供给管理服务器20。
以上,如本实施例所示,管理服务器20可不在每次使承担服务器执行处理程序时都发送接收输入数据,而使多个承担服务器依次交接输入数据。结果,在减轻管理服务器的负担的同时,还减少了至管理服务器20的网络通信量。此外,承担服务器50高速缓存输入数据的发送目的地,仅向管理服务器20询问未被高速缓存的发送目的地。结果,进一步减少了至管理服务器20的网络通信量。
此外,根据本实施例,即便在执行处理程序时发生了故障的情况下,承担服务器50尽可能不询问管理服务器20,而试着修复故障。另外,管理服务器20将被执行的处理程序预先安装于承担服务器后启动。由此,只要仅由管理服务器20管理着允许存取输入数据的承担服务器即可,从而可减轻让承担服务器进行这种管理的负担。另外,管理服务器20可与来自承担服务器50的询问等相对应地分散各承担服务器的负荷。
以上,根据本实施例,可结合更多计算机,适当且灵活地构筑网格计算系统。
以上,使用实施方式说明了本发明,但本发明的技术范围不限于上述实施方式中记载的范围。对本领域技术人员而言,显然可在上述实施方式中增加多种变更或改良。从权利要求的范围记载可知,增加这种变更或改良的方式也包含于本发明的技术范围中。

Claims (21)

1. 一种系统,具备多个承担服务器和管理所述多个承担服务器的管理服务器,其中所述承担服务器分别执行从用于处理包含在用户所请求的作业中的多个步骤的多个处理程序中分配给该承担服务器的处理程序,其中,
所述管理服务器具有:
执行指示信息生成部,生成包含用以识别所述多个处理程序中的每一个的识别信息和所述多个处理程序的执行顺序的执行指示信息;和
输入数据发送部,使输入到所述作业中的输入数据和所述执行指示信息相对应地发送到以所述输入数据为输入、执行应最先执行的处理程序的承担服务器;
承担服务器信息存储部,使用于识别多个处理程序中的每一个的识别信息与执行该处理程序的承担服务器的识别信息对应起来进行存储;以及
询问应对部,响应从所述承担服务器接受到询问的事实,从所述承担服务器信息存储部中取得与下次应执行的处理程序的识别信息相对应的承担服务器的识别信息,并将其作为针对上述询问的答复而予以发送,
所述多个承担服务器分别具有:
处理程序执行部,通过以接收到的所述输入数据为输入、执行所分配的所述处理程序来更新所述输入数据;
承担服务器选择部,根据对应于所述输入数据而接收的执行指示信息,向所述管理服务器询问以更新后的所述输入数据为输入、执行下次应执行的处理程序的承担服务器,并选择利用作为询问结果的识别信息而识别出的承担服务器;和
输入数据交接部,使所接收到的所述执行指示信息和更新后的所述输入数据相对应地发送到由所述承担服务器选择部选择的所述承担服务器。
2. 根据权利要求1所述的系统,其特征在于:
所述多个承担服务器中的每一个还具备高速缓存部,该高速缓存部对应于该承担服务器执行的处理程序的识别信息来高速缓存取得了所述承担服务器选择部过去向所述询问应对部进行询问的结果的承担服务器的识别信息,
所述承担服务器选择部在所述高速缓存部高速缓存有应执行的处理程序的识别信息的情况下,选择与该处理程序相对应的承担服务器,而在所述高速缓存部未高速缓存有应执行的处理程序的识别信息的情况下,向所述询问应对部询问执行该处理程序的承担服务器。
3. 根据权利要求1所述的系统,其特征在于:
所述处理程序执行部在接收到所述输入数据的情况下,将表示“接收到输入数据”的接收通知发送到所述管理服务器,而在结束所述处理程序的执行的情况下,将表示“该处理程序的执行结束”的结束通知发送到所述管理服务器,
所述承担服务器信息存储部还存储根据所述接收通知及所述结束通知判断在所述多个承担服务器中的每一个新接收输入数据后可否执行处理程序的判断结果,作为可否执行信息。
所述询问应对部针对接受询问的处理程序,根据所述可否执行信息而从执行该处理程序的多个承担服务器中选择可新接收输入数据并执行处理程序的承担服务器,将所选择的该承担服务器的识别信息作为对所述询问的答复而发送。
4. 根据权利要求3所述的系统,其特征在于:
所述管理服务器还具备处理程序启动部,该处理程序启动部针对所述询问应对部接受询问的处理程序,在执行该处理程序的多个承担服务器中、超过预定基准比例数量的承担服务器不能新接收输入数据并执行处理程序的情况下,在未启动该处理程序的承担服务器的任一个中启动该处理程序,
所述询问应对部将通过所述处理程序启动部启动了该处理程序的承担服务器的识别信息作为对所述询问的答复而发送。
5. 根据权利要求1所述的系统,其特征在于:
所述多个承担服务器中的每一个还具有:
历史记录存储部,存储由所述输入数据交接部发送给承担服务器的输入数据及执行指示信息的历史记录;和
故障发生判断部,判断在作为所述输入数据交接部发送更新后的所述输入数据及执行指示信息的发送目的地的承担服务器中执行处理程序时是否发生了故障,
在所述故障发生判断部判断为发生了故障的情况下,
所述承担服务器选择部选择以更新后的所述输入数据为输入、执行下次应执行的处理程序的其他承担服务器,
所述输入数据交接部从所述历史记录存储部取得输入数据及执行指示信息,并发送给由所述承担服务器选择部选择的所述其他承担服务器。
6. 根据权利要求5所述的系统,其特征在于:
所述处理程序执行部在接收到所述输入数据的情况下,将表示“接收到输入数据”的接收通知发送到所述管理服务器,而在结束所述处理程序的执行的情况下,将表示“结束该处理程序的执行”的结束通知发送到所述管理服务器,
所述管理服务器还具备故障发生通知发送部,该故障发生通知发送部在从自任一承担服务器接收到所述接收通知起的预定基准处理时间内未从该承担服务器接收到所述结束通知的情况下,将表示“在该承担服务器中执行处理程序时发生了故障”的故障发生通知发送到作为向该承担服务器发送了输入数据的发送源的承担服务器,
所述故障发生判断部在接收到所述故障发生通知的情况下,判断为在作为由所述输入数据交接部发送更新后的所述输入数据及执行指示信息的发送目的地的承担服务器中执行处理程序时发生了故障。
7.根据权利要求5所述的系统,其特征在于:
在作为所述输入数据交接部发送了输入数据及执行指示信息的发送目的地的承担服务器中,
所述处理程序执行部在判断为不能新接收输入数据并执行处理程序的情况下,将表示“拒绝输入数据”的拒绝通知发送给作为该输入数据及该执行指示信息的发送源的承担服务器,
该作为发送源的承担服务器中的所述故障发生判断部在从该作为发送目的地的承担服务器接收到所述拒绝通知的情况下,判断为在该作为发送目的地的承担服务器中执行处理程序时发生了故障。
8. 根据权利要求5所述的系统,其特征在于:
所述管理服务器还具备删除指示部,该删除指示部在通过执行所述多个处理程序而完成了所述作业的情况下,从所述多个承担服务器的每一个中的所述历史记录存储部删除输入数据及执行指示信息。
9. 根据权利要求5所述的系统,其特征在于:
在所述多个承担服务器的每一个中,
所述承担服务器选择部从以更新后的所述输入数据为输入、启动了下次应执行的处理程序的多个承担服务器中相对于与该承担服务器间的通信速度慢的承担服务器优先选择该通信速度快的承担服务器作为所述其他承担服务器。
10. 根据权利要求1所述的系统,其特征在于:
所述多个承担服务器中的每一个还具有:
历史记录存储部,将通过所述处理程序执行部执行所述处理程序而变更的、该承担服务器上的数据的历史记录信息与可恢复该变更的信息相对应地进行存储;和
变更恢复部,在作为由所述输入数据交接部发送了更新后的所述输入数据及执行指示信息的发送目的地的承担服务器中执行处理程序时发生了故障的情况下,根据所述历史记录存储部的所述历史记录信息,恢复由所述处理程序执行部变更后的数据。
11.根据权利要求1所述的系统,其特征在于:
所述管理服务器还具备处理程序启动部,该处理程序启动部根据所生成的所述执行指示信息,以输入到所述作业中的所述输入数据为输入,检测出应在下次执行的各个处理程序,在与所述输入数据发送部的发送目的地不同的承担服务器之一中启动所检测出的各个处理程序之一。
12. 根据权利要求11所述的系统,其特征在于:
在所述多个承担服务器的每一个中,
所述处理程序执行部向所述管理服务器通知过去执行处理程序所需的处理量,
在所述管理服务器中,
所述处理程序启动部在由所述处理程序执行部通知的处理程序的过去处理量超过已启动了该处理程序的承担服务器可处理的最大处理量的情况下,在与所述输入数据发送部的发送目的地不同的承担服务器之一中启动该处理程序。
13. 根据权利要求1所述的系统,其特征在于:
所述管理服务器还具备处理程序启动部,该处理程序启动部以输入到所述作业中的所述输入数据为输入、检测出应执行的多个处理程序中的每一个,针对所检测出的各个处理程序,在以该输入数据为输入执行的该处理程序所需的处理量超过已启动了该处理程序的承担服务器可处理的最大处理量的情况下,在与所述输入数据发送部的发送目的地不同的承担服务器之一中启动该处理程序。
14. 根据权利要求1所述的系统,其特征在于:
所述处理程序执行部在自最后接收到输入数据及执行指示信息起的预定基准待机时间内未接收到输入数据及执行指示信息的情况下,中止该承担服务器对处理程序的执行。
15. 根据权利要求1所述的系统,其特征在于:
所述管理服务器还具备承担服务器变更部,该承担服务器变更部在所述多个承担服务器之一中,在通过所述处理程序执行部执行处理程序而使用的计算资源的使用率比预定的基准使用率低的情况下,使最大处理量少于该承担服务器的其他承担服务器执行该处理程序。
16. 根据权利要求1所述的系统,其特征在于:
在作为由所述输入数据交接部发送了输入数据及执行指示信息的发送目的地的承担服务器中,
所述处理程序执行部根据接收到的执行指示信息,检测与接收到的输入数据相对应的应该已被执行的处理程序,在检测出的该处理程序可由作为发送源的承担服务器执行的情况下,执行处理程序。
17. 根据权利要求1所述的系统,其特征在于:
在所述多个承担服务器的每一个中,
所述输入数据交接部生成更新后的所述输入数据或所述执行指示信息的电子署名,并将所生成的该电子署名与作为电子署名的对象的该输入数据及该执行指示信息相对应地进行发送,
在接收了输入数据、执行指示信息及电子署名的承担服务器中,所述处理程序执行部在所述电子署名得以正确验证的情况下执行处理程序。
18. 一种管理服务器,其管理多个承担服务器,该多个承担服务器分别执行从用于处理包含在用户所请求的作业中的多个步骤的多个处理程序中分配给该承担服务器的处理程序,其中,
所述多个承担服务器中的每一个具有:
处理程序执行部,通过以接收到的输入数据为输入、执行所分配的所述处理程序,来更新所述输入数据;
承担服务器选择部,根据与所述输入数据相对应地接收的执行指示信息,向所述管理服务器询问以更新后的所述输入数据为输入、执行下次应执行的处理程序的其他承担服务器,并选择利用作为询问结果的识别信息而识别出的其他承担服务器;和
输入数据交接部,将接收到的所述执行指示信息和更新后的所述输入数据相对应地发送到由所述承担服务器选择部选择的所述承担服务器,
所述管理服务器具备:
执行指示信息生成部,生成包含用以识别所述多个处理程序中的每一个的识别信息和所述多个处理程序的执行顺序的执行指示信息;
输入数据发送部,使输入到所述作业中的输入数据和所述执行指示信息相对应地发送到以所述输入数据为输入、执行应最先执行的处理程序的承担服务器;
承担服务器信息存储部,使用于识别多个处理程序中的每一个的识别信息与执行该处理程序的承担服务器的识别信息对应起来进行存储;以及
询问应对部,响应从所述承担服务器接受到询问的事实,从所述承担服务器信息存储部中取得与下次应执行的处理程序的识别信息相对应的承担服务器的识别信息,并将其作为针对上述询问的答复而予以发送。
19. 一种承担服务器,由管理服务器管理,执行从用于处理包含在用户所请求的作业中的多个步骤的多个处理程序中分配给该承担服务器的处理程序,其中,
所述管理服务器具有:
执行指示信息生成部,生成包含用以识别所述多个处理程序中的每一个的识别信息和所述多个处理程序的执行顺序的执行指示信息;
输入数据发送部,使输入到所述作业中的输入数据和所述执行指示信息相对应地发送到以所述输入数据为输入、执行应最先执行的处理程序的承担服务器;
承担服务器信息存储部,使用于识别多个处理程序中的每一个的识别信息与执行该处理程序的承担服务器的识别信息对应起来进行存储;以及
询问应对部,响应从所述承担服务器接受到询问的事实,从所述承担服务器信息存储部中取得与下次应执行的处理程序的识别信息相对应的承担服务器的识别信息,并将其作为针对上述询问的答复而予以发送,
所述承担服务器具备:
处理程序执行部,通过以接收到的所述输入数据为输入、执行所分配的所述处理程序来更新所述输入数据;
承担服务器选择部,根据对应于所述输入数据而接收的执行指示信息,向所述管理服务器询问以更新后的所述输入数据为输入、执行下次应执行的处理程序的其他承担服务器,并选择利用作为询问结果的识别信息而识别出的其他承担服务器;和
输入数据交接部,使所接收到的所述执行指示信息和更新后的所述输入数据相对应地发送到由所述承担服务器选择部选择的所述承担服务器。
20. 一种控制管理多个承担服务器的管理服务器的方法,该多个承担服务器分别执行从用于处理包含在用户所请求的作业中的多个步骤的多个处理程序中分配给该承担服务器的处理程序,其中,所述多个承担服务器中的每一个具有:
处理程序执行部,通过以接收到的输入数据为输入、执行所分配的所述处理程序来更新所述输入数据;
承担服务器选择部,根据对应于所述输入数据而接收的执行指示信息,向所述管理服务器询问以更新后的所述输入数据为输入、执行下次应执行的处理程序的其他承担服务器,并选择利用作为询问结果的识别信息而识别出的其他承担服务器;和
输入数据交接部,使接收到的所述执行指示信息和更新后的所述输入数据相对应地发送到由所述承担服务器选择部选择的所述承担服务器,
其中,所述方法具备:
执行指示信息生成步骤,生成包含用以识别所述多个处理程序中的每一个的识别信息和所述多个处理程序的执行顺序的执行指示信息;
输入数据发送步骤,使该输入数据和所述执行指示信息相对应地发送到以输入到所述作业中的输入数据为输入、执行应最先执行的处理程序的承担服务器;
承担服务器信息存储步骤,使用于识别多个处理程序中的每一个的识别信息与执行该处理程序的承担服务器的识别信息对应起来进行存储;以及
询问应对步骤,响应从所述承担服务器接受到询问的事实,从所述承担服务器信息存储步骤中取得与下次应执行的处理程序的识别信息相对应的承担服务器的识别信息,并将其作为针对上述询问的答复而予以发送。
21. 一种控制承担服务器的方法,所述承担服务器由管理服务器管理、并执行从用于处理包含在用户所请求的作业中的多个步骤的多个处理程序中分配给该承担服务器的处理程序,其中,
所述管理服务器具有:
执行指示信息生成部,生成包含用以识别所述多个处理程序中的每一个的识别信息和所述多个处理程序的执行顺序的执行指示信息;
输入数据发送部,使输入到所述作业中的输入数据和所述执行指示信息相对应地发送到以所述输入数据为输入、执行应最先执行的处理程序的承担服务器;
承担服务器信息存储部,使用于识别多个处理程序中的每一个的识别信息与执行该处理程序的承担服务器的识别信息对应起来进行存储;以及
询问应对部,响应从所述承担服务器接受到询问的事实,从所述承担服务器信息存储部中取得与下次应执行的处理程序的识别信息相对应的承担服务器的识别信息,并将其作为针对上述询问的答复而予以发送,
所述方法包括:
处理程序执行步骤,通过以接收到的所述输入数据为输入、执行所分配的所述处理程序来更新所述输入数据;
承担服务器选择步骤,根据对应于所述输入数据而接收的执行指示信息,向所述管理服务器询问以更新后的所述输入数据为输入、执行下次应执行的处理程序的其他承担服务器,并选择利用作为询问结果的识别信息而识别出的其他承担服务器;和
输入数据交接步骤,使接收到的所述执行指示信息和更新后的所述输入数据相对应地发送到在所述承担服务器选择步骤中选择的所述承担服务器。
CNB2005800052414A 2004-02-18 2005-02-15 管理服务器、承担服务器及其所构成的系统和控制方法 Active CN100424649C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004041611 2004-02-18
JP041611/2004 2004-02-18

Publications (2)

Publication Number Publication Date
CN1922578A CN1922578A (zh) 2007-02-28
CN100424649C true CN100424649C (zh) 2008-10-08

Family

ID=34857940

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005800052414A Active CN100424649C (zh) 2004-02-18 2005-02-15 管理服务器、承担服务器及其所构成的系统和控制方法

Country Status (10)

Country Link
US (1) US7975268B2 (zh)
EP (1) EP1722302B1 (zh)
JP (1) JP4197701B2 (zh)
KR (1) KR100810015B1 (zh)
CN (1) CN100424649C (zh)
BR (1) BRPI0507844B1 (zh)
CA (1) CA2553416A1 (zh)
IL (1) IL177553A (zh)
TW (1) TWI335541B (zh)
WO (1) WO2005078581A1 (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4751265B2 (ja) * 2006-08-01 2011-08-17 株式会社日立製作所 リソース管理システム及びその方法
JP4826405B2 (ja) * 2006-09-19 2011-11-30 株式会社デンソー ネットワークシステム,ネットワークデバイスおよびプログラム
JP4757175B2 (ja) * 2006-11-24 2011-08-24 キヤノン株式会社 情報処理装置及びアプリケーション管理方法
KR100847461B1 (ko) * 2007-06-01 2008-07-18 코아인텍주식회사 입출력 공유 장치를 이용하여 구축된 서버 시스템 및 상기서버 시스템을 구축하는 방법
KR100919475B1 (ko) * 2007-11-27 2009-09-28 인하대학교 산학협력단 퍼지로직기반 그리드데이터 전송제어장치 및 전송제어방법
US20090222506A1 (en) * 2008-02-29 2009-09-03 Evident Software, Inc. System and method for metering and analyzing usage and performance data of a virtualized compute and network infrastructure
JP2009217405A (ja) * 2008-03-07 2009-09-24 Nec Corp ジョブネットワーク自動生成方式及びプログラム
JP5236352B2 (ja) * 2008-05-15 2013-07-17 株式会社日立製作所 アプリケーション配信制御システム、アプリケーション配信制御方法、情報処理装置、およびクライアント端末
JP5262593B2 (ja) * 2008-11-10 2013-08-14 富士通株式会社 データ転送システム、及びデータ転送方法
US8656419B2 (en) * 2009-07-02 2014-02-18 Ca, Inc. Dynamic distributed evaluator
JP5655286B2 (ja) * 2009-09-24 2015-01-21 ソニー株式会社 通信方法、通信システム、サーバおよびプログラム
JP5420358B2 (ja) * 2009-09-24 2014-02-19 株式会社日立システムズ バッチ処理実行方法及びバッチ処理実行システム
US20140297597A1 (en) * 2010-09-27 2014-10-02 Hitachi, Ltd. Computer system and management method for the same
JP5146520B2 (ja) * 2010-11-16 2013-02-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理システム及び画像処理方法
JP5321569B2 (ja) * 2010-12-02 2013-10-23 コニカミノルタ株式会社 画像処理システム、画像処理方法、画像処理サーバ及び画像形成装置並びに画像処理プログラム
JP5746878B2 (ja) * 2011-02-18 2015-07-08 株式会社日立製作所 バッチ処理の実行管理方法
JP2013012014A (ja) * 2011-06-29 2013-01-17 Yahoo Japan Corp アプリケーションプラットフォーム装置、アプリケーションプラットフォームシステム及びアプリケーションプラットフォーム装置の動作方法
US9547575B2 (en) * 2011-08-30 2017-01-17 Amazon Technologies, Inc. Managing host computing devices
US9494924B2 (en) 2012-05-18 2016-11-15 Kabushiki Kaisha Toshiba Social infrastructure control system, control method, control apparatus, and server
US10282782B2 (en) 2012-11-13 2019-05-07 Trading Technologies International, Inc. Distributed spreading tools and methods
JP6303300B2 (ja) * 2013-06-25 2018-04-04 富士通株式会社 制御依頼方法、情報処理装置、システム、およびプログラム
JP5467172B1 (ja) * 2013-09-18 2014-04-09 オリバー カルトシュタイン 情報処理システム、および情報処理方法
US9846618B2 (en) * 2013-12-27 2017-12-19 Oracle International Corporation System and method for supporting flow control in a distributed data grid
JP2016045930A (ja) * 2014-08-22 2016-04-04 キヤノン株式会社 管理システム、及び、管理システムの制御方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03204035A (ja) * 1989-12-29 1991-09-05 Nec Corp ネットワークジョブステップ実行制御方式
JP2001325041A (ja) * 2000-05-12 2001-11-22 Toyo Eng Corp 計算機資源活用方法及びシステム
JP2002073576A (ja) * 2000-08-31 2002-03-12 Toshiba Corp バッチジョブ制御システム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL99923A0 (en) * 1991-10-31 1992-08-18 Ibm Israel Method of operating a computer in a network
US20020019844A1 (en) 2000-07-06 2002-02-14 Kurowski Scott J. Method and system for network-distributed computing
JP2002073596A (ja) * 2000-08-29 2002-03-12 Nec System Technologies Ltd 外字を含むテキストのコード変換方法
US6996548B2 (en) 2001-05-11 2006-02-07 Hemisphere Ii Investment Lp Method and apparatus for providing a reward for the use of a processor in a parallel processing environment
KR100447869B1 (ko) 2001-12-27 2004-09-08 삼성전자주식회사 다핀 적층 반도체 칩 패키지 및 이에 사용되는 리드 프레임
US20030220960A1 (en) 2002-05-21 2003-11-27 Demoff Jeff S. System and method for processing data over a distributed network
US8020162B2 (en) * 2002-07-19 2011-09-13 International Business Machines Corporation Employing a resource broker in managing workloads of a peer-to-peer computing environment
ATE343817T1 (de) * 2003-04-23 2006-11-15 Comptel Corp Ereignisvermittlung
US20040225711A1 (en) * 2003-05-08 2004-11-11 Spotware Technologies, Inc. System for administering computers on a computing grid
US7464159B2 (en) * 2004-01-14 2008-12-09 International Business Machines Corporation Managing analysis of a degraded service in a grid environment

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03204035A (ja) * 1989-12-29 1991-09-05 Nec Corp ネットワークジョブステップ実行制御方式
JP2001325041A (ja) * 2000-05-12 2001-11-22 Toyo Eng Corp 計算機資源活用方法及びシステム
JP2002073576A (ja) * 2000-08-31 2002-03-12 Toshiba Corp バッチジョブ制御システム

Also Published As

Publication number Publication date
JP4197701B2 (ja) 2008-12-17
IL177553A0 (en) 2006-12-10
KR20060121962A (ko) 2006-11-29
US7975268B2 (en) 2011-07-05
EP1722302A4 (en) 2008-04-16
WO2005078581A1 (ja) 2005-08-25
EP1722302B1 (en) 2013-11-27
CA2553416A1 (en) 2005-08-25
KR100810015B1 (ko) 2008-03-10
BRPI0507844B1 (pt) 2022-05-17
JPWO2005078581A1 (ja) 2008-02-21
BRPI0507844A (pt) 2007-07-10
TW200606719A (en) 2006-02-16
US20090204694A1 (en) 2009-08-13
EP1722302A1 (en) 2006-11-15
IL177553A (en) 2013-03-24
TWI335541B (en) 2011-01-01
CN1922578A (zh) 2007-02-28

Similar Documents

Publication Publication Date Title
CN100424649C (zh) 管理服务器、承担服务器及其所构成的系统和控制方法
KR102240557B1 (ko) 데이터 저장 방법, 장치 및 시스템
CN1959717B (zh) 订单驱动的海量遥感数据集群化预处理系统及其方法
US9037505B2 (en) Mechanisms for executing a process in a cloud computing environment
JP4597488B2 (ja) プログラム配置方法及びその実施システム並びにその処理プログラム
US8862833B2 (en) Selection of storage containers for thin-partitioned data storage based on criteria
CN1153159C (zh) 基于服务器的手持应用和数据库管理的方法和设备
US20080052331A1 (en) Data arrangement management system, method, and program
US10310900B2 (en) Operating programs on a computer cluster
CN102799485B (zh) 历史数据的迁移方法及装置
US20110113429A1 (en) Incident management method and operation management server
JP6235156B2 (ja) 計算機システムおよび負荷平準化プログラム
CN111913925A (zh) 一种分布式存储系统中的数据处理方法及系统
US20090089772A1 (en) Arrangement for scheduling jobs with rules and events
CN102597957B (zh) 系统部署确定系统、系统部署确定方法及程序
JP2008059599A (ja) 仮想化されたリソースの割当て方法及びその実施システム
CN112241314B (zh) 多Kubernetes集群管理方法、装置和可读介质
CN115757270A (zh) 一种文件版本管理系统、方法及计算机设备
JP5737789B2 (ja) 仮想マシン運用監視システム
CN107016007B (zh) 基于数据仓库进行大数据处理的方法以及装置
US11733899B2 (en) Information handling system storage application volume placement tool
JP2011258222A (ja) 業務リソース管理方法及びその実施システム
US20230155958A1 (en) Method for optimal resource selection based on available gpu resource analysis in large-scale container platform
CN114153389A (zh) 一种异常zone自动补齐方法、装置及设备
CN115408341A (zh) 文件删除方法、系统、装置、处理器及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211208

Address after: USA New York

Patentee after: Qindarui Co.

Address before: USA New York

Patentee before: International Business Machines Corp.

TR01 Transfer of patent right