CN1534949A - 用于获取网格中的状态信息的方法和设备 - Google Patents

用于获取网格中的状态信息的方法和设备 Download PDF

Info

Publication number
CN1534949A
CN1534949A CNA2004100302614A CN200410030261A CN1534949A CN 1534949 A CN1534949 A CN 1534949A CN A2004100302614 A CNA2004100302614 A CN A2004100302614A CN 200410030261 A CN200410030261 A CN 200410030261A CN 1534949 A CN1534949 A CN 1534949A
Authority
CN
China
Prior art keywords
job
handling system
data handling
identifier
job identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004100302614A
Other languages
English (en)
Other versions
CN1298151C (zh
Inventor
苏珊娜・M・基奥恩
苏珊娜·M·基奥恩
德・F・迈克布雷蒂
杰拉尔德·F·迈克布雷蒂
P・马伦
肖恩·P·马伦
・K・穆里洛
杰西卡·K·穆里洛
・石萌海
约翰尼·石萌海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1534949A publication Critical patent/CN1534949A/zh
Application granted granted Critical
Publication of CN1298151C publication Critical patent/CN1298151C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multi Processors (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供用于获取在网格中执行的进程的状态信息的方法、设备,计算机指令。响应将一个作业从数据处理系统提交到网格上的远程节点,从该远程节点接收一个作业标识符。作业标识符保存在一个作业标识符的集合中。响应对从数据处理系统提交的作业的状态的请求,对于仍在执行的进程,提交作业标识符集合中的每个作业标识符的作业状态请求,使用该作业标识符集合以形成一个作业状态请求的集合。接收对作业状态请求集合的响应。然后呈现响应。

Description

用于获取网格中的状态信息的方法和设备
技术领域
一般来说,本发明涉及一种改进的数据处理系统,具体来说,涉及一种用于进行数据处理的改进的方法和设备。更具体来说,本发明提供用于从网格中的节点获取状态信息的方法、设备和计算机指令。
背景技术
网络数据处理系统在商业和研究的各个方面广泛地使用。这些网络用于传递数据和思想并提供用于存储信息的仓库。此外,在很多情况下,可以使用构成网络数据处理系统的不同的节点来处理数据。单个节点可以执行不同的任务。此外,使用不同的节点一起协作解决一个诸如复杂的计算之类的共同的问题也越来越常见。一组参与资源共享方案的节点也被称为“网格”或“格型网络”。例如,格型网络中的节点可以共享处理资源以执行诸如破译密码之类的复杂的计算。
格型网络中的节点可以包含在诸如局域网(LAN)或广域网(WAN)之类的网络数据处理系统内。这些节点还可以位于不同的地理位置。例如,连接到因特网的不同的计算机可以向格型网络提供处理资源。通过使用成千上万的单个计算机,可以迅速地解决大的问题。在诸如癌症研究、物理学和地球科学之类的许多区域都使用网格。
用户可以提交作业以便在网格中的其他节点上远程运行的作业。这些作业通常被提交到诸如网格资源应用程序管理(GRAM)服务之类的服务器进程。网格资源应用程序管理器允许程序在远程资源上启动,即使那些资源在不同的平台上运行。
在某些时间点,用户接收作业处理的结果。本发明认识到用户时常会需要在接收到结果之前获取有关远程节点处理这些作业的状态信息。当前,在这种类型的对作业的分布式处理方面,没有这样的功能。
因此,最好具有一种用于获取在网络数据处理系统中的远程节点上执行的作业的状态信息的改进的方法、设备和计算机指令。
发明内容
本发明提供用于获取在网格中执行的进程的状态信息的方法、设备,计算机指令。响应将一个作业从数据处理系统提交到网格上的远程节点,从该远程节点接收一个作业标识符。作业标识符保存在一个作业标识符的集合中。响应对从数据处理系统提交的作业的状态的请求,对于仍在执行的进程,提交作业标识符集合中的每个作业标识符的作业状态请求,使用该作业标识符集合以形成一个作业状态请求的集合。接收到对作业状态请求集合的响应。然后呈现响应。
附图说明
在所附的权利要求中阐述了本发明的新颖的特征。然而,本发明本身,以及优选的使用模式,进一步的目标和优点,通过参考对说明性的实施例的详细描述并参考附图,将得到最好的理解,其中:
图1描述了在其中可以实现本发明的数据处理系统的网络的图形表示;
图2是根据本发明的优选实施例可以作为服务器实现的数据处理系统的方框图;
图3是说明可以在其中实现本发明的数据处理系统的方框图;
图4说明根据本发明的优选实施例的网格中的组件;
图5说明根据本发明的优选实施例对my-job-submit命令的响应;
图6说明根据本发明的优选实施例的用于获取状态信息的一个条目;
图7说明根据本发明的优选实施例的包含状态信息的响应;
图8是根据本发明的优选实施例的作业状态信息的显示的示例;
图9是根据本发明的优选实施例的提交一个作业的过程的流程图;
图10是根据本发明的优选实施例的处理一个状态命令的过程的流程图;
图11是根据本发明的优选实施例的处理返回的状态信息的过程的流程图;
图12是说明根据本发明的优选实施例my-job-submit命令的伪码;
图13是说明根据本发明的优选实施例的网格进程状态命令的伪码。
具体实施方式
现在参考附图,图1描述了在其中可以实现本发明的数据处理系统的网络的图形表示。网络数据处理系统100是在其中可以实现本发明的数据处理系统的计算机网络。网络数据处理系统100包含网络102,该网络是用来在网络数据处理系统100内连接在一起的各个设备和计算机之间提供通信链路的媒介。网络102可以包括诸如有线、无线通信链路或光纤电缆之类的连接。
在所描述的示例中,服务器104与存储单元106一起连接到网络102。此外,客户端108、110和112也连接到网络102。这些客户端108、110和112可以是个人计算机或网络计算机。在所描述的示例中,服务器104为客户端108-112提供诸如启动文件、操作系统映像和应用程序之类的数据。客户端108、110和112是服务器104的客户端。网络数据处理系统100可以包括更多的服务器、客户端,及其他未显示的设备。在所描述的示例中,网络数据处理系统100是因特网,网络102表示全世界的网络和网关的集合,它们使用传输控制协议/Internet协议(TCP/IP)协议套件彼此进行通信。在因特网的中心是由成千上万的商业、政府、教育及其他计算机系统构成的主节点或主计算机之间的高速数据通信线路的主干网,它们路由数据和消息。当然,网络数据处理系统100还可以作为许多不同类型的网络来实现,例如,内部网、局域网(LAN)或广域网(WAN)。图1只作为示例,而不是对本发明的体系结构作出限制。网络数据处理系统100内的不同的服务器和客户端还被称为节点。
请参看图2,该图描述了根据本发明的优选实施例的可以作为服务器(如图1中的服务器104)实现的数据处理系统的方框图。数据处理系统200可以是包括连接到系统总线206的许多处理器202和204的对称多处理器(SME)系统。或者,也可以使用单处理器系统。与系统总线206相连接的还有存储器控制器/缓存208,它提供了到本地存储器209的接口。I/O总线桥接器210连接到系统总线206,并提供到I/O总线212的接口。如本文所述,存储器控制器/缓存208和I/O总线桥接器210可以集成在一起。
连接到I/O总线212的外围组件互连(PCI)总线桥接器214提供了到PCI本地总线216的接口。许多调制解调器可以连接到PCI本地总线216。典型的PCI总线实现方式将支持四个PCI扩展槽或插入式连接器。到图1中的客户端108-112的通信链路可以通过调制解调器218和通过插入式电路板连接到PCI本地总线216的网络适配器220来提供。
更多的PCI总线桥接器222和224为更多的PCI本地总线226和228提供了接口,从这些接口,可以支持更多的调制解调器或网络适配器。如此,通过数据处理系统200,可以连接到多个网络计算机。如文本所描述的,内存映射图形适配器230和硬盘232还可以直接或间接地连接到I/O总线。
那些精通本技术的普通人员将认识到,图2所描述的硬件可以不同。例如,除了所描述的硬件,也可以使用诸如光盘驱动器之类的其他外围设备,或者代替所描述的硬件。所描述的示例不对本发明的体系结构作出限制。
图2中所描述的数据处理系统可以是,运行高级交互执行(AIX)操作系统或LINUX操作系统的IBM eServer pSeries系统,该系统是位于纽约Armonk的IBM公司的产品。
现在参考图3,该图描述了说明在其中可以实现本发明的数据处理系统的方框图。数据处理系统300是客户计算机的一个示例。数据处理系统300使用外围组件互连(PCI)本地总线体系结构。虽然所描述的示例使用了PCI总线,但是也可以使用诸如加速图形端口(AGP)和工业标准体系结构(ISA)之类的其他总线体系结构。处理器302和主存储器304通过PCI桥接器308连接到PCI本地总线306。PCI桥接器308还可以包括集成的存储器控制器和处理器302的高速缓冲存储器。到PCI本地总线306的更多的连接可以通过直接组件互连或通过插入式电路板进行。在所描述的示例中,局域网(LAN)适配器310、SCSI主机总线适配器312和扩展总线接口314通过直接组件连接而连接到PCI本地总线306。与此对比,音频适配器316、图形适配器318和音频/视频适配器319通过插入到扩展槽中的插入式电路板连接到PCI本地总线306。扩展总线接口314为键盘和鼠标适配器320、调制解调器322和更多的存储器324提供了连接。小型计算机系统接口(SCSI)主机总线适配器312为硬盘驱动器326、磁带驱动器328和光盘驱动器330提供了连接。
操作系统在处理器302上运行,并用于协调和提供对图3中的数据处理系统300内的各个组件的控制。操作系统可以是诸如可以从Microsoft Corporation获取的Windows XP之类的市场上可买到的操作系统。诸如Java之类的面向对象的程序设计系统可以与操作系统一起运行,并提供从在数据处理系统300上执行的Java程序或应用程序对操作系统的调用。“Java”是Sun Microsystems,Inc.的商标。操作系统、面向对象的操作系统和应用程序或程序的指令位于诸如硬盘驱动器326之类的存储设备上,并可以加载到主存储器304中以供处理器302执行。
那些精通本技术的普通人员将认识到,图3中的硬件可以随实现方式不同而不同。除了图3中所描述的硬件之外,还可以使用诸如flash只读存储器(ROM)、等效的非易失性存储器或光盘驱动器之类的其他内部硬件或外围设备,或代替它们。此外,本发明的进程还可以应用于多处理器数据处理系统。
图3中所描述的示例和上文描述的示例不对本发明的体系结构作出限制。作为另一个示例,数据处理系统300可以是个人数字助理(PDA)设备或笔记本电脑。
本发明提供用于获取在网格内执行的进程的状态信息的方法、设备,计算机指令。本发明的机制提供了在一个节点获取在网格中的一个远程节点上执行的作业的状态信息的能力。本发明的机制涉及当提交作业供执行时存储所返回的作业标识符的方法。当前,还没有这样的进程可用于保存这些作业标识符并使用这些标识符来获取有关在远程节点上执行的进程的状态信息。此作业标识符用于发送请求以获取远程进程的状态信息。此机制提供了对目前可用的UNIX命令“ps”的扩展,该命令用于本地检查进程状态。本发明的机制提供了获取远程执行的进程的信息的能力。
现在参考图4,该图描述了一个说明根据本发明的优选实施例的在网络数据处理系统中的分布式逻辑单元中使用的组件。在此示例中,节点400、402、404、406、408、410和412是一个网格中的节点。节点414、416和418不是该网格的一部分。这些节点可以位于诸如图1中的网络数据处理系统100之类的网络数据处理系统中。在本示例中,这些节点都是因特网的一部分。
网格中的不同的节点彼此通过网格进程连接在一起。这些进程可以是一个工具包,例如,Globus Toolkit 2.2,可以从GlobusProject中获取,网址是www.globus.org。Globus Project是一个致力于将网格的概念应用于科学和工程计算的研究和开发项目。虽然这些实施例中所说明的示例和命令是与Globus Toolkit 2.2一起使用的,但是,依据特定的实现方式,也可以使用其他类型的网格处理软件。
在此示例中,节点404可以充当网格资源应用程序管理(GRAM)服务,用于接收和为不同的节点分配应用程序以供执行。节点404接收来自用户的请求。当用户首先用一个pass-phrase注册,附加将与用户尝试执行的所有程序关联的数字证书时,接收这些请求。然后,从执行应用程序管理器中选择一个应用程序。然后,可以与任何其他必要的远程资源一起选择一个或多个节点。
例如,位于节点400的一个用户向节点404提交一个或多个作业以供执行。节点404选择一个或多个节点处理这些作业。作业是可以被监视的任何任务或可执行程序。“任务”可以是传感器或其他机制。网格计算被设计为利用非计算机程序。例如,可以收集被调用以钉钉子的网格附加的机制的状态,此机制回报钉子的数量。这就产生这样的可能性,当调用该进程时,这样的机制可能需要报告获取进程状态的方法。例如,当作业被提交到叫做“Nail-pounder”的网格节点时,此节点回报,程序“number-pounded-status”是当希望作业的状态时调用的状态程序。
在这些示例中,作业是使用globus-job-submit请求或命令提交到网格的。作为此进程的一部分,节点404将选择在选定的节点处理该作业所需要的相应的应用程序。例如,节点408和410可以被选定为作为处理从节点400提交的作业的节点。然后,节点404用相应的应用程序将作业发送到节点408和410以供执行。
位于节点400的一个用户可能需要获取节点408和410正在处理的作业的状态。在这些示例中,本发明的机制提供了一个附加命令(网格进程状态(GPS)命令),以便节点400获取有关在远程节点处理的作业的状态信息。此机制只需要对希望状态信息的客户端进行修改。不需要对诸如节点404提供的GRAM服务之类的服务器进程进行更改。
在节点400生成网格进程状态命令的过程中,一个作业通过globus-job-submit被提交到网格。在此示例中,作业被提交到节点404。当请求作业时存储的信息启用了此命令。本发明的机制包括“my-job-submit”命令。当使用此命令将作业提交到网格时,本发明的机制创建了放在globus-job-submit周围的wrapper,以读取globus-job-submit返回的返回资源规范定义语言(RSL)字符串。RSL提供了描述资源的一个通用交互语言。Globus ResourceManagement体系结构的各个组件操纵RSL字符串,以与系统中的其他组件协同执行它们的管理功能。RSL提供了用于撰写复杂的资源描述的骨干语法,各个资源管理组件向此通用结构中引入了特定的<attribute,value>对。资源描述中的每个属性都充当控制资源管理系统中的一个或多个组件的行为的参数。
在这些示例中,wrapper被称为wrapper“my-job-submit”。My-job-submit命令将创建一个文件$HOME/.globus_job/<remote_hostname>,如果这样的文件<remote_hostname>在提交作业的节点上不存在的话。当返回响应时,从返回RSL字符串中获取远程主机名。还从存储在$HOME/.globus_job/<remote_hostname>文件中的RSL字符串中提取远程进程ID。
然后,当用户需要获取状态信息时,用户输入命令“gps”。此命令读取$HOME/.globus_job目录中的所有文件。此后,该命令向这些主机发出远程作业,以获取在这些主机上运行的作业的进程状态,并搜索存储在关联的$HOME/.globus_job/<remote_hostname>文件中的对应的进程ID。在所说明的示例中,这些作业请求可以直接发送到节点或通过网格服务器进程发送,具体情况取决于特定的实现方式。
在此示例中,节点400可以使用诸如图2中的数据处理系统200之类的服务器来实现。其他节点可以使用诸如图3中的数据处理系统300之类的数据处理系统来实现。
现在参考图5,该图描述了一个根据本发明的优选实施例的对my-job-submit命令的响应。字符串500是发回到使用my-job-submit命令提交作业的节点的作业ID字符串的示例。此字符串还被称为“资源列表”并被本发明的机制用来获取有关作业的状态信息。在这些示例中,此字符串是执行该进程的globus作业管理器创建的。globus作业管理器是在处理作业的远程节点上执行的程序或进程。字符串500的部分502包含进程标识符(PID)。
在图6中,描述了一个根据本发明的优选实施例获取状态信息。条目600位于文件602中。文件602的文件名表示这些示例中的远程主机的名称。在这些示例中,此文件存储在一个叫做“$HOME/.globus_job”的目录中。文件604用于另一个叫做“<otherhost>”的主机。在此示例中,条目600包括进程ID 606和作业ID 608。当诸如字符串500之类的作业ID字符串响应my-job-submit命令返回时,保存此信息。接下来,当执行一个网格进程状态命令时,本发明的机制提交一个叫做“ps-efl”的作业以获取进程信息。
在此示例中,“ps”是process status(进程状态)的缩写,而“efl”是对进程状态的请求的选项。ps命令打印有关活动进程的信息。在没有标志的情况下,ps打印有关与控制终端关联的进程的信息。输出包含进程ID、终端标识符、累积执行时间和命令名称。在有标志的情况下,显示的信息也相应地不同。例如,“-e”是写入到有关内核进程除外的所有进程的标准输出信息的选项;“-f”是生成完整列表的选项;“-1”是生成长列表的选项。如上面的nail-pounder示例中所提及的,这可以是提交作业时远程节点所返回的任何状态监视程序。
在图7中,描述了一个根据本发明的优选实施例的包含状态信息的响应。响应700是当提交ps-efl作业时返回的响应的示例。全局进程状态命令格式化每个进程ID的返回的信息。
现在请看图8,该图描述了根据本发明的优选实施例的作业状态信息的显示示例。在此示例中,显示800显示了单项作业进程的信息。当然,许多作业进程可以存在于作业800内。在此示例中,显示800提供了每个进程的下列字段:F 801、S 802、UID 804、PID 806、PPID 808、C 810、PRI 812、NI 814、ADDR 816、SZ818、WCHAN 820、STIME 822、TTY 824、TIME 826和CMD828。F 801包括与进程或线程(如果指定了-L选项)关联的标志(十六进制和附加)。S 802表示进程或内核线程的状态,而UID804是进程的用户ID号。PID 806表示作业的进程ID。此进程ID是只对运行该进程的节点是唯一的。PPID 808是父进程的进程ID。接下来,C 810是进程或线程的CPU使用率。每当系统时钟滴答响并发现进程或线程正在运行时,此值都增大。该值被计划程序通过每秒钟将它除以2来减少。对于sehed_other策略,使用CPU使用率来确定进程调度优先级。值大表示进程消耗的CPU大,导致进程优先级降低,而值小表示进程消耗I/O大,导致优先级比较高。此字段的默认标头是C。
PRI 812表示进程或内核线程的优先级。PRI 812中的数字越大,意味着优先级越低。NI 814表示在计算sched_other策略的优先级时所使用的进程的nice值。
ADDR 816包含进程堆栈的段号(如果正常);如果是内核进程,则包含预处理数据区的地址。SZ 818表示进程的核心映像的以页表示的大小。WCHAN 820是进程或内核线程正在等待或睡眠的事件。对于内核线程,如果内核线程正在运行,则此字段为空。对于进程,如果只有一个内核线程正在睡眠,等待通道被定义为睡眠内核线程的等待通道;否则,显示一个星。
STIME 822表示进程的启动时间。LANG环境变量控制此字段的外观。TTY 824是进程的控制工作站“-”表示进程不与工作站关联,“?”表示工作站未知。TIME 826表示进程的总执行时间。CMD 828包含命令名称。完整的命令名称以及其参数显示在此图中。
此外,除了在视觉上呈现信息之外,还可以使用其他类型的呈现。例如,其他信息可以通过扬声器在听觉上呈现。
下面请参考图9,该图描述了根据本发明的优选实施例的提交一个作业的进程的流程图。此进程是当使用my-job-submit命令时启动的进程的示例。图9中说明的进程可以在诸如图4中的节点400之类的节点中实现。
该进程以提交一个作业以便让远程资源处理开始(步骤900)。此作业是使用my-job-submit命令提交的。接收返回字符串(步骤902)。从此返回字符串,进程ID和作业ID被保存(步骤904),处理此后结束。此信息保存在诸如图6中的文件602之类的文件中,用于获取有关远程节点的状态信息。如果作业结束,不响应ps命令报告PID。如果作业完成,则报告完成。
下面请参考图10,该图描述了根据本发明的优选实施例的处理一个状态命令的进程的流程图。响应网格状态进程命令的执行,启动了图10中说明的进程。此图中说明的步骤显示了提交状态信息请求的网格进程状态命令的一部分。此进程可以在诸如图4中的节点400之类的节点上执行。
进程以标识文件开始(步骤1006)。这些文件在存储了进程的文件的目录或文件夹中标识。这些文件可以是图6中的文件602和604之类的文件。此后,选择其中一个标识的文件以便进行处理(步骤1002)。此后,提交一个作业以获取进程状态(步骤1004)。接下来,确定是否存在更多未处理的文件(步骤1006)。如果存在更多的文件,则进程返回到如上所述的步骤1002,否则,进程结束。
现在参考图11,该图描述了根据本发明的优选实施例的用于处理返回的状态信息的进程的流程图。图11中说明的进程说明了当返回有关进程的状态信息时网格状态进程命令所使用的步骤。
进程以等待接收响应开始(步骤1100)。当接收到响应时,此响应显示在诸如图8中的显示800之类的显示中(步骤1102)。然后,进程确定是否会有更多响应(步骤1104)。如果会有更多响应,则进程返回到步骤1100。否则,进程结束。
下面请参考图12,该图描述了说明根据本发明的优选实施例的my-job-submit命令的伪码。代码1200是解释器命令或解释器脚本中的代码的示例。代码1200提交所需要的作业并将保存返回字符串,稍后用于获取状态信息。
参考图13,该图描述了说明根据本发明的优选实施例的网格进程状态命令的伪码。代码1300是解释器命令或解释器脚本中的代码的示例。在此示例中,代码1300实现了用于标识当前正在处理的作业的进程。
因此,本发明提供了用于获取在远程节点上执行的进程的状态信息的方法、设备和计算机指令。本发明的机制为一个节点上的用户提供获取有关在远程节点上执行的进程的信息。此机制不要求对于执行状态命令的客户端或节点位于远程的进程或服务进行修改。
本发明的机制提供了新的job-submit-command,my-job-submit,该命令提交作业并保存返回字符串,用于获取状态信息。此外,本发明的机制提供了网格进程状态命令,该命令用于通过my-job-submit命令保存的信息获取远程节点上的作业的状态信息。
值得注意的是,尽管是在完全运转的数据处理系统的上下文中描述本发明的,那些精通本技术的普通人员将认识到,本发明的进程能够以计算机可读的指令介质的形式和各种各样的形式分配,本发明同样适用,不管实际用于执行分配的信号承载介质的特定类型如何。计算机可读的介质的示例包括可记录类型的介质,如软盘、硬盘驱动器、RAM、CD-ROM、DVD-ROM、传输类型的介质,例如数字和模拟通信链路,通过诸如射频和光波传输的传输形式的有线或无线通信链路。计算机可读的介质可以采取编码格式的形式,这些编码在特定数据处理系统中实际使用时被解码。
本发明的说明书只作说明,而不是详尽的说明或限于所说明的形式。那些精通本技术的普通人员将认识到,可以进行许多修改。所选择的实施例是为了最好地说明本发明的原理,实际应用,并使精通本技术的其他人懂得,带有各种修改的各个实施例也是可以接受的。

Claims (20)

1.一种数据处理系统中的用于获取在网格中执行的进程的状态信息的方法,该方法包括:
响应将一个作业从数据处理系统提交到网格上的远程节点,从该远程节点接收一个作业标识符;
将作业标识符保存在一个作业标识符的集合中;
响应对从数据处理系统提交的作业的状态的请求,对于仍在执行的进程,提交作业标识符集合中的每个作业标识符的作业状态请求,使用该作业标识符集合以形成一个作业状态请求的集合;
接收对作业状态请求集合的响应;以及
呈现所述响应。
2.根据权利要求1所述的方法,其特征在于,作业标识符保存在一个文件中。
3.根据权利要求1所述的方法,进一步包括:
如果对一个作业状态请求的响应表明,一个特定的作业已经完成,则删除作业标识符集合中该特定作业的特定作业标识符。
4.根据权利要求1所述的方法,进一步包括:
将作业标识符保存于在数据处理系统上执行的本地作业的作业标识符集合中。
5.根据权利要求1所述的方法,其特征在于,作业标识符集合内的每个作业标识符是唯一的标识符。
6.根据权利要求1所述的方法,其特征在于,对作业的状态的请求是响应用户输入和周期性的事件中的至少一个生成的。
7.根据权利要求1所述的方法,其特征在于,远程节点是一个GRAM。
8.根据权利要求1所述的方法,其特征在于,响应是使用显示屏幕和扬声器中的至少一个呈现的。
9.一种用于获取在网格中执行的进程的状态信息的数据处理系统,该数据处理系统包括:
第一接收装置,用于响应将一个作业从数据处理系统提交到网格上的远程节点,从该远程节点接收一个作业标识符;
保存装置,用于将作业标识符保存在一个作业标识符的集合中;
提交装置,用于响应对从数据处理系统提交的作业的状态的请求,对于仍在执行的进程,提交作业标识符集合中的每个作业标识符的作业状态请求,使用该作业标识符集合以形成一个作业状态请求的集合;
第二接收装置,用于接收对作业状态请求集合的响应;以及
呈现装置,用于呈现响应。
10.根据权利要求9所述的数据处理系统,其特征在于,作业标识符保存在一个平面文件中。
11.根据权利要求9所述的数据处理系统,进一步包括:
删除装置,用于,如果对一个作业状态请求的响应表明,一个特定的作业已经完成,则删除作业标识符集合中该特定作业的特定作业标识符。
12.根据权利要求9所述的数据处理系统,进一步包括:
保存装置,用于将作业标识符保存于在数据处理系统上执行的本地作业的作业标识符集合中。
13.根据权利要求9所述的数据处理系统,其特征在于,作业标识符集合内的每个作业标识符是唯一的标识符。
14.根据权利要求9所述的数据处理系统,其特征在于,对作业的状态的请求是响应用户输入和周期性的事件中的至少一个生成的。
15.根据权利要求9所述的数据处理系统,其特征在于,远程节点是一个GRAM。
16.根据权利要求9所述的数据处理系统,其特征在于,响应是使用显示屏幕和扬声器中的至少一个呈现的。
17.一种用于获取在网格中执行的进程的状态信息的数据处理系统,该数据处理系统包括:
总线系统;
连接到总线系统的存储器,其中,该存储器包含一个指令集;
连接到总线系统的处理单元,其中,处理单元执行指令集,响应将一个作业从数据处理系统提交到网格上的远程节点,从该远程节点接收一个作业标识符;将作业标识符保存在一个作业标识符的集合中;响应对从数据处理系统提交的作业的状态的请求,对于仍在执行的进程,提交作业标识符集合中的每个作业标识符的作业状态请求,使用该作业标识符集合以形成一个作业状态请求的集合;接收对作业状态请求集合的响应;以及呈现响应。
18.计算机可读的介质中的用于获取在网格上执行的进程的状态信息的计算机程序产品,该计算机程序产品包括:
第一指令,用于响应将一个作业从数据处理系统提交到网格上的远程节点,从该远程节点接收一个作业标识符;
第二指令,用于将作业标识符保存在一个作业标识符的集合中;
第三指令,用于响应对从数据处理系统提交的作业的状态的请求,对于仍在执行的进程,提交作业标识符集合中的每个作业标识符的作业状态请求,使用该作业标识符集合以形成一个作业状态请求的集合;
第三指令,用于接收对作业状态请求集合的响应;以及
第四指令,用于呈现响应。
19.根据权利要求18所述的计算机程序产品,其特征在于,作业标识符保存在一个平面文件中。
20.根据权利要求18所述的计算机程序产品,进一步包括:
第五指令,用于,如果对一个作业状态请求的响应表明,一个特定的作业已经完成,则删除作业标识符集合中该特定作业的特定作业标识符。
CNB2004100302614A 2003-03-27 2004-03-23 用于获取网格中的状态信息的方法和设备 Expired - Fee Related CN1298151C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/401,323 US7716061B2 (en) 2003-03-27 2003-03-27 Method and apparatus for obtaining status information in a grid
US10/401,323 2003-03-27

Publications (2)

Publication Number Publication Date
CN1534949A true CN1534949A (zh) 2004-10-06
CN1298151C CN1298151C (zh) 2007-01-31

Family

ID=32989415

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100302614A Expired - Fee Related CN1298151C (zh) 2003-03-27 2004-03-23 用于获取网格中的状态信息的方法和设备

Country Status (5)

Country Link
US (1) US7716061B2 (zh)
JP (1) JP3945709B2 (zh)
KR (1) KR100763316B1 (zh)
CN (1) CN1298151C (zh)
TW (1) TWI265422B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101933366A (zh) * 2008-01-30 2010-12-29 高通股份有限公司 使用路由表管理无线中继节点
CN102761570A (zh) * 2011-04-28 2012-10-31 同济大学 基于代理的网格资源监控系统及监控方法
CN104620559A (zh) * 2012-09-07 2015-05-13 甲骨文国际公司 用于支持分布式数据网格集群中的可伸缩消息总线的系统和方法
US10120579B1 (en) 2012-08-08 2018-11-06 Amazon Technologies, Inc. Data storage management for sequentially written media
US10157199B2 (en) 2012-08-08 2018-12-18 Amazon Technologies, Inc. Data storage integrity validation
US10558581B1 (en) 2013-02-19 2020-02-11 Amazon Technologies, Inc. Systems and techniques for data recovery in a keymapless data storage system
US10698880B2 (en) 2012-08-08 2020-06-30 Amazon Technologies, Inc. Data storage application programming interface
US10936729B2 (en) 2012-08-08 2021-03-02 Amazon Technologies, Inc. Redundant key management

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7340522B1 (en) * 2003-07-31 2008-03-04 Hewlett-Packard Development Company, L.P. Method and system for pinning a resource having an affinity to a user for resource allocation
US7571227B1 (en) * 2003-09-11 2009-08-04 Sun Microsystems, Inc. Self-updating grid mechanism
US8726278B1 (en) 2004-07-21 2014-05-13 The Mathworks, Inc. Methods and system for registering callbacks and distributing tasks to technical computing works
US7562143B2 (en) 2004-01-13 2009-07-14 International Business Machines Corporation Managing escalating resource needs within a grid environment
US7406691B2 (en) 2004-01-13 2008-07-29 International Business Machines Corporation Minimizing complex decisions to allocate additional resources to a job submitted to a grid environment
US7552437B2 (en) 2004-01-14 2009-06-23 International Business Machines Corporation Maintaining application operations within a suboptimal grid environment
US7266547B2 (en) 2004-06-10 2007-09-04 International Business Machines Corporation Query meaning determination through a grid service
US7917629B2 (en) * 2004-12-29 2011-03-29 Sap Ag Interface for external system management
US8024743B2 (en) * 2004-12-30 2011-09-20 Sap Ag Connection of clients for management of systems
US7590623B2 (en) 2005-01-06 2009-09-15 International Business Machines Corporation Automated management of software images for efficient resource node building within a grid environment
US7562035B2 (en) 2005-01-12 2009-07-14 International Business Machines Corporation Automating responses by grid providers to bid requests indicating criteria for a grid job
US7571120B2 (en) * 2005-01-12 2009-08-04 International Business Machines Corporation Computer implemented method for estimating future grid job costs by classifying grid jobs and storing results of processing grid job microcosms
US7472079B2 (en) * 2005-01-12 2008-12-30 International Business Machines Corporation Computer implemented method for automatically controlling selection of a grid provider for a grid job
US20060195559A1 (en) * 2005-02-28 2006-08-31 University Of Westminster Services for grid computing
US7823185B1 (en) * 2005-06-08 2010-10-26 Federal Home Loan Mortgage Corporation System and method for edge management of grid environments
US8019827B2 (en) * 2005-08-15 2011-09-13 Microsoft Corporation Quick deploy of content
KR100799775B1 (ko) * 2005-09-09 2008-01-31 한국정보통신대학교 산학협력단 무선 그리드 네트워크의 모바일 그리드 게이트웨이리플리케이션 시스템 및 그 방법
US8713179B2 (en) * 2005-10-04 2014-04-29 International Business Machines Corporation Grid computing accounting and statistics management system
KR100901872B1 (ko) * 2006-12-01 2009-06-09 한국전자통신연구원 그리드 서비스를 이용한 이종 노매딕/이동 통신 네트워크간 협업 시스템 및 그 방법
WO2008066277A1 (en) * 2006-12-01 2008-06-05 Electronics And Telecommunications Research Institute Collaboration system and method among heterogeneous nomadic and mobile communication networks using grid services
JP4926774B2 (ja) * 2007-03-20 2012-05-09 株式会社エヌ・ティ・ティ・データ グリッドシステム、グリッド処理方法、及び、コンピュータプログラム
US8069251B2 (en) * 2007-06-01 2011-11-29 Adobe Systems Incorporated System and/or method for client-driven server load distribution
US8239548B2 (en) 2007-07-17 2012-08-07 Adobe Systems Incorporated Endpoint discriminator in network transport protocol startup packets
US8145698B1 (en) 2008-01-03 2012-03-27 Adobe Systems Incorporated Self organizing peer-to-peer system, method, and/or apparatus
US8171147B1 (en) 2008-02-20 2012-05-01 Adobe Systems Incorporated System, method, and/or apparatus for establishing peer-to-peer communication
US8312147B2 (en) * 2008-05-13 2012-11-13 Adobe Systems Incorporated Many-to-one mapping of host identities
US8341401B1 (en) 2008-05-13 2012-12-25 Adobe Systems Incorporated Interoperable cryptographic peer and server identities
US8281004B2 (en) * 2009-02-03 2012-10-02 Ca, Inc. Multi-threaded method and system for automated remote submission of jobs to mainframe and UNIX systems from the Windows™ platform
US8660875B2 (en) * 2009-11-02 2014-02-25 Applied Materials, Inc. Automated corrective and predictive maintenance system
US9336034B2 (en) 2011-06-28 2016-05-10 Hewlett-Packard Development Company, L.P. Display of host operating system user interface elements within a guest operating system of a virtual machine
DE112011105379B4 (de) 2011-06-28 2022-12-15 Hewlett-Packard Development Company, L.P. Anzeige von Betriebsstatusinformationen eines Clients in einer Remote-Desktop-Sitzung
US9591069B2 (en) 2011-10-31 2017-03-07 Adobe Systems Incorporated Peer-to-peer assist for live media streaming
US8930416B2 (en) 2012-08-13 2015-01-06 Hulu, LLC Job dispatcher of transcoding jobs for media programs
JP6191361B2 (ja) * 2013-09-25 2017-09-06 富士通株式会社 情報処理システム、情報処理システムの制御方法及び制御プログラム
US10178431B2 (en) 2014-07-28 2019-01-08 Adobe Inc. Hybrid stream delivery
TWI620091B (zh) * 2016-09-13 2018-04-01 健行學校財團法人健行科技大學 植基於worker序列化請求的認證處理方法
US11347564B2 (en) * 2019-04-24 2022-05-31 Red Hat, Inc. Synchronizing batch job status across nodes on a clustered system

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05113963A (ja) 1991-10-23 1993-05-07 Nec Corp ジヨブ状態表示方式
US5537542A (en) * 1994-04-04 1996-07-16 International Business Machines Corporation Apparatus and method for managing a server workload according to client performance goals in a client/server data processing system
SE515901C2 (sv) * 1995-12-28 2001-10-22 Dynarc Ab Resursadministrering, plan och arrangemang
US6173068B1 (en) * 1996-07-29 2001-01-09 Mikos, Ltd. Method and apparatus for recognizing and classifying individuals based on minutiae
US5862404A (en) 1997-02-12 1999-01-19 Toshiba America Information Systems, Inc. Network device discovery and status information distribution using independent information distribution processes
US6505248B1 (en) * 1999-03-24 2003-01-07 Gte Data Services Incorporated Method and system for monitoring and dynamically reporting a status of a remote server
JP2001243159A (ja) 2000-02-29 2001-09-07 Canon Inc データ処理装置及びデータ処理方法、記憶媒体
US7171654B2 (en) * 2000-05-25 2007-01-30 The United States Of America As Represented By The Secretary Of The Navy System specification language for resource management architecture and corresponding programs therefore
US6772031B1 (en) 2000-05-30 2004-08-03 International Business Machines Corporation Method of, system for, and computer program product for providing a job monitor
US6614882B1 (en) * 2000-06-16 2003-09-02 Bellsouth Intellectual Property Management Corporation Proact module for proactive maintenance application
KR100349658B1 (ko) * 2000-12-04 2002-08-24 한국전자통신연구원 분산 가상환경을 위한 실시간 상태관리 서버와 그의공유공간 상태정보 관리방법
US20020152292A1 (en) 2001-01-09 2002-10-17 Ricoh Company Limited Method and system of remote support of device using e-mail
JP2002366389A (ja) 2001-06-11 2002-12-20 Sony Corp 情報処理装置及び情報処理方法、遠隔的タスク管理システム、並びに記憶媒体
US20030009553A1 (en) * 2001-06-29 2003-01-09 International Business Machines Corporation Method and system for network management with adaptive queue management
JP2003018308A (ja) 2001-06-29 2003-01-17 Hitachi Electronics Service Co Ltd ユーザシステムの監視方法およびリモート監視システム
US20030033370A1 (en) * 2001-08-07 2003-02-13 Nicholas Trotta Media-related content personalization
US6750766B1 (en) * 2002-02-06 2004-06-15 Sap Aktiengesellschaft Alerts monitor
US20040019514A1 (en) * 2002-07-23 2004-01-29 Sun Microsystems, Inc., A Delaware Corporation Submitting and monitoring jobs in peer-to-peer distributed computing
US20040019890A1 (en) * 2002-07-23 2004-01-29 Sun Microsystems, Inc., A Delaware Corporation Distributing and executing tasks in peer-to-peer distributed computing
EP1563348A2 (en) * 2002-08-21 2005-08-17 Neal E. Solomon Systems, methods and apparatus for organizing groups of self-configurable mobile robotic agents in a multi-robotic system
JP2005538469A (ja) * 2002-09-10 2005-12-15 イグザグリッド システムズ, インコーポレイテッド 階層型格納管理を用いるサーバシェア移送およびサーバ回復のための方法および装置
US7395536B2 (en) * 2002-11-14 2008-07-01 Sun Microsystems, Inc. System and method for submitting and performing computational tasks in a distributed heterogeneous networked environment
KR100475668B1 (ko) * 2002-12-23 2005-03-10 한국과학기술정보연구원 그리드 네트워크에서 그리드 자원에 대한 정보를 제공하는장치 및 방법과 그 프로세스를 기록한 컴퓨터 판독가능한기록매체
US7533141B2 (en) * 2003-01-24 2009-05-12 Sun Microsystems, Inc. System and method for unique naming of resources in networked environments

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101933367B (zh) * 2008-01-30 2015-11-25 高通股份有限公司 使用标识符管理无线中继节点
CN101933367A (zh) * 2008-01-30 2010-12-29 高通股份有限公司 使用标识符管理无线中继节点
US8737267B2 (en) 2008-01-30 2014-05-27 Qualcomm Incorporated Management of wireless relay nodes using routing table
CN101933366B (zh) * 2008-01-30 2015-02-25 高通股份有限公司 使用路由表管理无线中继节点
CN101933366A (zh) * 2008-01-30 2010-12-29 高通股份有限公司 使用路由表管理无线中继节点
CN102761570A (zh) * 2011-04-28 2012-10-31 同济大学 基于代理的网格资源监控系统及监控方法
US10157199B2 (en) 2012-08-08 2018-12-18 Amazon Technologies, Inc. Data storage integrity validation
US10120579B1 (en) 2012-08-08 2018-11-06 Amazon Technologies, Inc. Data storage management for sequentially written media
US10698880B2 (en) 2012-08-08 2020-06-30 Amazon Technologies, Inc. Data storage application programming interface
US10936729B2 (en) 2012-08-08 2021-03-02 Amazon Technologies, Inc. Redundant key management
CN104620558A (zh) * 2012-09-07 2015-05-13 甲骨文国际公司 用于支持分布式数据网格集群中的消息预处理的系统和方法
CN104620559A (zh) * 2012-09-07 2015-05-13 甲骨文国际公司 用于支持分布式数据网格集群中的可伸缩消息总线的系统和方法
US10558581B1 (en) 2013-02-19 2020-02-11 Amazon Technologies, Inc. Systems and techniques for data recovery in a keymapless data storage system

Also Published As

Publication number Publication date
TW200500868A (en) 2005-01-01
TWI265422B (en) 2006-11-01
JP3945709B2 (ja) 2007-07-18
JP2004295887A (ja) 2004-10-21
US7716061B2 (en) 2010-05-11
US20040193461A1 (en) 2004-09-30
KR100763316B1 (ko) 2007-10-05
CN1298151C (zh) 2007-01-31
KR20040086594A (ko) 2004-10-11

Similar Documents

Publication Publication Date Title
CN1298151C (zh) 用于获取网格中的状态信息的方法和设备
CN1142513C (zh) 动态提供内容的系统及其方法
CN1210656C (zh) 用于客户和自适应同步和转换服务器的方法、装置
US6339771B1 (en) Method and system for managing connections to a database management system
CN1678994A (zh) 用于提供访问用户界面信息的系统和方法
US20070047439A1 (en) Method and apparatus of supporting business performance management with active shared data spaces
CN1653419A (zh) 在浏览器上呈现第一媒体类型内容
CN1809068A (zh) Web应用程序架构
CN101821993A (zh) 对使用会话亲缘性的分布式环境中的故障恢复进行处理的方法和系统
CN1625179A (zh) 按可定制的、基于标签协议中的引用发送
US20070220158A1 (en) Unmanaged programming language interoperability with managed internet protocol context
US8775507B2 (en) Rest interface for job submission
US7155727B2 (en) Efficient data buffering in a multithreaded environment
EP1608131A2 (en) Content retrieval using exchange of context information
CN113835693A (zh) 代码生成方法、装置、电子设备、存储介质
CN111400350B (zh) 配置数据读取方法、系统、电子设备和存储介质
CN113806097A (zh) 一种数据处理方法、装置、电子设备以及存储介质
CN1617500A (zh) 用于处理对Web服务的请求的方法和系统
US20040139144A1 (en) Using web services to access computational grids by non-members of the grid
US20050071422A1 (en) Method, system, and computer program product for an automation tool adapter for use with multiple different automation tools
EP1754145B1 (en) Method and apparatus for supporting multiple versions of a web services protocol
CN113065848B (zh) 一种支持多类集群后端的深度学习调度系统及调度方法
CN102255872B (zh) 访问非远程对象的方法和装置
US20050283531A1 (en) Method and apparatus for combining resource properties and device operations using stateful Web services
US20020169881A1 (en) Method and apparatus for distributed access to services in a network data processing system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070131

Termination date: 20210323