WO2005091137A1

WO2005091137A1 - コンピュータシステム、これを構成するサーバ、そのジョブ実行制御方法及びプログラム

Info

Publication number: WO2005091137A1
Application number: PCT/JP2005/004653
Authority: WO
Inventors: Takashi Yonezawa; Kazutoshi Sugimoto; Kazuhisa Misono
Original assignee: International Business Machines Corporation
Priority date: 2004-03-19
Filing date: 2005-03-16
Publication date: 2005-09-29
Also published as: JPWO2005091137A1; EP1732004A4; EP1732004A1; JP5022030B2; US8239868B2; US20070283355A1; CN1934536A; CN100428167C

Description

明細書

コンピュータシステム、これを構成するサーノ、そのジョブ実行制御方法及びプログラム

技術分野

[0001] 本発明は、グリッドコンピューティングに関し、特にコンピュータに対してジョブの割り当てを行うスケジューリングの方法およびこれを実現するシステム構成に関する。背景技術

[0002] 近年、ネットワークで接続されたヘテロジーニアス (異機種混在)な情報システムを統合して利用する、グリッドコンピューティングと呼ばれるシステムが注目されている。このシステムでは、ネットワーク上の複数のコンピュータにおける CPUパワーゃデータストレージなどのコンピュータ資源が共有され、仮想的な 1つの高性能コンピュータとして利用される。複数のコンピュータに並列処理を行わせることで、 1台 1台の性能は低くとも高速に大量の処理を実行することが可能となる。

[0003] グリッドコンピューティングでは、システムに与えられたジョブ（プログラムの処理単位 )の実行順序を、ジョブの特性や優先順位に応じて決定するスケジューリングが非常に重要である。異機種混在環境を前提としたグリッド環境では、性能の異なる複数のコンピュータに対してジョブを割り当てる必要がある他、割り当てるジョブの大きさも様々であり、また、ローカルユーザだけでなぐ遠隔地にいるユーザからもジョブを与えられることから、様々なジョブの実行スケジュールを適切に設定する必要があるためである。

[0004] グリッドコンピューティングにおけるジョブのスケジューリングの方式には、大きく分けてプッシュ（Push)タイプとプル (Pull)タイプとがある。

プッシュタイプ (例えば、非特許文献 1参照）のスケジューリング方式では、スケジューラにジョブの投入があった場合に、スケジューラ力そのジョブを処理すべきコンビユータを割り当て、そのコンピュータに対してジョブの実行をリクエストする。この場合にスケジューラは、各コンピュータの利用状況をモニタリングし、ジョブの負荷情報等に応じて最適なコンピュータとジョブの割り当てを行う。 [0005] このプッシュタイプのスケジューリング方式は、主にクラスタグリッドと呼ばれる、数百台程度のサーバ (コンピュータ)で構成され、それらを同一サイト内に配置するタイプのグリッドシステムに多く用いられる。またプッシュタイプのスケジューリング方式は、最適なコンピュータに対して Specificにジョブを割り当てることができ、最適なスケジュ一リングが可能である。特に、各コンピュータの挙動にばらつきがあり、かつユーザがコンピュータを使用した場合にジョブがキャンセルされる環境では、そのような動作環境を加味した上で、最適なスケジューリングにより非常に効率の良い運用が期待できる。

[0006] 一方、プルタイプ (例えば、非特許文献 2参照）のスケジューリング方式では、各コンピュータがジョブを実行可能な状態になったときにスケジューラに対してポーリング（ Polling)という形でジョブのリクエストを行う。そして、このリクエストが行われた際に、実行すべきジョブがあれば、スケジューラはそのコンピュータに対してジョブを割り当て、コンピュータが割り当てられたジョブを実行する。実行すべきジョブが無い場合は、コンピュータは、一定時間の経過後に再度ポーリングを行う。

[0007] このプルタイプのスケジューリング方式は、非常に簡単な構成でに実装することができるため、数千台規模のグリッドシステムで多く使われる。特に、インターネット上に構築されるグリッドの場合には、ネットワークの制限のために、このプルタイプのスケジユーリング方式が用いられる。またプルタイプのスケジューリング方式は、コンピュータの管理情報が簡単で、多数のコンピュータに対して適用しやすい。そして、ポーリングによる自己最適化 (余裕のあるコンピュータほど頻繁にポーリングを行う）により、ある程度の効率ィ匕は図れる。

[0008] 特千文献 1： Chris Smith, Open source Metascheduling for Virtual Organizations with the Community Scheduler Framework (CSF)", Technical Whitepaper, Platform Computing Inc. 2003年 8月 .

非特許文献 2 : Eric Korpela, Dan Werthimer, David Anderson, Jeff Cobb, Matt Lebofsky, "Massively Distributed Computing for SETI", Computing in Science & amp; Engineering, Vol: 3, Issue: 1, J an. -Feb. 2001, Pages: 78—83.

発明の開示発明が解決しょうとする課題

[0009] 上述したように、グリッドコンピューティングにおける従来のスケジューリング方式は、プッシュタイプの場合、最適なジョブの割り当てを行うことができる。

しかし、最適なスケジューリングを行うために各コンピュータの使用状況を管理することが必要である。このため、スケジューラの動作が複雑になり、システム構成の変更 (ジョブを実行するコンピュータの増減等）に容易に対応することができな!/、。

また、スケジューラ力各コンピュータにアクセスしてジョブの実行をリクエストする形態であるため、ファイアウォールの内側にあるコンピュータなどに対しては適用できない。

[0010] 一方、プルタイプならば、上述したように、スケジューラが必要とするコンピュータの管理情報が簡単であるため、システム構成の変更にも容易に対応でき、またコンビュータからのポーリングによってネットワーク上でのアクセスが行われるため、ファイアゥオールの内部にあるコンピュータに対してもジョブを割り当てることが可能である。しかし、ポーリングによる自己最適化はあるものの、プルタイプのスケジューリング方式では、実行すべきジョブがあっても、コンピュータからのポーリングを待ってジョブの実行をリクエストするため、時間的なロスが発生してしまう。

また、ポーリングが行われた場合には、実行すべき複数のジョブのうち、そのポーリングを行ったコンピュータにとって最適なジョブを割り当てる力そのジョブの種類によっては、より相応しい他のコンピュータがある可能性もあり、必ずしもシステム全体から見て最も効率の高、最適なスケジューリングができるわけではな、。

[0011] そこで本発明は、グリッドコンピューティングにおいて、コンピュータの種類や使用状況およびジョブの種類の両面力も最適なスケジューリングを実現すると共に、システム構成の変更に対して容易に対応が可能なシステムおよびそのジョブ実行制御方法を提供することを目的とする。

また本発明は、ファイアウォール等によるアクセス制限のあるコンピュータを含むダリッドにお、ても、プッシュタイプのスケジューリング方式と同等の最適なジョブの割り当てを可能とすることを他の目的とする。

また本発明は、プッシュタイプとプルタイプとを組み合わせたスケジューリング方式およびこれを用いたシステムを提供することをさらに他の目的とする。

課題を解決するための手段

[0012] 上記の目的を達成するため、本発明は、ネットワークを介して接続された複数のコンピュータによりグリッドコンピューティングを実現する、次のように構成されたコンビュータシステムとして実現される。すなわち、このコンピュータシステムは、ネットワーク上のコンピュータに対してジョブの実行要求を行うコンピュータであるセンターサーバと、センターサーバからの要求に応じてジョブを実行するコンピュータであるプロセスサ一バとを備えて構成される。そして、このセンターサーバは、プロセスサーバに対して実行すべきジョブを割り当て、ジョブ実行リクエストを発行するスケジューラ部と、プロセスサーバの情報を管理すると共に、スケジューラ部により発行されたリクエストを受け付けて、このリクエストにかかるジョブを割り当てられたプロセスサーバの状況に応じて、このリクエストをプロセスサーバに送信するエージェント部とを備える。

[0013] ここで、より詳細には、エージェント部は、複数のプロセスサーバに対して 1対 1で対応させて設けられる。

また好ましくは、エージェント部は、対応するプロセスサーバの能力および動作状況に関する情報をプロセスサーノくから取得して管理する。そして、スケジューラ部は、ェージェント部に管理されて、る情報に基づ、て、プロセスサーバに対するジョブの割り当てを行う。

[0014] また、エージェント部は、プロセスサーバとのアクセスタイプに基づき、プロセスサーノくからのポーリングによるアクセスに応じてスケジューラ部から受け付けたリクエストを送信したり、自身が管理するタイミングで前記スケジューラ部力受け付けたリクエストを送信したりする。

より具体的には、ファイアウォールを介してセンターサーバに接続されるプロセスサーバが存在する場合に、センターサーバからファイアウォールを越えてプロセスサーバにアクセスすることができないので、プロセスサーバからのポーリングによるアクセスを待ってリクエストを送信する。

[0015] また、上記の目的を達成する他の本発明は、コンピュータによりグリッドコンビユーテイングシステムにおけるジョブのスケジューリングおよび当該ジョブの実行要求を行う、次のようなジョブ実行制御方法としても実現される。すなわち、このジョブ実行制御方法は、記憶装置に格納されたシステムを構成しジョブを実行するプロセスサーバの能力に基づき、このプロセスサーバの動作状況に関わらずにジョブの割り当てを行うステップと、ジョブの割り当てられたプロセスサーバに対するジョブ実行リクエストを発行するステップと、発行されたジョブ実行リクエストを一時的に保持し、ジョブの割り当てられたプロセスサーバの動作状況に応じて、このプロセスサーバに送信するステツプとを含むことを特徴とする。

[0016] さらに本発明は、コンピュータを制御して上述したセンターサーバの機能を実現させるプログラム、あるいはコンピュータに上記のジョブ実行制御方法の各ステップに対応する処理を実行させるプログラムとしても実現される。このプログラムは、磁気デイスクゃ光ディスク、半導体メモリ、その他の記録媒体に格納して配布したり、ネットヮークを介して配信したりすることにより提供される。

発明の効果

[0017] 以上のように構成された本発明によれば、グリッドコンピューティングにおいて、スケジユーラとプロセスサーバとの間の通信を中継するエージェント部をセンターサーバに設け、プロセスサーバのアクセスタイプの違いをエージェント部の制御によって吸収することにより、プロセスサーバのアクセスタイプの違いによらずに、コンピュータの種類や使用状況およびジョブの種類の両面力最適なスケジューリングを行うことができる。そしてプロセスサーバごとにエージェント部を設けることにより、プロセスサーバを増減してシステム構成を変更することが容易にできる。

[0018] また、本発明によれば、プロセスサーバのアクセスタイプの違!、をエージェント部の制御によって吸収することにより、従来はプッシュタイプのスケジューリングを行っていたジョブの実行要求を直接受け付けられるプロセスサーバと、従来はプルタイプのスケジユーリングを行って、たポーリングを行った後にジョブの実行要求を受け付けるプロセスサーバとをシステム内に混在させ、かつプッシュタイプのスケジューリング方式と同等の最適なジョブの割り当てを行うことができる。

図面の簡単な説明

[0019] [図 1]本実施形態によるグリッドコンピューティングシステムの全体構成を示す図である。

[図 2]本実施形態によるグリッドコンピューティングシステムにおけるセンターサーバおよびプロセスサーバを実現するのに好適なコンピュータ装置のハードウェア構成の例を模式的に示した図である。

[図 3]本実施形態におけるセンターサーバの機能構成を示す図である。

[図 4]本実施形態におけるポーリングを行うプロセスサーバの機能構成と PSエージェント部との関係を示す図である。

[図 5]本実施形態におけるポーリングを行わないプロセスサーバの機能構成と PSェージェント部との関係を示す図である。

[図 6]本実施形態における各 PSエージェント部によるジョブの実行要求時の動作を説明するフローチャートである。

発明を実施するための最良の形態

[0020] 以下、添付図面を参照して、本発明を実施するための最良の形態 (以下、実施形態）について詳細に説明する。

図 1は、本実施形態によるグリッドコンピューティングシステムの全体構成を示す図である。

図 1に示すように、本実施形態のシステムは、ジョブの割り当てを行うセンターサーバ（CS) 100による割り当てにしたがって実際にジョブを実行するプロセスサーバ（P S) 200とを備える。センターサーバ 100とプロセスサーバ 200とは、インターネットその他のコンピュータネットワークにて接続されている。このコンピュータネットワークは、通信プロトコルや、有線か、無線力といった通信形式を問わず、またファイアウォールやその他のアクセス制限を設けたものであっても良!、。

[0021] 図 2は、本実施形態によるグリッドコンピューティングシステムにおけるセンターサーノ 100およびプロセスサーバ 200を実現するのに好適なコンピュータ装置のハードウエア構成の例を模式的に示した図である。

図 2に示すコンピュータ装置は、演算手段である CPU (Central Processing Unit : 中央処理装置） 11と、 MZB (マザ一ボード）チップセット 12および CPUバスを介して CPU11に接続されたメインメモリ 13と、同じく MZBチップセット 12および AGP ( Accelerated Graphics Port)を介して CPU11に接続されたビデオカード 1

4と、 PCI (Peripheral Component Interconnect)バスを介して M/Bチップセット 12に接続された磁気ディスク装置 (HDD) 15、ネットワークインターフェイス 16と、さらにこの PCIバスからブリッジ回路 17および ISA (Industry Standard Architecture)バスなどの低速なバスを介して MZBチップセット 12に接続されたフレキシブルディスクドライブ 18およびキーボード Zマウス 19とを備える。

[0022] なお、図 2は本実施形態を実現するコンピュータ装置のハードウェア構成を例示するに過ぎず、本実施形態を適用可能であれば、他の種々の構成を取ることができる。例えば、ビデオカード 14を設ける代わりに、ビデオメモリのみを搭載し、 CPU11にてイメージデータを処理する構成としても良いし、外部記憶装置として、 ATA (AT Attachment

)や SCSI (Small Computer System Interface)などのインターフェイスを介して C D-R (Compact Disc Recordable)や DVD— RAM (Digital Versatile Disc Random Access Memory)のドライブを設けても良い。

[0023] 図 3は、センターサーバ 100の機能構成を示す図である。

センターサーバ 100は、各プロセスサーバ 200に対するジョブの割り当て（スケジュ一リング）を行うスケジューラ部 110と、プロセスサーバ 200の管理を行うと共にプロセスサーバ 200に対するリクエストおよびレスポンスの送受信を中継する PSエージェント部 120とを備える。 PSエージェント部 120は、グリッドコンピューティングシステムを構成するプロセスサーバ 200ごとに設けられている。そして、スケジューラ部 110は、この PSエージェント部 120を介して各プロセスサーバ 200にアクセスする。

[0024] スケジューラ部 110は、例えば図 2に示したプログラム制御された CPU11とメインメモリ 13や磁気ディスク装置 15等の記憶手段とで実現され、その具体的な機能として図 3に示すように、 PS能力検査部 111と、最適 PS選択部 112と、ジョブ依頼部 113とを備える。

PS能力検査部 111は、プロセスサーバ 200の能力を各プロセスサーバ 200に対応する PSエージェント部 120に問合せ、情報を取得する。

最適 PS選択部 112は、 PS能力検査部 111により取得されたプロセスサーバ 200 の能力の情報に基づき、ジョブに応じて最適なプロセスサーバ 200を選択し、割り当てを行う。このジョブの割り当てにおける最適化のロジックは任意で良、。

ジョブ依頼部 113は、最適 PS選択部 112にお!/、て選択されたプロセスサーバ 200 の PSエージェント部 120に対してジョブ実行を要求するリクエストを発行する。

[0025] 本実施形態では、 PSエージェント部 120がスケジューラ部 110とプロセスサーノ 20 0との間の通信を中継し、スケジューラ部 110によるジョブの実行要求をプロセスサーバ 200に代わって受け付ける。そのため、 PS能力検査部 111の問い合わせ先ゃジョブ依頼部 113のリクエストの発行先が PSエージェント部 120となって、る力上述したように、スケジューラ部 110の機能自体は、既存のプッシュタイプのスケジューラと変わらない。したがって、スケジューラ部 110には、既存のグリッドコンピューティングシステムで利用されて、るスケジューラを用いることができる。

[0026] PSエージェント部 120は、例えば図 2に示したプログラム制御された CPU11とメインメモリ 13や磁気ディスク装置 15等の記憶手段とで実現され、その具体的な機能として図 3に示すように、 PS状況管理部 121と、 PS能力管理部 122と、ジョブ受け付け部 123と、ジョブ依頼部 124と、ポーリング待ち受け部 125とを備える。

PS状況管理部 121は、対応するプロセスサーバ 200とアクセスして、プロセスサーバ 200の現在の動作状況を把握する。

PS能力管理部 122は、プロセスサーバ 200のジョブ実行能力に関する統計情報等を管理し、スケジューラ部 110の PS能力検査部 111からの問い合わせに応じて、管理している情報を返す。ここで、ジョブ実行能力に関する統計情報等とは、単に CPU 自身の処理能力や記憶装置の記憶容量の静的な情報だけでなぐ CPUに対する負荷の時間変動や動作傾向といった動的な内容を統計的に処理して得られた情報を含む。

PS状況管理部 121および PS能力管理部 122に管理される情報は、 PSエージェント部 120が対応して!/、るプロセスサーバ 200から取得され、図 2のメインメモリ 13ゃ磁気ディスク装置 15等の記憶手段に格納される。

ジョブ受け付け部 123は、スケジューラ部 110のジョブ依頼部 113から発行されたジョブ実行リクエストを受け付ける。ジョブ依頼部 124は、ジョブ受け付け部 123により受け付けられたジョブ実行リクェストを対応するプロセスサーバ 200に送信する。

ポーリング待ち受け部 125は、プロセスサーバ 200からのポーリングによる、ジョブの実行が可能であると、う通知を受付ける。

[0027] 詳しくは後述するが、本実施形態では、プッシュタイプのスケジューラを用いながら、プロセスサーバ 200からのポーリングによるアクセスを受け付けてジョブ実行リクエストを送信することができる。 PSエージェント部 120のポーリング待ち受け部 125は、このポーリングの受け付けのために用いられるものであり、ポーリングを行わずにセンタ一サーバ 100における所望のタイミングで送信されたジョブ実行リクエストを受け付けられるプロセスサーバ 200の PSエージェント部 120に対しては、必要な構成要素ではない。

[0028] 次に、プロセスサーバ 200の機能構成と、対応する PSエージェント部 120との関係について説明する。

上述したように、本実施形態において想定されるプロセスサーバ 200は、ポーリングを行わな、ものと行うものとがある。

図 4は、ポーリングを行うプロセスサーノ 200の機能構成と PSエージェント部 120との関係を示す図である。

プロセスサーバ 200は、図 2に示したようなコンピュータ装置をグリッドコンビユーティングシステムにおけるプロセスサーノ 200として機能させるための PS組み込み部 21 0を備えている。

[0029] PS組み込み部 210は、例えば図 2に示したプログラム制御された CPU11とメインメモリ 13や磁気ディスク装置 15等の記憶手段とで実現され、その具体的な機能として図 4に示すように、 PS状況監視部 211と、 PS状況通知部 212と、ジョブ受け付け部 2 13と、ジョブ実行部 214と、ポーリング実行部 215とを備える。

PS状況監視部 211は、自装置 (プロセスサーバ 200)の現在の使用状況や資源の状況を監視し、情報を収集する。

PS状況通知部 212は、 PS状況監視部 211にお、て収集された PSの使用状況や資源の状況に関する情報を、センターサーバ 100の PSエージェント部 120に通知する。 PSエージェント部 120では、 PS状況管理部 121および PS能力管理部 122がこの通知を受け付け、メインメモリ 13や磁気ディスク装置 15等の記憶装置に格納して管理する。 PS状況通知部 212からセンターサーバ 100への通知は、定期的に行つても良いし、プロセスサーバ 200の動作状況が変更された際に行うようにしても良い。また、センターサーバ 100の対応する PSエージェント部 120から任意のタイミングでプロセスサーバ 200へ問、合わせても良!、。

ジョブ受け付け部 213は、センターサーバ 100の PSエージェント部 120のジョブ依頼部 124から送信されたジョブ実行リクエストを受け付ける。

ジョブ実行部 214は、ジョブ受け付け部 213により受け付けられたジョブを、プロセスサーバ 200の資源を用いて実行する。

ポーリング実行部 215は、 PS状況監視部 211の監視等に基づき、プロセスサーバ 200がジョブを実行可能な状況である場合に、その旨を示す通知をセンターサーバ 1 00の PSエージェント部 120に対して行う。 PSエージェント部 120では、ポーリング待ち受け部 125がポーリング実行部 215からの通知を受け付けて、ジョブ依頼部 124にジョブ実行リクエストの送信を行わせる。

[0030] なお、ポーリング実行部 215は、プロセスサーバ 200がポーリングを行わずにセンタ一サーバ 100から送信されたジョブ実行リクエストを受け付けられる場合、すなわちフアイァウォールの内側にある等のアクセス制限がない場合は、設ける必要はない。図 5は、ポーリングを行わないプロセスサーバ 200の機能構成と PSエージェント部 1 20との関係を示す図である。

[0031] 次に、上記のように構成された本実施形態のグリッドコンピューティングシステムの動作について説明する。

上述したように、センターサーバ 100のスケジューラ部 110は、既存のプッシュタイプのスケジューラと同様であるので、実行すべきジョブが発生すると、センターサーバ 100の管理下にある全てのプロセスサーバ 200を対象として、当該ジョブの割り当てを行う。このとき、 PSエージェント部 120からプロセスサーバ 200の能力や動作傾向等の統計情報等を取得し、これらの情報およびジョブの種類や特性に基づ、て最適なスケジューリングを行う。そして、ジョブが割り当てられたプロセスサーバ 200の動作状況に関わらずにジョブ実行リクエストを発行し、そのプロセスサーバ 200に対応する PSエージェント部 120に送信してジョブの実行要求を行う。

[0032] PSエージェント部 120の動作は、プロセスサーバ 200のアクセスタイプが、センターサーバ 100からのジョブの実行要求を直接受け付けられるタイプ力、ファイアウォールの内側等にありポーリングを行った後にジョブの実行要求を受け付けるタイプかによって、動作が異なる。

図 6は、各 PSエージェント部 120によるジョブの実行要求時の動作を説明するフロ一チャートである。

図 6に示すように、 PSエージェント部 120は、ジョブ受け付け部 123によりスケジューラ部 110からジョブ実行リクエストを受け付け (ステップ 601)、当該 PSエージェント部 120に対応するプロセスサーバ 200がジョブの実行要求を直接受け付けられるタイブならば、そのジョブ実行リクエストを直ちにプロセスサーバ 200へ送信する（ステツプ 602、 604)。

[0033] 一方、当該 PSエージェント部 120に対応するプロセスサーバ 200がポーリングを行つた後にジョブの実行要求を受け付けるタイプならば、 PSエージェント部 120は、プロセスサーバ 200によるポーリングが行われるまで待機し (ステップ 602、 603)、ポーリングが行われた後にスケジューラ部 110から受け付けたジョブ実行リクエストをプロセスサーバ 200へ送信する（ステップ 604)。なお、 PSエージェント部 120は、プロセスサーバ 200によるポーリングが行われた際に送信すべきジョブ実行リクエストを持つていない場合は、何ら処理を行わず、ジョブの受け付けおよび次のポーリングのタイミングを待ち受ける。

[0034] プロセスサーバ 200は、センターサーバ 100からのジョブの実行要求を直接受け付けられるタイプである場合、センターサーバ 100の PSエージェント部 120力らジョブ実行リクエストを受け付けると、そのリクエストに応じてジョブを実行し、実行結果をセンターサーバ 100の PSエージェント部 120に返す。

一方、プロセスサーバ 200がポーリングを行った後にジョブの実行要求を受け付けるタイプである場合、そのプロセスサーバ 200は、ジョブの実行が可能な動作状況となった時点でポーリングを行い、ジョブ実行リクエストが送られるのを待つ。そして、センターサーバ 100における対応する PSエージェント部 120から送信されたジョブ実行リクエストを受け付けたならば、そのリクエストに応じてジョブを実行し、実行結果をセンターサーバ 100の PSエージェント部 120に返す。ジョブ実行リクエストを受信しな力つた場合は、一定時間経過後に再度ポーリングを繰り返す。

[0035] 以上のプロセスサーバ 200の動作は、従来のグリッドコンピューティングシステムにおけるプロセスサーバの動作と同様である。ただし、上述したように本実施形態では、センターサーバ 100において各プロセスサーバ 200に対応する PSエージェント部 12 0力プロセスサーバ 200のアクセスタイプに応じて、自身が管理するタイミングでジョブの実行要求を行うか、またはプロセスサーバ 200からのポーリングによるアクセスを待ってジョブの実行要求を行うかを制御できる。すなわち、プロセスサーバ 200のァクセスタイプの違、を PSエージェント部 120の制御によって吸収できるため、本実施形態によるシステムは、センターサーバ 100からのジョブの実行要求を直接受け付けられるプロセスサーバ 200と、ファイアウォールの内側等にありポーリングを行った後にジョブの実行要求を受け付けるプロセスサーバ 200とを混在させることができる。

[0036] また、本実施形態は、上記のようにポーリングを行った後にジョブの実行要求を受け付けるプロセスサーバ 200を含む構成とすることができる。そして、この場合でも、スケジューラ部 110は、 PSエージェント部 120を介してプロセスサーバ 200に対するジョブの実行要求を行うので、プロセスサーバ 200の動作状況の影響を受けずに、プロセスサーバ 200の能力とジョブの種類や特性とに基づく最適なスケジューリングを行うことができる。

[0037] さらに本実施形態は、上述したように、プロセスサーバ 200ごとに 1対 1で対応する P Sエージェント部 120をセンターサーバ 100に設け、この PSエージェント部 120に、対応するプロセスサーバ 200に関する情報の管理およびリクエストやレスポンスの送受信の制御を行わせる。また、スケジューラ部 110は、 PSエージェント部 120が管理するプロセスサーバ 200の情報に基づいて、プロセスサーバ 200に対するジョブの割り当てを行う。このため、プロセスサーバ 200を増減してシステム構成を変更する場合にも、対応する PSエージェント部 120を追加または削除することによって、容易に対応することができる。

Claims

請求の範囲

[1] ネットワークを介して接続された複数のコンピュータによりグリッドコンピューティングを実現するコンピュータシステムにおいて、

ネットワーク上のコンピュータに対してジョブの実行要求を行うセンターサーバと、前記センターサーノくからの要求に応じてジョブを実行するプロセスサーバとを備え前記センターサーバは、

前記プロセスサーバに対して実行すべきジョブを割り当て、ジョブ実行リクエストを発行するスケジューラ部と、

前記プロセスサーバの情報を管理すると共に、前記スケジューラ部により発行された前記リクエストを受け付けて、当該リクエストにかかるジョブを割り当てられたプロセスサーバの状況に応じて当該リクエストを当該プロセスサーバに送信するエージェント部と

を備えることを特徴とするコンピュータシステム。

[2] 前記エージェント部は、複数の前記プロセスサーバに対して 1対 1で対応させて設けられたことを特徴とする請求項 1に記載のコンピュータシステム。

[3] 前記エージェント部は、対応する前記プロセスサーバの能力および動作状況に関する情報を当該プロセスサーバから取得して管理し、

前記スケジューラ部は、前記エージェント部に管理されている前記情報に基づいて

、前記プロセスサーバに対する前記ジョブの割り当てを行うことを特徴とする請求項 2 に記載のコンピュータシステム。

[4] 前記エージェント部は、少なくとも一部の前記プロセスサーバに対して、当該プロセスサーノくからのポーリングによるアクセスに応じて前記スケジューラ部力も受け付けた前記リクエストを送信し、少なくとも他の一部の前記プロセスサーバに対して、自身が管理するタイミングで前記スケジューラ部から受け付けた前記リクエストを送信することを特徴とする請求項 1に記載のコンピュータシステム。

[5] 少なくとも一部の前記プロセスサーバは、ファイアウォールを介して前記センターサーバに接続されており、前記エージェント部は、前記ファイアウォールを介して接続されて、る前記プロセスサーバに対して、当該プロセスサーバからのポーリングによるアクセスに応じて前記スケジユーラ部力受け付けた前記リクエストを送信することを特徴とする請求項 1に記載のコンピュータシステム。

[6] グリッドコンピューティングシステムにおけるジョブのスケジューリングおよび当該ジョブの実行要求を行うサーバにおいて、

システムを構成するコンピュータに対して実行すべきジョブを割り当て、当該ジョブの実行要求を行うスケジューラ部と、

前記コンピュータの情報を管理すると共に、前記スケジューラ部による前記ジョブの実行要求を当該ジョブの割り当てられた当該コンピュータに代わって受け付け、当該コンピュータの状況に応じて当該ジョブの実行要求を当該コンピュータに対して行うエージェント部と

を備えることを特徴とするサーバ。

[7] 前記エージェント部は、システムを構成する前記コンピュータごとに設けられ、各々が対応するコンピュータとの間で設定された個別の通信形式で前記ジョブの実行要求を行うことを特徴とする請求項 6に記載のサーバ。

[8] 少なくとも一部の前記エージェント部は、システムを構成する前記コンピュータからのポーリングによるアクセスに応じて当該コンピュータに対する前記ジョブの実行要求を行い、少なくとも他の一部の前記エージェント部は、自身が管理するタイミングで対応する前記コンピュータに対する前記ジョブの実行要求を行うことを特徴とする請求項 7に記載のサーバ。

[9] グリッドコンピューティングシステムにおけるジョブのスケジューリングおよび当該ジョブの実行要求を行うサーバにおいて、

システムを構成するコンピュータの能力および動作状況に関する情報を管理すると共に、当該コンピュータとの間で行われる通信を中継して、当該コンピュータの動作状況に応じて送受信を行うエージェント部と、

前記エージェント部に管理されて、る前記情報に基づ、て前記コンピュータに実行させるジョブの割り当てを行!、、ジョブを割り当てられたコンピュータに対する当該ジョブの実行要求を、当該エージェント部を介して行うスケジューラ部と

を備えることを特徴とするサーバ。

[10] 前記エージェント部は、システムを構成する前記コンピュータごとに設けられ、

前記スケジューラ部は、ジョブを割り当てられた前記コンピュータに対応する前記ェ一ジェント部を介して当該ジョブの実行要求を行うことを特徴とする請求項 9に記載のサーバ。

[11] 前記スケジューラ部は、前記エージェント部に格納されている前記コンピュータの能力に関する情報に基づ、て前記ジョブの割り当てを行、、かつ当該ジョブの割り当てられたコンピュータの動作状況に関わらず、当該ジョブの実行要求を行い、

前記エージェント部は、少なくとも一部の前記コンピュータに対して、当該コンビュ一タカのポーリングによるアクセスに応じて前記スケジューラ部によるジョブの実行要求を送信し、少なくとも他の一部の前記コンピュータに対して、自身が管理するタイミングで前記スケジューラ部によるジョブの実行要求を送信することを特徴とする請求項 9に記載のサーバ。

[12] コンピュータにより、グリッドコンピューティングシステムにおけるジョブのスケジユーリングおよび当該ジョブの実行要求を行うジョブ実行制御方法であって、

前記コンピュータが、記憶装置に格納されたシステムを構成しジョブを実行するプロセスサーバの能力に基づき、当該プロセスサーバの動作状況に関わらずにジョブの割り当てを行うステップと、

前記コンピュータが、前記ジョブの割り当てられたプロセスサーバに対するジョブ実行リクエストを発行するステップと、

前記コンピュータが、発行された前記ジョブ実行リクエストを一時的に保持し、前記ジョブの割り当てられた前記プロセスサーバの動作状況に応じて、当該プロセスサーバに送信するステップと

を含むことを特徴とするジョブ実行制御方法。

[13] コンピュータに、

グリッドコンピューティングシステムを構成しジョブを実行するプロセスサーバの情報を記憶手段に格納して管理する機能と、前記プロセスサーバの情報に基づき、当該プロセスサーバに対して実行すべきジョブを割り当て、ジョブ実行リクエストを発行する機能と、

発行された前記リクエストを受け付けて、当該リクエストにかかるジョブを割り当てられたプロセスサーバの動作状況に応じて当該リクエストを当該プロセスサーバに送信する機能と

を実現させることを特徴とするプログラム。

[14] 前記ジョブ実行リクエストを発行する機能では、前記コンピュータに、前記プロセスサーバの動作状況に関わらず前記ジョブの割り当てを実行させることを特徴とする請求項 13に記載のプログラム。

[15] 前記リクエストを前記プロセスサーバに送信する機能では、前記コンピュータに、少なくとも一部の前記プロセスサーバに対して、当該プロセスサーバからのポーリングによるアクセスに応じて前記リクエストを送信させ、少なくとも他の一部の前記プロセスサーバに対して、自身が管理するタイミングで前記リクエストを送信させることを特徴とする請求項 13に記載のプログラム。

[16] 前記リクエストを前記プロセスサーバに送信する機能では、前記コンピュータに、フアイァウォールを介して接続されて、る前記プロセスサーバに対して、当該プロセスサーノくからのポーリングによるアクセスに応じて前記スケジューラ部力も受け付けた前記リクエストを送信させることを特徴とする請求項 13に記載のプログラム。