JP2007179248A - 計算機管理方法、計算機管理プログラム、および、計算機管理装置 - Google Patents

計算機管理方法、計算機管理プログラム、および、計算機管理装置 Download PDF

Info

Publication number
JP2007179248A
JP2007179248A JP2005376194A JP2005376194A JP2007179248A JP 2007179248 A JP2007179248 A JP 2007179248A JP 2005376194 A JP2005376194 A JP 2005376194A JP 2005376194 A JP2005376194 A JP 2005376194A JP 2007179248 A JP2007179248 A JP 2007179248A
Authority
JP
Japan
Prior art keywords
computer
business
reservation
management
reserved
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005376194A
Other languages
English (en)
Inventor
Koji Ito
康志 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005376194A priority Critical patent/JP2007179248A/ja
Publication of JP2007179248A publication Critical patent/JP2007179248A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】予約有り業務の実行を妨げることなく、計算機リソースの利用効率を充分に高めること。
【解決手段】本発明は、利用者クライアント101から実行を指示された予約有り処理を実行する計算機を管理する計算機管理方法であって、管理装置110が、記憶手段に格納されるリソース管理テーブル116において、予約有り処理を実行していない計算機をリソースプールとして管理するリソース管理手順と、予約有り処理の実行を予約した期間、および、割り込みにより実行を指示された期間を除く期間に、リソースプールの計算機に予約無し処理を実行させる予約無し処理管理手順と、を実行することを特徴とする。
【選択図】図2

Description

本発明は、計算機管理方法、計算機管理プログラム、および、計算機管理装置に関する技術である。
従来、未使用の計算機リソースをプール化して管理し、利用時間の異なる複数の業務で計算機リソースを共用するシステムが実現されている(特許文献1)。このような従来技術において、計算機リソースを利用した業務を行う場合には、あらかじめ利用する時間帯に空いている計算機リソースを予約確保するのが一般的である。また、緊急の業務が発生したときには、必ずしも予約する必要はなく割り込みによって業務を計算機リソースに実行させてもよい。
このように、予約や割り込みなどにより、業務の依頼者が計算機リソースに対して業務の実行を明示的に指示するような業務を、予約有り業務と定義する。予約有り業務は、例えば、通常の一般業務である。従来は、あらゆる業務は、予約有り業務として明示的に指定する必要があった。
特開2001−331332号公報
しかし、従来の技術における予約有り業務をもとにした計算機リソースの管理方法では、計算機リソースの利用効率を充分に高めることはできなかった。
特に処理期限が定められていることがないような予約無し業務も、計算機リソースの使用対象として存在する。予約無し業務は、予約有り業務とは異なり、業務の依頼者が計算機リソースに対して業務の実行を明示的に指示することはない。予約無し業務は、例えば、複数の計算機リソースを使って並列に処理することが可能な科学計算が挙げられる。
但し、予約無し業務を無条件に計算機リソースに割り当てる方式は、採用できない。通常、計算機リソースは、一度割り当てられた予約無し業務を最後まで実行する。よって、予約無し業務の実行中に予約有り業務の実行が割り込みまたは予約により指示されたときには、計算機リソースは、予約無し業務の実行を終えた後に、予約有り業務の実行を開始する。しかし、このようにすると、予約有り業務の依頼者は、予約有り業務を割り当てる計算機リソースを利用したいときに利用できなくなり、サービスを充分に受けることができない。よって、予約無し業務によって、予約有り業務の実行を妨げることがあってはならない。
そこで本発明は、前記した課題を解決し、予約有り業務の実行を妨げることなく、計算機リソースの利用効率を充分に高めることを主な目的とする。
前記課題を解決するために、本発明は、利用者クライアントから実行を指示された予約有り処理を実行する計算機を管理する計算機管理方法であって、コンピュータが、記憶手段に格納されるリソース管理テーブルにおいて、前記予約有り処理を実行していない前記計算機をリソースプールとして管理するリソース管理手順と、前記予約有り処理の実行を予約した期間、および、割り込みにより実行を指示された期間を除く期間に、前記リソースプールの前記計算機に予約無し処理を実行させる予約無し処理管理手順と、を実行することを特徴とする。その他の手段は、後記する。
本発明によれば、予約有り業務で計算機リソースが必要となった場合には、リソースプールから計算機リソースを確保して利用するという形態を残したまま、その時点で利用できる計算機リソースつまり、未使用の計算機リソースを最大限使用して、予約無し業務の処理多重度を上げることができる。また、予約有り業務が使用していない計算機リソースの障害を、予約有り業務が利用を開始する時刻より以前に検知することができる。その結果、予約有り業務の実行を妨げることなく、計算機リソースの利用効率を充分に高めることができる。
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明する。
図1は、業務処理システムを示す構成図である。
計算機センタ103には、業務処理サーバA105、業務処理サーバB106、業務処理サーバC107、業務処理サーバD108、業務処理サーバE109と、管理装置110が存在する。なお、図1では、5台の業務処理サーバの内で、業務処理サーバC107のみが予約有り業務を実行中であり、残る4台の業務処理サーバは予約有り業務を実行していない。なお、予約有り業務を実行していない各業務処理サーバは、リソースプールにプールされているともいえる。
図2は、管理装置110および業務処理サーバを示す構成図である。図2(a)の管理装置110は、主記憶装置111、CPU112、通信管理122を有し、図示を省略したバスで接続されている。管理装置110は、業務処理サーバの予約スケジュールを管理し、予約された期間に指定された業務を実行するという制御を行っている。また、実行している業務の状態を監視し、負荷が増大した場合には未使用のリソースを追加したり、障害を検知した場合には、未使用のリソースと交換したりといった制御を行っている。
管理装置110の主記憶装置111には、予約有り業務管理113、リソース管理114、予約無し業務管理115、リソース管理テーブル116、予約有り業務プログラム117、予約無し業務プログラム118、予約無し業務処理データ119、および、予約無し業務処理結果120が存在する。なお、予約有り業務管理113、リソース管理114、および、予約無し業務管理115は、例えば、CPUによって実行されるプログラムモジュールである。以下、管理装置110の動作の概要を順に説明することにより、管理装置110の各構成要素を明らかにする。
リソース管理114は、計算機センタ103に存在する業務処理サーバの利用状況や予約状況について、リソース管理テーブル116を使って管理している。例えば、リソース管理114は、負荷増大に伴う計算機リソースの追加や、障害に伴う代替計算機リソースの割当てなどを行う。予約有り業務管理113は、予約された時刻に到達した場合、リソース管理114を使って予約していた業務処理サーバに対して、予約有り業務プログラム117をデプロイして業務を開始する。
予約無し業務管理115は、予約無し業務実行するための予約無し業務プログラム118を業務処理サーバに実行させる。なお、予約無し業務の実行手法は、例えば、文献(特開2004−302741号公報)に記載されている、科学技術計算を複数の計算機リソースで実行するものが挙げられる。予約無し業務を実行するにあたり、リソース管理114に現時点で未使用の業務処理サーバを問い合わせる。予約無し業務管理115は、リソース管理114に確認した未使用の業務処理サーバに対して、予約無し業務プログラム118をコピーした後、予約無し業務処理データ119の処理データを投入する。各業務処理サーバの処理結果は、予約無し業務処理結果120に集める。
予約有り業務管理113は、利用者クライアント101からのアクセスが増大し、予約有り業務プログラム117の負荷が増大した場合、未使用のリソース(予約無し業務管理115が使用しているリソース)をリソースプールから取り出し、取り出したリソースである業務処理サーバ上で業務Aを実行することで高負荷への対応を行う。このような場合、予約無し業務管理115は当該業務処理サーバで障害が発生したのと同様と考え、仕掛中であった処理を別の業務処理サーバで実行する。
予約無し業務管理115は、業務処理サーバの予約時刻が近づいた場合(例えば、現在の時刻と予約時刻との差分が所定値以下となる場合)、予約無し業務データの投入を停止し、投入する予定であったデータは他の業務処理サーバに投入する。逆に、業務Aが終了して業務処理サーバがリソースプールに戻った場合、予約無し業務管理115は、当該業務サーバに予約無し業務プログラム118をコピーして、予約無し業務データの投入を開始する。
図2(b)の業務処理サーバC107では、予約有り業務プログラム117が動作している。予約有り業務プログラム117は、利用者クライアント101からのリクエストについて、ネットワーク102を介して受信して処理を行っている。図2(c)の業務処理サーバA105では、予約無し業務プログラム118が動作している。管理装置110は、予約有り業務プログラム117および予約無し業務プログラム118を各業務管理サーバにデプロイする。
図3は、計算機リソースの利用状況の一例を示す説明図である。図3は、5台の業務処理サーバの予約状況の例を示している。まず、時刻t1において、図1に示すように、5台中1台の業務処理サーバが予約有り業務プログラム117を動作させている。次に、時刻t2から時刻t3までの期間に、業務処理サーバA105、業務処理サーバB106には予約有り業務Bに関する予約が入っている。また、時刻t2から時刻t5までの期間に、業務処理サーバD108にも予約有り業務Cに関する予約が入っており、時刻t3から時刻t5までの期間に、業務処理サーバE109にも予約有り業務Dに関する予約が入っていることを示している。
図3の予約スケジュールに沿った業務処理の実行の一例を説明する。まず、時刻t1において、予約の入っていない各業務処理サーバ(業務処理サーバA105、業務処理サーバB106、業務処理サーバD108、および、業務処理サーバE109)が、予約無し業務を実行する。その後、現在の時刻が時刻t2に近づいた時点で、時刻t2から予約の入っている各業務処理サーバ(業務処理サーバA105、業務処理サーバB106、および、業務処理サーバD108)は、予約に備えて、予約無し業務を終了する。一方、時刻t2から予約の入っていない業務処理サーバE109は、予約無し業務を続行する。さらに、時刻t3から時刻t4までの期間は、予約の入っていない各業務処理サーバ(業務処理サーバA105、および、業務処理サーバB106)が、予約無し業務を実行する。
図4は、リソース管理テーブル116を示す構成図である。リソース管理テーブル116には、業務処理サーバ名301ごとに、予約有り業務の使用状況302、次の予約の開始時刻である予約有り業務の利用開始時刻303、予約有り業務の利用終了時刻304が記録されている。また、リソース管理テーブル116には、予約無し業務管理115が使用していることを示すフラグである予約無し業務で使用中305、予約無し業務管理115が障害を検知したことを示す障害検知306も記録されている。
図5および図6は、予約無し業務管理115を示すフローチャートである。図5の処理が図6の処理をサブルーチンとして呼び出す。
図5は、予約無し業務管理115のメイン処理を示すフローチャートである。まず、予約無し業務管理115は、リソース管理114に未使用の業務処理サーバを確認する(S401)。未使用とは、予約有り業務も予約無し業務も実行していないことを指す。次に、S402からS405において、未使用の業務処理サーバの数だけ、ループ変数をiとして以下に説明する処理を繰り返す。予約無し業務管理115は、図6に示すi番目の業務処理サーバの制御処理を起動し(S403)、その後、一定時間待つ(S404)。なお、S404は省略してもよい。
図6は、予約無し業務管理115のサブルーチン処理を示すフローチャートである。まず、予約無し業務管理115は、予約無し業務プログラム118を業務処理サーバにコピーして(S500)、デプロイする。次に、予約無し業務管理115は、予約無し業務処理データ119から処理するべきデータを取り出す(S501)。
予約無し業務管理115は、処理するべきデータである予約無し業務の内容がないときには(S502,Yes)、処理を終了する。予約無し業務管理115は、予約無し業務の内容があるときには(S502,No)、予約無し業務を業務処理サーバに投入(S503)、その予約無し業務の処理の終了を待つ(S504)。
なお、S503において予約無し業務の処理を行う業務処理サーバの管理者に対して、予約無し業務の処理を行うことに関する許可を確認させる画面をディスプレイなどの表示手段に表示してもよい。これにより、業務処理サーバの管理者は、管理対象の業務処理サーバが意図しない用途に勝手に使用されることを防ぐことができる。
また、予約無し業務管理115は、S503において予約無し業務の処理を業務処理サーバに実行させたときには、その実行に関するログを記憶手段に記録してもよい。このログは、例えば、予約無し業務の処理の依頼者に対する、業務処理サーバの計算機リソースの使用の対価に関する課金処理に使用される。
予約無し業務管理115は、S504にて業務処理サーバからの処理結果が届いた場合か、S504の待ち時間を超えた場合にS505に進み、S503において投入した予約無し業務の処理が正常に終了したか否かを判定する(S505)。
まず、処理が正常に終了している場合は(S505,Yes)、予約無し業務管理115は、予約無し業務の処理結果を予約無し業務処理結果120に格納する(S506)。その後、予約無し業務管理115は、リソース管理テーブル116を確認し、現在の時刻が、使用した業務処理サーバについての予約有り業務の利用開始時刻303のn分前になったかを判定する(S507)。利用開始時刻が近づいている場合は(S507,Yes)、予約無し業務管理115は、業務処理サーバ上の予約無し業務プログラム118を削除して(S513)、処理を終了する。利用開始時刻が近づいていないときには(S507,No)、S501に戻る。
一方、処理が正常に終了していない場合は(S505,No)、失敗した予約無し業務処理のデータを予約無し業務処理データ119に再登録する(S508)。これにより、失敗した予約無し業務処理のデータは、他の業務処理サーバにて処理されることになる。
その後、失敗した要因がハード障害であった場合は(S509,Yes)、リソース管理114に障害を報告する(S510)。報告を受けたリソース管理114は、その報告に関する業務処理サーバを予約している業務について、他の利用可能な業務処理サーバを割当てることになる。つまり、予約時間が始まるより以前に、障害を検知することができるようになる。
失敗した要因がハード障害ではないと判断した場合(S509,No)、予約有り業務管理113による予約有り業務の割り込みにより(S511)、業務管理サーバが奪取されたかを判断する。割り込みがあれば(S511,Yes)、それは通常の動作であるため処理を終了する。割り込みがない場合(S511,No)、オペレータコールを発信し(S512)、オペレータに対処を依頼する。
図7は、予約無し業務管理115を業務処理サーバ上で動作させる場合の業務処理システム構成を示す構成図である。つまり、図1においては管理装置110で動作していた予約無し業務管理115を、予約有り業務と同様に業務処理サーバ上で動作させる場合の例を示している。業務処理サーバE109で予約無し業務管理115が動作し、他の未使用の業務処理サーバに予約無し業務を依頼している。これにより、管理装置110の負荷を軽減できる点と、予約有り業務管理113が予約無し業務を他の予約有り業務と同様の扱いで管理することで、指定された時刻に予約無し業務を開始するといった制御が、予約有り業務管理113の機能を利用して容易に実現できる。
以上説明した本実施形態は、以下の特徴を有する。予約無し業務の実行を制御する予約無し業務管理115は、リソースプール上の未使用の計算機リソースを利用して予約無し業務を実行する。予約有り業務は、業務で計算機リソースが必要となった場合には、リソースプールから計算機リソースを確保して利用するが、予約無し業務はリソースプールに計算機リソースを登録したままの状態(予約有り業務から見ると未使用の状態のまま)で、計算機リソースを利用することを特徴とする。
予約無し業務管理115は、リソースプール上の計算機リソースの予約状況を確認し、予約無し業務で利用している計算機リソースの予約時間が近づいた場合には、予約時間に先立って予約無し業務を終了させる。また予約無し業務管理115は、予約有り業務が終了してリソースプールに計算機リソースが戻されたことを確認した場合、当該計算機リソースを利用して予約無し業務の処理多重度を上げる。
以上説明した本実施形態により、未使用の計算機リソースをプール化して管理し、業務で計算機リソースが必要となった場合には、リソースプール上の計算機リソースを予約確保して利用するシステムにおいて、複数の計算機リソースを使って並列に処理することが可能な科学計算等の予約無し業務については、その時点で利用できる計算機リソースつまり、その時点で未使用の計算機リソースを最大限使用して、多重度を上げて短時間に処理をすることができる。その結果、短時間で処理を完了することができる。
また、科学計算等の予約無し業務は、処理の多重度や処理量や計算機リソースの処理能力によって業務の実行時間が大きく変動し、計算機リソースを予約確保することが難しいため、計算機リソースを予約確保せずに利用することを可能とする。
本発明の一実施形態に関する業務処理システムを示す構成図である。 本発明の一実施形態に関する管理装置および業務処理サーバを示す構成図である。 本発明の一実施形態に関する計算機リソースの利用状況の一例を示す説明図である。 本発明の一実施形態に関するリソース管理テーブルを示す構成図である。 本発明の一実施形態に関する予約無し業務管理のメイン処理を示すフローチャートである。 本発明の一実施形態に関する予約無し業務管理のサブルーチン処理を示すフローチャートである。 本発明の一実施形態に関する予約無し業務管理を業務処理サーバ上で動作させる場合の業務処理システム構成を示す構成図である。
符号の説明
101 利用者クライアント
102 ネットワーク
103 計算機センタ
105 業務処理サーバA
106 業務処理サーバB
107 業務処理サーバC
108 業務処理サーバD
109 業務処理サーバE
110 管理装置
111 主記憶装置
112 CPU
113 予約有り業務管理
114 リソース管理
115 予約無し業務管理
116 リソース管理テーブル
117 予約有り業務プログラム
118 予約無し業務プログラム
119 予約無し業務処理データ
120 予約無し業務処理結果
122 通信管理

Claims (8)

  1. リソースの予約を要しない予約無し処理と、利用者クライアントから実行を指示されたリソースの予約を要する予約有り処理とを実行する計算機を管理する計算機管理方法であって、
    コンピュータが、
    記憶手段に格納されるリソース管理テーブルにおいて、前記予約有り処理を実行していない前記計算機をリソースプールとして管理するリソース管理手順と、
    前記予約有り処理の実行を予約した期間、および、割り込みにより実行を指示された期間を除く期間に、前記リソースプールの前記計算機に前記予約無し処理を実行させる予約無し処理管理手順と、
    を実行することを特徴とする計算機管理方法。
  2. 前記リソース管理手順は、前記予約無し処理の実行を中断した計算機、または、新規に追加された計算機を、前記リソースプールに追加することを特徴とする請求項1に記載の計算機管理方法。
  3. 前記予約無し処理管理手順は、所定の計算機について、前記予約有り処理の実行を予約した期間に現在の時刻が近づいた場合には、前記所定の計算機で動作している予約無し処理を終了し、その予約無し処理を実行するための予約無し業務プログラムを前記所定の計算機から削除することを特徴とする請求項1または請求項2に記載の計算機管理方法。
  4. 前記予約無し処理管理手順は、前記計算機に前記予約無し処理を実行させるか否かを確認する画面を表示手段に表示することを特徴とする請求項1ないし請求項3のいずれか1項に記載の計算機管理方法。
  5. 前記予約無し処理管理手順は、前記計算機が前記予約無し処理を実行した旨のログを記憶手段に記録することを特徴とする請求項1ないし請求項4のいずれか1項に記載の計算機管理方法。
  6. コンピュータが、前記予約無し処理を実行中の所定の計算機に関する障害を検知した場合、前記所定の計算機が実行するように予約された前記予約有り処理を、前記所定の計算機とは別の計算機に割り当てるように予約を変更する予約有り処理管理手順を実行することを特徴とする請求項1ないし請求項5のいずれか1項に記載の計算機管理方法。
  7. 請求項1ないし請求項6のいずれか1項に記載の計算機管理方法を、コンピュータに実行させるための計算機管理プログラム。
  8. リソースの予約を要しない予約無し処理と、利用者クライアントから実行を指示されたリソースの予約を要する予約有り処理とを実行する計算機を管理する計算機管理装置であって、
    リソース管理テーブルにおいて、前記予約有り処理を実行していない前記計算機をリソースプールとして管理するリソース管理部と、
    前記予約有り処理の実行を予約した期間、および、割り込みにより実行を指示された期間を除く期間に、前記リソースプールの前記計算機に前記予約無し処理を実行させる予約無し処理管理部と、
    を有することを特徴とする計算機管理装置。
JP2005376194A 2005-12-27 2005-12-27 計算機管理方法、計算機管理プログラム、および、計算機管理装置 Pending JP2007179248A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005376194A JP2007179248A (ja) 2005-12-27 2005-12-27 計算機管理方法、計算機管理プログラム、および、計算機管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005376194A JP2007179248A (ja) 2005-12-27 2005-12-27 計算機管理方法、計算機管理プログラム、および、計算機管理装置

Publications (1)

Publication Number Publication Date
JP2007179248A true JP2007179248A (ja) 2007-07-12

Family

ID=38304381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005376194A Pending JP2007179248A (ja) 2005-12-27 2005-12-27 計算機管理方法、計算機管理プログラム、および、計算機管理装置

Country Status (1)

Country Link
JP (1) JP2007179248A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012025977A1 (ja) * 2010-08-23 2012-03-01 株式会社日立製作所 スケジュール管理方法及びスケジュール管理サーバ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012025977A1 (ja) * 2010-08-23 2012-03-01 株式会社日立製作所 スケジュール管理方法及びスケジュール管理サーバ
JP5334226B2 (ja) * 2010-08-23 2013-11-06 株式会社日立製作所 スケジュール管理方法及びスケジュール管理サーバ

Similar Documents

Publication Publication Date Title
CN109117260B (zh) 一种任务调度方法、装置、设备和介质
KR100509794B1 (ko) 데이터베이스 관리시스템을 이용하는 작업들의 실시간 처리를 위한 스케줄링 방법
JP7003874B2 (ja) リソース予約管理装置、リソース予約管理方法およびリソース予約管理プログラム
JP2007041720A (ja) ジョブステップ実行プログラムおよびジョブステップ実行方法
JP2011065645A (ja) マルチコアプロセッサシステム
JP2009075956A (ja) ジョブ管理方法、ジョブ管理装置およびジョブ管理プログラム
JPWO2007072544A1 (ja) 情報処理装置、計算機、リソース割り当て方法及びリソース割り当てプログラム
US20070256078A1 (en) Resource reservation system, method and program product used in distributed cluster environments
CN115576684A (zh) 任务处理方法、装置、电子设备及存储介质
JP4529812B2 (ja) 分散資源配分システム、分散資源配分方法およびプログラム
CN111163140A (zh) 资源获取和分配的方法、装置和计算机可读存储介质
JP2007286703A (ja) 親子ライセンス管理方法、親子ライセンス管理方法及び親子ライセンス管理プログラム
JP2007179248A (ja) 計算機管理方法、計算機管理プログラム、および、計算機管理装置
JP2008181298A (ja) 作業状態復帰プログラム、作業状態復帰方法および作業状態復帰装置
JP2007102332A (ja) 負荷分散システム及び負荷分散方法
JP2004246592A (ja) ジョブ実行管理装置
JP2005071171A (ja) バッチジョブ実行制御方法
JP6191361B2 (ja) 情報処理システム、情報処理システムの制御方法及び制御プログラム
JP7052396B2 (ja) 資料採取サーバ、資料採取システム、資料採取方法および資料採取プログラム
JP5417626B2 (ja) 管理計算機、ジョブスケジューリング方法及びジョブスケジューリングプログラム
CN115834714B (zh) 一种跨平台任务调度方法、服务器和系统
CN112052084B (en) Resource allocation method and computer equipment
JP5287342B2 (ja) ジョブ管理装置、ジョブ管理方法及びジョブ管理システム
CN114513547B (zh) 模块的节点调度方法、装置、电子设备及存储介质
KR100378444B1 (ko) 서버 시스템 및 클라이언트의 요청에 대한 서버 시스템의처리 방법