JP2002288149A - 並列計算機のチェックポイントリスタートにおけるノード座標変換方法 - Google Patents

並列計算機のチェックポイントリスタートにおけるノード座標変換方法

Info

Publication number
JP2002288149A
JP2002288149A JP2001086624A JP2001086624A JP2002288149A JP 2002288149 A JP2002288149 A JP 2002288149A JP 2001086624 A JP2001086624 A JP 2001086624A JP 2001086624 A JP2001086624 A JP 2001086624A JP 2002288149 A JP2002288149 A JP 2002288149A
Authority
JP
Japan
Prior art keywords
node
job
coordinates
restart
checkpoint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001086624A
Other languages
English (en)
Inventor
Takeshi Obara
剛 小原
Hiroyuki Kumazaki
裕之 熊崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd, Hitachi Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2001086624A priority Critical patent/JP2002288149A/ja
Publication of JP2002288149A publication Critical patent/JP2002288149A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】リスタート時に再割り当てされるノードによっ
てシステムコールの動作が不正とならないチェックポイ
ントリスタートを実現する。 【解決手段】ユーザプログラムの作業領域に格納される
ノード座標を、常に初回ジョブ投入時に割り当てられた
ノードのノード座標とし、ノード座標を仮想的に扱うこ
とにより、リスタート時に再割り当てされるノードによ
ってシステムコールの動作が不正とならないチェックポ
イントリスタートを実現する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数ノードで構成
される並列計算機におけるチェックポイントリスタート
に関し、特にチェックポイント時にジョブに対して割り
当てられていたノードとジョブリスタート時にジョブへ
再割当てされるノードがチェックポイント時と異なる場
合において、リスタート後のジョブを正常に動作させる
ためのノード座標変換方法に関するものである。
【0002】
【従来の技術】チェックポイントリスタートにおけるチ
ェックポイントでは、ジョブ内のユーザプログラムを再
実行するために必要とされる情報として、データ領域や
スタック領域といったユーザプログラムの作業領域の内
容と、オペレーティングシステム内の管理情報を外部記
憶装置に退避する。リスタートでは、チェックポイント
時に退避されたユーザプログラムの作業領域の内容につ
いては退避した内容をそのまま回復、また、チェックポ
イント時に退避されたオペレーティングシステム内の管
理情報を元に、オペレーティングシステム内の管理情報
を補正することにより、ユーザプログラムを再実行する
ことが出来る。ここで、ユーザプログラムがシステムコ
ールによって取得した情報は、ユーザプログラムの作業
領域に格納されているため、チェックポイントリスター
トによってその情報が変更されることはなく、リスター
ト後にチェックポイント前の情報がそのまま使用され
る。
【0003】
【発明が解決しようとする課題】上記従来技術では、ジ
ョブをチェックポイントリスタートする際に、ジョブに
再割当てされるノードがチェックポイント時と異なる場
合は、次のような問題点が発生する。すなわち、チェッ
クポイント前にノード座標を出力とするシステムコール
により得たノード座標をユーザプログラムの作業領域に
格納していたユーザプログラムが、リスタート後にその
ノード座標を入力とするシステムコールを発行すると、
オペレーティングシステムではユーザプログラムから入
力されたノード座標をそのまま使用して処理を行なう
が、ジョブに再割り当てされているノードのノード座標
は異なるため、入力されたノード座標との間で不整合が
生じ、システムコールが正しく動作しない。
【0004】本発明の目的は、ユーザプログラムの作業
領域に格納されるノード座標を、常に初回ジョブ投入時
に割り当てられたノードのノード座標とし、ノード座標
を仮想的に扱うことにより、リスタート時に再割り当て
されるノードによってシステムコールの動作が不正とな
らないチェックポイントリスタートを実現することにあ
る。
【0005】
【課題を解決するための手段】上記の目的を解決するた
め、本発明の並列計算機のチェックポイントリスタート
におけるノード座標変換方法は、初回チェックポイント
時にジョブに割当てられていたノードのノード座標を外
部記憶装置に退避しておき、リスタート時にはジョブに
再割当てされたノードのノード座標と初回チェックポイ
ント時に割当てられたノードのノード座標を対応させた
ノード座標変換テーブルを作成し、リスタート後にその
ジョブからノード座標を入力とするシステムコールが発
行された場合、ノード座標変換テーブルから、入力され
たノード座標に対応する初回チェックポイント時に割当
てられていたノードのノード座標を求めてそのノード座
標を用いてシステムコールの処理を行ない、リスタート
後にそのジョブからノード座標を出力とするシステムコ
ールが発行された場合、一旦システムコールの処理で求
められたノード座標に対応する、初回チェックポイント
時に割当てられていたノード座標をノード座標変換テー
ブルから求めてそのノード座標をシステムコールの結果
として返却することを特徴とする。
【0006】
【発明の実施の形態】以下、本発明の一実施例について
図面により説明する。
【0007】図1は本発明の一実施例のシステム構成図
である。図1において、1は主記憶装置で、ユーザプロ
グラム21、ユーザプログラム作業領域31、オペレー
ティングシステム4、オペレーティングシステム作業領
域5はこの主記憶装置1に格納されている。6は中央処
理装置で、主記憶装置1と中央処理装置6で1つのノー
ド7が構成されている。各ノード7同士は高速ネットワ
ーク10で結合されている。9は外部記憶装置で、複数
のノード7、高速ネットワーク10及び外部記憶装置9
で並列計算機11を構成している。
【0008】8は単一または複数のユーザプログラム及
びユーザプログラム作業領域から構成されるジョブであ
る。図1では、例としてユーザプログラム21とそのユ
ーザプログラム作業領域31、ユーザプログラム22と
そのユーザプログラム作業領域32の2つのユーザプロ
グラムとそのユーザプログラム作業領域で構成されるジ
ョブ8を示している。チェックポイントリスタート機能
により、ジョブ8を構成しているユーザプログラム(2
1〜22)とユーザプログラム作業領域(31〜32)
の情報を外部記憶装置9に退避する。リスタート時に
は、ジョブ8に対して、その時点で使用可能なノードが
再割当てされ、外部記憶装置8から退避データを読み込
み、再割当てされたノード上でジョブを構成するユーザ
プログラム(21〜22)とユーザプログラム作業領域
(31〜32)を回復し、動作させる。
【0009】図2は、リスタート時にオペレーティング
システム作業領域5に作成されるノード座標変換テーブ
ル200の例を示したものである。201はジョブ識別
子で、どのジョブに対するノード座標変換テーブルであ
るかを識別するために使用する。202〜205はジョ
ブに対する初回割当てノードのノード座標で、206〜
209はリスタート時にジョブに対して再割当てされた
ノードのノード座標である。図2の例では、ジョブに対
して4ノード割当てられているものとしている。初回割
当てノードのノード座標202に対するリスタート後の
ノード座標は206、初回割当てノードのノード座標2
03に対応するリスタート後のノード座標は207とい
うように、初回割当てノードのノード座標群とリスター
トで再割当てされたノードのノード座標群は1対1に対応
付けられ、ノード座標変換時にはその対応づけに従って
変換される。
【0010】図3は、リスタート後に、主記憶装置1に
格納されているユーザプログラム21が、オペレーティ
ングシステム4に対してノード座標の入出力を伴うシス
テムコールを発行した際の動作を示したものである。ユ
ーザプログラム作業領域31に格納されているノード座
標を用いて、ユーザプログラム21からノード座標を入
力とするシステムコールが発行された場合、オペレーテ
ィングシステム4はまず入力されたノード座標をノード
座標変換テーブル200を用いて再割当てノード座標に
変換し、変換後のノード座標を用いてシステムコール処
理を行なう。
【0011】また、ユーザプログラム21からノード座
標を出力とするシステムコールが発行された場合、オペ
レーティングシステム4は、まずシステムコール処理を
行ない、出力ノード座標、つまり再割当てノード座標を
得る。その後、その再割当てノード座標をノード座標変
換テーブル200を用いて初回割当てノード座標に変換
し、変換後のノード座標をユーザプログラムに返却す
る。返却されたノード座標はユーザプログラム作業領域
31に格納される。
【0012】図4は、チェックポイント時に初回割当て
ノード座標群を退避する際の動作概要を示すフローチャ
ートである。チェックポイントするジョブのジョブ識別
子21が一致するノード座標変換テーブル200が存在
するかどうか調べ(ステップ400)、存在した場合
は、ノード座標変換テーブル200に格納されている初
回割当てノードのノード座標情報を退避する情報として
取得する(ステップ402)。存在しない場合は、オペ
レーティングシステム4から現在ジョブに割当てられて
いるノードのノード座標情報を退避する情報として取得
する(ステップ401)。取得した初回割当てノードの
ノード座標情報は、外部記憶装置9に退避される。
【0013】図5は、リスタート時にノード座標変換テ
ーブル200を作成する際の動作概要を示すフローチャ
ートである。まず外部記憶装置9に退避した初回割当て
ノード座標情報を読みこむ(ステップ500)。次に、
オペレーティングシステム4から現在ジョブに再割当て
されたノードのノード座標を取得する(ステップ50
2)。最後にステップ500で読み込んだ初回割当てノ
ード座標とステップ501で取得した再割当てノード座
標を元に、リスタートするジョブのジョブ識別子201
に対応するノード座標変換テーブル200を作成する。
【0014】図6は、ユーザプログラム21からノード
座標を入力とするシステムコールをオペレーティングシ
ステム4が受けた際の動作概要を示すフローチャートで
ある。オペレーティングシステム4では、ユーザプログ
ラム21が属するジョブの識別子201に対応するノー
ド座標変換テーブル200が存在するかどうか調べる
(ステップ600)。存在した場合、ノード座標変換テ
ーブル200より、入力されたノード座標を再割当てノ
ード座標に変換し(ステップ601)、存在しない場合
は、入力されたノード座標をそのまま用いて、ノード座
標を入力とするシステムコールの処理を行なう(ステッ
プ602)。
【0015】図7は、ユーザプログラム21からノード
座標を出力とするシステムコールをオペレーティングシ
ステム4が受けた際の動作概要を示すフローチャートで
ある。オペレーティングシステム4では、まずノード座
標を出力とするシステムコールの処理を行ない、一旦出
力するノード座標を得る(ステップ700)。次に、ユ
ーザプログラム21が属するジョブの識別子201に対
応するノード座標変換テーブル200が存在するかどう
か調べる(ステップ701)。存在した場合、ステップ
700の処理で得たノード座標をノード座標変換テーブ
ル200を用いて初回割当てノード座標に変換し(ステ
ップ702)、変換後のノード座標をユーザプログラム
21に返却する(ステップ703)。存在しない場合
は、ステップ700で得たノード座標をそのまま返却す
る(ステップ703)。
【0016】
【発明の効果】本発明によれば、チェックポイント時と
リスタート時にジョブに割当てられるノードが変更とな
った場合でも、リスタートされたジョブがノード座標を
用いたシステムコールを発行しても正常に動作すること
が保証される。
【図面の簡単な説明】
【図1】本発明の一実施例のシステム構成図。
【図2】ノード座標変換テーブルを示す図。
【図3】本発明の一実施例の原理図。
【図4】初回割当てノード座標情報の退避方法を説明す
るフローチャート。
【図5】ノード座標変換テーブル作成方法を説明するフ
ローチャート。
【図6】ノード座標を入力とするシステムコールの処理
方法を説明するフローチャート。
【図7】ノード座標を出力とするシステムコールの処理
方法を説明するフローチャート。
【符号の説明】
1…主記憶装置、21、22…ユーザプログラム、3
1、32…ユーザプログラム作業領域、4…オペレーテ
ィングシステム、5…オペレーティングシステム作業領
域、6…中央処理装置、7…ノード、8…ジョブ、9…
外部記憶装置、10…高速ネットワーク、11…並列計
算機、200…ノード座標変換テーブル、201…ジョ
ブ識別子。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小原 剛 神奈川県横浜市中区尾上町六丁目81番地 日立ソフトウェアエンジニアリング株式会 社内 (72)発明者 熊崎 裕之 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア事業部内 Fターム(参考) 5B027 AA01 BB01 CC04 5B045 GG11 JJ45

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 ユーザプログラムからノード座標として
    識別されるノードが複数連結されることによって構成さ
    れる計算機上で、単一又は複数のユーザプログラムから
    構成されるジョブを、ジョブ実行に必要とされるノード
    数を割当てて実行し、チェックポイント機能によりリス
    タートに必要なジョブの情報を外部記憶装置へ退避し、
    退避されたジョブの情報を読み込み、チェックポイント
    されたジョブをリスタートさせるシステムにおいて、初
    回チェックポイント時にジョブに割当てられていたノー
    ドのノード座標を外部記憶装置に退避しておき、リスタ
    ート時にはジョブに再割当てされたノードのノード座標
    と初回チェックポイント時に割当てられたノードのノー
    ド座標を対応させたノード座標変換テーブルを作成し、
    リスタート後にそのジョブからノード座標を入力とする
    システムコールが発行された場合、ノード座標変換テー
    ブルから、入力されたノード座標に対応する初回チェッ
    クポイント時に割当てられていたノードのノード座標を
    求めてそのノード座標を用いてシステムコールの処理を
    行ない、リスタート後にそのジョブからノード座標を出
    力とするシステムコールが発行された場合、一旦システ
    ムコールの処理で求められたノード座標に対応する、初
    回チェックポイント時に割当てられていたノード座標を
    ノード座標変換テーブルから求めてそのノード座標をシ
    ステムコールの結果として返却することを特徴とする並
    列計算機のチェックポイントリスタートにおけるノード
    座標変換方法。
JP2001086624A 2001-03-26 2001-03-26 並列計算機のチェックポイントリスタートにおけるノード座標変換方法 Pending JP2002288149A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001086624A JP2002288149A (ja) 2001-03-26 2001-03-26 並列計算機のチェックポイントリスタートにおけるノード座標変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001086624A JP2002288149A (ja) 2001-03-26 2001-03-26 並列計算機のチェックポイントリスタートにおけるノード座標変換方法

Publications (1)

Publication Number Publication Date
JP2002288149A true JP2002288149A (ja) 2002-10-04

Family

ID=18941974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001086624A Pending JP2002288149A (ja) 2001-03-26 2001-03-26 並列計算機のチェックポイントリスタートにおけるノード座標変換方法

Country Status (1)

Country Link
JP (1) JP2002288149A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009187171A (ja) * 2008-02-05 2009-08-20 Nec Corp チェックポイント・リスタート装置及びチェックポイント・リスタート方法
US7870424B2 (en) 2006-11-14 2011-01-11 Honda Motor Co., Ltd. Parallel computer system
JP2011186606A (ja) * 2010-03-05 2011-09-22 Nec Corp コンピュータシステム、およびそのチェックポイントリスタート方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7870424B2 (en) 2006-11-14 2011-01-11 Honda Motor Co., Ltd. Parallel computer system
JP2009187171A (ja) * 2008-02-05 2009-08-20 Nec Corp チェックポイント・リスタート装置及びチェックポイント・リスタート方法
JP2011186606A (ja) * 2010-03-05 2011-09-22 Nec Corp コンピュータシステム、およびそのチェックポイントリスタート方法

Similar Documents

Publication Publication Date Title
GB2293675A (en) Process allocation in a data processing system
EP3557445A1 (en) Transaction processing method and apparatus
JP2002288149A (ja) 並列計算機のチェックポイントリスタートにおけるノード座標変換方法
JP5672521B2 (ja) コンピュータシステム、およびそのチェックポイントリスタート方法
JP2003140894A (ja) ソフトウェア開発資源間の関連付け方法及びそのプログラム
JP3163196B2 (ja) 仮想記憶制御における命令中断情報格納制御方法
JPH08137923A (ja) Cadシステムの設計データ管理方式
JP2001282555A (ja) コンピュータシステムのプロセス管理方式
JP6278121B2 (ja) 情報処理装置、データ処理方法、及び、プログラム
JPH06332724A (ja) オブジェクト指向型システムにおける論理的単位の実装方式、及び実行多重度制御方式、並びに実行優先度制御方式
JP2590872B2 (ja) タスクスケジュール方法
JPH1131134A (ja) コンピュータシステム及び同システムに適用するスケジューリング方法
JPH02178847A (ja) プログラムの再実行用データテーブル生成方式
KR940002148B1 (ko) 전전자 교환시스팀의 작업 동기 방법
JPS63137348A (ja) 文字コ−ド変換方式
JP2019179411A (ja) 情報処理装置
JPH0588857A (ja) 実行形式フアイルの変換方式
JP2000148516A (ja) 移動オブジェクト実行順序制御方式
JPH0594285A (ja) テーブルデータの一元管理方式
JPS6154542A (ja) タスク制御方式
JPH09153076A (ja) データベースシステムおよびそれを用いたcadシステム
JPS58114249A (ja) プログラムのダイナミツクエリア管理によるデイスパツチング制御方式
JPH0452490B2 (ja)
JPH01305435A (ja) ロードモジュール最適化方式
JPH02186795A (ja) 電子交換システムの局データ作成方法