WO2013051067A1

WO2013051067A1 - 計算機および計算機制御方法

Info

Publication number: WO2013051067A1
Application number: PCT/JP2011/005643
Authority: WO
Inventors: 光司天野
Original assignee: 株式会社日立製作所
Priority date: 2011-10-07
Filing date: 2011-10-07
Publication date: 2013-04-11

Abstract

　複数計算機において同期して稼動するマルチタスク環境において、タスクの処理時間の統計を複数計算機で共有し、タスクの非同期状態を迅速に判断する。　計算機は、他の計算機と同期をとってタスクを処理するプロセッサと、同期プロセッサにタスクを割り当てるディスパッチャとタスクの処理時間を検出する同期タイム統計処理部と、タイムアウト統計管理テーブルを有しており、同期タイム統計処理部は過去のタスク処理時間の統計を基にタスク非同期状態を迅速に判断する。

Description

計算機および計算機制御方法

　計算機および計算機制御方法に関する。

　計算機システムにおけるシステム稼働時間を長時間化するために、計算機を多重化する技術が存在している。この技術は、例えばデュアルシステムなどにより、ハードウェアの障害に際してもシステム内の処理を継続することが出来るものである。

　また、システム停止時間を最小化するための計算機として、フォールト・トレラントコンピュータ（Ｆａｕｌｔ　ｔｏｌｅｒａｎｔ　ｃｏｍｐｕｔｅｒ）がある。このフォールト・トレラントコンピュータの技術は、ハードウェアを多重化し、同一プログラムを複数のＣＰＵで動作させて、ＣＰＵの障害時にも処理を継続可能とするものである。例えば、本出願人は分散配置に適したフォールトトレラントシステムの構成を提案している（特許文献１参照）。

　こうした従来のデュアルシステムやフォールトトレラントシステムにおいては、その実現に際して、クロック同期（ロックステップ方式）などを必要とする。そのため、専用ハードウェアに各計算機の通信インターフェースが直接接続されている計算機構成が一般的となっていた。

　一方、近年ではネットワークの高速化、及び計算機の汎用化に伴い、専用ハードウェアではなく、一般的なネットワークを利用して複数計算機を接続する技術が発達してきた。また、計算機システムが処理する情報量の拡大に伴い、各処理ステップを複数のタスクとして分解し、マルチタスク実行可能ＯＳが複数のタスクを切り換えながら実行するニーズがある。

　なお、情報処理装置の信頼性向上の従来技術としては、以下の技術が存在する。例えば、複数の装置により同一処理を実行する情報処理装置の信頼性を向上させるとの課題の下、互いに独立して同一処理を二重に実行する第１の装置および第２の装置を備える情報処理装置において、前記第１の装置においてステータスを取得するステータス取得手段と、取得された前記ステータスに応じた共通のイベントを、前記第１の装置および前記第２の装置において発生させるイベント発生手段とを備えることを特徴とする情報処理装置が提案されている（特許文献２参照）。

　また、高度の信頼性を確保しうる情報処理装置および情報処理方法を提供するとの課題の下、互いに独立して同一処理を二重に実行する第１の装置および第２の装置を備える情報処理装置において、前記第２の装置における処理により生成されたデータを、前記第２の装置から前記第１の装置に向けて送信する送信手段と、前記送信手段により送信された前記データと、前記第１の装置における処理により生成されたデータとを、前記第１の装置において照合し、前記両データが一致しない場合に異常と判定するデータ照合手段と、
を備えることを特徴とする情報処理装置も提案されている（特許文献３参照）。

　また、信頼性の高いクラスタシステムを提供するとの課題の下、複数のクラスタであって、各クラスタは複数のノードからなり、各クラスタの複数のノードはアプリケーションプログラムの処理を分担して並列に実行するものと、該複数のクラスタからの複数の実行結果の中から、最も多くのクラスタからの実行結果を前記アプリケーションプログラムの実行結果として採用する多数決手段とを具備する高信頼性クラスタシステムも提案されている（特許文献４参照）。

特開平８－３１４７４４号公報特開２００６－２０９５６５号公報特開２００６－２０９５２３号公報特開２００４－０４６３５６号公報

　これまで専用ハードウェアによって各計算機が接続されていた従来のフォールトトレラントシステムの構成では、各計算機において同一時刻に同一のプログラムを実行することは可能であった。一方、近年ではネットワークの高速化、及び計算機の汎用化に伴い、専用ハードウェアではなく、一般的なネットワークを利用して複数計算機を接続する技術が発達すると計算機をネットワークで接続し、専用ハードウェアではなくプログラムにて同期を取るバリア同期方式が考えられはじめた。しかしこれらは多くの場合マルチタスクを考慮せず、同期タスクがプロセッサのリソースを握った状態で同期をとる方式が殆どであった。同期タスクがプロセッサのリソースを握った状態では容易に同期タイミングの管理や同期タイムアウトをプロセッサのリソースを手放すことなく管理することができる。しかし、マルチタスクを実行する環境では、バリア同期とタスク制御を組み合わせて管理をする必要があるため、新たにタイムアウト管理機構が必要なった。

　また、一般的なネットワークを利用して複数計算機を接続する方式において、従来のマルチタスク動作可能なＯＳは、タスクスケジュールの中で他の計算機の挙動を意識するように作られてはいない。したがって、従来技術では、例えば、キャッシュに該当情報がヒットしたか否かにより、計算機によってシステムコール（例：ハードディスクドライブへのデータ読み取り指示等）が発行されたりされなかったり、メモリの回収作業の有無という違いが生じる状況を管理し、タイムアウトを調整することは行われていない。

　上記のような課題を鑑みて、マルチタスク環境を有する複数の計算機をネットワークで接続した計算機システムにおいて、計算機間でのタスク同期のタイムアウトを管理する技術を提供する。

　他の計算機と同じタスクを処理する計算機であって、当該計算機は、他の計算機と同期をとってタスクを処理する同期プロセッサと、他の計算機と同期をとらずにタスクを処理する非同期プロセッサと、同期プロセッサ及び非同期プロセッサにタスクを割り当てるディスパッチャと、同期プロセッサがあるタスクの切り替えポイントに達してから次のタスクの切り替えポイントに達するまでの経過時間を計測するタイムカウンタと、経過時間を前記他の計算機との間で交換する通信インタフェースと、他の計算機との間の同期処理のタイムアウトを判定する同期タイム処理部を有している。同期プロセッサにおいてタスクの切り替えポイントに達した場合に、同期タイム処理部は他の計算機の経過時間を確認し、あらかじめ定められた閾値以下の経過時間内に他の計算機の同期プロセッサがタスクの切り替えポイントに達した場合に、ディスパッチャに同期プロセッサに割り当てられているタスクをアンディスパッチさせる。

　マルチタスクを実行する複数の計算機をネットワークで接続した計算機システムにおいて、計算機間でのタスク同期のタイミングを管理することができる。

計算機システムの構成例を示す図である。タスク管理テーブルの構成例を示す図である。 Task Control Blockの構成例を示す図である。タスクプログラムの構成例を示す図である。同期タスク非同期タスク管理テーブルの構成例を示す図である。タイムアウト統計管理テーブルの構成例を示す図である。同期計算機管理テーブルの構成例を示す図である。タスク起動及び同期タイムアウト統計処理部が起動する際の処理の一例を説明する図である。同期タイム統計処理部が起動する際の処理の一例を説明する図である。タスクの切り替え処理およびタスク切り替え時の同期タイム統計処理の一例を説明する図である。計算機システムの他の構成例を示す図である。タスクプログラムの他の一例を示す図である。タイムアウト統計管理テーブルの他の一例を示す図である。同期計算機管理テーブルの他の一例を示す図である。ハッシュ生成及び登録時の処理の一例を示す図である。同期タイム統計処理の一例を示す図である。。初期タイムアウトと統計タイムアウトを選択する処理の一例を説明する図である。

　－－－システム構成－－－
　以下に実施形態について図面を用いて詳細に説明する。

　図１は、本実施形態の計算機システム１０の構成例を示す図である。

　計算機システム１０は、マルチプロセッサ環境を有する複数の計算機をネットワークで接続した計算機システムであって、計算機間で同じタスクプログラムを実行するとともにタスク同期を行い、フォールトトレラントシステムを構成するコンピュータシステムである。　
　計算機システム１０は、少なくとも２台の計算機１００と計算機２００がネットワーク５００および６００によって接続されて構成される。計算機１００と計算機２００はヘテロジニアスな構成でも良いが、以下では、同一の構成を例とし詳細な構造については計算機１００についてのみ説明する。

　計算機１００は、２つのプロセッサ１８０（１８０－１および１８０－２）、タイマー１１１、通信インターフェース１１２および１１３、記録媒体400、ならびにメモリ１１０を備え、これらはバス１９０にて接続されている。

　本実施形態では、プロセッサ１８０－１は、計算機２００との間でタスクを同期するタスク同期用として用い、プロセッサ１８０－２は、計算機２００とは独立して動作するタスク非同期用として用いるものとする。なお、タスク非同期用のプロセッサ１８０－２の用途が一般的である。

　メモリ１１０は、２つのタスクプログラム１２０（１２０Ａおよび１２０Ｂ）とオペレーティングシステム１４０Aを備えている。なお、タスクプログラム１２０には、オペレーティングシステムを実現するために必要なシステムプログラムと、それ以外のユーザプログラムとを含む。本実施形態では、システムプログラムは不図示とし、ユーザプログラムのみをタスクプログラム１２０として図示することとする。

　オペレーティングシステム１４０Ａは、複数のタスクを実行することのできるマルチタスク実行可能なオペレーティングシステムである。なお、オペレーティングシステム１４０Ａは、プロセッサ１８０がメモリ１１０に記憶されているシステムプログラムを実行することにより実現される。すなわち、オペレーティングシステム１４０Ａも、タスクが実行されることにより実現される。オペレーティングシステム１４０Ａは、タスクプログラム１２０の実行に係る処理をタスクに分解し、各タスクをプロセッサ１８０－１または１８０－２に割り当てるディスパッチャ１４２Ａ、計算機１００と計算機２００がタスク同期を行うために使用する、タスク制御用共有メモリ区画１３０A、タスクの切替ポイントに達した時の時刻を提供する時刻取得プログラム１４４A、タスクの切替ポイントに達した時刻から２つの切替ポイント間の処理にかかった時間を算出する同期タイム統計処理部１４５A、統計情報を記録しておくタイムアウト統計管理テーブル１５０A、プロセッサ１８０Ａ－１および１８０Ａ－２に割り当てたタスクに関する情報（「タスク制御ブロック；Task Control Block」という。以下、「ＴＣＢ」と表記する。）を記憶する２つのタスク管理テーブル１４３（１４３Ａ－１および１４３Ａ－２）、同期計算機管理テーブル１４１Ａを備える。

　タスク管理テーブル１４３A－１は、プロセッサ１８０－１に割り当てられたタスクのＴＣＢを記憶し、タスク管理テーブル１４３A－２は、プロセッサ１８０－２に割り当てられたタスクのＴＣＢを記憶する。

　タスクは、同期タスクと非同期タスクに分けて管理してありこれらの区分情報は、同/非同期タスク管理テーブル３１０Aに保存されており、システムの要件として与えられる初期のタイムアウトまた、タイムアウト統計管理テーブル情報がタイムアウトテーブル320Aに納められている。

　オペレーティングシステム１４０Ａは、計算機１００内のリソースを複数のタスクに割り当てるために、プリエンプションを行う技術を提供している。プリエンプションとは、実行中のタスクを一時的に打ち切り、他のタスクにリソースを使用させることである。　各タスクには優先度が設定可能となっており、オペレーティングシステム１４０Ａは、優先度に応じて、タスクの実行順序を決定する。実行優先度の高いタスクが存在する場合は、実行優先度が低いタスクはプリエンプションにより実行権限を一時的に打ち切られる。オペレーティングシステム１４０Ａは、タスクごとに定められる所定の時間タスクを実行した場合にも、そのタスクの実行を打ち切る。本実施例では、プロセッサ１８０－２にはプリエンプションが発生するが、プロセッサ１８０－１は同期をとるため、後述するタスク切り替え命令が実行された時のみプリエンプションが実施されるものとする。

　タスクプログラム１２０には、複数の命令が含まれる。

　図２は、タスク管理テーブル１４３の構成例を示す図である。計算機１００で実行されるタスクは、生成されてから消滅するまでの間、実行中の状態、実行可能であるがまだ実行されていない状態（実行可能状態）、条件成就や入力などを待機している状態（待機状態）の状態の間を遷移する。タスク管理テーブル１４３には、実行可能状態であるタスクに係るＴＣＢ１４３－４が格納される実行可能タスクキュー１４３－５、待機状態であるタスクに係るＴＣＢ１４３－４が格納される待機状態タスクキュー１４３－６、および実行中のタスクのＴＣＢ１４３－４を格納する実行中タスク１４３－７が含まれる。一般的には実行可能タスクキュー１４３－５は、優先度設定個数分だけ存在し、優先度の高い実行可能タスクキューから順次実行される。

　各ＴＣＢ１４３－４には、ポインタ１４３－４eが含まれる。実行可能タスクキュー１４３－５および待機状態タスクキュー１４３－６は、キューの先頭のＴＣＢ１４３－４を示すポインタを含み、実行可能タスクキュー１４３－５および待機状態タスクキュー１４３－６に格納されているＴＣＢ１４３－４のポインタ１４３－４eには、キューにおける次のＴＣＢ１４３－６を示すポインタが格納される。キューの最後尾のＴＣＢ１４６のポインタ１４３－４eにはｎｕｌｌが設定される。

　図３は、Task Control Block（TCB）１４３－４の構成例を示す図である。ＴＣＢ１４３－４には、タスクＩＤ１４３－４a、プログラムカウンタ１４３－４b、汎用レジスタ１４３－４c、制御レジスタ１４３－４d、ポインタ１４３－４e、割り込み可否１４３－４f、プリエンプトタイプ１４３－４g、同期タスクか非同期タスクか等の識別子１４３－４h、同期タスクの場合実行されるプロセッサを示す同期実行時プロセッサ識別子１４３－４i、非同期実行時プロセッサ識別子１４３－４j、到達したタスク切り替えポイントを格納する到達切り替えポイント１４３－４kが含まれる。

　タスクは、タスクＩＤ１４３－４aにより識別される。プログラムカウンタ１４３－４aは、プロセッサ１８０－１のプログラムカウンタに設定される値である。その他、
汎用レジスタ１４３－４c、制御レジスタ１４３－４d、割り込み可否１４３－４f、プリエンプトタイプ１４３－４gもプロセッサに設定される。ディスパッチャ１４２Ａは、プロセッサ１８０－１において実行中のタスクの実行を打ち切って他のタスクに切り替える場合に、プロセッサに設定されているこれらの値をTCB１４３－４の対応するレジスタ等に設定して、実行していたタスクが実行可能状態である場合には実行可能タスクキュー１４３－５にこのTCB１４３－４を追加し、実行していたタスクが待機状態である場合には、待機状態タスクキュー１４３－６にこのTCB１４３－４を追加する。そしてディスパッチャ１４２Aは、実行可能タスクキュー１４３－５から１つＴＣＢ１４３－４を読み出して、読み出したＴＣＢ１４３－４のプログラムカウンタ１４３－４a、他レジスタ情報をプロセッサ１８０－１に設定することにより、タスクの切り替えを行う。

　ディスパッチャ１４２Ａが、プロセッサ１８０のカウンタやレジスタの内容をＴＣＢ１４３－４に設定して実行中のタスクを打ち切ることを「アン・ディスパッチ」といい、ＴＣＢ１４６３－４に基づいてプロセッサ１８０に新たなタスクを実行させることを「ディスパッチ」ということとする。

　図１に戻って、タスク制御用共有メモリ区画１３０は、各計算機１００間で分散共有されるメモリである。タスク制御用共有メモリ区画１３０は、タスクの同期処理を行う頻度よりも高い頻度でＯＳ１４０により計算機１００と２００間で内容の同期が行われているものとする。後述するように、タスク制御用共有メモリ区画１３０には、実行可能タスクキュー１４３－５に格納されているＴＣＢ１４３－４がコピーされる。これによりディスパッチャ１４２は、計算機１００および２００における実行可能タスクキュー１４３－５に格納されているＴＣＢ１４３－４を交換することが可能になっている。

　同期計算機管理テーブル１４１Aは、同期をとろうとする計算機１００および２００を示す識別情報に対応付けて、当該計算機の同期がとれているか否かを示すフラグやステータス情報を管理する。　
　記録媒体４００には同期非同期タスク管理テーブル（同／非同期タスク管理テーブルとも呼ぶ）３１０Aとタイムアウトテーブル３２０Aが格納されている。タイムアウトテーブル３２０Aに格納されている情報は同期タイム統計処理部によって読み出されて、タイムアウト統計管理テーブル１５０Aに格納される。
なお、以下で説明する計算機制御方法の各種動作は、計算機システム１０を構成する各装置（計算機）のプロセッサがＲＡＭ（メモリ）に読み出して実行するプログラムによって実現される。そして、このプログラムは、後述する各種の動作を行うためのコードから構成されている。

　図４には、タスクプログラム１２０Ａの構成例が図示されている。タスクプログラム１２０Ａは、タスク処理命令列１２２、１２３、１２４、１２６など複数の処理命令を含む。これらタスク処理命令はユーザプログラムの処理命令やシステムコールが含まれ、あるタスク処理命令からさらに分岐して別のタスク処理命令が実行され再び呼び出し元のタスク処理命令に復帰して呼び出し元のタスク処理命令が実行されることもある。タスクプログラム１２０Aはさらに、タスク切り替え命令１２１、１２５を含み、このタスク切り替え命令をプロセッサ１８０が処理した時に、ディスパッチャ１４２Aによりアン・ディスパッチ、及びディスパッチによるタスク同期が行われる。システムコールとは、タスクからオペレーティングシステム１４０Ａに対する命令である。システムコールとしては、例えば、ディスクへのアクセス命令や、タイマー１１１からの時刻の取得命令などがある。オペレーティングシステム１４０Ａは、タスクから呼び出されるシステムコールに応じて、例えば、ディスクへのアクセスや、タイマー１１１からの時刻の取得を行うなどの各種の処理を行う。

　図５には、同期非同期タスク管理テーブル３１０の構成例が図示されている。同期タスク非同期タスク管理テーブル３１０には、タスク名３１０－１、タスクID３１０－２、タスクの種類３１０－３、同期用プロセッサ３１０－４、非同期用プロセッサ３１０－５の情報が格納されている。

　タスク名３１０－１はタスクが構成するプログラムの名称であり、タスクID３１０－２はタスクの識別情報である。タスクの種類３１０－３には、タスクが同期実行されるのか非同期実行されるのか、または同期でも非同期でも実行されるタスクであるのかを示す情報が格納されている。同期プロセッサ３１０－４はタスクが同期実行される際に用いられるプロセッサの識別情報であり、非同期プロセッサ３１０－５はタスクが非同期実行される際に用いられるプロセッサの識別情報である。タスクの種類３１０－３と同期プロセッサ３１０－４または、非同期用プロセッサ３１０－５の情報を用いて、タスクが実際に実行されるプロセッサ１８０が定まる。

　図６には、タイムアウト統計管理テーブルの構成例が図示されている。同期タイムアウト管理テーブル１５０は、タスクプログラム１５０－１、タスクのID１５０－２、切り替えポイント１５０－３、タイムアウト選択フラグ１５０－４、統計タイムアウト１５０－５、初期タイムアウト１５０－６を持ち、各タスクプログラムごとに１５０－aないし１５０－dのように一連の情報を保持している。

　タスクプログラム１５０－１は、タスクプログラムの識別情報であり、タスクのID１５０－２は当該タスクプログラムを構成するタスクの識別情報である。切り替えポイントはタスク切り替え命令が実行されてタスクがディスパッチャ１４２によってアン・ディスパッチされるポイントを示している。統計タイムアウト１５０－５はタイムアウトを決定する際に用いられる閾値である。統計タイムアウト１５０－５の設定方法は後述する。初期タイムアウト１５０－６は当該閾値の初期値である。なお、統計タイムアウト１５０－５には初期タイムアウト１５０－６以下の大きさの値が設定される。また、タイムアウトを判断する際に統計タイムアウト１５０－５を使用するか初期タイムアウト１５０－６を使用するかは、タイムアウト選択フラグ１５０－４に示される。

　図７には、同期計算機管理テーブルの構成例が図示されている。同期計算機管理テーブル１４１Aは、同期計算機１４１A－１、同期状態１４１－２、タイムスタンプカウンタ１４１A－３、タスクID１４１A－４、現在到達した切り替えポイント１４１A－５の情報を保持する。

　同期計算機１４１A－１には同期対象である計算機１００および２００の同期プロセッサ１８０－１またはプロセッサ２８０－１の識別子が格納されている。同期状態１４１－２には同期状態が、タイムスタンプカウンタ１４１A－３には直前の切り替えポイントに達した以降の経過時間が納められており、この値は同期タイム統計処理部１５０Aが統計処理を行う時に使用し統計処理結果は統計タイムアウト１５０－５に格納される。現在到達した切り替えポイント１４１－５は、タスク切り替え命令１２５が実行されたポイントを示しており、タスク切り替え命令の実行によってディスパッチャ１４２Aによるタスクのアン・ディスパッチが可能な状態になったことを示している。現在到達した切り替えポイント１４１A-５が示す値が同期計算機間で一致するまでにかかる時間が、統計タイムアウト１５０－５または、初期タイムアウト１５０－６を越えた時、タイムアウトと認定される。

　なお、同期計算機管理テーブル１４１の内容は、望ましくは更新されるたびに、計算機システム１０を構成する複数の計算機間で通信インタフェースを介して交換されるので、複数の計算機は互いにタイムスタンプカウンタ１４１－３や現在到達した切り替えポイント１４１－５の情報を共有することができる。

　図8は、タスク及び、同期タイム統計処理部の起動処理の一例を示している。図８を用いて、同期タスク、非同期タスク、およびメモリ回収タスクのように必要に応じて同期タスクとしても非同期タスクとしても起動されるタスクの起動プロセスを説明する。

　タスクを実行する前にディスパッチャ１４２Aは、同期タイム統計処理部を起動する（Ｓ１０１）。

　ディスパッチャ１４２Ａは記録媒体４００内の同／非同期タスク管理テーブル３１０Ａを読み出し、起動を指定されたタスク名の行を選出する（Ｓ１０２）。選出したタスク名の行からタスクの種類３１０－３を参照し、起動を指定されたタスクの種類が同期か、非同期か、または同期,非同期両方かを判定する（Ｓ１０３）。

　一般的には実行可能タスクキュー１４３－５は、優先度設定個数分だけ存在し、優先度の高い実行可能タスクキューから順次実行される。同期タスクと判断された場合、同期非同期タスク管理テーブル３１０の同期プロセッサ３１０－４に示されるプロセッサでメモリ確保など当該タスクの起動処理を実行する（Ｓ１０６）。更にディスパッチャ１４２Aは、該当タスク用のＴＣＢを生成し、ＴＣＢ内のタスクの種類１４３－４hに対し、同期タスク非同期タスク管理テーブルのタスクの種類３１０－３の情報を書き込み、ＴＣＢ内の同期実行時プロセッサ識別子１４３－４iに同期タスク非同期タスク管理定義テーブルの同期プロセッサ３１０－４を書き込み、ＴＢＣ内の非同期実行時プロセッサ識別子１４３－４jに同期タスク非同期タスク管理テーブルの非同期プロセッサ３１０－５の情報を書き込む（Ｓ１０７）。ディスパッチャ１４２Aは当該タスクのＴＣＢ１４３－４を同期実行時プロセッサ識別子１４３－４iにて示されるプロセッサのタスク管理テーブル１４３Ａ－１の１４３－５へ登録する（Ｓ１０８）。

　S103で起動されるタスクが非同期タスクであると判断された場合、同期非同期タスク管理テーブル３１０の非同期プロセッサ３１０－５に示されるプロセッサでメモリ確保など当該タスクの起動処理を実行する（Ｓ１０９）。さらにディスパッチャ１４２Aは、該当タスク用のＴＣＢを生成し、ＴＣＢ内のタスクの種類１４３－４hに同期タスク非同期タスク管理テーブルのタスクの種類３１０－３の情報を書き込み、ＴＣＢ内の同期実行時プロセッサ識別子１４３－４iに同期タスク非同期タスク管理テーブルの同期プロセッサ３１０－４の情報を書き込み、ＴＢＣ内の非同期実行時プロセッサ識別子１４３－４jに同期タスク非同期タスク管理テーブルの非同期プロセッサ３１０－５の情報を書き込む（Ｓ１１０）。ディスパッチャ１４２Aは当該タスクのＴＣＢ１４３－４を非同期実行時プロセッサ識別子１４３－４jにて示されるプロセッサのタスク管理テーブル１４３Ａ－２の１４３－５へ登録する（Ｓ１１１）。

　メモリ回収タスクプログラムのように、同期タスクや非同期タスクの処理の中で起動されるタスクにおける起動の場合、S１０３で当該タスクは同期、非同期タスクと判断される。その後、ディスパッチャ１４２Aは、該当タスクの起動を指示した親タスクの実行プロセッサの識別子が、同期非同期タスク管理テーブルの同期プロセッサ３１０－４に含まれるか確認する。含まれる場合は同期タスクとしてのタスクを起動するためにS１０６以降の処理を実行する。S104でステップを踏む。同期プロセッサ３１０－４に該当しないと判断した場合は、該当タスクの起動を指示した親タスクの実行プロセッサの識別子が同期非同期タスク管理テーブル３１０の非同期プロセッサ３１０－５に含まれるか確認する。含まれる場合は非同期タスクとしてのタスクを起動するために、S109以降の処理を実行する。当該親タスクの実行プロセッサが同期プロセッサにも非同期プロセッサにも該当しない場合には（S105 でNoの場合）、想定外の起動指示としてタスクの起動中止し起動を終了する。

　図９は、タスク起動時に行われる同期タイム統計処理部の起動処理を示している。これは図８のS101の詳細処理に相当する。同期タイム統計処理部１４５Aは、記録媒体４００の中のタイムアウトテーブル３２０Aの情報を読み込む（Ｓ２０１）。そして、同期タイム統計処理部１４５Aは、タイムアウトテーブル３２０Aより読み込んだ情報をメモリ１１０内のタイムアウト統計管理テーブル１５０Aに設定する。

　図１０はタスク切り替え処理とタスク切り替え時の統計処理をの一例を示している。

　まず、タスクプログラム１２０Bの処理において、タスク切り替え命令１２５がオペレーティングシステム１４０A内で実行される場合について説明する。オペレーティングシステム１４０Aは、同期計算機管理テーブル１４１Aのタスク１２０Bの実行プロセッサ１８０－１についての行の、現在到達した切り替えポイント１４１A－５を更新して、タスク切り替え命令１２５に対応する切り替えポイントの値を記録する（S３０１）。そしてオペレーティングシステム１４０Aは、ディスパッチャ１４２Aへタスク１２０Bのタスク切り替え処理の指示を行う（S３０２）。

　ディスパッチャ１４２Aは、同期タイム統計処理部を呼び出す（S３１１）。

　同期タイム統計処理部１４５Aは、同期計算機管理テーブル１４１Aにタスク１２０Bの実行プロセッサ１８０－１の同期相手として登録されているプロセッサ２８０－１について、プロセッサ２８０－１の現在到達した切り替えポイント１４１A-5の値が、S301でプロセッサ１８０－１について設定した現在到達した切り替えポイント１４１A－５の値と等しくなるまで、タイムスタンプカウンタ１４１A-3のチェックを続ける（S321）。ここでは、プロセッサ１８０－１が先に切り替えポイントに到達し、プロセッサ２８０－１が同一切り替えポイントに到達するのを待つ場合を例に説明している。

　次に同期タイム統計処理は、タイムアウトを判断するための閾値をタイムアウト統計管理テーブル１５０を参照して選択する（S３２２）。具体的には、タイムアウト統計管理テーブル１５０の切替ポイント１５０－３の値が、S321で現在到達した切り替えポイント１４１A-5として登録された切り替えポイントの値と等しい（図６の例では０ｘCCC・・・）行（図６の例では行150-d）について、タイムアウト選択フラグ１５０－４を確認する。タイムアウト選択フラグ１５０－４が「統計」であれば、同じ行の統計タイムアウト１５０－５に設定されている値を閾値とし、タイムアウト選択フラグ１５０－４が「初期」であれば同じ行の初期タイムアウト１５０－６に設定されている値を閾値とする。

　その後、同期タイム統計処理１４５は、タイムスタンプカウンタ１４１A－３の値とS３２２で選択した閾値とを比較して、タイムスタンプカウンタ１４１A-3の値が閾値を越えていないかを確認する（S323）。

　閾値を越えている場合（S323：No）には、タイムアウトとして処理を修了する。

　閾値を超えていない場合（Ｓ３２３：ＹＥＳ）、プロセッサ２８０－１と１８０－１における現在到達した切り替えポイントが同一になっているかを確認する（S３２４）。

　同一でない場合（S324：No）にはS323に戻る。

　同一であった場合（Ｓ３２４：ＹＥＳ）、プロセッサ２８０－１のタイムスタンプカウンタとプロセッサ１８０－１のタイムスタンプカウンタ、タイムアウト統計管理テーブル１５０に既に設定されている統計タイムアウト１５０－５を元に、新しい統計タイムアウトを算出し、統計タイムアウト１５０－５に再設定する。統計タイムアウトの算出方法の例としては、プロセッサ２８０－１もしくは、プロセッサ１８０－１のうち遅く切り替えポイントに達した方の処理時間を新たな統計タイムアウト値とする方法が考えられる。（S325）。

　S325の後同期タイム統計処理１４５Aは処理を呼び出し元のアン・ディスパッチ処理１４２Aに戻す。処理を戻されたディスパッチャ１４２Ａは、同期ＣＰＵ１８０－１上の実行中タスク１２０Ｂの情報を回収する（Ｓ３１２）。具体的にはタスク１２０BのTCBをタスク管理テーブル１４３の実行中タスク１４３－７から外す。

　続いてディスパッチャ１４２Aは、タスク管理テーブル内の実行可能タスク管理キュー１４３－５の最後尾にタスク１２０ＢのTCBへのリンクを登録する（Ｓ３１３）。

　以上の実施形態によれば、あるタスク切り替えポイントから次ぎのタスク切り替えポイントまでの経過時間を複数の計算機間で共有することができ、経過時間と閾値を比較することで複数計算機間でのタスク同期のタイムアウトを検出することができる。タイムアウトとなった処理には、同期はずれを生じさせる何らかの障害が発生している可能性があるため、障害検知の契機となる。

　さらに、タイムアウトの判定に用いる閾値を、過去の経過時間の実測値を用いて更新することができるので、タスクの特性に合わせた閾値を用いてタスク同期のタイムアウトを検出することができる。閾値は初期値より短い値に更新されるので、実測値に基づいて障害検知を迅速に行えるようなシステム設定が可能となる。

　図１１は、計算機システムの他の構成例を示す図である。図１に示す計算機システムとの違いは、オペレーションシステム１４０が、ハッシュ計算処理部１４６を有すること、およびタイムアウト統計管理テーブル１５０と同期計算管理テーブル１４１がハッシュ値を有する点である。ハッシュ計算処理部１４６は、２つのタスク切り替え命令の間に実行されたタスク処理命令の内容が同一であるか否かを判断するために用いられる。

　図１２は、タスクプログラム１２０Ｂの一例を示している。計算機２００、１００間で差がでる処理、例えばメモリ回収命令が実行される箇所にハッシュ生成命令１２７が埋め込まれている。

　図１３は、タイムアウト統計管理テーブル１５０Cの一例を示している。同一の切り替えポイントにいたるまでに実行されるタスク処理命令の違いをハッシュ値で区別するため、タイムアウト統計管理テーブル１５０Cはハッシュ値１５０－７を有している。同一のタスク切り替え命令にいたるまでの処理であっても、計算機によっては処理フローの条件分岐により、かかる時間が異なる。実行されたコードの違いにより生ずる処理時間の違いを考慮するため、実行プログラムに差異があるか否かをタスクプログラム１２０に埋め込まれたハッシュ生成命令１２７が生成するハッシュ値により区別すると共に、同じ切り替えポイント１５０－３に対する統計タイムアウトや初期タイムアウトであってもハッシュ値の違いによって異なる値を設定しておく。

　図１４は、動機計算機管理テーブル１４１Cの一例を示している。図７に示した同期計算機管理テーブル１４１Aにさらに、ハッシュ値１４１A－6を含む。これによって、同期計算機管理テーブル内でプログラムのパスの差異や進行状況をハッシュ値１４１Ａ－6から判断できることを意味する。

　図１５は、ハッシュ生成及び登録処理の一例を示す。
タスクプログラム１２０Bの処理において、ハッシュ生成命令１２７がオペレーティングシステム１４０Aで実行される際の処理を図１５を用いて説明する。

　オペレーティングシステム１４０Aは、ハッシュ生成命令が固有に持つ値を引数としてハッシュ計算処理部を起動する（Ｓ４０１）。

　ハッシュ計算処理部１４６Ａは、ハッシュ生成命令１２７に含まれる固有値を使用してマスクとハッシュ生成を行う（Ｓ４１２）。

　その後ハッシュ計算処理部１４６Ａは、同期計算機管理テーブル１４１Ｃ内のハッシュ値１４１Ａ－6に計算したハッシュ値を登録する（Ｓ４１３）。

　図１６は同期タイム統計処理の一例を示す図である。この処理は実施例1の図１０に示した同期タイム統計処理の代わりに用いられるものであり、図１０のS311でディスパッチャによって呼び出され、処理の修了後には呼び出し元であるディスパッチャに処理を返してS312以降の処理が実行される。

　次に同期タイム統計処理部１４５Aは、タイムアウトを判断するための閾値をタイムアウト統計管理テーブル１５０Cを参照して選択する（S４２２）。具体的には、タイムアウト統計管理テーブル１５０の、切り替えポイント１５０－３の値がS321で現在到達した切り替えポイント141A-５として登録された切り替えポイントと同じであって（図１３の例では０ｘCCC・・・）、かつハッシュ値１５０－７が同期計算機管理テーブル１４１Cの同期相手のプロセッサ１８０－１についてのハッシュ値１４１A-4と同じである（図１３では０ｘＦＡ１６３３１２・・・）行（図１３の例では行150-i）について、タイムアウト選択フラグ１５０－４を参照する、そしてタイムアウト選択フラグ１５０－４が初期であれば初期タイムアウト１５０－６の値を閾値とし、タイムアウト選択フラグ１５０－４が統計であれば統計タイムアウト１５０－５の値を閾値とする。

　その後、同期タイム統計処理部１４５Aは、タイムスタンプカウンタ１４１A－３の値とS４２２で選択した閾値とを比較して、タイムスタンプカウンタ１４１A-3の値が閾値を越えていないかを確認する（S323）。

　同一でない場合（S324：No）にはS323に戻る。

　同一であった場合（S324：Yes）同期タイム統計処理部１４５Aは、プロセッサ２８０－１のタイムスタンプカウンタとプロセッサ１８０－１のタイムスタンプカウンタ、タイムアウト統計管理テーブル１５０に既に設定されている統計タイムアウト１５０－５を元に、新しい統計タイムアウトを算出し、統計タイムアウト１５０－５に再設定する（S426）。尚、ここで更新される統計タイムアウト１５０－５の値は、タイムアウト統計管理テーブルのS422で確認した行に登録されている統計タイムアウト１５０－５の値である。

　図１７は、初期タイムアウトと統計タイムアウトのどちらを使用するか設定する処理を示している。同期タイム統計処理部は、変更すべきタイムアウト選択フラグ１５０－４の位置と変更後の値を引数として受け取る（Ｓ６０１）。その後変更すべきタイムアウト選択フラグ１５０－４の位置と変更後の値を変更する（Ｓ６０２）。尚、図１７は実施例２だけでなく、実施例１にも用いることが可能である。　この実施形態によれば、計算機間で実行されるタスク処理命令が異なる場合にも、その差異を考慮してタイムアウトの閾値を設定することができるので、タスク処理命令のちがいを考慮したタイムアウト管理が可能となる。

１０　：計算機システム
１００：　計算機
２００：　計算機
１１０：メモリ
２１０：　メモリ
１２０：タスクプログラム
１４０：オペレーティングシステム
１４１：　同期計算機管理テーブル
１４２：ディスパッチャ
１４３：　タスク管理テーブル
１４３：　タスクコントロールブロック（ＴＣＢ）
１４４：　時刻取得プログラム
１４５：　同期タイム統計処理部
１４６：　ハッシュ計算処理部
１５０：タイムアウト統計管理テーブル
１８０：　プロセッサ
３１０：　同／非同期タスク管理テーブル
３２０：　タイムアウトテーブル

Claims

　他の計算機と同じタスクを処理する計算機であって、
　前記他の計算機と同期をとってタスクを処理する同期プロセッサと、
　前記他の計算機と同期をとらずにタスクを処理する非同期プロセッサと、
　前記同期プロセッサ及び前記非同期プロセッサにタスクを割り当てるディスパッチャと、
　前記同期プロセッサがあるタスクの切り替えポイントに達してから次のタスクの切り替えポイントに達するまでの経過時間を計測するタイムカウンタと、
　前記経過時間を前記他の計算機との間で交換する通信インタフェースと、
　前記他の計算機との間の同期処理のタイムアウトを判定する同期タイム処理部を有しており、
　前記同期プロセッサにおいてタスクの切り替えポイントに達した場合に、前記同期タイム処理部は前記他の計算機の前記経過時間を確認し、あらかじめ定められた閾値以下の経過時間内に前記他の計算機の同期プロセッサが前記タスクの切り替えポイントに達した場合に、前記ディスパッチャに前記同期プロセッサに割り当てられているタスクをアンディスパッチさせることを特徴とする計算機。
　請求項１記載の計算機であって、
　前記閾値以下の経過時間内に前記他の計算機の同期プロセッサが前記タスクの切り替えポイントに達しなかった場合には、前記同期タイム処理部はタイムアウトとして処理を終了することを特徴とする計算機。
　請求項２記載の計算機であって、
　前記同期タイム処理部は、前記経過時間の統計値を計算し、当該統計値をもちいて前記閾値を更新することを特徴とする計算機。
　請求項３記載の計算機であって、前記同期タイム処理部は、前記閾値の初期値より前記統計値の方が短い場合に、当該統計値で当該閾値を更新することを特徴とする計算機。
　請求項３記載の計算機であって、前記閾値はタスク毎に設定されていることを特徴とする計算機。
　請求項３記載の計算機であって、
　タスクの所定のポイント毎に異なるハッシュ値を生成させるためのハッシュ生成命令が含まれており、
　前記計算機は、前記同期プロセッサが当該所定のポイントに達すると前記ハッシュ生成命令を実行してハッシュ値を生成させて記憶するハッシュ生成処理部を有しており、
　前記閾値は、タスクとハッシュ値の組み合わせ毎に設定されていることを特徴とする計算機。
　他の計算機と同じタスクを処理する計算機によって実行される方法であって、
　前記計算機は、
　前記他の計算機と同期をとってタスクを処理する同期プロセッサと、
　前記他の計算機と同期をとらずにタスクを処理する非同期プロセッサと、
　前記同期プロセッサ及び前記非同期プロセッサにタスクを割り当てるディスパッチャと、
　前記同期プロセッサがあるタスクの切り替えポイントに達してから次のタスクの切り替えポイントに達するまでの経過時間を計測するタイムカウンタと、
　前記経過時間を前記他の計算機との間で交換する通信インタフェースと、
　前記他の計算機との間の同期処理のタイムアウトを判定する同期タイム処理部を有しており、
　前記同期プロセッサにおいてタスクの切り替えポイントに達した場合に、前記同期タイム処理部は前記他の計算機の前記経過時間を確認し、あらかじめ定められた閾値以下の経過時間内に前記他の計算機の同期プロセッサが前記タスクの切り替えポイントに達した場合に、前記ディスパッチャに前記同期プロセッサに割り当てられているタスクをアンディスパッチさせることを特徴とする方法。
　請求項７記載の方法であって、
　前記閾値以下の経過時間内に前記他の計算機の同期プロセッサが前記タスクの切り替えポイントに達しなかった場合には、前記同期タイム処理部はタイムアウトとして処理を終了することを特徴とする方法。
　請求項８記載の方法であって、
　前記同期タイム処理部は、前記経過時間の統計値を計算し、当該統計値をもちいて前記閾値を更新することを特徴とする方法。
　請求項９記載の方法であって、
　前記同期タイム処理部は、前記閾値の初期値より前記統計値の方が短い場合に、当該統計値で当該閾値を更新することを特徴とする方法。
　請求項９記載の方法であって、
　前記閾値はタスク毎に設定されていることを特徴とする方法。
　請求項９記載の方法であって、
　タスクの所定のポイント毎に異なるハッシュ値を生成させるためのハッシュ生成命令が含まれており、
　前記計算機は、前記同期プロセッサが当該所定のポイントに達すると前記ハッシュ生成命令を実行してハッシュ値を生成させて記憶するハッシュ生成処理部を有しており、
　前記閾値は、タスクとハッシュ値の組み合わせ毎に設定されていることを特徴とする方法。