JP5464449B2 - 障害によるリブートを考慮した処理部間の不整合検出方法並びに共有装置及びクラスタシステム - Google Patents

障害によるリブートを考慮した処理部間の不整合検出方法並びに共有装置及びクラスタシステム Download PDF

Info

Publication number
JP5464449B2
JP5464449B2 JP2011084550A JP2011084550A JP5464449B2 JP 5464449 B2 JP5464449 B2 JP 5464449B2 JP 2011084550 A JP2011084550 A JP 2011084550A JP 2011084550 A JP2011084550 A JP 2011084550A JP 5464449 B2 JP5464449 B2 JP 5464449B2
Authority
JP
Japan
Prior art keywords
processing unit
host
reply
request
shared device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011084550A
Other languages
English (en)
Other versions
JP2012221101A (ja
Inventor
栄寿 喜多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011084550A priority Critical patent/JP5464449B2/ja
Publication of JP2012221101A publication Critical patent/JP2012221101A/ja
Application granted granted Critical
Publication of JP5464449B2 publication Critical patent/JP5464449B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、複数の処理部を含む装置における処理部間の不整合検出に関する。
メインフレーム等の大型コンピュータシステムにおいて、スケーラビリティや可用性の向上のために複数のホストを互いに結合したクラスタシステムが用いられている。
クラスタシステムではホスト同士がデータをやり取りしながら処理を行うが、このためのホスト間通信を複数のホストとインタフェースを持つ共有装置を介してホスト同士がメッセージ通信を行うことによって実現する方法がある。
この際に使用される共有装置は内部に複数の処理部と、処理部が共有する記憶部を備えている。そして、ここでのメッセージ通信機能とは、ホストからメッセージ送信要求を受け取った処理部が他方の処理部にリクエストを出し、リクエストを受け取った処理部がホストにメッセージを送信。送信に成功すると、元の処理部にリプライを返し、リプライを受け取った処理部が要求元のホストにリプライを返すというものである。
ここで、ホストから要求を受け取った処理部が他方の処理部にリクエストを出した直後に障害でリブートし、リブート後にホストから異なる送信要求を受け取った場合について考える。この場合、他方の処理部に本要求に対するリクエストを出した後に、すれ違いで、他方の処理部から前のリクエストに対するリプライが返されると、本リプライを後のリクエストに対するリプライと誤認するという問題があった。
このような問題を解消する方法として、例えば特許文献1に記載の技術を用いることが考えられる。特許文献1に記載に記載の技術では、処理要求毎に電文識別子を加え、この電文識別子を参照することにより、各処理を識別することが可能である。
特開2003−085060号公報
上述したように、特許文献1に記載の技術等を用いることにより各処理を識別することが可能となる。
しかしながら、特許文献1に記載の技術等では、各処理毎に電文識別子を変化させる必要があり、電文識別子の付与及び確認に伴う処理が煩雑になるという問題があった。
また、特許文献1に記載の技術等は、ホストたる各サーバが電文識別子を管理する必要があるという問題があった。加えて、特許文献1に記載の技術等は、共有装置の処理部のリブートを考慮したものではなく、リブートが生じたタイミングによっては処理部間ですれ違いによる不整合が発生してしまうという課題を直接解決するものではなかった。
そこで、本実施形態では、ホストにおいて電文識別子を管理させることなく、且つ、各処理毎に電文識別子を変化させる必要がない方法で、リブートに伴う処理部間での不整合を検出することが可能な、障害によるリブートを考慮した処理部間の不整合検出方法並びに共有装置及びクラスタシステムを提供することを目的とする。
本発明の第1の観点によれば、第1のホストに接続される第1の処理部と、第2のホストに接続される第2の処理部と、前記第1の処理部及び第2の処理部が利用する記憶部と、を有する共有装置において、前記第1の処理部が前記第1のホストからの第1のメッセージの送信要求を受け取ると、前記第2の処理部に対してリクエストを送信すると共に前記記憶部に自身のブート及びリブートの回数を記録し、当該リクエストを受信した前記第2の処理部が前記記録されたブート及びリブートの回数を読み込んで自身が記憶すると共に前記メッセージを前記第2のホストに送信し、前記第2の処理部がリプライを前記第1の処理部に送信すると共に前記自身が記憶したブート及びリブートの回数を前記記憶部に記録し、前記リプライを受け取った前記第1の処理部は当該リプライが前記第1のメッセージの送信要求に応じたリプライであるか否かを判断し、前記判断は、前記第1の処理部が、自身が前記記憶部に記録したブート及びリブートの回数と前記第2の処理部が前記記憶部に記録したブート及びリブートの回数を照らし合わせることにより行われることを特徴とする共有装置が提供される。
また、本発明の第2の観点によれば、第1のホストに接続される第1の処理部と、第2のホストに接続される第2の処理部と、前記第1の処理部及び第2の処理部が利用する記憶部と、を有する共有装置並びに当該共有装置に接続された前記第1のホスト及び前記第2のホストを含んだクラスタシステムにおいて、前記第1のホスト及び前記第2のホストは前記共有装置を介して通信を行い、前記共有装置は前記第1の観点により提供される共有装置であることを特徴とするクラスタシステムが提供される。
本発明の第の観点によれば、第1のホストに接続される第1の処理部と、第2のホストに接続される第2の処理部と、前記第1の処理部及び第2の処理部が利用する記憶部と、を有する共有装置が行う不整合検出方法において、前記第1の処理部が前記第1のホストからの第1のメッセージの送信要求を受け取ると、前記第2の処理部に対してリクエストを送信すると共に前記記憶部に自身のブート及びリブートの回数を記録し、当該リクエストを受信した前記第2の処理部が前記記録されたブート及びリブートの回数を読み込んで自身が記憶すると共に前記メッセージを前記第2のホストに送信し、前記第2の処理部がリプライを前記第1の処理部に送信すると共に前記自身が記憶したブート及びリブートの回数を前記記憶部に記録し、前記リプライを受け取った前記第1の処理部は当該リプライが前記第1のメッセージの送信要求に応じたリプライであるか否かを判断し、前記判断は、前記第1の処理部が、自身が前記記憶部に記録したブート及びリブートの回数と前記第2の処理部が前記記憶部に記録したブート及びリブートの回数を照らし合わせることにより行われることを特徴とする不整合検出方法が提供される。
また、本発明の第4の観点によれば、第1のホストに接続される第1の処理部と、第2のホストに接続される第2の処理部と、前記第1の処理部及び第2の処理部が利用する記憶部と、を有する共有装置並びに当該共有装置に接続された前記第1のホスト及び前記第2のホストを含んだクラスタシステムが行う不整合検出において、前記第1のホスト及び前記第2のホストは前記共有装置を介して通信を行い、前記共有装置は上記第3の観点により提供される不整合検出方法を行うことを特徴とする不整合検出方法が提供される。
本発明によれば、共有装置内のブートカウンタエリアの値を要因とすることによりリブートが発生してもリクエストとリプライの対応づけをすることが出来ることから、ホストにおいて電文識別子を管理させることなく、且つ、各処理毎に電文識別子を変化させる必要がない方法で、リブートに伴う処理部間での不整合を検出することが可能となる。
本発明の実施形態の基本的構成を表す図である。 本発明の実施形態におけるブート回数登録部の基本的動作を表すフローチャートである。 本発明の実施形態におけるホスト要求処理部の基本的動作を表すフローチャートである。 本発明の実施形態における他処理部要求部の基本的動作を表すフローチャートである。 本発明の実施形態における他処理部リプライ処理部の基本的動作を表すフローチャートである。
次に、本発明の実施形態について図面を用いて詳細に説明する。
図1を参照すると、本実施形態は、共有装置1000と第1のホスト2000と第2のホスト3000とを有している。
そして、本実施形態においては、第1のホスト2000と第2のホスト3000が、共有装置1000を介して相互にデータをやり取りしながら処理を行う。なお、やり取りされるデータはどのような規格やプロトコルに準拠したものであってもよい。本実施形態は、任意の通信方式に準拠して実装することが可能である。
共有装置1000は、記憶部110と第1の処理部120と第2の処理部130とを有している。
また、第1の処理部120は、第1のホスト2000とは直接接続されているが第2のホスト3000とは直接接続されていない。同様に、第2の処理部130は、第2のホスト3000とは直接接続されているが第1のホスト2000とは直接接続されていない。なお、各ホストとの接続は任意の方式により行うことが可能であり、接続方式に特に制限は無い。
記憶部110は、記憶装置であり、その用途に応じて複数の領域を有している。具体的には、記憶部110は、ブートカウンタ領域、リクエスト領域、リプライ領域及び通信データ領域を有している。そして、これらの各領域は処理部毎に1つずつ用意されている。そのため、本実施形態では、第1の処理部120用の領域として、第1のブートカウンタ領域111、第1のリクエスト領域113、第1のリプライ領域115及び第1の通信データ領域117を有している。加えて、第2の処理部130用の領域として、第2のブートカウンタ領域112、第2のリクエスト領域114、第2のリプライ領域116、及び第2の通信データ領域118を有している。
これらの各領域の具体的用途に関しては後述する。
第1の処理部120及び第2の処理部130は、ローカルメモリ(以下の説明及び図中においては、適宜「LM」と呼ぶ。)121及び131を有している。
また、第1の処理部120及び第2の処理部130は、それぞれ、ブート回数登録部122及び132と、ホスト要求処理部123及び133と、他処理部要求処理部124及び134と、他処理部リプライ処理部125及び135を有する。
ブート回数登録部122及び132は、第1の処理部120及び第2の処理部130のブート時と、リブート時に記憶部110のブートカウンタ領域にインクリメントしたブート回数を登録する機能を有する。
ホスト要求処理部123及び133は、自身が接続されているホストから送信要求を受け取った際に、他の処理部に要求を出す機能を有する。
他処理部要求処理部124及び134は、他処理部のホスト要求処理部から要求を受け取った際に、自身が接続されているホストにメッセージを送信し、送信成功後に要求元のホスト要求処理部に応答(以下、適宜「リプライ」と呼ぶ)を返す機能を有する。
他処理部リプライ処理部125及び135は、他処理部の他処理部要求処理部からリプライを受け取った際に自身が接続されているホストにリプライを返す機能を有する。
次に、図2乃至図5のフローチャートを参照して本実施形態の有する各部の動作について詳細に説明する。
図2は、ブート回数登録部122及び132の動作を表すフローチャートである。ブート回数登録部122及び132は自身が含まれている処理部がブートする際及びリブートする際に動作を行う。
図2を参照すると、ブート時及びリブート時に、ブート回数登録部122及び132は、記憶部110内の自処理部に割り当てられているブートカウンタ領域の値を読み出す(ステップA1)。
次に、読み出した値とブートカウンタが取り得る最大値を比較する(ステップA2)。ステップA2における比較の結果、両値が等しければ(ステップA2においてYes)ブートカウンタ領域に1を登録する(ステップA3)。すなわち、処理後のブートカウンタ値は「1」となる。
一方、ステップA2における比較の結果、両値が等しくなければ(ステップA2においてNo)、現在のブートカウンタ領域の値に1を加算する(ステップA4)。すなわち、処理後のブートカウンタ値は「現在のブートカウンタ値+1」となる。
以上で、ブート回数登録部122及び132の動作は終了する。
図3は、ホスト要求処理部123及び133の動作を表すフローチャートである。
図3を参照すると、ホスト要求処理部123及び133は、ホストからの通信要求を受信するまで待機をする(ステップB1においてNo)。
通信要求を受信すると(ステップB1においてYes)、受信した通信要求に付随する通信メッセージを、通信先ホストが接続されている処理部に割り当てられている通信データ領域に格納する(ステップB2)。
次に、記憶部110の自処理部に割り当てられているブートカウンタ領域の値を読み出し(ステップB3)、読み出した値を記憶部110の通信先ホストが接続されている処理部に割り当てられているリクエスト領域に格納する(ステップB4)。その後、再び、ステップB1に戻り、ホストからの通信要求を受信するまで待機をする。
図4は、他処理部要求処理部124及び134の動作を表すフローチャートである。
図4を参照すると、他処理部要求処理部124及び134は、記憶部110の自処理部に割り当てられているリクエスト領域の値の監視をする(ステップC1)。
そして、記憶部110の自処理部に割り当てられているリクエスト領域に0以外の値が書き込まれるまで待機をする(ステップC2においてNo)。
0以外の値が書き込まれると(ステップC2においてYes)、書き込まれた値を自処理部内のLMに一時保存する。また、LMに書き込まれた値を一時保存するに伴いリクエスト領域を0でクリアする(ステップC3)。
次に、記憶部110の自処理部に割り当てられた通信データ領域に格納されている通信メッセージを読み出す(ステップC4)。
そして、自身に接続されているホストにステップC4において読み出した通信メッセージを送信し(ステップC5)、ホストからの応答(リプライ)を受信するまで待機をする(ステップC6においてNo)。
そして、ホストからの応答を受信すると(ステップC6においてYes)、リクエスト領域からLMに一時保存していた値を、リクエストの要求元の処理部に割り当てられている記憶部110のリプライ領域に格納する(ステップC7)その後、再びステップC1に戻り、リクエスト領域の値の監視をする。
図5は、他処理部リプライ処理部125及び135の動作を表すフローチャートである。
図5を参照すると、他処理部リプライ処理部125及び135は、記憶部110の自処理部に割り当てられているリプライ領域の値の監視をする(ステップD1)。
記憶部110の自処理部に割り当てられているリプライ領域に0以外の値が書き込まれるまで待機をする(ステップD2においてNo)。
0以外の値が書き込まれると(ステップC2においてYes)、書き込まれた値を自処理部内のLMに一時保存する。また、LMに書き込まれた値を一時保存するに伴いリプライ領域を0でクリアする(ステップD3)。
次に、一時保存した値と記憶部110の自処理部に割り当てられているブートカウンタ領域の値を比較する(ステップD4)。ステップD4における比較の結果、両値が等しければ(ステップD4においてYes)、自身に接続されているホストに通信完了を報告する(ステップD5)。そして、ステップD1に戻る。
一方、ステップD4における比較の結果、両値が等しくなければ(ステップD4においてNo)、何もせずにステップD1に戻る。すなわち、この場合には自身に接続されているホストに通信完了は報告されないこととなる。
以上が本実施形態における各部の動作である。
次に、本実施形態の動作について、具体的な例を挙げて詳細に説明する。
今回の具体例では、第1のホスト2000から第2のホスト3000へのメッセージ通信を行う際に、処理の途中で、第1の処理部120が障害でリブートする、というケースを例に取って説明する。説明の為、このときの第1のブートカウンタ領域111の値は1であったと仮定する(ステップS4)。
第1のホスト2000が第1の処理部120にメッセージ通信を要求する。すると、ホストからの通信要求を監視している第1の処理部120のホスト要求処理部123が要求の受信を認識する(ステップB1においてYes)。
ホスト要求処理部123は受信した通信要求に付随する通信メッセージを通信先ホストに接続された処理部である第2の処理部130に割り当てられている、第2の通信データ領域118に格納する(ステップB2)。
次に、第2の処理部130にリクエストを出すために、第1のブートカウンタ領域111の値を読み出す(ステップB3)。そして、ステップB3において読み出した値を第2のリクエスト領域114に格納する(ステップB4)。
次に、自身に割り当てられている第2のリクエスト領域114を監視している第2の処理部130の他処理部要求部134は、第2のリクエスト領域114に0以外の値が書き込まれたことを確認する(ステップC2においてYes)。
他処理部要求部134は、書き込まれた値をLM131に一時保存し、第2のリクエスト領域114を0でクリアする(ステップC3)。
次に、第2の通信データ領域118に格納されている通信メッセージを読み出し(ステップC4)、第2のホスト3000に当該通信メッセージを送信し(ステップC5)、第2のホスト3000からの応答を待つ(ステップC6)。
そして、第2のホスト3000からの応答を受信すると(ステップC6においてYes)、第2のリクエスト領域114からLM131に一時保存していた値を、第1のリプライ領域115に格納する(ステップC7)。
次に、自身に割り当てられている第1のリプライ領域115を監視している第1の処理部120の他処理部リプライ処理部125は第1のリプライ領域115に0以外の値が書き込まれたことを認識すると(ステップD2においてYes)、書き込まれた値をLM121に一時保存し、第1のリプライ領域115を0でクリアする(ステップD3)。
次に、LM121に一時保存した値と第1のブートカウンタ領域111の値を比較する(ステップD4)。ここで、通常は2つの値は等しくなるため(ステップD4においてYes)、第1のホスト2000に対して通信完了の応答を返す(ステップD5)。
ここで、第1の処理部120が、第2の処理部130にリクエストを出した直後にリブートしたとする。このとき、第1の処理部120は、リブート直後にブート回数登録部122によって、第1のブートカウンタ領域111の値が2に更新される(ステップA1、A2においてYes、A3)。
この状態で、第2の処理部130からリプライを受け取ると、先の、LM121に一時保存した値と第1のブートカウンタ領域111の値を比較する処理(ステップD4)において、一時保存した値はリブート前の値の1だが、第1のブートカウンタ領域111の値はリブート後の2になっているため、比較は不一致となり(ステップD4においてNo)、第1のホスト2000に対して通信完了の応答は行われない。
以上説明した本発明の実施形態は、以下に示すような多くの効果を奏する。
第1の効果は、確実に処理部間の通信正常終了を確認出来ることである。
その理由はブートカウンタ領域の値を要因とすることによりリブートが発生してもリクエストとリプライの対応づけをすることが出来る為である。リクエストとリプライの対応にずれが生じるのはリブートが発生したときのみである。
第2の効果は、処理が軽いことである。
その理由はブート処理(リブート処理含む)で一度リクエスト要因であるブートカウンタ領域の値をインクリメントしたらその後、リブートが発生するまで値をインクリメントせずともよい為である。通信発行毎にリクエスト要因をインクリメントする方法と比較し、少ない処理で同等の効果を得ることが出来る。
なお、本発明の実施形態である共有装置は、ハードウェアにより実現することもできるが、コンピュータをその共有装置として機能させるためのプログラムをコンピュータがコンピュータ読み取り可能な記録媒体から読み込んで実行することによっても実現することができる。
また、本発明の実施形態による不整合検出方法は、ハードウェアにより実現することもできるが、コンピュータにその方法を実行させるためのプログラムをコンピュータがコンピュータ読み取り可能な記録媒体から読み込んで実行することによっても実現することができる。
また、上述した実施形態は、本発明の好適な実施形態ではあるが、上記実施形態のみに本発明の範囲を限定するものではなく、本発明の要旨を逸脱しない範囲において種々の変更を施した形態での実施が可能である。
加えて、本実施形態は、一般的な技術と比べ下記の点で有利な効果を奏している。
一般的な技術では、処理要求毎に電文識別子を変化させている。しかし、本実施形態では識別子(ブート回数)を処理要求毎に変化させておらず異なる。すなわち、本実施形態では装置が(リ)ブートしたときのみインクリメントしており、識別子の更新を最小限に留めることで負荷を軽減させることが可能となるという効果を奏する。
また、一般的な技術では、例えば各ブートデバイスのブート回数に制限をかける為、ブート回数を利用している。それに対し、本実施形態では処理部間の通信のすれ違いを防止する為、ブート回数を利用できるという効果を奏する。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1) 第1のホストに接続される第1の処理部と、第2のホストに接続される第2の処理部と、前記第1の処理部及び第2の処理部が利用する記憶部と、を有する共有装置において、
前記第1の処理部が前記第1のホストからの第1のメッセージの送信要求を受け取ると、前記第2の処理部に対してリクエストを送信し、当該リクエストを受信した前記第2の処理部が前記メッセージを前記第2のホストに送信すると共にリプライを前記第1の処理部に送信し、前記リプライを受け取った第1の処理部は当該リプライが前記第1のメッセージの送信要求に応じたリプライであるか否かを判断し、
前記判断は、前記記憶部上で、前記リクエスト及び前記リプライにそれぞれ対応付けられた、前記第1の処理部のブート及びリブートの回数を照らし合わせることにより行われることを特徴とする共有装置。
(付記2) 付記1に記載の共有装置において、
前記判断に際して、前記リクエスト及び前記リプライにそれぞれ対応付けられた、前記第1の処理部のブート及びリブートの回数、が一致した場合には当該リプライが正当なものであると判断して前記第1のホストに対してリプライ処理を行い一致しなかった場合は当該リプライが正当なものでないと判断して当該リプライを廃棄することを特徴とする共有装置。
(付記3) 付記1又は2に記載の共有装置において、
前記第1の処理部は前記リクエストを送信する際に前記記憶部に自身のブート及びリブートの回数を記録し、前記第2の処理部は前記リクエストを受け取るとともに前記記録されたブート及びリブートの回数を読み込んで自身が記憶し、前記第2の処理部は前記リプライを送信するとともに前記自身が記憶したブート及びリブートの回数を前記記憶部に記録し、前記第1の処理部は自身が前記記憶部に記録したブート及びリブートの回数と前記第2の処理部が前記記憶部に記録したブート及びリブートの回数を比較することにより前記判断を行うことを特徴とする共有装置。
(付記4) 付記1乃至3の何れか1に記載の共有装置において、
前記第1の処理部が第2の処理部としても動作し、前記第2の処理部が第1の処理部としても動作することを特徴とする共有装置。
(付記5) 第1のホストに接続される第1の処理部と、第2のホストに接続される第2の処理部と、前記第1の処理部及び第2の処理部が利用する記憶部と、を有する共有装置並びに当該共有装置に接続された前記第1のホスト及び前記第2のホストを含んだクラスタシステムにおいて、
前記第1のホスト及び前記第2のホストは前記共有装置を介して通信を行い、
前記共有装置は付記1乃至4の何れか1項に記載の共有装置であることを特徴とするクラスタシステム。
(付記6) 第1のホストに接続される第1の処理部と、第2のホストに接続される第2の処理部と、前記第1の処理部及び第2の処理部が利用する記憶部と、を有する共有装置が行う不整合検出方法において、
前記第1の処理部が前記第1のホストからの第1のメッセージの送信要求を受け取ると、前記第2の処理部に対してリクエストを送信し、当該リクエストを受信した前記第2の処理部が前記メッセージを前記第2のホストに送信すると共にリプライを前記第1の処理部に送信し、前記リプライを受け取った第1の処理部は当該リプライが前記第1のメッセージの送信要求に応じたリプライであるか否かを判断し、
前記判断は、前記記憶部上で、前記リクエスト及び前記リプライにそれぞれ対応付けられた、前記第1の処理部のブート及びリブートの回数を照らし合わせることにより行われることを特徴とする不整合検出方法。
(付記7) 付記6に記載の不整合検出方法において、
前記判断に際して、前記リクエスト及び前記リプライにそれぞれ対応付けられた、前記第1の処理部のブート及びリブートの回数、が一致した場合には当該リプライが正当なものであると判断して前記第1のホストに対してリプライ処理を行い一致しなかった場合は当該リプライ正当なものでないと判断して当該リプライを廃棄することを特徴とする不整合検出方法。
(付記8) 付記6又は7に記載の不整合検出方法において、
前記第1の処理部は前記リクエストを送信する際に前記記憶部に自身のブート及びリブートの回数を記録し、前記第2の処理部は前記リクエスト受け取るとともに前記記録されたブート及びリブートの回数を読み込んで自身が記憶し、前記第2の処理部は前記リプライを送信するとともに前記自身が記憶したブート及びリブートの回数を前記記憶部に記録し、前記1の処理部は自身が前記記憶部に記録したブート及びリブートの回数と前記第2の処理部が前記記憶部に記録したブート及びリブートの回数を比較することにより前記判断を行うことを特徴とする不整合検出方法。
(付記9) 付記6乃至8の何れか1に記載の不整合検出方法において、
前記第1の処理部が第2の処理部としても動作し、前記第2の処理部が第1の処理部としても動作することを特徴とする不整合検出方法。
(付記10) 第1のホストに接続される第1の処理部と、第2のホストに接続される第2の処理部と、前記第1の処理部及び第2の処理部が利用する記憶部と、を有する共有装置並びに当該共有装置に接続された前記第1のホスト及び前記第2のホストを含んだクラスタシステムが行う不整合検出において、
前記第1のホスト及び前記第2のホストは前記共有装置を介して通信を行い、
前記共有装置は付記6乃至8の何れか1に記載の不整合検出方法を行うことを特徴とする不整合検出方法。
本発明は、メインフレーム等の大型コンピュータシステムにおける、複数のホストを接続したクラスタシステムでホスト間の通信に好適である。
110 記憶部
111 第1のブートカウンタ領域
112 第2のブートカウンタ領域
113 第1のリクエスト領域
114 第2のリクエスト領域
115 第1のリプライ領域
116 第2のリプライ領域
117 第1の通信データ領域
118 第2の通信データ領域
120 第1の処理部
121、131 ローカルメモリ
122、132 ブート回数登録部
123、133 ホスト要求処理部
124、134 他処理部要求処理部
125、135 他処理部リプライ処理部
130 第2の処理部
1000 共有装置
2000 第1のホスト
3000 第2のホスト

Claims (8)

  1. 第1のホストに接続される第1の処理部と、第2のホストに接続される第2の処理部と、前記第1の処理部及び第2の処理部が利用する記憶部と、を有する共有装置において、
    前記第1の処理部が前記第1のホストからの第1のメッセージの送信要求を受け取ると、前記第2の処理部に対してリクエストを送信すると共に前記記憶部に自身のブート及びリブートの回数を記録し、当該リクエストを受信した前記第2の処理部が前記記録されたブート及びリブートの回数を読み込んで自身が記憶すると共に前記メッセージを前記第2のホストに送信し、前記第2の処理部がリプライを前記第1の処理部に送信すると共に前記自身が記憶したブート及びリブートの回数を前記記憶部に記録し、前記リプライを受け取った前記第1の処理部は当該リプライが前記第1のメッセージの送信要求に応じたリプライであるか否かを判断し、
    前記判断は、前記第1の処理部が、自身が前記記憶部に記録したブート及びリブートの回数と前記第2の処理部が前記記憶部に記録したブート及びリブートの回数を照らし合わせることにより行われることを特徴とする共有装置。
  2. 請求項1に記載の共有装置において、
    前記判断に際して、前記リクエスト及び前記リプライにそれぞれ対応付けられた、前記第1の処理部のブート及びリブートの回数、が一致した場合には当該リプライが正当なものであると判断して前記第1のホストに対してリプライ処理を行い一致しなかった場合は当該リプライが正当なものでないと判断して当該リプライを廃棄することを特徴とする共有装置。
  3. 請求項1又は2に記載の共有装置において、
    前記第1の処理部が第2の処理部としても動作し、前記第2の処理部が第1の処理部としても動作することを特徴とする共有装置。
  4. 第1のホストに接続される第1の処理部と、第2のホストに接続される第2の処理部と、前記第1の処理部及び第2の処理部が利用する記憶部と、を有する共有装置並びに当該共有装置に接続された前記第1のホスト及び前記第2のホストを含んだクラスタシステムにおいて、
    前記第1のホスト及び前記第2のホストは前記共有装置を介して通信を行い、
    前記共有装置は請求項1乃至の何れか1項に記載の共有装置であることを特徴とするクラスタシステム。
  5. 第1のホストに接続される第1の処理部と、第2のホストに接続される第2の処理部と、前記第1の処理部及び第2の処理部が利用する記憶部と、を有する共有装置が行う不整合検出方法において、
    前記第1の処理部が前記第1のホストからの第1のメッセージの送信要求を受け取ると、前記第2の処理部に対してリクエストを送信すると共に前記記憶部に自身のブート及びリブートの回数を記録し、当該リクエストを受信した前記第2の処理部が前記記録されたブート及びリブートの回数を読み込んで自身が記憶すると共に前記メッセージを前記第2のホストに送信し、前記第2の処理部がリプライを前記第1の処理部に送信すると共に前記自身が記憶したブート及びリブートの回数を前記記憶部に記録し、前記リプライを受け取った前記第1の処理部は当該リプライが前記第1のメッセージの送信要求に応じたリプライであるか否かを判断し、
    前記判断は、前記第1の処理部が、自身が前記記憶部に記録したブート及びリブートの回数と前記第2の処理部が前記記憶部に記録したブート及びリブートの回数を照らし合わせることにより行われることを特徴とする不整合検出方法。
  6. 請求項に記載の不整合検出方法において、
    前記判断に際して、前記リクエスト及び前記リプライにそれぞれ対応付けられた、前記第1の処理部のブート及びリブートの回数、が一致した場合には当該リプライが正当なものであると判断して前記第1のホストに対してリプライ処理を行い一致しなかった場合は当該リプライが正当なものでないと判断して当該リプライを廃棄することを特徴とする不整合検出方法。
  7. 請求項5又は6に記載の不整合検出方法において、
    前記第1の処理部が第2の処理部としても動作し、前記第2の処理部が第1の処理部としても動作することを特徴とする不整合検出方法。
  8. 第1のホストに接続される第1の処理部と、第2のホストに接続される第2の処理部と、前記第1の処理部及び第2の処理部が利用する記憶部と、を有する共有装置並びに当該共有装置に接続された前記第1のホスト及び前記第2のホストを含んだクラスタシステムが行う不整合検出において、
    前記第1のホスト及び前記第2のホストは前記共有装置を介して通信を行い、
    前記共有装置は請求項乃至の何れか1項に記載の不整合検出方法を行うことを特徴とする不整合検出方法。
JP2011084550A 2011-04-06 2011-04-06 障害によるリブートを考慮した処理部間の不整合検出方法並びに共有装置及びクラスタシステム Expired - Fee Related JP5464449B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011084550A JP5464449B2 (ja) 2011-04-06 2011-04-06 障害によるリブートを考慮した処理部間の不整合検出方法並びに共有装置及びクラスタシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011084550A JP5464449B2 (ja) 2011-04-06 2011-04-06 障害によるリブートを考慮した処理部間の不整合検出方法並びに共有装置及びクラスタシステム

Publications (2)

Publication Number Publication Date
JP2012221101A JP2012221101A (ja) 2012-11-12
JP5464449B2 true JP5464449B2 (ja) 2014-04-09

Family

ID=47272571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011084550A Expired - Fee Related JP5464449B2 (ja) 2011-04-06 2011-04-06 障害によるリブートを考慮した処理部間の不整合検出方法並びに共有装置及びクラスタシステム

Country Status (1)

Country Link
JP (1) JP5464449B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015061322A (ja) * 2013-09-17 2015-03-30 株式会社日本自動車部品総合研究所 電力変換装置
JP6760346B2 (ja) * 2018-10-02 2020-09-23 株式会社Soken 電力変換装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5133053A (en) * 1987-02-13 1992-07-21 International Business Machines Corporation Interprocess communication queue location transparency
JPH06149763A (ja) * 1992-10-31 1994-05-31 Sony Corp 情報伝送装置
JP2972772B1 (ja) * 1998-11-25 1999-11-08 甲府日本電気株式会社 系間通信システム及び系間通信制御方法

Also Published As

Publication number Publication date
JP2012221101A (ja) 2012-11-12

Similar Documents

Publication Publication Date Title
US8898665B2 (en) System, method and computer program product for inviting other virtual machine to access a memory space allocated to a virtual machine
US11550819B2 (en) Synchronization cache seeding
EP2923272B1 (en) Distributed caching cluster management
CN109684414B (zh) 区块数据的同步方法、装置、设备及存储介质
US10169178B2 (en) Implementing shared adapter configuration updates concurrent with maintenance actions in a virtualized system
US10831612B2 (en) Primary node-standby node data transmission method, control node, and database system
US20170289297A1 (en) Distributed caching cluster client configuration
WO2020108271A1 (zh) 应用程序更新方法、设备和装置及存储介质
US11188347B2 (en) Virtual function driver loading method and server using global and local identifiers corresponding to locations of the virtual functions
US9529772B1 (en) Distributed caching cluster configuration
US9811404B2 (en) Information processing system and method
US8725904B2 (en) Management processors, methods and articles of manufacture
US20230412742A1 (en) Apparatus, method, and system for monitoring image-forming apparatus, and storage medium
CN115080479B (zh) 传输方法、服务器、设备、裸金属实例及基板管理控制器
CN113794764A (zh) 服务器集群的请求处理方法、介质和电子设备
US20160156704A1 (en) Exchange of information between processing servers
US9043283B2 (en) Opportunistic database duplex operations
CN113746641B (zh) 一种基于分布式存储的odx协议处理方法
JP5464449B2 (ja) 障害によるリブートを考慮した処理部間の不整合検出方法並びに共有装置及びクラスタシステム
US9563388B2 (en) Sharing a hosted device in a computer network
JP2011229093A (ja) ネットワーク装置
CN116166198A (zh) 一种数据传输方法、设备、系统及存储介质
CN115698955A (zh) 事务镜像的容错
US9270530B1 (en) Managing imaging of multiple computing devices
US9509658B2 (en) Method of restoring a MAC address and recording medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130905

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140108

R150 Certificate of patent or registration of utility model

Ref document number: 5464449

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees