JP2010176602A - 二重化処理装置、二重化処理システム、方法及びプログラム - Google Patents
二重化処理装置、二重化処理システム、方法及びプログラム Download PDFInfo
- Publication number
- JP2010176602A JP2010176602A JP2009021131A JP2009021131A JP2010176602A JP 2010176602 A JP2010176602 A JP 2010176602A JP 2009021131 A JP2009021131 A JP 2009021131A JP 2009021131 A JP2009021131 A JP 2009021131A JP 2010176602 A JP2010176602 A JP 2010176602A
- Authority
- JP
- Japan
- Prior art keywords
- processing unit
- processing
- exclusive control
- unit
- incorporated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Test And Diagnosis Of Digital Computers (AREA)
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Abstract
【解決手段】二重化された一対の処理部2、3を有し、一方の処理部2、3に障害がある場合に、他方の処理部3、2によって運用を継続する処理装置1であって、各処理部2、3は、当該処理装置1から切り離されて新たに組み込まれる処理部3、2とのリンク確立を判断するリンク確立判断手段と、新たに組み込まれる処理部3、2を対象として、その組み込みの可否をテストする組み込み前テスト手段とを備える構成としてある。
【選択図】図2
Description
ここで、二重化された処理部の運用方式としては、例えば以下のような方式がある。
第二の方式は、通常時、一組の処理部を同期状態で運用し、一方の処理部に障害が発生したとき、他方の処理部のみで運用を継続する方式である(例えば、特許文献2参照)。
例えば、特許文献1に示される二重化装置では、ループバック診断を実行し、ループバック時間をカウントするカウンタがタイムアップした場合に、通信制御部の故障と判断し、二重化制御のための信号を反転するようにしている。
また、特許文献2に示される二重化装置では、一組の処理部を高精度に同期運用し、一組の処理部の処理時間が不一致となったとき、障害が発生したと判断するようにしている。
一般的には、処理部自身の初期診断後、通信パスに問題がないことを保守員が判断したら、システムの運用に組み込んでいた。
しかしながら、テストプログラムによる初期診断は、通常、処理部単独で実行されるため、診断結果が正常であっても、システムの運用に組み込んだ後に問題が表面化し、システムの運用に悪影響をおよぼすことがあった。
ここで、以下に示す本発明の二重化処理装置及び二重化処理システムは、プログラム(ソフトウェア)の命令によりコンピュータで実行される処理,手段,機能によって実現される。プログラムは、コンピュータの各構成要素に指令を送り、以下に示すような所定の処理や機能、例えば、新たに組み込まれる処理部のリンク確立判断、新たに組み込まれる処理部の組み込み前テスト手段、組み込み前テストの結果が組み込み不可である処理部の組み込み要求の拒否等を行わせる。
このように、本発明における各処理や手段は、プログラムとコンピュータとが協働した具体的手段によって実現される。
なお、プログラムの全部又は一部は、例えば、磁気ディスク,光ディスク,半導体メモリ,その他任意のコンピュータで読取り可能な記録媒体により提供され、記録媒体から読み出されたプログラムがコンピュータにインストールされて実行される。また、プログラムは、記録媒体を介さず、通信回線を通じて直接にコンピュータにロードし実行することもできる。
図1は、本発明の一実施形態に係る二重化処理システムのブロック図であり、図2は、二重化処理装置のブロック図である。
図1に示すように、本実施形態に係る処理システムは、複数のホスト装置1〜N(以下、単に「ホスト」という)と、複数のホストに接続され、ホストからのコマンドを処理し、ホストに結果を返す処理装置1(1〜N)とを備えて構成されている。
ホスト1〜Nは、処理装置1〜Nに対してアクセス可能なホストコンピュータである。
このように、処理装置1は、一対の処理部2,3を備えることにより、一方の処理部2、3に故障等の障害が発生した場合にも、他方の処理部2、3によって装置・システムの運用を継続できるようになっている。
リンク確立判断手段2a,3aは、故障等の障害により処理装置1から切り離されていたいずれかの処理部が新たに組み込まれる場合に、新たに組み込まれる処理部とのリンク確立を判断する。
組み込み前テスト手段2b,3bは、新たに組み込まれる処理部を対象として、その組み込みの可否をテストする。
これによって、故障修理後の処理部3を単独で初期診断する場合に比べ、組み込みの可否を正確に判断し、不完全な処理部の組み込みを防止することが可能となる。
組み込み拒否手段2c,3cは、新たに組み込まれようとする処理部2又は3の組み込み前テスト手段によるテストの結果が組み込み不可である場合に、当該テスト結果が組み込み不可である処理部の組み込み要求があっても、当該組み込み要求を拒否する。
具体的には、組み込み要求拒否の処理は、保守員がコンソール等から組込みを指示すると、図示しない状態記憶部(後述する図4参照)の組込み可否情報がチェックされ、このチェックの結果が「否」であれば、組込み不可であるメッセージを表示する等、保守員に組込みができないことが報知、通知されることになる。
一方、チェックの結果が「可」であれば、所定の組み込み処理が行われることになる(後述する図21〜図24参照)。
これにより、組み込み前テストの結果を認識していない保守員等が不完全な処理部を組み込もうとしても、これを有効に防止することができる。
より具体的には、各処理部2,3で同じコマンドを処理し、その処理時間が所定時間を越える場合に、新たに組み込まれる処理部に係る組み込み要求を拒否するようにすることができる。
このようにすると、実際の処理に近い動作で前記テストを実施できるので、各処理部2、3に別途テストロジック等を組み込む必要がなくなり、簡易かつ低コストに組み込み前テストを行うことが可能となる。
このようにすると、システムの運用を停止することなく、組み込み前テストを実施できるので、システム停止による処理効率の低下を回避できる。
このようにすると、本来、別のコマンドを排他的に処理する排他制御処理部2、3において、同じコマンドを処理し、その処理結果及び処理時間の比較にもとづいて、故障修理後の排他制御処理部2、3に係る組み込みの可否を判断することが可能となる。
このようにすると、各処理部2,3が担当すべきコマンドの処理結果や処理時間にもとづいて、テスト対象である排他制御処理部2,3の組み込みの可否を正確に判断することができる。
図3は、本実施形態に係る処理装置1の組み込み前テストにおける処理動作を示すフローチャートである。
なお、以下の説明においては、理解を容易にするために、処理部2を運用中の処理部、処理部3を障害等により処理装置1からいったん切り離されて新たに組み込まれる(故障修理後の)処理部とする。
この判断結果がYESの場合は、運用中の処理部2は、所定の組み込み前テストを実行する。
具体的には、処理部2は、本来であれば故障修理後の処理部3が担当すべきコマンドをホストから受け取ったか否かを判断し(図3のS2)、この判断結果がYESの場合、運用中の処理部2は、ホストから受け取ったコマンドを故障修理後の処理部3に転送するとともに(図3のS3,S4)、自らそのコマンドを処理し(図3のS5)、その結果をホストに通知(報告)する(図3のS6)。
また、運用中の処理部2は、ホストへの報告時に、タイマをセットして所定時間の計時を開始するとともに(図3のS7)、処理結果を故障修理後の処理部3に転送する(図3のS9,S10)。
処理結果が一致した場合は(図3のS12)、処理部3は、運用中の処理部2にタイマ停止要求を送信する(図3のS13)。
運用中の処理部2は、故障修理後の処理部3からタイマ停止要求を受け取ると(図3のS14)、タイマを停止して計時を終了する(図3のS15)。
また、タイムアウトしなかった(所定時間を越えなかった)場合には、新たに組み込まれた処理部3が正常に動作していると判断し、状態記憶部に「組み込み可能」の情報を記憶・設定をする(図3のS18)。
これにより、処理部3に対する組み込み前テストが完了する。
一方、テスト結果が組み込み不可である場合は、処理部2は、処理部3の組み込みを拒否する処理を行う。
なお、以上の処理動作において、図3に示すフローチャートに示すステップS1がリンク確立判断手段2a,3a、ステップS2〜S18が組み込み前テスト手段2b,3b、ステップS19、S20が組み込み拒否手段2c,3cとなる。
次に、以上のような実施形態に係る二重化処理装置及び二重化処理システムのより具体的な実施形態について、図4〜図25を参照しつつ説明する。
図4は、本実施形態に係る排他制御処理部(処理部2,3)の具体的構成を示す機能ブロック図であり、図5は、状態記憶部の記憶内容を示す表図、図6は、ペア通信制御部で処理する通信を示す表図、図7は、ペア通信制御部の処理を示す表図である。
具体的には、各排他制御処理部2,3は、ホスト送受信処理部10、組み込み前テスト制御部20、コマンド振り分け部30、排他制御部40、ペア通信制御部50、ペア通信送受信処理部60、タイマ70、構成制御部80、排他制御テーブルセルフ100、排他制御テーブルペア101、状態記憶部200、装置番号300、結果保存エリア400の各部を備えている。
また、一方の排他制御処理部2又は3が縮退している場合は、他方の運用状態の排他制御処理部3又は2が全てのコマンドを処理する。
これにより、ホストからのコマンド処理要求に対して、二重化された一対の排他制御処理部2,3によって、一方の処理部が故障しても、他方の処理部によって運用・処理動作が継続できるようになる。
ホスト送受信処理部10は、ホストから送られる通信データを取り込んで、コマンド振り分け部30にコマンドを渡し、また、コマンド振り分け部30から渡されたコマンド応答をホストに送信する。
また、ペアの排他制御処理部2,3のペア通信送受信処理部60からデータを受信してペア通信制御部50に渡し、また、ペア通信制御部50から渡されたデータをペアの排他制御処理部2,3のペア通信送受信処理部60へ転送する。
状態記憶部200は、所定の状態情報を記憶する記憶手段であり、具体的には、図5に示すように、ペア装置(ペアの排他制御処理部2,3)とのリンク確立状態、自装置(自身の排他制御処理部2,3)の状態、ペア装置の状態及び、組込み可否等の情報を記憶する。
また、自装置の状態は、自装置が運用状態ならば「運用」を示す情報が設定され、縮退状態なら「縮退」を示す情報が設定されている。
ペア装置状態は、ペア装置が運用状態ならば「運用」を示す情報が設定され、縮退状態なら「縮退」を示す情報が設定されている。
なお、自装置状態及びペア装置状態の設定条件や状態遷移に関しては、本発明と直接関係しないので、詳細な説明を省略する。
構成制御部80は、例えば保守員等から縮退状態であるペアの排他制御処理部2,3の組み込み処理が操作・指示された場合に、状態記憶部200の組込み可否情報を参照・確認し、組込み可否情報が「可」であれば組み込まれようとしている排他制御処理部2,3の組み込みを実行し、「否」であれば組み込みを行わないようになっている。
保守員がコンソール等から組込みを指示すると、構成制御部80は、状態記憶部200の組込み可否をチェックする。
チェックの結果、「否」であれば、組込み不可であるメッセージを表示する等、保守員に組込みができないことを報知、通知する。
一方、チェックの結果、「可」であれば、後述する図21〜図24に示すような運用形態に入るために以下の処理を行う。ここで、現在運用中の処理部をA、縮退中(組み込まれる側)の処理部をBとする。
まず、一時的にホストからのコマンド受信を保留し、この保留している状態で以下の処理を行う。
(1)処理部Bの排他制御テーブルセルフ100と排他制御テーブルペア101をクリアする。
(2)次に処理部Aの排他制御テーブルペア101を処理部Bの排他制御テーブルセルフ100にコピーする。
(3)コピーが完了したら、処理部Aと処理部Bの状態記憶部200の自装置の状態とペア装置の状態を運用に設定する。
上記3点が完了したら、ホストからのコマンドの受信を再開する。このとき、ホスト側が処理部Bへのパスが復旧したことを認識(またはオペレータによりパスの活性化)すれば、処理部Bへのコマンドの配信も再開され完全に二重化運用に復帰する。
なお、組み込み動作については、本発明に直接関係しないので、詳細な説明を省略する。
通常状態(自、ペアとも運用状態)では、コマンドを分担する排他制御処理部2,3が自身の排他制御テーブルセルフ100で処理情報・管理状態情報等のデータを記憶・管理し、ペア装置が縮退している場合は、ペアの排他制御処理部2、3の担当分の情報を自身の排他制御テーブルペア101で記憶・管理する。
なお、このペアの排他制御処理部2,3間の排他制御テーブルセルフ100と排他制御テーブルペア101のデータの送信・コピー処理は、本発明に直接関係しないので、詳細な説明は省略する。
縮退状態の排他制御処理部2,3は、運用状態の排他制御処理部2,3から転送されたコマンドを処理し、その結果を排他制御テーブルセルフ100に記憶・管理し、ペア(運用状態)の排他制御処理部2,3の処理結果は、排他制御テーブルペア101にコピーされる。
具体的には、排他制御部40は、コマンドの内容に従い、排他制御テーブルセルフ100や排他制御テーブルペア101のデータを更新し、排他制御テーブルセルフ100の更新内容は、ペア通信制御部50等を介して、逐次ペアの排他制御処理部2,3の排他制御テーブルペア101にコピーされる。
また、排他制御部40は、ペア通信制御部50からのコピーデータ応答を受けると、処理結果情報を生成して要求元に通知・報告する。
なお、この排他制御部40による排他制御方法の詳細については説明を省略する。
具体的には、コマンド振り分け部30は、ホスト送受信処理部10又は組込み前テスト制御部20から転送されたホストからのコマンドが、自身の排他制御処理部2,3で分担すべきコマンドであれば、当該コマンドを排他制御部40に渡し、一方、ペア(相手側)の排他制御処理部2,3が分担すべきコマンドの場合には、当該コマンドをペア通信制御部50へ渡すように振り分け処理を実行する。
また、コマンド振り分け部30は、排他制御部40又はペア通信制御部50からコマンドの結果を受け取ると、そのコマンドの要求元のホスト送受信処理部10又は自身の組込み前テスト制御部20に転送する。
このペア通信制御部50による各通信の中継処理の詳細については後述する(図6及び図7参照)。
また、ペア通信制御部50は、排他制御部40からコマンド振り分け部30へコマンドの結果を転送する際に、タイマ70を制御してタイマをセットし、所定時間の計時を開始させる。
これにより、縮退中の排他制御処理部2,3は、ペア通信送受信処理部60からテーブル転送通知を受けることにより、受信したデータを自身の排他制御テーブルセルフ100に書き込むことができる。
そして、コマンド振り分け部30又はペア通信制御部50からコマンド応答又は転送コマンド応答を受け取ると、組み込み前テスト制御部20は、当該受け取りデータを結果保存エリア400に保存・記憶させる。
そして、この確認できた場合には、ペア通信送受信処理部60を経由して運用中の排他制御処理部2,3のペア通信制御部50にタイマ停止要求を通知する。
一方、データが不一致の場合には、組み込み前テスト制御部20は何も行わない。
結果保存エリア400は、自装置とペア装置のコマンド処理結果を比較するための一時的な保存エリアとなる記憶手段である。
なお、以下に示す図8〜図20の説明においては、理解を容易にするために、排他制御処理部2を運用中の排他制御処理部、排他制御処理部3を故障修理後等に新たに組み込まれる排他制御処理部とする。
図10〜図20は、本実施形態における組込み前テストの具体的動作を示す説明図である。
図21及び図22は、ペアとなる双方の排他制御処理部が正常な状態で、各処理部で自身が分担するコマンドを受け取った場合の動作を示す説明図である。
図23及び図24は、ペアとなる双方の排他制御処理部が正常な状態で、各処理部でペアとなる相手側が分担するコマンドを受け取った場合の動作を示す説明図である。
また、図25は、ペアとなる排他制御処理部が縮退した状態で、縮退しているペアの処理部が分担するコマンドを受け取った場合の動作を示す説明図である。
まず、本実施形態における組み込み前テストの準備動作について説明する。
図8及び図9に示すように、故障の修理等が終わって新たに組み込まれる場合、接続された排他制御処理部3が起動されると、排他制御処理部2のペア通信送受信処理部60がペアである排他制御処理部3とのリンク確立を検出し、状態記憶部200のリンク状態情報を「アンリンク」から「リンク」に変更する(図8の(1),図9の(1))。
ペア通信送受信処理部60は、新たに組み込まれる排他制御処理部3のペア通信送受信処理部60へテーブルデータを転送する(図8の(6))。
テーブル転送通知を受け取った排他制御処理部3のペア通信制御部50は、自身の排他制御テーブルセルフ100と排他制御テーブルペア101に受信したテーブルデータをコピーする(図9の(7)〜(11))。
次に、組込み前テストが行われる場合の具体的動作について説明する。
まず、排他制御処理部2が運用状態で、排他制御処理部3が縮退状態のときに、排他制御処理部3が分担すべきコマンドを排他制御処理部2が受け付けた場合の動作を説明する。
この場合、図10に示すように、排他制御処理部2は、ホスト(図1参照)から受信したコマンドをホスト送受信処理部10で受け取り、コマンド振り分け部30に渡す(図10の(1)〜(2))。
コマンド振り分け部30は、装置番号300に記憶されたデータとコマンドの内容から、当該コマンドが自身又はペアのいずれの処理部で処理すべきものかを判定し、この場合ペアの排他制御処理部3で処理すべきコマンドと判断して、ペア通信制御部50へコマンドを渡す(図10の(3))。
排他制御部40は、図11に示すように、ペア通信制御部50からコマンドを受信すると、当該コマンドを処理して排他制御テーブルペア101のデータを更新し(図11の(5))、更新内容をペア通信制御部50にコピーデータ要求として通知する(図11の(6))。
そして、ペア通信送受信処理部60は、ペア通信制御部50からのコピーデータ要求を排他制御処理部3に送信する(図11の(8))。
そして、排他制御処理部3は、テーブルの更新が完了したことを排他制御処理部2に通知するため、コピーデータ応答を作成し、ペア通信送受信処理部60に送信依頼を行い、排他制御処理部2にコピーデータ応答を送信させる(図12の(13)〜(14))。
ペア通信制御部50は、受け取ったコピーデータ応答を排他制御部40に転送する(図13の(17))。
排他制御部40は、コマンドの処理結果に基づいてコマンド応答を作成し、ペア通信制御部50に送信する(図13の(18))。
ペア通信制御部50は、転送コマンド応答データを組み込み前テスト制御部20に渡す(図18の(24))。
組み込み前テスト制御部20は、排他制御処理部3における対応する同コマンドの処理結果が既に結果保存エリア400に保存されていれば、処理結果の判定を行うが、当該コマンドの処理結果が保存されていなければ、転送コマンド応答を結果保存エリア400に格納・保存する(図18の(25))。
以上で、運用装置側が行う本来の処理の動作(図10の(4)-1参照)が終了する。
まず、排他制御処理部2は、図14に示すように、ペア通信制御部50が、受け取ったコマンド要求を排他制御処理部3のペア通信制御部50に転送するために、当該コマンド要求をペア通信送受信処理部60に渡し、排他制御処理部3に送信させる(図14の(4)-2〜(5))。
ペア通信制御部50は、受け取った転送コマンド要求を組み込み前テスト制御部20に渡し(図15の(8))、組み込み前テスト制御部20は、コマンド振り分け部30にコマンド要求として渡す(図15の(9))。
コマンド振り分け部30は、装置番号300の内容とコマンドの内容から排他制御処理部3で処理すべきコマンドと判断し、当該コマンド要求を排他制御部40に渡す(図15の(10))。
排他制御部40は、排他制御部40から送信されたコマンドを処理して排他制御テーブルセルフ100を更新し(図15の(11))、更新内容をペア通信制御部50にコピーデータ要求として通知する(図15の(12))。
排他制御部40は、コマンドの処理結果をまとめコマンド応答を作成し、コマンド振り分け部30に送信する(図16の(14))。
コマンド振り分け部30は、要求元である組込み前テスト制御部20に当該コマンド応答を渡す(図16の(15))。
組み込み前テスト制御部20は、排他制御処理部2の同コマンドの処理結果が既に結果保存エリア400に保存されていれば、処理結果の判定を行うが、まだ保存されていなければ、コマンド応答に基づく処理結果を結果保存エリア400に保存する(図16の(16))。
排他制御処理部3の組込み前テスト制御部20は、排他制御処理部3の結果保存エリア400に保存されている両方の処理結果を付き合わせて一致を判断するとともに、排他制御処理部3の排他制御テーブルセルフ100と排他制御テーブルペア101の一致を判断し、両判断がともに一致する場合には、タイマ停止要求を作成してペア通信送受信処理部60に転送を依頼し、排他制御処理部2に転送する(図18の(26)〜(27))。
ペア通信制御部50は、タイマ停止要求を受け取ると、タイマ70のタイマを停止させ、所定時間の計時を終了させる(図19の(30))。
タイマ停止要求が発行されなかった場合は、一定時間が経過するとタイマ70のタイマがタイムアウトし、図20に示すように、タイマ70が状態記憶部200の組込み可否に「否」を示す情報を設定する(図20の(1))。
これにより、組み込み前テストの結果に応じて排他制御処理部3の組み込みが行われないことになる。
以下、参考として、正常(縮退していない)な状態での排他制御処理部2、3の動作について、図21〜図24を参照して説明する。
まず、図21に示すように、ホストから排他制御処理部2が分担すべきコマンドが発行され、このコマンドを排他制御処理部2のホスト送受信処理部10で受け取ったとする(図21の(1))。
ホスト送受信処理部10は、コマンド要求をコマンド振り分け部30に引渡し(図21の(2))、コマンド要求を受けたコマンド振り分け部30は、装置番号300とコマンド要求の内容から自身(排他制御処理部2)が分担すべきコマンドと判断し、ペア排他制御部40に引き渡す(図21の(3))。
排他制御部40は、コマンドを処理して排他制御テーブルセルフ100を更新し(図21の(4))、更新情報をコピーデータとしてペア通信制御部50に渡す(図21の(5))。
ペア通信制御部50は、更新が完了したらコピーデータ応答を作成し、ペア通信送受信処理部60経由で排他制御処理部2のペア通信制御部50に送る(図22の(11)〜(13)、図21の(14)〜(15))。
排他制御処理部2では、図21に示すように、排他制御処理部3からコピーデータ応答を受け取ると、ペア通信制御部50がこれを排他制御部40に渡す(図21の(16))。
排他制御部40は、コマンドの処理結果をまとめてコマンド応答を作成し、コマンド振り分け部30経由でホスト送受信処理部10に渡し、ホストに結果を通知・報告する(図21の(17)〜(18))。
この場合、排他制御処理部2のホスト送受信処理部10は、コマンド要求をコマンド振り分け部30に引渡し(図23の(2))、コマンド要求をコマンド振り分け部30は装置番号300とコマンド要求の内容からペア(排他制御処理部3)が分担すべきコマンドと判断し、ペア通信制御部50に引き渡す(図23の(3))。
ペア通信制御部50は、状態記憶部200を参照してペアの状態を確認し、排他制御処理部3が運用中であれば、ペア通信送受信処理部60にコマンドの転送を依頼し(図23の(4))、ペア通信送受信処理部60は、コマンドを排他制御処理部3に送信する(図23の(5))。
ペア通信制御部50は、コマンドを排他制御部40に渡し(図24の(8))、排他制御部40はコマンドを処理して排他制御テーブルセルフ100を更新し(図24の(9))、更新情報をコピーデータとしてペア通信制御部50に渡す(図24の(10))。
ペア通信制御部50は、コピーデータをペア通信送受信処理部60経由でペア通信制御部50に渡し、排他制御処理部2の排他制御テーブルペア101を更新する(図24の(11)〜(12)、図23の(14)〜(16))。
ペア通信制御部50は、更新が完了したらコピーデータ応答を作成し、ペア通信送受信処理部60を経由して、排他制御処理部3のペア通信制御部50に送る(図23の(17)〜(18)、図24の(19)〜(20))。
排他制御部40は、コマンドの処理結果をまとめてコマンド応答を作成し、ペア通信制御部50に渡す(図24の(22))。
ペア通信制御部50は、コマンド応答をペア通信送受信処理部60経由で排他制御処理部2のペア通信制御部50へ渡す(図24の(23)〜(24)、図23の(25)〜(26))。
排他制御処理部2のペア通信制御部50は、コマンド応答をコマンド振り分け部30経由でホスト送受信処理部10に渡し、ホストに結果を通知・報告する(図23の(27)〜(28))。
以上により、排他制御処理部2,3が正常(縮退していない)な状態での処理が完了する。
次に、排他制御処理部3が故障等により縮退した状態での運用・処理動作について、図25を参照して説明する。
まず、図25に示すように、ホストから排他制御処理部3が分担すべきコマンドが発行され、このコマンドを排他制御処理部2のホスト送受信処理部10で受け取ったとする(図25の(1))。
排他制御処理部2のホスト送受信処理部10は、コマンド要求をコマンド振り分け部30に引渡し(図25の(2))、コマンド振り分け部30は、装置番号300とコマンド要求の内容からペア(排他制御処理部3)が分担すべきコマンドと判断し、ペア通信制御部50に引き渡す(図25の(3))。
排他制御部40は、コマンドを処理して排他制御テーブルペア101を更新し(図25の(5))、更新情報をコピーデータとしてペア通信制御部50に渡す(図25の(6))。
ペア通信制御部50は、状態記憶部200のペア(排他制御処理部3)の状態を確認し、排他制御処理部3が縮退中なのでコピーデータを破棄し、コピー応答を作成して排他制御部40に返す(図25の(7))。
ペア通信制御部50は、コマンド応答をコマンド振り分け部30経由でホスト送受信処理部10に渡し、ホストに結果を報告する(図25の(9)〜(10))。
なお、排他制御処理部3が故障により縮退した状態で、ホストから排他制御処理部2が分担すべきコマンドが発行され、このコマンドを排他制御処理部2のホスト送受信処理部10で受け取ったケースについては説明を省略する。
これによって、故障修理後の処理部3を単独で初期診断する場合に比べ、組み込みの可否を正確に判断し、不完全な処理部の組み込みを防止することが可能となる。
2 処理部(排他制御処理部)
3 処理部(排他制御処理部)
10 ホスト送受信処理部
20 組み込み前テスト制御部
30 コマンド振り分け部
40 排他制御部
50 ペア通信制御部
60 ペア通信送受信処理部
70 タイマ
80 構成制御部
100 排他制御テーブルセルフ
101 排他制御テーブルペア
200 状態記憶部
300 装置番号
400 結果保存エリア
Claims (13)
- 二重化された一対の処理部を有し、一方の処理部に障害がある場合に、他方の処理部によって運用を継続する処理装置であって、
前記各処理部は、
当該処理装置から切り離されて新たに組み込まれる処理部とのリンク確立を判断するリンク確立判断手段と、
新たに組み込まれる処理部を対象として、その組み込みの可否をテストする組み込み前テスト手段と、を備える
ことを特徴とする二重化処理装置。 - 前記各処理部は、
新たに組み込まれる処理部の前記組み込み前テスト手段によるテストの結果が組み込み不可である場合に、当該テスト結果が組み込み不可である処理部の組み込み要求があっても、当該組み込み要求を拒否する組み込み拒否手段を備える
ことを特徴とする請求項1記載の二重化処理装置。 - 前記組み込み前テスト手段は、
前記各処理部で同じコマンドを処理し、その処理結果及び処理時間を比較することにより、新たに組み込まれる処理部に係る組み込みの可否を判断する
ことを特徴とする請求項1又は2記載の二重化処理装置。 - 前記組み込み前テスト手段は、
前記各処理部で同じコマンドを処理し、その処理時間が所定時間を越える場合に、新たに組み込まれる処理部に係る組み込み要求を拒否する
ことを特徴とする請求項3記載の二重化処理装置。 - 前記組み込み前テスト手段は、
前記テストを、システム運用中に実行する
ことを特徴とする請求項1〜4のいずれかに記載の二重化処理装置。 - 前記各処理部は、
通常時、別のコマンドを排他的に処理する排他制御処理部であり、一方の排他制御処理部に障害があるとき、他方の排他制御処理部が全てのコマンドを処理する
ことを特徴とする請求項1〜5のいずれかに記載の二重化処理装置。 - 前記組み込み前テスト手段は、
テスト対象となる排他制御処理部に割り当てられたコマンドを受け取ったときに前記テストを実行する
ことを特徴とする請求項6記載の二重化処理装置。 - 二重化された一対の処理部を備え、一方の処理部に障害がある場合に、他方の処理部によって運用を継続する二重化処理システムであって、
前記各処理部は、
当該処理システムから切り離されて新たに組み込まれる処理部とのリンク確立を判断するリンク確立判断手段と、
新たに組み込まれる処理部を対象として、その組み込みの可否をテストする組み込み前テスト手段と、を備える
ことを特徴とする二重化処理システム。 - 前記各処理部は、
新たに組み込まれる処理部の前記組み込み前テスト手段によるテストの結果が組み込み不可である場合に、当該テスト結果が組み込み不可である処理部の組み込み要求があっても、当該組み込み要求を拒否する組み込み拒否手段を備える
ことを特徴とする請求項8記載の二重化処理システム。 - 二重化された一対の処理部により、一方の処理部に障害がある場合に、他方の処理部によって運用を継続する二重化処理方法であって、
前記各処理部において、
当該処理システムから切り離されて新たに組み込まれる処理部とのリンク確立を判断するステップと、
新たに組み込まれる処理部を対象として、その組み込みの可否をテストするステップと、を有する
ことを特徴とする二重化処理方法。 - 前記各処理部において、
新たに組み込まれる処理部の前記組み込み前テストの結果が組み込み不可である場合に、当該テスト結果が組み込み不可である処理部の組み込み要求があっても、当該組み込み要求を拒否するステップを有する
ことを特徴とする請求項10記載の二重化処理方法。 - 二重化された一対の処理部を備え、一方の処理部に障害がある場合に、他方の処理部によって運用を継続する二重化処理装置を構成するコンピュータを、
前記各処理部において、
当該処理システムから切り離されて新たに組み込まれる処理部とのリンク確立を判断するリンク確立判断手段、
新たに組み込まれる処理部を対象として、その組み込みの可否をテストする組み込み前テスト手段、として機能させる
ことを特徴とする二重化処理プログラム。 - 前記コンピュータを、
前記各処理部において、
新たに組み込まれる処理部の前記組み込み前テスト手段によるテストの結果が組み込み不可である場合に、当該テスト結果が組み込み不可である処理部の組み込み要求があっても、当該組み込み要求を拒否する組み込み拒否手段、として機能させる
ことを特徴とする請求項12記載の二重化処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009021131A JP5581594B2 (ja) | 2009-02-02 | 2009-02-02 | 二重化処理装置、二重化処理システム、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009021131A JP5581594B2 (ja) | 2009-02-02 | 2009-02-02 | 二重化処理装置、二重化処理システム、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010176602A true JP2010176602A (ja) | 2010-08-12 |
JP5581594B2 JP5581594B2 (ja) | 2014-09-03 |
Family
ID=42707476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009021131A Expired - Fee Related JP5581594B2 (ja) | 2009-02-02 | 2009-02-02 | 二重化処理装置、二重化処理システム、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5581594B2 (ja) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02266457A (ja) * | 1989-04-06 | 1990-10-31 | Hitachi Ltd | 処理の継続実行方法 |
JPH0319069A (ja) * | 1989-06-16 | 1991-01-28 | Nec Corp | マルチプロセッサの異常診断方式 |
JPH0512055A (ja) * | 1991-07-08 | 1993-01-22 | Nec Eng Ltd | マイクロ・プロセツサ・ユニツト選択制御回路 |
JPH0619810A (ja) * | 1992-06-29 | 1994-01-28 | Yokogawa Electric Corp | 二重化装置 |
JPH06187185A (ja) * | 1992-12-18 | 1994-07-08 | Nec Commun Syst Ltd | 二重化装置 |
JPH06222939A (ja) * | 1993-01-21 | 1994-08-12 | Fujitsu Ltd | 複数パイプラインの試験方式 |
JPH07282022A (ja) * | 1994-04-04 | 1995-10-27 | Hitachi Ltd | マルチプロセッサシステム |
JPH0895820A (ja) * | 1994-09-22 | 1996-04-12 | Hitachi Ltd | 動的システム再構成時の接続確認方法 |
JPH11242661A (ja) * | 1998-02-25 | 1999-09-07 | Nec Corp | ファイル共有システムの排他制御装置及び構成制御方法 |
JP2001051865A (ja) * | 1999-08-05 | 2001-02-23 | Denso Corp | 電子制御装置の検査方法 |
JP2007183804A (ja) * | 2006-01-06 | 2007-07-19 | Nec Corp | コンソール、操作管理装置、同時操作管理システムおよび複数装置の同時操作方法およびプログラム |
JP2007207050A (ja) * | 2006-02-03 | 2007-08-16 | Alaxala Networks Corp | 並列プロセッサ間通信の試験方法及びプログラム |
-
2009
- 2009-02-02 JP JP2009021131A patent/JP5581594B2/ja not_active Expired - Fee Related
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02266457A (ja) * | 1989-04-06 | 1990-10-31 | Hitachi Ltd | 処理の継続実行方法 |
JPH0319069A (ja) * | 1989-06-16 | 1991-01-28 | Nec Corp | マルチプロセッサの異常診断方式 |
JPH0512055A (ja) * | 1991-07-08 | 1993-01-22 | Nec Eng Ltd | マイクロ・プロセツサ・ユニツト選択制御回路 |
JPH0619810A (ja) * | 1992-06-29 | 1994-01-28 | Yokogawa Electric Corp | 二重化装置 |
JPH06187185A (ja) * | 1992-12-18 | 1994-07-08 | Nec Commun Syst Ltd | 二重化装置 |
JPH06222939A (ja) * | 1993-01-21 | 1994-08-12 | Fujitsu Ltd | 複数パイプラインの試験方式 |
JPH07282022A (ja) * | 1994-04-04 | 1995-10-27 | Hitachi Ltd | マルチプロセッサシステム |
JPH0895820A (ja) * | 1994-09-22 | 1996-04-12 | Hitachi Ltd | 動的システム再構成時の接続確認方法 |
JPH11242661A (ja) * | 1998-02-25 | 1999-09-07 | Nec Corp | ファイル共有システムの排他制御装置及び構成制御方法 |
JP2001051865A (ja) * | 1999-08-05 | 2001-02-23 | Denso Corp | 電子制御装置の検査方法 |
JP2007183804A (ja) * | 2006-01-06 | 2007-07-19 | Nec Corp | コンソール、操作管理装置、同時操作管理システムおよび複数装置の同時操作方法およびプログラム |
JP2007207050A (ja) * | 2006-02-03 | 2007-08-16 | Alaxala Networks Corp | 並列プロセッサ間通信の試験方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5581594B2 (ja) | 2014-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9632884B2 (en) | Maintaining computer system operability | |
CN105933407B (zh) | 一种实现Redis集群高可用的方法及系统 | |
EP1703401B1 (en) | Information processing apparatus and control method therefor | |
EP3285168B1 (en) | Disaster tolerance method and apparatus in active-active cluster system | |
US7467322B2 (en) | Failover method in a cluster computer system | |
JP3620527B2 (ja) | ループ状インタフェースの障害解析方法及び障害解析機能を有するシステム | |
CN101072125A (zh) | 集群结构及其控制单元 | |
US20080288812A1 (en) | Cluster system and an error recovery method thereof | |
JP2012230444A (ja) | 計算機システムでの部分障害処理方法 | |
WO2018087835A1 (ja) | 移動デバイスを制御するシステム、制御装置及び制御方法 | |
CN106559288B (zh) | 一种基于icmp报文的快速故障检测方法 | |
JP2004171370A (ja) | 冗長構成におけるクライアント/サーバ間のアドレス制御方式および方法 | |
JP5581594B2 (ja) | 二重化処理装置、二重化処理システム、方法及びプログラム | |
JP3248485B2 (ja) | クラスタシステム、クラスタシステムにおける監視方式およびその方法 | |
US20080310314A1 (en) | Method for Detecting a Message Interface Fault in a Communication Device | |
JP2009075719A (ja) | 冗長構成装置及びその自己診断方法 | |
JP2008299658A (ja) | 監視制御システム | |
JP2004110801A (ja) | 再初期化したチャネル間接続の妥当性を検査するための技法 | |
CN100490343C (zh) | 一种通讯设备中主备用单元倒换的实现方法和装置 | |
JP2008250929A (ja) | リンク障害診断方法、ディスクアレイ・システム、及びリンク障害診断プログラム | |
JP2016127569A (ja) | 電子制御装置 | |
JP2002064490A (ja) | 故障部位切り分け方法 | |
CN111240749B (zh) | 一种集群系统中实例的挂起控制方法、装置、设备、存储介质 | |
JP6935819B2 (ja) | ノード装置、回復動作制御方法、及び回復動作制御プログラム | |
JP2001175545A (ja) | サーバシステムおよび障害診断方法ならびに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140617 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140630 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5581594 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |