JP2008205599A - 冗長切替装置、冗長切替システムおよび冗長切替制御プログラム - Google Patents

冗長切替装置、冗長切替システムおよび冗長切替制御プログラム Download PDF

Info

Publication number
JP2008205599A
JP2008205599A JP2007036637A JP2007036637A JP2008205599A JP 2008205599 A JP2008205599 A JP 2008205599A JP 2007036637 A JP2007036637 A JP 2007036637A JP 2007036637 A JP2007036637 A JP 2007036637A JP 2008205599 A JP2008205599 A JP 2008205599A
Authority
JP
Japan
Prior art keywords
failure
switching
operation state
state
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007036637A
Other languages
English (en)
Inventor
Shuji Teramoto
修司 寺本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007036637A priority Critical patent/JP2008205599A/ja
Publication of JP2008205599A publication Critical patent/JP2008205599A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

【課題】上位装置の存否にかかわらず、所定の場合に障害の発生した装置から他の装置に運用の切り替えを行うことのできる冗長切替装置、冗長切替システムおよび冗長切替制御プログラムを得る。
【解決手段】回線モジュール装置100は、アクト回線用の第nの回線モジュール102nとバックアップ回線用の第n+1の回線モジュール102n+1とこれらの切替制御を行う制御モジュール101を備えている。回線モジュール102内にはヘルスチェック回路113が備えられており、監視信号118の到来が途絶えると自律制御を行うモードにシフトする。この後は、状態監視回路115A、115Bの間で通信される信号を用いて、系の切り替えが自律的に実行される。
【選択図】図2

Description

本発明は、一対の回路装置を予め用意しておき、使用していた回路装置の障害発生時に正常な回路装置側に切り替えを行う冗長切替装置とこの冗長切替装置を用いた冗長切替システムおよび冗長切替制御プログラムに係わり、特に現在運用する回路装置の他にこの回路装置の障害発生時にこれと切り替わる回路装置を用意した通信システムに好適に使用することのできる冗長切替装置とこの冗長切替装置を用いた冗長切替システムおよび冗長切替制御プログラムに関する。
通信ネットワークを相互に接続するために使用されるルータや通信経路の切り替えを行うスイッチおよび、アクセス系装置は、一般的に、制御モジュール部と回線モジュール部によって構成されている。これらの回路装置では、従来からこれらを使用した通信システムの信頼性を向上させるため、二重化構成あるいはN+1冗長構成を採用している。ここで「N」は任意の正の整数である。このように回線モジュールを冗長に構成すると、装置内のアクト(現用)側回線モジュールの故障時は、スタンバイ(待機)側回線モジュールに切り替えてシステムの運用を維持することができる。
このような冗長構成を採った冗長切替装置および冗長切替装置を使用した冗長切替システムとして、従来からさまざまな優れた技術が提案されている。たとえば、同一カード内に複数回線を収容するような冗長構成をとる通信装置で、カード内の各冗長回線単位に回線優先度設定を行っておき、設定された優先度に基づいて複数冗長組の切替処理順序の制御を行うことが第1の提案として提案されている(たとえば特許文献1参照)。この第1の提案によれば、システム管理者の意図に応じた順番で冗長組の信号救済を行うことが可能になる。その結果としてシステム管理者が重要と認識している回線の信号断時間の短縮を図ることができる。
しかしながら、この第1の提案は「N」が「2」以上のN+1冗長構成のときに有用な技術思想であり、一対の回路装置で冗長切替装置を構成している場合には適用しようがない。このような冗長切替装置では択一的な切り替えしか実現できないからである。
一方、上位装置が下位装置の系選択制御を行う一方で、上位装置の機能が停止する場合には、その上位装置の指示によって下位装置が系選択制御を行うようにしたことが第2の提案として提案されている(たとえば特許文献2参照)。
特開2006−94311号公報(第0007段落、図2) 特開平07−202988号公報(第0021段落〜第0023段落、図1)
この第2の提案では、下位装置の各部からの警報を監視し、その監視結果を示す警報信号を上位装置へ出力する警報監視部が存在している。そして、上位装置に異常が発生していないときには、この警報監視部の警報信号を基にして、上位装置から下位装置に系選択指示が出力される。上位装置が障害を発生させた場合には、系切替制御が停止された旨の通知が下位装置に対して行われる。下位装置は上位装置からこの通知を受けると、警報監視部の監視結果に基づき自律的に系切替制御を行う。
このように第2の提案では上位装置が下位装置に系切替制御の停止を通知することで、それ以降の切替制御が下位装置で自立的に行われる。したがって、上位装置が障害によってこの通知を下位装置に対して行えない場合には、下位装置同士の切替制御が実行されない。すなわち、この状態で運用中の下位装置に障害が発生した場合には、他の下位装置への切り替えが行われず、システムの運用は停止してしまう。
そこで本発明の目的は、上位装置の存否にかかわらず、所定の場合に障害の発生した装置から他の装置に運用の切り替えを行うことのできる冗長切替装置、冗長切替システムおよび冗長切替制御プログラムを提供することにある。
請求項1記載の発明では、(イ)自装置内部の障害の発生を検知する障害検知手段と、(ロ)障害検知手段の検知状態を特定の系の運用について自装置と共に装置間の切替制御によって冗長構成をとる予め定めた他方の構成装置に通知する自装置障害有無通知手段と、(ハ)自装置が前記した他方の構成装置に代わって前記した特定の系の運用状態にあるか否かを記憶する系運用状態記憶手段と、(ニ)この系運用状態記憶手段に前記した特定の系の運用状態にあると記憶している状態でのみ前記した特定の系の運用を行う系運用手段と、(ホ)系運用状態記憶手段に運用状態にあると記憶されていない状態で、前記した他方の構成装置からその装置内部の障害の発生の通知を受けたとき障害検知手段が自装置の障害を検知していない条件で系運用状態記憶手段の記憶内容を運用状態に変更する系運用状態記憶変更手段とを冗長切替装置に具備させる。
すなわち本発明では、自装置内部の障害の発生を障害検知手段で検知して、これを特定の系の運用について自装置と共に装置間の切替制御によって冗長構成をとる予め定めた他方の構成装置に通知するようにしておく。この一方で、自装置と前記した他方の構成装置のいずれが特定の系の運用状態にあるかを系運用状態記憶手段に記憶するようにしておく。系運用手段は、この系運用状態記憶手段に自装置が前記した特定の系の運用状態にあると記憶している状態でのみ前記した特定の系の運用を行うことができる。系運用状態記憶変更手段は、系運用状態記憶手段に自装置が運用状態にあると記憶されていない状態で、前記した他方の構成装置からその装置内部の障害の発生の通知を受けたとき障害検知手段が自装置の障害を検知していない条件で系運用状態記憶手段の記憶内容を運用状態に変更する。このように本発明では、障害の発生を互いの装置で通知し合い、系運用状態記憶手段の記憶内容に応じて冗長構成をとる構成装置間で自律的に冗長切り替えを行えるようにしている。
請求項2記載の発明では、(イ)自装置内部の障害の発生を検知する障害検知手段と、障害検知手段の検知状態を特定の系の運用について自装置と共に装置間の切替制御によって冗長構成をとる予め定めた他方の構成装置に通知する自装置障害有無通知手段と、自装置が前記した他方の構成装置に代わって前記した特定の系の運用状態にあるか否かを記憶する系運用状態記憶手段と、系運用状態記憶手段に運用状態にあると記憶されていない状態で、前記した他方の構成装置からその装置内部の障害の発生の通知を受けたとき障害検知手段が自装置の障害を検知していない条件で系運用状態記憶手段の記憶内容を運用状態に変更する系運用状態記憶変更手段と、所定の時間間隔を置いて特定の制御信号の供給を受ける制御信号受信手段と、この制御信号受信手段による前記した特定の制御信号の受信が前記した所定の時間間隔よりも長い時間滞ったときには、系運用状態記憶手段に前記した特定の系の運用状態にあると記憶している状態でのみ前記した特定の系の運用を行う系運用手段とをそれぞれ備え、前記した特定の系の運用で冗長構成となった一対の構成装置と、(ロ)これら一対の構成装置のいずれを前記した特定の系の運用に当てるかの指示を送出する運用指示送出手段と、この運用指示送出手段による運用指示の送出が可能な状態で前記した一対の装置のそれぞれに対して前記した特定の制御信号の送出を継続する制御信号送出手段とを備えた上位装置とを冗長切替システムに具備させる。
すなわち本発明では、冗長構成をとる一対の構成装置と、これらの切替制御を行う役割の上位装置とで冗長切替システムを構成している。上位装置は、一対の構成装置のそれぞれに対して所定の時間間隔を置いて特定の制御信号の送出を継続するようになっている。通常は、一対の構成装置のうちの系運用状態記憶手段に運用状態にあると記憶されている方の構成装置が系の運用を行う。上位装置がダウンしてこの特定の制御信号の送出が所定の時間間隔よりも長い時間滞る事態が発生したときには、請求項1に記載した発明と同様にして構成装置間で自律的な切り替えが行われる。
この請求項2記載の発明では、上位装置が請求項1記載の冗長切替装置としての構成を有していてもよい。これにより、上位装置の信頼性も向上させることができる。また、前記した一対の構成装置は、上位装置に障害が発生して下位の一対の構成装置の切替制御を行えなくなったとき、これらの一対の構成装置が自律的な切替制御を行うかどうかを事前に設定しておくようにしてもよい。
請求項6記載の発明では、特定の系の運用について自装置と共に装置間の切替制御によって冗長構成をとる予め定めた他方の構成装置が存在する装置のコンピュータに、冗長切替制御プログラムとして、(イ)自装置内部の障害の発生を検知する障害検知処理と、(ロ)障害検知処理の結果としての検知状態を前記した予め定めた他方の構成装置に通知する自装置障害有無通知処理と、(ハ)自装置が前記した予め定めた他方の構成装置に代わって前記した特定の系の運用状態にあるか否かの記憶を保持する系運用状態記憶処理と、(ニ)この系運用状態記憶処理で前記した特定の系の運用状態にあると記憶している状態でのみ前記した特定の系の運用を行う系運用処理と、(ホ)系運用状態記憶処理で運用状態にあると記憶していない状態で、前記した予め定めた他方の構成装置からその装置内部の障害の発生の通知を受けたとき障害検知処理で自装置の障害を検知していない条件で系運用状態記憶処理による記憶内容を運用状態に変更する系運用状態記憶変更処理とを実行させることを特徴としている。
すなわち本発明では、請求項1記載の発明と同様の技術思想を冗長構成となったそれぞれの構成装置の冗長切替制御プログラムとして実現している。
以上説明したように請求項1記載の発明によれば、対等の構成装置間で障害に関する情報を伝達し合うのと、いずれが系の運用に当たるかを記憶する系運用状態記憶手段を構成装置自身が用意することで、他の装置の介在しない自律的な構成装置間の切替制御が実現する。したがって、他の装置から指示の情報が来ない状態でも切替制御を行ったり、その制御を開始することができ、信頼性の高い系の運用が可能になる。
また、請求項2記載の発明によれば、請求項1記載の発明の効果に加えて、上位装置の正常時にはその統率が取れ、障害以外の事由でも系の切り替えが可能になるという効果がある。
以下実施例につき本発明を詳細に説明する。
図1は、本発明の一実施例における回線モジュール装置の外観を表わしたものである。この回線モジュール装置100は、回線冗長化のためにアクト回線とバックアップ(スタンバイ)回線を使用する装置構成となっており、装置中央に制御モジュール101が配置されている。制御モジュール101の図で左側には、第0〜第7の回線モジュール1020〜1027が並列に配置されており、右側には第8〜第15の回線モジュール1028〜10215が並列に配置されている。それぞれの回線モジュール1020〜10215の上部には、第1の発光ダイオード103と第2の発光ダイオード104が上下に配置されている。このうち第1の発光ダイオード103は、自己の回線モジュール102に障害が発生していない状態で点灯し、自律制御モード中に障害が発生している状態で消灯する表示制御を行う。第2の発光ダイオード104の方は、自己の回線モジュール102におけるポートが閉塞してデータの通信が行われていない状態で赤色に点灯するようになっている。また、この図ではアクト回線用の発光ダイオードを表わす符号に英字「A」を、バックアップ回線用の発光ダイオードを表わす符号に英字「B」を付している。
このような回線モジュール装置100で、第0〜第15の回線モジュール1020〜10215は、さまざまな回線インタフェースを持っており、偶数番目がアクト回線用に、奇数番目がバックアップ回線用に設けられている。そして、これらアクト回線用とバックアップ回線用からなる第0および第1の回線モジュール1020、1021は、図示しないBWB(Back Wiring Board)で第0の接続手段1050によって交絡接続されており、1組となって第0の回線モジュール部1060を構成している。
また、第2および第3の回線モジュール1022、1023もBWBで第1の接続手段1051によって交絡接続されており、同様に1組となって第1の回線モジュール部1061を構成している。以下同様にして回線モジュール装置100全体では、第0〜第7の接続手段1050〜1057によって、それぞれペアとなった第0〜第7の回線モジュール部1060〜1067が構成されている。
制御モジュール101は、これら第0〜第15の回線モジュール1020〜10215の通信制御やシステム監視を行うようになっている。そして、たとえばアクト回線用の第0の回線モジュール1020が障害等により制御不能になった状況で、第0の回線モジュール部1060を構成するバックアップ回線用の第1の回線モジュール1021に障害を生じていない場合、制御モジュール101自体に障害が発生していなければ、自身のソフトウェア制御によって第1の回線モジュール1021側へ制御の切り替えを行うようになっている。制御モジュール101自体に障害が発生した場合には、第0の回線モジュール1020と第1の回線モジュール1021の間で自立的な切替制御が行われる。
図2は、本実施例の回線モジュール装置の制御モジュールと1組の回線モジュール部の回路構成を抜き出して示したものである。アクト回線用の第nの回線モジュール102n(ただし数値nは2〜14までの任意の偶数の整数および0のいずれか)は、冗長切替回路111Aを備えている。この第nの回線モジュール102nと前記したBWBによる接続手段105で接続されたバックアップ(スタンバイ)回線用の第n+1の回線モジュール102n+1も冗長切替回路111Bを備えている。
冗長切替回路111Aは、冗長機能の実現のための複数のレジスタを備えた冗長機能レジスタ112Aと、制御モジュール101のヘルスチェックを行うヘルスチェック回路113Aと、第nの回線モジュール102n内の障害の発生を監視する障害監視回路114Aおよびこれらと接続された状態監視回路115Aを備えている。冗長切替回路111Bも、冗長機能レジスタ112Bと、ヘルスチェック回路113Bと、障害監視回路114Bおよびこれらと接続された状態監視回路115Bを備えている。状態監視回路115Aは、接続手段105によってアクト・スタンバイ信号116Aおよび障害信号117Aを状態監視回路115Bに送出するようになっており、状態監視回路115Bからアクト・スタンバイ信号116Bおよび障害信号117Bを受け取るようになっている。状態監視回路115Bも状態監視回路115Aと基本的に同様の回路動作を行う。
このように、冗長切替回路111Aと冗長切替回路111Bは基本的に同一構成となっている。そこで、適宜これらの一方の回路部分を図示および説明して、他方の図示および説明を省略する。
図3は、冗長機能レジスタの構成を具体的に表わしたものである。図2に示した第nの回線モジュール102n内の冗長機能レジスタ112Aは、ハードウェア自律冗長切替機能を有効にするか無効にするかを設定することができる自律切替設定レジスタ121Aと、該当する回線モジュール102をアクト系にするかスタンバイ系にするかを設定する系情報レジスタ122Aと、自律冗長切り替えを実施したかどうかの結果を示す自律切替結果レジスタ123Aと、ヘルスチェックの監視タイマ値を設定する監視タイマ設定レジスタ124Aと、ヘルスチェック実行時に監視タイマをクリアするヘルスチェック監視レジスタ125Aから構成されている。
図2に戻って説明を続ける。ヘルスチェック回路113Aおよびヘルスチェック回路113Bは、制御モジュール101の障害を監視するためのウォッチドッグタイマ(Watch Dog Timer)機能を有する。ここでウォッチドッグタイマ機能は、制御モジュール101内のCPU(Central Processing Unit)131が暴走等によってその実行すべき制御プログラムを正常に実行できなくなったときに、これをリセット状態にするためのものである。
制御モジュール101内の図示しない記憶媒体に格納された前記した制御プログラムは、図1に示した第0〜第7の回線モジュール部1060〜1067のそれぞれがアクト側であるかスタンバイ側であるかに関係なく、予め定めた一定周期でこれらの監視を行うようになっている。また、図3に示した自律切替設定レジスタ121Aがハードウェア自律冗長切替機能を「有効」と設定している場合、ヘルスチェック回路113A、113Bは制御モジュール101による定期的なヘルスチェックのための監視信号118A、118Bの到来を監視する。
制御モジュール101による制御プログラムを用いた第nの回線モジュール102nへの監視が途絶えて、その結果、監視信号118Aが到来しなくなり、ヘルスチェック回路113Aの図示しない監視タイマがオーバフローしたとき、ヘルスチェック回路113Aは状態監視回路115Aへこれを通知する。また、同様に制御モジュール101による第n+1の回線モジュール102n+1の監視が途絶えて、その結果、監視信号118Bが到来しなくなり、ヘルスチェック回路113Bの図示しない監視タイマがオーバフローしたときには、ヘルスチェック回路113Bは同様に状態監視回路115Bへ通知を行うことになる。
障害監視回路114Aおよび障害監視回路114Bは、それぞれ自身の第nの回線モジュール102nあるいは第n+1の回線モジュール102n+1内の障害の発生状態を監視する。そして、第nの回線モジュール102nの内部で障害が発生した場合、障害監視回路114Aはその状態監視回路115Aにこれを通知するようになっている。第n+1の回線モジュール102n+1内で障害が発生した場合には、障害監視回路114Bがその状態監視回路115Bにこれを通知することになる。
状態監視回路115Aは、図3に示した自律切替設定レジスタ121Aがハードウェア自律冗長切替機能を「有効」と設定している場合、ヘルスチェック回路113Aの前記した監視タイマのオーバフロー通知を検出したときに、制御モジュール101に障害が発生したと判断する。そして、これ以後、制御モジュール101に依存しない自律制御モードへシフトする。状態監視回路115A内には、自律制御モードでスタンバイ側の状態監視回路115Bから障害信号が送られてきたときの対応を論理的に記した障害・アクト・スタンバイ論理回路133Aが配置されている。同様に状態監視回路115B内にも障害・アクト・スタンバイ論理回路133Bが配置されている。
図4は、この障害・アクト・スタンバイ論理回路の内容を表わしたものである。障害・アクト・スタンバイ論理回路133Aは、障害発生通知を検出した場合の障害信号とアクト・スタンバイ信号の対応関係を表わしたものである。障害信号は自装置内で障害の発生が検出されたときは信号「1」に、検出されないときには信号「0」に設定するようになっている。また、アクト・スタンバイ信号は自装置がアクト側であるときには信号「1」に、スタンバイ側であるときには信号「0」に設定するようになっている。
アクト側の第nの回線モジュール102nは、この自律制御モード中に自身の障害監視回路114Aから障害発生通知を検出したとき、障害信号117Aを信号「1」にするようになっている。このとき、スタンバイ側の第n+1の回線モジュール102n+1から送られてくる障害信号117Bがモジュール内部での障害の発生を検知していない信号「0」となっている場合、冗長機能レジスタ112Aはスタンバイ系に設定される。そしてこれに伴い、アクト・スタンバイ信号116Aを信号「1」から信号「0」へ切り替える。もし、このときスタンバイ側の第n+1の回線モジュール102n+1の障害信号117Bが信号「1」の場合、第n+1の回線モジュール102n+1の内部でも障害の発生が検知されていていることになる。この場合には、アクト・スタンバイ信号116Aは信号「1」のままであり、冗長切り替えが実行されない。
スタンバイ側の第n+1の回線モジュール102n+1内の状態監視回路115Bも図4に示した障害・アクト・スタンバイ論理回路133Aと同様の障害・アクト・スタンバイ論理回路133Bを備えている。そして、図3に示した自律切替設定レジスタ121Aに対応する自律切替設定レジスタ121B(図示せず)がハードウェア自律冗長切替機能を「有効」と設定している場合、ヘルスチェック回路113Bの前記した監視タイマがオーバフロー通知を検出したときに、制御モジュール101に障害が発生したと判断する。そして、これ以後、第n+1の回線モジュール102n+1も制御モジュール101に依存しない自律制御モードへシフトする。
スタンバイ側の第n+1の回線モジュール102n+1は、この自律制御モード中に自身の障害監視回路114Bから障害発生通知を検出したとき、障害信号117Bを信号「1」にするようになっている。スタンバイ側の第n+1の回線モジュール102n+1で自装置内の障害の発生が検出されていない状態で、すなわち障害信号117Bが信号「0」の場合で、アクト側の第nの回線モジュール102nから送られてくる障害信号117Aが、障害の発生を検知していない信号「0」からそのモジュール内での障害の発生を示す信号「1」に切り替わった場合、冗長機能レジスタ112Bはアクト系に設定される。そしてこれに伴い、スタンバイ側のアクト・スタンバイ信号116Bを信号「0」から信号「1」へ切り替える。
一方、スタンバイ側の第n+1の回線モジュール102n+1の障害信号117Bが信号「1」の場合、第n+1の回線モジュール102n+1の内部でも障害の発生が検知されていていることになる。この場合には、アクト・スタンバイ信号116Bは信号「0」のままであり、冗長切り替えが実行されない。スタンバイ側の障害信号が信号「1」の場合は、スタンバイ側のアクト・スタンバイ信号は信号「0」のままとする。
第nの回線モジュール102nおよび第n+1の回線モジュール102n+1は、以上のような制御を可能にするハードウェアを備えている。
図5は、第nの回線モジュール側の冗長切替回路の一例を具体的に表わしたものである。図2に示した第nの回線モジュール102nの冗長切替回路111Aは、システムの運用開始前に、系情報レジスタ122Aにアクト回線用であることの初期設定を行う。このとき、図2に示した第n+1の回線モジュール102n+1の図示しない系情報レジスタ122Bにはバックアップ(スタンバイ)回線用であることの設定を行うことになる。このようにして、第nの回線モジュール102nと第n+1の回線モジュール102n+1を用いた冗長構成の設定が完了する。
次に、システムの管理者は、ハードウェア自律切り替えを実施するかどうかの設定を行う。ハードウェア自律切り替えを実施する場合には、監視タイマ設定レジスタ124Aと図示しない監視タイマ設定レジスタ124Bとにヘルスチェックの際の監視タイマ値を設定しておき、自律切替設定レジスタ121Aと図示しない自律切替設定レジスタ121Bにそれぞれハードウェア自律切り替えを示す値「1」を設定する。すると、制御モジュール101に障害が発生したとき、第nの回線モジュール102nと第n+1の回線モジュール102n+1は制御モジュール101に依存することなく、自立的にこれらの間での切替制御を行うことができるようになる。
これに対して、自律切替設定レジスタ121Aと図示しない自律切替設定レジスタ121Bにそれぞれハードウェア自律切り替えを行わないことを示す値「0」を設定しておくと、ハードウェア自律切り替えは行われない。この場合、図2に示した制御モジュール101に障害が発生した状態で、第nの回線モジュール102nと第n+1の回線モジュール102n+1は自立的な制御を行うことはなく、これらの間での切替制御が不可能になる。
ところで冗長切替回路111Aでは、自律切替設定レジスタ121Aからハードウェア自律冗長切替機能のありを信号「1」で、なしを信号「0」で表わすハードウェア自律冗長切替機能信号141が出力されるようになっている。また、障害監視回路114Aは障害が発生したときに信号「1」となり、これ以外は信号「0」となる障害発生信号142を出力するようになっている。第1のアンド回路143はこれらハードウェア自律冗長切替機能信号141および障害発生信号142を入力して、障害信号117Aを出力するようになっている。
したがって、障害信号117Aはハードウェア自律冗長切替機能が有効で、かつ第nの回線モジュール102n内のいずれかの箇所で障害が発生した場合としての双方の信号「1」の論理状態のときに、信号「1」となり、これ以外の場合には信号「0」となる。この障害信号117Aは、図5には示していない第n+1の回線モジュール102n+1側の冗長切替回路111Bに送られる。
一方、障害監視回路114Aから出力される障害発生信号142は、インバータ145によってその論理を反転させて第2のアンド回路146の一方の入力端子に入力される。第2のアンド回路146の他方の入力端子には、系情報レジスタ122Aから出力されるアクト系・スタンバイ系設定情報147が入力されるようになっている。アクト系・スタンバイ系設定情報147は、この第nの回線モジュール102nがアクト側であるときに信号「1」となり、スタンバイ側であるときに信号「0」となるようになっている。
第2のアンド回路146の出力は第1の発光ダイオード103Aのアノード側に供給される。したがって、第1の発光ダイオード103Aは、インバータ145の出力が信号「1」となる障害の発生していない状態で、かつこの第nの回線モジュール102nがアクト側にあるときに緑色に点灯し、これ以外の場合に消灯する。
障害発生信号142の出力は、インバータ145を経ることなく、そのまま第2の発光ダイオード104Aのアノード側に供給されるようになっている。このため、第2の発光ダイオード104Aは第nの回線モジュール102nで障害が発生し、データの通信が不可能な状態で赤色に点灯する。第nの回線モジュール102nで障害が発生していない状態では消灯する。
なお、第nの回線モジュール102nで障害が発生しても第n+1の回線モジュール102n+1側で障害が発生しておらず、こちらのモジュールでデータ通信が可能な状態のとき赤色の点灯を行わないと定義することもできる。この場合には、第n+1の回線モジュール102n+1側の冗長切替回路111B側から送られてくる障害信号117Bを加えた形で論理を取って第2の発光ダイオード104A、104Bの点灯制御を行うようにすればよい。
系情報レジスタ122Aから出力されるアクト系・スタンバイ系設定情報147と、第1のアンド回路143から出力される障害時に信号「1」となる障害信号117Aは、第n+1の回線モジュール102n+1側の冗長切替回路111B側から送られてくる障害信号117Bと共に状態監視回路115A内の障害・アクト・スタンバイ論理回路133Aに入力されるようになっている。障害・アクト・スタンバイ論理回路133Aは、図4で示した論理内容にしたがって、アクト側の第nの回線モジュール102nのアクト・スタンバイ信号116Aを第n+1の回線モジュール102n+1の状態監視回路115Bに送信するようになっている。
具体的には、障害信号117Aが信号「1」でスタンバイ側の第n+1の回線モジュール102n+1から送られてくる障害信号117Bが信号「0」の場合、状態監視回路115Aは系情報レジスタ122Aをスタンバイ系に設定し、アクト・スタンバイ信号116Aを「1」から「0」へ切り替える。そして、自律切替結果レジスタ123Aに信号「1」を設定する。
一方、障害信号117Aが信号「1」で第n+1の回線モジュール102n+1側から送られてくる障害信号117Bも信号「1」の場合、切り替えの対象となるスタンバイ側も障害となっている。したがって、この場合にはアクト・スタンバイ信号116Aは信号「1」のままとなり、冗長切り替えは実行されない。
切り替え前にスタンバイ側となっている第n+1の回線モジュール102n+1は、アクト側の第nの回線モジュール102nからのアクト・スタンバイ信号116Aが信号「1」から信号「0」に変更されると、その図示しない系情報レジスタ122Bをアクト系に設定する。そして、障害・アクト・スタンバイ論理回路133B(図2)におけるスタンバイ側の第n+1の回線モジュール102n+1のアクト・スタンバイ信号116Bを信号「0」から信号「1」に切り替えて、その図示しない自律切替結果レジスタ123Bにアクト側としての信号「1」を設定する。その後、第n+1の回線モジュール102n+1側の図示しない第1の発光ダイオード103Bを緑色に点灯させ、ポートの閉塞を解除して、データの疎通を開始することになる。
図5には、第nの回線モジュール102nの残りの2つのレジスタである監視タイマ設定レジスタ124Aおよびヘルスチェック監視レジスタ125Aとヘルスチェック回路113Aの回路構造についても示している。ヘルスチェック回路113A内には単安定マルチバイブレータ149が配置されている。監視タイマ設定レジスタ124Aは、この単安定マルチバイブレータ149の図示しない時定数回路の出力パルスの時間幅を調整するようになっている。
ヘルスチェック回路113Aは、単安定マルチバイブレータ149の出力パルスの時間幅を制御モジュール101の出力する監視信号118Aの繰り返し周期よりも長く設定している。そして、制御モジュール101の監視タイミングで単安定マルチバイブレータ149をリセットすることで、監視が繰り返し正常に行われている状態で出力パルスの論理レベルが常にハイレベルに保持されるようにしている。何らかの原因で制御モジュール101の監視が行われなくなったり、監視信号118Aの出力される間隔が異常に長くなると、単安定マルチバイブレータ149の出力パルスの末端が検出されて、出力がローレベルに変化する。
この状態が出現すると、ヘルスチェック監視レジスタ125に制御モジュール101の異常を示す信号「1」が書き込まれることになる。このとき、自律切替設定レジスタ121Aがハードウェア自律冗長切替機能を有効にしていれば、制御モジュール101の制御と切り離した形で自律的に冗長機能が動作を開始することになる。
図6は、本実施例の回線モジュール装置の全体的な制御の様子を表わしたものである。図2および図5と共に説明する。自律切替設定レジスタ121Aおよび図示しない自律切替設定レジスタ121Bがハードウェア自律冗長切替機能を「有効」すなわち信号「1」と設定している場合(ステップS201:Y)、制御モジュール101に障害が発生すると(ステップS202)、アクト側の第nの回線モジュール102nとスタンバイ側の第n+1の回線モジュール102n+1がその障害の発生をヘルスチェックにより検知して、共に自律制御モードへシフトすることになる(ステップS203)。
この後にアクト側の第nの回線モジュール102nに障害が発生すると(ステップS204)、スタンバイ側である第n+1の回線モジュール102n+1から送られてくる障害信号117Bが信号「0」であれば(ステップS205:Y)、第n+1の回線モジュール102n+1側に系の切り替えが実行される(ステップS206)。そして、この第n+1の回線モジュール102n+1側でデータ通信が再開される結果としてデータの導通が救済される(ステップS207)。
一方、ステップS201でハードウェア自律冗長切替機能が無効で自律切替設定レジスタ121Aおよび自律切替設定レジスタ121Bが信号「0」に設定されている場合(N)、ステップS202で制御モジュール101に障害が発生すると、その時点で第nの回線モジュール102nのデータ通信自体は可能であるが、ステップS204で第nの回線モジュール102nに障害が発生するとデータ通信が停止してしまう(ステップS209)。したがって、ステップS208で回線モジュール装置100と第nの回線モジュール102nの交換が行われるまで、通信が行えなくなる。
同様の状況は、ステップS205でスタンバイ側である第n+1の回線モジュール102n+1も第nの回線モジュール102nと共に障害を発生するというレアケースでも存在し得る。この後者の場合には(ステップS205:N)、切り替え先の系が存在しないので(ステップS210)、データ通信が停止してしまうことになる(ステップS209)。
この後、所定の時点で保守作業者が回線モジュール装置100の故障した第nの回線モジュール102nあるいは制御モジュール101を交換する(ステップS208)。これにより、回線モジュール装置100は再度、最初から保守に関する処理が再開することになる(リターン)。
このように、本実施例の回線モジュール装置100は故障した第nの回線モジュール102nあるいは制御モジュール101の代わりに第n+1の回線モジュール102n+1を可能な範囲で長期間使用することを前提とした装置ではなく、保守作業者が制御モジュールを復旧させるまでの間の救済を可能にする装置として考えられている。したがって、実施例の回線モジュール装置100は回線モジュール102をアクト側からスタンバイ側に切り替えることのみを前提としており、スタンバイ側に切り替わった回線モジュール102を更なる障害の発生でアクト側に切り戻す制御は前提としていない。故障している回線モジュールに切り戻しても意味がないからである。
なお、以上説明した実施例で保守作業者による交換等の措置によって制御モジュール110が復旧したときには、図1に示した第0〜第15の回線モジュール1020〜10215に対するヘルスチェック機能を起動させる。そして、第0〜第15の回線モジュール1020〜10215の障害状態を確認すると共に、自律制御設定を実施した回線モジュール102についてはの自律切替状態を確認する。そして、第0〜第15の回線モジュール1020〜10215の少なくとも一部で自律切り替えが実施されていた場合には、自律切替設定レジスタを再設定することになる。
本実施例によれば、ステップS202で制御モジュール101に障害が発生した後も、ペアとなった第nの回線モジュール102nと第n+1の回線モジュール102n+1の双方に障害が発生しない限り通信を継続して確保することができる。したがって、従来よりも通信システムが安定するという利点がある。
<発明の変形例>
図7は、本発明の変形例として2つの制御モジュールを設けた例を示したものである。この変形例では初期的にアクト側の第0の制御モジュール1010と初期的にスタンバイ側の第1の制御モジュール1011がBWB等の接続手段301で接続されている。第0の制御モジュール1010と第1の制御モジュール1011は基本的に同一の構成となっている。そこで、第0の制御モジュール1010について説明を行い、これらを構成する回路装置の末尾に付けた数字「0」を、第1の制御モジュール1011では数字「1」と読み替えるものとする。
第0の制御モジュール1010は、第1の制御モジュール1011との自立的な切り替えを可能にする第0の冗長切替回路1110とそれ以外の回路部分(図示せず)を制御するCPU3020を備えている。第0の冗長切替回路1110は、冗長機能の実現のための複数のレジスタを備えた冗長機能レジスタ1120と、CPU3010のヘルスチェックを行うヘルスチェック回路1130と、第0の制御モジュール1010内の障害の発生を監視する障害監視回路1140およびこれらと接続された状態監視回路1150を備えている。状態監視回路1150は、接続手段301によってアクト・スタンバイ信号1160および障害信号1170を状態監視回路1151に送出するようになっており、状態監視回路1151からアクト・スタンバイ信号1161および障害信号1171を受け取るようになっている。
第0の制御モジュール1010は、アクト側として図1に示した第0〜第15の回線モジュール1020〜10215の通信制御やシステム監視を行うようになっている。また、これと共にCPU3010は一定時間間隔で第0の冗長切替回路1110に対して検査信号3040を送出するようになっている。
ヘルスチェック回路1130は、この検査信号3040を入力し、これによりウォッチドッグタイマ機能を働かせるようになっている。そして、CPU3010が何らかの原因で検査信号3040を送出して来なくなったり、その送出の間隔が異常に長くなった場合には、図3に示したヘルスチェック監視レジスタ125Aに相当する図示しないヘルスチェック監視レジスタ1250にCPU3010の異常を示す信号「1」が書き込まれることになる。このとき、図示しない自律切替設定レジスタ1210が制御モジュール自律冗長切替機能を有効にしていれば、第0の制御モジュール1010と第1の制御モジュール1011との間での自律的な冗長機能が動作を開始することになる。
状態監視回路1150の動作自体については、先の実施例と基本的に同一であるので、これらの説明を省略する。
この変形例によれば、第0の制御モジュール1010と第1の制御モジュール1011がこれらを監視する回路装置を必要とせずに自律的に障害時の切替制御を行うことができる。したがって、これにより通信システムの信頼性を向上させることができる。
この場合にも二重化された制御モジュール101の双方が障害を発生させたとき、本発明を用いることにより、更に通信システムの安定性を確保することができる。また、一般には制御モジュール101を二重化すると、通信システム全体でかなりのコストアップになるが、本発明を実施すれば制御モジュール101自体の構成を変更することなく冗長切り替えが実現する。したがって、通信システム全体のコストダウンに効果がある。
また、実施例ではハードウェアのみを用いて回線モジュール102同士の自立的な切り替えを実現したが、回線モジュール102のすべてがハードウェアで構成される必要はない。たとえば回線モジュールのような回路部分あるいは回線モジュール102内でもCPUを使用したソフトウェア制御で機能的に実現可能な回路部分を用いて回線モジュール102同士の自立的な切り替えを実現するようにしてもよい。
このようなソフトウェアを用いた制御の場合には、たとえばソフトウェア上でアクト状態とスタンバイ状態を更新後、自律制御モードで通常のソフトウェア制御モードに切り替えるような制御が行われてもよい。
更に実施例および変形例では接続手段としてBWBを使用したが、装置によっては有線または無線によるあらゆる接続手段が可能であることは当然である。また、実施例では制御モジュール101が出力する監視信号118を用いてヘルスチェックを行い、変形例では検査信号304を用いて同様のチェックを行ったが、これらに限定されるものではない。すなわち、繰り返し出力されるその他の制御信号を用いて同様に制御モジュール101側の健全性をチェックするようにしてもよい。
本発明の一実施例における回線モジュール装置の外観を表わした正面図である。 本実施例の回線モジュール装置の回線モジュール部と制御モジュールの関係を表わしたブロック図である。 本実施例の冗長機能レジスタの構成を示した説明図である。 本実施例の障害・アクト・スタンバイ論理回路の内容を表わした説明図である。 本実施例で第nの回線モジュール側の冗長切替回路の一例を具体的に表わしたブロック図である。 本実施例の回線モジュール装置の全体的な制御の様子を表わした説明図である。 本発明の変形例として2つの制御モジュールを設けた回線モジュール装置の要部を表わしたブロック図である。
符号の説明
100 回線モジュール装置
101 制御モジュール(上位装置)
102 回線モジュール(構成装置)
105、301 接続手段
112 冗長機能レジスタ
113 ヘルスチェック回路
114 障害監視回路
115 状態監視回路
118 監視信号
121 自律切替設定レジスタ
122 系情報レジスタ
123 自律切替結果レジスタ
124 監視タイマ設定レジスタ
125 ヘルスチェック監視レジスタ
302 CPU
304 検査信号

Claims (6)

  1. 自装置内部の障害の発生を検知する障害検知手段と、
    前記障害検知手段の検知状態を特定の系の運用について自装置と共に装置間の切替制御によって冗長構成をとる予め定めた他方の構成装置に通知する自装置障害有無通知手段と、
    自装置が前記他方の構成装置に代わって前記特定の系の運用状態にあるか否かを記憶する系運用状態記憶手段と、
    この系運用状態記憶手段に前記特定の系の運用状態にあると記憶している状態でのみ前記特定の系の運用を行う系運用手段と、
    前記系運用状態記憶手段に運用状態にあると記憶されていない状態で、前記他方の構成装置からその装置内部の障害の発生の通知を受けたとき前記障害検知手段が自装置の障害を検知していない条件で前記系運用状態記憶手段の記憶内容を運用状態に変更する系運用状態記憶変更手段
    とを具備することを特徴とする冗長切替装置。
  2. 自装置内部の障害の発生を検知する障害検知手段と、前記障害検知手段の検知状態を特定の系の運用について自装置と共に装置間の切替制御によって冗長構成をとる予め定めた他方の構成装置に通知する自装置障害有無通知手段と、自装置が前記他方の構成装置に代わって前記特定の系の運用状態にあるか否かを記憶する系運用状態記憶手段と、前記系運用状態記憶手段に運用状態にあると記憶されていない状態で、前記他方の構成装置からその装置内部の障害の発生の通知を受けたとき前記障害検知手段が自装置の障害を検知していない条件で前記系運用状態記憶手段の記憶内容を運用状態に変更する系運用状態記憶変更手段と、所定の時間間隔を置いて特定の制御信号の供給を受ける制御信号受信手段と、この制御信号受信手段による前記特定の制御信号の受信が前記所定の時間間隔よりも長い時間滞ったときには、前記系運用状態記憶手段に前記特定の系の運用状態にあると記憶している状態でのみ前記特定の系の運用を行う系運用手段とをそれぞれ備え、前記特定の系の運用で冗長構成となった一対の構成装置と、
    これら一対の構成装置のいずれを前記特定の系の運用に当てるかの指示を送出する運用指示送出手段と、この運用指示送出手段による運用指示の送出が可能な状態で前記一対の装置のそれぞれに対して前記特定の制御信号の送出を継続する制御信号送出手段とを備えた上位装置
    とを具備することを特徴とする冗長切替システム。
  3. 前記一対の構成装置は、それぞれ前記上位装置から送られてくる前記いずれを前記特定の系の運用に当てるかの指示を受信する指示受信手段を具備することを特徴とする請求項2記載の冗長切替システム。
  4. 前記上位装置は請求項1記載の冗長切替装置としての構成を有していることを特徴とする請求項2記載の冗長切替システム。
  5. 前記一対の構成装置は、前記制御信号受信手段による前記特定の制御信号の受信が前記所定の時間間隔よりも長い時間滞ったときに前記系運用手段の運用の可否を事前に設定しておく自律切替可否設定手段を具備することを特徴とする請求項2記載の冗長切替システム。
  6. 特定の系の運用について自装置と共に装置間の切替制御によって冗長構成をとる予め定めた他方の構成装置が存在する装置のコンピュータに、
    自装置内部の障害の発生を検知する障害検知処理と、
    前記障害検知処理の結果としての検知状態を前記予め定めた他方の構成装置に通知する自装置障害有無通知処理と、
    自装置が前記予め定めた他方の構成装置に代わって前記特定の系の運用状態にあるか否かの記憶を保持する系運用状態記憶処理と、
    この系運用状態記憶処理で前記特定の系の運用状態にあると記憶している状態でのみ前記特定の系の運用を行う系運用処理と、
    前記系運用状態記憶処理で運用状態にあると記憶していない状態で、前記予め定めた他方の構成装置からその装置内部の障害の発生の通知を受けたとき前記障害検知処理で自装置の障害を検知していない条件で前記系運用状態記憶処理による記憶内容を運用状態に変更する系運用状態記憶変更処理
    とを実行させることを特徴とする冗長切替制御プログラム。
JP2007036637A 2007-02-16 2007-02-16 冗長切替装置、冗長切替システムおよび冗長切替制御プログラム Pending JP2008205599A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007036637A JP2008205599A (ja) 2007-02-16 2007-02-16 冗長切替装置、冗長切替システムおよび冗長切替制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007036637A JP2008205599A (ja) 2007-02-16 2007-02-16 冗長切替装置、冗長切替システムおよび冗長切替制御プログラム

Publications (1)

Publication Number Publication Date
JP2008205599A true JP2008205599A (ja) 2008-09-04

Family

ID=39782664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007036637A Pending JP2008205599A (ja) 2007-02-16 2007-02-16 冗長切替装置、冗長切替システムおよび冗長切替制御プログラム

Country Status (1)

Country Link
JP (1) JP2008205599A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113360325A (zh) * 2021-06-03 2021-09-07 成都锐能科技有限公司 一种故障处理方法、装置及其系统
CN114257498A (zh) * 2020-09-22 2022-03-29 中车株洲电力机车研究所有限公司 通信系统、用于检测通信系统冗余失效的方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07202988A (ja) * 1993-12-27 1995-08-04 Nec Corp 自動系選択方法およびその通信システム
JP2003218744A (ja) * 2002-01-28 2003-07-31 Nec Commun Syst Ltd 二重化伝送装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07202988A (ja) * 1993-12-27 1995-08-04 Nec Corp 自動系選択方法およびその通信システム
JP2003218744A (ja) * 2002-01-28 2003-07-31 Nec Commun Syst Ltd 二重化伝送装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114257498A (zh) * 2020-09-22 2022-03-29 中车株洲电力机车研究所有限公司 通信系统、用于检测通信系统冗余失效的方法及装置
CN114257498B (zh) * 2020-09-22 2024-04-19 中车株洲电力机车研究所有限公司 通信系统、用于检测通信系统冗余失效的方法及装置
CN113360325A (zh) * 2021-06-03 2021-09-07 成都锐能科技有限公司 一种故障处理方法、装置及其系统

Similar Documents

Publication Publication Date Title
US6202170B1 (en) Equipment protection system
AU685497B2 (en) Method and apparatus for fault tolerant connection of a computing system to local area networks
US20020152425A1 (en) Distributed restart in a multiple processor system
JP2006260259A (ja) 情報処理システムの制御方法、情報処理システム、情報処理システムの制御プログラム、冗長構成制御装置
JP2011048534A (ja) フォールトトレラントコンピュータ及び電源制御方法
US20140298076A1 (en) Processing apparatus, recording medium storing processing program, and processing method
KR100936203B1 (ko) 데이터 처리 장치, 모드 관리 장치 및 모드 관리 방법
JP2008205599A (ja) 冗長切替装置、冗長切替システムおよび冗長切替制御プログラム
US7627774B2 (en) Redundant manager modules to perform management tasks with respect to an interconnect structure and power supplies
US10621024B2 (en) Signal pairing for module expansion of a failsafe computing system
JP2004355446A (ja) クラスタシステム及びその制御方法
JP3662444B2 (ja) プログラマブルコントローラおよび切替信号生成装置
US6832331B1 (en) Fault tolerant mastership system and method
JP2002024050A (ja) コントローラシステム
JP6654662B2 (ja) サーバ装置およびサーバシステム
JP2006172050A (ja) ホットスタンバイ式2重化システム
JP2010136038A (ja) 伝送装置及び冗長構成部の系切替え方法
JP2013254333A (ja) 多重系制御システム及びその制御方法
JP2000020336A (ja) 二重化通信システム
JPH08185329A (ja) データ処理装置
KR0152229B1 (ko) 시스팀의 이중화를 위한 저가형 이중화 노드
JPH11168502A (ja) 通信障害処理装置及び方法
JP2012150555A (ja) 監視システム
JP2606144B2 (ja) 二重化装置
KR20000059718A (ko) 피엘씨 이중화 시스템의 논스톱 운전방법 및 회로

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120116

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120223