JP3611894B2 - 二重化構成をもつシステム制御装置 - Google Patents

二重化構成をもつシステム制御装置 Download PDF

Info

Publication number
JP3611894B2
JP3611894B2 JP07282895A JP7282895A JP3611894B2 JP 3611894 B2 JP3611894 B2 JP 3611894B2 JP 07282895 A JP07282895 A JP 07282895A JP 7282895 A JP7282895 A JP 7282895A JP 3611894 B2 JP3611894 B2 JP 3611894B2
Authority
JP
Japan
Prior art keywords
control device
slave
master
processing
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07282895A
Other languages
English (en)
Other versions
JPH08272753A (ja
Inventor
浩 薬師寺
智子 大▲崎▼
玲子 佐藤
正人 岩脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP07282895A priority Critical patent/JP3611894B2/ja
Priority to US08/588,006 priority patent/US5870301A/en
Publication of JPH08272753A publication Critical patent/JPH08272753A/ja
Application granted granted Critical
Publication of JP3611894B2 publication Critical patent/JP3611894B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/1637Error detection by comparing the output of redundant processing systems using additional compare functionality in one or some but not all of the redundant processing components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1675Temporal synchronisation or re-synchronisation of redundant processing components
    • G06F11/1687Temporal synchronisation or re-synchronisation of redundant processing components at event level, e.g. by interrupt or result of polling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/165Error detection by comparing the output of redundant processing systems with continued operation after detection of the error
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、高信頼性の計算機システムの制御、状態監視、及び保守をオンラインで行うシステム制御装置に関し、特に二重化構成によりシステム制御装置の停止で計算機システムの停止を引き起さないようにした二重化構成をもつシステム制御装置に関する。
【0002】
【発明が解決しようとする課題】
従来、大型の計算機システムにあっては、計算機システムの電源、構成機器の起動停止の制御、状態監視、更には保守をオンラインで行うためのシステム制御装置が設けられている。
また近年にあっては、計算機機能を並列多重化してシステム停止を回避できる高信頼性の計算機システムの開発が進められている。このような高信頼性の計算機システムに使用するシステム制御装置についても、システム制御装置の停止によって計算機システムの停止を引き起こさないため、システム制御装置を二重化構成とすることが考えられている。
【0003】
従来のシステム制御装置の二重化構成は、一方のシステム制御装置を常用装置として動作させ、他方のシステム制御装置を予備装置として待機させておき、常用装置に異常が起きた場合、予備装置に切り替えて処理を引き継ぐようにしている。
【0004】
【発明が解決しようとする課題】
しかしながら、このような常用装置と予備装置によって二重化されたシステム制御装置にあっては、常用装置に異常が起きた場合、予備装置を起動するためには異常を起した常用装置が保持している計算機システムの制御、状態監視及び保守に関する各種の情報をそのまま引き継がなければならず、常用装置が異常停止した後では各種の情報の引き渡しが保証できず、結局は計算機システムを一旦停止し、予備装置を使用して最初から計算機システムを立ち上げなければならない。
【0005】
このような問題を解決する方法として、2台のシステム制御装置を並列に動作させて全く同じ処理を行わせる二重化構成の方法がある。この場合、一方のシステム制御装置が停止しても、他方のシステム制御装置が正常に動作しているため、計算機システムの停止を引き起こすことはない。
しかしながら、同時に並列動作している2台のシステム制御装置で、計算機システムの制御、状態監視、及び保守に関する情報に食い違いが出た場合、どちらの情報を元に計算機システムの制御、状態監視、保守等を行って良いか判らなくなる。この場合には、それまで主にどちらの装置の情報で動いていたかを判断し、正しいと思われる情報を採用することも考えられるが、正しいか否かは五分五分であり、これでは二重化構成による信頼性は十分に保証できない問題がある。
【0006】
本発明は、このような問題点に鑑みてなされたもので、同時に並列的に動作される2台の装置間での情報の等価性を保証すると共に情報が食い違った場合にも適切に対応でる信頼性の高い二重化構成をもつシステム制御装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
図1は本発明の原理図である。まず本発明は、図1(A)のように、計算機システム14に対し2台のシステム制御装置10,12を設ける。システム制御装置10は、マスタ制御装置10となり、計算機システム14の制御、状態監視、及び保守を司る、システム制御装置12はスレーブ制御装置となり、マスタ制御装置10と並行して動作し、マスタ制御装置10との情報の等価性を保ちながら待機系として動作する。
【0008】
マスタ制御装置10とスレーブ制御装置12の間は情報の等価性の維持に使用する第1バス20を介して接続される。またマスタ制御装置10とスレーブ制御装置12の各々は、専用のバス16,18を介して計算機システム14と個別に接続される。
マスタ制御装置10及びスレーブ制御装置12として動作するシステム制御装置の各々は、装置の動作状態を決める状態遷移処理部を備える。この状態遷移処理部は、図1(B)のように、少なくともイニシャライズ、マスタ、スレーブ、及びホルトの各状態を持つ。まず電源投入直後のイニシャライズ状態でマスタ実装位置を認識した場合にマスタ状態へ遷移する。また電源投入直後のイニシャライズ状態でスレーブ実装位置を認識した場合には、他の装置のマスタ状態への遷移を確認した後にスレーブ状態へ遷移する。
【0009】
更に、状態遷移処理部は、自己の異常を認識した際には自分自身をホルト状態に遷移し、他の装置の異常を認識した場合にはホルトを指示して他の装置をホルト状態に遷移させ、更にホルト指示を行った他の装置がマスタ装置であった場合は、自分自身をマスタ状態に遷移させる。
マスタ制御装置10及びスレーブ制御装置12として動作するシステム制御装置の各々には、更に、情報の等価性を保証するための情報送受信部が設けられる。この情報送受信部は、状態遷移処理部によりスレーブ状態に遷移した際に、マスタ状態に遷移している他の装置に等価性を保証する情報の転送を要求し、一方、マスタ状態に遷移した際には、他の装置からの等価性を保つ情報の転送要求に応じて該当する情報を転送する。
【0010】
また各装置には、更新情報転送部が設けられ、状態遷移処理部によりマスタ状態に遷移した後に、等価性を保証する情報の更新を認識した場合、スレーブ状態に遷移している他の装置に更新情報を転送する。
更に各装置には、等価性チェック部が設けられ、状態遷移処理部によりマスタ状態に遷移した場合、一定時間毎にスレーブ状態に遷移している他の装置と自己の情報とを比較して等価性を定期的にチェックする。このとき、比較した情報が一定時間以上異なる場合には、スレーブ状態に遷移している他の装置にホルトを指示してホルトさせる。
【0011】
また本発明のマスタ制御装置10及びスレーブ制御装置12の各々は、計算機システムからのオペレーション指令を受けた際に、要求されたオペレーションに対応する処理を実行するオペレーション処理部を備える。
計算機システム14からマスタ制御装置10にオペレーション指令を発行した場合、オペレーション指令を受信したマスタ制御装置10は、自己のオペレーション処理部およびスレーブ制御装置12のオペレーション処理部を起動し、次に自己のオペレーション処理の実行を開始すると同時にスレーブ制御装置12にオペレーション指令のパラメータデータを送信してオペレーション処理の開始を指示して処理の二重化を行う。
【0012】
また計算機システム14からスレーブ制御装置12にオペレーション指令を発行した場合、オペレーション指令を受信したスレーブ制御装置12は、自己のオペレーション処理部およびマスタ制御装置10のオペレーション処理部を起動し、次にマスタ制御装置10にオペレーション指令のパラメータデータを送信する。マスタ制御装置10はパラメータデータの受信終了後に自己のオペレーション処理を開始すると同時にスレーブ制御装置12にオペレーション処理の開始を指示して処理の二重化を行う。
【0013】
マスタ制御装置10はオペレーション指令を格納するキュー15を有する。マスタ制御装置10のオペレーション処理部は、計算機システム14から直接に又はスレーブ制御装置12を経由してオペレーション指令を受けた際に、キュー15に格納した後にパラメータデータのスレーブ制御装置12との間の転送を行い、転送終了後にキュー15を参照して受信したオペレーション指令が先頭にキューイングされている場合に、自己のオペレーション処理を開始すると同時にスレーブ制御装置12にオペレーション処理の開始を指示する。
【0014】
マスタ制御装置10およびスレーブ制御装置12で受信したオペレーションを実行した場合、スレーブ制御装置12はオペレーションの実行を終了するとマスタ制御装置10にオペレーションの完了を通知する。マスタ制御装置10は自己のオペレーションが終了し且つスレーブ制御装置12からオペレーションの完了通知を受信した際に、両装置のオペレーションの実行完了を認識してキュー15をクリアし、更に計算機システム14にオペレーションの処理完了を通知する。
【0015】
マスタ制御装置10は、受信したオペレーション指令をキュー15に格納する際に、現在、同じオペレーションが実行中か否か判断し、同じオペレーションを実行中であれば、オペレーションの二重発行と判断して受信したオペレーションを実行せずに計算機システム14に二重発行を通知する。
電源、機器状態等の状態監視に基づき計算機システム14に通知すべき事象が発生した場合、マスタ制御装置10及びスレーブ制御装置12の両方で発生事象に対する処理を行う。スレーブ制御装置12は処理が終了したらマスタ制御装置10に事象の発生を通知し、マスタ制御装置10は自己の処理が終了し且つスレーブ制御装置12からの事象の発生通知を受信した際に、両装置10,12で発生事象に対する処理が終了したと認識して計算機システム14に事象の発生を通知する。
【0016】
マスタ制御装置10は自己のオペレーション処理を終了した際に、スレーブ制御装置12からのオペレーション処理の終了通知を受け取ってない場合は、タイマを起動して時間を監視する。一定の時間を過ぎてもスレーブ制御装置12から処理の終了通知がない場合、スレーブ制御装置12の異常と判断してホルト指示によりホルトさせ、マスタ制御装置10で自己の処理を正常終了と見做してキュー15に格納されたオペレーションをクリアし、更に計算機システム14に処理の終了を通知する。
【0017】
事象発生の処理についても同様に、マスタ制御装置10は自己の処理を終了した際に、スレーブ制御装置12からの事象発生の通知を受け取ってない場合はタイマを起動して時間を監視し、一定の時間を過ぎてもスレーブ制御装置12から処理の事象の発生通知がない場合、スレーブ制御装置12の異常と判断してホルト指示によりホルトさせ、マスタ制御装置10で自己の処理を正常と見做して計算機システム14に事象の発生を通知する。
【0018】
またマスタ制御装置10は自己のオペレーション処理を終了し、且つスレーブ制御装置12からのオペレーション処理の終了通知を受け取った際に、両者の処理情報を比較し、不一致の場合にスレーブ制御装置12の異常と判断してホルト指示によりホルトさせ、マスタ制御装置10で自己の処理を正常終了と見做してキュー15に格納されたオペレーションをクリアし、更に計算機システム14に処理の終了を通知する。
【0019】
また事象の発生処理についても同様に、マスタ制御装置10は自己の処理を終了し、且つスレーブ制御装置12からの事象発生の通知を受け取った際に、両者の事象発生通知を比較し、不一致の場合にスレーブ制御装置12の異常と判断してホルト指示によりホルトさせ、マスタ制御装置10で自己の処理を正常と見做して計算機システム14に事象の発生を通知する。
【0020】
スレーブ制御装置12からマスタ制御装置10へオペレーション指令に伴うパラメータデータの転送中に異常を検出した場合、スレーブ制御装置12は自分自身をホルトし、マスタ制御装置14はキューに格納したオペレーションを破棄して終了させる。
マスタ制御装置10はオペレーション処理を実行中に、同時にオペレーション処理を実行しているスレーブ制御装置12が状態異常となり、ホルト状態に移行したことを認識した場合、自己の処理を正常終了と見做してキュー15に格納されたオペレーションをクリアし、更に計算機システム14に処理の終了を通知する。
【0021】
マスタ制御装置10は発生事象の処理中に、同時に発生事象の処理を実行しているスレーブ制御装置12が状態異常となり、ホルト状態に移行したことを認識した場合、自己の処理を正常と見做して計算機システム14に事象の発生を通知する。
更に、スレーブ制御装置12が処理の実行中に、マスタ制御装置10が状態異常となり、ホルト状態に移行したことを検出した場合、現在実行中の処理を破棄した後、自身の状態をスレーブ状態からマスタ状態に遷移させる。
【0022】
【作用】
このような本発明の二重化構成をもつシステム制御装置は、マスタ制御装置における更新情報のスレーブ制御装置への転送と、スレーブ制御装置との間の定期的な等価性のチェックにより、計算機システムの制御、状態、保守をオンラインで行っている2台の装置の内部情報の食い違いをなくし、等価性を保証することができる。
【0023】
また、マスタ制御装置で一定時間以上、情報食い違いを認識した場合は、スレーブ制御装置をホルトさせ、マスタ制御装置の情報を有効とする。マスタ制御装置の異常については自分自身でホルトし、このときスレーブ制御装置がマスタ制御装置のホルトを認識してマスタ制御装置に状態を遷移して処理を引き継ぐ。この場合、両者の情報の等価性は保証されているため、マスタ制御装置のホルトによる引き継ぎは、外部に全く影響せず、計算機システムの停止を引き起すことはない。
【0024】
また本発明では、2台のシステム制御装置の内のマスタ制御装置を、計算機システムからのオペレーション処理の対象と位置付ける。そして、計算機システムがオペレーションを発行した場合に、マスタ制御装置とスレーブ制御装置の両方でオペレーションを実行し、オペレーションの実行が終了したならば、マスタ制御装置は、スレーブ制御装置の処理終了との同期を取り、マスタ処理装置の結果を基にオペレーションの実行結果を判断する。この点は、電源、機器状態等の状態監視における非同期的な事象の発生の処理についても同様である。
【0025】
このように2台のシステム制御装置でオペレーションを実行することにより、2台のシステム制御装置の内部情報の等価性を実現できる。また、マスタ制御装置を計算機システムによるオペレーション処理の対象と位置付けすることで、情報の食い違いが起きても、マスタ制御装置の情報を有効としてシステムの制御、状態監視、保守が保証される。
【0026】
【実施例】
<目 次>
1.動作環境と装置構成
2.システム制御装置の機能構成
3.マスタとスレーブの設定および制御
4.オペレーションの実行
5.キューイングを伴うオペレーションの実行
6.状態監視における事象発生処理
7.異常検出処理
1.動作環境と装置構成
図2は本発明の二重化構成をもつシステム制御装置を備えた計算機システムのブロック図である。図2において、この計算機システムにあっては、筐体11の中にプロセッサモジュール14−1,14−2を設けることで計算機システムを構成している。計算機システムを構成するプロセッサモジュール14−1,14−2に対しては、システム制御モジュール22−1,22−2が設けられる。
【0027】
システム制御モジュール22−1の中にマスタ制御装置として動作するシステム制御装置10を設け、またシステム制御モジュール22−2の中にスレーブ制御装置として動作するシステム制御装置12を設けている。ここでシステム制御装置10は、マスタとして動作するためのスロット番号#00に接続され、またシステム制御装置12はスレーブとして動作するためのスロット番号#10に接続されている。
【0028】
計算機システムを構成するプロセッサモジュール14−1,14−2は、2本のシステムバス16−1,18−1を介して接続される。システムバス16−1,18−1にはシステムブリッジ回路部26−1,26−2が設けられ、他の筐体のシステムバスと接続されている。プロセッサモジュール14−1,14−2のそれぞれには複数のプロセッサが収納され、各プロセッサはキャッシュ機構を備えており、モジュール内の複数のプロセッサでそれぞれ1つの主記憶をもっている。
【0029】
システム制御モジュール22−1に設けたシステム制御装置10は、バス16をブリッジ回路部24−1に接続し、ブリッジ回路部24−1を介してシステムバス16−1に接続している。またシステム制御モジュール22−2のシステム制御装置12も、バス18によりブリッジ回路部24−2を介してシステムバス18−1に接続している。
【0030】
このためシステム制御装置10,12は、それぞれシステムバス16−1,18−1及びバス16,18を介してプロセッサモジュール14−1または14−2から必要なオペレーション指令を受信して必要な制御処理を行うことができる。プロセッサモジュール14−1,14−2によるオペレーション指令は、スロット番号#00に接続されたマスタとしてのシステム制御装置10に対し基本的に行われる。もし、マスタ側のシステム制御装置10がビジー状態にあれば、システムバス18−1を使用してスレーブ側のシステム制御装置12にオペレーション指令を発行することになる。
【0031】
システム制御装置10,12の間は専用のバス20で接続されている。このバス20は、システム制御装置10,12で内部に保持している計算機システムの制御、状態監視および保守に必要な各種の情報の等価性を保証するための情報伝送に使用される。
更にシステム制御装置10,12には、メンテナンスバス30が接続され、上位装置からの保守に関する指令を直接受けることができる。またシステム制御装置10,12には、ブリッジ回路部24−1,24−2を介して個別に入出力バス32−1,32−2が接続されており、外部の入出力装置との間で必要な情報の入出力処理ができるようにしている。
【0032】
図3は、図2の2台のシステム制御装置10,12を取り出して、両者のインタフェースを具体的に示している。まずシステム制御装置10は、バス16,18およびシステムバス16−1,18−1を介して計算機システムとしてのプロセッサモジュール14−1,14−2と接続されており、プロセッサモジュール14−1,14−2からのオペレーション指令により、筐体11内での電源投入制御、電源切断制御および異常監視を行う。
【0033】
またシステム制御装置10,12は、電源インタフェースバス38−1,38−2により電源部40−1,40−2を接続しており、これによって筐体間での電源投入制御、電源切断制御および異常監視を行う。マスタとして動作するシステム制御装置10は、デバイスバス46によりコンソール48−1を接続しており、これによりデバックや障害調査を行うことができる。スレーブとして動作するシステム制御装置12側については、コンソール48−2を設けているが、デバイスバスによる接続は行われていない。
【0034】
またシステム制御装置10,12を接続した入出力バス32−1,32−2はアダプタ54に接続され、アダプタを介して外部の入出力装置56−1〜56−3を接続している。この入出力バス32の接続で、外付けした入出力装置56−1〜56−3の電源制御および監視を行うことになる。
更に、システム制御装置10,12は外部警報用のインタフェースバス58を接続しており、システム制御装置10,12で制御、状態監視および保守における異常を検出した場合には、外部の警報装置に警報信号を送出して、警報表示動作を行わせるようにしている。
【0035】
システム制御装置10,12間には内部情報の等価性を保証する情報のやり取りのため、専用のバス20−1,20−2が設けられている。この実施例にあっては、システム制御装置10から12に情報を送るバス20−1と、システム制御装置12から10に情報を送るバス20−2を個別に設けているが、単一の双方向バスであってもよい。
【0036】
またシステム制御装置10,12は、メンテナンスバス30−1,30−2に接続される。メンテナンスバス30−1側には、上位操作ユニット42−1と操作パネル44が接続される。メンテナンスバス30−2側には、上位操作ユニット42−2が接続される。このメンテナンスバス30−1,30−2によって、システム制御装置10,12のデバック機能制御、パネル制御、上位操作ユニット42−1,42−2からの操作指令に基づく各種の処理制御を行う。
【0037】
更にシステム制御装置10,12からは、他の筐体との間を接続する筐体間インタフェースバス36−1,36−2,36−3を設けている。この筐体間インタフェースバス36−1〜36−3によって、システム制御装置10,12は筐体間での電源投入制御、電源切断制御および異常監視を行うことができる。
この図3に示すシステム制御装置10,12に対する各種のインタフェースを制御することにより、例えば次の7つの機能が実現できる。
【0038】
▲1▼筐体内の電源投入と電源切断および異常監視の機能
▲2▼筐体間の電源投入制御、電源切断制御および異常監視の機能
▲3▼デバック機能と障害調査機能
▲4▼保守支援機能
▲5▼オペレータコールのための外部系統制御機能
▲6▼保守用ホスト等からの電源制御機能
▲7▼電源投入時刻、切断時刻等の電源カレンダを行うタイマの制御機能
勿論、システム制御装置10,12の機能は、これ以外に必要に応じて適宜の制御、状態監視および保守等の制御機能をもたせることができる。
2.システム制御装置の機能構成
図4は、図3のシステム制御装置10側を例にとって他のシステム制御装置12との間で内部情報の等価性を保証するために必要な機能を示している。
【0039】
図4において、システム制御装置10にはプロセッサ60と内部メモリ82が設けられている。プロセッサ60には実装位置認識部62が設けられる。実装位置認識部62は、システム制御装置10を図2のように筐体11内に実装すると、その実装位置で決まるバスのスロット番号信号E1を取り込んでスロット番号#00を認識する。
【0040】
この実施例にあっては、スロット番号#00はマスタ制御装置としての実装位置を表わしている。実装位置認識部62で認識されたスロット番号信号E1は、状態認識部64に与えられる。状態認識部64に対しては、内部ステータス設定部66、状態遷移部68が設けられている。状態遷移部68は、図5の状態遷移図に示すように、イニシャライズ200、マスタ210、スレーブ220、状態制御230およびホルト240の4つの状態をもっている。
また図4のプロセッサ60にはイベント処理部70が設けられ、監視状態にある周辺装置における事象の変化信号E4を取り込み、内部メモリ82の状態信号を更新する。また異常検出部72が設けられ、システム制御装置12からの他系異常信号E5を認識すると、ホルト指示部74を起動して、システム制御装置12側にホルト指示信号E6を出力する。また異常検出部72は、システム制御装置10自身の異常を検出すると、プロセッサ60自体をホルト、即ち図5のホルト240に遷移させる。
【0041】
またプロセッサ60にはデータ送受信部75が設けられ、他のシステム制御装置12との間で内部情報の等価性を保つために必要な各種の送受信データE7のやり取りを行う。データ送受信部75で得られた等価性を保つための各種の情報は、内部メモリ82の中に割り当てられた等価性情報格納部84に格納される。更にプロセッサ60には、更新情報転送部76と等価性チェック部78が設けられる。等価性チェック部78は、内部メモリ82の等価性情報格納部84に状態検出、制御、保守等の各種の処理により格納情報の更新があったとき、この情報更新を認識し、更新情報転送部76により更新情報信号E8をシステム制御装置12に送る。送られたデータはシステム制御装置12の等価性情報格納部84に格納される。
【0042】
等価性チェック部78は更に、一定周期ごとにマスタとしてのシステム制御装置10とスレーブとしてのシステム制御装置12の間の格納情報の等価性のチェックを行う。この等価性のチェックは、更新情報転送装置76を使用してスレーブ側のシステム制御装置12が転送した等価性情報格納部84の情報と、各情報に対応した自己の情報との一致、不一致の比較を行う。もし不一致な情報があれば、ホルト指示部74によりホルト指示信号E6をスレーブ側のシステム制御装置12に送ってホルトさせる。
【0043】
更にプロセッサ60にはオペレーション処理部80が設けられ、図2の計算機システムを構成するプロセッサモジュール14−1,14−2が発行したオペレーションコマンド信号E9を受信し、受信したオペレーションの処理を実行する。このオペレーション処理部80に対応して、内部メモリ82にはキュー15が設けられており、キュー15が一杯になるまで連続的にオペレーションコマンドを受け付けることができる。オペレーション処理部80は、キュー15に複数のオペレーションコマンドの受付けがあるときには、時間的に最も旧い最初のオペレーションコマンドを取り出して処理を実行するようになる。
3.マスタとスレーブの設定および制御
図6は、システム制御装置10,12の電源投入によるパワーオンスタート時の図5のマスタ210またはスレーブ220への状態遷移を行うマスタ/スレーブ設定処理である。
【0044】
まず、マスタとなるシステム制御装置10の処理を説明すると、電源投入によりシステム制御装置10が立ち上がると、まずステップS1で、図5のイニシャライズ200の状態に遷移する。このイニシャライズ200の状態で図4のプロセッサ60に設けている実装位置認識部60がスロット番号信号E1からスロット番号#00を認識する。次にステップS4で相手の状態をチェックし、相手がマスタでなければ、システム制御装置10をスロット番号#00の位置に実装していることから、ステップS5に進み、マスタ210に状態遷移する。相手がマスタであれば、ステップS6に進んでスレーブ状態へ遷移する。
【0045】
スレーブ側となるシステム制御装置12にあっては、スロット番号#10が認識されることから、ステップS3からステップS7に進み、タイマをスタートする。このタイマはシステム制御装置10側が正常にマスタ状態に遷移する時間を監視するタイマである。続いてステップS8で、タイムアウトか否かチェックし、タイムアウトになるまでは、ステップS9で、相手方としてのシステム制御装置10はマスタ状態に遷移したか否かチェックしている。
【0046】
もしタイマによる設定時間内にシステム制御装置10側がステップS5のようにマスタ状態に遷移すると、ステップS10に進み、システム制御装置12側は図5のスレーブ220の状態に遷移する。ステップS8で、一定時間を経過してもシステム制御装置10側がマスタ状態に遷移しなかった場合には、システム制御装置10側に異常があることから、ステップS11で、相手方にホルトを指示し、ステップS12で、システム制御装置12がマスタ状態に遷移する。
【0047】
一方、システム制御装置10がマスタ状態に遷移し、またシステム制御装置12がスレーブ状態に遷移した後に、保守点検のため例えばシステム制御装置10を取り外すと、システム制御装置12がこれを認識して、図5の状態制御230の準備段階を経てマスタ状態210に遷移する。
その後、システム制御装置10の修理が済んでスロット番号#00に活性挿入されると、挿入したシステム制御装置10のイニシャライズ200からスレーブ220へ遷移する。
【0048】
図7のフローチャートは、図6のパワーオンスタートに伴うマスタ/スレーブの設定によりシステム制御装置10がマスタ状態に遷移し、またシステム制御装置12がスレーブ状態に遷移した後の運用状態における情報等価性のチェックに伴う状態遷移である。
図7において、左側が、マスタ装置として動作するシステム制御装置10の処理であり、右側に、これに対応するスレーブ装置として動作するシステム制御装置12の処理を示している。以下の説明にあっては、マスタ側となるシステム制御装置をマスタ制御装置10といい、またスレーブ側となるシステム制御装置をスレーブ制御装置12という。
【0049】
マスタ制御装置10は、ステップS1で、マスタ状態へ遷移すると、マスタ状態への遷移をスレーブ制御装置12に通知する。この通知を受けてスレーブ制御装置12は、ステップS101で、マスタ制御装置10に対し二重化構成を実現するために等価性を保つ必要のある情報の転送要求を発行する。この情報転送要求を受けて、マスタ制御装置10は、ステップS2で、要求された状態をスレーブ制御装置12に転送する。
スレーブ制御装置12は、ステップS102で、マスタ制御装置10から転送された情報をメモリやレジスタに格納する。この処理によって、マスタ制御装置10とスレーブ制御装置12における初期段階での情報の等価性が確立される。続いてスレーブ制御装置12は、ステップS103でスレーブ状態に遷移する。
【0050】
マスタ制御装置10がステップS1でマスタ状態へ遷移し、またスレーブ制御装置12がステップS103でスレーブ状態へ遷移した後の通常の運用状態にあっては、マスタ制御装置10がステップS3で等価性を保証する情報に更新があったか否かチェックしている。もし情報更新があると、それぞれのシステム制御装置は、相手方へ更新情報を送信し、システム制御装置は、メモリやレジスタに送られてきた更新情報を格納する。これによってマスタ制御装置10とスレーブ装置12での更新情報の等価性が保証される。
【0051】
尚、スレーブ制御装置12における更新情報処理はステップS105に示しており、スレーブ側の処理内容はマスタ側のステップS3,S4の処理と同じであり、これに対するマスタ側の処理もスレーブ側のステップS104と同じになる。
またマスタ制御装置10は、ステップS5で、予め定めた等価性のチェック周期に達したか否かチェックしている。
【0052】
マスタ制御装置10は、ステップS6で、スレーブ制御装置12から送られてきた情報と自分自身がもっている情報との一致、不一致を判断するための照合処理を実行する。この照合処理において、もし情報の不一致がステップS7で判別されると、ステップS8で、スレーブ制御装置12に対しホルトを指示する。このホルト指示を受けたスレーブ制御装置12は、ステップS106でホルト指示を判別すると、ステップS107で自分自身をホルトし、処理を停止する。
【0053】
図8は、システム制御装置10,12で異常検出が行われた場合の処理動作である。異常検出が行われると、まずステップS1で自分自身の異常検出か否かチェックする。もし自分自身の異常検出であれば、ステップS7で、自分自身をホルトして処理を停止する。ステップS1で相手方の異常検出であった場合には、ステップS2で、相手方にホルト指示を行う。
【0054】
次にステップS3で、ホルトを指示した相手がマスタか否かチェックする。もしホルトを指示した相手がマスタであった場合には、ステップS4で、図5の状態制御230へ遷移し、マスタとなるための準備処理をステップS5で実行した後、ステップS6で、マスタ状態へ遷移する。
4.オペレーションの実行
図9は、計算機システムとしてのプロセッサモジュール14からマスタ状態にあるシステム制御装置10にオペレーションが発行された場合の処理動作である。
【0055】
図9において、プロセッサモジュール14に対してシステム制御装置10,12はそれぞれバス16,18で個別に接続され、且つシステム制御装置10,12間は専用のバス20で接続されている。またシステム制御装置10はマスタ状態への遷移でマスタ処理部100としての機能を実現しており、またシステム制御装置12はスレーブ状態への遷移でスレーブ処理部200としての機能を実現している。
【0056】
この状態で、プロセッサモジュール14からバス16を介してシステム制御装置10にオペレーション102が発行されたとする。このオペレーション102の発行は、バス16を使用してシステム制御装置10を宛先とするオペレーションコマンド104の送出で実現される。オペレーションコマンド104は、少なくともコマンドとして必要なパラメータデータをもっている。
【0057】
システム制御装置10は、オペレーションコマンド104を受信すると、自分自身のマスタ処理部100とシステム制御装置12のスレーブ処理部200に起動割込みを行って動作状態とする。起動割込みを受けて動作状態となったマスタ処理部100は、プロセッサモジュール14からのオペレーションコマンド104を受信し終わると、バス20を介してシステム制御装置12のスレーブ処理部200にオペレーションデータ106を送信する。
【0058】
このオペレーションデータ106の送信が終了すると、マスタ処理部100は、自分自身におけるオペレーションの実行を開始すると同時に、システム制御装置12のスレーブ処理部200に対しオペレーション処理開始の割込コマンド108を送信する。この処理開始割込コマンド108を受けて、スレーブ処理装置200においても、その前に転送された同じオペレーションの処理を実行する。
【0059】
このようにしてプロセッサモジュール14からシステム制御装置10に対しオペレーション発行102が行われても、2台のシステム制御装置10,12の両方で同じオペレーション処理が実行される。
図10は、図9の処理動作のシーケンスであり、プロセッサモジュール14からのオペレーション発行はマスタシステム制御装置10を経由してスレーブシステム制御装置12に伝えられ、両方のオペレーション処理が並行して実行される。マスタシステム制御装置10は、自己のオペレーション処理の実行が終了すると、スレーブシステム制御装置12側におけるオペレーション処理の実行の終了通知を待つ。
【0060】
スレーブシステム制御装置12側から終了通知を受けると、両方の装置10,12においてオペレーション処理が正常に終了したと判断し、オペレーション発行元となるプロセッサモジュール14に対しオペレーション処理終了通知を送出する。これによって、オペレーション発行からオペレーション終了までの一連の処理が行われることになる。
【0061】
図11は、マスタ制御装置10とスレーブ制御装置12のフローチャートにより図9の処理動作を示している。まずマスタ制御装置10のステップS1で、オペレーションの発行を認識すると、ステップS2で、オペレーションを受信すると同時に、自分自身に対する起動割込みおよびスレーブ制御装置12に対する起動割込みを発生する。
【0062】
続いてステップS3で、スレーブ制御装置12にパラメータデータを送信する。スレーブ制御装置12にあっては、ステップS101で起動要求を認識すると、処理を起動し、ステップS102で、パラメータデータを受信する。パラメータデータの送信終了がマスタ制御装置10のステップS4で判別されると、ステップS5で、オペレーション処理の開始をスレーブ制御装置12に割込送信する。
【0063】
このとき自分自身の処理も開始することから、ステップS6で、オペレーション処理が実行される。スレーブ制御装置12は、ステップS103で、マスタ制御装置10からの開始割込みを判別すると、ステップS104で、オペレーション処理を実行する。このようにして、マスタ制御装置10とスレーブ制御装置12で並行して同じオペレーション処理が実行される。オペレーション処理が終了すると、マスタ制御装置10はステップS7で、またスレーブ制御装置12はステップS105で、実行終了処理を行う。
【0064】
この実行終了処理S7,S105の内容は、図10のタイムチャートに示したように、マスタ制御装置10にあっては、自己の処理終了でスレーブ制御装置12からの終了通知を待っており、終了通知を受けると、プロセッサモジュール14に対し処理の終了を通知するようになる。なお、マスタ制御装置10またはスレーブ制御装置12で処理が正常に終了しなかった場合のエラー処理については、後の説明で明らかにする。
【0065】
図12は、プロセッサモジュール14からオペレーションをスレーブ側のシステム制御装置12に発行した場合の処理動作である。プロセッサモジュール14からバス16を使用したシステム制御装置10に対するオペレーションの発行がビジー状態になると、プロセッサモジュール14は空き状態にあるバス18を使用してスレーブ側となるシステム制御装置12にオペレーション発行110を行う。
【0066】
このオペレーション発行110に伴って、バス18よりオペレーションコマンド112がシステム制御装置12に送られ、自分自身の起動割込みとシステム制御装置10に対する起動割込みが発生し、スレーブ処理部200およびマスタ処理部100が動作状態になる。続いてスレーブ処理部200は、受信したオペレーションコマンド112に含まれるパラメータデータ114をシステム制御装置10のマスタ処理部100に送る。
【0067】
次にスレーブ処理部200は、パラメータデータ114の送信を終了すると、マスタ処理部100に対しオペレーション処理開始の割込コマンド116を発行する。この開始割込コマンド116を受けたマスタ処理部100は、既に受信したパラメータデータ114に基づく処理を実行すると同時に、スレーブ処理部200に対しオペレーション処理の開始割込コマンド118を発行する。スレーブ処理部200は、このマスタ処理部100からの開始割込コマンド118を受けて、既に受信しているオペレーション処理を実行する。
【0068】
このようにプロセッサモジュール14からのオペレーションはスレーブ側のシステム制御装置12に発行されているが、オペレーションの開始はマスタ側のシステム制御装置10側から行うようになる。
図13は図12の処理動作のフローチャートであり、マスタ制御装置10とスレーブ制御装置12の処理を並べて示している。
【0069】
まずスレーブ制御装置12のステップS101で、オペレーション発行を認識すると、ステップS102で、オペレーション受信とこれに基づく起動割込みを発生し、ステップS103で、マスタ制御装置10にパラメータデータを送信する。マスタ制御装置10は、ステップS1で、起動割込みによる起動要求を認識すると、ステップS2で、パラメータデータを受信する。
【0070】
スレーブ制御装置12は、パラメータデータの送信終了をステップS104で判別すると、ステップS105で、オペレーション処理開始の割込コマンドをマスタ制御装置10に送信する。この処理開始の割込コマンドをマスタ制御装置10はステップS3で認識し、ステップS4で、自己のオペレーション処理を開始すると同時に、スレーブ制御装置12に対する開始処理の割込コマンドを送信する。
【0071】
スレーブ制御装置12は、ステップS106で、マスタ制御装置10からの処理開始の割込コマンドを認識すると、ステップS107で、オペレーション処理を実行する。このときマスタ制御装置10側にあっては、ステップS5で既にオペレーション処理が実行されている。オペレーション処理の実行を終了した後のステップS6,S108の完了通知処理は、図11のマスタ側装置10にオペレーションを発行した場合と同じであり、スレーブ制御装置12からの処理終了通知を待って、マスタ制御装置10がプロセッサモジュール14に処理終了を通知する。
5.キューイングを伴うオペレーションの実行
図14は、マスタとして動作するシステム制御装置10にキュー15を設け、プロセッサ14のオペレーション発行で受信したオペレーションコマンドを一旦キュー15で受け付けた後にオペレーション処理を実行する場合の処理動作である。
【0072】
図14は、プロセッサモジュール14からオペレーションをマスタ側のシステム制御装置10に発行した場合の処理動作である。この場合には、オペレーション発行120に伴うオペレーションコマンド122の受信で、起動割込みをシステム制御装置10およびシステム制御装置12に対し行い、受信したオペレーションコマンド122はキュー15に格納する。キュー15にあっては、時間的な受付け順に従って処理の順番を決めるインデックスをもっている。
【0073】
続いてマスタ処理部100は、システム制御装置12のスレーブ処理部200に対し、受信したオペレーションコマンド122から得られたパラメータデータ126の送信を行う。パラメータデータ126の送信が終了すると、マスタ処理部100はキュー15を参照する。受信したオペレーション124が一番最初にキューイングされている場合には、以前に受けたオペレーション処理は終了しており、現在のオペレーション処理は実行されていないことから、自分自身にオペレーション124の処理の開始を行わせる。同時に、スレーブ処理部200に対しオペレーション処理開始の割込コマンド128を送って処理を開始させる。
【0074】
図15は、図14のキューイングを伴うオペレーション処理の実行のフローチャートであり、マスタ制御装置10側のステップS2で、発行されたオペレーションを受信した際にキュー15に格納する点、およびパラメータデータの送信後にステップS5でキュー15を参照して最初にキューイングされているか否かでステップS6のオペレーション処理の開始を行う点以外は、図11のキューイングしない場合と同じである。
【0075】
更に、ステップS8,S105の実行終了処理については、システム制御装置10のマスタ処理部100で自分自身の処理の終了後に、システム制御装置12のスレーブ処理部200からの処理終了通知を受信した際に、キュー15の処理が済んだオペレーション124をクリアする点が、キューイング固有の処理であり、それ以外はキューイングしない場合と同じになる。
【0076】
図16は、マスタ制御装置として動作するシステム制御装置10側にキュー15を設けて、発行されたオペレーションをキューイングする場合に、プロセッサモジュール14からスレーブとして動作するシステム制御装置12側にオペレーションが発行された場合の処理動作である。
この場合には、プロセッサモジュール14からのオペレーション発行130によるオペレーションコマンド132をシステム制御装置12で受信すると、自分自身およびシステム制御装置10に対する起動割込みでスレーブ処理部200およびマスタ処理部100を動作状態とする。この時点でマスタ処理部100は、オペレーション136としてキュー15に格納する。スレーブ処理部部200は、オペレーションコマンド132の受信で得られたパラメータデータ134を、マスタ処理部100に送信する。
【0077】
送信されたパラメータデータ134は、オペレーション136としてキュー15に格納される。パラメータデータ134の送信が済むと、スレーブ処理部200はマスタ処理部100にオペレーション処理の開始割込コマンド138を発行する。開始割込コマンド138を受けたマスタ処理部100は、キュー15を参照し、キューイングしたオペレーション136が先頭にキューイングされている場合には、自分自身でオペレーション136の処理を開始させると同時に、スレーブ処理部200にオペレーション処理の開始割込コマンド140を発行して処理を開始させる。
【0078】
マスタ処理部100でオペレーション処理の実行が終了すると、スレーブ処理部200からのオペレーション処理の実行終了通知を待つ。スレーブ処理部200から実行終了通知が得られると、キュー15の該当するオペレーション136をクリアした後、プロセッサモジュール14に対しバス20を経由し、バス18を通じて処理終了を通知する。
【0079】
図17のフローチャートは、図16の処理動作をマスタ制御装置10とスレーブ装置12について示している。この処理は、マスタ制御装置10のステップS2でスレーブ制御装置12のオペレーション起動割込みで受信したオペレーションをキュー15に格納する点、ステップS4でスレーブ制御装置12からオペレーションの開始割込コマンドを受けた際にキュー15を参照して最初にキューイングされている際にオペレーション処理開始の割込みを行う点が、図13のキューイングを行わない処理と異なる。
【0080】
また、ステップS7の実行終了処理にあっては、スレーブ制御装置12からの終了通知を受けた際に、キュー15のオペレーションをクリアした後にプロセッサモジュール14に処理終了を通知する点が相違する。
6.状態監視における事象発生処理
図18は、システム制御装置10,12において、電源状態や機器の状態等の状態監視について、状態変化即ち非同期事象が発生した場合の処理動作である。この電源や入出力装置の状態変化に伴う非同期事象の発生については、システム制御装置10,12のマスタ処理部100およびスレーブ処理部200で同時に認識して、必要な処理を行う。
【0081】
そしてスレーブ処理部200で非同期事象発生142に対する必要な処理が終了すると、事象発生通知144をマスタ処理部100に対し送る。この事象発生通知144を受けたマスタ処理部100は、自分自身における処理の終了とスレーブ処理部200からの事象発生通知144の両方から非同期事象の発生142に対する処理が終了したものと認識し、バス16を使用してプロセッサモジュール14に対し処理通知146として非同期事象の発生142を通知する。
【0082】
図19は、図18の非同期事象発生に伴う処理動作のフローチャートである。
図19において、マスタ制御装置10およびスレーブ制御装置12も共にステップS1,S101で事象変化を認識すると、ステップS2,S102で、事象を検出して必要な処理を行う。続いてスレーブ制御装置12は、ステップS103でマスタ制御装置10に事象発生を通知し、ステップS104で実行終了処理を行う。
【0083】
マスタ制御装置10は、ステップS3で、スレーブ制御装置12からの事象発生通知を待っており、通知があると、ステップS4で、実行終了処理としてプロセッサモジュール14に対し事象発生通知を行う。
7.異常検出処理
図20は、オペレーションまたは非同期事象処理の実行中にスレーブ制御装置12側で処理に失敗したときのシーケンスを示す。
【0084】
図20において、オペレーションまたは非同期事象148が発生すると、マスタ制御装置10およびスレーブ制御装置12は、同時に並行して、それぞれに対応した処理を実行する。マスタ制御装置10は監視タイマを備えており、処理の実行を終了するとタイマを起動し、タイマがタイムアウトする間にスレーブ制御装置12からの終了通知を待つ。
【0085】
しかしながら、スレーブ制御装置12は、実行の途中で異常を起こし処理に失敗しており、タイマによる設定時間Tに達しても終了通知が得られない。したがってマスタ制御装置10は、設定時間Tが経過してタイムアウトしたときにスレーブ制御装置12が異常と判断し、ホルト指示によりスレーブ制御装置12をホルトさせ、自分自身で実行した処理は正常と見做して、プロセッサモジュール14に対する通知を行う。
【0086】
この場合、オペレーションを実行していた場合には、キュー15をクリアした後にプロセッサモジュール14に通知するようになる。また非同期事象の処理を実行していた場合には、自分自身で処理した非同期事象の発生をプロセッサモジュール14に通知するようになる。
図21は、マスタ制御装置10における図20の処理動作のフローチャートであり、この例ではオペレーションのキューイングを例にとっていることから、図15のマスタ制御装置10側のステップS8および図17のマスタ制御装置10側のステップS7の実行終了処理の内容となる。
【0087】
このマスタ実行終了処理にあっては、まずステップS1で、自己の処理終了か否かチェックしており、処理終了を認識すると、ステップS2で、スレーブ制御装置12からの終了通知の有無をチェックし、終了通知があれば、ステップS9で、キューイングされたオペレーションをクリアし、ステップS10で、スレーブ経由のオペレーションか否かチェックする。。
【0088】
スレーブ経由でなければ、ステップS11で、バス16を使用して上位のプロセッサモジュール14に正常終了を通知する。スレーブ経由であった場合には、ステップS12で、スレーブ制御装置12に上位のプロセッサモジュールへの正常終了の通知の送信を指示する。
一方、ステップS2でスレーブ制御装置から終了通知がなかった場合には、ステップS3でタイマを起動し、ステップS4でタイムアウトをチェックする。ステップS4でタイムアウトする一定時間T以内に、ステップS2でスレーブから終了通知があれば、ステップS9以降の正常処理を行う。
【0089】
タイマの設定時間Tを経過してもスレーブ制御装置12から終了通知がなければ、ステップS4でタイムアウトが判別され、ステップS5で、スレーブ制御装置12の異常と判断してスレーブ制御装置にホルトを指示して停止させる。続いてステップS6で、キューイングされたオペレーションをキュー15からクリアした後、ステップS7で、上位のプロセッサモジュールに正常終了を通知する。
【0090】
なお図21のフローチャートは、プロセッサモジュール14からのオペレーション発行に伴う処理を例にとっているが、状態監視に伴う非同期事象の発生についても、基本的に同じ処理となる。
図22は、オペレーションまたは非同期事象の実行中にスレーブ制御装置で異常が起きたときの処理の他の実施例である。この図22の実施例にあっては、スレーブ制御装置の処理終了時に処理結果をマスタ制御装置に通知し、両方の実行結果を比較することでスレーブ制御装置の処理が異常か否か判断している。
【0091】
図22において、オペレーションまたは非同期事象148が発生すると、マスタ制御装置10とスレーブ制御装置12は、オペレーションまたは非同期事象の処理を並行して実行する。スレーブ制御装置12は、処理の実行を終了すると、処理完了通知として実行結果を示す情報をマスタ制御装置10に転送する。マスタ制御装置10は、スレーブ制御装置12からの通知情報と自分自身の処理の実行結果として得られた情報の比較処理150を行う。
【0092】
この比較処理150の結果、両方の情報が一致していれば、処理は正常に行われたものとしてプロセッサモジュール14に終了通知を行う。一方、マスタ制御装置10とスレーブ制御装置12の処理情報が不一致であった場合には、スレーブ制御装置12の異常と見做し、スレーブ制御装置12にホルト指示を行って停止させた後に、マスタ制御装置10の処理情報を正常終了と見做してプロセッサモジュール14に終了通知を行う。
【0093】
図23のフローチャートは、図22でオペレーション発行に対するマスタ制御装置10側の実行終了時の処理を示している。このマスタ制御装置10における実行終了処理は、ステップS1で自己の処理終了を判別すると、ステップS2で、スレーブ装置12からの終了通知の有無をチェックしており、終了通知を受けると、ステップS3で、マスタ制御装置10とスレーブ制御装置12の処理情報を比較する。
【0094】
この比較により、ステップS4で、もし不一致が判別されると、ステップS5で、スレーブ制御装置12の異常と判断してホルトを指示して停止させ、ステップS6で、キューイングされたオペレーションをクリアした後、ステップS7で、マスタ制御装置10自身の処理結果は正常と見做して、上位のプロセッサモジュール14に正常終了の通知を行う。
【0095】
勿論、ステップS4で一致していれば、ステップS9で、マスタ制御装置10およびスレーブ制御装置12の正常終了処理を行う。なお図23は、オペレーション実行時の終了処理を示しているが、状態変化に伴う非同期事象発生処理については、ステップS6のキューイングされたオペレーションのクリアが必要な以外は同じになる。
【0096】
図24は、プロセッサモジュール14からスレーブ側のシステム制御装置12にオペレーション発行が行われ、マスタ側のシステム制御装置10にコマンドパラメータを送信している間にハードウェア異常が起きたときの処理動作である。
図24において、システム制御装置12に対しプロセッサモジュール14よりオペレーション発行152が行われ、これに伴い、キュー15にオペレーション156として格納される。その後、スレーブ処理部200からシステム制御装置10のマスタ処理部100に対しパラメータデータ154の送信が行われる。このパラメータデータ154の送信中にハードウェアエラー160が発生して送信不能になったとする。
【0097】
このハードウェアエラー160による送信異常は、スレーブ処理部200で検出される。スレーブ処理部200は、ハードウェアエラー160による異常を検出すると、自分自身をホルト状態とする。一方、マスタ処理部100は、スレーブ制御装置12がホルト状態になったことを検出すると、キュー15にキューイングしているオペレーション156を放棄し、処理を終了させる。この処理の終了に伴い、マスタ処理部100はオペレーション発行元のプロセッサモジュール14に対しオペレーションの破棄を示す破棄通知162を送る。
【0098】
図25は、図24の送信中のハードウェアエラー発生時のマスタ制御装置10側のエラー処理1フローチャートである。このエラー処理1は、ステップS1で、スレーブ制御装置12からのオペレーションの受信を行っており、ひき続いてのパラメータ受信中にステップS2でハードウェアをエラーしてスレーブ制御装置12がホルト状態に遷移したのを検出すると、ステップS3で、キューイングしているオペレーションを破棄する。
【0099】
図26は、オペレーションまたは非同期事象の発生に対し、マスタ制御装置10と並行して処理を開始したスレーブ制御装置12が、処理の実行中に異常となったときのシーケンスである。このようにスレーブ制御装置12が処理の実行中に異常を起こすと、自己ホルトあるいはマスタ制御装置10からのホルト指示でホルト状態に移行する。マスタ制御装置10側でスレーブ制御装置12がホルト状態に遷移したことが検出され、マスタ制御装置10で処理を終了すれば、ホルトしているスレーブ制御装置12からの終了通知に関わらず処理の正常終了と見做して、プロセッサモジュール14に対し、オペレーション実行の場合は処理の完了通知、非同期事象発生に対する処理の実行については非同期事象発生通知を行う。勿論、オペレーション実行の場合はキューイングされたオペレーションをクリアする。
【0100】
図27は、図26のマスタエラー処理2のフローチャートであり、ステップS1で、オペレーションまたは同期事象検出処理を実行中にある。このときステップS2でスレーブ制御装置12かホルト状態に遷移したことを検出すると、ステップS3でオペレーション実行中であった場合には、ステップS4で、キューイングされたオペレーションをクリアし、また同期事象発生に対する処理であった場合には、ステップS4の処理を行わずステップS5に進み、上位のプロセッサモジュールにオペレーションの場合は正常終了を、同期事象の場合は同期事象の発生通知を行う。
【0101】
図28は、オペレーションまたは非同期事象発生に伴う処理の実行中にマスタ制御装置10に異常が起きた場合のシーケンスであり、図29にフローチャートを示す。まずステップと101でオペレーションまたは非同期事象発生148に対しマスタ制御装置10およびスレーブ制御装置12が並行して処理を実行しており、実行の途中でマスタ制御装置10に異常が起きると、ホルト状態に遷移す。このマスタ制御装置がホルト状態になったことを、スレーブ制御装置12がステップ102で認識し、現在実行中のオペレーションおよび非同期事象に対する処理をステップ103で破棄する。
【0102】
このとき、異常を起こしたマスタ制御装置10は自分自身でホルト状態となっている。そこでスレーブ制御装置12は、図5の遷移状態図に示したように、ステップS104でスレーブ220から状態制御230に移行して、マスタ210に移行するための準備処理を実行した後、マスタ210に遷移する。その後は、ステップS105でスレーブ制御装置12はマスタ制御装置として破棄したオペレーションおよび非同期事象発生に対する処理を行うことになる。
【0103】
尚、上記の実施例は、筐体内にプロセッサモジュールを備えた計算機システムに本発明の二重化構成をもつシステム制御装置を適用した場合を例にとっているが、プロセッサモジュールに限らず適宜の機器構成の計算機システムにつき、そのまま適用することができる。
また上記の実施例にあっては、計算機システムの筐体単位に本発明の二重化構成をもつシステム制御装置を実装した場合を例にとっているが、筐体単位とせずに任意のシステム単位に二重化されたシステム制御装置を設けてもよい。
【0104】
またマスタおよびスレーブの設定はシステム制御装置を実装するバスのスロット番号に基づいて設定しているが、計算機システムのソフトウェアによってダイナミックに設定できるようにしてもよい。
更に、二重化構成をもつ2つのシステム制御装置と計算機システムの間のインタフェースバスは、2台のシステム制御装置間で等価性を保つための情報伝送ができ、また計算機システムとの間で個別に情報のやり取りができれば、適宜のバス構成でよい。
【0105】
【発明の効果】
以上説明してきたように本発明によれば、二重化されたシステム制御装置で扱っている計算機システムの制御、状態監視および保守に関する情報につき、パワーオンスタートに伴うイニシャライズ状態でマスタからスレーブに送って等価性を保証し、その後の運用状態にあっては、お互いの情報更新につき相手方に送って等価性を保ち、更に、定期的なチェックにより情報の等価性を保つため、2台のシステム制御装置で扱っている情報のくい違いをなくし、いずれかのシステム制御装置で異常が起きても、直ちに正しい処理を引き継ぐことができる。
【0106】
また2台のシステム制御装置の一方をマスタ、他方をスレーブに設定し、両方にくい違いを発生した場合には、スレーブ側の装置をホルトさせマスタ側の装置の情報を有効とすることで、万が一、情報にくい違いが起きても常にマスタ側の装置に従った運用を保証することができる。
更に、マスタ側のシステム制御装置に異常が起きた場合には、スレーブ側のシステム制御装置にマスタとしての状態を遷移して処理を引き継ぐことができ、この場合、両者の情報の等価性は保証されているため、それまでスレーブとして動作していた装置がマスタとしての動作状態に切り替わっても、計算機システムの制御、状態監視、更に保守管理に悪影響を及ぼすことはない。
【0107】
このようなシステム制御装置の二重化構成により、システム制御装置を原因とした計算機システムの停止を確実に防止し、計算機システムの信頼性を大幅に向上することができる。
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】本発明のシステム制御装置を備えた計算機システムのブロック図
【図3】図2のシステム制御モジュールのブロック図
【図4】図3のマスタ側システム制御装置の機能ブロック図
【図5】本発明のシステム制御装置の状態遷移図
【図6】パワーオンスタート時のマスタ及びスレーブの状態遷移のフローチャート
【図7】マスタ状態及びスレーブ状態移行後の等価性のチェック処理のフローチャート
【図8】異常検出処理の状態遷移のフローチャート
【図9】マスタ側にオペレーションが発行された場合の処理動作の説明図
【図10】図9の処理動作のシーケンス説明図
【図11】図9の処理動作のフローチャート
【図12】スレーブ側にオペレーションが発行された場合の処理動作の説明図
【図13】図12の処理動作のフローチャート
【図14】マスタ側に発行したオペレーションをキューイングする場合の処理動作の説明図
【図15】図14の処理動作のフローチャート
【図16】スレーブ側に発行したオペレーションをキューイングする場合の処理動作の説明図
【図17】図16の処理動作のフローチャート
【図18】状態監視で非同期事象が発生した場合の処理動作の説明図
【図19】図18の処理動作のフローチャート
【図20】スレーブ側の異常をタイマによる時間監視で判断する処理のシーケンス説明図
【図21】図20の処理動作のフローチャート
【図22】スレーブ側の異常を情報比較で判断する処理のシーケンス説明図
【図23】図22の処理動作のフローチャート
【図24】スレーブ側からデータ送信中に異常が発生した場合の処理の説明図
【図25】図24の処理動作のフローチャート
【図26】スレーブ側の処理実行中に異常が発生した場合の処理説明図
【図27】図26の処理動作のフローチャート
【図28】マスタ側の処理実行中に異常が発生した場合の処理説明図
【図29】図28の処理動作のフローチャート
【符号の説明】
10,12:システム制御装置(マスタ制御装置10,スレーブ制御装置12)
11:筐体
14,14−1,14−2:プロセッサモジュール(計算機システム)
15:キュー
16,18:バス
16−1,16−2:システムバス
20:バス
22−1,22−2:システム制御モジュール
24−1,24−2:ブリッジ回路部
26−1,26−2:システムブリッジ回路部
30:メンテナンスバス
32−1,32−2:入出力バス
36−1〜36−3:筐体間インタフェースバス
38−1,38−2:電源インタフェースバス
40−1,40−2:電源部
42−1,42−2:上位操作ユニット
44:操作パネル
46:デバイスバス
48−1,48−2:デバック用コンソール
54:アダプタ
56−1〜56−3:入出力装置
60:プロセッサ
62:実装位置認識部
64:状態認識部
66:内部ステータス設定部
68:状態遷移部
70:イベント処理部
72:異常検出部
74:ホルト指示部
75:データ送受信部
76:更新情報転送部
78:等価性チェック部
80:オペレーション処理部
82:内部メモリ
84:等価性情報格納部

Claims (20)

  1. 計算機システムの制御、状態監視、及び保守を司るマスタ制御装置と、
    前記マスタ制御装置と並行して動作して前記マスタ制御装置との情報の等価性を保ちながら待機系として動作するスレーブ制御装置とから構成され、
    前記マスタ制御装置とスレーブ制御装置の各々は状態遷移処理部を有し、該状態遷移処理部は、少なくともイニシャライズ、マスタ、スレーブ、及びホルトの各状態を持ち、電源投入直後のイニシャライズ状態でマスタ実装位置を認識した場合にマスタ状態へ遷移し、スレーブ実装位置を認識した場合には他の装置のマスタ状態への遷移を確認した後にスレーブ状態へ遷移し、
    前記マスタ制御装置とスレーブ制御装置の各々は、更に、前記状態遷移処理部によりマスタ状態に遷移した場合、一定時間毎にスレーブ状態に遷移している他の装置と自己の情報とを比較して等価性を定期的にチェックし、比較した情報が一定時間以上異なる場合は、スレーブ状態に遷移している他の装置にホルトを指示してホルトさせることを特徴とする二重化構成をもつシステム制御装置。
  2. 請求項1に於いて、前記マスタ制御装置とスレーブ装置間を情報の等価性の維持に使用する第1バスを介して接続し、前記マスタ制御装置とスレーブ制御装置の各々を専用バスを介して前記計算機システムと個別に接続したことを特徴とする二重化構成をもつシステム制御装置。
  3. 請求項の装置に於いて、前記状態遷移処理部は、自己の異常を認識した際には自分自身をホルト状態に遷移し、他の装置の異常を認識した場合には該他の装置にホルトを指示してホルト状態に遷移させ、更にホルト指示を行った他の装置がマスタ制御装置であった場合は、自分自身をマスタ状態に遷移させることを特徴とする二重化構成をもつシステム制御装置。
  4. 請求項に於いて、前記マスタ制御装置とスレーブ制御装置の各々は、更に、前記状態遷移処理部によりスレーブ状態に遷移した際に、マスタ状態に遷移している他の装置に等価性を保証する情報の転送を要求し、一方、マスタ状態に遷移した際には、他の装置からの等価性を保つ情報の転送要求に応じて該当する情報を転送する情報送受信部を設けたことを特徴とする二重化構成をもつシステム制御装置。
  5. 請求項に於いて、前記マスタ制御装置とスレーブ制御装置の各々は、更に、前記状態遷移処理部によりマスタ状態に遷移した後に、等価性を保証する情報の更新を認識した場合、スレーブ状態に遷移している他の装置に更新情報を転送する更新情報転送部とを設けたことを特徴とする二重構成をもつシステム制御装置。
  6. 請求項1に於いて、前記マスタ制御装置及びスレーブ制御装置の各々は、前記計算機システムからのオペレーション指令を受けた際に、要求されたオペレーションに対応する処理を実行するオペレーション処理部を備えたことを特徴とする二重化されたシステム制御装置。
  7. 請求項に於いて、前記計算機システムが前記マスタ制御装置にオペレーション指令を発行すると、該オペレーション指令を受信したマスタ制御装置は、自己のオペレーション処理部および前記スレーブ制御装置のオペレーション処理部を起動し、次に自己のオペレーション処理の実行を開始すると同時に前記スレーブ制御装置に前記オペレーション指令のパラメータデータを送信してオペレーション処理の開始を指示して処理の二重化を行うことを特徴とする二重化構成をもつシステム制御装置。
  8. 請求項に於いて、前記計算機システムが前記スレーブ制御装置にオペレーション指令を発行すると、該オペレーション指令を受信したスレーブ制御装置は、自己のオペレーション処理部および前記マスタ制御装置のオペレーション処理部を起動し、次に前記マスタ制御装置に前記オペレーション指令のパラメータデータを送信し、マスタ制御装置は該パラメータデータの受信終了後に自己のオペレーション処理を開始すると同時にスレーブ制御装置にオペレーション処理の開始を指示して処理の二重化を行うことを特徴とする二重化構成をもつシステム制御装置。
  9. 請求項又はに於いて、前記マスタ制御装置は前記オペレーション指令を格納するキューを有し、前記マスタ制御装置のオペレーション処理部は、前記計算機システムから直接に又は前記スレーブ制御装置を経由してオペレーション指令を受けた際に前記キューに格納した後にパラメータデータのスレーブ制御装置との間の転送を行い、マスタ制御装置は該パラメータデータの転送終了後に前記キュ−を参照して受信したオペレーション指令が先頭にキューイングされている場合に、自己のオペレーション処理を開始すると同時にスレーブ制御装置にオペレーション処理の開始を指示することを特徴とする二重化構成をもつシステム制御装置。
  10. 請求項に於いて、前記マスタ制御装置およびスレーブ制御装置で受信したオペレーションを実行した場合、前記スレーブ制御装置はオペレーションの実行を終了すると前記マスタ制御装置にオペレーションの終了を通知し、前記マスタ制御装置は自己のオペレーションが終了し且つスレーブ制御装置からオペレーションの終了通知を受信した際に、両制御装置のオペレーションの実行終了を認識して前記キューをクリアし、更に前記計算機システムにオペレーションの処理終了を通知することを特徴とする二重化構成をもつシステム制御装置。
  11. 請求項9に於いて、前記マスタ制御装置は、受信したオペレーション指令を前記キューに格納する際に、現在、同じオペレーションが実行中か否か判断し、同じオペレーションを実行中であれば、オペレーションの二重発行と判断して受信したオペレーションを実行せずに計算機システムに二重発行を通知することを特徴とする二重化構成をもつシステム制御装置。
  12. 請求項に於いて、状態監視に基づき前記計算機システムに通知する事象が発生した場合、前記マスタ制御装置及びスレーブ制御装置の両方で前記発生事象に対する処理を行い、スレーブ制御装置は処理が終了したらマスタ制御装置に前記事象の発生を通知し、マスタ制御装置は自己の処理が終了し且つスレーブ制御装置からの事象の発生通知を受信した際に、両制御装置で発生事象に対する処理が終了したと認識して前記計算機システムに事象の発生を通知することを特徴とする二重化構成をもつシステム制御装置。
  13. 請求項又は10に於いて、前記マスタ制御装置は自己の処理を終了した際に、スレーブ制御装置からのオペレーション処理の終了通知を受け取ってない場合はタイマを起動して時間を監視し、一定の時間を過ぎてもスレーブ制御装置から処理の終了通知がない場合にスレーブ制御装置の異常と判断してホルト指示によりホルトさせ、マスタ制御装置自身で自己の処理を正常終了と見做して前記キューに格納されたオペレーションをクリアし、更に計算機システムに処理の終了を通知することを特徴とする二重化構成をもつシステム制御装置。
  14. 請求項12に於いて、前記マスタ制御装置は事象発生に対する自己の処理を終了した際に、スレーブ制御装置からの事象発生の通知を受け取ってない場合はタイマを起動して時間を監視し、一定の時間を過ぎてもスレーブ制御装置から事象の発生通知がない場合にスレーブ制御装置の異常と判断してホルト指示によりホルトさせ、マスタ制御装置で自己の処理を正常と見做して計算機システムに事象の発生通知を行うことを特徴とする二重化構成をもつシステム制御装置。
  15. 請求項又は10に於いて、前記マスタ制御装置は自己のオペレーション処理を終了し、且つスレーブ制御装置からのオペレーション処理の終了通知を受け取った際に、両者の処理情報を比較し、不一致の場合にスレーブ制御装置の異常と判断してホルト指示によりホルトさせ、マスタ制御装置で自己の処理を正常終了と見做して前記キューに格納されたオペレーションをクリアし、更に計算機システムに処理の終了を通知することを特徴とする二重化構成をもつシステム制御装置。
  16. 請求項12に於いて、前記マスタ制御装置は発生事象に対する自己の処理を終了し、且つスレーブ制御装置からの事象発生の通知を受け取った際に、両者の事象発生通知を比較し、不一致の場合にスレーブ制御装置の異常と判断してホルト指示によりホルトさせ、マスタ制御装置で自己の処理を正常と見做して計算機システムに事象の発生通知を行うことを特徴とする二重化構成をもつシステム制御装置。
  17. 請求項に於いて、前記スレーブ制御装置からマスタ制御装置へオペレーション指令に伴うパラメータデータの転送中に異常を検出した場合、スレーブ制御装置は自己をホルトし、マスタ制御装置はキューに格納したオペレーションを破棄して終了させることを特徴とする二重化構成をもつシステム制御装置。
  18. 請求項又は10に於いて、前記マスタ制御装置はオペレーション処理を実行中に、同時にオペレーション処理を実行しているスレーブ制御装置が状態異常となり、ホルト状態に移行したことを認識した場合、自己の処理を正常終了と見做して前記キューに格納されたオペレーションをクリアし、更に計算機システムに処理の終了を通知することを特徴とする二重化構成をもつシステム制御装置。
  19. 請求項12に於いて、前記マスタ制御装置は発生事象の処理中に、同時に発生事象の処理を実行しているスレーブ制御装置が状態異常となり、ホルト状態に移行したことを認識した場合、自己の処理を正常と見做して計算機システムに事象の発生通知を行うことを特徴とする二重化構成をもつシステム制御装置。
  20. 請求項に於いて、スレーブ制御装置が処理の実行中に、マスタ制御装置が状態異常となり、ホルト状態に移行したことを検出した場合、現在実行中の処理を破棄した後、自身の状態をスレーブ状態からマスタ状態に遷移させることを特徴とする二重化構成をもつシステム制御装置。
JP07282895A 1995-03-30 1995-03-30 二重化構成をもつシステム制御装置 Expired - Fee Related JP3611894B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP07282895A JP3611894B2 (ja) 1995-03-30 1995-03-30 二重化構成をもつシステム制御装置
US08/588,006 US5870301A (en) 1995-03-30 1996-01-17 System control apparatus including a master control unit and a slave control unit which maintain coherent information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07282895A JP3611894B2 (ja) 1995-03-30 1995-03-30 二重化構成をもつシステム制御装置

Publications (2)

Publication Number Publication Date
JPH08272753A JPH08272753A (ja) 1996-10-18
JP3611894B2 true JP3611894B2 (ja) 2005-01-19

Family

ID=13500675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07282895A Expired - Fee Related JP3611894B2 (ja) 1995-03-30 1995-03-30 二重化構成をもつシステム制御装置

Country Status (2)

Country Link
US (1) US5870301A (ja)
JP (1) JP3611894B2 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5974391A (en) * 1994-07-12 1999-10-26 Fujitsu Limited Device and method for project management
KR100202706B1 (ko) * 1996-10-05 1999-06-15 이종수 피엘씨 리모트 시스템의 기동시간 동기화 및 비상상태 출력 제어방법
US6301508B1 (en) * 1997-01-22 2001-10-09 Ando Electric Co., Ltd. Automatic instrumentation system
US6092214A (en) * 1997-11-06 2000-07-18 Cisco Technology, Inc. Redundant network management system for a stackable fast ethernet repeater
US6085227A (en) * 1998-03-20 2000-07-04 International Business Machines Corporation System and method for operating scientific instruments over wide area networks
JP3674351B2 (ja) * 1999-01-08 2005-07-20 富士通株式会社 マスタサーバ
US6591279B1 (en) 1999-04-23 2003-07-08 International Business Machines Corporation System and method for computer-based notifications of real-world events using digital images
US6999994B1 (en) 1999-07-01 2006-02-14 International Business Machines Corporation Hardware device for processing the tasks of an algorithm in parallel
US6463343B1 (en) 1999-08-10 2002-10-08 International Business Machines Corporation System and method for controlling remote devices from a client computer using digital images
US6820213B1 (en) 2000-04-13 2004-11-16 Stratus Technologies Bermuda, Ltd. Fault-tolerant computer system with voter delay buffer
US6708283B1 (en) 2000-04-13 2004-03-16 Stratus Technologies, Bermuda Ltd. System and method for operating a system with redundant peripheral bus controllers
US6633996B1 (en) 2000-04-13 2003-10-14 Stratus Technologies Bermuda Ltd. Fault-tolerant maintenance bus architecture
US6687851B1 (en) 2000-04-13 2004-02-03 Stratus Technologies Bermuda Ltd. Method and system for upgrading fault-tolerant systems
US6691257B1 (en) 2000-04-13 2004-02-10 Stratus Technologies Bermuda Ltd. Fault-tolerant maintenance bus protocol and method for using the same
US7065672B2 (en) * 2001-03-28 2006-06-20 Stratus Technologies Bermuda Ltd. Apparatus and methods for fault-tolerant computing using a switching fabric
US6813523B2 (en) * 2001-08-23 2004-11-02 George Mauro Distributed process control
US7152125B2 (en) * 2001-09-25 2006-12-19 Intel Corporation Dynamic master/slave configuration for multiple expansion modules
US7373487B2 (en) * 2002-04-10 2008-05-13 Alps Electric Co., Ltd Controller with fail-safe function
US7552187B2 (en) * 2005-06-22 2009-06-23 Tele Atlas North America, Inc. System and method for automatically executing corresponding operations on multiple maps, windows, documents, and/or databases
US7725764B2 (en) 2006-08-04 2010-05-25 Tsx Inc. Failover system and method
JPWO2008111137A1 (ja) 2007-03-09 2010-06-24 富士通株式会社 情報処理装置及びドメイン動的再構成処理方法
JP5176914B2 (ja) * 2008-12-04 2013-04-03 富士通株式会社 伝送装置及び冗長構成部の系切替え方法
CN101582920B (zh) * 2009-06-09 2012-09-05 中兴通讯股份有限公司 一种分布式文件系统中校验和同步数据块的方法及装置
WO2012031112A2 (en) * 2010-09-03 2012-03-08 Time Warner Cable, Inc. Methods and systems for managing a virtual data center with embedded roles based access control
JP5640767B2 (ja) * 2011-01-25 2014-12-17 富士通株式会社 情報処理装置、データ管理方法およびデータベースシステム
JP5680048B2 (ja) * 2012-11-22 2015-03-04 株式会社リブ技術研究所 自動制御システム、接点情報収集分配装置および自動制御システムの子局
JP6135430B2 (ja) * 2013-09-27 2017-05-31 富士通株式会社 情報処理装置、方法、プログラム、及びシステム
KR101995515B1 (ko) * 2014-07-30 2019-07-02 지멘스 악티엔게젤샤프트 제어 인가를 컴퓨터에 할당하기 위한 방법 및 시스템
JP6356736B2 (ja) * 2016-06-29 2018-07-11 ファナック株式会社 コントローラシステムおよび制御方法
CN108574854A (zh) * 2017-03-10 2018-09-25 达创科技股份有限公司 传输多媒体数据的方法、伺服器及系统
CN112416387A (zh) * 2020-11-05 2021-02-26 东莞欧陆通电子有限公司 一种电源系统及电源系统升级方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57164346A (en) * 1981-04-01 1982-10-08 Matsushita Electric Ind Co Ltd Duplex system microcomputer device
IT1151351B (it) * 1982-01-19 1986-12-17 Italtel Spa Disposizione circuitale atta a realizzare lo scambio di dati tra una coppia di elaboratori operanti secondo il principio master-slave
US4610013A (en) * 1983-11-08 1986-09-02 Avco Corporation Remote multiplexer terminal with redundant central processor units
JPH01237734A (ja) * 1988-03-18 1989-09-22 Nec Corp 二重化装置
US4982325A (en) * 1988-03-18 1991-01-01 At&T Bell Laboratories Applications processor module for interfacing to a database system
US4882747A (en) * 1988-05-12 1989-11-21 Jerry Williams Infrared communication apparatus for remote site applications
US5157780A (en) * 1990-06-12 1992-10-20 Advanced Micro Devices, Inc. Master-slave checking system
US5263034A (en) * 1990-10-09 1993-11-16 Bull Information Systems Inc. Error detection in the basic processing unit of a VLSI central processor
US5525913A (en) * 1994-10-19 1996-06-11 Intel Corporation Power validation tool for microprocessor systems

Also Published As

Publication number Publication date
JPH08272753A (ja) 1996-10-18
US5870301A (en) 1999-02-09

Similar Documents

Publication Publication Date Title
JP3611894B2 (ja) 二重化構成をもつシステム制御装置
CA2051786C (en) Universal scheme of input/output redundancy in a process control system
EP0974912B1 (en) Fault resilient/fault tolerant computing
CA2733788C (en) Method and systems for redundant server automatic failover
US6845467B1 (en) System and method of operation of dual redundant controllers
EP1675006A2 (en) Fault tolerant computer system and interrupt control method for the same
JP3882783B2 (ja) プログラマブルコントローラ及びcpuユニット並びに通信ユニット及び通信ユニットの制御方法
CN100377083C (zh) 启动控制方法、双平台系统以及信息处理器
WO1992006431A1 (en) Message control method for data communication system
JP3942216B2 (ja) 二重化された監視/制御プロセッサによるシステム監視・制御方法およびシステム監視・制御装置
CN112099412A (zh) 一种微控制单元的安全冗余架构
CA2498592A1 (en) Method and circuit arrangement for synchronization of synchronously or asynchronously clocked processing units
US20050229035A1 (en) Method for event synchronisation, especially for processors of fault-tolerant systems
KR100440588B1 (ko) 계층적 구조를 지원하는 직렬 버스형 형상 인식 및 경보장치
JP2693627B2 (ja) プログラマブルコントローラの二重化システム
JPH06318107A (ja) プログラマブルコントローラおよびそれを用いた分散制御システムにおける特定他局のリセット方法、他局のリセット要因検出方法、異常局監視方法、同期起動方法および同期停止方法
JPS6224354A (ja) デユプレツクス計算機システム
KR100606888B1 (ko) 이동통신 시스템에서 디지털 송수신기 보드 제어 이중화장치 및 방법
JP3679412B6 (ja) 故障から立直りが速い/故障に対する耐性がある計算処理
JP2002312333A (ja) マルチプロセッサ初期化/並行診断方法
JPH01120652A (ja) 入出力装置監視時間設定方式
JPH0713791A (ja) 二重化制御システムの等値化方法
JPH0916426A (ja) 2ポートコンソールを持つフォールトトレラントコンピュータ
JP2001045021A (ja) 二重化処理システム
JP2002271348A (ja) 集計システム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040928

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041021

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071029

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081029

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081029

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091029

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091029

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101029

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101029

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111029

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111029

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121029

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121029

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131029

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees