JP2013186727A - 多重系システム用計算機および多重系制御方法 - Google Patents

多重系システム用計算機および多重系制御方法 Download PDF

Info

Publication number
JP2013186727A
JP2013186727A JP2012051699A JP2012051699A JP2013186727A JP 2013186727 A JP2013186727 A JP 2013186727A JP 2012051699 A JP2012051699 A JP 2012051699A JP 2012051699 A JP2012051699 A JP 2012051699A JP 2013186727 A JP2013186727 A JP 2013186727A
Authority
JP
Japan
Prior art keywords
computer
standby
active
main memory
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012051699A
Other languages
English (en)
Inventor
Yuki Ueda
裕規 植田
Shunichi Kagaya
俊一 加賀屋
Masayuki Yamamoto
雅之 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2012051699A priority Critical patent/JP2013186727A/ja
Publication of JP2013186727A publication Critical patent/JP2013186727A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Power Sources (AREA)
  • Hardware Redundancy (AREA)

Abstract

【課題】多重系システムの消費電力を低減しつつ動作復帰時間を短縮する。
【解決手段】系切換制御部116、136は、自系計算機の装置状態を監視すると共に装置状態を他系計算機と相互に監視し合い、自系計算機と他系計算機の装置状態に基づいて自系計算機を稼働系とするか待機系とするかを制御し、自系計算機が稼働系のときメインメモリ111、131のデータを他系計算機に転送し、自系計算機が待機系のとき稼働系の他系計算機から転送されてきたデータを前記メインメモリに記録する。中央処理部110、130は、自系計算機が稼働系のとき、メインメモリを利用して多重系システムのシステム処理を実行する。電源供給制御部119、139は、メインメモリおよび系切換制御部に対しては自系計算機が稼働系と待機系のどちらであっても電源を供給し、中央処理部に対しては自系計算機が稼働系のときにだけ電源を供給する。
【選択図】図1

Description

本発明は、稼働系の計算機と待機系の計算機を有する多重系システムに関する。
鉄道運行管理、電力系統制御、プラント制御を始めとする高い信頼性が要求される用途に計算機を用いる場合、システムが実行すべき処理(以下「システム処理」という)を通常時に実行する稼働系計算機に加えて、稼働系計算機に障害が発生したときに稼働系計算機の処理を引き継ぐ待機系計算機を備えた多重系システムが用いられる。
システムに専用となる専用ネットワークおよび専用機能拡張ボードを用いて構築する多重系システムが特許文献1に開示されている。特許文献1のシステムでは、稼働系計算機に障害が発生すると、稼働系計算機は本来の処理を停止し、障害発生箇所や原因の特定に利用可能な障害情報を所定の記憶領域に保存する。そして、待機系計算機は自律的に稼働系計算機の処理を引き継ぐ。
その他にも様々な構成および動作を有する多重系システムが開示されている(特許文献2〜4参照)。
特許第04487260号公報 特開2007−133542号公報 特開2000−181501号公報 特開平06−259274号公報
特許文献1の多重系システムはホットスタンバイ方式のシステムであり、待機系計算機に稼働系計算機と同等の動作を行わせておき、稼働系計算機に障害が発生すると、待機系計算機が即座に処理を引き継ぐ。そのため、短時間でシステムの動作を復旧させることができ、高い信頼性が確保される。しかし、稼働系計算機が正常に動作している間も待機系計算機は動作している。そのため、必要以上に計算機を動作させておくことになるのでシステム全体として消費電力が大きくなってしまう。
このようなホットスタンバイ方式の他にコールドスタンバイ方式やウォームスタンバイ方式と呼ばれる多重系システムの制御方式がある。
コールドスタンバイ方式は、稼働系計算機が動作している間、待機系計算機は動作していないので、消費電力は小さくなる。しかし、待機系計算機に障害が発生してから待機系計算機のハードウェアやOSを起動し始める。そのため、稼働系計算機に障害が発生してから待機系計算機が動作を開始するまでの動作復帰時間が長くなってしまう。
ウォームスタンバイ方式は、稼働系計算機が動作している間、待機系計算機はハードウェアおよびOSは動作させておき、稼働系計算機に障害が発生すると、待機系計算機は既に稼働中のOS上で処理を開始する。ウォームスタンバイ方式はコールドスタンバイ方式よりも動作復帰時間は短くなるが、OSを常時動作させているため、消費電力は大きい。
また特許文献2〜4に開示された様々なシステムも消費電力の低減と動作復帰時間の短縮を両立するために特別な工夫をしていない。
本発明の目的は、多重系システムの消費電力を低減しつつ動作復帰時間を短縮する技術を提供することである。
本発明の一つの実施態様による多重系システム用計算機は、複数の計算機で構成される多重系システムに用いられる多重系システム用計算機であって、処理に用いられるデータを保持するメインメモリと、自系計算機の装置状態を監視すると共に前記装置状態を他系計算機と相互に監視し合い、前記自系計算機と前記他系計算機の装置状態に基づいて前記自系計算機を稼働系とするか待機系とするかを制御し、前記自系計算機が稼働系のとき前記メインメモリのデータを前記他系計算機に転送し、前記自系計算機が待機系のとき前記稼働系の他系計算機から転送されてきたデータを前記メインメモリに記録する系切換制御部と、前記自系計算機が稼働系のとき、前記メインメモリを利用して前記多重系システムのシステム処理を実行する中央処理部と、前記メインメモリおよび前記系切換制御部に対しては前記自系計算機が稼働系と待機系のどちらであっても電源を供給し、前記中央処理部に対しては前記自系計算機が稼働系のときにだけ電源を供給する電源供給制御部と、を有している。
本発明によれば、多重系システムの消費電力を低減しつつ動作復帰時間を短縮する技術を提供することができる。
本実施形態に関わる多重系システムの構成を示すブロック図である。 メインメモリ111内に格納しているソフトウェアの構成を示す図である。 系切換制御ボード116のハードウェア構成を示すブロック図である。 本実施形態の多重系システムにおける通常時の動作を示すシーケンス図である。 本実施形態の多重系システムにおいて稼働系に障害が発生したときの動作を示すシーケンス図である。 本実施形態における以上の3つの制御を含む動作を示すフローチャートである。 本実施形態における稼働系計算機100と待機系計算機101の状態遷移図である。
本発明の実施形態について図面を参照して詳細に説明する。
図1は、本実施形態に関わる多重系システムの構成を示すブロック図である。本実施形態の多重系システムは2台の計算機100、101で構成された二重系システムである。ただし、この構成は単なる一例であり、計算機が3台以上であってもよい。
本実施形態は多重系システムは複数の計算機100、101を有し、稼働系の計算機と待機系の計算機が互いに連携して動作することにより、システムの高い信頼性を確保している。計算機100、101は同一構成であり、自系計算機および他系計算機の状態に応じて、稼働系あるいは待機系として動作する。
ここでは計算機100を例として基本的な構成および動作について説明する。なお、詳細な構成および動作については後述することにする。
図1を参照すると、計算機100は、主記憶部(以下「メインメモリ」という)111、系切換制御ボード116、中央処理部(CPUCentral Processing Unitに相当)110、および電源供給制御部119を有している。その他の構成については詳細な説明に明記することにする。
メインメモリ111は、システム本来の処理(システム処理)を規定したソフトウェア117と、システム処理に用いられるデータとを保持する。
系切換制御ボード116は、自系計算機の装置状態を監視すると共に、LAN102を介して装置状態を他系計算機と相互に監視し合う。また、系切換制御ボード116は、自系計算機と他系計算機の装置状態に基づいて、自系計算機を稼働系とするか待機系とするかを制御する。更に、系切換制御ボード116は、自系計算機が稼働系のときメインメモリ111のデータを他系計算機に転送し、自系計算機が待機系のとき稼働系の他系計算機から転送されてきたデータをメインメモリ111に記録する。
具体的には、系切換制御ボード116はLAN102経由で他系計算機と生存監視電文を送受信し、他系計算機からの生存監視電文が受信されているか否かに基づいて、他系計算機が正常か異常か判定している。そして、系切換制御ボード116は、自系計算機が稼働系のとき、待機系である他系計算機が正常であれば、メインメモリ111のデータを他系計算機に転送している。
電源供給制御部119は、メインメモリ111および系切換制御ボード116に対しては自系計算機が稼働系と待機系のどちらであっても電源を供給する。しかし、電源供給制御部119は、CPU110に対しては自系計算機が稼働系のときにだけ電源を供給する。
CPU110は、自系計算機が稼働系のとき、メインメモリ111のデータを利用して多重系システムのシステム処理を実行する。CPU110は、自系計算機が待機系のときには電源が供給されないので停止している。
自系計算機が待機系から稼働系に移行する時、電源供給制御部119からCPU110に電源が供給され始めるので、CPU110は電源供給制御部119からの電源が供給されると起動し、メインメモリ111に蓄積されているデータを使用してシステム処理を開始する。
このように本実施形態によれば、待機系の計算機ではCPU110に電源を供給せず、稼働系のメインメモリ111のデータを待機系のメインメモリ111にコピーしており、待機系から稼働系に移行するとき、旧稼働系からコピーしていたデータを用いて処理を開始するので、システム全体として消費電力を低減しつつ動作復帰時間を短縮することができる。
また、系切換制御ボード116は、自系計算機が待機系のとき、稼働系である他系計算機に異常が発生すると、LAN102経由で他系計算機にプロセッサ再起動要求電文またはプロセッサ停止要求電文を送信する。また、系切換制御ボード116は、自系計算機が稼働系のとき、待機系である他系計算機からプロセッサ再起動要求電文またはプロセッサ停止要求電文を受信すると、CPU110に割り込み信号を入力する。
また、CPU110は、割り込み信号が入力されると、メインメモリ111の所定領域のデータを記録媒体に退避するメモリダンプを開始し、メモリダンプが終了したら、メモリダンプ終了を他系計算機に通知して再起動または停止する。
その場合、系切換制御ボード116は、自系計算機が待機系のとき、他系計算機にプロセッサ再起動要求電文またはプロセッサ停止要求電文を送信してから時間を計測し、所定時間内に他系計算機からメモリダンプ終了の通知が受信されないとき、他系計算機にプロセッサ停止要求電文を送信する。
あるいは他の例として、CPU110は、入力された割り込み信号がプロセッサ再起動を要求するものであれば、メインメモリ111の所定領域のデータを記録媒体に退避するメモリダンプを開始し、メモリダンプが終了したら、メモリダンプ終了を他系計算機に通知してプロセッサを再起動し、割り込み信号がプロセッサ停止を要求するものであれば、メモリダンプを行わずに停止することにしてもよい。その場合、系切換制御ボード116は、自系計算機が待機系のとき、他系計算機にプロセッサ再起動要求電文を送信してからの時間を計測し、所定時間内に他系計算機からメモリダンプ終了の通知が受信されないとき、他系計算機にプロセッサ停止要求電文を送信することにするとよい。
以下、本実施形態について、より詳細に説明する。
ここでは計算機100が稼働系であり、計算機101が待機系であるとする。待機系計算機101はスタンバイ状態であり、電源供給制御部139から、メインメモリ131、入出力制御部(以下「I/O」という)132、および系切換制御ボード136に対してのみ給電を行っている。系切り換えが発生すると、稼働系計算機100は待機系計算機となり、待機系計算機101は稼働系計算機となる。
稼働系計算機100の構成と待機系計算機101の構成は同等なので、以下、稼働系計算機100を例に計算機の構成について述べる。
稼働系計算機100は、CPU110、メインメモリ111、およびI/O112を備える。I/O112には、ディスク装置113や拡張バス121が接続される。
拡張バス121には、計算機の機能を拡張するための回路が接続される。一般的には回路が実装された拡張ボードを、拡張バス121に接続されたスロットコネクタに挿入する形態が採られる。ただし、一部の機能は、計算機本体内に実装され、拡張バスに直接内部で接続されている場合もある。
本実施形態に係る計算機100は、拡張ボードとしてLANボード114、115、および系切換制御ボード116を備える。系切換制御ボード116は管理バス120を通じてI/O112にも接続されている。
LANボード114、115はそれぞれ汎用ネットワーク103、104に接続され、この汎用ネットワーク103、104に接続された他の計算機などと通信を行う。
系切換制御ボード116は、計算機の系切り換え制御のための機能拡張ボードであり、汎用ネットワークであるLAN102を介して、待機系計算機101の系切換制御ボード136と接続される。
系切換制御ボード116は、計算機100、101が相互に行う相手計算機の生存監視と、系切り換えに必要な強制割込、動作停止、計算機再起動の各指示電文の送信と、各指示電文受信時の自系計算機における指示内容の実行と、メインメモリ111、131間のメモリ転写と、スタンバイ状態からの復帰制御とを行う。
図2は、メインメモリ111内に格納しているソフトウェアの構成を示す図である。
前述の多重系システムにおいて、稼働系計算機100では、メインメモリ111にOS150、アプリケーション151、管理プログラム152、および他系監視プログラム153が書き込まれており、アプリケーション151、管理プログラム152、および他系監視プログラム153がOS150上で実行されている。待機系計算機101のメインメモリ131上のソフトウェアの構成は図2に示したものと同様であるが、スタンバイ状態なので、それらのソフトウェアは動作していない。
管理プログラム152は、稼働系と待機系の切り換え処理を行うプログラムである。本プログラムは、系切換制御ボード116に対して、電文の送受信を要求したり、動作を指示したりする。また、管理プログラム152は他系監視プログラム153に対して生存通知電文の送受信を要求する。
他系監視プログラム153は、系切換制御ボード116を使い、LAN102を介して、他系の計算機101の系切換制御ボード136と生存通知電文を送受信する。この電文の送受信には汎用通信プロトコルが使用される。
OS150内の割込処理プログラム118は、CPU110に対してマスク不可能割込(以下「NMI」という)信号が入力されたときに起動される。NMI信号が入力されると、CPU110は障害情報を所定の記憶領域に保存する等の障害発生時に行うべき処理を実行する。
次に、系切換制御ボード116、136の構成及び機能について詳細を示す。
図3は、系切換制御ボード116のハードウェア構成を示すブロック図である。
図3に示す稼働系計算機100の系切換制御ボード116は、ネットワークインタフェース200、再起動制御部201、電文比較回路202、メモリ転写制御部203、および復帰制御回路204からなり、管理バス120および拡張バス121に接続されている。待機系計算機101の系切換制御ボード136もこれと同様の構成である。系切換制御ボード116は、LAN102を介して待機系計算機101と電文の送受信を行う。
他系からCPU再起動要求電文を受信すると、電文比較回路202がそれをCPU再起動要求であると判断し、再起動制御部201が拡張バス121を介してCPU110に割込信号210を送信する。また、他系からCPU停止要求電文を受信すると、電文比較回路202がそれをCPU停止要求であると判断し、再起動制御部201がCPU停止信号211を送信して自系のCPU110を停止させる。
また、再起動制御部201は、管理バス120経由によりCPU再起動信号212を受信すると、CPU停止信号211を送信して自系のCPU110を停止させる。
メモリ転写制御回路203は、自系のメインメモリ111の内容に変更があると、拡張バス121を介して自系のメインメモリ111の変更内容を受信し、その変更内容を待機系計算機101の系切換制御ボード136に送信する。
待機系計算機101のメモリ転写制御部203は、稼働系計算機100から信号線215を介して受信したメインメモリの変更内容を、管理バス120を介して自系のメインメモリ131に書き込むことにより、メインメモリ131の内容を稼働系計算機100に合わせて更新する。
また、待機系の復帰制御回路204は稼働系計算機100から生存監視電文であるALIVEパケットを受信する。稼働系からのALIVEパケットが途絶えた場合、復帰制御回路204は、稼働系計算機100に異常が発生したと判断し、管理バス140を介してスタンバイ復帰要求電文をI/O132に送信する。
続いて、本発明に特有の3つの制御について詳細を示す。
図4は、本実施形態の多重系システムにおける通常時の動作を示すシーケンス図である。図5は、本実施形態の多重系システムにおいて稼働系に障害が発生したときの動作を示すシーケンス図である。
(1)生存監視制御
計算機100、101は、相手の障害発生を検知するために生存監視機能を備え、互いに生存監視電文(ALIVEパケット)を送信する(ステップ300)。
図4を参照すると、稼働系計算機100では、他系管理プログラム153から送信される生存監視電文(ALIVEパケット)がI/O112から復帰制御回路204に送信され(ステップ301)、復帰制御回路204から待機系計算機101に送信される(ステップ302)。待機系計算機101は、復帰制御回路204にて生存監視電文を受信する。
また、待機系計算機101は、復帰制御回路204から稼働系計算機100に生存監視電文(ALIVEパケット)を送信する(ステップ303)。稼働系計算機100では、復帰制御回路204にて当該電文を受信する。
稼働系計算機100の復帰制御回路204は、受信した生存監視電文(ALIVEパケット)をI/O112に通知する。この生存監視電文が途絶えることで障害が発生したとみなされる。本実施形態においては待機系計算機101はスタンバイ状態であり、CPUやI/O等が動作していないため、CPUが生存監視制御を行えない。そのため、本実施形態では稼働系計算機100にて待機系計算機101の生存監視を行い、スタンバイ状態で生存監視を実施できないという問題を回避している。
(2)メモリ転写制御
系切換制御ボード116は、メモリ転写制御部203を備える。これにより、待機系計算機101がスタンバイ状態であっても、稼働系計算機100に障害が発生したとき直ちに稼働系計算機100と同等の状態で動作を開始することができるようになっている。
図4を参照すると、稼働系計算機100のメモリ転写制御部203は自系のメインメモリ111への書込みが発生したとき、メインメモリ11に書き込まれる内容をI/O112から受信する(ステップ306)。そうすると、メモリ転写制御部203は、待機系計算機101のメモリ転写制御部20に、そのメモリ変更内容を送信する(ステップ307)。
待機系計算機101のメモリ転写制御部215は、稼働系計算機100から受信したメモリ変更内容を自系のメインメモリ131に反映する(ステップ308)。
(3)スタンバイ状態からの復帰制御
稼働系計算機100にて障害が発生すると、待機系計算機101からのCPUリセットおよび停止要求の発行と、系切換制御を実施するため、スタンバイ状態からの復帰が必要となる。復帰制御回路204は、スタンバイ状態から稼働状態への復帰を実現する回路である。
図5を参照すると、稼働系計算機100にて障害が発生すると、稼働系計算機100から待機系計算機101への生存監視電文(ALIVEパケット)が届かなくなる(ステップ310)。待機系計算機101の復帰制御回路204は、生存監視電文(ALIVEパケット)を受信できなくなったことにより、稼働系計算機100に異常が発生したと判定する(ステップ312)。そして、稼働系計算機100」はスタンバイ復帰要求を自系I/O132に送信し(ステップ313)、復帰完了待ち状態となる(ステップ314)。待機系計算機101がスタンバイ状態から稼働状態に復帰した後、待機系計算機101はCPUリセット要求を稼働系計算機100のI/O112に送信する。
図6は、本実施形態における以上の3つの制御を含む動作を示すフローチャートである。図6には、稼働系計算機100の動作と待機系計算機101の動作の両方が記載されている
稼働系計算機100は、定常状態時には生存監視電文(ALIVEパケット)を送信する処理(ステップ401)と、他系からの生存監視電文(ALIVEパケット)を受信する処理を行う(ステップ402)。
問題なく他系からの生存監視電文(ALIVEパケット)を受信できていれば、稼働系計算機100は、自系のメモリ変更内容を他系に転写するメモリ転写制御を実施する(ステップ403)。
待機系計算機101からの生存監視電文(ALIVEパケット)を受信できない場合、稼働系計算機100は他系に障害が発生したと判定し、障害時の処理を実施する(ステップ404,405)。この際の処理としては、待機系の切換えや、画面出力による通知等が考えられる。待機系の切り換えは、多重系システムに計算機が3台以上ある場合に待機系計算機となる計算機を切り替える処理である。
待機系計算機101は、他系からの生存監視電文(ALIVEパケット)を待ち(ステップ411)、問題なく受信できた場合は、他系へ生存監視電文(ALIVEパケット)を送信する(ステップ412)。そして、待機系計算機101は、稼働系計算機100からのメモリ転写データの有無を確認し(ステップ413)、データが存在すればメモリ転写制御を実施する(ステップ414)。他系からの生存監視電文(ALIVEパケット)を所定時間以上受信できなかった場合、待機系計算機101はスタンバイ復帰制御を実施する(ステップ415)。そして、復帰処理が完了した後(ステップ416)、待機系計算機101は他系リセットおよび他系停止の処理を実施する(ステップ417)。
図7は、本実施形態における稼働系計算機100と待機系計算機101の状態遷移図である。本実施形態における計算機100、101の電源供給のステータスとして、電源が供給されていない停止状態500、503と、メインメモリと系切換制御ボードのみに電源が供給されるスタンバイ状態501,504と、装置全体に電源が供給される稼働状態502、505という3つのステータスがある。
稼働系計算機100の停止状態500は、電源ステータスの初期状態であり、給電が開始されると稼働系計算機100はまずスタンバイ状態501となる。スタンバイ状態501は、電源の供給が停止されれば停止状態500となり、電源がONされれば、または再起動すると稼働状態502に移行する。稼働状態502は、電源がOFFされれば、またはCPU再起動および停止の処理によりスタンバイ処理501となる。なお、稼働系計算機の定常状態は稼働状態502である。
待機系計算機101の停止状態503は、電源ステータスの初期状態であり、給電が開始されるとスタンバイ状態504となる。待機系計算機101の定常状態は、スタンバイ状態504である。スタンバイ状態504は、稼働系計算機100にて障害が発生したことを検知すると、稼働状態505へ移行する。また、給電が停止すると停止状態503となる。稼働状態505は、当該状態に遷移した後に系切り換えが実施され、稼働状態を維持する。
本実施形態では、図7に示す電源ステータス管理を実現することで、障害発生時の即時復旧と省電力化を両立している。
以上、本発明の実施形態について述べてきたが、本発明は、これらの実施形態だけに限定されるものではなく、本発明の技術思想の範囲内において、これらの実施形態を組み合わせて使用したり、一部の構成を変更したりしてもよい。
100…稼働系計算機、101…待機系計算機、102…LAN、103…汎用ネットワーク、110…CPU、111…メインメモリ、112…I/O、113…ディスク装置、114、115…LANボード、116…系切換制御ボード、117…ソフトウェア、118…割込処理プログラム、119…電源供給制御部、120…管理バス、121…拡張バス、131…メインメモリ、132…I/O、136…系切換制御ボード、139…電源供給制御部、140…管理バス、150…OS、151…アプリケーション、152…管理プログラム、153…他系監視プログラム、153…他系管理プログラム、200…ネットワークインタフェース、201…再起動制御部、202…電文比較回路、203…メモリ転写制御回路、203…メモリ転写制御部、204…復帰制御回路、210…割込信号、211…CPU停止信号、212…CPU再起動信号、215…信号線

Claims (9)

  1. 複数の計算機で構成される多重系システムに用いられる多重系システム用計算機であって、
    処理に用いられるデータを保持するメインメモリと、
    自系計算機の装置状態を監視すると共に前記装置状態を他系計算機と相互に監視し合い、前記自系計算機と前記他系計算機の装置状態に基づいて前記自系計算機を稼働系とするか待機系とするかを制御し、前記自系計算機が稼働系のとき前記メインメモリのデータを前記他系計算機に転送し、前記自系計算機が待機系のとき前記稼働系の他系計算機から転送されてきたデータを前記メインメモリに記録する系切換制御部と、
    前記自系計算機が稼働系のとき、前記メインメモリを利用して前記多重系システムのシステム処理を実行する中央処理部と、
    前記メインメモリおよび前記系切換制御部に対しては前記自系計算機が稼働系と待機系のどちらであっても電源を供給し、前記中央処理部に対しては前記自系計算機が稼働系のときにだけ電源を供給する電源供給制御部と、
    を有する多重系システム用計算機。
  2. 前記中央処理部はプロセッサを含み、前記電源供給制御部からの電源が供給されると前記プロセッサを起動し、前記メインメモリに蓄積されているデータを使用して前記システム処理を開始する、請求項1に記載の多重系システム用計算機。
  3. 前記系切換制御部は、前記自系計算機が待機系のとき、稼働系である前記他系計算機に異常が発生すると、前記他系計算機にプロセッサ再起動要求電文またはプロセッサ停止要求電文を送信し、前記自系計算機が稼働系のとき、待機系である前記他系計算機から前記プロセッサ再起動要求電文または前記プロセッサ停止要求電文を受信すると、前記中央処理部のプロセッサに割り込み信号を入力する、請求項1または2に記載の多重系システム用計算機。
  4. 前記中央処理部は、前記プロセッサに前記割り込み信号が入力されると、前記メインメモリの所定領域のデータを記録媒体に退避するメモリダンプを開始し、前記メモリダンプが終了したら、メモリダンプ終了を前記他系計算機に通知して前記プロセッサを再起動または停止する、請求項3に記載の多重系システム用計算機。
  5. 前記系切換制御部は、前記自系計算機が待機系のとき、前記他系計算機に前記プロセッサ再起動要求電文または前記プロセッサ停止要求電文を送信してから所定時間内に前記他系計算機から前記メモリダンプ終了の通知が受信されないとき、前記他系計算機に前記プロセッサ停止要求電文を送信する、請求項4に記載の多重系システム用計算機。
  6. 前記中央処理部は、前記プロセッサに入力された割り込み信号が前記プロセッサ再起動を要求するものであれば、前記メインメモリの所定領域のデータを記録媒体に退避するメモリダンプを開始し、前記メモリダンプが終了したら、メモリダンプ終了を前記他系計算機に通知して前記プロセッサを再起動し、前記割り込み信号が前記プロセッサ停止を要求するものであれば、前記メモリダンプを行わずに前記プロセッサを停止し、
    前記系切換制御部は、前記自系計算機が待機系のとき、前記他系計算機に前記プロセッサ再起動要求電文を送信してから所定時間内に前記他系計算機から前記メモリダンプ終了の通知が受信されないとき、前記他系計算機に前記プロセッサ停止要求電文を送信する、請求項3に記載の多重系システム用計算機。
  7. 前記系切換制御部はネットワーク経由で前記他系計算機と生存監視電文を送受信し、前記他系計算機からの生存監視電文が受信されているか否かに基づいて、前記他系計算機が正常か異常か判定する、請求項1から6のいずれか一項に記載の多重系システム用計算機。
  8. 前記系切換制御部は、前記自系計算機が稼働系のとき、待機系である前記他系計算機が正常であれば、前記メインメモリのデータを前記他系計算機に転送する、請求項7に記載の多重系システム用計算機。
  9. 処理に用いるデータをメインメモリに保持し、系切換制御部が自系計算機を稼働系とするか待機系とするか制御し、前記自系計算機が稼働系のとき、中央処理部が前記メインメモリを利用して多重系システムのシステム処理を実行する、多重系システムにおける計算機を制御するための多重系制御方法であって、
    電源供給制御部が、
    前記メインメモリおよび前記系切換制御部に対しては前記自系計算機が稼働系と待機系のどちらであっても電源を供給し、前記中央処理部に対しては前記自系計算機が稼働系のときにだけ電源を供給するステップと、
    前記系切換制御部が、
    前記自系計算機の装置状態を監視すると共に前記装置状態を他系計算機と相互に監視し合うステップと、
    前記自系計算機と前記他系計算機の装置状態に基づいて前記自系計算機を稼働系とするか待機系とするかを制御するステップと、
    前記自系計算機が稼働系のとき前記メインメモリのデータを前記他系計算機に転送するステップと、
    前記自系計算機が待機系のとき前記稼働系の他系計算機から転送されてきたデータを前記メインメモリに記録するステップと、
    を有する多重系制御方法。

JP2012051699A 2012-03-08 2012-03-08 多重系システム用計算機および多重系制御方法 Pending JP2013186727A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012051699A JP2013186727A (ja) 2012-03-08 2012-03-08 多重系システム用計算機および多重系制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012051699A JP2013186727A (ja) 2012-03-08 2012-03-08 多重系システム用計算機および多重系制御方法

Publications (1)

Publication Number Publication Date
JP2013186727A true JP2013186727A (ja) 2013-09-19

Family

ID=49388087

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012051699A Pending JP2013186727A (ja) 2012-03-08 2012-03-08 多重系システム用計算機および多重系制御方法

Country Status (1)

Country Link
JP (1) JP2013186727A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7468830B2 (ja) 2019-11-28 2024-04-16 ホアウェイ・テクノロジーズ・カンパニー・リミテッド エネルギー効率の良い表示処理方法およびデバイス

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7468830B2 (ja) 2019-11-28 2024-04-16 ホアウェイ・テクノロジーズ・カンパニー・リミテッド エネルギー効率の良い表示処理方法およびデバイス

Similar Documents

Publication Publication Date Title
WO2020001354A1 (zh) 主备容器系统切换
JP4341571B2 (ja) 記憶装置システムおよびその制御方法、制御プログラム
JP5561622B2 (ja) 多重化システム、データ通信カード、状態異常検出方法、及びプログラム
EP2608049B1 (en) Control system and relay apparatus
TW454128B (en) Shared disk type multiple system
JP6130520B2 (ja) 多重系システムおよび多重系システム管理方法
CN111585835B (zh) 一种带外管理系统的控制方法、装置和存储介质
CN111858077A (zh) 一种存储系统中io请求日志的记录方法、装置及设备
CN113515408A (zh) 一种数据容灾方法、装置、设备及介质
US9026838B2 (en) Computer system, host-bus-adaptor control method, and program thereof
US9154448B2 (en) Apparatus and method for switching connection to a communication network
JP2007280313A (ja) 冗長化システム
WO1999026138A1 (fr) Procede de permutation dans un systeme multiplex
JP2008152552A (ja) 計算機システム及び障害情報管理方法
JP2006189963A (ja) ストレージアクセス制御方法、クラスタシステム、パス接続スイッチおよびストレージアクセス制御プログラム
JP2013186727A (ja) 多重系システム用計算機および多重系制御方法
JP2009075710A (ja) 冗長化システム
JP2007334668A (ja) メモリダンプ方法、クラスタシステム、それを構成するノードおよびプログラム
JP2008003731A (ja) 情報処理システム
JP2013254333A (ja) 多重系制御システム及びその制御方法
JP6822706B1 (ja) クラスタシステム、サーバ装置、引継ぎ方法、及びプログラム
JP2004013723A (ja) 共有メモリを使ったクラスタ構成を採用した情報処理システムの障害処理装置と方法
JP2010198353A (ja) コンピュータシステム、コンピュータ本体、hbaに対する電力供給制御方法およびそのプログラム
JP4476190B2 (ja) 多重系計算機システム
JP4193754B2 (ja) データ二重化方法とプログラム