JP2018133766A - 処理装置、二重化システム、処理方法、および処理プログラム - Google Patents

処理装置、二重化システム、処理方法、および処理プログラム Download PDF

Info

Publication number
JP2018133766A
JP2018133766A JP2017027876A JP2017027876A JP2018133766A JP 2018133766 A JP2018133766 A JP 2018133766A JP 2017027876 A JP2017027876 A JP 2017027876A JP 2017027876 A JP2017027876 A JP 2017027876A JP 2018133766 A JP2018133766 A JP 2018133766A
Authority
JP
Japan
Prior art keywords
unit
processing unit
processing
state
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017027876A
Other languages
English (en)
Other versions
JP6861533B2 (ja
Inventor
野崎 達也
Tatsuya Nozaki
達也 野崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2017027876A priority Critical patent/JP6861533B2/ja
Publication of JP2018133766A publication Critical patent/JP2018133766A/ja
Application granted granted Critical
Publication of JP6861533B2 publication Critical patent/JP6861533B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Train Traffic Observation, Control, And Security (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

【課題】安定性を向上させることができる処理装置、二重化システム、処理方法、および処理プログラムを得ること。【解決手段】実施の形態の処理装置は、処理部と、監視部と、系切替部と、再起動部とを備えることを特徴とする。処理部は、現用系の処理を実行する。監視部は、処理部の状態を監視する。系切替部は、監視部の監視結果に基づいて、処理部の設定を現用系と待機系との間で切り替える。再起動部は、系切替部によって処理部が待機系に切り替えられた場合、および監視部の監視結果が再起動条件を満たす場合のうち少なくともいずれか一方の場合に、処理部を再起動する。【選択図】図1

Description

本発明は、処理装置、二重化システム、処理方法、および処理プログラムに関する。
従来、複数の処理装置の一方を現用系とし他方を待機系として運用する二重化システムが知られている。かかる二重化システムは、現用系の処理装置に重大な障害が発生した場合に、現用系の処理装置を待機系へ切り替え、待機系の処理装置を現用系へ切り替える(特許文献1参照)。
特開2007−207219号公報
上記従来の二重化システムでは、処理装置における障害の要因に応じて現用系と待機系とを切り替えるものであるが、二重化システムの安定性を図る観点から、さらなる改善を行うことが望ましい。
本発明は、上記に鑑みてなされたものであって、二重化システムの安定性を向上させることができる処理装置を得ることを目的とする。
上述した課題を解決し、目的を達成するために、本発明の処理装置は、処理部と、監視部と、系切替部と、再起動部とを備えることを特徴とする。前記処理部は、現用系の処理を実行する。前記監視部は、前記処理部の状態を監視する。前記系切替部は、前記監視部の監視結果に基づいて、前記処理部の設定を前記現用系と待機系との間で切り替える。前記再起動部は、前記系切替部によって前記処理部が待機系に切り替えられた場合、および前記処理部の設定が前記待機系であり且つ前記監視部の監視結果が再起動条件を満たす場合のうち少なくとも一方の場合に、前記処理部を再起動する。
本発明によれば、二重化システムの安定性を向上させることができる、という効果を奏する。
本発明の実施の形態1にかかる二重化システムの構成の一例を示す図 実施の形態1にかかる処理装置の構成の一例を示す図 実施の形態1にかかる第1のスコア判定テーブルの一例を示す図 実施の形態1にかかる第2のスコア判定テーブルの一例を示す図 実施の形態1にかかる現用系の系切替部による系切替条件と第1の評価値との関係を示す図 実施の形態1にかかる監視部および管理部の処理の一例を示すフローチャート 図6に示すステップS14の処理の一例を示すフローチャート 図7に示すステップS26の処理の一例を示すフローチャート 図6に示すステップS15の処理の一例を示すフローチャート 実施の形態1にかかる処理装置のハードウェア構成の一例を示す図 本発明の実施の形態2にかかる監視部および管理部の処理の一例を示すフローチャート 本発明の実施の形態3にかかる二重化システムの処理装置の構成の一例を示す図 実施の形態3にかかる処理装置の管理部の現用系管理処理の一例を示すフローチャート 実施の形態3にかかる処理装置の管理部の待機系管理処理の一例を示すフローチャート
以下に、本発明の実施の形態にかかる処理装置、二重化システム、処理方法、および処理プログラムを図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
実施の形態1.
図1は、本発明の実施の形態1にかかる二重化システムの構成の一例を示す図である。図1に示すように、実施の形態1にかかる二重化システム1は、処理装置2と処理装置2とを備える。二重化システム1では、処理装置2および処理装置2の一方が現用系として動作し、他方が待機系に設定されており、現用系と待機系とを切り替え可能である。
二重化システム1は、駅内に設置されており、駅内のネットワーク4に接続された複数の駅装置3とネットワーク6に接続された中央管理装置5との間の情報の送受信を行う通信端末システムである。なお、駅装置3は、旅券発行端末、自動改札機、および発車案内板といった駅内に設置される装置である。また、二重化システム1は、通信端末システムに限定されず、種々のシステムに適用することができ、設置場所も駅内に限定されない。
処理装置2および処理装置2は、互いに同一の構成であり、以下においては、処理装置2および処理装置2を総称して処理装置2と記載する場合がある。処理装置2は、処理部20と、監視部21と、系切替部41と、再起動部42とを備える。処理装置2の処理部20が第1の処理部の一例であり、処理装置2の処理部20が第2の処理部の一例である。また、処理装置2の監視部21が第1の監視部の一例であり、処理装置2の監視部21が第2の監視部の一例である。
処理部20は、現用系に設定されている場合に、現用系の処理を実行する。現用系の処理は、上述したように、複数の駅装置3と中央管理装置5との間の情報の送受信処理であるが、送受信処理以外の情報処理であってもよく、送受信処理に限定されない。
監視部21は、処理部20の状態を監視する。監視部21は、処理部20を構成するデバイス、処理部20の電源電圧、処理部20の温度、不図示のファンのうち少なくとも1つの状態を処理部20の状態として監視することができる。処理部20を構成するデバイスは、CPU、HDD、メモリといったデバイスであり、処理部20の温度は、処理部20の内部温度または処理部20の周辺温度である。
また、監視部21は、処理部20が現用系に設定されて動作した期間を処理部20の状態として監視することもできる。以下、処理部20が現用系に設定されて動作した積算時間を積算稼動期間と記載する場合がある。
監視部21は、処理部20を構成するデバイス、処理部20の電源電圧、処理部20の温度、ファンおよび積算稼動期間のうち少なくとも1つ以上の状態に基づいて、処理部20の評価値Ssを演算することができる。評価値Ssは、処理部20の状態が現用系の処理を実行できなくなる状態に近づくほど小さくなるように設定される。
系切替部41は、監視部21の監視結果に基づいて、現用系の処理を実行している処理部20の状態が予め設定された系切替条件を満たす場合に、処理部20の設定を現用系と待機系との間で切り替える。監視部21が上述した評価値Ssを演算する場合、上述した系切替条件を、監視部21で演算される評価値Ssが閾値Sth未満であるという条件にすることができる。
閾値Sthは、重度の異常が発生する前に評価値Ssが下回るように設定される。重度の異常とは、処理部20の状態が現用系の処理を実行できなくなる状態を示す。以下においては、処理部20が正常状態ではないものの処理部20の状態が現用系の処理を実行できる状態を軽度の異常という場合があり、また、処理部20の性能が正常状態よりも低下している状態を性能低下という場合がある。
評価値Ssが閾値Sth未満であるという条件を系切替条件にすることで、系切替部41は、重度の異常が処理部20に発生する前に、系切り替え、すなわち、現用系と待機系との間の切り替えを行うことができる。したがって、現用系の処理部20が動作中に系切り替えを行うことができ、重度の異常が発生した後に系切り替えを行う場合に比べ、系切り替えに要する時間を抑えることができ、現用系の処理への影響を低減することができる。なお、重度の異常が発生する前に処理部20の設定を現用系と待機系との間で切り替えることができればよく、評価値Ssによる系切り替えに限定されない。
また、再起動部42は、処理部20が待機系に設定されている場合に、監視部21の監視結果に基づいて、処理部20を再起動する。処理部20の処理を実行するOS(Operating System)およびOS上で稼動するプログラムの不具合が生じたような場合、再起動により処理部20の状態を正常な状態に戻すことができる。したがって、待機系に設定されている処理部20を現用系に切り替え可能な状態にすることができ、二重化システム1の安定性を向上させることができる。
ここで、処理装置2の処理部20が現用系に設定され、処理装置2の処理部20が待機系に設定されているとする。そして、処理装置2の系切替部41が処理装置2の処理部20の設定を現用系から待機系へ切り替え、処理装置2の系切替部41が処理装置2の処理部20の設定を待機系から現用系へ切り替えたとする。
処理装置2の再起動部42は、処理装置2の処理部20の設定が現用系から待機系へ切り替えられた後に、処理装置2の処理部20を再起動することができる。これにより、系切り替え後に、処理装置2の処理部20の状態を正常な状態に戻して、次回の系切り替えを可能にすることができ、二重化システム1の安定性を向上させることができる。以下、処理装置2の構成および処理について具体的に説明する。
図2は、実施の形態1にかかる処理装置2の構成の一例を示す図である。図2に示すように、実施の形態1にかかる処理装置2は、通信部10と、電源部11と、ファン12と、制御部13とを備える。
通信部10は、第1の通信部16と、第2の通信部17とを備える。第1の通信部16は、ネットワーク4を介して他の処理装置2および複数の駅装置3との間で情報の送受信を行う。第2の通信部17は、ネットワーク6を介して中央管理装置5との間で情報の送受信を行う。ネットワーク4およびネットワーク6は、イントラネットであるが、イントラネット以外のネットワークであってもよい。
電源部11は、通信部10および制御部13に供給する電圧を生成し、通信部10および制御部13へ出力する。ファン12は、制御部13から出力される駆動電圧に基づいて、制御部13の内部を冷却する。
制御部13は、処理部20と、監視部21と、管理部22とを備える。処理部20は、現用系に設定されている場合、現用系の処理である送受信処理を実行する。なお、上述したように、現用系の処理は、送受信処理に限定されず、他の処理を実行してもよい。
監視部21は、デバイス監視部31と、RAS(Reliability Availability Serviceability)監視部32と、評価値演算部33とを備える。デバイス監視部31は、処理部20を構成するデバイスの状態を監視する。処理部20を構成するデバイスには、CPU(Central Processing Unit)、HDD(Hard Disk Drive)、およびメモリが含まれる。CPU、メモリ、およびHDDは、後述する図10のプロセッサ101、メモリ102、およびHDD103である。メモリは、CPUがプログラムを実行する際にデータを一時的に記憶するCPUの作業領域である。
デバイス監視部31は、CPU状態検出部34と、HDD状態検出部35と、メモリ状態検出部36とを備え、処理部20を構成するデバイスの性能の低下度合いを監視することができる。CPU状態検出部34は、CPUの状態が正常状態、注意状態、および警告状態の3つの状態のうちいずれであるかを検出する。警告状態は、注意状態よりも悪い状態であるが、CPUが動作していない故障状態よりも良い状態である。
CPU状態検出部34は、CPUの使用率に基づいてCPUの状態を検出することができる。CPUの使用率は、単位時間あたりにCPUが何らかの処理を行っている時間の割合を意味し、CPUの負荷率とも呼ばれる。CPUの使用率が高いほどCPUの負荷が大きくなり、CPUの処理速度が遅くなってCPUの処理が遅延する可能性が高くなる。CPU状態検出部34は、CPUの使用率が高くなるほどCPUの状態が悪いと判定する。
具体的には、CPU状態検出部34は、CPUの使用率が第1閾値Rth1未満である場合、CPUが正常状態であると判定し、CPUの使用率が第1閾値Rth1以上かつ第2閾値Rth2未満である場合にCPUが注意状態であると判定する。また、CPU状態検出部34は、CPUの使用率が第2閾値Rth2以上である場合、CPUが警告状態であると判定する。
また、CPU状態検出部34は、CPUが動作しない場合、または、CPUの使用率が第2閾値Rth2よりも高い第3閾値Rth3以上である状態が継続した場合に、CPUが故障状態であることを検出することもできる。
HDD状態検出部35は、SMART(Self-Monitoring Analysis and Reporting Technology)情報をHDDから取得し、取得したSMART情報に基づいて、HDDの状態を検出する。SMART情報には、CPUによるHDDからのデータの読み込み時のエラー割合、スループット能力値、通算通電時間、HDDの全体的な処理能力値、およびHDDの温度といった情報が含まれる。
HDD状態検出部35は、SMART情報に基づいて、HDDの状態が正常状態、注意状態、および警告状態の3つの状態のうちいずれであるかを検出する。HDD状態検出部35は、SMART情報を構成する各情報に重み付けを行い、重み付け後の値を合算することで、HDDの性能の劣化状態を数値化することができる。
HDD状態検出部35は、演算した数値に基づいて、CPUの場合と同様に、HDDの状態を3つの状態のいずれであるかを判定する。なお、HDDの性能は、エラー割合が高いほど悪くなり、通算通電時間が長いほど悪くなり、スループット能力値が下がるほど悪くなる。また、HDD状態検出部35は、HDDが故障して動作しなくなった場合、HDDが故障状態であることを検出することができる。
メモリ状態検出部36は、メモリの状態を検出する。メモリ状態検出部36は、メモリの使用率および故障セクタの割合に基づいて、メモリの状態を検出することができる。メモリの使用率は、メモリの記憶容量全体のうちCPUが使用しているメモリの割合を意味する。
メモリ状態検出部36は、メモリの使用率と故障セクタの割合とに重み付けを行い、重み付け後の値を合算することで、メモリの状態を数値化することができる。メモリ状態検出部36は、演算した数値に基づいて、CPUの場合と同様に、メモリの状態を3つの状態のいずれであるかを判定することができる。また、メモリ状態検出部36は、メモリが動作しなくなった場合、メモリが故障状態であることを検出することができる。
RAS監視部32は、処理部20の温度、処理部20の電源電圧、およびファン12の状態を監視する。RAS監視部32は、温度状態検出部37と、電圧状態検出部38と、ファン状態検出部39とを備える。
温度状態検出部37は、処理部20の温度状態を検出する。温度状態検出部37は、処理部20の温度Tcが高いほど処理部20の温度状態が悪いと判定する。具体的には、温度状態検出部37は、処理部20の温度Tcが第1閾値Tcth1未満である場合、処理部20の温度状態が正常状態であると判定し、処理部20の温度Tcが第1閾値Tcth1以上かつ第2閾値Tcth2未満である場合に処理部20の温度状態が注意状態であると判定する。
また、温度状態検出部37は、処理部20の温度Tcが第2閾値Tcth2以上かつ第3閾値Tcth3未満である場合、処理部20の温度状態が警告状態であると判定し、処理部20の温度Tcが第3閾値Tcth3以上である場合、処理部20の温度状態が故障状態であると判定する。第3閾値Tcth3は、処理装置2の定格温度To以上に設定される。
電圧状態検出部38は、処理部20に供給される電源電圧Vcの状態を検出する。電圧状態検出部38は、処理部20に供給される電源電圧Vcが低いほど電源電圧Vcの状態が悪いと判定する。具体的には、電圧状態検出部38は、電源電圧Vcが第1閾値Vcth1以上である場合、電源電圧Vcの状態が正常状態であると判定し、電源電圧Vcが第1閾値Vcth1未満かつ第2閾値Vcth2以上である場合に電源電圧Vcの状態が注意状態であると判定する。
また、電圧状態検出部38は、電源電圧Vcが第2閾値Vcth2未満かつ第3閾値Vcth3以上である場合、電源電圧Vcの状態が警告状態であると判定し、電源電圧Vcが第3閾値Vcth3未満である場合、電源電圧Vcの状態が故障状態であると判定する。
ファン状態検出部39は、ファン12の状態を検出する。ファン状態検出部39は、ファン12の停止時間Tsが長いほどファン12の状態が悪いと判定することができる。ファン12の停止時間Tsとは、稼動すべきファン12が何らかの要因で停止している時間であり、ファン12の継続停止時間または単位時間当たりのファン12の停止時間である。
ファン状態検出部39は、ファン12の停止時間Tsが第1閾値Tsth1未満である場合にファン12の状態が正常状態であると判定し、ファン12の停止時間Tsが第1閾値Tsth1以上かつ第2閾値Tsth2未満である場合にファン12の状態が注意状態であると判定する。また、ファン状態検出部39は、ファン12の停止時間Tsが第2閾値Tsth2以上かつ第3閾値Tsth3未満である場合にファン12の状態が警告状態であると判定する。
ファン状態検出部39は、ファン12の停止時間Tsが第3閾値Tsth3以上である場合にファン12の状態が故障状態であると判定する。なお、ファン状態検出部39は、停止時間Tsに加えて、または、停止時間Tsに代えて、ファン12の累積稼動時間が長いほどファン12の状態が悪いと判定することもできる。
評価値演算部33は、監視部21による監視結果に基づいて、評価値Ssを演算する。評価値Ssは、上述したように、処理部20の状態が現用系の処理を実行できなくなる状態に近づくほど小さくなるように設定される。
評価値演算部33は、第1のスコア判定テーブル50と、第2のスコア判定テーブル51を有しており、第1のスコア判定テーブル50と第2のスコア判定テーブル51とに基づいて、評価値Ssを算出することができる。
図3は、第1のスコア判定テーブル50の一例を示す図である。図3に示すように、第1のスコア判定テーブル50は、CPUの状態、HDDの状態、およびメモリの状態と3つのスコアSa,Sb,Scとの関係を規定するテーブルである。
図3に示す例では、CPUの状態が正常状態である場合、「100」の値が割り当てられ、CPUの状態が注意状態である場合、「60」の値が割り当てられ、CPUの状態が警告状態である場合、「30」の値が割り当てられる。また、CPUの重み付けとして、「1.0」が設定される。
CPUのスコアSaは、CPUの状態とCPUの重み付けとに基づいて演算される。CPUの状態が正常状態である場合、Sa=100×1.0=100であり、CPUの状態が注意状態である場合、Sa=60×1.0=60であり、CPUの状態が警告状態である場合、Sa=30×1.0=30である。
同様に、HDDのスコアSbは、HDDの状態と重み付けとに基づいて演算される。HDDの状態が正常状態である場合、Sb=100×0.5=50であり、HDDの状態が注意状態である場合、Sb=55×0.5=27.5であり、HDDの状態が警告状態である場合、Sb=20×0.5=10である。
同様に、メモリのスコアScは、メモリの状態と重み付けとに基づいて演算される。メモリの状態が正常状態である場合、Sc=100×0.5=50であり、メモリの状態が注意状態である場合、Sc=50×0.5=25であり、メモリの状態が警告状態である場合、Sc=10×0.5=5である。
図4は、第2のスコア判定テーブル51の一例を示す図である。図4に示すように、第2のスコア判定テーブル51は、処理部20の温度状態、電源電圧Vcの状態、およびファン12の状態と3つのスコアSd,Se,Sfとの関係を規定するテーブルである。
温度のスコアSdは、上述したスコアSa〜Scの場合と同様に、温度状態と重み付けとに基づいて演算される。温度の状態が正常状態である場合、Sd=100×0.75=75であり、温度の状態が注意状態である場合、Sd=60×0.75=45であり、温度の状態が警告状態である場合、Sd=30×0.75=22.5である。
同様に、電源電圧VcのスコアSeは、電源電圧Vcの状態と重み付けとに基づいて演算される。電源電圧Vcの状態が正常状態である場合、Se=100×1.0=100であり、電源電圧Vcの状態が注意状態である場合、Se=70×1.0=70であり、電源電圧Vcの状態が警告状態である場合、Se=40×1.0=40である。
同様に、ファン12のスコアSfは、ファン12の状態と重み付けとに基づいて演算される。ファン12の状態が正常状態である場合、Sf=100×0.5=50であり、ファン12の状態が注意状態である場合、Sf=50×0.5=25であり、ファン12の状態が警告状態である場合、Sf=10×0.5=5である。
評価値演算部33は、下記式(1)に示すように、上述した6つのスコアSa〜Sfの合計値であるスコア合計値Stを演算する。
St=Sa+Sb+Sc+Sd+Se+Sf ・・・(1)
そして、評価値演算部33は、下記式(2)に示すように、正常状態である場合のスコアSa〜Sfの合計値である正常時合計Stnでスコア合計値Stを除算することで、評価値Ssを求める。なお、第1のスコア判定テーブル50および第2のスコア判定テーブル51が図3および図4に示す状態である場合、Stn=100+50+50+75+100+50=425である。
Ss=St/Stn ・・・(2)
各スコア判定テーブル50,51は、外部からの設定要求があった場合に設定要求に含まれる値が監視部21によって設定される。これにより、各スコア判定テーブル50,51を容易に更新することができる。
また、各スコア判定テーブル50,51は、評価値演算部33に複数設けられてもよく、評価値演算部33は、時間帯、季節、および湿度のうち少なくとも1つによって各スコア判定テーブル50,51を切り替えることで、評価値Ssの判定精度をより向上させることができる。
なお、評価値Ssの算出は、上述した演算方法に限定されない。検出部34〜39においてスコアSa〜Sfを演算することができる。この場合、評価値演算部33は、検出部34〜39から通知されるスコアSa〜Sfに基づいて評価値Ssを演算することもできる。
また、監視部21は、上述した処理の一部を行うこともできる。監視部21は、6つのスコアSa〜Sfのうち5つ以下のスコアを用いて評価値Ssを演算することもできる。また、各スコア判定テーブル50,51において、上述したような正常状態、注意状態、および警告状態の3つの状態に各々異なる値を割り当てるものでなくてもよく、4つ以上の状態に各々異なる値を割り当てることもできる。
評価値演算部33は、定期的に評価値Ssを算出しており、評価値Ssを算出する毎に、算出した評価値Ssを管理部22へ通知することができる。また、評価値演算部33は、算出した評価値Ssを他の処理装置2へ通知することができる。具体的には、処理装置2の評価値演算部33は、算出した評価値Ssを通信部10およびネットワーク4を介して処理装置2へ通知することができる。また、処理装置2の評価値演算部33は、算出した評価値Ssを通信部10およびネットワーク4を介して処理装置2へ通知することができる。
また、監視部21は、CPUの状態、HDDの状態、メモリの状態、処理部20の温度状態、電源電圧Vcの状態、およびファン12の状態が上述した故障状態になった場合、故障状態を示す情報を系切替部41へ通知することができる。
図2に示す制御部13の管理部22は、系切替部41と、再起動部42とを備える。系切替部41は、監視部21から通知される故障状態を示す情報、監視部21から通知される評価値Ss、および他の処理装置2から通知される評価値Ssに基づいて、現用系の処理を実行している処理部20の設定を待機系へ変更する。また、系切替部41は、他の処理装置2から系切替要求があった場合に、処理部20の設定を待機系から現用系へ変更する。
ここで、説明の便宜上、処理部20が現用系に設定されている処理装置2を現用系の処理装置2とし、処理部20が待機系に設定されている処理装置2を待機系の処理装置2とする。現用系の処理装置2の監視部21、系切替部41、および再起動部42を現用系の監視部21、系切替部41、および再起動部42とする。待機系の処理装置2の監視部21、系切替部41、および再起動部42を待機系の監視部21、系切替部41、および再起動部42とする。
現用系の系切替部41は、現用系の監視部21から故障状態を示す情報が通知された場合に、現用系に設定された処理部20の設定を待機系へ変更する系切り替えを行うことができる。これにより、現用系に設定された処理部20が現用系の処理を継続できない状況になった場合に、系切り替えを行うことができる。
現用系の系切替部41は、系切り替えを行う場合、待機系の系切替部41へ系切替要求を通信部10およびネットワーク4を介して送信する。待機系の系切替部41は、待機系に設定されている処理部20を現用系に切り替える処理を実行し、切り替え処理が終了した場合に、現用系の系切替部41へ切替応答を送信する。現用系の系切替部41は、切替応答を受信した後、現用系に設定されている処理部20を待機系へ切り替えることで、系切り替えを完了する。
また、現用系の系切替部41は、現用系の監視部21から通知される評価値Ssと、待機系の監視部21から通知される評価値Ssとに基づいて、系切り替えを行うことができる。以下においては、現用系の監視部21から通知される評価値Ssを第1の評価値Ss1とし、待機系の監視部21から通知される評価値Ssを第2の評価値Ss2とする。
系切替部41は、第1の閾値Sth1の情報および第2の閾値Sth2の情報を記憶しており、第1の評価値Ss1、第2の評価値Ss2、第1の閾値Sth1、および第2の閾値Sth2に基づいて、上述した系切り替えを行うことができる。第1の閾値Sth1と第2の閾値Sth2との関係は、Sth1>Sth2である。
図5は、現用系の系切替部41による系切替条件と第1の評価値Ss1との関係を示す図である。図5に示すように、現用系の系切替部41は、第1の評価値Ss1が第1の閾値Sth1以上である場合、系切り替えを行わず、現用系の処理を実行している処理部20の設定を維持する。
また、現用系の系切替部41は、第1の評価値Ss1が第1の閾値Sth1未満である場合に、系切り替えを行う。これにより、処理部20の状態が現用系の処理を実行できなくなる状態になる前に系切り替えを行うことができ、処理部20を故障状態になった後に系切り替えを行う場合に比べて、現用系の処理への影響を低減することができる。
現用系の系切替部41は、第1の評価値Ss1が第1の閾値Sth1未満かつ第2の閾値Sth2以上である場合、指定時間に系切り替えを行う。指定時間は、予め設定された時間であり、現用系の処理が実行されない時間帯または現用系の処理が少ない時間帯の中から指定される。これにより、処理部20の状態が現用系の処理を実行できなくなる可能性が高くない状態では、現用系の処理への影響が少ない時間帯で系切り替えを行うことができ、現用系の処理への影響を低減することができる。したがって、二重化システム1の安定性を向上させることができる。
また、現用系の系切替部41は、第1の評価値Ss1が第2の閾値Sth2未満である場合、指定時間であるか否かにかかわらず、直ちに系切り替えを行う。これにより、処理部20の状態が現用系の処理を実行できなくなる可能性が高い状態では、直ちに系切り替えを行うことができ、現用系の処理への影響を低減することができる。したがって、二重化システム1の安定性を向上させることができる。
なお、系切替部41は、Ss1<Sth1である場合であっても、第2の評価値Ss2が第1の閾値Sth1以上でない場合には、系切り替えを行わないことができる。また、系切替部41は、Ss1<Sth1である場合であっても、第1の評価値Ss1が第2の評価値Ss2よりも小さく且つ第1の評価値Ss1と第2の評価値Ss2との差ΔSsが第3の閾値Sth3未満である場合には、系切り替えを行わないことができる。これにより、待機系の処理部20の状態が悪い状態である場合に、系切り替えが行われることを抑制でき、二重化システム1の安定性を向上させることができる。
図2に示す再起動部42は、待機系に設定された処理部20を再起動する。処理部20の再起動には、処理部20において動作するOSの再起動またはOS上で動作するプログラムの再起動である。なお、処理部20の再起動は、OSおよびOS上で動作するプログラムのうち少なくとも一つの初期化処理を含んでもよい。
再起動部42は、系切替部41によって処理部20の設定が現用系から待機系へ切り替えられた後に、待機系に切り替えられた処理部20を再起動する。再起動により処理部20の状態を正常な状態に戻して待機系へ変更された処理部20を現用系に切り替え可能な状態にすることができ、二重化システム1の安定性を向上させることができる。
また、Sth1>Ss≧Sth2の場合に、指定時間に系切り替えが行われるため、再起動部42は、系切り替え後に再起動を行うことで、現用系の処理が実行されない時間帯または現用系の処理が少ない時間帯に再起動を行うことができる。したがって、指定時間に系切り替えが行われた直後に再度系切り替えが必要になった場合であっても、現用系の処理への影響を抑えることができ、二重化システム1の安定性を向上させることができる。
つづいて、処理装置2における監視部21および管理部22の動作を、フローチャートを用いて説明する。図6は、実施の形態1にかかる監視部21および管理部22の処理の一例を示すフローチャートであり、図6のフローチャートに記載された一連の処理が繰り返し実行される。
図6に示すように、監視部21は、デバイス監視情報を生成し(ステップS10)、RAS監視情報を生成する(ステップS11)。デバイス監視情報は、上述したCPUの状態、HDDの状態、およびメモリの状態を示す情報であり、RAS監視情報は、上述した処理部20の温度状態、電源電圧Vcの状態、およびファン12の状態を示す情報である。監視部21は、生成したデバイス監視情報およびRAS監視情報に基づいて、上述した評価値Ssを演算する(ステップS12)。
次に、管理部22は、処理部20が現用系に設定されているか否かを判定する(ステップS13)。管理部22は、処理部20が現用系に設定されていると判定した場合(ステップS13:Yes)、現用系管理処理を実行して(ステップS14)、図6に示す処理を終了する。ステップS14の処理は、図7に示すステップS20〜S30の処理であり、後で詳述する。
また、管理部22は、処理部20が現用系に設定されていないと判定した場合(ステップS13:No)、待機系管理処理を実行し(ステップS15)、図6に示す処理を終了する。ステップS15の処理は、図9に示すステップS40〜S50の処理であり、後で詳述する。
図7は、図6に示すステップS14の処理の一例を示すフローチャートである。図7に示すように、管理部22は、待機系の処理装置2から評価値要求を受信したか否かを判定する(ステップS20)。管理部22は、評価値要求を受信したと判定した場合(ステップS20:Yes)、通信部10およびネットワーク4を介して待機系の処理装置2へ第1の評価値Ss1を送信する(ステップS21)。
ステップS21の処理後、管理部22は、待機系の処理装置2から系切替要求を受信したか否かを判定する(ステップS22)。管理部22は、系切替要求を受信したと判定した場合(ステップS22:Yes)、処理部20の設定を現用系から待機系へ切り替え(ステップS23)、切替応答を系切替要求の送信元の処理装置2へ送信する(ステップS24)。なお、系切り替えは、現用系の処理が中断しないようにまたは現用系の処理の中断が短時間になるように現用系の処理部20と待機系の処理部20とで系切り替えの処理が行われる。
管理部22は、評価値要求を受信していないと判定した場合(ステップS20:No)、待機系の処理装置2から第2の評価値Ss2を取得する(ステップS25)。次に、管理部22は、系切替条件を満たすか否かを判定する(ステップS26)。ステップS26の処理は、図8に示すステップS31〜S39の処理であり、後で詳述する。
管理部22は、系切替条件を満たすと判定した場合(ステップS26:Yes)、通信部10およびネットワーク4を介して待機系である他の処理装置2へ系切替要求を送信する(ステップS27)。つづいて、管理部22は、他の処理装置2から切替応答を受信したか否かを判定する(ステップS28)。
管理部22は、切替応答を受信していない場合(ステップS28:No)、ステップS28の処理を繰り返す。管理部22は、切替応答を受信した場合(ステップS28:Yes)、処理部20の設定を現用系から待機系へ切り替え(ステップS29)、処理部20の再起動を実行する(ステップS30)。なお、以下において、ステップS30の再起動を系切替後再起動と記載する場合がある。
図8は、図7に示すステップS26の処理の一例を示すフローチャートである。図8に示すように、管理部22は、第1の評価値Ss1が第1の閾値Sth1以上であるか否かを判定する(ステップS31)。管理部22は、第1の評価値Ss1が第1の閾値Sth1以上ではないと判定した場合(ステップS31:No)、第2の評価値Ss2が第1の閾値Sth1以上であるか否かを判定する(ステップS32)。
管理部22は、第2の評価値Ss2が第1の閾値Sth1以上ではないと判定した場合(ステップS32:No)、第2の評価値Ss2が第2の閾値Sth2以上であるか否かを判定する(ステップS33)。管理部22は、第2の評価値Ss2が第2の閾値Sth2以上であると判定した場合(ステップS33:Yes)、第1の評価値Ss1と第2の評価値Ss2との評価値差ΔSsが第3の閾値Sth3以上であるか否かを判定する(ステップS34)。なお、ΔSs=Ss2−Ss1である。
管理部22は、Ss2≧Sth1であると判定した場合(ステップS32:Yes)、または、ΔSs≧Sth3であると判定した場合(ステップS34:Yes)、第1の評価値Ss1が第2の閾値Sth2以上であるか否かを判定する(ステップS37)。
管理部22は、Ss1≧Sth2であると判定した場合(ステップS37:Yes)、予め設定された指定時間が到来しているか否かを判定する(ステップS38)。管理部22は、Ss1≧Sth2ではないと判定した場合(ステップS37:No)、または、予め設定された指定時間が到来していると判定した場合(ステップS38:Yes)、系切替条件を満たすと判定する(ステップS39)。
管理部22は、Ss1≧Sth1であると判定した場合(ステップS31:Yes)、Ss2≧Sth2ではないと判定した場合(ステップS33:No)、ΔSs≧Sth3ではないと判定した場合(ステップS34:No)、指定時間が到来していないと判定した場合(ステップS38:No)、系切替条件を満たさないと判定する(ステップS35)。
図9は、図6に示すステップS15の処理の一例を示すフローチャートである。図9に示すように、管理部22は、系切替後再起動の直後であるか否かを判定する(ステップS40)。管理部22は、系切替後再起動の直後ではないと判定した場合(ステップS40:No)、通信部10およびネットワーク4を介して現用系の処理装置2へ第2の評価値Ss2を送信する(ステップS41)。
つづいて、管理部22は、現用系の処理装置2から系切替要求を受信したか否かを判定する(ステップS42)。系切替要求を受信したと判定した場合(ステップS42:Yes)、処理部20を待機系から現用系へ切り替えを行い(ステップS43)、系切替要求の送信元の処理装置2へ切替応答を送信する(ステップS44)。
管理部22は、ステップS40において、系切替後再起動の直後であると判定した場合(ステップS40:Yes)、現用系の処理装置2へ評価値要求を行い、現用系の処理装置2から第1の評価値Ss1を取得する(ステップS45)。そして、管理部22は、ステップS26の処理と同様に、系切替条件を満たすか否かを判定する(ステップS46)。
管理部22は、系切替条件を満たすと判定した場合(ステップS46:Yes)、処理部20の現用系へ切り替えの準備を行い(ステップS47)、通信部10およびネットワーク4を介して現用系の処理装置2へ系切替要求を送信する(ステップS48)。つづいて、管理部22は、系切替要求の送信先の処理装置2から切替応答を受信したか否かを判定する(ステップS49)。管理部22は、切替応答を受信していないと判定した場合(ステップS49:No)、ステップS49の処理を繰り返す。
管理部22は、切替応答を受信したと判定した場合(ステップS49:Yes)、処理部20の設定を現用系へ切り替えて、処理部20に現用系の処理の実行を開始させる(ステップS50)。管理部22は、ステップS44の処理が終了した場合、ステップS50の処理が終了した場合、系切替要求を受信していないと判定した場合(ステップS42:No)、系切替条件を満たさないと判定した場合(ステップS46:No)、図9に示す処理を終了する。
図10は、実施の形態1にかかる処理装置2のハードウェア構成の一例を示す図である。図10に示すように、処理装置2は、プロセッサ101と、メモリ102と、HDD103と、インタフェース回路104とを備えるコンピュータである。プロセッサ101、メモリ102、HDD103、およびインタフェース回路104は、バス105によって互いにデータの送受信が可能である。通信部10は、インタフェース回路104によって実現される。
プロセッサ101は、HDD103に記憶されたOSおよび処理プログラムを読み出して実行することによって、処理部20、監視部21、および管理部22の機能を実行する。なお、プロセッサ101は、磁気ディスク、USB(Universal Serial Bus)メモリ、光ディスク、コンパクトディスク、およびDVD(Digital Versatile Disc)のうち一つ以上の記憶媒体から不図示のインタフェースを介してOSおよび処理プログラムを読み出しHDD103に記憶して実行することもできる。
プロセッサ101は、処理回路の一例であり、CPU、DSP(Digital Signal Processer)、およびシステムLSI(Large Scale Integration)のうち一つ以上を含む。メモリ102は、プロセッサ101の作業領域として用いられる記憶領域であり、RAM(Random Access Memory)に代表される不揮発性または揮発性の半導体メモリである。
以上のように、実施の形態1にかかる処理装置2は、処理部20と、監視部21と、系切替部41と、再起動部42とを備える。処理部20は、現用系の処理を実行する。監視部21は、処理部20の状態を監視する。系切替部41は、監視部21の監視結果に基づいて、処理部20の設定を現用系と待機系との間で切り替える。再起動部42は、系切替部41によって処理部20が待機系に切り替えられた場合、または、監視部21の監視結果が再起動条件を満たす場合に、処理部20を再起動する。処理部20の再起動によって、状態が悪くなった処理部20の状態が正常な状態に戻る可能性を増加させることができ、二重化システム1の安定性を向上させることができる。
また、監視部21は、処理部20の状態に基づく第1の評価値Ss1を演算すると共に、他の処理装置2における処理部20の状態に基づく第2の評価値Ss2を他の処理装置2から取得する。系切替部41は、第1の評価値Ss1と第2の評価値Ss2とに基づいて、現用系と待機系との間で処理部20の設定を切り替える。現用系の評価値と待機系の評価値を用いることで、現用系の処理部20の状態と待機系の処理部20の状態とを容易かつ適切に比較することができ、二重化システム1の安定性を向上させることができる。
また、系切替部41は、処理部20が現用系として設定されている場合に、第1の評価値Ss1が第1の閾値Sth1未満である場合に、処理部20の設定を現用系から待機系へ切り替える。再起動部42は、系切替部41によって処理部20の設定が現用系から待機系へ切り替えられた後に、処理部20を再起動する。第1の評価値Ss1が第1の閾値Sth1未満である場合に、処理部20の設定を現用系から待機系へ切り替えることから、第1の閾値Sth1を適切に設定することで、現用系の処理への影響を抑えつつ、系切り替えを行うことができる。
また、系切替部41は、処理部20が現用系として設定されている状態で、第1の評価値Ss1が第1の閾値Sth1未満であり且つ第2の閾値Sth2以上であると判定した場合、予め設定された時間に到達した場合に処理部20の設定を現用系から待機系へ切り替える。予め設定された時間に系切り替えを行うことから、処理部20の状態が現用系の処理を実行できなくなる可能性がそれほど高くない状態においては、現用系の処理への影響が少ない時間帯で系切り替えを行うことができ、現用系の処理への影響を低減することができる。
また、系切替部41は、処理部20が現用系として設定されている状態で、第1の評価値Ss1が第2の閾値Sth2未満であると判定した場合、予め設定された時間に到達したか否かにかかわらず処理部20の設定を現用系から待機系へ切り替える。これにより、処理部20の状態が現用系の処理を実行できなくなる可能性が高い状態では、すぐに系切り替えを行うことができ、現用系の処理への影響を低減することができる。
また、系切替部41は、処理部20が現用系に設定されている場合、第1の評価値Ss1が第2の評価値Ss2よりも低く第1の評価値Ss1と第2の評価値Ss2との差ΔSsが第3の閾値Sth3以上である場合に、処理部20の設定を現用系から待機系へ切り替える。これにより、現用系の処理装置2と評価値Ssにあまり差が無い待機系の処理装置2へ系切り替えが行われることを抑制することができ、系切り替えが頻繁に行われることを防止し、二重化システム1の安定性を向上させることができる。
また、監視部21は、処理部20を構成するデバイス、処理部20の電源電圧、および
処理部20の温度の少なくとも1つの状態を処理部20の状態として監視する。
実施の形態2.
実施の形態2の二重化システムは、処理装置2の再起動部42が第1の評価値Ss1と第2の評価値Ss2とに基づいて、再起動を実行する処理が追加される点で、実施の形態1の二重化システム1と異なる。なお、実施の形態2における二重化システムの処理装置は、再起動部の処理が一部異なる以外は、実施の形態1における処理装置2と同様の構成かつ同様の処理を行うことから、同一符号を用いることとし、実施の形態1と異なる処理について主に説明する。
実施の形態2にかかる二重化システム1は、待機系に設定されている処理装置2の再起動部42が、第2の評価値Ss2に基づいて、待機系の処理部20を再起動する。
具体的には、待機系の再起動部42は、第2の評価値Ss2が第4の閾値Sth4未満である場合に、待機系の処理部20を再起動することができる。これにより、待機系の処理部20が現用系へ系切り替えされたとしたら現用系の処理を実行できなくなる可能性がある場合に、待機系の再起動によって、処理部20の状態が正常な状態に回復する可能性を高めることができ、二重化システム1の安定性を向上させることができる。
また、待機系の再起動部42は、第2の評価値Ss2が第4の閾値Sth4未満である場合であっても、第1の評価値Ss1が第2の評価値Ss2よりも大きく且つ第1の評価値Ss1と第2の評価値Ss2との差ΔSsが第5の閾値Sth5以上でなければ、待機系の処理部20を再起動させないこともできる。これにより、現用系の処理部20の状態がよい場合に待機系の処理部20の再起動を行うことができる。したがって、現用系の処理部20と待機系の処理部20とが同時期に再起動することを回避することができ、二重化システム1の安定性を向上させることができる。
待機系の再起動部42は、第1の評価値Ss1が第1の閾値Sth1未満かつ第2の閾値Sth2以上であって、かつ、指定時間までの期間が予め設定された期間T1よりも短い場合、第2の評価値Ss2が第4の閾値Sth4未満でであっても、待機系の処理部20を再起動させないこともできる。これにより、現用系の処理部20と待機系の処理部20とが同時期に再起動することを回避することができ、二重化システム1の安定性を向上させることができる。
図11は、実施の形態2にかかる監視部21および管理部22の処理の一例を示すフローチャートである。図11に示すステップS40〜S50は、図9のステップS40〜S50の処理であるため、説明を省略する。
図11に示すように、管理部22は、系切替要求を受信していないと判定した場合(ステップS42:No)、現用系の処理装置2から第1の評価値Ss1を取得する(ステップS51)。そして、管理部22は、第2の評価値Ss2、または、第1の評価値Ss1および第2の評価値Ss2に基づき、再起動条件を満たすか否かを判定する(ステップS52)。
管理部22は、再起動条件を満たすと判定した場合(ステップS52:Yes)、処理部20の再起動を実行する(ステップS53)。管理部22は、再起動条件を満たさないと判定した場合(ステップS52:No)、図11に示す処理を終了する。
以上のように、実施の形態2にかかる処理装置2の再起動部42は、処理部20が待機系として設定されている場合に、第2の評価値Ss2が第4の閾値Sth4未満である場合に、処理部20を再起動する。これにより、待機系の処理部20が現用系へ系切り替えされたとしたら現用系の処理を実行できなくなる可能性がある場合に、待機系の再起動によって、処理部20の状態が正常な状態に回復する可能性を高めることができ、二重化システム1の安定性を向上させることができる。
実施の形態3.
実施の形態1,2にかかる二重化システム1は、第1の閾値Sth1および第2の閾値Sth2を用いて、系切り替え処理および再起動処理を行ったが、実施の形態3にかかる二重化システムは、第1の閾値Sth1および第2の閾値Sth2を用いない点で、実施の形態1,2の二重化システム1と異なる。なお、以下において、実施の形態1,2における処理装置2と同様の構成については、同一符号を用いて説明を省略し、実施の形態1,2と異なる処理について主に説明する。
図12は、実施の形態3にかかる二重化システム1Aの処理装置2Aの構成の一例を示す図である。図12に示すように、処理装置2Aは、通信部10と、電源部11と、ファン12と、制御部13Aとを備える。制御部13Aは、処理部20と、監視部21と、管理部22Aとを備える。管理部22Aは、系切替部41Aと、再起動部42とを備える。処理装置2Aは、処理装置2と同様のハードウェア構成であり、図10に示すハードウェア構成と同様の構成である。
現用系の系切替部41Aは、第1の評価値Ss1と第2の評価値Ss2とを比較し、かかる比較結果に基づいて、系切り替え処理を実行する。具体的には、現用系の系切替部41Aは、第1の評価値Ss1と第2の評価値Ss2との評価値差ΔSsが第6の閾値Sth6以上である場合に、系切替条件を満たすと判定し、系切り替え処理を実行する。これにより、評価値Ssが第6の閾値Sth6以上高い方の処理部20が現用系として用いられることから、二重化システム1Aの安定性を向上させることができる。なお、ΔSs=Ss2−Ss1である。
また、再起動部42は、現用系から待機系へ切り替えられた処理部20を再起動する。かかる再起動により処理部20の状態を正常な状態に戻して次の系切替時までに処理部20の状態を改善することができ、二重化システム1Aの安定性を向上させることができる。
また、実施の形態3にかかる二重化システム1Aにおいては、第2の評価値Ss2が第1の評価値Ss1よりも第6の閾値Sth6以上になる毎に、系切り替えが実行される。したがって、第6の閾値Sth6を小さく設定することで、処理部20の状態を近づけることができ、二重化システム1Aの安定性を向上させることができる。
実施の形態3にかかる処理装置2Aは、処理装置2と同様に、図6の処理を行うが、ステップS14,S15の処理が処理装置2と一部異なる。図13は、実施の形態3にかかる処理装置2Aの管理部22Aの現用系管理処理の一例を示すフローチャートであり、図7に対応するフローチャートである。図13に示すステップS25,S27〜S30は、図7に示すステップS25,S27〜S30と同じである。図13に示す処理では、図7に示すステップS20〜S24の処理は行われず、図13に示すステップS26Aの処理が図7に示すステップS26の処理と異なる。
図13に示すように、管理部22Aは、ステップS26Aにおいて、第1の評価値Ss1と第2の評価値Ss2との評価値差ΔSsが第6の閾値Sth6以上であるか否かを判定する。管理部22Aは、評価値差ΔSsが第6の閾値Sth6以上であると判定した場合(ステップS26A:Yes)に、処理をステップS27に移行し、評価値差ΔSsが第6の閾値Sth6以上ではないと判定した場合(ステップS26A:No)に、図13に示す処理を終了する。
図14は、実施の形態3にかかる処理装置2Aの管理部22Aの待機系管理処理の一例を示すフローチャートであり、図9に対応するフローチャートである。図14に示すステップS40〜S45,S47〜S50は、図9に示すステップS40〜S45,S47〜S50と同じであるが、図14に示すステップS46Aの処理が図9に示すステップS46の処理と異なる。
図14に示すように、管理部22Aは、ステップS46Aにおいて系切替条件を満たすか否かを判定するが、系切替条件は、ステップS24Aの処理と同じである。すなわち、管理部22Aは、評価値差ΔSsが第6の閾値Sth6以上である場合に、系切替条件を満たすと判定し(ステップS46A:Yes)、評価値差ΔSsが第6の閾値Sth6以上でない場合に系切替条件を満たさないと判定する(ステップS46A:No)。
なお、第1の評価値Ss1と第2の評価値Ss2は、積算稼動期間の値とすることができる。これにより、2つの処理装置2の処理部20間の積算稼動期間に一定時間以上の差がある場合に、系切り替え処理が行われる。したがって、2つの処理部20を現用系と待機系とで交互に切り替えることができ、積算稼動期間の平滑化を行うことができ、処理部20が待機系として継続して稼動しないことによる影響で動作しない状態になることを回避することができる。また、複数の処理装置2のうち評価値Ssが高い処理装置2を優先して使用することで、安定度の高い処理装置2で現用系の処理を実行させることができる。したがって、二重化システム1Aの安定性を向上させることができる。
以上のように、実施の形態3にかかる処理装置2Aの系切替部41Aは、第1の評価値Ss1が第2の評価値Ss2よりも低く第1の評価値Ss1と第2の評価値Ss2との差ΔSsが第6の閾値Sth6以上である場合に、処理部20の設定を現用系から待機系へ切り替える。したがって、評価値Ssが第6の閾値Sth6以上高い方の処理部20が現用系として用いられることから、二重化システム1Aの安定性を向上させることができる。
以上の実施の形態に示した構成は、本発明の内容の一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、本発明の要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。
1,1A 二重化システム、2,2A 処理装置、3 駅装置、4,6 ネットワーク、5 中央管理装置、10 通信部、11 電源部、12 ファン、13,13A 制御部、16 第1の通信部、17 第2の通信部、20 処理部、21 監視部、22,22A 管理部、31 デバイス監視部、32 RAS監視部、33 評価値演算部、34 CPU状態検出部、35 HDD状態検出部、36 メモリ状態検出部、37 温度状態検出部、38 電圧状態検出部、39 ファン状態検出部、41,41A 系切替部、42 再起動部、50 第1のスコア判定テーブル、51 第2のスコア判定テーブル。

Claims (10)

  1. 現用系の処理を実行する処理部と、
    前記処理部の状態を監視する監視部と、
    前記監視部の監視結果に基づいて、前記処理部の設定を前記現用系と待機系との間で切り替える系切替部と、
    前記系切替部によって前記処理部が前記待機系に切り替えられた場合、および前記処理部の設定が前記待機系であり且つ前記監視部の監視結果が再起動条件を満たす場合のうち少なくとも一方の場合に、前記処理部を再起動する再起動部と、を備える
    ことを特徴とする処理装置。
  2. 前記監視部は、
    前記処理部の状態に基づく第1の評価値を演算すると共に、前記現用系の処理を実行する他の処理装置の状態に基づく第2の評価値を前記他の処理装置から取得し、
    前記系切替部は、
    前記第1の評価値と前記第2の評価値とに基づいて、前記現用系と前記待機系との間で前記処理部の設定を切り替える
    ことを特徴とする請求項1に記載の処理装置。
  3. 前記系切替部は、
    前記処理部が前記現用系として設定されている場合に、前記第1の評価値が第1の閾値未満である場合に、前記処理部の設定を前記現用系から前記待機系へ切り替え、
    前記再起動部は、
    前記系切替部によって前記処理部の設定が前記現用系から前記待機系へ切り替えられた後に、前記処理部を再起動する
    ことを特徴とする請求項2に記載の処理装置。
  4. 前記再起動部は、
    前記処理部が前記待機系として設定され、かつ、前記第1の評価値が第4の閾値未満である場合に、前記処理部を再起動する
    ことを特徴とする請求項2に記載の処理装置。
  5. 前記系切替部は、
    前記第1の評価値と前記第2の評価値とを比較し、比較した結果に基づいて、前記現用系と前記待機系との間で前記処理部を切り替える
    ことを特徴とする請求項2に記載の処理装置。
  6. 前記系切替部は、
    前記処理部が前記現用系に設定されている場合、前記第1の評価値が前記第2の評価値未満かつ前記第1の評価値と前記第2の評価値との差が第3の閾値以上である場合に、前記処理部の設定を前記現用系から前記待機系へ切り替える
    ことを特徴とする請求項5に記載の処理装置。
  7. 前記再起動部は、
    前記第1の評価値が第4の閾値未満の場合に、前記処理部を再起動する
    ことを特徴とする請求項6に記載の処理装置。
  8. 第1の処理部および第2の処理部のうち一方を現用系に設定し他方を待機系に設定して動作する二重化システムにおいて、
    前記第1の処理部の状態を監視する第1の監視部と、
    前記第2の処理部の状態を監視する第2の監視部と、
    前記第1の監視部および前記第2の監視部のうち少なくとも一方の監視結果に基づいて、前記第1の処理部の設定を前記現用系と前記待機系との間で切り替える系切替部と、
    前記系切替部によって前記第1の処理部が前記待機系に切り替えられた場合、および前記第1の処理部の設定が前記待機系であり且つ前記監視結果が再起動条件を満たす場合のうち少なくとも一方の場合に、前記第1の処理部を再起動させる再起動部と、を備える
    ことを特徴とする二重化システム。
  9. 現用系の処理を実行する処理部の状態を監視する監視ステップと、
    前記監視ステップにおける監視結果に基づいて、前記処理部の設定を前記現用系と待機系との間で切り替える切替ステップと、
    前記切替ステップによって前記処理部が前記待機系に切り替えられた場合、および前記処理部の設定が前記待機系であり且つ前記監視ステップの監視結果が再起動条件を満たす場合のうち少なくとも一方の場合に、前記処理部を再起動する再起動ステップと、を含む
    ことを特徴とする処理方法。
  10. 現用系の処理を実行する処理部の状態を監視する監視ステップと、
    前記監視ステップにおける監視結果に基づいて、前記処理部の設定を前記現用系と待機系との間で切り替える切替ステップと、
    前記切替ステップによって前記処理部が前記待機系に切り替えられた場合、および前記処理部の設定が前記待機系であり且つ前記監視ステップの監視結果が再起動条件を満たす場合のうち少なくとも一方の場合に、前記処理部を再起動する再起動ステップと、
    をコンピュータに実行させることを特徴とする処理プログラム。
JP2017027876A 2017-02-17 2017-02-17 処理装置、二重化システム、処理方法、および処理プログラム Active JP6861533B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017027876A JP6861533B2 (ja) 2017-02-17 2017-02-17 処理装置、二重化システム、処理方法、および処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017027876A JP6861533B2 (ja) 2017-02-17 2017-02-17 処理装置、二重化システム、処理方法、および処理プログラム

Publications (2)

Publication Number Publication Date
JP2018133766A true JP2018133766A (ja) 2018-08-23
JP6861533B2 JP6861533B2 (ja) 2021-04-21

Family

ID=63248625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017027876A Active JP6861533B2 (ja) 2017-02-17 2017-02-17 処理装置、二重化システム、処理方法、および処理プログラム

Country Status (1)

Country Link
JP (1) JP6861533B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111845867A (zh) * 2020-07-16 2020-10-30 中车青岛四方车辆研究所有限公司 列车网络控制系统中央控制单元的数据安全冗余方法
CN112172879A (zh) * 2020-10-09 2021-01-05 国电南京自动化股份有限公司 一种主备控制中心切换方法及轨道交通综合监控系统
JP7419150B2 (ja) 2020-04-20 2024-01-22 株式会社東芝 駅務機器、センターサーバー装置、およびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0836502A (ja) * 1994-07-25 1996-02-06 Fujitsu Ltd 情報処理システム
JP2004054907A (ja) * 2002-05-31 2004-02-19 Omron Corp プログラマブルコントローラ及びcpuユニット並びに通信ユニット及び通信ユニットの制御方法
US7609618B1 (en) * 2005-12-15 2009-10-27 Cisco Technology, Inc. Dynamically controlling HSRP preemption dependent on stateful NAT convergence
CN101827035A (zh) * 2010-05-19 2010-09-08 迈普通信技术股份有限公司 保证优雅重启的方法以及双主控网络设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0836502A (ja) * 1994-07-25 1996-02-06 Fujitsu Ltd 情報処理システム
JP2004054907A (ja) * 2002-05-31 2004-02-19 Omron Corp プログラマブルコントローラ及びcpuユニット並びに通信ユニット及び通信ユニットの制御方法
US7609618B1 (en) * 2005-12-15 2009-10-27 Cisco Technology, Inc. Dynamically controlling HSRP preemption dependent on stateful NAT convergence
CN101827035A (zh) * 2010-05-19 2010-09-08 迈普通信技术股份有限公司 保证优雅重启的方法以及双主控网络设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7419150B2 (ja) 2020-04-20 2024-01-22 株式会社東芝 駅務機器、センターサーバー装置、およびプログラム
CN111845867A (zh) * 2020-07-16 2020-10-30 中车青岛四方车辆研究所有限公司 列车网络控制系统中央控制单元的数据安全冗余方法
CN112172879A (zh) * 2020-10-09 2021-01-05 国电南京自动化股份有限公司 一种主备控制中心切换方法及轨道交通综合监控系统

Also Published As

Publication number Publication date
JP6861533B2 (ja) 2021-04-21

Similar Documents

Publication Publication Date Title
JP4920391B2 (ja) 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
JP4060322B2 (ja) アプリケーション管理装置およびそのソフトウェアを格納した記憶媒体
US20100205607A1 (en) Method and system for scheduling tasks in a multi processor computing system
US8479038B1 (en) Method and apparatus for achieving high availability for applications and optimizing power consumption within a datacenter
US10133330B2 (en) Cluster system, controller, method for controlling, and computer-readable recording medium having stored therein controlling program that operate node at the combination of the respective load setting values that satisfy required performance and lowers power consumption
JP6861533B2 (ja) 処理装置、二重化システム、処理方法、および処理プログラム
US20160036654A1 (en) Cluster system
US9049101B2 (en) Cluster monitor, method for monitoring a cluster, and computer-readable recording medium
CN112199240B (zh) 一种节点故障时进行节点切换的方法及相关设备
JP2012037969A (ja) ストレージシステム、制御装置および制御方法
JP2019095893A (ja) 半導体装置
JP2016224883A (ja) 異常検出方法、情報処理装置および異常検出プログラム
US20120239988A1 (en) Computing unit, method of managing computing unit, and computing unit management program
JP6551111B2 (ja) 情報処理装置、ダウン判定方法、クラスタシステム、及びプログラム
JP2009003537A (ja) 計算機
US20130318310A1 (en) Processor processing method and processor system
JP2007226399A (ja) 計算機制御方法、計算機、計算機制御プログラム及び計算機システム
JP2017083935A (ja) 情報処理装置、クラスタシステム、クラスタリング方法、及びプログラム
JP6112205B2 (ja) 情報処理システム、装置、方法及びプログラム
US9847673B2 (en) Active power transfer switch control to reduce service impacts due to electrical power interruptions
JP2021043725A (ja) 計算システム、計算方法及びプログラム
JP5169729B2 (ja) ノード装置、冗長システム、電力制御方法およびプログラム
JP7057178B2 (ja) 管理ノード、ノード、クラスタシステムおよびノード制御方法
JP4983806B2 (ja) 二重化タイマを用いたシステム監視装置、および監視方法
CN116795195A (zh) 一种多cpu模组的主板系统、主板的控制方法及计算设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210302

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210330

R150 Certificate of patent or registration of utility model

Ref document number: 6861533

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250