JP5596322B2 - 多重化サービスプロセッサ、多重化サービスプロセッサの障害処理方法、およびプログラム - Google Patents

多重化サービスプロセッサ、多重化サービスプロセッサの障害処理方法、およびプログラム Download PDF

Info

Publication number
JP5596322B2
JP5596322B2 JP2009216908A JP2009216908A JP5596322B2 JP 5596322 B2 JP5596322 B2 JP 5596322B2 JP 2009216908 A JP2009216908 A JP 2009216908A JP 2009216908 A JP2009216908 A JP 2009216908A JP 5596322 B2 JP5596322 B2 JP 5596322B2
Authority
JP
Japan
Prior art keywords
service processor
processor
unit
storage area
diagnostic data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009216908A
Other languages
English (en)
Other versions
JP2011065521A (ja
Inventor
直樹 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Computertechno Ltd
Original Assignee
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Computertechno Ltd filed Critical NEC Computertechno Ltd
Priority to JP2009216908A priority Critical patent/JP5596322B2/ja
Publication of JP2011065521A publication Critical patent/JP2011065521A/ja
Application granted granted Critical
Publication of JP5596322B2 publication Critical patent/JP5596322B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、多重化サービスプロセッサ、多重化サービスプロセッサの障害処理方法、およびプログラムに関する。
多重化サービスプロセッサの障害処理の例が、特許文献1に記載されている。特許文献1の技術は、現用系中央処理装置で障害が発生したときに、現用系サービスプロセッサと予備系サービスプロセッサ間の通信を行い、現用系中央処理装置を停止し、予備系中央処理装置を起動させる構成である。
また、マルチプロセッサシステムの異常診断処理の1例が、特許文献2に記載されている。特許文献2の技術は、隣接する共有メモリに対して診断データを書き込み、読み出すことにより、トーラス状に結合したマルチプロセッサシステムの異常を検出する構成である。
特開昭63−85939号公報 特開平2−148333号公報
特許文献1、特許文献2の技術では、予備系サービスプロセッサからのプロセッサ間通信のみで、現用系サービスプロセッサの状態監視を実施する場合に、現用系のサービスプロセッサがストールしているのか、サービスプロセッサ間インターフェースの障害が発生しているのか切り分けができず、現用系サービスプロセッサが正常動作しているにもかかわらず、現用系のサービスプロセッサのストール監視の誤検出で予備系サービスプロセッサへの切り替えが誤って行われることを防止する技術の記載がない。
本発明の目的は、上記問題点を解決する多重化サービスプロセッサ、多重化サービスプロセッサの障害処理方法、およびプログラムを提供することである。
本発明の多重化サービスプロセッサは、複数のサービスプロセッサを有する多重化サービスプロセッサにおいて、前記サービスプロセッサは、前記サービスプロセッサ間で時刻を同期させる時刻同期処理部と、前記サービスプロセッサ間とのプロセッサ間通信を監視するプロセッサ間監視処理部と、同期した前記時刻の所定時間の経過をトリガにして現用系の前記サービスプロセッサによるユニット内の共有格納領域への診断データの書き込み、待機系の前記サービスプロセッサによる前記ユニット内の前記共有格納領域からの読み出し、および前記プロセッサ間通信による監視の一連の自己診断処理を自律的に順次実行して前記サービスプロセッサの障害の切り分けを行い待機系の前記サービスプロセッサへの切り替え処理を行う診断処理部と、を備える。
本発明の多重化サービスプロセッサの障害処理方法は、複数のサービスプロセッサを有する多重化サービスプロセッサの障害処理方法において、前記サービスプロセッサ間で時刻を同期させる時刻同期処理ステップと、前記サービスプロセッサ間とのプロセッサ間通信を監視するプロセッサ間監視処理ステップと、同期した前記時刻の所定時間の経過をトリガにして現用系の前記サービスプロセッサによるユニット内の共有格納領域への診断データの書き込み、待機系の前記サービスプロセッサによる前記ユニット内の前記共有格納領域からの読み出し、および前記プロセッサ間通信による監視の一連の自己診断処理を自律的に順次実行して前記サービスプロセッサの障害の切り分けを行い待機系の前記サービスプロセッサへの切り替え処理を行う診断処理ステップと、を含む。
本発明のプログラムは、複数のサービスプロセッサを有する多重化サービスプロセッサのプログラムにおいて、前記サービスプロセッサ間で時刻を同期させる時刻同期処理と、前記サービスプロセッサ間とのプロセッサ間通信を監視するプロセッサ間監視処理と、同期した前記時刻の所定時間の経過をトリガにして現用系の前記サービスプロセッサによるユニット内の共有格納領域への診断データの書き込み、待機系の前記サービスプロセッサによる前記ユニット内の前記共有格納領域からの読み出し、および前記プロセッサ間通信による監視の一連の自己診断処理を自律的に順次実行して前記サービスプロセッサの障害の切り分けを行い待機系の前記サービスプロセッサへの切り替え処理を行う診断処理と、をコンピュータに実行させる。
本発明の効果は、現用系のサービスプロセッサのストール監視の誤検出で予備系サービスプロセッサへの切り替えが誤って行われることを防止できることである。
本発明の第1の実施の形態である多重化サービスプロセッサ(1)10の構成図である。 本発明の第2の実施の形態である多重化サービスプロセッサ(2)20の構成図である。 サービスプロセッサ内レジスタ(2)59の診断データの1例である。 本発明の第2の実施の形態である多重化サービスプロセッサ(2)20の動作を示すフローチャートの1例である(1/2)。 本発明の第2の実施の形態である多重化サービスプロセッサ(2)20の動作を示すフローチャートの1例である(2/2)。 本発明の第3の実施の形態である多重化サービスプロセッサ(3)80の構成図である。
次に、本発明の第1の実施の形態について図面を参照して詳細に説明する。
図1は、本発明の第1の実施の形態である多重化サービスプロセッサ(1)10の構成図である。
多重化サービスプロセッサ(1)10は、サービスプロセッサ(11)11と、サービスプロセッサ(21)12と、ユニット93と、サービスプロセッサ間通信インタフェースケーブル97と、ユニット間インタフェース(11)95と、ユニット間インタフェース(12)96とから構成されている。
サービスプロセッサ(11)11と、サービスプロセッサ(21)12は同一の構成であるが、以下の説明では、サービスプロセッサ(11)11は運用中の現用系のサービスプロセッサであり、サービスプロセッサ(21)12は待機している待機系のサービスプロセッサであると想定している。
ユニット93は、CPU(中央処理装置)、IOP(入出力ユニット)、メモリ(記憶装置)等のサービスプロセッサ(11)11、およびサービスプロセッサ(21)12の被診断装置の1つである。
サービスプロセッサ(11)11は、ユニット93で障害が発生したときには、ユニット93で行われた自己診断の結果をユニット間インタフェース(11)95を経由して受信し、ユニット93に対する障害処理を行うユニット93の診断プロセッサである。
また、ユニット間インタフェース(11)95は、診断プロセッサであるサービスプロセッサ(11)11と、被診断装置であるユニット93との間の診断インタフェースである。
サービスプロセッサ(11)11は、プロセッサ間監視処理部(3)13と、時刻同期処理部(3)14と、診断処理部(3)15とから構成されている。
また、同様に、サービスプロセッサ(21)12は、プロセッサ間監視処理部(4)16と、時刻同期処理部(4)17と、診断処理部(4)18とから構成されている。
現用系のサービスプロセッサ(11)11のプロセッサ間監視処理部(3)13は、待機系のサービスプロセッサ(21)12のプロセッサ間監視処理部(4)16と連携して、サービスプロセッサ(11)11、およびサービスプロセッサ(21)12間とのプロセッサ間通信を行い、お互いに他のサービスプロセッサが正常に動作しているがどうかを監視する。
時刻同期処理部(3)14は、サービスプロセッサ(11)11、およびサービスプロセッサ(21)12間で時刻を同期させ、同じ時刻に設定する。
現用系のサービスプロセッサ(11)11の診断処理部(3)15は、診断データをユニット93内の共有格納領域94へ書き込む。
待機系のサービスプロセッサ(21)12の診断処理部(4)18は、共有格納領域94から診断データを読み出す。
待機系のサービスプロセッサ(21)12の診断処理部(4)18は、同期した前記時刻の所定時間の経過をトリガにして、診断データのユニット内の共有格納領域94への書き込み処理、共有格納領域94からの読み出し処理、プロセッサ間通信処理の一連の自己診断処理を自律的に順次実行し、現用系サービスプロセッサ、待機系サービスプロセッサ、ユニット間インタフェースのいずれかで障害が発生しているかどうかの切り分けを行い、待機系の前記サービスプロセッサへの切り替え処理を行う。
尚、プロセッサ間監視処理部(3)13と、時刻同期処理部(3)14と、診断処理部(3)15は、ハードウェアで実現してもよいしソフトウェアで実現してもよい。
このため、本発明の第1の実施の形態である多重化サービスプロセッサ(1)10は、現用系サービスプロセッサに異常がなく、両系間の経路上の障害が発生した等の現用系のサービスプロセッサのストール監視の誤検出で、予備系サービスプロセッサへの切り替えが誤って行われることを防止できる。
その理由は、現用系のサービスプロセッサによるユニット内の共有レジスタへの診断データの書き込み処理、待機系の前記サービスプロセッサによる共有レジスタからの読み出し処理、およびプロセッサ間通信の監視処理の一連の自己診断処理を自律的に順次実行することにより、現用系サービスプロセッサ、待機系サービスプロセッサ、ユニット間インタフェースの障害切り分けを行い、待機系の前記サービスプロセッサへの切り替え処理を行うような構成を採用したためである。
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。
図2は、本発明の第2の実施の形態である多重化サービスプロセッサ(2)20の構成図である。
多重化サービスプロセッサ(2)20は、サービスプロセッサ(12)30と、サービスプロセッサ(22)50と、サービスプロセッサ間通信インタフェースケーブル(1)21と、コネクタ(1)22と、コネクタ(2)23と、ユニット(1)70と、ユニット間インタフェース(21)24と、ユニット間インタフェース(22)25とから構成されている。
サービスプロセッサ(12)30は、プロセッサ間監視処理部(1)31と、時刻同期処理部(1)32と、診断処理部(1)35とから構成されている。
プロセッサ間監視処理部(1)31は、サービスプロセッサ(22)50内のプロセッサ間監視処理部(2)51とプロセッサ間通信を行う。
時刻同期処理部(1)32は、時計(1)34と、同期処理部(1)33から構成されている。同期処理部(1)33は、サービスプロセッサ(22)50内の時刻同期処理部(2)53と連携して、時計(1)34と時計(2)54の時刻を同期させ、同じ時刻に設定する。
診断処理部(1)35は、診断データ書込処理部(1)36と、診断データ読出処理部(1)37と、診断データ比較処理部(1)38と、障害切分処理部(1)40と、サービスプロセッサ内レジスタ(1)39とから構成されている。
同様に、サービスプロセッサ(22)50は、プロセッサ間監視処理部(2)51と、時刻同期処理部(2)52と、診断処理部(2)55とから構成されている。
プロセッサ間監視処理部(2)51は、サービスプロセッサ(12)30内のプロセッサ間監視処理部(1)31と、サービスプロセッサ間通信インタフェースケーブル(1)21、コネクタ(1)22、およびコネクタ(2)23経由でプロセッサ間通信を行う。
時刻同期処理部(2)52は、時計(2)54と、同期処理部(2)53から構成されている。同期処理部(2)53は、サービスプロセッサ(12)30内の時刻同期処理部(1)33と連携して、時計(1)34と時計(2)54の時刻を同期させ、同じ時刻に設定する。
診断処理部(2)55は、診断データ書込処理部(2)56と、診断データ読出処理部(2)57と、診断データ比較処理部(2)58と、障害切分処理部(2)60と、サービスプロセッサ内レジスタ(2)59とから構成されている。
サービスプロセッサ間通信インタフェースケーブル(1)21は、サービスプロセッサ(12)30内のプロセッサ間監視処理部(1)31と、サービスプロセッサ(22)50内のプロセッサ間監視処理部(2)51との間で、プロセッサ間通信を行うための通信路である。
ユニット(1)70は、診断データ書込読出処理部(1)71と、共有レジスタ72とから構成されている。
サービスプロセッサ(12)30、およびサービスプロセッサ(22)50は、それぞれ、本発明の第1の実施の形態である多重化サービスプロセッサ(1)10のサービスプロセッサ(11)11と、サービスプロセッサ(21)12の1例である。
また、プロセッサ間監視処理部(1)31、時刻同期処理部(1)32、および診断処理部(1)35は、それぞれ、本発明の第1の実施の形態である多重化サービスプロセッサ(1)10のプロセッサ間監視処理部(3)13と、時刻同期処理部(3)14と、診断処理部(3)15の1例である。
尚、プロセッサ間監視処理部(1)31、時刻同期処理部(1)32、および診断処理部(1)35は、ハードウェアで実現してもよいしソフトウェアで実現してもよい。
図3は、サービスプロセッサ内レジスタ(2)59の診断データの1例である。
診断データとして、プロセッサ番号(例プロセッサ#1)、時刻(例日、時、分、秒)を示している。
次に、本発明の第2の実施の形態における多重化サービスプロセッサ(2)20の動作について、図2、図4、図5を参照して説明する。
まず、サービスプロセッサ(12)30の同期処理部(1)33は、サービスプロセッサ(22)50の同期処理部(2)53と時刻の同期処理(同じ時刻t0にする)を実施する(ステップ31)。
次に、診断データ書込処理部(1)36は、プロセッサ番号と現在時刻(診断データ)をユニット(1)70へ出力する(ステップS32)。
ユニット(1)70の診断データ書込読出処理部(1)71は、診断データを共有レジスタ72に書き込む(ステップS50)。
診断処理部(2)55は、時刻t0から所定時間t2が経過したかどうかを判断する(ステップ41)。
ここで、t2は、サービスプロセッサ(12)30によるユニット(1)70内の共有レジスタ72への書き込み処理が終了する時間に基づいて予め設定されている。
サービスプロセッサ(22)50の診断処理部(2)55は、時刻t0から所定時間t2経過したと判断したとき(ステップS41/YES)、診断データ書込処理部(2)56は、ユニット(1)70内の共有レジスタ72の値を読み出し、サービスプロセッサ内レジスタ(2)59へ格納する(ステップS42)。
一方、サービスプロセッサ(12)30の診断処理部(1)35は、時刻t0から所定時間t1が経過したかどうかを判断する(ステップ33)。
ここで、t1は、サービスプロセッサ(12)30による共有レジスタ72への書き込み処理とサービスプロセッサ(22)50の共有レジスタ72からの読み出し処理が終了する時間に基づいて設定される。
診断処理部(1)35は、時刻t0から所定時間t1が経過したと判断したとき(ステップS33/YES)、診断データ書込処理部(1)36は、プロセッサ番号と現在時刻(診断データ)をユニット(1)70へ出力する(ステップS34)。
ユニット(1)70の診断データ書込読出処理部(1)71は、診断データを共有レジスタ72に書き込む(ステップS51)。
また、診断処理部(2)55は、時刻t0から所定時間t3が経過したかどうかを判断する(ステップ43)。
ここで、t3は、サービスプロセッサ(12)30による共有レジスタ72への再度の書き込み処理が終了する時間に基づいて設定されている。
診断処理部(2)55は、時刻t0から所定時間t3が経過したと判断したとき(ステップS43/YES)、障害切分処理部(2)60は、共有レジスタ72からの読み出しが可であるかを判断する(ステップS44)。
障害切分処理部(2)60は、共有レジスタ72からの読み出しが不可であると判断したとき(ステップS44/NO)、サービスプロセッサ(22)50、ユニット(1)70、ユニット間インタフェース(22)25のいずれかで障害が発生していると判断する(ステップS45)。
障害切分処理部(2)60が、共有レジスタ72からの読み出しが可であると判断したとき(ステップS44/YES)、診断データ比較処理部(2)58は、読み出した値と、サービスプロセッサ内レジスタ(2)59の値を比較し、同一かどうかを判断する(ステップS46)。
診断データ比較処理部(2)58は、読み出した値とサービスプロセッサ内レジスタ(2)59の値とを比較し、同一でないと判断したとき(ステップS46/NO)、読み出した値をサービスプロセッサ内レジスタ(2)59へ格納して、ステップS31へ戻る(ステップS47)。
診断データ比較処理部(2)58が、読み出した値と、サービスプロセッサ内レジスタ(2)59の値を比較し、同一であると判断したとき(ステップS46/YES)、診断処理部(2)55は、時刻t0から所定時間t4が経過したかどうかを判断する(ステップS60)。
ここで、t4は、t0から診断データ比較処理部(2)58によって読み出した値と、サービスプロセッサ内レジスタ(2)59の値を比較し、同一であると判断するまでの処理時間に基づいて設定されている。
診断処理部(2)55は、時刻t0から所定時間t4が経過したと判断したとき(ステップS60/YES)、プロセッサ間監視処理部(2)51は、サービスプロセッサ(12)30内のプロセッサ間監視処理部(1)31とプロセッサ間通信を実施する(ステップS61)。
次に、障害切分処理部(2)60は、プロセッサ間通信が可であるかどうかを判断する(ステップS62)。
障害切分処理部(2)60は、プロセッサ間通信が可であると判断したとき(ステップS62/YES)、サービスプロセッサ(12)30、ユニット間インタフェース(21)24のいずれかで障害が発生したと判断する(ステップS62)。
障害切分処理部(2)60は、プロセッサ間通信が不可であると判断したとき(ステップS62/NO)、サービスプロセッサ(12)30がストールしていると判断する(ステップS63)。
診断処理部(2)55は、その後、サービスプロセッサ(22)50を運用系に切り替えて動作を継続する(ステップS65)。
このため、本発明の第2の実施の形態である多重化サービスプロセッサ(2)20は、現用系サービスプロセッサに異常がなく、両系間の経路上の障害が発生したとき等の現用系のサービスプロセッサのストール監視の誤検出で、予備系サービスプロセッサへの切り替えが誤って行われることを防止できる。
その理由は、現用系のサービスプロセッサによるユニット内の共有レジスタへの診断データの書き込み処理、待機系の前記サービスプロセッサによる共有レジスタからの読み出し処理、およびプロセッサ間通信の監視処理の一連の自己診断処理を自律的に順次実行することにより、現用系サービスプロセッサ、待機系サービスプロセッサ、ユニット間インタフェースの障害切り分けを行い、待機系の前記サービスプロセッサへの切り替え処理を行うような構成を採用したためである。
また、多重化サービスプロセッサ(2)20は、サービスプロセッサが待機系に切り替わるときに発生する新たな障害によるシステムダウンの発生を低減できる。
その理由は、現用系のサービスプロセッサによるユニット内の共有レジスタへの診断データの書き込み処理、待機系の前記サービスプロセッサによる共有レジスタからの読み出し処理、およびプロセッサ間通信の監視処理の一連の自己診断処理を自律的に順次実行することにより、現用系サービスプロセッサ、待機系サービスプロセッサ、ユニット間インタフェースの障害切り分けを行い、待機系の前記サービスプロセッサへの切り替え処理を行うような構成を採用したためである。
次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。
図6は、本発明の第3の実施の形態である多重化サービスプロセッサ(3)80の構成図である。
本発明の第3の実施の形態である多重化サービスプロセッサ(3)80と、本発明の第2の実施の形態である多重化サービスプロセッサ(2)20との違いは、サービスプロセッサ(13)81内の診断処理部(5)41の診断データ乱数処理部(1)42と、サービスプロセッサ(23)82内の診断処理部(6)43の診断データ乱数処理部(2)44と、ユニット(2)90の共有メモリ92である。
診断データ乱数処理部(1)42は、乱数を発生し、診断データはプロセッサ番号と乱数とし、前回の診断データと今回の診断データを異なるようにする。
尚、共有メモリ92は、診断専用のメモリではなく、ユニット(2)90内に元々設けられている記憶装置の一部を利用したものでもよい。
診断データ書込読出処理部(2)91は、共有メモリ92への診断データの書き込み、共有メモリ92からの診断データの読み出しを行う。
このため、本発明の第3の実施の形態である多重化サービスプロセッサ(3)80は、現用系サービスプロセッサに異常がなく、両系間の経路上の障害が発生したとき等の現用系のサービスプロセッサのストール監視の誤検出で、予備系サービスプロセッサへの切り替えが誤って行われることを防止できる。
その理由は、現用系のサービスプロセッサによるユニット内の共有メモリへの診断データの書き込み処理、待機系の前記サービスプロセッサによる共有メモリからの読み出し処理、およびプロセッサ間通信の監視処理の一連の自己診断処理を自律的に順次実行することにより、現用系サービスプロセッサ、待機系サービスプロセッサ、ユニット間インタフェースの障害切り分けを行い、待機系の前記サービスプロセッサへの切り替え処理を行うような構成を採用したためである。
10 多重化サービスプロセッサ(1)
11 サービスプロセッサ(11)
12 サービスプロセッサ(21)
13 プロセッサ間監視処理部(3)
14 時刻同期処理部(3)
15 診断処理部(3)
16 プロセッサ間監視処理部(4)
17 時刻同期処理部(4)
18 診断処理部(4)
20 多重化サービスプロセッサ(2)
21 サービスプロセッサ間通信インタフェースケーブル(1)
22 コネクタ(1)
23 コネクタ(2)
24 ユニット間インタフェース(21)
25 ユニット間インタフェース(22)
30 サービスプロセッサ(12)
31 プロセッサ間監視処理部(1)
32 時刻同期処理部(1)
33 同期処理部(1)
34 時計(1)
35 診断処理部(1)
36 診断データ書込処理部(1)
37 診断データ読出処理部(1)
38 診断データ比較処理部(1)
39 サービスプロセッサ内レジスタ(1)
40 障害切分処理部(1)
41 診断処理部(5)
42 診断データ乱数処理部(1)
43 診断処理部(6)
44 診断データ乱数処理部(2)
50 サービスプロセッサ(22)
51 プロセッサ間監視処理部(2)
52 時刻同期処理部(2)
53 同期処理部(2)
54 時計(2)
55 診断処理部(2)
56 診断データ書込処理部(2)
57 診断データ読出処理部(2)
58 診断データ比較処理部(2)
59 サービスプロセッサ内レジスタ(2)
60 障害切分処理部(2)
70 ユニット(1)
71 診断データ書込読出処理部(1)
72 共有レジスタ
80 多重化サービスプロセッサ(3)
81 サービスプロセッサ(13)
82 サービスプロセッサ(23)
90 ユニット(2)
91 診断データ書込読出処理部(2)
92 共有メモリ
93 ユニット
94 共有格納領域
95 ユニット間インタフェース(11)
96 ユニット間インタフェース(12)
97 サービスプロセッサ間通信インタフェースケーブル

Claims (15)

  1. 複数のサービスプロセッサを有する多重化サービスプロセッサにおいて、
    前記サービスプロセッサは、前記サービスプロセッサ間で時刻を同期させる時刻同期処理部と、
    前記サービスプロセッサ間とのプロセッサ間通信を監視するプロセッサ間監視処理部と、
    同期した前記時刻の所定時間の経過をトリガにして現用系の前記サービスプロセッサによるユニット内の共有格納領域への診断データの書き込み、待機系の前記サービスプロセッサによる前記ユニット内の前記共有格納領域からの読み出し、および前記プロセッサ間通信による監視の一連の自己診断処理を自律的に順次実行して前記サービスプロセッサの障害の切り分けを行い待機系の前記サービスプロセッサへの切り替え処理を行う診断処理部と、を備え、
    前記時刻同期処理部は、前記サービスプロセッサ間で時計の前記時刻を同期させる同期処理部を備え、
    前記現用系の前記サービスプロセッサの前記診断処理部は、前記診断データを前記ユニット内の前記共有格納領域に書き込む診断データ書込処理部を備え、
    前記待機系の前記サービスプロセッサの前記診断処理部は、前記ユニット内の前記共有格納領域から前記診断データを読み出しサービスプロセッサ内レジスタに書き込む診断データ読出処理部と、前記現用系の前記サービスプロセッサによる前記診断データの前記共有領域への再度の書き込みが行われた後に前記共有格納領域から読み出した前記診断データおよび前記サービスプロセッサ内レジスタの値を比較する診断データ比較処理部と、前記共有格納領域からの読み出しが不可の場合前記待機系の前記サービスプロセッサ、前記ユニットおよびユニット間インタフェースのいずれかに障害が発生したと判断し、前記共有格納領域からの読み出しが可の場合で且つ前記プロセッサ間通信が不可のとき前記現用系の前記サービスプロセッサの障害が発生したと判断し、前記共有格納領域からの読み出しが可の場合で且つ前記プロセッサ間通信が可のとき前記現用系の前記サービスプロセッサ、前記ユニットおよび前記ユニット間インタフェースのいずれかの障害が発生したと判断する障害切分処理部と、を備えることを特徴とする多重化サービスプロセッサ。
  2. 前記診断データが、前記サービスプロセッサのプロセッサ番号、および時刻であることを特徴とする請求項1に記載の多重化サービスプロセッサ。
  3. 前記診断処理部は、診断データとして乱数を発生させる診断データ乱数処理部を備え、
    前記診断データが前記サービスプロセッサのプロセッサ番号および乱数データであることを特徴とする請求項1に記載の多重化サービスプロセッサ。
  4. 前記共有格納領域が共有レジスタであることを特徴とする請求項1から請求項3のいずれか1項に記載の多重化サービスプロセッサ。
  5. 前記共有格納領域が共有メモリであることを特徴とする請求項1乃至請求項3のいずれか1項に記載の多重化サービスプロセッサ。
  6. 複数のサービスプロセッサを有する多重化サービスプロセッサの障害処理方法において、
    前記サービスプロセッサ間で時刻を同期させる時刻同期処理ステップと、
    前記サービスプロセッサ間とのプロセッサ間通信を監視するプロセッサ間監視処理ステップと、
    同期した前記時刻の所定時間の経過をトリガにして現用系の前記サービスプロセッサによるユニット内の共有格納領域への診断データの書き込み、待機系の前記サービスプロセッサによる前記ユニット内の前記共有格納領域からの読み出し、および前記プロセッサ間通信による監視の一連の自己診断処理を自律的に順次実行して前記サービスプロセッサの障害の切り分けを行い待機系の前記サービスプロセッサへの切り替え処理を行う診断処理ステップと、を含み、
    前記時刻同期処理ステップは、前記サービスプロセッサ間で時計の前記時刻を同期させる同期処理ステップを含み、
    前記現用系の前記サービスプロセッサの前記診断処理ステップは、前記診断データを前記ユニット内の前記共有格納領域に書き込む診断データ書込処理ステップを含み、
    前記待機系の前記サービスプロセッサの前記診断処理ステップは、前記ユニット内の前記共有格納領域から前記診断データを読み出しサービスプロセッサ内レジスタに書き込む診断データ読出処理ステップと、前記現用系の前記サービスプロセッサによる前記診断データの前記共有領域への再度の書き込みが行われた後に前記共有格納領域から読み出した前記診断データおよび前記サービスプロセッサ内レジスタの値を比較する診断データ比較処理ステップと、前記共有格納領域からの読み出しが不可の場合前記待機系の前記サービスプロセッサ、前記ユニットおよびユニット間インタフェースのいずれかに障害が発生したと判断し、前記共有格納領域からの読み出しが可の場合で且つ前記プロセッサ間通信が不可のとき前記現用系の前記サービスプロセッサの障害が発生したと判断し、前記共有格納領域からの読み出しが可の場合で且つ前記プロセッサ間通信が可のとき前記現用系の前記サービスプロセッサ、前記ユニットおよび前記ユニット間インタフェースのいずれかの障害が発生したと判断する障害切分処理ステップと、を含むことを特徴とする多重化サービスプロセッサの障害処理方法。
  7. 前記診断データが前記サービスプロセッサのプロセッサ番号および時刻であることを特徴とする請求項6に記載の多重化サービスプロセッサの障害処理方法。
  8. 前記ユニット間診断処理ステップは、診断データとして乱数を発生させる診断データ乱数処理ステップを含み、
    前記診断データが前記サービスプロセッサのプロセッサ番号および乱数データであることを特徴とする請求項6に記載の多重化サービスプロセッサの障害処理方法。
  9. 前記共有格納領域が共有レジスタであることを特徴とする請求項6から請求項8のいずれか1項に記載の多重化サービスプロセッサの障害処理方法。
  10. 前記共有格納領域が共有メモリであることを特徴とする請求項6から請求項8のいずれか1項に記載の多重化サービスプロセッサの障害処理方法。
  11. 複数のサービスプロセッサおよびユニットを有する多重化サービスプロセッサを含むコンピュータに実行させるプログラムであって前記プログラムは、
    前記多重化サービスプロセッサに含まれる現用系の前記サービスプロセッサに、前記サービスプロセッサ間で時計の時刻を同期させる時刻同期処理を実行させ、
    前記現用系の前記サービスプロセッサまたは前記多重化サービスプロセッサに含まれる待機系の前記サービスプロセッサに、前記サービスプロセッサ間とのプロセッサ間通信を監視するプロセッサ間監視処理を実行させ、
    同期した前記時刻の所定時間の経過をトリガにして、前記現用系の前記サービスプロセッサによる前記ユニット内の共有格納領域への診断データの書き込み処理と、前記待機系の前記サービスプロセッサによる前記ユニット内の前記共有格納領域からの読み出し処理と、前記プロセッサ間通信による監視処理との一連の自己診断処理を自律的に順次実行させることにより、前記待機系の前記サービスプロセッサに、前記サービスプロセッサの障害の切り分けを行い待機系の前記サービスプロセッサへの切り替え処理を行う診断処理を実行させ、
    前記待機系の前記サービスプロセッサが実行する前記診断処理は、前記ユニット内の前記共有格納領域から前記診断データを読み出しサービスプロセッサ内レジスタに書き込む診断データ読出処理と、前記現用系の前記サービスプロセッサによる前記診断データの前記共有領域への再度の書き込みが行われた後に前記共有格納領域から読み出した前記診断データおよび前記サービスプロセッサ内レジスタの値を比較する診断データ比較処理と、前記共有格納領域からの読み出しが不可の場合前記待機系の前記サービスプロセッサ、前記ユニットおよびユニット間インタフェースのいずれかに障害が発生したと判断し、前記共有格納領域からの読み出しが可の場合で且つ前記プロセッサ間通信が不可のとき前記現用系の前記サービスプロセッサの障害が発生したと判断し、前記共有格納領域からの読み出しが可の場合で且つ前記プロセッサ間通信が可のとき前記現用系の前記サービスプロセッサ、前記ユニットおよび前記ユニット間インタフェースのいずれかの障害が発生したと判断する障害切分処理と、を含むことを特徴とするプログラム。
  12. 前記診断データが前記サービスプロセッサのプロセッサ番号および時刻であることを特徴とする請求項11に記載のプログラム。
  13. 前記現用系の前記サービスプロセッサに、診断データとして乱数を発生させる診断データ乱数処理を実行させ、
    前記診断データが前記サービスプロセッサのプロセッサ番号および乱数データであることを特徴とする請求項11に記載のプログラム。
  14. 前記共有格納領域が共有レジスタであることを特徴とする請求項11から請求項13のいずれか1項に記載のプログラム。
  15. 前記共有格納領域が共有メモリであることを特徴とする請求項11から請求項13のいずれか1項に記載のプログラム。
JP2009216908A 2009-09-18 2009-09-18 多重化サービスプロセッサ、多重化サービスプロセッサの障害処理方法、およびプログラム Expired - Fee Related JP5596322B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009216908A JP5596322B2 (ja) 2009-09-18 2009-09-18 多重化サービスプロセッサ、多重化サービスプロセッサの障害処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009216908A JP5596322B2 (ja) 2009-09-18 2009-09-18 多重化サービスプロセッサ、多重化サービスプロセッサの障害処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2011065521A JP2011065521A (ja) 2011-03-31
JP5596322B2 true JP5596322B2 (ja) 2014-09-24

Family

ID=43951676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009216908A Expired - Fee Related JP5596322B2 (ja) 2009-09-18 2009-09-18 多重化サービスプロセッサ、多重化サービスプロセッサの障害処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5596322B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014002177A1 (ja) 2012-06-26 2014-01-03 東芝三菱電機産業システム株式会社 データ収集システム、データ収集装置、データ収集システムプログラム、及びデータ収集プログラム
CN113823040A (zh) * 2020-06-19 2021-12-21 中国移动通信集团福建有限公司 共享单车的管理方法及系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58214952A (ja) * 1982-06-08 1983-12-14 Nec Corp 情報処理方式
JPH0812620B2 (ja) * 1986-09-30 1996-02-07 日本電気株式会社 情報処理システム
JPH01255952A (ja) * 1988-04-05 1989-10-12 Fujitsu Ltd サービスプロセッサの情報互換方式
JPH02148333A (ja) * 1988-11-30 1990-06-07 Pfu Ltd マルチプロセッサシステムの異常診断方式
JPH0776948B2 (ja) * 1991-03-29 1995-08-16 株式会社ピーエフユー 故障診断方法
JPH0683657A (ja) * 1992-08-27 1994-03-25 Hitachi Ltd サービスプロセッサの切り換え方式
JPH09274575A (ja) * 1996-04-04 1997-10-21 Hitachi Ltd 統合システム管理方式
JP2001022712A (ja) * 1999-07-13 2001-01-26 Hitachi Ltd 情報処理装置の初期設定方式
JP2003157180A (ja) * 2001-11-21 2003-05-30 Hitachi Ltd ディスクアレイシステム
JP2006107050A (ja) * 2004-10-04 2006-04-20 Fanuc Ltd 複数ロボットの協調動作制御装置
JP2008015704A (ja) * 2006-07-04 2008-01-24 Fujitsu Ltd マルチプロセッサシステム

Also Published As

Publication number Publication date
JP2011065521A (ja) 2011-03-31

Similar Documents

Publication Publication Date Title
US9052887B2 (en) Fault tolerance of data processing steps operating in either a parallel operation mode or a non-synchronous redundant operation mode
CN102193778B (zh) 用于生成时间戳的方法、设备和跟踪模块
ATE162898T1 (de) Fehlertolerantes rechnersystem.
US10114356B2 (en) Method and apparatus for controlling a physical unit in an automation system
JP7251949B2 (ja) 半導体装置、半導体システム及びテスト制御方法
JP4822000B2 (ja) フォールトトレラントコンピュータ
JP2006209593A (ja) 情報処理装置および情報処理方法
JP5596322B2 (ja) 多重化サービスプロセッサ、多重化サービスプロセッサの障害処理方法、およびプログラム
KR100928187B1 (ko) 듀얼 프로세서 제어 장치의 고장 안전 구조
KR101448013B1 (ko) 항공기용 다중 컴퓨터의 고장 허용 장치 및 방법
JP2011076344A (ja) 情報処理装置,情報処理装置の制御方法および制御プログラム
JP6217086B2 (ja) 情報処理装置、エラー検出機能診断方法およびコンピュータプログラム
Gohil et al. Redundancy management and synchronization in avionics communication products
JP4926299B1 (ja) プログラマブルロジックコントローラ
EP2690557B1 (en) Computer system, data processing method, and data processing program
JP2005165807A (ja) プロセッサ多重化システムにおける動作比較方式
JP2011022741A (ja) コンピュータシステム、サービスプロセッサ、及びその診断方法
Carpenter et al. Analysis and protection of interprocess communications in real-time systems
JP2010055509A (ja) 障害復旧システム、方法及びプログラム、並びにクラスタシステム
JP4613019B2 (ja) コンピュータシステム
JP2011028481A (ja) フォールトトレラントサーバ、プロセッサ切り替え方法およびプロセッサ切り替えプログラム
JP2006338425A (ja) 制御装置
CN108415788B (zh) 用于对无响应处理电路作出响应的数据处理设备和方法
JPS5911455A (ja) 中央演算処理装置の冗長システム
JPH1078896A (ja) 産業用電子計算機

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110712

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140701

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140722

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140807

R150 Certificate of patent or registration of utility model

Ref document number: 5596322

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees