JP2007011426A - 処理装置 - Google Patents

処理装置 Download PDF

Info

Publication number
JP2007011426A
JP2007011426A JP2005187641A JP2005187641A JP2007011426A JP 2007011426 A JP2007011426 A JP 2007011426A JP 2005187641 A JP2005187641 A JP 2005187641A JP 2005187641 A JP2005187641 A JP 2005187641A JP 2007011426 A JP2007011426 A JP 2007011426A
Authority
JP
Japan
Prior art keywords
processing
abnormality
processing unit
processing apparatus
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005187641A
Other languages
English (en)
Other versions
JP4831599B2 (ja
Inventor
Kazuhisa Fukuda
和久 福田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Electronics Corp
Original Assignee
NEC Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Electronics Corp filed Critical NEC Electronics Corp
Priority to JP2005187641A priority Critical patent/JP4831599B2/ja
Priority to US11/474,948 priority patent/US8296602B2/en
Publication of JP2007011426A publication Critical patent/JP2007011426A/ja
Application granted granted Critical
Publication of JP4831599B2 publication Critical patent/JP4831599B2/ja
Priority to US13/631,272 priority patent/US8984334B2/en
Priority to US14/615,935 priority patent/US9342416B2/en
Priority to US15/133,841 priority patent/US10235254B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0715Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/203Failover techniques using migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2035Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2043Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share a common memory address space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/82Solving problems relating to consistency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/85Active fault masking without idle spares

Abstract

【課題】複数のCPUのうち1つが動作不能になったとしても、そのCPUの処理が他のCPUにより実行されることができる処理装置。
【解決手段】 処理装置は、それぞれ予め決められた処理を実行する複数の処理部(102A,102B)と、前記複数の処理部(102A,102B)にそれぞれ設けられ、前記複数の処理部(102A,102B)の異常を検出して異常検出信号を生成する複数の異常検出回路(122A,122B)と、前記複数の異常検出回路(122A,122B)のいずれかからの前記異常検出信号に応答して、前記複数の処理部(102A,102B)のうちの、異常状態にある異常処理部以外の少なくとも1つの正常処理部を、異常救済処理を実行するように制御する異常監視制御部(108)とを具備している。
【選択図】 図1

Description

本発明は、複数の処理を同時に行う処理装置において、異常が発生したときの処理技術に関する。
単一のCPUを使用する処理装置が、制御処理のために使用されている。しかしながら、制御処理の高度化、複雑化により単一のCPUでは、処理をこなしきれなくなって来ている。そのために、複数のCPUが複数の処理を同時に実行するマルチプロセッサ処理装置が開発されてきた。
例えば、処理Aを実行するマルチプロセッサ装置を考えてみる。マルチプロセッサ装置はCPU1とCPU2を備え、それらは処理Aのうちの処理A1と処理A2をそれぞれ実行するとする。この場合、CPU1とCPU2が正常に処理A1とA2を実行することができれば何ら問題なく処理Aは終了する。
しかしながら、そのようなマルチプロセッサ処理装置では、複数のCPUのうち1つでも動作不能になるとシステム全体がダウンしてしまうことになる。例えば、CPU1がフリーズ状態になり、あるいは無限ループを実行する等の異常状態になると、CPU1による処理A1が未完了である。このため、CPU2が処理A2を正常に完了することができたとしても、処理Aは完了しないことになる。また、処理Aが完了しないので、CPU2は、処理A2を完了しても次の処理を開始することができない。こうして、マルチプロセッサ処理装置全体として正常に動作しなくなってしまう。
マルチプロセッサ処理装置に関連する技術として、特開2000−76199号公報に開示されている技術が知られている(特許文献1参照)。この従来例では、CPUは、調停回路に対してリクエスト信号を調停回路に発行する。調停回路は、バス調停を行い、そのCPUに対してバス使用権(グラント信号)を与える。バスを開放する場合には、CPUが調停回路に対して終了信号を発行し、それに基づいてバスが開放される。このように、バス使用権を確保することによりCPUの切替(入出力I/Fの占有/開放の制御)を行っている。
特開2000−76199号公報
本発明の目的は、複数のCPUのうち1つが動作不能になったとしても、そのCPUの処理が他のCPUにより実行されることができる処理装置を提供することである。
以下に、[発明の実施の形態]で使用する番号・符号を用いて、課題を解決するための手段を説明する。これらの番号・符号は、[特許請求の範囲]の記載と発明の実施の形態の記載との対応関係を明らかにするために付加されたものであるが、[特許請求の範囲]に記載されている発明の技術的範囲の解釈に用いてはならない。
本発明の観点では、処理装置は、それぞれ予め決められた処理を実行する複数の処理部(102A,102B)と、前記複数の処理部(102A,102B)にそれぞれ設けられ、前記複数の処理部(102A,102B)の異常を検出して異常検出信号を生成する複数の異常検出回路(122A,122B)と、前記複数の異常検出回路(122A,122B)のいずれかからの前記異常検出信号に応答して、前記複数の処理部(102A,102B)のうちの、異常状態にある異常処理部以外の、正常状態にある少なくとも1つの正常処理部を、異常救済処理を実行するように制御する異常監視制御部(108)とを具備している。
前記異常救済処理は、前記異常処理部での処理負荷、前記正常処理部での処理負荷、前記異常処理部と前記正常処理部で処理されるべき処理の優先度に基づいて決定されることがのぞましく、前記正常処理部は、前記異常救済処理において、前記異常処理部により実行されるべき処理を実行してもよいし、前記正常処理部は、前記異常救済処理において、前記異常処理部により実行されるべき処理と前記正常処理部で実行されるべき処理のうち優先度に従って処理してもよい。
また、処理装置は、単一の入出力端子(Td)と、前記複数の処理部(102A,102B)と前記入出力端子(Td)に接続され、選択制御信号に応答して前記入出力端子(Td)を前記正常処理部に接続するセレクタ部(106)とを更に具備し、前記異常監視制御部(108)は、前記異常検出信号に応答して、前記選択制御信号を生成する。これにより、異常処理部が接続されていた端子に、正常処理部を接続することができる。
また、前記複数の処理部(102A,102B)の各々は、CPU(2A,2B)と、前記CPU(2A,2B)に接続されたバス(12A,12B)と、前記バス(12A,12B)に接続された少なくとも1つの入出力インターフェイス(4−1−A,4−1−B)とを具備し、前記複数の異常検出回路(122A,122B)の各々は、前記CPU(2A,2B)に対して設けられた第1異常検出回路(22A,22B)と、前記バス(12A,12B)に対して設けられた第2異常検出回路(10A,10B)と、前記入出力インターフェイス(4−1−A,4−1−B)に対して設けられた第3異常検出回路(24A,24B)とを具備する。
前記異常監視制御部(108)は、前記異常検出信号をデコードしてデコード結果信号を生成する検出信号デコーダ(82a,82b,82c,82d,82e,82f)と、前記デコード結果信号を格納する記憶部(86c,86d,86e,86f)とを具備する。これにより、格納されているデコード結果を調べることにより異常の発生個所をしることができる。処理装置は、前記デコード結果信号を外部に出力するための端子(Te)を更に具備する。これにより、異常の発生を直ちに外部に知らせることができる。
前記異常監視制御部(108)は、前記正常処理部からの要求に応答して前記記憶部(86c,86d,86e,86f)をアクセスし、前記異常処理部のデータを前記正常処理部へ送信するアクセス部(88d,88e,88f)を更に具備する。これにより、正常処理部は、異常処理部の今までの処理状態をしることができる。
また、処理装置は、前記正常処理部から、リセット命令が設定され、前記異常処理部をリセットするために前記設定されたリセット命令を前記異常処理部に出力するレジスタ(16A,16B)を更に具備する。これにより、異常処理部がフリーズしているときには、リセットにより正常に戻せることになる。
また、処理装置は、前記複数の処理部(102A,102B)のそれぞれに設けられ、前記複数の処理部(102A,102B)が動作するための複数のクロック信号をそれぞれ生成する複数のクロック信号生成回路(15a,15B)と、電源電圧が閾値より低いことを検出して異常検出信号を前記異常監視制御部(108)に出力する電圧検出回路(9f)を更に具備する。前記異常監視制御部(108)は、検出された電源電圧が閾値より低いとき、前記複数のクロック信号のうち、より高い周波数のクロック信号で動作する処理部を前記異常処理部と認定し、前記複数のクロック信号のうち、より低い周波数のクロック信号で動作する処理部を前記正常処理部と認定し、前記異常救済処理を行うよう前記正常処理部を制御する。これにより、電源電圧が低下しても直ちに動作が停止することなく、必要な処理は続行することができる。
本発明によれば、マルチプロセッサ処理装置において、いずれかのCPUに異常が発生しても、直後のシステムダウンを避けることができる。また、安全の確保のための最低限の処理を実行することができる。負荷状態により、必要な処理は続行することができることになる。また、端子数が減らされても、端子が共有されているので、異常発生時にあっても、正常なCPUにより外部との信号の交換が可能である。また、その共有を通して、柔軟なシステム構成をとることができる。
以下に添付図面を参照して、本発明の処理装置について詳細に説明する。本発明の処理装置は、1つのチップ内に、半導体集積回路して実現されている。また、処理装置は制御システム内で制御処理のために使用されている例を挙げ、本発明を説明する。しかしながら、本発明はそのようなアプリケーションに限られるものではない。
図1は、本発明の第1実施形態による処理装置の構成を示すブロック図である。図1を参照して、第1実施形態の処理装置は、メモリ100、複数の処理部102A、102B、複数の異常検出回路122A、122B、異常監視制御部108、セレクタ部106とを備えている。
メモリ100は、複数の処理部102A、102Bに共有されており、複数の処理部102A、102Bのためにそれぞれメモリ領域100A、100Bを有している。また複数の処理部102A,102Bにより共通にアクセスされるべきメモリ領域100Zを有している。メモリ領域100A、100B、100Zの各々は、処理プログラムA,B,Zや、そのプログラムの実行時に使用されるデータを格納している。
処理部102Aは、メモリ100のメモリ領域100Aをアクセスして、そこに格納されている処理プログラムAを実行する。これにより、所望の処理が実行される。その処理は少なくとも1つの処理単位を含んでいる。処理部102Aは、処理単位の処理が終了する度に、その処理単位と関連するデータを異常監視制御部108に出力する。また、処理部102Aは、その処理のために外部データが必要なときには、また処理結果を外部に出力する時には、入出力端子Tdが処理部102Aに接続されるように異常監視制御部108に選択指示を出力する。異常監視制御部108から異常救済処理指示を受けたときには、メモリ領域100Aに格納されている処理プログラムAに代えてメモリ領域100Zに格納されている処理プログラムZを実行する。また、処理プログラムAを実行することができる。処理部102Bは、処理部102Aと同様に動作する。
異常検出回路122A、122Bは、それぞれ処理部102A、102Bに対して設けられている。各異常検出回路122A、122Bは、ウオッチドッグタイマ(図示せず)を有する。異常検出回路122Aは、ウオッチドッグタイマにより処理部102Aの異常を検出し、異常検出信号を異常監視制御部108に出力する。同様に、異常検出回路122Bは、処理部102Bの異常を検出し、異常検出信号を異常監視制御部108に出力する。
セレクタ部106は、単一の入出力端子TDに接続されており、異常監視制御部108からの選択制御信号に応答して、入出力端子Tdを処理部102Aまたは処理部102Bに接続する。
異常監視制御部108は、処理部102A、102Bの各々からの選択指示に基づいて選択制御信号を生成してセレクタ部106に出力する。これにより、入出力端子Tdは、セレクタ部106を介して処理部102A又は102Bに接続される。また、異常監視制御部108は、異常検出回路122A、122Bからの異常検出信号に基づいて処理部102A、102Bのいずれかの異常を検出し、入出力端子Tdを正常な処理部に強制的に接続するように選択制御信号を発生する。また、異常監視制御部108は、異常検出信号に応答して、正常な処理部に対して異常救済処理指示を出力する。また、異常監視制御部108は、処理部102A、102Bの各々から、所定の処理単位の処理が終了する度に、その処理単位に関連したデータを受信する。異常監視制御部108は、このデータに基づいて各処理部において何処まで処理が終了したかを知ることができる。
次に、図2を参照して、本発明の第1実施形態により処理装置の動作について説明する。初めに処理部102A、102Bが起動され、それぞれメモリ領域100A、100Bに格納されている処理プログラムA、Bの実行を開始する。処理プログラムAの処理と処理プログラムBの処理は異なるものとする。例えば、処理プログラムAによる処理は図示されない外部装置の制御に関する処理であり、処理プログラムBによる処理は演算処理であるとする。また、処理部102A,102Bは所定の処理周期で、処理プログラムA,Bの実行を進めていくものとする。更に、処理プログラムAは、複数の処理単位A1,...,A2、...を含み、処理プログラムBは、複数の処理単位B1,...,B2、...を含んでいるものとする。ここで、処理単位A1では、処理結果が入出力端子Tdを介して出力されるものとする。
処理部102Aは、処理プログラムAを実行し、処理単位A1の処理を終了する。その後、選択指示を異常監視制御部108に出力する。異常監視制御部108は、選択指示に応答して、選択制御信号をセレクタ部106に出力する。この結果、入出力端子Tdはセレクタ部106を介して処理部102Aに接続される。処理部102Aは、処理単位A1の処理結果をセレクタ部106と入出力端子Tdを介して外部に出力する。同時に、処理単位A1の処理と関連するデータを異常監視制御部108に出力する。これにより、異常監視制御部108は処理単位A1の終了を知ることができる。処理部102Bも同様に、処理単位B1を実行する。
その後、処理周期T0における処理が進行し、処理周期T1の処理が開始されるとする。このとき、処理部102Aは処理単位A2の処理を開始する。また、処理部102Bは処理単位B2の処理を開始する。このとき、異常検出回路122Aが処理部102Aの異常を検出すると、異常検出信号を異常監視制御部108に出力する。異常監視制御部108は、異常検出信号に応答して異常救済処理指示を処理部102Bに出力する。併せて、異常監視制御部108は、何処まで処理が進んでいるかを示す進行状況データ、この例では、処理単位A2と関連するデータが処理部102Bに送られる。処理部102Bは、処理プログラムBの処理単位B2の処理を中断し、異常救済処理プログラムZを実行し、異常処理を開始する。
図10(a)は、処理部102aと102Bに含まれるCPU1とCPU2の処理能力を示している。正常時において、CPU1とCPU2に割り当てられている時間がTのとき、CPU1とCPU2は、100%の処理能力で処理プログラムAとBとを時間T/2で処理している。このとき、CPU2の処理に異常が発生し、CPU2の処理もCPU1が実行しなければならないとき、図10(b)に示されるように、CPU1は、時間Tで処理プログラムAとBの両方を処理することができる。
一方、図11(a)は、処理部102aと102Bに含まれるCPU1とCPU2の処理能力を示している。図11(a)に示されるように、正常時において、CPU1とCPU2に割り当てられている時間がTのとき、CPU1とCPU2は、100%の処理能力で処理プログラムAとBとを時間T/2より長い時間とT/2の時間で処理している。このとき、CPU2の処理に異常が発生し、CPU2の処理もCPU1が実行しなければならないとき、図11(b)に示されるように、CPU1は、時間Tでは処理プログラムAとBの両方を処理することができない。このような場合には、CPU1が処理プログラムAだけを実行するのか、処理プログラムBだけを実行するのか等、何らかの対処が必要になる。
異常救済処理では、処理単位A1の重要性/緊急性が判断される。処理単位A1が実行され、制御が進んでいる場合、異常発生状態で直ちに、制御システムが停止されるべき場合もあるが、一方、後続の処理単位A2の処理が行われなければならない場合もある。そのような場合、1つの処理部の異常で制御処理システム全体を停止させることはできない。続いて、処理部102Bは、処理部102Aの処理負荷と処理部102Bの処理負荷を判断する。例えば、異常発生前の処理部102Aの処理負荷が70%であり、処理部102Bの処理負荷が30%であれば、処理部102Bは、プログラムAの処理とプログラムBの処理の両方を処理することができる。しかしながら、異常発生前の処理部102Aの処理負荷が80%であり、処理部102Bの処理負荷が50%であれば、処理部102Bは、プログラムAの処理とプログラムBの処理の両方を処理することはできない。そのような場合には、プログラムAの処理とプログラムBの処理(処理単位A2,...と処理単位B2,...)の重要性/緊急性に基づいて実行されるべき処理が判断される。
図3は、処理プログラムZによる異常救済処理を示すフローチャートである。図3を参照して、ステップS2で、処理部102Bは、異常発生後に予想される処理部102A、102Bの負荷を獲得する。処理部102Aの負荷は、異常監視制御部108から送られる、何処まで処理が進んでいるかを示す進行状況データと、処理プログラムAに記述されている処理単位から求めることができる。また、処理部102Bの負荷は、異常発生時の処理状況に基づいて処理プログラムBの処理単位から求めることができる。このとき、各処理単位の負荷が予め計算され、メモリ領域100Zのテーブル(図示せず)に保持されていれば、負荷の計算のための時間を短縮することができる。
続いて、処理部102Bは、処理プログラムA,Bの各処理単位の重要度/緊急度を求める。そのためには、処理プログラムA,Bの各処理単位に予め優先度が割り当てられたメモリ領域100Zのテーブル(図示せず)が用意されていればよい。これは、処理単位には、アクセサリ的な処理などが含まれているからである。そのような処理は、制御システムの安全の確保のためには必要ないので、優先度は低くなる。一方、途中まで制御処理が進んでいるが、その状態では不安定であり、所定の安定した状態にまで進めなければならない場合、あるいはその安定した状態まで戻さなければならない場合がある。そのために、例えば安全を確保するために必要な処理の優先度は高くなる。
そこで、ステップS6では、処理単位A2の処理の重要性/緊急性(優先度)が処理単位B2より高いか否かが判定される。処理単位A2の重要性/緊急性(優先度)が高い場合には、ステップS8が実行され、処理部102Bが本来実行すべき処理に加えて処理単位A2を実行したとき、負荷がオーバーするか否かが判定される。負荷がオーバーしないときには、ステップS14で処理単位A2が実行され、続いて処理単位B2が実行される。処理単位A2の処理が終了するとき、処理部102Bは、処理単位A2の処理結果をセレクタ部106と入出力端子Tdを介して外部に出力する。同時に、処理単位A2の処理と関連するデータを異常監視制御部108に出力する。これにより、異常監視制御部108は処理単位A2の終了を知ることができる。このとき、既に、異常監視制御部108により入出力端子Tdはセレクタ部106を介して処理部102Bに接続されているので、処理部102Bは、選択指示を異常監視制御部108に出力する必要がない。
その後、処理の続行が可能か否かがステップS16で判断され、続行可能であれば、ステップS18で処理が続行される。また、処理の続行が不可能であれば、ステップS12が実行され、制御処理は停止される。
また、負荷がオーバーすると判断されるときには、ステップS10で処理単位A2が実行され、安全が確保される。その後、ステップS12が実行され、制御処理は停止される。
また、処理単位A2の処理の重要性/緊急性が低い場合には、ステップS20で、処理部102Bが本来実行すべき処理に加えて処理単位A2を実行したとき、負荷がオーバーするか否かが判定される。負荷がオーバーするときには、ステップS22で処理単位B2が実行され、その後、ステップS12が実行され、制御処理は停止される。
また、ステップS20で負荷がオーバーしないと判定されるときには、ステップS24が実行される。ステップS24では、処理単位B2が実行され、続いて処理単位A2が実行される。処理単位A2の処理が終了するとき、処理部102Bは、処理単位A2の処理結果をセレクタ部106と入出力端子Tdを介して外部に出力する。同時に、処理単位A2の処理と関連するデータを異常監視制御部108に出力する。これにより、異常監視制御部108は処理単位A2の終了を知ることができる。このとき、既に、異常監視制御部108により入出力端子Tdはセレクタ部106を介して処理部102Bに接続されているので、処理部102Bは、選択指示を異常監視制御部108に出力する必要がない。
その後、処理の続行が可能か否かがステップS26で判断され、続行可能であれば、ステップS28で処理が続行される。また、処理の続行が不可能であれば、ステップS12が実行され、制御処理は停止される。
このようにして、処理部102Bは、余った処理能力で、処理プログラムA、Bの処理単位のうち、いくつかを間引くことにより、処理プログラムA、Bの処理を進めることができる。
上記の例では、処理周期が規定されているので、処理部102A、102Bの処理単位が処理周期内で完了する必要があったが、処理周期が規定されていない場合には、処理時間がかかるが、処理部102Bが処理プログラムAと処理プログラムBを実行すればよい。
また、上記の例では、処理部102A、102Bが選択指示を異常監視制御部108に出力して、セレクタ部106を制御しているが、入出力端子Tdが常時処理部102Aに接続され、異常時のみ処理部102Bに接続されれば十分である場合には、処理部102A、102Bが選択指示を異常監視制御部108に出力する必要はない。
また、処理部102A、102Bは、処理単位の処理が終了する度に、処理単位に関連するデータを異常監視制御部108に送っているが、例えば、処理部102Aが処理単位に関するデータを直接処理部102Bに送ってもよい。あるいは、メモリ領域100Zのテーブル(図示せず)に書き込んでもよい。いずれの場合でも、処理部102A、102Bは、処理単位の処理が終了する度に、処理単位に関連するデータを異常監視制御部108に送ることは不要である。
また、上記の例では、単一の入出力端子Tdがセレクタ部106を介して処理部102A、102Bに接続されている。しかしながら、複数の入出力端子(図示せず)が処理部102A,102Bにそれぞれ接続されている構成でもよい。その場合には、セレクタ部106は不要であり、それに伴う異常監視制御部108の処理は不要になる。
次に、本発明の第2実施形態による処理装置を図4を参照して説明する。図4では、メモリ100は図示されていないことに注意すべきである。また、第2実施形態による処理装置では、処理部は2つである。
第2実施形態の処理装置は、CPU2A,2B、異常検出回路22A,22B、バス12A,12B、バスブリッジ回路10、入出力ポート4−1−A、4−2−A,4−1−B,4−2−B、異常検出回路24A、24B、セレクタ部6、異常監視制御部8aとを備えている。ここで、異常監視制御部8aは、第1実施形態の異常監視制御部108に対応し、セレクタ部6は第1実施形態のセレクタ部106に対応する。以下に説明する実施形態では、異常監視制御部は、8a、8b,8c,8d,8e,8fと参照されるが、同様である。異常検出回路22A,24Aは、第1実施形態の異常検出回路122Aに対応し、異常検出回路22B,24Bは、第1実施形態の異常検出回路122Bに対応する。また、CPU2A、バス12A、バスブリッジ回路10、入出力ポート4−1−A、4−2−Aが第1実施形態の処理部102Aに対応し、CPU2B、バス12B、バスブリッジ回路10、入出力ポート入出力ポート4−1−B、4−2−Bが第1実施形態の処理部102Bに対応する。また、図4では、異常監視制御部8aからCPU2A,2Bへの異常救済処理指示のための信号線、CPU2A,2Bからの異常監視制御部8aへの選択指示の信号線、処理単位が終了したときに送られる処理単位に関連するデータのための信号線が図示されてない。
CPU2A,2Bは、メモリ(図示せず)に格納された処理プログラムA,Bをそれぞれ実行する。異常検出回路22A,22Bは、それぞれCPU2A,2Bに対して設けられている。異常検出回路22A,22Bの各々は、ウォッチドッグタイマを有し、対応するCPUの異常を監視している。異常を検出したとき、異常検出信号を異常監視制御部8aに出力する。
異常検出回路24Aは、入出力ポート4−1−A、4−2−Aに対して設けられ、異常検出回路24Bは、入出力ポート4−1−B、4−2−Bに対して設けられている。異常検出回路24A,24Bの各々は、各入出力ポートが固定値を出力しつづけているような状態を異常と判断して異常検出信号を異常監視制御部8aに出力する。
入出力ポート4−1−A、4−2−Aは、バス12Aに接続され、入出力ポート4−1−B、4−2−Bは、バス12Bに接続されている。バスブリッジ10は、バス12Aと12Bとを接続し、CPU2A,2Bと接続されている。これにより、入出力ポート4−1−A、4−2−Aと入出力ポート4−1−B、4−2−Bは、CPU2A,2Bと接続されている。
セレクタ部6は、バッファドライバ62、ANDゲート72、ORゲート78、セレクタ64,68,74,76を有している。入出力ポート4−1−a、4−1−Bの入力イネーブルENIは、ORゲート78の入力とセレクタ76の入力に接続されている。セレクタ76の出力とORゲート78の出力はセレクタ74の入力に接続されている。セレクタ74の出力はANDゲート72の一方の入力に接続されている。入出力端子TdはANDゲート72の他方の入力に接続されている。ANDゲート72の出力は、入出力ポート4−1−A、4−1−Bのデータ入力DINに接続されている。入出力ポート4−1−A、4−1−Bの出力イネーブルENOは、セレクタ64の入力に接続されている。セレクタ64の出力はバッファドライバ62の制御端子に接続されている。入出力ポート4−1−a、4−1−Bのデータ出力DOUTは、セレクタ68の入力に接続されている。セレクタ68の出力は、バッファドライバ62の入力に接続され、バッファドライバ62の出力は入出力端子Tdに接続されている。セレクタ64,68,74,76の各々には、異常監視制御部8aから選択制御信号が供給されている。以上により、入出力端子Tdは、通常は、入出力ポート4−1−Aに接続され、異常時に入出力ポート4−1−Bに接続される。
異常監視制御部8aは、検出信号デコーダ82aと切替信号出力回路84aとを有している。検出信号デコーダ82aは、異常検出回路22A,22B,24A,24Bからの異常検出信号をデコードして異常結果デコード信号を発生し、切替信号出力回路84aに出力する。切替信号出力回路84aは、異常結果デコード信号に応答して、選択制御信号をセレクタ部6に出力する。
第2実施形態による処理装置の動作は、第1実施形態の処理装置と同様なので、説明は省略する。
次に、図5を参照して、本発明の第3実施形態による処理装置について説明する。第3実施形態による処理装置は、第2実施形態による処理装置と同様である。第3実施形態による処理装置が、第2実施形態による処理装置と異なる点は、バス12A、12Bとバスブリッジ回路10に代えて、バス12A、12Bだけが使用されており、それらに対して異常検出回路10A,10Bがそれぞれ設けられていることである。バス異常は起きたときには、CPUからデータを入出力することはできない。そのため、異常検出回路10A、10Bが設けられている。異常検出回路10A、10Bは、例えば、バス上のデータが常に”1”あるいは”0”であるとき、バスの異常と判定し、異常検出信号を異常監視制御部8bに出力する。異常監視制御部8bは、構成と動作において、異常監視制御部8aと同様である。
第3実施形態による処理装置の動作は、第1実施形態の処理装置と同様なので、説明は省略する。
次に、図6を参照して、本発明の第4実施形態による処理装置について説明する。第4実施形態による処理装置は、第2実施形態による処理装置と同様である。第3実施形態による処理装置が、第2実施形態による処理装置と異なる点は、異常監視制御部8cの構成と動作である。第4実施形態では、異常監視制御部8cは、検出信号デコーダ82cと、切替信号出力回路84cと、内部メモリ86cとを有している。検出信号デコーダ82cは、異常検出回路22A,22B,24A,24Bからの異常検出信号をデコードして異常結果デコード信号を発生し、切替信号出力回路84aに出力する。切替信号出力回路84aは、異常結果デコード信号に応答して、選択制御信号をセレクタ部6に出力する。内部メモリ86cは、異常結果デコード信号を格納する。これにより、後で異常を解析するとき、内部メモリ86cに格納されているデータを調べることにより、異常の発生個所を速やかに決定することができる。また、異常結果デコード信号は出力端子Teにより外部に出力される。外部装置は、出力端子Teの信号を監視することにより処理装置内での異常の発生を知ることができる。
第4実施形態による処理装置の動作は、第1実施形態の処理装置と同様なので、説明は省略する。
次に、図7を参照して、本発明の第5実施形態による処理装置について説明する。第5実施形態による処理装置は、第3実施形態による処理装置と同様である。第5実施形態による処理装置が、第3実施形態による処理装置と異なる点は、異常監視制御部8dの構成と動作である。第5実施形態では、異常監視制御部8dは、検出信号デコーダ82dと、切替信号出力回路84dと、内部メモリ86dと、アクセス制御回路88dを有している。検出信号デコーダ82dは、異常検出回路22A,22B,24A,24B、10A,10Bからの異常検出信号をデコードして異常結果デコード信号を発生し、切替信号出力回路84dと内部メモリ86d、アクセス制御回路88dに出力する。切替信号出力回路84dは、異常結果デコード信号に応答して、選択制御信号をセレクタ部6に出力する。内部メモリ86dは、異常結果デコード信号を格納する。これにより、後で異常を解析するとき、内部メモリ86dに格納されているデータを調べることにより、異常の発生個所を速やかに決定することができる。また、異常結果デコード信号はアクセス制御回路88dに出力される。アクセス制御回路88dは、バス12A、12Bと接続されている。CPU2A,2Bは、バス12A、12Bを介して、アクセス制御回路88dをアクセスすることができる。アクセス制御回路88dは、CPU2A,2Bからの指示に従って、内部メモリ86dからデータを読み出して指示の発行元に出力する。但し、アクセス制御回路88dは、検出信号デコーダ82dからの異常結果デコード信号に基づいて、異常発生側のCPUからのアクセスは拒否する。異常救済処理指示に応答して、正常側のCPUが異常救済処理を実行するとき、必要なデータを内部メモリ86dから取り出すことができる。
第5実施形態による処理装置のその他の動作は、第1実施形態の処理装置と同様なので、説明は省略する。
次に、図8を参照して、本発明の第6実施形態による処理装置について説明する。第6実施形態による処理装置は、第5実施形態による処理装置と同様である。第6実施形態による処理装置が、第5実施形態による処理装置と異なる点は、RESETレジスタ16A,16Bが、バス12A,12Bと接続されるように設けられている点にある。CPU2Aは、バス12Aを介してRESETレジスタ16Aにリセット命令を設定し、このリセット命令によりCPU2Bはリセットされる。また、CPU2Bは、バス12Bを介してRESETレジスタ16Bにリセット命令を設定し、このリセット命令によりCPU2Aはリセットされる。こうして、例えば、CPU2Aがフリーズしたとき、異常監視制御部8eからの異常救済処理指示に応答してCPU2Bはレジスタ16Bにリセット命令を設定し、CPU2Aをリセットする。これにより、CPU2Aの動作が正常に復帰することが期待され、CPU2Aは正常動作に復帰することができるであろう。
第6実施形態による処理装置のその他の動作は、第1実施形態の処理装置と同様なので、説明は省略する。
次に、図9を参照して、本発明の第7実施形態による処理装置について説明する。第7実施形態による処理装置は、第6実施形態による処理装置と同様である。第7実施形態による処理装置が、第6実施形態による処理装置と異なる点は、以下のとおりである。即ち、発振器15Aは高周波数のクロック信号を発生してCPU2Aに供給し、CPU2Aは高周波数のクロック信号に同期して動作する。発振監視回路26Aがこの発振器15Aには設けられ、発振異常を検出したとき異常検出信号を異常監視制御部8fに出力する。また、発振器15Bは低周波数のクロック信号を発生してCPU2Bに供給し、CPU2Bは低周波数のクロック信号に同期して動作する。発振監視回路26Bがこの発振器15Bには設けられ、発振異常を検出したとき異常検出信号を異常監視制御部8fに出力する。また、低電圧検出回路9fが電源(図示せず)に対して設けられ、電源電圧が所定のレベルより低くなったとき、異常検出信号を異常監視制御部8fに出力する。低電圧検出回路9fから異常検出信号が受信されたとき、異常監視制御部8fは、CPU2Bに異常救済処理指示を出力する。CPU2Bは、CPU2Aに代わって処理プログラムAを実行する。こうして、電源電圧が動作可能電圧より低くなる前に、必要な処理を実行することができる。
第6実施形態による処理装置のその他の動作は、第1実施形態の処理装置と同様なので、説明は省略する。
以上述べたように、本発明によれば、例えば、制御対象によっては、複数のCPUのうち1つが動作不能になったとしても、安全が確保されるまで最低限の処理が行われることができる。また、処理能力が低下しても、主要な処理が継続して実行されることできる。
また、バスの調停回路に対してCPUがリクエスト信号を発行する場合、調停回路は、バス調停を行い、そのCPUに対してバス使用権(グラント信号)を与える。バスを開放する場合には、CPUが調停回路に対して終了信号を発行し、それに基づいてバスが開放される。CPUがバスの使用権を確保している間に異常が発生し、バス調停あるいはCPUの切替が不可能になってしまったとしても、本発明では、異常が発生したCPU以外のCPUにより処理が代行され、あるいはリセットがかけられることにより、システム全体のダウンが防止されている。
また、半導体集積回路では、端子数を減らすことが要望されている。その場合、従来では、特定の端子が特定のCPUに固定的に割り当てられている場合、そのCPUに異常が発生したとき、他のCPUが処理を続行しようとしても、端子に接続できないのでデータを取得することができなかった。しかしながら、本発明によれば、異常発生時には代替CPUがその端子を介してデータを取得して処理を続行することができる。こうして、異常時だけでなく、処理装置の使用におけるフレキシビリティを増すこともできる。
図1は、本発明の第1実施形態による処理装置の構成を示すブロック図である。 図2は、本発明の第1実施形態により処理装置の動作を示すタイミングチャートである。 図3は、本発明の第1実施形態により処理装置の動作を示すフローチャートである。 図4は、本発明の第2実施形態による処理装置の構成を示すブロック図である。 図5は、本発明の第3実施形態による処理装置の構成を示すブロック図である。 図6は、本発明の第4実施形態による処理装置の構成を示すブロック図である。 図7は、本発明の第5実施形態による処理装置の構成を示すブロック図である。 図8は、本発明の第6実施形態による処理装置の構成を示すブロック図である。 図9は、本発明の第7実施形態による処理装置の構成を示すブロック図である。 図10は、本発明において、異常が発生したときの異常救済処理の例を示す図である。 図11は、本発明において、異常が発生したときの異常救済処理の他の例を示す図である。
符号の説明
100:メモリ
102A,102B:処理部
122A,122B,22a,22B,24A,24B,10A,10B:異常検出回路
108,8a,8b,8c,8d,8e,8f:異常監視制御部
2A,2B:CPU
106,6:セレクタ部
82a,82b,82c,82d,82e,82f:検出信号デコーダ
84a,84b,84c,84d,84e,84f:切替信号出力回路
86c,86d,86e,86f:内部メモリ
88d,88e,88f:アクセス制御回路
16A,16B:RESETレジスタ

Claims (11)

  1. それぞれ予め決められた処理を実行する複数の処理部と、
    前記複数の処理部にそれぞれ設けられ、前記複数の処理部の異常を検出して異常検出信号を生成する複数の異常検出回路と、
    前記複数の異常検出回路のいずれかからの前記異常検出信号に応答して、前記複数の処理部のうちの、異常状態にある異常処理部以外の、正常状態にある少なくとも1つの正常処理部を、異常救済処理を実行するように制御する異常監視制御部と
    を具備する処理装置。
  2. 請求項1に記載の処理装置において、
    前記異常救済処理は、前記異常処理部での処理負荷、前記正常処理部での処理負荷、前記異常処理部と前記正常処理部で処理されるべき処理の優先度に基づいて決定される
    処理装置。
  3. 請求項1又は2に記載の処理装置において、
    前記正常処理部は、前記異常救済処理において、前記異常処理部により実行されるべき処理を実行する
    処理装置。
  4. 請求項1又は2に記載の処理装置において、
    前記正常処理部は、前記異常救済処理において、前記異常処理部により実行されるべき処理と前記正常処理部で実行されるべき処理のうち優先度に従って処理する
    処理装置。
  5. 請求項1乃至4のいずれかに記載の処理装置において、
    単一の入出力端子と、
    前記複数の処理部と前記入出力端子に接続され、選択制御信号に応答して前記入出力端子を前記正常処理部に接続するセレクタ部と
    を更に具備し、
    前記異常監視制御部は、前記異常検出信号に応答して、前記選択制御信号を生成する処理装置。
  6. 請求項1乃至5のいずれかに記載の処理装置において、
    前記複数の処理部の各々は、
    CPUと、
    前記CPUに接続されたバスと、
    前記バスに接続された少なくとも1つの入出力インターフェイスと
    を具備し、
    前記複数の異常検出回路の各々は、
    前記CPUに対して設けられた第1異常検出回路と、
    前記バスに対して設けられた第2異常検出回路と、
    前記入出力インターフェイスに対して設けられた第3異常検出回路と
    を具備する処理装置。
  7. 請求項1乃至6のいずれかに記載の処理装置において、
    前記異常監視制御部は、
    前記異常検出信号をデコードしてデコード結果信号を生成する検出信号デコーダと、
    前記デコード結果信号を格納する記憶部と
    を具備する処理装置。
  8. 請求項7に記載の処理装置において、
    前記デコード結果信号を外部に出力するための端子を
    更に具備する処理装置。
  9. 請求項7又は8に記載の処理装置において、
    前記異常監視制御部は、
    前記正常処理部からの要求に応答して前記記憶部をアクセスし、前記異常処理部のデータを前記正常処理部へ送信するアクセス部
    を更に具備する処理装置。
  10. 請求項1乃至9に記載の処理装置において、
    前記正常処理部から、リセット命令が設定され、前記異常処理部をリセットするために前記設定されたリセット命令を前記異常処理部に出力するレジスタを
    更に具備する処理装置。
  11. 請求項1乃至10のいずれかに記載の処理装置において、
    前記複数の処理部のそれぞれに設けられ、前記複数の処理部が動作するための複数のクロック信号をそれぞれ生成する複数のクロック信号生成回路と、
    電源電圧が閾値より低いことを検出して異常検出信号を前記異常監視制御部に出力する電圧検出回路を
    更に具備し、
    前記異常監視制御部は、
    検出された電源電圧が閾値より低いとき、前記複数のクロック信号のうち、より高い周波数のクロック信号で動作する処理部を前記異常処理部と認定し、前記複数のクロック信号のうち、より低い周波数のクロック信号で動作する処理部を前記正常処理部と認定し、前記異常救済処理を行うよう前記正常処理部を制御する
    処理装置。
JP2005187641A 2005-06-28 2005-06-28 処理装置 Expired - Fee Related JP4831599B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2005187641A JP4831599B2 (ja) 2005-06-28 2005-06-28 処理装置
US11/474,948 US8296602B2 (en) 2005-06-28 2006-06-27 Processor and method of controlling execution of processes
US13/631,272 US8984334B2 (en) 2005-06-28 2012-09-28 Processor and method of controlling execution of processes
US14/615,935 US9342416B2 (en) 2005-06-28 2015-02-06 Processor and method of controlling execution of processes
US15/133,841 US10235254B2 (en) 2005-06-28 2016-04-20 Processor and method of controlling execution of processes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005187641A JP4831599B2 (ja) 2005-06-28 2005-06-28 処理装置

Publications (2)

Publication Number Publication Date
JP2007011426A true JP2007011426A (ja) 2007-01-18
JP4831599B2 JP4831599B2 (ja) 2011-12-07

Family

ID=37569042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005187641A Expired - Fee Related JP4831599B2 (ja) 2005-06-28 2005-06-28 処理装置

Country Status (2)

Country Link
US (4) US8296602B2 (ja)
JP (1) JP4831599B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008192151A (ja) * 2007-02-06 2008-08-21 Internatl Business Mach Corp <Ibm> 命令スレッドの指示のためのir降下データの使用
JP2010140173A (ja) * 2008-12-10 2010-06-24 Toyota Motor Corp 情報処理装置
JP2011065528A (ja) * 2009-09-18 2011-03-31 Toyota Motor Corp マルチプロセッサシステム
JP2011181064A (ja) * 2010-02-05 2011-09-15 Fujitsu Ltd 情報処理装置及び情報処理方法
JP2016132195A (ja) * 2015-01-21 2016-07-25 コニカミノルタ株式会社 画像形成装置及びジョブ処理制御方法並びにジョブ処理制御プログラム
US10579487B2 (en) 2016-08-10 2020-03-03 Renesas Electronics Corporation Semiconductor device and control method thereof including a plurality of processing units

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4831599B2 (ja) * 2005-06-28 2011-12-07 ルネサスエレクトロニクス株式会社 処理装置
TWI369608B (en) * 2008-02-15 2012-08-01 Mstar Semiconductor Inc Multi-microprocessor system and control method therefor
US8334707B2 (en) * 2008-12-29 2012-12-18 Infineon Technologies Ag Storage circuit with fault detection and method for operating the same
JPWO2011068177A1 (ja) * 2009-12-02 2013-04-18 日本電気株式会社 二重化計算システム及び二重化計算方法
JP5533789B2 (ja) 2011-06-14 2014-06-25 株式会社デンソー 車載電子制御装置
CN103164299B (zh) * 2011-12-19 2017-03-01 联想(北京)有限公司 控制方法和电子设备
WO2014032610A1 (zh) * 2012-09-03 2014-03-06 东南大学 一种面向cpu流水线的错误恢复电路
US9952922B2 (en) 2013-07-18 2018-04-24 Nxp Usa, Inc. Fault detection apparatus and method
US9604585B2 (en) * 2014-07-11 2017-03-28 Ford Global Technologies, Llc Failure management in a vehicle
US10620613B2 (en) * 2017-08-21 2020-04-14 Fisher-Rosemount Systems, Inc. High performance control server system
US10922203B1 (en) * 2018-09-21 2021-02-16 Nvidia Corporation Fault injection architecture for resilient GPU computing

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05100882A (ja) * 1991-10-09 1993-04-23 Hitachi Ltd 情報処理装置
JPH0667916A (ja) * 1992-08-18 1994-03-11 Nec Corp 障害処理方式
JPH0820962B2 (ja) * 1986-09-30 1996-03-04 アンリツ株式会社 高級言語処理方法
JPH1083257A (ja) * 1996-09-09 1998-03-31 Mitsubishi Electric Corp データストレージシステム及びデータストレージ管理方法
JPH10187638A (ja) * 1996-10-28 1998-07-21 Mitsubishi Electric Corp クラスタ制御システム
JP2002259355A (ja) * 2001-02-28 2002-09-13 Hitachi Ltd 多重系システム
WO2003102772A2 (en) * 2002-05-31 2003-12-11 Veritas Operating Corporation Business continuation policy for server consolidation environment
JP2004295462A (ja) * 2003-03-27 2004-10-21 Hitachi Ltd リカバリ処理方法及びその実施システム並びにその処理プログラム

Family Cites Families (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS594054B2 (ja) * 1979-04-17 1984-01-27 株式会社日立製作所 マルチプロセツサ障害検出方式
EP0236803B1 (de) * 1986-03-12 1992-01-15 Siemens Aktiengesellschaft Verfahren zum Betrieb einer fehlergesicherten hochverfügbaren Multiprozessor-Zentralsteuereinheit eines Vermittlungssystemes
US4839895A (en) * 1987-01-07 1989-06-13 Nec Corporation Early failure detection system for multiprocessor system
JPH02310664A (ja) * 1989-05-26 1990-12-26 Hitachi Ltd 共有メモリを用いた通信方式
DE69021712T2 (de) * 1990-02-08 1996-04-18 Ibm Wiederanlaufkennzeichnungsmechanismus für fehlertolerierende Systeme.
JPH04149658A (ja) * 1990-10-08 1992-05-22 Canon Inc 情報処理装置
JP3189903B2 (ja) * 1991-06-03 2001-07-16 富士通株式会社 ケーパビリティの退避・復元機構を持つ装置
CA2072169A1 (en) * 1991-06-24 1992-12-25 Lih-Juan L. Danielson In-band/out-of-band alert delivery system
EP0553338B1 (en) * 1991-08-16 1999-10-13 Cypress Semiconductor Corp. High-performance dynamic memory system
JPH05128080A (ja) * 1991-10-14 1993-05-25 Mitsubishi Electric Corp 情報処理装置
US5574849A (en) * 1992-12-17 1996-11-12 Tandem Computers Incorporated Synchronized data transmission between elements of a processing system
JP3047275B2 (ja) * 1993-06-11 2000-05-29 株式会社日立製作所 バックアップ切り換え制御方法
US5513346A (en) * 1993-10-21 1996-04-30 Intel Corporation Error condition detector for handling interrupt in integrated circuits having multiple processors
JP2650855B2 (ja) 1994-07-07 1997-09-10 旭コンクリート工業株式会社 マンホールにおける管路取付方法
JP3345626B2 (ja) * 1994-09-29 2002-11-18 富士通株式会社 マルチプロセッサシステムにおけるプロセッサ異常対策装置およびマルチプロセッサシステムにおけるプロセッサ異常対策方法
DE4438277C2 (de) * 1994-10-26 2001-07-05 Eberspaecher J Gmbh & Co Diagnosesystem für die Erfassung und Anzeige von Funktionen eines Kraftfahrzeug-Heizgerätes
JP3196004B2 (ja) * 1995-03-23 2001-08-06 株式会社日立製作所 障害回復処理方法
JP3657027B2 (ja) * 1995-05-25 2005-06-08 株式会社小松製作所 車両故障診断装置の時間管理システム及び方法
US5613071A (en) * 1995-07-14 1997-03-18 Intel Corporation Method and apparatus for providing remote memory access in a distributed memory multiprocessor system
JPH09251443A (ja) * 1996-03-18 1997-09-22 Hitachi Ltd 情報処理システムのプロセッサ障害回復処理方法
US5796934A (en) * 1996-05-31 1998-08-18 Oracle Corporation Fault tolerant client server system
US5864653A (en) * 1996-12-31 1999-01-26 Compaq Computer Corporation PCI hot spare capability for failed components
JP3849951B2 (ja) * 1997-02-27 2006-11-22 株式会社日立製作所 主記憶共有型マルチプロセッサ
US6363497B1 (en) * 1997-05-13 2002-03-26 Micron Technology, Inc. System for clustering software applications
US6542926B2 (en) * 1998-06-10 2003-04-01 Compaq Information Technologies Group, L.P. Software partitioned multi-processor system with flexible resource sharing levels
US6199179B1 (en) * 1998-06-10 2001-03-06 Compaq Computer Corporation Method and apparatus for failure recovery in a multi-processor computer system
JP2000076199A (ja) 1998-08-28 2000-03-14 Nec Corp デバッグ端子を有するマルチプロセッサ装置
US6651125B2 (en) * 1999-09-28 2003-11-18 International Business Machines Corporation Processing channel subsystem pending I/O work queues based on priorities
US6662333B1 (en) * 2000-02-04 2003-12-09 Hewlett-Packard Development Company, L.P. Shared error correction for memory design
JP2001275140A (ja) * 2000-03-28 2001-10-05 Matsushita Electric Ind Co Ltd 運用/待機構成の通信制御装置及び運用/待機系切替方法
US6594785B1 (en) * 2000-04-28 2003-07-15 Unisys Corporation System and method for fault handling and recovery in a multi-processing system having hardware resources shared between multiple partitions
US6725317B1 (en) * 2000-04-29 2004-04-20 Hewlett-Packard Development Company, L.P. System and method for managing a computer system having a plurality of partitions
US6763474B1 (en) * 2000-08-03 2004-07-13 International Business Machines Corporation System for synchronizing nodes in a heterogeneous computer system by using multistage frequency synthesizer to dynamically adjust clock frequency of the nodes
US7228441B2 (en) * 2000-09-27 2007-06-05 Huron Ip Llc Multi-server and multi-CPU power management system and method
JP2002140202A (ja) * 2000-11-01 2002-05-17 Hitachi Ltd 情報配信システムおよびその負荷分散方法
US6785841B2 (en) * 2000-12-14 2004-08-31 International Business Machines Corporation Processor with redundant logic
JP4087072B2 (ja) * 2001-01-25 2008-05-14 株式会社日立製作所 ストレージシステム及び仮想プライベートボリューム制御方法
JP4457184B2 (ja) * 2001-02-13 2010-04-28 ネットアップ,インコーポレイテッド ストレージシステムにおけるフェイルオーバー処理
US7010726B2 (en) * 2001-03-01 2006-03-07 International Business Machines Corporation Method and apparatus for saving data used in error analysis
US6715101B2 (en) * 2001-03-15 2004-03-30 Hewlett-Packard Development Company, L.P. Redundant controller data storage system having an on-line controller removal system and method
US20020156983A1 (en) * 2001-04-19 2002-10-24 International Business Machines Corporation Method and apparatus for improving reliability of write back cache information
US6874014B2 (en) * 2001-05-29 2005-03-29 Hewlett-Packard Development Company, L.P. Chip multiprocessor with multiple operating systems
JP2003015826A (ja) * 2001-07-04 2003-01-17 Hitachi Ltd ディスクアレイ制御装置における共有メモリコピー機能
US6865695B2 (en) * 2001-07-26 2005-03-08 International Business Machines Corpoation Robust system bus recovery
US6922791B2 (en) * 2001-08-09 2005-07-26 Dell Products L.P. Failover system and method for cluster environment
US6993566B2 (en) * 2001-09-13 2006-01-31 International Business Machines Corporation Entity self-clustering and host-entity communication such as via shared memory
US6842870B2 (en) * 2001-09-20 2005-01-11 International Business Machines Corporation Method and apparatus for filtering error logs in a logically partitioned data processing system
JP2003131900A (ja) * 2001-10-24 2003-05-09 Hitachi Ltd サーバシステム運用管理方式
US6948091B2 (en) * 2002-05-02 2005-09-20 Honeywell International Inc. High integrity recovery from multi-bit data failures
JP4119162B2 (ja) * 2002-05-15 2008-07-16 株式会社日立製作所 多重化計算機システム、論理計算機の割当方法および論理計算機の割当プログラム
US7694085B2 (en) * 2002-06-14 2010-04-06 Nokia Corporation Warming large dynamic data in redundant functional unit
US7117315B2 (en) * 2002-06-27 2006-10-03 Fujitsu Limited Method and apparatus for creating a load module and a computer product thereof
JP3951835B2 (ja) * 2002-07-03 2007-08-01 株式会社日立製作所 業務管理方法及び業務処理システム
JP3774826B2 (ja) * 2002-07-11 2006-05-17 日本電気株式会社 情報処理装置
US7028218B2 (en) * 2002-12-02 2006-04-11 Emc Corporation Redundant multi-processor and logical processor configuration for a file server
US7366765B1 (en) * 2003-01-17 2008-04-29 Unisys Corporation Outboard clustered computer systems manager utilizing commodity components
JP2004234558A (ja) * 2003-01-31 2004-08-19 Hitachi Ltd 記憶デバイス制御装置、及びプログラム
US7290260B2 (en) * 2003-02-20 2007-10-30 International Business Machines Corporation Dynamic processor redistribution between partitions in a computing system
JP4051703B2 (ja) * 2003-03-31 2008-02-27 日本電気株式会社 シングルプロセッサ向けosによる並列処理システム、並列処理プログラム
US7139940B2 (en) * 2003-04-10 2006-11-21 International Business Machines Corporation Method and apparatus for reporting global errors on heterogeneous partitioned systems
US7676600B2 (en) * 2003-04-23 2010-03-09 Dot Hill Systems Corporation Network, storage appliance, and method for externalizing an internal I/O link between a server and a storage controller integrated within the storage appliance chassis
US7080230B2 (en) * 2003-04-25 2006-07-18 International Business Machines Corporation Broadcasting error notifications in system with dynamic partitioning
US7339885B2 (en) * 2003-06-05 2008-03-04 International Business Machines Corporation Method and apparatus for customizable surveillance of network interfaces
JP4276028B2 (ja) * 2003-08-25 2009-06-10 株式会社日立製作所 マルチプロセッサシステムの同期方法
US7117389B2 (en) * 2003-09-18 2006-10-03 International Business Machines Corporation Multiple processor core device having shareable functional units for self-repairing capability
US7225356B2 (en) * 2003-11-06 2007-05-29 Siemens Medical Solutions Health Services Corporation System for managing operational failure occurrences in processing devices
JP2005149436A (ja) * 2003-11-20 2005-06-09 Hitachi Ltd ストレージ装置、ストレージ装置における制御方法、ジョブスケジューリング処理方法及び障害処理方法並びにそれらのプログラム
JP4288418B2 (ja) * 2003-12-02 2009-07-01 日本電気株式会社 計算機システムおよび状態取得方法ならびに状態取得プログラム
DE102004005128B3 (de) * 2004-02-02 2005-01-05 Fujitsu Siemens Computers Gmbh Anordnung mehrerer Rechner und Verfahren zum Betreiben einer Anordnung mehrerer Rechner bei einem Rechnerausfall
DE102004009497B3 (de) * 2004-02-27 2005-06-30 Infineon Technologies Ag Chipintegriertes Mehrprozessorsystem und Verfahren zur Kommunikation zwischen mehreren Prozessoren eines chipintegrierten Mehrprozessorsystems
JP4462969B2 (ja) * 2004-03-12 2010-05-12 株式会社日立製作所 フェイルオーバクラスタシステム及びフェイルオーバ方法
JP2005301442A (ja) * 2004-04-07 2005-10-27 Hitachi Ltd ストレージ装置
US20060015773A1 (en) * 2004-07-16 2006-01-19 Dell Products L.P. System and method for failure recovery and load balancing in a cluster network
US7418557B2 (en) * 2004-11-30 2008-08-26 International Business Machines Corporation Managing multiprocessor operations
JP4462024B2 (ja) * 2004-12-09 2010-05-12 株式会社日立製作所 ディスク引き継ぎによるフェイルオーバ方法
US7321987B2 (en) * 2005-01-04 2008-01-22 International Business Machines Corporation Error monitoring of partitions in a computer system using partition status indicators
US7321989B2 (en) * 2005-01-05 2008-01-22 The Aerospace Corporation Simultaneously multithreaded processing and single event failure detection method
US7668962B2 (en) * 2005-02-07 2010-02-23 Symantec Operating Corporation System and method for connection failover using redirection
US7467325B2 (en) * 2005-02-10 2008-12-16 International Business Machines Corporation Processor instruction retry recovery
US7543305B2 (en) * 2005-03-24 2009-06-02 International Business Machines Corporation Selective event registration
JP4529767B2 (ja) * 2005-04-04 2010-08-25 株式会社日立製作所 クラスタ構成コンピュータシステム及びその系リセット方法
US8578385B2 (en) * 2005-04-21 2013-11-05 Microsoft Corporation Method and system for virtual service isolation
US7716521B1 (en) * 2005-05-06 2010-05-11 Oracle America, Inc. Multiple-core, multithreaded processor with flexible error steering mechanism
US7689660B2 (en) * 2005-06-09 2010-03-30 Sap Ag Application server architecture
JP4831599B2 (ja) * 2005-06-28 2011-12-07 ルネサスエレクトロニクス株式会社 処理装置
US7937616B2 (en) * 2005-06-28 2011-05-03 International Business Machines Corporation Cluster availability management
JP4939102B2 (ja) * 2006-04-21 2012-05-23 株式会社日立製作所 ネットワークブート計算機システムの高信頼化方法
JP4247262B2 (ja) * 2006-09-29 2009-04-02 株式会社東芝 集積回路装置
JP4923990B2 (ja) * 2006-12-04 2012-04-25 株式会社日立製作所 フェイルオーバ方法、およびその計算機システム。
US8370679B1 (en) * 2008-06-30 2013-02-05 Symantec Corporation Method, apparatus and system for improving failover within a high availability disaster recovery environment
US8682639B2 (en) * 2010-09-21 2014-03-25 Texas Instruments Incorporated Dedicated memory window for emulation address
EP2813949B1 (en) * 2013-06-11 2019-08-07 ABB Schweiz AG Multicore processor fault detection for safety critical software applications

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0820962B2 (ja) * 1986-09-30 1996-03-04 アンリツ株式会社 高級言語処理方法
JPH05100882A (ja) * 1991-10-09 1993-04-23 Hitachi Ltd 情報処理装置
JPH0667916A (ja) * 1992-08-18 1994-03-11 Nec Corp 障害処理方式
JPH1083257A (ja) * 1996-09-09 1998-03-31 Mitsubishi Electric Corp データストレージシステム及びデータストレージ管理方法
JPH10187638A (ja) * 1996-10-28 1998-07-21 Mitsubishi Electric Corp クラスタ制御システム
JP2002259355A (ja) * 2001-02-28 2002-09-13 Hitachi Ltd 多重系システム
WO2003102772A2 (en) * 2002-05-31 2003-12-11 Veritas Operating Corporation Business continuation policy for server consolidation environment
JP2005528691A (ja) * 2002-05-31 2005-09-22 ベリタス オペレーティング コーポレーション サーバ連結環境のための業務継続ポリシー
JP2004295462A (ja) * 2003-03-27 2004-10-21 Hitachi Ltd リカバリ処理方法及びその実施システム並びにその処理プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008192151A (ja) * 2007-02-06 2008-08-21 Internatl Business Mach Corp <Ibm> 命令スレッドの指示のためのir降下データの使用
JP2010140173A (ja) * 2008-12-10 2010-06-24 Toyota Motor Corp 情報処理装置
JP2011065528A (ja) * 2009-09-18 2011-03-31 Toyota Motor Corp マルチプロセッサシステム
JP2011181064A (ja) * 2010-02-05 2011-09-15 Fujitsu Ltd 情報処理装置及び情報処理方法
JP2016132195A (ja) * 2015-01-21 2016-07-25 コニカミノルタ株式会社 画像形成装置及びジョブ処理制御方法並びにジョブ処理制御プログラム
US9900454B2 (en) 2015-01-21 2018-02-20 Konica Minolta, Inc. Image forming apparatus, job processing control method and non-transitory computer-readable storage medium storing job processing control program
US10579487B2 (en) 2016-08-10 2020-03-03 Renesas Electronics Corporation Semiconductor device and control method thereof including a plurality of processing units

Also Published As

Publication number Publication date
US10235254B2 (en) 2019-03-19
US20160232064A1 (en) 2016-08-11
US20130024724A1 (en) 2013-01-24
US8984334B2 (en) 2015-03-17
US9342416B2 (en) 2016-05-17
US8296602B2 (en) 2012-10-23
JP4831599B2 (ja) 2011-12-07
US20060294422A1 (en) 2006-12-28
US20150154088A1 (en) 2015-06-04

Similar Documents

Publication Publication Date Title
JP4831599B2 (ja) 処理装置
KR101283431B1 (ko) 마이크로 컴퓨터
JP6692763B2 (ja) 制御装置および制御プログラム更新方法
JP2015018414A (ja) マイクロコンピュータ
US7428660B2 (en) Starting control method, duplex platform system, and information processor
JP2014081700A (ja) プログラマブルコントローラ、プログラマブルコントローラのデータバックアップ方法、プログラマブルコントローラの起動方法
JP6723941B2 (ja) 制御装置および制御プログラム更新方法
JP2010198131A (ja) プロセッサシステム、及びプロセッサシステムの動作モード切り替え方法
US8601215B2 (en) Processor, server system, and method for adding a processor
JP2006244382A (ja) マイクロプロセッサ
JP6047033B2 (ja) Lsiおよび情報処理システム
JP2003296133A (ja) コントローラ
CN112100002A (zh) 半导体装置和操作半导体装置的方法
CN110462603B (zh) 微型计算机
JP2008152665A (ja) 半導体集積回路の動作解析方法
JP4983806B2 (ja) 二重化タイマを用いたシステム監視装置、および監視方法
JP7295780B2 (ja) 半導体装置及びその動作方法
JP5087884B2 (ja) データ処理ユニット、およびこれを使用したデータ処理装置
JP6535516B2 (ja) マルチ・プログラマブルデバイス・システムとその制御方法
JP2006099654A (ja) 半導体回路装置
JP2006079180A (ja) マイクロコンピュータ
JP2018041492A (ja) マイクロコンピュータ
JP2005309663A (ja) モーションコントローラ
JP2011258053A (ja) マイクロコンピュータ
JP2005258576A (ja) 二重系cpu切替システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080516

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110914

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110914

R150 Certificate of patent or registration of utility model

Ref document number: 4831599

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees