JP2008146148A - 計算機システム - Google Patents

計算機システム Download PDF

Info

Publication number
JP2008146148A
JP2008146148A JP2006329458A JP2006329458A JP2008146148A JP 2008146148 A JP2008146148 A JP 2008146148A JP 2006329458 A JP2006329458 A JP 2006329458A JP 2006329458 A JP2006329458 A JP 2006329458A JP 2008146148 A JP2008146148 A JP 2008146148A
Authority
JP
Japan
Prior art keywords
computer system
error message
recording
failure
recording destination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006329458A
Other languages
English (en)
Inventor
Ryuzo Komori
隆三 小森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2006329458A priority Critical patent/JP2008146148A/ja
Publication of JP2008146148A publication Critical patent/JP2008146148A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Bus Control (AREA)

Abstract

【課題】汎用のマルチコアCPUモジュールのサブCPUに固定的に割り込み処理を割り付け、メインCPU上で動作しているアプリケーション処理を中断することなく、割り込み処理を行うようにした計算機システムを得る。
【解決手段】マルチコアCPUモジュール4は、アプリケーションが動作するメインCPU2とサブCPU3を有し、サブCPU3は、ハードウェアからの割り込み通知先を自CPUに設定しておき、割り込みが発生した場合にその割り込みを割り込み検出処理部10により検出し、割り込みの要因を割り込み要因識別部11で識別し、識別された割り込み要因をメインCPU2へ通知するかどうかをメインCPU通知判定処理部12で判定し、判定にしたがって、割り込み要因をCPU間割り込み通知部13によりメインCPUに通知する。
【選択図】図1

Description

この発明は、マルチコアCPUモジュールを搭載した産業用の計算機システムに関するものである。
従来の計算機システムでは、割り込み処理、故障判定処理およびエラーメッセージの変換処理について、CPUを固定的に割り付けて行っておらず、シングルCPUの計算機システムの場合は、割り込みおよび故障を検出した場合、CPUに対して割り込みを発生し、システムの停止・継続の対処の前に、CPUに割り込み・故障対応処理を実施させていた。
また、特許文献1の障害情報収集機能付きコンピュータには、計算機構成部分から独立し、かつ計算機構成部分の構成要素にアクセス可能に構成された障害情報収集機能により、計算機構成部分に障害が発生した場合に、計算機構成部分の構成要素に対してアクセスして、その障害情報を収集し、保存する第2の計算機構成部分を備えたものが記載されている。
特開2000−112790号公報(第3〜7頁、図1)
従来の計算機システムでは、割り込み処理、故障判定処理およびエラーメッセージの変換処理について、CPUを固定的に割り付けて行っていなかった。産業用のリアルタイム処理が必要な分野では、リアルタイムアプリケーションの処理を極力継続することが要求されるが、この割り込み・故障対応処理のために、CPU上で動作していたアプリケーションプログラムの処理が、アプリケーションの動作に影響の無い割り込みや継続可能な故障情報のために中断していた。また、CPU上のオペレーティングシステムおよびアプリケーションの状況により、割り込み・故障対応処理が行えない場合もあった。
また、特許文献1に示される障害情報収集機能付きコンピュータは、これらを解決しようとするものであるが、特別なハードウェアの追加と専用のCPUハードウェアを作る必要があり、コストが高くなる、また、市販の汎用のパーソナルコンピュータが利用できないなどの問題点があった。
また、Linux(登録商標)のような汎用のオペレーティングシステムを使用する場合、各故障検出時には、エラーメッセージとして記録されるが、従来から利用してきた形式のエラーメッセージにするために、このエラー発生時の処理を改造すると、障害を解消するためのプログラム変更モジュールの適用ができないという問題点があった。
この発明は、上記のような課題を解決するためになされたものであり、汎用のマルチコアCPUモジュールのサブCPUに固定的に割り込み処理を割り付け、メインCPU上で動作しているアプリケーション処理を中断することなく、割り込み処理を行うようにした計算機システムを得ることを目的とする。
この発明に係わる計算機システムにおいては、アプリケーションが動作するメインCPU及びこのメインCPUとは別のサブCPUを有するマルチコアCPUモジュールを搭載した計算機システムにおいて、サブCPUは、ハードウェアからの割り込み通知を自CPU宛に設定する割り込み設定手段、ハードウェアからの割り込みが発生した場合に割り込みを検出する割り込み検出手段、ハードウェアからの割り込みの要因を識別する割り込み要因識別手段、この割り込み要因識別手段によって識別された割り込み要因をメインCPUへ通知するかどうかを判定するメインCPU通知判定手段、及びこのメインCPU通知判定手段によってメインCPUに通知する割り込み要因と判定されたときに、割り込み要因をメインCPUに通知するCPU間割り込み手段を備えたものである。
この発明は、以上説明したように、アプリケーションが動作するメインCPU及びこのメインCPUとは別のサブCPUを有するマルチコアCPUモジュールを搭載した計算機システムにおいて、サブCPUは、ハードウェアからの割り込み通知を自CPU宛に設定する割り込み設定手段、ハードウェアからの割り込みが発生した場合に割り込みを検出する割り込み検出手段、ハードウェアからの割り込みの要因を識別する割り込み要因識別手段、この割り込み要因識別手段によって識別された割り込み要因をメインCPUへ通知するかどうかを判定するメインCPU通知判定手段、及びこのメインCPU通知判定手段によってメインCPUに通知する割り込み要因と判定されたときに、割り込み要因をメインCPUに通知するCPU間割り込み手段を備えたので、汎用のマルチコアCPUモジュールのサブCPUに固定的に割り込み処理を割り付け、メインCPU上で動作しているアプリケーション処理を中断することなく、割り込み処理を行うことができる。
実施の形態1.
以下、この発明の実施の形態1を図1に基づいて説明する。
図1は、この発明の実施の形態1による計算機システムを示す構成図である。
図1において、計算機システム1は、ワークステーション、パーソナルコンピュータ、あるいはその他の計算機からなるものである。この計算機として、メインCPU2およびサブCPU3の複数のCPUコアを含むマルチコアCPUモジュール4と主記憶としてのメモリ5が、メモリ制御を行うメモリ制御部及び割り込み制御を行う割り込み制御部並びにシステムバス制御を行うシステムバス制御部を持つシステムバスブリッジ6により接続されている。さらに、システムバスブリッジ6には、システムバス7を介して複数の周辺装置インタフェース8が接続されている。複数の周辺装置インタフェース8は、各種周辺装置に接続される。
なお、上述の実施の形態1では、マルチコアCPUモジュール4とメモリ5の接続に、システムバスブリッジ6を用いているが、発明を適用する計算機の構成は、この構成にかぎられない。
メインCPU2は、メモリ5に格納されたプログラムに従って、計算機システムとしての機能を実現する。サブCPU3は、ハードウェアからの割り込み通知をサブCPU3に通知するよう設定する割り込み設定処理部9(割り込み設定手段)、ハードウェアの割り込み発生時に割り込みを検出する割り込み検出処理部10(割り込み検出手段)、割り込み要因を識別する割り込み要因識別部11(割り込み要因識別手段)、ハードウェアの割り込み要因がメインCPU2への通知が必要なものかどうかを判定するメインCPU通知判定処理部12(メインCPU通知判定手段)、メインCPU2に対してCPU間割り込みを行うCPU間割り込み通知部13(CPU間割り込み手段)により構成されるプログラムによって、割り込み発生時の処理を実行する。このプログラムは、メモリ5に格納されている。このうち割り込み設定処理部9は、サブCPU3以外の他のCPU上に存在してもかまわない。
次に動作について説明する。
マルチコアCPUモジュール4に対して、ハードウェアの割り込みが発生した場合に、サブCPU3に割り込み通知が上がるように、割り込み設定処理部9の割り込み設定処理により設定する。これ以降、ハードウェアからの割り込み通知は、全てサブCPU3に上がるようになる。
ハードウェアの割り込みが発生すると、サブCPU3上で動作する割り込み検出処理部10により、その割り込みが検出され、割り込み要因識別部11によって、ハードウェアから割り込み要因を読み出し、識別する。そして、識別した割り込み要因が、メインCPU2に通知を行う必要があるかどうかをメインCPU通知判定処理部12により判定し、メインCPU2への通知が必要と判定された場合には、CPU間割り込み通知部13によって、メインCPU2に対してCPU間割り込みを発生する。メインCPU2に通知をする必要がない場合には、そのまま処理を終了する。
実施の形態1によれば、汎用のマルチコアCPUモジュールのサブCPUに固定的に割り込み処理を割り付け、メインCPU上で動作しているアプリケーション処理を中断することなく、割り込み処理を行うことができる。
また、汎用のマルチコアCPUモジュールを使用することにより、特別なハードウェアの追加を必要としない。
実施の形態2.
実施の形態1では、サブCPU上で割り込み要因を識別する機能を提供した。実施の形態2では、さらに、サブCPU上で、割り込み要因が故障要因かどうかを判定する故障判定処理を行い、メインCPUとは独立して、故障情報を収集する故障情報収集処理と故障情報記録処理を行うようにした。故障の種別によっては、メインCPU上の処理を継続できるものも存在するため、メインCPU上の処理に影響がない場合には、メインCPU上の処理を中断することなく、故障情報の収集・記録を行うことができる。
図2は、この発明の実施の形態2による計算機システムを示す構成図である。
図2において、1〜13は図1におけるものと同一のものである。図2では、サブCPU3に、識別された割り込み要因が、故障要因かどうかを判定する故障判定処理部14(故障判定手段)と、故障情報と判定された場合に、故障要因の解析に必要な故障情報を収集する故障情報収集処理部15(故障情報収集手段)と、収集された故障情報を、周辺装置インタフェース8を介して接続されているデバイスに記録する故障情報記録処理部16(故障情報記録手段)とを設けている。
次に図2を用いて、実施の形態2の動作について説明する。
実施の形態1では、全体的な動作について説明したが、実施の形態2では、故障要因判定処理、故障情報収集処理、故障情報記録処理について説明する。
図2に示された計算機システムは、割り込み要因を識別するまでは、実施の形態1で述べたとおりである。ここで、識別された割り込み要因は、故障要因かどうかを故障判定処理部14で判定し、故障情報と判定された場合、故障要因の解析に必要な故障情報を故障情報収集処理部15にて収集する。収集された故障情報は、故障情報記録処理部16により、周辺装置インタフェース8を介して接続されているデバイスに記録する。故障要因に対するメインCPU2への通知については、実施の形態1で述べたとおりである。
実施の形態2によれば、サブCPUに、固定的に、故障判定処理、故障情報収集および故障情報記録処理を割り付けることにより、メインCPU上で動作しているアプリケーション処理を中断することなく、故障情報収集および故障情報記録処理を行うことができる。
実施の形態3.
実施の形態2では、故障情報を、周辺装置インタフェース8を介して接続されているデバイスに記録した。実施の形態3では、さらに通信により他の計算機システムに対して故障情報を記録できるようにしたものである。故障の種別によっては、デバイスの故障時など同一計算機内に記録できない場合が存在するため、他の計算機システムに故障情報を通知することで、故障情報の取得性の向上が期待できる。
図3は、この発明の実施の形態3による計算機システムを示す構成図である。
図3において、1〜16は図2におけるものと同一のものである。図3では、サブCPU3の故障情報記録処理部16に、通信制御部18(通信制御手段)を設け、収集された故障情報を、システムバス7に接続された通信インタフェース17を介して他の計算機システムに送信し、他の計算機システムに記録させる。
次に、図3を用いて、実施の形態3の動作について説明する。
実施の形態2では、周辺装置インタフェース8を介して接続されているデバイスへの故障情報の記録について説明したが、実施の形態3では、通信インタフェース17を介した故障情報記録処理について説明する。
図5に示された計算機システムは、故障情報を収集するまでは、実施の形態2で述べたとおりである。収集された故障情報は、故障情報記録処理部16の通信制御部18により、システムバス7に接続された通信インタフェース17を介して他の計算機システムに記録される。
なお、故障要因に対するメインCPU2への通知については、実施の形態1で述べたとおりである。
実施の形態3によれば、故障情報記録処理に他の計算機システムへの出力を行えるようにすることにより、自計算機システムへの記録が行えない場合にも故障情報記録を行うことができる。
実施の形態4.
実施の形態2および実施の形態3では、故障情報を、周辺装置インタフェース8を介して接続されているデバイスまたは、通信インタフェース17を介して他の計算機システムに記録した。実施の形態4では、さらに記録先をどこにするかを指定する記録先指定部を追加し、故障情報記録処理で、記録先指定部で設定された記録先に故障情報を記録するようにした。これにより故障情報の記録先は、計算機システムの運用状態に応じて変更することが可能になる。
図4は、この発明の実施の形態4による計算機システムを示す構成図である。
図4において、1〜18は図3におけるものと同一のものである。図4では、サブCPU3に記録先を指定する記録先指定部20(記録先指定手段)を設け、メモリ5に記録先指定情報19を格納した。
次に、図4を用いて、実施の形態4の動作について説明する。
実施の形態4では、記録先指定部20について説明する。
図4に示された計算機システムは、故障情報を収集するまでは、実施の形態2で述べたとおりである。収集された故障情報は、記録先指定部20により、例えばメモリ5上の記録先指定情報19に設定された記録先を、故障情報記録処理部16にて参照し、指定された記録先に故障情報を記録する。故障要因に対するメインCPUへの通知については、実施の形態1で述べたとおりである。
実施の形態4によれば、故障情報の記録先を指定でき、故障情報にもとづいて、記録先に故障情報の出力が可能かどうかを判定し、何れかに故障情報の記録を行うことができる。
実施の形態5.
実施の形態4では、故障情報の記録先を指定できるようにした。実施の形態5では、さらに、故障情報の出力先を複数指定できるようにするとともに、収集された故障情報から、記録先が故障部位であるかどうかを判定し、登録された記録先の中から記録可能な記録先を選択し、故障情報記録処理部で、選択された記録先に故障情報を記録するようにしたものである。
これにより故障情報の記録先が故障していた場合でも、代替の記録先に記録が行えるようになり、故障情報の獲得性が向上する。
図5は、この発明の実施の形態5による計算機システムを示す構成図である。
図5において、1〜18、20は図4におけるものと同一のものである。図5では、サブCPU3に、記録先を決定する記録先決定処理部22(記録先決定手段)を設け、また、メモリ5に、例えば記録先の一覧である記録先指定テーブル21を設けたものである。
次に、図5を用いて、実施の形態5の動作について説明する。実施の形態5では、記録先指定部20および、記録先決定処理部22について説明する。
図5に示された計算機システムは、故障情報を収集するまでは、実施の形態4で述べたとおりである。メモリ5上に記録先指定テーブル21を設け、記録先指定部20により記録先を設定する。記録先指定テーブル21は、例えば記録先の一覧になっている。収集された故障情報は、記録先決定処理部22で、記録先指定テーブル21に登録された順番に、指定された記録先を取得し、収集された故障情報から記録先が記録可能かどうかを判定し、記録先が故障していた場合、次に指定された記録先を取得する。
記録可能な記録先が検出できた時点で、故障情報記録処理部16が、選択された記録先に故障情報を記録する。故障要因に対するメインCPU2への通知については、実施の形態1で述べたとおりである。
実施の形態5によれば、故障情報の記録先が故障していた場合でも、代替の記録先に記録が行えるようになり、故障情報の獲得性が向上する。
実施の形態6.
実施の形態2〜実施の形態5では、割り込み要因が故障要因かどうかの判定、故障情報の収集および故障情報の記録ができるようにした。実施の形態6では、さらに、各故障要因に対する故障対処を登録することにより、故障発生時の計算機システムの動作を決定できるようにしたものである。
これにより、故障要因毎に計算機システムの仕様に合せて故障に対する計算機システムの動作を変えることが可能となる。
図6は、この発明の実施の形態6による計算機システムを示す構成図である。
図6において、1〜18、20〜22は図5におけるものと同一のものである。図6では、サブCPU3に、故障発生時の計算機システムの動作を決定する故障対処特定処理部24(故障対処特定手段)と、故障発生時の動作を実施する故障発生時動作制御処理部25(故障発生時動作制御手段)を設け、メモリ5に、故障対処方法を示す故障対処テーブル23を設けたものである・
次に、図6を用いて、実施の形態6の動作について説明する。実施の形態6では、故障対処特定処理と故障発生時動作決定処理および故障発生時動作制御処理について説明する。
図6に示された計算機システムは、故障要因を判定するまでは、実施の形態2で述べたとおりである。
故障要因に対して、故障情報の収集、故障情報の記録、故障情報の通知(LED表示や接点出力による他計算機システムへの通知)、計算機システムの再起動、停止、故障要因に対するメインCPU2への通知の動作を定義する故障対処テーブル23を、例えばメモリ5上に持ち、サブCPU3に設けた故障対処特定処理部24にて、故障発生時に故障対処テーブル23の内容にしたがって、計算機システムの動作を決定する。ここで決定された動作は、故障発生時動作制御処理部25により実施される。
実施の形態6によれば、故障要因毎に計算機システムの仕様に合せて故障に対する計算機システムの動作を変えることが可能となる。
実施の形態7.
実施の形態1では、サブCPU上で割り込み要因を識別する機能を提供した。実施の形態7では、さらに、メインCPU上で検出されたエラーに対するエラーメッセージをサブCPU上で動作するエラーメッセージ変換処理にて、計算機システムで統一した形式のエラーメッセージに変換できるようにしたものである。
Linuxのような汎用のオペレーティングシステムを使用する場合、各故障検出時には、エラーメッセージとして記録されるが、このエラーメッセージは、計算機システムで使用するエラーメッセージの形式とは異なっていた。
このため、計算機システムで統一した形式のエラーメッセージに変換するための変換処理をサブCPU上で実施することにより、メインCPU上で実行されている処理に影響を与えることなく、また、汎用のオペレーティングシステムのエラー処理に手を加えることなく、エラーメッセージの形式を合せることができるようになる。
図7は、この発明の実施の形態7による計算機システムを示す構成図である。
図7において、1〜8は図1におけるものと同一のものである。図7は、サブCPU3に、エラーメッセージを統一した形式に変換するエラーメッセージ変換処理部27(エラーメッセージ変換手段)を設け、メモリ5に、汎用のオペレーティングシステムのエラーメッセージを記録するエラーメッセージバッファ26と、汎用のオペレーティングシステムのエラーメッセージとエラーメッセージ識別番号との対応を示したエラーメッセージ識別番号対応表28を設けている。
次に、図7を用いて、実施の形態7の動作について説明する。
図7に示された計算機システムは、メインCPU2上のプログラムのエラーメッセージの記録先を、例えばメモリ5上のエラーメッセージバッファ26に指定する。サブCPU3上のエラーメッセージ変換処理部27は、メモリ5上のエラーメッセージバッファ26に記憶されたエラーメッセージと、エラーメッセージ識別番号の対応を示すエラーメッセージ識別番号対応表28により、エラーメッセージバッファ26に記憶されたエラーメッセージを特定識別番号に変換し、この特定識別番号により、計算機システムのエラーメッセージテーブルを検索し、計算機システムの該当のエラーメッセージに変換する。これにより、計算機システムで統一した形式のエラーメッセージに変換することができる。
実施の形態7によれば、サブCPUに固定的にエラーメッセージ変換処理を割り付けることにより、メインCPU上で動作しているアプリケーション処理を中断することなく、エラーメッセージの変換を行うことができ、また、サブCPU上に処理を追加で割り付けるため、汎用のオペレーティングシステムのエラー処理に手を加えることなく、従来と同じエラーメッセージに変換することができる。
実施の形態8.
実施の形態7では、サブCPU上でエラーメッセージの識別とエラーメッセージ形式の変換についての機能を提供した。実施の形態8では、さらに、メインCPUとは独立して、変換されたエラーメッセージを記録する処理を追加する。これにより、メインCPU上の処理を中断することなく、変換されたエラーメッセージの記録を行うことができる。
図8は、この発明の実施の形態8による計算機システムを示す構成図である。
図8において、1〜8、26〜28は図7におけるものと同一のものである。図8では、サブCPU3に、周辺装置インタフェース8を介して接続されているデバイスに、変換されたエラーメッセージを記録するエラーメッセージ記録処理部29(エラーメッセージ記録手段)を設けている。
次に、図8を用いて、実施の形態8動作について説明する。実施の形態7では、全体的な動作について説明したが、実施の形態8では、エラーメッセージ記録処理について説明する。
図8に示された計算機システムは、エラーメッセージを識別・変換するまでは、実施の形態7で述べたとおりである。ここで、変換されたエラーメッセージは、エラーメッセージ記録処理部29により、周辺装置インタフェース8を介して接続されているデバイスに記録される。
実施の形態8によれば、サブCPUに、固定的に、エラーメッセージ記録処理を割り付けることにより、メインCPU上で動作しているアプリケーション処理を中断することなくエラーメッセージの記録処理を行うことができる。
実施の形態9.
実施の形態8では、変換されたエラーメッセージを、周辺装置インタフェース8を介して接続されているデバイスに記録した。実施の形態9は、さらに、通信により他の計算機システムに、変換されたエラーメッセージを記録するものである。故障の種別によっては、デバイスの故障時など同一計算機内に記録できない場合も存在するため、他の計算機システムに、変換されたエラーメッセージを通知することで、エラーメッセージの取得性の向上が期待できる。
図9は、この発明の実施の形態9による計算機システムを示す構成図である。
図9において、1〜8、26〜29は図8におけるものと同一のものである。図9では、エラーメッセージ記録処理部29に通信制御部30(通信制御手段)を設けるとともに、システムバス7に通信インタフェース17を接続した。
次に、図9を用いて、実施の形態9の動作について説明する。実施の形態9では、通信インタフェース17を介したエラーメッセージ記録処理について説明する。
図9に示された計算機システムは、エラーメッセージの形式を変換するまでは、実施の形態7で述べたとおりである。変換されたエラーメッセージは、エラーメッセージ記録処理部29の通信制御部30により、システムバス7に接続された通信インタフェース17を介して他の計算機システムに送信され、そこで記録される。
実施の形態9によれば、エラーメッセージ記録処理に他の計算機システムへの出力を行えるようにすることにより、自計算機システムへの記録が行えない場合にもエラーメッセージ記録を行うことができる。
実施の形態10.
実施の形態8および実施の形態9では、エラーメッセージを、周辺装置インタフェース8を介して接続されているデバイスまたは、通信インタフェース17を介して他の計算機システムに記録した。実施の形態10では、さらに記録先をどこにするかを指定する記録先指定部を追加し、エラーメッセージ記録処理で、記録先指定部で設定された記録先にエラーメッセージを記録するようにした。
これによりエラーメッセージの記録先は、計算機システムの運用状態に応じて変更することが可能になる。
図10は、この発明の実施の形態10による計算機システムを示す構成図である。
図10において、1〜8、17、26〜30は図9におけるものと同一のものである。図10では、サブCPU3に、エラーメッセージの記録先を指定する記録先指定部20(記録先指定手段)を設け、メモリ5に、エラーメッセージの記録先を指定した記録先指定情報19を格納している。
次に、図10を用いて、実施の形態10の動作について説明する。実施の形態10では、記録先指定部20について説明する。
図10に示された計算機システムは、エラーメッセージの形式を変換するまでは、実施の形態7で述べたとおりである。変換されたエラーメッセージは、記録先指定部20により、例えばメモリ5上の記録先指定情報19に設定された記録先を、エラーメッセージ記録処理部29にて参照し、指定された記録先にエラーメッセージを記録する。
実施の形態10によれば、エラーメッセージの記録先を指定でき、指定した記録先にエラーメッセージの記録を行うことができる。
実施の形態11.
実施の形態10では、エラーメッセージの記録先を指定できるようにした。実施の形態11では、さらに、エラーメッセージの出力先を複数指定できるようにし、記録先として指定された記録先が、記録可能であるかどうかの判定を行い、この判定結果に基づき、記録先の中から記録可能な記録先を選択し、選択された記録先に、エラーメッセージを記録するものである。
これにより、エラーメッセージの記録先が故障していた場合でも、代替の記録先に記録が行えるようになり、エラーメッセージの獲得性が向上する。
図11は、この発明の実施の形態11による計算機システムを示す構成図である。
図11において、1〜8、17、20、26〜30は図10におけるものと同一のものである。図11では、サブCPU3に、記録可能な記録先を決定する記録先決定処理部22(記録先決定手段)と、記録先が故障かどうかを判定する記録先故障判定処理部31(記録先故障判定手段)を設け、メモリ5に、例えば記録先の一覧である記録先指定テーブル21を設けたものである。
次に、図11を用いて、実施の形態11の動作について説明する。実施の形態11では、記録先指定部20および、記録先決定処理部22について説明する。
図11に示された計算機システムは、エラーメッセージの形式を変換するまでは、実施の形態7で述べたとおりである。メモリ5上に記録先指定テーブル21を設け、記録先指定部20により、記録先指定テーブル21の記録先を設定する。記録先指定テーブル21は、例えば記録先の一覧になっている。
エラーメッセージは、記録先決定処理部22で、テーブルに登録された順番に、指定された記録先を取得し、記録先故障判定処理部31によって、実際に記録先にアクセスし、記録先が記録可能かどうかを判定する。記録先が故障していた場合、次に指定された記録先を取得する。記録可能な記録先が検出できた時点で、選択された記録先にエラーメッセージを記録する。
実施の形態11によれば、エラーメッセージの記録先を複数指定でき、記録先の状況に基づいて、記録先への出力が可能かどうかを判定し、記録可能な記録先にエラーメッセージの記録を行うことができる。
実施の形態12.
実施の形態7〜実施の形態11では、メインCPUで出力されるエラーメッセージの変換およびエラーメッセージの記録ができるようにした。実施の形態12では、さらに、各エラーメッセージに対する対処を登録することにより、エラーメッセージ発生時の計算機システムの動作を決定できるようにしたものである。
これにより、エラーメッセージ毎に計算機システムの仕様に合せて、計算機システムの動作を変えることが可能となる。
図12は、この発明の実施の形態12による計算機システムを示す構成図である。
図12において、1〜8、17、20〜22、26〜31は図11におけるものと同一のものである。図12では、サブCPU3に、エラーメッセージ発生時に計算機システムの動作を決定するエラーメッセージ対処特定処理部33(エラーメッセージ対処特定手段)と、エラーメッセージ発生時に、エラーメッセージ対処特定処理部33により決定された計算機システムの動作を実施するエラーメッセージ発生時動作制御処理部34(エラーメッセージ発生時動作制御手段)を設け、メモリ5に、エラーメッセージへの対処を示すエラーメッセージ対処テーブル32を格納した。
次に、図12を用いて、実施の形態12の動作について説明する。実施の形態12では、エラーメッセージ対処特定処理とエラーメッセージ発生時動作制御処理について説明する。
図12に示された計算機システムは、メインCPU2上のプログラムのエラーメッセージを、計算機システムの識別番号及びエラーメッセージの形式に変換するまでは、実施の形態7で述べたとおりである。
得られた識別番号に対して、エラー情報の収集、エラー情報の記録、エラー情報の通知(LED表示や接点出力による他計算機システムへの通知)、計算機システムの再起動、停止の動作を定義したエラーメッセージ対処テーブル32をメモリ5に持ち、エラーメッセージ対処特定処理部33にて、エラーメッセージ発生時にエラーメッセージ対処テーブル32の内容にしたがって、計算機システムの動作を決定する。ここで決定された動作は、エラーメッセージ発生時動作制御処理部34により実施される。
実施の形態12によれば、エラーメッセージに基づいて、エラーメッセージ毎に異なる計算機システムの対処を行うことができる。
この発明の実施の形態1による計算機システムを示す構成図である。 この発明の実施の形態2による計算機システムを示す構成図である。 この発明の実施の形態3による計算機システムを示す構成図である。 この発明の実施の形態4による計算機システムを示す構成図である。 この発明の実施の形態5による計算機システムを示す構成図である。 この発明の実施の形態6による計算機システムを示す構成図である。 この発明の実施の形態7による計算機システムを示す構成図である。 この発明の実施の形態8による計算機システムを示す構成図である。 この発明の実施の形態9による計算機システムを示す構成図である。 この発明の実施の形態10による計算機システムを示す構成図である。 この発明の実施の形態11による計算機システムを示す構成図である。 この発明の実施の形態12による計算機システムを示す構成図である。
符号の説明
1 計算機システム、2 メインCPU、3 サブCPU、
4 マルチコアCPUモジュール、5 メモリ、6 システムバスブリッジ、
7 システムバス、8 周辺装置インタフェース、9 割り込み設定処理部、
10 割り込み検出処理部、11 割り込み要因識別部、
12 メインCPU通知判定処理部、13 CPU間割り込み通知部、
14 故障判定処理部、15 故障情報収集処理部、16 故障情報記録処理部、
17 通信インタフェース、18 通信制御部、19 記録先指定情報、
20 記録先指定部、21 記録先指定テーブル、22 記録先決定処理部、
23 故障対処テーブル、24 故障対処特定処理部、
25 故障発生時動作制御処理部、26 エラーメッセージバッファ、
27 エラーメッセージ変換処理部、28 エラーメッセージ識別番号対応表、
29 エラーメッセージ記録処理部、30 通信制御部、
31 記録先故障判定処理部、32 エラーメッセージ対処テーブル、
33 エラーメッセージ対処特定処理部、
34 エラーメッセージ発生時動作制御処理部。

Claims (12)

  1. アプリケーションが動作するメインCPU及びこのメインCPUとは別のサブCPUを有するマルチコアCPUモジュールを搭載した計算機システムにおいて、上記サブCPUは、ハードウェアからの割り込み通知を自CPU宛に設定する割り込み設定手段、ハードウェアからの割り込みが発生した場合に上記割り込みを検出する割り込み検出手段、上記ハードウェアからの割り込みの要因を識別する割り込み要因識別手段、この割り込み要因識別手段によって識別された割り込み要因を上記メインCPUへ通知するかどうかを判定するメインCPU通知判定手段、及びこのメインCPU通知判定手段によって上記メインCPUに通知する割り込み要因と判定されたときに、上記割り込み要因を上記メインCPUに通知するCPU間割り込み手段を備えたことを特徴とする計算機システム。
  2. 上記サブCPUは、上記割り込み要因識別手段によって識別された割り込み要因が故障要因かどうかを判定する故障判定手段、この故障判定手段によって故障要因と判定されたときに、上記故障要因の解析に必要な故障情報を収集する故障情報収集手段、及びこの故障情報収集手段によって収集された故障情報を記録する故障情報記録手段を備えたことを特徴とする請求項1記載の計算機システム。
  3. 上記故障情報記録手段は、上記故障情報を別の計算機システムに通信によって送信する通信制御手段を有し、上記別の計算機システムを上記故障情報の記録先とすることを特徴とする請求項2記載の計算機システム。
  4. 上記サブCPUは、上記故障情報記録手段によって上記故障情報を記録するときの記録先を指定する記録先指定手段を備えたことを特徴とする請求項2または請求項3記載の計算機システム。
  5. 上記記録先指定手段は、複数の記録先を指定できるとともに、上記サブCPUは、上記記録先指定手段によって指定された記録先が、故障部位であるかどうかを判定し、判定結果に基づき記録可能な記録先を決定する記録先決定手段を備えたことを特徴とする請求項4記載の計算機システム。
  6. 上記サブCPUは、上記故障要因に対する対処を特定する故障対処特定手段、及びこの故障対処特定手段によって特定された対処に応じて、故障時の計算機システムの動作を制御する故障発生時動作制御手段を備えたことを特徴とする請求項2〜請求項5のいずれかに記載の計算機システム。
  7. アプリケーションが動作するメインCPU及びこのメインCPUとは別のサブCPUを有するマルチコアCPUモジュールを搭載した計算機システムにおいて、上記メインCPUのオペレーティングシステムのエラーメッセージを記憶するエラーメッセージバッファを有し、上記サブCPUは、上記エラーメッセージバッファに記憶されたエラーメッセージを上記計算機システムのエラーメッセージの形式に変換するエラーメッセージ変換手段を備えたことを特徴とする計算機システム。
  8. 上記サブCPUは、上記変換されたエラーメッセージを記録するエラーメッセージ記録手段を備えたことを特徴とする請求項7記載の計算機システム。
  9. 上記エラーメッセージ記録手段は、上記変換されたエラーメッセージを別の計算機システムに通信によって送信する通信制御手段を有し、上記別の計算機システムを上記エラーメッセージの記録先とすることを特徴とする請求項8記載の計算機システム。
  10. 上記サブCPUは、上記エラーメッセージ記録手段によって上記エラーメッセージを記録するときの記録先を指定する記録先指定手段を備えたことを特徴とする請求項8または請求項9記載の計算機システム。
  11. 上記記録先指定手段は、複数の記録先を指定できるとともに、上記サブCPUは、上記記録先指定手段によって指定された記録先が、故障部位であるかどうかを判定する記録先故障判定手段、及びこの記録先故障判定手段による判定結果に基づき記録可能な記録先を決定する記録先決定手段を備えたことを特徴とする請求項10記載の計算機システム。
  12. 上記サブCPUは、上記変換されたエラーメッセージに対する対処を特定するエラーメッセージ対処特定手段、及びこのエラーメッセージ対処特定手段によって特定された対処に応じて、エラーメッセージ発生時の計算機システムの動作を制御するエラーメッセージ発生時動作制御手段を備えたことを特徴とする請求項7〜請求項11のいずれかに記載の計算機システム。
JP2006329458A 2006-12-06 2006-12-06 計算機システム Pending JP2008146148A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006329458A JP2008146148A (ja) 2006-12-06 2006-12-06 計算機システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006329458A JP2008146148A (ja) 2006-12-06 2006-12-06 計算機システム

Publications (1)

Publication Number Publication Date
JP2008146148A true JP2008146148A (ja) 2008-06-26

Family

ID=39606299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006329458A Pending JP2008146148A (ja) 2006-12-06 2006-12-06 計算機システム

Country Status (1)

Country Link
JP (1) JP2008146148A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034401A (ja) * 2009-08-03 2011-02-17 Ricoh Co Ltd 情報処理装置、情報処理方法及びそのプログラム
CN102880572A (zh) * 2012-09-07 2013-01-16 重庆蓝陵工业自控仪表有限责任公司 一种分布式系统现场设备多核嵌入式高速通讯模块

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0381834A (ja) * 1989-08-24 1991-04-08 Nec Corp 割込み制御装置
JPH0561811A (ja) * 1991-09-03 1993-03-12 Hokkaido Nippon Denki Software Kk 割込制御方式および情報処理システム
JPH0991178A (ja) * 1995-09-20 1997-04-04 Nec Software Ltd コンピュータシステムのダンプ収集機構
JPH11272632A (ja) * 1998-03-19 1999-10-08 Sharp Corp マルチプロセッサシステム
JP2001256081A (ja) * 2000-03-13 2001-09-21 Nec Corp 情報処理装置
JP2003114811A (ja) * 2001-10-05 2003-04-18 Nec Corp 自動障害復旧方法及びシステム並びに装置とプログラム
JP2005352591A (ja) * 2004-06-08 2005-12-22 Canon Inc マルチプロセッサシステム、デバッグ方法、及びプログラム
JP2006209479A (ja) * 2005-01-28 2006-08-10 Seiko Epson Corp プロセッサおよび情報処理方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0381834A (ja) * 1989-08-24 1991-04-08 Nec Corp 割込み制御装置
JPH0561811A (ja) * 1991-09-03 1993-03-12 Hokkaido Nippon Denki Software Kk 割込制御方式および情報処理システム
JPH0991178A (ja) * 1995-09-20 1997-04-04 Nec Software Ltd コンピュータシステムのダンプ収集機構
JPH11272632A (ja) * 1998-03-19 1999-10-08 Sharp Corp マルチプロセッサシステム
JP2001256081A (ja) * 2000-03-13 2001-09-21 Nec Corp 情報処理装置
JP2003114811A (ja) * 2001-10-05 2003-04-18 Nec Corp 自動障害復旧方法及びシステム並びに装置とプログラム
JP2005352591A (ja) * 2004-06-08 2005-12-22 Canon Inc マルチプロセッサシステム、デバッグ方法、及びプログラム
JP2006209479A (ja) * 2005-01-28 2006-08-10 Seiko Epson Corp プロセッサおよび情報処理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034401A (ja) * 2009-08-03 2011-02-17 Ricoh Co Ltd 情報処理装置、情報処理方法及びそのプログラム
CN102880572A (zh) * 2012-09-07 2013-01-16 重庆蓝陵工业自控仪表有限责任公司 一种分布式系统现场设备多核嵌入式高速通讯模块

Similar Documents

Publication Publication Date Title
US8191069B2 (en) Method of monitoring performance of virtual computer and apparatus using the method
JP4882845B2 (ja) 仮想計算機システム
US20100058351A1 (en) Information processing apparatus and information processing method
US11157373B2 (en) Prioritized transfer of failure event log data
EP2518627A2 (en) Partial fault processing method in computer system
WO2016000298A1 (zh) 一种系统异常的捕获方法、主系统、影子系统及智能设备
JP2008234520A (ja) ソフトウェア挙動監視装置、ソフトウェア挙動監視システム及びそのプログラム
US10102088B2 (en) Cluster system, server device, cluster system management method, and computer-readable recording medium
US8245085B2 (en) Dump output control apparatus and dump output control method
JP5163120B2 (ja) デバッグシステム、デバッグ方法、およびプログラム
JP4761229B2 (ja) 運用管理装置、運用管理方法ならびにプログラム
CN110764962A (zh) 日志处理方法和装置
JP5597293B2 (ja) 計算機システム及びプログラム
JP2008146148A (ja) 計算機システム
JP2011243012A (ja) 仮想計算機システムのメモリダンプ取得方法
JP2006164185A (ja) デバッグ装置
JP2017207903A (ja) 処理装置、方法及びプログラム
CN115499493A (zh) 异步事务处理方法、装置、存储介质及计算机设备
CN115543759A (zh) 操作系统的日志查阅方法、装置、电子设备及存储介质
JP2022142456A (ja) 異常対処プログラム、異常対処システム、及び異常対処方法
WO2020246095A1 (ja) 制御システム、プログラマブルロジックコントローラおよび情報処理方法
US7409605B2 (en) Storage system
JP2010039628A (ja) 制御システム、監視方法及びプログラム
JP4787551B2 (ja) デバッグシステム、デバッグ方法およびプログラム
JPWO2008120383A1 (ja) 情報処理装置、障害処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100910

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100921

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101022

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110215