JP2009110110A - 監視制御システム、監視制御方法、および監視制御プログラム - Google Patents
監視制御システム、監視制御方法、および監視制御プログラム Download PDFInfo
- Publication number
- JP2009110110A JP2009110110A JP2007279424A JP2007279424A JP2009110110A JP 2009110110 A JP2009110110 A JP 2009110110A JP 2007279424 A JP2007279424 A JP 2007279424A JP 2007279424 A JP2007279424 A JP 2007279424A JP 2009110110 A JP2009110110 A JP 2009110110A
- Authority
- JP
- Japan
- Prior art keywords
- error
- core
- hardware device
- function
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
【解決手段】コンピュータ1内のハードウェア装置104に接続され複数のコア処理手段101,102を有するマルチコアCPU100と、マルチコアCPU100に対してハードウェア装置104の動作制御を指示するBIOS部103とを備え、コア処理手段102が、ハードウェア装置104の起動動作時に当該ハードウェア装置の動作テストを行う初期動作診断機能を有し、コア処理手段101が、前記動作テストごとにハードウェア装置104における動作エラーをチェックし動作エラーが検知された場合に当該動作エラーに対するエラー処理を行う機能を備えた。
【選択図】図1
Description
ここで、POST時の上記ハードウェア装置を監視するウォッチドッグ(タイマー)処理を行うためには、例えばBMC(ベースボード管理コントローラ)や、専用のチップ(例:ADM6821)のようなウォッチドッグ処理用の装置をCPUとは別に設置する必要であった。
この関連技術は、一般的にPOSTの実行対象であるマザーボード機能装置304(又はCPU)と、このマザーボード機能装置304に、ウォッチドッグ監視処理を行うウォッチドッグ監視装置301を併設し、ウォッチドッグ監視装置301が、マザーボード機能デバイス304の初期動作を監視し、誤動作(動作エラー)が検出された場合には、予め設定されたエラー処理を行う機能を有する構成となっている。
これに対して、ウォッチドッグ用ICを用いることなく監視対象であるCPUの処理を監視するための手法が開示されている(特許文献1)。
又、上記関連技術であるマイクロコンピュータのリセット装置では、ウォッチドッグ処理用ICを用いることなく、ハードウェアの動作を監視することができるものの、CPUにおける割り込み処理が必要となる。この割り込み処理は電源投入時、又はPOST初期段階では動作することができず、このため、POST処理全てを監視および制御することができないという不都合がある。
本発明は、上記関連技術の有する不都合を改善し、コンピュータシステム内に生じ得る誤動作を、効果的に検知し処理する監視制御システム、監視制御方法、および監視制御プログラムを提供することを、その目的とする。
ここでは、まず、本発明の実施形態の基本的構成について説明する。
尚、本実施形態では、マルチコアCPU100が、2つのコア手段(CPUコア)を有する例を示すが、3つ以上のコア手段を有するマルチコアCPUであってもよい。
コア手段101が、BIOS部103からプログラムを読み出すと共に、当該プログラムに応じてPOST処理が行われるマザーボード機能装置104を監視する処理を行うウォッチドッグ監視機能を有する。
また、コア手段101は、コア手段102で行われるタイマークリア処理の結果をチェックすることにより、マザーボード機能装置104におけるPOST処理ごとにエラー発生の有無を判定するタイマー値検知機能を備えている。
ここで、コア手段101は、コア手段102のタイマカウンタ計数値がオーバーフロー値に達していることを検知した場合に、POST処理中のマザーボード機能装置104にエラーが発生したと判定する。
尚、上記オーバーフロー値は、タイマカウンタが減数カウントを行う場合は’0’、又、インクリメントカウントを行う場合は、予め設定された一定の値以上の数値とする。
これにより、BIOS部103は、各POSTにおけるエラーに応じたエラー処理を指示することができる。このため、コア手段101は、エラーログの取得、リセット、特定の入出力デバイスの実行といった各POST処理エラーに対応して、最適なエラー処理を実行することができる。
これにより、コア手段101は、ユーザに対してPOST処理の実行中に、エラーの発生及びエラー情報(内容)を実時間で出力することができる。
これにより、各POST処理が完了するごとにタイマカウンタの計数値がクリアされる。
尚、上記タイマカウンタは、ソフトウェア(プログラム)として実現され、又、一定時間間隔でクリアされる設定であってもよい。
更に、コア手段101は、コア手段102からのPOST処理終了通知を受信した場合に上記信号監視判定機能処理を終了する監視判定停止機能を有する。
又、BIOS部103は、コンピュータシステム1の電源が投入された際に、CPU100の動作を初期化する演算初期化機能を有する。
尚、この演算初期化機能は、上記プログラム記憶手段がアクセスされ、予め記憶された演算初期化機能(プログラム)が実行される構成であってもよい。
又、マザーボード機能装置104は、上記POST処理が実行されることにより、具体的には、メモリの初期化(記憶内容のクリア)、外部ハードウェア割り込みベクタの初期化、外部ハードウェアの初期化、ソフトウェア割り込みベクタの初期化などが行われた後に、マザーボード機能装置104の構成要素それぞれがテストされる。
次に、上記実施形態の動作について説明する。
先ず、コア手段101は、BIOS部103からの指示に基づいてマザーボード機能装置(ハードウェア装置)104の動作を監視する(監視処理工程)、次いで、コア手段102が、マザーボード機能装置104の初期動作診断処理を行うと共に当該初期動作診断に対応してタイマーカウントを行う(初期動作診断開始工程)。また、コア手段102が、初期動作診断処理完了ごとに前記タイマーカウントのクリア処理を行う(タイマークリア工程)。次いで、コア手段101が、前記クリア処理されたタイマーカウントの値に基づいて動作エラーの有無を判定する(誤動作判定工程)。最後に、動作エラーの発生が検知された場合に、一のコア処理手段101が、前記動作エラーに応じたエラー処理を行う(誤動作処理工程)。
次いで、コア手段101が、BIOS部103からプログラムを読み出すと共に、当該プログラムに応じて前記POST処理が行われるマザーボード機能装置(ハードウェア装置)104を監視する処理(ウォッチドッグ監視処理)を行う(ステップS102)。
また、BIOS部103からPOST処理の実行を指示するPOST処理用プログラムがコア手段102に送り込まれる、つまり、コア手段102が、BIOS部103からPOST処理用のプログラムを読み出すと共に、当該プログラムの内容に基づきマザーボード上のチップセット等を介しマザーボード機能装置104に対してPOST処理を行うと共に、当該各POST処理に対応してタイマーカウントを行う(ステップS103:初期動作診断開始工程)。
また、POST処理のプログラムが全て終了した時点(肯定判定となった時点)でPOST処理を終了する(ステップS109)と共に、コア手段101におけるウォッチドッグ監視処理を終了する(ステップS110)。
100 マルチコアCPU
101、102 コア手段
103 BIOS部
104、304 マザーボード機能装置
301 ウォッチドッグ監視デバイス
Claims (7)
- コンピュータ内に予め設けられたハードウェア装置に接続されると共に複数のコア処理手段を有するマルチコアCPUと、当該マルチコアCPUに対して前記ハードウェア装置の動作制御を指示するBIOS部とを備えた監視制御システムであって、
前記マルチコアCPUの一のコア処理手段が、前記ハードウェア装置の起動動作時に当該ハードウェア装置の動作テストを行う初期動作診断機能を有し、前記マルチコアCPUの他のコア処理手段が、前記動作テストごとに前記ハードウェア装置における動作エラーを検知する機能と、前記動作エラーが検知された場合に当該動作エラーに対するエラー処理を行う機能とを備えたことを特徴とする監視制御システム。 - 前記請求項1に記載の監視制御システムにおいて、
前記BIOS部は、前記初期動作診断機能の実行内容を示す診断指示情報と、前記検知された動作エラーに対応するエラー処理内容を示すエラー処理指示情報とを記憶する指示情報記憶手段を有することを特徴とした監視制御システム。 - 前記請求項2に記載の監視制御システムにおいて、
前記一のコア処理手段は、前記動作テストそれぞれに対応して経過時間をカウントするカウントタイマ手段を備えると共に前記動作テストごとにカウントタイマ手段を初期化するタイマ初期化機能を有し、
前記他のコア手段は、前記カウントタイマの値が初期化されずに予め設定された値に達した場合に前記ハードウェア装置に動作エラーが生じたと判定する動作エラー判定機能を有することを特徴とする監視制御システム。 - 前記請求項3に記載の監視制御システムにおいて、
前記他のコア処理手段は、前記動作エラーが検知された場合に前記BIOS部からの指示に基づき前記ハードウェア装置に当該動作エラーが生じたことを通知する、前記動作エラーの内容を記憶する、又は前記動作エラーの生じたハードウェア装置をリセットするかの何れかの処理を行うことを特徴とする監視制御システム。 - 前記請求項1乃至4の何れか一つに記載の監視制御システムにおいて、
前記一のコア処理手段が、前記各動作テスト内で前記カウントタイマ手段を初期化するポイントを複数設定する初期化ポイント設定機能を有し、
前記他のコア処理手段が、前記設定されたポイント毎に前記ハードウェア装置における動作エラーの有無をチェックする動作エラー複数チェック機能を備えたことを特徴とする監視制御システム。 - コンピュータ内に予め設けられたハードウェア装置に接続され複数のコア処理手段を有するマルチコアCPUと、当該マルチコアCPUに前記ハードウェア装置の動作制御を指示するBIOS部とを備えた監視制御システムであって、前記ハードウェア装置に生じた動作エラーを処理する監視制御方法であって、
一のコア処理手段は、前記BIOS部からの指示に基づいて前記ハードウェア装置の動作を監視する監視処理工程と、他のコア処理手段が、前記ハードウェア装置の初期動作診断処理を行うと共に当該初期動作診断に対応してタイマーカウントを行う初期動作診断開始工程と、他のコア処理手段が、前記タイマーカウントのクリア処理を行うタイマークリア工程と、一のコア処理手段が、前記クリア処理されたタイマーカウントの値に基づいて動作エラーの有無を判定する誤動作判定工程と、動作エラーの発生が検知された場合に、一のコア処理手段が、前記動作エラーに応じたエラー処理を行う誤動作処理工程とを備えたことを特徴とする監視制御方法。 - コンピュータ内に予め設けられたハードウェア装置に接続され複数のコア処理手段を有するマルチコアCPUと、当該マルチコアCPUに前記ハードウェア装置の動作制御を指示するBIOS部とを備えた監視制御システムであって、前記ハードウェア装置に生じた動作エラーを処理するための監視制御プログラムであって、
前記ハードウェア装置の初期動作診断処理を行うと共に当該初期動作診断に対応してタイマーカウントを行う初期動作診断開始機能、前記タイマーカウントのクリア処理を行うタイマークリア機能、を前記マルチコアCPUの一のコア処理手段に実行させると共に、
前記ハードウェア装置の動作を監視する監視処理機能、前記クリア処理されたタイマーカウントの値に基づいて動作エラーの有無を判定する誤動作判定機能、動作エラーの発生が検知された場合に、前記動作エラーに応じたエラー処理を行う誤動作処理機能、を前記マルチコアCPUの他のコア処理手段に実行させることを特徴とする監視制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007279424A JP2009110110A (ja) | 2007-10-26 | 2007-10-26 | 監視制御システム、監視制御方法、および監視制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007279424A JP2009110110A (ja) | 2007-10-26 | 2007-10-26 | 監視制御システム、監視制御方法、および監視制御プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009110110A true JP2009110110A (ja) | 2009-05-21 |
Family
ID=40778567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007279424A Pending JP2009110110A (ja) | 2007-10-26 | 2007-10-26 | 監視制御システム、監視制御方法、および監視制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009110110A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012113616A (ja) * | 2010-11-26 | 2012-06-14 | Nec Infrontia Corp | エラーコード出力装置及びエラーコード出力方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000122894A (ja) * | 1998-10-20 | 2000-04-28 | Fujitsu Ltd | 情報処理装置におけるエラー対処方法,情報処理装置,制御装置およびプログラムを格納したコンピュータ読取可能な記録媒体 |
JP2004302731A (ja) * | 2003-03-31 | 2004-10-28 | Toshiba Corp | 情報処理装置および障害診断方法 |
-
2007
- 2007-10-26 JP JP2007279424A patent/JP2009110110A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000122894A (ja) * | 1998-10-20 | 2000-04-28 | Fujitsu Ltd | 情報処理装置におけるエラー対処方法,情報処理装置,制御装置およびプログラムを格納したコンピュータ読取可能な記録媒体 |
JP2004302731A (ja) * | 2003-03-31 | 2004-10-28 | Toshiba Corp | 情報処理装置および障害診断方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012113616A (ja) * | 2010-11-26 | 2012-06-14 | Nec Infrontia Corp | エラーコード出力装置及びエラーコード出力方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6587966B1 (en) | Operating system hang detection and correction | |
CN107122321B (zh) | 硬件修复方法、硬件修复系统以及计算机可读取存储装置 | |
US9747192B2 (en) | Automated operating system installation on multiple drives | |
US8381034B2 (en) | Method for testing server supporting intelligent platform management interface | |
CN104636221B (zh) | 一种计算机系统故障处理方法和装置 | |
US8726097B2 (en) | Debugging method and computer system using the same | |
CN107111595B (zh) | 用于检测早期引导错误的方法、设备及系统 | |
US9542304B1 (en) | Automated operating system installation | |
US8726088B2 (en) | Method for processing booting errors | |
TWI759719B (zh) | 快閃記憶體控制器及用於快閃記憶體控制器的方法 | |
JP4886558B2 (ja) | 情報処理装置 | |
US20050033952A1 (en) | Dynamic scheduling of diagnostic tests to be performed during a system boot process | |
JP5529686B2 (ja) | コンピュータ装置の異常検査方法及びそれを用いたコンピュータ装置 | |
US20140143601A1 (en) | Debug device and debug method | |
JP2004302731A (ja) | 情報処理装置および障害診断方法 | |
KR20090037223A (ko) | 시스템 종료 후 자기진단 수행시스템 및 방법, 그리고 그를이용한 부팅방법 | |
TWI497279B (zh) | 除錯裝置及除錯方法 | |
JP2009110110A (ja) | 監視制御システム、監視制御方法、および監視制御プログラム | |
JP2009223714A (ja) | 演算回路及び演算回路の異常解析方法 | |
JP2017041109A (ja) | 管理装置,コンピュータおよび管理プログラム | |
CN106484438B (zh) | 计算机开机方法和系统 | |
JP4479002B2 (ja) | Cpuの省電力機能を有する機器のデバッグシステム及び方法 | |
KR20100046509A (ko) | 컴퓨터시스템 강제종료 장치 및 방법 | |
WO2014112039A1 (ja) | 情報処理装置、情報処理装置制御方法及び情報処理装置制御プログラム | |
TWI426379B (zh) | 電腦系統錯誤偵測系統及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091222 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100525 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101005 |