JP3206450B2 - Cpuボードのハードウェアモニタシステム - Google Patents

Cpuボードのハードウェアモニタシステム

Info

Publication number
JP3206450B2
JP3206450B2 JP25213696A JP25213696A JP3206450B2 JP 3206450 B2 JP3206450 B2 JP 3206450B2 JP 25213696 A JP25213696 A JP 25213696A JP 25213696 A JP25213696 A JP 25213696A JP 3206450 B2 JP3206450 B2 JP 3206450B2
Authority
JP
Japan
Prior art keywords
program
hardware
snmp
cpu board
cpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25213696A
Other languages
English (en)
Other versions
JPH1097443A (ja
Inventor
英樹 奥山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP25213696A priority Critical patent/JP3206450B2/ja
Publication of JPH1097443A publication Critical patent/JPH1097443A/ja
Application granted granted Critical
Publication of JP3206450B2 publication Critical patent/JP3206450B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はCPUボードのハー
ドウェアモニタシステムに関し、特にCPUボードに搭
載された各種ハードウェアデバイスユニットの動作状態
をモニタするCPUボードのハードウェアモニタシステ
ムに関する。
【0002】
【従来の技術】従来のこの種のCPUボードのハードウ
ェア動作情報モニタ方式の例としては、例えば、実開昭
56−045952号公報に示されている様に、各CP
Uボート上に自己診断プログラムを格納したローカルメ
モリと、自己診断プログラムを実行する切換え手段と、
自己診断結果を格納し表示する表示素子とを設けること
により、故障の診断を各CPUボート単体で行う様にな
っており、故障箇所を容易に発見する目的で使用される
ものである。
【0003】図4は従来のCPUボードのハードウェア
動作情報モニタ方式の一例を示すブロック図である。C
PUボード301,302、共通メモリ303及び共通
バス制御部304から構成され、これらの各々がバスラ
インSによって互いに接続されている。この場合、共通
メモリ303はCPUボード301,302により夫々
アクセスされるメモリであり、また共通バス制御部30
4はバスラインSを制御する。すなわち、CPUボード
301,302のいづれがバスラインSを占有するか等
を制御するものてある。そして、CPUボード301,
302が共に図5に示す様に構成されている。
【0004】図5は図4におけるCPUボード301も
しくは302の構成を示すブロック図である。CPU4
01は通常の演算、制御機能を有する処理装置であり、
このCPU401にバスラインTを介してローカルメモ
リ402、ゲート回路403、ラッチ404が夫々接続
され、またゲート回路403には診断スイッチ405
(切換手段)が、ラッチ404には発光ダイオード40
6〜409(表示素子)が夫々接続されている。
【0005】ローカルメモリ402はCPU401が占
有出来るメモリであり、またこのローカルメモリ402
には予めこのCPUボードの故障を診断するための自己
診断プログラムが記憶されている。ゲート回路403は
診断スイッチ405からの信号を開閉するためのもので
あり、また診断スイッチ405はこのCPUボードの故
障を自己診断する際に“オン”とされるものである。ラ
ッチ404は、この自己診断の際にCPU401から供
給される診断結果が一時記憶されるものであり、このラ
ッチ404の出力によって発光ダイオード406〜40
9が点灯されるようになっている。
【0006】次に動作を説明する。診断スイッチ405
を“オン”にすると、この“オン”信号はゲート回路4
03を介してCPU401に供給され、これによりCP
U401が当該CPUボードの自己診断を開始する。す
なわち、ローカルメモリ402に蓄えられている自己診
断プログラムが順次CPU401に読み出され、この読
み出された自己診断プログラムに従ってCPU401が
このCPUボードの故障の有無を診断し、診断結果をラ
ッチ404に出力する。そして、このラッチ404の出
力に従って発光ダイオード406〜409が点灯され、
これによりCPUボードの故障状態あるいは故障個所を
判断することができる。
【0007】次に、この種のCPUボードのハードウェ
ア動作情報モニタ方式の他の例として、例えば、特開平
04−156622号公報に示されるように、予め定め
られたオペレーティングシステム(OS)に基づいて処
理動作を実行する処理装置に備えられており、処理装置
にて予め定められた操作が行われると、OSとは独立し
て動作し、処理装置のハードウェアの状態を診断し、エ
ラー発生時の処理装置のハードウェアの状態を変更させ
ることなくハードウェアの状態を知り、エラー発生の原
因追求、さらに処理装置の早期回復するようになってい
る。
【0008】図6はこのCPUボードのハードウェア動
作情報モニタ方式の一例を示すブロック図である。処理
装置502は、ダイアログプロセッサ(DGP)501
とシステムバス503と、複数のCPU504、505
と中央記憶装置(CMU)506と、キーボードインタ
フェース507と、周辺装置インタフェース508とを
含んで構成される。
【0009】DGP501はシステムバスインタフェー
ス509と、CPU510と、ROM511と、RAM
512と、シリアルインプットアウトプット(SIO)
513とを含み、システムバスインタフェース509に
よってシステムバス503との間でデータの授受が行わ
れる。
【0010】システムバスインタフェース509と、C
PU510と、ROM511と、RAM512と、SI
O513とは、データバス514によって接続されてお
り、相互にデータの送受信が可能であり、ROM511
には処理装置502のハードウェアの状態を診断するた
めの診断プログラムが記憶されている。
【0011】SIO513にはキーボ−ド515が接続
されており、通常は処理装置502のOS用端末として
使用される。
【0012】キーボード515から予め定めるキーワー
ドなどが入力されると、CPU510はROM511か
ら診断プログラムを読み出して起動し、これによってD
GP501はハードウェア診断用端末となる。
【0013】システムバス503には、キーボードイン
タフエース507を介して複数のキ一ボードK1〜Kn
が接続され、オペレータがキーボード515、K1〜K
nを操作することにより、CPU504、505による
各種の演算処理、あるいは後述する複数の周辺装置の制
御を実行する。
【0014】CPU504,505はシステムバス50
3に接続されており、またローカルバス518,519
を介してCMU506にも接続されてている。CPU5
04はシステムバスインタフエース520と、ローカル
バスインタフェース521と、マイクロプロセッサユニ
ット(MPU)522と、キャッシュメモリ523と、
メインメモリ524とを含んて構成される。
【0015】CMU506はローカルバスインタフエー
ス525と共有メモリ526とを含んで構成される。ロ
ーカルバスインタフエース525はローカルバス51
8,519,共有メモリ526の間でデータの人出力制
御を行う。
【0016】周辺装置インタフェース508は、システ
ムバスインタフェース527と、プリンタインタフェー
ス528と、フロッピィディスクインタフェース528
と、SCSIインタフェース530と、SIOインタフ
エース531とを含んで構成される。
【0017】次に動作を説明する。図7は処理装置50
2の動作を示すフローチャ−トである。ステップ601
では、例えば電源を投入することによって処理装置50
2の立ち上げ処理が実行される。ステップ602では、
処理装置502に予め設定されているOSが実行され、
ステップ603ではこのOSの下で動作するアプリケー
ションの実行が行われる。ステップ604では、エラー
が発生したかどうかが判断される。
【0018】エラーが発生しない場合はステップ603
に戻り、引き続きアプリケーションの実行が行われる。
エラーが発生した場合はステップ605に進む。ステッ
プ605では、前述した様にキーボード515から予め
定めるキーワードを入力して、DGP501に予め設定
されている診断プログラムを起動させることによって、
DGP501は、ハードウェア自己診断用端末となる。
その後、ハードウェア診断用端末であるDGP501を
用いて処理装置502の各種ハードウェアの状態を診断
する。
【0019】この診断用端末(DGP)501を操作す
ることによって、CPU504、505内のメモリおよ
びCMU506内のメモリの各記憶内容、プリンタ53
2、フロッピィディスク533、磁気テープ534等の
周辺装置の状態、CPU504,505やキーボードイ
ンタフェース507、周辺装置インタフェース508等
がそれぞれ配置された複数の基板上のスイッチの設定状
態、これ等各基板の状態などを診断することができる。
【0020】また、DGP501はOS用端末としても
動作するので、エラー発生時にOSの下で動作するハー
ドウェア診断用プログラムを作成しておいて実行させる
こともできる。従って、診断処理プログラムの実行のた
めに、OS用の他の端末であるキーボードK1〜Knを
使用する必要がなく、処理装置2の他のオペレータの操
作を邪魔することなく処理装置502の診断を行うこと
ができる。
【0021】
【発明が解決しようとする課題】第一の問題点は、出荷
前のCPUボード単休において、ハードウェア動作に起
因する障害や故障が発生した場合、CPUボードに予め
大がかりなハードウェア的作り込みを行っておかない
と、障害や原因解析に多大な手間と時間を要することに
なるが、あるまとまった処理を行う装置/システムの場
合と異なり、CPUボード単体1つ1つに大がかりなハ
ードウェア的作り込みを行うことは非現実的であること
である。
【0022】その理由は、CPUボードのコストが著し
くアップしてしまう点と、回路の複雑さが増してしまう
点にある。ハードウェア情報をモニタするために、前述
した実開昭56−045952号公報の様な方法を採用
した場合、CPUボード1つ1つに、ゲート回路やラッ
チや表示素子を追加実装しなければならないし、また特
開平4−156622号公報の場合は、本来のCPUと
は別にさらに診断用プロセッサ、つまりCPUとその周
辺一式を追加実装せねばならず、この方法の場合、結果
として、CPUボード単体のための追加コストとしては
無視できないコスト高となるからである。
【0023】第二の問題点は、ハードウェア情報のモニ
タの方法が、ネットワークを介し遠隔(異なるフロアか
ら/異なるビルから/異なる地域から)のモニタ機能が
提供できず(もしくは提供しにくく)、かつモニタ装置
を個々の装置/CPUボード毎に専用のものを複数用意
しなければならないことである。
【0024】その理由は、ハードウェア情報のモニタの
方法が、実開昭56−045952号公報の例では、C
PUボード上の表示素子(LED)を、その場にいるオ
ペレータ(人)が目視することに依らねばならないし、
特開平4−156622号公報の場合も、モニタ対象の
装置のシステムバスに直結した専用のモニタ装置として
DGPを用意しており、これでは、ネットワークを介し
遠隔からモニタする機能は実現不可能であるからであ
る。
【0025】また、モニタ側を複数用意しなければなら
ないのは、各CPUボードが複数のベンダにより提供さ
れているものを使用する、といったよくある構成をとっ
た場合に、個々のCPUボード毎にローカル/専用のモ
ニタ方法を用意しなければならなくなるからである。
【0026】本発明の目的は、出荷時のCPUボード単
体、またはCPUボードが一端出荷されてOSやアプリ
ケーションプログラムが実装されたり、他のボードと共
に実装されている、いずれの場合にも、予め専用の大が
かりなハードウェアを作り込むことを必要とせずに、各
CPUボードのハードウェア動作に起因する障害の原因
解析のための簡易でいつも使用でき、またネットワーク
等を介して遠隔からでもモニタすることが可能なCPU
ボードのハードウェアモニタシステムを提供することで
ある。
【0027】
【課題を解決するための手段】本発明によれば、プロセ
ッシングユニットと、このプロセッシングユニットから
ランダムアクセス自在なランダムアクセスメモリユニッ
トと、前記プロセッシングユニットの制御により動作す
る各種ハードウェアデバイスユニットと、これ等各ユニ
ットの動作制御をなすためのOS及びアプリケーション
プログラムを格納するためのリードオンリメモリユニッ
トと、通信網とのインタフェースをなすインタフェース
ユニットと、これ等各ユニットを相互接続する内部バス
とを含むCPUボードのハードウェアモニタシテムであ
って、前記リードオンリメモリユニットにおける前記プ
ログラムの格納領域とは異なる領域に内蔵され前記通信
網の網管理のためのネットワーク管理プロトコルである
SNMP(Simple NetworkManagement Protocol)プロ
グラムと、前記SNMPプログラムを使用するモード/
使用しないモードを設定するためのモード切換部とを含
み、電源オンやハードウェアリセットに応答して前記モ
ード切換部を参照して前記使用するモードが設定されて
いるときに、前記OS及びアプリケーションプログラム
が非実装の場合には前記SNMPプログラムを起動せし
め、前記OS及びアプリケーションプログラムが実装の
場合には前記OS及びアプリケーションプログラムと共
に前記SNMPプログラムをも起動せしめて、前記各種
ハードウェアデバイスユニットの動作情報をモニタ可能
としたことを特徴とするCPUボードのハードウェアモ
ニタシステムが得られる。
【0028】そして、前記外部指令に応答して前記SN
MPプログラムを起動せしめるための起動プログラムが
前記リードオンリメモリユニットに内蔵されていること
を特徴とする また、前記CPUボードのモニタをなす外部モニタ装置
を含み、この外部モニタ装置の指令に従って前記通信網
を介して前記SNMPプログラムの起動を行って前記ハ
ードウェアの動作情報のモニタ及びテストを実行制御す
るようにしたことを特徴とする。
【0029】
【0030】すなわち、本発明では、CPUボートにO
Sやアプリケーションプログラムの格納/実行環境とな
るROM/RAMのエリアとは異なるエリアに、SNM
Pエージェントプログラムを格納/実行可能な様に内蔵
しておくと共に、このSNMPエージェントプログラム
を起動制御するためのブートプログラムをも内蔵してお
く。
【0031】従って、OSやアプリケーションプログラ
ムが未実装の出荷状態にあるCPUボード単体の評価や
障害解析に必要となる各種ハードウェア情報を、予め専
用の大規模なハードウェアを作り込むことなしに、CP
Uボードの構成の簡略化と保守性の向上とを同時に実現
するものである。
【0032】また、CPUボード上のSNMPエージェ
ントプログラムとネットワークを介して遠隔から通信し
て、CPUボード上の各種ハードウェア動作情報外部か
らモニタするためのSNMPマネージャプログラムを実
装した外部モニタ装置を設ける様にする。
【0033】こうすることで、CPUボードのハードウ
ェア動作情報をこの外部モニタ装置で簡易にいつでも使
用でき、ネットワークを介して、必要なら遠隔(異なる
フロアから/異なるビルから/異なる地域から)でも共
通的な方法でモニタすることが可能である。特に、業界
標準のSNMPというインタフェースを使用しているた
め、SNMPマネージャプログラムは標準に準拠してい
る限りどのベンダ(メーカー)のどの製品を使用しても
良く、また外部モニタ装置の機種もSNMPマネージャ
プログラムが動作するものであれば何を使用してもかま
わない。
【0034】また、1つのSNMPマネージャプログラ
ムが本発明の複数のCPUボードを同時にモニタするこ
とも可能であり、また逆に、所在の異なる複数の外部モ
ニタ装置により、同一のCPUボードのハードウェア情
報を同時期にモニタすることも可能である。
【0035】また、前記SNMPエージェントプログラ
ムは、SNMPマネージャプログラムからのネットワー
クを介した遠隔からの指令により、CPUボードのCP
Uレジスタ値や各種ハードウェア構成要素の固有情報/
動作情報(バージョン番号/シリアル番号/動作ステー
タス等)をリード/ライトする機能や、各種ハードウェ
ア構成要素の正常動作を適宜確認するテストプログラム
を実行すると共にその実行結果を報告する機能、さらに
CPUボードの障害発生時に自発的にアラーム通知を行
う機能を実現する。
【0036】このため、原因解析に必要となるハードウ
ェア固有の情報や動作情報のモニタ情報を事後に受動的
に外部モニタヘ返答するだけでなく、致命的な障害や故
障の発生前に解析が開始できるようになる。
【0037】また、SNMPエージェントプログラム
は、CPUボード出荷後におけるOSやアプリケーショ
ンプログラム実装後も、そのアプリケーションプログラ
ムがOS上て動作するのと並行して動作すること(オン
ラインモード)も可能な形態(タスク)で動作すること
も可能である。
【0038】このため、CPUボード出荷後で、OSや
アプリケーションプログラムが実装されている状態にお
いても、OSやアプリケーションプログラムのある特定
の動作時にのみ発生した障害や故障が、CPUボードの
ハードウェア動作に起因するかどうかの判定を、OSや
アプリケーションプログラムの動作を止めることなく簡
易でいつでも使え、ネットワークを介し、必要なら遠隔
からでも共通的な方法でモニタする方法も提供する、保
守性の高いモニタ環境を提供することができる。
【0039】また、オンラインモードでのSNMPエー
ジエントプログラムの利用の際、オフラインモードでの
SNMPエージェントプログラムの実行モードを無効化
するために、CPUボードの電源オンまたはハードウェ
アリセット前に選択したモードを設定する先となるモー
ド切換部を持つようにする。
【0040】これにより、CPUボードに格納したオフ
ラインモード用のSNMPエージェントプログラムをオ
ンラインモードでも利用でき、SNMPエージエントプ
ログラムをオフラインモード用とオンラインモード用と
二重に用意する必要がなく、かつ容易に使い分けること
が可能となる。
【0041】また、CPUボードが電源オフされたりハ
ードウェアリセットされると消滅してしまうハードウェ
ア動作情報の一時待避格納先となる不揮発性メモリ、例
えばSRAMを使用することにより、特に、開発中/出
荷前でまだ動作が不安定なCPUボードがストールして
しまい、CPUボードの電源オンやハードウェア・リセ
ットから再開しなければならない場合でも、再開立ち上
げしたSNMPエージェントプログラムにて、ストール
時のハードウェア動作情報をモニタできる。
【0042】
【発明の実施の形態】次に、本発明の実施の形態の構成
について図面を参照して詳細に説明する。
【0043】図1は本発明の実施例のブロック図であ
る。図1を参照すると、本発明の実施例の構成は、CP
U101と、ROM102と、RAM106と、イーサ
ネットインタフェース部110と、その他のハードウェ
ア構成要素109のI/O部108と、これ等各部とC
PUとを接続するCPUボード内部バス115とで構成
されるCPUボード100を有する。
【0044】また、OS104やアプリケーションプロ
グラム105の格納/実行環境となるエリアとは異なる
ROM102/RAM106のエリアに格納/実行でき
るように内蔵したSNMPエージエントプログラム(オ
フラインモード)103と、その起動を制御するブート
プログラム116とを含んで構成される。
【0045】また、CPUボード100上のSNMPエ
ージェントプログラム103がイーサネットインタフェ
ース部110を介してイーサネット112で(遠隔から
でも)通信でき、(複数の)CPUボード100上の各
種ハードウェア情報を外部からモニタするためのSNM
Pマネージャプログラム114を実装した外部モニタ装
置113が設けられている。
【0046】また、SNMPエージェントプログラム1
03は、CPUボード100が出荷前の段階において、
SNMPマネージャプログラム114からのイーサネッ
ト112、イーサネットインタフェース部110を介し
た(遠隔からの)指令により、CPU101のCPUレ
ジスタ値や各種ハードウェア構成要素109の固有情報
/動作情報(バージョン番号/シリアル番号/動作ステ
ータス等)を逐次任意にリード/ライトしたり、各種ハ
ードウェア構成要素109の正常動作を確認するテスト
プログラムを実行すると共にその実行結果を報告する機
能、さらにCPUボード100の障害や故障発生時に自
発的にアラーム通知を行う機能を実現する。
【0047】また、SNMPエージェントプログラム1
03は、CPUボード100出荷後におけるOS104
やアプリケーションプログラム105実装後も、そのア
プリケーションプログラム105がOS104上で動作
するのと並行して動作することが可能な形態(タスク)
で動作すること(オンライン・モード)も可能である。
【0048】また、オンラインモードでのSNMPエー
ジェントプログラム103の利用の際、オフラインモー
ドでのSNMPエージェントプログラム103の実行モ
ードを無効化するために、CPUボード100の電源オ
ンまたはハードウェアリセット前に選択したモードを設
定する先となるモード切換部111を持つ。
【0049】また、CPUボード100が電源オフされ
たりハードウェアリセットされると消滅してしまう一部
のハードウェア動作情報の一時待避格納先となる不揮発
性メモリ、例えばSRAM107を使用する。
【0050】次に、本発明の実施例の動作について図2
の動作フローに従い、図1の各構成要素を参照しつつ詳
細に説明する。
【0051】図2を参照すると、CPUボード100の
電源オンもしくはハードウェアリセットの前に、まずS
NMPエージェントトプログラム103を使用するモー
ド/使用しないモードを、CPUボード100の使用者
が事前に決定してモード切換部111に設定する(ステ
ップ201)。
【0052】次に、CPUボード100の電源オンもし
くはハードウェアリセットを実施する。その結果、ブー
トプログラム116がOS/アプリケーションプログラ
ムの有無を、メモリ上の所定の場所にプログラムが存在
しないことなどを判断材料として判定する。
【0053】ここで、OS/アプリケーションプログラ
ムが実装済みの場合の動作を説明する。まず。ハードウ
ェア初期化処理(ステップ204)が実行される。SN
MP使用判定(ステップ204)がその後モード切替部
111の設定値を参照して「SNMPを使用する」だっ
たらブート処理(ステップ208)を実行する。このブ
ート処理(208)は、OS104やアプリケーション
プログラム105だけでなく、SNMPエージェントプ
ログラム103もROMからRAMへと転送する。
【0054】次に、OS初期化/起動処理(ステップ2
10)を実施してプログラム起動を実施する。プログラ
ム起動は、RAMに転送されたアプリケーションプログ
ラム105だけでなく、SNMPエージェントプログラ
ム103もタスクとして起動する(オンラインブー
ト)。
【0055】その結果、SNMPエージェントプログラ
ム103は、CPUボード100出荷後、つまりROM
102にOSやアプリケーションプログラムが格納後に
もタスクとして稼働状態となり、イーサネットインタフ
ェース部108を介してイーサネット112を通して接
続された外部モニタ装置113上のSNMPマネージャ
プログラム114からの要求に従い、CPUボードの各
種ハードウェア動作情報を供給する。
【0056】一方、SNMP使用判定(ステップ20
6)が「SNMPを使用しない」だった場合は、OS1
04とアプリケーションプログラム105だけをブート
処理(ステップ211)し、OS初期化/起動処理(ス
テップ212)の後、アプリケーションプログラム10
5だけが起動される(通常のアプリモード)。
【0057】OS/アプリケーションプログラムが未実
装、つまりCPUボード単体の場合の動作を説明する。
先ず、ハードウェア初期化処理(ステップ205)が実
行される。SNMP使用判定(ステップ207)がその
後モード切替部111の設定値を参照して「SNMPを
使用する」だったら、ブート処理(ステップ214)を
実行する。
【0058】このブート処理(ステップ214)は、S
NMPエージェントプログラム103をROMからRA
Mへと転送する。次に、RAMに転送されたSNMPエ
ージェントプログラム103をプログラム起動(ステッ
プ215)する(オフラインモード)。
【0059】その結果、SNMPエージェントプログラ
ム103は、CPUボード100出荷前、つまりROM
102にOSやアプリケーションプログラムが格納前の
出荷前のCPUボード100単体後でも稼働状態とな
り、イーサネットインタフェース部108を介してイー
サネット112を通して接続された外部モニタ装置11
3上のSNMPマネージャプログラム114からの要求
に従い、CPUボードの各種ハードウェア動作情報を供
給する。
【0060】一方、SNMP使用判定(ステップ20
6)が「SNMPを使用しない」だった場合は何もしな
いで終了する。
【0061】次に、SNMPエージェントプログラム1
03の内部構造と内部動作を図3を使って詳細に説明す
る。尚、各種ハードウェア要素700は、図1のCPU
ボード100の各構成ユニット内におけるハードウェア
要素であり、これ等ハードウェア要素のうち、SNMP
により管理される対象となる、例えば、レジスタやフラ
グやバッファ等の記憶要素群が管理オブジェクト群71
3となるものとする。
【0062】SNMPエージェントプログラム103
は、受信したSNMPメッセージ(要求)701をSN
MPメッセージ受信部702が受信し、SNMPメッセ
ージ解析部703へBER(Basic Encord
ing Rule)で書かれたデータを渡す。
【0063】SNMPメッセージ解析部703はBER
の解析を行い、その結果を管理オブジェクト特定部70
4へと渡す。管理オブジェクト特定部704は、MIB
(Management Information B
ase)705に予め登録されている情報を参照し、各
種ハードウェア構成要素700内の管理オブジェクト群
713のどれにアクセスすれば、get/set(リー
ド/ライト)できるかを特定し、該当するget関数群
/set関数群(リード/ライトのためのサブルーチン
である)706のいずれかをコールする。
【0064】ここで、MIB705に登録されている情
報としては、オブジェクト識別子,オブジェクトタイ
プ,アクセス権,メソッド名(get関数/set関
数)があげられる。
【0065】オブジェクト識別子は、管理オブジェクト
群713の各オブジェクト(前述した如く、CPUボー
ド上の各ユニットを構成する各種ハードウェア要素のう
ち、管理対象となる要素であり、レジスタや、フラグ
や、バッファや、メモリ素子等であるが、実際にはこれ
等要素に保持された各情報を指称する)を夫々特定する
ための識別子である。
【0066】オブジェクトタイプは、これ等各オブジェ
クトの実態(インスタンス)、すなわち各オブジェクト
に保持されている内容が、数値(バージョン番号やシリ
アル番号等)であるか文字列(動作ステータス等)であ
るかを示す「データ型式」である。
【0067】アクセス権は、オブジェクト識別子により
特定された管理オブジェクトがget(リード)可能か
どうか、set(ライト)可能かどうかを登録したもの
である。
【0068】メッソド名(get関数/set関数)
は、管理オブジェクトに実際にアクセスするための手段
(サブルーチン)であり、オブジェクト識別子により特
定された管理オブジェクトをリードしたい時には、どの
手段を起動すれば良いかを登録したものである。
【0069】この手段は、一般的にソフトウェアプログ
ラムでは関数として提供されるものであり、従って「メ
ソッド」の実際は「get関数」,「set関数」のシ
ンボル名(関数へのポインタ)が登録されることにな
る。
【0070】SNMPエージェント103はSNMPマ
ネージャ114から要求メッセージを受けると、そのメ
ッセージからオブジェクト識別子を取出し、このオブジ
ェクト識別子をもってMIB705を検索する。
【0071】すなわち、管理オブジェクト特定部704
は、MIB705を参照して、要求された「オブジェク
ト識別子」がMIB705内に登録されているかどうか
判定し、登録されていれば、要求内容がMIB705に
登録されているオブジェクトタイプと一致しているかど
うかを判定する。一致していれば、要求されたアクセス
権がMIB705に登録されたものかどうかを調べ、そ
うであれば、MIB705の登録内容からメソッドを特
定してそのメソッドを起動すべく、get/set関数
群706をコールするのである。
【0072】上述の各判定処理で「否」となれば、その
旨の情報を有する応答のメッセージをSNMPマネージ
ャ114へ返送する。
【0073】こうしてコールされたget/set関数
群は対応する管理オブジェクトへのアクセスの結果をS
NMPメッセージ組立部707に渡す。その結果、SN
MPメッセージ組立部は再度BERに従いSNMPメッ
セージを組み立てSNMPメッセージ送信部708に渡
す。
【0074】最後に、SNMPメッセージ送信部708
は要求元のSNMPマネージャ114に対してSNMP
メッセージ(応答)709を送信する。
【0075】ここで、各種ハードウェア構成要素700
内の管理オブジェクト群713の値の内、CPUボード
100の電源オフや、ハードウェアリセットで失われて
欲しくない値や、管理オブジエクトとしては各種ハード
ウェア構成要素700内には存在していない値、例え
ば、特定のハードウェア動作の繰り返し数のカウント値
や動作履歴情報は、SRAM107に格納される。
【0076】従って、get関数群/set関数群70
6は必要に応じてSRAM107にもアクセスする。ま
た、get関数群/set関数群706の内、set関
数の幾つかは予めset関数内の1処理として組み込ま
れた各種ハードウェア構成要素700の正常動作確認の
ためのテストプログラムを実行し、その結果の報告をす
るようにすることも可能である。
【0077】また、管理オブジェクト監視部710は管
理オブジェクト群713や不揮発性メモリ107の値の
変化を監視し、もし特定の値、例えばアラームを示す値
の変化、もしくは、予め指定しておいたしきい値を越し
た場合に、その通知をSNMPメッセージ組立部707
へと送り、その結果SNMPメッセージ送信部708が
SNMPトラップ709を発行する。
【0078】この管理オブジェクト監視部710の監視
の例について、より詳述する。その一つとして、CPU
ボード上のフラッシュメモリの書込み回数のチェックを
行って上限(閾値)に達した時にはトラップを発行す
る。フラッシュメモリは電源バックアップなしにデータ
のリード/ライトが可能なメモリであるが、その書込み
回数には上限値(例えば、1万回)があるので、これを
監視対象とする。
【0079】第2の例として、CPUボード上のSRA
M等、電源バックアップが必要な素子の電源切れを監視
する。これ等のメモリはデータ保持のために電池を使用
するものであるから、この電池出力電圧を監視してある
閾値を下回るとトラップとしてSNMPマネージャへ通
知する。
【0080】第3の例として、回復不能な素子/部品に
障害が発生したことを監視する。CPUボード上の素子
や部品はI/Oを通じてソフトウェアによりその動作状
態(ステータス)を監視できるものであるから、このス
テータス監視によりNG若しくは単にアクセス応答が無
くなった場合に、トラップをSNMPマネージャへ通知
する。
【0081】第4の例として、冗長系の系切換時を監視
する。CPUボードやその部品などはN重化されている
場合があり、この時予め定められた障害の発生に従っ
て、自動的に系の切換えが行われる。その際、切換えら
れてスタンバイ状態になった方の系を修理する必要があ
るので、これをSNMPマネージャへトラップで通知す
る。
【0082】第5の例として、CPUの処理の負荷を監
視して増大した時にもアラームとしてトラップをSNM
Pマネージャへ通知する様にしても良い。
【0083】更に、第6の例としては、部品やカードの
動的な挿抜を監視する様にする。近時のCPUボードで
はハードディスク装置や通信カード等を動的に挿抜する
ことが一般的であり、その際、その挿抜の事実,その時
に障害が発生した場合はその事実等をSNMPマネージ
ャへ通知する。
【0084】尚、SNMPメッセージ組立部707にお
いて、SNMP応答メッセージかトラップかの区別は送
信電文のフォーマットにおける特定フィールドにその種
別を示す情報が存在することで行うことができる。
【0085】さらに、本発明の第2の実施例としては、
SNMPと同様、業界標準のCMIP(Common
Management Information Se
rvice)を利用することも考えられる。
【0086】また、モード切替部111のモード設定方
法は、CPUボード100上のハードウェア的なしか
け、例えばディップスイッチ等だけではなく、外部モニ
タ装置113からの信号を受信し、その信号を持ってモ
ードを切替える様にしてもよい。
【0087】また、不揮発性メモリ107としては、S
RAMだけではなく、フラッシュEPROM(フラッシ
ュイレーサブルプログラマブルROM)であってもよ
い。
【0088】また、SNMPエージェントプログラム1
03は、通常タスクとして実装される。従って、SNM
Pエージェントプログラム103の動作には、OSやU
DP(Usr Datagram Protocol)
通信レイヤのプロトコルが必要になる。
【0089】従って、オフラインモードで動作させる場
合SNMPエージェントプログラム103としては、S
NMPエージェントプログラム本体部と、SNMPエー
ジェントプロトコル動作専用の最小資源をアサインした
OSとUDP通信プロトコルの計3つで構成され、CP
Uボードベンダ側にて動作を保証した上でこれらを1セ
ットとしてSNMPエージェント機能を実現する。従っ
て、オンラインモードのSNMPエージェントプログラ
ムは、実際には、このSNMPエージェントプログラム
本体=タスク構成部分のみを本来のOSから起動するこ
とになる。
【0090】しかし、オフラインモードのSNMPエー
ジェントプログラムとオンラインモードのSNMPエー
ジェントプログラムは別々に各々重複して実装してもか
まわない。
【0091】また、本発明では、ブートプログラム11
6がOSやアプリケーションプログラムの実装の有無
を、メモリ上の所定の場所にOSやアプリケーションプ
ログラムが存在しないことなどを判断材料として判定す
るとしているが、これも「SNMPを使用する/SNM
Pを使用しない」のモード指定と同様、オペレータが別
途モード指定するようにしてもかまわない。
【0092】
【発明の効果】第1の効果は、OSやアプリケーション
プログラムが未実装なCPUボード出荷前状態にあるC
PUボード単体の評価や障害解析時に必要となる各種ハ
ードウェア情報を、予め専用の大がかりなハードウェア
を作り込むことを必要とせずに、各CPUボードのハー
ドウェア動作に起因する障害や故障の原因解析のための
簡易でいつでも使え、ネットワークを介し、必要なら遠
隔からでも共通的な方法でモニタする方法を提供し、C
PUボードの構成簡略化と保守性の向上を実現すること
ができることである。
【0093】その理由は、CPUと、ROMと、RAM
と、イーサネットインタフェース部と、その他のハード
ウェア構成要素のI/O部と、前記各部とCPUとを接
続するCPUボード内部バスで構成されるCPUボード
において、OSやアプリケーションプログラムの格納/
実行環境となるエリアとは異なるROM/RAMのエリ
アに格納/実行できるように格納したSNMPエージェ
ントプログラム(オフラインモード)とその起動を制御
するブートプログラムを実装し、イーサネットインタフ
ェース部を介してOSやアプリケーションプログラムが
未実装な出荷前状態にあるCPUボードにおいてもSN
MPエージェントプログラムを実行できるからである。
【0094】第2の効果は、CPUボードのハードウェ
ア動作情報を外部モニタ装置で簡易にいつでも使え、ネ
ットワークを介し、必要なら遠隔(異なるフロアから/
異なるビルから/異なる地域から)でも共通的な方法で
モニタすることができることである。特に、業界標準の
SNMPというインタフェースを使用しているため、S
NMPマネージャプログラムは標準に準拠している限り
どのベンダ(メーカー)のどの製品を使用しても良く、
また外部モニタ装置の機種も前記SNMPマネージャプ
ログラムが動作するものであれば何を使用してもかまわ
ない。
【0095】また、1つのSNMPマネージャプログラ
ムが本発明の複数のCPUボードを同時にモニタするこ
とも可能であり、また逆に、所在の異なる複数の外部モ
ニタ装置により、同一のCPUボードのハードウェア情
報を同時期にモニタすることも可能である。
【0096】また、CPUボード上の各種ハードウェア
構成要素へのアクセス方法は、SNMPエージェントプ
ログラムの中に隠蔽できる。つまり、CPUボードのイ
ンテリジェンスをCPUボード提供者側が設計し提供で
きるようになる。その結果、SNMPマネージャプログ
ラム、そしてこのSNMPエージェントプログラムを利
用してハードウェア動作情報をモニタするオペレータ
は、難解なハードウェアアクセス方法を予め熟知してお
く必要がなくなる。また、業界標準のプロトコルの利用
によりモニタ対象の追加や修正が容易に実現できること
である。
【0097】その理由は、ひとえに、CPUボード上の
SNMPエージェントプログラムを用いているからであ
る。
【0098】第3の効果は、原因解析に必要となるハー
ドウェア固有の情報や動作情報のモニタを事前に受動的
に外部モニタ装置へ返答するだけでなく、致命的な障害
や故障の発生前に対策が打てるようになることである。
【0099】その理由は、SNMPエージェントプログ
ラムは、SNMPマネージャプログラムからのネットワ
ークを介した遠隔からの指令により、CPUボードのC
PUレジスタ値や各種ハードウェア構成要素の固有情報
/動作情報(バージョン番号/シリアル番号/動作ステ
ータス等)をリード/ライトする機能や、各種ハードウ
ェア構成要素の正常動作を適宜確認するテストプログラ
ムを実行すると共にその実行結果を報告する機能だけで
なく、さらにCPUボードの障害発生時に自発的にアラ
ーム通知を行う機能を実現できるからである。
【0100】第4の効果は、CPUボード出荷後で、O
Sやアプリケーションプログラムが実装されている状態
においても、OSやアプリケーションプログラムのある
特定の動作時にのみ発生した障害や故障が、CPUボー
ドのハードウェア動作に起因するかどうかの判定を、S
NMPエージェントプログラムをオフラインモード用と
オンラインモード用と二重に用意することなく、かつ容
易に使い分けることが可能な保守性の高いモニタ環境を
提供できることである。
【0101】その理由は、CPUボードに格納したオフ
ラインモード用のSNMPエージェントプログラムを、
オンラインモードでも利用できるようにするため、オン
ラインモードでのSNMPエージェントプログラムの利
用の際には、オフラインモードでのSNMPエージェン
トプログラムの実行モードを無効化を設定するモード切
換部と、モードを選択する機能を持つブートプログラム
を持っており、CPUボードの電源オンまたはハードウ
ェアリセット前にモードを容易にいつでも選択すること
が可能だからである。
【0102】第5の効果は、開発中/出荷前でまだ動作
が不安定なCPUボードがストールしてしまい、CPU
ボードの電源ONやハードウェアリセットから再開しな
ければならない場合でも、再開立ち上げ後のSNMPエ
ージェントプログラムにて、トール時のハードウェア動
作情報をモニタできることである。
【0103】その理由は、CPUボードが電源オフされ
たりハードウェアリセットされると消滅してしまうハー
ドウェア動作情報の格納先となる不揮発性メモリ、例え
ばSRAMを一時待避先として使用するからてある。
【図面の簡単な説明】
【図1】本発明のCPUボードのハードウェア情報モニ
タ方式の構成を示すブロック図である。
【図2】本発明のCPUボードのハードウェア情報モニ
タ方式の動作を示すフローチャートである。
【図3】本発明のCPUボードのハードウェア情報モニ
タ方式のSNMPエージェントプログラムの実施例の内
部構成を示す機能ブロック図である。
【図4】従来のCPUボードのハードウェア情報モニタ
方式の一例を示すブロック図である。
【図5】図3におけるCPUボード301もしくは30
2の内部構成を示すブロック図である。
【図6】従来のCPUボードのハードウェア動作情報モ
ニタ方式のもう一つの一例を示すブロック図である。
【図7】図5の処理装置502の動作を示すフローチャ
ートである。
【符号の説明】
100 CPUボード 101 CPU 102 ROM 103 SNMPエージェントプログラム 104 OS 105 アプリケーションプログラム 106 RAM 107 SRAM 108 I/O部 109 その他の各種ハードウェア構成要素(各種デバ
イス) 110 イーサネットインタフェース部 111 モード切換部 112 イーサネット 113 外部モニタ装置 114 SNMPマネージャプログラム
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 11/28 - 11/36 G06F 11/22 G06F 13/00 351

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 プロセッシングユニットと、このプロセ
    ッシングユニットからランダムアクセス自在なランダム
    アクセスメモリユニットと、前記プロセッシングユニッ
    トの制御により動作する各種ハードウェアデバイスユニ
    ットと、これ等各ユニットの動作制御をなすためのOS
    及びアプリケーションプログラムを格納するためのリー
    ドオンリメモリユニットと、通信網とのインタフェース
    をなすインタフェースユニットと、これ等各ユニットを
    相互接続する内部バスとを含むCPUボードのハードウ
    ェアモニタシテムであって、前記リードオンリメモリユ
    ニットにおける前記プログラムの格納領域とは異なる領
    域に内蔵され前記通信網の網管理のためのネットワーク
    管理プロトコルであるSNMP(Simple NetworkManage
    ment Protocol)プログラムと、前記SNMPプログラ
    ムを使用するモード/使用しないモードを設定するため
    のモード切換部とを含み、電源オンやハードウェアリセ
    ットに応答して前記モード切換部を参照して前記使用す
    るモードが設定されているときに、前記OS及びアプリ
    ケーションプログラムが非実装の場合には前記SNMP
    プログラムを起動せしめ、前記OS及びアプリケーショ
    ンプログラムが実装の場合には前記OS及びアプリケー
    ションプログラムと共に前記SNMPプログラムをも
    動せしめて、前記各種ハードウェアデバイスユニットの
    動作情報をモニタ可能としたことを特徴とするCPUボ
    ードのハードウェアモニタシステム。
  2. 【請求項2】 前記SNMPプログラムを起動せしめる
    ための起動プログラムが前記リードオンリメモリユニッ
    トに内蔵されていることを特徴とする請求項1記載のC
    PUボードのハードウェアモニタシステム。
  3. 【請求項3】 前記CPUボードのモニタをなす外部モ
    ニタ装置を含み、この外部モニタ装置の指令に従って前
    記通信網を介して前記SNMPプログラムの起動を行っ
    て前記ハードウェアの動作情報のモニタ及びテストを実
    行制御するようにしたことを特徴とする請求項1または
    2記載のCPUボードのハードウェアモニタシステム。
JP25213696A 1996-09-25 1996-09-25 Cpuボードのハードウェアモニタシステム Expired - Fee Related JP3206450B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25213696A JP3206450B2 (ja) 1996-09-25 1996-09-25 Cpuボードのハードウェアモニタシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25213696A JP3206450B2 (ja) 1996-09-25 1996-09-25 Cpuボードのハードウェアモニタシステム

Publications (2)

Publication Number Publication Date
JPH1097443A JPH1097443A (ja) 1998-04-14
JP3206450B2 true JP3206450B2 (ja) 2001-09-10

Family

ID=17232987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25213696A Expired - Fee Related JP3206450B2 (ja) 1996-09-25 1996-09-25 Cpuボードのハードウェアモニタシステム

Country Status (1)

Country Link
JP (1) JP3206450B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI20011881A (fi) * 2001-09-25 2003-03-26 Nokia Corp Menetelmä tukiaseman hajautetun prosessoriarkkitehtuurin käynnistämiseksi ja tukiasema
JP6193834B2 (ja) * 2014-10-29 2017-09-06 ファナック株式会社 データ保存システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
情報処理学会論文誌、1993年6月、第34巻、第6号、p.1426−1440

Also Published As

Publication number Publication date
JPH1097443A (ja) 1998-04-14

Similar Documents

Publication Publication Date Title
EP1119806B1 (en) Configuring system units
US7428663B2 (en) Electronic device diagnostic methods and systems
US7293165B1 (en) BMC-hosted boot ROM interface
US7509375B2 (en) Management system for multimodule multiprocessor machines
US6640203B2 (en) Process monitoring in a computer system
JP2001516479A (ja) 機能するオペレーティング・システムなしにコンピュータのリモート管理を可能にするネットワーク機能拡張bios
JPH11504459A (ja) 遠隔診断修復用に適合された拡張bios
GB2342471A (en) Configuring system units
JP3206450B2 (ja) Cpuボードのハードウェアモニタシステム
JP4558376B2 (ja) コントローラ
Baitinger et al. System control structure of the IBM eServer z900
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees