JP2004030513A - Bus monitoring system and its program - Google Patents

Bus monitoring system and its program Download PDF

Info

Publication number
JP2004030513A
JP2004030513A JP2002189380A JP2002189380A JP2004030513A JP 2004030513 A JP2004030513 A JP 2004030513A JP 2002189380 A JP2002189380 A JP 2002189380A JP 2002189380 A JP2002189380 A JP 2002189380A JP 2004030513 A JP2004030513 A JP 2004030513A
Authority
JP
Japan
Prior art keywords
bus
monitoring
monitor
hardware
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002189380A
Other languages
Japanese (ja)
Inventor
Noboru Kinoshita
木下 登
Manabu Chikada
近田 学
Takahiko Shirakawa
白川 孝彦
Shinji Karasaki
唐崎 真二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Asahi Electronics Co Ltd
Original Assignee
Hitachi Ltd
Hitachi Asahi Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Asahi Electronics Co Ltd filed Critical Hitachi Ltd
Priority to JP2002189380A priority Critical patent/JP2004030513A/en
Publication of JP2004030513A publication Critical patent/JP2004030513A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To perform a fault analysis and fault processing on the basis of information acquired from a board for analysis without a monitoring CPU even when an abnormality that can not be processed by an OS itself occurs about bus monitoring and analysis for monitoring whether connection buses with various devices normally operate. <P>SOLUTION: A bus monitoring system is provided with a bus monitor 113 which is connected to a system bus (PCI bus) 115 of an information processor and has a bus monitoring and analyzing function of monitoring whether the connection buses (IDE 121 and SCSI bus 116) normally operate, a function 131 of making hardware resources separate and independent for a plurality of OSs by virtual hardware 132 having a function of allocating an interrupt from hardware and a processing time of a CPU, and a function 131 of making data writable and readable between the plurality of OSs, and executes a monitoring program 134 for monitoring and analyzing the buses on an OS independent of an OS that normally operates. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、情報処理装置の入出力バスモニタリングシステムおよびそのプログラムに関し、特にマルチOS環境の情報処理装置で、通常のOSとは別のOS上で動作する監視プログラムにより制御されるバスモニタを組込んだ情報処理装置およびプログラムに関する。
【0002】
【従来の技術】
従来のバスモニタ装置としては、例えば特開平7−319804号公報に示すSCSIバスモニタ装置及びバスモニタシステムがある。これは、バス受信部で取込まれたSCSI信号の遷移から記録すべき事象を検出するイベント検出手段と、この状態をトレースデータとして順次記録するトレースメモリとを設けて、記憶量が設定値を超えたとき、警報を出力するとともにバスに対してビジー信号を出力し、その間にトレースデータを外部へ転送するものである。すなわち、監視対象のバスライン(SCSIバス)に接続したアダプタを介してSCSIバスモニタ装置に信号を取り込み、モニタ装置内で処理したトレース情報をホスト収集装置(トレースメモリ)に送り、オペレータがホスト収集装置に含まれるキーボードの操作等により情報を解析していた。
【0003】
また、特開平10−222432号公報に示すSCSIバスモニタリングシステムでは、SCSIバス監視部がSCSIバスの監視を随時行い、バス情報解析部ではバスの信号情報をデータとして提供可能な形に変換する。バスモニタデーモンは、定期的にバスモニタに対してSCSIコマンドを発行することにより、SCSIバスの情報を取得して、システムにフィードバックさせる。すなわち、SCSIバスモニタにSCSI装置としての機能を組込み、ホストコンピュータから操作可能とし、SCSIバスモニタから取得したSCSIバス情報をもとに、SCSIバスの性能向上を図っている。
【0004】
【発明が解決しようとする課題】
しかしながら、これらの従来技術では、監視用の別のホスト収集装置が必要であったり、OS自身が検知できない異常でホストコンピュータのプログラムがハングアップした場合などは、SCSIバスモニタに採取された情報が利用できないという問題がある。
また、特開平10−222432号公報では、使用するOS毎にSCSIバスモニタを制御するプログラムを開発しなければならないという問題もある。
【0005】
本発明の目的は、このような従来の問題を解消し、監視用のCPUを必要とせず、通常のOSがハングアップやシステム停止してしまった場合などでも、バスモニタに採取された情報を利用できる安価で確実な障害解析および回復手段を備えたバスモニタリングシステムおよびそのプログラムを提供することにある。
【0006】
【課題を解決するための手段】
上記目的を達成するため、本発明のバスモニタリングシステムは、情報処理装置のシステムバス(PCIバス)に接続され、各種デバイスとの接続バス(IDE(Integrated Device Electronics)、SCSIバス)が正常に動作しているか否かを監視するためのバスのモニタリングおよび解析機能を有するバスモニタと、ハードウェアからの割り込みやCPUの処理時間を振り分ける機能を持つ仮想ハードウェアにより複数のOSに対しハードウェア資源を分離独立させる機能と、複数OS間でデータ書込みまたは読み出しを可能とする機能とを備えたマルチOS環境の情報処理装置において、通常のOSとは独立したOS上で動作する前記バスモニタを制御するためのモニタリングプログラムを実行させるようにしている。
これにより、通常のOS自身が処理できないような異常が発生した場合でも、監視用の別CPUが無くてもモニタリングプログラムからの情報により的確な障害解析および対策が可能となる。また、仮想ハードウェアを用いることにより、OSに依存しないでバスモニタを制御するための監視プログラムを開発することが可能となる。
【0007】
本発明のモニタ監視プログラムは、情報処理装置に対し、業務OS基本部の処理と、ハードウェア制御を行うハードウェアドライバ群の処理と、SCSIバスモニタを制御するためのSCSIバスモニタ管理APの処理と、ハードウェア内にロギングされる障害情報を編集出力するためのLOG制御APの処理と、IEDバスモニタを制御するIDEバスモニタ管理APの処理と、これらの各APによる編集結果をLAN経由でクライアントPC側からの制御で行うためのリモート制御APの処理とを、それぞれ実行させるためのプログラムである。
【0008】
【発明の実施の形態】
以下、本発明の実施形態を、図面により詳細に説明する。
図1は、本発明の一実施形態を示す監視対象バスをSCSIバスとしたバスモニタリングシステムの構成図である。
図1において、ソフトウェア130は、業務側プログラム133と監視側プログラム134の2つからなり、ハードウェア101は、業務側プログラム133と監視側プログラム134から仮想ハードウェア132としてそれぞれにアクセスされる。
複数OS制御プログラム131は、ハードウェア101からの割り込みやCPU108の処理時間を業務側プログラム133と監視側プログラム134に振り分ける機能があり、仮想ハードウェア132を各OSに対しハードウェアのように見せることで、業務側プログラム133から見えるハードウェア資源と監視側プログラム134から見えるハードウェア資源とを分離独立させている。
【0009】
また、複数OS制御プログラム131は、複数OS間でデータの書き込みまたは読み出しを可能とする機能も有する。これらの機能により、1つのハードウェア上で複数のOSが互いに独立して実行することを実現している。ここで実施しているような1つのハードウェアで複数のOSを独立に実行する技術は、特開平11−149385号公報に開示されている。これによれば、業務側プログラム133と監視側プログラム134を独立実行でき、業務側プログラム133が障害で停止した場合でも、監視側プログラム134は継続して動作できる。
【0010】
ハードウェア101は、CPU108、主メモリ109、SCSIA112、SCSIバスモニタ113、LANA114、各種デバイスを制御するためのSuperIO111、各バスを制御するシステムバスコントローラ120が、それぞれPCIバス115に接続されている。システムバスコントローラ120には、CRTA110が接続され、CRT107への表示制御を行う。また、システムバスコントローラ120は、IDEバス121の制御も行う。SuperIO111へは、キーボード105およびマウス106が接続される。
SCSIA112には、SCSIバス116を介してHDD(ハードディスク)102〜104が接続される。なおHDDの台数は、本実施例では3台としたが、この台数に限定されるものではない。このSCSIバス116の状態遷移をモニタリングできるように、SCSIバスモニタ113も接続されている。
また、LAN122を介して、複数台のクライアントPCが接続される。本実施例においては、クライアントPC117〜119の3台を接続した例を示している。
【0011】
図2は、図1における業務側プログラムの構成を示す図である。
業務側プログラム133は、図2に示すように、業務OS基本部201、ハードウェア制御を行うハードウェアドライバ群202、業務用の各種アプリケーションプログラムからなる業務AP203、CPU108やハードウェアドライバ群202から報告されたエラーのロギングや通知を行うシステム管理用アプリケーションであるシステム管理AP204、およびLAN122を介してクライアントPC117〜119との通信を行うリモート制御AP205で構成されている。
【0012】
図3は、図1における監視側プログラムの構成を示す図である。
監視側プログラム134は、図3に示すように、業務OS基本部301、ハードウェア制御を行うハードウェアドライバ群302、SCSIバスモニタ113を制御するためのSCSIバスモニタ管理AP303、ハードウェア101内にロギングされる障害情報を編集出力するためのLOG制御AP304、IDEバスモニタ901(図9参照)を制御するIDEバスモニタ管理AP306、および、これらの各APによる編集結果をLAN122経由でクライアントPC117〜119側からの制御で行うためのリモート制御AP305からなる。
なお、監視側プログラム134の操作はハードウェア101に接続されたキーボード105、マウス106およびCRT107を使用するか、あるいはLANA114に接続されたクライアントPCの操作による。
本実施例では、クライアントPC117を監視側プログラム134を操作する管理用PCとして記述する。
【0013】
図4は、図1におけるSCSIバスモニタ113の構成を示す図である。
SCSIバスの信号を受信するためのバスレシーバ401、受信したバスの信号をSCSIバスモニタ113の内部タイミングに同期させるためのバス信号ラッチ402、バスの状態遷移を記憶するためのトレースメモリ409、PCIバスとの転送制御を行うPCIバス制御部410、バスの状態遷移の発生時刻を示すためのタイムスタンプ発生部403、トレースメモリ409への書き込み停止条件を設定するためのトレース停止条件設定部404、トレース停止条件の検出およびバスの状態遷移を検出するイベント検出部405、トレースメモリ409のアクセスタイミングやアドレス更新タイミングを制御するモニタシーケンサ部406、トレースメモリ409のアドレスを管理するメモリアドレス制御部407、およびSCSIバスモニタ全体の制御を行うモニタ内部制御部408からなる。
【0014】
図5は、本発明の一実施例のシステム起動手順を示すフローチャートである。
図5により起動処理を説明する。
ハードウェア101に電源が投入(またはリブート)されると、業務側プログラム133が起動する(ステップ501)。業務側プログラム133は初期化処理を開始するが、複数OS制御プログラム131により初期化処理を中断し監視側プログラム134を起動する(ステップ502)。監視側プログラム134は、トレースメモリ409のクリア(ステップ503)、タイムスタンプ発生部403の初期設定(ステップ504)、トレース停止条件設定部404の初期設定(ステップ505)を行う。
この時設定されるトレース停止条件は、フリーラン状態(停止条件なし)である。
【0015】
次に、モニタシーケンサ部406を起動し、トレース動作を開始する(ステップ506)。その後、リモート制御AP305を入力待ちで起動し、クライアントPC117(管理用PC)からの操作待ちとする(ステップ507、ステップ508)。この状態で、複数OS制御プログラム131により業務側プログラム133に処理が移され、業務側プログラム133の起動処理が再開される(ステップ509)。次に、業務AP203が起動され、関連する各種情報の初期化が行われる(ステップ510)。その後、業務AP203による通常業務が開始される(ステップ511)。
【0016】
図6は、図1、図2におけるSCSIバス116に関する障害が、システム管理AP204よりクライアントPC117に通知された場合の処理手順を示すフローチャートである。
システム管理AP204がSCSIバス116に関する障害を、ハードウェアドライバ群202と業務OS基本部201の応答をモニタすることにより検出する(ステップ601)。システム管理AP204は、障害情報のロギングを行うとともにリモート制御AP205を介してクライアントPC117に障害通知する(ステップ602)。一般的には、システム管理者がクライアントPC117の情報から障害解析を行う(ステップ603)。この段階で障害要因を特定できれば、それに基づき適切な対策を実施する。システム管理AP204より通知された情報では要因が特定できない場合、システム管理者が、クライアントPC117よりSCSIバスモニタ管理AP303をアクセスし、SCSIバスモニタの動作モードを指定する(ステップ604)。
【0017】
ステップ604により動作パラメータを指定されたSCSIバスモニタ管理AP303は、まずモニタシーケンサ部406の停止指示を行う(ステップ605)。次に、トレース停止条件設定部404にチェックコンデション状態検出(エラー応答)などのステップ604で指定された停止条件を設定する(ステップ606)。そしてモニタシーケンサ部406を起動し、トレース動作を開始する(ステップ607)。監視側プログラム134は、イベント待ちの状態に入り休止状態となる(ステップ608)。これら監視側プログラム134の動作は、複数OS制御プログラム131により業務側プログラム133とは独立して実行される。
【0018】
図7は、CSIバスモニタが設定された停止条件を検出された場合の処理フローチャートである。
イベント検出部404は、バス信号ラッチ402の出力とトレース停止条件設定部406の出力を比較し停止条件が成立したことを検出する(ステップ701)。この結果、モニタシーケンサ部406によるトレースメモリ409へのSCSIバス信号状態の書き込みを停止する(ステップ702)。SCSIバスモニタ113からの割り込みにより、SCSIバスモニタ管理AP303に停止条件成立が通知される(ステップ703)。SCSIバスモニタ管理AP303は、PCIバス115を介してトレースメモリ409の内容を主メモリ109の所定のエリアに読み出す(ステップ704)。その後、SCSIバスモニタ管理AP303は主メモリ109上でトレースデータを編集し、結果をリモート制御AP305を介してクライアントPC117に転送する(ステップ705)。システム管理者は、クライアントPC117に転送されたトレースの内容を解析し、障害対策を実施する(ステップ706)。
業務側プログラム133の業務OS基本部201自身が処理できないような異常が発生した場合、業務側プログラム133は、停止状態などの機能不能状態に遷移してしまう場合がある。
【0019】
図8は、業務側プログラム停止障害時の処理フローチャートである。
システム管理者がクライアントPC117の操作によりSCSIバスモニタ管理AP303モニタ停止、およびトレースデータ転送を指定する(ステップ801)。モニタ停止を指示されたSCSIバスモニタ管理AP303が、モニタシーケンサ部406に停止の設定を行う(ステップ802)。モニタシーケンサ部406によるトレースメモリ409へのSCSIバス信号状態の書き込みが停止される(ステップ803)。SCSIバスモニタ管理AP303は、PCIバス115を介してトレースメモリ409の内容を主メモリ109の所定のエリアに読み出す(ステップ804)。その後、SCSIバスモニタ管理AP303は主メモリ109上でトレースデータを編集し、結果をリモート制御AP305を介してクライアントPC117に転送する(ステップ805)。システム管理者は、クライアントPC117に転送されたトレースの内容を解析し障害対策を実施する(ステップ806)。
【0020】
業務側プログラム133の業務OS基本部201自身が処理できないような異常がSCSIバス116のシーケンス以外の原因と考えられる場合、システム管理者はクライアントPC117の操作によりLOG制御AP304をアクセスしハードウェア101内にロギングされている各種ハードウェアログログの編集出力を行う。このようにして得られた情報を解析することにより、障害要因を判断し、適切な対策を実施する。
【0021】
また、本実施例では、SCSIバスモニタ113の制御をSCSIバスモニタ管理AP303でのみ行っているが、複数OS制御プログラム131の仮想ハードウェア132の設定を変更することで、システム管理AP204側から行えるようにすることもできる。システム管理AP204に、SCSIバス116に関する障害検出時、自動的にSCSIバスモニタ113の制御を行う機能を組み込むことにより、システム管理者の操作を介入させずにSCSIバス116の状態情報を採取することが可能になる。
【0022】
図9は、本発明によるIDEバスをトレースする場合の追加構成を示す図である。
本実施例では、SCSIバス116のモニタリングを行うことを例にしたが、図9に示すようにIDEバスモニタ901を接続し、監視側プログラム134にIDEバスモニタ管理APを組み込むことでIDEバスの監視を行うことも可能になる。図9において、IDEバスモニタ901は、PCIバス115から制御され、IDEバス121の監視を行う。HDD902、HDD903はIDE I/FのHDDである。
【0023】
【発明の効果】
以上説明したように、本発明によれば、マルチOS環境を利用して、通常動作している業務OSとは別のOS上で動作するバスモニタ監視プログラムでバスモニタを制御しているので、業務OS、業務プログラム自身が処理できないような異常が発生した場合、監視用の別CPUがなくてもモニタリングプログラムからの情報により的確な障害解析および対策が可能となる。また、仮想ハードウェア方式を用いることにより、業務側プログラムのOS種別に依存することなく、同一の監視側プログラムを使用できる。
【図面の簡単な説明】
【図1】本発明の一実施形態を示すバスモニタリングシステムの構成図である。
【図2】図1における業務側プログラムの構成を示す図である。
【図3】図1における監視側プログラムの構成を示す図である。
【図4】図1におけるSCSIバスモニタの構成を示す図である。
【図5】本発明の一実施例を示すシステムの起動手順を示すフローチャートである。
【図6】本発明における障害検出時の処理フローチャートである。
【図7】本発明におけるトレース停止条件検出時の処理フローチャートである。
【図8】本発明における業務側プログラム停止障害時の処理フローチャートである。
【図9】本発明によりIDEバスをトレースする場合の追加構成を示す図である。
【符号の説明】
101…ハードウェア、102〜104…HDD(ハードディスク)、
105…キーボード、106…マウス、107…CRT、108…CPU、
109…主メモリ、110…CRTA、111…Super IO、
112…SCSIA、113…SCSIバスモニタ、114…LANA、
115…PCIバス、116…SCSIバス、
117〜119…クライアントPC、120…システムバスコントローラ、
121…IDEバス、122…LAN、130…ソフトウェア、
131…複数OS制御プログラム、132…仮想ハードウェア、
133…業務側プログラム、134…監視側プログラム、
201…業務OS基本部、202…ハードウェアドライバ群、
203…業務AP(AP:アプリケーションプログラム)、
204…システム監視AP、205…リモート制御AP、
301…監視OS基本部、302…ハードウェアドライバ群、
303…SCSIバスモニタ管理AP、304…LOG制御AP、
305…リモート制御AP、306…IDEバスモニタ管理AP、
401…バスレシーバ、402…バス信号ラッチ、
403…タイムスタンプ発生部、404…トレース停止条件設定部、
405…イベント検出部、406…モニタシーケンサ部、
407…メモリアドレス制御部、408…モニタ内部制御部、
409…トレースメモリ、410…PCIバス制御部、
901…IDEバスモニタ、901,902…HDD。
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an input / output bus monitoring system for an information processing apparatus and a program therefor, and more particularly, to an information processing apparatus in a multi-OS environment, comprising a bus monitor controlled by a monitoring program operating on an OS different from a normal OS. The present invention relates to an embedded information processing device and a program.
[0002]
[Prior art]
Conventional bus monitor devices include, for example, a SCSI bus monitor device and a bus monitor system disclosed in Japanese Patent Application Laid-Open No. 7-319804. This is provided with an event detecting means for detecting an event to be recorded from a transition of the SCSI signal fetched by the bus receiving section, and a trace memory for sequentially recording this state as trace data. When it exceeds, an alarm is output and a busy signal is output to the bus, during which the trace data is transferred to the outside. That is, a signal is taken into a SCSI bus monitor device via an adapter connected to a bus line (SCSI bus) to be monitored, trace information processed in the monitor device is sent to a host collection device (trace memory), and the operator collects the host data. Information was analyzed by operating a keyboard included in the device.
[0003]
In the SCSI bus monitoring system disclosed in Japanese Patent Application Laid-Open No. 10-222432, a SCSI bus monitoring unit monitors the SCSI bus as needed, and a bus information analysis unit converts signal information of the bus into a form that can be provided as data. The bus monitor daemon periodically issues a SCSI command to the bus monitor to acquire SCSI bus information and feed it back to the system. In other words, the function as a SCSI device is incorporated in the SCSI bus monitor so that it can be operated from the host computer, and the performance of the SCSI bus is improved based on the SCSI bus information obtained from the SCSI bus monitor.
[0004]
[Problems to be solved by the invention]
However, according to these conventional techniques, when a separate host collection device for monitoring is required, or when the host computer program hangs due to an abnormality that cannot be detected by the OS itself, the information collected by the SCSI bus monitor is lost. There is a problem that it cannot be used.
Further, in Japanese Patent Application Laid-Open No. Hei 10-222432, there is a problem that a program for controlling a SCSI bus monitor must be developed for each OS used.
[0005]
An object of the present invention is to solve such a conventional problem and eliminate the need for a monitoring CPU. Even when a normal OS hangs up or the system stops, the information collected by the bus monitor can be obtained. An object of the present invention is to provide a bus monitoring system provided with an inexpensive and reliable fault analysis and recovery means that can be used, and a program therefor.
[0006]
[Means for Solving the Problems]
In order to achieve the above object, the bus monitoring system of the present invention is connected to a system bus (PCI bus) of an information processing apparatus, and a connection bus (IDE (Integrated Device Electronics), SCSI bus) for connecting to various devices operates normally. A bus monitor having a bus monitoring and analysis function for monitoring whether or not a bus is running, and a virtual hardware having a function of allocating an interrupt from hardware and a processing time of a CPU allocate hardware resources to a plurality of OSs. In an information processing apparatus in a multi-OS environment having a function of separating and independent and a function of enabling data writing or reading between a plurality of OSs, the bus monitor operating on an OS independent of a normal OS is controlled. To run a monitoring program for It has to.
As a result, even when an abnormality that cannot be processed by the normal OS itself occurs, accurate failure analysis and countermeasures can be performed based on information from the monitoring program without a separate monitoring CPU. Further, by using the virtual hardware, it is possible to develop a monitoring program for controlling the bus monitor without depending on the OS.
[0007]
A monitor monitoring program according to an embodiment of the present invention provides an information processing apparatus with processing of a business OS basic unit, processing of a hardware driver group for controlling hardware, and processing of a SCSI bus monitor management AP for controlling a SCSI bus monitor. LOG control AP processing for editing and outputting failure information logged in hardware, IDE bus monitor management AP processing for controlling the IED bus monitor, and editing results by these APs via the LAN. This is a program for executing the remote control AP process under the control of the client PC.
[0008]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a configuration diagram of a bus monitoring system according to an embodiment of the present invention in which a monitored bus is a SCSI bus.
In FIG. 1, software 130 includes two programs, a business program 133 and a monitoring program 134, and the hardware 101 is accessed by the business program 133 and the monitoring program 134 as virtual hardware 132.
The multiple OS control program 131 has a function of distributing an interrupt from the hardware 101 and a processing time of the CPU 108 to the business program 133 and the monitoring program 134, and makes the virtual hardware 132 look like hardware to each OS. Thus, the hardware resources seen from the business program 133 and the hardware resources seen from the monitoring program 134 are separated and independent.
[0009]
Further, the multiple OS control program 131 has a function of enabling data writing or reading between multiple OSs. With these functions, a plurality of OSs can be executed independently on one piece of hardware. A technique for executing a plurality of OSs independently with one piece of hardware as implemented here is disclosed in Japanese Patent Application Laid-Open No. H11-149385. According to this, the business-side program 133 and the monitoring-side program 134 can be executed independently, and even when the business-side program 133 stops due to a failure, the monitoring-side program 134 can continue to operate.
[0010]
In the hardware 101, a CPU 108, a main memory 109, a SCSIA 112, a SCSI bus monitor 113, a LANA 114, a SuperIO 111 for controlling various devices, and a system bus controller 120 for controlling each bus are connected to a PCI bus 115. The CRTA 110 is connected to the system bus controller 120 and controls display on the CRT 107. The system bus controller 120 also controls the IDE bus 121. The keyboard 105 and the mouse 106 are connected to the SuperIO 111.
HDDs (hard disks) 102 to 104 are connected to the SCSIA 112 via a SCSI bus 116. Although the number of HDDs is three in this embodiment, it is not limited to this number. The SCSI bus monitor 113 is also connected so that the state transition of the SCSI bus 116 can be monitored.
A plurality of client PCs are connected via the LAN 122. In this embodiment, an example is shown in which three client PCs 117 to 119 are connected.
[0011]
FIG. 2 is a diagram showing a configuration of the business program in FIG.
As shown in FIG. 2, the business-side program 133 reports from a business OS basic unit 201, a hardware driver group 202 for performing hardware control, a business AP 203 including various business application programs, a CPU 108, and a hardware driver group 202. The system includes a system management AP 204 that is a system management application that performs logging and notification of a received error, and a remote control AP 205 that communicates with the client PCs 117 to 119 via the LAN 122.
[0012]
FIG. 3 is a diagram showing the configuration of the monitoring program in FIG.
As shown in FIG. 3, the monitoring-side program 134 includes a business OS basic unit 301, a hardware driver group 302 for performing hardware control, a SCSI bus monitor management AP 303 for controlling the SCSI bus monitor 113, and the hardware 101. A LOG control AP 304 for editing and outputting logged failure information, an IDE bus monitor management AP 306 for controlling the IDE bus monitor 901 (see FIG. 9), and client PCs 117 to 119 via the LAN 122 for editing results by these APs. A remote control AP 305 for performing control from the side.
The operation of the monitoring program 134 is performed by using the keyboard 105, the mouse 106 and the CRT 107 connected to the hardware 101, or by operating a client PC connected to the LANA 114.
In this embodiment, the client PC 117 is described as a management PC that operates the monitoring program 134.
[0013]
FIG. 4 is a diagram showing a configuration of the SCSI bus monitor 113 in FIG.
A bus receiver 401 for receiving a SCSI bus signal, a bus signal latch 402 for synchronizing the received bus signal with the internal timing of the SCSI bus monitor 113, a trace memory 409 for storing bus state transitions, a PCI A PCI bus control unit 410 for controlling transfer with the bus, a time stamp generating unit 403 for indicating the time of occurrence of a bus state transition, a trace stop condition setting unit 404 for setting a write stop condition for the trace memory 409, An event detection unit 405 for detecting a trace stop condition and a bus state transition; a monitor sequencer unit 406 for controlling access timing and address update timing of the trace memory 409; a memory address control unit 407 for managing addresses of the trace memory 409; And SCSI Consisting monitor internal control unit 408 for controlling the entire monitor.
[0014]
FIG. 5 is a flowchart showing a system startup procedure according to one embodiment of the present invention.
The activation process will be described with reference to FIG.
When the power of the hardware 101 is turned on (or rebooted), the business program 133 is started (step 501). The business program 133 starts the initialization process, but the initialization process is interrupted by the multiple OS control program 131 and the monitoring program 134 is started (step 502). The monitoring program 134 clears the trace memory 409 (step 503), initializes the time stamp generator 403 (step 504), and initializes the trace stop condition setting unit 404 (step 505).
The trace stop condition set at this time is a free-run state (no stop condition).
[0015]
Next, the monitor sequencer unit 406 is activated to start a trace operation (step 506). After that, the remote control AP 305 is activated while waiting for input, and waits for an operation from the client PC 117 (management PC) (steps 507 and 508). In this state, the processing is transferred to the business program 133 by the multiple OS control program 131, and the startup processing of the business program 133 is restarted (step 509). Next, the business AP 203 is started, and various related information is initialized (step 510). Thereafter, the normal business by the business AP 203 is started (step 511).
[0016]
FIG. 6 is a flowchart illustrating a processing procedure when a failure related to the SCSI bus 116 in FIGS. 1 and 2 is notified from the system management AP 204 to the client PC 117.
The system management AP 204 detects a failure related to the SCSI bus 116 by monitoring responses of the hardware driver group 202 and the business OS basic unit 201 (step 601). The system management AP 204 logs the failure information and notifies the client PC 117 of the failure via the remote control AP 205 (step 602). Generally, the system administrator performs a failure analysis from the information of the client PC 117 (step 603). If the cause of the failure can be identified at this stage, appropriate measures will be taken based on the cause. If the cause cannot be specified from the information notified from the system management AP 204, the system administrator accesses the SCSI bus monitor management AP 303 from the client PC 117 and specifies the operation mode of the SCSI bus monitor (step 604).
[0017]
The SCSI bus monitor management AP 303, for which the operation parameters have been specified in step 604, first instructs the monitor sequencer unit 406 to stop (step 605). Next, the stop condition specified in step 604 such as check condition detection (error response) is set in the trace stop condition setting unit 404 (step 606). Then, the monitor sequencer unit 406 is activated to start the trace operation (step 607). The monitoring program 134 enters a state of waiting for an event and enters a pause state (step 608). The operation of the monitoring program 134 is executed by the multiple OS control program 131 independently of the business program 133.
[0018]
FIG. 7 is a processing flowchart when the CSI bus monitor detects the set stop condition.
The event detection unit 404 compares the output of the bus signal latch 402 with the output of the trace stop condition setting unit 406 and detects that the stop condition has been satisfied (step 701). As a result, the writing of the SCSI bus signal state to the trace memory 409 by the monitor sequencer unit 406 is stopped (step 702). An interruption from the SCSI bus monitor 113 notifies the SCSI bus monitor management AP 303 that the stop condition has been satisfied (step 703). The SCSI bus monitor management AP 303 reads the contents of the trace memory 409 to a predetermined area of the main memory 109 via the PCI bus 115 (Step 704). After that, the SCSI bus monitor management AP 303 edits the trace data on the main memory 109 and transfers the result to the client PC 117 via the remote control AP 305 (step 705). The system administrator analyzes the contents of the trace transferred to the client PC 117 and takes measures against the failure (step 706).
When an abnormality occurs such that the business OS basic unit 201 of the business program 133 cannot process the business program 133, the business program 133 may transition to a disabled state such as a stopped state.
[0019]
FIG. 8 is a processing flowchart at the time of the business side program stop failure.
The system administrator operates the client PC 117 to designate the SCSI bus monitor management AP 303 to stop monitoring and to transfer trace data (step 801). The SCSI bus monitor management AP 303 that has been instructed to stop monitoring sets the stop in the monitor sequencer unit 406 (step 802). The writing of the SCSI bus signal state to the trace memory 409 by the monitor sequencer unit 406 is stopped (step 803). The SCSI bus monitor management AP 303 reads the contents of the trace memory 409 into a predetermined area of the main memory 109 via the PCI bus 115 (Step 804). After that, the SCSI bus monitor management AP 303 edits the trace data on the main memory 109 and transfers the result to the client PC 117 via the remote control AP 305 (step 805). The system administrator analyzes the contents of the trace transferred to the client PC 117 and takes measures against the failure (step 806).
[0020]
When an abnormality that the business OS basic unit 201 of the business program 133 cannot process is considered to be a cause other than the sequence of the SCSI bus 116, the system administrator accesses the LOG control AP 304 by operating the client PC 117 and Edits and outputs various hardware log logs recorded in. By analyzing the information obtained in this way, the cause of the failure is determined and appropriate measures are taken.
[0021]
In this embodiment, the SCSI bus monitor 113 is controlled only by the SCSI bus monitor management AP 303. However, the control can be performed from the system management AP 204 by changing the setting of the virtual hardware 132 of the multiple OS control program 131. You can also do so. By incorporating a function for automatically controlling the SCSI bus monitor 113 upon detection of a failure related to the SCSI bus 116 in the system management AP 204, the status information of the SCSI bus 116 can be collected without intervention of the system administrator. Becomes possible.
[0022]
FIG. 9 is a diagram showing an additional configuration when tracing the IDE bus according to the present invention.
In the present embodiment, the monitoring of the SCSI bus 116 is described as an example. However, as shown in FIG. 9, an IDE bus monitor 901 is connected, and the IDE bus monitor Monitoring can also be performed. 9, an IDE bus monitor 901 is controlled by a PCI bus 115 and monitors the IDE bus 121. The HDD 902 and the HDD 903 are IDE I / F HDDs.
[0023]
【The invention's effect】
As described above, according to the present invention, the bus monitor is controlled by the bus monitor monitoring program operating on an OS different from the normally operating business OS using the multi-OS environment. When an abnormality occurs that the business OS or the business program itself cannot process, accurate failure analysis and countermeasures can be performed based on information from the monitoring program without a separate monitoring CPU. Further, by using the virtual hardware method, the same monitoring program can be used without depending on the OS type of the business program.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of a bus monitoring system according to an embodiment of the present invention.
FIG. 2 is a diagram showing a configuration of a business program in FIG.
FIG. 3 is a diagram showing a configuration of a monitoring-side program in FIG. 1;
FIG. 4 is a diagram showing a configuration of a SCSI bus monitor in FIG. 1;
FIG. 5 is a flowchart illustrating a procedure for starting a system according to an embodiment of the present invention.
FIG. 6 is a processing flowchart when a failure is detected in the present invention.
FIG. 7 is a processing flowchart when a trace stop condition is detected in the present invention.
FIG. 8 is a processing flowchart at the time of a task side program stop failure in the present invention.
FIG. 9 is a diagram showing an additional configuration when tracing an IDE bus according to the present invention.
[Explanation of symbols]
101: hardware, 102 to 104: HDD (hard disk),
105: keyboard, 106: mouse, 107: CRT, 108: CPU,
109: Main memory, 110: CRTA, 111: Super IO,
112: SCSIIA, 113: SCSI bus monitor, 114: LANA,
115: PCI bus, 116: SCSI bus,
117 to 119: client PC, 120: system bus controller,
121: IDE bus, 122: LAN, 130: software,
131: multiple OS control programs, 132: virtual hardware,
133: business side program, 134: monitoring side program,
201: business OS basic unit, 202: hardware driver group,
203: business AP (AP: application program),
204: system monitoring AP, 205: remote control AP,
301: monitoring OS basic unit, 302: hardware driver group,
303: SCSI bus monitor management AP, 304: LOG control AP,
305: remote control AP, 306: IDE bus monitor management AP,
401: bus receiver, 402: bus signal latch,
403: time stamp generation unit, 404: trace stop condition setting unit
405: an event detector, 406: a monitor sequencer,
407: memory address control unit, 408: monitor internal control unit,
409: trace memory, 410: PCI bus control unit,
901: IDE bus monitor; 901, 902: HDD.

Claims (3)

各種デバイスとの接続バスのモニタリングおよび解析を行う解析用バスモニタと、ハードウェアからの割り込みやCPUの処理時間を振り分ける仮想ハードウェアにより、複数のOSに対しハードウェア資源を分離独立させる手段と、複数OS間でデータの書込みまたは読み出しを行う複数OS制御プログラムを備えたマルチOS環境の情報処理装置からなるバスモニタリングシステムであって、
通常動作しているOSとは別のOS上で動作し、上記解析用バスモニタの制御を行い、バスのモニタリングおよび異常検出を行うバスモニタ監視プログラムを具備することを特徴としたバスモニタリングシステム。
A bus monitor for analysis and monitoring of a connection bus with various devices, and means for separating hardware resources for a plurality of OSs by means of virtual hardware for distributing interrupts from hardware and processing time of a CPU, A bus monitoring system comprising an information processing device in a multi-OS environment having a plurality of OS control programs for writing or reading data between a plurality of OSs,
A bus monitoring system that operates on an OS different from an OS that is normally operating, controls the analysis bus monitor, and includes a bus monitor monitoring program that performs bus monitoring and abnormality detection.
請求項1記載のバスモニタリングシステムにおいて、
前記バスモニタリング監視用プログラムは、通常動作しているOSの種別に依存しないことを特徴とするバスモニタリングシステム。
The bus monitoring system according to claim 1,
A bus monitoring system, wherein the bus monitoring monitoring program does not depend on the type of an OS that is operating normally.
情報処理装置に対し、業務OS基本部の処理と、ハードウェア制御を行うハードウェアドライバ群の処理と、SCSIバスモニタを制御するためのSCSIバスモニタ管理APの処理と、ハードウェア内にロギングされる障害情報を編集出力するためのLOG制御APの処理と、IEDバスモニタを制御するIDEバスモニタ管理APの処理と、これらの各APによる編集結果をLAN経由でクライアントPC側からの制御で行うためのリモート制御APの処理を、それぞれ実行させるためのモニタ監視用プログラム。For the information processing apparatus, the processing of the business OS basic unit, the processing of a group of hardware drivers for performing hardware control, the processing of the SCSI bus monitor management AP for controlling the SCSI bus monitor, and the processing of logging in the hardware Processing of a LOG control AP for editing and outputting fault information to be processed, processing of an IDE bus monitor management AP for controlling an IED bus monitor, and editing results of each AP are controlled by a client PC via a LAN. Monitor monitoring program for causing each of the processes of the remote control AP to execute.
JP2002189380A 2002-06-28 2002-06-28 Bus monitoring system and its program Pending JP2004030513A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002189380A JP2004030513A (en) 2002-06-28 2002-06-28 Bus monitoring system and its program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002189380A JP2004030513A (en) 2002-06-28 2002-06-28 Bus monitoring system and its program

Publications (1)

Publication Number Publication Date
JP2004030513A true JP2004030513A (en) 2004-01-29

Family

ID=31183823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002189380A Pending JP2004030513A (en) 2002-06-28 2002-06-28 Bus monitoring system and its program

Country Status (1)

Country Link
JP (1) JP2004030513A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034210A (en) * 2009-07-30 2011-02-17 Canon Inc Apparatus and method for processing information and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034210A (en) * 2009-07-30 2011-02-17 Canon Inc Apparatus and method for processing information and program

Similar Documents

Publication Publication Date Title
US9396093B1 (en) Virtual execution environment for software delivery and feedback
US8132057B2 (en) Automated transition to a recovery kernel via firmware-assisted-dump flows providing automated operating system diagnosis and repair
US7594144B2 (en) Handling fatal computer hardware errors
US6189114B1 (en) Data processing system diagnostics
US7788537B1 (en) Techniques for collecting critical information from a memory dump
US7765431B2 (en) Preservation of error data on a diskless platform
JP5579650B2 (en) Apparatus and method for executing monitored process
US20160371149A1 (en) Crash management of host computing systems in a cluster
US20100162043A1 (en) Method, Apparatus, and System for Restarting an Emulated Mainframe IOP
US7672247B2 (en) Evaluating data processing system health using an I/O device
US20090300644A1 (en) Method to Detect a Deadlock Condition by Monitoring Firmware Inactivity During the System IPL Process
KR20040047209A (en) Method for automatically recovering computer system in network and recovering system for realizing the same
WO2016000298A1 (en) System exception capturing method, main system, shadow system and intelligent device
CN114600088A (en) Server state monitoring system and method using baseboard management controller
WO2020010890A1 (en) Method and system for monitoring resource utilization rate of server cpu based on bmc
WO2015131549A1 (en) Method and device for collecting operating system fault information, and computer
US9298568B2 (en) Method and apparatus for device driver state storage during diagnostic phase
JP5440073B2 (en) Information processing apparatus, information processing apparatus control method, and control program
US7290180B2 (en) Method to use an alternate I/O debug path
JP5689783B2 (en) Computer, computer system, and failure information management method
JP2001101032A (en) Os monitoring system under inter-different kind of os control
US20050193259A1 (en) System and method for reboot reporting
JP2004030513A (en) Bus monitoring system and its program
US20050210329A1 (en) Facilitating system diagnostic functionality through selective quiescing of system component sensor devices
JP6060781B2 (en) Fault diagnosis apparatus and program