JP3645388B2 - Maintenance control method for information processing apparatus - Google Patents

Maintenance control method for information processing apparatus Download PDF

Info

Publication number
JP3645388B2
JP3645388B2 JP00357797A JP357797A JP3645388B2 JP 3645388 B2 JP3645388 B2 JP 3645388B2 JP 00357797 A JP00357797 A JP 00357797A JP 357797 A JP357797 A JP 357797A JP 3645388 B2 JP3645388 B2 JP 3645388B2
Authority
JP
Japan
Prior art keywords
maintenance
sequence
processing apparatus
information processing
menu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00357797A
Other languages
Japanese (ja)
Other versions
JPH10198454A (en
Inventor
敏夫 木下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP00357797A priority Critical patent/JP3645388B2/en
Publication of JPH10198454A publication Critical patent/JPH10198454A/en
Application granted granted Critical
Publication of JP3645388B2 publication Critical patent/JP3645388B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • User Interface Of Digital Computer (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、情報処理装置の保守制御技術に関し、特に、プログラムで動作する複数のプロセッサおよびメモリからなる制御装置の保守操作等に適用して有効な技術に関する。
【0002】
【従来の技術】
たとえば、コンピュータシステムの普及に伴って、システムの無停止運転に対する要求も高まっており、これに呼応して、ホストシステムの外部記憶として無停止保守が可能なディスクアレイサブシステム等の磁気ディスクサブシステムが使用されてきている。
【0003】
このような磁気ディスクサブシステムは、耐故障性やデータ処理速度を向上させるべく、いわゆるマルチプロセッサ構成をとることが一般的である。すなわち、マイクロプログラムで動作する複数のプロセッサおよび共有メモリからなる制御装置と、その配下のディスクアレイを構成する複数の磁気ディスク装置群からなる構成をとり、マイクロプログラムの更新やプロセッサの交換等の保守作業は、システム全体を停止させることなく実行される。そして、この保守作業は、たとえばシステムに接続されたパーソナルコンピュータ等の保守専用機(以下サービスプロセッサと呼ぶ)に実装されたアプリケーションプログラムから実施することが考えられる。
【0004】
上述のように、磁気ディスクサブシステムがホストシステムと連動して無停止状態で稼動する場合、その保守作業は使用状態下で実施せざるを得ず、保守操作でのミスは許されない。もしかりにミスしたとしても、そのエラーを最小限にくい止めるためのリカバリ操作を確実に実行しなければならない。このリカバリ操作を誤ると特に磁気ディスクサブシステムの場合、顧客の記憶したデータを消去したり、データが別のデータに化けたりして、使用者に計り知れない損害を与える事態を招く。したがって、保守作業に必要な要件は、ミスのない保守操作を実施させることと、ミスが生じてもそのエラーを最小限にするためのリカバリ操作を確実に実施させることである。
【0005】
保守操作およびエラーリカバリ操作を確実に実行する手段として、従来ではたとえば、コンピュータのアプリケーションを自動実行する方法があり、既に製品として販売されている。たとえば、このようなソフトウェア製品として、Windows等のオペレーティングシステム上で動作する米国マイクロソフト社の「マイクロソフト テスト」等の製品が知られている(Windowsおよびマイクロソフト テストは米国マイクロソフト社の商標である)。
【0006】
すなわち、パーソナルコンピュータ上で動作する全てのアプリケーションに対し、ユーザの操作すべき内容を全てスクリプトと呼ばれるソースプログラムで記述し、これを実行するものである。これらの機能は、完全に人手を必要とせず、アプリケーションがたとえエラーで中断されても、スクリプトの内容を詳細に定義すれば、エラーの自動リカバリは可能である。これらの機能は既にユーザ操作および対応するアプリケーションの動作が一定である定常操作において有効である。また、これらの機能にはユーザの操作した内容をスクリプトとして記録するレコード機能があり、スクリプトを記述する上で有効である。
【0007】
【発明が解決しようとする課題】
ところが、前述のような従来技術では、たとえば磁気ディスクサブシステムを保守する際にパーソナルコンピュータを用いて実施する場合、保守操作を全て自動化することができない場合がある。それは、磁気ディスクサブシステムの動作条件、構成状態等が、装置使用者の状況によって多岐にわたっており、保守内容がそれぞれの使用状態や条件に応じて変化するため、保守操作を定常化できないからである。
【0008】
また、エラーリカバリミスを防ぐ場合、従来技術での自動実行機能はエラーの状況に応じてスクリプトを変更する機能がないので対応できない。また、予めエラー状況を予測してスクリプトを作成することも可能だが、使用状態によってさらに変化してしまうため、全てカバーすることは実質的に限界がある。特に磁気ディスクサブシステムの場合、保守専用機であるサービスプロセッサ以外の、プロセッサ群がシステムの制御を実行しているが、これらのサービスプロセッサ以外の別のプロセッサ上で稼働している処理内容を取得して、スクリプトを作成することはできない。スクリプトはサービスプロセッサ内の制御のみを想定しているからである。
【0009】
以上から、本発明が解決しようとする課題を整理すると次の通りである。保守操作やエラーリカバリ操作を確実に実行させるためには、従来技術のようにスクリプトに基づいて自動実行させることことは、保守員の操作自体を減らしミスを防ぐことができる点では有効であるが、確実に正しい保守操作シーケンスを選択させるよう判断の誤りをさせないための技術、つまり保守目的と保守操作シーケンスとの対応付けが課題である。
【0010】
また、保守員の操作する内容、手順が正しいか否かをどう判断し、保守員にいかに知らしめるかが課題である。
【0011】
また、過去に実施した保守操作が正しい手順であったか、誤った手順だったのかを記録し、次の機会の保守操作時にどう役立たせるかが課題である。
【0012】
また、情報処理装置を制御するプロセッサの実行状態から如何に正しい手順を決定するかが課題である。
【0013】
本発明の目的は、保守目的と保守操作シーケンスとの的確な対応付けにより、保守員による誤った保守操作を確実に防止することが可能な情報処理装置の保守制御技術を提供することにある。
【0014】
本発明の他の目的は、誤った保守操作を保守員に的確に報知して誤った保守操作を確実に防止することが可能な情報処理装置の保守制御技術を提供することにある。
【0015】
本発明の他の目的は、熟練した保守員や技術者等による模範的な保守操作履歴や、過去の保守操作履歴を再利用することで、保守員による誤った保守操作の防止を効率よく実現することが可能な情報処理装置の保守制御技術を提供することにある。
【0016】
本発明の他の目的は、保守対象の情報処理装置の多様な実行状態に対応した的確な保守操作を保守員に実行させることが可能な情報処理装置の保守制御技術を提供することにある。
【0017】
本発明の他の目的は、保守員の熟練度等に関係なく、保守員による的確な保守操作を実現することが可能な情報処理装置の保守制御技術を提供することにある。
【0018】
【課題を解決するための手段】
本発明の情報処理装置の保守制御方法は、第1の情報処理装置に接続され、前記第1の情報処理装置に対する保守命令を発行する第2の情報処理装置における保守制御方法であって、前記第2の情報処理装置が前記第2の情報処理装置内のメニュー記憶領域に記憶した保守項目を読み出して前記第2の情報処理装置に接続される表示部に前記保守項目を表示するステップと、操作者から入力される情報に基づいて選択された前記保守項目に対応する保守操作シーケンスをシーケンス記憶部から読み出して前記表示部に表示するステップと、前記第1の情報処理装置を介して操作者が入力した保守処理を、前記第2の情報処理装置が検出するステップと、シーケンス判定部が前記検出ステップで検出された保守処理と、前記読み出した保守操作シーケンスとが一致しているかどうか判定するステップと、前記シーケンス判定部による判定の結果、一致している場合に、次のシーケンスをシーケンス記憶部から読み出しをして前記表示部に表示し、一致していない場合に正しい操作を行うようガイドするためのメッセージを前記第2の情報処理装置に接続される前記表示部に表示するステップと、からなるものである。
本発明では、保守員に対して保守操作を確実に実施させ、また、保守員による誤った操作がされたかどうかを監視・判断できる手段としてナビゲート手段を設ける。ナビゲート手段には、保守目的・保守内容をメニューとして記憶し各メニューに対応した操作シーケンスを記憶する手段、またメニューを選択すると該当する操作シーケンスをロードし、1ステップ毎に自動実行またはシーケンスから操作すべき内容をガイドとして出力するためのシーケンスを制御するシーケンサを設ける。また各保守用アプリケーションから保守員の操作した内容を知るためのアプリケーション操作監視手段と、正しく操作されたかどうかを、先にローディングされたシーケンスと比較するシーケンス判定手段を設け、もし誤った操作を行った場合、保守員を正しい操作手順に導くようにガイダンスを出力する手段を設ける。
【0019】
また先の操作シーケンスを記憶するに当たり、正しい操作なのか、誤った操作なのかの識別情報を記憶することで、保守員の操作がどの手順で実施したのかを判定できるようにする。記録された操作シーケンスは、適宜編集され、ナビゲート手段にて再利用される。
【0020】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照しながら詳細に説明する。
【0021】
(実施の形態1)
本第1の実施の形態では、プログラムで動作する複数のプロセッサおよびメモリからなる制御装置、たとえばディスクアレイサブシステム等の情報処理装置の保守を、パーソナルコンピュータを用いて実施する場合を例に採って説明する。特にディスクアレイサブシステムの場合、ホストマシンと連動して無停止で利用される場合が多い。このような利用状況下での保守作業は、ディスクアレイサブシステムを稼働させたまま実施されることがある。この場合、保守作業は確実に実施しなければならず、ディスクアレイサブシステムが高度かつ複雑な制御を行う装置であると、保守員に高度な保守技術が要求される。保守作業には、一部のディスク装置を交換したり、装置を制御するマイクロプログラムを交換するなど、様々あってその難易度のレベルも内容に応じて千差万別である。ところが、保守員の技術が必ずしも高度で一定であるとは限らず、ささいな操作ミスであるとか、もしくは稼働状況に応じては保守作業が進まないケースもある。従って保守員は、保守作業中に生じた事態に直ちに対処できる技量が必要である。これはそのような事態を一度経験したかどうかに関わる。すなわち過去の経験、いわゆるノウハウが保守技術に必要な要件である。このような経験を如何に他の保守員に生かすかが重要である。
【0022】
本第1の実施の形態では、特にディスクアレイサブシステムの保守を行う際に、熟練した保守員による模範的な保守操作や、過去の保守操作経験を蓄積して再利用することで、他の保守員による保守操作を的確に誘導する技術の一例を説明する。
【0023】
図1は、本発明の第1の実施の形態である情報処理装置の保守制御方法を実現するためのシステム構成の一例を示す概念図であり、図2は、本実施の形態の情報処理装置の保守制御方法が適用される磁気ディスクサブシステムの構成の一例を示す概念図である。
【0024】
まず、図2に例示されるように、本第1の実施の形態の磁気ディスクサブシステムは、上位の中央処理装置104に接続されるディスク制御装置101と、その配下に接続され、たとえばディスクアレイを構成する複数のディスク装置108(Disk装置)からなる。
【0025】
ディスク制御装置101は中央処理装置104と直接接続して制御するための複数のホストI/F制御部105とディスク装置108を制御するためのディスクI/F制御部106(Disk I/F)、これらのI/F制御部とを接続するための共通バス103と制御情報を共有するための共有メモリ107(共有Memory)から構成される。
【0026】
本第1の実施の形態の場合、このディスク制御装置101の保守を目的として、共通バス103と接続されたサービスプロセッサ102(Service Processor :以下、SVPと記す)を具備する。このSVP102は、保守専用のハードウエアとして、マイクロプロセッサ、主記憶、共通バス等を具備した中央処理装置と、CRTディスプレイ、キーボート、マウス等の外部入出力装置、およびプログラムやデータを記憶するための外部記憶装置からなるパーソナルコンピュータを使用する。
【0027】
すなわち、図1に例示されるように、本第1の実施の形態のSVP102は、共通バス130に、保守員に対して所望の情報を表示して提示するCRTディスプレイ131、保守員が所望の情報を入力するためのキーボード133およびマウス132、および全体の制御を行う図示しないマイクロプロセッサ、マイクロプロセッサの実行プログラムやデータ等が格納される図示しない主記憶、図示しないハードディスク装置等の外部記憶装置が接続された構成となっている。さらに、本第1の実施の形態では、たとえばフロッピイディスク、CD−ROM、光ディスク、光磁気ディスク等の可搬性記録媒体135が装填され可搬性記録媒体135に対する情報の記録/再生動作を行う媒体ドライブ134が共通バス130に接続されている。
【0028】
本第1の実施の形態の場合、図示しない主記憶には、後述のようにして保守員を誘導することで的確な保守操作を行わせるためのナビゲータ110、アプリケーション120等の制御プログラムがロードされ、図示しないマイクロプロセッサにて実行される。このナビゲータ110やアプリケーション120は、可搬性記録媒体135に記録されていたものが、必要に応じて、媒体ドライブ134を経由してSVP102の外部記憶装置に実装され、電源投入等の任意の契機で主記憶にロードされ、マイクロプロセッサにて実行される。あるいは、媒体ドライブ134を経由して可搬性記録媒体135から、電源投入等の任意の契機で主記憶にロードされ、マイクロプロセッサにて実行される。
【0029】
本第1の実施の形態では、過去のノウハウを操作シーケンスとして記憶しておいて、このシーケンスに基づいて保守員に操作を誘導する方法の一例を説明する。
【0030】
アプリケーション120は、ディスク制御装置101を保守するためのプログラムである。アプリケーション120は、保守を実施するための主処理122と保守員の入出力を行うユーザインタフェース121およびディスク制御装置101内の他の制御部との通信を実施するI/F部123から構成する。保守員は、保守内容に応じて直接、マウス132やキーボード133から入力してアプリケーション120を実行させ、CRTディスプレイ131でアプリケーション120からの出力を確認し操作を進める。アプリケーション120は1種類だけではなく、保守内容に応じて複数存在する。図1中では一例として1種類のみ例示してある。
【0031】
一方、アプリケーション120とともにSVP102に備えられ、保守員の操作を誘導するためのナビゲータ110には、過去のノウハウとして操作手順を記憶するためのシーケンス記憶114を具備する。保守員は、保守操作を実施する際、このナビゲータ110を最初に起動する。ナビゲータ110は、最初にシーケンス選択111を起動し、保守項目を記憶したメニュー112から所望のメニューをCRTディスプレイ131へ出力する。
【0032】
図3は、本第1の実施の形態におけるメニュー112の記憶構造の一例を示す概念図である。メニューは階層構造になっており、先頭メニューから順次詳細なメニューへと展開する。
【0033】
図4は、本第1の実施の形態におけるメニュー内容の記憶フォーマットの一例を示す概念図である。メニューの記憶フォーマットは、1メニュー項目つづ定義できる。また各メニューとのリンク関係を付けられるように、各メニュー毎に自分自身を識別する為のMenu Pointerを具備する。Menu Name には、CRTディスプレイ131へ出力する際に保守員へ明示するための名称を定義する。Next Menu Pointer は、同一レベルの他のメニューのMenu Pointerを定義する。たとえば図3の"Install" メニューの定義の場合、同一レベルにある他のメニューとして”Change”のMenu Pointerを指している。また"Install" と同じレベルである"Error Recovery"の場合、次に同じレベルのメニュー項目がないため、0xFFFFという値を定義し、次に続くメニュー項目がないことを定義する。Detail Pointerは、たとえば”Error Recovery”メニューの場合、詳細レベルでの"Recover Communication Error" というメニューのMenu Pointerを定義する。詳細レベルのメニューがない場合には、上述と同様の0xFFFFという値を定義する。このようなデータフォーマットであれば、階層構造が柔軟に定義できる。
【0034】
図2のシーケンス選択111で出力したメニューから、保守員はマウス132またはキーボード133より保守内容を決定する。メニューを決定すると、シーケンス選択111は、シーケンサ113へどのメニューが選択されたかを知らせる。シーケンサ113は、決定されたメニューに対応した操作シーケンスを決定するため、図5に例示されるような対応テーブルを参照する。
【0035】
図5で例示される対応テーブルは、先の図4で説明したMenu Pointerを定義したMenu ID 欄と、各Menu ID に対応する操作シーケンスを識別するためのシーケンスID欄からなる。シーケンサは図5の対応テーブルのMenu ID 欄を参照し、対応するシーケンスのIDを決定する。
【0036】
シーケンサ113は、決定したシーケンスIDをもつシーケンスを、シーケンス記憶114よりローディングする。
【0037】
図6および図7は、本第1の実施の形態においてシーケンス記憶114に格納されているシーケンス例を示す説明図である。この図6および図7に例示されるように、シーケンスはテキスト形式で記述されたソースプログラムである。シーケンスは大きくPropertyとScriptの2種類の記述ブロックから構成される。Propertyではシーケンスの属性を定義する。ここではシーケンスを定義した日付や定義した作業者の名前、該シーケンスで実施した場合、操作ミスを引き起こすものかどうかを示すResult属性を定義する。これは該シーケンスを定義する人自身が実施した結果に基づいて定義する。またScriptの部分は、実際の操作手順を記述する。本第1の実施の形態では特に記述文法には言及しないが、記述は階層構造をサポートしており、少なくとも1行に1処理をシーケンシャルに処理するための制御構造と、条件分岐による制御構造、および処理を繰り返し実行するための制御構造をサポートしている。本スクリプトは、シーケンサ113が解釈する。
【0038】
先頭のキーワード"Sequence"に引き続く値(図6の場合「Ox2012」)は、シーケンスの識別子であって、図5の対応テーブルに記載されたシーケンスIDと同一である。
【0039】
シーケンサ113は、先の図5の対応テーブルから対応するシーケンスを読み込み、1行ずつ構文解析して実施すべき内容を把握する。このとき、保守員が操作すべき内容を、処理すべき1行分のスクリプトの内容から解析し、ガイド出力115へ出力するよう要求する。ガイド出力115はCRTディスプレイ131へメッセージとして出力し、保守員の操作を誘導する。
【0040】
保守員はガイド出力115の出力したガイダンスに従って、対応するアプリケーション120を操作する。アプリケーション120は保守員の操作した内容をユーザインタフェース121が解釈し対応する主処理122を実行する。必要があればディスク制御装置101の他の制御部と通信するため、アプリケーション120内のI/F部123が処理をする。このとき、保守員の操作内容や主処理での処理内容を把握するため、AP操作来歴124へ出力して記録する。
【0041】
ナビゲータ110のAP操作監視117は、絶えずAP操作来歴124を監視しており、保守員がアプリケーション120に対して操作した内容やアプリケーション120の主処理122、I/F部123の処理内容を参照する。AP操作監視117は参照した内容を解釈し、どんな操作が行われたのかをシーケンス判定116へ通知する。シーケンス判定116は、ガイド出力115で誘導した内容に基づいて正しく保守員が操作したかどうかを判定する。正しく行われていることが確認できれば、シーケンサ113へ次のシーケンスを実行するように指示する。もし正しく行われていないことが判明した場合は、シーケンサ113へ操作が誤っている旨を指示する。シーケンサ113は、ガイド出力115を通じて、保守員に正しい操作を行うようガイドするためのメッセージを出力する。
【0042】
たとえば、図6では、“DIAG”というアプリケーションを起動し、メニューから"Communication Check" を選択して自動実行し、アプリケーション120から返されたMessage IDに応じて、保守員に参照すべきマニュアルページをガイダンスする動作を行うためのシーケンスが定義されている。
【0043】
シーケンスによっては、ディスク制御装置101の状態を把握した上で保守員の操作をガイドする必要がある。この場合は、シーケンスのスクリプト上でディスク制御装置101の状態を参照する指示を記入し、状態に応じて処理を分岐させるよう定義する。シーケンサ113がディスク制御装置101の状態を把握する必要がある場合、装置状態監視118が直接にディスク制御装置101の共通バス103を介して他の制御部と通信し、たとえば共有メモリ107等を参照することで情報を収集する。その結果と操作員の操作とをあわせて、シーケンス判定116で正しい操作を行ったか判断する。
【0044】
たとえば、図7では、“INFORMATION”というアプリケーションを起動し、メニュー"Status"の中から、"Communication Status"を選択して自動実行し、ディスク制御装置101の構成情報をチェックした後、アプリケーションから返されたMessage IDの種別や、複数のホストI/F制御部105〜ディスクI/F制御部106等の動作状態に応じて、保守員がなすべき処理を切りわけ、必要なメッセージを保守員に提示してガイドする動作を行う例が示されている。
【0045】
このように正しい操作を導く為のシーケンスを予め定義し、ナビゲータ110によって操作を誘導することで、誤った操作やエラーリカバリの対処を保守員に正しく実施させることが可能である。
【0046】
次に、図8のフローチャートを参照して、上述のような保守員の誘導処理におけるナビゲータ110の処理の一例を説明する。
【0047】
ステップ701では、まずメニュー112よりメニュー項目を読み込み、CRTディスプレイ131へ出力する。ステップ702では、保守員のメニュー選択項目を受け付ける。選択したメニューが更に詳細なメニューが定義されているかどうかをステップ703で判定し、あれば再度ステップ701で詳細メニューを読み込む。以上から保守員の選択した項目を決定すると、ステップ702で選択されたメニューに対するシーケンスをステップ704でシーケンス記憶114より特定する。ステップ705でスクリプトを読み込む。ステップ706で読み込んだスクリプトのうち次に処理すべきスクリプトを解析する。ステップ707でスクリプトが全て終了しているかを判定し、終わっていれば処理を終了する。ステップ708では、先に解析したスクリプトがディスク制御装置101の状態を参照すべきであるかどうかを判別する。必要である場合、ステップ720で装置状態情報を取得し、その結果、シーケンスを変更する必要があるかどうかをステップ721で判定する。必要がない場合はステップ705へ戻る。変更する必要があると判別した場合はステップ723で変更すべきシーケンスを特定し、ステップ705へ戻る。
【0048】
ステップ706で解析した内容をステップ709でCRTディスプレイ131を介して保守員に提示してガイドする。ステップ710では保守員がガイドに従って操作したかどうかを監視する。解釈したシーケンスがシーケンスを変更する必要がある場合は、ステップ711で判別し、ステップ714で変更シーケンスを特定してステップ705へ戻る。保守員の操作を調べ動作がガイドした内容と一致しているかどうかをステップ712で判定する。一致すればステップ705へ戻るが、一致していなければステップ713で正しい動作を実施するよう勧告メッセージを出力する。
【0049】
また、シーケンサ113は、読み込んだシーケンスからアプリケーション120の操作を自動実行できる場合は、自動実行できる機能を付加する。保守員の判断が必要な場合とか、保守員の操作が必要な場合は、その旨をスクリプトに明示できるようにし、シーケンサ113がCRTディスプレイ131にガイド出力して誘導するのか、自動実行するのかを判断して処理する。このように機能を付加すれば、保守員の操作が正しいかどうかを判定する項目が減るだけでなく、保守員が誤った操作をさせる機会を減らすことができる。
【0050】
このように、本第1の実施の形態では、保守員の実際の操作にディスク制御装置101の状態を加味して保守操作の誤りの有無等を判断しながら、適宜メッセージを出力したり、必要なスクリプトを自動的に実行する等の処理により、比較的複雑なマルチプロセッサ構成のディスク制御装置101の保守を致命的な誤操作等を発生させることなく、的確に遂行させることが可能になる。
【0051】
(実施の形態2)
前述の第1の実施の形態では、既に定義されたスクリプトに基づいて保守員を誘導する方法について述べた。続いて、保守員が操作した内容に基づいて、スクリプトとしてシーケンスを定義する第2の実施の形態について述べる。この第2の実施の形態は、たとえば高度な保守技量を有した保守員や、ディスク制御装置101のメーカの設計者等が操作した内容を解析し、スクリプトとしてシーケンス記憶114に定義する方法である。本方式によって、高度な技量を持った保守員のノウハウを他の保守員へ容易かつ的確に伝承することが可能になる。
【0052】
図9は、本第2の実施の形態の情報処理装置の保守制御方法を実現するためのSVP102の構成の一例を示す概念図である。前述の第1の実施の形態の図1の構成との違いは、保守操作を解析しスクリプト化するためのナビゲート解析800と、装置状態監視118が監視した結果を記憶するための装置状態805を備えている点である。
【0053】
ナビゲート解析800には、AP操作来歴解析802を具備しており、AP操作来歴解析802は保守員の既に操作した内容を記憶するAP操作来歴124の内容や、装置状態監視118が参照したディスク制御装置101の装置状態の情報を記憶した装置状態805の内容に基づいて、スクリプト化(スクリプト生成)を実行する。この結果に基づいて既にシーケンス記憶114に同一のスクリプトが定義されているかどうかをシーケンス検索804で検索する。この検索では、全く同一かどうかを検索するだけでなく、あるシーケンスで同一であれば、そのシーケンスも対象とするようにする。全く同一な手順であれば、既に記憶されているため、該シーケンスをシーケンス記憶114へ定義する必要はない。しかし、それ以外の場合には、シーケンス編集803にAP操作来歴解析802で解析したシーケンスを渡し、保守員が直接編集できるようにする。シーケンス記憶114に定義されているシーケンスは、前述の図6、図7で例示したとおりテキスト形式になっているため、簡単に編集することが可能である。また既にAP操作来歴124に記録されていた操作が、結果として正しい手順だったか誤った手順だったのかをシーケンスのプロパティに直接定義する。このようにすれば、もし誤った手順で別の保守員が操作した場合でも、正しく誘導することが可能となる。
【0054】
装置状態805は、最新のディスク制御装置101の状態情報だけを記憶するだけなく、参照した時刻と対応して時系列的に記憶することで、今後の障害解析に役立つ。
【0055】
また、ナビゲータ110を一つのアプリケーションとして考え、保守員操作のガイド誘導および操作監視を実施するため、図9ではナビゲータ110にユーザインタフェース831を設け、AP操作監視117の監視対象としている。
【0056】
このように、本第2の実施の形態によれば、熟練した保守員による過去の保守操作履歴情報や、ディスク制御装置101に精通したメーカの設計者や技術者等による模範的な保守操作をスクリプトとして記録して蓄積し、任意の保守員が保守操作を実行する際に、保守操作ガイドとして再利用することで、たとえば経験の少ない保守員等にも、的確な保守操作を行わせることができる、という効果がある。
【0057】
(実施の形態3)
図10は、本発明の第3の実施の形態の情報処理装置の保守制御方法を実現するためのSVP102の構成の一例を示す概念図である。
【0058】
この第3の実施の形態では、ディスク制御装置101とは別の遠隔地にセンタテスト装置901を設置し、ディスク制御装置101とセンタテスト装置901をネットワークで接続した場合を説明する。
【0059】
センタテスト装置901は、SVP102を含めて、ユーザ側に設置されたディスク制御装置101とほぼ同様の構成を備えたものであり、ユーザ側にて発生した保守操作手順の再現試験や、障害の再現等をメーカ内にて行うことが可能になっている。
【0060】
ディスク制御装置101の保守作業を実施した際、予期せぬ障害が発生することがあり、その原因を追究しリカバリを実施するためには、ディスク制御装置101を直接操作した保守員が全て実施できるとは限らない。この場合、ディスク制御装置101のダンプ情報やログ情報を採取して、保守センタと呼ばれる別の保守員や、もしくはディスク制御装置101を製造したメーカの技術者へ配布し、原因追究を実施する。このときに保守員がどのような保守操作を行ったかを知ることは原因追究の上で重要なことである。そこで図10の構成例では、SVP102にセンタ通信905を設け、保守員の操作したAP操作来歴124を保守センタやメーカへ転送できる手段を設ける。通信方法は、図10では通信モデムと呼ばれる通信媒体を用いて一般公衆回線網904を介して行う。センタ側にも通信モデム903を具備し、センタテスト装置901にサイト通信902を設け、ディスク制御装置101のセンタ通信905と情報の転送を行う。通信方法は、図10で例示した方法が一般的ではあるが、コンピュータネットワークと呼ばれるネットワーク手段、たとえばEhternetを利用したり、ディジタル通信網を利用するなど、様々な手段を採用することができる。ネットワーク手段が様々変化しても、対応できるようセンタ通信905およびサイト通信902が設定できるようにしておく。
【0061】
障害の生じたディスク制御装置101からAP操作来歴124および装置状態805を入手し、センタテスト装置901に具備するナビゲート解析800およびナビゲータ110にて、保守員操作が正しかったのかどうかを判別する。解析には保守センタで待機する別の高度な保守技術を要した保守員であるとか、製造したメーカの設計者が実施し、正しいリカバリ手順を追求する。解析の結果、正しいリカバリ手順をシーケンス記憶114に記憶させ、また該シーケンスが新規である場合、メニュー112に新規メニューを登録し、保守員が該メニューを選択することで、正しいリカバリ手順を誘導できるようにする。このように保守センタやメーカで定義したシーケンス記憶114およびメニュー112をサイト通信902手段で障害のあったディスク制御装置101へ転送する。これにより、ディスク制御装置101を直接保守する保守員が正しいリカバリ手順で障害を回復することが可能となる。
【0062】
また保守センタやメーカの評価センタ等で操作したAP操作来歴124をナビゲート解析800を用いてシーケンスを随時定義しておき、ネットワーク手段で各ディスク制御装置のナビゲータ110へ転送しておけば、いかなる障害が発生しても、既に該障害が保守センタやメーカの評価センタで体験済みであれば、シーケンスを自動的に変更して、正しいリカバリ手順をその場で保守員に伝達して誘導することが可能となる。
【0063】
以上、本発明の各実施の形態によって説明したように、複雑な制御を行う、たとえば、ディスクアレイサブシステム等の磁気ディスクサブシステムを保守する場合、正しい保守操作を保守員に誘導することで、操作ミスによる障害を防止することができるだけでなく、システムに精通したメーカの技術者や、熟練した保守員の操作手順や経験等を、一般の保守員へ伝承させて、的確に保守操作を誘導することが可能となる。また、このように熟練した保守員のノウハウを保守操作として記憶し再利用することで、より高度な保守を実施できる。
【0064】
以上本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
【0065】
【発明の効果】
本発明の情報処理装置の保守制御方法によれば、保守目的と保守操作シーケンスとの的確な対応付けにより、保守員による誤った保守操作を確実に防止することができる、という効果が得られる。
【0066】
また、本発明の情報処理装置の保守制御方法によれば、誤った保守操作を保守員に的確に報知して誤った保守操作を確実に防止することができる、という効果が得られる。
【0067】
また、本発明の情報処理装置の保守制御方法によれば、熟練した保守員や技術者等による模範的な保守操作履歴や、過去の保守操作履歴を再利用することで、保守員による誤った保守操作の防止を効率よく実現することができる、という効果が得られる。
【0068】
また、本発明の情報処理装置の保守制御方法によれば、保守対象の情報処理装置の多様な実行状態に対応した的確な保守操作を保守員に実行させることができる、という効果が得られる。
【0069】
また、本発明の情報処理装置の保守制御方法によれば、保守員の熟練度等に関係なく、保守員による的確な保守操作を実現することができる、という効果が得られる。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態である情報処理装置の保守制御方法を実現するためのシステム構成の一例を示す概念図である。
【図2】本発明の第1の実施の形態である情報処理装置の保守操作誘導方法が適用される磁気ディスクサブシステムの構成の一例を示す概念図である。
【図3】本発明の第1の実施の形態におけるメニューの記憶構造の一例を示す概念図である。
【図4】本発明の第1の実施の形態におけるメニュー内容の記憶フォーマットの一例を示す概念図である。
【図5】本発明の第1の実施の形態におけるシーケンサによって参照される対応テーブルの一例を示す概念図である。
【図6】本発明の第1の実施の形態においてシーケンス記憶に格納されているシーケンスの一例を示す説明図である。
【図7】本発明の第1の実施の形態における別のシーケンスの一例を示す説明図である。
【図8】本発明の第1の実施の形態におけるナビゲータの処理の一例を示すフローチャートである。
【図9】 本発明の第2の実施の形態である情報処理装置の保守制御方法を実現するためのSVPの構成の一例を示す概念図である。
【図10】 本発明の第3の実施の形態である情報処理装置の保守制御方法を実現するためのSVPの構成の一例を示す概念図である。
【符号の説明】
101…ディスク制御装置、102…サービスプロセッサ(コンピュータ装置)、103…共通バス、104…中央処理装置、105…ホストI/F制御部、106…ディスクI/F制御部、107…共有メモリ、108…ディスク装置、110…ナビゲータ、111…シーケンス選択、112…メニュー、113…シーケンサ、114…シーケンス記憶、115…ガイド出力、116…シーケンス判定、117…AP操作監視、118…装置状態監視、120…アプリケーション、121…ユーザインタフェース、122…主処理、123…I/F部、124…AP操作来歴、124…絶えずAP操作来歴、130…共通バス、131…CRTディスプレイ、132…マウス、133…キーボード、134…媒体ドライブ、135…可搬性記録媒体(情報記録媒体)、800…ナビゲート解析、802…AP操作来歴解析、803…シーケンス編集、804…シーケンス検索、805…装置状態、831…ユーザインタフェース、901…センタテスト装置、902…サイト通信、903…通信モデム、904…一般公衆回線網、905…センタ通信。
[0001]
BACKGROUND OF THE INVENTION
  The present invention provides a maintenance control technique for an information processing apparatus.In the artIn particular, the present invention relates to a technique that is effective when applied to a maintenance operation or the like of a control device including a plurality of processors and memories that are operated by programs.
[0002]
[Prior art]
For example, with the spread of computer systems, the demand for non-stop operation of the system has also increased, and in response to this, a magnetic disk subsystem such as a disk array subsystem capable of non-stop maintenance as an external storage of the host system. Has been used.
[0003]
Such a magnetic disk subsystem generally adopts a so-called multiprocessor configuration in order to improve fault tolerance and data processing speed. In other words, it is composed of a control device consisting of a plurality of processors and shared memory that operate with microprograms, and a group of magnetic disk devices constituting the subordinate disk array, and maintenance such as microprogram updates and processor replacements. Work is performed without stopping the entire system. The maintenance work can be performed from an application program installed in a maintenance dedicated machine (hereinafter referred to as a service processor) such as a personal computer connected to the system.
[0004]
As described above, when the magnetic disk subsystem operates in a non-stop state in conjunction with the host system, the maintenance work must be performed under the use state, and a mistake in the maintenance operation is not allowed. Even if you make a mistake, you must ensure that you perform a recovery operation to minimize the error. If this recovery operation is mistaken, especially in the case of a magnetic disk subsystem, data stored by the customer may be erased, or the data may be converted into another data, causing a situation in which the user is immeasurable. Therefore, the necessary requirements for the maintenance work are to perform a maintenance operation without mistakes, and to reliably perform a recovery operation for minimizing the errors even if a mistake occurs.
[0005]
Conventionally, for example, there is a method of automatically executing a computer application as means for reliably executing a maintenance operation and an error recovery operation, which has already been sold as a product. For example, as such software products, products such as “Microsoft Test” of Microsoft Corporation in the United States operating on an operating system such as Windows are known (Windows and Microsoft Test are trademarks of Microsoft Corporation in the United States).
[0006]
That is, all the contents to be operated by the user are described by a source program called a script for all applications running on the personal computer, and this is executed. These functions do not require any human intervention, and even if the application is interrupted by an error, automatic error recovery is possible if the script contents are defined in detail. These functions are already effective in the steady operation where the user operation and the operation of the corresponding application are already constant. These functions include a record function for recording the contents operated by the user as a script, which is effective in describing the script.
[0007]
[Problems to be solved by the invention]
However, in the conventional technology as described above, for example, when performing maintenance using a personal computer when maintaining the magnetic disk subsystem, it may not be possible to automate all maintenance operations. This is because the operation conditions and configuration status of the magnetic disk subsystem vary widely depending on the situation of the user of the device, and the maintenance content changes according to the usage status and conditions of each device, so the maintenance operation cannot be made steady. .
[0008]
Also, in order to prevent error recovery mistakes, the automatic execution function in the prior art cannot be handled because there is no function to change the script according to the error status. Although it is possible to predict the error situation in advance and create a script, since it further changes depending on the use state, there is a practical limit to covering all of them. Especially in the case of a magnetic disk subsystem, a group of processors other than the service processor, which is a dedicated maintenance machine, controls the system, but obtains the details of processing running on another processor other than these service processors. And you can't create a script. This is because the script assumes only control in the service processor.
[0009]
From the above, the problems to be solved by the present invention are summarized as follows. In order to reliably execute maintenance operations and error recovery operations, automatic execution based on scripts as in the prior art is effective in that maintenance operations can be reduced and mistakes can be prevented. Therefore, there is a problem of a technique for preventing a determination error so that a correct maintenance operation sequence is selected, that is, a correspondence between a maintenance purpose and a maintenance operation sequence.
[0010]
Another problem is how to determine whether or not the contents and procedures operated by the maintenance staff are correct and to inform the maintenance staff.
[0011]
Another problem is how to record whether the maintenance operation performed in the past was a correct procedure or an incorrect procedure and to make it useful at the maintenance operation at the next opportunity.
[0012]
Another problem is how to determine the correct procedure from the execution state of the processor that controls the information processing apparatus.
[0013]
  An object of the present invention is to provide an information processing apparatus capable of reliably preventing erroneous maintenance operations by maintenance personnel by accurately associating a maintenance purpose with a maintenance operation sequence.Maintenance control technologyIs to provide.
[0014]
  Another object of the present invention is to provide an information processing apparatus capable of accurately notifying maintenance personnel of erroneous maintenance operations and reliably preventing erroneous maintenance operations.Maintenance control technologyIs to provide.
[0015]
  Another object of the present invention is to efficiently prevent erroneous maintenance operations by maintenance personnel by reusing the model maintenance operation history by skilled maintenance personnel and engineers and the past maintenance operation history. Of information processing devices that canMaintenance control technologyIs to provide.
[0016]
  Another object of the present invention is to provide an information processing apparatus capable of causing maintenance personnel to perform accurate maintenance operations corresponding to various execution states of the information processing apparatus to be maintained.Maintenance control technologyIs to provide.
[0017]
  Another object of the present invention is to provide an information processing apparatus capable of realizing an accurate maintenance operation by a maintenance staff regardless of the skill level of the maintenance staff.Maintenance control technologyIs to provide.
[0018]
[Means for Solving the Problems]
  A maintenance control method for an information processing apparatus according to the present invention is a maintenance control method in a second information processing apparatus that is connected to a first information processing apparatus and issues a maintenance command for the first information processing apparatus, Reading a maintenance item stored in a menu storage area in the second information processing apparatus by the second information processing apparatus and displaying the maintenance item on a display unit connected to the second information processing apparatus; A step of reading out a maintenance operation sequence corresponding to the maintenance item selected based on information input from the operator from a sequence storage unit and displaying it on the display unit, and an operator via the first information processing device The second information processing apparatus detects the maintenance process input by the second information processing apparatus, the maintenance process detected by the sequence determination unit in the detection step, and the read maintenance operation If the result of the determination by the sequence determination unit is the same as the result of determination by the sequence determination unit, the next sequence is read from the sequence storage unit and displayed on the display unit. Displaying a message on the display unit connected to the second information processing apparatus for guiding the user to perform a correct operation when not.is there.
  The present inventionThen, a navigation means is provided as a means for allowing maintenance personnel to perform maintenance operations with certainty and monitoring / determining whether an erroneous operation has been performed by the maintenance personnel. The navigation means stores the maintenance purpose / maintenance content as a menu and stores an operation sequence corresponding to each menu. When a menu is selected, the corresponding operation sequence is loaded and automatically executed every step or from the sequence. A sequencer for controlling a sequence for outputting contents to be operated as a guide is provided. In addition, application operation monitoring means for knowing the contents operated by maintenance personnel from each maintenance application, and sequence judgment means for comparing whether the operation was performed correctly with the previously loaded sequence are provided. In such a case, a means for outputting guidance is provided so as to guide maintenance personnel to the correct operation procedure.
[0019]
Further, when storing the previous operation sequence, identification information as to whether the operation is correct or incorrect is stored, so that it is possible to determine in which procedure the operation of the maintenance staff was performed. The recorded operation sequence is appropriately edited and reused by the navigation means.
[0020]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0021]
(Embodiment 1)
In the first embodiment, a case where maintenance of an information processing apparatus such as a disk array subsystem such as a disk array subsystem is performed using a personal computer is taken as an example. explain. In particular, in the case of a disk array subsystem, it is often used without interruption in conjunction with a host machine. Maintenance work under such usage conditions may be performed while the disk array subsystem is operating. In this case, maintenance work must be carried out with certainty, and if the disk array subsystem is a device that performs sophisticated and complicated control, maintenance personnel are required to have advanced maintenance technology. There are various kinds of maintenance work, such as exchanging some disk devices or exchanging microprograms for controlling the devices, and the level of difficulty varies depending on the contents. However, the skill of the maintenance staff is not always high and constant, and there are cases where the maintenance work does not proceed depending on a minor operation error or depending on the operation status. Therefore, the maintenance staff needs a skill that can immediately cope with the situation that occurs during the maintenance work. This is related to whether such a situation has been experienced once. In other words, past experience, so-called know-how, is a necessary requirement for maintenance technology. It is important how to utilize this experience for other maintenance personnel.
[0022]
In the first embodiment, when performing maintenance of the disk array subsystem in particular, it is possible to accumulate and reuse exemplary maintenance operations by experienced maintenance personnel and past maintenance operation experiences. An example of a technique for accurately guiding maintenance operations by maintenance personnel will be described.
[0023]
  FIG. 1 shows an information processing apparatus according to the first embodiment of the present invention.Maintenance control methodFIG. 2 is a conceptual diagram illustrating an example of a system configuration for realizing the above. FIG. 2 illustrates the information processing apparatus according to the present embodiment.Maintenance control method1 is a conceptual diagram showing an example of a configuration of a magnetic disk subsystem to which is applied.
[0024]
First, as illustrated in FIG. 2, the magnetic disk subsystem according to the first embodiment is connected to a disk controller 101 connected to an upper central processing unit 104 and its subordinates, for example, a disk array. Are composed of a plurality of disk devices 108 (Disk devices).
[0025]
The disk controller 101 includes a plurality of host I / F controllers 105 for directly connecting and controlling the central processing unit 104 and a disk I / F controller 106 (Disk I / F) for controlling the disk device 108. A common bus 103 for connecting these I / F control units and a shared memory 107 (shared memory) for sharing control information are configured.
[0026]
In the case of the first embodiment, for the purpose of maintenance of the disk control apparatus 101, a service processor 102 (Service Processor: hereinafter referred to as SVP) connected to the common bus 103 is provided. This SVP 102 is a hardware dedicated to maintenance, a central processing unit equipped with a microprocessor, main memory, common bus, etc., an external input / output device such as a CRT display, a keyboard, a mouse, etc., and a program and data for storing it. A personal computer comprising an external storage device is used.
[0027]
That is, as illustrated in FIG. 1, the SVP 102 according to the first embodiment displays a CRT display 131 that displays desired information on the common bus 130 and presents it to the maintenance staff. A keyboard 133 and a mouse 132 for inputting information, a microprocessor (not shown) that performs overall control, a main memory (not shown) that stores execution programs and data of the microprocessor, and an external storage device such as a hard disk device (not shown) It is a connected configuration. Furthermore, in the first embodiment, a medium for recording / reproducing information to / from the portable recording medium 135 loaded with a portable recording medium 135 such as a floppy disk, CD-ROM, optical disk, magneto-optical disk, etc. A drive 134 is connected to the common bus 130.
[0028]
In the case of the first embodiment, the main memory (not shown) is loaded with control programs such as a navigator 110 and an application 120 for causing a maintenance person to perform an accurate maintenance operation as will be described later. This is executed by a microprocessor (not shown). The navigator 110 and the application 120 that are recorded on the portable recording medium 135 are mounted on the external storage device of the SVP 102 via the medium drive 134 as necessary, and at any occasion such as when the power is turned on. It is loaded into the main memory and executed by the microprocessor. Alternatively, the data is loaded from the portable recording medium 135 via the medium drive 134 to the main memory at an arbitrary timing such as power-on, and is executed by the microprocessor.
[0029]
In the first embodiment, an example of a method for storing past know-how as an operation sequence and guiding the operation to the maintenance staff based on this sequence will be described.
[0030]
The application 120 is a program for maintaining the disk control apparatus 101. The application 120 includes a main process 122 for performing maintenance, a user interface 121 that inputs and outputs maintenance personnel, and an I / F unit 123 that performs communication with other control units in the disk control apparatus 101. The maintenance staff directly inputs from the mouse 132 or the keyboard 133 according to the contents of maintenance to execute the application 120, confirms the output from the application 120 on the CRT display 131, and proceeds with the operation. There are not only one type of application 120, but a plurality of applications 120 depending on the contents of maintenance. In FIG. 1, only one type is illustrated as an example.
[0031]
On the other hand, the navigator 110 that is provided in the SVP 102 together with the application 120 and guides the operation of maintenance personnel includes a sequence storage 114 for storing operation procedures as past know-how. The maintenance staff activates the navigator 110 first when performing the maintenance operation. The navigator 110 first activates the sequence selection 111 and outputs a desired menu from the menu 112 storing the maintenance items to the CRT display 131.
[0032]
FIG. 3 is a conceptual diagram showing an example of the storage structure of the menu 112 in the first embodiment. The menu has a hierarchical structure and expands from the top menu to detailed menus.
[0033]
FIG. 4 is a conceptual diagram showing an example of the storage format of the menu contents in the first embodiment. The menu storage format can be defined for each menu item. Each menu has a Menu Pointer for identifying itself so that a link relationship with each menu can be attached. In Menu Name, a name for clearly indicating to the maintenance staff when outputting to the CRT display 131 is defined. Next Menu Pointer defines a Menu Pointer for other menus at the same level. For example, in the case of the definition of the “Install” menu in FIG. 3, the “Point” of “Change” is indicated as another menu at the same level. In the case of “Error Recovery”, which is the same level as “Install”, since there is no menu item at the same level, the value 0xFFFF is defined, and it is defined that there is no subsequent menu item. For example, in the case of the “Error Recovery” menu, the Detail Pointer defines a Menu Pointer of a menu called “Recover Communication Error” at the detail level. If there is no detail level menu, the value 0xFFFF is defined as described above. With such a data format, the hierarchical structure can be defined flexibly.
[0034]
From the menu output in the sequence selection 111 in FIG. 2, the maintenance person determines the maintenance content from the mouse 132 or the keyboard 133. When the menu is determined, the sequence selection 111 informs the sequencer 113 which menu has been selected. The sequencer 113 refers to a correspondence table as illustrated in FIG. 5 in order to determine an operation sequence corresponding to the determined menu.
[0035]
The correspondence table illustrated in FIG. 5 includes a Menu ID column that defines the Menu Pointer described in FIG. 4 and a sequence ID column for identifying an operation sequence corresponding to each Menu ID. The sequencer refers to the Menu ID column of the correspondence table in FIG. 5 and determines the ID of the corresponding sequence.
[0036]
The sequencer 113 loads a sequence having the determined sequence ID from the sequence storage 114.
[0037]
6 and 7 are explanatory diagrams illustrating a sequence example stored in the sequence storage 114 in the first embodiment. As illustrated in FIGS. 6 and 7, the sequence is a source program described in a text format. The sequence is mainly composed of two types of description blocks: Property and Script. Property defines sequence attributes. Here, the date defining the sequence, the name of the defined operator, and the Result attribute indicating whether an operation error is caused when the sequence is executed are defined. This is defined based on the results of the person defining the sequence himself. The Script part describes the actual operation procedure. In the first embodiment, the description grammar is not particularly referred to. However, the description supports a hierarchical structure, and a control structure for sequentially processing one process in at least one line, a control structure by conditional branching, And support the control structure to execute the process repeatedly. The sequencer 113 interprets this script.
[0038]
A value following the first keyword “Sequence” (“Ox2012” in the case of FIG. 6) is an identifier of the sequence, and is the same as the sequence ID described in the correspondence table of FIG.
[0039]
The sequencer 113 reads the corresponding sequence from the correspondence table shown in FIG. 5, and analyzes the syntax line by line to grasp the contents to be executed. At this time, the contents to be operated by the maintenance staff are analyzed from the contents of the script for one line to be processed and requested to be output to the guide output 115. The guide output 115 is output as a message to the CRT display 131 and guides maintenance personnel.
[0040]
The maintenance staff operates the corresponding application 120 according to the guidance output by the guide output 115. The application 120 executes the main process 122 corresponding to the user interface 121 interpreting the contents operated by the maintenance personnel. If necessary, the I / F unit 123 in the application 120 performs processing in order to communicate with another control unit of the disk control apparatus 101. At this time, in order to grasp the operation content of the maintenance staff and the processing content in the main processing, it is output to the AP operation history 124 and recorded.
[0041]
The AP operation monitoring 117 of the navigator 110 continuously monitors the AP operation history 124, and refers to the contents operated by the maintenance staff on the application 120, the main process 122 of the application 120, and the process contents of the I / F unit 123. . The AP operation monitor 117 interprets the referred content, and notifies the sequence determination 116 of what operation has been performed. The sequence determination 116 determines whether or not the maintenance staff has correctly operated based on the content guided by the guide output 115. If it can be confirmed that the process is correctly performed, the sequencer 113 is instructed to execute the next sequence. If it is determined that the operation has not been performed correctly, the sequencer 113 is instructed that the operation is incorrect. The sequencer 113 outputs a message for guiding maintenance personnel to perform a correct operation through the guide output 115.
[0042]
For example, in FIG. 6, the application “DIAG” is started, “Communication Check” is selected from the menu and automatically executed, and the manual page to be referred to by the maintenance staff is determined according to the Message ID returned from the application 120. A sequence for performing the guidance operation is defined.
[0043]
Depending on the sequence, it is necessary to know the state of the disk controller 101 and to guide the operation of maintenance personnel. In this case, an instruction for referring to the state of the disk control apparatus 101 is entered on the script of the sequence, and the process is defined to branch depending on the state. When the sequencer 113 needs to grasp the status of the disk control device 101, the device status monitor 118 directly communicates with other control units via the common bus 103 of the disk control device 101, and refers to the shared memory 107, for example. To collect information. The result and the operation of the operator are combined, and it is determined in sequence determination 116 whether the correct operation has been performed.
[0044]
For example, in FIG. 7, an application “INFORMATION” is started, “Communication Status” is selected from the menu “Status” and automatically executed, the configuration information of the disk controller 101 is checked, and then the application returns. Depending on the type of the received Message ID and the operation statuses of the plurality of host I / F control units 105 to 105 and the disk I / F control unit 106, etc. An example of performing an operation of presenting and guiding is shown.
[0045]
In this way, by defining a sequence for guiding a correct operation in advance and guiding the operation by the navigator 110, it is possible to cause maintenance personnel to correctly handle an erroneous operation or error recovery.
[0046]
Next, an example of processing of the navigator 110 in the maintenance staff guidance processing as described above will be described with reference to the flowchart of FIG.
[0047]
In step 701, first, a menu item is read from the menu 112 and output to the CRT display 131. In step 702, menu items for maintenance personnel are accepted. In step 703, it is determined whether a more detailed menu is defined for the selected menu. If there is, the detailed menu is read again in step 701. When the item selected by the maintenance staff is determined from the above, the sequence for the menu selected in step 702 is specified from the sequence storage 114 in step 704. In step 705, the script is read. Of the scripts read in step 706, the script to be processed next is analyzed. In step 707, it is determined whether all the scripts have been completed. In step 708, it is determined whether the previously analyzed script should refer to the state of the disk control apparatus 101. If necessary, apparatus status information is acquired in step 720, and as a result, it is determined in step 721 whether the sequence needs to be changed. If not necessary, the process returns to step 705. If it is determined that there is a need to change, the sequence to be changed is specified in step 723, and the process returns to step 705.
[0048]
In step 709, the contents analyzed in step 706 are presented to the maintenance staff via the CRT display 131 for guidance. In step 710, it is monitored whether the maintenance staff has operated according to the guide. If it is necessary to change the sequence of the interpreted sequence, the determination is made in step 711, the changed sequence is specified in step 714, and the process returns to step 705. In step 712, the operation of the maintenance staff is checked to determine whether or not the operation matches the guided content. If they match, the process returns to step 705, but if they do not match, a recommendation message is output in step 713 so as to perform the correct operation.
[0049]
In addition, the sequencer 113 adds a function that can automatically execute the operation of the application 120 from the read sequence. If maintenance personnel need to be judged or if maintenance personnel need to operate, the fact can be clearly indicated in the script, and whether the sequencer 113 guides the CRT display 131 to guide or automatically executes it. Judge and process. If the function is added in this manner, not only the items for determining whether or not the operation of the maintenance engineer is correct are reduced, but also the opportunity for the maintenance engineer to perform an erroneous operation can be reduced.
[0050]
As described above, in the first embodiment, a message is appropriately output or necessary while judging whether there is an error in the maintenance operation by taking into account the status of the disk controller 101 in the actual operation of the maintenance staff. By executing a process such as automatically executing a script, maintenance of the disk controller 101 having a relatively complicated multiprocessor configuration can be accurately performed without causing a fatal erroneous operation.
[0051]
(Embodiment 2)
In the first embodiment described above, the method of guiding maintenance personnel based on the already defined script has been described. Next, a second embodiment in which a sequence is defined as a script based on the contents operated by maintenance personnel will be described. This second embodiment is a method of analyzing contents operated by, for example, a maintenance staff having a high level of maintenance skill, a designer of the manufacturer of the disk control apparatus 101, and the like, and defining the contents as a script in the sequence storage 114. . This method makes it possible to easily and accurately transfer the know-how of maintenance personnel with advanced skills to other maintenance personnel.
[0052]
  FIG. 9 shows the information processing apparatus according to the second embodiment.Maintenance control methodIt is a conceptual diagram which shows an example of a structure of SVP102 for implement | achieving. The difference from the configuration of FIG. 1 of the first embodiment described above is that a navigation analysis 800 for analyzing and scripting the maintenance operation, and a device state 805 for storing the results monitored by the device state monitor 118. It is a point equipped with.
[0053]
The navigation analysis 800 includes an AP operation history analysis 802. The AP operation history analysis 802 stores the contents of the AP operation history 124 for storing the contents already operated by the maintenance staff, and the disk referred to by the apparatus status monitor 118. Scripting (script generation) is executed based on the contents of the device state 805 that stores the device state information of the control device 101. Based on this result, whether or not the same script is already defined in the sequence storage 114 is searched by the sequence search 804. In this search, not only whether or not they are exactly the same, but also if the sequence is identical, that sequence is also targeted. Since the same procedure is already stored, it is not necessary to define the sequence in the sequence storage 114. However, in other cases, the sequence analyzed by the AP operation history analysis 802 is transferred to the sequence editing 803 so that the maintenance staff can directly edit the sequence. Since the sequence defined in the sequence storage 114 is in the text format as illustrated in FIGS. 6 and 7, it can be easily edited. Further, it is directly defined in the sequence property whether the operation already recorded in the AP operation history 124 is a correct procedure or an incorrect procedure as a result. In this way, even if another maintenance person operates in the wrong procedure, it is possible to guide correctly.
[0054]
The device status 805 not only stores the latest status information of the disk control device 101 but also stores it in time series corresponding to the referenced time, which is useful for future failure analysis.
[0055]
In addition, considering the navigator 110 as one application and performing guide guidance and operation monitoring of maintenance personnel operations, a user interface 831 is provided in the navigator 110 in FIG.
[0056]
As described above, according to the second embodiment, past maintenance operation history information by skilled maintenance personnel, and exemplary maintenance operations by a manufacturer designer or engineer familiar with the disk control device 101 are performed. Recorded and stored as a script, and reused as a maintenance operation guide when any maintenance staff performs maintenance operations, for example, maintenance staff with less experience can perform accurate maintenance operations. There is an effect that can be done.
[0057]
    (Embodiment 3)
  FIG. 10 shows an information processing apparatus according to the third embodiment of the invention.Maintenance control methodIt is a conceptual diagram which shows an example of a structure of SVP102 for implement | achieving.
[0058]
In the third embodiment, a case will be described in which a center test apparatus 901 is installed at a remote location different from the disk control apparatus 101, and the disk control apparatus 101 and the center test apparatus 901 are connected via a network.
[0059]
The center test apparatus 901 includes the SVP 102 and has almost the same configuration as that of the disk control apparatus 101 installed on the user side. Etc. can be performed within the manufacturer.
[0060]
When maintenance work is performed on the disk controller 101, an unexpected failure may occur. To investigate the cause and perform recovery, all maintenance personnel who directly operate the disk controller 101 can perform it. Not necessarily. In this case, dump information and log information of the disk control apparatus 101 are collected and distributed to another maintenance staff called a maintenance center or an engineer of the manufacturer that manufactured the disk control apparatus 101 to investigate the cause. At this time, it is important to find out what kind of maintenance operation the maintenance person has performed in order to investigate the cause. Therefore, in the configuration example of FIG. 10, the center communication 905 is provided in the SVP 102, and means for transferring the AP operation history 124 operated by the maintenance staff to the maintenance center or manufacturer is provided. The communication method is performed via the general public network 904 using a communication medium called a communication modem in FIG. A communication modem 903 is also provided on the center side, and a site communication 902 is provided in the center test apparatus 901 to transfer information with the center communication 905 of the disk control apparatus 101. As a communication method, the method illustrated in FIG. 10 is generally used, but various means such as a network means called a computer network such as Ethernet or a digital communication network can be adopted. The center communication 905 and the site communication 902 can be set so as to cope with various changes in the network means.
[0061]
The AP operation history 124 and the device status 805 are obtained from the disk control device 101 in which the failure has occurred, and it is determined by the navigation analysis 800 and the navigator 110 provided in the center test device 901 whether the maintenance engineer operation was correct. The analysis is performed by a maintenance engineer who requires another advanced maintenance technology waiting at the maintenance center, or by the designer of the manufacturer, and pursues the correct recovery procedure. As a result of the analysis, the correct recovery procedure is stored in the sequence storage 114, and when the sequence is new, a new menu is registered in the menu 112, and the maintenance person can select the menu to guide the correct recovery procedure. Like that. In this way, the sequence storage 114 and menu 112 defined by the maintenance center or manufacturer are transferred to the failed disk controller 101 by means of the site communication 902 means. As a result, maintenance personnel who directly maintain the disk control apparatus 101 can recover from the failure by a correct recovery procedure.
[0062]
In addition, if the AP operation history 124 operated at the maintenance center or the manufacturer's evaluation center is defined as needed using the navigation analysis 800 and transferred to the navigator 110 of each disk controller by the network means, any kind of information can be obtained. Even if a failure occurs, if the failure has already been experienced at the maintenance center or manufacturer's evaluation center, the sequence is automatically changed and the correct recovery procedure is communicated to the maintenance staff on the spot for guidance. Is possible.
[0063]
As described above according to each embodiment of the present invention, when performing complex control, for example, when maintaining a magnetic disk subsystem such as a disk array subsystem, by guiding correct maintenance operations to maintenance personnel, Not only can it prevent failures due to operational mistakes, but also convey the operating procedures and experience of system engineers familiar with the system and skilled maintenance personnel to general maintenance personnel to accurately guide maintenance operations. It becomes possible to do. Further, by storing and reusing the know-how of skilled maintenance personnel as a maintenance operation in this way, more advanced maintenance can be performed.
[0064]
Although the invention made by the present inventor has been specifically described based on the embodiments, the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the invention. Needless to say.
[0065]
【The invention's effect】
  Information processing apparatus of the present inventionMaintenance control methodAccording to the present invention, it is possible to reliably prevent erroneous maintenance operations by maintenance personnel by accurately associating the maintenance purpose with the maintenance operation sequence.
[0066]
  The information processing apparatus of the present inventionMaintenance control methodAccordingly, it is possible to accurately notify the maintenance staff of the erroneous maintenance operation and to reliably prevent the erroneous maintenance operation.
[0067]
  Further, the information processing apparatus of the present inventionMaintenance control methodAccording to the above, it is possible to efficiently prevent erroneous maintenance operations by maintenance personnel by reusing model maintenance operation histories by skilled maintenance personnel and engineers and past maintenance operation histories. The effect of is obtained.
[0068]
  Further, the information processing apparatus of the present inventionMaintenance control methodAccording to this, it is possible to obtain an effect that the maintenance staff can execute an accurate maintenance operation corresponding to various execution states of the information processing apparatus to be maintained.
[0069]
  Further, the information processing apparatus of the present inventionMaintenance control methodAccording to the above, there is an effect that an accurate maintenance operation by the maintenance staff can be realized regardless of the skill level of the maintenance staff.
[Brief description of the drawings]
FIG. 1 shows an information processing apparatus according to a first embodiment of the invention.Maintenance control methodIt is a conceptual diagram which shows an example of the system configuration | structure for implement | achieving.
FIG. 2 is a conceptual diagram showing an example of a configuration of a magnetic disk subsystem to which a maintenance operation guidance method for an information processing apparatus according to a first embodiment of this invention is applied.
FIG. 3 is a conceptual diagram showing an example of a menu storage structure according to the first embodiment of the present invention.
FIG. 4 is a conceptual diagram showing an example of a storage format for menu contents according to the first embodiment of the present invention.
FIG. 5 is a conceptual diagram showing an example of a correspondence table referred to by the sequencer in the first embodiment of the present invention.
FIG. 6 is an explanatory diagram illustrating an example of a sequence stored in a sequence storage according to the first embodiment of this invention.
FIG. 7 is an explanatory diagram showing an example of another sequence according to the first embodiment of the present invention.
FIG. 8 is a flowchart illustrating an example of processing of a navigator according to the first embodiment of this invention.
FIG. 9 shows an information processing apparatus according to a second embodiment of the invention.Maintenance control methodIt is a conceptual diagram which shows an example of a structure of SVP for implement | achieving.
FIG. 10 shows an information processing apparatus according to a third embodiment of the invention.Maintenance control methodIt is a conceptual diagram which shows an example of a structure of SVP for implement | achieving.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 101 ... Disk control apparatus, 102 ... Service processor (computer apparatus), 103 ... Common bus, 104 ... Central processing unit, 105 ... Host I / F control part, 106 ... Disk I / F control part, 107 ... Shared memory, 108 ... Disk device, 110 ... Navigator, 111 ... Sequence selection, 112 ... Menu, 113 ... Sequencer, 114 ... Sequence storage, 115 ... Guide output, 116 ... Sequence judgment, 117 ... AP operation monitoring, 118 ... Device status monitoring, 120 ... Application 121, user interface 122, main processing 123, I / F section 124, history of AP operation 124, history of AP operation 130, common bus 131, CRT display 132, mouse 133, keyboard 134 ... Media drive, 135 ... Portability Recording medium (information recording medium), 800 ... navigation analysis, 802 ... AP operation history analysis, 803 ... sequence edit, 804 ... sequence search, 805 ... device status, 831 ... user interface, 901 ... center test device, 902 ... site Communication, 903: Communication modem, 904: General public network, 905: Center communication.

Claims (3)

第1の情報処理装置に接続され、前記第1の情報処理装置に対する保守命令を発行する第2の情報処理装置における保守制御方法であって、
前記第2の情報処理装置が前記第2の情報処理装置内のメニュー記憶領域に記憶した保守項目を読み出して前記第2の情報処理装置に接続される表示部に前記保守項目を表示するステップと、操作者から入力される情報に基づいて選択された前記保守項目に対応する保守操作シーケンスをシーケンス記憶部から読み出して前記表示部に表示するステップと、前記第1の情報処理装置を介して操作者が入力した保守処理を、前記第2の情報処理装置が検出するステップと、シーケンス判定部が前記検出ステップで検出された保守処理と、前記読み出した保守操作シーケンスとが一致しているかどうか判定するステップと、前記シーケンス判定部による判定の結果、一致している場合に、次のシーケンスをシーケンス記憶部から読み出しをして前記表示部に表示し、一致していない場合に正しい操作を行うようガイドするためのメッセージを前記表示部に表示するステップと、からなる、情報処理装置の保守制御方法。
A maintenance control method in a second information processing apparatus that is connected to a first information processing apparatus and issues a maintenance command for the first information processing apparatus,
Reading the maintenance items stored in the menu storage area in the second information processing apparatus by the second information processing apparatus and displaying the maintenance items on a display unit connected to the second information processing apparatus; A step of reading out a maintenance operation sequence corresponding to the maintenance item selected based on information input from an operator from a sequence storage unit and displaying the sequence on the display unit, and an operation via the first information processing device A step in which the second information processing apparatus detects the maintenance process input by the user, and a sequence determination unit determines whether the maintenance process detected in the detection step matches the read maintenance operation sequence. If the result of determination by the sequence determination unit is the same, the next sequence is read from the sequence storage unit and the previous sequence is read. It displayed on the display unit, and displaying a message for guiding to perform a correct operation when they do not coincide on the display unit, consisting of the maintenance method of controlling an information processing apparatus.
請求項1記載の情報処理装置の保守制御方法であって、さらに、前記第1の情報処理装置の状態によって保守処理を分岐させる場合には、前記保守操作を実行する前に前記第1の情報処理装置に関する情報を収集するステップを有することを特徴とする情報処理装置の保守制御方法。  The maintenance control method for an information processing apparatus according to claim 1, wherein when the maintenance process is branched depending on a state of the first information processing apparatus, the first information is executed before the maintenance operation is executed. A maintenance control method for an information processing apparatus, comprising a step of collecting information related to a processing apparatus. 請求項2記載の情報処理装置の保守制御方法であって、さらに、前記保守処理、および前記判定の結果を前記保守操作シーケンスに記録し、必要な場合に前記保守操作シーケンスの編集をすることを特徴とする情報処理装置の保守制御方法。  3. The maintenance control method for an information processing apparatus according to claim 2, further comprising: recording the maintenance process and the result of the determination in the maintenance operation sequence, and editing the maintenance operation sequence when necessary. A maintenance control method for an information processing apparatus.
JP00357797A 1997-01-13 1997-01-13 Maintenance control method for information processing apparatus Expired - Fee Related JP3645388B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00357797A JP3645388B2 (en) 1997-01-13 1997-01-13 Maintenance control method for information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00357797A JP3645388B2 (en) 1997-01-13 1997-01-13 Maintenance control method for information processing apparatus

Publications (2)

Publication Number Publication Date
JPH10198454A JPH10198454A (en) 1998-07-31
JP3645388B2 true JP3645388B2 (en) 2005-05-11

Family

ID=11561317

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00357797A Expired - Fee Related JP3645388B2 (en) 1997-01-13 1997-01-13 Maintenance control method for information processing apparatus

Country Status (1)

Country Link
JP (1) JP3645388B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5172280B2 (en) * 2007-11-01 2013-03-27 株式会社日立システムズ Automatic maintenance device
JP5347335B2 (en) * 2008-05-30 2013-11-20 富士通株式会社 Control program, control device, and control method
JP5513926B2 (en) * 2010-02-25 2014-06-04 株式会社日立システムズ Maintenance work support system
JP5912695B2 (en) * 2012-03-13 2016-04-27 株式会社日立システムズ Operational work support system and method
JP6140530B2 (en) * 2013-05-28 2017-05-31 株式会社エヌ・ティ・ティ・データ Operation support apparatus, operation support method, and program

Also Published As

Publication number Publication date
JPH10198454A (en) 1998-07-31

Similar Documents

Publication Publication Date Title
JP2547069B2 (en) Failure diagnosis method
JPH05346875A (en) Automation testing system for computer application software
JP2021043592A (en) Information processing system
JP4758471B2 (en) Maintenance guidance display device, maintenance guidance display method, maintenance guidance display program
JP3645388B2 (en) Maintenance control method for information processing apparatus
JPH08227368A (en) Job reexecution system
JPH07334571A (en) Work progress management device
JP2001034509A (en) Fault recovering method of information processor
JP2000358029A (en) Automatic fault diagnostic network system, and automatic fault diagnostic method for network
JPH10133914A (en) Computer system and device input/output simulator
JPH10240705A (en) Fault integrated managing device
JPH09282351A (en) Cad system
JP2008198055A (en) Disk array failure processing system, device, method, and program
JPH11285847A (en) Welding data control device and recording medium to which welding data control program is recorded
WO2023047806A1 (en) Information processing device and automatic analysis system
JP2637774B2 (en) Operation expert system
JPH01205245A (en) Automatic trace system for peripheral system and line system devices for electronic computer
JP2006163762A (en) System testing device directed to plant monitoring and control apparatus
JPH11120028A (en) Program transporting support system
CA2046701A1 (en) Flexible service network for computer systems
Dent Diagnostic engineering
CN115390886A (en) Service upgrading method and system based on big data vulnerability analysis
JPH01256896A (en) Process state display device
CN116489001A (en) Switch fault diagnosis and recovery method and device, switch and storage medium
JP5128876B2 (en) Backup system

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050125

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050203

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080210

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110210

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120210

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120210

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130210

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130210

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees