JP3624657B2 - 管理計算機又は計算機システム - Google Patents

管理計算機又は計算機システム Download PDF

Info

Publication number
JP3624657B2
JP3624657B2 JP30606797A JP30606797A JP3624657B2 JP 3624657 B2 JP3624657 B2 JP 3624657B2 JP 30606797 A JP30606797 A JP 30606797A JP 30606797 A JP30606797 A JP 30606797A JP 3624657 B2 JP3624657 B2 JP 3624657B2
Authority
JP
Japan
Prior art keywords
computer
management
execution
information
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30606797A
Other languages
English (en)
Other versions
JPH11143742A (ja
Inventor
俊明 平田
明裕 浦野
修司 藤野
栄二 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP30606797A priority Critical patent/JP3624657B2/ja
Priority to EP98120838A priority patent/EP0915423B1/en
Priority to DE69841935T priority patent/DE69841935D1/de
Priority to US09/188,263 priority patent/US6170010B1/en
Publication of JPH11143742A publication Critical patent/JPH11143742A/ja
Priority to US09/721,616 priority patent/US7155498B1/en
Application granted granted Critical
Publication of JP3624657B2 publication Critical patent/JP3624657B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/328Computer systems status display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/046Network management architectures or arrangements comprising network management agents or mobile agents therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Multi Processors (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、複数の計算機とこれらの計算機を管理する管理マネージャ計算機とがネットワークで接続された計算機運用管理システムに関する。
【0002】
【従来の技術】
従来の計算機システムでは日経コンピュータ1996.1.22,p115−p117および日経オープンシステム1997.6(no.51),p234−p239では、電源の投入および停止の制御、ジョブの実行制御、印刷制御、などの業務運用処理を実行する機能がそれぞれ独立のプログラムとして提供されていることが示されている。また、計算機や通信ネットワークの状態を管理する機能は上記業務運用の実行を制御、監視する製品とは独立なプログラムとして提供されていることが示されている。
【0003】
従って、これらは、各計算機ごとまたは各計算機で実行される業務運用処理ごとに該業務運用処理の実行予定の定義を確認するための画面、および、各業務運用処理の実行結果を確認するための画面が構成されている。さらに、計算機や通信ネットワークの状態を確認するための画面は前記業務運用処理の管理画面とは別の画面で構成されている。
【0004】
【発明が解決しようとする課題】
前記従来技術では、比較的小規模なネットワークで必要な運用機能のみを利用する場合には適しているが、複数の運用処理を組み合わせて実行することの多い大規模な計算機システムにおいては、業務運用処理ごとさらに計算機や通信ネットワークの管理を個別に行う必要があることから、上述した従来技術を適用すると、計算機システムとしてのトータルな運用管理が困難となる。
【0005】
さらに、従来技術では、各業務処理運用および計算機や通信ネットワークの管理が独立に行われているため、業務処理の問題を計算機としての問題と対応付けて解決することが困難である。
【0006】
しかしながら、すべての運用管理処理を管理マネージャ計算機で行うようにする場合には、管理マネージャ計算機と各計算機との間で通信を行う必要が生じるので、ネットワークトラヒックについても考慮しなければならなくなる。
【0007】
そこで、本発明の目的は、複数の計算機が接続された計算機システムにおいて、これらの計算機を管理する管理マネージャ計算機が、各計算機で実行される業務運用を一元的に管理するとともに、業務運用と計算機自身の管理を相互に関連付けて実施できるようにし、業務処理における問題を計算機自身や通信ネットワークの問題と関連付けて容易に解決できる方法及びプログラム、さらにはそれを用いた計算機又はシステムを提供することにあり、さらに、このとき、ネットワークに余計な負荷をかけないようにする方法及びプログラム、さらにはそれを用いた計算機又はシステムを提供することにある。
【0008】
【課題を解決するための手段】
上記目的を達成するために、本発明は、第一の態様として、
複数の計算機とこれらの計算機を管理する管理マネージャ計算機とがネットワークで接続された計算機運用管理システムであって、
各計算機または各計算機間の連携で実行する計算機の電源の投入および停止、業務の実行、実行結果の印刷、特定の事象が発生したときに指定された動作を行う、という一連の運用を一元的に管理する手段と、
計算機上で実行する各業務をシンボルで、業務の実行順序をシンボル間の方向付きのリンクで、さらに業務の実行状態をシンボルの色で表現する業務監視手段と、
計算機と計算機間の接続関係をシンボルとシンボル間のリンクで、さらに計算機の稼動状態をシンボルの色で表現する計算機監視手段と、
計算機と計算機上で実行する業務を関連付け、該業務監視手段で表示する監視画面と計算機監視手段で表示する監視画面を相互に切り替えて表示するとともに相互に関連する業務と計算機の関連を明示する手段と、
計算機監視手段および業務監視手段におけるそれぞれの監視画面上のシンボルの色を、計算機監視手段の計算機シンボルは計算機内の業務の状態に応じて複数の色で表示する手段と、
業務監視手段の業務シンボルは業務の状態に応じて複数の色で表示する手段を有する計算機運用管理システムを提供している。
【0009】
また、本発明は、第二の態様として、
複数の計算機とこれらの計算機を管理する管理マネージャ計算機とがネットワークで接続された計算機運用管理システムであって、
業務や計算機の状態の変化をマネージャ計算機上にイベントとして通知されたメッセージを表示する手段と、
イベントの重要度に応じてメッセージの表示色を変える手段と、
管理マネージャ計算機は特定のイベントを受信すると、あらかじめ指定された計算機に対してあらかじめ指定された業務の動作実行を指示する手段と、
計算機システムまたは業務プログラムの原因によって業務が正常に終了しなかったとき、計算機監視手段で管理している各計算機の状態を参照して、正常に動作している計算機に対して、再実行可能な時点にさかのぼって業務の再実行指示を行う手段と、
管理マネージャ計算機は定期的に業務実行の対象となる各計算機の負荷状況を収集する手段と、
業務の実行予定時刻に対する実行結果時刻を監視する手段と、
これが予め指定された時間の範囲を超えたとき、切り替え可能な業務の実行ポイントで当該計算機上での実行を打ち切り、予め決められた負荷以下の計算機に対して次の実行ポイントから業務の実行を指示する手段を有する計算機運用管理システムを提供する。
【0010】
【発明の実施の形態】
以下、本発明の形態について図面を参照して説明する。
【0011】
図2に本実施形態に係る計算機システムの全体構成を示す。図中、201は管理マネージャ計算機、202〜207は管理マネージャ計算機の管理対象となる管理対象計算機、208〜213はネットワークである。
【0012】
本実施形態に係る計算機システムは、管理対象計算機(202〜207)で実行されるべき業務運用処理の実行予定が定義された運用定義情報、および、管理対象計算機(202〜207)で実行された運用処理についてその実行状態や実行結果を、計算機自身やネットワークの状態とあわせて、管理マネージャ計算機が一括して管理することを可能とするものである。
【0013】
図1に、管理マネージャ計算機による管理対象計算機(202〜207)の一括管理を実現するためのシステム構成を示す。図1では図2の管理マネージャ計算機(201)と1台の管理対象計算機(201)についてのみ示しているが、他の管理対象計算機(203〜207)も管理対象計算機(202)と同様である。
【0014】
図1に示すように、管理マネージャ計算機(201)は、管理アプリケーション部(102)と、データベース(105)、管理情報制御部(108)とを備えている。
【0015】
管理アプリケーション部(102)は、管理対象計算機(202〜207)の業務の実行予定や現在の実行状態やイベントを表示、管理する統合管理画面表示部(103)と管理対象計算機から受信した特定のイベントに対して、予め指定された処理を実行するイベント・アクション制御部(104)とを有している。管理情報制御部(108)は管理対象計算機(202〜207)から業務定義情報やイベント情報を収集する管理情報収集部(106)および管理対象計算機(202〜207)に対して特定の動作を指示するアクション実行指示部(107)とを有している。管理情報収集部は管理対象計算機から収集した管理情報は統合管理画面表示部に通知するとともに必要に応じてデータベース(105)に格納する。
【0016】
また、管理対象計算機(202〜207)は図3に示す計算機のハードウエアやプロセスなどの基本的な制御を実行する計算機基本制御部(117)、ジョブ実行制御部(116)、電源制御部(115)、印刷実行制御部(114)、等の運用定義情報によって定義された運用処理を実行する運用実行部分と、統合管理エージェント(113)とを備えて構成されている。
【0017】
統合管理エージェント(113)は、各運用実行部分か現在の業務定義情報やイベント情報を収集する業務定義情報・イベント情報収集部(110)、計算機基本制御部(117)からCPUやメモリなどのハードウエア資源やプロセスなどのソフトウエア資源の利用状況に関する情報を収集する計算機情報収集部(111)および管理マネージャ計算機から受信したアクション実行指示を運用実行部分に対して指示するアクション実行制御部(112)とを備えて構成されている。
【0018】
図3に管理マネージャ計算機(201)および管理対象計算機(202〜207)のハードウエア構成を示す。
【0019】
図3に示すように各計算機は、中央処理装置(302)と、主記憶装置(301)と、通信回線(305)やローカルエリアネットワーク(304)等のネットワークとの間のデータの入出力を制御するネットワーク制御装置(303)と、デイスク装置(306)およびその入出力を制御するデイスク制御装置(307)と、表示装置(308)およびその入出力を制御する表示制御装置(309)とを備えて構成されている。
【0020】
図1の構成ブロックのうち、データベース(105)はデイスク装置(307)上に実現され、その他の構成ブロックは、デイスク装置(307)に格納されているプログラムを中央処理装置(302)が主記憶装置(301)上にロードして実行することで実現される。なお、このプログラムは、例えば、CD−ROM等の記録媒体に記録され、図示していないドライバによって読みこまれて、デイスク装置(307)に格納されるようにすることができる。
【0021】
以下に、図1のシステム構成における管理情報の収集方法について述べる。
【0022】
管理対象計算機において定義されている業務運用定義情報はおよび業務の開始や終了、異常の発生などを通知するイベント情報は、管理マネージャ計算機から定期的もしくは画面への管理情報の表示等で必要となったタイミングで収集する方法、もしくは、管理対象計算機が適当なタイミング自発的に管理マネージャ計算機に通知する方法が考えられる。管理マネージャ計算機はこれらの情報を受信すると、データベースに格納するとともにリアルタイム性の高い情報については図4において、後述する方法で統合管理画面表示部に表示する。
【0023】
一方、計算機自身の構成情報については、管理対象とする計算機を管理マネージャ計算機において定義して、これらの計算機から計算機情報収集部(111)を介して詳細な情報を収集する方法や予め統合管理エージェントを管理対象計算機に組み込んでおき、このプログラムが組み込まれている計算機を管理マネージャ計算機がブロードキャスト等の方法によって探索し、これらの計算機から計算機情報収集部(111)を介して詳細な情報を収集する方法が考えられる。
【0024】
次に、管理マネージャ計算機(101)において、管理アプリケーション部(102)が有する統合管理画面表示部(103)が表示する統合管理画面の一例について図4を用いて説明する。
【0025】
管理マネージャ計算機(101)においては、上述したようにして、運用定義情報、イベント情報、ログ情報がデータベース(105)に格納されるので、運用管理者等はこれらの情報を活用して、計算機システムの運用状況を把握することが可能となる。すなわち、管理マネージャ計算機(101)においては、管理アプリケーション部(102)が有する統合管理画面表示部(103)は、運用管理者等から参照が要求された情報を、管理情報制御部(108)によって検索/参照し、検索/参照された情報を用いて統合管理画面を作成し、作成した統合管理画面を表示装置(308)に表示するので、運用管理者等は、表示装置(308)に表示された統合管理画面を見ることで、計算機システムの運用状況を把握することが可能となる。
【0026】
図4において、画面1(401)は「計算機A」上の「ジョブネットA」に関する統合管理画面であり、「計算機A」について、「電源投入(402)」、「ジョブネットA(403)の実行」、「実行結果の印刷(511)」という一連の運用処理が定義された運用定義情報を示している。なお、これらの運用処理(401〜404)は、アイコンとして表示されており、各アイコンの表示態様を変更(例えば、色の変更等)することで、「未実行」、「実行中」、「実行の正常終了」、「実行の異常終了」といった各種状態を表すようにすることができる。ここで、統合管理画面表示部(103)は、各アイコンの表示様態を変更する際に、対応する運用処理(401〜404)のその時点での最新のイベント情報を、管理情報収集部(106)によって収集するようにすることが好ましい。
【0027】
運用管理者等は、例えば、画面1(401)において、「ジョブネットA(403)」をマウスでダブルクリックすることで、画面1(401)から画面2(405)に遷移させることが可能である。
【0028】
図4において、画面2(405)は、「計算機A」上の「ジョブネットA」に関する詳細な統合管理画面であり、「ジョブネットA」について、「ジョブA1(407)」の実行が完了した後、「ジョブA21(408)」と「ジョブA22(406)」とを並列に実行し、これらの両方の実行が完了した時点で「ジョブA3(409)」を実行する旨が定義されている。なお、これらの運用処理(406〜409)は、アイコンとして表示されており、各アイコンの表示態様を変更(例えば、色の変更等)することで、「未実行」、「実行中」、「実行の正常終了」、「実行の異常終了」といった各種状態を表すようにすることができる。ここで、統合管理画面表示部(103)は、各アイコンの表示様態を変更する際に、対応する運用処理(406〜409)のその時点での最新のイベント情報を、管理情報収集部(106)によって収集するようにすることが好ましい。
【0029】
図4において、画面4(416)は、管理マネージャ計算機が管理する管理対象計算機のグループを確認するための統合管理画面であり、本例では、「グループA(415)」と「グループB(414)」が表示されている。各グループは、アイコンとして表示されており、運用管理者等は、例えば、画面4(416)において「グループA」をマウスでダブルクリックすることにより、画面4(416)から画面5(410)に遷移させることが可能である。
【0030】
図4において、画面5(410)は画面4におけるグループAに属する管理対象計算機を確認するための統合管理画面であり、本例では、3台の管理対象計算機(411〜413)が表示されている。これらの管理対象計算機は、アイコンとして表示されており、各アイコンの表示態様を変更(例えば、色の変更等)することで、「起動中」、「停止中」、「部分的に停止中」といった各種状態を表すようにすることができる。ここで、統合管理画面表示部(103)は、各アイコンの表示様態を変更する際に、対応する管理対象計算機(411〜413)のその時点での最新のイベント情報を、管理情報収集部(106)によって収集するようにすることが好ましい。画面5において、例えば、「計算機A(411)」のアイコンをマウスでダブルクリックすることで画面3(420)に遷移させることが可能である。
【0031】
図4において、画面3(420)は、「計算機A」の運用状況を確認するための統合管理画面であり、「計算機A」について、現在のジョブの実行状況(419)と、「計算機A」上で実行が定義されているジョブネットの一覧(418)と、過去の動作履歴であるログ情報の一覧(417)とが、メッセージ形式で表示されている。運用管理者等は、例えば、画面3において、「ジョブネットA」に関する行をマウスでダブルクリックすることで、画面3(420)から画面1(401)に遷移させることが可能である。
【0032】
また、図4における画面1(401)または画面2(405)において、運用管理者等は、「計算機構成表示」というメニュー(図示せず)を選択することで、画面1(401)から画面5(410)に遷移することが可能である。このとき、画面5の表示において、「計算機A」の表示方法を他の計算機との違いが明らかになるように強調表示する方法を用いることができる。
【0033】
図7、図8に計算機の構成情報、業務運用定義情報、これらの状態を表す情報、およびイベント情報をデータベース上で管理する方法を示す。
【0034】
計算機管理テーブル(701)は、管理対象計算機を利用者による定義順(手動で定義する場合)または管理マネージャ計算機による発見順(管理マネージャ計算機が自動発見する場合)に管理対象計算機ごとに格納する。1つのレコードは「計算機グループ名称」、「計算機名称」、「稼動状態」、「CPU利用率」、「詳細情報」から構成する。これらの情報のうち、「稼動状態」、「CPU利用率」は動的に変化する情報であり、管理マネージャ計算機が定期的に収集して格納する方法の他に、統合管理画面表示部(103)にて表示する時点でこれらの情報を収集する方法も可能である。収集は、統合管理エージェント(113)のアクション実行制御部(112)が計算機基本制御部(117)から情報を受信することにより実現する。運用定義テーブル(702)は「識別子」「計算機名称」「運用種別」から構成する共通テーブルの他、運用種別ごとのテーブルである運用定義詳細テーブルから構成する。電源制御に関するテーブル(703)では、例えば、「識別子」「電源起動(曜日)」「電源起動(時刻)」「電源切断(曜日)」「電源切断(時刻)」から構成し、ジョブネットに関するテーブル(704)では「識別子」「ジョブネット名称」「起動曜日」「起動時刻」「構成ジョブ定義」から構成する。これらの運用定義情報は、管理対象計算機(109)における業務定義情報・イベント情報収集部(110)を介して対応する運用処理(114〜116)から収集する。収集した情報は、管理マネージャ計算機(101)における管理情報収集部(106)において、前述のデータベース(105)のテーブル形式に変換してデータベース(105)に格納する。イベント・ログテーブル(705)は、管理マネージャ計算機(102)が管理対象計算機(109)から収集したイベントやログ情報を時系列に格納する。1つのレコードは「識別子」「計算機名称」「時刻」「イベント・ログ種別」「詳細情報」から構成する。「詳細情報」を除き、すべてのイベントログに共通な形式とする。前記形式への変換は管理マネージャ計算機(101)における管理情報収集部(106)において、実行することが可能である。
【0035】
管理マネージャ計算機(102)では、管理情報制御部(108)が、図7、図8のテーブル(701〜705)を、例えば、SQL等の言語で検索することによって、管理アプリケーション部(102)が有する統合管理画面表示部(103)が、図4に例示したような画面表示が可能となる。特に業務定義情報と計算機構成情報との関連付けは、業務の管理画面(401)において、業務定義テーブル(702)の計算機名称からその計算機管理テーブル(701)を参照して、当該計算機の属するグループの計算機の構成を表示することが可能である。また、計算機の管理画面(410)において、計算機名称が指定されると、業務定義テーブル(702)やイベントログテーブル(705)の計算機名称を参照して、当該計算機における業務定義や実行状態を表示する(420、401)ことが可能である。なお、管理マネージャ計算機(101)は、画面表示を行う際に、表示に必要な情報が図7、図8のテーブル(701〜705)に存在しない場合には、その時点で、該情報を収集するようにする。
【0036】
一方、管理マネージャ計算機(101)は、イベント情報については、通知後ただちに、表示装置(308)に表示するようにすることが好ましく、このとき管理マネージャ計算機(101)で表示される画面は、例えば、図9に示すようになる。
【0037】
図9は、通知されたイベント情報のうちの、計算機Aのイベント情報をメッセージとして表示した画面の一例を示している。本図では、メッセージは、イベント情報の重要度(801)と、イベントが通知された日時(802〜803)と、通知元の管理対象計算機(804)と、メッセージ本体(805)とから構成されている。さらに、メッセージは重要度によって異なる色で表示することが可能である。
【0038】
通知されたイベント情報は、図9のようにメッセージ表示画面上に時系列に出力するばかりでなく、図4における業務管理画面(401)や、計算機管理画面(410)の該当するシンボルの表示色に反映する。
【0039】
さらに踏み込んで、以下に述べるように特定のイベントが発生したときに、予め指定しておいた動作指示を管理対象計算機に対して行うことが可能である。これらを具体的に図5および図6を用いて説明する。
【0040】
図5の例において、管理マネージャ計算機(101)は、管理対象計算機(109)において業務処理の異常を検出すると(501)、異常を検出した計算機の業務の実行状態を調査する(502)。調査は、自動的に再実行することが可能がを判定し、さらに可能であれば、一連の業務処理のうち、再実行すべき時点を判定する(503)。自動的に再実行可能であるかは、一連の業務処理のある時点までさかのぼれば、その時点までで業務処理が完結しており、かつ以前の結果を利用するだけで(この場合、結果はデイスク装置(306)などの不揮発性の媒体に記録されており、当該計算機とは別の計算機に前記結果情報が転送されている等で再実行時にこれを読み出せる必要がある)以降の処理に影響を与えない場合に、自動的に再実行可能となる。もちろん、前記でその時点までで業務処理が完結しており、かつ以前の結果を利用しない場合はなんら問題はない。
【0041】
さらに、上記再実行可能なポイントの判定は、業務プログラム自身が、一連の業務処理のうち、ある特定の業務処理が終了した時点で特定の終了コードを出力して、統合管理エージェント(110)の業務定義情報・イベント情報収集部(113)は、このコードを付加したイベント情報を管理マネージャ計算機に通知し、管理マネージャ計算機(101)のイベントアクション制御部(104)がデータベース(105)に格納された上記イベント情報を参照することによって可能である。
【0042】
次に、自動的な再実行が可能な場合、計算機管理情報から正常に動作中の計算機を選択する(504)。計算機の稼動状態は図7のデータベース上の計算機管理テーブル(701)を参照することで可能である。選択した計算機に対して、再実行可能なポイントから業務処理の実行を指示する(505)。このとき、必要に応じて業務処理を実行するプログラムを前記計算機に対して転送する。前記指示を受信した管理対象計算機は、指定された業務処理の実行を開始する(506)。
【0043】
次に図の例について説明する。管理マネージャ計算機において、管理対象計算機の業務処理の予実績が既定値以上になったことを検出すると(601)、異常を検出した計算機上の業務の実行状態を調査する(602)。予実績の判定は、運用定義テーブル(702〜704)に記述されている起動予定時刻と管理対象計算機から通知される業務開始/終了等のイベント情報に記録されている時刻情報に基づいてこれらの値の差を計算することで実施することが可能である。次に異常を検出した計算機上の業務の実行状態の調査では、一例として、現在実行中の業務の終了のポイントが計算機を切り替えるポイントになるかどうかを判定する方法が可能である。このため、管理対象計算機において、各業務処理の開始時点で、この業務が終了した時点が再実行可能なポイントであるか否かまたは判断不可能であるかを判断して、この情報を出力して、業務開始イベントに付加して管理マネージャ計算機に通知する。
【0044】
管理マネージャ計算機では、この情報に基づいて上記判断を行う(603)。現在の業務の終了時点が切り替えのポイントであると判断したとき、現在実行中の業務が終了したとき、計算機管理情報(701)から負荷値が異常でない管理対象計算機を選択し(604)、選択した計算機に対して業務処理の実行を指示する(605)。このとき、必要に応じて業務処理を実行するプログラムを前記計算機に対して転送する。前記指示を受信した管理対象計算機は、指定された業務処理の実行を開始する(606)。
【0045】
以下、実施例における業務運用管理方式の効果を示す。
【0046】
第一の効果は、業務運用上の問題解決の容易化である。これは、業務運用に関する定義や実行状態および実行結果を一元管理しており、これを計算機システムの構成や状態と関連付けて管理することにより、例えば、特定の計算機のに障害が発生したとき、影響を受ける業務を容易に把握することができる。例えば、特定の計算機に障害が発生したとき、計算機監視画面における当該計算機のシンボルの表示色を変えるとともに、該計算機上で実行中の業務監視画面上の業務シンボルの表示色もあわせて変更することにより前記を達成できる。さらに、業務の実行状態や計算機の状態/負荷をあわせて管理することにより、障害や性能上の問題が発生したとき、動的に正常に動作中の計算機に業務処理を振り分けることを自動的に実行できるようになる。
【0047】
第二の効果は、ネットワークトラヒック削減という効果である。これは、運用定義情報、イベント情報、ログ情報を管理マネージャ計算機(101)でデータベース化して蓄積することにより、運用管理者等がこれらの情報、特に変更頻度の低い情報、を参照する度に、管理マネージャ計算機(101)が管理対象計算機から必要な情報を収集する必要がなくなるからである。
【0048】
例えば、図3のネットワーク構成において、各計算機から1メッセージあたり1KBのログメッセージを1000メッセージ/日管理マネージャ計算機に収集するとき、6MB/日のネットワークトラヒックが発生するが、これらのログメッセージを管理対象計算機から10回/日、直接収集して参照すると、計60MB/日のネットワークトラヒックが発生することになる。また、リアルタイム性への要求が低いログ等の実行結果の詳細については夜間等の通常のネットワークトラヒックが低い時間帯にスケジュールして収集するようにすると、ネットワークトラヒックの削減効果は顕著なものとなる。
【0049】
【発明の効果】
以上に説明したように、本発明によれば、複数の計算機が接続された計算機システムにおいて、これらの計算機を管理する管理マネージャ計算機が、各計算機で実行される業務運用を、一元的に管理するとともに、計算機自身の管理と相互に関連付けて実施できる。これによって、問題を容易に、負荷をかけずに解決できる。
【図面の簡単な説明】
【図1】管理マネージャ計算機が、各計算機で実行される業務運用を一元的に管理するためのシステム構成を示す説明図。
【図2】本実施形態に係る計算機システムの全体構成図。
【図3】管理マネージャ計算機および管理対象計算機のハードウエア構成図。
【図4】管理マネージャ計算機で表示される統合管理画面の一例を示す説明図。
【図5】管理対象計算機に異常が発生した場合の回復手順を示す説明図。
【図6】管理対象計算機に負荷の異常が検出された場合の回復手順を示す説明図。
【図7】データベース上の各種テーブルの構造の一例を示す説明図。
【図8】データベース上の各種テーブルの構造の一例を示す説明図。
【図9】管理マネージャ計算機で表示されるイベント情報の一例を示す説明図。
【符号の説明】
101:管理マネージャ計算機、102:管理アプリケーション部、103:統合管理画面表示部、104:イベント・アクション制御部、105:データベース、106:管理情報収集部、107:アクション実行指示部、108:管理情報制御部、109:管理対象計算機、110:業務定義情報・イベント情報収集部、111:計算機情報収集部、112:アクション実行制御部、113:統合管理エージェント、114:印刷実行制御部、115:電源制御部、116:ジョブ実行制御部、117:計算機基本制御部、201:管理マネージャ計算機、202〜207:計算機、208〜213:ネットワーク、300:計算機、301:主記憶装置、302:中央処理装置、303:ネットワーク制御装置、304:ローカルエリアネットワーク、305:通信回線、306:デイスク装置、307:デイスク制御装置、401:計算機AのジョブネットAに関する管理画面、405:ジョブ定義の詳細表示画面、420:計算機Aに関する定義、実行状態の表示画面、416:計算機のグループの表示画面、410:グループA内の計算機の表示画面、701:計算機管理テーブル、702〜704:運用定義テーブル、705:イベント・ログテーブル

Claims (10)

  1. 複数の計算機で実行される複数の処理を管理する管理計算機であって、
    ネットワークインタフェースと、前記ネットワークインタフェースに接続される制御部と、
    前記制御部に接続される記憶部とを備え、
    前記記憶部は、前記一以上の計算機から構成されるグループをあらかじめ設定し、前記グループを構成する各計算機に対しあらかじめ定義された当該計算機で実行される処理の実行状況を保持し、
    前記制御部は、
    少なくとも一つの計算機で実行される処理を第一のシンボルで、処理の実行順序を前記第一のシンボル間の方向付きのリンクで、さらに処理の実行状況を前記第一のシンボルの表示態様で示すよう画面に出力し、
    前記記憶部に設定されているグループから、前記出力された第一のシンボルで表現される処理を実行する計算機を含むグループを特定し、第一のシンボルで表現される処理を実行する計算機と、前記グループに含まれる他の計算機とを、異なる表示態様で、それぞれ第二のシンボルで表現し、前記第二のシンボルを前記グループに含まれる計算機の接続関係とともに前記画面に出力することを特徴とする管理計算機。
  2. 前記記憶部には、あらかじめ設定されたグループを構成する前記一つ以上の計算機をそれぞれ特定する計算機識別子が前記グループごとに対応付けられて格納され、前記処理の実行情報は、前記計算機識別子を含み、前記処理を実行する計算機から前記ネットワークインタフェースを介して受けた前記処理実行情報であって、前記一つ以上の計算機で実行される複数の処理それぞれを特定する処理識別子と前記処理を実行する計算機を特定する計算機識別子と前記処理実行情報とが対応付けられて格納されており、
    前記制御部は、
    前記処理実行情報に基づいて前記第一のシンボルの表示態様を特定し、
    前記グループの特定は、前記第一のシンボルに表現される処理を実行する計算機を特定する計算機識別子に基づいて行い、
    さらに、前記制御部に接続される入力装置から前記出力された第二のシンボルの選択を受けた場合、前記第二のシンボルに対応する計算機で実行される処理の実行情報を前記記憶部から抽出し、処理の実行状況を前記画面に出力するを特徴とする請求項1記載の管理計算機。
  3. 前記グループは、あらかじめ定義された複数の処理を、ネットワークを介した計算機間で連携して実行する計算機で構成されることを特徴とする請求項1ないし2記載の管理計算機。
  4. 前記制御部は、前記計算機から前記ネットワークインタフェースを介して前記計算機を特定する計算機識別子を含む前記計算機の稼動情報を取得し、前記計算機に基づいてあらかじめ設定されているグループを構成する計算機の稼動状況を前記記憶部に格納し、前記第二のシンボルの表示態様をさらに前記稼動状況に基づいて表示態様を特定することを特徴とする請求項1または3記載の管理計算機。
  5. 前記制御部は、前記計算機から前記ネットワークインタフェースを介して前記計算機を特定する計算機識別子を含む前記計算機の稼動情報を取得し、前記稼動情報に含まれる計算機識別子に基づいて前記グループに対応付けられている計算機識別子と対応付けて前記稼動情報を格納することを特徴とする請求項2または3記載の管理計算機。
  6. 前記制御部は、前記第一のシンボルを画面に出力するとともに、構成表示要求領域を表示し、前記制御部に接続される入力装置を介して前記構成表示要求領域の選択を受け、前記第二のシンボルを画面に出力することを特徴とする請求項1記載の管理計算機。
  7. 制御部は、前記計算機から特定のイベントを前記ネットワークインタフェースを介して受信した場合、あらかじめ指定された処理の実行内容を示すプログラムをあらかじめ指定された計算機に送信することを特徴とする請求項1ないし5記載の管理計算機。
  8. 前記受信したイベントに基づいて前記処理が正常に終了しなかったとき、前記記憶部に格納されている稼動情報を参照し、正常に動作している前記計算機に対して、再実行可能な時点にさかのぼった当該処理の再実行を指示と、当該処理のプログラムを前記ネットワークインタフェースを介して送信することを特徴とする請求項記載の管理計算機。
  9. 前記処理実行情報は、前記処理の実行に対する予定時刻とその結果時刻とを含み前記制御部は、前記計算機からネットワークインタフェースを介して前記処理実行情報を取得した場合、
    前記取得した処理実行情報に基づいて前記計算機の切り替えを判断した場合は、切り替え可能な処理の実行ポイントで予め決められた負荷以下の他の前記計算機へ切替を行うことを特徴とする請求項記載の管理計算機。
  10. 複数の計算機で実行される処理を管理する請求項1ないし9記載の管理計算機と、前記管理計算機とネットワークを介して接続される計算機とを有する計算機システムであって、
    前記計算機は、前記管理計算機から指示される処理の実行指示に基づいて前記処理を実行し、前記処理の状況を示す処理実行情報を前記管理計算機に送信し、前記計算機自身の稼働情報を収集し、前記稼動情報を前記管理計算機に送信することを特徴とする計算機システム。
JP30606797A 1997-11-07 1997-11-07 管理計算機又は計算機システム Expired - Fee Related JP3624657B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP30606797A JP3624657B2 (ja) 1997-11-07 1997-11-07 管理計算機又は計算機システム
EP98120838A EP0915423B1 (en) 1997-11-07 1998-11-03 Computer operation management system
DE69841935T DE69841935D1 (de) 1997-11-07 1998-11-03 Verwaltungssystem zur Computerbedienung
US09/188,263 US6170010B1 (en) 1997-11-07 1998-11-09 Computer operation management system
US09/721,616 US7155498B1 (en) 1997-11-07 2000-11-27 Computer operation management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30606797A JP3624657B2 (ja) 1997-11-07 1997-11-07 管理計算機又は計算機システム

Publications (2)

Publication Number Publication Date
JPH11143742A JPH11143742A (ja) 1999-05-28
JP3624657B2 true JP3624657B2 (ja) 2005-03-02

Family

ID=17952655

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30606797A Expired - Fee Related JP3624657B2 (ja) 1997-11-07 1997-11-07 管理計算機又は計算機システム

Country Status (4)

Country Link
US (1) US6170010B1 (ja)
EP (1) EP0915423B1 (ja)
JP (1) JP3624657B2 (ja)
DE (1) DE69841935D1 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3537356B2 (ja) * 1998-12-09 2004-06-14 株式会社日立製作所 ジョブシステムにおける遅延要因解析方法
JP2000259585A (ja) * 1999-03-08 2000-09-22 Toshiba Corp システムアプリケーション管理方式とその管理方式を実行するためのプログラムを記録した記録媒体
US6944654B1 (en) * 1999-11-01 2005-09-13 Emc Corporation Multiple storage array control
KR100424418B1 (ko) * 2001-10-26 2004-03-24 주식회사 케이투씨 메인프레임 관리 시스템 및 그 방법과 그의 데이터 분석 장치
JP2003308213A (ja) * 2002-04-17 2003-10-31 Hitachi Ltd ジョブ処理方法、ジョブ処理装置及びストレージ管理システム
US20030197723A1 (en) * 2002-04-19 2003-10-23 Young Brian R. Methods, apparatus and computer program products for providing network device status information
JP3854941B2 (ja) * 2002-05-31 2006-12-06 キヤノン株式会社 印刷制御方法、ホストコンピュータ、プログラム及び記憶媒体
KR100484144B1 (ko) * 2002-06-20 2005-04-18 삼성전자주식회사 원격 관리 서버 및 원격 관리 방법
AU2002368384A1 (en) * 2002-11-28 2004-06-18 Allied Telesis K.K. Apparatus management system and method thereof
JP2004362144A (ja) * 2003-06-03 2004-12-24 Hitachi Ltd 運用管理方法及び実施装置並びに処理プログラム
US7353265B2 (en) * 2004-06-02 2008-04-01 Lehman Brothers Inc. Method and system for monitoring and managing assets, applications, and services using aggregated event and performance data thereof
JP4260723B2 (ja) * 2004-11-04 2009-04-30 株式会社日立製作所 情報処理装置、情報処理装置の制御方法、及びプログラム
US8239498B2 (en) * 2005-10-28 2012-08-07 Bank Of America Corporation System and method for facilitating the implementation of changes to the configuration of resources in an enterprise
US8782201B2 (en) * 2005-10-28 2014-07-15 Bank Of America Corporation System and method for managing the configuration of resources in an enterprise
JP4804139B2 (ja) * 2005-12-14 2011-11-02 株式会社日立製作所 情報出力方法、システム及びプログラム
US10838714B2 (en) 2006-04-24 2020-11-17 Servicenow, Inc. Applying packages to configure software stacks
US7971187B2 (en) * 2006-04-24 2011-06-28 Microsoft Corporation Configurable software stack
JP5433977B2 (ja) * 2008-05-09 2014-03-05 株式会社ニコン 自動機の制御装置
JP5298657B2 (ja) * 2008-06-18 2013-09-25 日本電気株式会社 情報処理装置、情報処理方法、およびプログラム
US20150095245A1 (en) * 2013-10-02 2015-04-02 Robert Daniel Cowan Method for Increasing Regulatory Compliance of a Company with Integrated Training and Hardware Service
US10275411B2 (en) 2014-09-29 2019-04-30 Hitachi, Ltd. Management system for computer system
US10430743B2 (en) 2016-02-24 2019-10-01 Bank Of America Corporation Computerized system for simulating the likelihood of technology change incidents
US10366338B2 (en) 2016-02-24 2019-07-30 Bank Of America Corporation Computerized system for evaluating the impact of technology change incidents
US10387230B2 (en) 2016-02-24 2019-08-20 Bank Of America Corporation Technical language processor administration
US10366367B2 (en) 2016-02-24 2019-07-30 Bank Of America Corporation Computerized system for evaluating and modifying technology change events
US10223425B2 (en) 2016-02-24 2019-03-05 Bank Of America Corporation Operational data processor
US10216798B2 (en) 2016-02-24 2019-02-26 Bank Of America Corporation Technical language processor
US10366337B2 (en) 2016-02-24 2019-07-30 Bank Of America Corporation Computerized system for evaluating the likelihood of technology change incidents
US10275182B2 (en) 2016-02-24 2019-04-30 Bank Of America Corporation System for categorical data encoding
US10067984B2 (en) 2016-02-24 2018-09-04 Bank Of America Corporation Computerized system for evaluating technology stability
US10019486B2 (en) 2016-02-24 2018-07-10 Bank Of America Corporation Computerized system for analyzing operational event data
US10275183B2 (en) 2016-02-24 2019-04-30 Bank Of America Corporation System for categorical data dynamic decoding
CN107015892B (zh) * 2017-03-30 2020-11-03 腾讯科技(深圳)有限公司 一种压力测试方法、装置和系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69132279T2 (de) 1990-09-17 2001-01-18 Cabletron Systems Inc Verfahren zur Isolierung eines Netzwerkfehlers
US5559955A (en) * 1990-09-17 1996-09-24 Cabletron Systems, Inc. Method and apparatus for monitoring the status of non-pollable device in a computer network
JPH04245751A (ja) 1991-01-31 1992-09-02 Nec Corp イベント処理分散型網監視システム
AU2237995A (en) * 1994-04-05 1995-10-23 Intel Corporation Method and appartus for monitoring and controlling programs in a network
JP3653335B2 (ja) * 1995-05-31 2005-05-25 株式会社日立製作所 コンピュータ管理システム
US5751914A (en) * 1995-10-10 1998-05-12 International Business Machines Corporation Method and system for correlating a plurality of events within a data processing system
US5796951A (en) * 1995-12-22 1998-08-18 Intel Corporation System for displaying information relating to a computer network including association devices with tasks performable on those devices
US5748884A (en) * 1996-06-13 1998-05-05 Mci Corporation Autonotification system for notifying recipients of detected events in a network environment
US5872970A (en) * 1996-06-28 1999-02-16 Mciworldcom, Inc. Integrated cross-platform batch management system
US5872931A (en) * 1996-08-13 1999-02-16 Veritas Software, Corp. Management agent automatically executes corrective scripts in accordance with occurrences of specified events regardless of conditions of management interface and management engine
US5944782A (en) * 1996-10-16 1999-08-31 Veritas Software Corporation Event management system for distributed computing environment
US5826239A (en) * 1996-12-17 1998-10-20 Hewlett-Packard Company Distributed workflow resource management system and method
US6006193A (en) * 1996-12-18 1999-12-21 Gibson; Kenneth U. Computer executable workflow control system
US5893905A (en) * 1996-12-24 1999-04-13 Mci Communications Corporation Automated SLA performance analysis monitor with impact alerts on downstream jobs
US6023507A (en) * 1997-03-17 2000-02-08 Sun Microsystems, Inc. Automatic remote computer monitoring system

Also Published As

Publication number Publication date
US6170010B1 (en) 2001-01-02
EP0915423A2 (en) 1999-05-12
EP0915423A3 (en) 2004-06-16
DE69841935D1 (de) 2010-11-25
JPH11143742A (ja) 1999-05-28
EP0915423B1 (en) 2010-10-13

Similar Documents

Publication Publication Date Title
JP3624657B2 (ja) 管理計算機又は計算機システム
JP3614625B2 (ja) 管理マネージャ計算機、記録媒体、および、計算機運用管理方法
EP2315125B1 (en) System and method for implementing polling agents in a client management tool
CN109857558A (zh) 一种数据流处理方法及系统
JP2004227359A (ja) ポリシーに基づいたストレージシステムの運用管理方法
JP2000067130A (ja) ワークフロー管理システム
JP2003308213A (ja) ジョブ処理方法、ジョブ処理装置及びストレージ管理システム
JP2003067352A (ja) パーティション構成変更方式、パーティション構成変更方法およびパーティション構成変更用プログラム
US7237005B2 (en) Job network setup method, job network execution method, job management system, management terminal and program
CN106843890B (zh) 基于智能决策的传感器网络、节点及其运行方法
CN115328664B (zh) 一种消息消费方法、装置、设备及介质
JPH11143829A (ja) 計算機システムの運用管理方法
JP2008181298A (ja) 作業状態復帰プログラム、作業状態復帰方法および作業状態復帰装置
US7155498B1 (en) Computer operation management system
US7240348B2 (en) Suspending scenario generation method, server device, and program therefor
JPH06348664A (ja) 異なる命令特性を持つ複数のcpuによって構成される計算機システムの制御装置
JP3979356B2 (ja) 管理マネージャ計算機、記録媒体、および、計算機運用管理方法
JPH1031592A (ja) メモリ管理方法及びメモリ管理システム
JP3984948B2 (ja) 計算機システムの運用管理方法
JPH07168794A (ja) 計算機システムのジョブ管理方法
JPH1040123A (ja) ジョブ管理方式と方法
JP3082704B2 (ja) 通信装置管理方式
JPH113230A (ja) ジョブ情報問合せ・表示システム
JP2003345680A (ja) Web監視制御システムのWeb端末管理方法
JP3815494B2 (ja) 計算機システムおよびその運用管理方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071210

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091210

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101210

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101210

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111210

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111210

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121210

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees