JP2016130892A - 監視装置、情報処理システム及び監視プログラム - Google Patents

監視装置、情報処理システム及び監視プログラム Download PDF

Info

Publication number
JP2016130892A
JP2016130892A JP2015004203A JP2015004203A JP2016130892A JP 2016130892 A JP2016130892 A JP 2016130892A JP 2015004203 A JP2015004203 A JP 2015004203A JP 2015004203 A JP2015004203 A JP 2015004203A JP 2016130892 A JP2016130892 A JP 2016130892A
Authority
JP
Japan
Prior art keywords
information
thread
server
monitoring target
monitored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015004203A
Other languages
English (en)
Inventor
美加代 小杉
Mikayo Kosugi
美加代 小杉
慶子 竹内
Keiko Takeuchi
慶子 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015004203A priority Critical patent/JP2016130892A/ja
Priority to US14/957,751 priority patent/US20160204999A1/en
Publication of JP2016130892A publication Critical patent/JP2016130892A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3433Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/14Arrangements for monitoring or testing data switching networks using software, i.e. software packages

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】ネットワークで接続された複数台のサーバを監視する監視装置の負荷を低減する。
【解決手段】監視装置10は、複数の監視対象の情報処理装置40に対して作成され、監視対象の情報処理装置に対する情報採取の指示をキュー24に登録する複数の監視プロセス23と、キューに登録された指示を読み出し、監視対象の情報処理装置から被監視情報を採取して記憶部26に書き出す、複数の監視対象の情報処理装置よりも少ない数の通信プロセス25と、を実行する。
【選択図】図10

Description

本発明は、監視装置、情報処理システム及び監視プログラムに関する。
近年、Information and Communication Technology(ICT)機器を集積し、管理ソフトウェアや業務アプリケーションを統合した垂直統合システム製品が登場している。垂直統合システムのように、ネットワークで接続された複数台のサーバから成る大規模システム環境において、各サーバは、定期的な情報採取によって監視される。
各サーバを監視する監視装置は、監視対象サーバの数のスレッドを作成する。スレッドとは、プログラムの実行単位である。スレッドは、監視対象サーバと1対1で通信し、監視対象サーバの情報を採取する。監視対象サーバの情報を採取するスレッドは、通信を行わないスレッドよりも、メモリ使用量が多く通信負荷が高い。したがって、監視対象サーバの増加に比例して、メモリ使用量は増加する。
特開2002−7334号公報 特開平9−330302号公報 特開平5−75621号公報
しかしながら、ソフトウェアに与えられるメモリ資源は限られている。このため、メモリ使用量がソフトウェアに割り当てられたメモリ量を超えた場合、メモリが枯渇する。メモリが枯渇すると、ソフトウェアの動作が停止する場合がある。
また、ソフトウェアによるメモリ使用量は、監視対象サーバの増加に比例して増加するため、監視対象サーバの数は、与えられたメモリ資源の範囲を超えて増やせない。さらに、監視対象サーバごとに作成されたスレッドは、監視中はメモリを占有する。監視対象サーバごとにスレッドが作成され、メモリの使用や通信による負荷が増加すると、他の処理に割り当てられるリソースは減少する。
本発明の一態様は、ネットワークで接続された複数台のサーバを監視する監視装置の負荷を低減する監視装置、情報処理システム及び監視プログラムを提供することを目的とする。
本発明の態様の一つは、複数の監視対象の情報処理装置に対して作成され、監視対象の情報処理装置に対する情報採取の指示をキューに登録する複数の監視プロセスと、キューに登録された指示を読み出し、監視対象の情報処理装置から被監視情報を採取して記憶部に書き出す、複数の監視対象の情報処理装置よりも少ない数の通信プロセスと、を実行する監視装置である。
開示の監視装置、情報処理システム及び監視プログラムによれば、ネットワークで接続された複数台のサーバを監視する監視装置の負荷を低減することができる。
システム管理方式の全体図の一例である。 システム管理方式での初期化フローの一例である。 システム管理方式での画面展開のフローの一例である。 比較例における監視装置の構成図の一例である。 比較例における初回のサーバ情報取得の動作例を示す図である。 比較例における2回目以降のサーバ情報取得の動作例を示す図である。 監視装置のハードウェア構成の一例を示す図である。 情報処理システムにおける監視装置の機能構成の一例を示す図である。 初回のサーバ情報取得の動作例を示す図である。 初回のサーバ情報取得において、Workerスレッド数が上限値である場合の動作例を示す図である。 2回目以降のサーバ情報取得の動作例を示す図である。 スレッド管理テーブルのデータ構造の一例を示す図である。 性能情報格納テーブルのデータ構造の一例を示す図である。 キューに登録されるエントリのデータ構造の一例を示す図である。 スレッド間で受け渡される情報のデータ構造の一例を示す図である。 Mainスレッドの処理のフローチャートの一例である。 Monitorスレッドの処理のフローチャートの一例である。 Monitorスレッドの接続情報更新処理のフローチャートの一例である。 Workerスレッドの処理のフローチャートの一例である。 監視対象サーバとMonitorスレッドをシリアル番号で対応付ける変形例1を示す図である。 監視対象サーバが複数のOSを有する変形例2を示す図である。 変形例2におけるWorkerスレッドの処理のフローチャートの一例である。
以下、図面に基づいて、本発明の実施の形態を説明する。以下の実施形態の構成は例示であり、本発明は実施形態の構成に限定されない。
<システム管理方式>
複数台のサーバから成る大規模システム環境において、監視装置は、ネットワーク接続された監視対象であるサーバ等から定期的に情報を採取し、状態監視を行う。図1は、システム管理方式の全体図の一例である。
図1において、システムは、端末、監視装置および監視対象のサーバ等を含む。監視対象は、サーバの他、スイッチ、ストレージおよびファシリティ機器等を含む。端末は、Webブラウザにより、監視装置に対してサーバ情報の取得を依頼する。
監視装置は、運用管理ソフトウェア、Operating System(OS)、java(登録商標)等のプログラムを備える。運用管理ソフトウェアは、サーバ情報表示Graphical User Interface(GUI)処理部、マネージャ、サーバ情報取得Application Programming Interface(API)処理部を備える。また、運用管理ソフトウェアは、他のファシリティ機
器等に対しそれぞれGUI処理部および情報取得処理部を備える。
監視対象のサーバは、OSおよびサーバ管理機構を備える。OSは、監視装置に対し、サーバの性能情報を提供する。サーバ管理機構は、サーバおよびOSと独立して動作し、
監視装置に対し、サーバの温度や電源等の状態の他、サーバのシリアル番号を提供する。
図2Aおよび図2Bは、システム管理方式の全体フローの一例である。システム管理方式は、サーバ情報等を取得するためのシステムの初期化のフロー、およびユーザからの情報取得の指示に対する画面展開のフローを含む。
図2Aは、システム管理方式での初期化フローの一例である。初期化のフローは、監視装置の起動により開始される。次に監視装置は、運用管理ソフトウェアを起動する。次に、監視装置は、サーバ情報表示GUI処理部、サーバ情報取得API処理部等の各処理部を初期化する。サーバ情報表示GUI処理部は、初期化の際、あらかじめユーザにより設定される設定ファイルを読み込み、サーバ情報取得に使用される設定情報を取得する。各処理部は、運用管理ソフトウェアによるサービスが終了すると、終了する。
図2Bは、システム管理方式での画面展開のフローの一例である。画面展開のフローは、端末でWeb画面が起動されることにより開始される。次に、Web画面は、監視装置に接続しサーバ情報の取得を依頼する。監視装置の運用管理ソフトウェアにおいて、各GUI処理部は、マネージャに対し、情報取得を依頼する。マネージャは、各情報取得処理部に対し、情報採取を依頼する。各情報取得処理部は、サーバから採取した情報に対する処理結果をマネージャに通知する。マネージャは、処理結果を各GUI処理部に通知する。各GUI処理部は、処理結果を端末に通知する。端末は、処理結果を画面に表示する。
<比較例>
図3は、比較例における監視装置の構成図の一例である。図3において、監視装置はマネージャおよびサーバ情報取得API処理部を備える。監視装置は、複数の監視対象サーバを監視する。監視対象サーバは、図1の監視対象のサーバと同様であるため、説明は省略される。
監視装置は、Mainスレッド、スレッド管理テーブルおよび管理スレッドを備える。管理スレッドは、監視対象サーバと同数存在する。Mainスレッドは、マネージャからの依頼を受け、サーバ情報取得API処理部の全体の処理を制御する。スレッド管理テーブルは、監視対象サーバと管理スレッドとの関連性を管理する。管理スレッドは、監視対象サーバと1対1で生成され、定期的に、監視対象サーバからの情報を採取する。管理スレッドは、性能情報格納域を備える。管理スレッドは、監視対象サーバから採取した情報を、性能情報格納域に保持する。
管理スレッドは、監視対象サーバ毎に、サーバへの接続情報の管理、接続、情報採取、編集、世代管理などを行う。また、各監視対象サーバは、マネージャからの初回接続を起点として、一定間隔で性能情報収集するため、監視対象サーバ毎に並行処理される。このため、性能採取用の管理スレッドは、監視対象サーバと1対1で存在する。
監視対象サーバのOSがVMwareのような仮想マシンである場合、監視装置は、例えば、VMwareから情報を取得するためにVMwareが提供するオープンソースソフトウェア(VIAPI)インタフェースを使用する。監視装置は、各管理スレッドに、通常のオブジェクトよりもサイズの大きいVimportTypeオブジェクトを生成する。監視対象サーバと1対1で、VimportTypeオブジェクトを有する管理スレッドが生成されると、監視装置のメモリ使用量は、監視対象サーバ数に比例して増加し、使用可能なヒープ量を超える可能性がある。
比較例では、採取した情報を管理スレッド内に保持するため、ユーザからサーバ情報取得の依頼を受けた場合に、対象となるサーバ情報を格納した管理スレッドの検索等に時間
がかかる。このため、サーバ情報の取得結果が返却されるまでの時間が長くなる場合がある。
図4は、比較例における初回のサーバ情報取得の動作例を示す図である。マネージャは、Mainスレッドに対し、サーバ情報の取得を依頼する(X1)。Mainスレッドは、スレッド管理テーブルにおいて、監視対象サーバを検索する(X2)。監視対象サーバは、初回のアクセスである場合、スレッド管理テーブルには登録されていない。このため、Mainスレッドは、監視対象サーバに対する管理スレッドを生成し、開始する(X3)。Mainスレッドは、監視対象サーバと生成した管理スレッドとの関連性をスレッド管理テーブルに登録する(X4)。管理スレッドは、監視対象サーバと通信し、性能情報を採取して性能情報格納域に保持する(X5)。Mainスレッドは、管理スレッドに対し、性能情報の取出しを依頼する(X6)。管理スレッドは、性能情報格納域から取り出した性能情報を、Mainスレッドに通知する(X7)。Mainスレッドは、通知された性能情報を、サーバ情報としてマネージャに返却する(X8)。
図5は、比較例における2回目以降のサーバ情報取得の動作例を示す図である。2回目以降のサーバ情報取得の処理では、監視対象サーバに対する管理スレッドは既に作成されている。このため、Mainスレッドは管理スレッドの生成、開始(図4のX3)、およびスレッド管理テーブルへの登録(図4のX4)の処理は行わない。
図5の処理のうち、図4と同一の処理については、同一の符号を付して、その説明は省略される。また、管理スレッドは、定期的に情報を採取し、性能情報格納域に採取した情報を保持する(Y1)。
<実施形態>
本実施形態では、監視対象サーバを管理するための管理スレッドを、MonitorスレッドとWorkerスレッドに分割する。Monitorスレッドは、監視対象サーバに対するサーバ情報取得の指示を制御する。Workerスレッドは、監視対象サーバからサーバ情報を採取する。サーバ情報の採取は、通信処理を伴うため、Monitorスレッドの処理よりも負荷が高い。本実施形態は、Workerスレッドの数を制限することにより、監視装置の負荷の低減を図る。なお、サーバ情報は、被監視情報の一例である。サーバ情報は、例えば、監視対象サーバの性能情報を含む。
<装置構成>
図6は、監視装置10のハードウェア構成の一例を示す図である。監視装置10は、プロセッサ11、主記憶装置12、補助記憶装置13、入力装置14、出力装置15、ネットワークインタフェース16を備える。また、これらはバス17により互いに接続される。
プロセッサ11は、補助記憶装置13に保持されたOSや様々なコンピュータプログラムを主記憶装置12にロードして実行することによって、様々な処理を実行する。ただし、コンピュータプログラムによる処理の一部がハードウェア回路により実行されてもよい。プロセッサ11は、例えば、Central Processing Unit(CPU)や、Digital Signal Processor(DSP)である。
主記憶装置12は、プロセッサ11に、補助記憶装置13に格納されているプログラムをロードするための記憶領域、及びプログラムを実行するための作業領域を提供する。また、主記憶装置12は、データを保持するためのバッファとして用いられる。主記憶装置12は、例えば、Read Only Memory(ROM)、Random Access Memory(RAM)等の半導体メモリである。
補助記憶装置13は、様々なプログラムや、各プログラムの実行に際してプロセッサ11が使用するデータを格納する。補助記憶装置13は、例えば、Erasable Programmable ROM(EPROM)、又はハードディスクドライブ(Hard Disk Drive、HDD)等の不揮発性のメモリである。補助記憶装置13は、例えば、オペレーティングシステム(Operating System、OS)、監視プログラム、その他様々なアプリケーションプログラムを保持する。
入力装置14は、ユーザからの操作入力を受け付ける。例えば、入力装置14は、タッチパッド、マウス、タッチパネル等のポインティングデバイス、キーボード、操作ボタン、遠隔操作機からの信号を受信する回路等である。出力装置15は、監視装置10により再定義された復旧シナリオの内容を出力する。出力装置15は、例えば、液晶ディスプレイ(Liquid Crystal Display、LCD)である。出力装置15は、表示部の一例である。
ネットワークインタフェース16は、ネットワークとの情報の入出力を行うインタフェースである。ネットワークインタフェース16は、有線のネットワークと接続するインタフェース、無線のネットワークと接続するインタフェースを含む。ネットワークインタフェース16は、例えば、Network Interface Card(NIC)、無線Local Area Network(LAN)カード等である。ネットワークインタフェース16で受信されたデータ等は、プロセッサ11に出力される。
例えば、監視装置10では、プロセッサ11が、補助記憶装置13に保持される管理プログラムを主記憶装置12にロードして実行する。なお、監視装置10のハードウェア構成は一例であり、上記に限られず、実施の形態に応じて適宜構成要素の省略や置換、追加が可能である。
図7は、情報処理システム1における監視装置10の機能構成の一例を示す図である。情報処理システム1は、監視装置10および複数の監視対象サーバ40を含む。情報処理システム1は、1000台以上の監視対象サーバ40を含む大規模システムであってもよい。監視対象サーバ40は、監視対象の情報処理装置の一例である。
監視装置10は、サーバ情報取得API処理部20およびマネージャ30を含む。サーバ情報取得API処理部20は、Mainスレッド21、スレッド管理テーブル22、Monitorスレッド23、キュー24、Workerスレッド25および性能情報格納テーブル26を備える。監視装置10のプロセッサ11は、コンピュータプログラムにより、Mainスレッド21、Monitorスレッド23、キュー24およびWorkerスレッド25の処理を実行する。ただし、Mainスレッド21、Monitorスレッド23、キュー24およびWorkerスレッド25のいずれか、またはその処理の一部がハードウェア回路により実行されてもよい。
Mainスレッド21は、マネージャ30からの指示を受け、サーバ情報取得API処理部20の全体の処理を制御する。Mainスレッド21は、例えば、Monitorスレッド23およびWorkerスレッド25を生成したり、性能情報格納テーブル26から性能情報を取得したりする。
スレッド管理テーブル22は、Mainスレッド21によって作成される。スレッド管理テーブル22は、監視対象サーバ40とMonitorスレッド23の関連性を管理する。監視対象サーバ40とMonitorスレッド23とを関連づけるキーは、監視対象サーバ40のIPアドレスであってもよく、シリアル番号であってもよい。
Monitorスレッド23は、監視対象サーバの情報を定期的に取得する処理を制御する。具体的には、Monitorスレッド23は、キュー24に対し、監視対象サーバに対する情報取得の指示を定期的に登録する。
Monitorスレッド23は、Mainスレッド21によって、監視対象サーバと1対1で生成される。ただし、1対1に限定されず、複数の監視対象サーバに対して1つのMonitorスレッド23が生成されてもよい。この場合、Monitorスレッド23は、複数の監視対象サーバに対する情報取得の処理を制御する。Monitorスレッド23は、監視プロセスの一例である。
キュー24は、監視対象サーバに対する情報取得の指示を管理する。キュー24は、Monitorスレッド23から受け取った指示を保持し、古い指示からWorkerスレッド25に受け渡す。キュー24は、Mainスレッド21の起動時に生成される。メモリ使用量を抑制するため、キュー24の要素数は、例えば1000に限定してもよい。また、キュー24は、1つに限られず複数あってもよい。
Workerスレッド25は、監視対象サーバと通信してサーバ情報を採取する。Workerスレッド25は、通常のオブジェクトよりもサイズの大きいサーバ情報採取のためのオブジェクトを有する。Workerスレッド25は、所定の上限値以内の数で生成される。
Workerスレッド25の数を増やすと、並列性が上がるため、処理性能は向上する。一方で、メモリ使用量や通信負荷も増加するというトレードオフがある。このため、Workerスレッド25の数の上限値を事前に算出し、初期化時に可変な値として設定できるようにする。
例えば、Workerスレッド25の数の上限値は、“監視対象サーバ40の上限数÷(Monitorスレッド23のサーバ情報取得指示の間隔÷Workerスレッド25の採取実行時間)”としてもよい。なお、Workerスレッド25の数の上限値は、サーバ情報取得API処理部20の起動時に、ユーザが指定する設定ファイルから読み込まれるようにしてもよい。Workerスレッド25は、通信プロセスの一例である。
性能情報格納テーブル26は、監視対象サーバと採取した情報の関連性を管理する。監視対象サーバと採取した情報とを関連づけるキーは、監視対象サーバのシリアル番号であってもよい。性能情報格納テーブル26は、記憶部の一例である。
マネージャ30は、端末を介してユーザからの指示を受け付け、サーバ情報取得API処理部20等の各処理部を制御する。監視対象サーバ40は、サーバ管理機構41およびOS42を備える。サーバ管理機構41は、監視対象サーバ40の温度や電源等の状態の他、監視対象サーバ40のシリアル番号を提供する。OSは、監視装置に対し、サーバの性能情報を提供する。
<動作例>
図8から図10は、サーバ情報取得の動作例を示す図である。図8は、初回のサーバ情報取得の動作例を示す。図9は、初回のサーバ情報取得において、Workerスレッド数が上限値である場合の動作例を示す。図10は、2回目以降のサーバ情報取得の動作例を示す。
図8は、初回のサーバ情報取得の動作例を示す図である。マネージャ30は、Mainスレッド21に、IPアドレス等の監視対象サーバ40へのアクセス情報を渡してサーバ
情報の取得を依頼する(A1)。Mainスレッド21は、スレッド管理テーブル22において、監視対象サーバ40が登録されているか否かを検索する(A2)。監視対象サーバ40は、初回のアクセスである場合、スレッド管理テーブル22には登録されていない。このとき、Workerスレッド25の数が上限値未満であれば、Mainスレッド21は、Workerスレッド25を生成し、開始する(A3)。また、Mainスレッド21は、監視対象サーバ40に対するMonitorスレッド23を生成し、開始する(A4)。さらに、Mainスレッド21は、監視対象サーバ40と、生成したMonitorスレッド23との関連性をスレッド管理テーブル22に登録する(A5)。
Monitorスレッド23は、サーバ情報取得の指示をキューに登録する(A6)。その後、Monitorスレッド23は、次のサーバ情報取得まで休止し、CPUおよびメモリ等のリソースをシステムに解放する。スレッドが一定時間処理を休止することは、スリープとも称される。
キュー24にサーバ情報取得の指示が登録されると、Workerスレッド25は、リソースが割り当てられて、処理を再開する。スレッドが休止状態から処理を再開することは、ウェイクアップとも称される。Workerスレッド25は、ウェイクアップをすると、キュー24に登録されたサーバ情報取得の指示を取り出す。Workerスレッド25は、キュー24から取り出した指示に従い、監視対象サーバ40と通信をして、サーバ情報を採取する(A7)。
Workerスレッド25は、採取したサーバ情報を性能情報格納テーブル26に格納する(A8)。Workerスレッド25は、キュー24に次の指示がある場合、当該指示に従ってサーバ情報を採取する。一方、キュー24に次の指示がない場合、Workerスレッド25は、次の指示が登録されるまでスリープし、リソースをシステムに解放する。
Mainスレッド21は、性能情報格納テーブル26をポーリングして、格納されたサーバ情報を取り出す(A9)。ポーリングは、定期的に問い合わせを行い、一定の条件を満たした場合に送受信や処理を行う通信および処理方式のことである。Mainスレッド21は、性能情報格納テーブル26から取り出したサーバ情報を、マネージャ30に通知する(A10)。
図9は、初回のサーバ情報取得において、Workerスレッド数が上限値である場合の動作例を示す図である。A3およびA7以外の処理は、図8と同様であるため、同一の符号を付して説明は省略される。
A2の処理後、Workerスレッド25の数が上限値であれば、Mainスレッド21は、Workerスレッド25を生成しない。すなわち、Mainスレッド21は、図8のA3の処理を行わない。
A6において、キュー24にサーバ情報取得の指示が登録されると、スリープ中のWorkerスレッド25があれば、図8のA7と同様に、Workerスレッド25はウェイクアップをしてサーバ情報を採取する。
一方、スリープ中のWorkerスレッド25がなく、各Workerスレッド25が処理の実行中である場合、処理が終了するまでキュー24に登録された指示は処理されない。Workerスレッド25は、処理を終了すると、キュー24に登録された次の指示を取り出し、当該指示に従ってサーバ情報を採取する(B1)。
図10は、2回目以降のサーバ情報取得の動作例を示す図である。A1、A2、A9およびA10の処理は、図8と同様であるため、同一の符号を付して説明は省略される。監視対象サーバ40に対するMonitorスレッド23は、初回のアクセス時に生成され、開始されている。
初回のサーバ情報取得の後、Monitorスレッド23は、所定の時間間隔で、サーバ情報取得の指示をキュー24に登録する(C1、C2)。キュー24に登録された指示は、処理を実行中でないWorkerスレッド25によって取り出される(C3)。指示を取り出したWorkerスレッド25は、監視対象サーバ40と通信をしてサーバ情報を採取し、採取したサーバ情報を性能情報格納テーブル26に格納する。サーバ情報の採取が繰り返され、監視対象サーバ40のサーバ情報が性能情報格納テーブル26に蓄積される。
<データ構造>
図11から図14は、監視装置10で使用するテーブルのデータ構造およびスレッド間で受け渡される情報のデータ構造の例を説明する。
図11は、スレッド管理テーブル22のデータ構造の一例を示す図である。スレッド管理テーブル22は、監視対象サーバ40とMonitorスレッド23の関連性を管理する。スレッド管理テーブル22は、「キー」および「値」の項目を含む。「キー」は、監視対象サーバ40のIPアドレスである。「値」は、当該監視対象サーバ40に対応するMonitorスレッド23のスレッド名である。また、「値」は、プロセス番号等、当該Monitorスレッド23を識別できる値であってもよい。
図11において、例えば、IPアドレスが“192.168.1.1”の監視対象サーバ40は、
スレッド名が“Monitor1”のMonitorスレッド23に関連付けられる。同様に、IPアドレスが“192.168.1.2”の監視対象サーバ40は、スレッド名が“Monitor2”のM
onitorスレッド23に関連付けられる。
図12は、性能情報格納テーブル26のデータ構造の一例を示す図である。性能情報格納テーブル26は、監視対象サーバと採取した情報の関連性を管理する。性能情報格納テーブル26は、「キー」および「値」の項目を含む。「キー」は、監視対象サーバ40のシリアル番号である。「値」は、当該監視対象サーバ40についての性能情報リストの格納先またはリンク先である。
性能情報を含むサーバ情報は、定期的に採取されるため、性能情報リストは、複数世代の性能情報を保持してもよい。各世代の性能情報は、1つのエントリとして性能情報リストに格納される。すなわち、性能情報リストは、世代ごとの性能情報を格納する複数のエントリを有する。
図12において、例えば、シリアル番号が“SQ1234AB00001”の監視対象サーバ40と
、“性能情報LIST1”で表される性能情報リストが関連付けられる。同様に、シリアル番
号が“SQ1234AB00002”の監視対象サーバ40と、“性能情報LIST2”で表される性能情報リストが関連付けられる。
図13は、キュー24に登録されるエントリのデータ構造の一例を示す図である。図13は、キュー24に登録される1エントリの例を示す。エントリ内の要素として、「IPアドレス」、「ユーザID」、「パスワード」および「キー」が含まれる。「IPアドレス」は、監視対象サーバ40のIPアドレスである。「ユーザID」は、監視対象サーバ40のログインユーザIDである。「パスワード」は、ユーザIDに対するパスワードで
ある。「キー」は監視対象サーバ40のシリアル番号である。
図13に示されるキュー24のエントリは、IPアドレスが“192.168.1.1”の監視対
象サーバ40に対してサーバ情報を採取することを指示する。Workerスレッド25は、ユーザIDを“admin”、パスワード名を“admin”として、監視対象サーバ40にログインして情報を採取する。また、Workerスレッド25は、シリアル番号“SQ1234AB00001”をキーとして、採取した性能情報を性能情報格納テーブル26に格納する。
図14は、スレッド間で受け渡される情報のデータ構造の一例を示す図である。マネージャ30は、サーバ情報取得の依頼時、Mainスレッド21にIpaddress、Id、Pass、ServerInfoを含む情報を渡す。Ipaddressは、サーバ情報の取得を依頼する管理対象サーバ40のサーバ管理機構41のIPアドレスである。Idは、当該管理対象サーバ40のサーバ管理機構41のログインユーザIDである。Passは、当該ログインユーザIDに対するパスワードである。ServerInfoは、OS接続情報を含むオブジェクトである。
Mainスレッド21は、Monitorスレッド23の生成時、In_id、In_pw、In_Ipaddress、In_SerialNum、QueueおよびTimerを含む情報を渡す。In_idは、OS接続情報
のユーザIDである。In_pwは、OS接続情報のパスワードである。In_Ipaddressは、O
S接続情報のIPアドレスである。In_SerialNumは、監視対象サーバ40のシリアル番号である。シリアル番号は、Mainスレッド21において、監視対象サーバ40のサーバ管理機構41から取得される。Queueは、サーバ情報取得の指示を登録するキュー24の
名称である。Timerは、サーバ情報を採取する間隔である。
Mainスレッド21は、Workerスレッド25を生成し、開始する際、Workerスレッド25にQueue、DataおよびCountを含む情報を渡す。Queueは、Worker
スレッド25が、サーバ情報取得の指示を取り出すキュー24の名称である。Dataは、採取したサーバ情報の格納先である性能情報格納テーブル26である。Countは、採取した
サーバ情報を保管する世代数である。サーバ情報を保管する世代数は、サーバ情報取得API処理部20の起動時に、ユーザが指定する設定ファイルから読み込まれるようにしてもよい。
Monitorスレッド23は、In_id、In_pw、In_IpaddressおよびIn_SerialNumを含むエントリをキュー24に登録する。In_idは、OS接続情報のユーザIDである。In_pwは、OS接続情報のパスワードである。In_Ipaddressは、OS接続情報のIPアドレスである。In_SerialNumは、監視対象サーバ40のシリアル番号である。Workerスレッド25は、キュー24から取り出したIn_id、In_pw、In_Ipaddressによって、監視対象サーバ40と通信し、サーバ情報を採取する。
<処理の流れ>
図15から図18は、Mainスレッド21、Monitorスレッド23およびWorkerスレッド25によるサーバ情報取得の処理の流れを説明する。
図15は、Mainスレッド21の処理のフローチャートの一例である。Mainスレッド21の処理は、例えば、マネージャ30からのサーバ情報取得の依頼により開始される。
OP11では、Mainスレッド21は、監視対象サーバ40のサーバ管理機構41から、シリアル番号等のサーバ基本情報を採取する。次に処理がOP12に進む。OP12では、Mainスレッド21は、スレッド管理テーブル22を検索する。次に処理がOP13に進む。
OP13では、Mainスレッド21は、スレッド管理テーブル22に、当該監視対象サーバ40のIPアドレスに合致するキーがあるか否かを判定する。合致するキーがある場合には(OP13:Y)、処理がOP18に進む。合致するキーがない場合には(OP13:N)、処理がOP14に進む。
OP14では、Mainスレッド21は、Workerスレッド25の数が上限値よりも小さいか否かを判定する。Workerスレッド25の数が上限値よりも小さい場合には(OP14:Y)、処理がOP15に進む。Workerスレッド25の数が上限値である場合には(OP14:N)、処理がOP16に進む。
OP15では、Mainスレッド21は、Workerスレッド25を生成し、開始する。次に処理がOP16に進む。OP16では、Mainスレッド21は、Monitorスレッド23を生成し、開始する。次に処理がOP17に進む。
OP17では、Mainスレッド21は、スレッド管理テーブル22に、生成したMonitorスレッド23を、当該監視対象サーバ40と関連付けて登録する。次に処理がOP19に進む。
OP18では、Mainスレッド21は、スレッド管理テーブル22に保持されたMonitorスレッド23の接続情報を更新する。Mainスレッド21は、接続情報が変更されていない場合には、Monitorスレッド23の接続情報を更新しなくてもよい。次に処理がOP19に進む。
OP19では、Mainスレッド21は、監視対象サーバ40のサーバ管理機構41から、OS、Input/Output(I/O)搭載情報等の各種情報を採取する。次に処理がOP20に進む。
OP20では、Mainスレッド21は、性能情報格納テーブル26を検索する。次に処理がOP21に進む。OP21では、Mainスレッド21は、性能情報格納テーブル26に、当該監視対象サーバ40のシリアル番号に合致するキーがあるか否かを判定する。合致するキーがある場合には(OP21:Y)、処理がOP23に進む。合致するキーがない場合には(OP21:N)、処理がOP22に進む。
OP22では、Mainスレッド21は、タイマーにより所定の待ち時間が経過した後、処理がOP20に戻る。すなわち、Mainスレッド21は、Workerスレッド25により当該監視対象サーバ40のサーバ情報が性能情報格納テーブル26に格納されるまでの間、OP20からOP22までの処理を繰り返す。OP23では、Mainスレッド21は、当該監視対象サーバ40の性能情報Listを取得し、Mainスレッド21の処理を終了する。
図16は、Monitorスレッド23の処理のフローチャートの一例である。Monitorスレッド23の処理は、例えば、Mainスレッド21が、Monitorスレッド23を生成し、開始することにより開始される。
OP31では、Monitorスレッド23は、キュー24への登録処理のリトライ回数を初期化する。次に処理がOP32に進む。OP32では、Monitorスレッド23は、キュー24に、接続情報を含むサーバ情報取得の指示を登録する。次に処理がOP33に進む。
OP33では、Monitorスレッド23は、OP32の登録処理によりキューが溢れるか否かを判定する。キューが溢れる場合には(OP33:Y)、処理がOP34に進む。キューが溢れない場合には(OP33:N)、処理がOP40に進む。
OP34では、Monitorスレッド23は、キュー24への登録処理のリトライ回数を1増やす。次に処理がOP35に進む。OP35では、Monitorスレッド23は、キュー24の待ち時間が、サーバ情報の採取間隔よりも小さいか否かを判定する。キュー24の待ち時間は、キュー24へのリトライ回数とリトライ間隔から算出することができる。キュー24の待ち時間がサーバ情報の採取間隔よりも小さい場合には(OP35:Y)、処理がOP40に進む。キュー24の待ち時間がサーバ情報の採取間隔以上の場合には(OP35:N)、処理がOP36に進む。
OP36では、Monitorスレッド23は、タイマーにキューのリトライ間隔を代入する。次に処理がOP37に進む。OP37では、Monitorスレッド23は、タイマーをセットしスリープする(OP38)。タイマーの待ち時間が経過すると、Monitorスレッド23は、ウェイクアップをして(OP39)、処理がOP32に戻る。
OP40では、Monitorスレッド23は、タイマーに“採取間隔−キュー待ち時間”を代入する。次に処理がOP41に進む。OP41では、Monitorスレッド23は、タイマーをセットしスリープする(OP42)。タイマーの待ち時間が経過すると、Monitorスレッド23は、ウェイクアップをして(OP43)、処理がOP31に戻る。
図17は、Monitorスレッド23の接続情報更新処理のフローチャートの一例である。図17の処理は、図15のOP18の詳細な処理を示す。OP51では、Monitorスレッド23は、スレッド管理テーブル22に保持するOS接続情報において、ユーザIDおよびパスワードを更新する。処理が図15のOP19に戻る。
図18は、Workerスレッド25の処理のフローチャートの一例である。Workerスレッド25の処理は、例えば、Monitorスレッド23がキュー24にサーバ情報取得の指示を登録することにより開始される。
OP61では、Workerスレッド25は、キュー24にサーバ情報取得の指示が登録されているか否かを判定する。キュー24にサーバ情報取得の指示が登録されている場合には(OP61:Y)、処理がOP64に進む。キュー24にサーバ情報取得の指示が登録されていない場合には(OP61:N)、処理がOP62に進む。OP62では、Workerスレッド25は、スリープする。キュー24にサーバ情報取得の指示が登録されると(OP63)、処理がOP64に進む。
OP64では、Workerスレッド25は、キュー24から、接続情報を含むサーバ情報取得の指示を取り出す。次に処理がOP65に進む。OP65では、Workerスレッド25は、監視対象サーバ40からサーバ情報を採取する。次に処理がOP66に進む。
OP66では、Workerスレッド25は、サーバ情報の採取に成功したか否かを判定する。サーバ情報の採取に成功した場合には(OP66:Y)、処理がOP67に進む。サーバ情報の採取に成功しなかった場合には(OP66:N)、処理がOP68に進む。
OP67では、Workerスレッド25は、採取したサーバ情報を編集する。サーバ
情報の編集は、CPU使用率の算出等、採取したサーバ情報を性能情報格納テーブル26に格納する値に編集することである。次に処理がOP69に進む。
OP68では、Workerスレッド25は、当該監視対象サーバ40の性能情報リストのエントリに空のデータを格納する。データが空のエントリは、当該監視対象サーバ40との通信が不可能であったことを示す。次に処理がOP69に進む。
OP69では、Workerスレッド25は、性能情報格納テーブル26に、当該監視対象サーバ40からの採取情報が既に存在するか否かを判定する。当該監視対象サーバ40からの採取情報が既に存在する場合には(OP69:Y)、処理がOP70に進む。当該監視対象サーバ40からの採取情報が存在しない場合には(OP69:N)、処理がOP72に進む。
OP70では、Workerスレッド25は、過去に採取した情報を格納した性能情報リストを取り出す。次に処理がOP71に進む。OP71では、Workerスレッド25は、性能情報リストの最古のエントリを削除する。なお、性能情報リストに含まれるエントリの数が、所定の世代数より少ない場合は、Workerスレッド25は、最古のエントリを削除しなくてもよい。次に処理がOP72に進む。
OP72では、Workerスレッド25は、性能情報リストの最新のエントリにOP65で採取した情報を格納する。次に処理がOP73に進む。OP73では、Workerスレッド25は、性能情報リストを性能情報格納テーブル26に登録する。次に処理がOP61に戻る。
<実施形態の作用効果>
監視対象サーバ40を監視するためには、監視対象サーバ40と1対1で管理スレッドが生成される。管理スレッドは、監視対象サーバ40と通信をしてサーバ情報を採取するため、通信を伴わないスレッドよりも、メモリ使用量および通信負荷等の負荷が高い。このため、監視対象サーバ40の増加にともなって負荷が高くなる。
本実施形態において、管理スレッドの役割は、Monitorスレッド23およびWorkerスレッド25によって分担される。Workerスレッド25は、他の処理よりも負荷が高い情報採取の処理等を分担する。また、Workerスレッド25の数は、監視対象サーバ40の数より少ない数に制限される。Workerスレッド25の数を超えてサーバ情報取得の指示があった場合、超えた分の指示は、キュー24に登録される。キュー24に登録された指示は、処理を終えたWorkerスレッド25によって取り出され、順次処理される。
このように、Workerスレッド25の数を制限して各監視対象サーバ40の情報を採取することで、監視装置10は、単位時間あたりの処理量を制限し、使用するリソースを抑制することができる。すなわち、監視装置10は、Workerスレッド25に割り当てられるリソースを再利用することで、メモリの使用量、通信負荷等の負荷を抑制することができる。
また、本実施形態において、1つのWorkerスレッド25は、複数の監視対象サーバ40から情報を採取する。このため、採取した情報は、Workerスレッド25とは別の性能情報格納テーブル26に保持される。Mainスレッド21は、性能情報格納テーブル26をWorkerスレッド25と共有する。したがって、Mainスレッド21は、Workerスレッド25と通信することなく、また、Workerスレッド25の処理とは非同期に、性能情報格納テーブル26から、採取した情報を取り出すことができ
る。これにより、Mainスレッド21は、Workerスレッド25が処理中か否かに拘らず、マネージャ30への応答が可能となり応答時間は短縮される。応答時間が短縮されることで、採取した情報が端末等の画面に表示されるまでの時間が短縮され、画面表示性能は改善される。
<変形例1>
図19は、監視対象サーバ40とMonitorスレッド23をシリアル番号で対応付ける変形例1を示す図である。図19において、監視対象サーバ40のIPアドレスは、“192.168.1.1”から“192.168.1.2”に変更される。また、スレッド管理テーブル22は、図11の場合と異なり、IPアドレスではなくシリアル番号をキーとする。監視対象サーバ40は、シリアル番号“SQ1234AB00001”により、Monitorスレッド23であ
る“Monitor 1”と対応付けられる。
IPアドレスの変更前、“Monitor 1”は、サーバ情報取得の依頼を受け付けると(D
1)、Workerスレッド25に対して監視対象サーバ40の情報採取を指示する(D2)。Workerスレッド25は、図12に示す性能情報格納テーブル26から、シリアル番号“SQ1234AB00001”に対応付けられる“性能情報LIST1”を取得する。
“性能情報LIST1”は、最新世代、一つ前世代、最古世代の3世代の性能情報のエント
リを有する。Workerスレッド25は、一つ前世代のエントリに、監視対象サーバ40から取得した性能情報を格納する(D3)。このとき、監視対象サーバ40のIPアドレスは変更前の“192.168.1.1”である。
次に、IPアドレスの変更後、“Monitor 1”は、サーバ情報取得の依頼を受け付ける
と(D1)、Workerスレッド25に対して監視対象サーバ40の情報採取を指示する(D4)。IPアドレスの変更前と同様に、Workerスレッド25は、“性能情報LIST1”を取得する。IPアドレスが変更されても、シリアル番号は変わらないため、変
更前と同じ“性能情報LIST1”が取得される。Workerスレッド25は、最新世代の
エントリに、監視対象サーバ40から取得した性能情報を格納する(D5)。このとき、IPアドレスの変更後であるため、監視対象サーバ40のIPアドレスは“192.168.1.2
”である。
なお、図19の変形例1における処理の流れは、図15から図18とほぼ同様であるため、異なる点が説明される。図15のOP13では、Mainスレッド21は、スレッド管理テーブル22に、監視対象サーバ40のIPアドレスではなく、シリアル番号に合致するキーがあるか否かを判定する。また、図17のOP51では、Monitorスレッド23は、スレッド管理テーブル22に保持するOS接続情報において、ユーザIDおよびパスワードの他、IPアドレスも更新する。
変形例1は、IPアドレスではなくシリアル番号をキーとして、監視対象サーバ40とMonitorスレッド23を対応づける。性能情報はシリアル番号をキーとして性能情報格納テーブル26に格納されるため、同一の監視対象サーバ40に対するサーバ情報は、IPアドレスが変更された場合でも、シリアル番号をキーとして取得することができる。
<変形例2>
図20は、監視対象サーバ40が複数のOSを有する変形例2を示す図である。図20において、監視対象サーバ40は、IPアドレスが“192.168.1.1”のOS1と“192.168.1.2”のOS2を有する。OS1は、図11のスレッド管理テーブル22を参照して、“Monitor 1”と対応付けられる。同様に、OS2は、“Monitor 2”と対応付けられる。
“Monitor 1”は、サーバ情報取得の依頼を受け付けると(E1)、Workerスレ
ッド25に対して監視対象サーバ40の情報採取を指示する(E2)。Workerスレッド25は、性能情報格納テーブル26から、シリアル番号“SQ1234AB00001”に対応付
けられる“OS_LIST1”を取得する(E3)。Workerスレッド25は、“OS_LIST1”に監視対象サーバ40から取得した性能情報を格納する(E4)。
同様に、“Monitor 2”は、サーバ情報取得の依頼を受け付けると(E5)、Work
erスレッド25に対して監視対象サーバ40の情報採取を指示する(E6)。Workerスレッド25は、性能情報格納テーブル26から、シリアル番号“SQ1234AB00001”
に対応付けられる“OS_LIST1”を取得する(E7)。Workerスレッド25は、“OS_LIST1”に監視対象サーバ40から取得した性能情報を格納する(E4)。
なお、図20の変形例2におけるMainスレッド21およびMonitorスレッド23の処理の流れは、図15から図17と同様である。Workerスレッド25に対して監視対象サーバ40の情報採取を指示する(E2)。Workerスレッド25の処理の流れは、図21に示される。
図21は、変形例2におけるWorkerスレッドの処理のフローチャートの一例である。OP61からOP73までの処理は図18とほぼ同様であるため、同一の符号を付して説明は省略される。
OP69では、Workerスレッド25は、性能情報格納テーブル26に、監視対象サーバ40に対応するOS_LISTが存在するか否かを判定する。当該監視対象サーバ40に対応するOS_LISTが存在する場合には(OP69:Y)、処理がOP74に進む。当該監視対象サーバ40に対応するOS_LISTが存在しない場合には(OP69:N)、処理がOP75に進む。
OP74では、Workerスレッド25は、性能情報格納テーブル26から取得したOS_LISTに、当該監視対象サーバ40からの採取情報が既に存在するか否かを判定する。当該監視対象サーバ40からの採取情報が既に存在する場合には(OP74:Y)、処理がOP70に進む。当該監視対象サーバ40からの採取情報が存在しない場合には(OP74:N)、処理がOP76に進む。
OP75では、Workerスレッド25は、性能情報格納テーブル26に、当該監視対象サーバ40に対応するOS_LISTを登録する。OS_LISTには、当該監視対象サーバ40が有するOSのIPアドレスが登録される。次に処理がOP72に進む。OP76では、Workerスレッド25は、当該監視対象サーバ40に対応するOS_LISTを最新の状態に更新する。次に処理がOP72に進む。
変形例2は、監視対象サーバ40が複数のOSを有する場合、各OSに対応するMonitorスレッド23が生成される。また、OS_LISTを介して、OSごとに性能情報リストが生成される。これにより、監視対象サーバ40が複数のOSを有する場合でも、OSごとにサーバ情報を取得することができる。
<記録媒体>
コンピュータその他の機械、装置(以下、コンピュータ等)に上記いずれかの機能を実現させるプログラムをコンピュータ等が読み取り可能な記録媒体に記録することができる。そして、コンピュータ等に、この記録媒体のプログラムを読み込ませて実行させることにより、その機能を提供させることができる。
ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。このような記録媒体のうちコンピュータ等から取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、CD−ROM、CD−R/W、DVD、ブルーレイディスク、DAT、8mmテープ、フラッシュメモリなどのメモリカード等がある。また、コンピュータ等に固定された記録媒体としてハードディスクやROM(リードオンリーメモリ)等がある。さらに、Solid State Drive(SSD)はコンピュータ等から取り外し可能な記録媒体としても、コンピュータ等
に固定された記録媒体としても利用可能である。
1 情報処理システム
10 監視装置
11 プロセッサ
12 主記憶装置
13 補助記憶装置
14 入力装置
15 出力装置
16 ネットワークインタフェース
17 バス
20 サーバ情報取得API処理部
21 Mainスレッド
22 スレッド管理テーブル
23 Monitorスレッド
24 キュー
25 Workerスレッド
26 性能情報格納テーブル
30 マネージャ
40 監視対象サーバ
41 サーバ管理機構
42 OS

Claims (7)

  1. 複数の監視対象の情報処理装置に対して作成され、監視対象の情報処理装置に対する情報採取の指示をキューに登録する、複数の監視プロセスと、
    前記キューに登録された前記指示を読み出し、前記監視対象の情報処理装置から被監視情報を採取して記憶部に書き出す、前記複数の監視対象の情報処理装置よりも少ない数の通信プロセスと、
    を実行する監視装置。
  2. 前記記憶部から取得した前記被監視情報を表示する表示部、
    を備える請求項1に記載の監視装置。
  3. 監視装置および複数の監視対象の情報処理装置を有する情報処理システムであって、
    前記監視装置は、
    複数の監視対象の情報処理装置に対して作成され、監視対象の情報処理装置に対する情報採取の指示をキューに登録する、複数の監視プロセスと、
    前記キューに登録された前記指示を読み出し、前記監視対象の情報処理装置から被監視情報を採取して記憶部に書き出す、前記複数の監視対象の情報処理装置よりも少ない数の通信プロセスと、を実行する、
    情報処理システム。
  4. コンピュータに、
    複数の監視対象の情報処理装置に対して作成され、監視対象の情報処理装置に対する情報採取の指示をキューに登録する、複数の監視プロセスと、
    前記キューに登録された前記指示を読み出し、前記監視対象の情報処理装置から被監視情報を採取して記憶部に書き出す、前記複数の監視対象の情報処理装置よりも少ない数の通信プロセスと、
    を実行させるための監視プログラム。
  5. コンピュータに、
    複数の監視対象の情報処理装置に対する情報採取の指示を受け、各監視対象の情報処理装置に対する情報採取の指示をキューに登録させる、
    ためのプログラム。
  6. コンピュータに、
    キューに登録された監視対象の情報処理装置に対する情報採取の指示を読み出させ、
    前記監視対象の情報処理装置から被監視情報を採取して記憶部に書き出させる、
    ためのプログラム。
  7. コンピュータに、
    複数の監視対象の情報処理装置ごとに、監視対象の情報処理装置を特定する情報を含む監視情報をキューに登録する監視プロセスを作成させ、
    前記キューに登録された監視情報を読み出し、前記監視情報により特定される監視対象の情報処理装置から被監視情報を採取して記憶部に書き出す、前記複数の監視対象の情報処理装置よりも少ない数の通信プロセスを作成させ、
    前記記憶部から前記被監視情報を取得させる、
    ためのプログラム。
JP2015004203A 2015-01-13 2015-01-13 監視装置、情報処理システム及び監視プログラム Pending JP2016130892A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015004203A JP2016130892A (ja) 2015-01-13 2015-01-13 監視装置、情報処理システム及び監視プログラム
US14/957,751 US20160204999A1 (en) 2015-01-13 2015-12-03 Monitoring apparatus and information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015004203A JP2016130892A (ja) 2015-01-13 2015-01-13 監視装置、情報処理システム及び監視プログラム

Publications (1)

Publication Number Publication Date
JP2016130892A true JP2016130892A (ja) 2016-07-21

Family

ID=56368324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015004203A Pending JP2016130892A (ja) 2015-01-13 2015-01-13 監視装置、情報処理システム及び監視プログラム

Country Status (2)

Country Link
US (1) US20160204999A1 (ja)
JP (1) JP2016130892A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3497595A1 (en) * 2016-08-08 2019-06-19 Johnson & Johnson Surgical Vision, Inc. System and method for providing a standardized medical device control
US11238981B2 (en) 2016-08-08 2022-02-01 Johnson & Johnson Surgical Vision, Inc. System and method for providing a genericized medical device architecture
CN108415806A (zh) * 2018-02-07 2018-08-17 深圳市亿联智能有限公司 一种高效率线程生命监测方式
CN110912785A (zh) * 2019-12-26 2020-03-24 联陆智能交通科技(上海)有限公司 Rsu健康检测方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009144969A2 (ja) * 2008-05-27 2009-12-03 株式会社日立製作所 計算機システムにおける情報収集方法、その方法を用いる管理計算機、及び計算機システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6477561B1 (en) * 1998-06-11 2002-11-05 Microsoft Corporation Thread optimization
US20040194088A1 (en) * 2002-05-08 2004-09-30 Jin-Rwei Chen Network device management
US7653722B1 (en) * 2005-12-05 2010-01-26 Netapp, Inc. Server monitoring framework
US20120291034A1 (en) * 2011-05-14 2012-11-15 International Business Machines Corporation Techniques for executing threads in a computing environment

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009144969A2 (ja) * 2008-05-27 2009-12-03 株式会社日立製作所 計算機システムにおける情報収集方法、その方法を用いる管理計算機、及び計算機システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ALEX HOMER,外4名, クラウドデザインパターン, vol. 第1版, JPN6018031930, 9 June 2014 (2014-06-09), JP, pages 24 - 31, ISSN: 0003992731 *
小池統,外2名: "MPLSネットワークのトラヒック収集方式と管理の一検討", 情報処理学会研究報告 2004−DSM−33, vol. 第2004巻,第46号, JPN6018031929, 14 May 2004 (2004-05-14), JP, pages 93 - 98, ISSN: 0003992730 *

Also Published As

Publication number Publication date
US20160204999A1 (en) 2016-07-14

Similar Documents

Publication Publication Date Title
JP6893284B2 (ja) リソーススケジューリング方法、スケジューリングサーバ、クラウドコンピューティングシステム、及び記憶媒体
JP4980792B2 (ja) 仮想計算機の性能監視方法及びその方法を用いた装置
JP5212360B2 (ja) 制御プログラム、制御システムおよび制御方法
US9852008B2 (en) Computer-readable recording medium storing execution information notification program, information processing apparatus, and information processing system
US9170840B2 (en) Duration sensitive scheduling in a computing environment
WO2012066640A1 (ja) 計算機システム、マイグレーション方法及び管理サーバ
JP2010282420A (ja) 管理計算機、リソース管理方法、リソース管理プログラム、記録媒体および情報処理システム
JP2016130892A (ja) 監視装置、情報処理システム及び監視プログラム
US20160147572A1 (en) Modifying memory space allocation for inactive tasks
JP2017528794A (ja) 負荷に基づく動的統合
JP2015075898A (ja) 処理再開方法、処理再開プログラムおよび情報処理システム
JP6237230B2 (ja) メモリ管理プログラム、メモリ管理方法、及びメモリ管理装置
CN111488492A (zh) 用于检索图数据库的方法和装置
CN100538649C (zh) 用于分发分派窗内的未使用的处理器循环的方法和系统
WO2013035246A1 (ja) 仮想計算機制御装置、仮想計算機制御方法、仮想計算機制御プログラム、及び集積回路
US8977752B2 (en) Event-based dynamic resource provisioning
CN110109741B (zh) 循环任务的管理方法、装置、电子设备及存储介质
JP4992740B2 (ja) マルチプロセッサシステム、障害検出方法および障害検出プログラム
JP6645275B2 (ja) 情報処理装置、仮想マシン移動方法、および仮想マシン制御プログラム
Liu et al. Towards low-latency I/O services for mixed workloads using ultra-low latency SSDs
US20130298132A1 (en) Multi-core processor system and scheduling method
JP5597293B2 (ja) 計算機システム及びプログラム
CN111782341A (zh) 用于管理集群的方法和装置
JP2016100731A (ja) 情報処理装置およびその制御方法、並びにプログラム
CN117093335A (zh) 分布式存储系统的任务调度方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180821

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190312