JP5782563B2 - 情報取得方法、計算機システム及び管理計算機 - Google Patents

情報取得方法、計算機システム及び管理計算機 Download PDF

Info

Publication number
JP5782563B2
JP5782563B2 JP2014512043A JP2014512043A JP5782563B2 JP 5782563 B2 JP5782563 B2 JP 5782563B2 JP 2014512043 A JP2014512043 A JP 2014512043A JP 2014512043 A JP2014512043 A JP 2014512043A JP 5782563 B2 JP5782563 B2 JP 5782563B2
Authority
JP
Japan
Prior art keywords
information
group
acquisition
computer
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014512043A
Other languages
English (en)
Other versions
JPWO2013160983A1 (ja
Inventor
敬太 嶋田
敬太 嶋田
高本 良史
良史 高本
貴志 爲重
貴志 爲重
健太郎 渡邊
健太郎 渡邊
裕 工藤
裕 工藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Application granted granted Critical
Publication of JP5782563B2 publication Critical patent/JP5782563B2/ja
Publication of JPWO2013160983A1 publication Critical patent/JPWO2013160983A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0853Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0894Policy-based network configuration management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0895Configuration of virtualised networks or elements, e.g. virtualised network function or OpenFlow elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、データセンタなどのインフラの管理者や、上位管理製品が情報を利用する単位で、管理対象のIT機器群の情報を集中して取得することにより、その単位内の管理対象情報の取得時間の差を縮小させる技術に関する。
現在、データセンタ内のIT機器を統合管理する製品を用いて、全てのIT機器のリソースを管理する市場の動きがある。また、サーバ仮想化技術の浸透により、管理対象となる仮想サーバを含むIT機器やサーバの数が増える傾向にある。従来の運用では、管理サーバが管理対象となるIT機器の全ての情報を予め登録した順序(IPアドレスなど)で定期に取得しておく。管理者は、必要に応じて管理サーバに保持された情報を参照していた(例えば、特許文献1)。
国際公開第2009/144969号
しかしながら、上記従来の定期的な情報取得方法では、管理者や、管理サーバと連携するアプリケーション(例えば、構成情報管理アプリケーションなど)が情報を利用するまとまりを考慮していない為、インフラの管理者や上位管理製品は、情報の鮮度に大きくばらつきのある情報を合わせて利用する恐れがあった。すなわち、予め登録した順序で取得した情報のうち最悪のケースでは、最初に取得した情報と最後に取得した情報を合わせて利用することになる。このため、情報を併せて利用する時点で最初の情報が変更されていないことを判定する必要があった。つまり、インフラの管理者などが障害の発生に対応して情報取得を行う際に、情報収集開始の時点で情報を取得する対象や順番を変更することができない、という問題があった。
そこで本発明は、インフラの管理者や、管理サーバと連携するアプリケーションが利用するIT機器のグループ内で、管理対象のIT機器群の情報を迅速に取得することを目的とする。
本発明は、プロセッサとメモリとインターフェースを備えた管理計算機と、前記管理計算機と複数の計算機を接続するネットワークと、を備えて前記管理計算機がネットワークを介して前記計算機の情報を取得する情報取得方法であって、前記管理計算機が、前記複数の計算機のうち、情報を取得する計算機のグループを取得グループ情報に設定する第1のステップと、前記管理計算機が、情報の取得対象とするグループの順序を決定した後に、前記情報の取得対象とする計算機のグループ内の順序を決定する第2のステップと、前記管理計算機が、前記決定された情報の取得対象とするグループの順序と前記情報の取得対象とする計算機のグループ内の順序で計算機の情報を取得する指令を出力する第3のステップと、前記情報を取得する指令に基づいて情報取得実行部が、前記決定された情報の取得対象とするグループの順序と前記情報の取得対象とする計算機のグループ内の順序で前記グループ毎の計算機の情報を取得する第4のステップと、を含む。
本発明によれば、管理者や管理計算機と連携するアプリケーションが利用する計算機システムを構成する機器のグループにおいて、管理対象の機器の情報をグループ単位で集中して取得することが可能となり、当該グループ内の管理対象情報の取得時間を短く抑えることができる。
本発明の第1の実施形態を示し、計算機システムの一例を示すブロック図である。 本発明の第1の実施形態を示し、管理サーバの機能部位の一例を示すブロック図である。 本発明の第1の実施形態を示し、サーバの機能部位の一例を示すブロック図である。 本発明の第1の実施形態を示し、ストレージ装置の機能部位の一例を示すブロック図である。 本発明の第1の実施形態を示し、仮想サーバを提供するサーバの機能部位の一例を示すブロック図である。 本発明の第1の実施形態を示し、管理機器登録テーブルの一例を示す図の前半である。 本発明の第1の実施形態を示し、管理機器登録テーブルの一例を示す図の後半である。 本発明の第1の実施形態を示し、構成情報トポロジーテーブルの一例を示す図である。 本発明の第1の実施形態を示し、取得グループポリシーテーブルの一例を示す図である。 本発明の第1の実施形態を示し、取得グループテーブルの一例を示す図である。 本発明の第1の実施形態を示し、取得順序テーブルの一例を示す図である。 本発明の第1の実施形態を示し、計算機システムで行われる処理の一例の概要を示すブロック図である。 本発明の第1の実施形態を示し、管理サーバの制御部で行われる処理の一例を示すフローチャートである。 本発明の第1の実施形態を示し、管理サーバの管理対象検出部で行われる処理の一例を示すフローチャートである。 本発明の第1の実施形態を示し、管理サーバのトポロジー生成部で行われる処理の一例を示すフローチャートである。 本発明の第1の実施形態を示し、管理サーバの取得グループ生成部で行われる処理の一例を示すフローチャートの前半である。 本発明の第1の実施形態を示し、管理サーバの取得グループ生成部で行われる処理の一例を示すフローチャートの後半である。 本発明の第1の実施形態を示し、管理サーバの取得順序決定部で行われる処理の一例を示すフローチャートの前半である。 本発明の第1の実施形態を示し、管理サーバの取得順序決定部で行われる処理の一例を示すフローチャートの後半である。 本発明の第1の実施形態を示し、管理サーバの情報取得部で行われる処理の一例を示すフローチャートである。 本発明の第1の実施形態を示し、管理サーバの取得順序決定部で生成される一時登録テーブルの一例である。 本発明の第1の実施形態を示し、ポーリングスレッド割当テーブルの一例を示す図である。 本発明の第1の実施形態を示し、管理サーバのポーリングスレッド割当部で行われる処理の一例を示すフローチャートの後半である。 本発明の第2の実施形態を示し、管理サーバの機能部位の一例を示すブロック図である。 本発明の第2の実施形態を示し、制約テーブルの一例を示す図である。 本発明の第2の実施形態を示し、管理サーバの情報取得部で行われる処理の一例を示すフローチャートの前半である。 本発明の第2の実施形態を示し、管理サーバの情報取得部で行われる処理の一例を示すフローチャートの後半である。 本発明の第3の実施形態を示し、管理サーバの機能部位の一例を示すブロック図である。 本発明の第3の実施形態を示し、管理サーバのアラート検知部で行われる処理の一例を示すフローチャートである。 本発明の第3の実施形態を示し、管理サーバの実行判定部で行われる処理の一例を示すフローチャートである。 本発明の第4の実施形態を示し、計算機システムの一例を示すブロック図である。 本発明の第4の実施形態を示し、ポーリングスレッド用サーバの機能部位の一例を示すブロック図である。 本発明の第4の実施形態を示し、管理サーバの情報送受信部で行われる処理の一例を示すフローチャートである。 本発明の第4の実施形態を示し、ポーリングスレッド用サーバの情報送受信部で行われる処理の一例を示すフローチャートである。 本発明の第4の実施形態を示し、一時管理機器登録テーブルの一例を示す図である。 本発明の第4の実施形態を示し、一時管理機器登録テーブルの一例を示す図である。 本発明の第4の実施形態を示し、取得順序テーブルの一例を示す図である。
以下、本発明の一実施形態について添付図面を用いて説明する。
<第1実施形態>
図1は、本発明の第1の実施形態の計算機システムの一例を示すブロック図である。管理サーバ101は、管理LAN100とNW−SW(管理用ネットワークスイッチ)102を介して、NW−SW102の管理インターフェース(管理I/F)112と、NW−SW(業務用ネットワークスイッチ)103の管理インターフェース113と、FC(Fibre Channel)−SW107の管理インターフェース117と、サーバ104−1〜104−3の管理インターフェース114と、サーバ105の管理インターフェース115と、仮想サーバ106−1〜106−2の管理インターフェース116と、ストレージ装置108[0]−1〜108−2の管理インターフェース118に接続されている。なお、各管理インターフェース112〜118は、管理サーバ101からの問い合わせに応じて各IT機器(以下、単に機器とする)の情報を送信するためのインターフェース(またはI/Oインターフェース)であり、例えば、後述のネットワークインターフェースを採用することができる。
管理LAN100とNW−SW102は、管理サーバ101が複数のサーバ104−1〜104−3を管理するためのネットワークを構成する。なお、以下ではサーバ104−1〜104−3の総称をサーバ104で表し、仮想サーバ106−1〜106−2を仮想サーバ106で表す。
管理サーバ101は、各サーバ104で稼働するOSやアプリケーションの配布や電源制御等の運用管理をする。NW−SW103は、業務用のネットワークを構成し、サーバ104上で実行される業務アプリケーションによって使用されるネットワークである。なお、NW−SW103は、業務LAN109を経由し、WAN等に接続されて計算機システムの外部のクライアント計算機と通信を行う。
管理サーバ101上では、制御部110が実行され、管理テーブル群111を参照および更新する。管理テーブル群111は制御部110によって後述するように更新または設定される。
管理セグメント150は、管理サーバ101が管理する領域である。管理セグメント150の定義は、管理者が任意で設定することが可能である。例えば、IPアドレスのネットワークセグメントで、1.1.1.X(Xは任意の数字)はセグメント1、1.1.2.Y(Yは任意の数字)はセグメント2などと定義しても良いし、または、本実施形態のNW−SW102の様に特定の機器を基準に定義しても良い。なお、図示はしないが、管理セグメントは複数存在しても良い。
図2は、管理サーバ101の構成を示すブロック図である。管理サーバ101は、演算を行うCPU(Central Processing Unit)201と、CPU201で実行するプログラムや、プログラムの実行に伴うデータを格納するメモリ202と、プログラムやデータを格納するストレージ装置108などへアクセスするためのディスクインターフェース204と、IPネットワークを介した通信のためのネットワークインターフェース205と、PCI Express(I/Oインターフェース)規格のI/Oデバイス(NIC(Network Interface Card)、HBA(Host Bus Adapter)、CNA(Converged Network Adapter)、といったI/OアダプタまたはI/Oデバイス)を接続することができるPCI−Expressインターフェース206から構成される。
図2の管理サーバ101では、ネットワークインターフェース205と、ディスクインターフェース204を、それぞれ代表して一つずつ示しているが、各々が複数あってもよい。たとえば、管理用ネットワーク102と業務用ネットワーク103への接続は、各々異なるネットワークインターフェース205を用いるようにしてもよい。
メモリ202には、制御部110と管理テーブル群111と情報取得ポーリングスレッド(情報取得実行部)231が格納されている。制御部110は、管理対象検出部214(図13参照)、トポロジー生成部215 (図14参照)、取得グループ生成部217(図15参照)、取得順序決定部216(図16参照)、情報取得部213(図17参照)、ポーリングスレッド割当部218(図20)、を有する。
管理対象検出部214と、トポロジー生成部215と、取得グループ生成部217と、取得順序決定部216と、情報取得部213と、ポーリングスレッド割当部218の各機能部はプログラムとしてメモリ202にロードされる。また、情報取得ポーリングスレッド231は、制御部110がロードされるタイミングで生成されても良いし、情報取得の際に生成されてもよい。
CPU201は、各機能部のプログラムに従って動作することによって、所定の機能を実現する機能部として動作する。例えば、CPU201は、取得グループ生成プログラムに従って動作することで取得グループ生成部217として機能する。他のプログラムについても同様である。さらに、CPU201は、各プログラムが実行する複数の処理のそれぞれを実現する機能部としても動作する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。
管理テーブル群111は、管理機器登録テーブル222(図6参照)、構成情報トポロジーテーブル226(図7参照)、取得グループポリシーテーブル223(図8参照)、取得グループテーブル224(図9参照)、取得順序テーブル225(図10参照)、一時登録テーブル227(図18参照) 、ポーリングスレッド割当テーブル228(図19参照)を有する。
各テーブルの情報は、管理サーバ101内のプログラム(機能部位)により自動生成されたものでも良いし、手動で利用者(または管理端末)が入力したものでも良いし、管理サーバ101と連携するアプリケーションが入力したものでも良い。なお、管理サーバ101と連携するアプリケーションとしては、例えば、上位の構成管理アプリケーションなどで構成される。
管理サーバ101、サーバ104、サーバ105の種別について、物理サーバ、ブレードサーバ、仮想化されたサーバ、論理物理分割または物理分割されたサーバなどのいずれであっても良く、いずれを使った場合も本発明の効果を得ることが出来る。
制御部110の各機能を実現するプログラム、テーブル等の情報は、ストレージ装置108や不揮発性半導体メモリ、ハードディスクドライブ、SSD(Solid State Drive)等の記憶デバイス、または、ICカード、SDカード、DVD等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。
図3は、サーバ104の構成を示すブロック図である。サーバ104は、演算を行うCPU301と、CPU301で実行するプログラムや、プログラムの実行に伴いデータを格納するメモリ302と、プログラムやデータを格納するストレージ装置(またはストレージサブシステム)108へアクセスするためのディスクインターフェース304と、IPネットワークを介して通信を行うためのネットワークインターフェース305と、電源制御や各インターフェースの制御を行うBMC(Basement Management Controller)303とを有する。メモリ302上のOS311がCPU301によって実行され、サーバ102内のデバイス管理を行っている。OS313の下で、業務を提供するアプリケーション311や監視プログラム312などが実行される。
図3では、ネットワークインターフェース305と、ディスクインターフェース304を、それぞれ代表して一つずつ示しているが、各々が複数あってもよい。たとえば、管理用ネットワーク102と業務用ネットワーク103への接続は、各々異なるネットワークインターフェース305を用いる。本実施形態では、サーバ104は管理ネットワーク(NW−SW102)と業務用ネットワーク(NW−SW103)へ接続する為のネットワークインターフェース305を有している。また、管理I/F114(図1参照)は管理ネットワーク(NW−SW102)用のネットワークインターフェース305を示している。
図4は、ストレージ装置108の構成を示すブロック図である。ストレージ装置108は、演算を行うCPU401と、CPU401で実行するプログラムや、プログラムの実行に伴いデータを格納するメモリ402と、ストレージ装置108およびストレージ装置108に接続した機器から送られたプログラムやデータを格納するディスク403と、サーバ104等がストレージ装置108に接続するためのポート404と、管理サーバ101がストレージ装置108を管理する為に利用する管理I/F118を有している。なお、管理I/F118としてはネットワークインターフェースを採用することができる。
図5は、仮想化部521を実行して複数の仮想サーバ106を提供するサーバ105のブロック図である。サーバ105は、サーバ104と同様にCPU502、メモリ501、BMC503、ネットワークインターフェース504、ディスクインターフェース505、PCIeインターフェース506から構成されている。
しかし、サーバ105は、仮想化部521と仮想サーバ106−1、106−2をメモリ501上に有している。サーバ105は、サーバ105の計算機資源を仮想化部521で仮想化し、1つ以上の仮想サーバ106を提供している。なお、仮想化部521は、例えば、ハイパーバイザやVMM(Virtual Machine Monitor)等で構成される。
メモリ501には、計算機資源を仮想化する上述の仮想化部521が格納され、サーバ105では1つ以上の仮想サーバ106を提供する。また、仮想化部521は、制御用インターフェースとして仮想化部管理用インターフェース522を備えている。仮想化部521は、サーバ105(ブレードサーバでも良い)の計算機資源を仮想化することで仮想サーバ106を構成する。仮想サーバ106は、仮想CPU532、仮想メモリ531、仮想ネットワークインターフェース534、仮想ディスクインターフェース535、仮想PCIeインターフェース536から構成されている。仮想メモリ531には、OS541が格納され仮想サーバ106内の仮想デバイス群を管理している。また、OS541上では、業務アプリケーション542が実行されている。OS541上で稼働する管理プログラム543によって、障害の検知やOSの電源制御、インベントリ管理などが提供されている。
仮想化部521は、サーバ105の物理計算機資源と仮想計算機資源の対応付けを管理している。仮想化部521は複数の仮想サーバ106間で通信を行うために仮想スイッチ523を有する。仮想スイッチ523は、サーバ105の物理的なインターフェースを複数の仮想サーバ106に接続させることができる。これにより、仮想サーバ106は、サーバ105の持つインターフェースを経由してサーバ105の外部の機器と接続可能となる。
仮想化部管理用インターフェース522は、仮想化部521が管理サーバ101と通信をするためのインターフェースであり、仮想化部521から管理サーバ101へ情報を通知したり、管理サーバ101から仮想化部521へ指示を送るときに使われる。また、ユーザ端末(図示省略)などから直接、使用することも可能である。
図6A、図6Bは、管理サーバ101に格納される管理機器登録テーブル222を示す。管理機器登録テーブル222は、管理サーバ101が管理する機器が有する構成情報や、当該機器で稼働するソフトウェアや認証に関する情報取得を行う際にまとめて取得する範囲を示すグループの情報などを格納している。本実施形態では、サーバ104、105等の各種サーバや、NW−SW102等のネットワークスイッチや、FC−SW107等のFCスイッチや、ストレージ装置108等のストレージ装置などの種類の異なる機器が同じテーブル上に登録されているが、種類ごとにテーブルが分かれていても良い。
図6A、図6Bにおいて、カラム601は、管理サーバ101が管理する、サーバ104等の機器のノードIDを格納しており、本識別子によって各機器を一意に識別する。カラム601へ格納するデータは、本テーブル222で使用される各カラムのいずれか、または複数カラムを組み合わせたものを指定することで入力を省略することが出来る。また、前記ノードIDは、昇順などで管理サーバ101が自動的に割り振っても良い。
カラム602は、サーバ104等の管理対象機器に割り当てられた管理IPアドレスを格納している。この管理IPアドレスに基づいて管理サーバ101はサーバ104等の管理対象機器に接続する。
カラム603は、サーバ104等の管理対象機器に管理サーバ101が接続する際に利用するユーザ名とパスワードを格納している。なお、図中セパレータ「:」の前方がユーザ名であり、後方がパスワードである。
カラム604は、サーバ104等の管理対象機器のOSの情報を格納している。
カラム605は、サーバ104等の管理対象機器のモデル名が格納されている。このモデル名は、インフラに関する情報であり、サーバ104等の管理対象機器のメーカや性能や構成可能なシステムの限界を知ることが出来る情報である。また、管理対象機器の構成が同じか否かを判別することが出来る情報である。
カラム606は、サーバ104等の管理対象機器の構成が格納されている。構成に関する情報としては、サーバ104やサーバ105等のサーバでは、プロセッサのアーキテクチャや、シャーシやスロットなどの物理位置情報と、特徴機能(ブレード間SMP:Symmetric Multi-Processing、HA(High Availability)構成などの有無)を格納している。NW−SW102やNW−SW103やFC−SW107等のスイッチでは、ポート数などを格納している。
カラム607は、サーバ104等の管理対象機器の稼働情報を格納する。稼働情報は、管理対象機器の電源ON/OFFやOSや業務システムが正常稼働しているかを表す情報である。また、管理サーバ101と管理対象機器間で通信不可となった場合は、その旨を示す稼働情報が登録される。
カラム608は、サーバ104等の管理対象機器の性能情報が格納されている。サーバ104やサーバ105等のサーバでは、プロセッサの動作周波数やコア数、メモリの容量、割り当てられたストレージ装置108の容量と種別、I/Oデバイスの性能などを格納することができる。NW−SW102やNW−SW103やFC−SW107等のスイッチでは、スイッチ容量などを格納することができる。また、ストレージ装置108等のストレージ装置では、ストレージ全体の容量などの情報を格納することができる。
カラム609は、サーバ104等の管理対象機器の情報が取得された時刻またはタイムスタンプを格納している。
カラム610は、サーバ104等の管理対象機器それぞれに対する追加設定項目が格納されている。この追加設定項目は、クラスタ構成、バックアップ構成、負荷分散構成、ハイパーバイザと仮想マシンの関係などに関する情報などである。ユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションから得た管理対象機器に関する情報や、それらの情報に基づいて管理サーバ101が生成した情報を格納しても良い。
カラム611は、サーバ104等の管理対象機器それぞれに関連するグループが格納されている。ここで、グループとは、所定の時間内に情報取得を行いたい管理対象機器をまとめたものであり、後に説明する取得グループ生成部217(図15)で生成される取得グループである。関連するグループには、サーバ104等の管理対象機器それぞれについて、自身が含まれる取得グループが存在した場合、その取得グループのグループID(図9参照)を格納する。
カラム612は、取得順序登録がされているか否かの情報(登録状態)を格納する。登録状態とは、管理サーバ101が、サーバ104等の管理対象機器を、後に説明する取得順序テーブル(図10)に登録しているということを示す。
カラム613は、管理対象全体に対する1回の情報取得処理の中で、それぞれのノードに対して処理が実行されたか否かを表す情報である。
図7は、管理サーバ101に格納される構成情報トポロジーテーブル226を示す。構成情報トポロジーテーブル226は、管理サーバ101の管理対象機器間の接続関係に関する情報を格納している。また、構成情報トポロジーテーブルは、管理サーバ101の管理対象機器全てについて登録されている。
カラム701は、トポロジーIDを格納している。トポロジーIDは、トポロジーの1つのまとまりを一意に識別する為の識別子である。カラム701へ格納するデータは、本テーブルで使用される各カラムのいずれか、または複数カラムを組み合わせたものを指定することで入力を省略することが出来る。また、前記トポロジーIDは、昇順などで管理サーバ101が自動的に割り当てても良い。
カラム707は、トポロジーが存在する管理セグメントの管理セグメントIDを格納している。
カラム702は、トポロジーの起点となるネットワークスイッチを格納している。本実施形態では、ネットワークスイッチ102、103を起点にトポロジーを登録しているが、起点としてはサーバ104やサーバ105のようなサーバでも良いし、FC−SW107のようなFCスイッチでも良いし、ストレージ装置108のようなストレージ装置でも良い。
カラム703とカラム704とカラム705とカラム706は、関連ノードIDを格納している。関連ノードIDは、トポロジーIDが割り当てられたトポロジーのまとまりを構成する機器のノードID(図6参照)を示している。また、カラムが左右で隣あう関連ノード同士は接続関係にあることを示している。本実施形態では、関連ノードIDを格納するカラムはカラム703とカラム704とカラム705とカラム706の4列しか記載されていないが、トポロジーのまとまりを構成する管理対象機器の数により、カラムの数は変更される。
図8は、管理サーバ101に格納される取得グループポリシーテーブル223を示す。取得グループポリシーテーブル223は、管理サーバ101の管理対象機器から、特定の機器を選択し、取得グループを設定する際に使用するポリシーを格納している。
カラム801は、ポリシーIDを格納する。ポリシーIDは、取得グループ設定の為のポリシーを一意に識別する為の識別子である。カラム801へ格納するデータは、本テーブルで使用される各カラムのいずれか、または複数カラムを組み合わせたものを指定することで入力を省略することが出来る。また、前記ポリシーIDは、昇順などで管理サーバ101が自動的に割り振っても良い。
カラム802は、ポリシーを格納する。ポリシーに基づいて取得グループ生成部217(図15)は取得グループを生成する。ポリシーは、例えば、サーバ104がクラスタ構成であることや、バックアップ構成であることや、負荷分散構成であることや、ハイパーバイザと仮想サーバとの関係や、同一ハイパーバイザ上にある仮想マシン同士の関係などがある。それらのポリシーは、ユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションから直接得てもいいし、ユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションが持つ情報に基づいて管理サーバ101が生成しても良いし、管理サーバ101が持つ管理対象機器の情報から管理サーバ101が生成しても良い。
カラム803は、ポリシーに対する優先度を格納する。優先度は、ポリシーに基づいて取得グループを生成する際、グループ優先度を決定する為に参照される。優先度は、ユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションが必要に応じて変更することが可能である。なお、優先度は、値が小さいほど優先度が高くなる。
カラム804は、障害発生時の情報取得を優先するか否かの情報を格納している。ただし、本第1実施形態では使用しない。
図9は、管理サーバ101に格納される取得グループテーブル224を示す。取得グループテーブル224は、ほぼ同一の時間帯に情報取得を行いたい管理対象機器をまとめた取得グループを格納する。前記取得グループを参考に管理サーバ101は管理対象機器の取得の順番を変更する。なお、前記同一の時間帯は、取得グループ内で最初の情報取得機器から最後の情報取得機器までの時間が短時間(例えば、数十分ないし数分)であることを示す。
カラム901は、グループIDを格納する。グループIDは、取得グループを一意に識別する為の識別子である。カラム901へ格納するデータは、本テーブルで使用される各カラムのいずれか、または複数カラムを組み合わせたものを指定することで入力を省略することが出来る。また、前記グループIDは、昇順などで管理サーバ101が自動的に割り振っても良い。
カラム902は、グループの優先度を格納する。グループ優先度は、取得グループポリシーテーブル223のカラム803の優先度に基づいて設定されるもので、管理対象機器に対する情報取得の取得順序を決定する際に、優先すべき取得グループを決定する為に利用する。
カラム903は、グループの登録状態を格納する。登録状態は、管理対象機器に対する情報取得の取得順序を決定する際に、重複して取得グループを設定されるのを避ける為に参照する情報で、グループを構成する管理対象機器が全て取得順序テーブル225(図10)に登録されていれば、グループの登録状態を「登録済」に変更する。
カラム904とカラム905とカラム906とカラム907は、関連ノードIDを格納している。関連ノードIDは、グループを構成する機器のノードID(図6参照)を示している。本実施形態では、関連ノードIDを格納するカラムはカラム904とカラム905とカラム906とカラム907の4つしか記載されていないが、グループを構成する管理対象機器の数により、カラムの数は変更される。
カラム908は、障害発生時の情報取得を優先するか否かの情報を格納している。この情報は、取得グループポリシーテーブル223のカラム804の優先度に基づいて設定される。ただし、本第1実施形態では使用しない。
図10は、管理サーバ101に格納される取得順序テーブル225を示す。取得順序テーブル225は、管理サーバ101が管理対象機器の情報取得を行う際の情報取得順序の情報を格納している。カラム1001は、取得番号を格納する。取得番号は、情報取得を行う際に参照する順番を示しており、本実施形態では、取得番号が小さな値を割り振られている行から順に情報取得を行う。
カラム1002は、カラム1003のノードIDが所属する管理セグメントのセグメントIDを格納する。
カラム1003は、情報取得ポーリングスレッドに割り当てるノードIDを格納する。
図18は、管理サーバ101に格納される一時登録テーブル227を示す。一時登録テーブル227は、取得順序決定部で行う処理中で、取得グループ(関連グループ)の情報を一時的に保持する為に使用するテーブルである。
カラム1701は、取得グループのグループIDを格納している。カラム1702は、取得グループのグループ優先度を格納している。カラム1703は、取得グループの情報のグループ登録状態を格納している。
特に、カラム1702及び1703は、それぞれ、取得グループテーブル224のカラム902、カラム903と同期している。よって、本実施形態のように一時取得テーブル227にカラム1702とカラム1703を作らずに、カラム1701のグループIDに基づいて、取得グループテーブル224のカラム902、カラム903を参照しても良い。
図19は、ポーリングスレッド割当テーブル228を示す。ポーリングスレッド割当テーブル228は、情報取得ポーリングスレッドが情報取得を行う管理対象機器の情報を格納しており、情報取得部213は、ポーリングスレッド割当テーブル228を参照し、情報取得を行う。
カラム1801は、取得番号を格納する。取得番号は、情報取得ポーリングスレッド231が情報取得を行う際に参照する順番を示しており、本実施形態では、取得番号が小さな値を割り振られている行から順に情報取得を行う。
カラム1802とカラム1803は、情報取得ポーリングスレッドに割り当てる管理対象機器(ノードID)を格納する。本実施形態では、カラム1802とカラム1803の2つのみを記載しているが、管理サーバ101が使用する情報取得ポーリングスレッドの数によりカラムの数は変更される。
図11は、計算機システムで行われる処理の一例の概要を表すブロック図である。管理サーバ101は、管理対象機器の情報の取得を行う際、構成情報トポロジーテーブル226に登録されたトポロジーと、取得グループテーブル224に登録された取得グループ3001(図中破線内)を素にして、管理対象機器の情報取得順序を決定し、情報取得を行う。
情報を取得する順序は、基本的にはトポロジーの登録順で決定されるが、管理対象機器が取得グループ3001に所属していた場合は、取得グループ3001に含まれる管理対象機器(図中サーバ1、2)の情報を優先して取得するように情報取得順序を変更する。
また、管理対象機器が複数の取得グループ3001に属していた場合は、優先度が高い取得グループ3001の管理対象機器から情報取得を行うように情報取得順序を決定する。これによって、接続関係がある管理対象機器同士を近い順で情報取得することを可能とする。また、その中でも取得グループ3001として関連性のある管理対象機器同士については、優先してかつ、近い順序で情報取得を行うことを可能とする。
図12は、管理サーバ101の制御部110で行われる処理の一例を示すフローチャートである。
ステップ1101で、ユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションや、管理サーバ101のスケジュール機能からの開始指示を契機に管理対象検出部214が管理対象機器の探索処理を開始する。
ステップ1102で、管理対象検出部214が管理対象機器を検出し、検出された構成情報を管理機器登録テーブル222に登録する。
ステップ1103で、トポロジー生成部215が、管理対象機器間の接続関係を表す構成情報トポロジーテーブル226を生成する。
ステップ1104で、取得グループ生成部217が、ユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションや、管理サーバ101のスケジュール機能からの開始指示を契機に取得グループポリシーテーブル223と管理機器登録テーブル222の情報に基づいて、取得グループを生成する。 ステップ1105で、取得グループ生成部217が、取得グループとそのグループ優先度を取得グループテーブル224に登録する。
取得グループテーブル224には、後述する取得グループポリシーテーブル223で示すように、バックアップ元のサーバとバックアップ先のサーバ及びこれらのサーバを接続する機器が一つのグループを構成するよう設定される。このグループが、管理サーバ101で構成情報を取得する計算機群(取得グループ)として設定され、管理サーバ101は、各取得グループごとに計算機や機器の情報を取得する。取得グループとしては、上述のバックアップの関係の他に、負荷分散を行う複数の計算機をひとつの取得グループとしたり、クラスタ構成が設定された複数の計算機をひとつの取得グループとしたり、仮想サーバとハイパーバイザなどの仮想化部(または物理計算機)をひとつの取得グループとしたり、ソフトウェアが連携する複数のサーバを取得グループとして抽出することができる。なお、ソフトウェアが連携する複数のサーバとしては、WEBサーバ、アプリケーションサーバ、データベースサーバが連携する計算機群をひとつの取得グループとして抽出することができる。管理サーバ101では、上記のように所定のポリシーまたは条件に基づいて、複数のサーバのうち関連のあるサーバを抽出し、取得グループとして設定することができる。
ステップ1106で、取得グループ生成部217が、管理機器登録テーブル222の各管理対象ノードに、それが所属する取得グループの情報を登録する。
ステップ1107で、取得順序決定部216が、管理機器登録テーブル222と取得グループテーブル224と構成情報トポロジーテーブル226を参照し、管理対象ノードの情報取得の順番を決定し、取得順序テーブル225に登録する。
ステップ1108で、ポーリングスレッド割当部218が、取得順序テーブル225を参照し、ポーリングスレッドに対して取得する管理対象ノードを割り当てる。
ステップ1109で、情報取得部213が、ポーリングスレッド割当テーブル228を参照し、必要な数の情報取得ポーリングスレッド231を生成し、前記ポーリングスレッドに、情報取得を指示する。
ステップ1110で、情報取得部213が、前記情報取得ポーリングスレッド231が取得した情報を管理機器登録テーブル222に登録する。
ステップ1111で、情報取得部213が、前記情報取得ポーリングスレッド231が取得した情報を管理機器登録テーブルに登録し、処理を完了する。
図13は、管理サーバ101の管理対象検出部214で行われる処理の一例を示すフローチャートである。この処理は、図12のステップ1101で実行される。
ステップ1201で、ユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションや、管理サーバ101のスケジュール機能からの開始指示を検出する。
ステップ1202で、管理対象検出部214は管理対象機器の探索処理を実行する。
ステップ1203で、管理対象機器を検出し、管理対象検出部214は検出した構成情報を管理機器登録テーブルに登録する。
ステップ1204で、管理対象検出部214は取得グループ生成部217に処理が完了したことを示す通知を行って処理を完了する。
図14は、管理サーバ101のトポロジー生成部215で行われる処理の一例を示すフローチャートである。この処理は、図12のステップ1103で実行される。
ステップ1301で、トポロジー生成部215は管理機器登録テーブル222を参照する。ステップ1302で、トポロジー生成部215は構成情報トポロジーテーブル226を生成する。ここでは、前述のステップ1301で参照した管理対象機器の構成情報を基にして接続関係を検出し、構成情報トポロジーテーブルを生成する。
ステップ1303で、トポロジー生成部215は取得グループ生成部217に処理完了を通知し、処理を完了する。
図15A、図15Bは、管理サーバ101の取得グループ生成部217で行われる処理の一例を示すフローチャートである。この処理は、図12のステップ1104で実行される。
図15Aのステップ1401では、取得グループ生成部217が管理機器登録テーブル222から管理対象機器の情報を取得する。
ステップ1402では、取得グループ生成部217がユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションから、取得グループを生成する為の取得グループポリシーや、取得グループを直接指定する情報や、取得グループの管理対象機器の情報が入力されたか否かを判定する。判定の結果、情報が存在する場合は、ステップ1412に進み、存在しない場合は、ステップ1404へ進む。
ステップ1412では、ユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションから受け付けた情報に、取得グループポリシーが存在するか否かを判定する。取得グループポリシーが存在する場合はステップ1413へ進み、それ以外の場合は、ステップ1403へ進む。
ステップ1413では、取得グループ生成部217がステップ1412で判定した取得グループポリシーを、取得グループポリシーテーブル223(図8)に登録し、ステップ1404へ進む。
ステップ1403では、取得グループ生成部217がユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションからの前記情報を受理し、ステップ1406へ進む。
ステップ1406では、取得グループ生成部217がステップ1403で受理した、管理サーバ101と連携するアプリケーションからの情報に該当する管理対象機器を選択し、ステップ1408に進む。
ステップ1404では、取得グループ生成部217が取得グループポリシーテーブル223を参照し、図15Bのステップ1405に進む。
ステップ1405では、取得グループ生成部217がステップ1401で得た管理対象機器の中から、取得グループポリシーテーブル223に合致する管理対象機器が存在するか否かを判定する。判定の結果、取得グループポリシーテーブル223に合致する管理対象機器が存在した場合は、ステップ1407に進む。合致する管理対象機器が存在しなかった場合は、ステップ1411へ進む。
ステップ1407では、取得グループ生成部217が前記ステップ1405でポリシーに合致すると判定された管理対象機器を選択し、ステップ1408へ進む。
ステップ1408では、取得グループ生成部217が前記ステップ1407で選択した管理対象機器を取得グループとして取得グループテーブル224に登録する。
ステップ1409では、取得グループ生成部217が取得グループポリシーの優先度に基づいて、取得グループにグループ優先度を設定し、ステップ1410に進む。
ステップ1410では、取得グループ生成部217が管理機器登録テーブル222の各管理対象機器の関連グループを格納するカラムに611に、関連する取得グループIDを設定して、ステップ1411に進む。
ステップ1411では、取得グループ生成部217が取得順序決定部216へ取得グループの設定処理が終わったことを通知し、取得グループ生成部217の処理を完了する。
図16A、図16Bは、管理サーバ101の取得順序決定部216で行われる処理の一例を示すフローチャートである。この処理は、図12のステップ1107で実行される処理で、具体的には、図15Bのステップ1411からの通知に基づいて開始される。
ステップ1501では、取得順序決定部216が管理機器登録テーブル222、取得グループテーブル224、構成情報トポロジーテーブル226を参照する。
ステップ1502では、取得順序決定部216が管理機器登録テーブル222の登録状態(カラム612)のステータスを全て未登録に変更する。
ステップ1503では、取得順序決定部216が一時登録テーブル227(図18参照)を生成する。
ステップ1504では、取得順序決定部216が構成情報トポロジーテーブル226の登録順に管理機器登録テーブル222の全管理対象機器が登録状態になるまでループ処理を行う。
ステップ1505では、取得順序決定部216が管理対象機器の登録状態のカラム612が登録済か否かを判断する。登録済以外の場合は、ステップ1506に進む。登録済みの場合はステップ1516に進み、全ての管理対象機器の処理が完了していればステップ1513へ進み、完了していなければステップ1504のループ処理の先頭に戻って上記処理を繰り返す。
ステップ1506では、取得順序決定部216が、上記ステップ1505で登録済みではないと判定された管理対象機器を取得順序テーブル225に登録する。
ステップ1507では、取得順序決定部216が一時登録テーブル227上のグループ(1701)の内、関連ノードの登録状態が全て登録済のグループは、登録状態を登録済に変更し、一時登録テーブル227から削除する。
ステップ1508では、ステップ1506で登録した管理対象機器の関連グループの内、登録状態が未登録、かつ一時登録テーブルに登録されていないグループが存在するか否かを判定する。前記条件に該当するグループが存在する場合は、図16Bのステップ1510へ進む。前記条件に該当するグループが存在しない場合は、図16Bのステップ1509へ進む。
図16Bのステップ1509では、取得順序決定部216が一時登録テーブル227に現在処理中のグループが登録されているか否かを判定する。一時登録テーブル227に現在処理中のグループが登録されていなければステップ1516へ進み、ステップ1504のループ処理の先頭に戻る。一時登録テーブル227に現在処理中のグループが登録されていれば、ステップ1511へ進む。
ステップ1510では、取得順序決定部216が一時登録テーブル227に登録状態が未登録の関連グループを登録する。
ステップ1511では、取得順序決定部216が一時登録テーブル227で最も優先度の高いグループを選択する。
ステップ1512では、取得順序決定部216がステップ1511で選択したグループを構成する関連ノードの内、未登録の関連ノードを1つ選択し、図16Aのステップ1506へ戻って上記処理を繰り返す。
ステップ1516では、管理機器登録テーブルの全管理機器の登録状態が、登録済に変更されたか否かを判断し、全管理機器の登録状態が登録済の場合は、ステップ1513に進む。そうでない場合は、ステップ1505に進み、管理機器登録テーブルに登録された次の管理機器について処理を行う。
ステップ1513では、ステップ1504のループ処理の終わりであり、ステップ1504のループ処理の終了条件を満たしていれば、ステップ1514へ進む。
ステップ1514では、取得順序決定部216がステップ1503で生成した一時登録テーブル227を消去する。
ステップ1515では、取得順序決定部216が管理対象機器の取得順序決定が終了したことをポーリングスレッド割当部218へ通知し、取得順序決定部216の処理を終了する。
以上の処理により、管理サーバ101は、管理機器登録テーブル222の機器について取得グループを設定し、取得グループごとの情報取得順位を決定して一時登録テーブル227に格納する。そして、管理サーバ101は、一時登録テーブル227の取得グループの順序に沿って取得グループ内の機器について情報を取得する順位を決定することができる。
図20は、管理サーバ101のポーリングスレッド割当部218で行われる処理の一例を示すフローチャートである。この処理は、図12のステップ1108で実行される処理であり、具体的には、図16Bのステップ1515で取得順序決定部216が送出した通知を契機として実行される。
ポーリングスレッド割当部218は、取得順序テーブル225の管理対象機器の情報を取得するために、情報取得ポーリングスレッド231を管理対象機器に割り当てる処理を行う。
ステップ1901では、ポーリングスレッド割当部218がポーリングスレッド割当テーブル228を生成する。この際、管理サーバ101で情報取得に使用する情報取得ポーリングスレッド231の数により、ポーリングスレッド割当テーブル228のカラム(カラム1802やカラム1803)の数も変化する。管理サーバ101が生成する情報取得ポーリングスレッド231の数は、予め管理者が設定しておいても良いし、管理サーバ101のマシンスペックから生成可能な情報取得ポーリングスレッド231の数をポーリングスレッド割当部218で推測し、自動的に設定しても良い。
ステップ1902では、ポーリングスレッド割当部218が取得順序テーブル225を参照する。
ステップ1903では、ポーリングスレッド割当部218が取得順序テーブル225に格納された全管理対象機器に対して取得番号順にステップ1904の処理を繰り返して行う、ループ処理を開始する。
ステップ1904では、ポーリングスレッド割当部218が取得順序テーブル225の取得番号順(1001)の順に管理対象機器のノードIDを取得して、ポーリングスレッド割当テーブル228のカラム1802またはカラム1803へ格納する。この処理は、取得順序テーブル225の取得番号1から順に、「NW−SW1」をポーリングスレッド割当テーブル228のポーリングスレッド1(1802)へ格納した後、取得番号2の「サーバ1」をポーリングスレッド2(1803)へ格納する。次に、ポーリングスレッド割当部218は、取得番号3の「サーバ2」を格納するためポーリングスレッド割当テーブル228に新たなエントリを追加してからポーリングスレッド1(1802)へ「サーバ2」を格納する。このように、取得番号順にポーリングスレッドを割り当てて、割り当てるポーリングスレッドがなくなると新たなエントリを追加する。
ステップ1905では、ステップ1903で開始したループ処理がループ条件を全て満たした場合に、そのループ処理を完了させる。
ステップ1906では、情報取得部213に処理の完了を通知し、ポーリングスレッド割当部218の処理を完了とする。
上記処理により、取得順序テーブル225の各ノードIDには、情報取得ポーリングスレッド231が割り当てられ、ポーリングスレッド割当テーブル228が生成される。
図17は、管理サーバ101の情報取得部213で行われる処理の一例を示すフローチャートである。この処理は、図12のステップ1109とステップ1110とステップ1111で実行される処理であり、具体的には、上記図20のステップ1906でポーリングスレッド割当部218が通知を送出した契機で開始される。
ステップ1601では、情報取得部213が管理機器登録テーブル222の全管理機器の定期取得カラム613を未取得に変更する。ステップ1602では、情報取得部213がポーリングスレッド割当テーブル228を参照する。
ステップ1603では、情報取得部213が、情報取得ポーリングスレッド231をポーリングスレッド割当テーブル228のポーリングスレッドの数だけ生成する。尚、既に情報取得ポーリングスレッドが生成されているのであれば、本ステップは無視することができる。図19の例では、ポーリングスレッド1、2の2つの情報取得ポーリングスレッド231が起動する。
ステップ1604では、ポーリングスレッド割当テーブル228の全管理対象機器について情報取得が行われるまで続けるループ処理を開始する。
ステップ1605では、情報取得部213がポーリングスレッド割当テーブル228に従い、各情報取得ポーリングスレッド231に管理対象機器の情報を取得させる。
ステップ1606で、情報取得部213は情報取得ポーリングスレッド231が取得した管理対象機器の情報を管理機器登録テーブル222に登録する。
ステップ1607では、情報取得部213がポーリングスレッド割当テーブル228の全管理対象機器について情報取得が完了すると、ステップ1604で開始したループ処理を終了し、ステップ1608に進む。
ステップ1608では、情報取得部213がステップ1603で生成した、情報取得ポーリングスレッドを消去する。尚、情報取得ポーリングスレッドを消去せずに、メモリ上に保持する場合は、このステップを無視する。
ステップ1609では、ユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションに対して、情報取得処理の完了を通知し、処理を完了する。
以上のように、管理対象機器の情報を取得する順序は、基本的にはトポロジーの登録順で決定されるが、管理対象機器が取得グループ3001に所属していた場合は、取得グループ3001に含まれる管理対象機器の情報を優先して取得するように情報取得順序を変更することができる。
そして、本発明では、管理対象機器が複数の取得グループに属していた場合、優先度が高い取得グループの管理対象機器から情報取得を行うように情報取得の順序を決定する。これによって、接続関係がある管理対象機器同士の情報取得順序を近づけることで、同じ時間帯で情報の取得を行うことが可能となる。さらに、取得グループとして関連性のある管理対象機器同士については、優先してかつ、近い順序で情報取得を行うことが可能となるのである。これにより、取得グループ内では、情報取得の時刻が大幅(例えば、数時間など)に異なるのを防いで、ほぼ同一の時間帯(例えば、数十分以内あるいは数分以内)で取得することが可能となる。
以上より、管理サーバと連携するアプリケーションが利用する機器のグループや、管理者が指定したグループまたはグループ内の管理対象の機器の情報を迅速に取得することが可能となるのである。
<第2実施形態>
第2の実施形態では、取得時間の制約条件が存在した場合に、取得グループに対して制約条件を付加しておき、管理サーバ101は、情報の取得後に制約条件を満たしているか否かを判定する。そして、制約条件を満たしていない場合は、管理サーバ101が情報の再取得を行ったり、ユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションに対して情報取得の失敗を通知する。これにより、ユーザ(管理者)からの入力や管理サーバ101と連携するアプリケーションが設定した条件を満たした構成情報を提供することが可能となる。
本第2実施形態で使用する計算機システムの構成は、前記第1実施形態の図1と同じである。しかし、管理サーバ101の構成については、図21で示すように、前記第1実施形態の構成に加えて制約テーブル(図22)を使用する点が異なる。また、前記第1実施形態の情報取得部213の処理の一部が異なる。
図22は、管理サーバ101に格納される制約テーブル229を示す。制約テーブル229は、ユーザ(管理者)からの入力や、管理サーバ101と連携するアプリケーションから情報取得の指令の際に入力された制約条件を格納する。
制約テーブル229のカラム2001では、制約条件を識別する制約IDを格納する。カラム2002では、入力または設定された制約条件の内容を格納する。カラム2003では、制約条件から抽出した、構成情報を取得するための時間条件を格納する。カラム2004では、制約条件を適用するグループのグループIDを格納する。
図23Aと図23Bは、第2実施形態において情報取得部213で行われる処理の一例を示すフローチャートである。
図23Aのステップ2101からステップ2107までは、前記第1実施形態における情報取得部213(図17)のステップ1601からステップ1607と同様である。
ステップ2108では、情報取得部213が制約テーブル229を参照する。ステップ2109では、情報取得部213が制約テーブル229の個々の制約条件に対して処理が実施し、全ての制約条件に対して処理が行われるまで、ステップ2113との間でループ処理をする。
ステップ2110では、情報取得部213が制約テーブル229のカラム2004で制約条件を適用するグループを参照する。
ステップ2111では、ステップ2110で参照したグループが制約条件を満たしているか否かを情報取得部213が判定する。例えば、「取得グループ内の管理対象機器は1時間以内に取得する」という制約が満たされているか否かを判定する場合、グループ中の関連ノードの内、最初に情報取得を行った管理対象機器の取得時刻と、最後に情報取得を行った管理対象機器の取得時刻を比較し、その時間差が1時間に収まっているか否かを判定する。制約条件を満たしている場合は、ステップ2113へ進む。制約条件を満たしていない場合は、ステップ2112に進む。
ステップ2112では、情報取得部213がステップ2111で制約条件を満たしているか否かを判定したグループの情報を再収集する。ここでは、再収集の代わりに、制約条件が満たされていないことをユーザ端末(図示省略)や連携するアプリケーションに通知しても良い。
ステップ2114、2115は、図17のステップ1608,1609と同様であり、情報取得部213が情報取得ポーリングスレッドを消去してから、ユーザ(管理者)や、管理サーバ101と連携するアプリケーションに対して、情報取得処理の完了を通知して、処理を完了する。
以上のように第2実施形態では、構成情報の取得後に制約条件を取得グループが満たしていたか否かを管理サーバ101が判定し、ユーザ端末(図示省略)や管理サーバ101と連携するアプリケーションに対して、取得グループが制約条件を満たしたか否かを知らせることが可能となる。
<第3実施形態>
第3の実施形態は、管理サーバ101が情報取得を行った際に、障害発生や故障発生などのアラート(障害情報)を検出した場合、その後の情報取得の対象を変更することを可能にするものである。
アラートを発行した管理対象機器と取得グループが同じ機器は、同じ原因で障害が発生している可能性もあるため、管理サーバ101は該当する機器を特定する。そして、管理サーバ101は、特定した機器に対して情報取得の延期や、別のポーリングスレッドを特定された機器へ割り当てることで、情報取得処理全体の遅延やアラートが大量に通知されるアラートストームを回避する。
また、管理サーバ101はRCA(Root Cause Analysis)による障害分析の為に、アラートが通知された管理対象機器と同じ取得グループのノードを優先して取得するように割当ポーリングスレッドを増やすことも可能となる。
本第3実施形態で使用する計算機システムの構成は、前記第1実施形態の図1と同じである。しかし、管理サーバ101の構成は図24で示すように、前記第1実施形態の構成にアラート検知部219と実行判定部220を加えた点が相違する。
図25は、管理サーバ101のアラート検知部219で行われる処理の一例を示すフローチャートである。
ステップ2101では、アラート検知部219が管理対象機器からのアラートを検知する。なお、アラートの検出は、情報取得ポーリングスレッド231が構成情報を取得するときに、管理対象機器からアラートを受け付けると、アラート検知部219に当該アラートを通知する。これにより、アラート検知部219は管理対象機器からのアラートを検出することができる。あるいは、ユーザ(管理者)によるアラートの入力や、管理サーバ101と連携するアプリケーションからのイベント通知からアラートを検出しても良い。
ステップ2102では、アラート検知部219が情報処理部213へ情報取得処理の中断指示を送出し、情報取得ポーリングスレッド231の情報取得を停止させる。
ステップ2103では、アラート検知部219がアラートを通知した管理対象機器を特定する。
ステップ2104では、ステップ2102で特定した管理対象機器の情報を、アラート検知部219が実行判定部220へ引き渡し、アラート検知部219の処理を完了する。
上記処理により、アラート検知部219は管理対象機器のうち、アラートを検出した機器については情報取得ポーリングスレッド231による情報取得を中止させる。
図26は、管理サーバ101の実行判定部220で行われる処理の一例を示すフローチャートである。この処理は、図25のステップ2104でアラート検知部219が通知したことを契機に、管理サーバ101の実行判定部220で行われる。
ステップ2301では、実行判定部220がアラート検知部219から引き渡された管理対象の機器情報を取得する。
ステップ2302では、実行判定部220が管理機器登録テーブル222を参照する。このステップでアラート検知部219から引き渡された管理対象機器の関連グループを特定する。
ステップ2303では、実行判定部220がアラート検知部219から引き渡された管理対象機器に関連グループが存在するか否かを判断する。関連グループが存在する場合はステップ2304に進む。関連グループが存在しない場合は、実行判定部220の処理を完了する。
ステップ2304では、実行判定部220がステップ2303で存在を特定した関連グループについて、障害対応策として、情報取得を優先的に行うか否かを判定する。判定については、には図9の取得グループテーブル224のカラム908の障害発生時に情報の取得を優先するか否かの情報を用いる。実行判定部220は、特定した関連グループのグループID(901)のカラム908の値が「優先」の場合はステップ2305へ進む。そうでない場合は、ステップ2307へ進む。
ステップ2305では、ポーリングスレッド割当部218が取得順序テーブル225を参照し、関連グループの関連ノードを除外して、ステップ2306へ進む。
ステップ2306では、ステップ2305で除外した関連ノードに対して、ポーリングスレッド割当部218で、新規に情報取得ポーリングスレッド231を生成して、関連ノードへ割り当て、ステップ2309へ進む。
優先的に取得しない場合のステップ2307では、実行判定部220が取得順序テーブル225を参照し、関連グループの関連ノードを全て取得順序テーブル225の最後に配置して、ステップ2308へ進む。
ステップ2308では、実行判定部220がポーリングスレッド割当部218へ指示を送り、情報取得ポーリングスレッド231への割り当てを再度実行させ、更新された取得順序テーブル225で情報取得ポーリングスレッド231を割り当てる順序を更新してからステップ2309へ進む。
尚、ステップ2307とステップ2308で行ったように、取得順序テーブル内の関連ノードの順番を変更する代わりに、ステップ2305とステップ2306で行ったように取得順序テーブルから関連ノードを除外し、新たに情報取得ポーリングスレッドを生成して割り当てるようにしても良い。
ステップ2309では、実行判定部220が情報取得部213に指令を出し、情報取得を再開させる。この際、情報取得部213のステップ1601で行う管理対象機器の定期取得カラムを未取得に変更するステップは省略する。
以上のように第3実施形態では、情報取得時に障害発生などのアラートが発生した際、それに対応して、その後の情報取得処理の順序を変更することにより、情報取得処理全体の遅延やアラートストームを防止したり、障害分析に役立つ情報を優先的に取得することが可能となる。
<第4実施形態>
第4実施形態は、管理サーバ101以外の一以上のサーバが情報取得ポーリングスレッドを生成し、管理対象機器の情報取得を行うことで、管理サーバ101の情報取得にかかる負荷を軽減することを可能とする。
図27は、第4実施形態の計算機システムの一例を示すブロック図である。
本第4実施形態で使用する計算機システムが、前記第1実施形態の計算機システムと異なる点は、一以上のポーリングスレッド用サーバ151が存在する点と、管理サーバ101の制御部110にポーリングスレッド用サーバとの間で情報の送受信を実施する情報送受信部2401が加えられた点と、情報取得部213及び情報取得ポーリングスレッド231がポーリングスレッド用サーバ151へ移動した点である。その他の構成は前記第1実施形態と同様である。なお、管理サーバ101に情報取得部213及び情報取得ポーリングスレッド231が残しておくことを排除しない。
図28は、ポーリングスレッド用サーバ151の一例を示すブロック図である。ポーリングスレッド用サーバ151の構成は、前記第1実施形態の管理サーバ101と同様の構成である。しかし、ポーリングスレッド用サーバ151では、制御部110Aに、情報取得部213と情報送受信部2501が格納され、管理テーブル群111Aに、一時管理機器登録テーブル2502と取得順序テーブル2503が格納される。
図29は、管理サーバ101の制御部110に含まれる情報送受信部2401で行われる処理の一例を示すフローチャートである。
ステップ2601では、情報送受信部2401が前記第1実施形態のポーリングスレッド割当部218のステップ1906の情報取得部213への処理完了通知と同じタイミングで、ポーリングスレッド用サーバ151に対して、ポーリングスレッド割当テーブル228に基づいて、情報取得対象の管理対象機器の情報と、管理対象機器の取得順序の情報を送信する。
ステップ2602では、情報送受信部2401がポーリングスレッド用サーバ151から構成情報の取得完了通知と構成情報の取得結果を受信する。
ステップ2603では、情報送受信部2401が前記ステップ2602で取得した情報取得結果を管理機器登録テーブル222に反映する。
以上の処理により、管理サーバ101は管理対象機器の情報取得を外部のポーリングスレッド用サーバ151へ依頼することが可能となる。
なお、上記では管理サーバ101に管理機器登録テーブル222を格納する例を示したが、管理LAN100に接続された図示しないストレージ装置の共有領域に管理機器登録テーブル222を格納して、管理サーバ101とポーリングスレッド用サーバ151で共有してもよい。この場合、管理サーバ101とポーリングスレッド用サーバ151が、管理機器登録テーブル222を共有しており、ポーリングスレッド用サーバ151が管理機器登録テーブル222に対して、直接取得結果を反映する場合は、ステップ2602とステップ2603における取得結果の受信と反映は省略しても良い。
図30は、ポーリングスレッド用サーバ151の制御部110Aに含まれる情報送受信部2501の処理の一例を示すフローチャートである。
ステップ2701では、情報送受信部2501が管理サーバ101から情報を取得する管理対象機器と、管理対象機器の取得順序を受信し、取得順序テーブル2503(図32参照)に格納する。
ステップ2702では、情報送受信部2501が情報取得部213へ取得順序テーブル2503の内容に基づいて、管理対象機器の情報取得を行うように指示を出す。情報取得部213は、前記第1実施形態と同様に情報取得ポーリングスレッド231を取得順序テーブル2503の順序で管理対象機器に割り当て、順次管理対象機器の構成情報を取得する。
ステップ2703では、情報送受信部2501が情報取得ポーリングスレッド231から情報を取得すると一時管理機器登録テーブル2502に登録させる。
ステップ2704では、情報送受信部2501が情報の取得が全ての管理対象機器について終了した時点で、管理サーバ101に完了通知と、一時管理機器登録テーブル2502の情報を送信する。
管理サーバ101は、上述のようにポーリングスレッド用サーバ151から受信した構成情報を、管理機器登録テーブル222へ反映させる。
図31A、図31Bは、一時管理機器登録テーブル2502の一例を示す。一時管理機器登録テーブル2502は、ポーリングスレッド用サーバ151が情報取得をして、取得した情報を管理サーバ101に送信するまで、情報を格納しておくテーブルである。一時管理機器登録テーブル2502は、図6A、図6Bに示した管理サーバ101が保持する管理対象機器登録テーブル222と比較して、関連グループ情報(カラム611)と登録状態情報(カラム612)が無い点が異なるのみで、他のカラムについても構成は同様である。
図32は、取得順序テーブル2503の一例を示す。取得順序テーブル2503は、ポーリングスレッド用サーバ151が、情報取得を行う際に参照するテーブルである。取得順序テーブル2503は、前記第1実施形態の図19に示したポーリングスレッド割当テーブル228の情報の内、ポーリングスレッド用サーバ151に割り当てられた分である。
取得順序テーブル2503は、ポーリングスレッド用サーバ151が生成した情報取得ポーリングスレッド231が情報取得を行う管理対象機器の情報を格納しており、情報取得部213は、取得順序テーブル2503を参照し、管理対象機器から情報の取得を実行する。
取得順序テーブル2503のカラム2901は、取得番号を格納する。取得番号は、情報取得ポーリングスレッド231が情報取得を行う際に参照する順番を示しており、本実施形態では、取得番号が小さな値を割り振られている行から順に情報取得を行う。
取得順序テーブル2503のカラム2902は、情報取得ポーリングスレッド231が情報取得を行う管理対象機器の識別子(ノードID)を格納する。
以上のように第4実施形態では、一以上のポーリングスレッド用サーバ151で情報取得ポーリングスレッド231を生成し、情報取得を行わせることで、管理サーバ101の情報取得にかかる負荷を軽減することを可能とする。

Claims (11)

  1. プロセッサとメモリとインターフェースを備えた管理計算機と、前記管理計算機と複数の計算機を接続するネットワークと、を備えて前記管理計算機がネットワークを介して前記計算機の情報を取得する情報取得方法であって、
    前記管理計算機が、前記複数の計算機のうち、情報を取得する計算機のグループを取得グループ情報に設定する第1のステップと、
    前記管理計算機が、情報の取得対象とするグループの順序を決定した後に、前記情報の取得対象とする計算機のグループ内の順序を決定する第2のステップと、
    前記管理計算機が、前記決定された情報の取得対象とするグループの順序と前記情報の取得対象とする計算機のグループ内の順序で計算機の情報を取得する指令を出力する第3のステップと、
    前記情報を取得する指令に基づいて情報取得実行部が、前記決定された情報の取得対象とするグループの順序と前記情報の取得対象とする計算機のグループ内の順序で前記グループ毎の計算機の情報を取得する第4のステップと、
    を含むことを特徴とする情報取得方法。
  2. 請求項1に記載の情報取得方法であって、
    前記第1のステップは、
    前記管理計算機が、前記グループに対する制約条件を設定する第5のステップと、
    前記管理計算機が、前記グループと前記制約条件とを結び付ける第6のステップと、を含み、
    前記管理計算機は、前記情報取得実行部で前記グループの前記計算機から情報を取得した時刻が、前記制約条件を満たすか否かを判定する第7のステップと、
    前記管理計算機が、前記判定結果が前記制約条件を満たしていないときには、前記グループに属する前記計算機の情報の取得を再度実行する第8のステップと、
    をさらに含むことを特徴とする情報取得方法。
  3. 請求項1に記載の情報取得方法であって、
    前記第4のステップは、
    前記計算機から障害情報を検出して、前記障害情報を発行した前記計算機と関連する前記グループを特定する第9のステップと、
    前記特定したグループに属する前記計算機の情報取得の順序を変更する第10のステップと、
    を含むことを特徴とする情報取得方法。
  4. 請求項1に記載の情報取得方法であって、
    前記第3のステップは、
    前記管理計算機が、前記決定された順序で計算機の情報を取得する指令を第1の計算機へ出力し、
    前記第4のステップは、
    前記第1の計算機は前記情報取得実行部を有して、前記決定された順序で前記グループ毎の計算機の情報を取得し、前記情報の取得結果を前記管理計算機へ送信する第11のステップと、
    前記管理計算機は、前記第1の計算機から前記情報の取得結果を受信する第12のステップと、
    を含むことを特徴とする情報取得方法。
  5. 請求項1に記載の情報取得方法であって、
    前記第1のステップは、
    前記管理計算機が、予め設定されたポリシー情報に基づいて、前記複数の計算機のうち、情報を取得する計算機のグループを抽出して前記取得グループ情報に設定することを特徴とする情報取得方法。
  6. プロセッサとメモリとインターフェースを備えた管理計算機と、
    前記管理計算機と複数の計算機を接続するネットワークと、を備えて前記管理計算機が前記ネットワークを介して前記計算機の情報を取得する計算機システムであって、
    前記管理計算機は、
    前記複数の計算機のうち、情報を取得する計算機のグループを取得グループ情報に設定する取得グループ生成部と、
    情報の取得対象とするグループの順序を決定した後に、前記情報の取得対象とする計算機のグループ内の順序を決定する取得順序決定部と、
    前記決定された情報の取得対象とするグループの順序と前記情報の取得対象とする計算機のグループ内の順序で計算機の情報を取得する指令を出力する情報取得部と、
    前記情報を取得する指令に基づいて、前記決定された順序で前記グループ毎の計算機の情報を取得する情報取得実行部と、
    を備えたことを特徴とする計算機システム。
  7. 請求項6に記載の計算機システムであって、
    取得グループ生成部は、
    前記グループに対する制約条件を設定して、前記グループと前記制約条件とを結び付け、
    前記情報取得部は、前記情報取得実行部で前記グループの前記計算機から情報を取得した時刻が、前記制約条件を満たすか否かを判定し、前記判定結果が前記制約条件を満たしていないときには、前記グループに属する前記計算機の情報の取得を再度実行することを特徴とする計算機システム。
  8. 請求項6に記載の計算機システムであって、
    前記管理計算機は、
    前記計算機から障害情報を検出して、前記障害情報を発行した前記計算機と関連する前記グループを特定する障害情報検出部をさらに有し、
    前記取得順序決定部は、
    前記特定したグループに属する前記計算機の情報取得の順序を変更することを特徴とする計算機システム。
  9. 請求項6に記載の計算機システムであって、
    前記情報取得部は、
    前記決定された順序で計算機の情報を取得する指令を第1の計算機へ出力し、
    前記第1の計算機は前記情報取得実行部を有して、前記決定された順序で前記グループ毎の計算機の情報を取得し、前記情報の取得結果を前記管理計算機へ送信し、
    前記管理計算機は、前記第1の計算機から前記情報の取得結果を受信することを特徴とする計算機システム。
  10. 請求項6に記載の計算機システムであって、
    前記取得グループ生成部は、
    予め設定されたポリシー情報に基づいて、前記複数の計算機のうち、情報を取得する計算機のグループを抽出して前記取得グループ情報に設定することを特徴とする計算機システム。
  11. プロセッサとメモリとインターフェースを備えた管理計算機であって、
    前記管理計算機は、
    ネットワークを介して接続された複数の計算機のうち、情報を取得する計算機のグループを取得グループ情報に設定する取得グループ生成部と、
    情報の取得対象とするグループの順序を決定した後に、前記情報の取得対象とする計算機のグループ内の順序を決定する取得順序決定部と、
    前記決定された情報の取得対象とするグループの順序と前記情報の取得対象とする計算機のグループ内の順序で計算機の情報を取得する指令を出力する情報取得部と、
    前記情報を取得する指令に基づいて、前記決定された順序で前記グループ毎の計算機の情報を取得する情報取得実行部と、
    を備えたことを特徴とする管理計算機。
JP2014512043A 2012-04-23 2012-04-23 情報取得方法、計算機システム及び管理計算機 Active JP5782563B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/060813 WO2013160983A1 (ja) 2012-04-23 2012-04-23 情報取得方法、計算機システム及び管理計算機

Publications (2)

Publication Number Publication Date
JP5782563B2 true JP5782563B2 (ja) 2015-09-24
JPWO2013160983A1 JPWO2013160983A1 (ja) 2015-12-21

Family

ID=49482356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014512043A Active JP5782563B2 (ja) 2012-04-23 2012-04-23 情報取得方法、計算機システム及び管理計算機

Country Status (4)

Country Link
US (1) US9712615B2 (ja)
EP (1) EP2833266A4 (ja)
JP (1) JP5782563B2 (ja)
WO (1) WO2013160983A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014158161A1 (en) * 2013-03-28 2014-10-02 Hewlett-Packard Development Company, L.P. Error coordination message for a blade device having a logical processor in another system firmware domain
WO2016038802A1 (ja) * 2014-09-12 2016-03-17 日本電気株式会社 情報処理装置、情報処理方法、及び、記録媒体
US11113088B2 (en) * 2017-07-26 2021-09-07 Dell Products, L.P. Generating and managing groups of physical hosts associated with virtual machine managers in an information handling system
US11010228B2 (en) * 2019-03-01 2021-05-18 International Business Machines Corporation Apparatus, systems, and methods for identifying distributed objects subject to service
US20240045770A1 (en) * 2022-08-02 2024-02-08 Rubrik, Inc. Techniques for using data backup and disaster recovery configurations for application management

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3816612B2 (ja) * 1997-01-14 2006-08-30 富士通株式会社 ネットワーク管理装置
JPH10334013A (ja) * 1997-06-04 1998-12-18 Nippon Telegr & Teleph Corp <Ntt> 分散型システムのための運用監視方法およびそのシステム
JP2000267899A (ja) * 1999-03-16 2000-09-29 Hitachi Ltd 情報処理装置
US7139823B2 (en) * 2001-08-23 2006-11-21 International Business Machines Corporation Dynamic intelligent discovery applied to topographic networks
JP4684883B2 (ja) 2005-12-21 2011-05-18 富士通株式会社 属性情報収集装置、属性情報収集方法および属性情報収集プログラム
JP4466615B2 (ja) 2006-06-16 2010-05-26 日本電気株式会社 運用管理システム、監視装置、被監視装置、運用管理方法及びプログラム
JP5051135B2 (ja) * 2006-11-06 2012-10-17 日本電気株式会社 資源情報収集装置、資源情報収集方法、プログラム、および、収集スケジュール生成装置
US8086905B2 (en) 2008-05-27 2011-12-27 Hitachi, Ltd. Method of collecting information in system network
JP4764915B2 (ja) * 2008-12-08 2011-09-07 株式会社日立製作所 性能管理システム、情報処理システム、及び性能管理システムにおける情報収集方法
JP5419746B2 (ja) * 2010-02-23 2014-02-19 株式会社日立製作所 管理装置及び管理プログラム

Also Published As

Publication number Publication date
EP2833266A1 (en) 2015-02-04
WO2013160983A1 (ja) 2013-10-31
JPWO2013160983A1 (ja) 2015-12-21
US20150095424A1 (en) 2015-04-02
US9712615B2 (en) 2017-07-18
EP2833266A4 (en) 2015-12-02

Similar Documents

Publication Publication Date Title
US8996477B2 (en) Multiple node/virtual input/output (I/O) server (VIOS) failure recovery in clustered partition mobility
US8615676B2 (en) Providing first field data capture in a virtual input/output server (VIOS) cluster environment with cluster-aware vioses
US8706859B2 (en) Method and apparatus of data center file system
US9223604B2 (en) Control method of virtual machine and virtual machine system
US9542249B2 (en) System redundancy verification method and computer system
US9516112B1 (en) Sending alerts from cloud computing systems
WO2013157072A1 (ja) 計算機システム、リソース管理方法及び管理計算機
US20120151095A1 (en) Enforcing logical unit (lu) persistent reservations upon a shared virtual storage device
JP5770284B2 (ja) I/oスイッチの制御方法、仮想計算機の制御方法及び計算機システム
US10152343B2 (en) Method and apparatus for managing IT infrastructure in cloud environments by migrating pairs of virtual machines
JP5782563B2 (ja) 情報取得方法、計算機システム及び管理計算機
US20140282584A1 (en) Allocating Accelerators to Threads in a High Performance Computing System
JP2016103144A (ja) 仮想マシン配備方法、仮想マシン配備プログラム及び仮想マシン配備システム
US9201740B2 (en) Computer system, cluster management method, and management computer
US9529656B2 (en) Computer recovery method, computer system, and storage medium
JP5316616B2 (ja) 業務引き継ぎ方法、計算機システム、及び管理サーバ
JP2015158773A (ja) 仮想装置の動作検証装置,仮想装置の動作検証システム及びプログラム
JP6010906B2 (ja) コンピュータネットワークシステム、構成管理方法、構成管理プログラム、記録媒体
US9710298B2 (en) Information processing system, storage apparatus, and program
JP5267544B2 (ja) ディスク引き継ぎによるフェイルオーバ方法
JP6030757B2 (ja) 仮想環境と非仮想環境が混在するクラウドシステムにおける監視項目制御方法、管理計算機及び計算機システム
US11204820B2 (en) Failure detection for central electronics complex group management
WO2014184944A1 (ja) 計算機システムの評価方法、計算機システムの制御方法及び計算機システム
JP4877368B2 (ja) ディスク引き継ぎによるフェイルオーバ方法
WO2017130390A1 (ja) 計算機システム及び分散データ処理の監視方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150707

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150717

R150 Certificate of patent or registration of utility model

Ref document number: 5782563

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150