JP6623692B2 - ログ情報採取システム、ログ情報採取プログラムおよびログ情報採取方法 - Google Patents

ログ情報採取システム、ログ情報採取プログラムおよびログ情報採取方法 Download PDF

Info

Publication number
JP6623692B2
JP6623692B2 JP2015215411A JP2015215411A JP6623692B2 JP 6623692 B2 JP6623692 B2 JP 6623692B2 JP 2015215411 A JP2015215411 A JP 2015215411A JP 2015215411 A JP2015215411 A JP 2015215411A JP 6623692 B2 JP6623692 B2 JP 6623692B2
Authority
JP
Japan
Prior art keywords
log information
storage device
storage
server
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015215411A
Other languages
English (en)
Other versions
JP2017090946A (ja
Inventor
勇介 林
勇介 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015215411A priority Critical patent/JP6623692B2/ja
Priority to US15/298,537 priority patent/US10204027B2/en
Publication of JP2017090946A publication Critical patent/JP2017090946A/ja
Application granted granted Critical
Publication of JP6623692B2 publication Critical patent/JP6623692B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers

Description

本発明は、ログ情報採取システム、ログ情報採取プログラムおよびログ情報採取方法に関する。
近年、複数のサーバ(以下、業務サーバと称する)が、所定の施設において集中的に運用されるようになっている。この施設は、データセンタとも称される。データセンタは、複数個所に分散して設置され、各データセンタは管理センタにより一括的に管理される傾向にある。
管理センタは、各データセンタで運用されている各業務サーバの状況に関するログ情報を収集し、収集されたログ情報に基づいて、各業務サーバの状態を管理する。関連する技術として、以下の特許文献1および特許文献2の技術が提案されている。
例えば、特許文献1の技術では、トランザクション履歴が主要データセンタからの他のデータと共に災害復旧サイトにミラーリングされる。例えば、特許文献2の技術では、各エラー情報等のイベント情報を保存する不揮発性メモリをミラーリングし、その不揮発性メモリを挿抜可能にしている。
特表2014−532932号公報 特開2006−178555号公報
各データセンタに設置された業務サーバが運用されている間、該業務サーバに関するログ情報は頻繁に変更される。この場合、管理センタは、各業務サーバの最新のログ情報を採取することが好ましい。
ただし、業務サーバが運用されている間、ログ情報は頻繁に変更されるため、ログ情報が変更されるごとに、業務サーバが最新のログ情報を管理センタに送信する処理を行うと、業務サーバに対する負荷が高くなる。
1つの側面として、本発明は、ログの採取を行う際に、サーバに対する負荷を低減することを目的とする。
1つの態様では、ログ情報採取システムは、監視装置と、該監視装置が監視する対象である監視対象装置と、該監視対象装置を管理する管理装置と、が通信可能に接続され、前記監視装置は、該監視装置に接続される第1ストレージ装置のうち所定の記憶領域を前記監視対象装置に対して割り当てる第1割り当て部と、前記監視対象装置に対して、該監視対象装置の記憶部にログ情報が記憶される際、前記第1割り当て部が割り当てた前記記憶領域に前記ログ情報のコピーを記憶させる制御を行う制御部と、を備え、前記管理装置は、前記監視対象装置の障害が検出された際、前記管理装置に接続される第2ストレージ装置に前記第1ストレージ装置からコピーされた前記ログ情報を該第2ストレージ装置から採取するか、または前記管理装置と前記第1ストレージ装置との間に確立されたアクセス経路から前記ログ情報を採取する採取部、を備え、前記制御部は、前記第1ストレージ装置と前記第2ストレージ装置との間のストレージ間通信経路が検出された場合、前記第1ストレージ装置に対して、前記第1ストレージ装置に記憶された前記ログ情報を前記第2ストレージ装置にコピーさせる制御を行い、前記ストレージ間通信経路が検出されない場合、前記管理装置と前記第1ストレージ装置との間の前記アクセス経路を確立する制御を行う
1つの側面によれば、ログの採取を行う際に、サーバに対する負荷を低減することができる。
実施形態のシステムの一例を示す図である。 実施形態のシステムの他の例を示す図である。 業務サーバの一例を示す図である。 監視サーバの一例を示す図である。 管理サーバの一例を示す図である。 第1ストレージ装置の一例を示す図である。 第2ストレージ装置の一例を示す図である。 各種テーブルの一例を示す図である。 更新時に送信される情報の比較例を示す図である。 監視対象サーバ追加処理の一例を示すシーケンスチャートである。 監視対象ログ追加処理の一例を示すシーケンスチャートである。 ミラーリング処理の一例を示すシーケンスチャートである。 ログ情報採取処理の一例を示すシーケンスチャート(その1)である。 ログ情報採取処理の一例を示すシーケンスチャート(その2)である。 ログ情報採取処理の一例を示すシーケンスチャート(その3)である。 ログ情報採取処理の一例を示すシーケンスチャート(その4)である。 ログ情報採取処理の一例を示すシーケンスチャート(その5)である。 ログ情報採取後の処理の一例を示すシーケンスチャート(その1)である。 ログ情報採取後の処理の一例を示すシーケンスチャート(その2)である。 ログ情報採取後の処理の一例を示すシーケンスチャート(その3)である。 サーバ監視解除処理の一例を示すシーケンスチャートである。 ログ監視解除処理の一例を示すシーケンスチャートである。 監視サーバのハードウェア構成の一例を示す図である。 管理サーバのハードウェア構成の一例を示す図である。 業務サーバのハードウェア構成の一例を示す図である。
以下、図面を参照して、実施形態のログ情報採取システムの一例について説明する。実施形態のログ情報採取システムは、管理システムにストレージ装置が設置されている場合と設置されていない場合との2つのパターンがある。以下、ストレージ装置を、単に「ストレージ」と称することがある。
<管理センタにストレージ装置が設置されている場合のシステム例>
図1は、管理センタにストレージ装置が設置されている場合のログ情報採取システム(以下、単にシステムと称する)1の一例を示す。システム1は、データセンタ2と管理センタ3とを含む。図1は、複数のデータセンタ2がある場合の例を示す。ただし、データセンタ2は1つであってもよい。
データセンタ2は、所定の業務を運用する複数の業務サーバ11が設置された施設であり、該データセンタ2は各業務サーバ11の管理や運用等を行う。管理センタ3は、複数のデータセンタ2で動作する各業務サーバ11を一括的に管理する施設である。
各データセンタ2と管理センタ3との間は、外部ネットワーク4およびストレージ間通信経路5により接続される。各データセンタ2は、管理センタ3と離間した場所に設置される。
データセンタ2について説明する。データセンタ2は、複数の業務サーバ11A、11B、・・・(総称して業務サーバ11と称する)と監視サーバ12と第1ストレージ装置13と第1内部ネットワーク14と第1SAN15とを含む。SANは、Storage Area Networkの略称であり、ストレージ装置を接続するネットワークである。
業務サーバ11は、所定の業務を運用する装置である。図1の例では、業務サーバ11Aおよび業務サーバ11B以外の業務サーバ11がデータセンタ2に設置される。データセンタ2に設置される業務サーバ11は1つであってもよい。
複数の業務サーバ11により1つの業務が運用されてもよいし、1つの業務サーバ11により複数の業務が運用されてもよい。業務サーバ11は、監視サーバ12による監視の対象である。業務サーバ11は、監視対象装置の一例である。
業務サーバ11による業務の運用は、該業務サーバ11が所定のアプリケーションプログラム(以下、単にアプリケーションと称する)を実行することにより実現されてもよい。
監視サーバ12は、各業務サーバ11の動作状況の監視を行う装置である。監視サーバ12は、監視装置の一例である。各業務サーバ11は、それぞれ記憶部を含む。各業務サーバ11は、該業務サーバ11の動作や状態等に関するログ情報を記憶部に記憶する制御を行う。
例えば、各業務サーバ11は、新たにログ情報が追加される場合、追加されたログ情報を記憶部に記憶する。また、各業務サーバ11は、記憶部に記憶された既存のログ情報を更新する場合、記憶部に記憶された該ログ情報の更新を行う。
監視サーバ12は、記憶部にログ情報の追加や更新を行う際に、第1ストレージ装置13に対してもログ情報の追加や更新を行う。つまり、監視サーバ12の記憶部の内容のコピーが第1ストレージ装置13にも記憶される。この処理は、ミラーリングとも称される。
第1ストレージ装置13は、上述したログ情報を記憶する装置である。第1ストレージ装置13は、ログ情報を記憶するだけでなく、所定の処理の実行や通信等を行う機能を有する。
第1ストレージ装置13は、複数の論理ボリューム(Logical Volume(LV))に分割される。論理ボリュームは、記憶領域の一例である。第1ストレージ装置13の各論理ボリュームは、データセンタ2に設置された各業務サーバ11にそれぞれ割り当てられる。つまり、1つの業務サーバ11に対して1つの論理ボリュームが割り当てられる。
第1内部ネットワーク14は、各業務サーバ11と監視サーバ12と第1ストレージ装置13との間を接続するネットワークであり、データセンタ2の内部のネットワークである。第1内部ネットワーク14は、例えば、Local Area Network(LAN)であってもよい。
第1SAN15は、各業務サーバ11と第1ストレージ装置13とを接続する。SANは、ストレージ装置とサーバとの間を接続するためのストレージネットワークである。SANは、LANとは異なるネットワークとして構築される。
実施形態のSANは、光ファイバケーブルを用いたネットワークとして構築されるものとする。SANによるデータの通信速度は、LANによるデータの通信速度より高速である。LANによるデータの通信速度は、外部ネットワーク4より高速である。
業務サーバ11は、ログ情報の追加や更新が行われた際、追加されたログ情報や更新された情報を、第1SAN15を介して、第1ストレージ装置13に送信する。第1ストレージ装置13は、受信した情報を、送信元の業務サーバ11に割り当てられた論理ボリュームに記憶する。業務サーバ11は、ログ情報が更新された場合、該ログ情報をファイル形式ではなく、更新された分の情報を第1ストレージ装置13に送信する。
第1SAN15は、データセンタ2の内部に設置されたネットワークであり、サーバとストレージ装置とを接続する高速なネットワークである。業務サーバ11は、該業務サーバ11の記憶部に記憶する場合とほぼ同等の負荷および速度で、追加された情報や更新された情報を第1ストレージ装置13に記憶させることができる。
このため、業務サーバ11は、第1ストレージ装置13に割り当てられた論理ボリュームを、自身の業務サーバ11に内蔵される補助記憶装置と同等に取り扱うことができる。これにより、業務サーバ11は、第1ストレージ装置13の論理ボリュームに対して、低い負荷であり、且つ高速に、第1ストレージ装置13に情報を記憶させることができる。
次に、管理センタ3について説明する。管理センタ3は、管理サーバ21と管理者端末22と第2ストレージ装置23と第2内部ネットワーク24と第2SAN25とを含む。
管理サーバ21は、外部ネットワーク4を介して、監視サーバ12に接続される。管理サーバ21は、監視サーバ12により業務サーバ11に障害が発生したことが検出された場合、監視サーバ12から送信される障害検出通知に基づいて、障害を認識する。管理サーバ21は、管理装置の一例である。
管理サーバ21は、障害の発生を認識した場合、障害の発生が検出された業務サーバ11に関するログ情報の採取を行う。管理センタ3に第2ストレージ装置23が設置されている場合、管理サーバ21は、第1ストレージ装置13から第2ストレージ装置23にコピーされたログ情報を、第2SAN25を介して、採取する。
管理者端末22は、例えば、管理センタ3の管理者が操作する端末である。管理者端末22は、例えば、業務サーバ11に障害が発生したことが検出された通知を画面表示してもよい。
第2ストレージ装置23と第1ストレージ装置13とは、ストレージ間通信経路5を介して接続される。第2ストレージ装置23は、第1ストレージ装置13と同様、複数の論理ボリュームに分割されているものとする。
データセンタ2の何れかの業務サーバ11に障害が発生したことが検出された場合、第1ストレージ装置13は、障害が発生した業務サーバ11に割り当てられた論理ボリュームに記憶されたログ情報を、第2ストレージ装置23の論理ボリュームにコピーする。
第2内部ネットワーク24は、管理サーバ21と管理者端末22と第2ストレージ装置23とを接続するネットワークであり、管理センタ3の内部のネットワークである。第2内部ネットワーク24は、例えばLANであってもよい。
第2SAN25は、管理サーバ21と第2ストレージ装置23とを接続するSANである。第1SAN15と同様、第2SAN25は、第2内部ネットワーク24とは異なるネットワークとして構築される。
<管理センタにストレージ装置が設置されていない場合のシステム例>
図2は、管理センタ3にストレージ装置が設置されていない場合のシステム1の一例を示す。図2の例に示されるように、管理センタ3は、図1の例で示した第2ストレージ装置23および第2SAN25を含んでいない。
一方、管理センタ3にストレージ装置(第2ストレージ装置23)が設置されていない場合、図2の例で示されるように、データセンタ2には、ゲートウェイサーバ16が設置される。
ゲートウェイサーバ16は、外部ネットワーク4を介して、管理センタ3の管理サーバ21と接続される。図2のシステム1の例の場合、管理サーバ21は、ゲートウェイサーバ16および第1SAN14を介して、第1ストレージ装置13の論理ボリュームからログ情報を採取する。
以下、業務サーバ、監視サーバ、管理サーバおよびストレージについて説明する。以下に説明する各装置は、管理センタ3に第2ストレージ装置23が設置されている場合のシステム1と設置されていない場合のシステム1との両者に適用される。
これ以降、管理センタ3に第2ストレージ装置23が設置されている場合の処理を方式Aと称することがあり、管理センタ3に第2ストレージ装置23が設置されていない場合の処理を方式Bと称することがある。
<業務サーバの一例>
次に、図3を参照して、データセンタ2に設置される業務サーバ11の一例について説明する。業務サーバ11は、第1内部ネットワークインタフェース制御部31と第1SANインタフェース制御部32と業務サーバ制御部33とミラーリング制御部34と記憶部35とを含む。
第1内部ネットワークインタフェース制御部31は、第1内部ネットワーク14に接続されるインタフェースの制御を行う。図3以降、ネットワークを「NW」と表記することがあり、インタフェースを「I/F」と表記することがある。
第1SANインタフェース制御部22は、第1SAN15を介して、第1ストレージ装置13にログ情報を送信するためのインタフェースの制御を行う。
業務サーバ制御部33は、業務サーバ11の各種の制御を行う。例えば、業務サーバ制御部33は、所定のアプリケーションを実行し、アプリケーションの実行に関するログ情報を生成する。
業務サーバ制御部33は、新たにログ情報を生成した場合、記憶部35に生成されたログ情報を記憶する。これにより、記憶部35に新たにログ情報が追加される。また、業務サーバ制御部33は、記憶部35に記憶されたログ情報を更新する場合もある。
業務サーバ制御部33が、ログ情報を追加して記憶部35に記憶した際、ミラーリング制御部34は、追加されたログ情報を、第1ストレージ装置13のうち業務サーバ11に割り当てられた論理領域に記憶する制御を行う。
また、業務サーバ11が、記憶部35に記憶されたログ情報を更新した際、ミラーリング制御部34は、第1ストレージ装置13のうち業務サーバ11に割り当てられた論理領域に記憶されているログ情報を更新する制御を行う。
従って、ミラーリング制御部34により、業務サーバ11の記憶部35のコピーが、第1ストレージ装置13のうち業務サーバ11に割り当てられた論理領域に作成される。
これにより、記憶部35に記憶されたログ情報の内容と同じ内容が第1ストレージ装置13の論理ボリュームに記憶される。実施形態では、ミラーリング制御部34は、ミラーリングプログラムが実行されることにより実現されるものとする。
<監視サーバの一例>
次に、図4を参照して、データセンタ2に設置される監視サーバ12の一例について説明する。監視サーバ12は、第1内部ネットワークインタフェース制御部41と第2SANインタフェース制御部42と経路検出部43と障害検出部44と監視サーバ制御部45と第1割り当て部46と監視サーバデータベース47とを含む。
第1内部ネットワークインタフェース制御部41は、第1内部ネットワーク14に接続されるインタフェースの制御を行う。外部ネットワークインタフェース制御部42は、外部ネットワーク4に接続されるインタフェースの制御を行う。
経路検出部43は、第1ストレージ装置13にストレージ間通信経路5が接続されているか否かを検出する。
障害検出部44は、データセンタ2に設置された各業務サーバ11に発生した障害を検出する。例えば、障害検出部44は、第1内部ネットワーク14を介して、各業務サーバ11から、障害を発生した旨の通知を受信することで、障害を検出してもよい。
また、障害検出部44は、定期的に各業務サーバ11の状況を確認することで、障害を検出してもよい。障害検出部44は、障害の発生を検出した場合、障害発生通知を管理センタ3に送信する。
監視サーバ制御部45は、監視サーバ12による各種の制御を行う。監視サーバ制御部45は、制御部の一例である。経路検出部43が、第1ストレージ装置13にストレージ間通信経路5が接続されていることを検出した場合、障害検出時に、第1ストレージ装置13に記憶されているログ情報は第2ストレージ装置23にコピーされる。このコピーは、リモートミラーとも称される。
この場合、監視サーバ制御部45は、第1ストレージ装置13に対して、障害の発生が検出された業務サーバ11に割り当てられた論理領域に記憶されているログ情報を第2ストレージ装置23の1つの論理ボリュームにコピーする制御を行う。
経路検出部43が、第1ストレージ装置13にストレージ間通信経路5が接続されていないことを検出した場合、データセンタ2には、ゲートウェイサーバ16が設置されていることになる。ゲートウェイサーバ16は、第1SAN15と接続される。
従って、経路検出部43が、第1ストレージ装置13にストレージ間通信経路5が接続されていないことを検出した場合、監視サーバ制御部45は、ゲートウェイサーバ16と第1ストレージ装置13との間にアクセス経路を確立する制御を行う。
第1割り当て部46は、新たな業務サーバ11に対して第1ストレージ装置13の論理ボリュームを割り当てる場合、業務サーバ11が割り当てられていない論理ボリュームを新たな業務サーバ11に対して割り当てる。
上述したように、ミラーリング制御部34は、ミラーリングプログラムが実行されることにより実現される。監視サーバ制御部45は、新たに業務サーバ11が追加された場合、ミラーリングプログラムをインストールするためのインストールプログラムを、新たに追加された業務サーバ11に送信する。
業務サーバ11がインストールプログラムを実行することにより、該業務サーバ11でミラーリングプログラムが実行され、該業務サーバ11にミラーリング制御部34の機能が設定される。
また、監視対象であった業務サーバ11が監視サーバ12による監視対象から解除されることがある。この場合、監視サーバ制御部45は、除外対象の業務サーバ11のミラーリング制御部34を無効化する。この場合、例えば、監視サーバ制御部45は、除外対象の業務サーバ11からミラーリングプログラムを削除してもよい。
業務サーバ11の記憶部35に記憶される全てのログ情報をミラーリングの対象としない場合もある。監視サーバ制御部45は、業務サーバ11のミラーリング制御部34に対して、ミラーリングの対象とするログ情報の設定を行う。
例えば、監視サーバ制御部45は、ミラーリング制御部34に対して、ミラーリングの対象とするログ情報を新たに追加する場合もあり、ログ情報をミラーリングの対象から解除する場合もある。
監視サーバデータベース47は、監視サーバテーブルを記憶する。監視サーバテーブルが記憶する情報は、監視サーバ制御部45や第1割り当て部46等が各種制御を行う際に利用される。
<管理サーバの一例>
次に、図5を参照して、管理センタ3に設置される管理サーバ12の一例について説明する。管理サーバ12は、第2内部ネットワークインタフェース制御部51と第2SANインタフェース制御部52と管理サーバ制御部53とログ情報採取部54と第2割り当て部55と管理サーバデータベース56とを含む。
第2内部ネットワークインタフェース制御部51は、第2内部ネットワーク24に接続されるインタフェースの制御を行う。第2SANインタフェース制御部52は、第2SAN25を介して、第2ストレージ装置23にログ情報を送信するためのインタフェースの制御を行う。
管理サーバ制御部53は、各種の制御を行う。管理サーバ制御部53は、第2ストレージ装置23が管理センタ2に設置されている場合、第2ストレージ23と管理サーバ21との間のアクセス経路を確立する制御を行う。
第2ストレージ装置23が管理センタ2に設置されていない場合、データセンタ2にはゲートウェイサーバ16が設置される。管理サーバ21は、外部ネットワーク4を介して、ゲートウェイサーバ16にアクセス可能である。
上述したように、監視サーバ制御部45は、第1ストレージ装置13とゲートウェイサーバ16との間のアクセス経路を確立する制御を行う。管理サーバ21は、ゲートウェイサーバ16とアクセス可能に接続される。
従って、監視サーバ12と管理サーバ21とがアクセス可能に接続され、且つ第1ストレージ装置13とゲートウェイサーバ16との間のアクセス経路が確立されることで、管理サーバ21と第1ストレージ装置13との間のアクセス経路が確立される。
ログ情報採取部54は、ログ情報を採取する。ログ情報採取部54は、採取部の一例である。第2ストレージ装置23が管理センタ2に設置されている場合、ログ情報採取部54は、第2ストレージ装置23からログ情報を採取する。
第2ストレージ装置23が管理センタ2に設置されていない場合、ログ情報採取部54は、管理サーバ21と第1ストレージ装置13との間に確立されたアクセス経路に基づいて、第1ストレージ装置13からログ情報を採取する。
実施形態では、第1ストレージ装置13の各論理ボリュームのうち、障害が検出された業務サーバ11に割り当てられた論理ボリュームに記憶されたログ情報が、第2ストレージ装置23のうち、ある論理ボリュームにコピーされる。
第2割り当て部55は、第2ストレージ装置23のうち、ログ情報がコピーされた論理ボリュームを管理サーバ21の論理ボリュームとして割り当てる。これにより、ログ情報採取部54は、第2SAN25を介して、第2ストレージ装置23のうち上記の論理ボリュームからログ情報を採取する。
管理サーバデータベース56は、管理サーバテーブルを記憶する。管理サーバテーブルが記憶する情報は、管理サーバ制御部53や第2割り当て部55等が各種制御を行う際に利用される。
<第1ストレージ装置の一例>
次に、図6を参照して、データセンタ2に設置される第1ストレージ装置13について説明する。第1ストレージ装置13は、ストレージ間通信経路インタフェース制御部61と内部ネットワークインタフェース制御部62とストレージ記憶部63とストレージポート制御部64とコピー処理部65とを含む。
ストレージ間通信経路インタフェース制御部61は、ストレージ間通信経路5に接続されるインタフェースの制御を行う。内部ネットワークインタフェース制御部62は、第1内部ネットワーク14に接続されるインタフェースの制御を行う。
ストレージ記憶部63は、情報を記憶する。例えば、ストレージ記憶部63は、複数の記憶装置を仮想的な1つの記憶装置とみなしてもよい。ストレージ記憶部63は、複数の論理ボリュームに分割される。
図6の例は、ストレージ記憶部63が分割された複数の論理ボリュームのうち、論理ボリューム63Aおよび論理ボリューム63Bを示す。また、ストレージ記憶部63は、論理ボリューム63Aおよび論理ボリューム63Bの他に1または複数の論理ボリュームに分割されてもよい。
図6の例では、論理ボリューム63Aにログ情報Aが記憶されている。ログ情報Aは、1つの業務サーバ11に関するログ情報である。論理ボリューム63Aには、1つの業務サーバ11に関するログ情報であれば、複数のログ情報が記憶されてもよい。
論理ボリューム63Bも同様であり、該論理ボリューム63Bにログ情報Bが記憶されている。ログ情報Bは、ログ情報Aに対応する業務サーバ11とは異なる業務サーバ11に関するログ情報である。論理ボリューム63Bにも、1つの業務サーバ11に関するログ情報であれば、複数のログ情報が記憶されてもよい。
ストレージポート制御部64は、ストレージ装置に設けられるストレージポートの制御を行う。コピー処理部65は、ストレージ記憶部63に記憶された各論理ボリュームのログ情報を第2ストレージ装置23にコピーする。つまり、コピー処理部65は、リモートミラーの処理を行う。
<第2ストレージ装置の一例>
次に、図7を参照して、第2ストレージ装置23の一例について説明する。第2ストレージ装置23は、図6の例で示した第1ストレージ装置13とほぼ同様である。ただし、第2ストレージ装置23は、コピー処理部65を含んでいない。第2ストレージ装置23から第1ストレージ装置13にログ情報がコピーされないためである。
<各種テーブルの一例>
次に、図8の例を参照して、監視サーバテーブルおよび管理サーバテーブルの一例について説明する。監視サーバテーブルは、監視サーバデータベース47に記憶されるテーブルである。
監視サーバテーブルは、障害IDと業務サーバのIPアドレスとストレージ装置のIPアドレスとLVのIDとゲートウェイサーバでのマウントポイントとの項目を含む。IDは、Identificationの略称である。IPは、Internet Protocolの略称である。
障害IDは、業務サーバ11に生じた障害を識別する識別子である。業務サーバのIPアドレスは、業務サーバ11のIPアドレスである。ストレージ装置のIPアドレスは、第1ストレージ装置13のIPアドレスである。
LVのIDは、第1ストレージ装置13の論理ボリューム(LV)を識別する識別子である。業務サーバ11に対して、1つの論理ボリュームが割り当てられるため、業務サーバのIPアドレスとLVのIDとは1対1で対応する。
ゲートウェイサーバでのマウントポイントは、ゲートウェイサーバ16における第1ストレージ装置13の論理ボリュームのマウントポイントを示す。ゲートウェイサーバでのマウントポイントのうち「None」は、ゲートウェイサーバ16においては、LVのIDに対応する論理ボリュームがマウントされていないことを示す。
ゲートウェイサーバでのマウントポイントが「None」である論理ボリュームは、ゲートウェイサーバ16からは認識されない。一方、ゲートウェイサーバでのマウントポイントが「None」でない論理ボリュームは、ゲートウェイサーバ16から認識される。
図8の例では、ストレージ装置のIPアドレスは、第1ストレージ装置13を示すため、全て同じIPアドレスである。ただし、データセンタ2には、複数の第1ストレージ装置13が設置されてもよく、この場合、ストレージ装置のIPアドレスは異なる場合がある。
また、同じ業務サーバ11のIPアドレスに複数の障害IDが対応付けられてもよい。例えば、業務サーバ11に複数の障害が発生したことが検出された場合、同じ業務サーバのIPアドレスに複数の障害IDが対応付けられる。
次に、管理サーバテーブルについて説明する。管理サーバテーブルは、管理サーバデータベース56に記憶されるテーブルである。管理サーバテーブルは、障害IDとストレージ装置のIPアドレスとLVのIDと管理サーバでのマウントポイントとの項目を含む。
管理サーバテーブルの障害IDは、監視サーバテーブルの障害IDと同じIDが割り振られる。ストレージ装置のIPアドレスは、第2ストレージ装置23のIPアドレスである。
LVのIDは、第2ストレージ装置23の論理ボリューム(LV)を識別する識別子である。管理サーバでのマウントポイントは、管理サーバ21における第2ストレージ装置23の論理ボリュームのマウントポイントを示す。
管理サーバテーブルは、方式Aの場合の処理に使用される。管理サーバテーブルの障害IDは第2ストレージ装置23のIPアドレスと対応付けられており、第2ストレージ装置23が管理センタ3に設置されている場合に、管理サーバテーブルは使用される。
従って、管理サーバテーブルに、障害IDに対応するレコードが存在しない場合、管理センタ3には第2ストレージ装置23が設置されていない。例えば、図8の例の場合、障害IDが「2」および「3」のレコードは管理サーバテーブルに存在しない。
<ログ情報が更新される場合の情報量の比較例>
次に、ログ情報が更新される場合の情報量の比較例について、図9を参照して、説明する。図9は、ファイル形式のログ情報(以下、ログ情報ファイルと称する)の一例を示す。
ファイルヘッダは、ログ情報ファイルに付加される付帯情報である。例えば、ファイルヘッダは、ファイル名とファイルサイズと所有者とアクセス権と作成日と更新日との項目を含む。
ログ情報ファイルのうち、データはログ情報の実体である。更新データは、ログ情報ファイルのうち、更新された分の情報(データ)である。
例えば、業務サーバ11に関するログ情報に対して第1ストレージ装置13の論理ボリュームが割り当てられない場合を想定する。この場合、業務サーバ11に関するログ情報は、例えば、データセンタ2に設置されたログサーバにより、外部ネットワーク4を介して、管理センタ3に送信される。
この場合、上記のログサーバは、ログ情報をファイル形式で管理センタ3に送信する。従って、図9の「ファイル形式で送信されるログ情報」の例で示されるように、ログ情報ファイルの全てのデータ(網掛けが施されている部分)がデータセンタ2から管理センタ3に送信される。
業務サーバ11に関するログ情報が頻繁に更新されると、業務サーバ11は、ログ情報が更新されるごとに、ログ情報ファイルを生成して、管理センタ3に送信する制御を行うため、業務サーバ11に対する負荷は大きくなる。
また、ログ情報が頻繁に更新されると、業務サーバ11は、頻繁にログ情報を管理センタ3に送信するため、外部ネットワーク4に対するネットワーク負荷も高くなる。データセンタ2に設置される業務サーバ11の数が増えるに応じて、外部ネットワーク4に対するネットワーク負荷はさらに高くなる。
実施形態では、業務サーバ11は、監視サーバ12の制御に基づいて、ログ情報を第1ストレージ装置13にミラーリングする制御を行う。業務サーバ11は、ログ情報を更新する場合、第1ストレージ装置13のうち業務サーバ11に割り当てられた論理ボリュームに記憶されているログ情報を更新する。
業務サーバ11は、ログ情報のうち更新される分の情報を、第1SAN15を介して、第1ストレージ装置13に送信する。第1ストレージ装置13は、受信した情報の送信元の業務サーバ11に割り当てられた論理ボリュームに記憶されているログ情報を、受信した情報に基づいて更新する。
従って、業務サーバ11は、ログ情報のうち更新される情報を第1SAN15に送信する。この場合、図9の「実施形態において更新される情報」の例で示されるように、更新される情報(データ)は、ログ情報をファイル形式で送信する場合と比べて少ない。
上述したように、業務サーバ11は、第1ストレージ装置13のうち、該業務サーバ11に割り当てられた論理ボリュームを、自身の業務サーバ11に内蔵される補助記憶装置と同等に取り扱うことができる。
このため、業務サーバ11は、記憶部35に記憶されているログ情報を更新する負荷とほぼ同等の負荷で、第1ストレージ装置13の論理ボリュームに記憶されているログ情報を更新することができる。
ここで、ログ情報をファイル形式で送信する場合において、更新された情報だけを業務サーバ11が管理センタ3に送信することも考えられる。この場合、業務サーバ11は、ログ情報が更新されたかを監視することになる。
また、ログ情報が更新された場合、業務サーバ11は、更新の前後のログ情報を比較して、更新された情報を特定する。従って、上記の監視や更新された情報を特定する処理により、業務サーバ11の負荷が高くなる。
一方、実施形態の業務サーバ11は、ログ情報が更新された場合、第1ストレージ装置13の論理ボリュームに記憶されているログ情報を更新するだけでよいため、業務サーバ11の負荷を低減することができる。
<監視対象サーバ追加処理の一例>
次に、図10のシーケンスチャートの例を参照して、監視サーバ12が監視の対象としていない業務サーバ11を、監視サーバ12による新たに監視対象とする場合の処理について説明する。以下、この処理を監視対象サーバ追加処理と称する。
例えば、新たな業務サーバ11がデータセンタ2に設置され、該新たな業務サーバ11が監視サーバ12の監視の対象となる場合、監視対象サーバ追加処理が行われる。また、データセンタ2に設置されている既存の業務サーバ11を新たに監視対象とする場合、監視対象サーバ追加処理が行われてもよい。
例えば、監視サーバ12を操作する操作者は、業務サーバ11を追加するための所定の情報(サーバ追加設定情報)を監視サーバ12に入力する。監視サーバ12は、サーバ追加設定情報の入力を受け付ける(ステップS1)。
サーバ追加設定情報は、例えば、監視サーバ12が業務サーバ11にアクセスするための情報(ユーザ名やパスワード、業務サーバ11のIPアドレス等)や第1SAN15に接続されるインタフェースのIPアドレス等を含む。また、サーバ追加設定情報は、業務サーバ11に関するログ情報がコピーされる第1ストレージ装置13のIPアドレス等の情報も含む。
監視サーバ12の監視サーバ制御部45は、第1ストレージ装置13の各論理ボリュームのうち、業務サーバ11が割り当てられていない論理ボリュームを割り当てる指示を、追加対象の業務サーバ11に対して出す(ステップS2)。
監視サーバ12から上記の指示を受信した第1ストレージ装置13は、業務サーバ11に割り当てる論理ボリューム、および業務サーバ11と第1ストレージ装置13との間のアクセス経路を作成する。このアクセス経路は、第1SAN15のアクセス経路である。
第1ストレージ装置13は、業務サーバ11に割り当てた論理ボリュームのID(LVのID)を第1SAN15のアクセス経路に関する情報と共に、監視サーバ12に返信する(ステップS3)。なお、第1ストレージ装置13は、ユニークなIDを論理ボリュームに割り振る。
監視サーバ制御部45は、各種情報を監視サーバテーブルに設定する(ステップS4)。例えば、監視サーバ制御部45は、ステップS1で入力を受け付けた業務サーバ11のIPアドレスおよび第1ストレージ装置13のIPアドレスを監視サーバテーブルに設定する。
また、監視サーバ制御部45は、ステップS3で第1ストレージ装置13から返信されたLVのIDを監視サーバテーブルに設定する。これにより、監視サーバテーブルは更新される(ステップS5)。
監視サーバ制御部45は、第1ストレージ装置13から受信した第1SAN15のアクセス経路に関する情報に基づいて、第1SAN15に対して、該アクセス経路の構築を指示する(ステップS6)。
第1SAN15は、複数の通信経路を含み、通信経路を切り替えるスイッチ(例えば、ファイバチャネルスイッチ等)を含む。第1SAN15の各スイッチは、監視サーバ12からの指示に基づいて、業務サーバ11と第1ストレージ装置13との間にアクセス経路が確立される設定を行う。
これにより、業務サーバ11と第1ストレージ装置13との間を接続する第1SAN15のアクセス経路が確立される(ステップS7)。
第1SAN15のアクセス経路が構築された後、監視サーバ制御部45は、該業務サーバ11に割り当てられた第1ストレージ装置13の論理ボリュームのマウントおよびフォーマットを行う指示を、第1ストレージ装置13に出す(ステップS8)。
第1ストレージ装置13は、指示された論理ボリュームのマウントおよびフォーマットを行う(ステップS9)。論理ボリュームがマウントされることにより、業務サーバ11は、該論理ボリュームを認識する。
また、第1ストレージ装置13は、マウントされた論理ボリュームをフォーマット(例えば、ファイルシステムのフォーマット)を行うことで、論理ボリュームの初期化が行われる。
監視サーバ制御部45は、業務サーバ11に対して、ミラーリング制御部34の設定を指示する(ステップS10)。上述したように、ミラーリング制御部34の機能は、ミラーリングプログラムにより実現されてもよい。
この場合、ミラーリング制御部34は、ミラーリングプログラムをインストールするためのインストールプログラムを業務サーバ11に送信する。
業務サーバ11は、インストールプログラムを実行することで、該業務サーバ11にミラーリングプログラムがインストールされる。これにより、業務サーバ11にミラーリング制御部34が設定される(ステップS11)。
ミラーリング制御部34が業務サーバ11に設定されると、ミラーリング制御部34が機能する。これにより、業務サーバ11は、新たなログ情報の追加やログ情報の変更を記憶部35に対して行う際に、第1ストレージ装置13の論理ボリュームに対しても、新たなログ情報の追加やログ情報の更新を行う。
これにより、記憶部35に記憶されるログ情報のコピーが、第1ストレージ装置13のうち、業務サーバ11に割り当てられた論路ボリュームに記憶される。つまり、ミラーリングが行われる。
監視サーバ制御部45は、ミラーリング制御部34を業務サーバ11に設定する際に、監視対象とするログ情報(採取対象のログ情報)を指定してもよい。例えば、業務サーバ11に関する複数のログ情報のうち、一部のログ情報が採取対象となる場合がある。
この場合、指定されたログ情報が記憶部35に記憶され、そのコピーが第1ストレージ装置13のうち、業務サーバ11に割り当てられた論理ボリュームに記憶されてもよい。ログ情報の指定に関する情報は、例えば、インストールプログラムに含まれてもよい。
業務サーバ11が、インストールプログラムを実行することで、業務サーバ11に設定されるミラーリング制御部34に、採取対象のログ情報の指定が設定される。
<監視対象ログ追加処理の一例>
次に、図11のシーケンスチャートの例を参照して、業務サーバ11に対して監視対象とする新たなログ情報を追加する処理について説明する。以下、この処理を監視対象ログ追加処理と称する。
例えば、監視サーバ12を操作する操作者は、追加対象のログ情報に関する情報(ログ追加設定情報)を監視サーバ12に入力する。監視サーバ12は、ログ追加設定情報の入力を受け付ける(ステップS12)。
ログ追加設定情報は、例えば、監視サーバ12が業務サーバ11にアクセスするための情報(ユーザ名やパスワード、業務サーバ11のIPアドレス等)や監視対象に追加されるログ情報に関する情報等を含む。
監視サーバ制御部45は、ログ追加設定情報に基づいて、業務サーバ11に対して、監視対象のログ情報を追加する指示を出す(ステップS13)。業務サーバ11のミラーリング制御部34は、この指示に基づいて、監視対象のログ情報を追加するように設定を更新する(ステップS14)。
これにより、更新された設定に基づいて、ミラーリング制御部34は、追加されたログ情報を、第1ストレージ装置13の論理ボリュームにコピーする。ミラーリング制御部34がミラーリングプログラムにより実現される場合、ミラーリングプログラムが再起動されることにより、設定の更新がミラーリング制御部34に反映されてもよい。
また、監視サーバ制御部45は、監視対象のログ情報を追加させるためのプログラム(ログ情報追加プログラム)を業務サーバ11に送信してもよい。このログ情報追加プログラムには、追加対象のログ情報に関する情報が含まれる。
業務サーバ11は、ログ情報追加プログラムを実行することで、ミラーリング制御部34に対して、監視対象のログ情報を追加する設定が行われる。
<ミラーリング処理の一例>
次に、図12のシーケンスチャートの例を参照して、ミラーリング処理について説明する。業務サーバ制御部33は、ログ情報の追加または更新を行うか否かの判定を行う(ステップS21)。
例えば、業務サーバ11が新たな業務システムの運用を担うことになった場合、監視対象のログ情報が追加される。また、業務サーバ11が運用する業務システムがアップデートされた場合等、新たに監視対象のログ情報が追加される場合がある。
ログ情報の追加と更新との何れも行われない場合(ステップS21でNO)、処理は次のステップに進まない。ログ情報の追加または更新が行われる場合(ステップS21でYES)、業務サーバ制御部33は、記憶部35に追加されたログ情報を記憶するか、または既に記憶されているログ情報を更新する(ステップS22)。
ステップS22の処理と共に、ミラーリング制御部34は、追加されたログ情報または更新された情報を、確立された第1SAN15のアクセス経路を介して、第1ストレージ装置13に送信する(ステップS23)。
第1ストレージ装置13は、業務サーバ11に割り当てられた論理ボリュームに、追加されたログ情報を記憶するか、または既に記憶されているログ情報を更新する(ステップS24)。
以上により、業務サーバ11の記憶部35に記憶されたログ情報の内容と同じ内容が第1ストレージ装置13のうち、業務サーバ11に割り当てられた論理ボリュームに反映される。つまり、ミラーリングが行われる。
<ログ情報採取処理の一例>
次に、図13のシーケンスチャートの例を参照して、ログ情報採取処理の一例を説明する。実施形態では、ログ情報の採取は、監視サーバ12の障害検出部44が、監視対象の業務サーバ11のうち何れかに何らかの障害が生じたことを検出した場合に行われる。
障害検出部44が、データセンタ2に設置された監視対象の業務サーバ11のうち、何れの業務サーバ11にも障害が発生したことを検出しない場合(ステップS31でNO)、処理は次のステップに進まない。
障害検出部44が上記の障害の発生を検出した場合(ステップS31でYES)、監視サーバ制御部45は、新たに障害IDを発行し、監視サーバテーブルにセットする(ステップS32)。
新たな障害IDは、監視サーバテーブルのうち、障害の発生が検出された第1ストレージ装置13のIPアドレスに対応したレコードにセットされる。これにより、監視サーバテーブルは更新される(ステップS33)。
監視サーバ制御部45は、監視サーバデータベース47に記憶された上記の監視サーバテーブルを参照して、障害IDに対応するLVのIDを取得する(ステップS34)。監視サーバデータベース47は、LVのIDを返す(ステップS35)。
経路検出部43は、第1ストレージ装置13にストレージ間通信経路5が接続されているかを確認する(ステップS36)。このため、経路検出部43は、第1内部ネットワーク14を介して、第1ストレージ装置13に対してアクセスして、ストレージ間通信経路5の有無を確認する。
第1ストレージ装置13は、ストレージ間通信経路5が接続されているか否かを監視サーバ12に返信する(ステップS37)。
第1ストレージ装置13にストレージ間通信経路5が接続されている場合(ステップS38でYES)、処理は方式Aに進む。第1ストレージ装置13にストレージ間通信経路5が接続されていない場合(ステップS38でNO)、処理は方式Bに進む。
方式Aの処理および方式Bの処理は、ステップS31がYESの場合に行われる。従って、以降の方式Aの処理および方式Bの処理は、業務サーバ11に障害が発生したことが検出された場合に行われる。
方式Aの場合の処理について、図14のシーケンスチャートの例を参照して説明する。監視サーバ制御部45は、障害発生が検出された場合、第1内部ネットワーク14を介して、第1ストレージ装置13に対して、各論理ボリュームに記憶されているログ情報を第2ストレージ装置23に対してコピーするように指示する(ステップS41)。
この指示に基づいて、第1ストレージ装置13のコピー処理部65は、各論理ボリュームのログ情報を、ストレージ間ネットワーク5を介して、第2ストレージ装置23にコピーする(ステップS42)。このコピーは、リモートミラーである。
第2ストレージ装置23のストレージ記憶部63は複数の論理ボリュームに分割されている。第1ストレージ装置13のうち、ログ情報の採取対象である業務サーバ11に割り当てられた論理ボリュームに記憶されたログ情報が、第2ストレージ装置23のうち1つの論理ボリュームに記憶される(ステップS43)。
第1ストレージ装置13は、コピーが完了した後に、コピー完了の旨を監視サーバ12に通知する(ステップS44)。コピー完了の通知には、第1ストレージ装置13の各論理ボリュームが第2ストレージ装置13のうち何れの論理ボリュームにコピーしたかの情報(以下、コピー先論理ボリューム情報と称する)が含まれる。
監視サーバ制御部45は、コピー先論理ボリューム情報(図14では「コピー先LV情報」と表記)を管理サーバ21に送信する(ステップS45)。管理サーバ21の第2割り当て部55は、第2ストレージ装置13にコピーされた論理ボリュームを管理サーバ21の論理ボリュームとして割り当てるように、第2ストレージ装置23に対して指示する(ステップS46)。
第2ストレージ装置23は、管理サーバ21と第2ストレージ装置23との間のアクセス経路を作成する(ステップS47)。このアクセス経路は、第2SAN25のアクセス経路である。
管理サーバ制御部53は、作成された第2SAN25のアクセス経路の情報に基づいて、第2SAN25のアクセス経路を確立する指示を第2SAN25に対して出す(ステップS48)
第2SAN25は、複数の通信経路を含み、通信経路を切り替えるスイッチ(例えば、ファイバチャネルスイッチ等)を含む。第2SAN25の各スイッチは、管理サーバ制御部53からの指示に基づいて、管理サーバ21と第2ストレージ装置23との間にアクセス経路を確立する(ステップS49)。
管理サーバ制御部53は、管理サーバ21に割り当てられた第2ストレージ装置23の論理ボリュームをマウントする(ステップS50)。これにより、該論理ボリュームは、第2ストレージ装置23に認識される。
管理サーバ制御部53は、管理者端末22に対して、障害の発生が検出されたことを示す情報、およびログ配置先情報を管理者端末22に通知する(ステップS51)。
ログ配置先情報は、ログ情報が記憶された第2ストレージ装置23の論理ボリュームの情報(マウントポイント)である。例えば、管理サーバ制御部53は、電子メールにより、上記の通知を管理者端末22に送信してもよい。
管理サーバ制御部53は、管理サーバテーブルに、新たなレコードを挿入する更新を行う(ステップS52)。新たに挿入されるレコードには、障害IDと第2ストレージ装置23のIPとLVのIDと管理サーバでのマウントポイントを示す情報とが含まれる。
次に、ステップS38でNOの場合に行われる方式Bの処理について、図15のシーケンスチャートを参照して、説明する。
監視サーバ12の監視サーバ制御部45は、ゲートウェイサーバ16に関する情報を確認する。ゲートウェイサーバ16に関する情報には、該ゲートウェイサーバ16にアクセスするための情報(ユーザ名やパスワード、IPアドレス等)が含まれる。また、ゲートウェイサーバ16に関する情報には、該ゲートウェイサーバ16が第1SAN15に接続されるポートのIPアドレス等の情報も含まれる。
監視サーバ制御部45は、第1ストレージ装置13に対して、ゲートウェイサーバ16と第1ストレージ装置13との間のアクセス経路を作成する指示を出す(ステップS61)。以下、このアクセス経路を、ゲートウェイサーバへの第1SANアクセス経路と称することがある。また、以下、ゲートウェイは「GW」と表記することがある。
第1ストレージ装置13は、上記の指示基づいて、ゲートウェイサーバ16と第1ストレージ装置13との間のアクセス経路を作成する(ステップS62)。
監視サーバ制御部45は、監視サーバ制御部45からの指示に基づいて、第1SAN15に対して、ゲートウェイサーバへの第1SANアクセス経路を確立する指示を出す(ステップS63)。第1SAN15は、ゲートウェイサーバへの第1SANアクセス経路を確立する(ステップS64)。
監視サーバ制御部45は、障害の発生が検出された業務サーバ11に割り当てられた第1ストレージ装置13の論理ボリュームを対象論理ボリューム(対象LV)として、マウントする指示をゲートウェイサーバ16に対して出す(ステップS65)。
ゲートウェイサーバ16は、監視サーバ制御部45からの指示に基づいて、第1ストレージ装置13のうち、対象論理ボリュームをマウントする(ステップS66)。これにより、ゲートウェイサーバ16は、対象論理ボリュームを認識する。
監視サーバ制御部45は、監視サーバテーブルのうち、ゲートウェイサーバでのマウントポイントに、ステップS66でマウントされた対象論理ボリュームのマウントポイントを設定する(ステップS67)。これにより、監視サーバテーブルは更新される(ステップS68)。
監視サーバ制御部45は、ゲートウェイサーバ16にアクセスするための情報および対象論理ボリュームのマウントポイントの情報を管理サーバ21に送信する(ステップS69)。
これにより、管理サーバ21から、外部ネットワーク4、ゲートウェイサーバ16および第1SAN14を介した第1ストレージ装置13へのアクセス経路が確立される。
管理サーバ21の管理サーバ制御部53は、管理者端末22に対して、障害の発生が検出されたことを示す情報、およびログ配置先情報を管理者端末22に通知する(ステップS70)。
以上により、方式Aの場合、第2SAN25を介して、管理サーバ21と第2ストレージ装置23との間のアクセス経路が確立される。また、方式Bの場合、外部ネットワーク4とゲートウェイサーバ16と第1SAN15とを介して、管理サーバ21と第1ストレージ装置13との間のアクセス経路が確立される。
次に、管理サーバ21によるログ情報採取について、図16および図17のシーケンスチャートの例を参照して、説明する。図16は、方式Aの場合のシーケンスチャートである。
管理サーバ21のログ情報採取部54は、ログ情報を採取する指示を出す(ステップS81)。方式Aの場合、第2SAN25を介して、管理サーバ21と第2ストレージ装置23との間のアクセス経路が確立されている。このため、ログ情報採取指示は、該アクセス経路に基づいて、第2ストレージ装置23に送信される。
ログ情報採取指示には、管理サーバテーブルの障害IDに対応するLVのIDが含まれる。このLVのIDは、障害の発生が検出された業務サーバ11に対応する。第2ストレージ装置23は、LVのIDに対応する論理ボリュームからログ情報を取得し、取得されたログ情報を管理サーバ21に送信する(ステップS82)。
ログ情報は、上記のアクセス経路に基づいて、管理サーバ21に送信される。これにより、管理サーバ21のログ情報採取部54はログ情報を採取する(ステップS83)。
図17は、方式Bの場合のシーケンスチャートである。方式Bの場合、外部ネットワーク4とゲートウェイサーバ16と第1SAN15とを介して、管理サーバ21と第1ストレージ装置13との間のアクセス経路が確立されている。
管理サーバ21のログ情報採取部54は、ログ情報を採取する指示を出す(ステップS84)。この指示(ログ情報採取指示)は、外部ネットワーク4とゲートウェイサーバ16と第1SAN15とを介して、第1ストレージ装置13に送信される。
ログ情報採取指示には、管理サーバテーブルの障害IDが含まれる。ゲートウェイサーバ16は、外部ネットワーク4を介して、管理サーバ21から送信されたログ情報採取指示を受信する。
ゲートウェイサーバ16は、監視サーバ2の監視サーバデータベース47に記憶されている監視サーバテーブルから障害IDに対応するLVのIDを取得し、ログ情報採取指示にLVのIDを含める。
第1ストレージ装置13は、LVのIDに対応する論理ボリュームからログ情報を取得し、取得されたログ情報を管理サーバ21に送信する(ステップS85)。ログ情報は、確立されたアクセス経路に基づいて、管理サーバ21に送信される。これにより、ログ情報採取部54は、ログ情報を採取する(ステップS86)。
<ログ情報採取後の処理の一例>
次に、ログ情報採取後の処理について、図18乃至図20のシーケンスチャートの例を参照して、説明する。管理サーバ21のログ情報採取部54が、ログ情報の採取を完了していない場合(ステップS91でNO)、処理は次のステップに進まない。
管理サーバ21のログ情報採取部54が、ログ情報の採取を完了した場合(ステップS91でYES)、採取が完了したログ情報が記憶されていた論理ボリュームの割り当て解除が行われる。
上述したように、ログ情報の採取は、障害IDに基づいて行われる。管理サーバ制御部53は、採取が完了したログ情報に対応する障害IDのレコードを管理サーバテーブルから取得する(ステップS92)。
管理サーバデータベース56に記憶されている管理サーバテーブルに、上記の障害IDが存在していれば、管理サーバデータベース56は、障害IDに対応するレコードを管理サーバ制御部53に返す。
管理サーバデータベース56に記憶されている管理サーバテーブルに、上記の障害IDが存在していなければ、管理サーバデータベース56は、空のレコードを管理サーバ制御部53に返す(ステップS93)。
空でないレコードが管理サーバ制御部53に返された場合、上述したように、管理センタ3に第2ストレージ装置23が設置されている。この場合(ステップS94でNO)、処理は方式Aに進む。
一方、空のレコードが管理サーバ制御部53に返された場合、上述したように、管理センタ3に第2ストレージ装置23が設置されていない。この場合(ステップS94でYES)、処理は方式Bに進む。
方式Aの場合の処理について、図19のシーケンスチャートの例を参照して説明する。管理サーバ制御部53は、管理サーバテーブルから、障害IDに対応する論理ボリュームのマウントポイント(管理サーバでのマウントポイント)を取得する(ステップS101)。
管理サーバデータベース56は、管理サーバテーブルの障害IDに対応するマウントポイントを管理サーバ制御部53に返す(ステップS102)。管理サーバ制御部53は、取得した論理ボリュームのマウントポイントをアンマウントする(ステップS103)。これにより、上記の論理ボリュームは、管理サーバ21により認識されなくなる。
管理サーバ制御部53は、第2ストレージ装置23に対して、上記の論理ボリュームの割り当てを解除する指示を出す(ステップS104)。この指示には、障害IDに対応するLVのIDが含まれる。
第2ストレージ装置23は、指示に基づいて、LVのIDに対応する論理ボリュームの割り当てを解除する(ステップS105)。
管理サーバ制御部53は、確立された第2SAN25のアクセス経路を解除する指示を第2SAN25に対して出す(ステップS106)。この指示に基づいて、第2SAN25は、スイッチ等を制御して、確立された第2SAN25のアクセス経路を解除する(ステップS107)。
管理サーバ制御部53は、管理サーバテーブルのうち障害IDに対応するレコードを削除する指示を管理サーバデータベース56に対して出す(ステップS108)。管理サーバデータベース56は、上記の障害IDに対応するレコードを管理サーバテーブルから削除する。
以上により、方式Aの場合のログ採取後の処理は終了する。次に、方式Bの場合のログ採取後の処理について、図20のシーケンスチャートの例を参照して説明する。
管理サーバ制御部53は、ログ採取が完了した旨の通知(ログ採取完了通知)を監視サーバ12に送信する(ステップS111)。ログ採取完了通知には、採取が完了したログ情報に対応する障害IDが含まれる。
監視サーバ制御部45は、監視サーバテーブルから、上記の障害IDに対応する論理ボリュームのマウントポイント(ゲートウェイサーバでのマウントポイント)を取得する(ステップ(ステップS112)。
監視サーバデータベース47は、上記のマウントポイントを返す(ステップS113)。監視サーバ制御部45は、ゲートウェイサーバ16に対して、論理ボリュームのマウントポイントをアンマウントする指示を出す(ステップS114)。ゲートウェイサーバ16は、この指示に基づくマウントポイントをアンマウントする(ステップS115)。
監視サーバ制御部45は、確立されたゲートウェイサーバ16と第1ストレージ装置13との間のアクセス経路を解除する指示を第1SAN15に対して出す(ステップS116)。この指示に基づいて、第2SAN25は、スイッチ等を制御して、上記のアクセス経路を解除する(ステップS117)。
監視サーバ制御部45は、監視サーバテーブルのうち、上記の障害IDに対応するレコードのマウントポイントを初期化する指示を出す(ステップS118)。監視サーバデータベース47は、この指示に基づいて、監視サーバテーブルのうち、上記の障害IDに対応するレコードのゲートウェイサーバでのマウントポイントを初期化する。
図8の例では、初期化されたゲートウェイサーバでのマウントポイントは「None」になっている。
<サーバ監視解除処理の一例>
次に、監視対象の業務サーバ11を解除の対象から解除する処理(以下、サーバ監視解除処理と称する)について、図21のシーケンスチャートの例を参照して説明する。
例えば、監視サーバ12を操作する操作者は、解除対象の業務サーバ11に関する情報(以下、サーバ解除設定情報と称する)を入力する。監視サーバ12は、サーバ解除設定情報の入力を受け付ける。
サーバ解除設定情報は、例えば、アクセスするための情報(ユーザ名やパスワード、業務サーバ11のIPアドレス等)や第1SAN15に接続されるポートのIPアドレス等の情報を含む。
監視サーバ制御部45は、サーバ解除設定情報に基づいて、解除対象の業務サーバ11にミラーリング制御部34の機能を解除する指示を出す(ステップS121)。業務サーバ11の業務サーバ制御部33は、この指示に基づいて、ミラーリング制御部34の機能を解除する(ステップS122)。
例えば、監視サーバ制御部45は、ミラーリング制御部34を実現するミラーリングプログラムを削除するアンインストールプログラムを、解除対象の業務サーバ11に送信してもよい。
この場合、解除対象の業務サーバ11は、アンインストールプログラムを実行することで、ミラーリング制御部34の機能を解除する。これにより、解除対象の業務サーバ11から第1ストレージ装置13に対してログ情報はコピーされなくなる。
監視サーバ制御部45は、監視サーバテーブルから、解除対象の業務サーバ11のIPアドレスに対応したLVのIDを取得する(ステップS123)。監視サーバデータベース47は、監視サーバテーブルのうち、解除対象の業務サーバ11のIPアドレスに対応したLVのIDを返す(ステップS124)。
監視サーバ制御部45は、確立された第1SANアクセス経路(解除対象の業務サーバ11と第1ストレージ装置13との間のアクセス経路)を解除する指示を出す(ステップS125)。この指示に基づいて、第1SAN15は、スイッチ等を制御して、上記の第1SANアクセス経路を解除する(ステップS126)。
監視サーバ制御部45は、ステップS123で取得されたLVのIDにより特定される第1ストレージ装置13の論理ボリュームを削除する指示を出す(ステップS127)。第1ストレージ装置13は、この指示に基づいて、論理ボリュームを削除する(ステップS128)。
監視サーバ制御部45は、監視サーバテーブルのうち、ステップS123で取得されたLVのIDに対応するレコードを削除する指示を出す(ステップS129)。監視サーバデータベース47は、この指示に基づいて、監視サーバテーブルから上記のレコードを削除する(ステップS130)。
<ログ監視解除処理の一例>
次に、図22のシーケンスチャートの例を参照して、監視対象のログ情報を監視の対象から解除する処理(以下、ログ監視解除処理と称する)について説明する。
例えば、監視サーバ12を操作する操作者は、解除対象のログ情報に関する情報(ログ解除設定情報)を監視サーバ12に入力する。監視サーバ12は、ログ解除設定情報の入力を受け付ける(ステップS141)。
ログ解除設定情報は、例えば、監視サーバ12が業務サーバ11にアクセスするための情報(ユーザ名やパスワード、業務サーバ11のIPアドレス等)等を含む。
監視サーバ制御部45は、ログ解除設定情報に基づいて、対象となる業務サーバ11に対して、解除対象のログ情報を監視の対象から解除する指示を出す(ステップS142)。業務サーバ11のミラーリング制御部34は、この指示に基づいて、監視対象のログ情報を解除するように設定を更新する(ステップS143)。
これにより、更新された設定に基づいて、ミラーリング制御部34は、解除対象のログ情報を、第1ストレージ装置13の論理ボリュームにコピーする制御を行わなくなる。
ミラーリング制御部34がミラーリングプログラムにより実現される場合、ミラーリングプログラムが再起動されることにより、設定の更新がミラーリング制御部34に反映されてもよい。
また、監視サーバ制御部45は、監視対象のログ情報を解除させるためのプログラム(ログ情報解除プログラム)を業務サーバ11に送信してもよい。このログ情報解除プログラムには、解除対象のログ情報に関する情報が含まれる。
業務サーバ11は、ログ情報解除プログラムを実行することで、ミラーリング制御部34に対して、監視対象のログ情報をミラーリングしないように設定する。
<監視サーバのハードウェア構成の一例>
次に、図23の例を参照して、監視サーバ12のハードウェア構成の一例を説明する。図23の例に示すように、バス100に対して、プロセッサ111とRandom Access Memory(RAM)112とRead Only Memory(ROM)113と補助記憶装置114と媒体接続部115と通信インタフェース116と入力装置117とディスプレイ118とが接続されている。
プロセッサ111は任意の処理回路である。プロセッサ111には、例えば、CPUが適用されてもよい。監視サーバ12のプロセッサ111は、第1プロセッサの一例である。
プロセッサ111はRAM112に展開されたプログラムを実行する。実行されるプログラムとしては、実施形態の処理を行うログ情報採取プログラムを適用してもよい。ROM113はRAM112に展開されるプログラムを記憶する不揮発性の記憶装置である。
補助記憶装置114は、種々の情報を記憶する記憶装置であり、例えばハードディスクドライブや半導体メモリ等を補助記憶装置114に適用してもよい。媒体接続部115は、可搬型記録媒体119と接続可能に設けられている。通信インタフェース116は、外部との通信を行うインタフェースである。
入力装置117は、監視サーバ12に対して何らかの入力を行うための装置である。例えば、入力装置117は、キーボードやマウス等であってもよい。監視サーバ12は、入力装置117による入力を受け付ける。ディスプレイ118は、所定の情報を表示する表示装置である。
可搬型記録媒体119としては、可搬型のメモリや光学式ディスク(例えば、Compact Disk(CD)やDigital Versatile Disk(DVD)等)を適用してもよい。この可搬型記録媒体119に実施形態の処理を行うログ管理プログラムが記録されてもよい。
監視サーバ12のうち、監視サーバデータベース47以外の各部は、与えられたプログラムをプロセッサ111が実行することにより、実現されてもよい。監視サーバデータベース47は、RAM112や補助記憶装置114等により実現されてもよい。
RAM112、ROM113、補助記憶装置114および可搬型記録媒体119は、何れもコンピュータ読み取り可能な有形の記憶媒体の一例である。これらの有形な記憶媒体は、信号搬送波のような一時的な媒体ではない。
<管理サーバのハードウェア構成の一例>
次に、図24の例を参照して、管理サーバ21のハードウェア構成の一例を説明する。図24の例に示すように、バス200に対して、プロセッサ211とRAM212とROM213と補助記憶装置214と媒体接続部215と通信インタフェース216とが接続されている。
プロセッサ211は任意の処理回路である。プロセッサ211には、例えば、CPUが適用されてもよい。管理サーバ21のプロセッサ211は、第2プロセッサの一例である。
プロセッサ211はRAM212に展開されたプログラムを実行する。ROM213はRAM212に展開されるプログラムを記憶する不揮発性の記憶装置である。
補助記憶装置214は、種々の情報を記憶する記憶装置であり、例えばハードディスクドライブや半導体メモリ等を補助記憶装置214に適用してもよい。媒体接続部215は、可搬型記録媒体219と接続可能に設けられている。通信インタフェース216は、外部との通信を行うインタフェースである。
可搬型記録媒体219としては、可搬型のメモリや光学式ディスクを適用してもよい。この可搬型記録媒体219に実施形態の処理を行うプログラムが記録されてもよい。
管理サーバ21のうち、管理サーバデータベース56以外の各部は、与えられたプログラムをプロセッサ211が実行することにより、実現されてもよい。管理サーバデータベース56は、RAM112や補助記憶装置114等により実現されてもよい。
RAM212、ROM213、補助記憶装置214および可搬型記録媒体219は、何れもコンピュータ読み取り可能な有形の記憶媒体の一例である。これらの有形な記憶媒体は、信号搬送波のような一時的な媒体ではない。
<業務サーバのハードウェア構成の一例>
次に、図25の例を参照して、業務サーバ11のハードウェア構成の一例を説明する。図25の例に示すように、バス300に対して、プロセッサ311とRAM312とROM313と補助記憶装置314と媒体接続部315と通信インタフェース316とが接続されている。
プロセッサ311は任意の処理回路である。プロセッサ311には、例えば、CPUが適用されてもよい。業務サーバ11のプロセッサ311は、第3プロセッサの一例である。
プロセッサ311はRAM312に展開されたプログラムを実行する。ROM313はRAM312に展開されるプログラムを記憶する不揮発性の記憶装置である。
補助記憶装置314は、種々の情報を記憶する記憶装置であり、例えばハードディスクドライブや半導体メモリ等を補助記憶装置314に適用してもよい。媒体接続部315は、可搬型記録媒体319と接続可能に設けられている。通信インタフェース316は、外部との通信を行うインタフェースである。
可搬型記録媒体319としては、可搬型のメモリや光学式ディスクを適用してもよい。この可搬型記録媒体219に実施形態の処理を行うプログラムが記録されてもよい。
業務サーバ11のうち、記憶部35以外の各部は、与えられたプログラムをプロセッサ311が実行することにより、実現されてもよい。記憶部35は、補助記憶装置114等により実現されてもよい。
RAM312、ROM313、補助記憶装置314および可搬型記録媒体319は、何れもコンピュータ読み取り可能な有形の記憶媒体の一例である。これらの有形な記憶媒体は、信号搬送波のような一時的な媒体ではない。
<その他>
上述した実施形態では、業務サーバ11が記憶部35にログ情報を追加や更新する際に、追加されたログ情報または更新された情報が、第1ストレージ装置13のうち、該業務サーバ11に割り当てられた論理ボリュームに記憶される。
業務サーバ11に障害が発生したことが検出された際、管理サーバ21は、第1ストレージ装置13または第2ストレージ装置23からログ情報を採取するため、業務サーバ11に対する、ログ情報採取のための負荷が低減する。
実施形態では、ストレージ装置は、サーバとSANにより接続される例について説明したが、SAN以外の任意のストレージネットワークに接続されてもよい。例えば、ストレージ装置は、Network Attached Storage(NAS)等であってもよい。
この場合、NASには、共有フォルダが動的に作成され、業務サーバ11が共有フォルダに割り当てられてもよい。
また、実施形態では、各業務サーバ11は1台の物理的なコンピュータにより実現される例を説明したが、各業務サーバ11は、1台の物理的なコンピュータ上の複数の仮想マシンであってもよい。この場合、上記の仮想マシンで動作するゲストOSが第1ストレージ装置13と通信を行う。OSは、Operating Systemの略称である。
また、各業務サーバ11が上記の仮想マシンにより実現される場合、上記の仮想マシンに対して、第1ストレージ装置13の論理ボリュームが割り当てられてもよい。例えば、この場合、論理ボリュームに共有フォルダが作成される。
また、第1ストレージ装置13が、ログ情報だけでなく、業務サーバ11が行う処理に関する情報を記憶する場合、第1ストレージ装置13に関するログ情報も採取の対象となることがある。
監視サーバ12が第1SAN15に接続されることで、第1ストレージ装置13に関するログ情報の採取が行われてもよい。この場合、第1ストレージ装置13の論理ボリュームに監視サーバ12が割り当てられる。
監視サーバ12は、該監視サーバ12に割り当てられた論理ボリュームをマウントする。これにより、該論理ボリュームは監視サーバ12により認識される。そして、監視サーバ12は、第1ストレージ装置13に対して、該第1ストレージ装置13に関するログ情報を採取する機能を実行させる。
ストレージ装置には、自身のストレージ装置に関するログ情報を採取する機能が設けられている場合がある。監視サーバ12は、第1ストレージ装置13に上記の機能を実行させる。
そして、監視サーバ12は、採取された第1ストレージ装置13に関するログ情報を、監視サーバ12に割り当てられた論理ボリュームに記憶させる制御を行う。これにより、第1ストレージ装置13に関するログ情報は、第1ストレージ装置13のうち、監視サーバ12に割り当てられた論理ボリュームに記憶される。
管理サーバ21は、監視サーバ12を経由して、上記の論理ボリュームから第1ストレージ装置13に関するログ情報を採取することで、第1ストレージ装置13に関するログ情報の採取が行われる。
また、採取対象のログ情報は、所定のテンプレート情報に基づいて指定されてもよい。例えば、監視サーバ12を操作する操作者は、例えば、ディスプレイ118に表示される所定のテンプレート情報に基づいて、入力装置117を用いて、採取対象のログ情報を指定してもよい。
例えば、テンプレート情報は、業務サーバ11で動作するアプリケーションと採取対象のログ情報とを関連付ける情報である。監視サーバ12が、アプリケーションの指定を受け付けると、監視サーバ12は、テンプレート情報に基づいて、アプリケーションに対応するログ情報を特定する。
この特定されたログ情報が採取対象のログ情報である。従って、採取対象のログ情報は、直接的に該ログ情報が指定されなくても、テンプレート情報に基づいて、指定することができる。
また、実施形態のシステム1は、例えば、クラウドコンピューティングシステムに適用されてもよい。クラウドコンピューティングシステムにおいて、サービスを提供するサーバに実施形態の業務サーバ11が適用されてもよい。
本実施形態は、以上に述べた実施の形態に限定されるものではなく、本実施形態の要旨を逸脱しない範囲内で種々の構成または実施形態を取ることができる。以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
監視装置と、該監視装置が監視する対象である監視対象装置と、該監視対象装置を管理する管理装置と、が通信可能に接続され、
前記監視装置は、
該監視装置に接続される第1ストレージ装置のうち所定の記憶領域を前記監視対象装置に対して割り当てる第1割り当て部と、
前記監視対象装置に対して、該監視対象装置の記憶部にログ情報が記憶される際、前記第1割り当て部が割り当てた前記記憶領域に前記ログ情報のコピーを記憶させる制御を行う制御部と、
を備え、
前記管理装置は、
前記監視対象装置の障害が検出された際、前記管理装置に接続される第2ストレージ装置に前記第1ストレージ装置からコピーされた前記ログ情報を該第2ストレージ装置から採取するか、または前記管理装置と前記第1ストレージ装置との間に確立されたアクセス経路から前記ログ情報を採取する採取部、
を備えることを特徴とするログ情報採取システム。
(付記2)
前記第1割り当て部は、複数の前記監視対象装置に対して、前記第1ストレージ装置のそれぞれ異なる記憶領域を割り当てる、
付記1記載のログ情報採取システム。
(付記3)
前記監視対象装置は、前記記憶部に記憶されたログ情報が更新された場合、該ログ情報のうち更新された分の情報を前記第1ストレージ装置に送信して、該第1ストレージ装置に対して割り当てられた記憶領域に記憶されたログ情報を更新させる、
付記1記載のログ情報採取システム。
(付記4)
前記管理装置と前記監視装置との間を接続する外部ネットワークと、
前記外部ネットワークより高速に通信を行い、前記監視装置と前記監視対象装置との間を接続する内部ネットワークと、
前記内部ネットワークより高速に通信を行い、前記監視対象装置と前記第1ストレージ装置との間を接続するストレージネットワークと、
をさらに備える付記1記載のログ情報採取システム。
(付記5)
前記制御部は、前記第1ストレージ装置と前記第2ストレージとの間のストレージ間通信経路が検出された場合、前記第1ストレージ装置と前記監視対象装置との間に前記第1ストレージネットワークのアクセス経路を確立する、
付記1記載のログ情報採取システム。
(付記6)
前記制御部は、
前記ストレージ装置と前記第2ストレージとの間のストレージ間通信経路が検出された場合、前記第1ストレージ装置に対して、前記第1ストレージ装置に記憶された前記ログ情報を前記第2ストレージにコピーさせる制御を行い、
前記ストレージ間通信経路が検出されない場合、前記管理装置と前記第1ストレージ装置との間の前記アクセス経路を確立する制御を行う、
付記1記載のログ情報採取システム。
(付記7)
新たに監視対象とする前記監視対象装置の指定を前記監視装置が受け付けた場合、前記第1割り当て部は、指定を受け付けた前記監視対象装置に対して、前記第1ストレージ装置のうち新たな記憶領域を割り当てる、
付記1記載のログ情報採取システム。
(付記8)
前記監視対象装置に関するログ情報のうち、新たに監視対象とするログ情報の指定を前記監視装置が受け付けた場合、前記制御部は、前記第1割り当て部が割り当てた前記記憶領域に前記新たに監視対象とするログ情報のコピーを記憶させる制御を行う、
付記1記載のログ情報採取システム。
(付記9)
前記管理装置は、前記第2ストレージ装置のうち、前記第1ストレージ装置からコピーされたログ情報が記憶された論理ボリュームを前記管理装置に対して割り当てる第2割り当て部、
をさらに備える付記1記載のログ情報採システム。
(付記10)
前記第2割り当て部は、前記採取部から前記ログ情報の採取が完了したことの通知を受信したことに応じて、前記第2ストレージ装置のうち、採取が完了した前記ログ情報に割り当てられた記憶領域の割り当てを解除する、
付記9記載のログ情報採取システム。
(付記11)
前記制御部は、前記採取部から前記ログ情報の採取が完了したことの通知を受信したことに応じて、採取が完了した前記ログ情報が記憶されていた前記第1ストレージの記憶領域と前記管理装置との間に確立されたアクセス経路を解除する、
付記5記載のログ情報採取システム。
(付記12)
前記第1ストレージ装置の記憶領域に割り当てられた監視対象装置を解除する指定を前記監視装置が受け付けた場合、前記第1割り当て部は、前記第1ストレージ装置のうち、指定を受け付けた前記監視対象装置に対して割り当てられた記憶領域の割り当てを解除する、
付記1記載のログ情報採取システム。
(付記13)
前記制御部は、前記第1ストレージ装置のうち、監視対象の業務サーバに割り当てられた記憶領域に記憶された複数のログ情報から、指定されたログ情報を監視対象から解除する制御を行う、
付記1記載のログ情報採取システム。
(付記14)
監視装置に、
該監視装置に接続される第1ストレージ装置のうち所定の記憶領域を、前記監視装置が監視する対象である監視対象装置に対して割り当て、
前記監視対象装置に対して、該監視対象装置の記憶部にログ情報が記憶される際、前記監視対象装置に対して割り当てられた前記記憶領域に前記ログ情報のコピーを記憶させ、
前記監視対象装置の障害が検出された際、前記監視対象装置を管理する管理装置に対して、該管理装置に接続される第2ストレージ装置に前記第1ストレージ装置からコピーされた前記ログ情報を該第2ストレージ装置から採取させるか、または前記管理装置と前記第1ストレージ装置との間に確立されたアクセス経路から前記ログ情報を採取させるように、通知を行う、
処理を実行させることを特徴とするログ情報採取プログラム。
(付記15)
監視装置が、
該監視装置に接続される第1ストレージ装置のうち所定の記憶領域を、前記監視装置が監視する対象である監視対象装置に対して割り当て、
前記監視対象装置に対して、該監視対象装置の記憶部にログ情報が記憶される際、前記監視対象装置に対して割り当てられた前記記憶領域に前記ログ情報のコピーを記憶させ、
前記監視対象装置の障害が検出された際、前記監視対象装置を管理する管理装置に対して、該管理装置に接続される第2ストレージ装置に前記第1ストレージ装置からコピーされた前記ログ情報を該第2ストレージ装置から採取させるか、または前記管理装置と前記第1ストレージ装置との間に確立されたアクセス経路から前記ログ情報を採取させるように、通知を行う、
ことを特徴とするログ情報採取方法。
1 システム
2 データセンタ
3 管理センタ
4 外部ネットワーク
5 ストレージ間通信経路
11 業務サーバ
12 監視サーバ
13 第1ストレージ装置
14 第1内部ネットワーク
15 第1SAN
16 ゲートウェイサーバ
21 管理サーバ
22 管理者端末
23 第2ストレージ装置
24 第2内部ネットワーク
25 第2SAN
33 業務サーバ制御部
34 ミラーリング制御部
35 記憶部
43 経路検出部
44 障害検出部
45 監視サーバ制御部
46 第1割り当て部
53 管理サーバ制御部
54 ログ情報採取部
55 第2割り当て部
111、211、311 プロセッサ
112、212、312 RAM
113、313、313 ROM

Claims (7)

  1. 監視装置と、該監視装置が監視する対象である監視対象装置と、該監視対象装置を管理する管理装置と、が通信可能に接続され、
    前記監視装置は、
    該監視装置に接続される第1ストレージ装置のうち所定の記憶領域を前記監視対象装置に対して割り当てる第1割り当て部と、
    前記監視対象装置に対して、該監視対象装置の記憶部にログ情報が記憶される際、前記第1割り当て部が割り当てた前記記憶領域に前記ログ情報のコピーを記憶させる制御を行う制御部と、
    を備え、
    前記管理装置は、
    前記監視対象装置の障害が検出された際、前記管理装置に接続される第2ストレージ装置に前記第1ストレージ装置からコピーされた前記ログ情報を該第2ストレージ装置から採取するか、または前記管理装置と前記第1ストレージ装置との間に確立されたアクセス経路から前記ログ情報を採取する採取部、
    を備え
    前記制御部は、
    前記第1ストレージ装置と前記第2ストレージ装置との間のストレージ間通信経路が検出された場合、前記第1ストレージ装置に対して、前記第1ストレージ装置に記憶された前記ログ情報を前記第2ストレージ装置にコピーさせる制御を行い、
    前記ストレージ間通信経路が検出されない場合、前記管理装置と前記第1ストレージ装置との間の前記アクセス経路を確立する制御を行う、
    ことを特徴とするログ情報採取システム。
  2. 前記第1割り当て部は、複数の前記監視対象装置に対して、前記第1ストレージ装置のそれぞれ異なる記憶領域を割り当てる、
    ことを特徴とする請求項1記載のログ情報採取システム。
  3. 前記監視対象装置は、前記記憶部に記憶されたログ情報が更新された場合、該ログ情報のうち更新された分の情報を前記第1ストレージ装置に送信して、該第1ストレージ装置に対して割り当てられた記憶領域に記憶されたログ情報を更新させる、
    ことを特徴とする請求項1または2記載のログ情報採取システム。
  4. 前記管理装置と前記監視装置との間を接続する外部ネットワークと、
    前記外部ネットワークより高速に通信を行い、前記監視装置と前記監視対象装置との間を接続する内部ネットワークと、
    前記内部ネットワークより高速に通信を行い、前記監視対象装置と前記第1ストレージ装置との間を接続するストレージネットワークと、
    をさらに備えることを特徴とする請求項1乃至3のうち何れか1項に記載のログ情報採取システム。
  5. 前記管理装置は、前記第2ストレージ装置のうち、前記第1ストレージ装置からコピーされたログ情報が記憶された論理ボリュームを前記管理装置に対して割り当てる第2割り当て部、
    をさらに備える請求項1乃至のうち何れか1項に記載のログ情報採取システム。
  6. 監視装置に、
    該監視装置に接続される第1ストレージ装置のうち所定の記憶領域を、前記監視装置が監視する対象である監視対象装置に対して割り当て、
    前記監視対象装置に対して、該監視対象装置の記憶部にログ情報が記憶される際、前記監視対象装置に対して割り当てられた前記記憶領域に前記ログ情報のコピーを記憶させ、
    前記監視対象装置の障害が検出された際、前記監視対象装置を管理する管理装置に対して、該管理装置に接続される第2ストレージ装置に前記第1ストレージ装置からコピーされた前記ログ情報を該第2ストレージ装置から採取させるか、または前記管理装置と前記第1ストレージ装置との間に確立されたアクセス経路から前記ログ情報を採取させるように、通知を行
    前記第1ストレージ装置と前記第2ストレージ装置との間のストレージ間通信経路が検出された場合、前記第1ストレージ装置に対して、前記第1ストレージ装置に記憶された前記ログ情報を前記第2ストレージ装置にコピーさせる制御を行い、
    前記ストレージ間通信経路が検出されない場合、前記管理装置と前記第1ストレージ装置との間の前記アクセス経路を確立する制御を行う、
    処理を実行させることを特徴とするログ情報採取プログラム。
  7. 監視装置が、
    該監視装置に接続される第1ストレージ装置のうち所定の記憶領域を、前記監視装置が監視する対象である監視対象装置に対して割り当て、
    前記監視対象装置に対して、該監視対象装置の記憶部にログ情報が記憶される際、前記監視対象装置に対して割り当てられた前記記憶領域に前記ログ情報のコピーを記憶させ、
    前記監視対象装置の障害が検出された際、前記監視対象装置を管理する管理装置に対して、該管理装置に接続される第2ストレージ装置に前記第1ストレージ装置からコピーされた前記ログ情報を該第2ストレージ装置から採取させるか、または前記管理装置と前記第1ストレージ装置との間に確立されたアクセス経路から前記ログ情報を採取させるように、通知を行
    前記第1ストレージ装置と前記第2ストレージ装置との間のストレージ間通信経路が検出された場合、前記第1ストレージ装置に対して、前記第1ストレージ装置に記憶された前記ログ情報を前記第2ストレージ装置にコピーさせる制御を行い、
    前記ストレージ間通信経路が検出されない場合、前記管理装置と前記第1ストレージ装置との間の前記アクセス経路を確立する制御を行う、
    処理を実行することを特徴とするログ情報採取方法。
JP2015215411A 2015-11-02 2015-11-02 ログ情報採取システム、ログ情報採取プログラムおよびログ情報採取方法 Active JP6623692B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015215411A JP6623692B2 (ja) 2015-11-02 2015-11-02 ログ情報採取システム、ログ情報採取プログラムおよびログ情報採取方法
US15/298,537 US10204027B2 (en) 2015-11-02 2016-10-20 Log information collection system and log information collection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015215411A JP6623692B2 (ja) 2015-11-02 2015-11-02 ログ情報採取システム、ログ情報採取プログラムおよびログ情報採取方法

Publications (2)

Publication Number Publication Date
JP2017090946A JP2017090946A (ja) 2017-05-25
JP6623692B2 true JP6623692B2 (ja) 2019-12-25

Family

ID=58638400

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015215411A Active JP6623692B2 (ja) 2015-11-02 2015-11-02 ログ情報採取システム、ログ情報採取プログラムおよびログ情報採取方法

Country Status (2)

Country Link
US (1) US10204027B2 (ja)
JP (1) JP6623692B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10467571B2 (en) * 2016-07-10 2019-11-05 Asim Kumar Datta Robotic conductor of business operations software
CN107315672B (zh) * 2017-06-22 2020-08-21 北京星选科技有限公司 用于监控服务器的方法和装置
CN108599973B (zh) * 2018-01-05 2021-08-24 创新先进技术有限公司 一种日志关联方法、装置及设备
CN108959029A (zh) * 2018-06-29 2018-12-07 深圳市同泰怡信息技术有限公司 收集和报告服务器异常日志的方法及系统
JP7207009B2 (ja) * 2019-02-26 2023-01-18 日本電信電話株式会社 異常検知装置、異常検知方法および異常検知プログラム
US11468011B2 (en) * 2019-04-11 2022-10-11 Singlestore, Inc. Database management system
JP7251417B2 (ja) * 2019-09-09 2023-04-04 富士通株式会社 情報送信システム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5544347A (en) * 1990-09-24 1996-08-06 Emc Corporation Data storage system controlled remote data mirroring with respectively maintained data indices
US5901327A (en) * 1996-05-28 1999-05-04 Emc Corporation Bundling of write data from channel commands in a command chain for transmission over a data link between data storage systems for remote data mirroring
US6226651B1 (en) * 1998-03-27 2001-05-01 International Business Machines Corporation Database disaster remote site recovery
US7111189B1 (en) * 2000-03-30 2006-09-19 Hewlett-Packard Development Company, L.P. Method for transaction log failover merging during asynchronous operations in a data storage network
US7467168B2 (en) * 2003-06-18 2008-12-16 International Business Machines Corporation Method for mirroring data at storage locations
US7620786B2 (en) * 2003-09-12 2009-11-17 Lsi Corporation Storage recovery using a delta log
JP2005242403A (ja) * 2004-02-24 2005-09-08 Hitachi Ltd 計算機システム
US7139851B2 (en) * 2004-02-25 2006-11-21 Hitachi, Ltd. Method and apparatus for re-synchronizing mirroring pair with data consistency
JP2006178555A (ja) 2004-12-21 2006-07-06 Hitachi Ltd イベント情報ミラーリング機能を有する情報処理装置
EP1867097B1 (en) * 2005-03-10 2016-11-02 Telecom Italia S.p.A. Disaster recovery architecture
EP2328089B1 (en) * 2005-04-20 2014-07-09 Axxana (Israel) Ltd. Remote data mirroring system
JP2008108227A (ja) * 2006-09-25 2008-05-08 Hitachi Ltd ストレージシステム及び監査ログ管理方法
JP5045489B2 (ja) * 2008-02-22 2012-10-10 日本電気株式会社 データ変更検知装置、データ変更検知方法、及びプログラム
US8024442B1 (en) * 2008-07-08 2011-09-20 Network Appliance, Inc. Centralized storage management for multiple heterogeneous host-side servers
GB2496377B (en) * 2011-11-02 2014-07-30 Ibm Message reconciliation during disaster recovery
JP6048038B2 (ja) * 2012-09-27 2016-12-21 富士通株式会社 情報処理装置,プログラム,情報処理方法
US9607065B2 (en) * 2013-04-26 2017-03-28 Netapp, Inc. Hierarchical coherency log for managing a distributed data storage system
US20150312337A1 (en) * 2014-04-25 2015-10-29 Netapp Inc. Mirroring log data

Also Published As

Publication number Publication date
JP2017090946A (ja) 2017-05-25
US20170123955A1 (en) 2017-05-04
US10204027B2 (en) 2019-02-12

Similar Documents

Publication Publication Date Title
JP6623692B2 (ja) ログ情報採取システム、ログ情報採取プログラムおよびログ情報採取方法
CN110603524B (zh) 用于编排的工作负载的依赖性分析的方法和系统
JP4650203B2 (ja) 情報システム及び管理計算機
US10146636B1 (en) Disaster recovery rehearsals
US8448167B2 (en) Storage system, and remote copy control method therefor
US7716319B2 (en) Computer system and method for managing log information
US20060095705A1 (en) Systems and methods for data storage management
US8706859B2 (en) Method and apparatus of data center file system
JP4813385B2 (ja) ストレージシステムの複数の論理リソースを制御する制御装置
US8578121B2 (en) Computer system and control method of the same
JP5360978B2 (ja) ファイルサーバ、及びファイルサーバにおけるファイル操作通知方法
JP4566874B2 (ja) Ipネットワークにおけるストレージアクセス管理機能及びシステム
JP5921684B2 (ja) 計算機システムおよびアプリケーションプログラム実行環境移行方法
US7779368B2 (en) Systems and methods for presenting managed data
US20140351545A1 (en) Storage management method and storage system in virtual volume having data arranged astride storage device
US7779082B2 (en) Address management device
JP2008021116A (ja) San/nas統合管理計算機及び方法
WO2015092847A1 (ja) コンピュータシステムおよびその処理方法
JP6393612B2 (ja) システムのバックアップ装置及びバックアップ方法
JP2008027279A (ja) 複数の仮想計算機からのテープ媒体へのアクセスを制御する方法及びシステム
JP4275700B2 (ja) リソース交換処理プログラムおよびリソース交換処理方法
JP2011248658A (ja) 仮想サーバデプロイ管理装置及び方法、そのプログラム
JP5439435B2 (ja) 計算機システムおよびその計算機システムにおけるディスク共有方法
JP2012027531A (ja) 計算機システムを管理する管理システム及び管理方法
JP2011081579A (ja) Itシステム仮想化における仮想リソースのシステム運用管理方法およびシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180706

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190308

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190416

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190610

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190610

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191111

R150 Certificate of patent or registration of utility model

Ref document number: 6623692

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150