JP2019046000A - ログ管理装置、ログ管理方法及びログ管理プログラム - Google Patents

ログ管理装置、ログ管理方法及びログ管理プログラム Download PDF

Info

Publication number
JP2019046000A
JP2019046000A JP2017166232A JP2017166232A JP2019046000A JP 2019046000 A JP2019046000 A JP 2019046000A JP 2017166232 A JP2017166232 A JP 2017166232A JP 2017166232 A JP2017166232 A JP 2017166232A JP 2019046000 A JP2019046000 A JP 2019046000A
Authority
JP
Japan
Prior art keywords
log
time
transmission
collection target
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017166232A
Other languages
English (en)
Inventor
雅人 田辺
Masato Tanabe
雅人 田辺
敏彦 及川
Toshihiko Oikawa
敏彦 及川
雄司 森多
Yuji Morita
雄司 森多
将斗 大塚
Masato Otsuka
将斗 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017166232A priority Critical patent/JP2019046000A/ja
Priority to US16/114,847 priority patent/US20190065337A1/en
Publication of JP2019046000A publication Critical patent/JP2019046000A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3433Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】ログ送信による業務の性能劣化を防ぐこと。
【解決手段】ストレージ装置20のログ生成時間計測部24が、ログ生成に要するログ生成時間を計測する。クラウド3のログ送信時間計測部34が、ログ受信の開始から完了までの時間をログ送信時間として計測する。そして、ログ解析部35が、ログ生成時間とログ送信時間とログに基づいてストレージ装置20の負荷指数を算出し、負荷指数に基づいて、各ストレージ装置20がログを生成して送信するログ送信時刻を決定する。
【選択図】図2

Description

本発明は、ログ管理装置、ログ管理方法及びログ管理プログラムに関する。
ストレージ装置の動作を監視し、ストレージ装置の潜在的な問題を解決する自動支援機能がある。図17は、自動支援機能を説明するための図である。図17に示すように、ストレージ装置a、ストレージ装置b及びストレージ装置cで表される3台のストレージ装置92は、自動支援が設定されるとクラウド93にログを送信し、クラウド93は、ログを解析して解析結果をストレージ装置92を管理するシステム管理者に通知する。
ここで、クラウド93は、コンピュータネットワークをベースとしてコンピュータ資源を提供するコンピュータシステムである。ログ送信は、システム管理者が指定する任意のタイミング、設定された定時タイミング、トラブル発生時、リブート時等に行われる。
なお、通信負荷が最も大きい利用者の機器がデータを送信するタイミングを、機器からのデータを受信するために利用可能な通信帯域がある時間帯に割り当てることで、ログ収集タイミングの集中を避けるログ管理システムがある。
また、情報処理装置の使用状況を指標値に数値化し、指標値が予め定められた基準指標値以上である時間帯を管理プログラムを実行させる時間帯として選択することで、適切な時間帯に管理プログラムを実行させる技術がある。
特開2016−110280号公報 国際公開第2005/033940号
図17に示した自動支援機能においてストレージ装置92がログを送信する時刻が適切でないと、ストレージ装置92を使用する業務が影響を受け、業務の性能劣化が発生するという問題がある。
本発明は、1つの側面では、ログ送信による業務の性能劣化を防ぐことを目的とする。
1つの態様では、ログ管理装置は、算出部と時刻決定部とを有する。算出部は、ログ収集対象装置においてログ生成に要したログ生成時間及び該ログ収集対象装置からのログ送信に要したログ送信時間に基づいて該ログ収集対象装置の負荷指数を算出する。時刻決定部は、算出部により算出された負荷指数に基づいて、ログ収集対象装置がログの送信処理を実行する時刻をログ送信時刻として決定する。
1つの側面では、本発明は、ログ送信による業務の性能劣化を防ぐことができる。
図1は、実施例に係るログ収集システムを説明するための図である。 図2は、ログ収集システムの機能構成を示す図である。 図3は、ログ解析部の機能構成を示す図である。 図4は、1ヶ月分のログ生成時間及びログ送信時間の一例を示す図である。 図5は、CPU使用率、メモリ使用率、DBR及びLATIの1日の遷移例を示す図である。 図6は、11時から11時50分のCPU使用率、メモリ使用率、DBR及びLATIを示す図である。 図7は、11/1のLI遷移を示す図である。 図8は、11/1、11/2、11/3、11/4、11/5のLI遷移を示す図である。 図9は、LIA遷移例を示す図である。 図10は、ストレージ装置B〜ストレージ装置EのLIA遷移を示す図である。 図11は、ストレージ装置A〜ストレージ装置Eの送信可能時刻範囲を示す図である。 図12は、近傍の範囲を増やした場合の各ストレージ装置の送信可能時刻範囲を示す図である。 図13Aは、ログ収集システムによる処理のシーケンスを示す第1のシーケンス図である。 図13Bは、ログ収集システムによる処理のシーケンスを示す第2のシーケンス図である。 図13Cは、ログ収集システムによる処理のシーケンスを示す第3のシーケンス図である。 図14は、ログ送信時刻決定処理のフローを示すフローチャートである。 図15は、順番付処理のフローを示すフローチャートである。 図16は、実施例に係るログ管理プログラムを実行するコンピュータのハードウェア構成を示す図である。 図17は、自動支援機能を説明するための図である。
以下に、本願の開示するログ管理装置、ログ管理方法及びログ管理プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例は開示の技術を限定するものではない。
まず、実施例に係るログ収集システムについて説明する。図1は、実施例に係るログ収集システムを説明するための図である。図1に示すように、ログ収集システム1は、ユーザ環境2とクラウド3を有する。ユーザ環境2には、ストレージ装置A、ストレージ装置B、・・・、ストレージ装置Xで表される複数のストレージ装置20が含まれる。各ストレージ装置20は、業務で使用されるデータ等が記憶される。各ストレージ装置20は、システム管理者によって管理される。
各ストレージ装置20は、自動支援機能によりログを収集し、ユーザ環境2の外部IF2aを介してクラウド3にログの送信を行う。各ストレージ装置20は、ログを生成する際に生成開始から生成終了までのログ生成に要するログ生成時間を計測し、ログ生成時間を付加してクラウド3にログを送信する。
クラウド3は、ログの受信開始から受信完了するまでの時間をログ送信に要するログ送信時間として計測する。そして、クラウド3は、ログとログ生成時間とログ送信時間に基づいて各ストレージ装置20の負荷指数を算出する。なお、負荷指数の詳細は後述する。そして、クラウド3は、負荷指数に基づいて各ストレージ装置20の送信可能時刻範囲を特定し、送信可能時刻範囲と負荷指数に基づいて複数のストレージ装置20のログ送信の順番付けを行う。ここで、送信可能時刻範囲は、ストレージ装置20がログを送信可能な時刻の範囲である。そして、クラウド3は、ログ送信の順番と送信可能時刻範囲に基づいて各ストレージ装置20のログ送信時刻を決定し、各ストレージ装置20に通知する。ここで、ログ送信時刻は、ログを生成して送信する処理を開始する時刻である。ログ送信時刻は、ログを送信する処理を開始する時刻でもよい。
このように、クラウド3は、ログとログ生成時間とログ送信時間に基づいて各ストレージ装置20の負荷指数を算出し、送信可能時刻範囲を特定し、ログ送信の順番付けを行う。そして、クラウド3は、ログ送信の順番と送信可能時刻範囲と負荷指数に基づいて各ストレージ装置20のログ送信時刻を決定する。したがって、ログ収集システム1は、ストレージ装置20を使用する業務への悪影響を防いでログ収集を行うことができる。
次に、ログ収集システム1の機能構成について説明する。図2は、ログ収集システム1の機能構成を示す図である。図2に示すように、ログ収集システム1には、複数のストレージ装置20と、クラウド3が含まれる。
複数のストレージ装置20とクラウド3はネットワーク1aで接続される。また、複数のストレージ装置20とクラウド3は管理ネットワーク1bで接続される。システム管理者は、管理ネットワーク1bを用いて複数のストレージ装置20を管理する。
ストレージ装置20は、ログ送信時刻記録部21と、装置状態記録部22と、ログ生成部23と、ログ生成時間計測部24と、ログ送信部25と、緊急ログフラグ監視部26と、帯域監視部27と、ログ制御部28とを有する。
ログ送信時刻記録部21は、クラウド3から通知されたログ送信時刻を記憶する。ログ送信時刻記録部21は、ログ制御部28からの問合せを受けると、ログ送信時刻を応答する。
装置状態記録部22は、ストレージ装置20の状態を記憶する。装置状態記録部22は、緊急度の高いログがある場合に緊急ログフラグを記憶する。装置状態記録部22は、緊急ログフラグ監視部26からの問合せを受けると、緊急ログフラグを応答する。装置状態記録部22は、クラウド3へのログ送信に用いるWAN(Wide Area Network)の送信帯域を記憶する。装置状態記録部22は、帯域監視部27からの問合せを受けると、WAN送信帯域を応答する。
ログ生成部23は、ログ制御部28の指示に基づいてログを生成する。ログには、レイテンシー(latency)、CPU(Central Processing Unit)使用率、メモリ使用率、DBR(ディスクビジー率)が含まれる。レイテンシーは、例えば、ストレージ装置20がアクセス要求を受けて応答するまでの時間である。また、ログには、ストレージ装置20のフォルト、ハードウェアエラー及びソフトウェアエラー、ユーザオペレーション等の発生状況、ストレージ性能情報(IOPS(Input/Output Per Second)、データ転送速度)等が含まれる。
ログ生成部23は、ログ生成を開始するときにログ生成時間計測部24に時間の計測開始を指示し、ログ生成を終了するときにログ生成時間計測部24に時間の計測終了を指示する。
ログ生成時間計測部24は、ログ生成部23の指示に基づいて、ログ生成に要した時間を計測する。ログ生成時間計測部24は、ログ制御部28からの問合せを受けると、計測した時間を応答する。ログ送信部25は、ログ制御部28の指示に基づいてログをクラウド3に送信する。
緊急ログフラグ監視部26は、クラウド3の指示に基づいて、装置状態記録部22に緊急ログフラグの問合せを行う。緊急ログフラグ監視部26は、帯域監視部27にWAN送信帯域の取得を指示する。帯域監視部27は、装置状態記録部22にWAN送信帯域の問合せを行う。そして、帯域監視部27は、緊急ログフラグの有無とWAN送信帯域を装置状態として通知する。
ログ制御部28は、ログ送信の制御を行う。すなわち、ログ制御部28は、ログ送信時刻記録部21にログ送信時刻を問合せ、ログ送信時刻になるとログ生成部23にログ生成を指示する。また、ログ制御部28は、ログ生成時間計測部24にログ生成時間を問合せ、ログ生成部23が生成したログにログ生成時間を付加し、クラウド3との接続を確立し、ログ送信部25にログ送信を指示する。
クラウド3は、ログ保存部31と、緊急ログフラグ保存部32と、ログ受信部33と、ログ送信時間計測部34と、ログ解析部35と、ストレージ装置管理部36と、ログ制御部37とを有する。
ログ保存部31は、ログ制御部37の指示に基づいてログ及びログ送信時間を保存する。緊急ログフラグ保存部32は、ストレージ装置管理部36がストレージ装置20から取得した装置状態を保存する。
ログ受信部33は、ストレージ装置20が送信したログを受信し、受信したログをログ保存部31に渡す。ログ送信時間計測部34は、ログ制御部37の指示に基づいてログ送信に要した時間を計測する。ログ解析部35は、ログ保存部31が保存するログに基づいて各ストレージ装置20のログ送信時刻を決定し、各ストレージ装置20に通知する。
ストレージ装置管理部36は、定期的に各ストレージ装置20に緊急ログフラグの更新を含む装置状態の更新を指示し、各ストレージ装置20から装置状態を受け取る。ここで、定期的とは、例えば特定の時間である。そして、ストレージ装置管理部36は、緊急ログフラグ保存部32に装置状態の保存を指示する。
ログ制御部37は、ログの受信、保存及び解析を制御する。すなわち、ログ制御部37は、ログの受信開始を検知するとログ送信時間計測部34にログ送信に要した時間の計測を指示する。また、ログ制御部37は、ログの受信が完了すると、ログ保存部31にログの保存を指示する。また、ログ制御部37は、ログ送信時間計測部34により計測されたログ送信時間の保存をログ保存部31に指示する。また、ログ制御部37は、ログ解析部35にログの解析とログ送信時刻の決定を指示する。また、ログ制御部37は、ログ送信時刻を各ストレージ装置20に送信する。
次に、ログ解析部35の詳細について説明する。図3は、ログ解析部35の機能構成を示す図である。図3に示すように、ログ解析部35は、算出部35aと、特定部35bと、順番決定部35cと、時刻決定部35dとを有する。
算出部35aは、ログ生成時間とログ送信時間とログに基づいてストレージ装置20の負荷指数を算出する。具体的には、算出部35aは、ログ保存部31から過去1ヶ月のストレージ装置20のレイテンシーの推移、CPU使用率の推移、メモリ使用率の推移、DBRの推移を取得する。算出部35aは、取得した値を一定の時間間隔で分割して扱う。一定の時間間隔は、例えば10分である。また、過去1ヶ月も一例であり、他の期間でもよい。
また、算出部35aは、ログ保存部31から1回毎のログ生成時間及びログ送信時間を過去1ヶ月分取得する。図4は、1ヶ月分のログ生成時間及びログ送信時間の一例を示す図である。なお、ここでは、ログは1日1回送信されるものとする。また、図4において、ログ生成時間及びログ送信時間の単位は分である。Dateは日付である。また、図4のデータは、11/1〜11/30の1ヶ月(30日分)のデータである。例えば、11/1のログ生成時間は16分であり、ログ送信時間は8分である。
そして、算出部35aは、1ヶ月分のログ生成時間及びログ送信時間に基づき次の日のログ生成時間及びログ送信時間を予測する。算出部35aは、LGT(Log Generation Time)=過去1ヶ月の平均ログ生成時間とLTT(Log Transmission Time)=過去1ヶ月の平均ログ送信時間を予測値とする。
図4に示したログ生成時間及びログ送信時間の場合、LGT=(16+22+18+・・・+22+19+17)/30=588/30=19.6≒20であり、LTT=(8+11+9+・・・+11+9+9)/30=294/30≒10である。
そして、算出部35aは、日毎の時刻mの負荷指数LImを以下の式(1)を用いて1ヶ月分算出する。
Figure 2019046000
ここで、CPUmは時刻mのCPU使用率であり、MEMmは時刻mのメモリ使用率であり、DBRmは時刻mのDBRである。単位はいずれも%である。CPUm、MEMm及びDBRmをそれぞれ3で割る理由は、CPUm、MEMm及びDBRmの3つの和の平均を計算するためである。また、CPUm、MEMm及びDBRmは、ある程度の値よりも小さい場合には業務に影響することはないため、所定の閾値(例えば80%)未満の場合は0とされる。
LATImは、時刻mのレイテンシーLATmを過去1ヶ月の平均レイテンシーで割った値である。LATに関しては使用されている環境により搭載されているドライブがSSD(Solod State Drive)であるかHDD(Hard Disk Drive)であるかによって基準が異なるため、1ヶ月の平均の値を基準とし、それに対する割合LATImが用いられる。LATImはある時刻mにおけるLATmの値が過去1ヶ月間の平均レイテンシーよりも大きくなると1.0よりも大きくなり、逆に過去1ヶ月間の平均レイテンシーよりも小さくなると1.0よりも小さくなる。
負荷指数LImは、送信開始時刻mを起点としてログを生成して送信するまでにストレージ装置20にかかる負荷に基づく値である。具体的には、負荷指数LImは、時刻mから時刻(m+(LGT+LTT))の間でCPU使用率、メモリ使用率、DBR及びレイテンシーに基づく値を足し合わせた値である。また、データは、一定の時間間隔で分割して扱われるため、分割の度合によってデータ数が異なる。分割の度合による差異をなくすため、m〜(m+(LGT+LTT))のデータ数で割ることによって正規化が行われる。
図5は、CPU使用率、メモリ使用率、DBR及びLATIの1日の遷移例を示す図である。図5の対象日は、11/1である。横軸は時刻であり、縦軸はCPU使用率、メモリ使用率、DBR及びLATIである。縦軸の単位は、CPU使用率、メモリ使用率およびDBRの場合は%である。
図6は、11時から11時50分のCPU使用率、メモリ使用率、DBR及びLATIを示す図である。図6では、データは10分間隔で扱われる。例えば、11時0分におけるCPU使用率は36%であり、メモリ使用率は53%であり、DBRは63%であり、LATIは1.02である。
図4に基づいて計算されたLGT+LTT=30を用いると、m〜(m+(LGT+LTT))のデータ数=3であるので、LI11:30は以下のように計算される。
LI11:30=((CPU11:30/3+MEM11:30/3+DBR11:30/3)×LATI11:30+(CPU11:40/3+MEM11:40/3+DBR11:40/3)×LATI11:40+(CPU11:50/3+MEM11:50/3+DBR11:50/3)×LATI11:50)/3=((94/3+89/3+41/3)×0.98+(88/3+92/3+38/3)×1.04+(84/3+88/3+56/3)×0.99)/3
ここで、CPUm、MEMm及びDBRmにおいて80未満を0とするとLI11:30は以下の値となる。
LI11:30=((94/3+89/3+0)×0.98+(88/3+92/3+0)×1.04+(84/3+88/3+0)×0.99)/3≒59.6
同様の計算を0時0分から23時50分について行うと11/1のLI遷移が得られる。図7は、11/1のLI遷移を示す図である。横軸は時刻であり、縦軸はLIである。同様に、11月の各日について、LI遷移が得られる。図8は、11/1、11/2、11/3、11/4、11/5のLI遷移を示す図である。
そして、算出部35aは、各日のLImを用いて1ヶ月分の平均値LIAmを以下の式(2)を用いて計算する。
Figure 2019046000
そして、算出部35aは、1日の全ての時刻mについてLIAmを計算する。図9は、LIA遷移例を示す図である。横軸は時刻であり、縦軸はLIAである。
特定部35bは、負荷指数に基づいて送信可能時刻範囲を特定する。具体的には、特定部35bは、算出部35aにより計算されたLIAmのうち最も低い値の時刻及び近傍(例えば、LIAが最低値より+10以内)をログ送信時刻の候補とする。ログ送信時刻の候補が連続している場合、特定部35bは、連続する候補の範囲を送信可能時刻範囲とする。図9では、LIAの中で最も低い値は13時付近の約6であり、LIAが16以内の範囲は10時から11時、12時30分から14時となるので、10時から11時と12時30分から14時が送信可能時刻範囲である。
算出部35aは、ユーザ環境2にある全てのストレージ装置20について、LIAを計算する。図10は、ストレージ装置B〜ストレージ装置EのLIA遷移を示す図である。そして、特定部35bは、各ストレージ装置20について送信可能時刻範囲を特定する。図11は、ストレージ装置A〜ストレージ装置Eの送信可能時刻範囲を示す図である。図11において、網掛け部分が送信可能時刻範囲である。なお、ストレージ装置AのLIA遷移は図9に示したLIA遷移である。
順番決定部35cは、ユーザ環境2にある全てのストレージ装置20について、送信可能時刻範囲と、ログ生成送信時間=LGT+LTTと、負荷指数とに基づいて、ログを送信する順番を決定する。ログ送信に使用可能なWAN帯域とログ送信に要する帯域から一度に1台のストレージ装置20のログしか送信可能でない場合には、各ストレージ装置20は、順番決定部35cにより決定された順番でログを送信する。なお、以下の説明では、一度に1台のストレージ装置20のログしか送信できないとする。
順番決定部35cは、基本的に、各ストレージ装置20の送信可能時刻範囲の終了時刻が早い順番にログ送信の順番を決定する。また、複数のストレージ装置20の送信可能時刻範囲の終了時刻が同じ場合には、全ストレージ装置20のLIAの合計が低くなる順番とする。
また、順番決定部35cは、前のストレージ装置20のログ送信終了後、次のストレージ装置20のログ送信までに時間の空がある場合には、ログ送信が可能で空き時間にログ送信を完了できる他のストレージ装置20の順番を先にする。空き時間にログ送信を完了できるか否かは送信可能時刻範囲とログ生成送信時間とによって判断される。
例えば、図11では、ストレージ装置Eの送信可能時刻範囲の終了時刻が11時で最も早い。したがって、順番決定部35cは、ストレージ装置Eの送信順番を1とする。次に終了時刻が早いのはストレージ装置C(11時20分)であるが、ストレージ装置Bは10時30分に送信可能であり、ログ生成送信時間は30分であるので、ストレージ装置Cがログ送信を開始できる11時にログ送信を完了できる。したがって、順番決定部35cは、ストレージ装置Bの送信順番を2とし、ストレージ装置Cの送信順番を3とする。
次に、ストレージ装置Aとストレージ装置Dの送信可能時刻範囲の終了時刻は14時で同じである。そこで、順番決定部35cは、ストレージ装置Aを先にする場合とストレージ装置Dを先にする場合で全ストレージ装置20のLIAの合計を計算する。ストレージ装置Aを先に送信する場合の合計LIAは以下のとおりである。
合計LIA=ストレージ装置EのLIA10:00+ストレージ装置BのLIA10:30+ストレージ装置CのLIA11:00+ストレージ装置AのLIA12:30+ストレージ装置DのLIA13:00=8+8+10+10+8=44
一方、ストレージ装置Dを先に送信する場合の合計LIAは以下のとおりである。
合計LIA=ストレージ装置EのLIA10:00+ストレージ装置BのLIA10:30+ストレージ装置CのLIA11:00+ストレージ装置DのLIA13:00+ストレージ装置AのLIA13:30=8+8+10+8+8=42
したがって、順番決定部35cは、合計LIAが42と小さい方、すなわち、ストレージ装置Dを先に送信する場合を選択し、ストレージ装置Dの送信順番を4とし、ストレージ装置Aの送信順番を5とする。
また、順番決定部35cは、緊急ログを保有するストレージ装置20がある場合には、緊急ログを保有するストレージ装置20と緊急ログを保有しないストレージ装置20に分け、それぞれの中で順番付けを行う。また、順番決定部35cは、緊急ログを保有するストレージ装置20の順番を緊急ログを保有しないストレージ装置20より先にする。
ログ解析部35は、送信可能時刻範囲内ではログを送信できないストレージ装置20がある場合には、LIAの最低値の近傍の範囲を増やす。例えば、LIAが最低値より+10以内を近傍としていた場合には、ログ解析部35は、LIAが最低値より+15以内を近傍とする。
例えば、図11において、ストレージ装置Aが緊急ログを保有する場合には、ストレージ装置Aが10時にログを生成して送信する。そして、ストレージ装置Eが10時30分にログを生成して送信する。そして、ストレージ装置Cが11時にログを生成して送信する。すると、ストレージ装置Cは11時15分にログ送信を完了するので、ストレージ装置Bは、11時15分にログの生成を開始する。しかしながら、ログ生成送信時間が30分であるため、ストレージ装置Bは、送信可能時刻範囲の終了時刻11時30分までにログ送信を完了することはできない。そこで、ログ解析部35は、LIAが最低値より+15以内を近傍とする。
図12は、近傍の範囲を増やした場合の各ストレージ装置20の送信可能時刻範囲を示す図である。図11と比較すると、図12では、ストレージ装置Aの送信可能時刻範囲として4時30分から5時までの範囲が増えている。この結果、ストレージ装置Aが4時にログを生成して送信する。そして、ストレージ装置Eが10時00分にログを生成して送信する。そして、ストレージ装置Bが10時30分にログを生成して送信する。そして、ストレージ装置Cが11時00分にログを生成して送信する。そして、ストレージ装置Dが13時にログを生成して送信する。したがって、全てのストレージ装置20が送信可能時刻範囲にログ送信を完了することができる。
時刻決定部35dは、送信可能時刻範囲と順番決定部35cにより決定された順番に基づいて各ストレージ装置20がログを生成して送信するログ送信時刻を決定する。
次に、ログ収集システム1による処理のシーケンスについて説明する。図13A〜図13Cは、ログ収集システム1による処理のシーケンスを示すシーケンス図である。図13Aに示すように、ストレージ装置20のログ制御部28は、ログ送信時刻記録部21にログ送信時刻を問い合わせ(ステップS1)、ログ送信時刻を取得する(ステップS2)。
そして、ログ制御部28は、ログ送信時刻であるか否かを判定し(ステップS3)、ログ送信時刻でない場合には、ステップS1に戻る。一方、ログ送信時刻である場合には、ログ制御部28は、ログ生成部23にログ生成を指示する(ステップS4)。
そして、ログ生成部23は、ログ生成を開始し(ステップS5)、ログ生成時間計測部24は、ログ生成時間の計測を開始する(ステップS6)。そして、ログ生成部23は、ログ生成を終了し(ステップS7)、ログ生成時間計測部24は、ログ生成時間の計測を終了する(ステップS8)。
そして、ログ制御部28は、ログ生成部23が生成したログを入手し(ステップS9)、ログ生成時間計測部24にログ生成時間を問い合わせる(ステップS10)。そして、ログ制御部28は、ログ生成時間計測部24からログ生成時間を入手し(ステップS11)、ログ生成時間をログへ付加する(ステップS12)。そして、ログ制御部28は、クラウド3と接続する(ステップS13)。そして、クラウド3のログ制御部37は、ログ制御部28と接続を確立する(ステップS14)。
そして、ログ制御部28は、ログ送信部25にログ送信を指示し(ステップS15)、ログ送信部25がログ送信を開始する(ステップS16)。そして、クラウド3のログ受信部33がログ受信を開始する(ステップS17)。そして、ログ制御部37がログの受信を検知し(ステップS18)、ログ送信時間計測部34にログ送信時間の計測開始を指示する(ステップS19)。そして、ログ送信時間計測部34がログ送信時間の計測を開始する(ステップS20)。
そして、図13Bに示すように、ログ送信部25がログ送信を完了し(ステップS21)、ログ受信部33がログ受信を完了する(ステップS22)。そして、ログ制御部37がログ受信部33からログを入手し(ステップS23)、ログ送信時間計測部34にログ送信時間の計測終了を指示する(ステップS24)。そして、ログ送信時間計測部34がログ送信時間の計測を終了する(ステップS25)。
そして、ログ制御部37がログ保存部31にログの保存を指示する(ステップS26)。そして、ログ保存部31がログ保存を開始し(ステップS27)、ログ保存を完了する(ステップS28)。そして、ログ制御部37は、ログ送信時間計測部34にログ送信時間を問い合わせ(ステップS29)、ログ送信時間計測部34からログ送信時間を入手する(ステップS30)。そして、ログ制御部37は、ログ保存部31にログ送信時間の保存を指示し、ログ保存部31がログ送信時間を保存する(ステップS31)。そして、ログ制御部37は、ログ解析部35にログ解析を指示する(ステップS32)。
そして、ログ解析部35は、ログ保存部31に過去1ヶ月のログを問い合わせ(ステップS33)、ログ保存部31から過去1ヶ月のログを取得する(ステップS34)。そして、ログ解析部35は、ログ生成時間の予測値を算出し(ステップS35)、ログ送信時間の予測値を算出する(ステップS36)。
そして、ログ解析部35は、d日前の負荷指数を算出する(ステップS37)。ここで、dは、初期値が0であり、例えば1ヶ月を30日とすると、29まで増加する変数である。そして、ログ解析部35は、過去1ヶ月分の負荷指数を全て算出したか否かを判定し(ステプS38)、過去1ヶ月分の負荷指数を算出していない場合には、dに1を加え(ステップS39)、ステップS37に戻る。
一方、過去1ヶ月分の負荷指数を全て算出した場合には、ログ解析部35は、負荷指数の過去1ヶ月の平均を算出し(ステップS40)、各ストレージ装置20のログ送信時刻を決定するログ送信時刻決定処理を行う(ステップS41)。
そして、ログ制御部37は、ログ送信時刻をストレージ装置20に送信して、ログ生成時刻の更新を指示する(ステップS42)。そして、ストレージ装置20のログ送信時刻記録部21が、ログ送信時刻を更新する(ステップS43)。そして、ストレージ装置20はステップS1に戻る。
このように、ログ解析部35が過去1ヶ月分のログを解析して負荷指数を算出し、負荷指数に基づいてログ送信時刻を決定するので、ストレージ装置20は業務への影響が少ない時刻にログを送信することができる。
また、図13Cに示すように、クラウド3のストレージ装置管理部36は、定期的にストレージ装置20に装置状態の更新を指示する(ステップS51)。そして、ストレージ装置20の緊急ログフラグ監視部26が装置状態記録部22に緊急ログフラグを問い合わせ(ステップS52)、緊急ログフラグを入手する(ステップS53)。
そして、帯域監視部27が、装置状態記録部22にWAN送信帯域を問い合わせ(ステップS54)、WAN送信帯域を入手する(ステップS55)。そして、帯域監視部27は、緊急ログフラグとWAN送信帯域を含む装置状態をクラウド3に通知する(ステップS56)。
そして、ストレージ装置管理部36は、装置状態を入手し(ステップS57)、装置状態の変更があったか否かを判定する(ステップS58)。そして、装置状態に変更がなかった場合には、ストレージ装置管理部36は、処理を終了する。
一方、装置状態に変更があった場合には、ストレージ装置管理部36は、ログ解析部35に解析処理の実施を指示する(ステップS59)。そして、ログ解析部35が、ログ送信時刻決定処理を行う(ステップS60)。そして、ログ制御部37は、ログ送信時刻をストレージ装置20に送信して、ログ生成時刻の更新を指示する(ステップS61)。そして、ストレージ装置20のログ送信時刻記録部21が、ログ送信時刻を更新する(ステップS62)。
このように、ストレージ装置管理部36がストレージ装置20から装置状態を入手し、装置状態に変更があるとログ解析部35に解析処理の実施を指示するので、ログ解析部35はストレージ装置20の変化に対応したログ送信時刻を決定することができる。
図14は、ログ送信時刻決定処理のフローを示すフローチャートである。図14に示すように、ログ解析部35は、負荷指数の最も低い値を抽出し(ステップS71)、負荷指数の最も低い値の近傍x%以内の時刻を候補として抽出する(ステップS72)。なお、近傍は所定の値y以内でもよい。
そして、ログ解析部35は、候補の値が連続する場合、1つの時刻範囲とする(ステップS73)。そして、ログ解析部35は、ユーザ環境内のストレージ装置20が1つのみであるか否かを判定し(ステップS74)、1つのみである場合には、最も低い負荷指数の時刻を次のログ送信時刻に決定し(ステップS75)、処理を終了する。
一方、ユーザ環境内のストレージ装置20が1つのみでない場合には、ログ解析部35は、緊急ログフラグがあるか否かを判定する(ステップS76)。そして、緊急ログフラグがある場合には、ログ解析部35は、緊急ログフラグ有のストレージ装置20と緊急ログフラグ無のストレージ装置20に分割する(ステップS77)。そして、ログ解析部35は、緊急ログフラグ有のストレージ装置20の中で、送信順番付けを行う順番付処理を行い(ステップS78)、緊急ログフラグ無のストレージ装置20の中で、順番付処理を行う(ステップS79)。一方、緊急ログフラグがない場合には、ログ解析部35は、全ストレージ装置20で、順番付処理を行う(ステップS80)。
そして、ログ解析部35は、全ストレージ装置20のログ送信時刻が送信可能時刻範囲であるか否かを判定し(ステップS81)、ログ送信時刻が送信可能時刻範囲でないストレージ装置20がある場合には、xに10を加算する(ステップS82)。そして、ログ解析部35は、ステップS72に戻る。
一方、全ストレージ装置20のログ送信時刻が送信可能時刻範囲である場合には、ログ解析部35は、送信順番により選ばれた時刻を各ストレージ装置20の次のログ送信時刻に決定する(ステップS83)。
このように、ログ解析部35は、負荷指数の最も低い値の近傍でログ送信時刻を決定するので、ストレージ装置20は業務への影響が少ない時刻にログを送信することができる。
図15は、順番付処理のフローを示すフローチャートである。図15に示すように、ログ解析部35は、順番が決まっていないストレージ装置20があるか否かを判定し(ステップS91)、順番が決まっていないストレージ装置20がない場合には、順番付処理を終了する。
一方、順番が決まっていないストレージ装置20がある場合には、ログ解析部35は、送信可能時刻範囲の終了時刻が最も早いストレージ装置20を次の順番の候補装置とする(ステップS92)。なお、送信可能時刻範囲の終了時刻が最も早いストレージ装置20が複数ある場合には、ログ解析部35は、全ストレージ装置20のLIAの合計が低くなる順番で、候補装置を選定する。そして、ログ解析部35は、装置候補以外に順番が決まっていないストレージ装置20があるか否かを判定し(ステップS93)、ない場合には、ステップS97へ進む。
一方、装置候補以外に順番が決まっていないストレージ装置20がある場合には、ログ解析部35は、装置候補以外に順番が決まっていない全ストレージ装置20について、以下のステップS94〜ステップS96の処理を行う。
すなわち、ログ解析部35は、1つ前の順番のストレージ装置20の送信終了時刻から候補装置の送信開始時刻の間に送信可能時刻範囲があるか否かを判定する(ステップS94)。そして、送信可能時刻範囲がない場合には、ログ解析部35は、次のストレージ装置20について処理を行う。一方、送信可能時刻範囲がある場合には、ログ解析部35は、1つ前の順番の装置の送信終了時刻から候補装置の送信開始時刻の間にある送信可能時刻範囲にログ生成送信時間が収まるか否かを判定する(ステップS95)。そして、送信可能時刻範囲にログ生成送信時間が収まらない場合には、ログ解析部35は、次のストレージ装置20について処理を行う。一方、送信可能時刻範囲にログ生成送信時間が収まる場合には、ログ解析部35は、処理中のストレージ装置20を候補装置とし(ステップS96)、次のストレージ装置20について処理を行う。
そして、装置候補以外に順番が決まっていない全ストレージ装置20についてステップS94〜ステップS96の処理が終了すると、ログ解析部35は、候補装置を次の順番として決定する(ステップS97)。
このように、ログ解析部35は、送信可能時刻範囲とログ生成送信時間と負荷指数に基づいてログを送信するストレージ装置20の順番を決定することで、ログ送信時刻を決定することができる。
上述してきたように、実施例では、ログ解析部35の算出部35aが、ログ生成時間とログ送信時間とログに基づいてストレージ装置20の負荷指数を算出する。そして、特定部35bが、負荷指数に基づいて送信可能時刻範囲を特定する。そして、順番決定部35cが、複数のストレージ装置20の送信可能時刻範囲とログ生成送信時間と負荷指数に基づいて、複数のストレージ装置がログを送信する順番を決定する。そして、時刻決定部35dが、各ストレージ装置20の送信可能時刻範囲と順番決定部35cにより決定された順番に基づいて各ストレージ装置のログ送信時刻を決定する。したがって、クラウド3は、ストレージ装置20のログ送信による業務の性能劣化を防ぐことができる。
また、実施例では、順番決定部35cは、送信可能時刻範囲の終了時刻に基づいて、複数のストレージ装置20がログを送信する順番を決定するので、送信可能時刻範囲にログを送信できないストレージ装置20の発生を抑えることができる。
また、実施例では、順番決定部35cは、送信可能時刻範囲の終了時刻が同じストレージ装置20が複数ある場合に、複数のストレージ装置20の順番を入れ替えた全ケースについて全ストレージ装置20の負荷指数の合計を算出する。そして、順番決定部35cは、算出した合計に基づいて複数のストレージ装置20の順番を決定する。したがって、順番決定部35cは、ストレージ装置20のログ送信による業務の性能劣化を少なくすることができる。
また、実施例では、順番決定部35cは、次の順番でログ送信を行うストレージ装置20を候補装置として選定する。そして、順番決定部35cは、1つ前の順番のストレージ装置の送信終了時刻から候補装置の送信開始時刻の間にログ送信を開始して完了できる他のストレージ装置20がある場合に、他のストレージ装置20を候補装置として選定する。そして、順番決定部35cは、1つ前の順番のストレージ装置の送信終了時刻から候補装置の送信開始時刻の間にログ送信を開始して完了できる他のストレージ装置20がなくなると候補装置を次の順番でログ送信を行うストレージ装置20として決定する。したがって、順番決定部35cは、送信可能時刻範囲にログを送信できないストレージ装置20の発生を抑えることができる。
また、実施例では、順番決定部35cは、緊急ログを保有するストレージ装置20がある場合には、緊急ログを保有するストレージ装置20と緊急ログを保有しないストレージ装置20に分け、緊急ログを保有するストレージ装置20の順番を先にする。したがって、クラウド3は、緊急ログを保有するストレージ装置20のログを優先して解析することができる。
また、実施例では、ログ解析部35は、送信可能時刻範囲内ではログを送信できないストレージ装置20がある場合には、LIAの最低値の近傍の範囲を増やすので、ログを送信できないストレージ装置20の発生を抑えることができる。
また、実施例では、ログ解析部35は、クラウド3上で動作するので、ユーザ環境2のログがない場合には、クラウド3にある他のストレージ装置のログを用いてログ送信時刻を決定することができる。
なお、実施例では、クラウド3について説明したが、クラウド3が有する構成をソフトウェアによって実現することで、同様の機能を有するログ管理プログラムを得ることができる。そこで、ログ管理プログラムを実行するコンピュータについて説明する。
図16は、実施例に係るログ管理プログラムを実行するコンピュータのハードウェア構成を示す図である。図16に示すように、コンピュータ50は、メインメモリ51と、プロセッサの一例であるCPU52と、LAN(Local Area Network)インタフェース53と、HDD54とを有する。また、コンピュータ50は、スーパーIO(Input Output)55と、DVI(Digital Visual Interface)56と、ODD(Optical Disk Drive)57とを有する。
メインメモリ51は、プログラムやプログラムの実行途中結果などを記憶するメモリである。CPU52は、メインメモリ51からプログラムを読み出して実行する中央処理装置である。CPU52は、メモリコントローラを有するチップセットを含む。
LANインタフェース53は、コンピュータ50をLAN経由で他のコンピュータに接続するためのインタフェースである。HDD54は、プログラムやデータを格納するディスク装置であり、スーパーIO55は、マウスやキーボードなどの入力装置を接続するためのインタフェースである。DVI56は、液晶表示装置を接続するインタフェースであり、ODD57は、DVD、CD−Rの読み書きを行う装置である。
LANインタフェース53は、PCIエクスプレス(PCIe)によりCPU52に接続され、HDD54及びODD57は、SATA(Serial Advanced Technology Attachment)によりCPU52に接続される。スーパーIO55は、LPC(Low Pin Count)によりCPU52に接続される。
そして、コンピュータ50において実行されるログ管理プログラムは、コンピュータ50により読み出し可能な記録媒体の一例であるCD−Rに記憶され、ODD57によってCD−Rから読み出されてコンピュータ50にインストールされる。あるいは、ログ管理プログラムは、LANインタフェース53を介して接続された他のコンピュータシステムのデータベースなどに記憶され、これらのデータベースから読み出されてコンピュータ50にインストールされる。そして、インストールされたログ管理プログラムは、HDD54に記憶され、メインメモリ51に読み出されてCPU52によって実行される。
また、実施例では、クラウド3がログ送信時刻を決定する場合について説明したが、ストレージ装置20のログを管理するログ管理装置がログ送信時刻を決定してもよい。
また、実施例では、クラウド3がストレージ装置20のログ送信時刻を決定する場合について説明したが、クラウド3は他のログ収集対象装置のログ送信時刻を決定してもよい。
また、実施例では、クラウド3がログの受信を開始してから完了するまでの時間をログ送信時間としたが、例えば、ストレージ装置20がログの送信を開始してからクラウド3がログの受信を完了するまでの時間等他の時間をログ送信時間としてもよい。
1 ログ収集システム
1a ネットワーク
1b 管理ネットワーク
2 ユーザ環境
2a 外部IF
3,93 クラウド
20,92 ストレージ装置
21 ログ送信時刻記録部
22 装置状態記録部
23 ログ生成部
24 ログ生成時間計測部
25 ログ送信部
26 緊急ログフラグ監視部
27 帯域監視部
28 ログ制御部
31 ログ保存部
32 緊急ログフラグ保存部
33 ログ受信部
34 ログ送信時間計測部
35 ログ解析部
35a 算出部
35b 特定部
35c 順番決定部
35d 時刻決定部
36 ストレージ装置管理部
37 ログ制御部
50 コンピュータ
51 メインメモリ
52 CPU
53 LANインタフェース
54 HDD
55 スーパーIO
56 DVI
57 ODD

Claims (9)

  1. ログ収集対象装置においてログ生成に要したログ生成時間及び該ログ収集対象装置からのログ送信に要したログ送信時間に基づいて該ログ収集対象装置の負荷指数を算出する算出部と、
    前記算出部により算出された負荷指数に基づいて、前記ログ収集対象装置がログの送信処理を実行する時刻を決定する時刻決定部と
    を有することを特徴とするログ管理装置。
  2. 複数のログ収集対象装置のログを管理し、
    前記算出部により算出された負荷指数に基づいて各ログ収集対象装置についてログ送信が可能な時刻範囲を特定する特定部と、
    前記特定部により特定された複数の時刻範囲に基づいて前記複数のログ収集対象装置がログを送信する順番を決定する順番決定部をさらに有し、
    前記時刻決定部は、各ログ収集対象装置の前記時刻範囲と前記順番に基づいて各ログ収集対象装置がログの送信処理を実行する時刻を決定する
    ことを特徴とする請求項1に記載のログ管理装置。
  3. 前記順番決定部は、各時刻範囲の終了時刻に基づいて前記順番を決定することを特徴とする請求項2に記載のログ管理装置。
  4. 前記順番決定部は、各時刻範囲の終了時刻に基づいて前記順番を決定すると同順位となるログ収集対象装置が複数ある場合に、複数のログ収集対象装置の順番を入れ替えた全ケースについて全ログ収集対象装置の負荷指数の合計を算出し、該算出した合計に基づいて全ログ収集対象装置の順番を決定することを特徴とする請求項3に記載のログ管理装置。
  5. 前記順番決定部は、次の順番でログ送信を行うログ収集対象装置を候補装置として選定した際に、1つ前の順番のログ収集対象装置の送信終了時刻から候補装置の送信開始時刻の間にログ送信を開始して完了できる他のログ収集対象装置がある場合に、該他のログ収集対象装置を候補装置としつつ、前記順番を決定することを特徴とする請求項3に記載のログ管理装置。
  6. 前記順番決定部は、前記複数のログ収集対象装置の中に緊急度の高いログを保有する緊急装置がある場合に、緊急装置の順番を先にして前記順番を決定することを特徴とする請求項2に記載のログ管理装置。
  7. 前記算出部、前記時刻決定部、前記特定部及び前記順番決定部を有し、前記時刻範囲にログを送信できないログ収集対象装置がある場合に、該時刻範囲を拡大するように制御するログ解析部を有することを特徴とする請求項2に記載のログ管理装置。
  8. コンピュータが、
    ログ収集対象装置においてログ生成に要したログ生成時間及び該ログ収集対象装置からのログ送信に要したログ送信時間に基づいて該ログ収集対象装置の負荷指数を算出し、
    算出した負荷指数に基づいて、前記ログ収集対象装置がログの送信処理を実行する時刻を決定する
    処理を実行することを特徴とするログ管理方法。
  9. コンピュータに、
    ログ収集対象装置においてログ生成に要したログ生成時間及び該ログ収集対象装置からのログ送信に要したログ送信時間に基づいて該ログ収集対象装置の負荷指数を算出し、
    算出した負荷指数に基づいて、前記ログ収集対象装置がログの送信処理を実行時刻を決定する
    処理を実行させることを特徴とするログ管理プログラム。
JP2017166232A 2017-08-30 2017-08-30 ログ管理装置、ログ管理方法及びログ管理プログラム Pending JP2019046000A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017166232A JP2019046000A (ja) 2017-08-30 2017-08-30 ログ管理装置、ログ管理方法及びログ管理プログラム
US16/114,847 US20190065337A1 (en) 2017-08-30 2018-08-28 Log management apparatus, and log management method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017166232A JP2019046000A (ja) 2017-08-30 2017-08-30 ログ管理装置、ログ管理方法及びログ管理プログラム

Publications (1)

Publication Number Publication Date
JP2019046000A true JP2019046000A (ja) 2019-03-22

Family

ID=65436125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017166232A Pending JP2019046000A (ja) 2017-08-30 2017-08-30 ログ管理装置、ログ管理方法及びログ管理プログラム

Country Status (2)

Country Link
US (1) US20190065337A1 (ja)
JP (1) JP2019046000A (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005033940A1 (ja) * 2003-09-30 2005-04-14 International Business Machines Corporation 情報処理装置における管理プログラムの実行管理
JP2016110280A (ja) * 2014-12-03 2016-06-20 株式会社リコー データ収集システム、データ収集方法

Also Published As

Publication number Publication date
US20190065337A1 (en) 2019-02-28

Similar Documents

Publication Publication Date Title
JP7214295B2 (ja) 分散型システムのデータ同期方法、装置、コンピュータプログラム、及び電子機器
Yadwadkar et al. Selecting the best vm across multiple public clouds: A data-driven performance modeling approach
US10331483B1 (en) Scheduling data access jobs based on job priority and predicted execution time using historical execution data
US10936465B2 (en) Method for optimized canary deployments for improved customer experience
CN107851106B (zh) 用于关系数据库即服务的自动需求驱动的资源缩放
US10078571B2 (en) Rule-based adaptive monitoring of application performance
US8555281B1 (en) Scheduling of tasks based upon historical execution times
US9942353B2 (en) Management of connections within a messaging environment based on the statistical analysis of server responsiveness
US9886195B2 (en) Performance-based migration among data storage devices
US9575800B2 (en) Using queues corresponding to attribute values and priorities associated with units of work and sub-units of the unit of work to select the units of work and their sub-units to process
EP3968159A1 (en) Performance monitoring in a distributed storage system
US20140372353A1 (en) Information processing system and data update control method
US11789782B2 (en) Techniques for modifying cluster computing environments
CN109154937A (zh) 查询响应的动态流式传输
US20150280981A1 (en) Apparatus and system for configuration management
US11797187B2 (en) Optimized I/O performance regulation for non-volatile storage
JPWO2017188419A1 (ja) 計算資源管理装置、計算資源管理方法、及びプログラム
US9542459B2 (en) Adaptive data collection
US10359936B2 (en) Selecting a primary storage device
US20080109390A1 (en) Method for dynamically managing a performance model for a data center
JP2019046000A (ja) ログ管理装置、ログ管理方法及びログ管理プログラム
US20170085460A1 (en) Benchmarking servers based on production data
Koch et al. SMiPE: estimating the progress of recurring iterative distributed dataflows
CN114637809A (zh) 同步延迟时间动态配置方法、装置、电子设备及介质
US11301442B2 (en) Method and system for using array level time buckets to efficiently calculate top contributors using relevant performance metric