JP2018113028A - Itインフラストラクチャにおいて実行されるアプリケーションのバッチ処理を監視するための方法およびシステム - Google Patents

Itインフラストラクチャにおいて実行されるアプリケーションのバッチ処理を監視するための方法およびシステム Download PDF

Info

Publication number
JP2018113028A
JP2018113028A JP2017245829A JP2017245829A JP2018113028A JP 2018113028 A JP2018113028 A JP 2018113028A JP 2017245829 A JP2017245829 A JP 2017245829A JP 2017245829 A JP2017245829 A JP 2017245829A JP 2018113028 A JP2018113028 A JP 2018113028A
Authority
JP
Japan
Prior art keywords
incident
batch
data representing
monitoring software
infrastructure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017245829A
Other languages
English (en)
Inventor
ホセ・イグナシオ・アルバレス・マルコス
Ignacio Alvarez Marcos Jose
ブリュノ・デメイリエ
Demeilliez Bruno
フロラン・ロシェット
Rochette Florent
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bull SA
Original Assignee
Bull SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bull SA filed Critical Bull SA
Publication of JP2018113028A publication Critical patent/JP2018113028A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3414Workload generation, e.g. scripts, playback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • G06F11/3062Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3428Benchmarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3433Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/83Indexing scheme relating to error detection, to error correction, and to monitoring the solution involving signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/835Timestamp
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/86Event-based monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/865Monitoring of software

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】ITインフラストラクチャにおいて実行されるアプリケーションのバッチ処理を監視する。【解決手段】バッチによる、リソースの通常の消費量を記録し50、バッチの実行を経時的に追跡調査し51、前記リソースの瞬間的消費量を測定し52、インシデントに近い期間中に実行されたバッチのそれぞれの、瞬間的消費量と通常の消費量とを比較53することにより、インフラストラクチャのコンピューティングリソースの少なくとも1つの輻輳インシデントを検出し60、前記インシデントの原因にある少なくとも1つのバッチを識別する70。【選択図】図1

Description

本発明は、ITインフラストラクチャを監視する分野に関し、より具体的には、これらのITインフラストラクチャ内で実行されるアプリケーションにおけるバッチ処理の分野に関する。これらのバッチ処理は、ほとんどのアプリケーションにあり、ユーザの介入なしのコンピュータ上のコマンド(プロセス)セットの自動連結である。1つが終了すると(結果に関係なく)、コンピュータは、次のバッチを処理する。スタックのすべてのバッチが実行されてしまうと、バッチ処理が終わる。
これらの処理をトリガすることが、例えばスケジューラによって、自動化され得る。競合するアクセス問題を回避するために、または適用負荷(applicative load)を軽減するために、バッチ処理がスケジュールされる必要がある。このように、スケジューラの目的は、概して、処理の優先順位を確保することにもある。実際には、いくつかの処理は、他の処理が仕上げられたときのみ行われる必要がある。バッチ処理は、とりわけ、自動化されたタスクに対して、例えば、公共団体または民間団体のコンピュータ機器にわたってアカウントを管理するために使用される。バッチにおいて立ち上げられる作業は、通常、インタラクティブなまたはトランザクショナルな作業に使用されない処理周期のみを使用する。これらの作業は、通常、アプリケーションの標準使用範囲外(夜間や週末)で実行されるが、それのみではない。
アプリケーションのバッチ処理の分野における課題は、生産中、すなわち、ユーザの彼らの作業時間中、アプリケーションの正しい動作を確実にするために必要である長い重要な処理がしばしばあることである。具体的には、バッチ処理の実行は、生産中のアプリケーションの動作を危うくする、ITインフラストラクチャリソースにおける輻輳を引き起こす場合がある。このような輻輳インシデントは、1つまたは複数のサーバ上の1つまたは複数のリソースの飽和、およびリソースの輻輳による1つまたは複数のリソースの持続時間の大幅な増加を特徴とすることが多い。実行時間の延長により、場合によっては、割り当てられた時間内にすべての処理が実行され得ないことが起こる。またある場合には、計画期間内に処理が完了されることができなかった場合、生産も打ち切られる必要がある。このように、生産中にインシデントが起こると、原因を決定するために分析が行われる必要がある。ある特有の課題は、使用可能な唯一の情報が、通常、スケジューリング機構に関連しているものであることから、特に、インシデントがバッチ処理に関連している場合、この分析が難しいという事実に関する。
この背景において、バッチ処理を監視し、生産中に起こる輻輳インシデントの原因にある可能性がある処理を識別する診断を可能にするためのツールを提案する解決策を提案することは興味深い。
本発明の目的は、ITインフラストラクチャにおける輻輳インシデントの診断のための方法を提案することによって、先行技術のいくつかの欠点を解消することにある。
この目的は、スケジューラによって決定された計画カレンダに従って、ITインフラストクチャにおいて実行されるアプリケーションのバッチ処理を監視するための方法によって達成され、方法は、前記インフラストラクチャのコンピューティングリソースの輻輳の、インシデントとして知られている少なくとも1つの事象の検出用に、および前記インシデントの原因に関与している可能性がある少なくとも1つのバッチの識別用に、構成された監視ソフトウェアによって、以下のステップ:
− 前記計画カレンダを表すデータからの、バッチによる前記インフラストラクチャのコンピューティングリソースの通常の消費量を表すデータの、監視ソフトウェアによってアクセス可能なメモリへの経時的な記録ステップと、
− 前記計画カレンダを表すデータによる、経時的なすべてのバッチの実行の追跡調査ステップと、
− 前記インフラストラクチャのコンピューティングリソースの瞬間的消費量の、監視ツールによる、経時的な測定ステップと、
− 前記識別を可能にするための、瞬間的消費量を表すデータと通常の消費量を表すテータとの間の、検出されたインシデントに近い期間中に実行されたバッチのそれぞれに対する、比較ステップと、
を実施することにより、実施されることを特徴とする。
別の特有の特徴によれば、前記インフラストラクチャのコンピューティングリソースの少なくとも1つのインシデントの検出ステップは、前記インシデントのタイムスタンプ処理をトリガする。
別の特有の特徴によれば、前記インシデントのタイムスタンプ処理ステップのつぎに、監視ソフトウェアによる、この事象に近い期間の決定が続き、この期間は、この事象に先行する、および/または後続する時間間隔まで拡張されることが可能である。
別の特有の特徴によれば、コンピューティングリソースの通常の消費量を表すデータの記録ステップは、バッチの実行の持続時間全体にわたるリソースの消費量プロファイルの、バッチのそれぞれに対する、記録ステップを含む。
別の特有の特徴によれば、監視ソフトウェアのユーザが、バッチの今後の実行の間の他のインシデントを回避するために取られるべき方策を決定し、任意選択で、結果としてカレンダを修正するための、分析および/または決定への補助を提供するための診断レポートの、監視ソフトウェアによる生成を、インシデントの分析中に得られた識別ステップがトリガする。
別の特有の特徴によれば、監視ソフトウェアによる少なくとも1つのインシデントの検出ステップは、特に瞬間的消費量の測定ステップ中に得られたデータによる、インシデントに近い前記期間中に実行されたバッチのそれぞれに関するフットプリントの、監視ソフトウェアによってアクセス可能なメモリへの記録をトリガする。
別の特有の特徴によれば、監視ソフトウェアによる少なくとも1つのインシデントの検出ステップは、特に瞬間的消費量の測定ステップ中に得られたデータによる、インシデント履歴の、監視ソフトウェアによってアクセス可能なメモリへの記録をトリガする。
別の特有の特徴によれば、監視ソフトウェアによる、瞬間的消費量を表すデータと通常の消費量を表すデータとの間の比較ステップは、前記インシデントの原因に関与している可能性がある少なくとも1つのバッチの前記識別を可能にする。
別の特有の特徴によれば、前記インシデントの原因に関与している可能性がある少なくとも1つのバッチの前記識別は、検出されたインシデントに関係する分析中のデータと、以前のインシデントに関係するデータとの間の少なくとも1つの相関づけに基づいている。
別の特有の特徴によれば、前記相関づけは、以下のステップ:
− バッチのフットプリントを表すデータとインシデント履歴を表すデータとの間の比較分析ステップと、
− バッチのフットプリントを表すデータと通常の消費量を表すデータとの比較分析ステップと、のうちの少なくとも1つを含む。
別の特有の特徴によれば、瞬間的消費量の測定ステップは、様々なパラメータを測定する複数のプローブの事前配備によって行われ、監視ツールが、このようにして測定された値を表すデータを監視ソフトウェアに伝送する。
別の特有の特徴によれば、瞬間的消費量の測定ステップ中に生成されたデータは、通常の消費量の記録ステップ中に格納されたデータを計算するために、監視ソフトウェアによって使用される。
別の特有の特徴によれば、前記計画カレンダを表すデータによる、バッチの実行の経時的な追跡調査ステップが、監視ソフトウェアのユーザによる前の計画ステップに続いて得られ、監視ソフトウェアがカレンダを表すデータを記録することを可能にする。
本発明の別の目的は、ITインフラストラクチャにおける輻輳インシデントの診断を可能にするシステムを提案することによって、先行技術のいくつかの欠点を解消することにある。
この目的は、スケジューラによって決定された計画カレンダに従って、ITインフラストラクチャにおいて実行されるアプリケーションのバッチ処理を監視するためのシステムによって達成され、システムは、本発明による方法を実施することによる、前記インフラストラクチャのコンピューティングリソースの輻輳の、インシデントとして知られている少なくとも1つの事象の検出用に、および前記インシデントの原因に関与している可能性がある少なくとも1つのバッチの識別用に、構成された監視ソフトウェアがその上で実行されるコンピュータ手段を備える、ことを特徴とする。
本発明の別の目的は、ITインフラストラクチャにおける輻輳インシデントの診断を可能にするプログラムを提案することによって、先行技術のいくつかの欠点を解消することにある。
この目的は、本発明による方法を実施するための、コンピュータ手段によって読み取り可能な媒体に格納され、これらのコンピュータ手段によって実行可能な命令を含む、コンピュータプログラム製品によって達成される。
本発明の他の特有の特徴および利点は、以下の添付図面に関連して示される、続く記述を読んだ時点で、よりはっきりと分かるようになるであろう。
本発明の実施形態による、方法のステップを示す図である。 本発明の実施形態による、システムを示す図である。
本発明は、ITインフラストラクチャにおいて実行されるアプリケーションのバッチ処理を監視するための方法およびシステム、ならびに方法を実施するためのコンピュータプログラム製品に関する。
「スケジューラ」、「計画カレンダ(CA)」という用語は、本記述では、当業者に対して、それぞれ、「スケジューリングプログラム」、「実行時間スケジューリング」、またはいずれかの同意義を表すこれらの用語の意味において使用され、これらの用語は、これらの用語が指す機能性を限定するとして解釈されてはならない。
概して、本出願は、機能特性に言及し、「a」または「an」という用語を使用するが、これは、実際には、ほぼ「少なくとも1つの」であり、本文に明確に述べられていない限り、個数を明示する必要がない、ということが当業者には明らかである。また、当業者であれば、本出願に提供されている機能の考察を読むことから、可能な変形形態を理解できることがはっきりしているので、本出願は、関わっている精緻な構造特性または端末タイプに関する詳細を提供することなく、コンピュータ手段およびITインフラストラクチャに言及する。このように、本出願が言及する本記述および図面は、限定的として解釈されてはならない。
本出願は、スケジューラによって決定された計画カレンダ(CA)に従って、ITインフラストラクチャ(FW)において実行されるアプリケーションのバッチ(BA)処理を監視するための方法にさらに関する。この方法は、一方において、前記インフラストラクチャ(FW)のコンピュータリソースの輻輳の、インシデント(EC)として知られている少なくとも1つの事象の検出(60)用に、他方において、前記インシデント(EC)の原因に関与している可能性がある少なくとも1つのバッチ(BA)の識別(70)用に、構成された監視ソフトウェア(LS)によって通常実施される。この検出(60)とこの識別(70)とは、以下のステップ:
− 前記計画カレンダ(CA)を表すデータからの、バッチ(BA)による前記インフラストラクチャ(FW)のコンピューティングリソースの通常の消費量(CM)を表すデータの、監視ソフトウェア(LS)によってアクセス可能なメモリへの経時的な記録ステップ(50)と、
− 前記計画カレンダ(CA)を表すデータによる、すべてのバッチ(BA)の実行の経時的な追跡調査ステップ(51)と、
− 前記インフラストラクチャ(FW)のコンピューティングリソースの瞬間的消費量(CI)の、監視ツール(SU)による、経時的な測定ステップ(52)と、
− 前記識別(70)を可能にするための、瞬間的消費量(CI)を表すデータと、通常の消費量(CM)を表すデータとの間の、検出されたインシデント(EC)に近い期間(PE)中に実行されたバッチ(BA)のそれぞれに対する、比較ステップ(53)と、
を実施することにより得られるのが好ましい。
いくつかの実施形態において、コンピューティングリソースの通常の消費量(CM)を表すデータの記録ステップ(50)は、バッチの実行の持続時間全体にわたるリソースの消費量プロファイル(PC)の、バッチ(BA)のそれぞれに対する記録ステップ(500)を含む。実際には、リソースの消費量が、実行期間にわたって一定ではないことから、バッチの実行持続時間全体にわたる、リソースの消費量を考量する必要がある。いくつかの実施形態において、通常の消費量(CM)を表すデータは、例えば、処理電力の消費量、使用されたメモリおよび/または空きメモリ、ネットワークの入力/出力および/または記憶メモリの数量、機械上で実行するプロセスなどの情報を表すデータを含む。
いくつかの実施形態において、前記インフラストラクチャ(FW)のコンピューティングリソースの少なくとも1つのインシデント(EC)の検出ステップ(60)は、前記インシデント(EC)のタイムスタンプ処理(61)をトリガする。いくつかの実施形態において、前記インシデント(EC)のこのタイムスタンプ処理(61)のつぎに、監視ソフトウェア(LS)による、この事象に近い期間(PE)の決定(610)が続き、この期間は、この事象に先行する、および/または後続する時間間隔まで拡張されることができる。
いくつかの実施形態において、監視ソフトウェア(LS)による少なくとも1つのインシデント(EC)の検出ステップ(60)は、特に瞬間的消費量(CI)の測定ステップ(52)中に得られたデータによる、インシデント(EC)に近い前記期間(PE)中に実行されたバッチ(BA)のそれぞれに関するフットプリント(EB)の、監視ソフトウェア(LS)によってアクセス可能なメモリへの記録(62)をトリガする。バッチ(BA)のフットプリント(EB)のこの記録(62)中、監視ソフトウェア(LS)が、監視ツール(SU)によって、瞬間的消費量(CI)を測定する(52)ことから来る情報を使用して、カレンダ(CA)に基づく、したがって、リソースの使用の正確さが劣る推定に基づくよりもむしろ、実際のフットプリントを生成することが好ましい。いくつかの実施形態において、このようなフットプリント(EB)を表すデータは、例えば、全リソース消費量、タイムスタンプ処理、入力/出力データだけではなく、場合によっては、例えば通常の消費量(CM)の記録ステップ(50)を介して得られる、リソース消費量プロファイル(PC)など、の情報を表すデータを含む。また、入力/出力データは、例えば、使用されたまたは生成されたファイル、データベース、ネットワーク(イントラネット、エクストラネット、インターネット・・・)から発生するデータなど、様々な形態を有することができる。
いくつかの実施形態において、監視ソフトウェア(LS)による少なくとも1つのインシデント(EC)の検出ステップ(60)は、特に瞬間的消費量(CI)の測定ステップ(52)中に得られたデータによる、インシデント履歴(HI)の、監視ソフトウェア(LS)によってアクセス可能なメモリへの、記録(63)をトリガする。いくつかの実施形態において、このインシデント履歴(HI)を表すデータは、例えば、タイムスタンプ処理、インシデントの期間にわたって実行するバッチのコンテキスト、全リソース消費量、場合によっては、以前のインシデントの分析中に得られた識別(70)から来る診断(RD)などの情報を表すデータを含む。
いくつかの実施形態において、監視ソフトウェア(LS)による、瞬間的消費量(CI)を表すデータと、通常の消費量(CM)を表すデータとの間の比較ステップ(53)は、前記インシデント(EC)の原因に関与している可能性がある少なくとも1つのバッチ(BA)の前記識別(70)を可能にする。この比較ステップ(53)は、例えば閾値または標準平均値に対する比較のための、各バッチによるリソースの使用レベルを識別する変数の少なくとも1つの計算に、特に対応することができる。前記インシデント(EC)の原因に関与している可能性がある少なくとも1つのバッチ(BA)の前記識別(70)が、検出されたインシデント(EC)に関係する分析中のデータと、以前のインシデントに関係するデータとの間の少なくとも1つの相関づけ(700)に基づいていることが好ましい。いくつかの実施形態において、前記相関づけ(700)は、以下のステップ:
− バッチのフットプリント(EB)を表すデータと、インシデント履歴(HI)を表すデータとの間の比較分析ステップ(701)と、
− バッチのフットプリント(EB)を表すデータと、通常の消費量(CM)を表すデータとの比較分析ステップ(702)と、
のうちの少なくとも1つを含む。
いくつかの実施形態において、監視ソフトウェア(LS)のユーザが、バッチ(BA)のその後の実行の間の他のインシデント(CE)を回避するために取られるべき方策を決定し、任意選択で、結果としてカレンダ(CA)を修正するための、分析および/または決定への補助を提供するための診断レポート(RD)の、監視ソフトウェア(LS)による生成(71)を、インシデント(EC)の分析中に得られた識別ステップ(70)がトリガする。実際には、診断レポートは、例えば通常の消費量に対する使用レベルを示す、リソース使用の、例えば合成表の形式であることができる。このタイプのレポートまたは表は、例えば検出されたインシデントの特性を列挙することによって、インシデントの特性であるインシデントのリソースを見せる可能性がある。このように、インシデントに関わっている可能性のある各バッチは、輻輳中に行方不明になったリソースに関係する情報にアクセスするユーザによって識別され得、これによりバッチの計画カレンダを修正するか、またはITインフラストラクチャの編成を見直すことすら行う。
いくつかの実施形態において、瞬間的消費量(CI)の測定ステップ(52)は、様々なパラメータを測定する複数のプローブの事前配備(520)によって行われ、監視ツール(SU)が、このようにして測定された値を表すデータを監視ソフトウェア(LS)に伝送する。ITインフラストラクチャ(FW)を監視するためには、例えば、処理電力消費量、使用されたメモリおよび/または空きメモリ、ネットワークの入力/出力の、および/または記憶メモリの数量、機械上で実行するプロセスなど、様々なタイプの(通常、物理的な)パラメータのうちの少なくとも1つのパラメータをそれぞれが監視する、いくつかの特殊なツールによって管理されることが多い、いくつかのプローブを配備することが通常好ましい。監視ソフトウェア(LS)は、この監視ツール(SU)と直接通信するか、またはこの監視ツール(SU)によって測定されたデータに後でアクセスするかのいずれかを行うように構成される可能性がある。
いつかの実施形態において、瞬間的消費量(CI)の測定ステップ(52)中に生成されたデータは、通常の消費量(CM)の記録ステップ(50)中に格納されたデータを計算するために、監視ソフトウェア(LS)によって使用される。
いくつかの実施形態において、前記計画カレンダ(CA)を表すデータによる、バッチ(BA)の実行の経時的な追跡調査ステップ(51)が、監視ソフトウェア(LS)のユーザによる前の計画ステップ(59)に続いて、得られ、監視ソフトウェアがカレンダ(CA)を表すデータを記録することを可能にする。
本出願は、したがって、バッチ処理を監視するためのシステムにも関する。このシステムは、本発明の様々な実施形態による、方法を実施するように構成された、監視ソフトウェア(LS)がその上で実行されるコンピュータ手段を備える。図2に示されているように、このようなコンピュータ手段は、これらのコンピュータ手段間の、特にITインフラストラクチャ(FW)内にある、監視ソフトウェアと監視ツール(SU)との間の通信によって監視されたITインフラストラクチャ(FW)にあるコンピュータ手段とは別個とすることができるが、もちろん、このITインフラストラクチャ(FW)内でこれらのコンピュータ手段を実行することが可能である。前記インフラストラクチャ(FW)のこれらのコンピュータ手段およびコンピューティングリソースは、例えば互いに通信するサーバにおいて実装された、少なくとも1つのプロセッサ、および少なくとも1つのメモリまたはデータベースを当然のことながら備える。その一方で、本出願は、本発明による、方法を実施するための、コンピュータ手段によって読み取り可能な媒体に格納され、これらのコンピュータ手段によって実行可能な命令を含む、コンピュータプログラム製品にも関する。このように、方法によって提案された機能性は、様々なITインフラストラクチャ(FW)を監視するための様々なコンピュータ手段上で配備され得る。
本出願は、図面および/または様々な実施形態に関連して、様々な技術特性および利点を説明している。当業者であれば、明示的に別段の定めがない限り、あるいはこれらの特徴が互換性のないものであること、または組み合わせが本出願において述べられている技術的課題のうちの少なくとも1つに対する解決策を提供しないことが明らかである限り、所与の実施形態の技術特性が、別の実施形態の特徴と実際に組み合わされ得る、ということを理解するだろう。また、所与の実施形態において説明された技術的特性は、明示的に別段の定めのない限り、このモードの他の特性から分離され得る。
本発明が、請求項に記載されたような本発明の適用分野から逸脱することなく、多くの他の特定の形態における実施形態を可能にすることが、当業者には分かるはずである。結果として、本実施形態は、例示として考えられなければならないが、添付の請求項の範囲によって定められた分野において変更され得、本発明は、本明細書の上に示された詳細に限定されてはならない。
CA 計画カレンダ
BA バッチ
FW インフラストラクチャ
LS 監視ソフトウェア
EC インシデント
CM 通常の消費量
SU 監視ツール
CI 瞬間的消費量
PE 期間
PC 消費量プロファイル
EB フットプリント
HI インシデント履歴
RD 診断、診断レポート
CE インシデント
ORD スケジューラ

Claims (15)

  1. スケジューラによって決定された計画カレンダ(CA)に従って、ITインフラストラクチャ(FW)において実行されるアプリケーションのバッチ(BA)処理を監視するための方法であって、
    前記インフラストラクチャ(FW)のコンピューティングリソースの輻輳の、インシデント(EC)として知られている少なくとも1つの事象の検出(60)用に、および前記インシデント(EC)の原因に関与している可能性がある少なくとも1つのバッチ(BA)の識別(70)用に、構成された監視ソフトウェア(LS)によって、
    前記計画カレンダ(CA)を表すデータからの、バッチ(BA)による前記インフラストラクチャ(FW)のコンピューティングリソースの通常の消費量(CM)を表すデータの、監視ソフトウェア(LS)によってアクセス可能なメモリへの経時的な記録ステップ(50)と、
    前記計画カレンダ(CA)を表すデータによる、すべてのバッチ(BA)の実行の経時的な追跡調査ステップ(51)と、
    前記インフラストラクチャ(FW)のコンピューティングリソースの瞬間的消費量(CI)の、監視ツール(SU)による、経時的な測定ステップ(52)と、
    前記識別(70)を可能にするための、瞬間的消費量(CI)を表すデータと通常の消費量(CM)を表すデータとの間の、検出されたインシデント(EC)に近い期間(PE)中に実行されたバッチ(BA)のそれぞれに対する、比較ステップ(53)と、
    を実施することにより、
    実施されることを特徴とする、方法。
  2. 前記インフラストラクチャ(FW)のコンピューティングリソースの少なくとも1つのインシデント(EC)の検出ステップ(60)が、前記インシデント(EC)のタイムスタンプ処理(61)をトリガする、ことを特徴とする、請求項1に記載の方法。
  3. 前記インシデント(EC)のタイムスタンプ処理ステップ(61)のつぎに、監視ソフトウェア(LS)による、この事象に近い期間(PE)の決定(610)が続き、この期間が、事象に先行する、および/または後続する時間間隔まで拡張されることができる、ことを特徴とする、請求項2に記載の方法。
  4. コンピューティングリソースの通常の消費量(CM)を表すデータの記録ステップ(50)が、バッチの実行の持続時間全体にわたるリソースの消費量プロファイル(PC)の、バッチ(BA)のそれぞれに対する、記録ステップ(500)を含む、ことを特徴とする、請求項1から3のいずれか一項に記載の方法。
  5. 監視ソフトウェア(LS)のユーザが、バッチ(BA)の今後の実行の間の他のインシデント(CE)を回避するために取られるべき方策を決定し、任意選択で、結果としてカレンダ(CA)を修正するための、分析および/または決定への補助を提供するための診断レポート(RD)の、監視ソフトウェア(LS)による生成(71)を、インシデント(EC)の分析中に得られた識別ステップ(70)がトリガする、ことを特徴とする、請求項1から4のいずれか一項に記載の方法。
  6. 監視ソフトウェア(LS)による少なくとも1つのインシデント(EC)の検出ステップ(60)が、特に瞬間的消費量(CI)の測定ステップ(52)中に得られたデータによる、インシデント(EC)に近い前記期間(PE)中に実行されたバッチ(BA)のそれぞれに関するフットプリント(EB)の、監視ソフトウェア(LS)によってアクセス可能なメモリへの記録(62)をトリガする、ことを特徴とする、請求項1から5のいずれか一項に記載の方法。
  7. 監視ソフトウェア(LS)による少なくとも1つのインシデント(EC)の検出ステップ(60)が、特に瞬間的消費量(CI)の測定ステップ(52)中に得られたデータによる、インシデント履歴(HI)の、監視ソフトウェア(LS)によってアクセス可能なメモリへの記録(63)をトリガする、ことを特徴とする、請求項1から6のいずれか一項に記載の方法。
  8. 監視ソフトウェア(LS)による、瞬間的消費量(CI)を表すデータと通常の消費量(CM)を表すデータとの間の比較ステップ(53)が、前記インシデント(EC)の原因に関与している可能性がある少なくとも1つのバッチ(BA)の前記識別(70)を可能にする、ことを特徴とする、請求項1から7のいずれか一項に記載の方法。
  9. 前記インシデント(EC)の原因に関与している可能性がある少なくとも1つのバッチ(BA)の前記識別(70)が、検出されたインシデント(EC)に関係する分析中のデータと、以前のインシデントに関係するデータとの間の少なくとも1つの相関づけ(700)に基づいている、ことを特徴とする、請求項6または7に記載の方法。
  10. 前記相関づけ(700)が、
    バッチのフットプリント(EB)を表すデータと、インシデント履歴(HI)を表すデータとの間の比較分析ステップ(701)と、
    バッチのフットプリント(EB)を表すデータと、通常の消費量(CM)を表すデータとの間の比較分析ステップ(702)と、
    のうちの少なくとも1つを含む、ことを特徴とする、請求項9に記載の方法。
  11. 瞬間的消費量(CI)の測定ステップ(52)が、様々なパラメータを測定する複数のプローブの事前配備(520)によって行われ、監視ツール(SU)が、このようにして測定された値を表すデータを監視ソフトウェア(LS)に伝送する、ことを特徴とする、請求項1から10のいずれか一項に記載の方法。
  12. 瞬間的消費量(CI)の測定ステップ(52)中に生成されたデータが、通常の消費量(CM)の記録ステップ(50)中に格納されたデータを計算するために、監視ソフトウェア(LS)によって使用される、ことを特徴とする、請求項1から11のいずれか一項に記載の方法。
  13. 前記計画カレンダ(CA)を表すデータによる、バッチ(BA)の実行の経時的な追跡調査ステップ(51)が、監視ソフトウェア(LS)のユーザによる、前の計画ステップ(59)に続いて得られ、監視ソフトウェア(LS)が、カレンダ(CA)を表すデータを記録することを可能にする、ことを特徴とする、請求項1から12のいずれか一項に記載の方法。
  14. スケジューラ(ORD)によって決定された計画カレンダ(CA)に従って、ITインフラストラクチャ(FW)において実行されるアプリケーションのバッチ(BA)処理を監視するためのシステムであって、請求項1から13のいずれか一項に記載の方法を実施することによる、前記インフラストラクチャ(FW)のコンピューティングリソースの輻輳の、インシデント(EC)として知られている少なくとも1つの事象の検出(60)用に、および前記インシデント(EC)の原因に関与している可能性がある少なくとも1つのバッチ(BA)の識別(70)用に、構成された監視ソフトウェア(LS)がその上で実行されるコンピュータ手段を備える、ことを特徴とする、システム。
  15. コンピュータ手段によって読み取り可能な媒体に格納されたコンピュータプログラム製品であって、請求項1から13のいずれか一項に記載の方法を実施するための、これらのコンピュータ手段によって実行可能な命令を含む、コンピュータプログラム製品。
JP2017245829A 2016-12-29 2017-12-22 Itインフラストラクチャにおいて実行されるアプリケーションのバッチ処理を監視するための方法およびシステム Pending JP2018113028A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1663518A FR3061571B1 (fr) 2016-12-29 2016-12-29 Procede et systeme de surveillance de traitements par lots d'applications executees dans une infrastructure informatique
FR1663518 2016-12-29

Publications (1)

Publication Number Publication Date
JP2018113028A true JP2018113028A (ja) 2018-07-19

Family

ID=58992945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017245829A Pending JP2018113028A (ja) 2016-12-29 2017-12-22 Itインフラストラクチャにおいて実行されるアプリケーションのバッチ処理を監視するための方法およびシステム

Country Status (6)

Country Link
US (1) US10635568B2 (ja)
EP (1) EP3343375B1 (ja)
JP (1) JP2018113028A (ja)
CN (1) CN108255669A (ja)
BR (1) BR102017028326A2 (ja)
FR (1) FR3061571B1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10931513B2 (en) * 2019-01-31 2021-02-23 Cisco Technology, Inc. Event-triggered distributed data collection in a distributed transaction monitoring system

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4528116B2 (ja) * 2002-06-25 2010-08-18 インターナショナル・ビジネス・マシーンズ・コーポレーション 分散環境中でアプリケーションの性能を監視するための方法およびシステム
US7721288B2 (en) * 2004-08-31 2010-05-18 Sap Ag Organizing transmission of repository data
US9135048B2 (en) * 2012-09-20 2015-09-15 Amazon Technologies, Inc. Automated profiling of resource usage
US9400728B2 (en) * 2013-01-14 2016-07-26 Wal-Mart Stores, Inc. Cross platform workflow management
US9451017B2 (en) * 2013-07-24 2016-09-20 Dynatrace Llc Method and system for combining trace data describing multiple individual transaction executions with transaction processing infrastructure monitoring data
JP6260130B2 (ja) * 2013-07-25 2018-01-17 富士通株式会社 ジョブ遅延検知方法、情報処理装置、およびプログラム
US9800651B2 (en) * 2014-04-04 2017-10-24 Ca, Inc. Application-specific assessment of cloud hosting suitability

Also Published As

Publication number Publication date
FR3061571B1 (fr) 2019-04-19
US10635568B2 (en) 2020-04-28
FR3061571A1 (fr) 2018-07-06
CN108255669A (zh) 2018-07-06
EP3343375B1 (fr) 2019-08-07
EP3343375A1 (fr) 2018-07-04
US20180246798A1 (en) 2018-08-30
BR102017028326A2 (pt) 2019-01-02

Similar Documents

Publication Publication Date Title
US8667334B2 (en) Problem isolation in a virtual environment
CN110245034A (zh) 根据使用数据的结构化日志模式的服务度量分析
US11165799B2 (en) Anomaly detection and processing for seasonal data
TW201734841A (zh) 分布式環境下監督學習算法的基準測試方法和裝置
US10430268B2 (en) Operations management system, operations management method and program thereof
CN110633194B (zh) 一种硬件资源在特定环境下的性能评估方法
US9621679B2 (en) Operation task managing apparatus and method
JP4910804B2 (ja) 業務プロセス推定プログラム、業務プロセス推定方法および業務プロセス推定装置
CN113204692A (zh) 数据处理任务执行进度的监测方法及装置
Khan et al. Modeling the autoscaling operations in cloud with time series data
KR101700832B1 (ko) 컴퓨팅 시뮬레이션 작업 필요자원 예측 장치 및 방법
Erdoğan et al. More effective sprint retrospective with statistical analysis
JP2018113028A (ja) Itインフラストラクチャにおいて実行されるアプリケーションのバッチ処理を監視するための方法およびシステム
CN116842298A (zh) 数据读写管理方法、装置、存储介质以及电子设备
US8566074B2 (en) Mapping between stress-test systems and real world systems
CN115858378A (zh) 一种测试系统及方法
US10255128B2 (en) Root cause candidate determination in multiple process systems
CN104239199A (zh) 虚拟机器人的生成方法、自动化测试方法及相关装置
Ibrahim et al. Presence: Performance metrics models for cloud saas web services
Hauck et al. Automatic derivation of performance prediction models for load-balancing properties based on goal-oriented measurements
CN108073502B (zh) 一种测试方法及其系统
CN114326670B (zh) 控制器执行任务的检测方法、装置、存储介质及电子装置
Dumas Business Process Analytics: From Insights to Predictions
KR101845208B1 (ko) 데이터베이스와 애플리케이션을 위한 웹기반 성능개선 방법
CN109324976B (zh) 管理测试进度的方法、装置、计算机设备以及存储介质