JP2017037645A - スマートアラートのためのシステム及び方法 - Google Patents

スマートアラートのためのシステム及び方法 Download PDF

Info

Publication number
JP2017037645A
JP2017037645A JP2016155482A JP2016155482A JP2017037645A JP 2017037645 A JP2017037645 A JP 2017037645A JP 2016155482 A JP2016155482 A JP 2016155482A JP 2016155482 A JP2016155482 A JP 2016155482A JP 2017037645 A JP2017037645 A JP 2017037645A
Authority
JP
Japan
Prior art keywords
alerts
alert
batch
median
job
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016155482A
Other languages
English (en)
Other versions
JP6531079B2 (ja
Inventor
マイトレヤ、ナツ
Natu Maitreya
プラヴィーン、ヴェンカテスワラン
Venkateswaran Praveen
ヴァイシャリ、パイサンカー
Paithankar Sadaphal Vaishali
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tata Consultancy Services Ltd
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of JP2017037645A publication Critical patent/JP2017037645A/ja
Application granted granted Critical
Publication of JP6531079B2 publication Critical patent/JP6531079B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting
    • G06Q10/1093Calendar-based scheduling for persons or groups
    • G06Q10/1097Task assignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0715Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06316Sequencing of tasks or work
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis

Abstract

【課題】IT企業向けバッチシステムにおけるスマートアラートのための方法及びシステムを提供する。
【解決手段】IT企業向けバッチシステムにおけるスマートアラート用のシステムにおいて、バッチジョブの最新定常状態を識別304し、その定常状態に対するスケジュールを導出306した後に、正常挙動がスケジュール内で算出308される。更に、1つ以上のジョブ及びアラートを刈り込み314、2つ以上のアラートの間で相関を検出316し、かつ群分けされたアラートの因果関係を導出318することにより、アラートの相関群を識別する。1つ以上のアラートを集約312する事により、最終的にバッチジョブの将来アラートを予測320する。
【選択図】図3

Description

関連出願と優先権の相互参照
本特許出願は、2015年8月7日付で提出したインド出願第2986/MUM/2015号の優先権を主張する。このインド出願の全内容は、参照により本明細書中に組み込まれる。
本発明主題は一般に、スマートアラートに関し、特に、IT企業向けバッチシステムにおけるスマートアラートのための方法及びシステムに関する。
今日の業務の増大しつつあるITへの依存により、企業のITシステムは、高水準の利用可能性及び性能の維持を必要としている。これを達成するために、ITシステムの健全性が絶えずモニタされることになる。構成要素の異常挙動、例えば、故障、変則性、SLA違反、及び機能停止等、が検出されてアラートが生成される。これらのアラートはその後、サービスデスク要員チームまたはリゾルバにより分析され、問題を解決するために適当な処置が取られる。
インド出願第2986/MUM/2015号
アラートを生成及び分析する現行の手法は、人手を多大に要する、その場しのぎの、直感式の駆動である。更に、アラートは反応式である。アラートは、単一の構成要素を隔離的に観察することにより設定され、体系全体の視点を欠いている。これらのアラートは、しばしば正確さを欠き、多数の偽アラートを生じるか、または多数の適法性の問題の見逃しにも繋がりかねない。更に、企業のITシステムは、業務及び基盤施設の変化により進化を続けている。手動によるアラートの構成設定ではこれらの変化に適合し得ないため、陳腐で時には時代遅れの構成設定となる。
一方、バッチシステムの管理は、固有の規模及び複雑さのために容易ではない。典型的なバッチシステムは、複雑な相互従属性を通じて接続された、いくつかの業務処理、即ち、バッチジョブ、で構成される。更に、バッチジョブでの機能停止及び遅延は、大きな財政上の損失に繋がりかねない。したがって、バッチシステムを正確にモニタして、全ての潜在的変則が適時に捕獲及び通知されるのを確実にすることが不可欠である。本明細書では、バッチジョブ及びジョブは、その説明全体を通して互換的に使用されるものとする。例示的シナリオでは、バッチシステムは、種々のアラートを生成するように構成される。最も一般的なアラートの一部として、異常に長いジョブ実行時間(MAXRUNALARM)、異常に短いジョブ実行時間(MINRUNALARM)、ジョブの遅延開始、ジョブの遅延終了、ジョブ不履行等がある。大規模で複雑なバッチシステムは、ノイズ及び冗長アラートの増大を招く。このことが、適切な時に適切なアラートを生成する問題を、現在のバッチシステム中で大きく関与させることになる。
実施形態の基本的理解を提供するために、本開示のいくつかの実施形態の簡単な概要を以下に提示する。本概要は、実施形態について広範に概説するものではない。本概要は、実施形態の主要/重要な要素を識別することも、または実施形態の適用範囲を画定することも意図していない。唯一の目的は、いくつかの実施形態を、以下に提示するより詳細な説明の導入部として簡単な形態で提示することにある。
上記に鑑みて、本明細書中の種々の実施形態は、バッチシステムにおけるスマートアラートのための方法及びシステムを提供する。ある態様では、1つ以上のアラートに関する設定を行うためのコンピュータ実装方法は、バッチジョブの最新定常状態を識別すること、バッチジョブの最新定常状態内で少なくとも1つのスケジュールを導出すること、及び少なくとも1つのスケジュール内で正常挙動を算出すること、により構成される。方法は、アラートの相関群を識別することにより、アラートを集約することを更に含む。アラートの相関群は、1つ以上のジョブ及びアラートを刈り込むこと、アラートの群分け用の1つ以上の相関ルールを用いることにより検出すること、及び潜在的原因及び結果を識別するための1つ以上の因果関係ルールを用いて群分けされたアラートの因果関係を導出することを含む。最後に、バッチジョブの将来アラートを予測する方法は、単変量計量予測法、多変量計量予測法、及びシステム挙動のうちの少なくとも1つ以上に基づく。
別の態様では、スマートアラート用のコンピュータ実装システムが提供される。システムは、メモリ及びプロセッサを含む。メモリは、バッチジョブの最新定常状態を識別すること、バッチジョブの最新定常状態内で少なくとも1つのスケジュールを導出すること、及び少なくとも1つのスケジュール内で正常挙動を算出することにより、1つ以上のアラートを設定するためにメモリ中に記憶された命令によりプロセッサが設定されるように、プロセッサに結合される。更に、システムは、アラートの相関群を識別することにより、アラートを集約するのを可能にするようにされる。アラートの相関群は、1つ以上のジョブ及びアラートを刈り込むこと、アラートの群分け用の1つ以上の相関ルールを用いて検出すること、及び潜在的原因及び結果を識別するための1つ以上の因果関係ルールを用いて群分けされたアラートの因果関係を導出することを含む。最後に、システムは、単変量計量予測法、多変量計量予測法、及びシステム挙動のうちの少なくとも1つ以上に基づいて、バッチジョブの将来アラートを予測するための方法を有効化するようにされる。
本明細書中の実施形態は、図面を参照して以下の詳細な説明からよりよく理解されることになるが、その図面中:
ある例示的実施形態に従って、スマートアラートのためのネットワーク実装を示す。 ある実施形態に従って、スマートアラートのためのブロック図を示す。 ある実施形態に従って、スマートアラートのための方法の処理フローを示す。
以下の検討から明らかなように特に別段の言及がない限り、本開示の全体を通して、「判別する(determining)」、「生成する(generating)」または「比較する(comparing)」等の用語を利用した検討内容は、コンピュータシステムのレジスタ及びメモリ内の物理(電子)量として表されるデータを、コンピュータシステムメモリ、レジスタ、もしくは他のそのような情報記憶、伝送または表示デバイス内で物理量として同様に表される他のデータに操作及び変形する、コンピュータシステム、または同様な電子活動検出デバイスの作用及び処理を指すことが理解される。
本明細書中の実施形態ならびにそれらの種々の特徴及び利点の詳細を、添付の図面に示しかつ以下の説明で詳述する非限定的実施形態を参照しながらより十分に説明する。本明細書中に使用する実施例は、本明細書中の実施形態を実施し得る方法の理解を容易にし、かつ当業者が本明細書中の実施形態を実施するのを更に容易にするようにのみ意図されている。したがって、実施例は、本明細書中の実施形態の適用範囲を限定するように解されるべきではない。
方法及びシステムは、本明細書中に説明される特定の実施形態に限定されない。加えて、方法及びシステムは、本明細書中に説明される他のモジュール及び方法とは独立かつ別個に実施され得る。各デバイス素子/モジュール及び方法は、他の素子/モジュール及び他の方法と組合せて使用され得る。
完結明細書の本文及び特許請求の範囲の全体を通して、単語「備える(comprise)」及び単語の変形、例えば、「備えている(comprising)」及び「備える(comprises)」等、は「含むが限定はされない(including but not limited to)」ことを意味し、例えば、他の付加物、構成要素、整数またはステップ等を除外するようには意図されていない。「例示的な(exemplary)」は、「の例である(an example of)」ことを意味し、好ましいまたは理想的な実施形態の望ましさを伝えるようには意図されてない。「等(such as)」は限定的な意味で使用されてはなく、説明目的に用いられる。
ファームウェア及び/またはソフトウェアの実装例に関して、方法は、本明細書中に説明する機能を遂行するモジュール(例えば、手順、機能等)を用いて実装され得る。命令を具体的に収録した任意の機械可読媒体は、本明細書中に説明する方法の実装に使用され得る。例えば、ソフトウェアの符号及びプログラムは、メモリに記憶されて処理装置により実行され得る。
別のファームウェア及び/またはソフトウェアの実装例では、1つ以上の命令または符号として非一時的コンピュータ可読媒体に機能が記憶され得る。実施例には、データ構造を符号化して有するコンピュータ可読媒体、及びコンピュータプログラムを符号化して有するコンピュータ可読媒体が含まれる。コンピュータ可読媒体は、製品の形態を取り得る。コンピュータ可読媒体には、物理的コンピュータ記憶媒体が含まれる。記憶媒体は、コンピュータによりアクセスされ得る任意の利用可能媒体であり得る。例えば、限定はされないが、そのようなコンピュータ可読媒体には、RAM、ROM、EEPROM、CD−ROMまたは他の光ディスク記憶、磁気ディスク記憶または他の磁気記憶デバイス、もしくは命令またはデータ構造の形態で所望のプログラム符号を記憶するために使用され得、かつコンピュータによりアクセスされ得る任意の他の媒体が含まれ得る。本明細書中に使用される、磁気式ディスク及び光学式ディスクには、コンパクトディスク(CD)、レーザーディスク(登録商標)、光ディスク、デジタル多用途ディスク(DVD)、フロッピー(登録商標)ディスク、及びブルーレイディスクが含まれるが、この場合、磁気式ディスクはデータを通常磁気的に再生し、光学式ディスクはデータをレーザにより光学的に再生する。上記のものの組合せも、コンピュータ可読媒体の範囲内に含めるべきである。
本明細書が、本発明主題の原理を単に示すにすぎないことを留意すべきである。当業者であれば、本明細書中に明示的には説明されていなくとも、本発明主題の原理を包含しその趣旨及び適用範囲内に含まれる、種々の配置を考案し得ることがしたがって理解される。更に、本明細書中に記載される全ての実施例は、基本的には、本発明の原理及び発明者(複数可)による当該技術の促進に貢献される概念の理解の援助となる教示的目的のためのみに特別に意図されているものであって、そのように具体的に記載した実施例及び条件には限定されずに解釈されるべきである。更に、本発明の原理、態様、及び実施形態をその特定の実施例と共に本明細書中に説明する全ての記載事項は、その均等物を含むように意図されている。
本明細書中の実施形態は、スマートアラート用のシステム及び方法を提供する。スマートアラートの分析用の開示のシステム及び方法は、より良好なアラート設定の閾値を推奨すること、及びバッチシステムに関する予測アラートを設定することを含む。開示の方法及びシステムは、例示のシナリオに限定されず、実施形態の適用範囲から逸脱することなく種々の適用及びシナリオ中に含まれ得る。ここで、その全体を通じて類似の参照符号が一貫して対応する特徴を示す、図面、特に、図1、図2、及び図3を参照すると、好ましい実施形態が図示されている。これらの実施形態を、以下の例示的システム及び/または方法に関して説明することとする。
本明細書では、スマートアラート管理システム、特にバッチシステム用の管理システム、に対する解決手段が提供される。バッチシステムは1組のジョブで構成され、ジョブは特定の業務機能を遂行するバッチアプリケーションを表す。ジョブは、ジョブ呼出の順番を決定する先行関係を有する。例えば、先行関係は、ジョブが1つより多い先行処理を有する場合、その全ての先行処理ジョブが完了した後にのみ当該ジョブが開始され得ることを示す。バッチシステムは、制約条件の組を:(1)バッチが開始し得る最早の時間、及び(2)バッチ内の全ての重要な業務ジョブが完了しなければならない最後の時間、について含み得る。本明細書中に開示する種々の実施形態は、スマートアラート用のシステム及び方法を提供する。スマートアラートのためのネットワーク実装を、図1を参照して更に説明する。
図1は、本発明主題のある実施形態に従って、スマートアラートのためのネットワーク実装100を示す。ネットワーク実装100は、1つ以上のコンピューティングデバイス、例えば、デバイス104−1、104−2...104−N、中に実装され得るシステム102、及びシステム102とデバイス104−1、104−2...104−Nとの間で通信を容易にするための通信ネットワーク106を含んで示されている。ある実施形態では、デバイス104−1、104−2...104−Nは、データソースを含み得る。例えば、データソースには、関係データベース、オブジェクトマッピングデータベース、xmlデータ、ドキュメントデータベース、NoSQLデータベース、HBase等のビッグデータサポート列指向データベース、またはビッグデータをサポートする任意のデータ構造が含まれるが、これらに限定されない。データソースは、記録形態である、アラートの履歴に関する情報を含む。バッチジョブは、システム中に異常挙動を検出したとき、アラートを生成する。バッチジョブにより生成されたアラートは、設定及び集約されて、将来アラートがシステムにより予測される。本明細書では、システム102が種々のコンピューティングシステム、例えば、ラップトップ型コンピュータ、デスクトップ型コンピュータ、ノート型、ワークステーション、メインフレームコンピュータ、サーバ、ネットワークサーバ等、として実装され得ることが理解されるであろう。一実装例では、システム102は、クラウド系の環境中に実装され得る。システム102の実施例には、可搬型コンピュータ、携帯情報端末、手持ち型デバイス、ワークステーションモバイルヘッドセット等、が含まれるが、これらに限定されない。
一実装例では、通信ネットワーク106は、無線ネットワーク、有線ネットワークまたはそれらの組合せであり得る。通信ネットワーク106は、異なる種類のネットワーク、例えば、イントラネット、構内ネットワーク(LAN)、広域ネットワーク(WAN)、インターネット等、のうちの1つとして実装され得る。通信ネットワーク106は、専用ネットワークまたは共有ネットワークのいずれであってもよい。共有ネットワークは、相互に通信を行うために、種々のプロトコル、例えば、ハイパーテキスト転送プロトコル(HTTP)、伝送制御プロトコル/インターネットプロトコル(TCP/IP)、無線アプリケーションプロトコル(WAP)等、を用いた異なる種類のネットワークの連携を表す。更に、ネットワーク106は、ルータ、ブリッジ、サーバ、コンピューティングデバイス、記憶デバイス等を含めて、種々のネットワークデバイスを含み得る。
開示のシステム102は、予測及び予防アラートを生成するためにスマートアラートを提供する。バッチジョブでは、バッチジョブの正常挙動中に変則が存在するとき、アラートが生成される。正常挙動(または異常挙動)中の変則は、以下の理由、即ち、部品不良、SLA違反、機能不全等、により引き起こされ得るが、これらに限定されない。システム102は、1つ以上のアラートのアラート構成を提供し、アラートを集約して将来アラートを予測する。システム102の例示的実装例を、図2を参照して更に詳細に説明する。
図2はある実施形態に従って、スマートアラート用のブロック図を示す。実施形態中、システム200は、コンピューティングデバイス、例えば、コンピューティングデバイス/システム102(図1)、中で実施または実行され得る。システム200は、少なくとも1つのプロセッサ、例えば、プロセッサ202等、少なくとも1つのメモリ、例えば、メモリ204等、通信インターフェース206、及びユーザインターフェース240を含むか、さもなければ、これらと通信する。プロセッサ202、メモリ204、通信インターフェース206、及びユーザインターフェース240は、システムバス、例えば、システムバス280、または同様の手段により結合され得る。システム200の種々の構成要素を、その機能性と共に、以下に説明する。
ある実施形態では、プロセッサ202は、通信と関連付けられた、とりわけ、音声及び論理機能を実装する回路部を含み得る。例えば、プロセッサ202は、1つ以上のデジタル信号プロセッサ(DSP)、1つ以上のマイクロプロセッサ、1つ以上の特殊目的のコンピュータチップ、1つ以上のフィールドプログラマブルゲートアレイ(FPGA)、1つ以上の特定用途向け集積回路(ASIC)、1つ以上のコンピュータ(複数可)、種々のアナログ・デジタル変換器、デジタル・アナログ変換器、及び/または他の支援回路を含み得るが、これらに限定されない。プロセッサ202は中でも、プロセッサ202の動作を支援するように構成されたクロック、算術論理演算装置(ALU)及び論理ゲートを含み得る。更に、プロセッサ202は、1つ以上のソフトウェアプログラムを実行する機能性を含み得るが、これらのソフトウェアプログラムはメモリ204中に記憶されるか、またはさもなければプロセッサ202にアクセス可能であり得る。
少なくとも1つのメモリ、例えば、メモリ204等、はシステム200の機能を実装するために、システム200により使用される任意の数の情報及びデータを記憶し得る。メモリ204は例えば、揮発性メモリ及び/または不揮発性メモリを含み得る。揮発性メモリの例には、揮発性ランダムアクセスメモリ(RAM)を含み得るが、これに限定されない。不揮発性メモリは追加的にまたは代替的に、電気的に消去可能なプログラム可能なリードオンリメモリ(EEPROM)、フラッシュメモリ、ハードドライブ等を備え得る。揮発性メモリの一部の例には、ランダムアクセスメモリ、ダイナミックランダムアクセスメモリ、スタティックランダムアクセスメモリ等を含むが、これらに限定されない。不揮発性メモリの一部の例には、ハードディスク、磁気テープ、光ディスク、プログラム可能なリードオンリメモリ、消去可能プログラム可能なリードオンリメモリ、電気的に消去可能なプログラム可能リードオンリメモリ、フラッシュメモリ等を含むが、これらに限定されない。メモリ204は、プロセッサ202が種々の例示的実施形態に従って種々の機能を実行するのを可能にするための、情報、データ、アプリケーション、命令等を記憶するように設定され得る。メモリ204は、プロセッサ202により実行されたとき、種々の実施形態中に説明されるようにシステム200を機能させる命令を記憶するように構成され得る。
メモリ204はまた、モジュール(複数可)210及びデータリポジトリ230を含む。モジュール(複数可)210は、例えば、設定モジュール212、集約モジュール214、予測モジュール216及び他のモジュール(複数可)220を含む。他のモジュール220は、スマートアラートシステム200により遂行されるアプリケーションまたは機能を補うプログラムまたは符号化命令を含み得る。データリポジトリ230は、バッチジョブにより生成されたアラートに関する履歴データ及び/または実時間データを含み得る。更に、他のデータ236は中でも、モジュール(複数可)210中の1つ以上のモジュールの実行の結果として処理、受信、または生成されたデータの記憶用のリポジトリとして機能し得る。
データリポジトリ230はスマートアラートシステム200の内部に示されているが、代替的実施形態では、データリポジトリ230はメモリ204の外にも実装され得、その場合データリポジトリ230はシステム200に通信可能に結合されたデータベース内に格納され得る。そのような外部データベース内に含まれるデータは、定期的に更新され得る。例えば、新規のデータがデータベース中に追加され得、及び/または現存のデータが修正され得、及び/または非有用データがデータベースから削除され得る。一実施例では、アラートに関して履歴データが記憶される。別の実施形態では、データリポジトリ230中に記憶されたデータは、バッチジョブにより生成されたアラートに関して実時間データであり得る。
通信インターフェース206は、ネットワーク106とシステム200との間で通信を容易にするように構成される。通信インターフェース206は、無線接続または有線接続の形態であり得る。無線通信インターフェース206の例には、IEEE802.11(Wifi)、ブルートゥース(登録商標)、または広域無線接続を含み得るが、これらに限定されない。有線通信インターフェース206の例には、イーサネット(登録商標)が含まれるが、これに限定されない。
ある例示的実施形態では、ユーザインターフェース240はプロセッサ202と通信し得る。ユーザインターフェース240の例には、入力インターフェース及び/または出力ユーザインターフェースが含まれるが、これらに限定されない。入力インターフェースは、ユーザによる入力指示を受信するように構成される。出力ユーザインターフェースは、聴覚的、視覚的、機械的または他のアラート及び/またはフィードバックをユーザに提供する。入力インターフェースの例には、キーボード、マウス、ジョイスティック、キーパッド、タッチスクリーン、ソフトキー等が含まれ得るが、これらに限定されない。出力インターフェースの例には、アラートを指示するための表示器、例えば、発光ダイオード表示器、薄膜トランジスタ(TFT)表示器、液晶表示器、活性マトリクス有機発光ダイオード(AMOLED)表示器等、マイクロホン、スピーカ、リンガ、バイブレータ等が含まれ得るが、これらに限定されない。ある例示的実施形態では、ユーザインターフェース240には、デバイスまたは素子の中でもとりわけ、スピーカ、マイクロホン、表示器、キーボード、タッチスクリーン等のうちのいずれかまたは全部が含まれ得る。
ある実施形態では、命令はプログラムまたはソフトウェアの形態であり得る。ソフトウェアは、システムソフトウェアまたはアプリケーションソフトウェアの形態であり得る。スマートアラート用のシステムは、ネットワーク、例えば、インターネット等、を介して利用可能なコンピュータ実装のアプリケーションにより容易にされ得る。実施形態では、スマートアラートシステムと関連付けられた機能性(図1〜3を参照して説明される)を遂行するために、メモリ204及びシステム200は、プロセッサ202により実行され得るモジュールまたはソフトウェアプログラムを含み得る。
ある例示的実施形態では、ユーザは、インターネットゲートウェイを用いて、スマートアラートシステム(例えば、システム200)へアクセスするようにされ得る。実施形態では、プロセッサ202は、メモリ204の内容及び任意選択的に本明細書中に説明する他の構成要素を用いて、システム200をしてバッチジョブ中にスマートアラートを有効化せしめるように構成される。バッチジョブ中の1つ以上の異常挙動の誘発の際に、システム200は、生成すべき1つ以上のアラート用のアラート設定を開始するようにされる。実施形態では、設定モジュール212は、スマートアラート用のアラート設定を開始する。アラートの設定処理は、バッチジョブの最新定常状態を識別すること、最新定常状態内で少なくとも1つのスケジュールを導出して正常挙動を算出すること、各挙動に対して閾値を導出すること、及び新規の定常状態を漸増的に更新して変化に適合させることを含む。正常挙動の算出方法、を図3で更に説明する。設定の後には、集約モジュール214により実行されるアラート集約処理が続く。集約処理は、共に発生する相関アラートの群を識別すること、1つ以上の計量条件に基づいて1つ以上のジョブ及びアラートの刈り込みを行うこと、アラートの群分け用の1つ以上の相関ルールを用いることにより2つ以上のアラートの間で相関を検出すること、及びプロセッサ202によりに実行される次のステップの潜在的原因及び結果を識別するために、1つ以上の因果関係ルールを用いて群分けされたアラートの因果関係を導出することを含む。アラートの刈り込み方法及び相互関係の検出方法を、図3で更に説明する。予測モジュール216は、プロセッサ202により実行されて、バッチジョブの将来アラートを予測する。例えば、将来アラートの予測は、単変量計量予測法、多変量計量予測法、及び/またはバッチシステムのシステム挙動のうちのどれか少なくとも1つ以上に基づくもので、図3で更に説明する。
図3は、ある実施形態に従ったスマートアラートのための方法の処理フローを示す。ある実施形態では、スマートアラートのための方法300は、システム、例えば、システム200(図2)等、により実装され得る。
方法300のステップ302では、バッチジョブ中の異常挙動により生成されるアラートのために、アラート設定モジュール212(図2中)により遂行される。アラート設定処理302は、方法300のステップ304に示すように、バッチジョブの最新定常状態の識別を含む。ある例示的実施形態では、バッチジョブは、業務処理における種々の変化を受ける。これらの変化の間に、バッチジョブの挙動が、1つ以上の定常状態に続いて起こる。バッチジョブの1つ以上の定常状態に対して、最新定常状態のジョブが分析されて、バッチジョブの現在の挙動が提供される。最新定常状態方法での識別は、平均標準偏差の変化及びジョブ実行時間の傾向を検出することを含むが、これに限定されない。例えば、バッチジョブの最新定常状態は、計量値の変化を識別することにより分析される。
次に、アラート設定処理302は、方法300のステップ306に示すように、バッチジョブの識別された最新定常状態内で、少なくとも1つのスケジュールを導出することを含む。実施形態では、スケジュールは:
●最初に、バッチジョブ計量値の1つ以上の群を、分類及び回帰木(CART)を用いて識別する。CARTでは、再帰パーティション分割法を用いて決定木が構築される。このパーティション法では、決定木の中間ノードは、分類器を表す決定箱であり、決定木の各葉ノードは類似値の群を表すルールの組により独自に定義される。
●次に、識別された計量値群の間で、重複を算出する。例えば、2つの計量値群A及びBとすると、重複は、2つの群間の類似性を
Figure 2017037645
として算出するダイスの係数を用いて計算され得る。この重複は、2つの群中に存在する値の範囲で算出される。例えば、重複は、min(A)≦min(B)とすれば、
Figure 2017037645
として算定され得る。
●最後に、複合ラベルを割り当てて、上記の規準を用いて、顕著な重複を有する群をスケジュールとして識別することにより導出される。
スケジュールを一旦導出したら、各スケジュールに対する正常挙動を識別する。本明細書では、正常挙動は、許容値の帯または範囲として定義され得る。この範囲は上側及び下側の閾値を用いて定義される。アラート設定処理302は、方法300のステップ308に示すように、正常挙動を算出することを更に含む。正常挙動は、許容な値の範囲にある。実施形態のうちの1つでは、正常挙動の範囲は、スケジュールの平均値及び標準偏差を用いることにより割り当てられる。平均値及び標準偏差の方法は、μ±σの範囲内にあるデータポイントのうちの少なくとも70%を含み、この場合μは平均値であり、σは標準偏差である。別の実施形態では、中央値及び中央値絶対偏差(MAD)を用いて、正常挙動に対して受け入れ値の範囲を定義するために使用される。同実施形態中で、識別されたスケジュールは、各スケジュール内の単一モードの分布となり、この場合範囲は中央値±kMADにより定義される。一実装例では、中央値により定義された範囲を中央値の両側に有する計量値分布中の歪みは、攻撃型または保守型の閾値を含み得る。別の実装例では、分布中の歪みがより少ないと、所期の挙動からの小偏差は、変則を表し得る。更に別の実装例では、計量値分布中のより大きい歪みは、変則を構成するより大きい偏差を含み得、閾値はより大きい距離に設定され得る。
別の実施形態では、上側及び下側の閾値は、計量値分布中に存在する歪度により決定され、許容閾値範囲が設定される。例えば、範囲は、(−1、1)とし得る。全体中央値medianoverall及び中央値絶対偏差MADoverallの値が識別される。分布が歪度を呈する場合、下側閾値は、medianleft−2MADleftにより算出され、上側閾値は、medianright+2MADrightにより算出される。この場合medianleft及びmedianrightは、2つの計量値群の中央値であり、MADleft及びMADrightは、2つの計量値の群の中央値絶対偏差である。
アラート設定処理302は、方法300のステップ310に示すように、システムの変化に適合するためにモデルを漸増的に更新することを更に含む。その挙動を頻繁には変えないジョブは、時折変えるジョブよりもよりも安定しているとみなし得る。安定性は、(i)定常状態変化の回数及び(ii)これらの定常状態の各々の期間、により推定され得る。ある実施形態では、各ジョブに対して、更新すべき適切な時間は、(図2に示すように)データリポジトリ206からのその実行履歴にわたる全変化ポイントを識別することにより算出される。例えば、過去の定常状態期間{d、d、d...、d}から、次の定常状態dn+1の期間が決定される。期間dn+1に到達すると、最新定常状態が計量値を用いて再算出される。
方法300のステップ312では、アラート設定モジュール212(図2)により設定されるアラートのために、アラート集約モジュール214(図2)により遂行される。アラート集約処理312は、方法300のステップ314に示すように、アラートの刈り込みを含む。1つ以上のバッチジョブ及びアラートの刈り込みは、1つ以上の計量条件に基づく。計量条件の例は、1つ以上のバッチジョブの従属性、実行条件、1つ以上のバッチジョブにより生成される音量または生成されるアラートの種類等を含み得るが、これらに限定されない。ある実施形態では、刈り込みの方策を適用して、各ジョブ・アラートJにバッチジョブを相関させることによりジョブ・アラートの組を絞り込む。他のバッチジョブへの従属性を先行関係の形態で有するバッチジョブに対しては、先行関係を使用してバッチジョブJの上流側及び下流側バッチジョブの組を導出する。バッチジョブJについて発生するアラートは、上流側及び下流側バッチジョブと関連付けられ得るので、その組に存在しないバッチジョブは刈り込まれる。別の実施形態では、バッチジョブ中のあらゆるバッチジョブが、異なる実行条件を含み得る。バッチジョブの実行条件は、ジョブが作動する時を定義し得る。例えば、実行条件は、平日または週末に作動するバッチジョブを定義し得る。ジョブ・アラートJと重複度の低い実行条件を有するバッチジョブは、ジョブ・アラートJと相関するアラートを生じ得ないので、刈り込まれ得る。別の実施形態では、バッチジョブは、mincountを定義し、mincountより多いアラート例を生成するバッチジョブのみを保持することにより、刈り込まれ得る。mincountの定義による刈り込みは、導出される相関中に十分な信頼性を確保する。更に別の実施形態では、バッチジョブは異なる種類のアラートを生成し、各アラートが相互に関連付けられ得る。アラートの種類は、一部の特定のアラート種類のみにより群分けされ得る。例えば、MAXRUNALARMの例は、MINRUNALARMの例によっては群分けされ得ない。群分けされ得ないアラートは排除される。
アラート集約処理312は、方法300のステップ316に示すように、アラート群の間で相関を検出することを更に含む。相関するアラートの群の識別は、アラートを連鎖及び群分けするための複数の相関ルールを適用することを更に含み、群分けされたアラートは1つ以上のリゾルバに割り当てられる。
バッチシステム中のバッチジョブは、時間分離される。時間分離されたバッチジョブは、相関するアラートを識別しながら、進み及び遅れにより識別され得る。進み/遅れ要因をΔとする。Δの値は、全対のバッチジョブに関して異なり得る。何故ならば、進み/遅れの値はバッチジョブの実行の間の時間差に依存するからである。例えば、Δの値は、互いに前後に作動するバッチジョブよりも、開始時間の間に大きい合間を有するバッチジョブに対してより大きい。同実施形態で、2つのバッチジョブA及びBの間の値は、以下の通りに算出される:
A、B=t実行時間A、B
式中、実行時間A、BはジョブA及びBの間の累積実行時間であり、tは実行時間の変動(経験的に10%に設定)を組み込むための乗数である。
更に、V、Vはそれぞれ、ジョブA及びBのアラートタイムスタンプベクトルであり、AはBに対して上流にある。Aのタイムスタンプは、Bのものの前に起こり得、ΔはAの遅れ及びBの進みに対応し得る。更に、種々の類似性の商が、2組の類似性により算出される。例えば、2群A及びBの類似性は、ダイス係数により
Figure 2017037645
と算出される。ダイス係数は、項
Figure 2017037645
を算出することにより修正される。組
Figure 2017037645
は、遅れ範囲Δ内で固有のタイムスタンプがV中に存在するV中のタイムスタンプを指す。例えば、2つのジョブ・アラートA及びBの間の相関は、以下の相関指標を用いて算出され、高い相関指標でジョブ・アラート対を保持する:
Figure 2017037645
ジョブ・アラートは、アラートの大型の組合せ中で取り込まれ得る。ある実施形態では、サイズ3以上のバッチジョブの組合せ間の相関が取り込まれる。例えば、種類についての組合せA...A<−>An+1があり、この場合2つ以上のアラートの存在が別のアラートの発生の前提となる。別の実施例では、ジョブの組合せA...Aがタイムスタンプ
Figure 2017037645
に対応し、この場合ViはジョブAiのアラート例のタイムスタンプのベクトルを示す。
更に、検索空間が極めて大きくなる場合、サイズkの全組合せを識別してそれらの他のアラートとの相関を判別するために、力ずくの手法を利用し得る。検索空間を、修正アプリオリアルゴリズムを用いて移動し得る。例えば、サイズkの組候補は、サイズk−1の組候補から構築される。組合せ空間を有するこれらの組候補は、以下の手法のうちの1つを用いて刈り込まれ得る:
●実行条件: バッチジョブ中のあらゆるジョブは実行条件と関連付けられる。低重複度の組合せ内のジョブの実行条件は、当該組合せから除外され得る。
●音量: 組合せ中のあらゆるジョブ・アラートは十分な回数発生する。ジョブの組合せA...Aは、
Figure 2017037645
であれば、刈り込まれる。
アラート集約処理312は、方法300のステップ318に示すように、アラート群の間での因果関係を導出することを更に含む。潜在的原因及び結果を識別するための1つ以上の因果関係ルールを用いて、群分けされたアラートの因果関係が導出される。相関ジョブ・アラートの群が識別され、バッチシステムの特質を利用することにより原因が分離される。識別された各相関に対して、上流側の関係が識別される。例えば、上流側が原因として割り当てられ、下流側が結果として割り当てられる。別の実施例では、ジョブ及びアラートの組合せA...A<−>An+1に対して相関が導出され、A...A中の全ジョブが上流側または下流側にあるとき因果関係方向がジョブAn+1に割り当てられる。
ジョブ・アラートは、是正処置を取るのに十分な余裕時間を与え得ないかもしれない。方法300のステップ320では、アラート予測モジュール216(図2)によりアラートの予測が遂行される。アラート予測処理320は、単変量計量予測法、多変量計量予測法、及びシステム挙動のうちの少なくとも1つ以上に基づいて、バッチジョブ将来アラートを予測する。予防処置には、主要な計量、例えば、作業負荷等、に対するジョブ挙動を予測するために、アラート予測用の単変量予測法が含まれる。ジョブ計量の傾向、周期性、平均値水準、季節性等は、適切な予測アルゴリズムを選択するために使用される。例えば、ジョブが可変手段を表すが傾向は存在しないとき、最新データの指数関数加重平均である、簡素な指数平滑法を利用し得る。僅かな傾向しか存在しない場合には、回帰モデルを構築して将来の日時を推定し得る。ホルトの方法は、ジョブが様々な傾向及び水準を示すが季節性は存在しないときに、使用され得る。ホルトの方法は、時変水準のみならず時変線形傾向を本質的に想定し、各々に対して別個の円滑化パラメータを使用する。傾向及び水準の変動と共に季節性が存在するとき、ARIMAモデルを使用して将来の日時の挙動を予測し得る。
別の実施形態では、予測が、複数の計量、例えば、実行時間、CPU使用率等、に依存することから、多変量予測法を使用して値を予測する。従属計量Dは、独立計量Iの関数である:D=f(I)。そこで、単変量予測法を用いてIが予測され、その値がDの予測に使用される。
更に別の実施形態では、全バッチを分析して、時系列予測用ジョブを導出する。時系列予測用に導出されるジョブは、全バッチを全体として分析することによってのみ導出され得る。例えば、予測可能にするために、将来バッチシナリオをシミュレートして、開始時、実行時、及び終了時の各ジョブ及び業務処理を予測する。更に、所与の将来日時に対して、ジョブは各ジョブの実行条件を用いて作動することになる。バッチの従属性が識別される。独立計量、例えば、作業負荷等、及び従属計量、例えば、実行時間等、が推定される。ジョブの開始時間が、予測実行時間を用いて全ジョブの開始ポイントから終了ポイントまでの全グラフを詳しく考察するために記録される。このように、将来アラートが予測される。
スマートアラートの用のシステムは、最適かつ最新のアラート設定の生成を提供する。システムは、バッチジョブの正常挙動を、その過去の履歴を分析することによりモデル化し、アラート設定を推奨して、正常挙動からの任意の偏差をアラートとして報告する。更に、システムは、相関アラートを検出及び集約するためのルールを生成することにより、冗長アラートの変化及び排除に適合する解決手段を提案する。最後に、システムは、予測及び予防用アラートを生成する。
特定の実装及び実施形態に関する以上の説明は、本明細書中の実装例及び実施形態の全般的性質を十分に明らかにするので、現在の知識を適用することにより、特定の実施形態等の種々の応用に対して包括的概念から逸脱することなく容易に修正及び/または適応可能である。したがって、そのような適応及び修正は、開示された実施形態の均等物の意味及び範囲内で把握されるべきであって把握されるように意図されている。本明細書中に使用される表現または専門用語は、説明目的のためのものであって限定的なものではないことを理解すべきである。したがって、本明細書中の実施形態を好ましい実施形態に関して説明したが、本明細書中の実施形態が本明細書中に説明された実施形態の趣旨及び適用範囲内で実施され得ることを、当業者であれば認識するであろう。
以上の説明は、種々の実施形態を参照しながら提示した。本出願に関連する分野及び技術に関する当業者であれば、説明した構成及び動作方法の改変及び変更例であっても上記原理、趣旨及び適用範囲から実質的に逸脱することなく実施され得ることを認識することになるであろう。

Claims (12)

  1. バッチシステムにおけるスマートアラートのプロセッサ実装方法であって、
    1つ以上のアラートを設定することであって、前記設定は:
    バッチジョブの最新定常状態を識別すること;
    前記識別されたバッチジョブの最新定常状態内で少なくとも1つのスケジュールを導出すること;及び
    前記少なくとも1つのスケジュール内で正常挙動を算出すること、前記正常挙動は上側閾値及び下側閾値の正常な値により定義され、前記上側閾値及び前記下側閾値は1つ以上の中央値及び中央値絶対偏差方法により算定される;
    を含む、1つ以上のアラートを設定すること、
    履歴分析及び実時間分析のうちの少なくとも一方に基づいてアラートの相関群を識別することにより、前記1つ以上のアラートを集約することであって、前記アラートの相関群の識別は:
    1つ以上の計量条件に基づいて1つ以上のジョブ及びアラートを刈り込むこと;
    前記アラートの群分けに1つ以上の相関ルールを使用することにより、2つ以上のアラートの間で相関を検出すること;及び
    潜在的な原因と結果を識別するために1つ以上の因果関係ルールを用いて前記群分けされたアラートの因果関係を導出すること;
    を含む、前記1つ以上のアラートを集約すること、ならびに
    単変量計量予測法、多変量計量予測法、及びシステム挙動のうちの少なくとも1つ以上に基づいてバッチジョブの将来アラートを予測すること、
    を含む、
    前記方法。
  2. 前記アラート設定は、ジョブ挙動の変化の観察時に次のバッチジョブのために漸増的に更新される、請求項1に記載の方法。
  3. 前記識別された定常状態内で少なくとも1つのスケジュールを導出することは:
    分類及び回帰木(CART)を用いて、1つ以上の計量値群を識別すること;
    前記識別された計量値群の間で重複を算出すること;及び
    前記識別された計量値群を重複と組み合わせて、複合ラベルを割り当てること、を含む、請求項1に記載の方法。
  4. 前記下側及び上側閾値は、計量値の分布の歪度に基づいて算出され、分布が歪度を呈する場合、前記下側閾値はmedianleft−2MADleftにより算出され、上側閾値はmedianright+2MADrightにより算出され、式中medianleft及びmedianrightは2つの計量値群の中央値であり、MADleft及びMADrightは2つの計量値群の中央値絶対偏差である、請求項1に記載の方法。
  5. 前記アラートの相関群の識別は、アラートの連鎖及び群分け用の複数の相関ルールを適用することを更に含み、前記群分けされたアラートは1つ以上のリゾルバに割り当てられる、請求項1に記載の方法。
  6. 1つ以上のアラートの刈り込み用の前記1つ以上の計量は、前記1つ以上のバッチジョブの従属性、実行条件、前記1つ以上のバッチジョブにより生成されたアラートの音量、及び生成されたアラートの種類を含む、請求項1に記載の方法。
  7. バッチシステムにおけるスマートアラートのプロセッサ実装システムであって、該システムは:
    少なくとも1つのプロセッサ;及び
    少なくとも1つのメモリであって、前記少なくとも1つのメモリは前記少なくとも1つのプロセッサに結合される、該少なくとも1つのプロセッサは命令により、
    1つ以上のアラートを設定し、該設定は、
    バッチジョブの最新定常状態を識別すること;
    該識別されたバッチジョブの最新定常状態内で少なくとも1つのスケジュールを導出すること;
    該少なくとも1つのスケジュール内で正常挙動を算出すること、前記正常挙動は上側閾値及び下側閾値の正常な値の範囲により定義され、前記上側閾値及び前記下側閾値は1つ以上の中央値及び中央値絶対偏差方法により算定される、を含み、
    履歴分析及び実時間分析のうちの少なくとも一方に基づいて相関アラートの群を識別することにより1つ以上のアラートを集約し、前記アラートの相関群を識別することは:
    1つ以上の計量条件に基づいて1つ以上のジョブ及びアラートを刈り込むこと;
    アラートの群分け用の1つ以上の相関ルールを用いることにより、2つ以上のアラートの間で相関を検出すること;及び
    潜在的原因と結果を識別するための1つ以上の因果関係ルールを用いて、前記群分けされたアラートの因果関係を導出すること;を含み、
    単変量計量予測法、多変量計量予測法、及びシステム挙動のうちの少なくとも1つ以上に基づいてバッチジョブの将来アラートを予測する、ように設定された、少なくとも1つのメモリ、
    を備える、
    前記システム。
  8. 前記アラート設定は、ジョブ挙動の変化の観察時に次のバッチジョブのために漸増的に更新される、請求項7に記載のシステム。
  9. 前記識別された定常状態内で少なくとも1つのスケジュールを導出することは:
    分類及び回帰木(CART)を用いて、前記バッチジョブ1つ以上の群の計量値を識別すること;
    前記識別された計量値の群の間で重複を算出すること;及び
    前記識別された計量値の群を重複と組み合わせて、複合ラベルを割り当てること、を含む、請求項7に記載のシステム。
  10. 前記下側及び上側閾値は、計量値の分布の歪度に基づいて算出され、分布が歪度を呈する場合、前記下側閾値はmedianleft−2MADleftにより算出され、上側閾値はmedianright+2MADrightにより算出され、式中medianleft及びmedianrightは2つの計量値群の中央値であり、MADleft及びMADrightは2つの計量値群の中央値絶対偏差である、請求項7に記載のシステム。
  11. 前記アラートの相関群の識別は、アラートの連鎖及び群分け用の複数の相関ルールを適用することを更に含み、前記群分けされたアラートは1つ以上のリゾルバに割り当てられる、請求項7に記載のシステム。
  12. 1つ以上のアラートの刈り込み用の前記1つ以上の計量は、前記1つ以上のバッチジョブの従属性、実行条件、前記1つ以上のバッチジョブにより生成されたアラートの音量、及び生成されたアラートの種類を含む、請求項7に記載のシステム。
JP2016155482A 2015-08-07 2016-08-08 スマートアラートのためのシステム及び方法 Active JP6531079B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN2986/MUM/2015 2015-08-07
IN2986MU2015 2015-08-07

Publications (2)

Publication Number Publication Date
JP2017037645A true JP2017037645A (ja) 2017-02-16
JP6531079B2 JP6531079B2 (ja) 2019-06-12

Family

ID=56611208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016155482A Active JP6531079B2 (ja) 2015-08-07 2016-08-08 スマートアラートのためのシステム及び方法

Country Status (5)

Country Link
US (1) US10628801B2 (ja)
EP (1) EP3128425A1 (ja)
JP (1) JP6531079B2 (ja)
AU (1) AU2016210785A1 (ja)
CA (1) CA2938472C (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018181422A1 (ja) * 2017-03-29 2018-10-04 京セラ株式会社 設備管理方法、設備管理装置及び設備管理システム
JP2020144669A (ja) * 2019-03-07 2020-09-10 日本電気株式会社 情報処理装置、コンテナ配置方法及びコンテナ配置プログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3435233B1 (en) * 2017-07-27 2020-02-26 Nokia Solutions and Networks Oy A method for identifying causality objects
US20190057404A1 (en) * 2017-08-15 2019-02-21 Linkedin Corporation Jobs forecasting
CN109617745B (zh) * 2019-01-11 2022-03-04 云智慧(北京)科技有限公司 告警预测方法、装置、系统及存储介质
US11248817B2 (en) * 2019-11-01 2022-02-15 Roth Technologies, LLC Continuous monitoring system for early failure detection in HVAC systems
US11656932B2 (en) 2021-07-19 2023-05-23 Kyndryl, Inc. Predictive batch job failure detection and remediation
EP4163790A1 (en) * 2021-10-05 2023-04-12 Tata Consultancy Services Limited Method and system for predicting batch processes

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005190270A (ja) * 2003-12-26 2005-07-14 Nomura Research Institute Ltd 因果関係推定プログラム及び因果関係推定方法
US7124060B1 (en) * 1999-11-03 2006-10-17 Abb Ab Method for isolating a fault from error messages
US20130158950A1 (en) * 2011-08-10 2013-06-20 Opnet Technologies, Inc. Application performance analysis that is adaptive to business activity patterns
JP2014153736A (ja) * 2013-02-05 2014-08-25 Fujitsu Ltd 障害予兆検出方法、プログラムおよび装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7076695B2 (en) * 2001-07-20 2006-07-11 Opnet Technologies, Inc. System and methods for adaptive threshold determination for performance metrics
US7280988B2 (en) * 2001-12-19 2007-10-09 Netuitive, Inc. Method and system for analyzing and predicting the performance of computer network using time series measurements
CN101882102A (zh) * 2003-08-11 2010-11-10 纯安姆芬特有限公司 用于自动化计算机支持的系统
WO2006079040A2 (en) * 2005-01-19 2006-07-27 Securities Industry Automation Corporation Shared data center monitor
US7218974B2 (en) * 2005-03-29 2007-05-15 Zarpac, Inc. Industrial process data acquisition and analysis
US7225103B2 (en) * 2005-06-30 2007-05-29 Oracle International Corporation Automatic determination of high significance alert thresholds for system performance metrics using an exponentially tailed model
US20070136115A1 (en) * 2005-12-13 2007-06-14 Deniz Senturk Doganaksoy Statistical pattern recognition and analysis
US20090138415A1 (en) * 2007-11-02 2009-05-28 James Justin Lancaster Automated research systems and methods for researching systems
US8230428B2 (en) * 2008-02-20 2012-07-24 International Business Machines Corporation Data management job planning and scheduling with finish time guarantee
US8621477B2 (en) * 2010-10-29 2013-12-31 International Business Machines Corporation Real-time monitoring of job resource consumption and prediction of resource deficiency based on future availability
US8495661B2 (en) 2010-11-02 2013-07-23 International Business Machines Corporation Relevant alert delivery with event and alert suppression in a distributed processing system
US8737231B2 (en) 2010-12-07 2014-05-27 International Business Machines Corporation Dynamic administration of event pools for relevant event and alert analysis during event storms
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
US8873813B2 (en) * 2012-09-17 2014-10-28 Z Advanced Computing, Inc. Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities
US8832265B2 (en) * 2012-05-01 2014-09-09 International Business Machines Corporation Automated analysis system for modeling online business behavior and detecting outliers
US20140316877A1 (en) * 2013-04-23 2014-10-23 Xerox Corporation Methods of promoting print device usage during non-peak times
US9514214B2 (en) * 2013-06-12 2016-12-06 Microsoft Technology Licensing, Llc Deterministic progressive big data analytics
US20150207696A1 (en) 2014-01-23 2015-07-23 Sodero Networks, Inc. Predictive Anomaly Detection of Service Level Agreement in Multi-Subscriber IT Infrastructure
US10169121B2 (en) * 2014-02-27 2019-01-01 Commvault Systems, Inc. Work flow management for an information management system
US10963810B2 (en) * 2014-06-30 2021-03-30 Amazon Technologies, Inc. Efficient duplicate detection for machine learning data sets

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7124060B1 (en) * 1999-11-03 2006-10-17 Abb Ab Method for isolating a fault from error messages
JP2005190270A (ja) * 2003-12-26 2005-07-14 Nomura Research Institute Ltd 因果関係推定プログラム及び因果関係推定方法
US20130158950A1 (en) * 2011-08-10 2013-06-20 Opnet Technologies, Inc. Application performance analysis that is adaptive to business activity patterns
JP2014153736A (ja) * 2013-02-05 2014-08-25 Fujitsu Ltd 障害予兆検出方法、プログラムおよび装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANUJA KELKAR ET AL.: "Analytics-Based Solutions for Improving Alert Management Service for Enterprice Systems", 13TH INTERNATIONAL CONFERENCE ON DATA MINING WORKSHOPS, JPN6018019518, 6 March 2014 (2014-03-06), pages 219 - 227 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018181422A1 (ja) * 2017-03-29 2018-10-04 京セラ株式会社 設備管理方法、設備管理装置及び設備管理システム
JPWO2018181422A1 (ja) * 2017-03-29 2020-02-06 京セラ株式会社 設備管理方法、設備管理装置及び設備管理システム
JP2020144669A (ja) * 2019-03-07 2020-09-10 日本電気株式会社 情報処理装置、コンテナ配置方法及びコンテナ配置プログラム
JP7234702B2 (ja) 2019-03-07 2023-03-08 日本電気株式会社 情報処理装置、コンテナ配置方法及びコンテナ配置プログラム

Also Published As

Publication number Publication date
US20170039530A1 (en) 2017-02-09
EP3128425A1 (en) 2017-02-08
JP6531079B2 (ja) 2019-06-12
US10628801B2 (en) 2020-04-21
CA2938472A1 (en) 2017-02-07
CA2938472C (en) 2019-01-15
AU2016210785A1 (en) 2017-02-23

Similar Documents

Publication Publication Date Title
JP6531079B2 (ja) スマートアラートのためのシステム及び方法
US20230162063A1 (en) Interpretability-based machine learning adjustment during production
US20230196101A1 (en) Determining suitability of machine learning models for datasets
US20200192741A1 (en) Automatic model-based computing environment performance monitoring
US10217054B2 (en) Escalation prediction based on timed state machines
US20150332195A1 (en) Facilitating performance monitoring for periodically scheduled workflows
JP2018113018A (ja) データプリプロセッシングのためのシステム及び方法
US9860109B2 (en) Automatic alert generation
US20210366268A1 (en) Automatic tuning of incident noise
US11373131B1 (en) Automatically identifying and correcting erroneous process actions using artificial intelligence techniques
Golmakani Optimal age-based inspection scheme for condition-based maintenance using A* search algorithm
US10176437B2 (en) Method and apparatus to analytically support parts provision for hardware maintenance service
US8793106B2 (en) Continuous prediction of expected chip performance throughout the production lifecycle
US11263103B2 (en) Efficient real-time data quality analysis
US20170068923A1 (en) Identification of asset groups for ensuring consistent estimates
CN113329128B (zh) 话务数据预测方法及装置、电子设备、存储介质
Zhang et al. A novel approach for QoS prediction based on Bayesian combinational model
US20130231978A1 (en) Integrated case management history and analytics
US20210248512A1 (en) Intelligent machine learning recommendation platform
US20230126193A1 (en) Predictive Remediation Action System
US11556451B2 (en) Method for analyzing the resource consumption of a computing infrastructure, alert and sizing
US11443206B2 (en) Adaptive filtering and modeling via adaptive experimental designs to identify emerging data patterns from large volume, high dimensional, high velocity streaming data
US20230359925A1 (en) Predictive Severity Matrix
WO2024042030A1 (en) A method for enabling a first electronic device to monitor a program in a development environment and related first electronic device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180530

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180828

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20181025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190520

R150 Certificate of patent or registration of utility model

Ref document number: 6531079

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250